PBS 常見問題與解決方式
無法移除 zpool 問題
- Exp 無法移除 zfs-backup
proxmox-backup-manager datastore remove zfs-backup
- 可重開主機或是重啟 PBS 服務
systemctl restart proxmox-backup.service systemctl restart proxmox-backup-proxy.service
- 再次執行就可移除 Exp.
# proxmox-backup-manager datastore remove zfs-backup Removing datastore from config... TASK OK
ZPool 突然消失問題
- 進行 remote 同步過程, 不知名原因造成原本建立的 pbs-zpool 消失, 因為測試備份資料, 所以沒有特別找 zfs 資料救回處理程序
- 此時 proxmox-backup 服務已經無法正常運作, 網頁管理介面也無法出現, 但 systemctl restart proxmox-backup 仍然可以成功, 在 message log 沒有看到異常原因
- 透過 zpool create 重新建立 pbs-zpool 之後, 網頁管理界面可以登入, 但原本建立的 Datastore : pvebackup 無法讀取必須重新建立, 但網頁管理界面並無刪除 Datastore 功能, 所以比須使用 proxmox-backup-manager 命令語法處理
proxmox-backup-manager datastore list proxmox-backup-manager datastore remove pvebackup
參考畫面如下:
root@TP-PVE-249:/pbs-zpool# proxmox-backup-manager datastore list ┌───────────┬────────────┬───────────────┐ │ name │ path │ comment │ ╞═══════════╪════════════╪═══════════════╡ │ pvebackup │ /pbs-zpool │ PVE Backup DS │ └───────────┴────────────┴───────────────┘ root@TP-PVE-249:/pbs-zpool# proxmox-backup-manager datastore remove pvebackup root@TP-PVE-249:/pbs-zpool# proxmox-backup-manager datastore list
- 再透過網頁管理界面重新建立 Datastore : pvenackup , 這樣原本的 Sync Jobs 就可以繼續恢復運作
修改備份 vm/ct 目錄的 Owner
- 如果要改由 PBS-B 讓 PVE 備份就會出現權限錯誤無法寫入
PBS 服務突然失效(Listen Port 8007 消失)
- 透過 systemctl restart proxmox-backup 重起並無法解決
-
- 透過 systemctl restart proxmox-backup-proxy 重新啟動
- 主要錯誤是 Too manu open files (os error 24) 所以修改限制檔案開啟數
- 目前 OS 的設定值
root@TP-PVE-252:~# cat /proc/sys/fs/file-max 9223372036854775807 root@TP-PVE-252:~# ulimit -Hn 1048576 root@TP-PVE-252:~# ulimit -Sn 1024
- 似乎目前這問題是 open files leak 的狀況, 要等後續 PBS 版本修正 — Jonathan Tsai 2020/07/23 10:17
- 暫時依照參考方式進行設定限制開啟檔案數LimitNOFILE=10240:524288
vi /etc/systemd/system/multi-user.target.wants/proxmox-backup-proxy.service
: [Service] : Group=backup LimitNOFILE=10240:524288 [Install] :
重新讀取與啟動 proxmox-backup-proxy 服務
systemctl daemon-reload systemctl restart proxmox-backup-proxy.service
備份 CT 出現 parameter 'encoded-size': value must have a minimum value of 13 (got 12) 錯誤訊息
- 主要原因是備份的 CT 內含有 0 byte 的檔案, 目前看到大部分的原因是 /etc/pve/firewall 內的 *.fw , 因為沒有設定 firewall 規則, 所以直接刪除這些檔案即可
rm /etc/pve/firewall/*.fw
升級後出現 unable to parse active worker status 'UPID:xxx:00003BD8:...:5X4X6113:termproxy::root: 5X4X6355 OK' - not a valid user id
- 這是已知的問題, 可以直接執行以下語法解決
sed -i -re 's/(:termproxy:):root:/\1:root@pam:/g' /var/log/proxmox-backup/tasks/active