ремонт сервера nfs

| щоденник, комп'ютери, linux, сервер

два роки тому в мене з’явився цікавий «кубик» — hp proliant microserver n40l; це невеличкий і досить малопотужний домашній серверочок, цікавий головним чином кубічною формою і наявністю чотирьох доків для накопичувачів 3,5” sata. я завантажив туди різних дисків, що знайшлися по шухлядах, налаштував mergerfs і snapraid, розшарив більшу частину об’єднаного дископростору (2,7 тб) через smb, щоби складати туди музику й кіно, і все це щасливо стрімиться minidlna на два домашні телевізори та vlc на будь-якому телефоні чи планшеті. інша частина мала бути доступна як nfs для бекапів promox, але…

…але щось давно я нічого не бекапив; аж ось граюся собі з lnav, і бачу, що в журналах roku (це сервер v2) proxmmox лається, що не може підключитися до microsever’а (шара nfs). схоже, час для ще однієї технічної розвідки замість читання цікавих книжок — лізу по ssh на micro.lan.

> uptime
 19:37:47 up 287 days, 23:29,  1 user,  load average: 0.04, 0.19, 0.12
> cat /etc/os-release
PRETTY_NAME="Debian GNU/Linux 10 (buster)"
> cat /etc/debian_version
10.13
> sudo apt update && sudo apt upgrade

зненацька, apt просить вказати, куди (пере)встановити grub, — ідентифікую в переліку системний диск (найменший); шкода обнуляти аптайм, але доведеться перезавантажити сервер, щоби переконатися, що все пройшло як слід.

> sudo systemctl reboot

після перезавантаження продовжую досліджувати. /etc/exports виглядає добре, сервіс nfs-server виглядає здоровим:

> cat /etc/exports
/srv/storage/share 192.168.1.0/255.255.255.0(fsid=0,rw,all_squash,anonuid=1001,anongid=1001,sync,insecure,no_subtree_check)
/srv/storage/backup 192.168.1.0/255.255.255.0(fsid=1,rw,all_squash,anonuid=1001,anongid=1001,sync,insecure,no_subtree_check)
> sudo systemctl status nfs-server
● nfs-server.service - NFS server and services
   Loaded: loaded (/lib/systemd/system/nfs-server.service; enabled; vendor preset: enabled)
   Active: active (exited) since Tue 2023-12-12 19:39:48 EST; 4min 52s ago
  Process: 430 ExecStartPre=/usr/sbin/exportfs -r (code=exited, status=0/SUCCESS)
  Process: 433 ExecStart=/usr/sbin/rpc.nfsd $RPCNFSDARGS (code=exited, status=0/SUCCESS)
 Main PID: 433 (code=exited, status=0/SUCCESS)

Dec 12 19:39:46 micro systemd[1]: Starting NFS server and services...
Dec 12 19:39:48 micro systemd[1]: Started NFS server and services.

гхм. дивлюся в інтерфейс proxmox — мережеве сховище microbackup знову онлайн. тепер мені аж цікаво, коли й чому впав сервіс nfs… саме для цього й існують журнали, а lnav дозволяє їх фільтрувати зручненько. log.lan має запис із ip в /etc/hosts, а профіль tivasyk має доступ до /var/log (через групу adm), дивлюся lnav по ssh просто з лептопа:

> ssh -t tivasyk@log.lan 'lnav /var/log/hosts/roku/'

фільтрування за microbackup показує, що перша помилка в доступних журналах сервера віртуалізації (roku.lan) з’являється 17 вересня 2023 о 00:17… але це співпадає, на жаль, з найдавнішими записами. тож не поталанило: було зберігать давніші журнали! але це вже питання налаштування ротації на сервері журналів.

p.s. lnav сподобався для «домашнього» застосування, — але про нього за іншим разом.

інтерфейс переглядача журналів lnav