Недавно делал заметку про анализ системных логов с помощью ИИ на примере проблемы с моим старым сервером с PVE.
Я подумал, что начались проблемы со старым железом. Хотел для начала БП поменять, потом память проверить, потому сетевуху заменить. Там стоит чип Realtek, с ним иногда бывают проблемы, хотя ни разу не сталкивался с тем, чтобы он приводил к аварийным перезагрузкам.
И как же мне повезло, что в комментариях один человек предположил, что проблема может быть с новым ядром Linux, которое недавно в PVE обновилось на 7-ю ветку. Судя по всему оно ко мне прилетело с очередным обновлением. Даже не обратил на это внимание.
Как оказалось, проблема была реально с ядром. У меня даже предположения не было смотреть в эту сторону. Не обратил внимания, что ядро обновилось. Сколько бы я времени потратил впустую, если бы не попробовал загрузиться в старой 6-й версии. Я выждал некоторое время и убедился, что не было ни одного аварийного ребута с момента возврата на 6-е ядро.
Делаю отдельно заметку об этом. Возможно, она кому-то сэкономит массу времени, как сэкономило мне. Банальный возврат на прошлую версию ядра, которая всё ещё поддерживаться и никаких проблем с ней нет, решило разом мою проблему.
Смотрим доступные в системе ядра:
# proxmox-boot-tool kernel list
Manually selected kernels:
None.
Automatically selected kernels:
6.17.13-7-pve
7.0.0-3-pve
7.0.2-2-pve
Принудительно выставляем 6-ю версию:
# proxmox-boot-tool kernel pin 6.17.13-7-pve
Перезагружаемся и проверяем:
# uname -r
6.17.13-7-pve
У меня несколько тестовых гипервизоров дома на старом железе и только тут возникли проблемы. Не знаю, с чем это связано, но мне на 100% помогло.
#proxmox #ошибка