У меня недавняя тема с переездом серверной получила продолжение, которого я бы предпочёл избежать, так как потратил кучу времени на решение.
На вид как будто бы всё нормально, но то тут, то там, где-то что-то не работает. То принтер отвалится на 5 минут, то SIP телефон становится неактивным, то один сервер недоступен, то другой. Такие проблемы решать очень трудно. Со стороны серверов и управляемых свитчей я не увидел никаких проблем и ошибок, которые можно было бы исправить.
Пришлось приехать, чтобы на месте разобраться. Удалённо ничего не получилось несмотря на то, что в офисе были руки, которые всё делали. Вооружился тестером, которым я пользуюсь очень редко. И вообще с проводами давно не работал, всё подзабыл. За последние лет 10 только в доме себе проводку сделал для камер и рабочих мест.
Изначально думал, что где-то либо дребезжит контакт, либо глючит какое-то устройство, которое мешает нормальной работе, хотя по Wireshark я не видел чего-то подозрительного, например, спама пакетами. С таким сталкивался не раз. Глючит какое-то устройство и спамит в сеть. Выключаешь – всё нормально.
Сам проверил соединения из серверной со свитчами, никаких проблем не увидел. Всё прозванивается. Выключил одновременно всё сетевое оборудование и включил. Иногда это помогает, но не в этот раз. Не буду рассказывать, что в итоге делал, перейду сразу к сути. Когда ничего не помогло, уже не знал, что делать.
Поступил следующим образом. Вообще всех абонентов отключил. Оставил один свитч, один компьютер. Подключил, стал ждать. Почти сразу один из серверов стал недоступен. Такая паскудненькая ошибка, скажу я вам. Включаешь комп, всё работает. А потом раз, отвалился терминальный сервер, а всё остальное работает. И в логах чисто. Потом что-то другое отваливается. У кого-то помогает перезагрузка, а у кого-то нет. И так то одно, то другое.
В какой-то момент посетила мысль, а нет ли тут каких-то помех, которые мешают работе сети. Спрашиваю на этот счёт электрика. И оказалось, что на одном отрезке Ethernet кабелей из серверной до свитчей пересекаются с линией 380В. Кидаю времянку напрямую, чтобы проверить. Так и есть. Проблема в этом. Кинули временные провода в обход этого участка, всё работает. Потом уже проложили на постоянку.
По ходу дела оказалось, что ещё и один свитч глючил, который заменили. Эта зараза существенно осложнила диагностику, потому что глючила и по времянке. Провозился в итоге весь день. Если бы не пришла идея насчёт наводок, не знаю, как бы всё это решалось. Я просто уже сталкивался в прошлом с этим не раз, но тут как-то в голову не пришло сразу. На вид там не было такого, что трассы пересекаются с силовыми. Сразу не подумал об этом.
Помню, как на одном производстве кран-балка включалась и весь этаж с офисом отваливался. Потом возвращался. Там тоже тестировали, провода перепрокладывали, сетевое оборудование меняли. Чего только не делали. Но этот кран такие наводки давал, что надо было очень далеко от его электрики провода класть. Похожую историю, только с мощным насосом рассказал один из подписчиков. Делал по этому поводу заметку. Может из-за неё и вспомнил про наводки, потому что не так давно это было.
С проводами если постоянно не работаешь, то трудно всё это диагностировать. Нужен опыт подобных проблем, потому что эти наводки никак себя явно не проявляют. Хорошо, если сеть полностью ложится. Тогда проще найти причину. А когда вот так, то тут, то там что-то не работает, связать это с помехами сразу в голову не приходит.
#железо #ошибка