Кратко временное проподание сети

Автор: Палыч.RU Дата: 29.05.2009 16:38
ASP Linux 14 (cobalt) free
Сервер на базе материнской платы Intel S5000 два встроенных 1Гб сетевых адаптера
На сервере поднята и настроена Samba

При работе пользователей периодически кратковременно (10-30 сек) пропадает сетевое соединение с сервером и как следствие не возможность нормально работать. При чем если на одном компьютере соединение оборвалось т.е. ping(ом) сервер не доступен то на другом компьютере клиент продолжает нормально работать. Повторяется это периодически но без замеченной мной закономерности. Самба при этом авторизации не теряет и сетевой ресурс по прежнему доступен после востановления соединения по сети. Пробовал менять порты на свитче - та же ситуация. Пробовал включать/выключать фаервол (iptables) оставляя лишь порты необходимые для работы самбы-сервера - ситуация не меняется. менял адреса на сетевых интерфейсах, пробовал выключать один из сетевых интерфейсов - не помогает. На свиче (на потру) который соединен с сервером ставил фильтрацию (drop) широковещательных пакетов - не помогает. В tail -f /var/log/messagess в моменты пропадания соединения ни чего не фиксируется. Вывод ifconfig показывает ноль ошибок и ноль drop пакетов. Оперативно подключившись по SSH к серверу пингую компьютер на котором только что пропало подключение к серверу - не пингуется.

Буду рад любым предложениям по устранению данного глюка.

П.С. если не в ту тему форума написал - извиняйте - ни чего более подходящего не нашел.

Re: Кратко временное проподание сети 29.05.2009 17:05lkanter
А если в это время смотреть на состояние портов на свиче? Похоже, свич останавливает порты.
Re: Кратко временное проподание сети 29.05.2009 20:32BigAndy
А случчайно работа не идет с кучей мелких файлов?
А сетевая карта какая? И какой модуль к ней прицепился?
Re: Кратко временное проподание сети 01.06.2009 10:41Палыч.RU
1. Коммутатор D-Link DES-3526 с заводсткими установками (кроме адреса веб-интерфейса). И с чего бы коммутатору глушить поочередно один или несколько портов на свиче? Мониторил порт только тот что соеденен непосредственно с сервером, пакеты бегут, ошибки редко но бывают, мониторить порт на коммутаторе к которому присоеденен отваливающийся сегмент пока не пробовал но возьму на вооружение эту идею.
2. Работа идет действительно с кучами файлов, но ведь на то он и файловый сервер.
3. Сетевые карты записаны как Intel Corporation 80003ES2LAN Gigabit Ethernet Controller (Copper), определились установщиком Linux без проблем, хотя для материнской платы серии S5000 сетевым контроллером стоит чипсет Intel 82563EB. Посмотреть какой модуль приципился к сетевой карте не могу - квалификация не позволяет, если дадите комманду консоли вывод опубликую.

Цитата:
Работа идет действительно с кучами файлов, но ведь на то он и файловый сервер

А файловый сервер что? Старик Хоттабыч? Если у него нет возможности, он не будет работать. В частности, это касается сокетов. [ru.wikipedia.org]Сокет_(программный_интерфейс)
Если у вас недостаточное количество сокетов, то таковое поведение сетевых устройств может наблюдаться регулярно. Вам осталось определить, на каком устройтсве это происходит. Для этого воспользуйтесь любым сниффером.

Посмотреть какой модуль приципился к сетевой карте не могу - квалификация не позволяет[/quote писал(а):
<br /> lspci, dmesg, lsmod , modprobe. <br />
только просьба: нне вываливайте весь вывод команд, а попытайтесь разобраться сами. Значимыми будет всего с десяток строчек, а если вывалите все - многие десятки. Никто в них копаться не захочет.
Re: Кратко временное проподание сети 01.06.2009 11:40BigAndy
Да, рекомендую еще почитать про сокеты, если все-таки обнаружите что дело в них. [www.ibm.com]
Re: Кратко временное проподание сети 01.06.2009 11:41BigAndy
Только что пришла в голову еще мысль: А интерференция в сети не может наблюдаться?
Re: Кратко временное проподание сети 01.06.2009 15:40Палыч.RU
Статьи прочитал, команды dmesg, modprobe пощупал - понял конечно мало, но все же есть некоторые результаты:
уменьшение MTU c 1500 (по умолчанию) до 512 дало некоторый положительный эффект, еще более стабильным соединение стало при переключении сервера с гигабитного порта коммутатора в 100 мегабитный. Понимаю что это не есть хорошо, но как временная мера допустима.
(Команды lspci, lsmod в моей системе отсутствуют)
Интерференцию еще не изучал, если есть интересные ссылки порекомендуйте.
У пользователей которые работают с данным сервисом при пропадании соединения windows выдает сообщение "Ошибка отложенной записи на диск "
Re: Кратко временное проподание сети 01.06.2009 20:03peter_ir
/sbin/lspci - пакет pciutils,
/sbin/lsmod - пакет module-init-tools
А при MTU 1492 есть улучшение?
Re: Кратко временное проподание сети 03.06.2009 08:48Палыч.RU
Все перечисленные меры пока не привели к положительному результату - по прежнему наблюдаются пропадания сети то у одного то у другого пользователя. Перезагрузка сети /etc/init.d/network restart , как и перезагрузка сервера самба так же не дают результата, только после полной перезагрузки сервера можно всем работать часа два спокойно.
Re: Кратко временное проподание сети 03.06.2009 09:01peter_ir
М.б., какие-то процессы размножаются сверх допустимого предела?
/proc/stat//processes
Re: Кратко временное проподание сети 03.06.2009 09:03BigAndy
>Все перечисленные меры пока не привели к положительному результату
А мер -то пока никаких не предлагалось. Сначала надо вычислить причину. А может быть, какой-нть порт свича или сетевая карта флудить начинает...
Проведите диагностику для начала.
Re: Кратко временное проподание сети 08.06.2009 14:57Палыч.RU
Как всегда причина оказалась банальной - халатность и рас...здяство.
из диапазона адресов сервера DHCP, раздаваемого клиентам, не был исключен статический адрес сервера, (на котором пропадала сеть) , поэтому сервер DHCP с легкостью присваивал этот адрес любому кто попросит.
После устранения данного конфликта работа сети востановилась в полном объеме.

Хотя в ответах и не было озвучено данное направление поиска решения, хочется всем выразить огромное спасибо за отзывчивость и не равнодушие.

Re: Кратко временное проподание сети 08.06.2009 15:17lkanter
Палыч.RU Пишет:
-------------------------------------------------------
> из диапазона адресов сервера DHCP, раздаваемого
> клиентам, не был исключен статический адрес
> сервера, (на котором пропадала сеть) , поэтому
> сервер DHCP с легкостью присваивал этот адрес
> любому кто попросит.

А на какой системе стоит DHCP-сервер?

Re: Кратко временное проподание сети 08.06.2009 16:33Палыч.RU
DHCP server поднят на Windows 2003 и физически находится на другом компьютере (сервере).

Как только разберусь с основами линукса перенесу DHCP и DNS сервера на машину со свободным ПО и полностью избавлюсь от MS на серверах своей компании.

П.С. Почему то не приходят уведомления об ответах в данной теме, хотя галочка стоит "Следить за темой"

Re: Кратко временное проподание сети 08.06.2009 20:12lkanter
Порядочный DHCP-сервер, перед тем как выдать кому-то IP, должен пингануть этот IP, чтобы проверить, не занят ли он уже кем-то!
Re: Кратко временное проподание сети 08.06.2009 20:38blH,
lkanter Пишет:
-------------------------------------------------------
> Порядочный DHCP-сервер, перед тем как выдать
> кому-то IP, должен пингануть этот IP, чтобы
> проверить, не занят ли он уже кем-то!

А порядочный фаерволл, который находится на этом IP, должен дропать все приходящие туда пинги, чтобы никакой блин злоумышленник даже и не думал пингованием проникнуть в секретные тайны этой сети. Отлично! Отлично!

Re: Кратко временное проподание сети 09.06.2009 15:57Палыч.RU
lkanter Пишет:
-------------------------------------------------------
> Порядочный DHCP-сервер, перед тем как выдать
> кому-то IP, должен пингануть этот IP, чтобы
> проверить, не занят ли он уже кем-то!

Хочу вам возразить, что это далеко не так, и ни кто ни кого не пингует, потому что если адрес был выдан то он находится в списке "Арендованных адресов" до момента истечения срока аренды - обычно три дня, и при наличии "резерва" в диапазоне DHCP сервера не будет назначен ни кому даже если Клиент, получивший этот адрес по запросу в данный момент не активен. Затем как только клиент просил продление аренды ему снова назначался/продлевается этот адрес.
По этому и происходило это пропадание - нет человека на работе - сервер работал, приходил человек включал компьютер - продлевал аренду и так по кругу.

RSS-материал