Зависание системы (сети?) в ядрах старше 64.8 на CentOS [message #38566] |
Sun, 03 January 2010 16:09 |
|
Здравствуйте, уважаемые.
Проблема такова: на последних ядрах в произвольный момент выскакивают в сислог такие сообщения:
Jan 3 06:48:56 vdsm5 kernel: unregister_netdevice: waiting for lo=d59ef000 to become free. Usage count = 6 ve=6899
Jan 3 06:49:36 vdsm5 last message repeated 4 times
Jan 3 06:49:36 vdsm5 kernel: unregister_netdevice: device d59ef000 marked to leak
Jan 3 06:49:36 vdsm5 kernel: free_netdev: device lo=d59ef000 leaked
Jan 3 06:49:36 vdsm5 kernel: neighbour leakage
Jan 3 07:16:28 vdsm5 kernel: Route hash chain too long!
Jan 3 07:16:28 vdsm5 kernel: Adjust your secret_interval!
Jan 3 07:30:28 vdsm5 kernel: Fatal resource shortage: kmemsize, UB 28684.
Jan 3 08:01:01 vdsm5 kernel: Fatal resource shortage: kmemsize, UB 28684.
Jan 3 08:10:08 vdsm5 kernel: Fatal resource shortage: kmemsize, UB 28684.
Jan 3 08:10:09 vdsm5 kernel: Fatal resource shortage: kmemsize, UB 28684.
Jan 3 08:11:55 vdsm5 kernel: TCP: time wait bucket table overflow (CT28684)
Jan 3 08:45:29 vdsm5 kernel: TCP: time wait bucket table overflow (CT28684)
Jan 3 11:37:13 vdsm5 kernel: TCP: time wait bucket table overflow (CT28684)
Причем, первые - всегда, а касаемые определенного CTID - не всегда. Могут выскакивать 3-4 раза, а иногда - только один раз. После чего система либо виснет, либо отрубается сеть - точно сказать не могу, просто пинги не идут до удаленного сервера. Появляется через несколько часов аптайма (от 1 до 10). Контейнеров на ноде - около 50, все мелкие, нода - интел quad 4x2.6, два sata диска по 500 гб, 8 гб мозга, CentOS 5.4.
Пробовал ядра PAE и Enterprize - пофигу, виснет и всё. Лечится только откатом ядра до 2.6.18-128.2.1.el5.028stab064.8. Хз, что там они сделали, но суда по google - проблема не только у меня. Заметил, что несколько пролонгирует время работы такая примочка:
sysctl net.ipv4.tcp_mem="786432 1048576 1572864" - но опять же не сильно.
Собственно, вопрос: кто сталкивался, как лечили и вообще есть ли лекарство? Ну очень динамит - т.к. в новом ядре есть фичи, которые хотелось бы иметь, а тут такая засада...
Для статистики: таких идентичных серверов у меня пять, проблема есть на ВСЕХ. Могу кинуть dmesg для более точного описания оборудования - но, опять же судя по гуглю, дело не в железе а в CentOS+ovzkernel, да и на еще одном сервере где такой же софт но нет OVZ - все работает нормально.
Помогите
Welcome to xfes.ru OpenVZ repository mirror
|
|
|