OpenVZ Forum


Home » International » Russian » Зависание системы (сети?) в ядрах старше 64.8 на CentOS (unregister_netdevice: device xxxxx marked to leak и TCP: time wait bucket table overflow (CTXXXX))
icon9.gif  Зависание системы (сети?) в ядрах старше 64.8 на CentOS [message #38566] Sun, 03 January 2010 16:09 Go to previous message
AnVir is currently offline  AnVir
Messages: 20
Registered: October 2009
Location: Russia
Junior Member

Здравствуйте, уважаемые.
Проблема такова: на последних ядрах в произвольный момент выскакивают в сислог такие сообщения:

Jan  3 06:48:56 vdsm5 kernel: unregister_netdevice: waiting for lo=d59ef000 to become free. Usage count = 6 ve=6899
Jan  3 06:49:36 vdsm5 last message repeated 4 times
Jan  3 06:49:36 vdsm5 kernel: unregister_netdevice: device d59ef000 marked to leak
Jan  3 06:49:36 vdsm5 kernel: free_netdev: device lo=d59ef000 leaked
Jan  3 06:49:36 vdsm5 kernel: neighbour leakage
Jan  3 07:16:28 vdsm5 kernel: Route hash chain too long!
Jan  3 07:16:28 vdsm5 kernel: Adjust your secret_interval!
Jan  3 07:30:28 vdsm5 kernel: Fatal resource shortage: kmemsize, UB 28684.
Jan  3 08:01:01 vdsm5 kernel: Fatal resource shortage: kmemsize, UB 28684.
Jan  3 08:10:08 vdsm5 kernel: Fatal resource shortage: kmemsize, UB 28684.
Jan  3 08:10:09 vdsm5 kernel: Fatal resource shortage: kmemsize, UB 28684.
Jan  3 08:11:55 vdsm5 kernel: TCP: time wait bucket table overflow (CT28684)
Jan  3 08:45:29 vdsm5 kernel: TCP: time wait bucket table overflow (CT28684)
Jan  3 11:37:13 vdsm5 kernel: TCP: time wait bucket table overflow (CT28684)


Причем, первые - всегда, а касаемые определенного CTID - не всегда. Могут выскакивать 3-4 раза, а иногда - только один раз. После чего система либо виснет, либо отрубается сеть - точно сказать не могу, просто пинги не идут до удаленного сервера. Появляется через несколько часов аптайма (от 1 до 10). Контейнеров на ноде - около 50, все мелкие, нода - интел quad 4x2.6, два sata диска по 500 гб, 8 гб мозга, CentOS 5.4.
Пробовал ядра PAE и Enterprize - пофигу, виснет и всё. Лечится только откатом ядра до 2.6.18-128.2.1.el5.028stab064.8. Хз, что там они сделали, но суда по google - проблема не только у меня. Заметил, что несколько пролонгирует время работы такая примочка:
sysctl net.ipv4.tcp_mem="786432 1048576 1572864" - но опять же не сильно.
Собственно, вопрос: кто сталкивался, как лечили и вообще есть ли лекарство? Ну очень динамит - т.к. в новом ядре есть фичи, которые хотелось бы иметь, а тут такая засада...
Для статистики: таких идентичных серверов у меня пять, проблема есть на ВСЕХ. Могу кинуть dmesg для более точного описания оборудования - но, опять же судя по гуглю, дело не в железе а в CentOS+ovzkernel, да и на еще одном сервере где такой же софт но нет OVZ - все работает нормально.
Помогите Sad


Welcome to xfes.ru OpenVZ repository mirror
 
Read Message icon9.gif
Read Message
Read Message
Read Message
Read Message
Read Message
Read Message
Read Message
Read Message
Previous Topic: hostname внутри VPS
Next Topic: Проблемы со Snort
Goto Forum:
  


Current Time: Thu Nov 07 14:15:59 GMT 2024

Total time taken to generate the page: 0.03209 seconds