Странное поведение VE [message #34564] |
Sun, 18 January 2009 13:36 |
qwe011
Messages: 10 Registered: April 2008
|
Junior Member |
|
|
Есть нод - CoreQuad, 8Г ОЗУ, 2.6.18-92.1.13.el5.028stab059.3
На одном VE (а их всего 3) расположен сайт с приличной посещаемостью. Когда этот VE обрабатывает нагрузку порядка 1500-2000 подключений на 80'ый порт, то остальные VE с большими задержками отвечают по 80'ому порту.
failcnt в UBC ни на одном VE не увеличивается при нагрузках.
Складывается такое ощущение что ovz некорректно распределяет ресурсы.
Может я что-то с UBC перемудрил?
Ещё иногда появляются странные сообщения на самом ноде:
Message from syslogd@ at ...
Node kernel: unregister_netdevice: device ffff81022cbe6800 marked to leak
Message from syslogd@ at ...
Node kernel: free_netdev: device venet0=ffff81022cbe6800 leaked
Подскажите пожалуйста в какую сторону копать? Что вообще происходит с нодом. Спасибо.
# UBC "нагруженного" VE
KMEMSIZE="2147483646:2147483646"
LOCKEDPAGES="256:256"
PRIVVMPAGES="786432:835584"
SHMPAGES="21504:21504"
NUMPROC="340:340"
PHYSPAGES="0:9223372036854775807"
VMGUARPAGES="33792:9223372036854775807"
OOMGUARPAGES="26112:9223372036854775807"
NUMTCPSOCK="4800:4800"
NUMFLOCK="188:206"
NUMPTY="16:16"
NUMSIGINFO="256:256"
TCPSNDBUF="53687296:73348096"
TCPRCVBUF="1720320:2703360"
OTHERSOCKBUF="1126080:2097152"
DGRAMRCVBUF="262144:262144"
NUMOTHERSOCK="360:360"
DCACHESIZE="3409920:3624960"
NUMFILE="9312:9312"
AVNUMPROC="180:180"
NUMIPTENT="128:128"
CPUUNITS="250000"
# второй VE
KMEMSIZE="14372700:14790164"
LOCKEDPAGES="256:256"
PRIVVMPAGES="393216:417792"
SHMPAGES="21504:21504"
NUMPROC="240:240"
PHYSPAGES="0:9223372036854775807"
VMGUARPAGES="33792:9223372036854775807"
OOMGUARPAGES="26112:9223372036854775807"
NUMTCPSOCK="4800:4800"
NUMFLOCK="188:206"
NUMPTY="16:16"
NUMSIGINFO="256:256"
TCPSNDBUF="53687296:73348096"
TCPRCVBUF="53687296:73348096"
OTHERSOCKBUF="53687296:73348096"
DGRAMRCVBUF="53687296:73348096"
NUMOTHERSOCK="360:360"
DCACHESIZE="3409920:3624960"
NUMFILE="9312:9312"
AVNUMPROC="180:180"
NUMIPTENT="128:128"
CPUUNITS="80000"
|
|
|
Re: Странное поведение VE [message #34578 is a reply to message #34564] |
Mon, 19 January 2009 11:21 |
khorenko
Messages: 533 Registered: January 2006 Location: Moscow, Russia
|
Senior Member |
|
|
Добрый день.
1) по поводу "unregister_netdevice: device ffff81022cbe6800 marked to leak"
Эти сообщения могут появляться при стопе Контейнеров, когда делаются попытки убить сетевой интерфейс, а его всё ещё кто-то "держит". В случае сильно нагруженной ноды это могут быть просто пакеты, которые ещё не успели отправить. Там стоит довольно небольшой timeout, возможно, в вашем случае его просто не хватает. Мы уже увеличили этот timeout, в новых ядрах: в нашем случае (у нас тоже такие сообщения появлялись) это помогло.
В любом случае, это незначительная проблема, даже если там и происходит leak, то совсем небольшого размера и редко. Больше никак на систему это влиять не должно.
2) по поводу тормозов других Контейнеров, когда первый нагружен.
Это тяжело сказать. Посмотрите top-ом, кто больше всех cpu потребляет, остаётся ли процессам из другий контейнеров. Может, память заканчивается (RAM), начинается своп использоваться - тоже из-за этого тормозить будет больше...
--
Константин
If your problem is solved - please, report it!
It's even more important than reporting the problem itself...
|
|
|
Re: Странное поведение VE [message #34655 is a reply to message #34564] |
Fri, 23 January 2009 20:27 |
sHaggY_caT
Messages: 144 Registered: August 2008 Location: Moscow, Russian Federatio...
|
Senior Member |
|
|
Можно еще сеть посмотреть, и обязательно, i/o. Как показывает мой _личный_ опыт, нагруженный контейнер обычно "выключает" ноду именно по i/o.
В моем случае помогло только дать контейнеру, который всегда под большой нагрузкой, отдельный физический жесткий диск.
Симптомы очень характерные: шелл-сессия забавно так дергается, и очень много процессов в состоянии D+
P.S. есть такая наглядно-гуёвая утилитка, как atop Показывает и i/o и сеть.
Для диагностики online очень удобно, хотя, конечно, ко всяким нагиосам не прикрутишь...
IT-outsource for UNIX servers,
http://ha-systems.ru
[Updated on: Fri, 23 January 2009 20:28] Report message to a moderator
|
|
|