OpenVZ Forum


Home » International » Russian » Странное поведение VE
Странное поведение VE [message #34564] Sun, 18 January 2009 13:36 Go to next message
qwe011 is currently offline  qwe011
Messages: 10
Registered: April 2008
Junior Member
Есть нод - CoreQuad, 8Г ОЗУ, 2.6.18-92.1.13.el5.028stab059.3

На одном VE (а их всего 3) расположен сайт с приличной посещаемостью. Когда этот VE обрабатывает нагрузку порядка 1500-2000 подключений на 80'ый порт, то остальные VE с большими задержками отвечают по 80'ому порту.

failcnt в UBC ни на одном VE не увеличивается при нагрузках.
Складывается такое ощущение что ovz некорректно распределяет ресурсы.

Может я что-то с UBC перемудрил?
Ещё иногда появляются странные сообщения на самом ноде:
Message from syslogd@ at ...
Node kernel: unregister_netdevice: device ffff81022cbe6800 marked to leak
Message from syslogd@ at ...
Node kernel: free_netdev: device venet0=ffff81022cbe6800 leaked


Подскажите пожалуйста в какую сторону копать? Что вообще происходит с нодом. Спасибо.

# UBC "нагруженного" VE
KMEMSIZE="2147483646:2147483646"
LOCKEDPAGES="256:256"
PRIVVMPAGES="786432:835584"
SHMPAGES="21504:21504"
NUMPROC="340:340"
PHYSPAGES="0:9223372036854775807"
VMGUARPAGES="33792:9223372036854775807"
OOMGUARPAGES="26112:9223372036854775807"
NUMTCPSOCK="4800:4800"
NUMFLOCK="188:206"
NUMPTY="16:16"
NUMSIGINFO="256:256"
TCPSNDBUF="53687296:73348096"
TCPRCVBUF="1720320:2703360"
OTHERSOCKBUF="1126080:2097152"
DGRAMRCVBUF="262144:262144"
NUMOTHERSOCK="360:360"
DCACHESIZE="3409920:3624960"
NUMFILE="9312:9312"
AVNUMPROC="180:180"
NUMIPTENT="128:128"

CPUUNITS="250000"

# второй VE
KMEMSIZE="14372700:14790164"
LOCKEDPAGES="256:256"
PRIVVMPAGES="393216:417792"
SHMPAGES="21504:21504"
NUMPROC="240:240"
PHYSPAGES="0:9223372036854775807"
VMGUARPAGES="33792:9223372036854775807"
OOMGUARPAGES="26112:9223372036854775807"
NUMTCPSOCK="4800:4800"
NUMFLOCK="188:206"
NUMPTY="16:16"
NUMSIGINFO="256:256"
TCPSNDBUF="53687296:73348096"
TCPRCVBUF="53687296:73348096"
OTHERSOCKBUF="53687296:73348096"
DGRAMRCVBUF="53687296:73348096"
NUMOTHERSOCK="360:360"
DCACHESIZE="3409920:3624960"
NUMFILE="9312:9312"
AVNUMPROC="180:180"
NUMIPTENT="128:128"

CPUUNITS="80000"
Re: Странное поведение VE [message #34578 is a reply to message #34564] Mon, 19 January 2009 11:21 Go to previous messageGo to next message
khorenko is currently offline  khorenko
Messages: 533
Registered: January 2006
Location: Moscow, Russia
Senior Member
Добрый день.

1) по поводу "unregister_netdevice: device ffff81022cbe6800 marked to leak"
Эти сообщения могут появляться при стопе Контейнеров, когда делаются попытки убить сетевой интерфейс, а его всё ещё кто-то "держит". В случае сильно нагруженной ноды это могут быть просто пакеты, которые ещё не успели отправить. Там стоит довольно небольшой timeout, возможно, в вашем случае его просто не хватает. Мы уже увеличили этот timeout, в новых ядрах: в нашем случае (у нас тоже такие сообщения появлялись) это помогло.
В любом случае, это незначительная проблема, даже если там и происходит leak, то совсем небольшого размера и редко. Больше никак на систему это влиять не должно.

2) по поводу тормозов других Контейнеров, когда первый нагружен.
Это тяжело сказать. Посмотрите top-ом, кто больше всех cpu потребляет, остаётся ли процессам из другий контейнеров. Может, память заканчивается (RAM), начинается своп использоваться - тоже из-за этого тормозить будет больше...

--
Константин


If your problem is solved - please, report it!
It's even more important than reporting the problem itself...
Re: Странное поведение VE [message #34655 is a reply to message #34564] Fri, 23 January 2009 20:27 Go to previous message
sHaggY_caT is currently offline  sHaggY_caT
Messages: 144
Registered: August 2008
Location: Moscow, Russian Federatio...
Senior Member

Можно еще сеть посмотреть, и обязательно, i/o. Как показывает мой _личный_ опыт, нагруженный контейнер обычно "выключает" ноду именно по i/o.
В моем случае помогло только дать контейнеру, который всегда под большой нагрузкой, отдельный физический жесткий диск.

Симптомы очень характерные: шелл-сессия забавно так дергается, и очень много процессов в состоянии D+

P.S. есть такая наглядно-гуёвая утилитка, как atop Smile Показывает и i/o и сеть.
Для диагностики online очень удобно, хотя, конечно, ко всяким нагиосам не прикрутишь...


IT-outsource for UNIX servers,
http://ha-systems.ru

[Updated on: Fri, 23 January 2009 20:28]

Report message to a moderator

Previous Topic: Проблема с ipt_owner
Next Topic: ip_conntrack_ftp and 2.6.18-92.1.18.el5.028stab060.2
Goto Forum:
  


Current Time: Tue Mar 19 05:27:56 GMT 2024

Total time taken to generate the page: 0.02415 seconds