OpenVZ Forum


Home » International » Russian » проблема с bind
проблема с bind [message #7977] Wed, 01 November 2006 17:42 Go to next message
knutov is currently offline  knutov
Messages: 79
Registered: December 2005
Location: Perm, Russia
Member
нода - центос 4.4

Ядро - последние три стабильных.

Несколько вдс было уже создано, с ними все хорошо. С вдс, которые создаются новые в течении последних трех дней проблемы - не работает named и не резолвятся домены. (примеры логов приведу ниже)

Изначально по неизвестной причине на вдс не работают нс сервера ДЦ, где стоит сервер. На самой ноде - работают. Для вдс указывал нс сервер 127.0.0.1, запускал бинд и все на ~20 вдс было хорошо. На свежесозданных бинд или не запускается или запускается но не работает.

/ver/log/messages из вдс
Oct 31 23:56:32 vds534 named[24375]: timer.c:812: unexpected error:
Oct 31 23:56:32 vds534 named[24375]: isc_thread_create() failed
Oct 31 23:56:32 vds534 named[24375]: ./main.c:488: unexpected error:
Oct 31 23:56:32 vds534 named[24375]: ns_timermgr_create() failed: unexpected error
Oct 31 23:56:32 vds534 named[24375]: create_managers() failed: unexpected error
Oct 31 23:56:32 vds534 named[24375]: exiting (due to early fatal error)

в ноды
Nov  1 00:01:35 vds532 sysctl: net.ipv4.conf.default.accept_source_route = 0
Nov  1 00:01:35 vds532 sysctl: error: unknown error 1 setting key 'kernel.sysrq'
Nov  1 00:01:35 vds532 sysctl: error: unknown error 1 setting key 'kernel.core_uses_pid'
Nov  1 00:01:35 vds532 network: Setting network parameters:  failed
Nov  1 00:01:35 vds532 network: Bringing up loopback interface:  succeeded
Nov  1 00:01:35 vds532 ifup: SIOCADDRT: Network is unreachable
Nov  1 00:01:35 vds532 network: Bringing up interface venet0:  succeeded
Nov  1 00:01:35 vds532 vzquota: quotaon:
Nov  1 00:01:35 vds532 vzquota: using //aquota.group on /dev/simfs [/]: Device or
resource busy
Nov  1 00:01:35 vds532 vzquota: quotaon: using //aquota.user on /dev/simfs [/]: Device
or resource busy
Nov  1 00:01:35 vds532 rc: Starting vzquota:  failed
Nov  1 00:02:19 vds532 named: /usr/sbin/named: symbol lookup error: /usr/sbin/named:
undefined symbol: dns_resolver_setudpsize
Nov  1 00:02:19 vds532 named: named startup failed


еще я примерно 3 дня назад на ноду с другой ноды перетаскивались две вдс через vzmigrate.

других отличий этой ноды от прочих вроде нет.

При необходимости могу дать доступ к ноде.
Re: проблема с bind [message #7994 is a reply to message #7977] Thu, 02 November 2006 15:08 Go to previous messageGo to next message
knutov is currently offline  knutov
Messages: 79
Registered: December 2005
Location: Perm, Russia
Member
Проблема стала интересней. На других нода на свежесозданных вдс точно такие же проблемы с резолвингом доменов.

В том числе на некоторых старых нодах, которые давно не трогались.

Куда смотреть то?

vzmemcheck -vA никаких проблем не показывает. du на ноде тоже говорит что места куча. В бинкаунтерс в failcnt нули.
Re: проблема с bind [message #8005 is a reply to message #7977] Thu, 02 November 2006 21:17 Go to previous messageGo to next message
knutov is currently offline  knutov
Messages: 79
Registered: December 2005
Location: Perm, Russia
Member
Проблема решилась. Единственное что менял -
vzctl set *** --kmemsize 30000000:30000000 --save

на
vzctl set *** --kmemsize 7929856:7929856 --save


Кроме этого параметра [вроде бы] ничего не менял.

Очень бы хотелось услышать мнение разработчиков на тему, как оно могло так странно влиять и является ли это багом или есть какие-то ограничения на размер kmemsize? (но если есть - почему проходит vzcfgvalidate?)


ps: сейчас посмотрел древний мануал, который в пдф.
там диапазон допустимых значений:
798720…13148160-851968…14024704

Отсюда вопросы:
1. тут две группы - одна для bar, другая для lim ?

2. почему проходит vzcfgvalidate?
 
# vzctl set *** --kmemsize 30000000:30000000 --save
UB limits were set successefully
Saved parameters for VE ***
# vzcfgvalidate /etc/sysconfig/vz-scripts/***.conf
Validation completed: success


3. Есть вдс, где kmemsize == 25000000 и они работают нормально. Это правильно, неправильно, лучше поставить меньшее значение из приведенного выше диапазона?
Re: проблема с bind [message #8021 is a reply to message #8005] Fri, 03 November 2006 13:31 Go to previous messageGo to next message
Vasily Tarasov is currently offline  Vasily Tarasov
Messages: 1345
Registered: January 2006
Senior Member
А каке вы пользуете ядро? Случаем не 2.6.16?
Re: проблема с bind [message #8026 is a reply to message #7977] Fri, 03 November 2006 13:57 Go to previous messageGo to next message
knutov is currently offline  knutov
Messages: 79
Registered: December 2005
Location: Perm, Russia
Member
вторая строчка оригинального поста - "последние три стабильных"

Непосредственно в текущий момент вернулся на 2.6.8-022stab078.21.
Re: проблема с bind [message #8027 is a reply to message #7977] Fri, 03 November 2006 13:58 Go to previous messageGo to next message
knutov is currently offline  knutov
Messages: 79
Registered: December 2005
Location: Perm, Russia
Member
да, если важно то -smp, а проц - opteron 175.
Re: проблема с bind [message #8030 is a reply to message #8026] Fri, 03 November 2006 14:22 Go to previous messageGo to next message
Vasily Tarasov is currently offline  Vasily Tarasov
Messages: 1345
Registered: January 2006
Senior Member
Извините, не заметил. Smile
А когда bind не работал - failcounter'ы появлялись у kmemsize'а?

Спасибо!
Re: проблема с bind [message #8032 is a reply to message #7977] Fri, 03 November 2006 14:32 Go to previous messageGo to next message
knutov is currently offline  knutov
Messages: 79
Registered: December 2005
Location: Perm, Russia
Member
нет, они всегда были по нулям.
Re: проблема с bind [message #8034 is a reply to message #7977] Fri, 03 November 2006 14:39 Go to previous messageGo to next message
Vasily Tarasov is currently offline  Vasily Tarasov
Messages: 1345
Registered: January 2006
Senior Member
Не могли бы вы сделать strace незапускающегося bind'a и запостить результат сюда?

Хочется убедится, что где-то он получает от ядра -ENOMEM и вываливается, а при этом failcounterы в норме.

Спасибо.
Re: проблема с bind [message #8035 is a reply to message #7977] Fri, 03 November 2006 14:47 Go to previous messageGo to next message
knutov is currently offline  knutov
Messages: 79
Registered: December 2005
Location: Perm, Russia
Member
можно попытаться.

strace что?
я обычно запускаю service named start.
Re: проблема с bind [message #8037 is a reply to message #8035] Fri, 03 November 2006 15:03 Go to previous message
Vasily Tarasov is currently offline  Vasily Tarasov
Messages: 1345
Registered: January 2006
Senior Member
впринципе можно и service стрейсить, только добавьте -f флаг, чтобы и детей прострейсить.
Previous Topic: q: screen and term resize
Next Topic: сетевые интерфейсы, 2 VSP на один IP - возможно?
Goto Forum:
  


Current Time: Sat Nov 16 02:09:25 GMT 2024

Total time taken to generate the page: 0.03348 seconds