OpenVZ Forum


Home » International » Russian » Проблема с сетью на ноде
Проблема с сетью на ноде [message #27651] Thu, 21 February 2008 20:44 Go to next message
blttll is currently offline  blttll
Messages: 8
Registered: February 2008
Junior Member
столкнулся с проблемой: после загрузки с openvz-ядром (пробовал несколько, компилил и брал уже готовые рабочие) до машины невозможно достучаться Confused

например пингуешь с соседней машины, она шлет arp-запрос, но ответа от openvz-машины не получает. стоит пустить пинг в обратном направлении (с openvz-машины) - все нормально. пинги начинают ходить в обоих направлениях. как только кеш из arp-таблицы на не openvz-машине затрется, пинг на openvz-машину опять не идет.

tcpdump -ni eth0 arp на openvz-машине показывает тишину, кроме тех случаев когда с нее самой что-то отправляется.

свитч исправен, openvz-машина загруженная с НЕ openvz-ядром ведет себя нормально.
ос: gentoo
openvz-ядро: 2.6.18 028stab053.5 (собрано по инструкции из вашего вики и на другой машине прекрасно работает).

хелп.
Re: Проблема с сетью на ноде [message #27664 is a reply to message #27651] Fri, 22 February 2008 08:41 Go to previous messageGo to next message
maratrus is currently offline  maratrus
Messages: 1495
Registered: August 2007
Location: Moscow
Senior Member
скажите, а openvz-машина - это HN или VPS?
и если можно, то опишите конфигурацию сети на вашей машине.
да, и еще, какую версию vzctl вы используете?
Re: Проблема с сетью на ноде [message #27670 is a reply to message #27651] Fri, 22 February 2008 08:56 Go to previous messageGo to next message
blttll is currently offline  blttll
Messages: 8
Registered: February 2008
Junior Member
1. openvz-машина это HN, на ней пока не стартовано ни одной VE
2. сеть на HN: ip-адрес из сети с маской /23, default gw - младший адрес из этой /23 сети. в общем самые заурядные настройки.
3. на соседних машинах ip-адреса из той же /23 сети с теми же сетевыми настройками (между собой пингуются отлично).
4. vzctl version 3.0.18, Linux 2.6.18-028stab053
Re: Проблема с сетью на ноде [message #27674 is a reply to message #27670] Fri, 22 February 2008 10:01 Go to previous messageGo to next message
den is currently offline  den
Messages: 494
Registered: December 2005
Senior Member
если нет ARP-запросов, значит что-то не так.

Укажите полную настройку сети на openvz машине и на исходной машине. Проверьте, что арп запрос уходит на правильный интерфейс

Regards,
Den
Re: Проблема с сетью на ноде [message #27675 is a reply to message #27651] Fri, 22 February 2008 10:54 Go to previous messageGo to next message
blttll is currently offline  blttll
Messages: 8
Registered: February 2008
Junior Member
сетевые настройки на неработающей HN (BAD-HN):
BAD-HN ~ # ifconfig
eth0 Link encap:Ethernet HWaddr 00:30:48:62:F9:A4
inet addr:xx.xx.185.55 Bcast:xx.xx.185.255 Mask:255.255.254.0
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:734 errors:0 dropped:0 overruns:0 frame:0
TX packets:272 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:100
RX bytes:71712 (70.0 Kb) TX bytes:33734 (32.9 Kb)
Base address:0x2000 Memory:d8220000-d8240000

lo Link encap:Local Loopback
inet addr:127.0.0.1 Mask:255.0.0.0
UP LOOPBACK RUNNING MTU:16436 Metric:1
RX packets:56 errors:0 dropped:0 overruns:0 frame:0
TX packets:56 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:4340 (4.2 Kb) TX bytes:4340 (4.2 Kb)

venet0 Link encap:UNSPEC HWaddr 00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00
UP BROADCAST POINTOPOINT RUNNING NOARP MTU:1500 Metric:1
RX packets:0 errors:0 dropped:0 overruns:0 frame:0
TX packets:0 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:0 (0.0 b) TX bytes:0 (0.0 b)

BAD-HN ~ # route -n
Kernel IP routing table
Destination Gateway Genmask Flags Metric Ref Use Iface
xx.xx.184.0 0.0.0.0 255.255.254.0 U 0 0 0 eth0
127.0.0.0 0.0.0.0 255.0.0.0 U 0 0 0 lo
0.0.0.0 xx.xx.184.1 0.0.0.0 UG 0 0 0 eth0

сетевые настройки на нормально работающей машине (GOOD-BOY):
GOOD-BOY ~ # ifconfig
eth0 Link encap:Ethernet HWaddr 00:30:48:90:13:60
inet addr:xx.xx.184.120 Bcast:xx.xx.185.255 Mask:255.255.254.0
inet6 addr: fe80::230:48ff:fe90:1360/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:467366900 errors:0 dropped:0 overruns:0 frame:0
TX packets:1908514865 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:100
RX bytes:2803931854 (2674.0 Mb) TX bytes:2417080846 (2305.1 Mb)
Base address:0x2000 Memory:d8200000-d8220000

lo Link encap:Local Loopback
inet addr:127.0.0.1 Mask:255.0.0.0
inet6 addr: ::1/128 Scope:Host
UP LOOPBACK RUNNING MTU:16436 Metric:1
RX packets:25410 errors:0 dropped:0 overruns:0 frame:0
TX packets:25410 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:3224520 (3.0 Mb) TX bytes:3224520 (3.0 Mb)

venet0 Link encap:UNSPEC HWaddr 00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00
UP BROADCAST POINTOPOINT RUNNING NOARP MTU:1500 Metric:1
RX packets:1567473273 errors:0 dropped:0 overruns:0 frame:0
TX packets:7726013 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:2452285685 (2338.6 Mb) TX bytes:2965763816 (2828.3 Mb)

GOOD-BOY ~ # route -n
Kernel IP routing table
Destination Gateway Genmask Flags Metric Ref Use Iface
xx.xx.184.190 0.0.0.0 255.255.255.255 UH 0 0 0 venet0
..
..
xx.xx.184.0 0.0.0.0 255.255.254.0 U 0 0 0 eth0
127.0.0.0 0.0.0.0 255.0.0.0 U 0 0 0 lo
0.0.0.0 xx.xx.184.1 0.0.0.0 UG 0 0 0 eth0

Запускаю пинг с GOOD-BOY на BAD-HN:
GOOD-BOY / # ping BAD-HN
PING BAD-HN (xx.xx.185.55) 56(84) bytes of data.
From GOOD-BOY (xx.xx.184.120) icmp_seq=1 Destination Host Unreachable
From GOOD-BOY (xx.xx.184.120) icmp_seq=2 Destination Host Unreachable
From GOOD-BOY (xx.xx.184.120) icmp_seq=3 Destination Host Unreachable

--- BAD-HN ping statistics ---
5 packets transmitted, 0 received, +3 errors, 100% packet loss, time 4000ms
, pipe 4

Во время пинга был включен tcpdump и тут и там:
На GOOD-BOY:
GOOD-BOY ~ # tcpdump -ni eth0 arp host BAD-HN
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on eth0, link-type EN10MB (Ethernet), capture size 96 bytes
13:26:00.811237 arp who-has xx.xx.185.55 tell xx.xx.184.120
13:26:01.811067 arp who-has xx.xx.185.55 tell xx.xx.184.120
13:26:02.810888 arp who-has xx.xx.185.55 tell xx.xx.184.120
13:26:03.810751 arp who-has xx.xx.185.55 tell xx.xx.184.120
13:26:04.811533 arp who-has xx.xx.185.55 tell xx.xx.184.120
13:26:05.811359 arp who-has xx.xx.185.55 tell xx.xx.184.120

6 packets captured
10 packets received by filter
0 packets dropped by kernel

на BAD-HN:
BAD-HN ~ # tcpdump -ni eth0 arp
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on eth0, link-type EN10MB (Ethernet), capture size 96 bytes

0 packets captured
0 packets received by filter
0 packets dropped by kernel


при этом на самом деле сеть на BAD-HN работает, но как-то в одну сторону (напоминает stateful-firewall). То есть если пинг запустить в обратную сторону (с BAD-HN на GOOD-BOY), то
GOOD-BOY делает arp-reply, пинг идет (в tcpdump на обеих машинах видна соответствующая активность). Останавливаем пинг, и запускаем как и хотели (c GOOD-BOY на BAD-HN) - работае
т. Делаем на GOOD-BOY arp -d BAD-HN и все, пинги больше не пойдут.

Перезагружаем BAD-HN с не openvz-ядром и сеть начинает работать как положено.
Re: Проблема с сетью на ноде [message #27676 is a reply to message #27675] Fri, 22 February 2008 11:12 Go to previous messageGo to next message
den is currently offline  den
Messages: 494
Registered: December 2005
Senior Member
- один ли сетевой интерфейс на BAD-HN?
- какая карточка там стоит?

Regards,
Den
Re: Проблема с сетью на ноде [message #27677 is a reply to message #27651] Fri, 22 February 2008 11:23 Go to previous messageGo to next message
blttll is currently offline  blttll
Messages: 8
Registered: February 2008
Junior Member
1. на BAD-HN два сетевых интерфейса (на втором просто линка нет), то же самое можно можно сказать про GOOD-BOY.
2.
BAD-HN ~ # lspci -vv | grep Ethe
04:00.0 Ethernet controller: Intel Corporation PRO/1000 EB Network Connection with I/O Acceleration (rev 01)
04:00.1 Ethernet controller: Intel Corporation PRO/1000 EB Network Connection with I/O Acceleration (rev 01)

BAD-HN ~ # dmesg | grep eth
e1000: eth0: e1000_probe: Intel(R) PRO/1000 Network Connection
e1000: eth0: e1000_watchdog: NIC Link is Up 100 Mbps Full Duplex
e1000: eth0: e1000_watchdog: 10/100 speed: disabling TSO

у GOOD-BOY интерфейсы такие же.
Re: Проблема с сетью на ноде [message #27678 is a reply to message #27677] Fri, 22 February 2008 11:40 Go to previous messageGo to next message
den is currently offline  den
Messages: 494
Registered: December 2005
Senior Member
скорее всего, у вас они меняются местами при загрузке OVZного ядра.

Вам надо прописать в конфигурации карточек HWADDR чтобы определится с порядком
Re: Проблема с сетью на ноде [message #27679 is a reply to message #27651] Fri, 22 February 2008 11:58 Go to previous messageGo to next message
blttll is currently offline  blttll
Messages: 8
Registered: February 2008
Junior Member
проверил, при загрузке с не openvz-ядра eth0 по прежнему имеет адрес 00:30:48:62:F9:A4.

могу показать diff для lspci -vvv для обоих ядер после загрузки.
Re: Проблема с сетью на ноде [message #27680 is a reply to message #27679] Fri, 22 February 2008 12:18 Go to previous messageGo to next message
den is currently offline  den
Messages: 494
Registered: December 2005
Senior Member
tcpdump работает ДО каких бы то ни было фильтров. Если он их не показывает - значит или проблемы с драйвером или они не приходят или приходят на другой интерфейс.

Или MAC конфликт.

Ищите куда уходят пакеты. Я не вижу других идей.
Re: Проблема с сетью на ноде [message #27684 is a reply to message #27651] Fri, 22 February 2008 14:16 Go to previous messageGo to next message
blttll is currently offline  blttll
Messages: 8
Registered: February 2008
Junior Member
заработало. всем спасибо и с наступающим.
Re: Проблема с сетью на ноде [message #27685 is a reply to message #27684] Fri, 22 February 2008 14:27 Go to previous messageGo to next message
maratrus is currently offline  maratrus
Messages: 1495
Registered: August 2007
Location: Moscow
Senior Member
Вас также с наступающим.
А все-таки, в чем была проблема?
Re: Проблема с сетью на ноде [message #27688 is a reply to message #27651] Fri, 22 February 2008 15:00 Go to previous messageGo to next message
blttll is currently offline  blttll
Messages: 8
Registered: February 2008
Junior Member
прошу прощения. меня самого бесят такие посты в конце топика. типа "заработало" и свалил. просто дейсвительно заработало, но почему было не понятно.

сейчас проблему удалось локализовать. и даже повторить.
для сетапа машины использовался pxe, при включении соответствующей опции в биосе, сетапе, отключении pxe и загрузке с openvz-ядром получали машину в состоянии которое я попытался описать выше.
в итоге решили попробовать другую сетевую карту. обесточили сервер... карта не подошла =) машину собрали обрато и вдруг все заработало. фокус с pxe и последующим исцеляющим обесточиванием удалось воспроизвести.

остался только один не решенный вопрос, почему не openvz-ядро работает и тут и там, а openvz - нет?
Re: Проблема с сетью на ноде [message #27704 is a reply to message #27688] Fri, 22 February 2008 21:35 Go to previous messageGo to next message
darkstar is currently offline  darkstar
Messages: 38
Registered: November 2007
Location: /Ukraine/Kiev
Member
Больше офтопиком, но всеже - что за сервер у Вас?

Igor Nemilostivy
Re: Проблема с сетью на ноде [message #27707 is a reply to message #27651] Sat, 23 February 2008 12:26 Go to previous message
blttll is currently offline  blttll
Messages: 8
Registered: February 2008
Junior Member
supermicro, деталей нет
Previous Topic: 2.6.18 и intellinuxgraphics
Next Topic: [SOLVED] Куда бы выплеснуть инфу?
Goto Forum:
  


Current Time: Wed Nov 06 05:46:41 GMT 2024

Total time taken to generate the page: 0.03579 seconds