kernel panic: vzquota_dparents_check_actual [message #38902] |
Thu, 18 February 2010 07:47 ![Go to next message Go to next message](/theme/ovz3/images/down.png) |
pavel.odintsov
Messages: 24 Registered: February 2010
|
Junior Member |
|
|
Столкнулись со странным кернел паником на функции "vzquota_dparents_check_actual", вызванным, предположительно тем, что один из дисков mdraid был исключен из массива по причине отказа (были замечены ошибки ввода-вывода). Как я понимаю, это является не нормальным поведением и mdraid должен был разрешить эту ситуацию полностью прозрачно.
В аттаче полные бэктрейсы ядра в момент паника.
uname -a
Linux xxx.fastvps.ru 2.6.18-128.2.1.el5.028stab064.8 #1 SMP Fri Nov 6 12:26:59 MSK 2009 x86_64 x86_64 x86_64 GNU/Linux
vzctl --version
vzctl version 3.0.23
cat /proc/cpuinfo
processor : 0
vendor_id : GenuineIntel
cpu family : 6
model : 26
model name : Intel(R) Core(TM) i7 CPU 920 @ 2.67GHz
stepping : 5
cpu MHz : 2673.430
cache size : 8192 KB
physical id : 0
siblings : 8
core id : 0
cpu cores : 4
apicid : 0
fpu : yes
fpu_exception : yes
cpuid level : 11
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm syscall nx rdtscp lm constant_tsc ida nonstop_tsc pni monitor ds_cpl vmx est tm2 cx16 xtpr popcnt lahf_lm
bogomips : 5350.67
clflush size : 64
cache_alignment : 64
address sizes : 36 bits physical, 48 bits virtual
power management: [8]
cat /proc/mdstat
Personalities : [raid1] [raid10] [raid0] [raid6] [raid5] [raid4]
md0 : active raid1 sdb1[1] sda1[0]
4200896 blocks [2/2] [UU]
md1 : active raid1 sdb2[1] sda2[0]
2104448 blocks [2/2] [UU]
md2 : active raid1 sdb3[2](F) sda3[0]
1458830400 blocks [2/1] [U_]
unused devices: <none>
http://ru.linkedin.com/pub/pavel-odintsov/35/154/575/
My blog is: http://stableit.ru
|
|
|
|
|
Re: kernel panic: vzquota_dparents_check_actual [message #38907 is a reply to message #38903] |
Thu, 18 February 2010 16:34 ![Go to previous message Go to previous message](/theme/ovz3/images/up.png) ![Go to next message Go to next message](/theme/ovz3/images/down.png) |
sHaggY_caT
Messages: 144 Registered: August 2008 Location: Moscow, Russian Federatio...
|
Senior Member |
![galia@shaggy-cat.ru](/theme/ovz3/images/jabber.png)
|
|
Подтверждаю существование проблемы.
Столкнулась с ней на тестах установочных кикстартов: дергала диски из mdraid, что бы убедится, что grub прописался Anacond'ой верно.
Скриншоты не сохранила, и не обратила внимание, на чем именно происходит паника, предположила тогда, что из-за железа, так как платформа дешевая, без hotswap (то есть, если честно, стопроцентной уверености, что тоже самое, нет, но и железа для повторных тестов сейчас тоже нет)
2.6.18-164.2.1.el5.028stab066.10
2 pavel.odintsov & Kir: если нужно, черкану комментарий в соотвествующем Баге, когда pavel.odintsov его заведет.
Обратите внимание, что у нас ядро из RHEL 5.4
IT-outsource for UNIX servers,
http://ha-systems.ru
[Updated on: Thu, 18 February 2010 16:40] Report message to a moderator
|
|
|
|
|
|
Re: kernel panic: vzquota_dparents_check_actual [message #38915 is a reply to message #38914] |
Thu, 18 February 2010 19:48 ![Go to previous message Go to previous message](/theme/ovz3/images/up.png) |
sHaggY_caT
Messages: 144 Registered: August 2008 Location: Moscow, Russian Federatio...
|
Senior Member |
![galia@shaggy-cat.ru](/theme/ovz3/images/jabber.png)
|
|
pavel.odintsov wrote on Thu, 18 February 2010 14:42 | sHaggY_caT wrote on Thu, 18 February 2010 12:29 | Отметилась
|
Такой вопросик, как Вы воспроизводили баг? Просто мне крайне проблематично сэмулировать физический отказ винта, а ставить на все продакшены дебаг-ядро довольно сомнительно.
|
Запускала SR1325 со снятой крышкой, уходила на безопасное для слуха расстояние, ждала когда засинкается mdraid, после чего стараясь не оглохнуть, и не замкнуть собой электрическую цепь, выдергивала sata-шнурок
Можно еще сделать вот так: echo 1 > /sys/block/sda/device/delete
Честно говоря, уже не помню, была ли во втором случае паника...
Для себя я тогда сделала выводы, что SR1325 по многим причинам мусор, хоть и дешевый.
Железа, на котором можно было бы потестить это ядро, у нас сейчас тоже нет
IT-outsource for UNIX servers,
http://ha-systems.ru
[Updated on: Thu, 18 February 2010 19:51] Report message to a moderator
|
|
|