Bug 21495

Summary: kernel panic при нагрузке на сеть
Product: Sisyphus Reporter: Sergey Alembekov <rt>
Component: kernel-image-std-defAssignee: Vitaly Chikunov <vt>
Status: CLOSED FIXED QA Contact: qa-sisyphus
Severity: normal    
Priority: P3 CC: cas, kernelbot, vt
Version: unstable   
Hardware: all   
OS: Linux   
Attachments:
Description Flags
kernel_messages while booting std-def on hp proliant dl180g6 none

Description Sergey Alembekov 2009-09-09 12:41:36 MSD
ядро: kernel-image-2.6.30-std-def
Железо: HP Proliant DL180G6

lspci:
00:00.0 Host bridge: Intel Corporation 5520 I/O Hub to ESI Port (rev 13)
00:01.0 PCI bridge: Intel Corporation 5520/5500/X58 I/O Hub PCI Express Root Port 1 (rev 13)
00:03.0 PCI bridge: Intel Corporation 5520/5500/X58 I/O Hub PCI Express Root Port 3 (rev 13)
00:07.0 PCI bridge: Intel Corporation 5520/5500/X58 I/O Hub PCI Express Root Port 7 (rev 13)
00:09.0 PCI bridge: Intel Corporation 5520/5500/X58 I/O Hub PCI Express Root Port 9 (rev 13)
00:14.0 PIC: Intel Corporation 5520/5500/X58 I/O Hub System Management Registers (rev 13)
00:14.1 PIC: Intel Corporation 5520/5500/X58 I/O Hub GPIO and Scratch Pad Registers (rev 13)
00:14.2 PIC: Intel Corporation 5520/5500/X58 I/O Hub Control Status and RAS Registers (rev 13)
00:1a.0 USB Controller: Intel Corporation 82801JI (ICH10 Family) USB UHCI Controller #4
00:1a.7 USB Controller: Intel Corporation 82801JI (ICH10 Family) USB2 EHCI Controller #2
00:1c.0 PCI bridge: Intel Corporation 82801JI (ICH10 Family) PCI Express Port 1
00:1c.4 PCI bridge: Intel Corporation 82801JI (ICH10 Family) PCI Express Port 5
00:1d.0 USB Controller: Intel Corporation 82801JI (ICH10 Family) USB UHCI Controller #1
00:1d.1 USB Controller: Intel Corporation 82801JI (ICH10 Family) USB UHCI Controller #2
00:1d.2 USB Controller: Intel Corporation 82801JI (ICH10 Family) USB UHCI Controller #3
00:1d.7 USB Controller: Intel Corporation 82801JI (ICH10 Family) USB2 EHCI Controller #1
00:1e.0 PCI bridge: Intel Corporation 82801 PCI Bridge (rev 90)
00:1f.0 ISA bridge: Intel Corporation 82801JIR (ICH10R) LPC Interface Controller
00:1f.2 IDE interface: Intel Corporation 82801JI (ICH10 Family) 4 port SATA IDE Controller
00:1f.5 IDE interface: Intel Corporation 82801JI (ICH10 Family) 2 port SATA IDE Controller
02:00.0 VGA compatible controller: Matrox Graphics, Inc. MGA G200e [Pilot] ServerEngines (SEP1) (rev 02)
06:00.0 RAID bus controller: Hewlett-Packard Company Smart Array G6 controllers (rev 01)
07:00.0 Ethernet controller: Intel Corporation 82576 Gigabit Network Connection (rev 01)
07:00.1 Ethernet controller: Intel Corporation 82576 Gigabit Network Connection (rev 01)

Машина загружается и работает нормально, Но как только нагружается сеть (копирование rsync-ом сизифа) случается kernel panic. 
Предоставить ругань во время паника пока нет возможности.
Comment 1 Sergey Alembekov 2009-09-09 12:42:46 MSD
Да, ничгео подобного не наблюдается на ovz-smp и ovz-rhel
Comment 2 Anton Farygin 2009-09-09 12:46:16 MSD
Серёг, а сфоткать не получится ?

Или снять через сеть (там kvm over lan есть в ipmi ?)
Comment 3 Sergey Alembekov 2009-09-09 16:47:13 MSD
Created attachment 3857 [details]
kernel_messages while booting std-def on hp proliant dl180g6
Comment 4 Sergey Alembekov 2009-09-09 16:48:52 MSD
(В ответ на комментарий №2)
> Или снять через сеть (там kvm over lan есть в ipmi ?)
Да, настроил уже. Сейчас буду воспроизводить ошибку.

А пока приложил лог загрузки - там тоже много интересного.
Comment 5 Sergey Alembekov 2009-09-09 16:57:20 MSD
Настроил serial console, запускаю rsync.
Всё, что появляется на экране:
[ 1219.623507] Disabling IRQ #58
Comment 6 Michail Yakushin 2009-09-09 22:08:16 MSD
cat /proc/interrupts?
lspci -v -k
Comment 7 Sergey Vlasov 2009-09-10 00:54:19 MSD
Попробуйте удалить пакет kernel-modules-igb-std-def#1.3.19.3-alt1.132638.10; похоже, модуль igb.ko в этом пакете собран криво, однако в kernel-image-std-def присутствует другая версия этого модуля (по номеру версии немного старее, хотя в ядре этот номер может не отражать реальную ситуацию; список поддерживаемых PCI ID тот же).
Comment 8 Sergey Alembekov 2009-09-10 10:16:53 MSD
Сергей, спасибо! Удаление igb помогло!
Миша, тебе ещё нужны /proc/interrupts и 
lspci -v -k? И если да, то с установленным kernel-modules-igb-std-def или без?
Comment 9 Sergey Alembekov 2009-09-17 15:34:02 MSD
Миша, в std-def-2.6.30-alt11 починилось.
Comment 10 Andrey Cherepanov 2009-09-17 18:09:18 MSD
Исправлено.