Bug 21495 - kernel panic при нагрузке на сеть
: kernel panic при нагрузке на сеть
Status: CLOSED FIXED
: Sisyphus
(All bugs in Sisyphus/kernel-image-std-def)
: unstable
: all Linux
: P3 normal
Assigned To:
:
:
:
:
:
  Show dependency tree
 
Reported: 2009-09-09 12:41 by
Modified: 2009-09-17 18:09 (History)


Attachments
kernel_messages while booting std-def on hp proliant dl180g6 (348.37 KB, text/plain)
2009-09-09 16:47, Sergey Alembekov
no flags Details


Note

You need to log in before you can comment on or make changes to this bug.


Description From 2009-09-09 12:41:36
ядро: kernel-image-2.6.30-std-def
Железо: HP Proliant DL180G6

lspci:
00:00.0 Host bridge: Intel Corporation 5520 I/O Hub to ESI Port (rev 13)
00:01.0 PCI bridge: Intel Corporation 5520/5500/X58 I/O Hub PCI Express Root
Port 1 (rev 13)
00:03.0 PCI bridge: Intel Corporation 5520/5500/X58 I/O Hub PCI Express Root
Port 3 (rev 13)
00:07.0 PCI bridge: Intel Corporation 5520/5500/X58 I/O Hub PCI Express Root
Port 7 (rev 13)
00:09.0 PCI bridge: Intel Corporation 5520/5500/X58 I/O Hub PCI Express Root
Port 9 (rev 13)
00:14.0 PIC: Intel Corporation 5520/5500/X58 I/O Hub System Management
Registers (rev 13)
00:14.1 PIC: Intel Corporation 5520/5500/X58 I/O Hub GPIO and Scratch Pad
Registers (rev 13)
00:14.2 PIC: Intel Corporation 5520/5500/X58 I/O Hub Control Status and RAS
Registers (rev 13)
00:1a.0 USB Controller: Intel Corporation 82801JI (ICH10 Family) USB UHCI
Controller #4
00:1a.7 USB Controller: Intel Corporation 82801JI (ICH10 Family) USB2 EHCI
Controller #2
00:1c.0 PCI bridge: Intel Corporation 82801JI (ICH10 Family) PCI Express Port 1
00:1c.4 PCI bridge: Intel Corporation 82801JI (ICH10 Family) PCI Express Port 5
00:1d.0 USB Controller: Intel Corporation 82801JI (ICH10 Family) USB UHCI
Controller #1
00:1d.1 USB Controller: Intel Corporation 82801JI (ICH10 Family) USB UHCI
Controller #2
00:1d.2 USB Controller: Intel Corporation 82801JI (ICH10 Family) USB UHCI
Controller #3
00:1d.7 USB Controller: Intel Corporation 82801JI (ICH10 Family) USB2 EHCI
Controller #1
00:1e.0 PCI bridge: Intel Corporation 82801 PCI Bridge (rev 90)
00:1f.0 ISA bridge: Intel Corporation 82801JIR (ICH10R) LPC Interface
Controller
00:1f.2 IDE interface: Intel Corporation 82801JI (ICH10 Family) 4 port SATA IDE
Controller
00:1f.5 IDE interface: Intel Corporation 82801JI (ICH10 Family) 2 port SATA IDE
Controller
02:00.0 VGA compatible controller: Matrox Graphics, Inc. MGA G200e [Pilot]
ServerEngines (SEP1) (rev 02)
06:00.0 RAID bus controller: Hewlett-Packard Company Smart Array G6 controllers
(rev 01)
07:00.0 Ethernet controller: Intel Corporation 82576 Gigabit Network Connection
(rev 01)
07:00.1 Ethernet controller: Intel Corporation 82576 Gigabit Network Connection
(rev 01)

Машина загружается и работает нормально, Но как только нагружается сеть
(копирование rsync-ом сизифа) случается kernel panic. 
Предоставить ругань во время паника пока нет возможности.
------- Comment #1 From 2009-09-09 12:42:46 -------
Да, ничгео подобного не наблюдается на ovz-smp и ovz-rhel
------- Comment #2 From 2009-09-09 12:46:16 -------
Серёг, а сфоткать не получится ?

Или снять через сеть (там kvm over lan есть в ipmi ?)
------- Comment #3 From 2009-09-09 16:47:13 -------
Created an attachment (id=3857) [details]
kernel_messages while booting std-def on hp proliant dl180g6
------- Comment #4 From 2009-09-09 16:48:52 -------
(В ответ на комментарий №2)
> Или снять через сеть (там kvm over lan есть в ipmi ?)
Да, настроил уже. Сейчас буду воспроизводить ошибку.

А пока приложил лог загрузки - там тоже много интересного.
------- Comment #5 From 2009-09-09 16:57:20 -------
Настроил serial console, запускаю rsync.
Всё, что появляется на экране:
[ 1219.623507] Disabling IRQ #58
------- Comment #6 From 2009-09-09 22:08:16 -------
cat /proc/interrupts?
lspci -v -k
------- Comment #7 From 2009-09-10 00:54:19 -------
Попробуйте удалить пакет kernel-modules-igb-std-def#1.3.19.3-alt1.132638.10;
похоже, модуль igb.ko в этом пакете собран криво, однако в kernel-image-std-def
присутствует другая версия этого модуля (по номеру версии немного старее, хотя
в ядре этот номер может не отражать реальную ситуацию; список поддерживаемых
PCI ID тот же).
------- Comment #8 From 2009-09-10 10:16:53 -------
Сергей, спасибо! Удаление igb помогло!
Миша, тебе ещё нужны /proc/interrupts и 
lspci -v -k? И если да, то с установленным kernel-modules-igb-std-def или без?
------- Comment #9 From 2009-09-17 15:34:02 -------
Миша, в std-def-2.6.30-alt11 починилось.
------- Comment #10 From 2009-09-17 18:09:18 -------
Исправлено.