Bug 11645 - [x86_64 only] Kernel panic when loading megaraid_mbox module
Summary: [x86_64 only] Kernel panic when loading megaraid_mbox module
Status: CLOSED FIXED
Alias: None
Product: Sisyphus
Classification: Development
Component: kernel-image-std-smp (show other bugs)
Version: unstable
Hardware: all Linux
: P2 blocker
Assignee: Sergey Vlasov
QA Contact: qa-sisyphus
URL:
Keywords:
Depends on:
Blocks:
 
Reported: 2007-04-28 14:08 MSD by Sergey Y. Afonin
Modified: 2007-07-13 14:11 MSD (History)
4 users (show)

See Also:


Attachments

Note You need to log in before you can comment on or make changes to this bug.
Description Sergey Y. Afonin 2007-04-28 14:08:14 MSD
При загрузке модуля на начальном этапе инсталляции возникает kernel panic.

lspci/lspci -n (это в x86_32 смотрится):
06:03.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID (rev 01)
06:03.0 0104: 1000:1960 (rev 01)

Порезавшиеся в начале строчки надо ? Или этого хватит ?

           Loading driver for storage adapter: megaraid_mbox      Unable to ha
 [<ffffffff8030a2ec>] sync_single+0x20/0x7b                         
PGD 0
Oops: 0000 [1] SMP
CPU 0
Modules linked in: megaraid_mbox megaraid_mm ata_piix libata piix sr_mod scsi_me
Pid: 0, comm: swapper Not tainted 2.6.18-std-smp-alt5 #1
RIP: 0010:[<ffffffff8030a2ec>]  [<ffffffff8030a2ec>] sync_single+0x20/0x7b
RSP: 0000:ffffffff804f6e88  EFLAGS: 00010246
RAX: ffffffffe0000000 RBX: ffff81015ea53080 RCX: 0000000000000002
RDX: ffff81000a392000 RSI: 0000000006372000 RDI: ffff81015ef13070
RBP: 0000000000000002 R08: 0000000000000000 R09: 0000000000000024
R10: 0000000006372000 R11: ffff810005d2c780 R12: 0000000000000000 msg
R13: 0000000000000001 R14: ffff81015ef13070 R15: ffff81015e5e7cc0
FS:  0000000000000000(0000) GS:ffffffff80563000(0000) knlGS:0000000000000000
CS:  0010 DS: 0018 ES: 0018 CR0: 000000008005003b
CR2: ffff80ff0a392000 CR3: 0000000000201000 CR4: 00000000000006e0
Process swapper (pid: 0, threadinfo ffffffff80570000, task ffffffff8048c3c0)
Stack:  ffffffff8030b1f1 ffff81015fc69858 ffff81015e690000 ffff81015e5e7cc0
 ffff81015e690008 ffff81015fc5e000 ffffffff880d8776 ffff81015fc68000
 ffffffff804f6ec8 ffff81015e690008 ffff81015e690008 0000000000000001
Call Trace:
 [<ffffffff8030b1f1>] swiotlb_sync_sg_for_cpu+0xca/0xe3
 [<ffffffff880d8776>] :megaraid_mbox:megaraid_mbox_dpc+0x4bc/0x592
 [<ffffffff8028655a>] tasklet_action+0x62/0xac
 [<ffffffff80210639>] __do_softirq+0x5e/0xd5
 [<ffffffff8025a0ec>] call_softirq+0x1c/0x28
DWARF2 unwinder stuck at call_softirq+0x1c/0x28
Leftover inexact backtrace:
 <IRQ> [<ffffffff80266e83>] do_softirq+0x2c/0x7d
 [<ffffffff80266e4e>] do_IRQ+0xec/0xf5
 [<ffffffff80253aa9>] mwait_idle+0x0/0x4a
 [<ffffffff80259411>] ret_from_intr+0x0/0xa
 <EOI> [<ffffffff80253adf>] mwait_idle+0x36/0x4a
 [<ffffffff80245e53>] cpu_idle+0x95/0xb8
 [<ffffffff805797a6>] start_kernel+0x220/0x225
 [<ffffffff80579288>] _sinittext+0x288/0x28c


Code: 48 8b 04 c2 74 07 41 ff c8 75 45 eb 21 83 f9 02 74 04 85 c9
RIP  [<ffffffff8030a2ec>] sync_single+0x20/0x7b
 RSP <ffffffff804f6e88>
CR2: ffff80ff0a392000
 <0>Kernel panic - not syncing: Aiee, killing interrupt handler!
Comment 1 Sergey Vlasov 2007-04-28 16:18:36 MSD
А памяти (RAM) на этой машине сколько?

Провести установку с имеющейся версией, вероятно, получится с опцией mem=3G (или
2G - зависит от того, как BIOS распределяет память для PCI-устройств); в
следующей сборке ядра эта ошибка должна быть исправлена.
Comment 2 Sergey Y. Afonin 2007-04-28 21:08:24 MSD
Не помогло, но мысль верная: всё поставилось, когда оставил 2Gb RAM в виде 
железа.

А, вообще, с параметром "mem=..." неплохо бы разобраться... В смысле почему 
тоже не работает. Было бы удобно в качестве временного решения, чтобы память 
сразу на место поставить. Ну или таки ядро новое побыстрее. :-)

Всего сейчас 4Gb по-умолчанию.
Comment 3 Sergey Vlasov 2007-04-28 23:45:54 MSD
Возможно, нужно было добавить ещё что-то типа iommu=off - у меня нет возможности
экспериментально проверить это. Т.е., нужно добиться, чтобы ядро отключило
использование IOMMU - обычно это происходит, когда не обнаруживается память за
пределами первых 4 GB адресного пространства. Возможно, параметр mem=
обрабатывается слишком поздно.

В kernel-image-std-smp 2.6.18-alt6 эта ошибка должна быть исправлена (в ядре
была сломана поддержка swiotlb, что проявлялось только на x86_64 при наличии RAM
за пределами первых 4 GB адресного пространства, причём только на процессорах
Intel, поскольку у AMD IOMMU реализован аппаратно).
Comment 4 Sergey Y. Afonin 2007-04-29 15:14:26 MSD
Заработало. Я так понимаю, это надо и на остальные ядра развесить, особенно 
ovz ?
Comment 5 Sergey Y. Afonin 2007-05-01 16:14:48 MSD
для статистики. ovz запустилось с

addappend="mem=3G iommu=off"

Comment 6 Vasily Averin 2007-07-13 14:11:39 MSD
We have reproduced this issue on RHEL5 kernels and I've filed following bug to
their bugzilla:
https://bugzilla.redhat.com/bugzilla/show_bug.cgi?id=248102

Thank you for your help!