Bug 31938

Summary: kernel BUG в scsi_transport_sas
Product: Sisyphus Reporter: Alexey Shabalin <shaba>
Component: kernel-image-un-defAssignee: Vitaly Chikunov <vt>
Status: NEW --- QA Contact: qa-sisyphus
Severity: normal    
Priority: P3 CC: kernelbot, shaba, vt
Version: unstable   
Hardware: all   
OS: Linux   

Description Alexey Shabalin 2016-04-01 15:02:20 MSK
к серверу подключена корзина с 12 дисками, на raid-контролёре созданы 2 логических диска.
на 4.2.6-un-def-alt1 проблем нет.
На kernel-image-un-def-4.5.0-alt1 один диск монтируется, а на втором падает модуль:

------------[ cut here ]------------
kernel BUG at drivers/scsi/scsi_transport_sas.c:164!
invalid opcode: 0000 [#1] PREEMPT SMP.
Modules linked in: sr_mod cdrom ata_generic pata_acpi ibmpex ipmi_ssif iTCO_wdt ipmi_devintf gpio_ich ibmaem iTCO_vendor_suppo
CPU: 0 PID: 1350 Comm: systemd-udevd Tainted: G           O    4.5.0-un-def-alt1 #1
Hardware name: IBM IBM System x3550 -[797871Y]-/System Planar, BIOS -[GFE149BUS-1.17]- 02/14/2011
task: ffff88042bc30340 ti: ffff8800374e0000 task.ti: ffff8800374e0000
RIP: 0010:[<ffffffffa0264f23>]  [<ffffffffa0264f23>] sas_sdev_to_rdev.isra.11+0x13/0x20 [scsi_transport_sas]
RSP: 0018:ffff8800374e36f8  EFLAGS: 00010202
RAX: ffff88042cb42208 RBX: ffff880037484800 RCX: ffffea0002eed460
RDX: 0000000000000005 RSI: ffff88042be05798 RDI: ffff880037478800
RBP: ffff8800374e36f8 R08: ffff88042be05810 R09: 0000000000000002
R10: 000000000000001b R11: 0000000000260000 R12: ffff880037484800
R13: ffff8800bbae0000 R14: ffff880037484c70 R15: ffff880037484c70
FS:  00007f7f7813e8c0(0000) GS:ffff88043fc00000(0000) knlGS:0000000000000000
CS:  0010 DS: 0000 ES: 0000 CR0: 000000008005003b
CR2: 0000560e8f56d7f8 CR3: 0000000037487000 CR4: 00000000000006f0
Stack:
 ffff8800374e3708 ffffffffa0264f80 ffff8800374e3738 ffffffffa02d4d0d
 0000000000000000 0000000000000000 ffff880037484998 ffff880037484998
 ffff8800374e3798 ffffffffa02d4d5f ffff8800374e3758 ffffffff81463250
Call Trace:
 [<ffffffffa0264f80>] sas_get_address+0x10/0x20 [scsi_transport_sas]
 [<ffffffffa02d4d0d>] ses_match_to_enclosure+0x6d/0x80 [ses]
 [<ffffffffa02d4d5f>] ses_intf_add+0x3f/0x4af [ses]
 [<ffffffff81463250>] ? klist_class_dev_get+0x10/0x20
 [<ffffffff815e6231>] ? klist_node_init+0x41/0x60
 [<ffffffff8145f701>] device_add+0x3f1/0x580
 [<ffffffff8146dd55>] ? __pm_runtime_resume+0x55/0x70
 [<ffffffffa001d23e>] scsi_sysfs_add_sdev+0xee/0x270 [scsi_mod]
 [<ffffffffa001a45f>] scsi_probe_and_add_lun+0xbef/0xe10 [scsi_mod]
 [<ffffffff8146d14e>] ? rpm_idle+0x1e/0x2b0
 [<ffffffff8146c5b0>] ? rpm_resume+0xa0/0x5e0
 [<ffffffffa001b46b>] __scsi_add_device+0x10b/0x130 [scsi_mod]
 [<ffffffffa001b49c>] scsi_add_device+0xc/0x20 [scsi_mod]
 [<ffffffffa02aaf35>] mptsas_scan_sas_topology+0x265/0x2e0 [mptsas]
 [<ffffffffa02ab35a>] mptsas_probe+0x3aa/0x560 [mptsas]
 [<ffffffff8136e209>] local_pci_probe+0x49/0xa0
 [<ffffffff8145d882>] ? get_device+0x12/0x20
 [<ffffffff8136ed60>] pci_device_probe+0x100/0x120
 [<ffffffff814622bd>] driver_probe_device+0x1dd/0x2c0
 [<ffffffff81462438>] __driver_attach+0x98/0xa0
 [<ffffffff814623a0>] ? driver_probe_device+0x2c0/0x2c0
 [<ffffffff814604b3>] bus_for_each_dev+0x53/0x90
 [<ffffffff81461a89>] driver_attach+0x19/0x20
 [<ffffffff814617e8>] bus_add_driver+0x118/0x220
 [<ffffffffa02b6000>] ? 0xffffffffa02b6000
 [<ffffffff81462eeb>] driver_register+0x5b/0xe0
 [<ffffffff8136da27>] __pci_register_driver+0x47/0x50
 [<ffffffffa02b6121>] mptsas_init+0x121/0x1000 [mptsas]
 [<ffffffffa02b6000>] ? 0xffffffffa02b6000
 [<ffffffff81002154>] do_one_initcall+0x94/0x200
 [<ffffffff8116983d>] do_init_module+0x5d/0x1d2
 [<ffffffff810ffe1d>] load_module+0x204d/0x2570
 [<ffffffff810fc130>] ? show_initstate+0x50/0x50
 [<ffffffff811003c6>] SYSC_finit_module+0x86/0x90
 [<ffffffff81100509>] SyS_finit_module+0x9/0x10
 [<ffffffff815f3736>] entry_SYSCALL_64_fastpath+0x16/0x75
Code: b0 48 8b 04 25 c8 07 00 00 48 8b 78 38 eb bc 66 0f 1f 84 00 00 00 00 00 48 8b 47 28 55 48 89 e5 83 b8 d8 02 00 00 01 75.
RIP  [<ffffffffa0264f23>] sas_sdev_to_rdev.isra.11+0x13/0x20 [scsi_transport_sas]
 RSP <ffff8800374e36f8>
---[ end trace a6328f62c1eec550 ]---
Comment 1 Alexey Shabalin 2016-04-05 13:33:42 MSK
qla2xxx
Comment 2 Alexey Shabalin 2016-04-05 13:37:02 MSK
отдельную ли багу заводить или нет? пока сюда добавлю. Модуль qla2xxx тоже падает, так что блокирует дальнейшую загрузку. Даже скопировать сообщение ядра не чем. Никаких дисков на него не подаётся, просто он присутствует в сервере. Есть возможность отключить pci-слот в биосе, после чего смог загрузится.
Comment 3 Michael Shigorin 2016-04-05 13:49:10 MSK
Эт хорошо бы сразу в b.k.o с дублирующим письмом в LKML, см. тж.
https://www.kernel.org/doc/linux/REPORTING-BUGS