Bug 21258 - instant reboot on Compaq Proliant 6400R
Summary: instant reboot on Compaq Proliant 6400R
Status: CLOSED WORKSFORME
Alias: None
Product: Sisyphus
Classification: Development
Component: kernel-image-ovz-rhel (show other bugs)
Version: unstable
Hardware: x86 Linux
: P3 normal
Assignee: aspsk
QA Contact: qa-sisyphus
URL:
Keywords:
Depends on:
Blocks:
 
Reported: 2009-08-27 16:31 MSD by Michael Shigorin
Modified: 2011-06-23 13:48 MSK (History)
12 users (show)

See Also:


Attachments
Proliant 6400R dmesg with 2.6.18-ovz-smp-alt26.M40.2 (13.34 KB, text/plain)
2009-08-27 20:24 MSD, Michael Shigorin
no flags Details

Note You need to log in before you can comment on or make changes to this bug.
Description Michael Shigorin 2009-08-27 16:31:59 MSD
kernel-image-ovz-rhel-2.6.18-alt7, alt9, alt10 уходят в перезагрузку практически сразу после распаковки образа -- за несколько циклов не успел заметить и одной строчки вывода собственно ядра.

2.6.18-ovz-smp-alt26.M40.2 работает нормально.

Машинка стоит на площадке в работе (хотя ненадолго выдёргиваема) и туда приходится появляться локально; у меня нет возможности проверить на стенде, на остальных системах alt7/alt9 работают нормально.

Понимаю, что бага крайне неудобная по части диагностики и воспроизведения :(
Comment 1 Sergey Vlasov 2009-08-27 19:43:02 MSD
Если сразу перезагружается - остаётся только пробовать serial console в варианте:

  debug earlyprintk=serial,ttyS0,115200

Ну и dmesg от работающего ядра может пригодиться.
Comment 2 Michael Shigorin 2009-08-27 20:24:44 MSD
Created attachment 3792 [details]
Proliant 6400R dmesg with 2.6.18-ovz-smp-alt26.M40.2

Сериалку подцеплять не очень удобно (второй хост через несколько стоек), хотя можно попробовать.
Comment 3 Sergey Vlasov 2009-08-27 21:26:12 MSD
(В ответ на комментарий №2)
> Created an attachment (id=3792) [details]
> Proliant 6400R dmesg with 2.6.18-ovz-smp-alt26.M40.2

Using x86 segment limits to approximate NX protection

ACPI: RSDP (v000 COMPAQ                                ) @ 0x000f4f70
  >>> ERROR: Invalid checksum
Intel MultiProcessor Specification v1.4
    Virtual Wire compatibility mode.

Можно попробовать поискать для стенда что-нибудь достаточно древнее (процессор без NX), и проверить с acpi=off (или отключить ACPI в BIOS).

Ну и там vesafb - отсутствие сообщений ядра проверяли с vga=normal?  Можно ещё earlyprintk=vga (хотя в случае перезагрузки при ошибке всё равно придётся возиться с serial, чтобы сохранить вывод).
Comment 4 Michael Shigorin 2009-08-27 23:03:14 MSD
(In reply to comment #3)
> Using x86 segment limits to approximate NX protection
Да, тоже заметил.

> ACPI: RSDP (v000 COMPAQ                                ) @ 0x000f4f70
>   >>> ERROR: Invalid checksum
И это вряд ли получится потрогать -- вот только не помню, всегда ли так было.

> Можно попробовать поискать для стенда что-нибудь достаточно древнее
> (процессор без NX)
Там PIII Xeon -- обычный PIII подойдёт?  У меня дома на терминале есть :)

> Ну и там vesafb - отсутствие сообщений ядра проверяли с vga=normal?
Надо же, забыл.

> Можно ещё earlyprintk=vga (хотя в случае перезагрузки при ошибке всё 
> равно придётся возиться с serial, чтобы сохранить вывод).
Постараюсь подготовиться и зайти.  Правда, пока не знаю, когда.
Comment 5 Andrey Rahmatullin 2009-08-27 23:06:04 MSD
(В ответ на комментарий №4)
> Там PIII Xeon 
(ой, такие были? я уж забыл)

> > Можно попробовать поискать для стенда что-нибудь достаточно древнее
> > (процессор без NX)
-- обычный PIII подойдёт?  У меня дома на терминале есть :)
В PIII точно нет NX.
Comment 6 Sergey Vlasov 2009-08-28 10:21:29 MSD
(В ответ на комментарий №4)
> Там PIII Xeon -- обычный PIII подойдёт?
Можно попробовать. Дело может быть даже не в самом NX, а, например, в отсутствии в старом процессоре каких-то MSR (например, на похожем железе там, откуда пришла базовая версия этого ядра, было http://bugs.centos.org/view.php?id=3230 - там, правда, вроде бы это проявлялось только в сборке для xen; в любом случае тот патч старый и у нас уже есть).
Comment 7 Michael Shigorin 2011-06-22 01:05:16 MSK
Возможно, на днях получится проверить там пару-тройку более современных 2.6.18/2.6.32/$current.
Comment 8 Michael Shigorin 2011-06-23 13:48:34 MSK
Немного прощёлкал: до отключения не забросил/поставил нужные пакеты, а для флэшки там инженер не смог обнаружить USB-портов.  Так что закапываем as is, вряд ли кому ещё будет актуальна такая археология при нынешних ценах на электричество.