Bug 48171 - Ноутбук HP 250 G9 зависает при перезагрузке (warm reboot)
Summary: Ноутбук HP 250 G9 зависает при перезагрузке (warm reboot)
Status: NEW
Alias: None
Product: Sisyphus
Classification: Development
Component: kernel-image-un-def (show other bugs)
Version: unstable
Hardware: x86_64 Linux
: P5 normal
Assignee: Vitaly Chikunov
QA Contact: qa-sisyphus
URL:
Keywords:
Depends on:
Blocks:
 
Reported: 2023-10-25 12:03 MSK by Белая Алёна
Modified: 2023-11-22 18:33 MSK (History)
5 users (show)

See Also:


Attachments
inxi -F (2.18 KB, text/x-log)
2023-10-25 12:03 MSK, Белая Алёна
no flags Details
логи загрузки (263.51 KB, text/x-log)
2023-10-25 12:04 MSK, Белая Алёна
no flags Details
journalctl -b -1 -p err (6.72 KB, text/x-log)
2023-10-25 12:04 MSK, Белая Алёна
no flags Details

Note You need to log in before you can comment on or make changes to this bug.
Description Белая Алёна 2023-10-25 12:03:17 MSK
Created attachment 14875 [details]
inxi -F

firmware-alsa-sof-2.2.6-alt1

Стенд: ноутбук HP 250 G9 (6S774EA)

ОС: 
Alt Worksation 10.1 
Alt Workstation K 10.1 
Alt Server 10.1

Ядро: kernel-image-un-def-6.5.8-alt1

Ноутбук зависает во время перезагрузки (warm reboot). 
В логах отображаются следующие ошибки:
окт 24 10:13:50 tatve kernel: watchdog: BUG: soft lockup - CPU#5 stuck for 183s! [kworker/5:1:109]
окт 24 10:13:50 tatve kernel: rcu: INFO: rcu_preempt self-detected stall on CPU
окт 24 10:13:50 tatve kernel: rcu:         5-....: (59918 ticks this GP) idle=1f74/1/0x4000000000000000 softirq=1399/1399 fqs=14987
окт 24 10:14:09 tatve kernel: watchdog: BUG: soft lockup - CPU#5 stuck for 213s! [kworker/5:1:109]
окт 24 10:14:24 tatve kernel: INFO: task khugepaged:84 blocked for more than 122 seconds.
окт 24 10:14:24 tatve kernel:       Tainted: G           OEL     6.1.54-un-def-alt1 #1
окт 24 10:14:24 tatve kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.

Шаги воспроизведения:
1. Установить систему
2. Обновиться до актуального состояния:
# apt-get update && apt-get dist-updrage 
# update-kernel
3. Перезагрузиться:
# reboot
или 
Меню приложений -> Завершение работы -> Перезагрузить 

Ожидаемый результат: успешная перезагрузка системы

Реальный результат: система зависает и ни на что не реагирует


Дополнительная информация: 
1. Вероятно проблема связана с модулем аудио. 

Есть аналогичные баги в апстриме:
https://bugzilla.kernel.org/show_bug.cgi?id=217867
https://bugs.launchpad.net/ubuntu/+source/linux/+bug/2027848

На ядре un-def-6.5.8-alt1 было проведено дополнительное исследование, драйвер sof-audio-pci-intel-tgl был добавлен в блэклист. Это исправило проблему зависаний, ноутбук стал перезагружаться корректно. Но в таком случае не работает звук.

2. Проблема также воспроизведена в р10 с ядрами: 
kernel-image-un-def-6.1.57-alt1
kernel-image-std-def-5.10.198-alt1 

3. Компнонент указан предположительно, исходя из результатов исследования. Если компонент определен неверно, прошу изменить на правильный.
Comment 1 Белая Алёна 2023-10-25 12:04:04 MSK
Created attachment 14876 [details]
логи загрузки
Comment 2 Белая Алёна 2023-10-25 12:04:32 MSK
Created attachment 14877 [details]
journalctl -b -1 -p err
Comment 3 Anton Farygin 2023-10-25 13:49:59 MSK
firmware врятли, скорее всего виновато ядро.
Comment 4 Vitaly Chikunov 2023-10-25 21:54:56 MSK
2. Было бы неплохо в таких багрепортах сравнивать поведение с предыдущими версиями ядер.

> https://bugs.launchpad.net/ubuntu/+source/linux/+bug/2027848

2. Например они пишут что предыдущие ядра просто зависают не доходя до логов.

3. Также он пишут что проблема возникает только при warn reboot, а при cold reboot её нет. Вы пишете "warm reboot" как синоним "перезагрузки" и всё. -- У нас при cold reboot проблема не воспроизводится?

4. И вообще по описанию Ubuntu это проблема может быть ошибкой оборудования - оно не инициализировалась при warm reboot. Не всегда апстрим ядра будет с энтузиазмом фиксить подобные ошибки железа. -- Так что одно из направлений багрепортов (и с учетом что у нас апстримные ядра) -- это багрепорт производителю ноутбука (HP) и звуковой карты (Intel).

5. "Another interesting fact is that the system works fine if i use the liquorix 6.4 kernel and switch the audio driver to legacy mode with dsp_driver=1 together with setting the model to dell-headset-multi."

Там же пишут что есть объезд через "legacy mode".
Comment 5 Anton Farygin 2023-10-26 10:34:08 MSK
Да, но там же пишут дальше что этот объёзд не всегда помогает и звук с ним не всегда работает.
Но вообще понятно что без железа у разработчика что-то с этим сделать невозможно. Поэтому ищем железо, на котором воспроизводится.
Comment 6 Vasiliy Kovalev 2023-10-26 13:04:28 MSK
> 5. "Another interesting fact is that the system works fine if i use the
> liquorix 6.4 kernel and switch the audio driver to legacy mode with
> dsp_driver=1 together with setting the model to dell-headset-multi."
> 
> Там же пишут что есть объезд через "legacy mode".

Если перевести в команды, такое временное решение работает:

# cat > /etc/modprobe.d/dell-headset-multi.conf <<EOF
blacklist snd_sof_pci_intel_tgl
options snd-hda-intel model=dell-headset-multi
options snd-intel-dspcfg dsp_driver=1
EOF

Отличия от иcпользования sof-драйвера:
- нет поддержки встроенного цифрового микрофона (DMic);
+ правильное обнаружение гарнитуры, не нужно вручную выбирать профиль.

Проверял на ядрах 6.1.57 и 6.5.8

Касательно самой проблемы, если перед перезагрузкой вручную выгружать модуль
# modprobe -r snd_sof_pci_intel_tgl
то зависания во время следующей загрузки системы исчезают.
Comment 7 Anton Farygin 2023-10-26 14:28:13 MSK
Надо срепортить проблему парням в проект sof на github
Comment 8 Anton Farygin 2023-10-26 14:38:13 MSK
и ещё - новая firmware-alsa-sof  не помогает ? пока не упаковано, но можно поставить ручками
Comment 9 Vasiliy Kovalev 2023-10-26 15:19:38 MSK
(Ответ для Anton Farygin на комментарий #8)
> и ещё - новая firmware-alsa-sof  не помогает ? пока не упаковано, но можно
> поставить ручками

не помогает, в новой версии "Add sof-v2.7 for Intel Meteor Lake hardware" добавлены прошивки для семейства MTL (sof-mtl.ri), а здесь используется sof-adl.ri
Comment 10 Vasiliy Kovalev 2023-10-26 18:40:46 MSK
(Ответ для Anton Farygin на комментарий #7)
> Надо срепортить проблему парням в проект sof на github

https://github.com/thesofproject/sof/issues/8400