Bug 40718

Summary: Проблема с доступом к NVMe при загрузке на плате TF307-MB-S-D с прошивкой SDK5.2 и 5.3
Product: Sisyphus Reporter: jqt4
Component: kernel-image-std-defAssignee: Vitaly Chikunov <vt>
Status: CLOSED FIXED QA Contact: qa-sisyphus
Severity: normal    
Priority: P5 CC: asheplyakov, jqt4, kernelbot, placeholder, sem, vt
Version: unstable   
Hardware: aarch64   
OS: Linux   

Description jqt4 2021-08-12 12:54:58 MSK
Система установлена на NVMe.
Довольно часто (примерно 1 раз из 5) загрузка системы встаёт на этапе initrd.
Выдаются сообщения:

 (initramfs)$ dmesg | grep nvme
 [    4.163222] nvme nvme0: pci function 0000:01:00.0
 [    4.167332] nvme 0000:01:00.0: device link capability is Gen3, x4
 [    4.216805] nvme nvme0: Removing after probe failure status: -19

Видимо, проблема в том, что NVMe по какой-то причине не работает и rootfs не доступна.

Используется ядро:
uname -a
Linux comp-42939f 5.10.57-std-def-alt2 #1 SMP Wed Aug 11 11:43:00 UTC 2021 aarch64 GNU/Linux
Comment 1 Evgeny Sinelnikov 2021-08-12 15:36:39 MSK
Судя по названию ядра машина обновлена до p10 или до сизифа. Нужно уточнить этот момент.
Comment 2 jqt4 2021-08-12 15:47:27 MSK
Система обновлена до Сизифа на 11.08.2021

С ядром 5.10.57-std-def-alt1 из задачи 282396 для p10 проблема воспроизводиться.

С ядрами kernel-image-un-def: 5.12.19 из задачи 282003 и 5.13.9 из 282297 проблему воспроизвести не удалось.
Comment 3 jqt4 2021-08-13 11:38:22 MSK
С целью локализации проблемы собрал в задаче 282502 ядро 5.10.57-std-def,
в config которого внесены исправления:
CONFIG_BLK_DEV_INTEGRITY_T10=m
CONFIG_NVME_CORE=m
CONFIG_BLK_DEV_NVME=m

Соответственно, собраны модули t10_pi nvme_core nvme.

С этим ядром воспроизвести проблему не удалось.

На основании этого можно предположить, что проблема может быть связана c состоянием гонки между инициализацией вкомпилированных драйверов nvme и загрузкой неких модулей в initrd.
Comment 4 jqt4 2021-08-26 18:49:01 MSK
Воспроизвёл проблему с ядром из p10
uname -a
Linux host-140 5.10.59-std-def-alt1 #1 SMP Mon Aug 23 08:41:26 UTC 2021 aarch64 GNU/Linux
Comment 5 jqt4 2021-09-01 13:02:52 MSK
Воспроизвёл проблему с ядром из p10
uname -a
Linux comp-42939f 5.10.61-std-def-alt1 #1 SMP Mon Aug 30 23:20:10 UTC 2021 aarch64 GNU/Linux
Comment 6 jqt4 2021-10-22 09:48:15 MSK
Проблема воспроизедена на той же плате с прошивкий SDK5.3 и ядром
uname -a
Linux host-107 5.10.72-std-def-alt1 #1 SMP Sun Oct 10 22:13:26 UTC 2021 aarch64 GNU/Linux
Comment 7 Repository Robot 2021-11-09 19:02:41 MSK
kernel-image-std-def-2:5.10.78-alt2 -> sisyphus:

 Tue Nov 09 2021 Kernel Bot <kernelbot@altlinux> 2:5.10.78-alt2
 - CLONE_USERNS default restriction restored (Closes: 41283)
 - NVME fix for TF307-MB-S-D (Closes: 40718)
 - use VIRT_CPU_ACCOUNTING_NATIVE instead of TICK_CPU_ACCOUNTING
Comment 8 jqt4 2021-11-09 19:59:23 MSK
Выполнено тестирование на той же плате с прошивкой SDK5.3 и ядром из Сизифа
uname -a
Linux comp-42939f 5.10.78-std-def-alt2 #1 SMP Tue Nov 9 08:07:44 UTC 2021 aarch64 GNU/Linux

Проблему воспроизвести не удалось.