Bug 47205 - Система не загружается после обновления пакетов
Summary: Система не загружается после обновления пакетов
Status: CLOSED FIXED
Alias: None
Product: Sisyphus
Classification: Development
Component: firmware-linux (show other bugs)
Version: unstable
Hardware: x86_64 Linux
: P5 critical
Assignee: Антон Мидюков
QA Contact: qa-sisyphus
URL:
Keywords:
Depends on:
Blocks:
 
Reported: 2023-08-11 16:20 MSK by Yury Sukhovey
Modified: 2023-08-17 20:10 MSK (History)
5 users (show)

See Also:


Attachments
Скриншот первой загрузки (289.15 KB, image/jpeg)
2023-08-11 16:20 MSK, Yury Sukhovey
no flags Details
Список обновленных пакетов (1.49 KB, text/plain)
2023-08-11 16:21 MSK, Yury Sukhovey
no flags Details
Загрузка с ядром 6.1.40 (265.20 KB, image/jpeg)
2023-08-12 01:06 MSK, Yury Sukhovey
no flags Details
Загрузка с ядром 6.4.9 (276.30 KB, image/jpeg)
2023-08-12 01:06 MSK, Yury Sukhovey
no flags Details
Полный лог загрузки ядра 6.4.10 (137.21 KB, text/plain)
2023-08-15 11:35 MSK, Yury Sukhovey
no flags Details
Полный лог загрузки ядра 6.4.10 (nomodeset) (207.90 KB, text/plain)
2023-08-15 11:54 MSK, Yury Sukhovey
no flags Details

Note You need to log in before you can comment on or make changes to this bug.
Description Yury Sukhovey 2023-08-11 16:20:22 MSK
Created attachment 14072 [details]
Скриншот первой загрузки

Установил 2023-08-10 начисто Regular KDE, накатил обновления, ядро штатное - 6.1.40 std-def. Все равботало.
Накатил ядро 6.4.9 un-def - все продолжило работать.

Сегодня прилетели обновления (список ниже) и система замерла на загрузке (скриншот).

------
man-pages-6.05.01-alt1.noarch
lightdm-kde-greeter-0.4.14-alt1.x86_64
libsecret-0.21.0-alt1.x86_64
i586-libsystemd-253.8-alt1.i586
firmware-intel-ucode-22-alt1.20230808.noarch
openssh-askpass-common-9.4p1-alt1.noarch
firmware-linux-20230809-alt1.noarch
NetworkManager-1.44.0-alt1.x86_64
libkf5akonadiwidgets-23.04.3-alt3.x86_64
i586-libnss-myhostname-253.8-alt1.i586
i586-libnm-1.44.0-alt1.i586
systemd-sysvinit-253.8-alt1.noarch
systemd-analyze-253.8-alt1.x86_64
systemd-253.8-alt1.x86_64
openssh-server-9.4p1-alt1.x86_64
openssh-9.4p1-alt1.x86_64
i586-libnss-systemd-253.8-alt1.i586
systemd-utils-filetriggers-253.8-alt1.noarch
systemd-tmpfiles-common-253.8-alt1.noarch
systemd-sysctl-common-253.8-alt1.x86_64
systemd-modules-common-253.8-alt1.noarch
systemd-boot-efi-253.8-alt1.x86_64
pam_systemd-253.8-alt1.x86_64
openssh-server-control-9.4p1-alt1.noarch
libnss-systemd-253.8-alt1.x86_64
libkf5akonadiprivate-23.04.3-alt3.x86_64
libkf5akonadicore-23.04.3-alt3.x86_64
kde5-akonadi-common-23.04.3-alt3.x86_64
i586-libudev1-253.8-alt1.i586
openssh-clients-9.4p1-alt1.x86_64
NetworkManager-wwan-1.44.0-alt1.x86_64
NetworkManager-wifi-1.44.0-alt1.x86_64
NetworkManager-team-1.44.0-alt1.x86_64
NetworkManager-ppp-1.44.0-alt1.x86_64
NetworkManager-bluetooth-1.44.0-alt1.x86_64
NetworkManager-adsl-1.44.0-alt1.x86_64
libnss-myhostname-253.8-alt1.x86_64
NetworkManager-daemon-1.44.0-alt1.x86_64
libnm-1.44.0-alt1.x86_64
udev-253.8-alt1.x86_64
openssh-common-9.4p1-alt1.x86_64
libudev1-253.8-alt1.x86_64
libsystemd-253.8-alt1.x86_64
------

В процессе экспериментов выяснилось, что если явно выбрать на загрузке ядро 6.1.40, тосистема грузится. При выборе 6.4.9 и установленного в альтераторе 6.1.44 - черный экран и монитор в спящем режиме.
Интересно, что если установить 6.1.40 ядром по-умолчанию и загрузке без явного выбора, тоже черный экран, 

В логах ничего подозрительного. Сравнил загрузки разных ядер - плюс-минус всё одинаково.

Конфигурация системы:
```
OS: ALT Regular Sisyphus x86_64 
Kernel: 6.1.40-std-def-alt1 
CPU: AMD Ryzen 9 3950X (32) @ 3.500GHz 
GPU: AMD ATI Radeon RX 7900 XT/7900 XTX 
SSD: Samsung SSD 980 PRO 2TB (NVMe)
Comment 1 Yury Sukhovey 2023-08-11 16:21:03 MSK
Created attachment 14073 [details]
Список обновленных пакетов
Comment 2 Антон Мидюков 2023-08-11 19:43:19 MSK
Больше похоже на проблему в firmware-linux.
Установите из таска:
apt-repo 326950 firmware-linux

Затем
make-initrd
make-initrd -k <проблемное ядро>

И перезагрузиться по очереди с текущим и проблемным.
Comment 3 Yury Sukhovey 2023-08-12 01:06:17 MSK
Created attachment 14077 [details]
Загрузка с ядром 6.1.40
Comment 4 Yury Sukhovey 2023-08-12 01:06:41 MSK
Created attachment 14078 [details]
Загрузка с ядром 6.4.9
Comment 5 Yury Sukhovey 2023-08-12 01:08:08 MSK
Не помогло.

Поломалось и рабочее ядро. 

6.1.40 (работало) - скриншот 6_1_40.jpg
6.1.44 - черный экран
6.4.9 - скриншот 6_4_9.jpg
Comment 6 Yury Sukhovey 2023-08-12 01:57:10 MSK
Провел еще один эксперимент.
Снова откатился на июльский firmware-linux:
  rpm -Uhv --force ./firmware-linux-20230714-alt1.noarch.rpm

Затем пересобрал initrd для ядер 6.1.44 и 6.4.9:
  make-initrd -k 6.1.44-std-def-alt1
  make-initrd -k 6.1.44-std-def-alt1

С ядром 6.4.9 система стартует и работает.
При выборе 6.1.44 0 черный экран.
Comment 7 Yury Sukhovey 2023-08-12 01:58:18 MSK
Провел еще один эксперимент.
Снова откатился на июльский firmware-linux:
  rpm -Uhv --force ./firmware-linux-20230714-alt1.noarch.rpm

Затем пересобрал initrd для ядер 6.1.44 и 6.4.9:
  make-initrd -k 6.1.44-std-def-alt1
  make-initrd -k 6.4.9-std-def-alt1

С ядром 6.4.9 система стартует и работает.
При выборе 6.1.44 0 черный экран.
Comment 8 Alexei Takaseev 2023-08-13 06:29:19 MSK
Подтверждаю проблему.

kernel-image-std-def-6.1.42-alt1, firmware-linux-20230809-alt1
Система:

AMD Ryzen 7 5700X 8-Core Processor
Sapphire Technology Limited PULSE RX 7900 XTX

При старте черный экран, в логах оседает такое:
===================================
Aug 13 10:53:14 metamorph kernel: [    0.647501] ----------------
Aug 13 10:53:14 metamorph kernel: [    0.647566] | NMI testsuite:
Aug 13 10:53:14 metamorph kernel: [    0.647632] --------------------
Aug 13 10:53:14 metamorph kernel: [    0.647699]   remote IPI:  ok  |
Aug 13 10:53:14 metamorph kernel: [    0.647774]    local IPI:  ok  |
Aug 13 10:53:14 metamorph kernel: [    0.648267] --------------------
Aug 13 10:53:14 metamorph kernel: [    0.648333] Good, all   2 testcases passed! |
Aug 13 10:53:14 metamorph kernel: [    0.648403] ---------------------------------
Aug 13 10:53:14 metamorph kernel: [    0.654383] mtrr: your CPUs had inconsistent variable MTRR settings
Aug 13 10:53:14 metamorph kernel: [    1.292454] scsi_mod: unknown parameter 'use_blk_mq' ignored
Aug 13 10:53:14 metamorph kernel: [    2.146975] amdgpu 0000:07:00.0: amdgpu: SMU driver if version not matched
Aug 13 10:53:14 metamorph kernel: [    2.417251] amdgpu: SRAT table not found
Aug 13 10:53:14 metamorph kernel: [    4.193150] XFS (sdf1): Deprecated V4 format (crc=0) will not be supported after September 2030.
Aug 13 10:53:14 metamorph kernel: [    4.662014] device-mapper: core: CONFIG_IMA_DISABLE_HTABLE is disabled. Duplicate IMA measurements will not be recorded in the IMA log.
Aug 13 10:53:14 metamorph kernel: [    4.837505] ACPI Warning: SystemIO range 0x0000000000000B00-0x0000000000000B08 conflicts with OpRegion 0x0000000000000B00-0x0000000000000B0F (\GSA1.SMBI) (20220331/utaddress-204)
Aug 13 10:53:14 metamorph kernel: [    4.858699] platform regulatory.0: Direct firmware load for regulatory.db failed with error -2
Aug 13 10:53:14 metamorph kernel: [    4.870927] snd_hda_codec_hdmi: unknown parameter 'index' ignored
Aug 13 10:56:39 metamorph kernel: [    0.648861] ----------------
Aug 13 10:56:39 metamorph kernel: [    0.648927] | NMI testsuite:
Aug 13 10:56:39 metamorph kernel: [    0.648992] --------------------
Aug 13 10:56:39 metamorph kernel: [    0.649058]   remote IPI:  ok  |
Aug 13 10:56:39 metamorph kernel: [    0.649134]    local IPI:  ok  |
Aug 13 10:56:39 metamorph kernel: [    0.649629] --------------------
Aug 13 10:56:39 metamorph kernel: [    0.649695] Good, all   2 testcases passed! |
Aug 13 10:56:39 metamorph kernel: [    0.649765] ---------------------------------
Aug 13 10:56:39 metamorph kernel: [    0.655824] mtrr: your CPUs had inconsistent variable MTRR settings
Aug 13 10:56:39 metamorph kernel: [    1.299930] scsi_mod: unknown parameter 'use_blk_mq' ignored
Aug 13 10:56:39 metamorph kernel: [    2.157082] amdgpu 0000:07:00.0: amdgpu: SMU driver if version not matched
Aug 13 10:56:39 metamorph kernel: [    2.434593] amdgpu: SRAT table not found
Aug 13 10:56:39 metamorph kernel: [    4.233312] XFS (sdf1): Deprecated V4 format (crc=0) will not be supported after September 2030.
Aug 13 10:56:39 metamorph kernel: [    4.752298] device-mapper: core: CONFIG_IMA_DISABLE_HTABLE is disabled. Duplicate IMA measurements will not be recorded in the IMA log.
Aug 13 10:56:39 metamorph kernel: [    4.924378] ACPI Warning: SystemIO range 0x0000000000000B00-0x0000000000000B08 conflicts with OpRegion 0x0000000000000B00-0x0000000000000B0F (\GSA1.SMBI) (20220331/utaddress-204)
Aug 13 10:56:39 metamorph kernel: [    4.965050] platform regulatory.0: Direct firmware load for regulatory.db failed with error -2
Aug 13 10:56:39 metamorph kernel: [    4.983505] snd_hda_codec_hdmi: unknown parameter 'index' ignored
=============================================
И такое:
=============================================
Aug 13 10:56:39 metamorph kernel: [    0.754609] amd_gpio AMDI0030:00: Invalid config param 0014
Aug 13 10:56:39 metamorph kernel: [    7.604408] [drm:mes_v11_0_submit_pkt_and_poll_completion.constprop.0 [amdgpu]] *ERROR* MES failed to response msg=14
Aug 13 10:56:39 metamorph kernel: [    7.604521] [drm:amdgpu_mes_reg_write_reg_wait [amdgpu]] *ERROR* failed to reg_write_reg_wait
Aug 13 10:56:39 metamorph kernel: [    7.717433] [drm:mes_v11_0_submit_pkt_and_poll_completion.constprop.0 [amdgpu]] *ERROR* MES failed to response msg=14
Aug 13 10:56:39 metamorph kernel: [    7.717519] [drm:amdgpu_mes_reg_write_reg_wait [amdgpu]] *ERROR* failed to reg_write_reg_wait
Aug 13 10:56:39 metamorph kernel: [    8.900695] [drm:mes_v11_0_submit_pkt_and_poll_completion.constprop.0 [amdgpu]] *ERROR* MES failed to response msg=14
Aug 13 10:56:39 metamorph kernel: [    8.900806] [drm:amdgpu_mes_reg_write_reg_wait [amdgpu]] *ERROR* failed to reg_write_reg_wait
Aug 13 10:56:39 metamorph kernel: [    9.013548] [drm:mes_v11_0_submit_pkt_and_poll_completion.constprop.0 [amdgpu]] *ERROR* MES failed to response msg=14
Aug 13 10:56:39 metamorph kernel: [    9.013634] [drm:amdgpu_mes_reg_write_reg_wait [amdgpu]] *ERROR* failed to reg_write_reg_wait
Aug 13 10:56:42 metamorph kernel: [   14.095886] amdgpu 0000:07:00.0: amdgpu: SMU: I'm not done with your previous command: SMN_C2PMSG_66:0x00000029 SMN_C2PMSG_82:0x00000000
Aug 13 10:56:42 metamorph kernel: [   14.095890] amdgpu 0000:07:00.0: amdgpu: Failed to disable gfxoff!
Aug 13 10:56:42 metamorph kernel: [   14.209143] [drm:mes_v11_0_submit_pkt_and_poll_completion.constprop.0 [amdgpu]] *ERROR* MES failed to response msg=14
===================================================

Мне помог откат до firmware-linux-20230705-alt1 и пересоздание initrd
на ядрах новее kernel-image-std-def-6.1.42-alt1 загрузиться вообще не
получается - черный экран сразу же после нажатия ENTER в GRUB'е
Comment 9 Yury Sukhovey 2023-08-15 11:35:09 MSK
Created attachment 14115 [details]
Полный лог загрузки ядра 6.4.10
Comment 10 Yury Sukhovey 2023-08-15 11:36:16 MSK
Попробовал обновить сегодня до свежего ядра 6.4.10-un-def.
Все так же черный экран. Полный лог загрузки прилагаю.
Comment 11 Yury Sukhovey 2023-08-15 11:54:45 MSK
Created attachment 14118 [details]
Полный лог загрузки ядра 6.4.10 (nomodeset)

Если добавить в параметры загрузки ядра noomodeset, то система грузится.

--------------
➜  ~ uname -a
Linux alt 6.4.10-un-def-alt1 #1 SMP PREEMPT_DYNAMIC Mon Aug 14 11:19:54 UTC 2023 x86_64 GNU/Linux
--------------
➜  ~ glxinfo -B
name of display: :0
display: :0  screen: 0
direct rendering: Yes
Extended renderer info (GLX_MESA_query_renderer):
    Vendor: Mesa (0xffffffff)
    Device: llvmpipe (LLVM 15.0.7, 256 bits) (0xffffffff)
    Version: 23.1.5
    Accelerated: no
    Video memory: 128717MB
    Unified memory: yes
    Preferred profile: core (0x1)
    Max core profile version: 4.5
    Max compat profile version: 4.5
    Max GLES1 profile version: 1.1
    Max GLES[23] profile version: 3.2
Memory info (GL_ATI_meminfo):
    VBO free memory - total: 31 MB, largest block: 31 MB
    VBO free aux. memory - total: 125287 MB, largest block: 125287 MB
    Texture free memory - total: 31 MB, largest block: 31 MB
    Texture free aux. memory - total: 125287 MB, largest block: 125287 MB
    Renderbuffer free memory - total: 31 MB, largest block: 31 MB
    Renderbuffer free aux. memory - total: 125287 MB, largest block: 125287 MB
Memory info (GL_NVX_gpu_memory_info):
    Dedicated video memory: 4294279731 MB
    Total available memory: 4294408448 MB
    Currently available dedicated video memory: 31 MB
OpenGL vendor string: Mesa
OpenGL renderer string: llvmpipe (LLVM 15.0.7, 256 bits)
OpenGL core profile version string: 4.5 (Core Profile) Mesa 23.1.5
OpenGL core profile shading language version string: 4.50
OpenGL core profile context flags: (none)
OpenGL core profile profile mask: core profile

OpenGL version string: 4.5 (Compatibility Profile) Mesa 23.1.5
OpenGL shading language version string: 4.50
OpenGL context flags: (none)
OpenGL profile mask: compatibility profile

OpenGL ES profile version string: OpenGL ES 3.2 Mesa 23.1.5
OpenGL ES profile shading language version string: OpenGL ES GLSL ES 3.20
--------------
➜  ~ inxi -Gxxx
Graphics:
  Device-1: AMD Navi 31 [Radeon RX 7900 XT/7900 XTX] vendor: Gigabyte
    driver: N/A arch: RDNA-3 pcie: speed: 16 GT/s lanes: 16 bus-ID: 0c:00.0
    chip-ID: 1002:744c class-ID: 0300
  Display: x11 server: X.Org v: 1.21.1.8 with: Xwayland v: 23.1.2
    compositor: kwin_x11 driver: X: loaded: modesetting,radeon
    unloaded: fbdev,vesa gpu: N/A display-ID: :0 screens: 1
  Screen-1: 0 s-res: 1920x1200 s-dpi: 96 s-size: 508x317mm (20.00x12.48")
    s-diag: 599mm (23.57")
  Monitor-1: Unknown-1 mapped: None-1 res: 1920x1200 hz: 60 size: N/A
    modes: 1920x1200
  API: OpenGL v: 4.5 Mesa 23.1.5 renderer: llvmpipe (LLVM 15.0.7 256 bits)
    direct-render: Yes
--------------
Comment 12 Антон Мидюков 2023-08-15 18:39:26 MSK
Попробуйте обновиться из задания 327236.
Comment 13 Yury Sukhovey 2023-08-15 22:42:15 MSK
После обновления из задачи ядра 6.4.9 и 6.4.10 стартуют и работают.
Попробовал подсунуть initrd-6.4.9-un-def-alt1, собранный с firmware 20230809 - черный экран.
Ядра 6.1.44 и 6.1 45 не стартуют вообще. Причем, не попадают в логи даже (нет строк типа "Linux version 6.1.44-std-def-alt1" или "Linux version 6.1.45-std-def-alt1")
Comment 14 Антон Мидюков 2023-08-16 00:49:36 MSK
(Ответ для Yury Sukhovey на комментарий #13)
> После обновления из задачи ядра 6.4.9 и 6.4.10 стартуют и работают.
> Попробовал подсунуть initrd-6.4.9-un-def-alt1, собранный с firmware 20230809
> - черный экран.

Тогда на firmware-linux. Таск 327236 коммичу.
Comment 15 Yury Sukhovey 2023-08-17 14:20:31 MSK
Ядро 6.1.46-std-def установилось и работает с версией firmware-linux из задания 327236.
Comment 16 Alexei Takaseev 2023-08-17 14:24:45 MSK
(Ответ для Yury Sukhovey на комментарий #15)
> Ядро 6.1.46-std-def установилось и работает с версией firmware-linux из
> задания 327236.

Аналогично, ядро

kernel-headers-modules-std-def-6.1.46-alt1.x86_64
kernel-headers-std-def-6.1.46-alt1.x86_64
kernel-image-std-def-6.1.46-alt1.x86_64
kernel-modules-drm-std-def-6.1.46-alt1.x86_64

и firmware

firmware-linux-20230814-alt1.noarch

заработали
Comment 17 Антон Мидюков 2023-08-17 20:10:29 MSK
(Ответ для Alexei Takaseev на комментарий #16)
> (Ответ для Yury Sukhovey на комментарий #15)
> > Ядро 6.1.46-std-def установилось и работает с версией firmware-linux из
> > задания 327236.
> 
> Аналогично, ядро
> 
> kernel-headers-modules-std-def-6.1.46-alt1.x86_64
> kernel-headers-std-def-6.1.46-alt1.x86_64
> kernel-image-std-def-6.1.46-alt1.x86_64
> kernel-modules-drm-std-def-6.1.46-alt1.x86_64
> 
> и firmware
> 
> firmware-linux-20230814-alt1.noarch
> 
> заработали

Значит исправлено. Закрываю.