Bug 57209

Summary: 2.3.5: kernel Oops
Product: Branch p11 Reporter: Sergey Y. Afonin <asy>
Component: kernel-modules-zfs-6.12Assignee: qa-team <qa-team>
Status: CLOSED WORKSFORME QA Contact: qa-p11 <qa-p11>
Severity: normal    
Priority: P5 CC: amakeenk, obidinog
Version: unspecified   
Hardware: x86_64   
OS: Linux   
Attachments:
Description Flags
zfs kernel Oops
none
lspci -v none

Description Sergey Y. Afonin 2025-12-11 19:09:39 MSK
Created attachment 20320 [details]
zfs kernel Oops

Наверное пусть будет.

kernel: Oops: Oops: 0002 [#1] PREEMPT SMP PTI
CPU: 2 UID: 987 PID: 2068 Comm: zpool Tainted: P   OE   6.12.59-6.12-alt1 #1
Tainted: [P]=PROPRIETARY_MODULE, [O]=OOT_MODULE, [E]=UNSIGNED_MODULE
Hardware name: Supermicro X9SCI/X9SCA/X9SCI/X9SCA, BIOS 2.3a 01/06/2021

Случилось в какой-то момент после перезагрузки, в минутах. Фактически на ровном месте. Сервр пока условно экспериментальный, несколько дней на том zfs льются данне rsync-ом, но в эту перезагрузку я rsync запустить не успел. Ещё и journal куда-то данные этой перезагрузки дел, хорошо, что oops сразу скопировал.

Случай пока разовый.
Comment 1 obidinog@basealt.ru 2025-12-12 10:39:03 MSK
Уточните, пожалуйста, на каком дистрибутиве воспроизводится и Приложите lspci -v
Comment 2 obidinog@basealt.ru 2025-12-12 10:41:24 MSK
И уточните, пожалуйста, полные шаги для воспроизведения ошибки
Comment 3 Sergey Y. Afonin 2025-12-12 13:11:08 MSK
Created attachment 20328 [details]
lspci -v

Пул zfs из 4-х HDD TOSHIBA HDWT840, всё подключено к контроллеру LSI SAS 9300-16i. Сам пул смонтировано вовнутрь пользовательского домашнего каталога. Система установлена на HDD, подключенные к Adaptec ASR5805.

# zpool status
  pool: FLOWDATA
 state: ONLINE
config:

        NAME        STATE     READ WRITE CKSUM
        FLOWDATA    ONLINE       0     0     0
          raidz1-0  ONLINE       0     0     0
            sdc     ONLINE       0     0     0
            sdd     ONLINE       0     0     0
            sde     ONLINE       0     0     0
            sdf     ONLINE       0     0     0

errors: No known data errors
Comment 4 Sergey Y. Afonin 2025-12-12 13:17:08 MSK
(Ответ для obidinog@basealt.ru на комментарий #1)

> Уточните, пожалуйста, на каком дистрибутиве воспроизводится

alt-p11-jeos-systemd-20250912-x86_64.iso
Опыт с zfs первый, опыт с systemd, можно считать, тоже первый.
Comment 5 Sergey Y. Afonin 2025-12-12 13:38:08 MSK
(Ответ для obidinog@basealt.ru на комментарий #2)

> И уточните, пожалуйста, полные шаги для воспроизведения ошибки

Шагов практически никаких. Перезагрузиться и ждать. Вопрос - сколько.

Сервер в тесте с 3 декабря, между делом копирую данные, которые там должны потом храниться будут, то есть том zfs не пуст, там чуть больше 1Тб записано. Экспериментировал с версиями systemd, в какой-то момент вернул актуальное состояние p11 (dist-upgrade) на вчерашнее число и перезагрузил. В момент перезагрузки отошёл, возвращаюсь, висит ошибка. Минут 5 прошло, пока я ходил, может чуть больше.

Сама система была в рабочем состоянии, отпал только zfs пул. Копирование я запускаю руками пока, то есть никакой записи в пул после перезагрузки не велось. За это время, с 3 декабря, проблема случилась один раз, сейчас вот всё работает, данные в пул копируются. Если/когда ещё раз вылезет, напишу.

# rpm -qa| grep "^kernel"
kernel-image-6.12-6.12.59-alt1.x86_64
kernel-modules-zfs-6.12-2.3.5-alt1.396347.1.x86_64
Comment 6 Alexander Makeenkov 2025-12-12 14:32:55 MSK
(Ответ для Sergey Y. Afonin на комментарий #5)
> Если/когда ещё раз вылезет, напишу.

И переоткройте баг.
Comment 7 Sergey Y. Afonin 2025-12-31 01:06:26 MSK
Опять вылезло. И, практически, так же сразу:

Загрузка:
Dec 31 00:19:21 kernel: Linux version 6.12.59-6.12-alt1 (builder@localhost.localdomain) 

Oops:
Dec 31 00:24:19 kernel: Oops: Oops: 0002 [#1] PREEMPT SMP PTI

Ядро, смотрю, поновее есть. Обновлю.
Comment 8 Sergey Y. Afonin 2026-01-30 09:03:31 MSK
(In reply to Sergey Y. Afonin from comment #7)

> Опять вылезло. И, практически, так же сразу:

И ещё раз так же, сразу после перезагрузки, то того отработав 20 дней. Всё ещё 6.12.59

> Ядро, смотрю, поновее есть. Обновлю.

Сейчас обновил до 6.12.65
Comment 9 Sergey Y. Afonin 2026-02-18 13:58:00 MSK
(Ответ для Sergey Y. Afonin на комментарий #8)

> > Ядро, смотрю, поновее есть. Обновлю.
> 
> Сейчас обновил до 6.12.65

В тот момент сразу сделал 5 перезагрузок и потом было ещё несколько, вроде не повторяется пока. Будем считать, что проблема была в 6.12.59-6.12-alt1.