Bug 39030 - livecd-install падает при 4 дисках (starterkit 09.2020)
Summary: livecd-install падает при 4 дисках (starterkit 09.2020)
Status: NEW
Alias: None
Product: Sisyphus
Classification: Development
Component: installer-livecd-install (show other bugs)
Version: unstable
Hardware: all Linux
: P5 major
Assignee: Антон Мидюков
QA Contact: qa-sisyphus
URL: http://www.altlinux.org/Installer/pro...
Keywords:
Depends on:
Blocks:
 
Reported: 2020-10-03 21:32 MSK by Стас
Modified: 2024-02-21 19:15 MSK (History)
9 users (show)

See Also:


Attachments
stdout и stderr livecd-install (2.66 KB, text/plain)
2020-10-03 21:32 MSK, Стас
no flags Details
/tmp/wizard.log (23.31 KB, text/plain)
2020-10-03 21:33 MSK, Стас
no flags Details
livecd-install_backtrace_alt-p10-xfce-20230309_1.txt (2.76 KB, text/plain)
2023-04-26 18:07 MSK, Ivan Alekseev
no flags Details
livecd-install_backtrace_regular-xfce-latest.txt (2.85 KB, text/plain)
2023-04-26 18:08 MSK, Ivan Alekseev
no flags Details
livecd-install_backtrace_alt-p10-xfce-20230309_2.txt (2.98 KB, text/plain)
2023-04-26 18:08 MSK, Ivan Alekseev
no flags Details
livecd-install_backtrace_alt-p10-xfce-20230309_3.txt (4.04 KB, text/plain)
2023-04-26 18:08 MSK, Ivan Alekseev
no flags Details
Ошибка "No such device" на StarterKit p10 XFCE (31.12 KB, image/png)
2023-04-26 18:22 MSK, Ivan Alekseev
no flags Details

Note You need to log in before you can comment on or make changes to this bug.
Description Стас 2020-10-03 21:32:30 MSK
Created attachment 8988 [details]
stdout и stderr livecd-install

1. Скачал alt-p9-kde5-20200912-x86_64.iso, записал на флешку (командой dd)
2. Загрузился с этой флешки на компьютер с четырьмя пустыми дисками по 2 Тб каждый
3. Запустил установку
4. на шаге разметки дисков получаю окно с ошибкой "неверный дескриптор файла", в списке дисков пусто, при клике "Next" программа аварийно завершается.

Запустил /usr/sbin/livecd-install из консоли, увидел трэйс падения, сохранил в файл altbug.txt, его и /tmp/wizard.log прилагаю.
Comment 1 Стас 2020-10-03 21:33:30 MSK
Created attachment 8989 [details]
/tmp/wizard.log
Comment 2 Стас 2020-10-03 22:10:05 MSK
Более точная диагностика.
Ошибка не зависит от количества дисков в компьютере.

Причина падения связана с выбором "Хранить в BIOS время по Гринвичу". Если на третьем этапе отменяешь этот выбор, установленный по умолчанию, после клика по "Next" возникает сообщение об ошибке и диски не видны. Сообщение об ошибке дословно: "Bad file descriptor"
Comment 3 Стас 2020-10-03 22:28:46 MSK
Дополнение. Эта ошибкаобходится такими "шаманскими" действиями:
1. На шаге 3 (выбор часового пояса) кликаем "Next", получаем ошибку и на шаге 4 видим пустой список дисков.
2. Кликаем "Back" - возвращаемся к выбору часового пояса, кликаем "Next", вдим список дисков.

Однако после выбора варианта разметки кликаем Next и получаем падение графической оболочки и перезугрузку из-за того, что чкрипт не нашёл файл altinst
Comment 4 Антон Мидюков 2020-10-05 08:11:57 MSK
Воспроизводится только на этой машине?
Два окна инсталлятора не открыто случайно (иногда такое может происходить)?
В виртуалке пробую, воспроизвести проблему не получается.
Comment 5 Стас 2020-10-06 15:09:04 MSK
На другой материанской плате ошибка тоже есть.
Причина оказалась в том, что диски были не совсем пустые - они раньше стояли в NAS и там был RAID5 mdadm + LVM поверх него. На дисках был очищен первый мегабайт.

Centos 8 установился на эти же диски без каких бы то ни было проблем.

Я не знаю, какой программой определяются диски в установочном скрипте, знаю только, что эта программа глючит в любой нестандартной ситуации. Вспомнил, что лет 7-8 назад у меня была подобная ситуация с инсталлятором P7 - тогда на дисках была NTFS.

Чтобы воспроизвести проблему, создайте на томах, выделенных для виртуалки, разделы, соберите их в RAID, запишите нулями первый мегабайт на каждом диске, потом устанавливайте Altlinux.

Если сообщите, в каком это пакете - посмотрю сам.
Comment 6 Антон Мидюков 2020-10-07 09:19:04 MSK
(Ответ для Стас на комментарий #5)
> На другой материанской плате ошибка тоже есть.
> Причина оказалась в том, что диски были не совсем пустые - они раньше стояли
> в NAS и там был RAID5 mdadm + LVM поверх него. На дисках был очищен первый
> мегабайт.
> 
> Centos 8 установился на эти же диски без каких бы то ни было проблем.
> 
> Я не знаю, какой программой определяются диски в установочном скрипте, знаю
> только, что эта программа глючит в любой нестандартной ситуации. Вспомнил,
> что лет 7-8 назад у меня была подобная ситуация с инсталлятором P7 - тогда
> на дисках была NTFS.
> 
> Чтобы воспроизвести проблему, создайте на томах, выделенных для виртуалки,
> разделы, соберите их в RAID, запишите нулями первый мегабайт на каждом
> диске, потом устанавливайте Altlinux.
> 
> Если сообщите, в каком это пакете - посмотрю сам.

alterator-vm, видимо.
Comment 7 Michael Shigorin 2020-10-14 13:59:43 MSK
На всякий: чистить метаданные лучше не dd, а wipefs -a.

По-хорошему надо б сделать в alterator-vm хотя бы кнопку для такого,
если не анализатор довольно распространённой проблемной ситуации.
Comment 8 Yar4e 2020-12-03 12:25:13 MSK
Почти наверняка это дубликат https://bugzilla.altlinux.org/show_bug.cgi?id=35918
Comment 9 111 2021-04-05 17:33:41 MSK
RAID10. Для ALT выделил раздел. Alterator падает. Пробовал simply и starter.
Параллельно с альтератором запускаю
watch cat /proc/mdstat

starter. При запуске альтератора массив разбирается. Если пересобрать вручную, то разделов не видно. Альтератор падает.
simply. Массив разбирается и заново собирается. Но после выбора «Ручная разметка диска» - «Далее» альтератор падает.
Comment 10 Ivan Alekseev 2023-04-26 18:05:25 MSK
Проверялось в Sisyphus, ошибка воспроизводится

- Версии пакетов:
livecd-evms-0.2.6-alt1
alterator-livecd-0.8.9-alt2
livecd-install-0.9.19-alt2
alterator-vm-0.4.32-alt2

- Стенд: виртуальная машина (legacy) с тремя одинаковыми жесткими дисками и подключенными образами:
-- Simply Linux Live 10.1: http://ftp.altlinux.org/pub/distributions/ALTLinux/p10/images/simply/x86_64/slinux-live-10.1-x86_64.iso
-- StarterKit p10 XFCE: http://nightly.altlinux.org/p10/release/alt-p10-xfce-20230309-x86_64.iso
-- Regular XFCE Sisyphus: http://nightly.altlinux.org/sisyphus/current/regular-xfce-latest-x86_64.iso

- Шаги для воспроизведения:
1) Загрузиться в LiveCD, используя образ Simply Linux Live 10.1;
2) С рабочего стола запустить установку на жесткий диск;
3) Установить систему на RAID (MD RAID 10 Region Manager) из трех дисков, подготовив разделы вручную, согласно документации:
https://docs.altlinux.org/ru-RU/alt-simply/10.1/html-single/alt-simply/index.html#idm45272095501104
  md0 1023 MB [1023 MB] SWAPFS
  md3 24 GB   [24 GB]   Ext2/3 / relatime
4) Загрузиться в LiveCD, используя образ StarterKit p10 XFCE;
5) Установить и запустить livecd-install:
$ su -
# apt-get update && apt-get install -y livecd-install && LC_ALL=ru_RU.utf-8 livecd-install
6) Дойти до этапа "4/10: Подготовка диска";
7) Выбрать "Подготовить разделы вручную" и нажать "Далее";
8) Выполнить действия 4-6, используя образ Regular XFCE Sisyphus.

- Фактический результат:
6) Воспроизвелась ошибка: "Критическая ошибка No such device". Список "Разделы" пуст.
7) livecd-install упал (livecd-install_backtrace_alt-p10-xfce-20230309_1.txt):
ice-9/boot-9.scm:751:25: In procedure dispatch-exception:
Throw to key `internal-error' with args `(wrong-type-arg #f "Wrong type to apply: ~S" (#f) (#f))'.
8) livecd-install упал при попытке перехода на этап "4/10: Подготовка диска" (livecd-install_backtrace_regular-xfce-latest.txt):
ice-9/boot-9.scm:751:25: In procedure dispatch-exception:
Throw to key `internal-error' with args `(wrong-type-arg "throw" "Wrong type argument in position ~a: ~a" (1 "swig-system-error") ("swig-system-error"))'.

- Ожидаемый результат:
Критическая ошибка не воспроизводится. В списке "Разделы" отображаются RAID-массивы. livecd-install не падает.

То есть, ошибка возникает тогда, когда уже есть размеченный RAID.
Хоть содержание ошибки в графике и различается ("неверный дескриптор файла" != "No such device"), но в терминале ошибки точно такие же как у Стаса. ("Wrong type to apply: ~S")

Содержимое /proc/mdstat:
    Personalities : [raid10]
    md126 : active (auto-read-only) raid10 sda1[0] sdb1[1] sdc1[2]
          1571264 blocks super 1.2 32K chunks 2 near-copies [3/3] [UUU]
    md127 : active (auto-read-only) raid10 sda2[0] sdb2[1] sdc2[2]
          37747136 blocks super 1.2 32K chunks 2 near-copies [3/3] [UUU]
    unused devices: <none>

(Ответ для Стас на комментарий #3)

> Дополнение. Эта ошибка обходится такими "шаманскими" действиями:
> 1. На шаге 3 (выбор часового пояса) кликаем "Next", получаем ошибку и на
> шаге 4 видим пустой список дисков.
> 2. Кликаем "Back" - возвращаемся к выбору часового пояса, кликаем "Next",
> вдим список дисков.
> 
> Однако после выбора варианта разметки кликаем Next и получаем падение
> графической оболочки и перезагрузку из-за того, что скрипт не нашёл файл
> altinst
В моем случае графическая оболочка не падает, система не перезагружается. Падает только livecd-install:
- При выборе "Удалить все разделы и создать разделы автоматически" (livecd-install_backtrace_alt-p10-xfce-20230309_2.txt):
ice-9/boot-9.scm:751:25: In procedure dispatch-exception:
Throw to key `internal-error' with args `(swig-system-error "evms-commit-changes" "No such device" () #f)'.
- При выборе "Подготовить разделы вручную", ручного создания томов SWAPFS / корень на уже имеющихся RAID-массивах и нажатия на кнопку "Далее" (livecd-install_backtrace_alt-p10-xfce-20230309_3.txt):
ice-9/boot-9.scm:751:25: In procedure dispatch-exception:
In procedure cadr: Wrong type (expecting pair): #f
Comment 11 Ivan Alekseev 2023-04-26 18:07:57 MSK
Created attachment 13035 [details]
livecd-install_backtrace_alt-p10-xfce-20230309_1.txt
Comment 12 Ivan Alekseev 2023-04-26 18:08:21 MSK
Created attachment 13036 [details]
livecd-install_backtrace_regular-xfce-latest.txt
Comment 13 Ivan Alekseev 2023-04-26 18:08:41 MSK
Created attachment 13037 [details]
livecd-install_backtrace_alt-p10-xfce-20230309_2.txt
Comment 14 Ivan Alekseev 2023-04-26 18:08:56 MSK
Created attachment 13038 [details]
livecd-install_backtrace_alt-p10-xfce-20230309_3.txt
Comment 15 Ivan Alekseev 2023-04-26 18:22:15 MSK
Created attachment 13039 [details]
Ошибка "No such device" на StarterKit p10 XFCE
Comment 16 Антон Мидюков 2024-02-21 19:15:11 MSK
Проблема в низкой скорости записи. Решается теперь указанием параметра загрузки oldinst
Добавлено в installer-livecd-install 0.10.1-alt1.