Summary: | livecd-install падает при 4 дисках (starterkit 09.2020) | ||
---|---|---|---|
Product: | Sisyphus | Reporter: | Стас <stas.grumbler> |
Component: | installer-livecd-install | Assignee: | Антон Мидюков <antohami> |
Status: | CLOSED WORKSFORME | QA Contact: | qa-sisyphus |
Severity: | major | ||
Priority: | P5 | CC: | 111, antohami, boyarsh, evg, kiber_pank4, mcpain, ptrnine, qwetwe, sem |
Version: | unstable | ||
Hardware: | all | ||
OS: | Linux | ||
URL: | http://www.altlinux.org/Installer/problems/MD-RAID-cleanup | ||
Attachments: |
Created attachment 8989 [details]
/tmp/wizard.log
Более точная диагностика. Ошибка не зависит от количества дисков в компьютере. Причина падения связана с выбором "Хранить в BIOS время по Гринвичу". Если на третьем этапе отменяешь этот выбор, установленный по умолчанию, после клика по "Next" возникает сообщение об ошибке и диски не видны. Сообщение об ошибке дословно: "Bad file descriptor" Дополнение. Эта ошибкаобходится такими "шаманскими" действиями: 1. На шаге 3 (выбор часового пояса) кликаем "Next", получаем ошибку и на шаге 4 видим пустой список дисков. 2. Кликаем "Back" - возвращаемся к выбору часового пояса, кликаем "Next", вдим список дисков. Однако после выбора варианта разметки кликаем Next и получаем падение графической оболочки и перезугрузку из-за того, что чкрипт не нашёл файл altinst Воспроизводится только на этой машине? Два окна инсталлятора не открыто случайно (иногда такое может происходить)? В виртуалке пробую, воспроизвести проблему не получается. На другой материанской плате ошибка тоже есть. Причина оказалась в том, что диски были не совсем пустые - они раньше стояли в NAS и там был RAID5 mdadm + LVM поверх него. На дисках был очищен первый мегабайт. Centos 8 установился на эти же диски без каких бы то ни было проблем. Я не знаю, какой программой определяются диски в установочном скрипте, знаю только, что эта программа глючит в любой нестандартной ситуации. Вспомнил, что лет 7-8 назад у меня была подобная ситуация с инсталлятором P7 - тогда на дисках была NTFS. Чтобы воспроизвести проблему, создайте на томах, выделенных для виртуалки, разделы, соберите их в RAID, запишите нулями первый мегабайт на каждом диске, потом устанавливайте Altlinux. Если сообщите, в каком это пакете - посмотрю сам. (Ответ для Стас на комментарий #5) > На другой материанской плате ошибка тоже есть. > Причина оказалась в том, что диски были не совсем пустые - они раньше стояли > в NAS и там был RAID5 mdadm + LVM поверх него. На дисках был очищен первый > мегабайт. > > Centos 8 установился на эти же диски без каких бы то ни было проблем. > > Я не знаю, какой программой определяются диски в установочном скрипте, знаю > только, что эта программа глючит в любой нестандартной ситуации. Вспомнил, > что лет 7-8 назад у меня была подобная ситуация с инсталлятором P7 - тогда > на дисках была NTFS. > > Чтобы воспроизвести проблему, создайте на томах, выделенных для виртуалки, > разделы, соберите их в RAID, запишите нулями первый мегабайт на каждом > диске, потом устанавливайте Altlinux. > > Если сообщите, в каком это пакете - посмотрю сам. alterator-vm, видимо. На всякий: чистить метаданные лучше не dd, а wipefs -a. По-хорошему надо б сделать в alterator-vm хотя бы кнопку для такого, если не анализатор довольно распространённой проблемной ситуации. Почти наверняка это дубликат https://bugzilla.altlinux.org/show_bug.cgi?id=35918 RAID10. Для ALT выделил раздел. Alterator падает. Пробовал simply и starter. Параллельно с альтератором запускаю watch cat /proc/mdstat starter. При запуске альтератора массив разбирается. Если пересобрать вручную, то разделов не видно. Альтератор падает. simply. Массив разбирается и заново собирается. Но после выбора «Ручная разметка диска» - «Далее» альтератор падает. Проверялось в Sisyphus, ошибка воспроизводится - Версии пакетов: livecd-evms-0.2.6-alt1 alterator-livecd-0.8.9-alt2 livecd-install-0.9.19-alt2 alterator-vm-0.4.32-alt2 - Стенд: виртуальная машина (legacy) с тремя одинаковыми жесткими дисками и подключенными образами: -- Simply Linux Live 10.1: http://ftp.altlinux.org/pub/distributions/ALTLinux/p10/images/simply/x86_64/slinux-live-10.1-x86_64.iso -- StarterKit p10 XFCE: http://nightly.altlinux.org/p10/release/alt-p10-xfce-20230309-x86_64.iso -- Regular XFCE Sisyphus: http://nightly.altlinux.org/sisyphus/current/regular-xfce-latest-x86_64.iso - Шаги для воспроизведения: 1) Загрузиться в LiveCD, используя образ Simply Linux Live 10.1; 2) С рабочего стола запустить установку на жесткий диск; 3) Установить систему на RAID (MD RAID 10 Region Manager) из трех дисков, подготовив разделы вручную, согласно документации: https://docs.altlinux.org/ru-RU/alt-simply/10.1/html-single/alt-simply/index.html#idm45272095501104 md0 1023 MB [1023 MB] SWAPFS md3 24 GB [24 GB] Ext2/3 / relatime 4) Загрузиться в LiveCD, используя образ StarterKit p10 XFCE; 5) Установить и запустить livecd-install: $ su - # apt-get update && apt-get install -y livecd-install && LC_ALL=ru_RU.utf-8 livecd-install 6) Дойти до этапа "4/10: Подготовка диска"; 7) Выбрать "Подготовить разделы вручную" и нажать "Далее"; 8) Выполнить действия 4-6, используя образ Regular XFCE Sisyphus. - Фактический результат: 6) Воспроизвелась ошибка: "Критическая ошибка No such device". Список "Разделы" пуст. 7) livecd-install упал (livecd-install_backtrace_alt-p10-xfce-20230309_1.txt): ice-9/boot-9.scm:751:25: In procedure dispatch-exception: Throw to key `internal-error' with args `(wrong-type-arg #f "Wrong type to apply: ~S" (#f) (#f))'. 8) livecd-install упал при попытке перехода на этап "4/10: Подготовка диска" (livecd-install_backtrace_regular-xfce-latest.txt): ice-9/boot-9.scm:751:25: In procedure dispatch-exception: Throw to key `internal-error' with args `(wrong-type-arg "throw" "Wrong type argument in position ~a: ~a" (1 "swig-system-error") ("swig-system-error"))'. - Ожидаемый результат: Критическая ошибка не воспроизводится. В списке "Разделы" отображаются RAID-массивы. livecd-install не падает. То есть, ошибка возникает тогда, когда уже есть размеченный RAID. Хоть содержание ошибки в графике и различается ("неверный дескриптор файла" != "No such device"), но в терминале ошибки точно такие же как у Стаса. ("Wrong type to apply: ~S") Содержимое /proc/mdstat: Personalities : [raid10] md126 : active (auto-read-only) raid10 sda1[0] sdb1[1] sdc1[2] 1571264 blocks super 1.2 32K chunks 2 near-copies [3/3] [UUU] md127 : active (auto-read-only) raid10 sda2[0] sdb2[1] sdc2[2] 37747136 blocks super 1.2 32K chunks 2 near-copies [3/3] [UUU] unused devices: <none> (Ответ для Стас на комментарий #3) > Дополнение. Эта ошибка обходится такими "шаманскими" действиями: > 1. На шаге 3 (выбор часового пояса) кликаем "Next", получаем ошибку и на > шаге 4 видим пустой список дисков. > 2. Кликаем "Back" - возвращаемся к выбору часового пояса, кликаем "Next", > вдим список дисков. > > Однако после выбора варианта разметки кликаем Next и получаем падение > графической оболочки и перезагрузку из-за того, что скрипт не нашёл файл > altinst В моем случае графическая оболочка не падает, система не перезагружается. Падает только livecd-install: - При выборе "Удалить все разделы и создать разделы автоматически" (livecd-install_backtrace_alt-p10-xfce-20230309_2.txt): ice-9/boot-9.scm:751:25: In procedure dispatch-exception: Throw to key `internal-error' with args `(swig-system-error "evms-commit-changes" "No such device" () #f)'. - При выборе "Подготовить разделы вручную", ручного создания томов SWAPFS / корень на уже имеющихся RAID-массивах и нажатия на кнопку "Далее" (livecd-install_backtrace_alt-p10-xfce-20230309_3.txt): ice-9/boot-9.scm:751:25: In procedure dispatch-exception: In procedure cadr: Wrong type (expecting pair): #f Created attachment 13035 [details]
livecd-install_backtrace_alt-p10-xfce-20230309_1.txt
Created attachment 13036 [details]
livecd-install_backtrace_regular-xfce-latest.txt
Created attachment 13037 [details]
livecd-install_backtrace_alt-p10-xfce-20230309_2.txt
Created attachment 13038 [details]
livecd-install_backtrace_alt-p10-xfce-20230309_3.txt
Created attachment 13039 [details]
Ошибка "No such device" на StarterKit p10 XFCE
Проблема в низкой скорости записи. Решается теперь указанием параметра загрузки oldinst Добавлено в installer-livecd-install 0.10.1-alt1. (Ответ для Антон Мидюков на комментарий #16) > Проблема в низкой скорости записи. Решается теперь указанием параметра > загрузки oldinst > Добавлено в installer-livecd-install 0.10.1-alt1. Закрываю, так как теперь есть объезд проблемы. |
Created attachment 8988 [details] stdout и stderr livecd-install 1. Скачал alt-p9-kde5-20200912-x86_64.iso, записал на флешку (командой dd) 2. Загрузился с этой флешки на компьютер с четырьмя пустыми дисками по 2 Тб каждый 3. Запустил установку 4. на шаге разметки дисков получаю окно с ошибкой "неверный дескриптор файла", в списке дисков пусто, при клике "Next" программа аварийно завершается. Запустил /usr/sbin/livecd-install из консоли, увидел трэйс падения, сохранил в файл altbug.txt, его и /tmp/wizard.log прилагаю.