Харктерные для p10 и p11 (не только на серверах) ошибки в журнале: systemd[1]: multipathd.service: Main process exited, code=exited, status=1/FAILURE systemd[1]: multipathd.service: Failed with result 'exit-code'. systemd[1]: Failed to start Device-Mapper Multipath Device Controller. иногда приводящие к деградация загрузки, т.е. сервис в большинстве случаев всё же запускается после разовой ругани в журнале, но не всегда. У данного бага очень плохая воспроизводимость. Впервые эти ошибки были замечены на 10.0. Следующие команды могут помочь устранить данные ошибки в большинстве случаев, поскольку отодвинут загрузку необходимых службе модулей на более раннюю стадию загрузки: echo "FEATURES += multipath" >> /etc/initrd.mk make-initrd && reboot Но на железе, которое фича make-initrd-multipath откажется поддерживать, и на очень быстром железе с почти нулевым временем прохождения stage1, именно этот воркэраунд может не сработать. Пока такого не встречалось.
На p11 предлагаю добавить в multipathd.service: OnSuccess=modprobe@dm_multipath.service
Платформа: alt-server p11 x86_64 Стенд: Supermicro SYS-2029BT-HNR node-c Пакет: multipath-tools 0.11.1-alt3 Ошибка не воспроизвелась, после установки системы, перезагрузки, выполнения make-initrd сервис запущен без ошибок Но, как говорит Леонид, ошибка плохо воспроизводится.
Created attachment 20218 [details] dmesg (In reply to obidinog@basealt.ru from comment #2) > Но, как говорит Леонид, ошибка плохо воспроизводится. За ней гонялись с начала 10.0. У gost@ десятки логов с этой ошибкой. И каждый раз, когда она попадалась и нам давали доступ, воспроизвести её снова не получалось. Только разово у Константина Белаша получилось воспроизвести. Я сохранил последние логи, они сюда не пролезут, Алексей Шабалин есть в копии переписки. sosreport показывает, что в одну секунду произошли два события: сначала эта ошибка, а затем успешная загрузка multipathd. Приложу только dmesg.
(In reply to Антон Мидюков from comment #1) > На p11 предлагаю добавить в multipathd.service: > OnSuccess=modprobe@dm_multipath.service В случае успешной загрузки multipathd, ..., так у нас как раз фейлится этот сервис, может ты имел ввиду OnFailure=...? Возможно, в его юните не хватает: After: modprobe@dm_multipath.service?
(Ответ для Leonid Krivoshein на комментарий #4) > (In reply to Антон Мидюков from comment #1) > > На p11 предлагаю добавить в multipathd.service: > > OnSuccess=modprobe@dm_multipath.service > В случае успешной загрузки multipathd, ..., так у нас как раз фейлится этот > сервис, может ты имел ввиду OnFailure=...? Возможно, в его юните не хватает: > After: modprobe@dm_multipath.service? Нет. Это я с точностью до наоборот подобрал... Хотел, чтобы сервис стартовал только после успешного завершения modprobe@dm_multipath.service. Похоже, тут подошло бы вот это: ConditionKernelModuleLoaded= Test whether the specified kernel module has been loaded and is already fully initialized. Added in version 258 Но нужен systemd 258.