Bug 37839

Summary: Не заполняет nodelist в corosync.conf
Product: Branch p9 Reporter: Alexander Makeenkov <amakeenk>
Component: crmshAssignee: Anton Farygin <rider>
Status: NEW --- QA Contact: qa-p9 <qa-p9>
Severity: normal    
Priority: P3 CC: shaba
Version: не указана   
Hardware: all   
OS: Linux   

Description Alexander Makeenkov 2020-01-16 14:55:55 MSK
Версия: crmsh-3.0.3-alt1
Система: ALT Server 9.0 x86_64

Две машины, на каждой добавлены записи в /etc/hosts, настроен беспарольный доступ по ssh, установлены пакеты pacemaker crmsh.

При попытке проинициализировать кластер, возникает ошибка:
# crm cluster init nodes=hosta,hostb
Generating SSH key
Configuring csync2
Generating csync2 shared key (this may take a while)...done
csync2 checking files...done
Configuring corosync
ERROR: cluster.init: Failed to start pacemaker.service

# systemctl status pacemaker
● pacemaker.service - Pacemaker High Availability Cluster Manager
   Loaded: loaded (/lib/systemd/system/pacemaker.service; enabled; vendor preset: disabled)
   Active: inactive (dead)
     Docs: man:pacemakerd
           https://clusterlabs.org/pacemaker/doc/en-US/Pacemaker/2.0/html-single/Pacemaker_Explained/index.html

янв 16 14:47:09 hosta systemd[1]: Dependency failed for Pacemaker High Availability Cluster Manager.
янв 16 14:47:09 hosta systemd[1]: pacemaker.service: Job pacemaker.service/start failed with result 'dependency'.

# journalctl -u corosync
янв 16 14:47:08 hosta systemd[1]: Starting Corosync Cluster Engine...
янв 16 14:47:09 hosta corosync[4602]:   [MAIN  ] Corosync Cluster Engine 3.0.2 starting up
янв 16 14:47:09 hosta corosync[4602]:   [MAIN  ] Corosync built-in features: dbus monitoring watchdog augeas systemd xmlconf vqsim nozzle snmp pie relro bindnow
янв 16 14:47:09 hosta corosync[4602]:   [MAIN  ] parse error in config: No valid name found for local host
янв 16 14:47:09 hosta corosync[4602]:   [MAIN  ] Corosync Cluster Engine exiting with status 8 at main.c:1386.
янв 16 14:47:09 hosta systemd[1]: corosync.service: Main process exited, code=exited, status=8/n/a
янв 16 14:47:09 hosta systemd[1]: corosync.service: Failed with result 'exit-code'.
янв 16 14:47:09 hosta systemd[1]: Failed to start Corosync Cluster Engine.

Исходя из этого сообщения "corosync[4602]:   [MAIN  ] parse error in config: No valid name found for local host" проверяю файл /etc/corosync/corosync.conf.

В нём не создаётся секция nodelist, из-за этого и возникает ошибка.
Comment 1 Andrey Cherepanov 2020-04-03 21:34:17 MSK
Откройте /etc/corosync/corosync.conf на каждом хосте и вычистите секцию
nodelist {
        # Change/uncomment/add node sections to match cluster configuration

}

Помогает? У corosync вбиты левые данные по умолчанию. Это же мешает развернуть pcs.
Comment 2 Alexey Shabalin 2020-04-04 04:40:23 MSK
я посмотрел, в других дистрибутивах не пакуют /etc/corosync/corosync.conf вообще. Пакуют/etc/corosync/corosync.conf.example. Может и нам не надо?
Если его не будет, это облегчит создание кластера?
Comment 3 Andrey Cherepanov 2020-04-04 13:42:47 MSK
(Ответ для Alexey Shabalin на комментарий #2)
> я посмотрел, в других дистрибутивах не пакуют /etc/corosync/corosync.conf
> вообще. Пакуют/etc/corosync/corosync.conf.example. Может и нам не надо?
> Если его не будет, это облегчит создание кластера?

Конечно! Соберёшь?
Comment 4 Alexey Shabalin 2020-04-04 20:10:53 MSK
В сизиф отправил corosync-3.0.3.0.18.g89b0d-alt2.
На новых установках corosync.conf быть не должно.
Comment 5 Alexander Makeenkov 2020-04-07 15:39:08 MSK
(Ответ для Alexey Shabalin на комментарий #4)
> В сизиф отправил corosync-3.0.3.0.18.g89b0d-alt2.
> На новых установках corosync.conf быть не должно.

Проверил инициализацию кластера в p9 с новым corosync из задания 249400.

Устанавливал с нуля из задания, файла конфига /etc/corosync/corosync.conf нет.

Но # crm cluster init nodes=hosta,hostb всё так же падает из-за ошибки "corosync[4602]:   [MAIN  ] parse error in config: No valid name found for local host".

Конфиг corosync.conf создаётся, но секции nodelist там нет.

# rpm -q corosync 
corosync-3.0.3.0.18.g89b0d-alt2.x86_64
Comment 6 Andrey Cherepanov 2020-04-07 18:46:32 MSK
(Ответ для Alexander Makeenkov на комментарий #5)
> (Ответ для Alexey Shabalin на комментарий #4)
> > В сизиф отправил corosync-3.0.3.0.18.g89b0d-alt2.
> > На новых установках corosync.conf быть не должно.
> 
> Проверил инициализацию кластера в p9 с новым corosync из задания 249400.
> 
> Устанавливал с нуля из задания, файла конфига /etc/corosync/corosync.conf
> нет.
> 
> Но # crm cluster init nodes=hosta,hostb всё так же падает из-за ошибки
> "corosync[4602]:   [MAIN  ] parse error in config: No valid name found for
> local host".
> 
> Конфиг corosync.conf создаётся, но секции nodelist там нет.
> 
> # rpm -q corosync 
> corosync-3.0.3.0.18.g89b0d-alt2.x86_64

Предлагаю этот пакет удалить, как сделали в Sisyphus.
Comment 7 Alexander Makeenkov 2023-01-20 16:00:18 MSK
crmsh-3.0.3-alt1 - ошибка воспроизводится.

В репозиториях p10 и sisyphus пакет удалён.