Bug 30772

Summary: Кладётся сеть.
Product: Sisyphus Reporter: Горев Андрей <nekapitan2009>
Component: systemdAssignee: Alexey Shabalin <shaba>
Status: CLOSED NOTABUG QA Contact: qa-sisyphus
Severity: critical    
Priority: P3 CC: arseny, evg, mike, shaba
Version: unstableKeywords: systemd
Hardware: all   
OS: Linux   

Description Горев Андрей 2015-02-24 07:48:57 MSK
Кладётся сеть полностью. Остаётся только мост virbr0 живым.
Всё происходит после завершения вручную запущенного pppd.
Вручную же приходится пускать из-за того что systemd НЕ поддеррживает функцию
respawn из /etc/inittab. Описывать в etcnet pppd смысла нет - там тоже нет такой
поддержки.
   Выглядит в /etc/inittab так:
p0:345:respawn:/usr/sbin/pppd call megaphone >/dev/null 2>&1

   Суть идеи: появляется устройство /dev/ttyUSB0_utps_modem => запускается pppd
=> появляется ppp интерфейс.

   Вторая проблема с aiccu. Не встаёт после падения (если ему что-то не нравится
он кладётся сам - его функция). Решал эту проблему так же через respawn.

   После падения сети ложатся и ВСЁ связанное с сетью: zebra, ospfd, и так далее.

   Проблема и с ntpd. Не путать с openntpd - его не использую. Суть: запущеннный со старой sys5init - норма. ntpdc в этом случае работает без вопросов.
Если запущен из systemd ntpdc НЕ работает. Идёт timeout типа не может соединиться с ntpd.
 
   ВСЕ настройки ВСЕХ даемонов остались прежними. Как до установки systemd, потянутым одним из пакетов при установке за собой. Пакет нужен, systemd после таких выкрутасов - НЕТ!
Comment 1 Alexey Shabalin 2015-02-26 18:33:47 MSK
Боюсь что мне вашу проблему повторить будет сложно.
Как минимум не понятно что значит "кладет сеть полностью".
Какой вывод команд "ip a", "ip r" до и после.
Я запускаю ppp(для pptp с аутентификацией по eToken) вручную под systemd - никаких проблем не испытываю.
Мало информации от Вас, что бы сделать какое-то предположение.
Проблему с ntp - вешайте на пакет ntp.
И никто не должен заставлять переходить на systemd, если он к вам прилител автоматически, значит это ошибка и надо разбираться кто его вытянул по зависимостям.
Comment 2 Горев Андрей 2015-03-06 07:05:33 MSK
 После гашения pppd маршрут выглядит вот так:
192.168.122.0/24 dev virbr0  proto kernel  scope link  src 192.168.122.1 

  До:
default via 10.135.66.1 dev enp3s0  proto zebra 
10.0.100.0/24 dev enp3s0  proto zebra 
10.11.0.0/16 dev enp3s0  proto zebra 
10.128.0.0/16 dev enp3s0  proto zebra 
10.135.0.0/16 dev enp3s0  proto zebra 
10.135.66.0/23 dev enp3s0  proto kernel  scope link  src 10.135.66.152  metric 1 
172.16.0.0/12 dev enp3s0  proto zebra 
192.168.0.0/16 dev enp3s0  proto zebra 
192.168.122.0/24 dev virbr0  proto kernel  scope link  src 192.168.122.1 
192.168.223.0/24 dev vlan2  proto kernel  scope link  src 192.168.223.1 
192.168.229.0/24 dev vlan3  proto kernel  scope link  src 192.168.229.1 
192.168.230.0/30 via 192.168.223.2 dev vlan2  proto zebra  metric 11211 

    После падения сети приходится выполнять её полный перезапуск (основного):
systemctl restart network
systemctl restart firehol
systemctl restart ospfd
systemctl restart zebra
Comment 3 Горев Андрей 2015-03-06 07:06:52 MSK
  Забыл! ip a показывает что все адреса стёрты, кроме virbr0. Ещё остаются адреса ipv6 на aiccu. И сам интерфейс.
Comment 4 Горев Андрей 2015-03-06 07:11:18 MSK
  Когда запущен pppd default маршрут стоит на него. Выше был маршрут до запуска pppd. Там default стоит на enp3s0. При запуске pppd zebra default маршрут переставляет на ppp0.
  До установки systemd (потянутым пакетом) zebra восстанавливала default без вопросов, но так как адреса вычищаются... Короче, жопа.
Comment 5 Горев Андрей 2015-03-06 07:15:36 MSK
    А вот ЧТО потянуло systemd:
	/bin/systemctl   is needed by openstack-neutron-2014.1.2-alt2
	/bin/systemctl   is needed by cloud-init-0.6.3-alt1
    Начальству захотелось попробовать своё облако для корпоративных целей поднять.
Первый пакет не знаю. Ставили без меня всё.
Comment 6 Горев Андрей 2015-03-06 07:57:24 MSK
Выдержка из /var/log/daemon/info (как выглядит ПОСЛЕ гашения pppd):
Mar  5 16:44:45 pc00447 pppd[15161]: sending SIGTERM to process 8777
Mar  5 16:44:45 pc00447 pppd[15161]: Exit.
Mar  5 16:44:46 pc00447 charon: 09[KNL] 2001:15c0:65ff:8455::1 disappeared from enp3s0 
Mar  5 16:44:46 pc00447 charon: 03[KNL] interface enp3s0 deactivated 
Mar  5 16:44:46 pc00447 charon: 14[KNL] fe80::e23f:49ff:fe16:7b4a disappeared from enp3s0 
Mar  5 16:44:46 pc00447 charon: 03[KNL] creating roam job due to address/link change 
Mar  5 16:44:47 pc00447 ntpd[6871]: Deleting interface #20 enp3s0, 10.135.66.152#123, interface stats: received=1182, sent=1449, dropped=12, ac
tive_time=86029 secs
Mar  5 16:44:47 pc00447 ntpd[6871]: Deleting interface #21 vlan2, 192.168.223.1#123, interface stats: received=107, sent=107, dropped=0, active_time=86029 secs
Mar  5 16:44:47 pc00447 ntpd[6871]: Deleting interface #22 vlan3, 192.168.229.1#123, interface stats: received=0, sent=0, dropped=0, active_time=86029 secs
Mar  5 16:44:47 pc00447 ntpd[6871]: Deleting interface #23 enp2s0, fe80::12fe:edff:fe03:829b%6#123, interface stats: received=0, sent=0, dropped=0, active_time=86029 secs
Mar  5 16:44:47 pc00447 ntpd[6871]: Deleting interface #24 enp3s0, 2001:15c0:65ff:8455::1#123, interface stats: received=0, sent=0, dropped=0, active_time=86029 secs
Mar  5 16:44:47 pc00447 ntpd[6871]: Deleting interface #25 enp3s0, fe80::e23f:49ff:fe16:7b4a%7#123, interface stats: received=0, sent=0, dropped=0, active_time=86029 secs
Mar  5 16:44:47 pc00447 ntpd[6871]: Deleting interface #26 vlan2, fe80::12fe:edff:fe03:829b%17#123, interface stats: received=0, sent=0, dropped=0, active_time=86029 secs
Mar  5 16:44:47 pc00447 ntpd[6871]: Deleting interface #27 vlan3, fe80::12fe:edff:fe03:829b%18#123, interface stats: received=0, sent=0, dropped=0, active_time=86029 secs
Mar  5 16:45:07 pc00447 /etc/net: ERROR: /etc/rc.d/init.d/network: unknown interface group for iface 'venet0' of type 'venet'
Mar  5 16:45:08 pc00447 charon: 12[KNL] interface enp3s0 activated 
Mar  5 16:45:08 pc00447 charon: 15[KNL] interface enp3s0 deactivated 
Mar  5 16:45:07 pc00447 /etc/net: ERROR: /etc/rc.d/init.d/network: unknown interface group for iface 'venet0' of type 'venet'
Mar  5 16:45:08 pc00447 charon: 12[KNL] interface enp3s0 activated 
Mar  5 16:45:08 pc00447 charon: 15[KNL] interface enp3s0 deactivated 
Mar  5 16:45:08 pc00447 charon: 12[KNL] creating roam job due to address/link change 
Mar  5 16:45:08 pc00447 charon: 08[KNL] creating roam job due to route change 
Mar  5 16:45:08 pc00447 charon: 11[KNL] 127.0.0.1 disappeared from lo 
Mar  5 16:45:08 pc00447 charon: 12[KNL] interface lo deactivated 
Mar  5 16:45:08 pc00447 charon: 09[KNL] ::1 disappeared from lo 
Mar  5 16:45:08 pc00447 charon: 11[KNL] creating roam job due to address/link change 
Mar  5 16:45:08 pc00447 /etc/net: ERROR: /etc/net/scripts/config-fw: Can't unload module ip_conntrack_ftp
Mar  5 16:45:09 pc00447 /etc/net: ERROR: /etc/rc.d/init.d/network: unknown interface group for iface 'venet0' of type 'venet'
Mar  5 16:45:08 pc00447 charon: 12[KNL] interface enp3s0 activated 
Mar  5 16:45:08 pc00447 charon: 15[KNL] interface enp3s0 deactivated 
Mar  5 16:45:08 pc00447 charon: 12[KNL] creating roam job due to address/link change 
Mar  5 16:45:08 pc00447 charon: 08[KNL] creating roam job due to route change 
Mar  5 16:45:08 pc00447 charon: 11[KNL] 127.0.0.1 disappeared from lo 
Mar  5 16:45:08 pc00447 charon: 12[KNL] interface lo deactivated 
Mar  5 16:45:08 pc00447 charon: 09[KNL] ::1 disappeared from lo 
Mar  5 16:45:08 pc00447 charon: 11[KNL] creating roam job due to address/link change 
Mar  5 16:45:08 pc00447 /etc/net: ERROR: /etc/net/scripts/config-fw: Can't unload module ip_conntrack_ftp
Mar  5 16:45:09 pc00447 /etc/net: ERROR: /etc/rc.d/init.d/network: unknown interface group for iface 'venet0' of type 'venet'


    Может поможет?
Comment 7 Evgenii Terechkov 2015-03-06 08:27:24 MSK
Судя по логу кажется, что вы пытаетесь запустить systemd (вместе с openstack) на ядре ovz (судя по упоминанием venet). Systemd требуется ядро новее 3.7.

Вообще же Алексей прав - разобраться в этой каше практически нереально.
Comment 8 Alexey Shabalin 2015-03-06 10:51:40 MSK
а что такое charon? что-то от zebra? Нет ли еще какой подсистемы управления интерфейсами? нет ли каких дополнительных скриптов post-down для etcnet или pppd?

советов несколько:
- openstack на сизифе не рабочий, в сизифе слишком новая SQLAlchemy, старый openstack с ним не работает. Я в ближайшее время буду обновлять openstack в сизифе. Так же собираюсь добавить init скрипты, что бы не было зависимости на systemd.
- не используйте systemd на ядрах ovz, они слишком старые
- я так и не понял, кто у вас управляет сетью, если это etcnet, то какие вопросы к systemd? :)
Comment 9 Evgenii Terechkov 2015-03-06 11:16:55 MSK
charon это часть strongswan, на сеть не должен бы никак влиять.
Comment 10 Alexey Shabalin 2015-07-22 20:19:07 MSK
В общем надо отделить мух от котлет, выявить виновника и его чинить. В этом сумбуре что-либо понять не возможно.
Comment 11 Michael Shigorin 2015-07-23 16:41:53 MSK
"Пробовать" что-либо достаточно незнакомое на рабочей системе -- также плохая идея, особенно если отвечает за неё один, а "пробует" другой...