Bug 39518 - выполнение команды virsh -c lxc:/// list --all приводит к грубому закрытию запущеных доменов
Summary: выполнение команды virsh -c lxc:/// list --all приводит к грубому закрытию за...
Status: NEW
Alias: None
Product: Branch p9
Classification: Distributions
Component: libvirt (show other bugs)
Version: не указана
Hardware: x86_64 Linux
: P5 blocker
Assignee: Alexey Shabalin
QA Contact: qa-p9@altlinux.org
URL:
Keywords:
Depends on:
Blocks:
 
Reported: 2021-01-07 14:35 MSK by Gleb Kulikov
Modified: 2021-01-07 15:48 MSK (History)
0 users

See Also:


Attachments

Note You need to log in before you can comment on or make changes to this bug.
Description Gleb Kulikov 2021-01-07 14:35:33 MSK
выполнение команды virsh -c lxc:/// list --all приводит к грубому закрытию запущеных доменов

1. запускаем домен virsh -c lxc:/// start имя

всё нормально, домен работает.

выполнение virsh -c lxc:/// list --all показывает запущеный домен в спике работающих.

2. выжидаем не менее 15 минут

если ТЕПЕРЬ (т.е., после некоторой паузы) выполнить virsh -c lxc:/// list --all
то запущеный домен(ы) немедленно и грубо останавливаются.

далее они не будут доступны (в т.ч., не показываются в списке virsh ... list) 
до перезапуска libvirtd.

воспроизводится 100% на p9 (включая Сервер), Сизифе

проверялось в т.ч. на "чистой" установке на хостах amd и intel.

от содержимого контейнера не зависит.
Comment 1 Gleb Kulikov 2021-01-07 15:11:20 MSK
дополнение: к немедленному и грубому закрытию контейнеров приводит (через некоторое время после последнего использования virsh, это важно!) ЛЮБАЯ попытка использовать virsh.

это мегафейл...
Comment 2 Gleb Kulikov 2021-01-07 15:38:36 MSK
да, в журнале, при запущенных контейнерах:

ошибка службы: GetMachineByPID: PID 67872 does not belong to any known machine
ошибка службы: GetMachineByPID: PID 68065 does not belong to any known machine

libvirtd.service: Succeeded.

# ps aux | grep 67872

root       67872  0.0  0.0  35992 14728 ?        S    19:24   0:00 /usr/libexec/libvirt_lxc --name a77ipa --console 27 --security=none --handshake 31 --veth vnet1

# ps aux | grep 68065

root       68065  0.0  0.0  35992 14792 ?        S    19:24   0:00 /usr/libexec/libvirt_lxc --name SOGO20200912 --console 27 --security=none --handshake 34 --veth vnet2

при описываемой проблеме, в журнале только 

machine-lxc\x2d63437\x2dSOGO20200912.scope: Stopping timed out. Killing.

янв 07 18:29:30  systemd[1]: machine-lxc\x2d63437\x2dSOGO20200912.scope: Killing process 63439 (init) with signal SIGKILL.

янв 07 18:29:30  systemd[1]: machine-lxc\x2d63437\x2dSOGO20200912.scope: Failed with result 'timeout'.

янв 07 18:29:30  systemd[1]: Stopped Container lxc-63437-SOGO20200912.
янв 07 18:29:30  systemd[1]: machine-lxc\x2d63437\x2dSOGO20200912.scope: Consumed 3.106s CPU time.