Bug 41028 - Постоянное падение сервиса dnsmasq при запуске системы.
Summary: Постоянное падение сервиса dnsmasq при запуске системы.
Status: CLOSED FIXED
Alias: None
Product: Sisyphus
Classification: Development
Component: dnsmasq (show other bugs)
Version: unstable
Hardware: x86_64 Linux
: P5 major
Assignee: Mikhail Efremov
QA Contact: qa-sisyphus
URL:
Keywords:
Depends on:
Blocks:
 
Reported: 2021-09-29 19:03 MSK by Mikhail Chernonog
Modified: 2022-12-05 15:22 MSK (History)
8 users (show)

See Also:


Attachments
dnsmasq log (38.58 KB, text/x-log)
2021-09-30 10:41 MSK, Mikhail Chernonog
no flags Details
dnsmasq host2cat log (7.10 KB, text/x-log)
2021-11-03 10:54 MSK, Alexander Makeenkov
no flags Details
Дамп падения (468.00 KB, application/x-core)
2021-12-11 11:51 MSK, Andrey Cherepanov
no flags Details

Note You need to log in before you can comment on or make changes to this bug.
Description Mikhail Chernonog 2021-09-29 19:03:55 MSK
Образ:
alt-education-10.0alpha-20210726-x86_64

Шаги:
1. Установить систему в обычном профиле.
2. Запустить систему.

Реальный результат:
Система загружается успешно. Однако не стартует сервис dnsmasq.
systemctl status dnsmasq показывает следующее:
 сен 29 17:35:51 education-10-x86-64-alpha-20210929.localdomain systemd[1]: dnsmasq.service: Main process exited, code=killed, status=11/SEGV
сен 29 17:35:56 education-10-x86-64-alpha-20210929.localdomain dnsmasq-helper[2590]: Setup resolv.conf for local resolver:
сен 29 17:35:56 education-10-x86-64-alpha-20210929.localdomain dnsmasq-helper[2743]: Job for host2cat.service failed because the control process exited with error code.
сен 29 17:35:56 education-10-x86-64-alpha-20210929.localdomain dnsmasq-helper[2743]: See "systemctl status host2cat.service" and "journalctl -xeu host2cat.service" for details.
сен 29 17:35:56 education-10-x86-64-alpha-20210929.localdomain dnsmasq-helper[3184]: Setup resolv.conf for local resolver: failed
сен 29 17:35:56 education-10-x86-64-alpha-20210929.localdomain dnsmasq-helper[2590]: [FAILED]
сен 29 17:35:56 education-10-x86-64-alpha-20210929.localdomain dnsmasq-helper[3255]: Restore resolv.conf: succeeded
сен 29 17:35:56 education-10-x86-64-alpha-20210929.localdomain dnsmasq-helper[3185]: Restore resolv.conf: [ DONE ]
сен 29 17:35:56 education-10-x86-64-alpha-20210929.localdomain systemd[1]: dnsmasq.service: Failed with result 'signal'.
сен 29 17:35:56 education-10-x86-64-alpha-20210929.localdomain systemd[1]: Failed to start A lightweight DHCP and caching DNS server.

После ручного перезапуска сервиса, systemctl restart dnsmasq все успешно запущено и работает. Из-за этой ошибки не резолвятся адреса и в следствие чего не монтируются репозитории.

Данное поведение срабатывает не всегда, попробовал 10 раз из них 7 раз сервис не запускался. Есть предположение что при запуске системы начинают конфликтовать NetworkManager и dnsmasq.
Comment 1 Mikhail Efremov 2021-09-29 23:16:53 MSK
Что показывает journalctl -u dnsmasq?
Comment 2 Mikhail Chernonog 2021-09-30 10:41:12 MSK
Created attachment 9751 [details]
dnsmasq log
Comment 3 Mikhail Chernonog 2021-09-30 10:56:50 MSK
Приложил лог файл
Данная ошибка воспроизводится не стабильно, лог снят на свежеустановленной системе.
Comment 4 Mikhail Efremov 2021-09-30 11:27:13 MSK
Пока не видел такого. Попробую воспроизвести.
Comment 5 Anton Farygin 2021-09-30 12:02:19 MSK
а зачем вообще нужен host2cat.service в обычной системе при установке по умолчанию ?
Comment 6 Andrey Cherepanov 2021-09-30 20:32:37 MSK
(Ответ для Anton Farygin на комментарий #5)
> а зачем вообще нужен host2cat.service в обычной системе при установке по
> умолчанию ?

В Альт Образовании для netpolice. Унаследованное legacy.
Comment 7 Anton Farygin 2021-09-30 20:36:12 MSK
может быть, в связи с выпуском нового продукта его стоит убрать ?

На p9, кстати, такой ошибки не воспроизводится на Альт Образование.
Comment 8 Andrey Cherepanov 2021-11-03 10:22:10 MSK
(Ответ для Anton Farygin на комментарий #7)
> может быть, в связи с выпуском нового продукта его стоит убрать ?
> 
> На p9, кстати, такой ошибки не воспроизводится на Альт Образование.

И потерять основную фишку соблюдения 1447-р? Плохая идея. Напомню, в http://government.ru/docs/all/61556/ необходимо "Программное  обеспечение  для  исключения  доступа  учащихся к интернет-ресурсам, несовместимым с задачами их воспитания". Есть netpolice, хоть и старый.
Comment 9 Andrey Cherepanov 2021-11-03 10:23:48 MSK
(Ответ для Mikhail на комментарий #3)
> Приложил лог файл
> Данная ошибка воспроизводится не стабильно, лог снят на свежеустановленной
> системе.

А полный лог с падением host2cat можно?
Comment 10 Anton Farygin 2021-11-03 10:30:46 MSK
(Ответ для Andrey Cherepanov на комментарий #8)
> (Ответ для Anton Farygin на комментарий #7)
> > может быть, в связи с выпуском нового продукта его стоит убрать ?
> > 
> > На p9, кстати, такой ошибки не воспроизводится на Альт Образование.
> 
> И потерять основную фишку соблюдения 1447-р? Плохая идея. Напомню, в
> http://government.ru/docs/all/61556/ необходимо "Программное  обеспечение 
> для  исключения  доступа  учащихся к интернет-ресурсам, несовместимым с
> задачами их воспитания". Есть netpolice, хоть и старый.

Можно собрать то, что пришло на смену dansguardian - будет выполнять примерно ту же задачу.
Comment 11 Andrey Cherepanov 2021-11-03 10:35:40 MSK
(Ответ для Anton Farygin на комментарий #10)
> (Ответ для Andrey Cherepanov на комментарий #8)
> > (Ответ для Anton Farygin на комментарий #7)
> > > может быть, в связи с выпуском нового продукта его стоит убрать ?
> > > 
> > > На p9, кстати, такой ошибки не воспроизводится на Альт Образование.
> > 
> > И потерять основную фишку соблюдения 1447-р? Плохая идея. Напомню, в
> > http://government.ru/docs/all/61556/ необходимо "Программное  обеспечение 
> > для  исключения  доступа  учащихся к интернет-ресурсам, несовместимым с
> > задачами их воспитания". Есть netpolice, хоть и старый.
> 
> Можно собрать то, что пришло на смену dansguardian - будет выполнять
> примерно ту же задачу.

Там есть готовые правила фильтрации по принятым в образовании классам?
Comment 12 Anton Farygin 2021-11-03 10:42:13 MSK
Откуда же я знаю. Можешь глянуть - что-то готовое есть точно.
Comment 13 Alexander Makeenkov 2021-11-03 10:54:24 MSK
Created attachment 9904 [details]
dnsmasq host2cat log

(Ответ для Andrey Cherepanov на комментарий #9)
> (Ответ для Mikhail на комментарий #3)
> > Приложил лог файл
> > Данная ошибка воспроизводится не стабильно, лог снят на свежеустановленной
> > системе.
> 
> А полный лог с падением host2cat можно?

Во вложении.
Comment 14 Mikhail Efremov 2021-11-04 19:06:45 MSK
Вообще похоже, что падает именно dnsmasq, по идее host2cat не должен на это влиять: он вызывается из скрипта-subscriber'а openresolv и напрямую с dnsmasq не связан. Но мне пока не удалось это воспроизвести, и с установленным host2cat тоже. Попробую именно education поставить.
Comment 15 Andrey Cherepanov 2021-11-15 16:59:52 MSK
Падает также и при пробуждении из suspend to ram:
ноя 15 16:23:52 comp-core-i5-8265u systemd[1]: dnsmasq.service: Main process exited, code=killed, status=11/SEGV
ноя 15 16:23:53 comp-core-i5-8265u dnsmasq-helper[11467]: Restore resolv.conf: [ DONE ]
ноя 15 16:23:53 comp-core-i5-8265u systemd[1]: dnsmasq.service: Failed with result 'signal'.
Comment 16 Andrey Cherepanov 2021-12-11 11:51:05 MSK
           PID: 2447 (dnsmasq)
           UID: 485 (_dnsmasq)
           GID: 40 (dip)
        Signal: 11 (SEGV)
     Timestamp: Sat 2021-12-11 11:45:34 MSK (5min ago)
  Command Line: /usr/sbin/dnsmasq --bind-interfaces --interface lo -s comp-core-i5-8265u -l /var/lib/dhcp/dhcpd.leases -r /etc/resolv.conf.dnsmasq -u _dnsmasq -k --pid-file
    Executable: /usr/sbin/dnsmasq
 Control Group: /system.slice/dnsmasq.service
          Unit: dnsmasq.service
         Slice: system.slice
       Boot ID: 05f10ff4efd24309a80ed1a9009495b5
    Machine ID: 85684a69d24229cfa2e2e62c5eaa4de4
      Hostname: comp-core-i5-8265u
       Storage: /var/lib/systemd/coredump/core.dnsmasq.485.05f10ff4efd24309a80ed1a9009495b5.2447.1639212334000000.zst (present)
     Disk Size: 41.5K
       Message: Process 2447 (dnsmasq) of user 485 dumped core.
                
                Found module linux-vdso.so.1 with build-id: 3d59f4f9cdfa3176da40d242647e425aab6634de
                Found module libnss_files.so.2 with build-id: 926a79aed523b27109f410107ab7dc1db4f2555d
                Found module ld-linux-x86-64.so.2 with build-id: f3f3256627065eda0cf73a6e2f23b99b6bbd7527
                Found module libunistring.so.2 with build-id: 61a298470050bdf3a02bcea7b79fd817755aa5b1
                Found module libc.so.6 with build-id: d1395e72cd9cd805d770506887dac4e75525879d
                Found module libgmp.so.10 with build-id: 2430d5965775038c1a38767b0cb2dc49d308b200
                Found module libhogweed.so.6 with build-id: 9f438a6a3eb2ebb0971a023550ea6fbce6bf8782
                Found module libnettle.so.8 with build-id: 75589b9be04299d851180d4af5bda3c7a1c204c4
                Found module libidn2.so.0 with build-id: 6fd8550a47fb03c129924d5d49230cd86d7d0538
                Found module dnsmasq with build-id: ca2ecb66f3ff0a2f5c295c3521b5c0e40db510d5
                Stack trace of thread 2447:
                #0  0x000055bc1294f12e lookup_domain (dnsmasq + 0x5012e)
                #1  0x000055bc12920d3d forward_query (dnsmasq + 0x21d3d)
                #2  0x000055bc12921a4e receive_query (dnsmasq + 0x22a4e)
                #3  0x000055bc129267cb check_dns_listeners (dnsmasq + 0x277cb)
                #4  0x000055bc12907fbc main (dnsmasq + 0x8fbc)
                #5  0x00007f2e5c5aae2d __libc_start_main (libc.so.6 + 0x27e2d)
                #6  0x000055bc12908c0a _start (dnsmasq + 0x9c0a)
Comment 17 Andrey Cherepanov 2021-12-11 11:51:40 MSK
Created attachment 10056 [details]
Дамп падения
Comment 18 Andrey Cherepanov 2021-12-11 11:52:39 MSK
host2cat запущен, дамп возник после выхода из suspend2ram.
Comment 19 ruslandh 2022-04-29 12:48:59 MSK
А баги не связаны друг с другом ?
https://bugzilla.altlinux.org/39812
Comment 20 Mikhail Efremov 2022-09-27 19:17:14 MSK
(Ответ для ruslandh на комментарий #19)
> А баги не связаны друг с другом ?
> https://bugzilla.altlinux.org/39812

Нет.
Comment 21 Mikhail Efremov 2022-09-27 19:18:16 MSK
Имеет смысл проверить с dnsmasq-2.87, возможно зафикселось.
Comment 22 Mikhail Efremov 2022-09-28 13:22:01 MSK
(In reply to Mikhail Efremov from comment #21)
> Имеет смысл проверить с dnsmasq-2.87, возможно зафикселось.

Я даже больше скажу, проблема с достаточно большой вероятностью исправлена. Но пока подожду закрывать, посмотрим.
Comment 23 Yuri N. Sedunov 2022-09-28 13:28:34 MSK
Active: active (running) since Tue 2022-09-27 19:18:06 MSK; 18h ago

Проблем нет. Ура.
Comment 24 ruslandh 2022-09-28 13:38:40 MSK
Миша, а есть карман для p10 ? что-бы проверить ?
Comment 25 Mikhail Efremov 2022-09-28 19:02:46 MSK
(In reply to ruslandh from comment #24)
> Миша, а есть карман для p10 ? что-бы проверить ?

#307467 TESTED #1 [test-only] p10 dnsmasq.git=2.87-alt2
Comment 26 Mikhail Efremov 2022-10-14 15:12:18 MSK
Будем считать, что fixed.
Comment 27 Yuri N. Sedunov 2022-10-25 20:49:00 MSK
(Ответ для Yuri N. Sedunov на комментарий #23)
> Active: active (running) since Tue 2022-09-27 19:18:06 MSK; 18h ago
> 
> Проблем нет. Ура.

Щастье было недолгим. Проблемы с разрешением адресов продолжаются.

$ prepsrpm libgdk-pixbuf.spec 
~/RPM/SOURCES ~/RPM/SPECS/43
--2022-10-25 20:43:04--  https://download.gnome.org/sources/gdk-pixbuf/2.42/gdk-pixbuf-2.42.10.tar.xz
Распознаётся download.gnome.org (download.gnome.org)… ошибка: Неизвестное имя или служба.
wget: не удаётся разрешить адрес «download.gnome.org»
Comment 28 Mikhail Efremov 2022-10-25 23:07:18 MSK
Проблемы с резолвингом и падение dnsmasq это сильно разные вещи. Он упал с SIGSEGV?
Comment 29 Yuri N. Sedunov 2022-10-25 23:11:26 MSK
(Ответ для Mikhail Efremov на комментарий #28)
> Проблемы с резолвингом и падение dnsmasq это сильно разные вещи. Он упал с
> SIGSEGV?

Не на кого больше грешить, отказаться от него -- никак.
Что прислать?
Comment 30 Mikhail Efremov 2022-10-26 14:18:23 MSK
(In reply to Yuri N. Sedunov from comment #29)
> (Ответ для Mikhail Efremov на комментарий #28)
> > Проблемы с резолвингом и падение dnsmasq это сильно разные вещи. Он упал с
> > SIGSEGV?
> 
> Не на кого больше грешить, отказаться от него -- никак.
> Что прислать?

Лог, конечно.
journalctl -u dnsmasq
Comment 31 Yuri N. Sedunov 2022-10-26 19:39:11 MSK
В журнале не было ничего и до "исправления" этой баги.


-- Boot 0549fc593b334906acdd2bef71c54ce3 --
окт 23 05:00:25 siver systemd[1]: Starting A lightweight DHCP and caching DNS server...
окт 23 05:00:26 siver dnsmasq[2628]: started, version 2.87 cachesize 150
окт 23 05:00:26 siver dnsmasq[2628]: compile time options: IPv6 GNU-getopt no-DBus no-UBus no-i18n IDN2 DHCP DHCPv6 no-Lua TF>
окт 23 05:00:26 siver dnsmasq[2628]: no servers found in /etc/resolv.conf.dnsmasq, will retry
окт 23 05:00:26 siver dnsmasq[2628]: read /etc/hosts - 2 addresses
окт 23 05:00:29 siver dnsmasq-helper[2629]: Setup resolv.conf for local resolver:[ DONE ]
окт 23 05:00:29 siver systemd[1]: Started A lightweight DHCP and caching DNS server.
окт 23 05:00:32 siver dnsmasq[2628]: reading /etc/resolv.conf.dnsmasq
окт 23 05:00:32 siver dnsmasq[2628]: using nameserver 192.168.0.1#53
-- Boot 1392d793754b4bdd858d277f03beb95c --
окт 23 05:11:03 siver systemd[1]: Starting A lightweight DHCP and caching DNS server...
окт 23 05:11:04 siver dnsmasq[2691]: started, version 2.87 cachesize 150
окт 23 05:11:04 siver dnsmasq[2691]: compile time options: IPv6 GNU-getopt no-DBus no-UBus no-i18n IDN2 DHCP DHCPv6 no-Lua TF>
окт 23 05:11:04 siver dnsmasq[2691]: reading /etc/resolv.conf.dnsmasq
окт 23 05:11:04 siver dnsmasq[2691]: using nameserver 192.168.0.1#53
окт 23 05:11:04 siver dnsmasq[2691]: read /etc/hosts - 2 addresses
окт 23 05:11:05 siver dnsmasq[2691]: no servers found in /etc/resolv.conf.dnsmasq, will retry
окт 23 05:11:05 siver dnsmasq-helper[2692]: Setup resolv.conf for local resolver:[ DONE ]
окт 23 05:11:05 siver systemd[1]: Started A lightweight DHCP and caching DNS server.
окт 23 05:11:11 siver dnsmasq[2691]: reading /etc/resolv.conf.dnsmasq
окт 23 05:11:11 siver dnsmasq[2691]: using nameserver 192.168.0.1#53
Comment 32 Mikhail Efremov 2022-10-27 14:32:44 MSK
Ну если dnsmasq не падает, то это какая-то другая проблема, не имеющая отношения к этому багу.
Не резолвится только этот адрес или вообще никакие? Что в этот момент показывают
resolvconf -l
systemctl status dnsmasq 
Можно также напрямую обратиться к DNS-серверу (192.168.0.1 судя по логу) с помощью dig:
dig @192.168.0.1 download.gnome.org
и сравнить с тем, что отвечает dnsmasq на 127.0.0.1.
Если он не резолвит адрес, то dnsmasq точно не причем.
Comment 33 Yuri N. Sedunov 2022-10-28 23:41:18 MSK
(Ответ для Mikhail Efremov на комментарий #32)
> Ну если dnsmasq не падает, то это какая-то другая проблема, не имеющая
> отношения к этому багу.
> Не резолвится только этот адрес или вообще никакие? Что в этот момент
> показывают
> resolvconf -l
> systemctl status dnsmasq 
> Можно также напрямую обратиться к DNS-серверу (192.168.0.1 судя по логу) с
> помощью dig:
> dig @192.168.0.1 download.gnome.org
> и сравнить с тем, что отвечает dnsmasq на 127.0.0.1.
> Если он не резолвит адрес, то dnsmasq точно не причем.

Проблемы периодические, или спонтанные, не замерял, -- то download.gnome.org, то github.com, то gitlab*
Comment 34 Mikhail Efremov 2022-12-05 15:22:30 MSK
> Проблемы периодические, или спонтанные, не замерял, -- то
> download.gnome.org, то github.com, то gitlab*

Есть вероятность, что это баг в 2.87, который исправлен в 2.88.
Но в любом случае к этому багу эта проблема никакого отношения не имеет.
Если она воспроизводится с 2.88, то откройте новый баг, пожалуйста.