Bug 31158 - dhcpd: failover: link startup timeout
Summary: dhcpd: failover: link startup timeout
Status: CLOSED FIXED
Alias: None
Product: Sisyphus
Classification: Development
Component: bind (show other bugs)
Version: unstable
Hardware: all Linux
: P3 normal
Assignee: placeholder@altlinux.org
QA Contact: qa-sisyphus
URL: https://bugzilla.redhat.com/show_bug....
Keywords:
Depends on:
Blocks:
 
Reported: 2015-07-23 15:44 MSK by Mike Lykov
Modified: 2017-02-01 22:29 MSK (History)
8 users (show)

See Also:


Attachments

Note You need to log in before you can comment on or make changes to this bug.
Description Mike Lykov 2015-07-23 15:44:57 MSK
версия 4.2.5-P1 на двух серверах
(dhcp-server-4.2.5-alt2)

Конфиг обычный (порт один - 647)
(secondary соотв. на втором)

failover peer "failover-partner" {
        primary;
        address dhcp1.samges.ru;
        port 647;
        peer address dhcp2.samges.ru;
        peer port 647;
        max-response-delay 60;
        max-unacked-updates 10;
        mclt 3600;
        split 128;
        load balance max seconds 3;
    }

При старте происходит такое:

Jul 23 15:24:16 netboot dhcpd: failover peer failover-partner: I move from recover to startup
Jul 23 15:24:16 netboot dhcpd: dhcpd startup succeeded
Jul 23 15:24:22 netboot dhcpd: DHCPDISCOVER from 00:15:65:7f:9b:a9 via eth0: not responding (startup)
Jul 23 15:24:31 netboot dhcpd: failover peer failover-partner: I move from startup to recover
Jul 23 15:26:51 netboot dhcpd: DHCPDISCOVER from 00:15:65:7a:ae:d4 via eth0: not responding (recovering)
Jul 23 15:26:52 netboot dhcpd: failover: link startup timeout

И так повторяется бесконечно, адреса при этом не выдаются (считается, что сервер не может их выдавать пока он в состоянии recover).

Длительность состояния должна бы определяться параметром mclt, уменьшал до 120 - не помогает.

траффик между серверами ходит (видно по tcpdump), но все пакеты с length 0.

на втором сервере всё то же самое:
Jul 23 15:26:37 dhcp2 dhcpd: Wrote 0 leases to leases file.
Jul 23 15:26:37 dhcp2 dhcpd: dhcpd startup succeeded
Jul 23 15:26:37 dhcp2 dhcpd: failover peer failover-partner: I move from recover to startup
Jul 23 15:26:52 dhcp2 dhcpd: failover peer failover-partner: I move from startup to recover
Jul 23 15:26:52 dhcp2 dhcpd: failover: link startup timeout

ждал минут по 10, пробовал разные варианты.

похожее было в Fedora:
https://bugzilla.redhat.com/show_bug.cgi?id=735103

So far it seems that the problem is in Fedora's change (bug #637017) in dhcp which allows us (since F15) to use system BIND libraries instead of bundled BIND libraries from dhcp sources.

4.3.1 из сизифа не пробовал.
Comment 1 Lenar Shakirov 2016-12-13 11:13:07 MSK
Проверьте, пожалуйста:
http://git.altlinux.org/tasks/174321/
Comment 2 Lenar Shakirov 2016-12-13 11:16:22 MSK
Коллеги, посмотрите, пожалуйста на мой фикс
Comment 3 Lenar Shakirov 2016-12-13 17:19:27 MSK
Коллеги, проверьте, пожалуйста, что эта сборка у вас ничего не сломала
Comment 4 Lenar Shakirov 2017-01-19 20:50:14 MSK
Патч на bind
http://git.altlinux.org/people/snejok/packages/bind.git?p=bind.git;a=commitdiff;h=1d72b684c5cbe2df95312d4f2d432c040c4c3c75

и пересборка dhcp с bind решает проблему

Прошу приложить.
Comment 5 Dmitry V. Levin 2017-01-28 12:27:03 MSK
(In reply to comment #4)
> Патч на bind
> http://git.altlinux.org/people/snejok/packages/bind.git?p=bind.git;a=commitdiff;h=1d72b684c5cbe2df95312d4f2d432c040c4c3c75
> 
> и пересборка dhcp с bind решает проблему
> 
> Прошу приложить.

Объясните, пожалуйста, почему вы считаете, что этот патч ещё актуален.
Comment 6 Lenar Shakirov 2017-01-28 13:35:21 MSK
(В ответ на комментарий №5)
> Объясните, пожалуйста, почему вы считаете, что этот патч ещё актуален.

С новой версией bind в Sisyphus и p8 еще не проверял.
В ближайшее время проверю.
Comment 7 Mikhail Efremov 2017-01-31 20:13:01 MSK
JFYI, в Федоре в тех библиотеках, с которыми собирается dhcp, этот патч все еще прикладывают.
Comment 8 Dmitry V. Levin 2017-01-31 20:17:16 MSK
(In reply to comment #7)
> JFYI, в Федоре в тех библиотеках, с которыми собирается dhcp, этот патч все еще
> прикладывают.

Конечно, раз они сидят на 9.9

(In reply to comment #6)
> (В ответ на комментарий №5)
> > Объясните, пожалуйста, почему вы считаете, что этот патч ещё актуален.
> 
> С новой версией bind в Sisyphus и p8 еще не проверял.
> В ближайшее время проверю.

Не надо проверять, всё и так уже ясно.
Comment 9 Repository Robot 2017-02-01 22:29:33 MSK
libisc-export-dhcp-9.9.9-alt2 -> sisyphus:

* Wed Feb 01 2017 Mikhail Efremov <sem@altlinux> 9.9.9-alt2
- Fix failover initialization in dhcpd (closes: #31158).
- Drop unneeded files.
- Rename to libisc-export-dhcp.
- Build export libraries only.

* Sat Jan 07 2017 Dmitry V. Levin <ldv@altlinux> 9.9.9-alt1
- 9.9.8-P4 -> 9.9.9-P5.
- Implemented early drop of linux capabilities.

* Wed Nov 02 2016 Gleb F-Malinovskiy <glebfm@altlinux> 9.9.8-alt5
- Applied upstream fix for CVE-2016-8864.