версия 4.2.5-P1 на двух серверах (dhcp-server-4.2.5-alt2) Конфиг обычный (порт один - 647) (secondary соотв. на втором) failover peer "failover-partner" { primary; address dhcp1.samges.ru; port 647; peer address dhcp2.samges.ru; peer port 647; max-response-delay 60; max-unacked-updates 10; mclt 3600; split 128; load balance max seconds 3; } При старте происходит такое: Jul 23 15:24:16 netboot dhcpd: failover peer failover-partner: I move from recover to startup Jul 23 15:24:16 netboot dhcpd: dhcpd startup succeeded Jul 23 15:24:22 netboot dhcpd: DHCPDISCOVER from 00:15:65:7f:9b:a9 via eth0: not responding (startup) Jul 23 15:24:31 netboot dhcpd: failover peer failover-partner: I move from startup to recover Jul 23 15:26:51 netboot dhcpd: DHCPDISCOVER from 00:15:65:7a:ae:d4 via eth0: not responding (recovering) Jul 23 15:26:52 netboot dhcpd: failover: link startup timeout И так повторяется бесконечно, адреса при этом не выдаются (считается, что сервер не может их выдавать пока он в состоянии recover). Длительность состояния должна бы определяться параметром mclt, уменьшал до 120 - не помогает. траффик между серверами ходит (видно по tcpdump), но все пакеты с length 0. на втором сервере всё то же самое: Jul 23 15:26:37 dhcp2 dhcpd: Wrote 0 leases to leases file. Jul 23 15:26:37 dhcp2 dhcpd: dhcpd startup succeeded Jul 23 15:26:37 dhcp2 dhcpd: failover peer failover-partner: I move from recover to startup Jul 23 15:26:52 dhcp2 dhcpd: failover peer failover-partner: I move from startup to recover Jul 23 15:26:52 dhcp2 dhcpd: failover: link startup timeout ждал минут по 10, пробовал разные варианты. похожее было в Fedora: https://bugzilla.redhat.com/show_bug.cgi?id=735103 So far it seems that the problem is in Fedora's change (bug #637017) in dhcp which allows us (since F15) to use system BIND libraries instead of bundled BIND libraries from dhcp sources. 4.3.1 из сизифа не пробовал.
Проверьте, пожалуйста: http://git.altlinux.org/tasks/174321/
Коллеги, посмотрите, пожалуйста на мой фикс
Коллеги, проверьте, пожалуйста, что эта сборка у вас ничего не сломала
Патч на bind http://git.altlinux.org/people/snejok/packages/bind.git?p=bind.git;a=commitdiff;h=1d72b684c5cbe2df95312d4f2d432c040c4c3c75 и пересборка dhcp с bind решает проблему Прошу приложить.
(In reply to comment #4) > Патч на bind > http://git.altlinux.org/people/snejok/packages/bind.git?p=bind.git;a=commitdiff;h=1d72b684c5cbe2df95312d4f2d432c040c4c3c75 > > и пересборка dhcp с bind решает проблему > > Прошу приложить. Объясните, пожалуйста, почему вы считаете, что этот патч ещё актуален.
(В ответ на комментарий №5) > Объясните, пожалуйста, почему вы считаете, что этот патч ещё актуален. С новой версией bind в Sisyphus и p8 еще не проверял. В ближайшее время проверю.
JFYI, в Федоре в тех библиотеках, с которыми собирается dhcp, этот патч все еще прикладывают.
(In reply to comment #7) > JFYI, в Федоре в тех библиотеках, с которыми собирается dhcp, этот патч все еще > прикладывают. Конечно, раз они сидят на 9.9 (In reply to comment #6) > (В ответ на комментарий №5) > > Объясните, пожалуйста, почему вы считаете, что этот патч ещё актуален. > > С новой версией bind в Sisyphus и p8 еще не проверял. > В ближайшее время проверю. Не надо проверять, всё и так уже ясно.
libisc-export-dhcp-9.9.9-alt2 -> sisyphus: * Wed Feb 01 2017 Mikhail Efremov <sem@altlinux> 9.9.9-alt2 - Fix failover initialization in dhcpd (closes: #31158). - Drop unneeded files. - Rename to libisc-export-dhcp. - Build export libraries only. * Sat Jan 07 2017 Dmitry V. Levin <ldv@altlinux> 9.9.9-alt1 - 9.9.8-P4 -> 9.9.9-P5. - Implemented early drop of linux capabilities. * Wed Nov 02 2016 Gleb F-Malinovskiy <glebfm@altlinux> 9.9.8-alt5 - Applied upstream fix for CVE-2016-8864.