| Summary: | dhcpd: failover: link startup timeout | ||
|---|---|---|---|
| Product: | Sisyphus | Reporter: | Mike Lykov <combr> |
| Component: | bind | Assignee: | placeholder <placeholder> |
| Status: | CLOSED FIXED | QA Contact: | qa-sisyphus |
| Severity: | normal | ||
| Priority: | P3 | CC: | george, glebfm, ldv, mike, placeholder, sem, slev, snejok, vt |
| Version: | unstable | ||
| Hardware: | all | ||
| OS: | Linux | ||
| URL: | https://bugzilla.redhat.com/show_bug.cgi?id=735103 | ||
Проверьте, пожалуйста: http://git.altlinux.org/tasks/174321/ Коллеги, посмотрите, пожалуйста на мой фикс Коллеги, проверьте, пожалуйста, что эта сборка у вас ничего не сломала Патч на bind http://git.altlinux.org/people/snejok/packages/bind.git?p=bind.git;a=commitdiff;h=1d72b684c5cbe2df95312d4f2d432c040c4c3c75 и пересборка dhcp с bind решает проблему Прошу приложить. (In reply to comment #4) > Патч на bind > http://git.altlinux.org/people/snejok/packages/bind.git?p=bind.git;a=commitdiff;h=1d72b684c5cbe2df95312d4f2d432c040c4c3c75 > > и пересборка dhcp с bind решает проблему > > Прошу приложить. Объясните, пожалуйста, почему вы считаете, что этот патч ещё актуален. (В ответ на комментарий №5)
> Объясните, пожалуйста, почему вы считаете, что этот патч ещё актуален.
С новой версией bind в Sisyphus и p8 еще не проверял.
В ближайшее время проверю.
JFYI, в Федоре в тех библиотеках, с которыми собирается dhcp, этот патч все еще прикладывают. (In reply to comment #7) > JFYI, в Федоре в тех библиотеках, с которыми собирается dhcp, этот патч все еще > прикладывают. Конечно, раз они сидят на 9.9 (In reply to comment #6) > (В ответ на комментарий №5) > > Объясните, пожалуйста, почему вы считаете, что этот патч ещё актуален. > > С новой версией bind в Sisyphus и p8 еще не проверял. > В ближайшее время проверю. Не надо проверять, всё и так уже ясно. libisc-export-dhcp-9.9.9-alt2 -> sisyphus: * Wed Feb 01 2017 Mikhail Efremov <sem@altlinux> 9.9.9-alt2 - Fix failover initialization in dhcpd (closes: #31158). - Drop unneeded files. - Rename to libisc-export-dhcp. - Build export libraries only. * Sat Jan 07 2017 Dmitry V. Levin <ldv@altlinux> 9.9.9-alt1 - 9.9.8-P4 -> 9.9.9-P5. - Implemented early drop of linux capabilities. * Wed Nov 02 2016 Gleb F-Malinovskiy <glebfm@altlinux> 9.9.8-alt5 - Applied upstream fix for CVE-2016-8864. |
версия 4.2.5-P1 на двух серверах (dhcp-server-4.2.5-alt2) Конфиг обычный (порт один - 647) (secondary соотв. на втором) failover peer "failover-partner" { primary; address dhcp1.samges.ru; port 647; peer address dhcp2.samges.ru; peer port 647; max-response-delay 60; max-unacked-updates 10; mclt 3600; split 128; load balance max seconds 3; } При старте происходит такое: Jul 23 15:24:16 netboot dhcpd: failover peer failover-partner: I move from recover to startup Jul 23 15:24:16 netboot dhcpd: dhcpd startup succeeded Jul 23 15:24:22 netboot dhcpd: DHCPDISCOVER from 00:15:65:7f:9b:a9 via eth0: not responding (startup) Jul 23 15:24:31 netboot dhcpd: failover peer failover-partner: I move from startup to recover Jul 23 15:26:51 netboot dhcpd: DHCPDISCOVER from 00:15:65:7a:ae:d4 via eth0: not responding (recovering) Jul 23 15:26:52 netboot dhcpd: failover: link startup timeout И так повторяется бесконечно, адреса при этом не выдаются (считается, что сервер не может их выдавать пока он в состоянии recover). Длительность состояния должна бы определяться параметром mclt, уменьшал до 120 - не помогает. траффик между серверами ходит (видно по tcpdump), но все пакеты с length 0. на втором сервере всё то же самое: Jul 23 15:26:37 dhcp2 dhcpd: Wrote 0 leases to leases file. Jul 23 15:26:37 dhcp2 dhcpd: dhcpd startup succeeded Jul 23 15:26:37 dhcp2 dhcpd: failover peer failover-partner: I move from recover to startup Jul 23 15:26:52 dhcp2 dhcpd: failover peer failover-partner: I move from startup to recover Jul 23 15:26:52 dhcp2 dhcpd: failover: link startup timeout ждал минут по 10, пробовал разные варианты. похожее было в Fedora: https://bugzilla.redhat.com/show_bug.cgi?id=735103 So far it seems that the problem is in Fedora's change (bug #637017) in dhcp which allows us (since F15) to use system BIND libraries instead of bundled BIND libraries from dhcp sources. 4.3.1 из сизифа не пробовал.