Bug 21493 - Keepalived в режиме VRRP блокирует сетевой интерфейс.
Summary: Keepalived в режиме VRRP блокирует сетевой интерфейс.
Status: CLOSED NOTABUG
Alias: None
Product: Sisyphus
Classification: Development
Component: keepalived (show other bugs)
Version: unstable
Hardware: all Linux
: P3 critical
Assignee: Anton Farygin
QA Contact: qa-sisyphus
URL:
Keywords:
Depends on:
Blocks:
 
Reported: 2009-09-09 12:22 MSD by Sergey Alembekov
Modified: 2009-12-05 00:57 MSK (History)
3 users (show)

See Also:


Attachments

Note You need to log in before you can comment on or make changes to this bug.
Description Sergey Alembekov 2009-09-09 12:22:52 MSD
keepalived.conf:
global_defs {
   notification_email {
     admin@
    }
   notification_email_from vrrp1@
   smtp_server smtp
   smtp_connect_timeout 30
 }
 vrrp_instance VI_174 {
     state BACKUP
     interface bond0
     smtp_alert
     virtual_router_id 174
     priority 200
     advert_int 1
     authentication {
     auth_type PASS
     auth_pass 0000
     }
    virtual_ipaddress {
     192.168.0.174/27
     }
    virtual_routes {
     default via 192.168.0.161 dev bond0
     }
 }

 vrrp_instance VI_175 {
     state MASTER
     interface bond0
     smtp_alert
     virtual_router_id 175
     priority 250
     advert_int 1
     authentication {
       auth_type PASS
       auth_pass 0000
       }
     virtual_ipaddress {
       192.168.0.175/27
       }
     virtual_routes {
       default via 192.168.0.161 dev bond0
       }
 }

/etc/net/ifaces/bond0/options:
TYPE=bond
ONBOOT=yes
BOOTPROTO=static
HOST="eth0 eth1"
BONDOPTIONS="miimon=30 mode=1 primary=eth0"

/var/log/messages на момент "зависания":    
21:21:32 file4 Keepalived_healthcheckers: SIOCGMIIREG on eth0 failed: Input/output error
Sep  8 21:21:43 file4 Keepalived_vrrp: VRRP_Instance(VI_175) Received lower prio advert, forcing new election
Sep  8 21:21:43 file4 Keepalived_vrrp: VRRP_Instance(VI_175) Sending gratuitous ARPs on bond0 for 192.168.0.175

При этом сервер перестаёт отвечать по всем адресам, в том числе и по тем, которые не обслуживаются keepalived. С циски, к которой подключен eth0 видно, что link есть.
Если сделать порту на коммутаторе вкл-выкл, то всё приходит в норму.

keealived-1.1.17-alt2

2.6.27-ovz-smp-alt9
2.6.18-ovz-rhel-alt9

Железо: HP ProLiant DL180G6
07:00.0 Ethernet controller: Intel Corporation 82576 Gigabit Network Connection (rev 01)
07:00.1 Ethernet controller: Intel Corporation 82576 Gigabit Network Connection (rev 01)

Ничего похожего не наблюдается на HP ProLiant DL360G5, но там 2.6.30-std-def-alt10 и по ряду причин я не могу сейчас использовать ядро 2.6.30 на DL180
Comment 1 Denis Ovsienko 2009-09-09 13:33:46 MSD
Не имею готового объяснения, но поинтересуюсь, что видно на локальной консоли сервера. Куда деваются адреса, маршруты?
Comment 2 Sergey Alembekov 2009-09-10 10:48:18 MSD
Благодаря решению #21495 смог перейти на ядро 2.6.30-std-def-alt10. С тех пор ошибки в логах не появлялись.

(В ответ на комментарий №1)
> Не имею готового объяснения, но поинтересуюсь, что видно на локальной консоли
> сервера. Куда деваются адреса, маршруты?
У меня есть возможность оставить одну машину на 2.6.27 и попробую воспроизвести ошибку, но будет ли кто-то ей заниматься, если она воспроизводится только на 2.6.27?
Comment 3 Denis Ovsienko 2009-09-10 11:16:15 MSD
Как вам удобнее. Что на консоли?
Comment 4 Denis Ovsienko 2009-12-05 00:56:34 MSK
Замнём для ясности.