Bug 27672

Summary: Отваливается сетевой интерфейс (e1000e) 2.6.32-ovz-el-alt40.M60P.2
Product: Branch p6 Reporter: Dmitriy Kruglikov <Dmitriy.Kruglikov>
Component: kernel-image-ovz-elAssignee: led
Status: CLOSED WONTFIX QA Contact: QA p6 <qa-p6>
Severity: critical    
Priority: P3 CC: aspsk, asy
Version: не указана   
Hardware: all   
OS: Linux   

Description Dmitriy Kruglikov 2012-08-27 11:13:09 MSK
Аналогично http://forum.openvz.org/index.php?t=tree&th=11008
но для модуля e1000e

Везде рекомендуют обновить ядро
Comment 1 Sergey Y. Afonin 2013-11-27 17:35:43 MSK
Именно с таким вот выводом от ядра ?

У меня просто
kernel: [13726837.683647] e1000e 0000:04:00.0: eth3: Reset adapter
kernel: [13726841.330965] e1000e: eth3 NIC Link is Up 100 Mbps Full Duplex, Flow Control: None
kernel: [13726841.340518] e1000e 0000:04:00.0: eth3: 10/100 speed: disabling TSO

Аналогично для igb:
kernel: [13720788.516739] igb 0000:08:00.0: eth0: Reset adapter
kernel: [13720791.053057] igb: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: RX
Comment 2 led 2013-11-28 00:57:56 MSK
(В ответ на комментарий №0)
> Везде рекомендуют обновить ядро

Так что происходит после обновления ядра?
Comment 3 Sergey Y. Afonin 2013-11-28 09:45:02 MSK
После обновления ядра плохо: Bug 29614.

А вот проблема с e1000e и igb, похоже, решается посредством pcie_aspm=off. 

На днях нашёл рекомендацию где-то в Интернет, позавчера вечером добавил, и, с тех пор, тишина. Правда с позавчерашнего вечера до, примерно, 15:00 ещё и ядро было ovz-el-2.6.32-alt88.M60P.1, но, потом, откатился из-за Bug 29614, а проблемы нет и с ovz-el-2.6.32-alt40.M60P.2 пока, 18 часов уже. А, до этого, максимальный перерыв между дёрганиями не превышал 4-х часов на протяжении нескольких месяцев. Собственно, как заметил и поставил на мониторинг, так что, когда началось на самом деле, сказать сложно. Видимо, давно.
Comment 4 led 2013-11-28 10:38:50 MSK
(В ответ на комментарий №3)
> После обновления ядра плохо: Bug 29614.
> 
> А вот проблема с e1000e и igb, похоже, решается посредством pcie_aspm=off. 
> 
> На днях нашёл рекомендацию где-то в Интернет, позавчера вечером добавил, и, с
> тех пор, тишина. Правда с позавчерашнего вечера до, примерно, 15:00 ещё и ядро
> было ovz-el-2.6.32-alt88.M60P.1, но, потом, откатился из-за Bug 29614, а
> проблемы нет и с ovz-el-2.6.32-alt40.M60P.2 пока, 18 часов уже. А, до этого,
> максимальный перерыв между дёрганиями не превышал 4-х часов на протяжении
> нескольких месяцев. Собственно, как заметил и поставил на мониторинг, так что,
> когда началось на самом деле, сказать сложно. Видимо, давно.

А с 2.6.32-alt107 ?
Comment 5 Sergey Y. Afonin 2013-11-28 10:56:09 MSK
(In reply to comment #4)

> А с 2.6.32-alt107 ?

Систему, где оно у меня часто проявляется, вообще плохо перегружать часто, а из-за проблем с шейпером совсем не хорошо ещё и оставлять надолго. :-(

Имеется ввиду проверка alt107 без pcie_aspm=off ?
Comment 6 Sergey Y. Afonin 2016-11-12 09:48:37 MSK
Наверное, надо закрыть. pcie_aspm=off явно помог тогда. Что касается упомянутого шейпера, оно починилось отключением tso/gso/gro (Bug 29614#c3). WONTFIX, но решение есть.