Bug 28390 - Ядро 3.7 - поломалась сетка (r8169)
Summary: Ядро 3.7 - поломалась сетка (r8169)
Status: CLOSED WORKSFORME
Alias: None
Product: Sisyphus
Classification: Development
Component: kernel-image-std-pae (show other bugs)
Version: unstable
Hardware: x86 Linux
: P3 normal
Assignee: Anton V. Boyarshinov
QA Contact: qa-sisyphus
URL:
Keywords:
: 28735 28936 28953 (view as bug list)
Depends on:
Blocks:
 
Reported: 2013-01-18 20:15 MSK by Sergei Naumov
Modified: 2015-04-14 21:05 MSK (History)
20 users (show)

See Also:


Attachments
Отчёт system-report (239.80 KB, application/octet-stream)
2013-01-25 06:36 MSK, Evgenii Terechkov
no flags Details

Note You need to log in before you can comment on or make changes to this bug.
Description Sergei Naumov 2013-01-18 20:15:41 MSK
После появления 3.7 (было на 3.7.2, сейчас на 3.7.3) заметил, что сетевой коннект поломан - байты либо не ходят вообще, либо время "пинга" ОЧЕНЬ велико, больше 20 секунд с периодическим пропаданием. При загрузке увидел вот такой дамп. На 3.6.11 таких проблем нет.

[   45.891324] WARNING: at net/sched/sch_generic.c:255 dev_watchdog+0x1f7/0x200()
[   45.891327] Hardware name: System Product Name
[   45.891329] NETDEV WATCHDOG: eth0 (r8169): transmit queue 0 timed out
[   45.891331] Modules linked in: nvidia(PO) nfsv4 auth_rpcgss nfs lockd sha256_generic sunrpc nls_utf8 cifs fscache pci_stub vboxpci(O) vboxnetadp(O) vboxnetflt(O) vboxdrv(O) rfcomm bnep ipv6 raid0
 joydev hid_generic usbhid hid btusb uinput bluetooth rfkill snd_hda_codec_hdmi snd_hda_codec_analog snd_hda_intel snd_hda_codec snd_hwdep snd_pcm ata_generic uhci_hcd snd_page_alloc pata_acpi fuse 
mvsas firewire_ohci ehci_hcd coretemp snd_timer iTCO_wdt pata_marvell crc32c_intel firewire_core r8169 libsas iTCO_vendor_support ide_pci_generic snd usbcore mxm_wmi i7core_edac crc_itu_t ide_core sr_mod scsi_transport_sas soundcore i2c_i801 edac_core lpc_ich cdrom mii usb_common acpi_cpufreq asus_atk0110 mperf rtc_cmos hwmon wmi microcode processor button pcspkr evdev dm_mod ext4 crc16 jbd2 mbcache sd_mod crc_t10dif
[   45.891401]  ahci libahci libata scsi_mod autofs4
[   45.891409] Pid: 0, comm: swapper/0 Tainted: P           O 3.7.3-std-pae-alt1 #1
[   45.891411] Call Trace:
[   45.891419]  [<c1038a0d>] warn_slowpath_common+0x6d/0xa0
[   45.891424]  [<c135e827>] ? dev_watchdog+0x1f7/0x200
[   45.891428]  [<c135e827>] ? dev_watchdog+0x1f7/0x200
[   45.891432]  [<c1038abe>] warn_slowpath_fmt+0x2e/0x30
[   45.891436]  [<c135e827>] dev_watchdog+0x1f7/0x200
[   45.891443]  [<c1046968>] call_timer_fn+0x28/0x100
[   45.891445]  [<c135e630>] ? dev_graft_qdisc+0x70/0x70
[   45.891447]  [<c104837c>] run_timer_softirq+0x1bc/0x260
[   45.891449]  [<c135e630>] ? dev_graft_qdisc+0x70/0x70
[   45.891452]  [<c1040f53>] __do_softirq+0xa3/0x1d0
[   45.891454]  [<c1040eb0>] ? local_bh_enable_ip+0x90/0x90
[   45.891455]  <IRQ>  [<c10411d5>] ? irq_exit+0x95/0xa0
[   45.891459]  [<c1022909>] ? smp_apic_timer_interrupt+0x59/0x90
[   45.891462]  [<c13f401d>] ? apic_timer_interrupt+0x2d/0x34
[   45.891466]  [<c12655fe>] ? intel_idle+0xbe/0x110
[   45.891469]  [<c131bef5>] ? cpuidle_enter+0x15/0x20
[   45.891471]  [<c131c3fc>] ? cpuidle_enter_state+0xc/0x40
[   45.891472]  [<c131c4bd>] ? cpuidle_idle_call+0x8d/0x220
[   45.891476]  [<c100a15c>] ? cpu_idle+0x5c/0xb0
[   45.891478]  [<c13d2bf2>] ? rest_init+0x72/0x80
[   45.891482]  [<c15f59f5>] ? start_kernel+0x376/0x37c
[   45.891483]  [<c15f54b4>] ? repair_env_string+0x51/0x51
[   45.891485]  [<c15f52d0>] ? i386_start_kernel+0xa6/0xad
[   45.891486] ---[ end trace 86ca7475dab91bd6 ]---
[   45.919557] r8169 0000:09:00.0 eth0: link up
Comment 1 Gleb F-Malinovskiy 2013-01-18 20:47:35 MSK
(В ответ на комментарий №0)
> После появления 3.7 (было на 3.7.2, сейчас на 3.7.3) заметил, что сетевой
> коннект поломан - байты либо не ходят вообще, либо время "пинга" ОЧЕНЬ велико,
> больше 20 секунд с периодическим пропаданием. При загрузке увидел вот такой
> дамп. На 3.6.11 таких проблем нет.

А что на std-def?
Comment 2 Sergei Naumov 2013-01-18 23:55:17 MSK
(В ответ на комментарий №1)
> (В ответ на комментарий №0)
> > После появления 3.7 (было на 3.7.2, сейчас на 3.7.3) заметил, что сетевой
> > коннект поломан - байты либо не ходят вообще, либо время "пинга" ОЧЕНЬ велико,
> > больше 20 секунд с периодическим пропаданием. При загрузке увидел вот такой
> > дамп. На 3.6.11 таких проблем нет.
> 
> А что на std-def?

То же самое, висит сетка. Заливал 3.7.2-alt1.1. Вернулся на 3.6.11-alt1.1 тут же все завелось...
Comment 3 Anton V. Boyarshinov 2013-01-24 11:08:29 MSK
Это сломано апстримом, я буду следить за развитием событий и как только появится патч...
Comment 4 Evgenii Terechkov 2013-01-25 06:36:14 MSK
Created attachment 5719 [details]
Отчёт system-report

Тоже столкнулся на 3.7.[24]-std-pae и сетевой r8169. Правда, дампа не видел (возможно, потому что указана опция quiet).

На 3.7.2 на линке видел только входящие броадкасты, arp ничего не резолвил, на 3.7.4 вообще tcpdump показывал только таймстампы с пустой строкой описания пакета и тоже ничего не работало.

Откатился на 3.6.11-std-pae.  На всякий случай прикладываю отчёт system-report.
Comment 5 Sergei Naumov 2013-03-09 10:07:40 MSK
(In reply to comment #3)
> Это сломано апстримом, я буду следить за развитием событий и как только
> появится патч...

В ветках 3.7.x проблема периодически исчезала и появлялась снова. Сейчас вот на ноуте запущен 3.7.10 вроде нормально (пишу вот сюда), а на десктопе накатил 3.8.2 и "опять двадцать пять". При пингах, кстати, пишет теперь не только "Destination Host Unreacable", а более осмысленное "No buffer space available".
Comment 6 Evgenii Terechkov 2013-03-23 07:24:46 MSK
*** Bug 28735 has been marked as a duplicate of this bug. ***
Comment 7 Andrei 2013-03-24 16:09:17 MSK
(В ответ на комментарий №6)
> *** Ошибка 28735 признана повтором этой ошибки. ***

Есть ли решение проблемы? Или только внешняя сетевуха?
Comment 8 Sergei Naumov 2013-03-24 21:06:18 MSK
(В ответ на комментарий №7)
> (В ответ на комментарий №6)
> > *** Ошибка 28735 признана повтором этой ошибки. ***
> 
> Есть ли решение проблемы? Или только внешняя сетевуха?


Внешнюю сетевуху не пробовал. Самое интересное, что в 3.8.3 и с новыми дровами проблема на 8169 исчезла, но она сохраняется на ноуте на "Интеле". Там уж никак внешнюю карку не прикрутишь, разве что через USB.
Comment 9 Andrei 2013-03-25 10:40:36 MSK
(В ответ на комментарий №8)
> Внешнюю сетевуху не пробовал. Самое интересное, что в 3.8.3 и с новыми дровами
> проблема на 8169 исчезла, но она сохраняется на ноуте на "Интеле". Там уж никак
> внешнюю карку не прикрутишь, разве что через USB.

Я сейчас установил внешнюю USB сетевую карту, все заработало. У меня только один раз сетевая карта работала на 3.8.3 ядре, но нестабильно. Сейчас все работает нормально через внешнюю карту.
Comment 10 Sergei Naumov 2013-03-31 13:39:07 MSK
На ноуте с Intel Corporation 82567LM Gigabit Network Connection обновил драйвер e1000e на 2.3.2 с сайта "Интела" и все завелось. Может и в "Сизифе" и бранчах сделать то же самое?
Comment 11 Sergei Naumov 2013-05-01 11:00:53 MSK
На момент 3.8.8-std-pae проблема сохранается для e1000e, причем странным образом. После инсталляции новой версии ядра и первой его загрузки тормозов не наблюдается. Последующие загрузки обнаруживают проблему. Лечиться только тем, что в течении 5 секунд после загрузки стартуется ping куда-нибудь. Тогда сетка остается живой. Странно очень...
Comment 12 Самойлов В.П. 2013-05-18 09:08:03 MSK
 А что вы скажете на это:
20.922419] r8169 Gigabit Ethernet driver 2.3LK-NAPI loaded
[   20.922635] r8169 0000:02:00.0: irq 43 for MSI/MSI-X
[   20.922815] r8169 0000:02:00.0 eth0: RTL8101e at 0xf9626000, 00:24:21:34:66:e7, XID 94300000 IRQ 43
Ошибку все заметили и прерывание?
Comment 13 Самойлов В.П. 2013-05-18 09:38:10 MSK
*** Bug 28936 has been marked as a duplicate of this bug. ***
Comment 14 Самойлов В.П. 2013-05-18 09:39:09 MSK
*** Bug 28953 has been marked as a duplicate of this bug. ***
Comment 16 Michael Shigorin 2013-10-17 22:02:34 MSK
Кто-нибудь может проверить, что с этим на нынешних ядрах (std-def, un-def, led-ws)?  У меня под рукой есть 10ec:8168 -- работает под 3.10.16-std-def-alt1@x86_64, да вроде и не ломалось.
Comment 17 Zerg 2013-10-17 22:53:20 MSK
У меня тоже 10ec:8168 работает на 3.10.16-std-def-alt1@i586 с тех пор, как починили.
Comment 18 Evgenii Terechkov 2013-10-18 03:46:42 MSK
10ec:8168 - не заметил, когда заработало.
Comment 19 Evgenii Terechkov 2013-10-18 03:48:58 MSK
(В ответ на комментарий №18)
> 10ec:8168 - не заметил, когда заработало.

на 3.10.16-std-pae@i686
Comment 20 Evgenii Terechkov 2015-04-14 05:29:55 MSK
RESOLVED-WORKSFORME?
Comment 21 Michael Shigorin 2015-04-14 21:05:51 MSK
На всякий напоминаю ещё вот этот commit message: http://git.altlinux.org/people/mike/packages/?p=mkimage-profiles.git;a=commit;h=49b6291a4080c80d2783529bad260732a90879c0

На попадающихся последнее время под руки 8168/8169 проблем не наблюдал будто.