после обновления с 2.6.18-std-smp-alt8 до kernel-image-std-smp-2.6.18-alt12.i586 в выводе ifconfig стали появляться RX overruns. На сетевой карте висит 2 влана и 5 алиасов
Created attachment 2445 [details] вывод dmesg
Created attachment 2446 [details] lspci
Похоже на последствия обновления skge, приехавшего в 2.6.18-std-smp-alt10: + skge: backported bugfixes from 2.6.22-rc1 (lakostis@) 0d99e11... Merge branch 'fix-drivers-net--skge' into kernel-image-std-smp a3d0649... backport e3b7df17c8344fbcc00e871e03f5f88d58905277 commit: 9b9e632... skge: transmit locking improvements edcc598... skge: turn carrier off when down 282e015... merge 9cbe330f1fbbc8de15a5914aa6e91d89eb9daac4 commit: d128960... skge: mask irqs when device down 774e53b... skge: deadlock on tx timeout 8e8215c... skge: set mac address bonding fix eaa332b... skge: comma consistency e51065e... skge: fix transmitter flow control 3369bb8... skge: race with workq and RTNL d3349f5... skge: handle zero address at open 80470ea... [netdrvr] skge: build fix 1a1dc8b... [PATCH] skge: don't clear MC state on link down 3ca91e6... [PATCH] skge: version 1.9 e2ee7f8... [PATCH] skge: better flow control negotiation 532ce90... [PATCH] skge: pause mapping for fiber f3cc5df... [PATCH] skge: fix stuck irq when fiber down e641de3... [PATCH] skge: fiber support 2e140e0... [PATCH] skge: check for PCI hotplug during IRQ b5ba57d... [PATCH] skge: version 1.8 d7c117e... [PATCH] skge: use NAPI for transmit complete cc67e64... [PATCH] skge: irq lock race e9789bf... [PATCH] skge: use netdev_alloc_skb 85347af... [PATCH] skge: version 1.7 ae4332d... [PATCH] skge: use ethX for irq assigments ffbc2d8... [PATCH] skge: use dev_alloc_skb 0185af4... [PATCH] skge: pci bus post fixes a1cb13e... [PATCH] skge: cleanup suspend/resume code
А можно ещё увидеть статистику проблемного интерфейса (ifconfig eth0, ethtool -S eth0)?
[root@light ~]# ethtool -S eth0 NIC statistics: tx_bytes: 5524685987247 rx_bytes: 1407725040399 tx_broadcast: 20 rx_broadcast: 768954 tx_multicast: 0 rx_multicast: 0 tx_unicast: 3841303968 rx_unicast: 2963423349 tx_mac_pause: 0 rx_mac_pause: 0 collisions: 0 multi_collisions: 0 aborted: 0 late_collision: 0 fifo_underrun: 0 fifo_overflow: 353 rx_toolong: 0 rx_jabber: 0 rx_runt: 0 rx_too_long: 0 rx_fcs_error: 0 [root@light ~]# ifconfig eth0 eth0 Link encap:Ethernet HWaddr 00:1B:FC:9E:0F:63 UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 RX packets:2964303514 errors:0 dropped:0 overruns:365 frame:0 TX packets:3841502277 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:1000 RX bytes:3279031262 (3.0 GiB) TX bytes:1654188794 (1.5 GiB) Interrupt:217
Да и просто вывод ethtool eth0 не помешает. "skge eth0: Link is up at 1000 Mbps, full duplex, flow control none" - аналогичный вывод от старого ядра не сохранился? там тоже flow control none?
К сожалению не сохранился. Но припоминается что таки был включен. [root@light ~]# ethtool eth0 Settings for eth0: Supported ports: [ TP ] Supported link modes: 10baseT/Half 10baseT/Full 100baseT/Half 100baseT/Full 1000baseT/Half 1000baseT/Full Supports auto-negotiation: Yes Advertised link modes: 10baseT/Half 10baseT/Full 100baseT/Half 100baseT/Full 1000baseT/Half 1000baseT/Full Advertised auto-negotiation: Yes Speed: 1000Mb/s Duplex: Full Port: Twisted Pair PHYAD: 0 Transceiver: internal Auto-negotiation: on Supports Wake-on: g Wake-on: d Current message level: 0x00000037 (55) Link detected: yes
Хм, как раз в районе flow control в драйвере что-то меняли. Что сейчас показывает ethtool -a eth0 (вроде бы в этом драйвере оно поддерживается)? Кстати, насколько сильно эти RX overruns (или не они) влияют на скорость?
[root@light ~]# ethtool -a eth0 Pause parameters for eth0: Autonegotiate: on RX: on TX: on Судя по графикам мониторинга - провалы появились периодические... Раньше график был ровный без скачков/провалов.. А сейчас в пики активности появились провалы.
В 4.0/branch исправления не будут вноситься уже технически (заглушена очередь на сборку), поэтому прошу ошибки, актуальные для sisyphus/p7/t7, перевесить на текущие ветки или сизиф.