Bug 22995 - На ядрах >18: qword_eol: fflush failed: errno 2
: На ядрах >18: qword_eol: fflush failed: errno 2
Status: CLOSED WONTFIX
: Sisyphus
(All bugs in Sisyphus/nfs-server)
: unstable
: all Linux
: P3 critical
Assigned To:
:
:
: distro-blocker
:
: 22919
  Show dependency tree
 
Reported: 2010-02-19 14:21 by
Modified: 2010-03-04 16:40 (History)


Attachments


Note

You need to log in before you can comment on or make changes to this bug.


Description From 2010-02-19 14:21:11
На ядрах новее 2.6.18 при попытке монтирования по NFS, сервер возвращает
Permission Denied, а в его логах появляется такая запись:

mountd[9853]: qword_eol: fflush failed: errno 2 (No such file or directory)

насколько я могу судить "service nfs restart" исправляет проблему до следующей
перезагрузки.

Протестировано на ядрах: 30-std-def, 32-std-def,
32-un-def, 27-ovz-smp

Предполагаю, что проблема может быть в несоответствии ожидаемого поведения
между userspace и ядром.
------- Comment #1 From 2010-02-19 14:55:01 -------
было бы уместно привести версии ядер и nfs-* на клиенте и сервере,
а также опции монтирования на клиенте и содержимое /etc/exports
с указанием файловых систем сервера.
------- Comment #2 From 2010-02-19 15:04:19 -------
(В ответ на комментарий №1)
> было бы уместно привести версии ядер и nfs-* на клиенте и сервере,
> а также опции монтирования на клиенте и содержимое /etc/exports
> с указанием файловых систем сервера.

Это на изкоробочном office-server происходит.
Сервер:
------------------------------
cat /etc/exports
/srv/public -ro,insecure,no_subtree_check *
/srv/share -rw,insecure,fsid=0,sec=krb5 *
-----------------------------
# mount
/dev/sda1 on / type ext3 (rw,relatime)
proc on /proc type proc (rw,noexec,nosuid,gid=19)
sysfs on /sys type sysfs (rw)
udevfs on /dev type tmpfs (rw)
devpts on /dev/pts type devpts (rw)
shmfs on /dev/shm type tmpfs (rw)
tmpfs on /tmp type tmpfs (rw,nosuid)
/dev/mapper/system-home on /srv type ext3
(rw,nosuid,nodev,relatime,usrquota,grpquota)
rpc_pipefs on /var/lib/nfs/rpc_pipefs type rpc_pipefs (rw)
nfsd on /proc/fs/nfsd type nfsd (rw)
-----------------------
 # rpm -qa | grep 'nfs-*'
nfs-server-1.1.6-alt1
nfs-clients-1.1.6-alt1
libnfsidmap-0.22-alt1
nfs-utils-1.1.6-alt1
----------------------
Опробованные перечислены в первом сообщении.

Клиент:
ядро 30-std-def-15
Версии nfs-* аналогичные серверу (одна сборка)
mount -t nfs 192.168.2.1:/srv/public /mnt/test -o nolock
mount.nfs: access denied by server while mounting 192.168.2.1:/srv/public
------- Comment #3 From 2010-02-19 16:49:22 -------
ресолвер настроен ?
ip <-> hostname в обе стороны.
------- Comment #4 From 2010-02-24 12:48:36 -------
(В ответ на комментарий №3)
> ресолвер настроен ?
Да, на обеих машинах всё хорошо в обе стороны.

> ip <-> hostname в обе стороны.
Сервер:
[root@c204 ~]# host 192.168.2.254
254.2.168.192.in-addr.arpa domain name pointer host-254.stend2.altlinux.ru.
[root@c204 ~]# host host-254.stend2.altlinux.ru
host-254.stend2.altlinux.ru has address 192.168.2.254

Клиент:
[root@host-254 ~]# host 192.168.2.1
1.2.168.192.in-addr.arpa domain name pointer c204.stend2.altlinux.ru.
[root@host-254 ~]# host c204.stend2.altlinux.ru
c204.stend2.altlinux.ru has address 192.168.2.1
------- Comment #5 From 2010-02-24 21:33:59 -------
А почему сервер не справлется с вычислением uuid?
------- Comment #6 From 2010-02-25 00:40:53 -------
как некоторым уже известно, в этом случае workaround -- явное указание fsid.
------- Comment #7 From 2010-02-25 01:00:30 -------
(In reply to comment #6)
> как некоторым уже известно, в этом случае workaround -- явное указание fsid.

А почему, собственно говоря, сервер не справляется с вычислением uuid?  Если
обычный mount вычисляет и монтирует файловую систему, то что мешает nfs-серверу
вычислить этот же самый uuid?
------- Comment #8 From 2010-02-25 01:19:32 -------
обычно сервер справляется с вычислением uuid -- и даже в этом конкретном
случае, достаточно лишь выдержать некоторую небольшую паузу.
почему она в этом случае кажется необходимой -- вопрос открытый,
я бы не прочь и сам услышать объяснения от понимающих в udev/libblkid.
------- Comment #9 From 2010-02-25 01:41:24 -------
(In reply to comment #8)
> обычно сервер справляется с вычислением uuid -- и даже в этом конкретном
> случае, достаточно лишь выдержать некоторую небольшую паузу.
> почему она в этом случае кажется необходимой -- вопрос открытый,
> я бы не прочь и сам услышать объяснения от понимающих в udev/libblkid.

Речь идёт о nfs/utils/mountd/cache.c ?
------- Comment #10 From 2010-02-25 01:53:27 -------
(В ответ на комментарий №8)
> обычно сервер справляется с вычислением uuid -- и даже в этом конкретном
> случае, достаточно лишь выдержать некоторую небольшую паузу.

На этом месте я хотел бы вмешаться:

http://www.spinics.net/lists/util-linux-ng/msg02852.html

Тред не очень длинный. Суть в том, что blkid слишком долго и не эффективно
сканирует устройство. Из-за этого некоторые программы отваливались по таймауту.

Ряд оптимизаций были сделаны в libblkid в новой версии util-linux-ng-2.17.1,
которого ещё в сизифе нет.
------- Comment #11 From 2010-02-25 01:54:42 -------
> Речь идёт о nfs/utils/mountd/cache.c ?
да
------- Comment #12 From 2010-02-25 01:58:50 -------
(In reply to comment #10)
> (В ответ на комментарий №8)
> > обычно сервер справляется с вычислением uuid -- и даже в этом конкретном
> > случае, достаточно лишь выдержать некоторую небольшую паузу.
> 
> На этом месте я хотел бы вмешаться:
> 
> http://www.spinics.net/lists/util-linux-ng/msg02852.html
> 
> Тред не очень длинный. Суть в том, что blkid слишком долго и не эффективно
> сканирует устройство. Из-за этого некоторые программы отваливались по таймауту.
> 
> Ряд оптимизаций были сделаны в libblkid в новой версии util-linux-ng-2.17.1,
> которого ещё в сизифе нет.

Очень слабо верится в то, что lvm-over-raid настолько медленный.  К тому же
обычному mount'у ведь ничто не мешает смонтировать файловую систему по uuid до
mountd.
------- Comment #13 From 2010-02-25 02:19:27 -------
(В ответ на комментарий №12)
> Очень слабо верится в то, что lvm-over-raid настолько медленный.  К тому же
> обычному mount'у ведь ничто не мешает смонтировать файловую систему по uuid до
> mountd.

Я не специалист в nfs и хотел проинформировать о проблемах
производительности... раз речь зашла о libblkid.
------- Comment #14 From 2010-02-25 12:38:54 -------
Исходная проблема, судя по всему, не имеет отношения к fsid=

[root@c204 ~]# cat /etc/exports
/srv/public -ro,insecure,no_subtree_check,fsid=1 *
/srv/share -rw,insecure,fsid=0,sec=krb5 *
-----------------------------------------
tail  /var/log/messages 
Feb 25 12:36:24 c204 mountd[14715]: authenticated mount request from
192.168.2.254:724 for /srv/public (/srv/public)
Feb 25 12:36:24 c204 mountd[14715]: qword_eol: fflush failed: errno 2 (No such
file or directory)
Feb 25 12:36:26 c204 mountd[14715]: authenticated mount request from
192.168.2.254:1017 for /srv/public (/srv/public)
Feb 25 12:36:26 c204 mountd[14715]: qword_eol: fflush failed: errno 2 (No such
file or directory)
------- Comment #15 From 2010-02-25 13:32:27 -------
какой удар от классика
------- Comment #16 From 2010-02-27 16:33:44 -------
altlinux-5.0.0-20100226-office-server-x86_64-ru-install-cd.iso
не повторяется.
------- Comment #17 From 2010-02-27 17:06:12 -------
> altlinux-5.0.0-20100226-office-server-x86_64-ru-install-cd.iso
> не повторяется.
Пока мы не знаем: с какими именно особенностями c204 связано наличие на нём
этой проблемы (разбиение диска, тайминги etc), но на нём это железно
воспроизводится -- значит то, что где-то работает -- не показатель.. На ham1 мы
иногда ловили эту ошибку. Именно иногда. А на c204 она 100% воспроизводится.
------- Comment #18 From 2010-03-04 15:54:00 -------
После двойной переустновки стенда не воспроизводится
------- Comment #19 From 2010-03-04 16:01:38 -------
(В ответ на комментарий №18)
> После двойной переустновки стенда не воспроизводится

WORKSFORME ?