<?xml version="1.0" encoding="UTF-8" ?>

<bugzilla version="5.2"
          urlbase="https://bugzilla.altlinux.org/"
          
          maintainer="jenya@basealt.ru"
>

    <bug>
          <bug_id>22995</bug_id>
          
          <creation_ts>2010-02-19 14:21:11 +0300</creation_ts>
          <short_desc>На ядрах &gt;18: qword_eol: fflush failed: errno 2</short_desc>
          <delta_ts>2010-03-04 16:40:03 +0300</delta_ts>
          <reporter_accessible>1</reporter_accessible>
          <cclist_accessible>1</cclist_accessible>
          <classification_id>4</classification_id>
          <classification>Development</classification>
          <product>Sisyphus</product>
          <component>nfs-server</component>
          <version>unstable</version>
          <rep_platform>all</rep_platform>
          <op_sys>Linux</op_sys>
          <bug_status>CLOSED</bug_status>
          <resolution>WONTFIX</resolution>
          
          
          <bug_file_loc></bug_file_loc>
          <status_whiteboard></status_whiteboard>
          <keywords>distro-blocker</keywords>
          <priority>P3</priority>
          <bug_severity>critical</bug_severity>
          <target_milestone>---</target_milestone>
          
          <blocked>22919</blocked>
          <everconfirmed>1</everconfirmed>
          <reporter name="Anton V. Boyarshinov">boyarsh</reporter>
          <assigned_to name="Sergey Bolshakov">sbolshakov</assigned_to>
          <cc>aen</cc>
    
    <cc>cas</cc>
    
    <cc>ldv</cc>
    
    <cc>legion</cc>
    
    <cc>sbolshakov</cc>
    
    <cc>vitty</cc>
          
          <qa_contact>qa-sisyphus</qa_contact>

      

      

      

          <comment_sort_order>oldest_to_newest</comment_sort_order>  
          <long_desc isprivate="0" >
    <commentid>106877</commentid>
    <comment_count>0</comment_count>
    <who name="Anton V. Boyarshinov">boyarsh</who>
    <bug_when>2010-02-19 14:21:11 +0300</bug_when>
    <thetext>На ядрах новее 2.6.18 при попытке монтирования по NFS, сервер возвращает Permission Denied, а в его логах появляется такая запись:

mountd[9853]: qword_eol: fflush failed: errno 2 (No such file or directory)

насколько я могу судить &quot;service nfs restart&quot; исправляет проблему до следующей перезагрузки.

Протестировано на ядрах: 30-std-def, 32-std-def,
32-un-def, 27-ovz-smp

Предполагаю, что проблема может быть в несоответствии ожидаемого поведения между userspace и ядром.</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>106878</commentid>
    <comment_count>1</comment_count>
    <who name="Sergey Bolshakov">sbolshakov</who>
    <bug_when>2010-02-19 14:55:01 +0300</bug_when>
    <thetext>было бы уместно привести версии ядер и nfs-* на клиенте и сервере,
а также опции монтирования на клиенте и содержимое /etc/exports
с указанием файловых систем сервера.</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>106879</commentid>
    <comment_count>2</comment_count>
    <who name="Anton V. Boyarshinov">boyarsh</who>
    <bug_when>2010-02-19 15:04:19 +0300</bug_when>
    <thetext>(В ответ на комментарий №1)
&gt; было бы уместно привести версии ядер и nfs-* на клиенте и сервере,
&gt; а также опции монтирования на клиенте и содержимое /etc/exports
&gt; с указанием файловых систем сервера.

Это на изкоробочном office-server происходит.
Сервер:
------------------------------
cat /etc/exports
/srv/public -ro,insecure,no_subtree_check *
/srv/share -rw,insecure,fsid=0,sec=krb5 *
-----------------------------
# mount
/dev/sda1 on / type ext3 (rw,relatime)
proc on /proc type proc (rw,noexec,nosuid,gid=19)
sysfs on /sys type sysfs (rw)
udevfs on /dev type tmpfs (rw)
devpts on /dev/pts type devpts (rw)
shmfs on /dev/shm type tmpfs (rw)
tmpfs on /tmp type tmpfs (rw,nosuid)
/dev/mapper/system-home on /srv type ext3 (rw,nosuid,nodev,relatime,usrquota,grpquota)
rpc_pipefs on /var/lib/nfs/rpc_pipefs type rpc_pipefs (rw)
nfsd on /proc/fs/nfsd type nfsd (rw)
-----------------------
 # rpm -qa | grep &apos;nfs-*&apos;
nfs-server-1.1.6-alt1
nfs-clients-1.1.6-alt1
libnfsidmap-0.22-alt1
nfs-utils-1.1.6-alt1
----------------------
Опробованные перечислены в первом сообщении.

Клиент:
ядро 30-std-def-15
Версии nfs-* аналогичные серверу (одна сборка)
mount -t nfs 192.168.2.1:/srv/public /mnt/test -o nolock
mount.nfs: access denied by server while mounting 192.168.2.1:/srv/public</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>106894</commentid>
    <comment_count>3</comment_count>
    <who name="Sergey Bolshakov">sbolshakov</who>
    <bug_when>2010-02-19 16:49:22 +0300</bug_when>
    <thetext>ресолвер настроен ?
ip &lt;-&gt; hostname в обе стороны.</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>107083</commentid>
    <comment_count>4</comment_count>
    <who name="Anton V. Boyarshinov">boyarsh</who>
    <bug_when>2010-02-24 12:48:36 +0300</bug_when>
    <thetext>(В ответ на комментарий №3)
&gt; ресолвер настроен ?
Да, на обеих машинах всё хорошо в обе стороны.

&gt; ip &lt;-&gt; hostname в обе стороны.
Сервер:
[root@c204 ~]# host 192.168.2.254
254.2.168.192.in-addr.arpa domain name pointer host-254.stend2.altlinux.ru.
[root@c204 ~]# host host-254.stend2.altlinux.ru
host-254.stend2.altlinux.ru has address 192.168.2.254

Клиент:
[root@host-254 ~]# host 192.168.2.1
1.2.168.192.in-addr.arpa domain name pointer c204.stend2.altlinux.ru.
[root@host-254 ~]# host c204.stend2.altlinux.ru
c204.stend2.altlinux.ru has address 192.168.2.1</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>107122</commentid>
    <comment_count>5</comment_count>
    <who name="Dmitry V. Levin">ldv</who>
    <bug_when>2010-02-24 21:33:59 +0300</bug_when>
    <thetext>А почему сервер не справлется с вычислением uuid?</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>107128</commentid>
    <comment_count>6</comment_count>
    <who name="Sergey Bolshakov">sbolshakov</who>
    <bug_when>2010-02-25 00:40:53 +0300</bug_when>
    <thetext>как некоторым уже известно, в этом случае workaround -- явное указание fsid.</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>107130</commentid>
    <comment_count>7</comment_count>
    <who name="Dmitry V. Levin">ldv</who>
    <bug_when>2010-02-25 01:00:30 +0300</bug_when>
    <thetext>(In reply to comment #6)
&gt; как некоторым уже известно, в этом случае workaround -- явное указание fsid.

А почему, собственно говоря, сервер не справляется с вычислением uuid?  Если обычный mount вычисляет и монтирует файловую систему, то что мешает nfs-серверу вычислить этот же самый uuid?</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>107131</commentid>
    <comment_count>8</comment_count>
    <who name="Sergey Bolshakov">sbolshakov</who>
    <bug_when>2010-02-25 01:19:32 +0300</bug_when>
    <thetext>обычно сервер справляется с вычислением uuid -- и даже в этом конкретном случае, достаточно лишь выдержать некоторую небольшую паузу.
почему она в этом случае кажется необходимой -- вопрос открытый,
я бы не прочь и сам услышать объяснения от понимающих в udev/libblkid.</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>107132</commentid>
    <comment_count>9</comment_count>
    <who name="Dmitry V. Levin">ldv</who>
    <bug_when>2010-02-25 01:41:24 +0300</bug_when>
    <thetext>(In reply to comment #8)
&gt; обычно сервер справляется с вычислением uuid -- и даже в этом конкретном
&gt; случае, достаточно лишь выдержать некоторую небольшую паузу.
&gt; почему она в этом случае кажется необходимой -- вопрос открытый,
&gt; я бы не прочь и сам услышать объяснения от понимающих в udev/libblkid.

Речь идёт о nfs/utils/mountd/cache.c ?</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>107133</commentid>
    <comment_count>10</comment_count>
    <who name="Alexey Gladkov">legion</who>
    <bug_when>2010-02-25 01:53:27 +0300</bug_when>
    <thetext>(В ответ на комментарий №8)
&gt; обычно сервер справляется с вычислением uuid -- и даже в этом конкретном
&gt; случае, достаточно лишь выдержать некоторую небольшую паузу.

На этом месте я хотел бы вмешаться:

http://www.spinics.net/lists/util-linux-ng/msg02852.html

Тред не очень длинный. Суть в том, что blkid слишком долго и не эффективно сканирует устройство. Из-за этого некоторые программы отваливались по таймауту.

Ряд оптимизаций были сделаны в libblkid в новой версии util-linux-ng-2.17.1, которого ещё в сизифе нет.</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>107134</commentid>
    <comment_count>11</comment_count>
    <who name="Sergey Bolshakov">sbolshakov</who>
    <bug_when>2010-02-25 01:54:42 +0300</bug_when>
    <thetext>&gt; Речь идёт о nfs/utils/mountd/cache.c ?
да</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>107135</commentid>
    <comment_count>12</comment_count>
    <who name="Dmitry V. Levin">ldv</who>
    <bug_when>2010-02-25 01:58:50 +0300</bug_when>
    <thetext>(In reply to comment #10)
&gt; (В ответ на комментарий №8)
&gt; &gt; обычно сервер справляется с вычислением uuid -- и даже в этом конкретном
&gt; &gt; случае, достаточно лишь выдержать некоторую небольшую паузу.
&gt; 
&gt; На этом месте я хотел бы вмешаться:
&gt; 
&gt; http://www.spinics.net/lists/util-linux-ng/msg02852.html
&gt; 
&gt; Тред не очень длинный. Суть в том, что blkid слишком долго и не эффективно
&gt; сканирует устройство. Из-за этого некоторые программы отваливались по таймауту.
&gt; 
&gt; Ряд оптимизаций были сделаны в libblkid в новой версии util-linux-ng-2.17.1,
&gt; которого ещё в сизифе нет.

Очень слабо верится в то, что lvm-over-raid настолько медленный.  К тому же обычному mount&apos;у ведь ничто не мешает смонтировать файловую систему по uuid до mountd.</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>107136</commentid>
    <comment_count>13</comment_count>
    <who name="Alexey Gladkov">legion</who>
    <bug_when>2010-02-25 02:19:27 +0300</bug_when>
    <thetext>(В ответ на комментарий №12)
&gt; Очень слабо верится в то, что lvm-over-raid настолько медленный.  К тому же
&gt; обычному mount&apos;у ведь ничто не мешает смонтировать файловую систему по uuid до
&gt; mountd.

Я не специалист в nfs и хотел проинформировать о проблемах производительности... раз речь зашла о libblkid.</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>107142</commentid>
    <comment_count>14</comment_count>
    <who name="Anton V. Boyarshinov">boyarsh</who>
    <bug_when>2010-02-25 12:38:54 +0300</bug_when>
    <thetext>Исходная проблема, судя по всему, не имеет отношения к fsid=

[root@c204 ~]# cat /etc/exports
/srv/public -ro,insecure,no_subtree_check,fsid=1 *
/srv/share -rw,insecure,fsid=0,sec=krb5 *
-----------------------------------------
tail  /var/log/messages 
Feb 25 12:36:24 c204 mountd[14715]: authenticated mount request from 192.168.2.254:724 for /srv/public (/srv/public)
Feb 25 12:36:24 c204 mountd[14715]: qword_eol: fflush failed: errno 2 (No such file or directory)
Feb 25 12:36:26 c204 mountd[14715]: authenticated mount request from 192.168.2.254:1017 for /srv/public (/srv/public)
Feb 25 12:36:26 c204 mountd[14715]: qword_eol: fflush failed: errno 2 (No such file or directory)</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>107144</commentid>
    <comment_count>15</comment_count>
    <who name="Sergey Bolshakov">sbolshakov</who>
    <bug_when>2010-02-25 13:32:27 +0300</bug_when>
    <thetext>какой удар от классика</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>107208</commentid>
    <comment_count>16</comment_count>
    <who name="Sergey Bolshakov">sbolshakov</who>
    <bug_when>2010-02-27 16:33:44 +0300</bug_when>
    <thetext>altlinux-5.0.0-20100226-office-server-x86_64-ru-install-cd.iso
не повторяется.</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>107214</commentid>
    <comment_count>17</comment_count>
    <who name="Anton V. Boyarshinov">boyarsh</who>
    <bug_when>2010-02-27 17:06:12 +0300</bug_when>
    <thetext>&gt; altlinux-5.0.0-20100226-office-server-x86_64-ru-install-cd.iso
&gt; не повторяется.
Пока мы не знаем: с какими именно особенностями c204 связано наличие на нём этой проблемы (разбиение диска, тайминги etc), но на нём это железно воспроизводится -- значит то, что где-то работает -- не показатель.. На ham1 мы иногда ловили эту ошибку. Именно иногда. А на c204 она 100% воспроизводится.</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>107387</commentid>
    <comment_count>18</comment_count>
    <who name="Anton V. Boyarshinov">boyarsh</who>
    <bug_when>2010-03-04 15:54:00 +0300</bug_when>
    <thetext>После двойной переустновки стенда не воспроизводится</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>107389</commentid>
    <comment_count>19</comment_count>
    <who name="AEN">aen</who>
    <bug_when>2010-03-04 16:01:38 +0300</bug_when>
    <thetext>(В ответ на комментарий №18)
&gt; После двойной переустновки стенда не воспроизводится

WORKSFORME ?</thetext>
  </long_desc>
      
      

    </bug>

</bugzilla>