Bug 26375 - Сбои файловой системы
: Сбои файловой системы
Status: REOPENED
: Sisyphus
(All bugs in Sisyphus/plymouth)
: unstable
: all Linux
: P3 normal
Assigned To:
:
:
:
:
: 23155 26742
  Show dependency tree
 
Reported: 2011-09-26 16:58 by
Modified: 2014-11-27 09:14 (History)


Attachments
Скриншоты загрузки ОС. (6.09 MB, application/x-rar)
2011-09-27 14:53, george0575@yandex.ru
no flags Details
Скриншоты останова ОС. (4.73 MB, application/x-rar)
2011-09-27 14:53, george0575@yandex.ru
no flags Details
boot1.jpg (3.79 MB, image/jpeg)
2011-09-28 10:55, george0575@yandex.ru
no flags Details
boot2.jpg (4.11 MB, image/jpeg)
2011-09-28 10:55, george0575@yandex.ru
no flags Details
mount_table.jpg (6.00 MB, image/jpeg)
2011-09-28 10:56, george0575@yandex.ru
no flags Details
livecd_check.jpg (4.66 MB, image/jpeg)
2011-09-28 10:57, george0575@yandex.ru
no flags Details
aftercheck_boot1.jpg (5.07 MB, image/jpeg)
2011-09-28 10:57, george0575@yandex.ru
no flags Details
aftercheck_boot2.jpg (4.30 MB, image/jpeg)
2011-09-28 10:58, george0575@yandex.ru
no flags Details
reiser.jpg (5.09 MB, image/jpeg)
2011-09-30 10:03, george0575@yandex.ru
no flags Details
dmesg (16.11 KB, application/x-gzip)
2011-09-30 23:18, george0575@yandex.ru
no flags Details
bad_boot_simply.txt.gz (5.52 KB, application/x-gzip)
2011-10-05 16:06, george0575@yandex.ru
no flags Details
good_boot_simply.txt.gz (5.55 KB, application/x-gzip)
2011-10-05 16:07, george0575@yandex.ru
no flags Details
boot1_lsof.txt.gz (5.86 KB, application/x-gzip)
2011-10-06 09:53, george0575@yandex.ru
no flags Details
boot2_lsof.txt.gz (5.53 KB, application/x-gzip)
2011-10-06 09:54, george0575@yandex.ru
no flags Details
boot_step2.txt.gz (6.00 KB, application/x-gzip)
2011-10-06 09:55, george0575@yandex.ru
no flags Details
lsof.txt.gz (144 bytes, application/x-gzip)
2011-10-06 09:55, george0575@yandex.ru
no flags Details
lsof2.txt.gz (96 bytes, application/x-gzip)
2011-10-06 13:38, george0575@yandex.ru
no flags Details
good_boot1.txt.gz (5.82 KB, application/x-gzip)
2011-10-06 13:39, george0575@yandex.ru
no flags Details
good_boot2.txt.gz (5.43 KB, application/x-gzip)
2011-10-06 13:41, george0575@yandex.ru
no flags Details


Note

You need to log in before you can comment on or make changes to this bug.


Description From 2011-09-26 16:58:17
Здравствуйте!

Заметил, что при каждой (без исключения) загрузке ОС в текстовых сообщениях на
экране идет информация о исправлениях файловой системы на жестком диске. Это
проявилось на обеих платформах дистрибутива Simply (x86 и x86_64) и с обеими
используемыми ФС: ext4 и reiserfs3. Создается впечатление, что при перезагрузке
или останове ОС не происходит корректного размонтирования разделов, что влечет
за собой сбойные участки, которые и исправляются при загрузке ОС.
Зафиксировал скриншоты происходящего при загрузке ОС (start.jpg в архиве
вложения).
При останове ОС (shutdown.jpg) замечены сообщения о невозможности
размонтировать разделы из-за того, что они заняты (busy).
------- Comment #1 From 2011-09-26 17:02:53 -------
В догонку:
>Это проявилось на обеих платформах дистрибутива Simply (x86 и x86_64)

соответственно и на абсолютно разных машинах (ноутбук x86_64 и стац. машина
x86) с полностью исправными жесткими дисками.
------- Comment #2 From 2011-09-27 14:53:09 -------
Created an attachment (id=5125) [details]
Скриншоты загрузки ОС.
------- Comment #3 From 2011-09-27 14:53:50 -------
Created an attachment (id=5126) [details]
Скриншоты останова ОС.
------- Comment #4 From 2011-09-28 10:53:21 -------
Забыл сказать о важном моменте: проблема касается только одного раздела,
смонтированного на /usr, причем ФС не важна (ext4, reiserfs на разных машинах -
эффект один и тот же).
Проверил на машине с ext4. /dev/sda8 - как раз /usr раздел. На другой машине с
reiser было тоже самое, тоже /usr на раздел диска другой.
1) Загрузил ОС штатно. Есть исправления ФС. На скриншоте boot1.jpg сообщение
/dev/sda8:  recovering journal
2) Перезагрузил ОС еще раз. Есть исправления ФС. На скриншоте boot2.jpg
сообщение то же
/dev/sda8:  recovering journal
3) Скриншот смонтированных разделов на всякий случай mount_table.jpg.
4) Загрузился с livecd (скриншот livecd_check.jpg) и проверил раздел.
Исправления ФС с сообщением
/dev/sda8:  recovering journal
Тут же проверил еще два раза. Исправлений больше нет.
5)  Снова загрузил ОС штатно (скриншот aftercheck_boot1.jpg). Сообщение про
superblock.
6) Перезагрузил ОС еще раз (скриншот aftercheck_boot2.jpg). Сообщение то же
/dev/sda8:  recovering journal

Косвенно подтверждается моя догадка о том, что при выключении/перезагрузке ОС
/usr не успевает размонтироваться. Видимо его кто-то держит.
------- Comment #5 From 2011-09-28 10:55:00 -------
Created an attachment (id=5127) [details]
boot1.jpg
------- Comment #6 From 2011-09-28 10:55:36 -------
Created an attachment (id=5128) [details]
boot2.jpg
------- Comment #7 From 2011-09-28 10:56:25 -------
Created an attachment (id=5129) [details]
mount_table.jpg
------- Comment #8 From 2011-09-28 10:57:00 -------
Created an attachment (id=5130) [details]
livecd_check.jpg
------- Comment #9 From 2011-09-28 10:57:41 -------
Created an attachment (id=5131) [details]
aftercheck_boot1.jpg
------- Comment #10 From 2011-09-28 10:58:40 -------
Created an attachment (id=5132) [details]
aftercheck_boot2.jpg
------- Comment #11 From 2011-09-28 12:17:21 -------
> 5)  Снова загрузил ОС штатно (скриншот aftercheck_boot1.jpg).
> Сообщение про superblock.

ну тут просто время. Это не при чём. Картинку про суперблок можно смело
удалять, чтобы место не занимала.
------- Comment #12 From 2011-09-28 12:43:21 -------
Что-то пункта удаления не нашел.
------- Comment #13 From 2011-09-29 17:36:39 -------
Этот скриншот (aftercheck_boot1.jpg) нужен. Он доказывает, что заранее
исправленная в livecd  ФС не портится при первой загрузке ОС, о оказывается
испорченной самой ОС после ее shutdown/reboot. Опять же указание на
неразмонтирование (как один из вариантов) раздела при останове/перезагрузке ОС.
------- Comment #14 From 2011-09-29 17:46:09 -------
Еще хочу обратить внимание на то, что это проблема не отдельно Simply, а всего
branch/p6, так как это касается базовой системы, а Simply выделяется только
графической средой.
------- Comment #15 From 2011-09-29 19:04:34 -------
(In reply to comment #13)

> Он доказывает, что заранее исправленная в livecd  ФС 

Он доказывает только то, что у Вас или таймер сбоит на материнке, или
синхронизируетесь не так. Более - ничего.

> Еще хочу обратить внимание на то, что это проблема не отдельно Simply, а всего
branch/p6,

У меня уже много что переведено на Branch p6, я этой проблемы не видел (хотя
мониторы не везде, но кое-где были). И рабочий компьютер на p6 - с момента
отбранчёвываения. На форуме, смотрю, тоже никто присоединиться с подтверждением
проблемы не спешит.
------- Comment #16 From 2011-09-30 10:02:27 -------
Выкладываю скриншот с другой машины с reiserfs (reuser.jpg). Там видны
исправления раздела /dev/sda5 (который тоже /usr). И так происходит при каждой
перезагрузке.

>На форуме, смотрю, тоже никто присоединиться с подтверждением проблемы не спешит.

Я уже понял, что на мою проблему обращать внимания вообще никто не спешит.
Логика железная: у  меня не воспроизводится, никто больше проблему не
подтверждает, значит и рассматривать не будем. Но как еще вам доказать, что
проблема не локальная? Почему для вас законы логики и здравого смыслы не имеют
значения!? Ну _НЕ МОЖЕТ_ на двух абсолютно разных машинах с разными ФС проблема
быть локальной!!! Одна - новый ноутбук Sony Vaio x86_64, другая - старый
Pentium 3 1700 (естественно x86). Оба исправны, что подтверждается нормальной
работой других ОС (и разных линуксов в том числе).
На открытую багу не было вообще никакой реакции (даже ее статус до сих пор не
изменился - NEW), пока я в форуме сигналить не начал, но и там меня послали
куда подальше.
Эту багу вообще кто-то начал исследовать? Если да, то почему здесь об этом не
известно? Были ли попытки воспроизвести у себя ситуацию, максимально
приближенную к моей? Ответ - нет. Иначе бы меня спросили, например:
1) как происходит инсталляция, с образа или апгрейдом с 5.0.2?
2) Какие были действия после инсталляции, добавлялся ли какой-то софт,
выключались или включались какие-то сервисы?
3) и т.д......

Если у других эта бага не воспроизводится, это не значит что ее нет. Это значит
то, что у остальных другие условия, при которых она не проявляется.

Я уверен что другие не жалуются потому, что этого не замечают, так как сбоям в
самой работе ОС это не приводит (ведь ФС все-таки исправляется), либо не
"заглядывают" за кулисы bootsplash, либо не обращают внимания на сами текстовые
сообщения.

Бага открыта 26, сегодня 30, _попыток_ решить проблему не замечено.
------- Comment #17 From 2011-09-30 10:03:22 -------
Created an attachment (id=5133) [details]
reiser.jpg
------- Comment #18 From 2011-09-30 10:06:26 -------
> Он доказывает только то, что у Вас или таймер сбоит на материнке, или синхронизируетесь не так. Более - ничего.

Остаюсь при своем мнении: скриншот нужен и сужает круг поиска.
------- Comment #19 From 2011-09-30 10:43:03 -------
Кстати, до Simply 6 на старой машине стоял Simply 5.0.2 и этой проблемы не
было. Даже разделы были те же, только при установке переформатировались.
------- Comment #20 From 2011-09-30 16:24:05 -------
(In reply to comment #16)

> Если у других эта бага не воспроизводится, это не значит что ее нет. Это значит
> то, что у остальных другие условия, при которых она не проявляется.

Так вот, как пользователь p6, чисто для статистики и того, кто будет заниматься
проблемой, я и написал, что у меня эта проблема НЕ воспроизводится. Так что это
или специфика Simply, или, вообще, Ваша.
------- Comment #21 From 2011-09-30 16:46:56 -------
>что у меня эта проблема НЕ воспроизводится. Так что это или специфика Simply, или, вообще, Ваша.

Я же написал про две _РАЗНЫЕ_ машины и ФС и про законы логики . Как же она
может быть только моя?

Еще раз: 
1) Если у других эта бага не воспроизводится, это не значит что ее нет. Это
значит
то, что у остальных другие условия, при которых она не проявляется.

2) Это проблема не только моя, так как я качаю образ стабильного симпли 6 с
сайта, нарезаю болванку, и ставлю ее на заведомо исправные два разных
компьютера.
При этом я создаю разделы вручную по своей схеме, а не автоматом. Это первая
особенность которая гипотетически может повлиять на проблему, но логически
повлиять не должна, так как размер раздела и его номер не должен влиять на
появление ошибок в ФС. Или может? Это первое нестандартное действие.
Затем я поставил ОС и после установки отключаю ненужные мне сервисы. Это второе
нестандартное действие.
Потом обновляю систему из реп. Это действие стандартное.
Потом добавляю некоторый нужный мне софт из реп. Это третье нестандартное
действие.

В итоге получилось 2 нестандартных действия, которые могут повлиять на
проблему.

Я соглашусь, что это может быть проблема только Симпли, так как диск могут
держать процессы из xfce. И я это сейчас проверю: переведу систему в загрузку
только в консоль, если проблема пропадет, попробую поставить другую граф. среду
и снова проверю.
------- Comment #22 From 2011-09-30 16:49:42 -------
> В итоге получилось 2 нестандартных действия, которые могут повлиять на
проблему.

Поправка: 3 нестандартных действия
------- Comment #23 From 2011-09-30 17:03:45 -------
(In reply to comment #21)

> Я соглашусь, что это может быть проблема только Симпли, так как диск могут
> держать процессы из xfce. И я это сейчас проверю: переведу систему в загрузку
> только в консоль, если проблема пропадет, попробую поставить другую граф. среду
> и снова проверю.

Можно более кардинально поступить: в /etc/inittab, в строке id:5:initdefault:,
поменять 5 и 3. Загрузится только текстовая консоль.
------- Comment #24 From 2011-09-30 17:04:20 -------
(In reply to comment #23)

> поменять 5 и 3. Загрузится только текстовая консоль.

"5 на 3" в смысле.
------- Comment #25 From 2011-09-30 17:35:17 -------
именно так только что и сделал. Только поменял 5 на 4. То есть
многопользовательский консольный.
После этого 3 раза перезагружался - проблема есть. Раздел каждый раз
исправляется.
Сейчас на 3 переделаю и посмотрю.
------- Comment #26 From 2011-09-30 17:52:06 -------
Для надежности переключился сразу на 1 (single-mode) и несколько раз
перезагрузился.
Даже вариант ядра failsave выбирал. Проблема осталась. Вот тут уж точно не
Симпли виноват.
Заметил, что как раз перед исправлениями раздела стартует LVM2, хотя я его в
панели управления в сервисах выключал. А как его из консоли надежно отключить?
Что-то у меня на него подозрения появились.
------- Comment #27 From 2011-09-30 18:06:06 -------
(In reply to comment #26)

> Даже вариант ядра failsave выбирал. Проблема осталась. Вот тут уж точно не
> Симпли виноват.

надо как-то найти, что. Может, действительно, какой-то вариант с монтированием
разделов... Но у меня тоже их много и /usr отдельно всегда. И инсталляций с p6
поболее пары десятков, не считая десктопа, за которым сам сижу.

> Заметил, что как раз перед исправлениями раздела стартует LVM2, 

Надо с отключением разбираться, а не со стартом. Проблема где-то там.

> хотя я его в панели управления в сервисах выключал. А как его из консоли надежно отключить ? 

Если не ошибаюсь, только удалением пакета. Но не думаю, что в нём дело.

А что mount выводит ?
------- Comment #28 From 2011-09-30 19:20:12 -------
Покажите вывод команд от root'а:
# fdisk -l
# cat /etc/fstab

Прикрепите вывод команды:
# dmesg | gzip >/tmp/dmesg.txt.gz

P.S.: Постарайтесь немного сжимать скриншоты, качать 5мб архивы не весело :)
P.S.S: Попробуйте стандартную разбивку диска, которую предлагает инсталлер.
------- Comment #29 From 2011-09-30 23:12:47 -------
Это уже ноутбук с ext4:

[root@homenout ~]# mount
udevfs on /dev type devtmpfs (rw,relatime,size=5120k,nr_inodes=213698,mode=755)
/dev/sda7 on / type ext4 (rw,relatime,user_xattr,acl,barrier=1,data=ordered)
proc on /proc type proc (rw,relatime)
sysfs on /sys type sysfs (rw,relatime)
runfs on /run type tmpfs (rw,relatime,size=5120k,mode=755)
devpts on /dev/pts type devpts
(rw,nosuid,noexec,relatime,gid=5,mode=620,ptmxmode=000)
shmfs on /dev/shm type tmpfs (rw,relatime)
tmpfs on /tmp type tmpfs (rw,nosuid,relatime)
/dev/sda10 on /home type ext4
(rw,nosuid,relatime,user_xattr,acl,barrier=1,data=ordered)
/dev/sda11 on /mnt/archive type ext4
(rw,nosuid,nodev,noexec,relatime,user_xattr,acl,barrier=1,data=ordered)
fusectl on /sys/fs/fuse/connections type fusectl (rw,relatime)
/dev/sda3 on /mnt/win_c type fuseblk
(rw,nosuid,nodev,relatime,user_id=0,group_id=0,default_permissions,allow_other,blksize=4096)
/dev/sda5 on /mnt/win_d type fuseblk
(rw,nosuid,nodev,relatime,user_id=0,group_id=0,default_permissions,allow_other,blksize=4096)
/dev/sda8 on /usr type ext4
(rw,nodev,relatime,user_xattr,acl,barrier=1,data=ordered)
/dev/sda9 on /var type ext4
(rw,nosuid,relatime,user_xattr,acl,barrier=1,data=ordered)
/dev/sda2 on /mnt/sda2 type fuseblk
(rw,nosuid,nodev,relatime,user_id=0,group_id=0,default_permissions,allow_other,blksize=4096)
/dev/sda1 on /mnt/sda1 type fuseblk
(rw,nosuid,nodev,relatime,user_id=0,group_id=0,default_permissions,allow_other,blksize=4096)
/etc/auto.tab on /mnt/auto type autofs
(rw,relatime,fd=6,pgrp=5013,timeout=5,minproto=5,maxproto=5,indirect)
/etc/auto.avahi on /mnt/net type autofs
(rw,relatime,fd=12,pgrp=5013,timeout=120,minproto=5,maxproto=5,indirect)
[root@homenout ~]#
------- Comment #30 From 2011-09-30 23:16:31 -------
[root@homenout ~]# fdisk -l

Disk /dev/sda: 500.1 GB, 500107862016 bytes
255 heads, 63 sectors/track, 60801 cylinders, всего 976773168 секторов
Units = секторы of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0xe5ad49dd

Устр-во Загр     Начало       Конец       Блоки   Id  Система
/dev/sda1            2048    27629567    13813760   27  Hidden NTFS WinRE
/dev/sda2   *    27629568    27834367      102400    7  HPFS/NTFS/exFAT
/dev/sda3        27834368   152823807    62494720    7  HPFS/NTFS/exFAT
/dev/sda4       152823808   976773167   411974680    5  Расширенный
/dev/sda5       152825856   572256255   209715200    7  HPFS/NTFS/exFAT
/dev/sda6       572258304   580646911     4194304   82  Linux своп / Solaris
/dev/sda7       580648960   591134719     5242880   83  Linux
/dev/sda8       591136768   612108287    10485760   83  Linux
/dev/sda9       612110336   622596095     5242880   83  Linux
/dev/sda10      622598144   643569663    10485760   83  Linux
/dev/sda11      643571712   976773167   166600728   83  Linux
[root@homenout ~]#
------- Comment #31 From 2011-09-30 23:17:16 -------
[root@homenout ~]# cat /etc/fstab
proc        /proc            proc    nosuid,noexec,gid=proc        0 0
devpts        /dev/pts        devpts    nosuid,noexec,gid=tty,mode=620    0 0
tmpfs        /tmp            tmpfs    nosuid                0 0
UUID=dca7ef56-0f6b-4461-9c63-8be05f54de96    /    ext4    relatime    1    1
UUID=842d1f0b-aeea-4468-b9ff-d83b11cc472f    /home    ext4    nosuid,relatime  
 1    2
UUID=1ea9a4e5-7abe-4c0d-bf6f-e7e9d4744815    /mnt/archive    ext4   
nosuid,nodev,noexec    1    0
UUID=5066AA9266AA77FC    /mnt/win_c    ntfs-3g    umask=0    1    0
UUID=F2A47A64A47A2AED    /mnt/win_d    ntfs-3g    umask=0    1    0
UUID=6a8cd330-3805-408a-b060-3bb447540c65    /usr    ext4    nodev,relatime   
1    2
UUID=e8a037b4-2e08-4d88-8187-de1ff86b1cd9    /var    ext4    nosuid,relatime   
1    2
UUID=952ab700-bade-4a46-88e8-a54da76519d1    swap    swap    defaults    0    0
UUID=0A0CA8920CA87A79    /mnt/sda2    ntfs-3g
locale=ru_RU.UTF-8,dmask=0,fmask=0111 0 0
UUID=AE22A81922A7E495    /mnt/sda1    ntfs-3g
locale=ru_RU.UTF-8,dmask=0,fmask=0111 0 0
/dev/sr0    /media/cdrom    udf,iso9660    ro,noauto,user,utf8    0 0
[root@homenout ~]#
------- Comment #32 From 2011-09-30 23:18:47 -------
Created an attachment (id=5134) [details]
dmesg
------- Comment #33 From 2011-10-03 18:01:14 -------
Переделал inittab на 1 (single-mode).
Перезагрузился в single-mode. Естественно ошибки ФС были найдены и исправлены.
Логинюсь рутом, даю руками
umount /usr,
смотрю mount - /usr отмонтирован.
Перезагружаюсь.
При загрузке ошибок _НЕТ_.
Логинюсь root, делаю umount /usr, перезагружаюсь,
ошибок НЕТ.
Логинюсь root, перезагружаюсь без ручного отмонтирования /usr,
ошибки ЕСТЬ.

Вывод: /usr не отмонтируется автоматически. Причем в single-mode что может его
держать?
И как это проверить? Или ошибка в скриптах завершения работы? Но тогда почему
это
отражается только на /usr?

Огромное спасибо Сергею Афонину за идею этой проверки.
------- Comment #34 From 2011-10-04 11:39:01 -------
Подключил старый комп (с reiserfs) к другому компу по null-модемному кабелю и
зафиксировал завершение работы ОС (из single-mode загрузки) без ручного
отмонтирования /usr:

----------------------------------------------------------------------------------------------
INIT: Sending processes the TERM signalinux ~]# [root@linux ~]#
INIT: Pid 3661 [id ~~] seems to hang
Activating splash [ DONE ]
Starting killall: [ DONE ]
Asking all remaining processes to terminate
Unmounting tmpfs filesystem [/dev/shm]:
Unmounting tmpfs filesystem [/tmp]:
Unmounting tmpfs filesystem [/run]:
Turning off swap:
Unmounting filesystem [/mnt/archive]:
Unmounting filesystem [/var]:
Unmounting filesystem [/usr]:
Unmounting filesystem [/home]:
Remounting remaining filesystems (if any) read-only: umount2: Device or
resource busy
umount: udevfs busy - remounted read-only

Remounting root filesystem read-only:
Please stand by while rebooting the system...
[   87.675395] Restarting system.
----------------------------------------------------------------------------------------------

После перезагрузки ошибки были. Видно, что сообщение про отмонтирование /usr
есть и оно без ошибок.

Затем в консоли отмонтировал /usr руками, он отмонтировался молча, без ошибок.
Задал mount и перезагрузил машину. Ниже вывод mount и лог завершения:

----------------------------------------------------------------------------------------------
[root@linux ~]# [root@linux ~]# udevfs on /dev type devtmpfs
(rw,relatime,size=5120k,nr_inodes=95826,mode=755)
/dev/sda6 on / type reiserfs (rw,noatime,notail)
proc on /proc type proc (rw,relatime)
sysfs on /sys type sysfs (rw,relatime)
runfs on /run type tmpfs (rw,relatime,size=5120k,mode=755)
devpts on /dev/pts type devpts
(rw,nosuid,noexec,relatime,gid=5,mode=620,ptmxmode=000)
shmfs on /dev/shm type tmpfs (rw,relatime)
tmpfs on /tmp type tmpfs (rw,nosuid,relatime)
/dev/sda7 on /home type reiserfs (rw,noatime,notail)
/dev/sda8 on /mnt/archive type reiserfs (rw,noatime,notail)
/dev/sda2 on /var type reiserfs (rw,noatime,notail)
INIT: Sending processes the TERM signal
INIT: Pid 3661 [id ~~] seems to hang
Activating splash [ DONE ]
Starting killall: [ DONE ]
Asking all remaining processes to terminate
Unmounting tmpfs filesystem [/dev/shm]:
Unmounting tmpfs filesystem [/tmp]:
Unmounting tmpfs filesystem [/run]:
Turning off swap:
Unmounting filesystem [/mnt/archive]:
Unmounting filesystem [/var]:
Unmounting filesystem [/home]:
Remounting remaining filesystems (if any) read-only: umount2: Device or
resource busy
umount: udevfs busy - remounted read-only

Remounting root filesystem read-only:
Please stand by while rebooting the system...
[  140.529486] Restarting system.
----------------------------------------------------------------------------------------------

После перезагрузки ошибок не было. Видно, что нет сообщения про отмонтирование
/usr, так как он уже был отмонтирован. Остальное все тоже самое.
Получается, /usr тупо не отмонтируется, хотя идет сообщение о его
отмонтировании. И раздел ничего не держит, иначе он бы не отмонтировался
вручную.
------- Comment #35 From 2011-10-04 16:44:14 -------
Можно добавить вызов команды mount между двумя этими командами:

> Unmounting filesystem [/home]:
> Remounting remaining filesystems (if any) read-only: umount2: Device or
> resource busy


Если согласны на эксперимент, то выполните команду:
sed 's/multipath_stop/multipath_stop\nmount/' -i /etc/rc.d/init.d/halt

P.S.: вы не отвечаете на мое письмо в личку :)
------- Comment #36 From 2011-10-05 12:53:09 -------
Провел эксперимент. После выполнения команды два раза перезагрузился.
Ошибки ФС есть оба раза.
------- Comment #37 From 2011-10-05 13:43:42 -------
(В ответ на комментарий №36)
> Провел эксперимент. После выполнения команды два раза перезагрузился.
> Ошибки ФС есть оба раза.

Этот эксперимент предполагал что вы подключите компьютер к другому по
нуль-модемному кабелю и посмотрите на вывод команды mount между:
Unmounting filesystem [/home]:
и
Remounting remaining filesystems (if any) read-only: umount2: Device or
resource busy
------- Comment #38 From 2011-10-05 14:40:26 -------
Проделал тест. Лог выключения машины:

INIT: Sending processes the TERM signal
INIT: Pid 3660 [id ~~] seems to hang
Activating splash [ DONE ]
Starting killall: [ DONE ]
Asking all remaining processes to terminate
Unmounting tmpfs filesystem [/dev/shm]:
Unmounting tmpfs filesystem [/tmp]:
Unmounting tmpfs filesystem [/run]:
Turning off swap:
Unmounting filesystem [/mnt/archive]:
Unmounting filesystem [/var]:
Unmounting filesystem [/usr]:
Unmounting filesystem [/home]:
udevfs on /dev type devtmpfs (rw,relatime,size=5120k,nr_inodes=95826,mode=755)
/dev/sda6 on / type reiserfs (rw,noatime,notail)
proc on /proc type proc (rw,relatime)
sysfs on /sys type sysfs (rw,relatime)
devpts on /dev/pts type devpts
(rw,nosuid,noexec,relatime,gid=5,mode=620,ptmxmode=000)
Remounting remaining filesystems (if any) read-only: umount2: Device or
resource busy
umount: udevfs busy - remounted read-only

Remounting root filesystem read-only:
Please stand by while rebooting the system...
[   91.599596] Restarting system.
------- Comment #39 From 2011-10-05 15:38:08 -------
Теперь выполните:
# sed 's/nodevfs/nodevfs,nodevtmpfs/' -i /etc/rc.d/init.d/halt

и снова выполните проверку с нуль-модемным кабелем _И_ проверьте правильность
размонтирования /usr
------- Comment #40 From 2011-10-05 16:05:29 -------
Выполнил команду, перезагрузился. Ошибки ФС при загрузке есть
(bad_boot_simply.txt.gz).
Там часть ссобщений с исправлениями:
Configuring kernel parameters: [ DONE ]
Checking filesystems
Checking all file systems.
[/sbin/fsck.reiserfs (1) -- /home] fsck.reiserfs -ay /dev/sda7
Reiserfs super block in block 16 on 0x807 of format 3.6 with standard journal
Blocks (total/free): 1220688/1056388 by 4096 bytes
Filesystem is clean
[/sbin/fsck.reiserfs (1) -- /usr] fsck.reiserfs -ay /dev/sda5
Replaying journal: Trans replayed: mountid 87, transid 990, desc 6773, len 1,
commit 6775, next trans offset 6758
Trans replayed: mountid 87, transid 991, desc 6776, len 1, commit 6778, next
trans offset 6761
Trans replayed: mountid 87, transid 992, desc 6779, len 1, commit 6781, next
trans offset 6764
Trans replayed: mountid 87, transid 993, desc 6782, len 1, commit 6784, next
trans offset 6767
Trans replayed: mountid 87, transid 994, desc 6785, len 1, commit 6787, next
trans offset 6770
Trans replayed: mountid 87, transid 995, desc 6788, len 1, commit 6790, next
trans offset 6773
Trans replayed: mountid 87, transid 996, desc 6791, len 1, commit 6793, next
trans offset 6776
Replaying journal: Done.
Reiserfs journal '/dev/sda5' in blocks [18..8211]: 7 transactions replayed
Reiserfs super block in block 16 on 0x805 of format 3.6 with standard journal
Blocks (total/free): 1464848/837164 by 4096 bytes
Filesystem is NOT clean
[/sbin/fsck.reiserfs (1) -- /var] fsck.reiserfs -ay /dev/sda2
Reiserfs super block in block 16 on 0x802 of format 3.6 with standard journal
Blocks (total/free): 500016/349664 by 4096 bytes
Filesystem is clean


Затем зашел root, отмонтировал руками и перезагрузился. Ошибок нет
(good_boot_simply.txt.gz).
Сообщения:
Configuring kernel parameters: [ DONE ]
Checking filesystems
Checking all file systems.
[/sbin/fsck.reiserfs (1) -- /home] fsck.reiserfs -ay /dev/sda7
Reiserfs super block in block 16 on 0x807 of format 3.6 with standard journal
Blocks (total/free): 1220688/1056388 by 4096 bytes
Filesystem is clean
[/sbin/fsck.reiserfs (1) -- /usr] fsck.reiserfs -ay /dev/sda5
Reiserfs super block in block 16 on 0x805 of format 3.6 with standard journal
Blocks (total/free): 1464848/837164 by 4096 bytes
Filesystem is clean
[/sbin/fsck.reiserfs (1) -- /var] fsck.reiserfs -ay /dev/sda2
Reiserfs super block in block 16 on 0x802 of format 3.6 with standard journal
Blocks (total/free): 500016/349663 by 4096 bytes
Filesystem is clean
[ DONE ]
------- Comment #41 From 2011-10-05 16:06:32 -------
Created an attachment (id=5144) [details]
bad_boot_simply.txt.gz
------- Comment #42 From 2011-10-05 16:07:22 -------
Created an attachment (id=5145) [details]
good_boot_simply.txt.gz
------- Comment #43 From 2011-10-05 16:12:30 -------
Покажите, пожалуйста, лог выключения, интересует появляется ли ошибка:
Remounting remaining filesystems (if any) read-only: umount2: Device or
resource busy
umount: udevfs busy - remounted read-only
------- Comment #44 From 2011-10-05 16:19:04 -------
INIT: Sending processes the TERM signal
INIT: Pid 3815 [id ~~] seems to hang
Activating splash [ DONE ]
Starting killall: [ DONE ]
Asking all remaining processes to terminate
Unmounting tmpfs filesystem [/dev/shm]:
Unmounting tmpfs filesystem [/tmp]:
Unmounting tmpfs filesystem [/run]:
Turning off swap:
Unmounting filesystem [/mnt/archive]:
Unmounting filesystem [/var]:
Unmounting filesystem [/usr]:
Unmounting filesystem [/home]:
udevfs on /dev type devtmpfs (rw,relatime,size=5120k,nr_inodes=95826,mode=755)
/dev/sda6 on / type reiserfs (rw,noatime,notail)
proc on /proc type proc (rw,relatime)
sysfs on /sys type sysfs (rw,relatime)
devpts on /dev/pts type devpts
(rw,nosuid,noexec,relatime,gid=5,mode=620,ptmxmode=000)
Remounting remaining filesystems (if any) read-only:
Remounting root filesystem read-only:
Please stand by while rebooting the system...
[   58.895779] Restarting system.

Сообщение пропало.
------- Comment #45 From 2011-10-05 17:21:32 -------
(В ответ на комментарий №44)
> Сообщение пропало.

Но разделу, который монтируется в /usr это не помогло?

1. Проверьте что у вас установлен пакет lsof.
2. Выполните:
# sed 's,# Unmount all the,lsof|grep /usr \&>/root/lsof.txt\n# Unmount all
the,' -i /etc/rc.d/init.d/halt
3. Перезагрузитесь два раза :)
4. Прикрепите сюда файл /root/lsof.txt
5. ВЫПОЛНЯЙТЕ СТРОГО ПОСЛЕ ВЫПОЛНЕНИЯ ПРЕДЫДУЩИХ ПУНКТОВ:
# sed 's/umount -f -l -t noproc/umount -f -t noproc/' -i
/etc/rc.d/init.d/functions
6. Перезагружайтесь и внимательно смотрите на ошибки во время выключения и
включения

P.S. Завел багу для исправления появляющейся при перезагрузке ошибки #26416
------- Comment #46 From 2011-10-05 17:39:58 -------
Смогу выполнить только завтра.
------- Comment #47 From 2011-10-06 09:51:29 -------
Ленар, доброе утро. Сделал все как Вы сказали и на последней загрузке ОС ошибки
пропали.
Теперь, все по порядку.

Выполнил первые 3 шага Вашей инструкции.
Первая перезагрузка (старт и завершение ОС) - boot1_lsof.txt.gz.
Вторая загрузка (только старт) - boot2_lsof.txt.gz.
Затем сохранил lsof.txt - lsof.txt.gz.
Выполнил команду из шага 5 и перезагрузился (завершение и старт ОС) -
boot_step2.txt.gz.
При старте ошибок уже не было.
------- Comment #48 From 2011-10-06 09:53:20 -------
Created an attachment (id=5148) [details]
boot1_lsof.txt.gz
------- Comment #49 From 2011-10-06 09:54:12 -------
Created an attachment (id=5149) [details]
boot2_lsof.txt.gz
------- Comment #50 From 2011-10-06 09:55:06 -------
Created an attachment (id=5150) [details]
boot_step2.txt.gz
------- Comment #51 From 2011-10-06 09:55:51 -------
Created an attachment (id=5151) [details]
lsof.txt.gz
------- Comment #52 From 2011-10-06 11:10:20 -------
Отлично, похоже мы нашли виновника:
plymouthd держит открытый файл /usr/lib/plymouth/details.so, поэтому в
действительности раздел не отмонтируется (опция -l у umount).

Теперь возвращаем обратно опцию и удаляем для проверки plymouth:
1. #sed 's/umount -f -t/umount -f -l -t/' -i /etc/rc.d/init.d/functions
2. #apt-get remove /sbin/plymouthd
3. Два раза перезагружаетесь :)
4. Прикрепляете сюда лог /root/lsof.txt и вывод через нуль-модемный кабель во
время перезагрузки.
5. Проверяете будут ли ошибки при проверке ФС
------- Comment #53 From 2011-10-06 12:58:08 -------
(In reply to comment #52)
> Отлично, похоже мы нашли виновника:
> plymouthd держит открытый файл /usr/lib/plymouth/details.so, поэтому в

А сходится... У меня Плимута нет нигде. А если он где-то пытался ставиться, я
его выносил нещадно.
------- Comment #54 From 2011-10-06 13:20:26 -------
>(опция -l у umount)

В русском мане -l - "Ленивое"  размонтирование :)
Лениво было ему размонтировать :)

Далее по теме. Проблема решена, ошибки пропали.
Выполнил команды, перезагрузился.
первая перезагрука - good_boot1.txt.gz
вторая перезагрука - good_boot2.txt.gz
и lsof - lsof2.txt.gz.

Ленар и Сергей. Ваша методика удаленного диагностирования и решения задач
вызывает восхищение. Мое мнение - это высший пилотаж.

А как по плимуту, отдельная бага откроется?
------- Comment #55 From 2011-10-06 13:22:06 -------
Архивы чуть позже
------- Comment #56 From 2011-10-06 13:38:12 -------
Created an attachment (id=5154) [details]
lsof2.txt.gz
------- Comment #57 From 2011-10-06 13:39:33 -------
(In reply to comment #20)
> > Если у других эта бага не воспроизводится, это не значит что ее нет.
Именно.

> Так вот, как пользователь p6, чисто для статистики и того, кто будет заниматься
> проблемой, я и написал, что у меня эта проблема НЕ воспроизводится.
Серёж, и всё-таки тон огорчает.  Если проблема соседа сейчас не касается -- это
не значит даже того, что не затронет завтра; уже поэтому "моя хата с краю,
ничего не знаю" не работает.

> Так что это или специфика Simply, или, вообще, Ваша.
А этот вывод и вовсе неверен.

Ленар и Георгий, спасибо за въедливость при диагностировании.
------- Comment #58 From 2011-10-06 13:39:55 -------
Created an attachment (id=5155) [details]
good_boot1.txt.gz
------- Comment #59 From 2011-10-06 13:41:38 -------
Created an attachment (id=5156) [details]
good_boot2.txt.gz
------- Comment #60 From 2011-10-06 14:09:59 -------
>А сходится... У меня Плимута нет нигде. А если он где-то пытался ставиться, я его выносил нещадно.

А с iso-шника он ставится всегда и из простых пользователей его вряд ли кто-то
будет выключать/удалять.

Поэтому странно, что никто не заметил проблемы. Видимо только по тому, как я
раньше говорил, что внимания не обращает.
------- Comment #61 From 2011-10-06 14:14:02 -------
(In reply to comment #60)
> >А сходится... У меня Плимута нет нигде. А если он где-то пытался ставиться, я его выносил нещадно.
> 
> Поэтому странно, что никто не заметил проблемы. Видимо только по тому, как я
> раньше говорил, что внимания не обращает.

Потому, что мало у кого /usr на отдельном разделе.
------- Comment #62 From 2011-10-06 15:21:44 -------
Переселить plymouth в /lib довольно сложно, так как расположение его файлов
прошито ещё и в make-initrd.
Возможно, было бы хорошим выходом выключать plymouth перед размонтированием
/usr, то есть в пакете startup
------- Comment #63 From 2011-10-06 15:43:08 -------
(In reply to comment #62)

А если сделать plymouth-static ?

(In reply to comment #57)

>> Так что это или специфика Simply, или, вообще, Ваша.
> А этот вывод и вовсе неверен.

Как раз таки почти верен - Server Light, это не касается.
По крайней мере, беты. Так что это дистрибутивозависимо в полный рост.
Что касается тона, тут не вся переписка. Кое-что есть на форуме, кое-что в
личной почте. Так что не всё так плохо, как кажется. ;-)

(In reply to comment #61)

> Потому, что мало у кого /usr на отдельном разделе.

у меня, как раз, всегда на отдельном... Но вот Плимута не оказалось.
------- Comment #64 From 2011-10-06 15:50:33 -------
(In reply to comment #62)
> Переселить plymouth в /lib довольно сложно, так как расположение его файлов
> прошито ещё и в make-initrd.
> Возможно, было бы хорошим выходом выключать plymouth перед размонтированием
> /usr, то есть в пакете startup

Пакет startup нельзя обучать выключению каждого сервиса, для этой цели
предназначены обычные startup-скрипты.
Пусть у plymouth будет соответствующий startup-скрипт, который будет отвечать
за своевременное деактивирование.
------- Comment #65 From 2011-10-07 14:34:14 -------
На p6.
------- Comment #66 From 2011-10-07 19:44:07 -------
(In reply to comment #62)
> Переселить plymouth в /lib довольно сложно, так как расположение его файлов
> прошито ещё и в make-initrd.
Может, поправить и его, а на старый плимут конфликт прописать?
------- Comment #67 From 2012-03-16 02:32:45 -------
(В ответ на комментарий №62)
> Переселить plymouth в /lib довольно сложно, так как расположение его файлов
> прошито ещё и в make-initrd.
Вроде там тупо прописать оба местоположения прокатит.
------- Comment #68 From 2012-03-16 15:12:35 -------
(In reply to comment #67)
> > Переселить plymouth в /lib довольно сложно, так как расположение его файлов
> > прошито ещё и в make-initrd.
> Вроде там тупо прописать оба местоположения прокатит.
Тем более.  И пойдёмте на сизиф, наверное.
------- Comment #69 From 2012-03-16 15:19:37 -------
(В ответ на комментарий №67)
> Вроде там тупо прописать оба местоположения прокатит.
Ругань только будет.
Вот пример, как правильно и просто исправить
http://git.altlinux.org/people/legion/packages/?p=make-initrd.git;a=commitdiff;h=8ce93ecc0b197d4c9609b247fbd65c2873ec0d04
------- Comment #70 From 2012-04-28 15:14:13 -------
*** Bug 27274 has been marked as a duplicate of this bug. ***
------- Comment #71 From 2012-05-18 12:19:04 -------
(In reply to comment #69)

> Вот пример, как правильно и просто исправить
> http://git.altlinux.org/people/legion/packages/?p=make-initrd.git;a=commitdiff;h=8ce93ecc0b197d4c9609b247fbd65c2873ec0d04

А, вроде, была идея make-initrd 0.6.2 попробовать в p6 ?
------- Comment #72 From 2012-05-18 19:46:37 -------
(In reply to comment #69)

> Вот пример, как правильно и просто исправить

А, тут способ имеется ввиду, а не дословно ?..
------- Comment #73 From 2012-06-13 21:16:09 -------
(In reply to comment #71)
> А, вроде, была идея make-initrd 0.6.2 попробовать в p6 ?

Если что, в t6 сейчас наблюдается make-initrd-0.7.8-alt1 (и тот, кто его молча
закинул -- диверсант, т.к. копировать надо было и make-initrd-propagator с
make-initrd-propagator-resume после выполнения соответствующей подгонки в
сизифе).

Не уверен, что стоит в p6, но по крайней мере можно обдумать.
------- Comment #74 From 2012-08-14 16:41:39 -------
не могу воспроизвести на p6, на sisyphus, на реальных машинах и в KVM
------- Comment #76 From 2012-08-27 21:31:56 -------
Сегодняшнее обновление. Никаких изменений не вижу: так же производится проверка
отдельного /usr. Точно /usr отдельным разделом на тестируемых системах ?
------- Comment #77 From 2012-11-22 01:04:36 -------
(В ответ на комментарий №76)
> Сегодняшнее обновление. Никаких изменений не вижу: так же производится проверка
> отдельного /usr. Точно /usr отдельным разделом на тестируемых системах ?

2amike, cas: ping
------- Comment #78 From 2012-11-30 15:03:24 -------
(В ответ на комментарий №76)
> Сегодняшнее обновление. Никаких изменений не вижу: так же производится проверка
> отдельного /usr. Точно /usr отдельным разделом на тестируемых системах ?

на новом образе, от 30.11, с отдельным /usr и sysvinit - подтверждается.
на systemd - не подтверждается.
------- Comment #79 From 2012-11-30 23:00:49 -------
(В ответ на комментарий №78)

> на новом образе, от 30.11, с отдельным /usr и sysvinit - подтверждается.
> на systemd - не подтверждается.

systemd реабилитирован. Похоже, мы столкнулись с вариантом "проблемы /usr",
которую он как раз решает.
Пока вешаю на RM p7.
major->normal
------- Comment #80 From 2013-02-06 14:04:50 -------
А в интернетах то оказывается известная проблема . Вначале на lor-e  прочёл что
systemd не работает с отдельным /usr, а потом ещё оказалось что  и какая-то
версия udev тоже плохо работает с отдельным /usr. 

Есть ещё ссылка http://www.gentoo.ru/node/25066 там как-то через openrc
исправляют вроде.
Но это на генту. 

Простите за спам. Я тут мельком глянул. Подумал может пригодится.
------- Comment #81 From 2013-03-04 05:09:39 -------
Если не будет мотивированных возражений, то в 15 часов 5 марта исключаю из
числа блокеров p7.
------- Comment #82 From 2013-03-04 09:31:51 -------
Возражение одно: отдельный /usr - это хорошо, и оно должно быть учтено. По
крайней мере, пока всякий идиотизм, в виде systemd в частности, не является
обязательной частью системы.
------- Comment #83 From 2013-03-15 21:43:14 -------
Не блокер для p7
------- Comment #84 From 2013-10-15 12:12:18 -------
Кентавр 7.0.1, серверная инсталляция... Возвращаем блокер на p7, или как ?
Я-то Плимут у себя, как обычно, снесу (как и Grub, врочем)...
------- Comment #85 From 2014-11-27 09:14:06 -------
ping.

(In reply to comment #79)

> systemd реабилитирован.

Нет. :-)

> Похоже, мы столкнулись с вариантом "проблемы /usr",
> которую он как раз решает.

Он её не решает, а маскирует. Если бы не systemd, об этом бы подумали.
Возможно.

altlinux-p7-sysv-tde-20140912-x86_64.iso - воспроизводится.
На сизифных сборках не проверял.