Bug 10809

Summary: При загрузке сообщает об ошибках HDD, хотя на самом деле он живой
Product: Sisyphus Reporter: stalker <stalker>
Component: kernel-image-std-smpAssignee: Sergey Vlasov <vsu>
Status: CLOSED NOTABUG QA Contact: qa-sisyphus
Severity: normal    
Priority: P2 CC: kopilo4ka
Version: unstable   
Hardware: all   
OS: Linux   
Attachments:
Description Flags
Dmesg после загрузки
none
вывод lspci -v none

Description stalker 2007-02-09 12:04:21 MSK
В dmesg после
hde: MAXTOR 6L040J2, ATA DISK drive
...
SGI XFS Quota Management subsystem
XFS mounting filesystem hde6
Ending clean XFS mount for filesystem: hde6
VFS: Mounted root (xfs filesystem) readonly.
Trying to move old root to /initrd ... /initrd does not exist. Ignored.
Unmounting old root
Trying to free ramdisk memory ... okay
Freeing unused kernel memory: 192k freed
Executing init=/sbin/init
Real Time Clock Driver v1.12ac
Adding 1044184k swap on /dev/hde5.  Priority:-1 extents:1 across:1044184k
hde: dma_intr: status=0x51 { DriveReady SeekComplete Error }
hde: dma_intr: error=0x84 { DriveStatusError BadCRC }
ide: failed opcode was: unknown
hde: dma_intr: status=0x51 { DriveReady SeekComplete Error }
hde: dma_intr: error=0x84 { DriveStatusError BadCRC }
ide: failed opcode was: unknown
hde: dma_intr: status=0x51 { DriveReady SeekComplete Error }
hde: dma_intr: error=0x84 { DriveStatusError BadCRC }
ide: failed opcode was: unknown
hde: dma_intr: status=0x51 { DriveReady SeekComplete Error }
hde: dma_intr: error=0x84 { DriveStatusError BadCRC }
ide: failed opcode was: unknown
hdf: DMA disabled
ide2: reset: success

Хотя винт на самом деле вполне себе живой, таккак снят был 15 минут назад со
старой рабочей лошадки, где ничего подозрительного небыло вообще.
Comment 1 stalker 2007-02-09 12:05:04 MSK
Created attachment 1786 [details]
Dmesg после загрузки
Comment 2 stalker 2007-02-09 12:05:34 MSK
Created attachment 1787 [details]
вывод lspci -v
Comment 3 Sergey Vlasov 2007-02-09 15:26:40 MSK
BadCRC обычно возникает либо из-за плохого кабеля, либо из-за неправильного
выбора режима UDMA (в частности, если неправильно работает распознавание типа
кабеля, и делается попытка включить UDMA > 33 на 40-жильном кабеле; вроде бы как
раз на nForce с распознаванием 40/80-жильного кабеля есть проблемы).  В данном
случае вообще включается UDMA133, специфичный для Maxtor - возможно, именно этот
режим работает плохо.  Кроме того, ситуацию может портить соседнее устройство на
том же канале - стоит попробовать его отключить.

На этой машине должен быть ещё один канал PATA от JMB363, который вроде бы
распознался ядром - как этот же диск работает на JMB363?  (Правда, в этом случае
используемый режим UDMA посмотреть не удастся, поскольку имеющийся в 2.6.18
драйвер не поддерживает настройку скорости обмена для контроллеров Jmicron -
используется режим, установленный в BIOS.)

Ещё можно попробовать использовать для xfs опцию монтирования nobarrier -
возможно, этот диск как-то странно обрабатывает команду FLUSH CACHE, которая
сейчас используется при монтировании xfs без дополнительных опций.  Для корневой
ФС нужно использовать параметр ядра rootflags=nobarrier.
Comment 4 stalker 2007-02-09 16:34:42 MSK
(In reply to comment #3)
> BadCRC обычно возникает либо из-за плохого кабеля,
Кабеля менял.. в смысле шлейфы.

> либо из-за неправильного выбора режима UDMA (в частности, если неправильно   
> работает распознавание типа  кабеля, и делается попытка включить UDMA > 33 на
>40-жильном кабеле;
У меня 40 жильных шлейфов вообще не осталось в доме... Везде 80 юзаю.

>  В данном случае вообще включается UDMA133, специфичный для Maxtor - возможно,
> именно этот режим работает плохо.
:-(

>  Кроме того, ситуацию может портить соседнее устройство на
> том же канале - стоит попробовать его отключить.
Попробую, но раньше они вроде вместе жили -там сидюк пишущий NEC9100A
 
> На этой машине должен быть ещё один канал PATA от JMB363, который вроде бы
> распознался ядром - как этот же диск работает на JMB363?  
Ок.Попробую.

> Ещё можно попробовать использовать для xfs опцию монтирования nobarrier -
> возможно, этот диск как-то странно обрабатывает команду FLUSH CACHE, которая
> сейчас используется при монтировании xfs без дополнительных опций.

На старой рабочей лошадке тоже было 2.6.18 пересобранное в среде более старого
сизифа (почти годовой давности)

Comment 5 stalker 2007-02-12 16:43:01 MSK
В общем на jmicron проблем нет. На нвидевском канале -если оставить винт в 1 -то
работает. с 2 винтами тоже нет проблем. 
Comment 6 Michael Shigorin 2007-02-12 17:03:24 MSK
нотабуг?
Comment 7 stalker 2007-02-12 17:09:25 MSK
(In reply to comment #6)
> нотабуг?

Если бы.. новый десктоп... :-(
Ещё блин с apic непонятно куда копать... так и неудалось  запустить его.
Попробовал в суппорт стукнуться -с линуксом вежливо попросили пройти...

==
Dear Sir / Madam
The linux system are not in our OS support list.(Windows
2K/XP(32/64bit))
Please try to choose the no APIC option for your linux system
install. Please try to disable the ACPI function in bios setup for issue
check.
Comment 8 Sergey Vlasov 2007-02-12 19:04:33 MSK
Относительно IDE - похоже, это всё-таки аппаратная проблема имеющейся комбинации
устройств (возможно, усугубляющаяся использованием UDMA133 - на старой машине
контроллер мог просто не поддерживать этот режим; есть также вероятность не
совсем хорошей реализации "устаревшего" IDE на материнке). Можно разве что
попробовать через hdparm устанавливать режим помедленнее.

По поводу APIC лучше открыть отдельную багу с указанием точной модели
материнской платы и версии BIOS.