Bug 9080

Summary: Неверно воспринимает пути с русскими буквами в URL при 8-битной локали
Product: Sisyphus Reporter: Vitaly Lipatov <lav>
Component: kdebase-konquerorAssignee: Nobody's working on this, feel free to take it <nobody>
Status: CLOSED WONTFIX QA Contact: qa-sisyphus
Severity: major    
Priority: P2 CC: asy, dottedmag, mike, mithraen, wrar
Version: unstable   
Hardware: all   
OS: Linux   
Bug Depends on: 4551    
Bug Blocks:    

Description Vitaly Lipatov 2006-02-15 18:02:27 MSK
В локали ru_RU.koi8-r 
Берём konqueror и пытаемся перейти по адресу    
http://ru.wikipedia.org/wiki/Построение_с_помощью_циркуля_и_линейки    
    
В строке адреса появляется    
http://ru.wikipedia.org/wiki/п═п÷пёп╓п╒п÷п∙п·п≥п∙_пё_п═п÷п²п÷п╜п╗п░_п⌠п≥п╒п⌡п╔п°п║_п≥_п°п≥п·п∙п п⌡п≥    
(перекодированное в UTF-8, но показанное как koi8-r)    
    
А до ВИКИ это доходит как РПУФТПЕОЙЕ У РПНПЭША ГЙТЛХМС Й МЙОЕКЛЙ    
Помогает    
$ echo РПУФТПЕОЙЕ У РПНПЭША ГЙТЛХМС Й МЙОЕКЛЙ | iconv -f koi8-r -t cp1251    
 
Если локаль cp1251, то до Вики доходит нормально. 
 
Если локаль UTF8, проблем вообще нет.
Comment 1 Sergey V Turchin 2006-02-15 18:18:39 MSK
(In reply to comment #0)  
> http://ru.wikipedia.org/wiki/Построение_с_помощью_циркуля_и_линейки      
Такой URL - нарушение стандарта 
 
Comment 2 Vitaly Lipatov 2006-11-20 22:11:12 MSK
Стандарта на что?
Предлагаете выкинуть из жизни википедию или вечно жить с транслитерацией?
Думаю ничего страшного и необычного в использовании UTF-8 для кодирования 
названий каталогов на веб-сервере, нет.
Comment 3 Andrey Rahmatullin 2006-11-20 22:41:49 MSK
Дада, какого стандарта? А то я только RFC 3987 знаю.
Comment 4 Sergey V Turchin 2006-11-21 12:54:07 MSK
http://www.w3.org/TR/html4/struct/links.html
RFC 1630
Comment 5 Andrey Rahmatullin 2006-11-21 16:11:36 MSK
3.  Relationship between IRIs and URIs

   IRIs are meant to replace URIs in identifying resources for
   protocols, formats, and software components that use a UCS-based
   character repertoire.  These protocols and components may never need
   to use URIs directly, especially when the resource identifier is used
   simply for identification purposes.  However, when the resource
   identifier is used for resource retrieval, it is in many cases
   necessary to determine the associated URI, because currently most
   retrieval mechanisms are only defined for URIs.  In this case, IRIs
   can serve as presentation elements for URI protocol elements.  An
   example would be an address bar in a Web user agent.  (Additional
   rationale is given in section 3.1.)

RFC3987
Comment 6 Vitaly Lipatov 2007-03-19 19:02:32 MSK
Я считаю что тут явная бага, безотносительно к стандартам - Википедия и прочие 
подобные ресурсы должны нормально открываться вне зависимости от кодировки 
локали.
Comment 7 Andriy Stepanov 2007-05-03 14:29:05 MSD
У меня не воспроизводится:

http://img224.imageshack.us/img224/1346/outeg7.jpg
Comment 8 Sergey V Turchin 2007-05-03 14:55:45 MSD
У меня вроде воспроизводилось, но я не думаю, что до KDE4 будут улучшения в 
этом плане. Если пытаться самому, боюсь, поломает все в неожиданных местах.
Comment 9 Vitaly Lipatov 2007-05-04 01:00:35 MSD
(In reply to comment #7)
> У меня не воспроизводится:
> 
> http://img224.imageshack.us/img224/1346/outeg7.jpg
> 
Возможно дело в LC_CTYPE?
Comment 10 Sergey Y. Afonin 2009-03-29 14:13:16 MSD
(In reply to comment #2)
> Предлагаете выкинуть из жизни википедию или вечно жить с транслитерацией?

А чем оно мешает в URL ? Только от проблем избавляет...
Comment 11 Andrey Rahmatullin 2009-03-29 14:21:33 MSD
(В ответ на комментарий №10)
> > Предлагаете выкинуть из жизни википедию или вечно жить с транслитерацией?
> А чем оно мешает в URL ?
Кто? Транслит? Тем же, чем в любых других местах. Не читаемый, отвратительно выглядит и создаёт впечатление "ниасилили технологии этого века".

> Только от проблем избавляет...
Проблемы исправлять надо, а не обходить.
Comment 12 Mikhail Gusarov 2009-03-29 14:23:19 MSD
(В ответ на комментарий №11)
> Проблемы исправлять надо, а не обходить.

В данном случае проблема - KDE3 + не-UTF8 локаль. Это скорее закапывать, по причине отсутствия желающих фиксить такую конфигурацию.
Comment 13 Sergey V Turchin 2010-02-27 17:10:19 MSK
(В ответ на комментарий №12)
> Это скорее закапывать, по
> причине отсутствия желающих фиксить такую конфигурацию.
Пожалуй