Summary: | \'encoding\' field ignored by utils | ||
---|---|---|---|
Product: | Sisyphus | Reporter: | Vitaly A. Ostanin <vyt> |
Component: | docbook-utils | Assignee: | Mikhail Zabaluev <mhz> |
Status: | CLOSED WONTFIX | QA Contact: | |
Severity: | minor | ||
Priority: | P4 | CC: | aris |
Version: | unstable | ||
Hardware: | all | ||
OS: | Linux |
Description
Vitaly A. Ostanin
2002-03-19 16:59:12 MSK
Explicit specification of the character set in HTML files is: - not belonging to the core standard; - considered harmful. Therefore, I think, the HTML issue is not a bug. On RTF I\'m not sure; the codepage information might probably be hacked into \\ansicpgNNN tag (oh ugliness), but this would open another can of worms. Explicit specification of the character set in HTML files is: - not belonging to the core standard; - considered harmful. Therefore, I think, the HTML issue is not a bug. On RTF I\'m not sure; the codepage information might probably be hacked into \\ansicpgNNN tag (oh ugliness), but this would open another can of worms. Так чем нужно пользоваться для определения кодировки в html? Не по content type charset= работает автоопределение кодировки? Для rtf указание языка должно быть - сделал rtf из koi8-r и из cp1251 - оба в ворде не читаются. В общем, если это не баги, поделитесь right way, pls. Так чем нужно пользоваться для определения кодировки в html? Не по content type charset= работает автоопределение кодировки? Для rtf указание языка должно быть - сделал rtf из koi8-r и из cp1251 - оба в ворде не читаются. В общем, если это не баги, поделитесь right way, pls. Определение кодировки в HTML традиционно возложено на внешние средства, главным образом HTTP (откуда и пришла <META http-equiv=\"...\" ...>) и MIME. Автоопределение кодировки в файле, по-моему, не входит в сферу рассмотрения системы генерации. Насчёт rtf присяжные всё ещё совещаются. Может быть, имеет смысл делать escapes для всех не-ASCII символов? Будем смотреть, что на самом деле производит backend rtf. Определение кодировки в HTML традиционно возложено на внешние средства, главным образом HTTP (откуда и пришла <META http-equiv=\"...\" ...>) и MIME. Автоопределение кодировки в файле, по-моему, не входит в сферу рассмотрения системы генерации. Насчёт rtf присяжные всё ещё совещаются. Может быть, имеет смысл делать escapes для всех не-ASCII символов? Будем смотреть, что на самом деле производит backend rtf. Неудачная традиция, совершенно не right way :( Как быть с html, полученными не через http, локально, например? Лучше бы это было опционально в utils - ставить кодировку или нет. Я бы, например, ставил - документацию будут читать люди, которые про \"not belonging\" не слышали (надеюсь, что будут :)). Кстати, russian apache, упомянутый в похожем обсуждении в <a href="mailto:devel@altlinux.ru" target="_new">devel@altlinux.ru</a> - тоже не лучшее решение. Насчет rtf как-то упоминалось (если не ошибаюсь, AEN\'ом), что там должно быть указание языка. Неудачная традиция, совершенно не right way :( Как быть с html, полученными не через http, локально, например? Лучше бы это было опционально в utils - ставить кодировку или нет. Я бы, например, ставил - документацию будут читать люди, которые про \"not belonging\" не слышали (надеюсь, что будут :)). Кстати, russian apache, упомянутый в похожем обсуждении в <a href="mailto:devel@altlinux.ru" target="_new">devel@altlinux.ru</a> - тоже не лучшее решение. Насчет rtf как-то упоминалось (если не ошибаюсь, AEN\'ом), что там должно быть указание языка. The problem is, OpenJade in its current state does not recognize koi8-r and windows-1251 (NB the IANA-approved name). For HTML, this is not fatal, apart from the questionable META issue. The RTF case can be helped by converting the XML source file to utf-8, with appropriate document changes. Then, run jw this way: SP_ENCODING=utf-8 jw -b rtf file.xml The problem is, OpenJade in its current state does not recognize koi8-r and windows-1251 (NB the IANA-approved name). For HTML, this is not fatal, apart from the questionable META issue. The RTF case can be helped by converting the XML source file to utf-8, with appropriate document changes. Then, run jw this way: SP_ENCODING=utf-8 jw -b rtf file.xml Ок, спасибо. Feedback все еще нужен? Тогда чем, перевесить багу на openjade? Ок, спасибо. Feedback все еще нужен? Тогда чем, перевесить багу на openjade? Use xsltproc with either chunk stylesheets or hack stylesheet wrappers with charset specified, supplied in the docbook-style-xsl package. Use xsltproc with either chunk stylesheets or hack stylesheet wrappers with charset specified, supplied in the docbook-style-xsl package. Как оказалось, это не баг. Для указания кодировки действительно лучше пользоваться стилями из docbook-style-xsl. Как оказалось, это не баг. Для указания кодировки действительно лучше пользоваться стилями из docbook-style-xsl. |