Bug 11918

Summary: pdftotext default encoding
Product: Sisyphus Reporter: Anton Farygin <rider>
Component: xpdf-utilsAssignee: Andrew Savchenko <bircoph>
Status: CLOSED WONTFIX QA Contact: qa-sisyphus
Severity: normal    
Priority: P2 CC: bircoph
Version: unstable   
Hardware: all   
OS: Linux   

Description Anton Farygin 2007-05-30 10:51:52 MSD
Просьба сделать кодировку по умолчанию для pdftotext - UTF-8, а не Latin1
В этом случае будет нормально работать просмотр русских pdf у программ,
использующих pdftotext в качестве фильтра.
Comment 1 Anton Farygin 2007-05-30 10:52:32 MSD
например у того-же пресловутого MC
Comment 2 Victor Forsyuk 2007-11-07 14:24:20 MSK
(In reply to comment #0)
> Просьба сделать кодировку по умолчанию для pdftotext - UTF-8, а не Latin1
> В этом случае будет нормально работать просмотр русских pdf у программ,
> использующих pdftotext в качестве фильтра.

Просмотр будет нормальным только для консоли в UTF-8. А это далеко не всегда
имеет место..
Comment 3 Victor Forsyuk 2007-11-07 14:29:10 MSK
(In reply to comment #1)
> например у того-же пресловутого MC

В случае вызова из MC'шного mc.ext правильным решением будет смотреть на
кодировку  консоли. То есть, не просто вызывать pdftotext, а в зависимости от
того, в какой кодировке консоль (utf-8, koi8, windows-1251) подставлять нужное
значение в параметр -enc утилиты pdftotext.
Comment 4 Victor Forsyuk 2007-11-12 12:14:29 MSK
Поскольку мне сейчас необходимо сделать сборку xpdf, по другим причинам, хотел
бы услышать есть ли контраргумены к моей позиции или нет? Если нет, то будет
WONTFIX и enhancement для mc.
Comment 5 Victor Forsyuk 2007-11-16 13:11:08 MSK
OK, закрываю.