Bug 11918 - pdftotext default encoding
Summary: pdftotext default encoding
Status: CLOSED WONTFIX
Alias: None
Product: Sisyphus
Classification: Development
Component: xpdf-utils (show other bugs)
Version: unstable
Hardware: all Linux
: P2 normal
Assignee: Andrew Savchenko
QA Contact: qa-sisyphus
URL:
Keywords:
Depends on:
Blocks:
 
Reported: 2007-05-30 10:51 MSD by Anton Farygin
Modified: 2008-02-26 15:03 MSK (History)
1 user (show)

See Also:


Attachments

Note You need to log in before you can comment on or make changes to this bug.
Description Anton Farygin 2007-05-30 10:51:52 MSD
Просьба сделать кодировку по умолчанию для pdftotext - UTF-8, а не Latin1
В этом случае будет нормально работать просмотр русских pdf у программ,
использующих pdftotext в качестве фильтра.
Comment 1 Anton Farygin 2007-05-30 10:52:32 MSD
например у того-же пресловутого MC
Comment 2 Victor Forsyuk 2007-11-07 14:24:20 MSK
(In reply to comment #0)
> Просьба сделать кодировку по умолчанию для pdftotext - UTF-8, а не Latin1
> В этом случае будет нормально работать просмотр русских pdf у программ,
> использующих pdftotext в качестве фильтра.

Просмотр будет нормальным только для консоли в UTF-8. А это далеко не всегда
имеет место..
Comment 3 Victor Forsyuk 2007-11-07 14:29:10 MSK
(In reply to comment #1)
> например у того-же пресловутого MC

В случае вызова из MC'шного mc.ext правильным решением будет смотреть на
кодировку  консоли. То есть, не просто вызывать pdftotext, а в зависимости от
того, в какой кодировке консоль (utf-8, koi8, windows-1251) подставлять нужное
значение в параметр -enc утилиты pdftotext.
Comment 4 Victor Forsyuk 2007-11-12 12:14:29 MSK
Поскольку мне сейчас необходимо сделать сборку xpdf, по другим причинам, хотел
бы услышать есть ли контраргумены к моей позиции или нет? Если нет, то будет
WONTFIX и enhancement для mc.
Comment 5 Victor Forsyuk 2007-11-16 13:11:08 MSK
OK, закрываю.