Bug 43440

Summary: Некорректное распознавание текста gscan2pdf
Product: Sisyphus Reporter: Анастасия Кирюхина <kiriukhinaaa>
Component: gscan2pdfAssignee: Vitaly Lipatov <lav>
Status: NEW --- QA Contact: qa-sisyphus
Severity: normal    
Priority: P5 CC: lav, vercha
Version: unstable   
Hardware: x86_64   
OS: Linux   
Attachments:
Description Flags
Исходное
none
gocr
none
tesseract
none
cuneiform none

Description Анастасия Кирюхина 2022-08-03 16:25:40 MSK
Created attachment 11267 [details]
Исходное

Тестовый стенд p10 kworkstation x86-64
Обновленный до Sisyphus

# rpm -qa | grep gscan2pdf
gscan2pdf-2.12.8-alt1

Шаги воспроизведения:

1. Подключить сканер.
2. Установить несколько программ: # apt-get install gocr tesseract cuneiform
3. Запустить программу из терминала: $ gscan2pdf
4. Файл -> Отсканировать. В открывшемся окне "Отсканировать документ" выбрать устройство. Вкладка "Постобработка" -> Сделать активным checkbox "Распознать отсканированные страницы" -> Выбрать по очереди каждую из программу для распознавания, язык -> Отсканировать.

Ожидаемый результат: После сканирования текст на вкладке "Текстовый слой" корректно отображается.

Фактический результат: После сканирования текст на вкладке "Текстовый слой" корректно отображается.

Приложены скрины - см. вложения.
Comment 1 Анастасия Кирюхина 2022-08-03 16:26:09 MSK
Created attachment 11268 [details]
gocr
Comment 2 Анастасия Кирюхина 2022-08-03 16:26:23 MSK
Created attachment 11269 [details]
tesseract
Comment 3 Анастасия Кирюхина 2022-08-03 16:26:37 MSK
Created attachment 11270 [details]
cuneiform
Comment 4 Анастасия Кирюхина 2022-08-03 16:28:54 MSK
> Фактический результат: После сканирования текст на вкладке "Текстовый слой"
> корректно отображается.

Читать: Фактический результат: После сканирования текст на вкладке "Текстовый слой" НЕ корректно отображается.