Bug 50788 (OCRdesktop)

Summary: Добавить пакет OCRdesktop
Product: New/proposed packages Reporter: Nikita <tseikovets>
Component: Обычный репозиторийAssignee: Artem Semenov <savoptik>
Status: NEW --- QA Contact: Andrey Cherepanov <cas>
Severity: normal    
Priority: P5 CC: manowar, viy
Version: не указана   
Hardware: all   
OS: Linux   
URL: https://github.com/chrys87/ocrdesktop

Description Nikita 2024-07-01 00:00:34 MSK
Предлагается добавить в Sisyphus пакет OCRdesktop. Это инструмент набора дополнительных технологий accessibility на системах GNU/Linux.

OCRdesktop позволяет получать контент с экрана в виде текста с помощью технологии OCR. Эта возможность востребована пользователями программ экранного доступа, таких как Orca, когда они не могут выполнить взаимодействие с графическим интерфейсом стандартным способом через AT-SPI2.

OCRdesktop берёт изображение текущего окна или рабочего пространства, подготавливает его для лучших результатов и использует tesseract для распознавания текста на нём. Результат отображается в текстовой области с включённым курсором, в подробном списке с координатами и достоверностью или в буфере обмена. Он также может эмулировать щелчки по тексту, чтобы обеспечить возможность взаимодействия с распознанным графическим интерфейсом.

В spec-файле данному пакету наиболее логичным представляется указать категорию Accessibility.

OCRdesktop - это приложение на Python с рядом дополнительных зависимостей. Кажется, что в Sisyphus  есть уже практически все пакеты из его зависимостей, разве что за исключением необязательной зависимости python-pdf2image для поддержки PDF, который сходу не получилось найди. Все зависимости перечислены в репозитории проекта.

Ссылки по теме:
* Репозиторий OCRdesktop на GitHub: https://github.com/chrys87/ocrdesktop
* Страница OCRdesktop в ArchWiki, где документировано больше аспектов, чем в репозитории: https://wiki.archlinux.org/title/Ocrdesktop