Вышла новая версия с поддержкой русского и украинского http://code.google.com/p/tesseract-ocr/downloads/list
Спасибо, я читал на ЛОРе )). Проблема в том, какие языки по умолчанию собирать? Думаю вообще никаких, а языковые пакеты отдельно делать. А то их тысяча и один.
ну а вдруг не читал? :) да наверное языковые - отдельно
tesseract-langpack-3.00-alt1 -> sisyphus: * Wed Aug 31 2011 Andrey Cherepanov <cas@altlinux> 3.00-alt1 - Initial import in Sisyphus for tesseract 3.00 (closes: #24221)