URL: https://www.opennet.dev/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID15
Нить номер: 4824
[ Назад ]

Исходное сообщение
"Чем точно распознать документ на русском языке? "

Отправлено mandms , 09-Авг-22 05:14 
Посоветуйте, пожалуйста, лучший способ бесплатно отсканировать документ на русском языке?
буду по главам книгу сканировать, хотелось бы максимально минимизировать ручное исправление.

Скан книги - PDF файл, в котором вместо текста каждая страница вставлена картинкой.

Подойдет любой бесплатный способ, хоть open source, хоть freeware, хоть desktop программа с каким-то триальным периодом, в который можно уложиться.

Желательно конечно, чтоб способ под Linux (Desktop) работал, но если нет, то и другие тоже подойдут, Windows, Macos.

Из того что нашёл
1. В Google Disk-е есть способ отсканировать при загрузке - но для русского языка не пробовал его, качество не знаю. Если кто-то делал отпишитесь пожалуйста.
2. В Yandex бизнес-пакете 360 что-то есть, но оно жутко дорогое (130р за 1000 знаков) но и при этом работает только с фотками из смартфонов, в общем способ не подходит.

В интернете много вариантов, непонятно какой самый лучший, в данном случае самый точный.


Содержание

Сообщения в этом обсуждении
"Чем точно распознать документ на русском языке? "
Отправлено Аноним , 09-Авг-22 06:47 
тессеракт https://qna.habr.com/q/1048984

"Чем точно распознать документ на русском языке? "
Отправлено Zalanar , 16-Авг-22 18:09 
> тессеракт https://qna.habr.com/q/1048984

Он существует?


"Чем точно распознать документ на русском языке? "
Отправлено Аноним , 09-Авг-22 16:00 
> В интернете много вариантов, непонятно какой самый лучший, в данном случае самый
> точный.

Ага, лучше потратить кучу времени на написание этого поста, чем взять и протестировать за 10 минут все эти варианты


"Чем точно распознать документ на русском языке? "
Отправлено Аноним , 09-Авг-22 17:34 
>> В интернете много вариантов, непонятно какой самый лучший, в данном случае самый
>> точный.
>  Ага, лучше потратить кучу времени на написание этого поста, чем взять
> и протестировать за 10 минут все эти варианты

За минуту.


"Чем точно распознать документ на русском языке? "
Отправлено mandms , 09-Авг-22 20:19 
>> В интернете много вариантов, непонятно какой самый лучший, в данном случае самый
>> точный.
>  Ага, лучше потратить кучу времени на написание этого поста, чем взять
> и протестировать за 10 минут все эти варианты

только самый нерабочий вариант займет 10 минут. любой рабочий вариант займет от часа до трёх если совсем рабочий


"Чем точно распознать документ на русском языке? "
Отправлено zandyg , 24-Авг-22 18:12 
ABBYY FineReader PDF 15 for Windows.

7 days full functionality for working with PDF documents like editing, commenting, and document comparison.
Saving conversion results after applying OCR (including automated conversion in Hot Folder) for 100 pages total.