The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Новая система оптического распознавания текста EasyOCR"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от opennews (??), 08-Июл-20, 22:49 
Проектом EasyOCR развивается новая система оптического распознавания текста, поддерживающая более 40 языков, включая английский, немецкий, французский, японский, китайский, корейский, узбекский, азербайджанский и литовский. Языки на основе кириллицы пока не поддерживаются, но их добавление в списке планов. Код написан на языке Python c использованием фреймворка PyTorch и распространяется под лицензией Apache 2.0. Для загрузки предоставляются готовые модели для языков на основе латинского алфавита и иероглифов...

Подробнее: https://www.opennet.dev/opennews/art.shtml?num=53314

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по времени | RSS]


1. "Новая система оптического распознавания текста EasyOCR"  +5 +/
Сообщение от Аноним (1), 08-Июл-20, 22:49 
Годно, нужно, не тессерактом единым. Правда, у abby распознавание работало лучше, чем у тессеракта ещё 20 лет назад и это было до хайпа на нейронки. Тессеракт уже овер 500 лет развивается всякими гуглами, этот проект уже может с ним конкурировать, какие у него преимущества в наличии? У меня были проблемы с распознаванием китайского в тессеракте, даже в монохромных изображениях, гугл наверное использует что-то другое или он зажал нормальные модели.
Ответить | Правка | Наверх | Cообщить модератору

3. "Новая система оптического распознавания текста EasyOCR"  –1 +/
Сообщение от Ivan_83 (ok), 08-Июл-20, 23:22 
Я с ним совсем пало игрался, но мне помогло запскейлить изображение раза в 2-4 и потом уже скормить тессеракту.
Ответить | Правка | Наверх | Cообщить модератору

5. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от artenaki (ok), 09-Июл-20, 01:01 
Чтобы распознавалки хорошо распознавали надо чистить изображения от лишнего, как сказано здесь http://subs.com.ru/page.php?al=videosubfinder_hardsub
Ответить | Правка | Наверх | Cообщить модератору

31. "Новая система оптического распознавания текста EasyOCR"  –1 +/
Сообщение от анон (?), 09-Июл-20, 12:30 
Теряется шум от букв, а это уже важная информация.
Ответить | Правка | Наверх | Cообщить модератору

8. "Новая система оптического распознавания текста EasyOCR"  +14 +/
Сообщение от Аноним (-), 09-Июл-20, 02:22 
Пора понять и смириться, что под Linux ничего даже близко подобного FineReader не будет. Не появилось за 27 лет и в ближайшем будущем тоже не предвидится... (да-да, знаю, свой движок ковыряйте сами, я про готовый продукт для конечного пользователя). С помощью FineReader я распознавал сотни книг еще в бородатых 90х... и это было мощь! Под Linux ни один проект до сих пор такого уровня распознавания не имеет, это один из немногочисленных минусов Linux, но ктож виноват, что разработчики FineReader такие жлобы и не хотят портировать его... За 27 лет могли бы озаботиться. Есть какие-то проекты, в т.ч. от гугла, но русский распознает там просто г**но - тестил на сотнях книг. Слишком уникальный и сложный софт, здесь только один игрок, который давно порешал весь рыночек, и Linux любовью обделил...
Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

12. "Новая система оптического распознавания текста EasyOCR"  +3 +/
Сообщение от Аноним (1), 09-Июл-20, 02:57 
Ну вообще-то, линукс поддерживается, просто это не та пользовательская приложуха. https://www.abbyy.com/ocr-sdk/technical-specifications/
Ответить | Правка | Наверх | Cообщить модератору

14. "Новая система оптического распознавания текста EasyOCR"  –4 +/
Сообщение от iPony129412 (?), 09-Июл-20, 04:24 
> но ктож виноват, что разработчики FineReader такие жлобы и не хотят портировать его...

Десктопный линукс с 1-2% 🤷♂
А так «серверная» версия есть, для интеграции с различными разработками.

Ответить | Правка | К родителю #8 | Наверх | Cообщить модератору

17. "Новая система оптического распознавания текста EasyOCR"  –4 +/
Сообщение от Аноним (17), 09-Июл-20, 08:39 
> Десктопный линукс с 1-2% 🤷♂

лол, даже у Бацьки 3%

Ответить | Правка | Наверх | Cообщить модератору

36. "Новая система оптического распознавания текста EasyOCR"  +6 +/
Сообщение от хотел спросить (?), 09-Июл-20, 12:49 
яки ён табе бацька, сабака?
Ответить | Правка | Наверх | Cообщить модератору

15. "Новая система оптического распознавания текста EasyOCR"  –4 +/
Сообщение от Тот_Самый_Анонимус (?), 09-Июл-20, 08:14 
> но ктож виноват, что разработчики FineReader такие жлобы

Линух и виноват. Под виндой была одна платформа — винНТ. У линя зоопарк дистров. Кому придёт в голову разрабатывать комерческий продукт хз под какие условия? И этот зоопарк дистров живёт всего на 1% компов.

Кстати, разработчики гнома тоже жлобы: они не портирую на вин гномегеймс. Облейте дeрмецом и их.

Ответить | Правка | К родителю #8 | Наверх | Cообщить модератору

18. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от And (??), 09-Июл-20, 09:08 
Косяк в набросе - уж очень явное враньё.
Из-за косяка сразу эффект не так забавен.

Как раз достоинство Л. в том, что под любым дистром из зоопарка работает Ок.

Ответить | Правка | Наверх | Cообщить модератору

19. "Новая система оптического распознавания текста EasyOCR"  –1 +/
Сообщение от iPony129412 (?), 09-Июл-20, 09:37 
Разработчики в курсе?
А то можно зайти на чуть ли не на любой багтрекер опенсормного десктопного проекта, и там находить DE специфичные баги

То с каким-то буфером обмена начнут приложения падать, а лезть к тебе будут:
https://github.com/telegramdesktop/tdesktop/issues/6952

То как-то не так выглядеть всё это будет
https://github.com/telegramdesktop/tdesktop/issues/7399

Это всё загромождает багтрекер, и причём сразу и не понятно, в чём баг.
То есть можно ли прям с разворота сказать "это не наш баг, идите плачьтесь разработчикам KDE"

Ответить | Правка | Наверх | Cообщить модератору

30. "Новая система оптического распознавания текста EasyOCR"  +2 +/
Сообщение от Клыкастый (ok), 09-Июл-20, 11:56 
> Разработчики в курсе?

Разработчики - в курсе. Про смузихлёбов "я тут [с трудом] собрал экзешник, хочу чтоб он работал везде и всегда [второй раз я на такой подвиг не отважусь, да и не получится]" не в курсе, пытай их сам.

> Это всё загромождает багтрекер, и причём сразу и не понятно, в чём баг.

Такое у них свойство, у багов - они не бегают по экрану с табличками "алё, пофикси с строке ### в сорце ####". И такое у них свойство - у пользователей, излагать проблемы так, что без длительного допроса с пристрастием вообще зачастую непонятно о чём речь.

Но есть и обратная сторона опенсорсных багтрекеров. Иногда на них заходят парни и девушки, понимающие чуть больше, чем офисный хомячок и к своим немногословным претензиям они присовокупляют патчи и PRы.

Ну вот как-то так.

И да, не знаю как в мире розовыхявапоней (может там всё проще, типа нихрена не работает да и ладно) но в багтрекерах вендовых софтин (ну где они есть, потому что схема "давай денег и иди на юх" не подразумевает такого) тоже есть баги XP-w7-32/64 и прочие специфичные. Чем это отличается от DE-специфичных?

Ответить | Правка | Наверх | Cообщить модератору

37. "Новая система оптического распознавания текста EasyOCR"  –2 +/
Сообщение от iPony129412 (?), 09-Июл-20, 13:11 
> хомяки, смузихлёбы, розовыхявапоней
> Иногда на них заходят парни и девушки, понимающие чуть больше, чем офисный хомячок и к своим немногословным претензиям они присовокупляют патчи и PRы.

А разработчикам это как-то не сдалось. И если продукт тем более проприетарный (ещё Adobe поучи как бизнес надо делать), то тут уж.

Это всё давно обсосано, опенсорс или не опенсорс модели работают по разному и нет однозначго ответа типа "закрытая/открытая модель лучше для всего"

Поэтому эти глупости детского максимализма и вот такого ЧСВ оставь при себе.

> тоже есть баги XP-w7-32/64 и прочие специфичные. Чем это отличается от DE-специфичных?

Да, кончено. Но зоопарк гораздо меньше и проще.
Ну а XP-нутых вообще сразу посылать. Особо в 2020 году-то...
До линуксов с несколько дистрибутивов * несколько звуковых серверов * несколько видео серверов ; несколько ДЕ - это в ни какое сравнение не идёт. Да, конечно, это всё не всегда и не для каждого ПО бабахает, но бабахает всё же.

Ответить | Правка | Наверх | Cообщить модератору

39. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от artenaki (ok), 09-Июл-20, 13:25 
> XP-нутых вообще сразу посылать

Пони забыли спросить. Японцы до сих пор под Windows 98 собирают и не только японцы. Учись, студент. А твои питоновские поделки к следующей минорной версии развалятся
https://www.vpngate.net/en/download.aspx
http://www.nyam.pe.kr/dev/imagine/#system_requirements
https://www.ghisler.com/download.htm

Ответить | Правка | Наверх | Cообщить модератору

41. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от iPony129412 (?), 09-Июл-20, 13:29 
> Вон две какие подделки есть, а ещё Total Commander собирают под Windows XP

Их право. Но это исключения из правила.


Ответить | Правка | Наверх | Cообщить модератору

42. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от artenaki (ok), 09-Июл-20, 13:42 
Что исключение? Еще множество софта XP поддерживает, это факт.
Мне что тебя ссылками тыкать?
На
https://potplayer.daum.net
https://foobar2000.org/download
Ответить | Правка | Наверх | Cообщить модератору

43. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от artenaki (ok), 09-Июл-20, 13:48 
> две какие подделки есть

Сначала разверни свою сеть VPN серверов, напиши софт такого уровня https://en.wikipedia.org/wiki/SoftEther_VPN а потом говори о поделках.
А ты случайно не клон фрактала? Очень похож.

Ответить | Правка | К родителю #41 | Наверх | Cообщить модератору

46. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от Клыкастый (ok), 09-Июл-20, 17:20 
> А разработчикам это как-то не сдалось.

Активно используют.

> И если продукт тем более проприетарный (ещё Adobe поучи как бизнес надо делать), то тут уж.

Это ты так спрятался за Adobe? Да ещё и подменил тему программирования бизнесом?

> Это всё давно обсосано, опенсорс или не опенсорс модели работают по разному
> и нет однозначго ответа типа "закрытая/открытая модель лучше для всего"

Да ещё и решил сбавить обороты на нейтральное?

> Поэтому эти глупости детского максимализма и вот такого ЧСВ оставь при себе.

Но всё же напоследок уязвить?

>> тоже есть баги XP-w7-32/64 и прочие специфичные. Чем это отличается от DE-специфичных?
> Да, кончено. Но зоопарк гораздо меньше и проще.

Нет. Просто есть способы искусственно его "уменьшить"

> Ну а XP-нутых вообще сразу посылать. Особо в 2020 году-то...

Ну вот например забить на часть пользователей. Проприетарные конторы и под линукс вполне на это способны.

> До линуксов с несколько дистрибутивов * несколько звуковых серверов * несколько видео
> серверов ; несколько ДЕ - это в ни какое сравнение не
> идёт. Да, конечно, это всё не всегда и не для каждого
> ПО бабахает, но бабахает всё же.

Не нужно громких слов про "бабахает", извини за каламбур. Из всего перечисленного сколько-нибудь серьёзная проблема это Xorg/wayland. И она имеет различные решения от "мы поддерживаем что-то одно" до стандартных решений по совместимости. Собственно полно мелких проектов от вчерашних студентов в количестве 1-2 человека, которые годами их, проекты, двигают без видимых затруднений. С чего у "серьёзных программистов серьёзных контор" это может вызывать проблемы, неясно. По мне так не вызывает. При хорошем подходе конторы могут писать даже кроссплатформенный код, а вот это чуть более реальная проблема, чем "две звуковых подсистемы".

На моей практике заунывные песни про "зоопарк DE" заводили граждане с вендовым бэкграундом но без "хороших манер программирования", то что ранее я назвал "смузихлёбы". Так что если ты скажешь опять про деньги и менеджмент - тут я соглашусь, вот тут с удовольствием и долго будут дуть в уши про "сегментация дистрибутивов", "увеличение затрат на поддержку" и ещё десятки умномодных слов. За которыми стоит простая истина - ни разрабатывать ни поддерживать что-то кроме бинарей под венду они не умеют и не собираются. Даже если рядом будут те, которые это делают успешно.

Ответить | Правка | К родителю #37 | Наверх | Cообщить модератору

48. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от iPony129412 (?), 09-Июл-20, 17:59 
> Активно используют.

Кто и что? Я сейчас открою Steam от Valve, которая очень любит линукс и оно будет выглядеть, как... Ну как сделали, так сделали...
Декораторы от Windows. Иконки в доке той же Ubuntu не работают.
И такое оно всё вот...

> На моей практике заунывные песни про "зоопарк DE" заводили граждане с вендовым бэкграундом но без "хороших манер программирования", то что ранее я назвал "смузихлёбы".

Ну а что от фанатика другого ждать...

> ни разрабатывать ни поддерживать что-то кроме бинарей под венду они не умеют и не собираются

Не верно. Этим не ограничивается - кроме Windows и десктопного Линукс ещё есть ОС. И не только десктопные. Ну там тоже проблемы с мобильной ОС на основе линукса ака Android - зоопарк всё же.

Ответить | Правка | Наверх | Cообщить модератору

38. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от iPony129412 (?), 09-Июл-20, 13:17 
> тоже есть баги XP-w7-32/64 и прочие специфичные.

И не забывай, что XP - это 2001. Тогда даже "дефолтного" ныне линукса Ubuntu не было...

Ответить | Правка | К родителю #30 | Наверх | Cообщить модератору

40. "Новая система оптического распознавания текста EasyOCR"  –1 +/
Сообщение от iPony129412 (?), 09-Июл-20, 13:25 
Потому что ты думаешь не головой а другим местом.

Это ты же мне заяснял бредятину, что в Pidgin не засовывают видеозвонки, потому что нужны ВебКамеры проекту и с хорошим качеством передачи (а то же как на средней камере разрабатывать, если брови чётко не видно), а не то, что рук нет.

Тебе всё само как-то должно делаться, и прибегать волшебное опенсорс сообщество.
А это хорошо для сказок. А вот в реальности далеко не всегда прибегает.

Ответить | Правка | К родителю #30 | Наверх | Cообщить модератору

47. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от Клыкастый (ok), 09-Июл-20, 17:53 
Ты меня явно с кем-то путаешь. И про Pidgin с бровями - не ко мне, и опенсорс сообщество я далеко не идеализирую. Вопрос совершенно простой - вой про ужасный линукс, под который "нормальные конторы" разрабатывать не могут - это вой не про линукс, а про отрицание новых подходов и традиций (которые - есть) на новом рынке (насколько он интересен - вопрос второй). При чём если рынок неинтересен, так и разговор короткий, и спорить не о чем. А вот длинные и мутные описания проблем чаще всего пузырьки над глубинным "не хочу учиться/меняться/осваивать". При чём если посмотреть что коммерсанты осваивали и заставляли сотрудников осваивать, так в общем багтрекеры с гитами и не проблема вовсе.
Ответить | Правка | Наверх | Cообщить модератору

49. "Новая система оптического распознавания текста EasyOCR"  –1 +/
Сообщение от iPony129412 (?), 09-Июл-20, 18:05 
> Ты меня явно с кем-то путаешь. И про Pidgin с бровями  не ко мне

А да, перепутал и аватарки и риторика детского максимализма похожа.

https://www.opennet.dev/~Ne01eX

Извиняюсь.

Ответить | Правка | Наверх | Cообщить модератору

57. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от Клыкастый (ok), 14-Июл-20, 21:02 
> А да, перепутал и аватарки и риторика детского максимализма похожа.

Вот было бы даже обидно, если бы это сказал не проприетарщик, который страдает от сборки софта. Проблема, с которой смышлёные школьники справляются без особых впечатлений.

> Извиняюсь.

Делай это в укромном месте.

Ответить | Правка | Наверх | Cообщить модератору

32. "Новая система оптического распознавания текста EasyOCR"  –1 +/
Сообщение от апрар (?), 09-Июл-20, 12:34 
балабол. Собери, запакеть и поддерживай еще под каждый дистр сперва, а есть еще и роллинги...
Снапы всякие тру линуксоиды хэйтят, натив хотят
Ответить | Правка | К родителю #18 | Наверх | Cообщить модератору

50. "Новая система оптического распознавания текста EasyOCR"  –2 +/
Сообщение от Тот_Самый_Анонимус (?), 09-Июл-20, 19:32 
> Косяк в набросе - уж очень явное враньё.
> Из-за косяка сразу эффект не так забавен.
> Как раз достоинство Л. в том, что под любым дистром из зоопарка работает Ок.

Слишком толсто. То-то я погляжу под линух целая очередь популярных программ выстроилась. Потому что под ним всё ОК.

Вин, Мак, Ондройд — вот под них делают версии, ибо есть стандарт. А под линь — нет, ибо зоопарк. У тебя в голове мозги, или кю?

Ответить | Правка | К родителю #18 | Наверх | Cообщить модератору

58. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от Клыкастый (ok), 14-Июл-20, 21:15 
> Слишком толсто. То-то я погляжу под линух целая очередь популярных программ выстроилась.
> Потому что под ним всё ОК.

Не поверишь - популярные программы есть и под линух. И многие из них собираются под BSD и макось. То, что "разработчики популярных программ" в твоей интерпретации напоминают баранов, впадающих в ступор от новых ворот - сугубо их особенность.

> Вин, Мак, Ондройд — вот под них делают версии, ибо есть стандарт.

POSIX, FHS и прочее - стандарты на месте. А то что разработчики "популярных программ" их не осиливают, то это проблема не стандартов. Да и то сказать - они и под венду так пишут. Сколько популярных программ не переживут систему на диске D:? Как давно они научились писать софт который не требует админских прав? Когда вендовые программы перестанут систему превращать в лоскутное одеяло, отрисовывая каждая своё обрамление? Можно не отвечать.

Ответить | Правка | Наверх | Cообщить модератору

24. "Новая система оптического распознавания текста EasyOCR"  +2 +/
Сообщение от Аноним (24), 09-Июл-20, 10:56 
>> но ктож виноват, что разработчики FineReader такие жлобы
> Линух и виноват. Под виндой была одна платформа — винНТ. У линя
> зоопарк дистров. Кому придёт в голову разрабатывать комерческий продукт хз под
> какие условия? И этот зоопарк дистров живёт всего на 1% компов.

Ну, допустим есть коммерческие продукты под коммерческую же красношляпу, зачастую это профессиональные программы для видео, которые раньше делались для IRIX например, было бы желание.

Причём зоопарк дистров это проблема в умах вантузят, опенсорс проектам достаточно выкладывать исходники, чтобы майнтейнеры опакечивали, в этом проблем нет.
Проприерасты же без проблем договариваются с продакшон-дистрами, на поставку бинарей, которые также опакечиваются, тем более что продакшон дистра всего два с половиной это красношляпа с сусей и убунтодебиан. Причём как правило достаточно одной rpm для красношляпы и одной deb для бубунты.
Всякие школорачи и прочие болгеносы это не энтерпрайз и не ЦА проприерастов.

Ответить | Правка | К родителю #15 | Наверх | Cообщить модератору

51. "Новая система оптического распознавания текста EasyOCR"  –1 +/
Сообщение от Тот_Самый_Анонимус (?), 09-Июл-20, 19:34 
> опенсорс проектам достаточно выкладывать исходники, чтобы майнтейнеры опакечивали, в этом проблем нет.

Речь о проекте с закрытым кодом

> Проприерасты же без проблем договариваются с продакшон-дистрами, на поставку бинарей, которые также опакечиваются, тем более что продакшон дистра всего два с половиной это красношляпа с сусей и убунтодебиан. Причём как правило достаточно одной rpm для красношляпы и одной deb для бубунты.

Где фотошоп, МСО или файнридер?

> Всякие школорачи и прочие болгеносы это не энтерпрайз и не ЦА проприерастов.

Да и остальные, как видим, тоже не ЦА. Так что обделавшись подотритесь.

Ответить | Правка | Наверх | Cообщить модератору

55. "Новая система оптического распознавания текста EasyOCR"  +1 +/
Сообщение от elsin (?), 09-Июл-20, 22:22 
https://www.winehq.org/ так вот же фотошоп, МСО или файнридер
Ответить | Правка | Наверх | Cообщить модератору

56. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от Тот_Самый_Анонимус (?), 09-Июл-20, 23:55 
> https://www.winehq.org/ так вот же фотошоп, МСО или файнридер

Через опу и без гарантий? Живите так сами.

Ответить | Правка | Наверх | Cообщить модератору

27. "Новая система оптического распознавания текста EasyOCR"  +1 +/
Сообщение от artenaki (ok), 09-Июл-20, 11:13 
Статически можно линковать. Не проблема, имхо. Да и стандарт LSB не просто так придумали, спросите Зенитара.
Ответить | Правка | К родителю #15 | Наверх | Cообщить модератору

44. "Новая система оптического распознавания текста EasyOCR"  +1 +/
Сообщение от Аноним (24), 09-Июл-20, 13:49 
> Статически можно линковать. Не проблема, имхо. Да и стандарт LSB не просто
> так придумали, спросите Зенитара.

За статическую линковку я уже давно говорил, что её от разработчика вполне достаточно, если это опенсорсный продукт, то и не нужно создавать гору пакетов для разных дистров, достаточно статической линковки и распространять тарболом.

Этого вполне достаточно, чтобы ознакомиться с программой, кому надо, тот для своего дистрибутива соберёт. Ну и само собой - сорцы выложить.

А проприерасты и так договорятся с продакшон-дистрстрами, примеры есть.

Ответить | Правка | Наверх | Cообщить модератору

45. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от Аноним (45), 09-Июл-20, 14:44 
Причем тут зоопарк, сложно не сложно. Выгодно будут - сделают (хоть под один дистр). Просто распиарен Linux мало = мало пользователей. Сильная хватка нужна для %. Та же история с Firefox и Opera, кстати.
Ответить | Правка | К родителю #15 | Наверх | Cообщить модератору

52. "Новая система оптического распознавания текста EasyOCR"  –1 +/
Сообщение от Тот_Самый_Анонимус (?), 09-Июл-20, 19:36 
> Причем тут зоопарк, сложно не сложно. Выгодно будут - сделают (хоть под один дистр). Просто распиарен Linux мало = мало пользователей. Сильная хватка нужна для %. Та же история с Firefox и Opera, кстати.

20 лет всё никак. Не судьба, значит.

Ответить | Правка | Наверх | Cообщить модератору

26. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от artenaki (ok), 09-Июл-20, 11:09 
> Пора понять и смириться, что под Linux ничего даже близко подобного FineReader не будет. Не появилось за 27 лет и в ближайшем будущем тоже не предвидится
> разработчики FineReader такие жлобы и не хотят портировать его

Есть онлайн версия. Платная, естественно. Бесплатно дается 5 или 10 страниц в месяц. Удобно, что на сервере самая последняя версия (14, которая на XP уже не ставится, 13 они пропустили, а зря) и не гадит. Но в ней нет смысла. Потому что бесплатный https://onlineocr.net распознает лучше. Вот как раз тот корейский текст FineReader вообще не увидел. Возможно, ему нужна предварительная обработка, которую делает onlineocr.net.

Конечно, как с оффлайн версией не получится схитрить, утянув с торрентов. Правда, я думаю, что онлайн все-таки невыгоден по ценам. Да и FineReader далеко не идеал, сколько я с ним мучался.

Ответить | Правка | К родителю #8 | Наверх | Cообщить модератору

29. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от artenaki (ok), 09-Июл-20, 11:18 
Проверьте сами, если не верите https://finereaderonline.com/ru-ru
Цены отстой https://finereaderonline.com/ru-ru/Store
10 тысяч рублей в год за 5000 страниц. Ну это курам на смех такое количество. В одном фильме может быть 1500 строк (картинок).
Что в сервисах синтеза речи, что распознавания онлайн вообще не катит. Без Windows не обойтись, даже, если ты платежеспособный линуксоид.
Ответить | Правка | Наверх | Cообщить модератору

35. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от анон (?), 09-Июл-20, 12:43 
> Без Windows не обойтись
>20x2
>линуксоиды не могут в виртуалки
Ответить | Правка | Наверх | Cообщить модератору

54. "Новая система оптического распознавания текста EasyOCR"  –2 +/
Сообщение от Аноним (54), 09-Июл-20, 21:11 
И что характерно: с 12по 15 версию даже по Вайном не запускается.
Ответить | Правка | К родителю #8 | Наверх | Cообщить модератору

16. "Новая система оптического распознавания текста EasyOCR"  –2 +/
Сообщение от апрар (?), 09-Июл-20, 08:18 
Тессекракт просто текст ищет. Для индексирования это норм, но как для оцифровки документов это никочем.
Нужно чтобы структуру документа еще определял примерно.
Ну и отсутствие второго по популярности языка в интернете при наличии вот этих вот 30и....
Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

60. "Новая система оптического распознавания текста EasyOCR"  –1 +/
Сообщение от надоело (?), 18-Июл-20, 12:13 
> Ну и отсутствие второго по популярности языка в интернете при наличии вот этих вот 30и....

По версии первого канала, конечно же? пора вaтанам просветиться уже, 2k20 на дворe.

Гуглу и прочим банально нафиг не уперся твой пусский, надо - дeлай сам или вали поднимать венду для файнридера.

Ответить | Правка | Наверх | Cообщить модератору

25. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от Аноним (25), 09-Июл-20, 11:01 
Просто тесеракт надо уметь готовить (обучать самому) и будет сносно работать.
Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

34. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от анон (?), 09-Июл-20, 12:40 
У адоба оцр в несколько проходов, это даже видно по времени и загрузке ядер. И да, у меня есть огромное количество текстов, которые может прочитать человек, но даже адоб не справится с половиной, но вот все остальное - без проблем. Я даже специально портил тексты, чтобы понять, что лучше справится, чтобы быть уверенным в том, что перечитывать не придется. Ответ - все распознают одинаково ужасно.
Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

2. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от Erley (ok), 08-Июл-20, 23:22 
Было бы интересно узнать чем это лучше/хуже Tesseract
Ответить | Правка | Наверх | Cообщить модератору

11. "Новая система оптического распознавания текста EasyOCR"  +2 +/
Сообщение от Аноним (-), 09-Июл-20, 02:29 
Хорошо бы... Когда узнаешь, возвращайся и расскажи нам. ;)
Ответить | Правка | Наверх | Cообщить модератору

13. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от Аноним (13), 09-Июл-20, 03:11 
Написано же: "для определения и распознавания текста на изображении применяются методы машинного обучения". Распознавание символов -- это вообще буквально хелло-ворлд в теме NN, первое, чему обучаются нy6aри.
Ответить | Правка | К родителю #2 | Наверх | Cообщить модератору

21. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от Erley (ok), 09-Июл-20, 10:01 
Так Tesseract тоже на нейронках работает.
Похоже что на данный момент Tesseract более продвинутый продукт - больше языков, больше алгоритмов.
А EasyOCR - только питоновская библиотека, но довольно удобная в использовании.
Ответить | Правка | Наверх | Cообщить модератору

4. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от Аноним (45), 09-Июл-20, 00:58 
Насколько хорошо китайский распознает? Надо распознать хардсаб https://www.youtube.com/watch?v=MEQd_FJjuAU
Ответить | Правка | Наверх | Cообщить модератору

6. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от Аноним (45), 09-Июл-20, 01:07 
И корейский тоже https://www.youtube.com/watch?v=91g5n0FlbaE но тут, наверное, проще будет распознать французскую речь.
Ответить | Правка | Наверх | Cообщить модератору

10. "Новая система оптического распознавания текста EasyOCR"  +1 +/
Сообщение от Аноним (10), 09-Июл-20, 02:28 
Поставь, проверь, а заодно и нам расскажешь. ;)
Ответить | Правка | К родителю #4 | Наверх | Cообщить модератору

7. "Новая система оптического распознавания текста EasyOCR"  –2 +/
Сообщение от Ingener (??), 09-Июл-20, 01:37 
Во время 90х про программы Easy* шутили так - Изя*. Например Изя-поинт (EasyPoint). Сорри, просто вспомнил шутку.
Ответить | Правка | Наверх | Cообщить модератору

9. "Новая система оптического распознавания текста EasyOCR"  +5 +/
Сообщение от Аноним (-), 09-Июл-20, 02:25 
Русский не поддерживается... значит ненужно!
Ответить | Правка | Наверх | Cообщить модератору

62. "Новая система оптического распознавания текста EasyOCR"  –1 +/
Сообщение от надоело (?), 18-Июл-20, 12:17 
Тебе всe равно китайский учить в скором времени, так что пофиг.
Ответить | Правка | Наверх | Cообщить модератору

22. "Новая система оптического распознавания текста EasyOCR"  +2 +/
Сообщение от Аноним (22), 09-Июл-20, 10:22 
Программа не поддерживает ни иврит, ни идиш, поэтому для Изи она бесполезна.
Ответить | Правка | К родителю #7 | Наверх | Cообщить модератору

20. "Новая система оптического распознавания текста EasyOCR"  +1 +/
Сообщение от Аноним (22), 09-Июл-20, 09:38 
В приложениях для OCR основная проблема не распознавание сырого текста, а восстановление форматирования текста (включая таблицы и детектирование шрифтов, красныx строк и мягких переносов) и вычистка артефактов распознавания и печати. В этом ABBYY FineReader нет равных.

Ответить | Правка | Наверх | Cообщить модератору

28. "Новая система оптического распознавания текста EasyOCR"  –2 +/
Сообщение от Аноним (25), 09-Июл-20, 11:14 
В гимпе порежь на кусочки как нравится распознай отдельно, а потом вставь форматированно отдельно в либреофис. Что характерно и для гимпа и для либры можно написать плагины для этого, но почему-то этим не заморочился.
Ответить | Правка | Наверх | Cообщить модератору

53. "Новая система оптического распознавания текста EasyOCR"  +2 +/
Сообщение от Аноним (-), 09-Июл-20, 21:08 
Сам нарезай, извращенец...
Ответить | Правка | Наверх | Cообщить модератору

23. "Новая система оптического распознавания текста EasyOCR"  –1 +/
Сообщение от Аноним (23), 09-Июл-20, 10:28 
>Новая система оптического распознавания текста EasyOCR

Это последнй пазл, который нехватал GNU/Linux! Всё! OS Windows мертва!

Ответить | Правка | Наверх | Cообщить модератору

33. "Новая система оптического распознавания текста EasyOCR"  +1 +/
Сообщение от прототипы (?), 09-Июл-20, 12:38 
Python? Господь простит...
Ответить | Правка | Наверх | Cообщить модератору

59. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от artenaki (ok), 17-Июл-20, 00:22 
Стреляйте в пианиста.
Ответить | Правка | Наверх | Cообщить модератору

61. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от надоело (?), 18-Июл-20, 12:15 
Напиши на pure С, лoх чтоли?
Ответить | Правка | К родителю #33 | Наверх | Cообщить модератору

64. "Новая система оптического распознавания текста EasyOCR"  +/
Сообщение от gilbertelyhopper (ok), 04-Сен-22, 06:37 
OCR — действительно крутая технология, я также знаю сайт, где они неплохо используют оптическое распознавание. Я также регулярно использую его на работе, это бесплатно и онлайн.
https://image2texts.com/ru/

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру