Проектом EasyOCR развивается новая система оптического распознавания текста, поддерживающая более 40 языков, включая английский, немецкий, французский, японский, китайский, корейский, узбекский, азербайджанский и литовский. Языки на основе кириллицы пока не поддерживаются, но их добавление в списке планов. Код написан на языке Python c использованием фреймворка PyTorch и распространяется под лицензией Apache 2.0. Для загрузки предоставляются готовые модели для языков на основе латинского алфавита и иероглифов...Подробнее: https://www.opennet.dev/opennews/art.shtml?num=53314
Годно, нужно, не тессерактом единым. Правда, у abby распознавание работало лучше, чем у тессеракта ещё 20 лет назад и это было до хайпа на нейронки. Тессеракт уже овер 500 лет развивается всякими гуглами, этот проект уже может с ним конкурировать, какие у него преимущества в наличии? У меня были проблемы с распознаванием китайского в тессеракте, даже в монохромных изображениях, гугл наверное использует что-то другое или он зажал нормальные модели.
Я с ним совсем пало игрался, но мне помогло запскейлить изображение раза в 2-4 и потом уже скормить тессеракту.
Чтобы распознавалки хорошо распознавали надо чистить изображения от лишнего, как сказано здесь http://subs.com.ru/page.php?al=videosubfinder_hardsub
Теряется шум от букв, а это уже важная информация.
Пора понять и смириться, что под Linux ничего даже близко подобного FineReader не будет. Не появилось за 27 лет и в ближайшем будущем тоже не предвидится... (да-да, знаю, свой движок ковыряйте сами, я про готовый продукт для конечного пользователя). С помощью FineReader я распознавал сотни книг еще в бородатых 90х... и это было мощь! Под Linux ни один проект до сих пор такого уровня распознавания не имеет, это один из немногочисленных минусов Linux, но ктож виноват, что разработчики FineReader такие жлобы и не хотят портировать его... За 27 лет могли бы озаботиться. Есть какие-то проекты, в т.ч. от гугла, но русский распознает там просто г**но - тестил на сотнях книг. Слишком уникальный и сложный софт, здесь только один игрок, который давно порешал весь рыночек, и Linux любовью обделил...
Ну вообще-то, линукс поддерживается, просто это не та пользовательская приложуха. https://www.abbyy.com/ocr-sdk/technical-specifications/
> но ктож виноват, что разработчики FineReader такие жлобы и не хотят портировать его...Десктопный линукс с 1-2% 🤷♂
А так «серверная» версия есть, для интеграции с различными разработками.
> Десктопный линукс с 1-2% 🤷♂лол, даже у Бацьки 3%
яки ён табе бацька, сабака?
> но ктож виноват, что разработчики FineReader такие жлобыЛинух и виноват. Под виндой была одна платформа — винНТ. У линя зоопарк дистров. Кому придёт в голову разрабатывать комерческий продукт хз под какие условия? И этот зоопарк дистров живёт всего на 1% компов.
Кстати, разработчики гнома тоже жлобы: они не портирую на вин гномегеймс. Облейте дeрмецом и их.
Косяк в набросе - уж очень явное враньё.
Из-за косяка сразу эффект не так забавен.Как раз достоинство Л. в том, что под любым дистром из зоопарка работает Ок.
Разработчики в курсе?
А то можно зайти на чуть ли не на любой багтрекер опенсормного десктопного проекта, и там находить DE специфичные багиТо с каким-то буфером обмена начнут приложения падать, а лезть к тебе будут:
https://github.com/telegramdesktop/tdesktop/issues/6952То как-то не так выглядеть всё это будет
https://github.com/telegramdesktop/tdesktop/issues/7399Это всё загромождает багтрекер, и причём сразу и не понятно, в чём баг.
То есть можно ли прям с разворота сказать "это не наш баг, идите плачьтесь разработчикам KDE"
> Разработчики в курсе?Разработчики - в курсе. Про смузихлёбов "я тут [с трудом] собрал экзешник, хочу чтоб он работал везде и всегда [второй раз я на такой подвиг не отважусь, да и не получится]" не в курсе, пытай их сам.
> Это всё загромождает багтрекер, и причём сразу и не понятно, в чём баг.
Такое у них свойство, у багов - они не бегают по экрану с табличками "алё, пофикси с строке ### в сорце ####". И такое у них свойство - у пользователей, излагать проблемы так, что без длительного допроса с пристрастием вообще зачастую непонятно о чём речь.
Но есть и обратная сторона опенсорсных багтрекеров. Иногда на них заходят парни и девушки, понимающие чуть больше, чем офисный хомячок и к своим немногословным претензиям они присовокупляют патчи и PRы.
Ну вот как-то так.
И да, не знаю как в мире розовыхявапоней (может там всё проще, типа нихрена не работает да и ладно) но в багтрекерах вендовых софтин (ну где они есть, потому что схема "давай денег и иди на юх" не подразумевает такого) тоже есть баги XP-w7-32/64 и прочие специфичные. Чем это отличается от DE-специфичных?
> хомяки, смузихлёбы, розовыхявапоней
> Иногда на них заходят парни и девушки, понимающие чуть больше, чем офисный хомячок и к своим немногословным претензиям они присовокупляют патчи и PRы.А разработчикам это как-то не сдалось. И если продукт тем более проприетарный (ещё Adobe поучи как бизнес надо делать), то тут уж.
Это всё давно обсосано, опенсорс или не опенсорс модели работают по разному и нет однозначго ответа типа "закрытая/открытая модель лучше для всего"
Поэтому эти глупости детского максимализма и вот такого ЧСВ оставь при себе.
> тоже есть баги XP-w7-32/64 и прочие специфичные. Чем это отличается от DE-специфичных?
Да, кончено. Но зоопарк гораздо меньше и проще.
Ну а XP-нутых вообще сразу посылать. Особо в 2020 году-то...
До линуксов с несколько дистрибутивов * несколько звуковых серверов * несколько видео серверов ; несколько ДЕ - это в ни какое сравнение не идёт. Да, конечно, это всё не всегда и не для каждого ПО бабахает, но бабахает всё же.
> XP-нутых вообще сразу посылатьПони забыли спросить. Японцы до сих пор под Windows 98 собирают и не только японцы. Учись, студент. А твои питоновские поделки к следующей минорной версии развалятся
https://www.vpngate.net/en/download.aspx
http://www.nyam.pe.kr/dev/imagine/#system_requirements
https://www.ghisler.com/download.htm
> Вон две какие подделки есть, а ещё Total Commander собирают под Windows XPИх право. Но это исключения из правила.
Что исключение? Еще множество софта XP поддерживает, это факт.
Мне что тебя ссылками тыкать?
На
https://potplayer.daum.net
https://foobar2000.org/download
> две какие подделки естьСначала разверни свою сеть VPN серверов, напиши софт такого уровня https://en.wikipedia.org/wiki/SoftEther_VPN а потом говори о поделках.
А ты случайно не клон фрактала? Очень похож.
> А разработчикам это как-то не сдалось.Активно используют.
> И если продукт тем более проприетарный (ещё Adobe поучи как бизнес надо делать), то тут уж.
Это ты так спрятался за Adobe? Да ещё и подменил тему программирования бизнесом?
> Это всё давно обсосано, опенсорс или не опенсорс модели работают по разному
> и нет однозначго ответа типа "закрытая/открытая модель лучше для всего"Да ещё и решил сбавить обороты на нейтральное?
> Поэтому эти глупости детского максимализма и вот такого ЧСВ оставь при себе.
Но всё же напоследок уязвить?
>> тоже есть баги XP-w7-32/64 и прочие специфичные. Чем это отличается от DE-специфичных?
> Да, кончено. Но зоопарк гораздо меньше и проще.Нет. Просто есть способы искусственно его "уменьшить"
> Ну а XP-нутых вообще сразу посылать. Особо в 2020 году-то...
Ну вот например забить на часть пользователей. Проприетарные конторы и под линукс вполне на это способны.
> До линуксов с несколько дистрибутивов * несколько звуковых серверов * несколько видео
> серверов ; несколько ДЕ - это в ни какое сравнение не
> идёт. Да, конечно, это всё не всегда и не для каждого
> ПО бабахает, но бабахает всё же.Не нужно громких слов про "бабахает", извини за каламбур. Из всего перечисленного сколько-нибудь серьёзная проблема это Xorg/wayland. И она имеет различные решения от "мы поддерживаем что-то одно" до стандартных решений по совместимости. Собственно полно мелких проектов от вчерашних студентов в количестве 1-2 человека, которые годами их, проекты, двигают без видимых затруднений. С чего у "серьёзных программистов серьёзных контор" это может вызывать проблемы, неясно. По мне так не вызывает. При хорошем подходе конторы могут писать даже кроссплатформенный код, а вот это чуть более реальная проблема, чем "две звуковых подсистемы".
На моей практике заунывные песни про "зоопарк DE" заводили граждане с вендовым бэкграундом но без "хороших манер программирования", то что ранее я назвал "смузихлёбы". Так что если ты скажешь опять про деньги и менеджмент - тут я соглашусь, вот тут с удовольствием и долго будут дуть в уши про "сегментация дистрибутивов", "увеличение затрат на поддержку" и ещё десятки умномодных слов. За которыми стоит простая истина - ни разрабатывать ни поддерживать что-то кроме бинарей под венду они не умеют и не собираются. Даже если рядом будут те, которые это делают успешно.
> Активно используют.Кто и что? Я сейчас открою Steam от Valve, которая очень любит линукс и оно будет выглядеть, как... Ну как сделали, так сделали...
Декораторы от Windows. Иконки в доке той же Ubuntu не работают.
И такое оно всё вот...> На моей практике заунывные песни про "зоопарк DE" заводили граждане с вендовым бэкграундом но без "хороших манер программирования", то что ранее я назвал "смузихлёбы".
Ну а что от фанатика другого ждать...
> ни разрабатывать ни поддерживать что-то кроме бинарей под венду они не умеют и не собираются
Не верно. Этим не ограничивается - кроме Windows и десктопного Линукс ещё есть ОС. И не только десктопные. Ну там тоже проблемы с мобильной ОС на основе линукса ака Android - зоопарк всё же.
> тоже есть баги XP-w7-32/64 и прочие специфичные.И не забывай, что XP - это 2001. Тогда даже "дефолтного" ныне линукса Ubuntu не было...
Потому что ты думаешь не головой а другим местом.Это ты же мне заяснял бредятину, что в Pidgin не засовывают видеозвонки, потому что нужны ВебКамеры проекту и с хорошим качеством передачи (а то же как на средней камере разрабатывать, если брови чётко не видно), а не то, что рук нет.
Тебе всё само как-то должно делаться, и прибегать волшебное опенсорс сообщество.
А это хорошо для сказок. А вот в реальности далеко не всегда прибегает.
Ты меня явно с кем-то путаешь. И про Pidgin с бровями - не ко мне, и опенсорс сообщество я далеко не идеализирую. Вопрос совершенно простой - вой про ужасный линукс, под который "нормальные конторы" разрабатывать не могут - это вой не про линукс, а про отрицание новых подходов и традиций (которые - есть) на новом рынке (насколько он интересен - вопрос второй). При чём если рынок неинтересен, так и разговор короткий, и спорить не о чем. А вот длинные и мутные описания проблем чаще всего пузырьки над глубинным "не хочу учиться/меняться/осваивать". При чём если посмотреть что коммерсанты осваивали и заставляли сотрудников осваивать, так в общем багтрекеры с гитами и не проблема вовсе.
> Ты меня явно с кем-то путаешь. И про Pidgin с бровями не ко мнеА да, перепутал и аватарки и риторика детского максимализма похожа.
https://www.opennet.dev/~Ne01eX
Извиняюсь.
> А да, перепутал и аватарки и риторика детского максимализма похожа.Вот было бы даже обидно, если бы это сказал не проприетарщик, который страдает от сборки софта. Проблема, с которой смышлёные школьники справляются без особых впечатлений.
> Извиняюсь.
Делай это в укромном месте.
балабол. Собери, запакеть и поддерживай еще под каждый дистр сперва, а есть еще и роллинги...
Снапы всякие тру линуксоиды хэйтят, натив хотят
> Косяк в набросе - уж очень явное враньё.
> Из-за косяка сразу эффект не так забавен.
> Как раз достоинство Л. в том, что под любым дистром из зоопарка работает Ок.Слишком толсто. То-то я погляжу под линух целая очередь популярных программ выстроилась. Потому что под ним всё ОК.
Вин, Мак, Ондройд — вот под них делают версии, ибо есть стандарт. А под линь — нет, ибо зоопарк. У тебя в голове мозги, или кю?
> Слишком толсто. То-то я погляжу под линух целая очередь популярных программ выстроилась.
> Потому что под ним всё ОК.Не поверишь - популярные программы есть и под линух. И многие из них собираются под BSD и макось. То, что "разработчики популярных программ" в твоей интерпретации напоминают баранов, впадающих в ступор от новых ворот - сугубо их особенность.
> Вин, Мак, Ондройд — вот под них делают версии, ибо есть стандарт.
POSIX, FHS и прочее - стандарты на месте. А то что разработчики "популярных программ" их не осиливают, то это проблема не стандартов. Да и то сказать - они и под венду так пишут. Сколько популярных программ не переживут систему на диске D:? Как давно они научились писать софт который не требует админских прав? Когда вендовые программы перестанут систему превращать в лоскутное одеяло, отрисовывая каждая своё обрамление? Можно не отвечать.
>> но ктож виноват, что разработчики FineReader такие жлобы
> Линух и виноват. Под виндой была одна платформа — винНТ. У линя
> зоопарк дистров. Кому придёт в голову разрабатывать комерческий продукт хз под
> какие условия? И этот зоопарк дистров живёт всего на 1% компов.Ну, допустим есть коммерческие продукты под коммерческую же красношляпу, зачастую это профессиональные программы для видео, которые раньше делались для IRIX например, было бы желание.
Причём зоопарк дистров это проблема в умах вантузят, опенсорс проектам достаточно выкладывать исходники, чтобы майнтейнеры опакечивали, в этом проблем нет.
Проприерасты же без проблем договариваются с продакшон-дистрами, на поставку бинарей, которые также опакечиваются, тем более что продакшон дистра всего два с половиной это красношляпа с сусей и убунтодебиан. Причём как правило достаточно одной rpm для красношляпы и одной deb для бубунты.
Всякие школорачи и прочие болгеносы это не энтерпрайз и не ЦА проприерастов.
> опенсорс проектам достаточно выкладывать исходники, чтобы майнтейнеры опакечивали, в этом проблем нет.Речь о проекте с закрытым кодом
> Проприерасты же без проблем договариваются с продакшон-дистрами, на поставку бинарей, которые также опакечиваются, тем более что продакшон дистра всего два с половиной это красношляпа с сусей и убунтодебиан. Причём как правило достаточно одной rpm для красношляпы и одной deb для бубунты.
Где фотошоп, МСО или файнридер?
> Всякие школорачи и прочие болгеносы это не энтерпрайз и не ЦА проприерастов.
Да и остальные, как видим, тоже не ЦА. Так что обделавшись подотритесь.
https://www.winehq.org/ так вот же фотошоп, МСО или файнридер
> https://www.winehq.org/ так вот же фотошоп, МСО или файнридерЧерез опу и без гарантий? Живите так сами.
Статически можно линковать. Не проблема, имхо. Да и стандарт LSB не просто так придумали, спросите Зенитара.
> Статически можно линковать. Не проблема, имхо. Да и стандарт LSB не просто
> так придумали, спросите Зенитара.За статическую линковку я уже давно говорил, что её от разработчика вполне достаточно, если это опенсорсный продукт, то и не нужно создавать гору пакетов для разных дистров, достаточно статической линковки и распространять тарболом.
Этого вполне достаточно, чтобы ознакомиться с программой, кому надо, тот для своего дистрибутива соберёт. Ну и само собой - сорцы выложить.
А проприерасты и так договорятся с продакшон-дистрстрами, примеры есть.
Причем тут зоопарк, сложно не сложно. Выгодно будут - сделают (хоть под один дистр). Просто распиарен Linux мало = мало пользователей. Сильная хватка нужна для %. Та же история с Firefox и Opera, кстати.
> Причем тут зоопарк, сложно не сложно. Выгодно будут - сделают (хоть под один дистр). Просто распиарен Linux мало = мало пользователей. Сильная хватка нужна для %. Та же история с Firefox и Opera, кстати.20 лет всё никак. Не судьба, значит.
> Пора понять и смириться, что под Linux ничего даже близко подобного FineReader не будет. Не появилось за 27 лет и в ближайшем будущем тоже не предвидится
> разработчики FineReader такие жлобы и не хотят портировать егоЕсть онлайн версия. Платная, естественно. Бесплатно дается 5 или 10 страниц в месяц. Удобно, что на сервере самая последняя версия (14, которая на XP уже не ставится, 13 они пропустили, а зря) и не гадит. Но в ней нет смысла. Потому что бесплатный https://onlineocr.net распознает лучше. Вот как раз тот корейский текст FineReader вообще не увидел. Возможно, ему нужна предварительная обработка, которую делает onlineocr.net.
Конечно, как с оффлайн версией не получится схитрить, утянув с торрентов. Правда, я думаю, что онлайн все-таки невыгоден по ценам. Да и FineReader далеко не идеал, сколько я с ним мучался.
Проверьте сами, если не верите https://finereaderonline.com/ru-ru
Цены отстой https://finereaderonline.com/ru-ru/Store
10 тысяч рублей в год за 5000 страниц. Ну это курам на смех такое количество. В одном фильме может быть 1500 строк (картинок).
Что в сервисах синтеза речи, что распознавания онлайн вообще не катит. Без Windows не обойтись, даже, если ты платежеспособный линуксоид.
> Без Windows не обойтись
>20x2
>линуксоиды не могут в виртуалки
И что характерно: с 12по 15 версию даже по Вайном не запускается.
Тессекракт просто текст ищет. Для индексирования это норм, но как для оцифровки документов это никочем.
Нужно чтобы структуру документа еще определял примерно.
Ну и отсутствие второго по популярности языка в интернете при наличии вот этих вот 30и....
> Ну и отсутствие второго по популярности языка в интернете при наличии вот этих вот 30и....По версии первого канала, конечно же? пора вaтанам просветиться уже, 2k20 на дворe.
Гуглу и прочим банально нафиг не уперся твой пусский, надо - дeлай сам или вали поднимать венду для файнридера.
Просто тесеракт надо уметь готовить (обучать самому) и будет сносно работать.
У адоба оцр в несколько проходов, это даже видно по времени и загрузке ядер. И да, у меня есть огромное количество текстов, которые может прочитать человек, но даже адоб не справится с половиной, но вот все остальное - без проблем. Я даже специально портил тексты, чтобы понять, что лучше справится, чтобы быть уверенным в том, что перечитывать не придется. Ответ - все распознают одинаково ужасно.
Было бы интересно узнать чем это лучше/хуже Tesseract
Хорошо бы... Когда узнаешь, возвращайся и расскажи нам. ;)
Написано же: "для определения и распознавания текста на изображении применяются методы машинного обучения". Распознавание символов -- это вообще буквально хелло-ворлд в теме NN, первое, чему обучаются нy6aри.
Так Tesseract тоже на нейронках работает.
Похоже что на данный момент Tesseract более продвинутый продукт - больше языков, больше алгоритмов.
А EasyOCR - только питоновская библиотека, но довольно удобная в использовании.
Насколько хорошо китайский распознает? Надо распознать хардсаб https://www.youtube.com/watch?v=MEQd_FJjuAU
И корейский тоже https://www.youtube.com/watch?v=91g5n0FlbaE но тут, наверное, проще будет распознать французскую речь.
Поставь, проверь, а заодно и нам расскажешь. ;)
Во время 90х про программы Easy* шутили так - Изя*. Например Изя-поинт (EasyPoint). Сорри, просто вспомнил шутку.
Русский не поддерживается... значит ненужно!
Тебе всe равно китайский учить в скором времени, так что пофиг.
Программа не поддерживает ни иврит, ни идиш, поэтому для Изи она бесполезна.
В приложениях для OCR основная проблема не распознавание сырого текста, а восстановление форматирования текста (включая таблицы и детектирование шрифтов, красныx строк и мягких переносов) и вычистка артефактов распознавания и печати. В этом ABBYY FineReader нет равных.
В гимпе порежь на кусочки как нравится распознай отдельно, а потом вставь форматированно отдельно в либреофис. Что характерно и для гимпа и для либры можно написать плагины для этого, но почему-то этим не заморочился.
Сам нарезай, извращенец...
>Новая система оптического распознавания текста EasyOCRЭто последнй пазл, который нехватал GNU/Linux! Всё! OS Windows мертва!
Python? Господь простит...
Стреляйте в пианиста.
Напиши на pure С, лoх чтоли?
OCR — действительно крутая технология, я также знаю сайт, где они неплохо используют оптическое распознавание. Я также регулярно использую его на работе, это бесплатно и онлайн.
https://image2texts.com/ru/