The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Выпуск системы распознавания текста GNU Ocrad 0.23

24.03.2014 21:37

Представлен релиз системы распознавания текста Ocrad (Optical Character Recognition) 0.23, развиваемой под эгидой проекта GNU. Из изменений в новой версии отмечено улучшение распознавание символов (например, более корректное разделение схожих начертаний L и Z) и реализация удаления лидирующих пробелов в фильтрах "только буквы" и "только цифры".

Для оптического распознавания в Ocrad используется метод выделение признаков (feature extraction). Ocrad может применяться как в форме библиотеки для интеграции функций OCR в другие приложения, так и в форме обособленной утилиты, которая на основе переданного на вход изображения выдаёт текст в UTF-8 или 8-битных кодировках. Распознавание поддерживается только для кодировок "ascii", "iso-8859-9" и "iso-8859-15". Поддержка кириллицы отсутствует. В состав входит анализатор макета страницы, позволяющий корректно разделять столбцы и блоки текста в печатных документах.

  1. Главная ссылка к новости (http://permalink.gmane.org/gma...)
  2. OpenNews: Инициатива по созданию полнофункциональной свободной системы распознавания речи
  3. OpenNews: Релиз YAGF 0.8.9, графической оболочки для систем распознавания текста
  4. OpenNews: Опубликован исходный код системы для формирования слепков отпечатков пальцев FingerJetFX
  5. OpenNews: Релиз системы распознавания текстов Cuneiform 1.1.0
  6. OpenNews: Релиз системы распознавания текста Tesseract 3.0 с поддержкой русского языка
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/39392-ocrad
Ключевые слова: ocrad, ocr
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (20) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, qwewewewewep (ok), 22:31, 24/03/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    интересно как оно по сравнению с ocropus, tesseract ?
     
  • 1.5, Аноним (-), 23:11, 24/03/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • –4 +/
    FineRider от всей этой опенсорсной лабуды так недосягаем, что даже не приходится радоваться подобным новостям.
     
     
  • 2.8, A.Stahl (ok), 00:11, 25/03/2014 [^] [^^] [^^^] [ответить]  
  • +6 +/
    >FineRider

    Неужели Офигенный Всадник лучше расшифровывает свитки, чем Джо Мокрый Нос Длинная Сопля?
    >что даже не приходится радоваться подобным новостям.

    Какая разница что может какая-то другая программа?
    То, что fineReader лучше, не делает Ocrad хуже.
    То, что в openSource сообществе нет специалистов по распознаванию никак не дискредитирует систему.
    Вышла новая версия. Улучшенная версия. Чем не повод порадоваться?
    Нельзя проскочить промежуточные этапы. Нельзя от палки-копалки перейти к транзисторам.
    Придётся сначала и с зубчатыми колёсами и с катушками и с лампами повозиться.
    Так устроен мир.

     
     
  • 3.9, Аноним (-), 00:24, 25/03/2014 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Оно путало L и Z. Лично мне хочется плакать, а не радоваться.
    Оно на стадии "ребенок учится ползать", в то время как какие-то движки из первого комментария открыты и умеют что-то распознавать на среднем уровне. Накой этот велосипед?
     
     
  • 4.10, Аноним (-), 01:29, 25/03/2014 [^] [^^] [^^^] [ответить]  
  • +/
    Что бы ты плакал.
     
  • 4.14, Евгений (??), 05:37, 25/03/2014 [^] [^^] [^^^] [ответить]  
  • +/
    > Оно путало L и Z. Лично мне хочется плакать, а не радоваться.

    Никто ничего не путал, уважаемому не стоит беспокоится
    > Оно на стадии "ребенок учится ползать", в то время как какие-то движки
    > из первого комментария открыты и умеют что-то распознавать на среднем уровне.
    > Накой этот велосипед?

    Основные проблемы у меня последний раз были в смешанном тексте с кириллицей и латиницей. Года 3 назад с  tesseract-ocr.

     
  • 3.19, Аноним (-), 12:55, 25/03/2014 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > То, что в openSource сообществе нет специалистов по распознаванию никак не дискредитирует систему.

    Там так же нет и многих других специалистов. И в конце-концов этот снежный ком недовидео-недоаудио-недофото и прочих просто-нету таки дискредитирует систему.

    > Нельзя проскочить промежуточные этапы. Нельзя от палки-копалки перейти к транзисторам.

    Придётся сначала и с зубчатыми колёсами и с катушками и с лампами повозиться.
    Так устроен мир.

    Так устроен опенсорс, где эти этапы за такое количество лет так и не были пройдены.

     
  • 2.18, IP (??), 11:36, 25/03/2014 [^] [^^] [^^^] [ответить]  
  • +/
    > FineRider от всей этой опенсорсной лабуды так недосягаем, что даже не приходится
    > радоваться подобным новостям.

    Вот только версии под линукс нет как таковой, я бы купил для дома буде таковая продавалась.
    Но таки ёк, только либа за штуку баксофф и "напиши гуй сам", при том, что хоум версия под винды меньше сотки.
    Да, файнридер хорош в распознавании, вот только запускать крайне хлопотно, когда нет желания с виндой возиться.

     
     
  • 3.21, ваноним (?), 17:35, 25/03/2014 [^] [^^] [^^^] [ответить]  
  • +/
    > Вот только версии под линукс нет как таковой

    Под Linux есть SDK: http://www.abbyy.com/ocr_sdk_linux/

     

  • 1.7, paulus (ok), 23:31, 24/03/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    cuneiform и tesseract нормально не работают, а про оcrad даже не стоит и заикаться. Хотя то, что работы в этих направлениях ведутся всеже плюс. Давно не пользовался, что сейчас из перечисленного более вменяемое?
     
     
  • 2.11, Аноним (-), 01:31, 25/03/2014 [^] [^^] [^^^] [ответить]  
  • +/
    > cuneiform и tesseract нормально не работают. Давно не пользовался, что сейчас из перечисленного более вменяемое?

    Вот и проверьте, потом здесь расскажите.

     
     
  • 3.12, 1 (??), 01:41, 25/03/2014 [^] [^^] [^^^] [ответить]  
  • +/
    Проверил - лучше всех штука finereader online
     
     
  • 4.13, VolanD (ok), 05:02, 25/03/2014 [^] [^^] [^^^] [ответить]  
  • +/
    > Проверил - лучше всех штука finereader online

    Ага, чтобы сразу в архивы АНБ?

     
  • 4.16, Аноним (-), 08:59, 25/03/2014 [^] [^^] [^^^] [ответить]  
  • +/
    Вы сами-то пробовали on-line?
    Там ограничение и на количество страниц и документов. Затем просит заплатить.
     
  • 2.15, Евгений (??), 05:40, 25/03/2014 [^] [^^] [^^^] [ответить]  
  • +/
    > cuneiform и tesseract нормально не работают, а про оcrad даже не стоит
    > и заикаться. Хотя то, что работы в этих направлениях ведутся всеже
    > плюс. Давно не пользовался, что сейчас из перечисленного более вменяемое?

    У меня проблемы были только со смешанным текстом  года 3 назад...

     
  • 2.24, Например (?), 14:05, 26/03/2014 [^] [^^] [^^^] [ответить]  
  • +/
    что значит "нормально"? с формулами, таблицами есть проблемы, а обычный текст у меня хорошо распознавался.
     

  • 1.17, Аноним (-), 09:49, 25/03/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Только я один прочел вначале как orcad со всеми вытекающими? ))
     
  • 1.20, Аноним (-), 16:38, 25/03/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Так ведь есть же Cuneiform который русский поддерживает. Еще бы gui на gtk ему нормальное прикрутить.
     
  • 1.22, Аноним (-), 17:41, 25/03/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Периодически юзаю синеформу для распознавания разных домашних бумажек в убунте 12.04 из терминала, меня устраивает. Точность распознавания процентов 80. Всё лучше чем руками перенабирать.
     
  • 1.23, Василий (??), 18:14, 25/03/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    > Поддержка кириллицы отсутствует

    Блин! С этого же надо было заметку начинать! А то я столько буковок прочитал зря, зачем напрягался? Минуты полторы убил зря! :-)))

     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру