[oodisc] (JT) OCR

Aleksey Novodvorsky aen на altlinux.ru
Вт Янв 29 13:50:53 MSK 2002


Alexandre Prokoudine wrote:

> Здравствуйте!
>
> > Maksim Otstavnov wrote:
> >
> > > Hello Aleksey,
> > >
> > > Кстати, а где сконцентрировались права на _ваши_ со smi разработки, и
> > > есть ли шанс что-то релицензировать свободно? (Без принятия закона о
> > > свободном релицензировании всех разработок, финансированных
> > > государством).
> >
> > C 84-го, когда Андропов прикрыл наши разработки,
>
> Мотивация сего неизвестна?

Новая метла. Возможно также, что идея ассиметричного ответа появилась именно
тогда. При Брежневе финансирование исследований шло 1:1 с американским, темы
тоже копировались, даже исполнители :-) В ноябре 91-го, в несчастном Боржоми мы
встретились с американскими коллегами, работавшими над аналогичной темой по
заказу аналогичного ведомства.

>
>
> > Собственно, остались лишь наши со smi  "оптические" алгоритмы, авторы
> > лингвистического блока далеко или очень далеко. Да и  статическое
> распознавание
> > слитного рукописного текста, -- очень специфическая область.
>
> Насколько я разумею, главной проблемой при распознавании рукописного теста
> является выделение блоков,

Это довольно сомнительное занятие. Вряд ли стоит сейчас лезть в подробности,
скажу только, что верхний контур слиного на письме слова сообщает мозгу 70-80%
информации, необходимой для распознавания.  Этот контур, после некоторой,
довольно непростой обработки, можно закодировать, выделив характерные элементы.

> которое осложняется:
> 1) неразборчивостью почерка
> 2) самим фактом СЛИТНОГО рукописного письма
> 3) "мусором" в отсканированном документе
> 4) рядом других неприятных параметров
>
> Дополнительный вопрос: что именно Вы называете лингвистическим блоком? Каким
> образом Вы разделяете "оптические алгоритмы" и "лингвистический блок"?

Оптический блок обрабатывает изображение (выделяет базовые линии,  утончает
изображение, etc.), пытается определить тип фрагмента, кодирует его и пытается
распознать, обращаясь к словарю.  На выходе оптики -- наборы вариантов для
каждого фрагмента связности.  Остальное -- лингвистика. Естественно, в случае
неудачи лингвистики (что бывало крайне редко), идет повторное обращение к
оптике.
Это _очень_ грубая схема.

>
>
> <just for fun>
> Как-то раз наблюдал работу OCR от Adobe - в статусбаре, кажется,
> комментировался каждый этап распознавания текста. Вот так узнаются
> корпоративные секреты. :-)))
> </just for fun>
>
> Известно ли Вам, что существует коммерческая OCR система для Linux - Omni? Я
> в курсе, что русский язык не распознаётся, но планируется ли её поддержка
> командой ALT на уровне требуемых библиотек?

Я ее не видел. Если наши пользователи будут пересекаться, то можем посмотреть.

>
>
> > Что касается общеупотребительного распознавания печатного и рукопечатного
> > текстов, то, насколько я припоминаю времена кооперативов, практически все
> авторы
> > были так или иначе задействованы и их разработки легли в основу
> продававшихся и
> > продающихся продуктов.
>
> Рукопечатного? :-))))))))

Это обычный термин, по крайней мере для начала 80-х :-) Имеются в виду печатные
буквы, написанные от руки. То есть, например, решение задачи распознавания
текста на бланках.

>
>
> Вы имеете ввиду FineReader и разработку Cognitive Technologies (название
> запамятовал)?

Продуктов в то время  было заметно больше.

>
>
> В принципе, отличия современных мощных OCR-пакетов от тех же GOCR и Clara в
> том, что они:
> 1) в большей или меньшей степени умеют работать со сложной разметкой текста
> 2) умеют более/менее прилично распознавать таблицы
> 3) умеют экспортировать всё это и ещё рисунки во внешние форматы
>
> Ну и, ясное дело, алгоритмы распознавания много совершеннее.
>
> В общем, вот какое у меня сложилось мнение после всего: даже если FineReader
> 3/4/5 заработает под wine, всё равно это неправильно. Пинать отечественных
> разработчиков OCR в сторону Linux-версий, похоже, бесполезно, особенно ABBYY
> Software House, которые до истерики любят MS, и в чуть меньшей степени -
> MacOS X. Остаётся опять надеяться на Запад. Omni мы уже дождались. :-/
>
> Кстати, имел кто-либо контакты по этому поводу с Cognitive Technologies?

Я -- нет.

Rgrds, AEN






Подробная информация о списке рассылки Oo-discuss