[Oo-discuss] OOo, OCR, FreeBSD

Boris Samorodov bsam на ipt.ru
Пт Сен 11 16:58:52 UTC 2009


On Fri, 11 Sep 2009 13:35:14 +0400 Boris Samorodov wrote:
> On Fri, 11 Sep 2009 12:31:09 +0400 Андрей Черепанов wrote:
> > 10 сентября 2009 Boris Samorodov написал:

> > > А знает ли кто-нибудь свободное ПО распознавания текстов для
> > > FreeBSD с сохранением в формате OOo? Ещё бы и русские тексты.
> > > В портах кое-что есть, но с русским и OOo, похоже, проблемы.
> > cuneiform портировали? Под Linux работает. Может выводить в TXT, HTML, RTF, но 
> > без определения таблиц.

> Вау! А слона-то я и не приметил! Порт: graphics/cuneiform. Работает,
> причём отменно. Большое спасибо.

Удалось запустить cuneiform из-под xsane. В параметрах для выходного
файла в конфигураторе распознавания текста xsane пишем "-l rus -f text
-o", команда для распознавания текста "xsane2cuneiform.sh" (этот
скрипт нужен, потому как параметры, выдаваемые xsane и требуемые
cuneiform следуют в разном порядке):
-----
% cat /usr/local/bin/xsane2cuneiform.sh
#!/bin/sh

cuneiform $3 $4 $2
-----

Понятно, что это только proof of concept для скрипта. Но вы поняли.
;-)

Пытался портировать YAGF (http://symmetrica.net/cuneiform-linux/yagf-ru.html),
но что-то не собралось с первого раза. Написал разработчику. Может,
ответит.

Пока всё, спасибо за внимание.
-- 
WBR, Boris Samorodov (bsam)
Research Engineer, http://www.ipt.ru Telephone & Internet SP
FreeBSD Committer, http://www.FreeBSD.org The Power To Serve


Подробная информация о списке рассылки Oo-discuss