[oodisc] (JT) OCR

Alexandre Prokoudine techwriter на tamb.ru
Вт Янв 29 00:53:53 MSK 2002


----- Original Message -----
From: Egor Grebnev <gregean на divo.ru>
To: <discuss на OpenOffice.ru>
Sent: Monday, January 28, 2002 4:57 PM
Subject: Re: [oodisc] (JT) OCR


> On Monday 28 January 2002 16:51, you wrote:
> > > Если да, то с чем они связаны? И каков (примерно) объем
> > > работ?
> >
> > Он очень велик. Это серьезная научная разработка.
>
> Думаю, это неправильная формулировка вопроса, но... если сравнивать с тем
же
> Wine (версия 1.0 которого, кстати, планируется через несколько месяцев),
то
> какой процент от человеко-часов, потраченных на Wine, может занять такая
> разработка?

То, что >100% - наверняка.

Такая работа, IMHO, не сравнима с созданием wine, поскольку она в принципе
сложнее - здесь переплетаются многие науки - математика, физика, лингвистика
(даже несколько направлений лингвистики).

Создавать OCR с нуля или почти с нуля - работа практическа неподъёмная.
Дэвид Ян, как я помню, в одном из интервью для "ДК" упоминал 3 млн. строк
кода на Си++. Кроме того, под такую разработку нужно много бабок - платить
за оборудование, аренду помещения, на зарплату специалистам (а они будут
вполне обоснованно претендовать на зарплату не меньше 800 гринов в месяц),
раскрутку продукта, который будет готов далеко не через месяц - в лучшем
случае - через год-полтора. Я имею ввиду нечто более-менее юзабельное.
Написать с нуля Konqueror и то проще. А ему, между прочим, два года, и над
ним не один десяток программистов работали. И не забывайте, что со всего
этого надо иметь ещё какую-то прибыль - а до выпуска первой официальной
версии на продажу, как я уже упоминал, пройдёт много времени.

И здесь есть ещё одно очень большое "НО": многие люди согласятся перейти на
Linux, если будут иметь полноценную OCR, которая сможет качественно
распознавать текст/таблицы и выводить их в РАСПРОСТРАНЁННЫЕ текстовые
форматы. Но сделают они это при условии, что такая OCR будет уже готова к
моменту перехода на Linux, без этого - фигушки (да и ещё много без чего).
Таким образом разработка будет вестись практически под очень маленький рынок
сбыта.

--
Regards,
AP





Подробная информация о списке рассылки Oo-discuss