[oodisc] (JT) OCR

Вт Янв 29 16:20:31 MSK 2002

Maksim Otstavnov wrote:

>Hello Alexandre,
>
>Tuesday, January 29, 2002, 12:53:53 AM, you wrote:
>
>AP> Такая работа, IMHO, не сравнима с созданием wine, поскольку она в принципе
>AP> сложнее - здесь переплетаются многие науки - математика, физика, лингвистика
>AP> (даже несколько направлений лингвистики).
>
>AP> Создавать OCR с нуля или почти с нуля - работа практическа неподъёмная.
>AP> Дэвид Ян, как я помню, в одном из интервью для "ДК" упоминал 3 млн. строк
>AP> кода на Си++.
>
>Есть народная примета: если число строк стало шести- (даже не семи-)
>значным, значит, пропущен цикл рефакторинга кода :)
>
>
К сожалению, тогда уже рефакторинг не поможет -- из опыта. :-)

А собственно --- с чего это все взяли что создание OCR это неподъемная 
задача --
у нас на кафедре (МГУ, ФизФак, кафедра компьютерных методов физики)  
студенты подобные поделки в качастве курсовых или дипломов сдают.
конечно плохо пригодные для коммерческой эксплуатации -- в
основном формулировка задач ставится как сравнение различных
стат. критериев, их противопоставление возможностным,
и отчаянное насилование морфологии;  спользовние этого
аппарата для "алфавитного" сжатия сканированных (или
факсимильных) изображений документов, ну и прочее.

кто-то даже на рукописный текст замахивался -- но не знаю чем закончилось.

я к тому, что если Гора не идет к Пророку.....

с уважением,
                      Виталий.