[oodisc] (JT) OCR
Vitaly Shishakov
shift на cmpd2.phys.msu.su
Вт Янв 29 16:20:31 MSK 2002
Maksim Otstavnov wrote:
>Hello Alexandre,
>
>Tuesday, January 29, 2002, 12:53:53 AM, you wrote:
>
>AP> Такая работа, IMHO, не сравнима с созданием wine, поскольку она в принципе
>AP> сложнее - здесь переплетаются многие науки - математика, физика, лингвистика
>AP> (даже несколько направлений лингвистики).
>
>AP> Создавать OCR с нуля или почти с нуля - работа практическа неподъёмная.
>AP> Дэвид Ян, как я помню, в одном из интервью для "ДК" упоминал 3 млн. строк
>AP> кода на Си++.
>
>Есть народная примета: если число строк стало шести- (даже не семи-)
>значным, значит, пропущен цикл рефакторинга кода :)
>
>
К сожалению, тогда уже рефакторинг не поможет -- из опыта. :-)
А собственно --- с чего это все взяли что создание OCR это неподъемная
задача --
у нас на кафедре (МГУ, ФизФак, кафедра компьютерных методов физики)
студенты подобные поделки в качастве курсовых или дипломов сдают.
конечно плохо пригодные для коммерческой эксплуатации -- в
основном формулировка задач ставится как сравнение различных
стат. критериев, их противопоставление возможностным,
и отчаянное насилование морфологии; спользовние этого
аппарата для "алфавитного" сжатия сканированных (или
факсимильных) изображений документов, ну и прочее.
кто-то даже на рукописный текст замахивался -- но не знаю чем закончилось.
я к тому, что если Гора не идет к Пророку.....
с уважением,
Виталий.
Подробная информация о списке рассылки Oo-discuss