[oodisc] Re: [oodisc] Сайт OOr
Alexandre Prokoudine
techwriter на tamb.ru
Вт Дек 25 15:25:11 MSK 2001
Здравствуйте, Пётр!
> Я бы словари выделил в отдельную тему. У меня есть некоторые контакты
> в РГГУ (нет, это не только студентки :)),
не только, и не столько ... :))
> а так же они есть и у Миши
> Быкова. Хотелось бы сделать проект Free Linguistics куда подключить
> некоторых людей оттуда.
> Free linguistics, это:
> - орфографические словари
> - словари синонимов
РГГУ по-прежнему ждёт свои 99$?
> - грамматика (для меня совершенно неизведанная тема, слабо себе
> представляю как можно с маленькой степенью ошибки проверять
> предложение на правильно расставленные запятые)
И чем больше работаешь с Word, тем больше в этом убеждаешься. Кстати, там
баги не только в запятых. В принципе, алгоритм, используемый в Word, даёт
вполне определённые сбои, когторые вполне реально пофиксить. Во всяком
случае, я понимаю природу этих ошибок с точки зрения лингвистики и считаю,
что их исправление реализуемо.
> - программы переводчики
Ох, держите меня четверо! Сейчас буду на них ругаться.
:-)
Переводчики на данном этапе годятся только, ТОЛЬКО, и ещё раз ТОЛЬКО ДЛЯ
ТЕХНИЧЕСКИХ ТЕКСТОВ. Причина тому - единообразный синтаксис технических
текстов, в данном случае - использование эталонных рамочных конструкций
предложения. А Вы подсуньте тому же ПРОМПТУ хотя бы маленький абзац Лиона
Фойхтвангера в оригинале ... Предупреждаю: не для слабонервных!
Что реально можно добавить во FreeLinguistics:
1) text to speech. Кстати, никто не хочет в свободное от жены и детей время
добавить эту фичу как модуль для ООо? Есть festival, к примеру, но без
русского модуля (ОЧЕНЬ надеюсь, что меня кто-нибудь поправит). Кстати, я
немного контактировал с московской группой энтузиастов, занимающихся
text2speech на базе одного из универститетов. Они прекрасно знают все
существующие движки - с ними можно было бы что-нибудь забацать.
2) распознавание текста. Усугубляется проблемами со сканерами. Если взять
GOCR, то там неплохо описан API (всё на их сайте лежит). По сути дела,
насколько я это смотрел - там надо просто переписать код под русский
алфавит. Коммерческая разработка от создателей OmniPage - несвободная,
коммерческая, и русский язык там не поддерживается.
Вот это и есть мои первые (или уже вторые?) "пять копеек" по поводу
FreeLinguistics (кстати, хорошее название).
Александр
Подробная информация о списке рассылки Oo-discuss