[oodisc] Re: [oodisc] Сайт OOr

Alexandre Prokoudine techwriter на tamb.ru
Вт Дек 25 15:25:11 MSK 2001


Здравствуйте, Пётр!

> Я бы словари выделил в отдельную тему. У меня есть некоторые контакты
> в РГГУ (нет, это не только студентки :)),

не только, и не столько ... :))

>  а так же они есть и у Миши
> Быкова. Хотелось бы сделать проект Free Linguistics куда подключить
> некоторых людей  оттуда.
> Free linguistics, это:
>  - орфографические словари
>  - словари синонимов

РГГУ по-прежнему ждёт свои 99$?

>  - грамматика (для меня совершенно неизведанная тема, слабо себе
> представляю как можно с маленькой степенью ошибки проверять
> предложение на правильно расставленные запятые)

И чем больше работаешь с Word, тем больше в этом убеждаешься. Кстати, там
баги не только в запятых. В принципе, алгоритм, используемый в Word, даёт
вполне определённые сбои, когторые вполне реально пофиксить. Во всяком
случае, я понимаю природу этих ошибок с точки зрения лингвистики и считаю,
что их исправление реализуемо.

>  - программы переводчики

Ох, держите меня четверо! Сейчас буду на них ругаться.
:-)

Переводчики на данном этапе годятся только, ТОЛЬКО, и ещё раз ТОЛЬКО ДЛЯ
ТЕХНИЧЕСКИХ ТЕКСТОВ. Причина тому - единообразный синтаксис технических
текстов, в данном случае - использование эталонных рамочных конструкций
предложения. А Вы подсуньте тому же ПРОМПТУ хотя бы маленький абзац Лиона
Фойхтвангера в оригинале ... Предупреждаю: не для слабонервных!

Что реально можно добавить во FreeLinguistics:

1) text to speech. Кстати, никто не хочет в свободное от жены и детей время
добавить эту фичу как модуль для ООо? Есть festival, к примеру, но без
русского модуля (ОЧЕНЬ надеюсь, что меня кто-нибудь поправит). Кстати, я
немного контактировал с московской группой энтузиастов, занимающихся
text2speech на базе одного из универститетов. Они прекрасно знают все
существующие движки - с ними можно было бы что-нибудь забацать.

2) распознавание текста. Усугубляется проблемами со сканерами. Если взять
GOCR, то там неплохо описан API (всё на их сайте лежит). По сути дела,
насколько я это смотрел - там надо просто переписать код под русский
алфавит. Коммерческая разработка от создателей OmniPage - несвободная,
коммерческая, и русский язык там не поддерживается.

Вот это и есть мои первые (или уже вторые?) "пять копеек" по поводу
FreeLinguistics (кстати, хорошее название).

Александр





Подробная информация о списке рассылки Oo-discuss