[oodisc] Странности с проверкой орфографии OO и Mozilla.
Aleksey Avdeev
solo на kengu.ru
Чт Окт 16 11:29:59 MSD 2003
Вячеслав Диконов пишет:
> В Пнд, 13.10.2003, в 18:20, Aleksey Avdeev пишет:
>
>> >Если кто-то хотел ввести негритянские диалекты, пусть вводит их
>> >отдельным словарём :)
>>
>> Стоит ли о данных словах сообщить куданибудь? Если да - то
>>куда? :-) (Правильным ли местом будет http://bugzilla.altlinux.ru/?)
>
> Сомневаюсь. АЛЬТ не занимается словарями MySpell. Он скорее игнорирует связанные с ними проблемы =|.
> Надо самому проверить словарь и прислать латку по указанным в ПРОЧТИМЕНЯ
> адресам.
Хорошо, так и сделаю.
Набросал небольшой скриптик (простейший), который выводит
заведомо неверные (и незнакомые мне лично) слова: Ищет в словаре
и выводит слова со сдвоенными (из списка) и с строенными буквами
(исхожу из того, что не все буквы могут стоять парой в слове, а
тройных повторений быть не должно). Файл приложен к письму.
Просьба проверить его на корректность, с точки зрения русской
орфографии (я далеко не лингвист): Список недопустимых сдвоенных
букв, возможно, стоит сузить. Список слов для исключения - тоже
(или расширить :-)).
Результат работы данного скрипта собираюсь отослать по адресам
из файла /usr/lib/openoffice/share/dict/ooo/readme.koi.
ЗЫ: Дублирую данное письмо в Sisyphus и Community. Приношу
извинения, если это доставит неудобства.
--
С уважением. Алексей.
----------- следущая часть -----------
#! /bin/bash
if [ "x$1" = "x" ]; then
echo "Формат команды:"
echo "rudichek <файл словаря>"
exit
fi
# Последовательности одинаковых букв
Dubli="ё й ш щ ъ ы ч ь"
# 2 буквы
Tribli="ц у к е н г ш щ з х ф в а п р о л д ж э я с м и т б ю"
# 3 буквы
# Слова подлежащии исключению
Iskluch="мон момушка момсон момо момлент момди момбе момбасу мома/E мом замбы фамы"
# Проверка
cat "$@" | grep \
$(for I in $Iskluch ; do echo -n " -e ^"$I"$"; done) \
$(for I in $Dubli ; do echo -n " -e " $I$I; done) \
$(for I in $Tribli ; do echo -n " -e " $I$I$I; done)
Подробная информация о списке рассылки Oo-discuss