[oodisc] Странности с проверкой орфографии OO и Mozilla.

Aleksey Avdeev solo на kengu.ru
Чт Окт 16 11:29:59 MSD 2003


Вячеслав Диконов пишет:
> В Пнд, 13.10.2003, в 18:20, Aleksey Avdeev пишет:
> 
>> >Если кто-то хотел ввести негритянские диалекты, пусть вводит их
>> >отдельным словарём :)
>>
>>   Стоит ли о данных словах сообщить куданибудь? Если да - то 
>>куда? :-) (Правильным ли местом будет http://bugzilla.altlinux.ru/?)
> 
> Сомневаюсь. АЛЬТ не занимается словарями MySpell. Он скорее игнорирует связанные с ними проблемы =|.
> Надо самому проверить словарь и прислать латку по указанным в ПРОЧТИМЕНЯ
> адресам.

   Хорошо, так и сделаю.

   Набросал небольшой скриптик (простейший), который выводит 
заведомо неверные (и незнакомые мне лично) слова: Ищет в словаре 
и выводит слова со сдвоенными (из списка) и с строенными буквами 
(исхожу из того, что не все буквы могут стоять парой в слове, а 
тройных повторений быть не должно). Файл приложен к письму.

   Просьба проверить его на корректность, с точки зрения русской 
орфографии (я далеко не лингвист): Список недопустимых сдвоенных 
букв, возможно, стоит сузить. Список слов для исключения - тоже 
(или расширить :-)).

   Результат работы данного скрипта собираюсь отослать по адресам 
из файла /usr/lib/openoffice/share/dict/ooo/readme.koi.

ЗЫ: Дублирую данное письмо в Sisyphus и Community. Приношу 
извинения, если это доставит неудобства.

-- 

С уважением. Алексей.
----------- следущая часть -----------
#! /bin/bash

if [ "x$1" = "x" ]; then
	echo "Формат команды:"
	echo "rudichek <файл словаря>"
	exit
fi

# Последовательности одинаковых букв

Dubli="ё й ш щ ъ ы ч ь"
	# 2 буквы

Tribli="ц у к е н г ш щ з х ф в а п р о л д ж э я с м и т б ю"
	# 3 буквы

# Слова подлежащии исключению
Iskluch="мон момушка момсон момо момлент момди момбе момбасу мома/E мом замбы фамы"

# Проверка
cat "$@" | grep \
	$(for I in $Iskluch ; do echo -n " -e ^"$I"$"; done) \
	$(for I in $Dubli ; do echo -n " -e " $I$I; done) \
	$(for I in $Tribli ; do echo -n " -e " $I$I$I; done)



Подробная информация о списке рассылки Oo-discuss