[oodisc] Slavi cyrillic letters

Vladimir NOVIKOV vnovikov на novikov.org
Вс Апр 7 00:04:35 MSD 2002


Aleksey Novodvorsky <aen на altlinux.ru> wrote:
> Благодаря ошибке в OOo, выявленной Владимиром Стусем  и помощи Владимира
> Новикова, я составил вирутальный алфайвит славянской кириллицы. Он
> прилагается, замечания приветствуются. Напомню, что пересечение этого
> упорядоченного множества   с множеством букв любого славянского
> кириллического алфавита должно быть упорядочено в соответствие с этим
> алфавитом. Аналогичная задача для тюркской кириллицы, увы, неразрешима.

Привет всем.

Я прочитал подготовленный АЕН вариант, к которому у меня 
есть пара замечаний.

1. Я бы добавил после позиции 106 (буква "Ж") позицию 
юникода 04С1 (молдавское "Ж"). Это единственная буква 
молдавского алфавита, которая отличается от русского, так 
что можно сделать нашим молдавским друзьям такую 
любезность. Соответственно, эта буква стала бы номером 
107, сдвинув остальное вниз.

2. Мне не совсем понятно с буквами "И". В варианте АЕН 
получается "I, И, I с двумя точками, Й". Я бы сделал сначала 
наше "И", потом два латинских, потом наше "Й". Именно так в 
украинском, где есть все четыре буквы "И". Тогда украинская 
сортировака правильна, а остальным по барабану. 
Разумеется, критика принимается и обсуждение 
приветствуется.

3. АЕН ставит македонское KJE сразу после "К", хотя в 
македонском алфавите эта буква стоит сильно ниже (после 
"Т"). Я бы там и оставил. Остальным языкам это не помешает, 
а македонская сортировка станет правильной.

4. По стандарту Unicode наша буква "Х" называется HA, а у 
Алексея - KHA (позиция 131). Это ошибка, или в ОО 
альтерналивные названия? Аналогично YERU vs. YERI.

5. Если уж оставлять 0400, то тогда после наших четырех "И" 
можно засунуть и 040D.

К сожалению, даже этот вариант не будет окончательно 
хорош. Не будет правильно работать сортировка украинского 
(у них мягкий знак является последней буквой) и македонского 
("Ш" последняя) языков.

Сейчас мы ограничены функциональностью программы, над 
которой не имеем контроля. Тем не менее, наверное надо 
будет переговорить с разработчиком на тему выбора таблицы 
сортировки по метке языка. Тогда будет просто несколько 
таблиц сортировки, а та, которую мы с Вами сейчас 
обсуждаем станет чем-то вроде generic cyrillic. на случай 
набранных русскими буквами слов в английском документе.

Я подготовил таблицу ОО, в которой обобщил всё написанное. 
Прилагаю её для обсуждения, критики, предложений. Надеюсь, 
что проаттаченный файл пройдёт, а не будет срезан, как уже 
было.

Пока,


Владимир


************************
Vladimir NOVIKOV		
vnovikov на novikov.org    		
100713.20 на compuserve.com
+++++
We don't need Windows, we don't need Gates,
we have the whole Linux Universe. 	
*************************




Подробная информация о списке рассылки Oo-discuss