[oodisc] OO.o 641C Win32 as html editor

Maksim Otstavnov maksim на otstavnov.com
Пн Дек 31 04:38:51 MSK 2001


Hello Aleksey,

Monday, December 31, 2001, 4:09:43 AM, you wrote:

>AN> Вопрос: можно ли в принципе допускать ввод символов Latin1 в тексте,
>>AN> помеченном как русский, без явного указания этого? Не стоит ли по 
>>AN> умолчанию проверять вводимые символы на принадлежность текущему языку?
>>
>>Я понимаю, как проверить, если пара английский/русский. А если еще и
>>французский и украинский?
>>
AN> Проблемы здесь нет, если Вы используете (а при корректной 
AN> интернационализации X Вы используете) xkb, так
AN> как  клавиатура описана 16-битными  keysyms.

Тогда вопрос риторический, отвечаем утвердительно: да, нельзя... :)

AN> В коммерческих Unices дело обстоит очень по-разному, но иногда это
AN> объясняется ленью "локализаторов".

...в линуксовой и виндовой сборке.

Т.е. текста из латинских букв, помеченного как русский, быть не
должно. Нужно банить его ввод и избавляться при импорте :(

AN> Это уже сделано. Гляньте в /usr/X11R6/lib/X11/xkb/symbols/{ru,fr,de,ua}
AN> дело ведь не в языке, а в принадлежности символа языку.

Да, тогда нечего на клаву смотреть.

>>>
>>>
>>> 2. С импортом "бедных" форматов дело обстоит совсем плохо: "i"
>>> украинское и "i" английское в 8-ми битах отличить сложно без
>>> контекстной эвристики.
>>>
>> Это разные keysym: i и Ukrainian_i
>>
AN> Извините, здесь я был невнимателен.
AN> При импорте таких форматов надо просто явно указать кодировку (как в OOo 
AN> для Encoded Text). В этих форматах тексты не бывают многокодировочными. 
AN> (многоязычными -- могут быть, но это совсем особый случай).

Это типичный случай для, например, английско-украинской среды. И
тривиального (без эвристики) решения нет.

-- 
-- Maksim






Подробная информация о списке рассылки Oo-discuss