[oodisc] OO.o 641C Win32 as html editor
Maksim Otstavnov
maksim на otstavnov.com
Пн Дек 31 04:38:51 MSK 2001
Hello Aleksey,
Monday, December 31, 2001, 4:09:43 AM, you wrote:
>AN> Вопрос: можно ли в принципе допускать ввод символов Latin1 в тексте,
>>AN> помеченном как русский, без явного указания этого? Не стоит ли по
>>AN> умолчанию проверять вводимые символы на принадлежность текущему языку?
>>
>>Я понимаю, как проверить, если пара английский/русский. А если еще и
>>французский и украинский?
>>
AN> Проблемы здесь нет, если Вы используете (а при корректной
AN> интернационализации X Вы используете) xkb, так
AN> как клавиатура описана 16-битными keysyms.
Тогда вопрос риторический, отвечаем утвердительно: да, нельзя... :)
AN> В коммерческих Unices дело обстоит очень по-разному, но иногда это
AN> объясняется ленью "локализаторов".
...в линуксовой и виндовой сборке.
Т.е. текста из латинских букв, помеченного как русский, быть не
должно. Нужно банить его ввод и избавляться при импорте :(
AN> Это уже сделано. Гляньте в /usr/X11R6/lib/X11/xkb/symbols/{ru,fr,de,ua}
AN> дело ведь не в языке, а в принадлежности символа языку.
Да, тогда нечего на клаву смотреть.
>>>
>>>
>>> 2. С импортом "бедных" форматов дело обстоит совсем плохо: "i"
>>> украинское и "i" английское в 8-ми битах отличить сложно без
>>> контекстной эвристики.
>>>
>> Это разные keysym: i и Ukrainian_i
>>
AN> Извините, здесь я был невнимателен.
AN> При импорте таких форматов надо просто явно указать кодировку (как в OOo
AN> для Encoded Text). В этих форматах тексты не бывают многокодировочными.
AN> (многоязычными -- могут быть, но это совсем особый случай).
Это типичный случай для, например, английско-украинской среды. И
тривиального (без эвристики) решения нет.
--
-- Maksim
Подробная информация о списке рассылки Oo-discuss