[oodisc] OO.o 641C Win32 as html editor
Aleksey Novodvorsky
aen на logic.ru
Пн Дек 31 05:17:46 MSK 2001
Maksim Otstavnov wrote:
>Hello Aleksey,
>
>Monday, December 31, 2001, 4:09:43 AM, you wrote:
>
>>AN> Вопрос: можно ли в принципе допускать ввод символов Latin1 в тексте,
>>
>>>AN> помеченном как русский, без явного указания этого? Не стоит ли по
>>>AN> умолчанию проверять вводимые символы на принадлежность текущему языку?
>>>
>>>Я понимаю, как проверить, если пара английский/русский. А если еще и
>>>французский и украинский?
>>>
>AN> Проблемы здесь нет, если Вы используете (а при корректной
>AN> интернационализации X Вы используете) xkb, так
>AN> как клавиатура описана 16-битными keysyms.
>
>Тогда вопрос риторический, отвечаем утвердительно: да, нельзя... :)
>
Нельзя -- что? Французский и украинский при вводе не пересекаются.
Внутри OOo они не пересекаются тем более -- все в UCS.
>
>
>AN> В коммерческих Unices дело обстоит очень по-разному, но иногда это
>AN> объясняется ленью "локализаторов".
>
>...в линуксовой и виндовой сборке.
>
>Т.е. текста из латинских букв, помеченного как русский, быть не
>должно. Нужно банить его ввод и избавляться при импорте :(
>
А почему _такой_ смайлик?
>
>
>
>AN> При импорте таких форматов надо просто явно указать кодировку (как в OOo
>AN> для Encoded Text). В этих форматах тексты не бывают многокодировочными.
>AN> (многоязычными -- могут быть, но это совсем особый случай).
>
>Это типичный случай для, например, английско-украинской среды. И
>тривиального (без эвристики) решения нет.
>
И здесь -- не соглашусь. Если текст украинский, то в нем не только
Ukrainian_i , но и Ukrainian_ie, у которой нет английского аналога, а
потому Ukrainian_i наверняка набирается в украинском регистре, то есть
имеет код > 128. Иное -- откровенная небрежность.
Проблемы могут возникнуть при наборе
украинско-беларусско-русско-сербского текста. Ни один из алфавитов не
является подмножеством другого (но все входят в CP1251). Такой текст
нуждается в принудительной языковой разметке.
>
>
В общем, с MS-форматами предстоит долгая возня. К сожалению, бытующее
мнение о хорошей переносимости (и чуть ли не стандартизованности) rtf и
сносной -- WW6/95 абсолютно неверно. MS и стандартизация несовместимы по
определению, пресловутая decommodization существовала в этой фирме
задолго до автора нашумевших документов и, скорее всего, была обычным
пофигизмом. При всей своей закрытости, лучший формат -- WW97/2000. Про
XP не знаю, мне еще в нем никто ничего не присылал.
Вообще, разработка государственного стандарта на форматы
документооборота, -- лучшее, что можно было бы придумать. MS как
миленький напишет конверторы. Но это нельзя отдавать на откуп
Госстандарту, даже если его профинансируют, -- разработка должна иметь
высокий статус.
Написал и вспомнил про Брябрина....
Rgrds, AEN
Подробная информация о списке рассылки Oo-discuss