[oodisc] OO.o 641C Win32 as html editor

Aleksey Novodvorsky aen на logic.ru
Пн Дек 31 05:17:46 MSK 2001


Maksim Otstavnov wrote:

>Hello Aleksey,
>
>Monday, December 31, 2001, 4:09:43 AM, you wrote:
>
>>AN> Вопрос: можно ли в принципе допускать ввод символов Latin1 в тексте,
>>
>>>AN> помеченном как русский, без явного указания этого? Не стоит ли по 
>>>AN> умолчанию проверять вводимые символы на принадлежность текущему языку?
>>>
>>>Я понимаю, как проверить, если пара английский/русский. А если еще и
>>>французский и украинский?
>>>
>AN> Проблемы здесь нет, если Вы используете (а при корректной 
>AN> интернационализации X Вы используете) xkb, так
>AN> как  клавиатура описана 16-битными  keysyms.
>
>Тогда вопрос риторический, отвечаем утвердительно: да, нельзя... :)
>
Нельзя -- что? Французский и украинский при вводе не пересекаются.
Внутри OOo они не пересекаются тем более -- все в UCS.

>
>
>AN> В коммерческих Unices дело обстоит очень по-разному, но иногда это
>AN> объясняется ленью "локализаторов".
>
>...в линуксовой и виндовой сборке.
>
>Т.е. текста из латинских букв, помеченного как русский, быть не
>должно. Нужно банить его ввод и избавляться при импорте :(
>
А почему _такой_ смайлик?

>
>
>
>AN> При импорте таких форматов надо просто явно указать кодировку (как в OOo 
>AN> для Encoded Text). В этих форматах тексты не бывают многокодировочными. 
>AN> (многоязычными -- могут быть, но это совсем особый случай).
>
>Это типичный случай для, например, английско-украинской среды. И
>тривиального (без эвристики) решения нет.
>
И здесь -- не соглашусь. Если текст украинский, то в нем не только 
Ukrainian_i , но и Ukrainian_ie,  у которой нет английского аналога, а 
потому Ukrainian_i наверняка набирается в украинском регистре, то есть 
имеет код > 128. Иное -- откровенная небрежность.
Проблемы могут возникнуть при наборе  
украинско-беларусско-русско-сербского текста. Ни один из алфавитов не 
является подмножеством другого (но все входят в CP1251).  Такой текст 
нуждается в принудительной языковой разметке.

>
>

В общем, с MS-форматами предстоит долгая возня. К сожалению, бытующее 
мнение о хорошей переносимости (и чуть ли не стандартизованности)  rtf и 
сносной -- WW6/95 абсолютно неверно. MS и стандартизация несовместимы по 
определению, пресловутая decommodization существовала в этой фирме 
задолго до автора нашумевших документов и, скорее всего, была обычным 
пофигизмом. При всей своей закрытости, лучший формат -- WW97/2000. Про 
XP не знаю, мне еще в нем никто ничего не присылал.
Вообще, разработка государственного стандарта на форматы 
документооборота, -- лучшее, что можно было бы придумать. MS как 
миленький напишет конверторы. Но это нельзя отдавать на откуп 
Госстандарту, даже если его профинансируют, -- разработка должна иметь 
высокий статус.  
Написал и вспомнил про Брябрина....

Rgrds, AEN





Подробная информация о списке рассылки Oo-discuss