[oodisc] лПДЙТПЧЛБ ЖБКМПЧ ппП ?

Alexej Kryukov akrioukov на newmail.ru
Пн Фев 28 19:37:44 MSK 2005


On Sunday 27 February 2005 23:53, Serge Skorokhodov wrote:
>
> Вот и все, чисто технический вопрос, выбирайте, что какой вариант
> удобнее для Вашей ситуации. Все остальное, это дело вкуса и
> "священные войны":) На сем позвольте этот оффтоп завершить,
> надеюсь, что больше споров на эту тему не будет:)

Да вот как бы не так :) Видите ли, в чем дело: никакой священной
войны (по крайней мере, до возникновения вопроса о BOM) тут на самом
деле не было, ибо никто и не пытался противопоставлять разные способы
представления Юникода друг другу. Кроме Николая Кузнецова, который
сделал это невольно: не из каких-то принципиальных соображений, а
просто по незнанию. Так что разговор должен был заглохнуть сам
собой. Но вот Ваша простыня (хотя большая часть ее содержимого --
прописная истина и обсуждению не подлежит) не только не кладет
конец этому "оффтопику", но, напротив, придает ему второе дыхание.

> Недостаток у нее --- значительно труднее реализуется обработка
> текста, т.к. "внутре у программы" разные символы имеют разную
> длину. У двухбайтовых кодировок этого недостатка нет, поэтому
> алгоритмы обработки текста реализуются "прямее":)

Я тоже раньше так думал... Но Вы не учитываете одной вещи: Юникод
давно перерос отведенные для него 16-битные рамки. А поскольку
всеобщий переход на 4-байтное представление был бы явным
расточительством, придумали механизм "суррогатных пар", с помощью
которых кодируются символы 32-битного Юникода. Что фактически
мало чем отличается от способа представления 16-битных символов
в UTF-8. Тем самым, IMHO, преимущества UCS-2 перед UTF-8 как-то
стираются...


-- 
Regards,
Alexej Kryukov <akrioukov at newmail dot ru>

Moscow State University
Historical Faculty


Подробная информация о списке рассылки Oo-discuss