[oodisc] ctrl+c(AcrobatReader/XPDF)_ctrl+v(OpenOffice.org)

Alexej Kryukov akrioukov на newmail.ru
Вт Мар 1 22:32:17 MSK 2005


On Tuesday 01 March 2005 20:44, Denis G. Samsonenko wrote:
>
> Суть такова: мой опыт показывает, что без использования пакета cmap
> копировать кириллицу из акробата не удаётся ни по линухом, ни под
> виндой. При использовании же cmap становится возможным копирование
> кириллицы из акробата как под виндой, так и под линухом. Правда в
> последнем случае только из 7'ой версии акробата.
>
> Не доверять своим глазам я как-то не могу.

Просто здесь желаемый эффект достигается (почти) случайным совпадением
нескольких факторов, которого Вы могли и не наблюдать. Итак: имеем
линуксовый acroread версии 5. Он, естественно, неюникодовый, по каковой
причине от cmap большой пользы нет: поиск всё равно не работает, а
кириллица копируется в виде последовательности символов ASCII. То
же самое относится и к файлам, сгенерированным через OOo. Но это Вы и
без меня знаете.

Теперь создаем pdf без использования CMAP (именно с помощью pdftex --
цепочка latex->dvips->ps2pdf этого эффекта не дает!). В этом случае
acroread будет считать, что файл состоит из 8-битных символов. Причем,
если в файле использовался postscript-шрифт, то код каждого символа
будет соответствовать его позиции в физическом pfb-файле, а не в 
тех виртуальных шрифтах, через посредство коих он доведен до
компилятора. Этот физический pfb-файл, скорее всего, имеет
кодировку cp1251 или нечто на ее базе. Так вот, если у нас
системная локаль тоже ru_RU.CP1251, то в буфере обмена мы
получаем 8-битный текст в локальной кодировке, который потом
и вставляем благополучно в OOo.

Правда, я так и не понял до конца, какую роль здесь играет
локаль. Казалось бы, при локали KOI8-R у нас в буфере обмена
должна получаться бНОПНЯ, а вместо этого не получается вообще
ничего... Но тем не менее факт есть факт.

-- 
Regards,
Alexej Kryukov <akrioukov at newmail dot ru>

Moscow State University
Historical Faculty


Подробная информация о списке рассылки Oo-discuss