[oodisc] OfficeFMT updated

Alexej Kryukov akrioukov на newmail.ru
Вс Авг 15 21:33:42 MSD 2004


On Saturday 14 August 2004 03:26, Aleksey Korotkov wrote:
>
> Проведён эксперимент. Результат прикладывается. ex.sxw --
> почти исходный файл (изначально был вордовский, но открыт
> в OO1.1.2 (win-версия; под Linux лень качать) и сохранён в

Алексей, большое спасибо за проведенный эксперимент. Кое над
чем он в самом деле заставляет задуматься, хотя с Вашими 
оценками я не согласен.

> родном формате. Там вообще-то есть не то, что математика,
> а логика, но проблема не в этом. ex-fmt.tex.bz2 -- это то, что
> вышло в результате экспорта через OfficeFMT. Нечто странное %).

А что конкретно Вам не нравится? По-моему, этот файл -- едва ли 
не образец чистоты, особенно в сравнении со вторым :)

> AK> Собственно, смысл данного
> AK> фильтра в том, чтобы обеспечить получение максимально чистого
> AK> выходного файла.

Поясню: чистота и валидность -- вообще говоря, вещи разные. Если
автор writer2latex жертвует чистотой ради валидности, то я в
ряде случаев считаю нужным поступать как раз наоборот. Поэтому 
не исключены ситуации, в которых файл может требовать ручной 
доводки (см. ниже).

> Что-то не вышло у меня получить такой файл.

В этом файле имеется три косяка, из-за которых он не компилируется.
Их в принципе легко исправить вручную, после чего можно получить
вполне удовлетворительный dvi:

1) Документ оформлен как чисто английский: в опциях babel нет
русского языка, а в опциях fontenc -- кириллической кодировки.
Естественно, это вызовет сбой на первом же русском символе.
Виноват автор документа, некорректно выставивший показатель языка.
В документации я предупреждаю о том, что языковая разметка
целиком на совести автора: фильтр воспроизводит ее как есть,
но ничего не исправляет.

2) Элемент списка 10-го уровня вложенности, в виде которого оформлен
эпиграф. Вообще говоря, здесь виноват опять же автор исходного
документа, избравший столь экзотический способ оформления, если только
это не глюк преобразования из Ворда в OOo. LaTeX же допускает не более
четырех уровней, из-за чего, естественно, возникает ошибка.

writer2latex, видимо, принудительно ограничивает уровень вложенности,
за счет чего и справляется с данной ситуацией. Но я не уверен, что
это хорошо. Представим себе документ, в котором действительно
используется более четырех уровней: очевидно, что подобное ограничение
будет чревато потерей информации. Поэтому м. б. правильнее в такой
ситуации генерировать код именно с полным сохранением структуры
нумерации (хотя бы и ценой валидности). А автор уже пускай потом
разбирается со своими списками вручную.

3) Видимо, символ logical not нельзя воспроизводить в текстовой моде 
as is: нужно либо заключать его между долларами, либо использовать
команду \textlnot. С моей точки зрения, это недоработка авторов
соответствующих пакетов для LaTeX. Но, впрочем, обеспечить workaround
проблемы не составляет, и я это сделаю.

> AK> Поэтому, если кому нужна не чистота, а
> AK> максимум возможностей, то рекомендуется вместо моей версии
> использовать AK> writer2latex by Henric Just
> (http://www.hj-gym.dk/~hj/writer2latex/).
>
> А там это настраивается.

Там чистота достигается в основном за счет отказа от передачи 
существенных элементов оформления. Но, впрочем, если кому
нравится -- вольному воля. Не зря же я и ссылочку на него дал.

> AK> Но его гораздо сложнее устанаваливать и настраивать;
>
> Да я бы не сказал, что ставить его сложнее. И настройка
> тоже -- коротенький xml-файл, всё очевидно.

На самом деле, он довольно длинный, если учесть все возможные
опции. Факт тот, что Вы-то его как раз не настроили: не
указали даже кириллическую кодировку. Так что можете открыть
и полюбоваться, как выглядит русский текст в кодировке 
us-ascii :)

> Результат его работы на том же файле -- ex.tex.bz2. Там
> тоже есть свои непонятки (с символами логических связок),
> но, по крайней мере, он техуется и получается пусть не
> совсем то, что должно быть, но -- похоже.

Да, он техуется. Но вот вопрос: Вы в него заглядывали? А
если заглядывали, то полагаете ли, что *это* можно дальше
как-то редактировать? (На самом деле, это не вина Henric
Just: при правильных настройках writer2latex даже с ним можно
получить намного более приятный результат, чем то, что у
Вас сотворилось на данном этапе).


-- 
Regards,
Alexej Kryukov <akrioukov at newmail dot ru>

Moscow State University
Historical Faculty



Подробная информация о списке рассылки Oo-discuss