[oodisc] Cyrillic Typography

Pavel Sokolov wcatc на mail.ru
Вс Фев 15 12:56:21 MSK 2004


Здравствуйте, Алексей,


AK> Тогда я попробую конкретизировать. Нужно, чтобы фрагменты
AK> текста, подлежащие исправлению, могли быть найдены путем
AK> поиска с использованием регулярных выражений и затем поддавались
AK> анализу стандартными средствами. Соответственно, поддержку
AK> обработки выделенных фрагментов я не планировал (по крайней
AK> мере, в основном модуле), т. к. поиск эффективно работает,
AK> только если ему не задавать границ.

[chop-chop]

AK> Самое забавное в том, что это не так просто реализовать в OOo, т. к.
AK> его поиск не знает такого понятия, как символ абзаца, а оперирует
AK> только с его началом/концом. По идее, поиск на регулярное выражение
AK> "$^" должен был бы давать нужный эффект, но фактически оно
AK> работает точно так же, как и "^$", т. е. почему-то находит лишь
AK> пустые строки.

AK> Далее, как я сказал, работать с выделенным фрагментом нежелательно.
AK> Если же обрабатывать весь документ, тогда нужно обеспечить
AK> анализ начальных отступов и/или пустых строк, чтобы определить,
AK> какие именно абзацы подлежат уничтожению. Красивого способа
AK> реализовать это для OOo я не вижу. Как мне представляется, с
AK> этим лучше справился бы какой-либо фильтр обработки текстовых
AK> документов, написанный на Perl или подобном языке.
[chop-chop]

 Я правильно понял, что ограничение на использование выделенного
 фрагмента связано именно с использованием regexp?
 
 А если попробовать убирать символ абзаца не через регулярное
 выражение, а просто, по рабоче-крестьянски, в цикле выбирать строки
 из выделенного фрагмента и убивать последний символ?
 Правда производительность будет...

-- 
С уважением,
 Pavel                            mailto:wcatc at mail.ru



Подробная информация о списке рассылки Oo-discuss