[oodisc] Получение текста из pdf
alex
oo_gw на mail.ru
Ср Авг 4 19:32:55 MSD 2004
Николай Кузнецов пишет:
>Здравствуйте, .
>
>Вы писали 2 августа 2004 г., 18:20:49:
>
>a> Есть необходимость выдрать текст из pdf (в Линуксе), но pdftotext и
>a> pdftohtml не дают желаемого результата - русские буквы заменяются
>a> точками, с английскими все нормально. Как можно выдрать текст?
>a> (желательно из консоли, чтобы можно было юзать в других программах).
>
>Там нужна такая штука pdftotextKOI.exe
>
Я же написал, что Линукс. Какой в Линуксе exe?
> и правильно её настроить.
>Также нужен файл KOI8-R.unicodeMap и ещё что-то.
>Всё это можно найти через страницу на www.wincmd.ru -
>"листер-плагин (PDF)filter".
>Если нет ссылок у него на странице - надо списаться с ним по мылу. Я
>брал оттуда.
>Точки - это отсутствие настройки КОИ, а Линух или Винды - неважно.
>
>
И как я буду запискать pdftotextKOI.exe под Линуксом???
Спасибо, конечно, но я всё равно ничего не понял... :-)
Подробная информация о списке рассылки Oo-discuss