The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

pstotext - extract plain text from PostScript and PDF files

Дата
13 Jan 2005
Заголовокpstotext - extract plain text from PostScript and PDF files
ПояснениеПрограмма для преобразования PS или PDF файлов в текстовый формат (для поддержки русского нужно патчить).
  • Единственное нормальное средство для конвертации в текст из PDF или PS с кириллицей внутри, утилита pdftotex из комплекта xpdf: "pdftotext -enc KOI8-R test.pdf";
  • PreScript - утилита на Python для вытаскивания текста из PostScript файлов , возможен вывод в HTML формате;
  • ps2html - конвертирует PostScript в HTML с максимальным сохранением форматирования.
  • PsToEdit - ковертирует PostScript и PDF во всевозможные форматы, включая текст и HTML;
  • Из pdf можно сконвертировать в PS используя pdf2ps.
  • Используя ghostscript можно конвертировать так:
    gs -q -dNODISPLAY -dNOBIND -dWRITESYSTEMDICT -dSIMPLE -c save -f ps2ascii .ps fite.ps -c quit
  • Home URLhttp://www.research.compaq.com/SRC/virtualpaper/pstotext.html
    Флагenglish
    РазделПреобразование из одного формата в другой
    Ключи

     Добавить ссылку
     
     Поиск ссылки (regex):
     

    Последние заметки
    << Предыдущие 15 записей
    - 13.09.2020 Гитара в Debian и борьба с XRUN
    - 11.09.2020 Первоначальная настройка VPS сервера на базе CentOS 8
    - 18.08.2020 Установка в Firefox официального расширения Google Translate, поставляемого для Chrome
    - 10.08.2020 Создание сборки Android 10 для Raspberry Pi 4
    - 10.07.2020 Включение DNS over TLS в Fedora
    - 29.06.2020 Диапазоны IP-адресов облачных сервисов Amazon, Google, OVH, DigitalOcean и Microsoft
    - 16.06.2020 Развёртывание приложений .NET/ASP.NET Core в Ubuntu 20.04 с Nginx
    - 02.05.2020 Логическое объединение нескольких файловых систем при помощи mergerfs
    - 13.04.2020 Откуда берется steal внутри виртуальных машин и что с этим делать
    - 03.04.2020 Настройка PulseAudio и ALSA для достижения максимального качества звука
    - 13.03.2020 Использование tor из состава Tor Browser без запуска самого браузера
    - 05.03.2020 Конвертация Chrome-дополнения для запуска в Firefox
    - 23.02.2020 Генерация конфигурации клиента OpenSSH из inventory.ini в Ansible
    - 22.02.2020 Преобразование закрытого ключа PuTTY для использования в OpenSSH
    - 21.02.2020 Использование SSH-ключей в Gitlab CI
    Следующие 15 записей >>




    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру