Ключевые слова:tex, rus, pdf, (найти похожие документы)
From: Sergey Sinitsa <podrugomu@gmail.com.>
Date: Mon, 24 Apr 2007 14:31:37 +0000 (UTC)
Subject: Оформление TeX для создание правильных PDF с русским текстом
Оригинал: http://rulinux.net.ru/node/44
Делаем правильные русские PDF с помощью свободного софта: OO Writer,
AbiWord, KOffice KWord, Scribus, PDFLaTeX + cmap
PDF с русским текстом оказывается можно сделать неправильно. Если
русский будет находиться в PDF-файле в неправильной кодировке, то не
смотря на то, что документ прекрасно отображается и печатается, с ним
возникают следующие проблемы:
* не работает поиск русских слов при просмотре документа;
* нельзя скопировать текст через буфер обмена;
* люди с ослабленным зрением не смогут использовать программы чтения
текста;
* быстро не посмотреть содержимое присланного документа в виде HTML
при чтении почты в GMail;
* русский текст в документе не индексируется поисковыми машинами в
Сети.
Последний пункт наиболее важен при публикации документов в Сети: такой
PDF сложно будет найти в Google.
Одним из преимуществ Open Office Writer перед MS Office Word является
встроенная возможность экспорта в PDF. Причем Writer из Open Office 2
сохраняет русский правильно.
Легковесный свободный текстовый процессор AbiWord версии 2.4 сохраняет
русский в PDF некорректно. Кроме того, PDF-файл получается в 2,5 раза
больше, чем при сохранении в OO Writer.
Программа вёрстки документов KWord из пакета KOffice под KDE (только
для Linux) также умеет сохранять в PDF. Уникальной особенностью KWord
является возможность импортировать PDF-файлы для редактирования. Как у
KWord обстоит с русским в PDF уточняется, следите за обновлением поста)
Scribus является свободным аналогом профессиональных программ для
верстки Page Maker и Quark Express. Умеет экспортировать в PDF, детали
уточняются...
Вопрос на $100. Единственный способ делать правильные PDF в TeX,
который мне удалось освоить, заключается в использовании пакета cmap.
А это автоматически означает что для создания PDF можно использовать
только PDFLaTeX, но не dvitopdf. Это, в свою очередь, означает
невозможность использования векторных рисунков в формате eps напрямую.
Я нашел следующее решение...
В Debian cmap находится в пакете tetex-extra. Чтобы подключить cmap
надо использовать в документе TeX заголовок следующего вида:
\RequirePackage{cmap}
\RequirePackage[cp1251]{inputenc}
\RequirePackage[TS1,T2A]{fontenc}
\RequirePackage[english,russian]{babel}
Причем именно в таком порядке: cmap первый. Иначе работать не будет!
Все. Теперь, если делать PDF с помощью PDFLaTeX, русский будет в
порядке.
Если надо вставить график или схему в векторном формате, то теперь
единственный вариант вместо eps использовать скрипты MetaPost или
PSTricks, либо конвертировать eps в PDF. Я пошел по первому пути
воспользовавшись тем, что мой рабочий редактор диаграмм Dia умеет
экспортировать в MetaPost напрямую. Что делать с этим *.mp-файлом мне,
избалованному удобством LaTeX-фронтэнда Kile пользователю, было
решительно не ясно. Не помогла и документация tetex на 50Мб. Повезло
что удалось нагуглить страничку одного техасского парня, описывающего
свой опыт использования подготовленной в свободных программах
векторной графики в TeX.
Оказалось, надо откомпилировать mp-файл командой mpost example.mp,
переименовать выходной файл (что-то типа example.1) в example.mps и
вставить в документ следующим образом:
\begin{figure}[ht]
\centering
\includegraphics[width=150mm]{example.mps}
\caption{Подпись}
\label{fig:MyLabel}
\end{figure}
Если диаграмма содержала надписи на русском языке, то в PDF их видно
не будет и для их появления требуются следующее шаманство: открываем
файл example.mp текстовым редактором, заменяем во всем документе {OT1}
на {T2A}, вставляем в заголовок перед \begin{document} руссифицирующее
заклятие:
\RequirePackage[cp1251]{inputenc}
\RequirePackage[TS1,T2A]{fontenc}
Потом сохраняем файл в кодировке cp1251, и далее по схеме выше.
Пол дня жизни ушло на пробы и ошибки, во время эксперементов ни одного
пингвина не пострадало. Все было проделано на свежей инсталляции
Debian GNU/Linux 4.0 Etch. Причем все упомянутые программы находятся
на 1-м DVD из 3-х DVD-дисков дистрибутива, за которые огромное спасибо
Михаилу Коннику.
Debian 4.0 Etch добавился в список свободного софта, которым я могу поделиться.