Рекомендации по преобразованию PDF

Я использую MarkLogic для создания XML-файлов для PDF-документов, содержащих изображения, форматированный текст (курсив и полужирный), таблицы и т. д. Не могли бы вы предоставить некоторые рекомендации для наилучшего преобразования. Я использую обычное преобразование со следующими конвейерами:

  • Обработка конвертации
  • Преобразование докбука
  • Преобразование HTML
  • Преобразование PDF
  • Преобразование PDF (разметка страницы, пакетная обработка изображений)
  • Обработка изменения статуса

Изображения не сохраняются, их название и формат также не сохраняются. Таблицы отображаются как обычный абзац в сгенерированном XML.


person user1360855    schedule 27.04.2012    source источник


Ответы (1)


Частью преобразования документа является создание файлов CSS для обработки форматирования, а также получение изображений из документа. Оба идут в базу данных. Когда вы используете браузер для просмотра документа, убедитесь, что ссылки на изображения и CSS работают. Возможно, вам придется изменить их, скажем, с /doc1.css на что-то вроде /get.xqy?uri=doc1.css. Также возможно, что другой CSS на странице мешает CSS документа.

person Dave Cassel    schedule 27.04.2012
comment
Я согласен с Дейвом - если вы посмотрите в Firebug или другом отладчике браузера, вы, вероятно, увидите, что запросы на css (и/или изображения) не выполняются. - person Eric Bloch; 27.04.2012
comment
Я хочу ввести некоторый тег (например, ‹italic›) вокруг текста, выделенного курсивом. Кроме того, больше беспокоят таблицы, если таблицы не имеют границ, а значения разделены с помощью вкладок. - person user1360855; 27.04.2012