Я использую MarkLogic для создания XML-файлов для PDF-документов, содержащих изображения, форматированный текст (курсив и полужирный), таблицы и т. д. Не могли бы вы предоставить некоторые рекомендации для наилучшего преобразования. Я использую обычное преобразование со следующими конвейерами:
- Обработка конвертации
- Преобразование докбука
- Преобразование HTML
- Преобразование PDF
- Преобразование PDF (разметка страницы, пакетная обработка изображений)
- Обработка изменения статуса
Изображения не сохраняются, их название и формат также не сохраняются. Таблицы отображаются как обычный абзац в сгенерированном XML.