Вопросы по теме 'pdftotext'

Установка poppler с помощью fink на Mac OSX Mountain Lion, похоже, не устанавливает утилиту pdftotext
Я хочу установить pdftotext на MacOSX. Я предпочитаю fink другим установщикам пакетов. Я использовал: fink install poppler46 думал, что pdftotext может быть включен (как при использовании brew install poppler), но, похоже, это не так....
736 просмотров
schedule 25.11.2022

как связать xargs с конвертером pdftotext для поиска в нескольких файлах PDF
Я делаю скрипт, который должен искать во всех файлах PDF в каталоге. Я нашел один преобразованный файл с именем «pdftotext», который позволяет мне использовать grep для файлов pef, но я могу запустить его только с одним файлом. Когда я хочу...
741 просмотров
schedule 24.10.2022

Установка pdftotext в Windows (для использования с пакетом R, 'tm')
У меня возникли проблемы с использованием пакета R, 'tm' для чтения файлов .pdf. В частности, я пытаюсь запустить следующий код: library(tm) filename = "myfile.pdf" tmp1 <- readPDF(PdftotextOptions="-layout") doc <-...
3643 просмотров
schedule 24.11.2022

Как использовать AWS lambda для преобразования файлов PDF в .txt с помощью Python
Мне нужно автоматизировать преобразование многих pdf в текстовые файлы с помощью AWS lambda в python 3.7. Я успешно конвертировал pdf-файлы с помощью poppler/pdftotext, tika и PyPDF2 на своей машине. Однако время ожидания истекло или ему нужно...
1440 просмотров

Tabula не обнаруживает некоторые таблицы с PDF-файлами, созданными с помощью того же программного обеспечения.
Я пытаюсь автоматизировать сортировку своих расходов в отчете о кредитной карте, которую предоставляет мой банк. Я нашел табулу, которая работала как чудо во многих pdf-файлах, упрощая преобразование в csv, а затем обрабатывая его так, как я хочу,...
140 просмотров
schedule 07.12.2023