Вопросы по теме 'pypdf2'

pypdf2 не определен
новое для версии python 3.7. Пытаюсь использовать pypdf2 , но у меня есть ошибка, которую я не могу исправить самостоятельно: моя команда: pdfFile2 = open(r"C:\Users\Luca\Desktop\python\tutorial\doc2.pdf", "wb") # w=write, r=read, b=binary...
2720 просмотров
schedule 18.05.2024

PDFMiner не анализирует более 1 страницы
Я использую PDFMiner6 с Python 3.5. Это намного лучше, чем PyPDF2 (медленнее, но точнее и не выдает кучу букв, не разделенных пробелами). Я попытался разобрать этот документ: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2963791/ (Вы можете...
387 просмотров
schedule 29.04.2024

Не удается получить рабочую командную строку в приглашении для работы над подпроцессом
Мне нужно извлечь текст из PDF. Я попробовал PyPDF2, но метод textExtract вернул зашифрованный текст, хотя pdf не зашифрован в соответствии с методом isEncrypted. Поэтому я перешел к попытке получить доступ к программе, которая выполняет эту...
115 просмотров
schedule 26.05.2024

Решение ошибки рынка EOF не найдено PyPDF2
Я использую PyPDF2 и tika для извлечения текста из файлов .pdf и .htm. Я сталкиваюсь со следующей ошибкой: «PyPDF2.utils.PdfReadError: маркер EOF не найден» Я видел несколько сообщений по этой проблеме, но ни одно из них не содержало решения....
533 просмотров
schedule 25.04.2024

Как использовать AWS lambda для преобразования файлов PDF в .txt с помощью Python
Мне нужно автоматизировать преобразование многих pdf в текстовые файлы с помощью AWS lambda в python 3.7. Я успешно конвертировал pdf-файлы с помощью poppler/pdftotext, tika и PyPDF2 на своей машине. Однако время ожидания истекло или ему нужно...
1440 просмотров

ImportError: невозможно импортировать имя «convert_from_path» из частично инициализированного модуля «pdf2image» (скорее всего, из-за циклического импорта)
Я получаю сообщение об ошибке при использовании модуля pdf2image: from pdf2image import convert_from_path pages = convert_from_path('mypdf', 500) для страницы в страницах: page.save('out.jpg', 'JPEG')
4171 просмотров
schedule 01.12.2022

Проблема с созданием интерактивного оглавления с использованием ссылок [пакет Python FPDF]
Я пытаюсь создать оглавление с помощью пакета Python FPDF ( https://pyfpdf.readthedocs.io/en/latest/ ) Я хочу, чтобы оглавление было в верхней части PDF-документа и было интерактивным, чтобы читатель сразу переходил к разделу. Проблема...
622 просмотров
schedule 13.12.2023

Поддерживаемые альтернативы PyPDF2
Я использую библиотеку PyPDF2 для извлечения текста, изображений, ширины и высоты страницы, аннотаций и другие атрибуты из pdf-документов. Однако в библиотеке много ошибок и проблем, и похоже, она не поддерживается в течение длительного...
2222 просмотров
schedule 30.05.2024

Выдавать горизонтальное отражение PDF с помощью PyPDF2 только в некоторых PDF-файлах
Мне нужно написать программу для быстрого и легкого перелистывания PDF-файла по горизонтали для строительных базовых чертежей, которые иногда нужно строить как зеркальное отражение того, как архитектор спроектировал его, в зависимости от того, как дом...
162 просмотров
schedule 15.11.2023