У меня возникли проблемы с использованием пакета R, 'tm' для чтения файлов .pdf. В частности, я пытаюсь запустить следующий код:
library(tm)
filename = "myfile.pdf"
tmp1 <- readPDF(PdftotextOptions="-layout")
doc <- tmp1(elem=list(uri=filename),language="en",id="id1")
doc[1:15]
... что дает мне ошибку:
Error in readPDF(PdftotextOptions = "-layout") :
unused argument (PdftotextOptions = "-layout")
Я предполагаю, что это связано с тем, что программа pdftotext (часть xpdf, http://www.foolabs.com/xpdf/download.html) неправильно установлен на моем компьютере, поэтому R не может получить к нему доступ.
Каковы шаги для правильной установки xpdf/pdftotext, чтобы приведенный выше код R мог быть выполнен? (Мне известны уже опубликованные подобные вопросы, однако они не решают ту же проблему)
readPDF
без опции-layout
? - person Karsten W.   schedule 23.03.2016tm
. Разархивируйте файл и прочитайте инструкции. - person RHertel   schedule 23.03.2016readPDF()
используйте аргументengine
, чтобы установить poppler в качестве механизма извлечения. - person   schedule 23.03.2016