чете текст от определена страница с помощта на PDFBox

Знам как да чета текст на цял pdf файл с помощта на PDFBox с помощта на PDFTextStripper.getText(PDDocument).

Имам и пример за това как да получа препратка към обект към определена страница с помощта на PDDocumentCatalog.getAllPages().get(i).

Как да получа текста само на една страница с помощта на PDFBox, тъй като не виждам такъв метод в клас PDPage?


person Shyam Sundar Ananthaswamy    schedule 26.11.2012    source източник


Отговори (1)


Можете да зададете параметри на PDFTextStripper, за да четете определени страници :

PDDocument doc; // document
int i; // page no.

PDFTextStripper reader = new PDFTextStripper();
reader.setStartPage(i);
reader.setEndPage(i);
String pageText = reader.getText(doc);

Доколкото ми е известно, PDPage е повече използвани за представяне на страница на екрана, вместо за извличане на текст. Поради това не бих препоръчал да използвате това за извличане на текст.

person amaidment    schedule 28.03.2013