Я использую Camelot для извлечения нескольких разделов PDF с помощью следующей команды.
cgl_section = camelot.read_pdf(filename, flavor='stream',
table_areas=['35,490,155,483', '53,480,110,470', '117,480,155,470',
'38,469,106,456', '39,454,105,445', '38,430,155,420',
'38,418,77, 410'])
Это нормально работает, когда PDF-файл действительно содержит данные в этих областях. Но я не ожидаю данных в каждом анализируемом PDF-файле, некоторые из них возвращаются пустыми. Я получаю следующую ошибку, когда возвращаемые данные не являются таблицей, а содержат только один столбец.
UserWarning: No tables found in table area 1
а также
ValueError: min() arg is an empty sequence
Мне нужен способ извлечения этих конкретных областей во всех PDF-файлах, но игнорировать пустые после. Необходимо иметь возможность использовать извлеченные данные упорядоченным образом.
Открыт также для любых других предложений
TIA
exception
, я не знаю о камелоте. - person Mohamed Thasin ah   schedule 02.01.2019