Използвам Camelot за извличане на множество секции от PDF чрез следната команда.
cgl_section = camelot.read_pdf(filename, flavor='stream',
table_areas=['35,490,155,483', '53,480,110,470', '117,480,155,470',
'38,469,106,456', '39,454,105,445', '38,430,155,420',
'38,418,77, 410'])
Това работи добре, когато PDF действително съдържа данни в тези области. Но не очаквам данни във всеки PDF файл, който е анализиран, някои се връщат празни. Получавам следната грешка, когато върнатите данни не са таблица и имат само една колона.
UserWarning: No tables found in table area 1
и
ValueError: min() arg is an empty sequence
Имам нужда от начин да извлека тези специфични области във всички PDF файлове, но да игнорирам празните след това. Необходимо е да можете да използвате извлечените данни по подреден начин.
Отворен и за всякакви други предложения
TIA
exception
, не знам за camelot. - person Mohamed Thasin ah   schedule 02.01.2019