Я пытался прочитать PDF-файл с помощью Itextsharp в приложении .NET. Я могу читать отдельные слова без ошибок. Задача, с которой я сталкиваюсь сейчас, — чтение таблицы. У меня есть структура таблицы, как это:
Обратите внимание, что здесь некоторые имена столбцов двухстрочные. например, код отдела и идентификационный номер сотрудника.
Поэтому мое требование состоит в том, чтобы прочитать идентификационный номер сотрудника и зарплату, если сотрудник относится к отделу кадров. Для этого я должен проверить, существует ли в файле PDF столбец с именем «Код отдела».
Когда я читаю эту таблицу с помощью iTextsharp, происходит следующее: скажем, часть «Отдел» столбца «Код отдела» находится в позиции 1, но «Код» занимает 5-ю позицию. Это потому, что этот столбец отображается в две строки и есть еще четыре слова существуют в pdf, прежде чем я прочитал часть «Код» в этой колонке. Я полностью застрял в этом :(
Кто-нибудь знает, как убедиться, что имя столбца «Код отдела» существует, и прочитать соответствующие значения из этой таблицы.
Ценю вашу помощь!
С уважением, Джалил