Как я могу использовать python для редактирования тегов файлов docx и/или doc в системе Windows?

У меня есть папка с большим количеством файлов .doc и .docx, я хотел бы разработать скрипт python для редактирования тегов каждого файла, чтобы я мог найти файл в папке, используя теги - таким образом, моя жизнь немного Полегче.

Я не уверен, с чего начать, и надеялся, что кто-нибудь укажет мне на библиотеку или предоставит пример кода, который поможет мне начать работу.

Я не уверен, имеет ли значение расширение файла, потому что это похоже на свойство Windows (щелкните правой кнопкой мыши файл> Свойства> Сведения> Теги> введите теги), но если расширение имеет значение, я могу изменить все файлы на .docx


person Hisham Hafez    schedule 09.01.2019    source источник


Ответы (1)


Пакет python-docx предоставляет методы для доступа к большинству метаданных в файл слова. Класс docx.opc.coreprops.CoreProperties в частности, позволяет вам изменить автора, категорию и т. д. Я не видел упомянутых тегов, но если вы проведете дополнительное исследование, я уверен, что вы сможете его найти.

CorePropertiesObjects

person PyNoob    schedule 09.01.2019