създайте помощен файл в txt от документ на ms word

Трябва да създам txt файл от документ на ms word. Txt файлът ще се използва като помощен документ за моя потребителски интерфейс и следователно трябва да бъде в специален формат. Има ли софтуер на трета страна, който мога да използвам за четене на ms word doc и създаване на текстов файл от него в определен формат? Или мога да използвам PERL, за да прочета word doc по начин, по който мога да извлека заглавките, таблиците и заглавията на секциите, както е посочено в word doc. Трябва да прочета документа на word и докато го анализирам, трябва да измисля начин да кажа дали редът, анализиран от документа на ms word, е съдържание на таблица или заглавие на раздел? Или има някакъв друг начин да го направите?


person user3676724    schedule 26.05.2014    source източник
comment
Какъв е този специален формат? Опишете какво точно искате да направите, вместо просто да искате „текстов файл“!   -  person Andrey Popov    schedule 26.05.2014


Отговори (1)


Имам много по-запознати с анализирането на HTML, така че бих ви препоръчал да преведете вашите Word документи в HTML първо с помощта на MSWord::ToHTML или някакъв еквивалентен модул.

След това можете да използвате един от безбройните модули за анализ на HTML, като Mojo::DOM за анализ вашите данни и техния стил. Има 8-минутен видеоклип за това как да използвате последния модул Mojocast Episode 5.

person Miller    schedule 26.05.2014