У меня есть сотни файлов .doc с текстом, который мне нужно разместить на веб-страницах.
Я понимаю, что могу преобразовать каждый файл .doc в .txt, а затем использовать включение на стороне сервера для встраивания содержимого каждой страницы в веб-страницу. Это сэкономило бы много времени, потому что я мог бы просто иметь одну страницу .php?txt=..., которая будет отображать разные включения .txt в зависимости от ссылки, которую пользователь нажал, чтобы попасть туда. Это отлично работает по содержанию.
Однако все форматирование теряется при преобразовании в .txt (заголовки должны быть выделены жирным шрифтом)
Когда я конвертирую эти файлы .doc в .html с помощью Microsoft Word, документы с ~ 20 строками становятся раздутыми> 300 файлов строк .htm (вероятно, потому, что каждый абзац помещается в текстовые поля)
«Очистка Word HTML» от Dreamweaver немного помог, но код все еще был чрезвычайно раздутым.
Как бы вы предложили поступить по этому поводу?
редактировать: возможно, я решил свой вопрос, пытаясь встроить документы Google на свою страницу.