У меня есть текстовый файл, в котором есть данные XML и данные HTML. Оба начинаются с ‹. Теперь я хочу извлечь только данные XML и сохранить их в другом файле. Как мне это сделать?
Пример файла:
xyz data:
<note>
<to>john</to>
<from>doe</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
xyz data
<bold>xyz</bold>
text
text
text
<bold>xyz</bold>
again XML data
Примечание. Этот файл имеет формат .txt.
<
и>
, разбросанными в разных местах. Вот что у вас есть. Что вы можете попытаться сделать, так это проанализировать это с помощью парсера HTML, а затем посмотреть на полученный DOM. - person Tomalak   schedule 20.10.2020