Мне приходится иметь дело с неверными тегами Html и Html внутри атрибутов Html:
<p class="<sometag attr="something"></sometag>">
<a href="<someothertag></someothertag">Link</a>
</p>
Я попытался использовать HtmlAgilityPack для анализа содержимого, но когда вы загружаете приведенный выше код в HtmlDocument, OuterHtml
выводит:
<p class="<sometag attr=" something"="">">
<a href="<someothertag></someothertag">Link</a>
</p>
Тег p
становится искаженным, а someothertag
внутри атрибута href
тега a
не распознается как узел (хотя на самом деле это текст внутри атрибута, я бы хотел, чтобы он распознавался как тег).
Есть ли что-то еще, что я могу использовать, чтобы помочь мне разобрать такой плохой HTML-код?