У меня есть содержимое ниже на Java, где я хочу удалить только теги html, но не символы новой строки.
<p>test1 <b>test2</b> test 3 </p> //line 1
<p>test4 </p> //line 2
Если я открою вышеуказанное содержимое в текстовом редакторе, строка 1 и строка 2 отображаются в разных строках (без отображения тега </p>
). Но в блокноте содержимое отображается вместе с тегами </p>
. Чтобы удалить все теги html, которые я использовал
Jsoup.parse(aboveContent).text()
Он удаляет все символы html. Но он показывает всю строку 1 и строку 2 в одной строке в блокноте. Каким-то образом Jsoup также удаляет символ новой строки.
Что я пробовал: -
Я также попытался заменить </p>
на \r\n
, а затем удалить теги html.
Jsoup.parse(contentWith\r\n-Insteadof-</p>Tag ).text()
но все же Jsoup удаляет символ конца строки (поскольку в отладчике я вижу как строку 1, так и строку 2) в одной строке.
Как я могу заставить Jsoup удалять только символ html, но не символ новой строки?