Я пытаюсь написать регулярное выражение, которое я могу использовать для преобразования правильно сформированной страницы HTML/php в копию простого текста/php. Я написал регулярное выражение для соответствия тегам HTML, оставив php:
<\w*[\s=\w-\d'"/!]*>
и я заменяю любые совпадения пустой строкой. Проблема, которая у меня есть, заключается в том, что
<!DOCTYPE HTML>
<html lang="en-US">
<head>
<meta charset="UTF-8">
<title></title>
</head>
<body>
становится 7 пустых строк. Есть ли хороший способ заменить символы новой строки в этих строках без замены всех символов новой строки во всем документе?
<?php echo('<b title="remove this too?">boldstuff</b>') ?>
- person ridgerunner   schedule 21.12.2011\s*<\/?\w*[^>]*>\s*
Кажется, работает по приведенной выше ссылке. - person Kassym Dorsel   schedule 21.12.2011'x'
с большим количеством комментариев и отступов (ознакомьтесь с некоторыми из моих ответов здесь для некоторых примеров). Если вы серьезно относитесь к изучению регулярных выражений, я настоятельно рекомендую прочитать: Мастерство регулярных выражений (3-е издание) — время, потраченное на чтение, окупится много раз. Также обязательно ознакомьтесь с: regular-expressions.info. - person ridgerunner   schedule 21.12.2011