Имам нужда от помощ при анализирането на html. Преди да публикувам въпрос тук, се опитах да намеря този отговор, но не успях. Съхранил съм пълен html на страницата на блога в таблица с база данни. Сега искам да извлека текст и изображения от този html. НО трябва да извлека само специфичен за абзац текст и изображения от целия html.
Вижте примера по-долу, има много кодови тагове в него. Има три параграфа. Трябва да извлека текст и изображения само от параграф 2, който е подходящ за моите изисквания. (Имам ключова дума и мога да търся тази ключова дума и по този начин мога да идентифицирам, че трябва да извлека този параграф.)
Как мога да извлека конкретен текст и изображения на абзац от всеки блог. Имам ключова дума за търсене в html, т.е. ключова дума = ПРОДУКТ ABC. Използвам php.
<html>
<!-- Javascript: tag come here --->
<!-- Head: tag come here --->
<!-- Meta: tag come here --->
<!-- Title: tag come here --->
<!-- Links: tag come here --->
<!-- Javascript: tag come here --->
<body>
<!-- Lot of other code come here about links, javascript, headings etc -->
<!-- DIV: tag come here --->
<p> "PARAGRAPH 1, This paragraph contain only some text." </p>
<!-- Script: tag come here --->
<p> PARAGRAPH 2, It has some information about PRODUCT ABC...</p>
<img /> <!-- some images come here related to this paragraph.-->
<img /> <!-- some images come here related to this paragraph.-->
<img /> <!-- some images come here related to this paragraph.-->
<!-- Script: tag come here --->
<p> PARAGRAPH 3, This paragraph contain only some text. </p>
<img /> <!-- some images come here related to this paragraph.-->
<!-- Links: tag come here --->
<!-- Javascript: tag come here --->
</body>
</head>
</html>
$html = file_get_html('http://www.google.com/'); $par=$html->find('p[id=hello]') ; foreach($par->find('img') as $element) echo $element->src . '<br>';
- person dreamweiver   schedule 24.05.2013