Мне нужна помощь в разборе html. Прежде чем публиковать вопрос здесь, я пытался найти этот ответ, но не смог найти. Я сохранил полный html страницы блога в таблице базы данных. Теперь я хочу извлечь текст и изображения из этого html. НО мне нужно извлечь из всего html только текст и изображения, относящиеся к абзацу.
См. пример ниже, в нем много тегов кода. В нем три абзаца. Мне нужно извлечь текст и изображения только из пункта 2, который соответствует моему требованию. (У меня есть ключевое слово, и я могу выполнить поиск по этому ключевому слову, и таким образом я могу определить, что мне нужно извлечь этот абзац.)
Как я могу извлечь определенный текст абзаца и изображения из любого блога. У меня есть ключевое слово для поиска в html, то есть ключевое слово = PRODUCT ABC. Я использую пхп.
<html>
<!-- Javascript: tag come here --->
<!-- Head: tag come here --->
<!-- Meta: tag come here --->
<!-- Title: tag come here --->
<!-- Links: tag come here --->
<!-- Javascript: tag come here --->
<body>
<!-- Lot of other code come here about links, javascript, headings etc -->
<!-- DIV: tag come here --->
<p> "PARAGRAPH 1, This paragraph contain only some text." </p>
<!-- Script: tag come here --->
<p> PARAGRAPH 2, It has some information about PRODUCT ABC...</p>
<img /> <!-- some images come here related to this paragraph.-->
<img /> <!-- some images come here related to this paragraph.-->
<img /> <!-- some images come here related to this paragraph.-->
<!-- Script: tag come here --->
<p> PARAGRAPH 3, This paragraph contain only some text. </p>
<img /> <!-- some images come here related to this paragraph.-->
<!-- Links: tag come here --->
<!-- Javascript: tag come here --->
</body>
</head>
</html>
$html = file_get_html('http://www.google.com/'); $par=$html->find('p[id=hello]') ; foreach($par->find('img') as $element) echo $element->src . '<br>';
- person dreamweiver   schedule 24.05.2013