используя простой html dom для очистки

Я безуспешно пытаюсь очистить некоторый контент с помощью simple_html_dom.

Я пытаюсь получить заголовок, путь к изображению и ссылку и отобразить его.

Структура HTML:

<div class="article_item clearfix">
<h2 class="title"><a href="http://www.demodomain/articleid=1">My amazing Title</a></h2>
<p class="date">September 22 2014</p>
<p class="image_left">
<a href="http://www.demodomain/articleid=1">
<img src="http://www.demodomain/photos/cef78533cd5.jpg" alt="My amazing post ">
</a>
</p>
<p>This is a demo description<strong>of this amazing</strong> article</p>
<p class="more"><a href="http://www.demodomain/articleid=1" class="blued_links">Read more...</a></p>
</div>

Мой код до сих пор:

foreach($html->find('article_item') as $article) {
    $item['title']   = $article->find('.title, a', 0)->plaintext;
    $item['thumb']  = $article->find('.image_left img', 0)->src;
    $item['details'] = $article->find('p', 0)->plaintext;
    $item['url'] = $article->find('.more, a', 0)->plaintext;
       


echo 'Title: ' . $item['title'];
echo "</br>";
echo "image url: " . $item['thumb'];
echo "</br>";
echo "Description: " . $item['details'];
echo "</br>";
echo "Read More Url: " . $item['url'];
}



// Clear dom object
$html->clear(); 
unset($html); 

person Irene T.    schedule 26.09.2014    source источник
comment
Так что не работает? Какие ошибки вы получаете?   -  person Steve    schedule 26.09.2014
comment
Это даже не вопрос.   -  person pguardiario    schedule 27.09.2014


Ответы (2)


Вы не указали, что не работает, но рассмотрим этот пример:

foreach($html->find('div.article_item') as $div) {
                 //  ^ point to div tag with class name article_item
    $title = $div->find('h2.title a ', 0)->innertext;
                     // ^ target the h2 tag with class title with child anchor
                     // just same as accessing dom with jquery
    $thumb = $div->find('p.image_left img ', 0)->src;
    $details = $div->children(3)->plaintext;
    // $url = $div->find('p.more', 0)->plaintext;
    $url = $div->find('p.more a', 0)->href;

    echo $title . '<br/>';
    echo $thumb . '<br/>';
    echo $details . '<br/>';
    echo $url . '<br/>';
}

По сути, это то же самое, что и выбор селекторов.

person Kevin    schedule 26.09.2014
comment
Великий Мистер Призрак... Большое спасибо!!! Из $url мне нужно взять ссылку a href. Пожалуйста, как это возможно? - person Irene T.; 26.09.2014
comment
@ИрэнТ. переделал, попробуй еще раз - person Kevin; 26.09.2014
comment
@ИрэнТ. конечно нет проблем рад, что это помогло - person Kevin; 26.09.2014

можешь попробовать вот так

$item['title']   = $article->find('h2.title')->plaintext;
$item['thumb']  = $article->find('p.image_left')->find('img')->src;
person Satya    schedule 26.09.2014