Изберете връзка вътре в етикета div

Бих искал да получа връзка (URL, за да бъде конкретен) вътре в клас div. Това е кодът, който имам, който ми дава текста вътре в клас div (Някакъв текст...).

foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//div[@class='content']"))
{
    //saves text (node.InnerText) in array          
}

Това е HTML от сайта. Бих искал да получа www.google.com

<div class="content">
    <p>Some text... 
    <a href="/bgwww.google.com">LINK</a> 
    </p>
</div>

person fanboy555    schedule 31.12.2012    source източник
comment
Можете да намерите отговора си на връзката по-долу: stackoverflow.com/questions/12087367/   -  person user1939593    schedule 31.12.2012
comment
@user1939593 Regex за това не е добро решение.   -  person Rudi Visser    schedule 31.12.2012


Отговори (2)


Този код не е валиден въз основа на вашето писане, но имате 2 опции:

  1. След като имате възела за div, използвайте .GetElementsByTagName("a") или децата, за да изтеглите връзката, след което вземете нейния атрибут href.

  2. Променете своя SelectNodes() XPath, за да получите вместо него маркера a: //div[@class='novica']/p/a.

Първото очевидно е по-добро, ако не имате нужда от .InnerText на този елемент, за да получите Some text..., но второто би било по-бързо.

person Rudi Visser    schedule 31.12.2012

person    schedule
comment
заявката за xpath е //div[@class='novica']/p/a[@href='/bgwww.google.com'] - person Paul Sullivan; 31.12.2012