как извлечь определенный контент с веб-страницы с помощью jsoup

Мне нужно извлечь ТОЛЬКО эти публикации с веб-страницы http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html, где первым автором является Рахул Рао.

Я пробовал следующий код, но он не дает мне никакого результата.

for( Element element : doc.select("table span.this-person.title") ){
System.out.println(element.text());
}

Что мне нужно, чтобы получить предпочтительный результат? Заранее спасибо.


person user1320030    schedule 01.03.2013    source источник
comment
Пожалуйста, ребята, помогите мне с этим. Я застрял здесь....   -  person user1320030    schedule 02.03.2013


Ответы (2)


Приведенный ниже код даст вам ожидаемый результат. Посмотрите, поможет ли он вам !!

Document doc = Jsoup.connect("http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html").get(); Элементы span = doc.select(("div[class=data]"));

    //System.out.println(span.tagName("span"));
    for (Element src : span) {

        for(int i=0;i<src.childNodeSize();i++){
            if(src.childNodes().get(0).toString().contains("Rahul Rao")){
                if(src.childNodes().get(i).toString().contains("<span class=\"title\">")){
                    System.out.println(src.childNodes().get(i));
                }

            }
person Satyendra    schedule 02.03.2013

Я попытался извлечь публикации, размещенные на странице, и добился определенного успеха.

Код выглядит следующим образом:

Document doc = Jsoup.connect("http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html").get();
    Elements span = doc.select("span");
    for (Element src : span) {
        if (src.tagName().equals("span")){
            System.out.println();
            System.out.print( src.ownText() );
        }
    }

Пожалуйста, посмотрите, если это поможет!

person Satyendra    schedule 02.03.2013
comment
Но он дает мне все публикации Рахула Рао.. Мне нужны только те публикации, где Рахул Рао является первым автором. - person user1320030; 02.03.2013
comment
Можете ли вы сказать мне, каким должен быть ваш ожидаемый результат или в каких публикациях Рахул Рао является первым автором. - person Satyendra; 02.03.2013