Я просматриваю газетные статьи и пытаюсь понять, как исключить более одного узла. В справке R сказано, что :not()
принимает последовательность простых селекторов. Я попробовал следующее
zeit_url <- read.html("http://www.zeit.de/wissen/gesundheit/2017-09/aids-hiv-neuinfektionen-europa-virus-gesundheit)
article <- zeit_url %>%
html_nodes('.article-page>:not(.ad-container, .cardstack)') %>%
html_text()
Не получается разделить два узла запятой. Любые предложения, как правильно указать последовательность селекторов в :not()
?
Я потратил много времени на поиск ответа, но я новичок в R (и HTML), поэтому я ценю ваше терпение, если это что-то очевидное.
article-age
, поэтому неясно, что вы пытаетесь получить. - person alistaire   schedule 13.11.2017