Я не нашел ни документации, ни учебника по этому поводу. Что-нибудь подобное существует?
doc.xpath('//table/tbody[@id="threadbits_forum_251"]/tr')
Приведенный выше код даст мне любой table
в любом месте, у которого есть tbody
дочерний элемент с атрибутом id
, равным threadbits_forum_251. Но почему он начинается с двойного //
? Почему в конце стоит /tr
? Дополнительные сведения см. В разделе «Ruby Nokogiri Parsing HTML table II».
Кто-нибудь может сказать мне, как извлечь href
, id
, alt
, src
и т. Д. С помощью Nokogiri?
td[3]/div[1]/a/text()' <--- extracts text
Как я могу извлечь другие вещи?