Я извлекаю данные с форума. Мой сценарий на основе работает нормально. Теперь мне нужно извлечь дату и время (21 декабря 2009 г., 20:39) из одного сообщения. Я не могу заставить его работать. Я использовал FireXPath для определения xpath.
Образец кода:
require 'rubygems'
require 'mechanize'
post_agent = WWW::Mechanize.new
post_page = post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')
puts post_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div[2]/text()').to_s.strip
puts post_page.parser.at_xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div[2]/text()').to_s.strip
puts post_page.parser.xpath('//[@id="post1960370"]/tbody/tr[1]/td/div[2]/text()')
все мои попытки заканчиваются пустой строкой или ошибкой.
Я не могу найти никакой документации по использованию Nokogiri в Mechanize. В документации Mechanize внизу страницы говорится:
После того, как вы использовали Mechanize для перехода на страницу, которую нужно очистить, затем очистите ее с помощью методов Nokogiri.
Но какими методами? Где я могу прочитать о них с примерами и объяснением синтаксиса? Я также ничего не нашел на сайте Нокогири.