Как разобрать XML с помощью Mechanize и XMLSimple в ruby?

Я пытаюсь получить удаленный XML-файл с помощью Mechanize, чтобы получить информацию о статусе icecast. Но у меня проблемы с передачей файла XML из формата Mechanize::File в строку или какой-либо формат XML, который XMLSimple может работать с.

XML-документ выглядит так:

<icestats>
  <admin>[email protected]</admin>
  <!-- ... -->
</icestats>

Мой код сейчас выглядит так:

require 'mechanize'
require 'xmlsimple'

server = 'example.net'
port = 8000
user = 'stackoverflow'
password = 'hackme'
agent = Mechanize.new
agent.user_agent_alias = 'Linux Firefox'
agent.add_auth("http://#{server}:#{port}/admin/status.xml", user, password)
agent.get("http://#{server}:#{port}/admin/status.xml")
xml = agent.current_page
status = XmlSimple.xml_in(xml)
puts status['admin']

Это должно вывести: [email protected]

Но выдает:

/home/user/.gem/ruby/1.9.1/gems/xml-simple-1.1.2/lib/xmlsimple.rb:191:in 'xml_in': Could not parse object of type: <Mechanize::File>. (ArgumentError)

Теперь я понимаю, что XMLSimple нужна строка, и поэтому я попытался преобразовать формат Mechanize::File в строку, заменив предпоследнюю строку на:

status = XmlSimple.xml_in(xml.to_s)

Но это вызывает еще более странное исключение:

/usr/lib64/ruby/1.9.1/rexml/parsers/baseparser.rb:406:in `block in pull_event': Undefined prefix Mechanize: found (REXML::UndefinedNamespaceException)
  from /usr/lib64/ruby/1.9.1/set.rb:222:in `block in each'
  from /usr/lib64/ruby/1.9.1/set.rb:222:in `each_key'
  from /usr/lib64/ruby/1.9.1/set.rb:222:in `each'
  from /usr/lib64/ruby/1.9.1/rexml/parsers/baseparser.rb:404:in `pull_event'
  from /usr/lib64/ruby/1.9.1/rexml/parsers/baseparser.rb:183:in `pull'
  from /usr/lib64/ruby/1.9.1/rexml/parsers/treeparser.rb:22:in `parse'
  from /usr/lib64/ruby/1.9.1/rexml/document.rb:231:in `build'
  from /usr/lib64/ruby/1.9.1/rexml/document.rb:43:in `initialize'
  from /home/user/.gem/ruby/1.9.1/gems/xml-simple-1.1.2/lib/xmlsimple.rb:965:in `new'
  from /home/user/.gem/ruby/1.9.1/gems/xml-simple-1.1.2/lib/xmlsimple.rb:965:in `parse'
  from /home/user/.gem/ruby/1.9.1/gems/xml-simple-1.1.2/lib/xmlsimple.rb:164:in `xml_in'
  from /home/user/.gem/ruby/1.9.1/gems/xml-simple-1.1.2/lib/xmlsimple.rb:203:in `xml_in'
  from debugging.rb:16:in `<main>'

Что не так с моим подходом? Когда я загружаю файл XML и использую локальный файл XML, приведенный выше код работает по желанию.

Я особенно ищу решения с Mechanize, а не с Nokogiri.


person Afr    schedule 27.02.2013    source источник


Ответы (1)


Попробуйте изменить:

xml = agent.current_page

to:

xml = agent.current_page.body
person pguardiario    schedule 28.02.2013