2008-01-26

用scrubyt抓取酷讯最新火车票信息

关键字: scrubyt screen-scaping
用scrubyt写的一个简单的小例子,scrubyt看起来真的很不错,不过现在bug也非常的多,特别是对xpath的支持。

require 'rubygems'
require 'scrubyt'

Scrubyt.logger = Scrubyt::Logger.new  
kooxoo_data = Scrubyt::Extractor.define do
  fetch "http://piao.kooxoo.com/"
  fill_textfield 'vFrom', '北京'
  fill_textfield 'to', '广州'
  submit
  record"//tbody/tr" do
     col1 "/td[@class='col1']" do
         url "href", :type => :attribute
     end
     col2 "/td[@class='col2']"
     col3 "/td[@class='col3']"
     col4 "/td[@class='col6']"
     col5 "/td[@class='col7']"
  end
end 
kooxoo_data.to_xml.write(open('result.xml', 'w'))

评论
发表评论

您还没有登录,请登录后发表评论

pickerel
搜索本博客
最近加入圈子
存档
最新评论