[問題] net/http 的 bug?
我正在爬取一些資料
執行了下面程式碼之後
rsp.code 為301 redirect
照理說Location的欄位應該是 (我使用fiddler觀察的)
http://www.amazon.com/Ravelli-ATD-Professional-Tripod-Camera/dp/B000YB862E/ref=redir_mobile_desktop?ie=UTF8&keywords=Camera%2C%20Photo%20%26%20Video&pi=AC_SX110_SY165_QL70&qid=1429517964&ref_=mp_s_a_1_1&sr=8-1
但我取出來之後還是原本的
http://www.amazon.com/gp/aw/d/B000YB862E/ref=mp_s_a_1_1?qid=1429517964&sr=8-1&pi=AC_SX110_SY165_QL70&keywords=Camera%2C+Photo+%26+Video
這樣我沒辦法進行redirect的動作 冏rz
是我弄錯了嗎
還是真的有bug
是否有人遇到相同問題?
程式碼如下
uri =
'http://www.amazon.com/gp/aw/d/B000YB862E/ref=mp_s_a_1_1?qid=1429517964&sr=8-1&pi=AC_SX110_SY165_QL70&keywords=Camera%2C+Photo+%26+Video'
req = Net::HTTP::Get.new(URI(uri))
rsp = Net::HTTP.start(uri.hostname, uri.port) {|http| http.request(req) }
puts rsp.code
puts rsp.header['Location']
puts rsp.header.to_hash.to_json
以下是我使用的版本
$ ruby --version
ruby 2.1.2p95 (2014-05-08 revision 45877) [x86_64-linux]
$ gem list | grep http
em-http-request (1.1.2)
http_parser.rb (0.6.0)
httpclient (2.6.0.1)
httpi (2.4.0)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.136.6.171
※ 文章網址: https://www.ptt.cc/bbs/Ruby/M.1429597313.A.29B.html
→
04/21 17:49, , 1F
04/21 17:49, 1F
→
04/21 17:50, , 2F
04/21 17:50, 2F
Ruby 近期熱門文章
PTT數位生活區 即時熱門文章