[問題] 有關抓取網頁的問題

看板Perl作者 (K.E.N)時間17年前 (2008/05/23 00:58), 編輯推噓2(200)
留言2則, 1人參與, 最新討論串1/1
請問一下 我是perl的新手~ 爬了一下版 用了WWW:Mechanize來抓取yahoo的網頁 抓yahoo!首頁可以成功~ 不過用 http://tw.search.yahoo.com/search?p=網頁 抓搜尋 "網頁" 的結果卻無法抓到中文 英文可以正常顯示~~ 我也試過 print encode ("big5-eten",decode('utf-8', $mech->content)); 但就是無法抓到中文=="中文的部份都被去掉~ 是空白的 不是亂碼... 搞了一個晚上了...有請高手指點一下 感謝 發現用Fx開yahoo search時是utf-8編碼 換成我的程式就變成ISO-8859-1 這是什麼原因呢~~==" -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 122.116.133.54 ※ 編輯: kf013099 來自: 122.116.133.54 (05/23 02:06)

05/25 14:07, , 1F
瀏覽器本身會把支援的語系發出去 雅虎的server會去判斷
05/25 14:07, 1F

05/25 14:07, , 2F
請參照RFC有關http protocol的規範^^
05/25 14:07, 2F
文章代碼(AID): #18DQPDLP (Perl)
文章代碼(AID): #18DQPDLP (Perl)