[問題] 擷取網頁面

看板Perl作者 (茶)時間13年前 (2012/02/10 22:37), 編輯推噓0(003)
留言3則, 1人參與, 最新討論串1/1
請問一下 我是perl的新手~ 爬了一下版 用了WWW:Mechanize來抓取yahoo的網頁 抓yahoo!首頁可以成功~ 不過用 http://tw.search.yahoo.com/search?p=網頁 抓搜尋 "網頁" 的結果卻無法抓到中文 英文可以正常顯示~~ 我也試過 print encode ("big5-eten",decode('utf-8', $mech->content)); 但就是無法抓到中文=="中文的部份都被去掉~ 是空白的 不是亂碼... 搞了一個晚上了...有請高手指點一下 感謝 發現用Fx開yahoo search時是utf-8編碼 換成我的程式就變成ISO-8859-1 這是什麼原因呢~~==" -- -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.37.49.98

02/11 09:48, , 1F
print encode("big5",$m->content);或把終端機編碼改成utf8
02/11 09:48, 1F

02/11 09:49, , 2F
你的程式丟上去query的東西也要是utf8,另外user-agent可
02/11 09:49, 2F

02/11 09:49, , 3F
能也需要設定就是了
02/11 09:49, 3F
文章代碼(AID): #1FDIkgUa (Perl)
文章代碼(AID): #1FDIkgUa (Perl)