Re: [問題] 請問抓網頁並去除html tag後 出現亂碼?

看板Perl作者 (蜥蜴)時間17年前 (2007/10/26 08:37), 編輯推噓2(201)
留言3則, 1人參與, 最新討論串5/5 (看更多)
※ 引述《senhuo (努力吧)》之銘言: : 請問還有更快的方式嗎? : 這樣是先做判斷 如果是uft再做decode : 不是的話就直接print出來 : 不知道有沒有更好、更快的作法~ 更快更好應該是沒有,畢竟都要用猜的,我覺得這樣寫比較簡潔 管他是utf-8還是big5,統統decode再encode一次 use WWW::Mechanize; use Encode; use Encode::Guess; my $http= "http://blog.roodo.com/judie35/archives/270979.html"; my $mech = WWW::Mechanize->new(); $mech->get($http); my $enc = guess_encoding($mech->content(), qw/big5-eten utf8/); my $html = encode ("big5-eten",decode($enc->name, $mech->content())); print $html; -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 60.250.75.176 ※ 編輯: imce 來自: 60.250.75.176 (10/26 08:38)

10/26 10:46, , 1F
這個方法讚~謝啦i大
10/26 10:46, 1F

10/26 11:58, , 2F
可是剛才跑似乎不行耶...
10/26 11:58, 2F

10/26 11:58, , 3F
@@
10/26 11:58, 3F
文章代碼(AID): #178JRD6V (Perl)
文章代碼(AID): #178JRD6V (Perl)