Re: [問題] 請問抓網頁並去除html tag後 出現亂碼?
※ 引述《senhuo (努力吧)》之銘言:
: 請問還有更快的方式嗎?
: 這樣是先做判斷 如果是uft再做decode
: 不是的話就直接print出來
: 不知道有沒有更好、更快的作法~
更快更好應該是沒有,畢竟都要用猜的,我覺得這樣寫比較簡潔
管他是utf-8還是big5,統統decode再encode一次
use WWW::Mechanize;
use Encode;
use Encode::Guess;
my $http= "http://blog.roodo.com/judie35/archives/270979.html";
my $mech = WWW::Mechanize->new();
$mech->get($http);
my $enc = guess_encoding($mech->content(), qw/big5-eten utf8/);
my $html = encode ("big5-eten",decode($enc->name, $mech->content()));
print $html;
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 60.250.75.176
※ 編輯: imce 來自: 60.250.75.176 (10/26 08:38)
推
10/26 10:46, , 1F
10/26 10:46, 1F
推
10/26 11:58, , 2F
10/26 11:58, 2F
→
10/26 11:58, , 3F
10/26 11:58, 3F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 5 之 5 篇):
Perl 近期熱門文章
PTT數位生活區 即時熱門文章