Re: [問題] 請問抓網頁並去除html tag後 出現亂碼?
※ 引述《senhuo (努力吧)》之銘言:
: 請問各位高手們
: 我將某一網頁抓下來
: 並用regular去除 html tag
: 但顯示的結果竟然變成亂碼,但有些網頁沒出現亂碼,有些則有...@@
: (還是去除tag前要加什麼?)
: 請問有人知道解決方案嗎
: 感謝~~
: 程式碼----------------------------------------------------------
Unicode網頁,請編碼成big5才能順利顯示
use WWW::Mechanize;
use Encode;
my $mech = WWW::Mechanize->new();
my $http="http://blog.roodo.com/judie35/archives/270979.html";
$mech->get($http);
my $html=$mech->content();
$html= encode ("big5-eten",decode('utf-8', $html));
foreach ($html){
s/<[^>]*>//g;}
print $html;
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 60.250.75.176
推
10/25 11:15, , 1F
10/25 11:15, 1F
推
10/25 16:51, , 2F
10/25 16:51, 2F
→
10/25 16:51, , 3F
10/25 16:51, 3F
→
10/25 16:51, , 4F
10/25 16:51, 4F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 5 篇):
Perl 近期熱門文章
PTT數位生活區 即時熱門文章