Re: [問題]抓取 utf8網頁

看板Perl作者 (HIHIHI)時間17年前 (2007/11/28 20:00), 編輯推噓2(201)
留言3則, 2人參與, 最新討論串3/3 (看更多)
※ 引述《LiloHuang (相見不如懷念)》之銘言: : ※ 引述《tumc (HIHIHI)》之銘言: : : 請問一下, : : 如何才能把抓下來的utf8網頁, : : 轉變成big5的格式, : : 直接用utf8存成文字檔都是亂碼 : #!/usr/bin/perl : use Encode qw/encode decode/; : use LWP::Simple; : my $html = get 'http://www.kkbox.com.tw/'; : print encode("Big5", decode("utf-8", $html)); 我用下面這段抓下來也是亂碼,是用 activestate版本的perl 5.8.8 以前記得用相同電腦,用不同版本的perl,不會有這問題 但重安裝xp後,重灌perl 5.8.8就不行 誰能解答為什麼會這樣 use Encode qw/encode decode/; use LWP::Simple; open(CK, ">check.txt"); my $html = get 'http://www.kkbox.com.tw/'; print CK encode("Big5", decode("utf-8", $html)); close (CK); -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 122.124.14.99

11/28 20:04, , 1F
非常正常...也沒有亂碼@@
11/28 20:04, 1F

11/29 08:59, , 2F
我覺得拉,亂碼會不會是因為charset=utf-8這行造成的
11/29 08:59, 2F

11/29 09:00, , 3F
如果把存下來的txt改htm打開後,就會變亂碼
11/29 09:00, 3F
文章代碼(AID): #17JLXcPD (Perl)
討論串 (同標題文章)
文章代碼(AID): #17JLXcPD (Perl)