PTT數位生活區 / Perl

Re: [問題] 請問抓網頁並去除html tag後出現亂碼？

看板Perl作者senhuo (努力吧)時間18年前 (2007/10/26 00:46)推噓1(1推 0噓 1→)

留言2則, 1人參與討論串4/5 (看更多)

各位高手小弟目前是這以下方法來解決目前編碼未知的情形以下程式碼 use Encode; use Encode::Guess; #第一個網址是utf編碼格式 #$webhttp = "http://blog.roodo.com/judie35/archives/270979.html"; #第二個網址是big-5 (也就是不需要decode) $webhttp = "http://news.pchome.com.tw/entertainment/udn/20071025/index-20071025151243038787.html"; $mech = WWW::Mechanize->new(); $mech->get($webhttp); $html=$mech->content(); $enc = guess_encoding($html, qw/big5-eten utf8/); #print $enc->name; if ($enc->name eq "utf8") {$html2 = decode($enc->name,$html);} else {print $html;} print $html2; ------------------------------------------------------------------------------ 請問還有更快的方式嗎？這樣是先做判斷如果是uft再做decode 不是的話就直接print出來不知道有沒有更好、更快的作法~ 謝謝各位~ ※ 引述《LiloHuang (相見不如懷念)》之銘言： : 解決不曉得原本是啥編碼但是想要轉成UTF8 : 可以使用Encode::Guess : use Encode::Guess; : my $enc = guess_encoding("中文", qw/big5-eten utf8/); : print $enc->name; : 詳細內容請參考 : http://search.cpan.org/~dankogai/Encode-2.23/lib/Encode/Guess.pm -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 163.25.10.182

推

10/26 01:39, , 1^F

10/26 01:39, 1^F

→

10/26 01:40, , 2^F

10/26 01:40, 2^F

‣ 返回看板[ Perl ] 程設

‣ 更多 senhuo 的文章

文章代碼(AID): #178CXsHR (Perl)

討論串 (同標題文章)

以下文章回應了本文：

2

3

Re: [問題] 請問抓網頁並去除html tag後出現亂碼？

18年前, 10/26

完整討論串 (本文為第 4 之 5 篇)：

排序：最新先 | 最舊先 | 留言數

2

3

Re: [問題] 請問抓網頁並去除html tag後出現亂碼？

18年前, 10/26

1

2

Re: [問題] 請問抓網頁並去除html tag後出現亂碼？

18年前, 10/26

1

1

Re: [問題] 請問抓網頁並去除html tag後出現亂碼？

18年前, 10/25

2

4

Re: [問題] 請問抓網頁並去除html tag後出現亂碼？

18年前, 10/25

[問題] 請問抓網頁並去除html tag後出現亂碼？

18年前, 10/25

在新視窗開啟完整討論串 (共5篇)

Perl 近期熱門文章

1

7

Re: [問題] sleep與-e搭配應用

1年前, 06/19

2

15

[問題] 如何改善大文件的讀寫效能

2年前, 07/12

1

2

Re: [問題] 參照變數宣告及記憶體位置問題

3年前, 02/13

1

2

[問題] 參照變數宣告及記憶體位置問題

3年前, 02/07

3

5

Learing Perl 第八版中文版出版了

4年前, 06/22

2

4

[請益] 請教terminal 餵正規表示法給perl問題

5年前, 04/10

1

9

[問題] 是不是要放棄perl了

5年前, 03/02

1

1

[問題] 請問如何建立新的Row？(代po)

5年前, 11/23

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

9

61

Re: [心得] 華碩螢幕3修修不好，消保調解還出爾反爾

[ PC_Shopping ]

3小時前, 07/14

14

113

[問題] 台灣大(原台灣之星)日本收不到簡訊?

5小時前, 07/14

4

9

[開箱] 迷你小巧功能強大 ASUS 商用級 PN54-S1

[ PC_Shopping ]

6小時前, 07/14

7

14

[心得] 關於iOS26的耗電

6小時前, 07/14

6

37

[問題] 蘋果電池健康度的問題

8小時前, 07/14

5

17

Re: [新聞] 知名智能手機品牌一加即將撤出美國及歐洲

9小時前, 07/14

0

28

Re: [新聞] 知名智能手機品牌一加即將撤出美國及歐洲

10小時前, 07/14

20

90

[請益] 三頻WIFI 7推薦

[ PC_Shopping ]

11小時前, 07/14

更多即時熱門文章 >>

‣ 返回看板[ Perl ] 程設

‣ 更多 senhuo 的文章

文章代碼(AID): #178CXsHR (Perl)