討論串(共3篇) - [問題] 抓回來的網頁去除html標籤後出現部份亂碼 - 看板Perl

看板 [ Perl ]

討論串[問題] 抓回來的網頁去除html標籤後出現部份亂碼

共 3 篇文章

排序：最新先 | 最舊先 | 留言數 | 推文總分

內容預覽：開啟 | 關閉 | 只限未讀

首頁

尾頁

Re: [問題] 抓回來的網頁去除html標籤後出現部份亂碼

推噓0(0推 )留言0則，0人參與作者tumc (HIHIHI)時間17年前 (2009/07/30 10:16)資訊

內容預覽:

jjt大大您好,. 我用你這招使用在TreeBuilder,解掉了中文亂碼問題. 但發現一點有點奇怪. $ascii=encode('big5',$ascii)不是應該己經編碼成big5了嗎. 為什麼我把$ascii存入文件內,然後在windows內開啟,看起來的中文編碼像是unicode,照理不是

Re: [問題] 抓回來的網頁去除html標籤後出現部份亂碼

推噓1(1推 )留言1則，0人參與作者jjt (jet)時間18年前 (2007/12/19 00:59)資訊

內容預覽:

好久沒有回問題了回一下XD. 2個同義詞 hex= 32 ad d3 a6 50 b8 71 b5 fc. 2茼P義詞 hex= 32 d3 a6 50 b8 71 b5 fc. ad在處理中被吃掉了 hex ad = '-'. 雖然不知道為什麼會這樣. 還有有方法可以解決. 1.在最前面加上.

(還有202個字)

[問題] 抓回來的網頁去除html標籤後出現部份亂碼

推噓0(0推 )留言0則，0人參與作者redmist (....N )時間18年前 (2007/12/18 13:13)資訊

內容預覽:

寫了一支程式到網路上抓資料，用HTML::FormatText模組去除html標籤後會出現部份. 亂碼(不是全部，甚至只有一小部份)，是什麼原因呢？. code如下. use LWP::UserAgent;. use HTML::Parse;. use HTML::FormatText;. my $

(還有455個字)

首頁

尾頁