看板 [ Perl ]
討論串[問題] 抓回來的網頁去除html標籤後出現部份亂碼
共 3 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者tumc (HIHIHI)時間16年前 (2009/07/30 10:16), 編輯資訊
0
0
0
內容預覽:
jjt大大您好,. 我用你這招使用在TreeBuilder,解掉了中文亂碼問題. 但發現一點有點奇怪. $ascii=encode('big5',$ascii)不是應該己經編碼成big5了嗎. 為什麼我把$ascii存入文件內,然後在windows內開啟,看起來的中文編碼像是unicode,照理不是

推噓1(1推 0噓 0→)留言1則,0人參與, 最新作者jjt (jet)時間17年前 (2007/12/19 00:59), 編輯資訊
0
0
1
內容預覽:
好久沒有回問題了 回一下XD. 2個同義詞 hex= 32 ad d3 a6 50 b8 71 b5 fc. 2茼P義詞 hex= 32 d3 a6 50 b8 71 b5 fc. ad在處理中被吃掉了 hex ad = '-'. 雖然不知道為什麼會這樣. 還有有方法可以解決. 1.在最前面加上.
(還有202個字)

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者redmist (....N )時間17年前 (2007/12/18 13:13), 編輯資訊
0
0
1
內容預覽:
寫了一支程式到網路上抓資料,用HTML::FormatText模組去除html標籤後會出現部份. 亂碼(不是全部,甚至只有一小部份),是什麼原因呢?. code如下. use LWP::UserAgent;. use HTML::Parse;. use HTML::FormatText;. my $
(還有455個字)
首頁
上一頁
1
下一頁
尾頁