Re: [問題] 抓回來的網頁去除html標籤後出現部份亂碼

看板Perl作者 (HIHIHI)時間16年前 (2009/07/30 10:16), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串3/3 (看更多)
: 好久沒有回問題了 回一下XD : 2個同義詞 hex= 32 ad d3 a6 50 b8 71 b5 fc : 2茼P義詞 hex= 32 d3 a6 50 b8 71 b5 fc : ad在處理中被吃掉了 hex ad = '-' : 雖然不知道為什麼會這樣 : 還有有方法可以解決 : 1.在最前面加上 : use Encode; : 2.修改內文 : if ($response->is_success) { : my $res = decode('big5',$response->content); : $ascii = HTML::FormatText->new->format(parse_html($res)); : $ascii = encode('big5',$ascii); : print $ascii; : } : 只要是中文問題 用這招通常都有效:P jjt大大您好, 我用你這招使用在TreeBuilder,解掉了中文亂碼問題 但發現一點有點奇怪 $ascii=encode('big5',$ascii)不是應該己經編碼成big5了嗎 為什麼我把$ascii存入文件內,然後在windows內開啟,看起來的中文編碼像是unicode,照理不是應該是big5才對嗎 可以幫我解答嗎,謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 59.124.185.18
文章代碼(AID): #1ASG9-YT (Perl)
文章代碼(AID): #1ASG9-YT (Perl)