Re: [問題] 抓回來的網頁去除html標籤後出現部份亂碼
: 好久沒有回問題了 回一下XD
: 2個同義詞 hex= 32 ad d3 a6 50 b8 71 b5 fc
: 2茼P義詞 hex= 32 d3 a6 50 b8 71 b5 fc
: ad在處理中被吃掉了 hex ad = '-'
: 雖然不知道為什麼會這樣
: 還有有方法可以解決
: 1.在最前面加上
: use Encode;
: 2.修改內文
: if ($response->is_success) {
: my $res = decode('big5',$response->content);
: $ascii = HTML::FormatText->new->format(parse_html($res));
: $ascii = encode('big5',$ascii);
: print $ascii;
: }
: 只要是中文問題 用這招通常都有效:P
jjt大大您好,
我用你這招使用在TreeBuilder,解掉了中文亂碼問題
但發現一點有點奇怪
$ascii=encode('big5',$ascii)不是應該己經編碼成big5了嗎
為什麼我把$ascii存入文件內,然後在windows內開啟,看起來的中文編碼像是unicode,照理不是應該是big5才對嗎
可以幫我解答嗎,謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 59.124.185.18
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 3 之 3 篇):
Perl 近期熱門文章
PTT數位生活區 即時熱門文章