Re: [請益] curl抓回來的亂碼問題
※ 引述《crossdunk (魯來又魯去)》之銘言:
: 是這樣的
: 小弟最近在學curl,現在有個問題是
: 抓回來的東西出現確是亂碼
: 我試過用別的編碼方式,卻都還是亂碼
: 大概是像下面這樣
: <a href="" rel="nofollow">http://www.8591.com.tw/user-login.html">å·2 è2 ·åˆ°ç?</a>
: <a href="" rel="nofollow">http://www.8591.com.tw/user-login.html">å·2 è3 £出ç</a>
: <a href="" rel="nofollow">http://www.8591.com.tw/user-login.html">é2 è3 £å鄊: 我是以8591網站來做測試的
: 請問要如何知道他的編碼是什麼來做轉換呢?
: 我看他的表頭是用UTF-8
: 我顯示的方式也用UTF-8,卻還是亂碼
: 請各位先進給小弟一點指導
: 謝謝!
<?php
function utf8tobig5($str){
return mb_convert_encoding($str, 'BIG5', 'UTF-8');
}
$data =
file_get_contents("http://www.8591.com.tw/wareList-sellList-22.html?searchServer=2031&searchType");
$data = utf8tobig5($data);
file_put_contents("a.txt",$data);
?>
產出來的a.txt在windows裡用記事本看似乎ok~
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.134.48.253
※ 文章網址: http://www.ptt.cc/bbs/PHP/M.1416279998.A.BE1.html
推
11/18 11:29, , 1F
11/18 11:29, 1F
→
11/18 11:29, , 2F
11/18 11:29, 2F
推
11/18 11:37, , 3F
11/18 11:37, 3F
→
11/18 11:37, , 4F
11/18 11:37, 4F
推
11/20 20:36, , 5F
11/20 20:36, 5F
→
11/20 20:37, , 6F
11/20 20:37, 6F
→
11/20 20:37, , 7F
11/20 20:37, 7F
討論串 (同標題文章)
完整討論串 (本文為第 2 之 2 篇):
8
15
PHP 近期熱門文章
PTT數位生活區 即時熱門文章