Re: [問題] 請教 Big5 和 UTF-8 的編碼差異...
這網路上有非常多資料:P
簡單來說(以下全部是經驗談)
Big5 有幾個特色
1. 每個中文字使用 2 bytes
2. 因為制定者腦殘,用到了控制碼
所以許多程式與軟體都會有許、蓋、功這類中文字的沖碼問題
3. 延伸字集中,有簡體字但是沒有定義日文字
UTF-8 則有以下特色
1. 採用變動大小,中文字使用 3 bytes,英文則維持 1 byte
因此若轉碼後,資料庫整體會變成 1.5 倍大,200MB(Big5) -> 300MB(UTF-8)
2. 支援所有語言文字,還有一些怪怪圖形:P
3. 簡體與正體中文重複字只定義一次,例如說,簡體的"山",跟正體的"山"
是同一個 UTF-8 編碼
至於怎麼轉碼呢....
php 只要使用 iconv 函數即可
安裝方式 http://www.twvbb.com/vbb/showthread.php?t=299
使用方式 http://tw.php.net/iconv
※ 引述《punpun (小金 )》之銘言:
: 請問有大大可以分享一下
: 有關 Big5 和 UTF-8 編碼文字互相轉換的流程
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.249.201
→
03/29 13:05, , 1F
03/29 13:05, 1F
→
03/29 13:27, , 2F
03/29 13:27, 2F
推
03/29 14:04, , 3F
03/29 14:04, 3F
推
03/29 19:37, , 4F
03/29 19:37, 4F
推
03/29 20:53, , 5F
03/29 20:53, 5F
推
03/29 23:56, , 6F
03/29 23:56, 6F
推
03/30 14:41, , 7F
03/30 14:41, 7F
→
03/30 14:41, , 8F
03/30 14:41, 8F
推
03/30 16:05, , 9F
03/30 16:05, 9F
→
03/30 16:07, , 10F
03/30 16:07, 10F
推
03/30 19:34, , 11F
03/30 19:34, 11F
→
03/30 19:36, , 12F
03/30 19:36, 12F
→
03/30 19:36, , 13F
03/30 19:36, 13F
推
03/30 19:53, , 14F
03/30 19:53, 14F
推
12/26 01:53, , 15F
12/26 01:53, 15F
討論串 (同標題文章)
Web_Design 近期熱門文章
PTT數位生活區 即時熱門文章