Re: [問題] 請教 Big5 和 UTF-8 的編碼差異...

看板Web_Design作者 (深藍站長)時間19年前 (2006/03/30 21:27), 編輯推噓2(200)
留言2則, 2人參與, 最新討論串3/3 (看更多)
http://www.twvbb.com/vbb/showthread.php?t=572 剛剛有網友提到,如果是 UTF-8 編碼下的簡體恐無法轉成 Big5... 不過還是有個辦法 我寫的這隻 function 可以支援 UTF-8 正體簡體轉換 只要將簡體轉成正體後,再 incov 即可:) ※ 引述《ckmarkhsu (深藍站長)》之銘言: : 這網路上有非常多資料:P : 簡單來說(以下全部是經驗談) : Big5 有幾個特色 : 1. 每個中文字使用 2 bytes : 2. 因為制定者腦殘,用到了控制碼 : 所以許多程式與軟體都會有許、蓋、功這類中文字的沖碼問題 : 3. 延伸字集中,有簡體字但是沒有定義日文字 : UTF-8 則有以下特色 : 1. 採用變動大小,中文字使用 3 bytes,英文則維持 1 byte : 因此若轉碼後,資料庫整體會變成 1.5 倍大,200MB(Big5) -> 300MB(UTF-8) : 2. 支援所有語言文字,還有一些怪怪圖形:P : 3. 簡體與正體中文重複字只定義一次,例如說,簡體的"山",跟正體的"山" : 是同一個 UTF-8 編碼 : 至於怎麼轉碼呢.... : php 只要使用 iconv 函數即可 : 安裝方式 http://www.twvbb.com/vbb/showthread.php?t=299 : 使用方式 http://tw.php.net/iconv : ※ 引述《punpun (小金 )》之銘言: : : 請問有大大可以分享一下 : : 有關 Big5 和 UTF-8 編碼文字互相轉換的流程 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.249.201

03/30 23:39, , 1F
你那兩個繁簡參考檔,最末端是不是少了 ?> 啊?
03/30 23:39, 1F

03/31 00:29, , 2F
金拍謝,真的是漏掉了,感謝提醒Orz...
03/31 00:29, 2F
文章代碼(AID): #14Azp6jW (Web_Design)
文章代碼(AID): #14Azp6jW (Web_Design)