Re: [心得] Unicode 補完計畫 (UAO)
※ 引述《mstar (Wayne Su)》之銘言:
: : 推 sicao:請問有沒有UTF-8跟unicode跟UTF-16等一干差別? 11/02 21:08
: Unicode:
: 前述的 U+xxxx 只是編號方式,實際的「編碼」有很多,
基本上就是「一個 unicode 各自表述」
同一個 unicode 字元,實際使用時,可以用不同的編碼方式來表示
: 目前常見的是 UTF8、UTF16、UTF32 幾種
: UTF8:
: 這個編碼方式的特色就是針對不同種類的字元使用不同的 byte 數
不正確,UTF16 也是使用不同 byte 數,只是大部份是 16 位元
加上 Windows 比較舊的版本也只支援固定 16 位元,造成很多人以為
UTF-16 或是 unicode 就都是 16 bits,固定 2 位元組,但這並不正確
UTF-8 真正的特色是,過去的 ANSI 程式不用做修改,可以直接相容 UTF-8
並且沒有 byte order 問題,這兩件事情才是他主要最重要的特色。
其他的 UTF16LE, UTF16BE 等都需要舊程式大幅度的修改
並且在不同平台上會有 byte order 的問題,所以不難看出 UTF-8 編碼
為何會最受歡迎,並且被廣為使用。
目前 Linux 系統上幾乎都採用 UTF-8 編碼,網頁作者也喜歡用 UTF-8
但很不幸的是,微軟的 Windows 系統全面都使用 UTF-16 LE
並且在 Windows 98 以前完全沒有 UTF-8 的支援
即使到目前的 Vista 還是使用 UTF-16LE,而且仍然沒有支援完整
所以 Windows 程式要支援 unicode,如果原先設計沒考量到,會需要大幅度的修改
相形之下,Linux 下的軟體幾乎只需要細微的修改,都可以直接支援 UTF-8
--
個人網頁: http://pcman.sayya.org/ 上面有自畫像及各種聯絡資訊
PCMan 全系列 BBS 連線軟體 http://pcman.ptt.cc/ http://pcmanx.csie.net/
新酷音輸入法 for Windows http://chewing.csie.net/
IE Tab Firefox plugin/extension http://ietab.mozdev.org/
PCMan 油畫作品集:http://www.wretch.cc/album/album.php?id=pcman&book=1
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 163.29.223.22
推
11/03 11:26, , 1F
11/03 11:26, 1F
推
11/03 17:31, , 2F
11/03 17:31, 2F
推
11/03 23:06, , 3F
11/03 23:06, 3F
討論串 (同標題文章)
EZsoft 近期熱門文章
PTT數位生活區 即時熱門文章