看板 [ Perl ]
討論串[問題] 一個奇怪的漢字編碼問題(Unihan?)
共 5 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓0(0推 0噓 1→)留言1則,0人參與, 最新作者herculus6502 (金麟豈是池中物)時間9年前 (2015/08/05 21:22), 9年前編輯資訊
1
0
1
內容預覽:
在考選部公佈的考畢試題 pdf 檔案中,如果出現"流行"這個詞. 在 grep 的時候都會找不到. 仔細檢查後發現,在 linux 上這兩個字比起用輸入法打出來的字"略小",字碼亦不同. 但在 windows 上似乎刻意地都顯示為較大的"流行"二字. 實際上的例子我找到這個網頁 http://cs.
(還有261個字)

推噓2(2推 0噓 0→)留言2則,0人參與, 最新作者flu (Crazy Rhythm)時間9年前 (2015/08/07 03:35), 9年前編輯資訊
1
0
7
內容預覽:
找了一陣子的心得. A. 首先以unicode han 之類的關鍵字去找到了這個wikipedia條目. https://en.wikipedia.org/wiki/CJK_Unified_Ideographs_(Unicode_block). 焦點放在表格下半部,在uni han欄位標示為 not
(還有1137個字)

推噓2(2推 0噓 0→)留言2則,0人參與, 最新作者gugod (啊)時間9年前 (2015/09/16 06:44), 編輯資訊
0
0
4
內容預覽:
Unicode 方面的檢索,可直接使用 unicode.org,其中有一頁是. 漢字相關的:. http://www.unicode.org/charts/unihan.html. 雖然 CTA 做得好像不存在似的,但"Lookup" 鈕旁邊可以輸入漢字,並. 查到各重資料。以下是「行」字 ( U+
(還有1359個字)

推噓1(1推 0噓 0→)留言1則,0人參與, 最新作者gugod (啊)時間9年前 (2015/09/16 07:04), 編輯資訊
0
0
4
內容預覽:
(這一點前封回章已經回應). U+328E 的「〇金」與 U+091D1 的「金」,在「字意」上通常指涉不同實物,. 多半不必視為同樣。私以為忽略便可。. 如果是組字專用的碼位,其名稱都會有 "COMBINING" 這個字,而且實際上在檔案中都. 會是兩個碼位,所以其實很好處理。可以使用 "uni"
(還有637個字)

推噓1(1推 0噓 2→)留言3則,0人參與, 最新作者buganini (霸格尼尼)時間9年前 (2015/09/27 23:14), 9年前編輯資訊
0
0
2
內容預覽:
除了Unihan,Unicode還有定義NFC/NFD/NFKC/NFKD四種normalization. 後面兩個相容性編碼不說了,前兩個正規等價:. NFC是等價組碼. NFD是等價拆碼. 在unicodedata裡面目前「拆組」對中文來說意義不大,主要是歐洲語言和韓語才有. 拆組的等價性問題,
(還有717個字)
首頁
上一頁
1
下一頁
尾頁