[轉錄] 一篇關於"重碼字的問題"的文章
近日在網路上閒逛,發現了行列發明人廖明德先生在網路上發表了一篇關於"重碼字問
題"文章。相信可以讓許多人更了解,如何訂定"重碼字順序"以及"簡碼與特別碼編排"的原
則。以下為轉錄內容,希望對大家有所幫助。
===============================================================================
問:為何「減」這字既無特碼,亦無簡碼呢?此字的使用頻率也不低的說!
答:特別碼的安排有其考慮因素,除了要有適合的空位、字頻高優先外,也要考慮記憶的
難度,太難記憶硬安排的結果是沒人使用。
以"減"字而言,在13053字裡字頻排序為864,算是使用率不低,但以它的字根碼想安排在
首首(38 38)有"沝"字,首二(38 19)有"尖"字,首三(38 10)有"江"字,首尾(38 26)有"
渢"字,二三有"左"字, 二尾有"戊"字,三三有"比"字,三尾有"長"字,尾尾有"絲"字,
所以幾乎是沒有可助記的空位放特別碼。現在字集加大,要安排特別碼更沒有空間了。
再說一級簡碼,"減"的第一個字根鍵位是[3v],但這個位置的一級簡碼的十個字,每個都
比"減"字頻高,所以一級簡碼輪不到它。
而二級簡碼因為有很多字不可能記憶,所以只能依規則(第二個字根碼的第一個數字)來擺
放,而"減"字的第二個字根碼(19)的第一個數字是1,只能擺第1個位置,但那位置已被兩
根的本字"尖"字占了。所以它也沒能被擺進二級簡碼。
問:又「嚐、寵、慣……等等」這些字使用率不低,卻排在重碼字的次選項(首選字通常
都有簡特碼可用)。
答:重碼字應以正常輸入的情況來考慮,因大多數行列使用者是以正常編碼來輸入,這樣
就夠用了,他們並不想去記特別碼,簡碼也是用久了自然記住的才使用,一級簡碼還可以
,要記二級簡碼就比較難了。反而要記住重碼字是第幾個還比較容易。
上列這些重碼字的使用頻率在倚天時代編碼時就有依據教育部的字頻資料排序設計,昨天
我特地比對新的字頻資料(中研院的平衡語料庫+網路論壇字頻,其實也不夠新),1龐2寵
及 1實2慣的排序仍是正確的,而"嚐"字字頻有比"噹"強一些,但差距不大,而「噹、龐
、實」這三個被排在前面的重碼字也都有被收進二級簡碼。雖然「重碼次選字挪至首選項
」我認為並不適合,但你說的也有另一種道理,也許可考慮把第二重碼字「嚐、寵、慣」
放進二級簡碼。當時只想到要把字頻最高的放進簡碼。
談到重碼字也要提到歷史:在倚天時代因當時電腦記憶體非常珍貴,當時對照表必需儘量
壓縮,只能用內碼排序,這樣才可以不記內碼,行列每次敲鍵都可能是30個鍵其中的一個
,而每個字最多會有4鍵,又要把一二級簡碼的資訊也記進去,這樣每個字只能用3個
byte來記錄, Big5的13053字集行列對照表總共只有39K,當它被載入記憶體仍保持壓縮
格式,程式是將每個敲進來的鍵先壓縮成5個bit再去和對照表進行bit比對,當時對照表
不可能用字頻排序,只能在對照表的檔頭針對必需調整的96個重碼字作記錄,每當出現重
碼字就拿這96個字來比對,如果該字有被包含就是最高頻字,即時將它調到第一個重碼字
顯示位置。。
而這些重碼字序就這樣被定下來了,到了WINDOWS一直延用,時間往前推進,雖然人們用
字習慣會隨環境改變,字頻序會跟著變,但輸入法對照表卻不能隨意跟著變動,因使用者
在不同系統間或前後版本間重複字的順序如果不一致會很困擾,有些行列使用者用了十幾
二十年,一切都已變成直覺,聽到要調整重碼字序,可能都要跳起來了,且不同輸入系統
間很難一齊更新,像微軟系統內含的輸入法更新可不是容易的事,作輸入法就是要考慮很
多。
如果要改可能來一次大改版,直接用字頻表來作對照表,輸入時一面按鍵就把最高頻的字
從頭列出當作簡碼,新近推出的行列10數字輸入法 就是直接用字頻排序對照表,老刀已
把它實現在LIME系統供智慧型手機使用者下載使用,我自己試用還蠻理想的。
轉錄網址http://hyperrate.com/thread.php?tid=21714
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 123.193.217.47
推
03/30 11:58, , 1F
03/30 11:58, 1F
推
03/30 11:59, , 2F
03/30 11:59, 2F
→
05/10 21:09, , 3F
05/10 21:09, 3F
→
05/10 21:12, , 4F
05/10 21:12, 4F
→
05/10 21:14, , 5F
05/10 21:14, 5F
→
05/10 21:15, , 6F
05/10 21:15, 6F
→
05/10 21:17, , 7F
05/10 21:17, 7F
→
05/10 21:23, , 8F
05/10 21:23, 8F
→
05/10 21:25, , 9F
05/10 21:25, 9F
→
05/10 21:27, , 10F
05/10 21:27, 10F
→
05/10 21:31, , 11F
05/10 21:31, 11F
→
05/10 21:33, , 12F
05/10 21:33, 12F
推
07/24 09:50, , 13F
07/24 09:50, 13F
→
07/24 09:51, , 14F
07/24 09:51, 14F
Array 近期熱門文章
PTT數位生活區 即時熱門文章