Re: [xx] X X 輸入法簡介 2005-02

看板IME (輸入法討論)作者 (Gmail放送,意者密)時間21年前 (2005/03/01 13:37), 編輯推噓1(100)
留言1則, 1人參與, 最新討論串2/2 (看更多)
這是您自己想製作的嗎? ※ 引述《cnoize (泥巴星球Server)》之銘言: : 只需把所有的字都強制設成三碼, 這樣常用字就可以輕易地放進簡碼區, 嘸蝦米就是這麼設計的,「補短」的原則就是讓字根少的加長, 二碼區就可以放簡碼字。 : 我一開始就決定字根越多越好, 用字根數量來換取無重碼, 所以也不需要把字拆 : 得很細, 研究每一筆畫. 字根可以很多,但是按鍵只有這麼幾個… 更不說字根記憶的問題了… : (*) 無重碼: : 也就是說, 其實我是同時在做下列輸入法: big5, big5hkscs, gb2312, gbk, : jisx, unicode. 它們之間的排列組合所造成的複雜度, 會嚴重地影響開發進度. : (*) 其他特色: : 0. 標準字: 26 * 26 * 26 = 17576 ([a-z] 三個鍵加一個空白.) : 1. 字根數量多: : 在開發初期, 就預估 BIG5 字根約有 2000 ~ 3000 個, 現在的狀況是: : ici findrootuni2run.ici uniok.txt | wc -l => 2253 : 約 2253 個, 它還包含了簡體及日文的部分字根. : 只用約一般輸入法十倍的字根來讓選字率達到零, 其實很划算. 十倍? 倉頡100個 行列200個 蝦米300個 你兩千多個字根是叫誰背啊... >"< : 2. 無省略字形: : 一般的拆字輸入法, 常常採用 "首、次、三、尾" 的方式取碼, 我認為 : 這樣子不合理, 會造成訊息的損失, 所以用相反的方法處理, 不但不省略, : 字形還常常重複使用. 怎麼相反? 你不是只取三碼? 那怎麼全取? 又要去增加字根? : 4. 拆字時不會有困難. : 所有的字形都包含在字根表之中了, 拆字一定不會有問題. 不會的字 : 只需查表即可. : 5. 沒有容錯. : 一字三碼, 三碼一字. : 容錯是不必要的, 難字查表即可, 學習者不會有疑惑. 如果將來你的輸入法風行了,我想光靠賣這個「表」就能過日子了... :P 2000多字的字根表… 嘖嘖… 20000多字的查碼表… 嘖嘖… 出個手冊來賣好了… :) : 6. 正式版本確定公布之後, 不可以修改. : 修改字碼會浪費學習者的時間. 好的做法是一開始就做到最好. : 其次是全部重新翻新, 開發新系統, 但以附加的方式增進原本的系統. : (*) 如何做到無重碼(不用選字): : 重碼的意思是: 兩個不同的單字的輸入鍵位相同, 以致於必須設法避開, : 或是讓使用者選字. 重碼會嚴重地降低輸入文字的速度, 一般的輸入法, : 常用字區也常常有重碼. : 嘸蝦米輸入法對於減少重碼, 作了很多努力, 但仍然沒有達成完全無重碼 : 的效果. : 而這個輸入法利用了一些簡單的技巧來解決重碼的問題: : 1. 運用大量的的字根, 因而能夠分散相似的文字至不同鍵位. : 相似字根的文字自然地被分開. 例如: "員" 和 "唄", 由於 : "員" 字旁常被其他文字使用, 所以 "員" 是字根. 取: : "員: 員 (貝)", 而 "唄: 口 貝". 這樣一來,字根會暴增… : 2. 讓 "標準字" 都用 3 鍵輸入, 不足的要設法補滿. : 補滿的方法是加入副根. 每一個字根都有一個副根, : 基本上以每個字根的最後幾部分組成. : (跟嘸蝦米的輔根不太一樣, 嘸蝦米是用最後一筆劃, : 而副根是任何字形都可以. ) : 副根在表格中加上 "()" 來識別. : 3. 由於副根的副根是相同的, 補滿的時候會容易造成重碼的機會. : 舉例而言, 很多字根的副根會是 "(一)", 假設 "一" 的副根為 : "(無)". 只要這類字根超過 26 個, 第一個鍵碼([a-z]) 就不夠用 : 了. : 所以要加入一個規則, 在第二鍵碼相同、第三鍵碼空缺, 需要 : 加入副根時, 改成加入首根(字首). : 首根在表格中加上 "<>" 來識別. 規則真多… 不過如果能一以貫之,沒有加一堆但書的話… 勉強還OK... : 4. 一個字根可以用多鍵碼來輸入. : 例如這個不常用字 "乜", 可以依需求, 找一個空位, : 隨意編成 "EXS". : 由於這是一個不常用字, 所以可以不必學. : 不過對於有需求的人而言, 不需要選字, 整個系統仍然無重碼. : U+4E5C # 乜 (b5) 這個就變成獨立出來的「特殊字」了 : (*) 簡碼的數量: : 1. 簡碼及保留給使用者自訂的空間: 這個很有趣,但是在使用上,會不會跟輸入法本身衝突? 因為沒有一個規則在,變成你必須記憶所有你定義的簡碼。 : 從以上的說明, 讀者可以了解, 在理論上, 目前其他的輸入法 : 不可能比這個輸入法快, 因為其他的輸入法保留的簡碼空間、簡碼的 : 詞句數量、及標準常用字長度等等要點, 都無法相比. 所以在速度方面, : 這個輸入法必定居於領先的地位. 我只能說,如果你記憶力超強的話…的確是如此… 而且這樣的輸入法,不用你做,本來說有的… 而且保證一字一碼,不用選字(沒有重碼),不會的時候,只要查表即可的… 內碼輸入法! XD : 這邊有一個特殊的地方, 雖然我認為輸入法比賽必須允許 : 使用詞庫才合理 本來就有了… 不然忘形等智慧型注音是混假的? >_< -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 220.135.48.20

140.113.22.98 03/04, , 1F
感謝提問, 回答處理中.댠最晚週日完成.
140.113.22.98 03/04, 1F
文章代碼(AID): #128_-MMh (IME)
文章代碼(AID): #128_-MMh (IME)