Re: [請益] 關於酷音的擴充詞庫

看板EZsoft (小軟體)作者 (夢幻豬太郎)時間18年前 (2008/05/04 23:07), 編輯推噓2(204)
留言6則, 2人參與, 最新討論串2/2 (看更多)
※ 引述《DRLai (蘇打)》之銘言: : 最近安裝了酷音0428的擴充詞庫 : 但是突然變得好不習慣 : 主要是很多單一字變成不是預設的 (恕刪...) : 還有很多常用的單一字被改掉了 : (原本安裝前單一字都是正常的,安裝後單一字全亂了…我安裝後有將自己的重新匯入) ︿︿︿︿︿︿︿︿︿︿︿︿︿ 這是關鍵之一 : 請問有辦法一次將單一字的詞刪掉嗎? : 一個一個刪好累 ︿︿︿︿︿︿︿︿︿ 這是關鍵之二 (恕刪...) 新酷音共享詞庫其實只是個數量比較多的「使用者自訂詞庫」 主要是把大家常用或是非一般認知的用語給彙整起來 另外就是補充新酷音內建詞庫不足的部份 在收集與整理的時候,三交花了不少力氣在刪除「單一」的字 因為使用新酷音的時候,「使用者自訂詞庫」連「單一」字, 甚至打錯的詞,只要按下Enter送出,都會一併學習並紀錄下來 假若不將這些「單字」或錯誤字詞給刪除,就會「干擾」正常出字的優先順序 因為紀錄在自訂詞庫的內容,新酷音都會盡可能給於較高的輸出順序 如文中提到的 為=>微 但=>蛋 被=>備 等等 可能就是上述原因造成的 而DRLai大做了一個很「致命」的動作,就是匯入自己的自訂詞庫 (用致命好像太嚴重了些^^") 三交的共享詞庫(也就是數量較多的自訂詞庫)是經過整理的 除了刪掉單一的字外,也會刪除怪異的詞 只保留內建詞庫缺少的與特殊用語的部份 由三交無法確定DRLai有整理過自己的自訂詞庫 如果只是單安裝共享詞庫,並且不另外匯入其他詞庫,應該不會發生這個問題才是 但是基於「這就是人蔘」的莫非定律原則 當然也有可能是三交整理的共享詞庫發生問題,囧囧囧r2 因此三交整理了另一個版本的共享詞庫,除了針對DRLai所提問題而進行的調整外 還對「的」、「得」與「地」三字進行最佳化 (這也是三交下一個版本的更新內容之一) 不過最佳化尚未調整完,DRLai大如果遇到任何問題,麻煩回報,三交會立即調整 當然其他有興趣的朋友,也可以試試看這個尚在整理中的版本^^ 下載網址: http://www.badongo.com/file/9194932 請您安裝以上的共享詞庫,但是請您注意一點,務必不要先匯入您自己的自訂詞庫 使用並觀察一段時間看看,看看單用共享詞庫是否會有奇怪的現象 如果還會出現,請跟三交反應,三交會立即改善 反之,麻煩DRLai大好好整理一下自訂詞庫,整理原則如下: 1.日常用語和名詞刪除,只保留姓名、術語與特殊用語 2.單一字請刪除,這會影響並干擾語句輸出的判斷 3.整理好後,如果匯入出現「載入過程發現詞彙錯誤或重複...」的訊息 代表自己整理的自訂詞庫有一個以上的字詞與共享詞庫重複,請找出並刪除之 希望這樣可以解決DRLai大的問題,也感謝您對新酷音的支持^^b -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 123.193.242.12

05/04 23:34, , 1F
不過我在安裝之前「單字」的部份沒有出現過那些耶^^a
05/04 23:34, 1F

05/04 23:34, , 2F
我也想過可能是匯入自己的詞庫的關係,不過有些字我沒打過
05/04 23:34, 2F

05/04 23:35, , 3F
也成了「單字」所以才有點疑惑(像是"蛋"我幾乎沒用過的字)
05/04 23:35, 3F

05/04 23:36, , 4F
另外,有沒有快速的解決方案呢?例如一次刪除所有的「單字」
05/04 23:36, 4F

05/04 23:51, , 5F
話說…新酷音好像沒有source code可以看耶XD
05/04 23:51, 5F

05/05 16:07, , 6F
有 source code 可以看, 請看官網->download->subversio
05/05 16:07, 6F
文章代碼(AID): #187T4zD- (EZsoft)
討論串 (同標題文章)
文章代碼(AID): #187T4zD- (EZsoft)