[問題] jieba自定義字典後仍無法正確斷詞

看板Python作者 (JackyLee)時間2年前 (2022/10/18 03:52), 2年前編輯推噓2(201)
留言3則, 2人參與, 2年前最新討論串1/1
想請教一下有使用過Jieba斷詞的板友 目前遇到目前遇到狀況如下 例如說我把「超前部屬」加入自定義字典,並且把權重加得很高 但看了一下斷詞完出來的結果,只有少數被成功斷成「超前部屬」,多數仍是超前+部屬 想請問一下有甚麼方式可以讓我自定義的單字能夠優先被識別呢? 感謝各位(跪 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 60.96.185.59 (日本) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1666036324.A.FEA.html

10/18 08:32, 2年前 , 1F
覺得蠻難的,斷詞後再接回去可能比較容易
10/18 08:32, 1F
其實量沒有說太多,手動起來是還好 不過因為是論文想說能直接跑出來應該最好(?

10/18 11:43, 2年前 , 2F
權重高高是多高? 加到9999看看?
10/18 11:43, 2F
加到超級無敵高了也是一樣哈哈,我在想應該是目標單字前後的單字也會影響斷詞結果,不 過這部分對代碼新手的我實在就沒辦法了 囧 ※ 編輯: TiffanyPany (60.96.185.59 日本), 10/18/2022 12:47:01

10/18 13:07, 2年前 , 3F
試試jeiba.suggest_freq("超前部署",True)?
10/18 13:07, 3F
感謝 剛剛加了快速看一下好像可以達成我想要的結果 非常感謝 ※ 編輯: TiffanyPany (60.96.185.59 日本), 10/18/2022 13:55:21
文章代碼(AID): #1ZJR9a_g (Python)
文章代碼(AID): #1ZJR9a_g (Python)