[問題] 拿中文句子分析程式套古文的字典

看板DataScience作者 (Neisseria)時間3年前 (2021/08/07 15:01), 編輯推噓1(101)
留言2則, 2人參與, 3年前最新討論串1/1
作業系統:(ex:mac,win10,win8,win7,linux,etc...) 不限,詢問概念性問題 問題類別:(ex:ML,SVM,RL,DL,RNN,CNN,NLP,BD,Vis,etc...) NLP 使用工具:(ex:python,Java,C++,tensorflow,keras,MATLAB,etc...) 假定是 jieba,但套別的中文句子分析程式也可以 問題內容: 如果拿現代中文的句子分析程式,像 jieba 但是把字典的部分換成古文的詞彙 這樣跑出來的結果還行嗎? 當然這個古文詞典目前是不存在的 也不是做研究用的 只是想做個把古文句子拆解的小程式 古文的範圍很廣,這樣會做不完 可能會限制範圍,像是孔孟老莊墨法之類的 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.231.177.247 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1628319680.A.ED3.html

08/07 19:00, 3年前 , 1F
你字典夠強就可啊 苦工是在建立字典上 又不是分詞
08/07 19:00, 1F

08/07 19:36, 3年前 , 2F
可以考慮看看中文Bert
08/07 19:36, 2F
文章代碼(AID): #1X3Y_0xJ (DataScience)
文章代碼(AID): #1X3Y_0xJ (DataScience)