[請益] 請問Cosine similarity演算法問題

看板CSSE (電腦科學及軟體工程)作者 (超浪漫賽車手)時間15年前 (2009/10/16 17:53), 編輯推噓2(201)
留言3則, 2人參與, 最新討論串1/1
有個問題思考很久, 因為這個演算法問題我也不知道該PO在哪,如果不符板歸我會自刪,感謝 請問各位強者,用Cosine similarity來作中文字和英文字的相似度有差別嗎? 由於是給予自詞特徵之後在計算其向量差距,而由於中文字和英文字的差異, 中文可能一個字也有意思,而英文必須要組合的單詞才會有特徵, 所以是否用這個方法來分別計算中英文相似度是否有差距? 還是這個方法比較適用於中文字的相似度計算呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.119.19.57

10/17 02:49, , 1F
中文可能要使用斷字的系統 中研院好像有 用了應該就跟英文
10/17 02:49, 1F

10/17 02:49, , 2F
的cosin similarity一樣了
10/17 02:49, 2F

10/17 20:03, , 3F
主要重點在特徵直的取得! 而不是在相似演算法
10/17 20:03, 3F
文章代碼(AID): #1As4A4o5 (CSSE)
文章代碼(AID): #1As4A4o5 (CSSE)