[問題] 中文 詞向量 相似度
各位板友好
小弟目前有一些客戶的瀏覽行為標籤,例如:
'輕食' '農業' '退休' '連鎖咖啡'
'連鎖速食餐廳' '遊戲' '遊樂園' '遊輪'
這種標籤,雖然已經是比較粗略的分類了,但整體還是有好幾百個
如果要人工手動去歸類成大類會非常費工
所以我想要用詞向量的方式進行集群,把相似的歸類在一起
不知道有什麼預訓練好的model可以算大量字詞的相似度
感謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 150.116.180.58 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1596817153.A.FE0.html
※ 編輯: s3714443 (150.116.180.58 臺灣), 08/08/2020 00:20:07
推
08/08 07:47,
4年前
, 1F
08/08 07:47, 1F
推
08/08 08:17,
4年前
, 2F
08/08 08:17, 2F
→
08/08 08:17,
4年前
, 3F
08/08 08:17, 3F
→
08/08 08:20,
4年前
, 4F
08/08 08:20, 4F
→
08/08 08:20,
4年前
, 5F
08/08 08:20, 5F
→
08/08 08:20,
4年前
, 6F
08/08 08:20, 6F
→
08/08 08:21,
4年前
, 7F
08/08 08:21, 7F
→
08/08 08:21,
4年前
, 8F
08/08 08:21, 8F
→
08/08 10:06,
4年前
, 9F
08/08 10:06, 9F
推
08/08 12:46,
4年前
, 10F
08/08 12:46, 10F
推
08/08 17:02,
4年前
, 11F
08/08 17:02, 11F
推
08/15 14:53,
4年前
, 12F
08/15 14:53, 12F
→
08/15 14:53,
4年前
, 13F
08/15 14:53, 13F
推
09/04 12:47,
4年前
, 14F
09/04 12:47, 14F
→
09/04 12:47,
4年前
, 15F
09/04 12:47, 15F
→
09/04 12:47,
4年前
, 16F
09/04 12:47, 16F
→
09/04 12:47,
4年前
, 17F
09/04 12:47, 17F
推
09/04 12:49,
4年前
, 18F
09/04 12:49, 18F
→
09/04 12:50,
4年前
, 19F
09/04 12:50, 19F
→
09/04 12:50,
4年前
, 20F
09/04 12:50, 20F
→
09/04 12:50,
4年前
, 21F
09/04 12:50, 21F
推
09/04 12:53,
4年前
, 22F
09/04 12:53, 22F
→
09/04 12:53,
4年前
, 23F
09/04 12:53, 23F
推
10/16 21:58,
4年前
, 24F
10/16 21:58, 24F
DataScience 近期熱門文章
PTT數位生活區 即時熱門文章