[問題] 如何讓機器學到需要的詞向量

看板DataScience作者 (fool)時間2年前 (2022/04/21 15:14), 編輯推噓3(307)
留言10則, 3人參與, 2年前最新討論串1/1
ctrl + y 可以刪除一整行,請將不需要的內容刪除 文章分類提示: - 問題: 當你想要問問題時,請使用這個類別。 - 討論: 當你自己已經有答案,但是也想聽聽版友意見時。 - 情報: 當你看到消息時,請使用這個類別。 根據板規規定,做適當的轉換,以及摘錄重要文意。 - 心得: 當你自己想要分享經驗時,請使用這個類別。 (回答並非義務,所以當有人回答時,哪怕句謝謝也好,多多回應,大E可編輯文章) 可以試著把程式碼用網站貼出來唷 https://pastebin.com/ (如果用不到以下框架,如觀念問題請自行視情況刪除作業系統,使用工具等項目) 作業系統: win10 問題類別: ML 使用工具: tensorflow 問題內容: 有4個詞,分別是 食物 漢堡 米飯 牙刷 食物 跟 漢堡 一起出現的頻率是 10 次 食物 跟 米飯 一起出現的頻率是 5 次 食物 跟 牙刷 一起出現的頻率是 2 次 該如何把這4個詞製作成向量,並且可比較相似度,食物 和 漢堡相似度最高, 和牙刷相似度最低,請提供關鍵字讓我查詢 或是 告知我該如何作 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.161.242.144 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1650525266.A.08F.html

04/21 15:38, 2年前 , 1F
Word2vec、GloVe
04/21 15:38, 1F

04/21 15:40, 2年前 , 2F
網路資源很多,這兩個也都有公開的 GitHub 實作可以研究
04/21 15:40, 2F

04/21 15:48, 2年前 , 3F
Word2vec的相似度計算和我要的不一樣
04/21 15:48, 3F

04/21 15:50, 2年前 , 4F
它是利用具有相同上下文的詞,計算相似度
04/21 15:50, 4F

04/21 15:52, 2年前 , 5F
例如狗咬人和貓咬人,狗跟貓相似是因為有相同的上下文
04/21 15:52, 5F

04/21 15:54, 2年前 , 6F
咬人,我要的相似度是一起出現的頻率
04/21 15:54, 6F

04/21 21:13, 2年前 , 7F
fp tree,兩個禮拜前作業剛好有出
04/21 21:13, 7F

04/21 23:48, 2年前 , 8F
如果只是要一起出現的頻率,那請找
04/21 23:48, 8F

04/21 23:49, 2年前 , 9F
frequent pattern mining / association rule
04/21 23:49, 9F

04/21 23:50, 2年前 , 10F
要演算法名的話可以從最基本的 Apriori 和 FP Growth 開始
04/21 23:50, 10F
文章代碼(AID): #1YOGHI2F (DataScience)
文章代碼(AID): #1YOGHI2F (DataScience)