[問題] 如何用機器學習製作特殊用途的詞向量

看板DataScience作者 (fool)時間2年前 (2022/04/24 17:25), 編輯推噓-2(1322)
留言26則, 5人參與, 2年前最新討論串1/1
作業系統: win10 問題類別: ML 使用工具: python 問題內容: 欄位結構如右,[(類別,原因),(資料,頻率)],舉例如下, [(食物,購買),(漢堡,10次),(米飯,5次),(牙刷,2次)] [(食物,不吃),(牙刷,10次),(米飯,5次),(青菜,2次)] 要如何把「食物」這個單詞作成向量, 當食物跟購買 一起出現時,食物跟漢堡 相似度最高 當食物跟不吃 一起出現時,食物跟牙刷 相似度最高 用Apriori 或 FP growth 能作出來嗎? 或是其它方式才能作? 該如何作? 求解,謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.160.205.52 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1650792337.A.21E.html

04/24 19:31, 2年前 , 1F
你要不要全部拿出來一次問一問
04/24 19:31, 1F

04/24 19:49, 2年前 , 2F
embedding 的做法很多,看你爽用哪一個就用哪一個
04/24 19:49, 2F

04/24 19:56, 2年前 , 3F
有了frequency pattern 要找彼此之間的conditional
04/24 19:56, 3F

04/24 19:56, 2年前 , 4F
probability 就是小菜一碟,會這樣問代表你求關鍵字
04/24 19:56, 4F

04/24 19:56, 2年前 , 5F
回去以後根本沒做功課。
04/24 19:56, 5F

04/24 20:47, 2年前 , 6F
frequent pattern mining / association rule
04/24 20:47, 6F

04/24 20:47, 2年前 , 7F
可見上次給你關鍵字,你根本沒去了解
04/24 20:47, 7F

04/24 20:51, 2年前 , 8F
我查了FP的資料,範例是2個詞、3個詞以上,一起出現
04/24 20:51, 8F

04/24 20:53, 2年前 , 9F
的頻率,例如食物跟漢堡一起出現10次,FP就可處理問題
04/24 20:53, 9F

04/24 20:57, 2年前 , 10F
我是ML新手,不知道在某條件下的frequency pattern
04/24 20:57, 10F

04/24 21:00, 2年前 , 11F
該如何作?因為給定的條件跟出現頻率無關,條件只出現1次
04/24 21:00, 11F

04/24 21:03, 2年前 , 12F
例如購買是條件,食物碰到購買會和漢堡相似
04/24 21:03, 12F

04/24 21:05, 2年前 , 13F
衣服碰到購買,也許會和透氣相似,這種情況下
04/24 21:05, 13F

04/24 21:07, 2年前 , 14F
該如何作出詞向量,想不出來,才再次發文請教
04/24 21:07, 14F

04/24 22:28, 2年前 , 15F
太好了,新關鍵字條件機率
04/24 22:28, 15F

04/27 21:34, 2年前 , 16F
你是不是沒發現 fp 的後面還有另一個關鍵字 association
04/27 21:34, 16F

04/27 21:34, 2年前 , 17F
rule XD
04/27 21:34, 17F

04/27 21:36, 2年前 , 18F
然後你這目標性,看起來並不是要做詞向量啊
04/27 21:36, 18F

04/27 21:37, 2年前 , 19F
你可以明確說看看拿了詞向量要怎麼用嗎,你期待一個詞向量
04/27 21:37, 19F

04/27 21:38, 2年前 , 20F
在 A 情況跟一個詞向量 X 距離近,在 B 情況卻又要能跟另
04/27 21:38, 20F

04/27 21:38, 2年前 , 21F
一個詞向量 Y 接近?
04/27 21:38, 21F

05/01 01:47, 2年前 , 22F
要問幾次
05/01 01:47, 22F

05/01 05:51, 2年前 , 23F
可以查查contractive learning, 在同個陣列的物件
05/01 05:51, 23F

05/01 05:51, 2年前 , 24F
他們互為正樣本,在另一個陣列的物件 他們互為負
05/01 05:51, 24F

05/01 05:51, 2年前 , 25F
樣本,這種訓練方式也適用於few shot learning, 就
05/01 05:51, 25F

05/01 05:51, 2年前 , 26F
提點到這了xdd
05/01 05:51, 26F
文章代碼(AID): #1YPHUH8U (DataScience)
文章代碼(AID): #1YPHUH8U (DataScience)