[問題] 巨量稀疏矩陣進行分群問題
各位好,我目前正在學習資料分群,目前遇到一個問題想請問各位
如果在一個針對使用者購買習慣的分群的過程中
由於商品數量有數十萬筆,使用者也有上百萬筆
要將使用者做分群的話我是以類似下面的排法
( '消費者A' , [0,1,0,0,0,0,0........])
( '消費者B' , [1,0,0,0,0,0,1........])
....
也就是每個使用者所購買的每一個產品都是一個特徵
但這從建立一個這麼大的資料量就已經是一個問題了
即便降低消費者到只剩下100人,也因為維度太大跑到後面就直接memory error
想請問各位像這種稀疏矩陣,在分群上大家覺得資料應該要先做怎樣的處理是洽當的呢
因為實在是新手,所以問題可能問得不太好
希望能有人能提供建議~
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.13.192.19 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1606966886.A.6CD.html
推
12/03 11:49,
4年前
, 1F
12/03 11:49, 1F
→
12/03 11:49,
4年前
, 2F
12/03 11:49, 2F
→
12/03 11:51,
4年前
, 3F
12/03 11:51, 3F
→
12/03 11:51,
4年前
, 4F
12/03 11:51, 4F
→
12/03 11:52,
4年前
, 5F
12/03 11:52, 5F
→
12/03 11:52,
4年前
, 6F
12/03 11:52, 6F
→
12/03 11:52,
4年前
, 7F
12/03 11:52, 7F
→
12/03 11:59,
4年前
, 8F
12/03 11:59, 8F
→
12/03 12:00,
4年前
, 9F
12/03 12:00, 9F
→
12/03 12:01,
4年前
, 10F
12/03 12:01, 10F
→
12/03 12:02,
4年前
, 11F
12/03 12:02, 11F
→
12/03 12:03,
4年前
, 12F
12/03 12:03, 12F
→
12/03 12:04,
4年前
, 13F
12/03 12:04, 13F
推
12/03 13:53,
4年前
, 14F
12/03 13:53, 14F
→
12/03 13:55,
4年前
, 15F
12/03 13:55, 15F
→
12/03 13:55,
4年前
, 16F
12/03 13:55, 16F
→
12/03 13:55,
4年前
, 17F
12/03 13:55, 17F
→
12/03 13:56,
4年前
, 18F
12/03 13:56, 18F
→
12/03 13:56,
4年前
, 19F
12/03 13:56, 19F
→
12/03 13:57,
4年前
, 20F
12/03 13:57, 20F
→
12/03 13:59,
4年前
, 21F
12/03 13:59, 21F
推
12/03 14:01,
4年前
, 22F
12/03 14:01, 22F
→
12/03 14:01,
4年前
, 23F
12/03 14:01, 23F
→
12/03 14:02,
4年前
, 24F
12/03 14:02, 24F
→
12/03 14:02,
4年前
, 25F
12/03 14:02, 25F
→
12/03 14:03,
4年前
, 26F
12/03 14:03, 26F
→
12/03 14:04,
4年前
, 27F
12/03 14:04, 27F
→
12/03 14:04,
4年前
, 28F
12/03 14:04, 28F
→
12/03 14:05,
4年前
, 29F
12/03 14:05, 29F
→
12/03 14:06,
4年前
, 30F
12/03 14:06, 30F
推
12/03 19:40,
4年前
, 31F
12/03 19:40, 31F
→
12/03 19:42,
4年前
, 32F
12/03 19:42, 32F
→
12/03 19:42,
4年前
, 33F
12/03 19:42, 33F
→
12/03 19:43,
4年前
, 34F
12/03 19:43, 34F
DataScience 近期熱門文章
PTT數位生活區 即時熱門文章