PTT數位生活區 / DataScience

[問題] 巨量稀疏矩陣進行分群問題

看板DataScience作者blueblance ( )時間4年前 (2020/12/03 11:41)推噓4(4推 0噓 30→)

留言34則, 3人參與討論串1/1

各位好,我目前正在學習資料分群,目前遇到一個問題想請問各位如果在一個針對使用者購買習慣的分群的過程中由於商品數量有數十萬筆,使用者也有上百萬筆要將使用者做分群的話我是以類似下面的排法 ( '消費者A' , [0,1,0,0,0,0,0........]) ( '消費者B' , [1,0,0,0,0,0,1........]) .... 也就是每個使用者所購買的每一個產品都是一個特徵但這從建立一個這麼大的資料量就已經是一個問題了即便降低消費者到只剩下100人,也因為維度太大跑到後面就直接memory error 想請問各位像這種稀疏矩陣,在分群上大家覺得資料應該要先做怎樣的處理是洽當的呢因為實在是新手,所以問題可能問得不太好希望能有人能提供建議~ 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.13.192.19 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1606966886.A.6CD.html

推

12/03 11:49, 4年前 , 1^F

12/03 11:49, 1^F

→

12/03 11:49, 4年前 , 2^F

12/03 11:49, 2^F

→

12/03 11:51, 4年前 , 3^F

12/03 11:51, 3^F

→

12/03 11:51, 4年前 , 4^F

12/03 11:51, 4^F

→

12/03 11:52, 4年前 , 5^F

12/03 11:52, 5^F

→

12/03 11:52, 4年前 , 6^F

12/03 11:52, 6^F

→

12/03 11:52, 4年前 , 7^F

12/03 11:52, 7^F

→

12/03 11:59, 4年前 , 8^F

12/03 11:59, 8^F

→

12/03 12:00, 4年前 , 9^F

12/03 12:00, 9^F

→

12/03 12:01, 4年前 , 10^F

12/03 12:01, 10^F

→

12/03 12:02, 4年前 , 11^F

12/03 12:02, 11^F

→

12/03 12:03, 4年前 , 12^F

12/03 12:03, 12^F

→

12/03 12:04, 4年前 , 13^F

12/03 12:04, 13^F

推

12/03 13:53, 4年前 , 14^F

12/03 13:53, 14^F

→

12/03 13:55, 4年前 , 15^F

12/03 13:55, 15^F

→

12/03 13:55, 4年前 , 16^F

12/03 13:55, 16^F

→

12/03 13:55, 4年前 , 17^F

12/03 13:55, 17^F

→

12/03 13:56, 4年前 , 18^F

12/03 13:56, 18^F

→

12/03 13:56, 4年前 , 19^F

12/03 13:56, 19^F

→

12/03 13:57, 4年前 , 20^F

12/03 13:57, 20^F

→

12/03 13:59, 4年前 , 21^F

12/03 13:59, 21^F

推

12/03 14:01, 4年前 , 22^F

12/03 14:01, 22^F

→

12/03 14:01, 4年前 , 23^F

12/03 14:01, 23^F

→

12/03 14:02, 4年前 , 24^F

12/03 14:02, 24^F

→

12/03 14:02, 4年前 , 25^F

12/03 14:02, 25^F

→

12/03 14:03, 4年前 , 26^F

12/03 14:03, 26^F

→

12/03 14:04, 4年前 , 27^F

12/03 14:04, 27^F

→

12/03 14:04, 4年前 , 28^F

12/03 14:04, 28^F

→

12/03 14:05, 4年前 , 29^F

12/03 14:05, 29^F

→

12/03 14:06, 4年前 , 30^F

12/03 14:06, 30^F

推

12/03 19:40, 4年前 , 31^F

12/03 19:40, 31^F

→

12/03 19:42, 4年前 , 32^F

12/03 19:42, 32^F

→

12/03 19:42, 4年前 , 33^F

12/03 19:42, 33^F

→

12/03 19:43, 4年前 , 34^F

12/03 19:43, 34^F

‣ 返回看板[ DataScience ] 研討

‣ 更多 blueblance 的文章

文章代碼(AID): #1Vo5vcRD (DataScience)

DataScience 近期熱門文章

2

6

[問題] 文字探勘的特徵選取問題

[ DataScience ]

2周前, 07/01

1

9

[問題] 請問kaggle有商業方案嗎? 它每週gpu的限

[ DataScience ]

4月前, 02/26

4

4

[徵才] 美國Amazon暑期實習生

[ DataScience ]

5月前, 01/23

1

6

[問題] 請教大家有推薦的GPU租用服務嗎?

[ DataScience ]

7月前, 12/20

3

8

[討論] 如何計算兩個不同欄的相似度？

[ DataScience ]

10月前, 09/07

1

4

Re: [問題] 如何在python中訓練好autoencoder?已刪文

[ DataScience ]

11月前, 08/06

2

12

[討論] 有人開始用KAN了嗎？

[ DataScience ]

11月前, 08/04

4

13

Re: [討論] cognitive model/causal ML執行的細節

[ DataScience ]

1年前, 05/15

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

12

19

[心得] 整機全球啟動 9800X3D+5090

[ PC_Shopping ]

5小時前, 07/19

5

9

Re: [賣/台中全國]零件機 HP 14-dq1033cl

[ nb-shopping ]

6小時前, 07/19

16

63

[請益] 尋找代替Adobe 的軟體

[ PC_Shopping ]

7小時前, 07/18

8

9

[心得] 家訪只是過程-Linn Selekt Dsm Organik

8小時前, 07/18

9

33

[請益] 現在B550主機板推薦?

[ PC_Shopping ]

9小時前, 07/18

46

150

Re: [情報] 視博通結束全漢全產品代理合作

[ PC_Shopping ]

10小時前, 07/18

6

26

[菜單] 6k內升級顯卡

[ PC_Shopping ]

10小時前, 07/18

16

36

Re: [新聞] 黃仁勳最愛手機竟然是Google Pixel 他親

11小時前, 07/18

更多即時熱門文章 >>

‣ 返回看板[ DataScience ] 研討

‣ 更多 blueblance 的文章

文章代碼(AID): #1Vo5vcRD (DataScience)