PTT數位生活區 / DataScience

[問題] 如何對categories data 做 clustering?

看板DataScience作者simplee (simple)時間7年前 (2018/09/02 19:47)推噓5(5推 0噓 7→)

留言12則, 8人參與討論串1/1

資料舉例: 用戶可以使用的顏色有五種 white, black, orange, red, blue one hot encoding後用戶A 0,0,1,1,0 用戶B 1,0,0,0,1 用戶C 0,1,0,0,0 用戶D 1,0,1,1,0 ……etc 備註: 實際上有800多個顏色與幾萬個用戶目的 1. 想要知道哪些顏色組合性質接近 2. 可視化(希望有word vector的效果) 查了幾個關鍵字還是不太清楚做法 k-means似乎都是對連續值的類聚(好像可以不要用歐幾里得距離，但也不知道該換什麼) 或可以直接對unary data PCA降維嗎? sci-kit learn, matlibplot畫出來怪怪的。 ----- Sent from JPTT on my Samsung SM-A530F. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.77.73.216 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1535888850.A.D6B.html

→

09/02 22:01, 7年前 , 1^F

09/02 22:01, 1^F

→

09/02 22:01, 7年前 , 2^F

09/02 22:01, 2^F

推

09/03 00:02, 7年前 , 3^F

09/03 00:02, 3^F

→

09/03 00:07, 7年前 , 4^F

09/03 00:07, 4^F

→

09/03 00:07, 7年前 , 5^F

09/03 00:07, 5^F

→

09/03 04:17, 7年前 , 6^F

09/03 04:17, 6^F

推

09/03 11:06, 7年前 , 7^F

09/03 11:06, 7^F

→

09/03 11:06, 7年前 , 8^F

09/03 11:06, 8^F

推

09/03 13:38, 7年前 , 9^F

09/03 13:38, 9^F

→

09/03 14:48, 7年前 , 10^F

09/03 14:48, 10^F

推

09/04 01:38, 7年前 , 11^F

09/04 01:38, 11^F

推

09/04 01:56, 7年前 , 12^F

09/04 01:56, 12^F

‣ 返回看板[ DataScience ] 研討

‣ 更多 simplee 的文章

文章代碼(AID): #1RYytIrh (DataScience)

DataScience 近期熱門文章

3

17

[討論] 請問有真正把AI運用到工作、投資、或賺

[ DataScience ]

7月前, 11/26

6

17

[討論] 各位會買相關書籍來看嗎?

[ DataScience ]

8月前, 10/31

3

10

[問題] 請問想看CV相關討論適合去何處

[ DataScience ]

9月前, 10/17

2

6

[問題] 文字探勘的特徵選取問題

[ DataScience ]

1年前, 07/01

1

9

[問題] 請問kaggle有商業方案嗎? 它每週gpu的限

[ DataScience ]

1年前, 02/26

4

4

[徵才] 美國Amazon暑期實習生

[ DataScience ]

1年前, 01/23

1

6

[問題] 請教大家有推薦的GPU租用服務嗎?

[ DataScience ]

1年前, 12/20

3

8

[討論] 如何計算兩個不同欄的相似度？

[ DataScience ]

1年前, 09/07

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

6

8

[賣/全國/皆可] 金士頓FURYM21TBSSD SFYRS/1000G

[ HardwareSale ]

1小時前, 07/22

4

21

[心得] Android自動轉寄簡訊驗證碼到Email

2小時前, 07/22

4

8

[請益] 是否該搭配DAC升級

3小時前, 07/22

8

20

[情報] SONY FE 100-400mm F5.6-8

3小時前, 07/22

8

52

Re: [問題] 家庭劇院規劃

4小時前, 07/22

5

23

Fw: [心得] iPhone手機與安卓手機使用心得

5小時前, 07/22

19

64

[心得] iPhone手機與安卓手機使用心得

5小時前, 07/22

5

18

Re: [問題] 家庭劇院規劃

6小時前, 07/22

更多即時熱門文章 >>

‣ 返回看板[ DataScience ] 研討

‣ 更多 simplee 的文章

文章代碼(AID): #1RYytIrh (DataScience)