Re: [討論] 分團問題!?
在推文有說過 不過還是講細一點
在之前接觸的領域中(生資),這類的圖通常是為了看數個個體間的相似度
類如測帶有大量基因表現量的癌症晶片之間的相似性,可能會用皮爾森相關係數
因為一輪比下去,最後也會自己跟自己比較,這樣會有個單向群集(One-way clustering)
的對稱矩陣
在數據科學方面,玉山資料科學團隊也有做類似的矩陣熱圖
大概就是這樣子的應用。
https://www.ithome.com.tw/news/108614
內文:除了分行的差異,玉山銀行也想要了解各分行間的相似程度。洪采襄表示,除了用二維圖
表來分析外,玉山也利用分群技術,如根據存款、信用卡、貸款,以及財富管理等四構面
,並且用顏色來呈現各分行之間的相似程度,來提供更直覺的視覺化呈現。
例如,若想要臺北將近30間分中,其中兩間的特性時,則在橫軸尋找A分行,縱軸則找到B
分行,在相似度矩陣中尋找A與B的交集點。
若此交集點的顏色愈偏紅色,代表A、B的相似度越高。反之,如果交集點偏向黃色,相似
度則比較低。此外,在相似度矩陣中,也可以利用分群,將特性相似的分行繪製在相鄰區
域。
※ 引述《peter308 (pete)》之銘言:
: 在處理龐大的數據的時候
: 經常會透過分團(Clique, cluster analysis) 來將數據做分類
: 我最近有觀察到這種分團問題都會附帶一個關聯矩陣
: 這個矩陣的長相大致上如下:
: https://i.imgur.com/IgE8Y75.jpg
: 因為我之前修群論的時候
: 對於這樣的圖形常常接觸
: 像有一本量子力學的教科書的封面就是這類型的矩陣
: https://i.imgur.com/I9Aa6cU.jpg
: 通常有這樣的圖形出現就表示系統有某種對稱性!
: 不知道各位在數據科學領域(非我的專長)
: 可有聽過有什麼樣的對稱性的狀況或是討論嗎??
: 感謝!!
--
你我相逢在深夜的BBS
你有你的 我有我的 想法
不認同也好 但不可否認
在這巧遇時交流的思緒
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.8.128.47
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1525843190.A.60D.html
※ 編輯: p122607 (39.8.128.47), 05/09/2018 13:20:49
推
05/09 13:30,
6年前
, 1F
05/09 13:30, 1F
討論串 (同標題文章)
DataScience 近期熱門文章
PTT數位生活區 即時熱門文章