[問題] 如何量化降維過程中損失的資訊量

看板DataScience作者 (HANA)時間5年前 (2019/06/07 10:03), 編輯推噓1(103)
留言4則, 4人參與, 5年前最新討論串1/1
最近在複習PCA 之前學到的是pca在降維時找到的是降維後方差最大的的維度來保持最多的資訊量 想問問有沒有辦法量化我們在降維過程中損失多少的資訊量 而這些損失的資訊對model的影響程度多寡 請高手解惑 ----- Sent from JPTT on my iPhone -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 126.193.20.94 (日本) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1559873035.A.077.html

06/07 10:20, 5年前 , 1F
explained_variance_ratio
06/07 10:20, 1F

06/07 12:02, 5年前 , 2F
計算方差解釋率看看保留多少成分囉
06/07 12:02, 2F

06/07 12:23, 5年前 , 3F
Eigenvalue / sum(eigenvalue) 看 ratio
06/07 12:23, 3F

06/07 12:26, 5年前 , 4F
感謝
06/07 12:26, 4F
文章代碼(AID): #1S-SOB1t (DataScience)
文章代碼(AID): #1S-SOB1t (DataScience)