Fw: [請益] 使用PCA在分類時的問題

看板MATLAB作者時間13年前 (2013/03/26 16:28), 編輯推噓0(008)
留言8則, 2人參與, 最新討論串1/1
※ [本文轉錄自 Master_D 看板 #1HKLizr2 ] 作者: kuan0817 () 看板: Master_D 標題: [請益] 使用PCA在分類時的問題 時間: Tue Mar 26 16:24:25 2013 大家好 最近使用了PCA來對我資料做降維 因為降維後的資料是要拿來做分類的 也就是有train跟test 我想問的問題是: 在找尋eigenvector時, 是否可以使用train+test一起去找 如果是這樣做的話, 後續的分類結果是否仍然可以算outside test呢? 看了一些網路上的資料, 好像有些是說可以納入test, 因為是unsupervised的 (清大張智星老師網站關於PCA的教學, 也是先對全部資料取pca, 然後再leave one out的 去看準確率) 但又覺得好像怪怪的 希望有人可以解惑 謝謝大家 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.116.82.127 ※ 發信站: 批踢踢實業坊(ptt.cc) ※ 轉錄者: kuan0817 (140.116.82.127), 時間: 03/26/2013 16:28:46

03/26 19:42, , 1F
pca是平移轉置運算的一種 運算耗費O(n^3)
03/26 19:42, 1F

03/26 19:43, , 2F
還是不是有點忘了 總之樣本數大的時候等待時間很可觀
03/26 19:43, 2F

03/26 19:45, , 3F
通常希望每個測試樣本看到的是經過相同平移轉置矩陣後結果
03/26 19:45, 3F

03/26 19:46, , 4F
分類之外 還有各種統計的分析才有意義
03/26 19:46, 4F

03/27 01:13, , 5F
可以 因為feature和label在你的case應該是獨立的
03/27 01:13, 5F

03/27 01:36, , 6F
補充樓上 個人解讀為分類索引並不是樣本數據的變數
03/27 01:36, 6F

03/27 01:37, , 7F
所以採行pca時只要單純處理數據即可 與獨立的嚴謹定義不同
03/27 01:37, 7F

03/27 01:40, , 8F
但是樣本的特徵分布與分類索引的相依特性還是存在著
03/27 01:40, 8F
文章代碼(AID): #1HKLn07l (MATLAB)
文章代碼(AID): #1HKLn07l (MATLAB)