[討論] 現在CNN架構對scale變化的解法?
就我所知
CNN並不是不受scale變化影響的的 譬如說 同一顆球 我近一點拍 讓球比較大
CNN就可能判錯
對不同大小影像CNN目前的解法
1. 硬train一發, 讓不同大小的data都有train到 然而CNN學到的feature仍不是scale
invairant的 若是出現training data中沒有的大小 還是可能會錯
2. 多加幾個CNN: 一個CNN不夠 可以用多個 例如1x1 3x3 5x5 同時都抽feature 然後再
merge起來
例如googleNet
這樣就同時考慮不同大小 但是這樣還是有極限
除非 3x3, 4x4, 5x5, 6x6, ...所有大小都有
3. Laplacian Pyramid/Gaussian Pyramid: 傳統的CV技術 不過跟CNN好像沒有很合?
4. Pooling: 把不同大小都pooling到一樣大小, 例如ROI pooling, 這我不知道算不算?
可是我覺得其實這只是計算方便 沒有讓他真的對不同尺度都有優化到?
小弟才疏學淺 還請各位先進補充補充
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.77.18 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1564577111.A.D3E.html
※ 編輯: PyTorch (140.112.150.97 臺灣), 07/31/2019 21:12:39
→
08/01 09:24,
5年前
, 1F
08/01 09:24, 1F
→
08/01 09:25,
5年前
, 2F
08/01 09:25, 2F
→
08/01 13:50,
5年前
, 3F
08/01 13:50, 3F
→
08/01 13:50,
5年前
, 4F
08/01 13:50, 4F
→
08/01 13:51,
5年前
, 5F
08/01 13:51, 5F
→
08/02 08:27,
5年前
, 6F
08/02 08:27, 6F
→
08/02 08:27,
5年前
, 7F
08/02 08:27, 7F
推
08/02 19:33,
5年前
, 8F
08/02 19:33, 8F
→
08/02 19:33,
5年前
, 9F
08/02 19:33, 9F
→
08/02 19:33,
5年前
, 10F
08/02 19:33, 10F
→
08/02 19:33,
5年前
, 11F
08/02 19:33, 11F
→
08/02 19:33,
5年前
, 12F
08/02 19:33, 12F
推
08/04 15:02,
5年前
, 13F
08/04 15:02, 13F
→
08/04 15:04,
5年前
, 14F
08/04 15:04, 14F
推
08/09 00:08,
5年前
, 15F
08/09 00:08, 15F
DataScience 近期熱門文章
PTT數位生活區 即時熱門文章