[問題] 實用上CNN怎麼解決不同影像大小問題

看板DataScience作者 (j-aids)時間6年前 (2018/05/30 06:08), 編輯推噓7(708)
留言15則, 9人參與, 6年前最新討論串1/1
網路上有些別人寫好的網站,可以上傳圖片就即時幫你用神經網路做出處理後的成果 譬如Waifu2x等 但是他們通常沒有規定死輸入影像的長寬pixels 自己做作業是都要固定輸入影像大小如512*512 才能吐output 因為convolution NN就是按input影像大小去寫死filter size跟padding的 請問實用上CNN是怎麼解決input影像大小可能不固定的問題呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.25.187 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1527631724.A.A2B.html

05/30 07:23, 6年前 , 1F
spatial pyramid pooling或global average pooling
05/30 07:23, 1F

05/30 07:23, 6年前 , 2F
可以參考看看
05/30 07:23, 2F

05/30 07:37, 6年前 , 3F
不想resize input的話就不要用inner product
05/30 07:37, 3F

05/30 08:51, 6年前 , 4F
推一樓
05/30 08:51, 4F

05/30 20:49, 6年前 , 5F
通常就直接resize 看是bicubic還是內插什麼的就看人
05/30 20:49, 5F

05/30 23:06, 6年前 , 6F
resize不會把一些小特徵消掉嗎?有些像病徵 瑕疵不是
05/30 23:06, 6F

05/30 23:07, 6年前 , 7F
都才幾個pixel
05/30 23:07, 7F

05/31 01:48, 6年前 , 8F
建議直接去看R-CNN, Yolo or SSD這種物件追蹤的相關Paper
05/31 01:48, 8F

05/31 01:49, 6年前 , 9F
你提的這個問題,沒有很簡單效能又好的方法
05/31 01:49, 9F

05/31 01:50, 6年前 , 10F
影像的物件偵測也算是一個特殊獨門技術,並不是很容易
05/31 01:50, 10F

05/31 01:52, 6年前 , 11F
同時要考慮到影像的變形以及大小問題,本來就是不容易啊
05/31 01:52, 11F

06/03 19:45, 6年前 , 12F
訓練的時候每個epoch隨機改變輸入圖片的大小,參考YOLOV2
06/03 19:45, 12F

06/07 15:30, 6年前 , 13F
1樓的那個比較接近要擷取不同大小範圍的特徵吧?
06/07 15:30, 13F

06/10 08:48, 6年前 , 14F
限制大小是因為最後有full connect才要限制吧
06/10 08:48, 14F

06/10 08:49, 6年前 , 15F
如果你的網路是FCN就沒問題啦
06/10 08:49, 15F
文章代碼(AID): #1R3Szieh (DataScience)
文章代碼(AID): #1R3Szieh (DataScience)