[問題] 關於模型訓練時的影像輸入大小
最近在做些影響辨識的實作想到的一個問題
一般影像辨識網路像是ResNet的架構都有固定的輸入尺寸,常見的影像大小大概就256*256
這種等級的尺寸
但是現今的圖片大小應該不太可能這麼小吧?
如果以真實世界的影像來說,要輸入這類的網路勢必就要做resize的動作
但是將圖片任意resize不是相對的也可能會遺失一些資訊嗎?
如果是1024*1024調整成256*256,這就直接小了16倍欸
一般的貓狗辨識可能不會有太大問題,但如果今天是醫學影像的話,這些遺失資訊搞不好就
是對疾病很重要的特徵
還是說這種情況可以直接把輸入尺寸打掉重練,按照原始架構重新手刻一個網路然後調整每
層的維度以適應新的輸入?
目前有想到另一個方法,使用像Unet那種多尺度的方式來做,不知道這可不可行?
有爬了一些文但好像都沒有看到類似的應用或文章,所以上來請教大家
感謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.82.188.41 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1714054023.A.736.html
推
04/26 02:12,
9月前
, 1F
04/26 02:12, 1F
→
04/26 02:12,
9月前
, 2F
04/26 02:12, 2F
→
04/26 02:15,
9月前
, 3F
04/26 02:15, 3F
→
04/26 02:21,
9月前
, 4F
04/26 02:21, 4F
→
04/26 02:21,
9月前
, 5F
04/26 02:21, 5F
→
04/26 02:26,
9月前
, 6F
04/26 02:26, 6F
→
04/26 02:26,
9月前
, 7F
04/26 02:26, 7F
→
04/26 02:26,
9月前
, 8F
04/26 02:26, 8F
→
04/26 02:27,
9月前
, 9F
04/26 02:27, 9F
→
04/26 02:46,
9月前
, 10F
04/26 02:46, 10F
→
04/26 02:46,
9月前
, 11F
04/26 02:46, 11F
→
04/26 02:46,
9月前
, 12F
04/26 02:46, 12F
→
04/26 02:50,
9月前
, 13F
04/26 02:50, 13F
→
04/26 02:55,
9月前
, 14F
04/26 02:55, 14F
推
04/26 03:04,
9月前
, 15F
04/26 03:04, 15F
→
04/26 03:10,
9月前
, 16F
04/26 03:10, 16F
→
04/26 03:12,
9月前
, 17F
04/26 03:12, 17F
→
04/26 03:12,
9月前
, 18F
04/26 03:12, 18F
→
04/26 03:14,
9月前
, 19F
04/26 03:14, 19F
→
04/26 03:14,
9月前
, 20F
04/26 03:14, 20F
→
04/26 03:26,
9月前
, 21F
04/26 03:26, 21F
→
04/26 03:26,
9月前
, 22F
04/26 03:26, 22F
→
04/26 03:29,
9月前
, 23F
04/26 03:29, 23F
→
04/26 03:29,
9月前
, 24F
04/26 03:29, 24F
→
04/26 03:29,
9月前
, 25F
04/26 03:29, 25F
推
04/26 15:14,
9月前
, 26F
04/26 15:14, 26F
→
04/26 15:14,
9月前
, 27F
04/26 15:14, 27F
→
04/26 15:15,
9月前
, 28F
04/26 15:15, 28F
→
04/28 07:50,
9月前
, 29F
04/28 07:50, 29F
→
04/28 07:50,
9月前
, 30F
04/28 07:50, 30F
推
04/28 18:36,
9月前
, 31F
04/28 18:36, 31F
→
04/28 18:36,
9月前
, 32F
04/28 18:36, 32F
→
04/30 15:30,
9月前
, 33F
04/30 15:30, 33F
DataScience 近期熱門文章
PTT數位生活區 即時熱門文章