[問題] 關於模型訓練時的影像輸入大小

看板DataScience作者 (再一次)時間9月前 (2024/04/25 22:07), 編輯推噓4(4029)
留言33則, 4人參與, 9月前最新討論串1/1
最近在做些影響辨識的實作想到的一個問題 一般影像辨識網路像是ResNet的架構都有固定的輸入尺寸,常見的影像大小大概就256*256 這種等級的尺寸 但是現今的圖片大小應該不太可能這麼小吧? 如果以真實世界的影像來說,要輸入這類的網路勢必就要做resize的動作 但是將圖片任意resize不是相對的也可能會遺失一些資訊嗎? 如果是1024*1024調整成256*256,這就直接小了16倍欸 一般的貓狗辨識可能不會有太大問題,但如果今天是醫學影像的話,這些遺失資訊搞不好就 是對疾病很重要的特徵 還是說這種情況可以直接把輸入尺寸打掉重練,按照原始架構重新手刻一個網路然後調整每 層的維度以適應新的輸入? 目前有想到另一個方法,使用像Unet那種多尺度的方式來做,不知道這可不可行? 有爬了一些文但好像都沒有看到類似的應用或文章,所以上來請教大家 感謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.82.188.41 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1714054023.A.736.html

04/26 02:12, 9月前 , 1F
我不知道你有多寬,先假設你胸腔是100cmx50cm的巨無
04/26 02:12, 1F

04/26 02:12, 9月前 , 2F
霸尺寸好了
04/26 02:12, 2F

04/26 02:15, 9月前 , 3F
0.1cm的解析度掃出來的圖像也才1000x500而已喔
04/26 02:15, 3F

04/26 02:21, 9月前 , 4F
比起解析度,患者呼吸或顯影劑的影響更大一些,一般
04/26 02:21, 4F

04/26 02:21, 9月前 , 5F
比一公分小的腫瘤醫生要認出來就要憑運氣了
04/26 02:21, 5F

04/26 02:26, 9月前 , 6F
至於模型,主流的大小是384或224,但是上至512或768
04/26 02:26, 6F

04/26 02:26, 9月前 , 7F
的也大有人在,另外transformer 是不受輸入大小影響
04/26 02:26, 7F

04/26 02:26, 9月前 , 8F
04/26 02:26, 8F

04/26 02:27, 9月前 , 9F
受限的只有你的荷包
04/26 02:27, 9F

04/26 02:46, 9月前 , 10F
文獻的話
04/26 02:46, 10F

04/26 02:46, 9月前 , 11F
04/26 02:46, 11F

04/26 02:46, 9月前 , 12F
這篇探討解析度對判症的影響
04/26 02:46, 12F

04/26 02:50, 9月前 , 13F
如果你說分類任務不夠好啦,那也有做結核病輔助圈選
04/26 02:50, 13F

04/26 02:55, 9月前 , 14F
啊 野雞刊
04/26 02:55, 14F

04/26 03:04, 9月前 , 15F
04/26 03:04, 15F

04/26 03:10, 9月前 , 16F
分類確實有保持在原始尺寸,在512做的傾向
04/26 03:10, 16F

04/26 03:12, 9月前 , 17F
你與其擔心單張圖片的解析度,不如擔心第三個維度帶
04/26 03:12, 17F

04/26 03:12, 9月前 , 18F
來的尺寸問題
04/26 03:12, 18F

04/26 03:14, 9月前 , 19F
這篇survey 做在vit剛問世後幾個月,所以沒有包含相
04/26 03:14, 19F

04/26 03:14, 9月前 , 20F
關技術
04/26 03:14, 20F

04/26 03:26, 9月前 , 21F
超高解析度收受的只有高頻紋理和比較小的物件,這部
04/26 03:26, 21F

04/26 03:26, 9月前 , 22F
分分割比較常出現
04/26 03:26, 22F

04/26 03:29, 9月前 , 23F
你想找input size free的模型,現在就是transformer
04/26 03:29, 23F

04/26 03:29, 9月前 , 24F
之前continuous kernel之類的工作多半和他們本身一樣
04/26 03:29, 24F

04/26 03:29, 9月前 , 25F
冷僻
04/26 03:29, 25F

04/26 15:14, 9月前 , 26F
之前也有想過這個問題 但是看到模型裡一大堆的maxpo
04/26 15:14, 26F

04/26 15:14, 9月前 , 27F
ol層之後就覺得 應該沒想像中嚴重
04/26 15:14, 27F

04/26 15:15, 9月前 , 28F
另外一樓好專業
04/26 15:15, 28F

04/28 07:50, 9月前 , 29F
用crop保持元解析度預測,再把每個slice結果組合回來就
04/28 07:50, 29F

04/28 07:50, 9月前 , 30F
04/28 07:50, 30F

04/28 18:36, 9月前 , 31F
樓上這樣要不要再加一組resize縮小的方便捕捉較大的
04/28 18:36, 31F

04/28 18:36, 9月前 , 32F
物體?
04/28 18:36, 32F

04/30 15:30, 9月前 , 33F
樓上如果分類任務的話可以做多尺度特徵
04/30 15:30, 33F
文章代碼(AID): #1cAcE7Ss (DataScience)
文章代碼(AID): #1cAcE7Ss (DataScience)