[問題] conv3D

看板DataScience作者 (波)時間4年前 (2020/04/03 04:18), 編輯推噓3(3016)
留言19則, 4人參與, 4年前最新討論串1/1
作業系統: win10 問題類別: Conv3D 使用工具: keras、tensorflow 問題內容: 最近在翻keras.io文件 看到conv input shape 目前練習的影像辨識圖片都是透過conv2D進行卷積 那如果透過3D攝影機擷取的影像多了縱深的維度是否透過conv3d進行卷積? 對於3d影像的維度其實不是很了解 想請問想法是否正確 或是有沒有一些透過3D影像分析的文章可供參考? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.235.118.45 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1585858737.A.C0E.html

04/03 13:13, 4年前 , 1F
一般影像是RGB三channel, 3d影像是RGBD四channel
04/03 13:13, 1F

04/03 13:14, 4年前 , 2F
只是多一個channel, 應該還是用conv2D
04/03 13:14, 2F

04/03 13:16, 4年前 , 3F
kaggle的文章 https://reurl.cc/E7r87A
04/03 13:16, 3F

04/03 15:14, 4年前 , 4F
3D通常是用來分析點雲圖或是CAD圖 而非影像
04/03 15:14, 4F

04/03 15:43, 4年前 , 5F
好 謝謝你們的回覆 會在多去了解!
04/03 15:43, 5F

04/04 01:45, 4年前 , 6F
我覺得決定要用哪種conv的重點是看你希望抽出來的feature是
04/04 01:45, 6F

04/04 01:45, 4年前 , 7F
幾D
04/04 01:45, 7F

04/04 01:45, 4年前 , 8F
醫學影像的3D,例如MRI或CT斷層掃出來就是真3D volume HxWx
04/04 01:45, 8F

04/04 01:45, 4年前 , 9F
D,這個時候因為預期的feature會是3D所以就很常用3D卷積保
04/04 01:45, 9F

04/04 01:45, 4年前 , 10F
留D軸的空間資訊
04/04 01:45, 10F

04/04 01:45, 4年前 , 11F
所以如果你覺得你的應用,第三軸的空間關係是重要feature的
04/04 01:45, 11F

04/04 01:45, 4年前 , 12F
話,使用3D卷積不是不行
04/04 01:45, 12F

04/04 01:45, 4年前 , 13F
順帶一提convXD的X代表的是輸出的shape是filter個X維度的X+
04/04 01:45, 13F

04/04 01:45, 4年前 , 14F
1維張量
04/04 01:45, 14F

04/04 01:45, 4年前 , 15F
像RGB影像做conv2D,kernel其實是3D的,第一層設定5x5 filt
04/04 01:45, 15F

04/04 01:45, 4年前 , 16F
er其實是5x5x3
04/04 01:45, 16F

04/04 01:45, 4年前 , 17F
舉例來說有些大量filter的conv層後面會有1x1卷積,意思是1x
04/04 01:45, 17F

04/04 01:45, 4年前 , 18F
1x256之類的把前面長太多的filter壓扁回來
04/04 01:45, 18F

04/22 21:46, 4年前 , 19F
好,謝謝你詳細的說明^^
04/22 21:46, 19F
文章代碼(AID): #1UXaYnmE (DataScience)
文章代碼(AID): #1UXaYnmE (DataScience)