[問題] yolov3觀念請益

看板DataScience作者 (潤)時間4年前 (2020/04/19 22:23), 編輯推噓0(002)
留言2則, 2人參與, 4年前最新討論串1/1
各位大大好,小弟最近在讀CNN和yolov3 在看完論文後,有一些觀念不太確定對不對 想請版友糾正: 1.訓練時我們其實在訓練的是每一層的卷積核,也就是所謂的filter(kernel),讓卷積網 路在實際應用時,可以透過這些核得到最大的響應(乘積),請問這樣理解對嗎? 2.在「訓練」時,物件中心(GT中心)的網格負責預測,而網路學習預測bounding box的 偏移量。根據論文可知v3會在三個尺度上做預測,我想請問的是,在「預測未知的圖片」 ,也就是不是訓練期的時候,是透過darknet-53這個feature extractor卷積後,在三個 尺度(8*8、16*16、32*32)的「每一個網格」直接輸出它所預測的偏移量、置信度、類 別機率嗎? 抱歉第二個問題有點長,主要是想釐清「訓練」跟「推論」階段的一些程序,希望可以為 小弟解答,謝謝各位! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.194.189.232 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1587306236.A.79E.html

04/20 00:20, 4年前 , 1F
1、2都是,沒錯
04/20 00:20, 1F

04/20 18:58, 4年前 , 2F
了解 謝謝您!
04/20 18:58, 2F
文章代碼(AID): #1Ud5xyUU (DataScience)
文章代碼(AID): #1Ud5xyUU (DataScience)