[問題] yolov3觀念請益
各位大大好,小弟最近在讀CNN和yolov3
在看完論文後,有一些觀念不太確定對不對
想請版友糾正:
1.訓練時我們其實在訓練的是每一層的卷積核,也就是所謂的filter(kernel),讓卷積網
路在實際應用時,可以透過這些核得到最大的響應(乘積),請問這樣理解對嗎?
2.在「訓練」時,物件中心(GT中心)的網格負責預測,而網路學習預測bounding box的
偏移量。根據論文可知v3會在三個尺度上做預測,我想請問的是,在「預測未知的圖片」
,也就是不是訓練期的時候,是透過darknet-53這個feature extractor卷積後,在三個
尺度(8*8、16*16、32*32)的「每一個網格」直接輸出它所預測的偏移量、置信度、類
別機率嗎?
抱歉第二個問題有點長,主要是想釐清「訓練」跟「推論」階段的一些程序,希望可以為
小弟解答,謝謝各位!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.194.189.232 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1587306236.A.79E.html
→
04/20 00:20,
4年前
, 1F
04/20 00:20, 1F
→
04/20 18:58,
4年前
, 2F
04/20 18:58, 2F
DataScience 近期熱門文章
PTT數位生活區 即時熱門文章