PTT數位生活區 / DataScience

Re: [問題] 全捲積網路(FCN) 在YOLOV2上訓練的問題

看板DataScience作者ching0629 (Syameroke)時間7年前 (2018/04/17 13:06)推噓4(4推 0噓 8→)

留言12則, 4人參與討論串2/4 (看更多)

我覺得可能很多人並不懂卷積網路的基本概念，舉例來說，原始yolo可以接受的input size應該是32的倍數，而不是13的倍數... 卷積網路在運算過程中經常會有pooling(或是現在比較喜歡用步輻為2的卷積器)做下採樣，原則上yolo所提出的概念是使用任意結構的網路皆可以進行目標檢測，而他厲害的地方是它訂出了一個output結構讓網路可以根據這個output來進行目標檢測在講yolo2之前我們先講yolo，原始yolo版本的輸出是對最後一層的每個像素(也就是前面一直提到的13*13，但原始yolo的output是7*7)做一次預測，而預測內容包含： 1. 2個最有可能的物件框，參數包含 (1) 0~1的機率描述是否存在非背景物體 (2) 物件框的相對x座標(以該範圍的百分比定義) (3) 物件框的相對y座標(以該範圍的百分比定義) (4) 物件框的相對寬度 (以n倍的原始範圍定義，如一個最終終像素在yolo中對應的是32*32個原始像素，所以這個數字為2代表對應到原來64的範圍) (5) 物件框的相對長度以上共有10個output。 2. 可能的類別數，描述這個框所框到的東西是甚麼，一樣輸出0~1之間的機率(一般後面這些output會經過softmax) 有了這個概念後，假定有一個32*32的輸入圖像，這樣最終特徵圖就是1*1，那yolo就是輸出2個可能的方框供人參考，而假設原始輸入圖像是320*320，那就會輸出200個可能的方框而yolo2和yolo的差別在，yolo是使用像素作為預測，如果有一個物件他大小接近整張圖，這樣一個32*32的範圍會預測的好也是滿奇怪的，所以精準度不夠，因此yolo2先使用一些clustering的方式先找出訓練集的方框大概都在哪，然後制定出ROI，並進行ROI pooling再做預測。除此之外，作者在訓練yolo2時，為了讓他能適應各種大小的物件，因此每10代會將所有圖片及相對應的label調整為一個任意32的倍數，用這種類似data augmentation訓練網路。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 210.60.122.10 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1523941600.A.9DA.html

→

04/17 13:09, 7年前 , 1^F

04/17 13:09, 1^F

→

04/17 13:09, 7年前 , 2^F

04/17 13:09, 2^F

→

04/17 13:10, 7年前 , 3^F

04/17 13:10, 3^F

推

04/17 16:41, 7年前 , 4^F

04/17 16:41, 4^F

→

04/17 16:41, 7年前 , 5^F

04/17 16:41, 5^F

推

04/17 16:43, 7年前 , 6^F

04/17 16:43, 6^F

→

04/17 16:43, 7年前 , 7^F

04/17 16:43, 7^F

→

04/17 16:43, 7年前 , 8^F

04/17 16:43, 8^F

→

04/17 16:44, 7年前 , 9^F

04/17 16:44, 9^F

推

04/17 20:02, 7年前 , 10^F

04/17 20:02, 10^F

→

04/17 20:02, 7年前 , 11^F

04/17 20:02, 11^F

推

04/17 22:16, 7年前 , 12^F

04/17 22:16, 12^F

‣ 返回看板[ DataScience ] 研討

‣ 更多 ching0629 的文章

文章代碼(AID): #1QrO3WdQ (DataScience)

討論串 (同標題文章)

以下文章回應了本文：

1

7

Re: [問題] 全捲積網路(FCN) 在YOLOV2上訓練的問題

6年前, 07/04

完整討論串 (本文為第 2 之 4 篇)：

排序：最新先 | 最舊先 | 留言數

8

27

Re: [問題] 全捲積網路(FCN) 在YOLOV2上訓練的問題

6年前, 07/09

1

7

Re: [問題] 全捲積網路(FCN) 在YOLOV2上訓練的問題

6年前, 07/04

4

12

Re: [問題] 全捲積網路(FCN) 在YOLOV2上訓練的問題

7年前, 04/17

19

59

[問題] 全捲積網路(FCN) 在YOLOV2上訓練的問題

7年前, 04/16

在新視窗開啟完整討論串 (共4篇)

DataScience 近期熱門文章

2

6

[問題] 文字探勘的特徵選取問題

[ DataScience ]

1月前, 07/01

1

9

[問題] 請問kaggle有商業方案嗎? 它每週gpu的限

[ DataScience ]

5月前, 02/26

4

4

[徵才] 美國Amazon暑期實習生

[ DataScience ]

6月前, 01/23

1

6

[問題] 請教大家有推薦的GPU租用服務嗎?

[ DataScience ]

7月前, 12/20

3

8

[討論] 如何計算兩個不同欄的相似度？

[ DataScience ]

10月前, 09/07

1

4

Re: [問題] 如何在python中訓練好autoencoder?已刪文

[ DataScience ]

1年前, 08/06

2

12

[討論] 有人開始用KAN了嗎？

[ DataScience ]

1年前, 08/04

4

13

Re: [討論] cognitive model/causal ML執行的細節

[ DataScience ]

1年前, 05/15

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

3

8

[請益] CyberPower的UPS要推新品了嗎？

[ PC_Shopping ]

9小時前, 08/01

6

27

[請益] 請教AP/Mesh選擇

[ PC_Shopping ]

10小時前, 08/01

7

8

[賣/桃園/面交]9800X3D 5070ti 白主機

[ HardwareSale ]

10小時前, 08/01

5

10

[討論] 2025年智慧手機販售機種整理(20250801)

10小時前, 08/01

6

7

[心得] Final D8k DC Pro 日本入手

10小時前, 08/01

4

25

Re: [情報] NV將在明年10月起停止提供RTX系列的Win1

[ PC_Shopping ]

11小時前, 08/01

3

34

[菜單] 舊機升級請教

[ PC_Shopping ]

11小時前, 08/01

7

11

[情報] 超便宜ES9039小尾巴,快上車沒時間解釋了

11小時前, 08/01

更多即時熱門文章 >>

‣ 返回看板[ DataScience ] 研討

‣ 更多 ching0629 的文章

文章代碼(AID): #1QrO3WdQ (DataScience)