Re: [問題] 全捲積網路(FCN) 在YOLOV2上訓練的問題

看板DataScience作者 (...無言...)時間5年前 (2019/07/09 17:52), 編輯推噓8(8019)
留言27則, 5人參與, 5年前最新討論串4/4 (看更多)
謝謝各位熱心的版友,版友們保貴的意見,讓我順利的教會yolo v2、v3, 如何辨識出車牌。 目前,我手邊使用Openalpr,用來在console底下, 針對picture或是video中每個frame,逐一解析出車牌「號碼」。 是否有版友們知道:如何將yolo v3和openalpr,一起結合。 使得一支video中,能同時「認得車牌」,也能同時「解析出車牌『號碼』」。 類似這樣的結果: https://www.youtube.com/watch?v=I6gIB7pfzwg
或是 https://www.youtube.com/watch?v=DCh9RTM7fqU
再次謝謝熱心的版友。 在這邊要特別跟jasonwu23說謝謝,感謝他熱心的指導! ※ 引述《fsvy (...無言...)》之銘言: : 借著這篇,想向版友們請益: : 我弄了一個星期的yolov2,試著教會machine辮識車牌。 : 然而,得到的weights檔,跑出的結果,框了整個銀幕(即:亂框)。 : 我遇到的問題,和這個描述非常相近: : http://keep.01ue.com/?pi=960547&_a=crawl&_c=index&_m=p : 想請問懂這部份的版友們,是否能提供意見呢? : 另外,是否有已經養好的辨識車牌的weights檔、cfg檔能提供,我想試試?(不妥會自刪) : 若是有不方便在版上提的事宜,歡迎站內信給我。 : 謝謝各位熱心的版友。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 60.248.187.109 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1562665920.A.B3E.html

07/09 18:33, 5年前 , 1F
就是很單純的先擷取出車牌,再把車牌影像餵進去就好了
07/09 18:33, 1F

07/09 18:34, 5年前 , 2F
另外 openalpr 的效果我覺得不怎麼樣
07/09 18:34, 2F

07/09 20:25, 5年前 , 3F
訓練yolo model,辨認0~9和A~Z和車牌共37類物體
07/09 20:25, 3F

07/09 20:25, 5年前 , 4F
就不需要別的工具了
07/09 20:25, 4F

07/10 17:52, 5年前 , 5F
請教jack大,如果openalpr不怎麼樣,有推薦其它的OCR嗎?
07/10 17:52, 5F

07/10 18:18, 5年前 , 6F
用yolo啊,蠻多論文都這樣做的
07/10 18:18, 6F

07/11 11:19, 5年前 , 7F
yolo是detection,不是recognition噢!yolo只能認車牌(物件)
07/11 11:19, 7F

07/11 11:19, 5年前 , 8F
無法解析出圖中的文字,圖中的文字要靠OCR解析。
07/11 11:19, 8F

07/11 12:27, 5年前 , 9F
直接用detection 做OCR啊XD
07/11 12:27, 9F

07/11 12:28, 5年前 , 10F
也就24個英文(扣掉i跟o)加十個數字而已
07/11 12:28, 10F

07/11 21:02, 5年前 , 11F
把字母A當成一種物件,B是一種物件,CDE...依此類推
07/11 21:02, 11F

07/11 22:58, 5年前 , 12F
建議還是crop出車牌後,可以用crnn或是attention base
07/11 22:58, 12F

07/11 22:58, 5年前 , 13F
的model加上CTC,這樣比較好學習到序列的問題
07/11 22:58, 13F

07/12 21:44, 5年前 , 14F
建議不要直接暴力 yolo recognition....
07/12 21:44, 14F

07/13 19:33, 5年前 , 15F
請問sxy大,可是車牌號碼字母是隨機的,不像英文
07/13 19:33, 15F

07/13 19:35, 5年前 , 16F
單字的字母有特定順序。這樣crnn能學到車牌的序列嗎?
07/13 19:35, 16F

07/13 19:48, 5年前 , 17F
可以 而且效果還蠻好的
07/13 19:48, 17F

07/13 19:49, 5年前 , 18F
不過目前做起來跟用detection 效果差不多
07/13 19:49, 18F

07/14 00:42, 5年前 , 19F
CRNN考慮的是圖像的序列,不是英文字母之間的序列,可以
07/14 00:42, 19F

07/14 00:42, 5年前 , 20F
想像就是在做圖像版的語音辨識,所以會有序列長度不一致
07/14 00:42, 20F

07/14 00:42, 5年前 , 21F
的問題,所以才要加上CTC
07/14 00:42, 21F

07/14 01:17, 5年前 , 22F
另外也可以用attention based的model,可以找一下論文,
07/14 01:17, 22F

07/14 01:17, 5年前 , 23F
他有引入一個spatial attention的方法,做街牌識別,效
07/14 01:17, 23F

07/14 01:17, 5年前 , 24F
果比原始crnn還好一些。另外還有一些很新的從檢測到識別
07/14 01:17, 24F

07/14 01:17, 5年前 , 25F
完全端對端架構的架構,把detection跟recognition 的卷
07/14 01:17, 25F

07/14 01:17, 5年前 , 26F
積共享,至於成效可以去找相關paper。
07/14 01:17, 26F

07/14 19:47, 5年前 , 27F
謝謝jack大和sxy大的回覆,我再研究研究
07/14 19:47, 27F
文章代碼(AID): #1T96F0i- (DataScience)
文章代碼(AID): #1T96F0i- (DataScience)