[問題] 驗證集資料評估

看板DataScience作者 (波)時間4年前 (2020/06/21 20:35), 編輯推噓6(6034)
留言40則, 8人參與, 4年前最新討論串1/1
問題類別:CNN 使用工具:tensorflow,keras 問題內容: 最近在用CNN來判斷如下圖所示(示意圖) 如果紅圈壓到藍色區塊則辨識為NG, 反之則正常 https://i.imgur.com/M9xOoAi.jpg
分類輸出就兩類,一個NG,另一個OK 原始資料集圖片數量NG 30張,ok 10張 我透過圖像擴增的方式將圖片增加到6萬張(兩類數量各半) 然後拆分80%訓練集 10%驗證集 10%驗證集 CNN架構以下面acc及loss數據表 我只有搭一層卷積(filter=64)和池化層 接一個隱藏層(60個神經元)和輸出(2個) 在輸出成前面有加個BN層做正規化 跑出來的結果可以看到訓練集資料都蠻穩定成長 但驗證集的成長幅度很不穩定 https://i.imgur.com/NtU94Ui.jpg
之前也有嘗試使用VGG16之類的模型結構 也有自己嘗試搭2~3層的卷積層 可是效果也不太理想 去請教別別人是說可能模型太深 所以這次我用一層的卷積及池化作嘗試 但感覺還是不太理想 想請問大家遇到這種情況可能的原因是什麼? 好讓我有個方向嘗試改善, 最近種感覺就單純隨便在try參數及模型架構 但結果都很不理想,很茫然QAQ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.165.106.190 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1592742903.A.B2E.html

06/21 21:48, 4年前 , 1F
圖片那個有可能是模型太淺?請問後面是怎個不理想呢?
06/21 21:48, 1F

06/21 22:26, 4年前 , 2F
你的圖片顏色都長一樣嗎?這樣用NN模型應該很難train吧,
06/21 22:26, 2F

06/21 22:26, 4年前 , 3F
cnn跑完的特徵矩陣會太過接近,這種感覺可以用opencv處理
06/21 22:26, 3F

06/21 22:26, 4年前 , 4F
看看
06/21 22:26, 4F

06/21 22:27, 4年前 , 5F
用色階方式處理在判斷圖形之類的
06/21 22:27, 5F

06/21 22:29, 4年前 , 6F
驗證會這麼動盪感覺就是模型自己也不是很確定所以兩邊在
06/21 22:29, 6F

06/21 22:29, 4年前 , 7F
猜,要馬就猜對很高不然就一起猜錯
06/21 22:29, 7F

06/21 23:04, 4年前 , 8F
目前不確定是不是模型太淺的關係,之前有試過比較深的cn
06/21 23:04, 8F

06/21 23:04, 4年前 , 9F
n,但結果訓練集很快就收斂,最後測試集的混淆矩陣可以
06/21 23:04, 9F

06/21 23:04, 4年前 , 10F
看到沒有像訓練集的準確一樣高,結果就像下面這張圖
06/21 23:04, 10F

06/21 23:04, 4年前 , 11F

06/21 23:08, 4年前 , 12F
有可能喔,圖像擴增其實圖片背景顏色都差不多,我再嘗
06/21 23:08, 12F

06/21 23:08, 4年前 , 13F
試做一點其他顏色的圖片來訓練,謝謝你的建議,我再來
06/21 23:08, 13F

06/21 23:08, 4年前 , 14F
嘗試看看
06/21 23:08, 14F

06/21 23:11, 4年前 , 15F
opencv影像處理這類的問題我想應該沒問題,但這個研究
06/21 23:11, 15F

06/21 23:11, 4年前 , 16F
的內容得用AI的元素QAQ
06/21 23:11, 16F

06/22 01:23, 4年前 , 17F
為啥輸出是二維?
06/22 01:23, 17F

06/22 01:26, 4年前 , 18F
輸出一維然後loss用BCE試試
06/22 01:26, 18F

06/22 01:27, 4年前 , 19F
沒事
06/22 01:27, 19F

06/22 19:19, 4年前 , 20F
很有可能最後的flattern出來的特徵太過相似,其實你的
06/22 19:19, 20F

06/22 19:19, 4年前 , 21F
模型根本沒學到真正細部的特徵,用opencv同階色化 crop
06/22 19:19, 21F

06/22 19:19, 4年前 , 22F
到你想要的部份在去train,或是直接轉換任務為相似度比
06/22 19:19, 22F

06/22 19:19, 4年前 , 23F
對問題,在去做訓練。
06/22 19:19, 23F

06/22 21:17, 4年前 , 24F
用2D的卷積層,輸出張量是3D的應該沒錯(高、寬、channe
06/22 21:17, 24F

06/22 21:17, 4年前 , 25F
l)
06/22 21:17, 25F

06/22 21:22, 4年前 , 26F
好,謝謝您的建議,我先去了解一下關於您的建議再去做
06/22 21:22, 26F

06/22 21:22, 4年前 , 27F
嘗試,謝謝
06/22 21:22, 27F

06/24 16:23, 4年前 , 28F
我覺得你需要來個1x1 conv
06/24 16:23, 28F

06/24 23:59, 4年前 , 29F
好,會嘗試看看 謝謝你!
06/24 23:59, 29F

06/25 19:52, 4年前 , 30F
我注意到你給的圖片上loss不是binary_crossentropy
06/25 19:52, 30F

06/25 19:53, 4年前 , 31F
有用過binary的試試看嗎?
06/25 19:53, 31F

06/26 01:26, 4年前 , 32F
最ㄧ開始我也有用過binary後來才改用categorical狀況好
06/26 01:26, 32F

06/26 01:26, 4年前 , 33F
像也沒改善,之後再測測看
06/26 01:26, 33F

06/29 14:00, 4年前 , 34F
機械手臂擺放晶圓 wafer 的異常偏移偵測?
06/29 14:00, 34F

06/30 16:19, 4年前 , 35F
把BN拿掉看看
06/30 16:19, 35F

06/30 21:29, 4年前 , 36F
p大 不是,是類似判斷孔洞鑽孔是否正常的瑕疵檢測
06/30 21:29, 36F

06/30 21:33, 4年前 , 37F
q大 有試著拿掉看看,但如果網路太深發現訓練結果都會
06/30 21:33, 37F

06/30 21:33, 4年前 , 38F
集中在pass,也有試過比較淺的,只是準確率也差不多在50
06/30 21:33, 38F

06/30 21:33, 4年前 , 39F
左右,目前在嘗試研究透過opencv對圖像做些處理再進行訓
06/30 21:33, 39F

06/30 21:33, 4年前 , 40F
練,之前都是丟原圖直接下去做模型訓練
06/30 21:33, 40F
文章代碼(AID): #1UxrFtik (DataScience)
文章代碼(AID): #1UxrFtik (DataScience)