Re: [問題] 關於CNN架構設計及GAN的epoch設計

看板DataScience作者 (love!)時間6年前 (2018/06/11 05:11), 編輯推噓2(204)
留言6則, 1人參與, 6年前最新討論串2/2 (看更多)
※ 引述《arch2453 (玖月)》之銘言: : 系統:win10 : 問題:CNN,GAN : 環境:python+jupyter notebook+Keras : 各位前輩們好 : 因為沒在學校修過正規課 : 平常是看網路教學影片和看書實作 : 所以有一些不懂的地方想在這裡向前輩們請教 : 1. : 關於GAN實作 : 我是參考CycleGAN的論文及程式 : 實現圖片的轉換 : 較有名的例子是風景變畫或是斑馬變馬 : 想請問的是Epoch該如何設定會比較好 : 我目前是固定設定epoch 200 : 但怎麼確定前面就已經能產生很好的圖片 : 或是在訓練更多次效果會更好 : 想請問除了用人眼觀測外 : 還有其他比較好說服人的方法嗎? : 因為不像普通的分類可以使用early stop的方式 風格轉換的評價方式要嘛用肉眼看,要嘛看 loss (設計良好的話) 你可以在 validation 的時候輸出成圖片存起來 那前面好不好用看的就知道了 可以每隔 10 個 epoch 存一次,loss 曲線挑最低點看輸出結果 : 2. : 在實作CNN的時候 : 我做的是辨識128x128大小圖片 : 架構放了三層的convolution 層 : 但老師質疑為什麼不放更多層 : 我回答我有嘗試了四層但效果下降 : 老師卻繼續質疑那可以在放更多到四五層看看 : 或是乾脆直接用別人現有VGG的19層 : 而不該使用最簡單的範例model : 想請問的是像這些參數: : 如層數,filter大小,neuron數的設計 : 有一定的合理理由嗎 : 還是只能try & error : 比如老師問我FC為什麼要放1000 : 像這種問題我都覺得很難回答QQ : 這些變數的組合實在是太多了Orz : 謝謝大家 多看別人的 paper 看他們怎麼設計架構 通常都是一些觀察和發想以後就會設計實驗,然後用實驗結果證明這想法是對的 所以大部分人都是看實驗結果說話的 還有一部分的人是直接用數學證明為什麼要這樣設計 總之,有(前人的)經驗以後就可以憑感覺調參,或是 grid search ASL dataset 我不熟 通常是可以 transfer learning 的情況下就可以使用用途相似的模型 所以不一定只能從引用那篇 paper 裡面找出 CNN,用途相似的也能找看看 至於 FC 為什麼要放 1000 這種問題 你可以實驗個幾次以後製成表格再報告給你老師聽 他看到你 500, 1000, 2000, 3000... 都跑過了,通常也沒啥好問的了 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.239.65.157 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1528665099.A.A9C.html

06/11 23:26, 6年前 , 1F
首先謝謝你給了這麼多的回應,的確GAN那裡我是每10epoch
06/11 23:26, 1F

06/11 23:26, 6年前 , 2F
存一次模型,但只有實作注意過Loss的變化!
06/11 23:26, 2F

06/11 23:31, 6年前 , 3F
另外,我只能看結果說話數學大概無法Orz,其實我有嘗試
06/11 23:31, 3F

06/11 23:31, 6年前 , 4F
過500,1000,1280,1500,2500,4096,但還是被問那為
06/11 23:31, 4F

06/11 23:31, 6年前 , 5F
什麼我最後選的是最好,而且因為最後FC兜兩層,組合又
06/11 23:31, 5F

06/11 23:31, 6年前 , 6F
更多了QQ
06/11 23:31, 6F
文章代碼(AID): #1R7PGBgS (DataScience)
文章代碼(AID): #1R7PGBgS (DataScience)