[問題] autoencoder train不起來

看板DataScience作者NDEJG (NDE)時間3年前 (2022/08/24 05:57)推噓0(0推 0噓 18→)

留言18則, 2人參與討論串1/1

作業系統: win10 問題類別: DL 使用工具: Keras in TF2 問題內容: 嘗試建一個autoencoder 來reconstruct輸入的影像，結果ouput 出來幾乎都是0，224個 channels 裡只有兩個不是全0的影像，那兩個不是全0的影像也完全不像輸入的影像，就兩個亮點。把每一層輸出抓出來看，發現有幾層的feature map全部都是0，其他層約有55 %的 feature map全部都是0。google不太到類似經驗，希望來板上取得靈感Q_Q model訓練好後希望看每層feature map長怎樣，尤其是想看哪些channel沒什麼貢獻，所以想保留影像的shape。 input: 從大張的影像隨機切36x36x224的植物影像，其中224個channels 都是從0-1，代表反射率，大部分的pixel 值小於0.5，因為想保留物理意義且全部的值都在0-1之間所以沒額外做 normalization。validation 跟testing 時用固定的影像。 model1: eocoder decoder各三層，encoder三層都用keras的conv2D，filter數量都是224，kernel size都是3，stride都是1，activation function 都是relu，padding=same。decoder就把conv2Dtranspose 回來。 loss function 是mse model2: 一樣架構，但把activation function 換成leakyrelu，最後一層的activation function 換成tanh（我看李宏毅老師的作業這樣改我就無腦跟著改） model3: 一樣架構，鑒於model2也失敗，覺得leakyrelu可能沒差，於是改回relu。仔細想了一下t anh的ouput是-1到1，但影像都是0-1，所以最後一層改用sigmoid，還是失敗。訓練參數： learning rate 0.001, 0.01, 0.05, 0.1（試了四組都train不起來） optimization Adam epoch 3以後每個epoch的validation loss都一樣，代表model大概沒在動。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 98.223.102.101 (美國) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1661291830.A.5D3.html

→

yoyololicon

08/24 15:34, 3年前 , 1^F

08/24 15:34, 1^F

→

yoyololicon

08/24 15:38, 3年前 , 2^F

08/24 15:38, 2^F

我想看有沒有channel 會被autoencoder drop掉，然後想看model對不同波段做了什麼事

→

yoyololicon

08/24 15:39, 3年前 , 3^F

08/24 15:39, 3^F

→

yoyololicon

08/24 15:39, 3年前 , 4^F

08/24 15:39, 4^F

code是公司ml工程師寫的，我改了一點以後兩個一起檢查過了應該沒問題。

→

chang1248w

08/24 18:20, 3年前 , 5^F

08/24 18:20, 5^F

→

chang1248w

08/24 18:20, 3年前 , 6^F

08/24 18:20, 6^F

我們的相機是特殊的相機，本身就有224個波段，我只是切個36x36pixel下來

→

chang1248w

08/24 18:21, 3年前 , 7^F

08/24 18:21, 7^F

→

chang1248w

08/24 18:21, 3年前 , 8^F

08/24 18:21, 8^F

--- 因為資料是美國管制資料所以我不能拍照也不能截圖QQ ※ 編輯: NDEJG (98.223.102.101 美國), 08/24/2022 21:51:18

→

chang1248w

08/24 23:00, 3年前 , 9^F

08/24 23:00, 9^F

→

chang1248w

08/24 23:05, 3年前 , 10^F

08/24 23:05, 10^F

→

chang1248w

08/24 23:05, 3年前 , 11^F

08/24 23:05, 11^F

→

chang1248w

08/24 23:05, 3年前 , 12^F

08/24 23:05, 12^F

→

chang1248w

08/24 23:11, 3年前 , 13^F

08/24 23:11, 13^F

→

chang1248w

08/24 23:44, 3年前 , 14^F

08/24 23:44, 14^F

更新：把最後一層activation function 改成linear就有不錯成果了，另外我誤會keras conv2D 做的事了，即使filter size跟channels 一樣多每個filter也還是從多個channel去取fea ture ，不過從每層feature看來有一部分的feature map還是全部都0，filter數量應該夠，有錯請指正 ※ 編輯: NDEJG (128.210.107.88 美國), 08/25/2022 00:53:04

→

chang1248w

08/25 09:42, 3年前 , 15^F

08/25 09:42, 15^F

→

chang1248w

08/25 09:43, 3年前 , 16^F

08/25 09:43, 16^F

→

chang1248w

08/25 09:45, 3年前 , 17^F

08/25 09:45, 17^F