[問題] 深度學習實踐問題
各位資料科學的先進好,我目前正在學校裡面學習深度學習相關的知識
目前是想自己寫出一個簡單的MLP來檢驗自己的學習
運用的架構是一層input layer,一層的hidden layer
最後一層是只有一個node的output layer
hidden layer的activation function是relu
output lyayer的activation function是sigmoid
除了output layer之外都有bias
跑起來程式上沒有問題,我的問題在於error收斂的很慢
error雖然一直往0在下降,但是幅度低的讓人難以接受
就我所知learning rate大概就是0.1 ~ 0.3這樣的值
因為這只是簡單的實踐,所以沒有使用learning rate decay的技巧
我已經將learning rate設為0.5了,error下降的速度還是很難讓人接受
想請問我的寫法是不是有哪邊錯了才導致這樣的結果呢?
這是我的code,最下面附上100個epoch訓練的error結果
https://pastebin.com/CTz4AkN5
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 108.12.49.245
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1541822859.A.5BF.html
推
11/10 12:26,
6年前
, 1F
11/10 12:26, 1F
推
11/10 12:29,
6年前
, 2F
11/10 12:29, 2F
推
11/10 13:57,
6年前
, 3F
11/10 13:57, 3F
→
11/10 13:57,
6年前
, 4F
11/10 13:57, 4F
→
11/10 13:58,
6年前
, 5F
11/10 13:58, 5F
→
11/10 14:03,
6年前
, 6F
11/10 14:03, 6F
→
11/10 14:03,
6年前
, 7F
11/10 14:03, 7F
→
11/10 14:06,
6年前
, 8F
11/10 14:06, 8F
→
11/10 14:06,
6年前
, 9F
11/10 14:06, 9F
推
11/10 15:29,
6年前
, 10F
11/10 15:29, 10F
→
11/10 15:29,
6年前
, 11F
11/10 15:29, 11F
推
11/10 15:51,
6年前
, 12F
11/10 15:51, 12F
→
11/10 15:51,
6年前
, 13F
11/10 15:51, 13F
→
11/10 15:51,
6年前
, 14F
11/10 15:51, 14F
推
11/10 17:34,
6年前
, 15F
11/10 17:34, 15F
→
11/10 17:34,
6年前
, 16F
11/10 17:34, 16F
推
11/18 14:52,
6年前
, 17F
11/18 14:52, 17F
討論串 (同標題文章)
DataScience 近期熱門文章
PTT數位生活區 即時熱門文章