[問題] 分類問題最後的softmax前要activation嗎?

看板DataScience作者Haikyuu (孔文革)時間7年前 (2018/04/23 21:07)推噓7(7推 0噓 12→)

留言19則, 9人參與討論串1/1

問題類別:DL 請問各位前輩在分類的NN例如CNN＋DNN 最後一層會接到softmax來map到0.0~1.0的output 那想請問最後一層(假設最後是DNN）(就是softmax前一層）後面還要加activation function嗎？有這個疑問是因為我想到softmax是用exponential 原本就有nonlinearity的作用前面再先經過activation function（例如reLU) 好像是多此一舉？而且可能會把更多information丟掉(譬如reLU把<0的丟掉）目前我自己實驗比較有加沒加在CNN實作上, 都是train的起來的 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.159.135 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1524488842.A.03F.html

→

truehero

04/23 21:33, 7年前 , 1^F

04/23 21:33, 1^F

推

bessgaga

04/23 22:15, 7年前 , 2^F

04/23 22:15, 2^F

→

bessgaga

04/23 22:15, 7年前 , 3^F

04/23 22:15, 3^F

→

TOEFLiBT100

04/23 22:26, 7年前 , 4^F

04/23 22:26, 4^F

→

TOEFLiBT100

04/23 22:26, 7年前 , 5^F

04/23 22:26, 5^F

推

EGsux

04/23 22:52, 7年前 , 6^F

04/23 22:52, 6^F

→

EGsux

04/23 22:52, 7年前 , 7^F

04/23 22:52, 7^F

推

yoyololicon

04/24 11:05, 7年前 , 8^F

04/24 11:05, 8^F

→

yoyololicon

04/24 11:05, 7年前 , 9^F

04/24 11:05, 9^F

可是無論如何你最後還是要經過softmax阿這樣梯度消失的問題還是存在還是你認為先經過ReLU再經過softmax會讓梯度消失的問題減少？我可能不像你那麼聰明我覺得我看不出來先經過ReLU再經過softmax對梯度消失有什麼特別幫助 ※ 編輯: Haikyuu (140.112.25.99), 04/24/2018 15:49:29

推

KyotoAnime

04/24 19:00, 7年前 , 10^F

04/24 19:00, 10^F

→

KyotoAnime

04/24 19:00, 7年前 , 11^F

04/24 19:00, 11^F

→

TOEFLiBT100

04/24 19:58, 7年前 , 12^F

04/24 19:58, 12^F