PTT數位生活區 / DataScience

[問題] RNN無法收斂已刪文

看板DataScience作者clansoda (小笨)時間6年前 (2019/08/04 01:12)推噓0(0推 0噓 0→)

留言0則, 0人參與討論串1/1

我目前在練習使用RNN來做各種NLP的應用，目前是使用bidirectional LSTM來做 sentiment analysis，雖然使用的是最基本的架構，但是我發現模型不會收斂我的架構是先有一個embedding layer來將text轉成embedding然後feed進一個兩層的bidirectional LSTM再將最後一個time series的output抽出來feed進一個兩層的forward NN然後產生prediction 使用的是Adam lr = 0.00001 mini_bacth_size = 128 我想過是不是因為我將left_to_right跟right_to_left的兩個sequence串起來所以才沒辦法收斂，我用了paper裡面的方法將兩個向量加起來也不行。我也試過把lr調小一點也不行，也試過forward NN只用一層也不行，也試過只用left_to_right 的LSTM也不行，想請問如果用layer normalization會比較好嗎我還沒試的原因是因為網路上的應用並沒有用到normalization就會收斂了我將我的data與code放在下面希望有經驗與有時間的前輩能給我一些建議 data https://bit.ly/2T2rm9Q code https://bit.ly/31juGQH -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 108.12.53.156 (美國) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1564852345.A.C1C.html

‣ 返回看板[ DataScience ] 研討

‣ 更多 clansoda 的文章

文章代碼(AID): #1THS1vmS (DataScience)

DataScience 近期熱門文章

1

9

[討論] 請問有真正把AI運用到工作、投資、或賺

[ DataScience ]

3周前, 11/26

5

16

[討論] 各位會買相關書籍來看嗎?

[ DataScience ]

1月前, 10/31

3

10

[問題] 請問想看CV相關討論適合去何處

[ DataScience ]

2月前, 10/17

2

6

[問題] 文字探勘的特徵選取問題

[ DataScience ]

5月前, 07/01

1

9

[問題] 請問kaggle有商業方案嗎? 它每週gpu的限

[ DataScience ]

9月前, 02/26

4

4

[徵才] 美國Amazon暑期實習生

[ DataScience ]

11月前, 01/23

1

6

[問題] 請教大家有推薦的GPU租用服務嗎?

[ DataScience ]

1年前, 12/20

3

8

[討論] 如何計算兩個不同欄的相似度？

[ DataScience ]

1年前, 09/07

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

27

53

[心得] 威剛的SSD真的很扯

[ PC_Shopping ]

7小時前, 12/23

7

13

[情報] AMD Zen6將會支援AVX 10.2

[ PC_Shopping ]

8小時前, 12/23

10

22

[討論] 肉呆重構調研 600人告訴你不需智慧眼鏡

8小時前, 12/23

2

24

[菜單] 95K遊戲工作機

[ PC_Shopping ]

10小時前, 12/23

2

28

[菜單] 50k剪片遊戲機

[ PC_Shopping ]

10小時前, 12/23

16

49

[情報] 全球記憶體荒有解？傳南韓兩大廠 SK 海

[ PC_Shopping ]

11小時前, 12/22

7

39

[開箱] 華擎 RX 9070 GRE Steel Legend 簡單開

[ PC_Shopping ]

11小時前, 12/22

37

89

[閒聊] 接下來顯卡也會限購嗎？

[ PC_Shopping ]

11小時前, 12/22

更多即時熱門文章 >>

‣ 返回看板[ DataScience ] 研討

‣ 更多 clansoda 的文章

文章代碼(AID): #1THS1vmS (DataScience)