PTT數位生活區 / DataScience

[問題] RNN(GRU)的memory在評估模型中如何工作？

看板DataScience作者wheado (principal component QQ)時間4年前 (2020/12/23 17:25)推噓2(2推 0噓 4→)

留言6則, 3人參與討論串1/1

作業系統:Linux 問題類別:RNN中的GRU 使用工具:Pytorch 問題內容: 初學者學習有關RNN在Forward中的過程，對於memory在評估或是實際應用中如何工作有疑惑。首先假設我有一個Batch(6)資料，其維度分別代表( seq_len(40), batch_size(6), embedding_dim(15) )，可以理解成(句子長度, batch size, word vector向量長度)。接著假設我有一個GRU Layer，他是單向的，一層(沒有堆疊)，memory的維度是7。代碼如下 https://imgur.com/IJoQ9mE

在執行Forward中，我必須給一個初始化的memory，根據batch(6)、單向、memory維度(7)，我的初始化memory是一個(1, 6, 7)的Tensor。在執行完之後我會得到輸出值(y)以及更新的memory。代碼如下 https://imgur.com/3Sr7DId

假設我之後接了一個Fully connected layer結束，使用Log loss當作損失函數。 Train了一發之後，我想找一筆測試資料(batch=1)來輸入給模型。問題是我在輸入模型的初始化memory應該選哪一個？還是我根本不需要去選？但是不選的話，很奇怪。或是我完全錯誤理解GRU的工作模式了？請高手指教，謝謝。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.168.199.15 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1608715527.A.872.html

推

12/27 13:42, 4年前 , 1^F

12/27 13:42, 1^F

→

12/27 13:42, 4年前 , 2^F

12/27 13:42, 2^F

推

12/27 13:59, 4年前 , 3^F

12/27 13:59, 3^F

→

12/27 14:00, 4年前 , 4^F

12/27 14:00, 4^F

→

12/27 18:16, 4年前 , 5^F

12/27 18:16, 5^F

→

12/27 18:17, 4年前 , 6^F

12/27 18:17, 6^F

‣ 返回看板[ DataScience ] 研討

‣ 更多 wheado 的文章

文章代碼(AID): #1Vumq7Xo (DataScience)

DataScience 近期熱門文章

1

9

[問題] 請問kaggle有商業方案嗎? 它每週gpu的限

[ DataScience ]

4月前, 02/26

4

4

[徵才] 美國Amazon暑期實習生

[ DataScience ]

5月前, 01/23

1

6

[問題] 請教大家有推薦的GPU租用服務嗎?

[ DataScience ]

6月前, 12/20

3

8

[討論] 如何計算兩個不同欄的相似度？

[ DataScience ]

9月前, 09/07

1

4

Re: [問題] 如何在python中訓練好autoencoder?已刪文

[ DataScience ]

10月前, 08/06

2

12

[討論] 有人開始用KAN了嗎？

[ DataScience ]

11月前, 08/04

4

13

Re: [討論] cognitive model/causal ML執行的細節

[ DataScience ]

1年前, 05/15

17

70

[討論] cognitive model/causal ML執行的細節

[ DataScience ]

1年前, 05/15

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

8

13

[情報] 原價屋索泰 60TI/70送全漢金牌

[ PC_Shopping ]

32分鐘前, 07/02

24

30

[心得] 夢想實現，開箱MSB Select DAC II

7小時前, 07/02

11

64

[心得] 一次啟動3把鍵盤 AK992青檸/蜜桃軸超安靜

[ PC_Shopping ]

8小時前, 07/02

3

10

[菜單] 15K 輕遊戲小主機推薦

[ PC_Shopping ]

9小時前, 07/02

5

12

[行情] Circle 商業模式全靠美債利息，為什麼IPO

[ DigiCurrency ]

10小時前, 07/01

5

10

[開箱] 啟動-Enermax安耐美PK850W PSU白金電源

[ PC_Shopping ]

11小時前, 07/01

5

20

[Coin] 比特幣大戶，今年買了多少顆BTC呢

[ DigiCurrency ]

11小時前, 07/01

10

27

[閒聊] 富士低價鏡頭去留選擇

11小時前, 07/01

更多即時熱門文章 >>

‣ 返回看板[ DataScience ] 研討

‣ 更多 wheado 的文章

文章代碼(AID): #1Vumq7Xo (DataScience)