討論串(共2篇) - [問題] DRL的time step - 看板DataScience

看板 [ DataScience ]

討論串[問題] DRL的time step

共 2 篇文章

排序：最新先 | 最舊先 | 留言數 | 推文總分

內容預覽：開啟 | 關閉 | 只限未讀

首頁

尾頁

Re: [問題] DRL的time step

推噓1(1推 )留言1則，0人參與作者Dyablo (Dyablo)時間4年前 (2021/10/01 04:16)資訊

內容預覽:

回文賺一下P幣. 這種東西通常都是假設固定的舉例像是RL常用來當baseline的mujoco gym. 雖然你看到的只是call一個step function所以乍看之下好像就是一個step. 可是其實在simulation看起來其實是大約300還是400步左右了. 所以如果你把一個simula

(還有564個字)

[問題] DRL的time step

推噓4(4推 )留言8則，0人參與作者chhuang17時間4年前 (2021/09/30 16:21)資訊

內容預覽:

由於我們家實驗室目前只有我做RL，所以又上來詢問大家了. 問題可能很幼幼班，還請大家見諒QQ. 過往我們家的學長都是用DQN來做 (智慧號控相關). 以其中一位學長的論文為例. 在action的選擇是延長綠燈時間與否. Δt = 5s, 每5秒就會決定號誌代理的動作. 最近在文獻回顧的時候，運用DD

(還有407個字)

首頁

尾頁