討論串[問題] DRL的time step
共 2 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓4(4推 0噓 4→)留言8則,0人參與, 2年前最新作者chhuang17時間2年前 (2021/09/30 16:21), 2年前編輯資訊
0
0
0
內容預覽:
由於我們家實驗室目前只有我做RL,所以又上來詢問大家了. 問題可能很幼幼班,還請大家見諒QQ. 過往我們家的學長都是用DQN來做 (智慧號控相關). 以其中一位學長的論文為例. 在action的選擇是延長綠燈時間與否. Δt = 5s, 每5秒就會決定號誌代理的動作. 最近在文獻回顧的時候,運用DD
(還有407個字)

推噓1(1推 0噓 0→)留言1則,0人參與, 2年前最新作者Dyablo (Dyablo)時間2年前 (2021/10/01 04:16), 2年前編輯資訊
0
0
0
內容預覽:
回文賺一下P幣. 這種東西通常都是假設固定的 舉例像是RL常用來當baseline的mujoco gym. 雖然你看到的只是call一個step function所以乍看之下好像就是一個step. 可是其實在simulation看起來其實是大約300還是400步左右了. 所以如果你把一個simula
(還有564個字)
首頁
上一頁
1
下一頁
尾頁