PTT數位生活區 / DataScience

Re: [問題] 請問有人能用policy gradient的方法(vani

看板DataScience作者yiche (陽光灑肩頭彷若自由人)時間4年前 (2021/09/03 11:22)推噓0(0推 0噓 9→)

留言9則, 1人參與討論串2/2 (看更多)

Reinforcement Learning的算法發展或是說解題思維分為三種： 1. Value based 2. Policy based 3. Actor Critic，兼容1+2 action_t = f(state_t) RL要學的正好就是這個function f 1. 透過最佳化Q值來得出f 2. 則是直接學這個f 我認為殊途同歸，但各有優劣我並沒有真的在mountain car這個環境中實作過算法不過我相信PG算法是做得到的底下這篇論文，提出了個PG方法於mountain car上實作，並且有做比較實驗，請見論文Fi gure3 也許值得原po研讀一下 https://reurl.cc/VEG7A5 ※ 引述《yuwenche (yuwenche)》之銘言： : 請問有人能用policy gradient的方法(vanilla, TRPO, PPO等)成功解決"MountainCar- v0 : 問題嗎? 或這問題只能用value learning methods(DQN,DRQN,GAIL等)才能解出? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.37.15.106 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1630639366.A.AE1.html ※ 編輯: yiche (114.37.15.106 臺灣), 09/03/2021 11:24:39

→

09/04 12:58, 4年前 , 1^F

09/04 12:58, 1^F

→

09/04 12:59, 4年前 , 2^F

09/04 12:59, 2^F

→

09/04 13:00, 4年前 , 3^F

09/04 13:00, 3^F

→

09/04 13:00, 4年前 , 4^F

09/04 13:00, 4^F

→

09/04 13:01, 4年前 , 5^F

09/04 13:01, 5^F

→

09/04 13:03, 4年前 , 6^F

09/04 13:03, 6^F

→

09/04 13:04, 4年前 , 7^F

09/04 13:04, 7^F

→

09/04 13:09, 4年前 , 8^F

09/04 13:09, 8^F

→

09/04 13:10, 4年前 , 9^F

09/04 13:10, 9^F

‣ 返回看板[ DataScience ] 研討

‣ 更多 yiche 的文章

文章代碼(AID): #1XCPK6hX (DataScience)

討論串 (同標題文章)

本文引述了以下文章的的內容：

0

2

[問題] 請問有人能用policy gradient的方法(vani

4年前, 09/03

完整討論串 (本文為第 2 之 2 篇)：

排序：最新先 | 最舊先 | 留言數

0

9

Re: [問題] 請問有人能用policy gradient的方法(vani

4年前, 09/03

0

2

[問題] 請問有人能用policy gradient的方法(vani

4年前, 09/03

在新視窗開啟完整討論串 (共2篇)

DataScience 近期熱門文章

3

17

[討論] 請問有真正把AI運用到工作、投資、或賺

[ DataScience ]

7月前, 11/26

6

17

[討論] 各位會買相關書籍來看嗎?

[ DataScience ]

8月前, 10/31

3

10

[問題] 請問想看CV相關討論適合去何處

[ DataScience ]

9月前, 10/17

2

6

[問題] 文字探勘的特徵選取問題

[ DataScience ]

1年前, 07/01

1

9

[問題] 請問kaggle有商業方案嗎? 它每週gpu的限

[ DataScience ]

1年前, 02/26

4

4

[徵才] 美國Amazon暑期實習生

[ DataScience ]

1年前, 01/23

1

6

[問題] 請教大家有推薦的GPU租用服務嗎?

[ DataScience ]

1年前, 12/20

3

8

[討論] 如何計算兩個不同欄的相似度？

[ DataScience ]

1年前, 09/07

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

2

18

[新聞] 三星認了Galaxy S26 Ultra螢幕泛紅　非硬

1小時前, 07/22

-16

22

[心得] 嫩模長腿苗條下面濕滑猛騎

[ PC_Shopping ]

1小時前, 07/22

-4

6

[心得] 嫩模翹臀扭腰騎乘女友感滿

1小時前, 07/22

21

45

Re: [請益] 約140K的ITX菜單求指點

[ PC_Shopping ]

11小時前, 07/22

10

59

[心得]為什麼不建議喇叭混搭

11小時前, 07/22

22

57

[請益] 人體工學椅推薦

[ PC_Shopping ]

11小時前, 07/22

13

20

[黑名] buglee 不回信不取貨

[ HardwareSale ]

11小時前, 07/22

2

32

[菜單] 90K遊戲機

[ PC_Shopping ]

12小時前, 07/21

更多即時熱門文章 >>

‣ 返回看板[ DataScience ] 研討

‣ 更多 yiche 的文章

文章代碼(AID): #1XCPK6hX (DataScience)