PTT數位生活區 / DataScience

[問題] 監督式學習的資料使用強化學習方法實作

看板DataScience作者wheado (principal component QQ)時間3年前 (2021/10/07 10:49)推噓4(4推 0噓 16→)

留言20則, 11人參與討論串1/1

由於工作上遇到一般監督式學習解決不了的問題，也可能是功力不到家，總之會需要用強化學習試試看，我目前的問題是一個監督式學習，有X有Y但就是學習不起來。從課程上知道如果一個監督式學習訓練不起來，可以使用強化學習的方法來試試看。再參考網路上的文獻跟教程之後，初步理解了像是 agent, environment, action, retrun, reward 等等專有名詞的定義，也初步理解了 action function 以及 state transition function 這些函數的用途以及隨機性的原理。問題來了，一般監督式學習(手寫辨識)，通常是有一些資料(X)及標記(Y)，接著就是寫一個forwrad流程來，更新我的模型 weight 即可。如果我要將這個問題(手寫辨識)用 RL 實作一次，要怎樣做？我嘗試上網搜尋但是沒有找到類似的範本，我從官方教學看到的範例是馬力歐跟木棒平衡(?) 我看完官方教學有感覺到強化學習是要有一個互動環境才能 work 。一般監督又要怎麼轉過去... 有沒有前輩可以指點，謝謝。或是有看到相關的關鍵字都可以跟我說，感謝。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 218.164.5.43 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1633574972.A.644.html

→

10/07 18:26, 3年前 , 1^F

10/07 18:26, 1^F

→

10/07 18:38, 3年前 , 2^F

10/07 18:38, 2^F

→

10/07 22:17, 3年前 , 3^F

10/07 22:17, 3^F

推

10/08 05:03, 3年前 , 4^F

10/08 05:03, 4^F

推

10/08 10:24, 3年前 , 5^F

10/08 10:24, 5^F

→

10/08 10:24, 3年前 , 6^F

10/08 10:24, 6^F

→

10/08 10:24, 3年前 , 7^F

10/08 10:24, 7^F

→

10/08 10:25, 3年前 , 8^F

10/08 10:25, 8^F

→

10/08 11:45, 3年前 , 9^F

10/08 11:45, 9^F

→

10/08 11:47, 3年前 , 10^F

10/08 11:47, 10^F

→

10/08 15:20, 3年前 , 11^F

10/08 15:20, 11^F

→

10/08 15:39, 3年前 , 12^F

10/08 15:39, 12^F

→

10/08 15:42, 3年前 , 13^F

10/08 15:42, 13^F

→

10/09 01:08, 3年前 , 14^F

10/09 01:08, 14^F

推

10/12 10:04, 3年前 , 15^F

10/12 10:04, 15^F

推

10/22 17:54, , 16^F

10/22 17:54, 16^F

→

10/28 11:52, , 17^F

10/28 11:52, 17^F

→

10/28 11:54, , 18^F

10/28 11:54, 18^F

→

10/28 11:54, , 19^F

10/28 11:54, 19^F

→

11/04 15:20, , 20^F

11/04 15:20, 20^F

‣ 返回看板[ DataScience ] 研討

‣ 更多 wheado 的文章

文章代碼(AID): #1XNc0yP4 (DataScience)

DataScience 近期熱門文章

2

6

[問題] 文字探勘的特徵選取問題

[ DataScience ]

1周前, 07/01

1

9

[問題] 請問kaggle有商業方案嗎? 它每週gpu的限

[ DataScience ]

4月前, 02/26

4

4

[徵才] 美國Amazon暑期實習生

[ DataScience ]

5月前, 01/23

1

6

[問題] 請教大家有推薦的GPU租用服務嗎?

[ DataScience ]

6月前, 12/20

3

8

[討論] 如何計算兩個不同欄的相似度？

[ DataScience ]

10月前, 09/07

1

4

Re: [問題] 如何在python中訓練好autoencoder?已刪文

[ DataScience ]

11月前, 08/06

2

12

[討論] 有人開始用KAN了嗎？

[ DataScience ]

11月前, 08/04

4

13

Re: [討論] cognitive model/causal ML執行的細節

[ DataScience ]

1年前, 05/15

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

10

46

[討論] 三星真的這麼不堪嗎？

9小時前, 07/12

3

19

Re: [新聞] OPPO 全新 Reno14 手機登台！

11小時前, 07/12

7

9

[支付] bybit卡實測

[ DigiCurrency ]

12小時前, 07/11

3

5

[購機] 手機三選一 A55/R9/U24 pro

12小時前, 07/11

6

69

[菜單] 60K遊戲機

[ PC_Shopping ]

14小時前, 07/11

26

48

[閒聊] [心得] 美亞啟動 AM4 最後的榮光

[ PC_Shopping ]

14小時前, 07/11

1

24

Re: [菜單] 30K高性價3A遊戲機(改單)

[ PC_Shopping ]

15小時前, 07/11

16

39

[問題] 亞太11方案Q1911收到簡訊

16小時前, 07/11

更多即時熱門文章 >>

‣ 返回看板[ DataScience ] 研討

‣ 更多 wheado 的文章

文章代碼(AID): #1XNc0yP4 (DataScience)