[討論] 股票當沖模型是否符合MDP的特性?
我有一個股票當沖模型:狀態有6個state,分別為 t、t-1、t-2、t-3的價格對昨日收盤
的值取對數,即 log(Pt/Pc)、log(Pt-1/Pc)、 log(Pt-2/Pc) 、 log(Pt-3/Pc);另外兩
個則是t時間的價格(標準化)和部位(-1、0、+1)。動作有三個:買進(+1) 、賣出(-1)
、不動作(0) 。
教科書說MDP(Markov Decision Process)是強化學習(Reinforcement Learning)的一項重
要性質,因為有了這個性質,我們才能只針對當前的狀態作出動作選擇,而無需去考慮以
前的狀態。請問這個模型是否符合MDP的特性?
請不要拿『股票漲跌可預測嗎?』這種哲學問題,或『影響股價的因素不僅是歷史股價,
還有更多的因素,如公司的近况、總經數據 …』這類社會科學的觀點來討論,請針對數學
模型來討論,謝謝。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.241.21.152 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1698041151.A.491.html
→
10/23 14:20,
6月前
, 1F
10/23 14:20, 1F
→
10/25 22:10,
6月前
, 2F
10/25 22:10, 2F
推
10/27 13:55,
6月前
, 3F
10/27 13:55, 3F
推
10/27 18:35,
6月前
, 4F
10/27 18:35, 4F
推
10/28 10:44,
6月前
, 5F
10/28 10:44, 5F
→
10/28 10:44,
6月前
, 6F
10/28 10:44, 6F
→
11/01 15:23,
5月前
, 7F
11/01 15:23, 7F
→
11/07 09:26,
5月前
, 8F
11/07 09:26, 8F
→
11/07 09:26,
5月前
, 9F
11/07 09:26, 9F
→
11/07 16:09,
5月前
, 10F
11/07 16:09, 10F
→
11/07 16:11,
5月前
, 11F
11/07 16:11, 11F
→
11/07 16:11,
5月前
, 12F
11/07 16:11, 12F
→
11/07 16:11,
5月前
, 13F
11/07 16:11, 13F
→
11/07 16:13,
5月前
, 14F
11/07 16:13, 14F
→
11/07 16:13,
5月前
, 15F
11/07 16:13, 15F
→
11/07 16:24,
5月前
, 16F
11/07 16:24, 16F
→
11/07 16:24,
5月前
, 17F
11/07 16:24, 17F
→
11/07 16:24,
5月前
, 18F
11/07 16:24, 18F
→
11/07 16:24,
5月前
, 19F
11/07 16:24, 19F
→
11/07 16:24,
5月前
, 20F
11/07 16:24, 20F
→
11/07 16:24,
5月前
, 21F
11/07 16:24, 21F
→
11/07 16:24,
5月前
, 22F
11/07 16:24, 22F
DataScience 近期熱門文章
PTT數位生活區 即時熱門文章