Re: [心得] 分享 金融開源data package

看板DataScience作者 (tipsofwarren)時間5年前 (2019/02/21 15:23), 5年前編輯推噓6(603)
留言9則, 3人參與, 5年前最新討論串2/2 (看更多)
剛剛看了一下 GRU_LSTM_demo.py, 有個疑問... print(' 歸一化 ') scaler = MinMaxScaler(feature_range=(0, 1)) stock_price = scaler.fit_transform(stock_price) print(' 取 80% data 當作 training data, 20% data 當作 testing data 做模型驗證 ') train_size = int(len(stock_price) * 0.8) test_size = len(stock_price) - train_size train, test = stock_price[0:train_size,:], stock_price[train_size:len(stock_price),:] 這邊的順序是不是有商討的空間? 應該是 1. 取 80% 當TrainSet, 並且 normalize (並且記下 normalize 的參數, 如 mean/std) 2. 剩下的 20% (暫且稱為 dev-test set) 應該用 step 1 的 normalize 參數 去做 標準化, 然後再丟進去 step 1 所獲得的 model 來計算 loss. 我還有個問題, 直接用 close price 當作 target 應該 也有商討空間... 應該改為 "相對值" 吧? 拍謝, 我弱弱的, 有講錯請更正... ※ 引述《f496328mm (123)》之銘言: : ※ [本文轉錄自 Python 看板 #1SRLbpwt ] : 作者: f496328mm (123) 看板: Python : 標題: [心得] 分享 金融開源data package : 時間: Wed Feb 20 21:43:12 2019 : https://github.com/linsamtw/FinMind : 分享我開發的 package,金融 data open source,超過10種金融數據, : 可直接 pip3 install FinMind : 包含台股股價、美股股價、台股個股外資買賣、融資融券、財報 : G7 國家匯率、央行利率、債券 ( G7 是7大工業組織 ) : 金價、油價、能源期貨價格 : 並提供 DL ( LSTM ) 預測股價範例 : https://github.com/linsamtw/FinMind/tree/master/Mining : 文件 https://linsamtw.github.io/FinMindDoc/ : ps : 目前在開發視覺化,如果有人有興趣合作,可以私信我 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.34.120 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1550733838.A.842.html ※ 編輯: tipsofwarren (122.116.34.120), 02/21/2019 15:25:10

02/21 15:43, 5年前 , 1F
1.先分出訓練集再做normalization
02/21 15:43, 1F

02/21 15:46, 5年前 , 2F
最後預測5天後,再一天的股價,用的是收盤價?
02/21 15:46, 2F

02/21 15:48, 5年前 , 3F
還蠻直覺的呀 哈
02/21 15:48, 3F
讓子彈再飛一毀兒... 看看大家怎麼說. 個人認為要用"相對值", 可以用 N 日均價當作基準, 訓練完之後再行返推絕對值. 用絕對值的話, 股價 100 漲一元 vs 200 漲 兩元應該是一樣的意思, 用 絕對值卻是看到 股價 100 vs 200 是不一樣的. ※ 編輯: tipsofwarren (122.116.34.120), 02/21/2019 15:53:20

02/21 15:56, 5年前 , 4F
意思是用收盤的漲跌%數才對?
02/21 15:56, 4F
其實包含 feature 也該 %%% 比較好... 老魯門外漢 請大家多指點... ※ 編輯: tipsofwarren (122.116.34.120), 02/21/2019 15:59:56

02/21 17:02, 5年前 , 5F
是,不能預測實際股價
02/21 17:02, 5F

02/21 19:45, 5年前 , 6F
你是對的,我 demo 只是提供一個分析的參考
02/21 19:45, 6F

02/21 19:45, 5年前 , 7F
只用股價去建 model
02/21 19:45, 7F

02/21 19:45, 5年前 , 8F
實際上,我收集超過10種 data,就是希望用所有 data
02/21 19:45, 8F

02/21 19:45, 5年前 , 9F
建模
02/21 19:45, 9F
文章代碼(AID): #1SRb8EX2 (DataScience)
文章代碼(AID): #1SRb8EX2 (DataScience)