[問題] Autocorrelation檢驗LSTM 訓練 feature?

看板DataScience作者 (tipsofwarren)時間5年前 (2019/02/13 22:12), 5年前編輯推噓1(106)
留言7則, 1人參與, 5年前最新討論串1/1
門外漢有個問題, 假設我打算用 a,b,c 三個變數 使用 DNN or LR 來 預測 y 我先檢查 a,y 的 coefficient, 結果發覺是 0, 那我想, 把 a 從 feature set 剔除 應該是很保險的. 但是, 如果我打算用 時間序列模型 來做訓練, 換句話說, a,b,c 的時間序列 來預測 y 那用 單純的 coefficient (a,y) 來檢查 a(n) 是否可以踢除 feature set 是否不對? 用白話的來說, 如果 (a,y) 沒有相關性, 是否代表 a(n) 與 y 的相關性也是 0? 如果這個推論是不成立的, 那麼我該用什麼樣的方法來檢驗 a(n) 是否適合加入 LSTM 訓練的 feature set ? 感謝解惑 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.160.85.189 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1550067150.A.79C.html

02/14 09:13, 5年前 , 1F
就算correlation 為 0 也不能拿掉 a 文章以下問題 就不
02/14 09:13, 1F

02/14 09:13, 5年前 , 2F
存在了
02/14 09:13, 2F

02/14 12:59, 5年前 , 3F
a(n) 重要性,應該是看a(n)與b(n)and a(n)與c(n) ,如果
02/14 12:59, 3F

02/14 12:59, 5年前 , 4F
其他特徵(b,c)跟它(a)相關性高,為了讓特徵變少,是可以
02/14 12:59, 4F

02/14 12:59, 5年前 , 5F
去掉a只看b,c組合,但單純只看a與y的correlation,可能會
02/14 12:59, 5F

02/14 12:59, 5年前 , 6F
因為沒有捕捉到a的高階特徵導致a與y相關性0,但說不定a^2
02/14 12:59, 6F

02/14 12:59, 5年前 , 7F
與y 是高度正相關 所以才會需要DNN去捕捉高階特徵
02/14 12:59, 7F
感謝指點。。。 ※ 編輯: tipsofwarren (42.73.246.102), 02/14/2019 14:26:28
文章代碼(AID): #1SP2NEUS (DataScience)
文章代碼(AID): #1SP2NEUS (DataScience)