[問題] 迴歸的預測問題
大家好,想請教一個迴歸問題
一般在寫迴歸的語法是
lm(y~x1+x2+x3...),直接將變數名稱寫上。
但因為實作牽涉變數選擇的問題
我的寫法是用矩陣的方式
lm(data[,7]~data[,variable])
data是1000*7的矩陣,第7個是反映變數
variable是數字向量,作為變數選擇的指標
例如variable=c(1,2,4)是選取x1,x2,x4作為解釋變數
這樣的寫法雖然一樣可以建模型但沒辦法順利預測測試集
我的測試集是200*7的資料集
用predict預測會給警告訊息說新資料筆數只有200和原始資料筆數不同
並且回傳的預測結果是建模型那1000筆資料的fitted.value
這樣的狀況只有在使用矩陣寫lm時會產生,一般寫法就沒問題
目前只想到提取模型係數自己算的解決方案,請問是否有方法可以解決這樣的問題呢?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.140.99.88 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1597637629.A.7D7.html
推
08/17 12:45,
4年前
, 1F
08/17 12:45, 1F
→
08/17 12:45,
4年前
, 2F
08/17 12:45, 2F
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章