[閒聊] 菜鳥上Kaggle: 房價預測

看板Python作者 (OPPR)時間7年前 (2018/02/13 22:30), 編輯推噓4(407)
留言11則, 7人參與, 7年前最新討論串1/3 (看更多)
這裡有人玩 Kaggle 嗎? 其實我還沒認真坐坐下來學Python,也沒其他程式經驗。 只是朋友說Kaggle 很好玩,可以當作學 Python 的目標,建議每兩週作一題,我就挑戰 看看。 我做的是很久的題目,1460 筆房價資料,每筆資料79個特性。 訓練後,要估另外1459筆資料回傳讓網站系統估算成績。 我先花了四五天,整理資料(我以前 Excel 還可以),然後朋友丟一個 Lasso Regressi on給我,我馬上套用,算一個結果就上傳... 以為這樣就算完成一題。 結果被打搶,Error message 我沒看清楚。 那一版真的很差,預估值誤差 rmse 將近35000。 再花了一週時間,重新再整一次資料,邊研究別人的方法,大致加了兩招:XGB 跟 K fol d 誤差降低到15000 左右。我想大概是我的極限了。 過程中一直用的 bumpy,pandas,一下子 array, 一下子 dataframe, 花了不少時間處理 ,應該乖乖坐下來搞懂才是。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.14.66.203 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1518532227.A.7C6.html

02/14 00:27, 7年前 , 1F
你這 metric 是不是忘了取 log
02/14 00:27, 1F

02/14 00:37, 7年前 , 2F
b 跟 n 很近
02/14 00:37, 2F

02/14 08:38, 7年前 , 3F
呃 這樣玩會學有點久 加油xd
02/14 08:38, 3F

02/14 08:39, 7年前 , 4F
你留意一下其他人怎做 feature engineering
02/14 08:39, 4F

02/14 09:56, 7年前 , 5F
可以多看別人的kernel 進步會比較快
02/14 09:56, 5F

02/14 09:58, 7年前 , 6F
感謝大家,我就讓b 留著,紀錄 b n 不遠。也會去多看
02/14 09:58, 6F

02/14 09:58, 7年前 , 7F
別人怎麼作,還有樓上建議的 feature engineering
02/14 09:58, 7F

02/14 09:58, 7年前 , 8F
對了,一樓說的我沒作,在研究看看,感恩
02/14 09:58, 8F

02/14 11:40, 7年前 , 9F
多跑幾個random seed再把結果綜合起來平均之類的,通
02/14 11:40, 9F

02/14 11:40, 7年前 , 10F
常會有明顯的進步
02/14 11:40, 10F

03/06 04:44, 7年前 , 11F
文章代碼(AID): #1QWlQ3V6 (Python)
文章代碼(AID): #1QWlQ3V6 (Python)