[閒聊] 菜鳥上Kaggle: 房價預測
這裡有人玩 Kaggle 嗎?
其實我還沒認真坐坐下來學Python,也沒其他程式經驗。
只是朋友說Kaggle 很好玩,可以當作學 Python 的目標,建議每兩週作一題,我就挑戰
看看。
我做的是很久的題目,1460 筆房價資料,每筆資料79個特性。
訓練後,要估另外1459筆資料回傳讓網站系統估算成績。
我先花了四五天,整理資料(我以前 Excel 還可以),然後朋友丟一個 Lasso Regressi
on給我,我馬上套用,算一個結果就上傳... 以為這樣就算完成一題。
結果被打搶,Error message 我沒看清楚。
那一版真的很差,預估值誤差 rmse 將近35000。
再花了一週時間,重新再整一次資料,邊研究別人的方法,大致加了兩招:XGB 跟 K fol
d 誤差降低到15000 左右。我想大概是我的極限了。
過程中一直用的 bumpy,pandas,一下子 array, 一下子 dataframe, 花了不少時間處理
,應該乖乖坐下來搞懂才是。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.14.66.203
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1518532227.A.7C6.html
推
02/14 00:27,
7年前
, 1F
02/14 00:27, 1F
推
02/14 00:37,
7年前
, 2F
02/14 00:37, 2F
推
02/14 08:38,
7年前
, 3F
02/14 08:38, 3F
→
02/14 08:39,
7年前
, 4F
02/14 08:39, 4F
推
02/14 09:56,
7年前
, 5F
02/14 09:56, 5F
→
02/14 09:58,
7年前
, 6F
02/14 09:58, 6F
→
02/14 09:58,
7年前
, 7F
02/14 09:58, 7F
→
02/14 09:58,
7年前
, 8F
02/14 09:58, 8F
→
02/14 11:40,
7年前
, 9F
02/14 11:40, 9F
→
02/14 11:40,
7年前
, 10F
02/14 11:40, 10F
→
03/06 04:44,
7年前
, 11F
03/06 04:44, 11F
討論串 (同標題文章)
Python 近期熱門文章
PTT數位生活區 即時熱門文章