[問題] xgboost同原始資料當input,先經過轉換?
不好意思,這個問題實在不知道怎麼下標題所以只好這樣下
是這樣的,最近有個project有點趕
內容比較不方便說明,這邊用舉例的
舉例為:
假設你目前僅有的資料是身高和體重
要預測他會喜歡4種商品的哪樣產品(multi class classification)
我的疑問為:
直接以"身高、體重"當input,使用xgboost預測
與
先以常用的已知公式bmi計算後再把"身高、體重、bmi"使用xgboost預測
是否可能會增加正確率?
會有這個疑問是因為bmi原本也是從身高、體重所衍生的資訊
如果原本身高體重就無法解釋喜歡哪樣商品
縱使增加了bmi這個資訊正確率仍然不會增加才對
但概念上,先計算出bmi與資料預處理(preprocessing)又有點類似
好的預處理確實會影響預測準確率
所以到底先經過一些原本已知的公式計算後當input,有沒有可能大幅增加正確率?
以上,先謝謝各位大大的指教
==
補充:
因為時間比較緊,我只能在
1. 撰寫一堆爬蟲趕快搜集蒐集更多資料
2. 撰寫一推不同的公式計算當input預測看看
兩個方式抉擇一種
又2的部分也有將近無限多種公式的種類
所以如果2的方式確定不可行,或是可行的機會太渺茫
我要把時間全部砸在1的方式處理
以上,謝謝各位
--
推
,
→
,
推
,
推
,
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.171.175.207
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1556446774.A.ADD.html
※ 編輯: woogee (1.171.175.207), 04/28/2019 18:27:44
推
04/28 19:46,
5年前
, 1F
04/28 19:46, 1F
→
04/28 19:47,
5年前
, 2F
04/28 19:47, 2F
→
04/28 19:47,
5年前
, 3F
04/28 19:47, 3F
→
04/28 19:47,
5年前
, 4F
04/28 19:47, 4F
→
04/28 19:48,
5年前
, 5F
04/28 19:48, 5F
→
04/28 19:49,
5年前
, 6F
04/28 19:49, 6F
→
04/28 19:49,
5年前
, 7F
04/28 19:49, 7F
→
04/28 19:50,
5年前
, 8F
04/28 19:50, 8F
→
04/28 19:51,
5年前
, 9F
04/28 19:51, 9F
了解,意思是先做BMI確實有意義但機會很渺茫囉?
推
04/29 12:08,
5年前
, 10F
04/29 12:08, 10F
→
04/29 12:08,
5年前
, 11F
04/29 12:08, 11F
謝謝你,我瞭解了,公式都不難實現,只是公式種類極多(至少100種+)
常見的是有package可用這部分會試試看,感謝
※ 編輯: woogee (1.171.175.207), 04/29/2019 14:51:58
推
04/29 21:04,
5年前
, 12F
04/29 21:04, 12F
推
04/29 22:48,
5年前
, 13F
04/29 22:48, 13F
推
04/30 01:09,
5年前
, 14F
04/30 01:09, 14F
→
04/30 01:09,
5年前
, 15F
04/30 01:09, 15F
→
04/30 01:09,
5年前
, 16F
04/30 01:09, 16F
→
04/30 01:09,
5年前
, 17F
04/30 01:09, 17F
推
04/30 04:35,
5年前
, 18F
04/30 04:35, 18F
→
04/30 04:36,
5年前
, 19F
04/30 04:36, 19F
→
04/30 04:38,
5年前
, 20F
04/30 04:38, 20F
推
04/30 15:35,
5年前
, 21F
04/30 15:35, 21F
→
04/30 15:35,
5年前
, 22F
04/30 15:35, 22F
→
04/30 15:37,
5年前
, 23F
04/30 15:37, 23F
推
05/03 11:11,
5年前
, 24F
05/03 11:11, 24F
→
05/03 11:11,
5年前
, 25F
05/03 11:11, 25F
→
05/03 11:11,
5年前
, 26F
05/03 11:11, 26F
→
05/03 11:11,
5年前
, 27F
05/03 11:11, 27F
→
05/03 11:11,
5年前
, 28F
05/03 11:11, 28F
→
05/03 11:11,
5年前
, 29F
05/03 11:11, 29F
→
05/03 11:11,
5年前
, 30F
05/03 11:11, 30F
DataScience 近期熱門文章
PTT數位生活區 即時熱門文章