Re: [問題] linear regression 的feature選用問題

看板DataScience作者 (心平氣和)時間6年前 (2018/03/28 09:48), 編輯推噓9(906)
留言15則, 12人參與, 6年前最新討論串2/2 (看更多)
※ 引述《PyTorch (屁眼火炬)》之銘言: : 如題 : 請教一下 : linear regression的model在feature選用上有可能 : 只用上feature的 x ** 2項 而不用x項效果會更好嗎? : 因為我看宏毅老師的投影片好像都是 : 先用 x , 再加用x ** 2, 再加 x *** 3, ... : 直到overfitting發生 : 那有可能是只用x ** 2, 而不用x 會效果更好嗎? : 還是說overfitting只會發生在高次方項? : 因為我想到若x存在負數,那只選用x**2當fearture而不用x也許會比較好? : 先謝謝各位願意看完我冗長的問題 比較簡單的答案: 有沒有可能比較好,有可能。舉例來說,如果今天是單變數的模型, 而你想要近似的函數具有「偶函數」的性質,那麼 x**2 的轉換也許會 更貼切地運用這個性質,達到更好的表現。 但實務上,有沒有人這麼做?我沒看到過。也許是因為有很多的做法 (例如把一次轉換、二次轉換都包含但最後使用 L1-regularization 一類的 稀疏模型)也可以達成類似的效果,也許是因為這個「有可能」的情形並 不那麼多,也許只是因為這樣的做法並不符合大部份人的「直覺」。所以 我還真的沒看過人這樣做的…… -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.216.8.103 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1522201705.A.7B5.html

03/28 10:28, 6年前 , 1F
感謝田神,小的也是coursera田神的粉絲,榮幸得田神回文
03/28 10:28, 1F

03/28 10:30, 6年前 , 2F
理清我長久的疑惑
03/28 10:30, 2F

03/28 13:40, 6年前 , 3F
這是domain knowledge的問題 而且還取決於領域 做廣告投放
03/28 13:40, 3F

03/28 13:40, 6年前 , 4F
賺錢應該確實是不會這樣做吧
03/28 13:40, 4F

03/28 13:59, 6年前 , 5F
朝聖田神
03/28 13:59, 5F

03/28 15:24, 6年前 , 6F
朝聖
03/28 15:24, 6F

03/28 17:58, 6年前 , 7F
取log呢,雖然負的需要額外處理,但是感覺這樣expon
03/28 17:58, 7F

03/28 17:58, 6年前 , 8F
ent的問題可以解決
03/28 17:58, 8F

03/28 20:08, 6年前 , 9F
朝聖
03/28 20:08, 9F

03/28 21:37, 6年前 , 10F
取log basis function的次方不就沒意義惹
03/28 21:37, 10F

03/28 21:58, 6年前 , 11F
03/28 21:58, 11F

03/28 22:12, 6年前 , 12F
03/28 22:12, 12F

03/29 08:32, 6年前 , 13F
03/29 08:32, 13F

03/29 08:38, 6年前 , 14F
<(_ _)>!!
03/29 08:38, 14F

03/30 01:59, 6年前 , 15F
朝聖
03/30 01:59, 15F
文章代碼(AID): #1QklHfUr (DataScience)
文章代碼(AID): #1QklHfUr (DataScience)