Re: [問題] linear regression 的feature選用問題
※ 引述《PyTorch (屁眼火炬)》之銘言:
: 如題
: 請教一下
: linear regression的model在feature選用上有可能
: 只用上feature的 x ** 2項 而不用x項效果會更好嗎?
: 因為我看宏毅老師的投影片好像都是
: 先用 x , 再加用x ** 2, 再加 x *** 3, ...
: 直到overfitting發生
: 那有可能是只用x ** 2, 而不用x 會效果更好嗎?
: 還是說overfitting只會發生在高次方項?
: 因為我想到若x存在負數,那只選用x**2當fearture而不用x也許會比較好?
: 先謝謝各位願意看完我冗長的問題
比較簡單的答案:
有沒有可能比較好,有可能。舉例來說,如果今天是單變數的模型,
而你想要近似的函數具有「偶函數」的性質,那麼 x**2 的轉換也許會
更貼切地運用這個性質,達到更好的表現。
但實務上,有沒有人這麼做?我沒看到過。也許是因為有很多的做法
(例如把一次轉換、二次轉換都包含但最後使用 L1-regularization 一類的
稀疏模型)也可以達成類似的效果,也許是因為這個「有可能」的情形並
不那麼多,也許只是因為這樣的做法並不符合大部份人的「直覺」。所以
我還真的沒看過人這樣做的……
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.216.8.103
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1522201705.A.7B5.html
推
03/28 10:28,
6年前
, 1F
03/28 10:28, 1F
→
03/28 10:30,
6年前
, 2F
03/28 10:30, 2F
→
03/28 13:40,
6年前
, 3F
03/28 13:40, 3F
→
03/28 13:40,
6年前
, 4F
03/28 13:40, 4F
推
03/28 13:59,
6年前
, 5F
03/28 13:59, 5F
推
03/28 15:24,
6年前
, 6F
03/28 15:24, 6F
→
03/28 17:58,
6年前
, 7F
03/28 17:58, 7F
→
03/28 17:58,
6年前
, 8F
03/28 17:58, 8F
推
03/28 20:08,
6年前
, 9F
03/28 20:08, 9F
推
03/28 21:37,
6年前
, 10F
03/28 21:37, 10F
→
03/28 21:58,
6年前
, 11F
03/28 21:58, 11F
推
03/28 22:12,
6年前
, 12F
03/28 22:12, 12F
推
03/29 08:32,
6年前
, 13F
03/29 08:32, 13F
推
03/29 08:38,
6年前
, 14F
03/29 08:38, 14F
推
03/30 01:59,
6年前
, 15F
03/30 01:59, 15F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):
DataScience 近期熱門文章
PTT數位生活區 即時熱門文章