[問題] SVM基礎觀念問題請教

看板DataScience作者 (低小調)時間5年前 (2019/06/04 22:38), 編輯推噓3(3020)
留言23則, 5人參與, 5年前最新討論串1/1
小弟剛接觸SVM,這個問題可能有點蠢,不過一直搞不清這個問題。 就是我在google找尋SVM相關說明的文章中都有提到: Wx+b>=1 和 Wx+b<=-1 我能理解要找到分割平面Wx+b=0,離兩邊的資料越遠越好, 但實在搞不懂為什麼突然就跑出 Wx+b>=1 和 Wx+b<=-1 了…… 還有為什麼是1,不能是其它數字,像是 Wx+b>=0.5 和 Wx+b<=0.5。 假如我今天手上的資料距離很近, 找不到能使所有資料都符合Wx+b>=1 和 Wx+b<=-1的條件怎麼辦呢? 我看的有以下幾篇: https://medium.com/@chih.sheng.huang821/c320098a3d2e https://taweihuang.hpd.io/2016/09/21/讀者提問:什麼是支持向量機-svm/ https://en.wikipedia.org/wiki/Support-vector_machine 這問題可能菜得很蠢,不過還是請好心的大大們指導一下,謝謝QQ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.226.219.84 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1559659093.A.457.html

06/04 23:17, 5年前 , 1F
三言兩語講不完,你把W和b乘以任意值,Wx+b的結果
06/04 23:17, 1F

06/04 23:17, 5年前 , 2F
都會不一樣,所以要配上另一條constrain才有意義
06/04 23:17, 2F

06/04 23:18, 5年前 , 3F
可以去u2搜林軒田教授講SVM的部分
06/04 23:18, 3F

06/05 04:40, 5年前 , 4F
選 1 算是通用吧 也是為了後續推導用 事實上沒差
06/05 04:40, 4F

06/05 04:40, 5年前 , 5F
wx+b>=1 兩邊同乘 0.5 變 0.5wx+0.5b>=0.5
06/05 04:40, 5F

06/05 04:40, 5年前 , 6F
令 w'=0.5w b'=0.5b 就變成 w'x+b'>=0.5
06/05 04:40, 6F

06/05 04:40, 5年前 , 7F
這式子透過同樣方法求出來的 線是一樣的
06/05 04:40, 7F

06/05 04:40, 5年前 , 8F
反正主要是要理解 SVM 想要去 maximize margin
06/05 04:40, 8F

06/05 04:40, 5年前 , 9F
假如當初選 1 的話
06/05 04:40, 9F

06/05 04:40, 5年前 , 10F
可以透過兩平行線距離求得 margin = 2/|w|
06/05 04:40, 10F

06/05 04:40, 5年前 , 11F
而實際上很難找到一條線完整把正負資料分開
06/05 04:40, 11F

06/05 04:40, 5年前 , 12F
所以可以參考 soft SVM
06/05 04:40, 12F

06/05 04:40, 5年前 , 13F
容忍資料與線中有些許的誤差去做分類
06/05 04:40, 13F

06/05 04:40, 5年前 , 14F
詳細的內容可以參考林軒田老師的教學
06/05 04:40, 14F

06/05 12:49, 5年前 , 15F
樓上是對的 因為經過scale過了
06/05 12:49, 15F

06/05 19:23, 5年前 , 16F
其實那個1就是方便計算而已,因為那是"最大邊界"。就算
06/05 19:23, 16F

06/05 19:23, 5年前 , 17F
你不設1,基於最優化,max(margin/||w||),更新過後的w'
06/05 19:23, 17F

06/05 19:23, 5年前 , 18F
=w/margin,代入後就是max(1/||w'||),考慮正負就是2/||
06/05 19:23, 18F

06/05 19:23, 5年前 , 19F
w||
06/05 19:23, 19F

06/05 19:25, 5年前 , 20F
這在物理意義上代表今天你就算設100,svm在做最優化他
06/05 19:25, 20F

06/05 19:25, 5年前 , 21F
還是會自動幫你找到間隔在正負1之間。
06/05 19:25, 21F

06/07 16:42, 5年前 , 22F
06/07 16:42, 22F

06/07 16:44, 5年前 , 23F
Soft-Margin SVM, https://bit.ly/2XxM2rB
06/07 16:44, 23F
文章代碼(AID): #1Sze9LHN (DataScience)
文章代碼(AID): #1Sze9LHN (DataScience)