[問題] 請問SVM的問題

看板CSSE (電腦科學及軟體工程)作者 (憶 本象)時間11年前 (2013/01/31 11:27), 編輯推噓3(308)
留言11則, 4人參與, 最新討論串1/1
大家好,我有一個關於 SVM 的小問題想請教。 就是 SVM 中 feature 的值能不能混用 binary,例如: <0,1>來表示有出現跟沒出現 跟連續值,例如: <0.7, 0.9> 這種經過權重後的數值。 因為我是做 text mining,我想要同時有 binary 跟 權重的特徵, 但不曉得這樣混用會不會有影響,或是有要考量的地方,請大大們指教。 p.s. 因為我第一次找到這個版,若是有其他更適合討論 Machine Learning 相關的 地方,煩請告訴我,謝謝!! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.36.65.1

02/01 04:39, , 1F
fuzzy SVM ?
02/01 04:39, 1F

02/01 10:33, , 2F
所以代表SVM原本是不建議這樣設定特徵值囉? ~"~
02/01 10:33, 2F

02/04 19:47, , 3F
我研所作文件自動分類 有使用Weighting的效果會比Binary的
02/04 19:47, 3F

02/04 19:48, , 4F
表示方式好得多 就是會分的比較準 如果你要混用 我覺得可以
02/04 19:48, 4F

02/04 19:49, , 5F
試試啦 不會怎樣 效果不一定 有時候也要看那個Feature是否
02/04 19:49, 5F

02/04 19:50, , 6F
本身有鑑別力
02/04 19:50, 6F

02/15 19:05, , 7F
剛好我目前也在做類似的研究!目前感覺起來還是feature
02/15 19:05, 7F

02/15 19:06, , 8F
的鑑別度影響比較大,目前我也有用到混用的部分,
02/15 19:06, 8F

02/15 19:07, , 9F
在可以拆成多個binary的情況下,使用binary的效果感覺上
02/15 19:07, 9F

02/15 19:08, , 10F
比起用單一個實數表示稍微好些,不知道是不是因為採用
02/15 19:08, 10F

02/15 19:09, , 11F
更多維度做判斷有利提升準確性的關係
02/15 19:09, 11F
文章代碼(AID): #1H2UI_p3 (CSSE)
文章代碼(AID): #1H2UI_p3 (CSSE)