[問題] 請問K-mean 的問題已回收

看板MATLAB作者 (小Bman)時間16年前 (2009/07/16 19:14), 編輯推噓2(206)
留言8則, 3人參與, 最新討論串1/1
小弟不才... 小弟最近做一個研究 是有關於 文字矩陣的!! 是 詞頻 的部分 橫 是 文字 直 是 文章 A B C D E F G ------------------------------------------------ D1 0 1 0 0 0 0 0 D2 1 0 1 0 0 0 0 D3 0 0 0 1 1 0 0 D4 0 0 0 0 0 1 1 是要利用 K-mean 去做一個分群 我想請問各位 大哥們 示意圖中有很多0 正規化過後 他數值還是 0 那這會不會影響 到 分群的結果 ? k-mean 要怎麼去證明說 分幾群 是比較好的結果? 不好意思!! 我有用 entropy 跟 purity去做驗證 可是 不管我怎麼做 出現的Value都是 非常的小 可以麻煩各位大大幫我解釋一下 是為什麼啊? 小弟 真的很需要你這份答案!! 感謝(跪 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 163.17.9.93

07/17 01:35, , 1F
我只知道有探討kmean分群最佳化的研究~囧
07/17 01:35, 1F

07/17 01:58, , 2F
正規化 會將數字轉換為指定區間値,一般而言是轉化為1~
07/17 01:58, 2F

07/17 01:59, , 3F
0之間,既然你數字只有0和1 理所當然正規化之後 1就是1...
07/17 01:59, 3F

07/17 02:01, , 4F
有幾種方式可以做驗證 你提的那幾個也在內,數字非常小沒
07/17 02:01, 4F

07/17 02:02, , 5F
關係 那是一個相對比較值,而非絕對大小值,詳細請參照
07/17 02:02, 5F

07/17 02:02, , 6F
各指標定義...
07/17 02:02, 6F

07/24 13:58, , 7F
entropy高代表purity高,以你給的資料,用k-means似乎
07/24 13:58, 7F

07/24 13:59, , 8F
不合適,考慮k-median或者NB吧,純粹個人意見
07/24 13:59, 8F
文章代碼(AID): #1ANmkQR1 (MATLAB)
文章代碼(AID): #1ANmkQR1 (MATLAB)