[問題] 聚類分析的中心估計偏差
大家好,最近遇到一個問題,利用聚類分析可以得到還不錯的結果
但是實際應用上發現中心式的聚類演算法大多中心都會有誤差
示意圖如下
https://i.imgur.com/CpAWWg4.jpg
生成兩組半徑為1.5的,中心在x軸上兩個有overlap的分布
圖二是一般聚類演算法得到的分群於與對應的群中心,此例為使用Gaussian Mixture Model
會發現一般的演算法大概都會分成這樣的結果
但所得到的聚類中心都會是偏差估計量,甚至變異數也會低估
請問是否有相關文獻指出該如何修正聚類演算法的中心與變異偏差?
小弟在此先謝過各位了
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.216.138.92 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1576490971.A.3CF.html
→
12/16 18:44,
5年前
, 1F
12/16 18:44, 1F
DataScience 近期熱門文章
PTT數位生活區 即時熱門文章