[問題] silhouette 使用方法
[問題類型]:
程式諮詢
[軟體熟悉度]:
新手(沒寫過程式,R 是我的第一次)
[問題敘述]:
我想使用silhouette這個package
我把資料改成我的(其他都沒改)
但結果怪怪的
我想可能是有些變數必需修改
但因為我看不懂程式碼
不知道從何改
想請問有人成功使用過這個package嗎?
可以教我嗎?
我會非常感激
謝謝
package的pdf檔網址
http://ftp.yzu.edu.tw/CRAN/web/packages/cluster/cluster.pdf
在第66頁
--------------------------------------------------------------------
我複製example的範例
把原先"ruspini"的資料
改成我自己的資料"abbc"
然後將原範例算距離的方法"canberra"
改成另一個算距離的方法"euclidean"
其他都沒改 只改了這兩部分
我最終的目的就是希望透過這個方法
得到我的資料應該分K群
不知道程式這樣改之後是不是對的
再麻煩您幫我看看
謝謝
程式碼如下:
pr4 <- pam(abbc, 4)
str(si <- silhouette(pr4))
(ssi <- summary(si))
plot(si) # silhouette plot
plot(si, col = c("red", "green", "blue", "purple"))# with cluster-wise
coloring
si2 <- silhouette(pr4$clustering, dist(abbc, "euclidean"))
summary(si2) # has small values: "euclidean"'s fault
plot(si2, nmax= 80, cex.names=0.6)
op <- par(mfrow= c(3,2), oma= c(0,0, 3, 0),
mgp= c(1.6,.8,0), mar= .1+c(4,2,2,2))
for(k in 2:6)
plot(silhouette(pam(abbc, k=k)), main = paste("k = ",k), do.n.k=FALSE)
mtext("PAM(abbc) as in Kaufman & Rousseeuw, p.101",
outer = TRUE, font = par("font.main"), cex = par("cex.main")); frame()
## the same with cluster-wise colours:
c6 <- c("tomato", "forest green", "dark blue", "purple2", "goldenrod4",
"gray20")
for(k in 2:6)
plot(silhouette(pam(abbc, k=k)), main = paste("k = ",k), do.n.k=FALSE,
col = c6[1:k])
par(op)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 115.43.79.63
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1426397900.A.CA9.html
→
03/15 15:15, , 1F
03/15 15:15, 1F
你好 我附上pdf檔的網址了 謝謝你
※ 編輯: vioan223 (115.43.79.63), 03/15/2015 18:50:52
推
03/15 19:57, , 2F
03/15 19:57, 2F
推
03/15 20:01, , 3F
03/15 20:01, 3F
※ 編輯: vioan223 (115.43.79.63), 03/15/2015 22:06:45
※ 編輯: vioan223 (115.43.79.63), 03/15/2015 22:07:20
→
03/15 23:37, , 4F
03/15 23:37, 4F
→
03/15 23:38, , 5F
03/15 23:38, 5F
abbc資料的內容是有九個數值屬性 像是年齡、身高這種 共有1千多筆資料 謝謝你~
※ 編輯: vioan223 (115.43.79.63), 03/16/2015 08:22:42
→
03/16 12:26, , 6F
03/16 12:26, 6F
→
03/16 12:26, , 7F
03/16 12:26, 7F
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章