Re: [問題] 求解此檔案如何讀入和如何跑出分群
大概寫了一下。
最後 res 是 species by locations 的 binary matrix 為所求。
重點是在要把所有的地點集中起來再逐列與各spp出現的地點做比對。
library(magrittr)
## fatch data
con <-
url(
"http://archive.ics.uci.edu/ml/machine-learning-databases/plants/plants.data",
"r"
)
src <- readLines(con)
close(con)
## split string by comma
srcLine <- strsplit(src, ",")
## get sp name
sppName <-
lapply(srcLine, function(x) {
x[1]
}) %>%
unlist
## get location name per sp
locName <-
lapply(srcLine, function(x) {
x[-1]
})
## get all unique location name
locNameUni <- locName %>% unlist %>% unique
## binary matrix
res <-
lapply(locName, function(x) {
locNameUni %in% x
}) %>%
do.call("rbind", .) %>%
set_colnames(locNameUni) %>%
set_rownames(sppName)
※ 引述《genius888053 (少年YO)》之銘言:
: https://i.imgur.com/InHBPvq.jpg

: 我複製到記事本後用txt檔案方式讀取可是卻發生以下問題
: https://i.imgur.com/A7iKdyy.jpg

: 上圖我有試著將sep刪除掉 可是一樣發生上述情形
: https://i.imgur.com/dnBtUX7.jpg

: 儘管我讀出來後卻發生資料不整齊和變數只有一筆的情形
: 求板上大大提點
: 第一次發文,有誤請見諒
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.246.95.32
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1528474412.A.814.html
※ 編輯: andrew43 (111.246.95.32), 06/09/2018 00:14:48
※ 編輯: andrew43 (111.246.95.32), 06/09/2018 00:15:35
→
06/09 00:52,
7年前
, 1F
06/09 00:52, 1F
→
06/09 00:53,
7年前
, 2F
06/09 00:53, 2F
→
06/09 00:54,
7年前
, 3F
06/09 00:54, 3F
推
06/09 01:45,
7年前
, 4F
06/09 01:45, 4F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 3 篇):
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章