[問題] t() 轉秩後問題
- 問題: 當你想要問問題時,請使用這個類別
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
請把以下不需要的部份刪除
使用者(已經有用R 做過不少作品)
[問題敘述]:
請簡略描述你所要做的事情,或是這個程式的目的
我想問
一般我到資料都是 長這樣的.csv
txt1 ALICE... 2015/01/02
txt2 asking... 2015/01/04
txt3 people.. 2015/01/13
. . .
. . .
. . .
但是資料很大 一轉秩後 EXCEL 就打不開
txt1 txt2 txt3 . . . .
ALICE.. askainq.... people....XX
2015/01/02 2015/01/04 2015/01/13
做完 text mining 後
主要我拉出關鍵字後,到文章後
ex轉秩後,去比對原文章後,日期那欄無法帶出
ex轉秩後 EXCEL 打得開 日期帶得出
但是如果ex 資料量太大時 轉秩後 打不開
日期那欄就 GG了~~
library(xlsx)
ex<-read.xlsx(file.choose(),2)
ex<-t(ex)
health<-grep("health", f8)
write.csv(ex[health],file="health.csv")
[程式範例]:
f1<-read.csv(file.choose(),sep=",")
f1<-t(f1)
f2 <- Corpus(VectorSource(f1))
#one<- tm_map(one, PlainTextDocument)
f3<- tm_map(f2, removePunctuation)
f4 <- tm_map(f3, removeNumbers)
f5 <- tm_map(f4, tolower)
f6 <- tm_map(f5, removePunctuation)
f7 <- tm_map(f6, removeWords, stopwords("english"))
f8<-tm_map(f7, stemDocument)
library(xlsx)
ex<-read.xlsx(file.choose(),2)
health<-grep("health", f8)
write.csv(ex[health],file="health.csv")
[關鍵字]:
t()
選擇性,也許未來有用
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.187.182
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1422840082.A.EA7.html
推
02/02 10:08, , 1F
02/02 10:08, 1F
→
02/02 10:09, , 2F
02/02 10:09, 2F
→
02/02 10:10, , 3F
02/02 10:10, 3F
→
02/02 10:11, , 4F
02/02 10:11, 4F
因為我用 grep f8 去對應位址 txtX
然後在ex 要去對應位址取出 日期
其實ex與f1是相同的 只是ex多了日期這項
health<-grep("health", f8)
write.csv(ex[health],file="health.csv")
※ 編輯: psinqoo (122.116.187.182), 02/02/2015 12:19:34
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章