Re: [問題] 跑文字mining的錯誤訊息
library(tm)
library(tmcn)
library(Rwordseg)
x1 <-read.csv(file.choose(),header=T)#讀入資料
x2 <-Corpus(VectorSource(x1))#向量格式
x3 <- tm_map(x2, removePunctuation)#去除標點符號
x4 <- tm_map(x3, removeNumbers)#去除數字
x5 <- tm_map(x4, function(word) {
gsub("[A-Za-z0-9]", "", word)
})#清除大小寫英文與數字
#inspect(d.corpus )#看内容
x6 <- tm_map(x5,segmentCN, nature = TRUE)#斷詞
x7 <- Corpus(VectorSource(x6))
相同問題 執行到 x7
一樣出現
Error in UseMethod("meta", x) :
no applicable method for 'meta' applied to an object of class "character"
應該是升級 tm 包 後產生??
x7有誰知道這段如何改
※ 引述《nh2 (nh)》之銘言:
: [問題類型]:
:
: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
:
: [軟體熟悉度]:
: 請把以下不需要的部份刪除
: 入門(寫過其他程式,只是對語法不熟悉)
: [問題敘述]:
: 請簡略描述你所要做的事情,或是這個程式的目的
: [環境敘述]:
:
: mac Rstudio, R3.2
:
: corp = Corpus(DirSource("./text/combine/"))
: head(corp)
: corp = tm_map(corp, stripWhitespace)
: corp = tm_map(corp, removePunctuation)
: corp = tm_map(corp, removeNumbers)
: corp = tm_map(corp, function(word){
: gsub("[A-Za-z0-9]","",word)})
: corp = tm_map(corp, PlainTextDocument)
: corp = tm_map(corp, removeWords,stopwords("english"))
: # 中文 stop words
: stopss = stopwordsCN()
: corp = tm_map(corp,removeWords, stopss)
: # 中文斷詞
: corp2 = tm_map(corp, content_transformer(segmentCN))
: corp2 = tm_map(corp, content_transformer(segmentCN), returnType = 'tm')
: corp2 <- tm_map(corp, content_transformer(segmentCN), nature = TRUE)
: corp2 <- tm_map(corp, function(sentence) {
: noun <- lapply(sentence, function(w) {
: w[names(w) == "n"]
: })
: unlist(noun)
: })
: corp3 = Corpus(VectorSource(corp2))
: 跑到最後一行就出現錯誤訊息寫:
: Error in UseMethod("meta", x) :
: 沒有適用的方法可將 'meta' 套用到 "character" 類別的物件
: 本來有想過是資料夾裡文件編碼的問題
: 但是文件有中有英文,中文小弟用程式轉成UTF8 ~~
: 另一個問題是不知道各位面對很多big5碼,有什麼方式比較快轉成utf8的?
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.241.22.108
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1435162160.A.55A.html
→
06/25 17:55, , 1F
06/25 17:55, 1F
→
06/25 18:00, , 2F
06/25 18:00, 2F
推
06/27 01:13, , 3F
06/27 01:13, 3F
→
06/27 01:37, , 4F
06/27 01:37, 4F
→
06/27 06:27, , 5F
06/27 06:27, 5F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章