[問題] 跑文字mining的錯誤訊息

看板R_Language作者 (nh)時間9年前 (2015/05/31 12:16), 編輯推噓1(104)
留言5則, 2人參與, 最新討論串1/2 (看更多)
[問題類型]: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 請把以下不需要的部份刪除 入門(寫過其他程式,只是對語法不熟悉) [問題敘述]: 請簡略描述你所要做的事情,或是這個程式的目的 [環境敘述]: mac Rstudio, R3.2 corp = Corpus(DirSource("./text/combine/")) head(corp) corp = tm_map(corp, stripWhitespace) corp = tm_map(corp, removePunctuation) corp = tm_map(corp, removeNumbers) corp = tm_map(corp, function(word){ gsub("[A-Za-z0-9]","",word)}) corp = tm_map(corp, PlainTextDocument) corp = tm_map(corp, removeWords,stopwords("english")) # 中文 stop words stopss = stopwordsCN() corp = tm_map(corp,removeWords, stopss) # 中文斷詞 corp2 = tm_map(corp, content_transformer(segmentCN)) corp2 = tm_map(corp, content_transformer(segmentCN), returnType = 'tm') corp2 <- tm_map(corp, content_transformer(segmentCN), nature = TRUE) corp2 <- tm_map(corp, function(sentence) { noun <- lapply(sentence, function(w) { w[names(w) == "n"] }) unlist(noun) }) corp3 = Corpus(VectorSource(corp2)) 跑到最後一行就出現錯誤訊息寫: Error in UseMethod("meta", x) : 沒有適用的方法可將 'meta' 套用到 "character" 類別的物件 本來有想過是資料夾裡文件編碼的問題 但是文件有中有英文,中文小弟用程式轉成UTF8 ~~ 另一個問題是不知道各位面對很多big5碼,有什麼方式比較快轉成utf8的? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 120.97.23.81 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1433045808.A.9FB.html

05/31 12:33, , 1F
(非R方法)用sublime text打開,有安裝convertToUTF8
05/31 12:33, 1F

05/31 12:33, , 2F
的套件會自動轉換,只要按全部存檔,全部關閉.....
05/31 12:33, 2F

05/31 12:34, , 3F
最後一行的錯誤訊息就是你的input class不是他可以
05/31 12:34, 3F

05/31 12:34, , 4F
使用的....
05/31 12:34, 4F

05/31 13:19, , 5F
試試iconv?
05/31 13:19, 5F
文章代碼(AID): #1LQeimdx (R_Language)
討論串 (同標題文章)
文章代碼(AID): #1LQeimdx (R_Language)