[問題] 讀取中文檔案

看板R_Language作者 (情弒月)時間9年前 (2015/03/05 16:14), 9年前編輯推噓0(003)
留言3則, 2人參與, 最新討論串1/1
[問題類型]: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 入門(寫過其他程式,只是對語法不熟悉) [問題敘述]: 想要抓PTT的資料來斷詞 目前已經可以抓到資料並存成中文檔案 可是利用 Corpus(DirSource("docs", encoding = 'UTF-8')) 讀取的時候 中文字全部變成 <U+ 開頭的字串 把查詢結果存到 TermDocumentMatrix 用 inspect 看結果應該是有斷成功 可是全部都變成奇怪的字了阿.... 想請問怎麼把中文字找回來QQ ===已解決=== 原本是在Win8.1上開發 換到Win7環境就沒問題了 [程式範例]: 程式碼可以看這邊 http://ideone.com/icNr73 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.165.197.23 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1425543290.A.A09.html ※ 編輯: sansea (118.165.197.23), 03/05/2015 16:15:48 ※ 編輯: sansea (118.165.197.23), 03/05/2015 16:17:08

03/05 19:31, , 1F
R的版本?
03/05 19:31, 1F

03/05 22:40, , 2F
3.1.2
03/05 22:40, 2F
※ 編輯: sansea (118.165.188.46), 03/06/2015 10:54:31

03/08 22:23, , 3F
我猜 把R 版本下降 就OK
03/08 22:23, 3F
文章代碼(AID): #1K-11we9 (R_Language)
文章代碼(AID): #1K-11we9 (R_Language)