PTT數位生活區 / R_Language

[問題] 讀取中文檔案

看板R_Language作者sansea (情弒月)時間11年前 (2015/03/05 16:14)推噓0(0推 0噓 3→)

留言3則, 2人參與討論串1/1

[問題類型]: 程式諮詢(我想用R 做某件事情，但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 入門(寫過其他程式，只是對語法不熟悉) [問題敘述]: 想要抓PTT的資料來斷詞目前已經可以抓到資料並存成中文檔案可是利用 Corpus(DirSource("docs", encoding = 'UTF-8')) 讀取的時候中文字全部變成 <U+ 開頭的字串把查詢結果存到 TermDocumentMatrix 用 inspect 看結果應該是有斷成功可是全部都變成奇怪的字了阿.... 想請問怎麼把中文字找回來QQ ===已解決=== 原本是在Win8.1上開發換到Win7環境就沒問題了 [程式範例]: 程式碼可以看這邊 http://ideone.com/icNr73 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.165.197.23 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1425543290.A.A09.html ※ 編輯: sansea (118.165.197.23), 03/05/2015 16:15:48 ※ 編輯: sansea (118.165.197.23), 03/05/2015 16:17:08

→

03/05 19:31, , 1^F

03/05 19:31, 1^F

→

03/05 22:40, , 2^F

03/05 22:40, 2^F

※ 編輯: sansea (118.165.188.46), 03/06/2015 10:54:31

→

03/08 22:23, , 3^F

03/08 22:23, 3^F

‣ 返回看板[ R_Language ] 程式

‣ 更多 sansea 的文章

文章代碼(AID): #1K-11we9 (R_Language)

R_Language 近期熱門文章

2

2

Re: [問題] geombar分類對齊函數

1年前, 04/24

2

2

[問題] geombar分類對齊函數

1年前, 04/21

1

2

徵求R studio家教

1年前, 01/17

1

7

[問題] 請問如何多次複製1筆資料? (求救)

1年前, 11/10

4

6

[問題] 如何將資料重組 (觀察值轉成變數)？

1年前, 10/28

2

8

[問題] 可否以RODBC去連Oracle??

1年前, 08/21

1

3

[問題] augPred function 出現錯誤訊息?

2年前, 07/27

2

8

[問題] IRT相關問題

2年前, 05/01

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

9

14

Re: [閒聊] 傳聞下周N卡漲20% 8月其他零件跟上

[ PC_Shopping ]

55分鐘前, 07/29

13

54

Re: [閒聊] 微軟:8G RAM超適合日常使用der

[ PC_Shopping ]

4小時前, 07/29

-1

5

[販售] 全國 AirPods Pro 2 未使用整新品

8小時前, 07/29

5

13

[問題] 原廠線材使用的現況詢問

9小時前, 07/29

11

23

[購機] R11、小米17、reno 16

12小時前, 07/28

-2

29

[新聞] LINE官方帳號大當機！業者崩潰：看不到

13小時前, 07/28

3

52

[菜單] 60K遊戲機請益

[ PC_Shopping ]

13小時前, 07/28

8

11

[賣/台中/皆可] 老舊文書機

[ HardwareSale ]

15小時前, 07/28

更多即時熱門文章 >>

‣ 返回看板[ R_Language ] 程式

‣ 更多 sansea 的文章

文章代碼(AID): #1K-11we9 (R_Language)