[問題] 讀取CSV檔英文部分亂碼

看板R_Language作者 (小刀會序曲)時間7年前 (2018/04/04 20:26), 7年前編輯推噓1(104)
留言5則, 4人參與, 7年前最新討論串1/1
[問題類型]: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 入門(寫過其他程式,只是對語法不熟悉) [問題敘述]: 讀取CSV檔時,總共只有兩行,第一行原名稱是HUMERUS,第二行是CODE 但讀進去第一行名稱變成UMERUS,H變成中文亂碼,第二行正常。 想請問為甚麼會這樣呢? CSV檔是xls檔轉成的,會是因為這個原因嗎? 如果是該怎麼辦,第一次遇到英文亂碼變成中文的.. 謝謝 [程式範例]: test<-read.table("CASE.csv",sep=",",header = T,encoding="big5") test<-read.table("CASE.csv",sep=",",header = T,encoding="UTF-8") test<-read.table("CASE.csv",sep=",",header = T) 以上三個都試過了.. [關鍵字]: 讀檔 英文 亂碼 CSV -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.226.45.84 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1522844775.A.30A.html

04/04 20:32, 7年前 , 1F
用notepad++去看編碼吧
04/04 20:32, 1F

04/04 20:32, 7年前 , 2F
另外還可以用顯示所有字元去看是否有其他字元
04/04 20:32, 2F
編碼是UTF8 BOM檔首,字元全都是CRLF read.csv("CASE.csv",header=T,sep=",",fileEncoding = "UTF-8-BOM") 改成這樣就可以了!!!感謝大大

04/04 20:41, 7年前 , 3F
csv檔打開是亂碼嗎?
04/04 20:41, 3F
不是耶 打開是正常的沒有亂碼 ※ 編輯: disney82231 (36.226.45.84), 04/04/2018 21:53:24 ※ 編輯: disney82231 (36.226.45.84), 04/04/2018 21:56:47

04/04 22:00, 7年前 , 4F
所以應該又是BOM害的。
04/04 22:00, 4F

04/04 22:31, 7年前 , 5F
真想拿有bom的檔案來試試,R不是implictly把BOM幹掉了
04/04 22:31, 5F
文章代碼(AID): #1QnCHdCA (R_Language)
文章代碼(AID): #1QnCHdCA (R_Language)