[問題] 讀取csv檔的小問題

看板R_Language作者 (ToastCheng哥)時間10年前 (2015/01/16 14:42), 編輯推噓2(2011)
留言13則, 5人參與, 最新討論串1/1
[問題類型]: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 新手(沒寫過程式,R 是我的第一次) [問題敘述]: 我主要是想問read.csv(或read.table)在什麼情況下會出問題, 在參數的設定上是不是只要sep有先注意是""還是","、quote有 時要設成""之外,其他都只是讀取檔案的偏好而不影響能不能讀取成功~? 會有這個問題是因為在網路上看到交大的課程,好奇點了作業2 http://ghuang.stat.nctu.edu.tw/course/bigdata14/homework.asp 有一個csv檔,我成功地用download.file(url,destfile,method="curl") 下載下來(在電腦也能直接開啟) 但是用read.table或read.csv卻一直出錯, 但開啟其他csv檔卻沒問題(參數都用一樣的) [程式範例]: > read.csv("/Users/Toast/Desktop/coursera R/FiveCities2.csv") 結果: 錯誤在make.names(col.names, unique = TRUE) : 無效的多位元組字串於 '<b6>m<c2><ed><a5><ab><b0><cf>' -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.118.40.10 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1421390552.A.D5C.html

01/16 15:05, , 1F
我試的結果是因為encoding是big5才會有這樣的錯誤,可以
01/16 15:05, 1F

01/16 15:05, , 2F

01/16 15:06, , 3F
ata_import_and_export/import_data.html
01/16 15:06, 3F

01/16 15:13, , 4F
"string,"string2",這種就會出問題
01/16 15:13, 4F

01/17 03:11, , 5F
感謝ty大,我成功用readline+for loop將它換成utf8重
01/17 03:11, 5F

01/17 03:11, , 6F
開了,不過好複雜阿@@,以後遇到big5編碼只能這樣解決
01/17 03:11, 6F

01/17 03:11, , 7F
01/17 03:11, 7F

01/17 03:58, , 8F
可以先用命令列工具把檔案轉成utf8
01/17 03:58, 8F

01/17 07:37, , 9F
read.csv(fileEncoding='big5'),不過有可能會掉字
01/17 07:37, 9F

01/17 15:17, , 10F
感謝~晚點來試試
01/17 15:17, 10F

01/17 22:06, , 11F
原來是fileEncoding...一開始一直改encoding="big5"
01/17 22:06, 11F

01/18 07:15, , 12F
在read.xxx的函式裡,encoding是輸出的編碼
01/18 07:15, 12F

01/19 02:14, , 13F
感謝大家,我完成了~~~
01/19 02:14, 13F
文章代碼(AID): #1KkBBOrS (R_Language)
文章代碼(AID): #1KkBBOrS (R_Language)