[問題] input data (非mxn)

看板R_Language作者 (yaowei)時間10年前 (2014/10/23 19:10), 編輯推噓3(306)
留言9則, 6人參與, 最新討論串1/1
[軟體熟悉度]: 新手(沒寫過程式,R 是我的第一次) [問題敘述]: input一個一開始行數不均的csv的data [程式範例]: 我知道這問題有點蠢 但因為這個data它有1.5 GB Excel打開到一半就掛了 還失去後面的一部分資訊 想說用R開並整理資料 沒料到這筆資料是長這樣的(在Excel看到前半部分資料) 例如: xxx xxx xxx xxx ←這些xxx我都不要 xxx xxx xxx xxx Name ID A B C D ←從這行開始以下才是我要的資料 a b c d e f g h i j k l . . . 可是因為不是mxn 標準dataframe的格式 (假設我要的資料是m x n) R loading進去之後就整個亂掉了 變成 k x 2 也就是我資料全部變成2個column全亂掉... 但我沒辦法開啟excel把不要的部分刪掉 請問這該怎麼辦QAQ 有什麼好建議 或挽救的整理方式 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.211.93 ※ 文章網址: http://www.ptt.cc/bbs/R_Language/M.1414062650.A.30C.html

10/23 20:37, , 1F
你如果知道前面不需要的資料的行數,可以用skip掉
10/23 20:37, 1F

10/23 20:37, , 2F
請使用skip這個參數
10/23 20:37, 2F

10/23 20:39, , 3F
skip=列數
10/23 20:39, 3F

10/23 21:03, , 4F
感謝!!!!
10/23 21:03, 4F

10/24 21:55, , 5F
你可以用 Notepad++ 或 Notepad2 打開大的csv, 修改檔案.
10/24 21:55, 5F

10/25 00:26, , 6F
read.delim("",skip=10) 這樣應該可以
10/25 00:26, 6F

10/25 00:27, , 7F
另一種方式是用 scan("",what="character") 但這需要會寫
10/25 00:27, 7F

10/25 00:27, , 8F
程式才能做後續處理
10/25 00:27, 8F

10/25 14:44, , 9F
read.table的時候 fill=TRUE看看
10/25 14:44, 9F
文章代碼(AID): #1KIE8wCC (R_Language)
文章代碼(AID): #1KIE8wCC (R_Language)