[問題] N*1資料 轉 a*b格式

看板R_Language作者 (打滾)時間8年前 (2017/08/22 16:08), 8年前編輯推噓1(1010)
留言11則, 4人參與, 最新討論串1/5 (看更多)
[問題類型]: N*1的資料 轉換成M*16 [軟體熟悉度]: R初學 [問題敘述]: 原始資料(csv檔)資料大致是這樣: time1 a = 5 b = 70 c = "rest" ... ... time2 a = 8 b = 15 c = "rest_2" ... ... 想要以16列為單位整理成M*16的矩陣 第一列是col標題 和每列前面的a,b,c等是row標題 類似這樣: time a b c ... time1 5 70 "rest" time2 8 15 "rest_2" 有找一些指令好像都是以同col內同樣資料來分組 所以不太知道目前需要做的這功能要怎麼處理 手機發文,排版請見諒 感謝大家 ----- Sent from JPTT on my Xiaomi MI 5. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.140.91.168 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1503389305.A.6A1.html ※ 編輯: playaround (223.140.91.168), 08/22/2017 16:09:03 ※ 編輯: playaround (223.140.91.168), 08/22/2017 16:11:05

08/22 16:14, , 1F
原始的資料檔案是什麼樣的格式可以一併說明。
08/22 16:14, 1F

08/22 16:15, , 2F
否則回答你的解法說不定根本沒辦法套用。
08/22 16:15, 2F
您好,檔案為csv檔 剛還有修改一下問題,再麻煩大大了 ※ 編輯: playaround (223.140.91.168), 08/22/2017 16:32:39 ※ 編輯: playaround (223.140.91.168), 08/22/2017 16:35:00

08/22 16:36, , 3F
重點就在CSV裡頭長什麼樣。簡單貼一下?
08/22 16:36, 3F
抱歉因為是內部系統下來的raw data,所以有沒辦法提供@@ 資料格式如範例那樣 每組是 第一列是time 後面15列都是a,b,c= 數字/字串 這樣多組連在一起 ※ 編輯: playaround (223.140.91.168), 08/22/2017 16:51:26 ※ 編輯: playaround (223.140.91.168), 08/22/2017 17:32:55 ※ 編輯: playaround (223.140.91.168), 08/22/2017 17:34:03

08/22 17:36, , 4F
matrix,ncol=16試試
08/22 17:36, 4F

08/22 17:37, , 5F
之後再自己設colname
08/22 17:37, 5F

08/22 18:28, , 6F
matrix不能混雜數字和字串。大概還是data frame或list吧
08/22 18:28, 6F
是XD 我單用matrix出來會得到奇怪的東西0.0

08/22 21:47, , 7F
建立matrix時是可以混雜數字和字串,但接下來運算可能會
08/22 21:47, 7F

08/22 21:47, , 8F
產生奇怪的結果
08/22 21:47, 8F
感謝各位大大都還特地發文指導@@ 我會先把各位提供的意見都先消化一下 之後如果還有問題的話再來請教各位 太感謝了 ※ 編輯: playaround (114.35.98.14), 08/23/2017 00:55:20 想再請教一下各位,不知道R語言對於資料量的處理效率是如何? 因為我在嘗試各位提供的方法時,發現把檔案丟進去處理 在下面console的地方等很久還是沒有>出現 想把過程中的一個階段的data也點出來看也常常是還在跑的空白XD 我的data全部約57萬筆 因為之前只有load過10萬筆內的資料去練習畫圖之類的而已 所以不知道是不是上到這個數字量的資料後 R在執行上就會比較需要時間? 或是可能只是我程式有地方沒改好XD ※ 編輯: playaround (114.35.98.14), 08/23/2017 03:13:54

08/23 12:34, , 9F
應該是程式不熟悉的問題 57萬筆不算大
08/23 12:34, 9F

08/23 12:35, , 10F
我目前處理超過千萬的data 都很順
08/23 12:35, 10F
了解 謝謝~ ※ 編輯: playaround (223.140.91.168), 08/23/2017 18:15:10

08/23 18:31, , 11F
看你用哪種方式,我的方法應該不至於跑超過三分鐘
08/23 18:31, 11F
文章代碼(AID): #1Pc-PvQX (R_Language)
文章代碼(AID): #1Pc-PvQX (R_Language)