Re: [心得] 資料整理套件介紹-第二章 dplyr(上)

看板R_Language作者 (拒看低質媒體)時間9年前 (2015/07/22 22:38), 編輯推噓1(105)
留言6則, 3人參與, 最新討論串2/2 (看更多)
dplyr 這個套件除了可以對R 的data.frame做處理之外, 也可以對SQL-like Data Source做資料ETL。 所以我是非常推薦版友把時間投資在這類套件之上。 這裡分享我一個實務經驗與玩具專案: https://github.com/wush978/dplyrSparkSQL 我利用這個套件串接Apache Spark這個高效能資料處理平台, 只要利用和dplyr完全一樣的語法, 可以輕鬆在一分鐘內處理億筆資料的整理。 我認為這類的介面會越來越多,因為不算難擴充(我自己花一個週末就寫了一個) 所以花時間投資dplyr ,未來的潛力是滿高的。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.165.189.37 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1437575926.A.93C.html

07/22 22:43, , 1F
當初要提這點也忘記了,感謝版大
07/22 22:43, 1F

07/22 23:05, , 2F
你寫得很棒,我只是錦上添花罷了
07/22 23:05, 2F

07/22 23:14, , 3F
謝謝,不過版大提到的也很重要,這個套件不只在資
07/22 23:14, 3F

07/22 23:14, , 4F
料整理方面還有其他值得投資的點,像是sql的api等
07/22 23:14, 4F

07/22 23:14, , 5F
07/22 23:14, 5F

07/23 09:22, , 6F
跟著強者學習,覺得很幸運^^
07/23 09:22, 6F
文章代碼(AID): #1Lhwhsay (R_Language)
文章代碼(AID): #1Lhwhsay (R_Language)