[問題] dataframe運作embed及修正timedelay首欄

看板R_Language作者 (社會黑暗、行路難)時間6年前 (2019/03/26 11:09), 編輯推噓1(101)
留言2則, 2人參與, 6年前最新討論串1/2 (看更多)
[問題類型]: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 入門(寫過其他程式,只是對語法不熟悉) [問題敘述]: 【原始資料型態】 > tao_b %>% + select(鄉鎮市區, 交易標的, 建物型態, 交易日期, 單價元平方公尺) %>% + arrange(鄉鎮市區, 交易標的, 建物型態, 交易日期, 單價元平方公尺) # A tibble: 86,181 x 5 鄉鎮市區 交易標的 建物型態 交易日期 單價元平方公尺 <chr> <chr> <chr> <dttm> <dbl> 八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012/6/18 36178 八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012/7/2 29795 八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012/7/6 30798 八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012/7/9 35814 八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012/7/15 30679 八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012/7/18 25065 八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012/7/20 52635 八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012/7/23 33718 八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012/7/23 33805 八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012/7/24 27712 # ... with 86,171 more rows 【所欲資料樣貌】 鄉鎮市區 交易標的 建物型態 交易日期 單價元平方公尺 timedelay [後兩項相減] (略) (略) (略)(略)   36178 33805 2373 29795 36178 -6383 30798 29795 1003 35814 30798 5016 30679 35814 -5135 25065 30679 -5614 52635 25065 27570 33718 52635 -18917 33805 33718 87 27712 33805 -6093 【遭遇問題】 1. 單獨用embed()拿到欄位timedelay欄位可以,但是要在檔案tao_b裡面新增這個欄位, 不知道該如何是好。 embed(tao_b$單價元平方公尺, 2) 2. 由於資料排序之下會有不同的鄉鎮市區、交易標的和建物型態,每項條件相同的 第一欄timedelay應修正為0,該如何用簡單指令找到該欄位並取代為0? (也就是上表顯示為'2373'的欄位) 3. 從上表來看,由於同條件下,2012-07-23的資料有兩筆,想要直接合併變成一筆, 期待結果為: 八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012-07-23 33761.5 =median(c(33718, 33805)) 由於資料量大,如果逐步清理資料會很花時間,想請教有無聰明的作法。 還先感謝大家~ [環境敘述]: > sessionInfo() R version 3.5.1 (2018-07-02) Platform: x86_64-w64-mingw32/x64 (64-bit) Running under: Windows >= 8 x64 (build 9200) [關鍵字]: embed() timedelay 資料整合 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.222.194.251 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1553569789.A.7EF.html

03/26 18:01, 6年前 , 1F
請問 embed 是什麼 function啊?
03/26 18:01, 1F

03/27 02:56, 6年前 , 2F
不是非常肯定是不是你要的 https://ideone.com/Aj4IX9
03/27 02:56, 2F
文章代碼(AID): #1ScPVzVl (R_Language)
文章代碼(AID): #1ScPVzVl (R_Language)