[問題] 不同資料集欄位比對,再輸出比對結果

看板R_Language作者 (特務)時間9年前 (2016/12/25 17:46), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串1/2 (看更多)
- 問題: 當你想要問問題時,請使用這個類別。 [問題類型]: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 入門(寫過其他程式,只是對語法不熟悉) [問題敘述]: 手邊有兩個資料集,分別是 data1 (預計發車時間), data2 (實際發車時間) 我想做的事情是根據起站發車班表 data1 ,寫個判斷式進行時間比對 先上兩個資料集的格式與內容示意 data1 data2 預期結果 Bus_No. DepartureTime DepartureTime Bus_No. 1 5:50 2015-12-25 06:51:20 4 2 6:10 2015-12-26 06:53:30 4 3 6:30 2015-12-27 06:29:58 3 4 6:50 2015-12-28 05:52:32 1 5 7:10 2015-12-29 07:09:24 5 判斷式的判斷條件: data1是預計發車時間,data2是實際發車時間, 比對方式:找實際發車時間與預計發車時間差距最小者(發車前後5分鐘都認定為該Bus_No.) Bus_No.的判定結果目前是打算用dpylr加在data2的Departure欄位後面, 最後結果輸出為data3(內含 DepartureTime 和 Bus_No. 兩個欄位) 碰到的問題: 1.卡在不同資料集的欄位資料比對 2.data1的Departure欄位 和 data2的Departure欄位 時間格式不一樣,不知怎麼寫判斷式 以上問題還要再麻煩各位大大解惑了@@ [程式範例]: data3 <- data2[.(這邊應該是寫時間判斷的東西,但我想不出怎麼寫), ] %>% .[.(DepartureTime, Bus_No.)] [環境敘述]: 請提供 sessionInfo() 的輸出結果, 裡面含有所有你使用的作業系統、R 的版本和套件版本資訊, 讓版友更容易找出錯誤 [關鍵字]: dplyr -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.136.219 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1482659170.A.47F.html
文章代碼(AID): #1ONvLYH_ (R_Language)
文章代碼(AID): #1ONvLYH_ (R_Language)