[問題] 列與列計算時間差,結果與預期不同

看板R_Language作者 (特務)時間8年前 (2017/01/01 07:21), 8年前編輯推噓0(0022)
留言22則, 3人參與, 最新討論串1/1
文章分類提示: - 問題: 當你想要問問題時,請使用這個類別。 [問題類型]: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 入門(寫過其他程式,只是對語法不熟悉) [問題敘述]: 請簡略描述你所要做的事情,或是這個程式的目的 如標題,我想做的是列與列的時間計算(以本例來說就是找不同車次發車時間間隔) 手邊有一份端點站的發車時間表如下所示 表定6:00~8:00「每隔10~20分不等」(去/返程)對開出一班車 我想要的結果是根據每個車次的發車時間找出一個range,用來判斷實際發車時間應屬哪一 車次 先假設這個range的預期結果是前後車次發車時間的中間值(5/5分配,之後可能會用2/8分) : (去/返程) (表定發車時間) (車次編號)    (預期結果↓) Goback Schedule_DepartTime Bus_No. rid1 qid1 start1 end1 difference 0 06:00 1 1 0 06:00 08:00 - 0 06:20 2 2 1 06:20 06:00 20min 0 06:35 3 3 2 06:35 06:20 15min 0 06:50 4 4 3 06:50 06:35 15min 0 07:00 5 5 4 07:00 06:50 10min 0 07:10 6 6 5 07:10 07:00 10min 0 07:25 7 7 6 07:25 07:10 15min 0 07:40 8 8 7 07:40 07:25 15min 0 08:00 9 9 8 08:00 07:40 20min 1 06:00 1 10 0 --- 1 06:20 2 11 1 --- 1 06:35 3 12 2 --- 1 06:50 4 13 3 --- 因兩端點發車時間相同故 1 07:00 5 14 4 --- Goback=1時之預期結果應 1 07:10 6 15 5 --- 與Goback=0之預期結果相 同 1 07:25 7 16 6 --- 1 07:40 8 17 7 --- 1 08:00 9 18 8 --- ###先新增column "rid1" 和 "qid1",時間相減時要用 式1 BusScedule_51[, Schedule_DepartTime :=      as.POSIXct(strptime(strptime( Schedule_DepartTime, "%H:%M"))] %>% 式2 Schedule_DepartTime, "%H:%M"))] %>%   .[ , c("rid1","qid1") := list( .I, {.I - .I[1L]}), by = .(Goback)] ###用上面2式新增的 "rid1" 和 "qid1" column跑以下式子, ###但出來的答案跟預期的答案不一樣 式3 BusScedule_51[ , start1 := Schedule_DepartTime[Bus_No.] ] 式4 BusScedule_51[ , end1 := Schedule_DepartTime[-qid1] ] 式5 BusScedule_51[ , difference := start1 - end1 ] 問題: 我知道式4裡面寫 [-qid1] 會抓讓過來的時間資料通通下移, 我想利用這個特性來作時間加減,但 qid1=0 的情況要怎麼處理difference我還沒想到.. 總之是拿之前寫的code改,但是出來的結果卻變成下面那樣: (請注意"---"右邊end1那一排): (去/返程) (表定發車時間) (車次編號) (預期結果↓) Goback Schedule_DepartTime Bus_No. rid1 qid1 start1 end1 difference 0 06:00 1 1 0 06:00 08:00 - 0 06:20 2 2 1 06:20 06:00 20min 0 06:35 3 3 2 06:35 06:20 15min 0 06:50 4 4 3 06:50 06:35 15min 0 07:00 5 5 4 07:00 06:50 10min 0 07:10 6 6 5 07:10 07:00 10min 0 07:25 7 7 6 07:25 07:10 15min 0 07:40 8 8 7 07:40 07:25 15min 0 08:00 9 9 8 08:00 07:40 20min 1 06:00 1 10 0 --- 08:00 1 06:20 2 11 1 --- 08:00 1 06:35 3 12 2 --- 06:00 1 06:50 4 13 3 --- 06:20 1 07:00 5 14 4 --- 06:35 1 07:10 6 15 5 --- 06:50 1 07:25 7 16 6 --- 07:00 1 07:40 8 17 7 --- 07:10 1 08:00 9 18 8 --- 07:20 如上所示,「資料出現在不該出現的位置」,搞了快2天還是搞不懂到底是哪裡寫錯了 請求板上大大們伸出援手...先謝謝大家orz [程式範例]: [環境敘述]: 請提供 sessionInfo() 的輸出結果, 裡面含有所有你使用的作業系統、R 的版本和套件版本資訊, 讓版友更容易找出錯誤 [關鍵字]: 選擇性,也許未來有用 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.136.219 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1483226505.A.DDD.html ※ 編輯: joson4921 (140.113.136.219), 01/01/2017 07:23:41

01/01 08:21, , 1F
如果只算時間差 diff:=start-shift(start),by=.(Goback)
01/01 08:21, 1F
好的,待會來試試@@ ※ 編輯: joson4921 (114.136.66.35), 01/01/2017 08:24:56

01/01 14:04, , 2F
建議拆成兩張表做,兩張表都用同一個函數處理
01/01 14:04, 2F

01/01 14:04, , 3F
之後再合併
01/01 14:04, 3F

01/01 14:04, , 4F
然後strptime跟as.POSIXct的performance很差
01/01 14:04, 4F

01/01 14:05, , 5F
我也會建議在前處理就做好,中間不要再轉換
01/01 14:05, 5F

01/01 14:05, , 6F
如果拆成兩張做,我覺得你的問題就可以解決了
01/01 14:05, 6F

01/01 14:05, , 7F
用split(data.table, by = "GoBack)
01/01 14:05, 7F

01/01 14:06, , 8F
然後配上 lapply(split_list, function(dt) ...)
01/01 14:06, 8F

01/01 14:06, , 9F
最後再 rbindlist變回同一張表
01/01 14:06, 9F

01/02 17:57, , 10F
c大可能是我用的方法不對,我查了一堆lapply的用法但都
01/02 17:57, 10F

01/02 17:58, , 11F
沒講到要怎麼做時間相減..轉回dataframe的方法還在看..
01/02 17:58, 11F

01/02 20:23, , 12F
我不是說用lapply做時間相減,我意思是你這裡
01/02 20:23, 12F

01/02 20:23, , 13F
拆成list個別處理可以比較簡單
01/02 20:23, 13F

01/02 20:24, , 14F
時間相減,我之前不是demo過了嗎?
01/02 20:24, 14F

01/02 20:24, , 15F
我還是建議就給一個虛擬日期 然後相減就好啦
01/02 20:24, 15F

01/02 20:24, , 16F
01/02 20:24, 16F

01/02 20:38, , 17F
喔喔!!是我誤會了..orz 這就來弄,感謝!!
01/02 20:38, 17F

01/02 21:16, , 18F
死了...能不能請c大推薦用list處理資料的文...我之前都
01/02 21:16, 18F

01/02 21:17, , 19F
是處理dataframe, list好像不給用 := 處理...
01/02 21:17, 19F

01/02 21:30, , 20F
split完之後就卡了,R不給我用 := 後面根本沒辦法寫..
01/02 21:30, 20F

01/03 00:11, , 21F
把置底的翻轉教室玩過一遍吧
01/03 00:11, 21F

01/03 00:25, , 22F
好的,謝謝c大
01/03 00:25, 22F
文章代碼(AID): #1OQ3s9tT (R_Language)
文章代碼(AID): #1OQ3s9tT (R_Language)