Re: [問題] 如何快速複製新增特定數筆資料
野人獻曝一下
思路:
1. 把活動日期欄位拆成start,end兩個欄位, 並用lubridate:ymd()轉成日期(date格式)
2. 用seq(start, end, by="day") 來創造期間的日期序列(list格式)
3. 新增一個days欄位,裡面存步驟2得到的日期list
4. 用訂位日期group_by(), 再把days欄位的list給unnest()
大概是這樣~
library(tidyr)
library(dplyr)
library(lubridate)
order_date <- c("2022/1/03","2022/1/20","2022/2/1")
date <- c("2022/2/5~2022/2/8","2022/1/25~2022/1/25","2022/2/2~2022/2/4")
time <- c("09:00~18:00","10:00~12:00","13:00~17:00")
name <- c("某某國際研討會","某某記者會","瑜珈課程")
room <- c("301會議室","201會議室","107會議室")
people <- c(100,50,10)
test_df <- tibble(order_date, date, time, name, room, people)
test_df %>% mutate(start=ymd(sub("~.*","",date)),end=ymd(sub(".*~","",date))) %>%
group_by(order_date) %>%
mutate(days = list(seq(min(start),max(end),by="day"))) %>%
unnest(days) %>% ungroup() %>%
select(days, time, name, room, people)
https://i.imgur.com/bPhFs8D.jpg
※ 引述《studioA (understand?)》之銘言:
: [問題類型]:
: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
: [軟體熟悉度]:
: 使用者(已經有用R 做過不少作品)
: [問題敘述]:
: 我有一份資料,格式如下
: 訂位日期 活動日期 活動時間 活動名稱 會議室 人數
: 2022/1/03 2022/2/5~2022/2/8 09:00~18:00 某某國際研討會 301會議室 100
: 2022/1/20 2022/1/25~2022/1/25 10:00~12:00 某某記者會 201會議室 50
: 2022/2/1 2022/2/2~2022/2/4 13:00~17:00 瑜珈課程 107會議室 10
: 我想將活動日期拆成一天一筆資料,格式如下
: 活動日期 活動時間 活動名稱 會議室 人數
: 2022/02/05 09:00~18:00 某某國際研討會 301會議室 100
: 2022/02/06 09:00~18:00 某某國際研討會 301會議室 100
: 2022/02/07 09:00~18:00 某某國際研討會 301會議室 100
: 2022/02/08 09:00~18:00 某某國際研討會 301會議室 100
: 2022/01/25 10:00~12:00 某某記者會 201會議室 50
: 2022/02/02 13:00~17:00 瑜珈課程 107會議室 10
: 2022/02/03 13:00~17:00 瑜珈課程 107會議室 10
: 2022/02/04 13:00~17:00 瑜珈課程 107會議室 10
: 我雖然先算出每個活動的總天數,然後一一新增複製合併相同活動天數,
: 但我覺這個方法很笨,所以上來請教各位大師 是否有更快速的寫法
: [程式範例]:
: data2 <- rbind.data.frame(DT[which(DT$活動天數==2),],
: DT[which(DT$活動天數==2),])
: data3 <- rbind.data.frame(DT[which(DT$活動天數==3),],
: DT[which(DT$活動天數==3),],
: DT[which(DT$活動天數==3),]) )
: 以此類推後 在合併所有資料集
: allDT<- rbind.data.frame(DT,data2,data3, .....,data11)
: [環境敘述]:
: R 4.0.3
: 請提供 sessionInfo() 的輸出結果,
: 裡面含有所有你使用的作業系統、R 的版本和套件版本資訊,
: 讓版友更容易找出錯誤
:
: [關鍵字]:
: merge
:
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.164.225.2 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1694085976.A.5DA.html
※ 編輯: locka (1.164.225.2 臺灣), 09/07/2023 19:54:11
※ 編輯: locka (1.164.225.2 臺灣), 09/07/2023 20:40:37
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 3 篇):
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章