[SQL ] 滾動計算並回傳
資料庫名稱:SAS SQL
資料庫版本:9.4
內容/問題描述:
我有table a和b
table a
date SID doctor
2019/1/1 a jack
2019/1/2 a jack
2019/1/3 a jack
2019/2/1 b ben
2019/2/2 b ben
2019/2/3 b ben
...
2019/2/15 b mark
2019/2/16 b mark
2019/2/17 b mark
table b
date SID doctor
2018/1/1 a jack
2018/1/2 b jack
2018/1/3 c jack
2018/1/15 a jack
2018/1/31 a ben
2018/3/1 b ben
2018/3/1 c mark
2018/4/16 d mark
2018/4/21 c mark
我要得到下面的結果
table c
date SID doctor doctor_service_volume
2019/1/1 a jack 3
2019/1/2 a jack 3
2019/1/3 a jack 2
2019/2/1 b ben 1
2019/2/2 b ben 1
2019/2/3 b ben 1
...
2019/2/15 b mark 2
2019/2/16 b mark 2
2019/2/17 b mark 2
我要計算table a每一筆,a.doctor在a.date過去一年內收過多少病人(不重複)
table b是處方簽資料
例如:
first row in table a
date SID doctor
2019/1/1 a jack
我就要從table b中去找docor jack在a.date和(a.date - 1 year)間
收了多少不重複的病人
table b doctor jack 在2018/1/1 ~ 2019/1/1開過處方簽的病人
date SID doctor
2018/1/1 a jack
2018/1/2 b jack
2018/1/3 c jack
2018/1/15 a jack (重複)
所以a.doctor_service_volume = 3
我自己寫的code如下
Proc sql;
create table want as select
a.*, (select count(distinct b.SID)
from
dataset a, dataset b
where
a.DoctorID = b.DoctorID and a.DoctorID is not missing and
b.prescriptiondate between a.prescriptionBeginDate and
intnx('year', a.PrescriptionBeginDate, -1, 'same'))
as service_volume
from
dataset a, dataset b;
quit;
因為跑很久,我不太確定這樣寫是不是可以得到我要的結果..
table a 有240萬筆,b有1600萬筆
如果大家要測試自己code寫得對不對,會怎麼弄?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.174.43.32 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Database/M.1601823745.A.E61.html
→
10/05 15:29,
4年前
, 1F
10/05 15:29, 1F
推
10/06 00:12,
4年前
, 2F
10/06 00:12, 2F
→
10/06 13:34,
4年前
, 3F
10/06 13:34, 3F
討論串 (同標題文章)
Database 近期熱門文章
PTT數位生活區 即時熱門文章