Re: [SQL ] 滾動計算並回傳

看板Database (資料庫)作者 ( )時間4年前 (2020/10/13 11:23), 編輯推噓0(000)
留言0則, 0人參與, 4年前最新討論串4/8 (看更多)
※ 引述《Wengboyu ( )》之銘言: : 資料庫名稱:SAS SQL : 資料庫版本:9.4 : 內容/問題描述: : 我有table a和b : table a : date SID doctor : 2019/1/1 a jack : 2019/1/2 a jack : 2019/1/3 a jack : 2019/2/1 b ben : 2019/2/2 b ben : 2019/2/3 b ben : ... : 2019/2/15 b mark : 2019/2/16 b mark : 2019/2/17 b mark : table b : date SID doctor : 2018/1/1 a jack : 2018/1/2 b jack : 2018/1/3 c jack : 2018/1/15 a jack : 2018/1/31 a ben : 2018/3/1 b ben : 2018/3/1 c mark : 2018/4/16 d mark : 2018/4/21 c mark : 我要得到下面的結果 : table c : date SID doctor doctor_service_volume : 2019/1/1 a jack 3 : 2019/1/2 a jack 3 : 2019/1/3 a jack 2 : 2019/2/1 b ben 1 : 2019/2/2 b ben 1 : 2019/2/3 b ben 1 : ... : 2019/2/15 b mark 2 : 2019/2/16 b mark 2 : 2019/2/17 b mark 2 : 我要計算table a每一筆,a.doctor在a.date過去一年內收過多少病人(不重複) : table b是處方簽資料 : 例如: : first row in table a : date SID doctor : 2019/1/1 a jack : 我就要從table b中去找docor jack在a.date和(a.date - 1 year)間 : 收了多少不重複的病人 : table b doctor jack 在2018/1/1 ~ 2019/1/1開過處方簽的病人 : date SID doctor : 2018/1/1 a jack : 2018/1/2 b jack : 2018/1/3 c jack : 2018/1/15 a jack (重複) : 所以a.doctor_service_volume = 3 : 我自己寫的code如下 : Proc sql; : create table want as select : a.*, (select count(distinct b.SID) : from : dataset a, dataset b : where : a.DoctorID = b.DoctorID and a.DoctorID is not missing and : b.prescriptiondate between a.prescriptionBeginDate and : intnx('year', a.PrescriptionBeginDate, -1, 'same')) : as service_volume : from : dataset a, dataset b; : quit; : 因為跑很久,我不太確定這樣寫是不是可以得到我要的結果.. : table a 有240萬筆,b有1600萬筆 : 如果大家要測試自己code寫得對不對,會怎麼弄?

10/05 15:29,
這種的就不太會一次撈完 可能就atable的一筆開始撈這樣
10/05 15:29

10/06 00:12,
10/06 00:12

10/06 13:34,
感謝,讓我試試看結果如何
10/06 13:34
SAS sql的code還是有些不同,我做了一些改寫碰到了一些小問題 ### Proc sql; create table want as select *, count(*) as doctor_service_volume from (select distinct a.*, b.SID from a left join b on a.DoctorID = b.DoctorID && a.date >= b.date && b.date >= intnx('year', a.date, -1, 'same') ) group by date, SID, DoctorID; quit; ### 會得到下面的結果 table c date SID doctor doctor_service_volume 2019/1/1 a jack 3 2019/1/1 a jack 3 2019/1/1 a jack 3 2019/1/2 a jack 3 2019/1/2 a jack 3 2019/1/2 a jack 3 2019/1/3 a jack 2 2019/1/3 a jack 2 2019/2/1 b ben 1 2019/2/2 b ben 1 2019/2/3 b ben 1 ... 2019/2/15 b mark 2 2019/2/15 b mark 2 2019/2/16 b mark 2 2019/2/16 b mark 2 2019/2/17 b mark 2 2019/2/17 b mark 2 也就是他算到多少次doctor_service_volume,就會重複多少次 doctor_service_volume是算對了,但資料變超級大 就算在選取時,再加上distinct也是一樣的結果 ### Proc sql; create table want as select distinct *, count(*) as doctor_service_volume from (select distinct a.*, b.SID from a left join b on a.DoctorID = b.DoctorID && a.date >= b.date && b.date >= intnx('year', a.date, -1, 'same') ) group by date, SID, DoctorID; quit; ### 問題應該是在藍綠色那塊,它把所有符合條件的全部都輸出一次 而不是只有doctor_service_volumn 以上是測試的結果,有可能是我改寫的方式錯了 我目前還在想該怎麼處理 感謝chippclass幫忙 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 120.126.32.197 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Database/M.1602559397.A.371.html
文章代碼(AID): #1VXHsbDn (Database)
文章代碼(AID): #1VXHsbDn (Database)