[問題] 用兩個data frame的index來join ?

看板R_Language作者 (裝配匠)時間8年前 (2017/03/20 22:53), 8年前編輯推噓1(103)
留言4則, 1人參與, 最新討論串1/2 (看更多)
[問題類型]: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 請把以下不需要的部份刪除 入門(寫過其他程式,只是對語法不熟悉) [問題敘述]: 請簡略描述你所要做的事情,或是這個程式的目的 假設我撈了0050的股票資料存到data frame 這樣data frame最前面是日期(但不是data frame的欄位) 但該日期欄並不是data frame的欄位 如果我又撈了0056的股票資料存到另一個data frame data frame最前面也是日期(但不是data frame的欄位) 那要如何用日期來join兩個data frame ? [程式範例]: #install.packages("quantmod") library(quantmod) STK0050=get(getSymbols("0050.tw")) View(STK0050) STK0050DF=data.frame(STK0050) str(STK0050DF)#查出來日期並非data frame的欄位 STK0056=get(getSymbols("0056.tw")) View(STK0056) STK0056DF=data.frame(STK0056) str(STK0056DF)#查出來日期並非data frame的欄位 #若我要用index:日期來join STK0050與STK0056 該怎麼做? [環境敘述]: > library(quantmod) Loading required package: xts Loading required package: zoo Attaching package: ‘zoo’ The following objects are masked from ‘package:base’: as.Date, as.Date.numeric Loading required package: TTR Version 0.4-0 included new data defaults. See ?getSymbols. Warning messages: 1: package ‘quantmod’ was built under R version 3.3.3 2: package ‘xts’ was built under R version 3.3.3 3: package ‘zoo’ was built under R version 3.3.3 4: package ‘TTR’ was built under R version 3.3.3 > STK0050=get(getSymbols("0050.tw")) As of 0.4-0, ‘getSymbols’ uses env=parent.frame() and auto.assign=TRUE by default. This behavior will be phased out in 0.5-0 when the call will default to use auto.assign=FALSE. getOption("getSymbols.env") and getOptions("getSymbols.auto.assign") are now checked for alternate defaults This message is shown once per session and may be disabled by setting options("getSymbols.warning4.0"=FALSE). See ?getSymbols for more details. > View(STK0050) > STK0050DF=data.frame(STK0050) > str(STK0050DF)#查出來日期並非data frame的欄位 'data.frame': 2235 obs. of 6 variables: $ X0050.TW.Open : num 61.5 60.1 59.1 59.1 56.4 ... $ X0050.TW.High : num 61.7 61.3 59.4 59.4 57.6 ... $ X0050.TW.Low : num 61 60 58.6 58 56.3 ... $ X0050.TW.Close : num 61.5 60.1 59.1 59.1 56.4 ... $ X0050.TW.Volume : num 2870000 4975000 7413000 7686000 20041000 ... $ X0050.TW.Adjusted: num 52.2 51 50.2 50.2 47.9 ... > > STK0056=get(getSymbols("0056.tw")) > View(STK0056) > STK0056DF=data.frame(STK0056) > str(STK0056DF)#查出來日期並非data frame的欄位 'data.frame': 2235 obs. of 6 variables: $ X0056.TW.Open : num 26 25.8 25.4 25.4 25.1 ... $ X0056.TW.High : num 26.1 26.1 25.4 25.4 25.4 ... $ X0056.TW.Low : num 25.7 25.7 25.2 25.1 25 ... $ X0056.TW.Close : num 26 25.8 25.4 25.4 25.1 ... $ X0056.TW.Volume : num 3440000 3806000 3145000 1543000 5381000 ... $ X0056.TW.Adjusted: num 19.9 19.7 19.4 19.4 19.1 ... [關鍵字]: #data frame #index -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.161.47.220 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1490021589.A.DA1.html ※ 編輯: Su22 (118.161.47.220), 03/20/2017 22:53:38 ※ 編輯: Su22 (118.161.47.220), 03/20/2017 22:54:40

03/20 23:59, , 1F
merge(STK0050,STK0056,all=True) 這是你要的嗎?
03/20 23:59, 1F
概念上是用merge沒錯 但直接這樣寫好像出來的結果不是我要的 我是要依照日期當index值去join這兩個data frame 所以join後一個日期應該只會有一筆row

03/21 00:00, , 2F
另外getSymbols()吐出來的資料是xts格式,如果你想要
03/21 00:00, 2F

03/21 00:01, , 3F
把日期抓出來,要用index()
03/21 00:01, 3F

03/21 00:02, , 4F
例如index(STK0050)
03/21 00:02, 4F
謝謝~試了index()的確可以把日期抓出來 我後來是用index把日期變成data frame的一個正式欄位 取名為DATE STK0050DF=cbind(STK0050DF,index(STK0050)) colnames(STK0050DF)[ncol(STK0050DF)]='DATE' 0056也用同樣的方法新增出一欄DATE 再用merge(STK0050DF,STK0056DF,by="DATE") 是可以達到我原本期望的效果 雖然要經過一次加工... ※ 編輯: Su22 (118.161.49.73), 03/22/2017 21:43:14
文章代碼(AID): #1Op-pLsX (R_Language)
文章代碼(AID): #1Op-pLsX (R_Language)