[問題] 用兩個data frame的index來join ?
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
請把以下不需要的部份刪除
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
請簡略描述你所要做的事情,或是這個程式的目的
假設我撈了0050的股票資料存到data frame
這樣data frame最前面是日期(但不是data frame的欄位)
但該日期欄並不是data frame的欄位
如果我又撈了0056的股票資料存到另一個data frame
data frame最前面也是日期(但不是data frame的欄位)
那要如何用日期來join兩個data frame ?
[程式範例]:
#install.packages("quantmod")
library(quantmod)
STK0050=get(getSymbols("0050.tw"))
View(STK0050)
STK0050DF=data.frame(STK0050)
str(STK0050DF)#查出來日期並非data frame的欄位
STK0056=get(getSymbols("0056.tw"))
View(STK0056)
STK0056DF=data.frame(STK0056)
str(STK0056DF)#查出來日期並非data frame的欄位
#若我要用index:日期來join STK0050與STK0056
該怎麼做?
[環境敘述]:
> library(quantmod)
Loading required package: xts
Loading required package: zoo
Attaching package: ‘zoo’
The following objects are masked from ‘package:base’:
as.Date, as.Date.numeric
Loading required package: TTR
Version 0.4-0 included new data defaults. See ?getSymbols.
Warning messages:
1: package ‘quantmod’ was built under R version 3.3.3
2: package ‘xts’ was built under R version 3.3.3
3: package ‘zoo’ was built under R version 3.3.3
4: package ‘TTR’ was built under R version 3.3.3
> STK0050=get(getSymbols("0050.tw"))
As of 0.4-0, ‘getSymbols’ uses env=parent.frame() and
auto.assign=TRUE by default.
This behavior will be phased out in 0.5-0 when the call will
default to use auto.assign=FALSE. getOption("getSymbols.env") and
getOptions("getSymbols.auto.assign") are now checked for alternate defaults
This message is shown once per session and may be disabled by setting
options("getSymbols.warning4.0"=FALSE). See ?getSymbols for more details.
> View(STK0050)
> STK0050DF=data.frame(STK0050)
> str(STK0050DF)#查出來日期並非data frame的欄位
'data.frame': 2235 obs. of 6 variables:
$ X0050.TW.Open : num 61.5 60.1 59.1 59.1 56.4 ...
$ X0050.TW.High : num 61.7 61.3 59.4 59.4 57.6 ...
$ X0050.TW.Low : num 61 60 58.6 58 56.3 ...
$ X0050.TW.Close : num 61.5 60.1 59.1 59.1 56.4 ...
$ X0050.TW.Volume : num 2870000 4975000 7413000 7686000 20041000 ...
$ X0050.TW.Adjusted: num 52.2 51 50.2 50.2 47.9 ...
>
> STK0056=get(getSymbols("0056.tw"))
> View(STK0056)
> STK0056DF=data.frame(STK0056)
> str(STK0056DF)#查出來日期並非data frame的欄位
'data.frame': 2235 obs. of 6 variables:
$ X0056.TW.Open : num 26 25.8 25.4 25.4 25.1 ...
$ X0056.TW.High : num 26.1 26.1 25.4 25.4 25.4 ...
$ X0056.TW.Low : num 25.7 25.7 25.2 25.1 25 ...
$ X0056.TW.Close : num 26 25.8 25.4 25.4 25.1 ...
$ X0056.TW.Volume : num 3440000 3806000 3145000 1543000 5381000 ...
$ X0056.TW.Adjusted: num 19.9 19.7 19.4 19.4 19.1 ...
[關鍵字]:
#data frame
#index
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.161.47.220
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1490021589.A.DA1.html
※ 編輯: Su22 (118.161.47.220), 03/20/2017 22:53:38
※ 編輯: Su22 (118.161.47.220), 03/20/2017 22:54:40
推
03/20 23:59, , 1F
03/20 23:59, 1F
概念上是用merge沒錯
但直接這樣寫好像出來的結果不是我要的
我是要依照日期當index值去join這兩個data frame
所以join後一個日期應該只會有一筆row
→
03/21 00:00, , 2F
03/21 00:00, 2F
→
03/21 00:01, , 3F
03/21 00:01, 3F
→
03/21 00:02, , 4F
03/21 00:02, 4F
謝謝~試了index()的確可以把日期抓出來
我後來是用index把日期變成data frame的一個正式欄位
取名為DATE
STK0050DF=cbind(STK0050DF,index(STK0050))
colnames(STK0050DF)[ncol(STK0050DF)]='DATE'
0056也用同樣的方法新增出一欄DATE
再用merge(STK0050DF,STK0056DF,by="DATE")
是可以達到我原本期望的效果
雖然要經過一次加工...
※ 編輯: Su22 (118.161.49.73), 03/22/2017 21:43:14
討論串 (同標題文章)
以下文章回應了本文:
完整討論串 (本文為第 1 之 2 篇):
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章