Re: [問題] 不會傳遞 expression 到sub-function
※ 引述《cog5566 (刃之56)》之銘言:
: ※ 引述《Chris7462 (~烤焦麵包~)》之銘言:
: : subsetBy(formula, subset, data = parent.frame(), select, drop=FALSE,
: : join=TRUE, ... )
: : 第二個參數是 logical 不是 expression,可以看他的說明
: : subset logical expression indicating elements or rows to keep: missing values
: : taken as false.
: : 用他的 example 看一下就知道了
: : sbstBy> data(dietox)
: : sbstBy> subsetBy(~Evit, Weight < mean(Weight), data=dietox)
: : data(dietox)
: : dietox$Weight < mean(dietox$Weight)
: 我想不是 logical 是 logical expression
: 你看例子的第二個參數是 Weight < mean(Weight)
: 並不是 dietox$Weight < mean(dietox$Weight)
你只看到了第二個參數,沒看到後面的 data=dietox
subsetBy 括號裡面整個的意思是用 dietox 這組資料的 Weight 也就是 dietox$Weight
可以把資料 attach 上去就知道了。
> data(dietox)
> attach(dietox)
> typeof(Weight < mean(Weight))
[1] "logical"
> typeof(dietox$Weight < mean(dietox$Weight))
[1] "logical"
> Weight == dietox$Weight
兩個是一樣的
: 如果你用
: typeof(Weight < mean(Weight))
: 和
: typeof(dietox$Weight < mean(dietox$Weight))
: 會得到完全不一樣的結果
因為你開 R 的時候有讀到舊的資料或是 R 的暫存檔,沒有 attach dietox 這個 data
的話應該不會 Weight 這個 variable
請先把舊的暫存檔或舊資料清掉,不然這樣討論下去你只會一直得到很奇怪的結果
: Weight < mean(Weight) 會變成 logical class 會是在 subsetBy 自己的 scope 之內
: 的事,但是在 subsetBy 之外的時候狀況很奇怪。
: 這也是一個我很不習慣 R 的地方之一。有一些 function 會展現出奇怪的特性,
: 就是你不知道到底 function 是抓引數的 value 還是 name or expression
: 譬如說好了
: x <- 10
: rm('x') 和 rm(x)
: 有同樣的效果
請看 ?rm
rm (..., list = character(), pos = -1,
envir = as.environment(pos), inherits = FALSE)
...
the objects to be removed, as names (unquoted) or character strings (quoted).
裡面放的可以是變數名稱或是字串,所以 rm('x') 跟 rm(x) 一樣
: 看起來好像沒有很奇怪,但是爲什麽 rm(x) 不會變成 rm(10)呢?
: 下面這個例子就會更奇怪
: x <- 10
: y <- 'x'
: rm(y)
: 那到底這個時候是什麽情況,到底這時候會抓 rm 的參數 name y 還是 value 'x'?
請把值呼叫出來
> x # x 是變數,數值為 10
[1] 10
> y # y 是變數,數值是字元 "x"
[1] "x"
: 回到我的問題的例子
: subsetBy(~Evit, Weight < mean(Weight), data=dietox)
: 如果在一般的 function下,而且 Weight 有給予值時,
: Weight < mean(Weight) 應該會去抓 Weight 的值來得出 logical class
: 但是這邊等神奇之處就是,Weight 是 dietox 的一個 column,
: 或是複雜一點的說,是 dietox 這個 data frame 的 environment 裏面的變數
: 他們是在 subsetBy 之內才被組合的。
: 這樣一來,subsetBy 必定會知道 subsetBy 外面被 call 時引數的 expression
: 而不是值。現在知道這可以用 substitute 來實現,但是我的問題是如果有下一層,
: 如何將這個 expression 帶到下一層?
: 我還是會不行用耶,貼上我的 code
: ######################################################################
: library('doBy')
: sdSubsetFun = function(group, dVar, data) {
: # 2SD threshold
: subsetThreshold = (dVar > (mean(dVar) - 2*sd(dVar))) &
: (dVar < (mean(dVar) + 2*sd(dVar)))
: dataOut = subsetBy(group,
: subset = subsetThreshold,
: data = data)
問題是出在這邊,因為 data = data 用的是 data 這個資料的 data$subsetThreshold
但是 data 下並沒有 data$subsetThreshold 這個變數,所以就有 error
: }
: x = rep(c('a','b','c'), 50)
: y = 1:150
: tData = data.frame(aa = x, bb = y)
另外這邊也錯,兩個改法。一個是
> tData = data.frame(aa <- x, bb <- y)
或是
> tData = data.frame(aa = x, bb = y)
> aa <- x
> bb <- y
: subData = sdSubsetFun(~aa, bb, tData)
: ######################################################################
: Error in sdSubsetFun(~aa, bb, tData) : object 'bb' not found
: ######################################################################
: 其實很顯而易見,在 evaluate dVar 的時候會在 local environment 找不到值,
: 因為 dynamic scope 的關係,它會去 global environment 找,但也會找不到。
: 所以他會再找 bb 的value,但是根本就沒有 bb 這個變數,bb是tData的 column name
: 所以最後他會說 bb 找不到。
: 還是說我什麽地方弄錯了?可能有小細節沒有注意到。
看不懂上面的幾個錯誤跟 dynamic scope 有什麼關係?
整的問題只是呼叫 function 的時候沒有把該放的參數放對而已。
我把整個改過的程式貼上來如下,如果再不行我也不知道怎麼幫你了....
library('doBy')
sdSubsetFun = function(group, dVar, data) {
# 2SD threshold
data$subsetThreshold = (dVar > (mean(dVar) - 2*sd(dVar))) &
(dVar < (mean(dVar) + 2*sd(dVar)))
dataOut = subsetBy(group,
subset = subsetThreshold,
data = data)
}
x = rep(c('a','b','c'), 50)
y = 1:150
tData = data.frame(aa = x, bb = y)
aa <- x
bb <- y
subData = sdSubsetFun(~aa, bb, tData)
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 36.229.4.177
→
06/02 13:22, , 1F
06/02 13:22, 1F
→
06/02 13:22, , 2F
06/02 13:22, 2F
※ 編輯: Chris7462 來自: 118.165.62.51 (06/03 01:54)
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 4 之 8 篇):
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章