Re: [問題] 不會傳遞 expression 到sub-function
※ 引述《Chris7462 (~烤焦麵包~)》之銘言:
: ※ 引述《cog5566 (刃之56)》之銘言:
: : 我想不是 logical 是 logical expression
: : 你看例子的第二個參數是 Weight < mean(Weight)
: : 並不是 dietox$Weight < mean(dietox$Weight)
: 你只看到了第二個參數,沒看到後面的 data=dietox
: subsetBy 括號裡面整個的意思是用 dietox 這組資料的 Weight 也就是 dietox$Weight
: 可以把資料 attach 上去就知道了。
...嗯...
你覺得... subsetBy 的範例有用 attach() 嗎?
就是因為他沒有用,所以才酷的...
: > data(dietox)
: > attach(dietox)
: > typeof(Weight < mean(Weight))
: [1] "logical"
: > typeof(dietox$Weight < mean(dietox$Weight))
: [1] "logical"
: > Weight == dietox$Weight
: 兩個是一樣的
當然啊...因為你加了 attach() ...
你把 dietox 拿到 search path 當然這個時候 Weight < mean(Weight)
就可以被 evaluate。
這不是等於說,你問我有沒有看到一隻貓,我說沒有。
然後你放了一隻貓在我前面,再問一次有沒有看到一隻貓...
然後說我之前錯了,這裡其實是有一隻貓的...
: : 如果你用
: : typeof(Weight < mean(Weight))
: : 和
: : typeof(dietox$Weight < mean(dietox$Weight))
: : 會得到完全不一樣的結果
: 因為你開 R 的時候有讀到舊的資料或是 R 的暫存檔,沒有 attach dietox 這個 data
: 的話應該不會 Weight 這個 variable
: 請先把舊的暫存檔或舊資料清掉,不然這樣討論下去你只會一直得到很奇怪的結果
這很有趣...
不過講正經的,這真的不是 attach() 的問題。
從頭到尾都沒有必要 attach dietox 到 Search Path
我很懷疑你自己有沒有真的執行過沒有 attach() 的範例
是真的可以執行的。跟 attach() 沒有關係。
: : Weight < mean(Weight) 會變成 logical class 會是在 subsetBy 自己的 scope 之內
: : 的事,但是在 subsetBy 之外的時候狀況很奇怪。
: : 這也是一個我很不習慣 R 的地方之一。有一些 function 會展現出奇怪的特性,
: : 就是你不知道到底 function 是抓引數的 value 還是 name or expression
: : 譬如說好了
: : x <- 10
: : rm('x') 和 rm(x)
: : 有同樣的效果
: 請看 ?rm
: rm (..., list = character(), pos = -1,
: envir = as.environment(pos), inherits = FALSE)
: ...
: the objects to be removed, as names (unquoted) or character strings (quoted).
: 裡面放的可以是變數名稱或是字串,所以 rm('x') 跟 rm(x) 一樣
: : 看起來好像沒有很奇怪,但是爲什麽 rm(x) 不會變成 rm(10)呢?
: 看不懂。
那
x <- 10
請問 sum(x,x) 跟 sum(10,10) 會不會一樣呢?
: : 下面這個例子就會更奇怪
: : x <- 10
: : y <- 'x'
: : rm(y)
: : 那到底這個時候是什麽情況,到底這時候會抓 rm 的參數 name y 還是 value 'x'?
: 請把值呼叫出來
: > x # x 是變數,數值為 10
: [1] 10
: > y # y 是變數,數值是字元 "x"
: [1] "x"
所以你有試過 rm(y) 嗎?
你覺得答案是?
答案是 y 會被刪掉而不是 x
但是爲什麽這個時候 y 不會被替換成 'x'變成 rm('x') 而刪掉 x?
答案是這個完全決定於 rm 的內部寫法。也就是說使用者沒辦法在外部決定輸入值是
variable name 或是 value。
我不知道這有沒有嚇到你啦,但是我第一次看到這個是有被嚇到啦。
可能我還太嫩了。
: : 回到我的問題的例子
: : subsetBy(~Evit, Weight < mean(Weight), data=dietox)
: : 如果在一般的 function下,而且 Weight 有給予值時,
: : Weight < mean(Weight) 應該會去抓 Weight 的值來得出 logical class
: : 但是這邊等神奇之處就是,Weight 是 dietox 的一個 column,
: : 或是複雜一點的說,是 dietox 這個 data frame 的 environment 裏面的變數
: : 他們是在 subsetBy 之內才被組合的。
: 看不懂。
這邊我想我們各有一半的責任。
我的責任是說錯了一點 data frame 應該沒有包含一個 environment,就只是變數
和值的對應關係。
你的責任是你小小作弊式的用了 attach() 然後再做
typeof(Weight < mean(Weight))
不然實際情況這個應該會出錯,然後會很驚訝的覺得爲什麽
subsetBy(~Evit, Weight < mean(Weight), data=dietox) 卻不會有問題
: : 這樣一來,subsetBy 必定會知道 subsetBy 外面被 call 時引數的 expression
: : 而不是值。現在知道這可以用 substitute 來實現,但是我的問題是如果有下一層,
: : 如何將這個 expression 帶到下一層?
: 一樣看不懂。
但是這是我的最終問題呀。可能是我表達不好,不過你看不懂是如何回答的?
: : 我還是會不行用耶,貼上我的 code
: : ######################################################################
: : library('doBy')
: : sdSubsetFun = function(group, dVar, data) {
: : # 2SD threshold
: : subsetThreshold = (dVar > (mean(dVar) - 2*sd(dVar))) &
: : (dVar < (mean(dVar) + 2*sd(dVar)))
: : dataOut = subsetBy(group,
: : subset = subsetThreshold,
: : data = data)
: 問題是出在這邊,因為 data = data 用的是 data 這個資料的 data$subsetThreshold
: 但是 data 下並沒有 data$subsetThreshold 這個變數,所以就有 error
沒錯這是個問題,而且是大問題。但是你有看到我貼的 error message 嗎
在這個問題發生之前上面就出問題了。
: : }
: : x = rep(c('a','b','c'), 50)
: : y = 1:150
: : tData = data.frame(aa = x, bb = y)
: 另外這邊也錯,兩個改法。一個是
: > tData = data.frame(aa <- x, bb <- y)
: 或是
: > tData = data.frame(aa = x, bb = y)
: > aa <- x
: > bb <- y
: : subData = sdSubsetFun(~aa, bb, tData)
: : ######################################################################
: : Error in sdSubsetFun(~aa, bb, tData) : object 'bb' not found
: : ######################################################################
: : 其實很顯而易見,在 evaluate dVar 的時候會在 local environment 找不到值,
: : 因為 dynamic scope 的關係,它會去 global environment 找,但也會找不到。
: : 所以他會再找 bb 的value,但是根本就沒有 bb 這個變數,bb是tData的 column name
: : 所以最後他會說 bb 找不到。
: : 還是說我什麽地方弄錯了?可能有小細節沒有注意到。
: 看不懂上面的幾個錯誤跟 dynamic scope 有什麼關係?
: 整的問題只是呼叫 function 的時候沒有把該放的參數放對而已。
這真的不是這個問題
: 我把整個改過的程式貼上來如下,如果再不行我也不知道怎麼幫你了....
這個有趣...
: library('doBy')
: sdSubsetFun = function(group, dVar, data) {
: # 2SD threshold
: data$subsetThreshold = (dVar > (mean(dVar) - 2*sd(dVar))) &
: (dVar < (mean(dVar) + 2*sd(dVar)))
: dataOut = subsetBy(group,
: subset = subsetThreshold,
: data = data)
: }
: x = rep(c('a','b','c'), 50)
: y = 1:150
: tData = data.frame(aa = x, bb = y)
: aa <- x
: bb <- y
: subData = sdSubsetFun(~aa, bb, tData)
你這樣可以跑是因為你用了跟剛剛加了 attach() 的作弊方式
aa <- x
bb <- y
這跟 attach(tData) 是類似的意思
但是這跟原本的 subsetBy那種寫法意思就差多了。
我要的是 bb 不是單純的 value 代進去sdSubsetFun
而是 bb 本身的 name 會被 sdSubsetFun 在裏面識別出來,進而組成一個新的
expression 當做 subsetBy 的引數。
不過如果你看不懂
x <- 10
rm(x) 跟 rm(10) 的這個基本又神秘的地方,那我也不知道該怎麼跟你說明了。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 139.184.222.89
討論串 (同標題文章)
完整討論串 (本文為第 5 之 8 篇):
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章