Re: [問題] 不會傳遞 expression 到sub-function

看板R_Language作者 (刃之56)時間11年前 (2013/06/02 16:39), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串5/8 (看更多)
※ 引述《Chris7462 (~烤焦麵包~)》之銘言: : ※ 引述《cog5566 (刃之56)》之銘言: : : 我想不是 logical 是 logical expression : : 你看例子的第二個參數是 Weight < mean(Weight) : : 並不是 dietox$Weight < mean(dietox$Weight) : 你只看到了第二個參數,沒看到後面的 data=dietox : subsetBy 括號裡面整個的意思是用 dietox 這組資料的 Weight 也就是 dietox$Weight : 可以把資料 attach 上去就知道了。 ...嗯... 你覺得... subsetBy 的範例有用 attach() 嗎? 就是因為他沒有用,所以才酷的... : > data(dietox) : > attach(dietox) : > typeof(Weight < mean(Weight)) : [1] "logical" : > typeof(dietox$Weight < mean(dietox$Weight)) : [1] "logical" : > Weight == dietox$Weight : 兩個是一樣的 當然啊...因為你加了 attach() ... 你把 dietox 拿到 search path 當然這個時候 Weight < mean(Weight) 就可以被 evaluate。 這不是等於說,你問我有沒有看到一隻貓,我說沒有。 然後你放了一隻貓在我前面,再問一次有沒有看到一隻貓... 然後說我之前錯了,這裡其實是有一隻貓的... : : 如果你用 : : typeof(Weight < mean(Weight)) : : 和 : : typeof(dietox$Weight < mean(dietox$Weight)) : : 會得到完全不一樣的結果 : 因為你開 R 的時候有讀到舊的資料或是 R 的暫存檔,沒有 attach dietox 這個 data : 的話應該不會 Weight 這個 variable : 請先把舊的暫存檔或舊資料清掉,不然這樣討論下去你只會一直得到很奇怪的結果 這很有趣... 不過講正經的,這真的不是 attach() 的問題。 從頭到尾都沒有必要 attach dietox 到 Search Path 我很懷疑你自己有沒有真的執行過沒有 attach() 的範例 是真的可以執行的。跟 attach() 沒有關係。 : : Weight < mean(Weight) 會變成 logical class 會是在 subsetBy 自己的 scope 之內 : : 的事,但是在 subsetBy 之外的時候狀況很奇怪。 : : 這也是一個我很不習慣 R 的地方之一。有一些 function 會展現出奇怪的特性, : : 就是你不知道到底 function 是抓引數的 value 還是 name or expression : : 譬如說好了 : : x <- 10 : : rm('x') 和 rm(x) : : 有同樣的效果 : 請看 ?rm : rm (..., list = character(), pos = -1, : envir = as.environment(pos), inherits = FALSE) : ... : the objects to be removed, as names (unquoted) or character strings (quoted). : 裡面放的可以是變數名稱或是字串,所以 rm('x') 跟 rm(x) 一樣 : : 看起來好像沒有很奇怪,但是爲什麽 rm(x) 不會變成 rm(10)呢? : 看不懂。 那 x <- 10 請問 sum(x,x) 跟 sum(10,10) 會不會一樣呢? : : 下面這個例子就會更奇怪 : : x <- 10 : : y <- 'x' : : rm(y) : : 那到底這個時候是什麽情況,到底這時候會抓 rm 的參數 name y 還是 value 'x'? : 請把值呼叫出來 : > x # x 是變數,數值為 10 : [1] 10 : > y # y 是變數,數值是字元 "x" : [1] "x" 所以你有試過 rm(y) 嗎? 你覺得答案是? 答案是 y 會被刪掉而不是 x 但是爲什麽這個時候 y 不會被替換成 'x'變成 rm('x') 而刪掉 x? 答案是這個完全決定於 rm 的內部寫法。也就是說使用者沒辦法在外部決定輸入值是 variable name 或是 value。 我不知道這有沒有嚇到你啦,但是我第一次看到這個是有被嚇到啦。 可能我還太嫩了。 : : 回到我的問題的例子 : : subsetBy(~Evit, Weight < mean(Weight), data=dietox) : : 如果在一般的 function下,而且 Weight 有給予值時, : : Weight < mean(Weight) 應該會去抓 Weight 的值來得出 logical class : : 但是這邊等神奇之處就是,Weight 是 dietox 的一個 column, : : 或是複雜一點的說,是 dietox 這個 data frame 的 environment 裏面的變數 : : 他們是在 subsetBy 之內才被組合的。 : 看不懂。 這邊我想我們各有一半的責任。 我的責任是說錯了一點 data frame 應該沒有包含一個 environment,就只是變數 和值的對應關係。 你的責任是你小小作弊式的用了 attach() 然後再做 typeof(Weight < mean(Weight)) 不然實際情況這個應該會出錯,然後會很驚訝的覺得爲什麽 subsetBy(~Evit, Weight < mean(Weight), data=dietox) 卻不會有問題 : : 這樣一來,subsetBy 必定會知道 subsetBy 外面被 call 時引數的 expression : : 而不是值。現在知道這可以用 substitute 來實現,但是我的問題是如果有下一層, : : 如何將這個 expression 帶到下一層? : 一樣看不懂。 但是這是我的最終問題呀。可能是我表達不好,不過你看不懂是如何回答的? : : 我還是會不行用耶,貼上我的 code : : ###################################################################### : : library('doBy') : : sdSubsetFun = function(group, dVar, data) { : : # 2SD threshold : : subsetThreshold = (dVar > (mean(dVar) - 2*sd(dVar))) & : : (dVar < (mean(dVar) + 2*sd(dVar))) : : dataOut = subsetBy(group, : : subset = subsetThreshold, : : data = data) : 問題是出在這邊,因為 data = data 用的是 data 這個資料的 data$subsetThreshold : 但是 data 下並沒有 data$subsetThreshold 這個變數,所以就有 error 沒錯這是個問題,而且是大問題。但是你有看到我貼的 error message 嗎 在這個問題發生之前上面就出問題了。 : : } : : x = rep(c('a','b','c'), 50) : : y = 1:150 : : tData = data.frame(aa = x, bb = y) : 另外這邊也錯,兩個改法。一個是 : > tData = data.frame(aa <- x, bb <- y) : 或是 : > tData = data.frame(aa = x, bb = y) : > aa <- x : > bb <- y : : subData = sdSubsetFun(~aa, bb, tData) : : ###################################################################### : : Error in sdSubsetFun(~aa, bb, tData) : object 'bb' not found : : ###################################################################### : : 其實很顯而易見,在 evaluate dVar 的時候會在 local environment 找不到值, : : 因為 dynamic scope 的關係,它會去 global environment 找,但也會找不到。 : : 所以他會再找 bb 的value,但是根本就沒有 bb 這個變數,bb是tData的 column name : : 所以最後他會說 bb 找不到。 : : 還是說我什麽地方弄錯了?可能有小細節沒有注意到。 : 看不懂上面的幾個錯誤跟 dynamic scope 有什麼關係? : 整的問題只是呼叫 function 的時候沒有把該放的參數放對而已。 這真的不是這個問題 : 我把整個改過的程式貼上來如下,如果再不行我也不知道怎麼幫你了.... 這個有趣... : library('doBy') : sdSubsetFun = function(group, dVar, data) { : # 2SD threshold : data$subsetThreshold = (dVar > (mean(dVar) - 2*sd(dVar))) & : (dVar < (mean(dVar) + 2*sd(dVar))) : dataOut = subsetBy(group, : subset = subsetThreshold, : data = data) : } : x = rep(c('a','b','c'), 50) : y = 1:150 : tData = data.frame(aa = x, bb = y) : aa <- x : bb <- y : subData = sdSubsetFun(~aa, bb, tData) 你這樣可以跑是因為你用了跟剛剛加了 attach() 的作弊方式 aa <- x bb <- y 這跟 attach(tData) 是類似的意思 但是這跟原本的 subsetBy那種寫法意思就差多了。 我要的是 bb 不是單純的 value 代進去sdSubsetFun 而是 bb 本身的 name 會被 sdSubsetFun 在裏面識別出來,進而組成一個新的 expression 當做 subsetBy 的引數。 不過如果你看不懂 x <- 10 rm(x) 跟 rm(10) 的這個基本又神秘的地方,那我也不知道該怎麼跟你說明了。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 139.184.222.89
文章代碼(AID): #1HgmI-Sb (R_Language)
文章代碼(AID): #1HgmI-Sb (R_Language)