Re: [問題] 關於r的資料分析問題

看板R_Language作者 (拒看低質媒體)時間11年前 (2013/10/30 00:37), 編輯推噓3(3012)
留言15則, 5人參與, 最新討論串3/3 (看更多)
※ 引述《solsiso (solsiso)》之銘言: : 小弟是新手,最近在學習r language : 剛好有作業分析台灣加權指數的日、週、月報酬率 : 及加權指數與台積電日報酬的平均數是否相等的檢定,時間是從 1997-2007 : 於是使用了r 當做練習 去做動差、偏態、峰態、和常態性檢定 : 但遇到幾個問題 : 1.在畫圖型時,報酬率看起來是符合常態分配的形狀 : 而在計算偏態、峰態、和常態性檢定時,卻都是很明顯不符合常態 : 是因為我單純只使用hist()沒加任何設定所導致的嗎? : 關於使用的package有 : moments() : psych() : 常態性檢定有 : shapiro.test() : jarque.test() : lillie.test() : 不知道這幾個是否有影響? 我之前有聽過一種說法:只要資料量夠大,資料通常都顯著的不常態。 也許你除了常態檢定以外,也可以畫畫QQ-plot,瞭解一下非常態的狀態是屬於: - 左偏或右偏* - short tail - long tail* short tail的話比較沒有關係,long tail*的話就要小心離群值出現的機會會偏高。 左偏或右偏就想辦法轉換吧。 : 2.另外再請教,有什麼package或函數可以一次把多個分析做類似 : 表格的輸出嗎? : 例如:上面的動差、偏態、峰態、檢定結果、平均數...等 : 一次一起清楚表示的做法,不然不懂要如何把輸出結果一起讓人了解 knitr 可以參考 https://www.youtube.com/watch?v=OHKZLeKlUsM
: 3.在想使用有關excel的package想直接讀excel,package是XLconnect : 於是裝了後卻出現以下訊息 : Loading required package: rJava : Error : .onLoad failed in loadNamespace() for 'rJava', details: : call: fun(libname, pkgname) : error: JAVA_HOME cannot be determined from the Registry : 此外: 警告訊息: : package ‘XLConnect’ was built under R version 3.0.2 : 錯誤: package ‘rJava’ could not be loaded : 我便再去裝rJava的package,但卻出現以下情況 : Error : .onLoad failed in loadNamespace() for 'rJava', details: : call: fun(libname, pkgname) : error: JAVA_HOME cannot be determined from the Registry : 錯誤: package or namespace load failed for ‘rJava’ : 我不知道該怎辦才好,只好另尋其它方法,但我還是想了解是否能解決上面情況 : 最後希望有板上前輩能指點一下~感謝各位~! : 希望 先把rJava裝起來吧! 你需要設定java, 剛剛查了一下,stackoverflow也有人遇過類似問題: http://stackoverflow.com/questions/7019912/using-the-rjava-package-on-win7-64-bit-with-r 裡面有兩種答案 FYI -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 1.34.138.85

10/30 00:50, , 1F
n大易拒絕那不是說法,是真的是那樣。
10/30 00:50, 1F

10/30 00:50, , 2F
適合度檢定好像都有這個弊病
10/30 00:50, 2F

10/30 06:43, , 3F
就像n很大 t-test都會有顯著的差異
10/30 06:43, 3F

10/30 13:32, , 4F
不太一樣 是因為適合度的檢定量跟根號n成正比
10/30 13:32, 4F

10/30 18:15, , 5F
感謝板大~我會去好好了解的
10/30 18:15, 5F

10/30 20:36, , 6F
n很大經常表示power很大, 所以只要偏離H0一點點即可拒絕.
10/30 20:36, 6F

10/30 20:37, , 7F
這並不是什麼缺點. 偏離H0的程度也不是p-value能表示的.
10/30 20:37, 7F

10/30 20:39, , 8F
power很大加上限制很小的alpha, 表示決策正確的機會極大,
10/30 20:39, 8F

10/30 20:39, , 9F
怎會是 "弊病" 呢?
10/30 20:39, 9F

10/30 20:45, , 10F
拒絕H0是因為取得H0為假的足夠證據, 但不表示資料偏離H0
10/30 20:45, 10F

10/30 20:46, , 11F
的程度. "顯著" 不表示 "差很多".
10/30 20:46, 11F

10/30 20:51, , 12F
蠻多人對這個問題有錯誤認識的. 請版友小心.
10/30 20:51, 12F

10/30 21:55, , 13F
推a大
10/30 21:55, 13F

10/30 21:55, , 14F
R版應該要跟統計版一起服用
10/30 21:55, 14F

10/30 23:00, , 15F
我幾乎天天一起服用啊 :) 這是我上 PTT 最重要的事情
10/30 23:00, 15F
文章代碼(AID): #1IR-HFbk (R_Language)
討論串 (同標題文章)
文章代碼(AID): #1IR-HFbk (R_Language)