Re: [問題] 想用R寫一個統計回歸分析的程式

看板R_Language作者 (我要低調 拯救形象)時間10年前 (2015/11/22 10:04), 10年前編輯推噓2(2021)
留言23則, 3人參與, 最新討論串2/2 (看更多)
首先 這標題可能有誤 我的理解這問題跟迴歸沒有關係 如果我的理解沒有錯 題目是: 現在有一組資料是10條繩子的長度 那麼想了解繩子的長度應該是什麼統計分配呢 是不是常態分配 or 指數分配 or Poisson分配 我猜 原po想做的事情是 隨機產生10組數據從上述的分配 然後看看是否跟繩子長度的分配一樣 如果到這邊 我的理解還是對的 原po可以往下看 1. 請先了解生成隨機變數的指令 請google一下 例如 rnorm(10,10,90) 跟你的敘述差距很大很大 只有第一個10是對的 產生10筆資料 還有 dunif 跟 runif 的差別等等 總之 三個指令都誤用了 2. 回到問題 如果沒有學過很多檢定方式 例如 Kolmogorov–Smirnov test 建議的做法是 畫直方圖 如果某一組隨機生成的數據 長相跟繩子長度類似 那麼我想你就接近答案了 3. 跟第一點相關 產生隨機變數的指令 有些參數需要輸入 一個簡單的做法 利用資料去算出這些參數 例如 sample mean and sample variance 其實 在算出這些值之後 也可以利用這些值刪除某些不太可能的分配 舉例來說 Poisson distribution 的特性是什麼 mean = variance? 4. 最後 想要做任何分析之前 請把統計課本再拿出來翻一下 瞭解一下其意義 再來實際做分析 就我看來 T-test 迴歸 在這裡毫無用處 不知道為什麼你會提到 ===========================分隔線======================== Sorry 這篇回文跟R沒什麼關係 小弟我實在不敢在這版上回R相關指令問題 版上神人太多了 如果版主覺得不適合 可以刪文 謝謝 ※ 引述《eegame (yu)》之銘言: : 初學者(兩個月) R是第一個程式語言 : 不知道各位前輩有沒做過類似的程式 : !!!假設!!! : 想用R統計10條繩子的長度 : 再根據統計特性的率隨機產生10組數據 : 程式如下 : G <- 10 #10組數據 : rowname <- c(1:G) #Y軸名稱 : colname <- c("c1","c2","c3","c4") #X軸名稱 : F <- matrix(,nrow=G,ncol=4,dimnames=list(rowname,colname))? : #開一個10*4的矩陣並以rowname和colname : F[1,"c1"] <- 19 : F[2,"c1"] <- 59 : F[3,"c1"] <- 48 : F[4,"c1"] <- 23 : F[5,"c1"] <- 31 : F[6,"c1"] <- 48 : F[7,"c1"] <- 56 : F[8,"c1"] <- 60 : F[9,"c1"] <- 74 : F[10,"c1"] <- 83 : #在矩陣c1的位置放入這10條繩子的調查數據 : #假設1符合常態分布 : F[,"c2"] <- rnorm(10,10,90)? : #在矩陣c2的位置放入根據常態分佈的機率隨機產生一組新的數據介於10~90之間的10筆數 : 據 : #假設2符合均勻分布 : F[,"c3"] <- dunif(10,10,90) : #在矩陣c3的位置放入根據均勻分佈的機率隨機產生一組新的數據介於10~90之間的10筆數 : 據 : #假設3符合Poisson distribution分布 : F[,"c4"] <- dpois(10, lambda=1) : #在矩陣c4的位置放入根據Poisson distribution分布的機率隨機產生一組新的數據介於1 : 0~90之間的10筆數據 : #結果如下 : F : c1 c2 c3 c4 : 1? 19 -70.255568 0.0125 1.013777e-07 : 2? 59 9.346476 0.0125 1.013777e-07 : 3? 48? -2.139539 0.0125 1.013777e-07 : 4? 23 -33.231206 0.0125 1.013777e-07 : 5? 31? 72.630937 0.0125 1.013777e-07 : 6? 48? -6.032507 0.0125 1.013777e-07 : 7? 56? -8.420308 0.0125 1.013777e-07 : 8? 60 -69.542557 0.0125 1.013777e-07 : 9? 74? 12.044775 0.0125 1.013777e-07 : 10 83 -13.474063 0.0125 1.013777e-07 : 問題1.我函數的指令是不是給的不對導致c2 c3 c4的結果錯誤? : 問題2.關於隨機分布的應用 如何做到根據統計特性產生結果? : 問題3.關於數據統計特性如何檢定比較符合 常態分布 均勻分布 負指數分布等等的分布 : 特性? 是用卡方檢定 T-test檢定? 還是用數值回歸??? : 這兩個月沒有看到類似的文章 : 麻煩各位前輩指點迷津 : 拜託 拜託 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 76.181.80.117 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1448157872.A.10B.html ※ 編輯: allen1985 (76.181.80.117), 11/22/2015 10:07:34

11/22 13:44, , 1F
好人,推
11/22 13:44, 1F

11/22 14:06, , 2F
所以不用做卡方檢定!!! 而是要先算出數據的平均數 中
11/22 14:06, 2F

11/22 14:06, , 3F
位數等等 然後怎麼做判別???
11/22 14:06, 3F
Hello 看到你的推文 我想你完全沒有了解我的意思 今天 你想要看 你的資料是趨近於什麼分配 你也學了不少分配 每個分配都有其特性 簡單講 你就是要想辦法 把資料的特性找出來 以及了解 你想比較之分配的特性 看看有沒有相似之處 舉例來說 常態分配是鐘形曲線 你的資料有嗎 如果你的資料是雙峰的 那麼基本上就不太可能是常態 而你提到一堆檢定 下次你打出某個檢定的名字 請你在後面打出 這個檢定是做什麼用的 例如 T-test 是檢定兩組連續行資料的平均數 是否相同 不然 大家很難幫你 因為很難了解你到底要做什麼

11/22 14:10, , 4F
我比較想建議原po把統計學學清楚比較重要...
11/22 14:10, 4F

11/22 14:10, , 5F
連我問題都不一一回覆,我實在不知道怎麼幫
11/22 14:10, 5F

11/22 14:11, , 6F
這實在不太是求學問的方式,像是在要答案
11/22 14:11, 6F

11/22 15:28, , 7F
對不起
11/22 15:28, 7F

11/22 15:30, , 8F
我以為我回答了
11/22 15:30, 8F

11/22 15:36, , 9F
請問你做卡方檢定做什麼?
11/22 15:36, 9F

11/22 15:36, , 10F
在做每個統計分析前 請先思考一下為什麼這麼做
11/22 15:36, 10F

11/22 15:37, , 11F
麻煩你回答一下 卡方檢定是用來檢定什麼的
11/22 15:37, 11F

11/22 15:38, , 12F
所以常態的兩個參數意義?卜瓦松的參數意義?
11/22 15:38, 12F

11/22 15:38, , 13F
你都沒有回答到阿....
11/22 15:38, 13F

11/22 15:38, , 14F
我說原po
11/22 15:38, 14F

11/22 15:42, , 15F
我懂 呵呵 C大辛苦了
11/22 15:42, 15F
※ 編輯: allen1985 (76.181.80.117), 11/22/2015 15:50:43

11/22 15:45, , 16F
a大辛苦了,還回那麼一大篇...
11/22 15:45, 16F

11/22 15:51, , 17F
難得在R版上 看到我看得懂的東西...就回一下
11/22 15:51, 17F

11/22 16:14, , 18F
而且卡方檢定只是統稱 最後檢定統計量是卡方的檢定
11/22 16:14, 18F

11/22 16:15, , 19F
應該要適度標明使用的是哪一種檢定
11/22 16:15, 19F

11/22 17:20, , 20F
我整理一下訊息 1.先將資料整理出圖看分布情況 2.比對資
11/22 17:20, 20F

11/22 17:20, , 21F
料分布與哪一種分布特性相近 3.至於檢定是用在事件成不成
11/22 17:20, 21F

11/22 17:20, , 22F
立 不知道目前這樣的方式對不對 之前以為檢定是用來找分
11/22 17:20, 22F

11/22 17:20, , 23F
布特性的 非常抱歉我目前還是不懂函數中各參數的意思
11/22 17:20, 23F
文章代碼(AID): #1MKIAm4B (R_Language)
文章代碼(AID): #1MKIAm4B (R_Language)