[問題] 想用R寫一個統計回歸分析的程式

看板R_Language作者 (yu)時間10年前 (2015/11/20 14:24), 10年前編輯推噓0(0020)
留言20則, 2人參與, 最新討論串1/2 (看更多)
初學者(兩個月) R是第一個程式語言 不知道各位前輩有沒做過類似的程式 !!!假設!!! 想用R統計10條繩子的長度 再根據統計特性的率隨機產生10組數據 程式如下 G <- 10 #10組數據 rowname <- c(1:G) #Y軸名稱 colname <- c("c1","c2","c3","c4") #X軸名稱 F <- matrix(,nrow=G,ncol=4,dimnames=list(rowname,colname))? #開一個10*4的矩陣並以rowname和colname F[1,"c1"] <- 19 F[2,"c1"] <- 59 F[3,"c1"] <- 48 F[4,"c1"] <- 23 F[5,"c1"] <- 31 F[6,"c1"] <- 48 F[7,"c1"] <- 56 F[8,"c1"] <- 60 F[9,"c1"] <- 74 F[10,"c1"] <- 83 #在矩陣c1的位置放入這10條繩子的調查數據 #假設1符合常態分布 F[,"c2"] <- rnorm(10,10,90)? #在矩陣c2的位置放入根據常態分佈的機率隨機產生一組新的數據介於10~90之間的10筆數 據 #假設2符合均勻分布 F[,"c3"] <- dunif(10,10,90) #在矩陣c3的位置放入根據均勻分佈的機率隨機產生一組新的數據介於10~90之間的10筆數 據 #假設3符合Poisson distribution分布 F[,"c4"] <- dpois(10, lambda=1) #在矩陣c4的位置放入根據Poisson distribution分布的機率隨機產生一組新的數據介於1 0~90之間的10筆數據 #結果如下 F c1 c2 c3 c4 1? 19 -70.255568 0.0125 1.013777e-07 2? 59 9.346476 0.0125 1.013777e-07 3? 48? -2.139539 0.0125 1.013777e-07 4? 23 -33.231206 0.0125 1.013777e-07 5? 31? 72.630937 0.0125 1.013777e-07 6? 48? -6.032507 0.0125 1.013777e-07 7? 56? -8.420308 0.0125 1.013777e-07 8? 60 -69.542557 0.0125 1.013777e-07 9? 74? 12.044775 0.0125 1.013777e-07 10 83 -13.474063 0.0125 1.013777e-07 問題1.我函數的指令是不是給的不對導致c2 c3 c4的結果錯誤? 問題2.關於隨機分布的應用 如何做到根據統計特性產生結果? 問題3.關於數據統計特性如何檢定比較符合 常態分布 均勻分布 負指數分布等等的分布 特性? 是用卡方檢定 T-test檢定? 還是用數值回歸??? 這兩個月沒有看到類似的文章 麻煩各位前輩指點迷津 拜託 拜託 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.208.20 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1448000644.A.095.html

11/20 14:28, , 1F
1. 你知道各分配參數意義嗎?
11/20 14:28, 1F

11/20 14:28, , 2F
2. 你知道第一個問題就知道怎樣根據你觀察的資料
11/20 14:28, 2F

11/20 14:28, , 3F
去產生適當的隨機數
11/20 14:28, 3F

11/20 14:29, , 4F
3. 你的目標是檢定什麼?十條繩子長度符合某分配?
11/20 14:29, 4F

11/20 14:30, , 5F
4. 你學過適合度檢定嗎?
11/20 14:30, 5F

11/20 14:36, , 6F
另外,我很好奇這跟回歸(標題)有什麼關係啊?
11/20 14:36, 6F

11/20 14:36, , 7F
5. 你產生隨機數的目的是什麼?
11/20 14:36, 7F

11/20 14:39, , 8F
6. 會不會你等一下又要刪文啦?
11/20 14:39, 8F
不好意思我疑惑了 主要的目的是根據數據的分佈特性 找出最適合的特性(常態 均勻 指 數 負指數)分佈 接下來以最適合的特性分佈 隨機產生一組新的數據 目前知道要開矩陣 存數據 然後繪製直方圖做各區間數量統計 根據數據的分佈特性 找出最符合的特性分佈 並以特性分佈在每個區間的機率隨機產生新的數據 ※ 編輯: eegame (114.136.66.137), 11/20/2015 21:51:19

11/21 17:03, , 9F
所以你的問題跟迴歸沒有關係?
11/21 17:03, 9F
找出最合適的分佈特性 我不知如何下手 因為邏輯判斷好像沒辦法 感覺用回歸曲線對找 各特性分佈曲線 找最小平方差來決定出最合適的特性 這個想法不知道對不對 有沒有辦法寫出來 ※ 編輯: eegame (114.136.88.76), 11/21/2015 21:59:00

11/22 09:36, , 10F
最合適的分佈特性? 你是說資料最符合哪種分配嗎?
11/22 09:36, 10F

11/22 09:37, , 11F
你問題中的自變數 應變數 是?
11/22 09:37, 11F

11/22 09:37, , 12F
建議你簡化一下你的題目 一步一步問 從頭開始
11/22 09:37, 12F

11/22 09:39, , 13F
大概知道你的問題是什麼了 你有聽過qq-plot嗎
11/22 09:39, 13F
是的 資料最符合的分配 之前有用ggplot2來試畫極座標投影圖 可是資料分布不是用直方圖來畫就可以了嗎? qq-plot是要用在畫圖嗎?還是有其他隱藏 版的功能??? ※ 編輯: eegame (223.140.231.38), 11/22/2015 12:09:38

11/22 12:12, , 14F
對我來說 你用ggplot2 還是什麼function畫圖 不重要
11/22 12:12, 14F

11/22 12:13, , 15F
重要的是你想要畫什麼圖 你的圖想表達什麼
11/22 12:13, 15F

11/22 12:13, , 16F
qq-plot 是用來檢測資料是否為常態分配的一種方法
11/22 12:13, 16F

11/22 12:13, , 17F
而你現在最欠缺的是 你得先把統計方法學好
11/22 12:13, 17F

11/22 12:14, , 18F
其次才是用R把結果寫出來
11/22 12:14, 18F

11/22 14:25, , 19F
推樓上,重點不是R,他只是工具,你怎麼呈現你的想
11/22 14:25, 19F

11/22 14:25, , 20F
法才是重點
11/22 14:25, 20F
文章代碼(AID): #1MJho42L (R_Language)
文章代碼(AID): #1MJho42L (R_Language)