[問題] statistical modeling如何知道distributi

看板DataScience作者 (做工的人)時間1年前 (2023/03/21 17:40), 編輯推噓9(9016)
留言25則, 8人參與, 1年前最新討論串1/1
統計題目通常都是給定已知distribution 然後這之後由data估計出mean, variance等未知變量(data analysis) 我好奇如何能從一群data估計出是什麼distribution? 就是說statistical modeling是怎麼做的? 先感謝各位的回覆與建議了 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 92.221.218.184 (挪威) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1679391616.A.837.html

03/21 18:53, 1年前 , 1F
應該是先「假設」其distribution再去求相關參數吧
03/21 18:53, 1F

03/21 20:14, 1年前 , 2F
同一樓看法
03/21 20:14, 2F

03/21 20:18, 1年前 , 3F
看設的random variable情境為何,在不同情境有不同適用的
03/21 20:18, 3F

03/21 20:18, 1年前 , 4F
機率分佈,至於準不準確我認為有待樣本做大之後再檢驗了
03/21 20:18, 4F

03/22 00:47, 1年前 , 5F
承上述大大討論:統計模型之所以是「統計」,是因為
03/22 00:47, 5F

03/22 00:47, 1年前 , 6F
基於研究者對這個領域的了解與前人經驗的累積,才能
03/22 00:47, 6F

03/22 00:47, 1年前 , 7F
針對變數提出很強的分佈假設,透過這樣的假設才能進
03/22 00:47, 7F

03/22 00:47, 1年前 , 8F
一步推敲變數與應變數的關係
03/22 00:47, 8F

03/22 00:51, 1年前 , 9F
當然這時就會有人質疑,前人經驗與當下情境有所出入
03/22 00:51, 9F

03/22 00:51, 1年前 , 10F
,究竟是否合適繼續使用同樣的分佈假設;這時除了可
03/22 00:51, 10F

03/22 00:51, 1年前 , 11F
以透過檢定佐證外,也可以透過各式各樣的手段放寬分
03/22 00:51, 11F

03/22 00:51, 1年前 , 12F
佈假設的限制(比方說robust, panel data…
03/22 00:51, 12F

03/22 14:30, 1年前 , 13F
標準做法不就是 kernel density estimation 嗎?
03/22 14:30, 13F

03/22 15:53, 1年前 , 14F
可以用Central limit theorem假設distribution
03/22 15:53, 14F

03/22 17:25, 1年前 , 15F
看你要做什麼用 如果是計量相關分析可以用GMM方法 只要
03/22 17:25, 15F

03/22 17:25, 1年前 , 16F
知道動差就可以跑了~回到問題本身 所以要先觀察data阿
03/22 17:25, 16F

03/22 17:26, 1年前 , 17F
學這麼多分配就是要讓你知道資料有這些種類的特性 都
03/22 17:26, 17F

03/22 17:26, 1年前 , 18F
不是那些學過的話再來談
03/22 17:26, 18F

03/27 18:55, 1年前 , 19F
推一樓
03/27 18:55, 19F

03/27 18:55, 1年前 , 20F
比較「統計化」的執行方式應該是先猜測分佈然後再去
03/27 18:55, 20F

03/27 18:55, 1年前 , 21F
估計參數
03/27 18:55, 21F

04/02 02:45, 1年前 , 22F
標準做法還有kernel density estimation 或是更直觀的
04/02 02:45, 22F

04/02 02:45, 1年前 , 23F
histogram 去試著看出資料的 distribution ,也有不
04/02 02:45, 23F

04/02 02:45, 1年前 , 24F
少針對 distribution 的檢定可以做,接著再用一樓說的
04/02 02:45, 24F

04/02 02:45, 1年前 , 25F
方法去繼續分析
04/02 02:45, 25F
文章代碼(AID): #1a6Nk0Wt (DataScience)
文章代碼(AID): #1a6Nk0Wt (DataScience)