跳到內容

R 程式設計/機率函式/二項式

來自華夏公益教科書,開放的書籍,為開放的世界

二項分佈

[編輯 | 編輯原始碼]
  • N 個伯努利試驗(所有試驗都具有相同的成功機率)的總和
  • N 次拋擲可能不公平的硬幣中正面出現的次數。
  • 在水樣中真正存在的 N 個卵囊中,實際計數的個數,假設每個卵囊具有相同的回收機率。
  • 此分佈具有 2 個引數(N 和 P),儘管我們通常知道試驗次數(N),因此只有一個引數未知(P)。

機率質量函式

[編輯 | 編輯原始碼]
  • dbinom(K,N,P),其中 K 是成功次數,N 是試驗次數,P 是成功的機率。
  • dbinom(5,10,0.5) = 0.2460938
具有相同試驗次數(10)但不同成功率(0.5 和 0.2)的二項式機率質量函式。

分佈函式

[編輯 | 編輯原始碼]
  • pbinom(K,N,P)
  • pbinom(5,10,0.5) = 0.6230469
N=10,P=0.2(藍色)和 P=0.5(紅色)。

生成隨機變數

[編輯 | 編輯原始碼]
  • rbinom(M,N,P)
  • rbinom(12,10,0.5) -> 5 5 7 5 5 6 7 6 6 6 4 7
  • hist(rbinom(1000,10,0.5)) --> 直方圖
檔案:Binom hist.JPG
1000 個二項式偏差樣本,顯示為直方圖。
  • hist(rbinom(1000,10,0.5), breaks = seq(from=-0.5, to=12.5))將整數值放在條形圖的中心(而不是條形圖的右側)。

引數估計

[編輯 | 編輯原始碼]

大多數情況下,我們可以計算試驗次數,因此該引數(N)是已知的。我們觀察正值的個數(K),並利用這些資訊來估計未觀察到的“成功”機率(P)。

  • M 個二項式的總和與 M*N 個伯努利試驗的總和相同 = binom(M*N,P)
  • 最大似然
    • lambda = sum(successes)/sum(trials) = sum(K)/sum(N)
  • 貝葉斯
    • 在均勻先驗的情況下,後驗是Beta(alpha=1+sum(K), beta=1+sum(N)-sum(K))
    • 在先驗機率質量在 0 和 1 上,並將剩餘質量分配給 Beta(1,1) 的情況下,請參閱拋硬幣示例
檔案:Beta1.JPG
來自 Mathcad 的影像
檔案:Binom.jpg
來自 WinBUGS 的影像


  • 經典
    • 正態近似
    • 精確置信區間

但是,如果 M 個二項式試驗的試驗次數未知呢?我們可以使用資料 K[1] 到 K[M] 來估計 N 和 P 嗎?

從重複的獨立同分布二項式試驗中估計兩個引數

[編輯 | 編輯原始碼]
華夏公益教科書