統計學/分佈/二項式

簡介
不同型別的資料
1. 原始資料和次級資料
2. 定量資料和定性資料
資料收集方法
資料分析
1. 資料清理
2. 移動平均
彙總統計
1. 集中趨勢的度量
  1. 平均數、中位數和眾數
  2. 幾何平均數
  3. 調和平均數
  4. 算術平均數、幾何平均數和調和平均數之間的關係
  5. 幾何中位數
2. 離散程度的度量
展示資料
1. 條形圖
2. 比較條形圖
3. 直方圖
4. 散點圖
5. 箱線圖
6. 餅圖
7. 比較餅圖
8. 象形圖
9. 折線圖
10. 頻率多邊形
機率
分佈
1. 離散分佈
2. 連續分佈
檢驗統計假設
點估計 (12:07, 28 March 2007 (UTC))
1. 無偏性
2. 優良性的度量
3. UMVUE
4. 完備性
5. 充分性和最小充分性
6. 輔助性
練習題
數值方法
時間序列分析
多元資料分析
特定資料集的分析
1. 結核病分析
附錄
1. 作者
2. 詞彙表
3. 索引
4. 連結

當伯努利分佈詢問“這個單一事件會成功嗎？”這個問題時，二項式與“在給定的試驗次數中，會有多少次成功？”這個問題相關聯。一些用二項式分佈建模的示例問題是

在十次拋擲中，這枚硬幣會有多少次正面朝上？
在特定醫院特定日期出生的兒童中，有多少人是女孩？
在特定教室中，有多少學生有綠色的眼睛？
在一個蜂群中，有多少隻蚊子在噴灑殺蟲劑後會死亡？

伯努利分佈和二項式分佈之間的關係是直觀的：二項式分佈是由多個伯努利試驗組成的。我們進行 $n$ 次重複實驗，其中成功的機率由引數 $p$ 給出，並將成功的次數加起來。這個成功的次數由隨機變數 X 表示。X 的值介於 0 和 $n$ 之間。

當一個隨機變數 X 服從引數為 $p$ 和 $n$ 的二項式分佈時，我們將其寫為 X ~ Bin(n,p) 或 X ~ B(n,p)，其機率質量函式由以下公式給出

P\left[X=k\right]={\begin{cases}{n \choose k}p^{k}\left(1-p\right)^{n-k}\ &0\leq k\leq n\\0&{\mbox{otherwise}}\end{cases}}\quad 0\leq p\leq 1,\quad n\in \mathbb {N}

其中 ${n \choose k}={n! \over k!(n-k)!}$

要回顧階乘 (n!)，請返回到本華夏公益教科書前面部分的複習課程。

一個例子

讓我們透過一個二項分佈的簡單示例來進行說明。我們將使用一些非常小的數字，因為階乘可能很難計算。我們將詢問五個隨機的人，他們是否相信其他星球上存在生命。在這個例子中，我們假設我們知道 30% 的人認為這是真的。我們想問這個問題：“有多少人會說他們相信外星生命？” 事實上，我們想比這更具體：**“恰好有 2 個人說他們相信外星生命的機率是多少？”**

我們知道需要代入方程的所有值。被問的人數 n=5。任何特定的人回答“是”的機率 p=0.3。（請記住，我說 30% 的人相信其他星球上存在生命！）最後，我們詢問恰好有 2 個人回答“是”的機率，所以 k=2。這將得出以下方程

P\left[X=2\right]={5 \choose 2}\cdot {{0.3^{2}\cdot }{\left(1-0.3\right)^{3}}}={10}\cdot {{0.3^{2}}\cdot {\left(1-0.3\right)^{3}}}=0.3087

因為

{5 \choose 2}={5! \over 2!\cdot 3!}={5\cdot 4\cdot 3\cdot 2\cdot 1 \over (2\cdot 1)\cdot (3\cdot 2\cdot 1)}={120 \over 12}=10

以下是 X 的所有可能值的機率。你可以透過將上述方程中的 k=2 替換為 0 到 5 之間的全部值來獲得這些值。

k 的值	機率 f(k)
0	0.16807
1	0.36015
2	0.30870
3	0.13230
4	0.02835
5	0.00243

我們能從這些結果中瞭解到什麼？首先，我們會看到只有一個人承認相信其他星球上存在生命的可能性略大一些。沒有人相信的可能性很大（約 17%），只有 0.24%（每千人略高於 2 人）的可能性是所有五個人都會是信徒。

方程的解釋

以上面的例子為例。讓我們逐個考慮這五個人。

任何一個人相信外星生命存在的機率是 30%，也就是 0.3。所以任何兩個人都相信外星生命存在的機率是 0.3 的平方。同樣，任何一個人不相信外星生命存在的機率是 70%，也就是 0.7，所以任何三個人都不相信外星生命存在的機率是 0.7 的立方。

現在，對於五個人中有兩個人相信外星生命，必須滿足兩個條件：兩個人相信外星生命，而三個人不相信。因此，五個人中有兩個人相信外星生命存在的機率似乎是 0.3 的平方（兩個信徒）乘以 0.7 的立方（三個不信徒），也就是 0.03087。

然而，在這樣做時，我們只考慮了第一個被選中的人是信徒的情況。我們如何考慮第三和第五個人是信徒的情況，這也意味著五個人中有兩個信徒？

答案在於組合學。考慮到五個人中前兩個人相信外星生命存在的機率是 0.03087，我們注意到從五個人中選出兩個人集的方法是 C(5,2)，也就是 10，即，有十種方法可以考慮五個人中的兩個人是“前兩個人”。這就是我們為什麼乘以 C(n,k) 的原因。五個人中任何兩個人都是信徒的機率是十倍於 0.03087，也就是 0.3087。