當 伯努利分佈 詢問“這個單一事件會成功嗎?”這個問題時,二項式與“在給定的試驗次數中,會有多少次成功?”這個問題相關聯。一些用二項式分佈建模的示例問題是
- 在十次拋擲中,這枚硬幣會有多少次正面朝上?
- 在特定醫院特定日期出生的兒童中,有多少人是女孩?
- 在特定教室中,有多少學生有綠色的眼睛?
- 在一個蜂群中,有多少隻蚊子在噴灑殺蟲劑後會死亡?
伯努利分佈和二項式分佈之間的關係是直觀的:二項式分佈是由多個伯努利試驗組成的。我們進行
次重複實驗,其中成功的機率由引數
給出,並將成功的次數加起來。這個成功的次數由隨機變數 X 表示。X 的值介於 0 和
之間。
當一個隨機變數 X 服從引數為
和
的二項式分佈時,我們將其寫為 X ~ Bin(n,p) 或 X ~ B(n,p),其機率質量函式由以下公式給出
![{\displaystyle P\left[X=k\right]={\begin{cases}{n \choose k}p^{k}\left(1-p\right)^{n-k}\ &0\leq k\leq n\\0&{\mbox{otherwise}}\end{cases}}\quad 0\leq p\leq 1,\quad n\in \mathbb {N} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/4fdcd7b3068def867c9ff8b21538b9ab6cad87dc)
其中 
要回顧階乘 (n!),請返回到本華夏公益教科書前面部分的 複習課程。
讓我們透過一個二項分佈的簡單示例來進行說明。 我們將使用一些非常小的數字,因為階乘可能很難計算。 我們將詢問五個隨機的人,他們是否相信其他星球上存在生命。 在這個例子中,我們假設我們知道 30% 的人認為這是真的。 我們想問這個問題:“有多少人會說他們相信外星生命?” 事實上,我們想比這更具體:**“恰好有 2 個人說他們相信外星生命的機率是多少?”**
我們知道需要代入方程的所有值。 被問的人數 n=5。 任何特定的人回答“是”的機率 p=0.3。 (請記住,我說 30% 的人相信其他星球上存在生命!)最後,我們詢問恰好有 2 個人回答“是”的機率,所以 k=2。 這將得出以下方程
因為 
以下是 X 的所有可能值的機率。 你可以透過將上述方程中的 k=2 替換為 0 到 5 之間的全部值來獲得這些值。
| k 的值 |
機率 f(k) |
| 0 |
0.16807
|
| 1 |
0.36015
|
| 2 |
0.30870
|
| 3 |
0.13230
|
| 4 |
0.02835
|
| 5 |
0.00243
|
我們能從這些結果中瞭解到什麼? 首先,我們會看到只有一個人承認相信其他星球上存在生命的可能性略大一些。 沒有人相信的可能性很大(約 17%),只有 0.24%(每千人略高於 2 人)的可能性是所有五個人都會是信徒。
以上面的例子為例。 讓我們逐個考慮這五個人。
任何一個人相信外星生命存在的機率是 30%,也就是 0.3。 所以任何兩個人都相信外星生命存在的機率是 0.3 的平方。 同樣,任何一個人不相信外星生命存在的機率是 70%,也就是 0.7,所以任何三個人都不相信外星生命存在的機率是 0.7 的立方。
現在,對於五個人中有兩個人相信外星生命,必須滿足兩個條件:兩個人相信外星生命,而三個人不相信。 因此,五個人中有兩個人相信外星生命存在的機率似乎是 0.3 的平方(兩個信徒)乘以 0.7 的立方(三個不信徒),也就是 0.03087。
然而,在這樣做時,我們只考慮了第一個被選中的人是信徒的情況。 我們如何考慮第三和第五個人是信徒的情況,這也意味著五個人中有兩個信徒?
答案在於組合學。 考慮到五個人中前兩個人相信外星生命存在的機率是 0.03087,我們注意到從五個人中選出兩個人集的方法是 C(5,2),也就是 10,即,有十種方法可以考慮五個人中的兩個人是“前兩個人”。 這就是我們為什麼乘以 C(n,k) 的原因。 五個人中任何兩個人都是信徒的機率是十倍於 0.03087,也就是 0.3087。
均值可以推匯出如下。
![{\displaystyle \operatorname {E} [X]=\sum _{i}f(x_{i})\cdot x_{i}=\sum _{x=0}^{n}{n \choose x}p^{x}\left(1-p\right)^{n-x}\cdot x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/25c14d7c93230e07fa765e5b066e733423288f60)
![{\displaystyle \operatorname {E} [X]=\sum _{x=0}^{n}{n! \over x!(n-x)!}p^{x}\left(1-p\right)^{n-x}x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b68fb0a2115b2b88188f882d4827a75bd0f49441)
![{\displaystyle \operatorname {E} [X]={n! \over 0!(n-0)!}p^{0}\left(1-p\right)^{n-0}\cdot 0+\sum _{x=1}^{n}{n! \over x!(n-x)!}p^{x}\left(1-p\right)^{n-x}x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/77dea4fc65c59c164b5788edbc9284493b722a27)
![{\displaystyle \operatorname {E} [X]=0+\sum _{x=1}^{n}{n(n-1)! \over x(x-1)!(n-x)!}p\cdot p^{x-1}\left(1-p\right)^{n-x}x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1504d9928a9523e18659f92b1c2147519e289f9d)
![{\displaystyle \operatorname {E} [X]=np\sum _{x=1}^{n}{(n-1)! \over (x-1)!(n-x)!}p^{x-1}\left(1-p\right)^{n-x}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d12b43e256bb10979874f372a5559a56773a9b4e)
現在令w=x-1 和 m=n-1。我們可以看到m-w=n-x。現在我們可以將求和重寫為
![{\displaystyle \operatorname {E} [X]=np\left[\sum _{w=0}^{m}{m! \over w!(m-w)!}p^{w}\left(1-p\right)^{m-w}\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/023e3a02fb0f74ecc050e8a6ac6f99773f9dbd71)
現在我們可以看到,該求和是對二項式隨機變數分佈為Bin(m, p)的完整 pmf 的求和。它等於 1(並且可以使用二項式定理輕鬆驗證)。因此,我們有
![{\displaystyle \operatorname {E} [X]=np\left[1\right]=np}](https://wikimedia.org/api/rest_v1/media/math/render/svg/622190f9d3d351a6901c3eeec8f81c2e936ec495)
我們使用以下公式推匯出方差
![{\displaystyle \operatorname {Var} [X]=\operatorname {E} [X^{2}]-(\operatorname {E} [X])^{2}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/39bfa72738f2149e732dfa85f4be9fcd52c38422)
我們已經計算了上面的 E[X],所以現在我們將計算 E[X2],然後回到這個方差公式
![{\displaystyle \operatorname {E} [X^{2}]=\sum _{i}f(x_{i})\cdot x^{2}=\sum _{x=0}^{n}x^{2}\cdot {n \choose x}p^{x}(1-p)^{n-x}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a813301bbd5190e14095a6656efcdb9f2962a141)
我們可以使用我們在上面推匯出均值時獲得的經驗。我們使用m 和 w 的相同定義。
![{\displaystyle \operatorname {E} [X^{2}]=\sum _{x=0}^{n}{n! \over x!(n-x)!}p^{x}\left(1-p\right)^{n-x}x^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/df10a914655f7841e060bb9072bc71fbb4af6b72)
![{\displaystyle \operatorname {E} [X^{2}]=0+\sum _{x=1}^{n}{n! \over x!(n-x)!}p^{x}\left(1-p\right)^{n-x}x^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d0ef869b731e23896f03218e82c305d3db41917f)
![{\displaystyle \operatorname {E} [X^{2}]=np\sum _{x=1}^{n}{(n-1)! \over (x-1)!(n-x)!}p^{x-1}\left(1-p\right)^{n-x}x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/35fb16618202ec081600966d99b8f1c2c6962c91)
![{\displaystyle \operatorname {E} [X^{2}]=np\sum _{w=0}^{m}{m \choose w}p^{w}\left(1-p\right)^{m-w}(w+1)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/19b17276a1cdd6a3f8569ed3bf01f6a1cfd13e5f)
![{\displaystyle \operatorname {E} [X^{2}]=np\left[\sum _{w=0}^{m}{m \choose w}p^{w}\left(1-p\right)^{m-w}w+\sum _{w=0}^{m}{m \choose w}p^{w}\left(1-p\right)^{m-w}\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ad5ddf55b6e8f72e5742e69fa83765614031db3d)
第一個求和的形式與我們在均值(上面)中計算的相同。它加起來為mp。第二個求和為1。
![{\displaystyle \operatorname {E} [X^{2}]=np\cdot (mp+1)=np((n-1)p+1)=np(np-p+1).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e118c6eaaae9f86b246c5bbb101cf50c31305519)
將此結果代入方差表示式,以及均值(E(X) = np),我們得到
![{\displaystyle \operatorname {Var} (X)=\operatorname {E} [X^{2}]-(\operatorname {E} [X])^{2}=np(np-p+1)-(np)^{2}=np(1-p).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4f05a27ebd1225835ee614a1e94e5bd4e561f1b5)
- ↑ 25