當伯努利分佈提出“單個事件是否會成功?”的問題時,二項式與“在給定次數的試驗中,有多少次會成功?”的問題相關聯。一些用二項式分佈建模的示例問題包括
- 在十次拋擲中,硬幣會落到正面多少次?
- 在某一天在某家醫院出生的兒童中,有多少個是女孩?
- 在某個教室裡,有多少個學生有綠色的眼睛?
- 在蜂群中,有多少隻蚊子在噴灑殺蟲劑後會死亡?
伯努利分佈和二項式分佈之間的關係是直觀的:二項式分佈是由多個伯努利試驗組成的。我們進行
次重複實驗,其中成功的機率由引數
給出,並將成功次數加起來。這個成功次數由隨機變數 X 表示。X 的值介於 0 和
之間。
當隨機變數 X 具有引數為
和
的二項式分佈時,我們將其寫為 X ~ Bin(n,p) 或 X ~ B(n,p),機率質量函式由以下方程給出
![{\displaystyle P\left[X=k\right]={\begin{cases}{n \choose k}p^{k}\left(1-p\right)^{n-k}\ &0\leq k\leq n\\0&{\mbox{otherwise}}\end{cases}}\quad 0\leq p\leq 1,\quad n\in \mathbb {N} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/4fdcd7b3068def867c9ff8b21538b9ab6cad87dc)
其中 
要複習階乘 (n!),請返回本華夏公益教科書前面部分的複習課程。
讓我們透過一個簡單的二項分佈例子來了解它。我們將使用一些非常小的數字,因為階乘計算起來很困難。我們將隨機詢問五個人是否相信外星生命的存在。在這個例子中,我們假設我們知道 30% 的人認為這是真的。我們想問的問題是:“有多少人會說他們相信外星生命?”實際上,我們想更具體一點:“**兩個人說他們相信外星生命的機率是多少?**”
我們知道將要代入方程的所有值。被問的人數,n=5。任何特定的人回答“是”的機率,p=0.3。(記住,我說 30% 的人相信外星生命存在!)最後,我們想知道正好有 2 個人回答“是”的機率,所以 k=2。這將得到以下方程
因為 
以下是 X 所有可能值的機率。您可以透過將上面方程中的 k=2 替換為 0 到 5 之間的任何值來獲得這些值。
| k 的值 |
機率 f(k) |
| 0 |
0.16807
|
| 1 |
0.36015
|
| 2 |
0.30870
|
| 3 |
0.13230
|
| 4 |
0.02835
|
| 5 |
0.00243
|
從這些結果中我們可以學到什麼?首先,我們會發現只有一個人的可能性略高於兩個人承認相信外星生命存在。沒有人相信它存在有明顯的可能性(大約 17%),只有 0.24%(不到千分之二)的可能性是五個人都相信。
以上面這個例子為例。讓我們逐個考慮五個人。
任何人相信外星生命存在的機率是 30%,即 0.3。因此,任何兩個人都相信外星生命存在的機率是 0.3 的平方。類似地,任何人都不相信外星生命存在的機率是 70%,即 0.7,因此,任何三個都不相信外星生命存在的機率是 0.7 的立方。
現在,為了讓五個人中有兩個人相信外星生命存在,必須滿足兩個條件:兩個人相信外星生命存在,三個人不相信。因此,五個人中有兩個人相信外星生命存在的機率似乎是 0.3 的平方(兩個相信者)乘以 0.7 的立方(三個不相信者),即 0.03087。
然而,在這樣做時,我們只考慮了前兩個被選中的人是相信者的情況。我們如何考慮第三個和第五個人是相信者的情況?這也會意味著五個人中總共有兩個相信者。
答案在於組合學。考慮到五個人中前兩個人相信外星生命存在的機率是 0.03087,我們注意到有 C(5,2),即 10 種方法可以從五個人中選出一組兩個人,也就是說,有 10 種方法可以考慮五個人中的兩個人是“前兩個人”。這就是我們乘以 C(n,k) 的原因。五個人中任意兩個人是相信者的機率是 0.03087 的十倍,即 0.3087。
平均值可以這樣推導。
![{\displaystyle \operatorname {E} [X]=\sum _{i}f(x_{i})\cdot x_{i}=\sum _{x=0}^{n}{n \choose x}p^{x}\left(1-p\right)^{n-x}\cdot x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/25c14d7c93230e07fa765e5b066e733423288f60)
![{\displaystyle \operatorname {E} [X]=\sum _{x=0}^{n}{n! \over x!(n-x)!}p^{x}\left(1-p\right)^{n-x}x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b68fb0a2115b2b88188f882d4827a75bd0f49441)
![{\displaystyle \operatorname {E} [X]={n! \over 0!(n-0)!}p^{0}\left(1-p\right)^{n-0}\cdot 0+\sum _{x=1}^{n}{n! \over x!(n-x)!}p^{x}\left(1-p\right)^{n-x}x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/77dea4fc65c59c164b5788edbc9284493b722a27)
![{\displaystyle \operatorname {E} [X]=0+\sum _{x=1}^{n}{n(n-1)! \over x(x-1)!(n-x)!}p\cdot p^{x-1}\left(1-p\right)^{n-x}x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1504d9928a9523e18659f92b1c2147519e289f9d)
![{\displaystyle \operatorname {E} [X]=np\sum _{x=1}^{n}{(n-1)! \over (x-1)!(n-x)!}p^{x-1}\left(1-p\right)^{n-x}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d12b43e256bb10979874f372a5559a56773a9b4e)
現在令 *w=x-1* 和 *m=n-1*。我們可以看到 *m-w=n-x*。現在我們可以將求和重寫為
![{\displaystyle \operatorname {E} [X]=np\left[\sum _{w=0}^{m}{m! \over w!(m-w)!}p^{w}\left(1-p\right)^{m-w}\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/023e3a02fb0f74ecc050e8a6ac6f99773f9dbd71)
現在我們可以看到,求和是在服從 Bin(m, p) 分佈的二項式隨機變數的完整機率質量函式上的求和。這等於 1(並且可以使用 二項式定理 輕鬆驗證)。因此,我們有
![{\displaystyle \operatorname {E} [X]=np\left[1\right]=np}](https://wikimedia.org/api/rest_v1/media/math/render/svg/622190f9d3d351a6901c3eeec8f81c2e936ec495)
我們使用以下公式推匯出方差
![{\displaystyle \operatorname {Var} [X]=\operatorname {E} [X^{2}]-(\operatorname {E} [X])^{2}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/39bfa72738f2149e732dfa85f4be9fcd52c38422)
我們已經計算了上面的 E[ *X*],所以現在我們將計算 E[ *X2*],然後回到這個方差公式
![{\displaystyle \operatorname {E} [X^{2}]=\sum _{i}f(x_{i})\cdot x^{2}=\sum _{x=0}^{n}x^{2}\cdot {n \choose x}p^{x}(1-p)^{n-x}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a813301bbd5190e14095a6656efcdb9f2962a141)
我們可以利用我們在推導均值時獲得的經驗。我們使用相同 *m* 和 *w* 的定義。
![{\displaystyle \operatorname {E} [X^{2}]=\sum _{x=0}^{n}{n! \over x!(n-x)!}p^{x}\left(1-p\right)^{n-x}x^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/df10a914655f7841e060bb9072bc71fbb4af6b72)
![{\displaystyle \operatorname {E} [X^{2}]=0+\sum _{x=1}^{n}{n! \over x!(n-x)!}p^{x}\left(1-p\right)^{n-x}x^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d0ef869b731e23896f03218e82c305d3db41917f)
![{\displaystyle \operatorname {E} [X^{2}]=np\sum _{x=1}^{n}{(n-1)! \over (x-1)!(n-x)!}p^{x-1}\left(1-p\right)^{n-x}x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/35fb16618202ec081600966d99b8f1c2c6962c91)
![{\displaystyle \operatorname {E} [X^{2}]=np\sum _{w=0}^{m}{m \choose w}p^{w}\left(1-p\right)^{m-w}(w+1)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/19b17276a1cdd6a3f8569ed3bf01f6a1cfd13e5f)
![{\displaystyle \operatorname {E} [X^{2}]=np\left[\sum _{w=0}^{m}{m \choose w}p^{w}\left(1-p\right)^{m-w}w+\sum _{w=0}^{m}{m \choose w}p^{w}\left(1-p\right)^{m-w}\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ad5ddf55b6e8f72e5742e69fa83765614031db3d)
第一個和式與我們在均值(上文)中計算的和式形式相同。它加起來等於mp。第二個和式等於 1。
![{\displaystyle \operatorname {E} [X^{2}]=np\cdot (mp+1)=np((n-1)p+1)=np(np-p+1).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e118c6eaaae9f86b246c5bbb101cf50c31305519)
將此結果代入方差表示式,並結合均值(E(X) = np),得到
![{\displaystyle \operatorname {Var} (X)=\operatorname {E} [X^{2}]-(\operatorname {E} [X])^{2}=np(np-p+1)-(np)^{2}=np(1-p).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4f05a27ebd1225835ee614a1e94e5bd4e561f1b5)
- ↑ 25