高中數學擴充套件/離散機率
引言
機率論是最廣泛應用的數學理論之一。它處理不確定性,並教你如何管理它。
請不要誤解:我們不是學習預測事物;相反,我們學習利用預測的機會並使它們有用。因此,我們不關心諸如明天下雨的機率是多少?之類的問題,而是假設機率是60%,我們可以進行推論,其中最簡單的是明天不下雨的機率是40%。
如上所述,機率是一個百分比,介於0%和100%之間(含)。數學家喜歡將機率表示為比例,即介於0和1之間的數字。因此,明天不下雨的機率為0.4。
應用
你可能會問我們為什麼要學習機率。讓我們看一個機率應用的快速示例。
考慮以下賭博遊戲:拋硬幣;如果是正面,我給你1美元;如果是反面,你給我2美元。你會很容易注意到這不是一個公平的遊戲 - 機會相同(50%-50%)但獎勵不同。即使我們玩的是機率,我們也能做出一些有用的,有時並不那麼明顯的結論:其中之一是從長遠來看我會變得更富有,而你會變得更窮。
另一個現實生活中的例子:我有一天觀察到外面烏雲密佈。所以我就問自己,我該不該帶傘?我將對烏雲的觀察作為我日常決定程式的一部分。因為在過去的經歷中,烏雲是下雨的預兆,所以我更有可能帶傘。
在現實生活中,機率論被經濟學家、企業、保險公司、政府等廣泛應用於風險分析。更廣泛的應用是它作為統計學的基礎,而統計學是所有科學研究的主要基礎。物理學的兩個分支的基礎都與機率有關。一個很明顯地從它的名字就能識別出來:統計力學。另一個是量子物理學。
為什麼是離散機率?
機率有兩種型別:離散和連續。連續情況被認為比離散機率更難理解,也更不直觀,它需要微積分知識。但我們將在本章稍後部分略微涉及連續情況。
事件和機率
大致來說,事件是我們可以為之分配機率的事物。例如明天下雨的機率為0.6;這裡,事件是明天會下雨,分配的機率為0.6。我們可以寫成
- P(明天會下雨) = 0.6
數學家通常用抽象字母來表示事件。在這種情況下,我們選擇A來表示事件明天會下雨,因此上面的表示式可以寫成
- P(A) = 0.6
另一個例子是一個(六面)公平的骰子每次擲出時將以相等的機率出現1、2、3、4、5或6。設B為下次擲出時出現1的事件。我們寫成
- P(B) = 1/6
誤解
請注意,機率1/6並不意味著它將在最多六次嘗試中出現1。它的確切含義將在本章稍後討論。大致來說,這意味著從長遠來看(即骰子被擲出很多次),1的比例將非常接近1/6。
不可能和必然事件
兩種型別的事件是特殊的。一種是無法發生的事件(例如,骰子擲出7);另一種是必然發生的事件(例如,骰子擲出1、2、3、4、5或6中的一個)。不可能事件的機率為0,而必然事件的機率為1。我們寫成
- P(不可能事件) = 0
- P(必然事件) = 1
以上內容加強了關於機率的一個非常重要的原則。即,機率的範圍在0到1之間。你永遠不會得到2.5的機率!所以記住以下內容
對於所有事件 .
事件的補集
一個最有用的概念是事件的補集。這裡我們使用 來表示事件骰子在下次投擲時不會出現 1。通常,在表示事件的變數上加一個橫線意味著該事件的相反情況。在上面骰子的例子中
這意味著骰子在下次投擲時出現 2、3、4、5 或 6 的機率是 5/6(儘管存在上述誤解,即 X/Y 的機率並不意味著它將在最多 Y 次嘗試中出現 X 次)。請注意
對於任何事件 E。
除了在頂部加一個橫線(線)之外,還有其他一些補集的符號(寫法):撇號 (A') 和星號 (A*)。A' 和 A* 都有以下含義:
組合獨立機率
獨立機率可以組合起來,得出更復雜事件的機率。我在這裡強調獨立這個詞,因為以下證明如果沒有這個要求是行不通的。這個詞的精確含義將在本章稍後討論,我們將展示為什麼獨立性在本章練習 10 中很重要。
新增機率
當單個事件可以以多種“方式”發生時,機率相加。由於這是一個相當寬泛的概念,以下示例可能會有所幫助。考慮擲一個骰子;如果我們想要計算某個事件的機率,比如擲出一個奇數,我們必須將所有導致這種情況發生的“方式”的機率相加——擲出 1、3 或 5。因此,我們得出以下計算結果
- P(擲出奇數)= P(擲出 1)+ P(擲出 3)+ P(擲出 5)= 1/6 + 1/6 + 1/6 = 3/6 = 1/2 = 0.5
請注意,機率的加法通常與使用“或”這個詞有關——當我們說某個事件 E 包含事件 X、Y 或 Z(如果任何事件發生,則滿足條件)時,我們使用加法來組合它們的機率(如果它們是不相交的,請參見下文)。
一個經驗法則是,一個事件的機率與其補集的機率之和必須等於 1。這是有道理的,因為我們直覺上認為,定義良好的事件要麼發生,要麼不發生。
機率相乘
當事件以多種“階段”或“步驟”發生時,機率相乘。例如,考慮連續擲兩次骰子;連續擲兩次 6(兩次背靠背)的機率是透過將每個步驟的機率相乘來計算的,因為這兩個事件是獨立的。直覺上,第一步是第一次擲骰子,第二步是第二次擲骰子。因此,擲兩次 6 的最終機率如下
- P(擲兩次 6)= P(第一次擲出 6)P(第二次擲出 6)= = 1/36 0.028(或 2.8%)
同樣,請注意,機率的乘法通常與使用“和”這個詞有關——當我們說某個事件 E 等效於事件 X、Y 和 Z 全部發生時,我們使用乘法來組合它們的機率(如果它們是獨立的)。
此外,重要的是要認識到,多個機率的乘積必須小於或等於每個單獨的機率,因為機率被限制在 0 到 1 的範圍內。這與我們對相對複雜事件通常不太可能發生的直覺認識相一致。
組合加法和乘法
通常需要同時使用這兩個運算。再次考慮一個骰子連續擲兩次。與前面的情況相反,我們現在將考慮擲出兩個數字相加為 3 的事件。在這種情況下,顯然涉及兩個步驟,因此將使用乘法,但也存在多種導致所考慮事件發生的“方式”,這意味著加法也必須參與其中。骰子在第一次擲出時可以出現 1,第二次擲出時可以出現 2,或者第一次擲出時可以出現 2,第二次擲出時可以出現 1。這導致了以下計算結果
- 擲出總和為 3 的機率 = 第一次擲出 1 的機率第二次擲出 2 的機率 + 第一次擲出 2 的機率第二次擲出 1 的機率 = + = 1/18 0.056(或 5.6%)
這只是一個簡單的例子,機率的加法和乘法可以用來計算更復雜的機率。
練習
令 A 表示(公平)骰子擲出的點數,令 C 表示在另一個(公平)骰子擲出的點數,令 B 表示從一副牌中隨機抽取的一張牌。
1. 擲一個骰子。擲出 3 的機率是多少,即計算 P(A = 3)?
2. 擲一個骰子。擲出 2、3 或 5 的機率是多少,即計算 P(A = 2, 3 或 5)?
3. 從一副 52 張牌中抽取一張方塊牌的機率是多少?。有 4 種花色,方塊、黑桃、梅花和紅心。
4. 擲一個骰子,然後從一副牌中隨機抽取一張牌。擲出 4 並且抽到黑桃 A 的機率是多少,即計算 P(A = 4)×P(B = 黑桃 A)。
5. 同時擲兩個骰子。擲出 1 和 3 的機率是多少?
6. 分別擲兩個骰子。擲出 1 和 3 的機率是多少,無論順序如何?
7. 計算擲出兩個骰子,它們的總和為 7 的機率。
8.(可選)令 C 為第一個骰子上擲出的點數,A 為第二個骰子上擲出的點數。證明 C 等於 A 的機率為 1/6。
9. 令 C 和 A 與練習 8 中相同。C 大於 A 的機率是多少?
10. 加雷斯被告知,在他所在的班級裡,50% 的學生踢足球,30% 的學生玩電子遊戲,30% 的學生學習數學。所以,如果他從班級裡隨機選擇一名學生,他計算出該學生踢足球、玩電子遊戲和學習數學的機率是 50% + 30% + 30% = 1/2 + 3/10 + 3/10 = 11/10。但所有機率都應該在 0 和 1 之間。加雷斯犯了什麼錯誤?
解答
1. P(A = 3) = 1/6
2. P(A = 2) + P(A = 3) + P(A = 5) = 1/6 + 1/6 + 1/6 = 1/2
3. P(B = 方塊 A) + ... + P(B = 方塊 K) = 13 × 1/52 = 1/4
4. P(A = 4) × P(B = 黑桃 A) = 1/6 × 1/52 = 1/312
5. P(A = 1) × P(C = 3) + P(A = 3) × P(C = 1) = 1/36 + 1/36 = 1/18
6. P(A = 1) × P(C = 3) + P(A = 3) × P(C = 1) = 1/36 + 1/36 = 1/18。這與上面的問題答案相同,因為在這兩種情況下,每個骰子的結果都與另一個骰子無關,無論它們是否同時擲出。另一種計算相同答案的方法是考慮第一個骰子可以是 1 或 3,但第二個骰子只能是 1 個數字——與第一個骰子相反,即如果第一個骰子是 1,則為 3,如果第一個骰子是 3,則為 1。這得出了:P(A=1 或 A=3) x P(相反) = 2/6 x 1/6 = 2/36 = 1/18。
7. 以下是可能的組合:1 + 6 = 2 + 5 = 3 + 4 = 7。獲得每個組合的機率為 1/18,如練習 6 中所示。有 3 種這樣的組合,因此機率為 3 × 1/18 = 1/6。
8. 由於 C 是第一個擲出的骰子,它可以是任何值,P(C) = 1。給定第一個擲出的某個值,P(A) = 1/6。C 和 A 值相同的機率為 1 * 1/6 = 1/6。
9. (C 等於 A) 的機率為 1/6。因此,(C 不等於 A) 的機率為 5/6。其中一半的案例將是 (C 大於 A)。因此,(C 大於 A) 的機率為 5/12。
10. 這三個集合是重疊的,因此,例如,要獲得某人屬於所有三個集合的機率,您需要相乘(假設它們是獨立的),而不是相加。P(F 且 V 且 M) = .5 x .3 x .3 = 0.045。必須記住,踢足球、玩電子遊戲、學習數學或做人、做男性、住在亞美尼亞等都是可能的事件/狀態。儘管這些事件/狀態的可能性和獨立性可能存在爭議,但任何奇怪組合的機率必須小於 1 的事實必須成立。
隨機變數
一個 *隨機實驗*,例如 *擲骰子* 或 *拋硬幣*,是一個產生一些不確定結果的過程。我們還需要隨機實驗能夠輕鬆地重複。在本節中,我們將開始使用大寫字母來表示隨機實驗的結果。例如,令 *D* 為擲骰子的結果。*D* 可以取值 1、2、3、4、5 或 6,但它是不確定的。我們說 *D* 是一個 *離散隨機變數*。現在假設我擲了一個骰子,它出現了 5。我們說 *D* 的 *觀察值* 是 5。
隨機變數是某個隨機實驗的結果。它通常用大寫字母表示,但它的觀察值則不用。例如,令
表示 *n* 次擲骰子的結果,那麼我們通常使用
來表示每個 Di 的觀察值。
從這裡開始,隨機變數可以縮寫為“rv”(在其他機率文字中常用的縮寫)。
伯努利實驗
(本節可選,假設您瞭解二項式展開。)
拋硬幣是伯努利實驗的一種更簡單、更具體的形式。如果我們拋一枚硬幣,我們預計會以相同機率得到正面或反面。伯努利實驗比這更靈活,因為兩個可能的結果不必具有相同的機率。
在伯努利實驗中,您將得到
- *成功*,用 1 表示,機率為 *p*(其中 *p* 是 0 和 1 之間的數字)
或
- *失敗*,用 0 表示,機率為 1 - *p*。
如果隨機變數B是伯努利實驗的結果,並且B成功結果的機率是p,我們說B來自一個成功機率為p的伯努利分佈(其中 表示隨機變數X具有機率分佈 D)。
例如,如果
那麼
- P(C = 1) = 0.65
並且
- P(C = 0) = 1 - 0.65 = 0.35
二項分佈
如果我們重複n次伯努利實驗並統計成功次數,我們就得到了一個二項分佈。例如
對於 i = 1, 2, ... , n。也就是說,存在n個變數 C1, C2, ... , Cn,它們都來自同一個伯努利分佈。我們考慮
,那麼B是統計n次試驗(實驗)中成功次數的隨機變數。這樣的變數被稱為二項變數,我們寫成
示例 1
阿迪亞、莎拉和約翰能力相當。他們在考試中獲得 100 分的機率遵循一個伯努利分佈,成功機率為 0.9。請問
- i) 他們中只有一個獲得 100 分的機率是多少?
- ii) 他們中兩個人獲得 100 分的機率是多少?
- iii) 三個人都獲得 100 分的機率是多少?
- iv) 沒有人獲得 100 分的機率是多少?
解答
我們正在處理一個二項變數,我們將它稱為B。並且
i) 阿迪亞(以及莎拉和約翰)獲得 100 分的機率為 0.9 或 90%。我們可以寫成
... 其中 S 代表他們中任何一個人的分數。他們中任何一個人獲得 100 分(成功)而另外兩個人獲得低於 100 分(失敗)的機率為
但是,獲得 100 分的候選人有 3 個,所以
ii) 我們要計算
機率為
但是,獲得 100 分的候選人組合有[1] 種,所以
iii) 計算
iv) "沒有人獲得100分"的機率是獲得0次成功,所以
上面的例子強烈暗示了二項分佈與二項式展開之間的聯絡。以下關於二項分佈的結果沒有給出證明;鼓勵讀者檢查其正確性。
如果
那麼
這是 (p + q)n 的二項式展開的第 k 項,其中 q = 1 - p。
事件
在前面的章節中,我們稍微濫用了“事件”這個詞。事件應該被認為是某個隨機變數的可能結果的集合(集合),因此我們可以為它分配一個機率。
讓我們先介紹一些符號。令 A 和 B 為兩個事件,我們定義
為 A 和 B 事件。事件 A 和 B 的機率計算如下
我們也定義
為 A 或 B 事件。正如在上面的練習 10 中看到的那樣,
通常情況下。事實上,
始終成立。
讓我們看一些例子。令 A 為擲骰子時獲得小於或等於 4 的數字的事件,令 B 為獲得奇數的事件。現在
- P(A) = 2/3
並且
- P(B) = 1/2
但 A 或 B 的機率不等於機率之和
因為 7/6 大於 1。
不難看出,擲出 1 或 3 的事件包含在 A 和 B 中。所以如果我們簡單地新增 P(A) 和 P(B),則某些事件的機率被添加了兩次。
下面的 維恩圖 應該可以更好地說明情況,
將藍色正方形視為 B 的機率,將黃色正方形視為 A 的機率。這兩個機率重疊,重疊的空間是 A 和 B 的機率。所以 A 或 B 的機率應該是
上面的公式是 容斥原理 的簡單方法。
如果對於事件 A 和 B,我們有
我們說 A 和 B 是 不相交 的。這意味著這兩個 集合 沒有共同的結果(元素)。如果兩個事件是不相交的,則下面的 維恩圖 代表它們
維恩圖
傳統上,維恩圖 用於以圖形方式說明集合。集合僅僅是事物的集合——例如,{1, 2, 3} 是一個包含 1、2 和 3 的集合。維恩圖通常是圓形的。通常很難為超過 3 個相交集合繪製維恩圖。例如,以下是一個顯示四個相交集合的維恩圖
期望
隨機變數的期望可以粗略地認為是某個可重複隨機實驗結果的長期平均值,其中 長期平均值 意味著我們多次執行基礎實驗並對結果進行平均。例如,令 D 如上;D 的觀察值(1、2 ... 或 6)發生的可能性相同。因此,如果您要擲骰子很多次,您會期望每個數字出現的大致次數相同。因此,期望值為
我們將D的期望記為E(D),所以
我們現在應該正確地定義期望。
考慮一個隨機變數R,假設它可以取的值為r1, r2, r3, ... , rn。我們定義期望為
思考一下:考慮到期望是結果的長期平均值,你能解釋為什麼E(R)是如此定義的嗎?
例子 1 在一個公平的拋硬幣遊戲中,用1表示丟擲正面,用0表示丟擲反面。同一個硬幣被拋了8次。令C為一個表示8次拋擲中正面數量的隨機變數。C的期望是什麼,即計算E(C)?
答:E(C)=∑[r x P(C=r)],其中0<=r<=8
所以期望值為4
面積作為機率
均勻分佈...
順序統計
估計U[0, x]中的x。...
均勻分佈的加法
新增U[0,1]並介紹CLT。
...CLT - 中心極限定理:在任何樣本分佈集中,隨著所取樣本數量的增加,樣本分佈的總體平均分佈將趨近於正態分佈.
CLT在統計推斷中很重要,在統計推斷中,從整個總體中抽取小樣本,以對整個總體得出結論。
反饋
你怎麼看? 太簡單還是太難?資訊太多還是不夠?我們如何改進?請在討論標籤中留下評論讓我們知道。更好的是,自己編輯它,讓它變得更好。

