統計學/機率

機率與一些不可預測性有關。我們知道可能出現哪些結果,但不能確定具體是哪一個。所有可能結果的集合起著基本作用。我們稱之為樣本空間,並用S表示。S的元素稱為結果。擲骰子的樣本空間為S = {1,2,3,4,5,6}。我們不僅談論結果,還談論事件,結果的集合(或樣本空間的子集)。例如,擲骰子時,我們可以詢問結果是否為偶數,這意味著詢問“偶數”事件= E = {2,4,6}。在結果數量有限的簡單情況下,我們為每個結果s (∈ S) 指定其機率(出現機率)p(s)(用小寫p表示),它是一個介於0和1之間的數。這是一個非常簡單的函式,稱為機率函式,其唯一其他屬性是所有機率的總和為1。我們也討論事件A的機率P(A)(用大寫P表示),它只是A中所有結果的機率之和。對於一個公平的骰子,p(s) = 1/6,對於每個結果s,P(“偶數”) = P(E) = 1/6+1/6+1/6 = 1/2。
非有限樣本空間的機率的一般概念稍微複雜一些,儘管它建立在相同的想法之上。
數學中很少有真正自包含的東西。許多數學分支相互接觸和相互作用,機率和統計領域也不例外。對機率的基本理解對於理解基本統計學至關重要,而機率在沒有統計學來確定“現實世界”機率的情況下在很大程度上是抽象的。
本節並非旨在對機率進行全面講授,而是簡單地觸及本課程所需的機率基礎,涵蓋貝葉斯分析的基礎知識,以供那些尋求更有趣內容的學生使用。這些知識對於嘗試理解各種分佈的數學原理將非常寶貴,這些分佈將在後面介紹。
集合是一組物件。我們通常用大寫字母表示集合,例如,A是這個房間裡所有女性的集合。
- 集合A的成員稱為A的元素,例如,帕特里夏是A的一個元素(帕特里夏∈ A);帕特里克不是A的一個元素(帕特里克∉ A)。
- 全集U是所考慮的所有物件的集合,例如,U是這個房間裡所有人的集合。
- 空集或空集∅沒有任何元素,例如,這個房間裡身高超過2.8米的男性集合是一個空集。
- 集合A的補集Ac是U中不在A中的所有元素的集合,即,x ∈ Ac 當且僅當 x ∉ A。
- 設A和B為2個集合。如果A的每個元素也是B的元素,則A是B的子集。寫成A ⊂ B,例如,這個房間裡戴金屬框眼鏡的女性集合 ⊂ 戴眼鏡的女性集合 ⊂ 這個房間裡的女性集合。
• 兩個集合A和B的交集A ∩ B是共同元素的集合。即,x ∈ A ∩ B 當且僅當 x ∈ A 且 x ∈ B。
• 兩個集合A和B的並集A ∪ B是A或B中所有元素的集合。即,x ∈ A ∪ B 當且僅當 x ∈ A 或 x ∈ B。
韋恩圖以視覺方式對定義的事件進行建模。每個事件用一個圓圈表示。具有共同結果的事件將重疊,被稱為事件的交集。

否定是一種表達“非A”的方式,因此表示A的補集已經發生。注意:事件A的補集可以表示為A'或Ac
例如:“六面骰子不落在1上的機率是多少?”(六分之五,或p = 0.833)

或者,更口語化地說,“‘非X’的機率加上‘X’的機率等於1或100%。”
相對頻率描述了成功次數與總結果次數之比。例如,如果拋硬幣50次,其中29次正面朝上,那麼相對頻率是
兩個事件的並集是指你想知道事件A或事件B。
這與“和”不同。“和”是交集,而“或”是事件的並集(兩個事件合在一起)。

在上面的事件示例中,你會注意到...
事件A是星星和鑽石。
事件B是三角形、五邊形和星星。
(A ∩ B) = (A 和 B) = A 與 B 的交集,只有星星
但 (A ∪ B) = (A 或 B) = A 與 B 的並集,是所有東西。三角形、五邊形、星星和鑽石
注意,事件A和事件B都有星星作為共同點。但是,當你列出事件的並集時,你只列出星星一次!
事件A = 星星,鑽石 事件B = 三角形,五邊形,星星
當你將它們組合在一起時,你得到(星星+鑽石)+(三角形+五邊形+星星),但是等等!星星被列出了兩次,所以需要從列表中減去多餘的星星。
你應該注意到,是交集被列出了兩次,所以你必須減去重複的交集。
事件並集的公式:P(A ∪ B) = P(A) + P(B) - P(A ∩ B)
示例
設 P(A) = 0.3,P(B) = 0.2,P(A ∩ B) = 0.15。求 P(A ∪ B)。
P(A ∪ B) = (0.3) + (0.2) - (0.15) = 0.35
示例
設 P(A) = 0.3,P(B) = 0.2,P(A ∩ B) = 0。求 P(A ∪ B)。
注意:由於事件的交集為空集,那麼你便知道事件是分離的或互斥的。
P(A ∪ B) = (0.3) + (0.2) - (0) = 0.5
全機率定理[1] 是一個定理,在離散情況下,它表明如果 {\displaystyle \left\{{B_{n}:n=1,2,3,\ldots }\right\}}\left\{{B_{n}:n=1,2,3,\ldots }\right\} 是樣本空間的一個有限或可數無限劃分(換句話說,一組兩兩不相交的事件,它們的並集是整個樣本空間),並且每個事件 {\displaystyle B_{n}}B_{n} 是可測的,那麼對於同一個機率空間的任意事件 {\displaystyle A}A
{\displaystyle P(A)=\sum _{n}P(A\cap B_{n})}{\displaystyle P(A)=\sum _{n}P(A\cap B_{n})} 或者,另一種說法是[1]
{\displaystyle P(A)=\sum _{n}P(A\mid B_{n})P(B_{n}),}{\displaystyle P(A)=\sum _{n}P(A\mid B_{n})P(B_{n}),} 其中,對於任何 {\displaystyle n}n,如果 {\displaystyle P(B_{n})=0}{\displaystyle P(B_{n})=0},這些項將被簡單地從求和中省略,因為 {\displaystyle P(A\mid B_{n})}{\displaystyle P(A\mid B_{n})} 是有限的。
給定另一個事件發生的情況下,一個事件的機率是多少?例如,給定老鼠找到了迷宮的房間,那麼它找到迷宮盡頭的機率是多少?
這用以下方式表示
或“給定B的情況下,A的機率”。
如果A和B彼此獨立,例如拋硬幣或生育孩子,那麼
因此,“給定上一個孩子是男孩,那麼下一個孩子是男孩的機率是多少?”
這也可疊加,其中A的機率有幾個“給定”。
或“給定B1、B2和B3為真,那麼A的機率是多少?”
-->