跳轉到內容

IB 數學 SL/統計與機率

來自華夏公益教科書,開放世界開放書籍

組合事件

[編輯 | 編輯原始碼]

同時發生時,即為組合事件。請注意,當 A 或 B 發生時,A 和 B 也同時發生。這意味著

它還意味著 A 發生,**或** B 發生,**或** A 和 B 都發生。

互斥事件

[編輯 | 編輯原始碼]
檔案:Venn diagram2.gif
維恩圖中的互斥事件

當兩個事件被稱為互斥事件時,這兩個事件不能同時發生。例如,一次拋硬幣的結果不可能是正面和反面。在維恩圖中,互斥事件不相互交叉,沒有重疊區域。換句話說: 。因此

.

因為這兩個事件的交集等於 0。

窮舉事件

[編輯 | 編輯原始碼]

當集合 A 和集合 B 包含**所有可能的事件**時,稱為窮舉事件,無論在集合 A 或集合 B 中。這意味著 ,其中 *U* 是所有事件的集合,或者換句話說

.

對於窮舉事件,A 的補集和 A 加起來等於 1

.

條件機率

[編輯 | 編輯原始碼]

條件機率是指在第二個事件一定會發生的情況下,第一個事件發生的機率。請注意,對於互斥事件,條件機率總是等於零。

條件機率可以透過首先找到兩個事件都發生的機率來計算。(對於獨立事件,這只是指 P(A)*P(B)。)然後將結果除以給定事件的機率。

獨立性

[編輯 | 編輯原始碼]

如果兩個事件滿足以下條件,則稱這兩個事件相互獨立。

也就是說

統計學

[編輯 | 編輯原始碼]

資料的圖表表示

[編輯 | 編輯原始碼]

眾數、中位數和平均數

[編輯 | 編輯原始碼]

眾數 - 資料集中出現頻率最高的數值。

例如:給定數字集:1,3,4,4,5,7,8,10,13,13,13

數字 13 出現頻率最高,因此眾數為 13

中位數 - 資料集中間位置的數值。要找到中位數,請按順序排列數字,並確定中間位置的數字。

例如:給定數字集:1,3,4,4,5,7,8,10,13,13,13

數字 7 位於資料集中間位置,因此中位數為 7

要了解中位數位於哪個位置

1/2(n+1)=

n 表示資料點的數量;結果是中位數的索引。然後檢視該位置的數字,即中位數。如果資料點的數量為偶數,則中位數位於兩個最“中心”數字之間。例如,在一個包含八個數字的集合中,如果第四個和第五個數字為 6、7,則中位數位於 6 和 7 之間。

平均數 - 資料集的平均值。要找到平均數,將資料集中所有數字加在一起,然後將此總和除以集合中的數字數量。

例如:給定數字集:1,3,4,4,5,7,8,10,13,13,13 <-- 資料集中有 11 個數字將所有數字加在一起:1+3+4+4+5+7+8+10+13+13+13= 79 將總和 (79) 除以資料集中數字的數量 (11) = 79/11 = 7.18

因此,資料集的平均數,即平均數,為 7.18

離散度量

[編輯 | 編輯原始碼]

離散度量,也稱為離散度量,衡量資料的分散程度。它們分為兩種型別:不受異常值影響的引數和受異常值影響的引數。

不受異常值影響:標準差,標準差將衡量統計資料中落入某個範圍或標準差內的百分比。據說 68% 的所有資料都落在平均數的一個標準差範圍內。

                      interquartile range,


受異常值影響:範圍,例如,在公司薪資中,最高管理人員的年薪可能高達 400,000 美元,而工廠工人的年薪僅為 10,000 美元,因此,薪資範圍為 390,000 美元。

短語“不受異常值影響”表示該引數忽略了資料集的極端值和異常值。

累積頻率

[編輯 | 編輯原始碼]

直方圖

[編輯 | 編輯原始碼]

在統計學中,直方圖是以條形圖形式顯示的表格頻率的圖形顯示。它顯示了有多少案例落入多個類別中的每一個:它是一種資料分箱形式。類別通常指定為某個變數的非重疊區間。類別(條形)必須相鄰。區間(或帶、或箱)通常大小相同。

直方圖用於繪製資料密度,通常用於密度估計:估計基礎變數的機率密度函式。用於機率密度的直方圖的總面積始終歸一化為 1。如果 x 軸上的區間長度都為 1,則直方圖與相對頻率圖相同。

直方圖的替代方法是核密度估計,它使用核來平滑樣本。這將構造一個平滑的機率密度函式,它通常能更準確地反映基礎變數。

直方圖是七個基本質量控制工具之一,其他工具包括帕累託圖、檢驗單、控制圖、因果圖、流程圖和散點圖。

隨機變數

[編輯 | 編輯原始碼]

期望值

[編輯 | 編輯原始碼]

隨機變數 x 發生的期望值由以下公式給出

其中 是事件 發生的機率。例如,拋硬幣兩次時出現正面次數的期望值為

出現一次正面的機率為 1/2,因為有兩個結果包含一個正面(HT 和 TH)。當一個遊戲被稱為公平時,這意味著期望值為 0。E(X)= 0

二項分佈

[編輯 | 編輯原始碼]

一個分佈是二項分佈當且僅當它符合以下四個引數:1)結果是獨立的 2)只有兩種結果,成功或失敗 3)成功的機率是恆定的 4)試驗次數是固定的。例如,有一個裝有 10 個彈珠的袋子,其中 5 個是紅色的,3 個是藍色的,2 個是綠色的。如果從袋中抽取 5 個彈珠(有放回),那麼抽到正好 2 個紅色彈珠的機率是多少?這是二項分佈,因為結果是獨立的,要麼是紅色要麼不是紅色,成功的機率是 0.5,試驗次數是 5。為了解決二項分佈問題,可以使用以下公式:nCk(p)k(1-p)n-k,其中 n 是試驗次數,k 是成功的次數,p 是成功的機率。對於之前的問題,公式為:5C2(.5)2(1-.5)5-2,結果為 10*.25*.125 = .3125,這意味著抽到正好 2 個紅色的機率是 31.25%。

正態分佈

[編輯 | 編輯原始碼]

正態分佈是一個連續分佈,由兩個引數定義:均值 和標準差 。由於正態曲線的對稱性,均值等於眾數和中位數。

標準正態分佈

[編輯 | 編輯原始碼]
標準正態分佈曲線示例

標準正態分佈的均值為 0,標準差為 1。曲線下的面積(機率)為 1。


為了找到正態曲線下的面積,學生可以使用 TI 計算器中的 normalcdf() 函式。語法為

normalcdf (下限,上限,均值,標準差)

其他正態分佈的機率

[編輯 | 編輯原始碼]

機率質量函式

[編輯 | 編輯原始碼]

一般來說,如果隨機變數 K 遵循引數為 np 的二項分佈,我們寫成 K ~ B(np)。在 n 次試驗中獲得正好 k 次成功的機率由 機率質量函式 給出

對於 k = 0, 1, 2, ..., n 以及

二項式係數(因此得名)"n 選擇 k",也記作 C(nk),  nCknCk。公式可以理解如下:我們想要 k 次成功(pk)和 n − k 次失敗 (1 − p)n − k。但是,k 次成功可以在 n 次試驗中的任何位置發生,並且在 n 次試驗中分配 k 次成功的不同方式有 C(nk) 種。

在建立二項分佈機率的參考表時,通常將表填充到 n/2 的值。這是因為對於 k > n/2,機率可以透過其補集計算,如下所示

因此,必須檢視不同的 k 和不同的 p(二項分佈一般來說是不對稱的)。但是,它的行為不是任意的。總是存在一個整數 m 滿足

作為 k 的函式,表示式 ƒ(knp) 在 k < m 時單調遞增,在 k > m 時單調遞減,只有一個例外,即 (n + 1)p 是整數。在這種情況下,對於 m = (n + 1)pm − 1 有兩個最大值。m 被稱為伯努利試驗中最可能的(最有可能的)結果。請注意,它發生的機率可能很小。

華夏公益教科書