最近的 SAT 考試結果如何?尚比亞 21 歲以下女性的平均身高是多少?工程學院的大學生與文科學院的大學生的啤酒消費量如何比較?
為了回答這些問題,我們會收集資料並將其整理成易於總結、視覺化和討論的形式。從寬泛的角度來看,資料的收集和聚合會形成一個分佈。分佈通常以直方圖或表格的形式出現。這樣,我們就可以立即“看到”資料並開始我們的科學探究。
例如,如果我們想更多地瞭解學生在 SAT 上的最新表現,我們會從 ETS 收集 SAT 成績,以適合我們的方式進行整理,然後形成這些成績的分佈。結果可能是一個數據表格,也可能是一個圖。無論如何,一旦我們“看到”資料,我們就可以開始提出更多關於資料的有趣研究問題。
我們建立的分佈通常與數學生成的分佈平行。例如,如果我們獲得所有高中生的身高並將這些資料繪製成圖,該圖可能類似於正態分佈,正態分佈是透過數學生成的。然後,我們可以簡單地使用正態分佈來近似所有高中生的身高,而無需費力地收集所有高中生的身高,並且不會損失太多精度。
在統計學研究中,我們關注數學分佈,為了簡單起見,也為了與現實世界相關。理解這些分佈將使我們能夠更輕鬆地視覺化資料並更快地構建模型。但是,它們不能也不能取代手動資料收集和生成實際資料分佈的工作。
某個範圍內的百分比是多少?分佈顯示了資料在某個範圍內的百分比。因此,給定一個分佈和一組值,我們可以確定資料落在某個範圍內的機率。
如果將相同的資料放在不同的分佈上,可能會得出不同的結論。因此,在所有統計分析中,將資料放在正確的分佈上至關重要。
分佈
- 機率分佈
- 離散分佈
- 均勻分佈
- 伯努利分佈
- 二項分佈
- 泊松分佈
- 幾何分佈
- 負二項分佈
- 超幾何分佈
- 連續分佈
- 均勻分佈
- 指數分佈
- 伽馬分佈
- 正態分佈
- 卡方分佈
- 學生 t 分佈
- F 分佈
- 貝塔分佈
- 威布林分佈
- Gumbel 分佈
一些分佈
| 名稱 |
符號 |
公式 |
符號 |
用途 |
連續/離散 |
筆記 |
| 伯努利 |
f(x)= |
 |
p x |
2 個結果 |
離散 |
1 次試驗 |
| 二項式 |
b(x;n, p)= |
 |
n 次試驗 k 次成功 p 機率 |
成功次數 特定機率 非隨機 |
離散 |
| 泊松 |
P(x)= |
 |

 |
結果/時間 結果/區域 |
離散 |
| 超幾何 |
h(x;N,n,k) = |
 |
n 個樣本來自 N 個專案 N 個專案中的 k 個是成功, N-k 個是失敗 |
成功發生 X 次 與位置無關 是隨機的 |
離散 |
不放回抽樣 |
多元 超幾何 |
 |
 |
樣本量 N 個專案 k 個單元格  每個單元格包含 個元素 |
|
離散 |
不放回抽樣 |
| 正態分佈 |
 |
 |
x 平均值 標準差 |
: |
連續型 |
Z 是一個隨機變數,具有
|
| 卡方分佈 |
 |
 |
是從具有方差為 的正態總體中抽取的樣本量的方差 |
隨機樣本的方差與總體的關係 |
連續型 |
| 學生 t 分佈 |
T = |
 |
是大小為 n 的隨機樣本的平均值 |
如果不知道  |
連續型 |
v=n-1 |
| F |
F= |
 |
連續型 |