最近一次SAT考試的結果如何?尚比亞21歲以下女性的平均身高是多少?工程學院的大學生與文理學院的大學生在啤酒消費方面有什麼區別?
為了回答這些問題,我們將收集資料並將其整理成易於彙總、視覺化和討論的形式。簡單地說,資料的收集和聚合導致了分佈。分佈通常以直方圖或表格的形式出現。這樣,我們就可以立即“看到”資料並開始我們的科學探究。
例如,如果我們想了解更多關於學生最近SAT考試成績的資訊,我們將從ETS收集SAT分數,以對我們有意義的方式對其進行整理,然後形成這些分數的分佈。結果可能是資料表,也可能是圖表。無論如何,一旦我們“看到”了資料,我們就可以開始提出更多關於我們資料的有趣研究問題。
我們建立的分佈通常與數學生成的分佈平行。例如,如果我們獲得所有高中生的身高並繪製這些資料,圖形可能類似於正態分佈,正態分佈是透過數學生成的。那麼,我們可以簡單地使用正態分佈來近似所有高中生的身高,而無需費力地收集所有高中生的身高,並且不會犧牲太多精度。
在統計學研究中,我們為了簡化和與現實世界的相關性而關注數學分佈。理解這些分佈將使我們能夠更容易地視覺化資料並更快地建立模型。然而,它們不能也不應該取代手動資料收集和生成實際資料分佈的工作。
多少百分比位於某個範圍內?分佈顯示了多少百分比的資料位於某個範圍內。因此,給定一個分佈和一組值,我們可以確定資料落在某個範圍內的機率。
如果將相同的資料疊加到不同的分佈上,可能會得出不同的結論。因此,在所有統計分析中,將資料放到正確的分佈上至關重要。
分佈
- 機率分佈
- 離散分佈
- 均勻分佈
- 伯努利分佈
- 二項分佈
- 泊松分佈
- 幾何分佈
- 負二項分佈
- 超幾何分佈
- 連續分佈
- 均勻分佈
- 指數分佈
- 伽瑪分佈
- 正態分佈
- 卡方分佈
- 學生t分佈
- F分佈
- 貝塔分佈
- 威布林分佈
- 耿貝爾分佈
一些分佈
| 名稱 |
符號 |
公式 |
符號 |
用途 |
連續/離散 |
備註 |
| 伯努利 |
f(x)= |
 |
p x |
2個結果 |
離散 |
1次試驗 |
| 二項式 |
b(x;n, p)= |
 |
n次試驗 k次成功 p機率 |
成功的次數 特定機率 非隨機 |
離散 |
| 泊松 |
P(x)= |
 |

 |
結果/時間 結果/區域 |
離散 |
| 超幾何 |
h(x;N,n,k) = |
 |
從n個樣本 N個專案 N個專案中的k個是成功, N-k個是失敗 |
成功發生X次 與位置無關 是隨機的 |
離散 |
無放回 |
多元 超幾何 |
 |
 |
樣本量 N個專案 k 個單元格  每個單元格包含 個元素 |
|
離散 |
無放回 |
| 正態分佈 |
 |
 |
x 平均值 標準差 |
: |
連續分佈 |
Z 是一個隨機變數,具有
|
| 卡方分佈 |
 |
 |
是從具有方差 的正態總體中抽取的樣本量的方差 |
隨機樣本的方差與總體的關係 |
連續分佈 |
| 學生t分佈 |
T= |
 |
隨機樣本大小為 n 的平均值 |
如果不知道  |
連續分佈 |
v=n-1 |
| F |
F= |
 |
連續分佈 |