跳轉至內容

統計/分佈

來自華夏公益教科書

最近的 SAT 考試結果如何?尚比亞 21 歲以下女性的平均身高是多少?工程學院的大學生與文科學院的大學生的啤酒消費量如何比較?

為了回答這些問題,我們會收集資料並將其整理成易於總結、視覺化和討論的形式。從寬泛的角度來看,資料的收集和聚合會形成一個分佈。分佈通常以直方圖或表格的形式出現。這樣,我們就可以立即“看到”資料並開始我們的科學探究。

例如,如果我們想更多地瞭解學生在 SAT 上的最新表現,我們會從 ETS 收集 SAT 成績,以適合我們的方式進行整理,然後形成這些成績的分佈。結果可能是一個數據表格,也可能是一個圖。無論如何,一旦我們“看到”資料,我們就可以開始提出更多關於資料的有趣研究問題。

我們建立的分佈通常與數學生成的分佈平行。例如,如果我們獲得所有高中生的身高並將這些資料繪製成圖,該圖可能類似於正態分佈,正態分佈是透過數學生成的。然後,我們可以簡單地使用正態分佈來近似所有高中生的身高,而無需費力地收集所有高中生的身高,並且不會損失太多精度。

在統計學研究中,我們關注數學分佈,為了簡單起見,也為了與現實世界相關。理解這些分佈將使我們能夠更輕鬆地視覺化資料並更快地構建模型。但是,它們不能也不能取代手動資料收集和生成實際資料分佈的工作。

某個範圍內的百分比是多少?分佈顯示了資料在某個範圍內的百分比。因此,給定一個分佈和一組值,我們可以確定資料落在某個範圍內的機率。

如果將相同的資料放在不同的分佈上,可能會得出不同的結論。因此,在所有統計分析中,將資料放在正確的分佈上至關重要。

分佈

  1. 機率分佈
  2. 離散分佈
    1. 均勻分佈
    2. 伯努利分佈
    3. 二項分佈
    4. 泊松分佈
    5. 幾何分佈
    6. 負二項分佈
    7. 超幾何分佈
  3. 連續分佈
    1. 均勻分佈
    2. 指數分佈
    3. 伽馬分佈
    4. 正態分佈
    5. 卡方分佈
    6. 學生 t 分佈
    7. F 分佈
    8. 貝塔分佈
    9. 威布林分佈
    10. Gumbel 分佈

一些分佈的比較

[編輯 | 編輯原始碼]
一些分佈
名稱 符號 公式 符號 用途 連續/離散 筆記
伯努利 f(x)= p
x
2 個結果 離散 1 次試驗
二項式 b(x;n, p)= n 次試驗
k 次成功
p 機率
成功次數
特定機率
非隨機
離散
泊松 P(x)=
結果/時間
結果/區域
離散
超幾何 h(x;N,n,k) = n 個樣本來自
N 個專案
N 個專案中的 k 個是成功,
N-k 個是失敗
成功發生 X 次
與位置無關
是隨機的
離散 不放回抽樣
多元
超幾何
樣本量
N 個專案
k 個單元格
每個單元格包含 個元素
離散 不放回抽樣
正態分佈 x
平均值
標準差
: 連續型 Z 是一個隨機變數,具有
卡方分佈 是從具有方差為 的正態總體中抽取的樣本量的方差 隨機樣本的方差與總體的關係 連續型
學生 t 分佈 T = 是大小為 n 的隨機樣本的平均值 如果不知道 連續型 v=n-1
F F= 連續型
華夏公益教科書