跳轉到內容

統計/分佈

來自華夏公益教科書,開放的書籍,開放的世界
(重定向自 統計:分佈)

最近一次SAT考試的結果如何?尚比亞21歲以下女性的平均身高是多少?工程學院的大學生與文理學院的大學生在啤酒消費方面有什麼區別?

為了回答這些問題,我們將收集資料並將其整理成易於彙總、視覺化和討論的形式。簡單地說,資料的收集和聚合導致了分佈。分佈通常以直方圖或表格的形式出現。這樣,我們就可以立即“看到”資料並開始我們的科學探究。

例如,如果我們想了解更多關於學生最近SAT考試成績的資訊,我們將從ETS收集SAT分數,以對我們有意義的方式對其進行整理,然後形成這些分數的分佈。結果可能是資料表,也可能是圖表。無論如何,一旦我們“看到”了資料,我們就可以開始提出更多關於我們資料的有趣研究問題。

我們建立的分佈通常與數學生成的分佈平行。例如,如果我們獲得所有高中生的身高並繪製這些資料,圖形可能類似於正態分佈,正態分佈是透過數學生成的。那麼,我們可以簡單地使用正態分佈來近似所有高中生的身高,而無需費力地收集所有高中生的身高,並且不會犧牲太多精度。

在統計學研究中,我們為了簡化和與現實世界的相關性而關注數學分佈。理解這些分佈將使我們能夠更容易地視覺化資料並更快地建立模型。然而,它們不能也不應該取代手動資料收集和生成實際資料分佈的工作。

多少百分比位於某個範圍內?分佈顯示了多少百分比的資料位於某個範圍內。因此,給定一個分佈和一組值,我們可以確定資料落在某個範圍內的機率。

如果將相同的資料疊加到不同的分佈上,可能會得出不同的結論。因此,在所有統計分析中,將資料放到正確的分佈上至關重要。

分佈

  1. 機率分佈
  2. 離散分佈
    1. 均勻分佈
    2. 伯努利分佈
    3. 二項分佈
    4. 泊松分佈
    5. 幾何分佈
    6. 負二項分佈
    7. 超幾何分佈
  3. 連續分佈
    1. 均勻分佈
    2. 指數分佈
    3. 伽瑪分佈
    4. 正態分佈
    5. 卡方分佈
    6. 學生t分佈
    7. F分佈
    8. 貝塔分佈
    9. 威布林分佈
    10. 耿貝爾分佈

一些分佈的比較

[編輯 | 編輯原始碼]
一些分佈
名稱 符號 公式 符號 用途 連續/離散 備註
伯努利 f(x)= p
x
2個結果 離散 1次試驗
二項式 b(x;n, p)= n次試驗
k次成功
p機率
成功的次數
特定機率
非隨機
離散
泊松 P(x)=
結果/時間
結果/區域
離散
超幾何 h(x;N,n,k) = 從n個樣本
N個專案
N個專案中的k個是成功,
N-k個是失敗
成功發生X次
與位置無關
是隨機的
離散 無放回
多元
超幾何
樣本量
N個專案
k 個單元格
每個單元格包含 個元素
離散 無放回
正態分佈 x
平均值
標準差
: 連續分佈 Z 是一個隨機變數,具有
卡方分佈 是從具有方差 的正態總體中抽取的樣本量的方差 隨機樣本的方差與總體的關係 連續分佈
學生t分佈 T= 隨機樣本大小為 n 的平均值 如果不知道 連續分佈 v=n-1
F F= 連續分佈
華夏公益教科書