跳轉到內容

統計/摘要/平均數/平均值

來自華夏公益教科書,開放世界開放書籍

統計學


  1. 介紹
    1. 什麼是統計學?
    2. 現代統計學中的學科
    3. 為什麼要學習統計學? 0% developed
    4. 學習統計學需要知道什麼?
  2. 不同型別的資料
    1. 原始資料和次級資料
    2. 定量資料和定性資料
  3. 資料收集方法
    1. 實驗
    2. 抽樣調查
    3. 觀察性研究
  4. 資料分析
    1. 資料清理
    2. 移動平均
  5. 彙總統計
    1. 集中趨勢的度量
      1. 平均數、中位數和眾數
      2. 幾何平均數
      3. 調和平均數
      4. 算術、幾何和調和平均數之間的關係
      5. 幾何中位數
    2. 離散程度的度量
      1. 資料的範圍
      2. 方差和標準差
      3. 四分位數和四分位數間距
      4. 分位數
  6. 資料顯示
    1. 條形圖
    2. 比較條形圖
    3. 直方圖
    4. 散點圖
    5. 箱線圖
    6. 餅圖
    7. 比較餅圖
    8. 象形圖
    9. 折線圖
    10. 頻數多邊形
  7. 機率
    1. 組合學
    2. 伯努利試驗
    3. 貝葉斯分析入門
  8. 分佈
    1. 離散分佈
      1. 均勻分佈
      2. 伯努利分佈
      3. 二項分佈
      4. 泊松分佈
      5. 幾何分佈
      6. 負二項分佈
      7. 超幾何分佈
    2. 連續分佈
      1. 均勻分佈
      2. 指數分佈
      3. 伽馬分佈
      4. 正態分佈
      5. 卡方分佈
      6. 學生t分佈
      7. F分佈
      8. 貝塔分佈
      9. 威布林分佈
  9. 檢驗統計假設
    1. 統計檢驗的目的
    2. 使用的形式主義
    3. 不同型別的檢驗
    4. 單個均值的z檢驗
    5. 兩個均值的z檢驗
    6. 單個均值的t檢驗
    7. 兩個均值的t檢驗
    8. 配對t檢驗比較均值
    9. 單因素方差分析F檢驗
    10. 單個比例的z檢驗
    11. 兩個比例的z檢驗
    12. 在Microsoft Excel中檢驗比例A是否大於比例B
    13. 斯皮爾曼等級相關係數
    14. 皮爾遜積矩相關係數
    15. 卡方檢驗
      1. 多個比例的卡方檢驗
      2. 列聯表的卡方檢驗
    16. 分佈的近似
  10. 點估計100% developed  as of 12:07, 28 March 2007 (UTC) (12:07, 28 March 2007 (UTC))
    1. 無偏性
    2. 優良性的度量
    3. UMVUE
    4. 完備性
    5. 充分性和最小充分性
    6. 輔助性
  11. 練習題
    1. 彙總統計問題
    2. 資料顯示問題
    3. 分佈問題
    4. 資料檢驗問題
  12. 數值方法
    1. 基礎線性代數和Gram-Schmidt正交化
    2. 無約束最佳化
    3. 分位數迴歸
    4. 統計軟體的數值比較
    5. Excel中的數值計算
    6. 統計/數值方法/隨機數生成
  13. 時間序列分析
  14. 多元資料分析
    1. 主成分分析
    2. 度量資料的因子分析
    3. 序數資料的因子分析
    4. 典型相關分析
    5. 判別分析
  15. 特定資料集的分析
    1. 結核病分析
  16. 附錄
    1. 作者
    2. 術語表
    3. 索引
    4. 連結

編輯此框

平均數、中位數和眾數

[編輯 | 編輯原始碼]

平均數

[編輯 | 編輯原始碼]

平均數,或更準確地說是算術平均數,僅僅是一組數字(或**資料集**)的算術平均值,用橫線符號 表示。因此變數 的平均數是 ,讀作“x-bar”。它可以透過將資料集中的所有值加起來,然後除以資料集中的值的數量來計算:.例如,考慮以下資料集:{1,2,3,4,5}。此資料的平均數將是

這是一個更復雜的資料集:{10,14,86,2,68,99,1}。平均數將按如下方式計算

中位數

[edit | edit source]

中位數是資料集中的“中間值”。也就是說,中位數是按順序排列的資料集的中心位置上的數字。

例如,讓我們看看上面第二個資料集中的資料:{10,14,86,2,68,99,1}。它的中位數是多少?

  • 首先,我們將資料集按順序排列:{1,2,10,14,68,85,99}
  • 接下來,我們確定資料集中的點數總數(在本例中為 7)。
  • 最後,我們確定資料集的中心位置(在本例中為第 4 個位置),中心位置上的數字就是我們的中位數 - {1,2,10,14,68,85,99},因此 14 是我們的中位數。
有用提示!
確定任何有序集合的中心位置或位置的簡單方法是將點數總數加 1,然後除以 2。如果得到的結果是整數,那麼這就是中心位置。如果得到的結果是小數,則取兩邊的兩個整數。

因為我們的資料集有奇數個點,所以確定中心位置很容易 - 它之前和之後會有相同數量的點。但是如果我們的資料集有偶數個點呢?

讓我們取相同的資料集,但新增一個新數字:{1,2,10,14,68,85,99,100} 這個集合的中位數是多少?

當您有偶數個點時,您必須確定資料集的兩個中心位置。(有關說明,請參見側邊框。)因此對於一個包含 8 個數字的集合,我們得到 (8 + 1) / 2 = 9 / 2 = 4 1/2,其兩邊有 4 和 5。

檢視我們的資料集,我們看到第 4 個和第 5 個數字是 14 和 68。然後,我們回到我們信賴的朋友平均數來確定中位數。(14 + 68)/ 2 = 82 / 2 = 41。求 2、4、6、8 的中位數 => 首先我們要統計數字以確定其奇偶性,我們發現它是偶數,所以我們可以寫:M=(4+6)/2=10/2=5 5 是上面順序數字的中位數。

眾數

[edit | edit source]

眾數是資料集中最常見或“最頻繁”的值。例如:以下資料集 (1, 2, 5, 5, 6, 3) 的眾數是 5,因為它出現兩次。這是資料集中最常見的值。具有一個眾數的資料集被稱為單峰,具有兩個眾數的資料集被稱為雙峰,具有兩個以上眾數的資料集被稱為多峰。單峰資料集的例子是 {1, 2, 3, 4, 4, 4, 5, 6, 7, 8, 8, 9}。這個資料集的眾數是 4。雙峰資料集的例子是 {1, 2, 2, 3, 3}。這是因為 2 和 3 都是眾數。注意:如果資料集中所有點都以相同的頻率出現,那麼將資料集描述為具有多個眾數或沒有眾數都是一樣的準確。

中程數

[edit | edit source]

中程數是資料集中的最小值和最大值之間的算術平均數。

平均數、中位數和眾數的關係

[edit | edit source]

平均數、中位數和眾數之間的關係可以提供有關資料分佈相對形狀的一些資訊。如果平均數、中位數和眾數近似相等,則可以假設分佈近似對稱。如果平均數 > 中位數 > 眾數,則分佈將向右偏斜。如果平均數 < 中位數 < 眾數,則分佈將向左偏斜。

問題

[edit | edit source]

1. 有一個老笑話說道:“以中位數大小作為參考,完全可以在一隻划艇中依次容納四個乒乓球和兩隻藍鯨。”解釋為什麼這句話是正確的。

<< 平均數 | 統計學 | 幾何平均數 >>

華夏公益教科書