跳轉至內容

統計/摘要/平均數/平均值

來自華夏公益教科書,開放的書本,面向開放的世界

統計


  1. 介紹
    1. 什麼是統計?
    2. 現代統計學中的學科
    3. 為什麼要學習統計學? 0% developed
    4. 學習統計學需要了解什麼?
  2. 不同型別的資料
    1. 原始資料和二手資料
    2. 定量資料和定性資料
  3. 資料收集方法
    1. 實驗
    2. 抽樣調查
    3. 觀察性研究
  4. 資料分析
    1. 資料清理
    2. 移動平均線
  5. 彙總統計
    1. 集中趨勢的度量
      1. 平均值、中位數和眾數
      2. 幾何平均數
      3. 調和平均數
      4. 算術平均數、幾何平均數和調和平均數之間的關係
      5. 幾何中位數
    2. 離散程度的度量
      1. 資料的範圍
      2. 方差和標準差
      3. 四分位數和四分位距
      4. 分位數
  6. 資料展示
    1. 條形圖
    2. 比較條形圖
    3. 直方圖
    4. 散點圖
    5. 箱線圖
    6. 餅圖
    7. 比較餅圖
    8. 象形圖
    9. 折線圖
    10. 頻率多邊形
  7. 機率
    1. 組合數學
    2. 伯努利試驗
    3. 貝葉斯分析入門
  8. 分佈
    1. 離散分佈
      1. 均勻分佈
      2. 伯努利分佈
      3. 二項分佈
      4. 泊松分佈
      5. 幾何分佈
      6. 負二項分佈
      7. 超幾何分佈
    2. 連續分佈
      1. 均勻分佈
      2. 指數分佈
      3. 伽馬分佈
      4. 正態分佈
      5. 卡方分佈
      6. 學生t分佈
      7. F分佈
      8. 貝塔分佈
      9. 威布林分佈
  9. 檢驗統計假設
    1. 統計檢驗的目的
    2. 使用的形式主義
    3. 不同型別的檢驗
    4. 單樣本z檢驗
    5. 雙樣本z檢驗
    6. 單樣本t檢驗
    7. 雙樣本t檢驗
    8. 配對樣本t檢驗用於比較平均值
    9. 單因素方差分析F檢驗
    10. 單樣本比例z檢驗
    11. 雙樣本比例z檢驗
    12. 檢驗比例A是否大於比例B在Microsoft Excel中的方法
    13. 斯皮爾曼等級相關係數
    14. 皮爾遜積差相關係數
    15. 卡方檢驗
      1. 卡方檢驗用於多個比例
      2. 卡方檢驗用於列聯表
    16. 分佈的近似值
  10. 點估計100% developed  as of 12:07, 28 March 2007 (UTC) (12:07, 28 March 2007 (UTC))
    1. 無偏性
    2. 優良性度量
    3. UMVUE
    4. 完備性
    5. 充分性和最小充分性
    6. 輔助性
  11. 練習題
    1. 彙總統計問題
    2. 資料展示問題
    3. 分佈問題
    4. 資料檢驗問題
  12. 數值方法
    1. 基礎線性代數和格拉姆-施密特正交化
    2. 無約束最佳化
    3. 分位數迴歸
    4. 統計軟體的數值比較
    5. Excel中的數值計算
    6. 統計/數值方法/隨機數生成
  13. 時間序列分析
  14. 多元資料分析
    1. 主成分分析
    2. 度量資料的因子分析
    3. 有序資料的因子分析
    4. 典型相關分析
    5. 判別分析
  15. 特定資料集的分析
    1. 結核病分析
  16. 附錄
    1. 作者
    2. 詞彙表
    3. 索引
    4. 連結

編輯此框

平均值、中位數和眾數

[編輯 | 編輯原始碼]

平均值

[編輯 | 編輯原始碼]

平均值,或更確切地說算術平均數,只是一組數字(或**資料集**)的算術平均值,用橫線符號 表示。因此,變數 的平均值為 ,讀作“x-bar”。它是透過將資料集中所有值加起來,然後除以資料集中值的個數來計算的:例如,取以下資料集:{1,2,3,4,5}。該資料集的平均值為

這裡有一個更復雜的資料集:{10,14,86,2,68,99,1}。平均值的計算方法如下

中位數

[edit | edit source]

中位數是資料集中的“中間值”。也就是說,中位數是有序資料集的中心數字。

例如,讓我們看看上面第二個資料集中的資料:{10,14,86,2,68,99,1}。它的中位數是多少?

  • 首先,我們將資料集按順序排序:{1,2,10,14,68,85,99}
  • 接下來,我們確定資料集中的總點數(在本例中為 7)。
  • 最後,我們確定資料集的中心位置(在本例中為第 4 個位置),中心位置的數字就是我們的中位數 - {1,2,10,14,68,85,99},因此 14 是我們的中位數。
有用提示!
確定任何有序集的中心位置或位置的簡單方法是將總點數加 1,然後除以 2。如果得到的結果是一個整數,那麼這就是中心位置。如果得到的結果是一個分數,則取兩邊的兩個整數。

因為我們的資料集有奇數個點,所以確定中心位置很容易 - 它在它之前的點數與它之後的點數相同。但如果我們的資料集有偶數個點呢?

讓我們使用相同的資料集,但向其中新增一個新數字:{1,2,10,14,68,85,99,100} 這個集合的中位數是多少?

當你有偶數個點時,你必須確定資料集的兩個中心位置。(請參閱側邊框以獲取說明。)因此,對於一組 8 個數字,我們得到 (8 + 1) / 2 = 9 / 2 = 4 1/2,它兩側有 4 和 5。

檢視我們的資料集,我們發現第 4 個和第 5 個數字是 14 和 68。從那裡,我們回到我們信賴的朋友平均值來確定中位數。(14 + 68)/ 2 = 82 / 2 = 41。找到 2, 4, 6, 8 的中位數 => 首先我們必須計算數字以確定它的奇偶性,因為我們看到它是偶數,所以我們可以寫:M=(4+6)/2=10/2=5 5 是上面順序數字的中位數。

眾數

[edit | edit source]

眾數是資料集中最常見或“最頻繁”的值。例如:以下資料集的眾數 (1, 2, 5, 5, 6, 3) 是 5,因為它出現兩次。這是資料集中最常見的值。具有一個眾數的資料集被稱為單峰,具有兩個眾數的資料集被稱為雙峰,具有兩個以上眾數的資料集被稱為多峰。單峰資料集的一個例子是 {1, 2, 3, 4, 4, 4, 5, 6, 7, 8, 8, 9}。該資料集的眾數為 4。雙峰資料集的一個例子是 {1, 2, 2, 3, 3}。這是因為 2 和 3 都是眾數。注意:如果資料集中所有點出現的頻率都相等,那麼將資料集描述為具有多個眾數或沒有眾數是同樣準確的。

中程數

[edit | edit source]

中程數是資料集中的最小值和最大值之間嚴格的算術平均值。

平均值、中位數和眾數之間的關係

[edit | edit source]

平均值、中位數和眾數彼此之間的關係可以提供有關資料分佈的相對形狀的一些資訊。如果平均值、中位數和眾數彼此大致相等,則可以假設分佈大致對稱。如果平均值 > 中位數 > 眾數,則分佈將右偏。如果平均值 < 中位數 < 眾數,則分佈將左偏。

問題

[edit | edit source]

1. 有一個老笑話這樣說:“以中位數尺寸為參考,在划艇裡放四個乒乓球和兩隻藍鯨是完全可能的。”解釋為什麼這個說法是正確的。

<< 平均數 | 統計學 | 幾何平均數 >>

華夏公益教科書