跳轉到內容

統計學/簡介/什麼是統計學

來自華夏公益教科書,開放的書籍,面向開放的世界

統計學


  1. 簡介
    1. 什麼是統計學?
    2. 現代統計學中的主題
    3. 為什麼我應該學習統計學? 0% developed
    4. 學習統計學需要哪些知識?
  2. 不同型別的資料
    1. 原始資料和二手資料
    2. 定量資料和定性資料
  3. 資料收集方法
    1. 實驗
    2. 抽樣調查
    3. 觀察研究
  4. 資料分析
    1. 資料清洗
    2. 移動平均
  5. 彙總統計量
    1. 集中趨勢的度量
      1. 平均數、中位數和眾數
      2. 幾何平均數
      3. 調和平均數
      4. 算術平均數、幾何平均數和調和平均數之間的關係
      5. 幾何中位數
    2. 離散程度的度量
      1. 資料的範圍
      2. 方差和標準差
      3. 四分位數和四分位數範圍
      4. 分位數
  6. 顯示資料
    1. 條形圖
    2. 比較條形圖
    3. 直方圖
    4. 散點圖
    5. 箱線圖
    6. 餅圖
    7. 比較餅圖
    8. 象形圖
    9. 折線圖
    10. 頻率多邊形
  7. 機率
    1. 組合數學
    2. 伯努利試驗
    3. 貝葉斯分析入門
  8. 分佈
    1. 離散分佈
      1. 均勻分佈
      2. 伯努利分佈
      3. 二項分佈
      4. 泊松分佈
      5. 幾何分佈
      6. 負二項分佈
      7. 超幾何分佈
    2. 連續分佈
      1. 均勻分佈
      2. 指數分佈
      3. 伽瑪分佈
      4. 正態分佈
      5. 卡方分佈
      6. 學生 t 分佈
      7. F 分佈
      8. 貝塔分佈
      9. 威布林分佈
  9. 檢驗統計假設
    1. 統計檢驗的目的
    2. 使用的形式
    3. 不同型別的檢驗
    4. 單個均值的 z 檢驗
    5. 兩個均值的 z 檢驗
    6. 單個均值的 t 檢驗
    7. 兩個均值的 t 檢驗
    8. 比較均值的配對 t 檢驗
    9. 單因素方差分析 F 檢驗
    10. 單個比例的 z 檢驗
    11. 兩個比例的 z 檢驗
    12. 在 Microsoft Excel 中檢驗比例 A 是否大於比例 B
    13. 斯皮爾曼等級相關係數
    14. 皮爾遜積矩相關係數
    15. 卡方檢驗
      1. 多個比例的卡方檢驗
      2. 列聯表的卡方檢驗
    16. 分佈的近似
  10. 點估計100% developed  as of 12:07, 28 March 2007 (UTC) (12:07, 28 March 2007 (UTC))
    1. 無偏性
    2. 優良性的度量
    3. UMVUE
    4. 完備性
    5. 充分性和最小充分性
    6. 輔助性
  11. 練習題
    1. 彙總統計量問題
    2. 資料顯示問題
    3. 分佈問題
    4. 資料檢驗問題
  12. 數值方法
    1. 基本線性代數和 Gram-Schmidt 正交化
    2. 無約束最佳化
    3. 分位數迴歸
    4. 統計軟體的數值比較
    5. Excel 中的數值
    6. 統計學/數值方法/隨機數生成
  13. 時間序列分析
  14. 多元資料分析
    1. 主成分分析
    2. 度量資料的因子分析
    3. 序數資料的因子分析
    4. 典型相關分析
    5. 判別分析
  15. 特定資料集的分析
    1. 結核病分析
  16. 附錄
    1. 作者
    2. 詞彙表
    3. 索引
    4. 連結

編輯此框

您的公司已經開發了一種可能治癒關節炎的新藥。您將如何進行測試以確認該藥物的有效性?

最新的銷售資料剛剛釋出,您的老闆希望您為管理層準備一份關於公司可以改進業務的方面的報告。您應該尋找什麼?您應該尋找什麼?

你和一個朋友在看棒球比賽,他突然提出和你打賭,說兩支球隊在比賽中都不會打出本壘打。你應該接受這個賭局嗎?

您想進行一項民意調查,詢問您的學校是否應該使用資金建造一個新的運動綜合體還是一個新的圖書館。您需要調查多少人?如何確保您的民意調查沒有偏見?如何解讀您的結果?

您工廠中的一臺小部件製造機,通常每生產 100 個小部件就會損壞 4 個,最近開始每生產 100 個小部件就會損壞 5 個。什麼時候需要購買新的製造機? (還有,什麼是小部件?)

這些只是眾多需要使用統計學的現實世界例子中的一部分。您將如何處理這些問題陳述?有一些人類的逐步演算法,但是否存在一個通用的問題陳述?

  • “尋找可能的解決方案,決定一個解決方案,計劃解決方案,實施解決方案,從結果中學習以供未來解決方案(或重新解決方案)。"
  • “SOAP - 主觀 - 給定的問題,客觀 - 經過檢查後的問題,評估 - 定義更好的問題,計劃 - 決定是否存在管理指南,併為這種情況制定解決方案藍圖,或生成一種風險最小化的全新解決方案路徑”。
  • “HAMRC - 假設,目標,方法,結果,結論” - 認為沒有真正差異的假設是零假設。

然後還有一個笑話比較了不同的思維方式

“一位物理學家、一位化學家和一位統計學家正在合作解決一個問題,這時廢紙簍自燃了(他們都發誓他們已經戒菸了)。化學家說,'快,我們必須減少反應物氧氣的濃度,透過增加非反應性氣體(如二氧化碳和一氧化碳)的相對濃度。在火焰上放一個防火毯。'物理學家插話道,'不,不,我們必須減少用於啟用燃燒的熱量;拿一些水來澆滅火焰。'與此同時,統計學家正到處點火。其他人驚慌地問道,'你在做什麼?'。'試圖獲得足夠的樣本量'。”

一般定義

[edit | edit source]

簡而言之,統計學是對資料的研究。它包括描述性統計(研究收集資料的方法和工具,以及用於描述和解釋資料的數學模型)和推斷性統計(用於進行基於機率的決策和準確預測的系統和技術)。

詞源

[edit | edit source]

顧名思義,統計學起源於“事物狀態”的概念。這個詞本身來自古拉丁語“statisticum collegium”,意思是“關於國家事務的講座”。最終,它演變成義大利語“statista”,意思是“政治家”,以及德語“Statistik”,意思是“涉及國家的資料收集”。逐漸地,這個詞開始用於描述任何型別資料的收集。

統計學作為數學的一個子集

[edit | edit source]

正如人們所期望的那樣,統計學很大程度上以數學為基礎,統計學的研究促成了數學中的許多重要概念:機率、分佈、樣本和總體、鐘形曲線、估計和資料分析。

未來

[edit | edit source]

接下來,我們將學習現代統計學中的主題以及統計學的一些實際應用。我們還將介紹一些開始學習統計學所需的數學背景知識。

華夏公益教科書