跳轉到內容

社會統計學:導論

來自華夏公益教科書,開放的書籍,開放的世界

社會統計學是將統計學方法應用於社會科學資料。社會統計學使用與任何其他形式的統計分析相同的數學工具,但它以不同的方式使用這些工具,這些方式考慮了社會科學資料的獨特特徵。社會科學中使用的大多數資料都是觀察性的,而不是實驗性的,這意味著社會科學家必須使用統計方法來控制對感興趣關係的外部影響,因為實驗控制不可用。社會科學資料的觀察性質也使得在大多數情況下難以執行正式的假設檢驗,因為假設幾乎總是以對用於檢驗它們的資料的先驗知識為條件。這些以及其他挑戰使社會統計學的實踐不同於物理生物學心理學科學中統計學的實踐。

本書介紹並解釋了社會科學中傳統統計技術的應用。本書沒有遵循社會統計學教科書中使用的標準方法,而是將重點放在社會科學中實際使用的統計概念和技術上。因此,例如,非常常用的線性迴歸模型在早期就被介紹,而數學上更簡單但不太常用的均值和標準差則在之後作為迴歸的邏輯推論而被介紹。整本書都採用概念性方法。對數學的使用降至最低。本書中使用的所有技術的數學定義都可以在網際網路上輕鬆找到,包括維基百科。

本書的第 1-4 章闡述了幾乎所有當代社會統計學的基礎模型:線性迴歸模型。線性迴歸模型將因變數 (Y) 表示為自變數 (X) 的線性函式加上誤差。線性迴歸在社會科學中尤其重要,因為社會科學文獻中使用的幾乎所有高階模型都是簡單線性迴歸模型的擴充套件。即使是像均值和標準差這樣的單變數描述性統計也可以理解為源於沒有自變數的線性迴歸的特例退化情況。雖然對於沒有矩陣代數知識的學生來說,迴歸在數學上很難解釋,但它在圖形上很容易解釋。因此,本書採用圖形方法來理解線性迴歸,並透過擴充套件,理解單變數統計。

本書的第 5-8 章將具有單個自變數的簡單線性迴歸模型擴充套件為具有多個自變數的多元線性迴歸模型。多元線性迴歸被引入作為一種方法,用於在社會科學環境中包含統計控制,在這些環境中,不可能實施實驗控制。因此,多元迴歸與統計模型中的推斷問題相關聯:希望推斷關於正在分析的資料之外的世界的一些事情。統計推斷的關鍵工具是 t 統計量,為此專門設立了一章。t 統計量用於確定給定迴歸係數的統計顯著性。在多元迴歸框架中,t 統計量也可以用來比較不同自變數的相對顯著性。另一個用於這些比較的工具,標準化迴歸係數,也有一章專門介紹。

本書的第 9-11 章重點關注可以使用相同的基本多元線性迴歸工具估算的不同模型配置。這些章節將第 1-8 章中介紹的統計量應用於特定且非常常用的迴歸模型型別,包括ANOVA 和互動模型。本書的未來章節可能會介紹其他模型型別。

第 1 章

華夏公益教科書