跳轉到內容

社會統計學/第 6 章

來自華夏公益教科書

使用 t 統計量的統計推斷

[編輯 | 編輯原始碼]

過去 50 年來,社會發生的重大變化之一是女性經濟權利的擴充套件。越來越多的女性在家庭之外工作,而且女效能夠從事比以往更多的工作。女性仍然面臨著許多挑戰,包括工作場所的歧視,但高薪工作不再僅僅是為男性保留。機會正變得更加平等。不久前,許多職業對女性是封閉的。美國全國青年縱向調查 (NLSY) 的原始調查樣本中的女性出生於 1957 年至 1964 年。這些女性在 1980 年代初期開始職業生涯,當時大多數職業對女性開放,但嚴重的工資歧視仍然存在。在許多情況下,這些女性也被期望將育兒責任放在職業發展之前。如今,隨著這些女性臨近退休,幾十年來她們所面臨的歧視可能意味著她們的收入仍然低於她們的知識和經驗應得的水平。她們一生都遭受著挑戰,這些挑戰為未來的女性打開了機會。這些女性的女兒主要出生於 1980 年代。她們在 2000 年代進入勞動力市場。這些女性所面臨的工資歧視遠低於她們的母親。因此,我們可能會假設原始 NLSY 女性的女兒將比她們的母親賺取更高的工資。圖 6-1 說明了一個比較 NLSY 女兒工資和她們母親工資的資料庫。女兒的工資取自 2008 年 NLSY,與 2007 年日曆年獲得的工資有關。僅包含在此期間約 23-30 歲的女兒。母親的工資取自 1988 年 NLSY,與 1987 年日曆年有關,當時她們也是 23-30 歲。母親的工資已按通貨膨脹進行調整。僅包含報告有工資收入的女兒和母親(沒有收入或收入缺失者被排除在外)。圖 6-1 顯示了資料庫的前 30 行,但完整的資料庫總共包含 642 對母女。資料庫包括 7 列。前兩個是元資料項:女兒和母親的案例識別號。資料庫中包含的五個變數是:B.YEAR -- 女兒的出生年份 D.WAGE -- 女兒在 2007 年的工資收入 M.WAGE -- 母親在 1987 年的工資收入 M.ADJ -- 母親的工資收入按通貨膨脹調整到 2007 年美元 DIFF -- 每個女兒的工資收入與其母親的工資收入之間的差額,或女兒比母親多賺多少錢

圖 6-1. 女兒在 2007 年的工資和她們母親在 1987 年的工資,針對每個時間段 24-31 歲的美國人(NLSY 資料)

圖 6-2 報告了女兒的工資和她們母親的工資(按通貨膨脹調整)的描述性統計資料。女兒的工資的觀察均值(23,881 美元)遠高於她們母親的工資的觀察均值(17,181 美元)。這表明女性就業機會確實發生了代際變化。

圖 6-2. 女兒的工資與其母親的工資的比較(NLSY 資料)

推斷性統計資料可用於對代際母女工資差異進行高置信度的結論。觀察到的母女工資差異的平均值為 6700 美元。該平均工資差異的標準誤差僅為 792 美元。這意味著工資的真實平均差異在 5900 美元到 7500 美元左右。它可能落在該範圍之外,但鑑於觀察到的平均值和標準誤差,工資差異的真實平均值可能為 0 的可能性極低。我們可以自信地得出結論,受僱的 NLSY 女兒比她們的母親 20 年前賺的錢更多。乍一看,這是一個令人驚訝的結果。工資差異的標準差非常大。觀察到的平均工資差異為 6700 美元,但標準差幾乎是其三倍:20,071 美元。工資差異的巨大誤差有很多原因。首先,收入是出了名的難以衡量。人們通常不瞭解自己的收入細節,甚至更常撒謊。其次,資料中可能存在抽樣誤差,因為只有 642 對母女被用來代表美國女性人口。第三,也是最重要的,人們的收入差異很大。教育水平、職業選擇、能力、個性和個人聯絡的差異都會在收入中產生特定於案例的誤差。儘管存在所有這些誤差,我們仍然可以對工資差異的平均值的大小如此自信的原因是,平均差異是根據大量的案例(N = 642)計算的。使用大量樣本降低了平均值的標準誤差。實際上,所有這些誤差來源往往相互抵消。結果是,觀察到的平均值可能非常接近真實平均值。有多接近?標準誤差是對真實平均值可能值的有效指導,但我們真正需要的是一種方法來確定真實平均值不同值的確切機率。在迴歸模型中,我們想知道斜率不同值的實際機率。為了判斷統計模型結果的重要性或顯著性,我們需要有關真實均值和斜率分佈的更詳細的資訊。

本章展示瞭如何對統計模型引數的真實值的可能範圍做出正式推斷。首先,可以將觀察到的引數及其標準誤差結合起來計算出一個稱為“t”統計量的新度量(第 6.1 節)。t 統計量是衡量觀察到的引數相對於其標準誤差的大小。其次,t 統計量可用於確定真實均值是否與零顯著不同(第 6.2 節)。這在配對樣本(如女兒和她們的母親)的研究中尤其重要。第三,t 統計量也可以應用於迴歸斜率(第 6.3 節)。迴歸斜率的 t 統計量可用於推斷迴歸模型與簡單平均模型相比是否增加了任何解釋力。可選部分(第 6.4 節)展示瞭如何使用 t 統計量對真實均值如何與特定目標水平不同的進行推斷。最後,本章以大量美國縣的貧困與犯罪關係的應用案例研究結束(第 6.5 節)。本案例研究說明了如何使用 t 統計量對均值和迴歸斜率進行推斷。本章的所有關鍵概念都將在此案例研究中使用。在本節結束時,您應該能夠對統計模型引數的統計和實質性意義做出正式推斷。

6.1. t 統計量 標準誤差非常類似於標準差。每個變數都有均值和標準差。標準差是有意義的,因為在大多數情況下,變數的值落在其均值方向上的一個標準差內。在幾乎所有情況下,變數的值落在其均值方向上的兩個標準差內。任何落線上程方向上兩個標準差以外的案例都是異常情況,並且可能是異常值。另一方面,諸如均值、斜率和截距之類的引數具有標準誤差。大多數情況下,模型的真實引數落在觀察到的引數的一個標準誤差內。真實引數幾乎總是落在觀察到的引數的兩個標準誤差內。然而,標準誤差還有一個非常重要的屬性。從數學上證明,真實引數以可以從引數的標準誤差計算出的確切機率與觀察到的引數不同。標準差和標準誤差之間的主要區別在於,標準差描述了一組資料點(如變數),而標準誤差描述了一個觀察到的引數(如均值、斜率或截距)。標準誤差表示觀察到的引數中的誤差量。標準差用於計算標準誤差,但標準誤差遠小於標準差。圖 6-3 總結了標準差和標準誤差之間的主要區別以及它們的使用方法。

圖 6-3. 標準差和標準誤差之間的差異

在推論統計中,標準誤差用於推斷引數的真實值。例如,我們經常想知道真實均值的值。我們知道變數的觀測均值,並且我們知道變數的真實均值可能接近它們的觀測均值,但我們永遠無法確定真實均值到底是什麼。變數觀測均值的標準誤差有助於我們推斷其真實均值的可能值。在圖 6-2 中,從社會政策的角度來看,瞭解女兒與母親工資差異的真實均值是否為零非常重要。如果真實均值為零,則意味著女性在打擊工作場所歧視方面沒有任何進展。工資的觀測均值差異為 6700 美元,標準誤差為 792 美元。換句話說,觀測均值距 0 有 8.46 個標準誤差。如果你從 6700 美元開始減去一個標準誤差,你會得到 5908 美元。如果你再減去一個標準誤差,你會得到 5116 美元。如果你再減去一個標準誤差,你會得到 4324 美元。你必須減去 8.46 個標準誤差才能達到 0 美元。如果工資的真實均值差異確實為 0 美元,那麼觀測均值將偏離 8.46 個標準誤差。統計學家將觀測引數與其標準誤差的比率稱為“t”統計量。t 統計量是基於觀測引數的度量,用於對真實引數的機率進行具體推斷。“t”這個標籤實際上並沒有代表任何東西。由於歷史上的偶然,第一個在 1908 年計算 t 統計量的人使用“s”來表示標準差,而“t”恰好是字母表的下一個字母。t 統計量是衡量引數相對於其標準誤差的大小。引數的 t 統計量可以透過將引數除以其標準誤差來輕鬆計算,但通常沒有必要自己進行計算。統計軟體程式通常會在引數及其標準誤差旁邊報告 t 統計量。t 統計量測量引數的大小。當觀測引數的 t 統計量很大時,我們可以推斷真實引數與 0 有顯著差異。例如,t 統計量為 10 意味著引數是其標準誤差的 10 倍,因此距離 0 有 10 個標準誤差。這是一個顯著且重要的差異。統計顯著性是指統計結果如此之大,以至於不太可能僅僅是偶然發生的。觀測引數的 t 統計量大於 2 通常與 0 具有統計學上的顯著差異。在 NLSY 女性工資示例(圖 6-2)中,觀測均值女兒與母親工資差異的 t 統計量為 8.46。這遠大於 2。我們可以推斷女兒與母親工資差異的真實均值與 0 美元有非常顯著的差異。統計計算機程式可以準確地告訴我們這個結果的統計顯著性有多大。統計軟體可以用來計算找到任意大小的 t 統計量的精確機率。該機率基於模型中的自由度數。例如,圖 6-2 中女兒與母親工資差距的平均模型基於 642 個案例。由於平均模型使用 1 個引數,因此模型具有 642 - 1 = 641 個自由度。計算機程式可以告訴我們,當觀測均值的 t 統計量為 8.46,自由度為 641 時,真實均值可能是 0 美元或類似值的機率為 0.000000000000018%。換句話說,真實均值肯定不為 0 美元。從技術上講,t 統計量的機率告訴我們的是“真實均值可能在觀測均值 6700 美元的兩側 8.46 個或更多標準誤差內的機率為 0.000000000000018%”。因此,從技術上講,這個機率是真實均值可能為 0 美元、小於 0 美元、13400 美元或大於 13400 美元的機率。一些學科(如心理學)的做法是將這些機率分解成不同的“檢驗”,並進行“單尾”和“雙尾”分析。在社會科學中,通常的做法要簡單得多。t 統計量的機率被簡單地認為是引數與 0 有顯著差異的機率。圖 6-4 給出了 t 統計量必須有多大才能被認為具有統計學意義的某種程度上的概念。圖 6-4 報告了與自由度為 641 的 t 統計量相關的機率(如女兒與母親工資示例)。實際觀測到的 t 統計量 8.46 超出了圖表範圍。社會科學家通常認為,如果 t 統計量與 5% 或更低的機率相關聯,則該統計量具有統計學意義。因此,當觀測均值如此之大(相對於其標準誤差),以至於真實均值可能為 0 的機率小於 5% 時,我們宣佈真實均值與 0 具有統計學上的顯著差異。

圖 6-4. 自由度為 641 的 t 統計量被發現的機率

對於自由度為 641 的平均模型,任何大於約 1.96 的 t 統計量都表明真實均值與 0 有顯著差異。與其他統計量一樣,通常沒有必要計算這些內容。統計軟體程式可以提供所有必要的資訊。例如,報告加拿大省份吸菸率與溫度迴歸結果的統計軟體輸出(圖 4-9)通常看起來像圖 6-5 中的表格。雖然能夠理解標準誤差和 t 統計量很有幫助,但你實際上只需要從表格中獲取機率。在加拿大省級吸菸率的示例中,溫度對吸菸的影響的截距 (37.041) 和斜率 (-.443) 都是統計學上顯著的。

圖 6-5. 報告 2008 年 13 個加拿大省和地區的吸菸率與平均氣溫迴歸的軟體輸出(根據圖 4-9)

6.2. 使用平均模型進行推斷在平均模型中,t 統計量用於對真實均值的水平進行推斷,但我們通常對真實均值並不太感興趣。通常觀測均值就足夠了。例如,NLSY 樣本中女兒和母親工資的觀測均值(圖 6-2)分別為 23881 美元(女兒)和 17181 美元(母親)。女兒工資的 t 統計量為 36.1,母親工資的 t 統計量為 33.2(自由度均為 641)。非常大的 t 統計量告訴我們女兒和母親工資的真實均值與 0 美元有顯著差異。這是正確的,但並不十分有趣。當然,她們的真實工資與 0 美元不同。如果她們的僱主付給她們 0 美元,她們為什麼要工作呢?只有當有某種理由證明真實均值不可能為 0 時,t 統計量在平均模型中才真正有用。這種情況通常發生在比較成對的關聯案例時,例如比較女兒的收入與母親的收入時。配對樣本是每個案例代表兩個關聯觀測的資料庫。對於配對樣本,我們通常想知道的是變數的真實均值是否已從一個時間段到另一個時間段發生了顯著變化。我們知道觀測均值發生了變化。如果我們在 1988 年對 642 名女性進行了調查,然後在 20 年後的 2008 年對她們的女兒進行了調查,那麼這兩個均值幾乎不可能完全相同。僅僅是偶然,其中一個就會更高。我們想知道的是,20 年後的均值是否顯著更高。對於配對樣本資料,平均模型通常用於對真實均值隨時間的變化進行推斷。與女兒和母親的收入一樣,通常有重要的社會政策原因需要了解是否發生了變化。例如,許多人認為,今天的學校之所以受到影響,是因為它們在兒童和家庭的社會支援服務方面花費了太多時間和金錢,而在教育方面花費太少。今天社會上普遍存在一種印象,即學校現在將有限的資源更多地用於學生服務,而不是直接的課堂教學。學校真的已經從關注教育轉向關注社會工作了嗎?這是一個基於配對樣本資料的平均模型的理想問題。圖 6-6 包含了 1988 年和 2008 年美國 50 個州以及哥倫比亞特區的學校支出資料。除了通常的元資料項外,還有六個變數:EXPENDxxxx——1988 年和 2008 年的學校總支出SUPPORTxxxx——1988 年和 2008 年的學生支援服務支出Sup%xxxx——1988 年和 2008 年學生支援佔總支出的比例學生支援服務支出包括學校護理、學校心理學、諮詢和社會工作服務的支出。1988 年的數字已根據通貨膨脹調整為 2008 年美元。請注意,所有支出都有所上升,部分原因是自 1988 年以來所有州的人口都增加了,部分原因是所有州對每個學生的教育支出都比 1988 年增加了。

圖 6-6. 美國州教育和學生支援支出資料庫,1998 年和 2008 年(NCES 資料)

圖 6-7 總結了學生支援支出佔教育總支出的百分比的描述性和推論統計資料。報告了 1988 年和 2008 年學生支援支出的描述性統計資料以及學生支援支出的變化。推論統計資料僅針對學生支援支出隨時間的變化進行報告。關於 1988 年和 2008 年學生支援支出水平的推論統計資料將毫無意義,因為這兩個變數的真實均值顯然遠大於 0%。

圖 6-7. 學生支援支出佔教育總支出的百分比變化的平均模型,1998 年至 2008 年(NCES 資料)

觀察到的學生支援支出平均變化為1.36%。實際上,觀察到的各州在學生支援服務方面的支出有所增加。這意味著各州真的比過去更加關注學生支援服務了嗎?還是這種增長更有可能僅僅是真實平均值為0%(表示沒有變化)的隨機波動?t統計量的機率可用於推斷隨時間推移的真實平均變化。學生支援支出變化的t統計量為2.21,自由度為50(有51個案例,因此自由度為51-1=50)。與該t統計量相關的機率為0.039,即3.9%。換句話說,在1988年至2008年間,學生支援支出的真實平均變化為0%的可能性僅為3.9%。由於真實平均值沒有變化的可能性小於5%,因此我們可以推斷,1988年至2008年間,學生支援支出的真實平均水平發生了變化。2008年,各州在學生支援服務方面的預算支出比例明顯高於1988年。自1988年以來,用於學生支援服務的教育支出的平均比例明顯增加。觀察到的平均增長率為1.36%,t統計量證實這種增長具有統計學意義。但這是否意味著它很重要?畢竟,學生支援支出的平均水平在二十年的時間裡僅從34.04%增長到35.40%。在23個州,實際上有所下降。這些似乎是相當微弱的結果,不足以作為社會政策的依據。這種增長具有統計學意義,但從政策角度來看,它似乎不足以構成意義。實質意義是指統計結果在研究人員和社會大眾看來足夠大,具有意義。自1988年以來,學生支援支出有所增加,具有統計學意義,但它可能不足以被認為具有實質意義。

6.3. 迴歸斜率的推斷 在迴歸模型中,t統計量用於推斷真實斜率。t統計量也可用於推斷迴歸截距,但實際上很少這樣做。雖然真實平均值的推斷僅在特殊情況下進行(如配對樣本),但真實斜率的推斷則經常進行。用t統計量處理迴歸斜率非常常見,以至於統計軟體程式通常在使用它們估計迴歸模型時預設輸出t統計量及其相關機率。在社會科學中寫出統計結果時,幾乎所有迴歸斜率都伴隨著一個記錄其統計顯著性的註釋。回到官方發展援助(ODA)支出佔國民收入比例的例子,20個富裕國家的ODA支出平均模型如圖6-8左側所示。20個富裕國家的ODA支出平均水平為0.52%(如圖表所示),但各國的偏差很大。瑞典(SWE)的援助金額幾乎是平均水平的兩倍(佔國民收入的1.01%),而美國(USA)的援助金額則遠低於平均水平的一半(佔國民收入的0.19%)。是什麼讓一些富裕國家在透過ODA援助幫助貧困國家方面比其他國家更加慷慨呢?

圖6-8. 2008年20個富裕國家ODA支出平均模型和迴歸(與收入對比)模型的比較(OECD資料來自圖4-1)

解釋平均模型中部分案例特定誤差的一種理論可能是,更富裕的國家有更多的錢可以花,因此更有能力變得更加慷慨。富裕國家在財富水平方面存在很大差異。最貧窮的富裕國家是紐西蘭(NZL),人均國民收入為27,940美元,而最富裕的國家是挪威(NOR),人均國民收入為87,070美元。該理論表明,挪威有能力比紐西蘭提供更多的援助,而且它確實做到了。從這兩個案例推廣,我們可以假設國家的ODA支出水平隨著國民收入水平的提高而上升。圖6-8右側顯示了ODA支出與國民收入水平之間的關係。該假設似乎是正確的:ODA支出中很大一部分的案例特定誤差可以歸因於國民收入的差異。從描述的角度來看,國民收入的差異解釋了ODA支出中“很大一部分”的案例特定誤差,但國民收入的影響是否具有統計學意義?圖6-9中的模型1報告了ODA支出對國民收入(以千美元計)的迴歸結果。此模型和圖6-9中報告的其他模型的資料均來自圖4-1所示的資料庫。國民收入的斜率為0.013,表明每增加1000美元的國民收入,ODA支出預計會增加0.13%。根據我們掌握的資料,國民收入真實斜率可能為0的機率非常小。我們可以推斷,國民收入的真實斜率幾乎肯定不為0。國民收入對ODA支出有高度顯著的影響。

圖6-9. 2008年20個富裕國家ODA支出對選定國家指標的迴歸結果(OECD資料來自圖4-1)

還有哪些因素可以解釋ODA支出水平中部分案例特定誤差?圖6-9中報告了另外兩個迴歸模型的結果。在模型2中,ODA支出迴歸到歐洲身份(如圖4-3所示)。觀察到的斜率為0.328。這代表了非歐洲國家和歐洲國家之間ODA支出平均水平的觀察差異。歐洲國家傾向於比非歐洲國家提供0.328%的ODA。與該斜率相關的t統計量的機率為0.013(即1.3%),表明歐洲身份真實斜率為0的可能性很小。基於真實斜率為0的機率很小,我們可以推斷真實斜率不為0。我們可以推斷,歐洲國家比非歐洲國家更加慷慨。模型3說明了一個不顯著的斜率。在模型3中,ODA支出迴歸到行政效率(行政成本佔官方發展援助總額的百分比)。我們可以假設,一個國家偏離ODA支出平均水平的案例特定偏差的一部分可能是由於行政成本高。如果行政成本高,ODA支出也會高,因為總支出水平等於一個國家在提供援助方面的真實“慷慨程度”加上其在管理援助預算方面的成本。觀察到的迴歸斜率為-.003,表明實際上並非如此。行政成本高實際上與較低的ODA支出相關聯,而不是更多。觀察到的行政成本影響很小,但絕對是負面的,而不是正面的。觀察到的行政成本對ODA支出的影響可能是負面的,但這種影響與0沒有顯著差異。行政成本斜率的t統計量的機率為0.927,表明真實斜率可能為0(或與觀察到的斜率的距離與0一樣遠)的可能性為92.7%。我們可以由此推斷,行政成本對ODA支出沒有顯著影響。關於不顯著斜率的另一種思考方式如圖6-10所示。圖6-10對比了ODA支出平均模型(左側)和基於行政成本的ODA支出迴歸模型(右側)。儘管迴歸線確實略微向下傾斜,但圖表右側的散點圖並沒有特別隨著直線移動。這與圖6-8右側的情況大不相同,在圖6-8右側,散點圖與直線追蹤得更加緊密。圖6-10說明了這樣一種情況,即ODA支出平均模型中只有一小部分案例特定誤差由迴歸模型解釋。當迴歸模型對因變數的案例特定誤差解釋很少時,斜率往往很小,而且沒有統計學意義。

圖6-10. 2008年20個富裕國家ODA支出平均模型和迴歸(與行政成本對比)模型的比較(OECD資料來自圖4-1)

6.4. 單樣本t統計量(可選/高階) 與引數相關的t統計量通常用於推斷真實引數是否與0顯著不同。預設情況下,這是所有統計軟體程式使用t統計量的方式。儘管如此,有時社會科學家希望對真實引數進行其他推斷。這需要一些額外的工作,但有可能使用t統計量來評估真實引數是否與任何數字(不僅僅是0)顯著不同。這在平均模型中最常進行。在迴歸模型中,我們幾乎總是想知道這條線是否真正傾斜,而其他則無關緊要。另一方面,在平均模型中,我們經常想知道真實平均值是否達到某個目標或閾值。這可以用ODA支出水平資料再次說明。圖4-1中列出的20個富裕國家ODA支出的觀察平均水平為0.52%。如第5章所述,這些國家商定了一個ODA支出目標水平,即佔國民收入的0.70%。第5章中使用的ODA支出標準誤用來論證真實平均ODA支出水平達到0.70%的目標“非常不可能”。究竟有多不可能?回答這個問題的一種方法是構建一個人工配對樣本資料庫。每個國家的實際ODA支出水平可以與0.70%的目標水平配對,並計算出差值。這在圖6-11中完成。實際ODA支出與目標ODA支出之間平均差值的t統計量為3.03,自由度為19。與該t統計量相關的機率僅為0.007(0.7%)。換句話說,國家真正達到ODA支出佔國民收入的0.7%的目標的可能性僅為0.7%(這兩個數字都是0.7只是巧合)。真實平均支出水平遠低於0.7%的目標。

圖6-11. 2008年20個富裕國家ODA支出與0.70%目標的比較的人工配對樣本(OECD資料來自圖4-1)

回答這個問題的另一種更直接的方法是將觀察到的平均值與 0.70% 進行比較。觀察到的官方發展援助支出平均水平為 0.518%。這比目標水平低 0.182%。該觀察到的平均值的標準誤為 0.060%。正如第 5 章所討論的那樣,觀察到的平均值比 0.70 低 3 個標準誤(實際上為 3.03 個標準誤,如圖 6-11 所示)。由於觀察到的平均值距離目標值 3.03 個標準誤,因此觀察到的平均值與目標值之間差異的 t 統計量為 3.03。具有 19 個自由度的 3.03 的 t 統計量具有 0.007 的機率。這與使用配對樣本設計得出的結果相同。官方發展援助支出的真實平均水平顯著低於 0.7%。這種 t 統計量的使用稱為“單樣本”t 統計量。它之所以有效是因為均值與其目標值之間的差異(在單樣本場景中使用)與案例與其目標值之間的差異均值相同(在配對樣本場景中使用)。單樣本 t 統計量可用於評估觀察到的均值與真實均值的任何任意目標水平之間的差距。原則上,相同的邏輯也可以用來評估觀察到的迴歸斜率和截距與任意目標之間的差距,但這在實踐中很少發生。單樣本 t 統計量的常見用途是推斷樣本誤差。例如,根據 2000 年美國人口普查,美國家庭的觀察到的平均規模為 2.668 人。該數字是基於對整個人口的實際統計,因此雖然它可能存在測量誤差和案例特定誤差,但它沒有樣本誤差。2000 年人口普查局當前人口調查 (CPS) 中美國家庭的觀察到的平均規模為 2.572 人。CPS 是對美國人口的抽樣調查,它使用與人口普查本身相同的測量方法。CPS 的測量誤差應該與人口普查的測量誤差相同,而 CPS 的案例特定誤差應該等同於人口普查的案例特定誤差。這意味著 CPS 觀察到的家庭規模與人口普查觀察到的家庭規模之間的唯一區別應該是 CPS 中的樣本誤差。人口普查觀察到的 2.668 的均值與 CPS 觀察到的 2.572 的均值之間的差異為 0.096 人。CPS 均值的標準誤為 0.0057,得出的 t 統計量為 16.79。CPS 均值基於 64,944 個家庭。具有 64,943 個自由度的 16.79 的 t 統計量具有非常接近於 0 的微小機率。由此我們可以推斷出 CPS 均值與人口普查均值顯著不同。換句話說,CPS 中的樣本誤差水平在統計學上是顯著的。另一方面,0.096 人的均值差異表明它可能在實質上並不顯著。

6.5。案例研究:貧困與犯罪 貧困與犯罪密切相關。貧困通常被衡量為缺乏金錢收入。生活在家庭收入低於一定收入門檻的人被認為生活在貧困中。確切的收入門檻取決於國家、家庭規模和構成,有時還取決於國家內的地區。在美國,過去四十年,全國總體貧困率一直穩定在人口的 12.5% 左右。由於貧困的整個概念與收入過低的想法密切相關,因此人們可能會預期貧困與財產犯罪的關係比與暴力犯罪的關係更為密切。如果貧困從根本上來說是缺乏金錢,那麼貧困人口可能會被預期會犯下財產犯罪以獲得更多金錢。這是對貧困的唯物主義理論。另一方面,貧困可能並非從根本上來說是一種經濟現象。人們可能會爭辯說,貧困實際上比僅僅缺乏收入要多得多。在這個貧困理論中,生活在貧困中意味著過著一種缺乏基本人尊嚴的生活,而這種人尊嚴來自於擁有一份好工作、良好的教育和安全的家園。如果貧困更多地與個人尊嚴而不是收入有關,那麼貧困可能與暴力犯罪的關係比與財產犯罪的關係更為密切,因為人們會因缺乏自尊而對愛人和周圍的人進行暴力報復。這是對貧困的心理社會理論。哪一個正確,是唯物主義的貧困理論還是心理社會的貧困理論?就具體假設而言,貧困與財產犯罪的關係更密切還是與暴力犯罪的關係更密切?在美國,美國人口普查局幾乎為每個縣提供貧困率資料,而聯邦調查局為大多數(但並非全部)縣提供犯罪資料(許多農村縣的資料缺失)。總而言之,2008 年,在 3140 個美國縣中,有 2209 個縣同時擁有貧困率和犯罪率統計資料。在這 2209 個美國縣中,財產犯罪率遠高於暴力犯罪率。考慮到美國縣的兩種犯罪率為配對樣本,觀察到的暴力犯罪率平均值為每 100,000 人口 85.9 起,遠低於觀察到的財產犯罪率平均值為每 100,000 人口 636.7 起。兩種犯罪率的平均差為 550.8,標準誤為 18.52。與該平均差相關的 t 統計量為 t = 13.937,具有 2208 個自由度,表明在 2209 個縣中,財產犯罪和暴力犯罪的真實水平相等的機率為 .000。財產犯罪確實比暴力犯罪普遍得多。這種差異在統計學上是顯著的(機率 = 0%)並且在實質上是顯著的(平均暴力犯罪率是平均暴力犯罪率的 7.4 倍)。將財產犯罪率和暴力犯罪率迴歸到 2209 個美國縣的貧困率的結果如 6-12 圖所示。兩個斜率都為正並且在統計學上高度顯著。貧困率每上升 1%,財產犯罪率預計會增加每 100,000 人口 13.0 起,暴力犯罪率預計會增加每 100,000 人口 4.5 起。顯然,犯罪率隨著貧困而上升。相對斜率似乎暗示貧困對財產犯罪的影響比對暴力犯罪的影響更大,但這兩個斜率實際上不可比。由於財產犯罪比暴力犯罪普遍得多,因此貧困率的額外增加預計會導致財產犯罪率的變化幅度大於暴力犯罪率的變化幅度。

圖 6-12。美國縣貧困率對財產犯罪(模型 1)和暴力犯罪(模型 2)的迴歸,2008 年

另一方面,兩個 t 統計量是可以比較的。t 統計量代表每種關係的統計顯著性。換句話說,t 統計量與迴歸模型對財產犯罪和暴力犯罪捕捉到的縣特定偏離均值犯罪率的程度相關。暴力犯罪的 t 統計量約為財產犯罪的 t 統計量的 2.5 倍。這意味著貧困解釋了暴力犯罪率變化的程度遠遠超過財產犯罪率變化的程度。換句話說,貧困對於理解暴力犯罪比對於理解財產犯罪更重要。這往往更支援心理社會的貧困理論,而不是唯物主義的貧困理論。貧困不僅僅是金錢問題。它也是——或者也許更多地——尊嚴問題。

第 6 章關鍵詞

[編輯 | 編輯原始碼]
  • 配對樣本是指每個案例代表兩個關聯的觀察結果的資料庫
  • 統計顯著性是指統計結果大到不可能僅僅是偶然發生的
  • 實質性顯著性是指統計結果大到足以在研究人員和整個社會眼中具有意義
  • t 統計量是指基於觀察到的引數的度量,用於對真實引數的機率進行特定推斷


第 5 章 · 第 7 章

華夏公益教科書