跳轉至內容

社會統計學,第 8 章:標準化係數

來自華夏公益教科書,開放的書籍,開放的世界

標準化係數

[編輯 | 編輯原始碼]

我們都知道,當我們開車時,我們的汽車會汙染大氣。我們可以直觀地看到、感覺到、聽到和聞到從排氣管中排出的汙染。當然,汽車並不是唯一汙染空氣的來源。我們現代社會中所做的一切幾乎都會造成空氣汙染,尤其是二氧化碳(CO2)排放到大氣中,導致全球變暖。購物會導致 CO2 排放,因為產品最初要進入商店需要消耗大量能源。傳送電子郵件會導致 CO2 排放,因為我們的計算機使用了電力。吃飯會導致 CO2 排放,因為我們的廚房電器使用了電力和天然氣。即使睡覺也會導致 CO2 排放,如果我們在臥室使用空調或暖氣,聽音樂或設定鬧鐘。這無法避免:僅僅生活在現代社會就會汙染空氣並加劇全球變暖。在第 3 章中,我們將各國的 CO2 排放量與汽車數量進行迴歸,建立了一個簡單的線性迴歸模型,用於預測 CO2 排放量。鑑於 CO2 排放來自多個來源,而不僅僅是汽車,多因果模型似乎更合適。理想情況下,CO2 排放的多因果模型將包括各種變數,例如電力使用量、空中、鐵路和卡車運輸、農業 CO2 排放量以及其他汙染源。在多元線性迴歸模型中包含所有這些變數將有助於建立一個可能非常準確地預測 CO2 排放量的模型,因為所有導致 CO2 排放的因素都將被考慮在內。圖 8-1 展示了一個更簡單的 CO2 排放多因果模型。使用圖 3-1 中的資料,將 51 個國家的人均 CO2 排放量與三個預測因子進行迴歸:每 1000 人擁有的汽車數量、人均國民收入和西歐國家地位。從理論上講,更多汽車數量和更高的人均國民收入應與更高水平的 CO2 排放量相關。西歐國家地位應與較低的 CO2 排放量相關,因為西歐國家近年來一直在積極推動氣候變化行動。圖 8-1 展示了三個模型:一個基於汽車數量的簡單線性迴歸模型(模型 1)、一個新增國民收入的多元線性迴歸模型(模型 2)以及一個額外新增歐洲國家地位的多元線性迴歸模型(模型 3)。

圖 8-1. 2005 年二氧化碳 (CO2) 排放量與汽車數量和國民收入的迴歸(資料來自圖 3-1)

從汽車數量作為感興趣的獨立變數的角度來看,國民收入是一個控制變數。模型 1 中與汽車數量相關的斜率為 0.013,但在控制國民收入後,斜率下降至 0.008。這種下降意味著國民收入從汽車數量的角度來看是一個競爭性控制:它與汽車數量競爭,解釋關於 CO2 排放量的相同事實。這並不奇怪。畢竟,開車是富裕國家生活中不可或缺的一部分。當國家的人均國民收入水平較高時,他們擁有的汽車也更多。因此,這兩個變數在解釋一個國家的 CO2 排放量方面存在競爭。為了使國民收入補充汽車數量,它必須解釋一個國家其他可能掩蓋汽車數量與 CO2 排放量之間真實關係的事實。補充汽車數量和國民收入的是歐洲國家地位。歐洲國家地位有助於揭示汽車數量與 CO2 排放量之間以及國民收入與 CO2 排放量之間的真實關係,因為歐洲國家的 CO2 排放量與其汽車數量和國民收入水平相比相對較低。在西歐,汽車往往較小且燃油效率高,因此西歐國家在擁有相同數量的汽車情況下,CO2 排放量更低。同樣,西歐嚴重依賴核能和風能,導致在相同國民收入水平的情況下 CO2 排放量更低。因此,從汽車數量和國民收入的角度來看,歐洲國家地位是一個補充性控制。它特別強烈地補充了國民收入。哪個變數對 CO2 排放量的總體影響更大,是汽車數量還是更廣泛的國民收入水平?很難說定,因為這些變數以截然不同的單位表示。每 1000 人增加一輛汽車的影響小於國民收入增加 1000 美元,但這不是一個公平的比較。畢竟,每 1000 人增加 100 輛汽車的影響遠大於國民收入增加 1000 美元。我們可以比較汽車數量和國民收入的 t 統計量,以確定哪一個在統計學上更顯著,但我們還沒有一種機制來比較不同變數在相同尺度上的效應的絕對大小。沒有這個,我們就無法確定哪個變數對 CO2 排放量的影響更大。更進一步,這兩種變數加在一起能解釋國際 CO2 排放量變異的多少,或者這兩種變數加上歐洲國家地位能解釋多少?畢竟,統計建模的最終目標是解釋世界上的事物。圖 8-1 中提出的模型部分解釋了國家間 CO2 排放量的差異,但我們不知道它們解釋了多少 CO2 排放量。這無疑是一個非常好的資訊,從科學的角度來看是如此,從社會政策的角度來看也是如此。政治家和公眾有權瞭解我們的統計模型能解釋現實世界中廣泛變異的多少。如果我們能解釋觀察到的變異的 90%,那就太好了。如果我們能解釋 50%,還不錯,至少說明了一些問題。如果我們只能解釋觀察到的變異的 10%,而其餘現實世界本質上是隨機的,那麼世界就有權無視我們以及我們的統計結果。

本章展示瞭如何在多元迴歸模型的背景下直接比較不同變數的相對解釋力。首先,為了比較變數,必須透過稱為標準化的過程將它們放在相同的尺度上(第 8.1 節)。使用標準化變數估計的迴歸斜率可用於直接比較每個變數的相對解釋力。其次,當使用標準化變數進行簡單線性迴歸時,結果會得到一個相關係數,該係數衡量變數之間關係的強度(第 8.2 節)。相關性方便地衡量兩個變數之間關係的強度,範圍從 -1 到 +1。相關係數也可以用於評估任何迴歸模型的總體預測能力(第 8.3 節)。可以衡量因變數中由自變數解釋的總變異量。一個可選部分(第 8.4 節)說明了如何使用相關係數同時探索連線大量變數的關係結構。最後,本章以臺灣人民對民主的滿意度為案例研究(第 8.5 節)。該案例研究說明了如何使用標準化迴歸係數來評估和比較多元迴歸模型中不同變數的效能。它還說明了如何比較不同迴歸模型的相對解釋力。本章的所有關鍵概念都在這個案例研究中得到應用。在本節結束時,你應該能夠使用多元迴歸來對多個自變數對單個因變數的影響做出基本推斷。

8.1. 使用標準化變數比較相同事物 線性迴歸涉及比較具有非常不同含義的變數的值。在圖 8-1 的模型 2 中,報告了在一個國家中,每增加 1 輛汽車(每 1000 人),人均 CO2 排放量就會增加 0.008 噸,而國民收入每增加 1000 美元,人均 CO2 排放量就會增加 0.074 噸。變數汽車以每 1000 人的數量表示,變數國民收入以千美元表示,變數 CO2 排放量以人均每年噸表示。使用如此多的不同單位使得跨變數比較不同國家變得困難。例如,澳大利亞有 542 輛汽車(每 1000 人)、29,480 美元(人均國民收入)和 18.1 噸(人均 CO2 排放量)。這些資料是高、低還是平均水平?它們彼此之間以及與其他國家相比如何?判斷變數值是高還是低的一種方法是使用均值和標準差。圖 8-2 報告了圖 8-1 中使用的 51 個國家 CO2 排放量、汽車數量和國民收入的均值和標準差。澳大利亞的 CO2 排放量(18.1 噸)遠遠高於 51 個國家 CO2 排放量的平均水平。事實上,澳大利亞的 CO2 排放量比平均水平高出兩個標準差以上。平均值為 6.15 噸。平均值加一個標準差為 6.15 + 4.34 = 10.49 噸。平均值加兩個標準差為 6.15 + 4.34 + 4.34 = 14.83 噸。澳大利亞的排放量為 18.1 噸,遠遠高於這一水平。

圖 8-2. 2005 年二氧化碳 (CO2) 排放量、汽車數量和國民收入的均值和標準差(資料來自圖 3-1)

澳大利亞每千人擁有的汽車數量也很多,為 542 輛,而跨國平均值為 242 輛。澳大利亞的水平比平均水平高出 1 個標準差,但不到 2 個標準差。澳大利亞的國民收入水平為 29,480 美元,遠高於平均水平,但不到 1 個標準差。實際上,它只比平均水平高出 0.83 個標準差。因此,雖然澳大利亞在乘用車和國民收入方面比平均水平高出約 1 個標準差,但在二氧化碳排放方面卻比平均水平高出 2 個標準差以上。這表明澳大利亞的二氧化碳排放特別高。回顧圖 3-2,情況似乎確實如此:澳大利亞的實際二氧化碳排放量遠高於迴歸線所示的預期水平。澳大利亞是一個明顯的異常值。另一方面,墨西哥的二氧化碳排放量比平均水平低 0.47 個標準差,乘用車比平均水平低 0.51 個標準差,收入比平均水平低 0.42 個標準差。它在所有三個變數上的低於平均水平的程度大致相同。它在所有三個變數上的接近平均水平的程度也比澳大利亞高,至少在標準差方面是如此。例如,在二氧化碳排放方面,墨西哥比平均水平低 0.47 個標準差,而澳大利亞則比平均水平高出 2.75 個標準差。用標準差來討論變數的多少高於或低於平均水平實際上是一種非常有用的技術。與計算特定情況下的標準差高於或低於平均水平相比,在稱為“標準化”的過程中,將變數的所有值同時轉換為高於或低於平均水平的標準差更有意義。標準化變數是指透過從每個觀測值中減去平均值,然後除以標準差而得到的變數。由於它們的構造方式,標準化變數的平均值始終為 0,標準差始終為 1。由於它們的構造方式,標準化變數沒有單位。例如,墨西哥的國民收入比平均水平低 0.42 個標準差。它不是低於平均水平 0.42 美元,也不是低於平均水平 0.42%。它只是低於平均水平 0.42 個標準差。這是標準化變數的唯一缺點:它們沒有單位。當社會統計學家有興趣做一些需要原始單位的事情時,比如使用迴歸模型進行預測,他們需要原始單位。非標準化變數是指以其原始單位表示的變數。所有變數最初都是非標準化變數,以美元、英鎊、百分比、每千人擁有的汽車數量或其他單位表示。一般來說,“非標準化變數”就是“變數”。“非標準化變數”一詞只在需要將非標準化變數與標準化變數區分開來時使用。標準化變數最重要的應用是線上性迴歸模型中。在圖 7-13 中,加拿大的 13 個省和地區的吸菸率與平均日氣溫和重度飲酒率進行了迴歸。溫度和重度飲酒都是吸菸率的統計學顯著預測指標,但由於它們以不同的單位記錄(度數與百分比),因此很難比較它們的影響。將所有三個變數(吸菸、溫度和飲酒)標準化,可以對溫度和飲酒對吸菸率的影響進行有意義的比較。標準化變數的第一步是找到它們的均值和標準差。圖 8-3 報告了所有三個變數的均值和標準差。第二步是使用這些均值和標準差將每個變數的每個值轉換為標準化值。

圖 8-3。2008 年加拿大的 13 個省和地區的吸菸率、平均氣溫和重度飲酒的均值和標準差(資料來自圖 4-8)

通常,標準化由統計計算機軟體自動執行,但圖 8-4 以“重度飲酒”變數為例說明了標準化過程中的步驟。加拿大的所有 13 個省和地區都列在第 1 列,它們的重度飲酒率列在第 2 列。重度飲酒的平均值記錄在第 3 列。每個值與平均值的差值在第 4 列中計算。重度飲酒的標準差記錄在第 5 列。每個省的重度飲酒的標準化值在第 6 列中計算。第 6 列中的值表示每個省比所有省的重度飲酒平均水平高出多少個標準差。

圖 8-4。使用 2008 年加拿大的 13 個省和地區的吸菸率為例說明如何對變數進行標準化

標準化將變數中每個案例的值更改為標準化值,但不會以任何方式更改變數的分佈。高案例仍然是高案例,低案例仍然是低案例。只有單位會發生變化。圖 8-5 說明了這一點。圖 8-5 的左側是使用原始的非標準化變數繪製的加拿大的 13 個省和地區的吸菸率與重度飲酒率的散點圖。圖 8-5 的右側使用標準化變數描述了相同的關係。點的佈局相同,但軸的刻度發生了變化。標準化圖以 0 為中心,每個方向的範圍從 -3 到 +3。還要注意,標準化圖上繪製的迴歸線如何穿過中心點。使用標準化變數估計的任何迴歸都會發生這種情況。

圖 8-5。非標準化變數(左)和標準化變數(右)在加拿大的 13 個省和地區中,吸菸率與重度飲酒率散點圖的比較

圖 8-6 報告了將省級吸菸率對平均氣溫和重度飲酒率進行迴歸的多元線性迴歸模型的係數。報告了兩個係數集,一個使用非標準化變數,另一個使用標準化變數。非標準化係數是指使用原始非標準化變數估計的迴歸模型的係數。標準化係數是指使用標準化變數估計的迴歸模型的係數。非標準化係數只是使用三個變數的原始單位找到的常規係數。它們與圖 7-13 模型 2 中報告的係數相同。另一方面,標準化係數是使用新的標準化變數版本時得到的模型的係數。

圖 8-6。2008 年加拿大的 13 個省和地區的吸菸率對氣溫和重度飲酒率的迴歸(根據圖 7-13,模型 2)

由於標準化係數都以標準化單位(以標準差表示,而不是度數或百分比)表示,因此它們可以直接比較。溫度與吸菸之間的關係是重度飲酒與吸菸之間關係的兩倍多。溫度每增加一個標準差,吸菸率就會下降 0.832 個標準差,而重度飲酒每增加一個標準差,吸菸率就會上升 0.398 個標準差。標準化模型沒有報告截距,因為標準化模型的截距始終為 0。報告 0 作為截距並不錯誤,但習慣上將標準化模型的截距留空。由於這種習慣,很容易一眼看出模型是使用非標準化變數還是標準化變數。無論何時報告截距,模型都是非標準化的。當沒有報告截距時,模型一定是標準化的。非標準化係數和標準化係數的 t 統計量和機率水平相同。由於標準化不會改變分析中點的佈局或誤差量,因此它不會對顯著性水平產生任何影響。圖 8-7 報告了二氧化碳排放回歸模型的標準化係數。在模型 2 中,乘用車的標準化係數大於國民收入的標準化係數。這表明乘用車的數量比國民收入水平更能預測二氧化碳排放量。兩個標準化係數之間的差異很小,但很明顯。在模型 3 中控制西歐狀態會改變這種情況。在模型 3 中,國民收入的標準化係數比乘用車的係數強。這是因為控制西歐狀態消除了國民收入與二氧化碳排放之間關係的大部分誤差(西歐狀態強烈補充了國民收入)。

圖 8-7。2005 年二氧化碳 (CO2) 排放量對乘用車和國民收入迴歸的度量係數和標準化係數的比較(根據圖 8-1)

那麼,哪個變數最能預測二氧化碳排放量?答案是它們的影響大致相同。哪個更強取決於我們是否控制了西歐狀態。西歐狀態本身對二氧化碳排放量的影響要弱得多,略高於其他兩個變數的一半。使用標準化變數生成標準化係數使所有這些比較成為可能。

8.2. 相關性 在圖 8-6 和圖 8-7 中,使用標準化係數比較模型內關係的相對強度。在加拿大各省,溫度與吸菸率之間的關係遠強於大量飲酒與吸菸率之間的關係。在各國,乘用車與二氧化碳排放量之間的關係與國民收入與二氧化碳排放量之間的關係強度大致相同。在所有這些情況下,不同關係的強度是在單個迴歸模型中進行比較的。標準化係數也可用於比較不同模型中關係的強度。例如,在第 1 章中,我們推測低收入會導致更高的垃圾食品消費。這個理論被轉化為兩個具體的假設。首先,假設中位收入較高的美國州的汽水消費量較低。其次,假設收入較高的州的含糖零食消費量較低。結果證明,第一個假設是正確的,但第二個假設是錯誤的。與預期相反,收入較高的州的含糖零食消費量實際上更多,而不是更少。我們可能想知道哪種關係更強,收入與汽水之間的(預期)關係,還是收入與含糖零食之間的(意外)關係。圖 8-8 和圖 8-9 報告了每個因變數對州中位收入的迴歸結果。每個模型中的非標準化係數與第 1 章中報告的係數相同。非標準化係數表明,州中位收入每增加 1000 美元,人均汽水消費量每年減少 0.603 加侖,人均含糖零食消費量每年增加 0.611 磅。標準化係數表明,收入與汽水消費量之間關係的強度實際上略強於收入與含糖零食消費量之間關係的強度。

圖 8-8. 2008 年 48 個美國州的汽水消費量對州中位收入的迴歸的度量和標準化係數比較(資料來自圖 1-2)
圖 8-9. 2008 年 48 個美國州的含糖零食消費量對州中位收入的迴歸的度量和標準化係數比較(資料來自圖 1-2)

簡單線性迴歸模型中的標準化係數通常以這種方式用於衡量變數之間關係的強度。標準化係數是兩個變數之間關係的簡便速記,原因有幾個。首先,由於它們基於標準化變數,因此它們始終具有可比性,無論原始變數是用什麼單位測量的。其次,事實證明,在只有一個預測變數的簡單線性迴歸模型中,哪個變數是因變數,哪個變數是自變數並不重要。無論哪種方式,標準化係數都將相同。第三,同樣僅在只有一個預測變數的簡單線性迴歸模型中,事實證明標準化係數將始終介於 -1 和 +1 之間。斜率在任何方向上都不大於 1。這種使用來自簡單迴歸模型的標準化係數的做法非常普遍,以至於它有自己的名稱和符號:相關性,用符號“r”表示。相關性 (r) 是衡量兩個變數之間關係強度的指標,範圍從 r = -1(完全負相關)到 r = 0(無相關性)再到 r = +1(完全正相關)。兩個變數之間的相關性與一個變數對另一個變數的迴歸的標準化係數完全相同。圖 8-10 演示瞭如何比較州收入與汽水和含糖零食的相關性。請注意,相關係數與圖 8-8 和圖 8-9 中報告的簡單線性迴歸係數相同。同樣,它們的機率對應於圖 8-8 和圖 8-9 中報告的 t 統計量的機率。

圖 8-10. 2008 年 48 個美國州的州中位收入與汽水和含糖零食消費量的相關性

8.3. R 和 R2 除了普遍衡量變數之間關係的強度之外,相關性還有另一個非常具體的用途。相關性可用於評估任何迴歸模型的整體預測強度。例如,圖 8-11 中的表格重複了圖 7-6 中對三個自變數(國民收入、教育支出和教師人數)進行的科學成績性別差距迴歸的結果。在圖 8-11 中,報告了非標準化係數和標準化係數。標準化係數表明,教師和國民收入的影響強於教育支出的影響,但它們並沒有告訴我們該模型作為一個整體在預測科學成績性別差距方面的表現如何。

圖 8-11. 2006 年對各種自變數進行的科學成績性別差距的多元線性迴歸(根據圖 7-6;資料來自圖 7-1)

相關性可用於幫助闡明這一點。評估模型效能的關鍵問題是:模型預測的因變數的值與實際觀察到的因變數的值之間的對應程度如何?換句話說,因變數的預期值與其實際值之間的關係強度是多少?相關性非常適合衡量兩個變數之間關係的強度。當將兩個變數相關聯時,這兩個變數是來自迴歸模型的因變數的實際值和預期值,則相關性用大寫字母 R 表示(將其區分為一種特定型別的相關性)。對於圖 8-11 的模型 1,R 為 0.446。這意味著在圖 8-11 的模型 1 中,科學成績性別差距的實際值與迴歸模型生成的預期值的 r = 0.446 相關。這不是理想的(完美的相關性將是 r = 1),但這是有意義的。圖 8-12 繪製了科學成績性別差距的實際值與圖 8-11 中模型 1 生成的預期值。兩者之間存在明確的正相關關係,但並不十分強。作為比較,對於預測加拿大各省吸菸率的迴歸(圖 8-6),該模型的預測效能為 R = 0.928,而對於預測各國二氧化碳排放量的迴歸(圖 8-7 中的模型 3),該模型的預測效能為 R = 0.632。圖 8-11 中的迴歸模型確實預測了科學成績的性別差距,但並不特別好。

圖 8-12. 基於圖 8-10 中模型 1 的科學成績性別差距的實際值與預期值的散點圖

除了總結迴歸模型的預測強度之外,迴歸模型 R 統計量還有另一個非常重要的用途。R 統計量在將回歸模型連結回平均模型方面發揮作用。在第 4 章中,圖 4-10 展示瞭如何將加拿大各省吸菸率的平均模型對映到吸菸的迴歸模型中。每個省份與平均吸菸率的偏差(圖 4-10 的左側)分散在吸菸迴歸模型的平均溫度範圍內(圖 4-10 的右側)。在圖 8-13 中,對吸菸率與大量飲酒率之間的關係進行了相同型別的對映。同樣,每個省份與平均吸菸率的偏差(左側)分散在自變數範圍內,在本例中為大量飲酒(右側)。

圖 8-13. 2008 年加拿大 13 個省和地區的吸菸率的平均模型和迴歸模型的示意圖

從這個角度來看,迴歸模型只不過是對為什麼某些案例比其他案例更偏離平均值的解釋。從這個角度來看,安大略省的吸菸率較低,至少部分原因是其飲酒率較低,而西北地區的吸菸率較高,至少部分原因是其飲酒率較高。這些省份的吸菸率也部分由其溫度(圖 4-10)解釋。總體而言,溫度和大量飲酒率解釋了吸菸率的跨省總變異性的很大一部分,但究竟佔多少呢?正確回答這個問題需要大量的代數,但所有這些代數的最終結果是,迴歸模型中自變數解釋的因變數總變異性的比例等於 R x R,或 R2(“R 平方”)。R2 是衡量回歸模型解釋的因變數總變異性比例的指標。與其他迴歸相關統計量一樣,無需計算 R2。任何估計迴歸模型的軟體程式都將自動報告模型的 R2 統計量。圖 8-11 中用於預測科學成績性別差距的模型的 R2 為 0.199 或 19.9%,表明一個國家的國民收入、教育支出和教師人數共同解釋了科學成績性別差距的國際變異性的近 20%。預測加拿大省級吸菸率的模型的 R2(圖 8-6)為 0.861,表明 86% 以上的跨省吸菸率差異可以用溫度和大量飲酒率的差異來解釋。預測各國二氧化碳排放量的完整模型的 R2(圖 8-7 中的模型 3)為 0.399,表明近 40% 的國際二氧化碳排放量差異可以用國民收入、乘用車和西歐國家地位的差異來解釋。由於 R2 具有如此重要的直觀意義(解釋的變異性比例),因此大多數迴歸結果表都報告 R2,而不是 R。由於根據定義,R2 等於 R 平方,因此可以使用計算器輕鬆地從一個計算另一個(如果需要)。實際上,R 很少使用,但幾乎每個迴歸模型都會報告和討論 R2。

8.4. 相關矩陣(可選/高階) 相關性是衡量變數之間關係強度的總結指標。因此,即使在迴歸模型之外,它們也很有用。有時我們只想瞭解一組變數之間存在哪些關係。連線一組變數的所有相關性的表格稱為相關矩陣。例如,圖 8-6(二氧化碳排放回歸模型)中包含的四個變數的相關矩陣如圖 8-14 所示。迴歸模型的因變數首先列在圖 8-14 中,然後列出所有自變數,但相關矩陣中變數的順序對相關性沒有任何影響。該表或矩陣只是組織所有變數之間所有相關性的便捷方式。

圖 8-14. 圖 8-6(二氧化碳排放回歸)中變數的相關矩陣

如圖 8-14 所示的相關矩陣,其行數和列數總是相等,因為每個變數既作為行也作為列出現。當一個變數在表格中與自身匹配時,其相關性始終為 1(每個變數與其自身完全相關)。因此,相關矩陣中總是有一條對角線穿過中間,其元素均為 1。相關矩陣的另一個特徵是,右上角報告的相關性是左下角報告的相關性的映象。這是因為相關性是對稱的:收入與汽車的相關性與汽車與收入的相關性相同。由於右上角的條目重複了左下角的條目,因此相關矩陣中右上角有時會留空。這些去除了冗餘相關性的半空白矩陣被稱為三角矩陣。圖 8-15 展示了一個包含七個變數的三角相關矩陣。這些相關性基於 2006 年世界價值觀調查中 1145 名臺灣受訪者的特徵(將在 8.5 節中討論)。由於一些變數的名稱很長,每個變數都列在一個編號的行上,這些編號被用作列標題。為了便於參考,還包括所有變數的平均值和標準差。包含平均值和標準差的相關矩陣,在緊湊的空間內總結了一組變數的所有重要特徵。儘管許多作者確實使用類似於圖 8-15 所示的三角矩陣,但完整的(正方形)矩陣更加方便。在三角矩陣中找到你正在尋找的相關性可能需要幾分鐘,而在正方形矩陣中,你總是可以沿著一行讀取以找到你想要的任何相關性。

圖 8-15. 包含臺灣民主迴歸(圖 8-16)中包含的變數描述性統計的相關矩陣

相關矩陣可以用來挑選出哪些自變數可能與因變數顯著相關。例如,在圖 8-15 中,與民主評級最密切相關的變數是年齡、教育和對制度的信心。相關矩陣還可以用來挑選出哪些自變數可能基於相互之間的相關性而相互競爭或相互補充。像年齡、教育和收入,或者信任和信心這樣的高度相關的變數組,很可能相互競爭或相互補充。在迴歸模型中使用時,彼此不相關的變數不太可能相互競爭或相互補充。然而,根據相關矩陣區分競爭性控制和補充性控制是困難或不可能的。

8.5. 案例研究:對臺灣民主的滿意度 在第五章中,來自 2006 年世界價值觀調查(WVS)臺灣版的資料被用來研究人們的年齡與他們對臺灣民主質量的評級之間的關係。人們對臺灣民主的評級是在 0 到 100 的量表上評分,其中: 評級 = 0 表示受訪者認為臺灣沒有足夠的民主 評級 = 50 表示受訪者認為臺灣的民主程度恰到好處 評級 = 100 表示受訪者認為臺灣的民主程度過高 圖 5-7 報告的迴歸模型發現,年齡與人們對臺灣民主的評級呈正相關,每增加一歲,民主評級預測會增加 0.105 分(老年人認為臺灣比年輕人更民主)。在 1216 名受調查者中,平均民主評級為 38.7,表明大多數人對臺灣的民主程度不太滿意。圖 8-16 報告了關於臺灣民主評級的兩個更廣泛的多元迴歸模型的結果。這些模型僅基於 1145 個調查回答,因為有些人沒有回答模型中使用的所有問題。圖 8-16 中報告的模型包括六個自變數: 年齡 -- 受訪者的年齡(以年為單位) 性別 -- 受訪者的性別,編碼為女性 = 0,男性 = 1 教育 -- 受訪者的受教育年限 收入 -- 受訪者的收入十分位(最低十分位、第二十分位、第三十分位等) 對社會的信任 -- 一個衡量受訪者對社會信任程度的變數,範圍從 0 到 18 對制度的信心 -- 一個衡量受訪者對社會制度(如政府、企業和教會)的信心程度的變數,範圍從 0 到 45 預計教育和收入會與人們對民主的評級呈正相關,因為在社會中更成功的人通常對社會有更高的評價。同樣,那些對社會制度有更高信任和信心的人,預計會對他們社會的民主程度有更高的評價。性別也被納入作為控制變數,但沒有對其影響的特定預期。

圖 8-16. 2006 年公民對臺灣民主評級的迴歸分析,包含六個自變數 (N=1145)

圖 8-16 中的第一列結果報告了民主評級與六個自變數中每個變數的相關性。這些相關性中只有三個具有統計學意義:年齡、教育和對制度的信心。圖 8-16 還報告了兩個迴歸模型的結果。對於每個模型,都報告了非標準化係數和標準化係數。非標準化係數只是基於模型中每個變數的非標準化變數的普通迴歸係數。標準化係數是在使用標準化變數估計的相同迴歸模型中產生的迴歸係數。模型 1 中的標準化係數表明,在模型中包含的四個變數中,年齡對民主評級的影響最大。在模型 2 中,對社會制度(包括政府)的信心與人們對國家民主的評級呈正相關。這是有道理的,因為對政府沒有信心的人不太可能認為他們的政府非常民主。令人驚訝的是,對社會的信任對人們對臺灣政府民主程度的評價沒有顯著影響。這兩個模型的 R2 統計量都出奇地低。模型 1 的 R2 為 0.019,表明模型 1 中的變數加起來只解釋了人們對臺灣民主評級總變異量的 1.9%。隨著模型 2 中變數的增加,R2 上升,但在 0.026(2.6%)時仍然非常低。這些低的 R2 分數對這兩個模型的實質意義提出了質疑。這兩個模型的係數都具有統計學意義,但一個模型解釋了因變數總變異量不到 3%,從政策的角度來看可能不是很有用。人們對他們自己的政府的民主程度的評級的真正原因仍然是一個謎,至少在臺灣是這樣。

第八章 關鍵詞

[編輯 | 編輯原始碼]
  • 相關性 (r) 是 _衡量兩個變數之間關係強度的指標,其範圍從 r = −1(完全負相關)到 r = 0(無相關性)到 r = +1(完全正相關)_。
  • R2 是 _衡量回歸模型解釋因變數總變異量比例的指標_。
  • 標準化係數 是 _使用標準化變數估計的迴歸模型的係數_。
  • 標準化變數 是 _透過從每個觀測值中減去均值,然後除以標準差而變換的變數_。
  • 非標準化係數 是 _使用原始非標準化變數估計的迴歸模型的係數_。
  • 非標準化變數 是 _以其原始單位表示的變數_。

第七章 · 第九章


華夏公益教科書