使用 SPSS 和 PASW/普通最小二乘迴歸
普通最小二乘 (OLS) 迴歸(或簡稱“迴歸”)是用於檢查兩個或多個區間/比率變數之間關係的有用工具。OLS 迴歸假設兩個變數之間存線上性關係。如果關係不是線性的,則 OLS 迴歸可能不是分析的理想工具,或者可能需要對變數/分析進行修改。線性迴歸的基本思想是,如果兩個變數之間存線上性關係,則可以使用一個變數來預測另一個變數的值。例如,由於身高和體重之間存線上性關係,如果您知道某人的身高,就可以更好地估計他們的體重。使用基本線公式,您可以使用自變數計算因變數的預測值,從而做出更好的預測。
為了說明如何在 SPSS 中進行迴歸分析,我們將使用樣本資料集中的兩個區間變數。這些相同的變數在其他一些章節中使用過。遺傳諮詢師被要求根據 10 分制對他們認為自己的宗教和精神程度進行評分 - 較高的值表示更宗教或更精神。在下面的分析中,我們將看看宗教程度如何預測精神程度。
在我們計算遺傳諮詢師的宗教程度和精神程度的迴歸線之前,我們應該做的第一件事是檢查這兩個變數的散點圖。散點圖將幫助我們確定兩個變數之間的關係是線性的還是非線性的,這是迴歸分析的一個關鍵假設。這在 SPSS 中透過轉到“圖形” -> “圖表構建器”來完成。

選擇“圖表構建器”後,您將獲得“圖表構建器”視窗,它看起來像這樣

在“圖表構建器”視窗中,在螢幕中間確保您選擇了“庫”選項卡,然後從選項列表中選擇“散點圖”。在選項的右側,您將看到 8 個框。如果您將滑鼠懸停在這些框上,它們將識別它們將生成的散點圖型別。選擇左上角的選擇,稱為“簡單散點圖”。要選擇它,您需要將其拖動到上面寫著“圖表預覽使用示例資料”的框中。然後您將看到兩個軸 - Y 軸和 X 軸。在我們的示例中,由於我們使用宗教程度來預測精神程度,因此我們將 relscale 拖動到 X 軸,將 sprscale 拖動到 Y 軸。然後我們選擇“確定”,並在我們的輸出視窗中獲得以下內容

具有大量值的散點圖通常很難解釋。SPSS 試圖透過使具有大量出現的點更暗來使解釋變得更容易。在這種情況下,我們在散點圖中可以看到,似乎有一條深色的線從左下角跑到右上角,表明宗教程度和精神程度之間存在正相關關係 - 一個增加,另一個也增加。該關係也似乎是線性的,這對於迴歸分析來說是件好事。在檢查了散點圖後,我們現在可以進行迴歸分析。
要在 SPSS 中執行迴歸分析,請選擇“分析” -> “迴歸” -> “線性”。

將開啟“線性迴歸”視窗。

左側是變數列表。找到您的因變數。在我們的示例中,它是“sprscale”。我們使用箭頭將其移動到“因變數”框中。然後找到您的自變數。在我們的示例中,它是“relscale”。我們將其移動到“自變數:”框中。

雖然可以選擇許多其他選項,但基本選項足以用於示例。因此,選擇“確定”,您將在輸出視窗中獲得以下內容

第一個表格只是告訴您哪些變數包含在分析中以及它們是如何包含的(即,哪個是自變數,哪個是因變數)。
第二個表格提供了“模型摘要”,我們稍後將回到它。第三個表格是方差分析表,它對於各種統計資料非常有用,但我們將在本章中暫時跳過它。
第四個表格提供了對我們當前努力最有意義的迴歸統計資料。第二行(不是標記為“(常數)”的第一行)的第一列“B”提供了自變數的斜率係數。這意味著,對於自變數的每個 1 個單位變化,因變數將發生 XX 個單位變化。在我們的示例中,10 分制宗教程度量表的每 1 分增加,會導致精神程度量表增加 0.506 分。這告訴我們我們在散點圖中注意到的兩個變數之間的關係是準確的 - 關係是正的。
第二列,標記為“標準誤差”,提供了斜率係數的標準誤差。第三列“Beta”提供了斜率係數的標準化版本(在二元迴歸中,這也被稱為相關係數或“r”)。這意味著,對於自變數的每個 1 個標準差單位變化,因變數將發生相應的 XX 個標準差單位變化。對於大多數變數來說,這不如斜率係數直觀。第四列“t”是 t 統計量。第五列“Sig.”提供了自變數斜率係數的 p 值。在我們的示例中,p 值為 0.000,小於標準 alpha 值 0.05,表明在假設實際上不存在關係的情況下,偶然發現我們所做的宗教程度和精神程度之間的線性關係的可能性小於千分之一。換句話說,我們可以拒絕宗教程度和精神程度之間不存在關係的零假設,並接受宗教程度和精神程度之間存在顯著關係的備擇假設。從實際意義上講,更宗教的遺傳諮詢師往往也更精神。
第四個表格的第一行提供了常數或 y 截距的統計資料。在本章中,我們最感興趣的是“B”列中的值。該值是 y 截距,或迴歸線與 y 軸相交的點。在我們的示例中,它是 3.822。這意味著,當遺傳諮詢師的宗教程度為零時,精神程度預測為 3.822。
回到第二個表格,敏銳的讀者會注意到第一列“R”與第四個表格中的“Beta”列相同。如上所述,二元迴歸中的標準化斜率係數等同於相關係數或“r”。第二列是 R 平方統計量,它是由統計模型解釋的資料集中可變性的比例。基本上,R 平方統計量可以解釋為:宗教程度解釋了精神程度變化的 34.2%。
最後,為了說明迴歸線作為我們資料集中許多案例的最佳擬合線的實際線,我們添加了另一個帶回歸線的散點圖。

此圖說明了迴歸線試圖最小化散點圖中所有點之間的變化,為自變數(宗教程度)的每個值提供因變數(精神程度)的最佳估計。它還顯示了迴歸線在上面提到的值(3.822)處與 y 軸相交。
以上解釋應為個人提供足夠的資訊來執行迴歸分析並在 SPSS 中解釋它。