計量經濟學理論/經典線性迴歸模型的假設
我們透過線性迴歸建立的估計量為我們提供了變數之間的關係。然而,執行迴歸並不自動地為我們提供變數之間可靠的關係。為了建立可靠的關係,我們必須瞭解估計量的性質 並證明關於資料的某些基本假設是正確的。必須瞭解,擁有良好的資料集對於應用經濟學研究至關重要。
在以下四個假設下,OLS是無偏的。這意味著
.
該模型必須在引數方面是線性的。
引數是自變數上的係數,如 和 。這些應該是線性的,因此具有 或 將違反此假設。
Y 和 X 之間的關係要求因變數 (y) 是解釋變數和誤差項的線性組合。該假設要求模型是完整的(模型規範),因為所有相關變數都已包含在模型中。模型必須在引數方面是線性的,但它不要求模型在變數方面是線性的。公式 1 和 2 描述了一個模型,該模型在引數和變數方面都是線性的。請注意,公式 1 和 2 以不同的符號顯示了同一個模型。(1) (2) 為了使 OLS 起作用,指定的模型必須在引數方面是線性的。請注意,如果和之間的真實關係是非線性的,則無法以任何有意義的方式估計係數。公式 3 顯示了一個經驗模型,其中是二次性質。(3) CLRM 的假設 1 要求模型在引數方面是線性的。OLS 無法以任何有意義的方式估計公式 3。但是,假設 1 不要求模型在變數方面是線性的。OLS 將在公式 4 中生成對的有效估計。(4) 使用普通最小二乘法 (OLS) 方法可以估計模型,這些模型在引數方面是線性的,即使模型在變數方面是非線性的。相反,無法估計模型,這些模型在引數方面是非線性的,即使它們在變數方面是線性的。最後,每個用 OLS 估計的模型都應包含所有相關的解釋變數,並且所有包含的解釋變數都應是相關的。
所有 不能都具有相同的值。這是完全的多重共線性,不允許。
值必須是隨機選擇的。換句話說,兩個不同的 x 值之間沒有相關性: 對於 。
給定自變數 的特定值,誤差項的均值為零。 。
在滿足以下兩個假設的情況下,OLS 是最佳線性無偏估計量(BLUE)。這意味著在所有可能的線性無偏估計量中,OLS 對 和 提供了最精確的估計。
在滿足第三個假設的情況下,OLS 是最佳無偏估計量(BUE),因此它甚至優於非線性估計量。同樣地,在滿足這個假設的情況下, 服從於以 為中心的 Student's t 分佈,而 以 為中心以特定方式分佈。
誤差項的方差是恆定的。 。這意味著誤差項 的方差不依賴於 的值。如果情況如此,則誤差項被稱為同方差的。在經濟資料中並非總是如此,例如,一個人的工資變化將隨著他們的受教育程度而變化——一個高中輟學者不會有太多工資變化,而那些擁有博士學位的人可能會看到非常不同的工資。
誤差項是獨立分佈的,因此它們的協方差為 0。 。
誤差項是正態分佈的。