跳轉到內容

計量經濟學理論/普通最小二乘法 (OLS)

來自華夏公益教科書,開放的書籍,開放的世界

普通最小二乘法OLS 是線性迴歸中最簡單(如果你能這樣稱呼它)的方法之一。OLS 的目標是將函式與資料緊密“擬合”。它是透過最小化資料中平方誤差的總和來實現的。

為什麼我們在求和之前對誤差進行平方

[編輯 | 編輯原始碼]

我們不是試圖最小化誤差的總和,而是最小化平方誤差的總和。讓我們再簡要回顧一下我們的毛衣故事。

模型 A
模型 B
模型 資料點 來自線的誤差
A 1 5
A 2 10
A 3 -5
A 4 -10
B 1 3
B 2 -3
B 3 3
B 4 -3

請注意,模型 A 的總和為 ,而模型 B 的總和為

這兩個模型的誤差總和都為 0。這是否意味著它們都非常適合!不!

因此,為了考慮符號,無論何時我們對誤差求和,我們都會先對項進行平方。因此,正負偏差都受到同等的懲罰,同時試圖最小化擬合線的誤差。

這兩個模型都有一個截距項 和一個斜率項 (一些教科書使用 而不是 而不是 ,當我們轉向多元公式時,這是一種更好的方法)。我們可以用以下公式表示任意單變數模型: 根據這個公式,y 值與 x 值相關。 被稱為因變數, 被稱為自變數,因為 的值由 的值決定。我們使用下標 i 來表示一個觀測值。所以 配對, 配對,等等。 項是誤差項,它是 的影響和 的觀測值之間的差異。

不幸的是,我們不知道 的值。我們必須對它們進行近似。我們可以使用普通最小二乘法來實現這一點。術語“最小二乘”意味著我們試圖最小化平方和,或者更具體地說,我們試圖最小化平方誤差項。由於我們需要最小化的變數有兩個(),我們有兩個方程。



將這些方程的解稱為 。解得


其中 。計算這些結果可以作為練習留給讀者。

需要注意的是, 不同,因為它們是基於單個樣本而不是整個總體得到的。如果你取不同的樣本,你將得到不同的 的值。我們稱 的 OLS 估計量。計量經濟學的主要目標之一是分析這些估計量的質量,並觀察在什麼條件下這些是好的估計量,以及在什麼條件下它們不是好的估計量。

一旦我們有了 ,我們可以構建另外兩個變數。第一個是擬合值,或者說對 *y* 的估計

第二個是誤差項的估計,我們將稱之為 **殘差**

這兩個變數將在後面起到重要作用。

華夏公益教科書