跳至內容

計量經濟學理論/經典正態線性迴歸模型 (CNLRM)

來自華夏公益教科書

計量經濟學研究的是因果關係。經濟學充滿了關於一件事如何導致另一件事的理論:價格上漲會導致需求下降,更好的教育會導致人們變得更富有,等等。因此,為了能夠檢驗這些理論,經濟學家會找到資料(例如,商品的價格和數量,或人口的教育水平和財富水平的資料)。但是,當這些資料被放在圖表上時,它們很少形成出現在入門經濟學教科書中的整齊的線條。

這是老忠實間歇泉噴發之間的等待時間與噴發持續時間之間的關係圖,但也可能是一張毛衣銷售供應線的圖表

資料總是看起來像一團雲,如果不使用恰當的技術,就無法確定這團雲是否提供了任何有用的資訊。計量經濟學是一種使用收集到的資料點建立相關性,並有望在將來建立因果關係的工具。我們透過從資料中建立 **解釋函式** 來實現這一點。該函式是一個線性模型,它是透過 *最小化* 資料到直線的平方距離來估計的。該距離被認為是 *誤差項*。這就是 **線性迴歸** 的過程。

計量經濟學的目的是建立兩個變數之間的相關性,並有希望建立因果關係。最簡單的方法是畫一條線。直線的斜率將表明“如果我們將 x 增加這麼多,那麼 y 將增加這麼多”,並且我們有一個截距,它告訴我們在 x = 0 時 y 的值。

直線的方程式是 y = a + b*x(注意:a 和 b 有不同的書寫形式,例如 alpha 和 beta,或 beta(0) beta(1),但它們始終表示“截距”和“斜率”)。

問題在於開發一條適合我們資料的直線。由於我們的資料是分散的並且是非線性的,因此這條簡單的直線不可能穿過每個資料點。因此,我們設定了一條直線,使其使誤差最小化(實際上我們需要最小化平方誤差)。我們調整第一條直線或 *解釋函式*,使其包含一個誤差項,這樣,給定 x 和誤差項,我們可以正確地得出正確的 y。

y = a + b*x + 誤差

基本示例

[編輯 | 編輯原始碼]

在我們把研究經費都花在度假之後,我們被大學施壓,要求我們找到關於明尼蘇達州毛衣行業走勢的一些答案。我們沒有太多時間,所以我們只收集了明尼蘇達州兩家不同服裝店在兩天內的資料。幸運的是,我們從夏季的一天和冬季的一天獲得了資料。我們要求兩家商店告訴我們他們賣出了多少件毛衣,他們告訴了我們真相。我們想看看天氣(溫度——自變數)如何影響毛衣的銷量(因變數)。

我們得到了以下散點圖。

現在我們可以新增一條線(一個函式)來告訴我們這兩個變數之間的關係。我們將最小化誤差的總和,然後看看我們得到了什麼。從冷側到直線的距離是 +15,從熱側到直線的距離是 -15。當我們把它們加在一起時,我們得到 15 - 15 = 0。0 誤差,我們的直線一定很完美!

請注意,我們的直線很好地擬合了資料。資料和函式之間的差異均勻分佈()。因此,溫度和毛衣銷售之間存在關係。“炎熱天氣增加了毛衣銷售”將是我們那篇著名論文的標題!但它會是錯誤的,我們很可能會被大學解僱。

如果我們只最小化了直線和資料之間的絕對距離!好吧,這是一個帶有估計直線的圖表,它就是這麼做的。為此,我們最小化 *平方* 誤差的總和。

一旦我們最小化了直線和資料之間的絕對距離,我們就得到了更好的擬合,我們可以宣稱“寒冷天氣增加了毛衣銷售”()

基本雙變數模型

[編輯 | 編輯原始碼]

我們的基本模型是一條最適合資料的直線。

其中 ,α 和 β 是必須估計的未知引數。 是不可觀測的誤差項。該項是一個 iid 隨機變數。**迴歸係數**。

關於符號的說明:

符號 含義
Y 因變數
X 自變數(s)
α,β 迴歸係數
ε,u 誤差或擾動項
^ 帽子:估計

誤差項的性質

[編輯 | 編輯原始碼]

誤差項,也稱為 **擾動項**,是不可觀測的隨機分量,它解釋了 之間的差異。該項是四種不同效應的組合。

1. *遺漏變數:* 在許多情況下,很難解釋系統中的所有變異性。寒冷天氣增加了毛衣的銷量,但取暖油的價格也可能產生影響。這在我們最初的模型中沒有考慮,但可以在我們的誤差項中解釋。

2. 非線性:實際關係可能並非線性,但我們只有線性建模系統。在30度時,有10人購買毛衣;在20度時,有40人購買毛衣;在10度時,有80人購買毛衣。在我們的模型中,誤差項並未考慮這種非線性。

3. 測量誤差:有時資料收集並不完全準確。商店告訴我們那天有10人購買毛衣,但與他們交談後,發現還有4人購買了毛衣。關係仍然存在,但在誤差項中收集了一些誤差。

4. 不可預測的影響:無論經濟模型的制定多麼完善,總會出現某種隨機性影響它。這些影響將由誤差項來解釋。

再次看一下我們毛衣故事中的OLS線,我們可以看看我們的誤差項。誤差是指我們的資料Y和我們的估計值Ŷ之間的距離。我們由此得到一個方程:

下一頁>

華夏公益教科書