跳轉到內容

統計學基礎/自由度

來自華夏公益教科書,開放的書籍,開放的世界

自由度

[編輯 | 編輯原始碼]

這是一個介紹自由度(df)概念的好時機。這個概念可能會引起一些焦慮,但在實際情況下,好的統計軟體會為您計算自由度,所以沒有必要擔心。

讓我們考慮一個例子:為了計算方差,我首先將平方偏差從均值加起來。均值是一個引數:它是所考察變數的整體特徵,是描述總體值分佈的一部分。如果您知道所有引數,就可以準確地描述資料。您知道的引數越多,也就是說您固定的引數越多,符合這種資料模型的樣本就越少。如果您只知道均值,那麼將會有很多可能的資料集與這種模型一致;但是,如果您知道均值和標準差,那麼符合這種模型的可能資料集就會更少。

所以在計算方差時,我首先要計算均值。當我計算出均值後,我就可以改變資料中的任何分數,除了一個。如果我保留一個分數不檢查,它就可以始終根據其餘資料和均值本身準確計算出來。也許一個例子可以更清楚地說明這一點。

我取一班學生的年齡,然後找出均值。如果我固定均值,那麼其他分數中還有多少個分數(總共有N個分數,請記住)可以變化?答案是N-1。有 N-1 個獨立的資訊可以變化,而均值是已知的。這些就是自由度。一個資訊不能變化,因為它的值完全由引數(在本例中為均值)和其他分數決定。在我們的計算過程中固定的每個引數都會導致失去一個自由度。

如果我們想象從少量資料點開始,然後在計算某些統計資料時固定相對較多的引數,我們就會發現,隨著更多自由度的丟失,我們的模型所解釋的情況就越來越少,因為越來越少的資訊可以原則上與實際觀察到的不同。

所以,通俗地說,我們對資料的興趣是由自由度決定的:如果一旦我們的引數被固定,就沒有任何東西可以變化(因為我們的資料點非常少,也許只有一個),那麼就沒有什麼可以調查的。自由度可以看作是將樣本量與解釋力聯絡起來。


1 簡介

2 統計量

3 引數方法和非引數方法

4 描述性統計

5 推斷統計:假設檢驗

6 自由度

7 顯著性

8 關聯

9 比較組或變數

10 迴歸

華夏公益教科書