跳轉到內容

統計學/點估計

來自 Wikibooks,開放世界中的開放書籍

通常,來自隨機實驗的隨機變數假設服從某個具有未知(但固定)引數(向量)[1] [2] 是一個正整數,其值取決於分佈)的分佈,取值範圍為集合 ,稱為引數空間。

備註。

  • 頻率統計學(此處討論的上下文)中,引數被視為固定的。
  • 另一方面,在貝葉斯統計學的上下文中,引數被視為隨機變數

例如,假設隨機變數被假設服從正態分佈。那麼,在這種情況下,引數向量是未知的,引數空間。通常,透過某些方法估計這些未知引數來“理解”隨機變數更有幫助。我們希望確保估計足夠[3],以便理解更準確。

直觀地說,隨機樣本的(實現)應該是有用的。實際上,本章介紹的估計量在某種意義上都是基於隨機樣本的,這就是點估計的含義。更準確地說,讓我們定義點估計點估計值

定義。(點估計)點估計是一個使用統計量的值來給出未知引數的單一值估計(可以理解為一個)的過程。

備註。

  • 回想一下,統計量是隨機樣本的函式。
  • 我們將未知引數稱為總體引數(因為與引數相對應的基礎分佈稱為總體)。
  • 統計量稱為點估計量,其實現值稱為點估計值
  • 點估計量的符號通常帶有
  • 估計將與區間估計形成對比,區間估計使用統計量的值來估計未知引數的區間可能值。

示例. 假設 是從正態分佈 中抽取的 個隨機樣本。

  • 我們可以使用 統計量 來直觀地估計 被稱為 點估計量,其實現值 被稱為 點估計
  • 或者,我們可以簡單地使用統計量 (儘管它不涉及 ,但它仍然可以被視為 的函式)來估計 。也就是說,我們使用正態分佈的第一個隨機樣本的值作為該分佈均值的點估計!直觀地說,這種估計量似乎“很糟糕”。
  • 這種僅直接取一個隨機樣本的估計量稱為 單觀測估計量
  • 我們稍後將討論如何評估點估計量的“好壞”。

接下來,我們將介紹兩個著名的點估計量,它們實際上“很好”,即 最大似然估計量矩估計量

最大似然估計量 (MLE)

[編輯 | 編輯原始碼]

顧名思義,這種估計量是 最大化某種“似然性”的估計量。現在,我們想知道為了以“良好”的方式估計未知引數(複數),應該最大化什麼樣的“似然性”。此外,如引言部分所述,估計量在某種意義上是基於隨機樣本的。因此,這種“似然性”也應該在某種意義上基於隨機樣本。

為了激發最大似然估計量的定義,請考慮以下示例。

示例. 在一個隨機實驗中,一枚(公平或不公平)硬幣被拋擲一次。設隨機變數 如果出現正面,則為 否則。那麼, 的機率質量函式為 ,其中未知引數 表示出現正面的機率,並且

現在,假設你得到一個隨機樣本,透過拋擲硬幣次獨立試驗(這種隨機樣本稱為獨立隨機樣本,因為所涉及的隨機變數是獨立的),對應的實現值為。那麼,對於,即隨機樣本恰好具有這些實現值的機率為

備註。

  • 關於符號的說明:你可能會注意到在的機率質量函式中有一個額外的""。這種符號表示機率質量函式是引數值為的”。它被包含在內是為了強調我們所指的引數值。
  • 一般來說,我們用表示引數值為可以是向量)的機率質量函式/機率密度函式。

  • 對於相同的含義,存在一些備選的記號:
  • 類似地,我們也有類似的記號,例如 ,表示事件發生的機率,引數值為。(通常使用第一個記號:。)
  • 對於均值、方差、協方差等,我們也有類似的記號,例如

直觀地,對於這些特定的實現(固定的),我們希望找到一個的值,使該機率最大化,即使獲得的實現成為“最有可能”或“似然最大”的實現。現在,讓我們正式定義與最大似然估計相關的術語。

定義。(似然函式)設 是一個具有聯合機率質量函式(pmf)或機率密度函式(pdf) 的隨機樣本,引數(向量) 是引數空間)。假設 是隨機樣本 的對應實現。那麼,似然函式,記為,是函式 是一個變數, 是固定的)。

備註。

  • 為了簡便,我們可以使用符號 代替。有時,為了方便起見,我們也可能只寫“”。

  • 當我們將替換為時,得到的“似然函式”就變成了一個隨機變數,我們用表示它。
  • 似然函式與聯合機率質量函式或機率密度函式本身形成對比,在聯合機率質量函式或機率密度函式中,是固定的,而是變數。
  • 當隨機樣本來自離散分佈時,似然函式的值就是引數向量下機率。也就是說,獲得這個特定實現的精確機率。
  • 當隨機樣本來自連續分佈時,似然函式的值不是機率。相反,它只是聯合機率密度函式在處的取值(可能大於1)。但是,該值仍然可以用來“反映”獲得“非常接近”這個特定實現的機率,其中機率可以透過對周圍“非常小”區域內的聯合機率密度函式進行積分來獲得。
  • 似然函式的自然對數,(或有時為),稱為對數似然函式
  • 請注意,似然函式的“表示式”實際上與聯合機率密度函式的表示式相同,只是輸入不同。因此,人們仍然可以對似然函式關於進行積分/求和(在某種意義上,在這種情況下,將似然函式轉換為聯合機率密度函式/機率質量函式),就像它是聯合機率密度函式/機率質量函式一樣,以獲得機率。

定義.(最大似然估計)給定一個似然函式,引數最大似然估計 是一個值,在這個值處最大化

備註。

  • 最大似然估計量(MLE)是(透過將中的“”替換為“”而得到)。
  • 在其他一些地方,根據上下文,縮寫 MLE 也可能表示最大似然估計。但是,在這裡我們僅在討論最大似然估計量時使用縮寫 MLE。
  • 由於(自然對數函式的定義域是所有實數的集合),自然對數函式是嚴格單調遞增的,即輸入越大,輸出越大。因此,當我們找到一個值,使得最大化時,在相同的值處也最大化。

現在,讓我們找到之前拋硬幣示例中未知引數 的 MLE。

示例.(回顧激勵示例)回想一下,我們使用拋硬幣的例子來激發最大似然估計。服從伯努利分佈,其成功機率為的機率質量函式為是從該分佈中抽取的隨機樣本。

  • 似然函式聯合機率質量函式(pmf)。

  • 因此,對數似然函式

  • 為了找到對數似然函式的最大值,我們可以使用微積分中學習的導數檢驗。對 關於 求導,得到

  • 為了找到 的臨界點,我們令(我們有)。
  • 為了驗證 實際上在 處取得最大值(而不是最小值),我們需要進行導數檢驗。在本例中,我們使用一階導數檢驗。

  • 我們可以看到,當時,,這使得,因此。另一方面,當時,這使得,因此。結果,我們可以得出結論,處取得最大值。因此,的最大似然估計是(而不是,後者是最大似然估計值!)。
Clipboard

練習。 使用二階導數檢驗來驗證處取得最大值。

解答
  • 由於,其中分子為負,分母為正。因此,。根據二階導數檢驗,這意味著處取得最大值。


有時,在求解引數的最大似然估計時,會對引數施加約束。在這種情況下,引數的最大似然估計稱為受限最大似然估計。我們將在以下示例中說明這一點。

示例: 繼續前面拋硬幣的例子。假設對施加約束,其中。在這種情況下,求的最大似然估計。

解:關於推導似然函式和對數似然函式的步驟,在這種情況下是相同的。在沒有限制的情況下,的最大似然估計是。現在,在存在限制的情況下,的最大似然估計為,僅當時(我們始終有,因為)。

If (and thus ), even though is maximized at , we cannot set the MLE to be due to the restriction on : . Under this case, this means when (we have when from previous example), i.e., is strictly increasing when . Thus, is maximized when with the restriction. As a result, the MLE of is (the MLE can be a constant, which can still be regarded as a function of ).

因此, 的最大似然估計可以寫成一個分段函式:,或者可以寫成

Clipboard

練習。 時,求 的最大似然估計。

解答
  • 時,由於存在限制,我們不能將最大似然估計設定為。在這種情況下,我們知道當 時,,即當 時, 嚴格遞減。因此, 處取得最大值,因此 的最大似然估計為

  • 時,我們可以將最大似然估計設定為,此時 最大化,因此 是在這種情況下 的最大似然估計。
  • 因此, 的最大似然估計是


為了找到最大似然估計,我們有時會使用導數檢驗以外的方法,並且不需要找到對數似然函式。讓我們在下面的例子中說明這一點。

示例: 是來自均勻分佈 的一個隨機樣本。求 的最大似然估計。

解: 均勻分佈的機率密度函式為。因此,似然函式為

為了使達到最大值,首先,我們需要確保對於每個,都有,這樣似然函式中指示函式的乘積才不為零(在這種情況下,值實際上為1)。除此之外,由於的嚴格遞減函式(因為(我們有)),我們應該選擇一個儘可能小的,使得,因此,儘可能大。

因此,我們應該選擇一個儘可能小的,前提條件是對於每個,都有,這意味著(無論如何選擇,總是成立)。由此可知,當的最大值時,達到最大值。因此,的最大似然估計是

Clipboard

練習。證明如果均勻分佈變為,則的最大似然估計不存在。

解答

Proof. In this case, the constraint from the indicator functions become for each . With similar argument, for the MLE of , we should choose a that is as small as possible subject to this constraint, which means for each . However, in this case, we cannot set to be the maximum of , or else the constraint will not be satisfied and the likelihood function becomes zero due to the indicator function. Instead, we should set to be slightly greater than the maximum of , so that the constraint can still be satisifed, and is quite small. However, for each such , we can always chooses a smaller that still satisfies the constraint. For example, for each , the smaller beta, can be selected as [4]. Hence, we cannot find a minimum value of subject to this constraint. Thus, there is no maximum point for , and hence the MLE does not exist.



在下面的例子中,我們將找到引數向量的最大似然估計。

例。 為來自均值為 ,方差為 的正態分佈的隨機樣本,。求 的最大似然估計。

:令 。似然函式為 ,因此對數似然函式為 。由於該函式是多元函式,我們可以使用多元微積分中的二階偏導數檢驗來尋找最大值點。但是,在本例中,我們實際上不需要使用這種檢驗。相反,我們可以逐個固定變數,使函式成為一元函式,這樣我們就可以使用一元函式的導數檢驗來尋找最大值點(在另一個變數固定的情況下)。

由於

此外,,它與 無關(這對我們使用這種方法很重要)並且

由於,根據一元函式的二階導數檢驗, 處取得最大值,在任意固定的 的情況下。

另一方面,由於,因此(因為 )。

因此,根據二階導數檢驗, 處取得最大值,在任何給定的固定 下。

因此,現在我們固定,因此我們有 處取得最大值,其中 是樣本方差 的取值。現在,固定,並且我們知道 處取得最大值,對於每個固定的 都是如此,包括這個固定的。結果, 處取得最大值。因此, 的最大似然估計是

Clipboard

練習。

(a) 計算 處的 Hessian 矩陣的行列式,可以表示為

(b) 因此,使用二階偏導數檢驗驗證 的最大值點。


解答

(a) 首先,

因此,Hessian矩陣的行列式為

(b) 從(a)可知,Hessian矩陣的行列式為正。此外,。因此,根據二階偏導數檢驗,處取得最大值。


Clipboard

練習。為來自速率引數為的指數分佈的隨機樣本,其機率密度函式為,其中。證明的最大似然估計為

解答

證明。 似然函式為 。因此,對數似然函式為 。對對數似然函式關於 求導得到 。令導數等於零,得到 。還需要驗證 處取得最大值。由於 ,這一點得到了驗證。因此, 的最大似然估計為


示例。(最大似然估計的應用)假設你有一個盒子,裡面有四個球,紅色和黑色球的數量未知。現在,你從盒子裡抽取三個球,發現你得到了兩個紅球和一個黑球。使用最大似然估計,估計盒子裡紅球和黑球的數量。

:根據抽取的球的顏色,我們知道盒子裡至少有兩個紅球和至少一個黑球。這意味著盒子中要麼有兩個紅球,要麼有三個紅球。設 為盒子裡紅球的數量。那麼,盒子裡黑球的數量為。引數 的可能取值為 2 和 3。

現在,我們比較當 時,從盒子裡抽取三個球得到這種結果的機率。

  • 對於,機率為(考慮超幾何分佈的機率質量函式)。
  • 對於,機率為

因此, 的最大似然估計值為 3。因此,估計的紅球數量為 3,黑球數量為 1。

Clipboard

練習。假設盒子現在包含 100 個球,紅球和黑球的數量未知。現在,你從盒子裡抽出 99 個球,發現你得到了 98 個紅球和 1 個黑球。使用最大似然估計,估計盒子裡紅球和黑球的數量。

解答

類似地,盒子中至少有 98 個紅球和 1 個黑球。我們使用與上述示例相同的符號。那麼,黑球的數量為,引數 的可能取值為 98 和 99。

  • 對於,機率為
  • 對於,機率為

因此,的最大似然估計值為99。因此,紅球的估計數量為99,黑球的估計數量為1。

備註。

  • 在這種情況下,兩個可能值的機率差異變得更大。
  • 直觀地講,當你得到這樣的抽取結果時,你會認為盒子裡面不太可能有兩個黑球,也就是說,沒有抽到的球實際上是黑色的,並且你以某種方式抽出了所有的紅球,但沒有抽到黑球。




矩估計法 (MME)

[編輯 | 編輯原始碼]

對於最大似然估計,我們需要利用似然函式,該函式來自分佈中隨機樣本的聯合機率質量函式或機率密度函式。然而,在實踐中我們可能並不知道分佈的機率質量函式或機率密度函式的確切形式。相反,我們可能只知道關於分佈的一些資訊,例如均值、方差和一些矩(階隨機變數的矩為,為了簡單起見,我們將其表示為)。這些矩通常包含關於未知引數的資訊。例如,對於正態分佈,我們知道。因此,當我們想要估計引數時,可以透過估計矩來實現。

現在,我們想知道如何估計矩。我們令樣本矩[5],其中是獨立同分布的。根據大數定律(假設條件滿足),我們有

  • (這可以透過在大數定律中將“”替換為“”來觀察,那麼條件仍然滿足,因此我們仍然可以應用大數定律)

通常情況下,我們有,因為在弱大數定律中用替換後,條件仍然滿足。

基於這些結果,我們可以使用第個樣本矩來估計第階矩,當很大時,這種估計會“更好”。例如,在上面正態分佈的例子中,我們可以用估計,用估計,這些估計量實際上被稱為矩估計法

更準確地說,我們給出矩估計法的定義如下:

定義。(矩估計法)設 是來自具有機率密度函式或機率質量函式 的分佈的一個隨機樣本。將 個矩,例如 ,分別寫成 的函式:。那麼,矩估計量(MME),分別為 ,由以下方程組(以 關於 的形式給出,對應於 個矩 的解給出)得到以下方程組:

備註。

  • 當存在個未知引數時,我們需要解一個包含個方程的方程組,其中涉及個樣本矩。
  • 通常,我們根據定義選擇前個矩作為這個矩。但這並非必要,我們可以選擇其他的矩,包括分數階矩(例如,在這種情況下我們使用)。
  • 因此,矩估計法唯一。

示例。是從正態分佈中抽取的隨機樣本。求的矩估計。

解法:首先,有兩個未知引數。因此,我們需要求解一個包含2個樣本矩和2個矩的2元方程組。由於,考慮以下方程組: 代入 ,得到 。因此, 的矩估計為 的矩估計為

備註。

  • 我們可以看到,求 的矩估計的過程比求 的最大似然估計要容易得多。這是因為在這種情況下,一階矩和二階矩關於引數的表示式很簡單。但是,當表示式更復雜時,求引數的矩估計可能會變得相當複雜。

例。 為來自速率引數為 的指數分佈的隨機樣本。求 的矩估計 (MME),並將其與 的最大似然估計 (MLE) 進行比較。

: 由於 ,考慮以下方程:。然後我們有 。因此, 的矩估計為 ,這與 的最大似然估計相同。

Clipboard

練習。 為來自均勻分佈 的隨機樣本。證明 的矩估計分別為

解答

Proof. Since and , consider the following system of equations: From , we have . Substituting it into , we have Solving this equation by quadratic formula, we get .

。然而,根據均勻分佈的定義,我們需要有,因此這種情況被拒絕。

,滿足均勻分佈的定義。

因此,我們得到了期望的結果。


估計量的性質

[編輯 | 編輯原始碼]

在本節中,我們將介紹一些用於評估點估計量“好壞”的標準,即無偏性有效性一致性

無偏性

[編輯 | 編輯原始碼]

對於成為引數的“良好”估計量,的一個理想特性是其期望值等於引數的值,或者至少接近該值。正因為如此,我們引入了偏差這一概念,來衡量的均值與的接近程度。

定義。(偏差)估計量偏差

我們還將定義一些與偏差相關的術語。

定義. ((無)偏估計量) 估計量 是引數 的一個無偏估計量,如果 。否則,該估計量稱為有偏估計量

定義. (漸近無偏估計量) 估計量 是引數 的一個漸近無偏估計量,如果 ,其中 是樣本量。

備註。

  • 無偏估計量必須是漸近無偏估計量,但反之不成立,即漸近無偏估計量可能不是無偏估計量。因此,有偏估計量也可能是漸近無偏估計量。
  • 當我們根據無偏性討論估計量的優劣時,無偏估計量優於漸近無偏估計量,漸近無偏估計量優於有偏估計量。
  • 然而,除了無偏性之外,還有其他評估估計量優劣的標準,因此,當我們也考慮其他標準時,有偏估計量在總體上可能比無偏估計量“更好”。

示例. 為來自伯努利分佈的隨機樣本,其成功機率為 。證明 的最大似然估計 (MLE) 的無偏估計量。

證明. 由於 ,結果成立。

Clipboard

練習。 假設伯努利分佈被替換為具有次試驗和成功機率的二項分佈。證明的有偏估計量。修改該估計量,使其成為的無偏估計量。

解答

證明。 由於的有偏估計量。

我們可以將該估計量修改為,則其均值為。或者,我們可以選擇估計量為),其均值也是(其他均值為的估計量也是可以的)。


示例。 為來自正態分佈 的一個隨機樣本。證明 的最大似然估計量 的無偏估計量,以及 的最大似然估計量 的一個漸近無偏估計量。

證明。 首先,由於 的無偏估計量。

On the other hand, Thus, , as desired.

Clipboard

練習。 修改 的估計量,使其成為無偏估計量。

解答

該估計量可以修改為


我們已經討論瞭如何評估估計量的無偏性。現在,如果我們有兩個無偏估計量,,我們應該如何比較它們的好壞?如果我們只從無偏性的角度比較它們,那麼它們的好壞是相同的。因此,在這種情況下,我們需要另一個標準。一種可能的方法是比較它們的方差,方差較小的那個更好,因為平均而言,該估計量與其均值的偏差較小,而根據無偏估計量的定義,其均值就是未知引數的值,因此方差較小的那個在某種偏差意義上更準確。實際上,無偏估計量仍然可能具有較大的方差,從而與其均值產生很大的偏差。這樣的估計量是無偏的,因為正偏差和負偏差在某種程度上相互抵消。這就是效率的思想。

定義。(效率)假設 是未知引數 的兩個無偏估計量。 相對 效率。如果 ,那麼我們說相對更有效

備註。

  • 由於,具有較小方差的估計量相對於具有較大方差的估計量來說,效率更高。
  • 通常情況下,方差應該是非零的,因此在正常情況下應定義效率。
  • 有時,它也被稱為相對效率,因為效率描述了 等於“多少”個
  • 有人可能會問,為什麼我們在定義中使用方差的比值來比較方差,而不是使用方差的差值。一個可能的原因是,方差的比值沒有任何單位(如果存在,方差的單位相互抵消),但方差的差值可能會有單位。此外,使用方差的比值允許我們對從不同方差計算出的不同效率進行數值比較

實際上,對於無偏估計量的方差,由於無偏估計量的均值是未知引數,它衡量了與偏差的平方值的均值,並且我們對此偏差有一個特定的術語,即均方誤差 (MSE)。

定義。(均方誤差)假設 是引數 的一個估計量。均方誤差 (MSE) 為

備註。

  • 根據此定義,誤差平方均值,因此得名均方誤差

注意,在 MSE 的定義中,我們沒有規定 必須是無偏估計量。因此,定義中的 可能是存在偏差的。我們已經提到,當 是無偏的時,它的方差實際上就是它的 MSE。在下文中,我們將給出 之間更一般的關係,而不僅僅是針對無偏估計量。

命題. (均方誤差與方差之間的關係)如果 存在,則

Proof. By definition, we have and . From these, we are motivated to write as desired.

示例.)是從 中抽取的隨機樣本。

(a)證明單觀測估計量 的無偏估計量。

(b)分別計算 的 MSE。

(c)在無偏性和效率方面,哪個估計量 的更好估計量?

解答:

(a) 由於,因此結果成立。

(b) ,以及

(c) 由於 相對而言比 更有效。由於 都是 的無偏估計量,我們得出結論:就無偏性和有效性而言, 的一個更好的估計量。

Clipboard

練習。 除了示例中樣本量為 的隨機樣本外,假設我們再取一個樣本量為 的隨機樣本。令 分別表示樣本量為 的樣本的樣本均值。

(a) 計算

(b) 說明樣本量 滿足的條件,在此條件下, 相對於 更有效。


解答

(a) 由於 (來自示例),並且 (透過與示例中類似的論證),

(b) 由於 ,條件是

備註。

  • 這表明,樣本量更大的樣本均值相對於樣本量較小的樣本均值更有效。



命題。 當且僅當

證明。

  • “如果”部分很簡單。假設。那麼,
  • “僅當”部分:我們可以使用逆否證法,即證明如果 ,那麼
  • 情況 1:當時,這意味著,因為方差是非負的。此外,。由此可知,即 MSE 不等於零。

  • 案例 2:當 時,這意味著 。此外,。由此可得 ,即 MSE 不等於零。

備註。

  • 因此,如果我們知道 ,那麼我們就知道 ,即 是一個漸近無偏估計量(此外 )( 可能 是一個無偏估計量)。

一致最小方差無偏估計量

[編輯 | 編輯原始碼]

現在,我們知道無偏估計量的方差越小,其效率(和“更好”)就越高。因此,我們自然想知道什麼是有效的(即“最佳”)無偏估計量,即方差最小的無偏估計量。對於這種無偏估計量,我們有一個特定的名稱,即一致最小方差無偏估計量 (UMVUE) [6]。更準確地說,我們對 UMVUE 有以下定義

定義。(一致最小方差無偏估計量)一致最小方差無偏估計量 (UMVUE) 是在所有無偏估計量中具有最小方差的無偏估計量。

事實上,UMVUE 是唯一的,即在所有無偏估計量中,只有一個無偏估計量具有最小方差,我們將在下面證明這一點。

命題.(UMVUE 的唯一性)如果是引數的函式的UMVUE,則是唯一的。

證明.假設的UMVUE,並且的另一個UMVUE。定義估計量。由於的無偏估計量。

Now, we consider the variance of . Thus, we now have either or . If the former is true, then is not an UMVUE of by definition, since we can find another unbiased estimator, namely , with smaller variance than it. Hence, we must have the latter, i.e., This implies when we apply the covariance inequality, the equality holds, i.e., which means is increasing linearly with , i.e., we can write for some constants and .

現在,我們考慮協方差另一方面,由於協方差不等式中存在等號,並且(因為它們都是UMVUE),因此,我們有

接下來需要證明,以證明,從而得出結論唯一的

從上面,我們現在有,如預期的那樣。

備註。

  • 因此,當我們能夠找到一個UMVUE時,它就是唯一的,並且任何其他可能的無偏估計量的方差都嚴格大於UMVUE的方差。
克拉美-羅下界
[編輯 | 編輯原始碼]

在不使用一些結果的情況下,確定UMVUE是相當困難的,因為存在許多(甚至可能是無限多個)可能的無偏估計量,因此很難確保一個特定的無偏估計量相對於所有其他可能的無偏估計量更有效。

因此,我們將介紹一些有助於我們找到UMVUE的方法。對於第一種方法,我們找到所有可能的無偏估計量的方差的下界[7]。在獲得這樣的下界後,如果我們能找到一個方差正好等於下界的無偏估計量,那麼該下界就是方差的最小值,因此根據定義,這樣的無偏估計量就是UMVUE。

備註。

  • 存在許多可能的下界,但是當界限越大時,它就越接近方差的實際最小值,因此“更好”。
  • 即使無偏估計量的方差沒有達到下界,它仍然可以是UMVUE。

找到這樣的下界的一種常見方法是使用克拉美-羅下界(CRLB),並且我們透過克拉美-羅不等式得到CRLB。在陳述不等式之前,讓我們定義一些相關的術語。

定義。(費舍爾資訊)關於引數且樣本量為費舍爾資訊,其中是似然函式的對數(作為隨機變數)。

備註。

  • 稱為得分函式,記為
  • ”可能是也可能不是一個引數向量。如果它只是一個單個引數(通常情況下),那麼它與“”相同。我們使用“”而不是“”是為了強調中的“”指的是中的“”。
  • 可以定義“關於引數向量的費歇爾資訊”,但在這種情況下,費歇爾資訊採用矩陣的形式而不是單個數字,它被稱為費歇爾資訊矩陣。然而,由於它比較複雜,我們這裡不討論它。
  • 由於得分函式的期望值為

並且,在允許導數和積分交換的一些正則條件下,這等於 ,關於 的費雪資訊也是得分函式的方差,即

對於允許導數和積分交換的正則條件,它們包括

  1. 所涉及的偏導數應該存在,即所涉及函式的(自然對數)是可微的
  2. 所涉及的積分應該是可微的
  3. 支援域不依賴於所涉及的引數

我們有一些結果可以幫助我們計算費雪資訊。

命題. 為來自具有機率密度函式或機率質量函式 的分佈的隨機樣本。此外,令 ,為樣本量為一的關於 的Fisher資訊。然後,在允許導數和積分交換的一些正則性條件下,

證明。

命題。 在允許導數和積分交換的一些正則條件下,

Proof. Now, it suffices to prove that , which is true since

備註。

  • 這個命題非常有用,因為在對 進行偏微分後,許多 很可能會消失,從而使期望值的計算變得更容易。

定理. (克拉美-拉奧不等式) 令 為來自某個分佈的隨機樣本,並令 的一個函式)的無偏估計量。然後,在允許交換導數和積分的一些正則性條件下,

Proof. Since is an unbiased estimator of , we have by definition . By definition of expectation, we have where is the likelihood function. Thus, Consider the covariance inequality: . We have ( by remark about Fisher information)

備註。

  • 稱為 克拉美-拉奧下界 (CRLB)。
  • 時,這意味著 的無偏估計量,因為 ,CRLB 變為

示例. 為來自正態分佈 的隨機樣本。證明 的最大似然估計量 的一致最小方差無偏估計量 (UMVUE)。

證明。 首先,我們可以看到在這種情況下滿足正則條件。因此,我們可以考慮的CRLB,如下所示。由於 我們有 因此,的CRLB為

另一方面, 的方差是 (這在前面的例子中已經展示過),它等於 的 CRLB。由此可知, 的一個 UMVUE。

Clipboard

練習。 一名學生聲稱 的另一個 UMVUE,因為 ,也等於 的 CRLB。這個說法正確嗎?為什麼?

解答

回想一下,UMVUE 是一個無偏估計量

這個說法是錯誤的,因為 通常不是一個無偏估計量。這是因為 ,除非 。但如果 ,那麼這個估計量就簡化為 ,這與 完全相同。因此,在這種情況下,該估計量不是另一個 UMVUE。


有時,我們無法使用 CRLB 方法來尋找 UMVUE,因為

  • 正則條件可能不滿足,因此我們無法使用克拉美-拉奧不等式,以及
  • 無偏估計量的方差可能不等於 CRLB,但我們不能由此得出它不是 UMVUE 的結論,因為 CRLB 可能根本無法達到,並且所有無偏估計量中最小的方差實際上是該估計量的方差,它大於 CRLB。

我們將在下面舉例說明這兩種情況。

示例。 為來自均勻分佈 的一個隨機樣本。如果我們想要找到 的UMVUE,我們不能使用Cramer-Rao不等式來找到它,因為支援 取決於引數

示例。 為來自正態分佈 的一個隨機樣本。已知在這種情況下,,其中 是具有 自由度的卡方分佈,其方差為。計算,以及 的CRLB。

:根據給定資訊,我們有 因此,

另一方面,由於 的 CRLB 為

備註。

  • 的無偏估計量,因為

  • 我們可以觀察到大於CRLB。但這是否意味著不是的UMVUE?我們不知道,因為我們不確定是否存在另一個無偏估計量,其方差小於,並且CRLB可能無法達到。

由於CRLB有時可以達到,有時無法達到,因此很自然地會提出這樣的問題:何時可以達到CRLB。換句話說,我們想知道CRLB的可達條件,這些條件在以下推論中給出。

推論.(CRLB的可達條件)令是從某個分佈中抽取的隨機樣本,並令的無偏估計量。假設Cramer-Rao不等式的正則條件滿足。則CRLB可以達到,即存在某個使得,當且僅當,其中是得分函式,而是一個常數。

Proof. Considering the proof for Cramer-Rao inequality, we have We can write as (by result about covariance). Also, (by result about variance). Thus, we have where is the correlation coefficient between two random variables. This means increases or decreases linearly with , i.e., for some constants . Now, it suffices to show that the constant is actually zero.

我們知道(因為 的無偏估計量),並且(來自關於Fisher資訊的備註)。因此,在兩邊應用期望得到 然後,結果就出來了。

備註。

  • 考慮到證明,我們知道,如果滿足這樣的可達條件,則無偏估計量 的方差等於 的CRLB,即該估計量是 的UMVUE。

示例。 我們已經證明,來自正態分佈 的隨機樣本 的對數似然函式是。證明 的CRLB 使用CRLB的可達條件是可達的。

證明。 分數函式為 由於我們有 (它是 的無偏估計量),CRLB 的可達條件得到滿足(在這種情況下,常數“" 為 ),因此 的 CRLB 是可達的。


備註。

  • 事實上,在證明之前,我們就知道 的 CRLB 是可達的,因為我們已經找到了 的一個無偏估計量,即 ,其方差正好等於之前得到的 CRLB。

示例。 延續前面的例子。證明 的 CRLB **不能** 使用 CRLB 的可達條件得到。

證明。 在這種情況下,得分函式為 取常數 ,則達到CRLB的無偏估計量 的一個潛在候選者為 。然而,我們注意到 是不可計算的,因為 是未知的。因此,不存在某個 使得 ,其中 是某個常數,並且


備註。

  • 即使我們知道的CRLB不可達,我們仍然不知道是否為UMVUE,因為可能存在一些具有更小方差(但未達到CRLB)的無偏估計量。

我們之前討論過MLE,MLE實際上是漸近的(即,當樣本量)“最佳選擇”,根據以下定理。

定理。假設是來自某個分佈的未知引數的MLE。那麼,在某些正則條件下,當時,

Proof. Partial proof: we consider the Taylor series of order 2 for , and we will get where is between and . Since is the MLE of , from the derivative test, we know that (we apply regularity condition to ensure the existence of this derivative). Hence, we have Since by central limit theorem, Furthermore, we apply the weak law of large number to show that It can be shown in a quite complicated way (and using regularity conditions) that Considering and , using property of convergence in probability, we have Considering and , and using Slutsky's theorem, we have where , and hence . It follows that This means and thus as desired.

備註。

  • 等價地,我們可以寫成。因此,的MLE的方差漸近地達到的CRLB。這意味著的MLE漸近地是的UMVUE。
  • 正則條件基本上類似於Cramer-Rao不等式中提到的正則條件。

由於在某些情況下我們無法使用CRLB來找到UMVUE,因此我們將在下面介紹另一種找到UMVUE的方法,該方法使用充分性完備性的概念。

充分性
[編輯 | 編輯原始碼]

直觀地講,一個充分統計量 ,它是給定隨機樣本的函式,包含了估計未知引數(向量)所需的所有資訊。因此,統計量 本身對於估計未知引數(向量) 是“充分”的。

正式地,我們可以如下定義和描述充分統計量

定義.(充分統計量)統計量 是未知引數(向量) 的一個充分統計量,如果隨機樣本條件分佈 給定 依賴於

備註。

  • 該定義可以表示為

其中 的聯合機率密度函式或機率質量函式。
  • 該等式意味著 給定(的)值的聯合條件機率質量函式或機率密度函式與 給定(的)值,以及引數值 的聯合條件機率質量函式或機率密度函式相同。

  • 這意味著即使提供了引數值,機率質量函式 (pmf) 或機率密度函式 (pdf) 也不會發生變化,這反過來意味著給定的值,的聯合條件 pmf 或 pdf 實際上並不依賴於
  • 指的是 在實現之前,它是一個隨機變數(隨機性來自)。
  • 在實現之後,該等式仍然成立(修改為)。

示例。考慮來自的隨機樣本。可以證明的充分統計量,但不是的充分統計量。

這可以透過應用定義來證明。但是,我們稍後將提供一種替代且通常更方便的方法來檢查統計量的充分性,並找到充分統計量。我們將在本文中非正式地解釋為什麼它是正確的。

  • 包含了分佈集中趨勢的資訊,這應該是估計均值所需的資訊。因此,它是的充分統計量。
  • 然而,不包含分佈離散程度的資訊(它只說明瞭“中心位置”,但對於特定的中心位置,離散程度可能大不相同),這應該是估計方差所需的資訊。因此,它不是的充分統計量。

備註。

  • 由此,我們也可以預期充分統計量不是唯一的,因為例如也應該包含集中趨勢的資訊(因為我們可以將其除以2得到的值,從而獲得資訊)。
  • 事實上,一般來說,給定的充分統計量,則也是的充分統計量,前提是是一個雙射函式(也稱為可逆函式、一一對應或雙射),以便其逆函式存在。

我們將在下面正式陳述上述關於充分統計量變換的說明。

命題。是未知引數(向量)的充分統計量。則,也是的充分統計量,對於每個雙射函式

現在,我們討論一個定理,它可以幫助我們檢查統計量的充分性,即(Fisher-Neyman)因子分解定理

定理.(因子分解定理)設 是隨機樣本 的聯合機率密度函式或機率質量函式。統計量充分統計量 當且僅當存在函式 使得 其中透過 依賴於,並且 依賴於

證明。 由於連續情況下的證明相當複雜,我們只給出離散情況下的證明。為簡化表達,令 , , , 以及 ,因此根據這些可以得到不同型別的機率質量函式的符號。根據定義,。此外,我們有 。因此,我們可以寫成

“僅當” () 方向:假設 是充分統計量。然後,我們選擇 ,根據充分統計量的定義,它不依賴於 。現在需要驗證對於這個選擇,方程是否成立。

因此,

"if" () direction: Assume we can write . Then, Now, we aim to show that does not depend on , which means is a sufficient statistic for . We have which does not depend on , as desired.

備註。

  • 也可能是一個常數,顯然不依賴於

示例. 考慮來自 的一個隨機樣本 。找到 的充分統計量。

Solution: The joint pdf of is Notice that the function depends on only through , so we can conclude that .

備註。

  • 我們也可以將 寫成 的充分統計量。
  • 直觀地說,這是因為後者也包含相同的統計量,因此包含相同的資訊。

  • 或者,我們可以將函式定義為,這是一個雙射函式,因此也是的充分統計量。
  • 我們需要從中分離出,因為對於函式,它不能依賴於。因此,我們不能在函式的定義中包含
  • 在這種情況下,定義函式的方法有很多。


對於一些“良好”的分佈,它們屬於指數族,可以使用另一種替代方法更容易且更方便地找到充分統計量。這種方法之所以有效,是因為這些分佈的pdf或pmf具有“良好”的形式,其特徵如下

定義。(指數族分佈)隨機變數的分佈屬於指數族分佈,如果的機率密度函式或機率質量函式具有以下形式: 其中,對於某些函式)。

備註。

  • 的值取決於未知引數的數量。
  • 請注意,可以為1,在這種情況下,“”只是一個單一引數。
  • 指數族分佈包含許多常見的分佈,例如正態分佈、指數分佈、伽馬分佈、卡方分佈、貝塔分佈、伯努利分佈、泊松分佈、幾何分佈等。
  • 然而,一些常見的分佈不屬於指數族分佈,例如學生t分佈、F分佈、柯西分佈和超幾何分佈。

示例。 正態分佈屬於指數族,其中 (因此在這種情況下“”為 2),因為它的機率密度函式可以表示為

定理.(指數族的充分統計量)設 是來自指數族分佈的一個隨機樣本,其機率密度函式或機率質量函式為 ,其中 。那麼, 的一個充分統計量

Proof. Since the distribution belongs to the exponential family, the joint pdf or pmf of can be expressed as From here, for applying the factorization theorem, we can identify the purple part of the function as "", and the red part of the function as "". We can notice that the red part of the function depends on only through . The result follows.

例. 考慮來自 的一個隨機樣本 。利用尋找指數族充分統計量的結果,證明 的充分統計量是

證明. 從前面的例子中,我們已經證明正態分佈屬於指數族,並且從那裡的表示式中,我們可以看出 的充分統計量是

由於,我們可以定義函式,可以證明這是一個雙射函式。

因此,也是的充分統計量。


現在,我們將開始討論充分統計量與UMVUE之間的關係。我們從Rao-Blackwell定理開始討論。

定理.(Rao-Blackwell 定理)設 的任意無偏估計量,而 充分統計量。定義。那麼, 的無偏估計量,並且

證明.假設 的任意無偏估計量,而 的充分統計量。

首先,我們證明 的無偏估計量。在證明無偏性之前,我們應該確保 實際上是一個估計量,即它是統計量,是隨機樣本的函式,並且需要獨立於 (以便它可以計算):由於 是隨機樣本的函式,並且 是充分統計量,這使得給定 的條件分佈 獨立。此外, 的函式,因此也是隨機樣本的函式。

現在,我們證明 的無偏估計量:由於 的無偏估計量。

接下來,我們證明:根據全方差定律,我們有 如所願。

備註。

  • 隨機變數 是透過首先找到,然後用 替換 得到的。這裡, 的實現。
  • 從Rao-Blackwell定理,我們知道 是比 更好的(或者至少是“相同質量”)效率意義上的估計量。請注意,該定理並沒有說明 是效率意義上的最佳估計量(即UMVUE)。相反,它只說明 在效率意義上更好
  • 應用一次該定理後, 可以作為“ 的任意無偏估計量”,我們可以再次應用此定理,依此類推。這意味著,在多次應用此定理之後,我們得到的“” 將是UMVUE。

  • 我們可以將這個過程理解為不斷“改進”無偏估計量,直到它成為最優的(在效率意義上),即它是一個UMVUE。
  • 由於UMVUE是唯一的,UMVUE必須是給定充分統計量的隨機變數的條件期望,它是一個的函式。
  • 因此,我們現在可以將UMVUE的候選範圍縮小到充分統計量的函式。

為了實際確定UMVUE,我們需要另一個定理,稱為萊曼-謝菲定理,它基於Rao-Blackwell定理,並且需要完備性的概念。

完備性
[編輯 | 編輯原始碼]

定義。(完備統計量)設是從具有引數(向量)的分佈中抽取的隨機樣本,該引數位於引數空間中。統計量是一個完備統計量,如果對於每個 意味著對於每個

當隨機樣本來自指數族中的分佈時,也可以很容易地找到完備統計量,類似於充分統計量的情況。

定理.(指數族的完備統計量)如果 是來自指數族分佈的一個隨機樣本,其中未知引數(向量),則 是一個完備統計量,前提是引數空間 中包含一個開集.

證明.略。

備註。

  • 開集開區間的推廣。實際上, 中的開集就是開區間
  • 直觀地說,開集指的是這樣的集合:對於集合中的每個點,該集合都包含所有足夠接近該點的點。
  • 例如, 中的一條直線(可以被解釋為一個集合)不是開集,因為對於直線上的每個點,直線不包含所有足夠接近該點的點(有一些“上方”和“下方”的點不包含在集合中)。
  • 同樣, 中的一個圓盤(平面中由圓包圍的區域)不是開集,因為對於圓盤上的每個點,圓盤不包含所有足夠接近該點的點(有一些“上方”和“下方”的點不包含在圓盤中)。
  • 根據前面關於指數族充分統計量的定理,我們知道 也是 的一個充分統計量,在滿足這些條件的情況下。
  • 當一個統計量對於引數(向量) 是充分的,並且也是一個完備統計量時,我們稱這樣的統計量為完備充分統計量

定理. (萊曼-謝菲定理) 如果 的一個完備充分統計量,並且,則唯一UMVUE(以機率1)。

證明. 假設 的一個完備充分統計量,並且

由於 的充分統計量,我們可以應用Rao-Blackwell定理。根據Rao-Blackwell定理,如果 的任意無偏估計量,則 是另一個無偏估計量,其中

為了證明 的唯一UMVUE,我們將證明無論選擇哪個 的無偏估計量,根據Rao-Blackwell定理(以機率1),我們都會得到相同。然後,對於所有可能的 的無偏估計量,都有(以機率1)[8],這意味著 是UMVUE,並且也是唯一的UMVUE,因為我們總是得到相同的 [9]

假設另一個 的無偏估計量()。根據Rao-Blackwell定理,存在一個無偏估計量),其中。由於 都是 的無偏估計量,對於每個,我們有。由於 是一個完備統計量,我們有,這意味著(機率為1),即在這種情況下,我們從Rao-Blackwell定理得到了相同的(機率為1)。

備註。

  • 該定理中的“”是的函式,我們從證明和Rao-Blackwell定理中知道,它實際上是,其中的任意無偏估計量。
  • 因此,當我們應用此定理時,只要我們能找到的一個函式(也許透過一些觀察),使得,我們就知道的唯一UMVUE。此外,由於UMVUE的唯一性,實際上是,其中的任意無偏估計量。

  • 在一些簡單的例子中,如上所述,我們可以透過一些觀察找到。然而,在更復雜的情況下, 的顯式形式可能並不直接明瞭,使得 。在這種情況下,我們需要找到 的無偏估計量,並計算 以得到 的顯式形式。

示例. 考慮來自 的一個隨機樣本。令未知引數向量為

(a) 證明 的充分統計量,即 ,也是一個完備統計量。

(b) 因此,證明 分別是 的UMVUE。

解答:

(a)

證明。 我們只需要證明引數空間中包含一個開集。這是正確的,因為引數空間如果我們使用笛卡爾座標系表示它,則是整個x軸上方的區域,因此包含一個開集。


(b)

證明。 因為(我們之前已經證明了這些),並且 分別是完備充分統計量(關於)和(關於)的函式,根據萊曼-謝菲定理,我們得到所需的結果。


備註。

  • 我們已經證明沒有達到的CRLB,並且的CRLB實際上是不可達到的。因此,我們之前無法確定是否是的UMVUE。現在,我們知道實際上是的UMVUE,這得益於Lehmann-Scheffé定理。

示例。考慮來自伯努利分佈的隨機樣本,其成功機率為,即,其機率質量函式為

(a) 找到的一個完備充分統計量

(b) 因此,找到的UMVUE。

(c) 證明的無偏估計量,並且的UMVUE。

解答

(a) 機率質量函式 (pmf) 。這意味著伯努利分佈屬於指數族。此外,引數空間 中包含一個開集。因此, 的完備充分統計量。

(b) 注意到 。因此,(它是 的函式)是 的UMVUE。

(c)

證明。 由於 的無偏估計量。

Now, we consider . We denote by . Then, this expectation becomes . In the following, we evaluate . Notice that follows the binomial distribution with trials with success probability , i.e., , and . Hence, Now, replacing by gives which is the UMVUE of , as desired.

Clipboard

練習。 我們能否使用 的CRLB找到 的UMVUE?如果可以,請用這種方法找到它。如果不行,請解釋原因。

解答

不可以。這是因為對數似然函式不可微(僅當 時才具有非零值),因此費舍爾資訊未定義。因此,CRLB 不存在。


Clipboard

練習。 考慮來自引數為 的泊松分佈的隨機樣本 ,其機率質量函式(pmf)為

(a) 求 的完備充分統計量。

(b) 求 的UMVUE。


解答

(a) 該機率質量函式為 因此,泊松分佈屬於指數族,並且 的完備充分統計量為

(b) 令 。由於 ,我們有 因此, 的UMVUE 為 (它是 的函式)。


一致性

[編輯 | 編輯原始碼]

在前面的章節中,我們討論了 無偏性有效性。在本節中,我們將討論另一個稱為 一致性 的性質。

定義。(一致估計量) 是未知引數 一致估計量,如果

備註。

  • 根據機率收斂的定義, 表示 時,對於每個

命題。如果 是未知引數 的(漸近)無偏估計量,並且 時,則 一致估計量

Proof. Assume is an (asymptotically) unbiased estimator of an unknown parameter and as . Since is an (asymptotically) unbiased estimator of , we have (this is true for both asymptotically unbiased estimator and unbiased estimator of ). In addition to this, we have by assumption that . By definition of mean squared error, these imply that . Thus, as , we have by Chebyshov's inequality (notice that exist from above), for each , Since probability is nonnegative (), and this probability is less than or equal to an expression that tends to be 0 as , we conclude that this probability tends to be zero as . That is, is a consistent estimator of .

備註。

  • 單獨的無偏性並不能蘊含一致性。

示例。 為來自 的一個隨機樣本。那麼, 的無偏估計量,因為。但是,存在一些 使得,即 對於某些。由於 無關,這意味著 對於某些,這是正確的。因此, 不是 的一致估計量。

Clipboard

練習。

(a) 提出 的一個一致估計量,並證明它實際上是 的一致估計量(提示:考慮大數弱定律)。

(b) 提出變異係數(或相對標準差)coefficient of variation 的一個一致估計量(假設 ,以便其定義),並證明它實際上是 的一致估計量。(提示:考慮大數弱定律和機率收斂的性質。您可以使用正態分佈具有有限四階矩這一事實。)

解答

(a) 的一致估計量。

證明。 根據大數弱定律(注意正態分佈的均值 和方差 是有限的),,如預期的那樣。


(b) 的一致估計量。

證明。 根據大數弱定律(方差有限,四階矩有限),。此外,根據連續對映定理,由於。因此,根據機率收斂的性質和樣本方差的結果,再次根據連續對映定理,(由於)。因此,根據機率收斂的性質(我們假設)再次,,如預期的那樣。




  1. 對於引數向量,它包含控制分佈的所有引數。
  2. 當我們不知道它是引數向量還是隻是一個引數時,我們將簡單地使用“”。如果我們知道它確實是一個引數向量,我們可以使用來代替。
  3. 我們將在#估計量的性質部分討論“好”的一些標準。
  4. . 因此,.
  5. 對於每個正整數 始終存在,不像
  6. “一致”表示與其他無偏估計量相比,方差最小,在引數空間 上(即,對於 的每個可能值)。也就是說,方差不僅對於 的特定值最小,而是對於 的所有可能值最小。
  7. 這與最小值不同。對於下界,它只需要小於所有相關的方差,並且可能不存在任何實際達到此下界的方差。但是,對於最小值,它必須是方差的值之一。
  8. 注意,這比 Rao-Blackwell 定理中的結果更強,後者僅說明 對於與 對應的 成立。
  9. 實際上,我們知道 UMVUE 根據之前的命題必須是唯一的。但是,在這個論證中,當我們證明 是 UMVUE 時,我們也自動證明了它是唯一的。
華夏公益教科書