機率/機率密度變換

PDF 版本 機率密度變換可用。 271 kb，14 頁 (資訊)

這本 Wikibook 展示瞭如何在單維和多維情況下變換連續隨機變數的機率密度。第一節闡述了通用問題並提供瞭解決方案。然而，這個通用解決方案通常很難評估，並且在特殊情況下可以進行簡化，例如，如果隨機向量是一維的，或者如果隨機向量的分量是獨立的。隨後章節推導了這些特殊情況的公式。這本 Wikibook 還旨在概述該領域中使用的不同方程式，並展示它們之間的聯絡。

一般問題和解決方案 (n-to-m 對映)

設 ${\vec {X}}=(X_{1},\ldots ,X_{n})$ 為具有隨機向量的機率密度函式，pdf， $\varrho _{\vec {X}}(x_{1},\ldots ,x_{n})$ ，並設 $f:\mathbb {R} ^{n}\to \mathbb {R} ^{m}$ 為一個 (Borel 可測) 函式。我們正在尋找 $\varrho _{\vec {Y}}$ 的機率密度函式，即 ${\vec {Y}}:={\vec {f}}({\vec {X}})$ .

首先，我們需要記住累積分佈函式，cdf， $F_{\vec {Y}}({\vec {y}})$ 的定義：它衡量了 Y 的每個分量都小於 y 的對應分量的機率。我們將使用簡寫符號，並說兩個向量“小於或等於”（≤）如果它們的每個分量都滿足條件。

F_{\vec {Y}}({\vec {y}})=P\left({\vec {Y}}\leq {\vec {y}}\right)=P\left({\vec {f}}({\vec {X}})\leq {\vec {y}}\right)

(1)

然後透過對 $F_{\vec {Y}}({\vec {y}})$ 求導可得所需的密度 $\varrho _{\vec {Y}}({\vec {y}})$ 。

\varrho _{\vec {Y}}({\vec {y}})={\frac {\partial }{\partial y_{1}}}\cdots {\frac {\partial }{\partial y_{m}}}F_{\vec {Y}}({\vec {y}})

(2)

因此，一般解可以表示為n維積分的m階導數

ℝⁿ → ℝ^m 對映

$\varrho _{\vec {Y}}({\vec {y}})={\frac {\partial }{\partial y_{1}}}\cdots {\frac {\partial }{\partial y_{m}}}\int _{\left\{{\vec {x}}\in \mathbb {R} ^{n}\mid {\vec {f}}({\vec {x}})\leq {\vec {y}}\right\}}\,\varrho _{\vec {X}}({\vec {x}})\,d^{n}x$

(3)

以下各部分將提供特殊情況下的簡化方法。

隨機變數的函式 (n=1, m=1)

如果 n=1 且 m=1，X 是一個連續分佈的隨機變數，其密度為 $\varrho _{X}$ ，並且 $f:\mathbb {R} \rightarrow \mathbb {R}$ 是一個可測博雷爾函式。那麼 Y := f(X) 也是連續分佈的，我們尋找密度 $\varrho _{Y}(y)$ 。

在下文中，f 始終至少可微。

首先要注意，可能存在 f 永遠無法達到的值，例如，如果 f(x) = x² 則 y<0。對於所有這些 y，必然有 $\varrho _{Y}(y)=0$ 。

\varrho _{Y}(y)={\begin{cases}0,&{\text{if }}y\notin f(\mathbb {R} )\\?,&{\text{if }}y\in f(\mathbb {R} )\end{cases}}

根據公式 1 和 2，我們可以得到

\varrho _{Y}(y)={\frac {d}{dy}}F_{Y}(y)={\frac {d}{dy}}P(Y\leq y)={\frac {d}{dy}}P(f(X)\leq y)

(4)

現在我們將以不同的方式重新排列這個表示式。

使用累積分佈函式 F_x 的推導

首先，我們將自己限制在導數始終不為 0 的 f（因此，f 是一個微分同胚）。然後，逆對映 $f^{-1}$ 存在，並且 f 或者單調遞增或者單調遞減。

如果 f 單調遞增，則 $x\leq f^{-1}(y)\Leftrightarrow f(x)\leq f(f^{-1}(y))=y$ 並且 $f^{\prime }>0$ 。因此

{\begin{array}{rcl}\varrho _{Y}(y)&=&{\frac {d}{dy}}P(f(X)\leq y)={\frac {d}{dy}}P(X\leq f^{-1}(y))\\&=&{\frac {d}{dy}}F_{X}(f^{-1}(y))=\varrho _{X}(f^{-1}(y)){\frac {df^{-1}(y)}{dy}}\end{array}}

如果 f 單調遞減，則 $x\leq f^{-1}(y)\Leftrightarrow f(x)\geq f(f^{-1}(y))=y$ 並且 $f^{\prime }<0$ 。因此

{\begin{array}{rcl}\varrho _{Y}(y)&=&{\frac {d}{dy}}P(f(X)\leq y)={\frac {d}{dy}}P(X\geq f^{-1}(y))\\&=&{\frac {d}{dy}}\left(1-F_{X}(f^{-1}(y))\right)=-\varrho _{X}(f^{-1}(y)){\frac {df^{-1}(y)}{dy}}\end{array}}

這可以總結為

\varrho _{Y}(y)={\begin{cases}0,&{\text{if }}y\notin f(\mathbb {R} )\\\varrho _{X}(f^{-1}(y))\cdot \left|{\frac {df^{-1}(y)}{dy}}\right|,&{\text{if }}y\in f(\mathbb {R} )\end{cases}}

(5)

如果現在導數 $f^{\prime }(x_{i})=0$ 在某些位置 $x_{i}$ 為零， $i=1,\ldots ,N$ ，那麼我們將 f 的定義空間使用這些位置分割成 $N+1$ 個不相交的區間 $I_{j}$ 。公式 5 對定義空間限制在這些區間 $I_{j}$ 上的函式 $f_{I_{j}}$ 成立。我們有

{\begin{array}{rcl}P(f(X)\leq y)&=&\sum \limits _{j=1}^{N+1}P(f_{I_{j}}(X)\leq y)\\\varrho _{Y}(y)={\frac {d}{dy}}P(f(X)\leq y)&=&\sum \limits _{j=1}^{N+1}\varrho _{X}(f_{I_{j}}^{-1}(y))\cdot \left|{\frac {df_{I_{j}}^{-1}(y)}{dy}}\right|\end{array}}

(5a)

按照約定，0 個加數的總和為 0，並使用反函式定理，可以將此寫成更緊湊的形式（讀作：所有滿足 f(x)=y 的 x 的總和）

ℝ → ℝ 對映

$\varrho _{Y}(y)=\sum \limits _{x,f(x)=y}{\frac {\varrho _{X}(x)}{\left|f^{\prime }(x)\right|}}$

(6)

使用積分替換的推導

在本節中，我們將考慮一個不同的推導。

公式 4 中的機率是機率密度的積分。同樣在 f 單調遞增的情況下，我們有

{\begin{array}{rcl}\int _{-\infty }^{y}\varrho _{Y}(u)\,du&=&P(Y\leq y)=P(f(X)\leq y)=P(X\leq f^{-1}(y))\\&=&\int _{-\infty }^{f^{-1}(y)}\varrho _{X}(x)\,dx\end{array}}

現在我們將右側積分中的 u 替換為 f(x)，即 $x=f^{-1}(u)$ 以及 ${\frac {du}{dx}}=f^{\prime }(x)$ 。積分的上下限則分別為 -∞ 到 y，且根據 “ $dx={\frac {dx}{du}}\,du$ ” 的法則，我們得到 ${\frac {dx}{du}}={\frac {d\,f^{-1}(u)}{du}}$ ，這由反函式定理得出。因此

\int _{-\infty }^{y}\varrho _{Y}(u)\,du=\int _{-\infty }^{y}\varrho _{X}(f^{-1}(u))\,{\frac {d\,f^{-1}(u)}{du}}\,du

對等式兩邊關於 y 求導，我們得到

\varrho _{Y}(y)=\varrho _{X}(f^{-1}(y))\,{\frac {d\,f^{-1}(y)}{dy}}

遵循與上一節相同的論證，我們再次可以推匯出方程式 6。

這個規則經常誤導物理學書籍呈現以下觀點，該觀點可能更容易記憶，但並不嚴謹：如果你將機率密度 $\varrho _{X}(x)$ 乘以“無窮小長度” $dx$ ，那麼你將得到 X 位於區間 [x, x+dx] 內的機率 $\varrho _{X}(x)\,dx$ 。將座標改為 y，透過代換，你將得到

\varrho _{X}(x)\,dx=\underbrace {\varrho _{X}(x(y))\,{\frac {dx}{dy}}} _{\varrho _{Y}(y)}\,dy

使用 Delta 分佈推導

在本節中，我們將考慮另一種不同的推導方法，這種方法在物理學中經常使用。

我們再次從公式 4 開始，將其寫成積分形式

{\begin{array}{rcl}\varrho _{Y}(y)&=&{\frac {d}{dy}}P(f(X)\leq y)\\&=&{\frac {d}{dy}}\int _{\{x\in \mathbb {R} \mid f(x)\leq y\}}\,\varrho _{X}(x)\,dx\\&=&{\frac {d}{dy}}\int _{\mathbb {R} }\Theta (y-f(x))\,\varrho _{X}(x)\,dx\\&=&\int _{\mathbb {R} }{\frac {d}{dy}}\Theta (y-f(x))\,\varrho _{X}(x)\,dx\\&=&\int _{\mathbb {R} }\delta (y-f(x))\,\varrho _{X}(x)\,dx\end{array}}

最後一個表示式的直觀解釋是：對所有可能的 x 值進行積分，並使用 delta “函式” 來選擇所有 y = f(x) 的位置。此公式通常出現在物理學書籍中，可能寫成期望值的形式， $\langle \ldots \rangle$

ℝ → ℝ 對映（使用狄拉克德爾塔分佈）

$\varrho _{Y}(y)=\int _{\mathbb {R} }\delta (y-f(x))\,\varrho _{X}(x)\,dx=\langle \,\delta (y-f(x))\,\rangle \;.$

(7)

我們可以看到，使用以下恆等式，此公式等效於公式 6

\int _{\mathbb {R} }\delta (h(x))\,g(x)\,dx=\sum \limits _{x_{0},h(x_{0})=0}{\frac {g(x_{0})}{\left|h^{\prime }(x_{0})\right|}}

示例

讓我們考慮以下具體示例：令 $\varrho _{X}(x)={\frac {\exp[-0.5x^{2}]}{\sqrt {2\pi }}}$ 且 $f(x)=x^{2}$ 。我們選擇使用公式 6（公式 5 和 7 會得到相同的結果）。我們計算導數 $f^{\prime }(x)=2x$ 並找到所有使 f(x)=y 的 x，它們是 $-{\sqrt {y}}$ 和 $+{\sqrt {y}}$ ，如果 y>0，否則沒有。對於 y>0，我們有

\varrho _{Y}(y)=\sum \limits _{x,f(x)=y}{\frac {\varrho _{X}(x)}{\left|f^{\prime }(x)\right|}}={\frac {\varrho _{X}(-{\sqrt {y}})}{\left|f^{\prime }(-{\sqrt {y}})\right|}}+{\frac {\varrho _{X}(+{\sqrt {y}})}{\left|f^{\prime }(+{\sqrt {y}})\right|}}={\frac {\exp[-0.5y]}{{\sqrt {2\pi }}\,2{\sqrt {y}}}}+{\frac {\exp[-0.5y]}{{\sqrt {2\pi }}\,2{\sqrt {y}}}}={\frac {\exp[-0.5y]}{\sqrt {2\pi \,y}}}

由於 f 從未達到負值，因此當 y<0 時，該和仍然為 0，最後我們得到

\varrho _{Y}(y)={\begin{cases}0,&{\text{if }}y\leq 0\\{\frac {\exp[-0.5y]}{\sqrt {2\pi \,y}}},&{\text{if }}y>0\end{cases}}

以下圖形說明了這個示例

另一個例子是逆變換法。假設計算機生成在 [0, 1] 上具有均勻分佈的隨機數 X，即

\varrho _{X}(x)\equiv {\begin{cases}1,&{\text{if }}0\leq x\leq 1\\0,&{\text{else.}}\end{cases}}

如果我們想要根據具有 pdf

\varrho _{Z}

的分佈獲得隨機數，我們選擇 f 作為 Z 的 cdf 的逆函式，即

Y=f(X)=F_{Z}^{-1}(X)

。現在我們可以證明 Y 將具有與所需的 Z 相同的分佈，

\varrho _{Y}=\varrho _{Z}

，方法是使用公式 5 以及

f^{-1}=F_{Z}

的事實。

{\begin{array}{rcl}\varrho _{Y}(y)&=&{\begin{cases}0,&{\text{if }}y\notin F_{Z}^{-1}(\mathbb {R} )\\\varrho _{X}(F_{Z}(y))\cdot \left|{\frac {dF_{Z}(y)}{dy}}\right|,&{\text{if }}y\in F_{Z}^{-1}(\mathbb {R} )\end{cases}}\\&=&1\cdot \left|{\frac {dF_{Z}(y)}{dy}}\right|=\varrho _{Z}(y)\end{array}}

.

以下示例圖示了該方法

隨機向量對映到隨機變數 (n>1, m=1)

現在我們將研究當已知密度為 $\varrho _{\vec {X}}$ 的隨機向量 X 對映到（標量）隨機變數 Y 時的情況，並計算新的密度 $\varrho _{Y}(y)$ 。

根據 3，我們發現

\varrho _{Y}(y)={\frac {d}{dy}}\int _{\{{\vec {x}}\in \mathbb {R} ^{n}\mid f({\vec {x}})\leq y\}}\,\varrho _{\vec {X}}({\vec {x}})\,d^{n}x

(8)

直接計算這個等式有時是最簡單的方法，例如，如果積分表示的面積或體積有已知公式。否則需要求解一個引數依賴的多重積分。

如果隨機向量 ${\vec {X}}$ 的分量是相互獨立的，那麼機率密度就會分解

\varrho _{\vec {X}}(x_{1},\ldots ,x_{n})=\varrho _{X_{1}}(x_{1})\cdot \ldots \cdot \varrho _{X_{n}}(x_{n})

在這種情況下，delta 函式可以提供一個快速評估工具。將積分邊界替換為積分內部的階躍函式， $H(y-f({\vec {x}}))$ ，並利用階躍函式的導數是 delta 函式這一事實。

{\begin{array}{rcl}\varrho _{Y}(y)&=&\int _{\mathbb {R} ^{n}}\varrho _{\vec {X}}(x_{1},\ldots ,x_{n})\,\delta (y-f({\vec {x}}))\,dx_{1}\ldots dx_{n}\\&=&\int _{\mathbb {R} }\varrho _{X_{n}}(x_{n})\cdots \int _{\mathbb {R} }\varrho _{X_{1}}(x_{1})\,\delta (y-f({\vec {x}}))\,dx_{1}\ldots dx_{n}\end{array}}

(9)

如果想要避免使用 delta 函式進行計算，當然也可以評估最裡面的積分 $\int dx_{1}$ ，前提是這些分量是獨立的。

\varrho _{Y}(y)=\int _{\mathbb {R} ^{n-1}}\,\sum \limits _{x_{1},f({\vec {x}})=y}{\frac {\varrho _{\vec {X}}({\vec {x}})}{\left|{\frac {\partial f({\vec {x}})}{\partial x_{1}}}\right|}}\,dx_{2}\ldots dx_{n}

示例

設 $Y=f({\vec {X}})=X_{1}+X_{2}$ ，其中獨立的連續隨機變數 X₁ 和 X₂。根據方程 9，我們有

{\begin{array}{rcl}\varrho _{Y}(y)&=&\int _{\mathbb {R} }\varrho _{X_{2}}(x_{2})\int _{\mathbb {R} }\varrho _{X_{1}}(x_{1})\,\delta (y-x_{2}-x_{1})\,dx_{1}\,dx_{2}\\&=&\int _{\mathbb {R} }\varrho _{X_{2}}(x_{2})\,\varrho _{X_{1}}(y-x_{2})\,dx_{2}\end{array}}

如果使用求和公式，則求和將遍歷所有滿足

f({\vec {x}})=x_{1}+x_{2}=y

的 x₁，即 x₁ = y - x₂。

導數為

{\frac {\partial (x_{1}+x_{2})}{\partial x_{1}}}=1

，因此我們也得到方程

\varrho _{Y}(y)=\int _{\mathbb {R} }\varrho _{X_{2}}(x_{2})\,\varrho _{X_{1}}(y-x_{2})\,dx_{2}

。

首先對 x₂ 進行積分，得到以下等效表示式：

\varrho _{Y}(y)=\int _{\mathbb {R} }\varrho _{X_{1}}(x_{1})\,\varrho _{X_{2}}(y-x_{1})\,dx_{1}

如果 $Y=X_{1}-X_{2}$ 且 X₁ 和 X₂ 獨立，則 $\varrho _{Y}(y)=\int _{\mathbb {R} }\varrho _{X_{1}}(x_{1})\,\varrho _{X_{2}}(x_{1}-y)\,dx_{1}$ 。

如果 $Y=X_{1}\cdot X_{2}$ ，其中 X₁ 和 X₂ 獨立，那麼 $\varrho _{Y}(y)=\int _{\mathbb {R} }\varrho _{X_{1}}(x_{1})\,\varrho _{X_{2}}\left({\frac {y}{x_{1}}}\right){\frac {1}{|x_{1}|}}\,dx_{1}$ 。

如果 $Y={\frac {X_{1}}{X_{2}}}$ ，其中 X₁ 和 X₂ 獨立，那麼 $\varrho _{Y}(y)=\int _{\mathbb {R} }\varrho _{X_{1}}(x_{2}\cdot y)\,\varrho _{X_{2}}(x_{2})\,|x_{2}|\,dx_{2}$ 。

給定獨立隨機變數 X₁ 和 X₂，其密度為

\varrho _{\vec {X}}(x_{1},x_{2})={\begin{cases}1/\pi ,&{\text{if }}x_{1}^{2}+x_{2}^{2}\leq 1\\0,&{\text{otherwise}}\end{cases}}

令

Y:={\sqrt {X_{1}^{2}+X_{2}^{2}}}

。根據公式 8，我們需要求解

\varrho _{Y}(y)={\frac {d}{dy}}\int _{{\bigl \{}{\vec {x}}\in \mathbb {R} ^{n}\mid {\sqrt {x_{1}^{2}+x_{2}^{2}}}\,\leq \,y{\bigr \}}}\,{\frac {1}{\pi }}\,dx_{1}\,dx_{2}

最後一個積分是在半徑為 y ≤ 1 的圓上，因此面積為

\pi y^{2}

。這簡化了計算

0\leq y\leq 1\Rightarrow \varrho _{Y}(y)={\frac {1}{\pi }}\,{\frac {d}{dy}}(\pi y^{2})={\frac {2\pi \,y}{\pi }}=2y

.

如果 y<0，我們在空集上進行積分，結果為 0。如果 y>1，

\varrho _{\vec {X}}=0

. 因此，最終結果是

\varrho _{Y}(y)={\begin{cases}2y,&{\text{if }}0\leq y\leq 1\\0,&{\text{otherwise}}\end{cases}}

以下圖形說明了這個示例

隨機向量 (n=m) 的可逆變換

設 ${\vec {X}}=(X_{1},\ldots ,X_{n})$ 是一個密度為 $\varrho _{\vec {X}}(x_{1},\ldots ,x_{n})$ 的隨機向量，並且設 $f:\mathbb {R} ^{n}\to \mathbb {R} ^{n}$ 是一個微分同胚。對於 ${\vec {Y}}:={\vec {f}}({\vec {X}})$ 的密度 $\varrho _{\vec {Y}}$ ，我們有

\int _{G}\varrho _{\vec {X}}({\vec {x}})\,d^{n}x=\int _{f(G)}\varrho _{\vec {X}}(f^{-1}({\vec {y}}))\;\left|{\frac {\partial (x_{1},\ldots ,x_{n})}{\partial (y_{1},\ldots ,y_{n})}}\right|\,d^{n}y

因此

ℝⁿ → ℝⁿ 對映

$\varrho _{\vec {Y}}({\vec {y}})=\varrho _{\vec {X}}(f^{-1}({\vec {y}}))\;\left|{\frac {\partial (x_{1},\ldots ,x_{n})}{\partial (y_{1},\ldots ,y_{n})}}\right|\;,$

(10)

其中 $\Phi _{f^{-1}}=\left|{\frac {\partial (x_{1},\ldots ,x_{n})}{\partial (y_{1},\ldots ,y_{n})}}\right|$ 是雅可比行列式的 $f^{-1}$ 。請注意 $\Phi _{f^{-1}}=\left(\Phi _{f}\right)^{-1}$ 。在一維情況下 (n=1)，公式 10 與公式 5 一致。

示例

給定隨機向量 ${\vec {X}}$ ，可逆矩陣 A 和向量 ${\vec {b}}$ ，令 ${\vec {Y}}=A{\vec {X}}^{T}+{\vec {b}}$ 。那麼 $\varrho _{\vec {Y}}({\vec {y}})=\varrho _{\vec {X}}\left(A^{-1}\,({\vec {y}}-{\vec {b}})\right)\;\left|\det A^{-1}\right|$ 。此外， $\det A^{-1}=1/\det A$ .
給定獨立的隨機變數 $X_{1}$ 和 $X_{2}$ ，我們引入極座標 $Y_{1}={\sqrt {X_{1}^{2}+X_{2}^{2}}}$ 和 $Y_{2}=\operatorname {atan2} (X_{2},X_{1})$ 。逆對映為 $X_{1}=Y_{1}\,\cos Y_{2}$ 和 $X_{2}=Y_{1}\,\sin Y_{2}$ 。由於雅可比行列式 $y_{1}$ ，所需的密度為 $\varrho _{\vec {Y}}(y_{1},y_{2})=y_{1}\,\varrho _{\vec {X}}(y_{1}\,\cos y_{2},\;y_{1}\,\sin y_{2})$ .

多維對映的可能簡化 (n>1, m>1)

即使上述特殊情況都不適用，簡化仍然有可能。其中一些列在下面

獨立目標分量

如果事先知道 $Y_{i}$ 的分量將是獨立的，即

\varrho _{\vec {Y}}(y_{1},\ldots ,y_{n})=\varrho _{Y_{1}}(y_{1})\cdot \ldots \cdot \varrho _{Y_{n}}(y_{n})\;,

則每個分量 $Y_{i}=f_{i}({\vec {X}})$ 的密度 $\varrho _{Y_{i}}$ 可以像上面部分隨機向量到隨機變數的對映那樣計算。

例子

給定隨機向量

{\vec {X}}=(X_{1},X_{2},X_{3},X_{4})

具有獨立的分量。

令

f:\mathbb {R} ^{4}\to \mathbb {R} ^{2}

，

{\vec {Y}}={\vec {f}}({\vec {X}}):=(X_{1}+X_{2},X_{3}+X_{4})

.

顯然，分量 Y₁ = X₁ + X₂ 和 Y₂ = X₃ + X₄ 是獨立的，因此

\varrho _{Y_{1}}(y_{1})=\int _{\mathbb {R} }\varrho _{X_{1}}(y_{1}-x_{2})\,\varrho _{X_{2}}(x_{2})\,dx_{2}

以及

\varrho _{Y_{2}}(y_{2})=\int _{\mathbb {R} }\varrho _{X_{3}}(y_{2}-x_{4})\,\varrho _{X_{4}}(x_{4})\,dx_{4}

請注意，即使

{\vec {X}}

的成分不是獨立的，

{\vec {Y}}

的成分可以是獨立的。

分割積分割槽域

有時將公式3中的積分割槽域分成可以單獨計算的部分很有用。可以透過使用狄拉克函式重寫3來明確地做到這一點

\varrho _{\vec {Y}}({\vec {y}})=\int _{\mathbb {R} ^{n}}\varrho _{\vec {X}}({\vec {x}})\,\delta (y_{1}-f({\vec {x}})_{1})\cdot \ldots \cdot \delta (y_{m}-f({\vec {x}})_{m})\,d^{n}x

然後使用恆等式 $\delta (x-x_{0})=\int _{\mathbb {R} }\delta (x-\xi )\,\delta (\xi -x_{0})\,d\xi$ .

例子

為了說明這個想法，我們使用一個簡單的ℝⁿ → ℝ示例：令Y = X₁² + X₂² + X₃，其中

\varrho _{\vec {X}}(x_{1},x_{2},x_{3})={\begin{cases}{\frac {e^{-x_{3}}}{\pi }},&{\text{if }}x_{1}^{2}+x_{2}^{2}\leq 1\wedge x_{3}\geq 0\\0,&{\text{else}}\end{cases}}

同時滿足 x₁² + x₂² + x₃ ≤ y、x₁² + x₂² ≤ 1 和 x₃ ≥ 0 的區域的引數化可能並不明顯，因此我們使用上面兩個公式

{\begin{array}{rcl}\varrho _{Y}(y)&=&\int _{\mathbb {R} ^{3}}\varrho _{\vec {X}}({\vec {x}})\,\delta (y-f({\vec {x}}))\,dx_{1}\,dx_{2}\,dx_{3}\\&=&\int _{0}^{\infty }\iint _{x_{1}^{2}+x_{2}^{2}\leq 1}{\frac {e^{-x_{3}}}{\pi }}\,\delta (y-x_{1}^{2}-x_{2}^{2}-x_{3})\,dx_{1}\,dx_{2}\,dx_{3}\\&=&\int _{0}^{\infty }\iint _{x_{1}^{2}+x_{2}^{2}\leq 1}{\frac {e^{-x_{3}}}{\pi }}\,\int _{\mathbb {R} }\delta (\xi -x_{1}^{2}-x_{2}^{2})\,\delta (y-x_{3}-\xi )\,d\xi \,\,dx_{1}\,dx_{2}\,dx_{3}\\&=&\int _{0}^{\infty }\,\int _{\mathbb {R} }\left[\iint _{x_{1}^{2}+x_{2}^{2}\leq 1}{\frac {e^{-x_{3}}}{\pi }}\delta (\xi -x_{1}^{2}-x_{2}^{2})\,dx_{1}\,dx_{2}\right]\,\delta (y-x_{3}-\xi )\,d\xi \,dx_{3}\end{array}}

現在，我們將積分拆分，使得括號中的表示式可以單獨計算，因為該區域僅取決於 x₁ 和 x₂，並且可能僅包含 x₃ 作為引數。

\iint _{x_{1}^{2}+x_{2}^{2}\leq 1}{\frac {e^{-x_{3}}}{\pi }}\delta (\xi -x_{1}^{2}-x_{2}^{2})\,dx_{1}\,dx_{2}={\begin{cases}e^{-x_{3}},&{\text{if }}0\leq \xi \leq 1\\0,&{\text{else}}\end{cases}}

因此

\varrho _{Y}(y)=\int _{0}^{\infty }\int _{0}^{1}e^{-x_{3}}\,\delta (y-x_{3}-\xi )\,d\xi \,dx_{3}=\int _{\max(0,y-1)}^{y}e^{-x_{3}}\,dx_{3}={\begin{cases}e^{1-y}-e^{-y},&{\text{if }}y>1\\1-e^{-y},&{\text{if }}0\leq y\leq 1\\0,&{\text{if }}y\leq 0\\\end{cases}}

輔助座標

如果 f 是單射的，那麼引入額外的輔助座標 Y_m+1 到 Y_n 會更容易，然後進行第可逆變換隨機向量節中的 $\mathbb {R} ^{n}\to \mathbb {R} ^{n}$ 變換，最後對所有得到的輔助座標進行積分。

例子

給定隨機向量

{\vec {X}}=(X_{1},X_{2},X_{3})

，密度為

\varrho _{\vec {X}}({\vec {x}})

，以及以下對映：

{\begin{pmatrix}Y_{1}\\Y_{2}\end{pmatrix}}={\begin{pmatrix}1&2&3\\4&5&6\end{pmatrix}}{\begin{pmatrix}X_{1}\\X_{2}\\X_{3}\end{pmatrix}}

現在我們引入輔助座標 Y₃ = X₃，這將得到變換矩陣

A={\begin{pmatrix}1&2&3\\4&5&6\\0&0&1\end{pmatrix}}

以及相應的 pdf

\varrho _{\vec {X}}(A^{-1}\,{\vec {y}})\;\left|\det A^{-1}\right|

。因此，我們最終得到

\varrho _{\vec {Y}}(y_{1},y_{2})=\int _{\mathbb {R} }\varrho _{\vec {X}}\left(A^{-1}\,{\begin{pmatrix}y_{1}\\y_{2}\\y_{3}\end{pmatrix}}\right)\;\left|\det A^{-1}\right|\;dy_{3}\;.

備註：如果聯合機率密度函式

\varrho _{\vec {Y}}(y_{1},y_{2})

，即條件機率分佈，並不重要，而我們只關心邊緣分佈，其中

\varrho _{Y_{1}}(y_{1})=\int _{\mathbb {R} }\varrho _{\vec {Y}}(y_{1},y_{2})\,dy_{2}

，那麼可以使用隨機向量到隨機變數的對映中描述的方法來計算該密度，對於對映 Y₁ = 1 X₁ + 2 X₂ + 3 X₃（同樣適用於 Y₂ = 4 X₁ + 5 X₂ + 6 X₃）。

現實世界應用

為了展示一些可能的應用，我們提出了以下問題，可以使用本華夏公益教科書中概述的技術來回答。原則上，這些答案也可以使用數值隨機數模擬來近似：生成多個 ${\vec {X}}$ 的實現，計算 ${\vec {Y}}=f({\vec {X}})$ ，並製作結果直方圖。然而，為了獲得合理的結果，尤其是在高維隨機向量的情況下，需要大量的隨機數。值得慶幸的是，我們總是可以使用上述公式分析地計算結果分佈。

統計物理學

假設雷射中的原子以正態分佈的速度 V_x 移動， $\varrho _{V_{x}}(v_{x})={\frac {\exp[-v_{x}^{2}/2\sigma ^{2}]}{\sqrt {2\pi \sigma ^{2}}}}$ ，σ² = k_BT/m。由於多普勒效應，以頻率 f₀ 發射的光線，當原子以 v_x 移動時，將被檢測為 f ≈ f₀ ( 1 + v_x / c )。因此，f 是 V_x 的函式。檢測到的光譜， $\varrho _{f}$ ，看起來像什麼？（答案：以 f₀ 為中心的正態分佈。）
假設理想氣體的速度分量（V_x，V_y，V_z）與上例相同，並且獨立地正態分佈。什麼是 $V={\sqrt {V_{x}^{2}+V_{y}^{2}+V_{z}^{2}}}$ 的機率密度 $\varrho _{V}$ ？(答案被稱為麥克斯韋-玻爾茲曼分佈。)

量化匯出屬性的不確定性

假設我們不知道 X 和 Y 的確切值，但我們可以為它們分別分配機率分佈。推導屬性 Z = X² / Y 的分佈是什麼？Z 的平均值和標準差是多少？（為了解決此類問題，有時使用圍繞平均值的線性化，並且假設 X 和 Y 都是正態分佈的。但是，我們並不侷限於此類限制。）
假設我們考慮一年後一克金、銀和鉑的價值，分別作為獨立的隨機變數 G、S 和 P。A 盒包含 1 克金、2 克銀和 3 克鉑。B 盒分別包含 4、5 和 6 克。因此， ${\begin{pmatrix}A\\B\end{pmatrix}}={\begin{pmatrix}1&2&3\\4&5&6\end{pmatrix}}{\begin{pmatrix}G\\S\\P\end{pmatrix}}$ 。一年後 A 盒（或 B 盒）中的內容價值是多少？（答案在上面的示例中給出。）請注意，A 和 B 是相關的。

請注意，以上示例假設 ${\vec {X}}$ 的分佈是已知的。如果未知，或者如果計算僅基於少量資料點，則來自數理統計的方法是量化不確定性的更好選擇。

生成相關隨機數

可以透過首先生成一個不相關隨機數向量，然後對它們應用函式來獲得相關隨機數。

為了獲得協方差矩陣為 C_Y 的隨機數，我們可以使用以下已知過程：計算 C_Y 的 Cholesky 分解 C_Y = A A^T。生成一個向量 ${\vec {x}}$ ，其中不相關隨機數的 var(X_i) = 1。應用矩陣 A： ${\vec {Y}}=A{\vec {X}}$ 。這將導致協方差矩陣為 C_Y = A A^T 的相關隨機變數。

使用本華夏公益教科書中概述的公式，我們還可以研究所得分佈的形狀以及非線性變換的影響。例如，考慮 X 在 [0, 2π] 中均勻分佈，Y₁ = sin(X) 且 Y₂ = cos(X)。在這種情況下，(Y₁, Y₂) 中隨機數的二維圖將顯示一個圓上的均勻分佈。儘管 Y₁ 和 Y₂ 在隨機上是相關的，但它們是不相關的。因此，重要的是要知道所得分佈，因為 $\varrho _{\vec {Y}}(y_{1},y_{1})$ 包含比協方差矩陣 C_Y 更多的資訊。