高階微觀經濟學/策略

策略

純策略

一個（純）策略指定了玩家將在所有可能的情況下如何反應，在這些情況下他/她可能會被要求行動。策略 $s_{i}$ 將資訊集 $\mathbf {\mathcal {H}}$ 對映到動作集 $\mathbf {\mathcal {A}}$
$s_{i}:\mathbf {\mathcal {H}} \rightarrow \mathbf {\mathcal {A}}$
使得 $s_{i}(H)\in C(H)\;\forall \;H\in \mathbf {\mathcal {H}}$
要求策略僅在每個資訊集中指定可行的動作。

策略空間的基數

一個有 $m$ 個資訊集的玩家，在每個資訊集 $H$ 中從 $b_{k}$ 個動作中選擇，那麼可能的數量

策略組合

一個策略組合 $s=(s_{1},\dots ,s_{I})$ 指定了每個玩家的一組策略，也可以寫成 $s=(s_{i},s_{-i})$

在接下來的討論中，集合 $\mathbf {\mathbb {S} } _{i}$ 表示玩家 $i$ 可用的所有純策略的集合，集合
$\mathbf {\mathbb {S} } =\times _{i=1}^{I}\mathbf {\mathbb {S} } _{i}$ 是純策略組合的集合。

隨機策略

混合策略

混合策略 $\sigma$ 為每個純策略 $s_{i}\in \mathbf {\mathbb {S} }$ 分配一個將被採用的機率，
$\sigma _{i}:\mathbf {\mathbb {S} } _{i}\rightarrow [0,1]$
使得 $\sum _{s_{i}\in \mathbf {\mathbb {S} } _{i}}\sigma _{i}(s_{i})=1$
要求分配給 $\mathbf {\mathbb {S} }$ 元素的機率總和為 1， $\sigma$ 是 $\mathbf {\mathbb {S} }$ 上的機率分佈函式。

混合擴充套件

混合擴充套件，單純形 $\Delta (\mathbf {\mathbb {S} } _{i})$ ，表示在純策略集合 $\mathbf {\mathbb {S} } _{i}$ 上的所有混合策略的空間。
$\Delta (\mathbf {\mathbb {S} } _{i})=\left\{(\sigma _{1,i},\dots ,\sigma _{M,i}):\sigma _{m,i}\geq 0\;\forall \;m=1,\dots ,M{\mbox{ and }}\sum _{m=1}^{M}\sigma _{m,i}=1\right\}$

預期效用

給定一個混合策略分佈 $\sigma$ ，預期效用 $E_{\sigma }[u_{i}(s)]$ 將所有可能的結果對映到實數線上。直觀地說，計算預期效用需要將每個純策略分佈 $u_{i}(s)$ 相關的效用，按每個分佈被選擇的機率進行加權，
$E_{\sigma }[u_{i}(s)]=\sum _{s\in \mathbf {\mathbb {S} } }Pr(s)\cdot u_{i}(s)$
混合分佈 $\sigma$ 為每個純策略 $s$ 分配機率，這意味著
$Pr(s)\equiv [\sigma _{1}(s_{1})\cdot \sigma _{w}(s_{2})\dots \cdot \sigma _{I}(s_{I})]=\prod _{i=1}^{I}\sigma _{i}(s_{i})$
因此， $\sigma$ 的預期效用為
$E_{\sigma }[u_{i}(s)]=\sum _{s\in \mathbb {\mathbf {S} } }\left[\left(\prod _{i=1}^{I}\sigma _{i}(s_{i})\right)u_{i}(s)\right]$

行為策略

為了替代在純策略中隨機化，隨機化策略可以寫成一個元組，該元組包含在每個資訊集的可用行動上的一系列機率分佈。因此，行為策略指定
$\forall H\in \mathbf {\mathcal {H}} {\mbox{ and action }}a\in \mathbf {\mathcal {A}} {\mbox{ a probability }}\lambda _{i}(a,H)\geq 0$
使得 $\sum _{a\in C(H)}\lambda (a,H)=1\;\forall \;H\in \mathbf {\mathcal {H}}$

行為策略與混合策略

行為策略和混合策略之間的關鍵區別在於**隨機化發生的時間**。對於混合策略，玩家在**遊戲開始之前**對純策略集合進行隨機化。對於行為策略，隨機化發生在**遊戲進行過程中**。一個**行為策略混合**允許兩種型別的隨機化，它允許在所有行為策略的空間中指定混合策略， $\sigma _{i}$ ，該策略將正機率分配給一個或多個（有限）行為策略 $(b_{1,i},\dots ,b_{k})$ 。
任何具有**完美記憶**的遊戲都允許行為策略和混合策略對，它們表現出**結果（實現）等效性**，這意味著每種策略在結果上產生相同的機率分佈。任何混合策略所隱含的結果機率分佈也可以從一個（唯一的？）行為策略中得到。