一個(純)策略指定了玩家將在所有可能的情況下如何反應,在這些情況下他/她可能會被要求行動。策略
將資訊集
對映到動作集
使得
要求策略僅在每個資訊集中指定可行的動作。
一個有
個資訊集的玩家,在每個資訊集
中從
個動作中選擇,那麼可能的數量
一個策略組合
指定了每個玩家的一組策略,也可以寫成
在接下來的討論中,集合
表示玩家
可用的所有純策略的集合,集合
是純策略組合的集合。
混合策略
為每個純策略
分配一個將被採用的機率,
![{\displaystyle \sigma _{i}:\mathbf {\mathbb {S} } _{i}\rightarrow [0,1]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2d6c37ef094e4cd8552255a5802fb530405916ee)
使得 
要求分配給
元素的機率總和為 1,
是
上的機率分佈函式。
混合擴充套件,單純形
,表示在純策略集合
上的所有混合策略的空間。
給定一個混合策略分佈
,預期效用
將所有可能的結果對映到實數線上。直觀地說,計算預期效用需要將每個純策略分佈
相關的效用,按每個分佈被選擇的機率進行加權,
![{\displaystyle E_{\sigma }[u_{i}(s)]=\sum _{s\in \mathbf {\mathbb {S} } }Pr(s)\cdot u_{i}(s)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6300a16752a24b9211678f4cdec2de47e01fe7e8)
混合分佈
為每個純策略
分配機率,這意味著
![{\displaystyle Pr(s)\equiv [\sigma _{1}(s_{1})\cdot \sigma _{w}(s_{2})\dots \cdot \sigma _{I}(s_{I})]=\prod _{i=1}^{I}\sigma _{i}(s_{i})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6159e35429587d172c848cf9c49605db0cbe6c5f)
因此,
的預期效用為
為了替代在純策略中隨機化,隨機化策略可以寫成一個元組,該元組包含在每個資訊集的可用行動上的一系列機率分佈。因此,行為策略指定

使得 
行為策略和混合策略之間的關鍵區別在於**隨機化發生的時間**。對於混合策略,玩家在**遊戲開始之前**對純策略集合進行隨機化。對於行為策略,隨機化發生在**遊戲進行過程中**。一個**行為策略混合**允許兩種型別的隨機化,它允許在所有行為策略的空間中指定混合策略,
,該策略將正機率分配給一個或多個(有限)行為策略
。
任何具有**完美記憶**的遊戲都允許行為策略和混合策略對,它們表現出**結果(實現)等效性**,這意味著每種策略在結果上產生相同的機率分佈。任何混合策略所隱含的結果機率分佈也可以從一個(唯一的?)行為策略中得到。