跳轉到內容

高階微觀經濟學/策略

來自華夏公益教科書,開放的書籍,開放的世界

純策略

[編輯 | 編輯原始碼]

一個(純)策略指定了玩家將在所有可能的情況下如何反應,在這些情況下他/她可能會被要求行動。策略將資訊集對映到動作集

使得
要求策略僅在每個資訊集中指定可行的動作。

策略空間的基數

[編輯 | 編輯原始碼]

一個有個資訊集的玩家,在每個資訊集中從個動作中選擇,那麼可能的數量

策略組合

[編輯 | 編輯原始碼]

一個策略組合指定了每個玩家的一組策略,也可以寫成

在接下來的討論中,集合 表示玩家 可用的所有純策略的集合,集合
是純策略組合的集合。

隨機策略

[編輯 | 編輯原始碼]

混合策略

[編輯 | 編輯原始碼]

混合策略 為每個純策略 分配一個將被採用的機率,

使得
要求分配給 元素的機率總和為 1, 上的機率分佈函式。

混合擴充套件

[編輯 | 編輯原始碼]

混合擴充套件,單純形 ,表示在純策略集合 上的所有混合策略的空間。

預期效用

[編輯 | 編輯原始碼]

給定一個混合策略分佈 ,預期效用 將所有可能的結果對映到實數線上。直觀地說,計算預期效用需要將每個純策略分佈 相關的效用,按每個分佈被選擇的機率進行加權,

混合分佈 為每個純策略 分配機率,這意味著

因此, 的預期效用為

行為策略

[編輯 | 編輯原始碼]

為了替代在純策略中隨機化,隨機化策略可以寫成一個元組,該元組包含在每個資訊集的可用行動上的一系列機率分佈。因此,行為策略指定

使得

行為策略與混合策略

[編輯 | 編輯原始碼]

行為策略和混合策略之間的關鍵區別在於**隨機化發生的時間**。對於混合策略,玩家在**遊戲開始之前**對純策略集合進行隨機化。對於行為策略,隨機化發生在**遊戲進行過程中**。一個**行為策略混合**允許兩種型別的隨機化,它允許在所有行為策略的空間中指定混合策略,,該策略將正機率分配給一個或多個(有限)行為策略
任何具有**完美記憶**的遊戲都允許行為策略和混合策略對,它們表現出**結果(實現)等效性**,這意味著每種策略在結果上產生相同的機率分佈。任何混合策略所隱含的結果機率分佈也可以從一個(唯一的?)行為策略中得到。

華夏公益教科書