博弈論入門/百萬富翁的抉擇
| 此頁面已從其他專案 遷移,需要進行書籍化. 此頁面需要修改以成為書籍的主頁,或修改以符合其所屬書籍的“本地風格指南”。 在書籍化頁面後,請移除 {{bookify}}。 |
本文主要探討了在熱門電視遊戲節目《百萬富翁的抉擇》中玩遊戲的博弈論和最佳策略。
一種基本策略是讓參賽者以最大限度地提高獎金的預期價值的方式行動。在遊戲中的每一個銀行家提出報價的時刻,參賽者可以透過選擇大於未開啟箱子平均價值的報價來最大限度地提高預期價值,而在報價小於平均價值時拒絕報價。然而,銀行家的報價幾乎從未超過未開啟箱子的平均價值。因此,如果參賽者總是選擇這種策略,遊戲就會變得無聊,因為遊戲將包括參賽者始終拒絕報價,並繼續開啟箱子直到結束(或直到銀行家的報價超過預期價值)。
然而,當其他策略涉及最佳化除預期價值之外的引數時,遊戲就變得有趣了。拒絕銀行家報價的參賽者是在接受一種風險,即他可能獲得的獎金少於該報價。不同的人對風險的容忍程度不同。例如,如果在獲得 400,000 美元與獲得 1 美元或 1,000,000 美元的同等機會之間做出選擇,許多參賽者會選擇接受 400,000 美元,儘管事實上,如果參賽者的策略只是最大限度地提高預期價值,他們應該拒絕報價。許多參賽者會接受 400,000 美元的原因是,人們會最大限度地提高他們對金錢的效用,而不是直接最大限度地提高預期價值。隨著一個人獲得的錢越來越多,金錢的效用就會遞減,例如,參賽者獲得的第一個 400,000 美元的效用可能比接下來獲得的 600,000 美元更有價值。
遊戲看似簡單的格式吸引了數學家、統計學家和經濟學家的注意,作為對風險條件下決策的學習:它是一個關於效用理論應用的極好說明性例子。2004 年,一群經濟學家玩了一個縮小版的遊戲,有 84 名參與者,並將結果與預期效用假設進行了比較。[1] 該研究受到了媒體的廣泛關注,2006 年 1 月 12 日刊登在《華爾街日報》的頭版,並在 2006 年 3 月 3 日在美國國家公共廣播電臺播出。
策略建模
[edit | edit source]在美國版《百萬富翁的抉擇》標準遊戲的開始,遊戲的預期價值為 131,477.54 美元,即 26 個箱子的平均值。但是,只有 26 個箱子中的 6 個箱子的價值大於預期價值,26 個箱子的中位數價值只有 875 美元。在提出任何交易之前,參賽者必須選擇 6 個箱子淘汰。因此,在第一次報價時,箱子的預期價值可能在 13,420.80 美元到 170,916.25 美元之間,中位數價值可能在 350 美元到 17,500 美元之間,這導致了遊戲參與者必須在遊戲開始時做出決定的遊戲條件的很大差異。
銀行家的視角
[edit | edit source]我們不應該只考慮贏得獎金的參賽者的視角,因為這是一場雙人遊戲,銀行家是另一個玩家。由於銀行家玩了大量的遊戲,這大大降低了他的風險,因此他可以對剩餘的風險極其容忍,並採用一種試圖最大限度地降低參賽者贏得獎金的預期價值的策略。然而,他試圖最大限度地降低的預期價值不是按場次計算的,而是按遊戲時間計算的。對參賽者來說,能夠讓一名普通參賽者玩一個小時並贏得 100,000 美元的策略,對銀行家來說比讓一名普通參賽者只玩 15 分鐘並贏得 50,000 美元的策略更有利。這有助於解釋為什麼銀行家最初的幾個報價僅僅是剩餘箱子的預期價值的一小部分。一個最佳的銀行家只會提出在他看來能夠提高每小時遊戲預期價值的報價。從參賽者的角度來看,這變成了他們必須支付的能夠提前結束遊戲的溢價。
參賽者的視角
[edit | edit source]通常,參賽者會帶著他們認為的最低滿意獎金的想法進入遊戲。只要參賽者能夠在沒有顯著風險淘汰所有高於該最低獎金的獎金的情況下繼續遊戲,他就會這樣做。參賽者認為滿意的程度可能會在遊戲過程中發生變化,因為剩下的獎金會發生變化。例如,當剩下的第二個最值獎金為 75,000 美元時,如果當前剩下的最值獎金為 100,000 美元,參賽者會對它可能成為剩下的最值獎金的風險感到更滿意,而不是如果它為 1,000,000 美元。因此,玩家在風險較低的情況下可能希望繼續玩遊戲。到第四次報價時,還剩下八個箱子。在遊戲中的這個階段,參賽者淘汰所有價值 100,000 美元或以上的獎金的機率只有 4.8%,而剩下至少兩個此類獎金的機率為 72.8%。因此,參賽者也不太可能接受早期的報價。
遊戲的開始
在遊戲的開始,參賽者可以選擇一個箱子。實際選中 1,000,000 美元箱子的機率為 3.85%。有趣的是,許多參賽者實際上認為他們選擇了 1,000,000 美元的箱子,即使沒有選擇百萬美元箱子的機率為 96.15%。許多參賽者在做出決策時基於他們認為自己選擇了百萬美元的箱子(或其他五個更高價值的箱子中的一個)。隨著遊戲的進行,這通常會導致參賽者承擔不必要的風險,並且不接受銀行家的報價,即使該報價可能高於剩餘箱子的平均價值的預期結果。這種人類行為現象(即妄想)幾乎每次都會對參賽者不利。
遊戲結束
[edit | edit source]隨著遊戲中對參賽者來說滿意的獎金數量減少,遊戲繼續進行的願望對兩個玩家來說都減少了。隨著參賽者認為滿意的獎金數量減少,參賽者的風險也增加了。這種增加的風險降低了報價要對參賽者具有吸引力所需的剩餘箱子估計價值的百分比。相反,銀行家,因為他也在努力最佳化遊戲的娛樂價值,如果剩餘箱子的價值都很低,他可能需要迅速結束遊戲。為了結束遊戲,他需要提高他為交易提供的剩餘箱子估計價值的百分比,偶爾甚至超過估計價值。
與蒙提霍爾問題對比
[edit | edit source]當只剩下三個箱子時,百萬富翁的抉擇似乎就像一個蒙提霍爾問題的版本。考慮一個有三個箱子的百萬富翁的抉擇遊戲(類似於蒙提霍爾問題中的三個門)。參賽者有一個箱子。然後,另外兩個箱子中的一個被開啟。最後,參賽者被賦予了用自己的箱子交換剩餘的未開啟箱子的選擇。
蒙提霍爾問題給參賽者提供了一個2/3的機率,可以透過切換贏得比賽,以及一個1/3的機率,可以透過保留他或她的箱子贏得比賽。然而,在讓我們做一筆交易和交易或不交易之間存在著至關重要的區別。在蒙提霍爾問題中,主持人利用了他對三個門後面隱藏的秘密知識,導致了一個錯誤的選擇總是會被揭示出來。這種非隨機的選擇導致了錯誤的選擇,這就是在讓我們做一筆交易中切換和不切換的獲勝機率不同的原因。這使得交易或不交易的行為類似於無知的蒙提霍爾問題。
一個經濟學家團隊——Post, Van den Assem, Baltussen & Thaler (報告)——分析了出現在交易或不交易中的人們的決策,發現,除其他事項外,當參賽者看到他們的預期收益下降時,他們的風險厭惡程度會降低。"輸家"往往會繼續玩遊戲,即使這意味著拒絕超過剩餘獎品平均值的銀行報價。一項獨立的實驗研究 (報告),讓學生參與者玩獎品縮小的遊戲,也揭示了類似的模式。這些發現為行為經濟學家提供了支援,行為經濟學家聲稱,經典的預期效用理論由於沒有考慮決策的背景,在解釋人類行為方面存在不足。四位經濟學家的研究是獨一無二的,因為其基礎的"實驗"——交易或不交易的特點是高賭注、透明的機率分佈,以及只需要最小的技巧或策略的簡單停止/繼續決策。
這項特殊的研究在美國吸引了一些媒體的關注,包括2006年1月12日的華爾街日報頭版和2006年3月3日的美國國家公共廣播電臺的報道。
- ↑ Post, Van den Assem, Baltussen, 和 Thaler (2004年12月). "交易或不交易?風險決策在一個高額獎金的真人秀節目中".
{{cite journal}}: Cite journal 需要|journal=(幫助)CS1 maint: 多個名稱:作者列表 (連結)
- Post, Van den Assem, Baltussen, 和 Thaler (2004年12月). "交易或不交易?風險決策在一個高額獎金的真人秀節目中".
{{cite journal}}: Cite journal 需要|journal=(幫助)CS1 maint: 多個名稱:作者列表 (連結)