跳轉到內容

資訊市場策略/背景/納什均衡

來自華夏公益教科書,開放的書籍,開放的世界

博弈論是一組理論工具,用於預測人們在戰略互動中的行為。[1] 博弈論的大部分內容超出了本書的範圍,但對某些博弈論方面的瞭解對於理解一些內容是必要的。在本節中,我們介紹一些關於玩家同時行動的博弈的背景知識。特別地,我們涵蓋了公共物品,這對思考資訊商品的創造很重要,以及協調博弈,這對研究具有網路外部性的市場很重要。

博弈矩陣

[編輯 | 編輯原始碼]

博弈論建立在博弈的結果和策略的基礎上。博弈包括兩個或多個受博弈結果影響的“玩家”。每個玩家都有可能採取的一組可能的“行動”。博弈矩陣是一個表格,它顯示了博弈中每個玩家所有可能的行動,以及每個玩家從所有可能策略中獲得的“收益”或回報。從博弈矩陣中,可以視覺化某個玩家的策略,並預測博弈的結果。

示例:公共物品博弈

[編輯 | 編輯原始碼]

公共物品是不可排斥的(沒有人可以阻止其他人使用它)且非競爭性的(有足夠多可供使用)。公共物品博弈是指每個玩家可以選擇在公共物品上投資多少,而該公共物品的收益將分配給所有玩家,無論誰選擇投資。在資訊商品的情況下,這可能被認為是公共廣播,其中個人可以選擇向公共廣播捐贈不同的金額(或根本不捐贈),但無論如何都可以收聽廣播。

為了建立一個簡單的模型,假設有一個只有兩個玩家的博弈。每個人都有選擇在公共廣播中投資 0 或 4 的選擇。廣播的質量隨著投資的增加而提高,回報為總投資的 3/4。因此,如果 是總共貢獻的金額,那麼每個玩家將獲得 的收益。

  • 當只有一個玩家投資時,該玩家會淨虧損,因為他們為商品支付了 4 但只獲得了 3 的收益,而選擇不投資的玩家獲得了 3 的淨收益。
  • 當兩個玩家都投資時,每個玩家獲得 6 的收益,他們的淨收益為 2。
  • 當兩個玩家都不投資時,他們都沒有支付或獲得任何收益,因此他們的淨收益為 0。

我們可以將這些視為下面博弈矩陣中的收益。玩家 1 選擇確定矩陣中哪一行使用的策略,而玩家 2 選擇確定表格中哪一列使用的策略。收益按順序列出,首先是行玩家的收益,然後是列玩家的收益。例如,如果玩家 1 選擇投資 4,而玩家 2 選擇投資 0,那麼這將使玩家處於表格的左下角單元格,顯示收益(-1,3)。這意味著如果玩家選擇這些策略,玩家 1 將獲得 -1 的淨收益,而玩家 2 將獲得 3 的淨收益。

公共物品 玩家 2
投資 0 投資 4
玩家 1 投資 0 0, 0 3, -1
投資 4 -1, 3 2, 2

納什均衡

[編輯 | 編輯原始碼]

納什均衡是指博弈中任何玩家都沒有動力單方面改變其決定的情況。這是一個均衡,因為沒有動力讓玩家改變他們的行為。

請注意,這並不意味著玩家一定對結果感到滿意。玩家可能都認為,如果他們都改變策略,可能會出現更好的結果,但沒有單個玩家可以透過改變策略來改善自己的收益。

為了更技術化一點,納什均衡建立在最佳反應的概念上。玩家的最佳反應是他們給定另一個玩家選擇的策略所能選擇的最佳策略。有可能(並且在公共物品博弈中將會出現這種情況)玩家的最佳反應與其他玩家選擇什麼策略無關。但是,也可能(並且在協調博弈中將會出現這種情況)玩家對其他玩家可能選擇的每種可能策略都有不同的最佳反應。

有了最佳反應的概念,納什均衡可以重新表述為

納什均衡是策略的集合(每個玩家一個),使得每個玩家的策略都是對其他玩家策略的最佳反應。

示例:公共物品博弈

[編輯 | 編輯原始碼]

在像上面公共物品博弈這樣的博弈矩陣中,尋找納什均衡的方法是問一系列“如果”問題

  • 如果玩家 2 選擇投資 0?那麼玩家 1 的最佳反應將是投資 0。這可以透過比較玩家 1 的收益來看出。如果玩家 2 投資 0,那麼博弈肯定會在左列進行。那麼玩家 1 在投資 0 獲得 0 的收益,或者投資 4 獲得 -1 的收益之間做出選擇。
  • 如果玩家 2 選擇投資 4?那麼玩家 1 的最佳反應將是投資 0。由於玩家 2 選擇了表格的右側,因此玩家 1 在投資 0 獲得 3 的收益,或者投資 4 獲得 2 的收益之間做出選擇。
  • 如果玩家 1 選擇投資 0(或投資 4)?我們從玩家 2 的角度做同樣的“如果”推理。玩家 2 思考他們對玩家 1 每種可能策略的最佳反應是什麼。在這個博弈中,玩家 2 的最佳反應始終是投資 0。

因此,這個博弈的納什均衡是每個玩家都投資 0 的情況。這個博弈的納什均衡顯示了搭便車問題。問題不在於有人在沒有支付投資的情況下獲得收益。問題是,如果有人可以在不投資的情況下獲得收益,那麼很有可能沒有人會投資,任何人都不會獲得收益。

這對於資訊商品非常重要,因為對於資訊商品,人們總是擔心潛在的創作者(作家、發明家等)如果其他人可以在不支付的情況下從資訊商品中獲益,那麼他們將不會費心投資建立資訊商品。

協調博弈

[編輯 | 編輯原始碼]

純粹協調博弈

[編輯 | 編輯原始碼]

在一些協調博弈中,玩家唯一關心的是他們要進行協調。在這些博弈中,他們並不關心哪一個納什均衡出現,而是其中一個出現。

例如,假設有一個小島國剛建好第一條公路。還沒有關於應該在道路的哪一邊行駛的傳統或法律。如果兩輛車迎面駛來,一輛在右邊行駛(從他們的角度來看,右邊),另一輛在左邊行駛(從他們的角度來看),他們將發生正面碰撞,並度過糟糕的一天。在博弈矩陣中,當玩家 1 在右邊行駛而玩家 2 在左邊行駛時,兩種可能性都顯示出(-10,-10)的收益,反之亦然。然而,如果他們都在右邊行駛,他們會互相透過,一切都會順利進行。在博弈矩陣中,當兩個玩家都選擇右邊策略時,顯示出(1,1)的收益。由於重要的是他們不是在右邊行駛,而是為了不發生碰撞而行駛,因此如果兩個玩家都在左邊行駛,他們也會獲得(1,1)的收益。

應該在路的哪邊行駛呢? 玩家 2
左邊 右邊
玩家 1 左邊 1, 1 -10, -10
右邊 -10, -10 1, 1

協調與分歧

[編輯 | 編輯原始碼]

在其他協調博弈中,玩家透過協調仍然能獲益,但他們對哪個均衡更可取存在分歧。這個經典的,儘管是性別歧視的,例子被稱為“性別之戰”。故事說,一個男人和一個女人想要約會,他們都更喜歡一起做某事,而不是分開做事情。然而,男人更喜歡約會去觀看足球比賽,而女人更喜歡約會去觀看芭蕾舞。

在博弈矩陣中,這表示為每個玩家選擇芭蕾舞足球作為策略。如果他們選擇不同的東西,他們就沒有約會,他們的收益是(0,0)。如果他們都選擇芭蕾舞,他們會更開心,但特別是女人會更開心,所以男人獲得 1 的收益,女人獲得 2 的收益。如果他們都選擇足球,他們很開心在一起,但男人更開心,獲得 2 的收益,而女人獲得 1 的收益。

性別之戰 女人
芭蕾舞 足球
男人 芭蕾舞 1, 2 0, 0
足球 0, 0 2, 1

讓我們用更適合資訊商品主題的術語重新描述相同的博弈。在一個企業中,重要的是工程方面的極客能夠與財務方面的會計師進行溝通,但他們在數學軟體方面有不同的品味。極客想要使用Matlab,而會計師想要使用Excel。如果他們每個人都選擇他們個人喜歡的軟體,他們可以完成一些私人工作,但如果沒有大量額外麻煩,溝通將不會發生。

在博弈矩陣中,這顯示為如果玩家選擇不同的數學軟體,他們會獲得(2,2)的收益。如果他們在 Excel 上協調,那麼會計師會非常開心,獲得 10 的收益,而工程師則很高興他們能夠完成工作,但仍然沒有那麼開心,獲得 6 的收益。如果他們在 Matlab 上協調,收益會反轉。

數學軟體 極客
Excel Matlab
會計師 Excel 10, 6 2, 2
Matlab 2, 2 6, 10

冒險的協調

[編輯 | 編輯原始碼]

有時,在特定均衡上協調顯然更好,但存在一些風險。討論這個想法的經典博弈被稱為“獵鹿”。故事說,兩個獵人要去尋找晚餐。如果他們分別去獵兔子,他們每個人都會捕獲一隻兔子,然後吃晚餐。如果他們一起狩獵,他們可以捕獲一頭鹿,然後有很多晚餐。然而,如果一個人獨自去獵鹿,那個獵人什麼也捕獲不到,會餓肚子,而另一個獵人仍然可以捕獲兔子。

這在博弈矩陣中顯示為如果他們都選擇鹿,則獲得(5,5)的收益,如果他們都選擇兔子,則獲得(1,1)的收益。此外,如果只有一個選擇鹿,那麼那個選擇鹿的人獲得 0 的收益。這個博弈仍然是一個協調博弈,有兩個納什均衡:(鹿鹿)和(兔子兔子)。

這個協調博弈的特殊(可能是特別糟糕)之處在於,如果一個玩家認為另一個玩家可能不會選擇鹿,那麼擔心這個玩家可能會選擇兔子以求安全。另一個玩家可能也這麼想,然後他們會陷入不太理想的均衡。在收益非常高的矩陣中尤其如此。

休斯頓大學的一項研究[2]發現,當收益規模較小時,如以下所示,玩家 91.7% 的時間會選擇冒險選項。但當他們以更大的收益規模進行遊戲時,冒險選項只被選擇了 69.4% 的時間。耐心在獵鹿中也起著作用。當進行反覆測試時,就像這對夫婦每天都去狩獵一樣,冒險決策在實驗進行得越久,結果往往越好。

喬治梅森大學進行了一項替代性研究[3],其結果證明是反直覺的。他們的研究表明,風險厭惡,甚至認知能力對參與者選擇“鹿”的頻率影響微乎其微,而耐心有小到中等的影響。在本實驗中發現,最重要的因素是玩家是男性且隨和。男性在鹿-鹿的結果中高出 14%,隨和的人高出 6%。

獵鹿 玩家 2
鹿 兔子
玩家 1 鹿 5, 5 0, 1
兔子 1, 0 1, 1

重新描述一個更適合主題的類似博弈。假設在 1985 年,一家企業的兩個地區辦事處之間交換了大量的郵件。他們正在考慮切換到傳真機。如果兩個地區辦事處都開始使用傳真機,他們將節省大量郵寄費用。如果只有一個辦事處獲得傳真機,他們將白白地付出費用和麻煩,因為他們將無法與另一個辦事處交換傳真。

這在博弈矩陣中顯示為如果他們都選擇郵件(因為沒有變化),則獲得(0,0)的收益,如果他們都選擇傳真,則獲得(2000,2000)的收益,因為他們可以透過切換到傳真機來節省大量成本。但是,如果只有一個切換,他們最終會繼續交換郵件。因此,堅持使用郵件的人獲得 0 的收益,而獲得傳真的人獲得 -300 的收益。


郵件或傳真 玩家 2
傳真 郵件
玩家 1 傳真 2000, 2000 -300, 0
郵件 0, -300 0, 0

參考資料

[編輯 | 編輯原始碼]
  1. 博弈論被經濟學家廣泛使用,但也用於研究軍事戰略、政治、家庭行為以及許多其他人類互動領域。它有時也被用來研究其他領域,包括進化生物學和計算機工程。
  2. (http://www.uh.edu/econpapers/RePEc/hou/wpaper/2006-01.pdf)
  3. http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1764272
華夏公益教科書