跳轉到內容

交通經濟學/博弈

來自華夏公益教科書

一個遊戲

[編輯 | 編輯原始碼]

首先,讓我們玩奇偶遊戲。

這是一個經典的遊戲,用來決定平局的決勝局或解決比賽。它只需要你的手指。

  1. 無限重複的迴圈賽(例如,使用以下連結中的時間表進行迴圈賽,然後再次進行,然後再次進行,依此類推,直到教授在某個不可預測的次數後說停止)。
  2. 收益矩陣(見下文),收益形式為 [A, B],因此第一個數字是玩家 A 的收益,第二個數字是玩家 B 的收益。玩家 A 是迴圈賽時間表中的第一個玩家。
  3. 這個遊戲 奇偶遊戲
  4. 策略(寫下來,暫時保密)
  5. 記分(記錄你的分數……榮譽制度)
  6. 獎品:同伴的敬畏

使用 迴圈賽時間表 來確定錦標賽的時間表。

玩家 B
奇數 偶數
玩家 A 奇數 [3, 3] [0, 5]
偶數 [5, 0] [1, 1]

這一切意味著什麼?

系統理性與使用者理性

以牙還牙與短視的自私

阿納托爾·拉波波特,他為類似的基於計算機的策略開發了成功的以牙還牙策略。

博弈論

[編輯 | 編輯原始碼]

博弈論關注經濟主體的戰略互動的一般分析,他們的決策會相互影響。

可以用博弈論分析的問題

  • 擁堵
  • 融資
  • 合併
  • 公交車與汽車
  • ……

每個遊戲中的主體是誰?

在博弈論中,支配(也稱為戰略支配)是指當一個玩家的策略優於另一個策略時,無論該玩家的對手如何行動,都會出現這種情況。許多簡單的遊戲可以使用支配來解決。相反,非傳遞性發生在遊戲中的一個策略可能比另一個策略更好或更糟,這取決於玩家的對手如何行動。(參考:支配策略

納什均衡(NE):當 A 的選擇在 B 的選擇下是最佳選擇,而 B 的選擇在 A 的選擇下是最佳選擇時,一對策略被定義為 NE。NE 可以被解釋為對每個人選擇的預期,使得一旦一個人做出自己的選擇,兩個人都不想改變自己的行為。

如果在一個遊戲中,一個玩家存在嚴格的支配策略,那麼該玩家將在遊戲的每個納什均衡中使用該策略。如果兩個玩家都有嚴格的支配策略,那麼該遊戲只有一個唯一的納什均衡。但是,該納什均衡並不一定是帕累托最優的,這意味著遊戲可能存在非均衡結果,這對兩個玩家都更好。用來說明這一點的經典遊戲是囚徒困境。(參考:支配策略

玩家 B
i j
玩家 A i [3,3]* [2,2]
j [2,2] [1,1]

玩家 A 的收益以單元格中的第一個數字表示,玩家 B 的收益以該單元格中的第二個數字表示。因此策略對 [i,i] 意味著玩家 A 的收益為 3,玩家 B 的收益也為 3。NE 在上面的插圖中用星號標出。這代表了一種情況,在這種情況下,每家公司或每個人都在做出最優選擇,前提是另一家公司或另一個人的選擇。在這裡,A 和 B 都明顯更喜歡選擇 i 而不是選擇 j。因此 [i,i] 是一個 NE。

囚徒困境

[編輯 | 編輯原始碼]

之前,我們玩了一個有限的一次性遊戲和一個無限重複的遊戲。這個遊戲被設定為所謂的“囚徒困境”。

囚徒困境這個詞源於這樣一種情況:兩個犯罪同夥都被逮捕並分別接受調查。如果他們都“堅持到底”,由於缺乏證據,他們會得到較輕的刑罰(比如各判處 1 年)。如果他們在審訊中都崩潰並認罪,他們將共同承擔犯罪的刑期(比如各判處 10 年)。但如果一個人認罪而另一個人不認罪,認罪者會成為汙點證人(並獲得假釋),並幫助定罪另一個人(後者會在監獄裡服刑 20 年)

在一次性或有限重複的囚徒困境遊戲中,認罪(收費、背叛、偶數)是一種支配策略,當兩個囚徒都認罪(州收費、背叛、偶數)時,這是一種支配策略均衡。


博弈論在交通中的應用

[編輯 | 編輯原始碼]

邊境收費

[編輯 | 編輯原始碼]

(基於 Levinson,David (1999) 邊境收費:博弈論分析。第十四屆交通與交通理論國際研討會論文集 173-187。)

兩個州(特拉華州和新澤西州)被一片水域隔開。它們由一座跨越該水域的橋樑連線。他們應該如何為這座橋樑以及他們其餘的道路提供資金?

他們應該收費還是徵稅?

是兩個司法管轄區的收費。需求是一個負指數函式。(目標是最大化地方福利(居民的效用加上非居民的收費收入(居民的收費收入被視為轉移支付)。)

司法管轄區 J(新澤西州)
i j
司法管轄區 I(特拉華州) i [1153, 1153]* [2322,883]
j [883, 2322] [1777,1777]

表格的解讀方式如下:每個司法管轄區選擇兩種策略中的一種(收費或徵稅)。實際上,司法管轄區 1(特拉華州)選擇一行,而司法管轄區 2(新澤西州)選擇一列。每個單元格中的兩個數字表明瞭當選擇相應的策略對時,兩個州的結果。逗號左邊的數字表明選擇行(特拉華州)的司法管轄區的收益,而逗號右邊的數字表明選擇列(新澤西州)的州的收益。因此(沿著第一列向下看)如果他們都收費,那麼每個州都獲得 1153 美元/小時的福利,但如果新澤西州收費而特拉華州徵稅,那麼新澤西州獲得 2322 美元,而特拉華州只獲得 883 美元。

所以:如何解決這個遊戲?如果兩個州都希望最大化福利,什麼策略是“理性的”?新澤西州可能會這樣推理:“會發生兩種情況:特拉華州可以收費或特拉華州可以繼續徵稅。假設特拉華州收費。那麼如果我不收費,我就只能得到 883 美元,如果我收費,我就得到 1153 美元,所以在這種情況下,收費是最好的。另一方面,如果特拉華州徵稅而我收費,我就得到 2322 美元,如果我徵稅,我們都得到 1777 美元。無論哪種方式,我收費都是最好的。因此,我將收費。”

但特拉華州的推理方式類似。因此,他們都收費,並損失了 624 美元/小時。然而,如果他們採取了“非理性”的行為並徵稅,他們每個州都可以獲得 1777 美元/小時。

協調博弈

[編輯 | 編輯原始碼]

在英國、日本、澳大利亞和其他一些島國,人們在道路的左側行駛;在美國和歐洲大陸,人們在右側行駛。但是,無論在哪裡,每個人都與其他地方的人一樣,在同一側行駛,即使該側在不同的地方會有所不同。

這種安排是如何實現的?

有兩種策略:靠左行駛和靠右行駛。有兩種可能的結果:兩輛車順利駛過彼此,或者相撞。我們任意將順利透過的值分配為 1,將相撞的值分配為 -10。以下是收益表

賓士
左側 右側
別克 左側 [1,1] [-10,-10]
右側 [-10,-10] [1,1]

(目標:最大化收益)

驗證 LL 和 RR 都是納什均衡。

但是,如果我們不知道選擇哪一邊,我們可能會隨機選擇 LR 或 RL 併發生碰撞,存在一些風險。我們如何知道選擇哪一邊?答案是,當然,對於這個協調博弈,我們依靠社會慣例。相反,我們知道,在這個博弈中,社會慣例非常強大且持久,在解決方案為 LL 的國家也不遜於解決方案為 RR 的國家。

參見 左側或右側駕駛的歷史討論


博弈論中的問題

[編輯 | 編輯原始碼]
  • 什麼是“理性”?
  • 當理性策略取決於他人的策略時會發生什麼?
  • 如果資訊不完整會發生什麼?
  • 如果存在不確定性或風險會發生什麼?
  • 在什麼情況下合作比自私更好?在什麼情況下合作是自私的?
  • 持續的互動與一次性事件有何不同?
  • 道德可以從理性的自私中推匯出嗎?
  • 現實與博弈論有何比較?

思考問題

[編輯 | 編輯原始碼]

無限或無限重複的囚徒困境博弈與有限重複或一次性博弈有何不同?為什麼?

兩家航空公司(美聯航,美國航空)分別提供從紐約到洛杉磯的 1 個航班。

價格 = $/pax,收益 = $/航班。

每架飛機載客 500 人。

固定成本為每航班 50000 美元,總需求為 200 美元時為 500 名乘客。

在 400 美元時,總需求為 250 名乘客。

乘客選擇最便宜的航班。

收益 = 收入 - 成本

兩人合作(4 分鐘)

1. 為博弈制定收益矩陣。

2. 什麼是均衡?

解決方案

[編輯 | 編輯原始碼]

零和博弈:如果我們將博弈中的勝負相加,將損失視為負數,發現對於選擇的每組策略,總和為零,那麼該博弈就是“零和博弈”。

問題擴充套件

[編輯 | 編輯原始碼]

3. 如果存在第三個價格 300 美元,其需求為 375 名乘客,會發生什麼?

重新表述問題。

解決方案

[編輯 | 編輯原始碼]

混合策略

[編輯 | 編輯原始碼]

混合策略:如果博弈中的玩家以特定機率隨機選擇兩種或多種策略,則這種選擇被稱為“混合策略”。

進一步應用

[編輯 | 編輯原始碼]


Previous page
介紹
交通經濟學 Next page
資料
代理
華夏公益教科書