交通經濟學/博弈
首先,讓我們玩奇偶遊戲。
這是一個經典的遊戲,用來決定平局的決勝局或解決比賽。它只需要你的手指。
- 無限重複的迴圈賽(例如,使用以下連結中的時間表進行迴圈賽,然後再次進行,然後再次進行,依此類推,直到教授在某個不可預測的次數後說停止)。
- 收益矩陣(見下文),收益形式為 [A, B],因此第一個數字是玩家 A 的收益,第二個數字是玩家 B 的收益。玩家 A 是迴圈賽時間表中的第一個玩家。
- 這個遊戲 奇偶遊戲
- 策略(寫下來,暫時保密)
- 記分(記錄你的分數……榮譽制度)
- 獎品:同伴的敬畏
使用 迴圈賽時間表 來確定錦標賽的時間表。
| 玩家 B | |||
| 奇數 | 偶數 | ||
| 玩家 A | 奇數 | [3, 3] | [0, 5] |
| 偶數 | [5, 0] | [1, 1] |
這一切意味著什麼?
系統理性與使用者理性
以牙還牙與短視的自私
見 阿納托爾·拉波波特,他為類似的基於計算機的策略開發了成功的以牙還牙策略。
博弈論關注經濟主體的戰略互動的一般分析,他們的決策會相互影響。
可以用博弈論分析的問題
- 擁堵
- 融資
- 合併
- 公交車與汽車
- ……
每個遊戲中的主體是誰?
在博弈論中,支配(也稱為戰略支配)是指當一個玩家的策略優於另一個策略時,無論該玩家的對手如何行動,都會出現這種情況。許多簡單的遊戲可以使用支配來解決。相反,非傳遞性發生在遊戲中的一個策略可能比另一個策略更好或更糟,這取決於玩家的對手如何行動。(參考:支配策略)
納什均衡(NE):當 A 的選擇在 B 的選擇下是最佳選擇,而 B 的選擇在 A 的選擇下是最佳選擇時,一對策略被定義為 NE。NE 可以被解釋為對每個人選擇的預期,使得一旦一個人做出自己的選擇,兩個人都不想改變自己的行為。
如果在一個遊戲中,一個玩家存在嚴格的支配策略,那麼該玩家將在遊戲的每個納什均衡中使用該策略。如果兩個玩家都有嚴格的支配策略,那麼該遊戲只有一個唯一的納什均衡。但是,該納什均衡並不一定是帕累托最優的,這意味著遊戲可能存在非均衡結果,這對兩個玩家都更好。用來說明這一點的經典遊戲是囚徒困境。(參考:支配策略)
| 玩家 B | |||
| i | j | ||
| 玩家 A | i | [3,3]* | [2,2] |
| j | [2,2] | [1,1] |
玩家 A 的收益以單元格中的第一個數字表示,玩家 B 的收益以該單元格中的第二個數字表示。因此策略對 [i,i] 意味著玩家 A 的收益為 3,玩家 B 的收益也為 3。NE 在上面的插圖中用星號標出。這代表了一種情況,在這種情況下,每家公司或每個人都在做出最優選擇,前提是另一家公司或另一個人的選擇。在這裡,A 和 B 都明顯更喜歡選擇 i 而不是選擇 j。因此 [i,i] 是一個 NE。
之前,我們玩了一個有限的一次性遊戲和一個無限重複的遊戲。這個遊戲被設定為所謂的“囚徒困境”。
囚徒困境這個詞源於這樣一種情況:兩個犯罪同夥都被逮捕並分別接受調查。如果他們都“堅持到底”,由於缺乏證據,他們會得到較輕的刑罰(比如各判處 1 年)。如果他們在審訊中都崩潰並認罪,他們將共同承擔犯罪的刑期(比如各判處 10 年)。但如果一個人認罪而另一個人不認罪,認罪者會成為汙點證人(並獲得假釋),並幫助定罪另一個人(後者會在監獄裡服刑 20 年)
在一次性或有限重複的囚徒困境遊戲中,認罪(收費、背叛、偶數)是一種支配策略,當兩個囚徒都認罪(州收費、背叛、偶數)時,這是一種支配策略均衡。
(基於 Levinson,David (1999) 邊境收費:博弈論分析。第十四屆交通與交通理論國際研討會論文集 173-187。)
兩個州(特拉華州和新澤西州)被一片水域隔開。它們由一座跨越該水域的橋樑連線。他們應該如何為這座橋樑以及他們其餘的道路提供資金?
他們應該收費還是徵稅?
設 和 是兩個司法管轄區的收費。需求是一個負指數函式。(目標是最大化地方福利(居民的效用加上非居民的收費收入(居民的收費收入被視為轉移支付)。)
| 司法管轄區 J(新澤西州) | |||
| i | j | ||
| 司法管轄區 I(特拉華州) | i | [1153, 1153]* | [2322,883] |
| j | [883, 2322] | [1777,1777] |
表格的解讀方式如下:每個司法管轄區選擇兩種策略中的一種(收費或徵稅)。實際上,司法管轄區 1(特拉華州)選擇一行,而司法管轄區 2(新澤西州)選擇一列。每個單元格中的兩個數字表明瞭當選擇相應的策略對時,兩個州的結果。逗號左邊的數字表明選擇行(特拉華州)的司法管轄區的收益,而逗號右邊的數字表明選擇列(新澤西州)的州的收益。因此(沿著第一列向下看)如果他們都收費,那麼每個州都獲得 1153 美元/小時的福利,但如果新澤西州收費而特拉華州徵稅,那麼新澤西州獲得 2322 美元,而特拉華州只獲得 883 美元。
所以:如何解決這個遊戲?如果兩個州都希望最大化福利,什麼策略是“理性的”?新澤西州可能會這樣推理:“會發生兩種情況:特拉華州可以收費或特拉華州可以繼續徵稅。假設特拉華州收費。那麼如果我不收費,我就只能得到 883 美元,如果我收費,我就得到 1153 美元,所以在這種情況下,收費是最好的。另一方面,如果特拉華州徵稅而我收費,我就得到 2322 美元,如果我徵稅,我們都得到 1777 美元。無論哪種方式,我收費都是最好的。因此,我將收費。”
但特拉華州的推理方式類似。因此,他們都收費,並損失了 624 美元/小時。然而,如果他們採取了“非理性”的行為並徵稅,他們每個州都可以獲得 1777 美元/小時。
在英國、日本、澳大利亞和其他一些島國,人們在道路的左側行駛;在美國和歐洲大陸,人們在右側行駛。但是,無論在哪裡,每個人都與其他地方的人一樣,在同一側行駛,即使該側在不同的地方會有所不同。
這種安排是如何實現的?
有兩種策略:靠左行駛和靠右行駛。有兩種可能的結果:兩輛車順利駛過彼此,或者相撞。我們任意將順利透過的值分配為 1,將相撞的值分配為 -10。以下是收益表
| 賓士 | |||
| 左側 | 右側 | ||
| 別克 | 左側 | [1,1] | [-10,-10] |
| 右側 | [-10,-10] | [1,1] |
(目標:最大化收益)
驗證 LL 和 RR 都是納什均衡。
但是,如果我們不知道選擇哪一邊,我們可能會隨機選擇 LR 或 RL 併發生碰撞,存在一些風險。我們如何知道選擇哪一邊?答案是,當然,對於這個協調博弈,我們依靠社會慣例。相反,我們知道,在這個博弈中,社會慣例非常強大且持久,在解決方案為 LL 的國家也不遜於解決方案為 RR 的國家。
參見 左側或右側駕駛的歷史討論
- 什麼是“理性”?
- 當理性策略取決於他人的策略時會發生什麼?
- 如果資訊不完整會發生什麼?
- 如果存在不確定性或風險會發生什麼?
- 在什麼情況下合作比自私更好?在什麼情況下合作是自私的?
- 持續的互動與一次性事件有何不同?
- 道德可以從理性的自私中推匯出嗎?
- 現實與博弈論有何比較?
無限或無限重複的囚徒困境博弈與有限重複或一次性博弈有何不同?為什麼?
兩家航空公司(美聯航,美國航空)分別提供從紐約到洛杉磯的 1 個航班。
價格 = $/pax,收益 = $/航班。
每架飛機載客 500 人。
固定成本為每航班 50000 美元,總需求為 200 美元時為 500 名乘客。
在 400 美元時,總需求為 250 名乘客。
乘客選擇最便宜的航班。
收益 = 收入 - 成本
兩人合作(4 分鐘)
1. 為博弈制定收益矩陣。
2. 什麼是均衡?
零和博弈:如果我們將博弈中的勝負相加,將損失視為負數,發現對於選擇的每組策略,總和為零,那麼該博弈就是“零和博弈”。
3. 如果存在第三個價格 300 美元,其需求為 375 名乘客,會發生什麼?
重新表述問題。
混合策略:如果博弈中的玩家以特定機率隨機選擇兩種或多種策略,則這種選擇被稱為“混合策略”。
- Levinson, David (2005) 擁堵和定價的微觀基礎:博弈論視角。交通研究 A 部分 第 39 卷,第 7-9 期,2005 年 8 月 - 11 月,第 691-704 頁。
- Levinson, David (2000) 串聯網路上的收入選擇。交通經濟與政策雜誌 34,1: 69-98。