交通經濟學/博弈
首先,讓我們玩奇偶遊戲。
這是一款經典的遊戲,用於確定決勝局或解決比賽。它只需要你的手指。
- 無限重複的迴圈賽(即使用下面連結中的時間表進行迴圈賽,然後重複進行,直到教授在某個不可預測的次數之後說停)。
- 收益矩陣(見下文),收益形式為 [A, B],因此第一個數字是玩家 A 的收益,第二個數字是玩家 B 的收益。玩家 A 是迴圈賽時間表中的第一個玩家。
- 遊戲 奇偶遊戲
- 策略(寫下來,現在暫時保密)
- 記分(記錄你的分數……榮譽系統)
- 獎品:你同行的敬畏
使用 迴圈賽時間表 來確定比賽的時間表。
| 玩家 B | |||
| 奇數 | 偶數 | ||
| 玩家 A | 奇數 | [3, 3] | [0, 5] |
| 偶數 | [5, 0] | [1, 1] |
這一切意味著什麼?
系統理性與使用者理性
以牙還牙與短視的自私
參見 阿納托爾·拉波波特,他為類似的基於計算機的策略開發了成功的以牙還牙策略。
博弈論關注的是對經濟主體戰略性互動的一般分析,其決策會相互影響。
可以用博弈論分析的問題
- 擁堵
- 融資
- 合併
- 公交車與汽車
- …
每個遊戲中的主體是誰?
在博弈論中,*支配*(也稱為戰略支配)發生在當一種策略對於某個玩家而言比另一種策略更好時,無論該玩家的對手如何行動。許多簡單的博弈可以使用支配來解決。相反,非傳遞性發生在當一種策略對於某個玩家而言可能比另一種策略更好或更差時,具體取決於該玩家的對手如何行動。(參考:佔優策略)
*納什均衡*(NE):如果 A 的選擇在給定 B 的情況下是最佳的,而 B 的選擇在給定 A 的情況下是最佳的,則一對策略被定義為 NE。NE 可以解釋為對每個人選擇的期望,這樣一來,一旦一個人做出自己的選擇,任何個人都不想改變自己的行為。
如果一個博弈中對於一個玩家存在嚴格佔優策略,那麼該玩家將在博弈的每個納什均衡中採用該策略。如果兩個玩家都有嚴格佔優策略,那麼該博弈只有一個唯一的納什均衡。但是,該納什均衡並不一定是帕累托最優的,這意味著博弈中可能存在非均衡結果,這些結果對兩個玩家都更好。用於說明這一點的經典博弈是囚徒困境。(參考:佔優策略)
| 玩家 B | |||
| i | j | ||
| 玩家 A | i | [3,3]* | [2,2] |
| j | [2,2] | [1,1] |
玩家 A 的收益用每個單元格中的第一個數字表示,玩家 B 的收益用該單元格中的第二個數字表示。因此策略對 [i,i] 意味著玩家 A 的收益為 3,玩家 B 的收益也為 3。NE 在上面的圖示中用星號表示。這表示一種情況,在這種情況下,每個公司或個人都在給定其他公司或個人選擇的條件下做出了最佳選擇。在這裡,A 和 B 都明顯更喜歡選擇 i 而不是選擇 j。因此 [i,i] 是一個 NE。
之前,我們玩過有限的一輪遊戲和無限重複的遊戲。這場遊戲被描述為“囚徒困境”。
“囚徒困境”這個詞語源於這樣一種情況:兩個犯罪合夥人被捕,分別接受調查。如果他們都“堅持到底”,他們因為缺乏證據而獲得輕判(比如各判 1 年)。如果他們都在審訊中崩潰並認罪,他們將均分犯罪時間(比如 10 年)。但如果一個人認罪,而另一個人不認罪,認罪的人成為汙點證人(獲得假釋)並幫助定罪另一個(在監獄裡服刑 20 年)。
在一次性或有限重複的囚徒困境博弈中,認罪(收費、背叛、偶數)是佔優策略,當兩個囚徒都認罪(收費、背叛、偶數)時,那就是佔優策略均衡。
(基於 Levinson, David (1999) 邊境收費:博弈論分析. 第十四屆國際交通運輸與交通理論研討會論文集 173-187.)
兩個州(特拉華州和新澤西州)被一片水域隔開。它們透過一座跨越該水域的橋樑連線起來。他們應該如何為這座橋樑和他們的其他道路提供資金?
他們應該收費還是徵稅?
令 和 是這兩個管轄區的收費。需求是負指數函式。(目標是最大化當地福利(居民的效用加上非居民的收費收入(居民的收費收入被視為轉移支付)。)
| 管轄區 J(新澤西州) | |||
| i | j | ||
| 管轄區 I(特拉華州) | i | [1153, 1153]* | [2322,883] |
| j | [883, 2322] | [1777,1777] |
該表格的閱讀方式如下:每個管轄區選擇兩種策略之一(收費或徵稅)。實際上,管轄區 1(特拉華州)選擇一行,管轄區 2(新澤西州)選擇一列。每個單元格中的兩個數字表示當選擇相應的策略對時,兩個州的結果。逗號左側的數字表示選擇行(特拉華州)的管轄區的收益,而逗號右側的數字表示選擇列(新澤西州)的州的收益。因此(向下閱讀第一列)如果他們都收費,每個人獲得 $1153/小時的福利,但如果新澤西州收費而特拉華州徵稅,新澤西州獲得 $2322 而特拉華州只獲得 $883。
因此:如何解決這場博弈?如果兩個州都希望最大化福利,哪些策略是“理性的”?新澤西州可能會這樣推理:“兩種情況可能發生:特拉華州可以收費或特拉華州可以繼續徵稅。假設特拉華州收費。那麼如果我不收費,我只能獲得 $883,如果我收費,我獲得 $1153,因此在這種情況下,收費是最好的。另一方面,如果特拉華州徵稅而我收費,我獲得 $2322,如果我徵稅,我們都獲得 $1777。無論哪種情況,收費對我來說都是最好的。因此,我會收費。”
但特拉華州的推理方式類似。因此,他們都收費,損失了 $624/小時。然而,如果他們“非理性”地採取行動,徵稅,他們每個人可以獲得 $1777/小時。
在英國、日本、澳大利亞和一些其他島國,人們在道路的左側行駛;在美國和歐洲大陸,他們在右側行駛。但在任何地方,每個人都在與其他地方相同的一側行駛,即使該側在不同的地方發生變化。
這種安排是如何實現的?
有兩種策略:左側行駛和右側行駛。有兩種可能的結果:兩輛車順利透過彼此或發生碰撞。我們任意將透過沒有問題的值分配為 1,將碰撞的值分配為 -10。這是收益表
| 賓士 | |||
| 左 | 右 | ||
| 別克 | 左 | [1,1] | [-10,-10] |
| 右 | [-10,-10] | [1,1] |
(目標:最大化收益)
驗證 LL 和 RR 都是納什均衡。
但是,如果我們不知道選擇哪一邊,我們就有可能會隨機選擇 LR 或 RL 併發生碰撞。我們怎麼知道該選擇哪一邊呢?答案是,對於這個協調博弈,我們依賴於社會習俗。相反,我們知道在這個博弈中,社會習俗非常強大且持久,在解決方案是 LL 的國家中並不比在解決方案是 RR 的國家中少。
參見 左側或右側行駛的歷史討論
- 什麼是“理性”?
- 當理性策略依賴於他人的策略時會發生什麼?
- 如果資訊不完整會發生什麼?
- 如果存在不確定性或風險會發生什麼?
- 在什麼情況下合作比自私更好?在什麼情況下合作是自私的?
- 持續互動與一次性事件有何不同?
- 道德可以從理性的自私中推匯出來嗎?
- 現實與博弈論相比如何?
無限次或無限次重複的囚徒困境博弈與有限次重複或一次性博弈有何不同?為什麼?
兩家航空公司(美聯航、美國航空)每家都提供從紐約到洛杉磯的 1 個航班。
價格 = 美元/人,收益 = 美元/航班。
每架飛機載客 500 人。
固定成本為每航班 50000 美元,總需求為 200 美元,500 名乘客。
400 美元時,總需求為 250 名乘客。
乘客選擇最便宜的航班。
收益 = 收入 - 成本
結伴工作(4 分鐘)
1. 制定博弈的收益矩陣。
2. 什麼是均衡?
零和博弈:如果我們把博弈中的勝負加起來,將損失視為負數,發現對於選擇的每一組策略,總和都是零,那麼這個博弈就是“零和博弈”。
3. 如果存在第三個價格 300 美元,需求為 375 名乘客,會發生什麼?
重新制定問題。
混合策略:如果博弈中的一個玩家根據特定機率隨機選擇兩種或多種策略,則此選擇稱為“混合策略”。
- Levinson,David(2005 年)擁堵和定價的微觀基礎:博弈論視角。運輸研究 A 部分,第 39 卷,第 7-9 期,2005 年 8 月至 11 月,第 691-704 頁。
- Levinson,David(2000 年)序列網路上的收益選擇。運輸經濟與政策雜誌,第 34 卷,第 1 期:69-98。