交通/選擇建模基礎
出行方式選擇分析 是傳統的四步交通預測模型中的第三步,緊隨出行生成和目的地選擇,但在路線選擇之前。雖然出行分配的區域間相互作用分析產生了一組起點-目的地 (OD) 表格,該表格說明了旅行的目的地,但出行方式選擇分析使模型構建者能夠確定將使用哪種交通工具。
旅行需求理論在交通生成附錄中介紹。該領域的核心是繼斯坦·華納 (Stan Warner) 在 1962 年發表的《城市出行中的模式戰略選擇:一項二元選擇研究》(Strategic Choice of Mode in Urban Travel: A Study of Binary Choice) 之後發展的一套模型。華納利用來自 CATS 的資料,使用生物學和心理學中的模型研究了分類技術。基於華納和其他早期研究者的工作,非聚合需求模型應運而生。分析是非聚合的,因為個人是觀察的基本單位,但同時又是聚合的,因為模型產生了一組描述人口選擇行為的單一引數。行為被納入是因為該理論使用了經濟學中的消費者行為概念和心理學中的部分選擇行為概念。加州大學伯克利分校 (尤其是丹尼爾·麥克法登,他因其努力獲得了諾貝爾經濟學獎) 和麻省理工學院 (摩西·本-阿基瓦)(以及與麻省理工學院相關的諮詢公司,尤其是劍橋系統公司)共同發展了現在被稱為選擇模型、直接需求模型 (DDM)、隨機效用模型 (RUM) 或其最常用的形式——多項式 logit 模型 (MNL) 的模型。
選擇模型吸引了大量的關注和研究;國際交通行為研究協會的會議記錄了模型的演變。這些模型在現代交通規劃和交通工程教科書中都有介紹。
模型快速發展的另一個原因是迫切的需求。當時正在提出一些系統(尤其是公交系統),而這些系統沒有使用轉向曲線中使用的經驗資料。選擇模型允許比較兩個以上的備選方案,以及備選方案屬性的重要性。人們普遍希望有一種分析技術,這種技術較少依賴聚合分析,並且具有更大的行為內容。此外,選擇模型也具有吸引力,因為它們在邏輯和行為方面可以追溯到 20 世紀 20 年代,同時在凱爾文·蘭卡斯特的消費者行為理論、效用理論和現代統計方法中都有根源。
Logit 模型由丹尼爾·麥克法登首次提出,該模型在各種形式下被廣泛用於交通預測。Logit 模型指出,選擇某種出行方式的機率與 的效用指數成正比,該效用指數除以所有效用指數的 的總和。
對於任何 Logit 模型,所有出行方式的機率之和都等於 1。
Logit 模型還指出,如果在系統中新增(或移除)新的交通工具,則原始交通工具將失去(或獲得)與它們原本的份額成正比的旅行量。
Logit 模型的步驟
- 計算每個 OD 對和出行方式的效用
- 計算每個 OD 對和出行方式的效用指數
- 對每個 OD 對的效用指數求和
- 根據 OD 對計算每個出行方式的機率
- 將每個 OD 對的機率乘以每個 OD 對的旅行次數

早期心理學研究涉及典型的實驗:這裡有兩個重量不同的物體, 和 ,哪個更重?從這樣的實驗中得出的結論是,重量差異越大,選擇正確的機率就越大。結果與右側的圖表相似。
路易斯·萊昂·瑟斯頓(Louis Leon Thurstone)在 1920 年代提出,感知到的重量為
,
其中 是真實重量,而 是隨機的,並且
假設 是正態分佈且獨立同分布(NID),就會得到二元 probit 模型。
計量經濟學公式
[edit | edit source]經濟學家處理的是效用而不是物理重量,他們認為
- 觀察到的效用 = 平均效用 + 隨機項。
在這種情況下,效用指的是做出特定選擇或消費商品或服務所獲得的總滿意度(或幸福感)。
必須考慮物件的特徵 x,所以我們有
- u(x) = v(x) + e(x)。
如果我們遵循瑟斯頓的假設,我們又會得到一個 probit 模型。
另一種方法是假設誤差項獨立同分布,服從 Weibull、Gumbel 型別 I 或雙指數分佈(它們非常相似,並且在尾部(更厚)與正態分佈略有不同)。這將產生多項式 logit 模型 (MNL)。丹尼爾·麥克法登(Daniel McFadden)認為,與其他可能用到的分佈相比,Weibull 具有理想的特性。除其他因素外,誤差項是正態分佈且獨立同分布的。logit 模型只是選擇一種模式的機率與不選擇該模式的機率的 log 比值。
請注意 logit 模型與我們之前估計的 S 形曲線之間的數學相似性,儘管在這裡共享量隨著效用而不是時間而增加。使用選擇模型,我們解釋的是使用某一模式的旅行者比例(或單個旅行者使用某一模式的機率乘以旅行者數量)。
與 S 形曲線的比較表明,模式(或技術)隨著其效用增加而被採用,這種情況隨著時間的推移由於多種原因而發生。首先,因為效用本身是網路效應的函式,使用者越多,服務越有價值,與加入網路相關的效用就越高。其次,因為效用隨著使用者成本下降而增加,這種情況發生在固定成本可以在更多使用者中分攤時(另一種網路效應)。第三,技術進步隨著時間的推移以及使用者數量的增加而發生,從而降低了相對成本。
效用表示式的示例如下
其中
- Pi = 選擇模式 i 的機率。
- PA = 選擇汽車的機率
- cA,cT = 汽車、公交的成本
- tA,tT = 汽車、公交的行程時間
- I = 收入
- N = 旅行者數量
透過代數運算,該模型可以轉化為其最常用的形式
對該模型的估計和使用,可以做出兩個相互矛盾的陳述。
- 它是“紙牌屋”,
- 由技術熟練且思維嚴謹的分析師使用,它是有用的。
“紙牌屋”問題主要源於模型規範的效用理論基礎。總體而言,效用理論假設 (1) 使用者和供應商對市場擁有完美資訊;(2) 他們具有確定性函式(面對相同的選擇,他們將始終做出相同的選擇);(3) 在備選方案之間切換是無成本的。這些假設與人們對行為的瞭解並不相符。此外,由於沒有普遍的效用尺度,因此不可能將效用在人群中進行彙總。
假設一個選項的淨效用為 ujk(選項 k,人 j)。我們可以想象它具有一個系統部分 vjk,它是物件特徵和人 j 的函式,加上一個隨機部分 ejk,它代表品味、觀察誤差和其他許多東西(這裡變得模糊)。(車輛等物體沒有效用,而是車輛的特性具有效用。)引入 e 使我們能夠進行一些彙總。如上所述,我們認為可觀察效用是一個函式
其中每個變數代表汽車旅行的一個特徵。值 β0 被稱為特定於替代方案的常數。大多數建模者認為它代表了方程式中遺漏的特徵(例如,交通方式的政治正確性,如果我乘坐公共交通工具,我會感到道義上的正義,因此 β0 對於汽車來說可能為負),但也包括使誤差項 NID 所需的任何內容。
計量經濟學估計
[edit | edit source]
現在談一些技術問題,我們如何估計 v(x)?效用 (v(x)) 是不可觀察的。我們所能觀察到的只有選擇(例如,測量為 0 或 1),並且我們想討論從 0 到 1 的選擇的機率。(如果我們對 0 和 1 進行迴歸,我們可能會測量 j 乘坐汽車的機率為 1.4 或 -0.2。)此外,誤差項的分佈將沒有合適的統計特徵。
MNL 方法是對這種函式形式進行最大似然估計。似然函式為
我們求解估計引數
使 L* 最大化。這種情況發生在
對數似然更容易處理,因為乘積變成了求和
考慮從 John Bitzan 的交通經濟學筆記中採用的一個例子。令 X 為一個二進位制變數,它以機率 (1- gamma) 為 gamma 和 0。然後 f(0) = (1- gamma) 且 f(1) = gamma。假設我們有 5 個 X 的觀察值,得到樣本 {1,1,1,0,1}。要找到 gamma 的最大似然估計量,檢查 gamma 的各種值,並針對這些值確定抽取樣本 {1,1,1,0,1} 的機率。如果 gamma 取值為 0,則抽取我們樣本的機率為 0。如果 gamma 為 0.1,則得到我們樣本的機率為:f(1,1,1,0,1) = f(1)f(1)f(1)f(0)f(1) = 0.1*0.1*0.1*0.9*0.1=0.00009。我們可以計算在 gamma 的一個範圍內獲得我們樣本的機率——這是我們的似然函式。logit 模型中 n 個獨立觀察值的似然函式為
其中:Yi = 1 或 0(例如選擇自動或非自動) 以及 Pi = 觀察到 Yi=1 的機率
因此,對數似然函式為
在二項式(二元選擇)logit 模型中,
- ,因此
對數似然函式透過將偏導數設定為零來最大化
以上是現代 MNL 選擇模型的精髓。
無關備選方案獨立性 (IIA)
[edit | edit source]無關備選方案獨立性是 Logit 的一個特性,但並非所有離散選擇模型都具有此特性。簡而言之,IIA 的含義是,如果您添加了一種模式,它將從現有的模式中以與現有份額成比例的方式提取。 (同樣,如果您刪除一種模式,其使用者將以與其先前份額成比例的方式切換到其他模式)。 為了瞭解為什麼此屬性可能會導致問題,請考慮以下示例:假設在我們的 logit 模式選擇模型中存在七種模式(獨自駕車、拼車 2 人、拼車 3 人以上、步行至公交、自動駕駛至公交(路邊停車)、自動搭乘公交(kiss and ride)以及步行或騎腳踏車)。 如果我們取消“kiss and ride”,可能會有不成比例的人使用“路邊停車”或“拼車”。
再舉一個例子。假設在駕駛和乘坐紅色公交車之間進行模式選擇,目前兩者各佔 50% 的份額。 如果我們引入另一種模式,稱為藍色公交車,其屬性與紅色公交車相同,logit 模式選擇模型將為每種模式分配 33.3% 的市場份額,換句話說,公交車將總共佔 66.7% 的市場份額。 邏輯上,如果模式完全相同,它將不會吸引任何額外乘客 (雖然人們可以想象,增加容量會增加公交模式份額,特別是如果公交車容量有限的情況下)。
有幾種策略可以幫助解決 IIA 問題。選擇巢狀可以幫助我們減少這個問題。 然而,存在巢狀結構適當性的問題。 其他替代方案包括更復雜的模型 (例如混合 Logit),這些模型更難估計。
回到根源
[edit | edit source]以上討論基於經濟學家的效用公式。 在 MNL 建模開發時,人們曾將注意力集中在心理學家對選擇的研究上 (例如, Luce 在 1959 年的《個人選擇行為》中討論的 Luce 選擇公理)。 它在計算過程建模中具有分析方面。 重點在於人們在做出選擇或解決問題時的思維方式 (見 Newell 和 Simon 1972)。 換句話說,與效用理論相反,它強調的不是選擇,而是選擇的做出方式。 它為旅行選擇和活動議程提供了概念框架,包括對長期和短期記憶、效應器以及思維和決策過程的其他方面的考慮。 它以處理資訊搜尋和處理方式的規則形式出現。 儘管在交通工作中對行為分析非常重視,但現代心理學思想的精華才剛剛開始進入該領域。 (例如 Golledge、Kwan 和 Garling 1984; Garling、Kwan 和 Golledge 1994)。
示例
[edit | edit source]示例 1:模式選擇模型
[edit | edit source]
您被提供此模式選擇模型
其中
- = 模式成本(美分)/ 工資率(每分鐘美分)
- = 車內旅行時間(分鐘)
- = 車外旅行時間(分鐘)
- = 模式特定虛擬變數:(虛擬變數取值 1 或 0)
- = 駕駛,
- = 具有步行通道的公交,[基礎模式]
- = 具有汽車通道的公交,
- = 拼車
有了這些輸入
| ' | 駕駛 | 步行連線公交 | 汽車連線公交 | 拼車 |
| t = 車內旅行時間(分鐘) | 10 | 30 | 15 | 12 |
| t0 = 車外旅行時間(分鐘) | 0 | 15 | 10 | 3 |
| = 駕駛, | 1 | 0 | 0 | 0 |
| = 具有步行通道的公交,[基礎模式] | 0 | 1 | 0 | 0 |
| = 具有汽車通道的公交, | 0 | 0 | 1 | 0 |
| = 拼車 | 0 | 0 | 0 | 1 |
| 成本 | 25 | 100 | 100 | 150 |
| 工資 | 60 | 60 | 60 | 60 |
最終的模式份額是多少?

| 輸出 | 1: 駕駛 | 2: 步行連線公交 | 3: 汽車連線公交 | 4: 拼車 | 總計 |
| 效用 | -1.26 | -2.09 | -3.30 | -3.58 | |
| EXP(V) | 0.28 | 0.12 | 0.04 | 0.03 | |
| P(V) | 59.96% | 26.31% | 7.82% | 5.90% | 100% |
解釋
時間價值
(以 1967 年的美元計算,當時工資率約為 2.85 美元/小時)
這意味著,如果您能以低於 1.10 美元/小時/人的成本改善旅行時間(透過增加公交數量,減少瓶頸等),那麼它在社會上是值得的。
示例 2:模式選擇模型解釋
[edit | edit source]在一個確定性世界中,鑑於這些事實,一個完全理性、完全知情的旅行者會選擇哪種模式?

| ' | 公交 | 汽車 | 引數 |
| Tw | 10 分鐘 | 5 分鐘 | -0.147 |
| Tt | 40 分鐘 | 20 分鐘 | -0.0411 |
| C | $2 | $1 | -2.24 |
汽車總是獲勝(只要所有引數都小於 0,就與引數無關)

| ' | 公交 | 汽車 | 引數 |
| Tw | 5 分鐘 | 5 分鐘 | -0.147 |
| Tt | 40 分鐘 | 20 分鐘 | -0.0411 |
| C | $2 | $4 | -2.24 |
| 結果 | -6.86 | -10.51 |
在觀察到的引數下,公交總是獲勝,但並非在所有引數下都如此。
需要注意的是,個人引數各不相同。我們可以引入社會經濟和其他可觀察的特徵以及隨機誤差項,使問題更具現實意義。
示例問題
[edit | edit source]其他問題
[edit | edit source]變數
[edit | edit source]- - 從 i 到 j 透過 m 方式出行的效用
- = 方式特異性虛擬變數:(虛擬變數取值為 1 或 0)
- = 方式 m 的機率
- = 方式成本(美分)/ 工資率(每分鐘美分)
- = 車內旅行時間 (分鐘)
- = 車外旅行時間 (分鐘)
- = 方式特異性虛擬變數:(虛擬變數取值為 1 或 0)
縮略語
[edit | edit source]- WCT - 步行連線公交
- ADT - 汽車連線公交(獨自開車/停車換乘)
- APT - 汽車連線公交(汽車乘客/送客換乘)
- AU1 - 汽車駕駛員(無乘客)
- AU2 - 汽車 2 人乘坐
- AU3+ - 汽車 3 人及以上乘坐
- WK/BK - 步行/騎行
- IIA - 無關選擇項獨立性
關鍵術語
[edit | edit source]- 出行方式選擇
- Logit 模型
- 機率
- 無關選擇項獨立性 (IIA)
- 虛擬變數 (取值為 1 或 0)
影片
[edit | edit source]參考文獻
[edit | edit source]- Garling, Tommy Mei Po Kwan, 和 Reginald G. Golledge. 家庭活動安排,交通研究,22B,pp. 333–353. 1994。
- Golledge. Reginald G.,Mei Po Kwan,和 Tommy Garling, “家庭出行決策的計算過程建模”,區域科學論文集,73,pp. 99–118. 1984。
- Lancaster, K.J.,消費者理論的新方法。政治經濟學雜誌,1966. 74(2): p. 132-157。
- Luce, Duncan R. (1959). 個人選擇行為,理論分析。紐約,Wiley。
- Newell, A. 和 Simon, H. A. (1972). 人類問題解決。新澤西州恩格爾伍德懸崖:普倫蒂斯-霍爾。
- Ortuzar, Juan de Dios 和 L. G. Willumsen's 交通建模。第 3 版。Wiley and Sons. 2001,
- Thurstone, L.L. (1927). 比較判斷法。心理評論,34,278-286。
- Warner, Stan 1962 城市出行中的模式戰略選擇:二元選擇研究