65
路網動態資訊之探討 高維度統計方法應用於 研發計畫成果報告

高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

  • Upload
    others

  • View
    13

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

路網動態資訊之探討

高維度統計方法應用於

研發計畫成果報告高維度統計方法應用於路網動態資訊之探討

Page 2: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

財團法人中華顧問工程司

105年度

計畫名稱:高維度統計方法應用於路網動態資訊之探討

計畫編號:05923

執行期間:自 105年 1月 1日至 105年 12月 31日止

Page 3: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

財團法人中華顧問工程司

105 年度研發計畫成果摘要報告(中文)

計畫編號 05923 計 畫 名 稱 高維度統計方法應用於路網動態資訊之探討

本司主辦單位:交通控制研究中心

主管:黃銘崇 主任

計畫主持人:黃銘崇 主任

研究人員:牛維方、黃友恆、李信儀、卓奕志

聯絡電話:(02)87325567#1318

傳真號碼:(02)87328967

e-mail:[email protected]

合作/委外研究單位:

計畫協同主持人:

研究人員:

地址:

聯絡電話:

e-mail:

研究期間 自 105 年 1 月 至 105 年 12 月

總經費 NT$ 165,000 自辦金額 NT$ 165,000 委外金額 NT$ 0

機密等級 ▓普通 □密 (解密條件:□ 年 月 日解密,□結案後解密)

研發成果 ▓期末報告書、期末簡報資料 □ 論文

□軟體應用程式 □ 硬體產品 □ 專利

關鍵字 車流量傳遞、缺失值插補、資料一致性

成果摘要:

這個研究計畫在均勻車流假設下,推導上下游定點間流量傳遞關係,其最重要的特點是

具有空間上短距離及時間上短時程相依,亦即在一封閉路段上,特定地點偵測器在一時間區

間內測得的流量只為最近之上游特偵測器定連續兩個時間區間的流量的凸組合,且權重只與

偵測器間距離有關,因此計算相對簡單。透過檢視 ETC M06A 表的細部資料我們發現所需的

假設在一般狀況下是可接受的,而權重在各 ETC 偵測器組合中隨距離呈現簡單的遞減關

係,可利用回歸得到一般性的函數並用於任意距離的偵測器組合。

由於流量傳遞關係描述路段上流量的時空關聯,一個自然的應用就是流量缺失值插補。

本研究亦建議缺失值位於高速公路主線上下游或匝道的各種狀況下進行插補的方法與公

式,進一步還可應用於上下游偵測器間流量資料一致性的檢驗。最後針對這兩項應用以國道

三號北部路段 ETC 及 VD 偵測器流量資料作為範例。

Page 4: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

China Engineering Consultants, Inc.

2016 Research & Development Results Summary Sheet

Project No 05923 Project

Name

An investigation for applying high dimensional

statistical methods to traffic network analysis

Department: Traffic Control Research Center

Manager: Ming-Chorng Huang

Principal Investigator: Ming-Chorng Huang

Project Staff: Wei-Fang Niu

You-Heng Huang

Hsin-Yi Lee

Yi-Chih Cho

Phone: +886-2-8732-5567 Ext.1318

Fax: +886-2-8732-8967

e-mail:[email protected]

Research Agency:

Principal Co-Investigator:

Project Staff:

Address:

Phone:

e-mail:

Project period From: 2016/1 to: 2016/12

Total Fee NT$165,000 CECI

Portion

NT$165,000 Agency

Portion

NT$0

Confidentiality

Classification

▓ Not Classified; □ Classified

Conditions For Removing Confidentiality:

□ Year Month Day, for removing confidentiality

□ Removal of confidentiality after the conclusion of the project

R&D Results ▓ Final Report and Presentation Material □ Paper/Thesis

□ Application Software □ Product(Hardware) □ Patent □ Other

Key Words traffic volume transfer、missing value imputation、data consistency

Abstract:

This study derived a simple relation for upstream-downstream traffic volumes under the

assumption of uniform traffic streams. The relation features a small range spatial-temporal

dependence of volumes from two sequential detectors. More specifically, the volume collected

from a specific detector is a convex combination of the volumes from the nearest upstream detector

in two earlier consecutive periods. The weights depend on the distances between detectors only.

Thus, this relation leads to simple calculations in its applications. Through investigating the detail

information in the ETC M06A datasets collected from the web of the national freeway bureau, we

found that the assumption is acceptable in general and the required weights can be obtained

through the smoothing spline method. Finally, we illustrate its applications with missing data

imputation and consistency tests among detectors in the Formosa highway in Taiwan.

Page 5: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

I

目錄

圖目錄

表目錄

壹、 計畫簡介 ................................................................................................... 1

貳、 文獻回顧 ................................................................................................... 3

參、 自由車流下的流量遞移關係 .................................................................... 5

3.1 流量遞移關係.................................................................................... 5

3.2 利用高速公路 ETC 資料驗證流量遞移關係 .................................... 6

3.3 實際應用的其他考量 ........................................................................ 8

肆、 流量遞移關係的應用 .............................................................................. 11

4.1 插補流量缺失值 .............................................................................. 12

4.1.1 主線上無分流、匯流時的插補 ................................................ 12

4.1.2 交流道區間有分流、匯流時的插補 ........................................ 13

4.1.3 插補實例 ................................................................................... 15

4.2 驗證偵測器間流量資料的一致性 ................................................... 16

4.2.1 主線上 VD 及 ETC 流量資料間的一致性 ............................... 17

4.2.2 匝道間主線、上匝道 VD 及下游 ETC 流量資料間的一致性 . 19

4.2.3 上游 ETC 及下匝道、匝道間主線 VD 流量資料間的一致性 . 21

伍、 結論與未來方向 ..................................................................................... 24

參考文獻…………………………………………………………………………..…25

附錄一 期末簡報簽到單...…………………...……………………………………26

附錄二 期末簡報意見回覆..………………………………………………………27

Page 6: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

II

圖目錄

圖 1 穩定車流假設下定點間流量的遞移 ........................................................... 6

圖 2 門架 03F0559N→03F0525N間在 105年 8月 3日統計量趨勢圖 ............... 8

圖 3 國道三號北上相鄰起訖門架間當期穿越比率 ............................................ 9

圖 4 2016 年 8 月第一、二週國三北區新店至鶯歌系統間通過特定門架後續行

至下一門架比率。 ........................................................................................ 10

圖 5 簡單的高速公路路網 ................................................................................. 11

圖 6 中和交流道上游主線(32.735KM)缺失值插補 .......................................... 15

圖 7 中和交流道下游主線(39.130KM)缺失值插補 .......................................... 16

圖 8 2016年 9月國道三號南下 33.7公里處 ETC所偵測到的流量與附近上下游

VD偵測到的流量比較 ................................................................................... 18

圖 9 2016年 9月國道三號北上 33.8公里處 ETC所偵測到的流量與附近上下游

VD偵測到的流量比較 ................................................................................... 19

圖 10 2016年 9月國道三號南下 33.7公里處(安坑、中和間)ETC經上游交流

道 VD流量估算所得與實際觀察到的流量比較 ............................................ 21

圖 11 2016年 9月國道三號南下安坑交流道上下匝道間主線估算所得與實際

觀察到流量的比較 ........................................................................................ 23

Page 7: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

III

表目錄

表 1 2016年 9月國道三號南下/北上 33.7/33.8公里處上下游流量比較 .... 17

表 2 2016年 9月國道三號南下 33.7公里處與上游交流道流量比較 ............ 20

表 3 2016年 9月國道三號南下 33.7公里處與下游交流道流量比較 ............ 22

Page 8: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

1

壹、 計畫簡介

道路交通本身是一種複雜現象,尤其考慮多車道、多種車型的狀況下要

進行交通流量預測所牽涉的變數繁多,在暢通與雍塞時,個別變數的影響方

式也可能大相逕庭,因此,建構能夠長期有效對道路流量及相關資訊進行預

測的系統就是一個相當大的挑戰。

進行流量預測的重要目的之一就是要讓用路人據以進行路徑規劃及讓管

理人員設定管制策略,因此實際建構的系統必須全面性地對路網(Network)進

行預測,將各路段間的關聯性納入考量,並以足夠長度的資料調校及驗證。

針對這個問題,技術上較簡單的方式是先針對單一路段進行預測後再進行組

合,在 2000 年以後的文獻可說已將常用的分析模型與方法應用於單一路段

的流量預測,包括回歸、時間序列、訊號處理、類神經網路及多種統計學習

的方法等都已經過反覆驗證,雖然成果看似豐碩,但這些研究通常基於作者

收集之短期的單一路段資料,普遍缺乏於大範圍及較長期間實施的策略與成

效驗證紀錄。尤其重要的是,這種組合的方式因為沒有加入車流在路段間分

合的考量,很可能出現資訊運用不完備導致路段與路段間預測不一致的狀

況。

另一種全然不同的思維就是同步運用所有資訊進行整個路網的預測,當

然,這在技術上和資料完備程度的要求上是較高的。目前台灣地區在高速公

路及都會區已建置相當數量的車輛偵測器及各種系統收集流量資訊,並以公

開資料的形式供公眾下載分析,因此用以調校及驗證模型的資料已相當充足。

但另一方面,現有資訊收集系統的密度也並未高到足以直接將所有收集到的

資料直接輸入基本車流模型即可獲得有效結論的程度,也就是說,由於偵測

器間仍有一定的的距離,我們無從得知特定時間通過特定偵測點的車輛在何

時通過下一偵測點(目前高速公路之 ETC 資料僅可在「事後」提供此資訊,

平面道路上則付之闕如),此一分布可能相當分散,加上道路連接點的分流與

匯流,整個路網上的車流形成一組時空關係複雜交織的資料。因此,路網階

層的預測面臨的問題是變數(各路段時段的車速、流量等)數量的快速上升,

且其間的關聯性又不可輕易忽視,此類「維度詛咒」問題正是當前各領域的

專家共同面對的困難,在交通流量預測上同樣需要更深入的研究與探討。

這次研究的目的是路網預測方法的的初步探討,計畫設定的方向是利用

分群法將路段分成(可能相互重疊的)若干群,在對較小的路網建模,工作項

Page 9: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

2

目包含以下幾個部分:

(1)資料收集與整理及文獻回顧

(2)訂定暢通雍塞分群標準

(3)降維並篩選變數

(4)建構預測模型與演算法

(5)模型驗證

在計畫執行時,對相關文獻進行回顧、整理後及取實際資料進行初步測

試後研究已略作調整,嘗試從較簡單的均勻車流假設開始,建構上下游路段

間流量遞移關係,並以高速公路為例,利用 ETC 收集的旅次細部資料(M06A

表)驗證所需假設,再進一步發展其應用方式包含插補及比對偵測器資料一致

性等,並以國道實例說明。

後續章節安排如下,第二章對相關重要文獻作一簡單回顧,第三章說明

自由車流下的流量遞移關係,並驗證其假設,第四章為流量遞移關係的應用

範例,第五章為結論及未來發展方向的探討。

Page 10: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

3

貳、 文獻回顧

短期交通流量預測(Short Term Trafic Forecast)方法的發展已有超過三十

年的歷史[1],但以路網為預測標的的研究[2][3][4]在 2012 年後才逐漸增加。近

期 E. I. Vlahogianni[5]

所撰寫的評論就相關課題提供了相當完整的回顧。

若僅針對單一路段進行分析預測,許多模型與演算法都可相當程度地達

成需求,由使用者依需求及對方法熟悉的程度選用。但當分析目標是整個路

網,技術上將面臨兩個方向上的挑戰。第一是變數數量的增加。除了多個路

段當期的資訊,各路段前期的資訊也必須同時考量,其次,各路段上下游流

量間必然存在特定的時空關係,這表示模型中必須內含上述的限制條件。

基於格位傳遞模型(Cell Transmission Model)進行路況分析與預測最合於

理論框架的方式之一,可以有效處理前述流量上下游時空關聯的問題。近期

如 Pascale 等人[6]將各路段道路狀態(暢通或雍塞)與車流密度設為狀態變數,

如此問題就成為一個跳躍馬可夫線性系統(Jump Markov Linear System),可以

利用信度傳遞 (Belief Propagation)演算法進行路網層級的推論與預測。此一

架構可能的困難在於偵測器的密度必然不足以滿足理論模型的需求,因此對

應大量缺失值處理與否直接影響演算的複雜度、速度與結果的準確度,如何

合理地進行簡化是進行大規模應用的關鍵。

另一種處理方式則是利用機器學習中的降維(dimension reduction)及分群

(clustering) 等方法,找出變數中彼此間的統計的關聯性,再利用與因變數有

關的變數群進行預測。例如 Sun 等人[4]利用 Graphical Lasso (g-lasso)決定路

段流量間的關聯,再針對各路段流量逐一建構類神經網路模型進行預測。由

於 g-lasso 計算速度快,這種處理方法可處理大範圍的路網,但最終選擇的變

數群是否具有意義或純為統計上的假象則難以判斷,更重要的盲點則是上下

游流量關聯在此並未直接明確地被納入考量,僅是隱含於演算法得到的統計

關聯中,因而可能對其進階應用(如預測壅塞及旅行時間)產生限制。當然,

在線性假設下進行變數選擇然後以非線性模型進行預測則顯得方法本身有所

矛盾。

一個相關的問題是關於流量資料中缺失值的插補,直覺的處理方法是以

歷史資料或相鄰時間的(加權)平均,但這些方法通常並未考慮流量的時空關

聯。處理插補問題時,若已有一個明確的模型描述路網流量,則基於此模型

進行插補就是單純的統計問題。在缺乏適當模型時,L. Qu 等人[7]則是建議利

Page 11: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

4

用機率主成分分析法(Probabilistic Principal Component Analysis, PPCA)進行

插補,他們的做法是將每日的分時流量視為一個向量,假設這個觀察值來自

一個因素模型(factor model),但有部分缺失的觀察值,利用期望-最大化演

算法(Expectation-Maximization Algorithm)估計後進行插補。

此外,A. Abadi[8]等人則從旅次的觀點來構建流量預測模型,當中主要核

心工作在運用最新流量資料迭代更新起訖矩陣(Origin-Destination matrix)及

路段分流比率(link-to-link dividing ratio)兩項資訊,再搭配適當的自回歸

(Autogressive model)模型即可進行預測。

綜合以上,構建路網或多點的流量模型仍有相當大的發展空間,在切合

實際現象與可接受的運算複雜度間須作適當調適,裨益於後續的進階應用。

Page 12: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

5

參、 均勻車流下的流量遞移關係

Sun 等人[4]利用 g-lasso 的處理架構展示一個從統計關聯將路段分群而

後分別建模的標準手法,但在技術細節上仍有一些值得討論的地方。使用

g-lasso 時主要的輸入是所有變數間的共變異數矩陣,在其較早的論文中[9],

他們直接以流量觀察值計算共變異數矩陣,並列出與特定路段相關係數最高

的 20 個路段(當期或前期的觀察值),值得注意的是,這些相關係數全部都高

於 0.95!顯然當中必然有某些特定的因子可用以說明該路網的流量關係。

其實造成這種現象的原因很簡單,因為作者使用的共變異數矩陣當中的

組成主要反應的是車流量隨著每日活動週期的升降,而同一區域中各路段的

流量大致遵循相同的週期起伏,自然相關係數都很接近 1。同樣的,使用

g-lasso 時若逕行以流量本身建構共變異矩陣,反應的仍是日內周期的趨勢而

非短期間流量的變動,如此一來由於統計假象而誤選變數的可能性大增,實

際現象則是如[4]文中圖四所示,選出距離較遠而不易解釋的路段。

在此必須強調的是,要準確找出路網中流量短期間的關聯,必須有效擷

取對應該時頻(例如 5 分鐘)的變異量,要達成這個目的有若干種去除趨勢

(de-trending)方法可供選擇,但何者適合交通流量資料仍需仔細驗證。此外,

在封閉路段中,下游特定地點的車流必然來自上游路段稍早的流量,與該下

游路段先前的流量無關,而若已知上游路段的流量,也可以不必再考慮更上

游的流量。因此,我們嘗試另一個方式,依據簡單的假設推導均勻車流下的

流量遞移關係,並利用高速公路 M06A 表資料就所需假設及參數性質進行驗

證所需假設,並嘗試推導若干可能應用。

3.1 流量遞移關係

若車流穩定,道路上下游的流量應該有很簡單的流量遞移關係。考慮高

速公路上距離不遠兩個偵測器 A、B,假設其間車流穩定,計算流量的時間長

度為。若所有車輛以固定車速行駛,從 A至 B 所需時間為 tAB,定義[x]為小

於x的最大整數,例如[1]=0,[1.00001]=1。若 ktAB

,則 )1( ktk AB 。

下圖 1中 Aq0 及Aq 分別表示在時間區間(0,)及(,2)通過 A點的流量,在時

間 k,僅有部分的 Aq0 通過 B點;而在時間(k+1), Aq0 已完全通過 B點,而 Aq

Page 13: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

6

僅有部分通過,而在時間區間(k, (k+1))通過B點的流量(紅色方框)則由 Aq0

及 Aq 所組成。

資料來源:本研究

圖 1 穩定車流假設下定點間流量的遞移。

顯而易見,若車流量均勻,下游 B點在時間區間(k, (k+1))的流量與

上游 A點的流量間的關係如下:

AABAABABB

k qkt

qtk

kt

q 0

)1(

注意當中兩個係數

ABtk )1(及

ktAB 都小於 1。

若 k=0,亦即 ABt0 ,表示有若干比例的車輛可以在單位時間之內

穿越 A及 B,而對應的係數

ABAB ttk

1

)1(與 A、B間距離有關,距離

越遠則係數越小,反之則係數越接近 1。以下我們稱此係數為「當期穿越比

率」。

雖然此一簡單關係背後的假設非常強,但如果流量在合理範圍內,真實

狀況未必距離此假設很遠,則上述公式仍提供未發生壅塞時車流量隨時空遞

移實用且簡單的方法。下一節利用 ETC 收集之旅次資料(M06A 表)檢視所

需的假設。

3.2 利用高速公路 ETC 資料驗證流量遞移關係

自 2014 年高速公路電子收費系統全面實施後對於行駛高速公路的車輛

動態提供了更細緻的資訊,目前這些資料也都以公開資料的形式提供下載作

各式各樣的分析應用。其中 M06A 表提供每日所有行駛高速公路的旅次通過

Page 14: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

7

各個偵測架的時間,對於分析高速公路車流有極大的幫助。本研究中所有ETC

及 VD 資 料 均 自 高 速 公 路 局 「 交 通 資 料 庫 」 下 載 , 網 址 為

http://tisvcloud.freeway.gov.tw/。

要驗證前一節的假設,我們收集 105年 8月每日的 M06A 表,並抽取出

通過國道三號北上路段的旅次,從其中萃取通過前後兩門架的時間。例如有

一旅次自三鶯交流道行駛至中和交流道,當中通過 03F0498N、03F0447N、

03F0394N 三支門架,這樣的旅次就會產生兩筆紀錄,分別是 03F0498N→

03F0447N 及 03F0447N→03F0394N 對應的時間。注意這兩筆紀錄中第一筆的

到達時間和第二筆的出發時間是相同的。其他更長的旅次也都用相同的方式

拆解,只通過一個門架的旅次則不會被納入。

接下來則對每組起訖門架依每五分鐘的時間區間計算以下統計量:

1

tN : 在特定時間區間內通過第一個門架的車輛數;

12

ttN : 在特定時間區間內通過第一個門架及第二個門架的車輛

數。

12

1ttN : 在特定時間區間內通過第一個門架並在下一時間區間通

過第二個門架的車輛數。

依前一小節的定義,「當期穿越比率」為同一時間區間內連續通過第一個

門架及第二個門架的車輛數占該時間區間內通過第一個門架的車輛數之比率,

亦即1

12

t

tt

N

N 。若兩門架距離不遠足以讓一定比率的車輛在五分鐘內通過,而「當

期穿越比率」不隨時間有明顯改變,且 11

12

1

1

12

t

tt

t

tt

N

N

N

N,則前一節所做的「車

流穩定」之假設大致就是可以接受的。

下圖 2顯示兩門架 03F0559N→03F0525N間在 105年 8月 3日當日各項統

計量的趨勢圖。第一列左右兩圖相同,都是每五分鐘通過 03F0559N的流量,

第二列左邊為當期即通過第二個門架的車輛數,右邊為下一期才通過第二個

門架的車輛數,第三列左右圖分別顯示比率1

12

t

tt

N

N 及1

12

1

t

tt

N

N 。

Page 15: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

8

「資料來源:本研究」

圖 2 門架 03F0559N→03F0525N間在 105年 8月 3日統計量趨勢圖。第一行是通過上游門

架 03F0559N的流量,左右相同,第二行左右分別是當期及次期通過下游門架的流量,第三

行則分別是「當期穿越比率」及「次期穿越比率」,亦即第二行流量對第一行比值。

很明顯的,除去深夜流量很低的時段,「當期穿越比率」大致是一個穩定

的常數,同時 6.01

12

t

tt

N

N, 4.0

1

12

1

t

tt

N

N,亦即幾乎所有車輛在兩個時間區間

就通過兩個門架。這個現象普遍可見於各門架間,只有在流量很高的時段才

會觀察到「當期穿越比率」下降,因此,前一節所做的「車流穩定」假設看

似嚴格,但在小區域、未嚴重壅塞及流量不至於過低的條件下其實並不容易

產生嚴重的背離,這意味上述流量遞移關係在一般狀況下至少是可以接受的

近似。而由於計算簡單,我們可以預期它在實際應用上的巨大潛力。

3.3 實際應用的其他考量

要進一步應用上述流量遞移關係於實際問題上仍有一些細節需要釐清。

首先,是否每一路段都有自己獨特的「當期穿越比率」或者該比率可由少數

因素如兩門架間距離決定。其次,上匝道的車流與原本主線的車流合流時僅

需直接轉換後加總即可,但下匝道的車流分流時則額外需要考慮下匝道比率,

Page 16: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

9

以區分出下游主線及下匝道各自的流量。

對於前者,我們收集國道三號北上 73 個門架(72 組起訖門架)2016 年 8

月的資訊,為避免深夜及尖峰時段引入過大變異,我們選擇每天上午 10時至

下午 14 時共 48 個時段,每組起訖門架以全月所有「當期穿越比率」取中位

數。下圖 3 顯示「當期穿越比率」與起訖門架距離有明確反向且近於線性關

係,當兩門架間距離太遠到超過 10公里以上,此一比率即接近 0,幾乎不會

有車輛能夠在單位時間內通過該兩個門架,而當兩門架間距離短至 1 公里,

大約 90%的車輛都可以在 5 分鐘內穿越兩個門架。圖中的回歸曲線可利用

smoothing spline 或其他統計方法計算,並據以計算特定距離門架或車輛偵

測器間的「當期穿越比率」。

「資料來源:本研究」

圖 3 國道三號北上相鄰起訖門架間當期穿越比率,此比率與距離明顯呈反向且接近線性關

係。資料取自 2016 年 8 月國道三號北上 73 個門架(72 組起訖門架)。

其次,對下匝道比率同樣可以利用 ETC M06A 表所提供的資訊來觀察這

個參數的性質。針對特定門架,收集每個時間區間流量並計算該批次車輛中

續行至下一門架的數量即可得到下匝道或續進的比例。下圖 4 顯示國道三號

北部地區六個門架在 2016年 8月第一週每五分鐘續進比率的趨勢圖,明顯可

以看出此一比率通常不是常數,但除了深夜時間通常不會有太大變動,此一

特徵即可作為後續應用的基礎。

Page 17: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

10

資料來源:本研究

圖 4 國三北區新店至鶯歌系統間通過特定門架後續行至下一門架比率。資料時間為

2016/8/1-2016/8/7。從圖中可見此比率並非常數,但除深夜時間不會有太大變動。

「」

綜合以上幾點,前述流量遞移關係雖然簡單,並立基於一個較強的假設,

但從實際的資料來看,將其應用在一些實際的問題上仍是可行的。下一節將

提供一些案例檢視其成效。

Page 18: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

11

肆、 流量遞移關係的應用

本節展示若干流量遞移關係的應用,為方便討論,考慮如下圖 5所顯示

簡單的高速公路路網:

資料來源:本研究

圖 5 簡單的高速公路路網。U、O、N、I 及 D 分別代表上游主線、出口匝道、出入口匝道

間主線、入口匝道及下游主線。

車流由上游主線 U 進入,一部分由出口匝道 O 離開,另一部分經匝道間主線

N 與入口 I 之車流匯流至下游主線 D。若僅要描述主線上狀況,則忽略出口

匝道 O 與入口 I。圖中各項變數的定義如下:

U

tq :時間 t 上游主線流量;

O

tq :時間 t 下匝道流量;

N

tq :時間 t 上下匝道間主線流量;

I

tq :時間 t 上匝道流量;

D

tq :時間 t下游主線流量。

此外,相關的參數還包括各偵測點間的當期穿越比例及下匝道比例:

UO :上游主線偵測點至出口匝道之當期穿越比例;

UN :上游主線偵測點至出入口匝道間主線之當期穿越比例;

ND :出入口匝道間主線至下游主線偵測點之當期穿越比例;

ID :入口匝道線至下游主線偵測點之當期穿越比例;

O

t :時間 t 下匝道比例。

需注意的是,因各偵測點間距離可由所在里程推算,利用如上節圖 3 所

Page 19: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

12

展示的關係式即可有效推估「當期穿越比率」,以下所有範例中參數均來自此,

而下匝道比例會隨時間緩慢改變,須逐步估算。

以下介紹流量遞移關係兩個簡單的應用,其中使用的 VD 及 ETC 資料均

為 5 分鐘流量,可自交通部臺灣區國道高速公路局「交通資料庫」下載

(http://tisvcloud.freeway.gov.tw/history/)。

4.1 插補流量缺失值

流量遞移關係一個簡單但重要的應用是缺失值插補。缺失值在任何領域

中皆是難以避免的,而車輛偵測器或資料傳輸系統等各種因素都可能產生缺

失值。對流量資料進行缺失值插補的方法很多,簡單的僅考慮定點流量的時

間序列性質,稍複雜則加入每日流量模式的考量,但不將上下游流量資訊納

入顯然並不是最有效率的做法,特別是單一偵測器長期產生缺失值時,勢必

要依賴相鄰路段提供資訊。

進行插補的基本原則應是盡可能使用缺失值發生時所有可得知之相關資

訊,但實際上這可能會讓問題看起來過於複雜,處理即時資訊時依時間順序

逐步進行是必然的,而由上游而下游逐步進行一般而言會是較簡單的。

4.1.1 主線上無分流、匯流時的插補

首先考慮高速公路主線流量,對於三個主線上的偵測點(對應圖 5中U、

N、D,但無上下匝道 I、O 情況),對 N 點缺失值可能的插補的情況有以下

三種。

(一) 下游 D 流量缺失,僅以上游 U 流量插補 N 點流量

此狀況可簡單利用上游流量(U)與流量(N)間關係得到

U

t

UNU

t

UNN

t qqq 1)1(ˆ

(二) 上游 U 流量缺失,僅以下游 D 流量插補 N 點流量

與前一狀況類似,利用流量(N)與下游流量(D)間關係得到

N

t

NDD

tND

N

t qqq 1)1(1

ˆ

(三) 同時以上游 U 流量及下游 D 流量插補 N 點流量

Page 20: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

13

若上下游資料都可收集到,可簡單合併前兩個算式得到

N

t

NDD

tND

U

t

UNU

t

UNN

t qqqqq 11 )1(1

)1(2

注意這個算式對應 D

t

N

t qq , 之估計誤差以

2)1

(,1ND

為權值的加權平

方和之最佳解,若有適當準則用以調整權值可得到不同權重的其他組合。

4.1.2 交流道區間有分流、匯流時的插補

對於交流道前後的區間,考慮圖四中簡單路網,在每個時間 t,利用收

集到的資料對缺失值插補的程序如下:

- 上游主線流量插補(U)

- 下匝道流量插補(O)

- 上下匝道間主線流量插補(N)

- 更新出口比率()

- 上匝道流量插補(I)

- 下游主線流量插補(D)

(一) 上游主線流量插補(U)

若下匝道流量(O)及上下匝道間流量(N)均未缺失,則可運用這兩者進

行插補。上游主線流量與另兩個流量間的關係可表達為

U

t

O

t

UOU

t

O

t

UOO

t qqq 11)1(

U

t

O

t

UNU

t

O

t

UNN

t qqq 11)1)(1()1(

其中 O

tq 、 N

tq 、 U

tq 1 都已觀察到或經適當插補,而 UO 、 UN 及 O

t 1 均

是已知的參數,因此,合併兩式消去 O

t 後整理可得到對上游主線流量的插

補值為

U

t

O

t

N

tUN

U

t

O

t

O

tUO

U

t

U

t qqqqqq 11111 )1(11

ˆ

此一公式表示上下游三個流量均以前一期上游主線流量流量為基準,

再利用下匝道流量及上下匝道間流量分別對此基準的差距回頭修正本期上

游主線流量。實作時,為避免過度修正(特別是 UO 或 UN 中任一個很小,

Page 21: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

14

可能過度放大修正值),可限制最大修正的幅度為前期流量的 10%(或其他

合理比率):

U

t

U

t

O

t

N

tUN

U

t

U

t

O

t

O

tUO

U

t

U

t

qqq

qqqqq

111

1111

ˆ10

1,ˆ)1(

1min

ˆ10

1,ˆ

1minˆˆ

若下匝道流量(O)及上下匝道間流量(N)任一缺失,則上述方法不適用,

須將流量時間序列資料以(指數加權)移動平均法或時間序列模型進行插補。

在實作範例中我們以移動平均法處理。

(二) 下匝道流量插補(O)

若下匝道流量缺失,因上游主線流量已先進行過插補,下匝道流量可

用上游主線收集到的觀察值或插補值逕行插補:

U

t

O

t

UOU

t

O

t

UOO

t qqq 111 )1(ˆ

注意在此假設下匝道比率變動緩慢,因此 O

t 以 O

t 1 替代。

(三) 上下匝道間主線流量插補(N)

與先前下匝道流量插補相同,上下匝道間主線流量插補的方式為

U

t

O

t

UNU

t

O

t

UNN

t qqq 111 )1)(1()1(ˆ

(四) 更新出口比率()

當上游主線流量、下匝道流量及上下匝道間主線流量都進行過插補,

下匝道比率可以利用這些資訊進行更新:

U

t

UOU

t

UO

O

tO

tqq

q

1)1(ˆ

(五) 上匝道流量插補(I)

若下游主線流量(D)未缺失,則同時運用其與上下匝道間主線流量進

行插補。將下游主線流量以上下匝道間主線流量及上匝道流量表示為

I

t

IDI

t

IDN

t

NDN

t

NDD

t qqqqq 11 )1()1(

移項整理即可得上匝道流量合理的插補值:

I

t

IDN

t

NDN

t

NDD

tID

I

t qqqqq 11 )1()1(1

ˆ

Page 22: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

15

(六) 下游主線流量插補(D)

由於上游流量皆已觀察到或是完成插補,下游主線流量(D)插補值即

可利用上匝道流量(I)及上下匝道間主線流量插補(N)處理

I

t

IDI

t

IDN

t

NDN

t

NDD

t qqqqq 11 )1()1(ˆ

4.1.3 插補實例

在此以國道三號南下中和交流道附近區域提供兩個簡單的例子。在中

和交流道上游 32.735 公里處的偵測器於 2016年 9 月 5 日缺失近 1 小時的

資料,利用中和交流道出口流量及上下匝道間主線流量反向插補的結果如

圖 6。圖中三條趨勢線分別代表上游主線流量、出口流量及上下匝道間主

線流量,紅點代表上游主線流量原為缺失經插補得到的數值。綜合三個定

點的流量來看,顯然插補的結果相當合理。

資料來源:本研究

圖 6 南下中和交流道上游主線 VD (32.735KM) 2016/9/5 19:30-20:15缺失值插補。三條

趨勢線分別代表上游主線流量、出口流量及上下匝道間主線流量,紅點代表上游主線流量經

插補得到的缺失值。

第二個例子則是中和交流道下游主線的偵測器於 2016 年 8 月 25 日缺

失近 1 小時,利用上下匝道間主線流量及入口流量插補的結果如圖 7。在

這個例子中,透過加入上下匝道間主線流量資訊插補過後的下游主線流量

充分反映出接近下午 4 點時流量突然增加的狀況,如果僅以下游主線流量

Page 23: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

16

本身的時間序列性質進行插補則必然無法反映這部份流量的變動。

資料來源:本研究

圖 7 南下中和交流道下游主線 VD(39.130KM) 2016/8/25 15:55至 16:45間缺失值插補。

三條趨勢線由上而下分別代表下游主線流量、上下匝道間主線流量及入口流量,下游主線流

量的紅點為插補後的缺失值。

4.2 驗證偵測器間流量資料的一致性

車輛偵測器提供流量、車速等多方面資訊,而由於高速公路為一封閉

系統,其上下游流量應滿足特定的關係,亦即流入量等於流出量。然而,

實際的情況並非如此簡單,除去因環境及其他原因造成單一偵測器個別的

誤差,偵測器間在時空的差異會造成比對其流量資訊上的困難,而流量遞

移關係正好補足此一間隙。

目前台灣地區高速公路流量資訊來源可以簡單區分成一般車輛偵測器

(VD)及電子收費系統(ETC)。前者數量多但資訊品質略差,後者數量相對較

少,但因牽涉到收費帳務,一般相信其誤差很小,並可提供個別車輛細部

行程資料。接下來我們將以國道三號北部路段為例,分三種狀況比對 VD

及 ETC流量資料間的一致性。

Page 24: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

17

4.2.1 主線上 VD 及 ETC 流量資料間的一致性

考慮主線上兩個偵測器(ETC及 VD各一),其間無交流道可供車輛進出

高速公路系統,依據流量遞移關係,下游流量可由上游流量決定,因此要

比對其是否一致只要將上游的流量依距離決定「當期穿越比率」後轉換成

下游流量即可逕行比對。圖 8及圖 9列出 2016年 9月國道三號南下 33.7

公里處及北上 33.8公里處(安坑、中和間)ETC 所偵測到的流量與附近上

下游 VD 偵測到的流量比較的散佈圖及誤差的趨勢圖,左列散佈圖橫軸是

下游實際所偵測到的流量,縱軸是由上游流量轉換得到的下游流量。若上

游是 VD,則將 VD 流量轉換到下游 ETC 所在位置與 ETC 流量比較,反之

亦然。右列趨勢圖為下游流量推估值與實際觀察值間誤差,可看出每日循

環,在清晨流量低時誤差變動較大。表 1則針對上述南下/北上各組合在每

日 07:00-21:00計算誤差值相關統計量,此路段 5分鐘流量均值約 320-340

台車,利用上游流量推算下游流量的平均絕對百分誤差(MAPE)約在 6%-7%

間,均方根誤差(RMSE)約 25-30輛。

表 1 2016年 9月每日 07:00-21:00國道三號南下/北上路段 33.7/33.8公里處 ETC所偵測

到的流量與附近上下游 VD偵測到的流量間轉換比較。MAPE及 RMSE計算以下游偵測器流量

為標的。

上游偵測器 下游偵測器 下游流量

資料筆數

下游流量

均值(輛)

MAPE

(%)

RMSE

(輛)

VD-N3-S-32.185-M-LOOP 03F0337S 4935 339.1 6.97% 30.2

VD-N3-S-32.735-M-LOOP 03F0337S 4935 339.1 6.32% 26.3

03F0337S VD-N3-S-34.835-M-LOOP 4970 335.0 6.35% 25.9

03F0337S VD-N3-S-35.345-M-LOOP 4982 337.5 6.24% 25.8

03F0338N VD-N3-N-32.540-M-LOOP 4970 335.2 6.83% 30.7

03F0338N VD-N3-N-32.823-M-LOOP 4970 325.0 6.25% 23.9

VD-N3-N-34.723-M-LOOP 03F0338N 4949 329.1 6.41% 25.2

VD-N3-N-35.300-M-LOOP 03F0338N 4949 329.1 6.26% 24.4

資料來源:本研究

Page 25: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

18

資料來源:本研究

圖 8 2016年 9月國道三號南下 33.7公里處 ETC所偵測到的流量與附近上下游 VD偵測到

的流量比較,左邊橫軸是下游實際所偵測到的流量,縱軸是由上游流量轉換得到的下游流量。

右邊橫軸為日期,縱軸是相對誤差。

Page 26: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

19

資料來源:本研究

圖 9 2016年 9月國道三號北上 33.8公里處 ETC所偵測到的流量與附近上下游 VD偵測到

的流量比較,左邊橫軸是下游實際所偵測到的流量,縱軸是由上游流量轉換得到的下游流量。

右邊橫軸為日期時間,縱軸是相對誤差。

4.2.2 匝道間主線、上匝道 VD 及下游 ETC 流量資料間的一致性

下游主線流量可由上下匝道間主線、上匝道流量經轉換後逕行加總獲

得,圖 10上顯示 2016年 9月國道三號南下 33.7公里處(安坑、中和間)ETC

Page 27: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

20

所偵測到的流量與 VD推估流量相關性質,上方散佈圖橫軸是 ETC實際所偵

測到的流量,縱軸是由上游 VD偵測流量轉換得到的下游流量。中間是兩者

誤差的趨勢圖,下方則取出 9月 2日部分放大展示。從表 2中可看出,這

個情況下流量推估的平均絕對百分誤差(MAPE)約在 6%-7.5%間,均方根誤

差(RMSE)約 30-45輛不等,與主線部分相比變異略高。

表 2 2016年 9月每日 07:00-21:00國道三號北區南下路段交流道上下匝道間主線及入口

流量與下游 ETC所偵測到的流量間轉換比較。MAPE及 RMSE計算以 ETC流量為標的。

上游偵測器 下游偵測器 下游流量

資料筆數

下游流量

平均(輛)

MAPE

(%)

RMSE

(輛)

VD-N3-S-31-I-ES-2A

VD-N3-S-31-I-WS-2B

VD-N3-S-31.470-N-LOOP

03F0337S

VD-N3-S-35-I-WS-2A

VD-N3-S-35-I-WS-2B

VD-N3-S-36.140-N-LOOP

03F0394S

VD-N3-S-43-I-WS-1

VD-N3-S-42.535-N-LOOP 03F0447S

VD-N3-S-54-I-WS-1

VD-N3-S-54.650-N-LOOP 03F0559S

資料來源:本研究

Page 28: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

21

資料來源:本研究

圖 10 2016年 9月國道三號南下 33.7公里處(安坑、中和間)ETC經上游交流道 VD流量估

算所得與實際觀察到的流量比較。上方散布圖橫軸是觀察值,縱軸是估計值,中圖為全月相

對誤差的趨勢圖,下圖為中圖紅色虛線部分(9月 2日)放大。

4.2.3 上游 ETC 及下匝道、匝道間主線 VD 流量資料間的一致性

比對上游主線 ETC及下匝道及上下匝道間主線上 VD 流量資料間的一

致性較先前兩個範例複雜的是需同步估計下匝道比率。實作時先估算下匝

Page 29: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

22

道的比率,再根據此比率推算上下匝道間主線上流量做為比較對象:

U

t

UOU

t

UO

O

tO

tqq

q

1)1(ˆ

U

t

O

t

UNU

t

O

t

UNN

t qqq 11)ˆ1)(1()ˆ1(ˆ

表 3 2016年 9月每日 07:00-21:00國道三號北區南下路段 ETC所偵測到的流量與下游交

流道上下匝道間主線及出口流量間轉換比較。MAPE及 RMSE計算以出口匝道流量為標的。

上游偵測器 下游偵測器 下游流

量資料

筆數

下游流

量平均

(輛)

MAPE

(%)

RMSE

(輛)

03F0301S

VD-N3-S-31-O-SW-1

VD-N3-S-31.470-N-LOOP 4797 24.2 10.56% 26.1

03F0337S

VD-N3-S-35-O-SW-1

VD-N3-S-36.140-N-LOOP 4935 339.1 7.92% 22.1

03F0394S

VD-N3-S-43-O-NW-1

VD-N3-S-43-NW-0.20-O-M

VD-N3-S-42.535-N-LOOP

4937 390.1 8.54% 31.9

03F0447S

VD-N3-S-50-O-NW-1A

VD-N3-S-50-O-NE-1B

VD-N3-S-50.835-N-LOOP

4933 451.1 7.87% 37.4

03F0559S

VD-N3-S-54-O-NW-1

VD-N3-S-54.650-N-LOOP 4892 433.3 9.30% 28.9

資料來源:本研究

Page 30: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

23

資料來源:本研究

圖 11 2016年 9月國道三號南下安坑交流道上下匝道間主線估算所得與實際觀察到流量的

比較。上方散布圖橫軸是觀察值,縱軸是估計值,中圖為全月相對誤差的趨勢圖,下圖為中

圖紅色虛線部分(9月 2日)放大。

圖 11顯示 2016年 9月國道三號北上安坑交流道上下匝道間主線利用

上述方式推估流量 N

tq̂ 及實際觀察到的流量 N

tq 比較。上方散佈圖橫軸是 VD

實際所偵測到的流量,縱軸是由上游 ETC 及下匝道出口 VD 偵測流量推算

得到的流量。中間是兩者誤差的趨勢圖,下方則取出 9月 2日部分放大展

示。表3顯示此情況流量推估的平均絕對百分誤差(MAPE)約在7%-11%間,

Page 31: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

24

均方根誤差(RMSE)約 20-40輛不等,變異相對前兩個範例則顯得略高。

伍、 結論與未來方向

在這個研究計畫中,我們在均勻車流假設下,推導出上下游定點間流量

傳遞關係,並將其應用於缺失值插補及流量資料間一致性的檢驗。

此一流量傳遞關係最重要的特點是具有空間上短距離及時間上短時程相

依之特性,明確地說,在一封閉路段上,某定點偵測器測得的流量只與上游

特偵測器定連續兩區間的流量有關,因此計算相對於 CTM 等模型簡單許多。

特別是,若偵測器間距離相對於流量統計的時間區間長度不長,部分車輛有

可能通過連續的兩個偵測器,則主要參數即為「當期穿越比率」。透過檢視

ETC M06A 表的細部資料我們發現,當車流量在合理範圍內,對同一組偵測

器「當期穿越比率」大致為常數,而與偵測器間距離成反比。這些簡潔的結

果大大增加流量傳遞關係在應用上的便利性。

當然,流量遞移關係仍有許多未納入考量的因素,例如車速及車間距離

等資訊都尚未使用,而內外側車道間的差異也未被明確描述,當然這部分技

術上的挑戰相對較高。再者,流量遞移關係僅在描述車流量移動的「平均水

準」,與實際觀察值必然有所差距,因此,加入誤差項或以機率模式表達是未

來必須處理的工作。

簡言之,本研究計畫中所構建的流量傳遞關係展示以一個簡單構建流量

模型的可能方式,且在現有架構下,已可以有一些實際的應用。後續工作則

在於加入更多的資訊,以拓展更廣泛應用。

Page 32: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

25

參考文獻

[1] Ahmed, M.S., Cook, A.R., 1979. Analysis of freeway traffic time-series data

by using Box-Jenkins techniques. Transportation Research Record 722, 1–9.

[2] Du, L., Peeta, S., Kim, Y.H., 2012. An adaptive information fusion model to

predict the short-term link travel time distribution in dynamic traffic

networks. Transportation Research Part B: Methodological 46 (1), 235–252.

[3] Haworth, J., Cheng, T., 2012. Non-parametric regression for space–time

forecasting under missing data. Computers, Environment and Urban Systems

36 (6), 538–550.

[4] Sun, S., Huang, R., Gao, Y., 2012. Network-scale traffic modeling and

forecasting with graphical lasso and neural networks. Journal of

Transportation Engineering 138 (11), 1358–1367.

[5] Vlahogianni, E.I., et al., 2014. Short-term traffic forecasting: Where we are

and where we’re going. Transportation Research Part C 43(1), 3-19.

[6] Pascale, A., Nicoli, M. and Spagnolini, U., 2014. Cooperative Bayesian

Estimation of Vehicular Traffic in Large-Scale Networks. IEEE Transactions

on Intelligent Transportation Systems, 15 (5), 2074-2088.

[7] Qu, L., Li, L., Zhang, Y., and Hu, J., 2009. PPCA-Based M issing Data

Imputation f or Traffic Flow Volume: A Systematical Approach. IEEE

Transactions on Intelligent Transportation Systems, 10 (3), 512-522.

[8] Abadi, A., Rajabioun, T., and Ioannou, P. A., 2015. Traffic Flow Prediction

for Road Transportation Networks With Limited Traffic Data. IEEE

Transactions on Intelligent Transportation Systems, 16 (2), 653-662.

[9] Sun. S and Zhang, C, 2007. The Selective Random Subspace Predictor for

Traffic Flow Forecasting. IEEE Transactions on Intelligent Transportation

Systems, 8 (2), 367-373.

Page 33: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

26

Page 34: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高維度統計方法應用於路網動態資訊之探討

27

高維度統計方法應用於路網動態資訊之探討

期末簡報意見回覆表

意見 回覆

黃友恆

1. 高速公路 VD 資料常因偵

測器本身誤差,而有流量

不守恆之問題,在應用本

案流量插補方法時會否有

影響?

實作時應先檢視所有相關的偵測器

間是否一致再進行插補即可避免此

問題。

2. 在驗證 VD 與 ETC 流量一

致性時,模型所用參數是

由 ETC 資料推估而得,當

應用在 VD 資料上,VD 位

置與 ETC 門架位置有所不

同,會否產生影響?

本研究目的之一即在克服偵測器(VD

或 ETC)間位置不同如何轉換比較的

問題,只要知道兩兩偵測器間距離,

利用圖三所顯示的關係即可推算所

需參數。

徐嘉駿

1. 本案所提出的流量遞移關

係式中,當期穿越比率是

否隨不同的週內日、或一

天中不同時間而有所變

化?

就 2016 年 8 月資料來看,並沒有明

顯區別,只有在車流量很低時有較大

變動,壅塞時會下降。

2. 流量關係式的參數係由

ETC 歷史資料推算而得,

是否以其他日的 ETC 資料

驗證此式預測準確度?

目前成果中的參數基於 2016 年 8 月

的資料,插補及一致性的應用範例資

料則涵蓋 2016 年 8 月~9 月,目前累

積結果尚稱合理。更廣泛的驗證會在

後續的計畫中進行。

Page 35: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

05923 高維度統計方法應用於路網動態資訊之探討

牛維方

2016/12/20

Page 36: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

報告大綱

計畫簡介

文獻回顧

均勻車流下的流量遞移關係

遞移關係的應用範例

- 流量缺失值插補

- 驗證流量資料一致性

結論

Page 37: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

目的及工作項目

本計畫設定的目的:

針對道路暢通與雍塞狀態之區分方法訂定可操作的處理架構;

將路網分成若干區塊便於後續分析的基本方法;

針對小區域路網之流量預測建立基本的模型與演算法。

本計畫設定的工作項目:

資料收集與整理及文獻回顧

訂定暢通雍塞分群標準

降維並篩選變數

建構預測模型與演算法

模型驗證

Page 38: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

文獻回顧 作者 預測區域 預測變數 模型/方法 說明

Min and Wynter (2011) Highway

network Volume

multivariate spatial-temporal autoregressive

(MSTAR)

Sun et al. (2012) Urban network Volume g-Lasso + NN

Haworth and Cheng

(2012) Urban network Volume KNN + Kernel regression

Abadi et al. (2015) Urban network

Volume OD simulation + ARMA

Kamarianakis et al. (2012) Urban / Highway

network Speed Space-time threshold AR + Lasso

Zhang et al. (2014)

Highway

network

Flow

Occupancy Speed

Hierarchical Fuzzy Rule-Based System +

Genetic Algorithms

Zou et al. (2014) Highway

network Travel time Space–time diurnal method

Pascale et al. (2014) Urban network Densities CTM + Jump Markov Linear System + Belief

Propagation

Cai et al. (2016) Urban network Speed KNN

Page 39: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

文獻回顧-路網上的車流分析

Sun and Zhang (2007):

只看相關係數可能會誤導!!!

間隔15min,100個資料點

Page 40: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

文獻回顧-路網上的車流分析

Sun, Huang and Gao (2012): Graphical Lasso

間隔15min,2400個資料點

Page 41: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高速公路的流量遞移關係

考慮高速公路上(上游)A點到(下游)B點的流量,假設區間內車流穩定。

- t:計算流量的時間單位

- tAB:從A行駛到B所需時間

- [x]:小於x的最大整數,例如[1]=0,[1.01]=1。

AABAABABB

k qkt

qtk

kt

q 0)1(

)1(

t

t

t

t

ttt

A B

t t kt

tAB

Aq0

Aqt

t

B

)τ(kq 1

Page 42: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

假設兩偵測點間距離有限,區間內車流穩定。

模型中主要參數:

當期穿越比率 ;

下匝道的流量比率。

在某時間區間通過第二個偵測點的流量只與第一個偵測點不早於該時間區間的連續兩時間區間的流量有關。

連續兩時間區間之分配比率由兩偵測點間距離決定。

每個交流道下匝道的流量比率在短期間內變動不大。

高速公路的流量遞移關係

t

t ABt

Page 43: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高速公路的流量遞移關係

2016/08/03,03F0559N至03F0525N流量(從M06A篩選)。

Flow at 03F0559N

0 4 8 12 16 20 24

0100

200

300

400

500

600

Flow at 03F0525N, lag 0

0 4 8 12 16 20 24

0100

200

300

400

500

600

0 4 8 12 16 20 24

0.0

0.2

0.4

0.6

0.8

1.0

Flow at 03F0559N

0 4 8 12 16 20 24

0100

200

300

400

500

600

Flow at 03F0525N, lag 1

0 4 8 12 16 20 240

100

200

300

400

500

600

0 4 8 12 16 20 24

0.0

0.2

0.4

0.6

0.8

1.0

Page 44: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高速公路的流量遞移關係

國道三號連續兩門架間當期穿越比率與距離。

當期穿越比率

2016/08/01-2016/08/30,10:00-14:00。

取中位數

2 4 6 8 10 12 14

0.0

0.2

0.4

0.6

0.8

distance between gantries

pro

po

rtio

n p

rop

ort

ion

in

on

e p

eri

od

Page 45: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

高速公路的流量遞移關係

2016/8/1-216/8/14國三北區通過各特定gantry後繼續行至至少下一gantry比率。

03F0301N

8/1 8/2 8/3 8/4 8/5 8/6 8/7 8/8 8/9 8/10 8/11 8/12 8/13 8/14 8/15

00.2

0.4

0.6

0.8

1

03F0338N

8/1 8/2 8/3 8/4 8/5 8/6 8/7 8/8 8/9 8/10 8/11 8/12 8/13 8/14 8/15

00.2

0.4

0.6

0.8

1

03F0394N

8/1 8/2 8/3 8/4 8/5 8/6 8/7 8/8 8/9 8/10 8/11 8/12 8/13 8/14 8/15

00.2

0.4

0.6

0.8

1

03F0447N

8/1 8/2 8/3 8/4 8/5 8/6 8/7 8/8 8/9 8/10 8/11 8/12 8/13 8/14 8/15

00.2

0.4

0.6

0.8

1

03F0498N

8/1 8/2 8/3 8/4 8/5 8/6 8/7 8/8 8/9 8/10 8/11 8/12 8/13 8/14 8/15

00.2

0.4

0.6

0.8

1

03F0525N

8/1 8/2 8/3 8/4 8/5 8/6 8/7 8/8 8/9 8/10 8/11 8/12 8/13 8/14 8/15

00.2

0.4

0.6

0.8

1

Page 46: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

流量遞移關係的應用

缺失值插補

- 基本的處理方法:以歷史資料或相鄰時間的(加權)平均

- L. Qu (2009): Probabilistic Principal Component Analysis

每日的分時流量視為一個向量

假設這個觀察值來自一個因素模型

利用EM演算法估計後進行插補

- 以上均未考慮流量的空間關聯

驗證流量資料一致性

- 以上游流量「預測」下游流量

- 比對下游流量觀察值與預測值是否一致

Page 47: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

流量遞移關係的應用-缺失值插補(主線)

N

tq

U

tq

D

tq

假設如下路段,兩兩相鄰偵測點距離有限,部分車輛可在單位時間內通過。

N

t

NDN

t

NDD

t qqq 1)1(

U

t

UNU

t

UNN

t qqq 1)1(

Page 48: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

流量遞移關係的應用-缺失值插補(主線)

基本策略

依時間順序逐步進行

由上游而下游逐步進行

使用可得知之相關資訊

演算法

以上游流量(U)插補流量(N)

以下游流量(D)插補流量(N)

以上游流量(U)及下游流量(D)插補流量(N)

Page 49: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

流量遞移關係的應用-缺失值插補(主線)

以上游流量(U)插補流量(N)

以下游流量(D)插補流量(N)

以上游流量(U)及下游流量(D)插補流量(N)

U

t

UNU

t

UNN

t qqq 1)1(ˆ

N

t

NDD

tND

N

t qqq 1)1(1

ˆ

N

t

NDD

tND

U

t

UNU

t

UNN

t qqqqq 11 )1(1

)1(2

N

t

NDN

t

NDD

tND

U

t

UNU

t

UNN

t

q

qqqqqqNt

1

22

1 )1(1

)1(min

Page 50: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

流量遞移關係的應用-缺失值插補 (交流道附近)

N

tq

U

tq

D

tq

O

tq

I

tq

假設如下路段,兩兩相鄰偵測點距離有限,部分車輛可在單位時間內通過。

I

t

IDI

t

IDN

t

NDN

t

NDD

t qqqqq 11 )1()1(

U

t

O

t

UOU

t

O

t

UOO

t qqq 11)1(

U

t

O

t

UNU

t

O

t

UNN

t qqq 11)1)(1()1(

Page 51: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

流量遞移關係的應用-缺失值插補 (交流道附近)

基本策略

依時間順序逐步進行

由上游而下游逐步進行

使用可得知之相關資訊

演算法

上游主線流量插補(U)

下匝道流量插補(O)

上下匝道間流量插補(N)

更新出口比率()

上匝道流量插補(I)

下游主線流量插補(D)

Page 52: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

流量遞移關係的應用-缺失值插補 (交流道附近)

上游主線流量插補(U)

若下匝道流量(O)及上下匝道間流量(N)未缺失,則同時運用這兩者進行插補。

若下匝道流量(O)及上下匝道間流量(N)任一缺失,則以(指數加權)移動平均法或時間序列模型進行插補。

U

t

O

t

UOU

t

O

t

UOO

t qqq 11)1(

U

t

O

t

UNU

t

O

t

UNN

t qqq 11)1)(1()1(

U

t

O

t

N

tUN

U

t

O

t

O

tUO

U

t

U

t qqqqqq 11111 )1(11

ˆ

U

t

U

t

O

t

N

tUN

U

t

U

t

O

t

O

tUO

U

t

U

t qqqqqqqq 1111111ˆ

10

1,ˆ)1(

1minˆ

10

1,ˆ

1minˆˆ

Page 53: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

流量遞移關係的應用-缺失值插補 (交流道附近)

下匝道流量(O)及上下匝道間流量插補(N)

更新出口比率()

U

t

O

t

UOU

t

O

t

UOO

t qqq 111 )1(ˆ

U

t

O

t

UNU

t

O

t

UNN

t qqq 111 )1)(1()1(ˆ

U

t

UOU

t

UO

O

tO

tqq

q

1)1(ˆ

Page 54: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

流量遞移關係的應用-缺失值插補 (交流道附近)

上匝道流量插補(I)

若上下匝道間流量(N)及下游主線流量(D)未缺失,則同時運用這兩者進行插補。

若上下匝道間流量(N) 及下游主線流量(D)任一缺失,則以(指數加權)移動平均法或時間序列模型進行插補。

下游主線流量插補(D)

I

t

IDN

t

NDN

t

NDD

tID

I

t qqqqq 11 )1()1(1

ˆ

I

t

IDI

t

IDN

t

NDN

t

NDD

t qqqqq 11 )1()1(ˆ

Page 55: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

流量遞移關係的應用-缺失值插補 (交流道附近)

nfbVD-N3-S-35-O-SW-1

nfbVD-N3-S-36.140-N-LOOP

Page 56: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

流量遞移關係的應用-缺失值插補 (交流道附近)

nfbVD-N3-S-36.140-N-LOOP

nfbVD-N3-S-35-I-WS-2A+

nfbVD-N3-S-35-I-WS-2B

Page 57: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

流量遞移關係的應用-驗證流量資料一致性

主線上VD及ETC流量資料間的一致性

南下33.7KM ETC vs VD

北上33.8KM ETC vs VD

Page 58: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

流量遞移關係的應用-驗證流量資料一致性

主線上VD及ETC流量資料間的一致性

上游偵測器 下游偵測器 下游流量資料筆數 下游流量平均值 MAPE RMSE

VD-N3-S-32.185-M-LOOP 03F0337S 4935 339.1 6.97% 30.2

VD-N3-S-32.735-M-LOOP 03F0337S 4935 339.1 6.32% 26.3

03F0337S VD-N3-S-34.835-M-LOOP 4970 335.0 6.35% 25.9

03F0337S VD-N3-S-35.345-M-LOOP 4982 337.5 6.24% 25.8

03F0338N VD-N3-N-32.540-M-LOOP 4970 335.2 6.83% 30.7

03F0338N VD-N3-N-32.823-M-LOOP 4970 325.0 6.25% 23.9

VD-N3-N-34.723-M-LOOP 03F0338N 4949 329.1 6.41% 25.2

VD-N3-N-35.300-M-LOOP 03F0338N 4949 329.1 6.26% 24.4

Page 59: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

流量遞移關係的應用-驗證流量資料一致性

匝道間主線、上匝道VD及下游ETC流量資料間的一致性: 2016年9月國道三號南下33.7公里處(安坑、中和間)ETC經上游交流道VD流量估算所得與實際觀察到的流量比較。

Page 60: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

流量遞移關係的應用-驗證流量資料一致性

匝道間主線、上匝道VD及下游ETC流量資料間的一致性

上游偵測器 下游偵測器 下游流量資料筆數 下游流量平均值 MAPE RMSE

VD-N3-S-31-I-ES-2A; VD-N3-S-31-I-WS-2B

VD-N3-S-31.470-N-LOOP 03F0337S 4797 339.1 7.44% 32.5

VD-N3-S-35-I-WS-2A

VD-N3-S-35-I-WS-2B

VD-N3-S-36.140-N-LOOP 03F0394S 4949 390.1 5.96% 30.0

VD-N3-S-43-I-WS-1

VD-N3-S-42.535-N-LOOP 03F0447S 4937 451.1 6.95% 42.0

VD-N3-S-54-I-WS-1

VD-N3-S-54.650-N-LOOP 03F0559S 4904 353.1 6.90% 29.1

Page 61: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

流量遞移關係的應用-驗證流量資料一致性

上游ETC及下匝道、匝道間主線VD流量資料間的一致性: 2016年9月國道三號南下33.7公里處(安坑、中和間)ETC經上游交流道VD流量估算所得與實際觀察到的流量比較。

Page 62: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

流量遞移關係的應用-驗證流量資料一致性

上游ETC及下匝道、匝道間主線VD流量資料間的一致性

上游偵測器 下游偵測器 下游流量資料筆數 下游流量平均值 MAPE RMSE

03F0301S VD-N3-S-31-O-SW-1

VD-N3-S-31.470-N-LOOP 4797 24.2 10.56% 26.1

03F0337S VD-N3-S-35-O-SW-1

VD-N3-S-36.140-N-LOOP 4935 339.1 7.92% 22.1

03F0394S

VD-N3-S-43-O-NW-1

VD-N3-S-43-NW-0.20-O-M

VD-N3-S-42.535-N-LOOP

4937 390.1 8.54% 31.9

03F0447S

VD-N3-S-50-O-NW-1A

VD-N3-S-50-O-NE-1B

VD-N3-S-50.835-N-LOOP

4933 451.1 7.87% 37.4

03F0559S VD-N3-S-54-O-NW-1

VD-N3-S-54.650-N-LOOP 4892 433.3 9.30% 28.9

Page 63: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

結論

流量遞移關係:假設及特性 - 車流穩定,考慮前後兩偵測點流量傳遞關係。 - 同一時段內穿越兩連續偵測點之比率約為定值,可由歷史資料決

定。 - 下匝道比率變動緩慢,可由即時資料逐步調整。

應用範例 - 缺失值插補 - 驗證流量資料一致性

後續工作: - 納入未考量的因素,例如車速、車間距離及內外側車道的差異等。 - 加入流量上限及超過上限後車流量的延滯及消解機制。 - 以視覺化方式展現成果。 - 拓展其他應用。

Page 64: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討
Page 65: 高維度統計方法應用於 路網動態資訊之探討 · 財團法人中華顧問工程司 105 年度 計畫名稱:高維度統計方法應用於路網動態資訊之探討

工作項目及進度