一种基于时空相关性的交通流量数据恢复方法转让专利

申请号 : CN201410154792.8

文献号 : CN103971520B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 宋春跃吴俏沈国江王慧

申请人 : 浙江大学

摘要 :

本发明公开了一种基于时空相关性的交通流量数据恢复方法。该方法包括前期交通数据转换、异常数据筛选方法和后续的交通流数据恢复方法。其中数据筛选方法,根据实际交通流数据的异常情况涉及了阈值筛选、零数据筛选和质量筛选法。然后根据交通流数据在时间上和空间上的相关性,结合时间序列法和多元线性回归法,即基于时间相关性和空间相关性的数据恢复方法,设计了基于时空相关性的综合交通流数据恢复方法。本发明方法简单快速,能够满足实时处理的要求,且所得结果的精确度高。

权利要求 :

1.一种基于时空相关性的交通流量数据恢复方法,其特征在于该方法包括以下步骤:步骤(1).交通流量数据格式转换:

将检测点由车辆检测器检测得到的原始交通流量数据qorig单位换算成标准小时流量数据,然后对该标准小时流量数据进行加权平均转换成固定周期T的交通流量数据集q;

所述的固定周期T的交通流量数据集q={q(1),…,q(k),…,q(n)};q(k)表示k时间段的交通流量数据,其中k=1,2,…,n,所述的标准小时流量数据表示单位为车辆/小时的交通流量数据;

步骤(2).交通流量数据筛选

2.1阈值筛选:

对步骤(1)得到的固定周期T的交通流量数据集q进行阈值筛选,即对交通流量数据集q中的交通流量数据q(k)进行逐个比较,根据公式(1)进行筛选,剔除交通流量数据集q中不符合公式(1)的数据:

0<q(k)<Qmax (1);

Qmax=fc×C (2);

其中阈值Qmax的单位为veh/h;C表示车道的基本通行能力,单位为veh/h;fc为常数;

2.2零数据筛选:

对步骤2.1筛选后得到的交通流量数据集进行零数据筛选,具体步骤如下:根据泊松分布原理得到时间间隔t内到达车辆数的概率P(x)见公式(3):式中P(x)为时间间隔t内到达x辆车的概率,x为自然数;λt为时间间隔t内平均到达的车辆数;

若置信水平α=0.01,采样间隔内有车辆通过,即x>0的概率为:由此可得:

λt≈4.6(veh/(tmin)) (5);

其中Q0表示时间间隔t内的标准小时交通流量数据;

若时间间隔t等于固定周期T,当k时段的历史平均交通流量 大于Q0,且实际检测到的交通流量数据q(k)显示为零时,则从步骤2.1筛选后得到的交通流量数据集中筛选出该数据,如公式(7)所示:

2.3质量筛选:

对步骤2.2筛选后的交通流量数据集进行质量筛选,剔除不符合式(8)的数据;

其中 为k时段的历史平均交通流量,σq为 的方差; 为k时段与k-1时段的流量平均差值,σd为 的方差;

步骤(3).交通流量数据恢复:

3.1利用基于时间相关性的交通流量数据恢复方法,得到缺失数据车道流量数据的预测值:首先采用简单移动平均法构造时间序列模型以得到步骤(2)筛选后的交通流量数据中缺失数据车道流量数据的预测值 见公式(9):其中n为移动平均个数;

3.2利用基于空间相关性的交通流量数据恢复方法,得到缺失数据车道流量数据预测值:首先采用多元线性回归分析,以步骤(2)筛选后的交通流量数据中缺失数据车道流量数据检测点交叉口的上下游交叉口的交通流量数据为自变量,建立多元回归模型,得到当前交叉口交通流量预测值 然后 乘以数据缺失车道j在该时段k的车道占有率fj(k),得到缺失数据车道流量数据预测值 见公式(10);

若上游交叉口有a个方向车流驶向检测路段,同时有驶出路段的车辆分b个方向驶向下游交叉口,则共有i=a+b个自变量Q1(k)、Q2(k)、……、Qi(k);

式中β0、……、βi为回归系数;

式中 表示数据缺失车道j在时段k内的历史交通流量,m为检测点车道数;

3.3利用基于时空相关性的交通流量数据恢复方法,得到最终的缺失数据车道流量数据恢复值:根据公式(13)、(14)计算上述步骤3.1、3.2两模型预测值的百分比相对误差RT和RS,并根据公式(15)确定综合模型的权重系数θ;

最后根据式(16)得到最终的缺失数据车道流量数据恢复值;

步骤4.根据公式(17)将步骤3得到的最终的缺失数据车道流量数据恢复值 补充至步骤2筛选后的交通流量数据集中;

说明书 :

一种基于时空相关性的交通流量数据恢复方法

技术领域

[0001] 本发明属于交通工程领域,涉及一种基于时空相关性的交通流量数据恢复方法。

背景技术

[0002] 交通信息数据是智能交通系统的基础,优质、完整的交通信息数据有利于提高交通管理和控制的准确性。交通信息数据主要有交通流量、速度和占有率,其中交通流量数据是最基本也是最重要的数据。
[0003] 通常,智能交通系统主要采用浮动车数据和路口及路段车辆检测器数据。浮动车数据是指通过装备全球定位系统的浮动车得到的位置数据,以及由此推断得到的速度、行程时间等数据;路口及路段车辆检测器数据是指通过安装在路口或者路段中的各种车辆检测器检测得到的交通流量、速度、占有率等数据。相对来说,浮动车数据由于采用GPS技术,数据可靠性和准确性较高,但得到的数据不够全面、完整,一般作为辅助数据,应用并不广泛;而路口及路段车辆检测器数据非常全面、完整,是交通系统的主要数据来源,但是由于检测器故障、老化等原因,得到的数据质量相对较差且存在大量数据缺失,对后续的有交通控制决策制定带来了极大的困难,故必须对这些数据进行筛选并补充恢复。
[0004] 目前,我国关于交通流量数据筛选及恢复的研究已出具成果,所采用的方法有包括kalman滤波、非参数回归、神经网络等各种智能算法。然而,在提高了数据筛选及恢复的精确性的同时,这些算法都过于复杂,不能满足交通数据需实时处理的要求,难以真正用在实际道路交通信号控制系统中。

发明内容

[0005] 本发明的目的是针对现有技术的不足,提出一种基于时空相关性的交通流量数据恢复方法。
[0006] 为解决上述技术问题,本发明所采用的技术方案如下:
[0007] 本发明方法包括以下步骤:
[0008] 步骤(1).交通流量数据格式转换:
[0009] 将检测点由车辆检测器检测得到的原始交通流量数据qorig单位换算成标准小时流量数据,然后对该标准小时流量数据进行加权平均转换成固定周期T的交通流量数据集q;
[0010] 所述的固定周期T可根据实际应用所需而定;
[0011] 所述的固定周期T的交通流量数据集q={q(1),…,q(k),…,q(n)};q(k)表示k时间段的交通流量数据,其中
[0012] 所述的标准小时流量数据表示单位为veh/h(即车辆/小时)的交通流量数据;
[0013] 步骤(2).交通流量数据筛选
[0014] 2.1阈值筛选:
[0015] 对步骤(1)得到的固定周期T的交通流量数据集q进行筛选,即对交通流量数据集q中的交通流量数据q(k)进行逐个比较,根据公式(1)进行筛选,剔除q中不符合公式(2)的数据:
[0016] 0<q(k)<Qmax (1);
[0017] Qmax=fc×C (2);
[0018] 其中阈值Qmax的单位为veh/h;C表示车道的基本通行能力,单位为veh/h;fc为常数,根据实际情况进行限定;
[0019] 2.2零数据筛选:
[0020] 对步骤2.1筛选后得到的交通流量数据集进行零数据筛选,具体步骤如下:
[0021] 根据泊松分布原理得到时间间隔t内到达车辆数的概率P(x)见公式(3):
[0022]
[0023] 式中P(x)为时间间隔t内到达x辆车的概率,x为自然数;λt为时间间隔t内平均到达的车辆数;
[0024] 本发明取置信水平α=0.01,采样间隔内有车辆通过,即x>0的概率为:
[0025]
[0026] 由此可得:
[0027] λt≈4.6(veh/(tmin)) (5);
[0028]
[0029] 其中Q0表示时间间隔t内的标准小时交通流量数据;
[0030] 本发明取时间间隔t等于固定周期T,若当k时段的历史平均交通流量 大于Q0,且实际检测到的交通流量数据q(k)显示为零时,则筛选出该数据,如公式(7)所示:
[0031]
[0032] 其中 为k时段的历史平均交通流量,其计算方法可由经验确定。
[0033] 2.3质量筛选:
[0034] 对步骤2.2筛选后的交通流量数据集进行质量筛选,剔除不符合式(8)的数据;
[0035]
[0036] 其中 为k时段的历史平均交通流量,σq为 的方差; 为k时段与k-1时段的流量平均差值,σd为 的方差。
[0037] 步骤(3).交通流量数据恢复:
[0038] 3.1利用基于时间相关性的交通流量数据恢复方法,得到缺失数据车道流量数据的预测值:
[0039] 首先采用简单移动平均法构造时间序列模型(即基于时间相关性的数据恢复模型)以得到步骤(2)筛选后的交通流量数据中缺失数据车道流量数据的预测值 见公式(9):
[0040]
[0041] 其中n为移动平均个数。
[0042] 3.2利用基于空间相关性的交通流量数据恢复方法,得到缺失数据车道流量数据预测值:
[0043] 首先采用多元线性回归分析,以步骤(2)筛选后的交通流量数据中缺失数据车道流量数据检测点交叉口的上下游交叉口的交通流量数据为自变量,建立多元回归模型(即基于空间相关性的数据恢复模型),得到当前交叉口交通流量预测值 然后乘以数据缺失车道j在该时段k的车道占有率fj(k),得到缺失数据车道流量数据预测值 见公式(10);
[0044]
[0045] 若上游交叉口有a个方向车流驶向检测路段,同时有驶出路段的车辆分b个方向驶向下游交叉口,则共有i=a+b个自变量Q1(k)、Q2(k)、……、Qi(k);
[0046]
[0047] 式中β0、……、βi为回归系数;
[0048]
[0049] 式中Hqj(k)表示数据缺失车道j在时段k内的历史交通流量,m为检测点车道数;
[0050] 3.3利用基于时空相关性的交通流量数据恢复方法,得到最终的缺失数据车道流量数据恢复值:
[0051] 根据公式(13)、(14)计算上述步骤3.1、3.2两模型预测值的百分比相对误差RT和RS,并根据公式(15)确定综合模型的权重系数θ;
[0052]
[0053]
[0054]
[0055] 最后根据式(16)得到最终的缺失数据车道流量数据恢复值;
[0056]
[0057] 步骤4.根据公式(17)将步骤3得到的最终的缺失数据车道流量数据恢复值补充至步骤2筛选后的交通流量数据集中;
[0058]
[0059] 本发明的有益效果:
[0060] 本发明可以对原始交通流数据进行统一预处理,并对缺失数据进行补充恢复。其采用的数据筛选方法根据实际交通情况和数据异常情况量身打造,算法简单明了且实用;同时基于时空相关性的数据恢复方法,结合了时间序列方法和多元线性回归分析法,相比于复杂的智能算法更为简单快速,能够满足实时处理的要求,且所得结果的精确性也不输于智能算法。

附图说明

[0061] 图1为十字路口示意图;
[0062] 图2为本发明方法流程图。

具体实施方式

[0063] 下面结合附图对本发明专利的技术方案作进一步的详细说明。
[0064] 如图2所示,本发明方法步骤如下:
[0065] 步骤(1).交通流量数据格式转换
[0066] 实际情况中,车辆检测器上传交通数据时通常按照信号控制周期上传,并不按照固定时间间隔上传,因此后续要对数据进行分析应用,必须先进行数据格式转换。
[0067] 将检测点由车辆检测器检测得到的原始交通流量数据qorig单位换算成标准小时流量数据,然后对该标准小时流量数据进行加权平均转换成固定周期T的交通流量数据集q。
[0068] 所述的固定周期T可根据实际应用所需而定;
[0069] 所述的固定周期T的交通流量数据集q={q(1),…,q(k),…,q(n)};q(k)表示k时间段的交通流量数据,其中
[0070] 所述的标准小时流量数据表示单位为veh/h(即车辆/小时)的交通流量数据;
[0071] 以T=5min为例,首先将所得原始交通流量数据统一折算成标准小时流量数据,然后将每5min内数据加权平均,如将8:00到8:05之间的数据加权平均定义为8:00时段的数据,若该5min内没有任何交通流量数据,则这一时段数据缺失。
[0072] 步骤(2).交通流量数据筛选
[0073] 由于环境因素影响、检测器故障或者数据传输过程故障,原始交通流量数据中存在着各种各样的异常数据,主要表现为:数据突变、数据激增、数据错误为零等等,为此本发明设计了三步筛选法:1)阈值筛选;2)零数据筛选;3)质量筛选,来对转换后的交通流量数据q(k)进行筛选。
[0074] 首先采用阈值筛选将交通流量数据q(k)框定在合理范围内,剔除一些极大或者极小甚至为负值的不合理流量数据;然后采用零数据筛选法区分出实际情况下确实没有车辆通过而得到的正确零数据与因为检测故障而显示为零的错误零数据;最后利用3σ法则进行质量控制筛选,筛选出在合理范围内却与实际不符的突变数据。
[0075] 2.1阈值筛选
[0076] 对步骤(1)得到的固定周期T的交通流量数据集q进行筛选,即对交通流量数据集q中的交通流量数据q(k)进行逐个比较,根据公式(1)进行筛选,剔除q中不符合公式(2)的数据:
[0077] 0<q(k)<Qmax (1);
[0078] Qmax=fc×C (2);
[0079] 其中阈值Qmax的单位为veh/h;C表示车道的基本通行能力,单位为veh/h;fc为常数,根据实际情况进行限定,一般取1~1.5;
[0080] 2.2零数据筛选
[0081] 根据交通流基本知识,在低流量情况下,车流是随机的,即在一定时间间隔内到达的车辆数服从泊松分布。
[0082] 对步骤2.1筛选后得到的交通流量数据集进行零数据筛选,具体步骤如下:
[0083] 根据泊松分布原理得到时间间隔t内到达车辆数的概率P(x)见公式(3):
[0084]
[0085] 式中P(x)为时间间隔t内到达x辆车的概率,x为自然数;λt为单位时间间隔t内平均到达的车辆数。
[0086] 本发明取置信水平α=0.01,采样间隔内有车辆通过,即x>0的概率为:
[0087]
[0088] 由此可得:
[0089] λt≈4.6(veh/(tmin)) (5);
[0090]
[0091] 其中Q0表示时间间隔t内的标准小时交通流量数据。
[0092] 本发明取时间间隔t等于固定周期T,若当k时段的历史平均交通流量 大于Q0,表示该时段有99﹪的概率不会出现零流量情况,若此时实际交通流量数据显示为零,则可判断为错误零数据而予以筛选出,如公式(7)所示:
[0093]
[0094] 其中 为k时段的历史平均交通流量,其计算方法可由经验确定。
[0095] 2.3质量筛选
[0096] 对步骤2.2筛选后的交通流量数据集进行质量筛选,剔除不符合式(8)的数据;
[0097]
[0098] 其中 为k时段的历史平均交通流量,σq为 的方差; 为k时段与k-1时段的流量平均差值,σd为 的方差。
[0099] 步骤(3).交通流量数据恢复
[0100] 交通流量数据从本质上来说属于时间序列数据,因此可以采用基于时间相关性的数据恢复方法对缺失数据进行补充恢复。同时城市路网的结构又使得交叉口间和车道间交通流量数据存在着空间上的相关关系,因此可以使用基于空间相关性的数据恢复对缺失数据进行补充。
[0101] 3.1利用基于时间相关性的交通流量数据恢复方法,得到缺失数据车道流量数据的预测值
[0102] 首先采用简单移动平均法构造时间序列模型(即基于时间相关性的数据恢复模型)以得到步骤(2)筛选后的交通流量数据中缺失数据车道流量数据的预测值 见公式(9):
[0103]
[0104] 其中n为移动平均个数。
[0105] 3.2利用基于空间相关性的交通流量数据恢复方法,得到缺失数据车道流量数据预测值
[0106] 首先采用多元线性回归分析,以步骤(2)筛选后的交通流量数据中缺失数据车道流量数据检测点交叉口的上下游交叉口的交通流量数据为自变量,建立多元回归模型(即基于空间相关性的数据恢复模型),得到当前交叉口交通流量预测值 然后乘以数据缺失车道j在该时段k的车道占有率fj(k),得到缺失数据车道流量数据预测值 见公式(10);
[0107]
[0108] 以典型十字路口为例,见图1,上游交叉口A有3个方向车流驶向检测路段AB,同时有驶出AB路段的车辆分3个方向驶向下游交叉口C、D、E。故共有六个自变量Q1(k)、Q2(k)、……、Q6(k)。
[0109]
[0110] 式中β0、……、β6为回归系数;
[0111]
[0112] 式中Hqj(k)表示数据缺失车道j在时段k内的历史交通流量,m为检测点车道数;
[0113] 3.3利用基于时空相关性的交通流量数据恢复方法,得到最终的缺失数据车道流量数据恢复值
[0114] 简单移动平均法算法简单快速,但不能用于连续缺失数据的恢复;多元线性回归分析法能够反映交通流的动态性,也能够应对数据连续缺失问题,却没有考虑车辆经过上下两交叉口所产生的时延。故根据两种方法的模型精度计算权重系数θ,并将两模型线性组合得到基于时空相关性的交通流量数据恢复方法。
[0115] 根据公式(13)、(14)计算上述步骤3.1、3.2两模型预测值的百分比相对误差RT和RS,并根据公式(15)确定综合模型的权重系数θ。
[0116]
[0117]
[0118]
[0119] 最后根据式(16)得到最终的缺失数据车道流量数据恢复值。
[0120]
[0121] 步骤4.根据公式(17)将步骤3得到的最终的缺失数据车道流量数据恢复值补充至步骤2筛选后的交通流量数据集中;
[0122]
[0123] 上述实施例仅用来进一步说明本发明,但本发明并不局限于实施例,凡是依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化与修饰,均落入本发明技术方案的保护范围内。