一种基于道路时空关联关系的路段行程时间推断方法转让专利

申请号 : CN201510344374.X

文献号 : CN105006147B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 呙维张发明朱欣焰刘异

申请人 : 武汉大学

摘要 :

本发明公开了一种基于道路时空关联关系的路段行程时间推断方法,包括步骤1:基于交叉口运行状态对路段行程时间交通数据进行统计;步骤2:基于通行模式周期性提取目标路段与邻接路段之间的特征关系;步骤3:基于三层神经网络模型对目标路段行程时间进行预测。本发明针对已有方法在数据缺失情况下对路段行程时间估计的不足,利用路段行程时间交通大数据对目标路段行程时间进行推断,解决了由于数据稀疏而不能推断行程时间的问题,最后利用武汉市浮动车GPS历史数据进行了验证,结果证明了本方法的有效性。

权利要求 :

1.一种基于道路时空关联关系的路段行程时间推断方法,其特征在于,包括以下步骤:

步骤1:基于交叉口运行状态对路段行程时间交通数据进行统计;

具体实现过程为,根据浮动车在道路交叉口的运行状态,计算浮动车通过路段的行程时间,并统计一定时间内浮动车通过路段的路段行程时间,获得路段行程时间交通数据,数据包括浮动车ID、驶入路段时刻、驶入路段端点ID、驶出路段端点ID、路段行程时间;

步骤2:基于通行模式周期性提取目标路段与邻接路段之间的特征关系;

具体实现过程为,以周为周期对统计数据分别聚类,分别按照周一、周二、周三、周四、周五、周六、周日将统计数据进行聚合;根据交通流向提取特征值,每隔半小时分别按照交通流向提取特征值;特征值包括:一周中哪一天、一天中哪半小时、目标路段与邻接路段度数比、路段与邻接路段长度比特征、邻接路段速度期望、邻接路段速度标准差、目标路段与邻接路段行程时间比值;

步骤3:基于三层神经网络模型对目标路段行程时间进行预测;

所述三层神经网络模型包括3层,一个输入层、一个隐层和一个输出层,输入层有6个神经元,输出层有1个神经元;并将提取的特征:一周中哪一天、一天中哪半小时、目标路段与邻接路段度数比、目标路段与邻接路段长度比、邻接路段速度期望、邻接路段速度标准差作为神经网络输入,目标路段与邻接路段行程时间比值作为神经网络的输出,进行训练,训练函数选择Levenberg-Marquardt算法,学习速率设置为0.01;并用训练的神经网络模型进行路段行程时间的推断。

说明书 :

一种基于道路时空关联关系的路段行程时间推断方法

技术领域

[0001] 本发明属于智能交通技术领域,特别涉及一种基于道路时空关联关系的路段行程时间推断方法。

背景技术

[0002] 装有GPS接收器的出租车作为交通状态传感器,采集的信息包括实时速度、时间戳、经纬度坐标以及方位角等,一定程度反映了城市交通的运行状态,对城市路网中路段实时或准实时行程时间的估计发挥重要作用。然而,由于出租车GPS采集的低频性以及行驶区域的局限性,出租车GPS采集的轨迹信息并不能实时覆盖所有城市路网,因此数据存在稀疏性。如何利用稀疏的数据推断路段行程时间是一个亟待解决的问题。
[0003] 目前,已有许多基于模型的方法利用浮动车数据来估计路段行程时间。Jula等在【文献1】中提出了在随机动态网络中估计路段行程时间的数学模型,并用卡尔曼滤波的方法估计未来时刻的路段行程时间;Zheng等在【文献2】中提出了一个三层神经网络模型估计单车路段的行程时间;Jenelius等在【文献3】中提出了一个统计模型用于城市路网行程时间的估计,该模型将轨迹行程时间分为路段行程时间和交叉口延迟时间两部分进行计算。现有模型是在GPS数据充足的情况下,估计路段或轨迹的行程时间,然而,在数据稀疏或缺失情况下,已有的方法不能对路段的行程时间进行有效推断。
[0004] 【文献1】Jula H,Dessouky M,Ioannou P A.Real-time estimation of travel times along the arcs and arrival times at the nodes of dynamic stochastic networks;
[0005] 【文献2】Zheng F,Van Zuylen H.Urban link travel time estimation based on sparse probe vehicle data;
[0006] 【文献3】Jenelius E,Koutsopoulos H N.Travel time estimation for urban road networks using low frequency probe vehicle data)。

发明内容

[0007] 针对数据稀疏性问题,本发明提出了一种基于目标路段及邻接路段特征关系的三层神经网络模型,根据历史数据获得路段间的特征关系,并用该模型进行路段行程时间的推断。对每一个待推断路段,车辆进入路段时间、目标路段与邻接路段的度数比、长度比以及邻接路段速度期望、速度方差作为输入,目标路段与邻接路段的行程时间比作为输出,并用训练的神经网络对路段行程时间进行推断。
[0008] 为解决数据稀疏性造成路段行程时间估计困难的问题,本发明提供了一种基于道路时空关联关系的路段行程时间推断方法,包括以下步骤:
[0009] 步骤1:基于交叉口运行状态对路段行程时间交通大数据进行统计;
[0010] 步骤2:基于通行模式周期性提取目标路段与邻接路段之间的特征关系;
[0011] 步骤3:基于三层神经网络模型对目标路段行程时间进行预测。
[0012] 作为优选,步骤1的具体实现过程为,根据浮动车在道路交叉口的运行状态,计算浮动车通过路段的行程时间,并统计一定时间内浮动车通过路段的路段行程时间,获得路段行程时间交通大数据,大数据包括浮动车ID、驶入路段时刻、驶入路段端点ID、驶出路段端点ID、路段行程时间。
[0013] 作为优选,步骤2的具体实现过程为,以周为周期对统计数据分别聚类,分别按照周一、周二、周三、周四、周五、周六、周日将统计数据进行聚合;根据交通流向提取特征值,每隔半小时分别按照交通流向提取特征值;特征值包括:一周中哪一天、一天中哪半小时、目标路段与邻接路段度数比、路段与邻接路段长度比特征、邻接路段速度期望、邻接路段速度标准差、目标路段与邻接路段行程时间比值。
[0014] 作为优选,步骤3中所述的三层神经网络模型包括3层,一个输入层、一个隐层和一个输出层,输入层有6个神经元,输出层有1个神经元;并将提取的特征:一周中哪一天、一天中哪半小时、目标路段与邻接路段度数比、目标路段与邻接路段长度比、邻接路段速度期望、邻接路段速度标准差作为神经网络输入,目标路段与邻接路段行程时间比值作为神经网络的输出,进行训练,训练函数选择Levenberg-Marquardt算法,学习速率设置为0.01;并用训练的神经网络模型进行路段行程时间的推断。
[0015] 相对于现有技术,本发明的优点如下:
[0016] 1.利用交通大数据解决数据稀疏性问题;本发明利用统计的路段行程时间交通大数据推断目标路段行程时间,可以解决由于当前数据稀疏性而造成对目标路段行程时间无法推断的问题;
[0017] 2.利用通行模式周期性提取目标路段与邻接路段之间的特征关系;本发明利用通行模式按照周呈现出的周期性,分别将周一、周二、周三、周四、周五、周六、周日统计数据聚类,并提取目标路段与邻接路段之间的特征关系;
[0018] 3.设计了反映通行模式周期性以及目标路段与邻接路段关系的三层神经网络模型;该模型将提取的一周中的第几天、一天中的哪个半小时、目标路段与邻接路段度数比、目标路段与邻接路段长度比、邻接路段速度期望、邻接路段速度标准差作为神经网络输入,反映了通行模式周期性以及目标路段与邻接路段之间的关系,并用训练的模型进行路段行程时间的推断。

附图说明

[0019] 图1:为本发明实施例的研究区域路网图;
[0020] 图2:为本发明实施例的车辆交叉口区域运动特性分析图;其中(a)为一个交叉口的具体情况,(b)为路段的入口与出口情况;
[0021] 图3:为本发明实施例的交通流向示意图;
[0022] 图4:为本发明实施例的神经网络模型结构图;
[0023] 图5:为本发明实施例的真实路段行程时间与推断路段行程时间之间的关系图;
[0024] 图6:为本发明实施例的路段行程时间推断流程图。

具体实施方式

[0025] 为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
[0026] 请见图1,本实施例对武汉市部分区域路网作为研究区域,每个路段给出一个编号,本实施例以路段76、77、81、82、88为例,具体说明本发明的实现方式。
[0027] 请见图6,本发明的提供的一种基于道路时空关联关系的路段行程时间推断方法,包括以下步骤:
[0028] 步骤1:计算单车路段行程时间;
[0029] 根据所示车辆在交叉口处的运动状态,计算单车通过路段的行程时间。
[0030] 根据现行交通规则,假设在交叉口区域不存在因为乘客上下车而导致停车,使得出租车速度为零的点;基于这种假设,请见图2,为实施例的车辆交叉口区域运动特性分析图,图中pi表示出租车GPS点,以下分情况进行交叉口运动特性的分析;
[0031] (1)若p3点在定位偏差搜索圆内,且速度为零,则认为浮动车仍然停留在交叉口停车线后,停车等待(由于GPS及GIS误差造成的定位偏差所致),如图2,(a)为一个交叉口的具体情况,(b)为路段的入口与出口情况;取下一个GPS点p4的速度v4,用p4点的速度反推车辆通过路段交叉口中心线pm的时刻。若p4点的速度不为零且在交叉口区域搜索圆内,则认为浮动车从交叉口停车线到p4点匀加速行驶,用以下方法计算浮动车通过交叉口pm的时间:
[0032]           (式一)
[0033] △tm4=2lm4/(vm+v4)          (式二)
[0034]           (式三)
[0035]           (式四)
[0036] v3=0          (式五)
[0037] 综上,可以得到出租车经过路段交叉口中心线的时间为:
[0038]           (式六)
[0039] 其中,ti(i=p1,p1…)表示出租车经过i点的时刻,vi(i=p1,p1…)表示出租车经过i点的速度,Δtm4表示出租车经过交叉口中心线pm点到p4点的时间差,lm4表示交叉口中心线pm点到p4点的距离,δ为定位偏差,设置为常数5m,a为中间变量;
[0040] 若v4在交叉口区域搜索圆内且为零,说明拥堵严重,认为从路段交叉口停车线到p4点,浮动车的运动经历了这样一个过程,在路段停车线后静止等待然后先匀加速后匀减速至零。如果下一点p5点速度v5不为零,考虑到同一目标路段拥挤程度的相似性,为简化计算,假设浮动车从交叉口中心线到p4点以p5点速度匀减速行驶。浮动车通过交叉口pm的时间可用以下方法计算:
[0041] △tm4=2lm4/v5       (式七)
[0042]          (式八)
[0043] 若v4在交叉口区域搜索圆外且为零,则说明拥堵严重或者乘客上下车,由于乘客上下车的轨迹并不能反应路段交通流情况,因此根据浮动车载客情况剔除乘客上下车的单车路段行程时间计算情况,拥堵情况下计算方法同上;
[0044] 若v4在交叉口区域搜索圆外且不为零,则说明浮动车从交叉口停车线启动达到一定速度,一直运行到p4,认为浮动车从交叉口中心线到p4点匀速行驶,以p4点速度v4反推浮动车通过交叉口中心线的速度,算浮动车通过交叉口pm的时间:
[0045] △tm4=lm4/v4          (式九)
[0046]           (式十)
[0047] (2)若p2,p3点在交叉口区域搜索圆内,p2点速度为零,p3点速度也为零,说明整个路段拥堵严重,从路段交叉口停车线到p3点浮动车运动经历了这样一个过程,在路段停车线后等待然后先匀加速后匀减速至零;如果下一点p4点速度v4不为零,考虑到同一目标路段拥挤程度的相似性,为简化计算,假设浮动车从交叉口中心线到p3点以p4点速度匀减速行驶,则浮动车通过交叉口pm的时间可用以下方法计算:
[0048] △tm3=2lm3/v4        (式十一)
[0049]             (式十二)
[0050] (3)若p2,p3点在交叉口区域搜索圆内,p2点速度为零,p3点速度不为零,说明浮动车在p2点停车等待,浮动车从路段交叉口停车线到p3点之间匀加速行驶,用p3点速度反推路段交叉口的速度。浮动车通过交叉口pm的时间可用以下方法计算:
[0051]              (式十三)
[0052] △tm3=2lm3/(vm+v3)       (式十四)
[0053]          (式十五)
[0054]         (式十六)
[0055] v2=0        (式十七)
[0056] 综上,可以得到出租车经过路段交叉口中心线的时间为:
[0057]          (式十八)
[0058] (4)若p2,p3点在交叉口区域搜索圆内,p2点速度不为零,p3点速度为零,说明整个路段拥堵严重,则认为浮动车从路段交叉口中心线到p3点之间匀减速行驶,考虑到交叉口通行速度具有一定的相似性,用p2点速度反推路段交叉口的速度。因此,浮动车通过交叉口中心线pm的时间可用以下方法计算:
[0059] △tm3=2lm3/v2         (式十九)
[0060]           (式二十)
[0061] (5)若p2,p3点在交叉口区域搜索圆内,p2点速度不为零,p3点速度也不为零,则认为浮动车没有在交叉口停车线停车等待,从路段交叉口中心线到p3点之间匀速行驶,用p3点速度v3反推浮动车在路段交叉口中心线的速度。因此,浮动车通过交叉口pm的时间可用以下方法计算:
[0062] △tm3=lm3/v3        (式二十一)
[0063]              (式二十二)
[0064] (6)若p3点在交叉口区域搜索圆外,p2点任意(在圆内或圆外),p2点速度为零,p3点速度也为零,则可以认为路段拥堵或者路段上有乘客上下车,根据出租车载客状态进一步判断,若是乘客下车,则剔除此种计算单车路段行程时间的情况,否则可以认为道路拥堵,浮动车通过交叉口pm的时间计算方法同情况(2);
[0065] (7)若p3点在交叉口区域搜索圆外,p2点任意(在圆内或圆外),p2点速度为零,p3点速度不为零,其处理方法同情况(3);
[0066] (8)若p3点在交叉口区域搜索圆外,p2点任意(在圆内或圆外),p2点速度不为零,p3点速度为零,在p3可能存在乘客上下车或者路段拥堵,根据出租车载客状态进一步判断,若是乘客下车,则剔除此种计算单车路段行程时间的情况,否则对于拥堵情况,浮动车通过交叉口pm的时间计算方法同情况(4);
[0067] (9)若p3点在交叉口区域搜索圆外,p2点任意(在圆内或圆外),p2点速度不为零,p3点速度也不为零,其处理方法同情况(5);
[0068] 步骤2:路段行程时间统计;
[0069] 利用武汉市出租车在2014年6月、7月两个月的历史GPS轨迹数据,统计出租车通过研究区域路段76、77、81、82、88的行程时间。
[0070] 步骤3:以周为周期对统计数据分别聚类;
[0071] 根据出租车进入路段时刻,并判断该时刻为一周中的第几天,分别按照周一、周二、周三、周四、周五、周六、周日将统计数据进行聚合。
[0072] 步骤4:根据交通流向提取特征值;
[0073] 如图3所示,每隔半小时分别按照红色交通流向、黑色交通流向提取特征值,假设路段82为目标路段,其它路段76、77、81、88为目标路段82的邻接路段;本实施例定义以下变量l代表路段长度,ti代表第i辆出租车通过路段的行程时间,vi代表第i辆出租车通过路段的平均速度,E(v)代表辆出租车通过路段的期望速度,D(v)代表出租车通过路段的速度标准差。各个特征值的计算方法如下:
[0074] 一周中哪一天、一天中哪半小时、目标路段与邻接路段度数比、路段与邻接路段长度比特征、邻接路段速度期望、邻接路段速度标准差、目标路段与邻接路段行程时间比值。
[0075] (1)一周中哪一天:按照时刻提取出租车通过时间为一周中的第几天,用数字1-7表示;
[0076] (2)一天中哪半小时:按照时刻提取出租车通过时间为一天中的哪个半小时,用数字1-48表示;
[0077] (3)目标路段与邻接路段度数比:路段度数Degri为与路段两端点直接相连路段数之和,对路段交通产生重要影响。路段度数越大,则与该路段直接相连的路段越多,该路段的交通分流能力越强,因此根据式二十三提取目标路段与邻接路段度数比作为神经网络输入信息。
[0078]            (式二十三)
[0079] 其中,Degrm为目标路段度数,Degrx为邻接路段度数;
[0080] (4)路段与邻接路段长度比特征:路段行程时间受路段长度的影响,一般而言路段长度越大,则车辆通过路段的行程时间越长。因此,目标路段长度、目标路段行程时间与邻接路段长度、邻接路段行程时间存在一定的关联关系,根据以下公式提取目标路段与邻接路段的长度比作为神经网络输入信息。
[0081]         (式二十四)
[0082] 其中,lengm为目标路段度数,lengx为邻接路段度数;
[0083] (5)速度期望:根据以下公式计算单车通过路段的平均速度,由于每一辆出租车通过目标路段的行程时间不同,因此根据下式计算出租车通过目标路段的速度期望值,用速度期望值代表所有车辆在半小时内通过路段的速度。
[0084] vi=l/ti            (式二十五)
[0085]          (式二十六)
[0086] (6)速度标准差:根据下式,计算速度的标准差,它反映了车辆通过路段速度的离散情况;
[0087]              (式二十七)
[0088] (7)行程时间比值:目标路段与邻接路段行程时间的比值作为神经网络的输出。
[0089] 步骤5:神经网络模型训练;
[0090] 请见图4,本实施例神经网络模型包括3层,一个输入层、一个隐层和一个输出层,输入层有6个神经元,输出层有1个神经元;并将提取的特征:一周中哪一天、一天中哪半小时、目标路段与邻接路段度数比、目标路段与邻接路段长度比、邻接路段速度期望、邻接路段速度标准差作为神经网络输入,目标路段与邻接路段行程时间比值作为神经网络的输出,进行训练。
[0091] 神经网络训练包括三个步骤:训练、验证和测试。本实施例将获得的整个数据集分成三个不同的数据集合:训练数据集、验证数据集和测试数据集,训练数据集用于神经网络的训练,验证数据集用于防止神经网络出现“过拟合”现象,以至于降低网络的泛化能力,测试数据集则用于神经网络性能的测试。神经网络的训练函数选择Levenberg-Marquardt算法,学习速率设置为0.01,以保持神经网络的稳定。
[0092] 步骤6:路段行程时间推断;
[0093] 利用训练的神经网络模型,根据邻接路段与目标路段之间的特征关系对目标路段行程时间进行推断。图5所示为在不同数据量条件下,真实路段行程时间与推断的目标路段行程时间之间的线性关系;图中横坐标表示目标路段的真实行程时间,纵坐标表示目标路段的推断行程时间,图中线性相关系数R值表示真实路段行程时间与推断路段行程时间之间的相关性,R值越大,表明神经网络模型对行程时间推断的结果越好。
[0094] 应当理解的是,本说明书未详细阐述的部分均属于现有技术。
[0095] 应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。