支持向量回归机融合的高速公路路段平均速度估计方法转让专利

申请号 : CN201710532831.7

文献号 : CN107180534B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 胡郁葱黄靖翔张筑杰黄玮琪

申请人 : 华南理工大学

摘要 :

本发明公开了一种支持向量回归机融合的高速公路路段平均速度估计方法,包括步骤:1)选定研究的高速公路,获取基础数据资料;2)根据收费数据,采用基于轨迹法的修正算法求取路段平均速度;3)将“两客一危”车辆作为浮动车,采用速度‑时间积分模型和加权平均法获得路段平均速度;4)使用支持向量回归机融合算法对两类路段平均速度的结果进行融合,得到基于支持向量回归机融合的高速公路路段平均速度。本发明将高速公路收费数据和“两客一危”北斗卫星定位系统数据结合起来,通过支持向量回归机的方法得到融合的路段平均速度估计值,提高了速度估计的准确度,有利于高速公路管理者的日常监测和应急处理,从而有效提高高速公路的运行效率。

权利要求 :

1.支持向量回归机融合的高速公路路段平均速度估计方法,其特征在于,包括以下步骤:

1)选定研究的高速公路,获取基础数据资料,包括:高速公路收费数据、高速公路“两客一危”北斗卫星定位数据;

2)根据收费数据,采用基于轨迹法的修正算法求取路段平均速度;

3)将“两客一危”车辆作为浮动车,以其北斗卫星定位系统数据为基础,采用速度-时间积分模型对单车行程速度进行估计,再对单一浮动车作加权平均获得路段平均速度,具体步骤包括:

3.1)计算单一浮动车路段行程速度:在时间区间p内研究路段sk,k+1上的浮动车数据返回点分布情况,以1,2,3,4,……,M表示浮动车q在路段sk,k+1上的定位点序号;定义:为p时间区间内浮动车q在路段sk,k+1上行驶的有效定位距离;时间序列和速度序列 分别为浮动车q在路段sk,k+1上的对

应定位点的时间和速度信息,则 的计算公式为:

则浮动车q在路段sk,k+1上行驶的平均行程速度 等价为有效距离 上行驶的平均行程速度,由下式求得:

3.2)计算路段平均速度:将时间区间p内路段sk,k+1上各浮动车的平均行程速度 作加权平均即可获得路段平均速度 其权重为各浮动车在研究路段上行驶的有效距离与路段长度之比,具体计算过程如下:其中, 为浮动车q在研究路段sk,k+1上行驶的有效距离 与路段长度lk,k+1的比值; 为浮动车q的归一化权重; 为研究时段p内经过路段sk,k+1的浮动车数量;

4)使用支持向量回归机融合算法对两类单一数据源处理出来的结果进行融合,得到基于支持向量回归机融合的高速公路路段平均速度。

2.根据权利要求1所述的支持向量回归机融合的高速公路路段平均速度估计方法,其特征在于:在步骤1)中,所述高速公路收费数据资料包括车辆进出口收费站的编号和时间信息,所述“两客一危”北斗卫星定位数据资料包括通过北斗卫星定位系统获得的速度数据。

3.根据权利要求1所述的支持向量回归机融合的高速公路路段平均速度估计方法,其特征在于:在步骤2)中,根据收费数据,采用基于轨迹法的修正算法求取路段平均速度,包含如下步骤:

2.1)数据预处理:若所采集的收费数据存在下列问题,则剔除:①数据不完整,出入站编码丢失或进出时间丢失;②出入口站编码相同;③入口时间晚于出口时间;④行程速度超过高速公路限速的120%;⑤行程时间超过样本均值的两倍标准差范围的离群值;

经过处理后,获得从时间区间p内出发,在路段si,j上行驶的车辆平均行程时间 即为:式中,i,j分别表示高速公路入口和出口; 表示从时间区间p出发的车辆n在i,j之间的收费系统记录行程时间, 表示筛选后的对应时间和出入口行驶的车辆数;

2.2)获取行程时间二维表:高速公路收费数据可处理得到所有节点之间的平均行程时间,将一天划分为P个时段,同一个时间区间p的路段行程时间按优先级排序方法排列成一个一维列向量Tp,p=1,2,…,P,其中入口i的优先级大于出口j的优先级,即再把得到的P个一维列向量按时间顺序组合成一个 的二维表,则该表涵盖了所有P个时段的各OD之间的旅行时间;

2.3)计算基本路段的修正行程时间:从节点k到节点k+1的基本路段sk,k+1旅程时间修正算法如下:a)当k=1时,

其中, 为基本路段s1,2的旅程修正时间;p为车辆从节点1出发时所处的时间区间;X为车辆从节点1行驶到节点2时所处的时间区间;li,j为高速公路路段si,j对应的长度;

为对应路程行程时间的权重,W1,2为车辆行驶的路程之和,通过下式计算:b)当2≤k≤K-2时,

其中, 为基本路段sk,k+1的旅程修正时间;p为车辆从当前节点k出发时所处的时间区间,ri为从节点上游的k-1个节点出发的车辆的出发时间区间,i=1,2,…,k-1,表示由时间区间ri上游i节点出发的车辆行驶到节点k时所处的时间区间恰为恰为p,而q为由时间区间p从节点k出发的车辆到达下游节点k+1时所处的时间区间;与W1,2一致,Wk,k+1为车辆行驶的路程之和,通过下式计算:c)当k=K-1时,

其中, 为基本路段sK-1,K的旅程修正时间;p为车辆从当前节点K-1出发的时间区间;

ri为K-1节点的上游K-2个节点出发的车辆的出发时间区间,i=1,2,…,K-1,表示由时间区间ri上游i节点出发的车辆行驶到节点K-1是所处的时间区间恰为p;WK-1,K为车辆行驶的路程之和,通过下式计算:

2.4)计算路段平均速度:通过上述修正行程时间,计算出路段sk,k+1的平均速度式中,lk,k+1为基本路段sk,k+1的长度; 为基本路段sk,k+1的旅程修正时间,由步骤

2.3)计算得。

4.根据权利要求1所述的支持向量回归机融合的高速公路路段平均速度估计方法,其特征在于:在步骤4)中,使用基于支持向量回归机融合算法对两类单一数据源处理出来的结果进行融合,得到基于支持向量回归机融合的高速公路路段平均速度的步骤如下:

4.1)产生训练集/测试集:将处理出的基于收费数据和“两客一危”北斗卫星定位系统数据所得的两类路段平均速度和真实值根据时间和路段三者一一对应,组成一个三列的矩阵,形成样本集,按照随机抽样的方式产生模型的训练集合和测试集合,保持测试集至少为训练集的20%;

4.2)构建支持向量回归机模型:采用RBF核函数,首先利用交叉验证方法寻找最佳的参数,包括惩罚因子和RBF核函数中的方差,然后利用最佳的参数训练模型;

4.3)模型输出:将测试集中的两类路段平均速度输入向量机中,将预测值与真实值进行比较,计算均方误差E和决定系数R2两项评价指标,具体计算公式如下所示:其中l为测试集样本个数;yi为第i个样本的真实值,i=1,2,…,l; 为第i个样本的预测值,i=1,2,…,l;

4.4)性能评价:比较均方误差E和决定系数R2与标准值得差异,若E>0.03,或R2<0.8,则重复步骤4.1)、4.2)和4.3),通过修改模型参数、核函数类型的方法重新建立向量回归机,直到满足要求为止,否则,保存向量机的形式,用于后续高速路段平均速度估计方法。

说明书 :

支持向量回归机融合的高速公路路段平均速度估计方法

技术领域

[0001] 本发明涉及高速公路管理的技术领域,尤其是指一种支持向量回归机融合的高速公路路段平均速度估计方法。

背景技术

[0002] 高速公路路段平均速度指单位时间段内,指定方向通过高速公路某一路段的交通车辆平均行程速度。路段平均速度能直观反映高速公路路段的实际运行状况,对高速公路的出行者和管理部门都具有重要的意义。目前,我国高速公路路段平均速度的获取方法主要为固定采集法,即采用布设在高速公路上的车辆检测器、高清摄像头等设备直接获取通过该断面的车辆平均速度,然而,由于布设和维护成本高等问题,车辆检测器、高清卡口等设备的布设密度较低,导致所采集的数据覆盖范围小,且存在损坏率高、维护不及时的问题,无法真实反映高速公路系统的运行状态。因此,国内外专家学者开始研究使用检测器数据以外的其他数据源估计高速公路路段平均速度的方法,例如收费数据、浮动车数据等。采用不同于车辆检测器的数据源,虽然有效避免了车检器覆盖范围小的问题,但是由于每种单一数据源都有其自身的缺陷,例如收费数据具有滞后性、受匝道长度影响的缺陷而浮动车数据具有检测目标随机性的缺陷,并不能够完全准确地反映实际的交通状态。
[0003] 随着计算机技术的发展,多源数据的融合方法受到越来越多的研究者关注。与单一数据源相比,通过多源数据融合获得的结果将具有更高的准确性和可靠性。但是,前人的融合算法依然较多地在检测器数据的基础上进行优化,而检测器密度稀疏且损坏率较高是当前高速公路数据采集的硬伤,有必要研究避开检测器数据而能通过其他数据融合获取平均速度的方法。通过对高速公路收费数据和浮动车数据进行比较发现:收费数据具有车辆信息全面可靠、辐射路网范围广的优点,却存在滞后性、受道路匝道影响较大的缺陷,而浮动车数据则具有实时性好,路网分布相对均匀分散的优点,却存在检测目标随机性、对象不全面的缺陷,可见它们之间能够很好地优势互补,互相佐证。
[0004] 因此,本发明提出一种基于支持向量回归机融合的高速公路路段平均速度估计方法,对收费数据和浮动车数据获取的路段平均速度进行融合修正,融合后的路段平均速度更接近真实值,可更好地反映高速公路系统运行状态,为管理者和出行者提供决策依据。

发明内容

[0005] 本发明的目的在于弥补现有高速公路车辆检测器密度稀疏、损坏率高导致所估计的路段平均速度准确率不高这一缺陷,提出了一种支持向量回归机融合的高速公路路段平均速度估计方法。该方法利用支持向量回归机原理,对高速公路收费数据和“两客一危”卫星定位数据所获取的路段平均速度进行融合处理,得到估计效果更好的路段平均速度,具有实际推广价值。
[0006] 为实现上述目的,本发明所提供的技术方案为:支持向量回归机融合的高速公路路段平均速度估计方法,包括以下步骤:
[0007] 1)选定研究的高速公路,获取基础数据资料,包括:高速公路收费数据、高速公路“两客一危”北斗卫星定位数据;
[0008] 2)根据收费数据,采用基于轨迹法的修正算法求取路段平均速度;
[0009] 3)将“两客一危”车辆作为浮动车,以其北斗卫星定位系统数据为基础,采用速度-时间积分模型对单车行程速度进行估计,再对单一浮动车作加权平均获得路段平均速度;
[0010] 4)使用支持向量回归机融合算法对两类单一数据源处理出来的结果进行融合,得到基于支持向量回归机融合的高速公路路段平均速度。
[0011] 在步骤1)中,所述高速公路收费数据资料包括车辆进出口收费站的编号和时间信息,所述“两客一危”北斗卫星定位数据资料包括通过北斗卫星定位系统获得的速度数据。
[0012] 在步骤2)中,根据收费数据,采用基于轨迹法的修正算法求取路段平均速度,包含如下步骤:
[0013] 2.1)数据预处理:若所采集的收费数据存在下列问题,则剔除:①数据不完整,出入站编码丢失或进出时间丢失;②出入口站编码相同;③入口时间晚于出口时间;④行程速度超过高速公路限速的120%;⑤行程时间超过样本均值的两倍标准差范围的离群值;
[0014] 经过处理后,获得从时间区间p内出发,在路段si,j上行驶的车辆平均行程时间即为:
[0015]
[0016] 式中,i,j分别表示高速公路入口和出口; 表示从时间区间p出发的车辆n在i,j之间的收费系统记录行程时间, 表示筛选后的对应时间和出入口行驶的车辆数;
[0017] 2.2)获取行程时间二维表:高速公路收费数据可处理得到所有节点之间的平均行程时间,将一天划分为P个时段,同一个时间区间p(p=1,2,…,P)的路段行程时间按优先级排序方法排列成一个一维列向量Tp,其中入口i的优先级大于出口j的优先级,即再把得到的P个一维列向量按时间顺序组合成一个 的二维表,则该表涵盖了所有P个时段的各OD之间的旅行时间;
[0018] 2.3)计算基本路段的修正行程时间:从节点k到节点k+1的基本路段sk,k+1旅程时间修正算法如下:
[0019] a)当k=1时,
[0020]
[0021] 其中, 为基本路段s1,2的旅程修正时间;p为车辆从节点1出发时所处的时间区间;X为车辆从节点1行驶到节点2时所处的时间区间;li,j为高速公路路段si,j对应的长度;为对应路程行程时间的权重,W1,2为车辆行驶的路程之和,通过下式计算:
[0022]
[0023] b)当2≤k≤K-2时,
[0024]
[0025] 其中, 为基本路段sk,k+1的旅程修正时间;p为车辆从当前节点k出发时所处的时间区间,ri(i=1,2,…,k-1)为从节点上游的k-1个节点出发的车辆的出发时间区间,表示由时间区间ri上游i节点出发的车辆行驶到节点k时所处的时间区间恰为恰为p,而q为由时间区间p从节点k出发的车辆到达下游节点k+1时所处的时间区间;与W1,2一致,Wk,k+1为车辆行驶的路程之和,通过下式计算:
[0026]
[0027] c)当k=K-1时,
[0028]
[0029] 其中, 为基本路段sK-1,K的旅程修正时间;p为车辆从当前节点K-1出发的时间区间;ri(i=1,2,…,K-1)为K-1节点的上游K-2个节点出发的车辆的出发时间区间,表示由时间区间ri上游i节点出发的车辆行驶到节点K-1是所处的时间区间恰为p;WK-1,K为车辆行驶的路程之和,通过下式计算:
[0030]
[0031] 2.4)计算路段平均速度:通过上述修正行程时间,计算出路段sk,k+1的平均速度[0032]
[0033] 式中,lk,k+1为基本路段sk,k+1的长度; 为基本路段sk,k+1的旅程修正时间,由步骤2.3)计算得。
[0034] 在步骤3)中,将“两客一危”车辆作为浮动车,以其北斗卫星定位系统获得的速度数据为基础,采用速度-时间积分模型对单车行程速度进行估计,再对单一浮动车作加权平均获得路段平均速度,具体步骤包括:
[0035] 3.1)计算单一浮动车路段行程速度:在时间区间p内研究路段sk,k+1上的浮动车数据返回点分布情况,以1,2,3,4,……,M表示浮动车q在路段sk,k+1上的定位点序号;定义:为p时间区间内浮动车q在路段sk,k+1上行驶的有效定位距离;时间序列
和速度序列 分别为浮动车q在路段sk,k+1上的对
应定位点的时间和速度信息,则 的计算公式为:
[0036]
[0037] 则浮动车q在路段sk,k+1上行驶的平均行程速度 等价为有效距离 上行驶的平均行程速度,由下式求得:
[0038]
[0039] 3.2)计算路段平均速度:将时间区间p内路段sk,k+1上各浮动车的平均行程速度作加权平均即可获得路段平均速度 其权重为各浮动车在研究路段上行驶的有效距离与路段长度之比,具体计算过程如下:
[0040]
[0041]
[0042]
[0043] 其中, 为浮动车q在研究路段sk,k+1上行驶的有效距离 与路段长度lk,k+1的比值; 为浮动车q的归一化权重; 为研究时段p内经过路段sk,k+1的浮动车数量。
[0044] 在步骤4)中,使用基于支持向量回归机融合算法对两类单一数据源处理出来的结果进行融合,得到基于支持向量回归机融合的高速公路路段平均速度的步骤如下:
[0045] 4.1)产生训练集/测试集:将处理出的基于收费数据和“两客一危”北斗卫星定位系统数据所得的两类路段平均速度和真实值根据时间和路段三者一一对应,组成一个三列的矩阵,形成样本集,按照随机抽样的方式产生模型的训练集合和测试集合,保持测试集至少为训练集的20%;
[0046] 4.2)构建支持向量回归机模型:采用RBF核函数,首先利用交叉验证方法寻找最佳的参数,包括惩罚因子和RBF核函数中的方差,然后利用最佳的参数训练模型;
[0047] 4.3)模型输出:将测试集中的两类路段平均速度输入向量机中,将预测值与真实值进行比较,计算均方误差E和决定系数R2两项评价指标,具体计算公式如下所示:
[0048]
[0049]
[0050] 其中l为测试集样本个数;yi(i=1,2,…,l)为第i个样本的真实值;为第i个样本的预测值;
[0051] 4.4)性能评价:比较均方误差E和决定系数R2与标准值得差异,若E>0.03,或R2<0.8,则重复步骤4.1)、4.2)和4.3),通过修改模型参数、核函数类型的方法重新建立向量回归机,直到满足要求为止,否则,保存向量机的形式,可用于后续高速路段平均速度估计方法。
[0052] 本发明与现有技术相比,具有如下优点与有益效果:
[0053] 1、本发明不依赖高速公路的车检器进行速度估计,有效避免了车检器损坏率高、精确度低、布置范围不广泛的缺点;
[0054] 2、本发明首次将我国高速公路上的“两客一危”北斗卫星定位系统数据用于路段平均速度估计中,增加北斗卫星定位系统的实用价值;
[0055] 3、本发明提出融合收费数据和卫星定位系统数据估计路段平均速度,克服了单一数据源得到的路段平均速度具有滞后性、不够全面等问题,提高了路段平均速度估计方法的精确度;
[0056] 4、本发明采用支持向量回归机融合,具有在有限样本的情况下获得最优解、解决传统神经网络无法避免局部最优问题、避免传统神经网络需要反复试凑确定网络结构问题和保证模型具有良好的泛化能力的优势;
[0057] 5、本发明在高速公路运行状态监测系统和用户路径诱导系统中具有广泛的使用空间,具有需要数据源简单、覆盖范围广的优点,对提高高速公路运行状态、发挥其骨干道路作用具有极大好处。

附图说明

[0058] 图1为高速公路基本路段示意图。
[0059] 图2为路段sk,k+1上的浮动车定位点分布图。
[0060] 图3为基于支持向量回归机的融合方法建模流程图。
[0061] 图4为实施例测试集结果对比图。

具体实施方式

[0062] 下面结合具体实施例对本发明作进一步说明。
[0063] 本实施例所提供的支持向量回归机融合的高速公路路段平均速度估计方法,使用高速公路收费数据和“两客一危”北斗卫星定位数据,分别处理出路段平均速度,再使用支持向量回归机进行融合,估计出高速公路路段平均速度。具体包括以下步骤:
[0064] 1)选定研究的高速公路,获取基础数据资料,包括:高速公路收费数据、高速公路“两客一危”北斗卫星定位数据;
[0065] 所述高速公路收费数据资料包括车辆进出口收费站的编号和时间信息。如下表1所示。
[0066] 表1收费数据示例
[0067]入口编号 入口日期 入口时间 出口编号 出口日期 出口时间
1022 160701 14:05 2002 160701 15:30
1104 160701 12:22 2002 160701 15:30
1101 160701 13:01 2002 160701 15:31
1027 160701 13:55 2002 160701 15:33
3015 160701 15:02 2002 160701 15:40
[0068] 所述“两客一危”卫星定位数据资料包括通过北斗卫星定位系统获得的速度数据。
[0069] 2)根据收费数据,采用基于轨迹法的修正算法求取路段平均速度,包含如下步骤:
[0070] 2.1)数据预处理:若所采集的收费数据存在下列问题,则剔除:①数据不完整,出入站编码丢失或进出时间丢失;②出入口站编码相同;③入口时间晚于出口时间;④行程速度超过高速公路限速的120%;⑤行程时间超过样本均值的两倍标准差范围的离群值。基本路段的定义如图1所示,相邻两个收费站构成1个基本路段,如s1,2,s2,3,sK-1,K等。
[0071] 经过处理后,获得从时间区间p内出发,在路段si,j上行驶的车辆平均行程时间即为:
[0072]
[0073] 式中,i,j分别表示高速公路入口和出口; 表示从时间区间p出发的车辆n在i,j之间的收费系统记录行程时间, 表示筛选后的对应时间和出入口行驶的车辆数。
[0074] 2.2)获取行程时间二维表:高速公路收费数据可处理得到所有节点之间的平均行程时间。将一天划分为P个时段,同一个时间区间p(p=1,2,…,P)的路段行程时间按优先级排序方法排列成一个一维列向量Tp,其中入口i的优先级大于出口j的优先级,即再把得到的P个一维列向量按时间顺序组合成一个的二维表,则该表涵盖了所有P个时段的各OD之间的旅行时间,如下表2所示。
[0075] 表2行程时间二维表
[0076]
[0077] 2.3)计算基本路段的修正行程时间:从节点k到节点k+1的基本路段sk,k+1旅程时间修正算法如下:
[0078] a)当k=1时,
[0079]
[0080] 其中, 为基本路段s1,2的旅程修正时间;p为车辆从节点1出发时所处的时间区间;X为车辆从节点1行驶到节点2时所处的时间区间,可根据表2中的数据获得;li,j为高速公路路段si,j对应的长度; 为对应路程行程时间的权重,W1,2为车辆行驶的路程之和,通过下式计算:
[0081]
[0082] b)当2≤k≤K-2时,
[0083]
[0084] 其中, 为基本路段sk,k+1的旅程修正时间;p为车辆从当前节点k出发时所处的时间区间,ri(i=1,2,…,k-1)为从节点上游的k-1个节点出发的车辆的出发时间区间,表示由时间区间ri上游i节点出发的车辆行驶到节点k时所处的时间区间恰为恰为p,而q为由时间区间p从节点k出发的车辆到达下游节点k+1时所处的时间区间;与W1,2一致,Wk,k+1为车辆行驶的路程之和,通过下式计算:
[0085]
[0086] c)当k=K-1时,
[0087]
[0088] 其中, 为基本路段sK-1,K的旅程修正时间;p为车辆从当前节点K-1出发的时间区间;ri(i=1,2,…,K-1)为K-1节点的上游K-2个节点出发的车辆的出发时间区间,表示由时间区间ri上游i节点出发的车辆行驶到节点K-1是所处的时间区间恰为p;WK-1,K为车辆行驶的路程之和,通过下式计算:
[0089]
[0090] 2.4)计算路段平均速度:通过上述修正行程时间,可计算出路段sk,k+1的平均速度[0091]
[0092] 式中,lk,k+1为基本路段sk,k+1的长度; 为基本路段sk,k+1的旅程修正时间,由步骤2.3)计算得。
[0093] 3)将“两客一危”车辆作为浮动车,以其北斗卫星定位系统获得的速度数据为基础,采用速度-时间积分模型对单车行程速度进行估计,再对单一浮动车作加权平均获得路段平均速度,具体步骤包括:
[0094] 3.1)计算单一浮动车路段行程速度:在时间区间p内研究路段sk,k+1上的浮动车数据返回点分布情况,以1,2,3,4,……,M表示浮动车q在路段sk,k+1上的定位点序号,具体如图2所示。定义: 为p时间区间内浮动车q在路段sk,k+1上行驶的有效定位距离;时间序列和速度序列 分别为浮动车q在路段sk,k+1上的对
应定位点的时间和速度信息。则 的计算公式为:
[0095]
[0096] 则浮动车q在路段sk,k+1上行驶的平均行程速度 可近似等价为有效距离上行驶的平均行程速度,可由下式求得:
[0097]
[0098] 3.2)计算路段平均速度:将时间区间p内路段sk,k+1上各浮动车的平均行程速度作加权平均即可获得路段平均速度 其权重为各浮动车在研究路段上行驶的有效距离与路段长度之比,具体计算过程如下:
[0099]
[0100]
[0101]
[0102] 其中, 为浮动车q在研究路段sk,k+1上行驶的有效距离 与路段长度lk,k+1的比值; 为浮动车q的归一化权重; 为研究时段p内经过路段sk,k+1的浮动车数量。
[0103] 4)使用基于支持向量回归机融合算法对两类单一数据源处理出来的结果进行融合,得到基于支持向量回归机融合的高速公路路段平均速度,其逻辑框图如图3所示,具体步骤如下:
[0104] 4.1)产生训练集/测试集:将步骤2和3中的两类速度和路段平均速度的真实值根据时间和路段一一对应,组成一个三列的矩阵,形成样本集,按照随机抽样的方式产生模型的训练集合和测试集合,保持测试集至少为训练集的20%;
[0105] 4.2)构建支持向量回归机模型:采用较为经典的RBF核函数,首先利用交叉验证方法寻找最佳的参数(惩罚因子和RBF核函数中的方差),然后利用最佳的参数训练模型;
[0106] 4.3)模型输出:将测试集中的两类路段平均速度输入向量机中,将预测值与真实值进行比较,计算均方误差(E)和决定系数(R2)两项评价指标,具体计算公式如下所示:
[0107]
[0108]
[0109] 其中l为测试集样本个数;yi(i=1,2,…,l)为第i个样本的真实值;为第i个样本的预测值;
[0110] 4.4)性能评价:比较均方误差(E)和决定系数(R2)与标准值得差异,若E>0.03,或R2<0.8,则重复步骤4.1)、4.2)和4.3),通过修改模型参数、核函数类型的方法重新建立向量回归机,直到满足要求为止,否则,保存向量机的形式,可用于后续高速路段平均速度估计方法。
[0111] 具体的,本实施例选择广东省广乐高速南行方向共18个基本路段,2016年11月6日8:00~21:00的收费数据和“两客一危”卫星定位数据,其中收费数据共计3712条,卫星定位数据5.6万条。
[0112] 按照步骤2)和3)的方法对数据进行预处理,以30min间隔,共处理出路段平均速度468组,随机选择400组数据作为模型的训练样本集,剩余68组数据作为测试样本集。
[0113] 采用本文所提出的融合模型,对路段平均速度进行预测。查阅相关文献,确定SVR核函数选择RBF函数,其参数方差σ和惩罚因子C在范围[-10,10]内寻优,不敏感损失系数ε=5。
[0114] 利用Matlab 2014a软件实现数据融合。经过400组数据的模型训练后,创建SVR模型,并输出测试集的融合结果,拟合结果如图4所示,均方误差E=0.0035,可决系数R2=0.977,表明模型融合结果与实际数据拟合程度高,模型效果良好。下表3为部分测试集的数据与相应真实值对比后得到的平均相对误差,从中可以看出,与单一数据源的估计速度相比,融合后的速度具有更小的相对误差,即融合结果更接近真实值。
[0115] 表3相对误差
[0116]
[0117] 本发明还分别以15min,45min和60min作为统计间隔,使用上述融合方法进行路段平均速度估计,结果显示,模型效果与统计间隔大小有关,时间间隔越大,误差越大,当统计间隔为30min以下时,估计结果更为精确,具体如下表4所示。
[0118] 表4不同统计间隔下的模型效果
[0119]
[0120] 实例分析证明,本发明建立的支持向量回归机融合模型是可行且有效的,能够起到提高路段平均速度估计精度的作用。总结可知该发明方法具有实际推广价值,值得推广。
[0121] 以上所述实施例只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。