基于多因素空间选择深度学习算法的短时交通流预测方法转让专利

申请号 : CN201910432795.6

文献号 : CN110188936B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 马东方盛博文

申请人 : 浙江大学

摘要 :

本发明提供了一种基于多因素空间选择深度学习算法的短时交通流预测方法。该方法的核心思想是筛选历史交通流量数据,找到与目标检测器空间相似最大的其他检测器,共同构造出时空关联矩阵,同时加入影响因素数据作为网络的第二个输入共同训练的网络参数,进一步用训练好的网络预测下一时间间隔内目标检测器的车流量。本发明可将路口短时间的流量序列进行良好预测,为提高流量预测的智能性与科学性、提升交叉口交通流的运行效率提供技术支持。

权利要求 :

1.基于多因素空间选择深度学习算法的短时交通流预测方法,其特征在于该方法步骤如下:

步骤c1数据预处理,具体是:

c11、对原始交通流数据进行最大最小值标准化处理:式中xorigin(t)是原始交通流数据,x(t)是标准化后的数据,xmin、xmax分别是多检测器训练集原始数据中的最大值、最小值;

步骤c2时空关联矩阵构造,具体是:c21:相似检测器选择:对于目标检测器S,选择与其最为相似的q个检测器作为时空关联矩阵的空间维度,令目标检测器待预测时间间隔为t,该时间间隔前p个连续的时间间隔流量序列为Gs:

T

Gs=[xs(t‑p),xs(t‑p+1),…,xs(t‑1)]  (2)同理构造出其它q个检测器在该段时间间隔内的流量序列Gs‑q,Gs‑q+1,…,Gs‑1,计算GS与这q个检测器流量序列的欧氏距离:c22:选出相似性最大的前r个检测器构造时空关联矩阵A;

A=[G1,G2,…,Gr,Gs]p×(r+1)  (4)步骤c3引入影响因素的Conv‑LSTM网络结构构建,具体是:c31、卷积层设计,网络中加入卷积神经网络来对时空关联矩阵中的空间结构进行特征提取:

Xconv=F(A·Wconv+Bconv)  (5)式中Wconv为卷积层的权重参数,Bconv为卷积层的偏差参数,F为激活函数,卷积层的输出Xconv是一个向量;

c32、长短期记忆层设计,长短期记忆层用于提取卷积层输出Xconv中的时间特征,它的输出是一个数值h(t);长短期记忆层由若干个LSTM基础单元组成,每个基础单元是一个LSTM细胞,每个LSTM细胞输入包括三部分:该细胞自身输入量xconv(t),上一细胞传递来的细胞状态C(t‑1),上一细胞的输出量h(t‑1);每个LSTM输出包括两部分:该细胞的输出h(t),该细胞的状态C(t);每个LSTM细胞包括三个门:遗忘门(ft),输入门(lt),输出门(ot),具体运作公式如(6)所示:

ft=σ(Wf*[h(t‑1),x(t)]+bf)  (6)lt=σ(Wi*[h(t‑1),x(t)]+bi)ot=σ(Wo*[h(t‑1),x(t)]+bo)h(t)=ot*tanh(Ct)式中σ为激活函数,Wf,Wi,WC,Wo分别是遗忘门,输入门,状态单元,输出门的权重矩阵,bf,bi,bC,bo分别是遗忘门,输入门,状态单元,输出门的偏置项;

步骤c33:输入除了时空关联矩阵还加入影响因素数据包括:星期,时刻,是否周末,是否假期,是否有雨;为了引入影响因素数据,在网络中增加一层合并层,该层将LSTM层输出h(t)与影响因素数据进行合并;

步骤c4引入优化算法训练参数,具体是:c41:选择Adam优化器处理梯度下降过程,Adam优化器可以将网络中的所有未知参数θ收敛到最优值,具体如公式(7)所示:式中mt,nt分别是偏一阶矩估计,偏二阶矩估计, 是修订后的偏一阶矩估计,偏二阶矩估计,ε是平滑项,α是学习速率,μ是偏一阶矩估计的指数衰减率,v是偏二阶矩估计的指数衰减率;

步骤5预测并进行逆标准化处理,具体是:c51、经过以上步骤已经得到训练好的网络,将待预测的交通流量对应的时空关联矩阵以及影响因素数据输入到网络中,得到预测值gorigin(t);

c52、对预测值进行逆标准化过程:g(t)=xmin+gorigin(t)·(xmax‑xmin)  (8)式中gorigin(t)是模型的预测输出,g(t)是逆标准化后的输出值。

说明书 :

基于多因素空间选择深度学习算法的短时交通流预测方法

技术领域

[0001] 本发明提出了一种基于多因素空间选择深度学习算法的短时交通流量的预测方法,对交通路网中目标检测器下一个周期内通过的车流量进行预测,支撑交通管理及信号
控制策略制定与方案优化,属于智能交通研究领域。

背景技术

[0002] 短时交通流预测方法主要包括统计学习方法以及机器学习方法,近年来机器学习方法分支之一的深度学习方法得到广泛应用,这是由于面对交通大数据时,深度网络架构
能够从大量数据中提取相关性强的特征用于训练网络中的参数,并且通常情况下训练时的
数据量越大,网络结构越合理,在预测时得到结果就会越精准。深度学习也从简单的前馈神
经网络(NNs),循环神经网络(RNNs),长短期记忆神经网络(LSTM),逐步发展到卷积‑长短期
记忆神经网络(Conv‑LSTM),研究者已经证明Conv‑LSTM能够较好的提取交通流量的时空关
联性并得到精准的预测结果,本方案的网络架构设计选择Conv‑LSTM模型。
[0003] 然而,大部分研究把目光放在网络架构的设计上,却忽视了对输入数据的选择,常见的Conv‑LSTM输入是一个时空关联的矩阵,矩阵包括两个维度:时间维度和空间维度,时
间维度是若干个连续时间间隔内流过某一检测器的车流量,空间维度包含目标检测器及其
上下游若干检测器,其中上下游检测器按照与目标检测器距离远近进行排列并纳入矩阵
中,然而这种输入矩阵的构造方式忽视了实际的路网结构,实际路网中要考虑检测器间的
连通性,限速要求,车道数等,简单的按照与目标检测器距离来构造矩阵会使一些低相关性
的历史数据训练到网络,从而对预测模型带来负面影响,因此本方案提出一种基于空间尺
度的历史数据选择方法。除了输入矩阵外,大多研究忽视了影响因素对交通流预测的作用,
影响因素会对交通模式带来改变,进而影响交通流变化,因此将影响因素考虑到输入中对
于预测精度具有重要意义。

发明内容

[0004] 本发明的目的在于提出一种基于多因素空间选择深度学习算法的短时交通流预测方法。该方法的核心思想是筛选历史交通流量数据,找到与目标检测器空间相似最大的
其它检测器,共同构造出时空关联矩阵,同时加入影响因素数据作为网络的第二个输入共
同训练的网络参数,进一步用训练好的网络预测下一时间间隔内目标检测器的车流量。
[0005] 为实现上述目标,本发明提出一种网络模型的输入选择方法,本发明包括如下步骤:
[0006] c1、数据预处理
[0007] c2、时空关联矩阵构造
[0008] c3、引入影响因素的Conv‑LSTM网络结构构建
[0009] c4、引入优化算法训练参数
[0010] c5、预测并进行逆标准化处理
[0011] 步骤c1包括:
[0012] c11、为了避免不同检测器交通流量值范围不同带来的影响,需要对原始交通流数据进行最大最小值标准化处理:
[0013]
[0014] 式中xorigin(t)是原始交通流数据,x(t)是标准化后的数据,xmin、xmax分别是多检测器训练集原始数据中的最大值、最小值。
[0015] 步骤c2包括:
[0016] c21:相似检测器选择:对于目标检测器S,需要选择与其最为相似的q个检测器作为时空关联矩阵的空间维度,令目标检测器待预测时间间隔为t,该时间间隔前p个连续的
时间间隔流量序列为Gs:
[0017] Gs=[xs(t‑p),xs(t‑p+1),…,xs(t‑1)]T  (2)
[0018] 同理可以构造出其它q个检测器在该段时间间隔内的流量序列Gs‑q,Gs‑q+1,…,Gs‑1,计算Gs与这q个检测器流量序列的欧氏距离:
[0019]
[0020] c22:欧氏距离越小表明该检测器与目标检测器相似性越大,选出相似性最大的前r个检测器构造时空关联矩阵A。
[0021] A=[G1,G2,…,Gr,Gs]p×(r+1)  (4)
[0022] 步骤c3包括:
[0023] c31、卷积层设计:网络中加入卷积神经网络来对时空关联矩阵中的空间结构进行特征提取:
[0024] Xconv=F(A·Wconv+Bconv)  (5)
[0025] 式中Wconv为卷积层的权重参数,Bconv为卷积层的偏差参数,F为激活函数,卷积层的输出Xconv是一个向量。
[0026] c32、长短期记忆层设计:长短期记忆层用于提取卷积层输出Xconv中的时间特征,它的输出是一个数值h(t)。长短期记忆层由若干个LSTM基础单元组成,每个基础单元是一
个LSTM细胞,每个LSTM细胞输入包括三部分:该细胞当前时刻输入量xconv(t),上一细胞传
递来的细胞状态C(t‑1),上一细胞的输出量h(t‑1);每个LSTM输出包括两部分:该细胞的输
出h(t),该细胞的状态C(t);每个LSTM细胞包括三个门:遗忘门(ft),输入门(lt),输出门
(ot),具体运作公式如(6)所示:
[0027] ft=σ(Wf*[h(t‑1),xconv(t)]+bf)  (6)
[0028] lt=σ(Wi*[h(t‑1),xconv(t)]+bi)
[0029]
[0030]
[0031] ot=σ(Wo*[h(t‑1),xconv(t)]+bo)
[0032] h(t)=ot*tanh(Ct)
[0033] 式中σ为激活函数,Wf,Wi,Wo分别是遗忘门,输入门,输出门的权重参数,bf,bi,bo分别是三个门的偏差参数。
[0034] c33、合并层设计:输入除了时空关联矩阵还加入了影响因素数据,他包括星期,时刻,是否周末,是否假期,是否有雨。为了引入影响因素数据,在网络中增加一层合并层,该
层将LSTM层输出h(t)与影响因素数据进行合并[h(t),W_day,Time,P_w,P_h,P_r]
[0035] 步骤c4包括:
[0036] c41:选择Adam优化器处理梯度下降过程,Adam优化器可以将网络中的所有未知参数θ收敛到最优值,具体如公式(7)所示:
[0037]
[0038]
[0039]
[0040]
[0041] 式中mt,nt分别是未知参数的一阶矩,二阶矩, 是修订后的一阶矩,二阶‑8
矩,ε是平滑项,α是学习速率,一般常值参数如下设定,μ=0.9,v=0.99,ε=10 。
[0042] 步骤5包括:
[0043] c51、经过以上步骤已经得到训练好的网络,将待预测的交通流量对应的时空关联矩阵以及影响因素数据输入到网络中,得到预测值gorigin(t)。
[0044] c52、对预测值进行逆标准化过程:
[0045] g(t)=xmin+gorigin(t)·(xmax‑xmin)  (8)
[0046] 式中gorigin(t)是模型的预测输出,g(t)是逆标准化后的输出值。
[0047] 本发明的有益效果:本发明在输入矩阵的构造方式上充分考虑了实际的路网结构,没有简单的按照与目标检测器距离来构造矩阵,不会使一些低相关性的历史数据引入
到网络,另外影响因素数据的引入可以敏感的捕捉到交通模式的变化,进而影响交通流预
测的准确性。本发明可将某路口短时间内的交通流量序列进行良好预测。

附图说明

[0048] 图1算法实现框架图;
[0049] 图2LSTM单元结构图;
[0050] 图3预测折线图;

具体实施方式

[0051] 以某城市某路口90天的流量序列为例,将85天交通流量数据作为训练数据集,将第86‑90天的交通流量数据作为待预测的测试集序列,对连续5天6:00‑21:00内的交通流量
数据进行预测,该路口有八个邻近的检测器,下文以第一号检测器第86天第13个时间间隔
(t=13)为例进行交通流量预测,具体实现流程见图1。在这之前需要对90天的流量数据进
行数据清洗及过滤操作,包括异常值滤除、采用拉格朗日插值法对缺失值进行填补。
[0052] 1、数据预处理
[0053] 1)对八个检测器85天的训练集数据进行最大值最小值标准化处理,xmin=24,xmax=2004。
[0054]
[0055] 同理对测试集数据应用相同的最大值,最小值进行标准化处理。
[0056] 2、时空关联矩阵构造
[0057] 以第一号检测器第86天第13个时间间隔(t=13)为例,对其进行时空关联矩阵构造。
[0058] 1)第一号检测器的序列为Gs(p=12):
[0059] Gs=[xs(1),xs(2),…,xs(12)]T
[0060] 同理构造其他七个检测器序列Gs‑7,Gs‑6,…,Gs‑1,并通过式3计算一号检测器与其他检测器的相似性,距离计算结果分别为:
[0061] [0.018,0.064,0.061,0.100,0.100,0.078,0.081]
[0062] 2)令r=2,选出距离最小的2个检测器构造矩阵A,可以看到Gs‑7,Gs‑5与Gs检测器最为相似,矩阵A为:
[0063] A=[Gs‑7,Gs‑5,Gs]12×3
[0064] 同理对所有训练数据进行如上操作,构造训练集的时空关联矩阵。
[0065] 3、引入影响因素的Conv‑LSTM网络结构构建,见图2
[0066] 1)卷积层构建
[0067] Xconv=F(A·Wconv+Bconv)
[0068] 2)长短期记忆层构建
[0069] ft=σ(Wf*[h(t‑1),xconv(t)]+bf)
[0070] lt=σ(Wi*[h(t‑1),xconv(t)]+bi)
[0071]
[0072]
[0073] ot=σ(Wo*[h(t‑1),xconv(t)]+bo)
[0074] h(t)=ot*tanh(Ct)
[0075] 3)合并层构建
[0076] [h(t),W_day,Time,P_w,P_h,P_r]
[0077] 4、引入优化算法训练参数
[0078] 将85天的训练集数据经过最大最小值标准化以及空间矩阵构造,喂入步骤三中的卷积‑长短期记忆网络进行参数训练,优化公式如下:
[0079] mt=0.9*mt‑1+0.1*dθ
[0080] nt=0.99*nt‑1+0.01*dθ2
[0081]
[0082]
[0083]
[0084] 5、预测并进行逆标准化处理
[0085] 1)训练好后的模型用来对一号检测器第86天第13个时间间隔(t=13)流量值进行预测,该时段的影响因素数据为:[5,13,0,0,0],其中这五个因素分别表示星期五,时段13,
非周末,非假期,无雨。该时间间隔的关联矩阵输入为A。
[0086] 2)经过以上步骤最后得到预测值为0.111,逆标准化过程为:
[0087] g(13)=24+0.111×1980=244.2
[0088] 重复以上四步预测第86‑90天的所有交通流量。
[0089] 误差计算及比较:以MAPE作为衡量标准,将本方案方法,Conv‑LSTM方法(无空间选择),传统LSTM方法,ARIMA方法进行比较,MAPE分别为6.42,7.83,8.25,11.19。图3展示了第
86天6:00‑21:00的四种方法的预测结果,从图中看到本方案设计的方法最接近真实值。
[0090] 综上,基于多因素空间选择深度学习算法的短时交通流量预测方法能得到较为精准的预测结果。本发明涉及一种交通流量序列的预测方法,具备预测误差小、计算复杂度较
低,具有时效性的特点。本发明可将某路口短时间内的交通流量序列进行良好预测,为提高
流量预测的智能性与科学性、提升路口交通流的运行效率提供技术支持。