一种基于ResLS-C深度学习组合的交通状态预测方法转让专利

申请号 : CN202110121993.8

文献号 : CN113222206B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 郑文苏蓓赵慧敏周亚琪

申请人 : 太原理工大学

摘要 :

本发明公开了一种基于ResLS‑C深度学习组合的交通状态预测方法,从残差网络中提取城市的整体空间特征,不仅可以提取高层空间特征而且解决了CNN梯度消散的缺点。利用长短时记忆网络模型挖掘交通流的时间序列特征。通过反卷积操作将卷积隐藏层中特征属性还原至原始空间内,计算真实值与预测值的损失更为准确。并且呈现预测数据的可视化效果更为直观,有效提高预测模型算法的直观性、空间可解释性、可操作性以及准确率。

权利要求 :

1.一种基于ResLS‑C深度学习组合的交通状态预测方法,其特征在于,包括:获取目标区域的交通流量历史数据,并按预设的格式将所述交通流量历史数据转化为二维交通流量矩阵;

构建提取空间特征的神经网络模型,由多残差单元组成,并对网络模型进行训练;

构建提取时间特征的长短时记忆神经网络模型,由遗忘门、输入门和输出门组成,并对网络模型进行训练;

构建反卷积神经网络模型,由反卷积层、反池化层和校正层组成,将高维特征还原到原始空间中;

基于实时采集的目标区域的交通流量数据,利用深度神经网络模型对目标区域进行交通状态预测;

对于交通流数据历史数据中第M行和第N列(M,N),在时间区间T内的特征值定义为:其中, 表示交通流在地理空间坐标特征值,X(long,lati)表示的是交通流量需求的地理空间坐标;X(long,lati)∈(m,n),在M×N区域的T时刻内,交通流二维空间信息矩阵定义如下:

其中, 为T时刻的交通流特征值, 为交通流在地理空间坐标(m,n)下的特征值. 的数量越多表示交通需求越大, 的数量越少表示交通需求越小;

ResLSTM的推理公式如下:t t t

h=O ⊙tanh(C)

t t t t

式中,i、f、O为三维张量,分别代表更新门、遗忘门和输出门;C是一个记忆矢量,它循t

环地携带历史信息;h是LSTM的隐藏模块;W为两个块之间的卷积核,共享权重,W下标表示了两者之间的信息传递;⊙表示矩阵的hadamord算法; 是一个残差操作,它反映了LSTM和ResLSTM之间的差异;tanh为非线性激活函数,σ表示sigmoid型函数。

说明书 :

一种基于ResLS‑C深度学习组合的交通状态预测方法

技术领域

[0001] 本发明涉及交通流预测技术领域,更具体地说,涉及一种基于ResLS‑C深度学习组合的交通状态预测方法。

背景技术

[0002] 随着经济的不断发展,人们对交通的需求原来越高,驾车出行的频率也越来越高,随之而来的问题就是交通拥堵日渐严重。为了缓解交通拥堵,如何有效处理交通状态信息
数据预测已经成为当前的研究热点。
[0003] 交通流量预测有俩个基础特征:
[0004] 其一是空间特征,传统的深度学习方法采用卷积神经网络捕获空间特征;卷积神经网络,是一种前馈神经网络,人工神经元可以响应周围单元,可以进行大型图像处理。卷
积神经网络包括卷积层和池化层。传统模式基于卷积神经网络对交通流量信息进行采集操
作。此后提出了一种结合时空分析的卷积神经网络(CNN)深度学习框架的交通流量短时预
测模型。使用改进的CNN来挖掘交通流量的空间特征。
[0005] 但因为CNN多层卷积容易出现梯度消散问题,本发明采用残差网络ResNet捕获交通流量空间特征。其优势在于残差网络多层卷积可以捕获全局交通流量空间特征的同时,
消除了CNN因梯度消散带来准确率下滑的缺点。
[0006] 其二是时间特征,因为LSTM具有很好的捕获交通流量捕获时间特征的能力。长短时记忆神经网络(Long Short‑term Memory Networks,LSTM)记忆单元具有遗忘门、输入门
和输出门,并通过反向传播和梯度下降算法达到了纠正错误的能力。循环神经网络处理时
间序列数据具有先天优势。

发明内容

[0007] 本发明要解决的技术问题在于,针对现有技术中存在的不足,本发明提供一种基于ResLS‑C深度学习组合的交通状态预测方法。
[0008] 本发明解决其技术问题所采用的技术方案是:构造一种基于ResLS‑C深度学习组合的交通状态预测方法,包括:
[0009] 获取目标区域的交通流量历史数据,并按预设的格式将所述交通流量历史数据转化为二维交通流量矩阵;
[0010] 构建提取空间特征的神经网络模型,由多残差单元组成,并对网络模型进行训练;
[0011] 构建提取时间特征的长短时记忆神经网络模型,由遗忘门、输入门和输出门组成,并对网络模型进行训练;
[0012] 构建反卷积神经网络模型,由反卷积层、反池化层和校正层组成,将高维特征还原到原始空间中;
[0013] 基于实时采集的目标区域的交通流量数据,利用所述深度神经网络模型对目标区域进行交通状态预测。
[0014] 其中,对于交通流数据历史数据中第M行和第N列(M,N),在时间区间T内的特征值定义为:
[0015]
[0016] 其中, 表示交通流在地理空间坐标特征值,X(long,lati)表示的是交通流量需求的地理空间坐标;X(long,lati)∈(m,n),在M×N区域的T时刻内,交通流二维空间信息矩阵定
义如下:
[0017]
[0018] 其中, 为T时刻的交通流特征值, 为交通流在地理空间坐标(m,n)下的特征值. 的数量越多表示交通需求越大, 的数量越少表示交通需求越小。
[0019] 其中,ResLSTM的推理公式如下:
[0020]
[0021]
[0022]
[0023]
[0024] ht=Ot⊙tanh(Ct)
[0025] 式中,it、ft、Ot为三维张量,分别代表更新门、遗忘门和输出门;Ct是一个记忆矢t
量,它循环地携带历史信息;h是LSTM的隐藏模块;W为两个块之间的卷积核,共享权重,W下
标表示了两者之间的信息传递;⊙表示矩阵的hadamord算法; 是一个残差操作,它反映了
LSTM和ResLSTM之间的差异;tanh为非线性激活函数,σ表示sigmoid型函数。
[0026] 与现有技术相比,本发明提供了一种基于ResLS‑C深度学习组合的交通状态预测方法,从残差网络中提取城市的整体空间特征,不仅可以提取高层空间特征而且解决了CNN
梯度消散的缺点。利用长短时记忆网络模型挖掘交通流的时间序列特征。通过反卷积操作
将卷积隐藏层中特征属性还原至原始空间内,计算真实值与预测值的损失更为准确。并且
呈现预测数据的可视化效果更为直观,有效提高预测模型算法的直观性、空间可解释性、可
操作性以及准确率。

附图说明

[0027] 下面将结合附图及实施例对本发明作进一步说明,附图中:
[0028] 图1是本发明提供的一种基于ResLS‑C深度学习组合的交通状态预测方法的流程示意图。
[0029] 图2是本发明提供的一种基于ResLS‑C深度学习组合的交通状态预测方法的深度神经网络ResLS‑C模型预训练流程示意图。
[0030] 图3是本发明提供的一种基于ResLS‑C深度学习组合的交通状态预测方法的深度残差网络结构示意图。
[0031] 图4是本发明提供的一种基于ResLS‑C深度学习组合的交通状态预测方法的反卷积神经网络结构模型的结构示意图。

具体实施方式

[0032] 为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
[0033] 如图1和图2所示,本发明设计了一种基于ResLS‑C深度学习组合的交通状态预测方法,包括:
[0034] 获取目标区域的交通流量历史数据,并按预设的格式将所述交通流量历史数据转化为二维交通流量矩阵;
[0035] 构建提取空间特征的神经网络模型,由多残差单元组成,并对网络模型进行训练;
[0036] 构建提取时间特征的长短时记忆神经网络模型,由遗忘门、输入门和输出门组成,并对网络模型进行训练;
[0037] 构建反卷积神经网络模型,由反卷积层、反池化层和校正层组成,将高维特征还原到原始空间中;
[0038] 基于实时采集的目标区域的交通流量数据,利用所述深度神经网络模型对目标区域进行交通状态预测。
[0039] 其中,对于交通流数据历史数据中第M行和第N列(M,N),在时间区间T内的特征值定义为:
[0040]
[0041] 其中, 表示交通流在地理空间坐标特征值,X(long,lati)表示的是交通流量需求的地理空间坐标;X(long,lati)∈(m,n),在M×N区域的T时刻内,交通流二维空间信息矩阵定
义如下:
[0042]
[0043] 其中, 为T时刻的交通流特征值, 为交通流在地理空间坐标(m,n)下的特征值. 的数量越多表示交通需求越大, 的数量越少表示交通需求越小。
[0044] 其中,ResLSTM的推理公式如下:
[0045]
[0046]
[0047]
[0048]
[0049] ht=Ot⊙tanh(Ct)
[0050] 式中,it、ft、Ot为三维张量,分别代表更新门、遗忘门和输出门;Ct是一个记忆矢t
量,它循环地携带历史信息;h是LSTM的隐藏模块;W为两个块之间的卷积核,共享权重,W下
标表示了两者之间的信息传递;⊙表示矩阵的hadamord算法; 是一个残差操作,它反映了
LSTM和ResLSTM之间的差异;tanh为非线性激活函数,σ表示sigmoid型函数。
[0051] 交通流矩阵输入图3所示的残差网络:局部空间依赖于卷积神经网络(CNN)用于捕捉空间相互作用,它有两个缺陷:
[0052] 当网络层数达到一定数量时,随着网络性能达到饱和,再增加隐含层数,网络性能会下降。由于不是过度拟合引起的,训练准确率和测试准确率都会下降。
[0053] 局部空间依靠CNN捕捉局部空间的交互作用,但将整个城市作为目标图像,CNN很难得到全局最优性能。加深CNN的层数会引起上述问题。因此,本发明利用深度剩差网络有
效地解决了这一问题。
[0054] 深度残差网络是一种深度卷积网络,给定输入数据,依次输入卷积层Conv、批处理归一化层批处理范数和非线性激活函数。然后将处理结果发送到多个剩余单元。
[0055] 剩余单元的输出可以形式化,进行如下数学公式计算:
[0056] xl+1=f(Wsxl+F(xl,Wl))
[0057] 其中,F(xl,Wl)为残差函数:xl和F(xl,Wl)的维数必须相同,如果不相同,则通过跳跃连接进行线性映射Ws,调整xl维数进行匹配。
[0058] L层的正向传播结果如下:
[0059]
[0060] 反向传播的结果如下:
[0061]
[0062] 残差网络是一种特殊的卷积神经网络。推导正向传播公式后,反向传播结果如下:
[0063]
[0064] 与反向传播公式相比,残差网络可以解决卷积神经网络中梯度消失或梯度爆炸的问题,并且可以完全保留至少该l层的网络信息。
[0065] 建立时空模型:在传统LSTM的基本结构上添加了残差网络,使得模型不仅获得了LSTM的模型捕获时间属性,还获得了ResNet的模型捕获空间属性。因此,ResLSTM组合模型
被用来处理时空变量。
[0066] 反卷积神经网络是一种特殊的卷积运算,它是从特征图像到原始图像的过程,也是卷积运算的前向运算。将高层特征图数据传输到多层反卷积神经网络中,通过反卷积层、
反池化层和校正层交替进行内部处理,将特征信息放大。最后,实现了全局特征图的可视化
过程。
[0067] 在卷积运算中,输出特征图的大小计算公式为:
[0068]
[0069] 在反卷积操作中,输出原始图像的尺寸计算公式为:
[0070] In=S(Out‑1)+K‑2P
[0071] 其中,In为输入图像的大小,Out为输出特征图像的大小。卷积核的大小是K*K,步长是S,边缘被扩展到P。
[0072] 本发明采用两层反卷积神经网络作为解码器,将原始图像转换为特征图像。在反卷积的过程中,恢复了图像的中高层特征。最后,将特征图像采样到原始图像的像素空间
中。还原后的原始图像也称为“预测图像”。
[0073] 利用预测图与真实图之间的差异信息作为模型的误差数据,便于逐像素计算全局预测损失,并不断反馈给网络进行训练,调整参数,直至模型最优。
[0074] 实验分析:本研究的数据源为2008年2月2日至2月8日北京市数万辆出租车的公共真实数据集,涵盖经度(116.188,116.676)和维度(39.722,40.049)。
[0075] 出租车出行数据集总量达1500万,按小时累计。最终得到时间粒度为1小时的交通数据1739976条。
[0076] 原始数据中存在缺失值和异常值。对于瞬时时间的缺失值,采用该时间点前后的流量值来填充缺失值。
[0077] 根据原始出租车数据,将北京市区划分为64*64不重叠的正方形区域,每个区域大小约为864m*864m,每个时间间隔的长度设为1小时。
[0078] 卷积神经网络模型的输入序列数据长度为120个交通数据,即24小时*5天。
[0079] 如果设置当前时间点为X,[X‑119,X]序列的输入为120条交通数据,输出序列数据长度为24。
[0080] 在训练和测试数据中使用滑动窗口生成样本,其中30%为训练集,70%为测试集。
[0081] 采用实验评价指标对交通流预测模型的有效性进行评价。短期交通流预测模型是对下次交通流需求的预测。
[0082] 为了检验ResLS‑C模型预测未来交通流数据的准确性,本发明采用均方根误差和平均百分比误差对模型进行比较。计算公式如下:
[0083]
[0084]
[0085] 其中,Xp(i)为ResLS‑C模型预测的交通流数据,Xt(i)为原始数据集中的真实交通流数据,m为经过处理的交通流数据总数。
[0086] 为了验证ResLS‑C模型的优越性,选取传统的LSTM、GRU和Convlstm与该模型的预测结果进行比较。
[0087] 通过比较,LSTM的平均预测误差最大,RMSE和MAPE分别为5.23和0.25,LSTM的预测误差与其他模型存在较大差异。
[0088] 去除LSTM属性曲线,比较GRU、Convlstm和ResLS‑C模型(CNN和LSTM的结合简称Convlstm)的优势,可以看出ResLS‑C模型有最好的效果,RMSE和MAPE分别为4.65和0.11;其
次是Convlstm,ResLS‑C模型比Convlstm的RMSE和MAPE分别降低了0.26和0.02;再者是GRU
模型,ResLS‑C模型比GRU模型的RMSE和MAPE分别降低了1.07和0.11。
[0089] 本发明提出ResLS‑C模型,该模型充分捕获交流流量的高维空间特征与时间特性,而且比CNN与LSTM结合等传统模型准确率更好。
[0090] 除此接入反卷积操作,通过反卷积操作将卷积隐藏层中特征属性还原至原始空间内,提高了预测模型的直观性、空间可解释性以及验证了交通流量的时空相关性。
[0091] 上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员
在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多
形式,这些均属于本发明的保护之内。