一种基于图注意力卷积网络的交通流量预测方法转让专利

申请号 : CN202010164451.4

文献号 : CN111223301B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 郑宏张思凯刘佳谋宿红毅闫波

申请人 : 北京理工大学

摘要 :

本发明涉及一种基于图注意力卷积网络的交通流量预测方法,旨在预测中长时间交通车流量,属于城市交通规划及流量预测技术领域。包括:步骤1:对交通流量数据预处理,输出预处理完成后的数据序列;步骤2:基于预处理完成后的数据序列,提取数据序列的空间特征以及时间特征;步骤3、输入经过步骤2两个AGA块的特征提取,经过一层全连接层得到下一时刻预测结果。所述方法未使用无法并行训练的递归结构,模型的所有组件都是卷积结构,可以减少训练时间;所述方法是首次尝试结合基于频谱的图卷积网络和基于空间的卷积网络,分别提取空间特征和时间特征,在时空交通网络上算法表现出众。

权利要求 :

1.一种基于图注意力卷积网络的交通流量预测方法,其特征在于:依托的网络结构包括一个输出层和两个注意力机制-卷积-注意力机制块,简写为AGA块;其中每个AGA块包括两个多头图注意力机制层,简写为MA和一个图形卷积层;AGA块构造为可将图结构时间序列中的空间和时间特征联合起来;当处理更复杂或特定的情况时,可以堆叠或扩展AGA块;每个AGA块包括两个具有相同结构的多注意层以及位于多注意层之间的GCN层;为防止过度拟合问题,每个AGA块均使用归一化层;AGA的输出由以下(1)定义:xt+1=AGA(xt)=attd(ReLU(Θl*Gattu(xt)))       (1)t l

其中,x是t时刻的交通流量;attd,attu分别是AGA块内的上下多注意机制;Θ是图卷积的谱核;ReLU表示ReLU激活函数;Θl是第l块AGA块的图卷积核;

所述交通流量预测方法,包括如下步骤:

步骤1:对交通流量数据预处理,输出预处理完成后的数据序列;

步骤2:基于步骤1输出的预处理完成后的数据序列,提取数据序列空间特征;

其中,提取序列空间特征由基于谱的图卷积网络完成,由以下(3)定义:x*Gθ=F-1(F(x)⊙F(θ))       (3)

其中,x*Gθ是数据序列空间特征;F(x)是图傅里叶变换;F-1(x)是图傅里叶逆变换;θ是图卷积核;⊙是矩阵对应位置相乘;x是输入的数据序列;

步骤3:步骤2:基于步骤1输出的预处理完成后的数据序列,提取数据序列时间特征;

其中,提取数据序列时间特征由图注意力机制完成,由以下(4)定义:att(xt)=FC(Th||Td||Tw)          (4)其中,th,td,tw分别是每小时采样间隔,每日采样间隔和每周采样间隔;FC是全连接函数;exp是以e为底的指数函数;Th,Td,Tw分别是三个多头注意力机制输出的结果;σ是激活函数; 是i节点t时刻的数据,αi,j是i节点与j节点的相关系数;Wk是可训练参数;

步骤4、输入经过步骤2和步骤3两个AGA块的特征提取,经过一层全连接层得到下一时刻预测结果。

2.根据权利要求1所述的一种基于图注意力卷积网络的交通流量预测方法,其特征在于:步骤1中,数据预处理包括线性插值、归一化以及依据交通网络中站点间的距离计算线路图的邻接距离。

3.根据权利要求1所述的一种基于图注意力卷积网络的交通流量预测方法,其特征在于:步骤1中,实验使用的数据集每间隔一段时间汇总一次交通数据,因此,路线图的每个节点每天包含若干数据点。

4.根据权利要求1或2所述的一种基于图注意力卷积网络的交通流量预测方法,其特征在于:线性插值方法用于解决数据清理问题后的缺失值;另外,通过零均值方法对输入数据进行归一化,以使输入数据的平均值为0;根据交通网络中站点之间的距离来计算路线图的邻接矩阵W,由以下(2)定义:其中,ωij是由dij决定的边的权重;σ和ε是控制矩阵W分布和稀疏性的阈值;

其中,dij表示节点i和j之间的距离;σ和ε是控制矩阵W分布和稀疏性的阈值。

5.根据权利要求4所述的一种基于图注意力卷积网络的交通流量预测方法,其特征在于:σ的取值范围为2到17。

6.根据权利要求4所述的一种基于图注意力卷积网络的交通流量预测方法,其特征在于:ε的取值范围为0.1到0.8。

说明书 :

一种基于图注意力卷积网络的交通流量预测方法

[0001] 本发明涉及一种基于图注意力卷积网络的交通流量预测方法,旨在预测中长时间交通车流量,属于城市交通规划及流量预测技术领域。

背景技术

[0002] 交通预测问题长期以来一直是一个令人高度关注的问题。根据2018年的一项调查,美国司机在路上花费50.6分钟,平均每天行驶31.5英里。在这种情况下,准确的交通量预测对于人民和政府必须提前计划并缓解拥堵至关重要。路线规划和其他运输服务也严重依赖交通状况预测。通常,交通预测是城市交通控制的基础,在智能交通系统中也起着重要的作用。
[0003] 交通预测的目标是使用历史交通参数,即交通速度,体积和密度,来预测未来的交通参数。流量预测是数据预测的典型时空问题。在空间维度上,不同的节点对同一节点具有不同的相互影响力;在时间维度上,两个节点在不同时间具有不同的相互影响力。
[0004] 随着运输系统的发展,由于大量的摄像头和传感器被广泛使用,因此交通数据变得更易于收集。所有收集交通数据的设备构成了一个庞大的交通信息网络。该网络为交通预测任务提供了坚实的数据基础,吸引了许多研究人员来解决这些问题。流量预测可以分为两种类型,短期流量预测和中长期流量预测。与短期交通量预测相比,中长期交通量预测具有更多的研究价值和实际意义。以前关于中长期交通量预测的研究可大致分为两类:动态建模和数据驱动建模。但是,由于交通预测问题的复杂性,不稳定性和干扰性,以及动态建模中不现实的假设和简化,在中长期交通预测问题中,动态建模方法的性能要比数据驱动方法差。近年来,许多研究人员采用深度学习方法来处理时空数据,即卷积神经网络。但是,这种方法是从网格数据,例如视频和图像,中提取空间特征的,这意味着这些方法仍然会失败。同时提取时空特征而忽略交通数据的动态相关性。

发明内容

[0005] 本发明的目的在于克服现有城市交通流量预测方法存在的忽略网络动态性技术缺陷,提出了一种基于图注意力卷积网络的交通流量预测方法。
[0006] 所述基于图注意力卷积网络的交通流量预测方法,依托的网络结构包括一个输出层和两个注意力机制-卷积-注意力机制块,简写为AGA块。其中每个AGA块包括两个多头图注意力机制层,简写为MA和一个图形卷积层;
[0007] AGA块构造为可将图结构时间序列中的空间和时间特征联合起来;当处理更复杂或特定的情况时,可以堆叠或扩展AGA块;
[0008] 每个AGA块包括两个具有相同结构的多注意层以及位于多注意层之间的GCN层;
[0009] 为防止过度拟合问题,每个AGA块均使用归一化层;
[0010] AGA的输出由以下(1)定义:
[0011] xt+1=AGA(xt)=attd(ReLU(Θl*Gattu(xt)))       (1)
[0012] 其中,xt是t时刻的交通流量;attd,attu分别是AGA块内的上下多注意机制;Θl是图卷积的谱核;ReLU表示relu激活函数;Θl是第l块AGA块的图卷积核;
[0013] 提出了一种新颖的门控时间图注意机制来捕获交通网络上的动态时间相关性。具有三个具有相同结构的独立注意机制,分别捕获每小时,每天和每周的依存关系。在注意力机制之后,一个完整的连接层将学习不同时间间隔对于下一次时间预测结果的重要性。
[0014] 所述交通流量预测方法,包括如下步骤:
[0015] 步骤1:对交通流量数据预处理,输出预处理完成后的数据序列;
[0016] 其中,数据预处理包括线性插值、归一化以及依据交通网络中站点间的距离计算线路图的邻接距离;
[0017] 实验使用的数据集每间隔一段时间汇总一次交通数据,因此,路线图的每个节点每天包含若干数据点;线性插值方法用于解决数据清理问题后的缺失值;另外,通过零均值方法对输入数据进行归一化,以使输入数据的平均值为0;根据交通网络中站点之间的距离来计算路线图的邻接矩阵W,由以下(2)定义:
[0018]
[0019] 其中,ωij是由dij决定的边的权重;σ和ε是控制矩阵W分布和稀疏性的阈值;
[0020] 其中,dij表示节点i和j之间的距离;σ和ε是控制矩阵W分布和稀疏性的阈值,σ的取值范围为2到17;ε的取值范围为0.1到0.8;
[0021] 步骤2:基于步骤1输出的预处理完成后的数据序列,提取数据序列空间特征;
[0022] 其中,提取序列空间特征由基于谱的图卷积网络完成,由以下(3)定义:
[0023] x*Gθ=F-1(F(x)⊙F(θ))                 (3)
[0024] 其中,x*Gθ是数据序列空间特征;F(x)是图傅里叶变换;F-1(x)是图傅里叶逆变换;θ是图卷积核;⊙是矩阵对应位置相乘;x是输入的数据序列;
[0025] 步骤3:步骤2:基于步骤1输出的预处理完成后的数据序列,提取数据序列时间特征;
[0026] 其中,提取数据序列时间特征由图注意力机制完成,由以下(4)定义:
[0027] att(xt)=FC(Th||Td||Tw)                  (4)
[0028]
[0029]
[0030]
[0031]
[0032]
[0033] 其中,th,td,tw分别是每小时采样间隔,每日采样间隔和每周采样间隔;FC是全连接函数;exp是以e为底的指数函数;Th,Td,Tw分别是三个多头注意力机制输出的结果;σ是激活函数; 是i节点t时刻的数据,αi,j是i节点与j节点的相关系数;Wk是可训练参数。
[0034] 步骤4、输入经过步骤2和步骤3两个AGA块的特征提取,经过一层全连接层得到下一时刻预测结果。
[0035] 有益效果
[0036] 本发明所述的一种基于图注意力卷积网络的交通流量预测方法,与现有的交通流量预测算法相比,具有如下有益效果:
[0037] 1.所述方法未使用无法并行训练的递归结构,模型的所有组件都是卷积结构,可以减少训练时间;
[0038] 2.所述方法是首次尝试结合基于频谱的图卷积网络和基于空间的卷积网络,分别提取空间特征和时间特征,在时空交通网络上算法表现出众。

附图说明

[0039] 图1是本发明一种基于图注意力卷积网络的交通流量预测方法依托的图注意力卷积算法网络结构图;
[0040] 图2是本发明交通流量预测方法与其他交通流量预测方法对比。

具体实施方式

[0041] 下面结合附图和实施例对本发明一种基于图注意力卷积网络的交通流量预测方法做进一步说明和详细描述。
[0042] 实施例1
[0043] 本实施例详细阐述了本发明“一种基于图注意力卷积网络的交通流量预测方法”在中长时间的交通流量预测的完整过程。
[0044] 步骤1,具体实施时,实验使用的是PeMSD7数据集,PeMSD7数据集每5分钟汇总一次交通数据,因此,路线图的每个节点每天包含288个数据点。线性插值方法用于解决数据清理问题后的缺失值。另外,通过零均值方法对输入数据进行归一化,以使输入数据的平均值为0。根据交通网络中站点之间的距离来计算路线图的邻接矩阵W,由公式(2)计算。
[0045] 数据预处理时σ和ε分别赋给10和0.5。图1(a)是网络的整体架构,由图1(a)可见,输入参数为前M个时序的各个节点交通流量信息xt-M+1,…,xt,经过两个注意力机制-卷积-注意力机制块,再经过一个输出层得到预测结果
[0046] 图1(b)是注意力机制-卷积-注意力机制块及门控时间图注意机制块的实现细节。对每个t时刻交通状态输入xt,首先经过一个门控时间图注意机制块在经过一层图卷积神经网络,最后再经过一个门控时间图注意机制块得到输出xt+1。在每一个门控时间图注意机制块中,三个多头图注意力网络分别提取输入xt中每小时与当前输入xt的相互影响,输入xtt t t
中每天与当前输入x 的相互影响及输入x中每周与当前输入x的相互影响。三个多头图注意力网络所得的三个输出拼接后在经过一个全连接层得到门控时间图注意机制块的输出,其中在经过全连接层时为了防止过拟合加入了残差结构。
[0047] 图2是本发明(GACAN)与其他交通流量预测方法的对比,从图2可以看出,本发明相较其他方法取得了最好的预测成果且模型收敛速度较快。
[0048] 以上所述为本发明的较佳实施例而已,本发明不应该局限于该实施例和附图所公开的内容。凡是不脱离本发明所公开的精神下完成的等效或修改,都落入本发明保护的范围。