一种基于Inception-CNN的城市快速路行程速度短时预测方法转让专利

申请号 : CN202011026285.8

文献号 : CN112201036B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 唐克双陈思曲曹喻旻李效松

申请人 : 同济大学

摘要 :

本发明涉及一种基于Inception‑CNN的城市快速路行程速度短时预测方法,该方法包括:训练阶段:(A1)构建历史的断面级行程速度信息时空矩阵,组建训练样本;(A2)构建Inception‑CNN深度神经网络模型,模型输入为历史时间段的断面级行程速度信息时空矩阵,模型输出为未来短时时间段的断面级行程速度信息时空矩阵;(A3)基于训练样本对模型进行训练;预测阶段:(B1)构建实时的断面级行程速度信息时空矩阵;(B2)将实时的断面级行程速度信息时空矩阵输入至训练好的模型,完成行程速度短时预测。与现有技术相比,本发明能有效学习具有不同尺度、影响范围的交通拥堵与交通事件模式,预测精度高。

权利要求 :

1.一种基于Inception‑CNN的城市快速路行程速度短时预测方法,其特征在于,该方法包括:训练阶段:

(A1)构建历史的断面级行程速度信息时空矩阵,组建训练样本;

(A2)构建Inception‑CNN深度神经网络模型,模型输入为历史时间段的断面级行程速度信息时空矩阵,模型输出为未来短时时间段的断面级行程速度信息时空矩阵;

(A3)基于训练样本对Inception‑CNN深度神经网络模型进行训练得到最优模型参数,完成训练;

预测阶段:

(B1)构建实时的断面级行程速度信息时空矩阵;

(B2)将实时的断面级行程速度信息时空矩阵输入至训练好的Inception‑CNN深度神经网络模型,得到待预测时段的断面级行程速度信息时空矩阵,完成城市快速路行程速度短时预测;

步骤(A1)和(B1)中构建断面级形成速度信息时空矩阵均通过如下方式构建:(a)获取定点检测器对各车道的行程速度检测数据时间序列;

(b)确定集计的时间长度,从时间和空间两个维度对行程速度检测数据进行双重集计得到各个检测点所在空间断面处的行程速度信息;

(c)将各个检测点所在空间断面处的行程速度信息组成矩阵形式得到断面级行程速度信息时空矩阵;

步骤(b)各个检测点所在空间断面处的行程速度信息通过下式得到:k

其中,Vi 、 分别为双重集计后检测断面i第k个集计时间段的行程速度与流量,分别为时间集计后检测断面i车道j在第k个集计时间段的流量与行程速度,T为各个集计时间段的长度,t为检测点的采样时间间隔,n为时间段长度扩大倍数, 分别为定点检测器获取的检测断面i车道j在第m个采样时刻的行程速度与流量;

步骤(c)断面级行程速度信息时空矩阵为S,表示为:k

其中,S为时空矩阵,Vi 为双重集计后检测断面i第k个集计时间段的行程速度,i=1,

2,……,L,k=1,2,……,H,L为区域内有效的定点检测器所在断面数量,H为集计时间段总数;

所述的Inception‑CNN深度神经网络模型包括依次级联的第一Inception模块、第二Inception模块和卷积神经网络;

所述的卷积神经网络包括依次级联的池化层、第一全连接层、第二全连接层和输出层;

步骤(A1)组建训练样本具体为:

确定训练样本大小P,随机选取第i个训练样本的选取起始时间点,获取从起始时间点开始的h_in个集计时间段内的断面级行程速度信息时空矩阵为 以及h_in个集计时间段后h_out个集计时间段内的断面级行程速度信息时空矩阵为 将 作为训练样本的输入,将 作为训练样本的标签,p=1,2,...,P;

步骤(A3)具体为:

(A31)将 作为输入对Inception‑CNN深度神经网络模型进行训练,更新优化Inception‑CNN深度神经网络模型的参数;

(A32)将步骤(A31)迭代进行直至Inception‑CNN深度神经网络模型收敛,完成训练。

2.根据权利要求1所述的一种基于Inception‑CNN的城市快速路行程速度短时预测方法,其特征在于,步骤(A31)中采用自适应学习率的梯度下降法对Inception‑CNN深度神经网络模型的参数进行优化。

3.根据权利要求1所述的一种基于Inception‑CNN的城市快速路行程速度短时预测方法,其特征在于,优化函数为:其中,Θ为Inception‑CNN深度神经网络模型中待优化的参数, 为第p个训练样本的标签, 为第p个训练样本对应的模型输出,P为训练样本大小。

说明书 :

一种基于Inception‑CNN的城市快速路行程速度短时预测

方法

技术领域

[0001] 本发明涉及智能交通技术领域,尤其是涉及一种基于Inception‑CNN的城市快速路行程速度短时预测方法。

背景技术

[0002] 随着城市快速发展,交通拥堵已逐渐成为制约城市经济增长和社会发展的瓶颈。快速路作为城市道路交通的骨架和动脉,承担大量的通勤和过境交通需求,在城市交通系统中发挥举足轻重的作用,是城市交通拥堵治理的核心环节。近年来,智能交通运输系统(Intelligent Transportation System,ITS)服务于缓解城市交通拥堵、提升居民出行质量等交通强国建设需求,而准确高效的交通状态预测技术不仅是ITS的关键环节,同时也是交通管理部门提高城市交通运行效率的基础。其中,短时行程速度能有效反映实时交通状态,服务于更可靠的动态交通管理和信息服务,以避免或缓解城市交通拥堵。故城市快速路行程速度短时预测方法的研究对于城市交通智能化与交通治理具有重大意义。
[0003] 目前,国内外关于交通状态预测的研究可大致分为两类:一是基于统计学的方法,二是基于神经网络的学习类方法。传统的统计学模型以差分整合移动平均自回归模型(Autoregressive Integrated Moving Average model,ARIMA)为主,适用于数据量充足且扰动较小的场景,但计算过程中涉及较多参数标定,导致模型泛化性较差,难以适应短时交通流随机性强、稳定性弱的特征;非参数模型较传统统计学模型在解决非线性、高维识别任务方面有所提升,模型可移植性较优,并可结合有关交通状态预测任务的相关参数,如气象数据等。神经网络支持大尺寸、高维度的输入数据,并具有高维非线性特征提取能力,从而能提高模型的精度与鲁棒性,其中,循环神经网络(Recurrent Neural Networks,RNN)可高效准确地识别交通数据的时间序列特征;近年来,在图像识别领域取得成功的卷积神经网络(Convolutional Neural Networks,CNN)也应用于交通状态预测任务,可提取交通数据中的时空关联特征,从而克服以往模型仅从时间或空间单一维度进行研究分析的不足。但在交通拥堵状态下,交通流的拥堵模式、交通事件的影响范围具有多样性,目前的深度学习方法对此缺乏足够的考虑。因此,建立高效的适应复杂交通模式的城市快速路行程速度短时预测方法具有重要的现实意义。

发明内容

[0004] 本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于Inception‑CNN的城市快速路行程速度短时预测方法。
[0005] 本发明的目的可以通过以下技术方案来实现:
[0006] 一种基于Inception‑CNN的城市快速路行程速度短时预测方法,该方法包括:
[0007] 训练阶段:
[0008] (A1)构建历史的断面级行程速度信息时空矩阵,组建训练样本;
[0009] (A2)构建Inception‑CNN深度神经网络模型,模型输入为历史时间段的断面级行程速度信息时空矩阵,模型输出为未来短时时间段的断面级行程速度信息时空矩阵;
[0010] (A3)基于训练样本对Inception‑CNN深度神经网络模型进行训练得到最优模型参数,完成训练;
[0011] 预测阶段:
[0012] (B1)构建实时的断面级行程速度信息时空矩阵;
[0013] (B2)将实时的断面级行程速度信息时空矩阵输入至训练好的Inception‑CNN深度神经网络模型,得到待预测时段的断面级行程速度信息时空矩阵,完成城市快速路行程速度短时预测。
[0014] 优选地,所述的Inception‑CNN深度神经网络模型包括依次级联的第一Inception模块、第二Inception模块和卷积神经网络。
[0015] 优选地,所述的卷积神经网络包括依次级联的池化层、第一全连接层、第二全连接层和输出层。
[0016] 优选地,步骤(A1)和(B1)中构建断面级形成速度信息时空矩阵均通过如下方式构建:
[0017] (a)获取定点检测器对各车道的行程速度检测数据时间序列;
[0018] (b)确定集计的时间长度,从时间和空间两个维度对行程速度检测数据进行双重集计得到各个检测点所在空间断面处的行程速度信息;
[0019] (c)将各个检测点所在空间断面处的行程速度信息组成矩阵形式得到断面级行程速度信息时空矩阵。
[0020] 优选地,步骤(b)各个检测点所在空间断面处的行程速度信息通过下式得到:
[0021]
[0022]
[0023]
[0024]
[0025]k
[0026] 其中,Vi 、 分别为双重集计后检测断面i第k个集计时间段的行程速度与流量,分别为时间集计后检测断面i车道j在第k个集计时间段的流量与行程速度,T为各个集计时间段的长度,t为检测点的采样时间间隔,n为时间段长度扩大倍数, 分别为定点检测器获取的检测断面i车道j在第m个采样时刻的行程速度与流量。
[0027] 优选地,步骤(c)断面级行程速度信息时空矩阵为S,表示为:
[0028]
[0029] 其中,S为时空矩阵,Vik为双重集计后检测断面i第k个集计时间段的行程速度,i=1,2,……,L,k=1,2,……,H,L为区域内有效的定点检测器所在断面数量,H为集计时间段总数。
[0030] 优选地,步骤(A1)组建训练样本具体为:
[0031] 确定训练样本大小P,随机选取第i个训练样本的选取起始时间点,获取从起始时间点开始的h_in个集计时间段内的断面级行程速度信息时空矩阵为 以及h_in个集计时间段后h_out个集计时间段内的断面级行程速度信息时空矩阵为 将 作为训练样本的输入,将 作为训练样本的标签,p=1,2,...,P。
[0032] 优选地,步骤(A3)具体为:
[0033] (A31)将 作为输入对Inception‑CNN深度神经网络模型进行训练,更新优化Inception‑CNN深度神经网络模型的参数;
[0034] (A32)将步骤(A31)迭代进行直至Inception‑CNN深度神经网络模型收敛,完成训练。
[0035] 优选地,步骤(A31)中采用自适应学习率的梯度下降法对Inception‑CNN深度神经网络模型的参数进行优化。
[0036] 优选地,优化函数为:
[0037]
[0038] 其中,Θ为Inception‑CNN深度神经网络模型中待优化的参数, 为第p个训练样本的标签, 为第p个训练样本对应的模型输出,P为训练样本大小。
[0039] 与现有技术相比,本发明具有如下优点:
[0040] 本发明基于Inception‑CNN的城市快速路行程速度短时预测方法在充分提取交通流高维非线性的时空关联性基础上,能有效学习具有不同尺度、影响范围的交通拥堵模式与交通事件特征,可以通过现有的线圈检测器等定点检测器采集的交通流检测参数,准确描述交通状态变化特征,进行行程速度短时预测,预测精度较高,可为工程应用提供扎实的基础。

附图说明

[0041] 图1为本发明基于Inception‑CNN的城市快速路行程速度短时预测方法的流程框图;
[0042] 图2为本发明Inception‑CNN深度神经网络模型的结构框图。

具体实施方式

[0043] 下面结合附图和具体实施例对本发明进行详细说明。注意,以下的实施方式的说明只是实质上的例示,本发明并不意在对其适用物或其用途进行限定,且本发明并不限定于以下的实施方式。
[0044] 实施例
[0045] 如图1所示,一种基于Inception‑CNN的城市快速路行程速度短时预测方法,该方法包括:
[0046] 训练阶段:
[0047] (A1)构建历史的断面级行程速度信息时空矩阵,组建训练样本;
[0048] (A2)构建如图2所示的Inception‑CNN深度神经网络模型,模型输入为历史时间段的断面级行程速度信息时空矩阵,模型输出为未来短时时间段的断面级行程速度信息时空矩阵,具体地:Inception‑CNN深度神经网络模型包括依次级联的第一Inception模块、第二Inception模块和卷积神经网络,卷积神经网络包括依次级联的池化层、第一全连接层、第二全连接层和输出层;
[0049] (A3)基于训练样本对Inception‑CNN深度神经网络模型进行训练得到最优模型参数,完成训练;
[0050] 预测阶段:
[0051] (B1)构建实时的断面级行程速度信息时空矩阵;
[0052] (B2)将实时的断面级行程速度信息时空矩阵输入至训练好的Inception‑CNN深度神经网络模型,得到待预测时段的断面级行程速度信息时空矩阵,完成城市快速路行程速度短时预测。
[0053] 其中,步骤(A1)和(B1)中构建断面级形成速度信息时空矩阵均通过如下方式构建:
[0054] (a)获取定点检测器对各车道的行程速度检测数据时间序列;
[0055] (b)确定集计的时间长度,从时间和空间两个维度对行程速度检测数据进行双重集计得到各个检测点所在空间断面处的行程速度信息,具体地:
[0056] 各个检测点所在空间断面处的行程速度信息通过下式得到:
[0057]
[0058]
[0059]
[0060]
[0061]
[0062] 其中,Vik、 分别为双重集计后检测断面i第k个集计时间段的行程速度与流量,分别为时间集计后检测断面i车道j在第k个集计时间段的流量与行程速度,T为各个集计时间段的长度,t为检测点的采样时间间隔,n为时间段长度扩大倍数, 分别为定点检测器获取的检测断面i车道j在第m个采样时刻的行程速度与流量;
[0063] (c)将各个检测点所在空间断面处的行程速度信息组成矩阵形式得到断面级行程速度信息时空矩阵,断面级行程速度信息时空矩阵为表示为S,具体如下:
[0064]
[0065] 其中,S为时空矩阵,Vik为双重集计后检测断面i第k个集计时间段的行程速度,i=1,2,……,L,k=1,2,……,H,L为区域内有效的定点检测器所在断面数量,H为集计时间段总数。
[0066] 步骤(A1)组建训练样本具体为:
[0067] 确定训练样本大小P,随机选取第i个训练样本的选取起始时间点,获取从起始时间点开始的h_in个集计时间段内的断面级行程速度信息时空矩阵为 以及h_in个集计时间段后h_out个集计时间段内的断面级行程速度信息时空矩阵为 将 作为训练样本的输入,将 作为训练样本的标签,p=1,2,...,P。
[0068] 步骤(A3)具体训练过程为:
[0069] (31)将 输入Inception‑CNN深度神经网络模型;
[0070] (32)经过第一Inception模块,具体操作为:
[0071] 令 其中fconv表示卷积层的激活函数,Conv表示卷积神经网络的卷积过程;
[0072] 令
[0073] 令
[0074] 令
[0075] 令 其中Concat表示张1
量的拼接过程,Inception表示第一Inception模块的卷积与池化以及激活过程;
[0076] (33)经过第二Inception模块,具体操作为:
[0077] 令
[0078] 令
[0079] 令2
[0080] 令 其中Inception表示第二Inception模块的卷积与池化以及激活过程。
[0081] (33)令 其中Pool表示卷积神经网络的池化过程。
[0082] (34)令 其中Flatten表示全连接层的矩阵运算与激活过程。
[0083] (35)令
[0084] (36)令
[0085] (37)采用自适应学习率的梯度下降法对Inception‑CNN深度神经网络模型的参数进行优化,优化函数为:
[0086]
[0087] 其中,Θ为Inception‑CNN深度神经网络模型中待优化的参数, 为第p个训练样本的标签, 为第p个训练样本对应的模型输出,P为训练样本大小;
[0088] (38)重复(31)~(37)进行直至Inception‑CNN深度神经网络模型收敛,完成训练。
[0089] 本实施例基于Tensorflow深度学习框架搭建,经过比选择优,Inception‑CNN深度神经网络模型参数确定为:在第一个Inception模块中,共包含4种卷积或池化算子的组合,即2个卷积层,分别有64个大小为3×3的卷积核;1个卷积层,包含96个大小为3×3的卷积核;1个卷积层,包含64个大小为1×1的卷积核;1个卷积层与1个池化层,分别有64个大小为1×1的卷积核与大小为3×3的平均池化算子。在第二个Inception模块中,共包含3种卷积或池化算子的组合,即4个卷积层,分别有128个大小为1×3、3×1、1×3、3×1的卷积核;2个卷积层,分别有192个大小为1×3与3×1的卷积核;1个卷积层与1个池化层,分别有大小为2×2的平均池化算子与64个大小为3×3的卷积核。随后采用最大池化层,2层全连接层神经元个数为分别为1024与512,最终输出大小为35的一维张量。模型训练时的批处理大小设置为256,激活函数为ReLU(Rectified Linear Unit),初始学习率为0.001。并采用早停(Early Stopping)机制防止模型过拟合。
[0090] 在本实施例中,为验证Inception‑CNN模型的有效性,选取ARIMA、ANN、CNN和RNN作为对比模型。为测试模型在不同输入时间步长条件下的适应性,设置30min、45min以及60min三种输入时长,对应步长大小为H={6,9,12},预测输出时长设置为5min,对应1个时间步长。同时,本实施例将数据集划分为工作日、非工作日以及所有时间三类,在此基础上,比较模型训练结果。
[0091] 其中,设置预测结果的平均绝对百分比误差(Mean Absolute Percent Error,MAPE)作为准确率的评价指标。
[0092]
[0093] 其中,N表示预测结果总数,yi表示实际行程速度, 表示模型预测的行程速度。
[0094] 首先,在不同输入时间步长的条件下对比模型预测的效果,如表1所示:
[0095] 表1不同输入时间步长的条件下模型预测结果的平均绝对百分比误差
[0096] 输入时长 30min 45min 60minARIMA 5.60 5.91 6.07
ANN 4.36 4.57 4.53
CNN 4.12 4.14 4.34
RNN 4.08 4.15 4.24
Inception‑CNN 4 4.09 4.19
[0097] 由表1可以看出,Inception‑CNN深度神经网络模型准确率均优于其它四个对比模型,特别地,当输入时长从30min增长至60min时,所有模型的平均绝对百分比误差都呈现上升的趋势,说明交通状态的演变具有时效性,30min的历史数据中已包含足够的有效特征,当输入时长继续增长时,将引入无效信息。本模型在输入时长为30min时预测的MAPE仅为4%,即精度达到96%,可以认为提取交通流多尺度、不同范围的动态变化特征能有效提高模型精度;在输入时长为60min时预测精度同样最高,说明本模型可准确识别有效特征,减少冗余信息带来的负面影响,提升模型精度。
[0098] 除此之外,本实施例对模型在不同场景下的表现也进行了对比分析,如表2所示:
[0099] 表2不同场景下模型预测结果的平均绝对百分比误差
[0100]输入时长 30min 45min 60min
ARIMA 6.82 4.16 5.60
ANN 5.03 3.86 4.36
CNN 4.63 3.64 4.12
RNN 4.55 3.47 4.08
Inception‑CNN 4.51 3.34 4
[0101] 由表2可以看出,Inception‑CNN深度神经网络模型在不同场景下的预测精度均最高。当数据集为工作日时,预测的MAPE最高,当数据集为非工作日时,预测的MAPE最低,说明非工作日的交通事件较少,而工作日的常发性与偶发性交通时间有所上升,进一步说明本模型对于不同尺度的交通拥堵、交通事件特征具有强学习能力。根据上述说明,本模型在不同场景、不同输入时间步长的条件下预测精度均较高,可为城市快速路的交通管理与控制部门提供更准确的行程速度预测信息。
[0102] 本发明提出的Inception‑CNN深度神经网络模型,在充分提取交通流高维非线性时空关联性的基础上,能有效学习具有不同尺度、影响范围的交通拥堵与交通事件模式,5分钟内的行程速度短时预测准确度高达95%,可为工程应用提供扎实可靠的基础。
[0103] 上述实施方式仅为例举,不表示对本发明范围的限定。这些实施方式还能以其它各种方式来实施,且能在不脱离本发明技术思想的范围内作各种省略、置换、变更。