一种交通短时流量智能预测方法转让专利

申请号 : CN202110555809.0

文献号 : CN113254866B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王延鹏温欣雨赵磊娜徐进陈正欢王程瑜

申请人 : 重庆交通大学

摘要 :

本发明提供一种交通短时流量智能预测方法,包括以下步骤,利用第一模型分别提取原始交通流序列中的非线性特征和高频噪声,将原始交通流序列分解为几个中心频率不同的子序列;分别建立第二模型和第三模型,并对不同中心频率的子序列进行预测,采用第二模型模型预测低中心频率子序列,采用第三模型预测高中心频率子序列;将各子序列的预测值相加。本发明具有较高的精度和稳定性。

权利要求 :

1.一种交通短时流量智能预测方法,其特征在于,包括以下步骤,利用第一模型分别提取原始交通流序列中的非线性特征和高频噪声,将原始交通流序列分解为若干个中心频率不同的子序列;

分别建立第二模型和第三模型,并对不同中心频率的子序列进行预测,采用第二模型预测低中心频率子序列,采用第三模型预测高中心频率子序列;

将各子序列的预测值相加;

所述第一模型包括,

式中,s(t)表示信号中包含高频噪声;s0(t)表示过滤后的信号;||·||2表示函数的第二范数,f(t)表示待求信号,t表示时间序列,α是过滤因子;

将上述公式通过傅立叶变换方法得到以下公式:式中,s0(ω)、s(ω)分别表示s0(t)和s(t)的傅立叶变换;α是过滤因子;

根据下述公式将s(t)分为k个子序列,式中,sl(t)表示分解的子序列,k表示子序列的个数。

2.如权利要求1所述的一种交通短时流量智能预测方法,其特征在于,所述第二模型,在通过变分模态分解后,为低频子系列建立第二模型;

d

设有样本空间{(xi,yi),i=1,2,...n}xi∈R ,yi∈R,R表示样本空间,d表示自变量维d

数,n表示样本的个数,xi,yi表示样本,存在一个映射f:R→R,以最小化回归值f(xi)和对象值yi之间的均方根误差,式中,ψ(·)表示非线性函数; 代表权重值,b代表偏移量;

然后引入第二模型:

式中,v表示惩罚因子,μ表示灵敏度,e表示预测值和对象值之间的误差,ei表示第i个样本预测值和对象值之间的误差,T表示矩阵转置;

在上述公式中应用拉格朗日乘数法,重写为以下公式,式中,L(·)表示拉格朗日函数,βi表示拉格朗日乘数, 和b的解由KKT条件和下述公式获得

n×n

式中,Ω∈R 为ψ(xi,xj)组成的核矩阵,ψ(xi,xj)是关于xi和xj的高斯核函数、Q=[1,T n n n×n

1,...1]∈R ;γ=v/μ;υ=[y1,y2,...yn]∈R ;I∈R 为单位矩阵;n表示样本的个数;高斯核函数如下述公式所示,

2 2

K(xi,xj)=exp[‑||xi‑xj||/(2σ)],σ>0式中,σ代表内核参数,然后,通过在样本空间中进行训练,生成下述公式,式中,xi表示样本。

3.如权利要求1所述的一种交通短时流量智能预测方法,其特征在于,所述第二模型包括,

设获得的时间序列样本为{x1,x2,...xn},将时间序列样本重构为下述公式,式中,d表示自变量维数,重建样本是 n表示样本的个数;重建样本的联合分布核函数如下述公式所示,式中, χ(·)代表核密度函数, 代表对称的一个内核带宽矩阵,采用对角矩阵作为内核带宽矩阵,如下述公式所示,式中,σ1,σ2...σd是自变量 各个维的带宽参数,σd+1是 的带宽参数,σi(i=1,2,...d)和σd+1并分别确定 方向和 方向的平滑度,采用以下公式确定σi和σd+1,式中,sti(i=1,2,...d)和std+1分别代表{xi,xi+1,...xi+n‑d‑1}(i=1,2,...d)和{xd+1,xd+2,...xn}的标准差;

核密度函数是高斯核密度函数采用以下公式所示,将联合分布核函数公式改写为下述公式式中, 和 是在 方向和 方向上对应的内核带宽矩阵,采用下述公式表示的多维核密度函数表示为下述公式σ代表内核参数;

n表示样本的个数。

说明书 :

一种交通短时流量智能预测方法

技术领域

[0001] 本发明涉及交通领域,具体涉及一种交通短时流量智能预测方法。

背景技术

[0002] 随着ITS的发展,短期交通流预测一直是研究热点,其预测精度对ITS性能的提高起着关键作用。因此,发展高精度的预测模型是必要的。目前,各种传统的预测模型已经被
建立起来,其实验结果证明是有效的,但仍存在缺陷需要改进。因此,迫切需要探索更可靠、
更精确的短期交通流预测方法。

发明内容

[0003] 本发明的发明目的是,提供一种更可靠、更精确的短期交通流预测方法。
[0004] 本发明提供一种交通短时流量智能预测方法,包括以下步骤,
[0005] 利用第一模型分别提取原始交通流序列中的非线性特征和高频噪声,将原始交通流序列分解为几个中心频率不同的子序列;
[0006] 分别建立第二模型和第三模型,并对不同中心频率的子序列进行预测,采用第二模型模型预测低中心频率子序列,采用第三模型预测高中心频率子序列;
[0007] 将各子序列的预测值相加。
[0008] 进一步的,
[0009] 所述第一模型包括,
[0010]
[0011] 式中,s(t)表示信号中包含高频噪声;s0(t)表示过滤后的信号;||·||2表示函数的第二范数,f(t)表示待求信号,t表示时间序列;
[0012] 将上述公式通过傅立叶变换方法得到以下公式:
[0013]
[0014] 式中,s0(ω)、s(ω)分别表示s0(t)和s(t)的傅立叶变换;α是过滤因子;
[0015] 根据下述公式将s(t)分为k个子系列,
[0016]
[0017] 式中,si(t)表示分解的子系列,k表示子系列的个数。
[0018] 进一步的,
[0019] 所述第二模型,在通过变分模态分解后,为低频子系列建立第二模型;
[0020] 设有样本空间{(xi,yi),i=1,2,...n},xi∈Rd,yi∈R,R表示样本空间,d表示自变d
量维数,n表示样本的个数。xi,yi表示样本,存在一个映射f:R→R,以最小化回归值f(xi)和
对象值yi之间的均方根误差,
[0021]
[0022] 式中,ψ(·)表示非线性函数; 代表权重值,b代表偏移量;
[0023] 然后引入第二模型:
[0024]
[0025] 式中,v表示惩罚因子,μ表示灵敏度,e表示预测值和对象值之间的误差,ei表示第i个样本预测值和对象值之间的误差,T表示矩阵转置;
[0026] 在上述公式中应用拉格朗日乘数法,重写为以下公式。
[0027]
[0028] 式中,L(·)表示拉格朗日函数;βi表示拉格朗日乘数。 和b的解由KKT条件和下述公式获得
[0029]
[0030] 式中,Ω∈Rn×n由ψ(xi,xj)组成,ψ(xi,xj)是xi和xj、V=[1,1,...1]T∈Rn;γ=ν/μ;n n×n
υ=[y1,y2,...yn]∈R的核函数,高斯核函数因如下述公式所示;I∈R 为单位矩阵;
[0031] K(xi,xj)=exp[‑||xi‑xj||2/(2σ2)],σ>0
[0032] 式中,σ代表内核参数。然后,通过在样本空间中进行训练,生成下述公式,
[0033]
[0034] 式中,xi是样本空间的每个向量。
[0035] 进一步的,
[0036] 所述第二模型模型包括,
[0037] 设获得的时间序列样本为{x1,x2,...xn},将时间序列样本重构为下述公式,
[0038]
[0039] 式中,d表示重构自变量的维数。重建样本是 重建样本的联合分布核函数如下述公式所示,
[0040]
[0041] 式中, K(·)代表核密度函数; 代表通常对称的一个内核带宽矩阵,采用对角矩阵作为内核带宽矩阵,如下述公式所示,
[0042]
[0043] 式中,σ1,σ2...σd是自变量 各个维的带宽参数,σd+1是 的带宽参数。σi(i=1,2,...d)和σd+1并分别确定 方向和 方向的平滑度,采用以下公式确定σi和σd+1,
[0044]
[0045]
[0046] 式中,sti(i=1,2,...d)和std+1分别代表{xi,xi+1,...xi+n‑d‑1}(i=1,2,...d)和{xd+1,xd+2,...xn}的标准差;
[0047] 核密度函数是高斯核密度函数采用以下公式所示,
[0048]
[0049] 将联合分布核函数公式改写为下述公式
[0050]
[0051] 式中, 和 是在 方向和 方向上对应的内核带宽矩阵,采用下述公式表示
[0052]
[0053]
[0054] 的多维核密度函数表示为下述公式
[0055]
[0056] 本发明的有益效果是,本发明不仅可以有效地将短期交通流划分为子序列,而且还可以根据各自的中心频率,采用两种合适的预测方法对分解后的子序列进行处理。更重
要的是,它补充了几种传统模式的优缺点。因此,本发明非常适合于短期交通流预测。

附图说明

[0057] 图1为本发明流程图。

具体实施方式

[0058] 短时流量预测是智能交通系统(ITS)的重要组成部分。然而,由于交通流数据存在很强的非线性和随机性,一些传统的预测方法难以提供令人满意的结果。为此,本发明提出
了一种基于变分模态分解、最小二乘支持向量和条件核密度估计的混合模型(VMD‑LSSVM‑
CKDE)。其中,第一模型首先将隐含的非线性和高频噪声分解为若干个子序列来处理。然后,
根据不同的中心频率建立各子序列的第二模型和第三模型,并将相应的预测结果叠加得到
最终的预测结果。最后,以一组主干道交叉口实测数据为例,对该方法的性能进行了评价。
实验结果表明,该模型的性能优于其他模型。例如,与传统模型相比,该方法在绝对误差、平
均相对百分比误差、均方根误差、均方根相对误差和等系数等指标上的改进分别为0.9920、
2.25%、1.3457、4.30%和0.9917。
[0059] 下面多本发明中的缩略语进行说明
[0060] AI,人工智能;AMIRA,自回归综合移动平均模型;KF,卡尔曼滤波器;SVM,支持向量;SARIMA,季节自回归综合移动平均模型;ANN,人工神经网络;CNN,卷积神经网络;LSTM,
长短期记忆;ELM,极限学习机;GS,梯度研究;WNN,小波神经网络;WD,小波分解;EMD,经验模
态分解;EEMD,系综经验模态分解;MAE,平均绝对误差;MRPE,平均相对百分比误差;RMSR,均
方根误差;RMSRE,均方根相对误差;EC,等系数。
[0061] 本发明的发明构思是,首先利用第一模型分别提取原始交通流序列中的非线性特征和高频噪声,将原始交通流序列分解为几个中心频率不同的子序列;其次,分别建立第二
模型和第三模型,并对不同中心频率的子序列进行预测,第二模型预测低中心频率子序列,
第三模型预测高中心频率子序列。第三,将各子序列的预测值相加,得到最终预测值。最后,
基于一组交通量数据的案例研究,对其性能进行了评价。实验结果表明,该模型优于常规模
型。与传统预测模型相比,本发明的有益效果是:(1)第一模型成功地应用于短期交通流预
测领域。同时,得到了满意的结果。就我们所知,新发展的分解模型可以解决传统方法的问
题,如模式混合。(2)根据子序列的中心频率不同,分别提出了不同的预测方法。特别的是,
与常见的单一预测模型不同,该模型能够适应子序列的中心频率,并选择合适的模型
(LSSVM或CKDE)对分解后的子序列进行预测。(3)利用一组城市道路实测数据集作为实验数
据,对所提模型的性能进行了全面的研究。为了更好地展示其性能,我们使用了四个参考模
型进行比较。结果表明,该方法具有较高的精度和稳定性。
[0062] 短期交通流数据具有低频,非线性和随机性等特点,因此很难通过单一模型进行有效预测,本发明建立了一个新的组合预测模型。
[0063] 下面对第一模型进行说明。
[0064] 将短期交通流数据分解为具有不同中心频率的几个子系列后,第一模型可以区分非线性和随机性的组成部分。
[0065] 作为一种新的分解方法,第一模型能够自适应地消除高频噪声,表达式如公式(1)所示:
[0066]
[0067] 式中,s(t)表示信号中包含高频噪声;s0(t)表示过滤后的信号;||·||2表示函数的第二范数,f(t)表示待求信号,t表示时间序列;
[0068] 将公式(1)通过傅立叶变换方法得到以下公式(2):
[0069]
[0070] 式中,s0(ω)、s(ω)分别表示s0(t)和s(t)的傅立叶变换;α是过滤因子。显然,可以通过在降低真实信号损失的条件下转动滤波器系数来滤除高频噪声。
[0071] 可以根据公式(3)根据下述公式将s(t)分为k个子系列,
[0072]
[0073] 式中,si(t)表示分解的子系列,k表示子系列的个数。
[0074] 在继续下一个步骤之前,需要对子系列执行几个过程:
[0075] 1)为了获得子序列的单边频谱,使用希尔伯特变换来处理子序列。
[0076] 2)为了避免子系列之间的频域重叠,每个子系列都应与指数混合,以便将其中心频率转换为新的基带;
[0077] 3)每个子序列的带宽可以通过解调信号的高斯平滑度来估计。
[0078] 因此分解问题改写为(4):
[0079]
[0080] 式中,si(t)和ωi表示分解后的子序列和相应的中心频率;δ(t)是狄拉克函数;j是虚单位;*表示卷积运算。
[0081] 为了消除约束项,可以通过添加惩罚项和Lagrange项将公式(4)转换为(5)。
[0082]
[0083] 式中,<·>表示内部产品;λ(t)表示拉格朗日乘数;α表示过滤因子,i为范围在1到n的自然数。
[0084] 通过变分原理和ADMM([20]~[22])解决了优化问题(5)。ADMM也称为乘法器的交替方向方法。以这种方式,通过逐步迭代来获得的解。详细的迭代过程如公式(6)、(7)、(8)
所示。
[0085]
[0086]
[0087]
[0088] 式中,si(ω)和β(ω)分别表示si(t)和β(t)的频域;m表示迭代序数,表示迭代因子。
[0089] 当满足公式(9)时,整个迭代过程将停止。
[0090]
[0091] 式中,ξ表示收敛系数,它决定了原始交通流与重建交通流之间的误差。
[0092] 每个子系列 都是通过傅里叶逆变换获得的,如(10)所示。
[0093]
[0094] 式中, 代表·获得的实部。ifft()表示是快速傅里叶逆变换
[0095] 下面对第二模型进行说明。
[0096] 在通过第一模型分解后,为低频子系列建立第二模型。它通常用于解决回归问题,并在描述交通流数据中存在的强非线性方面表现出色。
[0097] 假设有一个样本空间{(xi,yi),i=1,2,...n},xi∈Rd,yi∈R,R表示样本空间,n表d
示样本的个数,xi,yi表示样本,d为样本自变量的维数,存在一个映射f:R→R,以最小化回
归值f(xi)和对象值yi之间的均方根误差。
[0098]
[0099] 式中,ψ(·)表示非线性函数; 代表权重值,b代表偏移量。
[0100] 然后在公式中引入第二模型(12)
[0101]
[0102] 式中,v表示惩罚因子,μ表示灵敏度,e表示预测值和对象值之间的误差,ei表示第i个样本预测值和对象值之间的误差,T表示矩阵转置。
[0103] 在公式(12)中应用了拉格朗日乘数法,因此公式(12)可以如下重写。
[0104]
[0105] 式中,L(·)表示拉格朗日函数;βi表示拉格朗日乘数。 和b的解由KKT条件和矩阵公式(14)获得,KKT条件是非线性规划(nonlinear programming)最佳解的必要条件。KKT条
件将Lagrange乘数法(Lagrange multipliers)所处理涉及等式的约束优化问题推广至不
等式。
[0106]
[0107] 式中,Ω∈Rn×n由ψ(xi,xj)组成,ψ(xi,xj)是xi和xj、V=[1,1,...1]T∈Rn;γ=ν/μ;n
υ=[y1,y2,...yn]∈R的核函数。通常,高斯核函数因简单实用被广泛运用,如公式(15)所
示。
[0108] K(xi,xj)=exp[‑||xi‑xj||2/(2σ2)],σ>0    (15)
[0109] 式中,σ代表内核参数。然后,通过在样本空间中进行训练,将公式(11)改写为公式(16)。
[0110]
[0111] 式中,xi是样本空间的每个向量。
[0112] 下面对第三模型进行说明。
[0113] 第三模型是一种相对于核密度估计的改进方法,它针对更高频率的子序列而开发,有关核密度估计。假设获得的时间序列样本为{x1,x2,...xn}。考虑到时间序列之间存在
复杂的关系。因此可以将时间序列样本重构为公式(17)。
[0114]
[0115] 式中,d表示重构自变量的维数。重建样本是 重建样本的联合分布核函数如(18)所示。
[0116]
[0117] 式中, K(·)代表核密度函数; 代表通常对称的一个内核带宽矩阵,本发明采用对角矩阵作为内核带宽矩阵,如(19)所示。
[0118]
[0119] 式中,σ1,σ2...σd是自变量 各个维的带宽参数,σd+1是 的带宽参数。σi(i=1,2,...d)和σd+1并分别确定 方向和 方向的平滑度。本发明的值,用公式(20)表示。
[0120]
[0121] 式中,sti(i=1,2,...d)和std+1分别代表{xi,xi+1,...xi+n‑d‑1}(i=1,2,...d)和{xd+1,xd+2,...xn}的标准差。
[0122] 另一方面,最广泛使用的核密度函数是高斯核密度函数,如公式(21)所示。
[0123]
[0124] 结合公式(19)(21),可以将公式(18)改写为公式(22)
[0125]
[0126] 式中, 和 是在 方向和 方向上对应的内核带宽矩阵,如(23)所示
[0127]
[0128]
[0129] 类似地,的多维核密度函数表示为公式
[0130]
[0131] 本发明进行短期交通流预测的主要步骤:1)选择合适的过滤因子对原始交通流数据进行过滤;2)将过滤后的交通流数据分解为若干子序列;3)采用第二模型或第三模型对
不同中心频率的子序列进行预测;4)将几个子序列的预测值相加,得到最终的预测值。
[0132] 根据公式(2),原始交通流数据的损失与过滤因子的变化呈正相关,其中过滤因子的选择不要太大。本发明采用的滤波因子的取值范围在0到100之间,同时满足以下准则:1)
残差必须服从高斯分布;2)残差分布与高斯分布的拟合误差均方误差最小;
[0133] 通过第一模型分解得到不同中心频率的子级数,中心频率越高的子级数振荡越剧烈,反之亦然。因此,利用第二模型自身特有的拟合特征对低中心频率进行预测。另一方面,
作为一种非参数估计方法,第三模型是一种估计低振幅、强振荡时间序列的有效方法。因此
利用第三模型预测高中心频率子序列。众所周知,第二模型是在假定训练部分残差必须服
从均值为零的高斯分布的情况下建立的,这可以作为预测结果是否有效的判断标准。也就
是说,随着中心频率的增加,第二模型对子序列训练部分的残差不太可能服从高斯分布,就
这样选择临界中心频率。具体选择过程如表1所示。
[0134] 表1 预测方法的选择
[0135]
[0136] 本发明所提出的预测模型的具体过程如图1所示。
[0137] 本发明针对传统预测方法的不足,提出了一种新的预测方法显著提高了短期交通流预测的准确性,具有优越性和可靠性。
[0138] 本发明具有更高的预测精度,在短期交通流中的应用是有效的。其次,从与单一模型比较的角度来看:与ARIMA模型相比,本发明模型具有解释时间序列非线性分量的能力;
[0139] 综上所述,本发明不仅可以有效地将短期交通流划分为子序列,而且还可以根据各自的中心频率,采用两种合适的预测方法对分解后的子序列进行处理。更重要的是,它补
充了几种传统模式的优缺点。因此,本发明非常适合于短期交通流预测。
[0140] 以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修
改、等同替换、改进等,均应包含在本发明的保护范围之内。