一种出行生成量预测方法及系统转让专利

申请号 : CN201911215218.8

文献号 : CN111145537B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 陆建王成晨

申请人 : 东南大学

摘要 :

本发明公开一种出行生成量预测方法及系统。该方法包括:获取来自出行软件的用户出行数据;从出行数据中筛选不同时间点的出行产生量和出行吸引量生成出行产生量时间序列和出行吸引量时间序列;将出行产生量时间序列和出行吸引量时间序列均按时间划分为两段分别得到参数拟合序列和模型检验序列;利用参数拟合序列建立自回归滑动平均模型;利用模型检验序列判断自回归滑动平均模型是否需要调整;若是,则利用模型检验序列对自回归滑动平均模型的参数进行调整,并将调整后的自回归滑动平均模型确定为预测模型;利用预测模型对未来时刻的出行产生量和出行吸引量进行预测,得到预测出行生成量。本发明的方法及系统能够提高出行生成量预测的便捷程度。

权利要求 :

1.一种出行生成量预测方法,其特征在于,包括以下步骤:步骤101:获取来自出行软件的用户出行数据;

步骤102:从所述出行数据中筛选不同时间点的出行产生量和出行吸引量,生成出行产生量时间序列和出行吸引量时间序列;出行生成量包括出行产生量和出行吸引量;

出行产生量为由家出行的全部家庭端点数,与非由家出行和货物出行的全部起点数之和;出行吸引量为由家出行的全部非家庭端点数,与非由家出行和货物出行的全部终点数之和;其中

出行产生量时间序列表示为:

Xt={x1,x2,x3,...}出行吸引量时间序列表示为:

Yt={y1,y2,y3,...}其中,t表示时间点,xt为第t个时间点的出行产生量,Xt表示出行产生量时间序列,yt为第t个时间点的出行吸引量,Yt表示出行吸引量时间序列;

步骤103:将所述出行产生量时间序列和所述出行吸引量时间序列均按时间划分为两段,分别得到参数拟合序列和模型检验序列;

步骤104:计算所述出行产生量时间序列和所述出行吸引量时间序列的自相关系数;

步骤105:根据所述自相关系数判断所述出行产生量时间序列和所述出行吸引量时间序列是否平稳,得到第二判断结果;

步骤106:对所述出行产生量时间序列和所述出行吸引量时间序列进行至少一次差分处理,直到所述出行产生量时间序列和所述出行吸引量时间序列成为平稳序列;差分处理后确定差分阶数;

步骤107:利用所述参数拟合序列建立自回归滑动平均模型;出行生成量时间序列具有一定的周期性、连续性和稳定性,可以通过拟合前期时刻生成量时间序列对未来时刻生成量时间序列进行预测;

步骤108:利用所述模型检验序列判断所述自回归滑动平均模型的参数是否需要调整,得到第一判断结果;

步骤109:利用所述模型检验序列对所述自回归滑动平均模型的参数进行调整,并将调整后的所述自回归滑动平均模型确定为预测模型;

步骤110:将所述自回归滑动平均模型确定为预测模型;

步骤111:利用所述预测模型对未来时刻的出行产生量和出行吸引量进行预测,得到预测出行生成量。

2.根据权利要求1所述的出行生成量预测方法,其特征在于,所述步骤104,自相关系数计算公式为:

其中,rx(t,t+k)=E(Xt‑EXt)(Xt+k‑EXt+k)为Xt的延迟k(k=1,2,3,...,n)自协方差函数,ρx(t,t+k)为Xt的延迟k自相关函数,ry(t,t+k)=E(Yt‑EYt)(Yt+k‑EYt+k)为Yt的延迟k(k=1,

2,3,...,n)自协方差函数,ρy(t,t+k)为Yt的延迟k自相关函数,E、D分别为数学期望和方差,所述自协方差函数与自相关函数只依赖于时间的延迟长度k,而与时间的起止点无关。

3.根据权利要求1所述的出行生成量预测方法,其特征在于,所述步骤105,依据自相关系数判断Xt和Yt的平稳性,平稳序列通常具有短期相关性,即平稳序列的自相关系数会随着延迟期数k的增加而迅速衰减为0,随后在0附近波动且逐渐收敛于0,确定延迟期数k的阈值,确定任意k,可取5,随着k从1增长到5的过程中,若ρ(t,t+k)的值很快趋近于0,则时间序列Xt和Yt为平稳序列,直接执行步骤107;否则,Xt和Yt为非平稳序列,则执行步骤106,将非平稳序列转化为平稳序列后,再执行步骤107。

4.根据权利要求1所述的出行生成量预测方法,其特征在于,所述步骤107具体包括:

A1:建立任意时间点与该时间点的前期值之间的线性函数;

确定模型的自回归项,自回归项为出行产生量时间序列和所述出行吸引量时间序列关于当期值和前期值的线性函数;

B1:引入差分阶数和滞后算子,在所述线性函数的基础上建立自回归滑动平均模型;

C1:利用试算法计算所述自回归滑动平均模型的模型阶数;

D1:利用所述参数拟合序列确定所述自回归滑动平均模型的自回归系数和移动平均系数,得到建立好的自回归滑动平均模型。

5.根据权利要求1所述的出行生成量预测方法,其特征在于,所述步骤108具体包括:

A:根据所述自回归滑动平均模型计算所述模型检验序列中各个时间点的出行产生预测量 和出行吸引预测量

B:根据所述出行产生及吸引的预测量和所述模型检验序列中的出行产生及吸引量分别计算产生量及吸引量的最大相对百分误差预测指标RE;具体为其中x′T和y′T为检验序列中第T个时间点的出行产生量和吸引量, 和 为对应第T个时间点的出行产生和吸引量预测值,N表示预测样本个数;

C:根据所述出行产生及吸引的预测量和所述模型检验序列中的出行产生及吸引量分别计算产生量及吸引量的平均相对百分误差预测指标MAPE;具体为D:判断所述产生量最大相对百分误差预测指标、所述产生量平均相对百分误差预测指标、所述吸引量最大相对百分误差预测指标和所述吸引量平均相对百分误差预测指标是否均在对应的预设范围内,得到第三判断结果;具体为:判断最大相对百分误差预测指标RE是否满足RE<15%且平均相对百分误差预测指标MAPE是否满足MAPE<15%;

E:若所述第三判断结果表示是,则确定自回归滑动平均模型的参数不需要调整;执行步骤110;

F:若所述第三判断结果表示否,则确定自回归滑动平均模型的参数需要调整;执行步骤109。

6.根据权利要求1所述的出行生成量预测方法,其特征在于,所述出行软件为手机出行软件,所述用户出行数据包括出行时间和位置信息;出行时间和位置信息可以用来确定各出行起点的时间和出行终点的时间。

7.一种出行生成量预测系统,其特征在于,包括以下:数据获取模块(201),用于获取来自出行软件的用户出行数据;

筛选模块(202),用于从所述出行数据中筛选不同时间点的出行产生量和出行吸引量,生成出行产生量时间序列和出行吸引量时间序列;

划分模块(203),用于将所述出行产生量时间序列和所述出行吸引量时间序列均按时间划分为两段,分别得到参数拟合序列和模型检验序列;

相关系数计算模块(204),用于计算所述出行产生量时间序列和所述出行吸引量时间序列的自相关系数;

第二判断模块(205),用于根据所述自相关系数判断所述出行产生量时间序列和所述出行吸引量时间序列是否平稳,得到第二判断结果;

差分处理模块(206),用于若所述第二判断结果表示否,则对所述出行产生量时间序列和所述出行吸引量时间序列进行至少一次差分处理,直到所述出行产生量时间序列和所述出行吸引量时间序列成为平稳序列;

模型建立模块(207),用于利用所述参数拟合序列建立自回归滑动平均模型;

第一判断模块(208),用于利用所述模型检验序列判断所述自回归滑动平均模型的参数是否需要调整,得到第一判断结果;

第一预测模型确定模块(209),用于若所述第一判断结果表示是,则利用所述模型检验序列对所述自回归滑动平均模型的参数进行调整,并将调整后的所述自回归滑动平均模型确定为预测模型;

第二预测模型确定模块(210),用于若所述第一判断结果表示否,则将所述自回归滑动平均模型确定为预测模型;

预测模块(211),用于利用所述预测模型对未来时刻的出行产生量和出行吸引量进行预测,得到预测出行生成量。

8.根据权利要求7所述的出行生成量预测系统,其特征在于,所述模型建立模块(207)包括:线性函数建立单元,用于建立任意时间点与该时间点的前期值之间的线性函数;

模型初建单元,用于引入差分阶数和滞后算子,在所述线性函数的基础上建立自回归滑动平均模型;

模型阶数计算单元,用于利用试算法计算所述自回归滑动平均模型的模型阶数;

模型系数计算单元,用于利用所述参数拟合序列确定所述自回归滑动平均模型的自回归系数和移动平均系数,得到建立好的自回归滑动平均模型。

9.根据权利要求7所述的出行生成量预测系统,其特征在于,所述第一判断模块(208)包括:预测量计算单元,用于根据所述自回归滑动平均模型计算所述模型检验序列中各个时间点的出行产生预测量和出行吸引预测量;

产生量指标计算单元,用于根据所述出行产生预测量和所述模型检验序列中的出行产生量计算产生量最大相对误差预测指标和产生量平均绝对百分误差预测指标;

吸引量指标计算单元,用于根据所述出行吸引预测量和所述模型检验序列中的出行吸引量计算吸引量最大相对误差预测指标和吸引量平均绝对百分误差预测指标;

第三判断单元,用于判断所述产生量最大相对误差预测指标、所述产生量平均绝对百分误差预测指标、所述吸引量最大相对误差预测指标和所述吸引量平均绝对百分误差预测指标是否均在对应的预设范围内,得到第三判断结果;

第一结果确定单元,用于若所述第三判断结果表示是,则确定自回归滑动平均模型的参数不需要调整;

第二结果确定单元,用于若所述第三判断结果表示否,则确定自回归滑动平均模型的参数需要调整。

说明书 :

一种出行生成量预测方法及系统

技术领域

[0001] 本发明涉及交通预测领域,特别是涉及一种出行生成量预测方法及系统。

背景技术

[0002] 居民出行生成量预测是交通需求预测的首要步骤,其预测结果直接制约着后续各阶段的预测精度,对城市交通规划方案的制定有着重要的影响。
[0003] 目前,交通调查是居民出行量生成预测的基础,传统的居民出行调查方法已经非常成熟,但是这些方法普遍存在调查成本高、工作强度大、数据精度低等缺点。在我国城镇
化、机动化快速推进的过程中,城市居民出行行为往往会受到各种新型交通方式的影响,而
在短期内出现局部甚至更大范围的变化,这使得交通调查的数据不具备实时性的要求。被
动式调查即调查出行者携带GPS等设备被动记录出行轨迹,虽然调查的数据满足实时性的
要求,但依赖于GPS等设备和出行者的配合才能完成,使得居民出行生成量预测的便捷程度
大大降低。

发明内容

[0004] 本发明的目的是提供一种出行生成量预测方法及系统,提高出行生成量预测的便捷程度。
[0005] 为实现上述目的,本发明提供了如下方案:
[0006] 一种出行生成量预测方法,包括以下步骤:
[0007] 步骤101:获取来自出行软件的用户出行数据;
[0008] 步骤102:从所述出行数据中筛选不同时间点的出行产生量和出行吸引量,生成出行产生量时间序列和出行吸引量时间序列;出行生成量包括出行产生量和出行吸引量;
[0009] 出行产生量为由家出行的全部家庭端点数,与非由家出行和货物出行的全部起点数之和;出行吸引量为由家出行的全部非家庭端点数,与非由家出行和货物出行的全部终
点数之和;其中
[0010] 出行产生量时间序列表示为:
[0011] Xt={x1,x2,x3,...}
[0012] 出行吸引量时间序列表示为:
[0013] Yt={y1,y2,,y3,...}
[0014] 其中,t表示时间点,xt为第t个时间点的出行产生量,Xt表示出行产生量时间序列,yt为第t个时间点的出行吸引量,Yt表示出行吸引量时间序列;
[0015] 步骤103:将所述出行产生量时间序列和所述出行吸引量时间序列均按时间划分为两段,分别得到参数拟合序列和模型检验序列;
[0016] 步骤104:计算所述出行产生量时间序列和所述出行吸引量时间序列的自相关系数;
[0017] 步骤105:根据所述自相关系数判断所述出行产生量时间序列和所述出行吸引量时间序列是否平稳,得到第二判断结果;
[0018] 步骤106:对所述出行产生量时间序列和所述出行吸引量时间序列进行至少一次差分处理,直到所述出行产生量时间序列和所述出行吸引量时间序列成为平稳序列;差分
处理后确定差分阶数;
[0019] 步骤107:利用所述参数拟合序列建立自回归滑动平均模型;出行生成量时间序列具有一定的周期性、连续性和稳定性,可以通过拟合前期时刻生成量时间序列对未来时刻
生成量时间序列进行预测;
[0020] 步骤108:利用所述模型检验序列判断所述自回归滑动平均模型的参数是否需要调整,得到第一判断结果;
[0021] 步骤109:利用所述模型检验序列对所述自回归滑动平均模型的参数进行调整,并将调整后的所述自回归滑动平均模型确定为预测模型;
[0022] 步骤110:将所述自回归滑动平均模型确定为预测模型;
[0023] 步骤111:利用所述预测模型对未来时刻的出行产生量和出行吸引量进行预测,得到预测出行生成量。
[0024] 本发明的进一步改进在于:所述步骤104,自相关系数计算公式为:
[0025]
[0026]
[0027] 其中,rx(t,t+k)=E(Xt‑EXt)(Xt+k‑EXt+k)为Xt的延迟 k(k=1,2,3,...,n)自协方差函数,ρx(t,t+k)为Xt的延迟k自相关函数, ry(t,t+k)=E(Yt‑EYt)(Yt+k‑EYt+k)为Yt的延迟
k(k=1,2,3,...,n) 自协方差函数,ρy(t,t+k)为Yt的延迟k自相关函数,E、D分别为数学期
望和方差,所述自协方差函数与自相关函数只依赖于时间的延迟长度k,而与时间的起止点
无关。
[0028] 本发明的进一步改进在于:所述步骤105,依据自相关系数判断 Xt和Yt的平稳性,平稳序列通常具有短期相关性,即平稳序列的自相关系数会随着延迟期数k的增加而迅速
衰减为0,随后在0附近波动且逐渐收敛于0,确定延迟期数k的阈值,确定任意k,可取5,随着
k从1增长到5的过程中,若ρ(t,t+k)的值很快趋近于0,则时间序列Xt和Yt为平稳序列,直接
执行步骤107;否则,Xt和Yt为非平稳序列,则执行步骤106,将非平稳序列转化为平稳序列
后,再执行步骤107。
[0029] 本发明的进一步改进在于:所述步骤107具体包括:
[0030] A:建立任意时间点与该时间点的前期值之间的线性函数;
[0031] 确定模型的自回归项,自回归项为出行产生量时间序列和所述出行吸引量时间序列关于当期值和前期值的线性函数;
[0032] B:引入差分阶数和滞后算子,在所述线性函数的基础上建立自回归滑动平均模型;
[0033] C:利用试算法计算所述自回归滑动平均模型的模型阶数;
[0034] D:利用所述参数拟合序列确定所述自回归滑动平均模型的自回归系数和移动平均系数,得到建立好的自回归滑动平均模型。
[0035] 本发明的进一步改进在于:所述步骤108具体包括:
[0036] A:根据所述自回归滑动平均模型计算所述模型检验序列中各个时间点的出行产生预测量 和出行吸引预测量
[0037] B:根据所述出行产生预测量和所述模型检验序列中的出行产生量计算产生量最大相对误差预测指标和产生量平均绝对百分误差预测指标RE;具体为
[0038]
[0039]
[0040] 其中x′T和y′T为检验序列中第T个时间点的出行产生量和吸引量, 和 为对应第T个时间点的出行产生和吸引量预测值,N表示预测样本个数;
[0041] C:根据所述出行吸引预测量和所述模型检验序列中的出行吸引量计算吸引量最大相对误差预测指标和吸引量平均绝对百分误差预测指标MAPE,具体为:
[0042]
[0043]
[0044] D:判断所述产生量最大相对误差预测指标、所述产生量平均绝对百分误差预测指标、所述吸引量最大相对误差预测指标和所述吸引量平均绝对百分误差预测指标是否均在
对应的预设范围内,得到第三判断结果;具体为:
[0045] 判断平均绝对百分误差预测指标RE是否满足RE<15%且平均绝对百分误差预测指标MAPE是否满足MAPE<15%;
[0046] E:若所述第三判断结果表示是,则确定自回归滑动平均模型的参数不需要调整;执行步骤110;
[0047] F:若所述第三判断结果表示否,则确定自回归滑动平均模型的参数需要调整;执行步骤109。
[0048] 本发明的进一步改进在于:所述出行软件主要为手机出行软件,可以是滴滴出行APP、嘀嗒出行APP或其他手机出行软件的一种,所述用户出行数据主要包括出行时间和位
置信息;出行时间和位置信息可以用来确定各出行起点的时间和出行终点的时间。
[0049] 一种出行生成量预测系统,包括以下:
[0050] 数据获取模块201,用于获取来自出行软件的用户出行数据;
[0051] 筛选模块202,用于从所述出行数据中筛选不同时间点的出行产生量和出行吸引量,生成出行产生量时间序列和出行吸引量时间序列;
[0052] 划分模块203,用于将所述出行产生量时间序列和所述出行吸引量时间序列均按时间划分为两段,分别得到参数拟合序列和模型检验序列;
[0053] 相关系数计算模块204,用于计算所述出行产生量时间序列和所述出行吸引量时间序列的自相关系数;
[0054] 第二判断模块205,用于根据所述自相关系数判断所述出行产生量时间序列和所述出行吸引量时间序列是否平稳,得到第二判断结果;
[0055] 差分处理模块206,用于若所述第二判断结果表示否,则对所述出行产生量时间序列和所述出行吸引量时间序列进行至少一次差分处理,直到所述出行产生量时间序列和所
述出行吸引量时间序列成为平稳序列。
[0056] 模型建立模块207,用于利用所述参数拟合序列建立自回归滑动平均模型;
[0057] 第一判断模块208,用于利用所述模型检验序列判断所述自回归滑动平均模型的参数是否需要调整,得到第一判断结果;
[0058] 第一预测模型确定模块209,用于若所述第一判断结果表示是,则利用所述模型检验序列对所述自回归滑动平均模型的参数进行调整,并将调整后的所述自回归滑动平均模
型确定为预测模型;
[0059] 第二预测模型确定模块210,用于若所述第一判断结果表示否,则将所述自回归滑动平均模型确定为预测模型;
[0060] 预测模块211,用于利用所述预测模型对未来时刻的出行产生量和出行吸引量进行预测,得到预测出行生成量。
[0061] 本发明的进一步改进在于:所述模型建立模块207包括:线性函数建立单元,用于建立任意时间点与该时间点的前期值之间的线性函数;
[0062] 模型初建单元,用于引入差分阶数和滞后算子,在所述线性函数的基础上建立自回归滑动平均模型;
[0063] 模型阶数计算单元,用于利用试算法计算所述自回归滑动平均模型的模型阶数;
[0064] 模型系数计算单元,用于利用所述参数拟合序列确定所述自回归滑动平本发明的进一步改进在于:所述第一判断模块208包括:预测量计算单元,用于根据所述自回归滑动
平均模型计算所述模型检验序列中各个时间点的出行产生预测量和出行吸引预测量;
[0065] 产生量指标计算单元,用于根据所述出行产生预测量和所述模型检验序列中的出行产生量计算产生量最大相对误差预测指标和产生量平均绝对百分误差预测指标;
[0066] 吸引量指标计算单元,用于根据所述出行吸引预测量和所述模型检验序列中的出行吸引量计算吸引量最大相对误差预测指标和吸引量平均绝对百分误差预测指标;
[0067] 第三判断单元,用于判断所述产生量最大相对误差预测指标、所述产生量平均绝对百分误差预测指标、所述吸引量最大相对误差预测指标和所述吸引量平均绝对百分误差
预测指标是否均在对应的预设范围内,得到第三判断结果;
[0068] 第一结果确定单元,用于若所述第三判断结果表示是,则确定自回归滑动平均模型的参数不需要调整;
[0069] 第二结果确定单元,用于若所述第三判断结果表示否,则确定自回归滑动平均模型的参数需要调整。
[0070] 本发明公开了以下技术效果:本发明公开的出行生成量预测方法及系统,利用出行软件中数据获取出行产生量时间序列和出行吸引量时间序列,并在此基础上建立自回归
滑动平均模型从而直接完成对未来出行生成量的预测。本发明直接利用出行软件中的数据
即可实现出行生成量的预测,无需依赖于特定的GPS设备,从而能够提高出行生成量预测的
便捷程度。

附图说明

[0071] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施
例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图
获得其他的附图。
[0072] 图1为本发明出行生成量预测方法实施例的方法流程图;
[0073] 图2为本发明出行生成量预测系统实施例的系统结构图。

具体实施方式

[0074] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于
本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他
实施例,都属于本发明保护的范围。
[0075] 本发明的目的是提供一种出行生成量预测方法及系统,提高出行生成量预测的便捷程度。
[0076] 为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
[0077] 图1为本发明出行生成量预测方法实施例的方法流程图。
[0078] 参见图1,该出行生成量预测方法,包括:
[0079] 步骤101:获取来自出行软件的用户出行数据。该出行软件主要为手机出行软件。例如滴滴出行APP、嘀嗒出行APP等。所述用户出行数据主要包括出行时间和位置信息。出行
时间和位置信息可以用来确定各出行起点的时间和出行终点的时间。
[0080] 步骤102:从所述出行数据中筛选不同时间点的出行产生量和出行吸引量,生成出行产生量时间序列和出行吸引量时间序列。出行产生量为由家出行的全部家庭端点数,与
非由家出行和货物出行的全部起点数之和;换句话来说,单位时间内某一个分区的出行产
生量等于家庭端点在这个分区的出家出行数,与起点在这个分区的非由家出行和货物出行
的出行数之和。出行吸引量为由家出行的全部非家庭端点数,与非由家出行和货物出行的
全部终点数之和;或者说,单位时间内一个分区的出行吸引量等于非家庭端点在这个分区
的由家出行数,与终点在这个分区的非由家出行数和货物出行数之和。
[0081] 出行产生量时间序列表示为:
[0082] Xt={x1,x2,x3,}
[0083] 出行吸引量时间序列表示为:
[0084] Yt={y1,y2,,y3,...}
[0085] 其中,t表示时间点,xt为第t个时间点的出行产生量,Xt表示出行产生量时间序列,yt为第t个时间点的出行吸引量,Yt表示出行吸引量时间序列。
[0086] 出行生成量包括出行产生量和出行吸引量。
[0087] 步骤103:将所述出行产生量时间序列和所述出行吸引量时间序列均按时间划分为两段,分别得到参数拟合序列和模型检验序列。本实施例第一预设比例的出行产生量和
出行吸引量划分为参数拟合序列,将第二预设比例的出行产生量和出行吸引量划分为模型
检验序列。第一预设比例大于或等于第二预设比例的3倍,且第二预设比例为除第一预设比
例之外的数据所占的比例。
[0088] 优选的,第一预设比例为90%,第二预设比例为10%。
[0089] 步骤104:计算所述出行产生量时间序列和所述出行吸引量时间序列的自相关系数。自相关系数计算公式为:
[0090]
[0091]
[0092] 其中,rx(t,t+k)=E(Xt‑EXt)(Xt+k‑EXt+k)为Xt的延迟k(k=1,2,3,...,n)自协方差函数,ρx(t,t+k)为Xt的延迟k自相关函数, ry(t,t+k)=E(Yt‑EYt)(Yt+k‑EYt+k)为Yt的延迟k
(k=1,2,3,...,n) 自协方差函数,ρy(t,t+k)为Yt的延迟k自相关函数,E、D分别为数学期望
和方差,所述自协方差函数与自相关函数只依赖于时间的延迟长度k,而与时间的起止点无
关。
[0093] 步骤105:根据所述自相关系数判断所述出行产生量时间序列和所述出行吸引量时间序列是否平稳,得到第二判断结果。
[0094] 依据自相关系数判断Xt和Yt的平稳性,平稳序列通常具有短期相关性,即平稳序列的自相关系数会随着延迟期数k的增加而迅速衰减为0,随后在0附近波动且逐渐收敛于0,
确定延迟期数k的阈值,确定任意k,可取5,随着k从1增长到5的过程中,若ρ(t,t+k)的值很
快趋近于0,则时间序列Xt和Yt为平稳序列,直接执行步骤107;否则,Xt和Yt为非平稳序列,
则执行步骤106,将非平稳序列转化为平稳序列后,再执行步骤107。
[0095] 步骤106:对所述出行产生量时间序列和所述出行吸引量时间序列进行至少一次差分处理,直到所述出行产生量时间序列和所述出行吸引量时间序列成为平稳序列。差分
处理后确定差分阶数。
[0096] 差分阶数d为经过d次差分后使得Xt和Yt由非平稳序列转化为平稳序列,根据实际经验,d可取1或2,差分处理并确定差分阶数d 后,再执行步骤107。
[0097] 步骤107:利用所述参数拟合序列建立自回归滑动平均模型;出行生成量时间序列具有一定的周期性、连续性和稳定性,可以通过拟合前期时刻生成量时间序列对未来时刻
生成量时间序列进行预测。步骤107具体包括:
[0098] A:建立任意时间点与该时间点的前期值之间的线性函数。
[0099] 确定模型的自回归项,自回归项为出行产生量时间序列和所述出行吸引量时间序列关于当期值和前期值的线性函数,即第t个时间点的出行产生量xt可用前期值xt‑1、
xt‑2、...表示,则 同理,第t个时间点的出行吸引量yt可
用前期值yt‑1、yt‑2、...表示,则 实参数 为
自回归系数,也是待估参数,p表示第一模型阶数。
[0100] 引入滞后算子B,滞后算子是将出行产生量和出行吸引量的前期值转为当期值,即将第t‑k时间点的出行产生量和出行吸引量转为第 t个时间点的出行产生量xt和出行吸引
k k
量yt,Bxt=xt‑k, Byt=yt‑k,则自回归项可简写为 其中
移动平均项可简写为 xt=θ(B)uxt,yt=θ(B)
2 q k
uyt,其中θ(B)=1‑θ1B‑θ2B‑...‑θqB ;其中q表示第二模型阶数,B表示往后延迟k时刻系数,
k
表示B的简化函数,θ(B)表示移动平均系数,实参数θ1~θq为θ(B)展开形式的各项系
数。
[0101] 依据自回归项、移动平均项、差分阶数d以及滞后算子B建立预测模型,具体为:确定预测模型的线性函数,第T个时间点的出行生成量预测值同样可以表示为其与前期值以
及前期的随机误差所组成的线性函数,将该线性函数确定为预测模型的线性函数,即
[0102]
[0103]
[0104] B:引入差分阶数和滞后算子,在所述线性函数的基础上建立自回归滑动平均模型。
[0105] 预测模型的线性函数为(p,q)阶的自回归移动平均模型,根据模型的定义,确定预测模型,在预测模型的线性函数的基础上引入滞后算子B和差分阶数d,则预测第T个时间点
的出行产生量xt和出行吸引量yt的预测模型可简写为 和
[0106] C:利用试算法计算所述自回归滑动平均模型的模型阶数。
[0107] 利用试算法确定模型的模型阶数。模型阶数包括第一模型阶数p 和第二模型阶数q,具体为p=n,q=n‑1,采用试算法,由n=1开始确定第一模型阶数p和第二模型阶数q。
[0108] D:利用所述参数拟合序列确定所述自回归滑动平均模型的自回归系数和移动平均系数,得到建立好的自回归滑动平均模型。
[0109] 利用参数拟合序列确定预测模型的自回归系数 和移动平均系数θ,具体为:基于参数拟合序列,并利用MATLAB软件确定模型待估参数 和θ。
[0110] 将确定所述模型阶数p和q、所述差分阶数d、所述自回归系数 和所述移动平均系数θ后的预测模型确定为自回归滑动平均模型。
[0111] 步骤108:利用所述模型检验序列判断所述自回归滑动平均模型的参数是否需要调整,得到第一判断结果。该步骤108具体包括:
[0112] A:根据所述自回归滑动平均模型计算所述模型检验序列中各个时间点的出行产生预测量 和出行吸引预测量
[0113] B:根据所述出行产生预测量和所述模型检验序列中的出行产生量计算产生量最大相对误差预测指标和产生量平均绝对百分误差预测指标RE;具体为
[0114]
[0115]
[0116] 其中x′T和y′T为检验序列中第T个时间点的出行产生量和吸引量, 和 为对应第T个时间点的出行产生和吸引量预测值,N表示预测样本个数。
[0117] C:根据所述出行吸引预测量和所述模型检验序列中的出行吸引量计算吸引量最大相对误差预测指标和吸引量平均绝对百分误差预测指标MAPE,具体为:
[0118]
[0119]
[0120] D:判断所述产生量最大相对误差预测指标、所述产生量平均绝对百分误差预测指标、所述吸引量最大相对误差预测指标和所述吸引量平均绝对百分误差预测指标是否均在
对应的预设范围内,得到第三判断结果;具体为:
[0121] 具体为:判断平均绝对百分误差预测指标RE是否满足RE<15%且平均绝对百分误差预测指标MAPE是否满足MAPE<15%。
[0122] E:若所述第三判断结果表示是,则确定自回归滑动平均模型的参数不需要调整;
[0123] F:若所述第三判断结果表示否,则确定自回归滑动平均模型的参数需要调整。
[0124] 若不需要调整,执行步骤110。若需要调整,执行步骤109。
[0125] 步骤109:利用所述模型检验序列对所述自回归滑动平均模型的参数进行调整,并将调整后的所述自回归滑动平均模型确定为预测模型;具体为:重新调整第一模型阶数p、
第二模型阶数q,令n的值加1,更新预测模型直到满足RE和MAPE要求。
[0126] 步骤110:将所述自回归滑动平均模型确定为预测模型。
[0127] 步骤111:利用所述预测模型对未来时刻的出行产生量和出行吸引量进行预测,得到预测出行生成量。
[0128] 本实施例中的出行生成量预测方法,考虑到利用手机APP出行数据的时空变化规律,基于时间序列理论,利用手机APP大量的位置服务数据并通过差分处理将原始时间序列
平稳后,采用ARMA (autoregressive moving average model,自回归滑动平均模型) 实现
了出行生成量预测,能够满足手机APP出行数据时空变化的短期预测,并取得较好的预测精
度,为交通规划、交通管理等政策的制定提供经验和参考。
[0129] 图2为本发明出行生成量预测系统实施例的系统结构图。
[0130] 参见图2,该出行生成量预测系统,包括:
[0131] 数据获取模块201,用于获取来自出行软件的用户出行数据;
[0132] 筛选模块202,用于从所述出行数据中筛选不同时间点的出行产生量和出行吸引量,生成出行产生量时间序列和出行吸引量时间序列;
[0133] 划分模块203,用于将所述出行产生量时间序列和所述出行吸引量时间序列均按时间划分为两段,分别得到参数拟合序列和模型检验序列;
[0134] 自相关系数计算模块204,用于计算所述出行产生量时间序列和所述出行吸引量时间序列的自相关系数;
[0135] 第二判断模块205,用于根据所述自相关系数判断所述出行产生量时间序列和所述出行吸引量时间序列是否平稳,得到第二判断结果;
[0136] 差分处理模块206,用于若所述第二判断结果表示否,则对所述出行产生量时间序列和所述出行吸引量时间序列进行至少一次差分处理,直到所述出行产生量时间序列和所
述出行吸引量时间序列成为平稳序列。
[0137] 模型建立模块207,用于利用所述参数拟合序列建立自回归滑动平均模型;
[0138] 第一判断模块208,用于利用所述模型检验序列判断所述自回归滑动平均模型的参数是否需要调整,得到第一判断结果;
[0139] 第一预测模型确定模块209,用于若所述第一判断结果表示是,则利用所述模型检验序列对所述自回归滑动平均模型的参数进行调整,并将调整后的所述自回归滑动平均模
型确定为预测模型;
[0140] 第二预测模型确定模块210,用于若所述第一判断结果表示否,则将所述自回归滑动平均模型确定为预测模型;
[0141] 预测模块211,用于利用所述预测模型对未来时刻的出行产生量和出行吸引量进行预测,得到预测出行生成量。
[0142] 可选的,所述模型建立模块207包括:
[0143] 线性函数建立单元,用于建立任意时间点与该时间点的前期值之间的线性函数;
[0144] 模型初建单元,用于引入差分阶数和滞后算子,在所述线性函数的基础上建立自回归滑动平均模型;
[0145] 模型阶数计算单元,用于利用试算法计算所述自回归滑动平均模型的模型阶数;
[0146] 模型系数计算单元,用于利用所述参数拟合序列确定所述自回归滑动平均模型的自回归系数和移动平均系数,得到建立好的自回归滑动平均模型。
[0147] 可选的,所述第一判断模块208包括:
[0148] 预测量计算单元,用于根据所述自回归滑动平均模型计算所述模型检验序列中各个时间点的出行产生预测量和出行吸引预测量;
[0149] 产生量指标计算单元,用于根据所述出行产生预测量和所述模型检验序列中的出行产生量计算产生量最大相对误差预测指标和产生量平均绝对百分误差预测指标;
[0150] 吸引量指标计算单元,用于根据所述出行吸引预测量和所述模型检验序列中的出行吸引量计算吸引量最大相对误差预测指标和吸引量平均绝对百分误差预测指标;
[0151] 第三判断单元,用于判断所述产生量最大相对误差预测指标、所述产生量平均绝对百分误差预测指标、所述吸引量最大相对误差预测指标和所述吸引量平均绝对百分误差
预测指标是否均在对应的预设范围内,得到第三判断结果;
[0152] 第一结果确定单元,用于若所述第三判断结果表示是,则确定自回归滑动平均模型的参数不需要调整;
[0153] 第二结果确定单元,用于若所述第三判断结果表示否,则确定自回归滑动平均模型的参数需要调整。
[0154] 根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明公开的出行生成量预测方法及系统,利用出行软件中数据获取出行产生量时间序列和出行吸引量时间
序列,并在此基础上建立自回归滑动平均模型从而直接完成对未来出行生成量的预测。本
发明直接利用出行软件(手机中用于出行的app,例如滴滴)中的数据即可实现出行生成量
的预测,无需依赖于特定的GPS设备,从而能够提高出行生成量预测的便捷程度。
[0155] 本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统
而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说
明即可。
[0156] 本文中应用了具体个例对本发明的原理及实施方式进行了阐述,
[0157] 以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;
[0158] 同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。