人口流动模拟预测方法、装置、设备及介质转让专利

申请号 : CN202110543669.5

文献号 : CN112990613B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 赵鹏军胡昊宇庞亮万丹张听雨

申请人 : 北京大学

摘要 :

本公开涉及一种人口流动模拟预测方法、装置、设备及介质,其中,所述方法包括:对往年人流数据进行特征提取得到流量数据;对所述流量数据进行流量二元分解得到节假日流量以及日常性流量;根据二元分解后的所述节假日流量和所述日常性流量分别进行模型构建得到初步预测模型;对模型构建后的所述初步预测模型进行叠加得到初步预测结果;对所述初步预测结果结合实时人流数据进行再次预测得到实时预测结果。本公开的基于长序列手机信令大数据预测人口流动的方法相对于现有技术能够取得较好的预测效果。

权利要求 :

1.一种基于长时序信令大数据的人口流动模拟预测方法,其特征在于,包括:对往年人流数据进行特征提取得到流量数据;

对所述流量数据进行流量二元分解得到节假日流量以及日常性流量;

所述对所述流量数据进行流量二元分解得到节假日流量以及日常性流量具体包括:根据公式

和公式

对所述流量数据进行二元分解得到节假日流量以及日常性流量;

公式中,t表示时刻, 表示t时刻的流量数据的总流量, 表示二元分解后的t时刻的从第一城市i到第二城市j的日常性流量, 表示二元分解后的t时刻的从第一城市i到第二城市j的节假日流量,i表示第一城市,j表示第二城市, 表示t时刻的从第一城市i到第二城市j的流量, 表示t时刻的从第二城市j到第一城市i的流量,n表示第一城市和第二城市的城市数量,n为大于等于2的正整数;

根据二元分解后的所述节假日流量和所述日常性流量分别进行模型构建得到两个初步预测模型;

对模型构建后的两个所述初步预测模型进行叠加得到初步预测结果;

对所述初步预测结果结合实时人流数据进行再次预测得到实时预测结果;

所述初步预测模型包括:

耗散模型和汇聚模型,其中所述耗散模型表示当前时刻t的从第一城市i到第二城市j以及从第二城市j到第一城市i的流量动态平衡处于从第一城市i人员流出的状态;所述汇聚模型表示当前时刻t的从第一城市i到第二城市j以及从第二城市j到第一城市i的流量动态平衡处于向第一城市i人员流入的状态;

在春运期间节假日流量主要表现为返乡返工流量,根据返乡和返工行为特征进一步分为5个阶段:耗散阶段1、耗散阶段2、汇聚阶段1、汇聚阶段2、汇聚阶段3;

其中,对耗散阶段1建立如下模型:公式中,t表示时刻,t0表示该阶段的起始时刻,i表示第一城市,j表示第二城市,表示从第一城市i到第二城市j的返乡总流量, 表示t时刻从第一城市i到第二城市j应返乡但尚未返乡的流量, 表示t时刻从第一城市i到第二城市j的返乡流量,表示模型待估参数,表示随机误差项;

对汇聚阶段2和汇聚阶段3建立类似的模型:公式中,t表示时刻,t3及t4表示相应阶段的起始时刻,i表示第一城市,j表示第二城市, 和 表示t时刻从第一城市i到第二城市j在相应阶段应返乡但尚未返乡的流量, 和 表示t时刻从第一城市i到第二城市j在相应阶段的返乡流量,和 表示模型待估参数。

2.根据权利要求1所述的方法,其特征在于,所述人流数据具体包括:手机信令数据和地理信息数据,其中,所述手机信令数据包括手机与通讯基站之间的通信记录数据。

3.根据权利要求1 2任一项中所述的方法,其特征在于,所述方法还包括:~

根据常住人口和地理距离对所述实时预测结果进行重力模型校核。

4.一种基于长时序信令大数据的人口流动模拟预测装置,其特征在于,包括:特征提取模块,用于对往年人流数据进行特征提取得到流量数据;

二元分解模块,用于对所述流量数据进行流量二元分解得到节假日流量以及日常性流量;

所述二元分解模块具体根据公式和公式

对所述流量数据进行二元分解得到节假日流量以及日常性流量;

公式中,t表示时刻, 表示t时刻的流量数据的总流量, 表示二元分解后的t时刻的从第一城市i到第二城市j日常性流量, 表示二元分解后的t时刻的从第一城市i到第二城市j的节假日流量,i表示第一城市,j表示第二城市, 表示t时刻的从第一城市i到第二城市j的流量, 表示t时刻的从第二城市j到第一城市i的流量,n表示第一城市和第二城市的城市数量,n为大于等于2的正整数;

模型构建模块,用于根据二元分解后的所述节假日流量和所述日常性流量分别进行模型构建得到两个初步预测模型;

初步预测模块,用于对模型构建后的两个所述初步预测模型进行叠加得到初步预测结果;

再次预测模块,用于对所述初步预测结果结合实时人流数据进行再次预测得到实时预测结果;

所述初步预测模型具体包括:

耗散模型和汇聚模型,其中所述耗散模型表示当前时刻t的从第一城市i到第二城市j以及从第二城市j到第一城市i的流量动态平衡处于从第一城市i人员流出的状态;所述汇聚模型表示当前时刻t的从第一城市i到第二城市j以及从第二城市j到第一城市i的流量动态平衡处于向第一城市i人员流入的状态;

在春运期间节假日流量主要表现为返乡返工流量,根据返乡和返工行为特征进一步分为5个阶段:耗散阶段1、耗散阶段2、汇聚阶段1、汇聚阶段2、汇聚阶段3;

其中,对耗散阶段1建立如下模型:公式中,t表示时刻,t0表示该阶段的起始时刻,i表示第一城市,j表示第二城市,表示从第一城市i到第二城市j的返乡总流量, 表示t时刻从第一城市i到第二城市j应返乡但尚未返乡的流量, 表示t时刻从第一城市i到第二城市j的返乡流量,表示模型待估参数,表示随机误差项;

对汇聚阶段2和汇聚阶段3建立类似的模型:公式中,t表示时刻,t3及t4表示相应阶段的起始时刻,i表示第一城市,j表示第二城市, 和 表示t时刻从第一城市i到第二城市j在相应阶段应返乡但尚未返乡的流量, 和 表示t时刻从第一城市i到第二城市j在相应阶段的返乡流量,和 表示模型待估参数。

5.根据权利要求4所述的装置,其特征在于,所述人流数据具体包括:手机信令数据和地理信息数据,其中,所述手机信令数据包括手机与通讯基站之间的通信记录数据。

6.根据权利要求4 5任一项中所述的装置,其特征在于,还包括:~

重力模型校核模块,用于根据常住人口和地理距离对所述实时预测结果进行重力模型校核。

7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现权利要求1 3任一项中所述的基于长时序信令大数~

据的人口流动模拟预测方法。

8.一种计算机存储介质,其上存储有计算机程序指令,其特征在于,所述程序指令被处理器执行时用于实现权利要求1 3任一项中所述的基于长时序信令大数据的人口流动模拟~

预测方法。

说明书 :

人口流动模拟预测方法、装置、设备及介质

技术领域

[0001] 本公开涉及互联网技术领域,更为具体来说,本公开涉及人口流动模拟预测方法、装置、设备及介质。

背景技术

[0002] 为连续观测春运期间全国人口流动情况,百度、腾讯等互联网公司通过向用户提供空间定位服务,从而获取人口流动的轨迹及其特征。LBS技术是指借助网络运营商提供的
无线电通讯网络,或者通过外部定位方式,采集移动终端用户的空间位置(如地理坐标),向
用户提供与位置服务相关的增值业务。当人们允许各类平台的手机应用程序APP调用LBS服
务时,即可通过定位信息刻画出用户的移动轨迹。利用该项技术,可以动态展示春运期间国
内城市间的人口流动情况。
[0003] 第一,既有技术仅利用大数据进行了人口流动现状格局的分析,大数据应用主要停留在展示层面,未能提取人口流动的时空变化过程的一般规律,没有实现对未来人口流
动的预测功能。第二,LBS服务需要终端用户主动发起服务请求后,才能获得相关时空数据。
提供该服务的平台数量众多,因此数据覆盖程度有待提升,大量空间流动行为未能有效记
录。第三,该项技术获取的数据没有用户ID信息,因此无法识别用户的完整出行,只是统计
城市间的人口流动量。大部分的出行被拆解,未被完整识别,如从A地出发到最终目的地B地
途径了C地,同时用户在C地也有定位信息,此次出行会被拆解为A‑C和C‑B两次出行。
[0004] 基于多元线性回归的重大节假日OD交通量预测的技术方法采用高速公路联网收费产生的出口流水数据,综合考虑影响高速公路出行的多种因素,利用往年数据,构建多元
线性回归模型,对节假日范围内的区域总OD需求进行预测,再基于历史各日占总量的比例
将所预测的总量分配到各日,得到重大节假日各日的交通OD量预测。
[0005] 基于多元线性回归的重大节假日OD交通量预测方法虽然简单有效,具有一定的合理性,但多元模型中的解释变量的确定依赖经验判断和主观选择,解释变量的选择会对预
测效果产生一定的影响。此外,该方法所采用的高速公路出口流水数据只能反映重大节假
日期间高速公路单一交通方式的OD流量,而不能反映综合多种交通方式的节假日期间人口
流动OD量。且该预测方法多适用于范围较小的预测区域,对于较大范围,如全国的交通OD量
预测,该方法的计算过程将较为庞杂。

发明内容

[0006] 为提供一种应用便捷、准确率高、稳定性强的基于手机信令大数据预测人口流动数量与特征的方法的问题以解决现有技术的人口流动预测方法不能满足实际需求的技术
问题。
[0007] 为实现上述技术目的,本公开提供了一种基于长时序信令大数据的人口流动模拟预测方法,包括:
[0008] 对往年人流数据进行特征提取得到流量数据;
[0009] 对所述流量数据进行流量二元分解得到节假日流量以及日常性流量;
[0010] 根据二元分解后的所述节假日流量和所述日常性流量分别进行模型构建得到两个初步预测模型;
[0011] 对模型构建后的两个所述初步预测模型进行叠加得到初步预测结果;
[0012] 对所述初步预测结果结合实时人流数据进行再次预测得到实时预测结果。
[0013] 进一步,所述人流数据具体包括:
[0014] 手机信令数据和地理信息数据,其中,所述手机信令数据包括手机与通讯基站之间的通信记录数据。
[0015] 进一步,所述对所述流量数据进行流量二元分解得到节假日流量以及日常性流量包括:
[0016] 根据公式
[0017] 和公式
[0018]
[0019] 对所述流量数据进行二元分解得到节假日流量以及日常性流量;
[0020] 公式中,t表示时刻, 表示t时刻的流量数据的总流量, 表示二元分解后的t时刻的从第一城市i到第二城市j的日常性流量, 表示二元分解后的t时刻的从第一
城市i到第二城市j的节假日流量,i表示第一城市,j表示第二城市, 表示t时刻的从第一
城市i到第二城市j的流量, 表示t时刻的从第二城市j到第一城市i的流量,n为大于等于
2的正整数。
[0021] 进一步,所述初步预测模型具体包括:
[0022] 耗散模型和汇聚模型,其中所述耗散模型表示当前时刻t的从第一城市i到第二城市j以及从第二城市j到第一城市i的流量动态平衡处于从第一城市i人员流出的状态;所述
汇聚模型表示当前时刻t的从第一城市i到第二城市j以及从第二城市j到第一城市i的流量
动态平衡处于向第一城市i人员流入的状态。
[0023] 进一步,所述方法还包括:
[0024] 根据常住人口和地理距离对所述实时预测结果进行重力模型校核。
[0025] 为实现上述技术目的,本公开还能够提供一种基于长时序信令大数据的人口流动模拟预测装置,包括:
[0026] 特征提取模块,用于对往年人流数据进行特征提取得到流量数据;
[0027] 二元分解模块,用于对所述流量数据进行流量二元分解得到节假日流量以及日常性流量;
[0028] 模型构建模块,用于根据二元分解后的所述节假日流量和所述日常性流量分别进行模型构建得到初步预测模型;
[0029] 初步预测模块,用于对模型构建后的所述初步预测模型进行叠加得到初步预测结果;
[0030] 再次预测模块,用于对所述初步预测结果结合实时人流数据进行再次预测得到实时预测结果。
[0031] 进一步,
[0032] 所述二元分解模块具体根据公式
[0033] 和公式
[0034]
[0035] 对所述流量数据进行二元分解得到节假日流量以及日常性流量;
[0036] 公式中,t表示时刻, 表示t时刻的流量数据的总流量, 表示二元分解后的t时刻的从第一城市i到第二城市j的日常性流量, 表示二元分解后的t时刻的从第
一城市i到第二城市j的节假日流量,i表示第一城市,j表示第二城市, 表示t时刻的从
第一城市i到第二城市j的流量, 表示t时刻的从第二城市j到第一城市i的流量,n为大
于等于2的正整数。
[0037] 进一步,所述初步预测模型具体包括:
[0038] 耗散模型和汇聚模型,其中所述耗散模型表示当前时刻t的从第一城市i到第二城市j以及从第二城市j到第一城市i的流量动态平衡处于从第一城市i人员流出的状态;所述
汇聚模型表示当前时刻t的从第一城市i到第二城市j以及从第二城市j到第一城市i的流量
动态平衡处于向第一城市i人员流入的状态。
[0039] 为实现上述技术目的,本公开还能够提供一种计算机存储介质,其上存储有计算机程序,计算机程序被处理器执行时用于实现上述的基于长时序信令大数据的人口流动模
拟预测方法的步骤。
[0040] 为实现上述技术目的,本公开还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序实时现上述的基于
长时序信令大数据的人口流动模拟预测方法的步骤。
[0041] 本公开的有益效果为:
[0042] 手机信令大数据具有样本量大、时效性强、覆盖范围广、获取成本低、时空粒度精细等优势特征,能够克服传统数据在样本量和实效性方面的局限性。手机信令数据在刻画
人口流动时空特征方面已受到越来越多的关注和应用,但针对人口流动预测的应用还较
少。本技术构建了基于手机信令大数据的“大尺度人口时空流动态预测模型”(Population 
Temporal‑Spatial Flow Dynamic Prediction Model for Large Scale, PFDM),模型依
据春运期间人口流动的属性特征和时间特征,进行分段建模:针对春运期间人口流动的属
性特征,在模型预测中对人口流动量进行分解,对节假日流量和日常流量分别建立预测模
型。该项技术还应用重力模型进行预测量的检验和校正,提出基于手机信令大数据的城市
间人口流OD分布重力模型检验技术(Population  Flow Origin‑Destination 
Distribution Gravity Model, PFGM)。基于人口分布和地理空间的交互作用关系理论,构
建全国尺度城市间的人口流动OD分布重力模型,采用手机信令大数据进行模型计算与关键
参数标定,对PFDM预测结果进行检验和校正,进一步提高了预测精度。

附图说明

[0043] 图1示出了本公开的实施例1的流程示意图;
[0044] 图2示出了本公开的实施例1的优选实施方式的流程示意图;
[0045] 图3示出了本公开的实施例1的优选实施方式的流程示意图;
[0046] 图4示出了本公开的实施例1的优选实施方式的流程示意图;
[0047] 图5示出了本公开的实施例1的优选实施方式的流程示意图;
[0048] 图6示出了本公开的实施例1的优选实施方式的流程示意图;
[0049] 图7示出了本公开的实施例1的五轮预测结果图;
[0050] 图8示出了本公开的实施例1的预测结果与实际情况示意图;
[0051] 图9示出了城市间人口流动OD格局预测结果示意图;
[0052] 图10示出了城市间人口流动OD格局实际结果示意图;
[0053] 图11示出了城市流入流出预测结果示意图;
[0054] 图12示出了城市流入流出实际结果示意图;
[0055] 图13示出了城市群人口流出分布预测结果示意图;
[0056] 图14示出了城市群人口流出分布实际结果示意图;
[0057] 图15示出了本公开的实施例2的结构示意图;
[0058] 图16示出了本公开的实施例4的结构示意图。

具体实施方式

[0059] 以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以
避免不必要地混淆本公开的概念。
[0060] 在附图中示出了根据本公开实施例的各种结构示意图。这些图并非是按比例绘制的,其中为了清楚表达的目的,放大了某些细节,并且可能省略了某些细节。图中所示出的
各种区域、层的形状以及它们之间的相对大小、位置关系仅是示例性的,实际中可能由于制
造公差或技术限制而有所偏差,并且本领域技术人员根据实际所需可以另外设计具有不同
形状、大小、相对位置的区域/层。
[0061] 实施例一:
[0062] 如图1所示:
[0063] 本公开提供了一种基于长时序信令大数据的人口流动模拟预测方法,包括:
[0064] S101:对往年人流数据进行特征提取得到流量数据;
[0065] S102:对所述流量数据进行流量二元分解得到节假日流量以及日常性流量;
[0066] S103:根据二元分解后的所述节假日流量和所述日常性流量分别进行模型构建得到两个初步预测模型;
[0067] S104:对模型构建后的两个所述初步预测模型进行叠加得到初步预测结果;
[0068] S105:对所述初步预测结果结合实时人流数据进行再次预测得到实时预测结果。
[0069] 进一步,所述人流数据具体包括:
[0070] 手机信令数据和地理信息数据,其中,所述手机信令数据包括手机与通讯基站之间的通信记录数据。
[0071] 进一步,所述对所述流量数据进行流量二元分解得到节假日流量以及日常性流量包括:
[0072] 根据公式
[0073] 和公式
[0074]
[0075] 对所述流量数据进行二元分解得到节假日流量以及日常性流量;
[0076] 公式中,t表示时刻, 表示t时刻的流量数据的总流量, 表示二元分解后的t时刻的从第一城市i到第二城市j的日常性流量, 表示二元分解后的t时刻的从
第一城市i到第二城市j的节假日流量,i表示第一城市,j表示第二城市, 表示t时刻的从
第一城市i到第二城市j的流量, 表示t时刻的从第二城市j到第一城市i的流量,n为大于
等于2的正整数。
[0077] 进一步,所述初步预测模型包括:
[0078] 耗散模型和汇聚模型,其中所述耗散模型表示当前时刻t的从第一城市i到第二城市j以及从第二城市j到第一城市i的流量动态平衡处于从第一城市i人员流出的状态;所述
汇聚模型表示当前时刻t的从第一城市i到第二城市j以及从第二城市j到第一城市i的流量
动态平衡处于向第一城市i人员流入的状态,n表示第一城市和第二城市的城市数量,n为大
于等于2的正整数。
[0079] 进一步,所述方法还包括:
[0080] 根据常住人口和地理距离对所述实时预测结果进行重力模型校核。
[0081] 如图2 图6所示,示出了本公开的实施例1的优选实施方式的流程示意图:~
[0082] 对往年人流数据进行特征提取得到流量数据;
[0083] 对所述流量数据进行流量二元分解得到节假日流量以及日常性流量;
[0084] ①节假日性流量与日常性流量的分解
[0085] 在春运期间,节假日性流量主要表现为返乡返工流量。将春运期间城市间人口流动规模,分解为返乡返工流量 与日常性流量 :
[0086]
[0087]
[0088] 分解的基本原则是:城市i至城市j和城市j至城市i的流量在日常时段内通常是保持着一种动态平衡的状态,即在一定的时间周期内应该趋近于相等,形成一种相对稳定的
有序结构,预测中将这一部分作为城市间固有的日常流量;而在春运期间,由于存在返乡和
返工的过程,这种动态平衡在短期内被打破了,即城市对之间存在或大或小的净流出和净
流入的关系,预测中将这一部分作为春运期间返乡返工的流量。
[0089] ②对两类流量的预测
[0090] 将返乡返工流量分为返乡和返工两个阶段,根据返乡和返工行为特征进一步分为5个阶段:耗散阶段1、耗散阶段2、汇聚阶段1、汇聚阶段2、汇聚阶段3。
[0091] 其中,对耗散阶段1建立如下模型:
[0092]
[0093]
[0094]
[0095]
[0096] 公式中,t表示时刻,t0表示该阶段的起始时刻,i表示第一城市,j表示第二城市,表示从第一城市i到第二城市j的返乡总流量, 表示t时刻从第一城市i到第
二城市j应返乡但尚未返乡的流量, 表示t时刻从第一城市i到第二城市j的返乡流量,
表示模型待估参数,表示随机误差项。
[0097] 同理,可以对汇聚阶段2和汇聚阶段3建立类似的模型:
[0098]
[0099]
[0100] 公式中,t表示时刻,t3及t4表示相应阶段的起始时刻,i表示第一城市,j表示第二城市, 和 表示t时刻从第一城市i到第二城市j在相应阶段应返乡但尚未
返乡的流量, 和 表示t时刻从第一城市i到第二城市j在相应阶段的返乡流量,
和 表示模型待估参数。
[0101] 对于耗散阶段2和汇聚阶段1,受到除夕阶段干扰,时间较短。对于日常流量,规模变化相对稳定。对这些阶段均采用线性模型。日常流量的模型为:
[0102]
[0103] 公式中,t表示时刻,T表示该阶段的起始时刻,i表示第一城市,j表示第二城市,表示t时刻从第一城市i到第二城市j的日常流量, 表示观测期内从第一城市i到
第二城市j的日常流量均值, 和 表示模型待估参数,表示随机误差项。
[0104] 对两类流量分别建立不同的预测模型并求解,得到无疫情影响下的两类流量预测结果。针对返乡返工流量,结合从手机信令数据发现的一般时间变化规律,划分为2个耗散
阶段和3个汇聚阶段。在耗散阶段,外来务工人员从务工地返回家乡所在地,其中第一个子
阶段为春运开始至春运返乡高峰,第二个子阶段为春运返程高峰至除夕;在汇聚阶段,外来
务工人员从家乡所在地返回汇聚阶段,其中第一个子阶段为大年初一至春运返工高峰,第
二个子阶段为春运返工高峰至元宵节,第三个子阶段为元宵节之后至春运结束。针对城市
间日常流量,结合规律划分时间段,建立流量与时间的线性拟合关系。
[0105] ③疫情影响因素的衰减
[0106] 考虑疫情影响,人口流动规模可能缩减。
[0107]
[0108] 公式中,t表示时刻,i表示第一城市,j表示第二城市, 表示t时刻从第一城市i到第二城市j的流量预测结果, 表示t时刻从第一城市i到第二城市j的流量预测第
一次修正后结果, 和 分别表示第一城市i和第二城市j的疫情影响衰减因子,表示全
局疫情影响衰减因子。
[0109] 考虑中高风险区的管控和隔离政策,相关城市的人口流动规模进一步缩减。
[0110]
[0111] 公式中,t表示时刻,i表示第一城市,j表示第二城市, 表示t时刻从第一城市i到第二城市j的流量预测第一次修正后结果, 表示t时刻从第一城市i到第二城市
j的流量预测第二次修正后结果, 和 分别表示第一城市i和第二城市j的政策影响衰
减因子。
[0112] 基于今年年初全国流量数据、去年及前年节假日全国流量数据的综合分析,从全国流量、局部流量两个方面分析疫情爆发、中高风险管控等不同情景的影响,并考虑提前返
乡、就地过年等新现象的影响,给予此类情境涉及到的城市不同的衰减因子,得到特定疫情
情境下的流量预测结果。
[0113] ④基于重力模型的校核
[0114] 由于部分距离较远的中小城市间人口流动规模随机波动性较大,采用上述模型预测结果产生了部分离群的极端值,因此采用重力模型进行进一步的校核:
[0115]
[0116] 公式中,t表示时刻,i表示第一城市,j表示第二城市, 表示t时刻从第一城市i到第二城市j的流量预测第二次修正后结果, 表示t时刻从第一城市i到第二城
市j的流量预测第三次修正后结果, 和 分别表示第一城市i和第二城市j的常住人口规
模, 表示第一城市i和第二城市j之间的地理距离,k表示重力模型参数。
[0117] 基于全国城市的人口规模和地理空间关系,构建全国城市间的重力模型,结合预测结果对重力模型相关参数做出估计。采用重力模型的原因是,部分相距较远的中小城市
间流量随时间的随机性波动较大,采用重力模型可以修正由随机性波动造成的耗散过程参
数异常。以重力模型结果与原预测结果进行比对,将超出阈值的部分调整至符合重力模型
结果,校核调整得到最终的流量预测结果。
[0118] 根据二元分解后的所述节假日流量和所述日常性流量分别进行模型构建得到初步预测模型;
[0119] 对模型构建后的所述初步预测模型进行叠加得到初步预测结果;
[0120] 对所述初步预测结果结合实时人流数据进行再次预测得到实时预测结果。
[0121] (3)动态调整方法
[0122] 随着春运的进行,可以不断获取新的手机信令数据,利用新的信令数据对原有结果不断调整。对于每个城市而言,新获取的数据和上一轮预测的数值进行对比,可以得到新
的动态调整系数:
[0123]
[0124] 公式中, 表示城市的动态调整系数,m和m+1分别用以标记上一轮和当前轮次预测, 和 分别表示城市的人口总流出量和人口总流入量,t和tt分别表示当前轮次更新
数据的开始时刻和结束时刻。
[0125] 动态调整的重要性在于可以不断修正预测结果,提高预测精度,增强预测的可靠性。高频率多次引入新数据,能够有效的捕捉到最新发展趋势,便于辅助决策。在2021年春
运人口流动模拟预测中,经过五轮动态预测,最终实现预测模型的自我纠偏。
[0126] 本公开具有如下重要意义:
[0127] (1)技术创新
[0128] 手机信令大数据具有样本量大、时效性强、覆盖范围广、获取成本低、时空粒度精细等优势特征,能够克服传统数据在样本量和实效性方面的局限性。手机信令数据在刻画
人口流动时空特征方面已受到越来越多的关注和应用,但针对人口流动预测的应用还较
少。本技术构建了基于手机信令大数据的“大尺度人口时空流动态预测模型”(Population 
Temporal‑Spatial Flow Dynamic Prediction Model for Large Scale, PFDM),模型依
据春运期间人口流动的属性特征和时间特征,进行分段建模:针对春运期间人口流动的属
性特征,在模型预测中对人口流动量进行分解,对节假日流量和日常流量分别建立预测模
型。该项技术同时考虑到疫情对春运的影响,提出人口流动的新冠疫情影响因子(Covid‑19 
Factor),根据今年年初、疫情爆发年和正常年份的节假日全国综合流量数据,分析疫情爆
发、风险区管控、提前返乡等因素对局部和全域人口流动的影响,根据疫情波及情况,对于
不同城市设置不同的衰减因子,将疫情对春运人口流动的影响纳入模型预测中。该项技术
还应用重力模型进行预测量的检验和校正,提出基于手机信令大数据的城市间人口流OD分
布重力模型检验技术(Population Flow Origin‑Destination Distribution Gravity 
Model, PFGM)。基于人口分布和地理空间的交互作用关系理论,构建全国尺度城市间的人
口流动OD分布重力模型,采用手机信令大数据进行模型计算与关键参数标定,对PFDM预测
结果进行检验和校正,进一步提高了预测精度。
[0129] (2)政策意义
[0130] 合理规划交通线网与枢纽建设、运营与管理,有效缓解特殊情况下交通系统运行压力,是提升交通系统韧性,建设交通强国的要求。提高交通系统运力,支撑春运期间人口
流动需求,是推进新型城镇化,提升交通质量的要求。2021年1月28日,在交通运输部例行新
闻发布会上,交通运输部表示将指导部署各地交通运输部门在做好疫情防控的前提下,统
筹做好路网保通保畅等相关工作;加强运输监测,特别是对重要运输通道、旅游风景点周边
道路的运行监测;密切关注天气变化,做好恶劣天气公路交通突发事件应急处置保畅保通
工作;做好风险路段排查和整治,完善风险等级较高路段安全防护措施。利用手机信令大数
据,结合疫情等突发重大事件,对春运期间全国人口流动数量时空特征进行预测,有助于交
通运输部门提前做好应对预案,保障春运期间交通运力支持,为春运期间疫情防控政策与
交通政策提供参考。
[0131] (3)社会经济意义
[0132] 把握全国大尺度的人口流动时空特征和内在规律,有助于识别我国城镇化空间格局特征,了解全国流动人口分布与迁移情况,有助于解读区域发展水平,从出行角度分析我
国城市网络特征。预测人口流动的时空特征,有助于为相关企事业单位和个人采取错峰出
行提供参考,优化社会经济资源空间配置和利用,提高区域经济发展效益。春运是全国规模
最大、持续时间最长、周期性最强的迁徙活动。
[0133] 基于长序列手机信令大数据预测春运人口流动的效果较好。在春运40天中,为了更加精确地模拟预测人流的动态变化过程,在第一轮预测的基础上,后续再进行四轮动态
预测调整。四轮动态调整中不断增加新的观测数据,并考虑防控政策等因素的实际变化,具
体调整结果如下表1和图7所示。
[0134] 五轮预测中,前两轮预测在春运开始前进行,时间范围包括完整的春运40天,后三轮预测在春运期间进行,仅包括部分时间。对比16.68亿人次的真实观测结果,五轮预测中,
第一、四、五轮预测结果的总体误差均小于3%,非常接近真实结果。第二、三轮的总体误差较
大,预测结果低了大约三成,一是因为在2021年春运初期,不稳定因素多,政策变化较多且
各地政策弹性空间较大,导致大量返乡人员或提前返乡、或持观望态度未出行,降低了春运
初期人流规模,使第二轮预测值偏低;二是在春运中后期,人口流动强度不断增大,但是由
于数据更新时间滞后,在实际调整中未能及时将新的变化趋势纳入模型参数更新,使第三
轮预测值偏低。
[0135] 表1五轮预测对比
[0136]
[0137] 五轮预测的误差变化过程表明了动态调整的必要性和可靠性。在第一轮预测精度较高的基础上,尽管中间两轮预测出现偏差,但随着动态调整的次数不断增加,这些偏差被
逐渐修正。总体上,基于长序列手机信令大数据的春运人口流动预测效果准确性和可靠性
较高。
[0138] 背景技术对大数据的应用仅仅实现了大尺度人口流动格局的分析展示,未能实现对未来人口流动的预测功能。本发明与背景技术相比,不仅充分利用大数据技术实现了全
国人口流动格局规律的刻画,还建立了由出行行为挖掘、分阶段时空建模、重力模型检验、
疫情影响因子构成的模拟预测技术,实现了长时序、大尺度、高精度的人口流动有效预测,
拓展了LBS大数据的应用场景。
[0139] 背景技术虽然在交通量预测上有一定的有效性,但该模型解释变量的确定依赖经验判断和主观选择,且仅能对特定地区单一交通方式进行解释和预测。本发明与背景技术
相比,基于对既往数据的分析和分解,有效提取了人口流动的时空规律趋势,避免了解释变
量选择的主观性;通过手机信令数据的应用,可以反映综合各类交通方式的人口流动情况,
避免了单一交通方式的局限性;将疫情影响因子纳入模型,实现了对特殊事件下人口流动
变化特征的预测,提高了模型预测的适应性和可扩展性。
[0140] 数据获取
[0141] 2021年春运人口流动模拟预测的具体数据来源如表2所示,主要包括手机信令数据和基础地理信息数据。
[0142] 表2 所用数据来源与简要信息
[0143] 数据类型  数据描述  数据年份  数据来源 手机信令数据  整理后包括约3689万条出行记录数据  2019年至2021年(部分)  某移动通信运营商 
基础地理信息数据。  用于反映人流的空间特征  2016年  基于自然资源部标准地图服务网站审图号为GS(2016)1569号的标准地图 
[0144] (2)建立模型
[0145] 基于往年同期的春运数据,将城市间的流量分解为返乡返工流量和城市间日常流量,对两类流量分别建立不同的预测模型并求解,得到无疫情影响下的两类流量预测结果。
针对返乡返工流量,结合从手机信令数据发现的一般时间变化规律,划分为2个耗散阶段和
3个汇聚阶段。在耗散阶段,外来务工人员从务工地返回家乡所在地,其中第一个子阶段为
春运开始至春运返乡高峰,第二个子阶段为春运返程高峰至除夕;在汇聚阶段,外来务工人
员从家乡所在地返回汇聚阶段,其中第一个子阶段为大年初一至春运返工高峰,第二个子
阶段为春运返工高峰至元宵节,第三个子阶段为元宵节之后至春运结束。针对城市间日常
流量,结合规律划分时间段,建立流量与时间的线性拟合关系。
[0146] 结合今年年初全国流量数据、去年及前年节假日全国流量数据进行综合分析,得到疫情爆发、中高风险管控、提前返乡等因素对局部流量和全局流量的影响,给予此类情境
涉及到的城市不同的衰减因子,得到特定疫情情境下的流量预测结果。最后基于全国城市
的人口规模和地理空间关系,用重力模型校核预测结果,得到最终预测结果。
[0147] (3)预测结果
[0148] 从时间趋势看,2021年春运出行量的预测结果与实际结果变化趋势较为贴合,预测出了1月28日至3月8日出行量的三次涨落,实际出行情况中除夕前后的一次波谷,大年初
五至大年初七的一次波峰,以及正月十五左右的一次波峰均被预测到。与实际出行情况相
比,预测结果的整体趋势相同,但波动较为平缓。
[0149] 如图9和图10所示,从城市间人口流动OD格局看,春运40天的人口流动OD格局预测结果与实际情况基本相同。全国人口流动OD分布明显呈现出以城市群为基本网络单元的格
局。长三角、珠三角、成渝、京津冀城市群的OD网络强度和密度较高。实际情况中OD网络分布
更加集中在长三角、山东半岛、珠三角和成渝地区,且其他城市群中心城市与周边城市的OD
强度比预测结果大。
[0150] 如图11和图12所示,从城市人口流入流出的空间分布看,预测结果与实际情况基本相同。除夕前流出量较大的城市主要分布在长三角、珠三角、成渝三个核心城市群,以及
西安、郑州、北京等交通枢纽城市。除夕前流入量较大的城市主要分布在珠三角、成渝、长三
角和华北地区。人口流入的空间分布比人口流出的空间分布格局更加均匀,核心城市的人
口流入量比流出量低,而普通城市的流入量比流出量高。
[0151] 人口净流入和净流出分布格局的预测结果和实际情况也非常接近,预测结果的值稍低于实际情况。全国春运净流入和净流出城市呈现明显的空间分离现象。净流出规模较
大的城市集中分布在少量区域,前几位城市的净流出值大,但净流出城市的总体数量少,主
要分布在各城市群地区核心城市以及省会城市,珠三角和长三角城市群分布尤为密集。净
流入城市的空间分布和规模分布相对比较均匀,高值城市较少但城市数量较多,净流入规
模较大的城市主要集聚在城市群核心城市周围。
[0152] 如图13和图14所示:
[0153] 从区域层面看,以珠三角城市群为例,该地区春运期间的人口流出情况预测结果与实际情况基本相同。城市群人口流出量呈现出以核心城市为中心,向外圈层递减的态势。
从人口流出范围而言,珠三角人口流出的分布范围较广。从人口流出总量而言,珠三角城市
群人口流出量较大,承接人口流出量第一的城市达到180万人。
[0154] 实施例二:
[0155] 如图15所示,
[0156] 本公开还能够提供一种基于长时序信令大数据的人口流动模拟预测装置,包括:
[0157] 特征提取模块201,用于对往年人流数据进行特征提取得到流量数据;
[0158] 二元分解模块202,用于对所述流量数据进行流量二元分解得到节假日流量以及日常性流量;
[0159] 模型构建模块203,用于根据二元分解后的所述节假日流量和所述日常性流量分别进行模型构建得到两个初步预测模型;
[0160] 初步预测模块204,用于对模型构建后的两个所述初步预测模型进行叠加得到初步预测结果;
[0161] 再次预测模块205,用于对所述初步预测结果结合实时人流数据进行再次预测得到实时预测结果。
[0162] 其中,所述特征提取模块201依次与所述二元分解模块202、所述模型构建模块203、所述初步预测模块204以及所述再次预测模块205相连接。
[0163] 进一步,
[0164] 所述二元分解模块具体根据公式
[0165] 和公式
[0166]
[0167] 对所述流量数据进行二元分解得到节假日流量以及日常性流量;
[0168] 公式中,t表示时刻, 表示t时刻的流量数据的总流量, 表示二元分解后的t时刻的从第一城市i到第二城市j的日常性流量, 表示二元分解后的t时刻的从第一城
市i到第二城市j的节假日流量,i表示第一城市,j表示第二城市, 表示t时刻的从第一城
市i到第二城市j的流量, 表示t时刻的从第二城市j到第一城市i的流量。
[0169] 进一步,所述初步预测模型包括:
[0170] 耗散模型和汇聚模型,其中所述耗散模型表示当前时刻t的从第一城市i到第二城市j以及从第二城市j到第一城市i的流量动态平衡处于从第一城市i人员流出的状态;所述
汇聚模型表示当前时刻t的从第一城市i到第二城市j以及从第二城市j到第一城市i的流量
动态平衡处于向第一城市i人员流入的状态。
[0171] 实施例三:
[0172] 本公开还能够提供一种计算机存储介质,其上存储有计算机程序,计算机程序被处理器执行时用于实现上述的基于长时序信令大数据的人口流动模拟预测方法的步骤。
[0173] 本公开的计算机存储介质可以采用半导体存储器、磁芯存储器、磁鼓存储器或磁盘存储器实现。
[0174] 半导体存储器,主要用于计算机的半导体存储元件主要有Mos和双极型两种。Mos元件集成度高、工艺简单但速度较慢。双极型元件工艺复杂、功耗大、集成度低但速度快。
NMos和CMos问世后,使 Mos存储器在半导体存储器中开始占主要地位。NMos速度快,如英特
尔公司的1K位静态随机存储器的存取时间为 45ns。而CMos耗电省,4K位的CMos静态存储器
存取时间为300ns。上述半导体存储器都是随机存取存储器(RAM),即在工作过程中可随机
进行读出和写入新内容。而半导体只读存储器 (ROM)在工作过程中可随机读出但不能写
入,它用来存放已固化好的程序和数据。ROM 又分为不可改写的熔断丝式只读存储器──
PROM和可改写的只读存储器EPROM两种。
[0175] 磁芯存储器,具有成本低,可靠性高的特点,且有20多年的实际使用经验。70年代中期以前广泛使用磁芯存储器作为主存储器。其存储容量可达10位以上,存取时间最快为
300ns。国际上典型的磁芯存储器容量为 4MS~8MB,存取周期为1.0~1.5μs。在半导体存储
快速发展取代磁芯存储器作为主存储器的位置之后,磁芯存储器仍然可以作为大容量扩充
存储器而得到应用。
[0176] 磁鼓存储器,一种磁记录的外存储器。由于其信息存取速度快,工作稳定可靠,虽然其容量较小,正逐渐被磁盘存储器所取代,但仍被用作实时过程控制计算机和中、大型计
算机的外存储器。为了适应小型和微型计算机的需要,出现了超小型磁鼓,其体积小、重量
轻、可靠性高、使用方便。
[0177] 磁盘存储器,一种磁记录的外存储器。它兼有磁鼓和磁带存储器的优点,即其存储容量较磁鼓容量大,而存取速度则较磁带存储器快,又可脱机贮存,因此在各种计算机系统
中磁盘被广泛用作大容量的外存储器。磁盘一般分为硬磁盘和软磁盘存储器两大类。
[0178] 硬磁盘存储器的品种很多。从结构上,分可换式和固定式两种。可换式磁盘盘片可调换,固定式磁盘盘片是固定的。可换式和固定式磁盘都有多片组合和单片结构两种,又都
可分为固定磁头型和活动磁头型。固定磁头型磁盘的容量较小,记录密度低存取速度高,但
造价高。活动磁头型磁盘记录密度高(可达1000~6250位/英寸),因而容量大,但存取速度
相对固定磁头磁盘低。磁盘产品的存储容量可达几百兆字节,位密度为每英寸6 250位,道
密度为每英寸475道。其中多片可换磁盘存储器由于盘组可以更换,具有很大的脱体容量,
而且容量大,速度高,可存储大容量情报资料,在联机情报检索系统、数据库管理系统中得
到广泛应用。
[0179] 实施例四:
[0180] 本公开还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序实时现上述的基于长时序信令大数据的
人口流动模拟预测方法的步骤。
[0181] 图16为一个实施例中电子设备的内部结构示意图。如图16所示,该电子设备包括通过系统总线连接的处理器、存储介质、存储器和网络接口。其中,该计算机设备的存储介
质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机
可读指令被处理器执行时,可使得处理器实现一种基于长时序信令大数据的人口流动模拟
预测方法。该电设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计
算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使
得处理器执行一种基于长时序信令大数据的人口流动模拟预测方法。该计算机设备的网络
接口用于与终端连接通信。本领域技术人员可以理解,图16中示出的结构,仅仅是与本申请
方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,
具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有
不同的部件布置。
[0182] 该电子设备包括但不限于智能电话、计算机、平板电脑、可穿戴智能设备、人工智能设备、移动电源等。
[0183] 所述处理器在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多
个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及
各种控制芯片的组合等。所述处理器是所述电子设备的控制核心(Control Unit),利用各
种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器内的程序
或者模块(例如执行远端数据读写程序等),以及调用存储在所述存储器内的数据,以执行
电子设备的各种功能和处理数据。
[0184] 所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)
总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存
储器以及至少一个处理器等之间的连接通信。
[0185] 图16仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图16示出的结构并不构成对所述电子设备的限定,可以包括比图示更少或者更多的部件,或者组合某
些部件,或者不同的部件布置。
[0186] 例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器逻辑相连,从而通过电源管理
装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直
流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器
等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、Wi‑Fi模块等,在此不再赘
述。
[0187] 进一步地,所述电子设备还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI‑FI接口、蓝牙接口等),通常用于在该电子设备与其他电子设
备之间建立通信连接。
[0188] 可选地,该电子设备还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可
选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED
(Organic Light‑Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的
称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界
面。
[0189] 进一步地,所述计算机可用存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区
块链节点的使用所创建的数据等。
[0190] 在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的
划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0191] 所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个
网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目
的。
[0192] 另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单
元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
[0193] 以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。本公开的范围由所附权利要求及其等价物限定。不脱离本公
开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的
范围之内。