人口流动模拟预测方法、装置、设备及介质转让专利
申请号 : CN202110543669.5
文献号 : CN112990613B
文献日 : 2021-08-13
发明人 : 赵鹏军 , 胡昊宇 , 庞亮 , 万丹 , 张听雨
申请人 : 北京大学
摘要 :
权利要求 :
1.一种基于长时序信令大数据的人口流动模拟预测方法,其特征在于,包括:对往年人流数据进行特征提取得到流量数据;
对所述流量数据进行流量二元分解得到节假日流量以及日常性流量;
所述对所述流量数据进行流量二元分解得到节假日流量以及日常性流量具体包括:根据公式
和公式
对所述流量数据进行二元分解得到节假日流量以及日常性流量;
公式中,t表示时刻, 表示t时刻的流量数据的总流量, 表示二元分解后的t时刻的从第一城市i到第二城市j的日常性流量, 表示二元分解后的t时刻的从第一城市i到第二城市j的节假日流量,i表示第一城市,j表示第二城市, 表示t时刻的从第一城市i到第二城市j的流量, 表示t时刻的从第二城市j到第一城市i的流量,n表示第一城市和第二城市的城市数量,n为大于等于2的正整数;
根据二元分解后的所述节假日流量和所述日常性流量分别进行模型构建得到两个初步预测模型;
对模型构建后的两个所述初步预测模型进行叠加得到初步预测结果;
对所述初步预测结果结合实时人流数据进行再次预测得到实时预测结果;
所述初步预测模型包括:
耗散模型和汇聚模型,其中所述耗散模型表示当前时刻t的从第一城市i到第二城市j以及从第二城市j到第一城市i的流量动态平衡处于从第一城市i人员流出的状态;所述汇聚模型表示当前时刻t的从第一城市i到第二城市j以及从第二城市j到第一城市i的流量动态平衡处于向第一城市i人员流入的状态;
在春运期间节假日流量主要表现为返乡返工流量,根据返乡和返工行为特征进一步分为5个阶段:耗散阶段1、耗散阶段2、汇聚阶段1、汇聚阶段2、汇聚阶段3;
其中,对耗散阶段1建立如下模型:公式中,t表示时刻,t0表示该阶段的起始时刻,i表示第一城市,j表示第二城市,表示从第一城市i到第二城市j的返乡总流量, 表示t时刻从第一城市i到第二城市j应返乡但尚未返乡的流量, 表示t时刻从第一城市i到第二城市j的返乡流量,表示模型待估参数,表示随机误差项;
对汇聚阶段2和汇聚阶段3建立类似的模型:公式中,t表示时刻,t3及t4表示相应阶段的起始时刻,i表示第一城市,j表示第二城市, 和 表示t时刻从第一城市i到第二城市j在相应阶段应返乡但尚未返乡的流量, 和 表示t时刻从第一城市i到第二城市j在相应阶段的返乡流量,和 表示模型待估参数。
2.根据权利要求1所述的方法,其特征在于,所述人流数据具体包括:手机信令数据和地理信息数据,其中,所述手机信令数据包括手机与通讯基站之间的通信记录数据。
3.根据权利要求1 2任一项中所述的方法,其特征在于,所述方法还包括:~
根据常住人口和地理距离对所述实时预测结果进行重力模型校核。
4.一种基于长时序信令大数据的人口流动模拟预测装置,其特征在于,包括:特征提取模块,用于对往年人流数据进行特征提取得到流量数据;
二元分解模块,用于对所述流量数据进行流量二元分解得到节假日流量以及日常性流量;
所述二元分解模块具体根据公式和公式
对所述流量数据进行二元分解得到节假日流量以及日常性流量;
公式中,t表示时刻, 表示t时刻的流量数据的总流量, 表示二元分解后的t时刻的从第一城市i到第二城市j日常性流量, 表示二元分解后的t时刻的从第一城市i到第二城市j的节假日流量,i表示第一城市,j表示第二城市, 表示t时刻的从第一城市i到第二城市j的流量, 表示t时刻的从第二城市j到第一城市i的流量,n表示第一城市和第二城市的城市数量,n为大于等于2的正整数;
模型构建模块,用于根据二元分解后的所述节假日流量和所述日常性流量分别进行模型构建得到两个初步预测模型;
初步预测模块,用于对模型构建后的两个所述初步预测模型进行叠加得到初步预测结果;
再次预测模块,用于对所述初步预测结果结合实时人流数据进行再次预测得到实时预测结果;
所述初步预测模型具体包括:
耗散模型和汇聚模型,其中所述耗散模型表示当前时刻t的从第一城市i到第二城市j以及从第二城市j到第一城市i的流量动态平衡处于从第一城市i人员流出的状态;所述汇聚模型表示当前时刻t的从第一城市i到第二城市j以及从第二城市j到第一城市i的流量动态平衡处于向第一城市i人员流入的状态;
在春运期间节假日流量主要表现为返乡返工流量,根据返乡和返工行为特征进一步分为5个阶段:耗散阶段1、耗散阶段2、汇聚阶段1、汇聚阶段2、汇聚阶段3;
其中,对耗散阶段1建立如下模型:公式中,t表示时刻,t0表示该阶段的起始时刻,i表示第一城市,j表示第二城市,表示从第一城市i到第二城市j的返乡总流量, 表示t时刻从第一城市i到第二城市j应返乡但尚未返乡的流量, 表示t时刻从第一城市i到第二城市j的返乡流量,表示模型待估参数,表示随机误差项;
对汇聚阶段2和汇聚阶段3建立类似的模型:公式中,t表示时刻,t3及t4表示相应阶段的起始时刻,i表示第一城市,j表示第二城市, 和 表示t时刻从第一城市i到第二城市j在相应阶段应返乡但尚未返乡的流量, 和 表示t时刻从第一城市i到第二城市j在相应阶段的返乡流量,和 表示模型待估参数。
5.根据权利要求4所述的装置,其特征在于,所述人流数据具体包括:手机信令数据和地理信息数据,其中,所述手机信令数据包括手机与通讯基站之间的通信记录数据。
6.根据权利要求4 5任一项中所述的装置,其特征在于,还包括:~
重力模型校核模块,用于根据常住人口和地理距离对所述实时预测结果进行重力模型校核。
7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现权利要求1 3任一项中所述的基于长时序信令大数~
据的人口流动模拟预测方法。
8.一种计算机存储介质,其上存储有计算机程序指令,其特征在于,所述程序指令被处理器执行时用于实现权利要求1 3任一项中所述的基于长时序信令大数据的人口流动模拟~
预测方法。
说明书 :
人口流动模拟预测方法、装置、设备及介质
技术领域
背景技术
无线电通讯网络,或者通过外部定位方式,采集移动终端用户的空间位置(如地理坐标),向
用户提供与位置服务相关的增值业务。当人们允许各类平台的手机应用程序APP调用LBS服
务时,即可通过定位信息刻画出用户的移动轨迹。利用该项技术,可以动态展示春运期间国
内城市间的人口流动情况。
动的预测功能。第二,LBS服务需要终端用户主动发起服务请求后,才能获得相关时空数据。
提供该服务的平台数量众多,因此数据覆盖程度有待提升,大量空间流动行为未能有效记
录。第三,该项技术获取的数据没有用户ID信息,因此无法识别用户的完整出行,只是统计
城市间的人口流动量。大部分的出行被拆解,未被完整识别,如从A地出发到最终目的地B地
途径了C地,同时用户在C地也有定位信息,此次出行会被拆解为A‑C和C‑B两次出行。
线性回归模型,对节假日范围内的区域总OD需求进行预测,再基于历史各日占总量的比例
将所预测的总量分配到各日,得到重大节假日各日的交通OD量预测。
测效果产生一定的影响。此外,该方法所采用的高速公路出口流水数据只能反映重大节假
日期间高速公路单一交通方式的OD流量,而不能反映综合多种交通方式的节假日期间人口
流动OD量。且该预测方法多适用于范围较小的预测区域,对于较大范围,如全国的交通OD量
预测,该方法的计算过程将较为庞杂。
发明内容
问题。
城市i到第二城市j的节假日流量,i表示第一城市,j表示第二城市, 表示t时刻的从第一
城市i到第二城市j的流量, 表示t时刻的从第二城市j到第一城市i的流量,n为大于等于
2的正整数。
汇聚模型表示当前时刻t的从第一城市i到第二城市j以及从第二城市j到第一城市i的流量
动态平衡处于向第一城市i人员流入的状态。
一城市i到第二城市j的节假日流量,i表示第一城市,j表示第二城市, 表示t时刻的从
第一城市i到第二城市j的流量, 表示t时刻的从第二城市j到第一城市i的流量,n为大
于等于2的正整数。
汇聚模型表示当前时刻t的从第一城市i到第二城市j以及从第二城市j到第一城市i的流量
动态平衡处于向第一城市i人员流入的状态。
拟预测方法的步骤。
长时序信令大数据的人口流动模拟预测方法的步骤。
人口流动时空特征方面已受到越来越多的关注和应用,但针对人口流动预测的应用还较
少。本技术构建了基于手机信令大数据的“大尺度人口时空流动态预测模型”(Population
Temporal‑Spatial Flow Dynamic Prediction Model for Large Scale, PFDM),模型依
据春运期间人口流动的属性特征和时间特征,进行分段建模:针对春运期间人口流动的属
性特征,在模型预测中对人口流动量进行分解,对节假日流量和日常流量分别建立预测模
型。该项技术还应用重力模型进行预测量的检验和校正,提出基于手机信令大数据的城市
间人口流OD分布重力模型检验技术(Population Flow Origin‑Destination
Distribution Gravity Model, PFGM)。基于人口分布和地理空间的交互作用关系理论,构
建全国尺度城市间的人口流动OD分布重力模型,采用手机信令大数据进行模型计算与关键
参数标定,对PFDM预测结果进行检验和校正,进一步提高了预测精度。
附图说明
具体实施方式
避免不必要地混淆本公开的概念。
各种区域、层的形状以及它们之间的相对大小、位置关系仅是示例性的,实际中可能由于制
造公差或技术限制而有所偏差,并且本领域技术人员根据实际所需可以另外设计具有不同
形状、大小、相对位置的区域/层。
第一城市i到第二城市j的节假日流量,i表示第一城市,j表示第二城市, 表示t时刻的从
第一城市i到第二城市j的流量, 表示t时刻的从第二城市j到第一城市i的流量,n为大于
等于2的正整数。
汇聚模型表示当前时刻t的从第一城市i到第二城市j以及从第二城市j到第一城市i的流量
动态平衡处于向第一城市i人员流入的状态,n表示第一城市和第二城市的城市数量,n为大
于等于2的正整数。
有序结构,预测中将这一部分作为城市间固有的日常流量;而在春运期间,由于存在返乡和
返工的过程,这种动态平衡在短期内被打破了,即城市对之间存在或大或小的净流出和净
流入的关系,预测中将这一部分作为春运期间返乡返工的流量。
二城市j应返乡但尚未返乡的流量, 表示t时刻从第一城市i到第二城市j的返乡流量,
表示模型待估参数,表示随机误差项。
返乡的流量, 和 表示t时刻从第一城市i到第二城市j在相应阶段的返乡流量,
和 表示模型待估参数。
第二城市j的日常流量均值, 和 表示模型待估参数,表示随机误差项。
阶段和3个汇聚阶段。在耗散阶段,外来务工人员从务工地返回家乡所在地,其中第一个子
阶段为春运开始至春运返乡高峰,第二个子阶段为春运返程高峰至除夕;在汇聚阶段,外来
务工人员从家乡所在地返回汇聚阶段,其中第一个子阶段为大年初一至春运返工高峰,第
二个子阶段为春运返工高峰至元宵节,第三个子阶段为元宵节之后至春运结束。针对城市
间日常流量,结合规律划分时间段,建立流量与时间的线性拟合关系。
一次修正后结果, 和 分别表示第一城市i和第二城市j的疫情影响衰减因子,表示全
局疫情影响衰减因子。
j的流量预测第二次修正后结果, 和 分别表示第一城市i和第二城市j的政策影响衰
减因子。
乡、就地过年等新现象的影响,给予此类情境涉及到的城市不同的衰减因子,得到特定疫情
情境下的流量预测结果。
市j的流量预测第三次修正后结果, 和 分别表示第一城市i和第二城市j的常住人口规
模, 表示第一城市i和第二城市j之间的地理距离,k表示重力模型参数。
间流量随时间的随机性波动较大,采用重力模型可以修正由随机性波动造成的耗散过程参
数异常。以重力模型结果与原预测结果进行比对,将超出阈值的部分调整至符合重力模型
结果,校核调整得到最终的流量预测结果。
的动态调整系数:
数据的开始时刻和结束时刻。
运人口流动模拟预测中,经过五轮动态预测,最终实现预测模型的自我纠偏。
人口流动时空特征方面已受到越来越多的关注和应用,但针对人口流动预测的应用还较
少。本技术构建了基于手机信令大数据的“大尺度人口时空流动态预测模型”(Population
Temporal‑Spatial Flow Dynamic Prediction Model for Large Scale, PFDM),模型依
据春运期间人口流动的属性特征和时间特征,进行分段建模:针对春运期间人口流动的属
性特征,在模型预测中对人口流动量进行分解,对节假日流量和日常流量分别建立预测模
型。该项技术同时考虑到疫情对春运的影响,提出人口流动的新冠疫情影响因子(Covid‑19
Factor),根据今年年初、疫情爆发年和正常年份的节假日全国综合流量数据,分析疫情爆
发、风险区管控、提前返乡等因素对局部和全域人口流动的影响,根据疫情波及情况,对于
不同城市设置不同的衰减因子,将疫情对春运人口流动的影响纳入模型预测中。该项技术
还应用重力模型进行预测量的检验和校正,提出基于手机信令大数据的城市间人口流OD分
布重力模型检验技术(Population Flow Origin‑Destination Distribution Gravity
Model, PFGM)。基于人口分布和地理空间的交互作用关系理论,构建全国尺度城市间的人
口流动OD分布重力模型,采用手机信令大数据进行模型计算与关键参数标定,对PFDM预测
结果进行检验和校正,进一步提高了预测精度。
流动需求,是推进新型城镇化,提升交通质量的要求。2021年1月28日,在交通运输部例行新
闻发布会上,交通运输部表示将指导部署各地交通运输部门在做好疫情防控的前提下,统
筹做好路网保通保畅等相关工作;加强运输监测,特别是对重要运输通道、旅游风景点周边
道路的运行监测;密切关注天气变化,做好恶劣天气公路交通突发事件应急处置保畅保通
工作;做好风险路段排查和整治,完善风险等级较高路段安全防护措施。利用手机信令大数
据,结合疫情等突发重大事件,对春运期间全国人口流动数量时空特征进行预测,有助于交
通运输部门提前做好应对预案,保障春运期间交通运力支持,为春运期间疫情防控政策与
交通政策提供参考。
国城市网络特征。预测人口流动的时空特征,有助于为相关企事业单位和个人采取错峰出
行提供参考,优化社会经济资源空间配置和利用,提高区域经济发展效益。春运是全国规模
最大、持续时间最长、周期性最强的迁徙活动。
预测调整。四轮动态调整中不断增加新的观测数据,并考虑防控政策等因素的实际变化,具
体调整结果如下表1和图7所示。
第一、四、五轮预测结果的总体误差均小于3%,非常接近真实结果。第二、三轮的总体误差较
大,预测结果低了大约三成,一是因为在2021年春运初期,不稳定因素多,政策变化较多且
各地政策弹性空间较大,导致大量返乡人员或提前返乡、或持观望态度未出行,降低了春运
初期人流规模,使第二轮预测值偏低;二是在春运中后期,人口流动强度不断增大,但是由
于数据更新时间滞后,在实际调整中未能及时将新的变化趋势纳入模型参数更新,使第三
轮预测值偏低。
逐渐修正。总体上,基于长序列手机信令大数据的春运人口流动预测效果准确性和可靠性
较高。
国人口流动格局规律的刻画,还建立了由出行行为挖掘、分阶段时空建模、重力模型检验、
疫情影响因子构成的模拟预测技术,实现了长时序、大尺度、高精度的人口流动有效预测,
拓展了LBS大数据的应用场景。
相比,基于对既往数据的分析和分解,有效提取了人口流动的时空规律趋势,避免了解释变
量选择的主观性;通过手机信令数据的应用,可以反映综合各类交通方式的人口流动情况,
避免了单一交通方式的局限性;将疫情影响因子纳入模型,实现了对特殊事件下人口流动
变化特征的预测,提高了模型预测的适应性和可扩展性。
基础地理信息数据。 用于反映人流的空间特征 2016年 基于自然资源部标准地图服务网站审图号为GS(2016)1569号的标准地图
针对返乡返工流量,结合从手机信令数据发现的一般时间变化规律,划分为2个耗散阶段和
3个汇聚阶段。在耗散阶段,外来务工人员从务工地返回家乡所在地,其中第一个子阶段为
春运开始至春运返乡高峰,第二个子阶段为春运返程高峰至除夕;在汇聚阶段,外来务工人
员从家乡所在地返回汇聚阶段,其中第一个子阶段为大年初一至春运返工高峰,第二个子
阶段为春运返工高峰至元宵节,第三个子阶段为元宵节之后至春运结束。针对城市间日常
流量,结合规律划分时间段,建立流量与时间的线性拟合关系。
涉及到的城市不同的衰减因子,得到特定疫情情境下的流量预测结果。最后基于全国城市
的人口规模和地理空间关系,用重力模型校核预测结果,得到最终预测结果。
五至大年初七的一次波峰,以及正月十五左右的一次波峰均被预测到。与实际出行情况相
比,预测结果的整体趋势相同,但波动较为平缓。
局。长三角、珠三角、成渝、京津冀城市群的OD网络强度和密度较高。实际情况中OD网络分布
更加集中在长三角、山东半岛、珠三角和成渝地区,且其他城市群中心城市与周边城市的OD
强度比预测结果大。
西安、郑州、北京等交通枢纽城市。除夕前流入量较大的城市主要分布在珠三角、成渝、长三
角和华北地区。人口流入的空间分布比人口流出的空间分布格局更加均匀,核心城市的人
口流入量比流出量低,而普通城市的流入量比流出量高。
大的城市集中分布在少量区域,前几位城市的净流出值大,但净流出城市的总体数量少,主
要分布在各城市群地区核心城市以及省会城市,珠三角和长三角城市群分布尤为密集。净
流入城市的空间分布和规模分布相对比较均匀,高值城市较少但城市数量较多,净流入规
模较大的城市主要集聚在城市群核心城市周围。
从人口流出范围而言,珠三角人口流出的分布范围较广。从人口流出总量而言,珠三角城市
群人口流出量较大,承接人口流出量第一的城市达到180万人。
市i到第二城市j的节假日流量,i表示第一城市,j表示第二城市, 表示t时刻的从第一城
市i到第二城市j的流量, 表示t时刻的从第二城市j到第一城市i的流量。
汇聚模型表示当前时刻t的从第一城市i到第二城市j以及从第二城市j到第一城市i的流量
动态平衡处于向第一城市i人员流入的状态。
NMos和CMos问世后,使 Mos存储器在半导体存储器中开始占主要地位。NMos速度快,如英特
尔公司的1K位静态随机存储器的存取时间为 45ns。而CMos耗电省,4K位的CMos静态存储器
存取时间为300ns。上述半导体存储器都是随机存取存储器(RAM),即在工作过程中可随机
进行读出和写入新内容。而半导体只读存储器 (ROM)在工作过程中可随机读出但不能写
入,它用来存放已固化好的程序和数据。ROM 又分为不可改写的熔断丝式只读存储器──
PROM和可改写的只读存储器EPROM两种。
300ns。国际上典型的磁芯存储器容量为 4MS~8MB,存取周期为1.0~1.5μs。在半导体存储
快速发展取代磁芯存储器作为主存储器的位置之后,磁芯存储器仍然可以作为大容量扩充
存储器而得到应用。
算机的外存储器。为了适应小型和微型计算机的需要,出现了超小型磁鼓,其体积小、重量
轻、可靠性高、使用方便。
中磁盘被广泛用作大容量的外存储器。磁盘一般分为硬磁盘和软磁盘存储器两大类。
可分为固定磁头型和活动磁头型。固定磁头型磁盘的容量较小,记录密度低存取速度高,但
造价高。活动磁头型磁盘记录密度高(可达1000~6250位/英寸),因而容量大,但存取速度
相对固定磁头磁盘低。磁盘产品的存储容量可达几百兆字节,位密度为每英寸6 250位,道
密度为每英寸475道。其中多片可换磁盘存储器由于盘组可以更换,具有很大的脱体容量,
而且容量大,速度高,可存储大容量情报资料,在联机情报检索系统、数据库管理系统中得
到广泛应用。
人口流动模拟预测方法的步骤。
质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机
可读指令被处理器执行时,可使得处理器实现一种基于长时序信令大数据的人口流动模拟
预测方法。该电设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计
算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使
得处理器执行一种基于长时序信令大数据的人口流动模拟预测方法。该计算机设备的网络
接口用于与终端连接通信。本领域技术人员可以理解,图16中示出的结构,仅仅是与本申请
方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,
具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有
不同的部件布置。
个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及
各种控制芯片的组合等。所述处理器是所述电子设备的控制核心(Control Unit),利用各
种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器内的程序
或者模块(例如执行远端数据读写程序等),以及调用存储在所述存储器内的数据,以执行
电子设备的各种功能和处理数据。
总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存
储器以及至少一个处理器等之间的连接通信。
些部件,或者不同的部件布置。
装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直
流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器
等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、Wi‑Fi模块等,在此不再赘
述。
备之间建立通信连接。
选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED
(Organic Light‑Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的
称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界
面。
块链节点的使用所创建的数据等。
划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目
的。
元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的
范围之内。