一种基于无线用户信令的人口统计方法及系统转让专利
申请号 : CN202111637462.0
文献号 : CN113993120B
文献日 : 2022-03-18
发明人 : 艾怀丽 , 卫俊俊 , 赵丹怀 , 孟浩 , 张徐
申请人 : 中国移动紫金(江苏)创新研究院有限公司
摘要 :
权利要求 :
1.一种基于无线用户信令的人口统计方法,其特征在于,包括以下步骤:针对每个网格,按照预定时间间隔获取当前时间点和对应的用户清单,生成网格‑用户清单信息;基于区域网格参数信息,将所述网格‑用户清单信息转化成区域‑用户清单信息并保存更新至数据库中;
以当前时间点为截点,向前追溯预定时间段,将所述预定时间段内的所有区域‑用户清单信息采用合并去重的方式得到当前批次用户集合;将当前批次用户集合与上个批次用户集合进行分析,输出第一分析结果,得到对应区域内的实时流入流出统计表;
于所述数据库中生成每日驻留清单,基于每日驻留清单中筛选得到当天驻留用户集合,将当天驻留用户集合与前一天驻留用户集合进行对比分析输出第二分析结果,得到对应区域内的每日流入流出统计表;
其中,所述每日驻留清单的生成具体包括以下步骤:以用户手机为信号源,于数据库中获取用户于当日零点距当前时间点所停留过的N个网格信息,生成与所述网格信息相对应的N个网格停留信息,其中N为大于等于1的整数;基于区域网格参数信息,将所述N个网格停留信息转化为对应的N个区域停留信息,所述区域停留信息至少包括:日期‑时间段、停留区域信息、单次停留时间和用户手机号码;所述N个区域停留信息即为每日驻留清单;
当天驻留用户集合的筛选包括以下步骤:若每日驻留清单中在不同时间段获得的停留区域信息各不相同,则将每个区域停留信息中的单次停留时间一一与阈值进行对比,将单次停留时间大于等于阈值的区域停留信息择出来,并更新至对应区域内的当天驻留用户集合;
若每日驻留清单中在不同时间段获得的停留区域信息至少有两个相同停留区域,将具有相同停留区域信息的单次停留时间进行叠加得到关于所述相同停留区域信息的总停留时间,将总停留时间一一与阈值进行对比,择出总停留时间大于等于阈值的区域停留信息,更新至对应区域内的当天驻留用户集合;将剩余不同的区域停留信息中的单次停留时间一一与阈值进行对比,择出单次停留时间大于等于阈值的区域停留信息,并更新至对应区域内的当天驻留用户集合。
2.根据权利要求1所述的一种基于无线用户信令的人口统计方法,其特征在于,还包括:对第一分析结果和/或第二分析结果进行扩样处理。
3.根据权利要求1所述的一种基于无线用户信令的人口统计方法,其特征在于,将当前批次用户集合与上个批次用户集合进行分析具体包括以下步骤:定义当前批次用户集合为Xt,上个批次用户集合为Xt‑1,则Xt表示当前时间点t对应区域下的人群,Xt‑1为上个时间点t‑1对应区域下的人群,其中预定时间段为当前时间点t‑上个时间点t‑1;
若Xt>Xt‑1,则分析出对应区域下的人群动态为流入,且实时流入人群为Xt‑Xt‑1;
若Xt<Xt‑1,则分析出对应区域下的人群动态为流出,且实时流出人群为Xt‑1‑Xt;
若Xt=Xt‑1,则分析出对应区域下无人口流动。
4.根据权利要求1所述的一种基于无线用户信令的人口统计方法,其特征在于,所述网格‑用户清单信息至少包括:当前时间点、用户所在网格信息和用户手机号码;
所述区域网格参数信息包括:区域信息和网格信息,其中所述区域信息与所述网格信息之间存在预设的对应关系;
所述区域‑用户清单信息至少包括:当前时间点、用户所在区域信息和用户手机号码。
5.根据权利要求1所述的一种基于无线用户信令的人口统计方法,其特征在于,将当天驻留用户集合与前一天驻留用户集合进行对比分析的流程如下:定义当天驻留用户集合为Yd,前一天驻留用户集合为Yd‑1,则Yd为当天的对应区域下的驻留人群,则 Yd‑1为前一天的对应区域下的驻留人群;
若Yd>Yd‑1,则分析出对应区域下的当天与前一天的人群动态为流入,且每日流入人群为Yd‑Yd‑1;
若Yd<Yd‑1,则分析出对应区域下的当天与前一天的人群动态为流出,且每日流出人群为Yd‑1‑Yd;
若Yd=Yd‑1,则分析出对应区域下的当天与前一天相比无流动。
6.根据权利要求1所述的一种基于无线用户信令的人口统计方法,其特征在于,所述预定时间段为若干个连续的预定时间间隔。
7.一种基于无线用户信令的人口统计系统,其特征在于,包括:第一模块,针对每个网格,按照预定时间间隔获取当前时间点和对应的用户清单,生成网格‑用户清单信息;基于区域网格参数信息,将所述网格‑用户清单信息转化成区域‑用户清单信息并保存更新至数据库中;
第二模块,以当前时间点为截点,向前追溯预定时间段,将所述预定时间段内的所有区域‑用户清单信息采用合并去重的方式得到当前批次用户集合;将当前批次用户集合与上个批次用户集合进行分析,输出第一分析结果,得到对应区域内的实时流入流出统计表;
第三模块,于所述数据库中生成每日驻留清单,基于每日驻留清单中筛选得到当天驻留用户集合,将当天驻留用户集合与前一天驻留用户集合进行对比分析输出第二分析结果,得到对应区域内的每日流入流出统计表;
第四模块,以用户手机为信号源,于数据库中获取用户于当日零点距当前时间点所停留过的N个网格信息,生成与所述网格信息相对应的N个网格停留信息,其中N为大于等于1的整数;
基于区域网格参数信息,将所述N个网格停留信息转化为对应的N个区域停留信息,所述区域停留信息至少包括:日期‑时间段、停留区域信息、单次停留时间和用户手机号码;所述N个区域停留信息即为每日驻留清单;
第五模块,若每日驻留清单中在不同时间段获得的停留区域信息各不相同,则将每个区域停留信息中的单次停留时间一一与阈值进行对比,将单次停留时间大于等于阈值的区域停留信息择出来,并更新至对应区域内的当天驻留用户集合;
若每日驻留清单中在不同时间段获得的停留区域信息至少有两个相同停留区域,将具有相同停留区域信息的单次停留时间进行叠加得到关于所述相同停留区域信息的总停留时间,将总停留时间一一与阈值进行对比,择出总停留时间大于等于阈值的区域停留信息,更新至对应区域内的当天驻留用户集合;将剩余不同的区域停留信息中的单次停留时间一一与阈值进行对比,择出单次停留时间大于等于阈值的区域停留信息,并更新至对应区域内的当天驻留用户集合。
说明书 :
一种基于无线用户信令的人口统计方法及系统
技术领域
背景技术
迹大数据,基于基站进行定位,具有海量性、真实性、连续性、完整性、及时性和无感知性,可
对人口活动轨迹的整个过程进行观测。运用无线用户信令大数据进行计算人口数量,可有
效减少调查时长,降低成本及人力损耗。
移动轨迹并实现区域性、全面性的人口统计就成为了疫情期间亟需的一个技术问题。
发明内容
信息并保存更新至数据库中;
用户集合进行分析,输出第一分析结果,得到对应区域内的实时流入流出统计表;
对应区域内的每日流入流出统计表。
上个时间点t‑1;
码;
信息择出来,并更新至对应区域内的当天驻留用户集合。
停留时间,将总停留时间一一与阈值进行对比,择出总停留时间大于等于阈值的区域停留
信息,更新至对应区域内的当天驻留用户集合;
用户清单信息并保存更新至数据库中;
与上个批次用户集合进行分析,输出第一分析结果,得到对应区域内的实时流入流出统计
表;
结果,得到对应区域内的每日流入流出统计表。
小颗粒度的统计周期(比如15分钟)。同时,快速地统计人口数量和人口迁移轨迹,从而为人
口宏观策略制定、经济分析、疫情控制等紧急事件治理提供有效数据支撑,提升人口统计效
率,减少疫情等公众安全时间的影响,实现降本增效的目的。
附图说明
具体实施方式
出,成为该地的户籍人口。流动人口是指离开了户籍所在地到其他地方居住的人口。暂住人
口是指离开户籍所在地,在该地区暂时居住一定期限的人口。常住人口是指居住在某地半
年以上的人口。
于人口迁入和迁出而引起的人口数量变化。
用户清单信息并保存更新至数据库中;
户集合;将当前批次用户集合与上个批次用户集合进行分析,输出第一分析结果,得到对应
区域内的实时流入流出统计表;
行对比分析输出第二分析结果,得到对应区域内的每日流入流出统计表。
分钟为例,即每15分钟获取一次用户清单,生成网格‑用户清单信息。举例说明,将上午9点
15分定为当前时间点,则上一次获取用户清单的时间点为上9点,下一次获取用户清单的时
间点为9点30分。且生成的用户清单信息是与网格相对应的,进一步表示为,网格‑用户清单
信息至少包括:当前时间点、用户所在网格信息和用户手机号码。基于上述举例,网格‑用户
清单信息包括:9点15分,9点15分用户所在的网格信息和用户手机号码。
街道或者某小区对应占用且唯一的网络。使得网格‑用户清单信息直接转化为区域‑用户清
单信息,其中所述区域‑用户清单信息至少包括:当前时间点(9点15分)、用户于当前时间所
在的区域信息和用户手机号码。
与之相配的网格参数,即小区A、小区B、小区C分别对应于唯一的网格参数A、网格参数B、网
格参数C,因此当前区域信息与网格信息相互之间可相互转化或者相互调用。因此通过区域
网格参数信息,将网格‑用户清单信息转化成区域‑用户清单信息并保存更新至数据库中;
便于在统计时直接将人口统计或者流动定位在区域内,实现更精准的定位。
通过用户手机号码便可调出该用户在过去时间内的停留信息,创建了多维度的信息链,增
加了人口统计的全面性和进一步提高精度。
( )和cache( )方法持久化;将内存中的数据存放到磁盘中。
间隔。则在本实施例中,预定时间段为八个连续的预定时间间隔,即预定时间段为2小时,也
就是意味着以9点15分为截点,向前追溯2小时追溯到7点15分,将7点15分至9点15分之间得
到的所有区域‑用户清单信息采用合并去重的方式得到当前批次用户集合。即所有区域‑用
户清单信息采包括:7点15分获取到的区域‑用户清单信息、7点30分获取到的区域‑用户清
单信息、7点45分获取到的区域‑用户清单信息、…、9点获取到的区域‑用户清单信息和9点
15分获取到的区域‑用户清单信息。采用合并去重的方式即若以上区域‑用户清单信息中,
有相同的信息则去重保留在最后时间点得到的区域‑用户清单信息即可,从而得到当前批
次用户集合。
区域‑用户清单信息采用合并去重的方式得到当前批次用户集合。当第i个区域‑用户清单
信息与第i+1个区域‑用户清单信息相同,则在当前批次用户集合中剔除第i个区域‑用户清
单信息,保留第i+1个区域‑用户清单信息,其中1≤i≤m。若每个区域‑用户清单信息均不相
同,则在当前批次用户集合中全部保留。
上个时间点t‑1。
动,每个集合中的元素都有对应的信息,都能基于用户号码或者网格信息或者当前区域信
息调用对应的时间点的走向,形成网格式人口统计。
过的N个网格信息,生成与所述网格信息相对应的N个网格停留信息,其中N为大于等于1的
整数;基于区域网格参数信息,将所述N个网格停留信息转化为对应的N个区域停留信息,所
述区域停留信息至少包括:日期‑时间段(停留在当前区域的起始时间至时间截点或停留在
当前区域的起始时间至终止时间)、停留区域信息、单次停留时间和用户手机号码;所述N个
区域停留信息即为每日驻留清单。
间点为统计节点,在数据库中获取用户当天的区域‑用户清单信息,通过不同时间段的区
域‑用户清单信息可获知用户当天所停留过的N个网格信息,若用户当天一直呆在地方A没
有移动过,则N=1,且停留时间为11小时,则该用户的每日驻留清单为1个区域停留信息:某
天‑时间段(停留在地方A的起始时间至时间截点)、地方A、11小时和该用户的手机号码。
息:第一个区域停留信息:某天‑时间段(停留在地方A的起始时间至终止时间)、地方A、7小
时和该用户的手机号码;第二个区域停留信息:某天‑时间段(停留在地方B的起始时间至时
间截点)、地方B、2小时和该用户的手机号码。
阈值进行对比,将单次停留时间大于等于阈值的区域停留信息择出来得到当天驻留用户集
合。举例说明,用户从零点开始至时间截点依次到达并停留在地方A、地方B、地方C和地方D,
且停留的时间分别为Ta、Tb、Tc和Td;由于地方A、地方B、地方C和地方D为四个不同地理位置
的区域即所对应的网格均不相同。因此在判断是否为驻留用户时,需要将Ta、Tb、Tc和Td分
别与阈值进行大小对比,在本实施例中,所述阈值取值为4小时。则Ta、Tb、Tc和Td中有至少
一个是大于4小时的,则表示该用户分别在对应区域内均为驻留用户,分别更新到对应区域
内的当天驻留用户集合。举例说明,若Ta=2小时、Tb=6小时、Tc=3小时和Td=5小时,经对比发
现:Tb和Td均大于阈值,则表示该用户分别在地方B和地方D均为驻留用户,关于地方B和地
方D的区域停留信息分别更新到关于地方B和地方D的当天驻留用户集合中去。
行叠加得到关于所述相同停留区域信息的总停留时间,将总停留时间一一与阈值进行对
比,择出总停留时间大于等于阈值的区域停留信息,更新至对应区域内的当天驻留用户集
合;
地方D为四个不同地理位置的区域即所对应的网格均不相同,同时用户在地方A停留过两
次,停留的时间分别为Ta1和Ta2。因此在判断是否为驻留用户时,首先需要将关于地方A的
两次停留时间进行叠加进一步得到在地方A停留的总停留时间T= Ta1+ Ta2,然后将总停留
时间与阈值进行大小对比。本实施例中,所述阈值取值为4小时。则T、Tb、Tc和Td中有至少一
个是大于4小时的,则表示该用户分别在对应区域内均为驻留用户,分别更新到对应区域内
的当天驻留用户集合。举例说明,若T=6小时、Tb=1小时、Tc=3小时和Td=2小时,经对比发现:
仅T大于阈值,则表示该用户在地方A为驻留用户,则将关于地方A的区域停留信息分别更新
到对应区域的当天驻留用户集合中去。
群为Yd‑Yd‑1。
群为Yd‑1‑Yd。
第一分析结果和/或第二分析结果输出至MySQL结果表并乘以系数来进行扩样,所述系数δ
的取值为0.58‑0.61。
息转化成区域‑用户清单信息并保存更新至数据库中;
用户集合与上个批次用户集合进行分析,输出第一分析结果,得到对应区域内的实时流入
流出统计表;
比分析输出第二分析结果,得到对应区域内的每日流入流出统计表。
算可以自动发现人口流动方向。此外通过网格式统计系统提升人口统计的效率性。实现全
自动化人口统计功能,无需耗费人力资源进行人口统计,同时还具备很好的人员流动及时
掌控性。