一种基于无线用户信令的人口统计方法及系统转让专利

申请号 : CN202111637462.0

文献号 : CN113993120B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 艾怀丽卫俊俊赵丹怀孟浩张徐

申请人 : 中国移动紫金(江苏)创新研究院有限公司

摘要 :

本发明一种基于无线用户信令的人口统计方法及系统,属于无线通信网络的技术领域。将网格‑用户清单信息转化成区域‑用户清单信息并保存更新至数据库中;将当前批次用户集合与上个批次用户集合进行分析,输出第一分析结果,得到对应区域内的实时流入流出统计表;将当天驻留用户集合与前一天驻留用户集合进行对比分析输出第二分析结果,得到对应区域内的每日流入流出统计表。本发明基于手机用户与网络交互的信令数据来做人口统计做到更小颗粒度的统计周期,快速地统计人口数量和人口迁移轨迹,从而为人口宏观策略制定、经济分析、疫情控制等紧急事件治理提供有效数据支撑,提升人口统计效率,减少疫情等公众安全时间的影响,实现降本增效的目的。

权利要求 :

1.一种基于无线用户信令的人口统计方法,其特征在于,包括以下步骤:针对每个网格,按照预定时间间隔获取当前时间点和对应的用户清单,生成网格‑用户清单信息;基于区域网格参数信息,将所述网格‑用户清单信息转化成区域‑用户清单信息并保存更新至数据库中;

以当前时间点为截点,向前追溯预定时间段,将所述预定时间段内的所有区域‑用户清单信息采用合并去重的方式得到当前批次用户集合;将当前批次用户集合与上个批次用户集合进行分析,输出第一分析结果,得到对应区域内的实时流入流出统计表;

于所述数据库中生成每日驻留清单,基于每日驻留清单中筛选得到当天驻留用户集合,将当天驻留用户集合与前一天驻留用户集合进行对比分析输出第二分析结果,得到对应区域内的每日流入流出统计表;

其中,所述每日驻留清单的生成具体包括以下步骤:以用户手机为信号源,于数据库中获取用户于当日零点距当前时间点所停留过的N个网格信息,生成与所述网格信息相对应的N个网格停留信息,其中N为大于等于1的整数;基于区域网格参数信息,将所述N个网格停留信息转化为对应的N个区域停留信息,所述区域停留信息至少包括:日期‑时间段、停留区域信息、单次停留时间和用户手机号码;所述N个区域停留信息即为每日驻留清单;

当天驻留用户集合的筛选包括以下步骤:若每日驻留清单中在不同时间段获得的停留区域信息各不相同,则将每个区域停留信息中的单次停留时间一一与阈值进行对比,将单次停留时间大于等于阈值的区域停留信息择出来,并更新至对应区域内的当天驻留用户集合;

若每日驻留清单中在不同时间段获得的停留区域信息至少有两个相同停留区域,将具有相同停留区域信息的单次停留时间进行叠加得到关于所述相同停留区域信息的总停留时间,将总停留时间一一与阈值进行对比,择出总停留时间大于等于阈值的区域停留信息,更新至对应区域内的当天驻留用户集合;将剩余不同的区域停留信息中的单次停留时间一一与阈值进行对比,择出单次停留时间大于等于阈值的区域停留信息,并更新至对应区域内的当天驻留用户集合。

2.根据权利要求1所述的一种基于无线用户信令的人口统计方法,其特征在于,还包括:对第一分析结果和/或第二分析结果进行扩样处理。

3.根据权利要求1所述的一种基于无线用户信令的人口统计方法,其特征在于,将当前批次用户集合与上个批次用户集合进行分析具体包括以下步骤:定义当前批次用户集合为Xt,上个批次用户集合为Xt‑1,则Xt表示当前时间点t对应区域下的人群,Xt‑1为上个时间点t‑1对应区域下的人群,其中预定时间段为当前时间点t‑上个时间点t‑1;

若Xt>Xt‑1,则分析出对应区域下的人群动态为流入,且实时流入人群为Xt‑Xt‑1;

若Xt<Xt‑1,则分析出对应区域下的人群动态为流出,且实时流出人群为Xt‑1‑Xt;

若Xt=Xt‑1,则分析出对应区域下无人口流动。

4.根据权利要求1所述的一种基于无线用户信令的人口统计方法,其特征在于,所述网格‑用户清单信息至少包括:当前时间点、用户所在网格信息和用户手机号码;

所述区域网格参数信息包括:区域信息和网格信息,其中所述区域信息与所述网格信息之间存在预设的对应关系;

所述区域‑用户清单信息至少包括:当前时间点、用户所在区域信息和用户手机号码。

5.根据权利要求1所述的一种基于无线用户信令的人口统计方法,其特征在于,将当天驻留用户集合与前一天驻留用户集合进行对比分析的流程如下:定义当天驻留用户集合为Yd,前一天驻留用户集合为Yd‑1,则Yd为当天的对应区域下的驻留人群,则 Yd‑1为前一天的对应区域下的驻留人群;

若Yd>Yd‑1,则分析出对应区域下的当天与前一天的人群动态为流入,且每日流入人群为Yd‑Yd‑1;

若Yd<Yd‑1,则分析出对应区域下的当天与前一天的人群动态为流出,且每日流出人群为Yd‑1‑Yd;

若Yd=Yd‑1,则分析出对应区域下的当天与前一天相比无流动。

6.根据权利要求1所述的一种基于无线用户信令的人口统计方法,其特征在于,所述预定时间段为若干个连续的预定时间间隔。

7.一种基于无线用户信令的人口统计系统,其特征在于,包括:第一模块,针对每个网格,按照预定时间间隔获取当前时间点和对应的用户清单,生成网格‑用户清单信息;基于区域网格参数信息,将所述网格‑用户清单信息转化成区域‑用户清单信息并保存更新至数据库中;

第二模块,以当前时间点为截点,向前追溯预定时间段,将所述预定时间段内的所有区域‑用户清单信息采用合并去重的方式得到当前批次用户集合;将当前批次用户集合与上个批次用户集合进行分析,输出第一分析结果,得到对应区域内的实时流入流出统计表;

第三模块,于所述数据库中生成每日驻留清单,基于每日驻留清单中筛选得到当天驻留用户集合,将当天驻留用户集合与前一天驻留用户集合进行对比分析输出第二分析结果,得到对应区域内的每日流入流出统计表;

第四模块,以用户手机为信号源,于数据库中获取用户于当日零点距当前时间点所停留过的N个网格信息,生成与所述网格信息相对应的N个网格停留信息,其中N为大于等于1的整数;

基于区域网格参数信息,将所述N个网格停留信息转化为对应的N个区域停留信息,所述区域停留信息至少包括:日期‑时间段、停留区域信息、单次停留时间和用户手机号码;所述N个区域停留信息即为每日驻留清单;

第五模块,若每日驻留清单中在不同时间段获得的停留区域信息各不相同,则将每个区域停留信息中的单次停留时间一一与阈值进行对比,将单次停留时间大于等于阈值的区域停留信息择出来,并更新至对应区域内的当天驻留用户集合;

若每日驻留清单中在不同时间段获得的停留区域信息至少有两个相同停留区域,将具有相同停留区域信息的单次停留时间进行叠加得到关于所述相同停留区域信息的总停留时间,将总停留时间一一与阈值进行对比,择出总停留时间大于等于阈值的区域停留信息,更新至对应区域内的当天驻留用户集合;将剩余不同的区域停留信息中的单次停留时间一一与阈值进行对比,择出单次停留时间大于等于阈值的区域停留信息,并更新至对应区域内的当天驻留用户集合。

说明书 :

一种基于无线用户信令的人口统计方法及系统

技术领域

[0001] 本发明属于无线通信网络的技术领域,特别是涉及一种基于无线用户信令的人口统计方法及系统。

背景技术

[0002] 近年来随着手机普及率的迅猛提升,手机几乎覆盖所有城市人口,而运用手机信令分析技术对人口统计进行计算成为了一个较好的选择。手机信令大数据作为一种时空轨
迹大数据,基于基站进行定位,具有海量性、真实性、连续性、完整性、及时性和无感知性,可
对人口活动轨迹的整个过程进行观测。运用无线用户信令大数据进行计算人口数量,可有
效减少调查时长,降低成本及人力损耗。
[0003] 而由于无线用户信令数据为移动通信网信令大数据中控制面信令数据的一小部分,且信令数据规模每天数以亿计,如何从海量的信令数据中有效的识别出用户所处位置、
移动轨迹并实现区域性、全面性的人口统计就成为了疫情期间亟需的一个技术问题。

发明内容

[0004] 本发明为解决上述背景技术中存在的技术问题,提供了一种基于无线用户信令的人口统计方法及系统。
[0005] 本发明采用以下技术方案:一种基于无线用户信令的人口统计方法,包括以下步骤:
[0006] 针对每个网格,按照预定时间间隔获取当前时间点和对应的用户清单,生成网格‑用户清单信息;基于区域网格参数信息,将所述网格‑用户清单信息转化成区域‑用户清单
信息并保存更新至数据库中;
[0007] 以当前时间点为截点,向前追溯预定时间段,将所述预定时间段内的所有区域‑用户清单信息采用合并去重的方式得到当前批次用户集合;将当前批次用户集合与上个批次
用户集合进行分析,输出第一分析结果,得到对应区域内的实时流入流出统计表;
[0008] 于所述数据库中生成每日驻留清单,基于每日驻留清单中筛选得到当天驻留用户集合,将当天驻留用户集合与前一天驻留用户集合进行对比分析输出第二分析结果,得到
对应区域内的每日流入流出统计表。
[0009] 在进一步的实施例中,还包括:对第一分析结果和/或第二分析结果进行扩样处理。
[0010] 在进一步的实施例中,将当前批次用户集合与上个批次用户集合进行分析具体包括以下步骤:
[0011] 定义当前批次用户集合为Xt,上个批次用户集合为Xt‑1,则Xt表示当前时间点t对应区域下的人群,Xt‑1为上个时间点t‑1对应区域下的人群,其中预定时间段为当前时间点t‑
上个时间点t‑1;
[0012] 若Xt>Xt‑1,则分析出对应区域下的人群动态为流入,且实时流入人群为Xt‑Xt‑1;
[0013] 若Xt<Xt‑1,则分析出对应区域下的人群动态为流出,且实时流出人群为Xt‑1‑Xt;
[0014] 若Xt=Xt‑1,则分析出对应区域下无人口流动。
[0015] 在进一步的实施例中,所述网格‑用户清单信息至少包括:当前时间点、用户所在网格信息和用户手机号码;
[0016] 所述区域网格参数信息包括:区域信息和网格信息,其中所述区域信息与所述网格信息之间存在预设的对应关系;
[0017] 所述区域‑用户清单信息至少包括:当前时间点、用户所在区域信息和用户手机号码。
[0018] 在进一步的实施例中,所述每日驻留清单的生成具体包括以下步骤:
[0019] 以用户手机为信号源,于数据库中获取用户于当日零点距当前时间点所停留过的N个网格信息,生成与所述网格信息相对应的N个网格停留信息,其中N为大于等于1的整数;
[0020] 基于区域网格参数信息,将所述N个网格停留信息转化为对应的N个区域停留信息,所述区域停留信息至少包括:日期‑时间段、停留区域信息、单次停留时间和用户手机号
码;
[0021] 所述N个区域停留信息即为每日驻留清单。
[0022] 在进一步的实施例中,当天驻留用户集合的筛选包括以下步骤:
[0023] 若每日驻留清单中在不同时间段获得的停留区域信息各不相同,则将每个区域停留信息中的单次停留时间一一与阈值进行对比,将单次停留时间大于等于阈值的区域停留
信息择出来,并更新至对应区域内的当天驻留用户集合。
[0024] 在进一步的实施例中,当天驻留用户集合的筛选包括以下步骤:
[0025] 若每日驻留清单中在不同时间段获得的停留区域信息至少有两个相同停留区域,将具有相同停留区域信息的单次停留时间进行叠加得到关于所述相同停留区域信息的总
停留时间,将总停留时间一一与阈值进行对比,择出总停留时间大于等于阈值的区域停留
信息,更新至对应区域内的当天驻留用户集合;
[0026] 将剩余不同的区域停留信息中的单次停留时间一一与阈值进行对比,择出单次停留时间大于等于阈值的区域停留信息,并更新至对应区域内的当天驻留用户集合。
[0027] 在进一步的实施例中,将当天驻留用户集合与前一天驻留用户集合进行对比分析的流程如下:
[0028] 定义当天驻留用户集合为Yd,前一天驻留用户集合为Yd‑1,则Yd为当天的对应区域下的驻留人群,则 Yd‑1为前一天的对应区域下的驻留人群;
[0029] 若Yd>Yd‑1,则分析出对应区域下的当天与前一天的人群动态为流入,且每日流入人群为Yd‑Yd‑1;
[0030] 若Yd<Yd‑1,则分析出对应区域下的当天与前一天的人群动态为流出,且每日流出人群为Yd‑1‑Yd;
[0031] 若Yd=Yd‑1,则分析出对应区域下的当天与前一天相比无流动。
[0032] 在进一步的实施例中,所述预定时间段为若干个连续的预定时间间隔。
[0033] 一种基于无线用户信令的人口统计系统,包括:
[0034] 第一模块,针对每个网格,按照预定时间间隔获取当前时间点和对应的用户清单,生成网格‑用户清单信息;基于区域网格参数信息,将所述网格‑用户清单信息转化成区域‑
用户清单信息并保存更新至数据库中;
[0035] 第二模块,以当前时间点为截点,向前追溯预定时间段,将所述预定时间段内的所有区域‑用户清单信息采用合并去重的方式得到当前批次用户集合;将当前批次用户集合
与上个批次用户集合进行分析,输出第一分析结果,得到对应区域内的实时流入流出统计
表;
[0036] 第三模块,于所述数据库中生成每日驻留清单,基于每日驻留清单中筛选得到当天驻留用户集合,将当天驻留用户集合与前一天驻留用户集合进行对比分析输出第二分析
结果,得到对应区域内的每日流入流出统计表。
[0037] 本发明的有益效果:本发明的人口数据统计具有实时性、全面性和海量性,更适合当前疫情控制的人口统计,基于手机用户与网络交互的信令数据来做人口统计可以做到更
小颗粒度的统计周期(比如15分钟)。同时,快速地统计人口数量和人口迁移轨迹,从而为人
口宏观策略制定、经济分析、疫情控制等紧急事件治理提供有效数据支撑,提升人口统计效
率,减少疫情等公众安全时间的影响,实现降本增效的目的。

附图说明

[0038] 图1为关于区域的实时人口统计的流程图;
[0039] 图2为关于区域的历时人口统计的流程图。

具体实施方式

[0040] 目前城市人口统计方法主要分为两种,静态统计法和动态统计法:
[0041] 1)静态统计法是依赖于我们国家现有的人口统计制度和机构,包括统计局、公安局、计生办等,这种方法一般通过公安户籍管理机关登记了常住人口的人,无论其是否外
出,成为该地的户籍人口。流动人口是指离开了户籍所在地到其他地方居住的人口。暂住人
口是指离开户籍所在地,在该地区暂时居住一定期限的人口。常住人口是指居住在某地半
年以上的人口。
[0042] 2)动态统计法是指自然增长和机械增长之和就是城市人口的增长值。自然增长是指人口再生产的变化量,即出生人数和死亡人数的净差值。机械增长是指在一定时期内由
于人口迁入和迁出而引起的人口数量变化。
[0043] 但是仍存在以下问题:由于交通便利,城市之间人口流动频繁,不能统计到城市实际人口;偏于行政管理数据,统计数据存在滞后性、统计流程较为复杂。
[0044] 实施例1
[0045] 为了解决上述技术问题,本实施例提供了一种基于无线用户信令的人口统计方法,包括以下步骤:
[0046] 信息获取:针对每个网格,按照预定时间间隔获取当前时间点和对应的用户清单,生成网格‑用户清单信息;基于区域网格参数信息,将所述网格‑用户清单信息转化成区域‑
用户清单信息并保存更新至数据库中;
[0047] 如图1所示,关于区域的实时人口统计:以当前时间点为截点,向前追溯预定时间段,将所述预定时间段内的所有区域‑用户清单信息采用合并去重的方式得到当前批次用
户集合;将当前批次用户集合与上个批次用户集合进行分析,输出第一分析结果,得到对应
区域内的实时流入流出统计表;
[0048] 图2所示的关于区域的历时人口统计:于所述数据库中生成每日驻留清单,基于每日驻留清单中筛选得到当天驻留用户集合,将当天驻留用户集合与前一天驻留用户集合进
行对比分析输出第二分析结果,得到对应区域内的每日流入流出统计表。
[0049] 在进一步的实施例中,所述网格为数据结构服务器(redis)中的所有网格,增加用户手机信号获取的全面性。预定时间间隔根据需求而定,在本实施例中,以预定时间间隔15
分钟为例,即每15分钟获取一次用户清单,生成网格‑用户清单信息。举例说明,将上午9点
15分定为当前时间点,则上一次获取用户清单的时间点为上9点,下一次获取用户清单的时
间点为9点30分。且生成的用户清单信息是与网格相对应的,进一步表示为,网格‑用户清单
信息至少包括:当前时间点、用户所在网格信息和用户手机号码。基于上述举例,网格‑用户
清单信息包括:9点15分,9点15分用户所在的网格信息和用户手机号码。
[0050] 因此,为了将人口统计细化到各类区域(城市、行政区、街道等),便于实现疫情期间的管控,因此需要将与网格相关联的清单转化为与区域相关的清单。
[0051] 在进一步的实施中,区域网格参数信息包括:区域信息和网格信息,其中区域信息与所述网格信息之间存在预设的对应关系;所述预设的对应关系进一步解释为:某城市、某
街道或者某小区对应占用且唯一的网络。使得网格‑用户清单信息直接转化为区域‑用户清
单信息,其中所述区域‑用户清单信息至少包括:当前时间点(9点15分)、用户于当前时间所
在的区域信息和用户手机号码。
[0052] 换言之,当前区域信息至少包括:关于小区的区名(小区A、小区B、小区C)和/或地理坐标;关于城市的市名(城市A、城市B、城市C)和/或地理坐标等等。其中不同的小区都有
与之相配的网格参数,即小区A、小区B、小区C分别对应于唯一的网格参数A、网格参数B、网
格参数C,因此当前区域信息与网格信息相互之间可相互转化或者相互调用。因此通过区域
网格参数信息,将网格‑用户清单信息转化成区域‑用户清单信息并保存更新至数据库中;
便于在统计时直接将人口统计或者流动定位在区域内,实现更精准的定位。
[0053] 在本实施中,用户手机号码同时对应于时间信息、区域信息和网格信息,也就是通过对其中任意一个或者多个信息的调用,便可找出对应的用户所在区域或者动向;亦或者
通过用户手机号码便可调出该用户在过去时间内的停留信息,创建了多维度的信息链,增
加了人口统计的全面性和进一步提高精度。
[0054] 在进一步的实施例中,为了便于后期采集的数据与前期存储的所有数据进行有效的对比和分析,故在数据库对每次更新进来的数据进行持久化处理:利用Spark的presist
( )和cache( )方法持久化;将内存中的数据存放到磁盘中。
[0055] 在进一步的实施例中,关于区域的实时人口统计中,以9点15分为截点(预定时间间隔15分钟),向前追溯预定时间段,需要说明的是,预定时间段为若干个连续的预定时间
间隔。则在本实施例中,预定时间段为八个连续的预定时间间隔,即预定时间段为2小时,也
就是意味着以9点15分为截点,向前追溯2小时追溯到7点15分,将7点15分至9点15分之间得
到的所有区域‑用户清单信息采用合并去重的方式得到当前批次用户集合。即所有区域‑用
户清单信息采包括:7点15分获取到的区域‑用户清单信息、7点30分获取到的区域‑用户清
单信息、7点45分获取到的区域‑用户清单信息、…、9点获取到的区域‑用户清单信息和9点
15分获取到的区域‑用户清单信息。采用合并去重的方式即若以上区域‑用户清单信息中,
有相同的信息则去重保留在最后时间点得到的区域‑用户清单信息即可,从而得到当前批
次用户集合。
[0056] 换言之,当预定时间段为m个连续的预定时间间隔时,其中m为大于等于2的整数,则在预定时间段内按照预定时间间隔获取到(m+1)个区域‑用户清单信息,将所述(m+1)个
区域‑用户清单信息采用合并去重的方式得到当前批次用户集合。当第i个区域‑用户清单
信息与第i+1个区域‑用户清单信息相同,则在当前批次用户集合中剔除第i个区域‑用户清
单信息,保留第i+1个区域‑用户清单信息,其中1≤i≤m。若每个区域‑用户清单信息均不相
同,则在当前批次用户集合中全部保留。
[0057] 在进一步的实施例中,将当前批次用户集合与上个批次用户集合进行分析具体包括以下步骤:
[0058] 定义当前批次用户集合为Xt,上个批次用户集合为Xt‑1,则Xt表示当前时间点t对应区域下的人群,Xt‑1为上个时间点t‑1对应区域下的人群,其中预定时间段为当前时间点t‑
上个时间点t‑1。
[0059] 若Xt>Xt‑1,则分析出对应区域下的人群动态为流入,且实时流入人群为Xt‑Xt‑1;则当前实时流入流出统计表中统计出当前的区域下的人群为Xt,流入人群为Xt‑Xt‑1。
[0060] 若Xt<Xt‑1,则分析出对应区域下的人群动态为流出,且实时流出人群为Xt‑1‑Xt;则当前实时流入流出统计表中统计出当前的区域下的人群为Xt,流出人群Xt‑1‑Xt。
[0061] 若Xt=Xt‑1,则分析出对应区域下无人口流动。则当前实时流入流出统计表中统计出当前的区域下的人群为Xt或者Xt‑1,流出人群为0。但是不管当前处于流入、流出还是无流
动,每个集合中的元素都有对应的信息,都能基于用户号码或者网格信息或者当前区域信
息调用对应的时间点的走向,形成网格式人口统计。
[0062] 在进一步的实施例中,关于区域的历时人口统计中,每日驻留清单的生成具体包括以下步骤:以用户手机为信号源,于数据库中获取用户于当日零点距当前时间点所停留
过的N个网格信息,生成与所述网格信息相对应的N个网格停留信息,其中N为大于等于1的
整数;基于区域网格参数信息,将所述N个网格停留信息转化为对应的N个区域停留信息,所
述区域停留信息至少包括:日期‑时间段(停留在当前区域的起始时间至时间截点或停留在
当前区域的起始时间至终止时间)、停留区域信息、单次停留时间和用户手机号码;所述N个
区域停留信息即为每日驻留清单。
[0063] 进一步理解为,所述数据库中包括了不同时间点获取得到的区域‑用户清单信息,即一天内统计得到的区域‑用户清单信息都在数据库中,因此以天为单位,从零点距当前时
间点为统计节点,在数据库中获取用户当天的区域‑用户清单信息,通过不同时间段的区
域‑用户清单信息可获知用户当天所停留过的N个网格信息,若用户当天一直呆在地方A没
有移动过,则N=1,且停留时间为11小时,则该用户的每日驻留清单为1个区域停留信息:某
天‑时间段(停留在地方A的起始时间至时间截点)、地方A、11小时和该用户的手机号码。
[0064] 若用户当天去过至少两个不同的地方,地方A和地方B,则N≥2。用户在地方A的停留时间为7小时,在地方B的停留时间为2小时,则该用户的每日驻留清单为2个区域停留信
息:第一个区域停留信息:某天‑时间段(停留在地方A的起始时间至终止时间)、地方A、7小
时和该用户的手机号码;第二个区域停留信息:某天‑时间段(停留在地方B的起始时间至时
间截点)、地方B、2小时和该用户的手机号码。
[0065] 基于上述描述,当天驻留用户集合的筛选包括以下步骤:若每日驻留清单中在不同时间段获得的停留区域信息各不相同,则将每个区域停留信息中的单次停留时间一一与
阈值进行对比,将单次停留时间大于等于阈值的区域停留信息择出来得到当天驻留用户集
合。举例说明,用户从零点开始至时间截点依次到达并停留在地方A、地方B、地方C和地方D,
且停留的时间分别为Ta、Tb、Tc和Td;由于地方A、地方B、地方C和地方D为四个不同地理位置
的区域即所对应的网格均不相同。因此在判断是否为驻留用户时,需要将Ta、Tb、Tc和Td分
别与阈值进行大小对比,在本实施例中,所述阈值取值为4小时。则Ta、Tb、Tc和Td中有至少
一个是大于4小时的,则表示该用户分别在对应区域内均为驻留用户,分别更新到对应区域
内的当天驻留用户集合。举例说明,若Ta=2小时、Tb=6小时、Tc=3小时和Td=5小时,经对比发
现:Tb和Td均大于阈值,则表示该用户分别在地方B和地方D均为驻留用户,关于地方B和地
方D的区域停留信息分别更新到关于地方B和地方D的当天驻留用户集合中去。
[0066] 在另一个实施例中,若用户当天去过多地,且存在部分相同的地方,则N≥2。但是在筛选当天驻留用户集合时,采用以下流程:将具有相同停留区域信息的单次停留时间进
行叠加得到关于所述相同停留区域信息的总停留时间,将总停留时间一一与阈值进行对
比,择出总停留时间大于等于阈值的区域停留信息,更新至对应区域内的当天驻留用户集
合;
[0067] 将剩余不同的区域停留信息中的单次停留时间一一与阈值进行对比,择出单次停留时间大于等于阈值的区域停留信息,并更新至对应区域内的当天驻留用户集合。
[0068] 举例说明,用户从零点开始至时间截点依次到达并停留在地方A、地方B、地方C、地方D再返回至地方A,且停留的时间分别为Ta1、Tb、Tc、Td和Ta2;由于地方A、地方B、地方C和
地方D为四个不同地理位置的区域即所对应的网格均不相同,同时用户在地方A停留过两
次,停留的时间分别为Ta1和Ta2。因此在判断是否为驻留用户时,首先需要将关于地方A的
两次停留时间进行叠加进一步得到在地方A停留的总停留时间T= Ta1+ Ta2,然后将总停留
时间与阈值进行大小对比。本实施例中,所述阈值取值为4小时。则T、Tb、Tc和Td中有至少一
个是大于4小时的,则表示该用户分别在对应区域内均为驻留用户,分别更新到对应区域内
的当天驻留用户集合。举例说明,若T=6小时、Tb=1小时、Tc=3小时和Td=2小时,经对比发现:
仅T大于阈值,则表示该用户在地方A为驻留用户,则将关于地方A的区域停留信息分别更新
到对应区域的当天驻留用户集合中去。
[0069] 若某用户同一天中的在不同地方待过的时间均小于阈值,则表示当天该用户在任何一个地方都不属于驻留客户,因此对该用户不会产生新的当天驻留用户集合元素。
[0070] 在得到当天驻留用户集合的基础上,将当天驻留用户集合与前一天驻留用户集合进行对比分析的流程如下:
[0071] 定义当天驻留用户集合为Yd,前一天驻留用户集合为Yd‑1,则Yd为当天的对应区域下的驻留人群,则 Yd‑1为前一天的对应区域下的驻留人群;
[0072] 若Yd>Yd‑1,则分析出对应区域下的当天与前一天的人群动态为流入,且每日流入人群为Yd‑Yd‑1;则每日流入流出统计表中统计出当天的区域下的驻留人群为Yd,当天流入人
群为Yd‑Yd‑1。
[0073] 若Yd<Yd‑1,则分析出对应区域下的当天与前一天的人群动态为流出,且每日流出人群为Yd‑Yd‑1。则每日流入流出统计表中统计出当天的区域下的驻留人群为Yd,当天流出人
群为Yd‑1‑Yd。
[0074] 若Yd=Yd‑1,则分析出对应区域下的当天与前一天相比无流动,即未发生变化。
[0075] 为了增加人口统计的精确度,本实施例还包括:对第一分析结果和/或第二分析结果的扩样处理。即在生成实时流入流出统计表和/或每日流入流出统计表进行扩样处理。将
第一分析结果和/或第二分析结果输出至MySQL结果表并乘以系数来进行扩样,所述系数δ
的取值为0.58‑0.61。
[0076] 实施例2
[0077] 本实施例公开了一种基于无线用户信令的人口统计系统,用于实现实施例1所述的统计方法。
[0078] 包括:第一模块,被设置为针对每个网格,按照预定时间间隔获取当前时间点和对应的用户清单,生成网格‑用户清单信息;基于区域网格参数信息,将所述网格‑用户清单信
息转化成区域‑用户清单信息并保存更新至数据库中;
[0079] 第二模块,被设置为以当前时间点为截点,向前追溯预定时间段,将所述预定时间段内的所有区域‑用户清单信息采用合并去重的方式得到当前批次用户集合;将当前批次
用户集合与上个批次用户集合进行分析,输出第一分析结果,得到对应区域内的实时流入
流出统计表;
[0080] 第三模块,被设置为基于所述实时流入流出统计表生成每日驻留清单,于每日驻留清单中筛选得到当天驻留用户集合,将当天驻留用户集合与前一天驻留用户集合进行对
比分析输出第二分析结果,得到对应区域内的每日流入流出统计表。
[0081] 本发明采用网格信息、区域信息以及较短时间间隔之间的更新构成了相互之间存在预定关联的网格式统计系统,同时设计了流入、流出的人口统计处理方法。通过模型的计
算可以自动发现人口流动方向。此外通过网格式统计系统提升人口统计的效率性。实现全
自动化人口统计功能,无需耗费人力资源进行人口统计,同时还具备很好的人员流动及时
掌控性。