一种人口分布分析方法及装置转让专利

申请号 : CN202010080203.1

文献号 : CN110930285B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 朱丽云胡杨林张盈盈武健

申请人 : 北京交研智慧科技有限公司

摘要 :

本发明实施例提供一种人口分布分析方法及装置,该方法包括:获取目标区域中每个地块的用电量数据;根据用电量数据,识别地块的类别;获取目标区域内用户设备的信令数据;根据信令数据,确定目标区域中的工作地和居住地;根据用电量数据,确定居住地的用电户数;根据信令数据,确定OD数据;根据用电户数和信令数据,确定扩样系数;根据扩样系数和OD数据,确定目标区域的人口分布特征。本发明实施例中,通过居住地地块用电户数与用户设备的信令数据的对应关系,分析计算扩样系数,通过OD数据的分配获取工作地及游息地的人口分布特征,这种扩样系数计算方法有效解决现有人口分析方法准确度有限,且不能给出城市人口的动态分布描述的问题。

权利要求 :

1.一种人口分布分析方法,其特征在于,所述方法包括:将目标区域划分为多个地块,并获取每个所述地块的用电量数据;

根据所述用电量数据,识别所述地块的类别;

获取目标区域内用户设备的信令数据;

根据所述信令数据,确定所述目标区域中的工作地和居住地;

根据所述用电量数据,确定所述居住地的用电户数;

根据所述信令数据,确定交通出行量(OD)数据;

根据所述用电户数和所述信令数据,确定扩样系数;

根据所述扩样系数和所述交通出行量(OD)数据,确定所述目标区域的人口分布特征。

2.根据权利要求1所述的方法,其特征在于,所述根据所述用电量数据,识别所述地块的类别,包括:通过第一公式计算所述地块在工作时间段的用电比例,以及通过第二公式计算所述地块在休息时间段的用电比例;

所述第一公式为:

所述第二公式为:

在 < 且 < 的情况下,确定所述地块的类别为居住地特征地块;

在 > 且 的情况下,确定所述地块的类别为混合区特征地块;

在 且 < 的情况下,确定所述地块的类别为工作地特征地块;

其中, 表示所述地块在工作时间段的用电量 占全天用电量 的比例; 表示所述地块在休息时间段的用电量 占全天用电量 的比例; 表示所述地块在工作时间段的用电量 占全天用电量 的比例均数; 表示所述地块在休息时间段的用电量占全天用电量 的比例均数。

3.根据权利要求1所述的方法,其特征在于,所述根据所述信令数据,确定所述目标区域中的工作地和居住地,包括:根据所述信令数据,将所有的停留点投影在地理信息系统GIS地图上;

在与居住地分析时间段对应的所有的停留点中确定所述居住地,以及在与工作地分析时间段对应的所有的停留点中确定所述工作地。

4.根据权利要求3所述的方法,其特征在于,在所有的停留点中确定所述居住地或所述工作地,包括:将所有的停留点中停留时间不小于第一停留时间阈值的停留点确定为备选停留点;

将所有的备选停留点中停留时间占预设时间间隔比例不小于预设停留概率阈值的停留点确定为第一有效停留点;

将所有的第一有效停留点中停留时间最长的停留点确定为所述居住地或所述工作地。

5.根据权利要求1所述的方法,其特征在于,所述根据所述信令数据,确定交通出行量(OD)数据,包括:对所述目标区域内的多个基站进行聚类处理;

根据聚类处理后的基站所记录的所述信令数据,确定所述用户设备的停留轨迹;

将所述停留轨迹中停留时间不小于第二停留时间阈值的停留点确定为第二有效停留点;

遍历所有第二有效停留点,确定所述用户设备的出行起终点;

统计所述出行起终之间的交通出行量(OD)数据。

6.根据权利要求1所述的方法,其特征在于,所述根据所述用电户数和所述信令数据,确定扩样系数,包括:建立所述用电户数与所述信令数据的对应关系;

根据所述对应关系拟合曲线;

根据拟合的曲线确定所述扩样系数。

7.一种人口分布分析装置,其特征在于,包括:第一获取模块,用于将目标区域划分为多个地块,并获取每个所述地块的用电量数据;

识别模块,用于根据所述用电量数据,识别所述地块的类别;

第二获取模块,用于获取目标区域内用户设备的信令数据;

第一确定模块,用于根据所述信令数据,确定所述目标区域中的工作地和居住地;

第二确定模块,用于根据所述用电量数据,确定所述居住地的用电户数;

第三确定模块,用于根据所述信令数据,确定交通出行量(OD)数据;

第四确定模块,用于根据所述用电户数和所述信令数据,确定扩样系数;

第五确定模块,用于根据所述扩样系数和所述交通出行量(OD)数据,确定所述目标区域的人口分布特征。

8.根据权利要求7所述的装置,其特征在于,所述识别模块包括:计算单元,用于通过第一公式计算所述地块在工作时间段的用电比例,以及通过第二公式计算所述地块在休息时间段的用电比例;

所述第一公式为:

所述第二公式为:

在 < 且 < 的情况下,确定所述地块的类别为居住地特征地块;

在 > 且 的情况下,确定所述地块的类别为混合区特征地块;

在 且 < 的情况下,确定所述地块的类别为工作地特征地块;

其中, 表示所述地块在工作时间段的用电量 占全天用电量 的比例; 表示所述地块在休息时间段的用电量 占全天用电量 的比例; 表示所述地块在工作时间段的用电量 占全天用电量 的比例均数; 表示所述地块在休息时间段的用电量占全天用电量 的比例均数。

9.根据权利要求7所述的装置,其特征在于,所述第一确定模块包括:投影单元,用于根据所述信令数据,将所有的停留点投影在地理信息系统GIS地图上;

第一确定单元,用于在与居住地分析时间段对应的所有的停留点中确定所述居住地,以及在与工作地分析时间段对应的所有的停留点中确定所述工作地。

10.根据权利要求9所述的装置,其特征在于,所述第一确定单元包括:第一确定子单元,用于将所有的停留点中停留时间不小于第一停留时间阈值的停留点确定为备选停留点;

第二确定子单元,用于将所有的备选停留点中停留时间占预设时间间隔比例不小于预设停留概率阈值的停留点确定为第一有效停留点;

第三确定子单元,用于将所有的第一有效停留点中停留时间最长的停留点确定为所述居住地或所述工作地。

11.根据权利要求7所述的装置,其特征在于,所述第三确定模块包括:处理单元,用于对所述目标区域内的多个基站进行聚类处理;

第二确定单元,用于根据聚类处理后的基站所记录的所述信令数据,确定所述用户设备的停留轨迹;

第三确定单元,用于将所述停留轨迹中停留时间不小于第二停留时间阈值的停留点确定为第二有效停留点;

第四确定单元,用于遍历所有第二有效停留点,确定所述用户设备的出行起终点;

统计单元,用于统计所述出行起终之间的交通出行量(OD)数据。

12.根据权利要求7所述的装置,其特征在于,所述第四确定模块包括:建立单元,用于建立所述用电户数与所述信令数据的对应关系;

拟合单元,用于根据所述对应关系拟合曲线;

第五确定单元,用于根据拟合的曲线确定所述扩样系数。

说明书 :

一种人口分布分析方法及装置

技术领域

[0001] 本发明实施例涉及交通技术领域,特别涉及一种人口分布分析方法及装置。

背景技术

[0002] 人口要素在很大程度上决定了城市发展对自然资源、土地、基础设施和公共服务设施的需求,进而对城市的空间布局和发展方向有重要影响。作为城市居民生产生活的两大载体,“居住”和“就业”是城市空间结构中的两个核心内生变量,彼此依存相互影响。由掌握人口活动分布特征引发的研究和识别技术受到智能交通行业的广泛关注。
[0003] 传统获取城市居民职住空间分布的方式主要为上门走访、问卷调查等,这类方式不仅会消耗大量的人力物力,而且获取的样本数量也有限。近年来,基于位置感知数据不断成为城市人口统计的新兴手段。
[0004] 基于地理信息系统(Geographic Information System,GIS)和遥感数据,通过对城市居住面积的测算,结合社会经济统计数据对城市潜在人口分布特征进行分析,但是这种方法是一种静态统计方法,准确度有限,更不能给出城市人口的动态分布描述。

发明内容

[0005] 本发明实施例提供一种人口分布分析方法及装置,解决现有人口分析方法准确度有限,且不能给出城市人口的动态分布描述的问题。
[0006] 第一方面,本发明实施例提供一种人口分布分析方法,所述方法包括:
[0007] 将目标区域划分为多个地块,并获取每个所述地块的用电量数据;
[0008] 根据所述用电量数据,识别所述地块的类别;
[0009] 获取目标区域内用户设备的信令数据;
[0010] 根据所述信令数据,确定所述目标区域中的工作地和居住地;
[0011] 根据所述用电量数据,确定所述居住地的用电户数;
[0012] 根据所述信令数据,确定交通出行量OD数据;
[0013] 根据所述用电户数和所述信令数据,确定扩样系数;
[0014] 根据所述扩样系数和所述OD数据,确定所述目标区域的人口分布特征。
[0015] 可选地,所述根据所述用电量数据,识别所述地块的类别,包括:
[0016] 通过第一公式计算所述地块在工作时间段的用电比例,以及通过第二公式计算所述地块在休息时间段的用电比例;
[0017] 所述第一公式为:
[0018] ;
[0019] 所述第二公式为:
[0020] ;
[0021] 在 < 且 < 的情况下,确定所述地块的类别为居住地特征地块;
[0022] 在 > 且 的情况下,确定所述地块的类别为混合区特征地块;
[0023] 在 且 < 的情况下,确定所述地块的类别为工作地特征地块;
[0024] 其中, 表示所述地块在工作时间段的用电量 占全天用电量 的比例;表示所述地块在休息时间段的用电量 占全天用电量 的比例; 表示所述地块在工作时间段的用电量 占全天用电量 的比例均数; 表示所述地块在休息时间段的用电量 占全天用电量 的比例均数。
[0025] 可选地,所述根据所述信令数据,确定所述目标区域中的工作地和居住地,包括:
[0026] 根据所述信令数据,将所有的停留点投影在地理信息系统GIS地图上;
[0027] 在与居住地分析时间段对应的所有的停留点中确定所述居住地,以及在与工作地分析时间段对应的所有的停留点中确定所述工作地。
[0028] 可选地,在所有的停留点中确定所述居住地或所述工作地,包括:
[0029] 将所有的停留点中停留时间不小于第一停留时间阈值的停留点确定为备选停留点;
[0030] 将所有的备选停留点中停留时间占预设时间间隔比例不小于预设停留概率阈值的停留点确定为第一有效停留点;
[0031] 将所有的第一有效停留点中停留时间最长的停留点确定为所述居住地或所述工作地。
[0032] 可选地,所述根据所述信令数据,确定交通出行量OD数据,包括:
[0033] 对所述目标区域内的多个基站进行聚类处理;
[0034] 根据聚类处理后的基站所记录的所述信令数据,确定所述用户设备的停留轨迹;
[0035] 将所述停留轨迹中停留时间不小于第二停留时间阈值的停留点确定为第二有效停留点;
[0036] 遍历所有第二有效停留点,确定所述用户设备的出行起终点;
[0037] 统计所述出行起终之间的交通出行量OD数据。
[0038] 可选地,所述根据所述用电户数和所述信令数据,确定扩样系数,包括:
[0039] 建立所述用电户数与所述信令数据的对应关系;
[0040] 根据所述对应关系拟合曲线;
[0041] 根据拟合的曲线确定所述扩样系数。
[0042] 第二方面,本发明实施例提供一种人口分布分析装置,包括:
[0043] 第一获取模块,用于将目标区域划分为多个地块,并获取每个所述地块的用电量数据;
[0044] 识别模块,用于根据所述用电量数据,识别所述地块的类别;
[0045] 第二获取模块,用于获取目标区域内用户设备的信令数据;
[0046] 第一确定模块,用于根据所述信令数据,确定所述目标区域中的工作地和居住地;
[0047] 第二确定模块,用于根据所述用电量数据,确定所述居住地的用电户数;
[0048] 第三确定模块,用于根据所述信令数据,确定交通出行量OD数据;
[0049] 第四确定模块,用于根据所述用电户数和所述信令数据,确定扩样系数;
[0050] 第五确定模块,用于根据所述扩样系数和所述OD数据,确定所述目标区域的人口分布特征。
[0051] 可选地,所述识别模块包括:
[0052] 计算单元,用于通过第一公式计算所述地块在工作时间段的用电比例,以及通过第二公式计算所述地块在休息时间段的用电比例;
[0053] 所述第一公式为:
[0054] ;
[0055] 所述第二公式为:
[0056] ;
[0057] 在 < 且 < 的情况下,确定所述地块的类别为居住地特征地块;
[0058] 在> 且 的情况下,确定所述地块的类别为混合区特征地块;
[0059] 在 且 < 的情况下,确定所述地块的类别为工作地特征地块;
[0060] 其中, 表示所述地块在工作时间段的用电量 占全天用电量 的比例;表示所述地块在休息时间段的用电量 占全天用电量 的比例; 表示所述地块在工作时间段的用电量 占全天用电量 的比例均数; 表示所述地块在休息时间段的用电量 占全天用电量 的比例均数。
[0061] 可选地,所述第一确定模块包括:
[0062] 投影单元,用于根据所述信令数据,将所有的停留点投影在地理信息系统GIS地图上;
[0063] 第一确定单元,用于在与居住地分析时间段对应的所有的停留点中确定所述居住地,以及在与工作地分析时间段对应的所有的停留点中确定所述工作地。
[0064] 可选地,所述第一确定单元包括:
[0065] 第一确定子单元,用于将所有的停留点中停留时间不小于第一停留时间阈值的停留点确定为备选停留点;
[0066] 第二确定子单元,用于将所有的备选停留点中停留时间占预设时间间隔比例不小于预设停留概率阈值的停留点确定为第一有效停留点;
[0067] 第三确定子单元,用于将所有的第一有效停留点中停留时间最长的停留点确定为所述居住地或所述工作地。
[0068] 可选地,所述第三确定模块包括:
[0069] 处理单元,用于对所述目标区域内的多个基站进行聚类处理;
[0070] 第二确定单元,用于根据聚类处理后的基站所记录的所述信令数据,确定所述用户设备的停留轨迹;
[0071] 第三确定单元,用于将所述停留轨迹中停留时间不小于第二停留时间阈值的停留点确定为第二有效停留点;
[0072] 第四确定单元,用于遍历所有第二有效停留点,确定所述用户设备的出行起终点;
[0073] 统计单元,用于统计所述出行起终之间的OD数据。
[0074] 可选地,所述第四确定模块包括:
[0075] 建立单元,用于建立所述用电户数与所述信令数据的对应关系;
[0076] 拟合单元,用于根据所述对应关系拟合曲线;
[0077] 第五确定单元,用于根据拟合的曲线确定所述扩样系数。
[0078] 本发明实施例中,通过居住地地块用电户数与用户设备的信令数据的对应关系,分析计算扩样系数,通过OD数据的分配获取工作地及游息地的人口分布特征,这种扩样系数计算方法有效解决现有人口分析方法准确度有限,且不能给出城市人口的动态分布描述的问题。

附图说明

[0079] 为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图;
[0080] 图1为本发明实施例提供的人口分布分析方法的流程示意图;
[0081] 图2为本发明实施例提供的用电量数据示意图;
[0082] 图3为本发明实施例提供的拟合曲线示意图;
[0083] 图4为本发明实施例提供的人口分布分析装置的结构示意图。

具体实施方式

[0084] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0085] 在本发明实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本发明实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
[0086] 本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将相同名称区分开来,而不是暗示这些名称之间的关系或者顺序。
[0087] 为便于理解本申请的技术方案,首先对以下技术内容进行描述:
[0088] (1)基于手机信令数据的人口分布分析算法;
[0089] 基于手机信令数据的居住和出行特征分析。手机信令数据样本量大、数据客观、全面、且数据具有较强的时空持续性,可以观测到交通出行的整个过程。基于手机信令数据的人口分布分析算法可以弥补传统人口调查周期性长、工作量大、花费高的特点。基于手机信令数据可以实现城市人口职住分析、出行特征分析、出行分析空间分布特征分析、通勤出行分析以及全天人口活动分布。
[0090] 利用泰森多边形确定城市中基站的位置,并将信令数据生成时用户所处的基站位置作为用户的地理位置。通过信令数据获取用户的就业地与居住地后,将就业地与居住地对应的基站位置投影在地图上获取居民的职住分布,并以此为依据研究中心城区与周边地区的居民职住分布与通勤距离。
[0091] 使用居民的手机信令数据获取其居住信息与就业信息,并利用就业信息生成就业密度分布图。市中心的就业密度为基准,识别市内的就业密集区域,从就业密度与通勤距离两方面来测度每个密集区域的能级。分析每个就业中心的核心地区与辐射范围,并以此得出有关各个就业中心的辐射范围、通勤联系以及职住差异等方面的结论。
[0092] 通过对手机信令数据进行处理,获取了居民的就业分布数据,并从城市总体、城市区划、城市街道几个角度对居民的就业区域迁移趋势进行分析,结果发现上海市的就业区域迁移以短距离移动为主,从中心区与远郊区向近郊区迁移。
[0093] (2)基于用电大数据的行业应用技术;
[0094] 用电大数据具有数据数量庞大、数据类型众多、数据增量大、速度快等鲜明的特点。单个省的电力系统每日采集的上万用户电量信息数据,加上后期计算分析产生的中间数据和结果数据,日增量在几十个GB。近年来,用电量数据逐渐开始被应用于城市发展方面,如城市活跃商圈的识别、行业发展规律,但在人口活动分布方面尚且没有相关的应用技术。
[0095] 基于以上描述,手机信令数据广泛应用于城市人口分布和交通出行特征研究。由于国内手机信令数据掌握在移动、联通、电信几大运营商手中,数据来源较为分散,信令数据为不完全采样,且各个运营商在地域分布上具有一定的差异性,故由单一的手机信令数据获得的人口分布和出行特征数据的准确性较低。
[0096] 用电数据具有完全采样的特点,已经逐步应用于城市发展研究领域,但用电数据在空间上是静态数据且标识性较差,无法应用于研究中微观人口的活动轨迹,因此无法应用单一的用电量数据研究人口的职住关系。
[0097] 因此,目前亟需一种基于手机信令和用电量融合的高精度人口分布分析方法。
[0098] 参见图1,本发明实施例提供一种人口分布分析方法,该方法的具体步骤如下:
[0099] 步骤101:将目标区域划分为多个地块,并获取每个地块的用电量数据,然后执行步骤102;
[0100] 在本发明实施例中,目标区域指的是进行人口分布分析时的研究区域,在进行分析之前,先将目标区域划分为多个地块,获取每个地块对应的用电量数据。
[0101] 步骤102:根据用电量数据,识别地块的类别,然后执行步骤105;
[0102] 在本发明实施例中,基于地块的用电量识别出地块的类别,该地块的类别用于表示地块对应的用地功能。
[0103] 需要说明的是,城市土地利用指城市中工业、交通、商业、文化、教育、卫生、住宅和公园绿地等建设用地状况,相较于城市土地覆盖而言,城市土地利用是人的社会活动与城市物质空间之间的交互所表现的综合结果。城市土地中存在着较为明显的功能分区,按照产业结构进行分类,主要可分为:商业区、工业区和居住区。
[0104] 居住用地:居住区是城市居民的生活空间,分布广泛,是城市中面积最大的用地类型。
[0105] 工业用地:重工业区占地面积大,对环境会有污染,与居民生活没有必然联系,故一般分布在城郊地区,轻工业区消费生产为主,与居民的生活联系较密切,一般分布在城商业区外围或根据人口聚集程度分布。
[0106] 商业用地:商业区占地面积较小,一般位于城市或地区中也,是全市交通与通讯网络系统的枢纽,对城市经济和正常运转起着重要作用,更是城市经济活动量最为集中和繁忙的地区。
[0107] 居住用地、工业用地和商业用地的城市居民活动的区别在活动总量与时间分布特性上。商业用地白天工作时间段较为繁忙,夜晚休息时间段相对空闲;居住用地则在白天工作时间段空闲,夜晚承担居住休息功能时则比较繁忙。
[0108] 考虑到用电量的全天时间分布上,不同的时间段用电量是不同的,为确保一天中不同时间段的测量结果具有可比性,故需要对初始数据需要进行进一步处理得到该时间段与全天平均小时的比例。
[0109] 本发明实施例提供一种根据用电量数据,识别地块的类别的,具体流程如下:
[0110] 通过第一公式计算地块在工作时间段的用电比例,以及通过第二公式计算地块在休息时间段的用电比例;
[0111] 第一公式为:
[0112] ;
[0113] 第二公式为:
[0114] ;
[0115] 在 < 且 < 的情况下,确定地块的类别为居住地特征地块;
[0116] 在 > 且 的情况下,确定地块的类别为混合区特征地块;
[0117] 在 且 < 的情况下,确定地块的类别为工作地特征地块;
[0118] 其中, 表示地块在工作时间段的用电量 占全天用电量 的比例; 表示地块在休息时间段的用电量 占全天用电量 的比例; 表示地块在工作时间段的用电量 占全天用电量 的比例均数; 表示地块在休息时间段的用电量 占全天用电量 的比例均数。
[0119] 可以理解的是,上述工作时间段和休息时间段可以根据对应地块当地的活动的人群进行灵活设置,本发明实施例对工作时间段和休息时间段的具体时间不做限定。
[0120] 步骤103:获取目标区域内用户设备的信令数据,然后执行步骤104和步骤106;
[0121] 在本发明实施例中,用户设备指的是在目标区域中能够被获取信令数据的用户设备,该用户设备可以是用户能够随身携带的设备,例如:手机、平板电脑、笔记本电脑等;该用户设备也可以是不可移动的固定设备,例如:监视器、服务器等,在本发明实施例对用户设备的类型不做具体限定。
[0122] 具体地,在获取到用户设备的信令数据后,先对信令数据进行数据清洗,以剔除数据中的干扰信息和噪音。
[0123] 通过用户设备的信令数据可以获知用户设备在时间和位置上的分布特征,使用用户设备的分布特征来代表用户的分布特征,即可获知在目标区域中人口的分布特征。
[0124] 具体地,根据用户设备的信令数据进行人口类型分布,通过人口的停留日期、时间和位置总体上将人口划分为两大类型:常住人口(例如:停留时间超过7小时/天的、天数大于等于50%天,该50%天指的是停留天数占预设研究天数的比例为50%)以及非常住人口。常住人口又分为常驻人员和固定设备,其中定位位置一直不变的识别为固定设备;非常住人口中所有出现的日期里,停留时间均少于3个小时的识别为过境人员,其他为流动人员。
[0125] 可以理解的是,上述各数值仅为举例,本发明实施例并不具体限定各参数的数值。
[0126] 步骤104:根据信令数据,确定目标区域中的工作地和居住地,然后执行步骤105;
[0127] 在本发明实施例中,基于信令数据,在目标区域中识别出工作地和居住地,便于对人口分布的职住特征进行分析。
[0128] 本发明实施例提供一种确定目标区域中的工作地和居住地的方式,具体流程如下:
[0129] (1)根据信令数据,将所有的停留点投影在GIS地图上;
[0130] 在本发明实施例中,将出行定义为居民单程移动距离超过一定距离,例如:500米,时间超过一定时间,例如:5分钟的移动行为。利用GIS工具,可将所有停留点投影在地图上。
[0131] (2)在与居住地分析时间段对应的所有的停留点中确定所述居住地,以及在与工作地分析时间段对应的所有的停留点中确定所述工作地;
[0132] 判断一个停留点为工作停留点还是居住停留点,可利用停留点的时间分布特征、通信类型分布特征、通话频率分布特征等。在本发明实施例中,使用工作、居住停留点的时间分布特征对停留点类型进行判断。
[0133] 首先,划分居住地分析时间段和工作地分析时间段,例如:
[0134] 确定居住地分析时间段为:19:00-次日08:00;
[0135] 确定工作地分析时间段为:09:00-21:00(本日);
[0136] 然后,将所有的停留点中停留时间不小于第一停留时间阈值的停留点确定为备选停留点。该停留时间指的是用户设备在基站累计停留时间,例如:第一停留时间阈值设置为4小时。
[0137] 接着,将所有的备选停留点中停留时间占预设时间间隔比例不小于预设停留概率阈值的停留点确定为第一有效停留点。筛选出每个用户出现在工作时间(居住时间)范围内停留天数超过停留概率阈值的有效停留地点,该停留概率阈值可以根据其他城市经验设置,例如:设置为0.5。
[0138] 最后,将所有的第一有效停留点中停留时间最长的停留点确定为居住地或工作地,其中,在居住地分析时间段确定的是居住地,在工作地分析时间段确定的是工作地。
[0139] 需要说明的是,上述步骤101至步骤102的流程,与步骤103至步骤104的流程可以同步执行,或者先后执行,本发明实施例对此不做具体限定。
[0140] 步骤105:根据用电量数据,确定居住地的用电户数,然后执行步骤107;
[0141] 在本发明实施例中,基于由信令数据确定出的居住地,针对该居住地的用电量数据确定用电户数,认为在工作时间和休息时间存在用电高峰和低谷的家庭存在由职住产生的用电不均衡,从地块内将此类用电家庭户数识别出来,得到用电户数。
[0142] 步骤106:根据信令数据,确定OD数据,然后执行步骤107;
[0143] 在本发明实施例中,基于目标区域的用户设备的信令数据,确定用户的交通出行量(Origin-Destination,OD)数据。
[0144] 本发明实施例提供一种确定OD数据的方式,具体流程如下:
[0145] (1)对目标区域内的多个基站进行聚类处理;
[0146] 在本发明实施例中,根据基站的经纬度信息,将目标区域内一定距离(可根据基站平均服务半径设定)内的基站进行聚类合并处理。
[0147] (2)根据聚类处理后的基站所记录的信令数据,确定用户设备的停留轨迹;
[0148] 在本发明实施例中,根据聚合处理后的基站,确定用户设备的停留轨迹;尽管有时用户设备没有发生位移,其记录位置也会在邻近基站间跳动,就是所谓的乒乓效应,为了消除乒乓效应,对出行OD估计的影响,同时避免将长距离出行划分为多次的短距离出行,定义用户记录中连续两次及以上的基站为其停留基站。
[0149] (3)将停留轨迹中停留时间不小于第二停留时间阈值的停留点确定为第二有效停留点;
[0150] 在本发明实施例中,选择每个手机用户有效停留轨迹中,停留时间不小于设定停留时间阈值的有效停留点,可选地,设置停留时间阈值为1小时,其对应一次有目的的出行。
[0151] (4)遍历所有第二有效停留点,确定用户设备的出行起终点;
[0152] 在本发明实施例中,遍历所有用户有效停留表,判断其出行链的起终点。
[0153] (5)统计出行起终之间的OD数据;
[0154] 进一步地,基于OD信息,结合作息时间,规定居住地的判别依据为19:00-次日08:00停留时间最长的基站为居住基站。09:00-21:00(本日)停留时间最长的基站,且在基站周围500米范围内停留时间大于4小时、天数大于等于50%天的为工作地基站。
[0155] 步骤107:根据用电户数和信令数据,确定扩样系数,然后执行步骤108;
[0156] 在本发明实施例中,由于信令数据为不完全采样,结合用电量数据进行数据扩样可获得较为完整的人口分布信息。通过居住地块信令数据和用电户数的对应关系,计算信令数据的扩样系数。
[0157] 具体地,建立用电户数与信令数据的对应关系;根据对应关系拟合曲线;根据拟合的曲线确定扩样系数。
[0158] 在一些具体实施场景中,基于信令数据和用电量数据的扩样系数计算流程如下:
[0159] (1)考虑用户的实际情况,遍历用电较少用户的用电情况,认为6个月累计用电量低于24kW·h的,判定为空置,通过空置住房的识别,剔除与人口分布无关的用电户数;
[0160] (2)对用电数据进行处理。由于家庭中无人员留守情况下仍然存在部分用电,所以不能简单依靠用电与否来判断地区用电人口数,这里认为在工作时间和休息时间存在明显用电差异的家庭存在由职住产生的用电不均衡,从地块内将此类用电家庭户数识别出来;将工作时间和休息时间无差别用电家庭用户标记为停留用户。
[0161] (3)参见图2,图中横坐标为时间,对应全天0时至24时,单位为小时,纵坐标为用电量,单位为千瓦时。从日用电量数据中,选择用电量大于日平均用电量的时段属于用电峰值时段。将用电数据进行聚类分析,统计各个用电峰值时段的家庭户数,记为Fr;
[0162] (4)基于信令数据的轨迹数据,划分信令数据的居住基站,将19:00-次日08:00停留时间最长的基站为该用户的居住基站。该类用户有两类情况:1.长期处于居住基站没有出行,即工作时间仍然处于居住基站,将此类用户的户数标记为Wt;2.工作时间段存在出行,将此类用户的人口数标记为Wr。
[0163] (5)峰值时段用电人口数(Wp)=峰值用电户数(Wt)×户均人口数;
[0164] (6)参见图3,图中横坐标对应工作时间段存在出行的人口数Wr,单位为人,纵坐标对应峰值时段用电人口数Wp,单位为人,通过各个峰值时段用电人口数Wp与工作时间段存在出行的人口数Wr的对应关系,拟合曲线,获得该地块信令数据的扩样系数ai。
[0165] R2是趋势线拟合程度的指标,它的数值大小可以反映趋势线的估计值与对应的实际数据之间的拟合程度,拟合程度越高,趋势线的可靠性就越高。
[0166] R2是取值范围在0~1之间的数值,当趋势线的R2等于 1 或接近 1 时,其可靠性最2
高,反之则可靠性较低。R也称为决定系数。
[0167] 步骤108:根据扩样系数和OD数据,确定目标区域的人口分布特征;
[0168] 在本发明实施例中,结合OD数据的出行分配结果、信令数据及的扩样系数可获得工作地人口分布、通勤人口及全天各时间段的人口出行特征。具体地,可以采用现有的分析算法,根据扩样系数和OD数据进行人口分布特征分析,本发明实施例对基于扩样系数和OD数据确定人口分布特征的具体算法不做限定。
[0169] 本发明实施例中,通过居住地地块用电户数与用户设备的信令数据的对应关系,分析计算扩样系数,通过OD数据的分配获取工作地及游息地的人口分布特征,这种扩样系数计算方法有效解决现有人口分析方法准确度有限,且不能给出城市人口的动态分布描述的问题。
[0170] 参见图4,本发明实施例提供一种人口分布分析装置400,包括:
[0171] 第一获取模块401,用于将目标区域划分为多个地块,并获取每个所述地块的用电量数据;
[0172] 识别模块402,用于根据所述用电量数据,识别所述地块的类别;
[0173] 第二获取模块403,用于获取目标区域内用户设备的信令数据;
[0174] 第一确定模块404,用于根据所述信令数据,确定所述目标区域中的工作地和居住地;
[0175] 第二确定模块405,用于根据所述用电量数据,确定所述居住地的用电户数;
[0176] 第三确定模块406,用于根据所述信令数据,确定交通出行量OD数据;
[0177] 第四确定模块407,用于根据所述用电户数和所述信令数据,确定扩样系数;
[0178] 第五确定模块408,用于根据所述扩样系数和所述OD数据,确定所述目标区域的人口分布特征。
[0179] 可选地,所述识别模块402包括:
[0180] 计算单元,用于通过第一公式计算所述地块在工作时间段的用电比例,以及通过第二公式计算所述地块在休息时间段的用电比例;
[0181] 所述第一公式为:
[0182] ;
[0183] 所述第二公式为:
[0184] ;
[0185] 在 < 且 < 的情况下,确定所述地块的类别为居住地特征地块;
[0186] 在 > 且 的情况下,确定所述地块的类别为混合区特征地块;
[0187] 在 且 < 的情况下,确定所述地块的类别为工作地特征地块;
[0188] 其中, 表示所述地块在工作时间段的用电量 占全天用电量 的比例;表示所述地块在休息时间段的用电量 占全天用电量 的比例; 表示所述地块在工作时间段的用电量 占全天用电量 的比例均数; 表示所述地块在休息时间段的用电量占全天用电量 的比例均数。
[0189] 可选地,所述第一确定模块404包括:
[0190] 投影单元,用于根据所述信令数据,将所有的停留点投影在地理信息系统GIS地图上;
[0191] 第一确定单元,用于在与居住地分析时间段对应的所有的停留点中确定所述居住地,以及在与工作地分析时间段对应的所有的停留点中确定所述工作地。
[0192] 可选地,所述第一确定单元包括:
[0193] 第一确定子单元,用于将所有的停留点中停留时间不小于第一停留时间阈值的停留点确定为备选停留点;
[0194] 第二确定子单元,用于将所有的备选停留点中停留时间占预设时间间隔比例不小于预设停留概率阈值的停留点确定为第一有效停留点;
[0195] 第三确定子单元,用于将所有的第一有效停留点中停留时间最长的停留点确定为所述居住地或所述工作地。
[0196] 可选地,所述第三确定模块406包括:
[0197] 处理单元,用于对所述目标区域内的多个基站进行聚类处理;
[0198] 第二确定单元,用于根据聚类处理后的基站所记录的所述信令数据,确定所述用户设备的停留轨迹;
[0199] 第三确定单元,用于将所述停留轨迹中停留时间不小于第二停留时间阈值的停留点确定为第二有效停留点;
[0200] 第四确定单元,用于遍历所有第二有效停留点,确定所述用户设备的出行起终点;
[0201] 统计单元,用于统计所述出行起终之间的OD数据。
[0202] 可选地,所述第四确定模块407包括:
[0203] 建立单元,用于建立所述用电户数与所述信令数据的对应关系;
[0204] 拟合单元,用于根据所述对应关系拟合曲线;
[0205] 第五确定单元,用于根据拟合的曲线确定所述扩样系数。
[0206] 本发明实施例中,通过居住地地块用电户数与用户设备的信令数据的对应关系,分析计算扩样系数,通过OD数据的分配获取工作地及游息地的人口分布特征,这种扩样系数计算方法有效解决现有人口分析方法准确度有限,且不能给出城市人口的动态分布描述的问题。
[0207] 以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。