一种基于定位数据的生活圈识别方法转让专利

申请号 : CN201910149875.0

文献号 : CN110032609A

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 杨俊宴金探花史北祥王桥魏晋史宜

申请人 : 东南大学

摘要 :

本发明公开了一种基于定位数据的生活圈识别方法,首先对定位数据文件进行预处理;然后对定位数据进行行为点识别,并根据行为点在特定时间段的持续时长,划分出居住行为点、工作行为点和生活行为点集;选取特定城市或地区,实测或赋经验值,获取生活圈半径D值;提取分别距居住行为点M和工作行为点N小于D值的生活行为点,形成居住生活行为点集Q和工作生活行为点集S;分别提取点M和点集Q及点N和点集S形成最小边界几何面域,形成居住生活圈面域和工作生活圈面域。本发明充分利用定位数据,精准划定人群真实的居住或工作生活圈,比传统地以居住地为圆心圈层划定方法更为科学和客观,为居住或工作生活圈规划的分析和建设提供科学依据。

权利要求 :

1.一种基于定位数据的生活圈识别方法,其特征在于,该方法包括以下步骤:

(1)获取用户的定位数据文件,并对定位数据文件进行预处理;

(2)对步骤(1)得到的有效定位数据进行行为点识别,并将行为点划分为居住行为点M、工作行为点N和生活行为点集P;

(3)设置生活圈半径D值,提取距居住行为点M距离小于D值的生活行为点,形成居住生活行为点集Q;和/或,提取距工作行为点N距离小于D值的生活行为点,形成工作生活行为点集S;

(4)提取点M和点集Q形成最小边界几何面域,获取用户的居住生活圈面域Y,和/或提取点N和点集S形成最小边界几何面域,获取用户的工作生活圈面域L。

2.根据权利要求1或2所述的一种基于定位数据的生活圈识别方法,其特征在于,所述定位数据文件包括用户编号,用户位置更新的日期,时间和经纬度坐标信息。

3.根据权利要求1或2所述的一种基于定位数据的生活圈识别方法,其特征在于,步骤(1)获取用户的定位数据文件方法如下:定位数据文件可从手机信息推送服务商处获取脱敏的定位数据,或通过GPS定位仪器搜集获取GPS定位数据。

4.根据权利要求1或2所述的一种基于定位数据的生活圈识别方法,其特征在于,所述步骤(1)对定位数据文件进行预处理的方法如下:在EXCEL软件中,使用查找和选择功能内的定位选项,选择并删除缺失用户编号和经纬度信息的数据;使用删除重复项命令,选择并删除重复用户编号的数据;使用数字筛选命令,选择并删除日期或者经纬度不在预设正常值范围内的异常数据。

5.根据权利要求1或2所述的一种基于定位数据的生活圈识别方法,其特征在于,对步骤(2)得到的定位数据文件进行行为点识别,并将行为点划分为居住行为点M、工作行为点N和生活行为点集P的方法如下:(2.1)定义距离阈值和最短时间间隔阈值,设距离阈值为S米,最短时间间隔阈值为T1分钟;

(2.2)对定位数据中所有轨迹点按照时间序列排序,对轨迹点On,判断其下一个轨迹点On+1与轨迹点On的距离是否小于S米,如小于S米,则作为On的相邻点;持续以上操作,继续判断,至轨迹点On+m,若其与轨迹点On的距离大于或等于阈值S米,即搜索停止;计算轨迹点On+m和轨迹点On的时间间隔,如持续时间大于或等于预设时间T1,则记录所有轨迹点On到On+m-1;

如持续时间小于T1,则On到On+m-1不满足要求,结果无效;转至下一个轨迹点,即轨迹点On+1开始,重复以上步骤,直到找到符合条件的点,转到步骤(2.3);

(2.3)将步骤(2.2)得到的所有轨迹点On到On+m-1聚类,生成行为点,其中行为点的经纬度为所有轨迹点On到On+m-1经纬度的均值,轨迹点On被定位的时间tn为行为点的开始时间,轨迹点On+m-1被定位时的时间tn+m-1作为行为点的结束时间;

(2.4)从轨迹点On+m开始,重复步骤2.2与步骤2.3,遍历所有轨迹点,识别出所有的行为点;

(2.5)依次判断步骤(2.4)得到的行为点的开始时间和结束时间的区间是否与23:00-

05:00区间有交集,记录上述所有有交集的行为点形成集合A1,并选择A1中的行为点的结束时间与开始时间的时间差最大值的行为点,作为居住行为点M;

(2.6)依次判断步骤(2.4)得到的行为点的开始时间和结束时间是否与08:00-17:00区间有交集,记录上述所有有交集的行为点形成集合A2,并选择A2中的行为点的结束时间与开始时间的时间差最大值的行为点,作为工作行为点N;

(2.7)所有行为点文件中,剔除居住行为点M以及工作行为点N,得到生活行为点集P={p1,p2,p3,……,pn}。

6.根据权利要求5所述的一种基于定位数据的生活圈识别方法,其特征在于,步骤(3)中,提取距居住行为点M和工作行为点N距离小于D值的生活行为点,并形成居住生活行为点集Q和工作生活行为点集S的具体方法如下:(3.1)将步骤(2.5)-(2.7)得到的行为点文件,分图层加载到ArcGIS软件中,形成居住行为点M、工作行为点N、生活行为点集P三个图层;

(3.2)在ArcGIS软件中,以点M和点N为圆心,画半径为D的圆形,为圆M图层和圆N图层;

(3.3)在ArcGIS软件中,提取落在圆M图层范围内的生活行为点集P中的点,导出图层为居住生活行为点集Q的SHP文件;

(3.4)在ArcGIS软件中,提取落在圆N图层范围内的生活行为点集P中的点,导出图层为工作生活行为点集S的SHP文件。

7.根据权利要求6述的一种基于定位数据的生活圈识别方法,其特征在于,步骤(4)中,提取点M和点集Q形成最小边界几何面域,获取用户的居住生活圈面域Y的具体步骤如下:(4.1)在ArcGIS软件中,将点M和点集Q合并,得到点集X;

(4.2)在ArcGIS软件中,使用“最小边界几何”命令,在输入要素中,输入点集X,在地理选项中,选择“凸包(CONVEX HULL)”,输出面域Y,所形成的面域范围即为目标对象的居住生活圈范围。

8.根据权利要求6述的一种基于定位数据的生活圈识别方法,其特征在于,步骤(4)中,提取点N和点集S形成最小边界几何面域,获取用户的工作生活圈面域L的具体步骤如下:(4.3)在ArcGIS软件中,将点N和点集S合并,得到点集K;

(4.4)在ArcGIS软件中,使用“最小边界几何”命令,在输入要素中,输入点集K,在地理选项中,选择“凸包(CONVEX HULL)”,输出面域L,所形成的面域范围即为目标对象的工作生活圈范围。

9.根据权利要求6或7所述的一种基于定位数据的生活圈识别方法,其特征在于,将居住区内每个对象的居住生活圈面域合并,即得到居住区所有对象的居住生活圈面域;将办公区每个对象的工作生活圈面域合并,即得到办公区所有对象的工作生活圈面域。

说明书 :

一种基于定位数据的生活圈识别方法

技术领域

[0001] 本发明属于城市规划技术领域,尤其涉及一种基于定位数据的生活圈识别方法。

背景技术

[0002] 随着城市更新热潮的持续高涨,人们对集约的空间布局与精致的生活品质的需求不断提升。而生活圈作为城市人居环境的基本单元,决定着城市的设施空间配置及生活品质的塑造。国内外现有的生活圈范围界定方法主要以时间距离、空间距离或者是功能来定义生活圈等。
[0003] 此类生活圈范围界定的方法中,以时间距离定义生活圈的分析方法主要通过计算“15分钟步行距离”、“一小时通勤圈”等方式来划定城市生活圈的边界;以空间距离定义的生活圈主要通过“800m的步行距离”来确定可达空间边界,形成生活圈的范围;而以功能来定义的生活圈则通过计算重大设施的距离来确定生活圈边界。以上三类生活圈的划定方法皆存在一定的局限性,更多的以人为主观感受与经验判断来确定生活圈。首先,单纯的通过交通时间划分方法中,持续的移动行为并不符合实际人群活动特征,此方法缺乏对生活中人的真实行为活动进行考虑;通过纯空间距离划分方法,通过判断人群短期步行的最远距离,忽视了具体个体的行为特征,模糊了人群活动之间的差异性。通过重大设施等级的划分方法,仅从城市范围层面,对生活圈的等级分析,并未结合人群的真实使用情况。
[0004] 此外,也存在一些专家学者通过GPS定位数据,对人群活动范围进行真实重现,但分析的方法与技术较为局限,通过一个小范围,少量人,短时间的测度方式来划定某一小范围地段的生活圈边界,难以对城市整体的人群生活圈进行范围的界定。因此,目前生活圈识别的方式更多的是人为主观的界定方式或者小范围的真实表征方法,缺乏城市尺度的人群生活范围的真实还原,并且未能与当下多源大数据的应用相结合。

发明内容

[0005] 发明目的:针对以上问题,本发明提出一种基于定位数据的生活圈识别方法,针对现有生活圈以居住地或工作地简单做圆,忽视人群的真实情况的问题,以定位数据,识别人群的行为,以日常步行范围内的行为点集成面,得出人群真实的居住生活圈及工作生活圈。
[0006] 技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种基于定位数据的生活圈识别方法,该方法包括以下步骤:
[0007] (1)获取用户的定位数据文件,运用EXCEL软件对定位数据文件进行预处理。
[0008] (2)对步骤1得到的有效定位数据文件进行行为点识别,并根据行为点在特定时间段的持续时长,划分出行为点的不同行为性质:包括居住行为点M、工作行为点N和生活行为点集P。
[0009] (3)选取特定城市或地区,实测或赋经验值获取特定时长人群的步行距离,得出特定时长生活圈半径D值。提取距居住行为点M距离小于D值的生活行为点,形成居住生活行为点集Q;和/或,提取距工作行为点N距离小于D值的生活行为点,形成工作行为点集S。
[0010] (4)提取点M和点集Q形成最小边界几何面域,获取用户的居住生活圈面域Y,和/或提取点N和点集S形成最小边界几何面域,获取用户的工作生活圈面域L。
[0011] 进一步的,所述步骤(1)包括:
[0012] (1.1)获得脱敏定位数据,数据采集时间为5分钟一次,数据内容包括用户编号,用户位置更新日期与时间,用户实时经纬度坐标。定位数据可以通过手机运营商获得,亦可通过GPS数据采集获得。其中匿名定位数据编号为脱敏后的用户识别号,不涉及到用户的隐私信息。实际工作中数据采集时间间隔可以自由设定。定位数据的标准格式如下:
[0013] 表1定位数据格式示例
[0014]
[0015] (1.2)将脱敏的定位数据储存于配置不低于Intel Xeon Processor E5-2620V4处理器,512G SSD,128G DDR4内存的工作站上,并在此工作站上进行具体操作。
[0016] (1.3)在Excel程序中,使用‘查找和选择’命令,勾选‘空值’,获取所有空值单元格,右击“删除”命令,选择删除“整行”。使用“数据”命令栏下的“删除重复项”,勾选‘用户ID’列,删除所有用户重复数据。使用“排序和筛选”命令栏下的“筛选”命令,勾选‘数字筛选’,选择并删除日期或者经纬度不在正常值范围内的数据。
[0017] 进一步的,所述步骤(2)包括:
[0018] (2.1)定义距离阈值和最短时间间隔阈值,距离阈值为S米,最短时间间隔阈值为T1分钟;
[0019] (2.2)对所有轨迹点按照时间序列排序,对轨迹点On,判断其下一个轨迹点On+1与轨迹点On的距离是否小于S米,如小于S米,则作为On的相邻点;持续以上操作,继续判断,至轨迹点On+m,若其与轨迹点On的距离大于或等于阈值S米,即搜索停止;计算轨迹点On+m和轨迹点On的时间间隔,如持续时间大于或等于T1分钟,则记录所有轨迹点On到On+m-1;如持续时间小于T1分钟,则On到On+m-1不满足要求,结果无效;转至下一个轨迹点,即轨迹点On+1开始,重复以上步骤;
[0020] (2.3)将步骤2.1.2得到的所有轨迹点On到On+m-1聚类,生成行为点,其中行为点的经纬度为所有轨迹点On到On+m-1经纬度的均值,轨迹点On被定位的时间tn为行为点的开始时间,轨迹点On+m-1被定位时的时间tn+m-1作为行为点的结束时间;
[0021] (2.4)从轨迹点On+m开始,重复步骤2.2与步骤2.3,遍历所有轨迹点,识别出所有的行为点;
[0022] (2.5)依次判断步骤(2.4)得到的行为点的开始时间和结束时间的区间是否与23:00-05:00区间有交集,记录上述有交集的行为点形成集合A1,并计算A1中的行为点的结束时间与开始时间的时间差最大值的行为点,作为居住行为点M;
[0023] (2.6)依次判断步骤(2.4)得到的行为点的开始时间和结束时间是否与08:00-17:00区间有交集,记录上述有交集的行为点形成集合A2,并计算A2中的行为点的结束时间与开始时间的时间差最大值的行为点,作为工作行为点N;
[0024] (2.7)所有行为点文件中,剔除居住行为点M以及工作行为点N,得到生活行为点集P={p1,p2,p3,……,pn}。
[0025] 进一步的,所述步骤(3)包括:
[0026] (3.1)实测确定生活圈半径大小:选取拟划定生活圈的城市/地区,选择独立出行的人员,其中0-20岁市民、21-40岁市民、41-60岁市民、大于60岁市民,各个年龄段男女各L人,总实验人数为8*L人,在道路上连续行走T2分钟,以佳明GPSMAP 62scGPS记录仪器记录他们的所有步行距离,取所有距离的平均值作为生活圈半径D;或者通过赋经验值,单位分钟步行距离为d,D=d*T2,其中,时长T2基于城市和地区的差异,通常取值为15、30或60。
[0027] (3.2)将步骤(2)得到的行为点文件,分图层加载到ArcGIS软件中,形成居住行为点M、工作行为点N、到生活行为点集P三个图层。
[0028] (3.3)在ArcGIS软件中,分别以点M和点N为圆心,画半径为D的圆形,为圆M图层和圆N图层。
[0029] (3.4)使用ArcGIS软件中“选择”下的“按照位置选择文件”命令,勾选“从以下图层中选择要素”,目标图层为生活行为点集P图层,源图层分别为圆M图层和源N图层,目标图层要素的空间选择方法为“完全位于源图层要素范围内”,选择后,导出图层为“居住生活行为点集Q”和“工作生活行为点集S”的SHP文件。
[0030] 进一步的,所述步骤(4)包括:
[0031] (4.1)在ArcGIS软件中,使用“合并”命令,将点M和点集Q合并,得到点集X;
[0032] (4.2)在ArcGIS软件中,使用“最小边界几何”命令,在输入要素中,输入点集X,在地理选项中,选择“凸包(CONVEX HULL)”,输出面域Y,所形成的面域范围,即为目标对象的居住生活圈范围。如图3所示,为本发明的空间示意图,其中面域MP1P2即为居住生活圈范围。
[0033] (4.3)在ArcGIS软件中,使用“合并”命令,将点N和点集S合并,得到点集K;
[0034] (4.4)在ArcGIS软件中,使用“最小边界几何”命令,在输入要素中,输入点集K,在地理选项中,选择“凸包(CONVEX HULL)”,输出面域L,所形成的面域范围,即为目标对象的工作生活圈范围。如图4所示,为本发明的空间示意图,其中面域NP3PnP4即为工作生活圈范围。
[0035] 进一步的,还可以将居住区每个对象的居住生活圈面域合并,即得到该居住区所有对象的居住生活圈面域;将办公区每个对象的工作生活圈面域合并,即得到特定办公区所有对象的工作生活圈面域。
[0036] 有益效果:与现有技术相比,本发明的技术方案具有以下有益技术效果:
[0037] 本发明利用定位数据,通过算法和规则识别人群有效的行为,得出人群真实的居住行为点、工作行为点和生活行为点。以特定地区特定时间内的步行距离,作为生活圈半径,提取出分别距离居住行为点和工作行为点生活圈半径范围内的生活行为点,为居住生活行为点和工作生活行为点。生成居住行为点和居住生活行为点的最小边界几何面域为居住生活圈,生成工作行为点和工作生活行为点的最小边界几何面域为工作生活圈,本发明充分利用定位数据能够精准定位人群真实的居住或工作生活圈,比传统意义上的圆形更为科学和客观,为居住或工作生活圈规划的分析和建设提供科学依据。

附图说明

[0038] 图1本发明的流程图;
[0039] 图2行为点识别方法示意图;
[0040] 图3本发明的居住生活圈空间示意图;
[0041] 图4本发明的工作生活圈空间示意图;
[0042] 图5本发明在南京市新街口片区止马村居住小区某用户居住生活圈的应用;
[0043] 图6本发明在南京市新街口止马村居住小区居住生活圈的应用。

具体实施方式

[0044] 下面结合附图和实施例对本发明的技术方案作进一步的说明。
[0045] 以下将基于定位数据识别南京新街口止马村居住小区的15分钟居住生活圈及附图来详细地说明本发明的技术方案,如:
[0046] (1)运用EXCEL软件对匿名手机定位数据CSV文件进行预处理,其中匿名手机定位数据CSV文件从手机信息推送服务商处获取,包括用户编号,用户位置更新的日期,时间和经纬度坐标信息;并且,或通过GPS定位仪器搜集获取定位数据文件;
[0047] (1.1)通过手机信息推送服务商获得匿名用户的手机定位数据的具体步骤如下:通过手机信息推送服务商获得南京所有用户2017年11月11号的手机定位数据,数据采集时间为5分钟一次,采集时间间隔可以根据实际需要预先设置,数据内容包括用户编号,用户位置更新日期与时间,用户实时经纬度坐标,共采集数据23.21亿条,具体数据格式要求如表1所示,包含脱敏后的用户编号,用户性别、年龄、位置更新日期、时间、经度、维度信息。其中用户手机定位数据编号为脱敏后的手机识别号,不涉及到用户的隐私信息。将匿名手机定位数据储存于配置不低于Intel Xeon Processor E5-2620V4处理器,512G SSD,128G DDR4内存的工作站上,并在此工作站上进行具体操作。
[0048] 表2数据格式示例
[0049]
[0050] (1.2)运用EXCEL软件对步骤1得到的南京所有手机用户定位数据CSV文件进行预处理,删除缺失数据,重复数据和异常数据,得到所有用户的有效定位数据CSV文件。
[0051] 例如,在Excel程序中,使用‘查找和选择’命令,勾选‘空值’,获取所有空值单元格,右击“删除”命令,选择删除“整行”。使用“数据”命令栏下的“删除重复项”,勾选‘用户ID’列,删除所有用户重复数据。使用“排序和筛选”命令栏下的“筛选”命令,勾选‘数字筛选’,选择并删除日期或者经纬度不在正常值范围内的数据。
[0052] (2)对步骤2得到的南京所有手机用户有效定位数据CSV文件进行行为点识别;根据行为点所在的时间段,划分出南京所有手机用户行为点的不同行为性质:包括居住行为点、工作行为点和生活行为点。
[0053] (2.1)定义距离阈值和最短时间间隔阈值,距离阈值S为50米,最短时间间隔T1阈值为15分钟,该实例中的50米和15分钟只是示例,可以根据实际需要设置不同的值;
[0054] (2.2)对所有轨迹点按照时间序列排序,对轨迹点On,判断其下一个轨迹点On+1与轨迹点On的距离是否小于50米,如小于50米,则作为On的相邻点;持续以上操作,继续判断,至轨迹点On+m,若其与轨迹点On的距离大于或等于阈值50米,即搜索停止;计算轨迹点On+m和轨迹点On的时间间隔,如持续时间大于或等于15分钟,则记录所有轨迹点On到On+m-1;如持续时间小于15分钟,则On到On+m-1不满足要求,结果无效;转至下一个轨迹点,即轨迹点On+1开始,重复以上步骤,直到找到符合条件的点,转到步骤(2.3)。
[0055] (2.3)将步骤2.2得到的所有轨迹点On到On+m-1聚类,生成行为点。其中,行为点的经纬度为所有轨迹点On到On+m-1所有点经纬度的均值,轨迹点On被定位的时间tn为行为点的开始时间,轨迹点On+m-1被定位时的时间tn+m-1作为行为点的结束时间;
[0056] (2.4)从轨迹点On+m开始,重复步骤2.2与步骤2.3,遍历所有轨迹点,识别出所有的行为点;
[0057] (2.5)依次判断步骤(2.4)得到的行为点的开始时间和结束时间的区间是否与23:00-05:00区间有交集,记录上述所有有交集的行为点形成集合A1,并计算A1中的行为点的结束时间与开始时间的时间差最大值的行为点,作为居住行为点M;
[0058] (2.6)依次判断步骤(2.4)得到的行为点的开始时间和结束时间的区间是否与08:00-17:00区间有交集,记录上述所有有交集的行为点形成集合A2,并计算A2中的行为点的结束时间与开始时间的时间差最大值的行为点,作为工作行为点N;
[0059] (2.7)所有行为点文件中,剔除居住行为点M以及工作行为点N,得到生活行为点集P文件={p1,p2,p3,……,pn}。
[0060] (3)实测获取15分钟步行距离D值,该实施例实测D值为1.5km,提取距离居住行为点1.5km范围内的生活行为点集Q。
[0061] (3.1)选取南京新街口片区和人群特征,实测获取15分钟步行距离为1.5km的具体步骤如下:实测确定生活圈半径大小:选取特定的南京新街口片区,选择独立出行的人员,其中0-20岁市民、21-40岁市民、41-60岁市民、大于60岁市民,各个年龄段男女各10人,总试验者各80人,在新街口城市道路上连续行走15分钟,然后使用佳明GPSMAP 62sc记录仪器记录起始点与终点的距离,取所有距离的平均值作为生活圈半径D,本实施例距离值1.5km。
[0062] (3.2)以南京止马村居住小区为例,以居住点位于该居住小区的用户00069f1927ee5cef9919335d75170d3为例,提取其一天的行为活动轨迹点数据。
[0063] (3.3)将步骤3.2得到的用户00069f1927ee5cef9919335d75170d3行为点CSV文件,分图层加载到ArcGIS软件中,形成用户00069f1927ee5cef9919335d75170d3居住行为点M、工作行为点N、到生活行为点集P三个图层。
[0064] (3.4)在ArcGIS软件中,以用户00069f1927ee5cef9919335d75170d3的居住点M为圆心,画半径距离为1.5km的圆形,为圆M图层。
[0065] (3.5)提取位于圆M内的生活行为点集P得到居住生活行为点集Q,方法如下:
[0066] 使用ArcGIS软件中“选择”下的“按照位置选择文件”命令,勾选“从以下图层中选择要素”,目标图层为用户00069f1927ee5cef9919335d75170d3的生活行为点集P图层,源图层为圆M图层,目标图层要素的空间选择方法为“完全位于源图层要素范围内”,选择后,导出图层为“居住生活行为点集Q”的SHP文件。
[0067] (4)提取点M和点集Q形成最小边界几何面域,获取形成手机用户的居住生活圈面域。
[0068] (4.1)在ArcGIS软件中,使用“合并”命令,将点M和点集Q合并,得到点集X;
[0069] (4.2)在ArcGIS软件中,使用“最小边界几何”命令,在输入要素中,输入点集X,在地理选项中,选择“凸包(CONVEX HULL)”,输出面域Y,所形成的面域范围,即为手机用户00069f1927ee5cef9919335d75170d3的居住生活圈面域。如图5所示,为手机用户
00069f1927ee5cef9919335d75170d3的实际生活圈,具体范围为面域P1P2P3P4P5P6P7。
[0070] (4.3)提取居住点为止马村居住小区的所有用户的行为活动点数据,重复上述步骤3.2至步骤4.2,获取该居住小区所有用户居住生活圈几何面域集合{Y1,Y2,……,Yn},对所有面域取并集,输出面域Yzmc,即为该居住小区居住生活圈面域。如图6所示,为止马村居住小区的居住生活圈范围,即面域:
[0071] PM21-H1-PM32-PM34-PM12-H2-PM37-H3-PM22-PM23-PM15-PM36-H4-PM16-PM17-PM26-PM27,其中PM21是居住行为点为M2的手机用户的生活行为点,依此类推;H为该住区用户居住生活圈面域面域交汇点。