一种使用手机信令数据提取出行停驻点的方法转让专利

申请号 : CN202010240510.1

文献号 : CN111464950B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 万涛马山高煦明李科范小勇

申请人 : 天津市城市规划设计研究总院有限公司

摘要 :

一种使用手机信令数据提取出行停驻点的方法:将通过移动通信运营商获取设定时间的所有手机信令数据按照不同用户进行分组;分别提取每个手机用户的手机信令,并得到每个手机用户的按时间排序的基站及基站位置序列;分别对每个手机用户排序后的手机信令数据进行合并:将最小停留时间大于等于10min的信令位置,归入为集合C2,将最小停留时间大于1min并小于10min的归入集合C3;在集合C3中找出可能的停驻点;将集合C3中判断为停驻点的信令位置归入集合C2;将停留位置集合C2中的信令位置按照信令位置开始时间进行排序;直至集合C2和集合C3中的信令位置的数量不再发生变化。本发明充分利用了手机信令数据自身特点,选出更多的停驻点,减少漏选。

权利要求 :

1.一种使用手机信令数据提取出行停驻点的方法,其特征在于,包括如下步骤:

1)将通过移动通信运营商获取设定时间的所有手机信令数据按照不同用户进行分组;

2)分别提取每个手机用户的手机信令,将每个手机用户的手机信令数据按照时间戳进行排序,得到每个手机用户的按时间排序的基站及基站位置序列;

3)分别对每个手机用户排序后的手机信令数据进行合并:

4)将最小停留时间t(i)out‑t(i)in大于等于10min的信令位置,归入为集合C2,将最小停留时间t(i)out‑t(i)in大于1min并小于10min的归入集合C3;

5)以准确判断的停驻点间的速度关系,在集合C3中找出可能的停驻点;包括:(1)设定在集合C2中排序为j的信令位置开始时间为t(j)in、结束时间为t(j)out;

(2)取集合C3中一个信令位置k,在停留位置集合C2中找到在时间上与信令位置j最接近的前一个记录和后一个记录,记为信令位置j和信令位置j+1;

(3)根据信令位置k与信令位置j之间的经纬度信息计算距离为dis(j,k),最长的在途旅行时间为t(k)in‑t(j)out;最低移动速度为dis(j,k)/(t(k)in‑t(j)out);同样,信令位置k与信令位置j+1的最低移动速度计算为dis(k,j+1)/(t(j+1)in‑t(k)out);

(4)设定步行速度为4km/h,取速度3km/h为阈值,若集合C3中的信令位置k与信令位置j和信令位置j+1的速度均>3km/h,则判断信令位置k为在途点,否则判断信令位置k为停驻点;

6)将集合C3中判断为停驻点的信令位置从集合C3中拿走归入集合C2,从而更新停留位置集合C2和集合C3;将停留位置集合C2中的信令位置按照信令位置开始时间t(j)in进行排序;

7)返回步骤5)直至集合C2和集合C3中的信令位置的数量不再发生变化,最终得到集合C2既为全部停驻点集合。

2.根据权利要求1所述的一种使用手机信令数据提取出行停驻点的方法,其特征在于,步骤1)是按手机用户唯一识别码进行分组,将同一识别码人手机信令数据归为同一组。

3.根据权利要求1所述的一种使用手机信令数据提取出行停驻点的方法,其特征在于,步骤3)包括:

(1)如果连续多条信令在同一位置发生,则对多条信令进行合并,保留连续多条信令中的首条信令的时间戳和末条信令的时间戳;

(2)若一条信令发生的位置与该条信令左右相邻的信令发生的位置均不一致,不能与相邻的信令进行合并,则将该信令的开始时间戳与结束时间戳设置为一致,并作为该信令发生的时间;

(3)最终形成的合并的数据格式为手机号代码、信令位置i、开始时间t(i)in、结束时间t(i)out,计算用户在信令位置i处停留的时间至少为t(i)out‑t(i)in,最长的停留时间为t(i+

1)in‑t(i‑1)out;将所有的按时间排序的信令位置序列集合记为集合C1。

说明书 :

一种使用手机信令数据提取出行停驻点的方法

技术领域

[0001] 本发明涉及一种提取出行停驻点的方法。特别是涉及一种使用手机信令数据提取出行停驻点的方法。

背景技术

[0002] 城市规划领域重点关注城市形态演变规律,人口岗位分布特征及出行流动规律等方面特征,以便科学合理地制定发展策略,布局基础设施,提供交通支撑服务。传统获取数
据的手段主要包括人口普查,经济普查,居民出行抽样调查等,调查方法耗费大量人力与物
力,抽样率低,精度不高,数据更新周期长,且只能获取特定时间片段的数据,难以适应新时
期的规划管理需求。手机的广泛普及与手机海量信令数据分析技术为城市规划提供了一种
全新的高效便捷的数据获取分析手段,相比传统居民出行调查,手机信令数据覆盖范围广,
分析样本大,实施成本低,可长期连续监测等优势,为城市人口行为活动特征的观测和分析
提供了较好的基础。
[0003] 手机信令数据具有数据量大、覆盖范围广,精度不高,噪声数据较多等特点,应通过科学合理的数据清洗方法,对信令数据质量进行完善。和传统调查方式相比,虽然手机信
令数据具有显著优势,但其自身依然存在着不足和缺陷。手机信令数据虽然数据量大、覆盖
范围广,但同时也具有精度不高,噪声数据较多等特点,这就对数据的清洗提出了更高的要
求。
[0004] 目前信令数据的清洗方法主要分为两部分,即常规数据处理以及信令数据自身特征处理。常规数据处理包括过滤掉空值、错误值以及重复值等。信令数据自身特征处理,针
对手机信令数据的生成原理,对其所特有的乒乓切换数据、漂移数据、静止数据等进行处
理。通过分层次的数据清洗,减少了多余的计算,提高了清洗效率。
[0005] 手机信令数据直接来源于运营商(中国移动、中国联通、中国电信)的移动通信系统。当手机发生打电话(主叫/被叫)、收发短信、挂机、位置更新、基站切换、连接互联网等行
为时,会记录相关的基站信息,通过基站编号查询空间位置可以得到定位信息。典型的信令
数据通常包含手机的定位信息、手机SIM卡唯一编号(由运营商加密消除用户个人信息)、时
间戳信息等。2G网络环境下信令采样频率不高,用户日均记录条数约30~60条,构成主体为
位置更新信令.3G/4G网络环境下,信令采样频率大幅提高,用户日均记录数可达200~1 
000条,构成主体为上网信令。
[0006] 典型的信令数据通常包含手机的定位信息、手机SIM卡唯一编号(由运营商加密消除用户个人信息)、时间戳信息等。定位信息一般为基站编号。通过关联基站位置数据表,可
以获得经纬度信息,样例如下。
[0007]
[0008] 表中用户ID为手机号码加密后得到的结果。Lac和ci为手机基站的大区和小区编号,通过大区和小区基站的组合可得到基站的位置标识。运营商会对基站的位置进行登记、
维护。通过基站编号与基站位置表关联,可以得到经纬度形式的位置信息。手机信令数据具
有时空连续性。
[0009] 时间戳即为样例表中的记录时间字段,包含年份、月、日、小时、分钟、秒的信息。

发明内容

[0010] 本发明所要解决的技术问题是,提供一种在清洗后的数据基础上,结合出行时空特征,通过设定判别筛选条件,识别停驻点的使用手机信令数据提取出行停驻点的方法。
[0011] 本发明所采用的技术方案是:一种使用手机信令数据提取出行停驻点的方法,包括如下步骤:
[0012] 1)将通过移动通信运营商获取设定时间的所有手机信令数据按照不同用户进行分组;
[0013] 2)分别提取每个手机用户的手机信令,将每个手机用户的手机信令数据按照时间戳进行排序,得到每个手机用户的按时间排序的基站及基站位置序列;
[0014] 3)分别对每个手机用户排序后的手机信令数据进行合并:
[0015] 4)将最小停留时间t(i)out‑t(i)in大于等于10min的信令位置,归入为集合C2,将最小停留时间t(i)out‑t(i)in大于1min并小于10min的归入集合C3;
[0016] 5)以准确判断的停驻点间的速度关系,在集合C3中找出可能的停驻点;
[0017] 6)将集合C3中判断为停驻点的信令位置从集合C3中拿走归入集合C2,从而更新停留位置集合C2和集合C3;将停留位置集合C2中的信令位置按照信令位置开始时间t(j)in进
行排序;
[0018] 7)返回步骤5)直至集合C2和集合C3中的信令位置的数量不再发生变化,最终得到集合C2既为全部停驻点集合。
[0019] 步骤1)是按手机用户唯一识别码进行分组,将同一识别码人手机信令数据归为同一组。
[0020] 步骤3)包括:
[0021] (1)如果连续多条信令在同一位置发生,则对多条信令进行合并,保留连续多条信令中的首条信令的时间戳和末条信令的时间戳;
[0022] (2)若一条信令发生的位置与该条信令左右相邻的信令发生的位置均不一致,不能与相邻的信令进行合并,则将该信令的开始时间戳与结束时间戳设置为一致,并作为该
信令发生的时间;
[0023] (3)最终形成的合并的数据格式为手机号代码、信令位置i、开始时间t(i)in、结束时间t(i)out,计算用户在信令位置i处停留的时间至少为t(i)out‑t(i)in,最长的停留时间为
t(i+1)in‑t(i‑1)out;将所有的按时间排序的信令位置序列集合记为集合C1。
[0024] 步骤5)包括:
[0025] (1)设定在集合C2中排序为j的信令位置开始时间为t(j)in、结束时间为t(j)out;
[0026] (2)取集合C3中一个信令位置k,在停留位置集合C2中找到在时间上与信令位置j最接近的前一个记录和后一个记录,记为信令位置j和信令位置j+1;
[0027] (3)根据信令位置k与信令位置j之间的经纬度信息计算距离为dis(j,k),最长的在途旅行时间为t(k)in‑t(j)out;最低移动速度为dis(j,k)/(t(k)in‑t(j)out);同样,信令位
置k与信令位置j+1的最低移动速度计算为dis(k,j+1)/(t(j+1)in‑t(k)out);
[0028] (4)设定步行速度为4km/h,取速度3km/h为阈值,若集合C3中的信令位置k与信令位置j和信令位置j+1的速度均>3km/h,则判断信令位置k为在途点,否则判断信令位置k为
停驻点。
[0029] 本发明的一种使用手机信令数据提取出行停驻点的方法,充分利用了手机信令数据自身特点,先利用最短停留时间条件判断稳定停驻点,综合可能停驻点与前后停驻点间
速度、位置关系,选出更多的停驻点,减少漏选。

附图说明

[0030] 图1是信令数据时空轨迹图;
[0031] 图2a是B点并未被识别为活动停驻点示意图;
[0032] 图2b是因长距离的出行,B点被识别为活动停驻点示意图;
[0033] 图3是个体一天信令数据停驻点识别示意图。

具体实施方式

[0034] 下面结合实施例和附图对本发明的一种使用手机信令数据提取出行停驻点的方法做出详细说明。
[0035] 本发明研究的主要内容是如何通过手机信令数据获取居民的停驻点,进而得到城市居民的出行活动规律,职住空间分布特征等重要信息。
[0036] 在清洗后的数据基础上,结合出行时空特征,通过设定判别筛选条件,识别停驻点。本文提出了4步筛选条件,分别为停留时间筛选、出现频率筛选、速度降低筛选以及过远
绕行筛选,满足上述任意条件即可识别为停驻点。
[0037] 本发明结合时间和空间维度出行行为特征,设定停驻点的识别条件,从而准确挖掘出停驻点位置;最后,通过与实际出行轨迹的对比分析,验证了该方法的合理性和可行
性。
[0038] 本发明的一种使用手机信令数据提取出行停驻点的方法,包括如下步骤:
[0039] 1)将通过移动通信运营商获取设定时间的所有手机信令数据按照不同用户进行分组,方便下一步按照每个用户提起其停驻点;具体是按手机用户唯一识别码进行分组,将
同一识别码人手机信令数据归为同一组。
[0040] 2)分别提取每个手机用户的手机信令,将每个手机用户的手机信令数据按照时间戳进行排序,得到每个手机用户的按时间排序的基站及基站位置序列;
[0041] 3)分别对每个手机用户排序后的手机信令数据进行合并:包括:
[0042] (1)如果连续多条信令在同一位置发生,则对多条信令进行合并,保留连续多条信令中的首条信令的时间戳和末条信令的时间戳;
[0043] (2)若一条信令发生的位置与该条信令左右相邻的信令发生的位置均不一致,不能与相邻的信令进行合并,则将该信令的开始时间戳与结束时间戳设置为一致,并作为该
信令发生的时间;
[0044] (3)最终形成的合并的数据格式为手机号代码、信令位置i(i表示按排序顺序为第i个信令位置)、开始时间t(i)in、结束时间t(i)out,如图1所示,则可以计算用户在信令位置i
处停留的时间至少为t(i)out‑t(i)in,最长的停留时间为t(i+1)in‑t(i‑1)out;将所有的按时
间排序的信令位置序列集合记为集合C1。
[0045] 4)如果在一些地点进行一些活动必然会有一定时间的停留。但从步骤3)中对信令数据的分析可以看出,对于某一位置,可以计算其最短可能停留时间和最大可能停留时间,
其停留时间在一定范围内波动。但若最小停留时间超过一定限度,则可以确定停留发生。但
如何选取阈值存在问题,因为一些途中的情况,如公交站候车或途中堵车也会造成一定时
间的停留,本发明是按照2017年天津居民出行调查报告里获得的数值进行统计分析得到:
将最小停留时间t(i)out‑t(i)in大于等于10min的信令位置,归入为集合C2,将最小停留时间
t(i)out‑t(i)in大于1min并小于10min的归入集合C3;
[0046] 5)以准确判断的停驻点间的速度关系,在集合C3中找出可能的停驻点;包括:
[0047] (1)设定在集合C2中排序为j的信令位置开始时间为t(j)in、结束时间为t(j)out;
[0048] (2)取集合C3中一个信令位置k,在停留位置集合C2中找到在时间上与信令位置j最接近的前一个记录和后一个记录,记为信令位置j和信令位置j+1;
[0049] (3)根据信令位置k与信令位置j之间的经纬度信息计算距离为dis(j,k),最长的在途旅行时间为t(k)in‑t(j)out;最低移动速度为dis(j,k)/(t(k)in‑t(j)out);同样,信令位
置k与信令位置j+1的最低移动速度计算为dis(k,j+1)/(t(j+1)in‑t(k)out);
[0050] (4)设定步行速度为4km/h,考虑一般路径不是直线路径,按照直线距离计算速度会对速度产生高估,因此取速度3km/h为阈值,若集合C3中的信令位置k与信令位置j和信令
位置j+1的速度均>3km/h,则判断信令位置k为在途点,否则判断信令位置k为停驻点。
[0051] 6)将集合C3中判断为停驻点的信令位置从集合C3中拿走归入集合C2,从而更新停留位置集合C2和集合C3;将停留位置集合C2中的信令位置按照信令位置开始时间t(j)in进
行排序;
[0052] 7)返回步骤5)直至集合C2和集合C3中的信令位置的数量不再发生变化,最终得到集合C2既为全部停驻点集合。
[0053] 如图2a、图2b所示,B为C3中点,若(d(A,B)+d(B,C))/d(A,C)>1.3,则将C3中点加入C2,最终得到C2既为全部停驻点集合。
[0054] 下面给出实例:
[0055] 1、首先进行居住地识别
[0056] 选取连续7天内均出现的用户手机及其相关的时间空间信息,根据用户日常作息规律,选取每天第一条和最后一条记录,对相应空间信息进行空间聚类。计算用户在该聚类
地点出现天数,设定识别条件,如果用户出现天数与在聚类地点出现频率均超过设定的阈
值,则将该地点识别为居住地。
[0057] 2、进行工作地识别
[0058] 选取出现天数高于5天,并且已识别出居住地的用户记录,计算记录中各点位置与居住地距离,选取距离大于设定阈值(大于1km)的地点,进行空间聚类分析。统计在每个聚
类位置下停留的时间,以及每个用户的每个聚类地出现的天数,按照出现天数与停留时长
进行排序,将出现天数最长且停留时间最长的聚类地点识别为工作地。
[0059] 3、对本发明的一种使用手机信令数据提取出行停驻点的方法的验证
[0060] 将通过上述停驻点识别方法得到的信令数据停驻点,与实际出行轨迹进行对比,停驻点识别平均成功率为75%,说明本发明的方法具有较高的合理性和可行性。以某个体
一天信令数据分析可得,个体某日出行生成信令数据记录794条,通过停驻点挖掘技术,识
别认定停驻点10处,其中9处与实际停驻点位置吻合,且实际停驻点全部被准确识别,如图
3。