用户出行时段分析方法转让专利

申请号 : CN201611152291.1

文献号 : CN106604227B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 陈文宁王树峰孙秋香魏亚菲刘天炜张晓莹王金玲金小春

申请人 : 中国联合网络通信有限公司吉林省分公司

摘要 :

用户出行时段分析方法,涉及地理信息技术领域,解决现有用户位置分析方法存在评估困难且无法实现全面分析及判断等问题,本发明对每个联通用户信令记录按时间顺序升序排列;运用分类讨论确定每个联通用户各时段的常驻基站;将一天定义为出行时段和结束时段,以闲时常驻基站为出行起始基站位置与出行结束基站位置,计算某用户每天每条记录中基站与常驻基站的距离,从出行开始时段中选取时间最早的时间点作为出行开始时间点,从出行结束时段中选取时间最晚的时间点作为出行结束时间点;区分工作日与休息日,按天统计累计汇总到月,取出行开始时间点的众数和出行结束时间点的众数作为最终出行开始和结束的时间点,实现对用户出行时段的分析。

权利要求 :

1.用户出行时段分析方法,其特征是,该方法由以下步骤实现:

步骤一、采用时间序列形式对每个联通用户信令记录按时间顺序升序排列;运用分类讨论的基本原理确定每个联通用户各时段的常驻基站;

所述运用分类讨论的基本原理确定每个联通用户各时段的常驻基站具体为:首先确定每个联通用户一天的忙时与闲时;取该用户分别在忙时和闲时停留时间最长的基站为常驻基站;之后汇总到整月,取出停留时长最长的基站,作为该用户的常驻基站;

步骤二、将一天分别定义为出行时段和结束时段,以闲时常驻基站为出行起始基站位置与出行结束基站位置,按时间顺序将基站进行排序;

步骤三、运用google地图距离公式,计算某用户每天每条记录中基站与常驻基站的距离,再选取距离大于1000m的基站进行时间排序,从出行开始时段中选取时间最早的时间点作为出行开始时间点,从出行结束时段中选取时间最晚的时间点作为出行结束时间点;

步骤四、区分工作日与休息日,按天统计累计汇总到月,取步骤三中出行开始时间点的众数作为最终出行开始时间点,取出行结束时间点的众数作为最终出行结束时间点;实现对用户出行时段的分析。

2.根据权利要求1所述的用户出行时段分析方法,其特征在于,步骤二中,所述以闲时常驻基站为出行起始基站位置与出行结束基站位置,具体为:把时间数据按小时划分,取0:

00—12:00为出行开始时段;13:00—23:00为出行结束时段,依据时间序列形式将基站进行排序。

3.根据权利要求1所述的用户出行时段分析方法,其特征在于,忙时范围取6:00—21:

00为工作时段;闲时范围取22:00—次日5:00为休息时段。

说明书 :

用户出行时段分析方法

技术领域

[0001] 本发明涉及地理信息技术领域,具体涉及一种以用户地理位置及出行时间信息评价用户出行轨迹情况的方法。

背景技术

[0002] 随着4G网络的不断普及,用户位置信息获取能力得到提升,中国联合网络通信集团有限公司(简称“中国联通”)吉林分公司在大数据建设过程中获取了大量的数据,但如何从如此繁杂的数据中提炼出我们所需要的信息,成为了大数据平台建设过程中新的课题,伴随着大数据应用的讨论、创新,个性化技术成为了一个重要落地点。同时,由于这些数据涉用户位置轨迹信息,用户出行时刻信息,其均属于隐私信息。如何在有效使用这些敏感数据的同时又能保证数据安全就变得越来越重要。
[0003] 针对基站变更的不规律性、用户出行时间的差异性、用户轨迹的不可控性等问题,联通公司急需一种科学的分析方法来实现对以上信息的有效利用。目前,对于联通的用户来说,只能粗略的通过用户基站轨迹了解用户是否到达过某地域,并没有对其实现大数据形式的利用,是对于该方面大数据利用价值的损失,其缺乏全面的、有效的、统一的分析度量方法,缺失可行的定位手段。

发明内容

[0004] 本发明解决了联通公司获取的用户轨迹数据价值的实现,传统的用户位置分析方法存在评估困难且无法实现全面分析及判断等问题,本发明提供一种用户出行时段分析方法。
[0005] 用户出行时段分析方法,由以下步骤实现:
[0006] 步骤一、采用时间序列形式对每个联通用户信令记录按时间顺序升序排列;运用分类讨论的基本原理确定每个联通用户各时段的常驻基站;
[0007] 步骤二、将一天分别定义为出行时段和结束时段,以闲时常驻基站为出行起始基站位置与出行结束基站位置,按时间顺序将基站进行排序;
[0008] 步骤三、运用google地图距离公式,计算某用户每天每条记录中基站与常驻基站的距离,选出距离>1000米的记录,并按时间序列形式排序,从出行开始时段中选取时间最早的时间点作为出行开始时间点,从出行结束时段中选取时间最晚的时间点作为出行结束时间点;
[0009] 步骤四、区分工作日与休息日,按天统计累计汇总到月,取步骤三中出行开始时间点的众数作为最终出行开始时间点,取出行结束时间点的众数作为最终出行结束时间点;实现对用户出行时段的分析。
[0010] 本发明的有益效果:
[0011] (1)本发明所述的方法综合反映一定时期联通用户出行轨迹的变动规律和变动特征。
[0012] (2)本发明所述的方法对用户所属生活习性分析提供一定依据,为评价用户所属工作类型提供一个参考依据。
[0013] (3)本发明将联通公司现有基站情况与用户行为紧密联系在一起,为用户所属地理信息分析研究、判断用户行为规律提供强有力支撑,便于联通公司实现精准营。
[0014] (4)本发明采用的谷歌距离计算方法,对用户轨迹分析提供了强有力的理论支持。
[0015] (5)本发明所述的最终汇总方法采用取众数,确保了对用户行为轨迹定位的大概率成功性。

附图说明

[0016] 图1为本发明所述的用户出行时段分析方法的流程图。

具体实施方式

[0017] 具体实施方式一、结合图1说明本实施方式,用户出行时段分析方法,[0018] 步骤一、对每个联通用户信令记录按时间顺序升序排列;
[0019] 步骤二、运用分类讨论的基本原理确定步骤一中各时段常驻基站;
[0020] max(Bi)={b1 b2 … bn}
[0021] 其中i表示时刻分割点,bi表示停留基站时长,max(Bi)表示停留时长最长的常驻基站;
[0022] 步骤三、以一个用户为例,将一天分别定义为出行时段和结束时段,[0023]
[0024] 以闲时常驻基站为出行起始基站位置与出行结束基站位置,依据时间序列形式将基站进行排序。
[0025] 步骤四、运用google地图距离公式,计算用户每天每条记录中基站与常驻基站的距离,统计距离>1000M的基站,按时间序列形式排序,从出行开始时段中选取时间最早的时点作为出行开始时点,从出行开始时段中选取时间最晚的时点作为出行结束时点。
[0026] 步骤五、区分工作日与休息日,按天统计累计汇总到月,取出行开始时点的众数作为最终出行开始时点,取出行结束时点的众数作为最终出行结束时点。
[0027] 具体实施方式二、本实施方式为具体实施方式一所述的分析方法的实施例:基于时间序列形式,结合联通信令数据特征,把信令的日数据明细以用户为维度,对每个用户信令记录按时间顺序升序排列,之后,以一个用户为例,将一天分别定义为出行时段和结束时段,以闲时常驻基站为起始基站位置与结束基站位置,依据时间序列形式将基站进行排序统计。采用google地图的计算公式用经纬度计算地图两基站点A与B的距离,选出用户每天的出行开始时点与出行结束时点,并把日期按工作与休息日分别统计。然后统计至少一个月的众数,作为出行开始与出行结束时点,具体实施方式为:
[0028] 一、对每个联通用户信令记录按时间顺序升序排列,计算基站停留时长。
[0029] 把信令的日数据明细以用户为维度,按时间顺序排列,用下一个时间记录的开始时间-当前记录的开始时间,得到的时长作为当前基站的停留时长。
[0030] 二、计算汇总得到步骤一中各时段常驻基站;
[0031] (1)以一个用户为例,首先确定一日的忙时与闲时,取6:00—21:00为工作时段(忙时);22:00—次日5:00为休息时段(闲时)。
[0032] (2)取用户分别在忙时和闲时停留时间最长的基站为常驻基站。之后汇总到整月,取出停留时长最长的基站,作为用户的常驻基站。
[0033] 三、以一个用户为例,将一天分别定义为出行时段和结束时段,取0:00—12:00为出行开始时段;13:00—23:00为出行结束时段,具体划分形式如下:
[0034]
[0035] 之后以闲时常驻基站为起始基站位置与结束基站位置,依据时间序列形式将基站进行排序统计。
[0036] 四、运用google地图距离公式,计算用户各个时刻基站与常驻基站的距离,确定每日出行时刻点
[0037] 在前面实施方式三的基础之上,取闲时常驻基站为起始基站位置与结束基站位置,进行变站分析,用google地图距离公式,计算用户每天每条记录中基站与常驻基站的距离,统计距离>1000M的基站,按时间序列形式排序,从出行开始时段中选取时间最早的时点作为出行开始时点,从出行开始时段中选取时间最晚的时点作为出行结束时点。基站距离采用google地图的计算公式,具体公式如下:
[0038] DISTANCE=round(2*asin(sqrt(power(sin((lat1*asin(1)*2/180-lat2*asin(1)*2/180)/2),2)+cos(lat1*asin(1)*2/180)*cos(lat2*asin(1)*2/180)*power(sin((lng1*asin(1)*2/180-lng2*asin(1)*2/180)/2),2)))*EARTH_RADIUS*10000)/10)。
[0039] 其中:EARTH_RADIUS为地球半径,6378.137千米;
[0040] Lat1:点A的纬度,Lat2:点B的纬度,Lng1:点A的经度,Lng2:点B的经度。
[0041] 五、区分工作日与休息日,按天统计累计汇总到月,确定用户出行开始时刻点与结束时刻点。
[0042] 区分工作日与休息日,按天取用户出行开始时点,然后统计至少一个月的众数,作为出行开始时点,按天取用户出行结束时点,然后统计至少一个月的众数,作为出行结束时点。最终得到用户的出行规律。