轨迹规律的挖掘方法、装置、存储介质及电子设备转让专利

申请号 : CN201811401804.7

文献号 : CN109697221B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 徐丽丽王宇飞董俊龙

申请人 : 东软集团股份有限公司

摘要 :

本公开涉及一种轨迹规律的挖掘方法、装置、存储介质及电子设备,用于解决对低频采样轨迹进行规律分析准确性不高的技术问题。该方法包括:基于历史轨迹数据确定频繁点区域,频繁点区域包括频繁起点区域以及频繁终点区域;根据历史轨迹数据中起止点位于频繁点区域内的多条轨迹的采样点数据,确定频繁起点区域到频繁终点区域之间至少一条连通路径;确定目标轨迹与每一连通路径的相似度,并根据相似度确定目标轨迹所属的连通路径。

权利要求 :

1.一种轨迹规律的挖掘方法,其特征在于,所述方法包括:基于历史轨迹数据确定频繁点区域,所述频繁点区域包括频繁起点区域以及频繁终点区域;

根据所述历史轨迹数据中起止点位于所述频繁点区域内的多条轨迹的采样点数据,确定所述频繁起点区域到所述频繁终点区域之间至少一条连通路径;

确定目标轨迹与每一所述连通路径的相似度,并根据所述相似度确定所述目标轨迹所属的连通路径;

所述根据所述历史轨迹数据中起止点位于所述频繁点区域内的多条轨迹的采样点数据,确定所述频繁起点区域到所述频繁终点区域之间至少一条连通路径,包括:从所述历史轨迹数据中提取起点在所述频繁起点区域,以及终点在所述频繁终点区域的多条轨迹的采样点数据;

根据所述采样点数据提取所述频繁起点区域到所述频繁终点区域之间所有路段;

确定各路段之间的接续关系,以得到所述频繁起点区域到所述频繁终点区域之间至少一条连通路径;

根据所述采样点数据提取所述频繁起点区域到所述频繁终点区域之间所有路段,包括:

按照方位角对所述采样点数据进行一次聚类;

按照经纬度对一次聚类结果进行二次聚类,以提取得到所述频繁起点区域到所述频繁终点区域之间所有路段。

2.根据权利要求1所述的方法,其特征在于,所述基于历史轨迹数据确定频繁点区域,包括:

对所述历史轨迹数据的起止点分别进行聚类,以形成多个类簇;

合并类簇中心距离小于距离阈值的类簇,得到多个目标类簇;

确定起止点数量最多的目标类簇为频繁点区域。

3.根据权利要求1所述的方法,其特征在于,每一所述路段包括路段方位角、路段边界以及路段长度,所述确定各路段之间的接续关系,以得到所述频繁起点区域到所述频繁终点区域之间至少一条连通路径,包括:根据每一所述路段的采样点数据的采集时序确定各路段之间的接续关系,并构建路径有向图;

采用广度优先算法或者深度优先算法遍历所述路径有向图,以得到所述频繁起点区域到所述频繁终点区域之间至少一条连通路径。

4.根据权利要求1至3中任一项所述的方法,其特征在于,所述目标轨迹为实时获取到的车辆的行驶路径,所述方法还包括:获取所述目标轨迹所属连通路径的路况信息,将所述路况信息发送给所述车辆。

5.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:在得到每一所述历史轨迹所属的连通路径后,根据每一所述连通路径包括历史轨迹的数量确定所述连通路径中的频繁路径。

6.一种轨迹规律的挖掘装置,其特征在于,所述装置包括:频繁点区域确定模块,用于基于历史轨迹数据确定频繁点区域,所述频繁点区域包括频繁起点区域以及频繁终点区域;

连通路径确定模块,用于根据所述历史轨迹数据中起止点位于所述频繁点区域内的多条轨迹的采样点数据,确定所述频繁起点区域到所述频繁终点区域之间至少一条连通路径;

路径相似度计算模块,用于确定目标轨迹与每一所述连通路径的相似度,并根据所述相似度确定所述目标轨迹所属的连通路径;

连通路径确定模块包括数据提取子模块,用于从历史轨迹数据中提取起点在频繁起点区域,以及终点在频繁终点区域的多条轨迹的采样点数据;路段提取子模块,用于根据采样点数据提取频繁起点区域到频繁终点区域之间所有路段;关系确定子模块,用于确定各路段之间的接续关系,以得到频繁起点区域到频繁终点区域之间至少一条连通路径;

所述路段提取子模块用于:按照方位角对所述采样点数据进行一次聚类;按照经纬度对一次聚类结果进行二次聚类,以提取得到所述频繁起点区域到所述频繁终点区域之间所有路段。

7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至5中任一项所述方法的步骤。

8.一种电子设备,其特征在于,包括:存储器,其上存储有计算机程序;

处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1至5中任一项所述方法的步骤。

说明书 :

轨迹规律的挖掘方法、装置、存储介质及电子设备

技术领域

[0001] 本公开涉及数据挖掘技术领域,具体地,涉及一种轨迹规律的挖掘方法、装置、存储介质及电子设备。

背景技术

[0002] 随着可定位智能设备的普及与无线通讯技术的发展,大规模数量的用户位置数据被采集并持久化保存,形成了海量的轨迹数据。通过对大量的轨迹数据进行挖掘,可以得到
蕴藏在数据中丰富的信息,包括用户的出行习惯、生活经验等。在现有技术中,通常采用如
下方法对轨迹规律进行挖掘:
[0003] 1、基于网格聚合的方式。在该方式中,网格大小设置的合理性对算法效率以及轨迹分类的准确性影响较大,例如网格太多,聚合后的轨迹数据量仍然很大,导致算法效率不
高,网格太少,轨迹分类效果不佳。
[0004] 2、基于POI(Point of Interest,兴趣点)集合分析的方式。该方式依赖于外部系统生成轨迹的POI集合,基于轨迹中特殊点的分析方法受特殊点提取准确度影响较大,不适
用于采样频率较低的应用场景。

发明内容

[0005] 本公开的目的是提供一种轨迹规律的挖掘方法、装置、存储介质及电子设备,用于解决对低频采样轨迹进行规律分析准确性不高的技术问题。
[0006] 为了实现上述目的,本公开第一方面提供一种轨迹规律的挖掘方法,所述方法包括:
[0007] 基于历史轨迹数据确定频繁点区域,所述频繁点区域包括频繁起点区域以及频繁终点区域;
[0008] 根据所述历史轨迹数据中起止点位于所述频繁点区域内的多条轨迹的采样点数据,确定所述频繁起点区域到所述频繁终点区域之间至少一条连通路径;
[0009] 确定目标轨迹与每一所述连通路径的相似度,并根据所述相似度确定所述目标轨迹所属的连通路径。
[0010] 可选地,所述基于历史轨迹数据确定频繁点区域,包括:
[0011] 对所述历史轨迹数据的起止点分别进行聚类,以形成多个类簇;
[0012] 合并类簇中心距离小于距离阈值的类簇,得到多个目标类簇;
[0013] 确定起止点数量最多的目标类簇为频繁点区域。
[0014] 可选地,所述根据所述历史轨迹数据中起止点位于所述频繁点区域内的多条轨迹的采样点数据,确定所述频繁起点区域到所述频繁终点区域之间至少一条连通路径,包括:
[0015] 从所述历史轨迹数据中提取起点在所述频繁起点区域,以及终点在所述频繁终点区域的多条轨迹的采样点数据;
[0016] 根据所述采样点数据提取所述频繁起点区域到所述频繁终点区域之间所有路段;
[0017] 确定各路段之间的接续关系,以得到所述频繁起点区域到所述频繁终点区域之间至少一条连通路径。
[0018] 可选地,根据所述采样点数据提取所述频繁起点区域到所述频繁终点区域之间所有路段,包括:
[0019] 按照方位角对所述采样点数据进行一次聚类;
[0020] 按照经纬度对一次聚类结果进行二次聚类,以提取得到所述频繁起点区域到所述频繁终点区域之间所有路段。
[0021] 可选地,每一所述路段包括路段方位角、路段边界以及路段长度,所述确定各路段之间的接续关系,以得到所述频繁起点区域到所述频繁终点区域之间至少一条连通路径,
包括:
[0022] 根据每一所述路段的采样点数据的采集时序确定各路段之间的接续关系,并构建路径有向图;
[0023] 采用广度优先算法或者深度优先算法遍历所述路径有向图,以得到所述频繁起点区域到所述频繁终点区域之间至少一条连通路径。
[0024] 可选地,所述目标轨迹为实时获取到的车辆的行驶路径,所述方法还包括:
[0025] 获取所述目标轨迹所属连通路径的路况信息,将所述路况信息发送给所述车辆。
[0026] 可选地,所述方法还包括:
[0027] 在得到每一所述历史轨迹所属的连通路径后,根据每一所述连通路径包括历史轨迹的数量确定所述连通路径中的频繁路径。
[0028] 本公开第二方面提供一种轨迹规律的挖掘装置,所述装置包括:
[0029] 频繁点区域确定模块,用于基于历史轨迹数据确定频繁点区域,所述频繁点区域包括频繁起点区域以及频繁终点区域;
[0030] 连通路径确定模块,用于根据所述历史轨迹数据中起止点位于所述频繁点区域内的多条轨迹的采样点数据,确定所述频繁起点区域到所述频繁终点区域之间至少一条连通
路径;
[0031] 路径相似度计算模块,用于确定目标轨迹与每一所述连通路径的相似度,并根据所述相似度确定所述目标轨迹所属的连通路径。
[0032] 可选地,所述频繁点区域确定模块包括:
[0033] 聚类子模块,用于对所述历史轨迹数据的起止点分别进行聚类,以形成多个类簇;
[0034] 合并子模块,用于合并类簇中心距离小于距离阈值的类簇,得到多个目标类簇;
[0035] 确定子模块,用于确定起止点数量最多的目标类簇为频繁点区域。
[0036] 可选地,所述连通路径确定模块包括:
[0037] 数据提取子模块,用于从所述历史轨迹数据中提取起点在所述频繁起点区域,以及终点在所述频繁终点区域的多条轨迹的采样点数据;
[0038] 路段提取子模块,用于根据所述采样点数据提取所述频繁起点区域到所述频繁终点区域之间所有路段;
[0039] 关系确定子模块,用于确定各路段之间的接续关系,以得到所述频繁起点区域到所述频繁终点区域之间至少一条连通路径。
[0040] 可选地,所述路段提取子模块用于:
[0041] 按照方位角对所述采样点数据进行一次聚类;
[0042] 按照经纬度对一次聚类结果进行二次聚类,以提取得到所述频繁起点区域到所述频繁终点区域之间所有路段。
[0043] 可选地,每一所述路段包括路段方位角、路段边界以及路段长度,所述关系确定子模块用于:
[0044] 根据每一所述路段的采样点数据的采集时序确定各路段之间的接续关系,并构建路径有向图;
[0045] 采用广度优先算法或者深度优先算法遍历所述路径有向图,以得到所述频繁起点区域到所述频繁终点区域之间至少一条连通路径。
[0046] 可选地,所述目标轨迹为实时获取到的车辆的行驶路径,所述装置还包括:
[0047] 路况信息获取模块,用于获取所述目标轨迹所属连通路径的路况信息,将所述路况信息发送给所述车辆。
[0048] 可选地,所述装置还包括:
[0049] 频繁路径确定模块,用于在得到每一所述历史轨迹所属的连通路径后,根据每一所述连通路径包括历史轨迹的数量确定所述连通路径中的频繁路径。
[0050] 本公开第三方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开第一方面提供的轨迹规律的挖掘方法的步骤。
[0051] 本公开第四方面提供一种电子设备,包括:
[0052] 存储器,其上存储有计算机程序;
[0053] 处理器,用于执行所述存储器中的所述计算机程序,以实现本公开第一方面提供的轨迹规律的挖掘方法的步骤。
[0054] 在上述技术方案中,通过对海量历史轨迹数据的起点和终点进行分析可以确定用户的频繁起点区域以及频繁终点区域,根据历史轨迹数据中起点位于频繁起点区域内、且
终点位于频繁终点区域内的多条轨迹的采样点数据,可以刻画出频繁起点区域到频繁终点
区域之间至少一条连通路径,然后通过计算任一轨迹与每一连通路径的相似度,确定与该
轨迹相似度最高的连通路径为它的所属连通路径。这样,可以避免由于特殊点选取不准确
或者特殊值设置不合理对轨迹分类结果造成的影响,即使轨迹的采样频率较低,也能融合
历史轨迹数据刻画出该轨迹的连通路径,提升了对低频采样轨迹进行规律分析的准确性。
[0055] 本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

[0056] 附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
[0057] 图1是本公开实施例提供的一种轨迹规律的挖掘方法的流程图;
[0058] 图2是本公开实施例提供的一种轨迹规律的挖掘方法的流程图;
[0059] 图3是对采样点数据进行一次聚类后的结果示意图;
[0060] 图4是对采样点数据进行二次聚类后的结果示意图;
[0061] 图5是本公开实施例提供一种路径有向图;
[0062] 图6是本公开实施例提供的一种轨迹规律的挖掘装置的框图;
[0063] 图7是本公开实施例提供的一种电子设备的框图。

具体实施方式

[0064] 以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
[0065] 轨迹数据分析服务面向不同的客户,在实施过程中不同用户的数据采样频率不一致,高频采样可以保证在每条道路上搜集一定数量的采样点,对连续采样点进行分析可以
提取道路特征,利用现有技术即可实现轨迹规律的挖掘。然而,若轨迹采样频率较低,例如
采样点个数少且分布稀疏,利用现有技术进行轨迹规律的挖掘可能会导致轨迹分类的准确
率不高,甚至无法进行规律分析等问题。
[0066] 为了解决对低频采样轨迹进行规律分析准确性不高的技术问题,本公开实施例提供一种轨迹规律的挖掘方法,下面结合具体实施例对本公开提供的技术方案进行详细说
明。
[0067] 图1是本公开实施例提供的一种轨迹规律的挖掘方法的流程图,如图1所示,该方法包括以下步骤:
[0068] S11、基于历史轨迹数据确定频繁点区域。
[0069] 其中,频繁点区域包括频繁起点区域以及频繁终点区域。以确定频繁起点区域为例,需要确定频繁起点区域的半径以及边界,根据采集到的历史轨迹数据可以得到大量用
户起点位置信息,例如停车点位置。由于用户停车位置不固定,可以按照合适的半径对停车
点位置进行分区,或者按照聚类算法对起点进行聚类,以得到多个起点区域,并确定包含起
点位置数量最多的区域为频繁起点区域。
[0070] 频繁终点区域的确定原理与频繁起点区域确定原理相同,此处便不再赘述。
[0071] S12、根据历史轨迹数据中起止点位于频繁点区域内的多条轨迹的采样点数据,确定频繁起点区域到频繁终点区域之间至少一条连通路径。
[0072] 由于采样频率较低,采样点数量较少,利用单条行程轨迹无法刻画从起点到终点的连通路径。本公开实施例通过融合历史轨迹数据,提取历史轨迹数据中起点位于频繁起
点区域、且终点位于频繁终点区域的多条轨迹的采样点数据,该采样点数据包括方向信息
以及位置信息,按照各采样点之间的接续关系可以得到一条或多条频繁起点区域到频繁终
点区域之间的连通路径。
[0073] S13、确定目标轨迹与每一连通路径的相似度,并根据相似度确定目标轨迹所属的连通路径。
[0074] 示例地,频繁起点区域到频繁终点区域之间具有多条连通路径。分别计算目标轨迹与每一连通路径的相似度,并确定与目标轨迹相似度最大的连通路径为目标轨迹的所属
连通路径,也就是说该连通路径包含目标轨迹。其中,目标轨迹可以是任一历史轨迹,也可
以是实时获取到的车辆的行驶轨迹。例如,频繁起点区域到频繁终点区域之间有3条连通路
径,历史轨迹A与连通路径1、连通路径2、连通路径3的相似度分别为75%、1、25%,则历史轨
迹A的所属连通路径为连通路径2。
[0075] 采用上述方法,通过对海量历史轨迹数据的起点和终点进行分析可以确定用户的频繁起点区域以及频繁终点区域,根据历史轨迹数据中起点位于频繁起点区域内、且终点
位于频繁终点区域内的多条轨迹的采样点数据,可以刻画出频繁起点区域到频繁终点区域
之间至少一条连通路径,然后通过计算任一轨迹与每一连通路径的相似度,确定与该轨迹
相似度最高的连通路径为它的所属连通路径。这样,可以避免由于特殊点选取不准确或者
特殊值设置不合理对轨迹分类结果造成的影响,即使轨迹的采样频率较低,也能融合历史
轨迹数据刻画出该轨迹的连通路径,提升了对低频采样轨迹进行规律分析的准确性。
[0076] 图2是本公开实施例提供的一种轨迹规律的挖掘方法的流程图,如图2所示,该方法包括以下步骤:
[0077] S21、对历史轨迹数据的起止点分别进行聚类,以形成多个类簇。
[0078] 示例地,采用DBSAN(Density‑Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)密度聚类算法对历史轨迹数据的所有起点
进行聚类,以形成多个起点类簇,其中,DBSAN算法的参数包括给定点在邻域内成为核心对
象的最小邻域点数和邻域半径,可以设置邻域半径范围为(10m,50m)。
[0079] 对历史轨迹数据的所有终点进行聚类,形成多个终点类簇的方法步骤与起点相同,此处便不再赘述。
[0080] S22、合并类簇中心距离小于距离阈值的类簇,得到多个目标类簇。
[0081] 也就是说,将中心距离小于距离阈值的起点类簇以及中心距离小于距离阈值的终点类簇分别进行合并,可以得到多个目标起点类簇以及多个目标终点类簇。其中,距离阈值
可以通过如下公式计算得到:
[0082] 距离阈值=采样周期*车辆平均速度;
[0083] 例如,距离阈值为 中心距离小于 的类簇将被合并,形成多个目标类簇。
[0084] S23、确定起止点数量最多的目标类簇为频繁点区域。
[0085] 分别计算每一目标类簇中的点个数,确定包括起点数量最多的目标起点类簇所在区域为频繁起点区域,确定包括终点数量最多的目标终点类簇所在区域为频繁终点区域。
[0086] S24、从历史轨迹数据中提取起点在频繁起点区域,以及终点在频繁终点区域的多条轨迹的采样点数据。
[0087] 对于确定频繁起点区域到频繁终点区域之间的连通路径,首先要提取采样点数据,具体执行为步骤S24:从历史轨迹数据中提取起点在频繁起点区域,以及终点在频繁终
点区域的多条轨迹的采样点数据。
[0088] S25、根据采样点数据提取频繁起点区域到频繁终点区域之间所有路段。
[0089] 在一种可能的实施方式中,采样点数据包括方位角信息以及经纬度信息,可以按照方位角对采样点数据进行一次聚类,并按照经纬度对一次聚类结果进行二次聚类,以提
取得到频繁起点区域到频繁终点区域之间所有路段。
[0090] 例如,图3是对采样点数据进行一次聚类后的结果示意图,图中标号为路段的类别标识,不同的标号代表不同的类别。如图3所示,将频繁起点区域到频繁终点区域之间分布
的多个采样点P按照方位角进行类聚,可以得到方位角不同三个路段类别:路段1、路段2和
路段3。对方位角聚类后的各个路段类别内的采样点数据分布进行二次聚类,二次聚类后的
结果如图4所示,共有五个路段类别,分别为路段1.1、路段1.2、路段2.1、路段2.2、路段3。
[0091] 值得说明的是,一次聚类和二次聚类所依据的属性信息可以根据实际需要进行置换或添加。
[0092] S26、确定各路段之间的接续关系,以得到频繁起点区域到频繁终点区域之间至少一条连通路径。
[0093] 具体地,每一路段包括路段方位角、路段边界以及路段长度,各路段的方位角可以是该路段类别中采样点的方位角均值,路段边界为路段类别的边界,路段长度为边界距离。
确定频繁起点区域到频繁终点区域之间的连通路径可以根据每一路段的采样点数据的采
集时序确定各路段之间的接续关系,构建路径有向图,并采用广度优先算法或者深度优先
算法遍历路径有向图,即可得到频繁起点区域到频繁终点区域之间至少一条连通路径。
[0094] 其中,路段的接续关系为路段的方向和连接关系。示例地,在本公开实施例中,可以以行程为单位,采集各行程轨迹的同一路段中至少两个采样点数据,并根据该采样点数
据的方位角确定路段方向,根据采样点数据的采集时序确定连接关系,所构建的路径有向
图如图5所示。采用广度优先算法或者深度优先算法遍历路径有向图,可以得到频繁起点区
域到频繁终点区域之间的连通路径包括路径1(O‑>A‑>C‑>D‑>E),以及路径2(O‑>B‑>C‑>D‑>
E)。
[0095] S27、确定目标轨迹与每一连通路径的相似度,并根据相似度确定目标轨迹所属的连通路径。
[0096] 示例地,将目标轨迹映射为起点至终点的行程路径,可以通过计算行程路径与连通路径所包含的相同的中间点的比例确定两者的相似度。例如,行程路径为O‑>A‑>C‑>D‑>
E,该行程路径与路径1(O‑>A‑>C‑>D‑>E)的相似度为1,与路径2(O‑>B‑>C‑>D‑>E)的相似度
为2/3。定义与行程路径相似度最大的连通路径为行程路径的所属连通路径,那么该行程路
径所属的连通路径为路径1。
[0097] S28、获取目标轨迹所属连通路径的路况信息,将路况信息发送给车辆。
[0098] 示例地,目标轨迹为实时获取到的车辆的行驶路径,在采用上述方法计算车辆的行驶路径与每一连通路径的相似度之后,可以确定车辆的行驶路径所属的连通路径,据此
可以预测用户的行程,并预先获取该连通路径上的路况信息,以在交通拥堵的情况下及时
通知用户重新规划出行路线,达到规避拥堵风险的目的。
[0099] S29、在得到每一历史轨迹所属的连通路径后,根据每一连通路径包括历史轨迹的数量确定连通路径中的频繁路径。
[0100] 由于用户频繁起点的路径包括用户的频繁路径,统计每一历史轨迹与每一连通路径的相似度,并确定包含历史轨迹个数最多的连通路径为用户的频繁路径。具体地,将历史
轨迹映射为起点至终点的行程路径,统计每一行程路径与每一连通路径的相似度。通过计
算得到每一行程路径与每一连通路径的相似度,可以确定每一行程路径的所属连通路径,
以及得到每一连通路径所包含的行程路径数量,进一步可以确定包含历史轨迹数量最多的
连通路径为频繁路径。例如,连通路径1、连通路径2、连通路径3包含的历史轨迹数量分别为
1024、375、226,则可以确定连通路径1为频繁起点区域到频繁终点区域之间的频繁路径。基
于频繁路径可以向用户推送周边美食、景区等服务消息。
[0101] 此外,根据统计结果还可以确定属于相同连通路径的行程路径为相似轨迹,不属于相同连通路径的行程路径为不同轨迹。对于具有相似轨迹的用户可以进行好友推荐服
务。
[0102] 根据上述方法,通过对历史轨迹数据的起止点分别进行聚类和合并,解决了由于起止点区域范围较大,频繁点区域难以确定的问题;通过融合历史轨迹数据,实现挖掘从频
繁起点区域到频繁终点区域的连通路径;为了保证聚类后路段类别呈现道路线形,利用分
属性聚类的方法,分别按照方位角和经纬度对路段进行聚类,并利用广度或者深度优先搜
索可以得到频繁起点区域到频繁终点区域之间的连通路径,最后将各个历史轨迹映射为从
起点到终点的行程路径,依次对比行程路径与连通路径的相似度,可以确定频繁路径、相似
路径以及不同路径。因而,采用上述方法进行轨迹规律挖掘,可以避免由于特殊点选取不准
确或者特殊值设置不合理对轨迹规律分类结果造成的影响,即使轨迹的采样频率较低,也
能融合历史轨迹数据刻画该轨迹的连通路径,提升了对低频采样轨迹进行规律分析的准确
性,同时扩展了轨迹规律挖掘方法的应用场景。
[0103] 图6是根据一示例性实施例示出的一种轨迹规律的挖掘装置的框图,该装置600可以通过软件、硬件或者两者结合实现成为电子设备的部分或者全部。参照图6,该装置600包
括:
[0104] 频繁点区域确定模块601,用于基于历史轨迹数据确定频繁点区域,频繁点区域包括频繁起点区域以及频繁终点区域;
[0105] 连通路径确定模块602,用于根据历史轨迹数据中起止点位于频繁点区域内的多条轨迹的采样点数据,确定频繁起点区域到频繁终点区域之间至少一条连通路径;
[0106] 路径相似度计算模块603,用于确定目标轨迹与每一所述连通路径的相似度,并根据所述相似度确定所述目标轨迹所属的连通路径。
[0107] 可选地,频繁点区域确定模块601包括聚类子模块,用于对历史轨迹数据的起止点分别进行聚类,以形成多个类簇;合并子模块,用于合并类簇中心距离小于距离阈值的类
簇,得到多个目标类簇;确定子模块,用于确定起止点数量最多的目标类簇为频繁点区域。
[0108] 可选地,连通路径确定模块602包括数据提取子模块,用于从历史轨迹数据中提取起点在频繁起点区域,以及终点在频繁终点区域的多条轨迹的采样点数据;路段提取子模
块,用于根据采样点数据提取频繁起点区域到频繁终点区域之间所有路段;关系确定子模
块,用于确定各路段之间的接续关系,以得到频繁起点区域到频繁终点区域之间至少一条
连通路径。
[0109] 具体地,路段提取子模块用于按照方位角对采样点数据进行一次聚类,并按照经纬度对一次聚类结果进行二次聚类,以提取得到频繁起点区域到频繁终点区域之间所有路
段。
[0110] 每一路段包括路段方位角、路段边界以及路段长度,关系确定子模块用于根据每一路段的采样点数据的采集时序确定各路段之间的接续关系,并构建路径有向图;采用广
度优先算法或者深度优先算法遍历路径有向图,以得到频繁起点区域到频繁终点区域之间
至少一条连通路径。
[0111] 可选地,装置600还包括路况信息获取模块,该模块用于获取目标轨迹所属连通路径的路况信息,将路况信息发送给车辆,其中,目标轨迹可以是实时获取到的车辆的行驶路
径。
[0112] 可选地,装置600还包括频繁路径确定模块,用于在得到每一历史轨迹所属的连通路径后,根据每一连通路径包括历史轨迹的数量确定连通路径中的频繁路径。
[0113] 通过对历史轨迹数据的起止点分别进行聚类和合并,解决了由于起止点区域范围较大,频繁点区域难以确定的问题;通过融合历史轨迹数据,实现挖掘从频繁起点区域到频
繁终点区域的连通路径;为了保证聚类后路段类别呈现道路线形,利用分属性聚类的方法,
分别按照方位角和经纬度对路段进行聚类,并利用广度或者深度优先搜索可以得到频繁起
点区域到频繁终点区域之间的连通路径,最后将各个历史轨迹映射为从起点到终点的行程
路径,依次对比行程路径与连通路径的相似度,可以确定频繁路径、相似路径以及不同路
径。综上,采用上述装置,可以避免由于特殊点选取不准确或者特殊值设置不合理对轨迹规
律分类结果造成的影响,即使轨迹的采样频率较低,也能融合历史轨迹数据刻画该轨迹的
连通路径,提升了对低频采样轨迹进行规律分析的准确性。
[0114] 关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
[0115] 图7是根据一示例性实施例示出的一种电子设备700的框图。如图7所示,该电子设备700可以包括:处理器701,存储器702。该电子设备700还可以包括多媒体组件703,输入/
输出(I/O)接口704,以及通信组件705中的一者或多者。
[0116] 其中,处理器701用于控制该电子设备700的整体操作,以完成上述的轨迹规律的挖掘方法中的全部或部分步骤。存储器702用于存储各种类型的数据以支持在该电子设备
700的操作,这些数据例如可以包括用于在该电子设备700上操作的任何应用程序或方法的
指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存
储器702可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随
机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器
(Electrically Erasable Programmable Read‑Only Memory,简称EEPROM),可擦除可编程
只读存储器(Erasable Programmable Read‑Only Memory,简称EPROM),可编程只读存储器
(Programmable Read‑Only Memory,简称PROM),只读存储器(Read‑Only Memory,简称
ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件703可以包括屏幕和音频组件。其中
屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括
一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储
器702或通过通信组件705发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O
接口704为处理器701和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,
按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件705用于该电子设备700与其他
设备之间进行有线或无线通信。无线通信,例如Wi‑Fi,蓝牙,近场通信(Near Field 
Communication,简称NFC),2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信
组件705可以包括:Wi‑Fi模块,蓝牙模块,NFC模块。
[0117] 在一示例性实施例中,电子设备700可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(Digital 
Signal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,
简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列
(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元
件实现,用于执行上述的轨迹规律的挖掘方法。
[0118] 在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的轨迹规律的挖掘方法的步骤。例如,该计算机可读存
储介质可以为上述包括程序指令的存储器702,上述程序指令可由电子设备700的处理器
701执行以完成上述的轨迹规律的挖掘方法。
[0119] 以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简
单变型,这些简单变型均属于本公开的保护范围。
[0120] 另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本公开对各种可
能的组合方式不再另行说明。
[0121] 此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。