一种基于深度学习的信令轨迹恢复方法、系统及存储介质转让专利

申请号 : CN202210446511.0

文献号 : CN114885293B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 司俊俊羊晋涂波

申请人 : 和智信(山东)大数据科技有限公司

摘要 :

本发明提供一种基于深度学习的信令轨迹恢复方法、系统及存储介质,所述方法包括:分别获取当前信令轨迹数据和历史信令轨迹数据;将第一预设时间段和第二预设时间段划分为多个时间区间,确定各时间区间的轨迹保留点;根据历史信令轨迹数据确定基站转移概率矩阵,并获取空间注意力数据;生成基站表征向量,确定各时间区间的位置表征向量和时间表征向量,基于位置表征向量和时间表征向量之和确定历史轨迹注意力数据;将当前信令轨迹数据中的基站表征向量和对应的时间表征向量之和输入至编码器获得轨迹表征向量,获取编码器注意力数据;将轨迹表征向量、空间注意力数据、历史轨迹注意力数据以及编码器注意力数据输入至解码器,得到预测的信令轨迹序列。

权利要求 :

1.一种基于深度学习的信令轨迹恢复方法,其特征在于,所述方法包括:

分别获取第一预设时间段内的当前信令轨迹数据和第二预设时间段内的历史信令轨迹数据,所述当前信令轨迹数据和历史信令轨迹数据均包括多个轨迹点信息,各所述轨迹点信息包括用户编码信息、基站编码信息和时间戳信息;

按照预设时间间隔将所述第一预设时间段和所述第二预设时间段分别划分为多个时间区间,基于所述当前信令轨迹数据确定各当前轨迹序列的各时间区间的轨迹保留点;

根据历史信令轨迹数据或基站信息数据生成基站表征向量,根据所述历史信令轨迹数据确定基站转移概率矩阵,以所述基站转移概率矩阵内的基站转移概率数据为权重确定空间注意力数据,所述空间注意力数据包括第一键向量和第一值向量;

基于所述基站表征向量确定历史信令轨迹数据中各历史轨迹序列的各时间区间的位置表征向量,基于各时间区间的时间信息确定各时间区间的时间表征向量,并基于所述位置表征向量和所述时间表征向量之和确定历史轨迹注意力数据,所述历史轨迹注意力数据包括第二键向量和第二值向量;

将当前信令轨迹数据中的各轨迹保留点对应的基站表征向量和相应时间区间的时间表征向量之和输入至编码器获得轨迹表征向量,并基于所述编码器的注意力机制确定编码器注意力数据,所述编码器注意力数据包括第三键向量和第三值向量;

将所述轨迹表征向量、空间注意力数据、历史轨迹注意力数据以及编码器注意力数据输入至解码器,得到预测的信令轨迹序列。

2.根据权利要求1所述的基于深度学习的信令轨迹恢复方法,其特征在于,基于所述当前信令轨迹数据确定各当前轨迹序列的各时间区间的轨迹保留点,包括:基于所述当前信令轨迹数据获取各当前轨迹序列的各时间区间内的轨迹点信息;

确定各当前轨迹序列的各时间区间内被附着的数量最多的基站;

以所述被附着的数量最多的基站以及对应时间区间的起始时间确定轨迹保留点。

3.根据权利要求1所述的基于深度学习的信令轨迹恢复方法,其特征在于,根据所述历史信令轨迹数据确定基站转移概率矩阵,包括:对所述历史信令轨迹数据中的各历史轨迹序列的轨迹点根据时间排序;

基于任意两个时间相邻轨迹点对应的基站编码信息构建基站切换关系数据;

基于所述基站切换关系数据计算各基站切换关系数据对应的基站转移概率;

基于计算到的所述基站转移概率生成基站转移概率矩阵。

4.根据权利要求1所述的基于深度学习的信令轨迹恢复方法,其特征在于,根据历史信令轨迹数据或基站信息数据生成基站表征向量,包括:基于所述历史信令轨迹数据或基站信息数据构建基站关系图谱;其中,所述基站关系图谱中以基站编码信息为节点,基站之间的距离为边;

基于所述基站关系图谱通过图神经网络或图嵌入学习模型进行学习,以获得基站表征向量。

5.根据权利要求1所述的基于深度学习的信令轨迹恢复方法,其特征在于,基于所述基站表征向量确定历史信令轨迹数据中各历史轨迹序列的各时间区间的位置表征向量,包括:获取各历史轨迹序列的各时间区间内各轨迹点的基站表征向量;

基于各时间区间的各轨迹点的基站表征向量求平均得到对应时间区间的位置表征向量。

6.根据权利要求1所述的基于深度学习的信令轨迹恢复方法,其特征在于,所述时间表征向量的计算公式为:其中,i表示第i个时间区间,i的最小值为1,最大值为被划分的时间区间的总数量,t表示时间表征,timei表示第i个时间区间的起始时间戳,d表示所述位置表征向量的长度,j表示位置索引,j的取值范围为0至floor d/2,floor代表向下取整,2j和2j+1分别表示所述位置表征向量中的偶位置和奇位置。

7.根据权利要求1至6中任意一项所述的基于深度学习的信令轨迹恢复方法,其特征在于,所述编码器和解码器均包括多个GRU单元,所述GRU单元数量与所述时间区间的数量相同。

8.根据权利要求7所述的基于深度学习的信令轨迹恢复方法,其特征在于,所述第一键向量为所述基站表征向量,所述第一值向量为所述基站表征向量的加权和,所述第二键向量和所述第二值向量均为所述位置表征向量和所述时间表征向量之和,所述第三键向量和所述第三值向量均为所述编码器中的GRU单元的输出向量。

9.一种基于深度学习的信令轨迹恢复系统,该系统包括处理器和存储器,其特征在于,所述存储器中存储有计算机指令,所述处理器用于执行所述存储器中存储的计算机指令,当所述计算机指令被处理器执行时该系统实现如权利要求1至8中任意一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至8中任意一项所述方法的步骤。

说明书 :

一种基于深度学习的信令轨迹恢复方法、系统及存储介质

技术领域

[0001] 本发明涉及大数据挖掘技术领域,尤其涉及一种基于深度学习的信令轨迹恢复方法、系统及存储介质。

背景技术

[0002] 信令轨迹数据是一种重要的数据资源,是城市中人、车、物移动过程中相关传感器设备(如手机)产生的海量具有时间、空间双重属性的数据。信令轨迹数据可以揭示人、车、物的移动规律,近年来被广泛应用于交通流量预测、实时人口统计分析、疫情密接人员挖掘等智慧城市的各个领域。然而,由于数据采集设备配置、数据传输存在的缺陷等原因,信令轨迹数据通常具有采样稀疏性和不均匀性。稀疏、不均匀的轨迹数据对于轨迹相似度分析、轨迹模式挖掘等上层应用产生严重影响。
[0003] 目前针对GPS的轨迹恢复,Ren等人提出了一种基于路网匹配和深度学习模型的轨迹恢复技术,但该轨迹恢复技术依赖于路网数据;Xia等人提出了一种基于注意力机制的轨迹恢复技术,从历史轨迹中学习周期性轨迹模式用于缺失轨迹点的预测,然而单纯的注意力机制无法较好地学习到轨迹数据的时序特征。由于信令轨迹数据中的位置不是用户的经纬度位置,而是由基站ID表示的,通过基站ID关联基站位置获取相应的经纬度信息,这一特点使得信令轨迹数据与GPS等轨迹数据不同,因而现有的针对GPS的轨迹恢复技术难以将稀疏且不均匀的信令轨迹数据高效且准确的恢复为高采样率、均匀的信令轨迹数据。因此,如何最大程度的恢复用户的真实信令轨迹是亟待解决的技术问题。

发明内容

[0004] 有鉴于此,本发明提供了一种基于深度学习的信令轨迹恢复方法、系统及存储介质,以解决现有技术中存在的一个或多个问题。
[0005] 根据本发明的一个方面,本发明公开了一种基于深度学习的信令轨迹恢复方法,所述方法包括:分别获取第一预设时间段内的当前信令轨迹数据和第二预设时间段内的历史信令轨迹数据,所述当前信令轨迹数据和历史信令轨迹数据均包括多个轨迹点信息,各所述轨迹点信息包括用户编码信息、基站编码信息和时间戳信息;
[0006] 按照预设时间间隔将所述第一预设时间段和所述第二预设时间段分别划分为多个时间区间,基于所述当前信令轨迹数据确定各当前轨迹序列的各时间区间的轨迹保留点;
[0007] 根据历史信令轨迹数据或基站信息数据生成基站表征向量,根据所述历史信令轨迹数据确定基站转移概率矩阵,以所述基站转移概率矩阵内的基站转移概率数据为权重确定空间注意力数据,所述空间注意力数据包括第一键向量和第一值向量;
[0008] 基于所述基站表征向量确定历史信令轨迹数据中各历史轨迹序列的各时间区间的位置表征向量,基于各时间区间的时间信息确定各时间区间的时间表征向量,并基于所述位置表征向量和所述时间表征向量之和确定历史轨迹注意力数据,所述历史轨迹注意力数据包括第二键向量和第二值向量;
[0009] 将当前信令轨迹数据中的各轨迹保留点对应的基站表征向量和相应时间区间的时间表征向量之和输入至编码器获得轨迹表征向量,并基于所述编码器的注意力机制确定编码器注意力数据,所述编码器注意力数据包括第三键向量和第三值向量;
[0010] 将所述轨迹表征向量、空间注意力数据、历史轨迹注意力数据以及编码器注意力数据输入至解码器,得到预测的信令轨迹序列。
[0011] 在本发明的一些实施例中,基于所述当前信令轨迹数据确定各当前轨迹序列的各时间区间的轨迹保留点,包括:
[0012] 基于所述当前信令轨迹数据获取各当前轨迹序列的各时间区间内的轨迹点信息;
[0013] 确定各当前轨迹序列的各时间区间内被附着的数量最多的基站;
[0014] 以所述被附着的数量最多的基站以及对应时间区间的起始时间确定轨迹保留点。
[0015] 在本发明的一些实施例中,根据所述历史信令轨迹数据确定基站转移概率矩阵,包括:
[0016] 对所述历史信令轨迹数据中的各历史轨迹序列的轨迹点根据时间排序;
[0017] 基于任意两个时间相邻轨迹点对应的基站编码信息构建基站切换关系数据;
[0018] 基于所述基站切换关系数据计算各基站切换关系数据对应的基站转移概率;
[0019] 基于计算到的所述基站转移概率生成基站转移概率矩阵。
[0020] 在本发明的一些实施例中,根据历史信令轨迹数据或基站信息数据生成基站表征向量,包括:
[0021] 基于所述历史信令轨迹数据或基站信息数据构建基站关系图谱;其中,所述基站关系图谱中以基站编码信息为节点,基站之间的距离为边;
[0022] 基于所述基站关系图谱通过图神经网络或图嵌入学习模型进行学习,以获得基站表征向量。
[0023] 在本发明的一些实施例中,基于所述基站表征向量确定历史信令轨迹数据中各历史轨迹序列的各时间区间的位置表征向量,包括:
[0024] 获取各历史轨迹序列的各时间区间内各轨迹点的基站表征向量;
[0025] 基于各时间区间的各轨迹点的基站表征向量求平均得到对应时间区间的位置表征向量。
[0026] 在本发明的一些实施例中,所述时间表征向量的计算公式为:
[0027]
[0028]
[0029] 其中,i表示第i个时间区间,i的最小值为1,最大值为被划分的时间区间的总数量,t表示时间表征,timei表示第i个时间区间的起始时间戳,d表示所述位置表征向量的长度,j表示位置索引,j的取值范围为0至floor(d/2),floor代表向下取整,2j和2j+1分别表示所述位置表征向量中的偶位置和奇位置。
[0030] 在本发明的一些实施例中,所述编码器和解码器均包括多个GRU单元,所述GRU单元数量与所述时间区间的数量相同。
[0031] 在本发明的一些实施例中,所述第一键向量为所述基站表征向量,所述第一值向量为所述基站表征向量的加权和,所述第二键向量和所述第二值向量均为所述位置表征向量和所述时间表征向量之和,所述第三键向量和所述第三值向量均为所述编码器中的GRU单元的输出向量。
[0032] 根据本发明的另一方面,还公开了一种基于深度学习的信令轨迹恢复系统,该系统包括处理器和存储器,所述存储器中存储有计算机指令,所述处理器用于执行所述存储器中存储的计算机指令,当所述计算机指令被处理器执行时该系统实现如上任一实施例任意一项所述方法的步骤。
[0033] 另外,本发明还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上任一实施例所述方法的步骤。
[0034] 本发明所公开的基于深度学习的信令轨迹恢复方法及系统基于历史信令轨迹数据对网络模型进行训练,且基于编码器输出的轨迹表征向量及空间注意力数据、历史轨迹注意力数据以及编码器注意力数据得到预测的信令轨迹数据,该方法可高效且准确的将稀疏、不均匀的信令轨迹数据恢复为高采样率、均匀地信令轨迹序列,从而该方法及系统最大程度的恢复了用户的真实信令轨迹。
[0035] 本发明的附加优点、目的,以及特征将在下面的描述中将部分地加以阐述,且将对于本领域普通技术人员在研究下文后部分地变得明显,或者可以根据本发明的实践而获知。本发明的目的和其它优点可以通过在书面说明及其权利要求书以及附图中具体指出的结构实现到并获得。
[0036] 本领域技术人员将会理解的是,能够用本发明实现的目的和优点不限于以上具体所述,并且根据以下详细说明将更清楚地理解本发明能够实现的上述和其他目的。

附图说明

[0037] 此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的限定。附图中的部件不是成比例绘制的,而只是为了示出本发明的原理。为了便于示出和描述本发明的一些部分,附图中对应部分可能被放大,即,相对于依据本发明实际制造的示例性装置中的其它部件可能变得更大。在附图中:
[0038] 图1为本发明一实施例的基于深度学习的信令轨迹恢复方法的流程示意图。
[0039] 图2为本发明一实施例的基于深度学习的信令轨迹恢复系统的结构示意图。
[0040] 图3为本发明一实施例的基于深度学习的信令轨迹恢复系统的架构示意图。

具体实施方式

[0041] 为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
[0042] 在此,需要说明的是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的结构和/或处理步骤,而省略了与本发明关系不大的其他细节。
[0043] 应该强调,术语“包括/包含/具有”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。
[0044] 在下文中,将参考附图描述本发明的实施例。在附图中,相同的附图标记代表相同或类似的部件,或者相同或类似的步骤。
[0045] 图1为本发明一实施例的基于深度学习的信令轨迹恢复方法的流程示意图,如图1所示,该信令轨迹恢复方法至少包括步骤S10至S60。
[0046] 步骤S10:分别获取第一预设时间段内的当前信令轨迹数据和第二预设时间段内的历史信令轨迹数据,所述当前信令轨迹数据和历史信令轨迹数据均包括多个轨迹点信息,各所述轨迹点信息包括用户编码信息、基站编码信息和时间戳信息。
[0047] 在该步骤中,第一预设时间段和第二预设时间段均为根据实际需要设定的时间段,例如第一预设时间段可为某天,而第二预设时间段可为过去30天,则此时当前信令轨迹数据为该天的信令数据,而历史信令轨迹数据为当前信令轨迹数据过去30天的信令数据。具体的,当前信令轨迹数据和历史信令轨迹数据均包括多条轨迹序列,而各轨迹序列均包括多个轨迹点。
[0048] 示例性的,可从Kafka消息队列或数据库中提取当前信令轨迹数据集合D,假设D={T1,T2,…,Tn},其中Tn表示第n条轨迹序列。Tn={p1,p2,…,pm},,其中pm表示第n条轨迹序列中m时刻的轨迹点,pm=(userID,CellID,timestamp),其中userID表示用户编码,CellID表示基站编码,timestamp表示时间戳信息。不难理解的,历史信令轨迹数据也可从数据库中提取,且第一预设时间段和第二预设时间段也可为除上述示例之外的其他时间段。
[0049] 步骤S20:按照预设时间间隔将所述第一预设时间段和所述第二预设时间段分别划分为多个时间区间,基于所述当前信令轨迹数据确定各当前轨迹序列的各时间区间的轨迹保留点。
[0050] 在该步骤中,预设时间间隔为预设的参数,其可以根据第一预设时间段、第二预设时间段以及所需要的时间区间的数量进行设定。在当第一预设时间段为24h时,则预设时间间隔可选为十分钟,则此时第一预设时间段被划分为144个时间区间,第二预设时间段的划分规则类似。在该实施例中,第一预设时间段和第二预设时间段所采用的时间间隔相等。通过上述描述可知,当前信令轨迹数据中具有多条当前轨迹序列,而各条当前轨迹序列具有多个轨迹点,因而在各时间区间内,各当前轨迹序列的各时间区间内的轨迹点可能为多个;而确定各当前轨迹序列的各时间区间的轨迹保留点是为了使各当前轨迹序列的各时间区间内仅保留一个轨迹点。
[0051] 示例性的,基于当前信令轨迹数据确定各当前轨迹序列的各时间区间的轨迹保留点,包括:基于当前信令轨迹数据获取各当前轨迹序列的各时间区间内的轨迹点信息;确定各当前轨迹序列的各时间区间内被附着的数量最多的基站;以所述被附着的数量最多的基站以及对应时间区间的起始时间确定轨迹保留点。具体的,获取到的各当前轨迹序列的各时间区间内的轨迹点一般为多个,且各轨迹点对应于一个基站,从该时间区间内的所有轨迹点中获取出现次数最多的基站编码信息,换句话说,在该时间区间内,位于该基站辐射范围内的轨迹点的数量最多,因而该被附着的数量最多的基站作为该时间区间的保留轨迹点对应的基站,且该时间区间的保留轨迹点的时间戳信息为相应时间区间的起始时间。
[0052] 步骤S30:根据历史信令轨迹数据或基站信息数据生成基站表征向量,根据所述历史信令轨迹数据确定基站转移概率矩阵,以所述基站转移概率矩阵内的基站转移概率数据为权重确定空间注意力数据,所述空间注意力数据包括第一键向量和第一值向量。
[0053] 基站转移概率矩阵是由多个基站转移概率数据组成,而基站转移概率数据是基于基站切换关系数据计算得到,基站切换关系用于体现两个基站间的转移次数。在该步骤中,可先基于历史信令轨迹数据或基站信息数据生成基站表征向量,基站信息数据中包括各基站的编码信息、经纬度信息以及位置信息等。在该步骤中,具体的可构建预训练模型对基站编码进行表征学习以获得基站表征向量。在一实施例中,根据历史信令轨迹数据或基站信息数据生成基站表征向量,包括:基于历史信令轨迹数据或基站信息数据构建基站关系图谱;其中,基站关系图谱中以基站编码信息为节点,基站之间的距离为边;基于所述基站关系图谱通过图神经网络或图嵌入学习模型进行学习,以获得基站表征向量。
[0054] 在上述实施例中,利用图神经网络构建预训练模型,图神经网络中的各顶点为各基站对应的基站编码信息,而图神经网络中的各边为相应基站之间的距离;在基站表征向量提取过程中,通过训练图神经网络使得距离越近的基站的嵌入向量相似度越高,得到每个基站的嵌入向量表征。另外,对于其中的NULL值可随机分配一个随机向量。
[0055] 示例性的,根据历史信令轨迹数据确定基站转移概率矩阵,包括:对历史信令轨迹数据中的各历史轨迹序列的轨迹点根据时间排序;基于任意两个时间相邻轨迹点对应的基站编码信息构建基站切换关系数据;基于基站切换关系数据计算各基站切换关系数据对应的基站转移概率;基于计算到的基站转移概率生成基站转移概率矩阵。
[0056] 在上述实施例中,基于历史轨迹数据,可先对历史信令轨迹数据中的各条历史轨迹序列的多个轨迹点按照时间升序进行排序,进而提取各时间相邻的两个轨迹点的基站编码信息生成基站切换关系数据,基站切换关系数据中至少包括第一基站的基站编码信息、第二基站的基站编码信息以及第一基站和第二基站之间的切换次数。对于各历史轨迹序列均包括多个基站切换关系数据,因而基于多个基站切换关系数据可进一步的计算出任意两个基站进行切换的基站转移概率,进而可确定基站概率转移矩阵M。Mi,j表示某一用户(某条历史轨迹数据)当前位置在基站i,下一位置为基站j的概率。当获取到基站转移概率矩阵后,可进一步的基于基站概率转移矩阵构建空间注意力数据;该空间注意力数据中的Key‑ks(第一键向量)为基站表征向量,Value‑vs(第一值向量)为所有基站表征向量的加权和,而在计算加权和时,权重取自基站概率转移矩阵中的基站转移概率。
[0057] 步骤S40:基于所述基站表征向量确定历史信令轨迹数据中各历史轨迹序列的各时间区间的位置表征向量,基于各时间区间的时间信息确定各时间区间的时间表征向量,并基于所述位置表征向量和所述时间表征向量之和确定历史轨迹注意力数据,所述历史轨迹注意力数据包括第二键向量和第二值向量。
[0058] 在步骤S30中获取到基站表征向量后,进一步的基于基站表征向量确定历史信令轨迹数据中各历史轨迹序列的各时间区间的位置表征向量。在一实施例中,基于所述基站表征向量确定历史信令轨迹数据中各历史轨迹序列的各时间区间的位置表征向量,具体包括:获取各历史轨迹序列的各时间区间内各轨迹点的基站表征向量;基于各时间区间的各轨迹点的基站表征向量求平均得到对应时间区间的位置表征向量。
[0059] 具体的,可先将获取到的历史信令轨迹数据中的各历史轨迹序列的多个轨迹点进行整理,即将第二预设时间段以预设时间间隔划分成多个时间区间,此时预设时间间隔可为十分钟;而对于各条轨迹序列,各时间区间内具有多个轨迹点;进而获取各时间区间内的各轨迹点对应的基站表征向量,并将各时间区间内的多个基站表征向量求平均分别作为各s时间区间的位置表征向量,位置表征向量可记为Vi ,其中i表示第i个时间间隔,s代表位置s
表征,Vi的长度记为d,d具体的指基站表征向量的维度,是用图神经网络对其进行学习时设置的模型参数,通常取64、128、256等值,在一具体实施例中取128。
[0060] 进一步的,基于各时间区间的时间信息确定各时间区间的时间表征向量。示例性的,基于如下编码函数计算时间表征向量:
[0061]
[0062]
[0063] 其中,i表示第i个时间区间,t表示时间表征,timei表示第i个时间区间的起始时间戳,d为位置表征向量的长度;2j和2j+1分别表示位置表征向量中的偶位置和奇位置,j最t t大为floor(d/2),floor表示向下取整;则Vi,2j和Vi,2j+1 分别表示Vi向量中奇偶位置的值,假设d是128维,则第0~127中的偶数位置的值是用sin函数进行计算,奇数位置的值用cos函数计算。
[0064] 当计算得到各时间区间对应的位置表征向量和时间表征向量之后,进一步的,计算各时间区间的位置表征向量和时间表征向量之和,且将计算得到的位置表征向量和时间表征向量之和作为历史注意力数据中的Key‑kh向量(第二键向量)和Value‑vh向量(第二值向量)。
[0065] 步骤S50:将当前信令轨迹数据中的各轨迹保留点对应的基站表征向量和相应时间区间的时间表征向量之和输入至编码器获得轨迹表征向量,并基于所述编码器的注意力机制确定编码器注意力数据,所述编码器注意力数据包括第三键向量和第三值向量。
[0066] 在该步骤中,基于当前信令轨迹数据获取当前信令轨迹数据中各轨迹保留点的基站编码信息,并基于步骤S30中所生成的基站表征向量确定各轨迹保留点对应的基站表征向量;并基于步骤S40中所列举的时间表征向量的计算算法计算各轨迹保留点对应时间区间的时间表征向量。进一步的,将计算得到的轨迹保留点的基站表征向量和对应时间区间的时间表征向量相加,得到向量之和作为轨迹点嵌入向量,进一步的将轨迹点嵌入向量输入至编码器得到轨迹表征向量。
[0067] 其中,编码器为基于RNN的编码器。在一实施例中,编码器中的网络单元可采用GRU单元,即编码器包括多个GRU单元,且GRU单元数量与上述的第一预设时间段和第二预设时间段被划分的时间区间的数量相同,各GRU单元的输入包括当前时间区间对应的轨迹点嵌入向量及上一个GRU单元输出的隐状态向量(第一个GRU单元没有此项),且最后一个GRU单元输出的隐状态即为当前轨迹序列的轨迹表征向量。在该步骤中,当前时间区间对应的轨迹点嵌入向量为当前时间区间的基站表征向量和时间表征向量之和,且该步骤还基于编码器构造编码器注意力数据,其中各GRU单元的输出向量作为编码器注意力数据的Key‑ke向量(第三键向量)和Value‑ve向量(第三值向量)。
[0068] 步骤S60:将所述轨迹表征向量、空间注意力数据、历史轨迹注意力数据以及编码器注意力数据输入至解码器,得到预测的信令轨迹序列。
[0069] 在该步骤中,由于输入的当前信令轨迹中的轨迹点为稀疏的、不均匀的,而预测的信令轨迹序列具体是指相对于输入的当前信令轨迹来说呈轨迹点高密度的、均匀的信令轨迹数据。
[0070] 在该实施例中,解码器与编码器类似的均为基于RNN的解码器,且该解码器也包括多个GRU单元。参考图3,解码器中的每个GRU单元的输入包括前一个GRU单元的输出隐向量(第一个GRU单元则输入编码器输出的轨迹表征向量)、空间注意力Key‑ks和Value‑vs向量;历史轨迹注意力Key‑kh和Value‑vh向量以及编码器注意力Key‑ke和Value‑ve向量。具体的,把当前GRU单元输入向量作为Query‑q和空间注意力数据、历史轨迹注意力数据和编码器注意力数据进行计算得到的输出向量进行拼接,输入到全连接层和softmax层,得到当前时间区间对应的预测基站表征向量。具体的计算函数如下所示:
[0071] hi=GRU(hi‑1,qi);
[0072]
[0073]
[0074]
[0075]
[0076] 其中,ks和vs分别为第一键向量和第一值向量,kh和vh分别为第二键向量和第二值向量,ke和ve分别为第三键向量和第三值向量,qi为Query‑q,hi代表当前GRU单元的输出,代表融合了空间注意力数据的输出, 代表融合了历史轨迹注意力数据的输出, 代表融合了编码器注意力的输出,oi表示解码器的输出。
[0077] 进一步的,将编码器预测到的当前时间区间对应的基站表征向量通过映射关系可确定各时间区间对应的基站编码信息,从而得到恢复后的信令轨迹序列。
[0078] 对应的,本发明还公开了一种基于深度学习的信令轨迹恢复系统,该系统包括处理器和存储器,所述存储器中存储有计算机指令,所述处理器用于执行所述存储器中存储的计算机指令,当所述计算机指令被处理器执行时该系统实现如上任一实施例所述方法的步骤。
[0079] 图2为本发明一实施例的基于深度学习的信令轨迹恢复系统的结构示意图,从图2中可以看出,该系统具体包括轨迹数据获取模块、全局动态空间信息提取模块、空间注意力模块、基站ID预训练模块、历史轨迹注意力模块、解码器模块、编码器模块、编码器注意力模块以及轨迹输出模块。
[0080] 轨迹数据获取模块用于获取基站信息表、当前信令轨迹数据和历史信令轨迹数据,当前信令轨迹数据和历史信令轨迹数据均为稀疏轨迹数据,并进而把轨迹信令数据按照预设的时间间隔划分为若干个时间区间。全局动态空间信息提取模块用于根据历史信令轨迹数据,把每个用户每条信令轨迹中的轨迹点按照时间进行升序排序后,获取相邻时间轨迹点之后,得到基站切换关系数据。基站ID预训练模块用于对所有的基站ID进行预训练,得到每个基站ID的表征向量;且对Null值分配一个相同长度的随机向量。空间注意力模块用于根据基站切换关系,构建空间注意力数据。历史轨迹注意力模块用于把历史信令轨迹数据中每个时间区间内所有轨迹点的对应基站ID表征向量进行融合。编码器模块用于构造循环神经网络依次处理当前轨迹每个时间区间的表征向量,学习得到整条轨迹序列的表征向量。编码器注意力模块用于生成编码器注意力数据。解码器模块用于构造循环神经网络,基于编码器输出的轨迹表征向量、空间注意力数据、历史轨迹注意力数据和编码器注意力数据对各时间区间的基站ID进行预测。轨迹输出模块用于获取各时间区间的基站ID,其中原始轨迹缺失时刻的基站ID取解码器的预测值,从而得到均匀、密集的信令轨迹序列。
[0081] 另外,该发明还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上任一实施例所述方法的步骤。
[0082] 本领域普通技术人员应该可以明白,结合本文中所公开的实施方式描述的各示例性的组成部分、系统和方法,能够以硬件、软件或者二者的结合来实现。具体究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD‑ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
[0083] 还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
[0084] 本发明中,针对一个实施方式描述和/或例示的特征,可以在一个或更多个其它实施方式中以相同方式或以类似方式使用,和/或与其他实施方式的特征相结合或代替其他实施方式的特征。
[0085] 以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。