一种航迹模式挖掘方法与装置转让专利

申请号 : CN202010394728.2

文献号 : CN111291098B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 杜文博陈薏充曹先彬朱熙

申请人 : 北京航空航天大学

摘要 :

本发明公开了一种航迹模式挖掘方法与装置,首先对航班航迹信息进行提取,进行数据预处理后,根据航迹密度分布生成核心对象并滤除噪声,然后对核心对象进行加权,并进行模式挖掘,最后对挖掘出的航迹模式进行展示。本发明针对空中交通运行高密度、高复杂度的状况,实现了在多航班运行环境下的航迹模式挖掘;围绕着海量航班运行背景下的航迹模式精准快速挖掘,从提升空中交通系统安全性和高效性两方面出发,开展航迹模式挖掘方法研究,对于确保航班飞行安全、合理调配空域容量、检测异常飞行状况、预测航班未来飞行行为以及提高空中交通系统的运行效率具有重要的意义。

权利要求 :

1.一种基于自适应层次聚类的航迹模式挖掘方法,其特征在于,包括如下步骤:S1:针对空域中的某一城市对,获取在某一时间段内的所有民航航班运行信息,从中提取航班的实时经度、实时纬度、实时高度、实时飞行速度、实时航向角以及实时时间点六种信息,形成多个航迹序列;

S2:对形成的各航迹序列进行预处理,包括去除异常值、去重、分段和重采样;

S3:计算预处理后的每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象;

S4:计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵;

S5:根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权;

S6:采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵;其中,更新后的Hausdorff距离矩阵中每一行对应的航迹核心对象为一个航迹聚类簇;

S7:计算各个航迹聚类簇的类内距离平均值和类间距离平均值,判断类内距离平均值与类间距离平均值的比值是否小于阈值;若否,则执行步骤S8;若是,则执行步骤S9;

S8:判断航迹聚类簇的个数是否大于3;若是,则返回步骤S5,重新对Hausdorff距离矩阵中新生成的航迹核心对象对应的一行数值进行加权后,进行下一次合并;若否,则执行步骤S9;

S9:将每一个航迹聚类簇进行扩充,扩充的内容为该航迹聚类簇中航迹核心对象在航迹序列间双向Hausdorff距离阈值内的其他航迹,形成该航迹聚类簇对应的航迹模式,将各个航迹聚类簇对应的航迹模式进行可视化展示;

其中,步骤S1中,第 个航迹序列为 ,代表航迹序列 包含

个航迹向量, ,表示航迹序列的数量;其中航迹向量

,其中, 表示航迹向量 的实时经

度, 表示航迹向量 的实时纬度, 表示航迹向量 的实时高度, 表示航迹向量 的实时飞行速度, 表示航迹向量 的实时航向角, 表示航迹向量 的实时时间点;

步骤S2中,对航迹序列 进行去除异常值,具体包括:

提取每个航迹向量的实时飞行速度,若 节/小时或 节/小时,则将飞行速度 对应的航迹向量 去除;

提取每个航迹向量的实时航向角,若 且 ,则

将航向角 对应的航迹向量 去除;其中, 表示航迹向量 的实时航向角,表示航迹向量 的实时航向角, , ;

提取每个航迹向量的实时经度、实时纬度和实时高度,若

,则将经度 、

纬度 和高度 对应的航迹向量 去除;其中, 表示航迹向量 的实时经度,表示航迹向量 的实时纬度, 表示航迹向量 的实时高度, 表示航迹向量 的实时经度, 表示航迹向量 的实时纬度, 表示航迹向量 的实时高度;

步骤S2中,对航迹序列 进行去重,具体包括:

遍历航迹序列 的所有航迹向量,若存在 ,则将重复

的航迹向量 去除;

步骤S2中,对航迹序列 进行分段,具体包括:

获取航迹序列 的所有经度和纬度,组成多个经纬度点,引接空域情报区划分数据,按照各经纬度点所属的情报区进行标号;

步骤S2中,对航迹序列 进行重采样,具体包括:

针对航迹序列 在同一个情报区内的数据段,计算航班航迹点数 ,选取重采样点数为100,以航班航迹点数对重采样点数做整数除法得出重采样步长,余数的一半作为航迹序列 在该情报区内的数据段首尾需去除的点数,按照重采样步长对航迹序列 在该情报区内的数据段进行重采样,重采样计算公式如下:其中, 表示重采样后的航迹序列, 表示航迹 的第 个航迹序列,表示重采样的起始位置,表示整数除法后确定的重采样步长,以1的步长从0取到99,表示重采样所需的100个点;

步骤S3,计算预处理后的每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象,具体包括:利用如下公式计算航迹序列 与航迹序列 之间未加权过的双向Hausdorff距离:其中, 表示航迹序列 到航迹序列 的单向Hausdorff距离, 表示航迹向量 的空间位置 与航迹向量 的空间位置 的空

间欧式距离, 表示航迹序列 到航迹序列 的单向Hausdorff距离,表示航迹向量 空间位置 与航迹向量 的空间位置 的空

间欧式距离;

设置参数 作为航迹序列间双向Hausdorff距离 的阈值,设置参数作为生成航迹核心对象所需包含的最少“邻居”航迹序列数;选取一个航迹序列 ,计算与其他所有航迹序列间的双向Hausdorff距离 ;若对于某一个 ,使,则进行一次计数;当遍历完所有的航迹序列后,若计数的值大于或等于,则将航迹序列 定义为航迹核心对象;遍历所有航迹序列后,得到在参数 和下的航迹核心对象集合;

步骤S4,计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵,具体包括:假设共生成 个航迹核心对象,则Hausdorff距离矩阵为:其中, 表示航迹核心对象 与航迹核心对象 间未加权过的双向Hausdorff距离,满足:

步骤S5,根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权,具体包括:S53:判断某一个航迹核心对象 是否与其他所有航迹核心对象中超过第一阈值 的航迹核心对象间的双向Hausdorff距离小于 , ;若是,则执行步骤S54;若否,则执行步骤S55;其中, 表示航迹核心对象 与其他航迹核心对象间的最远双向Hausdorff距离;

S54:将航迹核心对象 在Hausdorff距离矩阵的对应行的所有值均乘以加权系数, ,同时记录 ;其中, 表示航迹核心对象 的加权系数;

S55:判断航迹核心对象 是否与其他所有的航迹核心对象中超过第二阈值的航迹核心对象间的双向Hausdorff距离大于 , ;若是,则执行步骤S56;若否,则执行步骤S57;

S56:将航迹核心对象 在Hausdorff距离矩阵的对应行的所有值均乘以加权系数, ,同时记录 ;

S57:记录 ;

S58:遍历Hausdorff距离矩阵的所有行后,对得到的Hausdorff距离矩阵根据主对角线进行翻转,得到加权后的Hausdorff距离矩阵 以及各个航迹核心对象的加权情况;

步骤S6,采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵,具体包括:在加权后的Hausdorff距离矩阵 的主对角线的右侧选取 中的最小值:其中, 表示航迹核心对象 和航迹核心对象 间加权后的双向Hausdorff距离;将航迹核心对象 和 合并,生成一个新的航迹核心对象 ,将加权后的Hausdorff距离矩阵 中与 和 相关的两行与两列剔除,将新生成的航迹核心对象 置于加权后的Hausdorff距离矩阵 中的第 行第 列,同时第行后的航迹核心对象上移一位,第 列后的航迹核心对象左移一位,补充原 中被剔除的第行与第列;

计算第行的双向Hausdorff距离:

计算第列的双向Hausdorff距离:

其中, 表示航迹核心对象 与航迹核心对象 间未加权过的双向Hausdorff距离, ; 表示航迹核心对象 与航迹核心对象 间未加权过的双向Hausdorff距离, ; 表示航迹核心对象 与航迹核心对象 间未加权过的双向Hausdorff距离; 表示航迹核心对象 与航迹核心对象 间未加权过的双向Hausdorff距离; 表示本次合并之前的矩阵 中第 行对应的加权系数; 表示本次合并之前的矩阵 中第 行对应的加权系数;

按照如下公式更新Hausdorff距离矩阵主对角线右上方的值:其中, , 表示Hausdorff距离矩阵的第 列, 表示Hausdorff距离矩阵的第列对应的航迹核心对象;以主对角线为对称轴,将主对角线右上方的值赋给主对角线左下方对应的值;

若需要合并的两个航迹核心对象 和 ,航迹核心对象

包含 个原始的航迹核心对象, ,航迹核心对象 含 个原

始的航迹核心对象, ,则更新后的航迹核心对象 与航迹核心对象之间加权后的双向Hausdorff距离为:

其中, 表示航迹核心对象 与航迹核心对象 间未

加权过的双向Hausdorff距离; 表示本次合并之前的矩阵 中, 与 的最小值对应的行的加权系数。

2.如权利要求1所述的基于自适应层次聚类的航迹模式挖掘方法,其特征在于,步骤S7中,利用如下公式计算航迹聚类簇 的类内距离平均值:利用如下公式计算航迹聚类簇 与其他所有航迹聚类簇 的类间距离平均值:

3.一种应用如权利要求1所述的基于自适应层次聚类的航迹模式挖掘方法的装置,其特征在于,包括:信息获取模块、航迹预处理模块、航迹核心对象生成模块、距离矩阵生成模块、自适应权重调整模块、层次聚类模块以及航迹模式可视化模块;其中,所述信息获取模块,用于针对空域中的某一城市对,获取在某一时间段内的所有民航航班运行信息,从中提取航班的实时经度、实时纬度、实时高度、实时飞行速度、实时航向角以及实时时间点六种信息,形成多个航迹序列;

所述航迹预处理模块,用于对形成的各航迹序列进行预处理,包括去除异常值、去重、分段和重采样;

所述航迹核心对象生成模块,用于将预处理后的各航迹序列作为输入数据,计算每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象;

所述距离矩阵生成模块,用于将选取的各航迹核心对象作为的输入数据,计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵;

所述自适应权重调整模块,用于根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权;

所述层次聚类模块,用于采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵;其中,更新后的Hausdorff距离矩阵中每一行对应的航迹核心对象为一个航迹聚类簇;计算各个航迹聚类簇的类内距离平均值和类间距离平均值,判断类内距离平均值与类间距离平均值的比值是否小于阈值;在类内距离平均值与类间距离平均值的比值大于或等于阈值时,判断航迹聚类簇的个数是否大于3;在航迹聚类簇的个数大于3时,重新对Hausdorff距离矩阵中新生成的航迹核心对象对应的一行数值进行加权后,进行下一次合并;

所述航迹模式可视化模块,用于在类内距离平均值与类间距离平均值的比值小于阈值时,或者,在类内距离平均值与类间距离平均值的比值大于或等于阈值且航迹聚类簇的个数小于或等于3时,将每一个航迹聚类簇进行扩充,扩充的内容为该航迹聚类簇中航迹核心对象在航迹序列间双向Hausdorff距离阈值内的其他航迹,形成该航迹聚类簇对应的航迹模式,将各个航迹聚类簇对应的航迹模式进行可视化展示。

说明书 :

一种航迹模式挖掘方法与装置

技术领域

[0001] 本发明涉及航空航天技术领域,尤其涉及一种航迹模式挖掘方法与装置。

背景技术

[0002] 在空域运行环境越来越复杂、民航航班运行体量越来越大、航班飞行方式难以分辨的场景下,实现航班航迹运动模式的精准挖掘是空中交通管理中的研究重点。一方面,有效挖掘航迹模式,可以得出航班的大致运行规律,为空管部门检测存在飞行行为异常的航班以及预测航班未来航迹做出参考,提升空域运行的安全性;另一方面,精准挖掘航迹模式,可以得出各扇区的运行状况,为空管部门调控空域流量、管理扇区开合提供数据支撑,提升空域运行的有效性。因此,一套行之有效且计算成本可控的航迹模式挖掘方法对于空管安全和效率来说至关重要。
[0003] 现有的航迹模式挖掘方法较为多样,包括基于聚类、分布、距离、偏差等等,这些方法通过构建不同的计算模型对航迹运动模式进行挖掘。由于航班运行体量大,运动模式相互交织的情况比较严重,现有的分类或聚类算法难以对不同规模,尤其是规模较小的航迹模式进行有效区分,航迹模式挖掘的困难,会直接导致空管部门难以及时对空域中航班整体运行状况有总体的认识与了解,针对存在异常飞行情况的航班不能及时发出告警,空域扇区的有效调度也面临着挑战。因此,针对不同规模航迹模式的精准挖掘方法是十分必要的。

发明内容

[0004] 有鉴于此,本发明提供了一种航迹模式挖掘方法与装置,用以在空域中从较为杂乱的航班运动里挖掘出不同规模的航迹运动模式并进行展示。
[0005] 因此,本发明提供了一种基于自适应层次聚类的航迹模式挖掘方法,包括如下步骤:
[0006] S1:针对空域中的某一城市对,获取在某一时间段内的所有民航航班运行信息,从中提取航班的实时经度、实时纬度、实时高度、实时飞行速度、实时航向角以及实时时间点六种信息,形成多个航迹序列;
[0007] S2:对形成的各航迹序列进行预处理,包括去除异常值、去重、分段和重采样;
[0008] S3:计算预处理后的每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象;
[0009] S4:计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵;
[0010] S5:根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权;
[0011] S6:采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵;其中,更新后的Hausdorff距离矩阵中每一行对应的航迹核心对象为一个航迹聚类簇;
[0012] S7:计算各个航迹聚类簇的类内距离平均值和类间距离平均值,判断类内距离平均值与类间距离平均值的比值是否小于阈值;若否,则执行步骤S8;若是,则执行步骤S9;
[0013] S8:判断航迹聚类簇的个数是否大于3;若是,则返回步骤S5,重新对Hausdorff距离矩阵中新生成的航迹核心对象对应的一行数值进行加权后,进行下一次合并;若否,则执行步骤S9;
[0014] S9:将每一个航迹聚类簇进行扩充,扩充的内容为该航迹聚类簇中航迹核心对象在航迹序列间双向Hausdorff距离阈值内的其他航迹,形成该航迹聚类簇对应的航迹模式,将各个航迹聚类簇对应的航迹模式进行可视化展示。
[0015] 在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S1中,第 个航迹序列为 ,代表航迹序列 包含个航迹向量, , 表示航迹序列的数量;其中航迹向量
,其中, 表示航迹向量 的实时经
度, 表示航迹向量 的实时纬度, 表示航迹向量 的实时高度, 表示航迹向量的实时飞行速度, 表示航迹向量 的实时航向角, 表示航迹向量 的实时时间点。
[0016] 在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S2中,对航迹序列 进行去除异常值,具体包括:
[0017] 提 取 每 个 航 迹 向 量 的 实 时 飞 行 速 度 ,若 或,则将飞行速度 对应的航迹向量 去除;
[0018] 提取每个航迹向量的实时航向角,若 且 ,则将航向角 对应的航迹向量 去除;其中, 表示航迹向量 的实时航向角,表示航迹向量 的实时航向角, , ;
[0019] 提取每个航迹向量的实时经度、实时纬度和实时高度,若
[0020]
[0021] ,则将经度 、纬度 和高度 对应的航迹向量 去除;其中, 表示航迹向量 的实时经度, 表示航迹向量 的实时纬度, 表示航迹向量 的实时高度, 表示航迹向量 的实时经度, 表示航迹向量 的实时纬度, 表示航迹向量 的实时高度;
[0022] 步骤S2中,对航迹序列 进行去重,具体包括:
[0023] 遍历航迹序列 的所有航迹向变量,若存在 ,则将重复的航迹向量 去除;
[0024] 步骤S2中,对航迹序列 进行分段,具体包括:
[0025] 获取航迹序列 的所有经度和纬度,组成多个经纬度点,引接我国的空域情报区划分数据,按照各经纬度点所属的情报区进行标号;
[0026] 步骤S2中,对航迹序列 进行重采样,具体包括:
[0027] 针对航迹序列 在同一个情报区内的数据段,计算航班航迹点数 ,选取重采样点数为100,以航班航迹点数对重采样点数做整数除法得出重采样步长,余数的一半作为航迹序列 在该情报区内的数据段首尾需去除的点数,按照重采样步长对航迹序列 在该情报区内的数据段进行重采样,重采样计算公式如下:
[0028]
[0029] 其中, 表示重采样后的航迹序列,  表示航迹 的第 个航迹序列, 表示重采样的起始位置,表示整数除法后确定的重采样步长,以1的步长从0取到99,表示重采样所需的100个点。
[0030] 在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S3,计算预处理后的每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象,具体包括:
[0031] 利用如下公式计算航迹序列 与航迹序列 之间未加权过的双向Hausdorff距离:
[0032]
[0033]
[0034]
[0035] 其中, 表示航迹序列  到航迹序列  的单向Hausdorff距离,表示航迹向量 的空间位置 与航迹向量 的空间位置
的空间欧式距离, 表示航迹序列  到航迹序列  的单向
Hausdorff距离, 表示航迹向量 的空间位置 与航迹向量 的
空间位置 的空间欧式距离;
[0036] 设置参数 作为航迹序列间双向Hausdorff距离 的阈值,设置参数作为生成航迹核心对象所需包含的最少“邻居”航迹序列数;选取一个航迹序列,计算 与其他所有航迹序列间的双向Hausdorff距离 ;若对于某一个 ,使 ,则进行一次计数;当遍历完所有的航迹序列后,若计数的值大于或等于,则将航迹序列 定义为航迹核心对象;遍历所有航迹序列后,得到在参数 和下的航迹核心对象集合。
[0037] 在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S4,计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵,具体包括:
[0038] 假设共生成 个航迹核心对象,则Hausdorff距离矩阵为:
[0039]
[0040] 其中, 表示航迹核心对象 与航迹核心对象 间未加权过的双向Hausdorff距离,满足:
[0041]
[0042] 。
[0043] 在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S5,根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权,具体包括:
[0044] S53:判断某一个航迹核心对象  是否与其他所有航迹核心对象中超过第一阈值的航迹核心对象间的双向Hausdorff距离小于 , ;若是,则执行步骤S54;若否,则执行步骤S55;其中,表示航迹核心对象 与其他航迹核心对象间的最远双向Hausdorff距离;
[0045] S54:将航迹核心对象 在Hausdorff距离矩阵的对应行的所有值均乘以加权系数, ,同时记录  ;其中, 表示航迹核心对象 的加权系数;
[0046] S55:判断航迹核心对象 与其他所有的航迹核心对象中超过第二阈值 的航迹核心对象间的双向Hausdorff距离大于 , ;若是,则执行步骤S56;若否,则执行步骤S57;
[0047] S56:将航迹核心对象 在Hausdorff距离矩阵的对应行的所有值均乘以加权系数, ,同时记录 ;
[0048] S57:记录 ;
[0049] S58:遍历Hausdorff距离矩阵的所有行后,对得到的Hausdorff距离矩阵根据主对角线进行翻转,得到加权后的Hausdorff距离矩阵 以及各个航迹核心对象的加权情况[0050] 在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S6,采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵,具体包括:
[0051] 在加权后的Hausdorff距离矩阵 的主对角线的右侧选取 中的最小值:
[0052]
[0053] 其中, 表示航迹核心对象 和航迹核心对象 间加权后的双向Hausdorff距离;将航迹核心对象 和 合并,生成一个新的航迹核心对象 ,将加权后的Hausdorff距离矩阵 中与 和 相关的两行与两列剔除,将新生成的航迹核心对象置于加权后的Hausdorff距离矩阵 中的第 行第 列,同时第j行后的航迹核心对象上移一位,第j列后的航迹核心对象左移一位,补充原 中被剔除的第j行与第j列;
[0054] 计算第 行的双向Hausdorff距离:
[0055]
[0056] 计算第 列的双向Hausdorff距离:
[0057]
[0058] 其中, 表示航迹核心对象 与航迹核心对象 间未加权过的双向Hausdorff距离, ; 表示航迹核心对象 与航迹核心
对象 间未加权过的双向Hausdorff距离, ; 表示
航迹核心对象 与航迹核心对象 间未加权过的Hausdorff距离; 表示
航迹核心对象 与航迹核心对象 间未加权过的双向Hausdorff距离; 表示本次合并之前的矩阵 中第w行对应的加权系数; 表示本次合并之前的矩阵 中第j行对应的加权系数;
[0059] 按照如下公式更新Hausdorff距离矩阵主对角线右上方的值:
[0060]
[0061] 其中, ,表示Hausdorff距离矩阵的第 列, 表示Hausdorff距离矩阵的第 列对应的航迹核心对象;以主对角线为对称轴,将主对角线右上方的值赋给主对角线左下方对应的值;
[0062] 若需要合并的两个航迹核心对象 和 ,航迹核心对象包含 个原始的航迹核心对象, 航迹核心对象 含 个原始
的航迹核心对象, 则更新后的航迹核心对象 与航迹核心对象
之间加权后的双向Hausdorff距离为:
[0063]
[0064] 其中, 表示航迹核心对象 与航迹核心对象间未加权过的双向Hausdorff距离; 表示本次合并之前的矩阵 中, 与 的最小值对应的行的加权系数。
[0065] 在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S7中,利用如下公式计算航迹聚类簇 的类内距离平均值:
[0066]
[0067] 利用如下公式计算航迹聚类簇 与其他所有航迹聚类簇 的类间距离平均值:
[0068] 。
[0069] 本发明还提供了一种基于自适应层次聚类的航迹模式挖掘装置,包括:信息获取模块、航迹预处理模块、航迹核心对象生成模块、距离矩阵生成模块、自适应权重调整模块、层次聚类模块以及航迹模式可视化模块;其中,
[0070] 所述信息获取模块,用于针对空域中的某一城市对,获取在某一时间段内的所有民航航班运行信息,从中提取航班的实时经度、实时纬度、实时高度、实时飞行速度、实时航向角以及实时时间点六种信息,形成多个航迹序列;
[0071] 所述航迹预处理模块,用于对形成的各航迹序列进行预处理,包括去除异常值、去重、分段和重采样;
[0072] 所述航迹核心对象生成模块,用于将预处理后的各航迹序列作为输入数据,计算每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象;
[0073] 所述距离矩阵生成模块,用于将选取的各航迹核心对象作为的输入数据,计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵;
[0074] 所述自适应权重调整模块,用于根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权;
[0075] 所述层次聚类模块,用于采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵;其中,更新后的Hausdorff距离矩阵中每一行对应的航迹核心对象为一个航迹聚类簇;计算各个航迹聚类簇的类内距离平均值和类间距离平均值,判断类内距离平均值与类间距离平均值的比值是否小于阈值;在类内距离平均值与类间距离平均值的比值大于或等于阈值时,判断航迹聚类簇的个数是否大于3;在航迹聚类簇的个数大于3时,重新对Hausdorff距离矩阵中新生成的航迹核心对象对应的一行数值进行加权后,进行下一次合并;
[0076] 所述航迹模式可视化模块,用于在类内距离平均值与类间距离平均值的比值小于阈值时,或者,在类内距离平均值与类间距离平均值的比值大于或等于阈值且航迹聚类簇的个数小于或等于3时,将每一个航迹聚类簇进行扩充,扩充的内容为该航迹聚类簇中航迹核心对象在航迹序列间双向Hausdorff距离阈值内的其他航迹,形成该航迹聚类簇对应的航迹模式,将各个航迹聚类簇对应的航迹模式进行可视化展示。
[0077] 本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法及装置,通过信息获取模块得到民航航班的飞行轨迹数据,进行预处理后,基于数据密度分布对数据进行核心对象提取,使用基于航迹数据相关性的自适应层次聚类算法对航班的航迹运动模式进行挖掘并可视化。由于自适应层次聚类算法的使用需要获取航班的飞行轨迹数据,因此,飞行轨迹数据包括航班三维坐标位置、飞行速度、航向角度以及时间点。具体地,首先通过信息获取模块对航班航迹信息进行提取,并接入航迹预处理模块进行数据预处理得到规整的航迹序列,然后通过航迹核心对象生成模块根据航迹密度分布生成核心对象并滤除噪声,对核心对象通过自适应权重调整模块进行加权,再通过层次聚类模块进行模式挖掘,最终通过航迹模式可视化模块对挖掘出的航迹模式进行展示。本发明针对空中交通运行高密度、高复杂度的状况,实现了在多航班运行环境下的航迹模式挖掘,为航迹模式挖掘问题的解决提出了一个全新的方案;本发明围绕着海量航班运行背景下的航迹模式精准快速挖掘,从提升空中交通系统安全性和高效性两方面出发,开展航迹模式挖掘方法研究,对于确保航班飞行安全、合理调配空域容量、检测异常飞行状况、预测航班未来飞行行为以及提高空中交通系统的运行效率具有重要的意义;本发明针对现有技术在挖掘航迹模式时不同规模的航迹容易相互交织的难点问题,提出通过自适应加权的方式辅助合并操作的进行,通过加权有效控制合并的顺序,使应属于大规模航迹模式的航迹先于应属于小规模航迹模式的航迹,从而可以显著减少大模式吞并小模式的发生;本发明能够处理空域内各城市对间规模不一、相互交织的航迹模式挖掘问题,航迹模式识别精度高,对参数的依赖小,可以有效解决复杂环境下的航迹模式挖掘问题。

附图说明

[0078] 图1为本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法的流程示意图;
[0079] 图2为本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法中航迹向量示意图;
[0080] 图3为本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法中可能出现的航迹异常值示意图;
[0081] 图4为本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法中航迹重采样示意图;
[0082] 图5为本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法中航迹核心对象的选取示意图;
[0083] 图6为本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法中航迹核心对象的合并示意图。

具体实施方式

[0084] 下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整的描述,显然,所描述的实施方式仅仅是作为例示,并非用于限制本发明。
[0085] 本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法,如图1所示,包括如下步骤:
[0086] S1:针对空域中的某一城市对,获取在某一时间段内的所有民航航班运行信息,从中提取航班的实时经度、实时纬度、实时高度、实时飞行速度、实时航向角以及实时时间点六种信息,形成多个航迹序列;
[0087] 具体地,每个航迹序列为六维向量序列,包含上述六种信息;
[0088] S2:对形成的各航迹序列进行预处理,包括去除异常值、去重、分段和重采样;
[0089] 具体地经过上述四个步骤的预处理后,每个航迹序列平滑连接,各航迹序列长度统一,即各航迹序列包含的航迹向量数相同;
[0090] S3:计算预处理后的每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象;
[0091] S4:计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵;
[0092] S5:根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权;
[0093] S6:采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵;其中,更新后的Hausdorff距离矩阵中每一行对应的航迹核心对象为一个航迹聚类簇;
[0094] S7:计算各个航迹聚类簇的类内距离平均值和类间距离平均值,判断类内距离平均值与类间距离平均值的比值是否小于阈值;若否,则执行步骤S8;若是,则执行步骤S9;
[0095] 具体地,步骤S7是判断层次聚类的效果是否满足航迹数据的航迹模式识别需求;如果类内距离平均值与类间距离平均值的比值小于阈值,则认为层次聚类的效果较为理想,此时可执行步骤S9;如果类内距离平均值与类间距离平均值的比值大于或等于阈值,则认为层次聚类的效果不理想,此时需要执行步骤S8进一步判断;
[0096] S8:判断航迹聚类簇的个数是否大于3;若是,则返回步骤S5,重新对Hausdorff距离矩阵中新生成的航迹核心对象对应的一行数值进行加权后,进行下一次合并;若否,则执行步骤S9;
[0097] 具体地,如果层次聚类的效果不理想,且航迹聚类簇的个数大于3,则需要返回步骤S5,继续进行下一层的层次聚类;如果层次聚类的效果不理想,且航迹聚类簇的个数小于或等于3,则可以执行步骤S9,针对此时的聚类结果进行可视化展示;
[0098] S9:将每一个航迹聚类簇进行扩充,扩充的内容为该航迹聚类簇中航迹核心对象在航迹序列间双向Hausdorff距离阈值内的其他航迹,形成该航迹聚类簇对应的航迹模式,将各个航迹聚类簇对应的航迹模式进行可视化展示。
[0099] 本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法,在空域中,在各城市对之间运行的每架航班将自己的飞行轨迹进行上传汇总,通过去除异常值、去重、分段以及重采样整理成为规整的四维航迹序列,运用Hausdorff距离计算方法得出每两条航迹间的空间距离,随后运用基于密度的核心对象生成算法,从航迹中抽取高密度的航迹核心对象,再通过航迹核心对象间的空间距离构建航迹距离矩阵,将航迹距离矩阵输入至自适应权重调整模块,根据航迹核心对象间距的分布确定相应的权重值,对航迹距离矩阵进行加权,随后针对加权后的航迹距离矩阵,采用层次聚类算法对航迹核心对象进行聚类。如果层次聚类的效果满足航迹数据的航迹模式识别需求,即类内距离与类间距离的比值小于一定阈值,则将聚类结束的航迹簇转换为航迹运动模式进行可视化;如果聚类的结果不满足阈值要求,则根据当前的航迹簇分布调整权重,继续进行下一层的层次聚类;如果层次聚类在聚类簇数不足时依然不能满足阈值要求,则针对现有的航迹簇结果进行展示。本发明的最终目标是在空域中从较为杂乱的航班运动里挖掘出不同规模的航迹运动模式并进行展示。
[0100] 在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S1中,针对某一时间段的某一城市对,例如2019年全年由北京至上海,接入该时间段内的航班运行时刻表,如果一架飞机在该时间段内执行了该城市对的航班,则收集该航班的ADS-B数据,并整理成为该航班的航迹序列 ,第 个航迹序列,代表航迹序列 包含 个航迹向量, , 表示航迹序列的数量;其中航迹向量,其中, 表示航迹向量 的实时经
度, 表示航迹向量 的实时纬度, 表示航迹向量 的实时高度, 表示航迹向量的实时飞行速度, 表示航迹向量 的实时航向角, 表示航迹向量 的实时时间点,如图2所示。
[0101] 在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,针对步骤S1中的航迹序列 ,由于ADS-B基站设置、数据采样时间、飞机飞行动态等因素的影响,每一个航迹序列中可能会包含少量的错误及重复数据,所包含的航迹向量的数量往往也是不同的,并且,航班在飞过情报区的边界时,需更换联络的区调,航班的飞行方式也会出现一系列的改变。针对以上的问题,在步骤S2中,对形成的各航迹序列进行预处理,包括去除异常值、去重、分段和重采样;其中,
[0102] 对航迹序列 进行去除异常值,具体可以通过以下方式来实现:常见的航迹异常值如图3所示,在由起飞机场A到降落机场B的途中,圆圈内的航迹发生偏离,为航迹异常值;首先,提取每个航迹向量的实时飞行速度,若 或
,说明航班的运行速度数据项存在异常,则将飞行速度 对应的航迹向量 去除;然后,提取每个航迹向量的实时航向角,若 且 ,说明飞机
的航向角采集出现问题,则将航向角 对应的航迹向量 去除;其中, 表示航迹向量的实时航向角, 表示航迹向量 的实时航向角, , ;最
后,提取每个航迹向量的实时经度、实时纬度和实时高度,若
[0103] ,
[0104] 说明在 处,航班的位置点发生了跳变,则将经度 、纬度 和高度 对应的航迹向量 去除;其中, 表示航迹向量 的实时经度, 表示航迹向量 的实时纬度, 表示航迹向量 的实时高度, 表示航迹向量 的实时经度, 表示航迹向量 的实时纬度, 表示航迹向量 的实时高度;
[0105] 对航迹序列 进行去重,具体可以通过以下方式来实现:遍历航迹序列 的所有航迹向变量,若存在 ,则将重复的航迹向量 去除;
[0106] 对航迹序列 进行分段,具体可以通过以下方式来实现:首先,获取航迹序列的所有经度和纬度,组成多个经纬度点,然后,引接我国的空域情报区划分数据,按照各经纬度点所属的情报区进行标号;
[0107] 对航迹序列 进行重采样,具体可以通过以下方式来实现:如图4所示,航迹 的点数为8,对由起飞机场A到降落机场B的航迹 进行重采样,重采样点为C,采样后的航迹序列为 。针对航迹序列 在同一个情报区内的数据段,选取重采样点数为100,以航班航迹点数对重采样点数做整数除法得出重采样步长,余数的一半作为航迹序列 在该情报区内的数据段首尾需去除的点数,按照重采样步长对航迹序列 在该情报区内的数据段进行重采样,重采样计算公式如下:
[0108]
[0109] 其中, 表示重采样后的航迹序列, 表示航迹 的第 个航迹序列, 表示重采样的起始位置,表示整数除法后确定的重采样步长,以1的步长从0取到
99,表示重采样所需的100个点。
[0110] 在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S3,计算预处理后的每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象,具体可以通过以下方式来实现:
[0111] 利用如下公式计算预处理后的航迹序列 与预处理后的航迹序列 之间未加权过的双向Hausdorff距离 :
[0112]
[0113]
[0114]
[0115] 其中, 表示航迹序列  到航迹序列  的单向Hausdorff距离,表示航迹向量 的空间位置 与航迹向量 的空间位置
的空间欧式距离, 表示航迹序列  到航迹序列  的单向
Hausdorff距离, 表示航迹向量 的空间位置 与航迹向量 的
空间位置 的空间欧式距离;
[0116] 在核心对象生成算法开始前,需设置参数 作为航迹序列间双向Hausdorff距离的阈值,设置参数 作为生成航迹核心对象所需包含的最少“邻居”航迹序列数;生成航迹核心对象的方法如下:选取一个航迹序列 ,计算 与其他所有航迹序列间的双向Hausdorff距离 ;若对于某一个 ,使 ,则进行一次计数;当遍历完所有的航迹序列后,若计数的值大于或等于 ,则将航迹序列 定义为航迹核心对象;遍历所有航迹序列后,得到在参数 和 下的航迹核心对象集合,航迹核心对象的选取如图5所示,在由起飞机场A到降落机场B的途中,椭圆圈出的航迹为核心对象。
[0117] 在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S4,计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵,具体可以通过以下方式来实现:
[0118] 假设共生成 个航迹核心对象,则Hausdorff距离矩阵为:
[0119]
[0120] 其中, 表示航迹核心对象 与航迹核心对象 间未加权过的双向Hausdorff距离,满足:
[0121]
[0122]
[0123] 在生成Hausdorff距离矩阵 后,此时的聚类簇数 。
[0124] 在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,针对生成的Hausdorff距离矩阵 ,可以得知每一行,也就是每一个航迹核心对象与其他所有核心对象的距离分布;由于在空域中,航迹模式交织情况较为严重,若直接对航迹核心对象进行合并层次聚类,则极有可能在规模较大的聚类还未完全形成时,规模较小的模式就已经与其他的模式合并,这样会导致航迹模式挖掘的准确性下降,因此,针对这一问题,在步骤S5中,根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权,具体地,步骤S5可以包括如下步骤:
[0125] S53:判断某一个航迹核心对象  是否与其他所有航迹核心对象中超过第一阈值的航迹核心对象间的双向Hausdorff距离小于 , ;若是,说明航迹核心对象 处于一个大规模航迹模式中,则执行步骤S54;若否,则执行步骤S55;其中,表示航迹核心对象 与其他航迹核心对象间的最远双向Hausdorff距离;
[0126] S54:将航迹核心对象在Hausdorff距离矩阵的对应行的所有值均乘以加权系数, ,同时记录 ;其中, 表示航迹核心对象 的加权系数;
[0127] S55:判断航迹核心对象 与其他所有的航迹核心对象中超过第二阈值 的航迹核心对象间的双向Hausdorff距离大于 , ;若是,说明航迹核心对象 处于一个小规模航迹模式中,则执行步骤S56;若否,则执行步骤S57;
[0128] S56:将航迹核心对象 在Hausdorff距离矩阵的对应行的所有值均乘以加权系数, ,同时记录 ;
[0129] S57:记录 ;
[0130] S58:遍历Hausdorff距离矩阵的所有行后,对得到的Hausdorff距离矩阵根据主对角线进行翻转,即,将Hausdorff距离矩阵右上部分的值赋给其主对角线上对称的左下部分位置,得到加权后的Hausdorff距离矩阵 以及各个航迹核心对象的加权情况[0131] 在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S6,采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,合并的效果如图6所示,在由起飞机场A到降落机场B的途中,椭圆圈出的两条航迹进行合并,生成一个新的航迹核心对象。通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵,具体可以通过以下方式来实现:
[0132] 由于加权得到的Hausdorff距离矩阵H是针对其主对角线对称的,因此,在加权后的Hausdorff距离矩阵 的主对角线的右侧选取 中的最小值:
[0133]
[0134] 其中, 表示航迹核心对象 和航迹核心对象 间加权后的双向Hausdorff距离;将航迹核心对象 和 合并,生成一个新的航迹核心对象 ,同时将加权后的Hausdorff距离矩阵 关于主对角线的右上侧部分进行更新,更新方法为将加权后的Hausdorff距离矩阵 中与 和 相关的两行与两列剔除,将新生成的航迹核心对象置于加权后的Hausdorff距离矩阵 中的第 行第 列,同时第j行后的航迹核心对象上移一位,第j列后的航迹核心对象左移一位,补充原 中被剔除的第j行与第j列;其中,[0135] 第 行的双向Hausdorff距离的计算方法为:
[0136]
[0137] 第 列的双向Hausdorff距离的计算方法为:
[0138]
[0139] 其中, 表示航迹核心对象 与航迹核心对象 间未加权过的双向Hausdorff距离, ; 表示航迹核心对象 与航迹核心
对象 间未加权过的双向Hausdorff距离, ; 表示
航迹核心对象 与航迹核心对象 间未加权过的双向Hausdorff距离;
表示航迹核心对象 与航迹核心对象 间未加权过的双向Hausdorff距离; 表示本次合并之前的矩阵 中第w行对应的加权系数; 表示本次合并之前的矩阵 中第j行对应的加权系数;
[0140] 在新生成的这一行和一列生成后,将其置于矩阵H的第 行与第 列,新产生的航迹核心对象在后续的合并操作中可以被再次加权。在更新完第 行和第 列后,在这一行和这一列之后的各行、列元素依次排列在矩阵H中,即第j行和第j列之后的值向上或左位移一位,按照如下公式更新Hausdorff距离矩阵主对角线右上方的值:
[0141]
[0142] 其中, ,表示Hausdorff距离矩阵的第 列, 表示Hausdorff距离矩阵的第 列对应的航迹核心对象;以主对角线为对称轴,将主对角线右上方的值赋给主对角线左下方对应的值,以保证矩阵H对称于主对角线;
[0143] 若在聚类后期,需要合并的两个航迹核心对象 和 ,航迹核心对象 包含 个原始的航迹核心对象, 航迹核心对象
含 个原始的航迹核心对象, 则更新后的航迹核心对象 与航迹核心对
象 之间加权后的双向Hausdorff距离为:
[0144]
[0145] 其中, 表示航迹核心对象 与航迹核心对象间未加权过的双向Hausdorff距离; 表示本次合并之前的矩阵 中, 与 的最小值对应的行的加权系数。在一步合并后,聚类簇的个数 。
[0146] 在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S7中,利用如下公式计算航迹聚类簇 的类内距离平均值,即类内的未加权的原始航迹核心对象两两距离的平均值:
[0147]
[0148] 利用如下公式计算航迹聚类簇 与其他所有航迹聚类簇 的类间距离平均值,即经过合并后生成的Harsdorff距离矩阵中与该类对应的一行的平均值:
[0149]
[0150] 如果针对每一类航迹簇,类内距离平均值都小于类间距离平均值的比例阈值 ,即,则认为层次聚类的效果已经较为理想,此时可以执行步骤S9;如果两种距离的关系不满足要求,且航迹聚类簇的个数 ,则返回步骤S5,针对现有的数据分布,对现有Hausdorff距离矩阵中进行了合并操作的对象进行再次加权,之后进行下一层合并层次聚类;如果两种距离的关系不满足要求,且航迹聚类簇的个数 ,则可以执行步骤S9,对现有的结果进行可视化展示。
[0151] 在复杂的空域环境下完成航迹模式的自适应挖掘后,可以使空管部门对于航班在空域中的运行方式有所了解,便于在航班出现不同于现有航迹模式时及时进行告警,在航班执行一定距离后预测后续的飞行轨迹,以及对空域流量、扇区开合做出优化调控,为空域安全性和高效性提供有力支撑,具有积极的意义。
[0152] 基于同一发明构思,本发明还提供了一种基于自适应层次聚类的航迹模式挖掘装置,包括:信息获取模块、航迹预处理模块、航迹核心对象生成模块、距离矩阵生成模块、自适应权重调整模块、层次聚类模块以及航迹模式可视化模块;其中,
[0153] 信息获取模块,用于针对空域中的某一城市对,获取在某一时间段内的所有民航航班运行信息,从中提取航班的实时经度、实时纬度、实时高度、实时飞行速度、实时航向角以及实时时间点六种信息,形成多个航迹序列;
[0154] 航迹预处理模块,用于对形成的各航迹序列进行预处理,包括去除异常值、去重、分段和重采样;
[0155] 航迹核心对象生成模块,用于将预处理后的各航迹序列作为输入数据,计算每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象;
[0156] 距离矩阵生成模块,用于将选取的各航迹核心对象作为的输入数据,计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵;
[0157] 自适应权重调整模块,用于根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权;
[0158] 层次聚类模块,用于采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵;其中,更新后的Hausdorff距离矩阵中每一行对应的航迹核心对象为一个航迹聚类簇;计算各个航迹聚类簇的类内距离平均值和类间距离平均值,判断类内距离平均值与类间距离平均值的比值是否小于阈值;在类内距离平均值与类间距离平均值的比值大于或等于阈值时,判断航迹聚类簇的个数是否大于3;在航迹聚类簇的个数大于3时,重新对Hausdorff距离矩阵中新生成的航迹核心对象对应的一行数值进行加权后,进行下一次合并;
[0159] 航迹模式可视化模块,用于在类内距离平均值与类间距离平均值的比值小于阈值时,或者,在类内距离平均值与类间距离平均值的比值大于或等于阈值且航迹聚类簇的个数小于或等于3时,将每一个航迹聚类簇进行扩充,扩充的内容为该航迹聚类簇中航迹核心对象在航迹序列间双向Hausdorff距离阈值内的其他航迹,形成该航迹聚类簇对应的航迹模式,将各个航迹聚类簇对应的航迹模式进行可视化展示。
[0160] 本发明提供的上述基于自适应层次聚类的航迹模式挖掘装置的具体实施与本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法的实施类似,在此不做赘述。
[0161] 本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法及装置,通过信息获取模块得到民航航班的飞行轨迹数据,进行预处理后,基于数据密度分布对数据进行核心对象提取,使用基于航迹数据相关性的自适应层次聚类算法对航班的航迹运动模式进行挖掘并可视化。由于自适应层次聚类算法的使用需要获取航班的飞行轨迹数据,因此,飞行轨迹数据包括航班三维坐标位置、飞行速度、航向角度以及时间点。具体地,首先通过信息获取模块对航班航迹信息进行提取,并接入航迹预处理模块进行数据预处理得到规整的航迹序列,然后通过航迹核心对象生成模块根据航迹密度分布生成核心对象并滤除噪声,对核心对象通过自适应权重调整模块进行加权,再通过层次聚类模块进行模式挖掘,最终通过航迹模式可视化模块对挖掘出的航迹模式进行展示。本发明针对空中交通运行高密度、高复杂度的状况,实现了在多航班运行环境下的航迹模式挖掘,为航迹模式挖掘问题的解决提出了一个全新的方案;本发明围绕着海量航班运行背景下的航迹模式精准快速挖掘,从提升空中交通系统安全性和高效性两方面出发,开展航迹模式挖掘方法研究,对于确保航班飞行安全、合理调配空域容量、检测异常飞行状况、预测航班未来飞行行为以及提高空中交通系统的运行效率具有重要的意义;本发明针对现有技术在挖掘航迹模式时不同规模的航迹容易相互交织的难点问题,提出通过自适应加权的方式辅助合并操作的进行,通过加权有效控制合并的顺序,使应属于大规模航迹模式的航迹先于应属于小规模航迹模式的航迹,从而可以显著减少大模式吞并小模式的发生;本发明能够处理空域内各城市对间规模不一、相互交织的航迹模式挖掘问题,航迹模式识别精度高,对参数的依赖小,可以有效解决复杂环境下的航迹模式挖掘问题。
[0162] 显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。