用于钢轨轮廓离群点检测及有效廓形识别的方法转让专利

申请号 : CN201810864497.X

文献号 : CN108931206B

文献日 : 2020-04-24

本发明公开了一种用于钢轨轮廓离群点检测及有效廓形识别的方法，针对铁路线上实际测试中离群点和廓形多样性引起的测量轮廓与标准轮廓误匹配而导致磨耗计算严重错误的问题，提出一种基于轮廓粗配准的离群点检测及有效廓形快速识别算法。该算法先对轮廓曲线进行分裂，消除了曲线中大部分的稀疏离群点；再对剩余轮廓段进行合并，将属于同一区域的合并为一段，然后进行区域凹凸性检验，根据连续凹凸和点数最大原则确定潜在轨头轨腰区，实现潜在区域与标准轮廓的粗配准；最后根据配准后两个轮廓间的轨腰相似度实现了有效廓形的识别。在此基础上将原始测量轮廓与标准轮廓重配准，根据轮廓间相对距离实现了离群点的有效去除。

1.一种用于钢轨轮廓离群点检测及有效廓形识别的方法，其特征在于，包括以下步骤：

1)在正常轮廓曲线上统计得到相邻点间距阈值T1后，首先对测量轮廓进行分裂，得到多个曲线碎片，然后根据正常轮廓数据点密集分布的特点，设定点数阈值T2，对曲线碎片一一进行检验，从而去除稀疏离群点；

2)设定段间距阈值T3，对相邻间隔不超过T3的属于同一区域的曲线碎片再次进行合并，然后对每个区域进行凹凸性检验，基于连续凹凸和点数最大原则提取轮廓潜在轨头轨腰区；

3)将所述潜在轨头轨腰区与标准轮廓进行粗配准，通过标准轨腰区与潜在轨腰区间的单向Hausdorff距离与设定阈值T4的比较，作为测量轮廓有效性的最终判别指标；

4)判别为有效轮廓后，将原始测量轮廓与标准轮廓重配准，然后，对原始测量轮廓每一点，依次寻找与标准轮廓对应点欧式距离最近点，并将距离值与设定阈值T5进行比较，若不超过阈值T5，则该点为正常点，否则即为离群点。

2.根据权利要求1所述的用于钢轨轮廓离群点检测及有效廓形识别的方法，其特征在于，步骤1)中，T1＝2，T2＝10。

3.根据权利要求1所述的用于钢轨轮廓离群点检测及有效廓形识别的方法，其特征在于，步骤2)中，T3设置为30。

4.根据权利要求1所述的用于钢轨轮廓离群点检测及有效廓形识别的方法，其特征在于，步骤3)中，T4的设置采用基于正态分布的3倍标准差准则：选取有效轮廓300幅，统计得到轮廓单向Hausdorff距离的平均值和标准差分别为2.6698mm和1.0878mm，通过计算得到T4＝μ+3σ＝5.9332mm；考虑到测量轮廓表面不平滑和仿射失真会放大轨腰Hausdorff距离测度，且无效轮廓与标准轮廓差异很大，最后将T4设置为15。

5.根据权利要求1所述的用于钢轨轮廓离群点检测及有效廓形识别的方法，其特征在于，T5≤T4。

用于钢轨轮廓离群点检测及有效廓形识别的方法

技术领域

[0001] 本发明涉及轨道交通检测领域，特别是一种用于钢轨轮廓离群点检测及有效廓形识别的方法。

背景技术

[0002] 通过利用2D位移激光传感器测量钢轨轮廓发现采集到的原始轮廓曲线受外界干扰的影响较大。具体表现为以下两点：一是受钢轨表面油脂层、光亮区域和路基、扣件等无关区域反射的影响，曲线中离群点较多且跳变幅度较大，尤其在轨顶踏面光亮的走形带上表现更为明显。离群点的存在会影响对轨腰双圆弧区的定位，导致轮廓配准错误；二是受铁路线路形态多样性的影响，除与标准轮廓形态一致的普通轨道区外，还有差异较大的道岔区和轨道接头区，后两者无法通过传统轨腰双圆心拟合来实现与标准轮廓的配准。检测系统若对采集到的廓形不加分类，不仅会因无效轮廓与标准轮廓的误匹配而造成检测结果异常，影响整条线路的质量评估，甚至会导致检测系统异常崩溃，降低系统的有效性。

[0003] 目前，常规离群点检测算法主要归纳为基于统计分布的离群点检测法、基于距离的离群点检测法和基于密度的离群点检测法三大类。

[0004] 1)基于统计分布的离群点检测法

[0005] 该方法是为数据集构建一个概率统计模型(如工程中常用的基于正态分布的3倍标准差模型，四分位数模型等)，其中的均值、标准差等模型参数由样本数据集求得，因此需预先对数据集的分布特征充分掌握[1]。在动态作业中，置于车底的2D传感器随车体的上下振动或左右侧滚而不停地变换空间位置，使得采集到的轮廓曲线在光平面坐标系下的位置也在时刻发生变化，不能保持固定。同时，离群点也可能出现在轮廓曲线的任何部位。此时，基于统计分布的离群点检测方法，要么难以将所有的离群点有效去除，要么在去除离群点的同时，可能破坏正常轮廓曲线自身的形态。

[0006] 2)基于距离的离群点检测法

[0007] 若数据集合D中，与对象O距离小于dmin的点的数目不超过pct个，则称对象O是以pct和dmin为参数的基于距离的离群点。该方法对于分布稀疏的离群点检测是有效的[2]。就钢轨测量轮廓来说，离群点可能呈现稀疏的单点分布，也可能呈现密集的线状分布。对后者来说，同样满足设定的最少点数要求。因此，该方法的效果也是不理想的。

[0008] 3)基于密度的离群点检测法

[0009] 该方法对于呈簇状分布的点集中离群点的检测是有效的[3]，通常使用的有kmeans[4] [5]聚类算法、局部离群点因子(Local Outlier Factor,LOF)算法等。但就钢轨测量轮廓来说，它是一条二维曲线，点集的分布并没有显著的密度特征，分类时可能将正常轮廓段和离群点归为一类。同时，分类的数目和离群点所属类号也都难以直接给定。由于钢轨测量轮廓是一条二维曲线，点集的分布并没有显著的密度特征，分类时可能将正常轮廓段和离群点归为一类。同时，分类的数目和离群点所属类号也都难以直接给定。

[0010] 和离群点归为一类，实际应用中面临的不确定性更多。

[0011] 如图1的(a)为例，3种方法的离群点检测效果见(b),(c),(d)，图中“X”点即为识别到的离群点。可以看出，统计分布模型对轮廓上下两端的离群点识别效果好，但难以识别到与轮廓纵向幅度一致的离群点；距离模型对稀疏分布的离群点识别效果好，但难以识别到密集分布的离群段；密度模型可能将正常轮廓段和离群点归为一类，实际应用中面临的不确定性更多。以上三种常规检测方法均不能有效去除离群点。

发明内容

[0012] 本发明所要解决的技术问题是，针对现有技术不足，提供一种用于钢轨轮廓离群点检测及有效廓形识别的方法，实现离群点的有效去除。

[0013] 为解决上述技术问题，本发明所采用的技术方案是：一种用于钢轨轮廓离群点检测及有效廓形识别的方法，包括以下步骤：

[0014] 1)在正常轮廓曲线上统计得到相邻点间距阈值T1后，首先对测量轮廓进行分裂，得到多个曲线碎片，然后根据正常轮廓数据点密集分布的特点，设定点数阈值T2，对曲线碎片一一进行检验，从而去除稀疏离群点；实验中正常数据点的间距约为0.5mm，离群点与相邻正常点的距离可达数十毫米，连续离群点的数目通常不超8个。据此，在保留一定余量的前提下，我们设置点间距阈值T1＝2，点数阈值T2＝10。

[0015] 2)设定段间距阈值T3，对相邻间隔不超过T3的属于同一区域的曲线碎片再次进行合并，然后对每个区域进行凹凸性检验，基于连续凹凸和点数最大原则提取轮廓潜在轨头轨腰区；实验中轨头与轨腰的间断距离通常达40mm，为保证拼接后的区域完整性，只要段间距阈值T3不超过该上限即可，我们将T3设置为30。

[0016] 3)将所述潜在轨头轨腰区与标准轮廓进行粗配准，通过标准轨腰区与潜在轨腰区间的单向Hausdorff距离与设定阈值T4的比较，作为测量轮廓有效性的最终判别指标；当标准轨腰区与潜在轨腰区间的单向Hausdorff距离小于T4时判别为有效轮廓，反之为无效轮廓。其中T4的设置采用基于正态分布的3倍标准差准则：选取有效轮廓300幅，统计得到轮廓单向Hausdorff距离的平均值和标准差分别为2.6698mm和1.0878mm，通过计算得到T4＝μ+3σ＝5.9332mm。考虑到测量轮廓表面不平滑和仿射失真可能放大轨腰Hausdorff距离测度，且尖轨、辙叉等无效轮廓相对有效轮廓与标准轮廓差异很大，我们将T4设置为15。

[0017] 4)判别为有效轮廓后，将原始测量轮廓与标准轮廓重配准，然后，对原始测量轮廓每一点，依次寻找与标准轮廓对应点欧式距离最近点，并将距离值与设定阈值T5进行比较，若不超过阈值T5，则该点为正常点，否则即为离群点。根据离群点与标准轮廓最近点间的距离较正常点出现突增的原则，提出一种自适应的距离阈值设置方案：在求得每个数据点距标准轮廓最近点的欧式距离后，对所有距离值进行升序排序，相邻两点出现突增的位置，后者距离值即为要设定的距离阈值。考虑到潜在轨头轨腰区数据点数已占据整幅轮廓70％以上，T5为潜在区域的欧式距离最大值，所以T5的取值不应超过T4。

[0018] 与现有技术相比，本发明所具有的有益效果为：本发明针对铁路线上实际测试中离群点和廓形多样性引起的测量轮廓与标准轮廓误匹配而导致磨耗计算严重错误的问题，提出一种基于轮廓粗配准的离群点检测及有效廓形快速识别算法。该算法先对轮廓曲线进行分裂，消除了曲线中大部分的稀疏离群点；再对剩余轮廓段进行合并，将属于同一区域的合并为一段，然后进行区域凹凸性检验，根据连续凹凸和点数最大原则确定潜在轨头轨腰区，实现潜在区域与标准轮廓的粗配准；最后根据配准后两个轮廓间的轨腰相似度实现了有效廓形的识别。在此基础上将原始测量轮廓与标准轮廓重配准，根据轮廓间相对距离实现了离群点的有效去除。

附图说明

[0019] 图1常规离群点检测算法性能测试；(a)原始轮廓；(b)1.5倍标准差模型；(c)dmin＝10,pct＝10；(d)kmeans算法(分为3类，图中曲线左、中、右区域各为1类)；

[0020] 图2为本发明基于轮廓粗配准的离群点及有效廓形检测流程图；

[0021] 图3为本发明轮廓分裂去除稀疏离群点示意图；(a)轮廓分裂效果；(b)去除稀疏离群点后效果；

[0022] 图4为轮廓合并与区域凹凸性检验图；(a)轮廓合并效果；(b)提取到的潜在轨头、轨腰区；

[0023] 图5为潜在区轮廓粗配准与相似度检验图；

[0024] 图6为原始轮廓重配准与离群点检测图；(a)离群点检测；(b)离群点全部去除后效果；

[0025] 图7为有效轮廓识别测试所用线路尺寸图；

[0026] 图8为不同轮廓配准算法的性能比较图；(a)轨腰双圆心拟合配准法(HD＝0.4823)；(b)轨头粗配准(HD＝6.1919)；(c)刚体ICP配准法(HD＝9.6855)；

[0027] 图9为测量轮廓数据点距标准轮廓最近点的距离排序图；

[0028] 图10为固定阈值与动态阈值的离群点检测效果比较图；(a)T5＝5时的离群点去除后效果；(b)T5＝25时的离群点去除后效果；

[0029] 图11为离群点引起的轨腰双圆弧区位置误判图；

[0030] 图12为不同检测算法的性能比较图；

[0031] 图13为接头区有效轮廓识别测试图；(a)接头鱼尾板尺寸；(b)不同里程处轨腰匹配误差；

[0032] 图14为道岔区有效轮廓识别测试图；(a)道岔区尺寸图；(b)不同里程处轨腰匹配误差。

具体实施方式

[0033] 考虑到每种轮廓形态都含有轨头区的特点，利用轨头区轨颚点和内侧直线作为轮廓配准的基准。相对于传统以轨腰区作为配准基准来说，轨头区配准精度较低，我们称其为粗配准，提出一种基于轮廓粗配准的离群点及有效廓形检测算法，具体检测流程如图2所示。

[0034] 第一步：轮廓分裂去除稀疏离群点

[0035] 正常的轮廓数据点分布较为密集，相邻点间距较小。凡点间距出现大幅跳变的地方，必定出现了异常。基于这一考虑，我们在正常轮廓曲线上统计得到相邻点间距阈值后，首先对测量轮廓进行分裂，得到很多的曲线碎片，效果如图3中的(a)，图中星号点为每段曲线碎片的终点。然后，根据正常轮廓数据点密集分布的特点，设定点数阈值，对碎片规模一一进行检验，从而去除稀疏离群点，效果如图3中的(b)。

[0036] 第二步：轮廓合并与区域凹凸性检验

[0037] 如图3中的(b)所示，去除稀疏离群点后，可能将原本属于同一区域的单一轮廓段分割成多条短距离的轮廓碎片，影响下一步的区域凹凸性判别。同时，轨头区前的密集离群段也会影响后续的轮廓配准。为此，我们先设定段间距阈值T3，来对相邻间隔较小的属于同一区域的轮廓段再次进行合并，然后对每个区域进行凹凸性检验，基于连续凹凸和点数最大原则提取轮廓潜在轨头轨腰区，效果依次见图4中的(a)、(b)。可以看出，不仅属于同一区域的轮廓碎片已被拼接回来，而且密集离群段的影响也被有效去除。

[0038] 第三步：潜在区域粗配准与轨腰相似度检验

[0039] 提取到潜在轨头轨腰区后，轨颚点即为轨头区终点，与轨颚点相邻的即为长约22mm的轨头内侧直线，由此几何特征即可对二者准确定位。实际应用中，我们只需知道轨颚点坐标和轨侧直线斜率，通过与标准轮廓相关位置的对比，即可得到旋转平移参数。

[0040] 假定测量轮廓和标准轮廓的轨颚点坐标分别为(xm_ge,ym_ge)、(xs_ge,ys_ge)，轨头内侧直线斜率分别为km、ks，则

[0041]

[0042] 式中旋转角θ＝arctan(ks-km)，[Tx,Ty]T即为求解得到的平移量，它是由测量轮廓与标准轮廓的相对位置决定。

[0043] 求得配准参数后，我们将潜在轨头轨腰区与标准轮廓进行粗配准，并使用Hausdorff距离[6,7]对两个轮廓轨腰区的相似度进行评价，作为测量轮廓有效性的最终判别指标。

[0044] 给定两个点集A＝(a1,a2,…)，B＝(b1,b2,…)，则两个点集间的Hausdorff距离[0045] H(A,B)＝max[h(A,B),h(B,A)] (0.2)

[0046] 式中

[0047]

[0048] H(A,B)称为双向Hausdorff距离，h(A,B)为从点集A到点集B的单向Hausdorff距离，相应地h(B,A)为从点集B到点集A的单向Hausdorff距离。

[0049] 潜在轨头轨腰区与标准轮廓粗配准后的效果见图5。由于测量轮廓轨腰区覆盖范围不固定，而标准轮廓来自准确的CAD模型，轨腰区点位、数目、覆盖范围是固定不变的。同时，测量轮廓表面由于铁锈、油渍的影响不够平滑，可能会误导对轨腰廓形的判别。基于这些考虑，轨腰相似度评估区的起点由测量轮廓轨腰起点决定(图中用As表示)，终点由标准轮廓轨腰终点决定(图中用Ae表示)，使用标准轮廓至测量轮廓在评估区的单向Hausdorff距离作为相似度测度。

[0050] 第四步：原始轮廓重配准与离群点有效去除

[0051] 判别为有效轮廓后，我们将其原始测量轮廓与标准轮廓重配准。然后，对于原始测量轮廓每一点，依次寻找标准轮廓距它的欧式距离最近点，并将距离值与设定阈值T5进行比较。若不超过阈值范围，则该点为正常点，否则即为离群点。原始轮廓离群点最终检测效果见图6中的(a)，去除后结果见图6中的(b)。和原始轮廓相比，不仅所有离群点都已被有效去除，而且正常轮廓段也都被有效地保留下来。

[0052] 实验及结果分析

[0053] (一)实验数据采集

[0054] 为分别检验本发明离群点检测和有效轮廓识别算法的性能，采集数据时，两者独立进行。其中，含有离群点的轮廓由钢轨铣磨车测量平台在室外一段铣后的60kg/m直轨上采集得到，多样性轮廓则由手推车式测量平台在一段由50kg/m钢轨铺设的普通轨道区和道岔区上采集得到，线路具体构成如图7。设置采样间隔0.1m，前者共采集有效轮廓100幅，后者共采集轮廓500幅，包括400幅有效轮廓和100幅无效轮廓。

[0055] (二)离群点检测性能测试

[0056] 1.不同轮廓配准算法的比较

[0057] 提取到测量轮廓潜在轨头轨腰区后，我们将本文使用的基于轨头区轨颚点和轨侧直线的轮廓粗配准法与传统的轨腰双圆心拟合配准法和刚体ICP配准法进行性能对比，三者效果依次见图8中的(a)～(c)。

[0058] 显然，轨腰双圆心拟合法的轮廓配准效果最好，轨头粗配准法次之，刚体ICP最差。考虑到廓形的多样性，轨腰配准在此是不能使用的；刚体ICP要求测量轮廓与标准轮廓曲线覆盖范围基本一致，这点在实际应用中是很难满足的，示例中两者由于轨头区范围差异较大，影响了整体配准效果；相比之下，轨头粗配准法的效果居于两者之间。轮廓配准后，相对有效轮廓，无效轮廓和离群点与标准轮廓数据点的差异很大，因此该方法在此是可以适用的。

[0059] 2.离群点检测阶段的固定阈值与自适应阈值的比较

[0060] 以图1的(a)原始测量轮廓为例，其配准后每个数据点距标准轮廓最近点的欧式距离升序排序如图9所示。

[0061] 显然，对该轮廓来说，距离值在6.786后出现突增，直接变为20.53，超过T4，参照上节离群点检测阈值设置规则，我们令T5＝T4＝15，离群点去除后效果见图5的(b)。作为比较，我们也令T5＝5和T5＝25，两种固定阈值下的离群点检测效果分别见图10的(a)、(b)。和图10的(b)相比，第一种情况阈值设置过小，导致轨头一些正常点被误删除掉；相反，第二种情况阈值设置过大，轨头上方一些离群点未被检测出来。相比之下，本文自适应阈值方案考虑了离群点的距离突增特性，检测性能最佳。

[0062] 3.不同离群点检测算法的比较

[0063] 我们以F1-Measure来表征每幅轮廓的离群点检测效果[8]，定义如下：

[0064]

[0065] 式中precision＝TP/(TP+FP)，recall＝TP/P，其中TP代表所检测到的离群点中真正的离群点数目，FP代表误识别的离群点数目，P代表轮廓中真正的离群点总数。F1-Measure越接近1，表示离群点检测的效果越好。

[0066] 以铣磨车平台采集到的100幅离群点轮廓为测试对象来检验不同算法的性能。由于基于密度的检测方法测试中面临的不确定因素较多，实验中我们没有采用，而只采用了基于统计的方法、基于距离的方法和本文方法进行性能比较。前两种方法的具体模型参数与图11一致，三种方法在不同轮廓上的F1-Measure得分曲线统计如图12所示。

[0067] 可以看出，统计模型和距离模型的离群点检测性能接近，100幅轮廓上的F1-Measure平均得分分别为0.5368和0.5146，检测效果不佳；而本文算法的检测性能要明显优于上述两种方法，F1-Measure平均得分达到0.9711，在许多轮廓上，检测得分更是直接达到1。测试结果表明本文提出的基于轮廓粗配准的离群点检测策略，通过测量轮廓与标准轮廓间点间距的比较，相对常规算法单纯只对测量轮廓进行分析，离群点的去除效果更好。

[0068] (三)有效轮廓识别性能测试

[0069] 1.轨道接头区

[0070] 从普通轨道区中提取一段包含一个轨道接头的线路。线路总长约10m，轨道接头位于线路的中央。通过判别这段线路的轮廓形态，并与实际路况进行对比，验证本文算法的有效轮廓识别性能。实验中，对无效轮廓，令h(B,A)＝20，不同里程处轮廓判别结果图13所示。从里程14.8m到15.4m之间连续出现无效轮廓，总长达0.7m，而实验路段接头区鱼尾板的长度为0.8m，两者基本相符，表明此里程段就是轨道接头所在位置。

[0071] 2.道岔区

[0072] 道岔区尺寸图如图14所示，它由基本轨、尖轨、连接部分和辙叉区组成。其中尖轨和辙叉区部分，廓形与正常轮廓完全不同，均为无效轮廓。该段线路不同里程处的轮廓判别结果如图14中的(b)所示。第一个连续无效区从里程30.7m到34.7m，长约4.1m，与尖轨区(图中S表示)长度完全相符；第二个连续无效区从里程45.4m到47.8m，长约2.5m，与辙叉区(图中F表示)长度基本相符，廓形判别结果与线路实际状况基本一致。

[0073] 3.廓形有效性判别准确率测试

[0074] 将数据集中剩下的100幅有效轮廓和100幅无效轮廓作为测试样本，分别以3倍标准差阈值T4＝5.9332和考虑测量轮廓表面不平滑及仿射失真影响后保留一定余量的阈值后T4＝15作为阈值参数，统计轮廓有效性判别的准确率，实验结果见表1。可以看出，后者廓形判别准确率较高，达到97.5％，误判率仅为2.5％，更符合实际线路的应用需求。

[0075] 表1廓形判别准确率测试

[0076]

[0077] (四)实时性测试

[0078] 我们以手推车平台在图7线路上采集到的500幅轮廓为例，测试算法的真实运行时间。实验在一台搭载Intel内核的台式机上进行，CPU为3.2GHz i5处理器，并配有4G内存。整个算法在Matlab平台运行，单个轮廓的离群点及廓形有效性检测平均校准耗时为41ms。按照《铁路线路修理规则》[9]和BS EN 13231-3[10]的标准要求，轨道纵向两个断面轮廓的采样间隔在0.2m～0.3m之间，通常设为0.25m。因此，我们能推导得到整个系统的平均检测速度约为21.95km/h，远高于钢轨铣磨车的5km/h常规作业速度，可以满足车载实时测量的需求。

[0079] 参考文献

[0080] [1]王新霞,王珂,焦东翔,等.基于正态分布离群点算法的反窃电研究[J].电气应用,2017(07):60-65.

[0081] [2]江峰,杜军威,眭跃飞,等.基于边界和距离的离群点检测[J].电子学报,2010,38(3):700-705.

[0082] [3]揭财明.基于密度的局部离群点检测算法分析与研究[D].重庆大学计算机软件与理论,2012.

[0083] [4]曹科研.不确定数据的聚类分析与异常点检测算法[D].东北大学计算机系统结构,2014.

[0084] [5]赵新想.基于密度的局部离群点检测算法的研究与改进[D].华中师范大学计算机软件与理论,2014.

[0085] [6]Huttenlocher D P,Klanderman G A,Rucklidge W J.Comparing images using the Hausdorff distance[J].IEEE transactions on pattern analysis and machine intelligence,1993,15(9):850-863.

[0086] [7]舒丽霞,周成平,彭晓明,等.基于Hausdorff距离图象配准方法研究[J].中国图象图形学报A辑,2003,8(12):1412-1417.

[0087] [8]姜嘉尧.基于最大化F1值学习的不平衡数据集分类算法研究[D].哈尔滨工业大学,2017.

[0088] [9]中华人民共和国铁道部.铁运[2006]146号铁路线路修理规则[S].北京:中国铁道出版社,2006.

[0089] [10]Institution B S.BS EN 13231-3Railway applications-track-acceptance of works-part 3:acceptance of rail grinding,milling and planning work in track[S].London,2006.

用于钢轨轮廓离群点检测及有效廓形识别的方法转让专利

申请号 : CN201810864497.X

文献号 : CN108931206B

文献日 : 2020-04-24

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 马子骥 , 石博 , 李艳福 , 刘宏立

申请人 : 湖南大学

摘要 :

权利要求 :

说明书 :