一种基于层次聚类分析的沟槽特征参数处理方法转让专利

申请号 : CN202110593698.2

文献号 : CN113269757B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 宋韬朱增旭赵亮

申请人 : 浙江中烟工业有限责任公司

摘要 :

本发明涉及一种基于层次聚类分析的沟槽特征参数处理方法,包括以下步骤:步骤1)、对图像进行边缘轮廓提取,计算沟槽特征参数;步骤2)、将获取的沟槽数目N与标准值Nstandard进行对比,判断沟槽数目计算是否准确,若不准确,则对所有孔的深度、面积、底部宽度的数据进行层次聚类筛选;本发明基于层次聚类分析法对图像处理得到的沟槽特征参数进行后期优化处理,对数据集进行有效分类,从分类中精准筛选出干扰数据,保证特征参数的准确性。

权利要求 :

1.一种基于层次聚类分析的沟槽特征参数处理方法,其特征在于,包括以下步骤:

步骤1)、对图像进行边缘轮廓提取,计算沟槽特征参数;

步骤2)、将获取的沟槽数目N与标准值Nstandard进行对比,判断沟槽数目计算是否准确,若不准确,则对所有孔的深度、面积、底部宽度的数据进行层次聚类筛选;

步骤2.1)、对X={x1,x2,x3…xn}进行欧氏距离计算,创建欧氏距离矩阵表,其中xi是单个孔的特征参数向量,xi={di,si,wi},d是沟槽深度,即沟槽孔顶点到沟槽底部的垂直距离,s是沟槽面积比,即单个沟槽孔面积与整体沟槽面积的比值,w是沟槽孔的底部宽度,欧氏距离计算公式:步骤2.2)、在建立好的欧氏距离矩阵表中找出距离最小的两个元素xi和xj合并成为类C(xi,xj),用C(xi,xj)替代xi和xj,重新带入矩阵表,形成迭代计算矩阵表,按类间平均距离法计算空间距离,迭代上述方法直至所有元素聚为一类,生成谱系树;

步骤2.3)、谱系树中数据点自下而上,逐层聚类,最终形成由C1和C2两大类组成完整的全集;C2类元素数量较少,计算出其元素数量|C2|,若|C2|等于N与Nstandard的差值,则此类元素均要筛除,若|C2|大于N与Nstandard的差值,则让C2中的每个元素依次与C1的重心点G计算空间距离,筛除其中空间距离最大、相似度最小的A个元素,A为N与Nstandard的差值。

2.根据权利要求1所述的一种基于层次聚类分析的沟槽特征参数处理方法,其特征在于,所述类间平均距离的定义为类间所有元素间欧式距离的平均值,计算公式如下:其中|C1|,|C2|代表C1和C2的元素个数。

3.根据权利要求1所述的一种基于层次聚类分析的沟槽特征参数处理方法,其特征在于,所述C1的重心点G的计算公式如下:

说明书 :

一种基于层次聚类分析的沟槽特征参数处理方法

技术领域

[0001] 本发明涉及烟草行业中沟槽滤棒检测领域,更具体地说,是涉及一种基于层次聚类分析的沟槽特征参数处理方法。

背景技术

[0002] 醋酸纤维沟槽滤棒是烟草行业目前较为常见的一种特殊异型滤棒,它由丝束、纤维素纸和成型纸组成。通过沟槽辊对纤维素纸进行挤压,在纤维素纸表面形成波浪形压纹,
压纹与成型纸之间形成半圆形中空的沟槽孔。沟槽孔在物理形态上包含了深度、数目、面积
比、宽度等特征参数。在抽吸过程中通过沟槽孔起到稀释烟气、降焦减害的作用。沟槽滤棒
特征参数值过大,引入空气量增加,烟气中焦油含量偏小,参数值过小,引入空气量减少,烟
气中焦油含量偏大,因此精准测量沟槽滤棒特征参数对于提高卷烟的焦油含量精准控制、
降焦减害效果有重要的意义。
[0003] 目前国内在沟槽特征参数检测原理方面多采用董浩的醋纤沟槽滤棒特征参数测定方法,该方法计算复杂度低、效果明显,现有测量手段基于图像处理技术,对沟槽表面特
征参数进行测量,在应用中发现存在因刀片切割瑕疵、纤维素纸位置漂移、丝束填充不均匀
等原因导致存在无法识别非沟槽点的问题,会将非沟槽点当做沟槽进行测量和计算,从而
对沟槽特征参数准确度有较大干扰,出现计算不准确的问题。

发明内容

[0004] 为了解决上述技术问题,本发明的目的在于提供一种基于层次聚类分析的沟槽特征参数处理方法,该方法对仪器检测后的特征参数数据进行后期处理,对奇异点数据进行
定向筛除,以达到精准测量的目的。
[0005] 为了实现上述发明的目的,本发明采用以下技术方案:
[0006] 一种基于层次聚类分析的沟槽特征参数处理方法,包括以下步骤:
[0007] 步骤1)、对图像进行边缘轮廓提取,计算沟槽特征参数;
[0008] 步骤2)、将获取的沟槽数目N与标准值Nstandard进行对比,判断沟槽数目计算是否准确,若不准确,则对所有孔的深度、面积、底部宽度的数据进行层次聚类筛选;
[0009] 步骤2.1)、对X={x1,x2,x3…xn}进行欧氏距离计算,创建欧氏距离矩阵表,其中xi是单个孔的特征参数向量,xi={di,si,wi},d是沟槽深度,即沟槽孔顶点到沟槽底部的垂直
距离,s是沟槽面积比,即单个沟槽孔面积与整体沟槽面积的比值,w是沟槽孔的底部宽度,
如图2所示,欧氏距离计算公式:
[0010]
[0011] 欧氏距离矩阵表
[0012]
[0013] 步骤2.2)、在建立好的欧氏距离矩阵表中找出距离最小的两个元素xi和xj合并成为类C(xi,xj),用C(xi,xj)替代xi和xj,重新带入矩阵表,形成迭代计算矩阵表,按类间平均
距离法计算空间距离,迭代上述方法直至所有元素聚为一类,生成谱系树,如图3所示;
[0014] 迭代计算矩阵表
[0015]
[0016]
[0017] 步骤2.3)、谱系树中数据点自下而上,逐层聚类,最终形成由C1和C2两大类组成完整的全集;C2类元素数量较少,计算出其元素数量|C2|,若|C2|等于N与Nstandard的差值,则此
类元素均要筛除,若|C2|大于N与Nstandard的差值,则让C2中的每个元素依次与C1的重心点G
计算空间距离,筛除其中空间距离最大、相似度最小的A个元素,A为N与Nstandard的差值。
[0018] 作为优选方案,所述类间平均距离的定义为类间所有元素间欧式距离的平均值,计算公式如下:
[0019]
[0020] 其中|C1|,|C2|代表C1和C2的元素个数。
[0021] 作为优选方案,所述C1的重心点G的计算公式如下:
[0022] 与现有技术相比,本发明的有益效果为:
[0023] 本发明基于层次聚类分析法对图像处理得到的沟槽特征参数进行后期优化处理,对数据集进行有效分类,从分类中精准筛选出干扰数据,保证特征参数的准确性。从实际应
用效果来看,该方法误检率低至0.7%,较改进前的误检率4.64%下降了84.84%,检测准确
率高,具有较好的应用效果。在实际生产中,若对该方法的特征参数向量扩充分析因子,进
行更高维度分析,将会进一步提高该方法的准确性。

附图说明

[0024] 构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的限定。
[0025] 图1为本发明的方法流程示意图;
[0026] 图2为本发明的沟槽滤棒特征参数标识图;
[0027] 图3为本发明的沟槽谱系树示意图;
[0028] 图4为本发明的实施例的沟槽滤棒原始采集图像;
[0029] 图5为本发明的实施例的沟槽样本谱系树示意图;
[0030] 图6为本发明的实施例的沟槽滤棒处理后的图像。

具体实施方式

[0031] 应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常
理解的相同含义。
[0032] 需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式
也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包
括”时,其指明存在特征、步骤、操作、器件、部件和/或它们的组合。
[0033] 此外,在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于
描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特
定的方位构造和操作,因此不能理解为对本发明的限制。
[0034] 此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者
隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两
个或两个以上,除非另有明确的限定。
[0035] 在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机
械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元
件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发
明中的具体含义。
[0036] 在本发明中,除非另有明确的规定和限定,第一特征在第二特征之“上”或之“下”可以包括第一和第二特征直接接触,也可以包括第一和第二特征不是直接接触而是通过它
们之间的另外的特征接触。而且,第一特征在第二特征“之上”、“上方”和“上面”包括第一特
征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在
第二特征“之下”、“下方”和“下面”包括第一特征在第二特征正下方和斜下方,或仅仅表示
第一特征水平高度小于第二特征。
[0037] 下面结合附图与实施例对本发明作进一步说明:
[0038] 如图1所示的一种基于层次聚类分析的沟槽特征参数处理方法,包括以下步骤:
[0039] 步骤1)、对图像进行边缘轮廓提取,计算沟槽特征参数;
[0040] 步骤2)、将获取的沟槽数目N与标准值Nstandard进行对比,判断沟槽数目计算是否准确,若不准确,则对所有孔的深度、面积、底部宽度的数据进行层次聚类筛选。
[0041] 步骤2.1)、对X={x1,x2,x3…xn}进行欧氏距离计算,创建欧氏距离矩阵表,其中xi是单个孔的特征参数向量,xi={di,si,wi},d是沟槽深度,即沟槽孔顶点到沟槽底部的垂直
距离,s是沟槽面积比,即单个沟槽孔面积与整体沟槽面积的比值,w是沟槽孔的底部宽度,
欧氏距离计算公式:
[0042]
[0043] 步骤2.2)、在建立好的欧氏距离矩阵表中找出距离最小的两个元素xi和xj合并成为类C(xi,xj),用C(xi,xj)替代xi和xj,重新带入矩阵表,形成迭代计算矩阵表,按类间平均
距离法计算空间距离,迭代上述方法直至所有元素聚为一类,生成谱系树;所述类间平均距
离的定义为类间所有元素间欧式距离的平均值,计算公式如下:
[0044]
[0045] 其中|C1|,|C2|代表C1和C2的元素个数。
[0046] 步骤2.3)、谱系树中数据点自下而上,逐层聚类,最终形成由C1和C2两大类组成完整的全集;C2类元素数量较少,计算出其元素数量|C2|,若|C2|等于N与Nstandard的差值,则此
类元素均要筛除,若|C2|大于N与Nstandard的差值,则让C2中的每个元素依次与C1的重心点G
计算空间距离,筛除其中空间距离最大、相似度最小的A个元素,A为N与Nstandard的差值,所述
C1的重心点G的计算公式如下:
[0047]
[0048] 下面通过运用本发明方法的一个具体的实施例来作出详细的解释。
[0049] 从图4中可以看出,计算出的沟槽数目为17个,理论设计沟槽数目为16个,计算值大于设计的标准值,因此可以断定该图像计算结果存在偏差。图像中左上角有一个不规则
深色区域被标记为沟槽孔,在标记15和17之间,深入分析为典型的丝束填充不均匀导致沟
槽特征参数计算异常,图中异常数据点用方框标记。
[0050] Step1:整支滤棒的特征参数数据计算如下:
[0051] 样本特征参数数据表
[0052]
[0053]
[0054] Step2:数据点数量17,大于设计的标准值16,数据存在异常,根据上表作出欧氏距离矩阵表:
[0055] 样本欧氏距离矩阵表
[0056]   1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 171 0                                
2 0.234 0                              
3 0.285 0.057 0                            
4 0.241 0.032 0.075 0                          
5 0.320 0.096 0.042 0.112 0                        
6 0.181 0.066 0.107 0.088 0.139 0                      
7 0.297 0.073 0.036 0.086 0.033 0.119 0                    
8 0.321 0.090 0.045 0.096 0.032 0.144 0.030 0                  
9 0.304 0.071 0.024 0.081 0.042 0.128 0.041 0.032 0                
10 0.268 0.051 0.052 0.058 0.070 0.096 0.037 0.059 0.061 0              
11 0.326 0.102 0.046 0.117 0.010 0.145 0.042 0.036 0.044 0.079 0            
12 0.112 0.312 0.355 0.325 0.382 0.249 0.361 0.389 0.377 0.336 0.388 0          
13 0.100 0.211 0.250 0.227 0.275 0.147 0.255 0.283 0.273 0.232 0.282 0.108 0        
14 0.092 0.233 0.273 0.248 0.298 0.169 0.279 0.307 0.295 0.255 0.305 0.084 0.024 0      
15 0.240 0.060 0.081 0.071 0.098 0.077 0.068 0.094 0.095 0.037 0.108 0.304 0.198 0.222 0    
16 0.285 0.461 0.492 0.481 0.514 0.397 0.503 0.530 0.515 0.488 0.518 0.196 0.271 0.250 0.459 0  
17 0.223 0.152 0.155 0.182 0.169 0.108 0.167 0.191 0.179 0.167 0.171 0.252 0.157 0.175 0.152 0.351 0[0057] Step3:从上表可知数据点5与11的相似度最高,空间距离最小为0.010,将类(5,
11)聚合替代数据点5和11,代入空间距离矩阵进行迭代运算,生成如图5所示的谱系树。
[0058] Step4:从谱系树中可以看出类C2包含数据点1、12、13、14、16,数量为5,而我们仅需剔除其中一个点,对C2类中所有数据点与C1类的重心点进行空间距离计算。从数据中可
以看出数据点16与C1类空间距离最远,是所需要筛除的数据点。
[0059] 空间距离表
[0060] 序号 点1 点12 点13 点14 点16C1重心G 0.265 0.333 0.227 0.25 0.474
[0061] Step5:经过上述步骤,得出最终的处理图,如图6所示。
[0062] 计算时间对比表
[0063]
[0064]
[0065] 从上表可以看出,对单支滤棒进行20次重复性计算,程序添加层次聚类算法前,计算单支滤棒平均耗时935.35毫秒,添加层次聚类算法后,计算单支滤棒平均耗时953.55毫
秒,多耗时18.2毫秒。由此可知,该算法因为数据量总体较少,计算量不大,对整体程序的计
算复杂度影响较小。
[0066] 本申请提出一种基于层次聚类分析的沟槽特征参数处理方法,旨在对已提取的特征参数数据进行再处理分析,从中筛除可疑数据点,保留正确的数据信息,提高数据的真实
性和有效性。
[0067] 层次聚类分析法是一种通过数据点与点的空间距离,判断两两之间的相似性,空间距离越小,相似性越高,将相似性最高的两点进行聚类,此过程反复迭代的一种的算法,
其特点是无须监督、无须设定聚类数、空间距离和相似性,容易定义,不需要明确的阈值。利
用层次聚类分析法,通过对孔与孔之间的深度、面积、底部宽度等参数的空间距离计算,可
以快速筛选出奇异性最大的数据点。
[0068] 在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特
点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不
一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何
的一个或多个实施例或示例中以合适的方式结合。
[0069] 尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨
的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型,凡是依据本发
明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术
方案的范围内。