一种基于层次聚类分析的沟槽特征参数处理方法转让专利
申请号 : CN202110593698.2
文献号 : CN113269757B
文献日 : 2022-05-27
发明人 : 宋韬 , 朱增旭 , 赵亮
申请人 : 浙江中烟工业有限责任公司
摘要 :
权利要求 :
1.一种基于层次聚类分析的沟槽特征参数处理方法,其特征在于,包括以下步骤:
步骤1)、对图像进行边缘轮廓提取,计算沟槽特征参数;
步骤2)、将获取的沟槽数目N与标准值Nstandard进行对比,判断沟槽数目计算是否准确,若不准确,则对所有孔的深度、面积、底部宽度的数据进行层次聚类筛选;
步骤2.1)、对X={x1,x2,x3…xn}进行欧氏距离计算,创建欧氏距离矩阵表,其中xi是单个孔的特征参数向量,xi={di,si,wi},d是沟槽深度,即沟槽孔顶点到沟槽底部的垂直距离,s是沟槽面积比,即单个沟槽孔面积与整体沟槽面积的比值,w是沟槽孔的底部宽度,欧氏距离计算公式:步骤2.2)、在建立好的欧氏距离矩阵表中找出距离最小的两个元素xi和xj合并成为类C(xi,xj),用C(xi,xj)替代xi和xj,重新带入矩阵表,形成迭代计算矩阵表,按类间平均距离法计算空间距离,迭代上述方法直至所有元素聚为一类,生成谱系树;
步骤2.3)、谱系树中数据点自下而上,逐层聚类,最终形成由C1和C2两大类组成完整的全集;C2类元素数量较少,计算出其元素数量|C2|,若|C2|等于N与Nstandard的差值,则此类元素均要筛除,若|C2|大于N与Nstandard的差值,则让C2中的每个元素依次与C1的重心点G计算空间距离,筛除其中空间距离最大、相似度最小的A个元素,A为N与Nstandard的差值。
2.根据权利要求1所述的一种基于层次聚类分析的沟槽特征参数处理方法,其特征在于,所述类间平均距离的定义为类间所有元素间欧式距离的平均值,计算公式如下:其中|C1|,|C2|代表C1和C2的元素个数。
3.根据权利要求1所述的一种基于层次聚类分析的沟槽特征参数处理方法,其特征在于,所述C1的重心点G的计算公式如下:
说明书 :
一种基于层次聚类分析的沟槽特征参数处理方法
技术领域
背景技术
压纹与成型纸之间形成半圆形中空的沟槽孔。沟槽孔在物理形态上包含了深度、数目、面积
比、宽度等特征参数。在抽吸过程中通过沟槽孔起到稀释烟气、降焦减害的作用。沟槽滤棒
特征参数值过大,引入空气量增加,烟气中焦油含量偏小,参数值过小,引入空气量减少,烟
气中焦油含量偏大,因此精准测量沟槽滤棒特征参数对于提高卷烟的焦油含量精准控制、
降焦减害效果有重要的意义。
征参数进行测量,在应用中发现存在因刀片切割瑕疵、纤维素纸位置漂移、丝束填充不均匀
等原因导致存在无法识别非沟槽点的问题,会将非沟槽点当做沟槽进行测量和计算,从而
对沟槽特征参数准确度有较大干扰,出现计算不准确的问题。
发明内容
定向筛除,以达到精准测量的目的。
距离,s是沟槽面积比,即单个沟槽孔面积与整体沟槽面积的比值,w是沟槽孔的底部宽度,
如图2所示,欧氏距离计算公式:
距离法计算空间距离,迭代上述方法直至所有元素聚为一类,生成谱系树,如图3所示;
类元素均要筛除,若|C2|大于N与Nstandard的差值,则让C2中的每个元素依次与C1的重心点G
计算空间距离,筛除其中空间距离最大、相似度最小的A个元素,A为N与Nstandard的差值。
用效果来看,该方法误检率低至0.7%,较改进前的误检率4.64%下降了84.84%,检测准确
率高,具有较好的应用效果。在实际生产中,若对该方法的特征参数向量扩充分析因子,进
行更高维度分析,将会进一步提高该方法的准确性。
附图说明
具体实施方式
理解的相同含义。
也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包
括”时,其指明存在特征、步骤、操作、器件、部件和/或它们的组合。
描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特
定的方位构造和操作,因此不能理解为对本发明的限制。
隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两
个或两个以上,除非另有明确的限定。
械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元
件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发
明中的具体含义。
们之间的另外的特征接触。而且,第一特征在第二特征“之上”、“上方”和“上面”包括第一特
征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在
第二特征“之下”、“下方”和“下面”包括第一特征在第二特征正下方和斜下方,或仅仅表示
第一特征水平高度小于第二特征。
距离,s是沟槽面积比,即单个沟槽孔面积与整体沟槽面积的比值,w是沟槽孔的底部宽度,
欧氏距离计算公式:
距离法计算空间距离,迭代上述方法直至所有元素聚为一类,生成谱系树;所述类间平均距
离的定义为类间所有元素间欧式距离的平均值,计算公式如下:
类元素均要筛除,若|C2|大于N与Nstandard的差值,则让C2中的每个元素依次与C1的重心点G
计算空间距离,筛除其中空间距离最大、相似度最小的A个元素,A为N与Nstandard的差值,所述
C1的重心点G的计算公式如下:
深色区域被标记为沟槽孔,在标记15和17之间,深入分析为典型的丝束填充不均匀导致沟
槽特征参数计算异常,图中异常数据点用方框标记。
2 0.234 0
3 0.285 0.057 0
4 0.241 0.032 0.075 0
5 0.320 0.096 0.042 0.112 0
6 0.181 0.066 0.107 0.088 0.139 0
7 0.297 0.073 0.036 0.086 0.033 0.119 0
8 0.321 0.090 0.045 0.096 0.032 0.144 0.030 0
9 0.304 0.071 0.024 0.081 0.042 0.128 0.041 0.032 0
10 0.268 0.051 0.052 0.058 0.070 0.096 0.037 0.059 0.061 0
11 0.326 0.102 0.046 0.117 0.010 0.145 0.042 0.036 0.044 0.079 0
12 0.112 0.312 0.355 0.325 0.382 0.249 0.361 0.389 0.377 0.336 0.388 0
13 0.100 0.211 0.250 0.227 0.275 0.147 0.255 0.283 0.273 0.232 0.282 0.108 0
14 0.092 0.233 0.273 0.248 0.298 0.169 0.279 0.307 0.295 0.255 0.305 0.084 0.024 0
15 0.240 0.060 0.081 0.071 0.098 0.077 0.068 0.094 0.095 0.037 0.108 0.304 0.198 0.222 0
16 0.285 0.461 0.492 0.481 0.514 0.397 0.503 0.530 0.515 0.488 0.518 0.196 0.271 0.250 0.459 0
17 0.223 0.152 0.155 0.182 0.169 0.108 0.167 0.191 0.179 0.167 0.171 0.252 0.157 0.175 0.152 0.351 0[0057] Step3:从上表可知数据点5与11的相似度最高,空间距离最小为0.010,将类(5,
11)聚合替代数据点5和11,代入空间距离矩阵进行迭代运算,生成如图5所示的谱系树。
以看出数据点16与C1类空间距离最远,是所需要筛除的数据点。
秒,多耗时18.2毫秒。由此可知,该算法因为数据量总体较少,计算量不大,对整体程序的计
算复杂度影响较小。
性和有效性。
其特点是无须监督、无须设定聚类数、空间距离和相似性,容易定义,不需要明确的阈值。利
用层次聚类分析法,通过对孔与孔之间的深度、面积、底部宽度等参数的空间距离计算,可
以快速筛选出奇异性最大的数据点。
点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不
一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何
的一个或多个实施例或示例中以合适的方式结合。
的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型,凡是依据本发
明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术
方案的范围内。