一种木工打磨过程中的切割异常检测方法转让专利

申请号 : CN202311412173.X

文献号 : CN117171693B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李帅

申请人 : 山东交通学院

摘要 :

本发明涉及数据处理技术领域,具体涉及一种木工打磨过程中的切割异常检测方法,包括:将切割过程中的动态数据转化为参数空间中的数据点,获取每种k值下参数空间中的类簇,根据每种k值下参数空间中的类簇获得每种k值下原始空间中的类簇,根据每种k值下原始空间中的所有类簇中的数据点分布情况,计算每种k值的合适程度,根据合适程度获得最佳k值,根据最佳k值获得切割过程中的动态数据的最佳聚类结果,根据最佳聚类结果获得切割过程中的动态数据中的异常数据点,实现切割异常检测。本发明获得原始空间中分布状态为椭圆形的类簇,将异常动态数据和正常动态数据分开,提高异常动态(56)对比文件Emad Ali 等.Unsupervised AnomalyIsolation for Condition MonitoringSystems《.2018 2nd European Conference onElectrical Engineering and ComputerScience (EECS)》.2019,491-496.Haoxuan Zhou 等.Conditional featuredisentanglement learning for anomalydetection in machines operating undertime-varying conditions《.MechanicalSystems and Signal Processing》.2023,第191卷1-26.张永梅 等.基于数学形态学的三维空间聚类《.火力与指挥控制》.2006,(第10期),41-43+47.左进 等.基于改进K均值聚类的异常检测算法《.计算机科学》.2016,第43卷(第8期),258-261.王鹏飞 等.密度峰值快速聚类算法优化研究《.计算机工程与科学》.2018,第40卷(第8期),1503-1510.

权利要求 :

1.一种木工打磨过程中的切割异常检测方法,其特征在于,所述方法包括以下步骤:

采集切割过程中的动态数据,将动态数据转化为参数空间中的数据点,参数空间中的每个数据点有对应的极角、极径和投票率;

获取每种k值下参数空间中的类簇,包括:根据投票率和k值设置类簇中心,其中,k值是指类簇的数量,根据数据点与类簇中心的极角的差异以及极径的差异,计算参数空间中每个数据点与每个类簇中心的特征相似性,根据每个数据点与每个类簇中心的投票率的差异以及特征相似性,获得参数空间中的类簇;

根据每种k值下参数空间中的类簇获得每种k值下原始空间中的类簇,根据每种k值下原始空间中的所有类簇中的数据点分布情况,计算每种k值的合适程度;

根据合适程度获得最佳k值,根据最佳k值获得切割过程中的动态数据的最佳聚类结果,根据最佳聚类结果获得切割过程中的动态数据中的异常数据点,实现切割异常检测;

所述将动态数据转化为参数空间中的数据点,包括的具体步骤如下:

切割过程中的动态数据包括动力输出数据和振动数据两个维度,动力输出数据和振动数据组成原始空间,将每个时刻的动力输出数据和振动数据转换为原始空间中的数据点,通过霍夫变换将原始空间中的数据点转换为参数空间中的数据点,参数空间是由极角 和极径 组成的;

所述每种k值的合适程度的计算公式为:

式中, 表示k值的合适程度,k值取遍[3,10]内的所有整数,表示k个类簇中第i个类簇中所有数据点到该类簇的基准线的距离的均值, 表示k个类簇中第i个类簇中数据点的数量, 表示k个类簇中第i个类簇的最小外接矩形的面积,和 分别表示k个类簇中第i个类簇的最小外接矩形的长边和短边,长边是最小外接矩形的两条边中长度最长的边,短边是最小外接矩形的两条边中长度最短的边;

所述类簇的基准线的获取方法具体如下:获得每个类簇的最小外接矩形,过每个类簇的最小外接矩形的几何中心作一条和最小外接矩形的长边平行的直线,作为类簇的基准线。

2.根据权利要求1所述的一种木工打磨过程中的切割异常检测方法,其特征在于,所述根据投票率和k值设置类簇中心,包括的具体步骤如下:将每种目标极角对应的所有数据点中,投票率最大的数据点作为类簇中心,共获得k个簇类中心,目标极角是投票率最大的k种极角,每种极角的投票率是参数空间中每种极角对应的所有数据点的投票率之和。

3.根据权利要求1所述的一种木工打磨过程中的切割异常检测方法,其特征在于,所述参数空间中每个数据点与每个类簇中心的特征相似性的计算公式为:式中,表示数据点与类簇中心的特征相似性,和 分别表示数据点的极角和极径,和 分别表示类簇中心的极角和极径, 表示以自然常数为底的指数函数,表示极角的误差允许范围,表示极径的误差允许范围。

4.根据权利要求1所述的一种木工打磨过程中的切割异常检测方法,其特征在于,所述根据每个数据点与每个类簇中心的投票率的差异以及特征相似性,获得参数空间中的类簇,包括的具体步骤如下:对于参数空间中任意一个数据点,计算该数据点与每个类簇中心的特征相似性,将该数据点划分到特征相似性最大的类簇中心中,如果该数据点的投票率在 范围内,将该数据点作为特征相似性最大的类簇中心所在的类簇中的数据点, 表示特征相似性最大的类簇中心的投票率;

以此类推,将参数空间中每个数据点划分到对应的类簇中心所在的类簇中,作为参数空间中的类簇。

5.根据权利要求1所述的一种木工打磨过程中的切割异常检测方法,其特征在于,所述根据每种k值下参数空间中的类簇获得每种k值下原始空间中的类簇,包括的具体步骤如下:根据参数空间中的类簇获得原始空间中的类簇,给参数空间中的每个类簇中的所有数据点投票的所有原始空间中的数据点组成原始空间中的一个类簇;

利用箱线图去除原始空间中的每个类簇中的异常点,通过计算数据点与每个类簇的几何中心的距离,将数据点划分到距离最近的类簇中。

说明书 :

一种木工打磨过程中的切割异常检测方法

技术领域

[0001] 本发明涉及数据处理技术领域,具体涉及一种木工打磨过程中的切割异常检测方法。

背景技术

[0002] 木工打磨过程中的切割异常可能导致木制品表面产生不平整、锯齿状或其他缺陷,影响产品的外观和质量。通过检测切割过程中的异常,及时发现并修复问题,确保最终的产品符合要求。
[0003] 现有技术是通过对切割过程中的动态数据进行聚类,根据聚类结果识别异常数据,进而实现切割异常检测。
[0004] K均值聚类算法是一种常规的聚类算法,适用于对分布状态为圆形的正常数据进行聚类;但是切割过程中正常的动态数据具有局部线性相关性,因此,正常的动态数据分布状态为椭圆形;所以利用K均值聚类算法识别动态数据中的异常数据,会将部分异常数据错误的识别为正常数据,导致不能切割异常检测不准确。

发明内容

[0005] 本发明提供一种木工打磨过程中的切割异常检测方法,以解决现有的问题,该方法包括以下步骤:
[0006] 采集切割过程中的动态数据,将动态数据转化为参数空间中的数据点,参数空间中的每个数据点有对应的极角、极径和投票率;
[0007] 获取每种k值下参数空间中的类簇,包括:根据投票率和k值设置类簇中心,根据数据点与类簇中心的极角的差异以及极径的差异,计算参数空间中每个数据点与每个类簇中心的特征相似性,根据每个数据点与每个类簇中心的投票率的差异以及特征相似性,获得参数空间中的类簇;
[0008] 根据每种k值下参数空间中的类簇获得每种k值下原始空间中的类簇,根据每种k值下原始空间中的所有类簇中的数据点分布情况,计算每种k值的合适程度;
[0009] 根据合适程度获得最佳k值,根据最佳k值获得切割过程中的动态数据的最佳聚类结果,根据最佳聚类结果获得切割过程中的动态数据中的异常数据点,实现切割异常检测。
[0010] 优选地,所述根据投票率和k值设置类簇中心,包括的具体步骤如下:
[0011] 将每种目标极角对应的所有数据点中,投票率最大的数据点作为类簇中心,共获得k个簇类中心,目标极角是投票率最大的k种极角,每种极角的投票率是参数空间中每种极角对应的所有数据点的投票率之和。
[0012] 优选地,所述参数空间中每个数据点与每个类簇中心的特征相似性的计算公式为:
[0013]
[0014] 式中,表示数据点与类簇中心的特征相似性,和 分别表示数据点的极角和极径, 和 分别表示类簇中心的极角和极径, 表示以自然常数为底的指数函数,表示极角的误差允许范围,表示极径的误差允许范围。
[0015] 优选地,所述根据每个数据点与每个类簇中心的投票率的差异以及特征相似性,获得参数空间中的类簇,包括的具体步骤如下:
[0016] 对于参数空间中任意一个数据点,计算该数据点与每个类簇中心的特征相似性,将该数据点划分到特征相似性最大的类簇中心中,如果该数据点的投票率在范围内,将该数据点作为特征相似性最大的类簇中心所在的类簇中的数据点, 表示特征相似性最大的类簇中心的投票率;
[0017] 以此类推,将参数空间中每个数据点划分到对应的类簇中心所在的类簇中,作为参数空间中的类簇。
[0018] 优选地,所述根据每种k值下参数空间中的类簇获得每种k值下原始空间中的类簇,包括的具体步骤如下:
[0019] 根据参数空间中的类簇获得原始空间中的类簇,给参数空间中的每个类簇中的所有数据点投票的所有原始空间中的数据点组成原始空间中的一个类簇;
[0020] 利用箱线图去除原始空间中的每个类簇中的异常点,通过计算数据点与每个类簇的几何中心的距离,将数据点划分到距离最近的类簇中。
[0021] 优选地,所述每种k值的合适程度的计算公式为:
[0022]
[0023] 式中, 表示k值的合适程度,k值取遍[3,10]内的所有整数,表示k个类簇中第i个类簇中所有数据点到该类簇的基准线的距离的均值, 表示k个类簇中第i个类簇中数据点的数量, 表示k个类簇中第i个类簇的最小外接矩形的面积,和 分别表示k个类簇中第i个类簇的最小外接矩形的长边和短边,长边是最小外接矩形的两条边中长度最长的边,短边是最小外接矩形的两条边中长度最短的边。
[0024] 优选地,所述类簇的基准线的获取方法具体如下:
[0025] 获得每个类簇的最小外接矩形,过每个类簇的最小外接矩形的几何中心作一条和最小外接矩形的长边平行的直线,作为类簇的基准线。
[0026] 优选地,所述将动态数据转化为参数空间中的数据点,包括的具体步骤如下:
[0027] 切割过程中的动态数据包括动力输出数据和振动数据两个维度,动力输出数据和振动数据组成原始空间,将每个时刻的动力输出数据和振动数据转换为原始空间中的数据点,通过霍夫变换将原始空间中的数据点转换为参数空间中的数据点,参数空间是由极角和极径 组成的。
[0028] 本发明的技术方案的有益效果是:本发明根据切割过程中正常的动态数据具有局部线性相关性的特征,将切割过程中动态数据转换到霍夫变换中进行聚类,通过限制数据点与簇类中心在极角和极径上的差异,获得霍夫空间中的类簇,使得根据霍夫空间中的类簇获得原始空间中分布状态为椭圆形的类簇,将异常动态数据和正常动态数据分开,提高异常动态数据的识别准确性,进而提高切割异常检测的准确性。

附图说明

[0029] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0030] 图1为本发明的一种木工打磨过程中的切割异常检测方法的步骤流程图。

具体实施方式

[0031] 为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种木工打磨过程中的切割异常检测方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
[0032] 除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
[0033] 下面结合附图具体的说明本发明所提供的一种木工打磨过程中的切割异常检测方法的具体方案。
[0034] 现有技术是通过对切割过程中的动态数据进行聚类,根据聚类结果识别异常数据,进而实现切割异常检测。由于切割过程中正常的动态数据具有局部线性相关性,因此切割过程中的正常的动态数据在原始空间中的分布状态为椭圆形,而K均值聚类算法适用于对分布状态为圆形的正常数据进行聚类;由于切割过程中的部分异常的动态数据和正常的动态数据混在一起时的整体分布状态为圆形,如果在原始空间中通过K均值聚类算法对切割过程中的动态数据进行聚类,会将部分异常的动态数据和正常的动态数据划分为一个类簇,进而导致识别动态数据中的异常数据时,会将部分异常的动态数据错误的识别为正常的动态数据,会导致异常的动态数据的识别结果不准确,进而导致切割异常检测结果不准确,所以在原始空间中进行聚类无法准确地识别切割过程中异常的动态数据。
[0035] 由于切割过程中正常的动态数据具有局部线性相关性,因此正常的动态数据在原始空间中的分布状态是由若干个平行的直线组成的,相应的在霍夫空间中的分布状态是一些特征相近的高投票的数据点,因此,本发明实施例通过切割过程中正常的动态数据在霍夫变换中的特征,根据数据点在参数空间的特征,进而获得在原始空间中的类簇,使聚类结果的分布状态为椭圆形,进而准确地识别异常数据,使切割异常检测更加准确。
[0036] 请参阅图1,其示出了本发明一个实施例提供的一种木工打磨过程中的切割异常检测方法的步骤流程图,该方法包括以下步骤:
[0037] S001,采集切割过程中的动态数据。
[0038] 需要说明的是,切割过程中的动态数据是指振动数据和动力输出数据:木工切割设备在操作中产生的振动数据通过振动传感器采集,振动数据常被用于分析切割设备的稳定性和平衡性,以及检测是否存在异常振动;切割设备在操作中的动力输出数据通过功率传感器,动力输出数据被用于评估切割设备的工作效率和能耗,并检测是否存在异常的动力输出情况。
[0039] 在本实施例中,切割过程中的动态数据包括动力输出数据和振动数据两个维度,动力输出数据和振动数据组成原始空间,将一分钟内每个时刻的木工切割设备在操作中产生的动力输出数据和振动数据转换为原始空间中的数据点。
[0040] S002,将原始空间中的数据点转换为参数空间中的数据点,根据投票率和k值设置类簇中心,计算参数空间中每个数据点与每个类簇中心的特征相似性,根据每个数据点与每个类簇中心的投票率的差异以及特征相似性,获得参数空间中的类簇。
[0041] 需要说明的是,正常情况下,木工切割设备在操作中产生的动力输出数据越大,则振动数据越大,两者呈正向线性关系,且动力输出数据在不同的范围内,动力输出数据与振动数据的正向线性关系的程度不同。
[0042] 在本实施例中,通过霍夫变换将原始空间中的数据点转换为参数空间中的数据点,参数空间是由极角 和极径 组成的,每个数据点除了有对应的极角和极径外,还有投票率。
[0043] 需要说明的是,由于切割过程中的动态数据具有局部线性相关性,因此正常的动态数据在原始空间中的分布状态是由若干个平行的直线组成的,若干个平行的直线在参数空间中表现为若干个投票率较高的数据点,这些数据点对应的极角 相同或相近,且这些数据点对应的极径 在小范围内分布,基于此,根据极角的投票率选择类簇中心,根据极角和极径的相似性计算数据点与类簇中心的特征相似性,进而实现聚类。
[0044] 在本实施例中,将每种目标极角对应的所有数据点中,投票率最大的数据点作为类簇中心,共获得k个簇类中心,目标极角是投票率最大的k种极角,每种极角的投票率是参数空间中每种极角对应的所有数据点的投票率之和。
[0045] 计算参数空间中每个数据点与每个类簇中心的特征相似性,具体计算公式为:
[0046]
[0047] 式中,表示数据点与类簇中心的特征相似性,和 分别表示数据点的极角和极径, 和 分别表示类簇中心的极角和极径, 表示以自然常数为底的指数函数,表示极角的误差允许范围,表示极径的误差允许范围,极角的误差允许范围和极径的误差允许范围分别用来限制属于同一个类簇的数据点的极角和极径的差异,在其他实施例中,实施人员可根据实际实施情况设置极角的误差允许范围和极径的误差允许范围,例如 ,。
[0048] 需要说明的是,为了使原始空间中获得的类簇是具有局部线性相关性的正常动态数据组成的,本实施例将极角 相同或相近且极径 在小范围内分布的若干个数据点聚为一类,因此,通过数据点与类簇中心之间极角的差异和极径的差异,判断数据点所属的类簇中心;数据点与类簇中心的极角的差异 越小,则数据点与类簇中心的特征相似性越大;数据点与类簇中心的极径的差异 越小,则数据点与类簇中心的特征相似性越大;同时由于要求数据点与类簇中心的极角相同或相近,为了保证实现该要求,通过数据点与类簇中心的极角的差异 调整极径的误差允许范围为 ,数据点与类簇中心的极角的差异 越大,调整后的极径的误差允许范围越小,根据调整后的极径的误差允许范围调整数据点与类簇中心的极径的差异为 ,则调整后的数据点与类簇中心的极径的差异越大,数据点与类簇中心的特征相似性越小。
[0049] 需要说明的是,聚类时除了要求数据点与每个类簇中心的特征相似性以外,还需要保证数据点与类簇中心的投票率相等或相近。
[0050] 对于参数空间中任意一个数据点,计算该数据点与每个类簇中心的特征相似性,将该数据点划分到特征相似性最大的类簇中心中,如果该数据点的投票率在范围内,将该数据点作为特征相似性最大的类簇中心所在的类簇中的数据点, 表示特征相似性最大的类簇中心的投票率。
[0051] 以此类推,将参数空间中每个数据点划分到对应的类簇中心所在的类簇中,作为参数空间中的类簇。
[0052] S003、根据每种k值下参数空间中的类簇获得每种k值下原始空间中的类簇,根据每种k值下原始空间中的所有类簇中的数据点分布情况,计算每种k值的合适程度,根据合适程度获得最佳k值,根据最佳k值获得切割过程中的动态数据的最佳聚类结果。
[0053] 在本实施例中,根据参数空间中的类簇获得原始空间中的类簇,给参数空间中的每个类簇中的所有数据点投票的所有原始空间中的数据点组成原始空间中的一个类簇。
[0054] 需要说明的是,由于参数空间中的一个数据点代表了原始空间中的一条直线,而原始空间中的一个数据点可能在原始空间中的多条直线上,因此原始空间中的一个数据点可能给参数空间中的多个数据点投票,进而原始空间中的一个数据点可能被划分到原始空间中的多个类簇中,因此,需要确定给参数空间中的多个数据点投票的原始空间中的数据点所属的类簇。
[0055] 在本实施例中,利用箱线图去除原始空间中的每个类簇中的异常点,通过计算数据点与每个类簇的几何中心的距离,将数据点划分到距离最近的类簇中。
[0056] 需要说明的是,类簇的数量k不同,则原始空间中的数据点的聚类结果不同,相应的切割异常检测的结果也不同,随着类簇的数量k的增大,原始空间中的数据点被划分的更加精细,每个类簇的聚合程度会逐渐提高,当类簇的数量k到达真实类簇数量时,再增加k值所得到的聚合程度反而会骤减,为了切割异常检测的准确性,需要提高聚类的准确性,因此,通过不同的类簇的数量k,将原始空间中的数据点划分为不同数量的类簇,进而计算每个类簇数量k值的合适程度。
[0057] 在本实施例中,根据原始空间中的k个类簇的数据点分布情况,计算每个k值的合适程度,具体计算公式为:
[0058]
[0059] 式中, 表示k值的合适程度,k值取遍[3,10]内的所有整数,表示k个类簇中第i个类簇中所有数据点到该类簇的基准线的距离的均值, 表示k个类簇中第i个类簇中数据点的数量, 表示k个类簇中第i个类簇的最小外接矩形的面积,和 分别表示k个类簇中第i个类簇的最小外接矩形的长边和短边,长边是最小外接矩形的两条边中长度最长的边,短边是最小外接矩形的两条边中长度最短的边。
[0060] 获得每个类簇的最小外接矩形,过每个类簇的最小外接矩形的几何中心作一条和最小外接矩形的长边平行的直线,作为类簇的基准线。
[0061] 需要说明的是,类簇的基准线是类簇中数据点应该集中分布的位置,由于切割过程中的动态数据具有局部线性相关性,因此原始空间中正常的动态数据分布在类簇的基准线附近,且类簇中数据点到该类簇的基准线的距离越小,则原始空间中正常的动态数据越分布在类簇的基准线附近,聚类效果越好; 表征类簇中数据点分布的密度,该值越大,则聚类效果越好;表征类簇中数据点分布的线性程度,该值越大,类簇中数据点分布的线性程度越大,则聚类效果越好。
[0062] 将合适程度最大的k值作为最佳k值,根据最佳k值获得切割过程中的动态数据的最佳聚类结果。
[0063] S004、根据最佳聚类结果获得切割过程中的动态数据中的异常数据点,实现切割异常检测。
[0064] 根据切割过程中的动态数据的最佳聚类结果获得异常数据点,将不属于任何一个类簇的数据点作为异常数据点,实现切割异常检测。
[0065] 本发明根据切割过程中正常的动态数据具有局部线性相关性的特征,将切割过程中动态数据转换到霍夫变换中进行聚类,通过限制数据点与簇类中心在极角和极径上的差异,获得霍夫空间中的类簇,使得根据霍夫空间中的类簇获得原始空间中分布状态为椭圆形的类簇,将异常动态数据和正常动态数据分开,提高异常动态数据的识别准确性,进而提高切割异常检测的准确性。
[0066] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。