一种基于AR和随机森林模型的故障诊断系统及方法转让专利

申请号 : CN202011202229.5

文献号 : CN112329341B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 马玲玉苑忠亮陈益飞孙伟

申请人 : 智昌科技集团股份有限公司

摘要 :

本发明提供一种基于AR和随机森林模型的故障诊断系统及方法,方法包括以下步骤:数据采集模块采集工业机器人的实时加速度值数据,并将采集到的数据存储至数据存储模块;数据分析模块一方面利用数据存储模块中存储的工业机器人的加速组值提取AR模型的特征值,建立并训练随机森林模型;另一方面根据数据采集模块采集的工业机器人的实时加速度值提取AR模型的特征值;故障诊断模块根据数据分析模块已训练好的随机森林模型,预测工业机器人的运行故障,并将诊断结果发送给工作人员,通过对历史数据进行特征提取,构建模型,使分类模型具有通用性且提高了故障诊断的准确率;每次对特征值用已构建好的随机森林模型进行预测,提高了实时故障预测的效率。

权利要求 :

1.一种基于AR和随机森林模型的故障诊断系统,其特征在于,包括:数据采集模块,用以采集工业机器人的实时加速度值;

数据存储模块,用以存储所述数据采集模块采集的工业机器人的加速度值;

数据分析模块包括离线数据建模单元和实时数据评估单元,其中,离线数据建模单元利用所述数据存储模块中存储的工业机器人的历史加速度值数据提取AR模型的特征值,建立并训练随机森林模型;实时数据评估单元根据所述数据采集模块采集的工业机器人的实时加速度值数据提取AR模型的特征值;

故障诊断模块,根据所述数据分析模块已训练好的所述随机森林模型,通过对数据采集模块采集的实时加速度值数据提取的AR模型的特征值进行判断,预测工业机器人的运行故障,诊断出当前工业机器人的运行状态是运行正常还是有故障;

还包括人机交互平台,用以将所述故障诊断模块的诊断结果发送给工作人员;

所述数据采集模块包括振动传感器,所述振动传感器安装于工业机器人机械手的机垛上,用以采集工业机器人的实时加速度值数据;

所述数据采集模块每次采集的包含一个运行周期的总的数量值,其中,采集频率1点/ms,每次计算量为1000个点,每次的计算量包含机械手的一个运动周期,包括采集80组正常状态下振动传感器获取的加速度值,采集80组有故障情况下的振动传感器获取的加速度值;

其中,所述提取AR模型的特征值包括:

确定AR模型参数的阶数:对采集的正常加速度值数据80组1000个数和故障加速度值数据80组1000个数分别进行拟合,并使用最小二乘法得到N个参数值,当每组之间对应的参数值N达到7时变化范围不超过5%,确定AR模型参数的阶数为7;

获得AR模型参数:使用7阶AR模型获得80组正常加速度值数据、80组故障加速度值数据,每组数据7个参数;

参数寻优:针对上述7个参数,通过对每组数据求方差共获得160组方差,对160组方差差值进行排序,得到差值排名前两个的特征,对上述特征进行特征标准化,数据降维,最后得到具有可分行两个特征值。

2.根据权利要求1所述的故障诊断系统的一种基于AR和随机森林模型的故障诊断方法,其特征在于,包括以下步骤:数据采集模块采集工业机器人的实时加速度值数据,并将所采集到的数据值存储至数据存储模块;

数据分析模块一方面利用所述数据存储模块中存储的工业机器人的历史加速组值数据提取AR模型的特征值,建立并训练随机森林模型;另一方面根据所述数据采集模块采集的工业机器人的实时加速度值数据提取AR模型的特征值;

故障诊断模块根据所述数据分析模块已训练好的所述随机森林模型,通过对数据采集模块采集的实时加速度值数据提取的AR模型的特征值进行判断,预测工业机器人的运行故障,诊断出当前工业机器人的运行状态是运行正常还是有故障,并将诊断结果发送给工作人员。

3.根据权利要求2所述的一种基于AR和随机森林模型的故障诊断方法,其特征在于,建立并训练所述随机森林模型包括以下步骤:确定可选参数值;

确定随机森林模型的训练方式;

得到最优结果与模型参数集;

保存训练好的随机森林模型。

说明书 :

一种基于AR和随机森林模型的故障诊断系统及方法

技术领域

[0001] 本发明涉及故障判断与处理技术领域,尤其涉及一种基于AR和随机森林模型的故障诊断系统及方法。

背景技术

[0002] 随着现代科学技术的发展,工业机器人正朝着复杂化、综合化和智能化的方向发展,在制造企业中发挥着越来越重要的作用。工业机器人的运行状况将直接或间接得影响企业的生产效率,因此对工业机器人的运行故障及时诊断,可以使企业及时了解工业机器人的实际运行状态,根据诊断结果及时安排维修,这样可以最大限度的降低维修成本,减少工业机器人损坏,保证工业机器人运行状态良好、延长使用寿命。
[0003] 现有的机器人运行故障诊断方法,要么是通过有经验的技术人员,现场观察后对工业机器人进行评分,这种诊断方式主观因素较强,无法精确获取工业机器人运行时的振动信号,不能准确的评价出工业机器人的运行状态;要么通过获取工业机器人振动信号进行评价的方法,根据工业机器人振动信号相关参数的值作为评分值,该方法每次对工业机器人进行评分都要进行大量的运算,且没有构建模型,导致单次的评分结果没有通用性且出现误判的概率较大,对工业机器人后续的工作产生不良影响。

发明内容

[0004] 本发明为克服通过有经验技术人员现场观察工业机器人运行状况时主观因素较强,无法精确获取工业机器人运行状态和通过获取工业机器人振动信号相关参数的方法需要进行大量运算且出现误判概率大的问题,提出了一种基于AR和随机森林模型的故障诊断系统及方法,通过对大量历史数据进行特征提取并构建模型,使该分类模型具有通用性且准确率较高,对特征值用已构建好的模型进行预测,大大提高了实时预测效率。
[0005] 为达到上述目的,本发明的技术方案具体是这样实现的:
[0006] 本发明一方面公开一种基于AR和随机森林模型的故障诊断系统,包括数据采集模块、数据存储模块、数据分析模块和故障诊断模块,其中,数据采集模块用以采集工业机器人的实时加速度值;数据存储模块用以存储所述数据采集模块采集的工业机器人的加速度值;数据分析模块利用所述数据存储模块中存储的工业机器人的加速度值数据提取AR模型的特征值,建立并训练随机森林模型;故障诊断模块根据所述数据分析模块已训练好的所述随机森林模型,预测工业机器人的运行故障。
[0007] 进一步地,一种基于AR和随机森林模型的故障诊断系统还包括人机交互平台,用以将所述故障诊断模块的诊断结果发送给工作人员。
[0008] 进一步地,所述数据分析模块包括离线数据建模单元和实时数据评估单元,其中,离线数据建模单元利用所述数据存储模块中存储的工业机器人的加速度值数据提取AR模型的特征值,建立并训练随机森林模型;实时数据评估单元根据所述数据采集模块采集的工业机器人的实时加速度值数据提取AR模型的特征值。
[0009] 进一步地,所述数据采集模块包括振动传感器,用以采集工业机器人的实时加速度值数据。
[0010] 本发明另一方面公开一种基于AR和随机森林模型的故障诊断方法,包括以下步骤:
[0011] 数据采集模块采集工业机器人的实时加速度值数据,并将所采集到的数据值存储至数据存储模块;
[0012] 数据分析模块一方面利用所述数据存储模块中存储的工业机器人的加速组值数据提取AR模型的特征值,建立并训练随机森林模型;另一方面根据所述数据采集模块采集的工业机器人的实时加速度值数据提取AR模型的特征值;
[0013] 故障诊断模块根据所述数据分析模块已训练好的所述随机森林模型,预测工业机器人的运行故障,并将诊断结果发送给工作人员。
[0014] 进一步地,所述提取AR模型的特征值包括以下步骤:
[0015] 确定AR模型参数的阶数;
[0016] 获得AR模型参数;
[0017] 参数寻优。
[0018] 进一步地,建立并训练所述随机森林模型包括以下步骤:
[0019] 确定可选参数值;
[0020] 确定随机森林模型的训练方式;
[0021] 得到最优结果与模型参数集;
[0022] 保存训练好的随机森林模型。
[0023] 进一步地,所述数据采集模块的采集频率为1点/ms,采集周期为一个运动周期。
[0024] 有益技术效果:
[0025] 1、本发明提出了一种基于AR和随机森林模型的故障诊断系统,包括数据采集模块、数据存储模块、数据分析模块和故障诊断模块,其中,数据采集模块用以采集工业机器人的实时加速度值;数据存储模块用以存储所述数据采集模块采集的工业机器人的加速度值;数据分析模块利用所述数据存储模块中存储的工业机器人的加速度值数据提取AR模型的特征值,建立并训练随机森林模型;故障诊断模块根据所述数据分析模块已训练好的所述随机森林模型,预测工业机器人的运行故障,该故障诊断系统提高了故障预测的准确率和效率;
[0026] 2、本发明提出了一种基于AR和随机森林模型的故障诊断方法,包括以下步骤:
[0027] 数据采集模块采集工业机器人的实时加速度值数据,并将所采集到的数据值存储至数据存储模块;
[0028] 数据分析模块一方面利用所述数据存储模块中存储的工业机器人的加速组值数据提取AR模型的特征值,建立并训练随机森林模型;另一方面根据所述数据采集模块采集的工业机器人的实时加速度值数据提取AR模型的特征值;
[0029] 故障诊断模块根据所述数据分析模块已训练好的所述随机森林模型,预测工业机器人的运行故障,并将诊断结果发送给工作人员,通过对历史数据进行特征提取,构建模型,使得该分类模型具有通用性且提高了故障诊断的准确率;每次对特征值用已构建好的随机森林模型进行预测,提高了实时故障预测的效率。

附图说明

[0030] 为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
[0031] 图1为本发明一种基于AR和随机森林模型的故障诊断系统的结构示意图;
[0032] 图2为本发明一种基于AR和随机森林模型的故障诊断方法示意图;
[0033] 图3为第一组有无故障数据时间序列图;
[0034] 图4为第二组有无故障数据时间序列图;
[0035] 图5为第三组有无故障数据时间序列图;
[0036] 图6为第四组有无故障数据时间序列图;
[0037] 图7为第五组有无故障数据时间序列图;
[0038] 图8为第六组有无故障数据时间序列图;
[0039] 图9为第七组有无故障数据时间序列图;
[0040] 图10为有无故障数据的三维特征图即原始AR模型参数特征值;
[0041] 图11为另一组有无故障数据的三维特征图即原始AR模型参数特征值;
[0042] 图12为选择第6个和第7个特征值,经特征标准化与PCA之后的散点图。
[0043] 其中,1‑无故障数据,2‑有故障数据。

具体实施方式

[0044] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
[0045] 下面结合附图对本发明的实施方式进行详细说明。
[0046] 首先需要说明的是,本发明中所使用的AR模型为自回归模型(Autoregressive model),是统计上一种处理时间序列的方法。
[0047] 本发明一方面公开一种基于AR和随机森林模型的故障诊断系统,参见图1,基于AR模型和随机森林的故障诊断系统,包括数据采集模块、数据存储模块、数据分析模块和故障诊断模块,其中,数据采集模块用以采集工业机器人的实时加速度值,具体地,数据采集模块包括振动传感器和工控机,所述振动传感器安装于工业机器人机械手的机垛上,用以采集工业机器人的实时加速度值,所述振动传感器通过485线连接工控机;数据存储模块用以存储所述数据采集模块采集的工业机器人的加速度值,优选地,所述数据存储模块为influxdb数据库;数据分析模块利用所述数据存储模块中存储的工业机器人的加速度值数据提取AR模型的特征值,建立并训练随机森林模型;故障诊断模块根据所述数据分析模块已训练好的所述随机森林模型,预测工业机器人的运行故障。
[0048] 本发明另一方面公开一种基于AR和随机森林模型的故障诊断方法,参见图2,具体包括以下步骤:
[0049] 数据采集模块采集工业机器人的实时加速度值数据,并将所采集到的数据值存储至数据存储模块;
[0050] 确定好每次采集的包含一个机器人运行周期的总的数量值,具体地,采集正常状态下振动传感器获取的加速度值,采集频率1ms一个点(1ms~2ms之间的数据自动过滤掉),每次计算量为1000个点,每次的计算量要包含机械手的一个运动周期,即共采集80组数据,并实时通过rabbitmq将数据存储到mysql数据库中;采集有故障情况下的振动传感器获取的加速度值,采集方式与正常状态下的采集方式相同,也共采集80组,并实时通过rabbitmq将数据存储到数据库中。
[0051] 数据分析模块一方面利用所述数据存储模块中存储的工业机器人的加速组值数据提取AR模型的特征值,建立并训练随机森林模型;另一方面根据所述数据采集模块采集的工业机器人的实时加速度值数据提取AR模型的特征值;
[0052] 具体地,包括以下步骤:
[0053] 提取AR模型的特征值,具体包括以下步骤:
[0054] 确定AR模型参数的阶数
[0055] 对采集的每个数用其前N个数进行拟合,得到N个参数,每次对采集到的每个数据进行上述操作,进而可以根据这些方程使用最小二乘法得到N个参数的值,即对超定方程组进行求解。具体地,共有正常数据80组1000个数,即会得到80组参数值,每组有N个数,每组之间对应的参数数值如果变化范围不超过5%,则认为N为AR模型参数的阶数,从数据5开始测试,依次增加1,实验中当阶数为7时,参数变化范围满足条件,确定阶数为7;同理对故障数据,也用上述方法,确定阶数也为7。
[0056] 获得AR模型参数
[0057] 使用自回归AR模型,阶数为7,共获得160组数据,每组7个值,其中前80组为正数据,后80组为负数据,时间序列的折线对比图,参见图3‑9。
[0058] 取其中的3个参数并绘制3维特征图,如图10和图11所示,发现AR模型参数是具有可分行的。
[0059] 参数寻优
[0060] 由于7个参数较多,且存在一些分类特征不明显的参数,故求得每组数据的方差,共160组方差,取正负数据的方差差值进行排序,得到差值排名前两个的特征,实验中为特征6与特征7,取好特征后,要对特征进行特征标准化,数据降维(PCA),最后得到的特征值具有明显的可分行,如图12所示。
[0061] 建立并训练随机森林模型,具体地,包括以下步骤:
[0062] 确定可选参数值
[0063] 随机森林模型有6大参数n_estimators、max_depth、min_samples_leaf、min_samples_split、max_features和criterion,其中,n_estimators表示弱学习器的最大个数,实验中,从50、100、150和200四个数中选择;bootstrap表示是否有放回的采样,取false或者true;criterion为特征选择标准,可选参数gini和entropy;max_features表示最大特征数,实验中取2;min_samples_leaf表示叶子节点最少样本数,可选参数设为1、2。
[0064] 确定训练森林模型方式
[0065] 使用Pipeline机制,实现对程序的流式化封装和管理,并可实现模型参数集在数据集上的重复使用,目的是方便参数的调节;使用GridSearchCV机制,输入参数有分类器类型,实验中选定为随机森林模型、160组的2维特征值、上述随机森林的参数列表、准确度评价标准“accuracy”、10折交叉验证的方式,即将数据平均分为10份,取一份数据作为测试数据,其余的数据作为训练数据,计算用训练数据训练好的模型对测试数据进行预测的准确率,,每次取10次不同的测试数据,获得10个准确率的结合,然后对其取平均,根据上述参数,通过GridSearchCV模块即可得出最优的结果与模型参数集:最佳效果为0.98,最优参数集为clf__criterion:'gini'、clf__max_features:2、clf__min_samples_leaf:2、clf__n_estimators:200。
[0066] 保存训练好的随机森林模型。
[0067] 同理对数据采集模块采集的工业机器人的实时加速度数据也进行AR模型特征值的提取。
[0068] 故障诊断模块根据所述数据分析模块已训练好的所述随机森林模型,预测工业机器人的运行故障,并将诊断结果发送给工作人员。
[0069] 具体地,使用上述步骤中建立并训练好的随机森林分类模型,通过对数据采集模块实时采集的工业机器人的加速度值数据的AR模型的特征值进行判断,诊断出工业机器人的运行状态,即目前是运行正常还是有故障,并通过界面显示出来,即振动传感器实时在线采集工业机器人的加速度值,通过rabbitmq传到服务器上进行存储及分析,每采集1000个,获取其7阶AR模型参数,用过滤方式取得前两个最优的参数,然后用已保存好的随机森林模型进行测试,如果连续1000次预测的结果中,75%为故障的,则认为该工业机器人存在问题。
[0070] 作为本发明的一个优选实施例,基于AR和随机森林模型的故障诊断系统还包括人机交互平台,用以将所述故障诊断模块的诊断结果发送给工作人员,具体地,故障诊断系统可通过界面,连接上数据库,实时查看采集的数据信息及预测的结果信息,故障诊断系统会对预测结果进行统计与监测,如预测出现故障问题,则将故障诊断结果以短信或邮件的方式及时通知工作人员。
[0071] 在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0072] 以上仅表达了本发明的实施方式,但并不能因此而理解为对本发明范围的限制。应当指出的是,对于本领域的一般技术人员来说,凡不脱离本发明构思的前提下,做出的改进,都应属于本发明的保护范围内。
[0073] 以上的实施例仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通工程技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明的权利要求书确定的保护范围内。