一种数据驱动的SMT生产线上SPI缺陷类别智能识别方法转让专利

申请号 : CN201811556806.3

文献号 : CN109657718B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 朱海平孙志娟李晓涛何非关辉扆书樵李朝晖金炯华吴淑敏倪明堂张卫平黄培

申请人 : 广东省智能机器人研究院

摘要 :

一种数据驱动的SMT生产线上SPI缺陷类别智能识别方法,第一阶段:SPI历史质量检测数据集聚类处理,对所得K类训练数据集采用Bagging算法独立抽样20次,利用BP神经网络模型对K类共计K×20组训练集分别训练独立缺陷分类器,得到K×20个独立缺陷分类器构成分类器集合;第二阶段:SPI在线检测6个锡膏印刷质量参数,对比历史训练数据集对该检测记录“T”进行归类,确定实时检测点属于K类训练数据集中的哪一个类别,当T恰好处于两类或多类训练数据集的边界上,则同时从多类K类训练数据集以约等量选择总计20个独立缺陷分类器进行检测记录T的类别判定;将T输入各独立缺陷分类器对输出结果按照集成规则进行集成预测,判定缺陷类别。本发明降低了人在自动检测中的作用,提高在线实时检测效率与准确度。

权利要求 :

1.一种数据驱动的SMT生产线上SPI缺陷类别智能识别方法,用于实现锡膏印刷质量在线自动检测与预测,包括以下步骤:步骤一:训练SPI历史质量检测记录容量确定,总数据量≥10000条,该总数据量中包含各类的缺陷类别记录信息;

步骤二:数据标准化处理;

步骤三:K‑means聚类,将SPI历史质量检测记录进行K组划分,形成K类训练数据集,K取值≤7;

步骤四:对K类训练数据集采用Bagging算法抽样20次,每次样本容量为该组内数据量的70%‑80%;

步骤五:利用BP神经网络模型对K组共计K×20组训练集分类训练独立缺陷分类器,得到K×20个独立缺陷分类器构成分类器集合;

步骤六:SPI在线检测6个锡膏印刷质量参数,按照欧氏空间距离最近法对检测记录“T”进行归类,确定实时检测点属于K类训练数据集中的哪一个类别,当T恰好处于两类K类训练数据集或多类K类训练数据集的边界上,则同时从多类K类训练数据集以约等量选择总计20个独立缺陷分类器进行检测记录T的类别判定,锡膏印刷质量参数包括锡膏面积、体积、高度、X偏移量、Y偏移量和拉尖;

步骤七:选择T所属类别中的20个独立缺陷分类器,将T输入各独立缺陷分类器对输出结果进行集成预测,判定缺陷类别。

2.根据权利要求1所述数据驱动的SMT生产线上SPI缺陷类别智能识别方法,其特征在于,所述步骤六的SPI在线检测6个锡膏印刷质量参数即锡膏面积、体积、高度、X偏移量、Y偏移量、拉尖6个项同时参与缺陷类别判定,充分考虑检测参数间的相关性。

3.根据权利要求1所述数据驱动的SMT生产线上SPI缺陷类别智能识别方法,其特征在于,所述步骤七的集成预测具体包括以下方法:动态检测记录T的类别划分采用欧氏空间距离最近法,得到的检测结果归一化后计算在多维线性空间中当前点到所述K类训练数据集的各类别聚类中心点的欧氏距离,选择欧氏距离最近的类别中20个独立缺陷分类器进行缺陷类别集成预测,当该检测点恰好处于两类别或多类别训练数据集的边界上时,以等量原则从各类训练数据集中随机抽取独立缺陷分类器构成20个独立分类器进行集成缺陷类别预测,集成预测规则如下:当:1)20个独立缺陷分类器全部输出为0,则确定为无缺陷;2)输出有一个判定缺陷时如果同属该组的独立缺陷分类器存在三个以上分类器输出结果为0,则该输出判定为无缺陷;3)当输出有2个及以上判别有缺陷并输出相应的缺陷类别时进行报警,并输出响应类别识别结果,CN表示集成的独立缺陷分类器集合,A、B、C、D、E表示数据集最初的各组分类编号。

4.根据权利要求2所述数据驱动的SMT生产线上SPI缺陷类别智能识别方法,其特征在于,所述训练数据集划分与独立缺陷分类器训练:具体表现为:

1)设定K=N,Kmeans聚类将原始数据集进行N类划分,将相似检测结果划分为一类提高各类别内缺陷分类器训练的有效性准确性;

2)对第N组总共m个数据有放回重复取样,取出一组数量为70%*m的样品数据集,完成

20次取样,每组得到20个训练数据集;

对每组得到的20个训练数据集分别利用BP神经网络模型训练得到20个独立缺陷分类器,最终得到K×20的独立缺陷分类器集合,完成弱分类器训练,进而按照权利要求3中方法集成预测实现强分类器效果。

5.根据权利要求3所述数据驱动的SMT生产线上SPI缺陷类别智能识别方法,其特征在于,所述步骤三的聚类处理具体包括以下步骤:设定所有样本点集合W,初始类别数C=1,聚类总类别数K,计算所有样本点的方差以及所有样本点的平均距离,样本点距离公式:

意样本点到其他多有样本点之间的平均距离:

任意样本点的方差值:

所有样本点的平均距离:

找出样本点集合W中方差最小的样本点作为聚类中心Cc;

以聚类中心Cc为圆心,所述样本点的平均距离为半径画圆,找出聚类中心Cc数据集Wc,C=C+1,W=W‑Wc;

遍历各个样本点,查看当前的类别数C是否小于总类别数K;

若小于,返回重新在样本点集合中找出方差最小的样本点;若C大于等于K,则已经遍历完成,找出样本点集合W中方差最小点作为第K类聚类中心,得到的初始聚类中心为C1、C2…Ck;

将空间内非聚类中心的样本点按照欧氏距离最近法分配给K个类别,计算每个类别中所有数据点的平均距离作为下一次的聚类中心,计算各个样本点到所在聚类中心的距离平方和,聚类后所有类别内数据点到聚类中心的平方和J(C):

判断聚类中心是否发生变化,若发生变化,则返回重新将空间内非聚类中心的样本点进行分配;若没有发生变化,则结束聚类,输出结果。

6.根据权利要求1所述数据驱动的SMT生产线上SPI缺陷类别智能识别方法,其特征在于,在生产线设备停机时间内,对离线模型的训练数据集进行更新,使用设定的期限内的历史检测记录数据重新训练,完成自动更新。

说明书 :

一种数据驱动的SMT生产线上SPI缺陷类别智能识别方法

技术领域

[0001] 本发明生产加工质量在线检测与预测领域,具体涉及一种数据驱动的SMT生产线上SPI 缺陷类别智能识别方法。

背景技术

[0002] 在智能制造中,质量在线检测与预测技术是提升质量管理能力、建设智能生产线 的关键技术之一。质量在线自动检测与预测的应用减少了人工检测操作,提高了质量 检测结果的一致性与稳定性、检测速度与检测结果的准确性,一定程度上避免误报、 漏报质量问题造成的时间和成本损失。随着科技不断创新、电子产品微型化的快速发 展对表面贴装技术(SMT,Surface Mount Technology)自动化与智能化提出更高要求, 其中,锡膏印刷的质量检测SPI(Solder Paste Inspection)技术通过3D‑SPI自动检 测技术检测焊盘上锡膏的体积、面积、高度、偏移及拉尖,并根据质量过程控制所设 定的各检测参数上下限进行质量结果识别,然而实际生产过程中对检测参数体积、高 度、面积、位置偏移等控制上下限的设定是操作工人按照经验来设定的,故而实际生 产中的误警率、漏报率都很高,传统过程质量控制方法的优化效果较差。
[0003] 随着数据挖掘技术、机器学习等方法的兴起,更智能的基于数据的智能质量预测 与控制方案被设计出来,这些方法可以有效利用质量在线检测的历史数据,充分学习 与挖掘检测数据与质量结果之间的相关关系,并以学习模型方式进行记录与展示,当 前该技术在在线检测与质量预测领域应用多集中在设备上,对SMT生产线的应用较少,SPI检测环节的质量识别仍然处于人工经验设定检测参数控制上下限的现状。

发明内容

[0004] 本发明要解决的技术问题是提供一种数据驱动的SMT生产线上SPI缺陷类别智能 识别方法,降低了人在自动检测中的作用,提高在线实时检测效率与准确度。
[0005] 为了解决上述技术问题,本发明采取以下技术方案:
[0006] 一种SMT生产线上SPI缺陷类别智能识别方法,用于实现锡膏印刷质量在线自动 检测与预测,包括以下步骤:
[0007] 步骤一:训练SPI历史质量检测记录容量确定,总数据量≥10000条,该总数据量 中包含各类的缺陷类别记录信息;
[0008] 步骤二:数据标准化处理;
[0009] 步骤三:K‑means聚类,将SPI历史质量检测数据集进行K组划分,形成K类训 练数据集,K取值≤7;
[0010] 步骤四:对K类训练数据集采用Bagging算法抽样20次,每次样本容量为该组内 数据量的70%‑80%;
[0011] 步骤五:利用BP神经网络模型对K组共计K×20组训练集分类训练独立缺陷分类 器,得到K×20个独立缺陷分类器构成分类器集合;
[0012] 步骤六:SPI在线检测6个锡膏印刷质量参数,按照欧氏空间距离最近法对检测记 录“T”进行归类,确定实时检测点属于K类训练数据集中的哪一个类别,当T恰好处 于两类K类训练数据集或多类K类训练数据集的边界上,则同时从多类K类训练数据 集以约等量选择总计20个独立缺陷分类器进行检测记录T的类别判定,锡膏印刷质量 参数包括面积、体积、高度、X偏移量、Y偏移量、拉尖;
[0013] 步骤七:选择T所属类别中的20个独立缺陷分类器,将T输入各独立缺陷分类器 对输出结果进行集成预测,判定缺陷类别。
[0014] 所述步骤七的集成预测具体包括以下方法:
[0015] 动态检测记录T的类别划分采用欧氏空间距离最近法,即该检测结果归一化后计 算在多维线性空间中当前点到所述K类训练数据集的各类别聚类中心点的欧氏距离, 选择欧氏距离最近的类别中20个独立缺陷分类器进行缺陷类别集成预测,当该检测点 恰好处于两类别或多类别训练数据集的边界上时,以等量原则从各类训练数据集中随 机抽取独立缺陷分类器构成20个独立分类器进行集成缺陷类别预测,集成预测规则如 下:
[0016]
[0017] 当:1)20个独立缺陷分类器全部输出为0,则确定为无缺陷;2)输出有一个判 定缺陷时如果同属该组的独立缺陷分类器存在三个以上分类器输出结果为0,则该输出 判定为无缺陷;3)当输出有2个及以上判别有缺陷并输出相应的缺陷类别时进行报警, 并输出响应类别识别结果,CN表示集成的独立缺陷分类器集合,A、B、C、D、E表示 数据集最初的各组分类编号。
[0018] 所述训练独立缺陷分类器的具体操作为:
[0019] 具体步骤为:
[0020] 设定K=N,对第N组总共m个数据有放回重复取样,取出一组数量为70%*m的样品 数据集,完成20次取样,每组得到20个训练数据集;
[0021] 对每组得到的20个训练数据集分别利用BP神经网络模型训练得到20个独立缺陷 分类器,最终得到K×20的独立缺陷分类器集合。
[0022] 所述步骤三的聚类处理具体包括以下步骤:
[0023] 设定所有样本点集合W,初始类别数C=1,聚类总类别数K,计算所有样本点的方 差以及所有样本点的平均距离,
[0024] 样本点距离公式:
[0025] 意样本点到其他多有样本点之间的平均距离:
[0026] 任意样本点的方差值:
[0027] 所有样本点的平均距离:
[0028]
[0029] 找出样本点集合W中方差最小的样本点作为聚类中心Cc;
[0030] 以聚类中心Cc为圆心,所述样本点的平均距离为半径画圆,找出聚类中心Cc数 据集Wc,C=C+1,W=W‑Wc;
[0031] 遍历各个样本点,查看当前的类别数C是否小于总类别数K;
[0032] 若小于,返回重新在样本点集合中找出方差最小的样本点;若C大于等于K,则 已经遍历完成,找出样本点集合W中方差最小点作为第K类聚类中心,得到的初始聚 类中心为C1、C2…Ck;
[0033] 将空间内非聚类中心的样本点按照欧氏距离最近法分配给K个类别,[0034] 计算每个类别中所有数据点的平均距离作为下一次的聚类中心,计算各个样本点 到所在聚类中心的距离平方和,
[0035] 聚类后所有类别内数据点到聚类中心的平方和J(C):
[0036]
[0037]
[0038] 判断聚类中心是否发生变化,若发生变化,则返回重新将空间内非聚类中心的样 本点进行分配;若没有发生变化,则结束聚类,输出结果。
[0039] 所述数据标准化处理具体为:
[0040] 对数据采用0‑1标准化,将各检测参数的检测结果处理到[0,1]:
[0041]
[0042] 其中,max为样本数据的最大值,min为样本数据的最小值。
[0043] 所述在生产线设备停机时间内,可对离线模型的训练数据集进行更新,使用设定 的期限内的历史检测记录数据重新训练,完成自动更新。
[0044] 本发明的有益效果如下:
[0045] 1)降低甚至取消人在“SPI在线检测与缺陷类别判定”中的参与,减少人为经验 造成的参数设定失误,提高检测效率、缺陷类别智能分类与分类准确性;
[0046] 2)锡膏检测各检测参数同时参与缺陷类别判定,更符合实际,克服SPC对单 变量控制的不足;
[0047] 3)利用历史数据对分类器模型进行更新,可以更多的将反应当前设备及生产状态 的检测数据应用在模型中,实现自主自动更新,及时追溯产品质量趋势变化。

附图说明

[0048] 图1为本发明基于神经网络集成的SPI缺陷类别判定模型结构示意图;
[0049] 图2为本发明的改进的K‑means聚类算法流程图;
[0050] 图3为本发明聚类处理后得到的聚类平方和和聚类类别数的J‑N曲线图。

具体实施方式

[0051] 为能进一步了解本发明的特征、技术手段以及所达到的具体目的、功能,下面结 合附图与具体实施方式对本发明作进一步详细描述。
[0052] 某SMT生产线上SPI检测的单条检测数据记录格式与质量结果如表1,锡膏印刷的 缺陷类别及编号如表2,上述本发明的目的就是在根据3D‑SPI检测得到的单条检测记 录数据判定锡膏印刷锡膏体缺陷与否和缺陷类别进行较准确的自动判断。本示例中所 用质量检测数据18703条,包含“32”条无锡膏和“4096”条桥接缺陷独立出现的情 况。具体情况如表3,按照本发明所示的流程,对18703进行学习与模型验证。具体操 作步骤如下:表1五条示例SPI检测记录
[0053]
[0054] 表2缺陷类别及编号
[0055]
[0056] 表3历史记录数据信息
[0057]
[0058] 本发明具体揭示了一种SMT生产线上SPI缺陷类别智能识别方法,具有两部分, 一是基于SPI历史质量检测数据的离线缺陷分类器集合训练;2)SPI在线检测动态缺 陷类别识别流程。具体包括以下步骤:
[0059] 步骤一:训练SPI历史质量检测记录容量确定,总数据量≥10000条,该总数据量 中包含各类的缺陷类别记录信息。历史积累的SPI质量检测数据有很多,需选取一定 容量M的数据作为样本进行建模,样本容量调节基本原则是M≥10000条,即至少有 10000条SPI质量检测结果记录,同时这些样本中需要有包含各种缺陷类别的质量数据 记录,保证历史质量检测记录具有足够的参考性。
[0060] 步骤二:数据标准化处理,即SPI检测质量数据进行预处理,锡膏检测到焊盘上 锡膏的面积、体积、高度、偏移与拉尖,6个参数量纲不同,为便于后续处理,对SPI 质量数据进行标准化操作,采用0‑1标准化,将各检测参数的检测结果处理到[0,1]:
[0061]
[0062] 其中,max为样本数据的最大值,min为样本数据的最小值。
[0063] 步骤三:K‑means聚类,将SPI历史质量检测数据集进行K组划分,形成K类训 练数据集,K取值≤7。
[0064] 步骤四:对K类训练数据集采用Bagging算法抽样20次,每次样本容量为该组内 数据量的70%‑100%。
[0065] 步骤五:利用BP神经网络模型对K组共计K×20组训练集分类训练独立缺陷分类 器,得到K×20个独立缺陷分类器构成分类器集合。
[0066] 步骤六:SPI在线检测6个锡膏印刷质量参数,按照欧氏空间距离最近法对检测记 录“T”进行归类,确定实时检测点属于K类训练数据集中的哪一个类别,当T恰好处 于两类K类训练数据集或多类K类训练数据集的边界上,则同时从多类K类训练数据 集以约等量选择总计20个独立缺陷分类器进行检测记录T的类别判定,锡膏印刷质量 参数包括面积、体积、高度、X偏移量、Y偏移量、拉尖。
[0067] 步骤七:选择T所属类别中的20个独立缺陷分类器,将T输入各独立缺陷分类器 对输出结果进行集成预测,判定缺陷类别。采用多个独立的弱分类器进行集成预测, 不是使用单一分类器,提高预测的准确度与泛化性。
[0068] 在以上步骤中,离线分类器集合训练首先对SPI历史质量数据集进行聚类处理得 到K类划分,将相似结果划分在同一类别,细分训练集提高了基于该训练集所建立的 分类器模型的准确性,进而分别对K类训练集采用Bagging算法完成20次抽样,再经 BP神经网络模型训练得到K×20个独立缺陷分类器组成的集合,所得各分类器属于弱 分类器,在缺陷类别判定时通过合理筛选与集成预测达到强分类器效果。通过对历史 数据集的分析,从而避免人为经验的判定,提高准确率。将等效弱分类器进行合理集 成则得到一个准去性好同时泛化性高的强分类器,避免拟合不足与过拟合现象的产生, 且操作简单效果良好。
[0069] 所述步骤七的集成预测具体包括以下方法:
[0070] 动态检测记录T的类别划分采用欧氏空间距离最近法,即该检测结果归一化后计 算在多维线性空间中当前点到所述K类训练数据集的各类别聚类中心点的欧氏距离, 选择欧氏距离最近的类别中20个独立缺陷分类器进行缺陷类别集成预测,当该检测点 恰好处于两类别或多类别训练数据集的边界上时,以等量原则从各类训练数据集中随 机抽取独立缺陷分类器构成20个独立分类器进行集成缺陷类别预测,集成预测规则如 下:
[0071]
[0072] 当:1)20个独立缺陷分类器全部输出为0,则确定为无缺陷;2)输出有一个判 定缺陷时如果同属该组的独立缺陷分类器存在三个以上分类器输出结果为0,则该输出 判定为无缺陷;3)当输出有2个及以上判别有缺陷并输出相应的缺陷类别时进行报警, 并输出响应类别识别结果,CN表示集成的独立缺陷分类器集合,A、B、C、D、E表示 数据集最初的各组分类编号。
[0073] 所述训练独立缺陷分类器的具体操作为:
[0074] 具体步骤为:
[0075] 设定K=N,对第K组总共m个数据有放回重复取样,取出一组数量为70%*m的样品 数据集,完成20次取样,每组得到20个训练数据集;
[0076] 对每组得到的20个训练数据集分别利用BP神经网络模型训练得到20个独立缺陷 分类器,最终得到K×20的独立缺陷分类器集合。
[0077] 所述步骤三的聚类处理具体包括以下步骤:
[0078] 设定所有样本点集合W,初始类别数C=1,聚类总类别数K,计算所有样本点的方 差以及所有样本点的平均距离,
[0079] 样本点距离公式:
[0080] 意样本点到其他多有样本点之间的平均距离:
[0081] 任意样本点的方差值:
[0082] 所有样本点的平均距离:
[0083]
[0084] 找出样本点集合W中方差最小的样本点作为聚类中心Cc;
[0085] 以聚类中心Cc为圆心,所述样本点的平均距离为半径画圆,找出聚类中心Cc数 据集Wc,C=C+1,W=W‑Wc;
[0086] 遍历各个样本点,查看当前的类别数C是否小于总类别数K;
[0087] 若小于,返回重新在样本点集合中找出方差最小的样本点;若C大于等于K,则 已经遍历完成,找出样本点集合W中方差最小点作为第K类聚类中心,得到的初始聚 类中心为C1、C2…Ck;
[0088] 将空间内非聚类中心的样本点按照欧氏距离最近法分配给K个类别,[0089] 计算每个类别中所有数据点的平均距离作为下一次的聚类中心,计算各个样本点 到所在聚类中心的距离平方和,
[0090] 聚类后所有类别内数据点到聚类中心的平方和J(C):
[0091]
[0092]
[0093] 判断聚类中心是否发生变化,若发生变化,则返回重新将空间内非聚类中心的样 本点进行分配;若没有发生变化,则结束聚类,输出结果。
[0094] K‑means算法需要提供聚成的类别数目K,而事先并不知需要聚成的类别,但是知 道随着聚类数目的增加J(C)逐渐减小,从给定K=1,逐一增加K值进行聚类,考察J(C)变 小速度减缓时对应K值为最佳聚类数目。原则上按照聚类数目K最大不超过7类进行 处理。
[0095] 所述在生产线设备停机时间内,可对离线模型的训练数据集进行更新,使用设定 的期限内的历史检测记录数据重新训练,完成自动更新。
[0096] 在本方法的具体实施当中,
[0097] 步骤一,18703条数据中随机抽取993条正常数据与6条缺陷数据1条报警数据作 为测试数据集模拟在线实时检测数据对模型进行验证,其他数据全部作为训练数据集 进行模型训练。
[0098] 步骤二,数据标准化处理,将各检测参数化为[0,1]区间,统一量纲便于建模分析。
[0099] 步骤三,依次给出聚类组数K=1,2,…7;分别对训练数据集进行划分,得到J‑N曲 线如图3示,取曲线上J下降速度第一次减慢的点K=5为聚类数目,聚类结果如表5。
[0100] 表5五组训练数据集聚类结果
[0101]
[0102] 步骤四:Bagging算法对K=N组进行20次重复抽样,每次抽样样本容量为该组组 内数据总量70%,统计分析重复抽样中会有1/3左右数据没有被抽到用于模型训练,则 该部分数据用于对组内独立分类器训练效果的检验。
[0103] 步骤五:对5×20组样本进行BP神经网络训练,神经网络模型训练参数如表6, 最终得到5×20个独立缺陷分类模型,并利用各组未被抽样抽中的数据对该组的独立 分类器训练效果进行测试,对应各组独立分类器模型训练结果的如表7。
[0104] 表6BP神经网络训练参数
[0105]
[0106] 表7分类器训练结果表
[0107]
[0108] 由聚类处理结果分析可知,在A、D两聚类组中,不存在缺陷数据,故认为该组拟 训练(并不进行训练,假设已经训练好20个模型)的20个独立分类器的输出全部为0, 即不存在缺陷问题。B、C、E三组中每组数据训练20个分类器模型;进行数据的输入、 模型训练与测试,以训练精度和训练过程中MES误差曲线参考选择训练效果较好的分 类器,平均每个独立分类器训练3次即可得到表现良好的分类器。最终得到5个聚类 组内分别训练的20个独立分类器,形成5×20大小的独立分类器集合,是动态预测过 程中选择分类器进行集成的基础。
[0109] 步骤六:在线检测数据动态划分,对预留的容量为1000的测试数据进行所属K组 数据类别的划分。
[0110] 步骤七:1000个测试数据中的一个N为例,假使N属于组别B,则分别将该数据 输入组别B的20个独立分类器,根据20个分类器的输出结果进行缺陷与否及其类别 判定,根据设定好的集成判定规则进行判定。
[0111] 需要说明的是,以上仅为本发明的优选实施例而已,并不用于限制本发明,尽管 参照实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对 前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,但 是凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在 本发明的保护范围之内。