产品虚拟量测方法及系统及装置及介质转让专利

申请号 : CN202111178994.2

文献号 : CN113609790B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 不公告发明人

申请人 : 成都数联云算科技有限公司

摘要 :

本发明公开了产品虚拟量测方法及系统及装置及介质,涉及智能工业领域,本方法通过结合时序滑窗方法和差分方法来建立参数差与特性值差之间的相关关系,消除工艺设备机差对机器学习模型的负面影响,并实现了有效样本的扩充,进而建立的机器学习模型对异常特性值有较高的检测准确率。

权利要求 :

1.产品虚拟量测方法,其特征在于,所述方法包括:获得多个第一产品的第一历史加工数据,所述第一产品为已完成工艺加工和质量检测的产品;

对每个所述第一历史加工数据进行特征提取获得多个第一数据集;

对每个所述第一数据集进行时序滑窗处理,获得多个第一参考样本;

将多个所述第一数据集与对应的所述第一参考样本做差分处理获得多个第一差分样本;

基于多个所述第一差分样本获得第一训练集;

利用所述第一训练集训练第一模型获得第二模型,所述第一模型用于学习参数特征差和特性值差之间的关系;

获得待检测产品的实时加工数据,所述待检测产品为已完成工艺加工且未完成质量检测的产品;

对所述实时加工数据进行特征提取获得第二数据集;

对所述第二数据集进行时序滑窗处理获得第二参考样本,将所述第二数据集与所述第二参考样本做差分处理获得差分数据;

将所述差分数据输入所述第二模型,获得所述待检测产品与其对应的参考产品之间的特性值差;

其中,所述参数特征差为第一特征与第二特征的差值,所述第一特征为预设产品的工艺加工设备的设备参数的特征;所述第二特征为参考产品的工艺加工设备的设备参数的特征;所述特性值差为第一特性值与第二特性值的差值,所述第一特性值为所述预设产品的质量检测设备输出的特性值;所述第二特性值为所述参考产品的质量检测设备输出的特性值。

2.根据权利要求1所述的产品虚拟量测方法,其特征在于,所述方法包括:基于m个已完成工艺加工和质量检测的第一产品1至第一产品m,获得所述第一产品1至所述第一产品m对应的第一历史加工数据1至第一历史加工数据m,m为大于1的整数;

基于所述第一历史加工数据1至所述第一历史加工数据m,获得第一数据集1至第一数据集m;

对所述第一数据集1至所述第一数据集m进行时序滑窗处理获得对应的第一参考样本1至第一参考样本m;

将所述第一数据集1与所述第一参考样本1做差分处理获得第一差分样本1,...,将所述第一数据集m与所述第一参考样本m做差分处理获得第一差分样本m;

基于所述第一差分样本1至所述第一差分样本m获得第一训练集。

3.根据权利要求1所述的产品虚拟量测方法,其特征在于,所述方法包括:基于所述实时加工数据,获得所述待检测产品的工艺加工设备的设备参数的特征a;

对所述实时加工数据进行时序滑窗处理,获得所述待检测产品对应的参考产品a;

基于所述参考产品a的历史加工数据,获得所述参考产品的工艺加工设备的设备参数的特征b和特性值b;

基于所述特征a和所述特征b获得所述待检测产品的第一参数特征差;

将所述第一参数特征差输入所述第二模型获得所述待检测产品的第一特性值差;

基于所述第一特性值差和所述特性值b获得所述待检测产品的特性值预测结果。

4.根据权利要求1所述的产品虚拟量测方法,其特征在于,第一数据集c的获得方式为:从第一历史加工数据c中提取获得:加工产品c的工艺设备的第一监测参数、检测所述产品c的质量检测设备d的输出特性值和所述质量检测设备d检测所述产品c的第一检测时间,c为大于或等于1且小于或等于m的整数;

对所述第一监测参数进行特征提取获得特征数据;

基于所述第一检测时间、所述特征数据和所述输出特性值获得所述第一数据集。

5.根据权利要求4所述的产品虚拟量测方法,其特征在于,对所述第一监测参数进行特征提取获得时域特征数据以及频域特征数据。

6.根据权利要求4所述的产品虚拟量测方法,其特征在于,产品i对应的第一数据集i为: ,其中, 为所述产品i的第一检测时间,为所述产品i对应的特征数据, 为所述产品i对应的输出特性值,i大于或等于1且小于或等于m。

7.根据权利要求6所述的产品虚拟量测方法,其特征在于,所述第一训练集为T:其中, 至 为产品1至产品m的第一检测时间, 至 为产品1对应的特征数据, 为产品1对应的输出特性值; 至 为产品2对应的特征数据, 为产品2对应的输出特性值; 至 为产品m对应的特征数据, 为产品m对应的输出特性值。

8.根据权利要求7所述的产品虚拟量测方法,其特征在于,利用所述第一训练集训练所述第一模型获得所述第二模型,具体包括:基于所述第一数据集1至所述第一数据集m构建第一训练集;

基于预设大小的时间窗口将所述第一训练集拆分为若干个第二训练集;

将每个所述第二训练集做差分处理获得多个所述第一差分样本;

基于所有所述第一差分样本获得第三训练集;

利用所述第三训练集训练第一模型获得所述第二模型。

9.根据权利要求8所述的产品虚拟量测方法,其特征在于,所述时间窗口大小为w,将所述第一训练集拆分为k个第二训练集,分别为w1至wk;其中,w1包括e条样本,e大于或等于1且小于或等于m,对w1做差分处理获得p个所述第一差分样本, ,所述第一训练集T为[p,n+2]的二维数组。

10.根据权利要求9所述的产品虚拟量测方法,其特征在于,对w1做差分处理具体包括:以w1中的产品1的对应的特征数据和输出特性值为第一参考样本,使用产品2至产品e的对应的特征数据和输出特性值与所述第一参考样本的对应项做差,获得第一差分样本1;

以w1中的产品2的对应的特征数据和输出特性值为第二参考样本,使用产品3至产品e的对应的特征数据和输出特性值与所述第二参考样本的对应项做差获得第一差分样本2;

以w1中的产品e‑2的对应的特征数据和输出特性值为第e‑2参考样本,使用产品e‑1至产品e的对应的特征数据和输出特性值与所述第e‑2参考样本的对应项做差获得第一差分样本e‑2;

以w1中的产品e‑1的对应的特征数据和输出特性值为第e‑1参考样本,使用产品e的对应的特征数据和输出特性值与所述第e‑1参考样本的对应项做差获得第一差分样本e‑1。

11.根据权利要求8所述的产品虚拟量测方法,其特征在于,所述方法包括:对所述第三训练集进行特征筛选获得第四训练集;

利用所述第四训练集训练第一模型获得所述第二模型。

12.根据权利要求11所述的产品虚拟量测方法,其特征在于,基于pearson相关系数或kendall相关系数对所述第三训练集进行特征筛选。

13.根据权利要求1所述的产品虚拟量测方法,其特征在于,构建所述第一模型采用岭回归算法或偏最小二乘回归算法。

14.根据权利要求1所述的产品虚拟量测方法,其特征在于,所述第一模型训练时采用MAE函数或R‑squre函数作为损失函数。

15.根据权利要求1所述的产品虚拟量测方法,其特征在于,所述预设产品与所述参考产品的工艺加工设备相同。

16.根据权利要求3所述的产品虚拟量测方法,其特征在于,所述方法还包括:若所述待检测产品的特性值预测结果超出阈值,则使用质量检测设备对所述待检测产品进行质量检测。

17.根据权利要求3所述的产品虚拟量测方法,其特征在于,若所述待检测产品的特性值预测结果未超出阈值,则将所述待检测产品转交下一工序。

18.根据权利要求3所述的产品虚拟量测方法,其特征在于,所述对所述实时加工数据进行时序滑窗处理,获得所述待检测产品对应的参考产品a,具体包括:基于时间窗口和所述实时加工数据,获得在所述时间窗口内,完成工艺加工时刻与所述待检测产品完成工艺加工时刻间隔时间最短的所述参考产品a。

19.产品虚拟量测系统,其特征在于,所述系统包括:历史加工数据获得单元,用于获得多个第一产品的第一历史加工数据,所述第一产品为已完成工艺加工和质量检测的产品;

第一特征提取单元,用于对每个所述第一历史加工数据进行特征提取获得多个第一数据集;

第一时序滑窗处理单元,用于对每个所述第一数据集进行时序滑窗处理,获得多个第一参考样本;

第一差分处理单元,用于将多个所述第一数据集与对应的所述第一参考样本做差分处理获得多个第一差分样本;

第一训练集获得单元,用于基于多个所述第一差分样本获得第一训练集;

模型训练单元,用于利用所述第一训练集训练第一模型获得第二模型,所述第一模型用于学习参数特征差和特性值差之间的关系;

实时加工数据获得单元,用于获得待检测产品的实时加工数据,所述待检测产品为已完成工艺加工且未完成质量检测的产品;

第二特征提取单元,用于对所述实时加工数据进行特征提取获得第二数据集;

第二时序滑窗处理单元,用于对所述第二数据集进行时序滑窗处理获得第二参考样本;

第二差分处理单元,用于将所述第二数据集与所述第二参考样本做差分处理获得差分数据;

特性值差获得单元,用于将所述差分数据输入所述第二模型,获得所述待检测产品与其对应的参考产品之间的特性值差;

其中,所述参数特征差为第一特征与第二特征的差值,所述第一特征为预设产品的工艺加工设备的设备参数的特征;所述第二特征为参考产品的工艺加工设备的设备参数的特征;所述特性值差为第一特性值与第二特性值的差值,所述第一特性值为所述预设产品的质量检测设备输出的特性值;所述第二特性值为所述参考产品的质量检测设备输出的特性值。

20.一种产品虚拟量测方法装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1‑18中任意一个所述产品虚拟量测方法的步骤。

21.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1‑18中任意一个所述产品虚拟量测方法的步骤。

说明书 :

产品虚拟量测方法及系统及装置及介质

技术领域

[0001] 本发明涉及智能工业领域,具体地,涉及产品虚拟量测方法及系统及装置及介质。

背景技术

[0002] 面板行业生产工艺复杂,从一张glass到生产出完整的panel面板包括Array、CF、Cell、Module等环节,具体又包括清洗干燥、成膜、曝光、显影、刻蚀、配向、涂布、液晶注入等
上百道工序,任何一个环节都可能造成面板缺陷,而缺陷板需要及时发现,阻止其流入后道
制程产生不合格品以及浪费生产资源,因此工厂在各个主工艺制程后段都设置了检测站
点,对glass的重要特性值进行检测。然而由于部分检测项目有较高的时间成本,因此对每
一张glass均进行检测是不现实的。当前绝大多数工厂都是采用抽检的方式,对少量glass
进行抽检,例如20抽1,但是抽检的方式可能漏掉一些缺陷,对产品的良率还是有一定影响。
[0003] 面板生产过程中会利用传感器对诸多工艺参数、设备参数进行采集,以一秒采集一次为单位,存储了大量的有用信息可供利用。不同生产制程阶段需要监测的参数不同,使
用的传感器也不同,以化学气相成膜工艺为例,主要监测的参数有温度、压力和化学气体流
量等,对应温度传感器、压力传感器和流量传感器。
[0004] 虚拟量测是一种利用机器学习算法对生产工艺参数、设备参数和特性值之间建立回归模型,进而实现对特性值进行自动预测的方法。由于虚拟量测可以对所有glass实现全
检,并且可以降低检测设备与人工成本,已经成为了面板行业特性值检测领域的一个重要
研究方向。然而由于面板生产中缺陷样本的稀缺性以及工艺设备的机差(同样的设备,两台
机器之间也会存在微小的性能差异(机差)。机差可以说是半导体制造设备厂家在生产同一
型号的设备时,因不可控因素的存在而可能产生的设备差异。随着半导体精密化程度的不
断提高,机差问题日益显著),导致一般的机器学习模型难以实现较高的检测准确率。

发明内容

[0005] 为了提高产品虚拟量测的准确率,本发明产品虚拟量测方法及系统及装置及介质。
[0006] 为实现上述目的,本发明提供了产品虚拟量测方法,所述方法包括:
[0007] 获得多个第一产品的第一历史加工数据,所述第一产品为已完成工艺加工和质量检测的产品;
[0008] 对每个所述第一历史加工数据进行特征提取获得多个第一数据集;
[0009] 对每个所述第一数据集进行时序滑窗处理,获得多个第一参考样本;
[0010] 将多个所述第一数据集与对应的所述第一参考样本做差分处理获得多个第一差分样本;
[0011] 基于多个所述第一差分样本获得第一训练集;
[0012] 利用所述第一训练集训练第一模型获得第二模型,所述第一模型用于学习参数特征差和特性值差之间的关系;
[0013] 获得待检测产品的实时加工数据,所述待检测产品为已完成工艺加工且未完成质量检测的产品;
[0014] 对所述实时加工数据进行特征提取获得第二数据集;
[0015] 对所述第二数据集进行时序滑窗处理获得第二参考样本,将所述第二数据集与所述第二参考样本做差分处理获得差分数据;
[0016] 将所述差分数据输入所述第二模型,获得所述待检测产品与其对应的参考产品之间的特性值差。
[0017] 其中,本方法通过结合时序滑窗方法和差分方法来建立参数差与特性值差之间的相关关系,消除工艺设备机差对机器学习模型的负面影响,并实现了有效样本的扩充,进而
建立的机器学习模型对异常特性值有较高的检测准确率。
[0018] 其中,利用时序滑窗方法做差分,能够消除工艺设备的机差对虚拟量测模型训练的负面影响,并及时抓住异常面板出现的异常波动。
[0019] 其中,利用差分方法对面板厂检测样本缺乏的问题实现了有效的训练样本扩充。
[0020] 优选的所述方法包括:
[0021] 基于m个已完成工艺加工和质量检测的第一产品1至第一产品m,获得所述第一产品1至所述第一产品m对应的第一历史加工数据1至第一历史加工数据m,m为大于1的整数;
[0022] 基于所述第一历史加工数据1至所述第一历史加工数据m,获得第一数据集1至第一数据集m;
[0023] 对所述第一数据集1至所述第一数据集m进行时序滑窗处理获得对应的第一参考样本1至第一参考样本m;
[0024] 将所述第一数据集1与所述第一参考样本1做差分处理获得第一差分样本1,...,将所述第一数据集m与所述第一参考样本m做差分处理获得第一差分样本m;
[0025] 基于所述第一差分样本1至所述第一差分样本m获得第一训练集。
[0026] 其中,通过从历史加工数据中提取数据能够获得样本数据,针对平行设备之间同样的设备参数会存在水平差异,将所有设备生产的产品统一建模会对模型效果有负面影
响,因此采用差分的方法构建设备参数差与特性值差的模型,即 。而差分的
关键在于如何选择参考样本,如果选择的参考样本时间跨度过长,则特性值的波动可能由
设备PM等其他随机因素影响,因此采用时序滑窗的方法来做差分,保证差分样本间特性值
的差异尽量是设备参数带来的。
[0027] 优选的,本方法中,所述参数特征差为第一特征与第二特征的差值,所述第一特征为预设产品的工艺加工设备的设备参数的特征;所述第二特征为参考产品的工艺加工设备
的设备参数的特征;所述特性值差为第一特性值与第二特性值的差值,所述第一特性值为
所述预设产品的质量检测设备输出的特性值;所述第二特性值为所述参考产品的质量检测
设备输出的特性值。
[0028] 其中,通过上述方式能够建立工艺加工设备的设备参数的特征与特性值之间的关系。
[0029] 优选的,所述方法包括:
[0030] 基于所述实时加工数据,获得所述待检测产品的工艺加工设备的设备参数的特征a;
[0031] 对所述实时加工数据进行时序滑窗处理,获得所述待检测产品对应的参考产品a;
[0032] 基于所述参考产品a的历史加工数据,获得所述参考产品的工艺加工设备的设备参数的特征b和特性值b;
[0033] 基于所述特征a和所述特征b获得所述待检测产品的第一参数特征差;
[0034] 将所述第一参数特征差输入所述第二模型获得所述待检测产品的第一特性值差;
[0035] 基于所述第一特性值差和所述特性值b获得所述待检测产品的特性值预测结果。
[0036] 其中,通过实时加工数据,获得待检测产品的工艺加工设备的设备参数的特征a;对实时加工数据进行时序滑窗处理,获得待检测产品对应的参考产品a;然后基于参考产品
a的历史加工数据,获得参考产品的工艺加工设备的设备参数的特征b和特性值b;基于特征
a和特征b获得所述待检测产品的第一参数特征差;将第一参数特征差输入第二模型获得待
检测产品的第一特性值差;由于第二模型通过相应的训练集训练获得,能够准确的获得待
检测产品的特性值预测结果。
[0037] 优选的,本方法中第一数据集c的获得方式为:
[0038] 从第一历史加工数据c中提取获得:加工产品c的工艺设备的第一监测参数、检测所述产品c的质量检测设备d的输出特性值和所述质量检测设备d检测所述产品c的第一检
测时间,c为大于或等于1且小于或等于m的整数;
[0039] 对所述第一监测参数进行特征提取获得特征数据;
[0040] 基于所述第一检测时间、所述特征数据和所述输出特性值获得所述第一数据集。
[0041] 其中,第一数据集c中包括第一检测时间是为了便于进行时序滑窗,特征数据和输出特性值是为了进行后续模型的训练。
[0042] 优选的,本方法中对所述第一监测参数进行特征提取获得时域特征数据以及频域特征数据。其中,历史加工数据并不能够直观的反映特性也不能够进行模型训练,通过特征
提取能够获得用于模型训练的特征数据。
[0043] 优选的,本方法中产品i对应的第一数据集i为: ,其中,为所述产品i的第一检测时间, 为所述产品i对应的特征数据,
为所述产品i对应的输出特性值,i大于或等于1且小于或等于m。
[0044] 优选的,本方法中所述第一训练集为T:
[0045]
[0046] 其中, 至 为产品1至产品m的第一检测时间, 至 为产品1对应的特征数据, 为产品1对应的输出特性值; 至 为产品2对应的特征数据, 为产
品2对应的输出特性值; 至 为产品m对应的特征数据, 为产品m对应的输出
特性值。
[0047] 优选的,本方法中利用所述第一训练集训练所述第一模型获得所述第二模型,具体包括:
[0048] 基于所述第一数据集1至所述第一数据集m构建第一训练集;
[0049] 基于预设大小的时间窗口将所述第一训练集拆分为若干个第二训练集;
[0050] 将每个所述第二训练集做差分处理获得多个所述第一差分样本;
[0051] 基于所有所述第一差分样本获得第三训练集;
[0052] 利用所述第三训练集训练第一模型获得所述第二模型。
[0053] 其中,通过上述方式能够结合时序滑窗和差分方法来建立参数特征差与特性值差之间相关关系,采用差分的方法构建设备参数差与特性值差的模型,即 。而
差分的关键在于如何选择参考样本,如果选择的参考样本时间跨度过长,则特性值的波动
可能由设备PM等其他随机因素影响,因此采用时序滑窗的方法来做差分,保证差分样本间
特性值的差异尽量是设备参数带来的。
[0054] 优选的,本方法中所述时间窗口大小为w,将所述第一训练集拆分为k个第二训练集,分别为w1至wk;其中,w1包括e条样本,e大于或等于1且小于或等于m,对w1做差分处理获
得p个所述第一差分样本, ,所述第一训练集T为[p,n+2]的二维数组。
[0055] 优选的,本方法中对w1做差分处理具体包括:
[0056] 以w1中的产品1的对应的特征数据和输出特性值为第一参考样本,使用产品2至产品e的对应的特征数据和输出特性值与所述第一参考样本的对应项做差,获得第一差分样
本1;
[0057] 以w1中的产品2的对应的特征数据和输出特性值为第二参考样本,使用产品3至产品e的对应的特征数据和输出特性值与所述第二参考样本的对应项做差获得第一差分样本
2;
[0058] …
[0059] 以w1中的产品e‑2的对应的特征数据和输出特性值为第e‑2参考样本,使用产品e‑1至产品e的对应的特征数据和输出特性值与所述第e‑2参考样本的对应项做差获得第一差
分样本e‑2;
[0060] 以w1中的产品e‑1的对应的特征数据和输出特性值为第e‑1参考样本,使用产品e的对应的特征数据和输出特性值与所述第e‑1参考样本的对应项做差获得第一差分样本e‑
1。
[0061] 优选的,所述方法包括:
[0062] 对所述第三训练集进行特征筛选获得第四训练集;
[0063] 利用所述第四训练集训练第一模型获得所述第二模型。
[0064] 其中,假设经过时序滑窗差分后共生成p条样本,则T被扩张为[p,n+2]的二维数组,由于面板生产参数众多,n可达上千维,因此先对生成的二维数组进行特征筛选,假设筛
选后特征数量为q,则得到最终的训练集:[q,n+2]的二维数组。
[0065] 优选的,本方法基于pearson相关系数或kendall相关系数对所述第三训练集进行特征筛选。
[0066] 优选的,本方法中构建所述第一模型采用岭回归算法或偏最小二乘回归算法。
[0067] 优选的,本方法中所述第一模型训练时采用MAE函数或R‑squre函数作为损失函数。
[0068] 优选的,本方法中所述预设产品与所述参考产品的工艺加工设备相同。
[0069] 其中,由于平行设备之间的设备参数会存在水平差异,因此做差分时产品选择参考样本应该是同一设备生产的产品,这样才能保证参数差与特性值差之间的关系不会失
真,将各台平行设备分别构建差分样本,再把所有样本合并建模。
[0070] 优选的,本方法中所述方法还包括:
[0071] 若所述待检测产品的特性值预测结果超出阈值,则使用质量检测设备对所述待检测产品进行质量检测。
[0072] 其中,这样设计的目的是当识别面板特性值出现了异常即触发报警机制,将异常产品交于检测设备复检,这样的双重检测机制可以同时保证检测的全面性与检测的准确
性。
[0073] 优选的,本方法中若所述待检测产品的特性值预测结果未超出阈值,则将所述待检测产品转交下一工序。若未检测到异常,则按照正常工序进行后面的处理。
[0074] 优选的,本方法中所述对所述实时加工数据进行时序滑窗处理,获得所述待检测产品对应的参考产品a,具体包括:
[0075] 基于时间窗口和所述实时加工数据,获得在所述时间窗口内,完成工艺加工时刻与所述待检测产品完成工艺加工时刻间隔时间最短的所述参考产品a。
[0076] 本发明还提供了产品虚拟量测系统,所述系统包括:
[0077] 历史加工数据获得单元,用于获得多个第一产品的第一历史加工数据,所述第一产品为已完成工艺加工和质量检测的产品;
[0078] 第一特征提取单元,用于对每个所述第一历史加工数据进行特征提取获得多个第一数据集;
[0079] 第一时序滑窗处理单元,用于对每个所述第一数据集进行时序滑窗处理,获得多个第一参考样本;
[0080] 第一差分处理单元,用于将多个所述第一数据集与对应的所述第一参考样本做差分处理获得多个第一差分样本;
[0081] 第一训练集获得单元,用于基于多个所述第一差分样本获得第一训练集;
[0082] 模型训练单元,用于利用所述第一训练集训练第一模型获得第二模型,所述第一模型用于学习参数特征差和特性值差之间的关系;
[0083] 实时加工数据获得单元,用于获得待检测产品的实时加工数据,所述待检测产品为已完成工艺加工且未完成质量检测的产品;
[0084] 第二特征提取单元,用于对所述实时加工数据进行特征提取获得第二数据集;
[0085] 第二时序滑窗处理单元,用于对所述第二数据集进行时序滑窗处理获得第二参考样本;
[0086] 第二差分处理单元,用于将所述第二数据集与所述第二参考样本做差分处理获得差分数据;
[0087] 特性值差获得单元,用于将所述差分数据输入所述第二模型,获得所述待检测产品与其对应的参考产品之间的特性值差。
[0088] 本发明还提供了一种产品虚拟量测方法装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实
现所述产品虚拟量测方法的步骤。
[0089] 本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述产品虚拟量测方法的步骤。
[0090] 本发明提供的一个或多个技术方案,至少具有如下技术效果或优点:
[0091] 本发明通过结合时序滑窗方法和差分方法来建立参数差与特性值差之间的相关关系,消除工艺设备机差对机器学习模型的负面影响,并实现了有效样本的扩充,进而建立
的机器学习模型对异常特性值有较高的检测准确率。当识别面板特性值出现了异常即触发
报警机制,将异常产品交于检测设备复检,这样的双重检测机制可以同时保证检测的全面
性与检测的准确性。

附图说明

[0092] 此处所说明的附图用来提供对本发明实施例的进一步理解,构成本发明的一部分,并不构成对本发明实施例的限定;
[0093] 图1为产品虚拟量测方法的流程示意图;
[0094] 图2为时序滑窗差分原理示意图;
[0095] 图3为产品虚拟量测系统的组成示意图。

具体实施方式

[0096] 为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在相互不冲突的情况下,本发明的
实施例及实施例中的特征可以相互组合。
[0097] 在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述范围内的其他方式来实施,因此,本发明的保护范围并不受下
面公开的具体实施例的限制。
[0098] 应当理解,本文使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,
则可通过其他表达来替换所述词语。
[0099] 如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提
示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者
设备也可能包含其它的步骤或元素。
[0100] 本说明书使用流程图说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个
步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
[0101] 实施例一
[0102] 请参考图1,图1为产品虚拟量测方法的流程示意图,本实施例一提供了产品虚拟量测方法,其特征在于,所述方法包括:
[0103] 获得多个第一产品的第一历史加工数据,所述第一产品为已完成工艺加工和质量检测的产品;
[0104] 对每个所述第一历史加工数据进行特征提取获得多个第一数据集;
[0105] 对每个所述第一数据集进行时序滑窗处理,获得多个第一参考样本;
[0106] 将多个所述第一数据集与对应的所述第一参考样本做差分处理获得多个第一差分样本;
[0107] 基于多个所述第一差分样本获得第一训练集;
[0108] 利用所述第一训练集训练第一模型获得第二模型,所述第一模型用于学习参数特征差和特性值差之间的关系;
[0109] 获得待检测产品的实时加工数据,所述待检测产品为已完成工艺加工且未完成质量检测的产品;
[0110] 对所述实时加工数据进行特征提取获得第二数据集;
[0111] 对所述第二数据集进行时序滑窗处理获得第二参考样本,将所述第二数据集与所述第二参考样本做差分处理获得差分数据;
[0112] 将所述差分数据输入所述第二模型,获得所述待检测产品与其对应的参考产品之间的特性值差。
[0113] 通过本方法能够解决工艺设备的机差对虚拟量测模型训练的负面影响,同时对于面板厂收集的检测产品样本不足的问题,利用时序滑窗差分方法生成有效训练样本,提高
机器学习模型的预测准确度。
[0114] 下面以产品为面板时对本发明进行详细介绍,本发明产品并不局限于面板,可以为多种类型的产品。
[0115] 构造训练集:每张glass在一个生产工艺步骤下会通过传感器监测多个工艺设备参数,按一秒一次记录为单位进行存储,这样的原始监测数据需要经过特征提取转化为机
器学习可以使用的训练特征。对一个监测参数可以提取最大值、最小值、均值、标准差、方
差、均方根等时域特征以及经过傅里叶变换后提取的频域特征,从历史数据中对一个检测
站点进行特征提取,则可构造机器学习基本训练集T如下:
[0116]
[0117] 其中,m为检测glass的数量,n为提取的特征数量,t为每张glass检测的时间,y为检测特性值。
[0118] 其中,历史数据包括工艺设备的监测参数和检测设备的检测参数,即对应x和y,此处是以一个检测站点为例进行举例,因为每一个检测站点都要单独建立一个预测模型。
[0119] 其中,本发明构造这样的训练集的目的是:机器学习模型的一般数据形式即是如此的二维矩阵格式,其中最后一列为预测目标,其他列为从设备参数提取的特征,每一行即
代表一块glasss,此处唯一的差异是第一列增加了时间信息,用来后续做时序滑窗差分的。
[0120] 时序滑窗差分:针对平行设备之间同样的设备参数会存在水平差异,将所有设备生产的glass统一建模会对模型效果有负面影响,因此采用差分的方法构建设备参数差与
特性值差的模型,即 。而差分的关键在于如何选择参考样本,如果选择的参
考样本时间跨度过长,则特性值的波动可能由设备PM等其他随机因素影响,因此采用时序
滑窗的方法来做差分,保证差分样本间特性值的差异尽量是设备参数带来的。
[0121] 其中,PM为Preventive Maintenance,预防性维护。
[0122] 在面板生产过程中,有些关键工艺加工时间较长,如果只有一台设备则产量无法提升,因此通常关键工艺会有多台同样的设备同时加工,即为平行设备。
[0123] 时序滑窗差分原理如图2,首先设定一个时间窗口大小w,假设窗口 内共有 条样本,即对应上述训练集T中的 行。先以 为参考样本, 分别与 做差,得到第
一组差分样本 ,同理,第二组差分以 为参考样本, 分别与 做差,得到 。
以此类推,一个时间窗口内如果有 条样本,经过时序滑窗差分后即可扩张为
条样本。
[0124] 构造后的最终差分训练集格式如下: 。
[0125] 特征筛选:假设经过时序滑窗差分后共生成p条样本,则T被扩张为[p,n+2]的二维数组,由于面板生产参数众多,n可达上千维,因此先对生成的二维数组进行特征筛选,假设
筛选后特征数量为q,则得到最终的训练集:[q,n+2]的二维数组。
[0126] 训练机器学习模型:以上述训练集为基础构建机器学习模型,学习q维设备参数差与特性值偏差 之间的关系。
[0127] 线上预测:模型上线后对于一个时间窗口w内生产的所有glass,选择时间窗口前训练集最近的一张glass作为参考,产线上的glass先提取基本特征,再将基本特征x与参考
glass做差分得到∆x,然后将差分后的特征信息传入训练好的机器学习模型∆y=f(∆x),
预测输出glass的特性值偏差∆y,最后用参考glass的特性值y+∆y即可得到预测glass的
特性值预测结果 。当 超出工厂管控线时,glass即交于检测设备复检。
[0128] 其中,上述最近即指的时间的邻近关系,例如模型上线后对实时生产的glass做预测,每块glass需要与一块参考glass做差分,因此选择时间上邻近的训练集样本做差分,因
为时间隔得越久,不可控因素对参数波动的影响越大。
[0129] 其中,在本发明实施例中,由于平行设备之间的设备参数会存在水平差异,因此做差分时glass选择参考样本应该是同一设备生产的glass,这样才能保证参数差与特性值差
之间的关系不会失真,将各台平行设备分别构建差分样本,再把所有样本合并建模。
[0130] 其中,在本发明实施例中,可采用pearson相关系数或者kendall相关系数对构建的差分特征进行特征筛选。
[0131] 其中,在本发明实施例中,构建机器学习模型可采用岭回归、偏最小二乘回归等算法,而模型训练时可采用MAE、R‑squre作为损失函数。
[0132] 实施例二
[0133] 请参考图3,图3为产品虚拟量测系统的组成示意图,本发明实施例二提供了产品虚拟量测系统,所述系统包括:
[0134] 历史加工数据获得单元,用于获得多个第一产品的第一历史加工数据,所述第一产品为已完成工艺加工和质量检测的产品;
[0135] 第一特征提取单元,用于对每个所述第一历史加工数据进行特征提取获得多个第一数据集;
[0136] 第一时序滑窗处理单元,用于对每个所述第一数据集进行时序滑窗处理,获得多个第一参考样本;
[0137] 第一差分处理单元,用于将多个所述第一数据集与对应的所述第一参考样本做差分处理获得多个第一差分样本;
[0138] 第一训练集获得单元,用于基于多个所述第一差分样本获得第一训练集;
[0139] 模型训练单元,用于利用所述第一训练集训练第一模型获得第二模型,所述第一模型用于学习参数特征差和特性值差之间的关系;
[0140] 实时加工数据获得单元,用于获得待检测产品的实时加工数据,所述待检测产品为已完成工艺加工且未完成质量检测的产品;
[0141] 第二特征提取单元,用于对所述实时加工数据进行特征提取获得第二数据集;
[0142] 第二时序滑窗处理单元,用于对所述第二数据集进行时序滑窗处理获得第二参考样本;
[0143] 第二差分处理单元,用于将所述第二数据集与所述第二参考样本做差分处理获得差分数据;
[0144] 特性值差获得单元,用于将所述差分数据输入所述第二模型,获得所述待检测产品与其对应的参考产品之间的特性值差。
[0145] 实施例三
[0146] 本发明实施例三提供了一种产品虚拟量测方法装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程
序时实现所述产品虚拟量测方法的步骤。
[0147] 其中,所述处理器可以是中央处理器(CPU,Central Processing Unit),还可以是其他通用处理器、数字信号处理器(digital signal processor)、专用集成电路
(Application Specific Integrated Circuit)、现成可编程门阵列(Fieldprogrammable 
gate array)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通
用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0148] 所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的数据,实现发明中产品虚拟量测方法装置的各种功能。所述存储器
可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所
需的应用程序(比如声音播放功能、图像播放功能等)等。此外,存储器可以包括高速随机存
取存储器、还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡,安全数
字卡,闪存卡、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0149] 实施例四
[0150] 本发明实施例四提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述产品虚拟量测方法的步骤。
[0151] 所述产品虚拟量测方法装置如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解本发明实现上
述实施例方法中的全部或部分流程,也可以通过计算机程序可存储于一计算机可读存介质
中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算
机程序包括计算机程序代码、对象代码形式、可执行文件或某些中间形式等。所述计算机可
读取介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动
硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存储器、点载波信号、电信信号以及软件
分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法
和专利实践的要求进行适当的增减。
[0152] 本发明已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可
能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,
所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
[0153] 同时,本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特
点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一
个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个
实施例中的某些特征、结构或特点可以进行适当的组合。
[0154] 此外,本领域技术人员可以理解,本说明书的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或
对他们的任何新的和有用的改进。相应地,本说明书的各个方面可以完全由硬件执行、可以
完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件
或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本说明书的
各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可
读程序编码。
[0155] 计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或
合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介
质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用
的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线
电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
[0156] 本说明书各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、
VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、
COBOL 2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序
编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在
用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种
情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网
(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软
件即服务(SaaS)。
[0157] 此外,除非权利要求中明确说明,本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书流程和方法的顺序。尽管上述披露中通
过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说
明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本
说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过
硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设
备上安装所描述的系统。
[0158] 同理,应当注意的是,为了简化本说明书披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附
图或对其的描述中。但是,这种披露方法并不意味着本说明书对象所需要的特征比权利要
求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
[0159] 针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本说明书作为参考。与本说明书内容
不一致或产生冲突的申请历史文件除外,对本说明书权利要求最广范围有限制的文件(当
前或之后附加于本说明书中的)也除外。需要说明的是,如果本说明书附属材料中的描述、
定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、
定义和/或术语的使用为准。
[0160] 最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此,作为示例而非限制,本说明书实施例的替代
配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介
绍和描述的实施例。
[0161] 尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优
选实施例以及落入本发明范围的所有变更和修改。
[0162] 显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围
之内,则本发明也意图包含这些改动和变型在内。