基于间歇过程软测量建模方法的间歇过程软测量建模系统转让专利

申请号 : CN202311127076.6

文献号 : CN116861224B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张淑宁刘珂吕高焕巩庆涛张晗

申请人 : 鲁东大学

摘要 :

法来建立模型,可以针对数据进行有效的预测,本发明属于生产过程数据处理及产品质量 避免不良因素对生产质量的影响,从而提高生产在线测量技术领域,公开了基于间歇过程软测量 效率。建模方法的间歇过程软测量建模系统。该系统搭载在青霉素间歇生产线,利用间歇过程软测量建模方法获取的在线质量预测值输入青霉素仿真平台,对青霉素生产工艺参数进行调控,获取青霉素最终生产工艺参数数据;该方法包括:对间歇过程的数据进行预处理;对间歇过程的数据进行特征提取;利用最小二乘支持向量回归方法对(56)对比文件刘世成;王海清;李平.基于多向核主元分析的青霉素生产过程在线监测.浙江大学学报(工学版).2007,(第02期),全文.

权利要求 :

1.一种基于间歇过程软测量建模方法的间歇过程软测量建模系统,其特征在于,该系统搭载在青霉素间歇生产线,利用间歇过程软测量建模方法获取的在线质量预测值输入青霉素仿真平台,对青霉素生产工艺参数进行调控,获取青霉素最终生产工艺参数数据,所述青霉素生产工艺参数包括:间歇过程中的底物浓度、溶解氧浓度、生物量浓度、通气体积、二氧化碳浓度、通气速率、搅拌器功率、基材进料流量、发酵罐温度、基材进料温度;

所述间歇过程软测量建模系统包括:批次运行状态的离线模型建立模块(1),用于利用LSFA算法,进行间歇过程的数据动态‑非线性特性的信息挖掘,建立批次运行状态的离线模型;

在线质量预测值计算模块(2),用于根据批次运行状态的离线模型,计算间歇过程在线数据的得分向量,并计算回归模型的在线质量预测值;

所述间歇过程软测量建模方法包括以下步骤:S1,利用LSFA算法进行间歇过程的数据动态‑非线性特性的信息挖掘,建立批次运行状态的离线模型;

S2,根据批次运行状态的离线模型,计算间歇过程在线数据的得分向量,并计算回归模型的在线质量预测值;

在步骤S1中,建立批次运行状态的离线模型,具体包括以下步骤:S11:收集批次生产过程的数据,采用马氏距离对间歇过程的异常数据进行预处理;

S12:对间歇过程的数据进行动态矩阵扩展;

S13:对动态扩展矩阵进行主成分分析降维,提取间歇过程数据中的主元信息;

S14:对降维数据进行慢特征提取;

S15:利用最小二乘支持向量回归方法对间歇过程进行预测,构建质量与慢特征之间的回归模型;

在步骤S13中,对动态扩展矩阵进行主成分分析降维,提取间歇过程数据中的主元信息,具体包括:对数据进行动态矩阵扩展后,获得的数据有 个样本 ,其中, 是一个 维向量,对矩阵进行线性变换,降维后的矩阵为:(5)

其中, 是一个 维向量并且 ; 是一个 的矩阵;

令 ; 表示负载矩阵, 表示负载向量, 分别表示降维前后样本的维数, 表示第 维负载向量的转置,表示矩阵转置;

根据样本求均值 :

(6)

样本的投影均值计算为:

(7)

根据样本均值计算样本的协方差矩阵:(8)

计算样本投影后的方差:

(9)

根据拉格朗日函数构造目标函数为:(10)

对目标函数求偏导:

(11)

令偏导等于0,得到结果:

(12)

式中,是 的特征值, 是对应的特征向量,只对 进行排序,将前 个最大特征值所对应的特征向量提取出来得到矩阵 ;

在步骤S14中,对降维数据进行慢特征提取,具体包括:通过对间歇过程的自变量 进行PCA降维,得到降维后结果 ,根据公式(7)、(9)计算降维后数据 的均值 和标准差 ,对降维后数据 进行标准化得到: ; 表示标准化后的数据;

求 数据的协方差矩阵,并进行SVD分解得到酉矩阵:(13)

式中, 表示标准化数据矩阵的转置, 表示SVD分解后的酉矩阵,表示矩阵转置;

利用分解后的矩阵对 进行白化变换:(14)

(15)

式中,表示白化矩阵,表示奇异值矩阵, 表示酉矩阵的转置,表示白化变量的一阶导数矩阵, 表示连续两个样本之间的差;

求解白化矩阵的协方差矩阵,进行二次SVD分解:(16)

式中, 表示矩阵 的一阶导数协方差矩阵, 表示酉矩阵的转置, 表示奇异值矩阵,表示酉矩阵;

按照升序进行排序,提取前 列作为数据的特征向量 ,最终得到负载向量 :

(17)

式中, 表示负载矩阵;

该步骤保证提取的特征均值为0,方差为1且各向量之间不相关;

根据得到的权重向量,求解慢特征 :(18)

式中, 表示慢特征;

在步骤S15中,构建质量与慢特征之间的回归模型,具体包括:将获得的数据采用LSSVR进行回归预测,得到优化的目标函数为:;

(19)

式中, 为负载向量,为偏置向量, 为模型的误差变量,为惩罚系数, 为目标函数, 为负载向量的转置, 为非线性映射函数;

根据拉格朗日函数:

(20)

其中, 为拉格朗日乘子,为构造的拉格朗日函数;

根据最优化KKT条件求解,得到模型公式为:(21)

其中, 表示核函数。

2.根据权利要求1所述的基于间歇过程软测量建模方法的间歇过程软测量建模系统,其特征在于,在步骤S11中,采用马氏距离对间歇过程的异常数据进行预处理,具体过程如下:收集多个批次生产过程的数据,第个批次过程输入矩阵为 ,其中,表示变量个数,表示样本采样次数,表示实数集, 为第个批次过程输入矩阵;

计算同一批次过程输入数据的均值 ,其中,表示均值个数,表示同一批次过程输入数据的均值, 表示第 批数据的样本均值,表示矩阵的转置;

变量 与 间的协方差矩阵为 :(1)

式中, 表示协方差矩阵,表示样本个数, 表示第 行第 列变量, 表示第 列均值, 表示第 行第 列变量, 表示第 列均值;

分别计算第个批次过程输入矩阵 中每一个样本点到均值的马氏距离:(2)

式中, 表示样本马氏距离,表示样本变量,表示均值,表示矩阵转置,表示协方差矩阵;

对马氏距离进行升序排序,通过设置阈值,遍历 选取前 个马氏距离最小的数据进行保留,剔除掉不符合设定阈值的异常值。

3.根据权利要求1所述的基于间歇过程软测量建模方法的间歇过程软测量建模系统,其特征在于,在步骤S12中,对间歇过程的数据进行动态矩阵扩展,具体包括:批次测量数据的样本为 ,其中 分别表示测量的批次数、工艺变量和采样次数,批次数据按三维数据形式构造;将数据按照时间序列分批展开,展开后的矩阵:(3)

式中, 表示扩展后 个批次的数据矩阵, 表示第 个批次中第 时刻采样的第个变量值;

引入时移重复作为附加变量来扩展原始输入矩阵,时刻 的增广输入矩阵:(4)

式中, 表示增广矩阵, 表示第 个批次的样本矩阵;

通过上述方法对间歇过程的自变量 进行动态扩展,得到扩展后结果 。

4.根据权利要求1所述的基于间歇过程软测量建模方法的间歇过程软测量建模系统,其特征在于,在步骤S2中,根据批次运行状态的离线模型,计算间歇过程在线数据的得分向量,并计算回归模型的在线质量预测值,具体包括:S20:采集新过程样本数据 ;

S21:计算 中样本点到均值的马氏距离:(22)

其中,均值采用离线建模阶段训练得到的同一批次过程输入数据的均值,根据求解的马氏距离值与阈值比较,若值大于阈值,则对测试数据的异常值进行剔除;

S22:构建时序增广矩阵,对新过程样本进行动态矩阵扩展:(23)

S23:对动态扩展矩阵进行主成分分析降维,根据步骤S13中训练的权重向量 ,提取数据中的主元信息:(24)

S24:步骤S14中计算出负载向量 ,将获得降维后的数据经过慢特征分析方法进行慢特征提取:(25)

S25:利用最小二乘支持向量回归方法对间歇过程进行预测,构建质量与慢特征之间的回归模型,最终得到预测值:(26)

其中, 是拉格朗日乘子,为偏置向量, 为核函数。

说明书 :

基于间歇过程软测量建模方法的间歇过程软测量建模系统

技术领域

[0001] 本发明属于生产过程数据处理及产品质量在线测量技术领域,尤其涉及一种基于间歇过程软测量建模方法的间歇过程软测量建模系统。

背景技术

[0002] 现在的工业生产过程分为连续生产过程和间歇生产过程两类。连续生产就是运行状态长期稳定运行,不改变生产条件。通常这种生产方式主要是生产一些生产量巨大的单一产品。间歇过程就是在一定的时间里,按照制定好的工艺流程进行工业生产,使得原材料被加工成为预想的产品。但是整个过程有许多因素具有不稳定性,一旦生产不稳定,生产出来的产品与想要的产品之间产生误差,不利于工业生产过程中要求度较高的产品的生产。间歇过程在工业生产中运用时间长久并且是传统的生产方式,具有生产成本低、工作流程简单等特点。因此应当建立该生产过程的软测量模型,模型会使对该过程的生产质量有一定的预测,这样就可以避免各种不良因素对生产质量产生不良影响,有利于提高生产质量。
[0003] 通过上述分析,现有技术存在的问题及缺陷为:由于生产条件的变化或运行条件的不稳定性,过程数据往往呈现出不同的数据特征,如非线性、重复性和慢时变特性等问题。这些数据存在的问题,对拟合模型的效果表现并不理想,影响了建模的有效性,不能够实时准确预报生产产品质量指标,从而降低泛化性能,影响预测质量且影响了生产效率。

发明内容

[0004] 为克服相关技术中存在的问题,本发明公开实施例提供了一种基于间歇过程软测量建模方法的间歇过程软测量建模系统,具体属于工业生产过程产品质量预测的软测量建模技术领域,具体涉及一种基于慢特征分析与最小二乘支持向量回归的间歇过程软测量建模方法。
[0005] 所述技术方案如下:一种基于间歇过程软测量建模方法的间歇过程软测量建模系统,该系统搭载在青霉素间歇生产线,利用间歇过程软测量建模方法获取的在线质量预测值输入青霉素仿真平台,对青霉素生产工艺参数进行调控,获取青霉素最终生产工艺参数数据,所述青霉素生产工艺参数包括:间歇过程中的底物浓度、溶解氧浓度、生物量浓度、通气体积、二氧化碳浓度、通气速率、搅拌器功率、基材进料流量、发酵罐温度、基材进料温度;
[0006] 所述间歇过程软测量建模系统包括:批次运行状态的离线模型建立模块,用于利用LSFA算法,进行间歇过程的数据动态‑非线性特性的信息挖掘,建立批次运行状态的离线模型;
[0007] 在线质量预测值计算模块,用于根据批次运行状态的离线模型,计算间歇过程在线数据的得分向量,并计算回归模型的在线质量预测值;
[0008] 所述间歇过程软测量建模方法包括以下步骤:
[0009] S1,利用LSFA算法进行间歇过程的数据动态‑非线性特性的信息挖掘,建立批次运行状态的离线模型;
[0010] S2,根据批次运行状态的离线模型,计算间歇过程在线数据的得分向量,并计算回归模型的在线质量预测值。
[0011] 在步骤S1中,建立批次运行状态的离线模型,具体包括以下步骤:
[0012] S11:收集批次生产过程的数据,采用马氏距离对间歇过程的异常数据进行预处理;
[0013] S12:对间歇过程的数据进行动态矩阵扩展;
[0014] S13:对动态扩展矩阵进行主成分分析降维,提取间歇过程数据中的主元信息;
[0015] S14:对降维数据进行慢特征提取;
[0016] S15:利用最小二乘支持向量回归方法对间歇过程进行预测,构建质量与慢特征之间的回归模型。
[0017] 在步骤S11中,采用马氏距离对间歇过程的异常数据进行预处理,具体过程如下:
[0018] 收集多个批次生产过程的数据,第个批次过程输入矩阵为 ,其中,表示变量个数,表示样本采样次数,表示实数集, 为第个批次过程输入矩阵;
[0019] 计算同一批次过程输入数据的均值 ,其中,表示均值个数,表示同一批次过程输入数据的均值, 表示第一批数据的样本均值,表示矩阵的转置;
[0020] 变量 与 间的协方差矩阵为 :
[0021] (1)
[0022] 式中, 表示协方差矩阵,表示样本个数, 表示第 行第 列变量, 表示第列均值, 表示第 行第 列变量, 表示第 列均值;
[0023] 分别计算第个批次过程输入矩阵 中每一个样本点到均值的马氏距离:
[0024] (2)
[0025] 式中, 表示样本马氏距离,表示样本变量,表示均值,表示矩阵转置,表示协方差矩阵;
[0026] 对马氏距离进行升序排序,通过设置阈值,遍历 选取前 个马氏距离最小的数据进行保留,剔除掉不符合设定阈值的异常值。
[0027] 在步骤S12中,对间歇过程的数据进行动态矩阵扩展,具体包括:
[0028] 批次测量数据的样本为 ,其中 分别表示测量的批次数、工艺变量和采样次数,批次数据按三维数据形式构造;将数据按照时间序列分批展开,展开后的矩阵:
[0029] (3)
[0030] 式中, 表示扩展后 个批次的数据矩阵, 表示第 个批次中第 时刻采样的第 个变量值;
[0031] 引入时移重复作为附加变量来扩展原始输入矩阵,时刻 的增广输入矩阵:
[0032] (4)
[0033] 式中, 表示增广矩阵, 表示第 个批次的样本矩阵;
[0034] 通过上述方法对间歇过程的自变量 进行动态扩展,得到扩展后结果 。
[0035] 在步骤S13中,对动态扩展矩阵进行主成分分析降维,提取间歇过程数据中的主元信息,具体包括:
[0036] 对数据进行动态矩阵扩展后,获得的数据有 个样本 ,其中,是一个 维向量,对矩阵进行线性变换,降维后的矩阵为:
[0037] (5)
[0038] 其中, 是一个 维向量并且 ; 是一个 的矩阵;
[0039] 令 ; 表示负载矩阵, 表示负载向量, 分别表示降维前后样本的维数, 表示第 维负载向量的转置,表示矩阵转置;
[0040] 根据样本求均值 :
[0041] (6)
[0042] 样本的投影均值计算为:
[0043] (7)
[0044] 根据样本均值计算样本的协方差矩阵:
[0045] (8)
[0046] 计算样本投影后的方差:
[0047] (9)
[0048] 根据拉格朗日函数构造目标函数为:
[0049] (10)
[0050] 对目标函数求偏导:
[0051] (11)
[0052] 令偏导等于0,得到结果:
[0053] (12)
[0054] 式中,是 的特征值, 是对应的特征向量,只对 进行排序,将前 个最大特征值所对应的特征向量提取出来得到矩阵 。
[0055] 在步骤S14中,对降维数据进行慢特征提取,具体包括:
[0056] 通过对间歇过程的自变量 进行PCA降维,得到降维后结果 ,根据公式(7)、(9)计算降维后数据 的均值 和标准差 ,对降维后数据 进行标准化得到:; 表示标准化后的数据;
[0057] 求 数据的协方差矩阵,并进行SVD分解得到酉矩阵:
[0058] (13)
[0059] 式中, 表示标准化数据矩阵的转置, 表示SVD分解后的酉矩阵,表示矩阵转置;
[0060] 利用分解后的矩阵对 进行白化变换:
[0061] (14)
[0062] (15)
[0063] 式中,表示白化矩阵,表示奇异值矩阵, 表示酉矩阵的转置,表示白化变量的一阶导数矩阵, 表示连续两个样本之间的差;
[0064] 求解白化矩阵的协方差矩阵,进行二次SVD分解:
[0065] (16)
[0066] 式中, 表示矩阵 的一阶导数协方差矩阵, 表示酉矩阵的转置,表示奇异值矩阵,表示酉矩阵;
[0067] 按照升序进行排序,提取前 列作为数据的特征向量 ,最终得到负载向量 :
[0068] (17)
[0069] 式中, 表示负载矩阵;
[0070] 该步骤保证提取的特征均值为0,方差为1且各向量之间不相关;
[0071] 根据得到的权重向量,求解慢特征 :
[0072] (18)
[0073] 式中, 表示慢特征。
[0074] 在步骤S15中,构建质量与慢特征之间的回归模型,具体包括:
[0075] 将获得的数据采用LSSVR进行回归预测,得到优化的目标函数为:
[0076] ;
[0077] (19)
[0078] 式中, 为权向量,为偏置向量, 为模型的误差变量,为惩罚系数, 为目标函数, 为负载向量的转置, 为非线性映射函数;
[0079] 根据拉格朗日函数:
[0080](20)
[0081] 其中, 为拉格朗日乘子,为构造的拉格朗日函数;
[0082] 根据最优化KKT条件求解,得到模型公式为:
[0083] (21)
[0084] 其中, 表示核函数。
[0085] 在步骤S2中,根据批次运行状态的离线模型,计算间歇过程在线数据的得分向量,并计算回归模型的在线质量预测值,具体包括:
[0086] S20:采集新过程样本数据 ;
[0087] S21:计算 中样本点到均值的马氏距离:
[0088] (22)
[0089] 其中,均值采用离线建模阶段训练得到的同一批次过程输入数据的均值,根据求解的马氏距离值与阈值比较,若值大于阈值,则对测试数据的异常值进行剔除;
[0090] S22:构建时序增广矩阵,对新过程样本进行动态矩阵扩展:
[0091] (23)
[0092] S23:对动态扩展矩阵进行主成分分析降维,根据步骤S13中训练的权重向量 ,提取数据中的主元信息:
[0093] (24)
[0094] S24:步骤S14中计算出负载向量 ,将获得降维后的数据经过慢特征分析方法进行慢特征提取:
[0095] (25)
[0096] S25:利用最小二乘支持向量回归方法对间歇过程进行预测,构建质量与慢特征之间的回归模型,最终得到预测值:
[0097] (26)
[0098] 其中, 是拉格朗日乘子,为偏置向量, 为核函数。
[0099] 本发明的另一目的在于提供一种间歇过程软测量建模系统,实施所述的间歇过程软测量建模方法,该系统包括:
[0100] 批次运行状态的离线模型建立模块,用于利用LSFA算法,进行间歇过程的数据动态‑非线性特性的信息挖掘,建立批次运行状态的离线模型;
[0101] 在线质量预测值计算模块,用于根据批次运行状态的离线模型,计算间歇过程在线数据的得分向量,并计算回归模型的在线质量预测值。
[0102] 进一步,利用所述间歇过程软测量建模系统搭建精细化工间歇生产线,进行生产工艺参数调控。
[0103] 结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明提供一种间歇过程软测量建模方法包括以下步骤:对间歇过程的数据进行预处理:对间歇过程的数据进行特征提取;利用最小二乘支持向量回归方法对间歇过程进行离线建模;利用工业生产过程数据进行在线预测。本发明中基于线性慢特征分析与最小二乘支持向量回归的建模方法,相较于传统的数据驱动建模方法,能够在批处理数据的情况下,有效提高新过程关键变量预测精度,避免不良因素对生产质量的影响,从而提高生产效率。通过对间歇过程中数据的提取,可以提高模型的生产质量预测精度。利用慢特征方法核函数跟踪过程的变化趋势,从而提高模型的预测精度。通过青霉素发酵过程仿真平台Pensim2.0模型产生数据,利用MATLAB仿真验证了所用方法的有效性。

附图说明

[0104] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理:
[0105] 图1是本发明实施例提供的间歇过程软测量建模系统示意图;
[0106] 图2是本发明实施例提供的间歇过程软测量建模方法流程图;
[0107] 图3是本发明实施例提供的间歇过程软测量建模方法框架图;
[0108] 图4是本发明实施例提供的间歇过程软测量建模方法原理图;
[0109] 图5是本发明实施例提供的根据本发明所述的实施例的训练集质量预测结果图;
[0110] 图6是本发明实施例提供的根据本发明所述的实施例的测试集质量预测结果图;
[0111] 图中:1、批次运行状态的离线模型建立模块;2、在线质量预测值计算模块。

具体实施方式

[0112] 为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其他方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施的限制。
[0113] 实施例1,本发明实施例提供一种基于间歇过程软测量建模方法的间歇过程软测量建模系统,该系统搭载在青霉素间歇生产线,利用间歇过程软测量建模方法获取的在线质量预测值输入青霉素仿真平台,对青霉素生产工艺参数进行调控,获取青霉素最终生产工艺参数数据,所述青霉素生产工艺参数包括:间歇过程中的底物浓度、溶解氧浓度、生物量浓度、通气体积、二氧化碳浓度、通气速率、搅拌器功率、基材进料流量、发酵罐温度、基材进料温度。
[0114] 如图1所示,本发明实施例提供的间歇过程软测量建模系统包括以下步骤:
[0115] 批次运行状态的离线模型建立模块1,用于利用LSFA算法,进行间歇过程的数据动态‑非线性特性的信息挖掘,建立批次运行状态的离线模型;
[0116] 在线质量预测值计算模块2,用于根据批次运行状态的离线模型,计算间歇过程在线数据的得分向量,并计算回归模型的在线质量预测值。
[0117] 如图2所示,本发明实施例提供的间歇过程软测量建模方法包括以下步骤:
[0118] S1,利用LSFA算法,进行间歇过程的数据动态‑非线性特性的信息挖掘,建立批次运行状态的离线模型;
[0119] S2,根据批次运行状态的离线模型,计算间歇过程在线数据的得分向量,并计算回归模型的在线质量预测值。
[0120] 在本发明实施例中,步骤S1利用LSFA算法,进行间歇过程的数据动态‑非线性特性的信息挖掘,建立批次运行状态的离线模型具体包括以下步骤:
[0121] S11:收集批次生产过程的数据,采用马氏距离对间歇过程的异常数据进行预处理;
[0122] S12:对间歇过程的数据进行动态矩阵扩展;
[0123] S13:对动态扩展矩阵进行主成分分析降维,提取间歇过程的数据中的主元信息;
[0124] S14:对降维数据进行慢特征提取;
[0125] S15:利用最小二乘支持向量回归方法对间歇过程进行预测,构建质量与慢特征之间的回归模型。
[0126] 数据预处理旨在采用马氏距离剔除异常值,步骤S11中,具体过程如下:
[0127] 收集多个批次生产过程的数据,第个批次过程输入矩阵为 ,其中,表示变量个数,表示样本采样次数,表示实数集, 为第个批次过程输入矩阵;
[0128] 计算同一批次过程输入数据的均值 ,其中,表示均值个数,表示同一批次过程输入数据的均值, 表示第一批数据的样本均值,表示矩阵的转置;
[0129] 变量 与 间的协方差矩阵为 :
[0130] (1)
[0131] 式中, 表示协方差矩阵,表示样本个数, 表示第 行第 列变量, 表示第列均值, 表示第 行第 列变量, 表示第 列均值;
[0132] 分别计算第个批次过程输入矩阵 中每一个样本点到均值的马氏距离:
[0133] (2)
[0134] 式中, 表示样本马氏距离,表示样本变量,表示均值,表示矩阵转置,表示协方差矩阵;
[0135] 对马氏距离进行升序排序,通过设置阈值,遍历 选取前 个马氏距离最小的数据进行保留,剔除掉不符合设定阈值的异常值。
[0136] 动态矩阵扩展旨在解决系统中批与批之间的动态特性,步骤S12中,具体过程如下:
[0137] 批次测量数据的样本为 ,其中 分别表示测量的批次数、工艺变量和采样次数,批次数据按三维数据形式构造;将数据按照时间序列分批展开,扩展后的矩阵:
[0138] (3)
[0139] 式中, 表示扩展后 个批次的数据矩阵, 表示第 个批次中第 时刻采样的第 个变量值;
[0140] 引入时移重复作为附加变量来扩展原始输入矩阵,时刻 的增强输入矩阵:
[0141] (4)
[0142] 式中, 表示增广矩阵, 表示第 个批次的样本矩阵;
[0143] 通过上述方法对间歇过程的自变量 进行动态扩展,得到扩展后结果 。
[0144] 主成分分析旨在对数据进行降维,将高维空间中无法进行比较的原始数据映射到低维空间,提取数据主元信息,步骤S13中,具体过程如下:
[0145] 对数据进行动态矩阵扩展后,获得的数据有 个样本 ,其中,是一个 维向量,对矩阵进行线性变换,降维后的矩阵为:
[0146] (5)
[0147] 其中, 是一个 维向量并且 ; 是一个 的矩阵;
[0148] 令 ; 表示负载矩阵, 表示负载向量, 分别表示降维前后样本的维数, 表示第 维负载向量的转置,表示矩阵转置;
[0149] 根据样本求均值 :
[0150] (6)
[0151] 样本的投影均值计算为:
[0152] (7)
[0153] 根据样本均值计算样本的协方差矩阵:
[0154] (8)
[0155] 计算样本投影后的方差:
[0156] (9)
[0157] 根据拉格朗日函数构造目标函数为:
[0158] (10)
[0159] 对目标函数求偏导:
[0160] (11)
[0161] 令偏导等于0,得到结果:
[0162] (12)
[0163] 式中,是 的特征值, 是对应的特征向量,只对 进行排序,将前 个最大特征值所对应的特征向量提取出来得到矩阵 。
[0164] 慢特征分析旨在从输入数据中提取出变化尽可能缓慢的潜变量,步骤S14中,具体过程如下:
[0165] 通过对间歇过程的自变量 进行PCA降维,得到降维后结果 ,根据公式(7)、(9)计算降维后数据 的均值 和标准差 ,对降维后数据 进行标准化得到:; 表示标准化后的数据;
[0166] 求 数据的协方差矩阵,并进行SVD分解得到酉矩阵:
[0167] (13)
[0168] 式中, 表示标准化数据矩阵的转置, 表示SVD分解后的酉矩阵,表示矩阵转置;利用分解后的矩阵对 进行白化变换:
[0169] (14)
[0170] (15)
[0171] 式中,表示白化矩阵,表示奇异值矩阵, 表示酉矩阵的转置,表示白化变量的一阶导数矩阵, 表示连续两个样本之间的差;
[0172] 求解白化矩阵的协方差矩阵,进行二次SVD分解:
[0173] (16)
[0174] 式中, 表示矩阵 的一阶导数协方差矩阵, 表示酉矩阵的转置,表示奇异值矩阵,表示酉矩阵;
[0175] 按照升序进行排序,提取前 列作为数据的特征向量 ,最终得到负载向量 :
[0176] (17)
[0177] 式中, 表示负载矩阵;
[0178] 该步骤保证提取的特征均值为0,方差为1且各向量之间不相关;
[0179] 根据得到的权重向量,求解慢特征 :
[0180] (18)
[0181] 式中, 表示慢特征。
[0182] 最小二乘支持向量回归旨在构建质量变量与慢特征变量之间的模型,对变量进行回归预测,步骤S15中,具体过程如下:
[0183] 将获得的数据采用LSSVR进行回归预测,得到优化的目标函数为:
[0184] ,
[0185] (19)
[0186] 式中, 为权向量,为偏置向量, 为模型的误差变量,为惩罚系数, 为目标函数, 为负载向量的转置, 为非线性映射函数;
[0187] 根据拉格朗日函数:
[0188](20)
[0189] 其中, 为拉格朗日乘子,为构造的拉格朗日函数;
[0190] 根据最优化KKT条件求解,得到模型公式为:
[0191] (21)
[0192] 其中, 表示核函数。
[0193] 采用试凑法对LSSVR的参数 和 进行寻优:保持选取建模的数据个数、数据的值和高斯核函数中核参数 的值相同的情况下,设置LSSVR中 的值在0.01 10000之间变化,为~了减少计算量,采用逐渐增大值区间的方法形成 的遍历向量,同样将其应用于 的值向量。
[0194] 通过计算LSSVR模型的RMSE(RootMeanSquareError),可以得到均方根误差矩阵,其中,表示 的指标个数,表示 的指标个数,其中设置 。
[0195] 通过选择LSSVR模型均方根误差矩阵的最小值,输出与索引值对应的两个参数值,并通过迭代参数值的上下限来找到最优参数值。
[0196] 在本发明实施例中,步骤S2,根据批次运行状态的离线模型,计算间歇过程在线数据的得分向量,并计算回归模型的在线质量预测值具体包括:
[0197] S20:采集新过程样本数据 ;
[0198] S21:计算 中样本点到均值的马氏距离:
[0199] (22)
[0200] 其中,均值采用离线建模阶段训练得到的同一批次过程输入数据的均值,根据求解的马氏距离值与阈值比较,若值大于阈值,则对测试数据的异常值进行剔除;
[0201] S22:构建时序增广矩阵,对新过程样本进行动态矩阵扩展:
[0202] (23)
[0203] S23:对动态扩展矩阵进行主成分分析降维,根据步骤S13中训练的权重向量 ,提取数据中的主元信息:
[0204] (24)
[0205] S24:步骤S14中计算出负载向量 ,将获得降维后的数据经过慢特征分析方法进行慢特征提取:
[0206] (25)
[0207] S25:利用最小二乘支持向量回归方法对间歇过程进行预测,构建质量与慢特征之间的回归模型,最终得到预测值:
[0208] (26)
[0209] 其中, 是拉格朗日乘子,为偏置向量, 为核函数。
[0210] LSSVR中的参数 和 应用模型训练选取的最优参数值。
[0211] 本发明实施例解决了间歇过程的软测量模型因数据不足,与传统的模型相比,本发明的优点在于本方法可以在大量批处理数据的情况下,通过将间歇过程数据提取出来与最小二乘支持向量机有效结合的方法来建立模型,可以针对数据进行有效的预测,避免不良因素对生产质量的影响,从而提高生产效率。
[0212] 实施例2,作为本发明的另一种实施方式,以测量的批次数,工艺变量和采样次数分别为50,9和800为例,如图3所示,本发明实施例提供的一种间歇过程软测量建模方法,包括:输入样本X,主成分分析,提取K个主成分、慢特征分析,选取S维慢特征,最小二乘支持向量回归,获得预测值Y。
[0213] 如图4所示,具体为一种基于慢特征分析与最小二乘支持向量回归的间歇过程软测量建模方法,包括:
[0214] 第一步:收集多个批次生产过程的数据,第个批次过程输入矩阵为 ,其中,表示变量个数, 表示样本采样次数,表示实数集。计算同一批次过程输入数据的均值 ,其中,表示均值个数。
[0215] 变量 与 间的协方差矩阵为 :
[0216] (1)
[0217] 分别计算第个批次过程输入矩阵 中每一个样本点到均值的马氏距离:
[0218] (2)
[0219] 对马氏距离进行升序排序,通过设置阈值,遍历 选取前 个马氏距离最小的数据进行保留,剔除掉不符合设定阈值的异常值。
[0220] 第二步:选取批次测量数据的样本为 ,其中 分别表示测量的批次数、工艺变量和采样次数,批次数据按三维数据形式构造;将数据按照时间序列分批展开,扩展后的矩阵:
[0221] (3)
[0222] 引入时移重复作为附加变量来扩展原始输入矩阵,时刻 的增强输入矩阵:
[0223] (4)
[0224] 通过上述方法对间歇过程的自变量 进行动态扩展,得到扩展后结果 。
[0225] 第三步:对数据进行动态矩阵扩展后,获得的数据有 个样本 ,其中, 是一个 维向量,对矩阵进行线性变换,降维后的矩阵为:
[0226] (5)
[0227] 其中, 是一个 维向量并且 ; 是一个 的矩阵;
[0228] 令 ; 表示负载矩阵, 表示负载向量, 分别表示降维前后样本的维数, 表示第 维负载向量的转置,表示矩阵转置;
[0229] 根据样本求均值 :
[0230] (6)
[0231] 样本的投影均值计算为:
[0232] (7)
[0233] 根据样本均值计算样本的协方差矩阵:
[0234] (8)
[0235] 计算样本投影后的方差:
[0236] (9)
[0237] 根据拉格朗日函数构造目标函数为:
[0238] (10)
[0239] 对目标函数求偏导:
[0240] (11)
[0241] 令偏导等于0,得到结果:
[0242] (12)
[0243] 式中,是 的特征值, 是对应的特征向量,只对 进行排序,将前 个最大特征值所对应的特征向量提取出来得到矩阵 。
[0244] 第四步:通过对间歇过程的自变量 进行PCA降维,得到降维后结果 ,根据公式(7)、(9)计算降维后数据 的均值 和标准差 ,对降维后数据 进行标准化得到:;
[0245] 求 数据的协方差矩阵,并进行SVD分解得到酉矩阵:
[0246] (13)
[0247] 利用分解后的矩阵对 进行白化变换:
[0248] (14)
[0249] (15)
[0250] 求解白化矩阵的协方差矩阵,进行二次SVD分解:
[0251] (16)
[0252] 按照升序进行排序,提取前 列作为数据的特征向量 ,最终得到负载向量 :
[0253] (17)
[0254] 该步骤保证提取的特征均值为0,方差为1且各向量之间不相关;
[0255] 根据得到的权重向量,求解慢特征 :
[0256] (18)
[0257] 第五步:将获得的数据采用LSSVR进行回归预测,得到优化的目标函数为:
[0258] ,
[0259] (19)
[0260] 式中, 为权向量,为偏置向量, 为模型的误差变量,为惩罚系数, 为目标函数, 为负载向量的转置, 为非线性映射函数;
[0261] 根据拉格朗日函数:
[0262](20)
[0263] 其中, 为拉格朗日乘子,为构造的拉格朗日函数;
[0264] 根据最优化KKT条件求解,得到模型公式为:
[0265] (21)
[0266] 其中, 表示核函数。
[0267] 采用试凑法对LSSVR的参数 和 进行寻优:保持选取建模的数据个数、数据的值和高斯核函数中核参数 的值相同的情况下,设置LSSVR中 的值在0.01   10000之间变化,~为了减少计算量,采用逐渐增大值区间的方法形成 的遍历向量,同样将其应用于 的值向量。
[0268] 通过计算LSSVR模型的RMSE(Root Mean Square Error),可以得到均方根误差矩阵  ,其中,表示 的指标个数,表示 的指标个数,其中设置 。
[0269] 通过选择LSSVR模型均方根误差矩阵的最小值,输出与索引值对应的两个参数值,并通过迭代参数值的上下限来找到最优参数值。
[0270] 第六步:通过控制青霉素仿真平台Pensim2.0模型中的参数范围来模仿工业生产,来产生所需数据。具体过程如下:
[0271] 设置间歇过程中的底物浓度取值范围为12‑18 g/L, 溶解氧浓度为1.16 mmol/L,生物量浓度取值范围为0.05‑0.15 g/L,通气体积取值范围为95‑105 L,二氧化碳浓度设置为0.5 mmol/L,通气速率的取值范围为6‑10 L/hr,搅拌器功率取值范围为25‑35 W,基材进料流量取值范围为0.035‑0.045 L/hr,发酵罐温度取值范围为298‑300 K,基材进料温度取值范围为296‑298 K;
[0272] 通过改变参数的取值来输入到仿真平台中,训练生成不同的数据,本发明选取了50批次的数据构成模型的样本,其中样本的维度为选取的9个变量。挑选前30批数据返回步骤S11作为输入进行模型训练,直至步骤S15。在模型训练完成以后,输入剩余批次数据作为测试集返回步骤S20,直至步骤S25结束。
[0273] 在本实施例中,本发明利用上述方法,通过上述参数设置,可得到青霉素仿真过程产品质量预测结果。为了验证本发明方法的有效性,本实例对比了该方法与经过动态内主成分分析方法处理数据的对比结果,以此来检验本发明的预测效果。
[0274] 由图5和图6结果对比可以看出,本发明方法的回归预测结果更接近于真实值,相比另一种方法有所改进,提升了模型的预测精度,拟合效果更好。
[0275] 需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
[0276] 在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0277] 以上所述,仅为本发明较优的具体的实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。