一种不等长批次条件下青霉素生产过程核学习监测方法转让专利

申请号 : CN201410129328.3

文献号 : CN103901855B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 葛志强

申请人 : 浙江大学

摘要 :

本发明公开了一种不等长批次条件下青霉素生产过程核学习监测方法,用于该过程批次不等长条件下的产品质量在线监测。本发明利用基于支持向量数据描述的核学习方法,建立了一个有效的非线性监测模型,并克服了青霉素生产过程批次不等长所造成的问题,提高了该过程的在线监测效率和性能,从而使得青霉素生产过程更加可靠,产品质量更加稳定。

权利要求 :

1.一种不等长批次条件下青霉素生产过程核学习监测方法,其特征在于,包括以下步骤:(1)利用集散控制系统收集青霉素生产过程的数据,组成建模用的训练样本集:i=1,2,…,I,其中,R为实数集,即表示Xi服从Ki×J的二维数据分布,I为该数据的批次信息,Ki为第i个批次的采样数据点数,J为变量个数,将这些数据存入历史数据库;

(2)沿着时间点方向对每一个数据矩阵进行排列,得到新的数据矩阵,并对其进行预处理和归一化,即使得各个过程变量的均值为零,方差为1,得到新的数据矩阵集为该步骤具体为:沿着时间点方向对每一个批次数据组成的矩阵进行排列,即:其中,X1(K1×J),X2(K2×J)和XI(KI×J)分别为第一、第二和第I批次的数据矩阵集,它们的行代表的是K1个、K2个和KI个采样样本点数,列代表的是J个变量;

(3)基于步骤(2)得到的二维数据矩阵集 采用基于支持向量数据描述的核学习方法,建立非线性过程监测模型,并构造基于距离因子的监测统计量,确定其统计限;

(4)将建模数据和各个模型参数存入历史数据库和实时数据库中备用;

(5)收集新的过程数据,并对其进行预处理和归一化;

(6)采用核学习监测模型对其进行监测,计算各个统计量的值,与统计限的值进行比较,得出青霉素生产过程的在线监测结果。

2.根据权利要求1所述一种不等长批次条件下青霉素生产过程核学习监测方法,其特征在于,所述步骤(3)具体为:针对步骤(2)得到的二维数据矩阵,建立支持向量数据描述模型,即解如下的优化问题Q:s.t.||Φ(x)-a||2≤R2+ξi,ξi≥0

其中,Q为优化目标函数,R为超球体的半径,C为调节参数,ξi为每个样本的松弛系数,Φ(x)为非线性映射函数,||·||表示向量2-范数,s.t.代表的是约束条件;

在高维特征空间中,可以得到超球体的球心a和半径R分别为:

其中,r,p,q,分别为各批次的标号,αi和αj为第i个和第j个样本的拉格朗日参数,x0为优化过程的初始化样本,xi和xj代表不同的单个样本,K(·)为核函数,代表高维空间的内积;

在支持向量数据描述模型基础上,构造基于距离因子的统计量,也即样本到超球体球心的距离Dist,即:其中,Dist是距离distance的简写,x为当前测试样本,该距离统计量的统计限为超球体半径的平方值。

3.根据权利要求1所述一种不等长批次条件下青霉素生产过程核学习监测方法,其特征在于,所述步骤(6)具体为:对于归一化之后的新批次数据 采用支持向量数据描述模型对其进行监测,计算监测统计量 如下:在高维特征空间中,当该数据与超球体球心之间的距离小于超球体的半径时,我们可以认为过程处于可控的运行状态;相反,当该数据与超球体球心之间的距离超出超球体的半径时,过程很可能发生了某种异常的状况,此时应该发出警报,尽快查明原因,排除故障。

说明书 :

一种不等长批次条件下青霉素生产过程核学习监测方法

技术领域

[0001] 本发明属于青霉素生产过程监测领域,尤其涉及一种不等长批次条件下青霉素生产过程核学习监测方法。

背景技术

[0002] 青霉素生产过程对产品质量的要求极高,如何有效地防止过程产生劣质或者不合格的产品是迫切需要解决的问题。另一方面,如果不对过程进行很好的监测,有可能会发生事故,轻者影响产品的质量,重者将会造成生命和财产的损失。此外,对青霉素生产过程进行监测获得的结果还可以反过来指导生产过程和生产工艺的改进。作为一种典型的间歇生产过程,传统的青霉素过程监测方法通常采用多向形式的多元统计分析方法,比如多向主元分析方法(MPCA)和多向偏最小二乘方法(MPLS)等。但是,由于青霉素生产过程往往具有非常强的非线性特性,且各个批次数据的长度也不完全一样,这就大大限制了传统方法的适用范围。

发明内容

[0003] 本发明的目的在于针对现有技术的不足,提供一种不等长批次条件下青霉素生产过程核学习监测方法。
[0004] 本发明的目的是通过以下技术方案来实现的:一种不等长批次条件下青霉素生产过程核学习监测方法,包括以下步骤:
[0005] (1)利用集散控制系统收集青霉素生产过程的数据,组成建模用的训练样本集:i=1,2,…,I,其中,R为实数集,即表示Xi服从Ki×J的二维数据分布,I为该数据的批次信息,Ki为第i个批次的采样数据点数,J为变量个数,将这些数据存入历史数据库;
[0006] (2)沿着时间点方向对每一个数据矩阵进行排列,得到新的数据矩阵,并对其进行预处理和归一化,即使得各个过程变量的均值为零,方差为1,得到新的数据矩阵集为(3)基于步骤2得到的二维数据矩阵集 ,采用基于支持向量数据描述的核学习方法,建立非线性过程监测模型,并构造基于距离因子的监测统计差为1,确定其统计限;
[0007] (4)将建模数据和各个模型参数存入历史数据库和实时数据库中备用;
[0008] (5)收集新的过程数据,并对其进行预处理和归一化;
[0009] (6)采用核学习监测模型对其进行监测,计算各个统计量的值,与统计限的值进行比较,得出青霉素生产过程的在线监测结果。
[0010] 本发明的有益效果是:通过将青霉素生产过程的三维数据矩阵沿着时间点方向展开为新的二维数据矩阵,克服了过程中批次不等长的问题。基于单类支持向量机的核学习方法,对于青霉素生产过程的非线性数据特性,具有非常强的建模能力。同时,基于距离因子的监测统计量实施起来方便、简单,非常适合青霉素生产过程的在线监测。相比目前的其它青霉素过程监测方法,本发明不仅可以大大提高该过程的监测效果,而且在很大程度上降低了青霉素生产过程监测的复杂度。

附图说明

[0011] 图1是青霉素生产过程的示意图;
[0012] 图2是本发明方法对青霉素生产过程正常批次数据的监测结果;
[0013] 图3是线性主元分析模型对青霉素生产过程正常批次数据的监测结果;
[0014] 图4是本发明方法对青霉素生产过程故障批次数据的监测结果;
[0015] 图5是线性主元分析模型对青霉素生产过程故障批次数据的监测结果。

具体实施方式

[0016] 本发明一种不等长批次条件下青霉素生产过程核学习监测方法,包括以下步骤:
[0017] 第一步:利用集散控制系统收集青霉素生产过程的数据,组成建模用的训练样本集: i=1,2,…,I,其中,R为实数集,即表示Xi服从Ki×J的二维数据分布,I为该数据的批次信息,Ki为第i个批次的采样数据点数,J为变量个数,将这些数据存入历史数据库;
[0018] 第二步:沿着时间点方向对每一个数据矩阵进行排列,得到新的数据矩阵,并对其进行预处理和归一化,即使得各个过程变量的均值为零,方差为1,得到新的数据矩阵集为[0019] 沿着时间点方向对每一个批次数据组成的矩阵进行排列,即:
[0020]
[0021] 其中,X1(K1×J),X2(K2×J)和XI(KI×J)分别为第一,第二和第I批次的数据矩阵集,它们的行代表的是K1个,K2个和KI个采样样本点数,列代表的是J个变量。这样,每个批次的数据全部排列为时间序列的形式,很好的克服了各个批次数据不等长的问题。
[0022] 另外,在历史数据库中对采集到的过程数据进行预处理,剔除野值点和明显的粗糙误差数据,为了使得过程数据的尺度不会影响到监测的结果,对不同变量的数据分别进行归一化处理,即各个变量的均值为零,方差为1。这样,不同过程变量的数据就处在相同的尺度之下,既而不会影响到后续的监测效果。
[0023] 第三步:基于得到的二维数据矩阵 采用基于支持向量数据描述的核学习方法,建立非线性过程监测模型,并构造基于距离因子的监测统计量确定其统计限。
[0024] 针对上一步得到的二维数据矩阵,建立支持向量数据描述模型,也即解如下的优化问题Q:
[0025]
[0026] s.t.||Φ(x)-a||2≤R2+ξi,ξi≥0
[0027] 其中,Q为优化目标函数,R为超球体的半径,C为调节参数,ξi为每个样本的松弛系数,Φ(x)为非线性映射函数,||g||2表示二范数。s.t.代表的是约束条件。
[0028] 在高维特征空间中,可以得到超球体的球心a和半径R分别为:
[0029]
[0030]
[0031] 其中r,p,q,分别为各批次的标号,αi和αj为第i个和第j个样本的拉格朗日参数,x0为优化过程的初始化样本,xi和xj代表不同的单个样本,K(g)为核函数,代表高维空间的内积。
[0032] 在支持向量数据描述模型基础上,构造基于距离因子的统计量,也即样本到超球体球心的距离Dist,即:
[0033]
[0034] 其中,Dist是距离distance的简写,x为选取测试样本,该距离统计量的统计限刚好为超球体半径的平方值。
[0035] 第四步:将建模数据和模型参数存入历史数据库和实时数据库中备用。
[0036] 第五步:收集新的青霉素生产过程批次过程数据,并进行预处理和归一化。
[0037] 对于过程中新收集到的数据样本,除了对其进行预处理之外,还要采用建模时的模型参数对该数据点进行归一化,即减去建模均值和除以建模标准差。
[0038] 第六步:采用核学习监测模型对其进行监测,计算各个统计量的值,与统计限的值进行比较,得出青霉素生产过程的在线监测结果。
[0039] 对于归一化之后的新批次数据 采用支持向量数据描述模型对其进行监测,计算监测统计量 如下:
[0040]
[0041] 在高维特征空间中,当该数据与超球体球心之间的距离小于超球体的半径时,我们可以认为过程处于可控的运行状态;相反,当该数据与超球体球心之间的距离超出超球体的半径时,过程很可能发生了某种异常的状况,此时应该发出警报,尽快查明原因,排除故障。
[0042] 以下结合一个具体的青霉素生产过程例子来说明本发明的有效性。该过程的流程示意图如图1所示,过程的监测变量如表1所示。为了建立基于核学习的非线性过程监测模型,在过程的正常操作工况下一共收集9批数据组成建模用的数据样本。其中,每一批数据中均包含有400个建模样本。在建模之前,我们首先将这9批数据沿着时间方向展开为一个3600*9的二维数据矩阵。然后,利用支持向量数据描述方法对该二维数据矩阵进行建模,并构造基于距离因子的监测统计量对过程进行在线监测。接下来结合该具体过程对本发明的实施步骤进行详细地阐述:
[0043] 1.采集过程正常工况数据,数据预处理,归一化和重新排列
[0044] 对收集到的9批次有效的过程建模数据样本进行预处理,剔除过程的野值点和粗糙误差点,把每一个批次数据按照时间方向展开成二维数据矩阵并对其进行归一化,得到[0045] 2.利用支持向量数据描述方法建立统计量并确定其统计限,并将所有的模型和参数存入数据库中备用。由于青霉素过程一般由两个操作阶段组成,所以我们需要对两个阶段分别建立核学习统计监测模型,这样,我们一共需要两个支持向量数据描述模型来对青霉素过程进行建模。
[0046] 3.获取当前监测数据信息,并对其进行预处理和归一化
[0047] 为了测试新方法的有效性,分别对正常批次和故障批次的数据进行测试。随机选取某一正常批次的数据,并利用建模用的归一化参数对其进行处理。选取一种典型故障进行测试,同样对其进行归一化处理。
[0048] 4.在线过程监测
[0049] 首先对正常批次的过程数据进行监测,本发明方法和传统的基于主元分析的线性监测方法得到的监测结果分别如图2和图3所示。从图中可以看出,本发明方法能对该批次做出较好的监测,即没有误报现象发生,说明新的方法并没有损失其在正常工况下的监测效果。相比之下,线性主元分析方法发生了较多的误报情况,即将该正常运行的过程状态误判为故障的状态,这会对青霉素过程的安全运行以及产品的质量监测造成干扰。然后,对故障批次进行监测,本发明方法和线性主元分析方法的监测效果如图4和图5所示。可以明显看出,本发明方法在第200个小时之后能连续监测到过程的故障,这正符合过程的真实情况。相比之下,现在主元分析方法的效果就差很多,其中,在第200个小时之后,两个统计量均只能断断续续地监测到过程的故障,另外,在200个小时之前,该方法还发生了较多的故障误报情况,这在青霉素生产过程中是尽量要避免发生的情况。
[0050] 表1:监测变量说明
[0051]序号 变量 序号 变量
1 通风速率(l/h) 6 二氧化碳浓度(mmol/l)
2 搅拌功率(W) 7 pH值
3 补料温度(K) 8 反应温度(K)
4 溶解氧浓度(g/l) 9 冷却水流量(l/h)
5 发酵体积(l)    
[0052] 上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。