一种基于半监督混合模型的聚丙烯熔融指数预测方法转让专利

申请号 : CN201711236164.4

文献号 : CN108171002B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 邵伟明宋执环

申请人 : 浙江大学

摘要 :

本发明公开了一种基于半监督混合模型的聚丙烯熔融指数预测方法,它首先通过分开处理辅助变量与熔融指数、并显式考虑熔融指数与辅助变量间的依赖关系,建立概率化的数学模型;然后同时挖掘有标签样本与无标签样本信息,利用期望最大化算法和贝叶斯信息准则进行自动模型参数学习与模型选择。该方法能够在线实时提供熔融指数的预测值,并评估其可信度。应用本发明,可提高模型参数学习以及模型选择的准确性、且所有参数无需人工设置,能够有效提高熔融指数的预测精度,为提高产品质量、降低成本、过程监控以及决策制定提供技术支持与保障。

权利要求 :

1.一种基于半监督混合模型的聚丙烯熔融指数预测方法,其特征在于,包括以下步骤:(1)选择与聚丙烯熔融指数y关联的辅助变量x∈Rm,其中m表示辅助变量个数;

(2)收集同时包含辅助变量与熔融指数的有标签样本集 与仅包含辅助变量的无标签样本集 其中n1与n2分别代表有标签样本与无标签样本的数量;

(3)对[XL,YL]与XU做无量纲化处理,将辅助变量样本与熔融指数样本的样本方差转换为单位方差;

(4)给定半监督混合模型的高斯成分个数K ,随机初始化模型参数其中,αk为第k个高斯成分的先验概率, 和 分别为第k个高斯成分中x的边缘概率密度的均值和协方差矩阵,ωk和ωk分别为第k个高斯成分中x与y的回归系数, 代表第k个高斯成分中熔融指数y的测量噪声方差;

(5)将步骤(3)处理后的有标签样本集、无标签样本集和步骤(4)中的初始化模型参数输入半监督混合模型中,通过最大化半监督目标函数L(ΘK)学习模型参数ΘK;

(6)遍历K=Kmin,Kmin+1,…,Kmax,重复步骤(4)和(5),利用贝叶斯信息准则计算最优高斯成分个数,记为Kopt,并从 中选择相应的模型参数集(7)采集仅包含辅助变量的未知样本,按步骤(3)消除辅助变量的量纲,利用步骤(6)中获得的最优高斯成分个数Kopt及相应的模型参数集 对聚丙烯的熔融指数进行预测,并提供该预测值的置信区间。

2.根据权利要求1所述的基于半监督混合模型的聚丙烯熔融指数预测方法,其特征在于,所述的步骤(5)中构建的半监督混合模型的目标函数L(ΘK)为:其中,Pk(yi|xi)为第k个高斯成分中给定xi熔融指数yi的条件概率密度,Pk(xi)和Pk(xj)分别为第k个高斯成分中xi和xj的边缘概率密度,Rik为[xi,yi]对第k个高斯成分的隶属度,Rjk为xj对第k个高斯成分的隶属度,它们的计算公式如下:式中,N(·;μ,Σ)表示均值为μ,协方差矩阵为Σ的正态分布;

和 分别表示x和y的联合概率密度的均值向量与协方差矩阵,其中,

3.根据权利要求2所述的基于半监督混合模型的聚丙烯熔融指数预测方法,其特征在于,所述的模型参数 的迭代公式具有如下形式:式中 1为全1列向量。

4.根据权利要求3所述的基于半监督混合模型的聚丙烯熔融指数预测方法,其特征在于,所述的步骤(6)中,最优高斯成分个数Kopt的计算公式如下:其中,BIC(K)代表高斯成分个数为K时的贝叶斯信息准则的取值,其计算公式如下:

说明书 :

一种基于半监督混合模型的聚丙烯熔融指数预测方法

技术领域

[0001] 本发明属于过程系统软测量建模与应用领域,具体涉及一种基于半监督混合模型的聚丙烯熔融指数预测方法。

背景技术

[0002] 聚丙烯树脂由于具有比重小、无毒、无味、易加工、抗冲击强度高、抗扭曲性好以及电绝缘性好等优点,在国民经济的众多工业领域中获得了十分广泛的应用。熔融指数是衡量聚丙烯产品质量的重要指标,通常以实验室化验分析的方式测量,周期为2-4小时。如此大的测量滞后会显著降低闭环控制系统的动态性与稳定性,卡边控制更无从谈起,致使聚丙烯生产过程波动强烈、产品废料多,不仅增加了企业的生产成本,也加剧了环境污染。
[0003] 熔融指数的软测量模型可实现熔融指数的在线实时预测。目前熔融指数的软测量建模方法可归纳为两大类。第一类是根据聚合反应的机理建立机理模型,另一类是利用生产过程数据建立数据驱动的模型。准确的机理模型动态性好,预测精度高,适用范围广,然而由于聚丙烯生产过程机理非常复杂且尚未完全清楚,熔融指数机理模型通常需要大量强烈的假设条件,一般较适用于稳态设计。相比而言,数据驱动的模型直接采用过程数据建立模型,更能反映实际生产状况的实时性,因此更适合熔融指数的在线预测。
[0004] 建立数据驱动的熔融指数软测量模型主要有两个难点。第一,由于市场需求,聚丙烯生产过程操作工况众多,产品通常具有多个牌号(可高达数十个),使得聚丙烯生产过程数据呈现强非线性、非高斯性等特性。单个全局模型(如偏最小二乘模型、神经网络模型、支持向量机模型等)难以在所有牌号范围内提供满意的预测精度。第二,目前的熔融指数预测方法通常为有监督学习方法,即仅依赖带有熔融指数化验值的有标签样本。然而由于熔融指数化验周期长,有标签样本的数量一般很少,使得熔融指数软测量模型由于“过学习”或“欠学习”等原因难以获得准确的模型参数。训练不佳的软测量模型必然无法提供满意的预测精度,而且人工整定参数耗时费力,难度非常大。另一方面,仅包含辅助变量的无标签样本大量存在,但现有的熔融指数软测量模型无法挖掘这些无标签样本蕴含的重要过程信息。此外,在软测量模型提供熔融指数预测值之后,人们还希望知道该预测值的可靠性有多大,即对熔融指数的预测精度进行评估。遗憾的是,目前多数熔融指数软测量模型不具备这一功能。因此,研究和开发具备多牌号处理、无标签样本信息挖掘以及预测精度评估等功能的熔融指数软测量模型,有助于提高熔融指数的预测精度,助力生产企业实现节能环保、降本增效的目标,是十分必要和迫切的。

发明内容

[0005] 针对现有技术的不足,本发明提供一种基于半监督混合模型的聚丙烯熔融指数预测方法,以混合模型的形式建立辅助变量和熔融指数的非线性关系,能够自适应应对牌号切换,有效解决产品牌号众多引起的强非线性、非高斯性问题,并通过半监督学习同时挖掘有标签样本和无标签样本蕴含的信息,使得模型训练更可靠。具体技术方案如下:
[0006] 一种基于半监督混合模型的聚丙烯熔融指数预测方法,其特征在于,包括以下步骤:
[0007] (1)选择与聚丙烯熔融指数y关联的辅助变量x∈Rm,其中m表示辅助变量个数;
[0008] (2)收集同时包含辅助变量与熔融指数的有标签样本集 与仅包含辅助变量的无标签样本集 其中n1与n2分别代表有标签样本与无标签样本的数量;
[0009] (3)对[XL,YL]与XU做无量纲化处理,将辅助变量样本与熔融指数样本的样本方差转换为单位方差;
[0010] (4)给定半监督混合模型的高斯成分个数K,随机初始化模型参数其中,αk为第k个高斯成分的先验概率, 和 分别为第k个高斯成分中x的边缘概率密度的均值和协方差矩阵,ωk和ωk分别为第k个高斯成分中x与y的回归系数, 代表第k个高斯成分中熔融指数y的测量噪声方差;
[0011] (5)将步骤(3)处理后的有标签样本集、无标签样本集和步骤(4)中的初始模型参数输入半监督混合模型中,通过最大化半监督目标函数L(ΘK)学习模型参数ΘK;
[0012] (6)遍历K=Kmin,Kmin+1,…,Kmax,重复步骤(4)和(5),利用贝叶斯信息准则计算最优高斯成分个数,记为Kopt,并从 中选择相应的模型参数集
[0013] (7)采集仅包含辅助变量的未知样本,按步骤(3)消除辅助变量的量纲,利用步骤(6)中获得的最优高斯成分个数Kopt及相应的模型参数集 对聚丙烯的熔融指数进行预测,并提供该预测值的置信区间。
[0014] 进一步地,所述的步骤(5)中构建的半监督混合模型的目标函数L(ΘK)为:
[0015]
[0016] 其中,Pk(yi|xi)为第k个高斯成分中给定xi熔融指数y的条件概率密度,Pk(xi)和Pk(xj)分别为第k个高斯成分中xi和xj的边缘概率密度,Rik为[xi,yi]对第k个高斯成分的隶属度,Rjk为xj对第k个高斯成分的隶属度,它们的计算公式如下:
[0017]
[0018]
[0019]
[0020]
[0021]
[0022] 式中,N(·;μ,Σ)表示均值为μ、协方差矩阵为Σ的正态分布;
[0023] 和 分别表示x和y的联合概率密度的均值向量与协方差矩阵,其中,[0024]
[0025]
[0026] 进一步地,所述的模型参数 的迭代公式具有如下形式:
[0027]
[0028]
[0029]
[0030]
[0031]
[0032] 式中 1为全1列向量。
[0033] 进一步地,所述的步骤(5)中,最优高斯成分个数Kopt的计算公式如下:
[0034]
[0035] 其中,BIC(K)代表高斯高斯成分个数为K时的贝叶斯信息准则的取值,其计算公式如下:
[0036]
[0037] 与现有技术相比,本发明的有益效果如下:
[0038] 1、以混合模型的形式建立辅助变量和熔融指数的非线性关系,能够自适应应对牌号切换,有效解决产品牌号众多引起的强非线性、非高斯性问题;
[0039] 2、通过半监督学习同时挖掘有标签样本和无标签样本蕴含的信息,使模型训练更可靠;
[0040] 3、所有模型参数均可自适应学习,无需人工干预,无需额外的校验数据集,极大节省了投入到模型开发的时间和精力;
[0041] 4、除提供熔融指数的预测值之外,本发明还可提供该预测值的置信区间,用于预测精度判别、异常样本分类以及保障模型更新的可靠性等。

附图说明

[0042] 图1为本发明的基于半监督混合模型的聚丙烯熔融指数预测方法的流程图;
[0043] 图2为某石化企业Spheripol-II液相本体法聚丙烯生产装置的工艺原理图;
[0044] 图3为基于半监督混合模型的聚丙烯熔融指数在线预测结果及其置信区间示意图;
[0045] 图4为偏最小二乘模型对熔融指数的预测结果示意图。

具体实施方式

[0046] 下面结合具体的实施例对本发明的基于半监督混合模型的聚丙烯熔融指数预测方法作进一步的阐述。需要指出的是,所描述的实施例仅旨在加强对本发明的理解,并不对本发明起任何限定作用。
[0047] 一种基于半监督混合模型的聚丙烯熔融指数预测方法,如图1所示,具体包括如下步骤:
[0048] (1)选择与聚丙烯熔融指数y关联的辅助变量x∈Rm,其中m表示辅助变量个数;
[0049] 本实施例根据对某石化公司Spheripol-II液相本体法聚丙烯生产工艺(如图2所示)的机理分析,选择对熔融指数影响最大的8个变量作为辅助变量,分别为反应器R201内氢气/丙烯浓度比(x1)、反应器R201内催化剂/丙烯浓度比(x2)、反应器R201的反应热(x3)、反应器R201的反应密度(x4)、反应器R202内氢气/丙烯浓度比(x5)、反应器R202内催化剂/丙烯浓度比(x6)、反应器R202的反应热(x7)以及反应器R202的反应密度(x8),因此辅助变量x=[x1,x2,…,x8],即x∈Rm,m=8。
[0050] (2)收集同时包含辅助变量与熔融指数的有标签样本集 与仅包含辅助变量的无标签样本集 其中n1与n2分别代表有标签样本与无标签样本的数量;
[0051] 本发明从计算机分散控制系统数据库中收集同时包含辅助变量与熔融指数的有标签样本集200组(记为 ),与仅包含辅助变量的无标签样本集200组(记为),作为训练数据集,其中n1=200与n2=200分别代表有标签样本与无标签样本的数量。
[0052] (3)对[XL,YL]与XU做无量纲化处理,将辅助变量样本与熔融指数样本的样本方差转换为单位方差;
[0053] 其中去量纲的方法为:
[0054]
[0055] 式中, 分别代表第l个辅助变量和熔融指数的样本标准差,xn(l)表示第n个样本的第l个辅助变量的采样值。
[0056] (4)给定半监督混合模型的高斯成分个数K,随机初始化模型参数其中,αk为第k个高斯成分的先验概率, 和 分别为第k个高斯成分中x的边缘概率密度的均值和协方差矩阵,ωk和ωk分别为第k个高斯成分中x与y的回归系数, 代表第k个高斯成分中熔融指数y的测量噪声方差;
[0057] (5)将步骤(3)处理后的有标签样本集、无标签样本集和步骤(4)中的初始模型参K K数输入半监督混合模型中,通过最大化半监督目标函数L(Θ)学习模型参数Θ ;即给定混合模型高斯成分数量K时,每个高斯成分的先验概率、x的边缘概率密度、x与y的函数关系以及噪声方差。具体过程为:
[0058] 第k(k=1,2,…,K)个高斯成分中,辅助变量x的边缘概率密度Pk(x)、x与y的函数关系y=fk(x)定义为
[0059]
[0060] 式中N(·;μ,Σ)表示均值为μ,协方差矩阵为Σ的正态分布;
[0061] 对公式(2)进行线性高斯运算,可获得熔融指数y的条件概率密度Pk(y|x)以及x和y的联合概率密度Pk(x,y),如下式所示:
[0062]
[0063] 根据协方差的定义以及概率的加法法则,可获得x的全局概率密度P(x)、x和y的全局联合概率密度P(x,y)具有如下形式:
[0064]
[0065] 式中, 和 分别表示x和y的联合概率密度的均值向量与协方差矩阵;αk表示混合模型中第k个高斯成分的先验概率;
[0066] 半 监督 混 合 模型 中 ,给 定 高斯 成 分 个数 K 待估 计的 参 数 包 括由于通过概率学习方法建模,因此可采用EM算法学习模型参数ΘK。在E步中,各隐变量的后验概率按如下公式计算:
[0067]
[0068] 式中zi和zj分别表示与第i个有标签样本和第j个无标签样本对应的离散型隐变量;
[0069] 在M步中,首先确定完整数据的对数似然函数,如下式所示:
[0070]
[0071] 其中 和 分别代表与有标签样本和无标签样本对应的隐变量集合。引入拉格朗日乘子β,结合约束 构建如下拉格朗日函数;
[0072]
[0073] 将 对αk求导,并β消除,可得αk的学习公式,如下式所示:
[0074]
[0075] 将L(ΘK)对分别对 与 求导可得
[0076]
[0077]
[0078]
[0079]
[0080] 式中 1为全1列向量。
[0081] 将上述导数置零,可得 与 的学习公式,即
[0082]
[0083]
[0084]
[0085]
[0086] (6)遍历K=Kmin,Kmin+1,…,Kmax,重复步骤(4)和(5),利用贝叶斯信息准则计算最优高斯成分个数,记为Kopt,并从 中选择相应的模型参数集
[0087]
[0088] 其中,BIC(K)代表高斯成分个数为K时的贝叶斯信息准则的取值,其计算公式如下:
[0089]
[0090] (7)采集仅包含辅助变量的未知样本xq,按步骤(3)消除辅助变量的量纲,利用步骤(6)中获得的最优高斯成分个数Kopt及相应的模型参数集 对聚丙烯的熔融指数进行预测,并提供该预测值的置信区间,具体如下:
[0091] 按下式计算熔融指数yq的条件概率密度P(yq|xq):
[0092]
[0093] 式中 zq表示与未知样本xq对应的隐变量。
[0094] 根据式(19),对熔融指数yq的预测值为
[0095]
[0096] 此外,该预测值的方差按下式计算
[0097]
[0098] 根据式(20)和式(21),熔融指数yq的置信区间(三倍标准差)的计算公式为[0099]
[0100] 为了验证本发明的有效性,从该石化公司计算机分散控制系统中收集额外的有标签样本148组作为校验样本集,按照步骤(7),对熔融指数进行预测,预测结果以及相应的置信区间如图3所示。同时,图4给出了传统偏最小二乘模型对熔融指数的预测结果。采用均方根误差(RMSE)量化本发明和偏最小二乘模型的预测精度,定义如下
[0101]
[0102] 其中yt和 分别代表第t个校验样本的化验值与预测值。本发明提供的方法与偏最小二乘模型的预测RMSE分别为0.3233和0.4097。可见,本发明较传统的偏最小二乘模型对熔融指数的预测精度有显著改善,预测误差降低了21%。此外,图3显示,本发明提供的置信区间能提供合适的宽度涵盖熔融指数的真实分布,而传统的方法是不具备这一功能的。
[0103] 上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明做出的任何修改和改变,都落入本发明的保护范围。