一种蒸汽热裂解过程的预测方法转让专利

申请号 : CN202110254597.2

文献号 : CN113035287B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 邱彤毕可鑫赵祺铭张书源

申请人 : 清华大学

摘要 :

本发明属于蒸汽热裂解技术领域,涉及一种蒸汽热裂解过程的预测方法。本发明通过获取蒸汽热裂解过程中若干变量的相应的若干组生产数据,生成与工业数据相关的基函数集合,建立相应的多元自适应样条回归模型。将实时获取的蒸汽热裂解过程中的自变量输入多元自适应样条回归模型中,输出得到蒸汽热裂解过程的因变量预测值,实现蒸汽热裂解过程的预测。由于多元自适应样条回归模型具有对工业变量进行自适应筛选的能力,模型建立的过程具有可解释性。所述建模和预测过程在工业数据集上,具有对少量数据高效快速准确建模的能力,可以对蒸汽热裂解过程进行控制与优化,提高生产操作水平,保障工业装置安全稳定运行,实现过程的提质增效。

权利要求 :

1.一种蒸汽热裂解过程的预测方法,其特征在于该方法包括以下步骤:

(1)设定蒸汽热裂解产物的种类i和蒸汽热裂解产物的含量wi为因变量Y,其中wi为第i产物的含量,设定蒸汽热裂解原料的物理性质和生产操作条件为自变量X;

(2)从历史记录中获取蒸汽热裂解过程中的自变量X和因变量Y,自变量X共有P种,因变量Y共有I种,每种有n组数据,对P+I种、n组数据进行预处理;

(3)根据步骤(2)的自变量X中的n组数据,分别建立关于自变量X的多个基函数g(X),记多个基函数g(X)的集合为C1;

对于每个自变量Xj,将自变量的所有n组数据作为结点建立基函数,与数据相应的基函数g(Xp)具体表达式如下:其中,p为自变量X的种类,t是n组数据中的自变量取值,基函数g(Xp)相对于取值t成对出现,以 和 表示,对自 变 量 X 中的 所 有 数 据 取基 函 数 后 ,得 到 基 函 数集 合 C 1 ,其中n为数据的个数,p为自变量X的种类,p=1,2……P;

(4)采用多元自适应样条回归模型,利用步骤(3)的基函数集合C1对多元自适应样条回归模型进行训练,得到一个用于预测因变量Y的多元自适应样条回归模型,包括以下步骤:(4‑1)设定一个多元自适应样条回归模型的升幂次数k;

(4‑2)根据步骤(3)的基函数集合C1中的基函数,将 和 作为自变量,对因变量Y进行向前逐步回归,得到一个基于一次基函数的回归模型,其过程如下:(4‑2‑1)建立每个基函数g(Xp)与因变量Y的第一一次回归方程,即Y=βtpg(Xp)+β0,其中,g(Xp)为自变量X在种类p上的取值t的基函数,βtp为基函数g(Xp)的回归系数,该回归系T ‑1 T数由最小二乘法计算公式确定,为βtp=(g(Xp) g(Xp)) g(Xp) Y,其中上标T为矩阵转置,β0为第一一次回归方程的常数项;分别计算以上每个第一一次回归方程的F统计量,计算公式为 其中n为数据集中数据的个数,m为方程Y=βtpgt(Xp)+β0中自变量X的维度,SSR为剩余平方和,SSR的计算公式为 其中 是因变量Y的估计值,是Y的平均值,SSE为回归平均值,SSE的计算公式为 上标T为矩阵转置,从以上多个第一一次回归方程的F统计量中选出最大的F统计量值,记为 k为与最大F统计量相对应的第k个回归方程;设F统计量的显著性临界值为α,对F统计量的最大值 进行判断,若则停止筛选,进行步骤(4‑3),若 则将与 相对应的基函数放入一个基函数集中,记该基函数集为 进行步骤(4‑2‑2),其中Fα为与临界值α相对应的F分布值,通过查询F分布值表得到,n为数据集中数据的个数;

(4‑2‑2)分别将集合C1中剩余的每个基函数与基函数集 中的基函数组合,建立多个第二一次回归方程,计算每个第二一次回归方程的F统计量,计算公式同步骤(4‑2‑1),将多个F统计量中的最大值记为 对 进行判断,若 则停止筛选,进行步骤(4‑3),若 则将F统计值最大的第二一次回归方程中的基函数放入基函数集,记该基函数集为 其中Fα为与临界值α对应的F分布值,n为数据集中数据的个数,进行步骤(4‑2‑3);

(4‑2‑3)设定第一一次回归方程的F统计量的阈值 重复步骤(4‑2‑2),直到其中q为基函数集合C1中的基函数个数,n为数据集中数据的个数,得到

一个基于一次基函数的向前回归模型 其中X是自变量的所有数据,M

是该模型中选定的基函数的总数, 是该模型中的基函数,βm是基函数的回归系数,β0是一次基函数的向前回归模型中的常数项;并将 的集合记为 该基函数集中共有q个函数;

(4‑3)对步骤(4‑2)的一次基函数的向前回归模型进行向后删减过程,得到基于一次基函数的向后回归模型,具体过程如下:(4‑3‑1)计算步骤(4‑2)中一次基函数的向前回归模型的广义交叉验证函数GCV的值,记为GCVq,计算公式为 其中wiz为蒸汽热裂解产物种类i在数据z中的含量;fiz(Xp)是一次基函数的向前回归模型在数据z上的预测值,n是数据集中数据的个数;G是有效参数的个数,G=2q+1;

(4‑3‑2)从步骤(4‑2)的一次基函数的向前回归模型的q个基函数中,任意删除一个基函数,得到q个包含q‑1个基函数的一次基函数的向后回归模型,分别计算该q个模型的广义交叉验证函数GCV的值,记其中的最小值为GCVq‑1,对该GCVq‑1进行判断,若GCVq‑1

f1(X);

(4‑3‑3)重复步骤(4‑3‑2),直至GCV的值不再减小,即GCVq‑1

(4‑4)对步骤(4‑3‑3)的基函数集h1(X)进行升幂次迭代,即,将基函数集合h1(X)中的所有项与步骤(3)的集合C1中的所有基函数g(Xp)相乘,得到一个基函数集合C2,将基函数集合C2中的基函数作为新的基函数,重复步骤(4‑2)和步骤(4‑3),得到基函数集h2(X),得到二次基函数的多元自适应样条回归模型f2(X);

(4‑5)设定一个广义交叉验证函数GCV的阈值,重复步骤(4‑4)的升幂次过程,若多元自适应样条回归模型的相应GCV达到阈值,或多元自适应样条回归模型的升幂次数达到步骤(4‑1)设定的升幂次数,则确认所述的多元自适应样条回归模型为用于预测因变量Y的多元自适应样条回归模型;

(5)实时获取蒸汽热裂解过程中的自变量X,将该自变量X输入步骤(4)的多元自适应样条回归模型中,输出得到蒸汽热裂解过程的因变量预测值,实现蒸汽热裂解过程的预测。

说明书 :

一种蒸汽热裂解过程的预测方法

技术领域

[0001] 本发明属于蒸汽热裂解技术领域,涉及一种蒸汽热裂解过程的预测方法,尤其涉及一种基于多元自适应样条回归的蒸汽热裂解过程的预测方法。

背景技术

[0002] 蒸汽热裂解过程是一种重要的石油二次加工过程,该过程通过燃料气燃烧和过热蒸汽提供的热量,将多种馏分油分解为烯烃,芳烃等产物。乙烯产量被视为衡量一个国家石油化工发展水平的重要标志之一,2019年国内乙烯总产量达2052万吨,约有92%的乙烯产品来自蒸汽热裂解过程,同时大量乙烯厂在进行新建和扩建。蒸汽热裂解过程的生产操作水平,将决定最终的产物分布。对过程精确地建模模拟预测,将对过程的提质增效起到重要作用。
[0003] 现有技术主要使用机理模型进行蒸汽热裂解过程的模拟,但是机理模型建模周期长,对工业数据质量要求高,在目前面临模型需求量大,工业数据难以收集的情况下,机理模型面临推广慢,应用难的问题。而使用神经网络等方法的机器学习模型,存在外延性和可解释性差的问题。因此,研发一种高效准确、可解释性强的产物收率预测模型,对蒸汽热裂解过程具有重要的现实意义。

发明内容

[0004] 本发明的目的是提出一种蒸汽热裂解过程的预测方法,针对已有技术中蒸汽热裂解机理模型建模效率低,机器学习模型可解释性差的缺点,根据工业数据集的特点建立带有显式表达式的产物收率预测模型,以便后续控制和优化模型的继续开发,提高装置效益。
[0005] 本发明提出的蒸汽热裂解过程的预测方法,包括:
[0006] 获取蒸汽热裂解过程中的历史数据,生成与历史数据相关的基函数集合,建立相应的多元自适应样条回归模型;实时获取蒸汽热裂解过程中的生产操作条件作为自变量X,将自变量X输入多元自适应样条回归模型中,输出得到蒸汽热裂解过程的因变量预测值,实现蒸汽热裂解过程的预测。
[0007] 本发明提出的一种蒸汽热裂解过程的预测方法,其优点是:
[0008] 本发明的蒸汽热裂解过程的预测方法,通过获取蒸汽热裂解过程中与若干变量相应的若干组生产历史数据,生成与历史数据样本相关的基函数集合,建立相应的多元自适应样条回归模型。利用该多元自适应样条回归模型,对实时采集的蒸汽热裂解过程中自变量,预测得到蒸汽热裂解过程的热裂解产物种类及含量。本发明方法中涉及的多元自适应样条回归模型,由于模型具有对工业变量的自适应筛选能力,模型的建立过程具有可解释性。由于建模和预测过程以工业数据为基础,因此本方法具有对少量数据高效快速准确建模的能力,可以对蒸汽热裂解过程进行控制与优化,提高蒸汽热裂解生产操作水平,保障工业装置安全稳定运行,实现过程的提质增效。

附图说明

[0009] 图1为本发明蒸汽热裂解过程的预测方法的流程框图。
[0010] 图2为本发明中涉及的蒸汽热裂解反应器结构示意图。
[0011] 图3为本发明中实施例中广义交叉验证函数GCV变化趋势图。

具体实施方式

[0012] 本发明提出的蒸汽热裂解过程的预测方法,包括:
[0013] 获取蒸汽热裂解过程中的历史数据,生成与历史数据相关的基函数集合,建立相应的多元自适应样条回归模型;实时获取蒸汽热裂解过程中的生产操作条件作为自变量X,将自变量X输入多元自适应样条回归模型中,输出得到蒸汽热裂解过程的因变量预测值,蒸汽热裂解过程的预测。
[0014] 本发明的蒸汽热裂解过程的预测方法,其流程框图如图1所示,具体包括以下步骤:
[0015] (1)设定蒸汽热裂解产物的种类i和蒸汽热裂解产物的含量wi为因变量Y,其中wi为第i产物的含量,设定蒸汽热裂解原料的物理性质(包括原料的族组成PIONA、原料的密度D,原料的恩氏蒸馏馏程ASTM D86)和生产操作条件为自变量X,生产操作条件包括反应器的进料量F、反应器的出口温度COT、反应器的出口压力COP、反应器的横跨段温度CIT、反应器的横跨段压力CIP,如图2中所示;
[0016] (2)从历史记录中获取蒸汽热裂解过程中的自变量X和因变量Y,自变量X共有P种,因变量Y共有I种,每种有n组数据,对P+I种、n组数据进行预处理;
[0017] 具体地,p种变量包括原料的物理性质、反应器的操作参数、裂解产物的种类和含量,对所述n组数据进行数据清洗,即若一组数据中存在缺失变量,则删除该组数据,若数据中的变量偏离整体的数据分布,则删除该组数据。
[0018] (3)根据步骤(2)的自变量X中的n组数据,分别建立关于自变量X的多个基函数g(X),记多个基函数g(X)的集合为C1;
[0019] 对于每个自变量Xj,将自变量的所有n组数据作为结点建立基函数,与数据相应的基函数g(Xp)具体表达式如下:
[0020]
[0021]
[0022] 其中,p为自变量X的种类,t是n组数据中的自变量取值,基函数g(Xp)相对于取值t成对出现,以 和 表示,
[0023] 对自变 量X中的所 有数据中取 基函数后 ,得到基函 数集合C1 ,其中n为数据的个数,p为自变量X的种类,p=1、2……P;
[0024] (4)采用多元自适应样条回归模型,利用步骤(3)的基函数集合C1对多元自适应样条回归模型进行训练,得到一个用于预测因变量Y的多元自适应样条回归模型,包括以下步骤:
[0025] (4‑1)设定一个多元自适应样条回归模型的升幂次数k;
[0026] (4‑2)根据步骤(3)的基函数集合C1中的基函数,将 和 作为自变量,对因变量Y进行向前逐步回归,得到一个基于一次基函数的回归模型,其过程如下:
[0027] (4‑2‑1)建立每个基函数g(Xp)与因变量Y的第一一次回归方程,即Y=βtpg(Xp)+β0,其中,g(Xp)为自变量X在种类p上的取值t的基函数,βtp为基函数g(Xp)的回归系数,该回归T ‑1 T系数由最小二乘法计算公式确定,为βtp=(g(Xp) g(Xp)) g(Xp) Y,其中上标T为矩阵转置,β0为第一一次回归方程的常数项;分别计算以上每个第一一次回归方程的F统计量,计算公式为 其中n为数据集中数据的个数,m为方程Y=βtpgt(Xp)+β0中自变量X的
维度,SSR为剩余平方和,SSR的计算公式为 其中 是因变量Y的估计值,
是Y的平均值,SSE为回归平均值,SSE的计算公式为 上标T为矩阵转置,从
以上多个第一一次回归方程的F统计量中选出最大的F统计量值,记为 k为与最大F统计量相对应的第k个回归方程;设F统计量的显著性临界值为α,对F统计量的最大值 进行判断,若 则停止筛选,进行步骤(4‑3),若 则将与 相对应
的基函数放入一个基函数集中,记该基函数集为 进行步骤(4‑2‑2),其中Fα为与临界值α相对应的F分布值,通过查询F分布值表得到,n为数据集中数据的个数;
[0028] (4‑2‑2)分别将集合C1中剩余的每个基函数与基函数集 中的基函数组合,建立多个第二一次回归方程,计算每个第二一次回归方程的F统计量,计算公式同步骤(4‑2‑1),将多个F统计量中的最大值记为 对 进行判断,若 则停止筛选,进
行步骤(4‑3),若 则将F统计值最大的第二一次回归方程中的基函数放入
基函数集,记该基函数集为 其中Fα为与临界值α对应的F分布值,n为数据集中数据的个数,进行步骤(4‑2‑3);
[0029] (4‑2‑3)设定第一一次回归方程的F统计量的阈值 重复步骤(4‑2‑2),直到其中q为基函数集合C1中的基函数个数,n为数据集中数据的个数,得到一个基于一次基函数的向前回归模型 其中X是自变量的所有数据,M
是该模型中选定的基函数的总数, 是该模型中的基函数,βm是基函数的回归系数,β0是一次基函数的向前回归模型中的常数项;并将 的集合记为 该基函数集中共
有q个函数;
[0030] (4‑3)对步骤(4‑2)的一次基函数的向前回归模型进行向后删减过程,得到基于一次基函数的向后回归模型,具体过程如下:
[0031] (4‑3‑1)计算步骤(4‑2)中一次基函数的向前回归模型的广义交叉验证函数GCV的值,记为GCVq,计算公式为 其中wiz为蒸汽热裂解产物种类i在数据z中的含量;fiz(Xp)是一次基函数的向前回归模型在数据z上的预测值,n是数据集中数据的个数;G是有效参数的个数,G=2q+1;
[0032] (4‑3‑2)从步骤(4‑2)的一次基函数的向前回归模型的q个基函数中,任意删除一个基函数,得到q个包含q‑1个基函数的一次基函数的向后回归模型,分别计算该q个模型的广义交叉验证函数GCV的值,记其中的最小值为GCVq‑1,对该GCVq‑1进行判断,若GCVq‑1
[0033] (4‑3‑3)重复步骤(4‑3‑2),直至GCV的值不再减小,即GCVq‑1
[0034] (4‑4)对步骤(4‑3‑3)的基函数集h1(X)进行升幂次迭代,即,将基函数集合h1(X)中的所有项与步骤(3)的集合C1中的所有基函数g(Xp)相乘,得到一个基函数集合C2,将基函数集合C2中的基函数作为新的基函数,重复步骤(4‑2)和步骤(4‑3),得到基函数集h2(X),得到二次基函数的多元自适应样条回归模型f2(X);
[0035] (4‑5)设定一个广义交叉验证函数GCV的阈值,重复步骤(4‑4)的升幂次过程,若多元自适应样条回归模型的相应GCV达到阈值,或多元自适应样条回归模型的升幂次数达到步骤(4‑1)设定的升幂次数,则确认所述的多元自适应样条回归模型为用于预测因变量Y的多元自适应样条回归模型;
[0036] (5)实时获取蒸汽热裂解过程中的自变量X,将该自变量X输入步骤(4)的多元自适应样条回归模型中,输出得到蒸汽热裂解过程的因变量预测值,实现蒸汽热裂解过程的预测。
[0037] 在本发明的一个实施例中,选择因变量为裂解气中的乙烯,含量为因变量,得到的最终建立的多元自适应回归模型为:
[0038] Y=31.5290+0.0066×max(0,819.86‑COT)‑0.0487×max(0,CIT‑599.60)[0039] +0.0214×max(0,169.78‑CIP)‑0.0388×max(0,F‑37496.87)
[0040] +0.0093×max(0,CIT‑599.60)×max(0,18.861‑NAP_N)
[0041] +0.0138×max(0,819.86‑COT)×max(0,34.735‑NAP_I)
[0042] 计算结果表明裂解气中的乙烯含量Y主要与反应器出口温度(COT),反应器横跨段温度(CIT),反应器横跨段压力(CIP),反应器总进料量(F),石脑油进料中的环烷烃组分含量(NAP_N),石脑油进料中的异构烷烃组分含量(NAP_I)密切相关。在多元自适应样条回归过程中,广义交叉验证函数GCV随基函数数量的增加,其变化趋势如图3所示。
[0043] 本实施例通过获取蒸汽热裂解过程中若干变量的相应的若干组生产数据,生成与工业数据样本相关的基函数集合,建立相应的多元自适应样条回归模型。由于模型具有对工业变量进行自适应筛选的能力,模型建立的过程具有可解释性。所述建模和预测过程在工业数据集上,具有对少量数据高效快速准确建模的能力,可以对蒸汽热裂解过程进行控制与优化,提高生产操作水平,保障工业装置安全稳定运行,实现过程的提质增效。
[0044] 以上所述仅为本发明的较佳实施例,对发明而言仅仅是说明性的,而非限制性的。本专业技术人员理解,在发明权利要求所限定的精神和范围内可对其进行许多改变,修改,甚至等效,但都将落入本发明的保护范围内。