基于PSO-DMPC的反应再生系统优化控制方法转让专利

申请号 : CN201710447640.0

文献号 : CN107065576B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 白竣仁陈雪梅周伟吴凌陈实易军

申请人 : 重庆科技学院

摘要 :

本发明公开了一种基于PSO‑DMPC的反应再生系统优化控制方法,包括:S1:将反应再生系统的传递函数模型转化为阶跃响应模型;S2:建立DMPC模型,包括开环预测模块、稳态目标计算模块和动态矩阵控制模块;S3:利用PSO算法中粒子在搜索空间内的强随机性,在不放松约束条件的前提下,在更大的范围内对经济优化函数进行求解;S4:根据PSO算法对经济优化函数求得的解获得反应再生系统的输出设定值,并与实际输出的偏差作为目标误差函数,最后利用PSO算法对该目标误差函数求解,获得操作变量的最佳变化量。本发明提供的基于PSO‑DMPC的反应再生系统优化控制方法不仅减小了RRS硬件负担,还能获取更优的操作变量参数,在保证经济效益的基础上,进一步对RRS进行优化控制。

权利要求 :

1.一种基于PSO-DMPC的反应再生系统优化控制方法,其特征在于包括如下步骤:S1:将反应再生系统的传递函数模型转化为阶跃响应模型;

S2:建立DMPC模型,DMPC模型包括开环预测模块、稳态目标计算模块和动态矩阵控制模块;其中,反应再生系统的阶跃响应模型为:

式(1)中,Δu为操作变量的变化量,k为时间,N为模型长度, 为反应再生系统的操作变量的阶跃响应系数矩阵, 为反应再生系统的干扰变量的阶跃响应系数矩阵,对于满足建立开环预测模块的过程,包括如下步骤:

S211:当Δu(k+i-1)=0、Δv(k+i-1)=0,1≤i≤P时,设 为对y(k+p|k)的预测值,其中,P为预测时域,则有:S212:考虑反馈校正,假设vss(k)=vss(k-1)+Δv(k)为已知,从k时刻开始,反应再生系统的操作变量不再变化时,基于式(2)得到反应再生系统的开环预测为yol(k+i|k),当检测到Δu(k-1)时求解得到反应再生系统的开环预测:其中,vss(k)为阶跃响应的递推模型;

建立稳态目标计算模块的过程,包括如下步骤:

S221:提取所有反应再生系统的操作变量和被控变量的硬约束条件与软约束条件,并合并表达为关于稳态操作变量的变化量δuss(k)的形式:其中, 为操作变量的上限, 为操作变量的理想值的集合, 为稳态增益矩阵,为稳态被控变量的变化量, 为被控变量的理想值的集合,k为迭代次数,t为时间;

S222:建立经济优化函数:

式(3)中,B为权重;

S223:放松约束条件,采用二次规划方法对式(3)进行求解,获得单目标下的稳态操作变量的变化量δuss(k);

建立动态矩阵控制模块的过程,包括如下步骤:

S231:取预测时域为P,控制时域为M,在每个时刻k,可得到:S232:当P大于N时,yol(k+j|k)=yol(k+N|k),j>N,该预测值包含预测误差的反馈校正及干扰的影响,得到:其中,D为动态控制矩阵;

S233:在动态矩阵中,根据PSO算法对经济优化函数求得的解获得反应再生系统的输出设定值,并与实际输出的偏差作为目标误差函数,选择最小化的目标误差函数如下:S234:对最小化的目标函数求解,获得操作变量的最佳变化量;

S3:利用PSO算法,在不放松约束条件的前提下,对经济优化函数进行求解;其中,约束条件包括操作变量的硬约束和软约束,被控变量的硬约束和软约束,外部目标的约束;

S4:根据PSO算法对经济优化函数求得的解获得反应再生系统的输出设定值,并与实际输出的偏差作为目标误差函数,利用PSO算法对该目标误差函数求解,获得操作变量的最佳变化量。

2.根据权利要求1所述的基于PSO-DMPC的反应再生系统优化控制方法,其特征在于:利用PSO算法,在不放松约束条件的前提下,对经济优化函数进行求解的过程,包括如下步骤:S31:对粒子群进行初始化,设定种群大小为N,迭代次数为m,速度更新参数为c1、c2,同时给出初始化粒子的位置和速度;

S32:根据求解的目标函数设置适应度函数,并计算每个粒子的适应度值;

S33:对每个种群中的新鲜粒子进行适应度值与个体历史最优位置的适应度值的比较,如果新鲜粒子的适应度值大于个体历史最优位置的适应度值,替代原来的个体历史最优位置,成为新的个体历史最优粒子位置;

S34:对每个种群中的新鲜粒子进行适应度值与全局历史最优位置的适应度值的比较,如果新鲜粒子的适应度值大于全局历史最优位置的适应度值,则替代原来的全局历史最优位置,成为新的个体全局最优粒子位置;

S35:更新各粒子的速度和位置;其中,

粒子的速度更新公式为:

粒子的位置更新公式为:

S36:重复步骤S31-步骤S35,如果已满足PSO算法的终止条件,则该种群中具有最大适应度的个体为最优解,否则迭代进行下一次,直到满足PSO算法的终止条件,求得最优经济目标下的稳态操作变量的变化量δuss(k)。

3.根据权利要求1所述的基于PSO-DMPC的反应再生系统优化控制方法,其特征在于:在动态矩阵中,根据PSO算法对经济优化函数求得的解获得反应再生系统的输出设定值的公式为:式(5)中,yss(k)为反应再生系统的输出设定值,δuss(k)为PSO算法对经济优化函数求得的解, 为稳态增益矩阵; 为开环稳态预测。

说明书 :

基于PSO-DMPC的反应再生系统优化控制方法

技术领域

[0001] 本发明属于石油化工技术领域,涉及一种基于PSO-DMPC的反应再生系统优化控制方法。

背景技术

[0002] 石油化工工业在我国国民经济中占有举足轻重的地位,承担着为我国提供各种能源的重担。常规的催化裂化装置由三个部分组成,包含反应再生系统、分馏系统以及吸收稳定系统。作为催化裂化的核心部分,反应再生系统(Reaction regeneration system,RRS)将原油经过加工,生成各种各样的轻质油产品。但现有的反应再生系统为非线性反应再生系统,存在控制精度低的问题。

发明内容

[0003] 鉴于上述问题,本发明的目的是提供一种基于PSO-DMPC的反应再生系统优化控制方法,以解决现有的非线性反应再生系统控制精度低的问题。
[0004] 本发明提供的基于PSO-DMPC的反应再生系统优化控制方法,包括:
[0005] S1:将反应再生系统的传递函数模型转化为阶跃响应模型;
[0006] S2:建立DMPC模型,DMPC模型包括开环预测模块、稳态目标计算模块和动态矩阵控制模块;
[0007] S3:利用PSO算法,在不放松约束条件的前提下,对经济优化函数进行求解;其中,约束条件包括操作变量的硬约束和软约束,被控变量的硬约束和软约束,外部目标的约束;
[0008] S4:根据PSO算法对经济优化函数求得的解获得反应再生系统的输出设定值,并与实际输出的偏差作为目标误差函数,利用PSO算法对该目标误差函数求解,获得操作变量的最佳变化量。
[0009] 利用上述根据本发明提供的基于PSO-DMPC的反应再生系统优化控制方法,能够赋予粒子更高的随机性,最优粒子可以表达更大范围内的最优值,该方法不仅减小了RRS硬件负担,还能获取更优的操作变量参数,真正达到RRS的自适应最优控制。

附图说明

[0010] 图1为根据本发明的基于PSO-DMPC的反应再生系统优化控制方法的流程图;
[0011] 图2为根据本发明的DMPC对RRS输出的跟踪效果图;
[0012] 图3为根据本发明的DMPC对RRS输入的跟踪效果;
[0013] 图4为根据本发明的PSO-DMPC对RRS的输出的跟踪结果图;
[0014] 图5为根据本发明的PSO-DMPC对RRS的输入的跟踪结果图。

具体实施方式

[0015] 在下面的描述中,出于说明的目的,为了提供对一个或多个实施例的全面理解,阐述了许多具体细节。然而,很明显,也可以在没有这些具体细节的情况下实现这些实施例。在其它例子中,为了便于描述一个或多个实施例,公知的结构和设备以方框图的形式示出。
[0016] 名词解释
[0017] PSO:Particle Swarm Optimization algorithm,粒子群优化算法。
[0018] DMPC:The Double-layerd Model Predictive Control,双层模型预测控制。
[0019] 图1示出了根据本发明的基于PSO-DMPC的反应再生系统优化控制方法的流程。
[0020] 如图1所示,本发明提供的基于PSO-DMPC的反应再生系统优化控制方法,包括如下步骤:
[0021] S1:将RRS的传递函数模型转化为阶跃响应模型。
[0022] 转换后的RRS的阶跃响应模型如下:
[0023]
[0024] 式(1)中,Δu为操作变量的变化量,k为时间,N为模型长度, 为RRS操作变量的阶跃响应系数矩阵, 为RRS干扰变量的阶跃响应系数矩阵,对 满足
[0025] S2:建立DMPC模型,DMPC模型包括开环预测模块、稳态目标计算模块和动态矩阵控制模块。
[0026] 建立开环预测模块的过程,包括如下步骤:
[0027] S211:当Δu(k+i-1)=0、Δv(k+i-1)=0(1≤i≤P)时,设 为对y(k+p|k)的预测值,其中,P为预测时域,则有:
[0028]
[0029] S212:考虑反馈校正,假设vss(k)=vss(k-1)+Δv(k)为已知,从k时刻开始,反应再ol生系统的操作变量不再变化时,基于式(2)得到反应再生系统的开环预测为y (k+i|k),当检测到Δu(k-1)时求解得到反应再生系统的开环预测:
[0030]
[0031] 式(3)中,vss(k)为阶跃响应的递推模型。
[0032] S213:基于式(3)与RRS的实际输出,得到误差
[0033]
[0034] S214:对误差进行一阶指数平滑处理,得到:
[0035]
[0036] S215:以平滑处理后的误差为基准,对RRS的输出进行反馈校正,且反馈校正在未来所有时间点都是恒定的,记 为k时刻的开环动态预测值得到:
[0037]
[0038]
[0039] S216:结合式(4),得到开放稳态预测:
[0040]
[0041] 建立稳态目标计算模块的过程,包括如下步骤:
[0042] S221:提取所有反应再生系统的操作变量和被控变量的硬约束条件与软约束条件,并合并表达为关于稳态操作变量的变化量δuss(k)的形式:
[0043]
[0044]
[0045]
[0046]
[0047]
[0048]
[0049] 其中, 为操作变量的上限, 为操作变量的理想值的集合, 为稳态增益矩阵, 为稳态被控变量的变化量, 为被控变量的理想值的集合,k为迭代次数,t为时间。
[0050] 更为具体地,稳态MV的硬约束为:
[0051]
[0052] 在MPC控制过程中,存在MV变化速率约束 其中,M为控制时域,则增加的稳态MV的硬约束为:
[0053]
[0054] 对δus(k)进行限制,则增加的稳态MV的硬约束为:
[0055]
[0056] 稳态CV的硬约束为:
[0057]
[0058] 稳态CV的软约束为:
[0059]
[0060] 在实际过程中,总是满足 另外,对Δyss(k)进行限制,则增加的稳态CV的硬约束为
[0061]
[0062] CV的新稳态值仅决定于δuss(k)的大小,而与MV动态变化路径无关。稳态预测模型为:
[0063]
[0064] 其中, 为稳态增益矩阵; 为开环稳态预测。
[0065] 所有条件合并表达为关于稳态操作变量的变化量δuss(k)的形式
[0066]
[0067]
[0068]
[0069]
[0070]
[0071]
[0072] S222:建立经济优化函数:
[0073]
[0074] 式(5)中,B为权重;
[0075] S223:放松约束条件,采用二次规划方法对式(5)进行求解,获得单目标下的稳态操作变量的变化量δuss(k)。
[0076] 建立动态矩阵控制模块的过程,包括如下步骤:
[0077] S231:取预测时域为P,控制时域为M。在每个时刻k,可得到:
[0078]
[0079] S232:当P大于N时,yol(k+j|k)=yol(k+N|k),j>N,该预测值包含预测误差的反馈校正及干扰的影响,得到:
[0080]
[0081]
[0082] 其中,D为动态控制矩阵;
[0083] S233:在动态矩阵中,根据PSO算法对经济优化函数求得的解获得反应再生系统的输出设定值,并与实际输出的偏差作为目标误差函数,选择最小化的目标误差函数如下:
[0084]
[0085] 为了让预测输出尽可能地接近实际输出,以式(5)的解求得RRS的输出设定值和实际输出的误差为目标误差函数。
[0086] S234:对最小化的目标函数(6)求解,获得操作变量的最佳变化量。
[0087] 采用MATLAB7.0为仿真平台,以RRS为对象,进行DMPC算法的研究,仿真过程中,采样周期为4分钟,权重向量B=(122211),Jmin=-3,建模时域N=30,作变量下限ui为0,预测控制的操作变量 上限为600,被控变量下限yi为0,被控变量上限 为800,稳态操作变量变化值δus(k)为100,操作变量变化值为50。
[0088] 各操作变量代表名称如表1所示:
[0089] 表1各操作变量代表名称
[0090]
[0091] 各被控变量代表名称如表2所示:
[0092] 表2各被控变量代表名称
[0093]
[0094] 通过实验仿真,DMPC对输出的跟踪效果以及对输入的跟踪效果如图2和图3所示。
[0095] 从图2和图3可以看出,在考虑各变量优先级顺序的条件下,通过放松约束条件对最佳的操作变量变化量进行求取,仿真结果表明,DMPC对RRS的输入和输出有很好的跟踪效果。然而,放松约束条件不仅对硬件设备提出了更高的要求,而且所求的最优解是通过放松约束条件后求取的最优解,并不是真正意义上的最优解。群体智能算法在不放松约束条件下,对最优化问题的求解比传统的二次规划或线性规划方法有天然的优势,因此,本发明将PSO算法引入到DMPC中。
[0096] S3:利用PSO算法,在不放松约束条件的前提下,对经济优化函数进行求解。
[0097] 利用PSO算法,在不放松约束条件的前提下,对经济优化函数进行求解的过程如下:
[0098] S31:对粒子群进行初始化,设定种群大小为N,迭代次数为m,速度更新参数为c1、c2,同时给出初始化粒子的位置和速度;
[0099] S32:根据求解的目标函数设置适应度函数,并计算每个粒子的适应度值;
[0100] S33:对每个种群中的新鲜粒子进行适应度值与个体历史最优位置的适应度值的比较,如果新鲜粒子的适应度值大于个体历史最优位置的适应度值,替代原来的个体历史最优位置,成为新的个体历史最优粒子位置;
[0101] S34:对每个种群中的新鲜粒子进行适应度值与全局历史最优位置的适应度值的比较,如果新鲜粒子的适应度值大于全局历史最优位置的适应度值,则替代原来的全局历史最优位置,成为新的个体全局最优粒子位置;
[0102] S35:更新各粒子的速度和位置;其中,
[0103] 粒子的速度更新公式为:
[0104] 粒子的位置更新公式为:
[0105] S36:重复步骤S31-步骤S35,如果已满足PSO算法的终止条件,则该种群中具有最大适应度的个体为最优解,否则迭代进行下一次,直到满足PSO算法的终止条件,求得最优经济目标下的稳态操作变量的变化量δuss(k)。
[0106] S4:根据PSO算法对经济优化函数求得的解获得反应再生系统的输出设定值,并与实际输出的偏差作为目标误差函数,利用PSO算法对该目标误差函数求解,获得操作变量的最佳变化量。
[0107] 利用PSO算法对目标误差函数求解,获得操作变量的最佳变化量的过程,包括如下步骤:
[0108] S41:取预测时域为P,控制时域为M,在每个时刻k,可得到:
[0109]
[0110] S42:当P大于N时,yol(k+j|k)=yol(k+N|k),j>N,该预测值包含预测误差的反馈校正及干扰的影响,得到:
[0111]
[0112]
[0113] S43:在动态矩阵中,根据PSO算法对经济优化函数求得的解获得反应再生系统的输出设定值,并与实际输出的偏差作为目标误差函数,选择最小化的目标误差函数如下:
[0114]
[0115] 在动态矩阵中,根据PSO算法对经济优化函数求得的解获得反应再生系统的输出设定值的公式为:
[0116]
[0117] 式(5)中,yss(k)为反应再生系统的输出设定值,δuss(k)为PSO算法对经济优化函数求得的解, 为稳态增益矩阵,由系统的稳态模型得到; 为开环稳态预测,由辨识好的传递函数模型得到。
[0118] S44:利用PSO算法对最小化的目标函数求解,获得操作变量的最佳变化量。
[0119] 步骤S44的操作过程请参照步骤S31-S36。
[0120] 采用MATLAB7.0为仿真平台,以RRS为对象,进行各算法的研究,仿真过程中,采样周期为4分钟,建模时域N=600,操作变量下限ui为-0.5,预测控制的操作变量 上限为0.5,被控变量下限yi为-0.5,被控变量上限 为0.5,稳态操作变量变化值δus(k)为0.1,操作变量变化值为0.1,B1=[0.1 2 2],A1=[10 20 200],J1max=-3,J2max=-4。各变量所代表意义如表1和表2所示,算法的参数取值如表3所示:
[0121] 表3各算法参数取值表
[0122]
[0123] PSO-DMPC对RRS输出的跟踪效果以及对输入的跟踪效果的如图4和图5所示。
[0124] 从图4和图5中可以看出,通过设置RRS的经济优化函数,并采用PSO对RRS的该问题求解,在保证经济效益的基础上,进一步对RRS的过程进行稳态控制,即采用PSO对DMPC的动态矩阵控制阶段进行求解,仿真结果表明,PSO-DMPC能对RRS的被控变量和操作变量进行跟踪,表明了PSO-DMPC算法在RRS中的有效性。
[0125] 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。