一种多变量半自适应预测控制方法转让专利

申请号 : CN201711054199.6

文献号 : CN109725526B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 邹涛于海斌郑洪宇曾鹏张鑫

申请人 : 中国科学院沈阳自动化研究所

摘要 :

本发明涉及一种多变量半自适应预测控制方法,初始化多变量过程的测试信号,建立辨识所需要的种子模型和控制器性能评判标准;判断当前控制器是否满足控制器性能评判标准,如果当前的预测控制器结构为单层结构或当前的预测控制器结构为双层结构且满足经济效益放松条件,则修改设定点预测控制为区间预测控制,以多变量测试信号作为前馈输入,建立具有测试和控制功能的区间预测控制器,并进行测试,采集测试数据;对测试数据进行辨识,得到辨识后的模型,用该模型更新原有预测控制器模型。本发明不需要增加新的约束条件,且不转变优化形式,无需额外计算量,减少测试时间;保证了测试过程中,生产过程的安全持续运行。

权利要求 :

1.一种多变量半自适应预测控制方法,其特征在于:包括以下步骤:步骤1:初始化多变量过程的测试信号,建立辨识所需要的种子模型和控制器性能评判标准;

所述种子模型为运行的预测控制器模型或由生产过程中被控变量和操作变量的历史数据分析获取;

所述控制器性能评判标准采用基于低扰动实验的MPC模型诊断方法建立;

所述多变量过程的测试信号为正交四值信号;

步骤2:判断当前控制器是否满足控制器性能评判标准,如果满足,则继续执行步骤2,实时监测控制器性能;否则执行步骤3;

步骤3:判断当前的预测控制器结构,如果当前的预测控制器结构为单层结构或,当前的预测控制器结构为双层结构且满足经济效益放松条件,则执行步骤4;

所述经济效益放松条件为:

步骤a:计算最优效益目标值Jopt=cuSS(k),其中,c=[c1 c2…cm]分别表示代价系数;uSS(k)表示当前时刻操作变量的稳态值;下角标SS表示稳态;

步骤b:计算当前效益值J(k)=cu(k),其中,u(k)表示当前时刻操作变量值;

步骤c:计算当前效益差ΔJ(k)=J(k)-ReJopt,其中,Re为效益放松系数,通过初始化设置;

步骤d:如果ΔJ(k)≥0,当前的系统状态满足经济效益放松条件,否则不满足,返回步骤a;

步骤4:修改设定点预测控制为区间预测控制,以多变量测试信号作为前馈输入,建立具有测试和控制功能的区间预测控制器,并进行测试,采集测试数据;

步骤5:对测试数据进行辨识,得到辨识后的模型,用该模型更新原有预测控制器模型,并返回步骤2。

2.根据权利要求1所述的多变量半自适应预测控制方法,其特征在于:所述区间预测控制包括以下优化形式:s.t

uLL≤uM(k)+ΔuM(k)≤uHL

ΔuLL≤ΔuM(k)≤ΔuHL

其中,y∈Rn为被控变量;u∈Rm为操作变量;v∈Rq为可测扰动变量;M和P分别表示控制时域和预测时域;

和 分别表示第i个被控变量初始预测值和预测值;ΔuM(k)=[Δu1,M(k)…Δum,M(k)]T,Δuj,M(k)=[Δuj(k),…,Δuj(k)]T;Δv(k)=[Δv1(k)…Δvq(k)]T,因为扰动无法预测,因此通常假设vl(k)=,…,=vl(k+P),Δvl(k)=vl(k)-vl(k-1);ysp(k)表示设定值;LL表示下限,HL表示上限,Q和R分别表示被控变量和控制权矩阵;G和H分别为输入输出动态矩阵和可测扰动输出动态矩阵;“*”表示Hadamard积;目标函数中第一项和第二项分别表示对被控变量开环预测值低于区间下限和高于区间上限的惩罚,QLL和QHL为对应的权矩阵;L1和L2分别违反区间约束的预测值的系数向量,即,当被控变量的预测值满足区间约束时,对应的系数({ 和 }为0;否则,设置为1;当ysp,HL=ysp,LL,区间预测控制等价于设定值预测控制。

3.根据权利要求1所述的多变量半自适应预测控制方法,其特征在于:所述具有测试和控制功能的区间预测控制器为:s.t.

ΔuM(k)=Δucon,M(k)+λΔuident,M(k)uLL≤uM(k)+ΔuM(k)≤uHL

ΔuLL≤ΔuM(k)≤ΔuHL

其中,Δucon,M(k)表示未来M步预测输出增量值;Δuident,M(k)表示未来M步激励信号增量值;λ为幅值强度;

和 分别表示第i个被控变量初始预测值和预测值;ΔuM(k)=[Δu1,M(k)…Δum,M(k)]T;ysp(k)表示设定值;LL表示下限,HL表示上限,Q和R分别表示被控变量和控制权矩阵;G为输入输出动态矩阵;“*”表示Hadamard积;QL和QH为对被控变量开环预测值低于区间下限和高于区间上限惩罚的权矩阵;L1和L2分别违反区间约束的预测值的系数向量。

4.根据权利要求3所述的多变量半自适应预测控制方法,其特征在于:当幅值强度λ=0时,控制器处于控制模式,当设定值下限ysp,LL与设定值上限ysp,HL相等时,控制目标为对设定点的实时跟踪;

当幅值强度λ≠0时,控制器处于综合测试模式,Δuident,M(k)作为激励信号,可视为系统的可测扰动,实现辨识需要的持续激励,Δucon,M(k)保证系统在控制区间的约束满足。

5.根据权利要求4所述的多变量半自适应预测控制方法,其特征在于:所述控制模式为通过区间预测控制或设定值预测控制保障生产过程中产品质量和生产的安全。

6.根据权利要求4所述的多变量半自适应预测控制方法,其特征在于:所述综合测试模式为在模型测试过程中,在实现辨识过程充分激励的同时,通过区间预测控制或设定值预测控制保障生产过程中产品质量和生产的安全。

说明书 :

一种多变量半自适应预测控制方法

技术领域

[0001] 本发明涉及优化控制领域,具体地说是一种多变量半自适应预测控制方法。

背景技术

[0002] 模型预测控制(Model Predictive Control,MPC)是一种能够处理多变量、约束、纯滞后等问题的控制算法,目前在工业的各个领域中应用广泛。其通过预测模型预测未来时刻的输出,并通过二次性能指标得到最优的控制作用。预测模型的精确度是预测控制实施成功与否的关键因素之一,不准确的预测模型会导致大的预测偏差,进而影响控制效果。另外,目前工业应用中广泛采用双层结构的MPC,其稳态目标计算(Steady-state Target Calculation,SSTC)的稳态模型来自动态优化(Dynamic Optimization,DO)层动态模型的稳态增益,稳态增益直接影响最优的经济工作点。因此,模型的精确度不仅仅影响控制效果,同样影响生产效益。
[0003] 在MPC的实施过程中,主要包括如下阶段:
[0004] 1)效益分析与初步设计;
[0005] 2)预测试;
[0006] 3)动态响应测试与模型辨识;
[0007] 4)控制器离线仿真与参数整定;
[0008] 5)控制器投运与培训;
[0009] 6)控制器维护。
[0010] 通常预测试采用开环阶跃测试辨识过程模型,过程测试和模型辨识占整个工程实施50%以上的时间.由于生产装置的生命周期特征,设备磨损、结垢、产品特性以及操作条件改变等因素,导致过程动态特性具有慢时变性。而模型与装置之间的误差,是影响预测控制器性能的主要因素之一。为了确保MPC效果和经济效益,有必要在模型预测出现较大偏差时,通过再辨识更新预测模型。再辨识过程中,断开控制器,产品质量不能达到要求,同时危及生产安全。

发明内容

[0011] 针对现有技术的不足,本发明提供一种多变量半自适应预测控制方法,实现在保证生产安全的同时,解决由于模型失配导致的控制器性能下降问题。
[0012] 本发明为实现上述目的所采用的技术方案是:
[0013] 一种多变量半自适应预测控制方法,包括以下步骤:
[0014] 步骤1:初始化多变量过程的测试信号,建立辨识所需要的种子模型和控制器性能评判标准;
[0015] 步骤2:判断当前控制器是否满足控制器性能评判标准,如果满足,则继续执行步骤2,实时监测控制器性能;否则执行步骤3;
[0016] 步骤3:判断当前的预测控制器结构,如果当前的预测控制器结构为单层结构或,当前的预测控制器结构为双层结构且满足经济效益放松条件,则执行步骤4;
[0017] 步骤4:修改设定点预测控制为区间预测控制,以多变量测试信号作为前馈输入,建立具有测试和控制功能的区间预测控制器,并进行测试,采集测试数据;
[0018] 步骤5:对测试数据进行辨识,得到辨识后的模型,用该模型更新原有预测控制器模型,并返回步骤2。
[0019] 所述种子模型为运行的预测控制器模型或由生产过程中被控变量和操作变量的历史数据分析获取。
[0020] 所述控制器性能评判标准采用基于低扰动实验的MPC模型诊断方法建立。
[0021] 所述多变量过程的测试信号为正交四值信号。
[0022] 所述经济效益放松条件为:
[0023] 步骤1:计算最优效益目标值Jopt=cuSS(N),其中,c=[c1 c2 … cm]分别表示代价系数;uSS(k)表示当前时刻操作变量的稳态值;下角标SS(Steady-State)表示稳态;
[0024] 步骤2:计算当前效益值J(k)=cu(k),其中,u(k)表示当前时刻操作变量值;
[0025] 步骤3:计算当前效益差ΔJ(k)=J(k)-ReJopt,其中,Re为效益放松系数,通过初始化设置;
[0026] 步骤4:如果ΔJ(k)≥0,当前的系统状态满足经济效益放松条件,否则不满足,返回步骤1。
[0027] 所述区间预测控制包括以下优化形式:
[0028]
[0029] s.t.
[0030]
[0031]
[0032] uLL≤uM(k)+ΔuM(k)≤uHL
[0033] ΔuLL≤ΔuM(k)≤ΔuHL
[0034]
[0035]
[0036] 其中,y∈Rn为被控变量;u∈Rm为操作变量;v∈Rq为可测扰动变量;M和P分别表示控制时域和预测时域;和 分别表示第i个被控变量
T
初始预测值和预测值;ΔuM(k)=[Δu1,M(k) … Δum,M(k)],Δuj,M(k)=[Δuj(k),…,Δuj(k)]T;Δv(k)=[Δv1(k) … Δvq(k)]T,因为扰动无法预测,因此通常假设vl(k)=,…,=vl(k+P),Δvl(k)=vl(k)-vl(k-1);ysp(k)表示设定值;LL和HL分别表示上下限,yLL表示被控变量的下限,Q和R分别表示被控变量和控制权矩阵;G和H分别为输入输出动态矩阵和可测扰动输出动态矩阵;“*”表示Hadamard积;目标函数中第一项和第二项分别表示对被控变量开环预测值低于区间下限和高于区间上限的惩罚,QL和QH为对应的权矩阵;L1和L2分别违反区间约束的预测值的系数向量,即,当被控变量的预测值满足区间约束时,对应的系数(和 )为0;否则,设置为1。当ysp,HL=ysp,LL,区间预测控制等价于设定值预测控制。
[0037] 所述具有测试和控制功能的区间预测控制器为:
[0038]
[0039] s.t.
[0040] ΔuM(k)=Δucon,M(k)+λΔuident,M(k)
[0041]
[0042]
[0043] uLL≤uM(k)+ΔuM(k)≤uHL
[0044] ΔuLL≤ΔuM(k)≤ΔuHL
[0045]
[0046]
[0047] 其中,Δucon,M(k)表示未来M步预测输出增量值;Δuident,M(k)表示未来M步激励信号增量值;λ为幅值强度;和 分别表示第i个被控变量初始预测值
和预测值;ΔuM(k)=[Δu1,M(k) … Δum,M(k)]T,ysp(k)表示设定值;LL表示下限;;HL表示上限;yLL表示被控变量的下限;Q和R分别表示被控变量和控制权矩阵;G为输入输出动态矩阵;“*”表示Hadamard积;QL和QH为对被控变量开环预测值低于区间下限和高于区间上限惩罚的权矩阵;L1和L2分别违反区间约束的预测值的系数向量。
[0048] 当幅值强度λ=0时,控制器处于控制模式,当设定值下限ysp,LL与设定值上限ysp,HL相等时,控制目标为对设定点的实时跟踪;
[0049] 当幅值强度λ≠0时,控制器处于综合测试模式,Δuident,M(k)作为激励信号,可视为系统的可测扰动,实现辨识需要的持续激励。Δucon,M(k)保证系统在控制区间的约束满足。
[0050] 所述控制模式为通过区间预测控制或设定值预测控制保障生产过程中产品质量和生产的安全。
[0051] 所述综合测试模式为在模型测试过程中,在实现辨识过程充分激励的同时,通过区间预测控制或设定值预测控制保障生产过程中产品质量和生产的安全。
[0052] 本发明具有以下有益效果及优点:
[0053] 1.本发明解决辨识所需的充分激励信号与系统平稳运行的矛盾;
[0054] 2.本发明解决辨识输入信号与不可测噪声的相关性问题;
[0055] 3.本发明不需要增加新的约束条件,且不转变优化形式,无需额外计算量;
[0056] 4.本发明减少测试时间;
[0057] 5.本发明保证了测试过程中,生产过程的安全持续运行;
[0058] 6.本发明在线解决因模型因素造成的控制器性能下降的问题。

附图说明

[0059] 图1是本发明的方法流程图;
[0060] 图2是本发明的初始化流程图;
[0061] 图3是本发明的性能检测过程流程图;
[0062] 图4是本发明的测试过程流程图;
[0063] 图5是本发明的辨识过程流程图;
[0064] 图6是本发明的系统架构图;
[0065] 图7是本发明的面向约束MPC的测试模块结构图;
[0066] 图8是本发明的面向双层MPC的测试模块结构图。

具体实施方式

[0067] 下面结合附图及实施例对本发明做进一步的详细说明。
[0068] 如图1为本发明的方法流程图。
[0069] 包括如下步骤:
[0070] 步骤S1初始化;
[0071] 步骤S2为控制性能监测过程;
[0072] 步骤S3为测试过程;
[0073] 步骤S4,辨识过程。
[0074] 如图2所示是本发明的初始化流程图。
[0075] 步骤S1进一步包括:
[0076] 步骤S11,建立辨识所需要的种子模型。其可为投运的预测控制器模型;也可由生产过程中被控变量和操作变量的历史数据分析获取。通常其具有合理的延迟时间和稳态时间。
[0077] 步骤S12,建立多变量过程的测试信号。针对多输入输出系统,为了同时激励所有输入节省辨识时间。本发明采用一种改进的正交四值信号,其由二个周期信号乘积构成。
[0078] ui(k)=hi(k)p(k)
[0079] 其中,p(k)表示周期为Np,幅值为[a,-a×P]的PRBS信号, 信号hi(k)的周期为Nh,选自阶次为Nh=2m-1的Hadamard矩阵i行元素。因此,单个输入信号的周期长度为Nh×Np。
[0080] 步骤S13,建立控制器性能评判标准
[0081] 步骤S14,设置效益放松系数Re。
[0082] 如图3所示是本发明的性能检测过程流程图。
[0083] 步骤S2为控制性能监测过程。
[0084] 具体的,步骤S21根据步骤S13建立的控制器性能评判标准实时判断当前控制器是否满足评判标准,如满足,则继续进行控制器的性能判断;否则,进入下一步骤(步骤S3,测试)。
[0085] 如图4所示是本发明的测试过程流程图。
[0086] 步骤S3为测试过程,进一步包括:
[0087] 步骤S31判断当前的MPC控制器结构是否为双层结构。如果是,进入步骤S32,否则进入步骤S36。
[0088] 步骤S32计算最优效益目标值Jopt=cuSS(N),其中,c=[c1 c2 … cm]分别表示代价系数;uSS(k)表示当前时刻操作变量的稳态值;下角标SS表示稳态。
[0089] 步骤S33计算当前效益值J(k)=cu(k),其中,u(k)表示当前时刻操作变量值。
[0090] 步骤S34计算当前效益差ΔJ(k)=J(k)-ReJopt。
[0091] 步骤S35判读当前时刻的效益差ΔJ(k)是否大于0。如果ΔJ(k)≥0,说明当前的系统状态满足步骤S14设置的经济效益放松条件,进入步骤S36,进行测试;否则进入S32。
[0092] 步骤S36改变当前的MPC设定点控制模式为区间控制模式。
[0093] 设定点控制模式的MPC目标函数和约束条件如下:
[0094]
[0095] s.t.
[0096]
[0097]
[0098] uLL≤uM(k)+ΔuM(k)≤uHL
[0099] ΔuLL≤ΔuM(k)≤ΔuHL
[0100] 其中,y∈Rn为被控变量;u∈Rm为操作变量;v∈Rq为可测扰动变量;M和P分别表示控制时域和预测时域;和 分别表示第i个被控变量
初始预测值和预测值;ΔuM(k)=[Δu1,M(k) … Δum,M(k)]T,Δuj,M(k)=[Δuj(k),…,Δuj(k)]T;Δv(k)=[Δv1(k) … Δvq(k)]T,因为扰动无法预测,因此通常假设vl(k)=,…,=vl(k+P),Δvl(k)=vl(k)-vl(k-1);ysp(k)表示设定值;LL和HL分别表示上下限,yLL表示被控变量的下限,Q和R分别表示被控变量和控制权矩阵;G和H分别为输入输出动态矩阵和可测扰动输出动态矩阵。
[0101] 区间MPC的优化形式如下:
[0102]
[0103] s.t.
[0104]
[0105]
[0106] uLL≤uM(k)+ΔuM(k)≤uHL
[0107] ΔuLL≤ΔuM(k)≤ΔuHL
[0108]
[0109]
[0110] 其中,“*”表示Hadamard积。目标函数中第一项和第二项分别表示对被控变量开环预测值低于区间下限和高于区间上限的惩罚,QL和QH为对应的权矩阵;L1和L2分别违反区间约束的预测值的系数向量,即,当被控变量的预测值满足区间约束时,对应的系数({ 和)为0;否则,设置为1。当ysp,HL=ysp,LL,区间MPC等价于设定值MPC。
[0111] 步骤S37将S12建立的测试信号,Δuident(k)作为区间控制器的前馈输入。则式(2)的优化命题变为:
[0112]
[0113] s.t.
[0114]
[0115]
[0116] uLL≤uM(k)+ΔuM(k)≤uHL
[0117] ΔuLL≤ΔuM(k)≤ΔuHL
[0118]
[0119]
[0120] 其中,Δucon,M(k)表示未来M步预测输出增量值;Δuident,M(k)表示未来M步激励信号增量值;λ为幅值强度。
[0121] 当幅值强度λ=0时,控制器处于控制模式,当设定值下限ysp,LL与设定值上限ysp,HL相等时,控制目标为对设定点的实时跟踪。
[0122] 当幅值强度λ≠0时,控制器处于综合测试模式,Δuident,M(k)作为激励信号,可视为系统的可测扰动,实现辨识需要的持续激励。Δucon,M(k)保证系统在控制区间的约束满足。
[0123] 注:随着幅值强度λ的增加,相应的操纵变量变化幅度及被控变量CV变化幅度也随之增加,测试效果也将越好,但同时被控变量违反区间约束的可能性也将越大。工程师可在目标跟踪控制与测试数据质量之间作出优化权衡。
[0124] 步骤S38采集过程数据,待后期辨识所用。
[0125] 如图5所示是本发明的辨识过程流程图。
[0126] 步骤S4为辨识过程,进一步包括:
[0127] 步骤S41通过步骤S38得到的数据(可以为实时或离线数据)进行辨识,得到新的模型。
[0128] 步骤S42将步骤S41得到的新的模型作为MPC的控制器模型。更新MPC控制器模型后,此时,如果性能检测模块检测控制器性能满足要求,则停止测试和辨识;否则,继续测试和辨识,直至更新模型后的控制器性能满足要求。
[0129] 图6为本发明涉及的多变量半自适应预测控制系统架构简图。
[0130] 主要包括性能监测模块、辨识模块和测试模块。性能监测模块实时检测当前控制器是否满足控制性能指标。当性能监测模块检测到控制器性能指标不满足要求时,测试模块中测试信号实现对过程的充分激励,获得辨识模块所需的数据。辨识模块根据MPC的结构分为面向约束MPC的测试模块和面向双层结构MPC的测试模块。辨识模块通过测试模块获得的数据,进行模型辨识,并将辨识后的模型作为新的控制器模块。更新后的控制器如果满足控制器性能指标,结束测试和辨识过程,否则,继续测试和辨识过程,直至控制器性能指标得到满足。
[0131] 图7为本发明中面向约束MPC的测试模块结构图。
[0132] 主要包括区间预测控制器、多变量测试信号。其中多变量测试信号实现测试过程的充分激励,区间预测控制器实现在测试过程中,保证过程的被控变量满足区间约束。
[0133] 图8为本发明中面向双层MPC的测试模块结构图。
[0134] 主要包括效益放松条件判断、区间预测控制器、多变量测试信号。其中,效益放松条件判断表示对当期状态下的经济效益是否满足设定要求。在该结构下,如果当期状态下的经济效益满足设定要求,则进行面向约束MPC的测试,即在充分激励测试的同时,保证被控变量满足区间约束。否则,继续进行判断,直至满足设定要求。
[0135] 以上公开的仅为本申请的具体实施例,但并不能因此理解为对本发明专利范围的限制。应当指出,在不脱离本发明构思的前提下,任何本领域的技术人员能思之的变化,都应落在本申请的保护范围内。