电机驱动单机械臂系统的点对点迭代学习优化控制方法转让专利

申请号 : CN201911119240.2

文献号 : CN110815225B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 陶洪峰李健黄彦德

申请人 : 江南大学

摘要 :

本发明公开了电机驱动单机械臂系统的点对点迭代学习优化控制方法,涉及机械臂优化控制领域。该方法基于提升技术将重复运行的单机械臂系统转换为时间序列的输入输出矩阵模型,然后基于性能指标设计点对点轨迹跟踪鲁棒迭代学习优化方法,通过求解多目标性能指标函数的二次型最优解得到优化迭代学习控制律,并根据最大奇异值理论证明当模型存在有界不确定性时算法的鲁棒收敛性,以及证明了机械臂系统在输入受约束情况下的收敛性,该方法可以解决机械臂系统的点对点跟踪控制问题,同时考虑了输入受约束以及建模存在不确定性的情况,从而实现对指定点处期望轨迹的高精度跟踪。

权利要求 :

1.电机驱动单机械臂系统的点对点迭代学习优化控制方法,其特征在于,所述方法包括:建立电机驱动单机械臂系统的物理模型;构建电机驱动单机械臂系统的离散状态空间模型;建立点对点轨迹跟踪模型;设计点对点迭代学习轨迹跟踪优化算法;分析所述点对点迭代学习轨迹跟踪优化算法的收敛性和鲁棒性;分析所述点对点迭代学习轨迹跟踪优化算法在输入约束条件下的收敛性和鲁棒性;实现所述电机驱动单机械臂系统在有输入约束情形下的点对点轨迹跟踪;

第一步、建立所述电机驱动单机械臂系统的物理模型:

电机驱动单机械臂系统的物理模型如式(1)所示:

其中,Nl=m2gl+m1gl, g为重力加速度,θ为连杆角度,i为电流,Kt为扭矩,Kb为反电动势系数,Bc为轴承粘滞摩擦系数,Dc为负载系数,l为连杆长度,m1为负载质量,m2为连杆质量,Rr为电阻,u为电机控制电压,Ξ为执行器转动惯量,Γ为电抗;

第二步、构建电机驱动单机械臂系统的离散状态空间模型:利用所述电机驱动单机械臂系统的连杆角度和电流定义状态变量: 定义电机控制电压u为输入变量,则式(1)所示的一种电机驱动单机械臂系统可描述为:显然式(2)为连续系统模型,因此需要对式(2)进行离散化,选取满足香农采样定理的采样周期Ts,并将连杆角度θ作为输出,进一步可以得到所述电机驱动单机械臂系统的离散状态空间模型:式中t和k分别代表采样时间和批次,批次过程在一个运行周期T内的时间范围内含有N个采样点,即t∈{0,1,2,…,N};uk(t),yk(t)和xk(t)分别是电机驱动单机械臂系统第k批次t时刻的输入,输出和状态向量;A,B,C为式(2)对应的离散系统参数矩阵,且满足CB≠0;并且假设系统运行的初始状态一致,即xk(0)=x0;

第三步、建立所述点对点轨迹跟踪模型:

针对式(3)形式的离散状态空间模型,可将其状态空间表达式转换为时间序列的输入输出矩阵模型:yk=Guk+d                      (4)其中:

d=[CA CA2 CA3…CAN]Tx0

uk=[uk(0),uk(1),...,uk(N-1)]Tyk=[yk(1),yk(2),...,yk(N)]TG是时间序列上的输入输出传递矩阵,d是系统初始状态对输出的影响;

在传统迭代学习控制算法设计中,参考轨迹通常是固定的,轨迹跟踪目标要求系统输出在各个时刻随着批次过程的不断运行逐渐靠近所设定的期望输出值,即yk(t)→yd(t),其中yk(t)为第k批次t时刻的系统实际输出,yd(t)为第k批次t时刻的系统期望输出;对于点对点跟踪问题,只需要跟踪一些指定的关键时间点的期望值,即yk(ti)=yd(ti),i=1,2,…,M,并且有0≤t1

ekM=ydM-ψyk                (7)其中,

ekM=[ek(t1),ek(t2),...,ek(tM)]T             (8)第四步、设计所述点对点迭代学习轨迹跟踪优化算法:

在实际应用中,跟踪误差e(k+1)M和系统输入uk+1通常反映了系统各个运行批次的收敛性能和能量消耗,较小的跟踪误差、控制能量及其控制振荡对系统的整体性能及其实际执行器的损耗至关重要,因此需要在迭代学习控制优化过程中考虑同时对误差和控制量进行优化;定义如下性能指标函数:其中Q为对称正定权阵,R和S为相应的对称非负定权阵,且将式(4)、式(7)、式(10)代入式(9),通过求解其二次型最优解获得优化迭代学习控制律为:uk+1=Luuk+LeekM                   (11)其中,

Lu=[(ψG)TQ(ψG)+R+S]-1[(ψG)TQ(ψG)+R],Lu是迭代学习控制律控制器输入项的增益,Le=[(ψG)TQ(ψG)+R+S]-1(ψG)TQ,Le是误差项的增益;

第五步、分析所述点对点迭代学习轨迹跟踪优化算法的收敛性和鲁棒性:若优化迭代学习控制律(11)满足条件η=||Lu-Le(ψG)||i2<1,||·||i2表示矩阵的最大奇异值,则当迭代批次k→∞时,系统在有限期望跟踪点处的跟踪输出误差收敛;

由式(4),(7)可将式(11)改写成:

定义系统稳态控制输入 根据式(12)可得:

u∞-uk+1=(Lu-Le(ψG))(u∞-uk)+ξ      (13)其中ξ=(I-(Lu-Le(ψG)))u∞-Le(ydM-ψd)为零矩阵,对式(13)两边取范数可得||u∞-uk+1||=||(Lu-Le(ψG))(u∞-uk)+ξ||≤η||u∞-uk||,若满足条件η<1,则控制输入在范数意义下收敛,进一步可得:其中,I是相应维数的单位矩阵,则可以得到:

当各权重矩阵参数确定时,从式(15)可以得出,稳态误差范数最终将收敛到常值,并且若S越小,在所述优化迭代学习控制律(11)的作用下系统的点对点跟踪稳态误差越小,当S取为零矩阵时,系统跟踪点处的跟踪输出误差范数可以收敛到零;

在实际工艺生产过程中,被控系统通常存在一定的建模不确定性;考虑在时间序列上的输入输出传递矩阵G上加一个在时间域变化的不确定性ΔG,进而定义带有不确定性的时间序列上的输入输出传递矩阵的表达式为Gθ=G(I+ΔG),并且定义ΔG=WΔ,不确定因子的有界条件为||Δ||i2≤1,系统鲁棒收敛的条件为:

||Lu-Le(ψGθ)||i2<1

若对称非负定权阵R取为零矩阵时,由下式:

其中,W是不确定的权重矩阵;

可得,若参数满足条件:

||[(ψG)TQ(ψG)+S]-1(ψG)TQ(ψG)W||i2<1     (16)则系统鲁棒收敛;若对称非负定权阵R=rI,r≥0,若条件(16)满足,则依然可保证离散T状态空间模型(3)在所述优化迭代学习控制律(11)作用下的鲁棒收敛;因为(ψG) Q(ψG)+S为对称正定矩阵,所以可以对其进行奇异值分解有(ψG)TQ(ψG)+S=U∑UT,其中U为酉矩阵,以及Σ是元素为σi的满秩对角阵,记为Σ=diag{σi},为了方便表示,令以及条件

满足可以得到||H||i2=α<1,

则可得到:

其中r为任意大于等于0的实数,则对于R=rI,r≥0,若条件(16)满足时,系统鲁棒收敛,即参数R=rI的设计不影响系统的鲁棒性,另一方面,参数S的设计需要满足条件(16);

第六步、分析所述点对点迭代学习轨迹跟踪优化算法在输入约束条件下的收敛性和鲁棒性:在许多工业过程控制应用中,为了确保工业过程安全、顺利地运行,需要对输入变量施加一定的约束,输入信号约束包括输入幅值的约束、输入随时间方向和批次方向变化的幅度约束,这些约束常以不等式的形式表示;

控制器输入的饱和约束:

ulow≤uk+1≤uhi                (18)low hi

其中u ,u 分别为控制器输入uk+1的下界值与上界值;

两个相邻采样时间之间的输入变化约束:

δulow≤δuk+1≤δuhi                      (19)其中δulow、δuhi分别为输入变量δuk+1沿时间轴变化的下界值与上界值,δuk+1(t)=uk+1(t-1)-uk+1(t-2);

两个相邻批次之间的输入变化约束:

Δulow≤Δuk+1≤Δuhi                (20)其中Δulow、Δuhi分别为输入变量Δuk+1沿迭代轴变化的下界值与上界值,Δuk+1=uk+1-uk;

所有上述约束方程都可以转化为Δuk+1的表达式,首先,所述控制器输入的饱和约束(18)可以转化为:ulow-uk≤Δuk+1≤uhi-uk             (21)假设δu(0)=u0,则δuk+1可以表示为:

δuk+1=μuk+1                        (22)其中:

因此两个相邻采样时间之间的输入变化约束(19)可以转化为:low hi

δu -μuk≤μΔuk+1≤δu -μuk          (24)上述约束可以组合成下面的线性不等式:

ζuΔuk+1≥ζk+1                       (25)其中:

理论上来说,式(25)所描述的输入Δuk+1的约束是一个凸集,这里用Ω表示;模型不确定的误差方程可以表示为:e(k+1)M=ekM-ψGθΔuk+1            (26)其中,Gθ是带有不确定性的时间序列上的输入输出传递矩阵,与时间序列上的输入输出传递矩阵G相对应;

将式(26)代入所述性能指标函数(9)得到:

收敛性与鲁棒性分析:

在约束条件下,假设条件1)存在一个可行的期望输入u∞和对应的期望误差e∞=0,且满足ulow≤u∞≤uhi,δulow≤δu∞≤δuhi以及Δulow<0,Δuhi>0;假设条件2)Q为对称正定权阵,R,S为相应的对称非负定权阵;则系统鲁棒收敛,并且当S取零矩阵时系统稳态误差收敛到0,即k→∞时,Δuk→0,ekM→0;

定义第k+1批次的最优性能指标函数为:

首先考虑Δuk+1=0的情况,此时uk+1=uk,e(k+1)M=ekM,uk+1=uk,所以可以推出(ekM,0,uk)∈Ω,因为性能指标函数在点(ekM,0,uk)处的值总是要大于或等于最优值,所以可以得到如下关系式:以此类推可得:

由式(30)可知,当k→∞时Δuk→0,因为当k足够大时Δuk→0,且满足条件Δulow<0,Δuhi>0,所以约束条件Δulow≤Δuk+1≤Δuhi同样满足;根据假设条件1)可知当uk+1=u∞时e(k+1)M=0,则 也是一个约束区域内的可行点,其中 显然(e(k+1)M,Δuk+1,uk+1)也是一个约束区域内的可行点,因为Ω为一凸集,可以推出Ω内任意两个可行点之间的点都是可行点;

同时,求解性能指标函数Jk+1从(e(k+1)M,Δuk+1,uk+1)到 的方向导数:由式(31)可以得到:

因为当k→∞时Δuk→0,因此当k→∞时式(32)可简化为:由式(33)以及假设条件2)可知,当k→∞时系统稳态输出误差收敛到某一有界值,当S取零矩阵时,稳态输出误差到达最小且为0;上述结果表明,假设条件成立时,输入约束模型不确定系统在所述优化迭代学习控制律(11)作用下依然可以收敛;当系统为标称系统,即Gθ=G时,结论同样成立;

第七步、根据鲁棒优化迭代学习控制律确定所述电机驱动单机械臂系统的每一迭代批次的输入矢量,将得到的所述输入矢量输入所述电机驱动单机械臂系统进行点对点轨迹跟踪控制,所述电机驱动单机械臂系统在输入矢量的控制作用下追踪指定跟踪点处的期望输出。

说明书 :

电机驱动单机械臂系统的点对点迭代学习优化控制方法

技术领域

[0001] 本发明涉及机械臂优化控制领域,尤其是电机驱动单机械臂系统的点对点迭代学习优化控制方法。

背景技术

[0002] 机械臂是能模仿人手臂的某些动作功能,用以按固定程序抓取、搬运物件或操作工具的自动操作装置。它可代替人的繁重劳动以实现生产的机械化和自动化,能在有害环境下操作以保护人身安全,因而广泛应用于机械制造、冶金、电子、轻工和原子能等部门。
[0003] 机械臂在执行重复过程任务时往往不需要跟踪完整的期望轨迹,只需要在某些特定的时间点处跟踪给定的期望值,比如机械臂的“取”和“放”操作,只需要专注拾取点和放置点的输出,而其它时间点的输出往往不需要多加考虑,机械臂的这类控制问题称为点对点跟踪控制。
[0004] 点对点跟踪问题的常用解决思路有两种:其一为设计一条经过特定跟踪点的任意轨迹,从而把该问题转化为一般的全轨迹跟踪,但此方法存在局限性,需要足够的先验知识才能确定最佳的固定参考轨迹,并且没有充分利用非跟踪时间点的自由度设计控制器;其二为基于参考轨迹更新的点对点控制方法,虽然较固定参考轨迹方法收敛快,但本质上还是全轨迹跟踪问题,全轨迹跟踪需要跟踪整个轨迹的输出,而有的工业过程例如机械臂操作只需要跟踪轨迹上的几个点的期望值就能达到控制要求。
[0005] 迭代学习控制(Iterative learning control,ILC)是一种广泛应用于执行重复任务的高性能控制方法,针对上述点对点跟踪问题,点对点ILC方法应运而生。

发明内容

[0006] 本发明人针对上述问题及技术需求,提出了电机驱动单机械臂系统的点对点迭代学习优化控制方法,利用指定时间点处的跟踪误差信息来更新输入,进而消除了不必要的非关键点跟踪约束,非关键点处的自由度给算法设计增加自由度的同时,也增加了系统整体性能的提升空间。
[0007] 本发明的技术方案如下:
[0008] 电机驱动单机械臂系统的点对点迭代学习优化控制方法,该方法包括:
[0009] 建立电机驱动单机械臂控制系统的模型;构建电机驱动单机械臂控制系统的离散状态空间方程;建立点对点轨迹跟踪模型;设计点对点迭代学习轨迹跟踪优化算法;分析点对点迭代学习轨迹跟踪优化算法的收敛性和鲁棒性;分析点对点迭代学习轨迹跟踪优化算法在输入约束条件下的收敛性和鲁棒性;实现电机驱动单机械臂控制系统在有输入约束情形下的点对点轨迹跟踪;
[0010] 第一步、建立电机驱动单机械臂控制系统的动态模型:
[0011] 电机驱动单机械臂实际物理模型如式(1)所示:
[0012]
[0013] 其中,Nl=m2gl+m1gl, g为重力加速度,θ为连杆角度,i为电流,Kt为扭矩,Kb为反电动势系数,Bc为轴承粘滞摩擦系数,Dc为负载系数,l为连杆长度,m1为负载质量,m2为连杆质量,Rr为电阻,u为电机控制电压,Ξ为执行器转动惯量,Γ为电抗;
[0014] 第二步、构建电机驱动单机械臂系统的离散状态空间方程:
[0015] 利用电机驱动单机械臂控制系统的连杆角度和电流定义状态变量:定义电机控制电压u为输入变量,则式(1)所示的一种电机驱动单机械臂控
制系统可描述为:
[0016]
[0017] 显然式(2)为连续系统模型,因此需要对式(2)进行离散化,选取满足香农采样定理的采样周期Ts,并将连杆角度θ作为输出,进一步可以得到电机驱动单机械臂控制系统的离散状态空间模型:
[0018]
[0019] 式中t和k分别代表采样时间和批次,批次过程在一个运行周期T内的时间t∈[0,T]范围内含有N个采样点;uk(t),yk(t)和xk(t)分别是电机驱动单机械臂控制系统第k批次t时刻的输入,输出和状态向量;A,B,C为式(2)对应的离散系统参数矩阵,且满足CB≠0;并且假设系统运行的初始状态一致,即xk(0)=x0;
[0020] 第三步、建立点对点轨迹跟踪模型:
[0021] 针对式(3)形式的线性离散系统,可将其状态空间表达式转换为时间序列的输入输出矩阵模型:
[0022] yk=Guk+d   (4)
[0023] 其中:
[0024]
[0025] d=[CA CA2 CA3 … CAN]Tx0
[0026] uk=[uk(0),uk(1),...,uk(N-1)]T
[0027] yk=[yk(1),yk(2),...,yk(N)]T
[0028] G是时间序列上的输入输出传递矩阵,d是系统初始状态对输出的影响;
[0029] 在传统迭代学习控制算法设计中,参考轨迹通常是固定的,轨迹跟踪目标要求系统输出在各个时刻随着批次过程的不断运行逐渐靠近所设定的期望输出值,即yk(t)→yd(t),其中t∈{0,1,2,…,N},yk(t)为第k批次t时刻的系统实际输出,yd(t)为第k批次t时刻的系统期望输出;对于点对点跟踪问题,只需要跟踪一些指定的关键时间点的期望值,即yk(ti)=yd(ti),i=1,2,…,M,并且有0≤t1
[0030] ydM=[yd(t1),yd(t2),...,yd(tM)]T   (5)
[0031] 同时定义矩阵ψ为M行N列的跟踪点选择矩阵,其中ψij为矩阵ψ中第i行第j列的元素,当第i个跟踪时间点ti被选择时,该矩阵第i行的所有N个元素除j=ti时为1其余全为0,共选取M个跟踪时间点,从而可得到ψyk为整个轨迹N个采样时间点所选取的M个跟踪时间点的实际输出值.其具体表达形式为:
[0032]
[0033] 由此可以定义在跟踪点处的跟踪误差为:
[0034] ekM=ydM-ψyk   (7)
[0035] 其中,
[0036] ekM=[ek(t1),ek(t2),...,ek(tM)]T   (8)
[0037] 第四步、设计点对点迭代学习轨迹跟踪优化算法:
[0038] 在实际工程应用中,系统输入量uk+1通常反映的是控制过程中消耗的能量,较小的控制能量及其控制振荡对控制器及其最终执行器的损耗至关重要,因此在优化过程中需要在考虑误差的基础上同时考虑控制量的优化条件,考虑如下性能指标函数:
[0039]
[0040] 其中Q为对称正定权阵,R和S为相应的对称非负定权阵,且
[0041]
[0042] 将式(4)、式(7)、式(10)代入式(9),通过求解其二次型最优解获得优化迭代学习控制律为:
[0043] uk+1=Luuk+LeekM   (11)
[0044] 其中,
[0045] Lu=[(ψG)TQ(ψG)+R+S]-1[(ψG)TQ(ψG)+R],Lu是迭代学习控制律控制器输入项的增益,
[0046] Le=[(ψG)TQ(ψG)+R+S]-1(ψG)TQ,Le是误差项的增益;
[0047] 第五步、分析点对点迭代学习轨迹跟踪优化算法的收敛性和鲁棒性:
[0048] 若优化迭代学习控制律(11)满足条件η=||Lu-Le(ψG)||i2<1,||·||i2表示矩阵的最大奇异值,则当迭代批次k→∞时,系统在有限期望跟踪点处的跟踪输出误差收敛;
[0049] 由式(4),(7)可将式(11)改写成:
[0050]
[0051] 定义系统稳态控制输入 根据式(12)可得:
[0052] u∞-uk+1=(Lu-Le(ψG))(u∞-uk)+ξ   (13)
[0053] 其中ξ=(I-(Lu-Le(ψG)))u∞-Le(ydM-ψd)为零矩阵,对式(13)两边取范数可得||u∞-uk+1||=||(Lu-Le(ψG))(u∞-uk)+ξ||≤η||u∞-uk||,若满足条件η<1,则控制输入在范数意义下收敛,进一步可得:
[0054]
[0055] 其中,I是相应维数的单位矩阵,则可以得到:
[0056]
[0057] 当各权重矩阵参数确定时,从式(15)可以得出,稳态误差范数最终将收敛到常值,并且若S越小,在优化迭代学习控制律(11)的作用下系统的点对点跟踪稳态误差越小,特别地当S取为零矩阵时,系统跟踪点处的跟踪输出误差范数可以收敛到零;
[0058] 在实际工艺生产过程中,被控系统通常存在一定的建模不确定性;考虑在原有系统G上加一个在时间域变化的不确定性ΔG,进而定义不确定被控系统的表达式为Gθ=G(I+ΔG),并且定义ΔG=WΔ,不确定因子的有界条件为||Δ||i2≤1,
[0059] 系统鲁棒收敛的条件为:
[0060] ||Lu-Le(ψGθ)||i2<1
[0061] 若对称非负定权阵R取为零矩阵时,由下式:
[0062]
[0063] 其中,W是不确定的权重矩阵;
[0064] 可得,若参数满足条件:
[0065] ||[(ψG)TQ(ψG)+S]-1(ψG)TQ(ψG)W||i2<1   (16)
[0066] 则系统鲁棒收敛;若对称非负定权阵R=rI,r≥0,若条件(16)满足,则依然可保证线性离散系统(3)在优化迭代学习控制律(11)作用下的鲁棒收敛;因为(ψG)TQ(ψG)+S为对称正定矩阵,所以可以对其进行奇异值分解有(ψG)TQ(ψG)+S=U∑UT,其中U为酉矩阵,以及Σ是元素为σi的满秩对角阵 ,记为Σ=diag{σi},为了方便表示,令以及条件
满足可以得到||H||i2=α<1。
[0067] 则可得到:
[0068]
[0069] 其中r为任意大于等于0的实数,则对于R=rI,r≥0,若条件(16)满足时,系统鲁棒收敛,即参数R=rI的设计不影响系统的鲁棒性,另一方面,参数S的设计需要满足条件(16);
[0070] 第六步、分析点对点迭代学习轨迹跟踪优化算法在输入约束条件下的收敛性和鲁棒性:
[0071] 在许多工业过程控制应用中,为了确保工业过程安全、顺利地运行,需要对输入变量施加一定的约束,输入信号约束包括输入幅值的约束、输入随时间方向和批次方向变化的幅度约束,这些约束常以不等式的形式表示;
[0072] 控制器输入的饱和约束:
[0073] ulow≤uk+1≤uhi   (18)
[0074] 其中ulow,uhi分别为控制器输入uk+1的下界值与上界值;
[0075] 两个相邻采样时间之间的输入变化约束:
[0076] δulow≤δuk+1≤δuhi   (19)
[0077] 其中δulow、δuhi分别为输入变量δuk+1沿时间轴变化的下界值与上界值,δuk+1(t)=uk+1(t-1)-uk+1(t-2);
[0078] 两个相邻批次之间的输入变化约束:
[0079] Δulow≤Δuk+1≤Δuhi   (20)
[0080] 其中Δulow、Δuhi分别为输入变量Δuk+1沿迭代轴变化的下界值与上界值,Δuk+1=uk+1-uk;
[0081] 所有上述约束方程都可以转化为Δuk+1的表达式,首先,控制器输入的饱和约束(18)可以转化为:
[0082] ulow-uk≤Δuk+1≤uhi-uk   (21)
[0083] 假设δu(0)=u0,则δuk+1可以表示为:
[0084] δuk+1=μuk+1   (22)
[0085] 其中:
[0086]
[0087] 因此两个相邻采样时间之间的输入变化约束(19)可以转化为:
[0088] δulow-μuk≤μΔuk+1≤δuhi-μuk   (24)
[0089] 上述约束可以组合成下面的线性不等式:
[0090] ζuΔuk+1≥ζk+1   (25)
[0091] 其中:
[0092]
[0093] 理论上来说,式(25)所描述的输入Δuk+1的约束是一个凸集,这里用Ω表示;模型不确定的误差方程可以表示为:
[0094] e(k+1)M=ekM-ψGθΔuk+1   (26)
[0095] 其中,Gθ是带有不确定性的时间序列上的输入输出传递矩阵,与确定性系统G相对应;
[0096] 将式(26)代入性能指标函数(9)得到:
[0097]
[0098] 收敛性与鲁棒性分析:
[0099] 在约束条件下,假设条件1)存在一个可行的期望输入u∞和对应的期望误差e∞=0,且满足ulow≤u∞≤uhi,δulow≤δu∞≤δuhi以及Δulow<0,Δuhi>0;假设条件2)Q为对称正定权阵,R,S为相应的对称非负定权阵;则系统鲁棒收敛,并且当S取零矩阵时系统稳态误差收敛到0,即k→∞时,Δuk→0,ekM→0;
[0100] 定义第k+1批次的最优性能指标函数为:
[0101]
[0102] 首先考虑Δuk+1=0的情况,此时uk+1=uk,e(k+1)M=ekM,uk+1=uk,所以可以推出(ekM,0,uk)∈Ω,因为性能指标函数在点(ekM,0,uk)处的值总是要大于或等于最优值,所以可以得到如下关系式:
[0103]
[0104] 以此类推可得:
[0105]
[0106] 由式(30)可知,当k→∞时Δuk→0,因为当k足够大时Δuk→0,且满足条件Δulow0,所以约束条件Δu ≤Δuk+1≤Δu 同样满足;根据假设条件1)可知当uk+1=u时e(k+1)M=0,则 也是一个约束区域内的可行点,其中 显然(e(k+1)M,
Δuk+1,uk+1)也是一个约束区域内的可行点,因为Ω为一凸集,可以推出Ω内任意两个可行点之间的点都是可行点;
[0107] 同时,求解性能指标函数Jk+1从(e(k+1)M,Δuk+1,uk+1)到 的方向导数:
[0108]
[0109] 由式(31)可以得到:
[0110]
[0111] 因为当k→∞时Δuk→0,因此当k→∞时式(32)可简化为:
[0112]
[0113] 由式(33)以及假设条件2)可知,当k→∞时系统稳态输出误差收敛到某一有界值,特别地当S取零矩阵时,稳态输出误差到达最小且为0;上述结果表明,假设条件成立时,输入约束模型不确定系统在优化迭代学习控制律(11)作用下依然可以收敛;特别地,当系统为标称系统,即Gθ=G时,结论同样成立;
[0114] 第七步、根据鲁棒优化迭代学习控制律确定电机驱动单机械臂系统的每一迭代批次的输入矢量,将得到的输入矢量输入电机驱动单机械臂系统进行点对点轨迹跟踪控制,电机驱动单机械臂系统在输入矢量的控制作用下追踪指定跟踪点处的期望输出。
[0115] 本发明的有益技术效果是:
[0116] 本申请公开了针对电机驱动单机械臂控制系统此类具有重复运动特征的线性系统,将该电机驱动单机械臂控制系统作为被控对象,设计点对点轨迹跟踪迭代控制算法的方法,控制算法可以利用轨迹跟踪有限时间点处的跟踪误差信息来更新控制输入,进而消除了不必要的非关键点跟踪约束,非关键点处的自由度给ILC算法设计增加自由度的同时,也增加了系统整体性能的提升空间。本申请基于范数最优迭代学习框架,引入输入约束情形下的多点多目标性能函数,通过求解目标函数的二次型最优解得到迭代学习控制律,同时在系统模型存在不确定性的情形下分析了鲁棒迭代学习算法的收敛条件,保证系统稳态跟踪输出误差在有限个期望时间点处的有界收敛。

附图说明

[0117] 图1是本申请公开的电机驱动单机械臂控制系统的模型框图。
[0118] 图2是本申请的电机驱动单机械臂控制系统的实际输出与参考点跟踪曲线图。
[0119] 图3是本申请中的无输入约束下标称与不确定性系统均方根误差的比较曲线图。
[0120] 图4是本申请中的无输入约束下标称与不确定性系统性能指标的比较曲线图。
[0121] 图5是本申请中的有无输入约束的标称系统均方根误差的比较曲线图。
[0122] 图6是本申请中的有无输入约束的标称系统性能指标的比较曲线图。
[0123] 图7是本申请中的输入约束下标称与不确定性系统均方根误差的比较曲线图。
[0124] 图8是本申请中的输入约束下标称与不确定性系统性能指标的比较曲线图。

具体实施方式

[0125] 下面结合附图对本发明的具体实施方式做进一步说明。
[0126] 结合图1-图8所示,请参考图1,其示出了本申请公开的电机驱动单机械臂控制系统模型框图。第k批次的控制器输入为uk,作用于机械臂可以得到系统第k批次的实际输出yk,经跟踪点选择器可以得到指定跟踪点处的实际输出,其与储存在期望轨迹存储器的设定期望值的误差传递给ekM,误差与设定的精度值做比较,若误差没有达到所设定的精度则将误差ekM与当前控制器输入uk传递到优化迭代学习控制器生成下一批次的控制器输入uk+1,如此循环运行直至系统实际输出与期望值之间的误差达到精度要求,则停止运行,此时的控制器输入即为最优控制输入。
[0127] 针对式(1)所示的电机驱动单机械臂实际物理模型,变量参数分别设定为:
[0128] Kt=1N·m,Kb=0.085V·s/rad,
[0129] Rr=0.075Ω,Bc=0.015kg·m2/s,Dc=0.05,
[0130] l=0.6m,m1=0.05kg,m2=0.01kg,
[0131] Ξ=0.05kg·m2,Γ=0.0008Ω,g=9.8m/s2。
[0132] 系统仿真时间设定为t=2s,采样时间设定为Ts=0.1s,则系统的离散状态空间表达式的参数矩阵分别为:
[0133]
[0134] C=[1 0 0]
[0135] 不失一般性,取采样区间中的5个点(M=5)对系统进行点对点跟踪控制,选取的采样点为ti∈{2 6 10 14 18},即跟踪时刻分别为0.2s、0.6s、1s、1.4s、1.8s,跟踪点处的期望值设定为:
[0136] ydM=[1.5 0.3 0 -0.3 1.5]T
[0137] 单位为rad,同时设定初始状态为xk(0)=[-0.01 0.02 -0.03]T。对称正定矩阵Q,对称非负定矩阵R,S分别选取为Q=10I,R=0.5I,S=0.001I。当对称正定矩阵Q,对称非负定矩阵R,S与采样点确定时优化迭代学习控制律(11)中的Lu,Le也随之确定。本申请的上述优化迭代学习控制器基于STM32F103RCT6芯片上实现,芯片的输入为电机控制电压u,并通过电压传感器采集得到。输入信号通过调理电路进入STM32F103RCT6芯片进行存储和计算,并构建迭代学习更新律,CPU计算后得到的信号为最优控制输入信号uk+1,输入信号再经RS232通信模块作用于电机驱动单机械臂控制系统,不断修正机械臂跟踪轨迹,直到跟踪上指定点处的期望轨迹。电机驱动单机械臂控制系统的动态模型(1)运行时,请参考图2,其示出了当电机驱动单机械臂系统建模准确,即为标称系统时,系统应用优化迭代学习控制律(11)的点对点轨迹跟踪效果图,经过一定批次k后,系统在指定跟踪点处的输出值能准确跟踪到期望值,图3和图4表明系统经过一定的迭代批次后能够收敛。当电机驱动单机械臂系统模型各物理参数存在一定偏差时,则系统离散后的参数矩阵有了一定的不确定度,这时系统矩阵G存在不确定度Δ,Δ为一有界下三角随机数矩阵。当系统物理各参数发生变化使得不确定度Δ在[-0.8,0.2]变化,此时图3和图4分别表示无输入约束下标称系统分别与不确定系统的均方根误差、性能指标的比较曲线图,表明当电机驱动单机械臂系统存在参数存在不确定性时,优化迭代学习控制律依旧能够保证系统收敛,且标称系统的均方根误差以及性能指标的收敛速度比不确定系统更快,验证了算法的合理性与有效性。电机驱动单机械臂系统在实际控制过程中输入可能会受到约束,这里考虑对系统施加输入幅值约束,即电机控制电压的范围为[-0.9V 0.9V],图5和图6分别为有无输入约束的标称系统均方根误差和性能指标的比较曲线图,图7和图8分别为输入约束下标称系统分别与不确定系统均方根误差、性能指标的比较曲线图,表明系统的输入信号在加以一定的约束条件后依然能够完成点对点跟踪任务,只是系统的均方根误差曲线收敛速度比无约束时候慢一些,但最终还是收敛的,这也进一步验证了算法的合理性以及有效性。
[0138] 本申请通过不引入参考轨迹、直接通过优化算法得到最优控制输入信号的方法来解决电机驱动机械臂系统重复过程的点对点跟踪问题,将迭代学习算法和优化算法相结合构造优化控制器。系统建模存在一定条件的不确定性时,基于性能指标的优化算法对模型不确定性具有鲁棒性,此外电机驱动机械臂系统执行重复过程任务时,控制器输入信号可能会受到约束。所提出的点对点鲁棒迭代学习优化方法能保证电机驱动单机械臂系统不管输入是否受到约束以及建模存在一定的不确定性的情况下依然能实现对期望轨迹高精度跟踪。
[0139] 以上所述的仅是本申请的优选实施方式,本发明不限于以上实施例。可以理解,本领域技术人员在不脱离本发明的精神和构思的前提下直接导出或联想到的其他改进和变化,均应认为包含在本发明的保护范围之内。