一种卫星编队相对轨道自适应神经网络构形包含控制方法转让专利

申请号 : CN201510465443.2

文献号 : CN105068546B

文献日 : 2017-06-16

一种卫星编队相对轨道自适应神经网络构形包含控制方法，本发明涉及卫星编队相对轨道自适应神经网络构形包含控制方法。本发明的目的是为了解决现有技术中未考虑系统存在非线性不确定性和外界干扰的情况、未考虑卫星编队系统动力学存在广义干扰情况、未考虑抖振现象以及信息全局可知带来的通讯负担的问题。通过以下技术方案实现的：步骤一、建立跟随星i的相对轨道动力学方程；步骤二、对步骤一中每一个跟随星设计分布式速度观测器；步骤三、根据跟随星i的相对轨道动力学方程和分布式速度观测器进行神经网络逼近；步骤四、根据步骤三得到的神经网络逼近结果，设计自适应神经网络构形包含控制算法。本发明应用于卫星领域。

1.一种卫星编队相对轨道自适应神经网络构形包含控制方法，其特征在于，一种卫星编队相对轨道自适应神经网络构形包含控制方法具体是按以下步骤进行的：步骤一、建立跟随星i的相对轨道动力学方程；

步骤二、对步骤一中每一个跟随星设计分布式速度观测器；

步骤三、根据跟随星i的相对轨道动力学方程和分布式速度观测器进行神经网络逼近；

步骤四、根据步骤三得到的神经网络逼近结果，设计自适应神经网络构形包含控制算法；

所述步骤一中建立跟随星i的相对轨道动力学方程；具体过程为：

卫星编队系统参考轨道坐标系即LVLH坐标系如下，

LVLH坐标系x轴由地心指向参考点，LVLH坐标系y轴沿参考点运行的速度方向，LVLH坐标系z轴根据右手定则由x轴和y轴确定；

参考点轨道角速度为在LVLH坐标系中，跟随星i相对于参考点的相对轨道动力学方程为：

式中：ω0为参考点轨道角速度，xi为跟随星i的相对位置在LVLH坐标系x轴上的分量，yi为跟随星i的相对位置在LVLH坐标系y轴上的分量，zi为跟随星i的相对位置在LVLH坐标系z轴上的分量，为跟随星i的相对速度在LVLH坐标系x轴上的分量，为跟随星i的相对速度在LVLH坐标系y轴上的分量，为跟随星i的相对速度在LVLH坐标系z轴上的相对分量，为跟随星i的相对加速度在LVLH坐标系x轴上的分量，为跟随星i的相对加速度在LVLH坐标系y轴上的分量，为跟随星i的相对加速度在LVLH坐标系z轴上的分量，μe为万有引力常数，R0为圆轨道的半径，Ri为跟随星i与地心间的距离，τoix为跟随星i在LVLH坐标系x轴上的控制力作用，τdoix为跟随星i在LVLH坐标系x轴上的广义干扰作用，τoiy为跟随星i在LVLH坐标系y轴上的控制力作用，τdoiy为跟随星i在LVLH坐标系y轴上的广义干扰作用，τoiz为跟随星i在LVLH坐标系z轴上的控制力作用，τdoiz为跟随星i在LVLH坐标系z轴上的广义干扰作用，i＝

1,2,…N，N为正整数，moi为跟随星i的质量，τoi＝[τoix τoiy τoiz]T为作用在跟随星i上的控制力作用，τdoi＝[τdoix τdoiy τdoiz]T为广义干扰作用；定义广义坐标qi＝(xi,yi,zi)T，则跟随星i的相对轨道动力学方程表示为：其中，

式中：为跟随星i的广义速度；

假设跟随星i的相对轨道动力学方程中moi、coi、goi未知且广义干扰τdoi有界。

2.根据权利要求1所述一种卫星编队相对轨道自适应神经网络构形包含控制方法，其特征在于，所述步骤二中对步骤一中每一个跟随星设计分布式速度观测器；具体过程为：对每一个跟随星设计分布式速度观测器，如下式所示：

式中：为跟随星i对自身期望速度向量的估计，β为正常数，aij为加权邻接矩阵的元素，j为卫星编队系统中卫星的序号；当j＝1,2,…,N-1,N时，表示跟随星的序号，为跟随星j对自身期望速度向量的估计，其中N表示的是跟随星的个数，N为正整数；当j＝N+1,…,N+m-

1,N+m时，表示领航星的序号，为领航星j的广义速度，其中m表示领航星的个数，m为正整数。

3.根据权利要求2所述一种卫星编队相对轨道自适应神经网络构形包含控制方法，其特征在于，所述步骤三中根据跟随星i的相对轨道动力学方程和分布式速度观测器进行神经网络逼近；具体过程为：首先定义如下形式的辅助变量

式中：qi为跟随星i的广义坐标，当j＝1,2,…,N-1,N时，表示跟随星的序号，qj为跟随星j的广义坐标；当j＝N+1,…,N+m-1,N+m时，表示领航星的序号，qj为领航星j的广义坐标；

为第一个辅助变量，si为第二个辅助变量，α为正常数，将式(7)代入式(4)有式(8)转换为：

其中，

式中：si为第二个辅助变量，为第二个辅助变量si的一阶导数，τoi为作用在跟随星i上的控制力作用，τdoi为作用在跟随星i上的广义干扰作用；

采用神经网络对未知非线性项进行逼近，表示为

式中：Wi为最优神经网络权值矩阵，φi为神经元的激活函数，εi为神经网络逼近误差，设神经网络逼近误差εi是有界的，T为表示矩阵的转置；

利用对未知非线性项进行处理，则的估计值可以表示为

式中：为跟随星i对最优神经网络权值矩阵的估计值。

4.根据权利要求3所述一种卫星编队相对轨道自适应神经网络构形包含控制方法，其特征在于，所述步骤四中根据步骤三得到的神经网络逼近结果，设计自适应神经网络构形包含控制算法；具体过程为：提出如下连续包含控制算法

其中， dmax≥||τdoi+εi||2， li(0)＝1，r1,r2＞0；

式中：KAi为正定对称矩阵，A为1或2，为矩阵的Hadamard积，为跟随星i对最优神经网络权值矩阵的估计，i代表跟随星，φi为神经元的激活函数，为第一个自适应增益，li为第二个自适应增益，γ为正数，r1为正数，r2为正数，εi为神经网络逼近误差。

一种卫星编队相对轨道自适应神经网络构形包含控制方法

技术领域

[0001] 本发明涉及卫星编队相对轨道自适应神经网络构形包含控制方法。

背景技术

[0002] 1、卫星编队系统的介绍和研究意义及价值

[0003] 近年来，航天技术对世界各国的政治、经济、军事和人类生活的方方面面都产生重要影响，逐渐发展成为衡量国家综合国力的一项关键技术。卫星技术是航天技术发展的重要组成部分，苏联于1957年发射了第一颗人造地球卫星，标志着人类多年来期望能够进入外太空的梦想得以实现。随着空间技术的不断成熟，许多不同用途的卫星正给人类提供着各种便捷的服务，如气象卫星、遥感卫星、环境卫星和通信卫星等。

[0004] 随着技术的不断成熟，航天任务朝着多样化的方向发展，这就使得单星的结构变得越来越复杂，研发周期不断变长，成本不断增加，能否顺利完成航天任务的风险同时也增加了，因为单星局部故障可能会导致整个系统的瘫痪。为避免以上缺陷，多星编队飞行控制方法逐渐得到发展和应用。卫星编队飞行是指将单颗复杂大卫星所具有的功能分配给一组具有一定空间、构型、相互协作的小卫星[1](Kapila V,SparksA G,Buffington J M,Yan Q.Spacecraft formation flying:Dynamics and control[J].Journal of Guidance,Control,and Dynamics,2000,23(3):561-564.)。这些编队小卫星以类似一颗虚拟单体复杂大卫星的方式来完成一定的空间任务，如对地观测、深空探测、通讯、导航等。与单颗复杂大卫星相比，卫星编队飞行有如下主要优点[2](Kristiansen R,Nicklasson P J.Spacecraft formation flying:A review and new results on state feedback control[J].Acta Astronautica,2009,65:1537-1552.)：(1)灵活性、可靠性高。在卫星编队飞行过程中，由于相互协作的多颗小卫星是以模块化的形式来共同完成一定的空间任务，这就可以大大地提高系统的灵活性和可靠性。假如系统中有一颗小卫星损坏，只会有与之相关的几条链路受到影响，而整个系统不会由此消亡或失效，那么就可以通过及时将损坏的个体清除出系统，补充新的小卫星来使系统复原。(2)适应性强。编队飞行系统具有很强的适应性，因为它采用的是模块化技术。当飞行任务发生变更时，系统可以根据任务的变更补充有效个体，经过系统重构、队形调整之后就可以很好地适应和完成新的任务。(3)成本低。由于编队飞行的主要特点是采用大量的小卫星来完成任务，这必将促使小卫星的设计制造采用标准化的工艺流程，相比于复杂大卫星，单星的成本自然就会降低，从而使整个系统的成本降低。

[0005] 2、卫星编队控制策略的分类

[0006] 目前，卫星编队控制多采用主从式控制策略，它是指主星接收地面控制指令，实现对主星的绝对轨道控制，各编队卫星通过测量其与主星的相对状态(相对位置和速度)实现对主星相对轨道的跟踪控制。主从式控制策略缺少编队卫星间的信息交互，实质为单星对主星的跟踪控制飞行，容易出现单点失败的情形，即一旦主控制器失效，势必造成系统全局的失效。为增强编队卫星间的协同性，基于信息一致性理论分析的分布式卫星编队协同控制成为最新研究热点。分布式卫星编队协同控制问题中，卫星间通讯方式主要分为有向图和无向图。无向通讯方式要求卫星间存在双向的信息交互，这对卫星的通讯设备、卫星间的通讯链路和通讯设备提出了非常高的要求。在存在多种干扰的复杂外太空环境下，有向通讯方式更容易实现，且具有更低的成本。

[0007] 3、卫星编队系统领航星个数的分类

[0008] 卫星编队协同控制的动力学模型可以表示为Euler-Lagrange系统。近年来，基于Euler-Lagrange系统的多智能体协调控制得到了广泛的研究。在多Euler-Lagrange系统协调控制领域，按照领航者个数分类，可以分为无领航者一致性控制、单领航者跟踪控制和多领航者包含控制控制。文献[3](Ren W.Distributed leaderless consensus algorithms for networked Euler-Lagrange systems[J].International Journal of Control,2009,82(11):2137-2149.)针对无领航者的一致性问题，对多Euler-Lagrange系统设计了分布式一致性控制算法。文献[4](Rodriguez-Angeles A,Nijmeijer H.Mutual
synchronization ofrobots via estimated state feedback:A cooperative approach[J].IEEE T.Contr.Syst.T.,2004,12(4):542-554.)针对单个领航者的跟踪控制问题，通过设计非线性的观测器来获得领航者的速度信息，但要求所有的跟随者都可以获得领航者的状态信息，这样的要求在实际中很难得到满足。以Euler-Lagrange系统为模型的无领航者一致性控制和单领航者跟踪控制在卫星编队协同控制中具有一定的应用范围，其应用缺陷是各个卫星最终的运动目标是集合到某一共同状态或跟踪单个领航星。被广泛关注的另一种应用方式是多星包含控制，多星包含控制是指各跟随星集合到由多领航星围成的构形凸包内的控制方式。其典型的应用是当多个领航星检测到环境中的危险情况后形成一个安全区域，跟随星则通过信息交互与分布式控制律最终运动到该区域内，从而可以避免外界不安全区域的影响。

[0009] 多星包含控制是指各跟随星集合到由多领航星围成的构形凸包内的控制方式。其典型的应用是当多个领航星检测到环境中的危险情况后形成一个安全区域，跟随星则通过信息交互与分布式控制律最终运动到该区域内，从而可以避免外界不安全区域的影响。

[0010] 4、列举文献

[0011] 文献[5](梅杰,马广富.近距离航天器相对轨道的鲁棒自适应控制[J].宇航学报,2010,31(10):2276-2282.)考虑卫星间的相对运动，设计滑模自适应控制算法，对近距离航天器相对轨道的鲁棒自适应控制问题进行了研究。该文献不考虑航天器主动姿态机动，因而航天器的转动角速度都比较小，故只需考虑航天器的相对轨道控制问题。首先，定义目标星和跟踪星的相对位置和相对速度误差向量，通过相对位置和相对速度误差向量的线性组合形成滑模变量。然后，考虑系统是否存在的干扰，分别设计了自适应控制律。最后，通过Lyapunov稳定性理论证明了所设计的控制算法可以使系统渐近稳定或者一致最终有界稳定。

[0012] 自适应控制是指对卫星编队系统设计控制算法使之能适应一定程度的参数不确定性，即能修正自己的特性以适应对象和扰动的动态特性的变化。

[0013] 文献[6](Mei J,Ren W,Ma G F.Distributed containment control for Lagrangian networks with parametric uncertainties under a directed graph[J].Automatica,2012,48:653-659.)基于有向图，对多Euler-Lagrange系统的分布式包含控制问题进行了研究。对于每一个跟随者，为了获得领航者的速度信息和加速度信息，通过引入符号函数设计了分布式速度观测器和加速度观测器，这两种观测器所得到的观测变量可以渐近收敛于领航者所围成的动态速度凸包和加速度凸包内。考虑系统存在参数不确定性，通过参数线性化的假设，结合自适应控制设计的分布式包含控制算法使系统的包含误差渐近收敛。

[0014] 文献[7](Liu H，Li J F.Terminal sliding mode control for spacecraft formation Flying[J].IEEE Transactions on Aerospace and Electronic Systems,2009,45(3):835-846.)

[0015] 基于主从式控制策略，设计了终端滑模控制算法，对航天器的编队飞行问题进行了研究。首先，在地球引力场范围内建立卫星编队飞行的相对轨道动力学模型。然后以目标星和跟随星相对位置误差和速度误差设计的终端滑模变量可以保证系统状态一旦到达滑模面后，相对跟踪误差便可以有限时间地趋向于零。最后，考虑系统受到不确知干扰的情况下，基于符号函数设计的控制算法可以保证系统在初始条件下可以渐近地趋向去滑模面，由于符号函数的抖振问题，本文献又提出了以连续饱和函数替代符号函数的改进方法。

[0016] 方案一

[0017] 文献[5](梅杰,马广富.近距离航天器相对轨道的鲁棒自适应控制[J].宇航学报,2010,31(10):2276-2282.)考虑卫星间的相对运动，设计滑模自适应控制算法，对近距离航天器相对轨道的鲁棒自适应控制问题进行了研究。该文献不考虑航天器主动姿态机动，因而航天器的转动角速度都比较小，故只需考虑航天器的相对轨道控制问题。首先，定义目标星和跟踪星的相对位置和相对速度误差向量，通过相对位置和相对速度误差向量的线性组合形成滑模变量。然后，考虑系统是否存在的干扰，分别设计了自适应控制律。最后，通过Lyapunov稳定性理论证明了所设计的控制算法可以使系统渐近稳定或者一致最终有界稳定。

[0018] 方案具体内容如下：

[0019] (1)两星相对运动方程

[0020]

[0021] (2)相关辅助变量设计

[0022] 首先分别定义相对位置误差向量e1和相对速度误差向量e2

[0023] e1＝ρ-ρd (30)

[0024]

[0025] 基于以上误差向量，定义滑模变量s

[0026] s＝e2+ke1 (32)

[0027] (3)不考虑干扰情况下的自适应控制算法

[0028]

[0029]

[0030] 明显该算法需要已知目标轨迹的加速度信息。

[0031] (4)考虑干扰情况下的自适应控制算法

[0032]

[0033] 系统存在有界干扰，通过改变转动惯量的自适应律，使系统的跟踪误差一致最终有界。

[0034] 方案的缺点描述如下：

[0035] 该方案基于主从控制策略研究了近距离航天器相对轨道的鲁棒自适应控制问题，存在的缺点是单点失败问题，即一旦主控制器失效，势必造成系统全局的失效，整个系统缺乏协同性。该方案根据系统是否存在干扰的情况提出两种自适应控制算法，但两种控制算法中均需要目标星的加速度信息，这在工程实际中需要装备价格昂贵的通信设备且实时测量的精准性受到考验。第一种控制算法未考虑干扰，设计的控制器使系统最终收敛，该控制算法虽然具有较好的鲁棒性，但其控制器中有较多难以直接获得的状态变量。第二种控制算法考虑了系统存在干扰的情况，但所得到的结论是系统的跟踪误差是一致最终有界，控制增益矩阵和参数的选取与控制量的大小以及控制精度相互之间存在制约关系，需要根据任务精度的要求进行折中，这就使设计一定程度上依赖于工程经验。

[0036] 方案二

[0037] 文献[6](Mei J,Ren W,Ma G F.Distributed containment control for Lagrangian networks with parametric uncertainties under a directed graph[J].Automatica,2012,48:653-659.)基于有向图，对多Euler-Lagrange系统的分布式包含控制问题进行了研究。对于每一个跟随者，为了获得领航者的速度信息和加速度信息，通过引入符号函数设计了分布式速度观测器和加速度观测器，这两种观测器所得到的观测变量可以渐近收敛于领航者所围成的动态速度凸包和加速度凸包内。考虑系统存在参数不确定性，通过参数线性化的假设，结合自适应控制设计的分布式包含控制算法使系统的包含误差渐近收敛。

[0038] 方案具体内容如下：

[0039] (1)Euler-Lagrange模型

[0040]

[0041] (2)速度、加速度观测器设计

[0042]

[0043]

[0044] (3)辅助变量设计

[0045]

[0046]

[0047] (4)分布式跟踪控制算法设计

[0048] 设计如下形式的自适应包含控制算法

[0049]

[0050]

[0051] 该算法设计时用到了参数线性化的假设，但无法处理系统存在非线性不确定性和外界干扰的情况

[0052] 方案的缺点描述如下：

[0053] 该方案设计的控制算法均未考虑系统存在非线性不确定性和外界干扰的情况，因而鲁棒性较差。对于方案中的速度、加速度观测器中，由于其引入了非连续符号函数，这会给系统带来抖振，产生高频未建模动态和使系统的磨损加剧，从而带来不利影响。

发明内容

[0054] 本发明的目的是为了解决现有技术中未考虑系统存在非线性不确定性和外界干扰的情况、未考虑卫星编队系统动力学存在广义干扰情况、未考虑抖振现象以及信息全局可知带来的通讯负担的问题，而提出了一种卫星编队相对轨道自适应神经网络构形包含控制方法。

[0055] 上述的发明目的是通过以下技术方案实现的：

[0056] 步骤一、建立跟随星i的相对轨道动力学方程；

[0057] 步骤二、对步骤一中每一个跟随星设计分布式速度观测器；

[0058] 步骤三、根据跟随星i的相对轨道动力学方程和分布式速度观测器进行神经网络逼近；

[0059] 步骤四、根据步骤三得到的神经网络逼近结果，设计自适应神经网络构形包含控制算法。

[0060] 发明效果

[0061] 本发明针对卫星编队相对轨道的构形包含控制问题，考虑卫星间通讯为分布式的有向图结构，且系统存在未知干扰和摄动，通过设计分布式包含控制算法使跟随星最终收敛到领航星所围成的动态凸包内，并使包含误差渐近收敛。首先，针对每个跟随星，设计分布式观测器来获得领航星的速度信息，然后利用NN来处理系统的不确定性，利用自适应增益技术处理系统的广义干扰，最后提出分布式自适应神经网络包含控制算法，使包含误差渐近收敛。本发明所设计的包含控制算法不存在非连续函数的抖振问题。通过数值仿真实验验证了控制算法的有效性；

[0062] 在控制律的作用下，图5-7表明，在t＝15s左右，跟随星每一个自由度上的运动轨迹逐渐趋于多个领航星构成的轨迹带内；图8-11表明，在t＝20s时，所有跟随星运动到由领航星围成的构形凸包内；图12-14表明，系统中各跟随星的包含误差在t＝22s左右均趋于0；图15-17表明，跟随星的广义控制力被限幅在300以内，t＝18s以后控制力保持在数值较小的范围内(即趋于稳定)，(稳定后)不存在非连续振荡现象；整体上，本仿真验证了控制算法的有效性，能够保证系统中所有跟随星分布到由领航星围成的构形凸包内，且包含误差趋于0，控制器为连续形式，所以仿真中控制器波形不存在非连续的振荡。

[0063] 1、设计分布式速度观测器，使每个跟随星都可以获得领航星的速度信息；

[0064] 2、考虑系统存在非线性不确定性和外界干扰的情况，通过神经网络进行逼近，从而使系统具有较好的鲁棒性；

[0065] 神经网络对函数具有良好的逼近能力，常被用于补偿系统中的非线性不确定和外界干扰。神经网络对系统中的未知非线性项fi进行补偿时，那么fi可以表示为

[0066] fi＝WiTφi+εi (43)

[0067] 式中，Wi为最优神经网络权值矩阵，φi为神经元的激活函数，εi为神经网络逼近误差，且该误差是有界的。神经元的激活函数有很多选择，如sigmoid函数、双曲正切函数以及高斯函数等。那么，对未知非线性项fi的估计为

[0068]

[0069] 式中，为最优神经网络权值矩阵的估计。

[0070] 如下以多输入单输出的3层RBF神经网络为例进行简单介绍，其结构如图2所示。

[0071] 在RBF神经网络结构中，x＝[x1,x2,…,xr]T为网络的r维输入向量，径向基向量为Tφ＝[φ1,φ2,…,φm] ，其中φj通常取为高斯基函数，即

[0072]

[0073] 式中，cj为网络中第j个节点的中心向量，cj＝[cj1,cj2,…,cjr]T；b＝[b1,b2,…,bm]T为网络的基宽向量，bj>0为节点j的基宽值。如果已知网络的权值矩阵为w＝[w1,w2,…,wmT] ，则RBF神经网络的输出为：

[0074] yj＝w1φ1+w2φ2+…+wmφm (46)

[0075] 3、考虑了卫星编队系统动力学存在广义干扰情况；

[0076] 4、控制系统为连续控制系统，不存在抖振现象；连续控制是指系统所设计的控制器函数具有连续性质，即不存在突变、奇点等情况。一般情况下，若是系统控制器中引入符号函数，则为不连续控制，因为符号函数存在数值突变的情况。非连续控制器会导致系统出现抖振，引入高频未建模动态，使系统的动态品质下降。

[0077] 5、仅要求编队卫星间通讯拓扑为一般的有向图，只有部分跟随星能获得领航星的信息即可，避免了信息全局可知带来的通讯负担，且设计的观测器和控制器均为分布式的；

[0078] 6、研究的是多领航星的构形包含控制问题，比一般的单一领航星(中心星)的协调跟踪控制问题具有更广泛的研究意义。

附图说明

[0079] 图1为本发明流程图；

[0080] 图2为RBF神经网络结构图，x＝[x1,x2,…,xr]T为网络的r维输入向量，径向基向量为φ＝[φ1,φ2,…,φm]T，网络的权值矩阵为w＝[w1,w2,…,wm]T，j为第j个神经元，Σ为求和符号，yj为RBF神经网络的输出；

[0081] 图3为卫星编队系统参考轨道坐标系示意图，Pi为跟随星i在LVLH坐标系下的相对位置矢量，Pj为卫星j在LVLH坐标系下的相对位置矢量；

[0082] 图4为编队卫星通讯拓扑图，1-8为跟随星，9-13为领航星；

[0083] 图5为实施例中qi1,i＝1,…,13的轨迹图；

[0084] 图6为实施例中qi2,i＝1,…,13的轨迹图；

[0085] 图7为实施例中qi3,i＝1,…,13的轨迹图；

[0086] 图8为实施例中t＝0s跟随星与领航星的相对位置图；

[0087] 图9为实施例中t＝10s跟随星与领航星的相对位置图；

[0088] 图10为实施例中t＝15s跟随星与领航星的相对位置图；

[0089] 图11为实施例中t＝20s跟随星与领航星的相对位置图；

[0090] 图12为qi1,i＝1,…,8的包含误差图；

[0091] 图13为qi2,i＝1,…,8的包含误差图；

[0092] 图14为qi3,i＝1,…,8的包含误差图；

[0093] 图15为跟随星广义控制力τoi1,i＝1,…,8变化曲线图；

[0094] 图16为跟随星广义控制力τoi2,i＝1,…,8变化曲线图；

[0095] 图17为跟随星广义控制力τoi3,i＝1,…,8变化曲线图。

具体实施方式

[0096] 具体实施方式一：结合图1说明本实施方式，一种卫星编队相对轨道自适应神经网络构形包含控制方法，其特征在于，一种卫星编队相对轨道自适应神经网络构形包含控制方法具体是按以下步骤进行的：

[0097] 步骤一、建立跟随星i的相对轨道动力学方程；

[0098] 步骤二、对步骤一中每一个跟随星设计分布式速度观测器；

[0099] 步骤三、根据跟随星i的相对轨道动力学方程和分布式速度观测器进行神经网络逼近；

[0100] 步骤四、根据步骤三得到的神经网络逼近结果，设计自适应神经网络构形包含控制算法；

[0101] 所述步骤一中建立跟随星i的相对轨道动力学方程；具体过程为：

[0102] 如图3所示为卫星编队系统和卫星编队系统参考轨道坐标系即LVLH坐标系，[0103] LVLH坐标系x轴由地心指向参考点，LVLH坐标系y轴沿参考点运行的速度方向，LVLH坐标系z轴根据右手定则由x轴和y轴确定；

[0104] 考虑参考点运行在某近圆轨道上，参考点轨道角速度为在LVLH坐标系中，跟随星i相对于参考点的相对轨道动力学方程为：

[0105]

[0106]

[0107]

[0108] 式中：ω0为参考点轨道角速度，xi为跟随星i的相对位置在LVLH坐标系x轴上的分量，yi为跟随星i的相对位置在LVLH坐标系y轴上的分量，zi为跟随星i的相对位置在LVLH坐标系z轴上的分量，为跟随星i的相对速度在LVLH坐标系x轴上的分量，为跟随星i的相对速度在LVLH坐标系y轴上的分量，为跟随星i的相对速度在LVLH坐标系z轴上的相对分量，为跟随星i的相对加速度在LVLH坐标系x轴上的分量，为跟随星i的相对加速度在LVLH坐标系y轴上的分量，为跟随星i的相对加速度在LVLH坐标系z轴上的分量，μe为万有引力常数，R0为圆轨道的半径，Ri为跟随星i与地心间的距离，τoix为跟随星i在LVLH坐标系x轴上的控制力作用，τdoix为跟随星i在LVLH坐标系x轴上的广义干扰作用，τoiy为跟随星i在LVLH坐标系y轴上的控制力作用，τdoiy为跟随星i在LVLH坐标系y轴上的广义干扰作用，τoiz为跟随星i在LVLH坐标系z轴上的控制力作用，τdoiz为跟随星i在LVLH坐标系z轴上的广义干扰作用，i＝1,2,…N，N为正整数，moi为跟随星i的质量，τoi＝[τoix τoiy τoiz]T为作用在跟随星i上的控制力作用，τdoi＝[τdoix τdoiy τdoiz]T为广义干扰作用；定义广义坐标qi＝(xi,yi,zi)T，则跟随星i的相对轨道动力学方程表示为：

[0109]

[0110] 其中，

[0111] 式中：为跟随星i的广义速度；

[0112] 假设跟随星i的相对轨道动力学方程中moi、coi、goi未知且广义干扰τdoi有界。

[0113] 具体实施方式二：本实施方式与具体实施方式一不同的是，所述步骤二中对步骤一中每一个跟随星设计分布式速度观测器；具体过程为：

[0114] 本发明考虑所有领航星均具有常值速度。由于领航星的速度不是全局已知，为了实现所有跟随星对领航星的包含控制，

[0115] 对每一个跟随星设计分布式速度观测器，如下式所示：

[0116]

[0117] 式中：为跟随星i对自身期望速度向量的估计，β为正常数，aij为加权邻接矩阵的元素，j为卫星编队系统中卫星的序号；当j＝1,2,…,N-1,N时，表示跟随星的序号，为跟随星j对自身期望速度向量的估计，其中N表示的是跟随星的个数，N为正整数；当j＝N+1,…,N+m-1,N+m时，表示领航星的序号，为领航星j的广义速度，其中m表示领航星的个数，m为正整数。

[0118] 本发明用有向图来描述卫星编队系统的通讯拓扑结构。其中，集合由所有节点组成，表示为集合ε由所有边组成，记
为有向图的边(vi,vj)∈ε表示卫星j能够获取卫星i的信息，vi为vj的父节点，vj为vi的子节点，并记vi为vj的邻居。矩阵A＝[aij]表示有向图的加权邻接矩阵，其定义为：当i≠j且(vi,vj)∈ε时，aij＝1，否则aij＝0。若有向图中除了一个节点(称为根节点)外，其余每个节点均有且仅有一个父节点，且存在根节点到其余任何节点的有向路径，则称该有向图为有向树。有向图的有向生成树为包含该有向图所有节点的有向树。如果有向图存在一个为有向生成树的子图，则称该有向图具有有向生成树。定义有向图G的Laplacian矩阵L为：L＝[lij]，其中lii＝∑j∈ν,j≠iaij和lij＝-aij，i≠j。

[0119] 假设1对于任意一个跟随星，至少存在一个领航星，该领航星有到该跟随星的有向路径。

[0120] 有向图G的Laplacian矩阵L可以写成如下方块矩阵的形式

[0121]

[0122] 其中，L1∈RN×N，L2∈RN×m，并有如下引理成立。

[0123] 引理1当假设1成立时，有：(1)存在由正实数di组成的对角矩阵P＝diag(d1,…,dn)，使是对称正定的；(2)矩阵的每个元素均是非负的；(3)矩阵L1的所有特征值均具有正实部。

[0124] 分布式观测器为通过设计观测器可以使跟随星间接获得领航星速度信息。对跟随星所设计的观测器，仅仅用到该跟随星邻居的状态信息。

[0125] 定义各跟随星期望位置向量期望速度向量其中 qL, 为由qi, 拼成的列向量，由凸包的定义知期望位置、速度向量分别在领航星的位置、速度向量围成的构形凸包内。将式(5)写成向量形式

[0126]

[0127] 为由拼成的列向量，并有

[0128]

[0129] 式中：由于本发明考虑领航星具有常速度，故则由引理1知

[0130]

[0131] 其它步骤及参数与具体实施方式一相同。

[0132] 具体实施方式三：本实施方式与具体实施方式一或二不同的是，所述步骤三中根据跟随星i的相对轨道动力学方程和分布式速度观测器进行神经网络逼近；具体过程为：

[0133] 首先定义如下形式的辅助变量

[0134]

[0135]

[0136] 式中：qi为跟随星i的广义坐标，当j＝1,2,…,N-1,N时，表示跟随星的序号，qj为跟随星j的广义坐标；当j＝N+1,…,N+m-1,N+m时，表示领航星的序号，qj为领航星j的广义坐标；为第一个辅助变量，si为第二个辅助变量，α为正常数，将式(7)代入式(4)有[0137]

[0138] 由于moi、coi、goi均是未知的，所以和goi为未知非线性项，则式(8)转换为：

[0139]

[0140] 其中，

[0141] 式中：si为第二个辅助变量，为第二个辅助变量si的一阶导数，τoi为作用在跟随星i上的控制力作用，τdoi为作用在跟随星i上的广义干扰作用；

[0142] 采用神经网络对未知非线性项进行逼近，可以表示为

[0143]

[0144] 式中：Wi为最优神经网络权值矩阵，φi为神经元的激活函数，εi为神经网络逼近误差，设神经网络逼近误差εi是有界的，T为表示矩阵的转置；

[0145] 利用对激活函数进行处理，则跟随星i对的估计量可以表示为

[0146]

[0147] 式中：为跟随星i对最优神经网络权值矩阵的估计值。

[0148] 其它步骤及参数与具体实施方式一或二相同。

[0149] 具体实施方式四：本实施方式与具体实施方式一、二或三不同的是，所述步骤四中根据步骤三得到的神经网络逼近结果，设计自适应神经网络构形包含控制算法；具体过程为：

[0150] 由于控制器非连续会给系统带来抖振，使系统出现未建模高频动态并使系统磨损加剧，带来极不利的影响，为此，

[0151] 提出如下连续包含控制算法

[0152]

[0153]

[0154]

[0155]

[0156]

[0157] 其中， dmax≥||τdoi+εi||2， li(0)＝1，r1,r2＞0；

[0158] 式中：KAi为正定对称矩阵，A为1或2，为矩阵的Hadamard积，为跟随星i对最优神经网络权值矩阵的估计，φi为神经元的激活函数，为第一个自适应增益，li为第二个自适应增益，γ为正数，r1为正数，r2为正数，εi为神经网络逼近误差。

[0159] 本发明考虑卫星编队系统V由N个跟随星VF和m个领航星VL组成，编号并分别记其集合为V＝VF∪VL、VF＝{1,2,…,N}、VL＝{N+1,…,N+m}。

[0160] 系统稳定性理论

[0161] Lyapunov稳定性理论：借助一个Lyapunov函数来直接对系统平衡状态的稳定性做出判断。从能量观点进行稳定性分析。如果一个系统被激励后，其存储的能量随着时间的推移逐渐衰减，达到平衡状态时，能量将是最小值，则这个平衡状态是渐进稳定的。反之，若系统不断地从外界吸收能量，储能越来越大，则这个平衡状态就是不稳定的。如果系统的储能既不增加，也不消耗，则这个平衡状态就是Lyapunov意义下的稳定。由于系统的复杂性和多样性，往往难以直观找到一个能量函数来描述系统的能量关系，于是Lyapunov定义一个正定的标量函数V，作为虚构的广义能量，根据的符号特征来判别系统的稳定性。对于一个给定的系统，若能够找到一个正定的标量函数V，而是负定的，则这个系统是渐进稳定的。这个V叫做Lyapunov函数，该方法被称为Lyapunov稳定性理论。

[0162] Barbalet引理：如果f(t), 并且存在p∈[1,∞)，使得f(t)∈Lp，那么当t→∞时，f(t)→0；

[0163] 将控制算法(12)代入式(9)有

[0164]

[0165] 式中：moi为跟随星i的质量，si为辅助变量，为辅助变量si的一阶导数，εi为神经网络逼近误差，为权值矩阵估计误差；

[0166] 构造Lyapunov函数

[0167]

[0168] 式中：V为Lyapunov函数，VF为所有跟随星组成的集合；

[0169] 对其求导得

[0170]

[0171] 式中：为Lyapunov函数的一阶导数；

[0172] 对其化简得

[0173]

[0174]

[0175] 式中：表示对于任意；

[0176] 由于且

[0177]

[0178] 则

[0179]

[0180] 根据式(18)与式(23)可以得到si∈L∞，并且存在V∞∈[0,V(0)] ,使得

[0181] 式中： ess sup为真上确界，u(t)为勒贝格可测函数。

[0182] L∞为空间，V(0)为Lyapunov函数的初值；

[0183] 对式(23)两边积分可得

[0184]

[0185] 上式表明si∈L2，因此si∈L2∩L∞。又广义干扰τdoi有界，且根据式(17)可以得到根据Barbalat定理，可以得到

[0186]

[0187] 将式(6)、(7)写成向量形式

[0188]

[0189] 其中 qF,sF为由qi,si拼成的列向量；

[0190] 式中，为跟随星实际位置与期望位置的误差向量，为跟随星实际位置与期望位置的误差向量的一阶导数，α为正常数，Ip为p为单位阵，为Kronecker积；

[0191] 式中：VF为所有跟随星组成的集合；

[0192] 则由输入到状态稳定性定理知：将看作输入，看作状态，则系统是输入到状态稳定的，即有

[0193]

[0194] 由定义知当t→∞时，系统所有跟随星分布到由领航星围成的构形凸包内，即[0195]

[0196] 采用以下实施例验证本发明的有益效果：

[0197] 实施例1

[0198] 网络拓扑结构

[0199] 步骤一、建立跟随星i的相对轨道动力学方程；

[0200] 步骤二、对步骤一中每一个跟随星设计分布式速度观测器；

[0201] 步骤三、根据跟随星i的相对轨道动力学方程和分布式速度观测器进行神经网络逼近；

[0202] 步骤四、根据步骤三得到的神经网络逼近结果，设计自适应神经网络构形包含控制算法；

[0203] 一种卫星编队相对轨道自适应神经网络构形包含控制方法具体是按以下步骤进行的：本节通过数值仿真实验验证本发明所提分布式包含控制算法的有效性。考虑卫星编队系统由8个跟随星(编号为1-8)和5个领航星(编号为9-13)组成。卫星编队系统中领航星和跟随星的通讯拓扑图如图4所示，该有向图明显满足具有有向生成树的假设。

[0204] 假设卫星编队系统参考点运行在近圆轨道上，初始轨道根数选取为：[a e i Δ ω f]＝[7136.0km 0.001 60° 10° 30° 0°]，其中a为参考点所在轨道的半长轴，e为偏心率，i为轨道倾角，Δ为升交点赤经，ω为近心点角距，f为初始时刻的真近点角。

[0205] 各领航星的相对运动轨迹分别为

[0206] q91＝5t+22,q92＝5t+10,q93＝5t+10,q101＝5t+26,q102＝5t+10.5,q103＝5t+8,[0207] q111＝5t+28,q112＝5t+14.5,q113＝5t+22,q121＝5t+24,q122＝5t+20,q123＝5t+16,[0208] q131＝5t+20,q132＝5t+15,q133＝5t+14。

[0209] 跟随星(i＝1,…,8)的相对轨道动力学方程为

[0210]

[0211] 各跟随星的质量为moi＝35kg，跟随星模型广义干扰取为

[0212]

[0213] 跟随星的初始相对位置和相对速度分别为：

[0214] q1(0)＝[15 10 3]Tm,q2(0)＝[10 -10 10]Tm,q3(0)＝[-20 -20 -15]Tm,

[0215] q4(0)＝[-15 -10 30]Tm,q5(0)＝[15 -10 16]Tm,q6(0)＝[-15 10 13]Tm,[0216] q7(0)＝[-15 -20 -12]Tm,q8(0)＝[15 20 -8]Tm；

[0217]

[0218]

[0219]

[0220] 神经网络激活函数向量取为

[0221] φi(z)＝[φi1(z),...,φi6(z)]T (51)

[0222] 其中，φij(z)是Guassian函数，即

[0223]

[0224] 式中：假设神经网络的参数设定为：神经元激活函数的宽度设为σij＝2，初始神经网络权值矩阵设为零矩阵，即神经元激活函数的中
心位置cij均匀分布在区域[-5,5]6×[-0.5,0.5]6内。控制器设计参数

[0225] (1)由于实际系统中广义控制τoi会有一定幅值限制，因此在仿真过程中选取饱和函数对τoi进行限制，饱和函数的形式如下所示：

[0226]

[0227] 其中，τimax为正常数，表示控制量τoi的最大幅值。本文取τimax＝300。

[0228] (2)对于控制器中的自适应律(15)，非负，所以不会降低，因此需要对进行限幅

[0229]

[0230] 其中，为正常数，表示的最大幅值。本文取

[0231] (3)考虑到符号函数的实现性，本发明控制器中的项中的sgn(si)项按照如下近似方法实现：sgn(si)＝[sat(si1),sat(si2),sat(si3)]T

[0232]

[0233] 其中，δ为数值较小的正常数，本文取δ＝5。

[0234] 综合以上考虑，仿真参数选取为：控制输入饱和幅值300，K1i＝20I2，K2i＝10I2，仿真时间为40s，α＝0.2，β＝2，γ＝15， δ＝5，r1＝0.01，r2＝0.01。

[0235] 仿真分析

[0236] 图5-7分别表示qi1,qi2,qi3,i∈1,…,13的运动轨迹，图8-11表示的是不同时刻卫星编队系统的构形包含关系图，可以看出8个跟随星最终可以收敛到5个领航星围成的构形凸包内。

[0237] 仿真结果表明：在控制律的作用下，图5-7表明，在t＝15s左右，跟随星每一个自由度上的运动轨迹逐渐趋于多个领航星构成的轨迹带内；图5为qi1,i＝1,…,13的轨迹，qi1表示跟随星i的广义坐标的第一个分量；图6为qi2,i＝1,…,13的轨迹，qi2表示跟随星i的广义坐标的第二个分量；图7为qi3,i＝1,…,13的轨迹，qi3表示跟随星i的广义坐标的第三个分量；

[0238] 图8-11表明，在t＝20s时，所有跟随星运动到由领航星围成的构形凸包内；图8为t＝0s跟随星与领航星的相对位置图，图9为t＝10s跟随星与领航星的相对位置图，图10为t＝15s跟随星与领航星的相对位置图，图11为t＝20s跟随星与领航星的相对位置图；

[0239] 图12-14表明，系统中各跟随星的包含误差在t＝22s左右均趋于0；图12为qi1,i＝1,…,8的包含误差图，图13为qi2,i＝1,…,8的包含误差图，图14为qi3,i＝1,…,8的包含误差图；

[0240] 图15-17表明，图15为跟随星广义控制力τoi1,i＝1,…,8变化曲线，τoi1为跟随星i的广义控制力的第一个分量，图16为跟随星广义控制力τoi2,i＝1,…,8变化曲线，τoi2为跟随星i的广义控制力的第二个分量，图17为跟随星广义控制力τoi3,i＝1,…,8变化曲线，τoi3为跟随星i的广义控制力的第三个分量，跟随星的广义控制力被限幅在300以内，t＝18s以后控制力保持在数值较小的范围内(即趋于稳定)，(稳定后)不存在非连续振荡现象。

[0241] 整体上，本仿真验证了控制算法的有效性，能够保证系统中所有跟随星分布到由领航星围成的构形凸包内，且包含误差趋于0，控制器为连续形式，所以仿真中控制器波形不存在非连续的振荡。

一种卫星编队相对轨道自适应神经网络构形包含控制方法转让专利

申请号 : CN201510465443.2

文献号 : CN105068546B

文献日 : 2017-06-16

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 孙延超 , 陈亮名 , 王文佳 , 董振 , 李传江 , 马广富

申请人 : 哈尔滨工业大学

摘要 :

权利要求 :

说明书 :