一种基于深度神经网络的定姿回归模型的构建方法转让专利

申请号 : CN202211562458.7

文献号 : CN115563571B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 卞燕山董广然韩星付枫郭文明冯冰清王刚冯彦栋张朋黄晓峰

申请人 : 中国西安卫星测控中心

摘要 :

本公开实施例是关于一种基于深度神经网络的定姿回归模型的构建方法。该方法包括:根据航天器的定姿模式和姿控单机数据,确定初始定姿回归模型的输入参数和输出参数并对其进行预处理,得到训练数据、验证数据和测试数据;构建初始定姿回归模型,利用训练数据对初始定姿回归模型进行训练、验证,得到第一损失函数和待定定姿回归模型;若第一损失函数的值小于第一预设阈值,则利用测试数据对待定定姿回归模型进行测试,并得到第二损失函数和定姿回归模型;若第二损失函数的值小于第二预设阈值,则输出定姿回归模型。本公开实施例通过数据模型拟合复杂的机理模型,方法具有通用性,检测准确度高,可以为航天器定姿异常检测提供技术支持。

权利要求 :

1.一种基于深度神经网络的定姿回归模型的构建方法,其特征在于,该方法包括:根据航天器的定姿模式和姿控单机数据,确定初始定姿回归模型的输入参数和输出参数;

对所述初始定姿回归模型的输入参数和输出参数进行预处理,得到训练数据、验证数据和测试数据;

选取深度神经网络,并构建所述初始定姿回归模型;

利用所述训练数据对所述初始定姿回归模型进行训练,得到训练后的所述初始定姿回归模型,并通过所述验证数据对训练后的所述初始定姿回归模型进行验证,并得到第一损失函数和待定定姿回归模型;

若所述第一损失函数的值小于第一预设阈值,则利用所述测试数据对所述待定定姿回归模型进行测试,并得到第二损失函数和定姿回归模型;

若所述第二损失函数的值小于第二预设阈值,则输出所述定姿回归模型及所述定姿回归模型的参数。

2.根据权利要求1所述基于深度神经网络的定姿回归模型的构建方法,其特征在于,所述对所述初始定姿回归模型的输入参数和输出参数进行预处理的步骤中包括:对所述姿控单机数据依次进行数据选取、数据剔野、类别变量one‑hot编码、角度值转换、数据归一化及训练验证测试数据划分。

3.根据权利要求2所述基于深度神经网络的定姿回归模型的构建方法,其特征在于,所述输出所述定姿回归模型及所述定姿回归模型的参数的步骤之后还包括:对所述定姿回归模型进行异常检测。

4.根据权利要求3所述基于深度神经网络的定姿回归模型的构建方法,其特征在于,所述对所述定姿回归模型进行异常检测的步骤中包括:将待检测数据进行所述预处理,得到所述待检测数据的输入和所述待检测数据的输出;

导入所述定姿回归模型;

根据所述第二损失函数,设置检测阈值和检测步长;

将所述待检测数据的输入逐个带入到所述定姿回归模型进行计算,并根据所述检测阈值和所述检测步长,判断所述定姿回归模型是否为定姿异常。

5.根据权利要求4所述基于深度神经网络的定姿回归模型的构建方法,其特征在于,对定姿正常的所述定姿回归模型进行异常检测的步骤之后还包括:对异常检测后的所述定姿回归模型进行检测准确性评估。

6.根据权利要求1所述基于深度神经网络的定姿回归模型的构建方法,其特征在于,所述深度神经网络为多层BP神经网络。

7.根据权利要求6所述基于深度神经网络的定姿回归模型的构建方法,其特征在于,所述利用所述训练数据对所述初始定姿回归模型进行训练,得到训练后的所述初始定姿回归模型的步骤中包括:网络初始化,确定所述多层BP神经网络的输入层的节点数、隐藏层的层数、各层节的点数和输出层的节点数,随机初始化网络连接权重,设置隐藏层的阈值和输出层的阈值,确定所述多层BP神经网络的优化器的算法,并初始化学习率;

利用所述训练数据计算隐藏层的输出和输出层的输出;

根据所述隐藏层的输出和所述输出层的输出,计算第三损失函数,更新所述网络连接权重、所述隐藏层的阈值和所述输出层的阈值,并得到训练后的所述初始定姿回归模型。

8.根据权利要求7所述基于深度神经网络的定姿回归模型的构建方法,其特征在于,所述利用所述测试数据对所述待定定姿回归模型进行测试,并得到第二损失函数和定姿回归模型的步骤中包括:利用所述测试数据进行测试,计算所述测试数据的输出值与所述待定定姿回归模型的预测值之间的误差,并得到所述第二损失函数。

9.根据权利要求1所述基于深度神经网络的定姿回归模型的构建方法,其特征在于,所述得到训练数据、验证数据和测试数据的步骤之后还包括:将所述训练数据、所述验证数据和所述测试数据按照预设比例进行分配。

10.根据权利要求1所述基于深度神经网络的定姿回归模型的构建方法,其特征在于,所述姿控单机数据至少包括:星敏数据、陀螺数据、磁强计数据、太敏数据、时间数据和轨道数据。

说明书 :

一种基于深度神经网络的定姿回归模型的构建方法

技术领域

[0001] 本公开实施例涉及在轨航天器测控管理技术领域,尤其涉及一种基于深度神经网络的定姿回归模型的构建方法。

背景技术

[0002] 航天器进入预定轨道运行工作,有时候需要进行姿态调整来实现载荷工作的指向需求。航天器能够进行姿态调整的首要前提,就是确定其相对某个参考坐标系下的空间姿态,即需要进行姿态确定(以下简称为定姿)。然而,定姿是一个复杂的机理过程,需要综合航天器上的星敏、太敏、陀螺等多个姿态敏感器的数据,经过系列坐标变换、比较计算、逻辑选择等过程,得到航天器的空间姿态数据。相关技术中,任一姿态敏感器出现异常,都可能导致定姿异常,进而无法调整姿态。通过建立定姿机理模型,实现航天器姿态异常检测,不仅难度大,而且因航天器设计机理的不同,其机理模型通用性不强。
[0003] 因此,有必要改善上述相关技术方案中存在的一个或者多个问题。
[0004] 需要注意的是,本部分旨在为权利要求书中陈述的本公开的技术方案提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

发明内容

[0005] 本公开实施例的目的在于提供一种基于深度神经网络的定姿回归模型的构建方法,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
[0006] 根据本公开实施例,提供一种基于深度神经网络的定姿回归模型的构建方法,该方法包括:
[0007] 根据航天器的定姿模式和姿控单机数据,确定初始定姿回归模型的输入参数和输出参数;
[0008] 对所述初始定姿回归模型的输入参数和输出参数进行预处理,得到训练数据、验证数据和测试数据;
[0009] 选取深度神经网络,并构建所述初始定姿回归模型;
[0010] 利用所述训练数据对所述初始定姿回归模型进行训练,得到训练后的所述初始定姿回归模型,并通过所述验证数据对训练后的所述初始定姿回归模型进行验证,并得到第一损失函数和待定定姿回归模型;
[0011] 若所述第一损失函数的值小于第一预设阈值,则利用所述测试数据对所述待定定姿回归模型进行测试,并得到第二损失函数和定姿回归模型;
[0012] 若所述第二损失函数的值小于第二预设阈值,则输出所述定姿回归模型及所述定姿回归模型的参数。
[0013] 本公开的一实施例中,所述对所述初始定姿回归模型的输入参数和输出参数进行预处理的步骤中包括:
[0014] 对所述姿控单机数据依次进行数据选取、数据剔野、类别变量one‑hot编码、角度值转换、数据归一化及训练验证测试数据划分。
[0015] 本公开的一实施例中,所述输出所述定姿回归模型及所述定姿回归模型的参数的步骤之后还包括:
[0016] 对所述定姿回归模型进行异常检测。
[0017] 本公开的一实施例中,所述对所述定姿回归模型进行异常检测的步骤中包括:
[0018] 将待检测数据进行所述预处理,得到所述待检测数据的输入和所述待检测数据的输出;
[0019] 导入所述定姿回归模型;
[0020] 根据所述第二损失函数,设置检测阈值和检测步长;
[0021] 将所述待检测数据的输入逐个带入到所述定姿回归模型进行计算,并根据所述检测阈值和所述检测步长,判断所述定姿回归模型是否为定姿异常。
[0022] 本公开的一实施例中,对定姿正常的所述定姿回归模型进行异常检测的步骤之后还包括:
[0023] 对异常检测后的所述定姿回归模型进行检测准确性评估。
[0024] 本公开的一实施例中,所述深度神经网络为多层BP神经网络。
[0025] 本公开的一实施例中,所述利用所述训练数据对所述初始定姿回归模型进行训练,得到训练后的所述初始定姿回归模型的步骤中包括:
[0026] 网络初始化,确定所述多层BP神经网络的输入层的节点数、隐藏层的层数、各层节的点数和输出层的节点数,随机初始化网络连接权重,设置隐藏层的阈值和输出层的阈值,确定所述多层BP神经网络的优化器的算法,并初始化学习率;
[0027] 利用所述训练数据计算隐藏层的输出和输出层的输出;
[0028] 根据所述隐藏层的输出和所述输出层的输出,计算第三损失函数,更新所述网络连接权重、所述隐藏层的阈值和输出层的所述阈值,并得到训练后的所述初始定姿回归模型。
[0029] 本公开的一实施例中,所述利用所述测试数据对所述待定定姿回归模型进行测试,并得到第二损失函数和定姿回归模型的步骤中包括:
[0030] 利用所述测试数据进行测试,计算所述测试数据的输出值与所述待定定姿回归模型的预测值之间的误差,并得到所述第二损失函数。
[0031] 本公开的一实施例中,所述得到训练数据、验证数据和测试数据的步骤之后还包括:
[0032] 将所述训练数据、所述验证数据和所述测试数据按照预设比例进行分配。
[0033] 本公开的一实施例中,所述姿控单机数据至少包括:
[0034] 星敏数据、陀螺数据、磁强计数据、太敏数据、时间数据和轨道数据。
[0035] 本公开的实施例提供的技术方案可以包括以下有益效果:
[0036] 本公开的实施例中,通过上述基于深度神经网络的定姿回归模型的构建方法,运用深度神经网络算法训练构建航天器定姿回归模型,通过数据模型拟合复杂的机理模型,该方法具有通用性,且检测准确度高,可以为航天器定姿异常检测提供技术支持。

附图说明

[0037] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0038] 图1示出本公开示例性实施例中基于深度神经网络的定姿回归模型的构建方法的步骤流程图;
[0039] 图2示出本公开示例性实施例中基于BP神经网络的定姿回归模型结构示意图;
[0040] 图3示出本公开示例性实施例中基于深度神经网络的定姿回归模型的构建方法及异常检测的步骤流程图。

具体实施方式

[0041] 现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
[0042] 此外,附图仅为本公开实施例的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。
[0043] 本示例实施方式中首先提供了一种基于深度神经网络的定姿回归模型的构建方法。参考图1中所示,该基于深度神经网络的定姿回归模型的构建方法可以包括:步骤S101~步骤S106。
[0044] 步骤S101:根据航天器的定姿模式和姿控单机数据,确定初始定姿回归模型的输入参数和输出参数。
[0045] 步骤S102:对所述初始定姿回归模型的输入参数和输出参数进行预处理,得到训练数据、验证数据和测试数据。
[0046] 步骤S103:选取深度神经网络,并构建所述初始定姿回归模型。
[0047] 步骤S104:利用所述训练数据对所述初始定姿回归模型进行训练,得到训练后的所述初始定姿回归模型,并通过所述验证数据对训练后的所述初始定姿回归模型进行验证,并得到第一损失函数和待定定姿回归模型。
[0048] 步骤S105:若所述第一损失函数的值小于第一预设阈值,则利用所述测试数据对所述待定定姿回归模型进行测试,并得到第二损失函数和定姿回归模型。
[0049] 步骤S106:若所述第二损失函数的值小于第二预设阈值,则输出所述定姿回归模型及所述定姿回归模型的参数。
[0050] 通过上述基于深度神经网络的定姿回归模型的构建方法, 运用深度神经网络算法训练构建航天器定姿回归模型,通过数据模型拟合复杂的机理模型,该方法具有通用性,且检测准确度高,可以为航天器定姿异常检测提供技术支持。
[0051] 下面,将参考图1至图3对本示例实施方式中的上述基于深度神经网络的定姿回归模型的构建方法的各个步骤进行更详细的说明。
[0052] 在步骤S101中,航天器定姿过程就是姿态测量的过程,通过姿控单机(星敏、太敏、磁强计、陀螺、地平仪等)数据,采用多种不同的定姿算法求解航天器在某坐标系下的姿态。每颗航天器都包含了多种定姿算法,通过“定姿模式”及其它数据,标识航天器所采用的不同定姿算法。
[0053] 定姿回归模型在训练和应用时,主要以姿控系统的测量单机,包括星敏、陀螺、磁强计、太敏等数据为模型输入,此外,还需考虑将时间、轨道数据等作为模型辅助输入,用以将航天器的位置、速度等相关关系引入定姿回归模型中,总计共U=87个参数,每个参数代表一个特征。
[0054] 定姿回归模型的输出主要是各坐标系下的姿态角数据,包括轨道系姿态角、惯性系姿态角速度、轨道系角速度、对日准惯性系姿态角输出,共V=12个参数,每个参数代表一个特征。训练定姿回归模型使用的输入、输出参数,选择正常状态下的数据进行训练。
[0055] 上述输入、输出参数可以根据实际进行适配选取。
[0056] 在步骤S102中,数据预处理包括数据选取、数据剔野、类别变量one‑hot编码、角度值转换、数据归一化以及训练验证测试数据划分。
[0057] 步骤S1021:选取航天器定姿状态正常情况下的数据作为训练样本;
[0058] 步骤S1022:将给定的数据分为输入样本 、输出样本,M为样本数量,且输入样本的向量以及其对应每个向量的分
量 ,输 出样 本 的向 量 以 及 其 对应 每 个向 量 的 分 量
;其中,x为输入样本的向量,x为输入样本的向量的分量,y为输出样
本的向量,y为输出样本的向量的分量。
[0059] 步骤S1023:数据剔野,采用 剔野,其中 为样本标准差,k为正整数,一般采用进行剔野,即剔除落在 区域外的数据,μ为样本均值,并用临近局部前后两点的均值补齐;
[0060] 步骤S1024:将轨道系姿态确定模式、惯性系姿态确定模式等类别变量用one‑hot进行编码,由标量转换为矢量。比如,轨道系姿态确定模式的值为0、1、2、3、4或5,进行one‑hot编码后,对应的矢量可分别表示为:[1,0,0,0,0,0]、[0,1,0,0,0,0]、[0,0,1,0,0,0]、[0,0,0,1,0,0]、[0,0,0,0,1,0]、[0,0,0,0,0,1];
[0061] 步骤S1025:输入角度θ1、输出角度θ2值按照如下公式进行映射处理:
[0062] (1)
[0063] 上式中,P、Q为正整数,使得θ2映射至‑180°~180°之间。
[0064] 步骤S1026:输入、输出数据归一化,将数据归一化到[0,1]之间,输入数据的归一化方法为 , 为步骤S1021中所有输入样本的列特征矢量;计算完毕后,再将其还原到原始范围,输入数据的逆归一化方法为;输出数据的处理过程与此类似。
[0065] 步骤S1027:将处理好的数据拆分训练数据 、验证数据以及测试数据 ,T、D、R分别为三类
样本的数量,其比例为预设比例,具体的,假设T、D、R的比例为6:2:2,且M=T+D+R,训练数据用于训练定姿回归模型,验证数据防止过拟合,测试数据用于定姿回归模型准确性验证。
[0066] 在步骤S103中,该部分流程具有通用性,区别在于选取的深度神经网络算法。本申请选取多层BP神经网络建立定姿回归模型。
[0067] 在步骤S104中,建立定姿回归模型的具体步骤如下:
[0068] 步骤S1041:网络初始化。确定多层BP神经网络的输入层节点数n=U,隐藏层层数和各层节点数lj(j=1,2,…,c),比如l1=5,l2=6,l3=4,输出层节点数m=V;随机初始化输入层、隐藏层、输出层神经元之间的连接权重 、 、 、 ;隐藏层各层阈值  (j=1,2,…,c)、输出层阈值b;优化器采用梯度下降法,初始学习率为 =0.01。网络结构如图2所示。
[0069] 步骤S1042:隐藏层输出计算。根据训练样本 的输入X,输入层和隐藏层l1之间的连接权重以及隐藏层l1的阈值,计算隐藏层l1输出H1:
[0070] (2)
[0071] 式中, 为矢量H1的分量, 为矢量 的分量,f为隐藏层激活函数:
[0072] (3)
[0073] 以当前隐藏层的输出作为下一层隐藏层的输入,按同样方法计算其余隐藏层的输出H2、H3:
[0074] (4)
[0075] (5)
[0076] 上式中, 为矢量H1的分量, 为矢量H2的分量, 为矢量H3的分量, 为矢量 的分量, 为矢量 的分量。
[0077] 步骤S1043:输出层输出计算。根据隐藏层输出H3,连接权重 和阈值b,计算网络预测输出 :
[0078] (6)
[0079] 上式中,Ok为矢量O的分量,bk为矢量b的分量。
[0080] 步骤S1034:第三损失函数的计算。计算每一个样本输出,根据网络预测输出O和样本值Y,计算网络预测误差e:
[0081]  (7)
[0082] ek为矢量e的分量,计算第三损失函数L为:
[0083]  (8)
[0084] 步骤S1045:更新权重。根据网络预测误差e更新网络连接权重 、 、 、:
[0085] (9)
[0086] (10)
[0087] (11)
[0088] (12)
[0089] 其中, 。
[0090] 步骤S1046:阈值更新。根据网络预测误差e更新网络节点阈值  (j=1,2,…,c)、b:
[0091] (13)
[0092] (14)
[0093] (15)
[0094] (16)
[0095] 其中, 。
[0096] 在 步 骤 S 1 0 5 中 ,每 一 次 用 训 练 数 据 训 练 完 后 ,用 验 证 数 据进行验证,如果第一损失函数L1的值小于第一预设阈值 ,本公开选取 =0.001,为了防止过拟合,算法迭代中止,训练得到的网络即为待定定姿回归模型;同时,设置最大迭代次数400次,达到最大次数时,迭代也中止,输出待定定姿回归模型;否则,返回步骤S1032;
[0097] 在步骤S106中,模型测试。利用步骤S105计算得到的待定定姿回归模型,引入测试数据 进行测试,计算测试数据输出值与待定定姿回归模型预测值之间的误差,若所有测试数据的第二损失函数Lr均值小于第二预设阈值 =0.001,则输出为最终的定姿回归模型,并统计定姿回归模型对每个测试样本的第二损失函数Lr值,R为测试样本数量;否则,返回步骤S1032。
[0098] 基于深度学习算法的定姿回归模型构建过程结束,存储模型参数、权重、阈值等数据,用于检测应用。
[0099] 应用上述建立的定姿回归模型进行异常检测应用步骤如下:
[0100] 步骤1071:待检测数据准备,按照步骤S1021至步骤S1026,准备待检测数据的输入和输出;
[0101] 步骤1072:定姿回归模型导入,导入步骤S106中输出的定姿回归模型;
[0102] 步骤1073:检测规则设置,根据步骤S106中输出的第二损失函数Lr值集合,设置检测阈值 =0.001以及检测步长 ,即连续s个待检测点超过检测阈值 判断为异常;为了提高检测敏感度, 取集合 的上四
分位数;
[0103] 步骤1074:将待检测数据的输入逐个带入定姿回归模型进行计算,如果连续s个待检测点满足下式,则判断为定姿异常:
[0104] (17)
[0105] 上式中,Yk为定姿回归模型预测值矢量O,Ok为待检测数据的真实值矢量Y的分量,m为输出数据的特征维度。
[0106] 步骤1075:检测准确性评估。对于待检测序列 ,J为序列总数,定姿回归模型输出序列为 ,采用如下计算式评估定姿回归模型检
测准确性:
[0107] (18)2
[0108] 为Y第j个分量的均值。R 的取值范围为0 1,模型效果越好,值越大。~
[0109] 一种基于深度神经网络的定姿回归模型的构建方法及异常检测的步骤流程图,如图3所示,按照步骤S101至步骤106,选取某航天器正常情况下共200万个样本数据进行定姿回归模型训练、验证和测试,输出定姿回归模型;然后按照步骤1071至步骤1075,对1000个2
数据序列进行异常检测,定姿回归模型检测准确度R 可达0.9以上。
[0110] 运用深度神经网络算法训练构建航天器定姿回归模型,通过数据模型拟合复杂的机理模型,并采用模型进行异常检测,方法具有通用性,检测准确度高,可以为航天器定姿异常检测提供技术支持。
[0111] 此方法的技术特性如下:
[0112] 仿真结果验证表明,建立三层BP神经网络,各层神经元数量分别为5、6、4,训练样本数据为200万个,每个样本包含87个输入特征参数、12个输出特征参数,通过训练形成定姿回归模型,并对1000个数据序列进行异常检测,定姿回归模型检测准确度可达0.9以上。
[0113] 此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本公开实施例的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
[0114] 在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。此外,本领域的技术人员可以将本说明书中描述的不同实施例或示例进行结合和组合。
[0115] 本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。