一种基于代表点优化的Bayes融合评估方法转让专利

申请号 : CN201710974547.5

文献号 : CN107766884B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 段晓君刘博文晏良徐琎张胜迪

申请人 : 中国人民解放军国防科技大学

摘要 :

本发明公开了一种基于代表点优化的Bayes融合评估方法,包括以下步骤:1、构造经典Bayes点估计模型,计算参数(μ、D)的Bayes后验估计值;2、使用聚类算法将先验样本数据分成分nr类,nr≥4,以该nr类的聚类中心为代表点计算参数后验估计值;3、构造优化函数,计算优化函数值,所述优化函数包括偏差函数和信息损失函数;4、根据优化函数值筛选最佳代表点,得到基于代表点的Bayes后验估计值。具有合理有效利用先验信息,量化代表点数目对信息损失与融合效率的影响,进而提高试验评估精度的优点。

权利要求 :

1.一种基于代表点优化的Bayes融合评估方法,其特征在于:包括以下步骤:步骤1:构造经典Bayes点估计模型,计算参数(μ、D)的Bayes后验估计值;

步骤2:使用聚类算法将先验样本数据分成分nr类,nr≥4,以该nr类的nr个聚类中心为代表点计算参数后验估计值;

步骤3:构造优化函数,计算优化函数值,所述优化函数包括偏差函数和信息损失函数;

步骤4:根据优化函数值筛选最佳代表点,得到基于代表点的Bayes后验估计值;

所述步骤1的具体过程为:

步骤1.1:获取制导系统第一阶段的先验子样 计算第一阶段先验子样X(1)的正态-逆Gamma分布的分布参数的估计值;

其中第一阶段先验子样X(1)的样本均值 和样本方差 为n1为第一阶段先验子样的数量,

步骤1.2:获取制导系统第二阶段试验后的样本 计算第二阶段样本X(2)的正态-逆Gamma分布的分布参数的估计值;

其中第二阶段试验后的样本X(2)的样本均值 和样本方差n2为第二阶段试验后的样本数量,

步骤1.3:Bayes后验估计值为:为样本落点的均值参数μ经Bayes方法估计后的估计值, 为样本落点的方差参数D经Bayes方法估计后的估计值。

2.根据权利要求1所述的一种基于代表点优化的Bayes融合评估方法,其特征在于:步骤4中筛选最佳代表点的方法为:使nr加1,重复步骤2和3,当nr的取值大于第二阶段样本数的两倍时,停止循环,选取使优化函数 值最小的分类数nr值,该nr值所对应的nr个聚类中心即为选取的最佳代表点。

3.根据权利要求2所述的一种基于代表点优化的Bayes融合评估方法,其特征在于:所述步骤2的具体过程为:步骤2.1:采用K-means聚类算法,将先验样本分为nr类,第i类样本记作ni为第i类样本的数量,取该nr类的nr个聚类中心为预先假定的代表点,记作 计算每一类的样本方差如式(7)所示:步骤2.2:计算代表点 的样本均值 和样本方差 如式(8)所示得到基于代表点的第一阶段正态-逆Gamma分布的参数的估计值分别为:(2)

步骤2.3:结合步骤1.2中计算的第二阶段样本X 的样本均值 和样本方差 计算(2)出基于代表点的第二阶段样本X 的正态-逆Gamma分布的分布参数估计值为:得到基于代表点的Bayes后验估计值:

4.根据权利要求3所述的一种基于代表点优化的Bayes融合评估方法,其特征在于:步骤3所述优化函数如式(1)所示:其中: 为该代表点数目为nr时的偏差函数, 为相应的信息损失函数;

所述偏差函数为:

所述信息损失函数为:

其中 表示样本落点的均值参数经基于代表点的Bayes方法估计后的估计值。

说明书 :

一种基于代表点优化的Bayes融合评估方法

技术领域

[0001] 本发明主要涉及到制导系统及定位系统的精度评估领域,尤其涉及一种基于代表点优化的Bayes融合评估方法。

背景技术

[0002] 对于制导系统或定位系统的精度试验评估而言,每一阶段试验的样本量较少,直接进行评估得到的结果精度较低。文献[1](唐雪梅,张金槐,邵凤昌,等.武器装备小子样试验分析与评估[M].北京:国防工业出版社,2001:1-3)指出在试验评估过程中,为解决子样较少的问题,常采用Bayes方法进行试验评估。其优点是可以充分融合各类异源试验的先验信息,从而提高试验评估的准确度,但是传统的Bayes融合评估方法主要面临两方面的难题:一是先验信息失真;二是先验样本数过大。
[0003] 当先验信息失真时,直接将先验信息与真实现场试验融合评估会带来较大偏差,目前已经有很多文献对这方面问题进行讨论。文献[2](黄寒砚,段晓君,王正明,考虑先验信息可信度的后验加权Bayes估计[J],航空学报,2008,29(5):1245-1251)分析了不同的可信度度量方法,包括基于数据相容性检验的可信度分析,综合物理先验和数据先验的可信度分析等,提出一种可信度融合评估的准则,并依据该准则给出一种考虑先验信息可信度的Bayes估计方法。对于先验样本过大的问题,国军标中有将所有先验信息归一化为一个试验点的做法,可以在一定程度上减轻先验样本数较大时信息将“淹没”现场试验子样的不足,也可以降低验前信息失真时Bayes估计出现较大的偏差的风险。但先验信息归一化为一个试验点,其信息损失与融合效率之间的关系,理论支撑尚显不足。
[0004] 文献[3](Flury,B.Principal points[J].Biometrika,1990,77(l):33-41)提出了代表点的概念,所谓代表点(Representative Points,RPs)是指在MSE(Mean Square Error)准则下能够最优地表征分布函数的一组点集,也叫主成分点(Principal Points)。文献[4](Hartigan J A,Wong M A.Algorithm AS 136:A K-Means Clustering Algorithm[J].Applied Statistics,1979,28(1):100-108)和文献[5](Tarpey,T.A parametric k-means algorithm[J].2007,Computational Statistics,22:71-89)提出了代表点的选取的一般方法,通常直接使用诸如k-means等聚类算法来寻找代表点。通过代表点选取可以规避国军标中将先验信息归一化为一个试验点所带来的风险,但是当先验数据存在偏差时,采用直接采用聚类算法估计代表点可能会失效,因为当代表点个数过多时,先验偏差对评估结果的影响可能会较大;而选取代表点过少时,信息损失偏大。

发明内容

[0005] 针对现有技术存在的问题,本发明要解决的问题在于提供一种评估精度较高的基于代表点优化的Bayes融合评估方法。
[0006] 为解决上述技术问题,本发明采用以下技术方案:
[0007] 一种基于代表点优化的Bayes融合评估方法,包括以下步骤:步骤1:构造经典Bayes点估计模型,计算参数(μ、D)的Bayes后验估计值;步骤2:使用聚类算法将先验样本数据分成分nr类,nr≥4,以该nr类的nr个聚类中心为代表点计算参数后验估计值;步骤3:构造优化函数,计算优化函数值,所述优化函数包括偏差函数和信息损失函数;步骤4:根据优化函数值选取最佳代表点,得到基于代表点的Bayes后验估计值。
[0008] 作为本发明的进一步改进:
[0009] 进一步地,步骤4中选取最佳代表点的方法为:使nr加1,重复步骤2和3,当nr的取值大于第二阶段样本数的两倍时,停止循环,选取使优化函数 值最小的分类数nr值,该nr值所对应的nr个聚类中心即为选取的最佳代表点。
[0010] 进一步地,所述步骤1的具体过程为:
[0011] 步骤1.1:获取第一阶段的先验子样 计算第一阶段先验子样X(1)的正态-逆Gamma分布的分布参数的估计值;
[0012]
[0013] 其中第一阶段先验子样X(1)的样本均值 和样本方差 为
[0014]
[0015] n1为第一阶段先验子样的数量,
[0016] 步骤1.2:获取第二阶段试验后的样本 计算第二阶段样本X(2)的正态-逆Gamma的分布参数的估计值;
[0017]
[0018] 其中第二阶段样本X(2)的样本均值 和样本方差 为:
[0019]
[0020] n2为第二阶段试验后的样本数量,
[0021] 步骤1.3:求得Bayes后验估计值为:
[0022]
[0023] 为样本落点的均值参数μ经Bayes方法估计后的估计值, 为样本落点的方差参数D经Bayes方法估计后的估计值。
[0024] 进一步地,所述步骤2的具体过程为:
[0025] 步骤2.1:采用K-means聚类算法,将先验样本分为nr类,第i类样本记作ni为第i类样本的数量,取该nr类的聚类中心为预先假定的代表点,记作 计算每一类的样本方差如式(7)所示:
[0026]
[0027] 步骤2.2:计算代表点 的样本均值 和样本方差 如式(8)所示
[0028]
[0029] 得到基于代表点的第一阶段正态-逆Gamma分布的超参数的估计值分别为:
[0030]
[0031] 步骤2.3:结合步骤1.2中计算的第二阶段样本X(2)的样本均值 和样本方差(2)计算出基于代表点的第二阶段样本X 的正态-逆Gamma分布的分布参数估计值为:
[0032]
[0033] 得到基于代表点的Bayes后验估计值:
[0034]
[0035] 进一步地,步骤3所述优化函数为:
[0036]
[0037] 其中:nr为所选取的代表点的数目, 为该代表点数目下的偏差函数, 为相应的信息损失函数;
[0038] 所述偏差函数为:
[0039] 所述信息损失函数为:
[0040] 其中 表示样本落点的均值参数经基于代表点的Bayes方法估计后的估计值。
[0041] 与现有技术相比,本发明的优点在于:
[0042] 本发明一种基于代表点优化的Bayes融合评估方法,通过构造包括信息损失与系统偏差的优化函数,计算优化函数值,然后根据优化函数值筛选最佳代表点,得到基于该代表点的Bayes后验融合估计值,从而合理有效的利用先验信息,量化代表点的数目对信息损失与融合效率的影响,进而提高试验评估的精度。

附图说明

[0043] 图1为本发明的系统流程图;
[0044] 图2为本发明中偏差函数,信息损失函数与代表点数目的关系。

具体实施方式

[0045] 图1示出了本发明一种基于代表点优化的Bayes融合评估方法的一种实施例,该方法包括以下步骤:步骤1:构造经典Bayes点估计模型,计算参数(μx、σx)的Bayes后验估计值;步骤2:使用聚类算法将先验样本数据分成分nr类,nr≥4,以该nr类的nr个聚类中心为代表点计算参数后验估计值;步骤3:构造优化函数,计算优化函数值,所述优化函数包括偏差函数和信息损失函数;步骤4:根据优化函数值筛选最佳代表点,得到基于该代表点的Bayes后验融合估计值。本发明通过构造出包括平衡信息损失与系统偏差的优化函数,计算优化函数值,然后根据优化函数值选取最佳代表点,得到基于该代表点的Bayes后验融合估计值,从而合理有效的利用先验信息,量化代表点的数目对信息损失与融合效率的影响,进而提高试验评估的精度。
[0046] 以X方向偏差为例,X的概率密度函数为:
[0047]
[0048] 其中σx是标准差,μx是均值,方差记为Dx=σx2。
[0049] 设 精度试 验得 到的 两阶 段的 偏差 数据 样本 为 和(1)
把第一阶段的数据X 作为先验样本。
[0050] 本实施例中,步骤1中计算参数(μx、σx)的Bayes后验估计值的具体方法为:
[0051] 步骤1.1:获取第一阶段的先验子样 计算第一阶段先验子样X(1)的样本均值 和样本方差 为:
[0052]
[0053] 得到正态-逆Gamma分布参数的估计值分别为:
[0054]
[0055] n1为第一阶段先验子样的数量,
[0056] 步骤1.2:获取第二阶段试验后的样本 计算第二阶段样本X(2)的样本均值 和样本方差 为:
[0057]
[0058] 得到第二阶段样本X(2)的正态-逆Gamma的分布参数的估计值;
[0059]
[0060] n2为第二阶段试验后的样本数量,
[0061] 步骤1.3:Bayes后验估计值为:
[0062]
[0063] 为样本落点的均值参数μ经Bayes方法估计后的估计值, 为样本落点的方差参数D经Bayes方法估计后的估计值。
[0064] 步骤2:使用聚类算法将先验样本数据分成分nr类,以该nr类的聚类中心为代表点计算参数后验估计值;
[0065] 步骤2.1:采用K-means聚类算法,将先验样本分为nr类,第i类样本记作ni为第i类样本的数量,这nr类的nr个聚类中心为预先假定的代表点,记作 计算每一类的样本方差,记为:
[0066]
[0067] 步骤2.2:计算代表点 的样本均值 和样本方差
[0068]
[0069] 得到基于代表点的第一阶段正态-逆Gamma分布的超参数的估计值分别为:
[0070]
[0071] 步骤2.3:结合步骤1.2中计算的第二阶段样本X(2)的样本均值 和样本方差计算出基于代表点的第二阶段样本X(2)的正态-逆Gamma分布参数的估计值分别为:
[0072]
[0073] 得到基于代表点的Bayes后验估计值:
[0074]
[0075] 其中 表示样本落点的均值参数经基于代表点的Bayes方法估计后的估计值,表示样本落点的方差参数D经Bayes方法估计后的估计值。
[0076] 步骤3:构造优化函数,计算优化函数值,所述优化函数包括偏差函数和信息损失函数;计算优化函数中偏差值 与信息损失值 以及优化函数值F;
[0077] 优化函数:
[0078] 优化函数中偏差值:
[0079] 信息损失值:
[0080] 偏差可用选取代表点的Bayes后验均值减去经典Bayes融合的均值来进行衡量,即 根据文[3](Cox,D.R.A note on grouping[J].Journal of the American Statistical Association,1957,52:543-547)中针对代表点信息损失的计算方法,为 综上,构造的优化函数如下:
[0081]
[0082] 步骤4:根据优化函数值筛选最佳代表点,得到基于该代表点的Bayes后验估计值。
[0083] 选取最佳代表点的方法是:使nr加1,重复步骤2和3,当nr的取值大于第二阶段样本数的两倍时,停止循环,选取使优化函数 取值最小的分类数nr值,该nr值所对应的nr个聚类中心即为选取的代表点,根据步骤2的计算得到基于该代表点的Bayes后验估计值。
[0084] 下面通过理论来验证在先验信息与实际数据存在系统偏差的情况下,基于代表点优化的Bayes融合评估方法大概率优于Bayes可信度评估方法,全面优于经典Bayes方法。以落点偏差正态总体参数的估计问题进行分析,理论和算例都证实了该方法的优势。
[0085] Bayes估计的误差通常用后验方差来度量。若真实的后验分布为f(θ|X),后验期望*估计为 其它任一估计值θ的后验方差为
[0086]
[0087] 经典Bayes估计不考虑先验信息可信度,估计值为θ2,则估计的后验方差为:
[0088]
[0089] 用θ2′,θ2分别表示无信息先验和先验样本完全可信时参数θ的后验期望估计,基于可信度方法给出的点估计值可表示为
[0090]
[0091] 其后验方差为:
[0092]
[0093] 其中:
[0094]
[0095] 类似地,基于代表点的方法估计结果后验方差为
[0096]
[0097]
[0098] 无系统偏差的情形下,会有 但是,有系统偏差的情况下,由于选取代表点会损失系统偏差,因此,选取代表点后,完全相信先验与无信息先验之间的差异会因先验样本数量的减少而减小。
[0099] 由于k1<n1,则 可推出
[0100]
[0101] 因此,则有
[0102] (θ2Rp'-θ2)2≤(θ2'-θ2)2       (18)
[0103] 对比(13)、(14)和(15),可推得,
[0104]
[0105] 等号成立当且仅当λ0=1,即先验可信度p=1。
[0106] 由此可见:在不同阶段分布函数存在系统偏差的情形下,基于代表点优化的方法的估计精度高于基于可信度的Bayes估计方法,而经典Bayes估计方法精度最低。基于代表点优化的方法的估计精度与改进的Bayes估计方法的精度的差别为λ0(1-λ0)[(θ2'-θ2)2-(θ2Rp'-θ2)2],改进Bayes估计方法与经典Bayes方法的精度差别为(1-λ0)2(θ′2-θ2)2,随着可信度降低,这个差距越明显。
[0107] 下面采用实例来进一步验证本发明的有益效果。
[0108] 在第一阶段先验试验和第二阶段现场试验中,分别选取n1=200,n2=10个样本点。采用正态分布N(η,D0)和N(0,D)进行仿真,两个分布的均值偏差为η。比较经典Bayes方法、基于可信度的Bayes方法、本文结合代表优化的Bayes方法等三种方法的结果。其中结合代表点的可信度Bayes方法中,最优代表点数目基于式(12)进行计算选取。仿真试验结果见表
1,最后一列Opt为最优代表点的数目。
[0109] 表1三种方法的计算结果比较
[0110]
[0111]
[0112] 从表1可得:1)在先验样本与实际样本分布无差异时,即η=0时,经典Bayes方法即为最优选择;2)在先验样本与实际样本分布差异较大时,基于代表点优化的Bayes融合评估方法降低了不可信先验信息中的系统偏差等影响,优于Bayes可信度评估方法以及经典Bayes方法,结果更为合理。
[0113] 关于优化函数的计算,以D=1,D0=1,η=1为例,图2即为优化函数中偏差函数和信息损失函数与代表点数目关系,从图2可以看出,本例中最优代表点数目为15。
[0114] 以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。