一种基于同质性检验的数据分区方法转让专利

申请号 : CN201510990130.9

文献号 : CN105607049B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李杨郭美玲张宁位寅生

申请人 : 哈尔滨工业大学

摘要 :

一种基于同质性检验的数据分区方法,本发明涉及基于同质性检验的数据分区方法。本发明的目的是为了解决现有技术在实际情况下杂波环境是非均匀时,经典方法鲁棒性能低、目标检测性能低以及只考虑局部数据的同质性,对于其他经典方法并不适用的问题。具体过程为:一、开始;二、获取雷达回波幅值数据,设置进位;三、对雷达回波幅值数据按需分段,并初始化R;四、计算不同分段间的同质化水平,对R进行赋值;五、调整进位,将进位+1;六、寻找R中大于进位的数据元素,如果能够找到则进行同质化水平计算再进行五,如果不能够找到,则进行七;七、根据分区矩阵R生成新的分区矩阵tt;八、结束。本发明应用于信号处理领域。

权利要求 :

1.一种基于同质性检验的数据分区方法,其特征在于一种基于同质性检验的数据分区方法具体是按照以下步骤进行的:步骤一、开始;

步骤二、获取雷达回波幅值数据,设置进位;过程为:

获取雷达回波数据矩阵,回波数据元素为复数,取幅值得到雷达回波幅值数据矩阵,设置进位为0;

步骤三、对雷达回波幅值数据按需分段,并初始化分区矩阵R;过程为:

按实际需求对参考窗口矩阵进行选择,参考窗口矩阵为m'*n',m'表示参考窗口行数,n'表示参考窗口列数;设取幅值得到雷达回波幅值数据矩阵为m*n,m为取幅值得到雷达回波幅值数据矩阵行数,n为取幅值得到雷达回波幅值数据矩阵列数;按参考窗口对取幅值得到雷达回波幅值数据矩阵进行分段,分为 段,设置分区矩阵R,分区矩阵R行数为列数为 初始化分区矩阵R所有数据元素为0;m'取值范围为 n'取值范围为 m取值范围为1≤m≤10000,n取值范围为1≤n≤10000;

步骤四、计算不同分段间的同质化水平,对分区矩阵R进行赋值;

步骤五、调整进位,将进位+1;

步骤六、寻找分区矩阵R中大于进位的数据元素,如果能够找到则进行同质化水平计算再进行步骤五,如果不能够找到,则进行步骤七;

步骤七、根据分区矩阵R生成新的分区矩阵tt;

步骤八、结束。

2.根据权利要求1所述一种基于同质性检验的数据分区方法,其特征在于:所述按参考窗口对取幅值得到雷达回波幅值数据矩阵进行分段,分为 段;具体过程为:设 将取幅值得到雷达回波幅值数据矩阵中第

到m个元素整合到第 段中,将取幅值得到雷达回波幅值数据矩阵中第 到n个元素整合到第 段中。

3.根据权利要求2所述一种基于同质性检验的数据分区方法,其特征在于:所述步骤四中计算不同分段间的同质化水平,对分区矩阵R进行赋值;具体过程为:令分区矩阵R(1,1)=1;计算第(1,1)段取幅值得到雷达回波幅值数据矩阵的数据段与第(i,j)段取幅值得到雷达回波幅值数据矩阵的数据段同质化水平,计算所得同质化水平与步骤二进位的和即为分区矩阵R(i,j)的值。

4.根据权利要求3所述一种基于同质性检验的数据分区方法,其特征在于:所述计算第(1,1)段取幅值得到雷达回波幅值数据矩阵的数据段与第(i,j)段取幅值得到雷达回波幅值数据矩阵的数据段同质化水平, 具体过程为:计算第(1,1)段取幅值得到雷达回波幅值数据矩阵的数据段与第(i,j)段取幅值得到雷达回波幅值数据矩阵的数据段的标准化的检验统计量TkN;分区矩阵R的第1行第1列元素值为1;

根据标准化的检验统计量TkN及K-AD同质性检验临界值表设置同质化水平,设定-5<TkN≤0.326同质化水平为1,0.326<TkN≤1.225同质化水平为2,1.225<TkN≤1.960同质化水平为3,1.960<TkN≤2.719同质化水平为4,2.719<TkN≤3.752同质化水平为5,3.752<TkN≤100同质化水平为6。

5.根据权利要求4所述一种基于同质性检验的数据分区方法,其特征在于:所述步骤六中寻找分区矩阵R中大于进位的数据元素,如果能够找到则进行同质化水平计算再进行步骤五,如果不能够找到,则进行步骤七;具体过程为:从分区矩阵R的第(1,1)个元素开始,寻找第一个大于步骤五中进位的数据元素的位置,若能寻找到并且第一个大于步骤五中进位的数据元素的位置位于分区矩阵R第x行第y列,则进行同质化水平计算,x取值范围为y取值范围为 执行步骤五;

若不能寻找到大于步骤五中进位的数据元素,则执行步骤七。

6.根据权利要求5所述一种基于同质性检验的数据分区方法,其特征在于:所述从分区矩阵R的第(1,1)个元素开始,寻找第一个大于步骤五中进位的数据元素的位置,若能寻找到并且其位于第x行第y列,则进行同质化水平计算,具体过程为:根据分区矩阵R的x行y列确定取幅值得到雷达回波幅值数据矩阵的第(x,y)处数据段,更新分区矩阵R第x行第y列数据元素为步骤五中进位+1,继续寻找分区矩阵R的数据元素大于步骤五中进位的所有位置,位置表示为(i1,j1), i1表示位置所在行数,j1表示位置所在列数,根据i1行j1列确定取幅值得到雷达回波幅值数据矩阵的第(i1,j1)处数据段,计算第(a,b)处数据段与第(i1,j1)处数据段的同质化水平,更新分区矩阵R第i1行第j1列数据元素为计算的同质化水平与步骤五中进位的和。

7.根据权利要求6所述一种基于同质性检验的数据分区方法,其特征在于:所述步骤七中根据分区矩阵R生成新的分区矩阵tt;具体过程为:新的分区矩阵tt大小与取幅值得到雷达回波幅值数据矩阵大小相同,为m行,n列;如果a不等于 b不等于 则令tt矩阵中第a(m'-1)+1到am'行,第b(n'-1)+1到bn'列的数据元素的值等于分区矩阵R中第a行第b列数据元素的值;

如果a等于 b不等于 则令tt矩阵中第a(m'-1)+1到m行,第b(n'-1)+1到bn'列的数据元素的值等于分区矩阵R中第a行第b列数据元素的值;

如果a不等于 b等于 则令tt矩阵中第a(m'-1)+1到am'行,第b(n'-1)+1到n列的数据元素的值等于分区矩阵R中第a行第b列数据元素的值;

如果a等于 b等于 则令tt矩阵中第a(m'-1)+1到m行,第b(n'-1)+1到n列的数据元素的值等于分区矩阵R中第a行第b列数据元素的值。

说明书 :

一种基于同质性检验的数据分区方法

技术领域

[0001] 本发明涉及基于同质性检验的数据分区方法。

背景技术

[0002] 经典的信号处理算法及检测技术,均假定整个杂波背景满足同一概率分布,随技术发展,现已发现通常实际的杂波背景尤其是机载下视雷达的杂波背景并不满足同一概率分布,这种差异性带来经典方法鲁棒性能的降低。例如空时自适应处理技术(STAP),若要获得鲁棒性,则要求能精确估计协方差矩阵。协方差矩阵采用最大似然估计得到,估计所用的样本一般来自待检测单元两侧,为获得良好性能(实际输出信杂噪比损失不超过3dB),训练样本需满足以下两条件:1、训练样本与待检测样本满足独立同分布(I.I.D);2、训练样本个数大于系统自由度的2倍。但在实际情况下,杂波环境是非均匀的,一方面是由于地形本身的特点引起;另一方面是由于机载雷达的阵列结构引起。在此情况下,很难得到满足条件的样本,这样会使STAP性能大幅降低。对于传统的目标检测技术来说同样存在这样的问题,传统的恒虚警检测技术(CFAR)适用于统计特性相同的区域。但在实际情况下,杂波环境是非均匀的会带来目标检测性能的下降。2013年Jeong等人提出了CI-CFAR检测器,通过拟合优度测试选择同质单元作为参考单元,进行CFAR检测,虽然提高了目标的检测概率,但此方法只考虑局部数据的同质性,对于其他经典方法例如STAP技术并不适用。

发明内容

[0003] 本发明的目的是为了解决现有技术在实际情况下杂波环境是非均匀时,经典方法鲁棒性能低、目标检测性能低以及只考虑局部数据的同质性,对于其他经典方法并不适用的问题,而提出的一种基于同质性检验的数据分区方法。
[0004] 上述的发明目的是通过以下技术方案实现的:
[0005] 步骤一、开始;
[0006] 步骤二、获取雷达回波幅值数据,设置进位;
[0007] 步骤三、对雷达回波幅值数据按需分段,并初始化分区矩阵R;
[0008] 步骤四、计算不同分段间的同质化水平,对分区矩阵R进行赋值;
[0009] 步骤五、调整进位,将进位+1;
[0010] 步骤六、寻找分区矩阵R中大于进位的数据元素,如果能够找到则进行同质化水平计算再进行步骤五,如果不能够找到,则进行步骤七;
[0011] 步骤七、根据分区矩阵R生成新的分区矩阵tt;
[0012] 步骤八、结束。
[0013] 发明效果
[0014] 本方法提出了一种基于同质性检验的数据分区算法,实现根据同质性对实际数据的整体进行分区,使位于同一分区的数据满足同一种概率分布,达到经典的信号处理算法及检测技术的数据满足同一概率分布的要求,便于经典的信号处理算法及检测技术的实施,实现鲁棒性能的提高,目标检测性能提高以及对于其他方法同样适用。解决了经典的信号处理算法及检测技术在实际情况下,杂波环境是非均匀的会带来鲁棒性能的下降的问题及CI-CFAR中K样本Anderson-Darling检验没有对数据整体间的同质性关系进行检验的问题。基于本方法对雷达回波数据进行分区,分区后利用属于同一分区的数据进行协方差矩阵估计再进行STAP处理,在某处得到的信噪比比不利用本方法直接进行协方差矩阵估计再进行STAP处理再同样一处得到的信噪比高13.68dB。
[0015] 实验中采用仿真数据,仿真数据形式如图1所示。共有1396个距离门,128个多普勒单元,其中logn1为对数正态分布1:分区满足对数正态分布,对数均值为7,对数标准差为0.7。wbl1为韦伯分布1:分区满足韦伯分布,尺度参数为400,形状参数为2。logn2为对数正态分布2:分区满足对数正态分布,对数均值为5,对数标准差为0.4。wbl2为韦伯分布2:分区满足韦伯分布,尺度参数为200,形状参数为8。仿真数据dB值如图2所示。
[0016] 本仿真数据模拟的是机载下视雷达的某通道数据,对此数据进行分区的目的是便于后续空时自适应处理算法的实施。由于STAP算法采用3DT-STAP快速算法,且模拟的雷达回波数据包含20个通道,为满足RMB准则最小的分区包含的数据量应大于等于120。所以利用基于同质性检验的数据分区方法,采用120*1(距离门*多普勒单元)的参考窗口类型。得到的分区结果如图3所示,整个过程共用时8.0852s。随后对各个分区进行瑞利分布,对数正态分布,韦伯分布的概率分布拟合,计算参数大小,利用KS拟合优度检验逐个比较每个分区与三种概率分布的接近程度,选择最接近的作为该分区的概率分布类型。得到结果与实际情况的比较如表1所示。
[0017] 表1实际情况与检测结果对比
[0018]
[0019]
[0020] 图3显示,基于同质性检验的数据分区方法能够实现对不同概率分布的区分。但这里的分区结果与实际情况并不完全相同。仿真数据中距离门单元1-698属于同种概率分布,但该方法得到的结果为距离门单元1-720属于同种概率分布。这是因为参考窗口的选择造成的,K-AD同质性检验算法首先就假定参考窗口内数据满足同一概率分布,即每120个距离单元为一个分段样本,样本内数据属于同一概率分布。720是离698最近的分段,所以会得到上述情况。观察图4到图7,显示不同分区的概率分布拟合情况,其中与实际情况存在出入的是第二个分区,实际情况该分区满足韦伯分布,但检测结果显示此分布满足对数正态分布。这种情况产生的原因也是参考窗口选择造成的,每个多普勒单元的第699到720距离门间的数据被划分入与自身概率分布不同的分区,同时使该分区的概率分布发生变化。如图4和图
5所示,第一个分区(图4)受这种影响较小没有对概率分布拟合造成太大影响,第二分区受这种影响较大,使原本的概率分布产生变化,由韦伯分布转向了更倾向于对数正态分区。但这种差异并不影响K-AD同质性检验分区有效性的验证,同样能够实现K-AD同质性检验的分区能力。

附图说明

[0021] 图1为仿真数据形式图,wbl 1为韦伯分布1,wbl2为韦伯分布2,logn1为对数正态分布1,logn2为对数正态分布2;
[0022] 图2为仿真数据dB值图;
[0023] 图3为仿真数据K-AD分区结果图;
[0024] 图4为分区1概率分布拟合示意图;
[0025] 图5为分区2概率分布拟合示意图;
[0026] 图6为分区3概率分布拟合示意图;
[0027] 图7为分区4概率分布拟合示意图;
[0028] 图8为本发明流程图。

具体实施方式

[0029] 具体实施方式一:结合图8说明本实施方式,本实施方式的一种基于同质性检验的数据分区方法具体是按照以下步骤制备的:
[0030] 步骤一、开始;
[0031] 步骤二、获取雷达回波幅值数据,设置进位;
[0032] 步骤三、对雷达回波幅值数据按需分段,并初始化分区矩阵R;
[0033] 步骤四、计算不同分段间的同质化水平,对分区矩阵R进行赋值;
[0034] 步骤五、调整进位,将进位+1;
[0035] 步骤六、寻找分区矩阵R中大于进位的数据元素,如果能够找到则进行同质化水平计算再进行步骤五,如果不能够找到,则进行步骤七;
[0036] 步骤七、根据分区矩阵R生成新的分区矩阵tt;
[0037] 步骤八、结束。
[0038] 具体实施方式二:本实施方式与具体实施方式一不同的是:所述步骤二中获取雷达回波幅值数据,设置进位;具体过程为:
[0039] 获取雷达回波数据矩阵,回波数据元素为复数,取幅值得到雷达回波幅值数据矩阵,设置进位为0。
[0040] 其它步骤及参数与具体实施方式一相同。
[0041] 具体实施方式三:本实施方式与具体实施方式一或二不同的是:所述步骤三中对雷达回波幅值数据按需分块,并初始化分区矩阵R;具体过程为:
[0042] 按实际需求对参考窗口矩阵进行选择,参考窗口矩阵为m'*n',m'表示参考窗口行数,n'表示参考窗口列数;设取幅值得到雷达回波幅值数据矩阵为m*n,m为取幅值得到雷达回波幅值数据矩阵行数,n为取幅值得到雷达回波幅值数据矩阵列数;按参考窗口对取幅值得到雷达回波幅值数据矩阵进行分段,分为 段,设置分区矩阵R,分区矩阵R行数为 列数为 初始化分区矩阵R所有数据元素为0;m'取值范围为 n'取值范围为 m取值范围为1≤m≤10000,n取值范围为1≤n≤10000;
[0043] 所述*为乘号。
[0044] 其它步骤及参数与具体实施方式一或二相同。
[0045] 具体实施方式四:本实施方式与具体实施方式一至三之一不同的是:所述按参考窗口对取幅值得到雷达回波幅值数据矩阵进行分段,分为 段;具体过程为:
[0046] 设 将取幅值得到雷达回波幅值数据矩阵中第到m个元素整合到第 段中,将取幅值得到雷达回波幅值数据矩阵中第
到n个元素整合到第 段中;所述*为乘号。
[0047] 其它步骤及参数与具体实施方式一至三之一相同。
[0048] 具体实施方式五:本实施方式与具体实施方式一至四之一不同的是:所述步骤四中计算不同分段间的同质化水平,对分区矩阵R进行赋值;具体过程为:
[0049] 令分区矩阵R(1,1)=1;计算第(1,1)段取幅值得到雷达回波幅值数据矩阵的数据段与第(i,j)段取幅值得到雷达回波幅值数据矩阵的数据段同质化水平,计算所得同质化水平与步骤二进位的和即为分区矩阵R(i,j)的值。
[0050] 其它步骤及参数与具体实施方式一至四之一相同。
[0051] 具体实施方式六:本实施方式与具体实施方式一至五之一不同的是:所述计算第(1,1)段取幅值得到雷达回波幅值数据矩阵的数据段与第(i,j)段取幅值得到雷达回波幅值数据矩阵的数据段同质化水平, 具体过程为:
[0052] 计算第(1,1)段取幅值得到雷达回波幅值数据矩阵的数据段与第(i,j)段取幅值得到雷达回波幅值数据矩阵的数据段的标准化的检验统计量TkN;分区矩阵R的第1行第1列元素值为1;
[0053] 根据标准化的检验统计量TkN及K-AD同质性检验临界值表设置同质化水平,设定-5
[0054] 其它步骤及参数与具体实施方式一至五之一相同。
[0055] 具体实施方式七:本实施方式与具体实施方式一至六之一不同的是:所述步骤六中寻找分区矩阵R中大于进位的数据元素,如果能够找到则进行同质化水平计算再进行步骤五,如果不能够找到,则进行步骤七;具体过程为:
[0056] 从分区矩阵R的第(1,1)个元素开始,寻找第一个大于步骤五中进位的数据元素的位置,若能寻找到并且第一个大于步骤五中进位的数据元素的位置位于分区矩阵R第x行第y列,则进行同质化水平计算,x取值范围为 y取值范围为 执行步骤五;
[0057] 若不能寻找到大于步骤五中进位的数据元素,则执行步骤七。
[0058] 其它步骤及参数与具体实施方式一至六之一相同。
[0059] 具体实施方式八:本实施方式与具体实施方式一至七之一不同的是:所述从分区矩阵R的第(1,1)个元素开始,寻找第一个大于步骤五中进位的数据元素的位置,若能寻找到并且其位于第x行第y列,则进行同质化水平计算,具体过程为:
[0060] 根据分区矩阵R的x行y列确定取幅值得到雷达回波幅值数据矩阵的第(x,y)处数据段,更新分区矩阵R第x行第y列数据元素为步骤五中进位+1,继续寻找分区矩阵R的数据元素大于步骤五中进位的所有位置,位置表示为(i1,j1), i1表示位置所在行数,j1表示位置所在列数,根据i1行j1列确定取幅值得到雷达回波幅值数据矩阵的第(i1,j1)处数据段,计算第(a,b)处数据段与第(i1,j1)处数据段的同质化水平,更新分区矩阵R第i1行第j1列数据元素为计算的同质化水平+步骤五中进位。
[0061] 其它步骤及参数与具体实施方式一至七之一相同。
[0062] 具体实施方式九:本实施方式与具体实施方式一至八之一不同的是:所述步骤七中根据分区矩阵R生成新的分区矩阵tt;具体过程为:
[0063] 新的分区矩阵tt大小与取幅值得到雷达回波幅值数据矩阵大小相同,为m行,n列;如果a不等于 b不等于 则令tt矩阵中第a(m'-1)+1到am'行,第b(n'-1)+1到bn'列的数据元素的值等于分区矩阵R中第a行第b列数据元素的值;
[0064] 如果a等于 b不等于 则令tt矩阵中第a(m'-1)+1到m行,第b(n'-1)+1到bn'列的数据元素的值等于分区矩阵R中第a行第b列数据元素的值;
[0065] 如果a不等于 b等于 则令tt矩阵中第a(m'-1)+1到am'行,第b(n'-1)+1到n列的数据元素的值等于分区矩阵R中第a行第b列数据元素的值;
[0066] 如果a等于 b等于 则令tt矩阵中第a(m'-1)+1到m行,第b(n'-1)+1到n列的数据元素的值等于分区矩阵R中第a行第b列数据元素的值。
[0067] 其它步骤及参数与具体实施方式一至八之一相同。
[0068] 采用以下实施例验证本发明的有益效果:
[0069] 实施例一:
[0070] 本实施例一种基于同质性检验的数据分区方法具体是按照以下步骤制备的:
[0071] 实验中采用仿真数据,仿真数据形式如图1所示。共有1396个距离门,128个多普勒单元,其中logn1为对数正态分布1:分区满足对数正态分布,对数均值为7,对数标准差为0.7。wbl1为韦伯分布1:分区满足韦伯分布,尺度参数为400,形状参数为2。logn2为对数正态分布2:分区满足对数正态分布,对数均值为5,对数标准差为0.4。wbl2为韦伯分布2:分区满足韦伯分布,尺度参数为200,形状参数为8。仿真数据dB值如图2所示。
[0072] 本仿真数据模拟的是机载下视雷达的某通道数据,对此数据进行分区的目的是便于后续空时自适应处理算法的实施。由于后续STAP算法采用3DT-STAP快速算法,且模拟的雷达回波数据包含20个通道,为满足RMB准则则最小的分区包含的数据量应大于等于120。所以利用基于同质性检验的数据分区方法,采用120*1(距离门单元*多普勒单元)的参考窗口类型。得到的分区结果如图3所示,整个过程共用时8.0852s。随后对各个分区进行瑞利分布,对数正态分布,韦伯分布的概率分布拟合,计算参数大小,利用KS拟合优度检验逐个比较每个分区与三种概率分布的接近程度,选择最接近的作为该分区的概率分布类型。得到结果与实际情况的比较如表1所示。
[0073] 表1 实际情况与检测结果对比
[0074]
[0075] 图3显示,基于同质性检验的数据分区方法能够实现对不同概率分布的区分。但这里的分区结果与实际情况并不完全相同。仿真数据中距离门单元1-698属于同种概率分布,但该方法得到的结果为距离门单元1-720属于同种概率分布。这是因为参考窗口的选择造成的,K-AD同质性检验算法首先就假定参考窗口内数据满足同一概率分布,即每120个距离单元为一个分段样本,样本内数据属于同一概率分布。720是离698最近的分段,所以会得到上述情况。观察图4到图7,显示不同分区的概率分布拟合情况,其中与实际情况存在出入的是第二个分区,实际情况该分区满足韦伯分布,但检测结果显示此分布满足对数正态分布。这种情况产生的原因也是参考窗口选择造成的,每个多普勒单元的第699到720距离门间的数据被划分入与自身概率分布不同的分区,同时使该分区的概率分布发生变化。如图4和图
5所示,第一个分区(图4)受这种影响较小没有对概率分布拟合造成太大影响,第二分区受这种影响较大,使原本的概率分布产生变化,由韦伯分布转向了更倾向于对数正态分区。但这种差异并不影响K-AD同质性检验分区有效性的验证,同样能够实现K-AD同质性检验的分区能力。
[0076] K-AD同质性检验又称为K样本Anderson-Darling检验可以理解为广义AD检验,其能够在样本分布函数表达式未知的情况下检验各样本是否同分布,H0:F1=F2=F3…FN,H0为原假设,其中F1…FN为各样本分布函数(CDF)。对于样本向量X=[B1,B2,…BK],K表示数据段个数(K≥2),本方法K取2,,用Bi={x1,x2,…xn}表示数据段,ni和 表示数据段Bi内数据样本数及其经验分布函数(EDF),N=∑ni表示向量X中所有数据样本数,HN(x)为所有数据样本的EDF。K-AD同质性检验统计量可以表示为:
[0077]
[0078] 其中,DN={x∈R:HN(x)<1},DN为样本,将向量X中所有样本展开,从小到大排列得到Z1<…
[0079]
[0080] K-AD同质性检验统计量 数学期望 和方差 分别如下所示:
[0081]
[0082]
[0083] 其中abcd由下式计算得到:
[0084]
[0085] 式中,H为所有数据段的样本数量倒数的和;
[0086] 可以通过衡量 与高斯分布族的相似程度来检验原假设H0。 经过归一化处理后得到TKN,用σN表示 的标准差。
[0087]
[0088] TkN为标准化检验统计量;
[0089] 与AD分布族辨识类似,K-AD同质性检验通过查找临界值表,判断样本是否同分布。若TKN小于高斯分布族在置信度水平α下的临界值tK-1(α),则接受原假设H0,否则拒绝原假设。
[0090] 表2 K-AD同质性检验临界值表tK-1(α)
[0091]
[0092] 对于其他K取值对应的K样本AD齐次性检验临界值,可以通过回归方程插值计算得到
[0093]
[0094] tK-1(α)为置信度水平α下对应的K-AD检验临界临界值,α为置信度水平,仿真序列a为韦伯分布,参数为3,2;序列b为分别为韦伯分布(3,2)高斯分布(3,2),高斯分布(3,1),韦伯分布(2,3)。更改两序列的长度分别为30,60,90,120,150,1200。进行10000次蒙特卡洛实验,计算各自的正确率。仿真结果如表3所示。
[0095] 表3 仿真结果
[0096]
[0097] 仿真结果表明:K-AD同质性检验在大部分情况下能够实现区分不同的概率分布;但对于相近的概率分辨能力较弱。其中韦伯(3,2)与高斯(3,2)的均值接近,方差相近,K-AD同质性检验对二者同质性检验的正确性较低。K-AD同质性检验的性能随着序列长度的增加而增加,在利用K-AD同质性检验分区的算法时,参考窗口大小的选择也很重要,要保证参考窗口转换成的序列的长度具有一定可信度。总体上看,参考窗口大小选120的K-AD同质性检验具有区分不同概率分布的能力。
[0098] 基于K-AD同质性检验分区算法的主要分为一下几步:
[0099] (1)按参考窗口对实际数据进行分区处理,
[0100] (2)对不同分段进行同质化水平检验,根据表2确定同质化水平,更新分区矩阵R矩阵。
[0101] (3)根据进位信息及标识位判断是否需继续进行同质化水平检验,需要则返回第(2)步,不需要则进行第(4)步。
[0102] (4)对分区矩阵R进行调整,便于后续其他步骤使用。
[0103] 本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,本领域技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。