一种基于历史数据辅助场景分析的电压缺失值填补方法转让专利

申请号 : CN202010311551.5

文献号 : CN111507412B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 陈光宇叶永康郝思鹏吕干云李干黄良灿

申请人 : 南京工程学院

摘要 :

本发明公开了一种基于历史数据辅助场景分析的电压缺失值填补方法,包括:S1、获取电网的历史数据;S2、通过波动互相关分析算法计算各已知属性数据与缺失属性数据的波动互相关系数;S3、筛选出波动互相性较大的属性数据;S4、计算组合权值;S5、对缺失日期进行场景分析并在电网的历史数据中寻找相似场景;S6、在相似场景中通过动态时间弯曲距离来衡量其余属性在缺失时间段内数据的相似度;S7、结合组合权值计算综合相似度;S8、寻找出综合相似度最高的日期,并用该日期同一时刻的数据结合横向数据进行缺失属性数据的填补。本发明能够充分利用电压相关属性的历史数据进行电压缺失值的填补,提高了电压填补值的准确性。

权利要求 :

1.一种基于历史数据辅助场景分析的电压缺失值填补方法,其特征在于:包括如下步骤:S1、获取电网的历史数据,进入步骤S2;

S2、通过波动互相关分析算法计算相同时间各已知属性数据与缺失属性数据的波动互相关系数,进入步骤S3;

S3、若某已知属性数据与该缺失属性数据的波动互相关系数超过比较阈值,则保留该已知属性数据,进入步骤S4;否则,舍弃该已知属性数据;

S4、将保留下的M个已知属性数据对应的属性称为Know属性,将缺失属性数据对应的属性称为Unknow属性,分别计算各Know属性与Unknow属性的组合权值;

S5、对含Unknow属性的日期进行场景分析,并在电网的历史数据中寻找H个最相似场景的日期;将含Unknow属性的日期称为缺失日期,将寻找到的H个最相似场景的日期称为H个相似日期;

S6、先确定缺失属性数据在缺失日期中的时间段,再对每一个相似日期的相同时间段,通过动态时间弯曲距离来衡量缺失日期的各Know属性数据与各相似日期的各Know属性数据的相似度;

S7、结合各Know属性与Unknow属性的组合权值,计算各相似日期的Unknow属性综合相似度;

S8、寻找出Unknow属性综合相似度最高的日期,并用该日期同一时刻的数据结合横向数据进行缺失属性数据的填补。

2.根据权利要求1所述的基于历史数据辅助场景分析的电压缺失值填补方法,其特征在于:所述步骤S2中,波动互相关系数的计算过程如下:S21、对于两个等长的时间序列xi和yi,其中i=1,2,…,N;

S22、计算xi、yi与平均值的差之和:

其中:l表示采样长度,Δx(l)、Δy(l)分别表示xi和yi在采样长度l下与平均值的差之和,和 分别表示xi和yi的平均值;

S23、计算分别代表xi、yi自相关性的前向差分:

Δx(l,l0)=x(l0+l)-x(l0),l0=1,2,…,N-lΔy(l,l0)=y(l0+l)-y(l0),l0=1,2,…,N-l其中:l=1,2,…,N-1,对于每一个取样时间段l都有l0=N-l个差值,Δx(l,l0)、Δy(l,l0)分别表示xi和yi的自相关性的前向差分;

S24、计算xi、yi的协方差:

其中:Covxy(l)表示xi和yi的协方差,表示·的平均;

S25、计算xi、yi的波动互相关系数:若xi、yi存在一定的关联性时,则Covxy(l)满足幂律分布其中:hxy表示xi和yi相关程度,即波动互相关系数,通过拟合幂律分布得到波动互相关系数hxy;当hxy=0时,表示xi和yi不相关;当hxy>0时,表示xi和yi正相关;当hxy<0时,表示xi和yi负相关;hxy值越大表示xi和yi的相关程度越高。

3.根据权利要求2所述的基于历史数据辅助场景分析的电压缺失值填补方法,其特征在于:所述步骤S4中,Know属性j与Unknow属性的组合权值wj通过下式计算:其中:M表示Know属性的数量j=1,2,…,M,cj表示Know属性j与Unknow属性的波动互相关系数。

4.根据权利要求1所述的基于历史数据辅助场景分析的电压缺失值填补方法,其特征在于:所述步骤S5中,含Unknow属性的日期进行场景分析,包括如下步骤:S51、根据日负荷情况对电网的历史数据进行场景分类;输入含Unknow属性的日期并分析日负荷情况;

S52、判断该日期的场景是否为休息日:若不是休息日,则认定该日期的场景为工作日,进入步骤S54;否则进入步骤S53;

S53、判断该日期的场景是否为特殊节假日:若是特殊节假日,则认定该日期的场景为特殊节假日,进入步骤S54;否则认定该日期的场景为一般休息日,进入步骤S54;

S54、在电网的历史数据中寻找H个最相似场景的日期,即寻找H个休息日、特殊节假日或一般休息日。

5.根据权利要求3所述的基于历史数据辅助场景分析的电压缺失值填补方法,其特征在于:所述步骤S6中,通过动态时间弯曲距离来衡量缺失日期的各Know属性数据与各相似日期的各Know属性数据的相似度,包括如下步骤:S61、设缺失属性数据发生的时刻为tn时刻,在tn时刻向后选取n个时间点,在tn时刻向前选取n个时间点,最后形成缺失属性数据在缺失日期中的时间段(t0,t2n),包含t0,t1,t2,…,t2n共2n+1个时间点;设经过比较阈值判断筛选后保留下的M个Know属性记为A1,A2,…,AM,Unknow属性记为A0;

S62、Know属性A1,A2,…,AM在第h个相似日期中的第t0,t1,t2,…,t2n时刻的属性数据分别记为D(1,h),D(2,h),…D(M,h), d(j,h,g)表示Know属性j在第h个相似日期中的tg时刻的属性数据,j=1,2,…,M,h=1,2,…,H,g=0,1,2,…,2n;

S63、通过动态时间弯曲距离来衡量Know属性Aj在第h个相似日期中的第t0,t1,t2,…,t2n时刻的属性数据D(j,h)与在缺失日期中的第t0,t1,t2,…,t2n时刻的属性数据D(j,p)的相似度S(j,h),p表示缺失日期。

6.根据权利要求5所述的基于历史数据辅助场景分析的电压缺失值填补方法,其特征在于:所述步骤S7中,各相似日期的Unknow属性综合相似度通过下式计算:其中:Ch表示Unknow属性在第h个相似日期中的综合相似度。

7.根据权利要求1所述的基于历史数据辅助场景分析的电压缺失值填补方法,其特征在于:将每天同一个时间点的某一属性的历史数据为该属性的一个纵向历史数据截面,横向历史数据是对同一时间的数据根据属性划分;所述步骤S8中,寻找出Unknow属性综合相似度最高的日期后,提取Unknow属性在该日期tn时刻的数据T1作为纵向填补数据;同时,对Unknow属性采用曲线的线性拟合找出该日期tn时刻的数据T2作为横向填补数据,求解出缺失属性数据的最终填补值为:T=α×T1+β×T2

α+β=1

其中:tn时刻为缺失属性数据发生时刻,α为T1的权重,β为T2的权重。

说明书 :

一种基于历史数据辅助场景分析的电压缺失值填补方法

技术领域

[0001] 本发明涉及一种基于历史数据辅助场景分析的电压缺失值填补方法,属于电力系统电压辨识技术。

背景技术

[0002] 随着电网的不断发展电网规模逐年增加,在调控领域,数据的准确性和完整性对电网控制尤为重要,但随着采集数据量成指数级的增长,因人工录入、采集装置故障导致的电压数据缺失问题时有发生,因此需要对缺失数据进行辨识或补全,传统最大期望值(Expectation Maximization Algorithm,EM)算法、K邻近算法(K Nearest Neighbors,KNN)算法等方法都提供了解决思路,但是由于较少利用历史数据作为分析依据,填补效果并不理想。近年来,世界各国掀起了大数据的研究热潮,大数据技术为智能电网的发展注入了新鲜血液,并取得了较好的效果,为此我们提出了一种基于历史数据辅助场景分析的电压缺失值填补方法,进一步提高电压缺失值的填补精度,满足电网发展需求。

发明内容

[0003] 发明目的:为了克服现有技术中存在的不足,本发明提供一种基于历史数据辅助场景分析的电压缺失值填补方法,以提高填补数据的精度,满足电网发展需求。
[0004] 技术方案:为实现上述目的,本发明采用的技术方案为:
[0005] 一种基于历史数据辅助场景分析的电压缺失值填补方法,包括如下步骤:
[0006] S1、获取电网的历史数据,进入步骤S2;
[0007] S2、通过波动互相关分析算法计算相同时间各已知属性数据与缺失属性数据的波动互相关系数,进入步骤S3;
[0008] S3、若某已知属性数据与该缺失属性数据的波动互相关系数超过比较阈值,则保留该已知属性数据,进入步骤S4;否则,舍弃该已知属性数据;
[0009] S4、将保留下的M个已知属性数据对应的属性称为Know属性,将缺失属性数据对应的属性称为Unknow属性,分别计算各Know属性与Unknow属性的组合权值;
[0010] S5、对含Unknow属性的日期进行场景分析,并在电网的历史数据中寻找H个最相似场景的日期;将含Unknow属性的日期称为缺失日期,将寻找到的H个最相似场景的日期称为H个相似日期;
[0011] S6、先确定缺失属性数据在缺失日期中的时间段,再对每一个相似日期的相同时间段,通过动态时间弯曲距离来衡量缺失日期的各Know属性数据与各相似日期的各Know属性数据的相似度;
[0012] S7、结合各Know属性与Unknow属性的组合权值,计算各相似日期的Unknow属性综合相似度;
[0013] S8、寻找出Unknow属性综合相似度最高的日期,并用该日期同一时刻的数据结合横向数据进行缺失属性数据的填补。
[0014] 本发明从电网的历史数据出发,充分利用电网中各属性数据之间存在的相关性,选取具有较强相关性的属性数据作为缺失属性数据填补的参考依据,并计算组合权值来进一步量化属性件的关联程度,确保对强相关的属性数据的利用度更高,同时通过动态时间完全距离来衡量各属性在缺失时刻的数据与历史数据的相似程度,并配合组合权值,找出与缺失时刻最相似时刻的数据来替代缺失时刻的数据。本发明充分利用了缺失属性数据与其他属性数据之间的相关性来解决缺失属性数据的填补问题,提高了缺失属性数据的填补的准确性。
[0015] 具体的,在步骤S1中,电网的历史数据来源于电压数据检测、母线平衡度检测、约束预处理、比例异常检测、初始潮流精度检测等,对电网的历史数据需要进行预处理,挑选出疑似的误数据,并判断是否可以进行后续优化计算。
[0016] 具体的,所述步骤S2中,波动互相关系数的计算过程如下:
[0017] S21、对于两个等长的时间序列xi和yi,其中i=1,2,…,N;
[0018] S22、计算xi、yi与平均值的差之和:
[0019]
[0020]
[0021] 其中:l表示采样长度,Δx(l)、Δy(l)分别表示xi和yi在采样长度l下与平均值的差之和, 和 分别表示xi和yi的平均值;
[0022] S23、计算分别代表xi、yi自相关性的前向差分:
[0023] Δx(l,l0)=x(l0+l)-x(l0),l0=1,2,…,N-l
[0024] Δy(l,l0)=y(l0+l)-y(l0),l0=1,2,…,N-l
[0025] 其中:l=1,2,…,N-1,对于每一个取样时间段l都有l0=N-l个差值,Δx(l,l0)、Δy(l,l0)分别表示xi和yi的自相关性的前向差分;
[0026] S24、计算xi、yi的协方差:
[0027]
[0028]
[0029]
[0030] 其中:Covxy(l)表示xi和yi的协方差, 表示·的平均;
[0031] S25、计算xi、yi的波动互相关系数:若xi、yi存在一定的关联性时,则Covxy(l)满足幂律分布
[0032] 其中:hxy表示xi和yi相关程度,即波动相关系数,通过拟合幂律分布得到波动相关系数hxy;当hxy=0时,表示xi和yi不相关;当hxy>0时,表示xi和yi正相关;当hxy<0时,表示xi和yi负相关;hxy值越大表示xi和yi的相关程度越高。
[0033] 考虑到属性数据较多,为避免相关性较低的属性数据影响缺失属性数据填补结果,因此设定波动互相关系数的比较阈值,若已知属性数据与缺失属性数据的波动互相关系数低于比较阈值,则认为该已知属性数据参考价值较低或无参考价值并舍弃;经比较阈值判定后,剩余M个属性数据,对应的属性称为M个Know属性,对这M个Know属性从1至M进行编号。属性数据与缺失属性数据的相关性不同,因此参考价值不同、利用价值不同,需要设定缺失属性的组合权值来确保历史数据充分且合理的利用。
[0034] 具体的,波动互相关系数越大,则认为已知属性数据与缺失属性数据的相关性越强,则该已知属性数据的在进行缺失属性数据填补时应具有更高的参考价值,因此应具有更高的权值;所述步骤S4中,Know属性j与Unknow属性的组合权值wj通过下式计算:
[0035]
[0036]
[0037] 其中:M表示Know属性的数量(也即保留下的已知属性数据对应的属性的数量),j=1,2,…,M,cj表示Know属性j与Unknow属性的波动相关系数(也即Know属性j对应的已知属性数据与Unknow属性对应的未知属性数据的波动相关系数)。
[0038] 具体的,所述步骤S5中,含Unknow属性的日期进行场景分析,包括如下步骤:
[0039] S51、根据日负荷情况对电网的历史数据进行场景分类;输入含Unknow属性的日期并分析日负荷情况;考虑到历史数据体量巨大,价值密度低,如果遍历历史数据则效率低下,收效甚微;因此进行日负荷情况分析,即对场景进行判断,归类到工作日、一般休息日和特殊节假日;
[0040] S52、判断该日期的场景是否为休息日:若是休息日,则认定该日期的场景为工作日,进入步骤S54;否则进入步骤S53;
[0041] S53、判断该日期的场景是否为特殊节假日:若是特殊节假日,则认定该日期的场景为特殊节假日,进入步骤S54;否则认定该日期的场景为一般休息日,进入步骤S54;
[0042] S54、在电网的历史数据中寻找H个最相似场景的日期,即寻找H个休息日、特殊节假日或一般休息日。
[0043] 对特殊节假日的说明:类似元旦、春节、清明节、劳动节、端午节、中秋节、国庆节等其他国家规定法定节假日为特殊节假日。
[0044] 具体的,所述步骤S6中,通过动态时间弯曲距离来衡量缺失日期的各Know属性数据与各相似日期的各Know属性数据的相似度,包括如下步骤:
[0045] S61、由于动态时间弯曲距离是用于衡量两个时间序列的相似程度,而我们缺失的是某一时刻的数据,设缺失属性数据发生的时刻为tn时刻,在tn时刻向后选取n个时间点(即tn+1,tn+2,…,t2n),在tn时刻向前选取n个时间点(即tn-1,tn-2,…,t0),最后形成缺失属性数据在缺失日期中的时间段(t0,t2n),包含t0,t1,t2,…,t2n共2n+1个时间点;设经过比较阈值判断筛选后保留下的M个Know属性记为A1,A2,…,AM,Unknow属性记为A0;
[0046] S62、Know属性A1,A2,…,AM在第h个相似日期中的第t0,t1,t2,…,t2n时刻的属性数据分别记为D(1,h),D(2,h),…D(M,h), d(j,h,g)表示Know属性j在第h个相似日期中的tg时刻的属性数据,j=1,2,…,M,h=1,2,…,H,g=0,1,2,…,2n;
[0047] S63、通过动态时间弯曲距离来衡量Know属性Aj在第h个相似日期中的第t0,t1,t2,…,t2n时刻的属性数据D(j,h)与在缺失日期中的第t0,t1,t2,…,t2n时刻的属性数据D(j,p)的相似度S(j,h),p表示缺失日期。
[0048] 具体的,所述步骤S7中,各相似日期的Unknow属性综合相似度通过下式计算:
[0049]
[0050] 其中:Ch表示Unknow属性在第h个相似日期中的综合相似度。
[0051] 具体的,将每天同一个时间点的某一属性的历史数据为该属性的一个纵向历史数据截面,横向历史数据是对同一时间的数据根据属性划分;本案的缺失属性数据填补策略充分利用了纵向历史数据,考虑到缺失属性数据不仅与纵向历史数据有关联,同时也与横向历史数据有关联,因此将两类数据结合而得到的缺失属性数据填补值将更加接近真实值;所述步骤S8中,寻找出Unknow属性综合相似度最高的日期后,提取Unknow属性在该日期tn时刻的数据T1作为纵向填补数据;同时,对Unknow属性采用曲线的线性拟合找出该日期tn时刻的数据T2作为横向填补数据,求解出缺失属性数据的最终填补值为:
[0052] T=α×T1+β×T2
[0053] α+β=1
[0054] 其中:tn时刻为缺失属性数据发生时刻,α为T1的权重,β为T2的权重。
[0055] 有益效果:本发明提供的基于历史数据辅助场景分析的电压缺失值填补方法,能够充分利用电网的历史数据,提高缺失属性数据填补的准确性;本发明通过波动互相关分析算法建立起属性之间的联系,并引入组合权值对相关程度进行量化,通过动态时间弯曲距离来衡量缺失时刻数据与历史数据的相似程度,最终选取最相似时刻的数据来替代缺失数据,完成缺失数据的填补。

附图说明

[0056] 图1为本发明的流程示意图;
[0057] 图2为波动互相关算法的流程示意图;
[0058] 图3为场景分析过程的流程示意图;
[0059] 图4为相似度计算的流程示意图;
[0060] 图5为综合相似度计算的流程示意图;
[0061] 图6为缺失值填补流程示意图;
[0062] 图7为不同算法填补准确度比较图;
[0063] 图8为本发明提出算法填补结果和真实值的比对图。

具体实施方式

[0064] 下面结合附图对本发明作更进一步的说明。
[0065] 如图1~6所示为基于历史数据辅助场景分析的电压缺失值填补方法,包括如下步骤:
[0066] S1、获取电网的历史数据,进入步骤S2。
[0067] S2、通过波动互相关分析算法计算相同时间各已知属性数据与缺失属性数据的波动互相关系数,进入步骤S3。
[0068] 如图2所示,波动互相关系数的计算过程如下:
[0069] S21、对于两个等长的时间序列xi和yi,其中i=1,2,…,N;
[0070] S22、计算xi、yi与平均值的差之和:
[0071]
[0072]
[0073] 其中:l表示采样长度,Δx(l)、Δy(l)分别表示xi和yi在采样长度l下与平均值的差之和, 和 分别表示xi和yi的平均值;
[0074] S23、计算分别代表xi、yi自相关性的前向差分:
[0075] Δx(l,l0)=x(l0+l)-x(l0),l0=1,2,…,N-l
[0076] Δy(l,l0)=y(l0+l)-y(l0),l0=1,2,…,N-l
[0077] 其中:l=1,2,…,N-1,对于每一个取样时间段l都有l0=N-l个差值,Δx(l,l0)、Δy(l,l0)分别表示xi和yi的自相关性的前向差分;
[0078] S24、计算xi、yi的协方差:
[0079]
[0080]
[0081]
[0082] 其中:Covxy(l)表示xi和yi的协方差, 表示·的平均;
[0083] S25、计算xi、yi的波动互相关系数:若xi、yi存在一定的关联性时,则Covxy(l)满足幂律分布
[0084] 其中:hxy表示xi和yi相关程度,即波动相关系数,通过拟合幂律分布得到波动相关系数hxy;当hxy=0时,表示xi和yi不相关;当hxy>0时,表示xi和yi正相关;当hxy<0时,表示xi和yi负相关;hxy值越大表示xi和yi的相关程度越高。
[0085] S3、若某已知属性数据与该缺失属性数据的波动互相关系数超过比较阈值,则保留该已知属性数据,进入步骤S4;否则,舍弃该已知属性数据。
[0086] 考虑到属性数据较多,为避免相关性较低的属性数据影响缺失属性数据填补结果,因此设定波动互相关系数的比较阈值,若已知属性数据与缺失属性数据的波动互相关系数低于比较阈值,则认为该已知属性数据参考价值较低或无参考价值并舍弃;经比较阈值判定后,剩余M个属性数据,对应的属性称为M个Know属性,对这M个Know属性从1至M进行编号。
[0087] S4、将保留下的M个已知属性数据对应的属性称为Know属性,将缺失属性数据对应的属性称为Unknow属性,分别计算各Know属性与Unknow属性的组合权值。
[0088] Know属性j与Unknow属性的组合权值wj通过下式计算:
[0089]
[0090]
[0091] 其中:M表示Know属性的数量(也即保留下的已知属性数据对应的属性的数量),j=1,2,…,M,cj表示Know属性j与Unknow属性的波动相关系数(也即Know属性j对应的已知属性数据与Unknow属性对应的未知属性数据的波动相关系数)。
[0092] S5、对含Unknow属性的日期进行场景分析,并在电网的历史数据中寻找H个最相似场景的日期;将含Unknow属性的日期称为缺失日期,将寻找到的H个最相似场景的日期称为H个相似日期。
[0093] 如图3所示,场景分析包括如下步骤:
[0094] S51、根据日负荷情况对电网的历史数据进行场景分类;输入含Unknow属性的日期并分析日负荷情况;考虑到历史数据体量巨大,价值密度低,如果遍历历史数据则效率低下,收效甚微;因此进行日负荷情况分析,即对场景进行判断,归类到工作日、一般休息日和特殊节假日;
[0095] S52、判断该日期的场景是否为休息日:若是休息日,则认定该日期的场景为工作日,进入步骤S54;否则进入步骤S53;
[0096] S53、判断该日期的场景是否为特殊节假日:若是特殊节假日,则认定该日期的场景为特殊节假日,进入步骤S54;否则认定该日期的场景为一般休息日,进入步骤S54;
[0097] S54、在电网的历史数据中寻找H个最相似场景的日期,即寻找H个休息日、特殊节假日或一般休息日。
[0098] 说明:周一至周五或其他因节假日调休的日期为工作日;普通周六周日为一般休息日;类似元旦、春节、清明节、劳动节、端午节、中秋节、国庆节等其他国家规定法定节假日为特殊节假日。
[0099] S6、先确定缺失属性数据在缺失日期中的时间段,再对每一个相似日期的相同时间段,通过动态时间弯曲距离来衡量缺失日期的各Know属性数据与各相似日期的各Know属性数据的相似度。
[0100] 如图4所示,相似度计算包括如下步骤:
[0101] S61、由于动态时间弯曲距离是用于衡量两个时间序列的相似程度,而我们缺失的是某一时刻的数据,设缺失属性数据发生的时刻为tn时刻,在tn时刻向后选取n个时间点(即tn+1,tn+2,…,t2n),在tn时刻向前选取n个时间点(即tn-1,tn-2,…,t0),最后形成缺失属性数据在缺失日期中的时间段(t0,t2n),包含t0,t1,t2,…,t2n共2n+1个时间点;设经过比较阈值判断筛选后保留下的M个Know属性记为A1,A2,…,AM,Unknow属性记为A0;
[0102] S62、Know属性A1,A2,…,AM在第h个相似日期中的第t0,t1,t2,…,t2n时刻的属性数据分别记为D(1,h),D(2,h),…D(M,h), d(jhg)表示Know属性j在第h个相似日期中的tg时刻的属性数据,j=1,2,…,M,h=1,2,…,H,g=0,1,2,…,2n;
[0103] S63、通过动态时间弯曲距离来衡量Know属性Aj在第h个相似日期中的第t0,t1,t2,…,t2n时刻的属性数据D(j,h)与在缺失日期中的第t0,t1,t2,…,t2n时刻的属性数据D(j,p)的相似度S(j,h),p表示缺失日期。
[0104] S7、结合各Know属性与Unknow属性的组合权值,计算各相似日期的Unknow属性综合相似度。
[0105] 如图5所示,各相似日期的Unknow属性综合相似度通过下式计算:
[0106]
[0107] 其中:Ch表示Unknow属性在第h个相似日期中的综合相似度。
[0108] S8、寻找出Unknow属性综合相似度最高的日期,并用该日期同一时刻的数据结合横向数据进行缺失属性数据的填补。
[0109] 如图6所示,利用横向和纵向数据进行缺失数据的填补流程包括如下步骤:
[0110] S81、输入电网数据;
[0111] S82、将电网数据进行数据类型划分,历史纵向数据形成历史纵向数据库,历史横向数据形成历史横向数据库;
[0112] S83、对于历史纵向数据库,寻找出Unknow属性综合相似度最高的日期后,提取Unknow属性在该日期tn时刻的数据T1作为纵向填补数据,同时选取合适的权重比α;
[0113] S84、对于横向历史数据库,对Unknow属性采用曲线的线性拟合找出该日期tn时刻的数据T2作为横向填补数据,同时选取合适的权重比β;
[0114] S85、求解出缺失属性数据的最终填补值为:
[0115] T=α×T1+β×T2
[0116] α+β=1
[0117] 其中:tn时刻为缺失属性数据发生时刻,α为T1的权重,β为T2的权重。
[0118] 将本发明应用到某区域电网电压值缺失情况的填补分析中,选取真实电网近1年半的历史数据作为历史数据集,采样周期为5分钟,数据填补对象为10kV母线的电压缺失值,对电压缺失数据相关属性计算波动互相关系数,最终得到的相关属性为:{无功负荷,有功负荷,电流值}。为了体现本发明提出算法的优势,选取传统最大期望值(Expectation Maximization Algorithm,EM)算法和K邻近算法(K Nearest Neighbors,KNN)进行对比分析。
[0119] 为了充分检测本发明提出方法的有效性,采用随机删除策略,删除数据集中的1%、5%、10%、15%、20%、25%、30%的数据。在不同电压缺失度的情况下采用填补准确度来评价填补结果,填补准确度的评价方法如下:
[0120]
[0121] 其中:nr为估计值正确的个数,n为电压缺失值的个数。为保证实验结果的可靠性,对不同电压缺失率情况下做5次计算,5次计算的平均值作为最终实验结果。实验结果如图7所示,可以看出本发明提出方法的填补正确率明显好于传统算法。为进一步展示本发明提出方法的效果,以缺失率为15%的情况为例进行分析。图8给出了连续27组电压数据在某一缺失情况下的比对分析,从图中结果可以明显看出,本发明提出的方法所绘制的曲线和真实值曲线具有较好的贴合度,填补结果接近真实值,填补效果较好。
[0122] 以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。