一种基于生成对抗网络的光伏数据缺失重构方法转让专利

申请号 : CN202110827561.9

文献号 : CN113688869B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 丁伟锋殷豪孟安波陈嘉铭张铮王陈恩

申请人 : 广东工业大学

摘要 :

本发明涉及光伏数据重构的技术领域,更具体地,涉及一种基于生成对抗网络的光伏数据缺失重构方法,包括以下步骤:S10:获取历史光伏数据,并对历史光伏数据进行归一化预处理;S20:将每日的光伏数据都形成一个1×T×n张量;S30:生成对抗网络学习光伏数据的分布规律,训练好的生成对抗网络能够生成符合真实样本数据分布规律的重构备选样本G(z);S40:采用大小为T×n的二值掩码矩阵M描述光伏数据的缺失值位置;S50:设置重构约束损失函数,找到最佳备选样本G'(z);S60:截取最佳备选样本的对应位置填充缺失值,即得重构样本。本发明可以在光伏数据含有大量缺失值时,对光伏数据多特征的缺失值进行重构填充,具有较高的重构准确率。

权利要求 :

1.一种基于生成对抗网络的光伏数据缺失重构方法,其特征在于,包括以下步骤:S10:获取历史光伏数据,并对历史光伏数据进行归一化预处理;

S20:将每日的光伏数据都形成一个1×T×n张量,其中T为时间步长,n为特征数量,1代表通道数量;

S30:将步骤S20中所有张量作为生成对抗网络学习对象,生成对抗网络学习光伏数据的分布规律,所述分布规律包括时序性和耦合关系,训练好的生成对抗网络能够生成符合真实样本数据分布规律的重构备选样本G(z);

S40:采用大小为T×n的二值掩码矩阵M描述光伏数据的缺失值位置,掩码矩阵中0表示该位置有缺失值,1表示该位置无缺失值,则缺失值样本x'表示如下:x'=Me x        (1)

其中,x为不含缺失值的测试样本,e为哈达玛积运算符号;

S50:设置重构约束损失函数,以重构约束函数为适应度函数,通过纵横交叉粒子群算法优化生成器的隐变量输入z,找到最佳备选样本G'(z),其中z为符合正态分布的噪声;

S60:截取最佳备选样本的对应位置填充缺失值,即得重构样本Y,表示为:Y=x'+(1‑M)e G'(z)               (2)。

2.根据权利要求1所述的基于生成对抗网络的光伏数据缺失重构方法,其特征在于,步骤S10中,光伏数据包括输出功率、温度、辐射强度和散射强度。

3.根据权利要求1所述的基于生成对抗网络的光伏数据缺失重构方法,其特征在于,步骤S10中,对历史光伏数据按以下公式进行最大最小值归一化处理:其中,t'表示数据归一化后的值;t表示数据归一化前的值;tmin和tmax表示数据的最小值和最大值。

4.根据权利要求1所述的基于生成对抗网络的光伏数据缺失重构方法,其特征在于,步骤S30中,生成对抗网络的训练按以下步骤进行:S31.利用卷积神经网络搭建生成对抗网络的生成器与判别器;

S32.使用Wasserstein散度衡量生成样本和真实样本的差异;

S33.训练生成对抗网络的过程中,生成器与判别器交替训练,以此更新生成器与判别器的网络架构参数,两者不断博弈,最终达到平衡时,即完成生成对抗网络的训练。

5.根据权利要求4所述的基于生成对抗网络的光伏数据缺失重构方法,其特征在于,步骤S31中,所述生成器包含1个全连接层、1个反卷积层及2个卷积层,所述判别器包括全连接层和3个卷积层。

6.根据权利要求5所述的基于生成对抗网络的光伏数据缺失重构方法,其特征在于,生成器输入为噪声z,输出为生成样本;判别器输入为生成样本与真实样本,输出为1维判别结果。

7.根据权利要求4所述的基于生成对抗网络的光伏数据缺失重构方法,其特征在于,步骤S32中,生成器损失LossG与判别器损失LossD分别采用下式表示:其中,E(·)表示分布函数数学期望;D(·)表示判别器的输出,G(·)表示生成器的输出;Pf表示生成样本数据分布,Pr表示真实样本数据分布;为真假样本之间的随机插值,Pu表示 的数据分布; 表示梯度值;设置k=2,p=6。

8.根据权利要求1至7任一项所述的基于生成对抗网络的光伏数据缺失重构方法,其特征在于,步骤S50中,最佳备选样本G'(z)按以下步骤确定:S51.重构约束损失函数由备选样本真实性损失、重构样本真实性损失和衡量备选样本与缺失值样本未缺失部分相似程度的上下文损失;

S52.纵横交叉粒子群算法以重构约束损失函数为适应度函数,在适应度函数最小时,将对应的生成器的隐变量z输入进生成器,即得最佳备选样本G'(z)。

9.根据权利要求8所述的基于生成对抗网络的光伏数据缺失重构方法,其特征在于,步骤S51中,重构约束损失函数的定义式表示为:Lt=Ls+λ1L1+λ2L2      (8)

L1=D(G(z))           (9)

L2=D(Y)                (10)Ls=||x',Me G(z)||2         (11)其中,L1为备选样本真实性损失,G(z)为重构备选样本;L2为重构样本真实性损失,Y为重构样本;LS为衡量备选样本与缺失值样本未缺失部分相似程度的上下文损失,||·||2表示取变量间的欧氏距离;λ1、λ2为平衡不同损失的系数。

10.根据权利要求8所述的基于生成对抗网络的光伏数据缺失重构方法,其特征在于,步骤S52中,纵横交叉粒子群算法的寻优过程按以下步骤进行:S521:初始化种群,设置最大迭代次数,纵向交叉概率;

S522:根据重构损失计算粒子适应度,并更新种群中个体的速度与位置;

S523:执行横向交叉并更新种群;

S524:执行纵向交叉并更新种群;

S525:判断是否达到最大迭代次数,若未达到,继续执行S521~S525,若达到,则找到最优z。

说明书 :

一种基于生成对抗网络的光伏数据缺失重构方法

技术领域

[0001] 本发明涉及光伏数据重构的技术领域,更具体地,涉及一种基于生成对抗网络的光伏数据缺失重构方法。

背景技术

[0002] 随着大规模光伏并入电网,对光伏发电功率预测和光伏发电并网技术等研究也在不断深入,完整的光伏数据是进行数据驱动类研究的重要基础。但在实际运行过程中,由于设备故障等因素影响了数据的量测、传输和转换等环节,光伏数据可能出现含缺失值的情况,这些异常数据并不能准确地反映光伏发电系统的真实状态。因此,对光伏数据的缺失值进行重构对于保障大规模光伏并网具有重要意义。
[0003] 中国专利CN201810274676.8公开了一种光伏电站监测数据修复方法,包括查找同一时刻光伏电站监测数据中的温湿度信息、光照强度和光伏电站输出功率历史数据是否存在缺失;若存在缺失,则将缺失的数据项进行标记并排除缺失的数据项;将监测到的排除缺失的数据项后的光伏电站监测数据进行训练,得到状态转换函数;根据插值理论拟合得到缺失的数据项,对光伏电站监测数据中的缺失的数据项补全;将补全后的所述光伏电站监测数据中的温湿度信息、光照强度和光伏电站输出功率历史数据输入到状态转换函数进行预测得到预测值;对预测值进行滤波得到光伏电站监测数据修复结果。上述方案虽然能对光伏数据缺失值进行重构,然而上述方案对历史数据、先验知识要求高,未能兼顾特征的时序性,且仅对单特征数据的缺失值进行重构,重构效果并不理想。

发明内容

[0004] 本发明的目的在于克服现有技术中的不足,提供一种基于生成对抗网络的光伏数据缺失重构方法,能够对多特征的缺失值进行重构、提高模型的重构准确率。
[0005] 为解决上述技术问题,本发明采用的技术方案是:
[0006] 提供一种基于生成对抗网络的光伏数据缺失重构方法,包括以下步骤:
[0007] S10:获取历史光伏数据,并对历史光伏数据进行归一化预处理;
[0008] S20:将每日的光伏数据都形成一个1×T×n张量,其中T为时间步长,n为特征数量,1代表通道数量;
[0009] S30:将步骤S20中所有张量作为生成对抗网络学习对象,生成对抗网络学习光伏数据的分布规律,所述分布规律包括时序性和耦合关系,训练好的生成对抗网络能够生成符合真实样本数据分布规律的重构备选样本G(z);
[0010] S40:采用大小为T×n的二值掩码矩阵M描述光伏数据的缺失值位置,掩码矩阵中0表示该位置有缺失值,1表示该位置无缺失值,则缺失值样本x'表示如下:
[0011] x'=Me x   (1)
[0012] 其中,x为不含缺失值的测试样本,e为哈达玛积运算符号;
[0013] S50:设置重构约束损失函数,以重构约束函数为适应度函数,通过纵横交叉粒子群算法优化生成器的隐变量输入z,找到最佳备选样本G'(z),其中z为符合正态分布的噪声;
[0014] S60:截取最佳备选样本的对应位置填充缺失值,即得重构样本Y,表示为:
[0015]
[0016] 本发明的基于生成对抗网络的光伏数据缺失重构方法,生成对抗网络学习光伏数据的时序性规律和各特征之间的耦合关系,可对多特征的缺失值进行同时重构;纵横交叉粒子群优化算法,解决了粒子群算法容易陷入局部最优、全局收敛性能差的缺陷;采用重构约束损失函数,使得光伏重构数据最大限度贴近真实数据。本发明可以在光伏数据含有大量缺失值时,对光伏数据的缺失值进行重构填充,具有较高的重构准确率。
[0017] 优选地,步骤S10中,光伏数据包括输出功率、温度、辐射强度和散射强度。
[0018] 优选地,步骤S10中,对历史光伏数据按以下公式进行最大最小值归一化处理:
[0019]
[0020] 其中,t'表示数据归一化后的值;t表示数据归一化前的值;tmin和tmax表示数据的最小值和最大值。
[0021] 优选地,步骤S30中,生成对抗网络的训练按以下步骤进行:
[0022] S31.利用卷积神经网络搭建生成对抗网络的生成器与判别器;
[0023] S32.使用Wasserstein散度衡量生成样本和真实样本的差异;
[0024] S33.训练生成对抗网络的过程中,生成器与判别器交替训练,以此更新生成器与判别器的网络架构参数,两者不断博弈,最终达到平衡时,即完成生成对抗网络的训练。
[0025] 优选地,步骤S31中,所述生成器包含1个全连接层、1个反卷积层及2个卷积层,所述判别器包括全连接层和3个卷积层。
[0026] 优选地,生成器输入为噪声 输出为生成样本;判别器输入为生成样本与真实样本,输出为1维判别结果。
[0027] 优选地,步骤S32中,生成器损失LossG与判别器损失LossD分别采用下式表示:
[0028]
[0029]
[0030] 其中,E(·)表示分布函数数学期望;D(·)表示判别器的输出,G(·)表示生成器的输出;Pf表示生成样本数据分布,Pr表示真实样本数据分布;为真假样本之间的随机插值, Pu表示 的数据分布;||▽(·)||表示梯度值;设置k=2,p=6。
[0031] 优选地,步骤S50中,最佳备选样本 按以下步骤确定:
[0032] S51.重构约束损失函数由备选样本真实性损失、重构样本真实性损失和衡量备选样本与缺失值样本未缺失部分相似程度的上下文损失;
[0033] S52.纵横交叉粒子群算法以重构约束损失函数为适应度函数,在适应度函数最小时,将对应的生成器的隐变量z输入进生成器,即得最佳备选样本G'(z)。
[0034] 优选地,步骤S51中,重构约束损失函数的定义式表示为:
[0035] Lt=Ls+λ1L1+λ2L2   (8)
[0036]
[0037] L2=D(Y)   (10)
[0038]
[0039] 其中,L1为备选样本真实性损失, 为重构备选样本;L2为重构样本真实性损失,Y为重构样本;LS为衡量备选样本与缺失值样本未缺失部分相似程度的上下文损失,||·||2表示取变量间的欧氏距离;λ1、λ2为平衡不同损失的系数。
[0040] 优选地,步骤S52中,纵横交叉粒子群算法的寻优过程按以下步骤进行:
[0041] S521:初始化种群,设置最大迭代次数,纵向交叉概率;
[0042] S522:根据重构损失计算粒子适应度,并更新种群中个体的速度与位置;
[0043] S523:执行横向交叉并更新种群;
[0044] S524:执行纵向交叉并更新种群;
[0045] S525:判断是否达到最大迭代次数,若未达到,继续执行S521~S525,若达到,则找到最优
[0046] 与现有技术相比,本发明的有益效果是:
[0047] 本发明的基于生成对抗网络的光伏数据缺失重构方法,可以在光伏数据含有大量缺失值时,对光伏数据多特征的缺失值进行重构填充,具有较高的重构准确率。

附图说明

[0048] 图1为基于生成对抗网络的光伏数据缺失重构方法的示意图;
[0049] 图2为纵横交叉粒子群算法的寻优过程示意图;
[0050] 图3为基于生成对抗网络的光伏数据缺失重构方法的重构效果图;

具体实施方式

[0051] 下面结合具体实施方式对本发明作进一步的说明。
[0052] 实施例
[0053] 如图1所示为本发明的基于生成对抗网络的光伏数据缺失重构方法的实施例,包括以下步骤:
[0054] S10:获取历史光伏数据,并对历史光伏数据进行归一化预处理;
[0055] S20:将每日的光伏数据都形成一个1×T×n张量,其中T为时间步长,n为特征数量,1代表通道数量;
[0056] S30:将步骤S20中所有张量作为生成对抗网络学习对象,生成对抗网络学习光伏数据的分布规律,所述分布规律包括时序性和耦合关系,训练好的生成对抗网络能够生成符合真实样本数据分布规律的重构备选样本
[0057] S40:采用大小为T×n的二值掩码矩阵M描述光伏数据的缺失值位置,掩码矩阵中0表示该位置有缺失值,1表示该位置无缺失值,则缺失值样本x'表示如下:
[0058] x'=Me x   (1)
[0059] 其中,x为不含缺失值的测试样本,e为哈达玛积运算符号;
[0060] S50:设置重构约束损失函数,以重构约束函数为适应度函数,通过纵横交叉粒子群算法优化生成器的隐变量输入z,找到最佳备选样本G'(z),其中z为符合正态分布的噪声;
[0061] S60:截取最佳备选样本的对应位置填充缺失值,即得重构样本Y,表示为:
[0062]
[0063] 步骤S10中,光伏数据包括输出功率、温度、辐射强度和散射强度。对历史光伏数据按以下公式进行最大最小值归一化处理:
[0064]
[0065] 其中,t'表示数据归一化后的值;t表示数据归一化前的值;tmin和tmax表示数据的最小值和最大值。
[0066] 步骤S30中,生成对抗网络的训练按以下步骤进行:
[0067] S31.利用卷积神经网络搭建生成对抗网络的生成器与判别器;所述生成器包含1个全连接层、1个反卷积层及2个卷积层,所述判别器包括全连接层和3个卷积层。生成器输入为噪声 输出为生成样本;判别器输入为生成样本与真实样本,输出为1维判别结果。
[0068] S32.使用Wasserstein散度衡量生成样本和真实样本的差异,生成器的目的在于生成符合原始数据分布规律的样本,让判别器误认为是真实样本;判别器的目的在于辨别出判别器的输入是真实样本还是生成样本;
[0069] S33.训练生成对抗网络的过程中,生成器与判别器交替训练,以此更新生成器与判别器的网络架构参数,两者不断博弈,最终达到平衡时,即完成生成对抗网络的训练。
[0070] 步骤S32中,生成器损失LossG与判别器损失LossD分别采用下式表示:
[0071]
[0072]
[0073] 其中,E(·)表示分布函数数学期望;D(·)表示判别器的输出,G(·)表示生成器的输出;Pf表示生成样本数据分布,Pr表示真实样本数据分布;为真假样本之间的随机插值, Pu表示 的数据分布;||▽(·)||表示梯度值;设置k=2,p=6。
[0074] 生成对抗网络由卷积层、反卷积层堆叠而成,使用Wasserstein散度衡量生成样本和真实样本的差异,以无监督的方式学习了光伏数据的时序性规律与各特征之间的耦合关系,并解决了生成对抗网络在博弈训练时梯度消失的问题,增强了生成对抗网络的学习能力。
[0075] 步骤S50中,最佳备选样本G'(z)按以下步骤确定:
[0076] S51.重构约束损失函数由备选样本真实性损失、重构样本真实性损失和衡量备选样本与缺失值样本未缺失部分相似程度的上下文损失;
[0077] S52.纵横交叉粒子群算法以重构约束损失函数为适应度函数,在适应度函数最小时,将对应的生成器的隐变量z输入进生成器,即得最佳备选样本G'(z)。
[0078] 步骤S51中,重构约束损失函数的定义式表示为:
[0079] Lt=Ls+λ1L1+λ2L2   (8)
[0080]
[0081] L2=D(Y)   (10)
[0082]
[0083] 其中,L1为备选样本真实性损失,G(z)为重构备选样本;L2为重构样本真实性损失,Y为重构样本;LS为衡量备选样本与缺失值样本未缺失部分相似程度的上下文损失,||·||2表示取变量间的欧氏距离;λ1、λ2为平衡不同损失的系数。重构约束损失函数,使得光伏重构数据最大限度地贴近真实数据,对提高光伏数据缺失值重构准确率有重要的实际工程意义。
[0084] 如图2所示,步骤S52中,纵横交叉粒子群算法的寻优过程按以下步骤进行:
[0085] S521:初始化种群Z=[Z(1),Z(2),···,Z(M)],其中M为种群粒子数量,设置最大迭代次数Nmax,纵向交叉概率Pv为0.7。
[0086] S522:根据重构损失函数式(8)计算粒子适应度,使用粒子群算法更新种群中个体的速度与位置,更新公式:
[0087]
[0088]
[0089] 其中,w为惯性权重;c1、c2为加速因子;r1、r2∈[0,1]; 和 分别表示编号为i的粒子在第d代的位置、速度、个体最佳位置和种群最佳位置; 为粒子i在第d+1代的位置、速度;其中,设置w=0.8,c1=c2=2.05。
[0090] S523:执行横向交叉并更新种群,横向交叉公式:
[0091]
[0092]
[0093] 其中,r1、r2、c1、c2∈[0,1];第三项的设置使得寻优范围延伸至超立方体边缘以外,能够提高算法的全局收敛能力。交叉后的子代构成横向交叉中庸解MShc(i,:),与父代X(i,:)相比较,取适应度更好的进行纵向交叉。
[0094] S524:执行纵向交叉并更新种群,纵向交叉公式:
[0095] MSvc(i,d1)=r·X(i,d1)+(1‑r)·X(i,d2)   (16)
[0096] 其中,r∈[0,1];X(i,d1)、X(i,d2)表示个体的第d1、d2维度。
[0097] 同样,纵向交叉中庸解MSvc(i,:)与父代相比较,取适应度更好的进入下一次迭代。
[0098] S525:判断是否达到最大迭代次数,若未达到,继续执行S521‑S525,若达到,则找到最优
[0099] 采用纵横交叉粒子群优化算法,解决了粒子群算法容易陷入局部最优、全局收敛性能差的缺陷。
[0100] 为验证本发明方法的有效性,具体在本实施例中:
[0101] 步骤S10中,获取某光伏发电站在2017‑2019年1月的实测历史光伏数据,采样点周期为20min,每日获取72个采样点,每个采样点包含输出功率、温度、辐射强度和散射强度4个特征。
[0102] 步骤S20中,每日的光伏数据都形成一个1×72×4张量,其中72为时间步长,4为特征数量,通道数为1;共获得2017‑2018年的336个张量(共336天数据不含缺失值)作为生成对抗网络的学习对象。
[0103] 步骤S31中,生成器输入为1×50大小的噪声z,生成器和判别器的网络结构变化如表1和表2所示:
[0104] 表1生成器网络结构
[0105]
[0106] 表2判别器网络结构
[0107]
[0108] 步骤S40中,以2019年第1天的光伏数据((该日数据不含缺失值)为例,采用掩码矩阵构建缺失值样本,设置每个特征的缺失率为50%,表示输出功率、温度、辐射强度和散射强度中,每个特征的缺失值数量在36左右浮动,且缺失位置不固定,总计144个缺失值;
[0109] 步骤S51中,λ1、λ2为平衡不同损失的系数,设置λ1=λ2=0.1。
[0110] 如图3所示,本实施例对2019年第1天的光伏数据在50%缺失率时进行重构,将粒子群算法(PSO)优化隐变量z的重构模型作为对比,对比纵横交叉粒子群算法(CSPSO)、PSO优化隐变量z时模型的重构效果以及实际值。由图3可知,CSPSO优化隐变量z时的重构曲线更加接近实际值曲线,以此可知,本申请可获得较好的光伏数据重构精度。
[0111] 显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。