基于复合气象特征构建与选择的新能源功率预测方法转让专利

申请号 : CN202210194829.4

文献号 : CN114266421B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 程凯马溪原陈元峰姚森敬李鹏李卓环包涛周悦陈炎森张子昊周长城

申请人 : 南方电网数字电网研究院有限公司

摘要 :

本申请涉及一种基于复合气象特征构建与选择的新能源功率预测方法、装置、计算机设备、存储介质和计算机程序产品。本申请能够从大量原始数据中得到最优特征组合,提高新能源功率预测模型的预测结果的稳定性和可靠性。该方法包括:获取原始数据;基于原始数据构建高维气象特征集合;从高维气象特征集合中,每次选取一个特征子集,将特征子集依次递增地输入至功率预测模型,得到一阶预测精度;通过分析一阶预测精度随特征子集增加时的变化情况,确定初选特征范围;通过序列前向浮动搜索算法对初选特征范围进行筛选得到最优特征组合;根据最优特征组合获取新能源功率预测模型的输入数据,以供新能源功率预测模型进行预测得到新能源网络的输出功率。

权利要求 :

1.一种基于复合气象特征构建与选择的新能源功率预测方法,其特征在于,所述方法包括:

获取原始数据;所述原始数据包括历史功率数据和相应的原始数值天气预报数据;

基于所述历史功率数据和相应的原始数值天气预报数据构建高维气象特征集合;具体包括:将所述历史功率数据和相应的原始数值天气预报数据作为原始特征;针对所述原始特征进行统计分析,得到统计特征;将所述原始特征和所述统计特征作为时域特征;以db9为母小波函数针对所述时域特征进行小波分解,得到小波分解特征;针对所述时域特征进行经验模态分解,得到经验模态分解特征;将所述小波分解特征和所述经验模态分解特征作为频域特征;其中,所述历史功率数据和所述原始数值天气预报数据均关联对应于待预测时刻;基于所述时域特征和所述频域特征构建所述高维气象特征集合,具体包括:获取各个所述待预测时刻对应的前后相邻时段;将所述前后相邻时段划分为多个关联时刻;获取所述各个所述关联时刻对应的关联时域特征和关联频域特征;将所述待预测时刻对应的所述时域特征和所述频域特征、以及所述关联时刻对应的所述关联时域特征和所述关联频域特征进行组合,得到所述高维气象特征集合;

从所述高维气象特征集合中,每次选取一个特征子集,将所述特征子集依次递增地输入至功率预测模型,得到每次的一阶预测精度;通过分析所述一阶预测精度随所述特征子集增加时的变化情况,确定初选特征范围;

通过序列前向浮动搜索算法对所述初选特征范围进行筛选得到最优特征组合;

根据所述最优特征组合获取新能源功率预测模型的输入数据,以供所述新能源功率预测模型进行预测得到新能源网络在待预测时间内的输出功率。

2.根据权利要求1所述的方法,其特征在于,所述原始数据包括风速、风向、辐照度、云量、温度、气压和湿度中的至少一种。

3.根据权利要求1所述的方法,其特征在于,所述小波分解特征包括低频分量。

4.根据权利要求1所述的方法,其特征在于,所述特征子集中的特征个数是以500为步进进行递增的。

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

针对组合后的特征采用基于互信息的单独最优特征组合方法进行排序,得到所述高维气象特征集合。

6.根据权利要求1至5任意一项所述的方法,其特征在于,所述通过序列前向浮动搜索算法对所述初选特征范围进行筛选得到最优特征组合,包括:从所述初选特征范围中,每次选取一个有效特征子集,将所述有效特征子集依次递增地输入至所述功率预测模型,得到每次的二阶预测精度;

通过分析所述二阶预测精度随所述有效特征子集增加时的变化情况,确定所述最优特征组合。

7.根据权利要求2所述的方法,其特征在于,所述统计特征包括均值、众数、上四分位点、中位数、下四分位点和四分位差。

8.一种基于复合气象特征构建与选择的新能源功率预测装置,其特征在于,所述装置包括:

原始数据获取模块,用于获取原始数据;所述原始数据包括历史功率数据和相应的原始数值天气预报数据;

高维特征构建模块,用于基于所述历史功率数据和相应的原始数值天气预报数据构建高维气象特征集合;具体包括:将所述历史功率数据和相应的原始数值天气预报数据作为原始特征;针对所述原始特征进行统计分析,得到统计特征;将所述原始特征和所述统计特征作为时域特征;以db9为母小波函数针对所述时域特征进行小波分解,得到小波分解特征;针对所述时域特征进行经验模态分解,得到经验模态分解特征;将所述小波分解特征和所述经验模态分解特征作为频域特征;其中,所述历史功率数据和所述原始数值天气预报数据均关联对应于待预测时刻;基于所述时域特征和所述频域特征构建所述高维气象特征集合,具体包括:获取各个所述待预测时刻对应的前后相邻时段;将所述前后相邻时段划分为多个关联时刻;获取所述各个所述关联时刻对应的关联时域特征和关联频域特征;将所述待预测时刻对应的所述时域特征和所述频域特征、以及所述关联时刻对应的所述关联时域特征和所述关联频域特征进行组合,得到所述高维气象特征集合;

初选特征范围确定模块,用于从所述高维气象特征集合中,每次选取一个特征子集,将所述特征子集依次递增地输入至功率预测模型,得到每次的一阶预测精度;通过分析所述一阶预测精度随所述特征子集增加时的变化情况,确定初选特征范围;

最优特征组合筛选模块,用于通过序列前向浮动搜索算法对所述初选特征范围进行筛选得到最优特征组合;

功率预测模块,用于根据所述最优特征组合获取新能源功率预测模型的输入数据,以供所述新能源功率预测模型进行预测得到新能源网络在待预测时间内的输出功率。

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

说明书 :

基于复合气象特征构建与选择的新能源功率预测方法

技术领域

[0001] 本申请涉及新能源技术领域,特别是涉及一种基于复合气象特征构建与选择的新能源功率预测方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术

[0002] 新能源例如风、光、冰等能源由于清洁环保的特点日益受到重视,但其受季节、时间的影响具有较强的随机性,且由于用户的用电需求有高峰和低谷,导致新能源在电力系统中的出力也具有较强的波动性。为了在新能源系统中达到填谷削峰的效果,目前常采用各种预测模型对新能源系统的输出功率进行预测以便有效利用输出功率的特点进行更有效的资源分配。
[0003] 目前的预测模型中对新能源的特征选择方法有模拟退火算法、禁忌搜索算法、遗传算法、随机重采样过程等,但这些特征选择方法都属于随机搜索法,虽然能够较快速地获得一个满足要求的局部最优解,但其选择结果具有较高的不确定性,使得后续得到的预测结果也不够准确。

发明内容

[0004] 基于此,有必要针对上述技术问题,提供一种基于复合气象特征构建与选择的新能源功率预测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005] 第一方面,本申请提供了一种基于复合气象特征构建与选择的新能源功率预测方法。所述方法包括:
[0006] 获取原始数据;所述原始数据包括历史功率数据和相应的原始数值天气预报数据;
[0007] 基于所述历史功率数据和相应的原始数值天气预报数据构建高维气象特征集合;
[0008] 从所述高维气象特征集合中,每次选取一个特征子集,将所述特征子集依次递增地输入至功率预测模型,得到每次的一阶预测精度;通过分析所述一阶预测精度随所述特征子集增加时的变化情况,确定初选特征范围;
[0009] 通过序列前向浮动搜索算法对所述初选特征范围进行筛选得到最优特征组合;
[0010] 根据所述最优特征组合获取新能源功率预测模型的输入数据,以供所述新能源功率预测模型进行预测得到新能源网络在待预测时间内的输出功率。
[0011] 在其中一个实施例中,所述基于所述历史功率数据和相应的原始数值天气预报数据构建高维气象特征集合,包括:
[0012] 将所述历史功率数据和相应的原始数值天气预报数据作为原始特征;
[0013] 针对所述原始特征进行统计分析,得到统计特征;
[0014] 将所述原始特征和所述统计特征作为时域特征;
[0015] 针对所述时域特征进行频率分解,得到频域特征;
[0016] 基于所述时域特征和所述频域特征构建所述高维气象特征集合。
[0017] 在其中一个实施例中,所述针对所述时域特征进行频率分解,得到频域特征,包括:
[0018] 针对所述时域特征进行小波分解,得到小波分解特征;
[0019] 针对所述时域特征进行经验模态分解,得到经验模态分解特征;
[0020] 将所述小波分解特征和所述经验模态分解特征作为所述频域特征。
[0021] 在其中一个实施例中,所述历史功率数据和所述原始数值天气预报数据均关联对应于待预测时刻;所述基于所述时域特征和所述频域特征构建所述高维气象特征集合,包括:
[0022] 获取各个所述待预测时刻对应的前后相邻时段;
[0023] 将所述前后相邻时段划分为多个关联时刻;
[0024] 获取所述各个所述关联时刻对应的关联时域特征和关联频域特征;
[0025] 将所述待预测时刻对应的所述时域特征和所述频域特征、以及所述关联时刻对应的所述关联时域特征和所述关联频域特征进行组合,得到所述高维气象特征集合。
[0026] 在其中一个实施例中,所述方法还包括:
[0027] 针对组合后的特征采用基于互信息的单独最优特征组合方法进行排序,得到所述高维气象特征集合。
[0028] 在其中一个实施例中,所述通过序列前向浮动搜索算法对所述初选特征范围进行筛选得到最优特征组合,包括:
[0029] 从所述初选特征范围中,每次选取一个有效特征子集,将所述有效特征子集依次递增地输入至所述功率预测模型,得到每次的二阶预测精度;
[0030] 通过分析所述二阶预测精度随所述有效特征子集增加时的变化情况,确定所述最优特征组合。
[0031] 在其中一个实施例中,所述统计特征包括均值、众数、上四分位点、中位数、下四分位点和四分位差。
[0032] 第二方面,本申请还提供了一种基于复合气象特征构建与选择的新能源功率预测装置。所述装置包括:
[0033] 原始数据获取模块,用于获取原始数据;所述原始数据包括历史功率数据和相应的原始数值天气预报数据;
[0034] 高维特征构建模块,用于基于所述历史功率数据和相应的原始数值天气预报数据构建高维气象特征集合;
[0035] 初选特征范围确定模块,用于从所述高维气象特征集合中,每次选取一个特征子集,将所述特征子集依次递增地输入至功率预测模型,得到每次的一阶预测精度;通过分析所述一阶预测精度随所述特征子集增加时的变化情况,确定初选特征范围;
[0036] 最优特征组合筛选模块,用于通过序列前向浮动搜索算法对所述初选特征范围进行筛选得到最优特征组合;
[0037] 功率预测模块,用于根据所述最优特征组合获取新能源功率预测模型的输入数据,以供所述新能源功率预测模型进行预测得到新能源网络在待预测时间内的输出功率。
[0038] 第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上述的基于复合气象特征构建与选择的新能源功率预测方法实施例中的各步骤。
[0039] 第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的基于复合气象特征构建与选择的新能源功率预测方法实施例中的各步骤。
[0040] 上述基于复合气象特征构建与选择的新能源功率预测方法、装置、计算机设备、存储介质和计算机程序产品,获取原始数据;该原始数据包括历史功率数据和相应的原始数值天气预报数据;基于历史功率数据和相应的原始数值天气预报数据构建高维气象特征集合;从高维气象特征集合中,每次选取一个特征子集,将特征子集依次递增地输入至功率预测模型,得到每次的一阶预测精度;通过分析一阶预测精度随特征子集增加时的变化情况,确定初选特征范围;通过序列前向浮动搜索算法对初选特征范围进行筛选得到最优特征组合;根据所述最优特征组合获取新能源功率预测模型的输入数据,以供新能源功率预测模型进行预测得到新能源网络在待预测时间内的输出功率。本申请能够从大量原始数据中得到最优特征组合,与传统的特征选择算法或特征搜索方法相比,传统方法每次仅能得到一组局部最优组合,使得后续模型的预测结果不够稳定,每次预测结果不同,而本申请能够指出哪些特征对提高预测精度有效,有利于提高后续新能源功率预测模型的预测结果的稳定性和可靠性。

附图说明

[0041] 图1为一个实施例中基于复合气象特征构建与选择的新能源功率预测方法的应用环境图;
[0042] 图2为一个实施例中基于复合气象特征构建与选择的新能源功率预测方法的流程示意图;
[0043] 图3为一个实施例中基于复合气象特征构建与选择的新能源功率预测方法的总体架构图;
[0044] 图4为一个实施例中特征构建结果示意图;
[0045] 其中,
[0046] (m)为高维气象特征集合的示意图;
[0047] (n)为使用序列前向浮动搜索方法筛选得到的特征示意图;
[0048] 图5为一个实施例中时间序列特征的构建过程示意图;
[0049] 图6为一个实施例中序列前向浮动搜索方法的流程示意图;
[0050] 图7为一个实施例中最优特征组合的统计结果示意图;
[0051] 图8为一个实施例中筛选得到的四种不同类型的特征的数量分布统计结果;
[0052] 其中,
[0053] (a)为经过筛选得到的原始NWP特征的统计结果;
[0054] (b)为经过筛选得到的统计特征的统计结果;
[0055] (c)为不同层数的小波分解特征的统计结果;
[0056] (d)为不同层数的经验模态分解特征的统计结果;
[0057] 图9为一个实施例中基于复合气象特征构建与选择的新能源功率预测装置的结构框图;
[0058] 图10为一个实施例中计算机设备的内部结构图。

具体实施方式

[0059] 为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0060] 本申请实施例提供的基于复合气象特征构建与选择的新能源功率预测方法,可以应用于如图1所示的应用环境中。其中,终端101通过网络与服务器102进行通信。数据存储系统可以存储服务器需要处理的数据。数据存储系统可以集成在服务器102上,也可以放在云上或其他网络服务器上。其中,终端101可以但不限于是新能源网络系统中的各种传感设备,例如光伏功率测量装置;服务器102可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
[0061] 在一个实施例中,如图2所示,提供了一种基于复合气象特征构建与选择的新能源功率预测方法,以该方法应用于图1中的服务器102为例进行说明,包括以下步骤:
[0062] 步骤S201,获取原始数据;所述原始数据包括历史功率数据和相应的原始数值天气预报数据;
[0063] 其中,原始数据包括新能源的历史功率数据与这些历史功率数据对应的原始数值天气预报数据,即NWP(Numerical Weather Prediction,天气数值预测)数据。
[0064] 具体地,结合图3所示的方案总体架构图,该方法可分为两个阶段:阶段1:新能源功率预测高维特征构建,阶段2:基于序列前向浮动搜索的新能源功率预测特征选择。首先,为了得到准确的预测结果,需要对原始数据进行特征构建,以得到符合规范的特征向量,需要说明的是,在正式预测之前的模型训练过程中,也需要对实现获取的训练数据进行特征构建,针对训练数据的特征构建过程与下述过程相同,本文不做重复赘述。上述原始数据是新能源系统在实际运行过程中积累的数据,包括新能源的风速、风向、辐照度、云量、温度、气压、湿度等特征参数,并构建时间序列特征、集群统计特征等。
[0065] 步骤S202,基于上述历史功率数据和相应的原始数值天气预报数据构建高维气象特征集合。
[0066] 其中,高维气象特征集合是指针对该新能源系统的各种属性的数据,由于属性(维度)较多,所以称之为高维。
[0067] 具体地,针对上述原始数据进行特征提取、特征变换得到高维特征,即高维气象特征集合。
[0068] 该步骤S202也即特征构造过程,具体可包括:将历史功率数据和相应的原始数值天气预报数据作为原始特征;针对原始特征进行统计分析,得到统计特征;将原始特征和统计特征作为时域特征;针对时域特征进行频率分解,得到频域特征;基于时域特征和频域特征构建高维气象特征集合。
[0069] 以一具体例子说明如下,首先获取原始数据(原始特征),本实施例用到的风电场原始特征如表1所示,以20个新能源网络构成的集群为例,该集群包括20个新能源网络,每个新能源电场都由风电场和光伏发电场构成,其中每个风电场包含有11个原始NWP特征,分别是3个不同高度的风速、风向,以及辐照度、云量、大气温度、湿度、海平面气压。则该集群的原始特征维度为11*20=220个。
[0070]
[0071] 表1 原始NWP特征
[0072] 在此基础上,对于每一种原始特征可以构造出反映该新能源集群整体出力情况的统计特征。如表2所示,分别构造每一个原始特征相对于20个新能源网络的均值、众数、上四分位点、中位数、下四分位点、四分位差。
[0073]
[0074] 表2 NWP统计特征
[0075] 将20个新能源网络的原始特征(共计11×20=220个)和上述集群的统计特征(共计11×6=66个)集中在一起(共计286个)统称为时域特征(也即时域特征为286维的数据),由于这些特征数据都是时间的变量。
[0076] 针对上述时域特征进行频域分解得到频域特征,具体地,本实施例对上述286个时域特征,开展频域分解。本实施例采用小波分解首先对每一个时域特征分解出5种不同频率的新特征,称为小波分解特征,例如,以db9为母小波函数对上述时域特征做4层分解,每一层分解产生的高频成分依次命名为小波1、小波2、小波3、小波4;其中,第四层分解产生的低频分量命名为小波5。然后,利用EMD(Empirical Mode Decomposition,经验模态分解)对上述时域特征进行分解产生经验模态分解特征,这些经验模态分解特征按照频率由高到低分别编号为emd1、emd2、emd3、emd4、emd5。小波分解特征和emd(经验模态分解)特征对应的频率范围如表3所示,将上述小波分解特征和上述经验模态分解特征统称为频域特征。
[0077]
[0078] 表3 小波特征和EMD特征对应的频率范围
[0079] 根据表3可知,原来的286维的时域特征变为286×10=2860维的频域特征。此时,可将上述时域特征(286维)和频域特征(2860维)组合在一起构建成为高维气象特征集合(共计286+2860=3146维),这是一种高维复合气象特征,如图4(m)所示。
[0080] 可选地,在另一实施例中,还可对时域特征和频域特征组合后的特征进行进一步扩充,例如可添加时间序列特征,具体过程如下:上述历史功率数据和上述原始数值天气预报数据均关联对应于待预测时刻,获取各个待预测时刻对应的前后相邻时段;将前后相邻时段划分为多个关联时刻;获取各个关联时刻对应的关联时域特征和关联频域特征;将待预测时刻对应的时域特征和频域特征、以及关联时刻对应的关联时域特征和关联频域特征进行组合,得到高维气象特征集合,如图4(m)所示。
[0081] 例如,如图5所示,图5展示了时间序列特征的构建过程示意图,在模型预测过程中,从原始数据中取一个时刻作为当前时刻,并预测未来多个时刻(待预测时刻)的功率(这些数据都是已经收集的历史数据),每个时刻都对应的已知的历史功率数据和相应的原始数值天气预报数据,可将待预测时刻前后相邻时段的NWP数据构建时间序列特征,例如,获取每个待预测时刻前后12小时的NWP数据,将每个前后12小时的时段按照15min的时间间隔划分为多个时刻(为与其他概念区分开来,在本文中称为关联时刻),每个前后时段共包含96个关联时刻,同上述每个待预测时刻的时域特征和频域特征的处理方式一致,对每个关联时刻也得到时域特征和频域特征,为区分概念,可将关联时刻的时域特征和频域特征分别称为关联时域特征和关联频域特征,依照上述逻辑,每个关联时刻的关联时域特征和关联频域特征共计3146维,将上述待预测时刻对应的时域特征和频域特征、以及关联时刻对应的关联时域特征和关联频域特征进行组合,得到所述高维气象特征集合,即约100个时刻(包括待预测时刻和关联时刻)的时域特征和频域特征共计3146×100=314600个,因而对于每一个待预测时刻,待输入模型的输入特征共计超过30万维,称为高维气象特征集合,如图
4(m)所示。
[0082] 可选地,在另一实施例中,还可对上述高维气象特征集合进行初步排序,如图3中的步骤3所示,对上述待输入模型的输入特征(超过30万维)采用基于互信息的单独最优特征组合方法进行排序,即通过每个特征单独使用时的效果进行排序,得到排好序的高维气象特征集合,该初步排序过程不需要考虑特征间的组合给预测精度带来的影响,每次只考虑一个维度的特征的预测效果,算法实现速度较快。另一方面,通过初步排序便于后续筛选特征的过程中加快筛选速度,更快地筛选出能够准确预测功率的特征。
[0083] 步骤S203,从高维气象特征集合中,每次选取一个特征子集,将特征子集依次递增地输入至功率预测模型,得到每次的一阶预测精度;通过分析一阶预测精度随特征子集增加时的变化情况,确定初选特征范围。
[0084] 具体地,本步骤为特征初步选择过程,基于上述特征排序结果(高维气象特征集合),以500为步进逐次增加预测模型的输入特征个数,以500个特征作为一个特征子集,即每次增加500个特征输入预测模型,通过预测模型分析特征个数增加时预测精度变化情况,初步确定初选特征范围。
[0085] 该步骤以500为步进进行初选,是一种粗选过程,为后续精选提供基础,便于加快特征筛选速度。
[0086] 步骤S204,通过序列前向浮动搜索算法对初选特征范围进行筛选得到最优特征组合。
[0087] 采用高达30多万维的特征作为输入参数,模型训练过程以及预测过程都很困难,计算效率和预测精度都难以达到理想的结果,因此需要对高维输入特征做特征选择。该步骤采用基于序列前向浮动搜索法的特征排序,针对步骤S203中的初选特征范围进一步排序。步骤S204具体包括:从初选特征范围中,每次选取一个有效特征子集,将有效特征子集依次递增地输入至功率预测模型,得到每次的二阶预测精度;通过分析二阶预测精度随有效特征子集增加时的变化情况,确定最优特征组合。
[0088] 具体地,本申请采用基于浮动搜索的启发式特征选择方法,如图6所示,图6展示了序列前向浮动搜索法的流程示意图,浮动搜索方法由序列前向选择方法(SFS)(Sequential Forward Selection,序列前向选择)发展而来,该方法是在SFS方法中加入了特征淘汰机制,使特征选择和特征淘汰过程交替进行,在选择有效特征的同时剔除冗余特征,有效避免特征空间的冗余和嵌套问题。图6中首先将特征空间清空,设定最优添加个数L,然后根据制定好的准则函数从备选库中选择使准则函数值最大的L个特征,将其添加到特征空间,其中准则函数值也即上述二阶预测精度。然后从已选中的特征空间中,选择使准则函数最小的R个特征,并将其淘汰(其中R
[0089] 浮动搜索方法的关键点包括评价指标、准则函数。本申请采用互信息作为特征选择方法的评价指标,并且以最大相关最小冗余算法作为浮动搜索方法的准则函数。
[0090] (1)评价指标
[0091] 鉴于新能源网络集群出力与输入NWP之间具有较强的非线性关系,而互信息量相比于欧式距离、一致性度量等指标具有更强的非线性表征能力,因此本文选择互信息量作为特征选择方法的度量指标。
[0092] 互信息是信息论的一种信息度量,它可以看成是一个随机变量中包含的关于另一个随机变量的信息量,或者说是一个随机变量由于已知另一个随机变量而减少的不确定性。
[0093] 设两个随机变量(X,Y)的联合分布为p(X,Y),边缘分布分别为p(X),p(Y),则互信息I(X;Y)是联合分布p(X,Y)与边缘分布p(X),p(Y)的相对熵,如公式(1)所示:
[0094]
[0095] (2)准则函数
[0096] 为了使选择的特征既满足有效性的要求,又具有较低的冗余度,本申请选择最大相关–最小冗余(mRMR)(Max‑Relevance and Min‑Redundancy,最大相关‑最小冗余算法)方法中的准则函数作为特征选择方法的准则函数。
[0097] 上述实施例,通过高维复合气象特征构建和基于序列前向浮动搜索的特征选择,筛选出对新能源功率预测有效的特征集合,有利于提升新能源功率预测模型的预测精度;该方法能够从大量原始数据中得到最优特征组合,与传统的特征选择算法或特征搜索方法相比,传统方法每次仅能得到一组局部最优组合,使得后续模型的预测结果不够稳定,每次预测结果不同,而本申请能够指出哪些特征对提高预测精度有效,有利于提高后续新能源功率预测模型的预测结果的稳定性和可靠性。
[0098] 步骤S205,根据所述最优特征组合获取新能源功率预测模型的输入数据,以供新能源功率预测模型进行预测得到新能源网络在待预测时间内的输出功率。
[0099] 具体地,采集新能源系统集群产生的当前数据,对这些数据做上述特征选择步骤后得到与上述最优特征组合对应的数据,输入至上述已经训练好的功率预测模型,得到未来的功率预测结果。
[0100] 进一步地,在另一实施例中,本申请还对上述过程中得到的有效特征进行了统计分析。
[0101] 对于本申请所选的新能源网络集群的四天预测结果,采用浮动搜索方法时,得到的最优特征组合中的特征个数为660时,预测误差最小。本申请对这660个特征做了统计分析。图7为最优特征组合的统计图,分为4个大类,分别是原始特征、统计特征、小波分解特征以及emd(经验模态分解)特征。
[0102] 从图7的统计结果可以看出原始的NWP特征仍然是被选中数量最多的特征,其被选中个数为283个,占总的被选中特征个数的43%,而剩余的特征,小波、emd分解特征占总的被选中特征个数的57%。
[0103] 图8为对上述四类特征进一步细分后的统计结果,即四种不同类型的特征的数量分布统计结果,图8中可以得到如下结论:(1)如图8(a)所示,在选中的283个原始NWP特征中,风速、辐照度特征占了绝对多数。其中,100m风速、辐照度、云量和170m风速特征分别被选中了90、69、65和26个,共计250个。其他NWP特征被选中33个,数量远少于风速和辐照度特征。(2)从图8(b)中可以看出,在100个统计特征中,均值和众数所占的比重最高,分别为37和27。这两个特征均是反映新能源集群总体的特征,而其他反映数据集中度或偏度的特征被选中较少,个数均低于20,说明构造反映集群总体特性的特征对提升预测精度至关重要。(3)从图8(c)中可以看出,在小波分解的5类不同频段的特征中,从低频到高频分别被选中的特征个数为59、28、49、7、0,其大致趋势为特征序列对应的频率越小,其特征重要性越高。
(4)从图8(d)中可以看出,emd分解的5类不同频段的特征中,从低频到高频分别被选中的特征个数为43、25、40、23、3,其大致趋势也为特征序列对应的频率越小,其特征重要性越高。
[0104] 上述实施例,通过对特征选择的结果进行分析总结,指出哪些特征对提高预测精度有效,为同行提供参考和借鉴。
[0105] 应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0106] 基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的基于复合气象特征构建与选择的新能源功率预测方法的基于复合气象特征构建与选择的新能源功率预测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个基于复合气象特征构建与选择的新能源功率预测装置实施例中的具体限定可以参见上文中对于基于复合气象特征构建与选择的新能源功率预测方法的限定,在此不再赘述。
[0107] 在一个实施例中,如图9所示,提供了一种基于复合气象特征构建与选择的新能源功率预测装置900,包括:原始数据获取模块901、高维特征构建模块902、初选特征范围确定模块903、最优特征组合筛选模块904和功率预测模块905,其中:
[0108] 原始数据获取模块901,用于获取原始数据;所述原始数据包括历史功率数据和相应的原始数值天气预报数据;
[0109] 高维特征构建模块902,用于基于所述历史功率数据和相应的原始数值天气预报数据构建高维气象特征集合;
[0110] 初选特征范围确定模块903,用于从所述高维气象特征集合中,每次选取一个特征子集,将所述特征子集依次递增地输入至功率预测模型,得到每次的一阶预测精度;通过分析所述一阶预测精度随所述特征子集增加时的变化情况,确定初选特征范围;
[0111] 最优特征组合筛选模块904,用于通过序列前向浮动搜索算法对所述初选特征范围进行筛选得到最优特征组合;
[0112] 功率预测模块905,用于根据所述最优特征组合获取新能源功率预测模型的输入数据,以供所述新能源功率预测模型进行预测得到新能源网络在待预测时间内的输出功率。
[0113] 在一实施例中,上述高维特征构建模块902,进一步用于:将所述历史功率数据和相应的原始数值天气预报数据作为原始特征;针对所述原始特征进行统计分析,得到统计特征;将所述原始特征和所述统计特征作为时域特征;针对所述时域特征进行频率分解,得到频域特征;基于所述时域特征和所述频域特征构建所述高维气象特征集合。
[0114] 在一实施例中,上述高维特征构建模块902,进一步用于:针对所述时域特征进行小波分解,得到小波分解特征;针对所述时域特征进行经验模态分解,得到经验模态分解特征;将所述小波分解特征和所述经验模态分解特征作为所述频域特征。
[0115] 在一实施例中,所述历史功率数据和所述原始数值天气预报数据均关联对应于待预测时刻;上述高维特征构建模块902,进一步用于:获取各个所述待预测时刻对应的前后相邻时段;将所述前后相邻时段划分为多个关联时刻;获取所述各个所述关联时刻对应的关联时域特征和关联频域特征;将所述待预测时刻对应的所述时域特征和所述频域特征、以及所述关联时刻对应的所述关联时域特征和所述关联频域特征进行组合,得到所述高维气象特征集合。
[0116] 在一实施例中,上述高维特征构建模块902,还用于:针对组合后的特征采用基于互信息的单独最优特征组合方法进行排序,得到所述高维气象特征集合。
[0117] 在一实施例中,上述最优特征组合筛选模块904,进一步用于:从所述初选特征范围中,每次选取一个有效特征子集,将所述有效特征子集依次递增地输入至所述功率预测模型,得到每次的二阶预测精度;通过分析所述二阶预测精度随所述有效特征子集增加时的变化情况,确定所述最优特征组合。
[0118] 上述基于复合气象特征构建与选择的新能源功率预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0119] 在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储原始数据以及各种中间过程数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于复合气象特征构建与选择的新能源功率预测方法。
[0120] 本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0121] 在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现如上述的基于复合气象特征构建与选择的新能源功率预测方法实施例中的各步骤。
[0122] 在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述的基于复合气象特征构建与选择的新能源功率预测方法实施例中的各步骤。
[0123] 在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上述的基于复合气象特征构建与选择的新能源功率预测方法实施例中的各步骤。
[0124] 需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
[0125] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read‑Only Memory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
[0126] 以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0127] 以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。