基于K均值聚类改进广义天气的光伏发电预测方法转让专利

申请号 : CN201610380692.6

文献号 : CN106022538B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张栋梁严健纵兆丹任晓达李国欣刘建华

申请人 : 中国矿业大学

摘要 :

一种基于K均值聚类改进广义天气的光伏发电预测方法,所述方法将光伏电站逐日历史出力数据聚类为K个簇,并为簇内数据附上数字标签;统计逐日历史出力数据所对应的数字标签和气象专业天气,构成一个气象专业天气对应一个或多个数字标签的改进广义天气映射;对于每相邻两日的历史出力数据,以第一日历史出力数据和其对应的数字标签、第二日历史出力数据对应的数字标签作为输入,以第二日历史出力数据作为输出,建立光伏发电的BP神经网络预测模型并利用所述模型预测发电量。本发明克服了现有广义天气映射中,关于气象专业天气划分过于绝对化的缺点,不仅可以在晴朗天气下精确预测光伏发电量,在多云转阴、阴雨等多变天气下也具有良好的预测精度。

权利要求 :

1.一种基于K均值聚类改进广义天气的光伏发电预测方法,其特征是,所述方法将光伏电站逐日历史出力数据聚类为K个簇,并为簇内数据附上数字标签;统计逐日历史出力数据所对应的数字标签和气象专业天气,构成一个气象专业天气对应一个或多个数字标签的改进广义天气映射;对于每相邻两日的历史出力数据,以第一日历史出力数据和其对应的数字标签、第二日历史出力数据对应的数字标签作为输入,以第二日历史出力数据作为输出,得到一组或多组预测结果;如果是一组预测结果的情况,则为最终预测结果;如果是多组预测结果的情况,则通过欧式距离公式,计算每组预测结果和其数字编号所对应的聚类中心的欧式距离,所得到欧式距离最小值者,为最终预测结果,建立光伏发电的BP神经网络预测模型并利用所述模型预测发电量。

2.根据权利要求1所述的一种基于K均值聚类改进广义天气的光伏发电预测方法,其特征是,所述方法包括以下步骤:①聚类逐日历史出力数据

a.根据需要确定分类状态数K;

b.从光伏电站的逐日历史出力数据中任意选取K个对象作为聚类中心,按距离最短原则将其它数据分别分配给最相近的聚类中心,形成K个簇;

c.将K个簇的均值作为K个新的聚类中心,计算所有对象与K个新聚类中心的距离,用与各个新聚类中心距离最小的对象对聚类中心进行更新,并按距离最短原则将其它数据重新分配给更新后的聚类中心,得到更新后的K个簇;

d.重复步骤c,直到K个聚类中心不发生变化为止;

②为逐日历史出力数据附上相应的数字标签

同一簇内的逐日历史出力数据具有相同的数字标签,不同簇内的逐日历史出力数据具有不同的数字标签;

③建立改进广义天气映射

统计逐日历史出力数据所对应的数字标签和气象专业天气,构成一个气象专业天气对应一个或多个数字标签的改进广义天气映射;

④训练和验证BP神经网络预测模型

从所有逐日历史出力数据中,选择一部分逐日历史出力数据作为训练样本,在每相邻两日的逐日历史出力数据中,以第一日历史出力数据、第一日历史出力数据对应的数字标签、第二日历史出力数据对应的数字标签作为输入,以第二日历史出力数据作为输出,通过BP神经网络拟合输入输出间的非线性映射关系,建立光伏发电的BP神经网络预测模型;用余下的逐日历史出力数据检验模型的预测精度;

⑤利用光伏发电的BP神经网络预测模型预测光伏发电量

从气象部门获取预测日的气象专业天气,根据改进广义天气映射,找到与此气象专业天气相对应的一个或多个数字标签,将预测日前一日历史出力数据、预测日前一日对应的数字标签、预测日的一个或多个数字标签输入到光伏发电的BP神经网络预测模型,得到一组或分别与多个数字标签相对应的多组预测结果。

3.根据权利要求2所述的一种基于K均值聚类改进广义天气的光伏发电预测方法,其特征是,所述分类状态数K为4。

说明书 :

基于K均值聚类改进广义天气的光伏发电预测方法

技术领域

[0001] 本发明涉及一种能够对光伏电站的发电量进行准确预测的方法,属于光伏发电技术领域。

背景技术

[0002] 光伏电源是一种间歇性能源,具有受季节特性、日特性、天气特性和波动特性等诸因素影响的特点。在众多复杂因素的影响下,光伏预测模型的建立过程略显复杂,但多数情况下,仍采用间接预测法,即根据光伏历史出力数据建立数学模型。此种方法认为数据本身就涵盖有地域、气候等信息,对数据进行统计和分类处理后,通过一些具有自学习等能力的算法来建立光伏发电模型。
[0003] 光伏发电模型的建立,从输入端看,需要两个方面的内容:一是光伏电站的逐日出力数据,二是每日数据所对应的气象专业天气数据。逐日出力数据一般以每天光照时段整点时刻发出功率为取样点,如夏季日是早上六点至晚上六点,共十三个时刻,即夏季日每一组历史出力数据都包含有十三个整点时刻的发电功率。气象专业天气由当地气象部门发布,表明光伏电站运行日的天气状况概念。根据GB/T22164—2008国家标准,中国气象局将所有气象天气标划分为33种专业天气类型。不同气象专业天气下,光伏出力的曲线各有不同。为了能将气象专业天气转变为计算机能够识别的参数,广义天气的概念应运而生。即通过某种事先定义好的评价指标(如太阳光辐照度、相对湿度、云量等),将33种气象专业天气再人为地分为几个集合,每一集合都包含多种气象专业天气,并且对应地为所述集合分配一个数字或字母标签。同时,由于在光伏电站运行过程中,每天都可以从当地气象部门获取当天的气象专业天气状况,结合已经划分好的广义天气集合,便使得逐日历史出力数据也都带上广义天气的标签。
[0004] 将相邻两组逐日历史出力数据及其对应的广义天气标签输入至算法中,经过大量训练,可以得到以第一日光伏出力数据、第一日广义天气标签、第二日广义天气标签为自变量,以第二日光伏出力数据为因变量的数据之间的拟合关系。最后,再由已经训练好的预测模型,根据预测日前一日各时刻的光伏出力数据、预测日前一日的广义天气状态标签,结合气象部门发布的预测日气象专业天气,就可以得到预测日各时刻的光伏出力数据。
[0005] 目前,利用广义天气预测光伏电站的发电量时,存在广义天气的划分过于绝对化的问题,即在构建广义天气映射集时,某一种用于划分广义天气的评价指标一旦确定,便会将气象专业天气定性地归类于某一集合的广义天气类型中,从而使所述气象专业天气带有所述集合所对应的广义天气标签。由于光伏出力易受当日风力、云量等因素的影响,即便是在相同的气象专业天气下(比如晴转多云天气),也往往会出现各自发电功率曲线相差较大的情况,如果此时再给历史出力数据带上广义天气状态标签,单独地用某一种广义天气状态来描述,将会使预测误差增大,特别是在晴转多云、阴雨等多变天气下,光伏发电量的预测精度更低。

发明内容

[0006] 本发明的目的在于针对现有技术之弊端,提供一种基于K均值聚类改进广义天气的光伏发电预测方法,以提高光伏发电量的预测精度。
[0007] 本发明所述问题是以下述技术方案解决的:
[0008] 一种基于K均值聚类改进广义天气的光伏发电预测方法,所述方法将光伏电站逐日历史出力数据聚类为K个簇,并为数据附上数字标签;统计逐日历史出力数据所对应的数字标签和气象专业天气,构成一个气象专业天气对应一个或多个数字标签的改进广义天气映射;对于每相邻两日的历史出力数据,以第一日历史出力数据和其对应的数字标签、第二日历史出力数据对应的数字标签作为输入,以第二日历史出力数据作为输出,建立光伏发电的BP神经网络预测模型并利用所述模型预测发电量,预测结果可能是一组或多组,如果是一组预测结果,则所述预测结果为最终预测结果;如果是多组预测结果,计算每组预测结果与其数字编号所对应的聚类中心的欧式距离,欧式距离最小值者为最终预测结果。
[0009] 上述基于K均值聚类改进广义天气的光伏发电预测方法,具体预测按以下步骤进行:
[0010] ①聚类逐日历史出力数据
[0011] a.根据需要确定分类状态数K;
[0012] b.从光伏电站的逐日历史出力数据中任意选取K个对象作为聚类中心,按距离最短原则将其它数据分别分配给最相近的聚类中心,形成K个簇;
[0013] c.将K个簇的均值作为K个新的聚类中心,计算所有对象与K个新聚类中心的距离,用与各个新聚类中心距离最小的对象对聚类中心进行更新,并按距离最短原则将其它数据重新分配给更新后的聚类中心,得到更新后的K个簇;
[0014] d.重复步骤c,直到K个聚类中心不发生变化为止;
[0015] ②为逐日历史出力数据附上相应的数字标签
[0016] 同一簇内的逐日历史出力数据具有相同的数字标签,不同簇内的逐日历史出力数据具有不同的数字标签;
[0017] ③建立改进广义天气映射
[0018] 统计逐日历史出力数据所对应的数字标签和气象专业天气,构成一个气象专业天气对应一个或多个数字标签的改进广义天气映射;
[0019] ④训练和验证BP神经网络预测模型
[0020] 从所有逐日历史出力数据中,选择一部分逐日历史出力数据作为训练样本,在每相邻两日的逐日历史出力数据中,以第一日历史出力数据、第一日历史出力数据对应的数字标签、第二日历史出力数据对应的数字标签作为输入,以第二日历史出力数据作为输出,通过BP神经网络拟合输入输出间的非线性映射关系,建立光伏发电的BP神经网络预测模型;用余下的逐日历史出力数据检验模型的预测精度;
[0021] ⑤利用光伏发电的BP神经网络预测模型预测光伏发电量
[0022] 从气象部门获取预测日的气象专业天气,根据改进广义天气映射,找到与此气象专业天气相对应的一个或多个数字标签,将预测日前一日历史出力数据、预测日前一日对应的数字标签、预测日的一个或多个数字标签输入到光伏发电的BP神经网络预测模型,得到一组或分别与多个数字标签相对应的多组预测结果,如果是一组预测结果,则所述预测结果为最终预测结果;如果是多组预测结果,根据欧式距离公式:
[0023]
[0024] 计算每组预测结果与其数字编号所对应的聚类中心的欧式距离,欧式距离最小值者为最终预测结果。
[0025] 式中:d为欧式距离值,i=1,2,3,…,13,表示早上6点开始到下午18点的13个整点时刻,xi为每日整点时刻出力值,yi为xi所属簇的聚类中心的各整点时刻值,n表示当日总的出力时刻个数,本文示例中n取13。
[0026] 上述基于K均值聚类改进广义天气的光伏发电预测方法,所述分类状态数K为4。
[0027] 本发明通过对现有广义天气映射关系的改进,克服了现有广义天气映射的映射结果过于绝对化的缺点,从而提高了光伏发电量的预测精度。所述方法不仅可在晴朗天气下精确预测光伏发电量,在多云转阴、阴雨等多变天气下也具有良好的预测精度。

附图说明

[0028] 图1是本发明的光伏发电预测方法流程图;
[0029] 图2是某光伏电站同属于“多云转阴”气象专业天气下的光伏出力曲线情况,用以说明现有广义天气概念对天气划分过于绝对的缺点;
[0030] 图3为28日雷阵雨气象专业天气下预测结果;
[0031] 图4为26日多云转阴气象专业天气下预测结果;
[0032] 图5为23日小雨气象专业天气下预测结果。

具体实施方式

[0033] 下面结合附图对本发明作进一步说明。
[0034] 针对现有广义天气在使用过程中过于绝对化的缺点,本方法在广义天气映射构建方面,通过K均值聚类算法将逐日历史出力数据聚为四个簇,每个簇均对应一个聚类中心。先使每个簇内带上数字标签,则簇内历史出力数据也带上数字标签。统计簇内历史出力数据所对应的气象专业天气,根据此对应关系,得到改进广义天气映射。在改进广义天气映射中,同一气象专业天气对应一个或多个广义天气标签,从而适应于同一预测日气象专业天气下,可能存在的多变性特点。
[0035] 本发明包括以下步骤:
[0036] ①聚类逐日历史出力数据
[0037] 聚类流程为:
[0038] a.输入所需要的分类状态数K,本发明取K为4。
[0039] b.从逐日历史出力数据中选取任意4个对象作为聚类中心,其它数据分别被分配给最相近的聚类中心,形成K个簇。
[0040] c.取K个簇的均值作为4个新的聚类中心,计算所有对象和K个新的聚类中心的距离。取产生最小距离的对象作为下一个新的聚类中心,并按步骤b中的分配方法将其它数据重新分配给更新后的聚类中心,得到更新后的K个簇。
[0041] d.重复步骤c,一直到4个聚类中心不发生变化为止。
[0042] 通过K均值聚类算法,将逐日历史出力数据中具有相似出力特性的数据聚类到同一个簇内,实现了以数据内在联系为基础的数据合理划分。4个簇内生成的4个聚类中心,作为每个簇内的基准数据,为最后多组预测结果的筛选奠定基础。
[0043] ②为4个簇内的逐日历史出力数据附上数字标签
[0044] 逐日历史出力数据经聚类后,分散于4个簇内,为每个簇附上数字标签,4个簇内的逐日历史出力数据便带有统一的数字标签。
[0045] ③建立改进广义天气映射
[0046] 统计逐日历史出力数据所对应的数字标签和逐日历史出力数据所对应的气象专业天气于表格中,构成了一个气象专业天气对应一个或多个数字标签的改进广义天气映射。
[0047] 现有广义天气映射和改进广义天气映射对比:
[0048] 表1为现有广义天气映射关系,表2为改进广义天气映射关系。
[0049] 表1 广义天气类型对应表
[0050]
[0051] 表2 改进后的广义天气类型对应表
[0052]
[0053] 对比二者发现,当预测日的气象专业天气确定时,前者对应的广义天气类型是固定的,而改进广义天气的同一个专业气象天气可以对应多个数字编号,其内包含更多种预测可能。下面以预测日天气为气象专业天气中的“多云转阴”天气为例,分析一下改进的必要性:
[0054] 以现有广义天气概念处理“多云转阴”气象专业天气时,一旦经过评价指标评价,“多云转阴”气象专业天气将永远对应“B”状态。但是从图2所示的某光伏电站同属于“多云转阴”气象专业天气下的光伏出力曲线可以看出,在同样的气象专业天气下,三条光伏出力曲线仍然相差较大,其中7月8日的曲线更接近于晴天,但是7月15日的曲线和阴雨天气下的曲线很相似。所以,如果单纯以“B”状态来描述,无疑会使预测结果误差偏大。而且此现象也可以解释为什么在晴朗天气下,现有预测方法精度都很高(因为没有较多多变因素干扰),而在多变天气下,预测精度就会大幅降低。
[0055] ④训练和验证BP神经网络预测模型
[0056] 在所有数据中,选择一部分逐日历史出力数据作为训练样本。在每相邻两日的逐日历史出力数据中,以第一日历史数据、第一日历史数据对应的数字标签、第二日数据对应的数字标签作为输入,以第二日历史数据作为输出,通过BP神经网络拟合输入输出间的非线性映射关系,建立光伏发电的BP神经网络预测模型。用余下的逐日历史出力数据检验模型的预测精度。
[0057] ⑤利用光伏发电的BP神经网络预测模型预测光伏发电量
[0058] 根据从气象部门获取的预测日气象专业天气,结合改进广义天气映射,找到此气象专业天气对应的一个或多个数字标签。将预测日前一日历史数据、预测日前一日对应的数字标签、预测日的一个或多个数字标签作为BP神经网络预测模型输入,得到一组或多组预测结果。如果是一组预测结果的情况,则为最终预测结果;如果是多组预测结果的情况,则通过欧式距离公式,计算每组预测结果和其数字编号所对应的聚类中心的欧式距离,所得到欧式距离最小值者,为最终预测结果。
[0059] 图1为本发明所述基于K均值聚类改进广义天气的光伏发电预测方法流程图,下面结合图1对本发明实施的技术方案进行详细、准确地描述。
[0060] 以某光伏电站2015年七月份前三十日发电数据为例,基于K均值聚类改进广义天气的光伏发电预测方法流程如下:
[0061] 表3 某光伏电站七月份前三十日各时刻发电数据
[0062]
[0063] 步骤1:根据图1流程图中K均值聚类过程以及上述聚类逐日历史出力数据的步骤,在MATLAB中实现对30组历史数据的K均值聚类。其中,K值定义为4,即30组数据经过聚类划分后,将分布于4个簇中。聚类结果以及各簇的聚类中心如表4、表5所示:
[0064] 表4 30组数据经K均值聚类后的结果
[0065]
[0066] 表5 各簇的聚类中心
[0067]
[0068] 其中,可认为簇“1”具备广义上的“晴天”特性,簇“2”具备广义上的“多云”特性、簇“3”具备广义上的“阵雨”特性、簇“4”具备广义上的“大雨”特性。
[0069] 步骤2:同一个簇内的数据带有相同的数字标签,不同簇带有不同的数字标签,30组数据经过聚类后,均带有数字标签。
[0070] 步骤3:按照步骤1和步骤2所述步骤,对2015年全年每日光伏发电数据进行聚类,根据数字标签和专业气象天气的对应情况,分类统计归纳后,得到如上述表2所示的改进后的广义天气类型对应表,实现对33种气象专业天气的重新归类。
[0071] 步骤4:在每相邻两日的逐日历史出力数据中,以第一日历史数据、第一日历史数据对应的数字标签、第二日历史数据对应的数字标签作为输入,以第二日历史数据作为输出,循环此过程,一直到预测日前一日为止。通过BP神经网络拟合输入输出间的非线性映射关系,建立光伏发电的BP神经网络预测模型。
[0072] 步骤5:由步骤4得到已经训练好的神经网络模型,以预测7月28日光伏出力值为例,预测该日专业气象天气下的各时刻光伏出力值。气象部门发布的当天气象专业天气为“雷阵雨”,根据表2中改进后的广义天气对应表,其对应“1、2、3、4”这四种数字标签。所以,根据训练好的神经网络模型,可以得到四组预测结果。为了从四组预测结果中筛选出最终预测结果,可以通过欧式距离公式,计算四组预测结果及其对应聚类中心的欧式距离,欧式距离最小者为最终预测值。计算结果如表6所示。
[0073] 表6 四组预测结果与其聚类中心的欧式距离
[0074]
[0075] 由表6可知,当28日天气定义为数字标签“1”时,其预测值和其对应的聚类中心最为贴近,所以数字标签“1”对应的预测值即为最终预测值。
[0076] 用改进前后两种广义天气法同时预测7月28日“雷阵雨”天气,预测结果及精度如表7所示。
[0077] 表7 改进前后两种预测方法结果及精度对比
[0078]
[0079] 从表7均方根误差可以看出,改进后广义天气预测方法相比于未改进方法,在预测精度上有大幅提高。图3、图4、图5分别是在“雷阵雨”、“多云转阴”和“小雨”气象专业天气下的预测结果。从图中也可以看出,本文改进后的广义天气光伏出力预测方法具有较高的预测精度。