一种短期风电功率非参数概率预测方法转让专利

申请号 : CN201510642448.8

文献号 : CN105225006B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 杨明林优韩学山李文博安滨

申请人 : 山东大学

摘要 :

本发明实施例公开了一种短期风电功率非参数概率预测方法,包括,构建每个前瞻时段的SVM预测模型和SBC预测模型;将风电功率预测所需数据输入SVM预测模型,得到每个前瞻时段的风电功率预测值;将误差分布预测所需数据输入SBC预测模型,得到每个前瞻时段的预测误差条件概率;利用D‑S证据理论对预测误差条件概率进行整合,其中设计风电功率的分布范围约束,得到每个前瞻时段的预测误差的整体概率分布;将风电功率预测值与预测误差概率分布叠加,得到每个前瞻时段的风电功率概率分布。本发明基于稀疏贝叶斯架构构建,具有高稀疏性,确保了模型的泛化能力与计算速度,且系统地计及了风电场输出功率的边界约束,使预测结果更加符合实际。

权利要求 :

1.一种短期风电功率非参数概率预测方法,其特征在于,包括:

构建每个前瞻时段的SVM预测模型和SBC预测模型,其中,所述SBC预测模型是将所述SVM预测模型对训练样本的预测误差进行区间分类、利用稀疏贝叶斯分类模型对所述预测误差落入某设定区间内的概率进行训练得到的;

将风电功率预测所需要的数据输入所述SVM预测模型,得到每个前瞻时段的风电功率预测值;

将风电功率的误差分布预测所需要的数据输入所述SBC预测模型,得到每个前瞻时段SVM预测误差在每个分类区间上的预测误差条件概率;

根据D-S证据理论,对所述预测误差条件概率进行整合,得到每个前瞻时段的预测误差均值和预测误差概率分布,其中,设计风电功率的分布范围约束;

将每个前瞻时段的所述风电功率预测值分别与所述预测误差均值、所述预测误差概率分布相叠加,得到每个前瞻时段的风电功率预测修正值和风电功率概率分布。

2.根据权利要求1所述的短期风电功率非参数概率预测方法,其特征在于,构建每个前瞻时段的SVM预测模型,包括:利用NWP历史数据和对应的风电场输出功率的历史数据作为样本对SVM进行训练,得到SVM模型权重系数,形成每个前瞻时段的SVM预测模型。

3.根据权利要求1所述的短期风电功率非参数概率预测方法,其特征在于,构建每个前瞻时段的SBC预测模型,包括:利用所述SVM预测模型,以测试样本的目标时段NWP数据和距离所述目标时段最近三个时段的风电场输出功率数据作为输入,得到所述测试样本的每个前瞻时段的风电功率预测目标值;

将所述测试样本的每个前瞻时段的所述风电功率预测目标值和相应的风电场输出功率实际值进行比较,得到每个前瞻时段的预测误差序列和预测误差范围,将所述预测误差范围平均离散为S个区间;

将每个前瞻时段的所述风电功率预测目标值、所述预测误差序列以及相应的NWP数据作为训练样本,分别对所述S个区间上的SBC模型进行训练,形成每个前瞻时段的SBC预测模型。

4.根据权利要求3所述的短期风电功率非参数概率预测方法,其特征在于,所述SBC预测模型 中 ,第n个 样本落 入所述 S个区 间中任 一区间 s的概 率p s ,n 为其中, xn为输入变量;K(xn,xi)为核函数,φ(xn)为[1,KT

(xn,xI),…K(xn,xN)],ωi表示权值系数。

5.根据权利要求1所述的短期风电功率非参数概率预测方法,其特征在于,将风电功率预测所需要的数据输入所述SVM预测模型,包括:将预测目标时段NWP数据和距离所述预测目标时段最近三个时段的风电场输出功率历史数据输入所述SVM预测模型。

6.根据权利要求5所述的短期风电功率非参数概率预测方法,其特征在于,将风电功率的误差分布预测所需要的数据输入所述SBC预测模型,包括:将所述预测目标时段NWP数据、所述风电功率预测值和距离所述预测目标时段最近三个时段的误差数据输入所述SBC预测模型。

7.根据权利要求1所述的短期风电功率非参数概率预测方法,其特征在于,所述风电功率的分布范围约束,具体为:根据预测的风电功率满足限制0≤Gforecast=GSVM+error≤GN,得出所述SVM预测模型的预测误差应分布在sd~su之间的区间范围上,其中,Gforecast为风电功率输出值;GSVM为所述SVM预测模型得到的风电功率预测值;error为所述SVM预测模型预测误差值,Emin和Emax分别为所述SBC预测模型中分类区间的最小、最大误差值,Gunit为所述SBC预测模型中每个区间的功率跨度。

8.根据权利要求3-6任一所述的短期风电功率非参数概率预测方法,其特征在于,所述NWP数据包括风电场周围四个测试点的NWP风速数据。

9.根据权利要3所述的短期风电功率非参数概率预测方法,其特征在于,所述S个区间中S的取值为20-150。

说明书 :

一种短期风电功率非参数概率预测方法

技术领域

[0001] 本发明涉及新能源发电过程中风电功率预测技术领域,特别是涉及一种短期风电功率非参数概率预测方法。

背景技术

[0002] 风能是一种可再生、洁净能源,对风能进行开发已得到了各国的高度重视,风力发电已经成为可再生能源中发展最快和最成熟的技术之一,但是风能的波动性、不可控性等特点,导致风电场输出功率的波动性、间歇性。继而导致风电的接入给电网带来了冲击,使电网的不确定性增加,电力调度的难度也随之增加。因此,对风电功率进行准确预测有利于减轻风电场对电网的冲击效应,降低不利影响,提高电力市场环境下的风电上网能力。从国内外研究现状来看,当前多数已有的风电功率预测方法为点预测方法。然而,由于风电难以准确预测,在预测结果中包含风电功率的不确定信息,对风电功率可能出现的范围及相应概率分布进行预报是必要的,以此需求为出发点所形成的概率预测方法,正受到越来越多的重视。
[0003] 风电功率概率预测方法可分为参数预测和非参数预测两类,其中的非参数预测方法不对预测目标的分布形式进行假设,可有效避免模型分布形式选择带来的建模误差,具有较好的普适性。在非参数方法中,较成熟的方法包括分位点回归法,该方法基于分位点回归分析理论,对风电功率波动区间,通过SVM(Support Vector Machine,支持向量机)自适应地选取回归函数,建立风电功率分为点回归模型,并基于内点法对所述模型进行求解,实现对未来时刻风电功率的波动区间分析,给出未来时刻风电功率概率分布。
[0004] 但是所述分位点回归法由于模型构建方法的原因,其预测精度会随着预测时长的增加而显著降低;同时也未考虑风电功率必须满足在[0,GN](GN为风电场装机容量)内取值的约束,导致预测结果与现实情况差异大。

发明内容

[0005] 本发明实施例中提供了一种短期风电功率非参数概率预测方法,以解决现有技术中的风电功率概率预测方法预测结果与现实情况差异大的问题。
[0006] 为了解决上述技术问题,本发明实施例公开了如下技术方案:
[0007] 一种短期风电功率非参数概率预测方法,包括:
[0008] 构建每个前瞻时段的SVM预测模型和SBC(Sparse Bayesian Classification,稀疏贝叶斯分类)预测模型;
[0009] 将风电功率预测所需要的数据输入所述SVM预测模型,得到每个前瞻时段的风电功率预测值;
[0010] 将风电功率的误差分布预测所需要的数据输入所述SBC预测模型,得到每个前瞻时段的预测误差条件概率;
[0011] 根据D-S证据理论,对所述预测误差条件概率进行整合,得到每个前瞻时段的预测误差均值和预测误差概率分布,其中,设计风电功率的分布范围约束;
[0012] 将每个前瞻时段的所述风电功率预测值分别与所述预测误差均值、所述预测误差概率分布相叠加,得到每个前瞻时段的风电功率预测修正值和风电功率概率分布。
[0013] 优选地,构建每个前瞻时段的SVM预测模型,包括:
[0014] 利用NWP(Numerical Weather Prediction,数值天气预报)历史数据和对应的风电场输出功率的历史数据作为样本对SVM进行训练,得到SVM模型权重系数,形成每个前瞻时段的SVM预测模型。
[0015] 优选地,构建每个前瞻时段的SBC预测模型,包括:
[0016] 利用所述SVM预测模型,以测试样本的目标时段NWP数据和距离所述目标时段最近三个时段的风电场输出功率数据作为输入,得到所述测试样本的每个前瞻时段的风电功率预测目标值;
[0017] 将所述测试样本的每个前瞻时段的所述风电功率预测目标值和相应的风电场输出功率实际值进行比较,得到每个前瞻时段的预测误差序列和预测误差范围,将所述预测误差范围平均离散为S个区间;
[0018] 将每个前瞻时段的所述风电功率预测目标值、所述预测误差序列以及相应的NWP数据作为训练样本,分别对所述S个区间上的SBC模型进行训练,形成每个前瞻时段的SBC预测模型。
[0019] 优选地,所述SBC预测模型中,第n个样本落入所述S个区间中任一区间s的概率ps,n为
[0020] 其中, xn为输入变量;K(xn,xi)为核函数,φ(xn)为[1,K(xn,xI),…K(xn,xN)]T,ωi表示权值系数。
[0021] 优选地,将风电功率预测所需要的数据输入所述SVM预测模型,包括:
[0022] 将预测目标时段NWP数据和距离所述预测目标时段最近三个时段的风电场输出功率历史数据输入所述SVM预测模型。
[0023] 优选地,将风电功率的误差分布预测所需要的数据输入所述SBC预测模型,包括:
[0024] 将所述预测目标时段NWP数据、所述风电功率预测值和距离所述预测目标时段最近三个时段的误差数据输入所述SBC预测模型。
[0025] 优选地,所述风电功率的分布范围约束,具体为:
[0026] 根据预测的风电功率满足限制0≤Gforecast=GSVM+error≤GN,得出所述SVM预测模型的预测误差应分布在sd~su之间的区间范围上,
[0027]
[0028] 其中,Gforecast为风电功率输出值;GSVM为所述SVM预测模型得到的风电功率预测值;error为所述SVM预测模型预测误差值,Emin和Emax分别为所述SBC预测模型中分类区间的最小、最大误差值,Gunit为所述SBC预测模型中每个区间的功率跨度。
[0029] 优选地,所述数值天气数据包括风电场周围四个测试点的NWP风速数据。
[0030] 优选地,所述S个区间中S的取值为20-150。
[0031] 由以上技术方案可见,本发明实施例提供的一种短期风电功率非参数概率预测方法包括:构建每个前瞻时段的SVM预测模型和SBC预测模型;将风电功率预测所需要的数据输入所述SVM预测模型,得到每个前瞻时段的风电功率预测值;将风电功率的误差分布预测所需要的数据输入所述SBC预测模型,得到每个前瞻时段的预测误差条件概率;利用D-S证据理论,对所述预测误差条件概率进行整合,其中,设计风电功率的分布范围约束,得到每个前瞻时段的预测误差均值和预测误差概率分布;将所述风电功率预测值分别与所述预测误差均值、所述预测误差概率分布相叠加,得到每个前瞻时段的风电功率预测修正值和风电概率分布。本发明实施中所采用的SBC方法具有良好的稀疏特性,计算量较小,泛化能力强;采用D-S证据理论系统地计及了风电功率的分布范围的边界约束,使预测结果更加符合现实情况,误差修正方法的应用,提高了风电功率概率的预测精度,同时,非参数预测方法避免了假设风电符合某种特定分布所带来的建模误差,摆脱假设误差特定分布形式的局限性,进一步提高所述风电功率概率预测的精度。

附图说明

[0032] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0033] 图1为本发明实施例提供的一种短期风电功率非参数预测方法的流程示意图;
[0034] 图2为本发明实施例提供的一种构建SBC预测模型的流程示意图;
[0035] 图3为本发明实施例提供的区间划分数目S与点预测精度关系图;
[0036] 图4为本发明实施例提供的单时段风电功率预测过程流程图;
[0037] 图5为本发明实施例提供的SVM预测误差的概率分布函数;
[0038] 图6为本发明实施例提供的风电功率的概率分布函数;
[0039] 图7为本发明实施例提供的预测方法的边际概率密度预测结果;
[0040] 图8为本发明实施例提供的预测方法与基准方法前瞻第5小时分布预测结果的边际校准指标;
[0041] 图9为本发明实施例提供的预测方法与基准方法前瞻1-48小时的50%中心概率区间;
[0042] 图10为本发明实施例提供的预测方法与基准方法前瞻1-48小时的90%中心概率区间;
[0043] 图11为本发明实施例提供的预测方法与基准方法的连续排名概率得分指标统计结果。

具体实施方式

[0044] 为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0045] SVM是在VC维理论和经验风险最小化原则的基础上提出的一种新型学习机器,其最大的特点是采用少数支持向量代表整个样本集,改变了传统的经验风险最小化原则,具有很好的泛化能力,另外,SVM在处理非线性问题,通过将非线性问题映射到高维空间转化为线性问题,从而巧妙的解决了反复计算问题,有效的克服了维数灾难以及局部极小问题。SVM回归的思想是通过一个非线性映射 将数据映射到高维特征空间H,并在这个空间进行线性回归,具体为,给定k个样本数据,其值为{xk,yk},其中xk∈Rn为n维向量,yk∈R为相应的 输 出 变 量 ,S V M 通 过 引 入 损 失 函 数 来 解 决 回 归 问 题 ,一 般 采 用n
ω∈R 来估计输出值,式中,ω为权重向量,b为偏
置项,可以通过解凸最优化问题得到ω和b。通常用核函数K替代内积计算,即
式中ai和 为不等于0的拉格朗日乘子。
[0046] SBC是一种基于贝叶斯框架的核函数方法,它具有和SVM相同的核函数形式,可以处理两分类问题。SBC在给出分类结果的同时,还可以量化给出分类的可靠程度,同时,还具有超高的稀疏性,使用极少的相关向量就能得到很高的预测精度,不用事先定义多余误差参数,可大大节约数据处理时间。
[0047] D-S证据理论,由Dempster于1967年首先提出,由他的学生Shafer于1976年进一步发展起来的一种不精确推理理论,也称信度函数理论,属于人工智能的范畴,最早应用于专家系统,可以把若干独立的证据结合起来,得到多个证据共同作用产生的事件的基本概率分布。
[0048] 本实施例将基于上述SVM、SBC以及D-S证据理论,对未来1-48h,的风电功率概率分布函数进行预测,其中,时间分辨率为1h。本实施例由单点值预测、预测误差条件概率分类、预测误差分布整合以及风电功率分布预测四部分组成,并通过分步预测对多时段的风电功率进行预测。在具体预测过程,首先通过SVM预测模型对风电功率进行点预测;进而,将SVM预测模型预测误差的范围离散为多个区间,通过SBC预测模型对SVM预测误差落入各预定区间的概率进行估计;而后,应用D-S证据理论对所有区间对应的概率估计结果进行整合,得到SVM预测误差的整体概率分布;最后,叠加误差分布与所述SVM预测模型预测的风电功率值,得到风电功率的概率分布结果。并且本实施例中以某74MW的风电场为例对方法进行验证,证明本实施例方法的有效性。
[0049] 参见图1,为本发明实施例提供的一种短期风电功率非参数预测方法的流程示意图,该方法包括:
[0050] 步骤101:构建每个前瞻时段的SVM预测模型和SBC预测模型。
[0051] 在构建每个前瞻时段的SVM预测模型时,风电场输出功率的影响因素有风速、风向、大气压力、日照强度和阵风等,其中研究表明风速对风电场输出功率的影响最大,因此本实施例中,采用NWP中的风速历史数据和对应的风电场输出功率的历史数据作为样本对SVM进行训练,得到SVM模型权重系数,形成每个前瞻时段的SVM预测模型。当然,也可以对NWP中的历史数据中的风速、风向、大气压力、日照强度和阵风分别构建模型,然后再对各个模型等权相加得到复合模型。
[0052] 在构建每个前瞻时段的SBC预测模型时,如图2所示,具体包括如下步骤:
[0053] 步骤201:利用所述SVM预测模型,以测试样本的目标时段NWP数据和距离所述目标时段最近三个时段的风电场输出功率数据作为输入,得到所述测试样本的每个前瞻时段的风电功率预测目标值。
[0054] 其中,所述目标时段NWP数据包括测试样本中目标时段风电场周围四个测试点的NWP风速数据。
[0055] 步骤202:将所述测试样本的每个前瞻时段的所述风电功率预测目标值和相应的风电场输出功率实际值进行比较,得到每个前瞻时段的预测误差序列和预测误差范围,将所述预测误差范围平均离散为S个区间。
[0056] 其中,所述S个区间中S的取值的依据为,如图3所示,SVM预测误差序列的区间划分数目S的取值与点预测精度指标归一化平均绝对误差(NMAE)和归一化均方根误差(NRMSE)的关系曲线。由图3可知,随着S数值的增大,前瞻48小时的NMAE和NRMSE平均值先逐渐减小后逐渐增大;当S的数值在[20,150]范围内时点预测精度相对较高。
[0057] 步骤203:将每个前瞻时段的所述风电功率预测目标值、所述预测误差序列以及相应的NWP数据作为训练样本,分别对所述S个区间上的SBC模型进行训练,形成每个前瞻时段的SBC预测模型。
[0058] 通过对SVM预测误差序列的分析,发现误差时间序列具有较强的自回归特性。同时,分别对风速与SVM预测误差数据以及SVM预测功率数据与SVM预测误差数据进行互相关性检验发现,风速和SVM预测功率数据均与SVM预测误差数据之间,具有显著的互相关性。因此,可通过对预测误差的分析、预估,预先得到误差可能的分布情况,并进行误差的修正。
[0059] 具体训练过程为,对于区间s,根据伯努利概型,对于误差是否落入区间s这个事件,N个相互独立样本发生的似然函数为:
[0060]
[0061] 式中,zs,n为分类标识,表示样本是否落在区间s内,落入为1,未落入为0;z=[zs,1,Tzs,2,…,zs,N];ps,n表示第n个样本落入区间s的概率。
[0062] 根据logistic sigmoid函数,ps,n可表示为:
[0063]
[0064] 式中,y(xn)采用核函数的线性组合表示,即:
[0065]
[0066] 式中,xn为输入变量;K(xn,xi)为核函数,此处采用高斯核函数形式;φ(xn)为[1,K(xn,x1),…K(xn,xN)]T,ωi表示权值系数。
[0067] 将式(2)、式(3)代入式(1)得到似然函数:
[0068]
[0069] 在SBC中,采用贝叶斯方法求取权值参数ω。假设参数ωi(i=1,2,…,N)的先验分布为均值为0、方差为 的Gauss分布,即:
[0070]
[0071] 式中, 为决定权值ωi先验分布的超参数;α=(α1,α2,…,αN)T。
[0072] 通过采用Laplace方法求解,可以求得ω的后验分布。其中,所求得的超参数αi多数趋于无穷大,从而使相应的权值系数ωi趋于0,剩余少量非零权值系数ωi所对应的样本向量即为相关向量,其中,找到为数不多的相关向量是SBC具有稀疏性的根本原因。最终求得的权值系数向量ω服从均值为ωMP=∑(ΦTΒΦ+Α)-1、方差为∑=(ΦTΒΦ+Α)-1的正态分布,其中,
[0073] Φ=[φ(x1),φ(x2),…,φ(xN)]T,Α=diag(α0,α1,…,αN),Β=diag(β0,β1,…,αN),βN=σ(y(xn))[1-σ(y(xn))]。
[0074] 解得所需参数之后,将权值系数的均值ωMP代入式(2)和式(3)形成SBC预测模型。
[0075] 对于任意新的输入变量ωMP,依据所得SBC预测模型,可以得到其属于第s个区间的概率ps,new其中,当ps,new≥0.5时,可得到zs,new=1的结论,即误差落在第s个区间内;反之,得到zs,new=0的结论,即误差未落在第s个区间内。
[0076] 构建关于每个前瞻时段的所述SVM预测模型和所述SBC预测模型后,下面将进行风电功率预测的过程。
[0077] 步骤102:将风电功率预测所需要的数据输入所述SVM预测模型,得到每个前瞻时段的风电功率预测值。
[0078] 本实施例中,风电功率预测所需要的数据包括预测目标时段NWP数据和距离所述预测目标时段最近三个时段的风电场输出功率历史数据。其中,所述预测目标时段NWP数据具体为风电场周围四个测点预测目标时段的NWP风速数据,当然,依据构建所述SVM模型时,所采用的数据不同,也可以将预测目标时段NWP中的风速、风向、大气压力、日照强度和阵风数据作为输入数据,以及距离所述预测目标时段较近的其它几个时段的风电场输出功率历史数据作为输入数据。
[0079] 步骤103:将风电功率的误差分布预测所需要的数据输入所述SBC预测模型,得到每个前瞻时段的预测误差条件概率。
[0080] 将所述预测目标时段NWP数据、所述风电功率预测值和距离所述预测目标时段最近三个时段的误差数据输入所述SBC预测模型,并重复进行S次预测,得到SVM预测误差落在S个区间的分类结果znew=[z1,new,z2,new,…,zS,new]及其对应概率值pnew=[p1,new,p2,new,…,pS,new]。其中,所述预测目标时段NWP数据具体为风电场周围四个测点预测目标时段的NWP风速数据。
[0081] 步骤104:根据D-S证据理论,对所述预测误差条件概率进行整合,得到每个前瞻时段的预测误差均值和预测误差概率分布,其中,设计风电功率的分布范围约束。
[0082] SVM预测误差落在每个区间的概率值都是利用独立SBC预测模型预测得到的,因此,由所述SBC预测模型得到的SVM预测误差落在S个区间内的概率值不满足概率之和为1的条件。此外,风电场的输出功率应在[0,GN]的范围内取值,这一约束也应体现在误差分布的预测中。
[0083] 为了解决上述问题,本实施例利用D-S证据理论,根据所述SBC预测模型预测结果,结合风电场输出功率范围约束,整合得到SVM预测误差的整体分布。
[0084] 其中,设计风电功率的分布范围约束,预测的风电功率满足以下限制,[0085] 0≤Gforecast=GSVM+error≤GN    (6)
[0086] 式中,Gforecast为风电功率输出值,GSVM为所述SVM预测模型得到的风电功率预测值,error为所述SVM预测模型预测误差值。
[0087] 根据式(6)可得SVM预测误差分布范围:
[0088] -GSVM≤error≤GN-GSVM    (7)
[0089] 进而可以确定SVM预测误差可能存在的上下边界区间sd和su,所述SVM预测模型预测误差应分布在sd~su之间的区间范围上:
[0090]
[0091]
[0092] 式中,Emin和Emax分别为所述SBC预测模型中分类区间的最小、最大误差值,Gunit为所述SBC预测模型中每个区间的功率跨度, 为上取整函数,表示取不小于x的最小整数。
[0093] 所述根据D-S证据理论,对所述预测误差条件概率进行整合,具体包括:
[0094] 在应用D-S证据理论整合所述SBC预测模型得到所述预测误差的分类结果以及风电功率范围约束时,对于所述SVM预测误差属于哪个区间这个事件,识别框架为Θ={Α1,Α2,…,Αs,…,ΑS},其中,元素Αs表示误差落在第s个区间内。分配给该框架下各命题的信任程度称为基本概率分配(BPA,也称m函数),m(Βi)反映着对Βi的信度大小,并且m(φ)=0、 如果m(ΒI)>0,则Βi被称为焦元。
[0095] 对于风电功率分布这一问题,共有S+1个证据、表示为D1,D2,…,DS+1,即S个SBC预测模型的预测结果及所述风电功率范围约束,对应的基本概率分配函数分别为m1,m2,…,DS+1。
[0096] 证据的命题概率分配如表一所示,
[0097] 表一:
[0098]
[0099] 其中所述S+1个证据的具体描述为:
[0100] 对于证据D1,所述SVM预测误差落在第1个区间内(命题B1,1)的概率为p1,new,所述SVM预测误差落在第1个区间之外(命题B1,2)的概率为p1,new;……
[0101] 对于证据Ds,所述SVM预测误差落在第S个区间内(命题BS,1)的概率为pS,new,所述SVM预测误差落在第S个区间之外(命题BS,1)的概率为pS,new;
[0102] 对于证据DS+1,所述SVM预测误差落在分布范围区间 上(命题BS+1)的概率为1。
[0103] 由于概率为0的命题不是焦元,因此,只需对所述S+1个证据在焦元上的概率分配进行整合。设m(Αs)(s=1,2,…,S)为Αs的基本可信数,反映综合多个SBC预测结果以及所述风电功率分布范围约束得到的对元素Αs的可信数大小。根据Dempster合成法则,由多源信息得到所述SVM预测误差落在第s个区间的概率值PD,s,即所有证据的焦元之间交元素为Αs的概率之和。
[0104]
[0105] 式中,is=1,2(s=1,2,…,S);K为归一化常数, 表示直和运算;K为归一化常数,以保证 为一个m函数,K可表示为:
[0106]
[0107] 根据式(10)可以综合所有独立的SBC预测结果以及所述风电功率分布范围约束,估计得到所述SVM预测误差在所有区间上的概率分配PD=(pD,1,pD,2,…,pD,S),将所有区间上的概率进行累积可得到所述SVM预测误差e的概率分布函数 如图5所示,并得到所述SVM预测误差e的预测误差均值。
[0108] 步骤105:将每个前瞻时段的所述风电功率预测值分别与所述预测误差均值、所述预测误差概率分布相叠加,得到每个前瞻时段的风电功率预测修正值和风电功率概率分布。
[0109] 将预测得到的每个前瞻时段的所述误差概率分布函数 对应的与每个前瞻时段的所述风电功率预测值GSVM叠加,得到最终的每个前瞻时段的风电功率g的概率分布函数如图6所示。图6中,S个区间的误差离散量es由所述SVM预测误差范围平均划分为S个区间获得,风电的功率离散量gs由离散的误差值es与SVM预测均值GSVM相加得到,如式(12)所示。
[0110] es=Emin+sGunit,gs=es+GSVM    (12)
[0111] 并且,e0=Emin,g0=e0+GSVM。
[0112] 同时,将每个前瞻时段的所述风电功率预测值GSVM相应的与每个前瞻时段的所述预测误差均值,得到每个前瞻时段的风电功率预测修正值。
[0113] 利用上述提供的预测方法,本实施例利用某装机容量为74MW的风电场的NWP风速和风电功率历史数据,模拟进行前瞻T(T=48)小时的风电功率预测,进行有效性验证。
[0114] 首先将样本分为训练集、测试集和验证集三部分,分别含有1000、1000、400个样本,然后,利用训练集数据对每个前瞻时段训练构建1个SVM预测模型,利用SVM模型对测试集样本进行模拟预测,得到风电功率SVM单点预测结果以及预测误差序列;其后,将测试集产生的每个前瞻时段的风电功率预测值、所述预测误差序列以及对应的NWP数据作为训练样本,分别对S个区间上的SBC模型进行训练,总共得到T×S个SBC预测模型;最后,依据本实施提供的步骤,如图4所示的单时段预测过程图,对所述验证集中的数据进行预测,最终得到关于所述验证集样本的每个前瞻时段的风电功率均值和风电功率概率分布结果。
[0115] 下面是关于点预测精度和概率预测结果的预测效果分析:
[0116] 首先,以48小时的平均NMAE值作为点预测精度指标,将SVM方法、线性分位点回归方法与本发明方法的点预测结果进行比较,如表二所示。由表二可知,单独的SVM点预测精度高于线性分位数点回归方法,而本发明的方法较单独的SVM方法精度又有较大提高。
[0117] 表二:
[0118]方法 线性分位点回归 SVM 本发明方法
NMAE 14.69 13.18 10.86
[0119] 其次,以经验误差统计方法和线性分位点回归方法作为基准方法,与本发明的方法进行概率预测结果合理性。
[0120] 为直观说明预测效果,如图7所示,展示了单次预测结果。预测时刻为0时,对未来1-48小时的风电功率概率分布进行预测。图中带星线为实际值,带圈线为本试试方法预测值,第一色带为预测得到的风电功率概率分布的50%置信区间,第二色带为90%置信区间。
从图7中可以看出,实际值大部分时段落在50%置信区间内,极个别超过90%的置信区间之外,说明对功率的分布预测结果较为合理。
[0121] 边际校准比较:
[0122] 边际校准指标表示预测的校准度,用于评价分布预测结果和实际观测值的等价性。当预测值与实际值完全一致时,边际校准值应该为0,其值越靠近零说明分布函数预测结果越接近真实的分布函数。如图8所示,为本发明实施方法与基准方法前瞻第5小时分布预测结果的边际校准指标。图8中,MC表示边际校准指标值,理想结果为预测值等于实际值时的边际校准值。由图8可知,本发明实施方法预测得到的边际校准值较两种基准方法更接近于0,即更接近于实际结果,说明本发明实施方法所得结果更加趋近于真实分布。
[0123] 中心概率区间比较:
[0124] 衡量概率预测效果的锐度指标旨在度量分布预测的集中度,分布预测的集中度可以用预测误差区间的宽窄表示。预测误差区间越窄,说明概率预测结果的锐度越好,即概率预测的效果越好。因此,本实施例采用了较常用、相对具有代表性的50%和90%中心概率区间评估分布预测的锐度。
[0125] 本实施例方法与基准方法前瞻1-48小时的50%中心概率区间和90%中心概率区间分别如图9和图10所示。从图9和图10中可以看出,由本实施例方法预测得到的中心概率区间显著小于经验误差统计方法,并且在除前瞻1小时之外的其余时段,均小于线性分位数回归方法,体现了本实施例方法的分布预测集中度较好。风电概率预测结果越集中,对调度决策的指导意义越强。
[0126] 连续排名概率得分比较:
[0127] 连续排名概率得分指标是评价概率预测性能的综合指标,它可以同时评估分布预测结果的校准度和锐度,其值越小说明方法预测性能越好。如图11所示,为本实施例方法与两种基准方法的连续排名概率得分指标统计结果比较。由图11可知,三种方法1小时前瞻预测结果的CRPS值相当,而其余时段,本实施例方法的概率预测性能均优于两种基准方法。
[0128] 通过上述采用多种评判指标对所提出分布预测方法的校准度和锐度进行的验证。结果表明,本实施例方法摆脱了假设误差特定分布形式的局限性,可提供符合实际的概率分布预测结果。
[0129] 需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0130] 以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。