一种感知风险的深度学习驱动的极限传输容量调整方法转让专利
申请号 : CN202010739587.3
文献号 : CN112003735B
文献日 : 2021-11-09
发明人 : 邱高 , 刘友波 , 刘俊勇 , 邱红兵
申请人 : 四川大学
摘要 :
权利要求 :
1.一种感知风险的深度学习驱动的极限传输容量调整方法,其特征在于,包括如下步骤;
步骤一,将极限传输容量预测器嵌入到调整模型中,得到深度置信网络代理辅助的双层模型;
步骤二,构建基于深度置信网络的预测区间,并根据预测区间覆盖概率、预测区间归一化平均带宽、累计带宽偏差调整预测区间,通过集成学习训练得到训练后的预测区间;
步骤三,基于训练后的预测区间得到极限传输容量值落在区间内的概率R,根据概率R评估预防控制失败的风险概率;
步骤四,将概率R引入深度置信网络代理辅助的双层模型的目标函数中,调整极限传输容量值。
2.根据权利要求1所述的一种感知风险的深度学习驱动的极限传输容量调整方法,其特征在于,所述的预测区间构建包括;
设训练样本集 ;以及PI,得到如下公式:
通过预测区间覆盖概率、预测区间归一化平均带宽和累计带宽偏差调整预测区间;其中的预测区间覆盖概率表明训练样本集的目标被预测区间覆盖的概率,采用下式计算:其中, 是布尔变量,采用下式所示:其中的PI为预测区间, 为样本的个数, 为训练变量, 为目标变量,c为显著性水平, 为第i个训练变量, 为第i个目标变量;
累计带宽偏差用于量化训练目标偏离预测区间的上限或者下限的程度,采用下式计算:
预测区间归一化平均带宽采用如下公式计算:其中,是为正则化因子。
3.根据权利要求1所述的一种感知风险的深度学习驱动的极限传输容量调整方法,其特征在于,所述的预测区间训练包括如下过程:通过集成学习训练预测区间,调整集成基学习器的权重优化预测区间,决策变量是集成基学习器的权重,定义为 ,其中, 表示参与预测区间训练的基学习器的总和;预测区间其训练过程为以下式为目标的最优化过程:通过重要性因子 ,将多目标优化问题转化成单目标优化问题:其中的 PICP 为预测区间覆盖概率, PINAW 为预测区间归一化平均带宽, AWD为累计带宽偏差。
4.根据权利要求1所述的一种感知风险的深度学习驱动的极限传输容量调整方法,其特征在于,所述的概率R计算采用如下公式:将R引入深度置信网络代理辅助的双层模型的目标函数中,得到:其中, ; 是归一化调节成本,最优集成权重 ,c为显著性水平。
5.根据权利要求1所述的一种感知风险的深度学习驱动的极限传输容量调整方法,其特征在于,所述的将极限传输容量预测器嵌入到双层模型中,得到深度置信网络代理辅助的双层模型包括如下过程:
代理辅助的极限传输容量调整双层模型由下式表示:其中, 和 分别是控制变量向量和状态变量向量; 表示某一个具体的工况;
是发电机出力调整成本; 和 分别是等式约束和不等式约束;
表示微分代数方程; 表示基于目标特征值的安全约束,其中 为求解后的β值;
使用基于深度置信网络的目标特征值预测器 来替代下层模型,得到深度置信网络代理辅助的双层模型,如下式所示:其中, 是实际值 的预测值; 是目标值的预测值,即预测的目标特征值。
说明书 :
一种感知风险的深度学习驱动的极限传输容量调整方法
技术领域
背景技术
过于粗糙且多预想事故集并未考虑在该研究中。总的来说,目前鲜有针对TTC预防调度的安
全经济研究,因此亟需一种新方法以解决此问题。近年来,一些学者提出了一种代理辅助
(Surrogate‑assisted,SA)的优化策略。该策略使用机器学习的代理规则代替优化模型中
存在的高维非线性或者复杂微分方程约束,从而大大降低优化模型求解复杂度,非常适用
于TTC的预防控制模型。
固有误差有可能导致以经济最优为目标的TTC调控失败,系统依旧处于不稳定运行点。在此
方面,已有学者提出解决方案。如有研究提出在控制模型中加入一定裕度,使得系统运行点
更加远离临界安全点,然而该方案难以确保调控的经济性,且在实际应用中会导致优化的
收敛性降低;亦有学者提出使用集成学习将预测误差以概率进行量化,然而此方案仅针对
分类型决策树,对于机器学习方法和回归型问题的兼容性仍有待研究。
发明内容
算:
的总和;预测区间其训练过程为以下式为目标的最优化过程:
* *
分代数方程;‑β≤0表示基于目标特征值的安全约束,其中β为求解后的β值;
附图说明
具体实施方式
化,从而可能导致安全问题。为了解决这个问题,一种可行办法是利用双层模型求解,即将
TTC计算模型作为下层模型,将TTC安全约束加入到上层经济调度模型中。其中,TTC安全约
束为控制断面TTC始终大于断面传输潮流。然而,求解下层TTC计算模型时存在的收敛困难
和计算负担重得问题使得TTC调整的双层模型难以求解。因此,将TTC预测器嵌入双层模型
中以替代下层TTC计算模型是一种很有效的解决方案。该方案的框架如图2所示。
* *
分代数方程,比如暂态稳定约束等;‑β≤0表示基于TTC的安全约束,其中β是求解下层模型
而获得的,而下层模型与模型(4)等效。该模型中最后两式表明断面传输潮流应当被控制不
超过TTC值。
DBN‑SBM),如下式所示:
难以求解DBN‑SBM,因此一种新型的演化计算算法——共生生物搜索(Symbiotic
Organisms search,SOS)将用于求解该双层模型。SOS程序的流程可以归纳为如下几个步
骤:i)初始化;ii)全局进化(包括共生、共栖和寄生三个阶段);iii)终止条件。基于基础的
SOS程序,一些改进将被引入SOS中以改善其稳定性和鲁棒性。用于求解TTC调整模型的改进
后的SOS算法如下所述:
增加搜索的随机性,以防止仅在某一个局限的空间内搜索导致陷入局部最优。因此,在此阶
段SOS采用如下的共生机制:
最优,在共栖阶段将引入随机扰动项增加SOS搜索的随机性:
PV)。然后将PV与Xi进行对比,择优保留。
据驱动的预防控制决策不可靠,甚至可能造成完全错误的预防控制决策。
于潮流(如图3中右边所示)。然而,由于存在预测误差ζ,实际的TTC值(即
)低于潮流值PFl(λ′0),也就是说实际上系统并未进入安全运行域中。因此,为了防
止控制失败,系统调度员更希望采用保守的预防控制策略,同时也要兼顾一定的经济性。一
种可能的方案是直接引入正阈值刀TTC约束中,即改写TTC安全约束为 ε>0,进而
能够使得DBN‑SBM优化后得到更大的TTC值 达到补偿误差ζ的目的。然而,此
方法的问题是,由于ζ的不确定性,非常难以找到一个ε值能够刚好补偿ζ,即ε=ζ。显然地,
设定一个比较大的ε值能够保证ε>ζ是针对此问题的一个解决方案,然而,ε值增大会显而易
见地导致调节成本的增加。而且,对于不同的运行工况,ε值也需要进行重复试验确定,这会
造成额外的计算成本。总之,很难合理地制定一个能够适用于所有场景的ε值基于DBN的区
间预测技术:
和一个特定的概率100×(1‑c)%组成,其中c是显著性水平,而100×(1‑c)%是置信水平。
一化平均带宽(PI normalized average width,PINAW)和累计带宽偏差(Accumulated
width deviation,AWD)。
了构建一个信息度较高的PI,需要引入PINAW,如式(16)所示。PINAW的值越小,预测区间PI
的质量越高。
(其中,2M表示参与PIs训练的基学习器的总和)。PIs训练的目标是在给定c的情
况下构建质量最优的PIs,其训练过程可被定义为以式(17)为目标的最优化过程:
言之,PIs能够给出实际的TTC值落在区间内的概率信息,此概率信息能够进而用于评估预
防控制失败的风险。
难以求解DBN‑SBM,因此一种新型的演化计算算法——共生生物搜索(Symbiotic
Organisms search,SOS)将用于求解该双层模型。SOS程序的流程可以归纳为如下几个步
骤:i)初始化;ii)全局进化(包括共生、共栖和寄生三个阶段);iii)终止条件。基于基础的
SOS程序,一些改进将被引入SOS中以改善其稳定性和鲁棒性。用于求解TTC调整模型的改进
后的SOS算法如下所述:
增加搜索的随机性,以防止仅在某一个局限的空间内搜索导致陷入局部最优。因此,在此阶
段SOS采用如下的共生机制:
最优,在共栖阶段将引入随机扰动项增加SOS搜索的随机性:
PV)。然后将PV与Xi进行对比,择优保留。
潮流(如图中,右边坐标系的 所示),实际的TTC值仍然会以一定概率R落入不稳定域中(如
右边坐标系中,浅红色方形区域R所示)。换言之,只要计算出R的大小,就能在一定程度上感
知预防控制失败的风险概率。通过图5,R可由下式计算:
性,然而,会导致一个较高的成本。
e
Ψ进行训练和测试。每个PIs训练算法执行10次,取PIs质量指标的平均值评估各个算法的
性能;在测试样本集上测试后的结果如图6所示。
0.0098。对于基于DBN的PIs,其性能指标分别为5.1e‑3,0.6656和0.0096。对于DBN集成的
PIs,其性能指标分别为3.4e‑3,0.6191和0.0076。从这些性能指标对比可以看出,DBN集成
的PIs表现最优。因此,DBN集成的PIs将被用于可感知风险的TTC调整模型中。
制的方法——即基于PIs的可感知风险的TTC调节算法(PIs‑based risk‑aware method)和
基于ε值的预测误差补偿算法(the fixed‑εmethod)——将被用于最优地平衡调节成本和
调节风险。使用控制失败指标(the control failure index,CFI)评估所提方法的可靠性。
CFI通过下式计算:
U
先被校验。如果这些稳态约束越限,此次控制也将被视为失败,则 S表示测试的失
U
稳工况的数量。在这个算例中,通过随机抽样生成额外200个失稳工况,因此S=200。
均调节成本。如图7所示,随着更多权重偏向于降低控制失败风险,CFI降低但同时 升高。值
得注意的是,当α=0时,可感知风险的方法等效于以成本为主导的DBN‑SBM,因此此时调节
策略成本最低(即$700.12),但控制失败风险达到了11.5%,表示这种控制策略对于实际的
预防控制来说过于风险。当α提升至0.25时,CFI首次达到了可接受的值,即CFI=1.5%<
2%,同时 升高至$1,888.99。通过提升α至1,以风险为主导的模型将导致系统运行在过于
保守的运行点。虽然CFI达到了1.5%,但成本过高,达到了$8,017.86,表明此策略不可行。
因此,为了制定一个成本和风险均较低的策略,在区间[0.2,0.5]内选择α比较合适。此外,
值得指出的是,因为在一些极端OC下,发电机的可调节容量严重不足,以至于仅通过发电机
重调度无法维持系统稳定,所以CFI无法达到0%。
法仅能达到最低3%的CFI,相比于可感知风险的方法高了1.5%。此外,当ε值从0.1p.u.增
加到0.5p.u.时,CFI没有降低,反而从3%增长到8.5%。我们也发现当ε值高于0.1p.u.时,
大部分优化程序难以收敛。也就是说,设定一个较高的ε值会导致误差补偿方法收敛性降
低,但是设定一个较小的ε值又无法保证TTC调节的成功。换而言之,选择一个最优的ε值亦
需要通过试验或者优化,这将带来额外的计算负担。假定已经获得了最优的ε值,误差补偿
方法依旧难以达到比可感知风险方法更优的CFI指标。总的来说,可感知风险的方法在保守
性调节TTC方面的表现优于误差补偿的方法。图9给出了两种方法在经济性方面的优劣比
较,以及成本和风险的灵敏度。
相对降低了$301.27。因此,可感知风险方法在经济性方面的表现也由于误差补偿的方法。
文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进
行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围
内。