基于全网域证据集的电子式互感器可信度评估方法和装置转让专利
申请号 : CN201910909246.3
文献号 : CN110632546B
文献日 : 2021-07-02
发明人 : 黄奇峰 , 卢树峰 , 徐敏锐 , 李志新 , 杨世海 , 陈文广 , 陈刚 , 成国锋 , 周赣 , 刘西昂 , 丁俊 , 徐欣 , 陆子刚 , 程思远 , 吴桥 , 程含渺 , 尧赣东
申请人 : 国网江苏省电力有限公司电力科学研究院 , 国家电网有限公司 , 国网江苏省电力有限公司 , 东南大学 , 国网江苏省电力有限公司扬州供电分公司 , 江苏省电力试验研究院有限公司
摘要 :
权利要求 :
1.一种基于全网域证据集的电子式互感器可信度概率评估方法,其特征在于,根据电子式互感器高维数据集和聚类后的电子式互感器高维数据集的不同簇的可信度概率,对预先建立的XGBoost模型进行训练,得到训练好的XGBoost模型;
将待评估电子式互感器高维数据集,输入训练好的XGBoost模型,得到预测的可信度概率,根据预测的可信度概率判断电子式互感器是否存在计量误差;
对电子式互感器高维数据集进行聚类,具体为:对电子式互感器高维数据集进行聚类,具体为:获取电子式互感器高维数据集D,半径参数ε,密度阈值MinPts,根据上述参数,采用DBSCAN密度聚类算法,得到聚类结果;
所述半径参数ε确定过程为:
给定数据集P={p(i);i=0,1,…n},对于任意点p(i),计算点p(i)到集合S={p(0),p(1),p(2),…,p(i‑1),p(i+1),…,p(n)}中所有点之间的距离,距离按照从小到大的顺序排序,设排序后的距离集合为J={j(1),j(2),…,j(k‑1),j(k),j(k+1),…,j(n)},则j(k)被称为k‑距离;k‑距离是点p(i)到除了p(i)点之外所有点之间距离第k近的距离;对待聚类集合中每个点p(i)都计算k‑距离,得到所有点的k‑距离集合E={e(1),e(2),…,e(n)},e(n)为第n个点的k‑距离;对所有点的k‑距离集合E进行升序排序后得到排序后的k‑距离集合E’,拟合一条排序后的E’集合中k‑距离的变化曲线图,绘出曲线,将所绘曲线的斜率绝对值最大的位置所对应的k‑距离的值,确定为半径ε的值;
k的取值为密度阈值MinPts,所述密度阈值MinPts为预先设定的阈值。
2.根据权利要求1所述的一种基于全网域证据集的电子式互感器可信度概率评估方法,其特征在于,所述电子式互感器高维数据集包括环境温度、环境湿度、智能变电站空间磁场、电子式互感器运行环境振动、电子式互感器的测量电流、测量电压数据。
3.根据权利要求1所述的一种基于全网域证据集的电子式互感器可信度概率评估方法,其特征在于,所述聚类后的电子式互感器高维数据集的不同簇的可信度概率,计算方法为:
式中,P为一个簇的可信度概率,Y为一个簇中可信数据的数量,N为一个类中不可信数据的数量,比差和角差大于设定值的数据是不可信数据,比差和角差小于设定值的数据是可信数据;
所述比差和角差计算方法为:
JC=(J‑J')*60
其中,BC为比差,B为电子式互感器测量电压或电流幅值,B’为传统电磁式标准互感器电压或电流幅值;JC为角差,J为电子互感器测量电压或电流相位,J’为传统电磁式标准互感器电压或电流相位。
4.一种基于全网域证据集的电子式互感器可信度概率评估装置,其特征在于,包括:聚类模块,用于对电子式互感器高维数据集进行聚类,得到聚类后的电子式互感器高维数据集的不同簇,剔除噪声点数据;
XGBoost模型训练模块,用于根据电子式互感器高维数据集和电子式互感器高维数据集的不同簇的可信度概率,对预先建立的XGBoost模型进行训练,得到训练好的XGBoost模型;
评估模块,用于将待评估电子式互感器高维数据集,输入训练好的XGBoost模型,得到预测的可信度概率,从而判断电子式互感器是否存在计量误差;
对电子式互感器高维数据集进行聚类,具体为:获取电子式互感器高维数据集D,半径参数ε,密度阈值MinPts,根据上述参数,采用DBSCAN密度聚类算法,得到聚类结果;
所述半径参数ε确定过程为:
给定数据集P={p(i);i=0,1,…n},对于任意点p(i),计算点p(i)到集合S={p(0),p(1),p(2),…,p(i‑1),p(i+1),…,p(n)}中所有点之间的距离,距离按照从小到大的顺序排序,设排序后的距离集合为J={j(1),j(2),…,j(k‑1),j(k),j(k+1),…,j(n)},则j(k)被称为k‑距离;k‑距离是点p(i)到除了p(i)点之外所有点之间距离第k近的距离;对待聚类集合中每个点p(i)都计算k‑距离,得到所有点的k‑距离集合E={e(1),e(2),…,e(n)},e(n)为第n个点的k‑距离;对所有点的k‑距离集合E进行升序排序后得到排序后的k‑距离集合E’,拟合一条排序后的E’集合中k‑距离的变化曲线图,绘出曲线,将所绘曲线的斜率绝对值最大的位置所对应的k‑距离的值,确定为半径ε的值;
k的取值为密度阈值MinPts,所述密度阈值MinPts为预先设定的阈值。
5.根据权利要求4所述的一种基于全网域证据集的电子式互感器可信度概率评估装置,其特征在于,电子式互感器高维数据集包括环境温度、环境湿度、智能变电站空间磁场、电子式互感器运行环境振动、电子式互感器的测量电流、测量电压数据。
6.根据权利要求4所述的一种基于全网域证据集的电子式互感器可信度概率评估装置,其特征在于,所述聚类后的电子式互感器高维数据集的不同簇的可信度概率,计算方法为:
式中,P为一个簇的可信度概率,Y为一个簇中可信数据的数量,N为一个类中不可信数据的数量,比差和角差大于设定值的数据是不可信数据,比差和角差小于设定值的数据是可信数据;
所述比差和角差计算方法为:
JC=(J‑J')*60
其中,BC为比差,B为电子式互感器测量电压或电流幅值,B’为传统电磁式标准互感器电压或电流幅值;JC为角差,J为电子互感器测量电压或电流相位,J’为传统电磁式标准互感器电压或电流相位。
说明书 :
基于全网域证据集的电子式互感器可信度评估方法和装置
技术领域
背景技术
要求。由于缺乏电子式互感器计量运行态势分析及风险评估手段,制约了电子式互感器用
于数字电能计量应用的发展进程。电子式互感器计量运行态势分析及风险评估技术难点主
要体现在4个方面:一是针对电子式互感器状态分析手段,通过与传统互感器进行误差比对
的方式,难以适应电子式互感器规模化应用场景下误差状态分析;二是在无标准器的条件
下,需要采用数据分析方法分析电子式互感器运行态势,但目前国内缺乏电子式互感器计
量大数据采集、存贮相关研究,无法开展相关分析;三是缺乏电子式互感器采集数据用于数
字电能计量应用风险评估方法,无法对电子式互感器数字电能计量应用风险进行评估以及
异常状态时电量处理,导致数字电能计量应用风险难以控制;四是现有电子式互感器现场
检测设备和专用工装较少,现场检测项目和手段并不完善,难以开展在线检测工作,无法及
时发现电子式互感器误差异常,造成计量数据用于数字电能计量应用的风险进一步加大。
因此,亟需开展面向数字电能计量应用的电子式互感器计量运行态势多维度分析及风险评
估研究。
度及风险,则是数字电能计量推广应用的关键环节。
发明内容
簇,剔除噪声点数据;
互感器运行环境振动、电子式互感器的测量电流、测量电压数据。
数ε,密度阈值MinPts,根据上述参数,采用DBSCAN密度聚类算法,得到聚类结果。
顺序排序,设排序后的距离集合为J={j(1),j(2),…,j(k‑1),j(k),j(k+1),…,j(n)},则j
(k)被称为k‑距离;k‑距离是点p(i)到所有点(除了p(i)点)之间距离第k近的距离;对待聚
类集合中每个点p(i)都计算k‑距离,得到所有点的k‑距离集合E={e(1),e(2),…,e(n)},e
(n)为第n个点的k‑距离;对所有点的k‑距离集合E进行升序排序后得到排序后的k‑距离集
合E’,拟合一条排序后的E’集合中k‑距离的变化曲线图,绘出曲线,将所绘曲线的斜率绝对
值最大的位置所对应的k‑距离的值,确定为半径ε的值;
据是可信数据;
准互感器电压或电流相位。
XGBoost模型;
器运行环境振动、电子式互感器的测量电流、测量电压数据。
数ε,密度阈值MinPts,根据上述参数,采用DBSCAN密度聚类算法,得到聚类结果。
顺序排序,设排序后的距离集合为J={j(1),j(2),…,j(k‑1),j(k),j(k+1),…,j(n)},则j
(k)被称为k‑距离;k‑距离是点p(i)到所有点(除了p(i)点)之间距离第k近的距离;对待聚
类集合中每个点p(i)都计算k‑距离,得到所有点的k‑距离集合E={e(1),e(2),…,e(n)},e
(n)为第n个点的k‑距离;对所有点的k‑距离集合E进行升序排序后得到排序后的k‑距离集
合E’,拟合一条排序后的E’集合中k‑距离的变化曲线图,绘出曲线,将所绘曲线的斜率绝对
值最大的位置所对应的k‑距离的值,确定为半径ε的值;
据是可信数据;
准互感器电压或电流相位。
可信度评估方法对电子式互感器测量数据用于数字电能计量应用评估;
度。
附图说明
具体实施方式
间磁场、电子式互感器运行环境振动,负荷数据包括电子式互感器的测量电流、测量电压;
电子式互感器可以为智能变电站中的一个或多个同型号的电子式互感器;电子式互感器高
维数据集包括m条数据样本,每条数据样本包括六维特征数据。
式标准互感器电压或电流相位,单位为分。
了6个特征,因此无法可视化。被聚成一类的数据被视为属于特征相似的一类数据。
有点之间的距离,距离按照从小到大的顺序排序,假设排序后的距离集合为J={j(1),j
(2),…,j(k‑1),j(k),j(k+1),…,j(n)},则j(k)就被称为k‑距离。也就是说,k‑距离是点p
(i)到所有点(除了p(i)点)之间距离第k近的距离。对待聚类集合中每个点p(i)都计算k‑距
离,最后得到所有点的k‑距离集合E={e(1),e(2),…,e(n)},e(n)为第n个点的k‑距离。根
据得到的所有点的k‑距离集合E,对k‑距离集合E进行升序排序后得到排序后的k‑距离集合
E’,拟合一条排序后的E’集合中k‑距离的变化曲线图,绘出曲线,将所绘曲线的斜率绝对值
最大的位置所对应的k‑距离的值,确定为半径ε的值。其中,k‑距离中k的取值为密度阈值
MinPts。
都有比差和角差,即每条数据样本都有标签,比差和角差大的数据被认为是不可信数据,比
差和角差小的数据被认为是可信数据。因此,对于某一类特征相似的数据,它的可信度可用
概率P表示。每个簇中的每条数据样本都有与传统电磁式标准互感器相比对的比差和角差,
如果准确度低于国家标准的准确级0.2,即比差大于0.2%或者角差大于10’,单位分,认为
此条数据不可信。电子式互感器误差的国家标准如下表1所示,可信度概率P如式(3):
的可信度概率,输出为预测的可信度概率,对预先建立的XGBoost模型进行训练,高维数据
集聚类后的一个簇采用同一个标签,即真实的可信度概率P,70%的数据样本作为训练集,
30%的数据样本作为测试集。训练集包括6个输入特征和对应的标签,标签为可信度概率,
聚类后的噪声点剔除,不参与组成训练集;模型训练的目的就是让输出尽可能逼近标签;
预测的可信度概率P’。预测概率P’在0‑1之间,即测量数据可信则为1,测量数据不可信则为
0。
是否存在计量误差。待评估电子式互感器高维数据集包括电子式互感器的环境温度、环境
湿度、智能变电站空间磁场、电子式互感器运行环境振动、电子式互感器的测量电流、测量
电压六个维度特征;
图2为Xgboost模型预测可信度概率P’与真实结果对比图。预测可信度概率P’在0‑1之间,即
测量数据可信则为1,测量数据不可信则为0。
评估方法对电子式互感器测量数据用于数字电能计量应用评估;
度。
信度。
XGBoost模型;
器运行环境振动、电子式互感器的测量电流、测量电压数据。
数ε,密度阈值MinPts,根据上述参数,采用DBSCAN密度聚类算法,得到聚类结果。
顺序排序,设排序后的距离集合为J={j(1),j(2),…,j(k‑1),j(k),j(k+1),…,j(n)},则j
(k)被称为k‑距离;k‑距离是点p(i)到所有点(除了p(i)点)之间距离第k近的距离;对待聚
类集合中每个点p(i)都计算k‑距离,得到所有点的k‑距离集合E={e(1),e(2),…,e(n)},e
(n)为第n个点的k‑距离;对所有点的k‑距离集合E进行升序排序后得到排序后的k‑距离集
合E’,拟合一条排序后的E’集合中k‑距离的变化曲线图,绘出曲线,将所绘曲线的斜率绝对
值最大的位置所对应的k‑距离的值,确定为半径ε的值;
据是可信数据;
准互感器电压或电流相位。
施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机
可用存储介质(包括但不限于磁盘存储器、CD‑ROM、光学存储器等)上实施的计算机程序产
品的形式。
程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序
指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产
生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实
现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或
多个方框中指定的功能。
其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一
个方框或多个方框中指定的功能的步骤。
本发明的保护范围。