一种反窃电智能分析方法及系统转让专利

申请号 : CN202110599614.6

文献号 : CN113222624B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 焦赞锋张君玮邹佳章进军钱文雍

申请人 : 江苏新智合电力技术有限公司

摘要 :

本发明涉及一种数据分析的技术领域,公开了一种反窃电智能分析方法,包括:获取电力用户用电历史数据,对电力用户用电历史数据进行缺失值处理以及归一化处理的预处理,得到预处理完成的用户用电数据;根据预处理完成的用户用电数据,利用基于局部密度的聚类算法对用户进行分类;对于不同类别的用户,利用特征提取算法分别提取用户的用电特征;利用特征选择算法确定不同用电特征的权重,并为不同的用电特征进行赋权处理;将赋权后的用电特征作为输入,输入到窃电行为检测模型中,利用窃电行为检测模型对用电特征进行检测,得到具有窃电行为的电力用户。本发明还提供了一种反窃电智能分析系统。本发明实现了窃电行为检测。

权利要求 :

1.一种反窃电智能分析方法,其特征在于,所述方法包括:S1:获取电力用户用电历史数据,对电力用户用电历史数据进行缺失值处理以及归一化处理的预处理,得到预处理完成的用户用电数据,其中所述对电力用户用电历史数据进行缺失值处理以及归一化处理的预处理,包括:

1)利用拉格朗日插值法对每位电力用户的用电历史数据进行缺失值处理:其中:

L(x)为缺失值数据项x的填充数据;

x表示缺失值数据项;

xi,xj表示非缺失数据项;

n表示缺失值数据项在用电数据时间序列的坐标位置;

2)对缺失值处理后的用电数据时间序列进行归一化处理,所述归一化处理公式为:其中:

xi'表示缺失值处理后属性i的原始数据;

表示属性i原始数据的最小值;

表示属性i原始数据的最大值;

S2:根据预处理完成的用户用电数据利用基于局部密度的聚类算法对用户进行分类,所述利用基于局部密度的聚类算法对用户进行分类包括:

1)设置用户分类数为K;

2)利用欧式距离法计算不同用户用电数据序列矩阵的距离dij,其中dij表示用户用电数据序列矩阵Xi和用户用电数据序列矩阵Xj之间的距离;

3)对于每个用户用电数据序列矩阵Xi,计算其局部密度ρi和距离εi:εi=max(dij)

其中:

c表示距离参数,将其设置为2;

4)构建用户的相似度矩阵:其中:

σ表示尺度参数;

5)计算聚类中心点:

Ci=εi≥2σ(εi)

C′i=Ci≥μ(ρi)

其中:

σ(εi)表示距离εi的标准差;

μ(ρi)表示密度ρi的均值;

Ci表示期望的聚类中心点;

C′i表示最终的聚类中心点;

6)计算每个用户用电数据序列矩阵Xi的ρi*εi,选取其中最大的K个用户用电数据序列矩阵作为聚类中心,并计算其余用户用电数据序列矩阵到聚类中心的距离,依照最小平方差准则分派各用户用电数据序列矩阵;

S3:对于不同类别的用户,利用特征提取算法分别提取用户的用电特征;

S4:利用特征选择算法确定不同用电特征的权重,并为不同的用电特征进行赋权处理;

S5:将赋权后的用电特征作为输入,输入到窃电行为检测模型中,利用窃电行为检测模型对用电特征进行检测,得到具有窃电行为的电力用户;并对所检测到具有窃电行为的电力用户的同类用户进行人工核查,其中所述利用窃电行为检测模型对用电特征进行检测,得到具有窃电行为的电力用户,包括:将赋权后的用户用电特征Y={Y1,Y2,…,Yi,…}作为窃电行为检测模型的输入,其中,Yi表示用户i的用户用电赋权特征;

所述窃电行为检测模型对窃电行为进行检测的流程为:

1)从Y={Y1,Y2,…,Yi,…}中随机选取M个样本特征构成样本数据集Y′,并将Y′放入孤立树的根节点;

2)对于所述根节点,从根节点的四种特征维度中随机选取一个特征维度,从根节点所存储样本数据集中选取特征维度的最大值和最小值之间随机产生一个切割点p;

3)以切割点p划分形成一个超平面,该超平面将当前节点存在的样本数据空间切分为2个子样本数据空间,并将维度大于p的样本点放在当前节点的右分支,小于p的样本点放在当前节点的左分支;

4)循环执行步骤2)、3),不断构造新的叶子节点,直到样本数据再无法再续分割;

5)循环执行步骤1)‑4),直到生成t棵孤立树,将t设置为3;

6)对于每个赋权后的用电特征Yi,将用电特征Yi遍历每颗孤立树,计算Yi的平均高度为h(Yi),并计算用电特征Yi的分数:其中:

N'表示孤立树的平均高度;

若S(Yi)>0.8且h(Yi)<0.2,说明用电特征Yi为异常特征,即电力用户i为窃电用户;

根据用户聚类结果,对所检测到具有窃电行为的电力用户的同类用户进行人工核查。

2.如权利要求1所述的一种反窃电智能分析方法,其特征在于,所述利用特征提取算法分别提取用户的用电特征,包括:

1)提取电力用户的电流平衡特征:其中:

Ia,Ib,Ic表示电力用户的电流时间序列数据中的三相电流序列数据;

d表示电力用户的电流平衡特征向量;

2)提取电力用户的电压平衡特征:其中:

Va,Vb,Vc表示电力用户的电压时间序列数据中的三相电压序列数据;

m表示电力用户的电压平衡特征向量;

3)提取电力用户的线路电量平衡特征k:其中:

h为电力用户的线路供电量序列数据;

∑nfh(n)表示同一区域内所有电力用户的用电量之和;

k表示电力用户的线路电量平衡特征向量;

4)以7天为一个窗口期,第i天与前7天线路电量平衡特征的平均值 第i天与前7天线路电量平衡特征的平均值 得到线路电量平衡均值特征:其中:

k′为电力用户的线路电量平衡均值特征向量。

3.如权利要求2所述的一种反窃电智能分析方法,其特征在于,所述利用特征选择算法确定不同用电特征的权重,包括:对于用户用电特征{D1,D2,…,Di,…},其中Di=(di,mi,ki,k′i),表示电力用户i的用电特征,di表示电力用户i的电流平衡特征向量,mi表示电力用户i的电压平衡特征向量,ki表示电力用户i的线路电量平衡特征向量,k′i为电力用户i的线路电量平衡均值特征向量,计算其平均间隔向量:

其中:

Mi表示Di的近邻样本集合;

建立目标函数:

其中:

w=(w1,w2,w3,w4)为权重向量,(w1,w2,w3,w4)分别为(d,m,k,k′)的权重,且w1+w2+w3+w4=1;

当函数 达到最大时,对应的权重向量即为用电特征的权重,并利用该权重向量为用电特征进行赋权处理,得到赋权后的用电特征。

4.一种反窃电智能分析系统,其特征在于,所述系统包括:数据获取装置,用于获取电力用户用电历史数据;

数据处理器,用于对电力用户用电历史数据进行缺失值处理以及归一化处理的预处理,利用基于局部密度的聚类算法对用户进行分类;

窃电行为检测装置,用于利用特征提取算法分别提取用户的用电特征,利用特征选择算法确定不同用电特征的权重,并为不同的用电特征进行赋权处理,将赋权后的用电特征作为输入,输入到窃电行为检测模型中,利用窃电行为检测模型对用电特征进行检测,得到具有窃电行为的电力用户,以实现权利要求1所述的反窃电智能分析方法。

5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有窃电行为检测程序指令,所述窃电行为检测程序指令可被一个或者多个处理器执行,以实现如权利要求1‑3任意一项所述的反窃电智能分析的实现方法的步骤。

说明书 :

一种反窃电智能分析方法及系统

技术领域

[0001] 本发明涉及数据分析的技术领域,尤其涉及一种反窃电智能分析方法及系统。

背景技术

[0002] 电力系统逐步发展稳定,智能电网日渐完善,用户用电信息采集系统广泛应用。而随着用户用电信息采集系统的应用积累了大量的用户历史用电数据。这些数据为电力部门
电网规划、决策、用户用电行为分析、负荷预测等提供了强有力的数据支撑。
[0003] 为了保障电网企业的经济效益,线损治理就成了电网企业的重中之重,但如今用户窃电手法日趋科技化,且目前的窃电查处较为被动,时常出现监测不到位、发现不及时、
判断不准确的情况。
[0004] 鉴于此,如何及时检测到窃电行为,成为本领域技术人员亟待解决的问题。

发明内容

[0005] 本发明提供一种反窃电智能分析方法,利用基于局部密度的聚类算法对用户进行分类,对于不同类别的用户,分别提取用电特征,并利用特征选择算法确定不同用电特征的
权重;最后利用窃电行为检测模型对用电特征进行检测,得到具有窃电行为的电力用户。
[0006] 为实现上述目的,本发明提供的一种反窃电智能分析方法,包括:
[0007] 获取电力用户用电历史数据,对电力用户用电历史数据进行缺失值处理以及归一化处理的预处理,得到预处理完成的用户用电数据;
[0008] 根据预处理完成的用户用电数据,利用基于局部密度的聚类算法对用户进行分类;
[0009] 对于不同类别的用户,利用特征提取算法分别提取用户的用电特征;
[0010] 利用特征选择算法确定不同用电特征的权重,并为不同的用电特征进行赋权处理;
[0011] 将赋权后的用电特征作为输入,输入到窃电行为检测模型中,利用窃电行为检测模型对用电特征进行检测,得到具有窃电行为的电力用户;并对所检测到具有窃电行为的
电力用户的同类用户进行人工核查。
[0012] 可选地,所述对电力用户用电历史数据进行缺失值处理以及归一化处理的预处理,包括:
[0013] 所述电力用户用电历史数据包括电力用户的三相电流值,三相电压值,功率;在本发明一个具体实施例中,本发明在用户电表附近设置传感器,获取用户的用电历史数据,所
述用电历史数据为电流、电压以及功率的时间序列数据;
[0014] 所述数据的预处理流程为:
[0015] 1)利用拉格朗日插值法对每位电力用户的用电历史数据进行缺失值处理:
[0016]
[0017]
[0018] 其中:
[0019] L(x)为缺失值数据项x的填充数据;
[0020] x表示缺失值数据项;
[0021] xi,xj表示非缺失数据项;
[0022] n表示缺失值数据项在用电数据时间序列的坐标位置;
[0023] 2)对缺失值处理后的用电数据时间序列进行归一化处理,所述归一化处理公式为:
[0024]
[0025] 其中:
[0026] xi'表示缺失值处理后属性i的原始数据;
[0027] 表示属性i原始数据的最小值;
[0028] 表示属性i原始数据的最大值。
[0029] 可选地,所述利用基于局部密度的聚类算法对用户进行分类,包括:
[0030] 对于预处理完成的用户用电数据X={X1,X2,…,Xn},其中Xi表示第i名用户的用户用电数据序列矩阵:
[0031]
[0032] 其中:
[0033] xi,p表示第i名用户用电属性p的时间序列数据;
[0034] xi,m表示第i名用户用电属性m的时间序列数据;
[0035] 在本发明一个具体实施例中,所述用电属性包括电流、电压以及功率属性;
[0036] 根据预处理完成的用户用电数据,本发明利用基于局部密度的聚类算法对用户进行分类,所述用户分类处理流程为:
[0037] 1)设置用户分类数为K,在本发明一个具体实施例中,将K设置为10;
[0038] 2)利用欧式距离法计算不同用户用电数据序列矩阵的距离dij,其中dij表示用户用电数据序列矩阵Xi和用户用电数据序列矩阵Xj之间的距离;
[0039] 3)对于每个用户用电数据序列矩阵Xi,计算其局部密度ρi和距离εi:
[0040]
[0041]
[0042] εi=max(dij)
[0043] 其中:
[0044] c表示距离参数,在本发明一个具体实施例中,将其设置为2;
[0045] 4)构建用户的相似度矩阵:
[0046]
[0047] 其中:
[0048] σ表示尺度参数,在本发明一个具体实施例中,本发明依照不同的值进行训练测试,然后选定错误率最小的值作为参数;
[0049] 5)计算聚类中心点:
[0050] Ci=εi≥2σ(εi)
[0051] C′i=Ci≥μ(ρi)
[0052] 其中:
[0053] σ(εi)表示距离εi的标准差;
[0054] μ(ρi)表示密度ρi的均值;
[0055] Ci表示期望的聚类中心点;
[0056] C′i表示最终的聚类中心点;
[0057] 6)计算每个用户用电数据序列矩阵Xi的ρi*εi,选取其中最大的K个用户用电数据序列矩阵作为聚类中心,并计算其余用户用电数据序列矩阵到聚类中心的距离,依照最小
平方差准则分派各用户用电数据序列矩阵。
[0058] 可选地,所述利用特征提取算法分别提取用户的用电特征,包括:
[0059] 1)提取电力用户的电流平衡特征:
[0060]
[0061] 其中:
[0062] Ia,Ib,Ic表示电力用户的电流时间序列数据中的三相电流序列数据;
[0063] d表示电力用户的电流平衡特征向量;
[0064] 2)提取电力用户的电压平衡特征:
[0065]
[0066] 其中:
[0067] Va,Vb,Vc表示电力用户的电压时间序列数据中的三相电压序列数据;
[0068] m表示电力用户的电压平衡特征向量;
[0069] 3)提取电力用户的线路电量平衡特征k:
[0070]
[0071] 其中:
[0072] h为电力用户的线路供电量序列数据;
[0073] ∑nfh(n)表示同一区域内所有电力用户的用电量之和;
[0074] k表示电力用户的线路电量平衡特征向量;
[0075] 4)以7天为一个窗口期,第i天与前7天线路电量平衡特征的平均值 第i天与前7天线路电量平衡特征的平均值 得到线路电量平衡均值特征:
[0076]
[0077] 其中:
[0078] k′为电力用户的线路电量平衡均值特征向量。
[0079] 可选地,所述利用特征选择算法确定不同用电特征的权重,包括:
[0080] 对于用户用电特征{D1,D2,…,Di,…},其中Di=(di,mi,ki,k′i),表示电力用户i的用电特征,di表示电力用户i的电流平衡特征向量,mi表示电力用户i的电压平衡特征向量,
ki表示电力用户i的线路电量平衡特征向量,k′i为电力用户i的线路电量平衡均值特征向
量,计算其平均间隔向量:
[0081]
[0082] 其中:
[0083] Mi表示Di的n个近邻样本集合;
[0084] 建立目标函数:
[0085]
[0086] 其中:
[0087] w=(w1,w2,w3,w4)为权重向量,(w1,w2,w3,w4)分别为(d,m,k,k′)的权重,且w1+w2+w3+w4=1;
[0088] 当函数 达到最大时,对应的权重向量即为用电特征的权重,并利用该权重向量为用电特征进行赋权处理,得到赋权后的用电特征。
[0089] 可选地,所述利用窃电行为检测模型对用电特征进行检测,得到具有窃电行为的电力用户,包括:
[0090] 将赋权后的用户用电特征Y={Y1,Y2,…,Yi,…}作为窃电行为检测模型的输入,其中,Yi表示用户i的用户用电赋权特征;所述窃电行为检测模型对窃电行为进行检测的流程
为:
[0091] 1)从Y={Y1,Y2,…,Yi,…}中随机选取M个样本特征构成样本数据集Y′,并将Y′放入孤立树的根节点;
[0092] 2)对于所述根节点,从根节点的四种特征维度中随机选取一个特征维度,从根节点所存储样本数据集中选取特征维度的最大值和最小值之间随机产生一个切割点p;
[0093] 3)以切割点p划分形成一个超平面,该超平面将当前节点存在的样本数据空间切分为2个子样本数据空间,并将维度大于p的样本点放在当前节点的右分支,小于p的样本点
放在当前节点的左分支;
[0094] 4)循环执行步骤2)、3),不断构造新的叶子节点,直到样本数据无法在继续分割;
[0095] 5)循环执行步骤1)‑4),直到生成t棵孤立树,在本发明一个具体实施例中,将t设置为3;
[0096] 6)对于每个赋权后的用电特征Yi,将用电特征Yi遍历每颗孤立树,计算Yi的平均高度为h(Yi),并计算用电特征Yi的分数:
[0097]
[0098] 其中:
[0099] N'表示孤立树的平均高度;
[0100] 若S(Yi)>0.8且h(Yi)<0.2,说明用电特征Yi为异常特征,即电力用户i为窃电用户;
[0101] 根据用户聚类结果,本发明对所检测到具有窃电行为的电力用户的同类用户进行人工核查。
[0102] 此外,为实现上述目的,本发明还提供一种反窃电智能分析系统,所述系统包括:
[0103] 数据获取装置,用于获取电力用户用电历史数据;
[0104] 数据处理器,用于对电力用户用电历史数据进行缺失值处理以及归一化处理的预处理,利用基于局部密度的聚类算法对用户进行分类;
[0105] 窃电行为检测装置,用于利用特征提取算法分别提取用户的用电特征,利用特征选择算法确定不同用电特征的权重,并为不同的用电特征进行赋权处理,将赋权后的用电
特征作为输入,输入到窃电行为检测模型中,利用窃电行为检测模型对用电特征进行检测,
得到具有窃电行为的电力用户。
[0106] 此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有窃电行为检测程序指令,所述窃电行为检测程序指令可被一个或者多个
处理器执行,以实现如上所述的反窃电智能分析的实现方法的步骤。
[0107] 相对于现有技术,本发明提出一种反窃电智能分析方法,该技术具有以下优势:
[0108] 首先,根据窃电行为特性,本发明提出一种窃电特征提取算法,首先提取电力用户的电流平衡特征:
[0109]
[0110] 其中:Ia,Ib,Ic表示电力用户的电流时间序列数据中的三相电流序列数据;d表示电力用户的电流平衡特征向量;由于正常电流数值非常接近,三相电流的不平衡率低,而异
常用电中其中一相电流与其他两相相比数值有差别,变化趋势明显不同且三相电流不平衡
率较高,因此电流平衡特征能够反映窃电行为的发生,其值越高代表窃电行为发生的概率
越大;提取电力用户的电压平衡特征:
[0111]
[0112] 其中:Va,Vb,Vc表示电力用户的电压时间序列数据中的三相电压序列数据;m表示电力用户的电压平衡特征向量;正常情况下三相电压曲线变化趋势同步且相似,若存在在
某一相或者多相电压上有其窃电行为时,会使得三相电压间会有差异;提取电力用户的线
路电量平衡特征k:
[0113]
[0114] 其中:h为电力用户的线路供电量序列数据;∑nfh(n)表示同一区域内所有电力用户的用电量之和;k表示电力用户的线路电量平衡特征向量;其中线路电量平衡特征k也表
示线损率,线损率是指损耗的电能占电力网络供应电能的百分比,一般情况下,线损率会在
一定范围保持稳定,如果一定区域中的所属用户的线损率在一定周期内发生了异常变化,
则在该台区内的所属用户可能有窃电行为;以7天为一个窗口期,第i天与前7天线路电量平
衡特征的平均值 第i天与前7天线路电量平衡特征的平均值 得到线路电量平衡均值
特征:
[0115]
[0116] 其中:k′为电力用户的线路电量平衡均值特征向量。同时本发明利用特征选择算法确定不同用电特征的权重,所述特征选择算法流程为:对于用户用电特征{D1,D2,…,
Di,…},其中Di=(di,mi,ki,k′i),表示电力用户i的用电特征,di表示电力用户i的电流平衡
特征向量,mi表示电力用户i的电压平衡特征向量,ki表示电力用户i的线路电量平衡特征向
量,k′i为电力用户i的线路电量平衡均值特征向量,计算其平均间隔向量:
[0117]
[0118] 其中:Mi表示Di的n个近邻样本集合;建立目标函数:
[0119]
[0120] 其中:w=(w1,w2,w3,w4)为权重向量,(w1,w2,w3,w4)分别为(d,m,k,k′)的权重,且w1+w2+w3+w4=1;当函数 达到最大时,对应的权重向量即为用电特征的权重,并利用
该权重向量为用电特征进行赋权处理,得到赋权后的用电特征;相较于传统技术,本发明所
提取的用电特征能较好的反应窃电行为特性,从而可以根据用户的用电特征进行窃电用户
的识别检测。
[0121] 同时,本发明将赋权后的用户用电特征Y={Y1,Y2,…,Yi,…}作为窃电行为检测模型的输入,其中,Yi表示用户i的用户用电赋权特征;所述窃电行为检测模型对窃电行为进
行检测的流程为:从Y={Y1,Y2,…,Yi,…}中随机选取M个样本特征构成样本数据集Y′,并将
Y′放入孤立树的根节点;对于所述根节点,从根节点的四种特征维度中随机选取一个特征
维度,从根节点所存储样本数据集中选取特征维度的最大值和最小值之间随机产生一个切
割点p;以切割点p划分形成一个超平面,该超平面将当前节点存在的样本数据空间切分为2
个子样本数据空间,并将维度大于p的样本点放在当前节点的右分支,小于p的样本点放在
当前节点的左分支;循环进行样本数据切割,不断构造新的叶子节点,直到样本数据无法在
继续分割;对于每个赋权后的用电特征Yi,将用电特征Yi遍历每颗孤立树,计算Yi的平均高
度为h(Yi),并计算用电特征Yi的分数:
[0122]
[0123] 其中:N'表示孤立树的平均高度;若S(Yi)>0.8且h(Yi)<0.2,说明用电特征Yi为异常特征,即电力用户i为窃电用户;相较于传统技术,本发明提出一种结合孤立森林的窃电
行为检测模型,所述孤立树与二叉查找树结构等价,因此外部节点终止的平均高度等于二
叉查找树中失败查询的路径长度,通过将每个用户的用电特征带入独立森林中的每颗孤立
树中,通过隔离树传递测试样本,以获得每个用电特征的异常分数,相对地,其值越高代表
该用户是窃电用户的概率越大。

附图说明

[0124] 图1为本发明一实施例提供的一种反窃电智能分析方法的流程示意图;
[0125] 图2为本发明一实施例提供的一种反窃电智能分析系统的结构示意图;
[0126] 本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

[0127] 应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0128] 利用基于局部密度的聚类算法对用户进行分类,对于不同类别的用户,分别提取用电特征,并利用特征选择算法确定不同用电特征的权重;最后利用窃电行为检测模型对
用电特征进行检测,得到具有窃电行为的电力用户。参照图1所示,为本发明一实施例提供
的反窃电智能分析方法示意图。
[0129] 在本实施例中,反窃电智能分析方法包括:
[0130] S1、获取电力用户用电历史数据,对电力用户用电历史数据进行缺失值处理以及归一化处理的预处理,得到预处理完成的用户用电数据。
[0131] 首先,本发明获取电力用户用电历史数据,所述电力用户用电历史数据为时间序列数据;
[0132] 进一步地,本发明对电力用户用电历史数据进行缺失值处理以及归一化处理的预处理,所述电力用户用电历史数据包括电力用户的三相电流值,三相电压值,功率;在本发
明一个具体实施例中,本发明在用户电表附近设置传感器,获取用户的用电历史数据,所述
用电历史数据为电流、电压以及功率的时间序列数据;
[0133] 所述数据的预处理流程为:
[0134] 1)利用拉格朗日插值法对每位电力用户的用电历史数据进行缺失值处理:
[0135]
[0136]
[0137] 其中:
[0138] L(x)为缺失值数据项x的填充数据;
[0139] x表示缺失值数据项;
[0140] xi,xj表示非缺失数据项;
[0141] n表示缺失值数据项在用电数据时间序列的坐标位置;
[0142] 2)对缺失值处理后的用电数据时间序列进行归一化处理,所述归一化处理公式为:
[0143]
[0144] 其中:
[0145] xi'表示缺失值处理后属性i的原始数据;
[0146] 表示属性i原始数据的最小值;
[0147] 表示属性i原始数据的最大值。
[0148] S2、根据预处理完成的用户用电数据,利用基于局部密度的聚类算法对用户进行分类。
[0149] 进一步地,对于预处理完成的用户用电数据X={X1,X2,…,Xn},其中Xi表示第i名用户的用户用电数据序列矩阵:
[0150]
[0151] 其中:
[0152] xi,p表示第i名用户用电属性p的时间序列数据;
[0153] xi,m表示第i名用户用电属性m的时间序列数据;
[0154] 在本发明一个具体实施例中,所述用电属性包括电流、电压以及功率属性;
[0155] 根据预处理完成的用户用电数据,本发明利用基于局部密度的聚类算法对用户进行分类,所述用户分类处理流程为:
[0156] 1)设置用户分类数为K,在本发明一个具体实施例中,将K设置为10;
[0157] 2)利用欧式距离法计算不同用户用电数据序列矩阵的距离dij,其中dij表示用户用电数据序列矩阵Xi和用户用电数据序列矩阵Xj之间的距离;
[0158] 3)对于每个用户用电数据序列矩阵Xi,计算其局部密度ρi和距离εi:
[0159]
[0160]
[0161] εi=max(dij)
[0162] 其中:
[0163] c表示距离参数,在本发明一个具体实施例中,将其设置为2;
[0164] 4)构建用户的相似度矩阵:
[0165]
[0166] 其中:
[0167] σ表示尺度参数,在本发明一个具体实施例中,本发明依照不同的值进行训练测试,然后选定错误率最小的值作为参数;
[0168] 5)计算聚类中心点:
[0169] Ci=εi≥2σ(εi)
[0170] C′i=Ci≥μ(ρi)
[0171] 其中:
[0172] σ(εi)表示距离εi的标准差;
[0173] μ(ρi)表示密度ρi的均值;
[0174] Ci表示期望的聚类中心点;
[0175] C′i表示最终的聚类中心点;
[0176] 6)计算每个用户用电数据序列矩阵Xi的ρi*εi,选取其中最大的K个用户用电数据序列矩阵作为聚类中心,并计算其余用户用电数据序列矩阵到聚类中心的距离,依照最小
平方差准则分派各用户用电数据序列矩阵。
[0177] S3、对于不同类别的用户,利用特征提取算法分别提取用户的用电特征。
[0178] 进一步地,对于不同类别的用户,本发明利用特征提取算法分别提取用户的用电特征,所述特征提取算法的流程为:
[0179] 1)提取电力用户的电流平衡特征:
[0180]
[0181] 其中:
[0182] Ia,Ib,Ic表示电力用户的电流时间序列数据中的三相电流序列数据;
[0183] d表示电力用户的电流平衡特征向量;
[0184] 2)提取电力用户的电压平衡特征:
[0185]
[0186] 其中:
[0187] Va,Vb,Vc表示电力用户的电压时间序列数据中的三相电压序列数据;
[0188] m表示电力用户的电压平衡特征向量;
[0189] 3)提取电力用户的线路电量平衡特征k:
[0190]
[0191] 其中:
[0192] h为电力用户的线路供电量序列数据;
[0193] ∑nfh(n)表示同一区域内所有电力用户的用电量之和;
[0194] k表示电力用户的线路电量平衡特征向量;
[0195] 4)以7天为一个窗口期,第i天与前7天线路电量平衡特征的平均值 第i天与前7天线路电量平衡特征的平均值 得到线路电量平衡均值特征:
[0196]
[0197] 其中:
[0198] k′为电力用户的线路电量平衡均值特征向量。
[0199] S4、利用特征选择算法确定不同用电特征的权重,并为不同的用电特征进行赋权处理。
[0200] 进一步地,本发明利用特征选择算法确定不同用电特征的权重,所述特征选择算法流程为:
[0201] 对于用户用电特征{D1,D2,…,Di,…},其中Di=(di,mi,ki,k′i),表示电力用户i的用电特征,di表示电力用户i的电流平衡特征向量,mi表示电力用户i的电压平衡特征向量,
ki表示电力用户i的线路电量平衡特征向量,k′i为电力用户i的线路电量平衡均值特征向
量,计算其平均间隔向量:
[0202]
[0203] 其中:
[0204] Mi表示Di的n个近邻样本集合;
[0205] 建立目标函数:
[0206]
[0207] 其中:
[0208] w=(w1,w2,w3,w4)为权重向量,(w1,w2,w3,w4)分别为(d,m,k,k′)的权重,且w1+w2+w3+w4=1;
[0209] 当函数 达到最大时,对应的权重向量即为用电特征的权重,并利用该权重向量为用电特征进行赋权处理,得到赋权后的用电特征。
[0210] S5、将赋权后的用电特征作为输入,输入到窃电行为检测模型中,利用窃电行为检测模型对用电特征进行检测,得到具有窃电行为的电力用户;并对所检测到具有窃电行为
的电力用户的同类用户进行人工核查。
[0211] 进一步地,本发明将赋权后的用户用电特征Y={Y1,Y2,…,Yi,…}作为窃电行为检测模型的输入,其中,Yi表示用户i的用户用电赋权特征;所述窃电行为检测模型对窃电行
为进行检测的流程为:
[0212] 1)从Y={Y1,Y2,…,Yi,…}中随机选取M个样本特征构成样本数据集Y′,并将Y′放入孤立树的根节点;
[0213] 2)对于所述根节点,从根节点的四种特征维度中随机选取一个特征维度,从根节点所存储样本数据集中选取特征维度的最大值和最小值之间随机产生一个切割点p;
[0214] 3)以切割点p划分形成一个超平面,该超平面将当前节点存在的样本数据空间切分为2个子样本数据空间,并将维度大于p的样本点放在当前节点的右分支,小于p的样本点
放在当前节点的左分支;
[0215] 4)循环执行步骤2)、3),不断构造新的叶子节点,直到样本数据无法在继续分割;
[0216] 5)循环执行步骤1)‑4),直到生成t棵孤立树,在本发明一个具体实施例中,将t设置为3;
[0217] 6)对于每个赋权后的用电特征Yi,将用电特征Yi遍历每颗孤立树,计算Yi的平均高度为h(Yi),并计算用电特征Yi的分数:
[0218]
[0219] 其中:
[0220] N'表示孤立树的平均高度;
[0221] 若S(Yi)>0.8且h(Yi)<0.2,说明用电特征Yi为异常特征,即电力用户i为窃电用户;
[0222] 进一步地,根据用户聚类结果,本发明对所检测到具有窃电行为的电力用户的同类用户进行人工核查。
[0223] 下面通过一个算法实验来说明本发明的具体实施方式,并对发明的处理方法进行测试。本发明算法的硬件测试环境为:Inter(R)Core(TM)i7‑6700K  CPU,软件为
Matlab2018b;对比方法为基于贝叶斯的反窃电智能分析方法以及基于神经网络的反窃电
智能分析方法。
[0224] 在本发明所述算法实验中,数据集为10G的电力数据。本实验通过将电力数据输入到算法模型中,将窃电行为检测的准确率作为算法可行性的评价指标,其中窃电行为检测
的准确率越高,则说明算法的有效性、可行性越高。
[0225] 根据实验结果,基于贝叶斯的反窃电智能分析方法的窃电行为检测的准确率为76.31%,基于神经网络的反窃电智能分析方法的窃电行为检测的准确率为81.69%,本发
明所述方法的窃电行为检测的准确率为88.92%,相较于对比算法,本发明所提出的反窃电
智能分析方法能够实现更高的窃电行为检测的有效性。
[0226] 发明还提供一种反窃电智能分析系统。参照图2所示,为本发明一实施例提供的反窃电智能分析系统的内部结构示意图。
[0227] 在本实施例中,所述反窃电智能分析系统1至少包括数据获取装置11、数据处理器12、窃电行为检测装置13,通信总线14,以及网络接口15。
[0228] 其中,数据获取装置11可以是PC(Personal Computer,个人电脑),或者是智能手机、平板电脑、便携计算机等终端设备,也可以是一种服务器等。
[0229] 数据处理器12至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。数据处理
器12在一些实施例中可以是反窃电智能分析系统1的内部存储单元,例如该反窃电智能分
析系统1的硬盘。数据处理器12在另一些实施例中也可以是反窃电智能分析系统1的外部存
储设备,例如反窃电智能分析系统1上配备的插接式硬盘,智能存储卡(Smart Media Card,
SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,数据处理器12
还可以既包括反窃电智能分析系统1的内部存储单元也包括外部存储设备。数据处理器12
不仅可以用于存储安装于反窃电智能分析系统1的应用软件及各类数据,还可以用于暂时
地存储已经输出或者将要输出的数据。
[0230] 窃电行为检测装置13在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,包括监控单元,用于运行数
据处理器12中存储的程序代码或处理数据,例如窃电行为检测程序指令16等。
[0231] 通信总线14用于实现这些组件之间的连接通信。
[0232] 网络接口15可选的可以包括标准的有线接口、无线接口(如WI‑FI接口),通常用于在该系统1与其他电子设备之间建立通信连接。
[0233] 可选地,反窃电智能分析系统1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、
无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显
示器以及OLED(Organic Light‑Emitting Diode,有机发光二极管)触摸器等。其中,显示器
也可以适当的称为显示屏或显示单元,用于显示在反窃电智能分析系统1中处理的信息以
及用于显示可视化的用户界面。
[0234] 图2仅示出了具有组件11‑15以及反窃电智能分析系统1,本领域技术人员可以理解的是,图1示出的结构并不构成对反窃电智能分析系统1的限定,可以包括比图示更少或
者更多的部件,或者组合某些部件,或者不同的部件布置。
[0235] 在图2所示的反窃电智能分析系统1实施例中,数据处理器12中存储有窃电行为检测程序指令16;窃电行为检测装置13执行数据处理器12中存储的窃电行为检测程序指令16
的步骤,与反窃电智能分析方法的实现方法相同,在此不作类述。
[0236] 此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有窃电行为检测程序指令,所述窃电行为检测程序指令可被一个或多个处理器执
行,以实现如下操作:
[0237] 获取电力用户用电历史数据,对电力用户用电历史数据进行缺失值处理以及归一化处理的预处理,得到预处理完成的用户用电数据;
[0238] 根据预处理完成的用户用电数据,利用基于局部密度的聚类算法对用户进行分类;
[0239] 对于不同类别的用户,利用特征提取算法分别提取用户的用电特征;
[0240] 利用特征选择算法确定不同用电特征的权重,并为不同的用电特征进行赋权处理;
[0241] 将赋权后的用电特征作为输入,输入到窃电行为检测模型中,利用窃电行为检测模型对用电特征进行检测,得到具有窃电行为的电力用户;并对所检测到具有窃电行为的
电力用户的同类用户进行人工核查。
[0242] 需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包
括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的
其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制
的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品
或者方法中还存在另外的相同要素。
[0243] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下
前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做
出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个
存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,
计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
[0244] 以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技
术领域,均同理包括在本发明的专利保护范围内。