一种窃电行为的检测方法、装置、计算机设备和存储介质转让专利

申请号 : CN202111545671.2

文献号 : CN113933556B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 钟健强余沛谦李伟温硕伟黄儒罗子勉

申请人 : 广东电网有限责任公司东莞供电局

摘要 :

本发明提供了一种窃电行为的检测方法、装置、计算机设备和存储介质,该方法包括:接收多个电表检测到的涌浪电流,从涌浪电流中提取原始电流特征,对原始电流特征进行主成分分析,以降维为目标电流特征,根据样本电流特征将窃电行为的窃电类型相同的样本用电户划分至同一个样本用户簇,针对每个K值,根据目标电流特征、样本电流特征对目标用电户、样本用电户进行K均值聚类,得到K个目标用户簇,根据样本用电户的分布信息计算样本用户簇与目标用户簇之间的相似度,根据相似度与目标用电户的分布信息检测目标用户簇的有效性,若目标用户簇有效,则在目标用户簇中依据样本用电户检测发生窃电行为的目标用电户,保证对目标用电户检测窃电的准确性。

权利要求 :

1.一种窃电行为的检测方法,其特征在于,包括:接收多个电表检测到的涌浪电流,所述电表安装在目标用电户的场所中;

从所述涌浪电流中提取原始电流特征;

对所述原始电流特征进行主成分分析,以降维为目标电流特征;

获取格式与所述目标电流特征相同的样本电流特征,所述样本电流特征关联发生窃电行为的样本用电户;

根据所述样本电流特征将所述窃电行为的窃电类型相同的所述样本用电户划分至同一个样本用户簇;

设置多个K值;

针对每个所述K值,根据所述目标电流特征和所述样本电流特征对所述目标用电户和所述样本用电户进行K均值聚类,得到K个目标用户簇;

根据所述样本用电户的分布信息计算所述样本用户簇与所述目标用户簇之间的相似度;

根据所述相似度与所述目标用电户的分布信息检测所述目标用户簇的有效性;

若所述目标用户簇有效,则在所述目标用户簇中依据所述样本用电户检测发生窃电行为的所述目标用电户。

2.根据权利要求1所述的方法,其特征在于,所述从所述涌浪电流中提取原始电流特征,包括:

将第一时间周期划分为多个第二时间周期;

在每个所述第二时间周期内生成标记,所述标记表示是否接收到所述涌浪电流;

若所述标记表示接收到所述涌浪电流,则统计接收所述涌浪电流的频次;

对所述涌浪电流分别统计最大值、最小值和平均值;

若所述标记表示未接收到所述涌浪电流,则将接收所述涌浪电流的频次设置为指定的数值;

将所述涌浪电流的最大值、最小值和平均值均设置为指定的数值;

将所述第二时间周期内的所述标记、所述频次、所述最大值、所述最小值和所述平均值组合为原始字符串;

将所述第一时间周期内的所有所述原始字符串组成原始电流特征。

3.根据权利要求1所述的方法,其特征在于,所述对所述原始电流特征进行主成分分析,以降维为目标电流特征,包括:将所述原始电流特征组合成第一电流矩阵;

将所述第一电流矩阵中的每一行数据执行零均值化;

若执行所述零均值化完成,则对所述第一电流矩阵计算协方差矩阵;

计算所述协方差矩阵的特征值与特征向量;

按照所述特征值的大小对所述特征向量从上到下按行排列,并取前q行组成第二电流矩阵;

计算所述第二电流矩阵与所述第一电流矩阵之间的乘积,获得降维之后的目标电流特征。

4.根据权利要求1所述的方法,其特征在于,所述针对每个所述K值,根据所述目标电流特征和所述样本电流特征对所述目标用电户和所述样本用电户进行K均值聚类,得到K个目标用户簇,包括:

针对每个所述K值,初始化K个目标用户簇,每个所述目标用户簇中具有中心;

计算组合电流特征与所述中心之间的距离,所述组合电流特征包括所述目标电流特征和所述样本电流特征;

将组合用电户划入所述距离最小的所述目标用户簇中,所述组合用电户包括所述目标用电户和所述样本用电户;

在每个所述目标用户簇中,计算所述组合用电户的所述组合电流特征的平均值,以更新所述目标用户簇的中心;

判断所述中心在更新时的变化幅度是否小于或等于第一阈值;若是,则确定所述目标用户簇收敛;若否,则返回执行所述计算组合电流特征与所述中心之间的距离。

5.根据权利要求1‑4中任一项所述的方法,其特征在于,所述根据所述样本用电户的分布信息计算所述样本用户簇与所述目标用户簇之间的相似度,包括:在所述目标用户簇中统计属于各个所述窃电类型的所述样本用电户的总数量;

将所述总数量最大的所述目标用户簇设置为归属所述窃电类型的特征用户簇;

针对指定的所述窃电类型,计算所述特征用户簇与所述样本用户簇之间在所述样本用电户上的重合程度,作为所述特征用户簇与所述样本用户簇之间的相似度。

6.根据权利要求5所述的方法,其特征在于,所述针对指定的所述窃电类型,计算所述特征用户簇与所述样本用户簇之间在所述样本用电户上的重合程度,作为所述特征用户簇与所述样本用户簇之间的相似度,包括:统计所述特征用户簇中所有所述样本用电户的第一子数量;

统计所述特征用户簇中属于指定的所述窃电类型的所述样本用电户的第二子数量;

统计所述样本用户簇中属于指定的所述窃电类型的所述样本用电户的第三子数量;

将所述第一子数量依次加上所述第三子数量并减去所述第二子数量,得到目标子数量;

计算所述第二子数量与所述目标子数量之间的比值,作为所述特征用户簇与所述样本用户簇之间的相似度。

7.根据权利要求5所述的方法,其特征在于,所述根据所述相似度与所述目标用电户的分布信息检测所述目标用户簇的有效性,包括:

统计所述特征用户簇中的所述目标用电户占所有所述目标用电户的占比;

若所述相似度大于或等于第二阈值、且所述占比小于或等于第三阈值,则确定所述目标用户簇的有效;

所述在所述目标用户簇中依据所述样本用电户检测发生窃电行为的所述目标用电户,包括:

确定所述特征用户簇中的所述目标用电户发生归属所述窃电类型的窃电行为。

8.一种窃电行为的检测装置,其特征在于,包括:涌浪电流接收模块,用于接收多个电表检测到的涌浪电流,所述电表安装在目标用电户的场所中;

电流特征提取模块,用于从所述涌浪电流中提取原始电流特征;

电流特征降维模块,用于对所述原始电流特征进行主成分分析,以降维为目标电流特征;

电流特征获取模块,用于获取格式与所述目标电流特征相同的样本电流特征,所述样本电流特征关联发生窃电行为的样本用电户;

样本用户簇聚类模块,用于根据所述样本电流特征将所述窃电行为的窃电类型相同的所述样本用电户划分至同一个样本用户簇;

聚类参数设置模块,用于设置多个K值;

目标用户簇聚类模块,用于针对每个所述K值,根据所述目标电流特征和所述样本电流特征对所述目标用电户和所述样本用电户进行K均值聚类,得到K个目标用户簇;

相似度计算模块,用于根据所述样本用电户的分布信息计算所述样本用户簇与所述目标用户簇之间的相似度;

有效性检测模块,用于根据所述相似度与所述目标用电户的分布信息检测所述目标用户簇的有效性;

窃电行为检测模块,用于若所述目标用户簇有效,则在所述目标用户簇中依据所述样本用电户检测发生窃电行为的所述目标用电户。

9.一种计算机设备,其特征在于,所述计算机设备包括:一个或多个处理器;

存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1‑7中任一项所述的窃电行为的检测方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1‑7中任一项所述的窃电行为的检测方法。

说明书 :

一种窃电行为的检测方法、装置、计算机设备和存储介质

技术领域

[0001] 本发明涉及电力的技术领域,尤其涉及一种窃电行为的检测方法、装置、计算机设备和存储介质。

背景技术

[0002] 在电力行业,随着经济发展、社会用电量的增大,窃电行为越发频繁,不仅给供电企业带来损失,而且,不安全的用电行为容易造成安全事故。
[0003] 目前监测窃电行为的方式主要是考量用电户的用电量,通过自定义规则或者时序模型对用电户的用电量进行分析,从而检测是否发生窃电行为。
[0004] 用电量是用电户用电的结果,损失的信息较多,比如,同样的用电量,可能是一台空调消耗的,也可能是电饭煲与电视机共同消耗的,还可能是电暖器与电吹风消耗的,这将
会导致检测窃电行为的精确度较低。

发明内容

[0005] 本发明提出了一种窃电行为的检测方法、装置、计算机设备和存储介质,以解决使用用电户的用电量检测窃电行为的精确度较低的问题。
[0006] 第一方面,本发明实施例提供了一种窃电行为的检测方法,包括:
[0007] 接收多个电表检测到的涌浪电流,所述电表安装在目标用电户的场所中;
[0008] 从所述涌浪电流中提取原始电流特征;
[0009] 对所述原始电流特征进行主成分分析,以降维为目标电流特征;
[0010] 获取格式与所述目标电流特征相同的样本电流特征,所述样本电流特征关联发生窃电行为的样本用电户;
[0011] 根据所述样本电流特征将所述窃电行为的窃电类型相同的所述样本用电户划分至同一个样本用户簇;
[0012] 设置多个K值;
[0013] 针对每个所述K值,根据所述目标电流特征、所述样本电流特征对所述目标用电户、所述样本用电户进行K均值聚类,得到K个目标用户簇;
[0014] 根据所述样本用电户的分布信息计算所述样本用户簇与所述目标用户簇之间的相似度;
[0015] 根据所述相似度与所述目标用电户的分布信息检测所述目标用户簇的有效性;
[0016] 若所述目标用户簇有效,则在所述目标用户簇中依据所述样本用电户检测发生窃电行为的所述目标用电户。
[0017] 第二方面,本发明实施例还提供了一种窃电行为的检测装置,包括:
[0018] 涌浪电流接收模块,用于接收多个电表检测到的涌浪电流,所述电表安装在目标用电户的场所中;
[0019] 电流特征提取模块,用于从所述涌浪电流中提取原始电流特征;
[0020] 电流特征降维模块,用于对所述原始电流特征进行主成分分析,以降维为目标电流特征;
[0021] 电流特征获取模块,用于获取格式与所述目标电流特征相同的样本电流特征,所述样本电流特征关联发生窃电行为的样本用电户;
[0022] 样本用户簇聚类模块,用于根据所述样本电流特征将所述窃电行为的窃电类型相同的所述样本用电户划分至同一个样本用户簇;
[0023] 聚类参数设置模块,用于设置多个K值;
[0024] 目标用户簇聚类模块,用于针对每个所述K值,根据所述目标电流特征、所述样本电流特征对所述目标用电户、所述样本用电户进行K均值聚类,得到K个目标用户簇;
[0025] 相似度计算模块,用于根据所述样本用电户的分布信息计算所述样本用户簇与所述目标用户簇之间的相似度;
[0026] 有效性检测模块,用于根据所述相似度与所述目标用电户的分布信息检测所述目标用户簇的有效性;
[0027] 窃电行为检测模块,用于若所述目标用户簇有效,则在所述目标用户簇中依据所述样本用电户检测发生窃电行为的所述目标用电户。
[0028] 第三方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括:
[0029] 一个或多个处理器;
[0030] 存储器,用于存储一个或多个程序,
[0031] 当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的窃电行为的检测方法。
[0032] 第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的窃电行
为的检测方法。
[0033] 在本实施例中,接收多个电表检测到的涌浪电流,电表安装在目标用电户的场所中,从涌浪电流中提取原始电流特征,对原始电流特征进行主成分分析,以降维为目标电流
特征,获取格式与目标电流特征相同的样本电流特征,样本电流特征关联发生窃电行为的
样本用电户,根据样本电流特征将窃电行为的窃电类型相同的样本用电户划分至同一个样
本用户簇,设置多个K值,针对每个K值,根据目标电流特征、样本电流特征对目标用电户、样
本用电户进行K均值聚类,得到K个目标用户簇,根据样本用电户的分布信息计算样本用户
簇与目标用户簇之间的相似度,根据相似度与目标用电户的分布信息检测目标用户簇的有
效性,若目标用户簇有效,则在目标用户簇中依据样本用电户检测发生窃电行为的目标用
电户,涌浪电流是用电户用电的过程,可以在一定程度上体现用电户的用电行为本身,保留
了较为丰富的信息量,可提高特征的质量,从而可以提高聚类的准确性,再者,以样本用电
户及其样本用户簇作为先验知识,对K均值聚类的结果进行检验,不仅可以保证K均值聚类
的结果的准确性,从而保证对目标用电户检测窃电行为的准确性,而且避免手动设置K值时
人工观察K均值聚类的性能,大大减少了工作量,提高了检测的效率,降低了检测的成本,此
外,K均值聚类操作简单、计算量少,占用的资源少,可以满足对大量用电户检测窃电行为。

附图说明

[0034] 图1为本发明实施例一提供的一种窃电行为的检测方法的流程图;
[0035] 图2为本发明实施例二提供的一种窃电行为的检测装置的结构示意图;
[0036] 图3为本发明实施例三提供的一种计算机设备的结构示意图。

具体实施方式

[0037] 下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便
于描述,附图中仅示出了与本发明相关的部分而非全部结构。
[0038] 实施例一
[0039] 图1为本发明实施例一提供的一种窃电行为的检测方法的流程图,本实施例可适用于适用涌浪电流检测窃电行为的情况,该方法可以由窃电行为的检测装置来执行,该窃
电行为的检测装置可以由软件和/或硬件实现,可配置在作为服务端的计算机设备中,例
如,服务器、工作站、个人电脑,等等,具体包括如下步骤:
[0040] 步骤101、接收多个电表检测到的涌浪电流。
[0041] 在本实施例中,电表安装在目标用电户的场所中,如住宅、公寓等,电表通常安装有浪涌电流(surge current)的保护器,在该保护器中可以增加元件,用于检测浪涌电流。
[0042] 其中,浪涌电流也称为接通浪涌或输入浪涌电流,是指电源或电气设备在接通时消耗的瞬时高输入电流,即,在电源或电气设备接通瞬间,流入电源设备的峰值电流,这是
由于为电容器和电感器或变压器充电需要很高的初始电流。
[0043] 进一步而言,接通时,电源中的放电电容器提供低阻抗,当它们从零充电至最大值时,允许大电流流入电路。这些电流可能高达稳态电流的20倍。即使它仅持续约10毫秒,它
仍需要30到40个周期才能使电流稳定到正常工作值。如果没有限制,那么大电流除了会在
电源线上产生电压骤降之外,还会损坏设备,并导致由同一电源供电的其他设备发生故障。
[0044] 电表持续地检测每个目标用电户在使用电气设备时产生的涌浪电流,并将该涌浪电路的信息通过物联网等方式传输至服务端。
[0045] 步骤102、从涌浪电流中提取原始电流特征。
[0046] 在本实施例中,可以从涌浪电流中提取用于区分正常用电行为与窃电行为的特征,记为原始电流特征。
[0047] 示例性地,可以将第一时间周期(如1天)划分为多个第二时间周期(如5分钟)。
[0048] 在每个第二时间周期内生成标记,该标记表示是否接收到涌浪电流,例如,在第二时间周期接收到涌浪电流,则标记为1,在第二时间周期未接收到涌浪电流,则标记为0。
[0049] 若标记表示接收到涌浪电流,则统计在该第二时间周期内接收涌浪电流的频次。
[0050] 对涌浪电流分别统计在该第二时间周期内的最大值、最小值、平均值。
[0051] 若标记表示未接收到涌浪电流,则将在该第二时间周期内接收涌浪电流的频次设置为指定的数值,如0。
[0052] 将涌浪电流在该第二时间周期内的最大值、最小值、平均值均设置为指定的数值,如0。
[0053] 将第二时间周期内的标记、频次、最大值、最小值、平均值按照既定的方式排列,组合为原始字符串。
[0054] 将第一时间周期内的所有原始字符串按照第二时间周期的顺序首位拼接,组成原始电流特征。
[0055] 当然,上述原始电流特征只是作为示例,在实施本发明实施例时,可以根据实际情况设置其它原始电流特征,例如,对第二时间周期内的涌浪电流累加获得总电流值,对第二
时间周期内的涌浪电流计算方差,等等,本发明实施例对此不加以限制。另外,除了上述原
始电流特征外,本领域技术人员还可以根据实际需要采用其它原始电流特征,本发明实施
例对此也不加以限制。
[0056] 步骤103、对原始电流特征进行主成分分析,以降维为目标电流特征。
[0057] 原始电流特征以向量的形式表示,由于原始电流特征的维度较多,在维持原始电流特征的主要特征分量的情况下,可以通过PCA(Principal Component Analysis,主成分
分析)算法降低原始电流特征的维度,记为目标电流特征,使得目标电流特征的维度降低至
个或十的量级,从而降低运算量。
[0058] 其中,PCA通过线性变换将原始数据(原始电流特征)变换为一组各维度线性无关的表示(目标电流特征)。
[0059] 在具体实现中,假设有 条 维的原始电流特征,则可以将原始电流特征组合成矩阵,得到 行 列第一电流矩阵 。
[0060] 将第一电流矩阵 中的每一行数据执行零均值化(减去这一行的均值)。
[0061] 若执行零均值化完成,则对第一电流矩阵 计算协方差矩阵 , ,其中, 为 的转置矩阵。
[0062] 计算协方差矩阵 的特征值与特征向量,以及,按照特征值的大小对特征向量从上到下按行排列,并取前q(q为正整数)行组成新的矩阵,记为第二电流矩阵 。
[0063] 计算第二电流矩阵 与第一电流矩阵 之间的乘积,获得降维之后的目标电流特征 ,即, 。
[0064] 步骤104、获取格式与目标电流特征相同的样本电流特征。
[0065] 在本实施例中,可以预先通过其他方式(如人工甄别)筛选发生窃电行为的样本用电户,对该样本用户设置样本电流特征,即,样本电流特征关联发生窃电行为的样本用电
户。
[0066] 其中,构建样本电流特征的方式与构建目标电流特征的方式相同,使得样本电流特征的格式(如维度的数量及含义等)与构建目标电流特征的格式(如维度的数量及含义
等),即,获取安装在样本用电户的场所中多个电表检测到的涌浪电流,从涌浪电流中提取
原始电流特征,对原始电流特征进行主成分分析,以降维为样本电流特征。
[0067] 步骤105、根据样本电流特征将窃电行为的窃电类型相同的样本用电户划分至同一个样本用户簇。
[0068] 在实际应用中,窃电行为的窃电类型较多,例如,欠压法窃电,欠流法窃电,欠压法窃电有断开零线的方式窃电,欠流法窃电有表内分流窃电和相零对调窃电,等等,窃电行为
通常并非持续进行,而是有选择性地挑选部分时间段进行,使得不同窃电类型的窃电行为
会对浪涌电流产生不同的影响。
[0069] 例如,断开零线窃电是将电路的零线断开,即,电表前面和后面的零线,使得电能表的电压线圈在通电时无法按照电压线路进行回路,进而不同正常工作,这就导致电表对
用电户的用电量无法进行计量。
[0070] 又如,表内分流窃电是在流经电表的相线电流进出孔之间并联一条分流线,使得用电户在用电时,电表的电流线圈没有电流通过或有局部电流通过。
[0071] 再如,相零对调窃电是将电表中相线和零线的出入口进行对调,在断电后,将连接电表的零线改用其他零线或接地线,电表没有电流通过。
[0072] 在本实施例中,可以调用K均值(K‑Means)、谱聚类(Spectral Clustering),层次聚类(Hierarchical Clustering)等聚类算法,使用样本电流特征对样本用电户进行聚类,
将样本用电户划分至不同的样本用户簇中,这些样本用户簇可以由运维人员登录客户端人
工检查是否准确聚类,如果未准确聚类,则运维人员在客户端向服务端发出调整指令,通知
服务端在某个样本用户簇中增加样本用电户、删除样本用电户,如果准确聚类,则可以认定
同一个样本用户簇中样本用电户的窃电行为的窃电类型相同。
[0073] 步骤106、设置多个K值。
[0074] 步骤107、针对每个K值,根据目标电流特征、样本电流特征对目标用电户、样本用电户进行K均值聚类,得到K个目标用户簇。
[0075] 在本实施例中,使用K均值(K‑Means)算法对目标用电户进行聚类,K(K为正整数)值表示聚类的簇的数量,K值的选取对K均值聚类的结果(簇中包含的目标用电户)影响明
显,不同K值得到的结果不一样,如果手动设置K值,人工观察K均值聚类的结果的优劣,操作
繁琐,效率较低。
[0076] 为此,本实施例可以设置多个合理的K值,如3‑100,针对一个K值执行一次K均值聚类,得到K个目标用户簇,由于K均值聚类的计算简单,可以保证多次K均值聚类的正常执行,
将样本用电户、样本电流特征、样本用户簇作为先验知识,以先验知识作为监督,连同目标
电流特征、样本电流特征对目标用电户、样本用电户进行K均值聚类,得到K个目标用户簇,
从不同K值对应的目标用户簇中选择合适的目标用户簇。
[0077] 在本发明的一个实施例中,步骤107可以包括如下步骤:
[0078] 步骤1071、针对每个K值,初始化K个目标用户簇。
[0079] 针对每个K值执行K均值聚类时,可以初始化K个目标用户簇,每个目标用户簇中具有中心,该中心初始可以是随机设置的,也可以是选择彼此距离尽可能远的K个点作为中
心,还可以是先对数据(目标电流特征、样本电流特征)用层次聚类算法或者Canopy算法进
行聚类,得到K个簇之后,从每个簇中选择一个点,该点可以是该类簇的中心点,或者是距离
类簇中心点最近的那个点,等等,本实施例对此不加以限制。
[0080] 步骤1072、计算组合电流特征与中心之间的距离。
[0081] 在每轮训练中,将组合用电户视为一个点,使用其组合电流特征计算该点与中心之间的距离,如欧氏距离、余弦距离等。
[0082] 其中,组合用电户包括目标用电户、样本用电户,组合电流特征包括目标电流特征、样本电流特征。
[0083] 步骤1073、将组合用电户划入距离最小的目标用户簇中。
[0084] 针对既定的组合用电户,可以将该组合用电户与每个目标用户簇的中心之间的距离进行比较,选择距离最小的目标用户簇作为该组合用电户归属的目标用户簇,从而将组
合用电户划入距离最小的目标用户簇中。
[0085] 步骤1074、在每个目标用户簇中,计算组合用电户的组合电流特征计算平均值,以更新目标用户簇的中心。
[0086] 将每个组合用电户重新划分至目标用户簇中之后,每个目标用户簇包含了多个组合用电户,对多个组合用电户的组合电流特征计算平均值,作为该目标用户簇新的中心。
[0087] 步骤1078、判断中心在更新时的变化幅度是否小于或等于第一阈值;若是,则执行步骤1079,若否,则返回执行步骤1072。
[0088] 步骤1079、确定目标用户簇收敛。
[0089] 针对同一个目标用户簇,可以计算更新前的中心与更新后的中心之间的差异,作为更新时的变化幅度,将更新时的变化幅度与预设的第一阈值进行比较。
[0090] 如果更新时的变化幅度小于或等于第一阈值,表示中心更新的变化较小,可以确认目标用户簇收敛,K均值聚类完成。
[0091] 如果更新时的变化幅度大于第一阈值,表示中心更新的变化较大,可以确认目标用户簇未收敛,进入下一轮训练,重新执行步骤1072‑步骤1077,直至目标用户簇收敛。
[0092] 步骤108、根据样本用电户的分布信息计算样本用户簇与目标用户簇之间的相似度。
[0093] 样本用电户作为先验知识,具有既定的窃电类型,因此,可以对比样本用电户在目标用户簇中的分布信息与样本用电户在样本用户簇中的分布信息,从而计算样本用户簇与
目标用户簇之间的相似度,该相似度用于表征对样本用电户聚类的相似程度。
[0094] 在本发明的一个实施例中,步骤108可以包括如下步骤:
[0095] 步骤1081、在目标用户簇中统计属于各个窃电类型的样本用电户的总数量。
[0096] 在K均值聚类中,样本用电户划分在不同的目标用户簇中,划分目标用户簇的情况可能与划分样本用户簇的情况可能并不一致,同一个目标用户簇中,可以包含一个或多个
窃电类型的样本用电户。
[0097] 在本实施例中,针对每个目标用户簇中,统计该目标用户簇中不同窃电类型的样本用电户的总数量。
[0098] 步骤1082、将总数量最大的目标用户簇设置为归属窃电类型的特征用户簇。
[0099] 针对既定的窃电类型,该窃电类型下的样本用电户可能划分至不同的目标用户簇中,将不同的目标用户簇中该窃电类型下的样本用电户的总数量进行比较,从而选择总数
量最大的目标用户簇,标记该窃电类型,记为表征该窃电类型的特征用户簇。
[0100] 步骤1083、针对指定的窃电类型,计算特征用户簇与样本用户簇之间在样本用电户上的重合程度,作为特征用户簇与样本用户簇之间的相似度。
[0101] 针对既定的窃电类型,样本用电户是既定的,在先聚类为样本用户簇、在后聚类为特征用户簇,此时,可计算特征用户簇与样本用户簇之间在样本用电户上的重合程度,作为
特征用户簇与样本用户簇之间的相似度。
[0102] 在具体实现中,一方面,统计特征用户簇中所有样本用电户的第一子数量X1,该样本用电户并不区分属于何种窃电类型,以及,统计特征用户簇中属于指定的窃电类型的样
本用电户的第二子数量X2,另一方面,统计样本用户簇中属于指定的窃电类型的样本用电
户的第三子数量X3。
[0103] 将第一子数量X1依次加上第三子数量X3并减去第二子数量X2,得到目标子数量X4,即,X4=X1+X3‑X2。
[0104] 计算第二子数量与目标子数量之间的比值X2/X4,作为特征用户簇与样本用户簇之间的相似度。
[0105] 步骤109、根据相似度与目标用电户的分布信息检测目标用户簇的有效性。
[0106] 样本用户簇作为先验知识,聚类的性能得到检验,可以以样本用户簇作为参考,评估样本用户簇与目标用户簇聚之间在样本用电户分布上的相似度,从而检验目标用户簇聚
类的性能。
[0107] 此外,目标用电户中发生窃电行为与正常用电行为的存在一定规律的,这些规律以分布信息呈现,可以检验目标用户簇聚类的性能。
[0108] 因此,本实施例可以结合样本用户簇与目标用户簇聚之间在样本用电户分布上的相似度、目标用电户的分布信息检测目标用户簇的有效性,即,检测检测目标用户簇是有效
还是无效。
[0109] 在具体实现中,在确定特征用户簇之后,可以统计特征用户簇中的目标用电户占所有目标用电户的占比。
[0110] 分别将相似度与预设的第二阈值进行比较、将占比与预设的第三阈值进行比较。
[0111] 若相似度大于或等于第二阈值、且占比小于或等于第三阈值,则确定目标用户簇有效。
[0112] 若相似度小于第二阈值、或占比大于第三阈值,则确定目标用户簇无效。
[0113] 步骤110、若目标用户簇有效,则在目标用户簇中依据样本用电户检测发生窃电行为的目标用电户。
[0114] 针对有效的聚类结果(K个目标用户簇),可以以样本用户簇作为参考,在目标用户簇中依据样本用电户检测发生窃电行为的目标用电户。
[0115] 在具体实现中,在确定特征用户簇之后,可以确定特征用户簇中的目标用电户发生归属特征用户簇对应窃电类型的窃电行为。
[0116] 在本实施例中,接收多个电表检测到的涌浪电流,电表安装在目标用电户的场所中,从涌浪电流中提取原始电流特征,对原始电流特征进行主成分分析,以降维为目标电流
特征,获取格式与目标电流特征相同的样本电流特征,样本电流特征关联发生窃电行为的
样本用电户,根据样本电流特征将窃电行为的窃电类型相同的样本用电户划分至同一个样
本用户簇,设置多个K值,针对每个K值,根据目标电流特征、样本电流特征对目标用电户、样
本用电户进行K均值聚类,得到K个目标用户簇,根据样本用电户的分布信息计算样本用户
簇与目标用户簇之间的相似度,根据相似度与目标用电户的分布信息检测目标用户簇的有
效性,若目标用户簇有效,则在目标用户簇中依据样本用电户检测发生窃电行为的目标用
电户,涌浪电流是用电户用电的过程,可以在一定程度上体现用电户的用电行为本身,保留
了较为丰富的信息量,可提高特征的质量,从而可以提高聚类的准确性,再者,以样本用电
户及其样本用户簇作为先验知识,对K均值聚类的结果进行检验,不仅可以保证K均值聚类
的结果的准确性,从而保证对目标用电户检测窃电行为的准确性,而且避免手动设置K值时
人工观察K均值聚类的性能,大大减少了工作量,提高了检测的效率,降低了检测的成本,此
外,K均值聚类操作简单、计算量少,占用的资源少,可以满足对大量用电户检测窃电行为。
[0117] 需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依
据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该
知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施
例所必须的。
[0118] 实施例二
[0119] 图2为本发明实施例二提供的一种窃电行为的检测装置的结构框图,具体可以包括如下模块:
[0120] 涌浪电流接收模块201,用于接收多个电表检测到的涌浪电流,所述电表安装在目标用电户的场所中;
[0121] 电流特征提取模块202,用于从所述涌浪电流中提取原始电流特征;
[0122] 电流特征降维模块203,用于对所述原始电流特征进行主成分分析,以降维为目标电流特征;
[0123] 电流特征获取模块204,用于获取格式与所述目标电流特征相同的样本电流特征,所述样本电流特征关联发生窃电行为的样本用电户;
[0124] 样本用户簇聚类模块205,用于根据所述样本电流特征将所述窃电行为的窃电类型相同的所述样本用电户划分至同一个样本用户簇;
[0125] 聚类参数设置模块206,用于设置多个K值;
[0126] 目标用户簇聚类模块207,用于针对每个所述K值,根据所述目标电流特征、所述样本电流特征对所述目标用电户、所述样本用电户进行K均值聚类,得到K个目标用户簇;
[0127] 相似度计算模块208,用于根据所述样本用电户的分布信息计算所述样本用户簇与所述目标用户簇之间的相似度;
[0128] 有效性检测模块209,用于根据所述相似度与所述目标用电户的分布信息检测所述目标用户簇的有效性;
[0129] 窃电行为检测模块210,用于若所述目标用户簇有效,则在所述目标用户簇中依据所述样本用电户检测发生窃电行为的所述目标用电户。
[0130] 在本发明的一个实施例中,所述电流特征提取模块202还用于:
[0131] 将第一时间周期划分为多个第二时间周期;
[0132] 在每个所述第二时间周期内生成标记,所述标记表示是否接收到所述涌浪电流;
[0133] 若所述标记表示接收到所述涌浪电流,则统计接收所述涌浪电流的频次;
[0134] 对所述涌浪电流分别统计最大值、最小值、平均值;
[0135] 若所述标记表示未接收到所述涌浪电流,则将接收所述涌浪电流的频次设置为指定的数值;
[0136] 将所述涌浪电流的最大值、最小值、平均值均设置为指定的数值;
[0137] 将所述第二时间周期内的所述标记、所述频次、所述最大值、所述最小值、所述平均值组合为原始字符串;
[0138] 将所述第一时间周期内的所有所述原始字符串组成原始电流特征。
[0139] 在本发明的一个实施例中,所述电流特征降维模块203还用于:
[0140] 将所述原始电流特征组合成第一电流矩阵;
[0141] 将所述第一电流矩阵中的每一行数据执行零均值化;
[0142] 若执行所述零均值化完成,则对所述第一电流矩阵计算协方差矩阵;
[0143] 计算所述协方差矩阵的特征值与特征向量;
[0144] 按照所述特征值的大小对所述特征向量从上到下按行排列,并取前q行组成第二电流矩阵;
[0145] 计算所述第二电流矩阵与所述第一电流矩阵之间的乘积,获得降维之后的目标电流特征。
[0146] 在本发明的一个实施例中,所述目标用户簇聚类模块207还用于:
[0147] 针对每个所述K值,初始化K个目标用户簇,每个所述目标用户簇中具有中心;
[0148] 计算组合电流特征与所述中心之间的距离,所述组合电流特征包括所述目标电流特征、所述样本电流特征;
[0149] 将组合用电户划入所述距离最小的所述目标用户簇中,所述组合用电户包括所述目标用电户、所述样本用电户;
[0150] 在每个所述目标用户簇中,计算所述组合用电户的所述组合电流特征计算平均值,以更新所述目标用户簇的中心;
[0151] 判断所述中心在更新时的变化幅度是否小于或等于第一阈值;若是,则确定所述目标用户簇收敛;若否,则返回执行所述计算组合电流特征与所述中心之间的距离。
[0152] 在本发明的一个实施例中,所述相似度计算模块208还用于:
[0153] 在所述目标用户簇中统计属于各个所述窃电类型的所述样本用电户的总数量;
[0154] 将所述总数量最大的所述目标用户簇设置为归属所述窃电类型的特征用户簇;
[0155] 针对指定的所述窃电类型,计算所述特征用户簇与所述样本用户簇之间在所述样本用电户上的重合程度,作为所述特征用户簇与所述样本用户簇之间的相似度。
[0156] 在本发明的一个实施例中,所述相似度计算模块208还用于:
[0157] 统计所述特征用户簇中所有所述样本用电户的第一子数量;
[0158] 统计所述特征用户簇中属于指定的所述窃电类型的所述样本用电户的第二子数量;
[0159] 统计所述样本用户簇中属于指定的所述窃电类型的所述样本用电户的第三子数量;
[0160] 将所述第一子数量依次加上所述第三子数量并减去所述第二子数量,得到目标子数量;
[0161] 计算所述第二子数量与所述目标子数量之间的比值,作为所述特征用户簇与所述样本用户簇之间的相似度。
[0162] 在本发明的一个实施例中,所述有效性检测模块209还用于:
[0163] 统计所述特征用户簇中的所述目标用电户占所有所述目标用电户的占比;
[0164] 若所述相似度大于或等于第二阈值、且所述占比小于或等于第三阈值,则确定所述目标用户簇的有效;
[0165] 在本发明的一个实施例中,所述窃电行为检测模块210还用于:
[0166] 确定所述特征用户簇中的所述目标用电户发生归属所述窃电类型的窃电行为。
[0167] 本发明实施例所提供的窃电行为的检测装置可执行本发明任意实施例所提供的窃电行为的检测方法,具备执行方法相应的功能模块和有益效果。
[0168] 实施例三
[0169] 图3为本发明实施例三提供的一种计算机设备的结构示意图。图3示出了适于用来实现本发明实施方式的示例性计算机设备12的框图。图3显示的计算机设备12仅仅是一个
示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0170] 如图3所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件
(包括系统存储器28和处理单元16)的总线18。
[0171] 总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举
例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)
总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
[0172] 计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
[0173] 系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可
移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不
可移动的、非易失性磁介质(图3未显示,通常称为“硬盘驱动器”)。尽管图3中未示出,可以
提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性
光盘(例如CD‑ROM, DVD‑ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动
器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产
品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各
实施例的功能。
[0174] 具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及
程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常
执行本发明所描述的实施例中的功能和/或方法。
[0175] 计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使
得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解
调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可
以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网
络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通
信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括
但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器
以及数据备份存储系统等。
[0176] 处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的窃电行为的检测方法。
[0177] 实施例四
[0178] 本发明实施例四还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述窃电行为的检测方法的各个过程,且
能达到相同的技术效果,为避免重复,这里不再赘述。
[0179] 其中,计算机可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非
穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储
器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁
盘只读存储器(CD‑ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件
中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行
系统、装置或者器件使用或者与其结合使用。
[0180] 注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、
重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行
了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还
可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。