谐波数据识别方法、装置、计算机设备和存储介质转让专利

申请号 : CN202211533808.7

文献号 : CN115563477B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李胜郑楷洪周尚礼龚起航曾璐琨刘玉仙

申请人 : 南方电网数字电网研究院有限公司

摘要 :

本申请涉及一种谐波数据识别方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:对量测终端的谐波含有率曲线进行分类处理,得到对应的类别为典型类别的谐波含有率典型曲线;根据所述谐波含有率典型曲线对应的量测终端的行业类型,对所述谐波含有率典型曲线进行聚类处理,得到所述谐波含有率典型曲线对应的谐波含有率数据域;对所述谐波含有率数据域中的各个谐波含有率数据进行局部离群识别,得到所述各个谐波含有率数据的离群识别结果;根据所述各个谐波含有率数据的离群识别结果,确定所述谐波含有率曲线的识别结果。采用本方法能够提高对不同行业量测终端的谐波数据的识别准确率。

权利要求 :

1.一种谐波数据识别方法,其特征在于,所述方法包括:

在多个目标时间段,按照预设采样频率采集量测终端的谐波数据;

对所述谐波数据的谐波分量的均方根值与基波分量的均方根值进行比值处理,得到所述量测终端在多个目标时间段下的谐波含有率数据;所述谐波含有率数据用于绘制所述量测终端的谐波含有率曲线;

对所述量测终端的谐波含有率曲线进行分类处理,得到对应的类别为典型类别的谐波含有率典型曲线;

根据所述谐波含有率典型曲线对应的量测终端的行业类型,对所述谐波含有率典型曲线进行聚类处理,得到每个行业类型的谐波含有率典型曲线对应的谐波含有率数据域;

对所述谐波含有率数据域中的各个谐波含有率数据进行局部离群识别,得到所述各个谐波含有率数据的离群识别结果;

根据所述各个谐波含有率数据的离群识别结果,统计每个所述目标时间段内的离群识别结果为离群类别的谐波含有率数据的数量;

在每个所述目标时间段内的离群类别的数量均超过预设数量阈值的情况下,确认所述量测终端的谐波含有率曲线的识别结果为异常,则所述量测终端的谐波数据也为异常;反之,确认所述量测终端的谐波含有率曲线的识别结果为正常,则所述量测终端的谐波数据也为正常;

所述对量测终端的谐波含有率曲线进行分类处理,得到对应的类别为典型类别的谐波含有率典型曲线,包括:获取分类处理半径和最小谐波数量;

根据所述分类处理半径和所述最小谐波数量,从所述谐波含有率曲线中,筛选得到第一聚类中心和边界点;

根据所述第一聚类中心和所述边界点,对除了所述第一聚类中心和所述边界点以外的谐波含有率曲线进行聚类处理,得到所述谐波含有率曲线的分类结果,并获取所述分类结果中对应的类别为典型类型的谐波含有率典型曲线。

2.根据权利要求1所述的方法,其特征在于,所述对所述谐波含有率数据域中的各个谐波含有率数据进行局部离群识别,得到所述各个谐波含有率数据的离群识别结果,包括:根据所述各个谐波含有率数据对应的行业类型,从所述谐波含有率数据域中,确定出与所述各个谐波含有率数据对应的行业类型相同的目标谐波含有率数据;

根据所述各个谐波含有率数据与所述各个谐波含有率数据对应的目标谐波含有率数据之间的高斯距离,得到所述各个谐波含有率数据的距离邻域;

根据所述各个谐波含有率数据的距离邻域,计算得到所述各个谐波含有率数据的局部离群因子;

根据所述各个谐波含有率数据的局部离群因子,对所述各个谐波含有率数据进行离群识别,得到所述各个谐波含有率数据的离群识别结果。

3.根据权利要求1所述的方法,其特征在于,所述根据所述谐波含有率典型曲线对应的量测终端的行业类型,对所述谐波含有率典型曲线进行聚类处理,得到每个行业类型的谐波含有率典型曲线对应的谐波含有率数据域,包括:获取预设聚类数量;

从所述谐波含有率典型曲线中,获取所述预设聚类数量的谐波含有率典型曲线,作为第二聚类中心;

根据所述第二聚类中心对应的量测终端的行业类型,对所述谐波含有率典型曲线进行聚类处理,得到所述每个行业类型的谐波含有率典型曲线对应的谐波含有率数据域。

4.根据权利要求1至3任意一项所述的方法,其特征在于,在所述对量测终端的谐波含有率曲线进行分类处理,得到对应的类别为典型类别的谐波含有率典型曲线之前,还包括:按照预设采样频率,采集得到所述量测终端在所述目标时间段下的谐波数据;

根据所述谐波数据,计算得到所述量测终端的谐波含有率曲线。

5.一种谐波数据识别装置,其特征在于,所述装置包括:

在多个目标时间段,按照预设采样频率采集量测终端的谐波数据;对所述谐波数据的谐波分量的均方根值与基波分量的均方根值进行比值处理,得到所述量测终端在多个目标时间段下的谐波含有率数据;所述谐波含有率数据用于绘制所述量测终端的谐波含有率曲线;

曲线分类模块,用于对所述量测终端的谐波含有率曲线进行分类处理,得到对应的类别为典型类别的谐波含有率典型曲线;

曲线聚类模块,用于根据所述谐波含有率典型曲线对应的量测终端的行业类型,对所述谐波含有率典型曲线进行聚类处理,得到每个行业类型的谐波含有率典型曲线对应的谐波含有率数据域;

离群识别模块,用于对所述谐波含有率数据域中的各个谐波含有率数据进行局部离群识别,得到所述各个谐波含有率数据的离群识别结果;

谐波识别模块,用于根据所述各个谐波含有率数据的离群识别结果,统计每个所述目标时间段内的离群识别结果为离群类别的谐波含有率数据的数量;在每个所述目标时间段内的离群类别的数量均超过预设数量阈值的情况下,确认所述量测终端的谐波含有率曲线的识别结果为异常,则所述量测终端的谐波数据也为异常;反之,确认所述量测终端的谐波含有率曲线的识别结果为正常,则所述量测终端的谐波数据也为正常;

所述曲线分类模块,还用于获取分类处理半径和最小谐波数量;根据所述分类处理半径和所述最小谐波数量,从所述谐波含有率曲线中,筛选得到第一聚类中心和边界点;根据所述第一聚类中心和所述边界点,对除了所述第一聚类中心和所述边界点以外的谐波含有率曲线进行聚类处理,得到所述谐波含有率曲线的分类结果,并获取所述分类结果中对应的类别为典型类型的谐波含有率典型曲线。

6.根据权利要求5所述的装置,其特征在于,所述离群识别模块,还用于根据所述各个谐波含有率数据对应的行业类型,从所述谐波含有率数据域中,确定出与所述各个谐波含有率数据对应的行业类型相同的目标谐波含有率数据;根据所述各个谐波含有率数据与所述各个谐波含有率数据对应的目标谐波含有率数据之间的高斯距离,得到所述各个谐波含有率数据的距离邻域;根据所述各个谐波含有率数据的距离邻域,计算得到所述各个谐波含有率数据的局部离群因子;根据所述各个谐波含有率数据的局部离群因子,对所述各个谐波含有率数据进行离群识别,得到所述各个谐波含有率数据的离群识别结果。

7.根据权利要求5所述的装置,其特征在于,所述曲线聚类模块,还用于获取预设聚类数量;从所述谐波含有率典型曲线中,获取所述预设聚类数量的谐波含有率典型曲线,作为第二聚类中心;根据所述第二聚类中心对应的量测终端的行业类型,对所述谐波含有率典型曲线进行聚类处理,得到所述每个行业类型的谐波含有率典型曲线对应的谐波含有率数据域。

8.根据权利要求5所述的装置,其特征在于,所述谐波数据识别装置还包括谐波采集模块,用于按照预设采样频率,采集得到所述量测终端在所述目标时间段下的谐波数据;根据所述谐波数据,计算得到所述量测终端的谐波含有率曲线。

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述的方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。

说明书 :

谐波数据识别方法、装置、计算机设备和存储介质

技术领域

[0001] 本申请涉及大数据技术领域,特别是涉及一种谐波数据识别方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术

[0002] 随着电力系统的建设工作开展,有越来越多的新能源电力设备持续接入电力系统,这也将导致谐波数据异常的负面影响会更为严重。
[0003] 传统技术中,主要是通过机器学习模型对谐波数据进行异常识别,然而当前电力系统中的量测终端的所属行业的类型和数量繁多,机器学习模型仅能有效识别出单一类型的量测终端的谐波数据异常,由此,存在对不同行业的量测终端的谐波数据识别准确率较低的问题。

发明内容

[0004] 基于此,有必要针对上述技术问题,提供一种能够提高对不同行业量测终端的谐波数据的识别准确率的谐波数据识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005] 第一方面,本申请提供了一种谐波数据识别方法。所述方法包括:
[0006] 对量测终端的谐波含有率曲线进行分类处理,得到对应的类别为典型类别的谐波含有率典型曲线;
[0007] 根据所述谐波含有率典型曲线对应的量测终端的行业类型,对所述谐波含有率典型曲线进行聚类处理,得到所述谐波含有率典型曲线对应的谐波含有率数据域;
[0008] 对所述谐波含有率数据域中的各个谐波含有率数据进行局部离群识别,得到所述各个谐波含有率数据的离群识别结果;
[0009] 根据所述各个谐波含有率数据的离群识别结果,确定所述谐波含有率曲线的识别结果。
[0010] 在其中一个实施例中,对所述谐波含有率数据域中的各个谐波含有率数据进行局部离群识别,得到所述各个谐波含有率数据的离群识别结果,包括:
[0011] 根据所述各个谐波含有率数据对应的行业类型,从所述谐波含有率数据域中,确定出与所述各个谐波含有率数据对应的行业类型相同的目标谐波含有率数据;
[0012] 根据所述各个谐波含有率数据与所述各个谐波含有率数据对应的目标谐波含有率数据之间的高斯距离,得到所述各个谐波含有率数据的距离邻域;
[0013] 根据所述各个谐波含有率数据的距离邻域,计算得到所述各个谐波含有率数据的局部离群因子;
[0014] 根据所述各个谐波含有率数据的局部离群因子,对所述各个谐波含有率数据进行离群识别,得到所述各个谐波含有率数据的离群识别结果。
[0015] 在其中一个实施例中,根据所述各个谐波含有率数据的离群识别结果,确定所述谐波含有率曲线的识别结果,包括:
[0016] 获取所述离群识别结果中被识别为离群数据的谐波含有率数据的数量;
[0017] 在所述数量满足预设异常数量条件的情况下,确认所述谐波含有率曲线的识别结果为异常。
[0018] 在其中一个实施例中,对量测终端的谐波含有率曲线进行分类处理,得到对应的类别为典型类别的谐波含有率典型曲线,包括:
[0019] 获取分类处理半径和最小谐波数量;
[0020] 根据所述分类处理半径和所述最小谐波数量,从所述谐波含有率曲线中,筛选得到第一聚类中心;
[0021] 根据所述第一聚类中心,对所述谐波含有率曲线进行聚类处理,得到所述谐波含有率曲线的分类结果,并获取所述分类结果中对应的类别为典型类型的谐波含有率典型曲线。
[0022] 在其中一个实施例中,根据所述谐波含有率典型曲线对应的量测终端的行业类型,对所述谐波含有率典型曲线进行聚类处理,得到所述谐波含有率典型曲线对应的谐波含有率数据域,包括:
[0023] 获取预设聚类数量;
[0024] 从所述谐波含有率典型曲线中,获取所述预设聚类数量的谐波含有率典型曲线,作为第二聚类中心;
[0025] 根据所述第二聚类中心对应的量测终端的行业类型,对所述谐波含有率典型曲线进行聚类处理,得到所述谐波含有率典型曲线对应的所述预设聚类数量的谐波含有率数据域。
[0026] 在其中一个实施例中,在所述对量测终端的谐波含有率曲线进行分类处理,得到对应的类别为典型类别的谐波含有率典型曲线之前,还包括:
[0027] 按照预设采样频率,采集得到所述量测终端在目标时间段下的谐波数据;
[0028] 根据所述谐波数据,计算得到所述量测终端的谐波含有率曲线。
[0029] 第二方面,本申请还提供了一种谐波数据识别装置。所述装置包括:
[0030] 曲线分类模块,用于对量测终端的谐波含有率曲线进行分类处理,得到对应的类别为典型类别的谐波含有率典型曲线;
[0031] 曲线聚类模块,用于根据所述谐波含有率典型曲线对应的量测终端的行业类型,对所述谐波含有率典型曲线进行聚类处理,得到所述谐波含有率典型曲线对应的谐波含有率数据域;
[0032] 离群识别模块,用于对所述谐波含有率数据域中的各个谐波含有率数据进行局部离群识别,得到所述各个谐波含有率数据的离群识别结果;
[0033] 谐波识别模块,用于根据所述各个谐波含有率数据的离群识别结果,确定所述谐波含有率曲线的识别结果。
[0034] 第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0035] 对量测终端的谐波含有率曲线进行分类处理,得到对应的类别为典型类别的谐波含有率典型曲线;
[0036] 根据所述谐波含有率典型曲线对应的量测终端的行业类型,对所述谐波含有率典型曲线进行聚类处理,得到所述谐波含有率典型曲线对应的谐波含有率数据域;
[0037] 对所述谐波含有率数据域中的各个谐波含有率数据进行局部离群识别,得到所述各个谐波含有率数据的离群识别结果;
[0038] 根据所述各个谐波含有率数据的离群识别结果,确定所述谐波含有率曲线的识别结果。
[0039] 第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0040] 对量测终端的谐波含有率曲线进行分类处理,得到对应的类别为典型类别的谐波含有率典型曲线;
[0041] 根据所述谐波含有率典型曲线对应的量测终端的行业类型,对所述谐波含有率典型曲线进行聚类处理,得到所述谐波含有率典型曲线对应的谐波含有率数据域;
[0042] 对所述谐波含有率数据域中的各个谐波含有率数据进行局部离群识别,得到所述各个谐波含有率数据的离群识别结果;
[0043] 根据所述各个谐波含有率数据的离群识别结果,确定所述谐波含有率曲线的识别结果。
[0044] 第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
[0045] 对量测终端的谐波含有率曲线进行分类处理,得到对应的类别为典型类别的谐波含有率典型曲线;
[0046] 根据所述谐波含有率典型曲线对应的量测终端的行业类型,对所述谐波含有率典型曲线进行聚类处理,得到所述谐波含有率典型曲线对应的谐波含有率数据域;
[0047] 对所述谐波含有率数据域中的各个谐波含有率数据进行局部离群识别,得到所述各个谐波含有率数据的离群识别结果;
[0048] 根据所述各个谐波含有率数据的离群识别结果,确定所述谐波含有率曲线的识别结果。
[0049] 上述谐波数据识别方法、装置、计算机设备、存储介质和计算机程序产品,对量测终端的谐波含有率曲线进行分类处理,得到对应的类别为典型类别的谐波含有率典型曲线;根据谐波含有率典型曲线对应的量测终端的行业类型,对谐波含有率典型曲线进行聚类处理,得到谐波含有率典型曲线对应的谐波含有率数据域;对谐波含有率数据域中的各个谐波含有率数据进行局部离群识别,得到各个谐波含有率数据的离群识别结果;根据各个谐波含有率数据的离群识别结果,确定谐波含有率曲线的识别结果。采用本方法,通过从量测终端的谐波含有率曲线中分类出典型特征,然后对谐波含有率典型曲线聚类得出各个行业类型的数据域,使得获取到的谐波含有率数据域中的谐波含有率数据兼具了典型特征和行业特征,进而利用局部离群识别出谐波含油率曲线中的异常,从而有效提高了对不同行业量测终端的谐波数据的识别准确率。

附图说明

[0050] 图1为一个实施例中谐波数据识别方法的应用环境图;
[0051] 图2为一个实施例中谐波数据识别方法的流程示意图;
[0052] 图3为另一个实施例中谐波数据识别方法的流程示意图;
[0053] 图4为又一个实施例中谐波数据识别方法的流程示意图;
[0054] 图5为一个实施例中谐波数据识别装置的结构框图;
[0055] 图6为一个实施例中计算机设备的内部结构图。

具体实施方式

[0056] 为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0057] 本申请实施例提供的谐波数据识别方法,可以应用于如图1所示的应用环境中。其中,量测终端101通过网络与量测主站102进行通信。数据存储系统可以存储量测主站102需要处理的数据,例如谐波含有率曲线、谐波含有率数据域和离群识别结果等。数据存储系统可以集成在量测主站102上,也可以放在云上或其他网络服务器上。其中,量测主站是指用于接收量测终端的谐波数据并进行异常识别的设备。量测终端是指采集电力用户的谐波数据的设备。
[0058] 在一个实施例中,如图2所示,提供了一种谐波数据识别方法,以该方法应用于图1中的量测主站为例进行说明,包括以下步骤:
[0059] 步骤S201,对量测终端的谐波含有率曲线进行分类处理,得到对应的类别为典型类别的谐波含有率典型曲线。
[0060] 其中,谐波数据是指与基波频率关联的电流中产生的电量。谐波含有率典型曲线是指能够表征谐波含有率曲线的典型特征的曲线。
[0061] 具体地,量测主站在目标时间段,采集量测终端的谐波数据,并计算得到谐波数据对应的谐波含有率;根据谐波含有率绘制得到量测终端的谐波含有率曲线。终端通过聚类算法对谐波含有率曲线进行分类处理,得到类别为典型类别的谐波含有率典型曲线和类别为非典型类别的谐波含有率非典型曲线,以得到能够表征谐波含有率曲线的典型特征的谐波含有率典型曲线。
[0062] 步骤S202,根据谐波含有率典型曲线对应的量测终端的行业类型,对谐波含有率典型曲线进行聚类处理,得到各个行业类型对应的谐波含有率数据域。
[0063] 其中,谐波含有率数据域是指通过谐波含有率典型曲线聚类得到的簇群,且簇群中包含有谐波含有率典型曲线中的谐波含有率数据。
[0064] 具体地,量测主站根据量测终端的档案,确定该量测终端所属的行业类型;进而根据谐波含有率典型曲线对应的量测终端所属的行业类型,对谐波含有率典型曲线进行聚类处理,得到每个行业类型对应的聚类簇群,将每个行业类型对应的聚类簇群作为每个行业类型对应的谐波含有率数据域。
[0065] 步骤S203,对谐波含有率数据域中的各个谐波含有率数据进行局部离群识别,得到各个谐波含有率数据的离群识别结果。
[0066] 其中,离群识别结果用于描述谐波含有率数据域中的每个谐波含有率数据是属于正常的数据点还是异常的数据点。
[0067] 具体地,量测主站对谐波含有率数据域中的各个谐波含有率数据进行局部离群识别,可以是根据谐波含有率数据与其距离最近的谐波含有率数据域中的各个谐波含有率数据之间的高斯距离,来识别每个谐波含有率数据域中的谐波含有率数据是属于离群类别还是正常类别,则量测主站得到各个谐波含有率数据的离群识别结果。
[0068] 步骤S204,根据各个谐波含有率数据的离群识别结果,确定谐波含有率曲线的识别结果。
[0069] 具体地,量测主站根据各个谐波含有率数据的离群识别结果,统计离群识别结果为离群类别的谐波含有率数据的数量;在离群类别的数量超过预设数量阈值的情况下,量测主站确认量测终端的谐波含有率曲线的识别结果为异常,则该谐波含有率曲线对应的谐波数据也为异常,即量测终端的谐波数据为异常;反之,确认量测终端的谐波含有率曲线的识别结果为正常,则该谐波含有率曲线对应的谐波数据也为正常,即量测终端的谐波数据为正常。其中,预设数量阈值包括但不限于是60%,80%和90%,当然还可以设置为其他数值。
[0070] 上述谐波数据识别方法中,对量测终端的谐波含有率曲线进行分类处理,得到对应的类别为典型类别的谐波含有率典型曲线;根据谐波含有率典型曲线对应的量测终端的行业类型,对谐波含有率典型曲线进行聚类处理,得到谐波含有率典型曲线对应的谐波含有率数据域;对谐波含有率数据域中的各个谐波含有率数据进行局部离群识别,得到各个谐波含有率数据的离群识别结果;根据各个谐波含有率数据的离群识别结果,确定谐波含有率曲线的识别结果。采用本方法,通过从量测终端的谐波含有率曲线中分类出典型特征,然后对谐波含有率典型曲线聚类得出各个行业类型的数据域,使得获取到的谐波含有率数据域中的谐波含有率数据兼具了典型特征和行业特征,进而利用局部离群识别出谐波含油率曲线中的异常,从而有效提高了对不同行业量测终端的谐波数据的识别准确率。
[0071] 在一个实施例中,上述步骤S203,对谐波含有率数据域中的各个谐波含有率数据进行局部离群识别,得到各个谐波含有率数据的离群识别结果,具体包括如下内容:根据各个谐波含有率数据对应的行业类型,从谐波含有率数据域中,确定出与各个谐波含有率数据对应的行业类型相同的目标谐波含有率数据;根据各个谐波含有率数据与各个谐波含有率数据对应的目标谐波含有率数据之间的高斯距离,得到各个谐波含有率数据的距离邻域;根据各个谐波含有率数据的距离邻域,计算得到各个谐波含有率数据的局部离群因子;根据各个谐波含有率数据的局部离群因子,对各个谐波含有率数据进行离群识别,得到各个谐波含有率数据的离群识别结果。
[0072] 具体地,量测主站将谐波含有率数据域中,除需进行离群识别的谐波含有率数据点以外的谐波含有率数据点作为目标谐波含有率数据点,则量测主站分别计算谐波含有率数据域中的每个谐波含有率数据与其他各个目标谐波含有率数据点之间的高斯距离。进而量测主站根据谐波含有率数据与其他各个目标谐波含有率数据点之间的高斯距离,计算得到该谐波含有率数据点的距离邻域;对该谐波含有率数据点的距离邻域进行局部离群因子(Local Outlier Factor,LOF)处理,得到该谐波含有率数据点的高斯核局部离群因子。量测主站将谐波含有率数据点的高斯核局部离群因子与离群阈值进行对比,得到对比结果;在对比结果为谐波含有率数据点的高斯核局部离群因子大于离群阈值的情况下,确认该谐波含有率数据点为离群识别结果为异常;在对比结果为谐波含有率数据点的高斯核局部离群因子小于离群阈值,或者对比结果为谐波含有率数据点的高斯核局部离群因子等于离群阈值的情况下,确认该谐波含有率数据点为离群识别结果为正常。其中,离群阈值可以设置为1。
[0073] 本实施例中,量测主站根据各个谐波含有率数据与各个谐波含有率数据对应的目标谐波含有率数据之间的高斯距离,得到各个谐波含有率数据的距离邻域;进而根据各个谐波含有率数据的距离邻域,计算得到各个谐波含有率数据的局部离群因子;最后根据各个谐波含有率数据的局部离群因子,对各个谐波含有率数据进行离群识别,得到各个谐波含有率数据的离群识别结果,通过与属于同一行业类型的谐波含有率数据进行离群识别,并利用谐波含有率数据域中每个谐波含有率数据的离群识别,来表征量测终端的谐波数据的离群识别结果,从而有效的提高了对不同行业量测终端的谐波数据的识别准确率。
[0074] 在一个实施例中,上述步骤S204,根据各个谐波含有率数据的离群识别结果,确定谐波含有率曲线的识别结果,具体包括如下内容:获取离群识别结果中被识别为离群数据的谐波含有率数据的数量;在数量满足预设异常数量条件的情况下,确认谐波含有率曲线的识别结果为异常。
[0075] 量测主站还可以综合各个目标时间段内的谐波含有率数据的离群识别结果,来确定谐波含有率曲线的识别结果。具体地,量测主站根据各个谐波含有率数据的离群识别结果,统计每个目标时间段内的离群识别结果为离群类别的谐波含有率数据的数量;在每个目标时间段内的离群类别的数量均超过预设数量阈值的情况下,量测主站确认量测终端的谐波含有率曲线的识别结果为异常,则该谐波含有率曲线对应的谐波数据也为异常;反之,确认量测终端的谐波含有率曲线的识别结果为正常,则该谐波含有率曲线对应的谐波数据也为正常。其中,预设数量阈值包括但不限于是60%,80%和90%,当然还可以设置为其他数值。
[0076] 在本实施例中,量测主站根据每个目标时间段内被识别为离群数据的谐波含有率数据的数量,来确认采集得到的谐波含有率曲线的识别结果,能够更精准的识别出谐波含有率曲线的异常情况,从而大大提高了对不同时间段下采集得到的谐波数据的识别精准度。
[0077] 在一个实施例中,上述步骤S201,对量测终端的谐波含有率曲线进行分类处理,得到对应的类别为典型类别的谐波含有率典型曲线,具体包括如下内容:获取分类处理半径和最小谐波数量;根据分类处理半径和最小谐波数量,从谐波含有率曲线中,筛选得到第一聚类中心;根据第一聚类中心,对谐波含有率曲线进行聚类处理,得到谐波含有率曲线的分类结果,并获取分类结果中对应的类别为典型类型的谐波含有率典型曲线。
[0078] 其中,第一聚类中心是指对量测终端的谐波含有率曲线进行分类处理的过程中得到的聚类中心。分类处理半径是指对谐波含有率曲线进行搜索的半径参数。最小谐波数量是指在分类处理半径范围内覆盖的谐波含有率曲线的最小数量。
[0079] 量测主站可以采用基于密度的聚类算法,对量测终端的谐波含有率曲线进行分类处理,得到对应的类别为典型类别的谐波含有率典型曲线。具体地,量测主站基于密度的聚类算法的所需参数,即分类处理半径和最小谐波数量。根据分类处理半径和最小谐波数量,从谐波含有率曲线中,筛选得到第一聚类中心,可以是量测主站搜索每个谐波含有率曲线在分类处理半径范围内覆盖的其他谐波含有率曲线的数量(为与其他数量进行区分,此处可将其称为曲线覆盖数量),将谐波含有率曲线的曲线覆盖数量与最小谐波数量进行比较,得到曲线数量比较结果,在曲线数量比较结果为谐波含有率曲线的曲线覆盖数量大于最小谐波数量的情况下,将该谐波含有率曲线作为第一聚类中心,则量测主站得到第一聚类中心;此外,在曲线数量比较结果为谐波含有率曲线的曲线覆盖数量等于最小谐波数量的情况下,将该谐波含有率曲线作为边界点。量测主站根据第一聚类中心和边界点,对除第一聚类中心和边界点以外的谐波含有率曲线进行密度聚类,得到谐波含有率曲线的分类结果。其中,分类结果中包含有类别为典型类型的谐波含有率典型曲线和类别为非典型类型的谐波含有率非典型曲线。量测主站从谐波含有率曲线的分类结果中,提取出类别为典型类型的谐波含有率典型曲线。
[0080] 在本实施例中,通过根据分类处理半径和最小谐波数量,从谐波含有率曲线中,筛选得到第一聚类中心;进而根据第一聚类中心,对谐波含有率曲线进行聚类处理,得到谐波含有率曲线的分类结果,从而能够将分类结果中对应的类别为典型类型的谐波含有率典型曲线作为处理依据以执行后续的谐波数据识别步骤,还实现了从量测终端的谐波含有率曲线中分类出典型特征,以提高对谐波数据的识别准确率。
[0081] 在一个实施例中,上述步骤S202,根据谐波含有率典型曲线对应的量测终端的行业类型,对谐波含有率典型曲线进行聚类处理,得到谐波含有率典型曲线对应的谐波含有率数据域,具体包括如下内容:获取预设聚类数量;从谐波含有率典型曲线中,获取预设聚类数量的谐波含有率典型曲线,作为第二聚类中心;根据第二聚类中心,对谐波含有率典型曲线进行聚类处理,得到谐波含有率典型曲线对应的预设聚类数量的谐波含有率数据域。
[0082] 其中,预设聚类数量是指所需聚类得到的谐波含有率数据域的数量;预设聚类数量可以设置为谐波含有率典型曲线的行业类型的总数量,例如谐波含有率典型曲线中包含有5个行业类型,则量测主站可以将预设聚类数量设置为5;预设聚类数量还可以设置为谐波含有率典型曲线的行业类型对应的大方向数量,例如谐波含有率典型曲线的5个行业类型,又可以归纳为3个行业大类,则量测主站可以将预设聚类数量设置为3。第二聚类中心是指对谐波含有率典型曲线进行聚类处理过程中得到的聚类中心。
[0083] 量测主站可以基于K均值(K‑means)聚类,对谐波含有率典型曲线进行聚类处理。具体地,量测主站通过获取预设聚类数量;然后从谐波含有率典型曲线中,随机选择预设聚类数量的谐波含有率典型曲线,作为第二聚类中心(为便于区分,可以将谐波含有率典型曲线中除第二聚类中心以外的谐波含有率典型曲线成为待分类谐波含有率典型曲线);根据第二聚类中心对应的量测终端的行业类型,与待分类谐波含有率典型曲线对应的量测终端的行业类型,分别得到待分类谐波含有率典型曲线与各个第二聚类中心之间的距离;将距离待分类谐波含有率典型曲线最近的第二聚类中心聚类为一个簇群;在所有的谐波含有率典型曲线完成簇群划分后,重新计算每个簇群中新的第二聚类中心,然后按照新的第二聚类中心,重新对谐波含有率典型曲线中除新的第二聚类中心以外的待分类谐波含有率典型曲线进行簇群划分,重复计算计算每个簇群中新的第二聚类中心,然后按照新的第二聚类中心;重新对谐波含有率典型曲线中除新的第二聚类中心以外的待分类谐波含有率典型曲线进行簇群划分的步骤,直到每个簇群的变化满足预设变化结束条件,将此时得到的预设数量的簇群,作为预设聚类数量的谐波含有率数据域。
[0084] 在本实施例中,量测主站从谐波含有率典型曲线中,获取预设聚类数量的谐波含有率典型曲线,作为第二聚类中心;进而根据第二聚类中心,对谐波含有率典型曲线进行聚类处理,得到谐波含有率典型曲线对应的预设聚类数量的谐波含有率数据域,使得获取到的谐波含有率数据域不仅包含有谐波含有率曲线的典型特征,还包含有谐波含有率曲线的行业特征,大大提高了对不同行业量测终端的谐波数据的识别准确率。
[0085] 在一个实施例中,在对量测终端的谐波含有率曲线进行分类处理,得到对应的类别为典型类别的谐波含有率典型曲线之前,还包括:按照预设采样频率,采集得到量测终端在目标时间段下的谐波数据;根据谐波数据,计算得到量测终端的谐波含有率曲线。
[0086] 具体地,量测主站可以在多个目标时间段,按照预设采样频率采集量测终端的谐波数据;对谐波数据的谐波分量的均方根值与基波分量的均方根值进行比值处理,得到量测终端在多个目标时间段下的谐波含有率数据。量测主站根据对谐波含有率进行曲线绘制,得到量测终端在多个目标时间段下的谐波含有率曲线。
[0087] 在本实施例中,通过预设采样频率采集得到量测终端在目标时间段下的谐波数据;然后根据谐波数据,计算得到量测终端的谐波含有率曲线,使得后续处理中,以谐波含有率曲线为依据执行后续的谐波数据识别步骤,而非直接使用谐波数据进行识别,以提高对量测终端的谐波数据的识别准确率。
[0088] 在一个实施例中,如图3所示,提供了另一种谐波数据识别方法,以该方法应用于图1中的量测主站为例进行说明,包括以下步骤:
[0089] 步骤S301,按照预设采样频率,采集得到量测终端在目标时间段下的谐波数据;根据谐波数据,计算得到量测终端的谐波含有率曲线。
[0090] 步骤S302,获取分类处理半径和最小谐波数量;根据分类处理半径和最小谐波数量,从谐波含有率曲线中,筛选得到第一聚类中心。
[0091] 步骤S303,根据第一聚类中心,对谐波含有率曲线进行聚类处理,得到谐波含有率曲线的分类结果,并获取分类结果中对应的类别为典型类型的谐波含有率典型曲线。
[0092] 步骤S304,获取预设聚类数量;从谐波含有率典型曲线中,获取预设聚类数量的谐波含有率典型曲线,作为第二聚类中心。
[0093] 步骤S305,根据第二聚类中心对应的量测终端的行业类型,对谐波含有率典型曲线进行聚类处理,得到谐波含有率典型曲线对应的预设聚类数量的谐波含有率数据域。
[0094] 步骤S306,根据各个谐波含有率数据对应的行业类型,从谐波含有率数据域中,确定出与各个谐波含有率数据对应的行业类型相同的目标谐波含有率数据。
[0095] 步骤S307,根据各个谐波含有率数据与各个谐波含有率数据对应的目标谐波含有率数据之间的高斯距离,得到各个谐波含有率数据的距离邻域。
[0096] 步骤S308,根据各个谐波含有率数据的距离邻域,计算得到各个谐波含有率数据的局部离群因子。
[0097] 步骤S309,根据各个谐波含有率数据的局部离群因子,对各个谐波含有率数据进行离群识别,得到各个谐波含有率数据的离群识别结果。
[0098] 步骤S310,获取离群识别结果中被识别为离群数据的谐波含有率数据的数量;在数量满足预设异常数量条件的情况下,确认谐波含有率曲线的识别结果为异常。
[0099] 上述谐波数据识别方法,能够实现以下有益效果:通过从量测终端的谐波含有率曲线中分类出典型特征,然后对谐波含有率典型曲线聚类得出各个行业类型的数据域,使得获取到的谐波含有率数据域中的谐波含有率数据兼具了典型特征和行业特征,进而利用局部离群识别出谐波含油率曲线中的异常,从而有效提高了对不同行业量测终端的谐波数据的识别准确率。
[0100] 为了更清晰阐明本公开实施例提供的谐波数据识别方法,以下以一个具体的实施例对上述谐波数据识别方法进行具体说明。如图4所示,提供了又一种谐波数据识别方法,可以应用于图1中的量测主站,具体包括如下内容:
[0101] 步骤S401,量测主站将分时段谐波数据采集任务发送至量测终端:量测主站以15分钟/次为预设采样频率,在9:00‑11:00,14:00‑16:00和23:00‑01:00(次日)这三个目标时间段,采集量测终端的谐波数据。
[0102] 步骤S402,基于密度的聚类算法,获取谐波含有率典型曲线:量测主站根据采集到的谐波数据,得到三个目标时间段的谐波含有率曲线,量测主站对谐波含有率曲线进行密度聚类,得到对应的类别为典型类别的谐波含有率典型曲线。
[0103] 步骤S403,基于K‑means聚类算法,对谐波含有率典型曲线进行聚类:量测主站根据谐波含有率典型曲线对应的量测终端的行业类型,对谐波含有率典型曲线进行K‑means聚类处理,得到谐波含有率典型曲线对应的谐波含有率数据域。
[0104] 步骤S404,基于局部离群因子识别出谐波数据的异常:对谐波含有率数据域中的各个谐波含有率数据进行局部离群识别,得到各个谐波含有率数据的高斯核局部离群因子,在谐波含有率数据点的高斯核局部离群因子大于1的情况下,确认该谐波含有率数据点为离群识别结果为异常;反之,确认该谐波含有率数据点为离群识别结果为正常。量测主站统计每个目标时间段内的离群识别结果为离群类别的谐波含有率数据的数量;在9:00‑11:00,14:00‑16:00和23:00‑01:00(次日)这三个目标时间段内的离群类别的数量均超过80%的情况下,量测主站确认量测终端的谐波含有率曲线的识别结果为异常,则量测终端的谐波数据为异常;反之,量测终端的谐波数据为正常。
[0105] 在本实施例中,通过三个目标时间段的谐波数据的谐波含有率典型曲线,聚类得出典型类别的谐波含有率典型曲线,通过根据谐波含有率典型曲线对应的量测终端的行业类型,聚类得出谐波含有率数据域,使得获取到的谐波含有率数据域中的谐波含有率数据兼具了典型特征和行业特征,进而利用局部离群识别出谐波含油率曲线中的异常,有效地提高了量测终端的谐波数据的识别准确率。
[0106] 应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0107] 基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的谐波数据识别方法的谐波数据识别装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个谐波数据识别装置实施例中的具体限定可以参见上文中对于谐波数据识别方法的限定,在此不再赘述。
[0108] 在一个实施例中,如图5所示,提供了一种谐波数据识别装置500,包括:曲线分类模块501、曲线聚类模块502、离群识别模块503和谐波识别模块504,其中:
[0109] 曲线分类模块501,用于对量测终端的谐波含有率曲线进行分类处理,得到对应的类别为典型类别的谐波含有率典型曲线。
[0110] 曲线聚类模块502,用于根据谐波含有率典型曲线对应的量测终端的行业类型,对谐波含有率典型曲线进行聚类处理,得到谐波含有率典型曲线对应的谐波含有率数据域。
[0111] 离群识别模块503,用于对谐波含有率数据域中的各个谐波含有率数据进行局部离群识别,得到各个谐波含有率数据的离群识别结果。
[0112] 谐波识别模块504,用于根据各个谐波含有率数据的离群识别结果,确定谐波含有率曲线的识别结果。
[0113] 在一个实施例中,离群识别模块,还用于根据各个谐波含有率数据对应的行业类型,从谐波含有率数据域中,确定出与各个谐波含有率数据对应的行业类型相同的目标谐波含有率数据;根据各个谐波含有率数据与各个谐波含有率数据对应的目标谐波含有率数据之间的高斯距离,得到各个谐波含有率数据的距离邻域;根据各个谐波含有率数据的距离邻域,计算得到各个谐波含有率数据的局部离群因子;根据各个谐波含有率数据的局部离群因子,对各个谐波含有率数据进行离群识别,得到各个谐波含有率数据的离群识别结果。
[0114] 在一个实施例中,谐波识别模块,还用于获取离群识别结果中被识别为离群数据的谐波含有率数据的数量;在数量满足预设异常数量条件的情况下,确认谐波含有率曲线的识别结果为异常。
[0115] 在一个实施例中,曲线分类模块501,还用于获取分类处理半径和最小谐波数量;根据分类处理半径和最小谐波数量,从谐波含有率曲线中,筛选得到第一聚类中心;根据第一聚类中心,对谐波含有率曲线进行聚类处理,得到谐波含有率曲线的分类结果,并获取分类结果中对应的类别为典型类型的谐波含有率典型曲线。
[0116] 在一个实施例中,曲线聚类模块502,还用于获取预设聚类数量;从谐波含有率典型曲线中,获取预设聚类数量的谐波含有率典型曲线,作为第二聚类中心;根据第二聚类中心对应的量测终端的行业类型,对谐波含有率典型曲线进行聚类处理,得到谐波含有率典型曲线对应的预设聚类数量的谐波含有率数据域。
[0117] 在一个实施例中,谐波数据识别装置500还包括谐波采集模块,用于按照预设采样频率,采集得到量测终端在目标时间段下的谐波数据;根据谐波数据,计算得到量测终端的谐波含有率曲线。
[0118] 上述谐波数据识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0119] 在一个实施例中,提供了一种计算机设备,该计算机设备的内部结构图可以如图6所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储谐波数据、谐波含有率曲线等数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种谐波数据识别方法。
[0120] 本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0121] 在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
[0122] 在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0123] 在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0124] 需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
[0125] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read‑Only Memory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
[0126] 以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0127] 以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。