一种用于数字信息的大数据分析处理方法转让专利

申请号 : CN202211568255.9

文献号 : CN115563193B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李华胡曼宇姜永飞蔡恒栋冯燚

申请人 : 陕西通信规划设计研究院有限公司

摘要 :

本发明涉及电数字数据处理技术领域,具体涉及一种用于数字信息的大数据分析处理方法,该方法包括:获取当前用电大数据集合和每个当前用电大数据对应的历史用电大数据序列;对当前用电大数据集合中的每个当前用电大数据进行重复性分析处理;对当前用电大数据集合中的每个当前用电大数据进行异常性分析处理;对当前用电大数据集合中的当前用电大数据进行聚类;对当前用电大数据类别集合中的当前用电大数据进行分类存储处理。本发明利用相对重复性与异常性对不同的区域的用电大数据进行聚类压缩存储处理,解决了后续对用电大数据异常程度分析的效率低下的技术问题,提高了后续对用电大数据异常程度分析的效率,应用于对用电大数据的数据存储。

权利要求 :

1.一种用于数字信息的大数据分析处理方法,其特征在于,包括以下步骤:

获取当前用电大数据集合和所述当前用电大数据集合中的每个当前用电大数据对应的历史用电大数据序列,其中,当前用电大数据集合中的当前用电大数据是当前时间段下的用电大数据,历史用电大数据序列中的历史用电大数据是历史时间段下的用电大数据,当前时间段的开始时间是历史时间段的结束时间,所述当前用电大数据集合中的当前用电大数据包括:当前平均用电量和当前单位平均电量序列,历史用电大数据序列中的历史用电大数据包括:历史单位平均电量序列;

根据所述当前用电大数据集合,对所述当前用电大数据集合中的每个当前用电大数据进行重复性分析处理,得到每个当前用电大数据对应的相对重复性;

根据所述当前用电大数据集合和所述当前用电大数据集合中的各个当前用电大数据对应的历史用电大数据序列,对所述当前用电大数据集合中的每个当前用电大数据进行异常性分析处理,得到每个当前用电大数据对应的相对异常度;

根据所述当前用电大数据集合中的各个当前用电大数据对应的相对重复性和相对异常度,对所述当前用电大数据集合中的当前用电大数据进行聚类,得到当前用电大数据类别集合;

对所述当前用电大数据类别集合中的当前用电大数据进行分类存储处理;

所述根据所述当前用电大数据集合和所述当前用电大数据集合中的各个当前用电大数据对应的历史用电大数据序列,对所述当前用电大数据集合中的每个当前用电大数据进行异常性分析处理,得到每个当前用电大数据对应的相对异常度,包括:根据所述当前用电大数据集合中的各个当前用电大数据包括的当前平均用电量和当前单位平均电量序列,确定每个当前用电大数据对应的当前第一异常性;

根据所述当前用电大数据集合中的每个当前用电大数据对应的历史用电大数据序列中的历史用电大数据包括的历史单位平均电量序列、每个当前用电大数据包括的当前单位平均电量序列,确定每个当前用电大数据对应的当前第二异常性;

根据所述当前用电大数据集合中的每个当前用电大数据对应的当前第一异常性和当前第二异常性,确定每个当前用电大数据对应的相对异常度;

所述根据所述当前用电大数据集合中的各个当前用电大数据包括的当前平均用电量和当前单位平均电量序列,确定每个当前用电大数据对应的当前第一异常性,包括:根据所述当前用电大数据集合中的各个当前用电大数据包括的当前平均用电量、所述当前用电大数据集合中的当前用电大数据包括的当前平均用电量的均值、所述当前用电大数据集合中当前用电大数据的数量,确定所述当前时间段对应的当前用电波动参数;

根据所述当前用电大数据集合中的各个当前用电大数据包括的当前单位平均电量序列中的每个当前单位平均电量、所述当前用电大数据集合中当前用电大数据的数量,确定所述当前时间段包括的每个当前单位时间段对应的当前单位电波动参数;

根据所述当前用电大数据集合中的各个当前用电大数据包括的当前单位平均电量序列、所述当前用电波动参数、所述当前时间段包括的各个当前单位时间段对应的当前单位电波动参数、所述当前用电大数据集合中当前用电大数据的数量,确定每个当前用电大数据对应的当前第一异常性;

所述根据所述当前用电大数据集合中的每个当前用电大数据对应的历史用电大数据序列中的历史用电大数据包括的历史单位平均电量序列、每个当前用电大数据包括的当前单位平均电量序列,确定每个当前用电大数据对应的当前第二异常性,包括:将当前用电大数据对应的历史用电大数据序列中的历史用电大数据包括的历史单位平均电量序列中的历史单位平均电量的均值,确定为当前用电大数据对应的当前总电量均值;

根据所述当前用电大数据集合中的每个当前用电大数据对应的当前总电量均值、每个当前用电大数据对应的历史用电大数据序列中的历史用电大数据包括的历史单位平均电量序列、每个当前用电大数据包括的当前单位平均电量序列、当前时间段和历史时间段,确定每个当前用电大数据对应的当前第二异常性。

2.根据权利要求1所述的一种用于数字信息的大数据分析处理方法,其特征在于,所述根据所述当前用电大数据集合,对所述当前用电大数据集合中的每个当前用电大数据进行重复性分析处理,得到每个当前用电大数据对应的相对重复性,包括:对所述当前用电大数据集合中的每个当前用电大数据进行重复字符提取,生成每个当前用电大数据对应的重复性字符空间;

根据所述当前用电大数据集合中的各个当前用电大数据对应的重复性字符空间,确定每个当前用电大数据对应的基础重复性集合;

根据每个当前用电大数据对应的基础重复性集合,确定每个当前用电大数据对应的相对重复性。

3.根据权利要求2所述的一种用于数字信息的大数据分析处理方法,其特征在于,所述根据所述当前用电大数据集合中的各个当前用电大数据对应的重复性字符空间,确定每个当前用电大数据对应的基础重复性集合,包括:对当前用电大数据对应的重复性字符空间和当前用电大数据对应的其他当前用电大数据对应的重复性字符空间进行重复字符提取,生成其他重复性字符空间,得到当前用电大数据对应的其他重复性字符空间集合,其中,当前用电大数据对应的其他当前用电大数据是所述当前用电大数据集合中除了该当前用电大数据之外的当前用电大数据;

根据所述当前用电大数据集合、每个当前用电大数据对应的其他重复性字符空间集合中的每个其他重复性字符空间,确定基础重复性,得到每个当前用电大数据对应的基础重复性集合。

4.权利要求1所述的一种用于数字信息的大数据分析处理方法,其特征在于,所述根据所述当前用电大数据集合中的各个当前用电大数据对应的相对重复性和相对异常度,对所述当前用电大数据集合中的当前用电大数据进行聚类,得到当前用电大数据类别集合,包括:将所述当前用电大数据集合中的每个当前用电大数据对应的相对重复性,确定为所述当前用电大数据对应的横坐标;

将所述当前用电大数据集合中的每个当前用电大数据对应的相对异常度,确定为所述当前用电大数据对应的纵坐标;

将所述当前用电大数据集合中的每个当前用电大数据对应的横坐标和纵坐标,组合为所述当前用电大数据对应的当前坐标;

根据所述当前用电大数据集合中的各个当前用电大数据对应的当前坐标,确定所述当前用电大数据集合中各个当前用电大数据之间的欧式距离;

根据所述当前用电大数据集合中各个当前用电大数据之间的欧式距离,对所述当前用电大数据集合中的当前用电大数据进行聚类,得到当前用电大数据类别集合。

5.根据权利要求1所述的一种用于数字信息的大数据分析处理方法,其特征在于,所述对所述当前用电大数据类别集合中的当前用电大数据进行分类存储处理,包括:对所述当前用电大数据类别集合中的每个当前用电大数据类别中各个当前用电大数据进行压缩,得到所述当前用电大数据类别对应的压缩文件;

对所述当前用电大数据类别集合中的各个当前用电大数据类别对应的压缩文件进行分类存储。

说明书 :

一种用于数字信息的大数据分析处理方法

技术领域

[0001] 本发明涉及电数字数据处理技术领域,具体涉及一种用于数字信息的大数据分析处理方法。

背景技术

[0002] 随着科技的发展,许许多多的行业进行了数字化的转型,并在数字化转型之后,形成与调用所涉猎领域的对象资源,而数字化的过程往往是基于大量的信息支撑的过程。例如智能电网的数字化转型,往往需要大量的电力相关的大数据(如,用电大数据)进行支撑,而大数据在分析处理的过程中往往需要对其进行存储。
[0003] 对于用电大数据进行存储时,常规的方法是基于时序用电大数据的重复性的存储。基于时序用电大数据的重复性的存储常见的方法为:利用GZIP压缩算法对用电大数据进行压缩存储,该方法对数据进行存储时,往往未考虑到数据的属性聚类,如数据的异常程度的聚类,致使后续进行用电大数据异常程度分析时,往往需要调动大量的数据,往往会损耗大量的计算资源对用电大数据进行基于异常程度的分析,往往导致对用电大数据异常程度分析的效率低下,其中,后续常常需要对存储的数据进行异常分析。

发明内容

[0004] 本发明的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本发明的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0005] 为了解决对用电大数据异常程度分析的效率低下的技术问题,本发明提出了一种用于数字信息的大数据分析处理方法。
[0006] 本发明提供了一种用于数字信息的大数据分析处理方法,该方法包括:
[0007] 获取当前用电大数据集合和所述当前用电大数据集合中的每个当前用电大数据对应的历史用电大数据序列,其中,当前用电大数据集合中的当前用电大数据是当前时间段下的用电大数据,历史用电大数据序列中的历史用电大数据是历史时间段下的用电大数据,当前时间段的开始时间是历史时间段的结束时间;
[0008] 根据所述当前用电大数据集合,对所述当前用电大数据集合中的每个当前用电大数据进行重复性分析处理,得到每个当前用电大数据对应的相对重复性;
[0009] 根据所述当前用电大数据集合和所述当前用电大数据集合中的各个当前用电大数据对应的历史用电大数据序列,对所述当前用电大数据集合中的每个当前用电大数据进行异常性分析处理,得到每个当前用电大数据对应的相对异常度;
[0010] 根据所述当前用电大数据集合中的各个当前用电大数据对应的相对重复性和相对异常度,对所述当前用电大数据集合中的当前用电大数据进行聚类,得到当前用电大数据类别集合;
[0011] 对所述当前用电大数据类别集合中的当前用电大数据进行分类存储处理。
[0012] 进一步的,所述根据所述当前用电大数据集合,对所述当前用电大数据集合中的每个当前用电大数据进行重复性分析处理,得到每个当前用电大数据对应的相对重复性,包括:
[0013] 对所述当前用电大数据集合中的每个当前用电大数据进行重复字符提取,生成每个当前用电大数据对应的重复性字符空间;
[0014] 根据所述当前用电大数据集合中的各个当前用电大数据对应的重复性字符空间,确定每个当前用电大数据对应的基础重复性集合;
[0015] 根据每个当前用电大数据对应的基础重复性集合,确定每个当前用电大数据对应的相对重复性。
[0016] 进一步的,所述根据所述当前用电大数据集合中的各个当前用电大数据对应的重复性字符空间,确定每个当前用电大数据对应的基础重复性集合,包括:
[0017] 对当前用电大数据对应的重复性字符空间和当前用电大数据对应的其他当前用电大数据对应的重复性字符空间进行重复字符提取,生成其他重复性字符空间,得到当前用电大数据对应的其他重复性字符空间集合,其中,当前用电大数据对应的其他当前用电大数据是所述当前用电大数据集合中除了该当前用电大数据之外的当前用电大数据;
[0018] 根据所述当前用电大数据集合、每个当前用电大数据对应的其他重复性字符空间集合中的每个其他重复性字符空间,确定基础重复性,得到每个当前用电大数据对应的基础重复性集合。
[0019] 进一步的,所述当前用电大数据集合中的当前用电大数据包括:当前平均用电量和当前单位平均电量序列,历史用电大数据序列中的历史用电大数据包括:历史单位平均电量序列;
[0020] 所述根据所述当前用电大数据集合和所述当前用电大数据集合中的各个当前用电大数据对应的历史用电大数据序列,对所述当前用电大数据集合中的每个当前用电大数据进行异常性分析处理,得到每个当前用电大数据对应的相对异常度,包括:
[0021] 根据所述当前用电大数据集合中的各个当前用电大数据包括的当前平均用电量和当前单位平均电量序列,确定每个当前用电大数据对应的当前第一异常性;
[0022] 根据所述当前用电大数据集合中的每个当前用电大数据对应的历史用电大数据序列中的历史用电大数据包括的历史单位平均电量序列、每个当前用电大数据包括的当前单位平均电量序列,确定每个当前用电大数据对应的当前第二异常性;
[0023] 根据所述当前用电大数据集合中的每个当前用电大数据对应的当前第一异常性和当前第二异常性,确定每个当前用电大数据对应的相对异常度。
[0024] 进一步的,所述根据所述当前用电大数据集合中的各个当前用电大数据包括的当前平均用电量和当前单位平均电量序列,确定每个当前用电大数据对应的当前第一异常性,包括:
[0025] 根据所述当前用电大数据集合中的各个当前用电大数据包括的当前平均用电量、所述当前用电大数据集合中的当前用电大数据包括的当前平均用电量的均值、所述当前用电大数据集合中当前用电大数据的数量,确定所述当前时间段对应的当前用电波动参数;
[0026] 根据所述当前用电大数据集合中的各个当前用电大数据包括的当前单位平均电量序列中的每个当前单位平均电量、所述当前用电大数据集合中当前用电大数据的数量,确定所述当前时间段包括的每个当前单位时间段对应的当前单位电波动参数;
[0027] 根据所述当前用电大数据集合中的各个当前用电大数据包括的当前单位平均电量序列、所述当前用电波动参数、所述当前时间段包括的各个当前单位时间段对应的当前单位电波动参数、所述当前用电大数据集合中当前用电大数据的数量,确定每个当前用电大数据对应的当前第一异常性。
[0028] 进一步的,所述根据所述当前用电大数据集合中的每个当前用电大数据对应的历史用电大数据序列中的历史用电大数据包括的历史单位平均电量序列、每个当前用电大数据包括的当前单位平均电量序列,确定每个当前用电大数据对应的当前第二异常性,包括:
[0029] 将当前用电大数据对应的历史用电大数据序列中的历史用电大数据包括的历史单位平均电量序列中的历史单位平均电量的均值,确定为当前用电大数据对应的当前总电量均值;
[0030] 根据所述当前用电大数据集合中的每个当前用电大数据对应的当前总电量均值、每个当前用电大数据对应的历史用电大数据序列中的历史用电大数据包括的历史单位平均电量序列、每个当前用电大数据包括的当前单位平均电量序列、当前时间段和历史时间段,确定每个当前用电大数据对应的当前第二异常性。
[0031] 进一步的,所述根据所述当前用电大数据集合中的各个当前用电大数据对应的相对重复性和相对异常度,对所述当前用电大数据集合中的当前用电大数据进行聚类,得到当前用电大数据类别集合,包括:
[0032] 将所述当前用电大数据集合中的每个当前用电大数据对应的相对重复性,确定为所述当前用电大数据对应的横坐标;
[0033] 将所述当前用电大数据集合中的每个当前用电大数据对应的相对异常度,确定为所述当前用电大数据对应的纵坐标;
[0034] 将所述当前用电大数据集合中的每个当前用电大数据对应的横坐标和纵坐标,组合为所述当前用电大数据对应的当前坐标;
[0035] 根据所述当前用电大数据集合中的各个当前用电大数据对应的当前坐标,确定所述当前用电大数据集合中各个当前用电大数据之间的欧式距离;
[0036] 根据所述当前用电大数据集合中各个当前用电大数据之间的欧式距离,对所述当前用电大数据集合中的当前用电大数据进行聚类,得到当前用电大数据类别集合。
[0037] 进一步的,所述对所述当前用电大数据类别集合中的当前用电大数据进行分类存储处理,包括:
[0038] 对所述当前用电大数据类别集合中的每个当前用电大数据类别中各个当前用电大数据进行压缩,得到所述当前用电大数据类别对应的压缩文件;
[0039] 对所述当前用电大数据类别集合中的各个当前用电大数据类别对应的压缩文件进行分类存储。
[0040] 本发明具有如下有益效果:
[0041] 本发明的一种用于数字信息的大数据分析处理方法,利用相对重复性与异常性对不同的区域的用电大数据进行聚类压缩存储处理,解决了后续对用电大数据异常程度分析的效率低下的技术问题,提高了后续对用电大数据异常程度分析的效率。首先,获取当前用电大数据集合和上述当前用电大数据集合中的每个当前用电大数据对应的历史用电大数据序列。实际情况中,获取当前用电大数据集合,可以便于后续比较当前用电大数据集合中当前用电大数据之间的重复性。其次,获取当前用电大数据对应的历史用电大数据序列,可以便于后续根据历史用电大数据序列可以判断当前用电大数据的异常性。接着,根据上述当前用电大数据集合,对上述当前用电大数据集合中的每个当前用电大数据进行重复性分析处理,得到每个当前用电大数据对应的相对重复性。实际情况中,通过当前用电大数据集合,对当前用电大数据进行重复性分析处理,可以提高当前用电大数据对应的相对重复性确定的准确度。并且,可以便于后续基于当前用电大数据对应的相对重复性,对当前用电大数据进行压缩,可以提高对当前用电大数据进行压缩的效率。然后,根据上述当前用电大数据集合和上述当前用电大数据集合中的各个当前用电大数据对应的历史用电大数据序列,对上述当前用电大数据集合中的每个当前用电大数据进行异常性分析处理,得到每个当前用电大数据对应的相对异常度。实际情况中,综合考虑当前用电大数据集合和各个当前用电大数据对应的历史用电大数据序列,可以提高当前用电大数据对应的相对异常度确定的准确度。并且,可以便于后续对不同异常程度的大数据进行分类处理,可以减少智能电网的数字化转型对数据进行二次异常性分析的算力浪费。之后,根据上述当前用电大数据集合中的各个当前用电大数据对应的相对重复性和相对异常度,对上述当前用电大数据集合中的当前用电大数据进行聚类,得到当前用电大数据类别集合。最后,对上述当前用电大数据类别集合中的当前用电大数据进行分类存储处理。因此,本发明利用相对重复性与异常性对不同的区域的用电大数据进行聚类压缩存储处理,在进行压缩或者存储的时候不仅能满足压缩所需要的数据的重复性,也能对不同异常程度的大数据进行分类处理,减少了智能电网的数字化转型对数据进行二次异常性分析的算力浪费,解决了后续对用电大数据异常程度分析的效率低下的技术问题,提高了后续对用电大数据异常程度分析的效率。

附图说明

[0042] 为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0043] 图1为根据本发明的一种用于数字信息的大数据分析处理方法的流程图。

具体实施方式

[0044] 为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的技术方案的具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一个实施例。此外,一个或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
[0045] 除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
[0046] 本发明提供了一种用于数字信息的大数据分析处理方法,该方法包括以下步骤:
[0047] 获取当前用电大数据集合和当前用电大数据集合中的每个当前用电大数据对应的历史用电大数据序列;
[0048] 根据当前用电大数据集合,对当前用电大数据集合中的每个当前用电大数据进行重复性分析处理,得到每个当前用电大数据对应的相对重复性;
[0049] 根据当前用电大数据集合和当前用电大数据集合中的各个当前用电大数据对应的历史用电大数据序列,对当前用电大数据集合中的每个当前用电大数据进行异常性分析处理,得到每个当前用电大数据对应的相对异常度;
[0050] 根据当前用电大数据集合中的各个当前用电大数据对应的相对重复性和相对异常度,对当前用电大数据集合中的当前用电大数据进行聚类,得到当前用电大数据类别集合;
[0051] 对当前用电大数据类别集合中的当前用电大数据进行分类存储处理。
[0052] 下面对上述各个步骤进行详细展开:
[0053] 参考图1,示出了根据本发明的一种用于数字信息的大数据分析处理方法的一些实施例的流程。该用于数字信息的大数据分析处理方法,包括以下步骤:
[0054] 步骤S1,获取当前用电大数据集合和当前用电大数据集合中的每个当前用电大数据对应的历史用电大数据序列。
[0055] 在一些实施例中,可以获取当前用电大数据集合和上述当前用电大数据集合中的每个当前用电大数据对应的历史用电大数据序列。
[0056] 其中,当前用电大数据集合中的当前用电大数据可以是当前时间段下的用电大数据。用电大数据可以是包括与电力相关数据的大数据。历史用电大数据序列中的历史用电大数据可以是历史时间段下的用电大数据。当前时间段的开始时间可以是历史时间段的结束时间。当前时间段对应的时长可以等于1天。比如,当前时间段的开始时间可以为2022年11月05日00时00分00秒。当前时间段的结束时间可以为2022年11月05日24时00分00秒。历史时间段对应的时长可以等于7天。比如,历史时间段的开始时间可以为2022年10月29日00时00分00秒。历史时间段的结束时间可以为2022年11月05日00时00分00秒。历史用电大数据序列中的每个历史用电大数据对应的时长可以等于当前用电大数据对应的时长。历史用电大数据序列中的各个历史用电大数据对应的时长的和等于历史时间段对应的时长。
[0057] 例如,用电大数据可以是某个区域的居民用电大数据。居民用电大数据可以表征某个区域的居民的用电情况。比如,居民用电大数据可以是居民用电日志数据。居民用电大数据可以包括但不限于:居住在某个区域的各个居民的姓名、详细住址和用电量。当前用电大数据集合可以表征某个地区(如,某个居民小区)的居民的用电情况。当前用电大数据集合中的当前用电大数据可以表征该地区包括的区域(如,该居民小区包括的居民楼)的居民的用电情况。其中,各个区域的居民规模可以相同。
[0058] 当前用电大数据对应的历史用电大数据序列对应的区域可以与该当前用电大数据对应的区域相同。比如,当前用电大数据可以是在2022年11月05日全天,某个居民小区包括的5号居民楼的居民用电大数据。当历史用电大数据序列中历史用电大数据的数量为2时,该当前用电大数据对应的历史用电大数据序列可以包括:在2022年11月04日全天该居民小区包括的5号居民楼的居民用电大数据,在2022年11月03日全天该居民小区包括的5号居民楼的居民用电大数据。
[0059] 步骤S2,根据当前用电大数据集合,对当前用电大数据集合中的每个当前用电大数据进行重复性分析处理,得到每个当前用电大数据对应的相对重复性。
[0060] 在一些实施例中,可以根据上述当前用电大数据集合,对上述当前用电大数据集合中的每个当前用电大数据进行重复性分析处理,得到每个当前用电大数据对应的相对重复性。
[0061] 作为示例,本步骤可以包括以下步骤:
[0062] 第一步,对上述当前用电大数据集合中的每个当前用电大数据进行重复字符提取,生成每个当前用电大数据对应的重复性字符空间。
[0063] 例如,可以通过STC(Suffix Tree Clustering,去重)算法,对每个当前用电大数据进行重复字符提取,生成每个当前用电大数据对应的重复性字符空间。
[0064] 当前用电大数据对应的重复性字符空间可以如下所示:
[0065]
[0066] 其中, 是当前用电大数据集合中第n个当前用电大数据对应的重复性字符空间。是当前用电大数据集合中第n个当前用电大数据中第1个重复的字符的重复次数。重复的字符可以是至少出现两次的字符。 是当前用电大数据集合中第n个当前用电大数据中第1个重复的字符。 是当前用电大数据集合中第n个当前用电大数据中第2个重复的字符的重复次数。 是当前用电大数据集合中第n个当前用电大数据中第2个重复的字符。 是当前用电大数据集合中第n个当前用电大数据中第h个重复的字符的重复次数。 是当前用电大数据集合中第n个当前用电大数据中第h个重复的字符。 是当前用电大数据集合中第n个当前用电大数据中第H个重复的字符的重复次数。 是当前用电大数据集合中第n个当前用电大数据中第H个重复的字符。H是所有重复字符的数量。
[0067] 第二步,根据上述当前用电大数据集合中的各个当前用电大数据对应的重复性字符空间,确定每个当前用电大数据对应的基础重复性集合。
[0068] 其中,当前用电大数据对应的基础重复性集合中的基础重复性可以是该当前用电大数据与当前用电大数据集合中除了该当前用电大数据之外的当前用电大数据之间的基础重复性。
[0069] 例如,本步骤可以包括以下子步骤:
[0070] 第一子步骤,对当前用电大数据对应的重复性字符空间和当前用电大数据对应的其他当前用电大数据对应的重复性字符空间进行重复字符提取,生成其他重复性字符空间,得到当前用电大数据对应的其他重复性字符空间集合。
[0071] 其中,当前用电大数据对应的其他当前用电大数据是上述当前用电大数据集合中除了该当前用电大数据之外的当前用电大数据。其他重复性字符空间可以是当前用电大数据和当前用电大数据集合中除了该当前用电大数据之外的当前用电大数据对应的重复性字符空间,这两个重复性字符空间之间的重复性字符空间。
[0072] 比如,可以通过STC算法,对当前用电大数据对应的重复性字符空间和当前用电大数据对应的其他当前用电大数据对应的重复性字符空间,这两个重复性字符空间中的重复字符进行提取,生成其他重复性字符空间。
[0073] 第二子步骤,根据上述当前用电大数据集合、每个当前用电大数据对应的其他重复性字符空间集合中的每个其他重复性字符空间,确定基础重复性,得到每个当前用电大数据对应的基础重复性集合。
[0074] 比如,确定基础重复性对应的公式可以为:
[0075]
[0076] 其中, 是当前用电大数据集合中第n个当前用电大数据与第 个当前用电大数据之间的基础重复性。是当前用电大数据集合中第n个当前用电大数据包括的所有字符的总长度。 是当前用电大数据集合中第 个当前用电大数据包括的所有字符的总长度。, ,并且 。N是当前用电大数据集合中当前用电大数据的数量。n和 是当前用电大数据集合中的当前用电大数据的序号。 是当前用电大数据集合中第n个当前用电大数据与第 个当前用电大数据对应的重复性字符空间,这两个重复性字符空间之间的重复性字符空间中第 个重复的字符的重复次数。 是当前用电大数据集合中第n个当前用电大数据与第 个当前用电大数据对应的重复性字符空间,这两个重复性字符空间之间的重复性字符空间中第 个重复的字符的重复长度。是当前用电大数据集合中第n个当前用电大数据与第 个当前用电大数据对应的重复性字符空间,这两个重复性字符空间中重复字符的总个数。 。是当前用电大数据集合中第n个当前用电大数据与第 个当前用电大数据对应的重复性字符空间,这两个重复性字符空间中重复字符的序号。
[0077] 实际情况中,若第n个当前用电大数据为第n个区域的居民用电大数据,记为 。第个当前用电大数据为第 个区域的居民用电大数据,记为 。则 可以表征第 个区域和第 个区域对应的居民用电大数据 和 中的重复字符的数据量与 和 总体数据量的比值,数据量的量化方式为通过字符的长度进行量化, 越大,往往说明 和 重复的数据越多,后续对 和 进行压缩的时候,对其进行同时压缩时往往具有较高的压缩率,反之则相反。而建立重复性字符空间的目的是在每个当前用电大数据与第 个当前用电大数据进行重复性字符检测的时候更加的方便,并且过滤一小部分重复性较低的重复字符,可以减少计算量,可以减少计算资源的占用。
[0078] 第三步,根据每个当前用电大数据对应的基础重复性集合,确定每个当前用电大数据对应的相对重复性。
[0079] 例如,确定每个当前用电大数据对应的相对重复性对应的公式可以为:
[0080]
[0081] 其中,是当前用电大数据集合中第n个当前用电大数据对应的相对重复性。N是当前用电大数据集合中当前用电大数据的数量。n和 是当前用电大数据集合中的当前用电大数据的序号。 是当前用电大数据集合中第n个当前用电大数据与第 个当前用电大数据之间的基础重复性。
[0082] 实际情况中,若第n个当前用电大数据为第n个区域的居民用电大数据,记为 。则第 个区域第天的居民用电大数据 的相对重复性 是利用 与其他所有 个区域的基础重复性的平均值,该值越大,说明 与其他区域的居民用电大数据中重复的数据越多,反之则相反。实现了根据不同区域的相同时间节点内的用电大数据进行不同区域之间的用电大数据相对重复性特征的量化。并且,当前用电大数据之间的相对重复性越高,在进行压缩时的压缩率往往就越高。
[0083] 步骤S3,根据当前用电大数据集合和当前用电大数据集合中的各个当前用电大数据对应的历史用电大数据序列,对当前用电大数据集合中的每个当前用电大数据进行异常性分析处理,得到每个当前用电大数据对应的相对异常度。
[0084] 在一些实施例中,可以根据上述当前用电大数据集合和上述当前用电大数据集合中的各个当前用电大数据对应的历史用电大数据序列,对上述当前用电大数据集合中的每个当前用电大数据进行异常性分析处理,得到每个当前用电大数据对应的相对异常度。
[0085] 其中,上述当前用电大数据集合中的当前用电大数据可以包括:当前平均用电量和当前单位平均电量序列。历史用电大数据序列中的历史用电大数据可以包括:历史单位平均电量序列。当前平均用电量可以是当前时间段内的平均用电量。当前单位平均电量序列中的当前单位平均电量可以是当前时间段包括的单位时间段内的平均用电量。单位时间段对应的时长可以是1小时。历史单位平均电量序列中的历史单位平均电量可以是历史用电大数据对应的时间段包括的单位时间段内的平均用电量。例如,平均用电量可以是居民平均用电量。
[0086] 例如,历史用电大数据对应的时间段可以是2022年11月04日全天。单位时间段对应的时长可以为1小时。则历史单位平均电量序列可以包括:2022年11月04日包括的24个小时包括的各个小时内的平均用电量。
[0087] 作为示例,本步骤可以包括以下步骤:
[0088] 第一步,根据上述当前用电大数据集合中的各个当前用电大数据包括的当前平均用电量和当前单位平均电量序列,确定每个当前用电大数据对应的当前第一异常性。
[0089] 例如,本步骤可以包括以下子步骤:
[0090] 第一子步骤,根据上述当前用电大数据集合中的各个当前用电大数据包括的当前平均用电量、上述当前用电大数据集合中的当前用电大数据包括的当前平均用电量的均值、上述当前用电大数据集合中当前用电大数据的数量,确定上述当前时间段对应的当前用电波动参数。
[0091] 比如,确定上述当前时间段对应的当前用电波动参数对应的公式可以为:
[0092]
[0093] 其中,是当前时间段对应的当前用电波动参数。 是以自然常数为底的指数函数。N是当前用电大数据集合中当前用电大数据的数量。n是当前用电大数据集合中的当前用电大数据的序号。 。 是当前时间段内,当前用电大数据集合中的第n个当前用电大数据包括的当前平均用电量。是当前用电大数据集合中的当前用电大数据包括的当前平均用电量的均值。
[0094] 又如,若当前时间段用第t天表示,第n个当前用电大数据为第n个区域的居民用电大数据,当前用电大数据集合中当前用电大数据的数量N等于所有区域的总数,则当前时间段内,当前用电大数据集合中的第n个当前用电大数据包括的当前平均用电量 是第t天第n个区域的居民的平均用电量。当前用电大数据集合中的当前用电大数据包括的当前平均用电量的均值 是第t天所有N个区域的居民的平均用电量的平均值。当前时间段对应的当前用电波动参数 是第t天的用电波动参数。
[0095] 实际情况中,可以为第 天的用电波动参数,其计算过程为对第天所有 个区域的居民的平均用电量方差的衰减取反,在第 天所有的居民平均用电量波动情况越大的时候(方差越大),值则越小,在第 天所有的居民平均用电量波动情况越小的时候(方差越小),值则越大。物理逻辑为当第天所有的 个区域的居民用的平均用电量差异比较大的时候,进行第 个区域的第一异常性的时候容易产生异常放大的情况(如,每个区域的居民平均用电量都有着显著的差异,即不同区域在相同的时间内用电趋势量化不明显),所以利用该参数对其进行约束,反之则相反。
[0096] 第二子步骤,根据上述当前用电大数据集合中的各个当前用电大数据包括的当前单位平均电量序列中的每个当前单位平均电量、上述当前用电大数据集合中当前用电大数据的数量,确定上述当前时间段包括的每个当前单位时间段对应的当前单位电波动参数。
[0097] 比如,确定当前时间段包括的每个当前单位时间段对应的当前单位电波动参数对应的公式可以为:
[0098]
[0099] 其中,是当前时间段包括的第i个当前单位时间段对应的当前单位电波动参数。是以自然常数为底的指数函数。 是当前用电大数据集合中的第 个当前用电大数据包括的当前单位平均电量序列中第i个当前单位平均电量,其中,第i个当前单位平均电量可以是第i个当前单位时间段内的平均用电量。i可以是当前时间段包括的当前单位时间段的序号。i还可以是当前单位平均电量的序号。N是当前用电大数据集合中当前用电大数据的数量。n和 是当前用电大数据集合中的当前用电大数据的序号。 是当前用电大数据集合中的第n个当前用电大数据包括的当前单位平均电量序列中第i个当前单位平均电量。
, , 。
[0100] 又如,若当前时间段用第t天表示,第i个当前单位时间段用第i小时表示,第n个当前用电大数据为第n个区域的居民用电大数据,个当前用电大数据为为第 个区域的居民用电大数据,当前用电大数据集合中当前用电大数据的数量N等于所有区域的总数,则当前用电大数据集合中的第 个当前用电大数据包括的当前单位平均电量序列中第i个当前单位平均电量 是第t天的第i个小时中的第 个区域的居民的平均用电量。当前用电大数据集合中的第n个当前用电大数据包括的当前单位平均电量序列中第i个当前单位平均电量是第t天的第i个小时中的第n个区域的居民的平均用电量。当前时间段包括的第i个当前单位时间段对应的当前单位电波动参数 是第t天的第i个小时的用电波动参数。
[0101] 实际情况中, 可以为第天的第个小时用电波动参数,其每个区域不同,对应的值大小不同,计算方式为利用当前区域的居民的平均用电量与整体所有区域的平均用电量做差,而后进行取反衰减,物理意义以第 个区域为例,当第 个区域与其他所有的区域在第个小时居民平均用电量差异较大的时候,利用第 个区域的第个小时的居民的平均用电量对第 个区域的居民平均用电量进行度量的时候,容易引发度量不准确的情况。在正常的情况下,假设第 个区域的居民平均用电量是异常的,其往往不符合第个小时整体所有区域的居民用电量的趋势,那么用其对第 个区域的第小时的居民平均用电量异常与否度量往往是不准确的,在这个时候 的值就特别小,而后在整体的求和计算中对其进行一定程度上的忽略,使得该异常数据不会对第 个区域的第小时的居民平均用电量异常造成较大的影响。
[0102] 第三子步骤,根据上述当前用电大数据集合中的各个当前用电大数据包括的当前单位平均电量序列、上述当前用电波动参数、上述当前时间段包括的各个当前单位时间段对应的当前单位电波动参数、上述当前用电大数据集合中当前用电大数据的数量,确定每个当前用电大数据对应的当前第一异常性。
[0103] 比如,确定每个当前用电大数据对应的当前第一异常性对应的公式可以为:
[0104]
[0105] 其中, 是当前用电大数据集合中第n个当前用电大数据对应的当前第一异常性。是当前时间段对应的当前用电波动参数。N是当前用电大数据集合中当前用电大数据的数量。n和 是当前用电大数据集合中的当前用电大数据的序号。 是当前时间段包括的第i个当前单位时间段对应的当前单位电波动参数。 是当前用电大数据集合中的第 个当前用电大数据包括的当前单位平均电量序列中第i个当前单位平均电量,其中,第i个当前单位平均电量可以是第i个当前单位时间段内的平均用电量。i可以是当前时间段包括的当前单位时间段的序号。i还可以是当前单位平均电量的序号。 是当前用电大数据集合中的第n个当前用电大数据包括的当前单位平均电量序列中第i个当前单位平均电量。是当前时间段包括的当前单位时间段的数量。如,若当前时间段对应的时长为1天,当前单位时间段对应的时长为1小时,则 。
[0106] 又如,若当前时间段用第t天表示,第i个当前单位时间段用第i小时表示,第n个当前用电大数据为第n个区域的居民用电大数据,个当前用电大数据为为第 个区域的居民用电大数据,当前用电大数据集合中当前用电大数据的数量N等于所有区域的总数,则 是第t天的第i个小时中的第 个区域的居民的平均用电量。 是第t天的第i个小时中的第n个区域的居民的平均用电量。 是第t天的第i个小时的用电波动参数。是第t天的用电波动参数。 。可以量化第n个区域的用电量与其余N‑1个区域的用电量在第t天内的第一异常性。
[0107] 实际情况中,通过每个区域(非第 个区域)每个小时与第 个区域每个小时的居民平均用电量在 的影响下计算的差异值,而后以 对整体进行约束求取平均值。以其余的个非第 个区域的每个小时的居民的平均用电量的趋势在 的影响下与 的约束下进行第 个区域的第 天的居民的平均用电量的异常计算, 越大,说明第 个地区的第 天的居民的平均用电量趋势与其余地区的用电趋势相悖越大,即该地区该时间段内的用电越异常,反之则相反。
[0108] 第二步,根据上述当前用电大数据集合中的每个当前用电大数据对应的历史用电大数据序列中的历史用电大数据包括的历史单位平均电量序列、每个当前用电大数据包括的当前单位平均电量序列,确定每个当前用电大数据对应的当前第二异常性。
[0109] 例如,本步骤可以包括以下子步骤:
[0110] 第一子步骤,将当前用电大数据对应的历史用电大数据序列中的历史用电大数据包括的历史单位平均电量序列中的历史单位平均电量的均值,确定为当前用电大数据对应的当前总电量均值。
[0111] 第二子步骤,根据上述当前用电大数据集合中的每个当前用电大数据对应的当前总电量均值、每个当前用电大数据对应的历史用电大数据序列中的历史用电大数据包括的历史单位平均电量序列、每个当前用电大数据包括的当前单位平均电量序列、当前时间段和历史时间段,确定每个当前用电大数据对应的当前第二异常性。
[0112] 比如,确定每个当前用电大数据对应的当前第二异常性对应的公式可以为:
[0113]
[0114] 其中, 是当前用电大数据集合中第n个当前用电大数据对应的当前第二异常性。n是当前用电大数据集合中的当前用电大数据的序号。是当前时间段包括的当前单位时间段的数量。i可以是当前时间段包括的当前单位时间段的序号。如,若当前时间段对应的时长为1天,当前单位时间段对应的时长为1小时,则 。 是当前用电大数据集合中的第n个当前用电大数据包括的当前单位平均电量序列中第i个当前单位平均电量。i还可以是当前单位平均电量的序号。 是当前用电大数据集合中第n个当前用电大数据对应的当前总电量均值。是历史用电大数据序列中历史用电大数据的数量。历史用电大数据序列中历史用电大数据的数量可以等于历史时间段对应的时长与当前时间段对应的时长的比值。
。如,若当前时间段对应的时长为1天,历史时间段对应的时长为7天,则 。 是当前用电大数据集合中第n个当前用电大数据对应的历史用电大数据序列中第 个历史用电大数据包括的历史单位平均电量序列中第i个历史单位平均电量。 是当前用电大数据集合中第n个当前用电大数据对应的历史用电大数据序列中第 个历史用电大数据包括的历史单位平均电量序列中第i个历史单位平均电量。 。
[0115] 又如,若当前时间段用第t天表示,第i个当前单位时间段用第i小时表示,第n个当前用电大数据为第n个区域的居民用电大数据,个当前用电大数据为为第 个区域的居民用电大数据,当前用电大数据集合中当前用电大数据的数量N等于所有区域的总数,第 个历史用电大数据为第t天的第前 天的居民用电大数据,第 个历史用电大数据为第t天的第前 天的居民用电大数据,则 。 表示第n个区域第t天的第i小时的居民平均用电量。 表示第n个区域第t天的第前 天第i小时的居民平均用电量。 表示第n个区域第t天的第前 天第i小时的居民平均用电量。 表示第n个区域第t天的前 天所有的第i小时的居民平均用电量的平均值。可以量化第 天的第 个区域的用电量与历史数据中的 天的第 个区域的用电量的第二异常性。
[0116] 实际情况中,在对第二异常性的分析过程中,是考虑到第 个区域的居民平均用电量在不同的时间内发生自身波动的可能(如,工作日内用电时间较为集中,所以工作日内的用电趋势往往更为明显,周末的时候居民用电比较零散,周末的用电趋势往往不太明显。),所以利用 天内的相同小时的用电量的平均值 加上 时间内每个相同小时内不同天的居民平均用电量的差异值的平均值来对 天内的相同小时的用电趋势进行表征,而后利用第天的第个小时的居民的平均用电量与前 天内的相同小时的用电趋势的差异值来表示天的第个小时的居民的平均用电量的离群程度,即异常程度。 越大,说明第 个区域第天的居民平均用电相较于前 天而言异常程度越大,反之则相反。
[0117] 第三步,根据上述当前用电大数据集合中的每个当前用电大数据对应的当前第一异常性和当前第二异常性,确定每个当前用电大数据对应的相对异常度。
[0118] 例如,确定每个当前用电大数据对应的相对异常度对应的公式可以为:
[0119]
[0120] 其中, 是当前用电大数据集合中第n个当前用电大数据对应的相对异常度。 是当前用电大数据集合中第n个当前用电大数据对应的当前第一异常性。 是当前用电大数据集合中第n个当前用电大数据对应的当前第二异常性。
[0121] 实际情况中,以第 个区域对应的居民用电大数据 为例,就第 个区域而言,在不同的时间下,该区域的用电量往往是不一样的(此处的不同时间可以指不同天数),而在相同的时间(如,同一天)内第 个区域与其余的 个区域的用电量往往应该是相似的,所以对不同的时间的第 个区域的用电量的变化趋势、相同时间内的第 个区域的用电量和不同区域的用电量的变化趋势分别进行差异性的分析,量化得到第一异常性与第二异常性,而后根据量化的结果对第 个区域内的用电量数据异常程度进行分析。第一异常性 是通过用来描述第 个地区第 天的的居民的平均用电与其余 个区域而言的异常程度,第二异常性 是通过用来描述第 个地区第天的的居民的平均用电与自身前 天而言的异常程度。以这两个数据的乘积对第 个区域的第天的居民平均用电量的异常程度进行描述,越大说明第 天的第 个地区的居民的平均用电量的异常程度越大,而居民的平均用电量是通过第 个区域的第天的即对应的第天区域的居民用电大数据 获取而来,所以第 个区域的居民用电大数据 的异常程度也就越大;相反的,第 个区域的居民用电大数据 的异常程度也就越小。实现了根据不同区域的同一时间的用电大数据趋势与相同区域的不同时间的用电大数据的趋势进行每个区域的用电大数据的异常程度特征量化。并且,当前用电大数据对应的相对异常度越相似,后续进行分类分区存储之后,对于用电大数据的异常进行分析调取数据往往更为方便,更加节省计算资源,并且对于不同异常程度的同类当前用电大数据进行不同压缩程度的存储时往往更为方便。
[0122] 步骤S4,根据当前用电大数据集合中的各个当前用电大数据对应的相对重复性和相对异常度,对当前用电大数据集合中的当前用电大数据进行聚类,得到当前用电大数据类别集合。
[0123] 在一些实施例中,可以根据上述当前用电大数据集合中的各个当前用电大数据对应的相对重复性和相对异常度,对上述当前用电大数据集合中的当前用电大数据进行聚类,得到当前用电大数据类别集合。
[0124] 作为示例,本步骤可以包括以下步骤:
[0125] 第一步,将上述当前用电大数据集合中的每个当前用电大数据对应的相对重复性,确定为上述当前用电大数据对应的横坐标。
[0126] 第二步,将上述当前用电大数据集合中的每个当前用电大数据对应的相对异常度,确定为上述当前用电大数据对应的纵坐标。
[0127] 第三步,将上述当前用电大数据集合中的每个当前用电大数据对应的横坐标和纵坐标,组合为上述当前用电大数据对应的当前坐标。
[0128] 第四步,根据上述当前用电大数据集合中的各个当前用电大数据对应的当前坐标,确定上述当前用电大数据集合中各个当前用电大数据之间的欧式距离。
[0129] 第五步,根据上述当前用电大数据集合中各个当前用电大数据之间的欧式距离,对上述当前用电大数据集合中的当前用电大数据进行聚类,得到当前用电大数据类别集合。
[0130] 例如,可以根据上述当前用电大数据集合中各个当前用电大数据之间的欧式距离,利用现有的距离聚类算法,对上述当前用电大数据集合中的当前用电大数据进行聚类,得到当前用电大数据类别集合。利用不同区域的用电大数据的相对重复性特征与异常程度特征进行综合聚类,可以便于后续对数据进行分类别存储。
[0131] 实际情况中,利用各个当前用电大数据对应的相对重复性和相对异常度进行聚类,可以使得具有相对重复性相似的,相对异常度相似的当前用电大数据被聚为一类,可以便于后续的处理。
[0132] 步骤S5,对当前用电大数据类别集合中的当前用电大数据进行分类存储处理。
[0133] 在一些实施例中,可以对上述当前用电大数据类别集合中的当前用电大数据进行分类存储处理。
[0134] 作为示例,本步骤可以包括以下步骤:
[0135] 第一步,对上述当前用电大数据类别集合中的每个当前用电大数据类别中各个当前用电大数据进行压缩,得到上述当前用电大数据类别对应的压缩文件。
[0136] 例如,可以利用现有的压缩技术,对当前用电大数据类别中各个当前用电大数据进行压缩,得到该当前用电大数据类别对应的压缩文件。
[0137] 第二步,对上述当前用电大数据类别集合中的各个当前用电大数据类别对应的压缩文件进行分类存储。
[0138] 例如,可以对上述当前用电大数据类别集合中的各个当前用电大数据类别对应的压缩文件进行分区存储。即可以根据当前用电大数据所在的当前用电大数据类别,实现对当前用电大数据的分区存储,可以便于后续进行用电大数据异常程度分析,往往可以精确调用数据,可以减少计算量,可以减少计算资源的占用,并且还可以满足压缩所需要的数据的重复性,可以提高后续对用电大数据异常程度分析的效率。
[0139] 本发明的一种用于数字信息的大数据分析处理方法,利用相对重复性与异常性对不同的区域的用电大数据进行聚类压缩存储处理,解决了后续对用电大数据异常程度分析的效率低下的技术问题,提高了后续对用电大数据异常程度分析的效率。首先,获取当前用电大数据集合和上述当前用电大数据集合中的每个当前用电大数据对应的历史用电大数据序列。实际情况中,获取当前用电大数据集合,可以便于后续比较当前用电大数据集合中当前用电大数据之间的重复性。其次,获取当前用电大数据对应的历史用电大数据序列,可以便于后续根据历史用电大数据序列可以判断当前用电大数据的异常性。接着,根据上述当前用电大数据集合,对上述当前用电大数据集合中的每个当前用电大数据进行重复性分析处理,得到每个当前用电大数据对应的相对重复性。实际情况中,通过当前用电大数据集合,对当前用电大数据进行重复性分析处理,可以提高当前用电大数据对应的相对重复性确定的准确度。并且,可以便于后续基于当前用电大数据对应的相对重复性,对当前用电大数据进行压缩,可以提高对当前用电大数据进行压缩的效率。然后,根据上述当前用电大数据集合和上述当前用电大数据集合中的各个当前用电大数据对应的历史用电大数据序列,对上述当前用电大数据集合中的每个当前用电大数据进行异常性分析处理,得到每个当前用电大数据对应的相对异常度。实际情况中,综合考虑当前用电大数据集合和各个当前用电大数据对应的历史用电大数据序列,可以提高当前用电大数据对应的相对异常度确定的准确度。并且,可以便于后续对不同异常程度的大数据进行分类处理,可以减少智能电网的数字化转型对数据进行二次异常性分析的算力浪费。之后,根据上述当前用电大数据集合中的各个当前用电大数据对应的相对重复性和相对异常度,对上述当前用电大数据集合中的当前用电大数据进行聚类,得到当前用电大数据类别集合。最后,对上述当前用电大数据类别集合中的当前用电大数据进行分类存储处理。因此,本发明利用相对重复性与异常性对不同的区域的用电大数据进行聚类压缩存储处理,在进行压缩或者存储的时候不仅能满足压缩所需要的数据的重复性,也能对不同异常程度的大数据进行分类处理,减少了智能电网的数字化转型对数据进行二次异常性分析的算力浪费,解决了后续对用电大数据异常程度分析的效率低下的技术问题,提高了后续对用电大数据异常程度分析的效率。
[0140] 以上上述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围,均应包含在本申请的保护范围之内。