一种基于用电模式隶属评分的企业环保管控响应研判方法转让专利

申请号 : CN202010316606.1

文献号 : CN111539845B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 刘畅杨迎春罗晓伊滕予非苏少春唐伟靳旦彭理谦

申请人 : 国网四川省电力公司电力科学研究院

摘要 :

本发明公开了一种基于用电模式隶属评分的企业环保管控响应研判方法,包括:S1:获取待监测企业的用户历史用电曲线;S2:对非环保管控时段用户用电曲线进行聚类,挖掘企业典型生产模式曲线带;S3:提取S1中标记的管控时段用户用电数据,提取管控时段前后一段时长的非管控时段生产用电数据,分别对其进行匹配,建立环保指令响应模型库;S4:进行企业环保管控响应研判,对异常企业进行预警。本发明提出了典型曲线带的计算方法,并通过构建计算历史管控曲线对生产模式的隶属关系,建立环保指令响应模型库,提出了企业响应环保指令的概率评估方法,为环保部门实现管控措施响应信息远程监控和异常生产企业精准控制提供技术手段。

权利要求 :

1.一种基于用电模式隶属评分的企业环保管控响应研判方法,其特征在于,该方法包括以下步骤:步骤1:获取待监测企业的用户历史用电曲线,并进行数据清洗和标记;

步骤2:根据步骤1的标记结果对待监测企业的非环保管控时段用户用电曲线进行聚类,挖掘企业典型生产模式曲线带,辨识出典型生产模式曲线;

步骤3:分别提取步骤1中标记的管控时段用户用电数据,提取管控时段前后一段时长的非管控时段生产用电数据,分别对其进行对比匹配,建立环保指令响应模型库;

步骤4:根据步骤3建立的环保指令响应模型库,进行企业环保管控响应研判,对异常企业进行预警;

步骤3包括以下子步骤:

步骤31:提取管控时段前后一段时长的非管控时段历史生产用电数据,并根据日期远近进行赋权;

步骤32:针对步骤2辨识出的典型生产模式曲线形成模式匹配度评分,其中,距离管控时段越近的曲线评分权重越高;

样本Di对模式c的度量距离distmod(c,Di)计算公式如下:式中,dist为距离函数;Lowerbc为模式c生产模式曲线带下限,Upperbc为模式c生产模式曲线带上限;若样本Di位于模式c的曲线带内,则该样本与模式c的距离为零;其他情况,距离定义为样本与c模式上限的距离和其与c模式下限的距离的较小值;

样本Di对模式c的隶属度Score(i,c)计算公式如下:式中,Nc为生产模式数量;

管控前后所属是生产模式c的评分Sc(c)为:

式中,ND为样本数量,βi为样本评分权重;

步骤33:选择评分较高的生产模式,通过求取生产模式上下限的均值,生成与管控日样本所对应的生产模式曲线;

步骤34:通过对管控日样本与对应的生产模式曲线进行对比,学习不同生产模式下的管控响应模型,进而针对不同的企业,生成环保指令响应模型库;包括:选择一个生产模式,根据标记的各类管控样本,生成该模式下的典型管控生产曲线带;

求出典型管控生产曲线带与对应的生产模式曲线在对应时刻比值的最大值LU和最小值LL,作为管控响应深度的范围,记作管控响应边界曲线;

其中,需对历史管控样本的响应情况进行区分,选取响应指令的样本进行模型库的建立,对于明显不响应的数据样本应予以去除;当现有管控样本不满足训练需求时,根据环保管控指令的严厉程度人工建立管控指令模型,并在生产运行过程中不断校正的方式予以修正;

步骤35:根据环保管控指令的严厉程度,进行模型的正确性校验;

步骤2包括以下子步骤:

步骤21:对非环保管控时段用户用电曲线进行聚类:采用层次聚类和k-means相结合的方法进行分析,具体如下:步骤211:采用基于层次聚类法生成聚类树;

步骤212:按照聚类树距离选择最优聚类数目k_cluster;

步骤213:按照给定聚类数k_cluster进行k-means聚类;

步骤214:聚类效果评估,满足条件则结束分类;否则返回步骤212重新聚类;

步骤22:挖掘企业典型生产模式曲线带:根据步骤21的聚类结果,按照不同类生成典型曲线带;其中,典型生产模式曲线带的上限Upperb(i)、下限Lowerb(i)计算方法如下:式中:i的取值范围为1~k;c的取值范围为1~分类数;Wci为第c类中所有曲线第i时刻值的集合,mean和δ分别为均值函数和标准差函数。

2.根据权利要求1所述的一种基于用电模式隶属评分的企业环保管控响应研判方法,其特征在于,步骤4包括以下子步骤:步骤41:提取待校核管控时段前一段时长的非管控时段历史生产用电数据,并根据日期远近进行赋权;

步骤42:生成与管控日样本所对应的生产模式曲线;

步骤43:结合该企业的管控指令模型和步骤42生成的生产模式曲线,计算管控响应边界曲线;

步骤44:根据实时用电曲线,与管控响应边界曲线进行对比,实时计算响应概率,判断企业环保响应情况,并进行评估,评估方法如下:记某一时刻待评估企业电量数据为S(i),则企业未响应环保指令的概率Pro(i)为:式中,S(i)为某一时刻待评估企业电量数据,LU(i)为管控响应边界曲线上边界,LL(i)为管控响应边界曲线下边界;

而管控时段内企业未响应环保指令的总概率Pro为:

式中,Pro(i)是企业为响应环保指令的概率;

若管控时段内企业未响应环保指令的总概率高于50%,进行预警;若管控时段内企业未响应环保指令的总概率低于50%,不进行预警;同时,针对不同的企业按照管控时段内企业未响应环保指令的总概率的大小进行排序,并按照环保部门要求提交排名靠前的企业名单。

3.根据权利要求1所述的一种基于用电模式隶属评分的企业环保管控响应研判方法,其特征在于,步骤1包括以下子步骤:步骤11:从电网公司用电采集系统获取待监测企业用户历史用电曲线,包括一天多个时间点的电量数据或功率数据;

步骤12:对步骤11中采集到的数据进行数据清洗,其中数据清洗包括异常数据剔除和缺失数据补齐;

步骤13:对步骤12中清洗后的数据进行历史数据标记初步标记和管控标记:初步标记包括工作日与非工作日,工作日标记为0,非工作日标记为1;管控标记按照环保部门的要求包括无管控、红色管控、橙色管控和黄色管控四类,分别对应标记为0、1、2和3;

步骤14:进行工作日标记和非工作日标记的有效性判定:对工作日数据和非工作日数据的相关性进行分析,判断该企业工作日和非工作日的用电情况是否呈现较大差异,若差异较大,对非工作日和工作日分别进行处理;若差异较小,则不区分工作日和非工作日。

4.根据权利要求3所述的一种基于用电模式隶属评分的企业环保管控响应研判方法,其特征在于,步骤S12中所述异常数据剔除是对明显不符合实际情况的数据进行剔除;

步骤S12中所述缺失数据补齐是采用对当日用电曲线采用三次样条插值算法,或者曲线拟合法,或者相邻两点的均值算法对缺失数据进行补齐。

5.根据权利要求4所述的一种基于用电模式隶属评分的企业环保管控响应研判方法,其特征在于,步骤S12中采用以均值算法对缺失数据进行补齐,记作N时刻数据缺失,则缺失时刻的补齐数据为PN:式中,PN-1为N时刻的前一时刻的数据,PN+1为N时刻的后一时刻的数据。

6.根据权利要求3所述的一种基于用电模式隶属评分的企业环保管控响应研判方法,其特征在于,步骤14中进行工作日标记和非工作日标记的有效性判定,具体判断标准如下:分别计算工作日样本和非工作日样本数据集的上包络线和均值线;工作日样本数目为N1,样本维数为k=24/采样周期,将工作日样本记作为N1×k的矩阵;非工作日样本记作为N2×k的矩阵,N2为非工作日样本数目;则样本的包络线和均值线均为1×k的矩阵,其求解方法为:Gupper(i)=max(Wi)        (2)式中:i的取值范围为1~k;Wi为W所有输入样本第i时刻的值的集合;max为取最大值函数;Gupper为上包络线向量;

式中:num为W中的样本数目,Gmean为均值向量;

计算工作日样本和非工作日样本的特征线的差值的积分,计算公式如下:式中:I为差值积分;f为特征指标,为上包络线upper和均值线mean;下标1代表工作日,下标2代表非工作日;

若差值积分满足以下公式,则不必区分工作日与非工作日:If<αk max(W)        (5)

式中,α为调节系数,max(W)为全部样本中的最大值。

说明书 :

一种基于用电模式隶属评分的企业环保管控响应研判方法

技术领域

[0001] 本发明涉及电力大数据与环保管控数据交互分析技术领域,尤其涉及一种基于用电模式隶属评分的企业环保管控响应研判方法。

背景技术

[0002] 近年来,随着国家电网泛在电力物联网的建设,电网呈现信息化、数字化、智能化特征,大量电网数据为国网公司开拓电网数字经济的蓝海提供了有利的平台和坚实的基础。目前,大部分研究主要集中在泛在电力物联网与智能电网之间的融合交互,旨在利用信息化手段为传统电网赋能,提升电网的运行效率和客户服务质量,然而,对于电网数据在其他行业的应用尚处于初步探索阶段,相关的问题分析方法仍有待进一步研究。
[0003] 将用户用电数据用于环保管控监测,为有关政府部门提供管控效果反馈信息和决策支持是对“枢纽型”、“平台型”、“共享型”电网的积极探索。一方面,有效的促进电网数据的经济效益挖掘,有利于国家电网公司战略转型策略的实施;另一方面,可有效提升环保监测的效率和准确性,实现跨专业、跨行业的数据共享、技术支撑和互利共赢。
[0004] 然而,由于不同的企业生产情况和用能情况各不相同,同一企业在不同季节、不同时间段在产量、工艺等方面也有较大差异,以往通过日电量数据反映用户生产水平和环保管控措施响应情况的方法难以适应“蓝天保卫战”的实际需求。

发明内容

[0005] 本发明所要解决的技术问题是现有的环保管控监测方法不能精准地实现生产企业对环保部门管控指令响应情况的研判和异常生产企业的把控,难以满足实际需求。本发明提供了解决上述问题的一种基于用电模式隶属评分的企业环保管控响应研判方法,本发明针对电力大数据对于环保监测应用场景,旨在建立电力用户用电曲线与环保指令之间的对应关系模型,实现生产企业对环保部门管控指令响应情况的研判和异常生产企业的精准把控。
[0006] 本发明通过下述技术方案实现:
[0007] 一种基于用电模式隶属评分的企业环保管控响应研判方法,该方法包括以下步骤:
[0008] 步骤1:获取待监测企业的用户历史用电曲线,并进行数据清洗和标记;
[0009] 步骤2:根据步骤1的标记结果对待监测企业的非环保管控时段用户用电曲线进行聚类,挖掘企业典型生产模式曲线带,辨识出典型生产模式曲线;
[0010] 步骤3:分别提取步骤1中标记的管控时段用户用电数据,提取管控时段前后一段时长的非管控时段生产用电数据,分别对其进行对比匹配,建立环保指令响应模型库;
[0011] 步骤4:根据步骤3建立的环保指令响应模型库,进行企业环保管控响应研判,对异常企业进行预警。
[0012] 其中,生产模式曲线带,是生产模式上、下限之间的范围;
[0013] 生产模式曲线为曲线上、下限的均值;
[0014] 通过对某一生产模式下所有的管控曲线的集合求取管控模式的上、下限,该模式下管控曲线上、下限之间的范围就是典型管控生产曲线带;
[0015] 环保指令响应模型是指,某一生产模式下的响应深度曲线范围,可以通过管控曲线带上下限与生产模式曲线对应相除所得到的两条曲线(LU\LL)求取;环保指令响应模型库是指所有模式下对应环保指令响应模型的集合。
[0016] 工作原理如下:
[0017] 将用户用电数据用于环保管控监测,为有关政府部门提供管控效果反馈信息和决策支持是对“枢纽型”、“平台型”、“共享型”电网的积极探索。一方面,有效的促进电网数据的经济效益挖掘,有利于国家电网公司战略转型策略的实施;另一方面,可有效提升环保监测的效率和准确性,实现跨专业、跨行业的数据共享、技术支撑和互利共赢。然而,由于不同的企业生产情况和用能情况各不相同,同一企业在不同季节、不同时间段在产量、工艺等方面也有较大差异,以往通过日电量数据反映用户生产水平和环保管控措施响应情况的方法难以适应实际需求。
[0018] 因此,需要研究扩展时间维度电量信息用于生产企业环保管控执行情况的监测及精准辨识方法,充分挖掘用户用电信息与环保管控之间的关联关系,实现异常生产企业的精确查找。本发明采用上述方案,从用户的多维度历史用电数据入手,提出了典型曲线带的计算方法,并通过构建计算历史管控曲线对生产模式的隶属关系,建立环保指令响应模型库,提出了企业响应环保指令的概率评估方法。在此基础上,实现企业环保管控响应研判,为环保部门实现管控措施响应信息远程监控和异常生产企业精准控制提供技术手段。
[0019] 进一步地,步骤1包括以下子步骤:
[0020] 步骤11:从电网公司用电采集系统获取待监测企业用户历史用电曲线,包括一天多个时间点的电量数据或功率数据,采集周期一般可为15min,1h,2h等。
[0021] 步骤12:对步骤11中采集到的数据进行数据清洗,其中数据清洗包括异常数据剔除和缺失数据补齐;
[0022] 步骤13:对步骤12中清洗后的数据进行历史数据标记初步标记和管控标记:初步标记包括工作日与非工作日(包括周末和节假日),工作日标记为0,非工作日标记为1;管控标记按照环保部门的要求包括无管控、红色管控、橙色管控和黄色管控四类,分别对应标记为0、1、2和3;
[0023] 步骤14:进行工作日标记和非工作日标记的有效性判定:对工作日数据和非工作日数据的相关性进行分析,判断该企业工作日和非工作日的用电情况是否呈现较大差异,若差异较大,对非工作日和工作日分别进行处理;若差异较小,则不区分工作日和非工作日。
[0024] 进一步地,步骤S12中所述异常数据剔除是对明显不符合实际情况的数据进行剔除,例如未配置自用电源的用户量测量出现负值、电量数据异常增大;
[0025] 步骤S12中所述缺失数据补齐是采用对当日用电曲线采用三次样条插值算法,或者曲线拟合法,或者相邻两点的均值算法对缺失数据进行补齐。
[0026] 进一步地,步骤S12中采用以均值算法对缺失数据进行补齐,记作N时刻数据缺失,则缺失时刻的补齐数据为PN:
[0027]
[0028] 式中,PN-1为N时刻的前一时刻的数据,PN+1为N时刻的后一时刻的数据。
[0029] 特别的,对于一天内数据缺失超过三分之一的历史数据,认为该数据不可信,予以去除。
[0030] 进一步地,步骤14中进行工作日标记和非工作日标记的有效性判定,具体判断标准如下:
[0031] 分别计算工作日样本和非工作日样本数据集的上包络线和均值线;以采样时间为1h的样本为例进行说明,工作日样本数目为N1,样本维数为k=24,将工作日样本记作为N1×24的矩阵;非工作日样本记作为N2×24的矩阵,N2为非工作日样本数目;则样本的包络线和均值线均为1×24的矩阵(或24维向量),其求解方法为:
[0032] Gupper(i)=max(Wi)  (2)
[0033] 式中:i的取值范围为1~k;Wi为W所有输入样本第i时刻的值的集合;max为取最大值函数;Gupper为上包络线向量;
[0034]
[0035] 式中:num为W中的样本数目,Gmean为均值向量;
[0036] 计算工作日样本和非工作日样本的特征线的差值的积分,计算公式如下:
[0037]
[0038] 式中:I为差值积分;f为特征指标,为上包络线upper和均值线mean;下标1代表工作日,下标2代表非工作日;
[0039] 若差值积分满足以下公式,则不必区分工作日与非工作日:
[0040] If<αkmax(W)  (5)
[0041] 式中,α为调节系数,max(W)为全部样本中的最大值。
[0042] 进一步地,步骤2包括以下子步骤:
[0043] 步骤21:对非环保管控时段用户用电曲线进行聚类:为确定最优聚类数,采用层次聚类和k-means相结合的方法进行分析,具体如下:
[0044] 步骤211:采用基于层次聚类法生成聚类树;
[0045] 步骤212:按照聚类树距离选择最优聚类数目k_cluster;
[0046] 步骤213:按照给定聚类数k_cluster进行k-means聚类;
[0047] 步骤214:聚类效果评估,满足条件则结束分类;否则返回步骤212重新聚类;
[0048] 步骤22:挖掘企业典型生产模式曲线带:根据步骤21的聚类结果,按照不同类生成典型曲线带;其中,典型生产模式曲线带的上限Upperb(i)、下限Lowerb(i)计算方法如下:
[0049]
[0050] 式中:i的取值范围为1~k;c的取值范围为1~分类数;Wci为第c类中所有曲线第i时刻值的集合,mean和δ分别为均值函数和标准差函数。
[0051] 进一步地,步骤3包括以下子步骤:
[0052] 步骤31:提取管控时段前后一段时长(比如三十天)的非管控时段历史生产用电数据,并根据日期远近进行赋权;当工作日与非工作日生产模式差异较大时,应对工作日和非工作日分别处理;
[0053] 步骤32:针对步骤2辨识出的典型生产模式曲线形成模式匹配度评分,其中,距离管控时段越近的曲线评分权重越高;
[0054] 样本Di对模式c的度量距离distmod(c,Di)计算公式如下:
[0055]
[0056] 式中,dist为距离函数,可以采用欧式距离、马氏距离或其他;若样本Di位于模式c的曲线带内,则该样本与模式c的距离为零,其他情况,距离定义为样本与c模式上限的距离和其与模式c典型生产模式曲线带下限的距离的小值;Lowerbc为模式c典型生产模式曲线带下限,Upperbc为模式c典型生产模式曲线带上限;
[0057] 样本Di对模式c的隶属度Score(i,c)计算公式如下:
[0058]
[0059] 式中,Nc为生产模式数量;
[0060] 管控前后所属是生产模式c的评分Sc(c)为:
[0061]
[0062] 式中,ND为样本数量,βi为样本评分权重;
[0063] 步骤33:选择评分较高的生产模式,通过求取生产模式上下限的均值,生成与管控日样本所对应的生产模式曲线;
[0064] 步骤34:建立管控响应模型:通过对管控日样本与对应的生产模式曲线进行对比,学习不同生产模式下的管控响应模型,进而针对不同的企业,生成环保指令响应模型库;包括:
[0065] 选择一个生产模式,根据标记的各类管控样本,生成该模式下的典型管控生产曲线带,生成方法同公式(6);
[0066] 求出典型管控生产曲线带与对应的生产模式曲线在对应时刻比值的最大值LU和最小值LL,作为管控响应深度的范围,记作管控响应边界曲线;
[0067] 特别的,需对历史管控样本的响应情况进行区分,选取响应指令的样本进行模型库的建立,对于明显不响应的数据样本应予以去除;当现有管控样本不满足训练需求时,根据环保管控指令的严厉程度人工建立管控指令模型,并在生产运行过程中不断校正的方式予以修正;针对不同的企业,生成环保指令响应模型库。
[0068] 步骤35:根据环保管控指令的严厉程度,进行模型的正确性校验。
[0069] 进一步地,步骤4包括以下子步骤:
[0070] 步骤41:提取待校核管控时段前一段时长(比如三十天)的非管控时段历史生产用电数据,并根据日期远近进行赋权;
[0071] 步骤42:生成与管控日样本所对应的生产模式曲线;
[0072] 步骤43:结合该企业的管控指令模型和步骤42生成的生产模式曲线,计算管控响应边界曲线(包括上边界LU和下边界LL);管控时段内,用户生产模式曲线受管控响应边界曲线限制;
[0073] 步骤44:根据实时用电曲线,与管控响应边界曲线进行对比,实时计算响应概率,判断企业环保响应情况,并进行评估,评估方法如下:
[0074] 记某一时刻待评估企业电量数据为S(i),则企业未响应环保指令的概率Pro(i)为:
[0075]
[0076] 式中,S(i)为某一时刻待评估企业电量数据,LU(i)为管控响应边界曲线上边界,LL(i)为管控响应边界曲线下边界;
[0077] 而管控时段内企业未响应环保指令的总概率Pro为:
[0078]
[0079] 若管控时段内企业未响应环保指令的总概率高于50%,进行预警;若管控时段内企业未响应环保指令的总概率低于50%,不进行预警;同时,针对不同的企业按照管控时段内企业未响应环保指令的总概率的大小进行排序,并按照环保部门要求提交排名靠前的企业名单。
[0080] 本发明与现有技术相比,具有如下的优点和有益效果:
[0081] 本发明一种基于用电模式隶属评分的企业环保管控响应研判方法,从用户的多维度历史用电数据入手,提出了典型曲线带的计算方法,并通过构建计算历史管控曲线对生产模式的隶属关系,建立环保指令响应模型库,提出了企业响应环保指令的概率评估方法。在此基础上,实现企业环保管控响应研判和异常生产企业的精准把控,为环保部门实现管控措施响应信息远程监控和异常生产企业精准控制提供技术手段。

附图说明

[0082] 此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
[0083] 图1为本发明一种基于用电模式隶属评分的企业环保管控响应研判方法流程图。
[0084] 图2为本发明实施例中步骤2的聚类结果图。
[0085] 图3为本发明实施例中步骤2生成典型生产模式曲线带结果图。
[0086] 图4为本发明步骤1的子步骤流程图。
[0087] 图5为本发明步骤2的子步骤流程图。
[0088] 图6为本发明步骤3的子步骤流程图。
[0089] 图7为本发明步骤4的子步骤流程图。

具体实施方式

[0090] 为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
[0091] 实施例1
[0092] 如图1至图7所示,本发明一种基于用电模式隶属评分的企业环保管控响应研判方法,该方法包括以下步骤:
[0093] 步骤1:获取待监测企业的用户历史用电曲线,并进行数据清洗和标记;
[0094] 步骤2:根据步骤1的标记结果对待监测企业的非环保管控时段用户用电曲线进行聚类,挖掘企业典型生产模式曲线带,辨识出典型生产模式曲线;
[0095] 步骤3:分别提取步骤1中标记的管控时段用户用电数据,提取管控时段前后一段时长的非管控时段生产用电数据,分别对其进行对比匹配,建立环保指令响应模型库;
[0096] 步骤4:根据步骤3建立的环保指令响应模型库,进行企业环保管控响应研判,对异常企业进行预警。
[0097] 具体地,如图1所示,图1为本发明实施例提供的基于管控要求与用电模式隶属评分的企业环保管控响应研判方法流程图,本发明方法的实施详细步骤如下:
[0098] 如图4所示,步骤1的具体步骤如下:
[0099] 步骤11:从电网公司用电采集系统获取待监测企业用户历史用电曲线,以某环保监测企业为例,从用电采集系统中选取该企业一年的生产用电数据集,该数据采样周期为1h;
[0100] 步骤12:对步骤11中采集到的数据进行数据清洗,检测到该数据中4-28日8:00至18点数据缺失,缺失数据超过1/3,将该日样本从历史数据中去除;
[0101] 步骤13:对步骤12中清洗后的数据进行历史数据标记初步标记和管控标记:初步标记包括工作日与非工作日(包括周末和节假日),工作日标记为0,非工作日标记为1;管控标记按照环保部门的要求包括无管控、红色管控、橙色管控和黄色管控四类,分别对应标记为0、1、2和3;
[0102] 步骤14:进行工作日标记和非工作日标记的有效性判定:对工作日数据和非工作日数据的相关性进行分析,判断该企业工作日和非工作日的用电情况是否呈现较大差异,若差异较大,对非工作日和工作日分别进行处理;若差异较小,则不区分工作日和非工作日。
[0103] 其中,步骤14中进行工作日标记和非工作日标记的有效性判定,具体判断标准如下:
[0104] 分别计算工作日样本和非工作日样本数据集的上包络线和均值线;以采样时间为1h的样本为例进行说明,工作日样本数目为N1,样本维数为k=24,将工作日样本记作为N1×24的矩阵;非工作日样本记作为N2×24的矩阵,N2为非工作日样本数目;则样本的包络线和均值线均为1×24的矩阵(或24维向量),其求解方法为:
[0105] Gupper(i)=max(Wi)  (2)
[0106] 式中:i的取值范围为1~k;Wi为W所有输入样本第i时刻的值的集合;max为取最大值函数;Gupper为上包络线向量;
[0107]
[0108] 式中:num为W中的样本数目,Gmean为均值向量;
[0109] 计算工作日样本和非工作日样本的特征线的差值的积分,计算公式如下:
[0110]
[0111] 式中:I为差值积分;f为特征指标,为上包络线upper和均值线mean;下标1代表工作日,下标2代表非工作日;
[0112] 若差值积分满足以下公式,则不必区分工作日与非工作日:
[0113] If<αkmax(W)  (5)
[0114] 式中,α为调节系数,max(W)为全部样本中的最大值。
[0115] 本实施例中α取0.2,k为24,计算得:
[0116] max(W)=731.8960
[0117] Iupper=1547.2
[0118] Imean=2276.0
[0119] 均满足公式(5),判定工作日标记无效,该企业的生产作息并非按照国家工作日排列;后续计算过程中不必考虑工作日标记。
[0120] 如图5所示,步骤2的具体步骤如下:
[0121] 步骤21:对非环保管控时段用户用电曲线进行聚类:为确定最优聚类数,采用层次聚类和k-means相结合的方法进行分析,具体如下:
[0122] 首先对所选择样本进行层次聚类生成聚类树,按照聚类树中距离最大原则进行层次划分,本实施例中划分为2类;
[0123] 根据给出的聚类树,采用k-means聚类法对数据进行聚类,聚类结果附图2所示;
[0124] 校核聚类结果,满足类间距离与类中距离的要求,聚类结束。
[0125] 步骤22:挖掘企业典型生产模式曲线带:根据步骤21的聚类结果,按照不同类生成典型曲线带;其中,典型生产模式曲线带的上限Upperb(i)、下限Lowerb(i)计算方法如下:
[0126]
[0127] 式中:i的取值范围为1~k;c的取值范围为1~分类数;Wci为第c类中所有曲线第i时刻值的集合,mean和δ分别为均值函数和标准差函数。
[0128] 本实施例中型生产模式曲线带如附图3所示。
[0129] 步骤3,分别提取步骤1中标记的红色管控、橙色管控和黄色管控时段用户用电数据,提取管控时段前后三十天的非管控时段生产用电数据,分别对进行匹配,建立环保指令响应模型库。如图6所示,步骤3的具体步骤如下:
[0130] 步骤31:提取管控时段前后三十天的非管控时段历史生产用电数据,形成样本集合D;
[0131] 步骤32:针对步骤2辨识出的典型生产模式曲线形成模式匹配度评分,其中,距离管控时段越近的曲线评分权重越高;当工作日与非工作日生产模式差异较大时,应对工作日和非工作日分别处理;
[0132] 样本Di对模式c的度量距离distmod(c,Di)计算公式如下:
[0133]
[0134] 式中,dist为距离函数,可以采用欧式距离、马氏距离或其他;Lowerbc为模式c生产模式曲线带的下限,Upperbc为模式c生产模式曲线带的上限;若样本Di位于模式c的曲线带内,则该样本与模式c的距离为零,其他情况,距离定义为样本与c模式上限的距离和其与模式c下限的距离的较小值;
[0135] 样本Di对模式c的隶属度Score(i,c)计算公式如下:
[0136]
[0137] 式中,Nc为生产模式数量;
[0138] 管控前后所属是生产模式c的评分Sc(c)为:
[0139]
[0140] 式中,ND为样本数量,βi为样本评分权重;本实施例中,取管控前10天的数据权重为0.5,管控前20天-10天的数据权重为0.3,管控前30天-20天的数据权重为0.2。
[0141] 步骤33:选择评分较高的生产模式,通过求取生产模式上下限的均值,生成与管控日样本所对应的生产模式曲线;本实施例中,16个管控样本管控前所属模式为模式2,13个样本管控前所属模式为模式1。
[0142] 步骤34:通过对管控日样本与对应的生产模式曲线进行对比,学习不同生产模式下的管控响应模型,进而针对不同的企业,生成环保指令响应模型库;包括:
[0143] 选择一个生产模式,根据标记的各类管控样本,生成该模式下的典型管控生产曲线带,生成方法同公式(6);
[0144] 求出典型管控生产曲线带与对应的生产模式曲线在对应时刻比值的最大值LU和最小值LL,作为管控响应深度的范围,记作管控响应边界曲线;
[0145] 特别的,需对历史管控样本的响应情况进行区分,选取响应指令的样本进行模型库的建立,对于明显不响应的数据样本应予以去除;当现有管控样本不满足训练需求时,根据环保管控指令的严厉程度人工建立管控指令模型;本实施例中,缺乏红色管控响应曲线,根据用户情况构造了红色管控指令边界曲线,在未来生产运行过程中不断校正的方式予以修正。
[0146] 步骤35:根据环保管控指令的严厉程度,进行模型的正确性校验。本例中,相同的模式下,橙色响应边界函数低于黄色响应的边界函数,说明模型正确。
[0147] 如图7所示,步骤4的具体步骤如下:
[0148] 步骤41:提取待校核管控时段前30日的非管控时段历史生产用电数据,并根据日期远近进行赋权;
[0149] 步骤42:生成与管控日样本所对应的生产模式曲线;
[0150] 步骤43:结合该企业的管控指令模型和步骤42生成的生产模式曲线,计算管控响应边界曲线(包括上边界LU和下边界LL);管控时段内,用户生产模式曲线受管控响应边界曲线限制;
[0151] 步骤44:根据实时用电曲线,与管控响应边界曲线进行对比,实时计算响应概率,判断企业环保响应情况,并进行评估,评估方法如下:
[0152] 记某一时刻待评估企业电量数据为S(i),则企业未响应环保指令的概率Pro(i)为:
[0153]
[0154] 式中,S(i)为某一时刻待评估企业电量数据,LU(i)为管控响应边界曲线上边界,LL(i)为管控响应边界曲线下边界;
[0155] 而管控时段内企业未响应环保指令的总概率Pro为:
[0156]
[0157] 根据公式(10)和公式(11)计算出本实施例中的某环保监测企业响应环保指令的概率Pro=[85%,78%,92%,89%,75%,65%,80%,95%,72%],管控时段内企业未响应环保指令的总概率Pro=81%,属于疑似未响应管控指令的企业。
[0158] 工作原理是:将用户用电数据用于环保管控监测,为有关政府部门提供管控效果反馈信息和决策支持是对“枢纽型”、“平台型”、“共享型”电网的积极探索。一方面,有效的促进电网数据的经济效益挖掘,有利于国家电网公司战略转型策略的实施;另一方面,可有效提升环保监测的效率和准确性,实现跨专业、跨行业的数据共享、技术支撑和互利共赢。然而,由于不同的企业生产情况和用能情况各不相同,同一企业在不同季节、不同时间段在产量、工艺等方面也有较大差异,以往通过日电量数据反映用户生产水平和环保管控措施响应情况的方法难以适应实际需求。因此,需要研究扩展时间维度电量信息用于生产企业环保管控执行情况的监测及精准辨识方法,充分挖掘用户用电信息与环保管控之间的关联关系,实现异常生产企业的精确查找。本发明采用上述方案,从用户的多维度历史用电数据入手,提出了典型曲线带的计算方法,并通过构建计算历史管控曲线对生产模式的隶属关系,建立环保指令响应模型库,提出了企业响应环保指令的概率评估方法。在此基础上,实现企业环保管控响应研判,为环保部门实现管控措施响应信息远程监控和异常生产企业精准控制提供技术手段。
[0159] 以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。