基于人工智能的企业复工复产程度监控方法转让专利

申请号 : CN202010811567.2

文献号 : CN111680939B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张宏达马亮陈仕军胡若云裘炜浩林森叶方斌欧阳柳

申请人 : 国网浙江省电力有限公司国网浙江省电力有限公司营销服务中心

摘要 :

本发明涉及一种基于人工智能的企业复工复产程度监控方法,其技术方案要点是,所使用的神经网络在训练时,采用基于坐标下降搜索的神经网络剪枝方法进行优化:剪枝步骤一,为神经网络中的每一层维护一个敏感度分数,保持其他层剪枝率不变,剪枝该层后对网络训练两轮得到的正确分类率即为该层的敏感度分数;剪枝步骤二,对敏感度分数最高的的层进行剪枝,并更新对应的敏感度分数;剪枝步骤三,计算当前剪枝网络的剪枝率,若满足压缩率要求,则对该网络进行微调,最后得到压缩后的神经网络;否则,返回剪枝步骤二。本发明通过神经网络的优化,能够有效提高神经网络预测的准确性,从而提高复工复产的监控和预测能力。

权利要求 :

1.一种基于人工智能的企业复工复产程度监控方法,其特征在于:包括以下步骤:步骤一,获取目标地区内企业的历史能耗数据,选出历史能耗数据中的历史复工数据;

步骤二,根据目标企业的能耗类型对目标内企业进行第一次分类,并将目标企业的历史复工数据进行拟合形成复工的拟合曲线;

步骤三,设定若干条复工的典型曲线作为聚类中心,选取典型曲线和拟合曲线的参数作为维度数值,根据维度数值之间的欧式距离进行聚类分析,并确定聚类的中心;

步骤四,将同一类拟合曲线的参数作为神经网络的训练输入量,将同一类拟合曲线聚类的中心作为训练输出结果;

步骤五,将企业当前复工的能耗数值制成拟合曲线,选取拟合曲线的参数送入神经网络然后输出,输出结果经过转换后和企业当前复工的能耗数值合并形成制成复工复产曲线;

步骤六,进行能耗水平指数的计算,并根据能耗水平指数显示当前和预测的地区的整体复工复产水平;

在步骤四中,所使用的神经网络在训练时,采用基于坐标下降搜索的神经网络剪枝方法进行优化;

剪枝步骤一,为神经网络中的每一层维护一个敏感度分数,保持其他层剪枝率不变,剪枝该层后对网络训练两轮得到的正确分类率即为该层的敏感度分数;

剪枝步骤二,对敏感度分数最低的层进行剪枝,并更新对应的敏感度分数;

剪枝步骤三,计算当前剪枝网络的剪枝率,若满足压缩率要求,则对该网络进行微调,最后得到压缩后的神经网络;否则,返回剪枝步骤二;

对于一个剪枝模型  ,将其结构表示为 ,其中L为该神经网络的层数,且满足 ,即第j层的剪枝后通道数小于初始通道数,给定一个训练集以及测试集 ,剪枝的目标是找到结构变量 的最优组合,从而让在 上训练或者微调的剪枝模型 能够在 达到最高的精度,首先将剪枝问题建模为:其中 是在训练集 上训练或者微调的权重, 代表结构为 的模型在测试集 上测试得到的正确率,进一步将搜索空间缩小以增加搜索效率,进一步限制为:,

其中 为解空间变量搜索的步长,

具体为初始化一个剪枝结构 即初始未剪枝

的网络结构,然后为神经网络中的每一层即每一个独立变量方向 计算一个敏感度分数:  ,其中 ,初始化完成后基于坐标下降的思想,将剪枝结构搜索过程建模为对每一个独立变量方向 ,即某一层的结构进行迭代优化,在第k轮的搜索过程中,的更新可以表示为: ,其中 代表在当前轮,网络中对剪枝敏感度最低的层,即: 对第 层进行优化后,对敏感度

分数 进行更新,以动态维护整个神经网络中的敏感度分数序列,保证每次优化搜索过程都造成最小的精度损失:通过以上迭代过程,可以在每次迭代中进行局部优化得到序列, ,且在这个线性搜索过程中,可以得到以下结论:代表第i轮神经网络的剪枝率,在剪枝率达到目标要求后,迭代终止,然后,用更多的轮来微调剪枝模型 ,最终获得神经网络 ;

在步骤二中,若目标企业的能耗类型为小微企业则采用基于电力数据分级赋权的方式对复工复产程度进行监控,包括以下评估子步骤:评估子步骤一,根据电力大数据平台提供的企业电力大数据,分析零电量和周期性企业的用电特征,获取停工企业筛选条件;

评估子步骤二,根据筛选条件,筛选出停工企业,判定企业为停工企业的筛选条件下所示: ,

其中 ,一个计量周期由若干个分计量周期构成,若企业用电数据,满足条件a,或者不满足条件a但分计量周期满足条件b的次数大于设定值,则判定该企业为完全停工;

若连续m个分计量周期满足条件b,判定该企业对停工率的贡献度为α,连续n个分计量周期满足条件b,判定该企业对停工率的贡献度为β;贡献度与该企业停工情况对目标区域内全部企业停工率的影响程度成正比,完全停工企业的贡献度为1;

评估子步骤三,根据下式计算目标区域内的企业复工率R:

 ,

上式中,k为贡献度为α的户数,q为贡献度为β的户数,e为计量周期内完全停工企业数, N为目标区域内符合设定条件的企业总数;

在步骤六中,通过下列公式进行能耗水平指数的计算:

上式中,Z为能耗水平指数,n为当前区域内符合计算设定的运营企业数量,M为小微企业在运营企业数量中的占比,当t为当前时间点时,Pm,t为编号为m的目标企业的当前能耗数据中的能耗数值,当t作为预测数据大于当前时间点时,Pm,t为目标企业的当前所处的类在聚类时的中心的能耗数值在对应时间点处的能耗数折算值,Qn为目标企业的常态数据中的能耗数值。

2.根据权利要求1所述的基于人工智能的企业复工复产程度监控方法,其特征在于:评估子步骤二中,对分计量周期的确定由以下方式进行确定:分计量周期确定子步骤一,获取每个企业的电量拟合曲线f(Pk,t)和差值拟合曲线f(Pk,t-Pk,t-1);

分计量周期确定子步骤二,若电量拟合曲线f(Pk,t)和差值拟合曲线f(Pk,t-Pk,t-1)随着时间稳定收敛的企业确定为稳定型企业,而电量拟合曲线f(Pk,t)和差值拟合曲线f(Pk,t-Pk,t-1)随着时间周期性波动的确定为周期型企业;

分计量周期确定子步骤三,对于周期型企业根据企业的电量的变化周期,将一个电量的变化周期确定为一个分计量周期,将至少三个分计量周期确定为一个计量周期,对于稳定型企业将至少一周确定为一个分计量周期,将至少三个分计量周期确定为一个计量周期。

3.根据权利要求1所述的基于人工智能的企业复工复产程度监控方法,其特征在于:在步骤三中,聚类的中心的确定由人工比照正态分布的规律进行确定。

4.根据权利要求3所述的基于人工智能的企业复工复产程度监控方法,其特征在于:步骤三中,聚类分析包括以下步骤:聚类分析子步骤一,构建企业多维度能耗数据空间,聚类的维度项至少包括对所有拟合曲线上升段的上升时间、上升段的上升率、中间段持续时间、中间段的拐点数目、稳定段能耗均值和稳定段波动率;

聚类分析子步骤二,根据人工选定的K个典型企业确定为K个聚类的中心;

聚类分析子步骤三,计算每个多维度能耗数据与聚类中心的欧式距离,并根据欧式距离进行聚类;

聚类分析子步骤四,更新聚类中心,并重复聚类分析子步骤三,步骤直到聚类中心的迭代次数满足设定要求,将最后一次聚类后的多维度能耗数据供后续使用。

5.根据权利要求4所述的基于人工智能的企业复工复产程度监控方法,其特征在于:复工的拟合曲线分为上升段、中间段和稳定段,上升段与中间段的分割由拟合曲线的上升率变化确定,稳定段由复工的拟合曲线与常态拟合曲线对比确定。

6.根据权利要求5所述的基于人工智能的企业复工复产程度监控方法,其特征在于:根据目标企业的能耗类型对目标内企业进行第一次分类,第一次分类采用的方法包括根据企业性质、企业人数和企业能耗层级在内的直接分类或采用将企业性质、企业人数和企业能耗层级数字维度化后的聚类方式分类。

7.根据权利要求1所述的基于人工智能的企业复工复产程度监控方法,其特征在于:显示地区的整体复工复产水平时,通过设定颜色色相、明度和纯度参数进行区分,当前地区的复工复产水平处于不同层级时,采用色相进行区分;当前地区的复工复产水平处于相同层级时,明度和/或纯度值与地区的整体复工复产率相乘后进行显示。

说明书 :

基于人工智能的企业复工复产程度监控方法

技术领域

[0001] 本发明属于一种企业复工复产的监控方法,涉及一种基于人工智能的企业复工复产程度监控方法。

背景技术

[0002] 2019年年末新冠病毒肺炎导致了大量企业出现了较长时间的停工,因此对于电网负荷来说,地区整体能效的变动与以往的经验并不一致,在以往时间段,负荷的较大变化往往只局限于长假和长假前后时间段内,而本次复工复产出现了能耗水平整体变化趋势复杂,能耗水平的监测与疫情、复工复产、生产行业等都紧密相关,因此在整个地区的能耗监测上存在监测常态化,无法采用通过日期推测一刀切等问题,同时电网负荷监测也需要承当起社会整体复工复产态势监测的作用,因此,对电网负荷的能耗监测提出了更高的要求,不仅仅是要能看当前地区整体复工复产的态势,还要能对不同行业复工复产态势进行观测,进一步的还需要更多的预测功能,实现更多预测、推测功能,以期达到更为精准的复工复产帮扶、监控,辅助决策层进行下一步的决策。
[0003] 而人工智能技术由于硬件算力的提高,整体有了很大的强化,在企业工业等各个领域都能发挥重要的作用,因此,采用人工职能技术对企业复工复产问题是值得探索和使用的,但是现有技术尚未有此技术的内容可供借鉴,因此,需要开发一种基于人工智能的企业复工复产程度监控方法以利于有效提高复工复产的监控和预测能力。

发明内容

[0004] 本发明解决了现有技术仅仅只能针对当前能耗进行监控,对于复工复产等时期的能耗监控较弱,不能区分各个行业的能耗水平、无法对复工复产水平进行进一步预测等问题,提供一种利于有效提高复工复产的监控和预测能力的基于人工智能的企业复工复产程度监控方法。
[0005] 本发明解决其技术问题所采用的技术方案是:一种基于人工智能的企业复工复产程度监控方法,包括以下步骤:
[0006] 步骤一,获取目标地区内企业的历史能耗数据,选出历史能耗数据中的历史复工数据;
[0007] 步骤二,根据目标企业的能耗类型对目标内企业进行第一次分类,并将目标企业的历史复工数据进行拟合形成复工的拟合曲线;
[0008] 步骤三,设定若干条复工的典型曲线作为聚类中心,选取典型曲线和拟合曲线的参数作为维度数值,根据维度数值之间的欧式距离进行聚类分析,并确定聚类的中心;
[0009] 步骤四,将同一类拟合曲线的参数作为神经网络的训练输入量,将同一类拟合曲线聚类的中心作为训练输出结果;
[0010] 步骤五,将企业当前复工的能耗数值制成拟合曲线,选取拟合曲线的参数送入神经网络然后输出,输出结果经过转换后和企业当前复工的能耗数值合并形成制成复工复产曲线;
[0011] 步骤六,进行能耗水平指数的计算,并根据能耗水平指数显示当前和预测的地区的整体复工复产水平;
[0012] 在步骤四中,所使用的神经网络在训练时,采用基于坐标下降搜索的神经网络剪枝方法进行优化;
[0013] 剪枝步骤一,为神经网络中的每一层维护一个敏感度分数,保持其他层剪枝率不变,剪枝该层后对网络训练两轮得到的正确分类率即为该层的敏感度分数;
[0014] 剪枝步骤二,对敏感度分数最高的层进行剪枝,并更新对应的敏感度分数;
[0015] 剪枝步骤三,计算当前剪枝网络的剪枝率,若满足压缩率要求,则对该网络进行微调,最后得到压缩后的神经网络;否则,返回剪枝步骤二。
[0016] 本发明首先将数据进行固定格式的清理,然后通过将企业历史数据的分类,确定企业的类别,然后获取各个类别企业的复工曲线,对于这些复工企业进行拟合曲线的绘制,利用绘制的拟合曲线,然后在相同分类中选取聚合的中心,这个聚合的中心就是以后可供使用的典型曲线,利用典型曲线,可以通过折算、换算等方式,进行复工复产数据的预测,同时,拟合曲线的绘制为进行一次数据膨胀提供了条件,也就是增加了新的不能直接从能耗数值序列、集合中得出的参数,例如拐点数量、复工能耗的上升数值等参数,利用这些因此的参数进行后续的神经网络的训练,这里的参数往往是直接相关于复工曲线的参数,隐藏不深的参数;如果要挖掘更深的隐藏参数,还可以采取对拟合曲线取矩阵进行特征量的挖掘等方式。这个拟合曲线的训练集由上述的参数构成,聚合的中心则作为结果集进行使用,因此,通过上述方式,利用人工智能中常用的神经网络即可完成训练,利用这个神经网络,可以通过合适的数据输入,来判断当前的复工状态,以及复工至完全运行时可能的能耗等级,以此来判断预测整个地区复工复产的能耗状态。为了提高神经网络的训练效果,需要采用基于坐标下降搜索的神经网络剪枝方法进行优化;通过神经网络的优化,能够有效提高神经网络训练的效率,提高神经网络预测的准确性,能够最终较好的判断预测整个地区复工复产的能耗状态。本发明提供了一种当前地区能耗水平预测的方法,特别是适用于复工复产时期的监测和预测,能够较为精准的预测后续的符合能耗,当然在此基础上,也可以引入各种其他配合数据和方法进行进一步的强化其的预测性;例如,针对能源大客户即可应用如中国专利申请号CN201910826364.8 一种区域内支柱性电力用户的电量预测方法和系统所提供的技术方案进行监控和预测,而针对服务业小微企业,则可以直接通过写字楼的空置率等手段进行相应的监控和预测。
[0017] 作为优选,剪枝步骤一中,直接将预训练的网络权重随机加载到剪枝网络上,然后进行若干轮数的训练来获得敏感度分数;
[0018] 剪枝步骤二中,将剪枝结构搜索过程建模为对每一个独立变量方向 ,即某一层的结构进行迭代优化,对第 层进行优化后,对敏感度分数 进行更新,以动态维护整个神经网络中的敏感度分数序列,使得每次优化搜索过程都造成最小的精度损失,在每次迭代中进行局部优化得到序列,在剪枝率达到目标要求后,迭代终止。
[0019] 卷积神经网络(deep neural networks, DNNs)的出现直接掀起了人工智能领域发展的一波浪潮,极大的促进了包括图像理解、语言识别、自然语言处理、医学诊断等多个研究领域的发展。然而,随着深度神经网络性能的增加,其对运算能力和存储能力的要求也越来越高,深度神经网络高存储高功耗的弊端严重制约着其在智能化移动嵌入式设备上的应用。因此,研究人员提出了一系列压缩与加速神经网络的级数,包括低阶分解、参数量化、知识蒸馏和网络剪枝等。其中,结构化剪枝因其不会造成稀疏连接,不依赖软硬件支持的特点而受到广泛关注。结构化剪枝的核心思想在于直接移除某一个卷积层中的整个通道即滤波(filter),加速网络的计算。然而,这样做的缺点在于网络的结构会突然发生较大的改变,导致网络性能大幅度下降,所以需要设计更科学的剪枝方案来应对结构化剪枝带来的性能下降的缺点。
[0020] 本发明的出发点在于,以往的结构搜索方法没有关注到神经网络本身结构的特点,往往采用对神经网络剪枝方案随机改变的方法来搜索到一个最优结构,这样做的缺点在于非常耗时,往往在进行很多轮的搜索之后找到的仍然是一个局部最优(local optimum)剪枝方案,对于不同的任务,同一个网络的最优剪枝方案往往不同。基于以上观察,本文提出了基于坐标下降搜索的神经网络结构化剪枝方法(CDPruner),通过将神经网络剪枝结构搜索建模成为一个离散优化问题,为神经网络中的每一层维护一个敏感度分数(sensitivity score),该分数的得出我们采用了基于启发式的对某一个方案训练若干轮(epoch),在不耗费大量时间的情况下得出一个模拟的剪枝模型精度。然后,利用坐标下降法的思想,每次对敏感度分数最低,即最适合剪枝的层进行剪枝搜索,直到该层的敏感度不是最低的,即达到了一个局部最优。通过对每一个子问题进行这样的优化,最终可以达到一个全局最优的剪枝方案,对得出的网络结构进行微调(fine-tune)即可获得最终压缩后的模型。对不同神经网络结构进行剪枝的大量实验结果验证了本发明提出的方法相比现有的深度神经网络具有更好的性能。例如,在CIFAR-10数据集上,利用本发明提出的方法可以将VGG-16的模型大小压缩至原来的6.62%,浮点运算次数压缩到原来的19.90%,top-1分类错误率只增加了0.24%;可以将GoogLeNet的模型大小压缩至原来的46.02%,浮点运算次数压缩到原来的34.76%,同时甚至可以降低top-1分类的错误率,优于目前最先进的结构化剪枝算法。
[0021] 作为优选,在步骤二中,若目标企业的能耗类型为小微企业则采用基于电力数据分级赋权的方式对复工复产程度进行监控,包括以下评估子步骤:
[0022] 评估子步骤一,根据电力大数据平台提供的企业电力大数据,分析零电量和周期性企业的用电特征,获取停工企业筛选条件。
[0023] 评估子步骤二,根据筛选条件,筛选出停工企业,判定企业为停工企业的筛选条件下所示:
[0024]
[0025] 其中 ,一个计量周期由若干个分计量周期构成,
[0026] 若企业用电数据,满足条件a,或者不满足条件a但分计量周期满足条件b的次数大于设定值,则判定该企业为完全停工;
[0027] 若连续m个分计量周期满足条件b,判定该企业对停工率的贡献度为α,连续n个分计量周
[0028] 期满足条件b,判定该企业对停工率的贡献度为β;贡献度与该企业停工情况对目标区域
[0029] 内全部企业停工率的影响程度成正比,完全停工企业的贡献度为1。
[0030] 评估子步骤三,根据下式计算目标区域内的企业复工率R:
[0031] ,
[0032] 上式中,k为贡献度为α的户数,q为贡献度为β的户数,e为计量周期内完全停工企业数,为目标区域内符合设定条件的企业总数。
[0033] 本发明采用了按电力数据分级赋权的方式进行复工率计算,本发明采用了两级制的方式进行评价,在较长的计量周期内完全没有复工迹象的,或者维持在极低用电水平的小微企业,可以定位其处于停工状态,而对于在较长计量周期内,部分乃至大部分时间维持在极低用电水平的小微企业,认为其存在复工复产,但是由于订单和客户的不稳定,目前还存在不确定性。本发明中设置了m个分计量周期满足条件和n个分计量周期基本能够满足大部分的计量需要,如果为了进一步提高小微企业的计量需要,还可以设置更多的计量周期分级别,但是这个在提高小微企业复工复产的计算时相对有限,作用上不如针对每个小微企业确定一个合理的分计量周期更为有效,一般情况下,默认的计量周期有一月或一周两种,对应的分计量周期为一周和一天;但是这个设置仍有改进的余地,例如,很多小微企业是以二天到三天为一个生产周期的,中间的休息时间相对不固定,此时,分计量周期则以二天到三天更为合理。需要特别指出的是,如果采用最直接的方式,可以直接设定n>m,此时,若连续m个分计量周期满足条件b,且连续n个分计量周期满足条件b,则直接判定该企业对停工率的贡献度为β。
[0034] 作为优选,评估子步骤二中,对分计量周期的确定由以下方式进行确定:
[0035] 分计量周期确定子步骤一,获取每个企业的电量拟合曲线f(Pk,t)和差值拟合曲线f(Pk,t-Pk,t-1);
[0036] 分计量周期确定子步骤二,若电量拟合曲线f(Pk,t)和差值拟合曲线f(Pk,t-Pk,t-1)随着时间稳定收敛的企业确定为稳定型企业,而电量拟合曲线f(Pk,t)和差值拟合曲线f(Pk,t-Pk,t-1)随着时间周期性波动的确定为周期型企业;
[0037] 分计量周期确定子步骤三,对于周期型企业根据企业的电量的变化周期,将一个电量的变化周期确定为一个分计量周期,将至少三个分计量周期确定为一个计量周期,对于稳定型企业将至少一周确定为一个分计量周期,将至少三个分计量周期确定为一个计量周期。
[0038] 作为优选,在步骤三中,聚类的中心的确定由人工比照正态分布的规律进行确定。聚类中心的正态分布是其中可选的一个方案,主要是因为,小微企业部分,我们采用了基于电力数据分级赋权的方式对复工复产程度进行监控,而能源大客户企业的内容,可以选用如中国专利申请号CN201910826364.8 所公开的一种区域内支柱性电力用户的电量预测方法和系统所提供的技术方案并结合人工预测做更高精度的预测。
[0039] 作为优选,根据目标企业的能耗类型对目标内企业进行第一次分类,第一次分类采用的方法包括根据企业性质、企业人数和企业能耗层级在内的直接分类或采用将企业性质、企业人数和企业能耗层级数字维度化后的聚类方式分类。
[0040] 作为优选,复工的拟合曲线分为上升段、中间段和稳定段,上升段与中间段的分割由拟合曲线的上升率变化确定,稳定段由复工的拟合曲线与常态拟合曲线对比确定。
[0041] 作为优选,步骤三中,聚类分析包括以下步骤:
[0042] 聚类分析子步骤一,构建企业多维度能耗数据空间,聚类的维度项至少包括对所有拟合曲线上升段的上升时间、上升段的上升率、中间段持续时间、中间段的拐点数目、稳定段能耗均值和稳定段波动率;
[0043] 聚类分析子步骤二,根据人工选定的K个典型企业确定为K个聚类的中心;
[0044] 聚类分析子步骤三,计算每个多维度能耗数据与聚类中心的欧式距离,并根据欧式距离进行聚类;
[0045] 聚类分析子步骤四,更新聚类中心,并重复聚类分析子步骤三,步骤直到聚类中心的迭代次数满足设定要求,将最后一次聚类后的多维度能耗数据供后续使用。
[0046] 本发明中,聚类中心的确定是具有关键意义的,通过细密的聚类中心的划分,可以获得的供神经网络分类后对照的拟合曲线精度就更高,折算、换算的难度就更低。如果是较为精密的划分,还省略掉折算和换算的步骤。本技术方案中定义的折算是根据相同时间点内所消耗的电量累积值与拟合曲线做定积分所获得的累计值进行对比,然后根据同比例进行折算。换算则只是根据当前获得的电量数值与拟合曲线对应时间点的电量数值做对比,然后直接换算。一般应用的场景为聚类中心数量较少的区段,输入的电量数据与聚类中心所提供的典型曲线之间两者之间存在有一定的差异,因此需要进行折算和换算。
[0047] 作为优选,在步骤六中,通过下列公式进行能耗水平指数的计算:
[0048]
[0049] 上式中,Z为能耗水平指数,n为当前区域内符合计算设定的运营企业数量,M为小微企业在运营企业数量中的占比,当t为当前时间点时,Pm,t为编号为m的目标企业的当前能耗数据中的能耗数值,当t作为预测数据大于当前时间点时,Pm,t为目标企业的当前所处的类在聚类时的中心的能耗数值在对应时间点处的能耗数折算值,Qn为目标企业的常态数据中的能耗数值。折算的定义在上文中已做叙述,在此不做重复。本发明中的 RM就是小企业的能耗,(n/2+ (Σnm=1Pm,t / Qn)/2n)(1-M)为一般性企业的能耗,而支柱性企业和能源大户并不必然存在,因此,本发明中暂不列入,当存在有支柱性企业和能源大户时,应当将其补入上式中进行计算,由于支柱性企业的计算各有其特点,因此,选择中,应当通过人工方式进行补充。
[0050] 作为优选,显示地区的整体复工复产水平时,通过设定颜色色相、明度和纯度参数进行区分,当前地区的复工复产水平处于不同层级时,采用色相进行区分;当前地区的复工复产水平处于相同层级时,明度和/或纯度值与地区的整体复工复产率相乘后进行显示。本发明中采用相同色相不同明度和纯度进行区分时可以将能耗水平指数作为参数,直接用于调整相关的明度和纯度,在此技术上,显示的内容可见性直观性更佳,能够获得更好的体验。
[0051] 本发明的实质性效果是:通过神经网络的优化,能够有效提高神经网络训练的效率,提高神经网络预测的准确性,提供一种利于有效提高复工复产的监控和预测能力的基于人工智能的企业复工复产程度监控方法,最终较好地判断预测整个地区复工复产的能耗状态。

附图说明

[0052] 图1为本发明中剪枝优化的一种示意图;
[0053] 图2为本发明中的一种流程示意图。

具体实施方式

[0054] 下面通过具体实施例,对本发明的技术方案作进一步的具体说明。
[0055] 实施例1:
[0056] 一种基于人工智能的企业复工复产程度监控方法(参见附图1和附图2),包括以下步骤:
[0057] 步骤一,获取目标地区内企业的历史能耗数据,选出历史能耗数据中的历史复工数据;
[0058] 步骤二,根据目标企业的能耗类型对目标内企业进行第一次分类,并将目标企业的历史复工数据进行拟合形成复工的拟合曲线;
[0059] 步骤三,设定若干条复工的典型曲线作为聚类中心,选取典型曲线和拟合曲线的参数作为维度数值,根据维度数值之间的欧式距离进行聚类分析,并确定聚类的中心;
[0060] 步骤四,将同一类拟合曲线的参数作为神经网络的训练输入量,将同一类拟合曲线聚类的中心作为训练输出结果;
[0061] 步骤五,将企业当前复工的能耗数值制成拟合曲线,选取拟合曲线的参数送入神经网络然后输出,输出结果经过转换后和企业当前复工的能耗数值合并形成制成复工复产曲线;
[0062] 步骤六,进行能耗水平指数的计算,并根据能耗水平指数显示当前和预测的地区的整体复工复产水平;
[0063] 在步骤四中,所使用的神经网络在训练时,采用基于坐标下降搜索的神经网络剪枝方法进行优化;
[0064] 剪枝步骤一,为神经网络中的每一层维护一个敏感度分数,保持其他层剪枝率不变,剪枝该层后对网络训练两轮得到的正确分类率即为该层的敏感度分数;
[0065] 剪枝步骤二,对敏感度分数最高的层进行剪枝,并更新对应的敏感度分数;
[0066] 剪枝步骤三,计算当前剪枝网络的剪枝率,若满足压缩率要求,则对该网络进行微调,最后得到压缩后的神经网络;否则,返回剪枝步骤二。
[0067] 本实施例首先将数据进行固定格式的清理,然后通过将企业历史数据的分类,确定企业的类别,然后获取各个类别企业的复工曲线,对于这些复工企业进行拟合曲线的绘制,利用绘制的拟合曲线,然后在相同分类中选取聚合的中心,这个聚合的中心就是以后可供使用的典型曲线,利用典型曲线,可以通过折算、换算等方式,进行复工复产数据的预测,同时,拟合曲线的绘制为进行一次数据膨胀提供了条件,也就是增加了新的不能直接从能耗数值序列、集合中得出的参数,例如拐点数量、复工能耗的上升数值等参数,利用这些因此的参数进行后续的神经网络的训练,这里的参数往往是直接相关于复工曲线的参数,隐藏不深的参数;如果要挖掘更深的隐藏参数,还可以采取对拟合曲线取矩阵进行特征量的挖掘等方式。这个拟合曲线的训练集由上述的参数构成,更为具体的是,训练集中,在获取的数据量足够的情况下,所采用的参数往往只和上升段或中间段的对应参数相关,通过这个方式能够对于预测有较大的帮助。聚合的中心则作为结果集进行使用,因此,通过上述方式,利用人工智能中常用的神经网络即可完成训练,利用这个神经网络,可以通过合适的数据输入,来判断当前的复工状态,以及复工至完全运行时可能的能耗等级,以此来判断预测整个地区复工复产的能耗状态。为了提高神经网络的训练效果,需要采用基于坐标下降搜索的神经网络剪枝方法进行优化;通过神经网络的优化,能够有效提高神经网络训练的效率,提高神经网络预测的准确性,能够最终较好的判断预测整个地区复工复产的能耗状态。本实施例提供了一种当前地区能耗水平预测的方法,特别是适用于复工复产时期的监测和预测,能够较为精准的预测后续的符合能耗,当然在此基础上,也可以引入各种其他配合数据和方法进行进一步的强化其的预测性;例如,针对能源大客户即可应用如中国专利申请号CN201910826364.8 一种区域内支柱性电力用户的电量预测方法和系统所提供的技术方案进行监控和预测,而针对服务业小微企业,则可以直接通过写字楼的空置率等手段进行相应的监控和预测。
[0068] 显然通过上述的方法,可以根据监控和预测的结果对电网负荷进行有效的调整,利用空余时间进行设备加装、检修和维护,还可以根据监控和预测的结果,对后续电网改造提高指导。
[0069] 剪枝步骤一中,直接将预训练的网络权重随机加载到剪枝网络上,然后进行若干轮数的训练来获得敏感度分数;
[0070] 剪枝步骤二中,将剪枝结构搜索过程建模为对每一个独立变量方向 ,即某一层的结构进行迭代优化,对第 层进行优化后,对敏感度分数 进行更新,以动态维护整个神经网络中的敏感度分数序列,使得每次优化搜索过程都造成最小的精度损失,在每次迭代中进行局部优化得到序列,在剪枝率达到目标要求后,迭代终止。
[0071] 卷积神经网络(deep neural networks, DNNs)的出现直接掀起了人工智能领域发展的一波浪潮,极大的促进了包括图像理解、语言识别、自然语言处理、医学诊断等多个研究领域的发展。然而,随着深度神经网络性能的增加,其对运算能力和存储能力的要求也越来越高,深度神经网络高存储高功耗的弊端严重制约着其在智能化移动嵌入式设备上的应用。因此,研究人员提出了一系列压缩与加速神经网络的级数,包括低阶分解、参数量化、知识蒸馏和网络剪枝等。其中,结构化剪枝因其不会造成稀疏连接,不依赖软硬件支持的特点而受到广泛关注。结构化剪枝的核心思想在于直接移除某一个卷积层中的整个通道即滤波(filter),加速网络的计算。然而,这样做的缺点在于网络的结构会突然发生较大的改变,导致网络性能大幅度下降,所以需要设计更科学的剪枝方案来应对结构化剪枝带来的性能下降的缺点。
[0072] 本实施例的出发点在于,以往的结构搜索方法没有关注到神经网络本身结构的特点,往往采用对神经网络剪枝方案随机改变的方法来搜索到一个最优结构,这样做的缺点在于非常耗时,往往在进行很多轮的搜索之后找到的仍然是一个局部最优(local optimum)剪枝方案,对于不同的任务,同一个网络的最优剪枝方案往往不同。基于以上观察,本文提出了基于坐标下降搜索的神经网络结构化剪枝方法(CDPruner),通过将神经网络剪枝结构搜索建模成为一个离散优化问题,为神经网络中的每一层维护一个敏感度分数(sensitivity score),该分数的得出我们采用了基于启发式的对某一个方案训练若干轮(epoch),在不耗费大量时间的情况下得出一个模拟的剪枝模型精度。然后,利用坐标下降法的思想,每次对敏感度分数最低,即最适合剪枝的层进行剪枝搜索,直到该层的敏感度不是最低的,即达到了一个局部最优。通过对每一个子问题进行这样的优化,最终可以达到一个全局最优的剪枝方案,对得出的网络结构进行微调(fine-tune)即可获得最终压缩后的模型。对不同神经网络结构进行剪枝的大量实验结果验证了本实施例提出的方法相比现有的深度神经网络具有更好的性能。例如,在CIFAR-10数据集上,利用本实施例提出的方法可以将VGG-16的模型大小压缩至原来的6.62%,浮点运算次数压缩到原来的19.90%,top-1分类错误率只增加了0.24%;可以将GoogLeNet的模型大小压缩至原来的46.02%,浮点运算次数压缩到原来的34.76%,同时甚至可以降低top-1分类的错误率,优于目前最先进的结构化剪枝算法。
[0073] 更具体的是:
[0074] 对于一个剪枝模型 ,将其结构表示为 ,其中L为该神经网络的层数,且满足 ,即第j层的剪枝后通道数小于初始通道数。给定一个训练集(training set) 以及测试集(test set) ,剪枝的目标是找到结构变量 的最优组合,从而让在 上训练或者微调的剪枝模型 能够在 达到最高的精度(accuracy)。为了达到上述目的,首先将剪枝问题建模为:
[0075]
[0076] 其中 是在训练集 上训练或者微调的权重, 代表结构为 的模型 在测试集 上测试得到的正确率。进一步将搜索空间缩小以增加搜索效率,将公式(3.2)进一步限制为:
[0077] ,其中 为解空间变量搜索的步长,例如当 时,某一层的解空间为
,本实施例进一步将解空间灵活化,可以通过控制 来动态的达到不同
的剪枝模型需要的性能。
[0078] 该方法的输入为对某一神经网络的目标剪枝率α,输出为该神经网络的最佳剪枝结构 以及最优剪枝模型 ,本实施例提出的方法是完全端到端(end-to-end)的,可以方便的应用到各种深度学习任务上。
[0079] 首先,初始化一个剪枝结构 即初始未剪枝的网络结构。然后为神经网络中的每一层即每一个独立变量方向 计算一个敏感度分数 :  ,
[0080] 其中 , 为搜索步长,本方法中设置为0.1。在上式中,如果花费很多轮去训练剪枝网络并得到敏感度分数是非常耗时的,直接将预训练(pretrain)的网络权重随机加载到剪枝网络上,然后进行较少轮数的训练来获得准确率,即本文中的敏感度分数。
[0081] 初始化完成后基于坐标下降的思想,将剪枝结构搜索过程建模为对每一个独立变量方向 ,即某一层的结构进行迭代优化,在第k轮的搜索过程中, 的更新可以表示为: ,其中 代表在当前轮,网络中对剪枝敏感度最低的层,即: 对第 层进行优化后,对敏感度分数 进行更新,以动态维
护整个神经网络中的敏感度分数序列,保证每次优化搜索过程都造成最小的精度损失:
[0082]
[0083] 通过以上迭代过程,可以在每次迭代中进行局部优化得到序列, ,且在这个线性搜索过程中,可以得到以下结论:
[0084]
[0085] 代表第i轮神经网络的剪枝率,这个指标可以基于参数量,也可以基于浮点型运算次数,在剪枝率达到目标要求后,迭代终止。然后,用更多的轮来微调剪枝模型,最终获得神经网络 。
[0086] 在本实施例的步骤二中,若目标企业的能耗类型为小微企业则采用基于电力数据分级赋权的方式对复工复产程度进行监控,包括以下评估子步骤:
[0087] 评估子步骤一,根据电力大数据平台提供的企业电力大数据,分析零电量和周期性企业的用电特征,获取停工企业筛选条件;
[0088] 评估子步骤二,根据筛选条件,筛选出停工企业,判定企业为停工企业的筛选条件下所示:
[0089]
[0090] 其中 ,一个计量周期由若干个分计量周期构成,若企业用电数据,满足条件a,或者不满足条件a但分计量周期满足条件b的次数大于设定值,则判定该企业为完全停工;
[0091] 若连续m个分计量周期满足条件b,判定该企业对停工率的贡献度为α,连续n个分计量周期满足条件b,判定该企业对停工率的贡献度为β;
[0092] 贡献度与该企业停工情况对目标区域内全部企业停工率的影响程度成正比,完全停工企业的贡献度为1;
[0093] 评估子步骤三,根据下式计算目标区域内的企业复工率R :
[0094]
[0095] 上式中,K为贡献度为α的户数,q为贡献度为β的户数,e为计量周期内完全停工企业数, N为目标区域内符合设定条件的企业总数。
[0096] 本实施例采用了按电力数据分级赋权的方式进行复工率计算,本实施例采用了两级制的方式进行评价,在较长的计量周期内完全没有复工迹象的,或者维持在极低用电水平的小微企业,可以定位其处于停工状态,而对于在较长计量周期内,部分乃至大部分时间维持在极低用电水平的小微企业,认为其存在复工复产,但是由于订单和客户的不稳定,目前还存在不确定性。本实施例中设置了m个分计量周期满足条件和n个分计量周期基本能够满足大部分的计量需要,如果为了进一步提高小微企业的计量需要,还可以设置更多的计量周期分级别,但是这个在提高小微企业复工复产的计算时相对有限,作用上不如针对每个小微企业确定一个合理的分计量周期更为有效,一般情况下,默认的计量周期有一月或一周两种,对应的分计量周期为一周和一天;但是这个设置仍有改进的余地,例如,很多小微企业是以二天到三天为一个生产周期的,中间的休息时间相对不固定,此时,分计量周期则以二天到三天更为合理。需要特别指出的是,本实施例中,采用的是最为直接的方式,即设定n>m,且若连续m个分计量周期满足条件b,且连续n个分计量周期满足条件b,则直接判定该企业对停工率的贡献度为β。
[0097] 除此之外,在上述基础上,还可以采用隶属度方式对贡献度进行计算,例如设定隶属度函数,对于一个企业是以符合条件a的隶属度来确定贡献度α与隶属度的乘积,符合条件b的隶属度来确定贡献度β与隶属度的乘积的方式来获取更为准确的贡献度,此时,小微企业的贡献度累加之后更为精确。但是这个计算属于可选方案,依然推荐以设定n>m,且若连续m个分计量周期满足条件b,且连续n个分计量周期满足条件b,则直接判定该企业对停工率的贡献度为β的方式来进行计算。
[0098] 本实施例评估子步骤二中,对分计量周期的确定由以下方式进行确定:
[0099] 分计量周期确定子步骤一,获取每个企业的电量拟合曲线f(Pk,t)和差值拟合曲线f(Pk,t-Pk,t-1)。
[0100] 分计量周期确定子步骤二,若电量拟合曲线f(Pk,t)和差值拟合曲线f(Pk,t-Pk,t-1)随着时间稳定收敛的企业确定为稳定型企业,而电量拟合曲线f(Pk,t)和差值拟合曲线f(Pk,t-Pk,t-1)随着时间周期性波动的确定为周期型企业。
[0101] 分计量周期确定子步骤三,对于周期型企业根据企业的电量的变化周期,将一个电量的变化周期确定为一个分计量周期,将至少三个分计量周期确定为一个计量周期,对于稳定型企业将至少一周确定为一个分计量周期,将至少三个分计量周期确定为一个计量周期。
[0102] 本实施例在步骤三中,聚类的中心的确定由人工比照正态分布的规律进行确定。聚类中心的正态分布是其中可选的一个方案,主要是因为,小微企业部分,我们采用了基于电力数据分级赋权的方式对复工复产程度进行监控,而能源大客户企业的内容,可以选用如中国专利申请号CN201910826364.8 所公开的一种区域内支柱性电力用户的电量预测方法和系统所提供的技术方案并结合人工预测做更高精度的预测。
[0103] 本实施例根据目标企业的能耗类型对目标内企业进行第一次分类,第一次分类采用的方法包括根据企业性质、企业人数和企业能耗层级在内的直接分类或采用将企业性质、企业人数和企业能耗层级数字维度化后的聚类方式分类。
[0104] 本实施例复工的拟合曲线分为上升段、中间段和稳定段,上升段与中间段的分割由拟合曲线的上升率变化确定,稳定段由复工的拟合曲线与常态拟合曲线对比确定。
[0105] 本实施例步骤三中,聚类分析包括以下步骤:
[0106] 聚类分析子步骤一,构建企业多维度能耗数据空间,聚类的维度项至少包括对所有拟合曲线上升段的上升时间、上升段的上升率、中间段持续时间、中间段的拐点数目、稳定段能耗均值和稳定段波动率;
[0107] 聚类分析子步骤二,根据人工选定的K个典型企业确定为K个聚类的中心;
[0108] 聚类分析子步骤三,计算每个多维度能耗数据与聚类中心的欧式距离,并根据欧式距离进行聚类;
[0109] 聚类分析子步骤四,更新聚类中心,并重复聚类分析子步骤三,步骤直到聚类中心的迭代次数满足设定要求,将最后一次聚类后的多维度能耗数据供后续使用。
[0110] 本实施例中,聚类中心的确定是具有关键意义的,通过细密的聚类中心的划分,可以获得的供神经网络分类后对照的拟合曲线精度就更高,折算、换算的难度就更低。如果是较为精密的划分,还省略掉折算和换算的步骤。本技术方案中定义的折算是根据相同时间点内所消耗的电量累积值与拟合曲线做定积分所获得的累计值进行对比,然后根据同比例进行折算。本实施例中采用折算方式进行,换算则只是根据当前获得的电量数值与拟合曲线对应时间点的电量数值做对比,然后直接换算。一般应用的场景为聚类中心数量较少的区段,输入的电量数据与聚类中心所提供的典型曲线之间两者之间存在有一定的差异,因此需要进行折算和换算。
[0111] 在步骤六中,通过下列公式进行能耗水平指数的计算:
[0112]
[0113] 上式中,Z为能耗水平指数,n为当前区域内符合计算设定的运营企业数量,M为小微企业在运营企业数量中的占比,当t为当前时间点时,Pm,t为编号为m的目标企业的当前能耗数据中的能耗数值,当t作为预测数据大于当前时间点时,Pm,t为目标企业的当前所处的类在聚类时的中心的能耗数值在对应时间点处的能耗数折算值,Qn为目标企业的常态数据中的能耗数值。折算的定义在上文中已做叙述,在此不做重复。本实施例中的 RM就是小企业的能耗, 为一般性企业的能耗,而支柱性企业和能源大户并不必然存在,因此,本实施例中暂不列入,当存在有支柱性企业和能源大户时,应当将其补入上式中进行计算,由于支柱性企业的计算各有其特点,因此,选择中,应当通过人工方式进行补充。
[0114] 显示地区的整体复工复产水平时,通过设定颜色色相、明度和纯度参数进行区分,当前地区的复工复产水平处于不同层级时,采用色相进行区分;当前地区的复工复产水平处于相同层级时,明度和/或纯度值与地区的整体复工复产率相乘后进行显示。本实施例中采用相同色相不同明度和纯度进行区分时可以将能耗水平指数作为参数,直接用于调整相关的明度和纯度,在此技术上,显示的内容可见性直观性更佳,能够获得更好的体验。
[0115] 综上所述,本实施例通过神经网络的优化,能够有效提高神经网络训练的效率,提高神经网络预测的准确性,由此通过聚类、拟合曲线、参数使用等一系列方案最终提供了一种利于有效提高复工复产的监控和预测能力的基于人工智能的企业复工复产程度监控方法,利用本实施例所提供的技术方案最终能较好地判断预测整个地区复工复产的能耗状态,为复工复产提供助力,也为其他可能的突发停工事件的复工复产提供了可靠的监控手段。
[0116] 以上所述的实施例只是本发明的一种较佳的方案,并非对本发明作任何形式上的限制,在不超出权利要求所记载的技术方案的前提下还有其它的变体及改型。