一种基于卷积神经网络的电网设备分类方法转让专利

申请号 : CN201710079894.1

文献号 : CN106897739B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 路永玲胡成博陶风波徐家园徐长福马展岳涛刘浩杰陈彤丁俊峰洪炜鑫

申请人 : 国网江苏省电力公司电力科学研究院国家电网公司南京大学

摘要 :

本发明公开了一种基于卷积神经网络的电网设备分类方法,步骤1,根据已有的电网设备图像训练集和测试集,训练卷积神经网络模型;输入层对输入的图像数据进行预处理,用以增大数据量;卷积层的数量不大于N,N+1为常用卷积神经网络卷积层的层数;步骤2,利用训练完成的卷积神经网络模型对需分类的电网设备图像进行分类。本发明利用数据增强技术将输入图像数据进行预处理,增大数据量,解决了数据量不足会导致网络过拟合,精度下降的问题;鉴于训练数据的数量较少,削减了卷积层数量和卷积核数目,同时增大卷积核的尺寸,减小了每层卷积层所提取出的特征图的大小,从而减少了卷积层提取出的特征数量,同样起到了防止过拟合的作用,提高了精度。

权利要求 :

1.一种基于卷积神经网络的电网设备分类方法,其特征在于:包括以下步骤,步骤1,根据已有的电网设备图像训练集和测试集,训练卷积神经网络模型;

卷积神经网络模型包括输入层、卷积层、全连接层和Softmax层;所述输入层对输入的图像数据进行预处理,用以增大数据量;

用训练集和测试集进行训练过程为:

S51,将训练用的图像数据输入输入层进行预处理;

训练用的图像数据包括训练集中的电网设备图像、电网设备图像对应的电网设备分类标签文档、训练集中的电网设备图像的图像均值;

对图像数据预处理主要处理的是电网设备图像,这里依次通过剪切和随机反转的方法,增大数据量;

S52,定义t=1,将预处理后的训练用的图像数据输出到第t层卷积层;

S53,依次对其进行卷积、非线性激活、平滑和最大值池化处理;

S54,判断t是否等于N,N为卷积层数量,如果是,则转至S55;如果不是,则t=t+1,将t层卷积层的输出传递至t+1层卷积层,转至S53;

S55,将N层卷积层的输出依次经过两层全连接层输出至Softmax层;

第一层全连接层是N层卷积层进行池化后的全连接,第二层全连接层是第一层全连接层进行非线性激活后,然后进行Dropout后再进行全连接的结果;

Softmax层输出每一维电网设备图像属于某一类别的概率;

S56,将Softmax层输出的结果与对应的电网设备分类标签文档中的数字标签进行对比;

S57,根据两者的的残差采用随机梯度下降法调整卷积神经网络的权重参数,重复S52 ~S57的步骤,直到残差小于阈值完成训练,最后输出训练完成的卷积神经网络模型;

S58,调用卷积神经网络模型,输入测试用的图像数据,将判断结果与已知正确结果相比较,建立精度层、损失层,实时输出这一判断的正确率以及损失;

测试用的图像数据包括测试集中的电网设备图像、电网设备图像对应的电网设备分类标签文档、测试集中的电网设备图像的图像均值;

步骤2,利用训练完成的卷积神经网络模型对需分类的电网设备图像进行分类。

2.根据权利要求1所述的一种基于卷积神经网络的电网设备分类方法,其特征在于:采用权值共享方法,建立卷积层。

3.根据权利要求1所述的一种基于卷积神经网络的电网设备分类方法,其特征在于:采用采用ReLU型的激励函数进行非线性激活。

4.根据权利要求1所述的一种基于卷积神经网络的电网设备分类方法,其特征在于:N=

4。

说明书 :

一种基于卷积神经网络的电网设备分类方法

技术领域

[0001] 本发明涉及一种基于卷积神经网络的电网设备分类方法,属于神经网络领域。

背景技术

[0002] 电网设备识别在电网设备分类、状态监测和异常预警等领域有着非常重要的应用,是一项具有很高实用价值的技术。
[0003] 近年来基于深度卷积神经网络的图像识别方法有了很多突破。但是,由于图像数据数量限制和CPU运算能力的限制,神经网络的精度一直难以突破,且训练效率很低。随着数据增强技术和使用GPU计算的实现,利用基于较少数据的深层卷积网络实现图像准确分类成为可能。
[0004] 目前,主流的图像识别的方法分为两大类,第一类是基于边缘识别和特征提取的算法。这种方法根据灰度图像分割、彩色图像分割和纹理图像分割等分割方法得到图像的特征,然后通过特征匹配进行图像的分类。这种方法缺点在于计算量大,对噪声敏感,且不具有泛化能力。
[0005] 第二类是基于深度卷积神经网络的算法。卷积神经网络主要用来识别位移、缩放及扭曲不变性的二维图像,其基本结构包括两层,其一为特征提取层,每个神经元输入与前一层的局部接受域相连,并提取该局部特征;其二是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射是一个平面,平面上所有神经元的权值相等。
[0006] Alexnet是常用的卷积神经网络。Alexnet的结构在“Alex Krizhevsky,ImageNet classification with Deep Convolutional Neural Networks”中提出。应用在电网设备的分类中,其结构可以用图1说明,InputLayer就是输入图片层,每个输入图片都将被缩放成227×227大小,分rgb三个颜色维度输入。Layer1~Layer5是卷积层,用于提取特征。在卷积滤波后,还接有ReLUs操作和max-pooling操作。Layer6~Layer8是全连接层,相当于在五层卷积层的基础上再加上一个三层的全连接神经网络分类器。
[0007] 由于Alexnet的特征检测层通过训练数据进行学习,所以在使用时,避免了显式的特征提取,而是隐式从训练数据学习;由于其特征映射层中单独神经元在约束下共享相同的突触权值集,具有位移不变性的优点。
[0008] 缺点在于对于较少的训练数据,Alexnet中过多的卷积层和卷积核非常容易出现数据的过拟合,使得训练完成的网络对于测试数据分类结果很不准确,没有实用性。

发明内容

[0009] 为了解决上述技术问题,本发明提供了一种基于卷积神经网络的电网设备分类方法。
[0010] 为了达到上述目的,本发明所采用的技术方案是:
[0011] 一种基于卷积神经网络的电网设备分类方法,包括以下步骤,
[0012] 步骤1,根据已有的电网设备图像训练集和测试集,训练卷积神经网络模型;
[0013] 卷积神经网络模型包括输入层、卷积层、全连接层和Softmax层;所述输入层对输入的图像数据进行预处理,用以增大数据量;所述卷积层的数量不大于N,N+1为常用卷积神经网络卷积层的层数;
[0014] 步骤2,利用训练完成的卷积神经网络模型对需分类的电网设备图像进行分类。
[0015] 输入层利用数据增强技术将输入的图像数据进行预处理,用以增大数据量。
[0016] 输入输入层的图像数据包括图像均值和lmdb文件,lmdb文件中包括电网设备图像以及对应的电网设备分类标签文档,每张电网设备图像都对应有一个电网设备分类标签文档。
[0017] 采用权值共享方法,建立卷积层。
[0018] 卷积层对输入的电网设备图像依次进行卷积、非线性激活、平滑和最大值池化处理。
[0019] 采用采用ReLU型的激励函数进行非线性激活。
[0020] N=4。
[0021] 本发明所达到的有益效果:本发明利用数据增强技术将输入图像数据进行预处理,通过剪切、随机反转,增大数据量,解决了数据量不足会导致网络过拟合,精度下降的问题;鉴于训练数据的数量较少,削减了卷积层数量和卷积核数目,同时增大卷积核的尺寸,减小了每层卷积层所提取出的特征图的大小,从而减少了卷积层提取出的特征数量,同样起到了防止过拟合的作用,提高了精度。

附图说明

[0022] 图1为常用卷积神经网络结构;
[0023] 图2为本发明的流程图。

具体实施方式

[0024] 下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
[0025] 一种基于卷积神经网络的电网设备分类方法,包括以下步骤:
[0026] 步骤1,构建训练集和测试集。
[0027] 通过实地拍照,采集六大电网设备图像,每类采集24张,并按照3:1的比例分为训练图片和测试图片。
[0028] 步骤2,构建与电网设备图像对应的电网设备分类标签文档。
[0029] 每张电网设备图像都对应有一个电网设备分类标签文档,电网设备分类标签文档中存储有对应电网设备图像的读取路径和文件名,其中,文件名=名称+数字标签,例如:0代表变压器、1代表避雷器、2代表电流互感器、3代表电压互感器、4代表断路器、5代表整流器。
[0030] 步骤3,将电网设备图像以及对应的电网设备分类标签文档打包成lmdb文件。
[0031] 步骤4,分别计算训练集和测试集中各电网设备图像的图像均值。
[0032] 步骤5,构建并训练卷积神经网络模型。
[0033] 卷积神经网络模型包括输入层、卷积层、全连接层和Softmax层,其中,输入层利用数据增强技术将输入的图像数据进行预处理,用以增大数据量;卷积层采用权值共享方法建立,卷积层的数量不大于N,N+1为常用卷积神经网络卷积层的层数。常用卷积神经网络卷积层的层数为5,这里的卷积层的数量区4。
[0034] 用训练集和测试集进行训练过程为:
[0035] S51,将训练用的图像数据输入输入层进行预处理;
[0036] 训练用的图像数据包括训练集中的电网设备图像以及对应的电网设备分类标签文档打包成lmdb文件、训练集中的电网设备图像的图像均值。
[0037] 对图像数据预处理主要处理的是电网设备图像,这里依次通过剪切和随机反转的方法,增大数据量。例如:对于256×256的图像进行随机剪切到227×227,然后允许水平翻转,那么相当与将样本倍增到(256-227)2×2=1682,测试时候,对左上、右上、左下、右下、中间做了5次剪切,然后翻转,共10个剪切,之后对结果求平均。
[0038] S52,定义t=1,将预处理后的训练用的图像数据输出到第t层卷积层;
[0039] S53,依次对其进行卷积、非线性激活、平滑和最大值池化处理;
[0040] 这里的采用ReLU型的激励函数进行非线性激活,具体数学表达式为:f(x)=max(0,x),其中,f(x)为输出,x为输入,当输入小于0时,输出都是0,当输入大于0时,输出等于输入;
[0041] 平滑处理的具体公式如下:
[0042]
[0043] 其中,n为同一个位置上临近的平滑核的数目,N是平滑核的总数目,k,α,β为预设的参数, 是对位于(x′,y)的像素运用核i计算得到的激活值, 是对位于(x′,y)的像素运用核j计算得到的激活值, 是对 进行平滑操作后的激活值。最大值池化选择池化窗口中的最大值作为采样值;
[0044] S54,判断t是否等于N,如果是,则转至S55;如果不是,则t=t+1,将t层卷积层的输出传递至t+1层卷积层,转至S53;
[0045] S55,将N层卷积层的输出依次经过两层全连接层输出至Softmax层。
[0046] 第一层全连接层是N层卷积层进行池化后的全连接,第二层全连接层是第一层全连接层进行非线性激活后,然后进行Dropout后再进行全连接的结果;
[0047] Dropout的具体做法是对于每一个隐层,以50%的概率将他们设置为0,不再对于前向运算或者后向反馈的过程起任何作用,对于每一个输入来说,使用的不同的网络结构,但是权重是共享的,这样求得的参数能够适应不同的情况下的网络结构,也就是提高了系统的泛化能力;
[0048] Softmax层输出的每一维电网设备图像属于某一类别的概率;
[0049] S56,将Softmax层输出的结果与对应的电网设备分类标签文档中的数字标签进行对比;
[0050] S57,根据两者的的残差采用随机梯度下降法调整卷积神经网络的权重参数,重复S52~S57的步骤,直到残差小于阈值完成训练,最后输出训练完成的卷积神经网络模型;
[0051] S58,调用卷积神经网络模型,输入测试用的图像数据,将判断结果与已知正确结果相比较,建立精度层、损失层,实时输出这一判断的正确率以及损失。
[0052] 测试用的图像数据包括测试集中的电网设备图像以及对应的电网设备分类标签文档打包成lmdb文件、测试集中的电网设备图像的图像均值。
[0053] 步骤6,利用训练完成的卷积神经网络模型对需分类的电网设备图像进行分类。
[0054] 上述方法利用数据增强技术将输入图像数据进行预处理,通过剪切、随机反转,增大数据量,解决了数据量不足会导致网络过拟合,精度下降的问题;鉴于训练数据的数量较少,削减了卷积层数量和卷积核数目,同时增大卷积核的尺寸,减小了每层卷积层所提取出的特征图的大小,从而减少了卷积层提取出的特征数量,同样起到了防止过拟合的作用,提高了精度。
[0055] 以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。