入侵检测模型建立方法、装置及数据处理设备转让专利

申请号 : CN201811261791.8

文献号 : CN109460787B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 郭保青余祖俊宁滨朱力强王尧

申请人 : 北京交通大学中国铁路总公司

摘要 :

本申请提供一种入侵检测模型建立方法、装置及数据处理设备,方法包括:获取从铁路沿线采集的多个训练图像;分别对多个训练图像进行HOG特征提取,获得各训练图像的第一图像特征;将多个训练图像和图像标签输入改进AlexNet网络结构的卷积神经网络进行训练;针对每个训练图像,通过卷积神经网络提取第二图像特征,并根据该训练图像的第一图像特征及第二图像特征的组合进行分类训练。通过对图像进行HOG特征提取并结合改进AlexNet网络结构的模型提取的图像特征一起进行分类训练,从而使得训练得到的入侵检测模型能够有针对性地从画面中判断出是否存在入侵行人,拥有较高的识别准确性,并且不易受到光线等环境因素的影响。

权利要求 :

1.一种入侵检测模型建立方法,其特征在于,所述方法包括:

获取从铁路沿线采集的多个训练图像,所述多个训练图像包括图像标签为有入侵行人的训练图像及图像标签为没有入侵行人的训练图像;

分别对所述多个训练图像进行HOG特征提取,获得各所述训练图像的第一图像特征;

将所述多个训练图像和所述图像标签输入改进AlexNet网络结构的卷积神经网络进行训练;针对每个所述训练图像,通过所述改进AlexNet网络结构的卷积神经网络提取该训练图像的第二图像特征,并根据该训练图像的第一图像特征及第二图像特征的组合进行分类训练,得到训练完成的卷积神经网络模型;

其中,所述改进AlexNet网络结构的卷积神经网络包括:

第一卷积层,由32个大小为7*7的卷积核构成,该第一卷积层包括卷积部分、BN层和ReLu激励函数;

第二卷积层,由32个大小为7*7,扩充边缘为2的卷积核构成,该第二卷积层包括卷积部分、标准化层、ReLu激励函数和降采样层,该第二卷积层的降采样层中卷积核大小为3*3,步长为2;

第三卷积层,由64个大小为5*5,扩充边缘为2的卷积核构成,该第三卷积层包括卷积部分、标准化层、ReLu激励函数和降采样层,该第三卷积层的降采样层中卷积核大小为3*3,步长为2;

第四卷积层,由192个大小为3*3,扩充边缘为1的卷积核构成,该第四卷积层包括卷积部分、标准化层和ReLu激励函数,该第四卷积层无降采样层;

第五卷积层,由384个大小为3*3,扩充边缘为1的卷积核构成,该第五卷积层包括卷积部分、标准化层和ReLu激励函数;

第六卷积层,由256个大小为3*3,扩充边缘为1的卷积核构成,该第六卷积层无标准化层,降采样层中卷积核大小为3*3,步长为2;

第一全连接层,神经元数目为4096,包括全连接层、标准化层及ReLu激励函数,该第一全连接层有4096个6*14*256尺寸的滤波器对输入数据进行卷积运算,通过4096个神经元输出运算结果;对4096个运算结果进行标准化处理,然后通过ReLu激活函数生成的4096个值为该第一全连接层的输出结果;

第二全连接层,神经元数目为4096,包括全连接层及ReLu激励函数,没有标准化层,该第二全连接层有4096个滤波器对输入数据进行卷积运算,通过4096个神经元输出图像的所述第二图像特征;并将第二图像特征与第一图像特征进行拼接,得到7876维的组合特征;

第三全连接层,用于将7876维的所述组合特征作为输入,转化为4096维的特征;

第四全连接层,所述第四全连接层为分类层,用于根据图像的第一图像特征和第二图像特征的特征组合进行分类识别获得对应的图像标签。

2.根据权利要求1所述的方法,其特征在于,在获取训练样本集之后,所述方法还包括:将所述多个训练图像调整为相同尺寸。

3.根据权利要求2所述的方法,其特征在于,所述分别对所述多个训练图像进行HOG特征提取,获得各所述训练图像的第一图像特征的步骤,包括:对所述训练图像进行颜色空间标准化;

计算所述训练图像各像素点的梯度幅值和梯度方向;

按照预设窗口尺寸及预设滑动步长从所述训练图像提取为多个图像块;

根据所述像素点的梯度幅值和梯度方向,计算每个所述图像块内每个预设大小的图像细胞内的HOG特征,并根据所述图像细胞的HOG特征组合得到每个像素块的HOG特征;

将多个图像块的HOG特征组合得到所述训练图像的第一图像特征。

4.根据权利要求2所述的方法,其特征在于,所述将所述多个训练图像调整为相同尺寸的步骤,包括:将所述多个训练图像通过拉伸或压缩的方式调整为预设尺寸。

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:

获取待识别图像;

对所述待识别图像进行HOG特征提取,获得该待识别图像的第一图像特征;

将所述待识别图像输入预先训练的所述卷积神经网络进行特征提取,获得该待识别图像的第二图像特征,并通过所述卷积神经网络的分类网络对所述待识别图像的第一图像特征及第二图像特征的组合进行识别分类,获得与该待识别图像对应的识别结果,所述识别结果包括表征该待识别图像中有入侵行人或没有入侵行人的图像标签。

6.根据权利要求5所述的方法,其特征在于,所述获取待识别图像的步骤,包括:通过快速背景差分算法在铁道监控视频图像中获取监控画面有变化的图像作为待识别图像。

7.一种入侵检测模型建立装置,其特征在于,所述装置包括:

训练图像获取模块,用于获取从铁路沿线采集的多个训练图像,所述多个训练图像包括图像标签为有入侵行人的训练图像及图像标签为没有入侵行人的训练图像;

HOG特征提取模块,分别对所述多个训练图像进行HOG特征提取,获得各所述训练图像的第一图像特征;

模型训练模块,用于将所述多个训练图像和所述图像标签输入改进AlexNet网络结构的卷积神经网络进行训练;针对每个所述训练图像,通过所述改进AlexNet网络结构的卷积神经网络提取该训练图像的第二图像特征,并根据该训练图像的第一图像特征及第二图像特征的组合进行分类训练,得到训练完成的卷积神经网络模型;

其中,所述改进AlexNet网络结构的卷积神经网络包括:

第一卷积层,由32个大小为7*7的卷积核构成,该第一卷积层包括卷积部分、BN层和ReLu激励函数;

第二卷积层,由32个大小为7*7,扩充边缘为2的卷积核构成,该第二卷积层包括卷积部分、标准化层、ReLu激励函数和降采样层,该第二卷积层的降采样层中卷积核大小为3*3,步长为2;

第三卷积层,由64个大小为5*5,扩充边缘为2的卷积核构成,该第三卷积层包括卷积部分、标准化层、ReLu激励函数和降采样层,该第三卷积层的降采样层中卷积核大小为3*3,步长为2;

第四卷积层,由192个大小为3*3,扩充边缘为1的卷积核构成,该第四卷积层包括卷积部分、标准化层和ReLu激励函数,该第四卷积层无降采样层;

第五卷积层,由384个大小为3*3,扩充边缘为1的卷积核构成,该第五卷积层包括卷积部分、标准化层和ReLu激励函数;

第六卷积层,由256个大小为3*3,扩充边缘为1的卷积核构成,该第六卷积层无标准化层,降采样层中卷积核大小为3*3,步长为2;

第一全连接层,神经元数目为4096,包括全连接层、标准化层及ReLu激励函数,该第一全连接层有4096个6*14*256尺寸的滤波器对输入数据进行卷积运算,通过4096个神经元输出运算结果;对4096个运算结果进行标准化处理,然后通过ReLu激活函数生成的4096个值为该第一全连接层的输出结果;

第二全连接层,神经元数目为4096,包括全连接层及ReLu激励函数,没有标准化层,该第二全连接层有4096个滤波器对输入数据进行卷积运算,通过4096个神经元输出图像的所述第二图像特征;并将第二图像特征与第一图像特征进行拼接,得到7876维的组合特征;

第三全连接层,用于将7876维的所述组合特征作为输入,转化为4096维的特征;

第四全连接层,所述第四全连接层为分类层,用于根据图像的第一图像特征和第二图像特征的特征组合进行分类识别获得对应的图像标签。

8.根据权利要求7所述的装置,其特征在于,所述装置还包括识别图像获取模块及入侵识别模块,其中,所述识别图像获取模块用于获取待识别图像;

所述HOG特征提取模块还用于对所述待识别图像进行HOG特征提取,获得该待识别图像的第一图像特征;

所述入侵识别模块用于将所述待识别图像输入预先训练的所述卷积神经网络进行特征提取,获得该待识别图像的第二图像特征,并通过所述卷积神经网络的分类网络对所述待识别图像的第一图像特征及第二图像特征的组合进行识别分类,获得与该待识别图像对应的识别结果,所述识别结果包括表征该待识别图像中有入侵行人或没有入侵行人的图像标签。

9.一种数据处理设备,其特征在于,包括机器可读存储介质及处理器,所述机器可读存储介质存储有机器可执行的指令,所述指令在被所述处理器执行时,促使所述数据处理设备实现权利要求1-6任意一项所述的方法。

说明书 :

入侵检测模型建立方法、装置及数据处理设备

技术领域

[0001] 本申请涉及图像处理技术领域,具体而言,涉及一种入侵检测模型建立方法、装置及数据处理设备。

背景技术

[0002] 随着高速铁路的不断发展,高铁线路数量和行车速度均在不断提高,列车行驶的安全性也越来越受到关注。在维护高铁安全运行的工作中,检测高铁线路是否有异物入侵对行车安全十分重要,其中,识别是否存在行人入侵高铁线路又是入侵检测中最重要的部分。现有技术中采用了一些图像差分算法从监控视频中识别出变化画面从而判断是否有异物入侵。但是这些方法对异物入侵的识别能力有限,无法精准区分是何种异物入侵,因此针对于行人入侵的检测存在大量误报。并且这些方法的检测精度容易受到光线等环境因素的影响,不能保证较高的识别准确性。

发明内容

[0003] 为了克服现有技术中的上述不足,本申请的目的之一在于提供一种入侵检测模型建立方法,所述方法包括:
[0004] 获取从铁路沿线采集的多个训练图像,所述多个训练图像包括图像标签为有入侵行人的训练图像及图像标签为没有入侵行人的训练图像;
[0005] 分别对所述多个训练图像进行HOG特征提取,获得各所述训练图像的第一图像特征;
[0006] 将所述多个训练图像和所述图像标签输入改进AlexNet网络结构的卷积神经网络进行训练;针对每个所述训练图像,通过所述改进AlexNet网络结构的卷积神经网络提取该训练图像的第二图像特征,并根据该训练图像的第一图像特征及第二图像特征的组合进行分类训练,得到训练完成的卷积神经网络模型。
[0007] 可选地,在获取训练样本集之后,所述方法还包括:
[0008] 将所述多个训练图像调整为相同尺寸。
[0009] 可选地,所述分别对所述多个训练图像进行HOG特征提取,获得各所述训练图像的第一图像特征的步骤,包括:
[0010] 对所述训练图像进行颜色空间标准化;
[0011] 计算所述训练图像各像素点的梯度幅值和梯度方向;
[0012] 按照预设窗口尺寸及预设滑动步长从所述训练图像提取为多个图像块;
[0013] 根据所述像素点的梯度幅值和梯度方向,计算每个所述图像块内每个预设大小的图像细胞内的HOG特征,并根据所述图像细胞的HOG特征组合得到每个像素块的HOG特征;
[0014] 将多个图像块的HOG特征组合得到所述训练图像的第一图像特征。
[0015] 可选地,所述将所述多个训练图像调整为相同尺寸的步骤,包括:
[0016] 将所述多个训练图像通过拉伸或压缩的方式调整为预设尺寸。
[0017] 可选地,所述改进AlexNet网络结构的卷积神经网络包括:
[0018] 第一卷积层,由32个大小为7*7的卷积核构成,该第一卷积层包括卷积部分、BN层和ReLu激励函数;
[0019] 第二卷积层,由32个大小为7*7,扩充边缘为2的卷积核构成,该第二卷积层包括卷积部分、标准化层、ReLu激励函数和降采样层,该第二卷积层的降采样层中卷积核大小为3*3,步长为2;
[0020] 第三卷积层,由64个大小为5*5,扩充边缘为2的卷积核构成,该第三卷积层包括卷积部分、标准化层、ReLu激励函数和降采样层,该第三卷积层的降采样层中卷积核大小为3*3,步长为2;
[0021] 第四卷积层,由192个大小为3*3,扩充边缘为1的卷积核构成,该第四卷积层包括卷积部分、标准化层和ReLu激励函数,该第四卷积层无降采样层;
[0022] 第五卷积层,由384个大小为3*3,扩充边缘为1的卷积核构成,该第五卷积层包括卷积部分、标准化层和ReLu激励函数;
[0023] 第六卷积层,由256个大小为3*3,扩充边缘为1的卷积核构成,该第六卷积层无标准化层,降采样层中卷积核大小为3*3,步长为2;
[0024] 第一全连接层,神经元数目为4096,包括全连接层、标准化层及ReLu激励函数,该第一全连接层有4096个6*14*256尺寸的滤波器对输入数据进行卷积运算,通过4096个神经元输出运算结果;对4096个运算结果进行标准化处理,然后通过ReLu激活函数生成的4096个值为该第一全连接层的输出结果;
[0025] 第二全连接层,神经元数目为4096,包括全连接层及ReLu激励函数,没有标准化层,该第二全连接层有4096个滤波器对输入数据进行卷积运算,通过4096个神经元输出图像的所述第二图像特征;并将第二图像特征与第一图像特征进行拼接,得到7876维的组合特征;
[0026] 第三全连接层,用于将7876维的所述组合特征作为输入,转化为4096维的特征;
[0027] 第四全连接层,所述第四全连接层为分类层,用于根据图像的第一图像特征和第二图像特征的特征组合进行分类识别获得对应的图像标签。
[0028] 可选地,所述方法还包括:
[0029] 获取待识别图像;
[0030] 对所述待识别图像进行HOG特征提取,获得该待识别图像的第一图像特征;
[0031] 将所述待识别图像输入预先训练的所述卷积神经网络进行特征提取,获得该待识别图像的第二图像特征,并通过所述卷积神经网络的分类网络对所述待识别图像的第一图像特征及第二图像特征的组合进行识别分类,获得与该待识别图像对应的识别结果,所述识别结果包括表征该待识别图像中有入侵行人或没有入侵行人的图像标签。
[0032] 可选地,所述获取待识别图像的步骤,包括:
[0033] 通过快速背景差分算法在铁道监控视频图像中获取监控画面有变化的图像作为待识别图像。
[0034] 本申请的另一目的在于提供一种入侵检测模型建立装置,所述装置包括:
[0035] 训练图像获取模块,用于获取从铁路沿线采集的多个训练图像,所述多个训练图像包括图像标签为有入侵行人的训练图像及图像标签为没有入侵行人的训练图像;
[0036] HOG特征提取模块,分别对所述多个训练图像进行HOG特征提取,获得各所述训练图像的第一图像特征;
[0037] 模型训练模块,用于将所述多个训练图像和所述图像标签输入改进AlexNet网络结构的卷积神经网络进行训练;针对每个所述训练图像,通过所述改进AlexNet网络结构的卷积神经网络提取该训练图像的第二图像特征,并根据该训练图像的第一图像特征及第二图像特征的组合进行分类训练,得到训练完成的卷积神经网络模型。
[0038] 可选地,所述装置还包括识别图像获取模块及入侵识别模块,其中,
[0039] 所述识别图像获取模块用于获取待识别图像;
[0040] 所述HOG特征提取模块还用于对所述待识别图像进行HOG特征提取,获得该待识别图像的第一图像特征;
[0041] 所述入侵识别模块用于将所述待识别图像输入预先训练的所述卷积神经网络进行特征提取,获得该待识别图像的第二图像特征,并通过所述卷积神经网络的分类网络对所述待识别图像的第一图像特征及第二图像特征的组合进行识别分类,获得与该待识别图像对应的识别结果,所述识别结果包括表征该待识别图像中有入侵行人或没有入侵行人的图像标签。
[0042] 本申请的另一目的在于提供一种数据处理设备,包括机器可读存储介质及处理器,所述机器可读存储介质存储有机器可执行的指令,所述指令在被所述处理器执行时,促使所述数据处理设备实现本申请提供的所述入侵检测模型建立方法。
[0043] 相对于现有技术而言,本申请具有以下有益效果:
[0044] 本申请实施例提供的入侵检测模型建立方法、装置及数据处理设备,通过对图像进行HOG特征提取并结合改进AlexNet网络结构的神经网络模型提取的图像特征一起进行分类训练,从而使得训练得到的入侵检测模型能够有针对性地从画面中判断出是否存在入侵行人,拥有较高的识别准确性,并且不易受到光线等环境因素的影响。

附图说明

[0045] 为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0046] 图1为本申请实施例提供的数据处理设备的硬件结构示意图;
[0047] 图2为本申请实施例提供的入侵检测模型建立方法的流程示意图之一;
[0048] 图3为本申请实施例提供的HOG特征的梯度方向划分示意图;
[0049] 图4为本申请实施例提供的入侵检测模型建立方法的流程示意图之二;
[0050] 图5为本申请实施例提供的入侵检测模型建立装置的功能模块示意图之一;
[0051] 图6为本申请实施例提供的入侵检测模型建立装置的功能模块示意图之二。
[0052] 图标:100-数据处理设备;110-入侵检测模型建立装置;111-训练图像获取模块;112-HOG特征提取模块;113-模型训练模块;114-识别图像获取模块;115-入侵识别模块;
120-机器可读存储介质;130-处理器。

具体实施方式

[0053] 为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
[0054] 因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0055] 应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
[0056] 在本申请的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0057] 在本申请的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
[0058] 请参照图1,图1为本实施例提供的一种数据处理设备100的示意图,该数据处理设备100可以包括入侵检测模型建立装置110、机器可读存储介质120及处理器130。
[0059] 所述机器可读存储介质120以及处理器130各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述入侵检测模型建立装置110包括至少一个可以软件或固件(firmware)的形式存储于所述机器可读存储介质120中或固化在数据处理设备100的操作系统(operating system,OS)中的软件功能模块。所述处理器130用于执行所述机器可读存储介质120中存储的可执行模块,例如所述入侵检测模型建立装置110所包括的软件功能模块及计算机程序等。
[0060] 其中,所述机器可读存储介质120可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,机器可读存储介质120用于存储程序,所述处理器130在接收到执行指令后,执行所述程序。
[0061] 请参照图2,图2为应用于图1所示的数据处理设备100的一种第一在线诊断方法的流程图,以下将对所述方法包括各个步骤进行详细阐述。
[0062] 步骤S110,获取从铁路沿线采集的多个训练图像,所述多个训练图像包括图像标签为有入侵行人的训练图像及图像标签为没有入侵行人的训练图像。
[0063] 在本实施例中,所述多个训练图像可以为通过快速背景差分算法在铁道监控视频图像中获取到的监控画面有变化的图像。这些图像可以预先被标注有相应的图像标签,例如,标注为有入侵行人或标注为没有入侵行人。
[0064] 通过上述方法获得所述多个训练图像可能存在多种不同的图像尺寸,故在本实施例中,在获得所述多个训练图像后,可以先将所述多个训练图像调整为相同的尺寸以方便后续进行图像特征提取。例如,可以通过压缩或者拉伸的方式将所述多个训练图像调整为相同的尺寸。
[0065] 步骤S120,分别对所述多个训练图像进行HOG特征提取,获得各所述训练图像的第一图像特征。
[0066] 在本实施例中,针对每个所述训练图像,先进行HOG特征提取。
[0067] 具体地,首先计算所述训练图像各像素点的梯度幅值和梯度方向。
[0068] 可以采用Gamma校正法对输入训练图像进行颜色空间的标准化,然后分别计算每个像素在水平方向的梯度和垂直方向的梯度。
[0069] 以训练图像的像素点为单位建立像素坐标系,像素点(x,y)水平方向的梯度可以表示为Gx(x,y)=H(x+1,y)-H(x-1,y),垂直方向的梯度可以表示为Gy(x,y)=H(x,y+1)-H(x,y-1)。
[0070] 获得像素点的水平和垂直梯度后,可以计算出像素点的梯度幅值G(x,y)和梯度方向 其中,
[0071]
[0072]
[0073] 然后,按照预设窗口尺寸及预设滑动步长从所述训练图像提取为多个图像块。
[0074] 在本实施例中,步骤S110获得训练图像尺寸可以为64*128像素的。
[0075] 将64*128的训练图像划分成8*8像素的图像细胞,可以划分出8*16=128个图像细胞,然后以4个两行两列的图像细胞组成一个图像块大小,以一个图像块为预设窗口尺寸,一个图像细胞为预设滑动步,沿训练图像水平和垂直方向进行提取,从水平方向可以提取7个图像块,垂直方向可以提取15个图像块,总共可以提取7*15=105个图像块。
[0076] 针对每个图像块,将图像块中的每个图像细胞在角度[0,π]范围的梯度方向平均划分为9个区间,如图3所示。
[0077] 接着,根据所述像素点的梯度幅值和梯度方向,计算每个所述图像块内每个预设大小的图像细胞内的HOG特征,并根据所述图像细胞的HOG特征组合得到每个像素块的HOG特征。
[0078] 针对每个像素细胞内每个像素,用梯度方向进行加权投影,得到9维的HOG特征,针对每个图像细胞,利用下述公式进行二范数归一化直方图处理,
[0079]
[0080] 其中,x为HOG特征向量,k为序号,k的变换范围为1到n,n为向量x的维数,在本实施例中可以设置为9。
[0081] 如此可以是图像的局部变化产生的影响减小,在行人检测中使用该归一化函数能够取得较好的效果。
[0082] 最后,将多个图像块的HOG特征组合得到所述训练图像的第一图像特征。
[0083] 4个图像细胞的HOG特征组合可以得到一个像素块的36维HOG特征,105个像素块的HOG特征组合可以得到训练图像的3780维的HOG特征作为该训练图像的第一图像特征。
[0084] 步骤S130,将所述多个训练图像和所述图像标签输入改进AlexNet网络结构的卷积神经网络进行训练;针对每个所述训练图像,通过所述改进AlexNet网络结构的卷积神经网络提取该训练图像的第二图像特征,并根据该训练图像的第一图像特征及第二图像特征的组合进行分类训练,得到训练完成的卷积神经网络模型。
[0085] 在本实施例中,考虑改进AlexNet网络结构的卷积神经网络相对较为简单并且对二分类能达到较好效果,因此选用改进AlexNet网络结构的卷积神经网络进行进一步的处理。
[0086] 现有常用的AlexNet模型由5个卷积层和3个全连接层组成,并且引入LRN(Local Response Normalization,局部响应归一化)方法来提高网络模型的泛化能力和训练速度,但存在一定的弊端,故在本实施例中,采用BN(Batch Normalization,批量归一化)方法替代AlexNet网络原本的LRN方法进行归一化处理,并且在全连接层不使用Dropout层。
[0087] 同时,为了防止卷积核数量太多带来的计算量暴增而影响计算性能,在本实施例中,对现有常用的AlexNet网络结构进行改进,采用两个小卷积核的卷积层替代经典网络的大卷积层,即引入了两个具有7*7卷积核的卷积层代替原来大小为11*11卷积核的第一个卷积层。在降低卷积核大小和个数的同时加入BN方法,从而实现对异物侵限报警图像进行特征提取和分类识别。
[0088] 具体地,本实施例中采用的所述改进AlexNet网络结构的卷积神经网络包括:
[0089] 第一卷积层,由32个大小为7*7的卷积核构成,该第一卷积层包括卷积部分、BN层和ReLu激励函数。所述第一卷积层输入的数据为储存为64*128的灰度图像。
[0090] 第二卷积层,由32个大小为7*7,扩充边缘为2的卷积核构成,该第二卷积层包括卷积部分、标准化层、ReLu激励函数和降采样层,该第二卷积层的降采样层中卷积核大小为3*3,步长为2。所述第二卷积层输入的数据为储存为64*128的灰度图像
[0091] 第三卷积层,由64个大小为5*5,扩充边缘为2的卷积核构成,该第三卷积层包括卷积部分、标准化层、ReLu激励函数和降采样层,该第三卷积层的降采样层中卷积核大小为3*3,步长为2。所述第三卷积层输入的数据为27*59*32像素。
[0092] 第四卷积层,由192个大小为3*3,扩充边缘为1的卷积核构成,该第四卷积层包括卷积部分、标准化层和ReLu激励函数,该第四卷积层无降采样层。所述第四卷积层输入的数据为13*29*64像素。
[0093] 第五卷积层,由384个大小为3*3,扩充边缘为1的卷积核构成,该第五卷积层包括卷积部分、标准化层和ReLu激励函数。所述第五卷积层输入的数据为13*29*192像素。
[0094] 第六卷积层,由256个大小为3*3,扩充边缘为1的卷积核构成,该第六卷积层无标准化层,降采样层中卷积核大小为3*3,步长为2。所述第六卷积层输入的数据为13*29*384像素。
[0095] 第一全连接层,所述第一全连接层输入的数据为6*14*256像素,神经元数目为4096,包括全连接层、标准化层及ReLu激励函数,该第一全连接层有4096个6*14*256尺寸的滤波器对输入数据进行卷积运算,通过4096个神经元输出运算结果;对4096个运算结果进行BN标准化处理,然后通过ReLu激活函数生成的4096个值为该第一全连接层的输出结果。
[0096] 第二全连接层,所述第二全连接层输入的数据为6*14*256像素,神经元数目为4096,包括全连接层及ReLu激励函数,没有标准化层,该第二全连接层有4096个6*14*256尺寸的滤波器对输入数据进行卷积运算,通过4096个神经元输出图像的所述第二图像特征。
并将第二图像特征与第一图像特征进行拼接,得到7876维的组合特征;
[0097] 第三全连接层,用于将7876维的所述组合特征作为输入,转化为4096维的特征。
[0098] 第四全连接层,所述第四全连接层为分类层,用于根据图像的第一图像特征和第二图像特征的特征组合进行分类识别获得对应的图像标签。其中,可以将有入侵行人的图像标签设置为1,没有入侵行人的图像标签设置为0。
[0099] 通过分别所述多个训练图像输入上述卷积神经网络模型进行训练,得到训练完成的卷积神经网络模型可以用于对待识别图像中是否具有入侵行人进行识别。
[0100] 请参照图4,在识别过程中可以包括步骤。
[0101] 步骤S210,获取待识别图像。
[0102] 步骤S220,对所述待识别图像进行HOG特征提取,获得该待识别图像的第一图像特征。
[0103] 步骤S230,将所述待识别图像输入预先训练的所述卷积神经网络进行特征提取,获得该待识别图像的第二图像特征,并通过所述卷积神经网络的分类网络对所述待识别图像的第一图像特征及第二图像特征的组合进行识别分类,获得与该待识别图像对应的识别结果,所述识别结果包括表征该待识别图像中有入侵行人或没有入侵行人的图像标签。
[0104] 具体地,所述待识别图像可以为通过快速背景差分算法在铁道监控视频图像中获取监控画面有变化的图像。
[0105] 对所述待识别图像的特征提取处理可以参照上述训练过程中对训练图像的特征提取的方式,再次不再赘述。
[0106] 在对所述待识别图像进行特征提取后,在所述AlexNet模型的分类层可以根据待识别图像的第一图像特征和第二图像特征的组合进行分类识别,最终输出表征该待识别图像中有入侵行人或没有入侵行人的图像标签。
[0107] 请参照图5,本实施例还提供一种入侵检测模型建立装置110,该入侵检测模型建立装置110包括训练图像获取模块111、HOG特征提取模块112及模型训练模块113。
[0108] 所述训练图像获取模块111用于获取从铁路沿线采集的多个训练图像,所述多个训练图像包括图像标签为有入侵行人的训练图像及图像标签为没有入侵行人的训练图像。
[0109] 本实施例中,所述训练图像获取模块111可用于执行图2所示的步骤S110,关于所述训练图像获取模块111的具体描述可参对所述步骤S110的描述。
[0110] 所述HOG特征提取模块112分别对所述多个训练图像进行HOG特征提取,获得各所述训练图像的第一图像特征。
[0111] 本实施例中,所述HOG特征提取模块112可用于执行图2所示的步骤S120,关于所述HOG特征提取模块112的具体描述可参对所述步骤S120的描述。
[0112] 所述模型训练模块113用于将所述多个训练图像和所述图像标签输入改进AlexNet网络结构的卷积神经网络进行训练;针对每个所述训练图像,通过所述改进AlexNet网络结构的卷积神经网络提取该训练图像的第二图像特征,并根据该训练图像的第一图像特征及第二图像特征的组合进行分类训练,得到训练完成的卷积神经网络模型。
[0113] 本实施例中,所述模型训练模块113可用于执行图2所示的步骤S130,关于所述模型训练模块113的具体描述可参对所述步骤S130的描述。
[0114] 可选地,请参照图6,所述入侵检测模型建立装置110还可以包括识别图像获取模块114及入侵识别模块115。
[0115] 所述识别图像获取模块114用于获取从铁路沿线采集的多个训练图像,所述多个训练图像包括图像标签为有入侵行人的训练图像及图像标签为没有入侵行人的训练图像;
[0116] 所述HOG特征提取模块112还用于分别对所述多个训练图像进行HOG特征提取,获得各所述训练图像的第一图像特征;
[0117] 所述模型训练模块113用于将所述多个训练图像和所述图像标签输入改进AlexNet网络结构的卷积神经网络进行训练;针对每个所述训练图像,通过所述改进AlexNet网络结构的卷积神经网络提取该训练图像的第二图像特征,并根据该训练图像的第一图像特征及第二图像特征的组合进行分类训练,得到训练完成的卷积神经网络模型。
[0118] 综上所述,本申请实施例提供的入侵检测模型建立方法、装置及数据处理设备,通过对图像进行HOG特征提取并结合改进AlexNet网络结构的神经网络模型提取的图像特征一起进行分类训练,从而使得训练得到的入侵检测模型能够有针对性地从画面中判断出是否存在入侵行人,拥有较高的识别准确性,并且不易受到光线等环境因素的影响。
[0119] 在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0120] 另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
[0121] 所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0122] 需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0123] 以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。