基于违停车辆标签的神经网络的训练方法和检测方法转让专利

申请号 : CN202011305044.7

文献号 : CN112115928B

文献日 : 2021-03-09

本发明公开了一种基于违停车辆标签的神经网络的训练方法和检测方法。所述方法，包括：获取包含停放车辆的街景图像的第一集合和包含标记有违停车辆的所述街景图像的第二集合；将所述第一集合输入第一卷积神经网络和第一全连接层以获得第一特征向量；将所述第二集合输入第二卷积神经网络和第二全连接层以获得第二特征向量；计算所述第一特征向量与所述第二特征向量的均方误差损失函数；将所述第一特征向量以Softmax函数进行分类以获得Softmax损失函数；以及，基于所述均方误差损失函数和所述Softmax损失函数的加权和更新模型参数。这样，所述第一特征向量能够更好地识别能够表示车辆违停的特征，以提高车辆违停检测的准确性。

1.一种基于违停车辆标签的神经网络的训练方法，其特征在于，包括：获取每个包含停放车辆的街景图像的第一集合和包含标记有违停车辆的所述街景图像的第二集合；

将所述第一集合的街景图像输入第一卷积神经网络和第一全连接层以获得第一特征向量；

将所述第二集合的街景图像输入第二卷积神经网络和第二全连接层以获得第二特征向量，所述第二卷积神经网络与所述第一卷积神经网络具有相同的网络结构；

计算所述第一特征向量与所述第二特征向量的均方误差损失函数；

将所述第一特征向量以Softmax函数进行分类以获得Softmax损失函数；以及基于所述均方误差损失函数和所述Softmax损失函数的加权和更新所述第一卷积神经网络、第一全连接层、所述第二卷积神经网络和第二全连接层的参数；

其中，在包含标记有违停车辆的所述街景图像的第二集合中，所述违停车辆在每个所述街景图像中以候选框形式标记；

将所述第二集合的街景图像输入第二卷积神经网络和第二全连接层以获得第二特征向量，包括：

计算每个所述街景图像中，所述候选框的中心相对于所述街景图像的位置；以及将所述位置坐标作为所述街景图像的标签值，与所述街景图像一起输入所述第二卷积神经网络和所述第二全连接层以获得所述第二特征向量；

其中，在包含标记有违停车辆的所述街景图像的第二集合中，所述违停车辆在每个所述街景图像中以标签信息形式标记，所述标签信息包括所述违停车辆的违停描述；

将所述第二集合的街景图像输入第二卷积神经网络和第二全连接层以获得第二特征向量，包括：

将每个所述街景图像以及其对应的标签信息通过多模态特征向量转化为混合特征向量；以及

将所述混合特征向量输入所述第二卷积神经网络和所述第二全连接层以获得所述第二特征向量；

其中，基于所述均方误差损失函数和所述Softmax损失函数的加权和更新所述第一卷积神经网络、第一全连接层、所述第二卷积神经网络和第二全连接层的参数包括：基于所述均方误差损失函数和所述Softmax损失函数的加权和迭代地更新所述第一卷积神经网络、第一全连接层、所述第二卷积神经网络和第二全连接层的参数，其中，在每次迭代中，首先固定所述第一卷积神经网络和第一全连接层的参数并更新所述第二卷积神经网络和第二全连接层的参数，再固定所述第二卷积神经网络和第二全连接层的参数并更新所述第一卷积神经网络和第一全连接层的参数。

2.根据权利要求1所述的基于违停车辆标签的神经网络的训练方法，其中，所述违停车辆的违停描述包括车辆的牌号、车型、车型、颜色、违停地点、违章时间。

3.一种车辆违停的检测方法，其特征在于，包括：获取包含停放车辆的街景图像；

将所述街景图像输入根据权利要求1到2中任意一项所述的基于违停车辆标签的神经网络的训练方法所训练的第一卷积神经网络，第一全连接层和Softmax函数，所述Softmax函数的输出为表示所述停放车辆属于违停的第一概率和所述停放车辆不属于违停的第二概率；以及

基于所述第一概率和所述第二概率确定所述停放车辆是否违停。

4.一种电子设备，包括：

处理器；以及

存储器，在所述存储器中存储有计算机程序指令，所述计算机程序指令在被所述处理器运行时使得所述处理器执行如权利要求1-2中任一项所述的基于违停车辆标签的神经网络的训练方法或者如权利要求3所述的车辆违停的检测方法。

基于违停车辆标签的神经网络的训练方法和检测方法

技术领域

[0001] 本申请涉及人工智能技术领域，且更为具体地，涉及一种基于违停车辆标签的神经网络的训练方法、车辆违停检测方法、训练装置、检测装置和电子设备。

背景技术

[0002] 智慧城市是把新一代信息技术充分应用在城市中各行各业的城市信息化高级形态。随着城市化进程的不断加快，大量人口涌入城市，私家车的数量迅速增加，导致城市车
辆数量迅速增加，而城市停车位紧缺，导致车辆违停现象十分严重，城市交通混乱甚至瘫
痪，造成巨大的经济损失。因此，必须要对车辆进行有效监管，才能保证城市交通的正常运
行，监管车辆最直接有效的方法是对违停车辆进行抄牌。

[0003] 传统的车辆违停检测与抄牌要依靠交警巡逻贴罚单完成，这种人工监管车辆的方法费时费力，而且覆盖面不广，容易漏检。

[0004] 目前，深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、语音信号处理等领域。此外，深度学习以及神经网络在机器视觉、图像分类、物体检测、语义分割、
文本翻译等领域，也展现出了接近甚至超越人类的水平。

[0005] 深度学习以及神经网络的发展（尤其是机器视觉技术的发展），为车辆违停检测提供的解决思路和方案。

发明内容

[0006] 为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种基于违停车辆标签的神经网络的训练方法、车辆违停检测方法、训练装置、检测装置和电子设备，其包
含停放车辆的街景图像和包含标记有违停车辆的所述街景图像作为训练用图像集来训练
用于车辆违停检测的神经网络，以最终训练完成的检测模型能够更好地提取违停车辆的特
征，从而提高分类准确性。

[0007] 根据本申请的一个方面，提供了一种基于违停车辆标签的神经网络的训练方法，其包括：

[0008] 获取每个包含停放车辆的街景图像的第一集合和包含标记有违停车辆的所述街景图像的第二集合；

[0009] 将所述第一集合的街景图像输入第一卷积神经网络和第一全连接层以获得第一特征向量；

[0010] 将所述第二集合的街景图像输入第二卷积神经网络和第二全连接层以获得第二特征向量，所述第二卷积神经网络与所述第一卷积神经网络具有相同的网络结构；

[0011] 计算所述第一特征向量与所述第二特征向量的均方误差损失函数；

[0012] 将所述第一特征向量以Softmax函数进行分类以获得Softmax损失函数；以及

[0013] 基于所述均方误差损失函数和所述Softmax损失函数的加权和更新所述第一卷积神经网络、第一全连接层、所述第二卷积神经网络和第二全连接层的参数。

[0014] 在上述基于违停车辆标签的神经网络的训练方法中，在包含标记有违停车辆的所述街景图像的第二集合中，所述违停车辆在每个所述街景图像中以候选框形式标记；

[0015] 将所述第二集合的街景图像输入第二卷积神经网络和第二全连接层以获得第二特征向量包括：

[0016] 计算每个所述街景图像中，所述候选框的中心相对于所述街景图像的位置坐标；以及

[0017] 将所述位置坐标作为所述街景图像的标签值，与所述街景图像一起输入所述第二卷积神经网络和所述第二全连接层以获得所述第二特征向量。

[0018] 在上述基于违停车辆标签的神经网络的训练方法中，在包含标记有违停车辆的所述街景图像的第二集合中，所述违停车辆在每个所述街景图像中以标签信息形式标记，所
述标签信息包括所述违停车辆的违停描述；

[0019] 将所述第二集合的街景图像输入第二卷积神经网络和第二全连接层以获得第二特征向量包括：

[0020] 将所述每个街景图像以及其对应的标签信息通过多模态特征向量变换转换为混合特征向量；以及

[0021] 将所述混合特征向量输入所述第二卷积神经网络和所述第二全连接层以获得所述第二特征向量。

[0022] 在上述基于违停车辆标签的神经网络的训练方法中，所述违停车辆的违停描述包括所述车辆的牌号、车型、颜色、违章地点、违章时间。

[0023] 在上述基于违停车辆标签的神经网络的训练方法中，基于所述均方误差损失函数和所述Softmax损失函数的加权和更新所述第一卷积神经网络、第一全连接层、所述第二卷
积神经网络和第二全连接层的参数包括：基于所述均方误差损失函数和所述Softmax损失
函数的加权和迭代地更新所述第一卷积神经网络、第一全连接层、所述第二卷积神经网络
和第二全连接层的参数，其中，在每次迭代中，首先固定所述第一卷积神经网络和第一全连
接层的参数并更新所述第二卷积神经网络和第二全连接层的参数，再固定所述第二卷积神
经网络和第二全连接层的参数并更新所述第一卷积神经网络和第一全连接层的参数。

[0024] 根据本申请的另一方面，提供了一种车辆违停的检测方法，其包括：

[0025] 获取包含停放车辆的街景图像；

[0026] 将所述街景图像输入根据如上所述的基于违停车辆标签的神经网络的训练方法所训练的第一卷积神经网络，第一全连接层和Softmax函数，所述Softmax函数的输出为表
示所述停放车辆属于违停的第一概率和所述停放车辆不属于违停的第二概率；以及

[0027] 基于所述第一概率和所述第二概率确定所述停放车辆是否违停。

[0028] 根据本申请的再一方面，提供了一种基于违停车辆标签的神经网络的训练装置，其包括：

[0029] 训练用图像集获取单元，用于获取每个包含停放车辆的街景图像的第一集合和包含标记有违停车辆的所述街景图像的第二集合；

[0030] 第一特征向量生成单元，用于将所述训练用图像集获取单元获得的所述第一集合的街景图像输入第一卷积神经网络和第一全连接层以获得第一特征向量；

[0031] 第二特征向量生成单元，用于将所述训练用图像集获取单元获得的所述第二集合的街景图像输入第二卷积神经网络和第二全连接层以获得第二特征图，所述第二卷积神经
网络与所述第一卷积神经网络具有相同的网络结构；

[0032] 均方误差损失函数计算单元，用于计算所述第一特征向量生成单元获得的所述第一特征向量与所述第二特征向量生成单元获得的所述第二特征向量的均方误差损失函数；

[0033] Softmax损失函数生成单元，用于将所述第一特征图生成单元获得的所述第一特征向量以Softmax函数进行分类以获得Softmax损失函数；以及

[0034] 参数更新单元，用于基于所述均方误差损失函数计算单元获得的所述均方误差损失函数和所述Softmax损失函数生成单元获得的所述Softmax损失函数的加权和更新所述
第一卷积神经网络、第一全连接层、第二卷积神经网络和第二全连接层的参数。

[0035] 在上述基于违停车辆标签的神经网络的训练装置中，所述第二特征向量生成单元，进一步包括：

[0036] 候选框位置坐标计算子单元，用于计算每个所述街景图像中，所述候选框的中心相对于所述街景图像的位置坐标；以及

[0037] 特征向量计算子单元，用于将所述位置坐标作为所述街景图像的标签值，与所述街景图像一起输入所述第二卷积神经网络和所述第二全连接层以获得所述第二特征向量。

[0038] 在上述基于违停车辆标签的神经网络的训练装置中，所述第二特征向量生成单元，进一步包括：

[0039] 混合特征向量生成子单元，用于将所述每个街景图像以及其对应的标签信息通过多模态特征向量变换转换为混合特征向量；以及

[0040] 特征向量生成子单元，用于将所述混合特征向量输入所述第二卷积神经网络和所述第二全连接层以获得所述第二特征向量

[0041] 在上述基于违停车辆标签的神经网络的训练装置中，所述违停车辆的违停描述包括所述车辆的牌号、车型、颜色、违章地点、违章时间。

[0042] 在上述基于违停车辆标签的神经网络的训练装置中，所述参数更新单元，进一步用于：基于所述均方误差损失函数和所述Softmax损失函数的加权和迭代地更新所述第一
卷积神经网络、第一全连接层、所述第二卷积神经网络和第二全连接层的参数，其中，在每
次迭代中，首先固定所述第一卷积神经网络和第一全连接层的参数并更新所述第二卷积神
经网络和第二全连接层的参数，再固定所述第二卷积神经网络和第二全连接层的参数并更
新所述第一卷积神经网络和第一全连接层的参数。

[0043] 根据本申请的又一方面，提供了一种车辆违停的检测装置，其包括：

[0044] 街景图像获取单元，用于获取包含停放车辆的街景图像；

[0045] 分类单元，用于将所述街景图像获取单元获得的所述街景图像输入至如上所述的基于违停车辆标签的神经网络的训练装置所训练的第一卷积神经网络，第一全连接层和
Softmax函数，所述Softmax函数的输出为表示所述停放车辆属于违停的第一概率和所述停
放车辆不属于违停的第二概率；以及

[0046] 确定单元，用于基于所述分类单元获得的所述第一概率和所述第二概率确定所述停放车辆是否违停。

[0047] 根据本申请的再又一方面，提供了一种电子设备，包括：处理器；以及，存储器，在所述存储器中存储有计算机程序指令，所述计算机程序指令在被所述处理器运行时使得所
述处理器执行如上所述的基于违停车辆标签的神经网络的训练方法或者如上所述的车辆
违停的检测方法。

[0048] 根据本申请的又一方面，提供了一种计算机可读介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的基于违停车辆
标签的神经网络的训练方法或者如上所述的车辆违停的检测方法。

[0049] 与现有技术相比，本申请提供的基于违停车辆标签的神经网络的训练方法、车辆违停检测方法、训练装置、检测装置和电子设备，其通过包含停放车辆的街景图像和包含标
记有违停车辆的所述街景图像作为训练用图像集来训练用于车辆违停检测的神经网络，以
最终训练完成的检测模型能够减少用于分类的特征图在其图像空间内的低概率样本点的
数目其能够更好地提取违停车辆的特征，从而提高分类准确性。

附图说明

[0050] 通过结合附图对本申请实施例进行更详细的描述，本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解，并且构成说明
书的一部分，与本申请实施例一起用于解释本申请，并不构成对本申请的限制。在附图中，
相同的参考标号通常代表相同部件或步骤。

[0051] 图1图示了根据本申请实施例的基于违停车辆标签的神经网络的训练方法和车辆违停检测方法的应用场景图。

[0052] 图2图示了根据本申请实施例的基于违停车辆标签的神经网络的训练方法的流程图。

[0053] 图3图示了根据本申请实施例的基于违停车辆标签的神经网络的训练方法的系统架构的示意图。

[0054] 图4图示了根据本申请实施例的车辆违停的检测方法的流程图。

[0055] 图5图示了根据本申请实施例的基于违停车辆标签的神经网络的训练装置的框图示意图。

[0056] 图6图示了根据本申请实施例的用违停车辆标签的神经网络的训练装置中第二特征向量生成单元的框图。

[0057] 图7图示了根据本申请实施例的违停车辆标签的神经网络的训练装置中第二特征向量生成单元的另一框图。

[0058] 图8图示了根据本申请实施例的车辆违停的检测装置的框图。

[0059] 图9图示了根据本申请实施例的电子设备的框图。

具体实施方式

[0060] 下面，将参考附图详细地描述根据本申请的示例实施例。显然，所描述的实施例仅仅是本申请的一部分实施例，而不是本申请的全部实施例，应理解，本申请不受这里描述的
示例实施例的限制。

[0061] 场景概述

[0062] 如上所述，传统的车辆违停检测与抄牌要依靠交警巡逻贴罚单完成，这种人工监管车辆的方法费时费力，而且覆盖面不广，容易漏检。深度学习以及神经网络的发展（尤其
是机器视觉技术的发展），为车辆违停检测提供的解决思路和方案。

[0063] 具体来说，在进行道路上车辆的违停检测时，可以获得大量的包含停放车辆的街景图像。对于车辆是否违停可以看作一个针对上述图像的二元分类问题。现有一些基于深
度神经网络的解决方案，其简单地通过卷积神经网络+Softmax分类器的网络结构来进行二
元分类，检测正确率不高，无法实际应用。

[0064] 本申请发明人发现，上述方案影响到检测率的部分原因在于所获得的用于分类的特征图在其图像空间中包含大量的低概率样本点，这是因为在包含有停放车辆的街景图像
中，可能多个图像对应同一街景，因此大量的包含有停放车辆的街景图像存在在其背景上
类似而停放车辆的细节上不同的情况，也就是说，总体上类似而在细节上有差异。而当将这
些街景图像作为图像集通过卷积神经网络时，在由通过卷积神经网络所获得的图像空间中
就会存在大量的低概率样本点，从而影响后续分类的准确性。

[0065] 针对上述技术问题，本申请的基本思路是通过包含停放车辆的街景图像和包含标记有违停车辆的所述街景图像作为训练用图像集来训练用于车辆违停检测的神经网络，以
最终训练完成的检测模型能够更好地提取违停车辆的特征，从而提高分类准确性。

[0066] 基于此，本申请提供了一种基于违停车辆标签的神经网络的训练方法，其包括：获取每个包含停放车辆的街景图像的第一集合和包含标记有违停车辆的所述街景图像的第
二集合；将所述第一集合的街景图像输入第一卷积神经网络和第一全连接层以获得第一特
征向量；将所述第二集合的街景图像输入第二卷积神经网络和第二全连接层以获得第二特
征向量，所述第二卷积神经网络与所述第一卷积神经网络具有相同的网络结构；计算所述
第一特征向量与所述第二特征向量的均方误差损失函数；将所述第一特征向量以Softmax
函数进行分类以获得Softmax损失函数；以及，基于所述均方误差损失函数和所述Softmax
损失函数的加权和更新所述第一卷积神经网络、第一全连接层、所述第二卷积神经网络和
第二全连接层的参数。

[0067] 具体来说，通过包含标记有违停车辆的街景图像作为参考图像，并通过相同结构的第二卷积神经网络映射到图像空间中，再通过第二全连接层获得第二特征向量，所述第
二特征向量可以提取出能够表示车辆违停的特征。进而，通过计算所述第一特征向量与所
述第二特征向量之间的均方误差损失函数并以此更新第一卷积神经网络，可以使得所述第
一特征向量能够更好地提取出用于识别车辆违停的特征。同时，也就是间接地减少了第一
特征图（第一特征图通过第一全连接层转化为所述第一特征向量）在其所在的图像空间内
的低概率样本点，从而提高了分类准确性；或者说，使得所述第一特征图在其所在的图像空
间内的低概率样本点分布在经过所述第一全连接层之后被一定程度上忽略，从而提高了分
类准确性。

[0068] 相应地，所述第一特征向量的目的是用于进行对车辆违停进行分类，而在第二集合的图像中包含违停车辆的标记，因此，需要在以所述第一特征向量通过Softmax分类器获
得Softmax损失函数之后，与均方差损失函数联立对所述第一卷积神经网络、第一全连接
层、所述第二卷积神经网络和第二全连接进行训练，从而提高对于车辆违停检测的准确率。

[0069] 相应地，根据本申请的另一方面，还提供一种车辆违停的检测方法，其，包括：获取包含停放车辆的街景图像；将所述街景图像输入根据如上所述的基于违停车辆标签的神经
网络的训练方法所训练的第一卷积神经网络，第一全连接层和Softmax函数，所述Softmax
函数的输出为表示所述停放车辆属于违停的第一概率和所述停放车辆不属于违停的第二
概率；以及，基于所述第一概率和所述第二概率确定所述停放车辆是否违停。

[0070] 图1图示了根据本申请实施例的基于违停车辆标签的神经网络的训练方法和车辆违停检测方法的应用场景图。

[0071] 如图1所示，在该应用场景中，在训练阶段，摄像头（例如，如图1中所示意的C）采集包含停放车辆和包含标记有违停车辆（例如，如图1中所示意的V）的街景图片；并将其作为
训练用图像集输入至用于车辆违停检测的神经网络的训练服务器中（例如，图1中所示意的
S）。在训练完成后，在检测阶段中，由摄像头所采集的包含有停放车辆的街景图像被输入至
用于车辆违停检测的服务器中，其中，在所述服务器上部署于训练完成的卷积神经网络模
型（例如，如图1所示意的S），以输出停放车辆是否违停的判定结果。

[0072] 在介绍了本申请的基本原理之后，下面将参考附图来具体介绍本申请的各种非限制性实施例。

[0073] 示例性方法

[0074] 图2图示了根据本申请实施例的基于违停车辆标签的神经网络的训练方法的流程图。

[0075] 如图2所示，根据本申请实施例的基于违停车辆标签的神经网络的训练方法，包括：S110，获取每个包含停放车辆的街景图像的第一集合和包含标记有违停车辆的所述街
景图像的第二集合；S120，将所述第一集合的街景图像输入第一卷积神经网络和第一全连
接层以获得第一特征向量；S130，将所述第二集合的街景图像输入第二卷积神经网络和第
二全连接层以获得第二特征向量，所述第二卷积神经网络与所述第一卷积神经网络具有相
同的网络结构；S140，计算所述第一特征向量与所述第二特征向量的均方误差损失函数；
S150，将所述第一特征向量以Softmax函数进行分类以获得Softmax损失函数；以及，S160，
基于所述均方误差损失函数和所述Softmax损失函数的加权和更新所述第一卷积神经网
络、第一全连接层、所述第二卷积神经网络和第二全连接层的参数。

[0076] 图3图示了根据本申请实施例的基于违停车辆标签的神经网络的训练方法的系统架构的示意图。在本申请实施例中，所述系统结构，包括：第一卷积神经网络（例如，如图3所
示意的CNN1）、第二卷积神经网络（例如，如图3所示意的CNN2）、第一全连接层（例如，如图3
所示意的Fcl1）、第二全连接层（例如，如图3所示意的Fcl2）Softmax函数（例如，如图3所示
意的S）、以及，均方差损失函数（例如，如图3所示意的Ml），其中，包含停放车辆的街景图像
的第一集合（例如，如图3所示意的IN0）被输入至所述第一卷积神经网络，所述第一卷积神
经网络用于对所述第一集合中的图像进行卷积处理，以生成第一特征图（例如，如图3所示
意的F1）；所述第一全连接层，用于将所述第一特征图转化的特征向量转化为用于分类的第
一特征向量（例如，如图3所示意的V1），其中，所述第一特征向量以Softmax函数进行分类以
获得Softmax损失函数；包含标记有违停车辆的所述街景图像的第二集合（例如，如图3所示
意的IN1）被输入至与所述第一卷积神经网络具有相同网络结构的所述第二卷积神经网络，
所述第二卷积神经网络用于对所述第二集合中的图像进行卷积处理，以生成第二特征图
（例如，如图3所示意的F2）；所述第二全连接层，用于将所述第二特征图转化的特征向量转
化为用于分类的第二特征向量（例如，如图3所示意的V2）。相应地，在获得所述第一特征图
和所述第二特征图后，计算所述第一特征向量与所述第二特征向量的均方误差损失函数。
相应地，基于所述均方差损失函数和所述Softmax损失函数的加权和更新所述第一卷积神
经网络、所述第一全连接层、所述第二卷积神经网络和所述第二全连接层。

[0077] 在步骤S110中，获取每个包含停放车辆的街景图像的第一集合和包含标记有违停车辆的所述街景图像的第二集合。也就是，在本申请实施例中，训练用图像数据集，包括两
类：包含停放车辆的街景图像集和包含标记有违停车辆的街景图像集。

[0078] 在步骤S120中，将所述第一集合的街景图像输入第一卷积神经网络和第一全连接层以获得第一特征向量。具体来说，该过程首先包括所述第一集合的街景图像被输入至所
述第一卷积神经网络，并经所述第一卷积神经网络的卷积处理，以生成第一特征图；接着，
所述第一全连接层对基于所述第一特征图转化的特征向量进行处理，以生成用于分类的第
一特征向量，其中，所述第一特征向量能够提取到违停车辆的特征。

[0079] 应可以理解，在包含有停放车辆的街景图像中，可能多个图像对应于同一街景。因此，大量的包含有停放车辆的街景图像存在在背景上类似而在停放车辆的细节上不同的情
况，也就是说，总体上类似而在细节上有差异，而当将这些街景图像作为图像集通过所述第
一卷积神经网络时，在由通过所述第一卷积神经网络所获得的所述第一特征图在其图像空
间中就会存在大量的低概率样本点。而因为这些低概率样本点的存在，导致所述第一特征
向量不能够很好地提取到表示车辆违停的特征。

[0080] 在步骤S130中，将所述第二集合的街景图像输入第二卷积神经网络和第二全连接层以获得第二特征向量，所述第二卷积神经网络与所述第一卷积神经网络具有相同的网络
结构。具体来说，该过程首先包括所述第二集合的街景图像被输入至所述第二卷积神经网
络，并经所述第二卷积神经网络的卷积处理，以生成第二特征图；接着，所述第二全连接层
对基于所述第二特征图转化的特征向量进行处理，以生成用于分类的第二特征向量。

[0081] 也就是，在本申请实施例中，通过以包含违停车辆的图像作为参考图像，并通过相同结构的卷积神经网络映射到图像空间中，再通过全连接层获得第二特征向量，所述第二
特征向量可以提取出能够表示车辆违停的特征。

[0082] 在本申请一个示例中，在包含标记有违停车辆的所述街景图像的第二集合中，所述违停车辆在每个所述街景图像中以候选框形式标记。相应地，将所述第二集合的街景图
像输入第二卷积神经网络和第二全连接层以获得第二特征向量包括：计算每个所述街景图
像中，所述候选框的中心相对于所述街景图像的位置坐标；以及，将所述位置坐标作为所述
街景图像的标签值，与所述街景图像一起输入所述第二卷积神经网络和所述第二全连接层
以获得所述第二特征向量。

[0083] 特别地，通过以候选框形式标记违停车辆，并以候选框的中心位置坐标作为标签值，可以在所获得的第二特征向量中提取出违停车辆相对于街景图像的空间位置特征，从
而良好地提取出能够表示车辆违停的特征。

[0084] 在本申请另一示例中，在包含标记有违停车辆的所述街景图像的第二集合中，所述违停车辆在每个所述街景图像中以标签信息形式标记，所述标签信息包括所述违停车辆
的违停描述。相应地，将所述第二集合的街景图像输入第二卷积神经网络和第二全连接层
以获得第二特征向量包括：将所述每个街景图像以及其对应的标签信息通过多模态特征向
量变换转换为混合特征向量；以及，将所述混合特征向量输入所述第二卷积神经网络和所
述第二全连接层以获得所述第二特征向量。

[0085] 特别地，通过以标签信息形式标记违停车辆，并将标签信息与街景图像一起转换为特征向量并输入所述第二卷积神经网络和所述第二全连接层，可以在所获得的所述第二
特征向量中提取出违停车辆整体的画像特征，从而良好地提取出能够表示车辆违停的特
征。

[0086] 在上述示例中，所述违停车辆的违停描述包括但不限于所述车辆的牌号、车型、颜色、违章地点、违章时间等。

[0087] 在步骤S140中，计算所述第一特征向量与所述第二特征向量的均方误差损失函数。相应地，通过计算所述第一特征向量与所述第二特征向量之间的均方误差损失函数并
以此更新第一卷积神经网络，可以使得所述第一特征向量也能够更好地提取出用于识别车
辆违停的特征，也就是间接地减少了所述第一特征图在其所在图像空间内的低概率样本
点，或者说，使得所述第一特征图在其所在的图像空间内的低概率样本点分布在经过所述
第一全连接层之后被一定程度上忽略，从而提高了分类准确性。

[0088] 在步骤S150中，将所述第一特征向量以Softmax函数进行分类以获得Softmax损失函数。这里，所述第一特征向量的目的是用于进行对车辆违停进行分类。

[0089] 在步骤S160中基于所述均方误差损失函数和所述Softmax损失函数的加权和更新所述第一卷积神经网络、第一全连接层、所述第二卷积神经网络和第二全连接层的参数。优
选地，在本申请实施例中，基于所述均方误差损失函数和所述Softmax损失函数的加权和更
新所述第一卷积神经网络、第一全连接层、所述第二卷积神经网络和第二全连接层的参数，
包括：基于所述均方误差损失函数和所述Softmax损失函数的加权和迭代地更新所述第一
卷积神经网络、第一全连接层、所述第二卷积神经网络和第二全连接层的参数，其中，在每
次迭代中，首先固定所述第一卷积神经网络和第一全连接层的参数并更新所述第二卷积神
经网络和第二全连接层的参数，再固定所述第二卷积神经网络和第二全连接层的参数并更
新所述第一卷积神经网络和第一全连接层的参数。

[0090] 相应地，通过在每次迭代中依次更新所述第二卷积神经网络和所述第二全连接层以及所述第一卷积神经网络和所述第一全连接层，可以避免同时更新所述第一卷积神经网
络、第一全连接层、所述第二卷积神经网络和所述第二全连接层导致参数过于发散，便于卷
积神经网络的参数收敛；

[0091] 另外，通过首先更新所述第二卷积神经网络和第二全连接层然后再更新所述第一卷积神经网络和第一全连接层，可以有助于以更充分提取的体现车辆违停的特征来更新所
述第一卷积神经网络和第一全连接层，从而提高检测精度。具体地，所述第二卷积神经网络
提取出的特征可以有助于识别用于判定车辆是否违停，比如车道线位置，马路位置，是否具
有停车位画线等。

[0092] 综上，基于本申请实施例的基于违停车辆标签的神经网络的训练方法被阐明，其通过包含停放车辆的街景图像和包含标记有违停车辆的所述街景图像作为训练用图像集
来训练用于车辆违停检测的神经网络，以最终训练完成的检测模型能够减少用于分类的特
征图在其图像空间内的低概率样本点的数目其能够更好地提取违停车辆的特征，从而提高
分类准确性。

[0093] 进一步地，根据本申请的另一方面，还提供一种车辆违停的检测方法。如图4所示，所述车辆违停的检测方法，包括：S210，获取包含停放车辆的街景图像；S220，将所述街景图
像输入根据如上所述的基于违停车辆标签的神经网络的训练方法所训练的第一卷积神经
网络，第一全连接层和Softmax函数，所述Softmax函数的输出为表示所述停放车辆属于违
停的第一概率和所述停放车辆不属于违停的第二概率；以及，S230，基于所述第一概率和所
述第二概率确定所述停放车辆是否违停。

[0094] 示例性装置

[0095] 图5图示了根据本申请实施例的基于违停车辆标签的神经网络的训练装置的框图示意图。

[0096] 如图5所示，根据本申请实施例的基于违停车辆标签的神经网络的训练装置500，包括：训练用图像集获取单元510，用于获取每个包含停放车辆的街景图像的第一集合和包
含标记有违停车辆的所述街景图像的第二集合；第一特征向量生成单元520，用于将所述训
练用图像集获取单元510获得的所述第一集合的街景图像输入第一卷积神经网络和第一全
连接层以获得第一特征向量；第二特征向量生成单元530，用于将所述训练用图像集获取单
元510获得的所述第二集合的街景图像输入第二卷积神经网络和第二全连接层以获得第二
特征图，所述第二卷积神经网络与所述第一卷积神经网络具有相同的网络结构；均方误差
损失函数计算单元540，用于计算所述第一特征向量生成单元520获得的所述第一特征向量
与所述第二特征向量生成单元530获得的所述第二特征向量的均方误差损失函数；Softmax
损失函数生成单元550，用于将所述第一特征图生成单元获得的所述第一特征向量以
Softmax函数进行分类以获得Softmax损失函数；以及，参数更新单元560，用于基于所述均
方误差损失函数计算单元540获得的所述均方误差损失函数和所述Softmax损失函数生成
单元550获得的所述Softmax损失函数的加权和更新所述第一卷积神经网络、第一全连接
层、第二卷积神经网络和第二全连接层的参数。

[0097] 在一个示例中，如图6所示，在上述基于违停车辆标签的神经网络的训练装置500中，所述第二特征向量生成单元530，进一步包括：候选框位置坐标计算子单元531，用于计
算每个所述街景图像中，所述候选框的中心相对于所述街景图像的位置坐标；以及，特征向
量计算子单元532，用于将所述位置坐标作为所述街景图像的标签值，与所述街景图像一起
输入所述第二卷积神经网络和所述第二全连接层以获得所述第二特征向量。

[0098] 在一个示例中，如图7所示，在上述基于违停车辆标签的神经网络的训练装置500中，所述第二特征向量生成单元530，进一步包括：混合特征向量生成子单元533，用于将所
述每个街景图像以及其对应的标签信息通过多模态特征向量变换转换为混合特征向量；以
及，特征向量生成子单元534，用于将所述混合特征向量输入所述第二卷积神经网络和所述
第二全连接层以获得所述第二特征向量

[0099] 在一个示例中，在上述基于违停车辆标签的神经网络的训练装置500中，所述违停车辆的违停描述包括所述车辆的牌号、车型、颜色、违章地点、违章时间。

[0100] 在一个示例中，在上述基于违停车辆标签的神经网络的训练装置中，所述参数更新单元560，进一步用于：基于所述均方误差损失函数和所述Softmax损失函数的加权和迭
代地更新所述第一卷积神经网络、第一全连接层、所述第二卷积神经网络和第二全连接层
的参数，其中，在每次迭代中，首先固定所述第一卷积神经网络和第一全连接层的参数并更
新所述第二卷积神经网络和第二全连接层的参数，再固定所述第二卷积神经网络和第二全
连接层的参数并更新所述第一卷积神经网络和第一全连接层的参数。

[0101] 根据本申请的又一方面，提供了一种车辆违停的检测装置。

[0102] 图8图示了根据本申请实施例的车辆违停的检测装置的框图。

[0103] 如图8所示，根据本申请实施例的所述违停车辆的检测装置800，包括：街景图像获取单元810，用于获取包含停放车辆的街景图像；分类单元820，用于将所述街景图像获取单
元810获得的所述街景图像输入至如上所述的基于违停车辆标签的神经网络的训练装置所
训练的第一卷积神经网络，第一全连接层和Softmax函数，所述Softmax函数的输出为表示
所述停放车辆属于违停的第一概率和所述停放车辆不属于违停的第二概率；以及，确定单
元830，用于基于所述分类单元820获得的所述第一概率和所述第二概率确定所述停放车辆
是否违停。

[0104] 这里，本领域技术人员可以理解，上述基于违停车辆标签的神经网络的训练装置500和所述车辆违停的检测装置800中的各个单元和模块的具体功能和操作已经在上面参
考图1到图4的基于违停车辆标签的神经网络的训练方法和车辆违停的检测方法的描述中
得到了详细介绍，并因此，将省略其重复描述。

[0105] 如上所述，根据本申请实施例的基于违停车辆标签的神经网络的训练装置500和所述车辆违停的检测装置800可以实现在各种终端设备中，例如用于车辆违停检测的服务
器等。在一个示例中，根据本申请实施例的基于违停车辆标签的神经网络的训练装置500
和/或所述车辆违停的检测装置800可以作为一个软件模块和/或硬件模块而集成到终端设
备中。例如，该基于违停车辆标签的神经网络的训练装置500和/或所述车辆违停的检测装
置800可以是该终端设备的操作系统中的一个软件模块，或者可以是针对于该终端设备所
开发的一个应用程序；当然，该基于违停车辆标签的神经网络的训练装置500和/或所述车
辆违停的检测装置800同样可以是该终端设备的众多硬件模块之一。

[0106] 替换地，在另一示例中，该基于违停车辆标签的神经网络的训练装置500和/或所述车辆违停的检测装置800与该终端设备也可以是分立的设备，并且该基于违停车辆标签
的神经网络的训练装置500和/或所述车辆违停的检测装置800可以通过有线和/或无线网
络连接到该终端设备，并且按照约定的数据格式来传输交互信息。

[0107] 示例性电子设备

[0108] 下面，参考图9来描述根据本申请实施例的电子设备。

[0109] 图9图示了根据本申请实施例的电子设备的框图。

[0110] 如图9所示，电子设备10包括一个或多个处理器11和存储器12。

[0111] 处理器11可以是中央处理单元（CPU）或者具有数据处理能力和/或指令执行能力的其他形式的处理单元，并且可以控制电子设备10中的其他组件以执行期望的功能。

[0112] 存储器12可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储
器例如可以包括随机存取存储器（RAM）和/或高速缓冲存储器（cache）等。所述非易失性存
储器例如可以包括只读存储器（ROM）、硬盘、闪存等。在所述计算机可读存储介质上可以存
储一个或多个计算机程序指令，处理器11可以运行所述程序指令，以实现上文所述的本申
请的各个实施例的基于违停车辆标签的神经网络的训练方法和车辆违停的检测方法以及/
或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如均方差损失函数值、
街景图像等各种内容。

[0113] 在一个示例中，电子设备10还可以包括：输入装置13和输出装置14，这些组件通过总线系统和/或其他形式的连接机构（未示出）互连。

[0114] 该输入装置13可以包括例如键盘、鼠标等等。

[0115] 该输出装置14可以向外部输出各种信息，包括车辆违停的检测结果等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等
等。

[0116] 当然，为了简化，图9中仅示出了该电子设备10中与本申请有关的组件中的一些，省略了诸如总线、输入/输出接口等等的组件。除此之外，根据具体应用情况，电子设备10还
可以包括任何其他适当的组件。

[0117] 示例性计算机程序产品和计算机可读存储介质

[0118] 除了上述方法和设备以外，本申请的实施例还可以是计算机程序产品，其包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述
“示例性方法”部分中描述的根据本申请各种实施例的基于违停车辆标签的神经网络的训
练方法和车辆违停的检测方法中的步骤。

[0119] 所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如
Java、C++等，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程
序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软
件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备
或服务器上执行。

[0120] 此外，本申请的实施例还可以是计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方
法”部分中描述的根据本申请各种实施例的基于违停车辆标签的神经网络的训练方法和车
辆违停的检测方法中的步骤。

[0121] 所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电
磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的
例子（非穷举的列表）包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储
器（RAM）、只读存储器（ROM）、可擦式可编程只读存储器（EPROM或闪存）、光纤、便携式紧凑盘
只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

[0122] 以上结合具体实施例描述了本申请的基本原理，但是，需要指出的是，在本申请中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本申请的
各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作
用，而非限制，上述细节并不限制本申请为必须采用上述具体的细节来实现。

[0123] 本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到
的，可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具
有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇
“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使
用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

[0124] 还需要指出的是，在本申请的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

[0125] 提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义
的一般原理可以应用于其他方面而不脱离本申请的范围。因此，本申请不意图被限制到在
此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

[0126] 为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技
术人员将认识到其某些变型、修改、改变、添加和子组合。

基于违停车辆标签的神经网络的训练方法和检测方法转让专利

申请号 : CN202011305044.7

文献号 : CN112115928B

文献日 : 2021-03-09

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 朱淑敏 , 王顺镇 , 沈瑶

申请人 : 城云科技(中国)有限公司

摘要 :

权利要求 :

说明书 :