基于神经网络的图像处理方法、装置和电子设备转让专利

申请号 : CN201610849620.1

文献号 : CN106548192B

文献日 : 2019-08-09

本发明实施例公开了一种基于神经网络的图像处理方法、装置和电子设备，其中，图像处理方法包括：获取待处理图像中的各样本的外观特征信息；根据各样本的外观特征信息分别确定第一中间阶段各样本属于预定类型中每一类的概率；根据每一类的各概率区间的概率取值范围对所述第一中间阶段各样本属于每一类的概率进行语义统计，以获得所有类的语义统计向量；将所述语义统计向量与所述每个样本的外观特征信息进行拼接；根据所述拼接后的每个样本的外观特征信息确定第二中间阶段各样本属于每一类的概率，其中的第二中间阶段各样本属于每一类的概率用于确定各样本最终属于每一类的概率。本发明实施例可以提高神经网络对图像数据解释的准确性。

1.一种基于神经网络的图像处理方法，其特征在于，包括：

获取待处理图像中的各样本的外观特征信息；

根据各样本的外观特征信息分别确定第一中间阶段各样本属于预定类别中每一类的概率；

根据每一类的各概率区间的概率取值范围对所述第一中间阶段各样本属于每一类的概率进行语义统计，以获得所有类的语义统计向量；

将所述语义统计向量与所述每个样本的外观特征信息进行拼接；

根据所述拼接后的每个样本的外观特征信息确定第二中间阶段各样本属于每一类的概率，其中的第二中间阶段各样本属于每一类的概率用于确定各样本最终属于每一类的概率。

2.根据权利要求1所述的方法，其特征在于，所述待处理图像中的各样本包括：待处理图像中的各像素或者待处理图像中的各检测框。

3.根据权利要求2所述的方法，其特征在于，所述获取待处理图像中的各样本的外观特征信息的步骤包括：利用VGG卷积神经网络层获取待处理图像中的各像素的外观特征信息；或者利用Faster-具有区域的卷积神经网络RCNN中的区域建议网络RPN层针对待处理图像产生多个检测框，并利用Faster-RCNN中的Fast-RCNN检测器网络层抽取出各检测框的外观特征信息。

4.根据权利要求3所述的方法，其特征在于，所述根据各样本的外观特征信息分别确定第一中间阶段各样本属于预定类别中每一类的概率的步骤包括：利用VGG卷积神经网络层中的卷积核为1×1的卷积层针对所述各像素的外观特征信息产生第一中间阶段各像素属于每一类的概率；或者利用Faster-RCNN中的Fast-RCNN检测器网络层针对其抽取出的各检测框的外观特征信息产生第一中间阶段各检测框属于每一类的概率。

5.根据权利要求1至4中任一权利要求所述的方法，其特征在于，所述每一类的各概率区间的概率取值范围是通过所述基于神经网络的图像处理方法学习获得的。

6.根据权利要求1至4中任一权利要求所述的方法，其特征在于，不同类具有的概率区间的数量相同，且所有类的概率区间的概率取值范围并未采用完全相同的概率取值范围。

7.根据权利要求5所述的方法，其特征在于，不同类具有的概率区间的数量相同，且所有类的概率区间的概率取值范围并未采用完全相同的概率取值范围。

8.根据权利要求1至4中任一权利要求所述的方法，其特征在于，同一类的相邻的两个概率区间的概率取值范围存在相交的子集。

9.根据权利要求5所述的方法，其特征在于，同一类的相邻的两个概率区间的概率取值范围存在相交的子集。

10.根据权利要求6所述的方法，其特征在于，同一类的相邻的两个概率区间的概率取值范围存在相交的子集。

11.根据权利要求7所述的方法，其特征在于，同一类的相邻的两个概率区间的概率取值范围存在相交的子集。

12.根据权利要求1至4中任一权利要求所述的方法，其特征在于，所述根据每一类的各概率区间的概率取值范围对所述第一中间阶段各样本属于预定类别中每一类的概率进行语义统计的步骤包括：针对第一中间阶段任意一个样本属于任意一类的概率而言，确定该样本属于该类的概率分别针对于该类的各概率区间的取值范围的权重值，且确定出的各权重值均为非负且非零的权重值；