一种基于参数迁移学习的无监督图像识别方法转让专利

申请号 : CN201811489723.7

文献号 : CN109583506B

文献日 : 2020-06-09

一种基于参数迁移学习的无监督图像识别方法，它属于图像识别技术领域。本发明解决了传统无监督图像识别方法存在的需要的无标签样本数量大，以及大量的无标签样本导致的训练时间长的问题。本发明直接对识别模型的参数进行迁移学习，只需要辅助领域的有标签样本和少量应用领域的无标签样本，即可对识别模型进行训练，本发明的方法克服了传统无监督图像识别方法的需要无标签样本数量大的问题，降低了对标签样本的依赖，解决了无监督识别问题，提高了模型的学习效率，更适用于数据规模较大的应用场景。本发明可以应用于图像识别技术领域。

1.一种基于参数迁移学习的无监督图像识别方法，其特征在于，该方法包括以下步骤：步骤一、从辅助领域采集含有类别标签的图像，构成辅助域图像集Xs；从应用领域采集无类别标签的图像，构成应用域图像集Xt；

步骤二、构建两个结构相同的卷积神经网络，将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络，其中：辅助域网络记为Ns，应用域网络记为Nt；

步骤三、利用辅助域图像集Xs训练辅助域网络Ns，辅助域网络Ns的所有层的学习率lr均设置为非零值；

使用交叉熵e来度量预测误差：

e＝-yrs×lgyps

其中，yrs为待测试图像的真实类别，yps为辅助域网络Ns的预测输出；

直至预测误差不再减小时停止训练，得到训练好的辅助域网络Ns；

步骤四、依次将辅助域图像集Xs和应用域图像集Xt输入到训练好的辅助域网络Ns中，分别得到两个图像集在辅助域网络Ns每一层的输出特征集合和其中：k＝1,

2,…,n，n为辅助域网络Ns的总层数，为辅助域图像集Xs在辅助域网络Ns每一层的输出特征集合，为应用域图像集Xt在辅助域网络Ns每一层的输出特征集合；

步骤五、利用最大均值差异方法度量辅助域图像集Xs和应用域图像集Xt在辅助域网络Ns的每一层输出特征的相似度dsim；并筛选出最低的相似度对应的层，记录最低的相似度对应层的序号lsim；

步骤六、将训练好的辅助域网络Ns中所有层的参数对应地复制到应用域网络Nt中后，将应用域网络Nt的第lsim层的学习率设为非零值、除第lsim层外的其他所有层的学习率均设为零值；

利用应用域图像集Xt训练应用域网络Nt，训练过程中分别提取出辅助域网络Ns和应用域网络Nt的第lsim层的参数矩阵，并对提取出的参数矩阵进行PCA降维，且训练时保持辅助域网络Ns第lsim层的降维后参数矩阵与应用域网络Nt第lsim层的降维后参数矩阵的距离最小；直至应用域网络Nt的输出信息熵不再减小时停止训练，得到训练好的应用域网络Nt；

步骤七、利用训练好的应用域网络Nt对应用领域的图像进行识别，得到识别结果。

2.根据权利要求1所述的一种基于参数迁移学习的无监督图像识别方法，其特征在于，所述步骤一的具体过程为：从辅助领域采集含有类别标签的图像，构成辅助域图像集Xs；从应用领域采集无类别标签的图像，构成应用域图像集Xt；其中：应用域图像集Xt中图像样本数量为辅助域图像集Xs中图像样本数量的十分之一；

将辅助域图像集Xs与应用域图像集Xt中的所有图像缩放到相同的尺寸。

3.根据权利要求1所述的一种基于参数迁移学习的无监督图像识别方法，其特征在于，所述步骤二的具体过程为：构建两个结构相同的卷积神经网络，将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络，其中：辅助域网络记为Ns，应用域网络记为Nt；

每个卷积神经网络包括五层卷积层和三层全连接层，其中：全连接层的位于卷积层之后；

在全连接层之后为图像分类器，图像分类器共有C个分支，其中：C代表能够识别的图像类别总数；且图像分类器第c个分支的输出yc表示为：其中：pc(x)为输入图像x在第c个分支上的输出概率，c＝1,2，…，C。

4.根据权利要求1所述的一种基于参数迁移学习的无监督图像识别方法，其特征在于，所述步骤五的具体过程为：利用最大均值差异方法度量辅助域图像集Xs和应用域图像集Xt在辅助域网络Ns的每一层输出特征的相似度dsim：其中：ms和mt分别为辅助域图像集和应用域图像集中图像样本总数，k(xi,xj)为高斯核函数；xi和xj分别为第i个图像和第j个图像的像素矩阵；

并筛选出最低的相似度对应的层，记录最低的相似度对应的层的序号lsim。

5.根据权利要求1所述的一种基于参数迁移学习的无监督图像识别方法，其特征在于，所述步骤六的具体过程为：将训练好的辅助域网络Ns中所有层的参数对应地复制到应用域网络Nt中后，将应用域网络Nt的第lsim层的学习率设为非零值、除第lsim层外的其他所有层的学习率均设为零值；

利用应用域图像集Xt训练应用域网络Nt，训练过程中分别提取出辅助域网络Ns的第lsim层的参数矩阵Ws和应用域网络Nt的第lsim层的参数矩阵Wt，对辅助域网络Ns的第lsim层的参数矩阵Ws进行PCA降维得到降维后的参数矩阵Ws′，对应用域网络Nt的第lsim层的参数矩阵Wt进行PCA降维得到降维后的参数矩阵Wt′；

训练过程中，利用欧式距离度量参数矩阵Ws′和参数矩阵Wt′之间的差异，使参数矩阵Ws′和参数矩阵Wt′之间的距离始终保持最小，即始终保持最小，其中：代表2范数；

当应用域网络Nt的输出信息熵不再减小时停止训练，得到训练好的应用域网络Nt；应用域网络Nt的输出信息熵的表达式为：e1＝-ypt×lgypt

其中：e1代表应用域网络Nt的输出信息熵，ypt代表应用域网络Nt的预测输出。

6.一种基于参数迁移学习的无监督图像识别方法，其特征在于，该方法包括以下步骤：步骤一、从辅助领域采集含有类别标签的图像，构成辅助域图像集Xs；从应用领域采集无类别标签的图像，构成应用域图像集Xt；

步骤三、利用辅助域图像集Xs训练辅助域网络Ns，辅助域网络Ns的所有层的学习率lr均设置为非零值；

使用交叉熵e来度量预测误差：

e＝-yrs×lgyps

其中，yrs为待测试图像的真实类别，yps为辅助域网络Ns的预测输出；

直至预测误差不再减小时停止训练，得到训练好的辅助域网络Ns；

步骤四、依次将辅助域图像集Xs和应用域图像集Xt输入到训练好的辅助域网络Ns中，分别得到两个图像集在辅助域网络Ns每一层的输出特征集合和其中：k＝1,2,…,n，n为辅助域网络Ns的总层数，为辅助域图像集Xs在辅助域网络Ns每一层的输出特征集合，为应用域图像集Xt在辅助域网络Ns每一层的输出特征集合；

步骤五、利用最大均值差异方法度量辅助域图像集Xs和应用域图像集Xt在辅助域网络Ns的每一层输出特征的相似度dsim，设置相似度阈值δ，筛选出相似度低于相似度阈值δ的所有层，并将筛选出的所有层的序号记录下来；

步骤六、将训练好的辅助域网络Ns中所有层的参数对应地复制到应用域网络Nt中后，将步骤五筛选出的应用域网络Nt中的所有层的学习率设为非零值、应用域网络Nt中的其他层的学习率均设为零值；

利用应用域图像集Xt训练应用域网络Nt，训练过程中分别提取出辅助域网络Ns和应用域网络Nt中低于相似度阈值δ的所有层的参数矩阵，对提取出的每组参数矩阵进行PCA降维，得到降维后的参数矩阵；训练过程中，利用欧式距离度量每组降维后的参数矩阵的差异，且训练时始终保持各组降维后参数矩阵之间的距离之和最小；

直至应用域网络Nt的输出信息熵不再减小时停止训练，得到训练好的应用域网络Nt；

步骤七、利用训练好的应用域网络Nt对应用领域的图像进行识别，得到识别结果。

7.根据权利要求6所述的一种基于参数迁移学习的无监督图像识别方法，其特征在于，所述步骤一的具体过程为：从辅助领域采集含有类别标签的图像，构成辅助域图像集Xs；从应用领域采集无类别标签的图像，构成应用域图像集Xt；其中：应用域图像集Xt中图像样本数量为辅助域图像集Xs中图像样本数量的十分之一；

将辅助域图像集Xs与应用域图像集Xt中的所有图像缩放到相同的尺寸。

8.根据权利要求6所述的一种基于参数迁移学习的无监督图像识别方法，其特征在于，所述步骤二的具体过程为：构建两个结构相同的卷积神经网络，将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络，其中：辅助域网络记为Ns，应用域网络记为Nt；

每个卷积神经网络包括五层卷积层和三层全连接层，其中：全连接层的位于卷积层之后；

在全连接层之后为图像分类器，图像分离器共有C个分支，其中：C代表能够识别的图像类别总数；且图像分类器第c个分支的输出yc表示为：其中：pc(x)为输入图像x在第c个分支上的输出概率，c＝1,2，…，C。

9.根据权利要求6所述的一种基于参数迁移学习的无监督图像识别方法，其特征在于，所述步骤五的具体过程为：利用最大均值差异方法度量辅助域图像集Xs和应用域图像集Xt在辅助域网络Ns的每一层输出特征的相似度dsim：其中：ms和mt分别为辅助域图像集和应用域图像集中图像样本总数，k(xi,xj)为高斯核函数；xi和xj分别为第i个图像和第j个图像的像素矩阵；

设置相似度阈值δ，筛选出相似度低于相似度阈值δ的所有层，并将筛选出的所有层的序号记录下来。

10.根据权利要求6所述的一种基于参数迁移学习的无监督图像识别方法，其特征在于，所述步骤六的具体过程为：将训练好的辅助域网络Ns中所有层的参数对应地复制到应用域网络Nt中后，将步骤五筛选出的应用域网络Nt中的所有层的学习率设为非零值、应用域网络Nt中的其他层的学习率均设为零值；

利用应用域图像集Xt训练应用域网络Nt，训练过程中分别提取出辅助域网络Ns和应用域网络Nt中低于相似度阈值δ的所有层的参数矩阵，对提取出的每组参数矩阵进行PCA降维，得到降维后的参数矩阵；训练过程中，利用欧式距离度量每组降维后参数矩阵的差异，且训练时始终保持各组降维后参数矩阵之间的距离之和最小，即始终保持最小，其中：l为低于相似度阈值的层的组数，k为低于相似度阈值的第k组层；

当应用域网络Nt的输出信息熵不再减小时停止训练，得到训练好的应用域网络Nt；应用域网络Nt的输出信息熵的表达式为：e1＝-ypt×lgypt

其中：e1代表应用域网络Nt的输出信息熵，ypt代表应用域网络Nt的预测输出。

一种基于参数迁移学习的无监督图像识别方法

技术领域

[0001] 本发明属于图像识别技术领域，具体涉及一种无监督图像识别方法。

背景技术

[0002] 图像识别，是一种从静态图像或动态视频中检测出感兴趣目标的技术。有效的图像识别方法是实现目标跟踪、场景解析、环境感知等智能识别任务的前提和基础。在实际生活中，图像识别技术有十分广泛的应用，如自动驾驶领域的行人/车辆检测技术、安防领域的人脸识别技术等，都是以图像识别为基础而实现的。

[0003] 目前的图像识别技术大多是基于机器学习理论设计实现的，主要方法是从应用场景中采集含有类别标签的图像样本，对识别模型进行训练，使模型从样本中学习到有用的特征，并能够依据这些特征进行识别。但是，当应用领域无法采集到足够的标签样本时，基于机器学习的图像识别方法将无法进行训练。这是无监督图像识别所面临的主要问题。目前的主要解决方案是利用迁移学习，使用含有大量标签样本的辅助领域和只含有无标签样本的应用领域同时训练识别模型，将模型从辅助领域学习到的知识迁移到应用领域，以提高模型的识别效果。然而，这一方法要求应用领域能够提供的无标签样本的数量较大，且模型的训练时间与样本数量直接相关，大量的无标签样本导致训练时间较长。

发明内容

[0004] 本发明的目的是为解决传统无监督图像识别方法存在的需要的无标签样本数量大，以及大量的无标签样本导致的训练时间长的问题。

[0005] 本发明为解决上述技术问题采取的技术方案是：

[0006] 本发明的一个方案，一种基于参数迁移学习的无监督图像识别方法，该方法包括以下步骤：

[0007] 步骤一、从辅助领域采集含有类别标签的图像，构成辅助域图像集Xs；从应用领域采集无类别标签的图像，构成应用域图像集Xt；

[0008] 步骤二、构建两个结构相同的卷积神经网络，将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络，其中：辅助域网络记为Ns，应用域网络记为Nt；

[0009] 步骤三、利用辅助域图像集Xs训练辅助域网络Ns，辅助域网络Ns的所有层的学习率lr均设置为非零值；

[0010] 使用交叉熵e来度量预测误差：

[0011] e＝-yrs×lg yps

[0012] 其中，yrs为待测试图像的真实类别，yps为辅助域网络Ns的预测输出；

[0013] 直至预测误差不再减小时停止训练，得到训练好的辅助域网络Ns；

[0014] 步骤四、依次将辅助域图像集Xs和应用域图像集Xt输入到训练好的辅助域网络Ns中，分别得到两个图像集在辅助域网络Ns每一层的输出特征集合和其中：k＝1,2,…,n，n为辅助域网络Ns的总层数，为辅助域图像集Xs在辅助域网络Ns每一层的输出特征集合，为应用域图像集Xt在辅助域网络Ns每一层的输出特征集合；

[0015] 步骤五、利用最大均值差异方法度量辅助域图像集Xs和应用域图像集Xt在辅助域网络Ns的每一层输出特征的相似度dsim；并筛选出最低的相似度对应的层，记录最低的相似度对应层的序号lsim；

[0016] 步骤六、将训练好的辅助域网络Ns中所有层的参数对应地复制到应用域网络Nt中后，将应用域网络Nt的第lsim层的学习率设为非零值、除第lsim层外的其他所有层的学习率均设为零值；

[0017] 利用应用域图像集Xt训练应用域网络Nt，训练过程中分别提取出辅助域网络Ns和应用域网络Nt的第lsim层的参数矩阵，并对提取出的参数矩阵进行PCA降维，且训练时保持辅助域网络Ns第lsim层的降维后参数矩阵与应用域网络Nt第lsim层的降维后参数矩阵的距离最小；直至应用域网络Nt的输出信息熵不再减小时停止训练，得到训练好的应用域网络Nt；

[0018] 步骤七、利用训练好的应用域网络Nt对应用领域的图像进行识别，得到识别结果。

[0019] 本发明的另一个方案，步骤一、从辅助领域采集含有类别标签的图像，构成辅助域图像集Xs；从应用领域采集无类别标签的图像，构成应用域图像集Xt；

[0020] 步骤二、构建两个结构相同的卷积神经网络，将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络，其中：辅助域网络记为Ns，应用域网络记为Nt；

[0021] 步骤三、利用辅助域图像集Xs训练辅助域网络Ns，辅助域网络Ns的所有层的学习率lr均设置为非零值；(在本设计中lr＝0.001)，训练目标是使Ns的预测误差最小；

[0022] 使用交叉熵e来度量预测误差：

[0023] e＝-yrs×lg yps

[0024] 其中，yrs为待测试图像的真实类别，yps为辅助域网络Ns的预测输出；

[0025] 直至预测误差不再减小时停止训练，得到训练好的辅助域网络Ns；

[0026] 步骤四、依次将辅助域图像集Xs和应用域图像集Xt输入到训练好的辅助域网络Ns中，分别得到两个图像集在辅助域网络Ns每一层的输出特征集合和其中：k＝1,2,…,n，n为辅助域网络Ns的总层数，为辅助域图像集Xs在辅助域网络Ns每一层的输出特征集合，为应用域图像集Xt在辅助域网络Ns每一层的输出特征集合；

[0027] 步骤五、利用最大均值差异方法度量辅助域图像集Xs和应用域图像集Xt在辅助域网络Ns的每一层输出特征的相似度dsim，设置相似度阈值δ，筛选出相似度低于相似度阈值δ的所有层，并将筛选出的所有层的序号记录下来；

[0028] 步骤六、将训练好的辅助域网络Ns中所有层的参数对应地复制到应用域网络Nt中后，将步骤五筛选出的应用域网络Nt中的所有层的学习率设为非零值、应用域网络Nt中的其他层的学习率均设为零值；

[0029] 利用应用域图像集Xt训练应用域网络Nt，训练过程中分别提取出辅助域网络Ns和应用域网络Nt中低于相似度阈值δ的所有层的参数矩阵，对提取出的每组参数矩阵进行PCA降维，得到降维后的参数矩阵；训练过程中，利用欧式距离度量每组降维后的参数矩阵的差异，且训练时始终保持各组降维后参数矩阵之间的距离之和最小；

[0030] 直至应用域网络Nt的输出信息熵不再减小时停止训练，得到训练好的应用域网络Nt；

[0031] 步骤七、利用训练好的应用域网络Nt对应用领域的图像进行识别，得到识别结果。

[0032] 本发明的有益效果是：本发明提出了一种基于参数迁移学习的无监督图像识别方法，本发明直接对识别模型的参数进行迁移学习，只需要辅助领域的有标签样本和少量应用领域的无标签样本，即可对识别模型进行训练，本发明的方法克服了传统无监督图像识别方法的需要无标签样本数量大的问题，降低了对标签样本的依赖，解决了无监督识别问题，而且本发明方法的训练时间可以减少60％以上，提高了模型的学习效率，更适用于数据规模较大的应用场景。

附图说明

[0033] 图1是本发明的一种基于参数迁移学习的无监督图像识别方法的流程框图；

[0034] 图2是本发明所使用的卷积神经网络的结构图。

具体实施方式

[0035] 具体实施方式一：如图1所示，本实施方式所述的一种基于参数迁移学习的无监督图像识别方法，该方法包括以下步骤：

[0036] 步骤一、从辅助领域采集含有类别标签的图像，构成辅助域图像集Xs；从应用领域采集无类别标签的图像，构成应用域图像集Xt；所述应用领域是指本发明方法可以应用到的各个领域，所述辅助领域是指样本内容与所要应用到的领域相似，且包含大量标签的领域；

[0037] 步骤二、构建两个结构相同的卷积神经网络，将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络，其中：辅助域网络记为Ns，应用域网络记为Nt；

[0038] 步骤三、利用辅助域图像集Xs训练辅助域网络Ns，辅助域网络Ns的所有层的学习率lr均设置为非零值；(在本设计中lr＝0.001)，训练目标是使Ns的预测误差最小；

[0039] 使用交叉熵e来度量预测误差：

[0040] e＝-yrs×lg yps

[0041] 其中，yrs为待测试图像的真实类别，yps为辅助域网络Ns的预测输出；

[0042] 直至预测误差不再减小时停止训练，得到训练好的辅助域网络Ns；

[0043] 步骤四、依次将辅助域图像集Xs和应用域图像集Xt输入到训练好的辅助域网络Ns中，分别得到两个图像集在辅助域网络Ns每一层的输出特征集合和其中：k＝1,2,…,n，n为辅助域网络Ns的总层数，为辅助域图像集Xs在辅助域网络Ns每一层的输出特征集合，为应用域图像集Xt在辅助域网络Ns每一层的输出特征集合；

[0044] 步骤五、利用最大均值差异方法度量辅助域图像集Xs和应用域图像集Xt在辅助域网络Ns的每一层输出特征的相似度dsim；并筛选出最低的相似度对应的层，记录最低的相似度对应层的序号lsim；

[0045] 步骤六、将训练好的辅助域网络Ns中所有层的参数对应地复制到应用域网络Nt中后，将应用域网络Nt的第lsim层的学习率设为非零值、除第lsim层外的其他所有层的学习率均设为零值；

[0046] 利用应用域图像集Xt训练应用域网络Nt，训练过程中分别提取出辅助域网络Ns和应用域网络Nt的第lsim层的参数矩阵，并对提取出的参数矩阵进行PCA(Principal Component Analysis，PCA)降维，且训练时保持辅助域网络Ns第lsim层的降维后参数矩阵与应用域网络Nt第lsim层的降维后参数矩阵的距离最小；直至应用域网络Nt的输出信息熵不再减小时停止训练，得到训练好的应用域网络Nt；

[0047] 步骤七、利用训练好的应用域网络Nt对应用领域的图像进行识别，得到识别结果。

[0048] 具体实施方式二：本实施方式与具体实施方式一不同的是：所述步骤一的具体过程为：

[0049] 从辅助领域采集含有类别标签的图像，构成辅助域图像集Xs；从应用领域采集无类别标签的图像，构成应用域图像集Xt；其中：应用域图像集Xt中图像样本数量为辅助域图像集Xs中图像样本数量的十分之一；

[0050] 将辅助域图像集Xs与应用域图像集Xt中的所有图像缩放到相同的尺寸。

[0051] 具体实施方式三：本实施方式与具体实施方式一不同的是：所述步骤二的具体过程为：

[0052] 构建两个结构相同的卷积神经网络，将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络，其中：辅助域网络记为Ns，应用域网络记为Nt；

[0053] 如图2所示，每个卷积神经网络包括五层卷积层conv1～conv5和三层全连接层fc1～fc3，其中：全连接层的位于卷积层之后；

[0054] 在全连接层之后为图像分类器，图像分类器共有C个分支，其中：C代表能够识别的图像类别总数；且图像分类器第c个分支的输出yc表示为：

[0055]

[0056] 其中：pc(x)为输入图像x在第c个分支上的输出概率，c＝1,2，…，C。

[0057] 具体实施方式四：本实施方式与具体实施方式一不同的是：所述步骤五的具体过程为：利用最大均值差异方法度量辅助域图像集Xs和应用域图像集Xt在辅助域网络Ns的每一层输出特征的相似度dsim：

[0058]

[0059] 其中：ms和mt分别为辅助域图像集和应用域图像集中图像样本总数，k(xi,xj)为高斯核函数；xi和xj分别为第i个图像和第j个图像的像素矩阵；

[0060] 并筛选出最低的相似度对应的层，记录最低的相似度对应的层的序号lsim。

[0061] 具体实施方式五：本实施方式与具体实施方式一不同的是：所述步骤六的具体过程为：

[0062] 将训练好的辅助域网络Ns中所有层的参数对应地复制到应用域网络Nt中后，将应用域网络Nt的第lsim层的学习率设为非零值、除第lsim层外的其他所有层的学习率均设为零值；

[0063] 利用应用域图像集Xt训练应用域网络Nt，训练过程中分别提取出辅助域网络Ns的第lsim层的参数矩阵Ws和应用域网络Nt的第lsim层的参数矩阵Wt，对辅助域网络Ns的第lsim层的参数矩阵Ws进行PCA降维得到降维后的参数矩阵Ws′，对应用域网络Nt的第lsim层的参数矩阵Wt进行PCA降维得到降维后的参数矩阵Wt′；

[0064] 训练过程中，利用欧式距离度量参数矩阵Ws′和参数矩阵Wt′之间的差异，使参数矩阵Ws′和参数矩阵Wt′之间的距离始终保持最小，即始终保持最小，其中：代表2范数；

[0065] 当应用域网络Nt的输出信息熵不再减小时停止训练，得到训练好的应用域网络Nt；应用域网络Nt的输出信息熵的表达式为：

[0066] e1＝-ypt×lg ypt

[0067] 其中：e1代表应用域网络Nt的输出信息熵，ypt代表应用域网络Nt的预测输出。

[0068] 优选地，具体实施方式一可以用实施方式六的操作代替，以获得更好的效果：

[0069] 具体实施方式六：本实施方式所述的一种基于参数迁移学习的无监督图像识别方法，该方法包括以下步骤：

[0070] 步骤一、从辅助领域采集含有类别标签的图像，构成辅助域图像集Xs；从应用领域采集无类别标签的图像，构成应用域图像集Xt；

[0071] 步骤二、构建两个结构相同的卷积神经网络，将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络，其中：辅助域网络记为Ns，应用域网络记为Nt；

[0072] 步骤三、利用辅助域图像集Xs训练辅助域网络Ns，辅助域网络Ns的所有层的学习率lr均设置为非零值；(在本设计中lr＝0.001)，训练目标是使Ns的预测误差最小；

[0073] 使用交叉熵e来度量预测误差：

[0074] e＝-yrs×lg yps

[0075] 其中，yrs为待测试图像的真实类别，yps为辅助域网络Ns的预测输出；

[0076] 直至预测误差不再减小时停止训练，得到训练好的辅助域网络Ns；

[0077] 步骤四、依次将辅助域图像集Xs和应用域图像集Xt输入到训练好的辅助域网络Ns中，分别得到两个图像集在辅助域网络Ns每一层的输出特征集合和其中：k＝1,2,…,n，n为辅助域网络Ns的总层数，为辅助域图像集Xs在辅助域网络Ns每一层的输出特征集合，为应用域图像集Xt在辅助域网络Ns每一层的输出特征集合；

[0078] 步骤五、利用最大均值差异方法度量辅助域图像集Xs和应用域图像集Xt在辅助域网络Ns的每一层输出特征的相似度dsim，设置相似度阈值δ，筛选出相似度低于相似度阈值δ的所有层，并将筛选出的所有层的序号记录下来；

[0079] 步骤六、将训练好的辅助域网络Ns中所有层的参数对应地复制到应用域网络Nt中后，将步骤五筛选出的应用域网络Nt中的所有层的学习率设为非零值、应用域网络Nt中的其他层的学习率均设为零值；

[0080] 利用应用域图像集Xt训练应用域网络Nt，训练过程中分别提取出辅助域网络Ns和应用域网络Nt中低于相似度阈值δ的所有层的参数矩阵(提取出的层是成组的，即每组层中的一个对应于辅助域网络Ns的层，另一个对应于应用域网络Nt的层)，对提取出的每组参数矩阵进行PCA降维，得到降维后的参数矩阵；训练过程中，利用欧式距离度量每组降维后的参数矩阵的差异，且训练时始终保持各组降维后参数矩阵之间的距离之和最小；

[0081] 直至应用域网络Nt的输出信息熵不再减小时停止训练，得到训练好的应用域网络Nt；

[0082] 步骤七、利用训练好的应用域网络Nt对应用领域的图像进行识别，得到识别结果。

[0083] 具体实施方式七：本实施方式与具体实施方式六不同的是：所述步骤一的具体过程为：

[0084] 从辅助领域采集含有类别标签的图像，构成辅助域图像集Xs；从应用领域采集无类别标签的图像，构成应用域图像集Xt；其中：应用域图像集Xt中图像样本数量为辅助域图像集Xs中图像样本数量的十分之一；

[0085] 将辅助域图像集Xs与应用域图像集Xt中的所有图像缩放到相同的尺寸。

[0086] 具体实施方式八：本实施方式与具体实施方式六不同的是：所述步骤二的具体过程为：

[0087] 构建两个结构相同的卷积神经网络，将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络，其中：辅助域网络记为Ns，应用域网络记为Nt；

[0088] 如图2所示，每个卷积神经网络包括五层卷积层conv1～conv5和三层全连接层fc1～fc3，其中：全连接层的位于卷积层之后；

[0089] 在全连接层之后为图像分类器，图像分离器共有C个分支，其中：C代表能够识别的图像类别总数；且图像分类器第c个分支的输出yc表示为：

[0090]

[0091] 其中：pc(x)为输入图像x在第c个分支上的输出概率，c＝1,2，…，C。

[0092] 具体实施方式九：本实施方式与具体实施方式六不同的是：所述步骤五的具体过程为：利用最大均值差异方法度量辅助域图像集Xs和应用域图像集Xt在辅助域网络Ns的每一层输出特征的相似度dsim：

[0093]

[0094] 其中：ms和mt分别为辅助域图像集和应用域图像集中图像样本总数，k(xi,xj)为高斯核函数；xi和xj分别为第i个图像和第j个图像的像素矩阵；

[0095] 设置相似度阈值δ，筛选出相似度低于相似度阈值δ的所有层，并将筛选出的所有层的序号记录下来。

[0096] 具体实施方式十：本实施方式与具体实施方式六不同的是：所述步骤六的具体过程为：

[0097] 将训练好的辅助域网络Ns中所有层的参数对应地复制到应用域网络Nt中后，将步骤五筛选出的应用域网络Nt中的所有层的学习率设为非零值、应用域网络Nt中的其他层的学习率均设为零值；

[0098] 利用应用域图像集Xt训练应用域网络Nt，训练过程中分别提取出辅助域网络Ns和应用域网络Nt中低于相似度阈值δ的所有层的参数矩阵，对提取出的每组参数矩阵进行PCA降维，得到降维后的参数矩阵；训练过程中，利用欧式距离度量每组降维后参数矩阵的差异，且训练时始终保持各组降维后参数矩阵之间的距离之和最小，即始终保持最小，其中：l为低于相似度阈值的层的组数，k为低于相似度阈值的第k组层；

[0099] 当应用域网络Nt的输出信息熵不再减小时停止训练，得到训练好的应用域网络Nt；应用域网络Nt的输出信息熵的表达式为：

[0100] e1＝-ypt×lg ypt

[0101] 其中：e1代表应用域网络Nt的输出信息熵，ypt代表应用域网络Nt的预测输出。

[0102] 本发明的上述算例仅为详细地说明本发明的计算模型和计算流程，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动，这里无法对所有的实施方式予以穷举，凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

一种基于参数迁移学习的无监督图像识别方法转让专利

申请号 : CN201811489723.7

文献号 : CN109583506B

文献日 : 2020-06-09

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 杨春玲 , 陈宇 , 张岩 , 李雨泽 , 朱敏

申请人 : 哈尔滨工业大学

摘要 :

权利要求 :

说明书 :