一种基于模块化的流形排序的图像推荐方法转让专利
申请号 : CN201810578350.4
文献号 : CN108804650B
文献日 : 2021-07-02
发明人 : 简萌 , 贾婷 , 毋立芳
申请人 : 北京工业大学
摘要 :
权利要求 :
1.一种基于模块化流形排序的图像推荐方法,其特征在于,包括以下步骤:
1)、基于图片内容信息的图片相似性计算,利用计算的相似性构图将图片输入网络中提取图片特征;利用余弦相似性计算两张图片的相似性;利用计算的相似性构图;
2)、流形的模块化
第一,将每一张图片分别放在一个流形上,然后考虑每一个流形上的图片和它的邻居图片,合并到这个流形上计算模块度增量;模块度增量是将一个孤立的点放到一个模块上后,这个模块的变化;也就是就说将一张独立的图片放到一个流形上后,这个流形上的模块度会发生变化,这个变化的量即为模块度增量;找到这个独立的图片在不同的流形上的模块度增量的最大正值,将这张图片放到这个流形上,若没有正值则图片所属流形保持不变;
重复上述过程直到每一张图片所属的流形不再变化;第二,把每一张图片当成一个节点,将新的流形上的所有节点压缩成一个新的节点,所有流形节点之间的权重转化为新节点的环的权重,流形之间的边权重转化成新节点之间的边权重;重复第一步,直到整个图的模块度不再发生变化;这就将所有的图片分布到了不同的流形上;将每一个流形上的图片分别进行流形排序;
3)、流形排序算法
流形排序的算法采用拉普拉斯图映射方法,基于图像间的拓扑流形分布,利用其几何结构中隐含的局部信息相关性,传播已知的用户与部分图像的相关度,获取所有图像对相关用户的相关度估计;
4)、根据相关度估计生成推荐列表
根据每一个流形上计算得到的用户图像之间的相关度,得到全部的用户和图像之间的相关度;根据每一张图片和用户之间的相关度排序,生成推荐列表。
2.根据权利要求1所述的方法,其特征在于,步骤3)、流形排序算法具体如下:所有图片的集合X={x1,x2,…,xn},用户集合U={u1,u2,…,uc},对应的拓扑关系图为W={wij}n×n,图像的用户先验Y=[yij]n×c,其中yi,j表示图像i与用户j的先验相关度,无先验则对应位置为0;
在分析构造拓扑流形W={wij}n×n的基础上,利用先验Y=[yij]n×c,建立流形排序模型,估计信息相关度F=[fij]n×c,其中,fij表示通过流形传播的图像i与用户j的相关度,即用户j对图像i的感兴趣程度;根据流形平滑准则,依流形分布关系,建立流形学习模型如下:其中, 表示Frobenious范数,tr(*)是矩阵的迹,L是W={wij}n×n的拉普拉斯矩阵,β是平衡参数;其解析解表示为
* ‑1
F=((1‑β)I+βL) Y
*
这里,I为单位矩阵,F=[fij]n×c即为优化上式收敛所得的图像X={x1,x2,…,xn}与用户U={u1,u2,…,uc}中基于流形排序的相关度估计结果。
3.根据权利要求1所述的方法,其特征在于,步骤2)、流形的模块化具体如下:首先将每一张图片分别放在一个流形上,然后考虑每一个流形上的图片和它的邻居图片,即相似性高的图片,合并到这个流形上计算模块度增量;模块度增量是将一个孤立的点放到一个模块上后,这个模块的变化;也就是就说将一张独立的图片放到一个流形上后,这个流形上的模块度会发生变化,这个变化的量即为模块度增量;模块度增量按下式进行计算;
其中ki,in是一个流形上的图片中与图片xi有连接关系的边的权重之和;ki表示所有与图片xi有连接关系的边的权重之和;∑in表示一个流形上的图片的所有的边的权重之和;
∑tot表示一个流形上的图片与图片之间的边的权重之和,m表示所有的边的权重之和;
然后找到这个独立的图片在不同的流形上的模块度增量的最大正值,将这张图片放到这个流形上;即找到使得ΔQ最大的那张邻居图片,且满足maxΔQ>0,则将这张图片分配到使得ΔQ最大的那张邻居图片所在的流形上;若没有取到正值,则该图片依然在其原来的流形上;重复上述过程直到每一张图片所属的流形不再变化;第二,把每一张图片当成一个节点,将新的流形上的所有节点压缩成一个新的节点,所有流形节点之间的权重转化为新节点的环的权重,流形之间的边权重转化成新节点之间的边权重;重复第一步,直到整个图的模块度不再发生变化;这就将所有的图片分布到了不同的流形上;分别对每一个流形上的图片进行流形排序。
说明书 :
一种基于模块化的流形排序的图像推荐方法
技术领域
法来进行图片推荐的方法。
背景技术
了大量多媒体信息的产生,但信息的类型杂多,内容质量参差不齐,这导致社交平台海量的
数据中80%以上的信息是冗余或无用的,用户的需求直接面临着“信息过载”带来的巨大挑
战。另一方面社交媒体的核心是用户,对用户兴趣的研究十分重要,并且用户想从大量的多
媒体数据中获得喜欢的信息也是非常困难的。因此有必要挖掘用户感知的社交多媒体信息
间的隐含的关系。
息来源于用户亦服务于用户。伴随着社交网络(Facebook、Twitter、微博等)的盛行,社会化
网络引入了用户更多的社交行为数据,引入了社交网络成员之间的关系和交互行为信息。
社会化推荐通过引入这些信息能提升推荐系统的性能,更个性化的表达用户。
析各种结构。
信息沿流形传播的结果。对全局流形上的数据进行排序,该方法被广泛应用于推荐检索等
社交多媒体应用问题中。朱小飞通过研究相关性度量对高维稀疏查询数据处理的不足,提
出基于流形排序的查询推荐算法。该方法通过加强结构上具有代表性的查询,有效的避免
查询推荐的冗余性。Hoi等在流形学习的基础上引入主动学习,获取数据判别结构,用于图
像检索。Jian等结合用户的主动交互信息,提取图像库中图像的相关度,用于排列图像,实
现图像检索应用。可见流形学习策略能够有效的获取全局结构的判别结构,这一特性已被
应用于多种模式识别问题中,然而,考虑到流形学习中矩阵计算的负担,面对大数据的环
境,有必要研究可扩展的流形学习模式。采用局部流形子集学习的策略,可以降低面向大规
模数据的计算难度。
好,来给用户推荐图片。You Q等人提出了一种从用户发布的图像中推断用户属性的方法。
他们用卷积神经网络来提取图片特征,采用相似度来进一步传播图像之间的标签信息。这
也充分说明了图片的内容信息的重要性。将图片的内容信息和社交网络中的用户图片关系
相结合,可以提高推荐系统的推荐能力。
发明内容
相似性构图。
的点放到一个模块上后,这个模块的变化。也就是就说将一张独立的图片放到一个流形上
后,这个流形上的模块度会发生变化,这个变化的量即为模块度增量。找到这个独立的图片
在不同的流形上的模块度增量的最大正值,将这张图片放到这个流形上,若没有正值则图
片所属流形保持不变。重复上述过程直到每一张图片所属的流形不再变化。第二,把每一张
图片当成一个节点,将新的流形上的所有节点压缩成一个新的节点,所有流形节点之间的
权重转化为新节点的环的权重,流形之间的边权重转化成新节点之间的边权重。重复第一
步,直到整个图的模块度不再发生变化。这就将所有的图片分布到了不同的流形上。将每一
个流形上的图片分别进行流形排序。
对相关用户的相关度估计。
先验则对应位置为0。
用户j对图像i的感兴趣程度。根据流形平滑准则,依流形分布关系,建立流形学习模型如
下:
多个单独的子流形进行处理。也就是说,利用模块化的方法将所有图片分到多个子流形上,
单独对子流形进行学习。对于每一个子流形,结合已有的用户图片关系和图片之间的关系,
得到子流形上的图片与所有用户之间的关系,根据子流形上的关系用户图像相关性得到用
于图像推荐的全局流形中的用户图像相关性。采取局部流形的策略,降低面向大规模数据
的计算难度,实现基于流形排序的社交多媒体相关度计算。根据每一张图片和所有用户之
间的相关度排序,给每个用户生成推荐列表。
己的图片对网络进行微调。花瓣网上的图片分成34类,根据图片所属的类别给图片添加标
签,用这些有标签的图片对网络进行微调。然后将图片输入网络中提取图片特征。利用余弦
相似性计算两张图片的相似性;利用计算的相似性构造拓扑关系图。
的点放到一个模块上后,这个模块的变化。也就是就说将一张独立的图片放到一个流形上
后,这个流形上的模块度会发生变化,这个变化的量即为模块度增量。模块度增量按下式进
行计算。
和。∑tot表示一个流形上的图片与图片之间的边的权重之和,m表示所有的边的权重之和
配到使得ΔQ最大的那张邻居图片所在的流形上。若没有取到正值,则该图片依然在其原来
的流形上。重复上述过程直到每一张图片所属的流形不再变化。第二,把每一张图片当成一
个节点,将新的流形上的所有节点压缩成一个新的节点,所有流形节点之间的权重转化为
新节点的环的权重,流形之间的边权重转化成新节点之间的边权重。重复第一步,直到整个
图的模块度不再发生变化。这就将所有的图片分布到了不同的流形上。分别对每一个流形
上的图片进行流形排序。
扑流形上所有图像的相关度。用于相关信息的推荐。流形学习策略侧重于挖掘高维数据几
何流形关系中隐含的信息,强调获取全局判别结构的同事,学习局部几何关系中隐含的局
部相关性。
先验则对应位置为0。
用户j对图像i的感兴趣程度。根据流形平滑准则,依流形分布关系,建立流形学习模型如
下:
系。
每一张图片和所有用户之间的相关度排序,给用户推荐相关度最高的N张图片。
法都是采用离线的方法来验证推荐系统的好坏,得到每一个用户的推荐准确率。
附图说明
具体实施方式
上利用深度学习的方法提取爬取的图片的特征,首先利用自己的图片对网络进行微调。花
瓣网上的图片分成34类,根据图片所属的类别给图片添加标签,用这些有标签的图片对网
络进行微调。使得网络更适合这个数据集,提取的特征更准确。然后将实验所需的图片输入
网络中提取图片特征。利用余弦相似性计算两张图片的相似性;利用计算的相似性构造拓
扑关系图。
的点放到一个模块上后,这个模块的变化。也就是就说将一张独立的图片放到一个流形上
后,这个流形上的模块度会发生变化,这个变化的量即为模块度增量。模块度增量按下式进
行计算。
和。∑tot表示一个流形上的图片与图片之间的边的权重之和,m表示所有的边的权重之和
配到使得ΔQ最大的那张邻居图片所在的流形上。如果ΔQ<0,则该图片依然在自己所在的
流形上。重复上述过程直到每一张图片所属的流形不再变化。第二,把每一张图片当成一个
节点,将新的流形上的所有节点压缩成一个新的节点,所有流形节点之间的权重转化为新
节点的环的权重,流形之间的边权重转化成新节点之间的边权重。重复第一步,直到整个图
的模块度不再发生变化。这就将所有的图片分布到了不同的流形上。分别对每一个流形上
的图片进行流形排序。将不同的图片模块化的结果如图2所示。
扑流形上所有图像的相关度。用于相关信息的推荐。
先验则对应位置为0。
用户j对图像i的感兴趣程度。根据流形平滑准则,依流形分布关系,建立流形学习模型如
下:
相关度估计结果。
用户的相关度越大,这张图片越容易被用户喜欢。所以根据每一张图片和所有用户之间的
相关度降序排序,给用户推荐相关度最高的N张图片。
评价很难实现,很难找到真实的用户来评价系统。所以一般的推荐方法都是采用离线的方
法来验证推荐系统的好坏,得到每一个用户的推荐准确率。所以将所有图片的用户的80%
做训练,剩下的20%为测试集,用来评估系统的性能。