一种基于非局部网络和局部网络的短视频推荐方法转让专利
申请号 : CN202110034609.0
文献号 : CN112765401B
文献日 : 2021-11-12
发明人 : 顾盼
申请人 : 中国计量大学
摘要 :
权利要求 :
1.一种基于非局部网络和局部网络的短视频推荐方法,其特征在于:采用注意力机制方法,得到用户的短视频多行为交互序列中“肯定”行为对每个“点击”行为的影响;对于一个用户的交互行为序列 可以表示为X=[x1,…,xl],其中 是短视频的封面图特征向量,d是特征向量长度;其中,“肯定”行为序列表示为*
且X是X的子集;“点击”行为序列即是X=[x1,…,xl];用非局部网络方法中的注意力机制方法,得到“肯定”行为序列对“点击”行为的影响;序列中最后点击短视频(last‑click)用于代表用户的当前点击兴趣,所以注意力机制是基于最后点击短视频的:其中, 和 是模型需要训练的参数;xt表示点击序列中的最后一个短视频向量表征, 代表当前“点击”序列中“肯定”序列的第i个短视频向量表征;σ为sigmoid函数; 代表当前“点击”序列中“肯定”序列的第i个短视频向量表征 的重要程度;是以xt为结尾的“点击”行为序列中“肯定”行为对当前点击兴趣的影响;
采用基于非局部注意力机制的循环神经网络生成用户兴趣表征;基于非局部注意力机制的循环神经网络中的门控制循环神经网络单元(unit)对信息的选择不仅考虑序列中当前短视频和上一个门控制循环神经网络单元的状态,还考虑“肯定”行为的影响,如下:其中,zt为更新门(update gate),rt是重置门(reset gate),这两个门控向量决定了哪些信息能作为门控循环单元的输出; 是当前记忆内容;xt是当前层的节点输入,是“肯定”行为的影响; 和
分别是控制更新门zt和重置门rt的参数; 和 是控制前记忆内容 的参数;⊙是元素级别的矩阵相乘,σ是sigmoid函数;门控制循环神经网络最后一层的隐藏状态ht的输出就是用户兴趣表征v;
根据用户兴趣表征,预测用户对目标短视频xnew的点击率:其中,v是用户兴趣表征,xnew是目标短视频;是用户对目标短视频的点击率预测值;
和 是转移矩阵, 是偏置向量,b2是偏置标量;σ是sigmoid激活函数;
根据模型特性,设计损失函数;通过用户对目标短视频的点击率预测值 计算预测值和真实值y之间的误差,进而使用误差来更新模型参数;采用交叉熵损失函数来指导模型参数的更新过程:
其中,y∈{0,1}是真实值,代表用户是否点击了目标短视频;σ是sigmoid函数;采用Adam优化器更新模型参数。
说明书 :
一种基于非局部网络和局部网络的短视频推荐方法
技术领域
背景技术
短视频平台的短视频数量增长得非常快。这使得对有效短视频推荐系统的需求非常迫切,
有效的短视频推荐系统可以提升用户体验和用户黏性,从而给平台带来巨大的商业价值。
述文本质量较低、时长较短且用户在一段时间内的交互序列较长。因此,短视频推荐是一个
更具有挑战性的任务。且在短视频推荐问题中用户的交互行为有很多种,包括“点击”、“喜
欢”和“收藏”。不同的交互行为代表不同的喜欢程度。“点击”表示该用户愿意观看该短视
频,但情感不强烈;而“喜欢”和“收藏”都属于用户强烈和确切的情感,“喜欢”表示用户喜欢
该短视频,愿意再观看同类的视频,“收藏”表示用户不仅当前喜欢该短视频,还希望以后能
再看到该视频。被用户“喜欢”和“收藏”的短视频也同时被用户“点击”。可以将“喜欢”和“收
藏”归纳为同一类型的行为,即“肯定”行为。此时,用户的交互序列具有两种交互行为,一种
是“点击”行为,另一种是“肯定”行为。针对于短视频推荐问题,有研究者提出了一些方法。
例如,Chen等人利用分层的注意力机制去计算物品和类目这两种级别的重要性,得到更准
确的预测结果。Li等人使用基于图的循环神经网络去建模,最后得到用户的偏好。
于“肯定”行为序列的用户兴趣表征对提升推荐效果的作用很不明显。原因有两个:用户的
“肯定”行为序列时间相隔较长,序列性不强;将“肯定”行为序列单独建模,忽视了“肯定”行
为对后续“点击”行为的作用。本方法创新性地提出多行为交互序列建模方法,将“点击”和
“肯定”这两种行为序列放到一个行为序列中处理,生成用户兴趣向量表征。其中,“点击”行
为是有序列性的,而“肯定”行为因为行为事件间隔较大,是无序的。本方法将非局部网络
(non‑local network)和局部网络(local network)结合起来,其中,非局部网络采用的是
注意力机制(attention mechanism),学习过去一段时间内“肯定”行为对“点击”行为的影
响;局部网络采用的是门控循环神经网络(GRU),学习“点击”行为的序列性。本方法是一种
基于非局部注意力机制的循环神经网络,改进原始神经网络的结构,使得网络可以同时学
习到“肯定”行为对“点击”行为的影响以及“点击”行为对“点击”行为的影响。
发明内容
互行为代表不同的喜欢程度。“点击”表示该用户愿意观看该短视频,但情感不强烈;而“喜
欢”和“收藏”都属于用户的强烈和确切的情感,“喜欢”表示用户喜欢该短视频,愿意再观看
同类的视频,“收藏”表示用户不仅当前喜欢该短视频,还希望以后能再看到该视频。被用户
“喜欢”和“收藏”的短视频也同时被用户“点击”。可以将“喜欢”和“收藏”归纳为同一类型的
行为,即“肯定”行为。此时,用户的交互序列具有两种交互行为,一种是“点击”行为,另一种
是“肯定”行为。然而,原始的序列推荐方法都是针对一种交互行为的序列。为此,本发明采
用以下技术方案:
是短视频的封面图特征向量,d是特征向量长度。其中,“肯定”行为序列表示为
*
且X是X的子集。“点击”行为序列即是X=[x1,…,xl]。用非局部网络方法
中的注意力机制方法,得到“肯定”行为序列对“点击”行为的影响。通常,序列中最后点击短
视频(last‑click)用于代表用户的当前点击兴趣,所以注意力机制是基于最后点击短视频
的:
视频向量表征。σ为sigmoid函数。 代表当前“点击”序列中“肯定”序列的第i个短视频
向量表征 的重要程度。是以xt为结尾的“点击”行为序列中“肯定”行为对当前点击兴趣
的影响。
和 分别是控制更新门zt和重置门rt的参数。
和 是控制前记忆内容 的参数。⊙ 是元素级别的矩阵相乘,σ是
sigmoid函数。
虑序列中当前短视频和上一个门控制循环神经网络单元的状态,还考虑“肯定”行为的影
响,如下:
“肯定”行为的影响。 和
分别是控制更新门zt和重置门rt的参数。 和 是控制前记忆
内容 的参数。⊙是元素级别的矩阵相乘,σ是sigmoid函数。门控制循环神经网络最后一层
的隐藏状态ht的输出就是用户兴趣表征v。
sigmoid激活函数。
指导模型参数的更新过程:
其中,“点击”行为是有序列性的,而“肯定”行为因为行为事件间隔较大,是无序的。
内所有“肯定”行为对“点击”行为的影响;局部网络采用的是门控循环神经网络(GRU),学习
近段时间内“点击”行为对“点击”行为的影响。
“点击”行为的影响。
附图说明
具体实施方式
在本发明核心指导思想下做出的非本质改进和调整,仍然属于本发明的保护范围。
的交互行为有很多种,包括“点击”、“喜欢”和“收藏”。不同的交互行为代表不同的喜欢程
度。“点击”表示该用户愿意观看该短视频,但情感不强烈;而“喜欢”和“收藏”都属于用户强
烈和确切的情感,“喜欢”表示用户喜欢该短视频,愿意再观看同类的视频,“收藏”表示用户
不仅当前喜欢该短视频,还希望以后能再看到该视频。被用户“喜欢”和“收藏”的短视频也
同时被用户“点击”。因此,短视频点击率预测问题可以表示成:输入用户多行为交互序列
以及目标短视频xnew,来预测用户对目标短视频xnew的点击率。
户的“点击”、“喜欢”和“收藏”行为。在本方法中,将“喜欢”和“收藏”归纳为同一类型的行
为,即“肯定”行为。此时,用户的交互序列具有两种交互行为,一种是“点击”行为,另一种是
“肯定”行为。原始的序列推荐方法都是针对一种交互行为的序列。Li等人分别将序列推荐
方法应用于“点击”行为序列和“肯定”行为序列,最后实验表明,基于“肯定”行为序列的用
户兴趣表征对提升推荐效果的作用很不明显。原因有两个:用户的“肯定”行为序列时间相
隔较长,序列性不强;将“肯定”行为序列单独建模,忽视了“肯定”行为对后续“点击”行为的
作用。本方法创新性地提出多行为交互序列建模方法,将“点击”和“肯定”这两种行为序列
放到一个行为序列中处理,生成用户兴趣向量表征。其中,“点击”行为是有序列性的,而“肯
定”行为因为行为事件间隔较大,是无序的。本方法将非局部网络(non‑local network)和
局部网络(local network)结合起来,其中,非局部网络采用的是注意力机制(attention
mechanism),学习过去一段时间内“肯定”行为对“点击”行为的影响;局部网络采用的是门
控循环神经网络(GRU),学习“点击”行为的序列性。本方法同时是一种基于非局部注意力机
制的循环神经网络,改进了原始神经网络的结构,使得网络可以同时学习到“肯定”行为对
“点击”行为的影响以及“点击”行为对“点击”行为的影响。
于非局部注意力机制的循环神经网络生成用户兴趣表征。第三部分是根据用户兴趣表征,
预测用户对目标短视频的点击率。
是短视频的封面图特征向量,d是特征向量长度。其中,“肯定”行为序列表示为
*
且X 是X的子集。“点击”行为序列即是X=[x1,…,xl]。用非局部网络方法
中的注意力机制方法,得到“肯定”行为序列对“点击”行为的影响。通常,序列中最后点击短
视频(last‑click)用于代表用户的当前点击兴趣,所以注意力机制是基于最后点击短视频
的:
视频向量表征。σ为sigmoid函数。 代表当前“点击”序列中“肯定”序列的第i个短视频
向量表征 的重要程度。 是以xt为结尾的“点击”行为序列中“肯定”行为对当前点击兴趣
的影响。
和 分别是控制更新门zt和重置门rt的参数。
和 是控制前记忆内容 的参数。⊙是元素级别的矩阵相乘,σ是
sigmoid函数。
虑当前序列中短视频和上一个门控制循环神经网络单元的状态,还考虑“肯定”行为的影
响,如下:
“肯定”行为的影响。 和
分别是控制更新门zt和重置门rt的参数。 和 是控制前记忆
内容 的参数。⊙是元素级别的矩阵相乘,σ是sigmoid函数。门控制循环神经网络最后一层
的隐藏状态ht的输出就是用户兴趣表征v。
sigmoid激活函数。
数来指导模型参数的更新过程:
一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,
本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护
范围之内。