推荐模型训练方法、推荐方法和相关设备转让专利
申请号 : CN202110683173.8
文献号 : CN113254785B
文献日 : 2021-10-08
发明人 : 张黄斌 , 赵冲 , 王丹磊
申请人 : 腾讯科技(深圳)有限公司
摘要 :
权利要求 :
1.一种推荐模型训练方法,其特征在于,所述推荐模型包括第一神经网络结构和第二神经网络结构;其中,所述方法包括:获取历史推荐样本信息、历史推荐对象的历史兴趣信息、以及所述历史推荐对象针对所述历史推荐样本信息的样本标签;
通过所述第一神经网络结构对所述历史推荐样本信息和所述历史兴趣信息进行特征信息的提取和融合,以确定向所述历史推荐对象推荐所述历史推荐样本信息的样本推荐概率,以便根据所述样本推荐概率和所述样本标签确定主损失函数的值,其中所述第二神经网络结构的网络层次少于第一神经网络结构;
通过所述第二神经网络结构对所述历史推荐样本信息和所述历史兴趣信息进行内容相似度确定处理,以确定所述历史推荐对象与所述历史推荐样本信息的相关性,以根据所述相关性和所述样本标签确定辅助损失函数的值;
根据所述主损失函数的值和所述辅助损失函数的值将所述推荐模型训练为目标推荐模型。
2.根据权利要求1所述方法,其特征在于,所述推荐模型还包括嵌入层;其中,所述方法还包括:
通过所述嵌入层对所述历史推荐样本信息和所述历史兴趣信息分别进行向量化处理,以生成历史推荐样本隐向量和历史兴趣隐向量;
其中,通过所述第一神经网络结构对所述历史推荐样本信息和所述历史兴趣信息进行特征信息的提取和融合,以确定向所述历史推荐对象推荐所述历史推荐样本信息的样本推荐概率,包括:
通过所述第一神经网络结构对所述历史推荐样本隐向量和所述历史兴趣隐向量进行特征信息的提取和融合,以确定向所述历史推荐对象推荐所述历史推荐样本信息的样本推荐概率;
其中,通过所述第二神经网络结构对所述历史推荐样本信息和所述历史兴趣信息进行内容相似度确定处理,包括:
通过所述第二神经网络结构对所述历史推荐样本隐向量和所述历史兴趣隐向量进行相似度确定处理,以确定所述历史推荐对象与所述历史推荐样本信息的相关性。
3.根据权利要求2所述方法,其特征在于,通过所述第二神经网络结构对所述历史推荐样本隐向量和所述历史兴趣隐向量进行相似度确定处理,以确定所述历史推荐对象与所述历史推荐样本信息的相关性,包括:对所述历史推荐样本隐向量进行浅层特征提取处理,以生成历史推荐样本浅层特征;
对所述历史兴趣隐向量进行浅层特征提取处理,以生成历史兴趣浅层特征;
对所述历史推荐样本浅层特征和所述历史兴趣浅层特征进行激活处理,以获得历史推荐样本浅层激活特征和历史兴趣浅层激活特征;
根据所述历史推荐样本浅层激活特征和所述历史兴趣浅层激活特征,确定所述历史推荐对象与所述历史推荐样本信息的相关性。
4.根据权利要求3所述方法,其特征在于,确定所述历史推荐对象与所述历史推荐样本信息的相关性,包括:
将所述历史推荐样本浅层激活特征和所述历史兴趣浅层激活特征进行内积求取处理,以确定激活特征内积值;
将所述激活特征内积值进行求和处理,以获得所述历史推荐对象与所述历史推荐样本信息的相关性指标,其中所述相关性指标用来衡量所述历史推荐对象与所述历史推荐样本信息的相关性。
5.根据权利要求3所述方法,其特征在于,所述历史推荐对象包括至少一个历史兴趣信息,所述历史兴趣浅层特征包括至少一个历史兴趣浅层特征,所述至少一个历史兴趣浅层特征与所述至少一个历史兴趣信息一一对应;其中,确定所述历史推荐对象与所述历史推荐样本信息的相关性,包括:
对所述历史兴趣浅层特征进行卷积处理,以获得至少一个历史兴趣浅层卷积特征;
确定各个历史兴趣浅层卷积特征与所述历史推荐样本浅层特征之间的相似度,以生成至少一个兴趣相似度特征;
对各个兴趣相似度特征进行融合分类处理,以确定各个历史兴趣浅层卷积特征与所述历史推荐样本浅层特征的相关度;
根据各个历史兴趣浅层卷积特征与所述历史推荐样本浅层特征的相关度对各个历史兴趣浅层卷积特征进行加和池化处理,以获得所述历史推荐对象的历史兴趣特征;
根据所述历史推荐对象的历史兴趣特征和所述历史推荐样本浅层特征,获得所述历史推荐对象与所述历史推荐样本信息的相关性指标,其中所述相关性指标用来衡量所述历史推荐对象与所述历史推荐样本信息的相关性。
6.根据权利要求3所述方法,其特征在于,对所述历史推荐样本浅层特征进行激活处理,以获得历史推荐样本浅层激活特征,包括:对所述历史推荐样本浅层特征进行非线性激活处理,以获得非线性激活特征;
对所述历史推荐样本浅层特征进行归一化激活处理,以获得归一化激活特征;
通过所述归一化激活特征对所述非线性激活特征进行门限控制处理,以生成所述历史推荐样本浅层特征。
7.根据权利要求2所述方法,其特征在于,通过所述第二神经网络结构对所述历史推荐样本隐向量和所述历史兴趣隐向量进行相似度确定处理,以确定所述历史推荐对象与所述历史推荐样本信息的相关性,包括:获取所述历史推荐对象的历史画像信息;
通过所述嵌入层对所述历史画像信息进行处理,以获得历史画像特征隐向量;
通过所述第二神经网络结构对所述历史推荐样本隐向量、所述历史兴趣隐向量和所述历史画像特征隐向量进行相似度确定处理,以确定所述历史推荐对象与所述历史推荐样本信息的相关性。
8.根据权利要求2所述方法,其特征在于,通过所述第二神经网络结构对所述历史推荐样本隐向量和所述历史兴趣隐向量进行相似度确定处理,以确定所述历史推荐对象与所述历史推荐样本信息的相关性,包括:获取所述历史推荐对象点击所述历史推荐样本信息的历史上下文信息;
通过所述嵌入层对所述历史上下文信息进行处理,以获得历史上下文特征隐向量;
通过所述第二神经网络结构对所述历史推荐样本隐向量、所述历史兴趣隐向量和所述历史上下文特征隐向量进行相似度确定处理,以确定所述历史推荐对象与所述历史推荐样本信息的相关性。
9.根据权利要求2所述方法,其特征在于,通过所述第一神经网络结构对所述历史推荐样本隐向量和所述历史兴趣隐向量进行特征信息的提取和融合,以确定向所述历史推荐对象推荐所述历史推荐样本信息的样本推荐概率,包括:确定所述历史兴趣隐向量相对于所述历史推荐样本隐向量的激活权重;
通过所述激活权重对所述历史兴趣隐向量进行加权处理,以获得加权历史兴趣隐向量;
对所述加权历史兴趣隐向量和所述历史推荐样本隐向量进行拼接、拉平处理,以确定融合特征向量;
对所述融合特征向量进行多次全连接激活处理,以确定向所述历史推荐对象推荐所述历史推荐样本信息的样本推荐概率。
10.根据权利要求9所述方法,其特征在于,对所述加权历史兴趣隐向量和所述历史推荐样本隐向量进行拼接、拉平处理,以确定融合特征向量,包括:获取所述历史推荐对象的历史画像信息;
通过所述嵌入层对所述历史画像信息进行处理,以获得历史画像特征隐向量;
对所述加权历史兴趣隐向量、所述历史推荐样本隐向量、以及所述历史画像特征隐向量进行拼接、拉平处理,以确定所述融合特征向量。
11.根据权利要求9所述方法,其特征在于,对所述加权历史兴趣隐向量和所述历史推荐样本隐向量进行拼接、拉平处理,以确定融合特征向量,包括:获取所述历史推荐对象点击所述历史推荐样本信息的历史上下文信息;
通过所述嵌入层对所述历史上下文信息进行处理,以获得历史上下文特征隐向量;
对所述加权历史兴趣隐向量、所述历史推荐样本隐向量、以及所述历史上下文特征隐向量进行拼接、拉平处理,以确定所述融合特征向量。
12.一种推荐方法,其特征在于,包括:获取待推荐内容信息、待推荐对象的兴趣信息;
通过目标推荐模型的第一神经网络结构对所述待推荐内容信息和所述待推荐对象的兴趣信息进行特征信息的提取和融合,以确定向所述待推荐对象推荐所述待推荐内容信息的概率,其中所述目标推荐模型是通过权利要求1‑11任一项所述的推荐模型训练方法训练获得的;
根据所述向所述待推荐对象推荐所述待推荐内容信息的概率向所述待推荐对象推荐所述待推荐内容信息。
13.一种推荐模型训练装置,其特征在于,所述推荐模型包括第一神经网络结构和第二神经网络结构,包括:
样本标签获取模块,用于获取历史推荐样本信息、历史推荐对象的历史兴趣信息、以及所述历史推荐对象针对所述历史推荐样本信息的样本标签;
主损失函数值获取模块,用于通过所述第一神经网络结构对所述历史推荐样本信息和所述历史兴趣信息进行特征信息的提取和融合,以确定向所述历史推荐对象推荐所述历史推荐样本信息的样本推荐概率,以便根据所述样本推荐概率和所述样本标签确定主损失函数的值;
辅助损失函数值获取模块,用于通过所述第二神经网络结构对所述历史推荐样本信息和所述历史兴趣信息进行相似度确定处理,以确定所述历史推荐对象与所述历史推荐样本信息的相关性,以根据所述相关性和所述样本标签确定辅助损失函数的值;
反向训练模块,用于根据所述主损失函数的值和所述辅助损失函数的值将所述推荐模型训练为目标推荐模型。
14.根据权利要求13所述装置,其特征在于,所述推荐模型还包括嵌入层;其中,推荐模型训练装置还包括:
隐向量确定模块,用于通过所述嵌入层对所述历史推荐样本信息和所述历史兴趣信息分别进行向量化处理,以生成历史推荐样本隐向量和历史兴趣隐向量;
主损失函数值获取模块,还用于通过所述第一神经网络结构对所述历史推荐样本隐向量和所述历史兴趣隐向量进行特征信息的提取和融合,以确定向所述历史推荐对象推荐所述历史推荐样本信息的样本推荐概率;
辅助损失函数值获取模块,还用于通过所述第二神经网络结构对所述历史推荐样本隐向量和所述历史兴趣隐向量进行相似度确定处理,以确定所述历史推荐对象与所述历史推荐样本信息的相关性。
15.根据权利要求14所述装置,其特征在于,所述辅助损失函数值模块包括:生成历史推荐样本浅层特征生成子模块,用于对所述历史推荐样本隐向量进行浅层特征提取处理,以生成历史推荐样本浅层特征;
历史兴趣浅层特征生成子模块,用于对历史兴趣隐向量进行浅层特征提取处理,以生成历史兴趣浅层特征;
激活子模块,用于对历史推荐样本浅层特征和历史兴趣浅层特征进行激活处理,以获得历史推荐样本浅层激活特征和历史兴趣浅层激活特征;
相关性确定子模块,用于根据历史推荐样本浅层激活特征和历史兴趣浅层激活特征,确定历史推荐对象与历史推荐样本信息的相关性。
16.根据权利要求15所述装置,其特征在于,所述相关性确定子模块包括:激活特征内积值确定单元,用于将历史推荐样本浅层激活特征和历史兴趣浅层激活特征进行内积求取处理,以确定激活特征内积值;
求和单元,用于将激活特征内积值进行求和处理,以获得历史推荐对象与历史推荐样本信息的相关性指标,其中相关性指标用来衡量历史推荐对象与历史推荐样本信息的相关性。
17.根据权利要求15所述装置,其特征在于,所述历史推荐对象包括至少一个历史兴趣信息,历史兴趣浅层特征包括至少一个历史兴趣浅层特征,至少一个历史兴趣浅层特征与至少一个历史兴趣信息一一对应;其中,所述相关性确定子模块包括:历史兴趣浅层卷积特征确定单元,用于为对历史兴趣浅层特征进行卷积处理,以获得至少一个历史兴趣浅层卷积特征;
兴趣相似度特征确定单元,用于确定各个历史兴趣浅层卷积特征与历史推荐样本浅层特征之间的相似度,以生成至少一个兴趣相似度特征;
分类单元,用于对各个兴趣相似度特征进行融合分类处理,以确定各个历史兴趣浅层卷积特征与历史推荐样本浅层特征的相关度;
历史兴趣特征确定单元,用于根据各个历史兴趣浅层卷积特征与历史推荐样本浅层特征的相关度对各个历史兴趣浅层卷积特征进行加和池化处理,以获得历史推荐对象的历史兴趣特征;
相关性确定单元,用于根据历史推荐对象的历史兴趣特征和历史推荐样本浅层特征,获得历史推荐对象与历史推荐样本信息的相关性指标,其中相关性指标用来衡量历史推荐对象与历史推荐样本信息的相关性。
18.根据权利要求15所述装置,其特征在于,所述激活子模块包括:非线性激活特征获取单元,用于对历史推荐样本浅层特征进行非线性激活处理,以获得非线性激活特征;
归一化激活特征获取单元,用于对历史推荐样本浅层特征进行归一化激活处理,以获得归一化激活特征;
历史推荐样本浅层特征获取单元,用于通过归一化激活特征对非线性激活特征进行门限控制处理,以生成历史推荐样本浅层特征。
19.根据权利要求14所述装置,其特征在于,所述辅助损失函数值获取模块包括:历史画像信息获取子模块,用于获取历史推荐对象的历史画像信息;历史画像特征隐向量获取子模块用于通过嵌入层对历史画像信息进行处理,以获得历史画像特征隐向量;
相似度确定处理子模块,用于通过第二神经网络结构对历史推荐样本隐向量、历史兴趣隐向量和历史画像特征隐向量进行相似度确定处理,以确定历史推荐对象与历史推荐样本信息的相关性。
20.根据权利要求14所述装置,其特征在于,所述辅助损失函数值获取模块包括:历史上下文信息确定子模块,用于获取历史推荐对象点击历史推荐样本信息的历史上下文信息;
历史上下文特征隐向量确定子模块,用于通过嵌入层对历史上下文信息进行处理,以获得历史上下文特征隐向量;
相关性确定子模块,用于通过第二神经网络结构对历史推荐样本隐向量、历史兴趣隐向量和历史上下文特征隐向量进行相似度确定处理,以确定历史推荐对象与历史推荐样本信息的相关性。
21.根据权利要求14所述装置,其特征在于,所述主损失函数值获取模块包括:激活权重确定子模块,用于确定历史兴趣隐向量相对于历史推荐样本隐向量的激活权重;
加权历史兴趣隐向量确定子模块,用于通过激活权重对历史兴趣隐向量进行加权处理,以获得加权历史兴趣隐向量;
融合特征向量确定子模块,用于对加权历史兴趣隐向量和历史推荐样本隐向量进行拼接、拉平处理,以确定融合特征向量;
样本推荐概率确定子模块,用于对融合特征向量进行多次全连接激活处理,以确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率。
22.根据权利要求21所述装置,其特征在于,所述融合特征向量确定子模块包括:历史画像信息获取单元,用于获取历史推荐对象的历史画像信息;
历史画像特征隐向量单元,用于通过嵌入层对历史画像信息进行处理,以获得历史画像特征隐向量;
获取融合特征向量第一单元,用于对加权历史兴趣隐向量、历史推荐样本隐向量、以及历史画像特征隐向量进行拼接、拉平处理,以确定融合特征向量。
23.根据权利要求21所述装置,其特征在于,所述融合特征向量确定子模块包括:历史上下文信息获取单元,用于获取历史推荐对象点击历史推荐样本信息的历史上下文信息;
历史上下文特征隐向量获取单元,用于通过嵌入层对历史上下文信息进行处理,以获得历史上下文特征隐向量;
融合特征向量获取第二单元,用于对加权历史兴趣隐向量、历史推荐样本隐向量、以及历史上下文特征隐向量进行拼接、拉平处理,以确定融合特征向量。
24.一种推荐装置,其特征在于,包括:待推荐信息获取模块,用于获取待推荐内容信息、待推荐对象的兴趣信息;
概率确定模块,用于通过目标推荐模型的第一神经网络结构对待推荐内容信息和待推荐对象的兴趣信息进行特征信息的提取和融合,以确定向待推荐对象推荐待推荐内容信息的概率;
推荐模块,用于根据向待推荐对象推荐待推荐内容信息的概率向待推荐对象推荐待推荐内容信息。
25.一种电子设备,其特征在于,包括:存储器;以及
耦合到所述存储器的处理器,所述处理器被用于基于存储在所述存储器中的指令,执行如权利要求1‑11任一项所述的推荐模型训练方法或者如权利要求12所述的推荐方法。
26.一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如权利要求1‑11任一项所述的推荐模型训练方法或者如权利要求12所述的推荐方法。
说明书 :
推荐模型训练方法、推荐方法和相关设备
技术领域
背景技术
的信息,成为信息推荐的一种主要形式。
发明内容
的值对推荐模型训练进行指导,从而提高推荐模型预测推荐概率的准确性。
签;通过所述第一神经网络结构对所述历史推荐样本信息和所述历史兴趣信息进行特征信
息的提取和融合,以确定向所述历史推荐对象推荐所述历史推荐样本信息的样本推荐概
率,以便根据所述样本推荐概率和所述样本标签确定主损失函数的值;通过所述第二神经
网络结构对所述历史推荐样本信息和所述历史兴趣信息进行内容相似度确定处理,以确定
所述历史推荐对象与所述历史推荐样本信息的相关性,以根据所述相关性和所述样本标签
确定辅助损失函数的值;根据所述主损失函数的值和所述辅助损失函数的值将所述推荐模
型训练为目标推荐模型。
兴趣信息进行特征信息的提取和融合,以确定向所述待推荐对象推荐所述待推荐内容信息
的概率,其中所述目标推荐模型是通过上述推荐模型训练方法训练获得的;根据所述向所
述待推荐对象推荐所述待推荐内容信息的概率向所述待推荐对象推荐所述待推荐内容信
息。
通过第一神经网络结构对历史推荐样本信息和所述历史兴趣信息进行特征信息的提取和
融合,以确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率,以便根据样本推荐
概率和样本标签确定主损失函数的值;辅助损失函数值获取模块用于通过第二神经网络结
构对历史推荐样本信息和所述历史兴趣信息进行内容相似度确定处理,以确定历史推荐对
象与历史推荐样本信息的相关性,以根据相关性和样本标签确定辅助损失函数的值;反向
训练模块用于根据主损失函数的值和辅助损失函数的值将推荐模型训练为目标推荐模型。
数值获取模块还用于通过所述第一神经网络结构对所述历史推荐样本隐向量和所述历史
兴趣隐向量进行特征信息的提取和融合,以确定向所述历史推荐对象推荐所述历史推荐样
本信息的样本推荐概率;辅助损失函数值获取模块还用于通过所述第二神经网络结构对所
述历史推荐样本隐向量和所述历史兴趣隐向量进行相似度确定处理,以确定所述历史推荐
对象与所述历史推荐样本信息的相关性。
史兴趣隐向量进行浅层特征提取处理,以生成历史兴趣浅层特征;激活子模块用于对历史
推荐样本浅层特征和历史兴趣浅层特征进行激活处理,以获得历史推荐样本浅层激活特征
和历史兴趣浅层激活特征;相关性确定子模块用于根据历史推荐样本浅层激活特征和历史
兴趣浅层激活特征,确定历史推荐对象与历史推荐样本信息的相关性。
进行求和处理,以获得历史推荐对象与历史推荐样本信息的相关性指标,其中相关性指标
用来衡量历史推荐对象与历史推荐样本信息的相关性。
一对应;其中,相关性确定子模块包括:历史兴趣浅层卷积特征确定单元、兴趣相似度特征
确定单元、分类单元、历史兴趣特征确定单元、以及相关性确定单元。
兴趣浅层卷积特征与历史推荐样本浅层特征之间的相似度,以生成至少一个兴趣相似度特
征;分类单元用于对各个兴趣相似度特征进行融合分类处理,以确定各个历史兴趣浅层卷
积特征与历史推荐样本浅层特征的相关度;历史兴趣特征确定单元用于根据各个历史兴趣
浅层卷积特征与历史推荐样本浅层特征的相关度对各个历史兴趣浅层卷积特征进行加和
池化处理,以获得历史推荐对象的历史兴趣特征;相关性确定单元用于根据历史推荐对象
的历史兴趣特征和历史推荐样本浅层特征,获得历史推荐对象与历史推荐样本信息的相关
性指标,其中相关性指标用来衡量历史推荐对象与历史推荐样本信息的相关性。
归一化激活处理,以获得归一化激活特征;历史推荐样本浅层特征获取单元用于通过归一
化激活特征对非线性激活特征进行门限控制处理,以生成历史推荐样本浅层特征。
隐向量;相似度确定处理子模块用于通过第二神经网络结构对历史推荐样本隐向量、历史
兴趣隐向量和历史画像特征隐向量进行相似度确定处理,以确定历史推荐对象与历史推荐
样本信息的相关性。
进行处理,以获得历史上下文特征隐向量;相关性确定子模块用于通过第二神经网络结构
对历史推荐样本隐向量、历史兴趣隐向量和历史上下文特征隐向量进行相似度确定处理,
以确定历史推荐对象与历史推荐样本信息的相关性。
权处理,以获得加权历史兴趣隐向量;融合特征向量确定子模块用于对加权历史兴趣隐向
量和历史推荐样本隐向量进行拼接、拉平处理,以确定融合特征向量;样本推荐概率确定子
模块用于对融合特征向量进行多次全连接激活处理,以确定向历史推荐对象推荐历史推荐
样本信息的样本推荐概率。
获取融合特征向量第一单元用于对加权历史兴趣隐向量、历史推荐样本隐向量、以及历史
画像特征隐向量进行拼接、拉平处理,以确定融合特征向量。
处理,以获得历史上下文特征隐向量;融合特征向量获取第二单元用于对加权历史兴趣隐
向量、历史推荐样本隐向量、以及历史上下文特征隐向量进行拼接、拉平处理,以确定融合
特征向量。
的兴趣信息进行特征信息的提取和融合,以确定向待推荐对象推荐待推荐内容信息的概
率;推荐模块用于根据向待推荐对象推荐待推荐内容信息的概率向待推荐对象推荐待推荐
内容信息。
实现上述任一项所述的推荐模型训练方法或者上述推荐方法。
器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设
备执行上述推荐模型训练方法。
史推荐样本信息的相关性确定的辅助损失函数的值,通过该辅助损失函数可以提高预测推
荐概率的准确性。
附图说明
的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据
这些附图获得其他的附图。
具体实施方式
整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示
相同或类似的部分,因而将省略对它们的重复描述。
而,本领域技术人员将意识到,可以实践本公开的技术方案而省略特定细节中的一个或更
多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知
方法、装置、实现或者操作以避免模糊本公开的各方面。
实体相对应。可以采用软件形式来实现这些功能实体,或在一个或硬件获取模块或集成电
路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功
能实体。
因此实际执行的顺序有可能根据实际情况改变。
了列出的要素/组成部分/等之外还可存在另外的要素/组成部分/等;用语“第一”、“第二”
和“第三”等仅作为标记使用,不是对其对象的数量限制。
包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
可以将用户的行为数据上传给服务器105,以便服务器对该用户行为进行分析和信息推荐。
现实设备、智能家居等等。
据进行分析等处理,并将处理结果反馈给终端设备。
间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大
数据和人工智能平台等基础云计算服务的云服务器等,本公开对此不做限制。
可例如通过第一神经网络结构对历史推荐样本信息和所述历史兴趣信息进行特征信息的
提取和融合,以确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率,以便根据样
本推荐概率和样本标签确定主损失函数的值;服务器105可例如通过第二神经网络结构对
历史推荐样本信息和所述历史兴趣信息进行内容相似度确定处理,以确定历史推荐对象与
历史推荐样本信息的相关性,以根据相关性和样本标签确定辅助损失函数的值;服务器105
可例如根据主损失函数的值和辅助损失函数的值将推荐模型训练为目标推荐模型。
备、网络和服务器。
Learning,ML)技术,其中人工智能是利用数字计算机或者数字计算机控制的机器模拟、延
伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应
用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生
产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智
能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机
视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的
核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度
学习通常包括人工神经网络模型、置信网络、强化学习、迁移学习、归纳学习、式教学习等技
术。
图1实施例中的服务器或终端设备来执行,也可以由服务器和终端设备共同执行,在下面的
实施例中,以服务器为执行主体为例进行举例说明,但本公开并不限定于此。
中,例如纸质的广告页等,本公开对此不做限制。历史推荐样本信息可以指的是在过去的某
段时间内向历史推荐对象推荐过的信息。
不做限制。历史兴趣信息可以包括该历史推荐对象在过去一段时间内的历史行为信息。
技术人员可以根据实际需求进行设定。
根据样本推荐概率和样本标签确定主损失函数的值。
结构(softmax)等。在一些实施例中,第一神经网络结构可以是深度神经网络结构,即第一
神经网络结构可以包括多层次的网络(例如包括至少两层特征提取生成网络结构、至少一
层特征融合神经网络结构、至少一层激活网络结构以及分类网络结构),即第一神经网络结
构可以包括多层待训练的参数,例如可以是如图3所示的DIN(Deep Interest network,深
度兴趣网络)网络(包括但不限于嵌入层301、由激活单元(Activation Unit)和加和池化层
(SUM Pooling)组成的加权网络单元302、和全连接激活层(PRelu(一种激活函数)、Dice(一
种激活函数)、Softmax(一种分类网络结构));也可以是浅度神经网络结构,例如仅由MLP
(多层神经网络模型)网络结构、激活网络结构等组成的神经网络结构,再例如仅由几个卷
基层和分类网络结构(Softmax)组成的神经网络,本公开对第一神经网络结构的网络层次
及网络结构不做限制,任意一种可以进行信息推荐的网络结构均可以是本公开中的第一神
经网络结构。
定向历史推荐对象推荐历史推荐样本信息的样本推荐概率,最后根据样本推荐概率和样本
标签确定一个主损失函数的值。
生成历史推荐样本隐向量和历史兴趣隐向量。
括:通过第一神经网络结构对历史推荐样本隐向量和历史兴趣隐向量进行特征信息的提取
和融合,以确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率。
量。
隐向量也会有多个,并且各个历史兴趣信息会与各个历史兴趣隐向量会存在一一对应的关
系。
的特征向量进行分类处理,以确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率
可以包括以下步骤:
推荐样本隐向量进行拼接、拉平处理,以确定融合特征向量;对融合特征向量进行多次全连
接激活处理,以确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率。
称之为历史推荐样本隐向量)分别经过激活单元计算获得兴趣权重(Activation Weight)。
在激活单元中,两组输入向量与其外积(Out Product)拼接后再进行两层全连接计算即可
获得一个兴趣权重标量,分别作为各历史兴趣隐向量的对应的激活权重,从而根据该激活
权重对各个历史兴趣隐向量进行加权池化(SUM Pooling),以获得加权历史兴趣隐向量;最
后将历史推荐样本隐向量和加权历史兴趣隐向量进行拼接、拉平(Concat& Flatten),此后
经过多层已PRelu或Dice为激活函数的全连接层输出预测的样本推荐概率。
值池化、平均值池化、求和池化等)。若采用求和池化处理,那么加权历史兴趣隐向量可以是
各个历史兴趣隐向量与各个激活权重的加权之和。
荐对象的画像信息确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率。具体可以
包括以下步骤:获取历史推荐对象的历史画像信息;通过嵌入层对历史画像信息进行处理,
以获得历史画像特征隐向量;对加权历史兴趣隐向量、历史推荐样本隐向量、以及历史画像
特征隐向量进行拼接、拉平处理,以确定融合特征向量;对融合特征向量进行多次全连接激
活处理,以确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率。
推荐对象的信息。
史推荐对象的历史上下文信息确定向历史推荐对象推荐历史推荐样本信息的样本推荐概
率。具体可以包括以下步骤:获取历史推荐对象点击历史推荐样本信息的历史上下文信息;
通过嵌入层对历史上下文信息进行处理,以获得历史上下文特征隐向量;对加权历史兴趣
隐向量、历史推荐样本隐向量、以及历史上下文特征隐向量进行拼接、拉平处理,以确定融
合特征向量;对融合特征向量进行多次全连接激活处理,以确定向历史推荐对象推荐历史
推荐样本信息的样本推荐概率。
限制。
签确定辅助损失函数的值。
第二神经网络结构可例如包括卷积网络结构、激活网络结构、拼接网络结构和分类网络结
构(softmax)中的任意一个或者多个等。
络结构、至少一层激活网络结构以及分类网络结构),即第二神经网络结构可以包括多层待
训练的参数,例如可以是如图3所示的DIN;也可以是浅度神经网络结构,例如仅由MLP(多层
感知机)网络结构、激活网络结构等组成的神经网络结构,本公开对第二神经网络结构的网
络层次及网络结构不做限制,任意一种可以确定历史推荐对象与历史推荐样本信息的相关
性的网络结构均可以是本公开中的第二神经网络结构。
生成历史推荐样本隐向量和历史兴趣隐向量。那么通过第二神经网络结构对历史推荐样本
信息和历史兴趣信息进行相似度确定处理,以确定历史推荐对象与历史推荐样本信息的相
关性,以根据相关性和样本标签确定辅助损失函数的值可以包括:通过第二神经网络结构
对历史推荐样本隐向量和历史兴趣隐向量进行相似度确定处理,以确定历史推荐对象与历
史推荐样本信息的相关性,以根据相关性和样本标签确定辅助损失函数的值。
量。
值。
次数或者推荐模型的预测精度达到一定的阈值后,则完成推荐模型训练,获得目标推荐模
型。
中,在传统的主损失函数的值的基础上新引入了一个用于描述历史推荐对象与历史推荐样
本信息间相关性的辅助损失函数的值,通过描述历史推荐对象与历史推荐样本信息间相关
性的辅助损失函数的值对推荐模型进行训练指导,以提高推荐神经网络的推荐概率的预测
准确性。
量)进行特征提取,以生成历史样本浅层特征Featurei。例如可以根据Featurei = MLP
(Embi)对历史推荐样本隐向量进行处理,以获得历史样本浅层特征Featurei。
限制。
向量1、兴趣隐向量2或者兴趣隐向量N,N为大于或者等于1的整数)进行浅层特征提取,以生
成新的特征向量,即历史兴趣浅层特征。
结构,本公开对此不做限制。
)激活函数)进行激活;也可以对历史推荐样本浅层特征Featurei进行多次激活,然后将
多次激活结构融合以获得推荐样本浅层激活特征Rtarget,本公开对此不做限制。
tanh(Featurei));对历史推荐样本浅层特征进行归一化激活处理(又一次激活处理),以获
得归一化激活特征(例如使用 进行激活处理,以获得归一化激活特征 );
然后通过归一化激活特征对非线性激活特征进行门限控制处理,以生成历史推荐样本浅层
特征Ri。其中, ,其中i为大于或者等于1小于或
者等于N的整数,N为历史推荐对象的历史兴趣隐向量的个数。
史推荐样本浅层特征归一化至0‑1之间。
激活特征对非线性激活特征进行门限处理,可以通过归一化激活特征的值对非线性激活特
征中的值进行大小调整,以避免非线性激活特征中产生突变和跳跃的现象。
层激活特征确定历史推荐对象与历史推荐样本信息的相关性指标的网络结构,本公开对此
不做限制。
荐样本信息的相关性指标MR(即 ),其中相关性指标用来衡量历
史推荐对象与历史推荐样本信息的相关性。
处理,以获得激活特征内积值。
应很大。例如历史推荐对象的历史兴趣信息中包括收藏该历史推荐样本信息,那么该历史
推荐对象就很有可能会点击该历史推荐样本信息,那么历史推荐对象与历史推荐样本信息
的相关度就会比较大,那么该相关性指标也对应的会比较大。
相关性指标;若历史推荐对象的历史兴趣信息由多个,那么需要将该多个历史兴趣信息对
应的特征激活值相加,以确定历史推荐对象与历史推荐样本信息的相关性指标。
息一一对应,并且相关性确定网络结构5021是如图6所示的网络结构,那么历史推荐对象与
历史推荐样本信息的相关性的确定可以通过如下方法完成:
样本浅层特征之间的相似度(其中相似度确定单元可以采用多种计算方式,比如MLP、直接
求点积等),以生成至少一个兴趣相似度特征B1、B2、……BN;对各个兴趣相似度特征进行融
合分类(softmax)处理,以确定各个历史兴趣浅层卷积特征与历史推荐样本浅层特征的相
关度b1、b2、……bN;根据各个历史兴趣浅层卷积特征与历史推荐样本浅层特征的相关度对
各个历史兴趣浅层卷积特征进行加和池化处理(例如采用公式Sum(bi*Bi)进行加和池化处
理,其中Sum代表求和函数,i代表大于或者等于1小于或者等于N的整数),以获得历史推荐
对象的历史兴趣特征C;根据历史推荐对象的历史兴趣特征和历史推荐样本浅层特征,获得
历史推荐对象与历史推荐样本信息的相关性指标(例如将C与Rtarget求点积以获得相关性
指标MR),其中相关性指标用来衡量历史推荐对象与历史推荐样本信息的相关性。
函数的值和辅助损失函数的值确定一样本标签,然后基于该样本标签对推荐模型进行训
练。
络结构引入描述内容间相似度的辅助损失函数,将内容间的相似性加入推荐模型的学习目
标中,针对性的指导内容隐向量的训练,提升隐向量准确性,进而改善模型的预测能力。
值传导至嵌入层时对参数更新的指导性较弱。即:在现有网络模型中指导嵌入层中的隐向
量训练的目标仅有最终预测分值与训练样本的标签之间的主损失函数的值,此主损失函数
的值并不能直接指导隐向量的学习;主损失函数的运算与嵌入层层之间往往有多层其他运
算逻辑(如attention(注意力)网络、Dense网络(稠密神经网络)、RNN网络(循环神经网络)
等),中间步骤和参数较多,中间参数与嵌入层的参数同步训练,主损失函数对嵌入层的指
导作用经中间网络被稀释。
层参数的影响,降低学习效率。
浅层的学习效果会被深层网络稀释,而本公开提供的辅助损失函数的值可以直接的作用于
嵌入层,对嵌入层的指导更加直接(因此从嵌入层到辅助损失函数的确定所经历的层数少,
因此辅助损失函数的值对嵌入层的指导作用没有被稀释)。本公开提供的推荐模型,通过结
构优化引入了辅助损失函数,使得推荐模型的损失函数能够直接作用于嵌入层,对嵌入层
获得的隐向量进行直接指导。
性的指导隐向量的训练,提升隐向量准确性,进而改善推荐模型的预测能力。本公开提出的
模型方案对内容刻画更准确,预测能力更强,且易于在现有方案的基础上进行改造。
特性,其核心是为用户打标签,包括但不限于用户的姓名、性别、年龄、所处位置、爱好等可
以用来描述历史推荐对象的信息。
对历史画像信息进行处理,以获得历史画像特征隐向量;通过第二神经网络结构对历史推
荐样本隐向量、历史兴趣隐向量和历史画像特征隐向量进行相似度确定处理,以确定历史
推荐对象与历史推荐样本信息的相关性。
了历史画像信息、历史兴趣信息以外的所有信息,例如可以是用户下单的时间信息、下单的
位置信息等,本公开对此不做限制。
史上下文信息;通过嵌入层对历史上下文信息进行处理,以获得历史上下文特征隐向量;通
过第二神经网络结构对历史推荐样本隐向量、历史兴趣隐向量和历史上下文特征隐向量进
行相似度确定处理,以确定历史推荐对象与历史推荐样本信息的相关性。
实施例中的服务器或终端设备来执行,也可以由服务器和终端设备共同执行,在下面的实
施例中,以服务器为执行主体为例进行举例说明,但本公开并不限定于此。
率,其中目标推荐模型是通过推荐模型训练方法训练获得的。
网络结构对待推荐隐向量和兴趣隐向量进行特征信息的提取和融合,以确定向待推荐对象
推荐待推荐内容信息的概率。
费的资源。
模块802、辅助损失函数值获取模块803、以及反向训练模块804。
块802可以用于通过第一神经网络结构对历史推荐样本信息和所述历史兴趣信息进行特征
信息的提取和融合,以确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率,以便
根据样本推荐概率和样本标签确定主损失函数的值;辅助损失函数值获取模块803可以用
于通过第二神经网络结构对历史推荐样本信息和所述历史兴趣信息进行内容相似度确定
处理,以确定历史推荐对象与历史推荐样本信息的相关性,以根据相关性和样本标签确定
辅助损失函数的值;反向训练模块804可以用于根据主损失函数的值和辅助损失函数的值
将推荐模型训练为目标推荐模型。
数值获取模块802还用于通过所述第一神经网络结构对所述历史推荐样本隐向量和所述历
史兴趣隐向量进行特征信息的提取和融合,以确定向所述历史推荐对象推荐所述历史推荐
样本信息的样本推荐概率;辅助损失函数值获取模块803还用于通过所述第二神经网络结
构对所述历史推荐样本隐向量和所述历史兴趣隐向量进行相似度确定处理,以确定所述历
史推荐对象与所述历史推荐样本信息的相关性。
用于对历史兴趣隐向量进行浅层特征提取处理,以生成历史兴趣浅层特征;激活子模块可
以用于对历史推荐样本浅层特征和历史兴趣浅层特征进行激活处理,以获得历史推荐样本
浅层激活特征和历史兴趣浅层激活特征;相关性确定子模块可以用于根据历史推荐样本浅
层激活特征和历史兴趣浅层激活特征,确定历史推荐对象与历史推荐样本信息的相关性。
征内积值进行求和处理,以获得历史推荐对象与历史推荐样本信息的相关性指标,其中相
关性指标用来衡量历史推荐对象与历史推荐样本信息的相关性。
一对应;其中,相关性确定子模块可以包括:历史兴趣浅层卷积特征确定单元、兴趣相似度
特征确定单元、分类单元、历史兴趣特征确定单元、以及相关性确定单元。
个历史兴趣浅层卷积特征与历史推荐样本浅层特征之间的相似度,以生成至少一个兴趣相
似度特征;分类单元可以用于对各个兴趣相似度特征进行融合分类处理,以确定各个历史
兴趣浅层卷积特征与历史推荐样本浅层特征的相关度;历史兴趣特征确定单元可以用于根
据各个历史兴趣浅层卷积特征与历史推荐样本浅层特征的相关度对各个历史兴趣浅层卷
积特征进行加和池化处理,以获得历史推荐对象的历史兴趣特征;相关性确定单元可以用
于根据历史推荐对象的历史兴趣特征和历史推荐样本浅层特征,获得历史推荐对象与历史
推荐样本信息的相关性指标,其中相关性指标用来衡量历史推荐对象与历史推荐样本信息
的相关性。
特征进行归一化激活处理,以获得归一化激活特征;历史推荐样本浅层特征获取单元可以
用于通过归一化激活特征对非线性激活特征进行门限控制处理,以生成历史推荐样本浅层
特征。
画像特征隐向量;相似度确定处理子模块可以用于通过第二神经网络结构对历史推荐样本
隐向量、历史兴趣隐向量和历史画像特征隐向量进行相似度确定处理,以确定历史推荐对
象与历史推荐样本信息的相关性。
下文信息进行处理,以获得历史上下文特征隐向量;相关性确定子模块可以用于通过第二
神经网络结构对历史推荐样本隐向量、历史兴趣隐向量和历史上下文特征隐向量进行相似
度确定处理,以确定历史推荐对象与历史推荐样本信息的相关性。
量进行加权处理,以获得加权历史兴趣隐向量;融合特征向量确定子模块可以用于对加权
历史兴趣隐向量和历史推荐样本隐向量进行拼接、拉平处理,以确定融合特征向量;样本推
荐概率确定子模块可以用于对融合特征向量进行多次全连接激活处理,以确定向历史推荐
对象推荐历史推荐样本信息的样本推荐概率。
获取融合特征向量第一单元用于对加权历史兴趣隐向量、历史推荐样本隐向量、以及历史
画像特征隐向量进行拼接、拉平处理,以确定融合特征向量。
处理,以获得历史上下文特征隐向量;融合特征向量获取第二单元用于对加权历史兴趣隐
向量、历史推荐样本隐向量、以及历史上下文特征隐向量进行拼接、拉平处理,以确定融合
特征向量。
的兴趣信息进行特征信息的提取和融合,以确定向待推荐对象推荐待推荐内容信息的概
率;推荐模块903可以用于根据向待推荐对象推荐待推荐内容信息的概率向待推荐对象推
荐待推荐内容信息。
置在处理器中。其中,这些模块和/或子模块和/或单元的名称在某种情况下并不构成对该
模块和/或子模块和/或单元本身的限定。
表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或用于
实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注
的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可
以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意
的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的
功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来
实现。
序。另外,也易于理解,这些处理可以是例如在模块中同步或异步执行的。
任何限制。
序而执行各种适当的动作和处理。在RAM 1003中,还存储有电子设备1000操作所需的各种
程序和数据。CPU 1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接
口1005也连接至总线1004。
1008;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经
由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至I/O接口1005。可拆卸介
质1011,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便
于从其上读出的计算机程序根据需要被安装入储存部分1008。
介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样
的实施例中,该计算机程序可以通过通信部分1009从网络上被下载和安装,和/或从可拆卸
介质1010被安装。在该计算机程序被中央处理单元(CPU)1001执行时,执行本申请的系统中
限定的上述功能。
但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组
合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或导线的电连接、便
携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储
器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD‑ROM)、光存储器件、磁存储器件、
或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程
序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本
申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,
其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限
于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可
读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者
传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储
介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等
等,或者上述的任意合适的组合。
上述计算机可读存储介质承载有一个或者程序,当上述一个或者程序被一个该设备执行
时,使得该设备可实现功能包括:获取历史推荐样本信息、历史推荐对象的历史兴趣信息、
以及历史推荐对象针对历史推荐样本信息的样本标签;通过嵌入层对历史推荐样本信息和
历史兴趣信息分别进行向量化处理,以生成历史推荐样本隐向量和历史兴趣隐向量;通过
第一神经网络结构对历史推荐样本隐向量和历史兴趣隐向量进行特征信息的提取和融合,
以确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率,以便根据样本推荐概率和
样本标签确定主损失函数的值;通过第二神经网络结构对历史推荐样本隐向量和历史兴趣
隐向量进行相似度确定处理,以确定历史推荐对象与历史推荐样本信息的相关性,以根据
相关性和样本标签确定辅助损失函数的值;根据主损失函数的值和辅助损失函数的值将推
荐模型训练为目标推荐模型。
机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使
得该计算机设备执行上述实施例的各种可选实现方式中提供的方法。
例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储
介质(可以是CD‑ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算设备(可以是个
人计算机、服务器、移动终端、或者智能设备等)执行根据本公开实施例的方法,例如图2、图
4、或图7的一个或所示的步骤。
者适应性变化遵循本公开的一般性原理并包括本公开未申请的本技术领域中的公知常识
或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要
求指出。