推荐模型训练方法、推荐方法和相关设备转让专利

申请号 : CN202110683173.8

文献号 : CN113254785B

文献日 : 2021-10-08

本公开提供一种推荐模型训练方法、推荐方法和相关设备，该方法包括：获取历史推荐样本信息、历史推荐对象的历史兴趣信息和样本标签；通过嵌入层对历史推荐样本信息和历史兴趣信息分别进行向量化处理，以生成历史推荐样本隐向量和历史兴趣隐向量；通过第一神经网络结构对历史推荐样本隐向量和历史兴趣隐向量进行特征信息的提取和融合，以确定主损失函数的值；通过第二神经网络结构对历史推荐样本隐向量和历史兴趣隐向量进行相似度确定处理，以确定历史推荐对象与历史推荐样本信息的相关性，以根据相关性和样本标签确定辅助损失函数的值；根据主损失函数的值和辅助损失函数的值将推荐模型训练为目标推荐模型。

1.一种推荐模型训练方法，其特征在于，所述推荐模型包括第一神经网络结构和第二神经网络结构；其中，所述方法包括：获取历史推荐样本信息、历史推荐对象的历史兴趣信息、以及所述历史推荐对象针对所述历史推荐样本信息的样本标签；

通过所述第一神经网络结构对所述历史推荐样本信息和所述历史兴趣信息进行特征信息的提取和融合，以确定向所述历史推荐对象推荐所述历史推荐样本信息的样本推荐概率，以便根据所述样本推荐概率和所述样本标签确定主损失函数的值，其中所述第二神经网络结构的网络层次少于第一神经网络结构；

通过所述第二神经网络结构对所述历史推荐样本信息和所述历史兴趣信息进行内容相似度确定处理，以确定所述历史推荐对象与所述历史推荐样本信息的相关性，以根据所述相关性和所述样本标签确定辅助损失函数的值；

根据所述主损失函数的值和所述辅助损失函数的值将所述推荐模型训练为目标推荐模型。

2.根据权利要求1所述方法，其特征在于，所述推荐模型还包括嵌入层；其中，所述方法还包括：

通过所述嵌入层对所述历史推荐样本信息和所述历史兴趣信息分别进行向量化处理，以生成历史推荐样本隐向量和历史兴趣隐向量；

其中，通过所述第一神经网络结构对所述历史推荐样本信息和所述历史兴趣信息进行特征信息的提取和融合，以确定向所述历史推荐对象推荐所述历史推荐样本信息的样本推荐概率，包括：

通过所述第一神经网络结构对所述历史推荐样本隐向量和所述历史兴趣隐向量进行特征信息的提取和融合，以确定向所述历史推荐对象推荐所述历史推荐样本信息的样本推荐概率；

其中，通过所述第二神经网络结构对所述历史推荐样本信息和所述历史兴趣信息进行内容相似度确定处理，包括：

通过所述第二神经网络结构对所述历史推荐样本隐向量和所述历史兴趣隐向量进行相似度确定处理，以确定所述历史推荐对象与所述历史推荐样本信息的相关性。

3.根据权利要求2所述方法，其特征在于，通过所述第二神经网络结构对所述历史推荐样本隐向量和所述历史兴趣隐向量进行相似度确定处理，以确定所述历史推荐对象与所述历史推荐样本信息的相关性，包括：对所述历史推荐样本隐向量进行浅层特征提取处理，以生成历史推荐样本浅层特征；

对所述历史兴趣隐向量进行浅层特征提取处理，以生成历史兴趣浅层特征；

对所述历史推荐样本浅层特征和所述历史兴趣浅层特征进行激活处理，以获得历史推荐样本浅层激活特征和历史兴趣浅层激活特征；

根据所述历史推荐样本浅层激活特征和所述历史兴趣浅层激活特征，确定所述历史推荐对象与所述历史推荐样本信息的相关性。

4.根据权利要求3所述方法，其特征在于，确定所述历史推荐对象与所述历史推荐样本信息的相关性，包括：

将所述历史推荐样本浅层激活特征和所述历史兴趣浅层激活特征进行内积求取处理，以确定激活特征内积值；

将所述激活特征内积值进行求和处理，以获得所述历史推荐对象与所述历史推荐样本信息的相关性指标，其中所述相关性指标用来衡量所述历史推荐对象与所述历史推荐样本信息的相关性。

5.根据权利要求3所述方法，其特征在于，所述历史推荐对象包括至少一个历史兴趣信息，所述历史兴趣浅层特征包括至少一个历史兴趣浅层特征，所述至少一个历史兴趣浅层特征与所述至少一个历史兴趣信息一一对应；其中，确定所述历史推荐对象与所述历史推荐样本信息的相关性，包括：

对所述历史兴趣浅层特征进行卷积处理，以获得至少一个历史兴趣浅层卷积特征；

确定各个历史兴趣浅层卷积特征与所述历史推荐样本浅层特征之间的相似度，以生成至少一个兴趣相似度特征；

对各个兴趣相似度特征进行融合分类处理，以确定各个历史兴趣浅层卷积特征与所述历史推荐样本浅层特征的相关度；

根据各个历史兴趣浅层卷积特征与所述历史推荐样本浅层特征的相关度对各个历史兴趣浅层卷积特征进行加和池化处理，以获得所述历史推荐对象的历史兴趣特征；

根据所述历史推荐对象的历史兴趣特征和所述历史推荐样本浅层特征，获得所述历史推荐对象与所述历史推荐样本信息的相关性指标，其中所述相关性指标用来衡量所述历史推荐对象与所述历史推荐样本信息的相关性。

6.根据权利要求3所述方法，其特征在于，对所述历史推荐样本浅层特征进行激活处理，以获得历史推荐样本浅层激活特征，包括：对所述历史推荐样本浅层特征进行非线性激活处理，以获得非线性激活特征；

对所述历史推荐样本浅层特征进行归一化激活处理，以获得归一化激活特征；

通过所述归一化激活特征对所述非线性激活特征进行门限控制处理，以生成所述历史推荐样本浅层特征。

7.根据权利要求2所述方法，其特征在于，通过所述第二神经网络结构对所述历史推荐样本隐向量和所述历史兴趣隐向量进行相似度确定处理，以确定所述历史推荐对象与所述历史推荐样本信息的相关性，包括：获取所述历史推荐对象的历史画像信息；

通过所述嵌入层对所述历史画像信息进行处理，以获得历史画像特征隐向量；

通过所述第二神经网络结构对所述历史推荐样本隐向量、所述历史兴趣隐向量和所述历史画像特征隐向量进行相似度确定处理，以确定所述历史推荐对象与所述历史推荐样本信息的相关性。

8.根据权利要求2所述方法，其特征在于，通过所述第二神经网络结构对所述历史推荐样本隐向量和所述历史兴趣隐向量进行相似度确定处理，以确定所述历史推荐对象与所述历史推荐样本信息的相关性，包括：获取所述历史推荐对象点击所述历史推荐样本信息的历史上下文信息；

通过所述嵌入层对所述历史上下文信息进行处理，以获得历史上下文特征隐向量；

通过所述第二神经网络结构对所述历史推荐样本隐向量、所述历史兴趣隐向量和所述历史上下文特征隐向量进行相似度确定处理，以确定所述历史推荐对象与所述历史推荐样本信息的相关性。

9.根据权利要求2所述方法，其特征在于，通过所述第一神经网络结构对所述历史推荐样本隐向量和所述历史兴趣隐向量进行特征信息的提取和融合，以确定向所述历史推荐对象推荐所述历史推荐样本信息的样本推荐概率，包括：确定所述历史兴趣隐向量相对于所述历史推荐样本隐向量的激活权重；

通过所述激活权重对所述历史兴趣隐向量进行加权处理，以获得加权历史兴趣隐向量；

对所述加权历史兴趣隐向量和所述历史推荐样本隐向量进行拼接、拉平处理，以确定融合特征向量；

对所述融合特征向量进行多次全连接激活处理，以确定向所述历史推荐对象推荐所述历史推荐样本信息的样本推荐概率。

10.根据权利要求9所述方法，其特征在于，对所述加权历史兴趣隐向量和所述历史推荐样本隐向量进行拼接、拉平处理，以确定融合特征向量，包括：获取所述历史推荐对象的历史画像信息；

通过所述嵌入层对所述历史画像信息进行处理，以获得历史画像特征隐向量；

对所述加权历史兴趣隐向量、所述历史推荐样本隐向量、以及所述历史画像特征隐向量进行拼接、拉平处理，以确定所述融合特征向量。

11.根据权利要求9所述方法，其特征在于，对所述加权历史兴趣隐向量和所述历史推荐样本隐向量进行拼接、拉平处理，以确定融合特征向量，包括：获取所述历史推荐对象点击所述历史推荐样本信息的历史上下文信息；

通过所述嵌入层对所述历史上下文信息进行处理，以获得历史上下文特征隐向量；

对所述加权历史兴趣隐向量、所述历史推荐样本隐向量、以及所述历史上下文特征隐向量进行拼接、拉平处理，以确定所述融合特征向量。

12.一种推荐方法，其特征在于，包括：获取待推荐内容信息、待推荐对象的兴趣信息；

通过目标推荐模型的第一神经网络结构对所述待推荐内容信息和所述待推荐对象的兴趣信息进行特征信息的提取和融合，以确定向所述待推荐对象推荐所述待推荐内容信息的概率，其中所述目标推荐模型是通过权利要求1‑11任一项所述的推荐模型训练方法训练获得的；

根据所述向所述待推荐对象推荐所述待推荐内容信息的概率向所述待推荐对象推荐所述待推荐内容信息。

13.一种推荐模型训练装置，其特征在于，所述推荐模型包括第一神经网络结构和第二神经网络结构，包括：

样本标签获取模块，用于获取历史推荐样本信息、历史推荐对象的历史兴趣信息、以及所述历史推荐对象针对所述历史推荐样本信息的样本标签；

主损失函数值获取模块，用于通过所述第一神经网络结构对所述历史推荐样本信息和所述历史兴趣信息进行特征信息的提取和融合，以确定向所述历史推荐对象推荐所述历史推荐样本信息的样本推荐概率，以便根据所述样本推荐概率和所述样本标签确定主损失函数的值；

辅助损失函数值获取模块，用于通过所述第二神经网络结构对所述历史推荐样本信息和所述历史兴趣信息进行相似度确定处理，以确定所述历史推荐对象与所述历史推荐样本信息的相关性，以根据所述相关性和所述样本标签确定辅助损失函数的值；

反向训练模块，用于根据所述主损失函数的值和所述辅助损失函数的值将所述推荐模型训练为目标推荐模型。

14.根据权利要求13所述装置，其特征在于，所述推荐模型还包括嵌入层；其中，推荐模型训练装置还包括：

隐向量确定模块，用于通过所述嵌入层对所述历史推荐样本信息和所述历史兴趣信息分别进行向量化处理，以生成历史推荐样本隐向量和历史兴趣隐向量；

主损失函数值获取模块，还用于通过所述第一神经网络结构对所述历史推荐样本隐向量和所述历史兴趣隐向量进行特征信息的提取和融合，以确定向所述历史推荐对象推荐所述历史推荐样本信息的样本推荐概率；

辅助损失函数值获取模块，还用于通过所述第二神经网络结构对所述历史推荐样本隐向量和所述历史兴趣隐向量进行相似度确定处理，以确定所述历史推荐对象与所述历史推荐样本信息的相关性。

15.根据权利要求14所述装置，其特征在于，所述辅助损失函数值模块包括：生成历史推荐样本浅层特征生成子模块，用于对所述历史推荐样本隐向量进行浅层特征提取处理，以生成历史推荐样本浅层特征；

历史兴趣浅层特征生成子模块，用于对历史兴趣隐向量进行浅层特征提取处理，以生成历史兴趣浅层特征；

激活子模块，用于对历史推荐样本浅层特征和历史兴趣浅层特征进行激活处理，以获得历史推荐样本浅层激活特征和历史兴趣浅层激活特征；

相关性确定子模块，用于根据历史推荐样本浅层激活特征和历史兴趣浅层激活特征，确定历史推荐对象与历史推荐样本信息的相关性。

16.根据权利要求15所述装置，其特征在于，所述相关性确定子模块包括：激活特征内积值确定单元，用于将历史推荐样本浅层激活特征和历史兴趣浅层激活特征进行内积求取处理，以确定激活特征内积值；

求和单元，用于将激活特征内积值进行求和处理，以获得历史推荐对象与历史推荐样本信息的相关性指标，其中相关性指标用来衡量历史推荐对象与历史推荐样本信息的相关性。

17.根据权利要求15所述装置，其特征在于，所述历史推荐对象包括至少一个历史兴趣信息，历史兴趣浅层特征包括至少一个历史兴趣浅层特征，至少一个历史兴趣浅层特征与至少一个历史兴趣信息一一对应；其中，所述相关性确定子模块包括：历史兴趣浅层卷积特征确定单元，用于为对历史兴趣浅层特征进行卷积处理，以获得至少一个历史兴趣浅层卷积特征；

兴趣相似度特征确定单元，用于确定各个历史兴趣浅层卷积特征与历史推荐样本浅层特征之间的相似度，以生成至少一个兴趣相似度特征；

分类单元，用于对各个兴趣相似度特征进行融合分类处理，以确定各个历史兴趣浅层卷积特征与历史推荐样本浅层特征的相关度；

历史兴趣特征确定单元，用于根据各个历史兴趣浅层卷积特征与历史推荐样本浅层特征的相关度对各个历史兴趣浅层卷积特征进行加和池化处理，以获得历史推荐对象的历史兴趣特征；

相关性确定单元，用于根据历史推荐对象的历史兴趣特征和历史推荐样本浅层特征，获得历史推荐对象与历史推荐样本信息的相关性指标，其中相关性指标用来衡量历史推荐对象与历史推荐样本信息的相关性。

18.根据权利要求15所述装置，其特征在于，所述激活子模块包括：非线性激活特征获取单元，用于对历史推荐样本浅层特征进行非线性激活处理，以获得非线性激活特征；

归一化激活特征获取单元，用于对历史推荐样本浅层特征进行归一化激活处理，以获得归一化激活特征；

历史推荐样本浅层特征获取单元，用于通过归一化激活特征对非线性激活特征进行门限控制处理，以生成历史推荐样本浅层特征。

19.根据权利要求14所述装置，其特征在于，所述辅助损失函数值获取模块包括：历史画像信息获取子模块，用于获取历史推荐对象的历史画像信息；历史画像特征隐向量获取子模块用于通过嵌入层对历史画像信息进行处理，以获得历史画像特征隐向量；

相似度确定处理子模块，用于通过第二神经网络结构对历史推荐样本隐向量、历史兴趣隐向量和历史画像特征隐向量进行相似度确定处理，以确定历史推荐对象与历史推荐样本信息的相关性。

20.根据权利要求14所述装置，其特征在于，所述辅助损失函数值获取模块包括：历史上下文信息确定子模块，用于获取历史推荐对象点击历史推荐样本信息的历史上下文信息；

历史上下文特征隐向量确定子模块，用于通过嵌入层对历史上下文信息进行处理，以获得历史上下文特征隐向量；

相关性确定子模块，用于通过第二神经网络结构对历史推荐样本隐向量、历史兴趣隐向量和历史上下文特征隐向量进行相似度确定处理，以确定历史推荐对象与历史推荐样本信息的相关性。

21.根据权利要求14所述装置，其特征在于，所述主损失函数值获取模块包括：激活权重确定子模块，用于确定历史兴趣隐向量相对于历史推荐样本隐向量的激活权重；

加权历史兴趣隐向量确定子模块，用于通过激活权重对历史兴趣隐向量进行加权处理，以获得加权历史兴趣隐向量；

融合特征向量确定子模块，用于对加权历史兴趣隐向量和历史推荐样本隐向量进行拼接、拉平处理，以确定融合特征向量；

样本推荐概率确定子模块，用于对融合特征向量进行多次全连接激活处理，以确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率。

22.根据权利要求21所述装置，其特征在于，所述融合特征向量确定子模块包括：历史画像信息获取单元，用于获取历史推荐对象的历史画像信息；

历史画像特征隐向量单元，用于通过嵌入层对历史画像信息进行处理，以获得历史画像特征隐向量；

获取融合特征向量第一单元，用于对加权历史兴趣隐向量、历史推荐样本隐向量、以及历史画像特征隐向量进行拼接、拉平处理，以确定融合特征向量。

23.根据权利要求21所述装置，其特征在于，所述融合特征向量确定子模块包括：历史上下文信息获取单元，用于获取历史推荐对象点击历史推荐样本信息的历史上下文信息；

历史上下文特征隐向量获取单元，用于通过嵌入层对历史上下文信息进行处理，以获得历史上下文特征隐向量；

融合特征向量获取第二单元，用于对加权历史兴趣隐向量、历史推荐样本隐向量、以及历史上下文特征隐向量进行拼接、拉平处理，以确定融合特征向量。

24.一种推荐装置，其特征在于，包括：待推荐信息获取模块，用于获取待推荐内容信息、待推荐对象的兴趣信息；

概率确定模块，用于通过目标推荐模型的第一神经网络结构对待推荐内容信息和待推荐对象的兴趣信息进行特征信息的提取和融合，以确定向待推荐对象推荐待推荐内容信息的概率；

推荐模块，用于根据向待推荐对象推荐待推荐内容信息的概率向待推荐对象推荐待推荐内容信息。

25.一种电子设备，其特征在于，包括：存储器；以及

耦合到所述存储器的处理器，所述处理器被用于基于存储在所述存储器中的指令，执行如权利要求1‑11任一项所述的推荐模型训练方法或者如权利要求12所述的推荐方法。

26.一种计算机可读存储介质，其上存储有程序，该程序被处理器执行时实现如权利要求1‑11任一项所述的推荐模型训练方法或者如权利要求12所述的推荐方法。

技术领域

[0001] 本公开涉及人工智能技术领域，尤其涉及一种推荐模型训练方法、推荐方法、装置、电子设备和计算机可读存储介质。

背景技术

[0002] 随着互联网技术的飞速发展，互联网能够给用户提供丰富的信息资源。获取用户历史兴趣，然后基于训练完成的推荐模型对用户历史兴趣进行分析以预测可以向用户推荐
的信息，成为信息推荐的一种主要形式。

[0003] 但是相关技术中提供的训练完成的推荐模型预测精度较低，会向用户推荐用户自身并不感兴趣的信息等，导致用户体验较差。

[0004] 针对上述情况，本公开提供了一种可以提高推荐模型预测准确率的推荐模型训练方法。

[0005] 需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解。

发明内容

[0006] 本公开的目的在于提供一种推荐模型训练方法、装置、电子设备以及和计算机可读存储介质，能够通过由历史推荐对象和历史推荐样本信息的相关性确定的辅助损失函数
的值对推荐模型训练进行指导，从而提高推荐模型预测推荐概率的准确性。

[0007] 本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。

[0008] 本公开实施例提供了一种推荐模型训练方法，包括：获取历史推荐样本信息、历史推荐对象的历史兴趣信息、以及所述历史推荐对象针对所述历史推荐样本信息的样本标
签；通过所述第一神经网络结构对所述历史推荐样本信息和所述历史兴趣信息进行特征信
息的提取和融合，以确定向所述历史推荐对象推荐所述历史推荐样本信息的样本推荐概
率，以便根据所述样本推荐概率和所述样本标签确定主损失函数的值；通过所述第二神经
网络结构对所述历史推荐样本信息和所述历史兴趣信息进行内容相似度确定处理，以确定
所述历史推荐对象与所述历史推荐样本信息的相关性，以根据所述相关性和所述样本标签
确定辅助损失函数的值；根据所述主损失函数的值和所述辅助损失函数的值将所述推荐模
型训练为目标推荐模型。

[0009] 本公开实施例提供一种推荐方法，包括：获取待推荐内容信息、待推荐对象的兴趣信息；通过目标推荐模型的第一神经网络结构对所述待推荐内容信息和所述待推荐对象的
兴趣信息进行特征信息的提取和融合，以确定向所述待推荐对象推荐所述待推荐内容信息
的概率，其中所述目标推荐模型是通过上述推荐模型训练方法训练获得的；根据所述向所
述待推荐对象推荐所述待推荐内容信息的概率向所述待推荐对象推荐所述待推荐内容信
息。

[0010] 本公开实施例提供了一种推荐模型训练装置，包括：样本标签获取模块、主损失函数值获取模块、辅助损失函数值获取模块、以及反向训练模块。

[0011] 其中，样本标签获取模块用于获取历史推荐样本信息、历史推荐对象的历史兴趣信息、以及历史推荐对象针对历史推荐样本信息的样本标签；主损失函数值获取模块用于
通过第一神经网络结构对历史推荐样本信息和所述历史兴趣信息进行特征信息的提取和
融合，以确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率，以便根据样本推荐
概率和样本标签确定主损失函数的值；辅助损失函数值获取模块用于通过第二神经网络结
构对历史推荐样本信息和所述历史兴趣信息进行内容相似度确定处理，以确定历史推荐对
象与历史推荐样本信息的相关性，以根据相关性和样本标签确定辅助损失函数的值；反向
训练模块用于根据主损失函数的值和辅助损失函数的值将推荐模型训练为目标推荐模型。

[0012] 在一些实施例中，推荐模型还包括嵌入层；其中，推荐模型训练装置还包括：隐向量确定模块。

[0013] 其中，隐向量确定模块用于通过所述嵌入层对所述历史推荐样本信息和所述历史兴趣信息分别进行向量化处理，以生成历史推荐样本隐向量和历史兴趣隐向量，主损失函
数值获取模块还用于通过所述第一神经网络结构对所述历史推荐样本隐向量和所述历史
兴趣隐向量进行特征信息的提取和融合，以确定向所述历史推荐对象推荐所述历史推荐样
本信息的样本推荐概率；辅助损失函数值获取模块还用于通过所述第二神经网络结构对所
述历史推荐样本隐向量和所述历史兴趣隐向量进行相似度确定处理，以确定所述历史推荐
对象与所述历史推荐样本信息的相关性。

[0014] 在一些实施例中，辅助损失函数值模块包括：生成历史推荐样本浅层特征生成子模块、历史兴趣浅层特征生成子模块、激活子模块以及相关性确定子模块。

[0015] 其中，生成历史推荐样本浅层特征生成子模块用于对历史推荐样本隐向量进行浅层特征提取处理，以生成历史推荐样本浅层特征；历史兴趣浅层特征生成子模块用于对历
史兴趣隐向量进行浅层特征提取处理，以生成历史兴趣浅层特征；激活子模块用于对历史
推荐样本浅层特征和历史兴趣浅层特征进行激活处理，以获得历史推荐样本浅层激活特征
和历史兴趣浅层激活特征；相关性确定子模块用于根据历史推荐样本浅层激活特征和历史
兴趣浅层激活特征，确定历史推荐对象与历史推荐样本信息的相关性。

[0016] 在一些实施例中，相关性确定子模块包括：激活特征内积值确定单元和求和单元。

[0017] 其中，激活特征内积值确定单元用于将历史推荐样本浅层激活特征和历史兴趣浅层激活特征进行内积求取处理，以确定激活特征内积值；求和单元用于将激活特征内积值
进行求和处理，以获得历史推荐对象与历史推荐样本信息的相关性指标，其中相关性指标
用来衡量历史推荐对象与历史推荐样本信息的相关性。

[0018] 在一些实施例中，历史推荐对象包括至少一个历史兴趣信息，历史兴趣浅层特征包括至少一个历史兴趣浅层特征，至少一个历史兴趣浅层特征与至少一个历史兴趣信息一
一对应；其中，相关性确定子模块包括：历史兴趣浅层卷积特征确定单元、兴趣相似度特征
确定单元、分类单元、历史兴趣特征确定单元、以及相关性确定单元。

[0019] 其中，历史兴趣浅层卷积特征确定单元配置为对历史兴趣浅层特征进行卷积处理，以获得至少一个历史兴趣浅层卷积特征；兴趣相似度特征确定单元用于确定各个历史
兴趣浅层卷积特征与历史推荐样本浅层特征之间的相似度，以生成至少一个兴趣相似度特
征；分类单元用于对各个兴趣相似度特征进行融合分类处理，以确定各个历史兴趣浅层卷
积特征与历史推荐样本浅层特征的相关度；历史兴趣特征确定单元用于根据各个历史兴趣
浅层卷积特征与历史推荐样本浅层特征的相关度对各个历史兴趣浅层卷积特征进行加和
池化处理，以获得历史推荐对象的历史兴趣特征；相关性确定单元用于根据历史推荐对象
的历史兴趣特征和历史推荐样本浅层特征，获得历史推荐对象与历史推荐样本信息的相关
性指标，其中相关性指标用来衡量历史推荐对象与历史推荐样本信息的相关性。

[0020] 在一些实施例中，激活子模块包括：非线性激活特征获取单元、归一化激活特征获取单元、以及历史推荐样本浅层特征获取单元。

[0021] 其中，非线性激活特征获取单元用于对历史推荐样本浅层特征进行非线性激活处理，以获得非线性激活特征；归一化激活特征获取单元用于对历史推荐样本浅层特征进行
归一化激活处理，以获得归一化激活特征；历史推荐样本浅层特征获取单元用于通过归一
化激活特征对非线性激活特征进行门限控制处理，以生成历史推荐样本浅层特征。

[0022] 在一些实施例中，辅助损失函数值获取模块包括：历史画像信息获取子模块、历史画像特征隐向量获取子模块、以及相似度确定处理子模块。

[0023] 其中，历史画像信息获取子模块用于获取历史推荐对象的历史画像信息；历史画像特征隐向量获取子模块用于通过嵌入层对历史画像信息进行处理，以获得历史画像特征
隐向量；相似度确定处理子模块用于通过第二神经网络结构对历史推荐样本隐向量、历史
兴趣隐向量和历史画像特征隐向量进行相似度确定处理，以确定历史推荐对象与历史推荐
样本信息的相关性。

[0024] 在一些实施例中，辅助损失函数值获取模块包括：历史上下文信息确定子模块、历史上下文特征隐向量确定子模块、以及相关性确定子模块。

[0025] 其中，历史上下文信息确定子模块用于获取历史推荐对象点击历史推荐样本信息的历史上下文信息；历史上下文特征隐向量确定子模块用于通过嵌入层对历史上下文信息
进行处理，以获得历史上下文特征隐向量；相关性确定子模块用于通过第二神经网络结构
对历史推荐样本隐向量、历史兴趣隐向量和历史上下文特征隐向量进行相似度确定处理，
以确定历史推荐对象与历史推荐样本信息的相关性。

[0026] 在一些实施例中，主损失函数值获取模块包括：激活权重确定子模块、加权历史兴趣隐向量确定子模块、融合特征向量确定子模块、以及样本推荐概率确定子模块。

[0027] 其中，激活权重确定子模块用于确定历史兴趣隐向量相对于历史推荐样本隐向量的激活权重；加权历史兴趣隐向量确定子模块用于通过激活权重对历史兴趣隐向量进行加
权处理，以获得加权历史兴趣隐向量；融合特征向量确定子模块用于对加权历史兴趣隐向
量和历史推荐样本隐向量进行拼接、拉平处理，以确定融合特征向量；样本推荐概率确定子
模块用于对融合特征向量进行多次全连接激活处理，以确定向历史推荐对象推荐历史推荐
样本信息的样本推荐概率。

[0028] 在一些实施例中，融合特征向量确定子模块包括：历史画像信息获取单元、历史画像特征隐向量单元、以及获取融合特征向量第一单元。

[0029] 其中，历史画像信息获取单元用于获取历史推荐对象的历史画像信息；历史画像特征隐向量单元用于通过嵌入层对历史画像信息进行处理，以获得历史画像特征隐向量；
获取融合特征向量第一单元用于对加权历史兴趣隐向量、历史推荐样本隐向量、以及历史
画像特征隐向量进行拼接、拉平处理，以确定融合特征向量。

[0030] 在一些实施例中，融合特征向量确定子模块包括：历史上下文信息获取单元、历史上下文特征隐向量获取单元、以及融合特征向量获取第二单元。

[0031] 其中，历史上下文信息获取单元用于获取历史推荐对象点击历史推荐样本信息的历史上下文信息；历史上下文特征隐向量获取单元用于通过嵌入层对历史上下文信息进行
处理，以获得历史上下文特征隐向量；融合特征向量获取第二单元用于对加权历史兴趣隐
向量、历史推荐样本隐向量、以及历史上下文特征隐向量进行拼接、拉平处理，以确定融合
特征向量。

[0032] 本公开实施例提供了一种推荐装置，包括：待推荐信息获取模块、概率确定模块以及推荐模块。

[0033] 其中，待推荐信息获取模块用于获取待推荐内容信息、待推荐对象的兴趣信息；概率确定模块用于通过目标推荐模型的第一神经网络结构对待推荐内容信息和待推荐对象
的兴趣信息进行特征信息的提取和融合，以确定向待推荐对象推荐待推荐内容信息的概
率；推荐模块用于根据向待推荐对象推荐待推荐内容信息的概率向待推荐对象推荐待推荐
内容信息。

[0034] 本公开实施例提出一种电子设备，该电子设备包括：一个或处理器；存储装置，用于存储一个或程序，当所述一个或程序被所述一个或处理器执行，使得所述一个或处理器
实现上述任一项所述的推荐模型训练方法或者上述推荐方法。

[0035] 本公开实施例提出一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现如上述任一项所述的推荐模型训练方法或者推荐方法。

[0036] 本公开实施例提出一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理
器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设
备执行上述推荐模型训练方法。

[0037] 本公开实施例提供的推荐模型训练方法、装置及电子设备和计算机可读存储介质，在对推荐模型进行训练时，在主损失函数的值基础上增加了一个由历史推荐对象与历
史推荐样本信息的相关性确定的辅助损失函数的值，通过该辅助损失函数可以提高预测推
荐概率的准确性。

[0038] 应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本公开。

附图说明

[0039] 此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开
的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据
这些附图获得其他的附图。

[0040] 图1示出了应用于本公开实施例的推荐模型训练方法或推荐方法的示例性系统架构的示意图。

[0041] 图2是根据一示例性实施例示出的一种推荐模型训练方法的流程图。

[0042] 图3是根据一示例性实施例示出的一种推荐模型的结构示意图。

[0043] 图4是根据一示例性实时示出的一种确定历史推荐对象与历史推荐样本信息的相关性的方法的流程图。

[0044] 图5是根据一示例性实施例示出的一种推荐模型的结构示意图。

[0045] 图6是根据一示例性实施例示出的一种相关性确定网络的结构示意图。

[0046] 图7是根据一示例性实施例示出的一种推荐方法的流程图。

[0047] 图8根据一示例性实施例示出的一种推荐模型训练装置的框图。

[0048] 图9根据一示例性实施例示出的一种推荐装置的框图。

[0049] 图10示出了适于用来实现本公开实施例的的电子设备的结构示意图。

具体实施方式

[0050] 现在将参考附图更全面地描述示例实施例。然而，示例实施例能够以多种形式实施，且不应被理解为限于在此阐述的实施例；相反，提供这些实施例使得本公开将全面和完
整，并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示
相同或类似的部分，因而将省略对它们的重复描述。

[0051] 本公开所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中，提供许多具体细节从而给出对本公开的实施方式的充分理解。然
而，本领域技术人员将意识到，可以实践本公开的技术方案而省略特定细节中的一个或更
多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知
方法、装置、实现或者操作以避免模糊本公开的各方面。

[0052] 附图仅为本公开的示意性图解，图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图不一定必须与物理或逻辑上独立的
实体相对应。可以采用软件形式来实现这些功能实体，或在一个或硬件获取模块或集成电
路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功
能实体。

[0053] 附图中所示的流程图仅是示例性说明，不是必须包括所有的内容和步骤，也不是必须按所描述的顺序执行。例如，有的步骤还可以分解，而有的步骤可以合并或部分合并，
因此实际执行的顺序有可能根据实际情况改变。

[0054] 本说明书中，用语“一个”、“一”、“该”、“”和“至少一个”用以表示存在一个或要素/组成部分/等；用语“包含”、“包括”和“具有”用以表示开放式的包括在内的意思并且是指除
了列出的要素/组成部分/等之外还可存在另外的要素/组成部分/等；用语“第一”、“第二”
和“第三”等仅作为标记使用，不是对其对象的数量限制。

[0055] 下面结合附图对本公开示例实施方式进行详细说明。

[0056] 图1示出了可以应用于本公开实施例的推荐模型训练方法或推荐方法的示例性系统架构的示意图。

[0057] 如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以
包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

[0058] 用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。例如，用户可以在终端设备进行一些行为（如点击广告、商品等行为），终端设备
可以将用户的行为数据上传给服务器105，以便服务器对该用户行为进行分析和信息推荐。

[0059] 其中，终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机、台式计算机、可穿戴设备、虚拟
现实设备、智能家居等等。

[0060] 服务器105可以是提供各种服务的服务器，例如对用户利用终端设备101、102、103所进行操作的装置提供支持的后台管理服务器。后台管理服务器可以对接收到的请求等数
据进行分析等处理，并将处理结果反馈给终端设备。

[0061] 服务器可以是独立的物理服务器，也可以是物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中
间件服务、域名服务、安全服务、CDN（Content Delivery Network，内容分发网络）、以及大
数据和人工智能平台等基础云计算服务的云服务器等，本公开对此不做限制。

[0062] 服务器105可例如从终端设备101、102、或者103等获取历史推荐样本信息、历史推荐对象的历史兴趣信息、以及历史推荐对象针对历史推荐样本信息的样本标签；服务器105
可例如通过第一神经网络结构对历史推荐样本信息和所述历史兴趣信息进行特征信息的
提取和融合，以确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率，以便根据样
本推荐概率和样本标签确定主损失函数的值；服务器105可例如通过第二神经网络结构对
历史推荐样本信息和所述历史兴趣信息进行内容相似度确定处理，以确定历史推荐对象与
历史推荐样本信息的相关性，以根据相关性和样本标签确定辅助损失函数的值；服务器105
可例如根据主损失函数的值和辅助损失函数的值将推荐模型训练为目标推荐模型。

[0063] 应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的，服务器105可以是一个实体的服务器，还可以为服务器组成，根据实际需要，可以具有任意数目的终端设
备、网络和服务器。

[0064] 本公开提供了一种可以提高推荐模型预测准确率的推荐模型训练方法。该推荐模型训练方法涉及人工智能技术（Artificial Intelligence，AI）中的机器学习（Machine
Learning，ML）技术，其中人工智能是利用数字计算机或者数字计算机控制的机器模拟、延
伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应
用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生
产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智
能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

[0065] 人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、
大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机
视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

[0066] 其中，机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的
知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的
核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度
学习通常包括人工神经网络模型、置信网络、强化学习、迁移学习、归纳学习、式教学习等技
术。

[0067] 根据上述人工智能中的机器学习技术，本公开提出了以下推荐模型训练方法。

[0068] 图2是根据一示例性实施例示出的一种推荐模型训练方法的流程图。本公开实施例所提供的方法可以由任意具备计算处理能力的电子设备来执行，例如该方法可以由上述
图1实施例中的服务器或终端设备来执行，也可以由服务器和终端设备共同执行，在下面的
实施例中，以服务器为执行主体为例进行举例说明，但本公开并不限定于此。

[0069] 参照图2，本公开实施例提供的推荐模型训练方法可以包括以下步骤。

[0070] 步骤S202，获取历史推荐样本信息、历史推荐对象的历史兴趣信息、以及历史推荐对象针对历史推荐样本信息的样本标签。

[0071] 其中，推荐样本信息可以指的是任意一种可以向用户推荐的信息，该向用户推荐的信息可以依附于多媒体载体上，例如网页、视频、音频等；也可以依附于实质的物理载体
中，例如纸质的广告页等，本公开对此不做限制。历史推荐样本信息可以指的是在过去的某
段时间内向历史推荐对象推荐过的信息。

[0072] 推荐对象可以是人、也可以是设备等，历史推荐对象可以指的是在过去的某段时间内向其推荐了某些信息的对象。

[0073] 兴趣信息可以包括推荐对象（包括待推荐对象或者历史推荐对象）的行为信息，例如推荐对象有过兴趣的内容分类信息、标签信息、商品来源信息等多维度数据，本公开对此
不做限制。历史兴趣信息可以包括该历史推荐对象在过去一段时间内的历史行为信息。

[0074] 可以理解的是，历史推荐对象的历史兴趣信息可以包括历史推荐对象的一个兴趣信息，也可以包括多个兴趣信息，本公开对此不做限制。

[0075] 历史推荐对象针对历史推荐样本信息的样本标签可以包括历史推荐对象针对历史推荐样本信息的点击、收藏、长时间浏览等所对应的标签，本公开对此不做限制，本领域
技术人员可以根据实际需求进行设定。

[0076] 步骤S204，通过第一神经网络结构对历史推荐样本信息和历史兴趣信息进行特征信息的提取和融合，以确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率，以便
根据样本推荐概率和样本标签确定主损失函数的值。

[0077] 其中，第一神经网络结构可以是任意一种可以完成特征提取和特征分类的网络结构，第一神经网络结构可例如包括卷积网络结构、激活网络结构、拼接网络结构和分类网络
结构（softmax）等。在一些实施例中，第一神经网络结构可以是深度神经网络结构，即第一
神经网络结构可以包括多层次的网络（例如包括至少两层特征提取生成网络结构、至少一
层特征融合神经网络结构、至少一层激活网络结构以及分类网络结构），即第一神经网络结
构可以包括多层待训练的参数，例如可以是如图3所示的DIN（Deep Interest network，深
度兴趣网络）网络（包括但不限于嵌入层301、由激活单元（Activation Unit）和加和池化层
（SUM Pooling）组成的加权网络单元302、和全连接激活层（PRelu（一种激活函数）、Dice（一
种激活函数）、Softmax（一种分类网络结构））；也可以是浅度神经网络结构，例如仅由MLP
（多层神经网络模型）网络结构、激活网络结构等组成的神经网络结构，再例如仅由几个卷
基层和分类网络结构（Softmax）组成的神经网络，本公开对第一神经网络结构的网络层次
及网络结构不做限制，任意一种可以进行信息推荐的网络结构均可以是本公开中的第一神
经网络结构。

[0078] 其中，MLP是一种网络层次较少的前馈神经网络模型。

[0079] 在一些实施例中，第一神经网络结构可以对历史推荐样本信息和历史兴趣信息进行特征信息的提取和融合，然后使用分类器对特征融合后的特征向量进行分类处理，以确
定向历史推荐对象推荐历史推荐样本信息的样本推荐概率，最后根据样本推荐概率和样本
标签确定一个主损失函数的值。

[0080] 可以理解的是，本公开中的主损失函数仅仅是一个名称，与辅助损失函数之间不存在主要和辅助的功能区别。

[0081] 在另外一些实施例中，推荐模型还可以包括一个嵌入层，那么推荐模型的训练方法还可以包括：通过嵌入层对历史推荐样本信息和历史兴趣信息分别进行向量化处理，以
生成历史推荐样本隐向量和历史兴趣隐向量。

[0082] 那么通过第一神经网络结构对历史推荐样本信息和历史兴趣信息进行特征信息的提取和融合，以确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率步骤可以包
括：通过第一神经网络结构对历史推荐样本隐向量和历史兴趣隐向量进行特征信息的提取
和融合，以确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率。

[0083] 在一些实施例中，可以通过推荐模型的嵌入层对历史推荐样本信息和历史兴趣信息分别进行向量化处理，以获得低维语义向量——历史推荐样本隐向量和历史兴趣隐向
量。

[0084] 可以理解的是，若历史推荐对象的历史兴趣信息有多个（例如兴趣信息1、兴趣信息2、……兴趣信息N，N为大于或者等于1的整数），那么对应的通过嵌入层生成的历史兴趣
隐向量也会有多个，并且各个历史兴趣信息会与各个历史兴趣隐向量会存在一一对应的关
系。

[0085] 该嵌入层可例如为图3所示的嵌入层301，本公开对此不做限制。

[0086] 在一些实施例中，该第一神经网络结构可以包括该嵌入层，也可以让嵌入层独立于第一神经网络结构，本公开对此不做限制。

[0087] 假设第一神经网络结构是DIN网络模型，那么通过第一神经网络结构对历史推荐样本隐向量和历史兴趣隐向量进行特征信息的提取和融合，然后使用分类器对特征融合后
的特征向量进行分类处理，以确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率
可以包括以下步骤：

[0088] 确定历史兴趣隐向量相对于历史推荐样本隐向量的激活权重；通过激活权重对历史兴趣隐向量进行加权处理，以获得加权历史兴趣隐向量；对加权历史兴趣隐向量和历史
推荐样本隐向量进行拼接、拉平处理，以确定融合特征向量；对融合特征向量进行多次全连
接激活处理，以确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率。

[0089] 可以理解的是，因为推荐模型中线性神经网络的表达力不够，所以通常需要在推荐模型中增加激活处理以为推荐模型加入非线性因素。

[0090] 为了对神经网络进行激活处理，通常需要在神经网络中添加激活函数，例如 sigmoid函数、tanh函数、ReLU函数、Leaky ReLU函数等。

[0091] 如图3所示，各历史兴趣隐向量（在训练过程中，可以将图3中的兴趣隐向量称之为历史兴趣隐向量）与历史推荐样本隐向量（在训练过程中，可以将图3中的推荐信息隐向量
称之为历史推荐样本隐向量）分别经过激活单元计算获得兴趣权重（Activation Weight）。
在激活单元中，两组输入向量与其外积（Out Product）拼接后再进行两层全连接计算即可
获得一个兴趣权重标量，分别作为各历史兴趣隐向量的对应的激活权重，从而根据该激活
权重对各个历史兴趣隐向量进行加权池化（SUM Pooling），以获得加权历史兴趣隐向量；最
后将历史推荐样本隐向量和加权历史兴趣隐向量进行拼接、拉平（Concat& Flatten），此后
经过多层已PRelu或Dice为激活函数的全连接层输出预测的样本推荐概率。

[0092] 上述加权池化操作可以指的是，根据各个激活权重对应地对各个历史兴趣隐向量进行加权处理，然后将各个加权处理之后的历史兴趣隐向量进行池化处理（可例如是最大
值池化、平均值池化、求和池化等）。若采用求和池化处理，那么加权历史兴趣隐向量可以是
各个历史兴趣隐向量与各个激活权重的加权之和。

[0093] 在一些实施例中，如图3所示，在训练过程中，不仅可以通过历史推荐对象的历史兴趣信息确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率，还可以结合历史推
荐对象的画像信息确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率。具体可以
包括以下步骤：获取历史推荐对象的历史画像信息；通过嵌入层对历史画像信息进行处理，
以获得历史画像特征隐向量；对加权历史兴趣隐向量、历史推荐样本隐向量、以及历史画像
特征隐向量进行拼接、拉平处理，以确定融合特征向量；对融合特征向量进行多次全连接激
活处理，以确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率。

[0094] 其中，该历史推荐对象的画像信息可以用来勾画目标用户的用户特性，其核心是为用户打标签，包括但不限于用户的姓名、性别、年龄、所处位置、爱好等可以用来描述历史
推荐对象的信息。

[0095] 在另外一些实施例中，如图3所示，在训练过程中，不仅可以通过历史推荐对象的历史兴趣信息确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率，还可以结合历
史推荐对象的历史上下文信息确定向历史推荐对象推荐历史推荐样本信息的样本推荐概
率。具体可以包括以下步骤：获取历史推荐对象点击历史推荐样本信息的历史上下文信息；
通过嵌入层对历史上下文信息进行处理，以获得历史上下文特征隐向量；对加权历史兴趣
隐向量、历史推荐样本隐向量、以及历史上下文特征隐向量进行拼接、拉平处理，以确定融
合特征向量；对融合特征向量进行多次全连接激活处理，以确定向历史推荐对象推荐历史
推荐样本信息的样本推荐概率。

[0096] 其中，该历史上下文信息可以包括历史推荐对象除了历史画像信息、历史兴趣信息以外的所有信息，例如可以是用户下单的时间信息、下单的位置信息等，本公开对此不做
限制。

[0097] 在一些实施例中，在获得样本推荐概率和样本标签后，可以计算样本推荐概率和样本标签的交叉熵损失函数，以获得主损失函数的值。

[0098] 步骤S206，通过第二神经网络结构对历史推荐样本信息和历史兴趣信息进行相似度确定处理，以确定历史推荐对象与历史推荐样本信息的相关性，以根据相关性和样本标
签确定辅助损失函数的值。

[0099] 第二神经网络结构可以是任意一种能够确定历史推荐样本信息和历史兴趣信息之间的相似度，从而确定历史推荐对象和历史推荐样本信息之间的相关性的网络结构，该
第二神经网络结构可例如包括卷积网络结构、激活网络结构、拼接网络结构和分类网络结
构（softmax）中的任意一个或者多个等。

[0100] 在一些实施例中，第二神经网络结构可以是深度神经网络结构，即第二神经网络结构可以包括多层次的网络（例如包括至少一层卷积网络结构、至少一层特征融合神经网
络结构、至少一层激活网络结构以及分类网络结构），即第二神经网络结构可以包括多层待
训练的参数，例如可以是如图3所示的DIN；也可以是浅度神经网络结构，例如仅由MLP（多层
感知机）网络结构、激活网络结构等组成的神经网络结构，本公开对第二神经网络结构的网
络层次及网络结构不做限制，任意一种可以确定历史推荐对象与历史推荐样本信息的相关
性的网络结构均可以是本公开中的第二神经网络结构。

[0101] 在另外一些实施例中，推荐模型还可以包括一个嵌入层，那么推荐模型的训练方法还可以包括：通过嵌入层对历史推荐样本信息和历史兴趣信息分别进行向量化处理，以
生成历史推荐样本隐向量和历史兴趣隐向量。那么通过第二神经网络结构对历史推荐样本
信息和历史兴趣信息进行相似度确定处理，以确定历史推荐对象与历史推荐样本信息的相
关性，以根据相关性和样本标签确定辅助损失函数的值可以包括：通过第二神经网络结构
对历史推荐样本隐向量和历史兴趣隐向量进行相似度确定处理，以确定历史推荐对象与历
史推荐样本信息的相关性，以根据相关性和样本标签确定辅助损失函数的值。

[0102] 在一些实施例中，可以通过推荐模型的嵌入层对历史推荐样本信息和历史兴趣信息分别进行向量化处理，以获得低维语义向量——历史推荐样本隐向量和历史兴趣隐向
量。

[0103] 该嵌入层可例如为图3所示的嵌入层301，本公开对此不做限制。

[0104] 在一些实施例中，该第二神经网络结构可以包括该嵌入层，也可以让嵌入层独立于第二神经网络结构，本公开对此不做限制。

[0105] 在另外一些实施例中，第一神经网络结构可以有自己对应的嵌入层，也可以与第二神经网络结构共享一个嵌入层，本公开对此不做限制。

[0106] 在一些实施例中，第二神经网络结构的网络层次可以多于第一神经网络结构的网络层次，也可以少于第一神经网络结构的网络层次，本公开对此不做限制。

[0107] 在获得历史推荐对象与历史推荐样本信息的相关性后，可以计算历史推荐对象与历史推荐样本信息的相关性与样本标签之间的交叉熵损失函数，以获得辅助损失函数的
值。

[0108] 步骤S208，根据主损失函数的值和辅助损失函数的值将推荐模型训练为目标推荐模型。

[0109] 在一些实施例中，可以将主损失函数的值与辅助损失函数的值相加，以确定一个终极损失函数的值，然后根据该终极损失函数的值反向训练推荐模型，待达到一定的训练
次数或者推荐模型的预测精度达到一定的阈值后，则完成推荐模型训练，获得目标推荐模
型。

[0110] 本公开通过在模型中引入描述内容间相似度的辅助损失函数的值的方式，改善推荐模型的预测能力。

[0111] 与常见的以Din模型为代表的“Embedding‑Interest Extractor‑Loss（即内容信息向量化、特征抽取、计算损失函数）”的模型不同，本公开提供的推荐神经网络训练方法
中，在传统的主损失函数的值的基础上新引入了一个用于描述历史推荐对象与历史推荐样
本信息间相关性的辅助损失函数的值，通过描述历史推荐对象与历史推荐样本信息间相关
性的辅助损失函数的值对推荐模型进行训练指导，以提高推荐神经网络的推荐概率的预测
准确性。

[0112] 图4是根据一示例性实时示出的一种确定历史推荐对象与历史推荐样本信息的相关性的方法的流程图。

[0113] 参考图4，上述确定历史推荐对象与历史推荐样本信息的相关性的方法可以包括以下步骤。

[0114] 步骤S402，对历史推荐样本隐向量进行浅层特征提取处理，以生成历史推荐样本浅层特征。

[0115] 如图5所示，可以通过第二神经网络结构501中的浅层特征提取激活结构5011中的特征提取单元（如图5中的MLP网络）对历史推荐样本隐向量Embi（即图5中的推荐信息隐向
量）进行特征提取，以生成历史样本浅层特征Featurei。例如可以根据Featurei = MLP
（Embi）对历史推荐样本隐向量进行处理，以获得历史样本浅层特征Featurei。

[0116] 其中，浅层特征提取激活结构5011中的特征提取单元的网络的层次可以少一些，可例如可以只包括一层卷积结构；也可例如包括图5所示的MLP网络结构，本公开对此不做
限制。

[0117] 步骤S404，对历史兴趣隐向量进行浅层特征提取处理，以生成历史兴趣浅层特征。

[0118] 在一些实施例中，可以通过第二神经网络结构501中的浅层特征提取结构5012、5013、或者5014中的特征提取单元（如图5中的MLP网络）对历史兴趣隐向量（即图中兴趣隐
向量1、兴趣隐向量2或者兴趣隐向量N，N为大于或者等于1的整数）进行浅层特征提取，以生
成新的特征向量，即历史兴趣浅层特征。

[0119] 在一些实施例中，浅层特征提取结构5011中的特征提取单元与浅层特征提取结构5012、5013、或者5014中的特征提取单元可以具备相同的网络结构，也可以具备不同的网络
结构，本公开对此不做限制。

[0120] 步骤S406，对历史推荐样本浅层特征和历史兴趣浅层特征进行激活处理，以获得历史推荐样本浅层激活特征和历史兴趣浅层激活特征。

[0121] 在一些实施例中，可以对历史推荐样本浅层特征Featurei进行一次激活，以获得推荐样本浅层激活特征Rtarget，即仅使用一个激活函数（例如tanh激活函数或者西格玛（
）激活函数）进行激活；也可以对历史推荐样本浅层特征Featurei进行多次激活，然后将
多次激活结构融合以获得推荐样本浅层激活特征Rtarget，本公开对此不做限制。

[0122] 图5在第二神经网络结构501中示出了一种对历史推荐样本浅层特征进行两次激活处理的结构示意图。

[0123] 如图5所示，可以对历史推荐样本浅层特征进行非线性激活处理（一次激活处理），以获得非线性激活特征（例如使用tanh激活函数进行激活处理，以获得非线性激活特征
tanh（Featurei））；对历史推荐样本浅层特征进行归一化激活处理（又一次激活处理），以获
得归一化激活特征（例如使用进行激活处理，以获得归一化激活特征）；
然后通过归一化激活特征对非线性激活特征进行门限控制处理，以生成历史推荐样本浅层
特征Ri。其中，，其中i为大于或者等于1小于或
者等于N的整数，N为历史推荐对象的历史兴趣隐向量的个数。

[0124] 其中，非线性激活处理可以指的是向历史推荐样本浅层特征中增加线性特征的处理方式。归一化激活处理，不仅可以向历史推荐样本浅层特征中引入线性特征，还可以将历
史推荐样本浅层特征归一化至0‑1之间。

[0125] 通过归一化激活特征对非线性激活特征进行门限控制处理可以指的是将归一化激活特征和非线性激活特征求哈达码积，以获得历史推荐样本浅层特征。其中，通过归一化
激活特征对非线性激活特征进行门限处理，可以通过归一化激活特征的值对非线性激活特
征中的值进行大小调整，以避免非线性激活特征中产生突变和跳跃的现象。

[0126] 对历史兴趣浅层特征进行激活处理的处理方式可以参考历史推荐样本浅层特征的激活方式，本公开对此不做限制。

[0127] 步骤S408，根据历史推荐样本浅层激活特征和历史兴趣浅层激活特征，确定历史推荐对象与历史推荐样本信息的相关性。

[0128] 在一些实施例中，可以通过图5所示的相关性确定网络结构5021确定历史推荐对象与历史推荐样本信息的相关性指标。

[0129] 其中，相关性确定网络结构可以是一个加权池化（Sum Polling）层，也可以是如图6所示的网络结构，还可以是其他任意可以根据历史推荐样本浅层激活特征和历史兴趣浅
层激活特征确定历史推荐对象与历史推荐样本信息的相关性指标的网络结构，本公开对此
不做限制。

[0130] 若相关性确定网络结构5021是一个加权池化（Sum Polling）层，那么历史推荐对象与历史推荐样本信息的相关性的确定可以通过如下方法完成。

[0131] 将历史推荐样本浅层激活特征和历史兴趣浅层激活特征进行内积求取处理，以确定激活特征内积值；然后将激活特征内积值进行求和处理，以获得历史推荐对象与历史推
荐样本信息的相关性指标MR（即），其中相关性指标用来衡量历
史推荐对象与历史推荐样本信息的相关性。

[0132] 其中，将历史推荐样本浅层激活特征和历史兴趣浅层激活特征进行内积求取处理指的是对历史推荐样本浅层激活特征和历史兴趣浅层激活特征进行点积处理或者数量积
处理，以获得激活特征内积值。

[0133] 相关性指标MR可以用来衡量历史推荐对象与历史推荐样本信息之间的相关度，若历史推荐对象的历史兴趣信息与历史推荐样本信息的相关性很大，则该相关性指标就会对
应很大。例如历史推荐对象的历史兴趣信息中包括收藏该历史推荐样本信息，那么该历史
推荐对象就很有可能会点击该历史推荐样本信息，那么历史推荐对象与历史推荐样本信息
的相关度就会比较大，那么该相关性指标也对应的会比较大。

[0134] 可以理解的是，若历史推荐对象的历史兴趣信息只有一个，那么对应的特征激活值也就只有一个，那么该特征激活值就可以直接作为历史推荐对象与历史推荐样本信息的
相关性指标；若历史推荐对象的历史兴趣信息由多个，那么需要将该多个历史兴趣信息对
应的特征激活值相加，以确定历史推荐对象与历史推荐样本信息的相关性指标。

[0135] 在一些实施例中，若历史推荐对象包括至少一个历史兴趣信息，历史兴趣浅层特征包括至少一个历史兴趣浅层特征，且至少一个历史兴趣浅层特征与至少一个历史兴趣信
息一一对应，并且相关性确定网络结构5021是如图6所示的网络结构，那么历史推荐对象与
历史推荐样本信息的相关性的确定可以通过如下方法完成：

[0136] 对历史兴趣浅层特征R1、R2、……RN进行卷积处理，以获得至少一个历史兴趣浅层卷积特征A1、A2、……AN；利用相似度确定单元确定各个历史兴趣浅层卷积特征与历史推荐
样本浅层特征之间的相似度（其中相似度确定单元可以采用多种计算方式，比如MLP、直接
求点积等），以生成至少一个兴趣相似度特征B1、B2、……BN；对各个兴趣相似度特征进行融
合分类（softmax）处理，以确定各个历史兴趣浅层卷积特征与历史推荐样本浅层特征的相
关度b1、b2、……bN；根据各个历史兴趣浅层卷积特征与历史推荐样本浅层特征的相关度对
各个历史兴趣浅层卷积特征进行加和池化处理（例如采用公式Sum(bi*Bi)进行加和池化处
理，其中Sum代表求和函数，i代表大于或者等于1小于或者等于N的整数），以获得历史推荐
对象的历史兴趣特征C；根据历史推荐对象的历史兴趣特征和历史推荐样本浅层特征，获得
历史推荐对象与历史推荐样本信息的相关性指标（例如将C与Rtarget求点积以获得相关性
指标MR），其中相关性指标用来衡量历史推荐对象与历史推荐样本信息的相关性。

[0137] 其中，相关性指标还可以用其它方式确定，例如注意力网络、循环神经网络模型等任意可以确定历史推荐对象与历史推荐样本信息的相关性的网络。

[0138] 在一些实施例中，当获得历史推荐对象与历史推荐样本信息的相关性后，可以继续基于该历史推荐对象与历史推荐样本信息的相关性确定辅助损失函数的值。

[0139] 在一些实施例中，还可以通过图5所示的第一神经网络结构502对历史推荐样本信息和历史兴趣信息进行特征信息的提取和融合，以获得主损失函数的值，然后基于主损失
函数的值和辅助损失函数的值确定一样本标签，然后基于该样本标签对推荐模型进行训
练。

[0140] 本发明提供了一种将内容间相似度纳入推荐模型学习目标的模型改进方案，可以对第一神经网络结构（以Din模型为代表）的单一损失函数模型进行优化，通过第二神经网
络结构引入描述内容间相似度的辅助损失函数，将内容间的相似性加入推荐模型的学习目
标中，针对性的指导内容隐向量的训练，提升隐向量准确性，进而改善模型的预测能力。

[0141] 在现有的推荐神经网络（例如第一神经网络结构）中，其结构复杂性非常高，除了attention（注意力）机制、池化，可能还会有多个带激活函数的全连接层，导致损失函数的
值传导至嵌入层时对参数更新的指导性较弱。即：在现有网络模型中指导嵌入层中的隐向
量训练的目标仅有最终预测分值与训练样本的标签之间的主损失函数的值，此主损失函数
的值并不能直接指导隐向量的学习；主损失函数的运算与嵌入层层之间往往有多层其他运
算逻辑（如attention（注意力）网络、Dense网络（稠密神经网络）、RNN网络（循环神经网络）
等），中间步骤和参数较多，中间参数与嵌入层的参数同步训练，主损失函数对嵌入层的指
导作用经中间网络被稀释。

[0142] 根据链式求导机制，损失函数对参数训练的影响是逐层的，同时受到损失函数和前层参数影响，生成损失函数的位置离需要更新的参数层数越多，参数学习越容易受到前
层参数的影响，降低学习效率。

[0143] 因此，主损失函数的值会自动的对各自影响的部分逐层计算梯度，梯度决定参数更新的方向。由于逐层计算的机制，普遍认为的是主损失函数对嵌入层参数的影响力较小，
浅层的学习效果会被深层网络稀释，而本公开提供的辅助损失函数的值可以直接的作用于
嵌入层，对嵌入层的指导更加直接（因此从嵌入层到辅助损失函数的确定所经历的层数少，
因此辅助损失函数的值对嵌入层的指导作用没有被稀释）。本公开提供的推荐模型，通过结
构优化引入了辅助损失函数，使得推荐模型的损失函数能够直接作用于嵌入层，对嵌入层
获得的隐向量进行直接指导。

[0144] 另外，本公开提供的辅助损失函数还是一种可以描述历史推荐对象与历史推荐样本信息的相关性的损失函数的值，因此将该相关性加入推荐模型的学习目标中，可以针对
性的指导隐向量的训练，提升隐向量准确性，进而改善推荐模型的预测能力。本公开提出的
模型方案对内容刻画更准确，预测能力更强，且易于在现有方案的基础上进行改造。

[0145] 在一些实施例中，在确定历史推荐对象与历史推荐样本信息的相关性时，还可以结合历史推荐对象的画像信息，该历史推荐对象的画像信息可以用来勾画目标用户的用户
特性，其核心是为用户打标签，包括但不限于用户的姓名、性别、年龄、所处位置、爱好等可
以用来描述历史推荐对象的信息。

[0146] 在一些实施例中，可以通过以下方法结合历史推荐对象的历史画像信息确定历史推荐对象与历史推荐样本信息的相关性：获取历史推荐对象的历史画像信息；通过嵌入层
对历史画像信息进行处理，以获得历史画像特征隐向量；通过第二神经网络结构对历史推
荐样本隐向量、历史兴趣隐向量和历史画像特征隐向量进行相似度确定处理，以确定历史
推荐对象与历史推荐样本信息的相关性。

[0147] 通过嵌入层对历史画像信息进行处理可以指的是通过嵌入层中的卷积核对历史画像信息进行卷积处理，以从历史画像信息中提取出一些浅层画像语义特征。

[0148] 在一些实施例中，在确定历史推荐对象与历史推荐样本信息的相关性时，还可以结合历史推荐对象的行为的历史上下文信息，该历史上下文信息可以包括历史推荐对象除
了历史画像信息、历史兴趣信息以外的所有信息，例如可以是用户下单的时间信息、下单的
位置信息等，本公开对此不做限制。

[0149] 在一些实施例中，可以通过以下方法结合历史推荐对象的历史上下文信息确定历史推荐对象与历史推荐样本信息的相关性：获取历史推荐对象点击历史推荐样本信息的历
史上下文信息；通过嵌入层对历史上下文信息进行处理，以获得历史上下文特征隐向量；通
过第二神经网络结构对历史推荐样本隐向量、历史兴趣隐向量和历史上下文特征隐向量进
行相似度确定处理，以确定历史推荐对象与历史推荐样本信息的相关性。

[0150] 通过嵌入层对历史上下文信息进行处理可以指的是通过嵌入层中的卷积核对历史上下文信息进行卷积处理，以从历史上下文信息中提取出一些浅层语义特征。

[0151] 图7是根据一示例性实施例示出的一种推荐方法的流程图。本公开实施例所提供的推荐方法可以由任意具备计算处理能力的电子设备来执行，例如该方法可以由上述图1
实施例中的服务器或终端设备来执行，也可以由服务器和终端设备共同执行，在下面的实
施例中，以服务器为执行主体为例进行举例说明，但本公开并不限定于此。

[0152] 参考图7，上述推荐方法可以包括以下步骤。

[0153] 步骤S702，获取待推荐内容信息、待推荐对象的兴趣信息。

[0154] 步骤S704，通过目标推荐模型的第一神经网络结构对待推荐内容信息和待推荐对象的兴趣信息进行特征信息的提取和融合，以确定向待推荐对象推荐待推荐内容信息的概
率，其中目标推荐模型是通过推荐模型训练方法训练获得的。

[0155] 在一些实施例中，上述目标推荐模型还可以包括嵌入层，那么通过第一神经网络结构对待推荐内容信息和待推荐对象的兴趣信息进行特征信息的提取和融合可以包括：

[0156] 通过嵌入层对推荐内容信息进行向量化处理，以获得待推荐隐向量；通过第一神经网络结构对待推荐对象的兴趣信息进行向量化处理，以获得兴趣隐向量；通过第一神经
网络结构对待推荐隐向量和兴趣隐向量进行特征信息的提取和融合，以确定向待推荐对象
推荐待推荐内容信息的概率。

[0157] 步骤S706，根据向待推荐对象推荐待推荐内容信息的概率向待推荐对象推荐待推荐内容信息。

[0158] 本公开实施例提供的推荐方法，采用上述推荐神经网络训练方法训练获得的目标神经网络进行推荐概率的预测，提高了预测准确率，提高了用户体验，减少了推荐过程中花
费的资源。

[0159] 图8根据一示例性实施例示出的一种推荐模型训练装置的框图。参照图8，本公开实施例提供的推荐模型训练装置800可以包括：样本标签获取模块801、主损失函数值获取
模块802、辅助损失函数值获取模块803、以及反向训练模块804。

[0160] 其中，样本标签获取模块801可以用于获取历史推荐样本信息、历史推荐对象的历史兴趣信息、以及历史推荐对象针对历史推荐样本信息的样本标签；主损失函数值获取模
块802可以用于通过第一神经网络结构对历史推荐样本信息和所述历史兴趣信息进行特征
信息的提取和融合，以确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率，以便
根据样本推荐概率和样本标签确定主损失函数的值；辅助损失函数值获取模块803可以用
于通过第二神经网络结构对历史推荐样本信息和所述历史兴趣信息进行内容相似度确定
处理，以确定历史推荐对象与历史推荐样本信息的相关性，以根据相关性和样本标签确定
辅助损失函数的值；反向训练模块804可以用于根据主损失函数的值和辅助损失函数的值
将推荐模型训练为目标推荐模型。

[0161] 在一些实施例中，推荐模型还包括嵌入层；其中，推荐模型训练装置800还包括：隐向量确定模块。

[0162] 其中，隐向量确定模块用于通过所述嵌入层对所述历史推荐样本信息和所述历史兴趣信息分别进行向量化处理，以生成历史推荐样本隐向量和历史兴趣隐向量，主损失函
数值获取模块802还用于通过所述第一神经网络结构对所述历史推荐样本隐向量和所述历
史兴趣隐向量进行特征信息的提取和融合，以确定向所述历史推荐对象推荐所述历史推荐
样本信息的样本推荐概率；辅助损失函数值获取模块803还用于通过所述第二神经网络结
构对所述历史推荐样本隐向量和所述历史兴趣隐向量进行相似度确定处理，以确定所述历
史推荐对象与所述历史推荐样本信息的相关性。

[0163] 在一些实施例中，辅助损失函数值获取模块803可以包括：生成历史推荐样本浅层特征生成子模块、历史兴趣浅层特征生成子模块、激活子模块以及相关性确定子模块。

[0164] 其中，生成历史推荐样本浅层特征生成子模块可以用于对历史推荐样本隐向量进行浅层特征提取处理，以生成历史推荐样本浅层特征；历史兴趣浅层特征生成子模块可以
用于对历史兴趣隐向量进行浅层特征提取处理，以生成历史兴趣浅层特征；激活子模块可
以用于对历史推荐样本浅层特征和历史兴趣浅层特征进行激活处理，以获得历史推荐样本
浅层激活特征和历史兴趣浅层激活特征；相关性确定子模块可以用于根据历史推荐样本浅
层激活特征和历史兴趣浅层激活特征，确定历史推荐对象与历史推荐样本信息的相关性。

[0165] 在一些实施例中，相关性确定子模块可以包括：激活特征内积值确定单元和求和单元。

[0166] 其中，激活特征内积值确定单元可以用于将历史推荐样本浅层激活特征和历史兴趣浅层激活特征进行内积求取处理，以确定激活特征内积值；求和单元可以用于将激活特
征内积值进行求和处理，以获得历史推荐对象与历史推荐样本信息的相关性指标，其中相
关性指标用来衡量历史推荐对象与历史推荐样本信息的相关性。

[0167] 在一些实施例中，历史推荐对象包括至少一个历史兴趣信息，历史兴趣浅层特征包括至少一个历史兴趣浅层特征，至少一个历史兴趣浅层特征与至少一个历史兴趣信息一
一对应；其中，相关性确定子模块可以包括：历史兴趣浅层卷积特征确定单元、兴趣相似度
特征确定单元、分类单元、历史兴趣特征确定单元、以及相关性确定单元。

[0168] 其中，历史兴趣浅层卷积特征确定单元可以配置为对历史兴趣浅层特征进行卷积处理，以获得至少一个历史兴趣浅层卷积特征；兴趣相似度特征确定单元可以用于确定各
个历史兴趣浅层卷积特征与历史推荐样本浅层特征之间的相似度，以生成至少一个兴趣相
似度特征；分类单元可以用于对各个兴趣相似度特征进行融合分类处理，以确定各个历史
兴趣浅层卷积特征与历史推荐样本浅层特征的相关度；历史兴趣特征确定单元可以用于根
据各个历史兴趣浅层卷积特征与历史推荐样本浅层特征的相关度对各个历史兴趣浅层卷
积特征进行加和池化处理，以获得历史推荐对象的历史兴趣特征；相关性确定单元可以用
于根据历史推荐对象的历史兴趣特征和历史推荐样本浅层特征，获得历史推荐对象与历史
推荐样本信息的相关性指标，其中相关性指标用来衡量历史推荐对象与历史推荐样本信息
的相关性。

[0169] 在一些实施例中，激活子模块可以包括：非线性激活特征获取单元、归一化激活特征获取单元、以及历史推荐样本浅层特征获取单元。

[0170] 其中，非线性激活特征获取单元可以用于对历史推荐样本浅层特征进行非线性激活处理，以获得非线性激活特征；归一化激活特征获取单元可以用于对历史推荐样本浅层
特征进行归一化激活处理，以获得归一化激活特征；历史推荐样本浅层特征获取单元可以
用于通过归一化激活特征对非线性激活特征进行门限控制处理，以生成历史推荐样本浅层
特征。

[0171] 在一些实施例中，辅助损失函数值获取模块803可以包括：历史画像信息获取子模块、历史画像特征隐向量获取子模块、以及相似度确定处理子模块。

[0172] 其中，历史画像信息获取子模块可以用于获取历史推荐对象的历史画像信息；历史画像特征隐向量获取子模块可以用于通过嵌入层对历史画像信息进行处理，以获得历史
画像特征隐向量；相似度确定处理子模块可以用于通过第二神经网络结构对历史推荐样本
隐向量、历史兴趣隐向量和历史画像特征隐向量进行相似度确定处理，以确定历史推荐对
象与历史推荐样本信息的相关性。

[0173] 在一些实施例中，辅助损失函数值获取模块803可以包括：历史上下文信息确定子模块、历史上下文特征隐向量确定子模块、以及相关性确定子模块。

[0174] 其中，历史上下文信息确定子模块可以用于获取历史推荐对象点击历史推荐样本信息的历史上下文信息；历史上下文特征隐向量确定子模块可以用于通过嵌入层对历史上
下文信息进行处理，以获得历史上下文特征隐向量；相关性确定子模块可以用于通过第二
神经网络结构对历史推荐样本隐向量、历史兴趣隐向量和历史上下文特征隐向量进行相似
度确定处理，以确定历史推荐对象与历史推荐样本信息的相关性。

[0175] 在一些实施例中，主损失函数值获取模块802可以包括：激活权重确定子模块、加权历史兴趣隐向量确定子模块、融合特征向量确定子模块、以及样本推荐概率确定子模块。

[0176] 其中，激活权重确定子模块可以用于确定历史兴趣隐向量相对于历史推荐样本隐向量的激活权重；加权历史兴趣隐向量确定子模块可以用于通过激活权重对历史兴趣隐向
量进行加权处理，以获得加权历史兴趣隐向量；融合特征向量确定子模块可以用于对加权
历史兴趣隐向量和历史推荐样本隐向量进行拼接、拉平处理，以确定融合特征向量；样本推
荐概率确定子模块可以用于对融合特征向量进行多次全连接激活处理，以确定向历史推荐
对象推荐历史推荐样本信息的样本推荐概率。

[0177] 在一些实施例中，融合特征向量确定子模块可以包括：历史画像信息获取单元、历史画像特征隐向量单元、以及获取融合特征向量第一单元。

[0178] 其中，历史画像信息获取单元用于获取历史推荐对象的历史画像信息；历史画像特征隐向量单元用于通过嵌入层对历史画像信息进行处理，以获得历史画像特征隐向量；
获取融合特征向量第一单元用于对加权历史兴趣隐向量、历史推荐样本隐向量、以及历史
画像特征隐向量进行拼接、拉平处理，以确定融合特征向量。

[0179] 在一些实施例中，融合特征向量确定子模块可以包括：历史上下文信息获取单元、历史上下文特征隐向量获取单元、以及融合特征向量获取第二单元。

[0180] 其中，历史上下文信息获取单元用于获取历史推荐对象点击历史推荐样本信息的历史上下文信息；历史上下文特征隐向量获取单元用于通过嵌入层对历史上下文信息进行
处理，以获得历史上下文特征隐向量；融合特征向量获取第二单元用于对加权历史兴趣隐
向量、历史推荐样本隐向量、以及历史上下文特征隐向量进行拼接、拉平处理，以确定融合
特征向量。

[0181] 由于推荐模型训练装置800的各功能已在其对应的方法实施例中予以详细说明，本公开于此不再赘述。

[0182] 图9根据一示例性实施例示出的一种推荐装置的框图。参照图9，本公开实施例提供的推荐装置900可以包括：待推荐信息获取模块901、概率确定模块902以及推荐模块903。

[0183] 其中，待推荐信息获取模块901可以用于获取待推荐内容信息、待推荐对象的兴趣信息；概率确定模块902可以用于通过第一神经网络结构对待推荐内容信息和待推荐对象
的兴趣信息进行特征信息的提取和融合，以确定向待推荐对象推荐待推荐内容信息的概
率；推荐模块903可以用于根据向待推荐对象推荐待推荐内容信息的概率向待推荐对象推
荐待推荐内容信息。

[0184] 由于推荐装置900的各功能已在其对应的方法实施例中予以详细说明，本公开于此不再赘述。

[0185] 描述于本申请实施例中所涉及到的模块和/或子模块和/或单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的模块和/或子模块和/或单元也可以设
置在处理器中。其中，这些模块和/或子模块和/或单元的名称在某种情况下并不构成对该
模块和/或子模块和/或单元本身的限定。

[0186] 附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代
表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或用于
实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注
的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可
以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意
的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的
功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来
实现。

[0187] 此外，上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺
序。另外，也易于理解，这些处理可以是例如在模块中同步或异步执行的。

[0188] 图10示出了适于用来实现本公开实施例的的电子设备的结构示意图。需要说明的是，图10示出的电子设备1000仅是一个示例，不应对本公开实施例的功能和使用范围带来
任何限制。

[0189] 如图10所示，电子设备1000包括中央处理单元（CPU）1001，其可以根据存储在只读存储器（ROM）1002中的程序或者从储存部分1008加载到随机访问存储器（RAM）1003中的程
序而执行各种适当的动作和处理。在RAM 1003中，还存储有电子设备1000操作所需的各种
程序和数据。CPU 1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出（I/O）接
口1005也连接至总线1004。

[0190] 以下部件连接至I/O接口1005：包括键盘、鼠标等的输入部分1006；包括诸如阴极射线管（CRT）、液晶显示器（LCD）等以及扬声器等的输出部分1007；包括硬盘等的储存部分
1008；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经
由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至I/O接口1005。可拆卸介
质1011，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器1010上，以便
于从其上读出的计算机程序根据需要被安装入储存部分1008。

[0191] 特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读存储
介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样
的实施例中，该计算机程序可以通过通信部分1009从网络上被下载和安装，和/或从可拆卸
介质1010被安装。在该计算机程序被中央处理单元（CPU）1001执行时，执行本申请的系统中
限定的上述功能。

[0192] 需要说明的是，本公开所示的计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——
但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组
合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或导线的电连接、便
携式计算机磁盘、硬盘、随机访问存储器（RAM）、只读存储器（ROM）、可擦式可编程只读存储
器（EPROM或闪存）、光纤、便携式紧凑磁盘只读存储器（CD‑ROM）、光存储器件、磁存储器件、
或者上述的任意合适的组合。在本申请中，计算机可读存储介质可以是任何包含或存储程
序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本
申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，
其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限
于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可
读存储介质以外的任何计算机可读存储介质，该计算机可读存储介质可以发送、传播或者
传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储
介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等
等，或者上述的任意合适的组合。

[0193] 作为另一方面，本申请还提供了一种计算机可读存储介质，该计算机可读存储介质可以是上述实施例中描述的设备中所包含的；也可以是单独存在，而未装配入该设备中。
上述计算机可读存储介质承载有一个或者程序，当上述一个或者程序被一个该设备执行
时，使得该设备可实现功能包括：获取历史推荐样本信息、历史推荐对象的历史兴趣信息、
以及历史推荐对象针对历史推荐样本信息的样本标签；通过嵌入层对历史推荐样本信息和
历史兴趣信息分别进行向量化处理，以生成历史推荐样本隐向量和历史兴趣隐向量；通过
第一神经网络结构对历史推荐样本隐向量和历史兴趣隐向量进行特征信息的提取和融合，
以确定向历史推荐对象推荐历史推荐样本信息的样本推荐概率，以便根据样本推荐概率和
样本标签确定主损失函数的值；通过第二神经网络结构对历史推荐样本隐向量和历史兴趣
隐向量进行相似度确定处理，以确定历史推荐对象与历史推荐样本信息的相关性，以根据
相关性和样本标签确定辅助损失函数的值；根据主损失函数的值和辅助损失函数的值将推
荐模型训练为目标推荐模型。

[0194] 根据本申请的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算
机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使
得该计算机设备执行上述实施例的各种可选实现方式中提供的方法。

[0195] 通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，本公开实施
例的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储
介质（可以是CD‑ROM，U盘，移动硬盘等）中，包括若干指令用以使得一台计算设备（可以是个
人计算机、服务器、移动终端、或者智能设备等）执行根据本公开实施例的方法，例如图2、图
4、或图7的一个或所示的步骤。

[0196] 本领域技术人员在考虑说明书及实践在这里公开的公开后，将容易想到本公开的其他实施例。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或
者适应性变化遵循本公开的一般性原理并包括本公开未申请的本技术领域中的公知常识
或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要
求指出。

[0197] 应当理解的是，本公开并不限于这里已经示出的详细结构、附图方式或实现方法，相反，本公开意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。

推荐模型训练方法、推荐方法和相关设备转让专利

申请号 : CN202110683173.8

文献号 : CN113254785B

文献日 : 2021-10-08

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 张黄斌 , 赵冲 , 王丹磊

申请人 : 腾讯科技(深圳)有限公司

摘要 :

权利要求 :

说明书 :

推荐模型训练方法、推荐方法和相关设备

技术领域

背景技术

发明内容

附图说明

具体实施方式