内容推荐方法、装置和存储介质转让专利

申请号 : CN202110506935.7

文献号 : CN112989209B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 黄梓琪

申请人 : 腾讯科技(深圳)有限公司

摘要 :

一种内容推荐方法、装置和存储介质,方法包括:响应于内容推荐事件,获取待推荐的内容标签;基于预设标签关联关系获取与内容标签关联的关联内容标签;预设标签关联关系是基于历史内容序列对应的历史内容标签序列确定的,其中,历史内容序列是通过在由用户的历史内容浏览记录所构建的用户浏览记录图上进行游走得到,历史内容浏览记录用于确定用户浏览的历史内容以及历史内容被浏览的顺序;基于关联内容标签获取对应的目标内容,并对目标内容进行推荐。上述方法可挖掘用户潜在的兴趣点,提升推荐给用户内容的多样性。此外,预设标签关联关系是基于用户实际的历史内容浏览记录得到,利用该预设标签关联关系用于内容推荐,更符合用户内容浏览习惯。

权利要求 :

1.一种内容推荐方法,其特征在于,所述方法包括:响应于内容推荐事件,获取待推荐的内容标签,所述内容标签为终端当前所处页面对应的内容标签;

基于预设标签关联关系获取与所述内容标签关联的关联内容标签;所述预设标签关联关系是基于历史内容序列对应的历史内容标签序列确定的,其中,所述历史内容序列是通过在由用户的历史内容浏览记录所构建的用户浏览记录图上进行游走得到的,所述历史内容浏览记录用于确定所述用户浏览的历史内容以及所述历史内容被浏览的顺序;所述历史内容标签序列,为按照所述历史内容序列中各历史内容的顺序,将各历史内容各自对应的标签组成的对应的历史内容标签序列,其中,一个历史内容对应至少一个标签,在历史内容包括多个标签时,同一个历史内容的多个标签,在所述历史内容标签序列中存在先后顺序;

基于所述关联内容标签获取对应的目标内容,并对所述目标内容进行推荐。

2.根据权利要求1所述的内容推荐方法,其特征在于,所述预设标签关联关系的确定包括步骤:

获取历史内容浏览记录;

根据所述历史内容浏览记录中历史内容以及所述历史内容被浏览的顺序构建用户浏览记录图;

在所述用户浏览记录图中游走,得到所述历史内容序列;

获取所述历史内容序列中各历史内容对应的内容标签,按照所述历史内容序列中各历史内容的顺序,将各历史内容各自对应的内容标签组成对应的历史内容标签序列;

计算所述历史内容标签序列中各历史内容标签之间的相似度;

基于各所述内容标签之间的相似度,确定所述预设标签关联关系。

3.根据权利要求2所述的内容推荐方法,其特征在于,在所述获取历史内容浏览记录之后,在所述根据所述历史内容浏览记录中历史内容以及所述历史内容被浏览的顺序构建用户浏览记录图之前,还包括:

根据所述历史内容浏览记录,确定历史内容统计信息;所述历史内容统计信息包括以下至少一项:所述历史内容浏览记录对应的各用户的内容浏览次数、所述历史内容浏览记录中各内容的被浏览次数,或者所述历史内容浏览记录中各所述历史内容的用户操作标识;

根据所述历史内容统计信息对所述历史内容浏览记录进行过滤,得到有效历史内容浏览记录;

所述根据所述历史内容浏览记录构建用户浏览记录图,包括:根据所述有效历史内容浏览记录构建用户浏览记录图。

4.根据权利要求3所述的内容推荐方法,其特征在于,所述根据所述历史内容统计信息对所述历史内容浏览记录进行过滤,得到有效历史内容浏览记录,包括以下至少一种:将内容浏览次数超过预设浏览次数阈值的用户确定为浏览异常用户;过滤掉所述历史内容浏览记录中,所述浏览异常用户产生的目标历史内容浏览记录,得到有效历史内容浏览记录;或者,

将被浏览次数在预设被浏览次数范围之外的内容确定为异常内容;过滤掉所述历史内容浏览记录中的异常内容,得到有效历史内容浏览记录;或者,根据各所述历史内容的用户操作标识,确定所述历史内容浏览记录中的不感兴趣内容;过滤掉所述历史内容浏览记录中的不感兴趣内容,得到有效历史内容浏览记录。

5.根据权利要求2至4任意一项所述的内容推荐方法,其特征在于,所述计算所述历史内容标签序列中各历史内容标签之间的相似度,包括:基于所述历史内容标签序列对预设词向量模型进行训练,得到训练好的词向量模型;

根据所述训练好的词向量模型,输出各所述历史内容标签序列中各历史内容标签对应的标签向量;

根据标签向量计算各所述历史内容标签之间的相似度。

6.根据权利要求1至4任意一项所述的内容推荐方法,其特征在于,所述响应于内容推荐事件,获取对应的内容标签包括:在监测到内容推荐事件时,检测所述内容推荐事件对应的当前页面,所述当前页面为终端当前所处页面;

获取与所述当前页面对应的内容标签。

7.根据权利要求6所述的内容推荐方法,其特征在于:所述获取与所述当前页面对应的内容标签,包括:若所述当前页面为内容推荐首页,根据当前用户的用户画像得到与所述当前页面对应的内容标签;

所述基于所述关联内容标签获取对应的目标内容,并对所述目标内容进行推荐,包括:获取所述关联内容标签对应的多个目标内容,在所述内容推荐首页上对所述多个目标内容进行显示。

8.根据权利要求6所述的内容推荐方法,其特征在于:所述获取与所述当前页面对应的内容标签,包括:若所述当前页面为视频浮层页面,根据当前播放视频的视频标签得到与所述当前页面对应的视频标签;基于所述当前页面对应的视频标签得到所述当前页面对应的内容标签;

所述基于预设标签关联关系获取与所述内容标签关联的关联内容标签,包括:基于预设标签关联关系,获取所述视频标签的关联视频标签作为与所述内容标签关联的关联内容标签;

所述基于所述关联内容标签获取对应的目标内容,并对所述目标内容进行推荐,包括:获取所述关联视频标签对应的目标视频,将所述目标视频加入所述当前页面对应的视频播放序列;响应于基于所述当前页面输入的视频切换指令,基于所述视频播放序列获取下一视频进行播放。

9.一种内容推荐装置,其特征在于,所述装置包括:内容标签获取模块,用于响应于内容推荐事件,获取待推荐的内容标签,所述内容标签为终端当前所处页面对应的内容标签;

关联内容标签获取模块,用于基于预设标签关联关系获取与所述内容标签关联的关联内容标签;所述预设标签关联关系是基于历史内容序列对应的历史内容标签序列确定的,其中,所述历史内容序列是通过在由用户的历史内容浏览记录所构建的用户浏览记录图上进行游走得到的,所述历史内容浏览记录用于确定所述用户浏览的历史内容以及所述历史内容被浏览的顺序;所述历史内容标签序列,为按照所述历史内容序列中各历史内容的顺序,将各历史内容各自对应的标签组成的对应的历史内容标签序列,其中,一个历史内容对应至少一个标签,在历史内容包括多个标签时,同一个历史内容的多个标签,在所述历史内容标签序列中存在先后顺序;

推荐模块,用于基于所述关联内容标签获取对应的目标内容,并对所述目标内容进行推荐。

10.根据权利要求9所述的内容推荐装置,其特征在于,所述内容标签获取模块,包括:当前页面检测单元,用于在监测到内容推荐事件时,检测所述内容推荐事件对应的当前页面,所述当前页面为终端当前所处页面;

标签获取单元,用于获取与所述当前页面对应的内容标签。

11.根据权利要求9所述的内容推荐装置,其特征在于,所述装置还包括:预设标签关联关系确定模块,包括:

行为记录获取单元,用于获取历史内容浏览记录;

构图单元,用于根据所述历史内容浏览记录中历史内容以及所述历史内容被浏览的顺序构建用户浏览记录图;

游走单元,用于在所述用户浏览记录图中游走,得到所述历史内容序列;

标签序列生成单元,用于获取历所述史内容序列中各历史内容对应的内容标签,按照历史内容序列中各历史内容的顺序,将各历史内容各自对应的内容标签组成对应的历史内容标签序列;

相似度计算单元,计算所述历史内容标签序列中各历史内容标签之间的相似度;

关联关系生成单元,用于基于各所述内容标签之间的相似度,确定所述预设标签关联关系。

12.根据权利要求11所述的内容推荐装置,其特征在于,所述装置还包括统计模块和过滤模块:

所述统计模块,用于确定历史内容统计信息;所述历史内容统计信息包括以下至少一项:所述历史内容浏览记录对应的各用户的内容浏览次数、所述历史内容浏览记录中各内容的被浏览次数,或者所述历史内容浏览记录中各所述历史内容的用户操作标识;

所述过滤模块,用于根据所述历史内容统计信息对所述历史内容浏览记录进行过滤,得到有效历史内容浏览记录;

所述构图单元还用于:根据所述有效历史内容浏览记录构建用户浏览记录图。

13.根据权利要求12所述的内容推荐装置,其特征在于:所述过滤模块,还用于:将内容浏览次数超过预设浏览次数阈值的用户确定为浏览异常用户;过滤掉所述历史内容浏览记录中,所述浏览异常用户产生的目标历史内容浏览记录,得到有效历史内容浏览记录;或者,将被浏览次数在预设被浏览次数范围之外的内容确定为异常内容;过滤掉所述历史内容浏览记录中的异常内容,得到有效历史内容浏览记录;

或者,根据各所述历史内容的用户操作标识,确定所述历史内容浏览记录中的不感兴趣内容;过滤掉所述历史内容浏览记录中的不感兴趣内容,得到有效历史内容浏览记录。

14.根据权利要求11至13任意一项所述的内容推荐装置,其特征在于,所述相似度计算单元还包括:

模型训练子单元,用于基于所述历史内容标签序列对预设词向量模型进行训练,得到训练好的词向量模型;

向量转换子单元,用于根据所述训练好的词向量模型,输出各所述历史内容标签序列中各历史内容标签对应的标签向量;

相似度计算子单元,用于根据标签向量计算各所述历史内容标签之间的相似度。

15.根据权利要求10所述的内容推荐装置,其特征在于:所述标签获取单元,还用于:若所述当前页面为内容推荐首页,根据当前用户的用户画像得到与所述当前页面对应的内容标签;

所述推荐模块还用于:获取所述关联内容标签对应的多个目标内容,在所述内容推荐首页上对所述多个目标内容进行显示。

16.根据权利要求10所述的内容推荐装置,其特征在于:所述标签获取单元,还用于:若所述当前页面为视频浮层页面,根据当前播放视频的视频标签得到与所述当前页面对应的视频标签;基于所述当前页面对应的视频标签得到所述当前页面对应的内容标签;

所述关联内容标签获取模块还用于:基于预设标签关联关系,获取所述视频标签的关联视频标签作为与所述内容标签关联的关联内容标签;

所述推荐模块包括:视频队列更新单元,用于获取所述关联视频标签对应的目标视频,将所述目标视频加入所述当前页面对应的视频播放序列;视频切换模块,用于响应于基于所述当前页面输入的视频切换指令,基于所述视频播放序列获取下一视频进行播放。

17.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。

18.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。

说明书 :

内容推荐方法、装置和存储介质

技术领域

[0001] 本申请涉及计算机技术领域,特别是涉及一种内容推荐方法、装置、计算机设备和存储介质。

背景技术

[0002] 随着技术的发展,网络越来越发达,日常生活中也越来越多的多媒体数据应用软件,常见的有视频软件、新闻软件。视频发布者可以在视频软件中发布原创或转载视频,而
视频浏览者则可以在视频软件中浏览这些视频。为了提高视频浏览者的体验,如何为视频
浏览者用户推荐适合个人的视频是较为热门的研究话题。
[0003] 相关技术中,有不少视频推荐利用视频间的关联关系来训练视频推荐模型,将用户可能喜欢的视频输入训练好的视频推荐模型,即可输出相关的视频推荐给用户,然而基
于当下及未来的视频数据量的巨大的现实情况,而训练模型所用到的训练数据有限,视频
推荐局限于训练数据中包含的视频,当出现新的视频时,推荐模型无法推荐到这类新的视
频,随着时间推移通过这种方法推荐的视频会导致用户获取的视频越来越单一。

发明内容

[0004] 基于此,有必要针对上述技术问题,提供一种能够提高视频推荐准确率的新视频,推荐场景丰富的内容推荐方法、装置和存储介质。
[0005] 一种内容推荐方法,所述方法包括:
[0006] 响应于内容推荐事件,获取待推荐的内容标签;
[0007] 基于预设标签关联关系获取与所述内容标签关联的关联内容标签;所述预设标签关联关系是基于历史内容序列对应的历史内容标签序列确定的,其中,所述历史内容序列
是通过在由用户的历史内容浏览记录所构建的用户浏览记录图上进行游走得到的,所述历
史内容浏览记录用于确定用户浏览的历史内容以及所述历史内容被浏览的顺序;
[0008] 基于所述关联内容标签获取对应的目标内容,并对所述目标内容进行推荐。
[0009] 一种内容推荐装置,所述装置包括:
[0010] 内容标签获取模块,用于响应于内容推荐事件,获取待推荐的内容标签;
[0011] 关联内容标签获取模块,用于基于预设标签关联关系获取与所述内容标签关联的关联内容标签;所述预设标签关联关系是基于历史内容序列对应的历史内容标签序列确定
的,其中,所述历史内容序列是通过在由用户的历史内容浏览记录所构建的用户浏览记录
图上进行游走得到的,所述历史内容浏览记录用于确定用户浏览的历史内容以及所述历史
内容被浏览的顺序;
[0012] 推荐模块,用于基于所述关联内容标签获取对应的目标内容,并对所述目标内容进行推荐。
[0013] 一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0014] 响应于内容推荐事件,获取待推荐的内容标签;
[0015] 基于预设标签关联关系获取与所述内容标签关联的关联内容标签;所述预设标签关联关系是基于历史内容序列对应的历史内容标签序列确定的,其中,所述历史内容序列
是通过在由用户的历史内容浏览记录所构建的用户浏览记录图上进行游走得到的,所述历
史内容浏览记录用于确定用户浏览的历史内容以及所述历史内容被浏览的顺序;
[0016] 基于所述关联内容标签获取对应的目标内容,并对所述目标内容进行推荐。
[0017] 一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0018] 响应于内容推荐事件,获取待推荐的内容标签;
[0019] 基于预设标签关联关系获取与所述内容标签关联的关联内容标签;所述预设标签关联关系是基于历史内容序列对应的历史内容标签序列确定的,其中,所述历史内容序列
是通过在由用户的历史内容浏览记录所构建的用户浏览记录图上进行游走得到的,所述历
史内容浏览记录用于确定用户浏览的历史内容以及所述历史内容被浏览的顺序;
[0020] 基于所述关联内容标签获取对应的目标内容,并对所述目标内容进行推荐。
[0021] 一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中;计算机设备的处理器从计算机可
读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行以下步
骤:
[0022] 响应于内容推荐事件,获取待推荐的内容标签;
[0023] 基于预设标签关联关系获取与所述内容标签关联的关联内容标签;所述预设标签关联关系是基于历史内容序列对应的历史内容标签序列确定的,其中,所述历史内容序列
是通过在由用户的历史内容浏览记录所构建的用户浏览记录图上进行游走得到的,所述历
史内容浏览记录用于确定用户浏览的历史内容以及所述历史内容被浏览的顺序;
[0024] 基于所述关联内容标签获取对应的目标内容,并对所述目标内容进行推荐。
[0025] 上述内容推荐方法、装置和存储介质,响应于内容推荐事件,获取待推荐的内容标签;基于预设标签关联关系获取内容标签关联的关联内容标签;基于关联内容标签获取对
应的目标内容,并对目标内容进行推荐。其中,预设标签关联关系是根据历史内容序列对应
的历史内容标签序列确定的,历史内容序列是根据用户的历史内容浏览记录构建的用户浏
览记录图中游走得到,其中历史内容浏览记录用于确定用户浏览的历史内容以及历史内容
被浏览的顺序。上述方法,根据获取的内容标签为基础进行推荐,随着时间推移内容新增,
但新增的内容仍可以用原有的标签描述,从内容标签维度,根据历史内容浏览记录拟合历
史内容标签,可挖掘用户潜在的兴趣点,提升推荐给用户内容的多样性。此外,预设标签关
联关系是根据历史内容序列对应的历史内容标签序列确定的,而历史内容序列是根据用户
实际的历史内容浏览记录构建的浏览记录图中游走得到,根据该预设标签关联关系用于内
容推荐,可以为用户推荐更符合用户内容浏览习惯的内容。

附图说明

[0026] 图1为一个实施例中内容推荐方法的应用环境图;
[0027] 图2为一个实施例中内容推荐方法的流程示意图;
[0028] 图3(1)为一个具体实施例中视频推荐首页的示意图;
[0029] 图3(2)为一个具体实施例中的视频浮层页面示意图;
[0030] 图4为一个实施例中预设标签关联关系的确定步骤流程示意图;
[0031] 图5为一个具体实施例中具体实施例中构建内容标签序列的过程示意图;
[0032] 图6为一个实施例中计算历史内容标签序列中各历史内容标签之间的相似度的流程示意图;
[0033] 图7为一个实施例中响应于内容推荐事件,获取对应的内容标签的流程示意图;
[0034] 图8为另一个实施例中内容推荐方法的流程示意图;
[0035] 图9为另一个实施例中内容推荐方法的流程示意图;
[0036] 图10为一个具体实施例中内容推荐方法的流程示意图;
[0037] 图11为一个实施例中基于历史记录随机游走的构图方式;
[0038] 图12为一个具体实施例中应用内容推荐方法的效果示意图;
[0039] 图13为一个实施例中内容推荐装置的结构框图;
[0040] 图14为一个实施例中计算机设备的内部结构图。

具体实施方式

[0041] 为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不
用于限定本申请。
[0042] 本申请提供的内容推荐方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。服务器104监测到终端102中的内容推荐事件,获取待推荐
的内容标签;基于预设标签关联关系获取与内容标签关联的关联内容标签;基于关联内容
标签获取对应的目标内容,并对目标内容向终端102进行推荐。其中,预设标签关联关系是
根据历史内容序列对应的历史内容标签序列确定的,历史内容序列是根据用户的历史内容
浏览记录构建的用户浏览记录图中游走得到,其中历史内容浏览记录用于确定用户浏览的
历史内容以及历史内容被浏览的顺序。其中,终端102可以智能手机、平板电脑、笔记本电
脑、台式计算机、智能音箱、智能手表等,但并不局限于此,服务器104可以独立的物理服务
器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云
数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、
以及大数据和人工智能平台等基础云计算服务的云服务器。终端以及服务器可以通过有线
或无线通信方式进行直接或间接地连接,本申请在此不做限制。在一个实施例,上述服务器
也可以是区块链中的一个节点。
[0043] 云技术(Cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。
[0044] 云技术(Cloud technology)基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算
技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、
图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用,将来每个物品都有
可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将
会分开处理,各类行业数据皆需要强大的系统后盾支撑,只能通过云计算来实现。
[0045] 在本申请的实施例中,对于视频提取标签信息的过程中可能涉及到计算机视觉技术。计算机视觉技术(Computer Vision, CV)计算机视觉是一门研究如何使机器“看”的科
学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视
觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为
一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中
获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、
图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟
现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特
征识别技术。
[0046] 在另一些实施例中,上述内容推荐方法也可以仅涉及终端,终端在监测到内容推荐事件时,获取待推荐的内容标签,根据预设标签关联关系获取与内容标签关联的关联内
容标签,最后基于关联内容标签获取对应的目标内容推荐给终端用户。
[0047] 在一个实施例中,如图2所示,提供了一种内容推荐方法,以该方法应用于图1中的服务器为例进行说明,包括步骤S210至步骤S230。
[0048] 步骤S210,响应于内容推荐事件,获取待推荐的内容标签。
[0049] 其中,在检测到内容推荐事件发生时需要向用户推荐相应的内容。多媒体(Multimedia)是多种媒体的综合,一般包括文本,声音和图像等多种媒体形式。在一个实施
例中,内容包括多媒体内容,例如可以是音频、视频或者图文内容等。在一个具体实施例中,
检测到进入多媒体应用程序(如视频应用程序)首页,判定为检测到内容推荐事件;在另一
个实施例中,检测到进入应用程序的多媒体内容模块(如浏览器中用于浏览视频的视频模
块)时,判定为检测到内容推荐事件;在本实施例中,可以通过监测多媒体应用程序或者多
媒体模块的启动信号判断是否进入多媒体内容推荐首页,进而确定是否检测到多媒体的内
容推荐事件。
[0050] 在另一个实施例中,在检测到多媒体内容详情查看页面时,如视频详情查看页面/视频浮层页面,判定为检测到内容推荐事件,例如在视频应用首页选择并打开其中一个视
频查看详情,或者在新闻应用首页选择并打开其中一个新闻查看详情内容,等等;在本实施
例中,可以通过内容详情查看信号确定是否进入多媒体内容详情查看页面,进而确定是否
检测到内容推荐事件。
[0051] 其中,视频推荐首页中可以同时展示多个视频,在一个实施例中,视频推荐首页可以是视频应用、其它应用程序(如浏览器)的视频模块的首页,在这些首页面中通常同时显
示多个视频简介画面,用户在通过点击视频简介画面可以进入该视频的详情页面;在信息
流产品中,也叫主Feeds场景;如图3(1)所示为一个具体实施例中视频推荐首页的示意图;
视频浮层表示通过浮层的方式展示视频详情;在一个实施例中,用户通过点击首页展示的
视频简介画面,即进入视频浮层展示该视频的视频详情页面。信息流是一种可以滚动浏览
的内容流,可以出现在页面上的任何位置;视频浮层表示在信息流产品中,用户点击主
Feeds上的某个视频之后,进入视频播放页面,在该页面可以不停往下滑动并查看其他视
频,视频浮层就是指该视频播放页面;也称一拖三场景,如图3(2)所示,为一个具体实施例
中的视频浮层页面示意图。
[0052] 在另一个实施例中,在检测到用户发送的内容搜索请求时,判定为检测到内容推荐事件;例如用户通过搜索关键词查找视频、新闻的场景下,可以根据用户输入的搜索请求
向用户推荐相关视频、新闻;在本实施例中,可以通过检测是否检测到内容搜索请求判定是
否检测到内容推荐事件。在其他实施例中,也可以通过其它方式判定是否检测到内容推荐
事件。
[0053] 进一步地,在一个实施例中,内容为多媒体内容,多媒体内容可以是视频、图片、博客或者笔记等内容,多媒体内容标签表示多媒体内容所属的标签;以多媒体内容为视频为
例,多媒体内容标签可以表示视频所属的标签,例如视频内容相关的分类:历史、文学、动物
等等,又如视频的类型如搞笑、科普、教学等等。进一步地,视频标签可以是从视频信息中提
取;在一个实施例中,根据视频的描述信息(如视频标题)确定视频标签;通常在发布视频时
要求视频发布者对于所发布的视频设置主题、描述关键词等等,主题、关键词通常设置为与
视频相关的描述语句,因此可通过主题等视频描述信息确定视频标签。在另一个实施例中,
对视频中的画面、字幕、音频等信息进行识别,确定为视频标签;在实际情况中,还有一些视
频在视频画面中设置了字幕等信息,例如“**电影解说”、“**科普”、“蛋糕做法”等信息,通
过识别视频画面中的字幕信息可以确定该电影可能所属的类型;或者电影片段的画面中会
出现经典人物角色,通过识别这些经典人物角色可以确定该视频有可能与电影相关;或者
电影片段画面中出现经典台词,根据该经典台词片段可以确定该视频可能与电影有关,又
或者视频中音频中介绍了该视频主要是什么内容,由此也可以确定视频的关联信息,作为
视频标签。在另一个实施例中,还可以根据视频对应的评论信息中提取相关信息,并且基于
评论中提取的相关信息确定视频的类型,作为视频标签;现有的视频通常设置了评论区域,
浏览过的用户可以在评论区域发表评论,评论信息中可能涉及到与视频类型相关的信息,
可通过提取评论信息中字段并识别确定视频类型。在其它实施例中,也可以通过其它方式
确定视频标签。
[0054] 步骤S220,基于预设标签关联关系获取与内容标签关联的关联内容标签。
[0055] 在一个实施例中,预设标签关联关系是预先确定的,预设标签关联关系中存储了内容标签之间的相关关系;在一个实施例中,预设标签关联关系中存储了各内容标签之间
的相似度。在本实施例中,预设标签关联关系是基于历史内容序列确定。
[0056] 进一步地,历史内容序列根据用户的历史内容浏览记录确定。在一个实施例中,历史内容浏览记录表示收集的用户针对内容进行的相关浏览操作记录,例如对内容的阅读时
间或浏览时间、阅读次数或浏览次数、是否转发评论或者点赞、内容的浏览顺序等等。收集
大量用户的内容浏览记录,并根据用户的历史内容浏览记录生成对应的历史内容标签序
列。
[0057] 更进一步地,在一个实施例中,根据用户的历史内容浏览记录确定历史内容序列,包括:根据历史内容浏览记录中的浏览过的历史内容、以及历史内容的被浏览顺序构建用
户浏览记录图,从用户浏览记录图中游走得到历史内容序列。其中根据历史内容浏览记录
中的浏览过的历史内容、以及历史内容的被浏览顺序构建用户浏览记录图的具体步骤将在
后续实施例中详细描述,在此不再赘述。
[0058] 在一个实施例中,基于历史内容标签序列确定预设标签关联关系,可以通过任意一种方式实现;例如基于历史内容标签序列学习各内容标签之间的相似度,进而确定预设
标签关联关系。在其它实施例中,上述步骤均可通过其它方式实现。
[0059] 在一个实施例中,基于预设标签关联关系获取关联内容标签的数量为预设数目;进一步地,根据预设关联关系计算各内容标签与待推荐的内容标签之间的相似度,在获取
关联内容标签时,将相似度按照大小顺序进行排列,取相似度较大的前预设数目个内容标
签,作为本实施例中的关联内容标签。在另一个实施例中,基于预设标签关联关系获取关联
内容标签包括:获取相似度大于预设相似度阈值的各内容标签,作为本实施例中的关联内
容标签。在另一个实施例中,基于预设标签关联关系获取关联内容标签也可以是:从预设标
签关联关系的所有相似度中取相似度较大的前预设百分比数值对应的内容标签,作为本实
施例中的关联内容标签。可以理解地,在其它实施例中,获取关联内容标签也可以通过其它
形式实现。
[0060] 步骤S230,基于关联内容标签获取对应的目标内容,并进行推荐。
[0061] 在获取到关联内容标签之后,根据关联内容标签获取到对应的目标内容向用户进行推荐。在一个实施例中,基于关联内容标签获取目标内容,包括:获取标签为关联内容标
签的内容作为本实施例中的目标内容。内容均携带有各自对应的标签,如所属分类:历史、
文学、动物,或者搞笑、科普、教学等等,在得到关联内容标签之后,获取这些标签对应的内
容作为目标内容进行推荐。
[0062] 在另一个实施例中,进行内容推荐时,基于原始的内容标签和/或关联内容标签获取目标内容进行推荐。根据获取的内容标签或者与其关联的内容标签获取目标内容,都有
可能是用户感兴趣的内容。
[0063] 在一个实施例中,基于关联内容标签获取目标内容的数量可根据实际情况进行选择。如获取目标内容的数量设置为1、2、5或者10个等等。在另一个实施例中,基于关联内容
标签获取目标内容的数量可根据当前终端所处的场景确定,例如当前终端处于内容推荐首
页时,获取目标内容的数量为5;又如当前终端处于视频详情查看页面/视频浮层页面时,获
取目标内容的数量为1或者2,在其它实施例中获取目标内容的数量也可以通过其它方式确
定。
[0064] 进一步地,在一个实施例中,在获取到目标内容之后,将目标内容推送至终端的显示界面进行展示。
[0065] 上述内容推荐方法,响应于内容推荐事件,获取待推荐的内容标签;基于预设标签关联关系获取内容标签关联的关联内容标签;基于关联内容标签获取对应的目标内容,并
对目标内容进行推荐。其中,预设标签关联关系是根据历史内容序列对应的历史内容标签
序列确定的,历史内容序列是根据用户的历史内容浏览记录构建的用户浏览记录图中游走
得到,其中历史内容浏览记录用于确定用户浏览的历史内容以及历史内容被浏览的顺序。
上述方法,根据获取的内容标签为基础进行推荐,随着时间推移内容新增,但新增的内容仍
可以用原有的标签描述,从内容标签维度,根据历史内容浏览记录拟合历史内容标签,可挖
掘用户潜在的兴趣点,提升推荐给用户内容的多样性。此外,预设标签关联关系是根据历史
内容序列对应的历史内容标签序列确定的,而历史内容序列是根据用户实际的历史内容浏
览记录构建的浏览记录图中游走得到,利用该预设标签关联关系用于内容推荐,可以为用
户推荐更符合用户内容浏览习惯的内容。
[0066] 在一个实施例中,如图4所示,上述方法中的预设标签关联关系的确定包括步骤S410至步骤S460。
[0067] 步骤S410,获取历史内容浏览记录。
[0068] 历史内容浏览记录表示用户浏览内容的历史记录。在一个实施例中,用户的历史内容浏览记录包括用户在内容推荐首页点击的记录;例如内容推荐首页同时展示了多条可
能不同类型的内容简介信息,用户选择了其中的一个内容打开查看详情,则在用户的历史
内容浏览记录中添加从内容推荐首页打开查看这一内容的历史浏览记录。在另一个实施例
中,用户的历史内容浏览记录还包括:用户在视频浮层页面中从一个视频切换至另一个视
频的记录;例如用户当前正在视频浮层页面浏览某一个视频,并在这一视频界面中做出了
视频切换操作(如向上/向下/向左/向右滑动),根据视频切换操作终端将会在视频浮层页
面中为用户切换至另一个视频进行展示,则在用户的历史内容浏览记录中添加从当前视频
切换至另一视频的历史记录。在其它实施例中,历史内容浏览记录还可以包括其它形式的
内容浏览记录。
[0069] 其中,历史内容浏览记录与用户对应,获取历史内容浏览记录时,获取多个用户对应的历史内容浏览记录。在一个实施例中,历史内容浏览记录可以利用用户账号作为用户
标识进行获取。进一步地,在一个实施例中,用户的历史内容浏览记录可以从预设数据库中
获取。在一个实施例中,获取历史内容浏览记录包括获取三条以上的历史内容浏览记录。
[0070] 在一个实施例中,获取用户的历史内容浏览记录可以获取当前时刻的预设历史时间段内的历史内容浏览记录,例如可以获取过去1个月内、3个月内、半年内的历史内容浏览
记录;通过设定预设历史时间段,可以使得到或者更新的内容标签更加符合用户的最新的
内容浏览记录浏览习惯。
[0071] 步骤S420,根据历史内容浏览记录中历史内容以及历史内容被浏览的顺序构建用户浏览记录图。
[0072] 用户浏览记录图根据各用户的历史内容浏览记录构建得到。在一个实施例中,根据历史内容浏览记录中历史内容以及历史内容被浏览的顺序构建用户浏览记录图,包括:
将历史内容作为图中的节点,将历史内容与历史内容之间的被浏览顺序作为图中的节点之
间连接的边;对于多条历史内容浏览记录中的相同的被浏览顺序,在图中对应节点之间的
边增加权重;最终得到用户浏览记录图。
[0073] 步骤S430,在用户浏览记录图中游走,得到历史内容序列。
[0074] 历史内容序列表示由内容组成的序列;本实施例中,用户浏览记录图中是根据真实的用户内容浏览记录构建得到,将在构建得到的用户浏览记录图中游走,得到的内容序
列记为历史内容序列。在一个实施例中,在用户浏览记录图中随机游走,得到历史内容序
列。
[0075] 其中,假设网页之前通过超链接相互连接,互联网上的所有网页便构成了一张图。用户随机的打开一个网页,并通过超链接跳转到另一个网页。每当用户到达一个网页,他都
有两种选择,停留在当前网页或者通过继续访问其他网页。如果用户继续访问网页的概率
为d,那么用户停留在当前网页的概率便是(1‑d)。如果用户继续访问其他网页,则会以均匀
分布的方式随机访问当前网页指向的另一网页,这是一个随机游走的过程。在一个实施例
中,在构建得到的用户浏览记录图中随机游走得到历史内容序列可以通过任意一种方式实
现。
[0076] 步骤S440,基于历史内容序列中各历史内容对应的内容标签,获得对应的历史内容标签序列。
[0077] 其中,一个历史内容对应至少一个标签;在一个实施例中,一个历史内容可能对应包括一个标签或者多个标签。在本实施例中,在得到历史内容序列之后,获取历史内容序列
中各历史内容对应的标签,按照历史内容序列中各历史内容的顺序,将各历史内容各自对
应的标签组成对应的历史内容标签序列。
[0078] 如图5所示为一个具体实施例中获得内容标签序列的过程示意图。对于历史内容序列A→B,分别获取内容A 的标签Tag(A)={Taga1,Taga2, Taga3,Taga4},以及内容B的标签
Tag(B)={Tagb1,Tagb2},进一步地,基于历史内容序列生成对应的历史内容标签序列:Taga1
→Taga2→Taga3→Taga4→Tagb1→Tagb2。在一个实施例中,同一内容的不同内容标签的先后
顺序可以根据预设权重(例如越相关的标签对应的权重越高)得到,也可以分别将内容A和
内容B的各内容标签进行随机打乱之后进行组合得到标签序列。在其它实施例中,也可以通
过其它方式根据历史内容序列的内容标签,生成对应的历史内容标签序列。
[0079] 步骤S450,计算历史内容标签序列中各历史内容标签之间的相似度。
[0080] 在一个实施例中,计算内容标签之间的相似度包括:确定历史内容标签序列中各历史内容标签的标签向量,根据标签向量计算各历史内容标签之间的相似度。
[0081] 在一个实施例中,如图6所示,计算历史内容标签序列中各历史内容标签之间的相似度,包括步骤S451至步骤S453。
[0082] 步骤S451,基于历史内容标签序列对预设词向量模型进行训练,得到训练好的词向量模型。
[0083] 词向量(word embedding):词的向量表征;在一个具体实施例中,通过word2vec(词向量)中的Skip‑Gram对内容标签生成对应的标签向量Embedding。Word2Vec其实就是通
过学习文本来用词向量的方式表征词的语义信息,即通过一个嵌入空间使得语义上相似的
单词在该空间内距离很近。Embedding其实就是一个映射,将单词从原先所属的空间映射到
新的多维空间中,也就是把原先词所在空间嵌入到一个新的空间中去。
[0084] 其中,Word2Vec(Word to Vector)表示由词到向量的方法;Word2Vec的算法流程包括以下步骤:第一步,将one‑hot(独热)形式的词向量输入到单层神经网络中,其中输入
层的神经元结点个数应该和one‑hot形式的词向量维数相对应。比如,输入词是“夏天”,它
对应的one‑hot词向量[0,0,1],[0,0,1];那么,设置输入层的神经元个数是3。第二步,通过
神经网络中的映射层中的激活函数,计算目标单词与其他词汇的关联概率,其中在计算时,
使用了负采样(negative sampling)的方式来提高其训练速度和正确率;第三步,通过使用
随机梯度下降(SGD)的优化算法计算损失;第四步,通过反向传播算法将神经元的各个权重
和偏置进行更新。word2vec实质上是一种降维操作,将one‑hot形式的词向量转化为
word2vec形式。Skip‑Gram model是通过目标单词推测语境,在大规模的数据集中Skip‑
Gram model训练速度快。Skip‑Gram 的损失函数是通过将目标词汇的正例和负例使用二元
对数回归(Binary Logistic Regeression)计算概率并相加得到的。
[0085] 在其它实施例中,也可通过其他方式实现获得内容标签对应的标签向量。
[0086] 步骤S452,根据训练好的词向量模型,输出各历史内容标签序列中各历史内容标签对应的标签向量。
[0087] 训练好的词向量模型对于输入的内容标签,可以输出对应的词向量,即用向量的形式表示内容标签。
[0088] 步骤S453,根据标签向量计算各内容标签之间的相似度。
[0089] 在一个实施例中,根据对应标签向量计算内容标签之间的相似度,可采用任意一种方式实现,如余弦相似度、欧式距离、曼哈顿距离、皮尔逊相关系数等等方法。在其它实施
例中,根据标签向量计算内容标签之间的相似度也可以通过其它方式实现。
[0090] 本实施例中,利用训练好的词向量模型将内容标签转化为对应的标签向量,然后基于标签向量计算标签之间的相似度,然后基于标签之间的相似度确定预设标签关联关
系,在进行内容推荐时基于预设标签关联关系,推荐准确率高,效果好。且从内容标签的维
度拟合用户历史浏览记录,并利用历史浏览记录中得到的历史内容序列对应的历史内容标
签序列训练词向量模型,相较于利用内容本身之间的关系训练模型,内容标签数量比内容
本身的数量少,模型更容易收敛。且即便随着时间的推移内容数量新增量巨大,内容标签的
数量可能不增加或者增加很少,因此利用内容标签实现内容推荐,能够减少OOV(Out of 
Vocabulary,集外词)的问题,即便新增内容,也能利用预设标签关联关系和待推荐的内容
标签,获取相关联的内容标签对应的目标内容进行推荐。
[0091] 步骤S460,基于各内容标签之间的相似度,确定预设标签关联关系。
[0092] 在一个实施例中,基于各内容标签之间的相似度,确定预设标签关联关系,包括:针对每一个内容标签,分别取相似度较大的标签与内容标签对应存储。例如针对内容标签
tag1,可以取与tag1相似度较大的前预设数位内容标签,作为tag1的关联内容标签进行存
储;又如针对内容标签tag2,可以取与tag2相似度大于预设相似度阈值的内容标签作为
tag2的关联内容标签进行存储,进而得到各内容标签之间的预设标签关联关系。可以理解
地,在其它实施例中,也可以通过其它方式确定预设标签关联关系。
[0093] 进一步地,在一个实施例中,生成预设标签关联关系之后,可以每隔预定时间段对预设标签关联关系进行更新;其中,预定时间段可以根据实际情况进行设置。
[0094] 本实施例中,根据历史内容浏览记录构建用户浏览记录图,然后在用户浏览记录图中游走得到历史内容序列,进而得到对应的历史内容标签序列,最后基于内容标签序列
计算各内容标签之间的相似度,基于相似度得到预设标签关联关系;上述方法仅以实际的
用户浏览过的历史内容浏览记录生成预设标签关联关系,得到的预设标签关联关系更加贴
合用户真实的内容浏览习惯,在根据预设标签关联关系进行内容推荐时,得到待推荐的目
标内容更有可能符合用户的喜好,提高推荐准确率。
[0095] 进一步地,在一些实际情况中,用户在内容推荐首页中点击查看其中的一个内容详情,或者从视频浮层页面中的一个视频切换到另一个视频,有可能是用户的误操作,因此
在本实施例中,在得到历史内容浏览记录之后,还可以从其中过滤掉由于用户误操作导致
的行为记录。在另一些实际情况中,还有可能因为其它原因产生异常的记录,例如在指定时
间段内,同一用户对于同一个内容浏览次数超出对应的阈值,或者一个内容被浏览的次数
超出对应的阈值,表示这一内容可能存在异常,对于这类情况也需要进行过滤。
[0096] 在一个实施例中,在获取历史内容浏览记录之后,在根据历史内容浏览记录构建用户浏览记录图之前,还包括:根据历史内容浏览记录,确定历史内容统计信息;根据历史
内容统计信息对历史内容浏览记录进行过滤,得到有效历史内容浏览记录;进一步地,在本
实施例中,根据历史内容浏览记录构建用户浏览记录图,包括:根据有效历史内容浏览记录
构建用户浏览记录图。
[0097] 在一个实施例中,历史内容统计信息包括以下至少一项:历史内容浏览记录中各用户浏览内容的内容浏览次数、历史内容浏览记录中各内容的被浏览次数,或者历史内容
浏览记录中各内容的用户操作标识。
[0098] 其中,各用户的内容浏览次数表示一个用户浏览同一内容的次数。各内容的被浏览次数表示一个内容被多个用户浏览的总次数。各内容的用户操作标识表示用户对各内容
进行操作的标识;在一个实施例中,用户操作标识包括是否收藏操作、是否点赞操作、是否
评论操作或者是否转发操作等等的标识。
[0099] 进一步地,在一个实施例中,统计用户对一个内容浏览的次数还结合一次浏览行为中的浏览时长确定。例如,若浏览时长超出预设时长,用户对该内容的浏览次数+1,若浏
览时长未超过预设时长,用户对该内容的浏览次数不增加。同理统计一个内容的被浏览次
数也可以结合用户对该内容的浏览时长确定;例如若浏览时长超出预设时长,该内容被浏
览的次数+1,反之则不增加被浏览次数。
[0100] 在本实施例中,有效历史内容浏览记录表示根据统计信息对历史内容浏览记录进行过滤之后,留下来的历史内容浏览记录,过滤后的行为记录中过滤掉了可能存在浏览异
常行为的异常用户、被浏览次数异常的异常视频和用户可能不感兴趣的视频,保留的行为
记录更加符合用户的内容浏览习惯。
[0101] 此外,对于用户的浏览行为和内容被浏览的次数,若用户的浏览次数和内容的被浏览次数处于正常范围之外,则可能用户或者内容可能存在异常,因此结合用户对内容的
浏览次数,以及内容的被浏览次数进行过滤,可减少异常数据对后续步骤的影响。
[0102] 在一个实施例中,用户对内容的操作标识可以表征用户是否对该内容是否感兴趣;例如在一个具体实施例中,若内容的操作标识中包含用户对该内容进行转发、评论、点
赞或者收藏的操作标识,确定用户对该内容感兴趣;若内容的操作标识中包含用户对该内
容选择了“不喜欢”的操作标识,确定用户对该内容不感兴趣。
[0103] 进一步地,根据统计信息过滤掉历史内容浏览记录中的异常数据,得到剩余的历史内容浏览记录,记为有效历史内容浏览记录,后续基于有效历史内容浏览记录构建用户
浏览记录图,可得到更加准确的用户浏览记录图。
[0104] 进一步地,在一个实施例中,根据历史内容统计信息对历史内容浏览记录进行过滤,得到有效历史内容浏览记录,包括:将内容浏览次数超过预设浏览次数阈值的用户确定
为浏览异常用户;过滤掉历史内容浏览记录中,浏览异常用户产生的目标历史内容浏览记
录,得到有效历史内容浏览记录。
[0105] 在本实施例中,利用预设浏览次数阈值和用户的浏览次数判断用户是否出现浏览行为异常,将内容浏览次数超过预设浏览次数阈值的用户确定为浏览异常用户,将异常用
户产生的历史内容浏览记录过滤掉,剩余的确定为有效历史内容浏览记录。其中,预设浏览
次数阈值可根据实际情况进行设置,例如可设置为1000次、2000次等等。以内容为视频为
例,用户的内容浏览次数也可以以用户频次表示,用户频次表示在指定时间段内(如12个小
时或者24小时)用户有点击或者观看该视频行为的次数。例如,用户在12点从视频推荐首页
观看了视频,并进入了视频浮层观看了其他视频;而后14点时这个用户又进行了从视频推
荐首页到视频浮层观看视频的操作;16点再次有这个行为;且这个用户在指定时间段内有
这三次这样的动作,那么用户频次为3。
[0106] 或者,在另一个实施例中,根据历史内容统计信息对历史内容浏览记录进行过滤,得到有效历史内容浏览记录,包括:将被浏览次数在预设被浏览次数范围之外的内容确定
为异常内容;过滤掉历史内容浏览记录中的异常内容,得到有效历史内容浏览记录。
[0107] 在本实施例中,利用预设被浏览次数范围和内容的被浏览次数判断内容是否出现异常,将被浏览次数在预设被浏览次数范围之外的内容确定为异常内容,过滤掉历史内容
浏览记录中异常内容,剩余的确定为有效历史内容浏览记录。以内容为视频为例,内容的被
浏览次数也即视频频次,视频频次是指在统计时间内,单个视频被点击或者观看的次数。
[0108] 其中,预设被浏览次数范围可根据实际情况进行设置,例如在一个具体实施例中将预设被浏览次数范围设置为5次 5000次,将被浏览次数小于5次或者大于5000次的内容
~
确定为异常内容;在其它实施例中,也可以设置为其它数值范围。在一个实施例中,过高频
次的内容作为样本训练词向量模型,对于模型的训练效果产生影响,而过低频次的内容作
为样本训练词向量模型,对于模型的训练参考价值不大,因此在本实施例中,利用预设被浏
览次数范围对内容进行过滤,过滤后的内容作为样本训练词向量,可得到更好的训练效果。
[0109] 或者,在另一个实施例中,根据历史内容统计信息对历史内容浏览记录进行过滤,得到有效历史内容浏览记录,包括:根据各内容的用户操作标识,确定历史内容浏览记录的
不感兴趣内容;过滤掉历史内容浏览记录中的不感兴趣内容,得到有效历史内容浏览记录。
[0110] 在本实施例中,利用各内容的用户操作标识判断内容是否为用户感兴趣的内容;在一个具体实施例中,将包含选择“不喜欢”的操作标识的内容确定为用户的不感兴趣内
容,在该用户的历史内容浏览记录中将这一内容过滤掉,如用户甲对应的历史内容浏览记
录,假设为B→A→C→D…,针对内容A包含用户甲选择“不喜欢”的操作标识,将用户甲的历
史内容浏览记录中内容A过滤,得到用户甲的有效历史内容浏览记录:B→C→D…。
[0111] 在另一个实施例中,可同时利用上述方法对历史内容浏览记录进行过滤,得到有效历史内容浏览记录。
[0112] 在另一个实施例中,以内容为视频为例,在获取历史内容浏览记录之后,在根据历史内容浏览记录构建用户浏览记录图之前,还包括:读取历史内容浏览记录中各内容的平
均被播放时长和完播率,过滤历史内容浏览记录中平均被播放时长小于预设时长阈值,或
者完播率小于预设比例阈值的内容,使保留的内容浏览记录更加符合用户的内容浏览习
惯。
[0113] 其中,视频的播放时长表示该视频被播放的时长,完播率表示该视频被完整播放的次数与被播放的次数的比例;在一个实施例中,完播率较低的视频用户可能不感兴趣,如
一个视频被播放的次数为20次,其中根据完播率确定仅有1次被完整播放,将历史内容浏览
记录中的该视频过滤。进一步地,对于一个时长为3分钟的历史视频,播放时长仅1 5秒(可
~
根据视频总时长自行设定),可能表示用户对该视频并不感兴趣,在过滤操作时,可以将该
视频过滤掉。
[0114] 其中,对于播放时长和完播率可以设置对应的预设阈值,根据对应的预设阈值判断是否满足对应的条件,进而判断用户是否对该视频感兴趣。例如播放时长超过视频时长
的80%判定为用户对视频感兴趣,等等。
[0115] 本实施例中,基于历史内容统计信息将历史内容浏览记录中用户可能不感兴趣的内容过滤掉,可减少历史内容浏览记录中用户误操作,或者不感兴趣的内容对内容推荐的
影响。
[0116] 在一个实施例中,如图7所示,响应于内容推荐事件,获取对应的内容标签,包括步骤S211和步骤S212。其中,步骤S211,在监测到内容推荐事件时,检测内容推荐事件对应的
当前页面;步骤S212,获取与当前页面对应的内容标签。
[0117] 其中,内容推荐事件对应的当前页面,也即终端当前所处页面。例如在一个实施例中,检测到多媒体内容应用程序或者多媒体内容模块的启动信号,确定当前终端所处页面
为内容推荐首页;又如检测到内容详情查看信号,确定当前所处页面为内容详情页面;等
等。
[0118] 进一步地,在一个实施例中,如图8所示,获取与当前页面对应的内容标签,包括步骤S810:若当前页面为内容推荐首页,根据当前用户的用户画像得到与当前页面对应的内
容标签。在本实施例中,基于关联内容标签获取对应的目标内容,并进行推荐,包括步骤
S820:获取关联内容标签对应的多个目标内容,在内容推荐首页上对多个目标内容进行显
示。
[0119] 其中,用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。在实际操作的过程中往往会以最为浅
显和贴近生活的话语将用户的属性、行为与期待的数据转化联结起来。作为实际用户的虚
拟代表,用户画像所形成的用户角色并不是脱离产品和市场之外所构建出来的,形成的用
户角色需要有代表性能代表产品的主要受众和目标群体。在本实施例中,当终端当前处于
内容推荐首页时,获取用户画像,并基于用户画像进行内容推荐。进一步地,本实施例中的
用户画像包括内容标签构成的画像。通过用户画像可以获知用户的偏好:用户通常喜欢浏
览哪些类型的内容,不喜欢浏览哪些类型的内容;例如用户通常对科普、体育、新闻等类型
的内容较为感兴趣,而对于娱乐八卦、影视介绍等类型的内容不感兴趣。
[0120] 在一个实施例中,用户画像可以通过用户历史内容的浏览记录生成。进一步地,在一个具体实施例中,根据用户的历史内容的浏览记录,分别读取其中各内容的浏览次数、浏
览时长等浏览信息,基于浏览次数、浏览时长等浏览信息进行过滤,得到用户的感兴趣内容
集合和不感兴趣内容集合;进一步地,基于用户的感兴趣内容集合中各内容的标签,生成用
户的感兴趣内容标签,根据不感兴趣视频集合中各视频的标签,生成用户的不感兴趣内容
标签,进而得到用户画像。在其它实施例中,用户画像也可以通过其它方式实现。
[0121] 在一个实施例中,内容推荐首页表示内容应用程序首页,或者应用程序的内容模块首页;在内容推荐首页通常显示多条内容的简介信息,用户可在内容推荐首页中选择一
条内容打开查看详情。
[0122] 其中,当前用户表示终端当前登录的用户账号对应的用户。进一步地,根据当前用户的用户画像得到与当前页面对应的内容标签,包括:根据用户画像中用户感兴趣的内容
标签作为本实施例中待推荐的内容标签。在一个实施例中,当前页面为内容推荐首页,与当
前页面对应的内容标签的数量包括两个以上;内容推荐首页的内容标签包括两个以上,可
以为用户在内容推荐首页中推荐更加丰富的内容。
[0123] 进一步地,在获取到当前用户的用户画像并确定当前页面对应的内容标签之后,获取内容标签对应的多个目标内容,将目标内容显示在内容推荐首页。其中,获取的目标内
容的数量可以根据实际情况进行设定,如可以设置为获取5个、10个目标内容显示在内容推
荐首页。
[0124] 可以理解地,在获取到关联内容标签对应的多个目标内容之后,在内容推荐首页上对多个目标内容进行显示,在内容推荐首页中显示目标内容,由于内容推荐首页的内容
容量有限,因此可以仅在内容推荐首页显示部分目标内容。其中,显示内容的数量可以通过
任意一种方式实现,例如结合内容的简介信息所占画面大小与内容推荐首页大小确定,等
等。在另一个实施例中,也可以在内容推荐首页中显示固定数量的目标内容。
[0125] 在另一个实施例中,如图9所示,获取与当前页面对应的内容标签,包括步骤S910至步骤S940。
[0126] 其中,步骤S910:若当前页面为视频浮层页面,根据当前播放视频的视频标签得到与当前页面对应的视频标签;基于当前页面对应的视频标签得到当前页面对应的内容标
签。
[0127] 在本实施例中,基于预设标签关联关系获取与内容标签关联的关联内容标签,包括步骤S920:基于预设标签关联关系,获取视频标签的关联视频标签作为与内容标签关联
的关联内容标签。
[0128] 在本实施例中,基于关联内容标签获取对应的目标内容,并进行推荐,包括步骤S930:获取关联视频标签对应的目标视频,将目标视频加入当前页面对应的视频播放序列。
[0129] 在一个实施例中,视频浮层页面表示内容为视频时,视频的详细信息展示页面,通常用户在视频推荐首页选择一个视频打开,则进入视频浮层页面。
[0130] 当前播放视频表示的是在视频浮层中当前播放的视频,根据当前播放视频的视频标签得到与当前页面对应的视频标签包括:获取当前播放视频的视频标签作为当前页面对
应的视频标签;本实施例中,内容标签包括视频标签。其中,当前播放视频的视频标签可能
只有一个,也可能包括多个。进一步地,在本实施例中,获取关联内容标签包括获取关联视
频标签。
[0131] 在获取到关联视频标签之后,可以获取关联视频标签对应的视频,在本实施例中记为目标视频;进一步地,在本实施例中,推荐目标视频时,将目标视频加入视频播放队列;
例如在一个实施例中,将目标视频作为当前播放视频的下一视频加入视频播放队列。视频
播放队列表示由当前播放视频和待播放的视频组成的队列。
[0132] 步骤S940,响应于基于当前页面输入的视频切换指令,基于视频播放序列获取下一视频进行播放。
[0133] 视频切换指令用于指示在当前页面中切换当前播放的视频。在一个实施例中,常见的视频切换指令包括向上/向下/向左/向右滑动等预设操作;在另一个实施例中,视频切
换指令也可以是用户通过语音输入。在其它实施例中,也可以通过其它方式确定在当前页
面检测到视频切换指令。
[0134] 在本实施例中,当终端当前处于视频浮层页面时,若在视频浮层页面中检测到视频切换指令(如向上/向下/向左/向右滑动操作),将当前播放的视频切换至视频播放队列
中的下一视频;由上述步骤可知,将获取的目标视频作为下一视频加入视频播放队列,因此
在检测到用户在当前页面输入的视频切换指令时,在视频浮层页面中将当前显示的内容由
当前播放视频切换至显示目标视频。
[0135] 在一个实施例中,在获取到当前播放视频的视频标签,作为当前页面对应的视频标签,获取视频标签对应的多个目标视频,作为相邻页面的视频进行推荐。本实施例中,获
取的目标视频的数量可以根据实际情况进行设定,如可以设置为获取1个或者2个以上,设
置为获取1个目标视频时,将目标视频作为下一视频加入视频播放队列,设置为获取2个以
上目标视频时,将目标视频依次加入视频播放队列,目标视频加入视频播放队列中的顺序
可以是随机顺序。
[0136] 进一步地,当前播放视频的视频标签可以通过任意一种方式读取,在一个实施例中,根据当前播放视频的视频信息中提取当前播放视频的视频标签;其中,视频信息可以包
括主题、视频画面、字幕、音频、视频关联的评论信息等等。
[0137] 在本实施例中,若在监测到内容推荐事件时,终端当前所处的页面为视频浮层页面,此时根据视频浮层页面中当前播放视频的视频标签,获取关联视频标签,再基于关联视
频标签获取对应的目标视频进行推荐;用户在视频推荐首页选择并打开查看详情的视频,
很有可能是用户感兴趣的视频,因此在该场景下,直接根据当前播放的该视频的视频标签
推荐关联的标签对应的目标视频,可以召回更加符合用户喜好的视频,提高内容推荐的准
确率。
[0138] 本申请还提供一种应用场景,该应用场景应用上述的内容推荐方法。具体地,如图10所示,以内容为视频为例,该内容推荐方法在该应用场景的应用如下,主要包括在视频推
荐首页和视频浮层页面两种场景进行视频推荐,该方法包括以下步骤:
[0139] ①收集用户的视频浏览信息,生成历史视频浏览记录:分析主Feeds的(视频推荐首页)视频到浮层页面视频的平均播放时长和完播率,收集并处理主feeds到浮层视频的历
史视频序列(对应上述历史内容序列):滤去平均播放时长和完播率过低的视频(低于对应
阈值的视频,即用户大概率不感兴趣的视频)后,组成首视频‑尾视频对;首视频‑尾视频对
可以包括主feeds视频‑浮层视频对。例如用户在主feeds场景选择一个视频A,打开查看视
频A的详情,跳转到视频浮层页面展示视频A的详细内容,然后用户在视频浮层中切换到视
频B查看详情,再切换到视频C查看详情,若视频A、B和C的平均播放时长和完播率均大于对
应阈值,则经过过滤之后,生成的首视频→尾视频对包括:A→B→C。又如其中的视频B的完
播率小于对应阈值,过滤之后得到首视频→尾视频对包括:A→C。
[0140] ②根据①中过滤后得到的历史视频序列,统计针对每一个视频的用户频次和每一个视频被浏览的视频频次。
[0141] ③过滤过热用户、低频和高频视频,对过滤后的历史视频序列构建用户视频行为记录图,并在用户视频行为记录图中随机游走,得到历史视频序列。其中,过滤过热的用户,
就是过滤观看行为过多的用户。在一个具体实施例中,用户频次高于5000定义为过热用户;
同理,视频频次低于5(可自定义)的定义为低频视频;视频频次高于5000(可自定义)的定义
为高频视频。
[0142] 传统的构图方式中,对于第一个视频A,有视频序列“AB”、“AC”、“AD”、“AE”,对将这些视频构成视频集合,对集合内的视频两两构边成图后,随机游走生成序列。但这种构图方
式会使最终生成的关联标签过于发散。在本申请的实施例中只对原始的视频序列进行构图
游走,这样最终生成的标签之间实际关联度较强,发散合理,如图11所示。
[0143] ④拉取随机游走得到的视频序列中各历史视频对应的标签信息。
[0144] ⑤根据③构图游走后的历史视频序列和④中各历史视频对应的标签集合,将历史视频序列映射为相应的历史视频标签序列(对应上述历史内容标签序列),组成tag 
document(标签文档)。
[0145] ⑥最后将生成的标签序列通过嵌入式学习,如word2vec中的Skip‑Gram,生成最终的标签Embedding。在其它实施例中也可以利用其他方式将标签序列中的视频标签转换为
对应的标签向量。
[0146] ⑦在主Feeds应用场景时,获取用户画像中的多个视频标签作为输入,获取用户画像中的视频标签作为主feeds页面的视频标签,获取用户画像中视频标签的关联视频标签
集合,根据关联视频标签集合获取对应的目标视频,在主Feeds页面中为用户推荐目标视
频;在其它实施例中,也可以获取关联视频标签集合对应的目标图文、目标博客等内容进行
推荐。在视频浮层页面的一拖三场景,用户点击主Feeds的视频后,页面跳转到视频浮层页
面展示视频详情,获取用户点击的主Feeds视频(视频浮层页面的当前播放视频)的视频标
签作为输入,获取主feeds视频的视频标签的关联视频标签集合,并根据关联视频标签集合
获取对应的目标视频,进行推荐召回,在一拖三场景中上为用户提供推荐视频内容。
[0147] 在一个具体实施例中,将上述方法应用与QQ浏览器中,效果如图12所示:得到的在QQ浏览器主Feeds上线,大盘总点击次数+0.21%,人均消费+0.18%。其中单策略提升明显,合
计效率+12.72%, 合计点击PV+21.86%, 主feeds效率11.72%,feeds点击PV+22.04%。
[0148] 其中,效率可以理解成“消费”,如使用QQ浏览器,效率越高,表示用户在QQ浏览器上使用的时长/点击等消费行为越多,同时证明给用户推荐的视频是符合用户兴趣的;与此
类似地,用户使用浏览器的时长就越多,证明上述方法进行推荐的视频的准确率越好;点击
PV(page view,页面浏览量),用户点击一次页面算1次pv,同样可以反映上述内容推荐方法
的在实际应用中的好坏,PV值越高表示效果越好。
[0149] 上述内容推荐方法,通过分析主Feeds视频到浮层视频的播放时长和完播率等浏览信息,收集用户观看视频序列的行为信息,通过GraphEmbedding方法挖掘视频标签之间
的关系,并得到训练好的词向量模型,以及训练好的词向量模型输出的视频标签之间的相
似度,进而根据各视频标签之间的相似度生成预设标签关联关系。在主Feeds页面、视频一
拖三等页面中,获取到当前页面对应的视频标签,基于预设标签关联关系获取视频标签关
联的关联视频标签,基于关联视频标签获取目标视频进行推荐召回中,帮助用户拓展视野,
提升推荐给用户内容的多样性。
[0150] 应该理解的是,虽然上述实施例中所涉及的各流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确
的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,
上述实施例中所涉及的各流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这
些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤
或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或
者阶段的至少一部分轮流或者交替地执行。
[0151] 在一个实施例中,如图13所示,提供了一种内容推荐装置,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:内容标签获
取模块1310、关联内容标签获取模块1320和推荐模块1330,其中:
[0152] 内容标签获取模块1310,用于响应于内容推荐事件,获取待推荐的内容标签;
[0153] 关联内容标签获取模块1320,用于基于预设标签关联关系获取与内容标签关联的关联内容标签;预设标签关联关系是基于历史内容序列对应的历史内容标签序列确定的,
其中,历史内容序列是通过在由用户的历史内容浏览记录所构建的用户浏览记录图上进行
游走得到的,历史内容浏览记录用于确定用户浏览的历史内容以及历史内容被浏览的顺
序;
[0154] 推荐模块1330,用于基于关联内容标签获取对应的目标内容,并对目标内容进行推荐。
[0155] 上述内容推荐装置,响应于内容推荐事件,获取待推荐的内容标签;基于预设标签关联关系获取内容标签关联的关联内容标签;基于关联内容标签获取对应的目标内容,并
对目标内容进行推荐。其中,预设标签关联关系是根据历史内容序列对应的历史内容标签
序列确定的,历史内容序列是根据用户的历史内容浏览记录构建的用户浏览记录图中游走
得到,其中历史内容浏览记录用于确定用户浏览的历史内容以及历史内容被浏览的顺序。
上述方法,根据获取的内容标签为基础进行推荐,随着时间推移内容新增,但新增的内容仍
可以用原有的标签描述,从内容标签维度,根据历史内容浏览记录拟合历史内容标签,可挖
掘用户潜在的兴趣点,提升推荐给用户内容的多样性。此外,预设标签关联关系是根据历史
内容序列对应的历史内容标签序列确定的,而历史内容序列是根据用户实际的历史内容浏
览记录构建的浏览记录图中游走得到,利用该预设标签关联关系用于内容推荐,可以为用
户推荐更符合用户内容浏览习惯的内容。
[0156] 在一个实施例中,上述装置的内容标签获取模块1310,包括:当前页面检测单元,用于在监测到内容推荐事件时,检测内容推荐事件对应的当前页面;标签获取单元,用于获
取与当前页面对应的内容标签。
[0157] 在一个实施例中,上述装置的标签获取单元,还用于:若当前页面为内容推荐首页,根据当前用户的用户画像得到与当前页面对应的内容标签;在本实施例中,上述推荐模
块1330还用于:获取关联内容标签对应的多个目标内容,在内容推荐首页上对多个目标内
容进行显示。
[0158] 在一个实施例中,上述装置的标签获取单元,还用于:若当前页面为视频浮层页面,根据当前播放视频的视频标签得到与当前页面对应的视频标签;本实施例中,基于当前
页面对应的视频标签得到当前页面对应的内容标签;在本实施例中,关联内容标签获取模
块1320还用于基于预设标签关联关系,获取视频标签的关联视频标签作为与内容标签关联
的关联内容标签;在本实施例中,上述推荐模块1330包括:视频队列更新单元,用于获取关
联视频标签对应的目标视频,将目标视频加入所述当前页面对应的视频播放序列;视频切
换模块,用于响应于基于当前页面输入的视频切换指令,基于所述视频播放序列获取下一
视频进行播放。
[0159] 在一个实施例中,上述装置还包括:预设标签关联关系确定模块,包括:
[0160] 行为记录获取单元,用于获取历史内容浏览记录;构图单元,用于根据历史内容浏览记录中历史内容以及历史内容被浏览的顺序构建用户浏览记录图;游走单元,用于在用
户浏览记录图中游走,得到历史内容序列;标签序列生成单元,用于基于历史内容序列中各
历史内容对应的内容标签,获得对应的历史内容标签序列;相似度计算单元,用于计算历史
内容标签序列中各历史内容标签之间的相似度;关联关系生成单元,用于基于各内容标签
之间的相似度,确定预设标签关联关系。
[0161] 在一个实施例中,上述装置还包括:统计模块,用于根据历史内容浏览记录,确定历史内容统计信息;历史内容统计信息包括以下至少一项:历史内容浏览记录对应的各用
户的内容浏览次数、历史内容浏览记录中各内容的被浏览次数,或者历史内容浏览记录中
各历史内容的用户操作标识;
[0162] 过滤模块,用于根据历史内容统计信息对历史内容浏览记录进行过滤,得到有效历史内容浏览记录;
[0163] 在本实施例中,上述装置的构图单元,还用于:根据有效历史内容浏览记录构建用户浏览记录图。
[0164] 在一个实施例中,上述装置的过滤模块,还用于将内容浏览次数超过预设浏览次数阈值的用户确定为浏览异常用户;过滤掉历史内容浏览记录中,浏览异常用户产生的目
标历史内容浏览记录,得到有效历史内容浏览记录;或者,将被浏览次数在预设被浏览次数
范围之外的内容确定为异常内容;过滤掉历史内容浏览记录中的异常内容,得到有效历史
内容浏览记录;或者,根据各内容的用户操作标识,确定历史内容浏览记录的不感兴趣内
容;过滤掉历史内容浏览记录中的不感兴趣内容,得到有效历史内容浏览记录。
[0165] 在一个实施例中,上述装置的相似度计算单元还包括:模型训练子单元,用于基于历史内容标签序列对预设词向量模型进行训练,得到训练好的词向量模型;向量转换子单
元,用于根据训练好的词向量模型,输出各历史内容标签序列中各历史内容标签对应的标
签向量;相似度计算子单元,用于根据标签向量计算各历史内容标签之间的相似度。
[0166] 关于内容推荐装置的具体实施例可以参见上文中对于内容推荐方法的实施例,在此不再赘述。上述内容推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实
现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形
式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0167] 在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图14所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。
其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易
失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该
内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备
的数据库用于存储用户标签数据。该计算机设备的网络接口用于与外部的终端通过网络连
接通信。该计算机程序被处理器执行时以实现一种内容推荐方法。
[0168] 本领域技术人员可以理解,图14中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设
备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0169] 在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
[0170] 在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0171] 在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备
的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计
算机设备执行上述各方法实施例中的步骤。
[0172] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读
取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申
请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括
非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read‑Only 
Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器
(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种
形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存
储器(Dynamic Random Access Memory,DRAM)等。
[0173] 以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛
盾,都应当认为是本说明书记载的范围。
[0174] 以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在
不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。
因此,本申请专利的保护范围应以所附权利要求为准。