音视频数据的推荐方法、系统及服务器和存储介质转让专利

申请号 : CN201811488442.X

文献号 : CN109783656B

文献日 : 2020-11-06

本公开是关于一种音视频数据的推荐方法、系统及服务器和存储介质，其中，所述方法包括：获取用户的收敛度信息，所述收敛度信息用于表示用户的兴趣信息收集的充分程度；根据所述收敛度信息和预设的第一对应关系确定与所述收敛度信息对应层次的目标聚类结果，所述目标聚类结果属于预先对音视频数据进行聚类分析得到的多个层次的聚类结果，每个层次的聚类结果包括一个或多个聚类集合，每个聚类集合包括多个音视频数据；在所述目标聚类结果中选择目标音视频数据；将所述目标音视频数据推荐给所述用户。本公开利用表示用户的兴趣信息收集的充分程度的收敛度信息确定目标聚类结果，使得最终推荐的目标音视频数据更符合用户的兴趣爱好，推荐效果好。

1.一种音视频数据的推荐方法，其特征在于，包括：获取用户的收敛度信息，所述收敛度信息用于表示用户的兴趣信息收集的充分程度；

根据所述收敛度信息和预设的第一对应关系确定与所述收敛度信息对应层次的目标聚类结果，所述目标聚类结果属于预先对音视频数据进行聚类分析得到的多个层次的聚类结果，每个层次的聚类结果包括一个或多个聚类集合，每个聚类集合包括多个音视频数据；

在所述目标聚类结果中选择目标音视频数据；

将所述目标音视频数据推荐给所述用户；

其中，所述获取用户的收敛度信息的步骤，包括：

根据所述用户的行为数据的数量和预设的第二对应关系确定所述用户的收敛度信息；

或，按照预先学习得到的预测模型和所述行为数据确定所述收敛度信息；

其中，所述行为数据至少包括以下之一：所述用户在音视频数据的应用程序中，对音视频数据的浏览数据、播放数据、点赞数据、评论数据，以及，所述用户启动、登录所述应用程序的数据。

2.根据权利要求1所述的音视频数据的推荐方法，其特征在于，所述在所述目标聚类结果中选择目标音视频数据的步骤，包括：在所述目标聚类结果中选择满足第一预设条件的多个目标聚类集合；

针对每个所述目标聚类集合，选择满足第二预设条件的多个候选音视频数据；

对多个所述候选音视频数据进行排序；

将每个所述目标聚类集合中排序在前的第一预设数量的所述候选音视频数据确定为所述目标音视频数据。

3.根据权利要求2所述的音视频数据的推荐方法，其特征在于，所述在所述目标聚类结果中选择满足第一预设条件的多个目标聚类集合的步骤，包括：按照所述目标聚类结果中各聚类集合的第一概率，对所述目标聚类结果中的各聚类集合进行排序；

选择排序在前的第二预设数量的多个聚类集合作为多个所述目标聚类集合。

4.根据权利要求2所述的音视频数据的推荐方法，其特征在于，所述针对每个所述目标聚类集合，选择满足第二预设条件的多个候选音视频数据的步骤，包括：针对每个所述目标聚类集合，选择触发操作数量最多的第三预设数量的多个音视频数据作为多个所述候选音视频数据。

5.根据权利要求2所述的音视频数据的推荐方法，其特征在于，所述对多个所述候选音视频数据进行排序的步骤，包括：按照多个所述候选音视频数据的第二概率，对多个所述候选音视频数据进行排序。

6.根据权利要求1至5中任一项所述的音视频数据的推荐方法，其特征在于，所述预先对音视频数据进行聚类分析得到的多个层次的聚类结果的步骤，包括：根据音视频数据的特征向量，按照层次聚类算法对音视频数据进行自上而下式或自下而上式的聚类分析，得到多个层次的所述聚类结果。

7.一种音视频数据的推荐系统，其特征在于，包括：获取单元，被配置为获取用户的收敛度信息，所述收敛度信息用于表示用户的兴趣信息收集的充分程度；

确定单元，被配置为根据所述收敛度信息和预设的第一对应关系确定与所述收敛度信息对应层次的目标聚类结果，所述目标聚类结果属于预先对音视频数据进行聚类分析得到的多个层次的聚类结果，每个层次的聚类结果包括一个或多个聚类集合，每个聚类集合包括多个音视频数据；

选择单元，被配置为在所述目标聚类结果中选择目标音视频数据；

推荐单元，被配置为将所述目标音视频数据推荐给所述用户；

其中，所述获取单元，被配置为根据所述用户的行为数据的数量和预设的第二对应关系确定所述用户的收敛度信息；或，按照预先学习得到的预测模型和所述行为数据确定所述收敛度信息；其中，所述行为数据至少包括以下之一：所述用户在音视频数据的应用程序中，对音视频数据的浏览数据、播放数据、点赞数据、评论数据，以及，所述用户启动、登录所述应用程序的数据。

8.一种服务器，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

获取用户的收敛度信息，所述收敛度信息用于表示用户的兴趣信息收集的充分程度；

在所述目标聚类结果中选择目标音视频数据；

将所述目标音视频数据推荐给所述用户；

其中，所述获取用户的收敛度信息的步骤，包括：

根据所述用户的行为数据的数量和预设的第二对应关系确定所述用户的收敛度信息；

或，按照预先学习得到的预测模型和所述行为数据确定所述收敛度信息；

9.一种非临时性计算机可读存储介质，当所述存储介质中的指令由服务器的处理器执行时，使得服务器能够执行一种音视频数据的推荐方法，所述方法包括：获取用户的收敛度信息，所述收敛度信息用于表示用户的兴趣信息收集的充分程度；

在所述目标聚类结果中选择目标音视频数据；

将所述目标音视频数据推荐给所述用户；

其中，所述获取用户的收敛度信息的步骤，包括：

根据所述用户的行为数据的数量和预设的第二对应关系确定所述用户的收敛度信息；

或，按照预先学习得到的预测模型和所述行为数据确定所述收敛度信息；

音视频数据的推荐方法、系统及服务器和存储介质

技术领域

[0001] 本公开涉及音视频处理技术领域，尤其涉及音视频数据的推荐方法、系统及服务器和存储介质。

背景技术

[0002] 现在短视频应用程序越来越多，逐渐成为用户打发碎片时间和获取知识的一个重要途径。短视频应用程序中的短视频分为两种，一个是UGC(User Generated Content，用户创造内容)，另一种是PGC(Professional Generated Content，专业创造内容)，二者之间的区别在于短视频的内容是由谁来提供。由用户自己提供的叫UGC，由专业短视频制作机构提供的叫PGC。目前更普遍一点的是UGC，也就是说短视频平台的绝大部分短视频内容，都是由用户自己上传到平台上的。

[0003] 短视频应用程序的一个核心功能，就是针对不同的用户，推荐不同的短视频内容。相关技术中，通过获取用户的诸如年龄、性别、所在位置等基本信息，根据用户的基本信息推荐相应的短视频，或者，直接推荐热门的短视频，造成推荐的短视频无法符合用户的兴趣爱好，推荐效果差。

发明内容

[0004] 为克服相关技术中存在的问题，本公开提供一种音视频数据的推荐方法、系统及服务器和存储介质。

[0005] 根据本公开实施例的第一方面，提供一种音视频数据的推荐方法，包括：获取用户的收敛度信息，所述收敛度信息用于表示用户的兴趣信息收集的充分程度；根据所述收敛度信息和预设的第一对应关系确定与所述收敛度信息对应层次的目标聚类结果，所述目标聚类结果属于预先对音视频数据进行聚类分析得到的多个层次的聚类结果，每个层次的聚类结果包括一个或多个聚类集合，每个聚类集合包括多个音视频数据；在所述目标聚类结果中选择目标音视频数据；将所述目标音视频数据推荐给所述用户。

[0006] 可选地，所述获取用户的收敛度信息的步骤，包括：根据所述用户的行为数据的数量和预设的第二对应关系确定所述用户的收敛度信息；或，按照预先学习得到的预测模型和所述行为数据确定所述收敛度信息；其中，所述行为数据至少包括以下之一：所述用户在音视频数据的应用程序中，对音视频数据的浏览数据、播放数据、点赞数据、评论数据，以及，所述用户启动、登录所述应用程序的数据。

[0007] 可选地，所述在所述目标聚类结果中选择目标音视频数据的步骤，包括：在所述目标聚类结果中选择满足第一预设条件的多个目标聚类集合；针对每个所述目标聚类集合，选择满足第二预设条件的多个候选音视频数据；对多个所述候选音视频数据进行排序；将每个所述目标聚类集合中排序在前的第一预设数量的所述候选音视频数据确定为所述目标音视频数据。

[0008] 可选地，所述在所述目标聚类结果中选择满足第一预设条件的多个目标聚类集合的步骤，包括：按照所述目标聚类结果中各聚类集合的第一概率，对所述目标聚类结果中的各聚类集合进行排序；选择排序在前的第二预设数量的多个聚类集合作为多个所述目标聚类集合。

[0009] 可选地，所述针对每个所述目标聚类集合，选择满足第二预设条件的多个候选音视频数据的步骤，包括：针对每个所述目标聚类集合，选择触发操作数量最多的第三预设数量的多个音视频数据作为多个所述候选音视频数据。

[0010] 可选地，所述对多个所述候选音视频数据进行排序的步骤，包括：按照多个所述候选音视频数据的第二概率，对多个所述候选音视频数据进行排序。

[0011] 可选地，所述预先对音视频数据进行聚类分析得到的多个层次的聚类结果的步骤，包括：根据音视频数据的特征向量，按照层次聚类算法对音视频数据进行自上而下式或自下而上式的聚类分析，得到多个层次的所述聚类结果。

[0012] 根据本公开实施例的第二方面，提供一种音视频数据的推荐系统，包括：获取单元，被配置为获取用户的收敛度信息，所述收敛度信息用于表示用户的兴趣信息收集的充分程度；确定单元，被配置为根据所述收敛度信息和预设的第一对应关系确定与所述收敛度信息对应层次的目标聚类结果，所述目标聚类结果属于预先对音视频数据进行聚类分析得到的多个层次的聚类结果，每个层次的聚类结果包括一个或多个聚类集合，每个聚类集合包括多个音视频数据；选择单元，被配置为在所述目标聚类结果中选择目标音视频数据；推荐单元，被配置为将所述目标音视频数据推荐给所述用户。

[0013] 可选地，所述获取单元，被配置为根据所述用户的行为数据的数量和预设的第二对应关系确定所述用户的收敛度信息；或，按照预先学习得到的预测模型和所述行为数据确定所述收敛度信息；其中，所述行为数据至少包括以下之一：所述用户在音视频数据的应用程序中，对音视频数据的浏览数据、播放数据、点赞数据、评论数据，以及，所述用户启动、登录所述应用程序的数据。

[0014] 可选地，所述选择单元，包括：目标聚类集合选择单元，被配置为在所述目标聚类结果中选择满足第一预设条件的多个目标聚类集合；候选音视频数据选择单元，被配置为针对每个所述目标聚类集合，选择满足第二预设条件的多个候选音视频数据；候选音视频数据排序单元，被配置为对多个所述候选音视频数据进行排序；目标音视频数据确定单元，被配置为将每个所述目标聚类集合中排序在前的第一预设数量的所述候选音视频数据确定为所述目标音视频数据。

[0015] 可选地，所述目标聚类集合选择单元，被配置为按照所述目标聚类结果中各聚类集合的第一概率，对所述目标聚类结果中的各聚类集合进行排序；选择排序在前的第二预设数量的多个聚类集合作为多个所述目标聚类集合。

[0016] 可选地，所述候选音视频数据选择单元，被配置为针对每个所述目标聚类集合，选择触发操作数量最多的第三预设数量的多个音视频数据作为多个所述候选音视频数据。

[0017] 可选地，所述候选音视频数据排序单元，被配置为按照多个所述候选音视频数据的第二概率，对多个所述候选音视频数据进行排序。

[0018] 可选地，所述系统还包括：聚类单元，被配置为根据音视频数据的特征向量，按照层次聚类算法对音视频数据进行自上而下式或自下而上式的聚类分析，得到多个层次的所述聚类结果。

[0019] 根据本公开实施例的第三方面，提供一种服务器，包括：处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为：获取用户的收敛度信息，所述收敛度信息用于表示用户的兴趣信息收集的充分程度；根据所述收敛度信息和预设的第一对应关系确定与所述收敛度信息对应层次的目标聚类结果，所述目标聚类结果属于预先对音视频数据进行聚类分析得到的多个层次的聚类结果，每个层次的聚类结果包括一个或多个聚类集合，每个聚类集合包括多个音视频数据；在所述目标聚类结果中选择目标音视频数据；将所述目标音视频数据推荐给所述用户。

[0020] 根据本公开实施例的第四方面，提供一种非临时性计算机可读存储介质，当所述存储介质中的指令由服务器的处理器执行时，使得服务器能够执行一种音视频数据的推荐方法，所述方法包括：获取用户的收敛度信息，所述收敛度信息用于表示用户的兴趣信息收集的充分程度；根据所述收敛度信息和预设的第一对应关系确定与所述收敛度信息对应层次的目标聚类结果，所述目标聚类结果属于预先对音视频数据进行聚类分析得到的多个层次的聚类结果，每个层次的聚类结果包括一个或多个聚类集合，每个聚类集合包括多个音视频数据；在所述目标聚类结果中选择目标音视频数据；将所述目标音视频数据推荐给所述用户。

[0021] 根据本公开实施例的第五方面，提供一种计算机程序产品，包括：当所述计算机程序产品中的指令由服务器的处理器执行时，使得服务器能够执行一种音视频数据的推荐方法，所述方法包括：获取用户的收敛度信息，所述收敛度信息用于表示用户的兴趣信息收集的充分程度；根据所述收敛度信息和预设的第一对应关系确定与所述收敛度信息对应层次的目标聚类结果，所述目标聚类结果属于预先对音视频数据进行聚类分析得到的多个层次的聚类结果，每个层次的聚类结果包括一个或多个聚类集合，每个聚类集合包括多个音视频数据；在所述目标聚类结果中选择目标音视频数据；将所述目标音视频数据推荐给所述用户。

[0022] 本公开的实施例提供的技术方案可以包括以下有益效果：

[0023] 本公开实施例提供的音视频数据的推荐方案，若对某用户推荐音视频数据，先获取表示该用户的兴趣信息收集的充分程度的收敛度信息，再根据获取到的收敛度信息和预设的第一对应关系确定目标聚类结果。其中，第一对应关系为收敛度信息与目标聚类结果所在层次之间的对应关系，目标聚类结果属于预先对音视频数据进行聚类分析得到的多个层次的聚类结果，为多个层次的聚类结果中的其中一层，而且，每个层次的聚类结果包括一个或多个聚类集合，每个聚类集合包括多个音视频数据。在确定目标聚类结果之后，从目标聚类结果中选择出目标音视频数据，并推荐给用户。本公开实施例先对音视频数据进行聚类分析得到多个层次的聚类结果，然后根据获取到的用户的收敛度信息确定对应层次的目标聚类结果，再从目标聚类结果中选择推荐给用户的目标音视频数据，利用表示用户的兴趣信息收集的充分程度的收敛度信息确定目标聚类结果，使得最终推荐的目标音视频数据更符合用户的兴趣爱好，推荐效果好。

[0024] 应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

[0025] 此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

[0026] 图1是根据一示例性实施例示出的一种音视频数据的推荐方法的流程图。

[0027] 图2是根据一示例性实施例示出的一种音视频数据的推荐方法的流程图。

[0028] 图3是根据一示例性实施例示出的一种短视频作品的推荐方法的流程图。

[0029] 图4是根据一示例性实施例示出的一种音视频数据的推荐系统的框图。

[0030] 图5是根据一示例性实施例示出的一种用于音视频数据的推荐的服务器的框图。

[0031] 图6是根据一示例性实施例示出的一种用于音视频数据的推荐的装置的框图。

具体实施方式

[0032] 这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的系统和方法的例子。

[0033] 图1是根据一示例性实施例示出的一种音视频数据的推荐方法的流程图，如图1所示，音视频数据的推荐方法可以用于服务器中，包括以下步骤。

[0034] 在步骤S11中，获取用户的收敛度信息。

[0035] 在音视频数据的应用程序中，若对某用户推荐音视频数据，则先获取该用户的收敛度信息。其中，收敛度信息表示该用户的兴趣信息被应用程序或者应用程序的服务器所收集的充分程度。例如，某用户刚刚通过应用程序注册，那么应用程序或应用程序的服务器(以下称为平台)对该用户的兴趣爱好等一无所知，平台对该用户的兴趣信息的收集就很不充分，所以平台对该用户的兴趣定位是很不精准的，也可以说，该用户目前的收敛度信息很少。在实际应用中，收敛度信息可以为具体的数字，如0、0.1、0.2、……、1等，此时，收敛度信息的范围在0至1之间，0表示用户的兴趣信息收集的充分程度最低，1表示用户的兴趣信息收集的充分程度最高。收敛度信息对应的数字大小，可以具体体现在对用户的兴趣信息的收集类别和各收集类别的收集数量上，用户的兴趣信息的收集类别越多、收集类别的收集数量越多，收敛度信息对应的数字越大；用户的兴趣信息的收集类别越少、收集类别的收集数量越少，收敛度信息对应的数字越小。用户的兴趣信息的收集类别可以包括但不限于：喜欢的音视频数据的国家、作者、类型、时长、播放量、评论量、转发量、搜索量等等。音视频数据的应用程序可以为短视频应用程序，该用户可以为新用户或老用户，本公开实施例对音视频数据的应用程序的来源、类别等，以及，用户的类型等不作具体限制。

[0036] 在获取用户的收敛度信息时，可以根据用户在平台上的行为衡量该用户的收敛度信息，也可以通过神经网络模型预测用户的收敛度信息，本公开实施例对获取用户的收敛度信息所采用的技术手段不作具体限制。

[0037] 在步骤S12中，根据收敛度信息和预设的第一对应关系确定与收敛度信息对应层次的目标聚类结果。

[0038] 在获取收敛度信息之后，利用收敛度信息与第一对应关系确定目标聚类结果。确定目标聚类结果的目的在于缩小确定推荐给用户的音视频数据的范围。目标聚类结果为预先对音视频数据进行聚类分析得到的多个层次的聚类结果中的一层。聚类分析的目标可以为平台内的全部音视频数据，而且，聚类分析得到的每个层次的聚类结果可以包括一个或多个聚类集合，每个聚类集合中包括多个音视频数据。聚类分析得到的多个层次的聚类结果可以形成一树状结构，在该树状结构中，上层的聚类结果可以相对地覆盖更多的兴趣信息，下层的聚类结果可以相对地覆盖更准确的兴趣信息。

[0039] 该第一对应关系可以为收敛度信息与聚类结果所在的层次之间的对应关系，例如，收敛度信息为0，则该收敛度信息对应第5层的聚类结果；收敛度信息为0.05，则该收敛度信息对应第6层的聚类结果。本公开实施例对第一对应关系中收敛度信息与聚类结果所在的层次的具体关系等不作具体限制。该第一对应关系还可以为收敛度信息与聚类结果所包含的用户的兴趣信息的收集类别之间的对应关系，例如，收敛度信息为0，则该收敛度信息对应仅包含喜欢的音视频数据的国家这一收集类别的聚类结果；收敛度信息为0.1，则该收敛度信息对应包含喜欢的音视频数据的国家、作者、类型和时长这四个收集类别的聚类结果。本公开实施例对第一对应关系中收敛度信息与聚类结果包含的收集类别的具体关系等不作具体限制。

[0040] 在步骤S13中，在目标聚类结果中选择目标音视频数据。

[0041] 目标聚类结果中包括多个聚类集合，而且，每个聚类集合中包括多个音视频数据。在目标聚类结果中选择出目标音视频数据，可以依据先从目标聚类结果中选择目标聚类集合，再从目标聚类集合中选择目标音视频数据的顺序执行。在实际应用中，在确定目标聚类结果之后，可以在目标聚类结果包括的多个聚类集合中，选择用户比较喜欢的几个聚类集合作为目标聚类集合，再从每个目标聚类集合中选择用户发聩比较好的音视频数据作为目标音视频数据。

[0042] 在步骤S14中，将目标音视频数据推荐给用户。

[0043] 最终确定的目标音视频数据可以来源于多个目标聚类集合，可以将目标音视频数据按照列表的形式推荐给用户，在实际应用中，可以在音视频数据的应用程序上弹出包含目标音视频数据的封面的窗口，在该窗口中以列表的形式展示各目标音视频数据的封面。用户可以点击各目标音视频数据的封面，执行播放目标音视频数据、查看简介和评论等操作。

[0044] 本公开实施例提供的音视频数据的推荐方法，若对某用户推荐音视频数据，先获取表示该用户的兴趣信息收集的充分程度的收敛度信息，再根据获取到的收敛度信息和预设的第一对应关系确定目标聚类结果。其中，第一对应关系为收敛度信息与目标聚类结果所在层次之间的对应关系，目标聚类结果属于预先对音视频数据进行聚类分析得到的多个层次的聚类结果，为多个层次的聚类结果中的其中一层，而且，每个层次的聚类结果包括一个或多个聚类集合，每个聚类集合包括多个音视频数据。在确定目标聚类结果之后，从目标聚类结果中选择出目标音视频数据，并推荐给用户。本公开实施例先对音视频数据进行聚类分析得到多个层次的聚类结果，然后根据获取到的用户的收敛度信息确定对应层次的目标聚类结果，再从目标聚类结果中选择推荐给用户的目标音视频数据，利用表示用户的兴趣信息收集的充分程度的收敛度信息确定目标聚类结果，使得最终推荐的目标音视频数据更符合用户的兴趣爱好，推荐效果好。

[0045] 图2是根据一示例性实施例示出的一种音视频数据的推荐方法的流程图。如图2所示，音视频数据的推荐方法可以用于服务器中，包括以下步骤。

[0046] 在步骤S21中，对平台中的音视频数据进行聚类分析得到多个层次的聚类结果。

[0047] 本公开实施例首先可以对平台中的所有音视频数据按照层次聚类的方式进行聚类分析。在实际应用中，可以根据各音视频数据的特征向量，采用Bisecting层次聚类算法或Agglomerative层次聚类算法对各音视频数据进行聚类分析得到多个层次的聚类结果。

[0048] 其中，Bisecting层次聚类算法是一种自上而下式的分裂聚类算法，首先，从全部音视频数据开始，把全部音视频数据分裂成两个类别，然后在分裂成的两个类别中，挑选其中一个类别继续分裂，分裂成两个子类别，如此一直分裂下去，就会得到一个树状的层次聚类结构。Agglomerative层次聚类算法与Bisecting层次聚类算法相反，是一种自下而上式的合并聚类算法，将全部音视频数据中最相似的两个音视频数据进行合并在一个聚类集合中，然后把两个最相似的聚类集合合并在一起，形成一个更大的聚类集合，如下一直合并下去，直到把全部音视频数据都合并成成一个聚类集合，形成一个树状的层次聚类结构。

[0049] 在实际应用中，按照上述两种层次聚类算法得到的树状的层次聚类结构中，可以限制每个聚类集合中最少包含多少个音视频数据，对于包含的音视频数据的数量小于限制数量的聚类集合，可以进行删除或者舍弃，以便在后续的推荐过程中屏蔽掉。

[0050] 上述判断两个音视频数据是否相似，可以按照音视频数据的特征向量，特征向量包括但不限于：音视频数据的封面图像特征、视频特征、音频特征、以及，平台对音视频数据的行为向量，如播放记录等等，本公开实施例对音视频数据的特征向量的内容、形式、来源等不作具体限制。

[0051] 在步骤S22中，计算每个层次的聚类结果中各聚类集合的第一概率。

[0052] 本公开实施例中聚类集合的第一概率可以理解为用户喜欢该聚类集合中的音视频数据的概率。用户喜欢某音视频数据可以通过用户点击过该音视频数据、播放过该音视频数据、评论过该音视频数据、点赞过该音视频数据、分享过该音视频数据等用户行为表示。在实际应用中，可以利用传统的机器学习建模，以及，用户的行为数据和聚类集合计算各聚类集合的第一概率。其中，用户的行为数据可以包括正样本数据和负样本数据，正样本数据可以为用户点击过音视频数据或播放过音视频文件等，负样本数据可以为音视频数据展示给用户，但是用户没有点击或播放过展示的音视频数据等，而且，正样本数据和负样本数据中还需要包含音视频数据对应的聚类集合，即将用户的行为数据+聚类集合作为一条最终的样本数据。本公开实施例对机器学习建模所采用的技术手段等不作具体限制。

[0053] 在步骤S23中，获取用户的收敛度信息。

[0054] 本公开实施例可以按照一个相对简单的规则确定用户的收敛度信息。例如，可以根据用户的行为数据的数量和预设的第二对应关系确定收敛度信息。用户在平台上的行为数据越多，其收敛度信息越大，行为数据越少，其收敛度信息越小。其中，第二对应关系可以为行为数据的数量与收敛度信息的具体数值之间的对应关系。本公开实施例还可以按照预先学习得到的预测模型和行为数据确定收敛度信息。例如，刚进入平台的用户的收敛度信息设为0，每天稳定活跃，且注册时间超过半年的用户的收敛度信息设为1。可以预先获取用户的行为数据，利用行为数据作为训练样本数据学习得到预测模型，进而利用学习得到的预测模型计算收敛度信息。需要说明的是，本公开实施例对训练预测模型所采用的技术手段等不作具体限制。

[0055] 本公开实施例中，上述行为数据包括但不限于：用户在音视频数据的应用程序中，对音视频数据的浏览数据、播放数据、点赞数据、评论数据，以及，用户启动、登录应用程序的数据等。上述行为数据中的各具体数据可以进一步包括对应的行为执行的时间、执行的数量、执行的频率等等，本公开实施例对行为数据包含的内容和形式等不作具体限制。

[0056] 在步骤S24中，根据收敛度信息和预设的第一对应关系确定与收敛度信息对应层次的目标聚类结果。

[0057] 在步骤S25中，在目标聚类结果中选择目标音视频数据。

[0058] 本步骤S25可以划分为如下步骤：

[0059] 步骤S251，在目标聚类结果中选择满足第一预设条件的多个目标聚类集合。

[0060] 满足第一预设条件的目标聚类集合可以理解为用户比较喜欢的聚类集合，在实际应用中，可以按照目标聚类结果中各聚类集合的第一概率，对目标聚类结果中的各聚类集合进行排序；选择排序在前的第二预设数量的多个聚类集合作为多个目标聚类集合。其中，第一概率可以在上述步骤S22中计算得到。第二预设数量可以为2或3等，本公开实施例对第二预设数量的数值等不作具体限制。

[0061] 步骤S252，针对每个目标聚类集合，选择满足第二预设条件的多个候选音视频数据。

[0062] 在选择出多个目标聚类集合之后，可以在每个目标聚类集合中选择出用户反馈度最好的多个候选音视频数据，在实际应用中，可以针对每个目标聚类集合，选择触发操作数量最多的第三预设数量的多个音视频数据作为多个候选音视频数据。该触发操作可以包括但不限于：点赞、播放、分享等等，第三预设数量可以为2或3等，本公开实施例对第三预设数量的数值等不作具体限制。

[0063] 步骤S253，对多个候选音视频数据进行排序。

[0064] 在每个目标聚类集合中，对多个候选音视频数据进行排序，可以按照多个候选音视频数据的第二概率，对多个候选音视频数据进行排序。该第二概率可以为用户在平台推荐了某音视频数据时，该用户播放该音视频数据的概率，该第二概率的计算可以通过机器学习等方式执行，本公开实施例对获取第二概率所采用的技术手段等不作具体限制。

[0065] 步骤S254，将每个目标聚类集合中排序在前的第一预设数量的候选音视频数据确定为目标音视频数据。

[0066] 每个目标聚类集合中确定的目标音视频数据的具体数量可以相同也可以不同，即每个目标聚类集合中的第一预设数量可以相同也可以不同。若某目标聚类集合中包含的音视频数据较多，则该目标聚类集合中的目标音视频数据也较多，即该目标聚类集合中的第一预设数量较大；若某目标聚类集合中包含的音视频数据较少，则该目标聚类集合中的目标音视频数据也较少，即该目标聚类集合中的第一预设数量较小。或者，若某目标聚类集合的第一概率较大，则该目标聚类集合中的目标音视频数据较多，即该目标聚类集合中的第一预设数量较大；若某目标聚类集合的第一概率较小，则该目标聚类集合中的目标音视频数据较少，即该目标聚类集合中的第一预设数量较小。本公开实施例对第一预设数量的数值等不作具体限制。

[0067] 在步骤S26中，将目标音视频数据推荐给用户。

[0068] 需要说明的是，上述步骤S21和步骤S22可以定期执行，并非在为每位用户推荐音视频数据时均需要执行上述步骤S21和步骤S22。

[0069] 本公开实施例提供的音视频数据的推荐方法，若对某用户推荐音视频数据，先获取表示该用户的兴趣信息收集的充分程度的收敛度信息，再根据获取到的收敛度信息和预设的第一对应关系确定目标聚类结果。其中，第一对应关系为收敛度信息与目标聚类结果所在层次之间的对应关系，目标聚类结果属于预先对音视频数据进行聚类分析得到的多个层次的聚类结果，为多个层次的聚类结果中的其中一层，而且，每个层次的聚类结果包括一个或多个聚类集合，每个聚类集合包括多个音视频数据。在确定目标聚类结果之后，从目标聚类结果中选择出目标音视频数据，并推荐给用户。本公开实施例先对音视频数据进行聚类分析得到多个层次的聚类结果，然后根据获取到的用户的收敛度信息确定对应层次的目标聚类结果，再从目标聚类结果中选择推荐给用户的目标音视频数据，利用表示用户的兴趣信息收集的充分程度的收敛度信息确定目标聚类结果，使得最终推荐的目标音视频数据更符合用户的兴趣爱好，推荐效果好。

[0070] 图3是根据一示例性实施例示出的一种短视频作品的推荐方法的流程图。如图3所示，短视频作品的推荐方法可以用于服务器中，包括以下步骤。

[0071] 在步骤S31中，将短视频平台中的全部短视频作品进行层次聚类。

[0072] 全部短视频作品可以按照层次聚类算法进行聚类分析，得到若干层次的聚类。每个层次的聚类中包含多个聚类集合，每个聚类集合中包含多个短视频作品。

[0073] 在步骤S32中，计算短视频平台中用户对每个聚类的喜欢程度。

[0074] 可以按照用户播放、点赞或分享短视频作品的次数、频率等行为数据计算用户对每个聚类的喜欢程度。

[0075] 在步骤S33中，计算待推荐的用户的兴趣收敛度。

[0076] 可以根据用户的行为数据确定用户的兴趣收敛度。

[0077] 在步骤S34中，确定推荐的聚类层次以及在该层次的聚类中用户最喜欢的聚类。

[0078] 在确定推荐的聚类所在的层次中选择用户最喜欢的几个聚类。

[0079] 在步骤S35中，推荐具体的若干短视频作品。

[0080] 在用户最喜欢的几个聚类中选择用户最喜欢的或反馈最好的几个短视频作品。

[0081] 需要说明的是，上述步骤S31和步骤S32可以定期执行，并非在为每位用户推荐短视频作品时均需要执行上述步骤S31和步骤S32。

[0082] 如果用户的兴趣收敛度还很低，比如用户刚刚进入平台，那就需要进行比较宽泛的兴趣探索，先确定个大概的方向，用户到底喜欢哪几个大类的短视频作品，此时需要推荐聚类层次比较浅的聚类，因为这些聚类比较上层，包含的范围比较宽，代表的兴趣类型比较粗略，适合做初步的兴趣探索。

[0083] 如果用户的兴趣收敛度已经比较高，兴趣已经比较稳定了，那就按照用户的兴趣维度去推荐短视频作品，此时可以从比较底层的聚类层次去推荐，因为底层的聚类是比较集中的兴趣聚类，兴趣类别更具体，适合推荐给兴趣收敛度高的用户。

[0084] 对于新用户而言，给定了合适的兴趣探索力度，让用户最开始确定喜欢的大类是什么，然后再逐渐通过行为反馈，细化自己的兴趣类型，是一个兴趣具化的非常自然的过程。以此带给新用户非常高效的兴趣探索，更容易使平台推荐的短视频作品符合用户的心里预期，令平台快速定位到用户的兴趣类型，大大提高了用户停留在平台上的概率。

[0085] 图4是根据一示例性实施例示出的一种音视频数据的推荐系统的框图。参照图4，该系统包括获取单元41，确定单元42、选择单元43和推荐单元44。

[0086] 获取单元41，被配置为获取用户的收敛度信息，所述收敛度信息用于表示用户的兴趣信息收集的充分程度；确定单元42，被配置为根据所述收敛度信息和预设的第一对应关系确定与所述收敛度信息对应层次的目标聚类结果，所述目标聚类结果属于预先对音视频数据进行聚类分析得到的多个层次的聚类结果，每个层次的聚类结果包括一个或多个聚类集合，每个聚类集合包括多个音视频数据；选择单元43，被配置为在所述目标聚类结果中选择目标音视频数据；推荐单元44，被配置为将所述目标音视频数据推荐给所述用户。

[0087] 获取单元41，被配置为根据所述用户的行为数据的数量和预设的第二对应关系确定所述用户的收敛度信息；或，按照预先学习得到的预测模型和所述行为数据确定所述收敛度信息；其中，所述行为数据至少包括以下之一：所述用户在音视频数据的应用程序中，对音视频数据的浏览数据、播放数据、点赞数据、评论数据，以及，所述用户启动、登录所述应用程序的数据。

[0088] 选择单元43，包括：目标聚类集合选择单元431，被配置为在所述目标聚类结果中选择满足第一预设条件的多个目标聚类集合；候选音视频数据选择单元432，被配置为针对每个所述目标聚类集合，选择满足第二预设条件的多个候选音视频数据；候选音视频数据排序单元433，被配置为对多个所述候选音视频数据进行排序；目标音视频数据确定单元434，被配置为将每个所述目标聚类集合中排序在前的第一预设数量的所述候选音视频数据确定为所述目标音视频数据。

[0089] 目标聚类集合选择单元431，被配置为按照所述目标聚类结果中各聚类集合的第一概率，对所述目标聚类结果中的各聚类集合进行排序；选择排序在前的第二预设数量的多个聚类集合作为多个所述目标聚类集合。

[0090] 候选音视频数据选择单元432，被配置为针对每个所述目标聚类集合，选择触发操作数量最多的第三预设数量的多个音视频数据作为多个所述候选音视频数据。

[0091] 候选音视频数据排序单元433，被配置为按照多个所述候选音视频数据的第二概率，对多个所述候选音视频数据进行排序。

[0092] 系统还包括：聚类单元45，被配置为根据音视频数据的特征向量，按照层次聚类算法对音视频数据进行自上而下式或自下而上式的聚类分析，得到多个层次的所述聚类结果。

[0093] 关于上述实施例中的系统，其中各个单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

[0094] 图5是根据一示例性实施例示出的一种用于音视频数据的推荐的服务器500的框图。服务器500可以包括以下一个或多个组件：处理组件502，存储器504，电力组件506，多媒体组件508，音频组件510，输入/输出(I/O)的接口512，传感器组件514，以及通信组件516。

[0095] 处理组件502通常控制服务器500的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件502可以包括一个或多个模块，便于处理组件502和其他组件之间的交互。例如，处理组件502可以包括多媒体模块，以方便多媒体组件508和处理组件502之间的交互。

[0096] 存储器504被配置为存储各种类型的数据以支持在服务器500的操作。这些数据的示例包括用于在服务器500上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

[0097] 电源组件506为服务器500的各种组件提供电力。电源组件506可以包括电源管理系统，一个或多个电源，及其他与为服务器500生成、管理和分配电力相关联的组件。

[0098] 多媒体组件508包括在所述服务器500和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件508包括一个前置摄像头和/或后置摄像头。当服务器500处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

[0099] 音频组件510被配置为输出和/或输入音频信号。例如，音频组件510包括一个麦克风(MIC)，当服务器500处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。在一些实施例中，音频组件510还包括一个扬声器，用于输出音频信号。

[0100] I/O接口512为处理组件502和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

[0101] 传感器组件514包括一个或多个传感器，用于为服务器500提供各个方面的状态评估。例如，传感器组件514可以检测到服务器500的打开/关闭状态，组件的相对定位，例如所述组件为服务器500的显示器和小键盘，传感器组件514还可以检测服务器500或服务器500一个组件的位置改变，用户与服务器500接触的存在或不存在，服务器500方位或加速/减速和服务器500的温度变化。传感器组件514可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件514还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

[0102] 通信组件516被配置为便于服务器500和其他设备之间有线或无线方式的通信。服务器500可以接入基于通信标准的无线网络，如WiFi，运营商网络(如2G、3G、4G或5G)，或它们的组合。在一个示例性实施例中，通信组件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件516还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

[0103] 在示例性实施例中，服务器500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

[0104] 在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器504，上述指令可由服务器500的处理器520执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

[0105] 图6是根据一示例性实施例示出的一种用于音视频数据的推荐的装置600的框图。例如，装置600可以被提供为一服务器或电子设备。参照图6，装置600包括处理组件622，其进一步包括一个或多个处理器，以及由存储器632所代表的存储器资源，用于存储可由处理组件622的执行的指令，例如应用程序。存储器632中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件622被配置为执行指令，以执行上述图1和图2所示的方法。

[0106] 装置600还可以包括一个电源组件626被配置为执行装置600的电源管理，一个有线或无线网络接口650被配置为将装置600连接到网络，和一个输入输出(I/O)接口658。装置600可以操作基于存储在存储器632的操作系统，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM或类似。

[0107] 本公开实施例还可以提供一种计算机程序产品，当所述计算机程序产品中的指令由服务器、系统或电子设备的处理器执行时，使得服务器、系统或电子设备能够执行上述音视频数据的推荐方法。

[0108] 本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

[0109] 应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

音视频数据的推荐方法、系统及服务器和存储介质转让专利

申请号 : CN201811488442.X

文献号 : CN109783656B

文献日 : 2020-11-06

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 肖战勇 , 陈祯扬 , 刘京鑫 , 常超

申请人 : 北京达佳互联信息技术有限公司

摘要 :

权利要求 :

说明书 :

音视频数据的推荐方法、系统及服务器和存储介质

技术领域

背景技术

发明内容

附图说明

具体实施方式