关键词确定方法、装置、计算机设备及介质转让专利

申请号 : CN202111295116.9

文献号 : CN113724022B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李栋孟高小平郑秋野徐禄军何攀

申请人 : 北京达佳互联信息技术有限公司

摘要 :

本公开关于一种关键词确定方法、装置、计算机设备及介质,属于互联网技术领域。本公开实施例中,在确定目标业务的关键词时,不仅考虑到了目标业务下的内容资源,还考虑到了内容资源所关联的目标对象的关键词,由于目标对象是与目标业务满足第一相关度条件的用户,基于该目标对象的关键词和目标业务之间的相关度,来确定目标业务的关键词,能够确定出与目标业务相关度高的关键词,提高了确定关键词的精确度,进而基于所确定的关键词,再确定目标业务下内容资源的投放对象,提升了投放的精准度。

权利要求 :

1.一种关键词确定方法,其特征在于,所述方法包括:获取目标业务下的至少一个内容资源的资源信息;

在所述至少一个内容资源所关联的目标对象中,选取转化时间满足目标条件的至少一个目标对象,获取所述至少一个目标对象的关键词,所述转化时间表示所述目标对象对内容资源执行目标操作的时间,所述目标对象与所述目标业务之间满足第一相关度条件;

基于所述至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词,确定至少一个所述关键词对应的相关度,所述相关度表示所述关键词与所述目标业务之间的相关程度;

将所述相关度满足第二相关度条件的关键词,确定为所述目标业务的关键词,所述关键词用于确定所述目标业务下内容资源的投放对象。

2.根据权利要求1所述的关键词确定方法,其特征在于,所述目标业务下的至少一个内容资源的资源信息的获取过程包括:获取所述目标业务下的至少一个内容资源的资源介绍信息,所述资源介绍信息用于介绍所述目标业务;

基于所述至少一个内容资源的资源介绍信息,确定所述至少一个内容资源的资源信息。

3.根据权利要求2所述的关键词确定方法,其特征在于,所述基于所述至少一个内容资源的资源介绍信息,确定所述至少一个内容资源的资源信息包括:对于任一个内容资源,对所述内容资源的资源介绍信息进行切词,得到所述资源介绍信息所包括的至少一个关键词;

基于所述至少一个关键词的词向量,确定所述内容资源的资源信息。

4.根据权利要求1所述的关键词确定方法,其特征在于,所述基于所述至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词,确定至少一个所述关键词对应的相关度包括:

分别确定所述至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词之间的相似度,所述相似度表示所述关键词与所述内容资源之间的相似程度;

基于至少一个所述关键词对应的相似度,确定至少一个所述关键词对应的相关度。

5.根据权利要求4所述的关键词确定方法,其特征在于,所述基于至少一个所述关键词对应的相似度,确定至少一个所述关键词对应的相关度包括:对于任一个关键词,确定所述关键词对应的至少一个相似度的和值;

基于所述至少一个相似度的和值和所述至少一个相似度的数量,确定所述关键词对应的相关度。

6.根据权利要求1所述的关键词确定方法,其特征在于,所述将所述相关度满足第二相关度条件的关键词,确定为所述目标业务的关键词包括下述任一项:按照相关度由高至低的排列次序进行排序,将排列次序位于前目标位数的相关度对应的关键词,确定为所述目标业务的关键词;

按照相关度由高至低的排列次序进行排序,将相关度达到目标阈值的相关度对应的关键词,确定为所述目标业务的关键词。

7.一种关键词确定装置,其特征在于,所述装置包括:获取单元,被配置为执行获取目标业务下的至少一个内容资源的资源信息;

所述获取单元,还被配置为执行在所述至少一个内容资源所关联的目标对象中,选取转化时间满足目标条件的至少一个目标对象,获取所述至少一个目标对象的关键词,所述转化时间表示所述目标对象对内容资源执行目标操作的时间,所述目标对象与所述目标业务之间满足第一相关度条件;

相关度确定单元,被配置为执行基于所述至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词,确定至少一个所述关键词对应的相关度,所述相关度表示所述关键词与所述目标业务之间的相关程度;

关键词确定单元,被配置为执行将所述相关度满足第二相关度条件的关键词,确定为所述目标业务的关键词,所述关键词用于确定所述目标业务下内容资源的投放对象。

8.根据权利要求7所述的关键词确定装置,其特征在于,所述获取单元包括:介绍信息获取子单元,被配置为执行获取所述目标业务下的至少一个内容资源的资源介绍信息,所述资源介绍信息用于介绍所述目标业务;

资源信息获取子单元,被配置为执行基于所述至少一个内容资源的资源介绍信息,确定所述至少一个内容资源的资源信息。

9.根据权利要求8所述的关键词确定装置,其特征在于,所述资源信息获取子单元,被配置为执行:

对于任一个内容资源,对所述内容资源的资源介绍信息进行切词,得到所述资源介绍信息所包括的至少一个关键词;

基于所述至少一个关键词的词向量,确定所述内容资源的资源信息。

10.根据权利要求7所述的关键词确定装置,其特征在于,所述相关度确定单元,包括:相似度确定子单元,被配置为执行分别确定所述至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词之间的相似度,所述相似度表示所述关键词与所述内容资源之间的相似程度;

相关度确定子单元,被配置为执行基于至少一个所述关键词对应的相似度,确定至少一个所述关键词对应的相关度。

11.根据权利要求10所述的关键词确定装置,其特征在于,所述相关度确定子单元,被配置为执行:

对于任一个关键词,确定所述关键词对应的至少一个相似度的和值;

基于所述至少一个相似度的和值和所述至少一个相似度的数量,确定所述关键词对应的相关度。

12.根据权利要求7所述的关键词确定装置,其特征在于,所述关键词确定单元,被配置为执行下述任一项:

按照相关度由高至低的排列次序进行排序,将排列次序位于前目标位数的相关度对应的关键词,确定为所述目标业务的关键词;

按照相关度由高至低的排列次序进行排序,将相关度达到目标阈值的相关度对应的关键词,确定为所述目标业务的关键词。

13.一种计算机设备,其特征在于,所述计算机设备包括:一个或多个处理器;

用于存储所述处理器可执行程序代码的存储器;

其中,所述处理器被配置为执行所述程序代码,以实现如权利要求1至6中任一项所述的关键词确定方法。

14.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的程序代码由计算机设备的处理器执行时,使得计算机设备能够执行如权利要求1至6中任一项所述的关键词确定方法。

说明书 :

关键词确定方法、装置、计算机设备及介质

技术领域

[0001] 本公开涉及互联网技术领域,尤其涉及一种关键词确定方法、装置、计算机设备及介质。

背景技术

[0002] 随着互联网技术的飞速发展和网络用户规模的逐渐扩大,各行各业会采用投放与自身业务相关的资源(如广告)的方式,来进行自身业务的宣传。
[0003] 通常地,在业务方投放资源时,会根据所投放的资源的内容,提取该资源的内容所包含的关键词,或根据所投放的资源的资源标题,提取该资源标题所包含的关键词,生成业
务方的关键词库,再根据用户基于资源的交互行为,来为用户添加各种各样的关键词标签。
进一步地,当业务方再次投放资源时,会在关键词库中选取关键词,向携带该关键词的用户
投放资源,从而实现定向投放的效果。
[0004] 然而,上述技术中基于资源的内容和标题,来确定资源对应业务的关键词,难以确定出与业务相关度高的关键词,进而降低了投放的精准度。

发明内容

[0005] 本公开提供一种关键词确定方法、装置、计算机设备及介质,提高了确定关键词的精确度,进而提升了投放的精准度。本公开的技术方案包括以下内容。
[0006] 根据本公开实施例的第一方面,提供一种关键词确定方法,该方法包括:
[0007] 获取目标业务下的至少一个内容资源的资源信息和该至少一个内容资源所关联的至少一个目标对象的关键词,该目标对象与该目标业务之间满足第一相关度条件;
[0008] 基于该至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词,确定至少一个该关键词对应的相关度,该相关度表示该关键词与该目标业务之间的相关程
度;
[0009] 将该相关度满足第二相关度条件的关键词,确定为该目标业务的关键词,该关键词用于确定该目标业务下内容资源的投放对象。
[0010] 本公开实施例中,在确定目标业务的关键词时,不仅考虑到了目标业务下的内容资源,还考虑到了内容资源所关联的目标对象的关键词,由于目标对象是与目标业务满足
第一相关度条件的用户,基于该目标对象的关键词和目标业务之间的相关度,来确定目标
业务的关键词,能够确定出与目标业务相关度高的关键词,提高了确定关键词的精确度,进
而基于所确定的关键词,再确定目标业务下内容资源的投放对象,提升了投放的精准度。
[0011] 在一些实施例中,该目标业务下的至少一个内容资源的资源信息的获取过程包括:
[0012] 获取该目标业务下的至少一个内容资源的资源介绍信息,该资源介绍信息用于介绍该目标业务;
[0013] 基于该至少一个内容资源的资源介绍信息,确定该至少一个内容资源的资源信息。
[0014] 本公开实施例中,利用内容资源的资源介绍信息,能够快速确定出内容资源的资源信息,提高了确定资源信息的效率,进而提高了确定关键词的效率。
[0015] 在一些实施例中,基于该至少一个内容资源的资源介绍信息,确定该至少一个内容资源的资源信息包括:
[0016] 对于任一个内容资源,对该内容资源的资源介绍信息进行切词,得到该资源介绍信息所包括的至少一个关键词;
[0017] 基于该至少一个关键词的词向量,确定该内容资源的资源信息。
[0018] 本公开实施例中,利用资源介绍信息所包括的关键词的词向量,来计算内容资源的资源信息,不仅提高了确定资源信息的效率,且通过确定用于表征内容资源的向量,以便
后续基于该向量来进行后续相似度的计算。
[0019] 在一些实施例中,该至少一个内容资源所关联的至少一个目标对象的关键词的获取过程包括:
[0020] 在该至少一个内容资源所关联的目标对象中,选取转化时间满足目标条件的至少一个目标对象,该转化时间表示该目标对象对内容资源执行目标操作的时间;
[0021] 获取该目标时间段内的至少一个目标对象的关键词。
[0022] 本公开实施例中,通过选取转化时间满足目标条件的目标对象,能够选取得到时间维度上较优的转化对象,相应地,所获取的关键词也即是较优的转化用户的关键词,能够
提高确定关键词的精确度。
[0023] 在一些实施例中,基于该至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词,确定至少一个该关键词对应的相关度包括:
[0024] 分别确定该至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词之间的相似度,该相似度表示该关键词与该内容资源之间的相似程度;
[0025] 基于至少一个该关键词对应的相似度,确定至少一个该关键词对应的相关度。
[0026] 本公开实施例中,利用各个关键词与对应内容资源之间的相似程度,来确定各个关键词与目标业务之间的相关程度,能够快速确定出各个关键词对应的相关度,提高了确
定相关度的效率,进而提高了确定关键词的效率。
[0027] 在一些实施例中,基于至少一个该关键词对应的相似度,确定至少一个该关键词对应的相关度包括:
[0028] 对于任一个关键词,确定该关键词对应的至少一个相似度的和值;
[0029] 基于该至少一个相似度的和值和该至少一个相似度的数量,确定该关键词对应的相关度。
[0030] 本公开实施例中,在关键词维度,采用各个关键词对应的相似度的平均值,来表征关键词和目标业务之间的相关度,能够快速确定出各个关键词对应的相关度,提高了确定
相关度的效率,进而提高了确定关键词的效率。
[0031] 在一些实施例中,将该相关度满足第二相关度条件的关键词,确定为该目标业务的关键词包括下述任一项:
[0032] 按照相关度由高至低的排列次序进行排序,将排列次序位于前目标位数的相关度对应的关键词,确定为该目标业务的关键词;
[0033] 按照相关度由高至低的排列次序进行排序,将相关度达到目标阈值的相关度对应的关键词,确定为该目标业务的关键词。
[0034] 本公开实施例中,通过选取相关度排序靠前的部分关键词,或者选取相关度大于一定阈值的部分关键词,均能够选取得到相关度较高的关键词,能够确定出与目标业务相
关度高的关键词,提高了确定关键词的精确度,进而提升了投放的精准度。
[0035] 根据本公开实施例的第二方面,提供一种关键词确定装置,该装置包括:
[0036] 获取单元,被配置为执行获取目标业务下的至少一个内容资源的资源信息和该至少一个内容资源所关联的至少一个目标对象的关键词,该目标对象与该目标业务之间满足
第一相关度条件;
[0037] 相关度确定单元,被配置为执行基于该至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词,确定至少一个该关键词对应的相关度,该相关度表示该关键
词与该目标业务之间的相关程度;
[0038] 关键词确定单元,被配置为执行将该相关度满足第二相关度条件的关键词,确定为该目标业务的关键词,该关键词用于确定该目标业务下内容资源的投放对象。
[0039] 在一些实施例中,该获取单元包括:
[0040] 介绍信息获取子单元,被配置为执行获取该目标业务下的至少一个内容资源的资源介绍信息,该资源介绍信息用于介绍该目标业务;
[0041] 资源信息获取子单元,被配置为执行基于该至少一个内容资源的资源介绍信息,确定该至少一个内容资源的资源信息。
[0042] 在一些实施例中,该资源信息获取子单元,被配置为执行:
[0043] 对于任一个内容资源,对该内容资源的资源介绍信息进行切词,得到该资源介绍信息所包括的至少一个关键词;
[0044] 基于该至少一个关键词的词向量,确定该内容资源的资源信息。
[0045] 在一些实施例中,该获取单元包括:
[0046] 目标对象获取子单元,被配置为执行在该至少一个内容资源所关联的目标对象中,选取转化时间满足目标条件的至少一个目标对象,该转化时间表示该目标对象对内容
资源执行目标操作的时间;
[0047] 关键词获取子单元,被配置为执行获取该至少一个目标对象的关键词。
[0048] 在一些实施例中,该相关度确定单元,包括:
[0049] 相似度确定子单元,被配置为执行分别确定该至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词之间的相似度,该相似度表示该关键词与该内容资源之
间的相似程度;
[0050] 相关度确定子单元,被配置为执行基于至少一个该关键词对应的相似度,确定至少一个该关键词对应的相关度。
[0051] 在一些实施例中,该相关度确定子单元,被配置为执行:
[0052] 对于任一个关键词,确定该关键词对应的至少一个相似度的和值;
[0053] 基于该至少一个相似度的和值和该至少一个相似度的数量,确定该关键词对应的相关度。
[0054] 在一些实施例中,该关键词确定单元,被配置为执行下述任一项:
[0055] 按照相关度由高至低的排列次序进行排序,将排列次序位于前目标位数的相关度对应的关键词,确定为该目标业务的关键词;
[0056] 按照相关度由高至低的排列次序进行排序,将相关度达到目标阈值的相关度对应的关键词,确定为该目标业务的关键词。
[0057] 根据本公开实施例的第三方面,提供一种计算机设备,该计算机设备包括:
[0058] 一个或多个处理器;
[0059] 用于存储该处理器可执行程序代码的存储器;
[0060] 其中,该处理器被配置为执行该程序代码,以实现上述的关键词确定方法。
[0061] 根据本公开实施例的第四方面,提供一种计算机可读存储介质,该计算机可读存储介质包括:当该计算机可读存储介质中的程序代码由计算机设备的处理器执行时,使得
计算机设备能够执行上述的关键词确定方法。
[0062] 根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的关键词确定方法。
[0063] 应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

[0064] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
[0065] 图1是根据一示例性实施例示出的一种关键词确定方法的实施环境示意图;
[0066] 图2是根据一示例性实施例示出的一种关键词确定方法的流程图;
[0067] 图3是根据一示例性实施例示出的一种关键词确定方法的流程图;
[0068] 图4是根据一示例性实施例示出的一种关键词确定装置的框图;
[0069] 图5是根据一示例性实施例示出的一种服务器的框图。

具体实施方式

[0070] 为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
[0071] 需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用
的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或
描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相
一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面
相一致的装置和方法的例子。
[0072] 本公开所涉及的数据或信息可以为经用户授权或者经过各方充分授权的数据或信息。
[0073] 首先,针对本公开实施例涉及的应用场景进行描述:本公开实施例涉及的关键词确定方法可应用于目标业务下的资源投放场景中,例如,目标业务下的广告投放场景。本公
开实施例中,关键词是指与目标业务相关的词汇。
[0074] 在相关技术中,在业务方投放资源时,会根据所投放的资源的内容,提取该资源的内容所包含的关键词,或根据所投放的资源的资源标题,提取该资源标题所包含的关键词,
生成业务方的关键词库,再根据用户基于资源的交互行为,来为用户添加各种各样的关键
词标签。进一步地,当业务方再次向用户投放资源时,会在关键词库中选取关键词,向携带
该关键词的用户投放资源,来实现投放。然而,相关技术难以确定出与业务相关度高的关键
词,降低了投放的精准度。
[0075] 基于此,本公开实施例提供了一种关键词确定方法,通过获取目标业务下的至少一个内容资源的资源信息和该至少一个内容资源所关联的至少一个目标对象的关键词,基
于该至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词,确定至少一个
该关键词对应的相关度,将该相关度满足第二相关度条件的关键词,确定为该目标业务的
关键词。如此,提高了确定关键词的精确度,进而提升了投放的精准度。
[0076] 图1是本公开实施例提供的一种关键词确定方法的实施环境示意图,参见图1,该实施环境中包括:服务器101。
[0077] 服务器101可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式文件系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服
务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发
网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
[0078] 可选地,上述服务器101的数量可以更多或更少,本公开实施例对此不加以限定。当然,服务器101还可以包括其他功能服务器,以便提供更全面且多样化的服务。
[0079] 本公开实施例中,服务器101用于获取目标业务下的至少一个内容资源的资源信息和该至少一个内容资源所关联的至少一个目标对象的关键词,基于该至少一个内容资源
的资源信息和所关联的至少一个目标对象的关键词,确定至少一个该关键词对应的相关
度,将该相关度满足第二相关度条件的关键词,确定为该目标业务的关键词。
[0080] 在一些实施例中,本公开实施例提供的关键词确定方法由服务器101周期性执行,例如,服务器101每间隔目标时长(如1小时),执行一次上述关键词确定方法所执行的过程。
[0081] 在另一些实施例中,本公开实施例提供的关键词确定方法由终端102在需要确定目标业务的关键词时触发,例如,终端102响应于业务方(的管理人员)对确定关键词的触发
操作,向服务器101发送关键词的确定请求,以请求该服务器101确定该目标业务的关键词。
[0082] 在一些实施例中,服务器101与终端102可以通过有线或无线通信方式进行直接或间接的连接,本公开实施例对此不作限定。
[0083] 终端102可以为智能手机、智能手表、台式电脑、手提电脑、虚拟现实终端、增强现实终端、无线终端和膝上型便携计算机等设备中的至少一种,终端102具有通信功能,可以
接入有线网络或无线网络。终端102可以泛指多个终端中的一个,本实施例仅以终端102来
举例说明。本领域技术人员可以知晓,上述终端的数量可以更多或更少。
[0084] 图2是根据一示例性实施例示出的一种关键词确定方法的流程图,如图2所示,该方法由服务器执行,包括以下步骤。
[0085] 在步骤201中,服务器获取目标业务下的至少一个内容资源的资源信息和该至少一个内容资源所关联的至少一个目标对象的关键词,该目标对象与该目标业务之间满足第
一相关度条件。
[0086] 在步骤202中,服务器基于该至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词,确定至少一个该关键词对应的相关度,该相关度表示该关键词与该目
标业务之间的相关程度。
[0087] 在步骤203中,服务器将该相关度满足第二相关度条件的关键词,确定为该目标业务的关键词,该关键词用于确定该目标业务下内容资源的投放对象。
[0088] 本公开实施例提供的技术方案,在确定目标业务的关键词时,不仅考虑到了目标业务下的内容资源,还考虑到了内容资源所关联的目标对象的关键词,由于目标对象是与
目标业务满足第一相关度条件的用户,基于该目标对象的关键词和目标业务之间的相关
度,来确定目标业务的关键词,能够确定出与目标业务相关度高的关键词,提高了确定关键
词的精确度,进而基于所确定的关键词,再确定目标业务下内容资源的投放对象,提升了投
放的精准度。
[0089] 在一些实施例中,该目标业务下的至少一个内容资源的资源信息的获取过程包括:
[0090] 获取该目标业务下的至少一个内容资源的资源介绍信息,该资源介绍信息用于介绍该目标业务;
[0091] 基于该至少一个内容资源的资源介绍信息,确定该至少一个内容资源的资源信息。
[0092] 在一些实施例中,基于该至少一个内容资源的资源介绍信息,确定该至少一个内容资源的资源信息包括:
[0093] 对于任一个内容资源,对该内容资源的资源介绍信息进行切词,得到该资源介绍信息所包括的至少一个关键词;
[0094] 基于该至少一个关键词的词向量,确定该内容资源的资源信息。
[0095] 在一些实施例中,该至少一个内容资源所关联的至少一个目标对象的关键词的获取过程包括:
[0096] 在该至少一个内容资源所关联的目标对象中,选取转化时间满足目标条件的至少一个目标对象,该转化时间表示该目标对象对内容资源执行目标操作的时间;
[0097] 获取该至少一个目标对象的关键词。
[0098] 在一些实施例中,基于该至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词,确定至少一个该关键词对应的相关度包括:
[0099] 分别确定该至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词之间的相似度,该相似度表示该关键词与该内容资源之间的相似程度;
[0100] 基于至少一个该关键词对应的相似度,确定至少一个该关键词对应的相关度。
[0101] 在一些实施例中,基于至少一个该关键词对应的相似度,确定至少一个该关键词对应的相关度包括:
[0102] 对于任一个关键词,确定该关键词对应的至少一个相似度的和值;
[0103] 基于该至少一个相似度的和值和该至少一个相似度的数量,确定该关键词对应的相关度。
[0104] 在一些实施例中,将该相关度满足第二相关度条件的关键词,确定为该目标业务的关键词包括下述任一项:
[0105] 按照相关度由高至低的排列次序进行排序,将排列次序位于前目标位数的相关度对应的关键词,确定为该目标业务的关键词;
[0106] 按照相关度由高至低的排列次序进行排序,将相关度达到目标阈值的相关度对应的关键词,确定为该目标业务的关键词。
[0107] 上述图2所示仅为本公开的基本流程,下面基于一种具体实施方式,来对本公开提供的方案进行进一步阐述,图3是根据一示例性实施例示出的一种关键词确定方法的流程
图,参见图3,该方法包括以下步骤。
[0108] 在步骤301中,服务器获取目标业务下的至少一个内容资源的资源信息。
[0109] 在一些实施例中,目标业务为目标行业。例如,目标行业可以是二级行业,二级行业是指一级行业下的具体行业,如,一级行业可以是农业、工业、服务业,相应地,二级行业
可以是钢铁行业、服装行业、食品行业等。在另一些实施例中,目标业务为所属行业内的具
体业务。例如,以所属行业为服装行业为例,目标业务可以是女装业务、男装业务、童装业务
等等。
[0110] 本公开实施例中,目标业务下的内容资源是指包含该目标业务的相关内容的多媒体资源。可理解地,内容资源也即是用于宣传该目标业务的多媒体资源。例如,目标业务下
的内容资源可以是目标业务的广告视频、宣传视频等等。在一些实施例中,内容资源采用资
源标识来表示。例如,资源标识可以是资源名称、资源编号、资源ID(Identification,身份
标识符)等。
[0111] 本公开实施例中,资源信息是指内容资源的特征向量。
[0112] 在一些实施例中,服务器获取内容资源的资源信息的过程包括:服务器获取该目标业务下的至少一个内容资源的资源介绍信息,基于该至少一个内容资源的资源介绍信
息,确定该至少一个内容资源的资源信息。如此,利用内容资源的资源介绍信息,能够快速
确定出内容资源的资源信息,提高了确定资源信息的效率,进而提高了确定关键词的效率。
[0113] 其中,资源介绍信息用于介绍该目标业务。在一些实施例中,资源介绍信息为该内容资源的资源标题,如视频标题;或者,资源介绍信息为该内容资源的资源描述,如视频描
述。需要说明的是,在实施本方案之前,业务方(如广告主)在投放目标业务下的内容资源
时,会在内容资源的投放计划(如广告计划)中,填写内容资源的资源标题或资源描述。应理
解地,内容资源的资源标题或资源描述所包含的内容均是和目标业务强相关的内容。
[0114] 在一些实施例中,服务器基于资源介绍信息,确定内容资源的资源信息的过程包括:对于任一个内容资源,服务器对该内容资源的资源介绍信息进行切词,得到该资源介绍
信息所包括的至少一个关键词,基于该至少一个关键词的词向量,确定该内容资源的资源
信息。在一种可选的实施例中,服务器基于该至少一个关键词的词向量,确定内容资源的资
源信息的过程为:服务器获取该至少一个关键词的词向量的平均值,将所获取的平均值确
定为该内容资源的资源信息。如此,利用资源介绍信息所包括的关键词的词向量,来计算内
容资源的资源信息,不仅提高了确定资源信息的效率,且通过确定用于表征内容资源的向
量,以便后续基于该资源信息来进行后续相似度的计算。
[0115] 本公开实施例中,关键词是指与目标业务相关的词汇。例如,以目标业务为女装为例,关键词可以是连衣裙、高跟鞋、风衣外套等等。关键词的词向量是指关键词的特征向量。
[0116] 在一种可选的实施例中,服务器获取关键词的词向量的过程为:对于任一个关键词,服务器在第一对应关系中,基于该关键词,确定该关键词对应的词向量,该第一对应关
系包括多个词汇以及该多个词汇对应的词向量。在另一种可选的实施例中,服务器获取关
键词的词向量的过程为:对于任一个关键词,服务器将该关键词输入词向量提取模型,通过
该词向量提取模型基于该关键词进行特征提取,得到该关键词的词向量。
[0117] 在一些实施例中,词向量提取模型为Word2vec模型。其中,Word2vec模型是一种用于产生词向量的相关模型。在一些实施例中,在实施本方案之前,服务器基于语料库所包括
的多个词汇,利用Word2vec模型生成该多个词汇对应的词向量,基于该多个词汇和该多个
词汇对应的词向量,生成该第一对应关系。在一种可选的实施例中,服务器在该语料库所包
括的多个词汇中,选取与目标业务相关的词汇,利用Word2vec模型生成该与目标业务相关
的词汇对应的词向量,基于该与目标业务相关的词汇和该与目标业务相关的词汇对应的词
向量,生成该第一对应关系。
[0118] 在步骤302中,服务器获取该至少一个内容资源所关联的至少一个目标对象的关键词,该目标对象与该目标业务之间满足第一相关度条件。
[0119] 其中,目标对象是指目标用户,具体是内容资源的转化用户。转化用户是指对目标业务下的内容资源执行过目标操作的用户,应理解地,转化用户是对目标业务感兴趣的用
户,对于目标业务来说,转化用户也即是转化率较高的高价值用户。本公开实施例中,目标
对象与目标业务之间满足第一相关度条件表示目标对象与目标业务之间具备强相关的关
系。应理解地,在进行目标业务的广告、宣传时,其核心目标是期望带来转化用户,而转化用
户也即是与目标业务具备强相关的关系的用户。在一些实施例中,目标对象采用对象标识
来表示。例如,对象标识可以是用户名称、用户账号、用户ID等。
[0120] 下面基于广告类型的内容资源为例,来对转化用户进行说明:以常规广告为例,该常规广告是基于用户的点击操作来实现转化,相应地,目标操作为对广告的点击操作,转化
用户为对该常规广告实施点击操作的用户;以应用程序广告为例,该应用程序广告是基于
用户对应用程序的下载来实现转化,相应地,目标操作为对应用程序的下载操作,转化用户
为基于该应用程序广告下载对应的应用程序的用户;以咨询广告为例,该咨询广告是基于
用户的在线咨询来实现转化,相应地,目标操作为在线咨询操作,转化用户为基于该咨询广
告发起在线咨询的用户;以信息收集广告为例,该信息收集广告是基于用户在信息表单中
的填写操作来实现转化,相应地,目标操作为在信息表单中的填写操作,转化用户为在该信
息收集广告的信息表单中填写信息的用户;以商品广告为例,该商品广告是基于用户对商
品的购买操作来实现转化,相应地,目标操作为对商品的购买操作,转化用户为基于该商品
广告购买对应商品的用户。
[0121] 在一些实施例中,对于任一个内容资源,服务器在第二对应关系中,基于该内容资源的资源标识,确定该资源标识对应的至少一个对象标识,在该至少一个对象标识中确定
目标对象的对象标识,并获取该目标对象的关键词,该第二对应关系包括多个资源标识以
及该多个资源标识对应的对象标识。在一种可选的实施例中,服务器获取目标对象的关键
词的过程为:服务器在确定目标对象后,从该目标对象的用户画像中,获取该目标对象的关
键词。其中,用户画像是一种将用户的属性、行为等具体信息抽象为用户标签,进而利用这
些用户标签来描述用户的工具。
[0122] 在一些实施例中,服务器在该至少一个内容资源所关联的目标对象中,选取转化时间满足目标条件的至少一个目标对象,该转化时间表示该目标对象对内容资源执行目标
操作的时间,获取该至少一个目标对象的关键词。其中,目标条件为预先设定的转化时间条
件,在一些实施例中,转化时间满足目标条件为转化时间处于距离当前时刻最近的目标时
间段内,该目标时间段为预先设定的时间段,如90天内。如此,通过选取转化时间距离当前
时间最近的目标时间段内的目标对象,能够选取得到时间维度上最新的转化对象,相应地,
所获取的关键词也即是最新转化用户的关键词,能够提高确定关键词的精确度。
[0123] 在步骤303中,服务器分别确定该至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词之间的相似度,该相似度表示该关键词与该内容资源之间的相似程
度。
[0124] 在一些实施例中,相似度采用向量之间的余弦相似度来表示,相应过程为:对于任一个目标对象的关键词,服务器获取该目标对象的关键词的词向量,基于该关键词的词向
量和该目标对象对应的内容资源的资源信息,计算关键词的词向量与资源信息之间的余弦
相似度,将计算得到的余弦相似度确定为该关键词与对应内容资源之间的相似度。
[0125] 其中,服务器获取目标对象的关键词的词向量的过程,参见步骤301中获取资源介绍信息中关键词的词向量的过程,不再赘述。
[0126] 上述实施例是通过计算向量之间的余弦相似度,来确定关键词和内容资源之间的相似度的过程。在另一些实施例中,服务器还基于其他相似度计算方式,来确定关键词和内
容资源之间的相似度。例如,通过计算向量之间的距离,来确定关键词和内容资源之间的相
似度。其中,距离可以是欧氏距离、曼哈顿距离、切比雪夫距离、卡方距离及汉明距离中的任
一项,本公开实施例对选择何种距离计算相似度不作限定。应理解地,距离越小,则相似度
越大,距离越大,则相似度越小。或者,服务器还能够通过计算向量之间的相关系数,来确定
关键词和内容资源之间的相似度。其中,相关系数可以是皮尔森相关系数和Jaccard相关系
数中的任一项。
[0127] 在一个具体示例中,以广告1为例,该广告1所关联的目标对象可以包括用户1和用户2,用户1的关键词可以是A,用户2的关键词可以是B;以广告2为例,该广告2所关联的目标
对象可以包括用户3和用户4,用户3的关键词可以是A,用户4的关键词可以是A和C。那么,计
算用户1的关键词A对应的相似度的过程为:计算关键词A的向量与广告1的向量之间的相似
度;计算用户2的关键词B对应的相似度的过程为:计算关键词B的向量与广告2的向量之间
的相似度;计算用户3的关键词A对应的相似度的过程为:计算关键词A的向量与广告2的向
量之间的相似度;计算用户4的关键词A对应的相似度的过程为:计算关键词A的向量与广告
2的向量之间的相似度;计算用户4的关键词C对应的相似度的过程为:计算关键词C的向量
与广告2的向量之间的相似度。
[0128] 在一种可选的实施例中,服务器确定出各个关键词与对应内容资源之间的相似度后,按相似度由高至低的排列次序进行排序,选取排列次序靠前的相似度对应的关键词,基
于所选取的关键词执行步骤304。如此,有效减少了服务器的运算量,进而提升了服务器的
处理速度。
[0129] 在步骤304中,服务器基于至少一个该关键词对应的相似度,确定至少一个该关键词对应的相关度,该相关度表示该关键词与该目标业务之间的相关程度。
[0130] 本公开实施例中,采用相关度来表示关键词与目标业务之间的相关程度,应理解地,相关度越大,表示关键词与目标业务之间的相关程度越大;相关度越小,表示关键词与
目标业务之间的相关程度越小。
[0131] 在一些实施例中,对于任一个关键词,服务器确定该关键词对应的至少一个相似度的和值,基于该至少一个相似度的和值和该至少一个相似度的数量,确定该关键词对应
的相关度。在一种可选的实施例中,服务器确定该关键词对应的至少一个相似度的和值后,
基于该至少一个相似度的和值和该至少一个相似度的数量,计算该至少一个相似度的平均
值,将计算得到的平均值确定为该关键词对应的相关度。如此,在关键词维度,采用各个关
键词对应的相似度的平均值,来表征关键词和目标业务之间的相关度,能够快速确定出各
个关键词对应的相关度,提高了确定相关度的效率,进而提高了确定关键词的效率。
[0132] 在一个具体示例中,基于步骤303中的示例,假设用户1的关键词A对应的相似度为80,用户2的关键词B对应的相似度为70,用户3的关键词A对应的相似度为90,用户4的关键
词A对应的相似度为90,用户4的关键词C对应的相似度为60,可以发现,按照关键词的维度,
关键词A分别对应有3个相似度,分别是80、90、90。那么,基于步骤304计算各个关键词对应
的相关度的过程为:对于关键词A来说,关键词A对应的相关度为(80+90+90)/3≈86.7。
[0133] 上述实施例中,利用各个关键词与对应内容资源之间相似程度,来确定各个关键词与目标业务之间的相关程度,能够快速确定出各个关键词对应的相关度,提高了确定相
关度的效率,进而提高了确定关键词的效率。
[0134] 在步骤305中,服务器将该相关度满足第二相关度条件的关键词,确定为该目标业务的关键词,该关键词用于确定该目标业务下内容资源的投放对象。
[0135] 在一些实施例中,服务器按照相关度由高至低的排列次序进行排序,将排列次序位于前目标位数的相关度对应的关键词,确定为该目标业务的关键词。其中,目标位数为预
先设定的位数,如10位。例如,选取排列次序位于前10位的相关度对应的关键词,作为该目
标业务的关键词。
[0136] 在另一些实施例中,服务器按照相关度由高至低的排列次序进行排序,将相关度达到目标阈值的相关度对应的关键词,确定为该目标业务的关键词。其中,目标阈值为预先
设定的阈值,如90。例如,选取相关度达到90的相关度对应的关键词,作为该目标业务的关
键词。
[0137] 在上述实施例中,通过选取相关度排序靠前的部分关键词,或者选取相关度大于一定阈值的部分关键词,均能够选取得到相关度较高的关键词,能够确定出与目标业务相
关度高的关键词,提高了确定关键词的精确度,进而提升了投放的精准度。
[0138] 通过上述步骤301至步骤305,实现了一种目标业务的关键词挖掘方法,能够确定出与目标业务相关度高的关键词,也就确定出了高价值的关键词。一方面,本公开实施例通
过计算各个关键词和目标业务的相关度,再选取相关度较高的关键词,使得所选取的关键
词是与目标业务息息相关的;另一方面,本公开实施例采用了目标业务内的目标对象(也即
是转化用户)的关键词,由于这部分用户对于目标业务的转化率较高,因此,在这部分用户
的关键词中进行关键词的选择,能够进一步确定出高价值的关键词。进而,业务方利用本公
开实施例所确定出的关键词进行后续的资源投放时,基于关键词所确定的用户是转化率相
对较高的用户,不仅降低了业务方选择关键词的难度,还使业务方的定向更加精准,提升了
资源的投放效果。
[0139] 在一些实施例中,业务方所操作的终端上,能够展示本公开实施例所确定出的目标业务的关键词,业务方在确定内容资源的投放对象时,可以在终端上所展示的多个关键
词中进行选择操作,终端响应于业务方对多个关键词的选择操作,获取被选中的关键词,基
于被选中的关键词向服务器发送对内容资源的投放请求,该投放请求携带被选中的关键
词。服务器响应于接收到内容资源的投放请求,基于该投放请求携带的关键词,确定携带有
该关键词的用户,也即是确定出了内容资源的投放对象,进而向所确定的用户对应的终端
发送该内容资源。如此,实现了一种基于关键词的投放方法,且由于所采用的关键词是与目
标业务相关度高的关键词,因此,有效提升了投放的精准度。
[0140] 本公开实施例提供的技术方案,在确定目标业务的关键词时,不仅考虑到了目标业务下的内容资源,还考虑到了内容资源所关联的目标对象的关键词,由于目标对象是与
目标业务满足第一相关度条件的用户,基于该目标对象的关键词和目标业务之间的相关
度,来确定目标业务的关键词,能够确定出与目标业务相关度高的关键词,提高了确定关键
词的精确度,进而基于所确定的关键词,再确定目标业务下内容资源的投放对象,提升了投
放的精准度。
[0141] 图4是根据一示例性实施例示出的一种关键词确定装置的框图。参见图4,该装置包括获取单元401,相关度确定单元402和关键词确定单元403:
[0142] 获取单元401,被配置为执行获取目标业务下的至少一个内容资源的资源信息和该至少一个内容资源所关联的至少一个目标对象的关键词,该目标对象与该目标业务之间
满足第一相关度条件;
[0143] 相关度确定单元402,被配置为执行基于该至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词,确定至少一个该关键词对应的相关度,该相关度表示该
关键词与该目标业务之间的相关程度;
[0144] 关键词确定单元403,被配置为执行将该相关度满足第二相关度条件的关键词,确定为该目标业务的关键词,该关键词用于确定该目标业务下内容资源的投放对象。
[0145] 本公开实施例提供的技术方案,在确定目标业务的关键词时,不仅考虑到了目标业务下的内容资源,还考虑到了内容资源所关联的目标对象的关键词,由于目标对象是与
目标业务满足第一相关度条件的用户,基于该目标对象的关键词和目标业务之间的相关
度,来确定目标业务的关键词,能够确定出与目标业务相关度高的关键词,提高了确定关键
词的精确度,进而基于所确定的关键词,再确定目标业务下内容资源的投放对象,提升了投
放的精准度。
[0146] 在一些实施例中,该获取单元401包括:
[0147] 介绍信息获取子单元,被配置为执行获取该目标业务下的至少一个内容资源的资源介绍信息,该资源介绍信息用于介绍该目标业务;
[0148] 资源信息获取子单元,被配置为执行基于该至少一个内容资源的资源介绍信息,确定该至少一个内容资源的资源信息。
[0149] 在一些实施例中,该资源信息获取子单元,被配置为执行:
[0150] 对于任一个内容资源,对该内容资源的资源介绍信息进行切词,得到该资源介绍信息所包括的至少一个关键词;
[0151] 基于该至少一个关键词的词向量,确定该内容资源的资源信息。
[0152] 在一些实施例中,该获取单元401包括:
[0153] 目标对象获取子单元,被配置为执行在该至少一个内容资源所关联的目标对象中,选取转化时间满足目标条件的至少一个目标对象,该转化时间表示该目标对象对内容
资源执行目标操作的时间;
[0154] 关键词获取子单元,被配置为执行获取该至少一个目标对象的关键词。
[0155] 在一些实施例中,该相关度确定单元402,包括:
[0156] 相似度确定子单元,被配置为执行分别确定该至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词之间的相似度,该相似度表示该关键词与该内容资源之
间的相似程度;
[0157] 相关度确定子单元,被配置为执行基于至少一个该关键词对应的相似度,确定至少一个该关键词对应的相关度。
[0158] 在一些实施例中,该相关度确定子单元,被配置为执行:
[0159] 对于任一个关键词,确定该关键词对应的至少一个相似度的和值;
[0160] 基于该至少一个相似度的和值和该至少一个相似度的数量,确定该关键词对应的相关度。
[0161] 在一些实施例中,该关键词确定单元403,被配置为执行下述任一项:
[0162] 按照相关度由高至低的排列次序进行排序,将排列次序位于前目标位数的相关度对应的关键词,确定为该目标业务的关键词;
[0163] 按照相关度由高至低的排列次序进行排序,将相关度达到目标阈值的相关度对应的关键词,确定为该目标业务的关键词。
[0164] 需要说明的是:上述实施例提供的关键词确定装置在确定关键词时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功
能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部
分功能。另外,上述实施例提供的关键词确定装置与关键词确定方法实施例属于同一构思,
其具体实现过程详见方法实施例,这里不再赘述。
[0165] 本公开实施例提到的计算机设备可以提供为一种服务器。图5是根据一示例性实施例示出的一种服务器的框图,该服务器500可因配置或性能不同而产生比较大的差异,可
以包括一个或多个处理器(Central Processing Units,CPU)501和一个或多个的存储器
502,其中,该一个或多个存储器502中存储有至少一条程序代码,该至少一条程序代码由该
一个或多个处理器501加载并执行以实现上述各个方法实施例提供的关键词确定方法中服
务器执行的过程。当然,该服务器500还可以具有有线或无线网络接口、键盘以及输入输出
接口等部件,以便进行输入输出,该服务器500还可以包括其他用于实现设备功能的部件,
在此不做赘述。
[0166] 在示例性实施例中,还提供了一种包括程序代码的计算机可读存储介质,例如包括程序代码的存储器502,上述程序代码可由服务器500的处理器501执行以完成上述关键
词确定方法。可选地,计算机可读存储介质可以是ROM(Read‑Only Memory,只读内存)、RAM
(Random Access Memory,随机存取存储器)、CD‑ROM(Compact‑Disc Read‑Only Memory,只
读光盘)、磁带、软盘和光数据存储设备等。
[0167] 在示例性实施例中,还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的关键词确定方法。
[0168] 在一些实施例中,本公开实施例所涉及的计算机程序可被部署在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过
通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算
机设备可以组成区块链系统。
[0169] 本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或
者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识
或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的
权利要求指出。
[0170] 应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。