关键词确定方法、装置、计算机设备及介质转让专利
申请号 : CN202111295116.9
文献号 : CN113724022B
文献日 : 2022-03-25
发明人 : 李栋孟 , 高小平 , 郑秋野 , 徐禄军 , 何攀
申请人 : 北京达佳互联信息技术有限公司
摘要 :
权利要求 :
1.一种关键词确定方法,其特征在于,所述方法包括:获取目标业务下的至少一个内容资源的资源信息;
在所述至少一个内容资源所关联的目标对象中,选取转化时间满足目标条件的至少一个目标对象,获取所述至少一个目标对象的关键词,所述转化时间表示所述目标对象对内容资源执行目标操作的时间,所述目标对象与所述目标业务之间满足第一相关度条件;
基于所述至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词,确定至少一个所述关键词对应的相关度,所述相关度表示所述关键词与所述目标业务之间的相关程度;
将所述相关度满足第二相关度条件的关键词,确定为所述目标业务的关键词,所述关键词用于确定所述目标业务下内容资源的投放对象。
2.根据权利要求1所述的关键词确定方法,其特征在于,所述目标业务下的至少一个内容资源的资源信息的获取过程包括:获取所述目标业务下的至少一个内容资源的资源介绍信息,所述资源介绍信息用于介绍所述目标业务;
基于所述至少一个内容资源的资源介绍信息,确定所述至少一个内容资源的资源信息。
3.根据权利要求2所述的关键词确定方法,其特征在于,所述基于所述至少一个内容资源的资源介绍信息,确定所述至少一个内容资源的资源信息包括:对于任一个内容资源,对所述内容资源的资源介绍信息进行切词,得到所述资源介绍信息所包括的至少一个关键词;
基于所述至少一个关键词的词向量,确定所述内容资源的资源信息。
4.根据权利要求1所述的关键词确定方法,其特征在于,所述基于所述至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词,确定至少一个所述关键词对应的相关度包括:
分别确定所述至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词之间的相似度,所述相似度表示所述关键词与所述内容资源之间的相似程度;
基于至少一个所述关键词对应的相似度,确定至少一个所述关键词对应的相关度。
5.根据权利要求4所述的关键词确定方法,其特征在于,所述基于至少一个所述关键词对应的相似度,确定至少一个所述关键词对应的相关度包括:对于任一个关键词,确定所述关键词对应的至少一个相似度的和值;
基于所述至少一个相似度的和值和所述至少一个相似度的数量,确定所述关键词对应的相关度。
6.根据权利要求1所述的关键词确定方法,其特征在于,所述将所述相关度满足第二相关度条件的关键词,确定为所述目标业务的关键词包括下述任一项:按照相关度由高至低的排列次序进行排序,将排列次序位于前目标位数的相关度对应的关键词,确定为所述目标业务的关键词;
按照相关度由高至低的排列次序进行排序,将相关度达到目标阈值的相关度对应的关键词,确定为所述目标业务的关键词。
7.一种关键词确定装置,其特征在于,所述装置包括:获取单元,被配置为执行获取目标业务下的至少一个内容资源的资源信息;
所述获取单元,还被配置为执行在所述至少一个内容资源所关联的目标对象中,选取转化时间满足目标条件的至少一个目标对象,获取所述至少一个目标对象的关键词,所述转化时间表示所述目标对象对内容资源执行目标操作的时间,所述目标对象与所述目标业务之间满足第一相关度条件;
相关度确定单元,被配置为执行基于所述至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词,确定至少一个所述关键词对应的相关度,所述相关度表示所述关键词与所述目标业务之间的相关程度;
关键词确定单元,被配置为执行将所述相关度满足第二相关度条件的关键词,确定为所述目标业务的关键词,所述关键词用于确定所述目标业务下内容资源的投放对象。
8.根据权利要求7所述的关键词确定装置,其特征在于,所述获取单元包括:介绍信息获取子单元,被配置为执行获取所述目标业务下的至少一个内容资源的资源介绍信息,所述资源介绍信息用于介绍所述目标业务;
资源信息获取子单元,被配置为执行基于所述至少一个内容资源的资源介绍信息,确定所述至少一个内容资源的资源信息。
9.根据权利要求8所述的关键词确定装置,其特征在于,所述资源信息获取子单元,被配置为执行:
对于任一个内容资源,对所述内容资源的资源介绍信息进行切词,得到所述资源介绍信息所包括的至少一个关键词;
基于所述至少一个关键词的词向量,确定所述内容资源的资源信息。
10.根据权利要求7所述的关键词确定装置,其特征在于,所述相关度确定单元,包括:相似度确定子单元,被配置为执行分别确定所述至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词之间的相似度,所述相似度表示所述关键词与所述内容资源之间的相似程度;
相关度确定子单元,被配置为执行基于至少一个所述关键词对应的相似度,确定至少一个所述关键词对应的相关度。
11.根据权利要求10所述的关键词确定装置,其特征在于,所述相关度确定子单元,被配置为执行:
对于任一个关键词,确定所述关键词对应的至少一个相似度的和值;
基于所述至少一个相似度的和值和所述至少一个相似度的数量,确定所述关键词对应的相关度。
12.根据权利要求7所述的关键词确定装置,其特征在于,所述关键词确定单元,被配置为执行下述任一项:
按照相关度由高至低的排列次序进行排序,将排列次序位于前目标位数的相关度对应的关键词,确定为所述目标业务的关键词;
按照相关度由高至低的排列次序进行排序,将相关度达到目标阈值的相关度对应的关键词,确定为所述目标业务的关键词。
13.一种计算机设备,其特征在于,所述计算机设备包括:一个或多个处理器;
用于存储所述处理器可执行程序代码的存储器;
其中,所述处理器被配置为执行所述程序代码,以实现如权利要求1至6中任一项所述的关键词确定方法。
14.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的程序代码由计算机设备的处理器执行时,使得计算机设备能够执行如权利要求1至6中任一项所述的关键词确定方法。
说明书 :
关键词确定方法、装置、计算机设备及介质
技术领域
背景技术
务方的关键词库,再根据用户基于资源的交互行为,来为用户添加各种各样的关键词标签。
进一步地,当业务方再次投放资源时,会在关键词库中选取关键词,向携带该关键词的用户
投放资源,从而实现定向投放的效果。
发明内容
度;
第一相关度条件的用户,基于该目标对象的关键词和目标业务之间的相关度,来确定目标
业务的关键词,能够确定出与目标业务相关度高的关键词,提高了确定关键词的精确度,进
而基于所确定的关键词,再确定目标业务下内容资源的投放对象,提升了投放的精准度。
后续基于该向量来进行后续相似度的计算。
提高确定关键词的精确度。
定相关度的效率,进而提高了确定关键词的效率。
相关度的效率,进而提高了确定关键词的效率。
关度高的关键词,提高了确定关键词的精确度,进而提升了投放的精准度。
第一相关度条件;
词与该目标业务之间的相关程度;
资源执行目标操作的时间;
间的相似程度;
计算机设备能够执行上述的关键词确定方法。
附图说明
具体实施方式
的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或
描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相
一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面
相一致的装置和方法的例子。
开实施例中,关键词是指与目标业务相关的词汇。
生成业务方的关键词库,再根据用户基于资源的交互行为,来为用户添加各种各样的关键
词标签。进一步地,当业务方再次向用户投放资源时,会在关键词库中选取关键词,向携带
该关键词的用户投放资源,来实现投放。然而,相关技术难以确定出与业务相关度高的关键
词,降低了投放的精准度。
于该至少一个内容资源的资源信息和所关联的至少一个目标对象的关键词,确定至少一个
该关键词对应的相关度,将该相关度满足第二相关度条件的关键词,确定为该目标业务的
关键词。如此,提高了确定关键词的精确度,进而提升了投放的精准度。
务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发
网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
的资源信息和所关联的至少一个目标对象的关键词,确定至少一个该关键词对应的相关
度,将该相关度满足第二相关度条件的关键词,确定为该目标业务的关键词。
操作,向服务器101发送关键词的确定请求,以请求该服务器101确定该目标业务的关键词。
接入有线网络或无线网络。终端102可以泛指多个终端中的一个,本实施例仅以终端102来
举例说明。本领域技术人员可以知晓,上述终端的数量可以更多或更少。
一相关度条件。
标业务之间的相关程度。
目标业务满足第一相关度条件的用户,基于该目标对象的关键词和目标业务之间的相关
度,来确定目标业务的关键词,能够确定出与目标业务相关度高的关键词,提高了确定关键
词的精确度,进而基于所确定的关键词,再确定目标业务下内容资源的投放对象,提升了投
放的精准度。
图,参见图3,该方法包括以下步骤。
可以是钢铁行业、服装行业、食品行业等。在另一些实施例中,目标业务为所属行业内的具
体业务。例如,以所属行业为服装行业为例,目标业务可以是女装业务、男装业务、童装业务
等等。
的内容资源可以是目标业务的广告视频、宣传视频等等。在一些实施例中,内容资源采用资
源标识来表示。例如,资源标识可以是资源名称、资源编号、资源ID(Identification,身份
标识符)等。
息,确定该至少一个内容资源的资源信息。如此,利用内容资源的资源介绍信息,能够快速
确定出内容资源的资源信息,提高了确定资源信息的效率,进而提高了确定关键词的效率。
述。需要说明的是,在实施本方案之前,业务方(如广告主)在投放目标业务下的内容资源
时,会在内容资源的投放计划(如广告计划)中,填写内容资源的资源标题或资源描述。应理
解地,内容资源的资源标题或资源描述所包含的内容均是和目标业务强相关的内容。
信息所包括的至少一个关键词,基于该至少一个关键词的词向量,确定该内容资源的资源
信息。在一种可选的实施例中,服务器基于该至少一个关键词的词向量,确定内容资源的资
源信息的过程为:服务器获取该至少一个关键词的词向量的平均值,将所获取的平均值确
定为该内容资源的资源信息。如此,利用资源介绍信息所包括的关键词的词向量,来计算内
容资源的资源信息,不仅提高了确定资源信息的效率,且通过确定用于表征内容资源的向
量,以便后续基于该资源信息来进行后续相似度的计算。
系包括多个词汇以及该多个词汇对应的词向量。在另一种可选的实施例中,服务器获取关
键词的词向量的过程为:对于任一个关键词,服务器将该关键词输入词向量提取模型,通过
该词向量提取模型基于该关键词进行特征提取,得到该关键词的词向量。
的多个词汇,利用Word2vec模型生成该多个词汇对应的词向量,基于该多个词汇和该多个
词汇对应的词向量,生成该第一对应关系。在一种可选的实施例中,服务器在该语料库所包
括的多个词汇中,选取与目标业务相关的词汇,利用Word2vec模型生成该与目标业务相关
的词汇对应的词向量,基于该与目标业务相关的词汇和该与目标业务相关的词汇对应的词
向量,生成该第一对应关系。
户,对于目标业务来说,转化用户也即是转化率较高的高价值用户。本公开实施例中,目标
对象与目标业务之间满足第一相关度条件表示目标对象与目标业务之间具备强相关的关
系。应理解地,在进行目标业务的广告、宣传时,其核心目标是期望带来转化用户,而转化用
户也即是与目标业务具备强相关的关系的用户。在一些实施例中,目标对象采用对象标识
来表示。例如,对象标识可以是用户名称、用户账号、用户ID等。
用户为对该常规广告实施点击操作的用户;以应用程序广告为例,该应用程序广告是基于
用户对应用程序的下载来实现转化,相应地,目标操作为对应用程序的下载操作,转化用户
为基于该应用程序广告下载对应的应用程序的用户;以咨询广告为例,该咨询广告是基于
用户的在线咨询来实现转化,相应地,目标操作为在线咨询操作,转化用户为基于该咨询广
告发起在线咨询的用户;以信息收集广告为例,该信息收集广告是基于用户在信息表单中
的填写操作来实现转化,相应地,目标操作为在信息表单中的填写操作,转化用户为在该信
息收集广告的信息表单中填写信息的用户;以商品广告为例,该商品广告是基于用户对商
品的购买操作来实现转化,相应地,目标操作为对商品的购买操作,转化用户为基于该商品
广告购买对应商品的用户。
目标对象的对象标识,并获取该目标对象的关键词,该第二对应关系包括多个资源标识以
及该多个资源标识对应的对象标识。在一种可选的实施例中,服务器获取目标对象的关键
词的过程为:服务器在确定目标对象后,从该目标对象的用户画像中,获取该目标对象的关
键词。其中,用户画像是一种将用户的属性、行为等具体信息抽象为用户标签,进而利用这
些用户标签来描述用户的工具。
操作的时间,获取该至少一个目标对象的关键词。其中,目标条件为预先设定的转化时间条
件,在一些实施例中,转化时间满足目标条件为转化时间处于距离当前时刻最近的目标时
间段内,该目标时间段为预先设定的时间段,如90天内。如此,通过选取转化时间距离当前
时间最近的目标时间段内的目标对象,能够选取得到时间维度上最新的转化对象,相应地,
所获取的关键词也即是最新转化用户的关键词,能够提高确定关键词的精确度。
度。
量和该目标对象对应的内容资源的资源信息,计算关键词的词向量与资源信息之间的余弦
相似度,将计算得到的余弦相似度确定为该关键词与对应内容资源之间的相似度。
容资源之间的相似度。例如,通过计算向量之间的距离,来确定关键词和内容资源之间的相
似度。其中,距离可以是欧氏距离、曼哈顿距离、切比雪夫距离、卡方距离及汉明距离中的任
一项,本公开实施例对选择何种距离计算相似度不作限定。应理解地,距离越小,则相似度
越大,距离越大,则相似度越小。或者,服务器还能够通过计算向量之间的相关系数,来确定
关键词和内容资源之间的相似度。其中,相关系数可以是皮尔森相关系数和Jaccard相关系
数中的任一项。
对象可以包括用户3和用户4,用户3的关键词可以是A,用户4的关键词可以是A和C。那么,计
算用户1的关键词A对应的相似度的过程为:计算关键词A的向量与广告1的向量之间的相似
度;计算用户2的关键词B对应的相似度的过程为:计算关键词B的向量与广告2的向量之间
的相似度;计算用户3的关键词A对应的相似度的过程为:计算关键词A的向量与广告2的向
量之间的相似度;计算用户4的关键词A对应的相似度的过程为:计算关键词A的向量与广告
2的向量之间的相似度;计算用户4的关键词C对应的相似度的过程为:计算关键词C的向量
与广告2的向量之间的相似度。
于所选取的关键词执行步骤304。如此,有效减少了服务器的运算量,进而提升了服务器的
处理速度。
目标业务之间的相关程度越小。
的相关度。在一种可选的实施例中,服务器确定该关键词对应的至少一个相似度的和值后,
基于该至少一个相似度的和值和该至少一个相似度的数量,计算该至少一个相似度的平均
值,将计算得到的平均值确定为该关键词对应的相关度。如此,在关键词维度,采用各个关
键词对应的相似度的平均值,来表征关键词和目标业务之间的相关度,能够快速确定出各
个关键词对应的相关度,提高了确定相关度的效率,进而提高了确定关键词的效率。
词A对应的相似度为90,用户4的关键词C对应的相似度为60,可以发现,按照关键词的维度,
关键词A分别对应有3个相似度,分别是80、90、90。那么,基于步骤304计算各个关键词对应
的相关度的过程为:对于关键词A来说,关键词A对应的相关度为(80+90+90)/3≈86.7。
关度的效率,进而提高了确定关键词的效率。
先设定的位数,如10位。例如,选取排列次序位于前10位的相关度对应的关键词,作为该目
标业务的关键词。
设定的阈值,如90。例如,选取相关度达到90的相关度对应的关键词,作为该目标业务的关
键词。
关度高的关键词,提高了确定关键词的精确度,进而提升了投放的精准度。
过计算各个关键词和目标业务的相关度,再选取相关度较高的关键词,使得所选取的关键
词是与目标业务息息相关的;另一方面,本公开实施例采用了目标业务内的目标对象(也即
是转化用户)的关键词,由于这部分用户对于目标业务的转化率较高,因此,在这部分用户
的关键词中进行关键词的选择,能够进一步确定出高价值的关键词。进而,业务方利用本公
开实施例所确定出的关键词进行后续的资源投放时,基于关键词所确定的用户是转化率相
对较高的用户,不仅降低了业务方选择关键词的难度,还使业务方的定向更加精准,提升了
资源的投放效果。
词中进行选择操作,终端响应于业务方对多个关键词的选择操作,获取被选中的关键词,基
于被选中的关键词向服务器发送对内容资源的投放请求,该投放请求携带被选中的关键
词。服务器响应于接收到内容资源的投放请求,基于该投放请求携带的关键词,确定携带有
该关键词的用户,也即是确定出了内容资源的投放对象,进而向所确定的用户对应的终端
发送该内容资源。如此,实现了一种基于关键词的投放方法,且由于所采用的关键词是与目
标业务相关度高的关键词,因此,有效提升了投放的精准度。
目标业务满足第一相关度条件的用户,基于该目标对象的关键词和目标业务之间的相关
度,来确定目标业务的关键词,能够确定出与目标业务相关度高的关键词,提高了确定关键
词的精确度,进而基于所确定的关键词,再确定目标业务下内容资源的投放对象,提升了投
放的精准度。
满足第一相关度条件;
关键词与该目标业务之间的相关程度;
目标业务满足第一相关度条件的用户,基于该目标对象的关键词和目标业务之间的相关
度,来确定目标业务的关键词,能够确定出与目标业务相关度高的关键词,提高了确定关键
词的精确度,进而基于所确定的关键词,再确定目标业务下内容资源的投放对象,提升了投
放的精准度。
资源执行目标操作的时间;
间的相似程度;
能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部
分功能。另外,上述实施例提供的关键词确定装置与关键词确定方法实施例属于同一构思,
其具体实现过程详见方法实施例,这里不再赘述。
以包括一个或多个处理器(Central Processing Units,CPU)501和一个或多个的存储器
502,其中,该一个或多个存储器502中存储有至少一条程序代码,该至少一条程序代码由该
一个或多个处理器501加载并执行以实现上述各个方法实施例提供的关键词确定方法中服
务器执行的过程。当然,该服务器500还可以具有有线或无线网络接口、键盘以及输入输出
接口等部件,以便进行输入输出,该服务器500还可以包括其他用于实现设备功能的部件,
在此不做赘述。
词确定方法。可选地,计算机可读存储介质可以是ROM(Read‑Only Memory,只读内存)、RAM
(Random Access Memory,随机存取存储器)、CD‑ROM(Compact‑Disc Read‑Only Memory,只
读光盘)、磁带、软盘和光数据存储设备等。
通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算
机设备可以组成区块链系统。
者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识
或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的
权利要求指出。