关键词推荐方法、装置、计算设备及存储介质转让专利

申请号 : CN201711068460.8

文献号 : CN110020132B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 汪洋陈戈黄东波赵鹏昊

申请人 : 腾讯科技(北京)有限公司

摘要 :

本申请公开了关键词推荐方法、装置、计算设备及存储介质。其中,关键词推荐方法,包括:获取关键词集合;确定关键词集合中每个关键词对应的频度参数值;根据每个关键词对应的频度参数值对关键词集合中各关键词进行排序,并从相应的排序结果中提取与预定投放效果有关的关键词,并将其作为推荐词集合。

权利要求 :

1.一种关键词推荐方法,其特征在于,包括:

获取关键词集合,所述关键词集合包括文本集合中各文本对应的关键词;

确定所述关键词集合中每个关键词对应的频度参数值,包括:确定所关键词集合中每个关键词的文本频率,其中,每个关键词的文本频率表示在所述文本集合中包含该关键词的文本的总数量;计算所述关键词集合中每个关键词对于所述关键词集合的重要度参数值;以及对每个关键词的文本频率和重要度参数值进行加权计算,并将相应的计算结果作为该关键词的频度参数值;其中,每个关键词对应的频度参数值用于描述该关键词的使用广泛度;以及根据所述每个关键词对应的频度参数值对所述关键词集合中各关键词进行排序,并从相应的排序结果中提取与预定投放效果有关的关键词,并将其作为推荐词集合。

2.如权利要求1所述的方法,其中,所述获取关键词集合,包括:

获取包含多个文本的文本集合,其中每个文本用于描述一个用于呈现在页面中的附加内容,并获取每个文本所对应附加内容的投放效果记录;

对所述文本集合中各文本分别进行分词操作,并获取各个文本对应的关键词,并生成所述文本集合对应的关键词集合。

3.如权利要求2所述的方法,其中,所述获取包含多个文本的文本集合,包括:获取属于预定行业类别并投放至预定投放渠道的多个附加内容,并生成所述文本集合,所述文本集合包括所述多个附加内容中各附加内容对应的文本。

4.如权利要求1所述的方法,其中,所述计算所述关键词集合中每个关键词对于该关键词集合的重要度参数值的步骤包括:构建包含多个结点的网络图,该网络图中每个结点表示所述关键词集合中一个关键词,所述网络图中包含于所述文本集合中任一个文本的两个结点相连接,所述网络图中每对相连接的两个结点的相关性参数值对应于所述文本集合中包含这两个结点的文本的数量;

根据文本排列算法,计算所述网络图中每个结点的权重值,并将其作为该结点的重要度参数值。

5.如权利要求2所述的方法,其中,所述每个文本的所对应的投放效果记录包括该文本对应的曝光记录和点击记录,所述从相应的排序结果中提取与预定投放效果有关的关键词,并将其作为推荐词集合,包括:按照频度参数值由高到低的顺序,从所述排序结果中提取多个关键词,并将其作为第一筛选集合;

计算所述第一筛选集合中每个关键词的曝光支持度,所述曝光支持度表示所述文本集合中包含该关键词的文本所对应的曝光次数与所述文本集合中所有文本所对应的总曝光次数的比值;

提取所述第一筛选集合中曝光支持度高于第一阈值的关键词,并将所提取的关键词作为第二筛选集合;

根据所述文本集合中每个文本对应的曝光记录和点击记录,确定该文本对应的点击率;

计算所述第二筛选集合中每个关键词的曝光置信度,其中,每个关键词的曝光置信度表示所述文本集合中包含该关键词且点击率高于第二阈值的文本的曝光次数与所述文本集合中包含该关键词的文本的总曝光次数的比值;以及根据所述第二筛选集合中每个关键词的曝光置信度对所述第二筛选集合中各关键词进行排序,并按照曝光置信度由高到低的顺序,从相应的排序结果中提取多个关键词,并将所提取关键词作为所述推荐词集合。

6.如权利要求1所述的方法,还包括:从所述排序结果中提取降低投放效果的关键词,并将其作为非推荐词集合。

7.如权利要求5所述的方法,还包括:从所述第二筛选集合对应的排序结果中提取不属于所述推荐词集合的多个关键词,并将所提取的关键词作为非推荐词集合。

8.如权利要求2所述的方法,其中,所述每个文本的所对应的投放效果记录包括该文本对应的点击记录和转化记录,所述从相应的排序结果中提取与预定投放效果有关的关键词,并将其作为推荐词集合,包括:按照频度参数值由高到低的顺序,从所述排序结果中提取多个关键词,并将其作为第一筛选集合;

计算所述第一筛选集合中每个关键词的点击支持度,所述点击支持度表示所述文本集合中包含该关键词的文本所对应的点击次数与所述文本集合中所有文本所对应的总点击次数的比值;

提取所述第一筛选集合中点击支持度高于第三阈值的关键词,并将所提取的关键词作为第三筛选集合;

根据所述文本集合中每个文本对应的点击记录和转化记录,确定该文本对应的转化率;

计算所述第三筛选集合中每个关键词的点击置信度,其中,每个关键词的点击置信度表示所述文本集合中包含该关键词且转化率高于第四阈值的文本的点击次数与所述文本集合中包含该关键词的文本的总点击次数的比值;以及根据所述第三筛选集合中每个关键词的点击置信度对所述第三筛选集合中各关键词进行排序,并按照点击置信度由高到低的顺序,从相应的排序结果中提取多个关键词,并将所提取关键词作为所述推荐词集合。

9.一种呈现推荐词的方法,其特征在于,包括:

获取根据权利要求1所述的方法而生成的多个推荐词集合,每个推荐词集合的属性值包括行业类别和投放渠道;

响应于选择推荐词集合的操作,提供呈现所述多个推荐词集合所对应属性选项的用户界面,所述属性选项包括行业类别和投放渠道;以及响应于对所述用户界面中属性选项的选择操作,确定并呈现与被选的属性值对应的推荐词集合,以便提示用户在编辑文本时使用该推荐词集合中关键词。

10.如权利要求9所述的方法,还包括:确定并呈现与被选的属性值对应的非推荐词集合,以便提示用户在编辑文本时避免使用所述非推荐词集合中关键词。

11.一种关键词推荐装置,其特征在于,包括:

获取单元,用于获取关键词集合,所述关键词集合包括文本集合中各文本对应的关键词;

频度确定单元,用于确定所述关键词集合中每个关键词对应的频度参数值,包括:确定所关键词集合中每个关键词的文本频率,其中,每个关键词的文本频率表示在所述文本集合中包含该关键词的文本的总数量;计算所述关键词集合中每个关键词对于所述关键词集合的重要度参数值;以及对每个关键词的文本频率和重要度参数值进行加权计算,并将相应的计算结果作为该关键词的频度参数值;其中,每个关键词对应的频度参数值用于描述该关键词的使用广泛度;

筛选单元,用于根据所述每个关键词对应的频度参数值对所述关键词集合中各关键词进行排序,并从相应的排序结果中提取与预定投放效果有关的关键词,并将其作为推荐词集合。

12.一种呈现推荐词的装置,其特征在于,包括:

获取单元,用于获取根据权利要求1所述的方法而生成的多个推荐词集合,每个推荐词集合的属性值包括行业类别和投放渠道;

选择单元,响应于选择推荐词集合的操作,提供呈现所述多个推荐词集合所对应属性选项的用户界面,所述属性选项包括行业类别和投放渠道;以及呈现单元,响应于对所述用户界面中属性选项的选择操作,确定并呈现与被选的属性值对应的推荐词集合,以便提示用户在编辑文本时使用该推荐词集合中关键词。

13.一种计算设备,其特征在于包括:

一个或多个处理器;

存储器;以及

一个或多个程序,存储在该存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行权利要求1‑10中任一项所述方法的指令。

14.一种存储介质,存储有一个或多个程序,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行如权利要求1‑10中任一项所述的方法。

说明书 :

关键词推荐方法、装置、计算设备及存储介质

技术领域

[0001] 本申请涉及信息投放领域,尤其涉及关键词推荐方法、装置、计算设备及存储介质。

背景技术

[0002] 在用户通过终端设备访问网络时,终端设备所显示的页面通常还呈现有附件内容(例如广告、新闻等等)。这些附加内容的表达词语(例如其中的关键词)会直接影响用户对该附加内容的兴趣度。

发明内容

[0003] 根据本申请一个方面,提出了一种关键词推荐方法,包括:获取关键词集合;确定关键词集合中每个关键词对应的频度参数值,每个关键词对应的频度参数值用于描述该关键词的使用广泛度;根据每个关键词对应的频度参数值对关键词集合中各关键词进行排序,并从相应的排序结果中提取与预定投放效果有关的关键词,并将其作为推荐词集合。
[0004] 根据本申请又一个方面,提供一种呈现推荐词的方法,包括:获取根据本申请关键词推荐方法而生成的多个推荐词集合,每个推荐词集合的属性值包括行业类别和投放渠道;响应于选择推荐词集合的操作,提供呈现多个推荐词集合所对应属性选项的用户界面,属性选项包括行业类别和投放渠道;响应于对用户界面中属性选项的选择操作,确定并呈现与被选的属性值对应的推荐词集合,以便提示用户在编辑文本时使用该推荐词集合中关键词。
[0005] 根据本申请又一个方面,提供一种关键词推荐装置,包括:获取单元、频度确定单元、筛选单元。获取单元用于获取关键词集合。频度确定单元用于确定所述关键词集合中每个关键词对应的频度参数值,每个关键词对应的频度参数值用于描述该关键词的使用广泛度。筛选单元用于根据所述每个关键词对应的频度参数值对所述关键词集合中各关键词进行排序,并从相应的排序结果中提取与预定投放效果有关的关键词,并将其作为推荐词集合。
[0006] 在一些实施例中,获取单元还包括文本获取模块和关键词生成模块。其中,文本获取模块用于获取包含多个文本的文本集合,其中每个文本用于描述一个用于呈现在页面中的附加内容,并获取每个文本所对应附加内容的投放效果记录。关键词生成模块用于对文本集合中各文本分别进行分词操作,并获取各个文本对应的关键词,并生成所述文本集合对应的关键词集合。关键词集合包括各文本对应的关键词。
[0007] 在一些实施例中,文本获取模块根据下述方式获取包含多个文本的文本集合:获取属于预定行业类别并投放至预定投放渠道的多个附加内容,并生成文本集合,文本集合包括所述多个附加内容中各附加内容对应的文本。
[0008] 在一些实施例中,频度确定单元根据下述方式确定关键词集合中每个关键词对应的频度参数值:确定所述关键词集合中每个关键词的文本频率,其中,每个关键词的文本频率表示在所述文本集合中包含该关键词的文本的总数量;计算所述关键词集合中每个关键词对于所述关键词集合的重要度参数值;对每个关键词的文本频率和重要度参数值进行加权计算,并将相应的计算结果作为该关键词的频度参数值。
[0009] 在一些实施例中,频度确定单元根据下述方式计算所述关键词集合中每个关键词对于该关键词集合的重要度参数值:构建包含多个结点的网络图,该网络图中每个结点表示所述关键词集合中一个关键词,网络图中包含于文本集合中任一个文本的两个结点相连接,网络图中每对相连接的两个结点的相关性参数值对应于文本集合中包含这两个结点的文本的数量;根据文本排列算法,计算所述网络图中每个结点的权重值,并将其作为该结点的重要度参数值。
[0010] 在一些实施例中,每个文本的所对应的投放效果记录包括该文本对应的曝光记录和点击记录,筛选单元根据下述方式从相应的排序结果中提取与预定投放效果有关的关键词,并将其作为推荐词集合:按照频度参数值由高到低的顺序,从所述排序结果中提取多个关键词,并将其作为第一筛选集合;计算所述第一筛选集合中每个关键词的曝光支持度,所述曝光支持度表示所述文本集合中包含该关键词的文本所对应的曝光次数与所述文本集合中所有文本所对应的总曝光次数的比值;提取所述第一筛选集合中曝光支持度高于第一阈值的关键词,并将所提取的关键词作为第二筛选集合;根据所述文本集合中每个文本对应的曝光记录和点击记录,确定该文本对应的点击率;计算第二筛选集合中每个关键词的曝光置信度,其中,每个关键词的曝光置信度表示文本集合中包含该关键词且点击率高于第二阈值的文本的曝光次数与文本集合中包含该关键词的文本的总曝光次数的比值;根据第二筛选集合中每个关键词的曝光置信度对第二筛选集合中各关键词进行排序,并按照曝光置信度由高到低的顺序,从相应的排序结果中提取多个关键词,并将所提取关键词作为所述推荐词集合。
[0011] 在一些实施例中,筛选单元还用于根据文本集合中各文本所对应的投放效果记录,从关键词集合的排序结果中提取降低投放效果的关键词,并将其作为非推荐词集合。
[0012] 在一些实施例中,筛选单元还用于从所述第二筛选集合对应的排序结果中提取不属于所述推荐词集合的多个关键词,并将所提取的关键词作为非推荐词集合。
[0013] 在一些实施例中,所述每个文本的所对应的投放效果记录包括该文本对应的点击记录和转化记录,筛选单元根据下述方式从相应的排序结果中提取与预定投放效果有关的关键词,并将其作为推荐词集合:按照频度参数值由高到低的顺序,从所述排序结果中提取多个关键词,并将其作为第一筛选集合;计算所述第一筛选集合中每个关键词的点击支持度,所述点击支持度表示所述文本集合中包含该关键词的文本所对应的点击次数与所述文本集合中所有文本所对应的总点击次数的比值;提取所述第一筛选集合中点击支持度高于第三阈值的关键词,并将所提取的关键词作为第三筛选集合;根据所述文本集合中每个文本对应的点击记录和转化记录,确定该文本对应的转化率;计算所述第三筛选集合中每个关键词的点击置信度,其中,每个关键词的点击置信度表示所述文本集合中包含该关键词且转化率高于第四阈值的文本的点击次数与所述文本集合中包含该关键词的文本的总点击次数的比值;根据所述第三筛选集合中每个关键词的点击置信度对所述第三筛选集合中各关键词进行排序,并按照点击置信度由高到低的顺序,从相应的排序结果中提取多个关键词,并将所提取关键词作为所述推荐词集合。
[0014] 根据本申请又一个方面,提供一种呈现推荐词的装置,包括:获取单元,用于获取根据本申请的关键词推荐方法而生成的多个推荐词集合,每个推荐词集合的属性值包括行业类别和投放渠道;选择单元,响应于选择推荐词集合的操作,提供呈现所述多个推荐词集合所对应属性选项的用户界面,所述属性选项包括行业类别和投放渠道;呈现单元,响应于对所述用户界面中属性选项的选择操作,确定并呈现与被选的属性值对应的推荐词集合,以便提示用户在编辑文本时使用该推荐词集合中关键词。
[0015] 在一些实施例中,呈现单元还用于确定并呈现与被选的属性值对应的非推荐词集合,以便提示用户在编辑文本时避免使用所述非推荐词集合中关键词。
[0016] 根据本申请又一个方面,提供一种计算设备,包括:一个或多个处理器、存储器以及一个或多个程序。程序存储在该存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行本申请的关键词推荐方法的指令。
[0017] 根据本申请又一个方面,提供一种存储介质,存储有一个或多个程序。所述一个或多个程序包括指令。所述指令当由计算设备执行时,使得所述计算设备执行本申请的关键词推荐方法。
[0018] 综上,根据本申请的关键词推荐方案,通过对关键词集合中各关键词的频度(即使用广泛度)进行准确排序(例如,基于文本频率和重要性参数值的加权结果所进行的排序),可以获取使用频度高的第一筛选集合。在此基础上,本申请的方案可以对第一筛选集合中关键词进行筛选(例如,基于曝光支持度和曝光置信度的方法或者基于点击支持度和点击置信度的方法),可以获取高质量的推荐词。这样,本申请的方案可以获取能够提高用户对附加内容(例如,广告等)的感兴趣程度(感兴趣程度例如可以表现为用户对广告的点击概率或转化概率等)的推荐词集合。

附图说明

[0019] 为了更清楚地说明本申请实例中的技术方案,下面将对实例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0020] 图1示出了根据本申请一些实施例的应用场景100的示意图;
[0021] 图2示出了根据本申请一些实施例的关键词推荐方法200的流程图;
[0022] 图3示出了根据本申请一个实施例的计算关键词频度参数值的方法300的流程图;
[0023] 图4示出了根据本申请一个实施例的网络图400的示意图;
[0024] 图5示出了根据本申请一个实施例的获取推荐词集合的方法500的示意图;
[0025] 图6示出了根据本申请一个实施例的获取推荐词集合的方法600的示意图;
[0026] 图7示出了根据本申请一些实施例的关键词推荐方法700的流程图;
[0027] 图8示出了根据本申请一些实施例的呈现推荐词的方法800的流程图;
[0028] 图9A示出了根据本申请一个实施例的选定推荐词集合的用户页面示意图;
[0029] 图9B示出了根据本申请一个实施例的呈现推荐词集合的用户界面示意图;
[0030] 图10示出了根据本申请一些实施例的呈现推荐词的方法1000的流程图;
[0031] 图11A示出了根据本申请一些实施例的关键词推荐装置1100的示意图;
[0032] 图11B示出了根据本申请一个实施例的获取单元1110的示意图;
[0033] 图12示出了根据本申请一些实施例的呈现推荐词的装置1200的示意图;及[0034] 图13示出了一个计算设备的组成结构图。

具体实施方式

[0035] 下面将结合本申请实例中的附图,对本申请实例中的技术方案进行清楚、完整地描述,显然,所描述的实例仅是本申请一部分实例,而不是全部的实例。基于本申请中的实例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实例,都属于本申请保护的范围。
[0036] 在一些实施例中,在终端设备中应用访问网络(即用户进行网上冲浪)时,终端设备可以显示用户所访问页面。这里,终端设备例如为是台式电脑、笔记本电脑、平板电脑、移动电话或掌上游戏机等各种计算设备。终端设备中应用例如是浏览器、微信、QQ、微博等各种软件。另外,所访问页面通常还可以显示附加内容。附加内容例如为新闻资讯、广告等各种内容。这里,附加内容例如可以是静态图片、动态图片、文字消息和视频等各种媒体形式。
[0037] 图1示出了根据本申请一些实施例的应用场景100的示意图。如图1所示,应用场景100包括存储设备110、计算设备120和计算设备130。这里,存储设备110例如可以是数据库服务器,但不限于此。存储设备110存储有文本111和投放效果记录112。文本集合111可以包括多个文本。每个文本用于描述一个用于附加呈现在页面中的附加内容。换言之,文本是附加内容的文字表述。以广告为例,一个文本可以是一个广告对应的广告文案。在一个实施例中,投放效果记录112包括曝光记录和点击记录。曝光记录可以包括文本集合111中各文本所对应附加内容(例如为一个广告)的曝光记录。这里,附加内容在每次被显示在页面中时,可以被认为完成一次曝光。点击记录可以包括多条记录。每条记录用于记录用户对一个附加内容的一次点击事件。在又一个实施例中,投放效果记录112可以包括点击记录和转化记录。这里,每条转化记录用于记录一个转化事件。每个转化事件例如是用户点击一个附加内容,并执行被期望的操作。被期望的操作例如为注册账户、对商品下单,下载并登录待推广的应用等等,本申请对此不作限制。基于文本111和投放效果记录112,计算设备120可以生成推荐词集合121。这里,推荐词集合121用于被应用到附加内容对应的文本中,例如应用到广告文案中,但不限于此。换言之,推荐词集合121中关键词被认为可以提高用户对附加内容的感兴趣度。计算设备130可以从计算设备120获取推荐词集合121,以便用户根据该推荐词集合121编辑文本(例如,编辑广告文案等等)。这里,计算设备120和130例如可以被实现为硬件独立的服务器、分布式应用、个人计算机等各种设备,本申请对此不做限制。下面结合图2对生成推荐词集合的过程进行说明。
[0038] 图2示出了根据本申请一些实施例的关键词推荐方法200的流程图。方法200例如可以一个生成推荐词的应用中执行。该生成推荐词的应用例如可以驻留在计算设备120中,但不限于此。这里,计算设备120例如为广告素材服务器、新闻素材服务器等等。
[0039] 方法200包括步骤S201。在步骤S201中,获取关键词集合。
[0040] 在一个实施例中,该集合中每个关键词用于编辑呈现在页面中的附加内容。具体而言,在步骤S201中,首先获取包含多个文本的文本集合,并获取每个文本所对应信息的投放效果记录。其中,每个文本用于描述一个用于附加呈现在页面中的附加内容。
[0041] 在一个实施例中,步骤S201例如可以从存储设备110获取文本集合和投放效果记录。在又一个实施例中,步骤S201可以从文本服务器(例如为广告服务器)获取多个文本(例如为广告文案)并将其作为文本集合。另外,步骤S201可以从网络日志中提取每个文本所对应的投放效果记录。在又一个实施例中,考虑到不同商业类型(例如IT产品类、房地产类、服饰类、生鲜类等等)和投放渠道(例如新闻客户端、视频客户端、即时通讯应用等等)的附加内容所需推荐词集合不同,步骤S201可以获取属于预定行业类别并用于按照预定投放渠道进行投放的多个附加内容(例如,多个广告),并将各信息对应的文本作为文本集合。
[0042] 在确定文本集合时,步骤S201还可以对文本集合中各文本分别进行分词操作,并获取各个文本对应的关键词,并生成文本集合对应的关键词集合,关键词集合包括上述各文本对应的关键词。这里,分词方式例如为基于多层隐马模型的汉语词法分析系统(Institute of Computing Technology,Chinese Lexical Analysis System,缩写为ICTCLAS)或者文本挖掘算法(text miner)等等,本申请对此不做限制。
[0043] 对于步骤S201所获取的关键词集合,方法200可以执行步骤S202,确定每个关键词对应的频度参数值,每个关键词对应的频度参数值用于描述该关键词的使用广泛度。这里,使用广泛度例如为该关键词在文本集合中通用程度。在一些实施例中,步骤S202可以被实施为图3所示的方法300。
[0044] 如图3所示,方法300包括步骤S301和步骤S302。在步骤S301中,确定关键词集合中每个关键词的文本频率(document frequency)。其中,每个关键词的文本频率表示在文本集合中包含该关键词的文本的总数量。
[0045] 在步骤S302中,计算关键词集合中每个关键词对于关键词集合的重要度参数值。在一个实施例中,步骤S302可以首先构建包含多个结点的网络图,该网络图中每个结点表示关键词集合中一个关键词。网络图中包含于文本集合中任一个文本的两个结点相连接。
网络图中每对相连接的两个结点的相关性参数值对应于文本集合中包含这两个结点的文本的数量。例如,图4示出了根据本申请一个实施例的网络图400的示意图。如图4所示,网络图400包括结点w1至w9。c1至c10分别表示一个相关性参数值。这里,网络图400中每个结点表示关键词集合中一个关键词。例如,结点w1和w5相连接,这两个结点的相关性参数值为c1。c1值与文本集合中同时包含结点w1和w5的文本的数量成正比。
[0046] 在网络图的基础上,步骤S302可以根据文本排列(text rank)算法,计算网络图中每个结点的权重值,并将其作为该结点的重要度参数值。在一个实施例中,步骤S302可以根据下述公式确定每个结点(即每个关键词)的重要度参数值。
[0047]
[0048] 其中,Vi、Vj和Vk分别表示网络图中一个结点。d为一个阻尼系数,取值范围例如为[0.5,0.9]。S(Vi)表示结点Vi的重要度参数值,S(Vj)表示结点Vj的重要度参数值。In(Vi)表示网络图中与结点Vi相连接的结点的集合,Out(Vj)表示网络图中与结点Vj相连接的结点的集合。ωjk表示结点Vk和Vj的相关性参数值,ωji表示结点Vi和Vj的相关性参数值。这里,步骤S302可以基于上述公式迭代计算每个关键词的重要度参数值,直到重要度参数值收敛(例如,最新两次计算得到的重要度参数值之差不超过收敛阈值)。
[0049] 在步骤S302中确定关键词集合中每个关键词的重要度参数值时,方法300可以执行步骤S303。在步骤S303中,对每个关键词的文本频率和重要度参数值进行加权计算,并将相应的计算结果作为该关键词的频度参数值。综上,方法300通过对关键词的文本频率和重要度参数值进行加权计算,可以极大避免多个关键词频度参数值相同的情况出现,从而可以对各个关键词的频度参数值进行准确区分。
[0050] 在步骤S202中确定每个关键词对应的频度参数值时,方法200可以执行步骤S203。在步骤S203中,根据所述每个关键词对应的频度参数值对关键词集合中各关键词进行排序,并从相应的排序结果中提取与预定投放效果有关的关键词,并将其作为推荐词集合。根据一个实施例,在步骤S203中,从排序结果中提取多个关键词作为第一筛选集合。例如,步骤S203可以从排序结果中提取频度参数值高于频度阈值的关键词,以将其作为第一筛选集合。又例如,步骤S203可以按照频度参数值由高到低的顺序,提取多个关键词(例如第一预定数量的关键词),并将其作为第一筛选集合。这里,步骤S203还可以采用其他适合的方式从排序结果中提取排名靠前的多个关键词,并将其作为第一筛选集合。在此基础上,步骤S203可以从第一筛选集合中提取与预定投放效果有关的关键词,并将其作为推荐词集合。
在一个实施例中,步骤S203可以根据文本集合中各文本所对应的投放效果记录,从第一筛选集合中提取与预定投放效果有关的关键词,并将其作为推荐词集合。这里,获取推荐词集合的目的是获取能够提高用户对文本所对应附加内容(例如,广告文案所对应的广告等等)的感兴趣程度(感兴趣程度例如可以表现为用户对广告的点击概率或转化率等等)。步骤S203所进行的提取操作可以是各种可以确定能够提高感兴趣程度的关键词的方式,本申请对此不作限制。
[0051] 在根据本申请一些实施例中,投放效果记录包括曝光记录和点击记录。曝光记录和点击记录例如可以从预定时间范围(例如为最近一个月)内的网络日志中提取。在这些实施例中,步骤S203中根据第一筛选集合确定推荐词集合的过程可以被实现为方法500。
[0052] 如图5所示,方法500包括步骤S501,计算第一筛选集合中每个关键词的曝光支持度。这里,曝光支持度表示文本集合中包含该关键词的文本所对应的曝光次数与文本集合中所有文本所对应的总曝光次数的比值。
[0053] 在步骤S502中,提取第一筛选集合中曝光支持度高于第一阈值的关键词,并将所提取的关键词作为第二筛选集合。通过曝光支持度对关键词进行筛选,方法500可以过滤掉曝光支持度低(即低于第一阈值)的关键词(即,被认为不具有统计意义的关键词)。
[0054] 在步骤S503中,根据所述文本集合中每个文本对应的曝光记录和点击记录,确定该文本对应的点击率。这里,一个文本对应的点击率是指该文本对应的点击记录数量(即用户对文本所对应附加内容的点击次数)与该文本对应的曝光记录数量(即,文本所对应附加内容的曝光次数)的比值。需要说明的是,文本的点击率数据也可以是步骤S201在获取文本集合时所获取的。在步骤S201获取到每个文本对应的点击率时,步骤S503可以被省略。
[0055] 在步骤S504中,计算第二筛选集合中每个关键词的曝光置信度。其中,每个关键词的曝光置信度表示文本集合中包含该关键词且点击率高于第二阈值的文本的曝光次数与文本集合中包含该关键词的文本的总曝光次数的比值。这里,第二阈值例如为3%,但不限于此。下面举例说明曝光支持度和曝光置信度的作用。假设有2个关键词:“抢购”,“空中楼阁”。第一个关键词曝光1万次,其曝光支持度是千分之一,曝光置信度是0.75。第二个词曝光1次,其曝光支持度是千万分之一,曝光置信度是1.0。第二个关键词尽管曝光置信度非常高(即100%),但是其曝光支持度较低。因此,用户关于这个词的点击操作有可能是误点击(也可以称为偶然性点击),并非由这个词引起用户的兴趣而进行的点击行为,即第二个词由于曝光的数据量太少,不具有统计意义。
[0056] 在步骤S505中,根据第二筛选集合中每个关键词的曝光置信度对第二筛选集合中各关键词进行排序,并从相应的排序结果中提取多关键词,并将所提取关键词作为推荐词集合。例如,步骤S505可以从排序结果中提取曝光置信度高于曝光置信度阈值的关键词,以将其作为推荐词集合。又例如,步骤S505可以按照曝光置信度由高到低的顺序,提取多个关键词(例如第二预定数量的关键词),并将其作为推荐词集合。应当理解,曝光置信度越高,关键词更能提高用户对附加内容(例如为广告或新闻)的感兴趣程度。因此,通过按照曝光置信度进行排序,步骤S505可以获取高质量的推荐词(即能够提高用户感兴趣程度的关键词)。
[0057] 在根据本申请又一些实施例中,投放效果记录包括点击记录和转化记录。点击记录和转化记录例如可以从预定时间范围(例如为最近一个月)内的网络日志中提取。在这些实施例中,步骤S203中根据第一筛选集合确定推荐词集合的过程可以被实现为方法600。
[0058] 在步骤S601中,计算第一筛选集合中每个关键词的点击支持度。这里,点击支持度表示文本集合中包含该关键词的文本所对应的点击次数与文本集合中所有文本所对应的总点击次数的比值。
[0059] 在步骤S602中,提取第一筛选集合中点击支持度高于第三阈值的关键词,并将所提取的关键词作为第三筛选集合。
[0060] 在步骤S603中,根据文本集合中每个文本对应的点击记录和转化记录,确定该文本对应的转化率。这里,一个文本对应的转化率是指该文本对应的转化记录数量(即用户对文本所对应附加内容的转化次数)与该文本对应的点击记录数量(即,用户对文本所对应附加内容的点击次数)的比值。
[0061] 在步骤S604中,计算第三筛选集合中每个关键词的点击置信度。其中,每个关键词的点击置信度表示文本集合中包含该关键词且转化率高于第四阈值的文本的点击次数与文本集合中包含该关键词的文本的总点击次数的比值。
[0062] 在步骤S605中,根据第三筛选集合中每个关键词的点击置信度对第三筛选集合中各关键词进行排序,并从相应的排序结果中提取多个关键词,并将所提取关键词作为推荐词集合。例如,步骤S605可以从排序结果中提取点击置信度高于点击置信度阈值的关键词,并将其作为推荐词集合。又例如,步骤S605可以按照点击置信度由高到低的顺序,提取多个关键词(例如第三预定数量的关键词),并将其作为推荐词集合。
[0063] 综上,根据本申请实施例的方法200,通过对关键词集合中各关键词的频度(即使用广泛度)进行准确排序(例如,基于文本频率和重要性参数值的加权结果所进行的排序),可以获取使用频度高的第一筛选集合。在此基础上,方法200可以对第一筛选集合中关键词进行筛选(例如,基于曝光支持度和曝光置信度的方法500或者基于点击支持度和点击置信度的方法600),可以获取高质量的推荐词。这样,本申请的方法200可以获取能够提高用户对附加内容(例如,广告等)的感兴趣程度(感兴趣程度例如可以表现为用户对广告的点击概率或转化率等等)的推荐词集合。
[0064] 图7示出了根据本申请一些实施例的关键词推荐方法700的流程图。方法700例如可以在计算设备120中执行,但不限于此。如图7所示,方法700可以包括步骤S701至S703。这里,步骤S701至S703的实施方式分别与步骤S201至步骤S203一致,这里不再赘述。
[0065] 在一些实施例中,方法700还可以包括步骤S704,从根据频度参数值的排序结果中提取降低投放效果的关键词,并将其作为非推荐词集合。具体而言,在一个实施例中,步骤S704可以提取排序结果中不属于第一筛选集合的多个关键词,并将其作为非推荐词集合。在又一个实施例中,步骤S704可以从第二筛选集合对应的排序结果中提取不属于推荐词集合的多个关键词,并将所提取的关键词作为非推荐词集合。这里,非推荐词集合中各关键词可以被认为是对提高用户对附加内容的感兴趣程度有负面影响的用语。基于非推荐词集合,用户在编辑文本(例如广告文案等)时,可以回避一些不利于提高感兴趣程度的用词。在又一个实施例中,步骤S704可以从第三筛选集合对应的排序结果中提取不属于推荐词集合的多个关键词,并将所提取的关键词作为非推荐词集合。
[0066] 图8示出了根据本申请一些实施例的呈现推荐词的方法800的流程图。这里,方法800例如可以在呈现推荐词的应用中执行。这里,呈现推荐词的应用例如可以驻留在计算设备130中,但不限于此。
[0067] 如图8所示,在步骤S801中,获取多个推荐词集合。这里,每个推荐词集合的属性值包括行业类别和投放渠道。每个推荐词集合例如可以是通过根据本申请的方法200或者方法700所获取的。
[0068] 在步骤S802中,响应于选择推荐词集合的操作,提供呈现多个推荐词集合所对应属性选项的用户界面。属性选项包括行业类别和投放渠道。
[0069] 在步骤S803中,响应于对用户界面中属性选项的选择操作,确定并呈现与被选的属性值对应的推荐词集合,以便提示用户在编辑文本时使用该推荐词集合中关键词。例如,图9A示出了根据本申请一个实施例的选定推荐词集合的用户页面示意图。用户可以在该用户界面中选定行业类别和投放渠道各自的属性值。这样,步骤S803可以根据用户的选择操作,确定所要呈现的推荐词集合。这里,所呈现的推荐词集合例如可以是按照其中关键词对应拼音首字母进行分组和排序,但不限于此。图9B示出了根据本申请一个实施例的呈现推荐词集合的用户界面示意图。如图9B所示,区域b为文本(例如为广告文案)编辑区,区域a为推荐词集合的呈现区。用户可以根据区域a中推荐词,对区域b中文本进行编辑。这里,除了采用按照关键词首字母分组方式以外,本申请的实施例还可以在区域a中按照其他各种适用的呈现方式显示推荐词集合。
[0070] 图10示出了根据本申请一些实施例的呈现推荐词的方法1000的流程图。这里,方法1000例如可以在呈现推荐词的应用中执行。这里,呈现推荐词的应用例如可以驻留在计算设备130中,但不限于此。
[0071] 如图10所示,方法1000包括步骤S1001至S1003。这里,步骤S1001至S1003的实施方式分别与步骤S801至S803一致,这里不再赘述。另外,方法1000还包括步骤S1004。在步骤S1004中,确定并呈现与被选的属性值对应的非推荐词集合,以便提示用户在编辑文本时避免使用非推荐词集合中关键词。
[0072] 图11A示出了根据本申请一些实施例的关键词推荐装置1100的示意图。装置1100例如可以驻留在计算设备120中。如图11A所示,装置1100包括获取单元1110、频度确定单元1120、筛选单元1130。
[0073] 获取单元1110用于获取关键词集合。其中,该集合中每个关键词用于编辑呈现在页面中的附加内容。在一个实施例中,获取单元1110可以被实现为图11B所示的结构。
[0074] 如图11B所示,获取单元1110可以包括文本获取模块1111和关键词生成模块1112。文本获取模块1111可以获取包含多个文本的文本集合。其中,每个文本用于描述一个用于呈现在页面中的附加内容,并获取每个文本所对应附加内容的投放效果记录。在一个实施例中,文本获取模块1111可以获取属于预定行业类别并投放至预定投放渠道的多个附加内容,并生成文本集合。文本集合包括多个附加内容中各附加内容对应的文本。
[0075] 关键词生成模块1112用于对文本集合中各文本分别进行分词操作,并获取各个文本对应的关键词,并生成所述文本集合对应的关键词集合。关键词集合包括各文本对应的关键词。
[0076] 频度确定单元1120用于确定关键词集合中每个关键词对应的频度参数值。每个关键词对应的频度参数值用于描述该关键词的使用广泛度,例如在文本集合中的使用广泛度。在一些实施例中,频度确定单元1120可以确定关键词集合中每个关键词的文本频率。其中,每个关键词的文本频率表示在文本集合中包含该关键词的文本的总数量。频度确定单元1120还可以计算关键词集合中每个关键词对于关键词集合的重要度参数值。在一个实施例中,频度确定单元1120可以构建包含多个结点的网络图。该网络图中每个结点表示所述关键词集合中一个关键词。网络图中包含于文本集合中任一个文本的两个结点相连接。网络图中每对相连接的两个结点的相关性参数值对应于文本集合中包含这两个结点的文本的数量。根据文本排列算法,频度确定单元1120计算网络图中每个结点的权重值,并将其作为该结点的重要度参数值。
[0077] 在此基础上,频度确定单元1120可以对每个关键词的文本频率和重要度参数值进行加权计算,并将相应的计算结果作为该关键词的频度参数值。
[0078] 筛选单元1130用于根据每个关键词对应的频度参数值对关键词集合中各关键词进行排序,并从相应的排序结果中提取与预定投放效果有关的关键词,并将其作为推荐词集合。在一个实施例中,筛选单元1130可以按照频度参数值从高到低的顺序,从相应的排序结果中提取多个关键词(例如第一预定数量的关键词),并将所提取的关键词作为第一筛选集合。在又一个实施例中,筛选单元1130可以从排序结果中提取频度参数值高于频度阈值的关键词,并将其作为第一筛选集合。
[0079] 在此基础上,筛选单元1130可以根据文本集合中各文本所对应的投放效果记录,从第一筛选集合中提取与预定投放效果有关的关键词,并将其作为推荐词集合。在一些实施例中,每个文本的所对应的投放效果记录包括该文本对应的曝光记录和点击记录。筛选单元1130可以计算所述第一筛选集合中每个关键词的曝光支持度。曝光支持度表示文本集合中包含该关键词的文本所对应的曝光次数与文本集合中所有文本所对应的总曝光次数的比值。筛选单元1130可以提取第一筛选集合中曝光支持度高于第一阈值的关键词,并将所提取的关键词作为第二筛选集合。根据文本集合中每个文本对应的曝光记录和点击记录,筛选单元1130可以确定该文本对应的点击率。筛选单元1130可以计算第二筛选集合中每个关键词的曝光置信度。其中,每个关键词的曝光置信度表示文本集合中包含该关键词且点击率高于第二阈值的文本的曝光次数与文本集合中包含该关键词的文本的总曝光次数的比值。根据第二筛选集合中每个关键词的曝光置信度对第二筛选集合中各关键词进行排序,并从相应的排序结果中提取多个关键词,并将所提取关键词作为推荐词集合。例如,筛选单元1130可以按照曝光置信度从高到低的顺序,从第二筛选集合的排序结果中提取多个关键词(例如第二预定数量的关键词),并将所提取的关键词作为推荐词集合。在又一个实施例中,筛选单元1130可以从排序结果中提取频度参数值高于频度阈值的关键词,并将其作为推荐词集合。
[0080] 在一些实施例中,筛选单元1130还可以根据文本集合中各文本所对应的投放效果记录,从关键词集合的排序结果中提取降低投放效果的关键词,并将其作为非推荐词集合。例如,筛选单元1130可以从关键词集合的排序结果提取不属于第一筛选集合的多个关键词,并将其作为非推荐词集合。又例如,筛选单元1130可以从第二筛选集合(或者第三筛序集合)对应的排序结果中提取不属于推荐词集合的多个关键词,并将所提取的关键词作为非推荐词集合。
[0081] 在一些实施例中,每个文本的所对应的投放效果记录包括该文本对应的点击记录和转化记录。筛选单元1130用于计算第一筛选集合中每个关键词的点击支持度。点击支持度表示文本集合中包含该关键词的文本所对应的点击次数与文本集合中所有文本所对应的总点击次数的比值。筛选单元1130提取第一筛选集合中点击支持度高于第三阈值的关键词,并将所提取的关键词作为第三筛选集合。根据文本集合中每个文本对应的点击记录和转化记录,筛选单元1130可以确定该文本对应的转化率。筛选单元1130可以计算第三筛选集合中每个关键词的点击置信度。其中,每个关键词的点击置信度表示文本集合中包含该关键词且转化率高于第四阈值的文本的点击次数与文本集合中包含该关键词的文本的总点击次数的比值。筛选单元1130可以根据第三筛选集合中每个关键词的点击置信度对第三筛选集合中各关键词进行排序,并按照点击置信度由高到低的顺序从相应的排序结果中提取多个关键词,并将所提取关键词作为推荐词集合。装置1100更具体的实施方式与方法200一致,这里不再赘述。
[0082] 图12示出了根据本申请一些实施例的呈现推荐词的装置1200的示意图。装置1200例如可以驻留在计算设备130中。
[0083] 如图12所示,装置1200包括获取单元1210、选择单元1220和呈现单元1230。获取单元1210用于获取根据本申请关键词推荐方法(例如方法200或700)而生成的多个推荐词集合。每个推荐词集合的属性值包括行业类别和投放渠道。选择单元1220响应于选择推荐词集合的操作,提供呈现多个推荐词集合所对应属性选项的用户界面。属性选项包括行业类别和投放渠道。呈现单元1230响应于对用户界面中属性选项的选择操作,确定并呈现与被选的属性值对应的推荐词集合,以便提示用户在编辑文本时使用该推荐词集合中关键词。
[0084] 在一些实施例中,呈现单元1230还用于确定并呈现与被选的属性值对应的非推荐词集合,以便提示用户在编辑文本时避免使用非推荐词集合中关键词。装置1200更具体的实施方式与方法800一致,这里不再赘述。
[0085] 图13示出了一个计算设备的组成结构图。如图13所示,该计算设备包括一个或者多个处理器(CPU或GPU)1302、通信模块1304、存储器1306、用户接口1310,以及用于互联这些组件的通信总线1308。
[0086] 处理器1302可通过通信模块1304接收和发送数据以实现网络通信和/或本地通信。
[0087] 用户接口1310包括一个或多个输出设备1312,其包括一个或多个扬声器和/或一个或多个可视化显示器。用户接口1310也包括一个或多个输入设备1314,其包括诸如,键盘,鼠标,声音命令输入单元或扩音器,触屏显示器,触敏输入板,姿势捕获摄像机或其他输入按钮或控件等。
[0088] 存储器1306可以是高速随机存取存储器,诸如DRAM、SRAM、DDR RAM、或其他随机存取固态存储设备;或者非易失性存储器,诸如一个或多个磁盘存储设备、光盘存储设备、闪存设备,或其他非易失性固态存储设备。
[0089] 存储器1306存储处理器1302可执行的指令集,包括:
[0090] 操作系统1316,包括用于处理各种基本系统服务和用于执行硬件相关任务的程序;
[0091] 应用1318,包括用于实现上述关键词推荐方法(例如方法200或700)或者呈现推荐词的方法(例如方法800)的各种程序,这种程序能够实现上述各实例中的处理流程,比如可以包括根据本申请的生成推荐词的应用或者呈现推荐词的应用。生成推荐词的应用可以包括图11所示的关键词推荐装置1100。呈现推荐词的应用例如可以包括图12所示的呈现推荐词的装置1200。
[0092] 另外,本申请的每一个实例可以通过由数据处理设备如计算机执行的数据处理程序来实现。显然,数据处理程序构成了本申请。此外,通常存储在一个存储介质中的数据处理程序通过直接将程序读取出存储介质或者通过将程序安装或复制到数据处理设备的存储设备(如硬盘和或内存)中执行。因此,这样的存储介质也构成了本发明。存储介质可以使用任何类型的记录方式,例如纸张存储介质(如纸带等)、磁存储介质(如软盘、硬盘、闪存等)、光存储介质(如CD‑ROM等)、磁光存储介质(如MO等)等。
[0093] 因此,本申请还公开了一种非易失性存储介质,其中存储有数据处理程序,该数据处理程序用于执行本申请上述方法的任何一种实例。
[0094] 另外,本申请所述的方法步骤除了可以用数据处理程序来实现,还可以由硬件来实现,例如,可以由逻辑门、开关、专用集成电路(ASIC)、可编程逻辑控制器和嵌微控制器等来实现。因此这种可以实现本申请所述方法的硬件也可以构成本申请。
[0095] 以上所述仅为本申请的较佳实例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。