基于点击位置因素改进的CTR热门内容计算方法及装置转让专利

申请号 : CN202210576409.2

文献号 : CN114662008B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李多海

申请人 : 上海二三四五网络科技有限公司

摘要 :

本申请公开了基于点击位置因素改进的CTR热门内容计算方法及装置,所述方法包括:S1,获取用户近期的点击曝光行为数据;S2,从点击曝光行为数据中获取点击集合A和曝光集合B;S3,将曝光集合B与点击集合A进行内关联得到集合C;S4,从集合C中,根据第一筛选策略筛选出发生点击行为的点击位置附近的曝光数据,得到曝光集合D;S5,将点击集合A与筛选后的曝光集合D进行合并得到集合E;S6,对集合E中的所有物品计算CTR得到物品CTR结果集F;S7,将物品CTR结果集F过滤掉曝光数量小于预设的曝光阈值的物品,再进行CTR数值降序排列,得到最终热门结果。本申请有效减轻了无效曝光对CTR所带来的影响。

权利要求 :

1.基于点击位置因素改进的CTR热门内容计算方法,其特征在于,包括:S1,获取用户近N天的点击曝光行为数据;

S2,从点击曝光行为数据中获取点击集合A和曝光集合B,其中,点击集合A和曝光集合B中均包括用户编号、该用户编号获取的批次推荐内容的编号,以及该用户编号发生点击/曝光行为的位置记录;

S3,将曝光集合B通过用户编号和批次推荐内容的编号与点击集合A进行内关联得到集合C,集合C中仅包括发生了点击行为的批次中的曝光数据;

S4,从集合C中,根据预设的第一筛选策略筛选出发生点击行为的点击位置附近的曝光数据,得到曝光集合D;

S5,将点击集合A与筛选后的曝光集合D进行合并,得到集合E;

S6,对集合E中的所有物品计算CTR,得到物品CTR结果集F;

S7,将物品CTR结果集F过滤掉曝光数量小于预设的曝光阈值的物品,再进行CTR数值降序排列,得到最终热门结果,即基于点击位置因素改进的CTR热门内容。

2.根据权利要求1所述的基于点击位置因素改进的CTR热门内容计算方法,其特征在于,步骤S1中,获取的所述点击曝光行为数据,包括用户编号user_id,物品编号item_id,批次推荐内容的编号trace_id,用户点击/曝光行为的位置position,以及标签label,label=1表示点击,label=0表示曝光;其中,一个批次推荐内容的编号trace_id下包括多个物品编号item_id。

3.根据权利要求1所述的基于点击位置因素改进的CTR热门内容计算方法,其特征在于,步骤S3中,如果用户在某批次的推荐物品中仅发生了曝光行为,那么这‑整个批次的曝光数据将不参与后续的物品CTR计算。

4.根据权利要求1所述的基于点击位置因素改进的CTR热门内容计算方法,其特征在于,步骤S3中,得到的集合C包括用户编号user_id、曝光物品的编号expose_item_id、该用户编号获取的批次推荐内容的编号trace_id、曝光位置expose_position、点击物品的编号click_item_id、点击位置click_position,以及标签label,label=1表示点击,label=0表示曝光。

5.根据权利要求1所述的基于点击位置因素改进的CTR热门内容计算方法,其特征在于,步骤S4中,预设的第一筛选策略包括:允许点击位置下方距离最近的K1个曝光数据参与计算,K1为大于等于1的整数。

6.根据权利要求1所述的基于点击位置因素改进的CTR热门内容计算方法,其特征在于,步骤S4中,预设的第一筛选策略包括:允许点击位置上方距离最近的K2个曝光数据参与计算,K2为大于等于1的整数。

7.根据权利要求1所述的基于点击位置因素改进的CTR热门内容计算方法,其特征在于,步骤S6中,所述计算CTR,包括:CTR=物品的点击用户数量/物品的曝光用户数量。

8.基于点击位置因素改进的CTR热门内容计算装置,其特征在于,包括:信息获取模块,用于获取用户近N天的点击曝光行为数据;

点击集合A生成模块,用于从点击曝光行为数据中获取点击集合A,其中,点击集合A包括用户编号、该用户编号获取的批次推荐内容的编号,以及该用户编号发生点击行为的位置记录;

曝光集合B生成模块,用于从点击曝光行为数据中获取曝光集合B,其中,曝光集合B包括用户编号、该用户编号获取的批次推荐内容的编号,以及该用户编号发生曝光行为的位置记录;

集合C生成模块,用于将曝光集合B通过用户编号和批次推荐内容的编号与点击集合A进行内关联得到集合C,集合C中仅包括发生了点击行为的批次中的曝光数据;

曝光集合D生成模块,用于从集合C中,根据预设的第一筛选策略筛选出发生点击行为的点击位置附近的曝光数据,得到曝光集合D;

集合E生成模块,用于将点击集合A与筛选后的曝光集合D进行合并,得到集合E;

点击率计算模块,对集合E中的所有物品计算CTR,以获得物品CTR结果集F;

CTR热门内容选取模块,用于将物品CTR结果集F过滤掉曝光数量小于预设的曝光阈值的物品,再进行CTR数值降序排列,得到最终热门结果,即基于点击位置因素改进的CTR热门内容。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1‑7任一项所述的基于点击位置因素改进的CTR热门内容计算方法。

10.一种电子设备,其特征在于,包括:

处理器;以及

存储器,用于存储所述处理器的可执行指令;

其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1‑7任一项所述的基于点击位置因素改进的CTR热门内容计算方法。

说明书 :

基于点击位置因素改进的CTR热门内容计算方法及装置

技术领域

[0001] 本发明涉及网络技术领域,尤其涉及基于点击位置因素改进的 CTR 热门内容计算方法及装置。

背景技术

[0002] 在互联网技术领域,互联网产品的推广方可以利用应用墙等推广资源为应用的开发方推广应用,即互联网产品的推广方会根据用户的当前操作场景以及确定出的应用的点击通过率(CTR,Click Through Rate)为用户推荐CTR较高的一个或多个优质应用。CTR是互联网广告常用的术语,即该广告的实际点击次数除以广告的展现量。
[0003] 大部分互联网软件存在一些被动弹出式界面,例如弹出一些新闻、游戏等,大部分用户会选择直接关闭或者忽视(因为这些弹出式内容并非他们所喜爱的内容)。但从内容推荐角度,这些无效的内容曝光却会影响各个内容的点击率计算(CTR)。
[0004] 因此,如何消除或减轻无效曝光对CTR所带来的影响,快速且精准计算出应用的CTR在应用的推广方面显得尤为重要。

发明内容

[0005] 本发明的目的在于提供基于点击位置因素改进的 CTR 热门内容计算方法及装置,以解决上述技术背景中提出的问题。
[0006] 为实现上述目的,本发明采用以下技术方案:
[0007] 本申请第一个方面公开了基于点击位置因素改进的 CTR 热门内容计算方法,包括:
[0008] S1,获取用户近N天的点击曝光行为数据;
[0009] S2,从点击曝光行为数据中获取点击集合A和曝光集合B,其中,点击集合A和曝光集合B中均包括用户编号、该用户编号获取的该批次推荐内容的编号,以及该用户编号发生点击/曝光行为的位置记录;
[0010] S3,将曝光集合B通过用户编号和该批次推荐内容的编号与点击集合A进行内关联得到集合C,集合C中仅包括发生了点击行为的批次中的曝光数据;
[0011] S4,从集合C中,根据预设的第一筛选策略筛选出发生点击行为的点击位置附近的曝光数据,得到曝光集合D;
[0012] S5,将点击集合A与筛选后的曝光集合D进行合并,得到集合E;
[0013] S6,对集合E中的所有物品计算CTR,得到物品CTR结果集F;
[0014] S7,将物品CTR结果集F过滤掉曝光数量小于预设的曝光阈值的物品,再进行CTR 数值降序排列,得到最终热门结果,即基于点击位置因素改进的 CTR 热门内容。
[0015] 优选地,步骤S1中,获取的所述点击曝光行为数据,包括用户编号 user_id,物品编号item_id,该批次推荐内容的编号trace_id,用户点击/曝光行为的位置position,以及标签label,label=1表示点击,label=0表示曝光;其中,一个批次推荐内容的编号trace_id下包括多个物品编号item_id。
[0016] 优选地,步骤S3中,如果用户在某批次的推荐物品中仅发生了曝光行为,那么这一整个批次的曝光数据将不参与后续的物品 CTR 计算。
[0017] 优选地,步骤S3中,得到的集合C包括用户编号user_id、曝光物品的编号expose_item_id、该用户编号获取的该批次推荐内容的编号trace_id、曝光位置expose_position、点击物品的编号click_item_id、点击位置click_position,以及标签label,label=1表示点击,label=0表示曝光。
[0018] 优选地,步骤S4中,预设的第一筛选策略包括:允许点击位置下方距离最近的 K1个曝光数据参与计算,K1为大于等于1的整数。
[0019] 优选地,步骤S4中,预设的第一筛选策略包括:允许点击位置上方距离最近的 K2个曝光数据参与计算,K2为大于等于1的整数。
[0020] 优选地,步骤S6中,所述计算CTR,包括:
[0021] CTR= 物品的点击用户数量 / 物品的曝光用户数量。
[0022] 本申请第二个方面公开了基于点击位置因素改进的 CTR 热门内容计算装置,包括:
[0023] 信息获取模块,用于获取用户近N天的点击曝光行为数据;
[0024] 点击集合A生成模块,用于从点击曝光行为数据中获取点击集合A,其中,点击集合A包括用户编号、该用户编号获取的该批次推荐内容的编号,以及该用户编号发生点击行为的位置记录;
[0025] 曝光集合B生成模块,用于从点击曝光行为数据中获取曝光集合B,其中,曝光集合B包括用户编号、该用户编号获取的该批次推荐内容的编号,以及该用户编号发生曝光行为的位置记录;
[0026] 集合C生成模块,用于将曝光集合B通过用户编号和该批次推荐内容的编号与点击集合A进行内关联得到集合C,集合C中仅包括发生了点击行为的批次中的曝光数据;
[0027] 曝光集合D生成模块,用于从集合C中,根据预设的第一筛选策略筛选出发生点击行为的点击位置附近的曝光数据,得到曝光集合D;
[0028] 集合E生成模块,用于将点击集合A与筛选后的曝光集合D进行合并,得到集合E;
[0029] 点击率计算模块,对集合E中的所有物品计算CTR,以获得物品CTR结果集F;
[0030] CTR 热门内容选取模块,用于将物品CTR结果集F过滤掉曝光数量小于预设的曝光阈值的物品,再进行CTR 数值降序排列,得到最终热门结果,即基于点击位置因素改进的 CTR 热门内容。
[0031] 本申请第三个方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的基于点击位置因素改进的 CTR 热门内容计算方法。
[0032] 本申请第四个方面提供一种电子设备,包括:
[0033] 处理器;以及
[0034] 存储器,用于存储所述处理器的可执行指令;
[0035] 其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的基于点击位置因素改进的 CTR 热门内容计算方法。
[0036] 与现有技术相比,本发明的技术方案具有以下有益效果:
[0037] 本申请公开了基于点击位置因素改进的 CTR 热门内容计算方法及装置,所述方法引入了用户注意力因素,将用户真正注意到的点击位置附近的曝光数据加入到CTR计算中,进而获得基于点击位置因素改进的CTR热门内容,有效减轻了无效曝光对CTR所带来的影响。

附图说明

[0038] 构成本申请的一部分附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0039] 图1示意性示出一种基于点击位置因素改进的 CTR 热门内容计算方法的流程图;
[0040] 图2示意性示出一种基于点击位置因素改进的 CTR 热门内容计算装置的结构示意图。

具体实施方式

[0041] 为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
[0042] 需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序,应该理解这样使用的数据在适当情况下可以互换。此外,术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0043] 实施例:
[0044] 在一些实施例中,在终端设备中应用访问网络时,终端设备可以显示用户所访问页面。这里,终端设备例如是台式电脑、笔记本电脑、平板电脑、移动电话或掌上游戏机等各种计算设备。终端设备中的应用例如是浏览器、微信、QQ、微博、App等各种软件。另外,所访问页面通常还可以显示新闻资讯、广告等各种附加内容。这里,附加内容例如可以是静态图片、动态图片、文字消息和视频等各种媒体形式。
[0045] 以新闻产品App为例,在新闻产品App中,可获取大量用户的行为数据,如曝光、点击等行为数据,以下结合该应用场景具体阐述本申请的CTR热门内容计算方法。
[0046] 图1为一种基于点击位置因素改进的 CTR 热门内容计算方法的流程示意图。
[0047] 参阅图1所示,一种基于点击位置因素改进的 CTR 热门内容计算方法,具体包括如下步骤:
[0048] 步骤S1:获取用户近N天的点击曝光行为数据。
[0049] 主要信息字段有:user_id、item_id、trace_id、position、label;
[0050] 其中,
[0051] user_id:表示用户编号;
[0052] item_id:表示物品编号;
[0053] trace_id:表示该批次推荐内容的编号,一个编号可以有多条物料,例如一个编号下大约有 15~30 条物料;
[0054] position:用户行为的位置,如用户点击/曝光了第一个位置的新闻,则position=1;
[0055] label:标签,其中,label =1,表示点击;label=0,表示曝光。
[0056] 获取的数据样例如下:
[0057]user_id item_id trace_id position label
a1 i1 t1 3 1
a1 i2 t1 7 0
a2 i3 t2 1 1
a2 i4 t2 2 0
…… …… …… …… ……
[0058] 步骤S2:从点击曝光行为数据中获取点击集合A和曝光集合B。
[0059] 具体地,通过条件label=1筛选得到点击集合 A;通过条件label=0筛选得到曝光集合 B。
[0060] 获取的数据样例如下:
[0061] 点击集合 A:
[0062]user_id item_id trace_id position label
a1 i1 t1 3 1
a2 i3 t2 1 1
…… …… …… …… ……
[0063] 曝光集合 B:
[0064]user_id item_id trace_id position label
a1 i2 t1 7 0
a3 i4 t2 2 0
…… …… …… …… ……
[0065] 步骤S3:将曝光集合 B 通过 user_id、trace_id 与点击集合 A 进行内关联得到集合 C,这样集合 C 中仅包含发生了点击行为的批次中的曝光数据。
[0066] 这样,如果用户在某批次的推荐物品中仅发生了曝光行为,那么这一整个批次的曝光数据将不参与后续的物品CTR 计算。
[0067] 此时,集合C包含以下信息:
[0068] user_id、expose_item_id、trace_id、expose_position、label、click_item_id、click_position.
[0069] 其中,expose_item_id为曝光物品的编号;expose_position为曝光位置;click_item_id为点击物品的编号,click_position为点击位置。
[0070] 数据样例如下:
[0071] 集合C:
[0072] user_id expose_item_id trace_id expose_position label click_item_id click_positiona1 i2 t1 7 0 i1 3a2 i4 t2 2 0 i3 1
…… ……   …… …… …… ……
[0073] 步骤S4:筛选出点击位置上方/或附近的曝光数据得到曝光集合 D。
[0074] 例如,筛选条件为:
[0075] click_position – K2<= expose_position <= click_position + K1
[0076] 参数K1、K2解释:允许点击位置下方最近的K1个曝光数据以及上方的K2个曝光数据参与后续计算,因为这部分展现内容大概率被用户所关注到了,适合参与计算物品的修正CTR,其中,K1、K2均为大于等于1的整数。
[0077] 假设K1=K2=2,那么不满足click_position ‑ 2<=expose_position <= click_position + 2 的数据会被过滤掉(如上述示例中,集合C的第一条数据会被过滤,因为7>3+2)。
[0078] 由此,得到曝光集合D的数据样例如下:
[0079] user_id expose_item_id trace_id expose_position label click_item_id click_positiona2 i4 t2 2 0 i3 1…… ……   …… …… …… ……
[0080] 步骤S5:将筛选后的曝光集合D修改字段名称,使其与点击集合A保持一致,便于点击集合A与筛选后的曝光集合D进行合并,得到数据集合E。
[0081] 数据样例如下:
[0082] 集合 E:
[0083]user_id item_id trace_id position label
a1 i1 t1 3 1
a2 i3 t2 1 1
a2 i4 t2 2 0
…… …… …… …… ……
[0084] 步骤S6:对集合E中的所有物品计算CTR,得到物品CTR结果集F,其中:CTR= 物品的点击用户数量 / 物品的曝光用户数量。
[0085] 数据样例如下:
[0086] 物品CTR结果集F:
[0087]item_id click_nums expose_nums CTR
i1 45 3122 0.0144
i3 137 21990 0.0062
i4 332 4762 0.0697
…… …… …… ……
[0088] 步骤S7:将物品CTR结果集F先过滤掉曝光数量不足预设的曝光阈值的物品,再进行CTR数值的降序排列,得到最终热门结果,即基于点击位置因素改进的CTR热门内容。
[0089] 需要说明的是,上述应用场景仅是本发明实施方式的一个示例,本发明的实施方式不限于上述应用场景,而是可以应用到任何本发明实施方式适用的应用场景中。
[0090] 另一方面,本申请还公开了一种基于点击位置因素改进的 CTR 热门内容计算装置。参阅2所示,基于点击位置因素改进的 CTR 热门内容计算装置,包括:
[0091] 信息获取模块101,用于获取用户近N天的点击曝光行为数据;
[0092] 点击集合A生成模块102,用于从点击曝光行为数据中获取点击集合A,其中,点击集合A包括用户编号、该用户编号获取的该批次推荐内容的编号,以及该用户编号发生点击行为的位置记录;
[0093] 曝光集合B生成模块103,用于从点击曝光行为数据中获取曝光集合B,其中,曝光集合B包括用户编号、该用户编号获取的该批次推荐内容的编号,以及该用户编号发生曝光行为的位置记录;
[0094] 集合C生成模块104,用于将曝光集合B通过用户编号和该批次推荐内容的编号与点击集合A进行内关联得到集合C,集合C中仅包括发生了点击行为的批次中的曝光数据;
[0095] 曝光集合D生成模块105,用于在集合C中,根据预设的第一筛选策略筛选出发生点击行为的点击位置附近的曝光数据,得到曝光集合D;
[0096] 集合E生成模块106,用于将点击集合A与筛选后的曝光集合D进行合并,得到集合E;
[0097] 点击率计算模块107,对集合E中的所有物品计算CTR,以获得物品CTR结果集F;
[0098] CTR 热门内容选取模块108,用于将物品CTR结果集F过滤掉曝光数量小于预设的曝光阈值的物品,再进行CTR 数值降序排列,得到最终热门结果,即基于点击位置因素改进的 CTR 热门内容。
[0099] 另外,本申请的实例可以通过由数据处理设备如计算机执行的数据处理程序来实现。显然,数据处理程序构成了本申请。此外,通常存储在一个存储介质中的数据处理程序通过直接将程序读取出存储介质或者通过将程序安装或复制到数据处理设备的存储设备(如硬盘和或内存)中执行。因此,这样的存储介质也构成了本发明。存储介质可以使用任何类型的记录方式,例如纸张存储介质(如纸带等)、磁存储介质(如软盘、硬盘、闪存等)、光存储介质(如CD‑ROM等)、磁光存储介质(如MO等)等。
[0100] 因此本申请还公开了一种非易失性存储介质,其中存储有数据处理程序,该数据处理程序用于执行本申请的基于点击位置因素改进的 CTR 热门内容计算方法的任何一种实例。
[0101] 综上所述,本申请公开了基于点击位置因素改进的 CTR 热门内容计算方法及装置,所述方法引入了用户注意力因素,将用户真正注意到的点击位置附近的曝光数据加入到CTR计算中,进而获得基于点击位置因素改进的CTR热门内容,明显提升了应用该方法的产品其UV点击率指标,有效减轻了无效曝光对CTR所带来的影响。
[0102] 以上对本发明的具体实施例进行了详细描述,但其只是作为范例,本发明并不限制于以上描述的具体实施例。对于本领域技术人员而言,任何对本发明进行的等同修改和替代也都在本发明的范畴之中。因此,在不脱离本发明的精神和范围下所作的均等变换和修改,都应涵盖在本发明的范围内。