可疑刷量视频的识别方法、真实播放量预估方法及装置转让专利

申请号 : CN201910690295.2

文献号 : CN110290400A

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王中晴彭涛

申请人 : 北京奇艺世纪科技有限公司

摘要 :

本发明实施例提供了可疑刷量视频的识别方法、真实播放量预估方法及装置,应用于视频检测技术领域。该识别方法包括:确定待识别的目标视频和目标播放端,所述目标播放端为视频识别所针对的播放端;确定针对所述目标播放端识别可疑刷量视频时,所依据的各个评判维度;计算预定时段内,所述目标视频在所述各个评判维度下的评判值;基于所述各个评判维度下的评判值,识别所述目标视频是否为可疑刷量视频,得到识别结果。可见,通过本方案可以有效地识别视频是否为可疑刷量视频。

权利要求 :

1.一种可疑刷量视频的识别方法,其特征在于,包括:

确定待识别的目标视频和目标播放端;其中,所述目标播放端为视频识别所针对的播放端;

确定针对所述目标播放端识别可疑刷量视频时,所依据的各个评判维度;每一评判维度为视频刷量时受到影响的维度;

计算预定时段内,所述目标视频在所述各个评判维度下的评判值;

基于所述各个评判维度下的评判值,识别所述目标视频是否为可疑刷量视频,得到识别结果。

2.根据权利要求1所述的方法,其特征在于,所述确定针对所述目标播放端识别可疑刷量视频时,所依据的各个评判维度的步骤,包括:获取关于各个播放端与各个播放端所依据的评判维度的对应关系,其中,每一播放端所依据的评判维度为针对该播放端识别可疑刷量视频时所依据的评判维度;

从所获得的对应关系中,获取针对所述目标播放端识别可疑刷量视频时,所依据的各个评判维度。

3.根据权利要求2所述的方法,其特征在于,所述各个播放端包括:网页端、客户端和影音设备端;

所述关于各个播放端与各个播放端所依据的评判维度的对应关系,包括:所述网页端对应于如下评判维度的一个或多个:

播放视频的新增用户的播放量占比、视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、视频在每个播放端的播放量与该视频所属频道在每个播放端的播放量的相关性、视频的播放量在各个播放端的总播放量中的占比、播放视频的用户中登录用户的占比、视频的正片播放率,以及,视频的播放事件中满足预定播放时长的播放事件的占比;其中,所述新增用户为符合预定新增条件的用户;

所述客户端对应于如下评判维度的一个或多个:

播放视频的新增用户的播放量占比、视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、播放视频的用户中登录用户的占比、视频的正片播放率,以及视频的播放事件中满足预定播放时长的播放事件的占比;

所述影音设备端对应于如下评判维度的一个或多个:

视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、播放视频的用户中登录用户的占比、视频的正片播放率,以及视频的播放事件中满足预定播放时长的播放事件的占比。

4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于所述各个评判维度下的评判值,识别所述目标视频是否为可疑刷量视频,得到识别结果的步骤,包括:针对所述各个评判维度中每一评判维度,判断该评判维度下的评判值是否满足该评判维度对应的预定刷量条件,得到判断结果;如果所得到的各个判断结果中,表明满足对应预定刷量条件的判断结果的数量,大于预定数量阈值,确定所述目标视频为可疑刷量视频,否则,确定所述目标视频不为可疑刷量视频;

或者,

对所述各个评判维度下的评判值进行加权计算,得到计算结果;如果所述计算结果符合所述加权计算对应的预定刷量条件,确定所述目标视频为可疑刷量视频,否则,确定所述目标视频不为可疑刷量视频。

5.一种可疑刷量视频的真实播放量预估方法,其特征在于,所述方法包括:当根据权利要求1-4任一项所述的识别方法识别出目标视频为可疑刷量视频时,统计所述识别方法所利用的预定时段内,目标播放端以外的其他播放端中,所述目标视频的播放量之和pca_other_sum_bvv;其中,所述目标播放端为可疑刷量视频识别所针对的播放端;

统计所述预定时段内,所述目标播放端中所述目标视频的播放量pca_bvv;

统计所述预定时段内,各个播放端在经过数据清洗后所述目标视频的播放量之和all_sum_bvv;其中,所述数据清洗为去除刷量用户的处理;

利用所计算得到的pca_other_sum_bvv、pca_bvv和all_sum_bvv,基于预定公式,预估所述预定时间内所述目标视频在所述目标播放端中的真实播放量pca_bvv_predict;

其中,所述预定公式包括:

所述pca_ratio=pca_bvv/all_sum_bvv。

6.一种可疑刷量视频的识别装置,其特征在于,包括:

第一确定单元,用于确定待识别的目标视频和目标播放端;其中,所述目标播放端为视频识别所针对的播放端;

第二确定单元,用于确定针对所述目标播放端识别可疑刷量视频时,所依据的各个评判维度;每一评判维度为视频刷量时受到影响的维度;

计算单元,用于计算预定时段内,所述目标视频在所述各个评判维度下的评判值;

识别单元,用于基于所述各个评判维度下的评判值,识别所述目标视频是否为可疑刷量视频,得到识别结果。

7.根据权利要求6所述的装置,其特征在于,所述第二确定单元包括:对应关系确定子单元,用于获取关于各个播放端与各个播放端所依据的评判维度的对应关系,其中,每一播放端所依据的评判维度为针对该播放端识别可疑刷量视频时所依据的评判维度;

维度获取子单元,用于从所获得的对应关系中,获取针对所述目标播放端识别可疑刷量视频时,所依据的各个评判维度。

8.根据权利要求7所述的装置,其特征在于,所述各个播放端包括:网页端、客户端和影音设备端;

所述关于各个播放端与各个播放端所依据的评判维度的对应关系,包括:所述网页端对应于如下评判维度的一个或多个:

播放视频的新增用户的播放量占比、视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、视频在每个播放端的播放量与该视频所属频道在每个播放端的播放量的相关性、视频的播放量在各个播放端的总播放量中的占比、播放视频的用户中登录用户的占比、视频的正片播放率,以及,视频的播放事件中满足预定播放时长的播放事件的占比;其中,所述新增用户为符合预定新增条件的用户;

所述客户端对应于如下评判维度的一个或多个:

播放视频的新增用户的播放量占比、视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、播放视频的用户中登录用户的占比、视频的正片播放率,以及视频的播放事件中满足预定播放时长的播放事件的占比;

所述影音设备端对应于如下评判维度的一个或多个:

视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、播放视频的用户中登录用户的占比、视频的正片播放率,以及视频的播放事件中满足预定播放时长的播放事件的占比。

9.根据权利要求6-8任一项所述的装置,其特征在于,所述识别单元包括:第一识别子单元,用于针对所述各个评判维度中每一评判维度,判断该评判维度下的评判值是否满足该评判维度对应的预定刷量条件,得到判断结果;如果所得到的各个判断结果中,表明满足对应预定刷量条件的判断结果的数量,大于预定数量阈值,确定所述目标视频为可疑刷量视频,否则,确定所述目标视频不为可疑刷量视频;

或者,

第二识别子单元,用于对所述各个评判维度下的评判值进行加权计算,得到计算结果;

如果所述计算结果符合所述加权计算对应的预定刷量条件,确定所述目标视频为可疑刷量视频,否则,确定所述目标视频不为可疑刷量视频。

10.一种可疑刷量视频的真实播放量预估装置,其特征在于,所述装置包括:第一统计单元,用于当根据权利要求1-4任一项所述的识别方法识别出目标视频为可疑刷量视频时,统计所述识别方法所利用的预定时段内,目标播放端以外的其他播放端中,所述目标视频的播放量之和pca_other_sum_bvv;其中,所述目标播放端为可疑刷量视频识别所针对的播放端;

第二统计单元,用于统计所述预定时段内,所述目标播放端中所述目标视频的播放量pca_bvv;其中,所述数据清洗为去除刷量用户的处理;

第三统计单元,用于统计所述预定时段内,各个播放端在经过数据清洗后所述目标视频的播放量之和all_sum_bvv;

计算单元,用于利用所计算得到的pca_other_sum_bvv、pca_bvv和all_sum_bvv,基于预定公式,预估所述预定时间内所述目标视频在所述目标播放端中的真实播放量pca_bvv_predict;

其中,所述预定公式包括:

所述pca_ratio=pca_bvv/all_sum_bvv。

11.一种服务器,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的方法步骤。

说明书 :

可疑刷量视频的识别方法、真实播放量预估方法及装置

技术领域

[0001] 本发明涉及视频检测技术领域,特别是涉及可疑刷量视频的识别方法、真实播放量预估方法及装置。

背景技术

[0002] 随着互联网的高速发展,视频网站也逐渐被大众熟识和使用。而随着视频网站对用户的开放性的提升,视频网站中自制剧和自制综艺等,成为各大视频网站的宠儿。
[0003] 然而,在这一片繁荣的情境之下,存在着大量的灰色地带—视频刷量,不仅损害了视频网站平台方的利益,而且由于推荐系统的存在,很容易把刷量的视频推荐给更多的用户,无疑损害了大众的知情权。其中,所谓视频刷量是指:视频上传者为了使自己提交到视频网站的视频得到更高的关注和点击数,使用第三方机构模拟人类点击视频的行为。
[0004] 可见,如何有效地识别视频是否为可疑刷量视频,即视频是否存在刷量的可疑性,是一个亟待解决的问题。

发明内容

[0005] 本发明实施例的目的在于提供可疑刷量视频的识别方法及装置,以有效地识别视频是否为可疑刷量视频。另外,本发明实施例还提供了可疑刷量视频的真实播放量预估方法及装置,以在识别到视频为可疑刷量视频时,有效预估视频的真实播放量。具体技术方案如下:
[0006] 第一方面,本发明实施例提供了一种可疑刷量视频的识别方法,包括:
[0007] 确定待识别的目标视频和目标播放端;其中,所述目标播放端为视频识别所针对的播放端;
[0008] 确定针对所述目标播放端识别可疑刷量视频时,所依据的各个评判维度;每一评判维度为视频刷量时受到影响的维度;
[0009] 计算预定时段内,所述目标视频在所述各个评判维度下的评判值;
[0010] 基于所述各个评判维度下的评判值,识别所述目标视频是否为可疑刷量视频,得到识别结果。
[0011] 可选地,所述确定针对所述目标播放端识别可疑刷量视频时,所依据的各个评判维度的步骤,包括:
[0012] 获取关于各个播放端与各个播放端所依据的评判维度的对应关系,其中,每一播放端所依据的评判维度为针对该播放端识别可疑刷量视频时所依据的评判维度;
[0013] 从所获得的对应关系中,获取针对所述目标播放端识别可疑刷量视频时,所依据的各个评判维度。
[0014] 可选地,所述各个播放端包括:网页端、客户端和影音设备端;
[0015] 所述关于各个播放端与各个播放端所依据的评判维度的对应关系,包括:
[0016] 所述网页端对应于如下评判维度的一个或多个:
[0017] 播放视频的新增用户的播放量占比、视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、视频在每个播放端的播放量与该视频所属频道在每个播放端的播放量的相关性、视频的播放量在各个播放端的总播放量中的占比、播放视频的用户中登录用户的占比、视频的正片播放率,以及,视频的播放事件中满足预定播放时长的播放事件的占比;其中,所述新增用户为符合预定新增条件的用户;
[0018] 所述客户端对应于如下评判维度的一个或多个:
[0019] 播放视频的新增用户的播放量占比、视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、播放视频的用户中登录用户的占比、视频的正片播放率,以及视频的播放事件中满足预定播放时长的播放事件的占比;
[0020] 所述影音设备端对应于如下评判维度的一个或多个:
[0021] 视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、播放视频的用户中登录用户的占比、视频的正片播放率,以及视频的播放事件中满足预定播放时长的播放事件的占比。
[0022] 可选地,所述基于所述各个评判维度下的评判值,识别所述目标视频是否为可疑刷量视频,得到识别结果的步骤,包括:
[0023] 针对所述各个评判维度中每一评判维度,判断该评判维度下的评判值是否满足该评判维度对应的预定刷量条件,得到判断结果;如果所得到的各个判断结果中,表明满足对应预定刷量条件的判断结果的数量,大于预定数量阈值,确定所述目标视频为可疑刷量视频,否则,确定所述目标视频不为可疑刷量视频;
[0024] 或者,
[0025] 对所述各个评判维度下的评判值进行加权计算,得到计算结果;如果所述计算结果符合所述加权计算对应的预定刷量条件,确定所述目标视频为可疑刷量视频,否则,确定所述目标视频不为可疑刷量视频。
[0026] 第二方面,本发明实施例提供了一种可疑刷量视频的真实播放量预估方法,包括:
[0027] 当根据第一方面所提供的识别方法识别出目标视频为可疑刷量视频时,统计所述识别方法所利用的预定时段内,目标播放端以外的其他播放端中,所述目标视频的播放量之和pca_other_sum_bvv;其中,所述目标播放端为可疑刷量视频识别所针对的播放端;
[0028] 统计所述预定时段内,所述目标播放端中所述目标视频的播放量pca_bvv;
[0029] 统计所述预定时段内,各个播放端在经过数据清洗后所述目标视频的播放量之和all_sum_bvv;其中,所述数据清洗为去除刷量用户的处理;
[0030] 利用所计算得到的pca_other_sum_bvv、pca_bvv和all_sum_bvv,基于预定公式,预估所述预定时间内所述目标视频在所述目标播放端中的真实播放量pca_bvv_predict;
[0031] 其中,所述预定公式包括:
[0032]
[0033] 所述pca_ratio=pca_bvv/all_sum_bvv。
[0034] 第三方面,本发明实施例提供了一种可疑刷量视频的识别装置,包括:
[0035] 第一确定单元,用于确定待识别的目标视频和目标播放端;其中,所述目标播放端为视频识别所针对的播放端;
[0036] 第二确定单元,用于确定针对所述目标播放端识别可疑刷量视频时,所依据的各个评判维度;每一评判维度为视频刷量时受到影响的维度;
[0037] 计算单元,用于计算预定时段内,所述目标视频在所述各个评判维度下的评判值;
[0038] 识别单元,用于基于所述各个评判维度下的评判值,识别所述目标视频是否为可疑刷量视频,得到识别结果。
[0039] 可选地,所述第二确定单元包括:
[0040] 对应关系确定子单元,用于获取关于各个播放端与各个播放端所依据的评判维度的对应关系,其中,每一播放端所依据的评判维度为针对该播放端识别可疑刷量视频时所依据的评判维度;
[0041] 维度获取子单元,用于从所获得的对应关系中,获取针对所述目标播放端识别可疑刷量视频时,所依据的各个评判维度。
[0042] 可选地,所述各个播放端包括:网页端、客户端和影音设备端;
[0043] 所述关于各个播放端与各个播放端所依据的评判维度的对应关系,包括:
[0044] 所述网页端对应于如下评判维度的一个或多个:
[0045] 播放视频的新增用户的播放量占比、视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、视频在每个播放端的播放量与该视频所属频道在每个播放端的播放量的相关性、视频的播放量在各个播放端的总播放量中的占比、播放视频的用户中登录用户的占比、视频的正片播放率,以及,视频的播放事件中满足预定播放时长的播放事件的占比;其中,所述新增用户为符合预定新增条件的用户;
[0046] 所述客户端对应于如下评判维度的一个或多个:
[0047] 播放视频的新增用户的播放量占比、视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、播放视频的用户中登录用户的占比、视频的正片播放率,以及视频的播放事件中满足预定播放时长的播放事件的占比;
[0048] 所述影音设备端对应于如下评判维度的一个或多个:
[0049] 视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、播放视频的用户中登录用户的占比、视频的正片播放率,以及视频的播放事件中满足预定播放时长的播放事件的占比。
[0050] 可选地,所述识别单元包括:
[0051] 第一识别子单元,用于针对所述各个评判维度中每一评判维度,判断该评判维度下的评判值是否满足该评判维度对应的预定刷量条件,得到判断结果;如果所得到的各个判断结果中,表明满足对应预定刷量条件的判断结果的数量,大于预定数量阈值,确定所述目标视频为可疑刷量视频,否则,确定所述目标视频不为可疑刷量视频;
[0052] 或者,
[0053] 第二识别子单元,用于对所述各个评判维度下的评判值进行加权计算,得到计算结果;如果所述计算结果符合所述加权计算对应的预定刷量条件,确定所述目标视频为可疑刷量视频,否则,确定所述目标视频不为可疑刷量视频。
[0054] 第四方面,本发明实施例提供了一种可疑刷量视频的真实播放量预估装置,包括:
[0055] 第一统计单元,用于当根据第一方面所提供的识别方法识别出目标视频为可疑刷量视频时,统计所述识别方法所利用的预定时段内,目标播放端以外的其他播放端中,所述目标视频的播放量之和pca_other_sum_bvv;其中,所述目标播放端为可疑刷量视频识别所针对的播放端;
[0056] 第二统计单元,用于统计所述预定时段内,所述目标播放端中所述目标视频的播放量pca_bvv;
[0057] 第三统计单元,用于统计所述预定时段内,各个播放端在经过数据清洗后所述目标视频的播放量之和all_sum_bvv;其中,所述数据清洗为去除刷量用户的处理;
[0058] 计算单元,用于利用所计算得到的pca_other_sum_bvv、pca_bvv和all_sum_bvv,基于预定公式,预估所述预定时间内所述目标视频在所述目标播放端中的真实播放量pca_bvv_predict;
[0059] 其中,所述预定公式包括:
[0060]
[0061] 所述pca_ratio=pca_bvv/all_sum_bvv。
[0062] 第五方面,本发明实施例提供了一种服务器,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
[0063] 存储器,用于存放计算机程序;
[0064] 处理器,用于执行存储器上所存放的程序时,实现上述第一方面所提供的识别方法的步骤。
[0065] 第六方面,本发明实施例提供了一种服务器,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
[0066] 存储器,用于存放计算机程序;
[0067] 处理器,用于执行存储器上所存放的程序时,实现上述第二方面所提供的预估方法的步骤。
[0068] 第七方面,本发明实施还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所提供的识别方法的步骤。
[0069] 第八方面,本发明实施还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第二方面所提供的预估方法的步骤。
[0070] 第九方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面所提供的识别方法的步骤。
[0071] 第十方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第二方面所提供的预估方法的步骤。
[0072] 本发明实施例中,考虑到视频刷量为单端刷量行为,因此,在确定待识别的目标视频的同时,确定可疑刷量视频识别所针对的目标播放端;进而,确定针对该目标播放端识别可疑刷量视频时,所依据的各个评判维度,每一评判维度为视频刷量时受到影响的维度;并计算预定时段内,该目标视频在所述各个评判维度下的评判值;最后,基于各个评判维度下的评判值,识别该目标视频是否为可疑刷量视频,得到识别结果。可见,通过本方案可以有效地识别视频是否为可疑刷量视频。
[0073] 另外,在利用本发明实施例所提供的识别方法识别到目标视频为可疑刷量视频时,通过本发明实施例所提供的真实播放量预估方法,可以有效预估目标视频的真实播放量,从而更全面的了解目标视频的播放状况。
[0074] 当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

[0075] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0076] 图1为本发明实施例所提供的一种可疑刷量视频的识别方法的流程图;
[0077] 图2为本发明实施例所提供的一种可疑刷量视频的真实播放量预估方法的流程图;
[0078] 图3为本发明实施例所提供的一种可疑刷量视频的识别装置的结构示意图;
[0079] 图4为本发明实施例所提供的一种可疑刷量视频的真实播放量预估装置的结构示意图;
[0080] 图5为本发明实施例所提供的一种服务器的结构示意图;
[0081] 图6为本发明实施例所提供的一种服务器的结构示意图。

具体实施方式

[0082] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0083] 为了有效地识别视频是否为可疑刷量视频,即视频是否存在刷量的可疑性,本发明实施例提供了一种可疑刷量视频的识别方法。
[0084] 其中,本发明实施例所提供的一种可疑刷量视频的识别方法的执行主体可以为一种可疑刷量视频的识别装置,该装置可以运行于视频网站的服务器中。另外,本发明实施例中待识别的目标视频可以为单个视频,当然,也可以为存在多个视频文件的视频专辑,例如:连载视频的视频专辑,或者,电视剧专辑。在具体应用中,可以根据实际需求,选择单个视频或者视频专辑作为待识别的目标视频。
[0085] 如图1所示,本发明实施例所提供的一种可疑刷量视频的识别方法,可以包括如下步骤:
[0086] S101,确定待识别的目标视频和目标播放端;
[0087] 其中,该目标播放端为视频识别所针对的播放端。
[0088] 当满足可疑刷量视频的识别的触发条件时,可以确定待识别的目标视频。并且,考虑到视频刷量通常为单端刷量行为,因此,在确定待识别的目标视频的同时,可以确定可疑刷量视频识别所针对的目标播放端。进而,在确定目标视频和目标播放端后,执行识别方法的后续流程。其中,该触发条件可以检测到识别指令,或者,达到预定时间点,等等。
[0089] 其中,所谓的确定待识别的目标视频即为:确定待识别的目标视频的视频标识。类似的,所谓的确定可疑刷量视频识别所针对的目标播放端即为:确定可疑刷量视频识别所针对的目标播放端的端标识。并且,可以由人工指定或者系统指定方式,来确定哪些视频是待识别的目标视频;以及由人工指定或系统指定方式,来确定可疑刷量视频识别所针对的目标播放端。
[0090] 可以理解的是,在具体应用中,能够播放视频的播放端可以包括:网页端、客户端和影音设备端。其中,所谓网页端为在电子设备的浏览器中运行的能够播放视频的网页;所谓客户端为在电子设备中所安装的能够播放视频的应用程序;而所谓影音设备端为能够提供影音播放功能的硬件设备,如电视盒子、投屏设备等,或者,在智能电视、智能投影设备等具有影音播放功能的设备中运行的应用程序。另外,在具体应用中,根据电子设备类型不同的,网页端可以包括:PC(Personal Computer,个人计算机)网页端和移动网页端,而客户端可以包括:PC客户端和移动客户端。其中,所谓PC网页端为在PC的浏览器中运行的网页;所谓移动网页端为在移动终端的浏览器中运行的网页;所谓PC客户端为在PC中安装的应用程序;所谓移动客户端为在移动终端中安装的应用程序。
[0091] 基于上述关于能够播放视频的播放端的描述,本发明实施例所针对的各个播放端可以包括:网页端、客户端和影音设备端,那么,所确定的目标播放端可以为网页端、客户端或影音设备端。当然,为了更加精细的识别,本发明实施例所针对的各个播放端可以包括PC网页端、移动网页端、PC客户端、移动客户端和影音设备端,那么,所确定的目标播放端可以为PC网页端、移动网页端、PC客户端、移动客户端或影音设备端。
[0092] S102,确定针对该目标播放端识别可疑刷量视频时,所依据的各个评判维度;
[0093] 由于不同的播放端,视频进行刷量时存在的影响不同,因此,在确定出目标播放端后,为了实现针对该目标播放端的视频识别,可以确定针对该目标播放端识别可疑刷量视频时,所依据的各个评判维度,每一评判维度为在目标播放端进行视频刷量时受到影响的维度。
[0094] 可以理解的是,确定针对该目标播放端识别可疑刷量视频时,所依据的各个评判维度的具体实现方式,存在多种。
[0095] 示例性的,在一种实现方式中,所述确定针对目标播放端识别可疑刷量视频时,所依据的各个评判维度的步骤,可以包括:
[0096] 获取关于各个播放端与各个播放端所依据的评判维度的对应关系,其中,每一播放端所依据的评判维度为针对该播放端识别可疑刷量视频时所依据的评判维度;
[0097] 从所获得的对应关系中,获取针对所述目标播放端识别可疑刷量视频时,所依据的各个评判维度。
[0098] 该具体实现方式中,关于各个播放端与各个播放端所依据的评判维度的对应关系,可以为基于经验值或统计分析所设定的。当然,基于对应关系,来确定针对所述目标播放端识别可疑刷量视频时,所依据的各个评判维度,仅仅作为一种示例,并不应该构成对本发明实施例的限定。例如:还可以在给定待识别的目标视频时,人工给定针对该目标播放端识别可疑刷量视频时,所依据的各个评判维度,这也是合理的。
[0099] 为了方案清楚及布局清晰,后续对关于各个播放端与各个播放端所依据的评判维度的对应关系,进行示例性说明。
[0100] S103,计算预定时段内,该目标视频在各个评判维度下的评判值;
[0101] 在确定出所依据的各个评判维度后,可以按照与各个评判维度匹配的计算方式或统计方式,来计算预定时段内,该目标视频在各个评判维度下的评判值。
[0102] 另外,可以理解的是,可以获取该目标视频的视频播放日志和/或各个用户的播放点击日志,进而,利用该视频播放日志和/或各个用户的播放点击日志中的日志信息,计算预定时段内,该目标视频在各个评判维度下的评判值。在具体应用中,可以利用kafka开源流处理平台对用户的播放点击日志进行采集,并导入到Hadoop大数据平台中,使用HIVE作为数据存储的数据仓库。
[0103] 可以理解的是,该预定时段的时长,可以根据实际需求设定,例如:一天、一周、一个月等等。并且,预定时段的表征形式可以存在多种。示例性的,在一种实现方式中,可以给定起始时间点和时长,例如:起始时间点为2019年5月14日00:00,而时长为一周。而在另一种实现方式中,可以给定起始时间点和结束时间点,例如:起始时间点为2019年5月14日00:00,终止时间点为2019年5月21日00:00。
[0104] S104,基于各个评判维度下的评判值,识别该目标视频是否为可疑刷量视频,得到识别结果。
[0105] 在获得各个评判维度下的评判值后,可以通过预定的分析方式,基于各个评判维度下的评判值,识别该目标视频是否为可疑刷量视频,得到识别结果。另外,在确定出该目标视频为可疑刷量视频时,表明该目标视频存在刷量的可疑性。
[0106] 可以理解的是,所述基于各个评判维度下的评判值,识别该目标视频是否为可疑刷量视频,得到识别结果的具体实现方式存在多种。
[0107] 示例性的,在一种实现方式中,所述基于各个评判维度下的评判值,识别该目标视频是否为可疑刷量视频,得到识别结果的步骤,可以包括:
[0108] 针对该各个评判维度中每一评判维度,判断该评判维度下的评判值是否满足该评判维度对应的预定刷量条件,得到判断结果;如果所得到的各个判断结果中,表明满足对应预定刷量条件的判断结果的数量,大于预定数量阈值,确定该目标视频为可疑刷量视频,否则,确定该目标视频不为可疑刷量视频。
[0109] 该种实现方式中,每一评判维度对应一个预定刷量条件,这样,可以针对每一评判维度,判断该评判维度下的评判值是否满足预定刷量条件,得到判断结果;进而基于各个判断结果中满足相应预定刷量条件的判断结果的数量,确定目标视频是否为可疑刷量视频。
[0110] 可以理解的是,每一评判维度对应的预定刷量条件可以根据相应评判维度进行设定,后续结合具体的评判维度,进行举例说明。另外,预定数量阈值可以根据实际情况设定,例如:预定数量阈值可以为少于各个评判维度的总数量的值,也可以为等于各个评判维度的总数量的值。
[0111] 在另一种实现方式中,所述基于各个评判维度下的评判值,识别该目标视频是否为可疑刷量视频,得到识别结果的步骤,可以包括:
[0112] 对各个评判维度下的评判值进行加权计算,得到计算结果;如果该计算结果符合所述加权计算对应的预定刷量条件,确定该目标视频为可疑刷量视频,否则,确定该目标视频不为可疑刷量视频。
[0113] 由于不同的播放端,所依据的各个评判维度可能不同,因此,针对每一播放端,可以设定关于所依据的各个评判维度的所对应的权重。
[0114] 本发明实施例中,考虑到视频刷量为单端刷量行为,因此,在确定待识别的目标视频的同时,确定可疑刷量视频识别所针对的目标播放端;进而,确定针对该目标播放端识别可疑刷量视频时,所依据的各个评判维度,每一维度为视频刷量时受到影响的维度;并计算预定时段内,该目标视频在所述各个评判维度下的评判值;最后,基于各个评判维度下的评判值,识别该目标视频是否为可疑刷量视频,得到识别结果。可见,通过本方案可以有效地识别视频是否为可疑刷量视频。
[0115] 为了方案清楚及布局清晰,下面示例性的介绍关于各个播放端与各个播放端所依据的评判维度的对应关系。
[0116] 示例性的,在一种实现方式中,所述各个播放端包括:网页端、客户端和影音设备端;
[0117] 所述关于各个播放端与各个播放端所依据的评判维度的对应关系,包括:
[0118] 网页端对应于如下评判维度的一个或多个:
[0119] 播放视频的新增用户的播放量占比、视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、视频在每个播放端的播放量与该视频所属频道在每个播放端的播放量的相关性、视频的播放量在各个播放端的总播放量中的占比、播放视频的用户中登录用户的占比、视频的正片播放率,以及,视频的播放事件中满足预定播放时长的播放事件的占比;其中,该新增用户为符合预定新增条件的用户;
[0120] 客户端对应于如下评判维度的一个或多个:
[0121] 播放视频的新增用户的播放量占比、视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、播放视频的用户中登录用户的占比、视频的正片播放率,以及视频的播放事件中满足预定播放时长的播放事件的占比;
[0122] 影音设备端对应于如下评判维度的一个或多个:
[0123] 视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、播放视频的用户中登录用户的占比、视频的正片播放率,以及视频的播放事件中满足预定播放时长的播放事件的占比。
[0124] 示例性的,在另一种实现方式中,所述各个播放端包括:PC网页端、移动网页端、PC客户端、移动客户端和影音设备端;
[0125] 所述关于各个播放端与各个播放端所依据的评判维度的对应关系,包括:
[0126] PC网页端和移动网页端均对应于如下评判维度的一个或多个:
[0127] 播放视频的新增用户的播放量占比、视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、视频在每个播放端的播放量与该视频所属频道在每个播放端的播放量的相关性、视频的播放量在各个播放端的总播放量中的占比、播放视频的用户中登录用户的占比、视频的正片播放率,以及,视频的播放事件中满足预定播放时长的播放事件的占比;其中,该新增用户为符合预定新增条件的用户;
[0128] PC客户端和移动客户端均对应于如下评判维度的一个或多个:
[0129] 播放视频的新增用户的播放量占比、视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、播放视频的用户中登录用户的占比、视频的正片播放率,以及视频的播放事件中满足预定播放时长的播放事件的占比;
[0130] 影音设备端对应于如下评判维度的一个或多个:
[0131] 视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、播放视频的用户中登录用户的占比、视频的正片播放率,以及视频的播放事件中具有满足播放时长的播放事件的占比。
[0132] 为了方案清楚,下面针对每一评判维度进行详细介绍:
[0133] (1)播放视频的新增用户的播放量占比:
[0134] 由于视频刷量通常是短时间的大量播放行为,且大量的播放行为的用户通常是新注册用户或新访客,因此,可以将播放视频的新增用户的播放量占比,作为一个评判维度。并且,播放视频的新增用户的播放量占比越高,表明视频刷量的可疑性越高。
[0135] 其中,该新增用户为符合预定新增条件的用户。示例性的,该预定新增条件可以为:在该预定时段之前的指定时长内未发生过播放行为。例如:预定时段为2019年5月10日00:00至2019年5月10日24:00,该预定新增条件可以为:在2019年5月10日00:00至2019年5月10日24:00之前一个月内未发生过播放行为。当然,预定新增条件并不局限于上述所给的示例。
[0136] 播放视频的新增用户的播放量占比具体为:对于所针对的播放端,一视频的总播放量中新增用户所产生的播放量与该视频的总播放量的比值。通过分析视频的视频播放日志和/或各个用户的播放点击日志,可以计算得到该播放视频的新增用户的播放量占比。
[0137] 其中,播放视频的新增用户的播放量占比所对应的预定刷量条件可以为:大于预定的第一比例阈值。该第一比例阈值可以根据实际情况设定,例如:该第一比例阈值可以为70%、75%、80%等等。
[0138] 针对播放视频的新增用户的播放量占比这个评判维度而言,所述计算预定时段内,所述目标视频在所述各个评判维度下的评判值,具体可以为:
[0139] 计算预定时段内,播放该目标视频的新增用户的播放量占比的具体比值。
[0140] (2)视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性:
[0141] 对于大数据环境来说,每个视频与其所在的频道的分时段播放量是正相关的,如果视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的正相关越弱,表明视频属于刷量视频的可疑性越大。其中,相关性通常可以用相关系数表征,相关系数的值在[-1,1]之间,值越小,代表着视频越可疑。
[0142] 可选地,所述视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性,包括:
[0143] 视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的皮尔逊相关系数。
[0144] 示例性的,假如预定时段为某一天,那么可以统计视频在每个小时内的播放量,以及该视频所属频道在每个子时段的播放量,计算视频在每个小时的播放量与该视频所属频道在每个小时的播放量的皮尔逊相关系数。
[0145] 可以理解的是,在统计学中,皮尔逊相关系数(Pearson  correlation coefficient),又称皮尔逊积矩相关系数(Pearson product-moment correlation coefficient,简称PPMCC或PCCs),是用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间。其中,两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商。本实施例中,对于该评判维度而言,变量X和变量Y分别为:视频在每个小时内的播放量,以及该视频所属频道在每个子时段的播放量。
[0146] 当然,在另一种实现方式中,可以将视频在每个子时段的播放量拟合成曲线,以及将视频所属频道在每个子时段的播放量拟合成曲线,然后,计算两条曲线的相关性。相关性越小,表明视频属于刷量视频的可疑性越大。
[0147] 对于该评判维度而言,所对应的预定刷量条件可以为:小于预定的第一系数阈值。该第一系数阈值可以根据实际情况设定,例如:该第一系数阈值可以为-0.5、-0.6、-0.7、-
0.8等等。
[0148] 针对该评判维度而言,所述计算预定时段内,所述目标视频在所述各个评判维度下的评判值,具体可以为:
[0149] 计算预定时段内,所述目标视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性的具体值。
[0150] (3)视频在每个播放端的播放量与该视频所属频道在每个播放端的播放量的相关性:
[0151] 对于大数据环境来说,视频与其所在的频道的分平台播放量是正相关的,如果视频与其所在的频道的分平台播放量的正相关越弱,表明视频属于刷量视频的可疑性越大。其中,相关性通常可以用相关系数表征,相关系数的值在[-1,1]之间,值越小,代表着视频越可疑。
[0152] 所述视频在每个播放端的播放量与该视频所属频道在每个播放端的播放量的相关性,包括:
[0153] 视频在每个播放端的播放量与该视频所属频道在每个播放端的播放量的皮尔逊相关系数。
[0154] 示例性的,假如视频所在的播放端为上述的五个播放端:PC客户端、PC网页端、移动客户端、移动网页端、影音设备端,那么可以统计视频在每个播放端的播放量与该视频所属频道在每个播放端的播放量的皮尔逊相关系数。本实施例中,对于该评判维度而言,在计算皮尔逊相关系数时,变量X和变量Y分别为:视频在每个播放端的播放量,以及该视频所属频道在每个播放端的播放量。
[0155] 当然,在另一种实现方式中,可以将视频在每个播放端的播放量拟合成曲线,以及将视频所属频道在每个播放端的播放量拟合成曲线,然后,计算两条曲线的相关性。相关性越小,表明视频属于刷量视频的可疑性越大。
[0156] 对于该评判维度而言,所对应的预定刷量条件可以为:小于预定的第二系数阈值。该第二系数阈值可以根据实际情况设定,例如:该第二系数阈值可以为-0.5、-0.6、-0.7、-
0.8等等。
[0157] 针对该评判维度而言,所述计算预定时段内,所述目标视频在所述各个评判维度下的评判值,具体可以为:
[0158] 计算预定时段内,所述目标视频在每个播放端的播放量与该视频所属频道在每个播放端的播放量的相关性的具体值。
[0159] (4)视频的播放量在各个播放端的总播放量中的占比:
[0160] 经过大数据分析可知,视频在某一播放端的播放量在各个播放端的总播放量中的占比越高,表明视频在该端进行刷量的可疑性越高。
[0161] 对于该评判维度而言,所对应的预定刷量条件可以为:大于预定的第二比例阈值。该第二比例阈值可以根据实际情况设定,例如:该第二比例阈值可以为50%、55%、60%、
65%、70%等等。
[0162] 针对该评判维度而言,所述计算预定时段内,所述目标视频在所述各个评判维度下的评判值,具体可以为:
[0163] 计算预定时段内,目标视频在目标播放端的播放量在各个播放端的总播放量中的占比的比值。
[0164] (5)播放视频的用户中登录用户的占比:
[0165] 经过大数据分析可知,对于一个正常的高播放量剧集,其登录用户占比是相对较高的。若一个视频存在着高播放量,然而登录用户占比却较低,表明该视频存在刷量的可疑行为。因此,将播放视频的用户中登录用户的占比作为一个评判维度。
[0166] 对于该评判维度而言,所对应的预定刷量条件可以为:小于预定的第三比例阈值。该第三比例阈值可以根据实际情况设定,例如:该第三比例阈值可以为10%、20%、30%、
40%等等。
[0167] 针对该评判维度而言,所述计算预定时段内,所述目标视频在所述各个评判维度下的评判值,具体可以为:
[0168] 计算预定时段内,针对该目标播放端,播放目标视频的用户中登录用户的占比的比值。
[0169] (6)视频的正片播放率;
[0170] 其中,视频的正片播放率为:正片观看量与播放量的比值。
[0171] 经过大数据分析可知,一个存在着高播放量的视频,代表视频应该具有较高的热度和趣味性,其用户应该会观看其中的内容,而不是点击一下视频就关闭了,若观看量与播放量的占比过低,也代表着该视频可能存在刷量行为。该种评判维度,可以应用于有广告分成的视频的识别。
[0172] 对于该评判维度而言,所对应的预定刷量条件可以为:小于预定的第四比例阈值。该第四比例阈值可以根据实际情况设定,例如:该第四比例阈值可以为10%、20%、30%、
40%等等。
[0173] 针对该评判维度而言,所述计算预定时段内,所述目标视频在所述各个评判维度下的评判值,具体可以为:
[0174] 计算预定时段内,针对该目标播放端,该目标视频的正片播放率的具体值。
[0175] (7)视频的播放事件中满足预定播放时长的播放事件的占比;
[0176] 经过大数据分析可知,刷量视频中,为了获得点击数,播放时长较短的占比相对较多,可以设定预定播放时长,如1分钟、2分钟、3分钟、4分钟、5分钟等,计算视频的播放事件中满足预定播放时长的播放事件的占比。
[0177] 对于该评判维度而言,所对应的预定刷量条件可以为:大于预定的第五比例阈值。该第五比例阈值可以根据实际情况设定,例如:该第五比例阈值可以为50%、60%、65%、
70%等等。可以理解的是,可以设定一个预定播放时长,也可以设置多个预定播放时长。当设置多个预定播放时长时,所对应的预定刷量条件可以为:比值均值大于预定的第六比例阈值,当然并不局限于此。针对该评判维度而言,所述计算预定时段内,所述目标视频在所述各个评判维度下的评判值,具体可以为:
[0178] 计算预定时段内,针对该目标播放端,目标视频的播放事件中满足预定播放时长的播放事件的占比的比值。
[0179] 另外,在识别到视频属于可疑刷量视频时,通常存在获知视频的真实播放量的需求,从而更全面地了解视频的播放状况。基于该需求,在上述的包括步骤S101-S104的基础上,本发明实施例还提供的一种可疑刷量视频的真实播放量预估方法。如图2所示,本发明实施例所提供的一种可疑刷量视频的真实播放量预估方法还可以包括如下步骤:
[0180] S201,当根据本发明实施例所提供的识别方法识别出目标视频为可疑刷量视频时,统计该识别方法所利用的预定时段内,目标播放端以外的其他播放端中,所述目标视频的播放量之和pca_other_sum_bvv;该目标播放端为可疑刷量视频识别所针对的播放端;
[0181] S202,统计该预定时段内,该目标播放端中该目标视频的播放量pca_bvv;
[0182] S203,统计该预定时段内,各个播放端在经过数据清洗后该目标视频的播放量之和all_sum_bvv;
[0183] 其中,所述的数据清洗为去除刷量的用户的处理。其中,去除刷量的用户可以采用任一种刷量用户的过滤方法,在此不做限定。
[0184] S204,利用所计算得到的pca_other_sum_bvv、pca_bvv和all_sum_bvv,基于预定公式,预估该预定时间内该目标视频在该目标播放端中的真实播放量pca_bvv_predict;
[0185] 其中,该预定公式可以包括:
[0186]
[0187] 该pca_ratio=pca_bvv/all_sum_bvv。
[0188] 可以理解的是,可以通过对目标视频的视频播放日志和/或各个用户的播放点击日志进行分析,从而得到上述的S201-S203中各个统计值。
[0189] 本实施例中,在识别到视频属于可疑刷量视频时,可以有效预估出该视频的真实播放量,从而使得对目标视频的播放状况的了解更加全面。
[0190] 相应于上述的可疑刷量视频的识别方法的实施例,本发明实施例还提供了一种可疑刷量视频的识别装置。如图3所示,本发明实施例所提供的一种可疑刷量视频的识别装置可以包括:
[0191] 第一确定单元310,用于确定待识别的目标视频和目标播放端;其中,所述目标播放端为视频识别所针对的播放端;
[0192] 第二确定单元320,用于确定针对所述目标播放端识别可疑刷量视频时,所依据的各个评判维度;每一评判维度为视频刷量时受到影响的维度;
[0193] 计算单元330,用于计算预定时段内,所述目标视频在所述各个评判维度下的评判值;
[0194] 识别单元340,用于基于所述各个评判维度下的评判值,识别所述目标视频是否为可疑刷量视频,得到识别结果。
[0195] 本发明实施例中,考虑到视频刷量为单端刷量行为,因此,在确定待识别的目标视频的同时,确定可疑刷量视频识别所针对的目标播放端;进而,确定针对该目标播放端识别可疑刷量视频时,所依据的各个评判维度,并计算预定时段内,该目标视频在所述各个评判维度下的评判值;最后,基于各个评判维度下的评判值,识别该目标视频是否为可疑刷量视频,得到识别结果。可见,通过本方案可以有效地识别视频是否为可疑刷量视频。
[0196] 可选地,所述第二确定单元320可以包括:
[0197] 对应关系确定子单元,用于获取关于各个播放端与各个播放端所依据的评判维度的对应关系,其中,每一播放端所依据的评判维度为针对该播放端识别可疑刷量视频时所依据的评判维度;
[0198] 维度获取子单元,用于从所获得的对应关系中,获取针对所述目标播放端识别可疑刷量视频时,所依据的各个评判维度。
[0199] 可选地,所述各个播放端包括:网页端、客户端和影音设备端;
[0200] 所述关于各个播放端与各个播放端所依据的评判维度的对应关系,包括:
[0201] 所述网页端对应于如下评判维度的一个或多个:
[0202] 播放视频的新增用户的播放量占比、视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、视频在每个播放端的播放量与该视频所属频道在每个播放端的播放量的相关性、视频的播放量在各个播放端的总播放量中的占比、播放视频的用户中登录用户的占比、视频的正片播放率,以及,视频的播放事件中满足预定播放时长的播放事件的占比;其中,所述新增用户为符合预定新增条件的用户;
[0203] 所述客户端对应于如下评判维度的一个或多个:
[0204] 播放视频的新增用户的播放量占比、视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、播放视频的用户中登录用户的占比、视频的正片播放率,以及视频的播放事件中满足预定播放时长的播放事件的占比;
[0205] 所述影音设备端对应于如下评判维度的一个或多个:
[0206] 视频在每个子时段的播放量与该视频所属频道在每个子时段的播放量的相关性、播放视频的用户中登录用户的占比、视频的正片播放率,以及视频的播放事件中满足预定播放时长的播放事件的占比。
[0207] 可选地,所述识别单元340可以包括:
[0208] 第一识别子单元,用于针对所述各个评判维度中每一评判维度,判断该评判维度下的评判值是否满足该评判维度对应的预定刷量条件,得到判断结果;如果所得到的各个判断结果中,表明满足对应预定刷量条件的判断结果的数量,大于预定数量阈值,确定所述目标视频为可疑刷量视频,否则,确定所述目标视频不为可疑刷量视频;
[0209] 或者,
[0210] 第二识别子单元,用于对各个评判维度下的评判值进行加权计算,得到计算结果;如果所述计算结果符合所述加权计算对应的预定刷量条件,确定所述目标视频为可疑刷量视频,否则,确定所述目标视频不为可疑刷量视频。
[0211] 相应于上述的可疑刷量视频的真实播放量预估方法,本发明实施例还提供了一种可疑刷量视频的真实播放量预估装置。如图4所示,本发明实施例所提供的一种可疑刷量视频的真实播放量预估装置,可以包括:
[0212] 第一统计单元410,用于当根据本发明实施例所提供的识别方法识别出目标视频为可疑刷量视频时,统计该识别方法所利用的预定时段内,目标播放端以外的其他播放端中,所述目标视频的播放量之和pca_other_sum_bvv;其中,所述目标播放端为可疑刷量视频识别所针对的播放端;
[0213] 第二统计单元420,用于统计所述预定时段内,所述目标播放端中所述目标视频的播放量pca_bvv;
[0214] 第三统计单元430,用于统计所述预定时段内,各个播放端在经过数据清洗后所述目标视频的播放量之和all_sum_bvv;其中,所述数据清洗为去除刷量用户的处理;
[0215] 计算单元440,用于利用所计算得到的pca_other_sum_bvv、pca_bvv和all_sum_bvv,基于预定公式,预估该预定时间内该目标视频在该目标播放端中的真实播放量pca_bvv_predict;
[0216] 其中,所述预定公式包括:
[0217]
[0218] 所述pca_ratio=pca_bvv/all_sum_bvv。
[0219] 另外,相对于上述的可疑刷量视频的识别方法实施例,本发明实施例还提供了一种服务器,如图5所示,包括处理器501、通信接口502、存储器503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信,
[0220] 存储器503,用于存放计算机程序;
[0221] 处理器501,用于执行存储器503上所存放的程序时,实现本发明实施例所提供的一种可疑刷量视频的识别方法的步骤。
[0222] 另外,相对于上述的可疑刷量视频的真实播放量预估方法的实施例,本发明实施例还提供了一种服务器,如图6所示,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信,[0223] 存储器603,用于存放计算机程序;
[0224] 处理器601,用于执行存储器603上所存放的程序时,实现本发明实施例所提供的一种可疑刷量视频的真实播放量预估方法的步骤。
[0225] 上述服务器提到的通信总线可以是外设部件互连标准(Peripheral Component Interconnect,PCI)总线或扩展工业标准结构(Extended Industry  Standard Architecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0226] 通信接口用于上述服务器与其他设备之间的通信。
[0227] 存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
[0228] 上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
[0229] 在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述的一种可疑刷量视频的识别方法的步骤。
[0230] 在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述的一种可疑刷量视频的真实播放量预估方法的步骤。
[0231] 在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中一种可疑刷量视频的识别方法。
[0232] 在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中一种可疑刷量视频的真实播放量预估方法。
[0233] 在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
[0234] 需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0235] 本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、存储介质、计算机程序产品的实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0236] 以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。