一种广告点位异常流量识别的方法和装置转让专利

申请号 : CN202010650617.3

文献号 : CN111953557B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张可成田丹丹丁若谷

申请人 : 北京明略昭辉科技有限公司

摘要 :

本发明提出一种广告点位异常流量识别的方法和装置,包括以下步骤:将各个广告点位的每日总流量和各广告点位的流量阈值比较,获得的待分析广告点位;根据各待分析广告点位上各设备的流量情况,得到各待分析广告点位的流量倾斜度;根据流量倾斜度,得到待分析广告点位的整体流量倾斜度;将各待分析广告点位的流量倾斜度与整体流量倾斜度比较,当流量倾斜度大于整体流量倾斜度时,再将该广告点位中各设备产生的流量与该广告点位中设备的平均流量进行比较,若某设备产生的流量大于平均流量,则确定该设备为异常设备,该设备在该广告点位产生的流量为异常流量。本发明结合设备ID和广告点位分析,并定位流量倾斜度来精细判断广告点位上的异常情况,提高了识别率。

权利要求 :

1.一种广告点位异常流量识别的方法,其特征在于,包括以下步骤:S1:将各个广告点位的每日总流量和各广告点位预设的一流量阈值比较,获得的待分析广告点位;

S2:由S1中得到的所述待分析广告点位,根据各待分析广告点位上各设备的流量情况,得到各待分析广告点位的流量倾斜度,所述流量倾斜度计算公式如下:其中,ni为对应的广告点位i上的设备个数,PVij是设备j在广告点位i上的流量,PVi是该广告点位i上各个设备的每日总流量;

S3:根据S2中得到的所述流量倾斜度,得到待分析广告点位的整体流量倾斜度;

S4:将S2中各待分析广告点位的所述流量倾斜度与S3中所述整体流量倾斜度比较,当所述流量倾斜度大于所述整体流量倾斜时,再将该广告点位中各设备产生的流量与该广告点位中设备的平均流量进行比较,若某设备产生的流量大于所述平均流量,则确定该设备为异常设备,该设备在该广告点位产生的流量为异常流量,所述整体流量倾斜度计算公式如下:

其中,k为S3中得到的待分析广告点位的数量。

2.根据权利要求1所述的一种广告点位异常流量识别的方法,其特征在于,S1具体包括:

S11:从终端设备在网络访问时产生的日志信息中,提取各个广告点位上的每日总流量、设备ID数以及每个设备ID在该广告点位的流量数据;

S12:根据S11中所得到的每个广告点位的所述每日总流量计算得到每个广告点位上的平均流量,该平均流量即为该广告点位的所述流量阈值;

S13:将获得的各广告点位的每日总流量与该点位的所述流量阈值进行比较,所述每日总流量大于所述流量阈值的广告点位判定为待分析广告点位。

3.根据权利要求2所述的一种广告点位异常流量识别的方法,其特征在于,S2具体包括:

根据S13中得到的待分析广告点位i,根据S11中获取的对应待分析广告点位上各个设备ID的流量分布情况,得到该广告点位的流量倾斜度PVI。

4.根据权利要求3所述的一种广告点位异常流量识别的方法,其特征在于,所述流量倾斜度PVIi的取值范围为(0,1],数值越小说明流量分布的越均匀,反之,数值越大则说明流量倾斜越严重。

5.根据权利要求4所述的一种广告点位异常流量识别的方法,其特征在于,S3具体包括:

根据S2中的计算的各个待分析广告点位的所述流量倾斜度,结合S11中得到的对应待分析广告点位的设备数得到整体流量倾斜度 计算公式如下:其中,k为S13中得到的待分析广告点位的数量。

6.根据权利要求5所述的一种广告点位异常流量识别的方法,其特征在于,S4具体包括:

将S2中各待分析广告点位的所述流量倾斜度PVIi与S3中的所述整体流量倾斜度 比较,当广告点位i的流量倾斜度PVIi大于整体流量倾斜度 时,再将该广告点位i中各设备产生的流量PVij与该广告点位中设备的平均流量 进行比较,若设备j产生的流量大于该广告点位的所述平均流量,则确定该设备为异常设备,该设备在该广告点位产生的流量为异常流量。

7.一种广告点位异常流量识别的装置,应用权利要求1‑6任一项 所述的一种广告点位异常流量识别的方法,其特征在于,包括:数据获取模块,用于根据终端设备的日志信息,提取对应广告点位上每日总流量、设备数以及各个设备ID在该广告点位的流量数据并输出;

第一处理模块,电性连接所述数据获取模块,接收所述数据获取模块输出的对应广告点位的所述每日总流量,处理得到每个广告点位的平均流量,并将所述平均流量作为流量阈值输出;

第一判断模块,电性连接所述数据获取模块和所述第一处理模块,接收所述数据获取模块输出的广告点位的所述每日总流量和所述第一处理模块输出的对应的流量阈值,比较并输出待分析广告点位;

第二处理模块,电性连接所述数据获取模块和所述第一判断模块,接收所述第一判断模块输出的待分析广告点位,根据所述数据获取模块得到的对应广告点上各设备ID的流量数据,输出该广告点位的流量倾斜度,所述流量倾斜度计算公式如下:其中,ni为对应的广告点位i上的设备个数,PVij是设备j在广告点位i上的流量,PVi是该广告点位i上各个设备的每日总流量;再根据所述数据获取模块输出的各广告点位的设备数,输出所述整体流量倾斜度,所述整体流量倾斜度计算公式如下:其中,k为所述待分析广告点位的数量;

第三处理模块,电性连接所述数据获取模块和第一处理模块,接收所述第一判断模块输出的待分析广告点位,根据所述数据获取模块得到的对应广告点位上的设备数以及各个设备ID在该广告点位的流量,输出每个广告点位上的设备平均流量第二判断模块,电性连接所述数据获取模块、所述第二处理模块和所述第三处理模块,根据待分析广告点位的流量倾斜度和整体流量倾斜度的大小,结合广告点位上设备产生流量与该广告点位设备平均流量的关系,输出异常设备,该异常设备在该广告点位上的流量即为异常流量。

8.根据权利要求7所述的一种广告点位异常流量识别的装置,其特征在于,所述第二判断模块具体用于:

接收所述第二处理模块输出的待分析广告点位的流量倾斜度和所述整体流量倾斜度并进行比较,若超出,则输出该广告点位,并将该广告点位上各设备的流量数据和所述第三处理模块输出的该广告点位上的平均流量PVi进行比较,若超出,则输出该异常设备,该设备在该广告点位上产生的流量为异常流量。

说明书 :

一种广告点位异常流量识别的方法和装置

技术领域

[0001] 本发明属于网络技术领域,尤其涉及一种广告点位异常流量识别的方法和装置。

背景技术

[0002] 随着智能手机、平板电脑等移动终端设备的普及,第三方应用程序(Application,APP)客户端逐渐成为广告主投放广告的主要载体。App厂商将App中广告位托管给广告网络
(AdNetWork,ADN),借助ADN的销售和代理团队进行变现。但是,部分群体通过伪造广告的浏
览和点击流量攫取巨额利益,严重损害了广告主的利益,这种伪造的浏览称之为“异常流
量”。为了维护广告主的合法权益,需要对广告的异常流量进行监测,在广告监测过程中,可
以设置不用广告点位,例如微博首页轮播图中的士力架广告是一个广告点位,汽车之家车
型页滚动图中的丰田凯美瑞广告也是一个广告点位,需要一种技术手段,通过分析一个广
告点位的流量情况来判断该广告点位是否崔仔异常流量。
[0003] 现有技术中,公开号为CN201610373443.4的中国专利文献一种异常流量的检测方法及装置公开了一种方法,通过标记异常数据和正常数据广告点位异常流量识别。但这种
标记在实际场景下代价非常高,需要大量人工成本投入,因而难以经济有效的实现。公开号
为CN201910688288.9的中国专利文献异常流量识别方法、电子设备及存储介质也公开了一
种方法,通过获取目标设备的网络访问数据,获得目标设备访问网络时对应的至少2个时间
信息以及每个时间信息对应的位置信息,通过将计算得到的目标设备的移动速率与预设阈
值比较广告点位异常流量识别。本方法没有考虑到目标设备在广告活动中的行为,仅通过
射别的位置变化就判断一个设备为异常设备,该设备所对应的流量为异常流量有一定的片
面性和误判率;同时,该方法需要依赖于位置信息,而位置信息的获取在很多场景下存在困
难,因此难以推广通用于所有场景。
[0004] 上述方法中存在不便采集数据和判断片面的问题,所以,本发明提出了一种广告点位异常流量识别的方法和装置。

发明内容

[0005] 本发明针对上述的数据获取困难和判断存在片面性的问题,提出一种结合设备ID和广告点位判断异常流量的广告点位异常流量识别的方法和装置,本方法通过计算广告点
位上流量的倾斜情况,从而精确的判断该广告点位上的异常情况,进一步确定异常流量。
[0006] 为了实现上述目的,本发明提供一种广告点位异常流量识别的方法,包括以下步骤:
[0007] S1:将各个广告点位的每日总流量和各广告点位预设的一流量阈值比较,获得的待分析广告点位;
[0008] S2:由S1中得到的所述待分析广告点位,根据各待分析广告点位上各设备的流量情况,得到各待分析广告点位的流量倾斜度;
[0009] S3:根据S2中得到的所述流量倾斜度,得到待分析广告点位的整体流量倾斜度;
[0010] S4:将S2中各待分析广告点位的所述流量倾斜度与S3中所述整体流量倾斜度比较,当所述流量倾斜度大于所述整体流量倾斜时,再将该广告点位中各设备产生的流量与
该广告点位中设备的平均流量进行比较,若某设备产生的流量大于所述平均流量,则确定
该设备为异常设备,该设备在该广告点位产生的流量为异常流量。
[0011] 作为优选,S1具体包括:
[0012] S11:从终端设备在网络访问时产生的日志信息中,提取各个广告点位上的每日总流量、设备ID数以及每个设备ID在该广告点位的流量数据;
[0013] S12:根据S11中所得到的每个广告点位的所述每日总流量计算得到每个广告点位上的平均流量,该平均流量即为该广告点位的所述流量阈值;
[0014] S13:将获得的各广告点位的每日总流量与该点位的所述流量阈值进行比较,所述每日总流量大于所述流量阈值的广告点位判定为待分析广告点位。
[0015] 作为优选,S2具体包括:
[0016] 根据S13中得到的待分析广告点位i,根据S11中获取的对应待分析广告点位上各个设备ID的流量分布情况,得到该广告点位的流量倾斜度PVI,计算公式如下:
[0017]
[0018] 其中,ni为对应的广告点位i上的设备个数,PVij是设备j在广告点位i上的流量,PVi是该广告点位i上各个设备的每日总流量。
[0019] 作为优选,所述流量倾斜度PVIi的取值范围为(0,1],数值越小说明流量分布的越均匀,反之,数值越大则说明流量倾斜越严重。
[0020] 作为优选,S3具体包括:
[0021] 根据S2中的计算的各个待分析广告点位的所述流量倾斜度,结合S11中得到的对应待分析广告点位的设备数得到整体流量倾斜度 计算公式如下:
[0022]
[0023] 其中,k为S13中得到的待分析广告点位的数量。
[0024] 作为优选,S4具体包括:
[0025] 将S2中各待分析广告点位的所述流量倾斜度PVIi与S3中的所述整体流量倾斜度比较,当广告点位i的流量倾斜度PVIi大于整体流量倾斜度 时,再将该广告点位i中
各设备产生的流量PVij与该广告点位中设备的平均流量 进行比较,若设备j产生的流量
大于该广告点位的所述平均流量,则确定该设备为异常设备,该设备在该广告点位产生的
流量为异常流量。
[0026] 本发明还提出一种广告点位异常流量识别的装置,应用上述一种广告点位异常流量识别的方法,包括:
[0027] 数据获取模块,用于根据终端设备的日志信息,提取对应广告点位上每日总流量、设备数以及各个设备ID在该广告点位的流量数据并输出;
[0028] 第一处理模块,电性连接所述数据获取模块,接收所述数据获取模块输出的对应广告点位的所述每日总流量,处理得到每个广告点位的平均流量,并将所述平均流量作为
流量阈值输出;
[0029] 第一判断模块,电性连接所述数据获取模块和所述第一处理模块,接收所述数据获取模块输出的广告点位的所述每日总流量和所述第一处理模块输出的对应的流量阈值,
比较并输出待分析广告点位;
[0030] 第二处理模块,电性连接所述数据获取模块和所述第一判断模块,接收所述第一判断模块输出的待分析广告点位,根据所述数据获取模块得到的对应广告点上各设备ID的
流量数据,输出该广告点位的流量倾斜度;再根据所述数据获取模块输出的各广告点位的
设备数,输出所述整体流量倾斜度;
[0031] 第三处理模块,电性连接所述数据获取模块和第一处理模块,接收所述第一判断模块输出的待分析广告点位,根据所述数据获取模块得到的对应广告点位上的设备数以及
各个设备ID在该广告点位的流量,输出每个广告点位上的设备平均流量
[0032] 第二判断模块,电性连接所述数据获取模块、所述第二处理模块和所述第三处理模块,根据待分析广告点位的流量倾斜度和整体流量倾斜度的大小,结合广告点位上设备
产生流量与该广告点位设备平均流量的关系,输出异常设备,该异常设备在该广告点位上
的流量即为异常流量。
[0033] 作为优选,所述第二判断模块具体用于:
[0034] 接收所述第二处理模块输出的待分析广告点位的流量倾斜度和所述整体流量倾斜度并进行比较,若超出,则输出该广告点位,并将该广告点位上各设备的流量数据和所述
第三处理模块输出的该广告点位上的平均流量 进行比较,若超出,则输出该异常设备,
该设备在该广告点位上产生的流量为异常流量。
[0035] 与现有技术相比,本发明的优点和积极效果在于:
[0036] 1、本发明结合设备ID和广告点位,根据广告点位上各设备的流量分布情况,判断异常数据,避免了误判。
[0037] 2、本发明还提出了一个具体的量化值‑‑流量倾斜度来表示该广告点位上流量的倾斜情况,能够更加精细地判断该广告点位上的异常情况,再根据该广告点位上各设备的
流量状况,从而进一步确定异常流量,可以有效的提高异常流量的识别率,降低正常流量的
误判率,从而维护广告主的利益。
[0038] 3、本发明通过把广告点位的流量分布情况映射到(0,1]这个区间上,从而具体的展示广告点位流量倾斜的严重程度。
[0039] 4、本发明中所说需要的数据来自于日志信息,便于采集和推广。

附图说明

[0040] 图1为本发明一种广告点位异常流量识别的方法的流程示意图1;
[0041] 图2为本发明得到待分析广告点位的流程示意图;
[0042] 图3为本发明一种广告点位异常流量识别的装置的结构示意图;
[0043] 图4为本发明一种广告点位异常流量识别的方法的流程示意图2。

具体实施方式

[0044] 以下,结合附图对本发明的具体实施方式进行进一步的描述。
[0045] 如图1‑2所示,本发明提出的一种广告点位异常流量识别的方法,包括以下步骤:
[0046] S1:将各个广告点位的每日总流量和各广告点位预设的流量阈值比较,获得的待分析广告点位;
[0047] S1具体包括以下步骤:
[0048] S11:从获得的终端设备在网络访问时产生的多个日志信息中,根据广告点位提取对应广告点位上的每日总流量、设备ID数以及每个设备ID在该广告点位的流量数据;
[0049] S12:根据S11中所得到的每个广告点位的所述每日总流量计算得到每个广告点位上的平均流量,该平均流量即为该广告点位的流量阈值;
[0050] S13:将获得的各广告点位的每日总流量与该点位的所述流量阈值进行比较,所述每日总流量大于所述流量阈值的广告点位判定为待分析广告点位。
[0051] S2:由S1中得到的所述待分析广告点位,根据各待分析广告点位上各设备的流量情况,得到各待分析广告点位的流量倾斜度;
[0052] S2具体包括以下步骤:
[0053] 根据S1中得到的待分析广告点位i,根据对应待分析广告点位上各个设备ID的流量分布情况,得到该广告点位的流量倾斜度PVIi,计算公式如下:
[0054]
[0055] 其中,ni为对应的广告点位i上的设备个数,PVij是设备j在广告点位i上的流量,PVi是该广告点位i上各个设备的每日总流量。
[0056] 上述流量倾斜度PVIi的取值范围为(0,1],数值越小说明流量分布的越均匀,反之,数值越大则说明流量倾斜越严重。PVIi可以具体的展示该广告点位流量倾斜程度,从更
精细地层面分析流量的异常情况。
[0057] S3:根据S2中得到的所述流量倾斜度,得到待分析广告点位的整体流量倾斜度;
[0058] S3具体包括以下步骤:
[0059] 根据S2中的计算的各个待分析广告点位的所述流量倾斜度PVIi,结合S11中得到的对应待分析广告点位的设备数得到整体流量倾斜度 计算公式如下:
[0060]
[0061] 其中,k为S13中得到的待分析广告点位的数量。
[0062] S4:将S2中各待分析广告点位的所述流量倾斜度PVIi与S3中的所述整体流量倾斜度 比较,当广告点位i的流量倾斜度大于整体流量倾斜时,再将该广告点位i中各设备
产生的流量PVij与该广告点位中设备的平均流量 进行比较,若设备j产生的流量大于该
广告点位的所述平均流量,则确定该设备为异常设备,该设备在该广告点位产生的流量为
异常流量。
[0063] 本方法中,根据终端设备产生的日志信息提取所需要的数据,数据容易得到,使本方法易于推广;同时,通过定义流量倾斜度来表示各个广告点位上的流量倾斜程度,具化了
流量倾斜程度,便于判断,再采用结合各设备ID在广告点位的流量情况,进而判断异常设
备,从而得到异常流量,增加参考因素的同时增加判断的量化值,使得异常流量识别的过程
中可以有迹可循,更为精细地分析流量的异常情况,有效提高了异常流量的识别率。
[0064] 如图3所示,本实施例还提出了一种广告点位异常流量识别的装备,应用上述方法,具体内容包括:
[0065] 数据获取模块,用于根据终端设备的日志信息,提取对应广告点位上每日总流量、设备数以及各个设备ID在该广告点位的流量并输出;
[0066] 第一处理模块,电性连接所述数据获取模块,接收所述数据获取模块输出的对应广告点位的所述每日总流量,处理得到每个广告点位的平均流量,并将所述平均流量作为
流量阈值输出;
[0067] 第一判断模块,电性连接所述数据获取模块和所述第一处理模块,接收所述数据获取模块输出的广告点位的所述每日总流量和所述第一处理模块输出的对应的流量阈值,
比较,输出待分析广告点位;
[0068] 第二处理模块,电性连接所述数据获取模块和所述第一判断模块,接收所述第一判断模块输出的待分析广告点位,根据所述数据获取模块得到的对应广告点上各设备ID的
流量情况,输出该广告点位的流量倾斜度;再根据所述数据获取模块输出的各广告点位的
设备数,输出所述整体流量倾斜度;
[0069] 第三处理模块,电性连接所述数据获取模块和第一处理模块,接收所述第一判断模块输出的待分析广告点位,根据所述数据获取模块得到的对应广告点位上的设备数以及
各个设备ID在该广告点位的流量,输出每个广告点位上的设备平均流量
[0070] 第二判断模块,电性连接数据获取模块、第二处理模块和第三处理模块,根据待分析广告点位的流量倾斜度和整体流量倾斜度的大小,结合广告点位上设备产生流量与该广
告点位设备平均流量的关系,输出异常设备,该异常设备在该广告点位上的流量即为异常
流量。
[0071] 第二判断模块具体工作用于接收所述第二处理模块输出的待分析广告点位的流量倾斜度和所述整体流量倾斜度并进行比较,若超出,则输出该广告点位,并将该广告点位
上各设备的流量数据和所述第三处理模块输出的该广告点位上的平均流量 进行比较,
若超出,则输出该异常设备,该设备在该广告点位上产生的流量为异常流量。
[0072] 如图4所示,以下以一个异常流量的识别为例进行说明:
[0073] 首先,数据获取模块从获取到的终端设备在进行网络访问时产生的多个日志信息中,根据广告点位i(i=1,2,3...)提取对应广告点位的每日总流量PVIi、设备数ni以及各个
设备j在该广告点位的流量PVij;
[0074] 然后,第一处理模块根据数据获取模块得到的广告点位i的每日总流量PVIi计算得到各个广告点位的平均流量 并将此平均流量作为流量阈值;
[0075] 第一判断模块将获得的各个广告点位i的每日总流量PVIi与对应广告点位的平均流量 进行比较,将每日总流量PVIi大于对应的平均流量 的广告点位i筛选出来,所
筛选出来的广告点位初步认定为是存在异常流量的待分析广告点位;
[0076] 第二处理模块分别根据上述筛选出来的待分析广告点位,根据所述广告点位上各设备的流量分布情况PVi1、PVi2、PVi3。。。PVij,求得对应点位的流量倾斜度PVIi,然后结合所
筛选出来的广告点位的数量以及各广告点位上设备的数量,得到筛选出来的待分析广告点
位的整体流量倾斜度;
[0077] 第二判断模块将每一个筛选出来的待分析广告点位的流量倾斜度PVIi依次与整体的流量倾斜度比较,当流量倾斜度小于整体流量倾斜度时,比较下一个筛选出来的待分
析广告点位,当流量倾斜度大于整体流量倾斜度时,继续比较该广告点位中各设备在该广
告点位产生的流量PVij依次与该广告点位的设备平均流量 当设备产生的流量PVij小于
该广告点位的设备平均流量 时,继续比较下一设备再该广告点位的流量情况,当设备产
生的流量PVij大于该广告点位的设备平均流量 时,则判定该设备为异常设备,该异常设
备在该待分析广告点位上产生的流量为异常流量。
[0078] 本方法中根据广告点位的每日总流量PVIi、设备数ni以及各个设备j在该广告点位的流量PVij,提出了一个具体的量化值‑‑流量倾斜度来表示该广告点位上流量的倾斜情况,
把广告点位的流量分布情况映射到(0,1]这个区间上,能够具体的展示广告点位流量倾斜
的严重程度,再根据该广告点位上各设备的流量状况,从而进一步确定异常流量,可以有效
的提高异常流量的识别率,降低正常流量的误判率,从而维护广告主的利益。
[0079] 以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等
效实施例应用于其它领域,但是凡是未脱离本发明技术方案内容,依据本发明的技术实质
对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。