一种异常目标确定方法、装置、设备及介质转让专利

申请号 : CN201910663546.8

文献号 : CN110188262B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王璐

申请人 : 武汉斗鱼网络科技有限公司

摘要 :

本发明实施例公开了一种异常目标确定方法、装置、设备及介质,所述方法包括:确定基于目标搜索词所搜索到的目标对象;针对所述目标对象中的当前目标对象,基于当前目标对象在设定时间段内被访问的次数以及各所述目标对象在所述设定时间段内被访问的次数和,确定当前目标对象在所述设定时间段内的访问占比;根据当前目标对象在两个相邻的设定时间段内的访问占比确定当前目标对象在两个相邻的设定时间段之间被访问的次数变化度;基于所述次数变化度确定所述当前目标对象是否为异常目标对象。通过采用上述技术方案,提高了异常目标的识别精度。

权利要求 :

1.一种异常目标确定方法,其特征在于,包括:

确定基于目标搜索词所搜索到的目标对象;

针对所述目标对象中的当前目标对象,基于当前目标对象在设定时间段内被访问的次数以及各所述目标对象在所述设定时间段内被访问的次数和,确定当前目标对象在所述设定时间段内的访问占比;

根据当前目标对象在两个相邻的设定时间段内的访问占比确定当前目标对象在两个相邻的设定时间段之间被访问的次数变化度;

基于所述次数变化度确定所述当前目标对象是否为异常目标对象;

根据当前目标对象在两个相邻的设定时间段内的访问占比,以及各所述目标对象在每个所述设定时间段内被访问的次数和确定各所述目标对象在两个相邻的设定时间段内被访问的次数和的变化度;

基于所述次数和的变化度确定所述目标搜索词是否为异常搜索词。

2.根据权利要求1所述的方法,其特征在于,所述确定各所述目标对象在两个相邻的设定时间段内被访问的次数和的变化度包括:按照如下公式计算各所述目标对象在两个相邻的设定时间段内被访问的次数和的变化度:其中,D(Hc||Hs)表示基于目标搜索词所搜索到的目标对象在两个相邻的设定时间段c和s内被访问的次数和的变化度,Ns表示各所述目标对象在设定时间段s内被访问的次数和,Nc表示各所述目标对象在设定时间段c内被访问的次数和,Hs(i)第i个目标对象在设定时间段s内的访问占比,Hc(i)表示第i个目标对象在设定时间段c内的访问占比,n表示所述目标对象的个数。

3.根据权利要求1-2任一项所述的方法,其特征在于,所述确定当前目标对象在所述设定时间段内的访问占比,包括:按照如下公式计算当前目标对象在所述设定时间段内的访问占比:其中,Hs(i)表示当前目标对象i在设定时间段s内的访问占比,Ns(i)表示目标对象i在设定时间段s内被访问的次数,Ns表示各所述目标对象在设定时间段s内被访问的次数和。

4.根据权利要求1所述的方法,其特征在于,所述确定基于目标搜索词所搜索到的目标对象,包括:从预设搜索记录流水表获取基于目标搜索词所搜索到的目标对象。

5.根据权利要求1所述的方法,其特征在于,所述确定当前目标对象在所述设定时间段内的访问占比之前,还包括:分别确定每个所述目标对象在所述设定时间段内被访问的次数。

6.一种异常目标确定装置,其特征在于,所述装置包括:

目标对象确定模块,用于确定基于目标搜索词所搜索到的目标对象;

访问占比确定模块,用于针对所述目标对象中的当前目标对象,基于当前目标对象在设定时间段内被访问的次数以及各所述目标对象在所述设定时间段内被访问的次数和,确定当前目标对象在所述设定时间段内的访问占比;

次数变化度确定模块,用于根据当前目标对象在两个相邻的设定时间段内的访问占比确定当前目标对象在两个相邻的设定时间段之间被访问的次数变化度;

异常目标对象确定模块,用于基于所述次数变化度确定所述当前目标对象是否为异常目标对象;

次数和变化度确定模块,用于根据当前目标对象在两个相邻的设定时间段内的访问占比,以及各所述目标对象在每个所述设定时间段内被访问的次数和确定各所述目标对象在两个相邻的设定时间段内被访问的次数和的变化度;

异常搜索词确定模块,用于基于所述次数和的变化度确定所述目标搜索词是否为异常搜索词。

7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-5中任一项所述的异常目标确定方法。

8.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时实现如权利要求1-5中任一项所述的异常目标确定方法。

说明书 :

一种异常目标确定方法、装置、设备及介质

技术领域

[0001] 本发明实施例涉及计算机技术领域,尤其涉及一种异常目标确定方法、装置、设备及介质。

背景技术

[0002] 在直播平台上,为了获得利益,普遍存在着一些通过刷搜索、刷弹幕、刷关注等方式刷热度的作弊行为。
[0003] 上述作弊行为会造成直播网络堵塞、直播平台服务器压力过大等问题,对平台的直播生态环境造成了极大的影响。因此为了降低上述作弊行为给直播平台带来的负面影响,需要采用合理的方法及时且准确地找到与作弊相关的目标对象,并对其采取一定的干预措施,以营造良好的直播生态环境。

发明内容

[0004] 本发明实施例提供一种异常目标确定方法、装置、设备及介质,以实现对异常目标的准确识别。
[0005] 第一方面,本发明实施例提供了一种异常目标确定方法,所述方法包括:
[0006] 确定基于目标搜索词所搜索到的目标对象;
[0007] 针对所述目标对象中的当前目标对象,基于当前目标对象在设定时间段内被访问的次数以及各所述目标对象在所述设定时间段内被访问的次数和,确定当前目标对象在所述设定时间段内的访问占比;
[0008] 根据当前目标对象在两个相邻的设定时间段内的访问占比确定当前目标对象在两个相邻的设定时间段之间被访问的次数变化度;
[0009] 基于所述次数变化度确定所述当前目标对象是否为异常目标对象。
[0010] 第二方面,本发明实施例提供了一种异常目标确定装置,所述装置包括:
[0011] 目标对象确定模块,用于确定基于目标搜索词所搜索到的目标对象;
[0012] 访问占比确定模块,用于针对所述目标对象中的当前目标对象,基于当前目标对象在设定时间段内被访问的次数以及各所述目标对象在所述设定时间段内被访问的次数和,确定当前目标对象在所述设定时间段内的访问占比;
[0013] 次数变化度确定模块,用于根据当前目标对象在两个相邻的设定时间段内的访问占比确定当前目标对象在两个相邻的设定时间段之间被访问的次数变化度;
[0014] 异常目标对象确定模块,用于基于所述次数变化度确定所述当前目标对象是否为异常目标对象。
[0015] 第三方面,本发明实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的异常目标确定方法。
[0016] 第四方面,本发明实施例提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时实现如上述第一方面所述的异常目标确定方法。
[0017] 本发明实施例提供的一种异常目标确定方法,通过确定基于目标搜索词所搜索到的目标对象;针对所述目标对象中的当前目标对象,基于当前目标对象在设定时间段内被访问的次数以及各所述目标对象在所述设定时间段内被访问的次数和,确定当前目标对象在所述设定时间段内的访问占比;根据当前目标对象在两个相邻的设定时间段内的访问占比确定当前目标对象在两个相邻的设定时间段之间被访问的次数变化度;基于所述次数变化度确定所述当前目标对象是否为异常目标对象的技术手段,实现了对异常目标对象的准确识别。

附图说明

[0018] 为了更清楚地说明本发明实施例中的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本发明实施例的内容和这些附图获得其他的附图。
[0019] 图1为本发明实施例一提供的一种异常目标确定方法流程示意图;
[0020] 图2为本发明实施例二提供的一种异常目标确定方法流程示意图;
[0021] 图3为本发明实施例三提供的一种异常目标确定装置结构示意图;
[0022] 图4为本发明实施例四提供的一种电子设备的结构示意图。

具体实施方式

[0023] 为使本发明解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本发明实施例的技术方案作进一步的详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0024] 实施例一
[0025] 图1为本发明实施例一提供的一种异常目标确定方法流程示意图。本实施例公开的异常目标确定方法可适用于对通过搜索的方式刷热度的异常目标对象进行识别的情况。例如直播平台的主播为了刷自己直播间的热度,不断地通过基于搜索词搜索的方式找到自己的直播间,并点击进入;或者各网购平台的商家为了刷自己店铺的热度,不断地通过基于搜索词搜索的方式找到自己的店铺并点击进入。上述刷热度的直播间、商家以被使用的搜索词均为异常目标对象,需要对其进行准确识别并进行干预,以营造良好的网络环境。本实施例公开的异常目标识别方法可以由异常目标识别装置来执行,其中,该装置可由软件和/或硬件实现,并一般集成在服务器中。具体参见图1所示,该方法包括如下步骤:
[0026] 步骤110、确定基于目标搜索词所搜索到的目标对象。
[0027] 其中,搜索词为用户为了找到自己期望的信息而向搜索窗输入的词汇。例如,用户想买条夏天穿的女士牛仔裤,则用户可能会通过购物网站的搜索窗输入“牛仔裤女夏”,在该搜索词下搜索到的结果即为所述目标对象,具体可以是很多售卖夏天穿的女士牛仔裤的商家店铺,所述“牛仔裤女夏”即为搜索词。再例如,用户想观看直播游戏“王者荣耀”的直播间,则用户可能会通过直播平台的搜索窗输入搜索词“王者荣耀”,对应搜索到的目标对象可能是很多直播“王者荣耀”的直播间。上述用户的搜索行为均为用户实际需要的、正常的搜索行为。目前,很多主播或者商家为了提高自己直播间或者店铺的热度,以使更多的用户能够快速找到并进入自己的直播间或者店铺,通常会通过搜索的方式刷热度。具体的,比如主播A想刷自己直播间的热度,会雇佣一批用户通过直播平台的搜索窗多次输入能够搜索到自己直播间的搜索词,不断地进行搜索操作,并点击进入自己的直播间,以此来提高自己直播间的热度。所述目标搜索词可以是平台搜索窗中出现过的任何搜索词,为了提高识别精度,所述目标搜索词可以是在平台搜索窗中出现次数达到一定阈值的搜索词。
[0028] 具体的,所述确定基于目标搜索词所搜索到的目标对象,包括:
[0029] 从预设搜索记录流水表获取基于目标搜索词所搜索到的目标对象。针对用户的每次搜索操作,后台会将用户输入的搜索词以及基于该搜索词得到的搜索结果等信息记录在预设的搜索记录流水表中,当需要获取基于目标搜索词所搜索到的目标对象信息时,可从所述搜索记录流水表中获取。
[0030] 步骤120、针对所述目标对象中的当前目标对象,基于当前目标对象在设定时间段内被访问的次数以及各所述目标对象在所述设定时间段内被访问的次数和,确定当前目标对象在所述设定时间段内的访问占比。
[0031] 其中,所述目标对象通常包括多个,以在直播平台的搜索窗输入搜索词“王者荣耀”为例,得到的目标对象假设包括:1号直播间、2号直播间和3号直播间,则所述当前目标对象可以是1号直播间、2号直播间和3号直播间中的任意一个。
[0032] 所述设定时间段可以是7天、30天或者更长。以所述设定时间段是7天,所述当前目标对象为1号直播间为例,假设1号直播间在2019年5月1号到2019年5月7号这7天的时间内,被访问(即被点击)的次数为20,所述2号直播间在2019年5月1号到2019年5月7号这7天的时间内,被访问(即被点击)的次数为25,所述3号直播间在2019年5月1号到2019年5月7号这7天的时间内,被访问(即被点击)的次数为30,则1号直播间在2019年5月1号到2019年5月7号这7天的时间内的访问占比可确定为20/(20+25+30)=4/15。
[0033] 步骤130、根据当前目标对象在两个相邻的设定时间段内的访问占比确定当前目标对象在两个相邻的设定时间段之间被访问的次数变化度。
[0034] 其中,所述两个相邻的设定时间段具体指时间上连续的两个时间段,例如一个设定时间段为7天,则所述两个相邻的设定时间段具体可以指2019年5月1号到2019年5月7号,以及2019年5月8号到2019年5月14号两个时间段。
[0035] 所述次数变化度可以是当前目标对象在两个相邻的设定时间段内被访问次数的差,例如当前目标对象在2019年5月1号到2019年5月7号之间被访问的次数为20,在2019年5月8号到2019年5月14号之间被访问的次数为25,则所述次数变化度可以是25-20=5。为了提高异常目标对象的识别精度,本实施例综合考虑了当前目标对象被访问的次数以及其他各目标对象被访问的次数和,具体的,根据当前目标对象在两个相邻的设定时间段内的访问占比确定当前目标对象在两个相邻的设定时间段之间被访问的次数变化度,若当前目标对象在两个相邻的设定时间段内的访问占比相差越大,则说明目标对象在该两个相邻的设定时间段之间被访问的次数变化度越大。
[0036] 步骤140、基于所述次数变化度确定所述当前目标对象是否为异常目标对象。
[0037] 若所述次数变化度是由当前目标对象在后一个设定时间段内的访问占比减去目标对象在相邻的前一个设定时间段内的访问占比,当所述次数变化度超过设定阈值时,则确定当前目标对象为异常目标对象。例如,当前目标对象在2019年5月1号到2019年5月7号之间的访问占比为0.5,在2019年5月8号到2019年5月14号之间的访问占比为0.6,则所述次数变化度为0.6-0.5=0.1。具体可通过将所述次数变化度与设定阈值进行比较的方式确定所述当前目标对象是否为异常目标对象,例如假设所述设定阈值为0.3,由于所述0.1小于0.3,故确定当前目标对象不是异常目标对象。所述设定阈值可基于工程经验进行设置,或者通过对多个已知的异常目标对象的次数变化度进行计算,将多个已知的异常目标对象的次数变化度的平均值确定为所述设定阈值。
[0038] 本实施例提供的一种异常目标确定方法,通过结合搜索之后用户的点击行为,即目标对象在两个相邻的设定时间段之间被访问的次数变化度,确定当前目标对象是否为异常目标对象的技术手段,提高了异常目标对象的识别准确度。
[0039] 实施例二
[0040] 图2为本发明实施例二提供的一种异常目标确定方法流程示意图。在上述实施例的基础上,本实施例增加了判断所述目标搜索词是否为异常搜索词的步骤。具体参见图2所示,该方法包括如下步骤:
[0041] 步骤210、确定基于目标搜索词所搜索到的目标对象。
[0042] 步骤220、针对所述目标对象中的当前目标对象,基于当前目标对象在设定时间段内被访问的次数以及各所述目标对象在所述设定时间段内被访问的次数和,确定当前目标对象在所述设定时间段内的访问占比。
[0043] 步骤230、根据当前目标对象在两个相邻的设定时间段内的访问占比确定当前目标对象在两个相邻的设定时间段之间被访问的次数变化度。
[0044] 步骤240a、基于所述次数变化度确定所述当前目标对象是否为异常目标对象。
[0045] 步骤240b、根据当前目标对象在两个相邻的设定时间段内的访问占比,以及各所述目标对象在每个所述设定时间段内被访问的次数和确定各所述目标对象在两个相邻的设定时间段内被访问的次数和的变化度。
[0046] 其中,若当前目标对象在后一个设定时间段内的访问占比大于相邻的前一个设定时间段内的访问占比,则说明当前目标对象的访问占比发生了增涨,其增涨一定程度地说明了所述目标搜索词为异常搜索词,因此,本实施例加入了该增涨对识别异常搜索词的贡献。所述后一个设定时间段例如为2019年5月8号到2019年5月14号,对应的所述相邻的前一个设定时间段为2019年5月1号到2019年5月7号。
[0047] 若各所述目标对象在后一个设定时间段内被访问的次数和大于在相邻的前一个设定时间段内被访问的次数和,则说明在所述目标搜索词下各目标对象的总点击次数增加,所述总点击次数增加的越多,表示所述目标搜索词为异常搜索词的可能性越大,因此,本实施例加入了各目标对象在每个设定时间段内被访问的次数和对识别异常搜索词的贡献。
[0048] 具体的,按照如下公式计算各所述目标对象在两个相邻的设定时间段内被访问的次数和的变化度:
[0049]
[0050] 其中,D(Hc||Hs)表示基于目标搜索词所搜索到的目标对象在两个相邻的设定时间段c和s内被访问的次数和的变化度,Ns表示各所述目标对象在设定时间段s内被访问的次数和,Nc表示各所述目标对象在设定时间段c内被访问的次数和,Hs(i)第i个目标对象在设定时间段s内的访问占比,Hc(i)表示第i个目标对象在设定时间段c内的访问占比,n表示所述目标对象的个数。
[0051] 可以看出,上述公式(2)由两部分组成,加号前面的部分 通过采用比值的方式表示目标搜索词所搜索到的目标对象在两个相邻的设定时间段c和s内被访问次数的变化情况,该比值能够表示目标搜索词所搜索到的目标对象在前后两个时段内被访问的变化程度。其中,为了防止所述目标对象在设定时间段s内被访问的次数和Ns取值为0,在分母的位置进行加1处理,以避免出现分母为0的情况,进而提高系统的计算稳定性。由于目标对象在设定时间段c内被访问的次数和Nc,与目标对象在设定时间段s内被访问的次数和Ns之间可能会存在量级差异很大的情况,比如,目标对象在设定时间段c内被访问的次数和Nc为10000,而在设定时间段s内被访问的次数和Ns为1。因此通过采用对数函数对上述比值进行取对数处理,实现了压缩量级差异的目的,使得上述比值对变化度的影响更加平稳,同时与加号后面处于相同的量级尺度的数据项 可以直接相加。
[0052] 加号后面的一部分 则是采用信息论中相对熵的思想。在数学中,相对熵被定义为 其中p(x)和q(x)是关于变量x的概
率分布,可以用来度量概率分布之间的差异性。在本实施例中,将目标对象在设定时间段内的访问占比看作是一种概率分布,这种设定满足统计学原理。与相对熵基本公式有较大不同的地方在于 这一项,该项表示只有第i个目标对象在设定时间段c内
的访问占比大于第i个目标对象在设定时间段s内的访问占比即Hc(i)>Hs(i)时,第i个目标对象在两个设定时间段内的访问占比差异才会被计算,即此时第i个目标对象在两个设定时间段内的访问占比差异才对整体的变化度有贡献,这样设计的目的是为了与本实施例所解决的技术问题相吻合。本实施例要解决的技术问题是为了找到异常的通过搜索得到的目标对象,只有目标对象在当前设定时间段c的访问占比高于目标对象在历史设定时间段s的访问占比的情况下才认为该目标对象有可能是异常目标对象,因此只有满足Hc(i)>Hs(i)时,第i个目标对象在两个设定时间段内的访问占比差异才会对整体的变化度产生正项贡献,Hc(i)≤Hs(i)时,所述访问占比差异对整体的变化度产生的贡献为0。
[0053] 将上述公式(2)的两部分( 和 )结合起来对目标对象在两个相邻的设定时间段内被访问的次数和的变化度进行评价的方案,既考虑了目标对象在两个相邻的设定时间段c和s内被访问次数的变化情况,又基于相对熵的思想考虑了目标对象在设定时间段内访问占比的概率分布情况。相比于只通过上述公式(2)的其中一部分( 或者 )对异常搜索词进行确定
的方式,基于上述公式(2)所确定的目标搜索词为异常搜索词的准确度更高。进一步的,按照如下公式计算当前目标对象在所述设定时间段内的访问占比:
[0054]
[0055] 其中,Hs(i)表示当前目标对象i在设定时间段s内的访问占比,Ns(i)表示目标对象i在设定时间段s内被访问的次数,Ns表示各所述目标对象在设定时间段s内被访问的次数和。
[0056] 举例说明上述次数和的变化度的计算过程,假设基于目标搜索词Q所搜索到的目标对象包括1号直播间、2号直播间和3号直播间,其中,在前一个设定时间段s内(假设为2019年5月1号到2019年5月7号)各直播间被访问的次数分别为Ns(1)=10,Ns(2)=50,Ns(3)=40,各直播间在设定时间段s内被访问的次数和Ns=100;按照上述公式2可分别计算得到各直播间在设定时间段s内的访问占比:
[0057] 假设所述1号直播间、2号直播间和3号直播间在与设定时间段s相邻的后一个设定时间段c(即为2019年5月8号到2019年5月14号)内被访问的次数分别为:Nc(1)=40,Nc(2)=30,Nc(3)=50,各直播间在设定时间段c内被访问的次数和Nc=120,按照上述公式2可分别计算得到各直播间在设定时间段c内的访问占比:
[0058] 进一步根据上述公式(1)可计算得到1号直播间、2号直播间和3号直播间在设定时间段s和c内被访问的次数和的变化度为:
[0059]
[0060] 其中,max(a,b)的含义是取a与b中的最大者,例如max(2,3)=3。
[0061] 步骤250、基于所述次数和的变化度确定所述目标搜索词是否为异常搜索词。
[0062] 例如,假设次数和的变化度阈值为0.5,则由于上述0.587大于0.5,故确定目标搜索词Q为异常搜索词。其中,所述次数和的变化度阈值可基于工程经验进行设置,或者通过对多个已知的异常搜索词的次数和变化度进行计算,将多个已知的异常搜索词的次数和变化度的平均值确定为所述阈值。
[0063] 进一步的,设置直播间在两个相邻的设定时间段之间被访问的次数变化度阈值为η=0.2,由于1号直播间在时间段c与时间段s之间被访问的次数变化度为Hc(1)-Hs(1)=0.1-0.33=-0.23,2号直播间在时间段c与时间段s之间被访问的次数变化度为Hc(2)-Hs(2)=0.5-0.25=0.25,3号直播间在时间段c与时间段s之间被访问的次数变化度为Hc(3)-Hs(3)=0.4-0.42=-0.02,可以看出2号直播间在时间段c与时间段s之间被访问的次数变化度大于阈值0.2,因此确定2号直播间具有通过搜索刷热度的嫌疑,确定2号直播间为异常直播间。
[0064] 本实施例提供的一种异常目标确定方法,通过结合搜索之后用户的点击行为,即目标对象在两个相邻的设定时间段之间被访问的次数变化度,确定当前目标对象是否为异常目标对象的技术手段,以及通过结合目标对象在两个相邻的设定时间段内的访问占比,以及各所述目标对象在每个所述设定时间段内被访问的次数和确定所述目标搜索词是否为异常搜索词的技术手段,提高了异常目标的识别准确度。
[0065] 实施例三
[0066] 图3为本发明实施例三提供的一种异常目标确定装置结构示意图。参见图3所示,所述装置包括:目标对象确定模块310、访问占比确定模块320、次数变化度确定模块330和异常目标对象确定模块340;
[0067] 其中,目标对象确定模块310,用于确定基于目标搜索词所搜索到的目标对象;访问占比确定模块320,用于针对所述目标对象中的当前目标对象,基于当前目标对象在设定时间段内被访问的次数以及各所述目标对象在所述设定时间段内被访问的次数和,确定当前目标对象在所述设定时间段内的访问占比;次数变化度确定模块330,用于根据当前目标对象在两个相邻的设定时间段内的访问占比确定当前目标对象在两个相邻的设定时间段之间被访问的次数变化度;异常目标对象确定模块340,用于基于所述次数变化度确定所述当前目标对象是否为异常目标对象。
[0068] 进一步的,还包括:
[0069] 次数和变化度确定模块,用于根据当前目标对象在两个相邻的设定时间段内的访问占比,以及各所述目标对象在每个所述设定时间段内被访问的次数和确定各所述目标对象在两个相邻的设定时间段内被访问的次数和的变化度;
[0070] 异常搜索词确定模块,用于基于所述次数和的变化度确定所述目标搜索词是否为异常搜索词。
[0071] 进一步的,所述次数和变化度确定模块具体用于:
[0072] 按照如下公式计算各所述目标对象在两个相邻的设定时间段内被访问的次数和的变化度:
[0073]
[0074] 其中,D(Hc||Hs)表示基于目标搜索词所搜索到的目标对象在两个相邻的设定时间段c和s内被访问的次数和的变化度,Ns表示各所述目标对象在设定时间段s内被访问的次数和,Nc表示各所述目标对象在设定时间段c内被访问的次数和,Hs(i)第i个目标对象在设定时间段s内的访问占比,Hc(i)表示第i个目标对象在设定时间段c内的访问占比,n表示所述目标对象的个数。
[0075] 进一步的,访问占比确定模块320具体用于:按照如下公式计算当前目标对象在所述设定时间段内的访问占比:
[0076]
[0077] 其中,Hs(i)表示当前目标对象i在设定时间段s内的访问占比,Ns(i)表示目标对象i在设定时间段s内被访问的次数,Ns表示各所述目标对象在设定时间段s内被访问的次数和。
[0078] 进一步的,目标对象确定模块310具体用于:从预设搜索记录流水表获取基于目标搜索词所搜索到的目标对象。
[0079] 进一步的,所述装置还包括:被访问次数确定模块,用于确定当前目标对象在所述设定时间段内的访问占比之前,分别确定每个所述目标对象在所述设定时间段内被访问的次数。
[0080] 本实施例提供的异常目标确定装置,通过结合搜索之后用户的点击行为,即目标对象在两个相邻的设定时间段之间被访问的次数变化度,确定当前目标对象是否为异常目标对象的技术手段,提高了异常目标对象的识别准确度。
[0081] 本发明实施例所提供的异常目标确定装置可执行本发明任意实施例所提供的异常目标确定方法,具备执行方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的异常目标确定方法。
[0082] 实施例四
[0083] 图4为本发明实施例四提供的一种电子设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性电子设备12的框图。图4显示的电子设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0084] 如图4所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
[0085] 总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
[0086] 电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
[0087] 系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如异常目标确定装置的目标对象确定模块310、访问占比确定模块320、次数变化度确定模块330和异常目标对象确定模块340)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
[0088] 具有一组(例如异常目标确定装置的目标对象确定模块310、访问占比确定模块320、次数变化度确定模块330和异常目标对象确定模块340)程序模块42的程序/实用工具
40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
[0089] 电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
[0090] 处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的异常目标确定方法,该方法包括:
[0091] 确定基于目标搜索词所搜索到的目标对象;
[0092] 针对所述目标对象中的当前目标对象,基于当前目标对象在设定时间段内被访问的次数以及各所述目标对象在所述设定时间段内被访问的次数和,确定当前目标对象在所述设定时间段内的访问占比;
[0093] 根据当前目标对象在两个相邻的设定时间段内的访问占比确定当前目标对象在两个相邻的设定时间段之间被访问的次数变化度;
[0094] 基于所述次数变化度确定所述当前目标对象是否为异常目标对象。
[0095] 处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的异常目标确定方法。
[0096] 当然,本领域技术人员可以理解,处理器还可以实现本发明任意实施例所提供的异常目标确定方法的技术方案。
[0097] 实施例五
[0098] 本发明实施例五还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的异常目标确定方法,该方法包括:
[0099] 确定基于目标搜索词所搜索到的目标对象;
[0100] 针对所述目标对象中的当前目标对象,基于当前目标对象在设定时间段内被访问的次数以及各所述目标对象在所述设定时间段内被访问的次数和,确定当前目标对象在所述设定时间段内的访问占比;
[0101] 根据当前目标对象在两个相邻的设定时间段内的访问占比确定当前目标对象在两个相邻的设定时间段之间被访问的次数变化度;
[0102] 基于所述次数变化度确定所述当前目标对象是否为异常目标对象。
[0103] 当然,本发明实施例所提供的一种计算机可读存储介质,其上存储的计算机程序不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的异常目标确定方法中的相关操作。
[0104] 本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0105] 计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0106] 计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
[0107] 可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0108] 注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。