图片复审概率区间生成方法及图片复审判定方法转让专利

申请号 : CN201710876917.1

文献号 : CN107729924B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 郑佳赵骏

申请人 : 平安科技(深圳)有限公司

摘要 :

本发明涉及一种图片复审概率区间生成方法、装置、存储介质和计算机设备。所述方法包括:获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率;对于每组具有相同不良概率的图片,统计被复审判定为正常图片的第一数量,和被复审判定为不良图片的第二数量;根据每组不良概率对应的第一数量和第二数量重新生成图片复审概率区间。上述的图片复审概率区间生成方法、装置、存储介质和计算机设备通过结合人工复审后的结果,对复审概率区间进行调整,使得新生成的图片复审概率区间范围更加准确,减少图片复审的工作量,从而提高不良图片复审的效率。

权利要求 :

1.一种图片复审概率区间生成方法,所述方法包括:

获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率;

将具有相同不良概率的图片作为一组;

对于每组具有相同不良概率的图片中,统计被复审判定为正常图片的第一数量,和被复审判定为不良图片的第二数量;

获取所述原始复审概率区间的原始上限概率和原始下限概率;

根据所述原始上限概率和原始下限概率计算出二分类概率,所述二分类概率能够使得原始下限概率至二分类概率所对应的第二数量之和,与二分类概率至原始上限概率所对应的第一数量之和,二者总和取最小值;

根据所述二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间。

2.根据权利要求1所述的方法,其特征在于,在所述获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率之前,包括:获取预设图片集中,每个图片为不良图片的初始概率;

对每个图片对应的初始概率进行计算,生成所述预设图片集中每个图片为不良图片的不良概率;

设定原始复审概率区间,并提取位于原始复审概率区间的不良概率对应的图片,形成与所述原始复审概率区间相对应的图片集。

3.根据权利要求1所述的方法,其特征在于,所述根据所述二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间,包括:当二分类概率小于等于预设概率时,根据公式 进行计算,重新生成上限概率s2’,其中,s1为原始下限概率,s2为原始上限概率,t为二分类概率,x0为预设概率;

当二分类概率大于预设概率时,根据公式 进行计算,重新生成下限概率s1’,其中,s1为原始下限概率,s2为原始上限概率,t为二分类概率,x0为预设概率;

根据所述新的上限概率s2’或所述新的下限概率s1’,重新生成图片复审概率区间。

4.根据权利要求1所述的方法,其特征在于,所述获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率之后,还包括:获取所述图片集对应的图片传输系统的图片系统权值;

所述根据所述二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间,包括:根据所述二分类概率和所述图片系统权值,对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间。

5.一种图片复审判定方法,所述方法包括:

获取待鉴定图片为不良图片的不良概率;

判断所述不良概率是否在预设的图片复审概率区间之内,所述图片复审概率区间根据权利要求1至4中任一项所述图片复审概率区间生成方法生成;

若是,则判定所述待鉴定图片需要进行图片复审。

6.一种图片复审概率区间生成装置,其特征在于,所述装置包括:不良概率获取模块,用于获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率;

图片判定数量统计模块,用于将具有相同不良概率的图片作为一组;对于每组具有相同不良概率的图片中,统计被复审判定为正常图片的第一数量,和被复审判定为不良图片的第二数量;

图片复审概率区间生成模块,用于获取所述原始复审概率区间的原始上限概率和原始下限概率;根据所述原始上限概率和原始下限概率计算出二分类概率,所述二分类概率使得原始下限概率至二分类概率所对应的第二数量之和,与二分类概率至原始上限概率所对应的第一数量之和,二者总和取最小值;根据所述二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间。

7.一种图片复审判定装置,其特征在于,所述装置包括:待鉴定图片不良概率获取模块,用于获取待鉴定图片为不良图片的不良概率;

图片复审判断模块,用于判断所述不良概率是否在预设的图片复审概率区间之内,所述图片复审概率区间根据权利要求1至4中任一项所述图片复审概率区间生成方法生成;若是,则判定所述待鉴定图片需要进行图片复审。

8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至5中任意一项所述方法的步骤。

说明书 :

图片复审概率区间生成方法及图片复审判定方法

技术领域

[0001] 本发明涉及通信技术领域,特别是涉及一种图片复审概率区间生成方法、装置、存储介质和计算机设备及一种图片复审判定方法、装置、存储介质和计算机设备。

背景技术

[0002] 随着通信技术的发展,为了便于用户的交流沟通,越来越多的网络平台,如社交平台、金融平台等,都为用户提供图片上传下载的功能。这也使得不良图片的传播越来越容易。为了防止不良图片的传播,许多网络平台通过将传输的图片接入不良图片鉴别系统进行鉴别,不良图片鉴别系统反馈的可以是将图片鉴定为正常、性感、色情三类中一种的单类别概率,或者是将图片鉴定为正常、性感、色情三类时分别对应的三个概率。
[0003] 然而,由于目前的不良图片鉴别系统存在漏检率或误检率,经过不良图片鉴别系统鉴定后的图片中仍有一部分图片需要进行人工复审来确认。在不良图片鉴别系统识别率有限的情况下,不良图片鉴别系统生成的图片复审概率区间比较大,因此人工复审的工作量也相应较大,需要耗费大量不必要的时间,从而导致不良图片的复审效率较低。

发明内容

[0004] 本发明实施例提供一种图片复审概率区间生成方法、装置、存储介质和计算机设备,可以有效解决不良图片复审效率较低的技术问题。
[0005] 本发明实施例提供一种图片复审判定方法、装置、存储介质和计算机设备,可以有效解决不良图片复审效率较低的技术问题。
[0006] 一种图片复审概率区间生成方法,所述方法包括:获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率;对于每组具有相同不良概率的图片,统计被复审判定为正常图片的第一数量,和被复审判定为不良图片的第二数量;根据每组不良概率对应的第一数量和第二数量重新生成图片复审概率区间。
[0007] 在其中一个实施例中,在所述获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率之前,包括:获取预设图片集中,每个图片的为不良图片初始概率;对每个图片对应的初始概率进行计算,生成所述预设图片集中每个图片为不良图片的不良概率;设定原始复审概率区间,并提取位于原始复审概率区间的不良概率对应的图片,形成与所述原始复审概率区间相对应的图片集。
[0008] 在其中一个实施例中,所述根据每组不良概率对应的第一数量和第二数量重新生成图片复审概率区间,包括:获取所述原始复审概率区间的原始上限概率和原始下限概率;根据所述原始上限概率和原始下限概率计算出二分类概率,通过所述二分类概率能够获得原始下限概率至二分类概率所对应的第二数量之和,与二分类概率至原始上限概率所对应的第一数量之和,二者总和的最小值;根据所述二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间。
[0009] 在其中一个实施例中,所述根据所述二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间,包括:当二分类概率小于等于预设概率时,根据公式 进行计算,重新生成上限概率s2’,其中,s1为原始下限概率,s2为原始上限概率,t为二分类概率,x0为预设概率;当二分类概率大于预设概率时,根据公式进行计算,重新生成下限概率s1’,其中,s1为原始下限概率,s2为原始
上限概率,t为二分类概率,x0为预设概率;根据所述新的上限概率s2’或所述新的下限概率s1’,重新生成图片复审概率区间。
[0010] 在其中一个实施例中,所述获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率之后,还包括:获取所述图片集对应的图片传输系统的图片系统权值;所述根据所述二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间,包括:根据所述二分类概率和所述图片系统权值,对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间。
[0011] 一种图片复审判定方法,所述方法包括:获取待鉴定图片为不良图片的不良概率;判断所述不良概率是否在预设的图片复审概率区间之内,所述图片复审概率区间根据上述各个实施例中所述的图片复审概率区间生成方法而生成;若是,则判定所述待鉴定图片需要进行图片复审。
[0012] 一种图片复审概率区间生成装置,所述装置包括:不良概率获取模块,用于获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率;图片判定数量统计模块,用于对于每组具有相同不良概率的图片,统计被复审判定为正常图片的第一数量,和被复审判定为不良图片的第二数量;图片复审概率区间生成模块,用于根据每组不良概率对应的第一数量和第二数量重新生成图片复审概率区间。
[0013] 一种图片复审判定装置,所述装置包括:待鉴定图片不良概率获取模块,用于获取待鉴定图片为不良图片的不良概率;图片复审判断模块,用于判断所述不良概率是否在预设的图片复审概率区间之内,所述图片复审概率区间根据权利要求1-5中任一项所述图片复审概率区间生成方法生成;若是,则判定所述待鉴定图片需要进行图片复审。
[0014] 一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述各个实施例中所述的图片复审概率区间生成方法的步骤。
[0015] 一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述各个实施例中所述的图片复审判定方法的步骤。
[0016] 一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述各个实施例中所述的图片复审概率区间生成方法的步骤。
[0017] 一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述各个实施例中所述的图片复审判定方法的步骤。
[0018] 上述的图片复审概率区间生成方法、装置、存储介质和计算机设备及图片复审判定方法、装置、存储介质和计算机设备,通过结合原始复审概率区间对应图片集的人工复审结果,对于每组具有相同不良概率的图片,统计被复审判定为正常图片的第一数量,和被复审判定为不良图片的第二数量,根据第一数量和第二数量对原始复审概率区间进行计算,重新生成图片复审概率区间。根据统计的复审结果对复审概率区间进行调整,使得新生成的图片复审概率区间范围更加准确,减少图片复审的工作量,从而提高不良图片复审的效率。

附图说明

[0019] 图1为一个实施例中图片复审概率区间生成方法的应用环境图;
[0020] 图2为一个实施例中图片复审概率区间生成方法的流程图;
[0021] 图3为另一个实施例中图片复审概率区间生成方法的流程图;
[0022] 图4为又一个实施例中图片复审概率区间生成方法的流程图;
[0023] 图5为一个实施例中图片复审判定方法的流程图;
[0024] 图6为一个实施例中图片复审概率区间生成装置的结构框图;
[0025] 图7为另一个实施例中图片复审概率区间生成装置的结构框图;
[0026] 图8为一个实施例中图片复审判定装置的结构框图;
[0027] 图9为一个实施例中第一计算机设备的内部结构图。

具体实施方式

[0028] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0029] 可以理解,本发明所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但这些元件不受这些术语的限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本发明的范围的情况下,可以将第一数量称为第二数量,且类似地,可将第二数量称为第一数量。第一数量和第二数量两者都是数量,但其不是同一数量。
[0030] 本发明实施例所提供的图片复审概率区间生成方法,可应用于如图1的应用环境中。参照图1,该应用环境包括第一计算机设备102和第二计算机设备104。第一计算机设备102和第二计算机设备104可为终端也可为服务器。其中,终端包括但不限于手机、平板电脑或者个人数字助理或穿戴式设备等,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群。第一计算机设备102和第二计算机设备可为相同类型的计算机设备,也可为不同类型的计算机设备。第一计算机设备102可用于执行本发明实施例所提供的图片复审概率区间生成方法。第二计算机设备104可以是存储有不良图片鉴别系统的终端或服务器,可用于鉴别不良图片并输出图片的初始概率。第一计算机设备102可与第二计算机设备104网络连接,比如说,第一计算机设备102可获取第二计算机设备104对图片进行鉴别得到的初始概率等数据,网络连接包括但不限于无线网络、有线网络等。
[0031] 在一个实施例中,第一计算机设备102和第二计算机设备104可为同一计算机设备。
[0032] 在一个实施例中,如图2所示,提供了一种图片复审概率区间生成方法,该方法可应用于如图1所示的应用环境中的第一计算机设备102,该方法包括:
[0033] 步骤S202,获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率。
[0034] 本实施例中,原始复审概率区间可以指预设的固定的复审概率区间,也可以是前一次调整的复审概率区间。其中,复审概率区间是指在不良图片鉴定过程中,需要进行人工复审的图片所对应的概率区间。不良概率是指图片为不良图片的可能程度,不良概率处于原始复审概率区间中。可根据不良图片鉴定系统输出的初始概率,按照预设的算法计算得到不良概率。进一步地,可根据与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率,统计形成原始复审概率区间上的图片不良分布,其中,图片不良分布中,横坐标可为不良概率,纵坐标可为相同不良概率所对应的图片数量。
[0035] 步骤S204,对于每组具有相同不良概率的图片,统计被复审判定为正常图片的第一数量,和被复审判定为不良图片的第二数量。
[0036] 本实施例中,统计原始复审概率区间中的图片被复审判定为正常图片或不良图片的数量。其中,相同不良概率的图片中,被复审判定为正常图片的图片数量为第一数量,被复审判定为不良图片的图片数量为第二数量。
[0037] 步骤S206,根据每组不良概率对应的第一数量和第二数量重新生成图片复审概率区间。
[0038] 本实施例中,新的图片复审概率区间是指用于判定图片是否要进行人工复审的概率区间,当新接收的图片的不良概率处于上述方法计算得到的新的图片复审概率区间之中时,可将该图片判定为需要进行人工复审。进一步地,还可根据每个不良概率的图片所对应的第一数量和第二数量,分别形成第一数量分布和第二数量分布之后,根据每组不良概率对应的第一数量分布和第二数量分布重新生成图片复审概率区间。
[0039] 上述实施例中,通过结合原始复审概率区间对应图片集的人工复审结果,统计被复审判定为正常图片的第一数量,和被复审判定为不良图片的第二数量,根据第一数量和第二数量对原始复审概率区间进行计算,重新生成图片复审概率区间。通过结合人工复审后的结果,对复审概率区间进行调整,使得新生成的图片复审概率区间范围更加准确,减少图片复审的工作量,从而提高不良图片复审的效率。
[0040] 在一个实施例中,如图3所示,在步骤S202之前,还包括:
[0041] 步骤S302,获取预设图片集中,每个图片为不良图片的初始概率。
[0042] 本实施例中,预设图片集是指图片系统在预设时间段内输入不良图片鉴别系统的图片所构成的图片集。初始概率不良图片鉴别系统输出的每个图片鉴别后的概率,不良图片鉴别系统输出的可以是将图片鉴定为正常、性感、色情三类中一种的单类别概率,或者是将图片鉴定为正常、性感、色情三类时分别对应的三个多类别概率。其中,单一类别概率和多类别概率可为图片为相应图片类别的置信度。单一类别概率和多类别概率的取值可为0至1。
[0043] 步骤S304,对每个图片对应的初始概率进行计算,生成预设图片集中每个图片为不良图片的不良概率。
[0044] 本实施例中,不良概率是按照预设的算法根据初始概率进行计算而得到的具有统一标准的概率。具体地,将单类别概率或多类别概率统一映射为在同一参考范围上的概率。
[0045] 进一步地,获取预设图片集中,每个图片为不良图片的初始概率所对应的图片类别权值;根据相同图片的初始概率所对应的图片类别权值,对每个图片对应的初始概率进行计算,生成预设图片集中每个图片为不良图片的不良概率。其中,图片类别权值是指不良图片鉴别系统输出的图片类别所对应的权值。当初始概率为单一类别概率时,每个图片所对应的图片类别权值为预设正常权值、预设性感权值、预设色情权值三类中的一种;当初始概率为多类别概率时,每个图片所对应的图片类别权值可为三个,分别是预设正常权值、预设性感权值和预设色情权值。
[0046] 步骤S306,设定原始复审概率区间,并提取位于原始复审概率区间的不良概率对应的图片,形成与原始复审概率区间相对应的图片集。
[0047] 本实施例中,计算出每个图片为不良图片的不良概率之后,可根据原始复审概率区间提取出相应的图片,形成与原始复审概率区间相对应的图片集,该图片集为需要进行人工复审的图片集。进一步地,可将与原始复审概率区间相对应的图片集提取出来存储至预设路径下的数据库,使得图片复审人员能够直接对已提取出的图片进行复审。
[0048] 上述实施例中,通过将不良图片鉴定系统输出的图片的初始概率统一映射成不良概率进行比较,使得能够确定具有统一参考标准的原始复审概率区间,并根据原始复审概率区间相对应的图片集的人工复审结果,对原始复审概率区间进行计算,重新生成图片复审概率区间,规范了图片复审概率区间的确定方式,提高了图片复审概率区间的准确度。
[0049] 在一个实施例中,步骤S206,还包括:获取原始复审概率区间的原始上限概率和原始下限概率;根据原始上限概率和原始下限概率计算出二分类概率,通过二分类概率能够获得原始下限概率至二分类概率所对应的第二数量之和,与二分类概率至原始上限概率所对应的第一数量之和,二者总和的最小值;根据二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间。
[0050] 本实施例中,原始上限概率和原始下限概率是指原始复审概率区间的端点,且原始上限概率的值大于原始下限概率的值。二分类概率是指将原始复审概率区间分割成两个区间的值,二分类概率大于原始下限阈值且小于原始上限阈值。具体地,在将原始下限概率至二分类概率所对应的第二数量之和,与二分类概率至原始上限概率所对应的第一数量之和,两者的总和取最小值时,可得到二分类概率。可表示为公式 其中,s1为原始下限概率,s2为原始上限概率,Mi表示概率为i的第二数量,Ni表示概率为i的第一数量,通过取 与 二者之和的最小值可求得二分类概率t。
[0051] 具体地,原始复审概率区间的原始上限概率和原始下限概率,可按照与计算不良概率相同的预设的算法计算得到。由于每个不良图片鉴别系统都存在漏检率或误检率,每个不良图片鉴别系统有自身预设的需要进行复审的初始概率区间,可提取该初始概率区间的初始上限概率和初始下限概率进行计算,得到原始上限概率和原始下限概率。原始复审概率区间的原始上限概率和原始下限概率也可为根据前一次调整的图片复审概率区间直接确定的。
[0052] 进一步地,还可在形成第一数量分布和第二数量分布之后,将第二数量分布在原始下限概率至二分类概率的积分,与第一数量分布在二分类概率至原始上限概率的积分,两者的积分之和取最小值计算得二分类概率。根据二分类概率对原始上限概率和原始下限概率按照预设的分别或者同时进行计算,重新生成图片复审概率区间。
[0053] 在一个实施例中,在获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率之后,还包括:获取图片集对应的图片传输系统的图片系统权值。步骤S206包括:根据二分类概率和图片系统权值,对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间。
[0054] 本实施例中,图片系统权值为与图片系统所对应的一个或多个权值。其中,图片系统包括但不限于娱乐性质的系统,比如相亲论坛、社交平台等,或者也可为金融领域的系统,比如银行系统、证券系统等。具体的,图片系统权值可根据图片系统的属性或参数进行赋值。比如,可根据图片类型进行赋值,其中,图片类型包括但不限于发票单据类、客户单据类、凭证文件类、工作流通类、客户交流沟通类等,按照内部至对外流程业务的程度由低到高赋值;还可以根据图片访问频率进行赋值,其中,访问频率可分为外部访问频率及下载频率等,按照频率的取值由低到高赋值;还可以根据图片重要程度进行赋值,比如可根据图片与交易的关联程度进行赋值,可按照图片与交易凭证、推广宣传及客户管理的相关程度由低到高赋值。进一步地,可根据图片系统的一个或多个系统权值和二分类概率,对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间。具体地,还可将多个系统权值的和作为该图片系统的综合系统权值。当综合系统权值在预设的权值区间时,采取相应的分别或同时对原始上限概率和原始下限概率进行计算。
[0055] 在一个实施例中,可根据图片类型确定权值q1,可根据图片访问频率确定权值q2,可根据图片重要程度确定权值q3。具体地,可根据q1、q2、q3权值之和确定综合系统权值Q=q1+q2+q3,且可限定q1、q2、q3的取值范围。比如,q1可取值1至10,q2取值1至20,q3取值1至10。进一步地,可根据综合系统权值Q与预设阈值的大小,采取相应的计算公式重新生成原始上限概率和原始下限概率。比如,当综合系统权值Q小于等于20,调整 当综合系统权值Q大于20,调整 其中,其中,s1为原始下限概率,s2为原始
上限概率,t为二分类概率,s1’为新的下限概率,s2’为新的上限概率。
[0056] 在一个实施例中,可根据图片的URL(资源统一定位符)中的关键字确定图片的类型。比如说,如果一张图片的URL相关的关键词为货物、货款、支付等,则可给图片打上单据的标签。具体地,可以预设关键词的数据库,生成关键词和类型的映射关系。当提取到URL中包含的关键词时,将该关键词与数据库中的预设关键词进行匹配,获取与匹配成功的关键词具有映射关系的图片类型,作为与该图片对应的图片类型。
[0057] 本实施例中,针对不同的图片系统的情况生成相应的图片复审概率区间,使得生成的图片复审概率区间更加符合实际需求,提高了图片复审区间的准确度。
[0058] 在一个实施例中,针对不同的用户也可有相应的图片系统权值。该图片系统权值可根据用户的历史发图数据进行赋值。比如说,可以根据用户历史记录中发的图片的不良程度进行赋值;还可根据用户历史发图的图片访问频率进行赋值;还可根据用户历史记录中发的文本等其他形式内容的不良程度进行赋值。举例来说,针对一个历史习惯为上传过色情图片,且图片访问频率大于预设阈值的用户,可赋予相对较高的权值。
[0059] 在一个实施例中,可根据用户历史记录中发的图片的不良程度确定权值c1,可根据用户历史发图的图片访问频率确定权值c2,可根据用户历史记录中发的文本等其他形式内容的不良程度确定权值c3。具体地,可根据c1、c2、c3权值之和确定综合系统权值C=c1+c2+c3,且可限定c1、c2、c3的取值范围。比如,c1可取值1至10,c2取值1至20,c3取值1至10。进一步地,可根据综合系统权值C与预设阈值的大小,采取相应的计算公式重新生成原始上限概率和原始下限概率。比如,当综合系统权值C小于等于20,调整 当综合系统权值C大于20,调整 其中,其中,s1为原始下限概率,s2为原始上限
概率,t为二分类概率,s1’为新的下限概率,s2’为新的上限概率。
[0060] 本实施例中,针对不同用户的历史记录生成相应的图片复审概率区间,使得生成的图片复审概率区间更加符合实际需求,提高了图片复审区间的准确度。
[0061] 在一个实施例中,如图4所示,提供了另一种图片复审概率区间生成方法,该方法包括:
[0062] 步骤S402,获取预设图片集中,每个图片为不良图片的初始概率,对每个图片对应的初始概率进行计算,生成预设图片集中每个图片为不良图片的不良概率。
[0063] 本实施例中,初始概率不良图片鉴别系统输出的每个图片鉴别后的概率,不良图片鉴别系统输出的可以是将图片鉴定为正常、性感、色情三类中一种的单类别概率,或者是将图片鉴定为正常、性感、色情三类时分别对应的三个多类别概率。
[0064] 在一个实施例中,当初始概率为单类别概率时,可分别预设正常、性感及色情三种单类别概率的映射公式,计算生成不良概率。比如说,针对鉴别为正常图片的单类别概率A,映射公式可为不良概率 针对鉴别为性感图片的单类别概率B,映射公式可为不良概率 针对鉴别为色情图片的单类别概率C,映射公式可为不良概率 其中,若A、B、C的取值都为0至1,则与概率A相应的不良概率y取值为0至 与概率B相应的不良概率y取值为 至 与概率C相应的不良概率y取值为 至1,因此不良概率y的取值范围为0至1。本实施例中,通过将三种单类别概率映射为同一取值标准下的不良概率,降低了比较不良图片鉴别系统输出概率的难度,规范了不良概率的标准,提高了确定复审概率区间的准确度。
[0065] 在一个实施例中,当初始概率为多类别概率时,可综合每张图片所对应的正常概率、性感概率及色情概率,按照统一的映射公式,计算生成不良概率。比如说,针对相同图片所对应的正常概率D、性感概率E和色情概率F,且三个概率之和可为1,可预设映射公式为不良概率 本实施例中,通过综合三个多类别概率计算得到不良概率,降低了比较不良图片鉴别系统输出概率的难度,规范了不良概率的标准,提高了确定复审概率区间的准确度。
[0066] 步骤S404,设定原始复审概率区间,并提取位于原始复审概率区间的不良概率对应的图片,形成与原始复审概率区间相对应的图片集。
[0067] 具体地,可根据确定不良概率的映射公式,确定原始复审概率区间。其中,原始复审概率区间在预设图片集所对应的不良概率的取值区间中。
[0068] 步骤S406,获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率。
[0069] 步骤S408,对于每组具有相同不良概率的图片,统计被复审判定为正常图片的第一数量,和被复审判定为不良图片的第二数量。
[0070] 本实施例中,将原始复审概率区间相对应的图片集作为需要进行人工复审的图片集,使得图片复审人员将该图片集中的图片判定为正常图片或不良图片。
[0071] 在一个实施例中,针对图片复审,可提供相应的图片复审界面,在该界面上展示原始复审概率区间相对应的图片集中的图片,图片复审人员可根据判断选择出其中的正常图片或不良图片。进一步地,可按照每个不良概率展示对应的图片,当检测到图片复审人员的点击操作,则可以给该图片打上相应的标签,统计统一类型的标签数量作为第一数量或第二数量。
[0072] 举例来说,可将图片复审人员点击选择的图片作为不良图片并标记为“1”,将没有被点击选择的图片作为正常图片并标记为“0”,当对该不良概率对应的图片都进行了复审之后,可以统计该不良概率下标记为“0”的图片数量作为第一数量,统计标记为“0”的图片数量作为第二数量。
[0073] 步骤S410,获取原始复审概率区间的原始上限概率和原始下限概率,根据原始上限概率和原始下限概率计算出二分类概率。
[0074] 本实施例中,通过二分类概率能够获得原始下限概率至二分类概率所对应的第二数量之和,与二分类概率至原始上限概率所对应的第一数量之和,二者总和的最小值。具体地,获取原始复审概率区间对应的原始上限概率s2和原始下限概率s1,其中,原始上限概率s2和原始下限概率s1可根据不良图片鉴别系统的漏检率和误检率确定。
[0075] 在一个实施例中,可根据每个不良概率所对应的第一数量生成第一数量分布P1(x),相应的,可根据每个不良概率所对应的第二数量生成第二数量分布P2(x)。进一步地,可根据公式 计算生成二分类概率t,其中二分类概率t使得,将第二数量分布P2(x)在原始下限概率s1至二分类概率t的积分,与第一数量分布P1(x)在二分类概率t至原始上限概率s2的积分,两者的积分之和取最小值。
[0076] 步骤S412,判断二分类概率是否大于预设概率。
[0077] 本实施例中,当二分类概率小于等于预设概率时,执行步骤S314;当二分类概率大于预设概率时,执行步骤S316。
[0078] 步骤S414,按照预设的第一公式进行计算,重新生成上限概率。
[0079] 具体地,第一公式可预设为 其中,s1为原始下限概率,s2为原始上限概率,t为二分类概率,x0为预设概率,s2’为新的上限概率。
[0080] 步骤S416,按照预设的第二公式进行计算,重新生成下限概率。
[0081] 具体地,第二公式可预设为 其中,s1为原始下限概率,s2为原始上限概率,t为二分类概率,x0为预设概率,s1’为新的下限概率。
[0082] 步骤S418,根据重新生成的上限概率或重新生成的下限概率,重新生成图片复审概率区间。
[0083] 具体地,根据新的上限概率s2’或新的下限概率s1’,重新生成图片复审概率区间,该图片复审概率区间为s1’至s2’。
[0084] 上述实施例中,通过将不良图片鉴定系统输出的图片的初始概率统一映射成不良概率进行比较,根据原始复审概率区间所对应的图片经过人工复审后的结果,统计被复审判定为正常图片的第一数量,和被复审判定为不良图片的第二数量,根据第一数量和第二数量对原始复审概率区间进行计算,重新生成图片复审概率区间。通过结合人工复审后的结果,计算生成二分类概率。根据二分类概率与预设概率的大小将对复审概率区间的调整分成两种情况,使得新生成的图片复审概率区间范围更加准确,减少图片复审的工作量,从而提高不良图片复审的效率。
[0085] 在一个实施例中,如图5所示,提供了一种图片复审判定方法,该方法包括:
[0086] 步骤S502,获取待鉴定图片为不良图片的不良概率。
[0087] 本实施例中,待鉴定图片为需要进行判定是否要进行图像复审的图片。具体地,获取待鉴定图片为不良图片的不良概率与计算预设图片集中每个图片不良概率的计算方式一致。
[0088] 步骤S504,判断不良概率是否在预设的图片复审概率区间之内。
[0089] 本实施例中,图片复审概率区间的生成方法包括:获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率;对于每组具有相同不良概率的图片,统计被复审判定为正常图片的第一数量,和被复审判定为不良图片的第二数量;根据每组不良概率对应的第一数量和第二数量重新生成图片复审概率区间。若是,则执行步骤S506;若否,则执行步骤S508。
[0090] 步骤S506,判定待鉴定图片需要进行图片复审。
[0091] 步骤S508,判定待鉴定图片不需要进行图片复审。
[0092] 在一个实施例中,图片复审概率区间的生成方法还包括:在获取与原始复审概率区间相对应的图片集中,每个图片为不良图片的不良概率之前,获取预设图片集中,每个图片为不良图片的初始概率;对每个图片对应的初始概率进行计算,生成预设图片集中每个图片为不良图片的不良概率;设定原始复审概率区间,并提取位于原始复审概率区间的不良概率对应的图片,形成与原始复审概率区间相对应的图片集。
[0093] 在一个实施例中,根据每组不良概率对应的第一数量和第二数量重新生成图片复审概率区间,包括:获取原始复审概率区间的原始上限概率和原始下限概率;根据原始上限概率和原始下限概率计算出二分类概率,通过二分类概率能够获得原始下限概率至二分类概率所对应的第二数量之和,与二分类概率至原始上限概率所对应的第一数量之和,二者总和的最小值;根据二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间。
[0094] 在一个实施例中,根据二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间,包括:当二分类概率小于等于预设概率时,根据公式进行计算,重新生成上限概率s2’,其中,s1为原始下限概率,s2为原始上限概率,t为二分类概率,x0为预设概率;当二分类概率大于预设概率时,根据公式进行计算,重新生成下限概率s1’,其中,s1为原始下限概率,s2为原始
上限概率,t为二分类概率,x0为预设概率;根据新的上限概率s2’或新的下限概率s1’,重新生成图片复审概率区间。
[0095] 在一个实施例中,获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率之后,还包括:获取图片集对应的图片传输系统的图片系统权值;根据二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间,包括:根据二分类概率和图片系统权值,对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间。
[0096] 上述实施例中,通过将不良图片鉴定系统输出的图片的初始概率统一映射成不良概率进行比较,根据原始复审概率区间所对应的图片经过人工复审后的结果,统计被复审判定为正常图片的第一数量,和被复审判定为不良图片的第二数量,根据第一数量和第二数量对原始复审概率区间进行计算,重新生成图片复审概率区间。通过结合人工复审后的结果,对复审概率区间进行调整,使得新生成的图片复审概率区间范围更加准确,减少图片复审的工作量,从而提高不良图片复审的效率。
[0097] 在一个实施例中,如图6所示,提供了一种图片复审概率区间生成装置600,该装置包括:不良概率获取模块602,用于获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率;图片判定数量统计模块604,用于对于每组具有相同不良概率的图片,统计被复审判定为正常图片的第一数量,和被复审判定为不良图片的第二数量;图片复审概率区间生成模块606,用于根据每组不良概率对应的第一数量和第二数量重新生成图片复审概率区间。
[0098] 在一个实施例中,如图7所示,提供了另一种图片复审概率区间生成装置700,该装置还包括原始复审图片集形成模块601,用于获取预设图片集中,每个图片为不良图片的初始概率;对每个图片对应的初始概率进行计算,生成预设图片集中每个图片为不良图片的不良概率;设定原始复审概率区间,并提取位于原始复审概率区间的不良概率对应的图片,形成与原始复审概率区间相对应的图片集。
[0099] 在一个实施例中,图片复审概率区间生成模块606还用于获取原始复审概率区间的原始上限概率和原始下限概率;根据原始上限概率和原始下限概率计算出二分类概率,通过二分类概率能够获得原始下限概率至二分类概率所对应的第二数量之和,与二分类概率至原始上限概率所对应的第一数量之和,二者总和的最小值;根据二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间。
[0100] 在一个实施例中,图片复审概率区间生成模块606还用于当二分类概率小于等于预设概率时,根据公式 进行计算,重新生成上限概率s2’,其中,s1为原始下限概率,s2为原始上限概率,t为二分类概率,x0为预设概率;当二分类概率大于预设概率时,根据公式 进行计算,重新生成下限概率s1’,其中,s1为原始
下限概率,s2为原始上限概率,t为二分类概率,x0为预设概率;根据新的上限概率s2’或新的下限概率s1’,重新生成图片复审概率区间。
[0101] 在一个实施例中,图片复审概率区间生成模块606还用于获取图片集对应的图片传输系统的图片系统权值;根据二分类概率和图片系统权值,对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间。
[0102] 在一个实施例中,如图8所示,提供了一种图片复审判定装置800,该装置包括:待鉴定图片不良概率获取模块802,用于获取待鉴定图片为不良图片的不良概率;图片复审判断模块804,用于判断不良概率是否在预设的图片复审概率区间之内,图片复审概率区间的生成方法包括:获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率;对于每组具有相同不良概率的图片中,统计被复审判定为正常图片的第一数量,和被复审判定为不良图片的第二数量;根据每组不良概率对应的第一数量和第二数量重新生成图片复审概率区间;若是,则判定待鉴定图片需要进行图片复审。
[0103] 在一个实施例中,在获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率之前,包括:获取预设图片集中,每个图片为不良图片的初始概率;对每个图片对应的初始概率进行计算,生成预设图片集中每个图片为不良图片的不良概率;设定原始复审概率区间,并提取位于原始复审概率区间的不良概率对应的图片,形成与原始复审概率区间相对应的图片集。
[0104] 在一个实施例中,根据每组不良概率对应的第一数量和第二数量重新生成图片复审概率区间,包括:获取原始复审概率区间的原始上限概率和原始下限概率;根据原始上限概率和原始下限概率计算出二分类概率,通过二分类概率能够获得原始下限概率至二分类概率所对应的第二数量之和,与二分类概率至原始上限概率所对应的第一数量之和,二者总和的最小值;根据二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间。
[0105] 在一个实施例中,根据二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间,包括:当二分类概率小于等于预设概率时,根据公式进行计算,重新生成上限概率s2’,其中,s1为原始下限概率,s2为原始上限概率,t为二分类概率,x0为预设概率;当二分类概率大于预设概率时,根据公式进行计算,重新生成下限概率s1’,其中,s1为原始下限概率,s2为原始
上限概率,t为二分类概率,x0为预设概率;根据新的上限概率s2’或新的下限概率s1’,重新生成图片复审概率区间。
[0106] 在一个实施例中,获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率之后,还包括:获取图片集对应的图片传输系统的图片系统权值;根据二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间,包括:根据二分类概率和图片系统权值,对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间。
[0107] 上述的图片复审概率区间生成装置和图片复审判定装置可以实现为一种计算机程序的形式,计算机程序可在如图9的第一计算机设备上运行。第一计算机设备上的非易失性存储介质可存储组成该图片复审概率区间生成装置和图片复审判定装置的各个程序模块,比如图6中的不良概率获取模块602、图片判定数量统计模块604、图片复审概率区间生成模块606以及图8中的待鉴定图片不良概率获取模块802和图片复审判断模块804等。各个程序模块中包括计算机程序,计算机程序用于使服务器执行本说明书中描述的本申请各个实施例的图片复审概率区间生成方法和图片复审判定方法中的步骤,第一计算机设备中的处理器能够调用第一计算机设备的非易失性存储介质中存储的图片复审概率区间生成装置和图片复审判定装置的各个程序模块,运行对应的计算机程序,实现本说明书中图片复审概率区间生成装置和图片复审判定装置的各个模块对应的功能。
[0108] 在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率;对于每组具有相同不良概率的图片,统计被复审判定为正常图片的第一数量,和被复审判定为不良图片的第二数量;根据每组不良概率对应的第一数量和第二数量重新生成图片复审概率区间。
[0109] 在一个实施例中,该程序被处理器执行时,所实现的获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率步骤之前,还包括以下步骤:获取预设图片集中,每个图片为不良图片的初始概率;对每个图片对应的初始概率进行计算,生成预设图片集中每个图片为不良图片的不良概率;设定原始复审概率区间,并提取位于原始复审概率区间的不良概率对应的图片,形成与原始复审概率区间相对应的图片集。
[0110] 在一个实施例中,该程序被处理器执行时,所实现的根据每组不良概率对应的第一数量和第二数量重新生成图片复审概率区间的步骤,具体包括以下步骤:获取原始复审概率区间的原始上限概率和原始下限概率;根据原始上限概率和原始下限概率计算出二分类概率,通过二分类概率能够获得原始下限概率至二分类概率所对应的第二数量之和,与二分类概率至原始上限概率所对应的第一数量之和,二者总和的最小值;根据二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间。
[0111] 在一个实施例中,该程序被处理器执行时,所实现的根据二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间的步骤,具体包括以下步骤:当二分类概率小于等于预设概率时,根据公式 进行计算,重新生成上限概率s2’,其中,s1为原始下限概率,s2为原始上限概率,t为二分类概率,x0为预设概率;
当二分类概率大于预设概率时,根据公式 进行计算,重新生成下限概
率s1’,其中,s1为原始下限概率,s2为原始上限概率,t为二分类概率,x0为预设概率;根据新的上限概率s2’或新的下限概率s1’,重新生成图片复审概率区间。
[0112] 在一个实施例中,该程序被处理器执行时,所实现的获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率的步骤之后,还包括:获取图片集对应的图片传输系统的图片系统权值;所实现的根据二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间的步骤,具体包括:根据二分类概率和图片系统权值,对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间。
[0113] 在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:获取待鉴定图片为不良图片的不良概率;判断不良概率是否在预设的图片复审概率区间之内,图片复审概率区间根据上述各个实施例中的图片复审概率区间生成方法而生成。
[0114] 在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器在执行程序时实现以下步骤::获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率;对于每组具有相同不良概率的图片,统计被复审判定为正常图片的第一数量,和被复审判定为不良图片的第二数量;根据每组不良概率对应的第一数量和第二数量重新生成图片复审概率区间。
[0115] 在一个实施例中,上述处理器执行程序时,所实现的获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率的步骤之前,还包括以下步骤:获取预设图片集中,每个图片为不良图片的初始概率;对每个图片对应的初始概率进行计算,生成预设图片集中每个图片为不良图片的不良概率;设定原始复审概率区间,并提取位于原始复审概率区间的不良概率对应的图片,形成与原始复审概率区间相对应的图片集。
[0116] 在一个实施例中,上述处理器执行程序时,所实现的根据每组不良概率对应的第一数量和第二数量重新生成图片复审概率区间的步骤,具体包括以下步骤:获取原始复审概率区间的原始上限概率和原始下限概率;根据原始上限概率和原始下限概率计算出二分类概率,通过二分类概率能够获得原始下限概率至二分类概率所对应的第二数量之和,与二分类概率至原始上限概率所对应的第一数量之和,二者总和的最小值;根据二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间。
[0117] 在一个实施例中,上述处理器执行程序时,所实现的根据二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间的步骤,具体包括以下步骤:当二分类概率小于等于预设概率时,根据公式 进行计算,重新生成上限概率s2’,其中,s1为原始下限概率,s2为原始上限概率,t为二分类概率,x0为预设概率;
当二分类概率大于预设概率时,根据公式 进行计算,重新生成下限概
率s1’,其中,s1为原始下限概率,s2为原始上限概率,t为二分类概率,x0为预设概率;根据新的上限概率s2’或新的下限概率s1’,重新生成图片复审概率区间。
[0118] 在一个实施例中,上述处理器执行程序时,所实现的获取与原始复审概率区间相对应的图片集中每个图片为不良图片的不良概率的步骤之后,还包括:获取图片集对应的图片传输系统的图片系统权值;所实现的根据二分类概率对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间的步骤,具体包括:根据二分类概率和图片系统权值,对原始上限概率和原始下限概率进行计算,重新生成图片复审概率区间。
[0119] 在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器在执行程序时实现以下步骤:获取待鉴定图片为不良图片的不良概率;判断不良概率是否在预设的图片复审概率区间之内,图片复审概率区间根据上述各个实施例中的图片复审概率区间生成方法而生成。
[0120] 在一个实施例中,上述的计算机设备可包括但不限于独立的物理服务器,或者是多个物理服务器构成的服务器集群。如图9,为一个实施例中第一计算机设备的内部结构示意图。该第一计算机设备可应用于图1的应用环境中的第一计算机设备102。该第一计算机设备包括通过系统总线连接的处理器、非易失性存储介质、内存储器和网络接口。其中,该第一计算机设备的处理器用于提供计算和控制能力,支撑整个第一计算机设备的运行。第一计算机设备的非易失性存储介质存储有操作系统、数据库和计算机程序。该数据库中存储有用于实现以上各个实施例所提供的一种图片复审概率区间生成方法和图片复审判定方法相关的数据,比如可存储有预设的图片集中每个图片集所对应的初始概率。该计算机程序可被处理器所执行,以用于实现以上各个实施例所提供的一种图片复审概率区间生成方法和一种图片复审判定方法。第一计算机设备中的内存储器为非易失性存储介质中的操作系统、数据库和计算机程序提供高速缓存的运行环境。网络接口可以是以太网卡或无线网卡等,用于与外部的终端或服务器进行通信,比如与图1的应用环境中的第二计算机设备104进行通信,获取预设图片集中每个图片为不良图片的初始概率。
[0121] 本领域技术人员可以理解,图9中示出的第一计算机设备的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的第一计算机设备的限定,具体的第一计算机设备可以包括比图中更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。比如,该图中的第一计算机设备还可包括显示屏等。
[0122] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等。
[0123] 以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0124] 以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。