审核监控方法、装置、电子设备及存储介质转让专利
申请号 : CN201811628689.7
文献号 : CN109803176B
文献日 : 2021-05-21
发明人 : 陈思思 , 林协 , 李锦春 , 邱泽潮 , 蒋伟 , 胡志龙
申请人 : 广州华多网络科技有限公司
摘要 :
权利要求 :
1.一种审核监控方法,其特征在于,所述方法包括:获取审核样本的数量;
获取测试样本的投放数量;
获取监控间隔;
根据所述测试样本的投放数量与所述监控间隔,计算所述测试样本投放数值区间的区间中心;
根据所述区间中心、预设区间大小以及所述审核样本的数量,设置所述测试样本投放数值区间,所述测试样本投放数值区间的数量等于所述测试样本的投放数量;
确定每个所述测试样本投放数值区间中的投放阈值;
当已审核样本的数量大于所述投放阈值时,投放测试样本。
2.根据权利要求1所述的审核监控方法,其特征在于,在所述当已审核样本的数量大于所述投放阈值时,投放测试样本之前,所述方法还包括:获取测试样本的标识;
所述当已审核样本的数量大于所述投放阈值时,投放测试样本,包括:当审核样本的数量大于所述投放阈值时,投放与所述测试样本的标识对应的测试样本。
3.根据权利要求2所述的审核监控方法,其特征在于,所述获取测试样本的标识,包括:根据标识预设规则设置测试样本的多个标识;
基于所述测试样本的多个标识设置对应所述多个标识的投放权重;
基于所述多个标识的投放权重构建多个标识权重数值区间,一个所述标识与一个所述标识权重数值区间对应;
生成标识选择数值,查找所述标识选择数值所属的标识权重数值区间,并获取所述标识选择数值所属的所述标识权重数值区间对应的标识作为测试样本的标识。
4.根据权利要求3所述的审核监控方法,其特征在于,每个所述标识的属性包括测试样本的标识的违规等级、违规频率、重要性评价、漏检率中的至少一种。
5.根据权利要求1所述的审核监控方法,其特征在于,所述获取测试样本的投放数量之前,所述方法还包括:
根据数量预设规则设置测试样本的多个投放数量;
基于所述多个投放数量设置对应所述多个投放数量的投放权重;
基于所述多个投放数量的投放权重构建多个数量权重数值区间,一个所述投放数量与一个所述数量权重数值区间对应;
生成数量选择数值,查找所述数量选择数值所属的数量权重数值区间,并获取所述数量选择数值所属的所述数量权重数值区间对应的投放数量作为测试样本的投放数量。
6.根据权利要求1所述的方法,其特征在于,所述根据所述测试样本的投放数量与所述监控间隔,计算所述测试样本投放数值区间的区间中心,采用公式:其中,Am为一个所述监控间隔P内的第m个所述区间中心,m=1,…,2n‑1,n为所述测试样本的投放数量,n∈N*。
7.根据权利要求1所述的方法,其特征在于,所述当已审核样本的数量大于所述投放阈值时,投放测试样本之前,所述方法还包括:获取当所述已审核样本的数量达到所述投放阈值时对应的第一图片以及在所述第一图片之后相邻的第二图片;
根据所述第一图片以及所述第二图片的图片属性,编辑所述测试样本,所述图片属性包括亮度、对比度、图片标识、业务标签中的至少一种。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:统计测试结果,所述测试结果包括漏检率、测试样本的标识中的至少一种。
9.一种审核监控装置,其特征在于,包括:第一获取模块,用于获取审核样本的数量;
第二获取模块,用于获取测试样本的投放数量;
第三获取模块,用于获取监控间隔;
区间计算模块,用于根据所述测试样本的投放数量与所述监控间隔,计算所述测试样本投放数值区间的区间中心;
区间设置模块,用于根据所述区间中心、预设区间大小以及所述审核样本的数量,设置所述测试样本投放数值区间,所述测试样本投放数值区间的数量等于所述测试样本的投放数量;
阈值确定模块,用于确定每个所述测试样本投放数值区间中的投放阈值;
投放模块,用于当审核样本的数量大于所述投放随机数阈值对应的审核样本的数量时,投放测试样本。
10.一种电子设备,其特征在于,包括:存储器;
一个或多个处理器,与所述存储器耦接;
一个或多个程序,其中,所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行如权利要求1‑8任一项所述的方法。
11.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行如权利要求1‑8任一项所述的方法。
说明书 :
审核监控方法、装置、电子设备及存储介质
技术领域
背景技术
少多媒体直播掺杂着违规内容,例如色情、暴力等内容,这些违规内容扰乱了人们的正常生
活。为了减少违规内容的传播,就需要及时发现并消除违规内容。
审核人员之间的审核标准往往存在差异,而这种差异性容易引起用户对审核结果的争议,
所以各平台需要对审核人员的审核质量进行监控,但是目前尚且没有有效的方法可以控制
审核质量。
发明内容
本投放数值区间的数量等于测试样本的投放数量;确定每个测试样本投放数值区间中的投
放阈值;当已审核样本的数量大于投放阈值时,投放测试样本。
块,用于基于审核样本的数量设置测试样本投放数值区间,测试样本投放数值区间的数量
等于测试样本的投放数量;阈值确定模块,用于确定每个测试样本投放数值区间中的投放
阈值;投放模块,当审核样本的数量大于投放随机数阈值对应的审核样本的数量时,投放测
试样本。
置为由一个或多个处理器执行,一个或多个程序配置用于执行如上述第一方面所述的方
法。
法。
间,其中,测试样本投放数值区间的数量等于测试样本的投放数量,最后确定每个测试样本
投放数值区间中的投放阈值,并当已审核样本的数量大于投放阈值时,投放测试样本。本申
请通过向审核人员审核的审核样本中随机投放测试样本,实现对审核人员的审核结果的实
时测试,从而实时监控审核人员的审核质量,提高监控效率的同时有利于提高审核质量。
附图说明
本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附
图。
具体实施方式
施例仅用于解释本申请,并不用于限定本申请。
增加,对多媒体直播的审核监管工作带来了越来越大的挑战。为了对大量的多媒体直播实
现有效的监管,直播平台引入了机器审核以提高审核效率,但是目前的机器审核只能进行
简单的甄别和筛选,而如果要对违规内容实现更加准确的审核和判别,仍需要足够多的、训
练有素的审核人员来进行二次审核。
审核质量造成较大影响,所以人工审核需要监督,也就是对于审核人员的审核结果需要进
行监控,才能更好地在利用人工审核提高审核准确度的同时,保证人工审核的审核质量。
并且对于审核人员审核过程中出现的差异性,无法做出及时地调整和管控,导致审核质量
低下且易导致审核结果不够公正与标准。
时做出调整以保证审核人员可以及时阻断违规内容的传播。所以如何可以有效地在监控审
核质量的同时提高审核效率显得愈发重要。
100可以进行数据交互。进一步地,多个终端200之间可以相互通过互联网进行通信连接,也
可以将服务器100作为传输中介,并通过互联网来进行相互间的通信连接。
空间内。其中,服务器100可以是单独的服务器,也可以是服务器集群,可以是本地服务器,
也可以是云端服务器,在此不作限定。在一些实施方式中,服务器100中可以安装多媒体直
播审核系统,可以用于分发直播数据。
核,并根据审核得到的审核结果提交处罚结果,处罚结果存储于服务器100。另外,管理人员
可以在客户端登录管理员帐号,不同的管理员可以的对应不同的管理员帐号,也可以对应
相同的管理员帐号,通过管理员帐号,可以监控审核人员对直播数据的审核。
数据可以先通过机器审核,在机器审核阶段利用图像识别以及数据分析,对直播数据进行
初步判断,判断直播数据是否安全。经过判断,可以将安全的直播数据存储归档,并将不安
全的直播数据作为审核样本存储于审核数据分发队列中,在一些实施方式中,审核数据分
发队列存储于服务器100,服务器100上可以安装多媒体直播审核系统,可以用于分发审核
数据分发队列中的审核样本。
的审核样本将进入人工审核阶段,具体的,人工审核由多个审核人员通过客户端对审核样
本进行审核。
号,获取该审核帐号对应的审核样本进行审核。
本的一种。具体的,作为一种方式,可以将不确定的审核样本分发入人工一审,将疑似违规
的审核样本分发入人工二审,进一步地,经人工一审判断仍为疑似违规的审核样本可以分
发入人工二审,进行第二次人工审核,以提升违规内容判断的准确性。
断,选择合理的处理方式。其中,审核规则是审核人员对审核样本进行违规判断的依据,作
为一种方式,审核人员可以根据审核规则,确定审核样本的违规类型,例如色情、暴力等。
不对本方案构成限定。
下步骤:
规及其违规类型等。
数据分发队列,通过审核数据分发队列分发给审核人员进行审核。
核人员审核完已获取的审核样本之后,还可以继续请求新的审核样本进行审核,此时审核
样本的数量可以继续累计。进一步地,经审核人员审核后的审核样本作为已审核样本,随着
审核人员审核过程的推进,该审核人员的已审核样本也在不断累计。
审核样本的审核为止。通过系统预设审核样本的数量,使得审核样本的数量固定,从而无需
对审核样本的数量进行累计,减少计算量。
核的审核样本的数量;再如审核样本的数量取决于审核人员请求的数量,也就是审核样本
的数量非固定,而是根据审核人员请求的数量不断累计,如审核人员在审核完1000个审核
样本之后,此时又请求了100个审核样本,那么此时获取审核样本的数量为1100个。通过自
定义审核样本的数量,可以使得审核效率高的审核人员获取更多的审核样本进行审核,审
核效率低的审核人员获取较少的审核样本进行审核,从而可以合理地分配审核样本,提高
整体审核效率和审核质量。
审核人员进行审核,可以直接判断审核人员的审核结果是否正确,从而判断是否漏检。具体
的例如,测试样本是已经确定违规类型为“色情”的数据,而审核人员对该测试样本的审核
结果为“暴力”或未提交审核结果,那么此时可以判断审核人员对该测试样本的判断不正
确,可以视为漏检。
漏检率来说,可以不必在管理人员判断过程中再次引发争议,而是基于明确的答案进行判
断,并且可以根据测试样本的违规类型对审核人员的漏检率进行自动判断,从而可以大大
提高判断效率。
每个一级分类对应多个二级分类,每个二级分类又对应多个三个分类。其中,一级分类“严
重违规”对应多个二级分类,具体可以包括“情色内容”、“色情广告”、“严重涉政”、“违反法
律”等,进一步地,二级分类“违反法律”对应多个三级分类,具体可以包括“赌博”、“吸毒”
等。通过对样本库中的测试样本按照违规类型进行分类,可以方便管理样本库,并且可以针
对性地选取不同违规类型的测试样本对审核人员进行测试,例如可以对审核“赌博”类数据
的漏检率较高的审核人员,重点投放“赌博”类的测试样本,提高测试效率,也有利于提高审
核人员对自身审核能力较为薄弱的违规类型的审核准确率。
审核质量进行测试,从而实现有间隔的监控,提高监控的有效性和效率。在一些实施方式
中,测试样本投放数值区间的长度相同,在另一些实施方式中,测试样本投放数值区间的长
度也可以不相同。
值区间[50,100]对应审核样本的数量为50至100,也就是对应第50个审核样本至第100个审
核样本。在另一些实施方式中,审核样本的数量与测试样本投放数值区间上的数值可以不
完全相同,例如审核样本的数量1对应测试样本投放数值区间上的数值1000,进一步地,测
试样本投放数值区间[1050,1100]对应审核样本的数量为50至100,也就是对应第50个审核
样本至第100个审核样本。可以理解的是,审核样本的数量与测试样本投放数值区间上的数
值可以不完全相同,只需审核样本的数量与测试样本投放数值区间上的数值存在一一对应
的关系。
样本的投放数量,从而增加测试样本投放数值区间的数量,提高测试样本的投放密度。例如
对应审核样本的数量第1个至第100个,原测试样本的投放数量为2个,现测试样本的投放数
量增加为4 个,那么在审核人员审核100个审核样本的过程中从原来只需要接受2次测试提
高到需要接收4次测试,提高了测试的频率和密度,有利于及时对审核人员的审核质量实现
更细致的监控,可以及时发现问题。
样本而不是测试样本,保证审核人员的审核效率。其中,具体方法与上述增加投放数量的方
法大致相同,只是从增加改为减少,效果可见前述内容,故在此不再赘述。可以理解的是,通
过调整测试样本的投放数量,可以调整测试样本的投放密度,并且通过适宜的投放密度,可
以实现审核人员审核效率和管理人员监控效率之间的平衡,利于实现在保证审核人员审核
效率的同时,保证管理人员的监控效率和监控效果。
利于准确地投放测试样本。
值区间中的投放阈值,从而可以在间隔投放的基础上,增加测试样本的投放随机性,分散测
试位置,有利于对审核人员长期大量的审核实现有效监控,提高监控效率和监控效果。而不
会因为过于密集的投放,导致对一个时间段内进行了多次测试,而忽略了其他时间段可能
产生的审核差异性,影响监控效果。
具体的例如,在每个测试样本投放数值区间中选定第 1个数值作为投放阈值,测试样本投
放数值区间分别有[50,150]、[200,300] 以及[350,450],每个测试样本投放数值区间中的
投放阈值分别为50、200以及350,相当于间隔150个样本投放测试样本进行测试。从而通过
将每个测试样本投放数值区间的数值确定为投放阈值,可以间隔相同间隔投放测试样本,
周期性地测试审核人员的审核质量,提高监控效果。
从而可以在间隔投放的基础上,提高测试频率或测试密度。
以及420,那么当审核人员已审核样本的数量大于投放阈值100时,投放第一个测试样本,也
就是将第一个测试样本投放在第100 个以及第101个审核样本之间;审核人员已审核样本
的数量大于投放阈值233 时,投放第二个测试样本,也就是将第二个测试样本投放在第233
个以及第 234个审核样本之间;审核人员已审核样本的数量大于投放阈值233时,投放第三
个测试样本,也就是将第三个测试样本投放在第420个以及第421个审核样本之间。从而通
过投放阈值,可以确定测试样本的投放位置,并投放测试样本。
也可以是等于投放阈值的位置的附近,在此可以不作限定。
本,使得测试分散,有利于实现有效监控;通过确定每个测试样本投放数值区间中的投放阈
值,并当已审核样本的数量大于投放阈值时,投放测试样本,可以向审核人员审核的审核样
本中有间隔地随机投放测试样本,实现对审核人员的审核结果的实时测试,从而可以实时
监控审核人员的审核质量,提高监控效率的同时有利于提高审核质量。
包括以下步骤:
行设置。在一些实施方式中,审核人员的审核能力可以是由漏检率来考量,漏检率高的审核
人员的审核能力强,漏检率低的审核人员的审核能力弱。具体的,作为一种方式,根据一个
审核人员的审核能力进行设置,例如该审核人员的审核能力较弱,可以设置较高的投放数
量如7、 8、9等,而若该审核人员的审核能力较强,可以设置较低的投放数量如1、 2、3等。从
而根据审核人员的审核能力设置测试样本投放数量,可以对审核能力弱的审核人员多测
试,提高监控效果,对审核能力强的审核人员少测试,在相同时间内可以审核更多的审核样
本而非测试样本,提高审核效率。
投放权重。
人员,将投放数量“3”设置较大的投放权重如3,投放数量“2”的投放权重为2,投放数量“1”
的投放权重为1,使得较大的投放数量可以占更高的权重,从而对审核能力弱的审核人员可
以有更大概率投放较多的测试样本进行测试,提高对审核能力弱的审核人员的监控,有助
于提高审核质量。
权重,从而对审核能力强的审核人员可以有更大概率投放较少的测试样本进行测试,提高
审核能力强的审核人员的审核效率。
数量权重数值区间分别为[0,1),[1,3),[3,6), [6,10)。
大小。例如,投放数量“1”对应的投放权重为3、投放数量“2”对应的投放权重为1,那么投放
数量“1”对应的数量权重数值区间可以是[0,3),投放数量“2”对应的数量权重数值区间是
[3,4)。
选择数值。由于数量选择数值是随机生成的,因此数量选择数值为上述并集区间中的每一
个数值的概率相等,而投放数量的数量权重数值区间的长度越长,即投放数量的数量权重
数值区间包含的数值越多,则数量选择数值属于该投放数量的数量权重数值区间的概率就
越大。
如3,查找数量选择数值3所属的数量权重数值区间为[3,6),获取该区间对应的投放数量
“3”作为测试样本的投放数量,即测试样本的投放数量为3。
放数量。具体的,采用TreeMap算法构造树,如图5 所示,节点B为树的根节点,节点A以及节
点C为叶节点,节点D为父节点。以根节点为例,若查找的元素大于根节点,则在树的右边进
行搜索;若查找的元素小于根节点,则在树的左边进行搜索;若查找的元素等于根节点,则
直接返回根节点。
应数值3,叶节点A以及叶节点C分别对应数值1和数值6,父节点D对应数值10,从而构建如图
5所示的树,那么在区间[0,10)中生成数量选择数值如7时,可以通过如图5所示的树,首先
判断数量选择数值7大于根节点B,那么在树的右边继续查找,与父节点D进行比较,判断小
于父节点D,那么在树的左边继续查找,与叶节点C 进行比较,判断大于叶节点C,此时可以
数量选择数值所属的数量权重数值区间为[6,10),获取与数量权重数值区间对应的投放数
量“4”作为测试样本的投放数量。
审核的过程中投放测试样本进行测试。可以理解的是,当测试样本的投放数量一定时,监控
间隔越小,监控频率就越高,对审核人员的审核质量的监控也更细致,越有利于管理人员及
时地发现问题,并作相应处理以确保审核质量,避免大量返工。而当测试样本的投放数量一
定时,监控间隔越大,监控频率就越低,对审核人员的审核质量的监控也更宽松,可以减小
计算量,节约系统资源。
核能力较弱的审核人员在较短的间隔内就可以实现有效的测试。而针对审核能力较强的审
核人员,可以设置较大的监控间隔如2000,则当投放数量一定时,较大的监控间隔使得审核
能力较强的审核人员可以在相同时间内审核更多的审核样本,提高审核效率,同时减小管
理人员对审核能力较强的审核人员的监控频率,节约测试成本并有利于更严格地督促审核
能力较弱的审核人员,提高监控的灵活性和监控效率。
2000]的区间中心为1000。可以理解的是,通过计算测试样本投放数值区间的区间中心,可
以确定测试样本投放数值区间的中心位置。
述测试样本的投放数量,n∈N。
1个区间中心 即测试样本投放数值区间的区间中
心为500。
以及 即测试样本投放数值区间的
区间中心为250以及750。
为600,那么当区间中心为600,预设区间大小为±500,此时对应的测试样本投放数值区间
的下限数值为600‑500=100,上限数值为600+500=1100,即对应的测试样本投放数值区间
为[100,1100]。可以理解的是,根据预设区间大小可以确定测试样本投放数值区间的区间
大小,具体的,可以根据一个预设区间大小确定每个测试样本投放数值区间的区间大小,也
可以根据多个预设区间大小确定多个测试样本投放数值区间的区间大小。
为1000时,测试样本投放数值区间的数量等于测试样本的投放数量为1,那么在一个监控间
隔P内只有1个区间中心A1=500,那么当区间中心为500、预设区间大小为±80%,此时对应
的测试样本投放数值区间的下限数值为500‑500*80%=100,上限数值为500+500*80%=
900,即对应的测试样本投放数值区间为[100,900],即构建测试样本投放数值区间如图6中
的阴影区域。
监控间隔P内有2个区间中心 以及
此时对应的2个测试样本投放数值区间的下限数
值分别为250‑250*80%=50以及750‑ 750*80%=550,上限数值分别为250+250*80%=
450以及750+750*80%=950,即对应的3个测试样本投放数值区间分别为[50,450]以及
[550,950],分别对应图6中的2个阴影区域。
监控间隔P内有3个区间中心
以及
此时对应的3个测试样本投放数值区间的下限数
值分别为166‑ 166*80%≈33、500‑500*80%≈366以及833‑833*80%≈799,上限数值分别
为 166+166*80%≈298、500+500*80%≈633以及833+833*80%≈965,即对应的 3个测试
样本投放数值区间分别为[33,298]、[366,633]以及[799,965],分别对应图6中的3个阴影
区域。
数值对应审核样本的数量,例如测试样本投放数值区间[100,900],对应第100个审核样本
至第900个审核样本,并且测试样本投放数值区间中的数值与审核样本一一对应,也就是测
试样本投放数值区间中的数值100对应第100个审核样本,数值111对应第111个审核样本,
区间中心500对应第500个审核样本。如此,通过区间中心和预设区间大小可以确定测试样
本投放数值区间,并基于审核样本的数量可以设置测试样本投放数值区间,从而可以根据
测试样本投放数值区间确定审核样本的范围,在测试样本投放数值区间中选定一个数值A
可以对应第A个审核样本,有利于确定审核样本的具体位置,进而对具体位置进行具体操
作,在一些实施方式中,确定审核样本的具体位置后,可以对应该具体位置投放测试样本,
实现测试样本的精准投放。
[100,900]中生成随机数566,即投放阈值为566,对应第566个审核样本。从而通过投放阈值
可以随机地确定对应每个测试样本投放数值区间的审核样本的位置,并且通过在随机的位
置投放测试样本,可以增加测试样本的投放随机性,提高测试有效性。
级分类进行管理,具体的如表1所示,表1对样本库中测试样本的部分违规类型进行示意。其
中,一级分类可以包括“严重违规”、“一般违规”、“轻微违规”,一级分类“严重违规”对应的
二级分类可以包括“情色内容”、“色情广告”、“严重涉政”、“违反法律”等,进一步地,二级分
类“违反法律”对应的多个三级分类可以包括“赌博”、“吸毒”等。
可以对应三级分类设置测试样本的标识如“色情网页”、“赌博”以及“吸毒”等。通过获取测
试样本的标识,可以获取与测试样本的标识对应的测试样本的违规类型,从而可以针对性
地选取不同违规类型的测试样本对审核人员进行测试,例如可以对审核“赌博”类数据的漏
检率较高的审核人员,重点投放“赌博”类的测试样本,提高测试效率,也有利于提高审核人
员对自身审核能力较为薄弱的违规类型的审核准确率。
如“情色内容”,对应三级分类设置测试样本的标识如“色情网页”。那么可以针对不同级的
分类,对标识进行分级获取,也就是可以先获取一级分类的标识,然后在该一级分类的标识
下的二级分类中获取二级分类的标识,最后在该二级分类的标识下的三级分类中获取三级
分类的标识。从而可以分级获取,有利于对不同违规类型的测试样本进行灵活选择。
属于情色内容的测试样本的测试概率,从而可以灵活调整监控重点,在重点时期进行对敏
感违规类型进行重点监控,也有利于后期就重点违规类型的审核对审核人员进行培训。
程度,按照投放权重由高至低依次设置标识“严重违规”、“一般违规”以及“轻微违规”的投
放权重为9、2、1,从而使得严重程度较高的违规类型可以对应更高的权重,增加投放属于该
违规类型的测试样本的投放概率,提高对严重程度高的测试样本的监控强度,从而有利于
提高审核人员对严重程度高的违规类型的审核能力,使得在真实审核过程中,可以减小对
严重违规的直播数据的漏检率,增加平台对严重违规的直播数据的管控,减小违规内容对
社会和用户造成的不良影响。
权重,对于标识“吸毒”的漏检率较低时,可以对标识“吸毒”设置较小的投放权重。从而可以
对审核人员漏检率较高也就是审核能力较弱的违规类型设置更大的权重,增加投放该违规
类型的测试样本的概率,实现针对性地测试,提高测试效果,从而有利于管理人员及时监控
审核人员对该违规类型的审核质量,对审核人员的审核能力实现有效监控,便于后期培训。
以构建4个连续的数量权重数值区间分别为[0,1),[1,3),[3,6),[6,10)。
对应的投放权重为3,标识“色情网页”对应的投放权重为4。那么标识“赌博”对应的标识权
重数值区间可以是[0,1),标识“吸毒”对应的标识权重数值区间是[1,3),标识“穿着违规服
装”对应的标识权重数值区间可以是[3,6),标识“色情网页”对应的标识权重数值区间可以
是[6,10)。
上述方法大致相同,只是本实施方式根据不同级分类对标识权重数值区间进行了多次构
建,故在此不再赘述。可以理解的是,通过多次构建可以实现分级选择,从而在灵活选择不
同违规类型的测试样本的同时,还可以保证测试的随机性。
10)中生成数量选择数值如3,查找数量选择数值3所属的数量权重数值区间为[3,6),获取
该区间对应的标识“穿着违规服装”作为测试样本的标识,即测试样本的标识为“穿着违规
服装”。从而根据标识的投放权重设置标识权重数值区间,可以灵活设置对应不同标识的不
同违规类型的测试样本的投放权重,调整投放概率,实现有侧重点地投放,再通过生成随机
数来随机选择测试样本的标识进行投放,实现在限定投放概率的同时随机投放测试样本,
在实现有侧重点地投放的基础上增加了测试随机性,提高测试有效性进而提高管理人员的
监控效率。
数值、数量权重数值区间对应,故在此不再赘述。
的标识对应的测试样本。在不同的测试样本投放数值区间可以投放对应同一个测试样本的
标识的测试样本,也就是投放属于同一违规类型的测试样本,也可以投放对应不同测试样
本的标识的测试样本,也就是投放属于不同违规类型的测试样本,在此不做限定。
个测试样本的标识分别为“赌博”和“吸毒”。那么当审核人员审核完第100个审核样本时,投
放与第一个测试样本的标识对应的测试样本,也就是将与标识“赌博”对应的测试样本投放
在第100个以及第101个审核样本之间;当审核人员审核完第555个审核样本时,投放与标识
“吸毒”对应的测试样本,也就是将与第二个测试样本的标识对应的测试样本投放在第555
个以及第556个审核样本之间。需要说明的是,2个测试样本的标识可以相同,也可以不同。
如此,通过投放阈值,可以确定测试样本的投放位置,并投放与测试样本标识对应的测试样
本,从而可以精准投放属于相同或不同违规类型的测试样本。
违规类型做出正确审核,则可以判断审核人员对该测试样本漏检。具体的例如,测试样本是
已经确定违规类型为“色情”的数据,而审核人员对该测试样本的审核结果为“暴力”或未提
交审核结果,那么此时可以判断审核人员对该测试样本的判断不正确,可以视为漏检,而若
审核人员提交对该测试样本的审核结果为“色情”,也就是提交了正确的审核结果,在一些
实施方式中,当审核人员对测试样本提交了正确的审核结果时,可以计入一个提交量。
率越高,审核准确度就越高,对应的审核能力越强。
投放数量与提交量的差值占投放数量的比例,并且可以根据对应每个测试样本的标识的投
放数量以及提交量,计算对应每个测试样本的标识的漏检率。具体的例如,对审核人员进行
测试后,可以得到如表2所示的结果。从而可以监控审核人员对每个违规类型的审核质量,
方便管理人员通过分析后找出审核人员的业务薄弱点,进行后续的岗中专项培训,提高培
训效率,以及审核人员后续的审核能力。
警的质量预警阈值可以是相同的数值,也可以是不同的数值。
质量。从而可以及时提醒审核人员注意审核质量并作出改善,有利于自动调控审核人员的
审核质量。
提醒审核人员注意审核质量,或及时中断该审核人员的审核避免因该审核人员偏低的审核
质量造成大量返工。并且可以将审核人员当前加载的审核样本退回审核数据分发队列,使
得其他审核人员可以获取该审核人员当前加载的审核样本完成审核。从而方便管理人员及
时作出调整,实现对审核人员的审核质量的及时有效的监控,确保审核质量。
量。当审核人员的漏检率达到或超过第二质量预警阈值时,可以生成第二提示信息,向管理
人员发出提示,提示管理人员该审核人员的漏检率偏高,方便管理人员及时提醒审核人员,
或对该审核人员的审核任务进行调整如中断审核或退回重审等。其中,第一质量预警阈值
与第二质量预警阈值可以相等,也可以不相等。在一些实施方式中,第二质量预警阈值高于
第一质量预警阈值,也就是,根据审核人员的漏检率,可以先提醒审核人员注意调整,如若
提醒后仍无法控制漏检率,并继续增长至达到或超过第二质量预警阈值时,再提醒管理人
员需作出提醒或审核工作的调整。从而可以及时提醒审核人员注意审核质量,提供改善空
间,当无法改善时再提醒管理人员,可以在降低管理人员的工作量的同时方便管理人员及
时作出调整,实现对审核人员的审核质量的及时有效的监控,确保审核质量。
样本的位置的前后两张图片。具体的例如,测试样本的投放数量为1个,测试样本投放数值
区间为[50,450],并且每个测试样本投放数值区间中的投放阈值为100,获取1个测试样本
的标识为“赌博”。那么当已审核样本的数量大于投放阈值,即当审核人员审核完第100个审
核样本时,投放该测试样本,也就是将与标识“赌博”对应的测试样本投放在第 100个以及
第101个审核样本之间,此时获取当审核样本的数量达到投放阈值时对应的第一图片以及
在第一图片之后相邻的第二图片,也就是获取第 100个审核样本以及第101个审核样本。
系列符号的组合,例如图片标识“game‑201812190011”可以对应一张游戏图片,图片标识可
以在人工审核阶段之前的机器审核阶段由机器识别得到,具体的,通过机器识别图片Z为一
张游戏截图,可以为图片Z添加图片标识“game‑201812190011”,从而可以通过对比2张图片
之间的图片标识,判断2张图片是否属于一个图片类型,从而可以使得相同类型的图片放置
在一起,可以避免引起视觉不适,提高审核体验的同时,使审核人员不易察觉哪个是测试样
本,实现对真实审核环境的模拟,从而提高测试审核人员的审核质量的有效性。
本中,选择与第一图片或第二图片的图片类型相同的测试样本进行投放。其中当第一图片
和第二图片的图片类型不同时,可以选择与两张图片中的其中一张图片的图片类型相同的
测试样本进行投放。进一步地,作为一种方式,根据前述步骤中获取的测试样本的标识,可
以从对应测试样本的标识的测试样本中选择与第一图片或第二图片具有相同图片标识的
测试样本进行投放。使得在第一图片和第二图片之间投放测试样本时,审核人员不易发现
哪个是测试样本,从而实现对真实审核环境的模拟,提高测试审核人员的审核质量的有效
性。
表征不同的业务类型,例如在直播领域中,业务类型可以包括娱乐视频、交友视频、电商直
播等,不同业务类型对应不同的业务来源,例如通过电商直播的应用程序产生的图片对应
的业务标签为电商直播,通过游戏直播的应用程序产生的图片对应的业务标签为游戏直
播。不同的业务类型对应的业务标签不同,可以根据前后两张图片即第一图片和第二图片
的业务标签,在对应所获取的测试样本的标识的多个测试样本中,选择与第一图片或第二
图片的业务标签相同的测试样本进行投放。其中当第一图片和第二图片的业务标签不同
时,可以选择与两张图片中的其中一张图片的业务标签相同的测试样本进行投放。进一步
地,作为一种方式,根据前述步骤中获取的测试样本的标识,可以从对应测试样本的标识的
测试样本中选择与第一图片或第二图片具有相同业务标签的测试样本进行投放。使得在第
一图片和第二图片之间投放测试样本时,审核人员不易发现哪个是测试样本,实现对真实
审核环境的模拟,从而提高测试审核人员的审核质量的有效性。
之前,根据不同的业务来源会包含相应的业务标签,例如通过电商直播的应用程序产生的
图片对应的业务标签为电商直播,从而根据第一图片和第二图片的业务标签,可以选择与
第一图片或第二图片的业务标签相同的、同为电商直播的测试样本进行投放,使得相同业
务标签的图片放置在一起供审核人员进行审核,由于相同业务标签的图片之间比不同业务
标签的图片之间存在较小的差异,例如同为电商直播的图片中物品占比大于人像占比,而
同为交友直播的图片中人像占比大于物品占比,从而通过投放相同业务标签的测试样本,
可以有效减少审核人员在审核过程中的突兀感,实现对真实审核环境的模拟,使审核人员
不易察觉哪个是测试样本,从而提高测试审核人员的审核质量的有效性。
相同或相似,可以理解的是,通过调整要投放的测试样本的亮度和对比度,可以使得测试样
本投放入第一图片和第二图片之间时,亮度与对比度之间不会出现较大的变化,避免视觉
上的突兀感,提高审核体验的同时,使审核人员不易察觉哪个是测试样本,实现对真实审核
环境的模拟,从而提高测试审核人员的审核质量的有效性。
根据第一图片和第二图片的亮度和对比度,调整该测试样本的亮度和对比度,使得测试样
本的亮度和对比度与其前后两张图片的亮度和对比度相同或相似,避免视觉上的突兀感,
提高审核体验的同时,使审核人员不易察觉哪个是测试样本,实现对真实审核环境的模拟,
从而提高测试审核人员的审核质量的有效性。
过设置数值区间获取测试样本的标识,在审核人员的审核过程中投放不同测试样本的标识
的测试样本进行测试,从而可以针对性地选取不同违规类型的测试样本对审核人员进行测
试,有利于提高审核人员对自身审核能力较为薄弱的违规类型的审核准确率,方便管理人
员实时监控审核质量,通过统计测试结果,可以自动评估审核人员的审核能力,实时反馈测
试结果,同时测试结果还可用于对审核人员进行后期培训提供数据参考,有利于提高培训
效率。通过编辑测试样本还可以模拟真实审核环境进行投放,提高测试审核人员的审核质
量的有效性。相较于现有技术,本方法可以实现模拟真实审核环境的投放,提高测试有效
性,并对审核人员的审核质量可以实现自动测试和实时反馈测试结果,从而方便管理人员
实时监控审核质量,大幅度节约审核质量监控过程的人力成本消耗,并且方便管理人员管
理以及对审核人员进行后期培训,进一步提高审核质量。
些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图3和图4中
的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在
同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必
然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或
者交替地执行。
获取模块920、区间设置模块930、阈值确定模块940以及投放模块950,其中:
获取模块、测试样本编辑模块以及测试结果统计模块,其中:
投放数量。
或其它的形式。
块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
备。本申请中的电子设备1000可以包括一个或多个如下部件:处理器1010、存储器1020以及
一个或多个应用程序,其中一个或多个应用程序可以被存储在存储器1020中并被配置为由
一个或多个处理器1010执行,一个或多个程序配置用于执行如前述方法实施例所描述的方
法。
集或指令集,以及调用存储在存储器1020内的数据,执行电子设备1000的各种功能和处理
数据。可选地,处理器1010 可以采用数字信号处理(Digital Signal Processing,DSP)、现
场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列
(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器1010可集成中央
处理器(Central Processing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)
和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程
序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,
上述调制解调器也可以不集成到处理器1010中,单独通过一块通信芯片进行实现。
储器1020可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的
指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用
于实现下述各个方法实施例的指令等。存储数据区还可以存储电子设备1000在使用中所创
建的数据(比如电话本、音视频数据、聊天记录数据)等。
以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
上述方法实施例中所描述的方法。
时性计算机可读介质(non‑transitory computer‑ readable storage medium)。计算机可
读取存储介质1100具有执行上述方法中的任何方法步骤的程序代码1110的存储空间。这些
程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机
程序产品中。程序代码1110可以例如以适当形式进行压缩。
放数值区间,其中,测试样本投放数值区间的数量等于测试样本的投放数量,最后确定每个
测试样本投放数值区间中的投放阈值,并当已审核样本的数量大于投放阈值时,投放测试
样本。本申请通过向审核人员审核的审核样本中随机投放测试样本,实现对审核人员的审
核结果的实时测试,从而实时监控审核人员的审核质量,提高监控效率的同时有利于提高
审核质量。
对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而
这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和
范围。