一种模糊测试方法、装置、电子设备以及存储介质转让专利

申请号 : CN202211719523.2

文献号 : CN115905021B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 柴园园高振鹏胡建勋胡庆格

申请人 : 长春吉大正元信息技术股份有限公司深圳正元星捷信息科技有限公司中科信息安全共性技术国家工程研究中心有限公司

摘要 :

本发明公开了一种模糊测试方法、装置、电子设备以及存储介质。该方法包括:获取初始样本集合、至少两个候选变异方法以及至少两个变异位置;根据各候选变异方法以及各变异位置,对所述初始样本集合中的各初始样本进行一次变异,得到模糊数据;根据所述模糊数据以及待测试程序,确定目标变异方法以及目标变异位置区间;根据所述目标变异方法以及所述目标变异位置区间,对所述待测试程序进行模糊测试。使用本发明的技术方案,可以减少变异的随机性,提高模糊数据的有效性,从而提高模糊测试的效率。

权利要求 :

1.一种模糊测试方法,其特征在于,包括:

获取初始样本集合、至少两个候选变异方法以及至少两个变异位置;

根据各候选变异方法以及各变异位置,对所述初始样本集合中的各初始样本进行一次变异,得到模糊数据;

根据所述模糊数据以及待测试程序,确定目标变异方法以及目标变异位置区间;

根据所述目标变异方法以及所述目标变异位置区间,对所述待测试程序进行模糊测试;

所述根据所述模糊数据以及待测试程序,确定目标变异方法以及目标变异位置区间,包括:根据各初始样本和待测试程序进行模糊测试,得到与各初始样本匹配的初始程序覆盖率;

根据所述模糊数据和待测试程序进行模糊测试,得到与各模糊数据匹配的模糊程序覆盖率;

根据各初始程序覆盖率以及各模糊程序覆盖率,确定目标变异方法以及目标变异位置区间;

所述根据各初始程序覆盖率以及各模糊程序覆盖率,确定目标变异方法以及目标变异位置区间,包括:获取至少两个预设变异位置区间,其中,所述预设变异位置区间为根据各初始样本的样本大小而确定;

若确定与预设变异位置区间匹配的各模糊数据中,存在模糊程序覆盖率大于初始程序覆盖率的目标模糊数据,则将预设变异位置区间作为目标变异位置区间;

将与各目标模糊数据匹配的候选变异方法作为目标变异方法;

在所述确定所述目标变异方法以及所述目标变异位置区间之后,还包括对所述目标变异位置区间进行缩小或扩充;

根据各候选变异方法以及各变异位置,对所述初始样本集合中的各初始样本进行一次变异,得到模糊数据,包括:根据第一候选变异方法,对所述初始样本集合中的各初始样本的第一变异位置处进行一次变异;

重复执行对所述初始样本集合中的各初始样本的第一变异位置处进行一次变异的操作,直至完成对全部变异位置的变异;

重复执行根据第一候选变异方法,对所述初始样本集合中的各初始样本的第一变异位置处进行一次变异的操作,直至完成对全部变异方法的处理;

根据所述目标变异方法以及所述目标变异位置区间,对所述待测试程序进行模糊测试,包括:确定各目标变异方法的权重,并根据各目标变异方法的权重,对各目标变异方法进行排序;

根据各目标变异方法的排序结果,确定对所述待测试程序进行模糊测试所需的目标变异方法;

确定进行模糊测试所需的各目标变异方法对应的目标变异位置区间;

根据进行模糊测试所需的各目标变异方法以及其对应的目标变异位置区间,生成模糊数据,并对所述待测试程序进行模糊测试。

2.根据权利要求1所述的方法,其特征在于,确定各目标变异方法的权重,包括:确定各目标变异方法对应的目标模糊数据的数量,以及,对各目标变异位置区间,分别确定对应的目标模糊数据数量最多的目标变异方法;

根据各目标变异方法对应的目标模糊数据的数量,以及各目标变异位置区间对应的目标模糊数据数量最多的目标变异方法,确定各目标变异方法的权重。

3.根据权利要求1所述的方法,其特征在于,在对所述待测试程序进行模糊测试之后,还包括:若确定满足变异方法更新条件,则重新根据各候选变异方法以及各变异位置,确定目标变异方法以及目标变异位置区间;

根据重新确定的目标变异方法以及目标变异位置区间,对待测试程序进行模糊测试。

4.一种模糊测试装置,其特征在于,包括:

数据获取模块,用于获取初始样本集合、至少两个候选变异方法以及至少两个变异位置;

模糊数据生成模块,用于根据各候选变异方法以及各变异位置,对所述初始样本集合中的各初始样本进行一次变异,得到模糊数据;

目标变异信息确定模块,用于根据所述模糊数据以及待测试程序,确定目标变异方法以及目标变异位置区间;

模糊测试模块,用于根据所述目标变异方法以及所述目标变异位置区间,对所述待测试程序进行模糊测试;

所述目标变异信息确定模块,还包括:

初始程序覆盖率确定单元,用于根据各初始样本和待测试程序进行模糊测试,得到与各初始样本匹配的初始程序覆盖率;

模糊程序覆盖率确定单元,用于根据所述模糊数据和待测试程序进行模糊测试,得到与各模糊数据匹配的模糊程序覆盖率;

目标变异信息确定单元,用于根据各初始程序覆盖率以及各模糊程序覆盖率,确定目标变异方法以及目标变异位置区间;

所述目标变异信息确定单元,具体用于:

获取至少两个预设变异位置区间,其中,所述预设变异位置区间为根据各初始样本的样本大小而确定;

若确定与预设变异位置区间匹配的各模糊数据中,存在模糊程序覆盖率大于初始程序覆盖率的目标模糊数据,则将预设变异位置区间作为目标变异位置区间;

将与各目标模糊数据匹配的候选变异方法作为目标变异方法;

在所述确定所述目标变异方法以及所述目标变异位置区间之后,还包括对所述目标变异位置区间进行缩小或扩充;

所述模糊数据生成模块,还包括:

变异单元,用于根据第一候选变异方法,对所述初始样本集合中的各初始样本的第一变异位置处进行一次变异;

变异位置迭代单元,用于重复执行对所述初始样本集合中的各初始样本的第一变异位置处进行一次变异的操作,直至完成对全部变异位置的变异;

变异方法迭代单元,用于重复执行根据第一候选变异方法,对所述初始样本集合中的各初始样本的第一变异位置处进行一次变异的操作,直至完成对全部变异方法的处理;

所述模糊测试模块,还包括:

权重确定单元,用于确定各目标变异方法的权重,并根据各目标变异方法的权重,对各目标变异方法进行排序;

目标变异方法确定单元,用于根据各目标变异方法的排序结果,确定对所述待测试程序进行模糊测试所需的目标变异方法;

目标变异位置区间确定单元,用于确定进行模糊测试所需的各目标变异方法对应的目标变异位置区间;

模糊测试单元,用于根据进行模糊测试所需的各目标变异方法以及其对应的目标变异位置区间,生成模糊数据,并对所述待测试程序进行模糊测试。

5.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1‑3中任一所述的模糊测试方法。

6.一种存储计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1‑3中任一所述的模糊测试方法。

说明书 :

一种模糊测试方法、装置、电子设备以及存储介质

技术领域

[0001] 本发明涉及信息安全技术领域,尤其涉及一种模糊测试方法、装置、电子设备以及存储介质。

背景技术

[0002] 模糊测试是自动或半自动的生成随机数据输入到一个程序中,并监视程序异常,如崩溃,断言(assertion)失败,以发现可能的程序错误。模糊数据的生成是模糊测试中的关键一环,通常在对一个待测试程序进行模糊测试前,会设定一个初始样本集合,对初始样本进行一定次数的变异迭代,得到模糊数据。每一次变异随机选择变异算法和变异位置,通过变异算法作用于样本的变异位置。
[0003] 但是,在模糊数据的生成过程中,并不是每次变异都是有效的,通过变异生成的模糊数据中仅有少数部分能够覆盖目标程序的生成逻辑。同时,由于变异过于随机,变异的效率低下,从而导致模糊测试的效率较低。

发明内容

[0004] 本发明提供了一种模糊测试方法、装置、电子设备以及存储介质,以实现减少变异的随机性,提高模糊数据的有效性,从而提高模糊测试的效率。
[0005] 第一方面,本发明实施例提供了一种模糊测试方法,该方法包括:
[0006] 获取初始样本集合、至少两个候选变异方法以及至少两个变异位置;
[0007] 根据各候选变异方法以及各变异位置,对所述初始样本集合中的各初始样本进行一次变异,得到模糊数据;
[0008] 根据所述模糊数据以及待测试程序,确定目标变异方法以及目标变异位置区间;
[0009] 根据所述目标变异方法以及所述目标变异位置区间,对所述待测试程序进行模糊测试。
[0010] 第二方面,本发明实施例还提供了一种模糊测试装置,该装置包括:
[0011] 数据获取模块,用于获取初始样本集合、至少两个候选变异方法以及至少两个变异位置;
[0012] 模糊数据生成模块,用于根据各候选变异方法以及各变异位置,对所述初始样本集合中的各初始样本进行一次变异,得到模糊数据;
[0013] 目标变异信息确定模块,用于根据所述模糊数据以及待测试程序,确定目标变异方法以及目标变异位置区间;
[0014] 模糊测试模块,用于根据所述目标变异方法以及所述目标变异位置区间,对所述待测试程序进行模糊测试。
[0015] 第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例中任一所述的模糊测试方法。
[0016] 第四方面,本发明实施例还提供了一种存储计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明实施例中任一所述的模糊测试方法。
[0017] 本发明实施例的技术方案,通过对初始样本集合中的初始样本,根据多个候选变异方法和变异位置,进行一次变异,得到模糊数据,根据模糊数据对待测试程序进行模糊测试,得到有效的目标变异方法和目标变异位置区间,根据目标变异方法和目标变异位置区间对待测试程序进行最终的模糊测试。解决了现有技术中的模糊测试方法中,变异较为随机,变异的效率低下,从而导致模糊测试的效率较低的问题,减少了变异的随机性,提高了模糊数据的有效性,从而提高模糊测试的效率。
[0018] 应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。

附图说明

[0019] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020] 图1是本发明实施例一提供的一种模糊测试方法的流程图;
[0021] 图2是本发明实施例二提供的一种模糊测试方法的流程图;
[0022] 图3是本发明实施例三提供的一种模糊测试装置的结构示意图;
[0023] 图4是本发明实施例四提供的一种电子设备的结构示意图。

具体实施方式

[0024] 为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0025] 需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0026] 实施例一
[0027] 图1为本发明实施例一提供了一种模糊测试方法的流程图,本实施例可适用于在模糊测试之前确定有效的变异方法以及变异位置区间的情况,该方法可以由模糊测试装置来执行,该模糊测试装置可以采用硬件和/或软件的形式实现,该模糊测试装置可配置于电子设备或者服务器中。
[0028] 如图1所示,该方法包括:
[0029] S110、获取初始样本集合、至少两个候选变异方法以及至少两个变异位置。
[0030] 初始样本集合是多个初始样本组成的集合,初始样本可以是字符、数字、字母,或者其中几种的组合,本实施例对初始样本的数量和类型不进行限制。模糊测试的基本思想是发送大量随机的或经过变异的输入给待测试程序,以期望触发错误条件或引起故障。因此,在模糊测试之前,需要对初始样本集合中的各初始样本进行变异,变异后的数据以及初始样本作为模糊数据,输入模糊测试器中。
[0031] 变异是指对初始样本进行小的更改,这些更改可能仍使模糊测试的输入保持有效,同时也可能对模糊测试的结果有新的影响。候选变异方法可以是任意一个变异方法,示例性的,候选变异方法可以包括替换型变异方法、插入型变异方法以及删除型变异方法,例如,替换型变异方法可以是反转变异法、抽象语法树变异法、字典变异法等,本实施例对候选变异方法的数量以及具体类型不进行限制。
[0032] 变异位置是指变异方法作用于初始样本中的具体的位置,单位为字节。变异位置可以随机选择,也可以按照从前到后的顺序依次选择,还可以根据模糊测试的预处理阶段得到的数据或者模糊测试迭代过程中得到的数据进行确定,本实施例对变异位置的确定方式不进行限制。
[0033] S120、根据各候选变异方法以及各变异位置,对所述初始样本集合中的各初始样本进行一次变异,得到模糊数据。
[0034] 在本实施例中,对所述初始样本集合中的各初始样本,根据不同的候选变异方法以及不同的变异位置进行变异,生成模糊数据。由于并不是所有的变异都是有效变异,因此需要采用不同的候选变异方法以及不同的变异位置对初始样本进行处理,从而筛选出有效变异的变异方法和变异位置。
[0035] 同时,由于现有技术中的变异方式,是随机生成初始样本的变异迭代次数,在每一次迭代中,随机选择一种变异方法,以及变异方法所需的变异位置。因此,根据现有技术的变异方式,在一个模糊数据的生成过程中,经历过每次迭代的变异方法和变异位置可能都是不相同的,即使该模糊数据是有效的模糊数据,也无法确定迭代过程中的哪个变异方法或者变异位置是有效的。因此,本实施例中,对初始样本只进行一次变异,也即,在一个模糊数据的生成过程中,只经过了一次变异方法和变异位置的处理。这样设置便于后续准确的筛选出有效变异方法及变异位置。
[0036] 可选的,S120又可以通过以下步骤实现:
[0037] A1、根据第一候选变异方法,对所述初始样本集合中的各初始样本的第一变异位置处进行一次变异。
[0038] 具体的,可以通过先进先出原则维护一张变异方法列表,取表头的候选变异方法作为第一候选变异方法。通过第一候选变异方法对各初始样本进行变异时,变异位置可以是随机生成的,也可以是从前到后依次取得某位置。示例性的,当初始样本共100个时,随机生成一个变异位置,取候选变异方法A对100个初始样本的变异位置处进行变异。
[0039] A2、重复执行对所述初始样本集合中的各初始样本的第一变异位置处进行一次变异的操作,直至完成对全部变异位置的变异。
[0040] 以上述示例为例,可以共随机生成100个变异位置,也即,随机生成一个变异位置,取候选变异方法A对100个初始样本的变异位置处进行变异,重复上述过程共100轮,得到根据第一候选变异方法以及全部变异位置对各初始样本进行变异后的数据。
[0041] 需要进行说明的是,由于各初始样本的样本大小可能不相同,因此,在变异位置大于初始样本的样本大小时,不再对该初始样本进行变异。例如,初始样本的大小由2MB‑10MB,若随机位置为3MB,则对样本大小为3MB以下的初始样本不再进行变异。
[0042] A3、重复执行根据第一候选变异方法,对所述初始样本集合中的各初始样本的第一变异位置处进行一次变异的操作,直至完成对全部变异方法的处理。
[0043] 在本实施例中,得到根据第一候选变异方法以及全部变异位置对各初始样本进行变异后的数据之后,继续根据下一候选变异方法以及各变异位置对各初始样本进行变异,直至完成对全部变异方法的处理。
[0044] S130、根据所述模糊数据以及待测试程序,确定目标变异方法以及目标变异位置区间。
[0045] 在本实施例中,将模糊数据输入至模糊测试器,对待测试程序进行模糊测试,根据模糊测试结果,在各个候选变异方法中筛选出有效的目标变异方法以及目标变异位置区间。
[0046] 本实施例中可以以待测试程序的程序覆盖率为依据,在各个候选变异方法中筛选出有效的目标变异方法以及目标变异位置区间。具体的,将各模糊数据输入模糊测试器,得到模糊测试器对待测试程序进行模糊测试输出的结果,从而可以确定各模糊数据对待测试程序的程序覆盖率。程序覆盖率是指在模糊测试过程中,被执行到的代码占待测试程序总代码的比例。程序覆盖率可以用来衡量模糊测试效果的好坏,可以理解的,被执行到的代码比重越高,找到待测试程序中的bug的概率越大,因此,程序覆盖率越高,模糊测试效果越好。
[0047] 在一个可选的实施例中,可以对各模糊数据对应的程序覆盖率按照从高到低的顺序进行排序,取前预设数量个模糊数据,将其对应的候选变异方法作为目标变异方法。统计前预设数量个模糊数据对应的各目标变异方法,并对各目标变异方法,分别根据对应的变异位置,确定目标变异位置区间。示例性的,可以取程序覆盖率排名前50个模糊数据,其中10个模糊数据对应候选变异方法A、20个数据对应候选变异方法B、20个数据对应候选变异方法C,则将变异方法A、变异方法B以及变异方法C作为目标变异方。对于对应候选变异方法A的10个模糊数据,其变异位置包括2MB、2.1MB以及2.2MB,因此候选变异方法A对应的目标变异位置区间是2‑2.2MB。
[0048] 可选的,S130还可以通过以下步骤实现:
[0049] B1、根据各初始样本和待测试程序进行模糊测试,得到与各初始样本匹配的初始程序覆盖率。
[0050] B2、根据所述模糊数据和待测试程序进行模糊测试,得到与各模糊数据匹配的模糊程序覆盖率。
[0051] B3、根据各初始程序覆盖率以及各模糊程序覆盖率,确定目标变异方法以及目标变异位置区间。
[0052] 在本实施例中,确定某候选变异方法是否是有效的变异方法,是通过变异后的模糊数据相比于变异前的初始样本,是否使待测试程序的程序覆盖率提高来确定的。具体的,如果变异后的模糊数据对应的模糊程序覆盖率高于变异前的初始样本对应的初始程序覆盖率,则确定变异采用的候选变异方法是有效的变异方法。如果变异后的模糊数据对应的模糊程序覆盖率低于或者等于变异前的初始样本对应的初始程序覆盖率,则确定变异采用的候选变异方法是无效的变异方法,后续进行模糊测试时,不再采用该变异方法生成模糊数据。
[0053] S140、根据所述目标变异方法以及所述目标变异位置区间,对所述待测试程序进行模糊测试。
[0054] 在候选变异方法中确定出有效的目标变异方法,以及确定了与目标变异方法对应的目标变异位置区间之后,在后续的模糊测试过程中,仅根据有效的目标变异方法以及目标变异位置区间生成模糊数据,能够限制变异的随机性,保证模糊数据的有效性,提高模糊测试的效率。
[0055] 进一步的,确定了有效的目标变异方法以及其对应的目标变异位置区间之后,在进行模糊测试时,可以仅对初始样本进行一次变异,也可以进行多次变异。在进行多次变异时,可以预先生成随机数,作为变异迭代次数,也可以根据经验值,或者根据模糊测试迭代过程中产生的数据,设定变异迭代次数。
[0056] 本发明实施例的技术方案,通过对初始样本集合中的初始样本,根据多个候选变异方法和变异位置,进行一次变异,得到模糊数据,根据模糊数据对待测试程序进行模糊测试,得到有效的目标变异方法和目标变异位置区间,根据目标变异方法和目标变异位置区间对待测试程序进行最终的模糊测试。解决了现有技术中的模糊测试方法中,变异较为随机,变异的效率低下,从而导致模糊测试的效率较低的问题,减少了变异的随机性,提高了模糊数据的有效性,从而提高模糊测试的效率。
[0057] 可选的,在对所述待测试程序进行模糊测试之后,还包括:若确定满足变异方法更新条件,则重新根据各候选变异方法以及各变异位置,确定目标变异方法以及目标变异位置区间;根据重新确定的目标变异方法以及目标变异位置区间,对待测试程序进行模糊测试。
[0058] 其中,满足变异方法更新条件,可以是待测试程序存在更新,或者,每隔预设时间间隔,或者,当对待测试程序进行模糊测试,模糊数据为根据初始样本一次变异得到时,收集到的模糊数据和/或模糊测试结果达到一定数量。本实施例对变异方法更新条件的具体内容不进行限制。
[0059] 在本实施例中,根据有效的目标变异方法以及目标变异位置区间生成模糊数据,能够很大程度上限制变异的随机性。但是,当待测试程序更新时,当前确定的有效的目标变异方法以及目标变异位置区间对更新后的待测试程序不一定能够很好的适用。同时,在一段时间内除对候选变异方法和候选变异位置进行分析,得到的目标变异方法以及目标变异位置区间之外,其他候选变异方法以及候选变异位置也有可能对待测试程序产生新的有效变异。因此,本实施例每满足一次变异方法更新条件,则重新确定有效的目标变异方法以及目标变异位置区间,并采用新的确定的目标变异方法以及目标变异位置区间进行模糊测试。
[0060] 本实施例的技术方案,在避免了变异随机性的同时,能够进行变异方法的演进,避免了有效变异位置以及有效变异方法的改变对测试的影响。
[0061] 实施例二
[0062] 图2为本发明实施例二提供的一种模糊测试方法的流程图,本发明实施例在上述实施例的基础上,对初始样本变异的过程、确定目标变异方法以及目标变异位置区间的过程,以及对待测试程序进行模糊测试的过程进行了进一步的具体化,并加入了目标变异方法和目标变异位置区间自演进的步骤。
[0063] 如图2所示,该方法包括:
[0064] S210、获取初始样本集合、至少两个候选变异方法以及至少两个变异位置。
[0065] S220、根据第一候选变异方法,对所述初始样本集合中的各初始样本的第一变异位置处进行一次变异。
[0066] S230、重复执行对所述初始样本集合中的各初始样本的第一变异位置处进行一次变异的操作,直至完成对全部变异位置的变异。
[0067] S240、重复执行根据第一候选变异方法,对所述初始样本集合中的各初始样本的第一变异位置处进行一次变异的操作,直至完成对全部变异方法的处理。
[0068] 其中,根据各候选变异方法以及各变异位置,对初始样本集合中的各初始样本进行一次变异,得到各模糊数据的过程已在上述实施例中进行了说明,本实施例在此不再赘述。
[0069] S250、根据各初始样本和待测试程序进行模糊测试,得到与各初始样本匹配的初始程序覆盖率。
[0070] S260、根据所述模糊数据和待测试程序进行模糊测试,得到与各模糊数据匹配的模糊程序覆盖率。
[0071] S270、根据各初始程序覆盖率以及各模糊程序覆盖率,确定目标变异方法以及目标变异位置区间。
[0072] 其中,分别计算变异后的模糊数据对应的模糊程序覆盖率,以及变异前的初始样本对应的初始程序覆盖率,并通过比较模糊程序覆盖率和初始程序覆盖率,筛选有效的目标变异方法以及目标变异位置区间的过程已在上述实施例中进行了说明,本实施例在此不再赘述。
[0073] 可选的,S270又可以通过以下步骤实现:
[0074] C1、获取至少两个预设变异位置区间。
[0075] 其中,所述预设变异位置区间为根据各初始样本的样本大小而确定。
[0076] 示例性的,以各初始样本的样本大小为2‑10MB为例,可以预先设定0‑2MB、2‑4MB、4‑6MB、6‑8MB以及8‑10MB五个变异位置区间。但是,本实施例对预设变异位置区间的数量、大小以及具体的设定方式不进行限制。
[0077] C2、若确定与预设变异位置区间匹配的各模糊数据中,存在模糊程序覆盖率大于初始程序覆盖率的目标模糊数据,则将预设变异位置区间作为目标变异位置区间。
[0078] 与预设变异位置区间匹配的各模糊数据是指至少一个候选变异方法作用的变异位置在预设变异位置区间内时,采用该候选变异方法以及该变异位置对初始样本进行一次变异得到的模糊数据。
[0079] 在本实施例中,对于与预设变异位置区间匹配的各模糊数据,只要存在至少一个模糊程序覆盖率大于初始程序覆盖率的目标模糊数据,就将该预设变异位置区间作为目标变异位置区间。
[0080] C3、将与各目标模糊数据匹配的候选变异方法作为目标变异方法。
[0081] 在本实施例中,生成模糊程序覆盖率大于初始程序覆盖率的目标模糊数据所采用的候选变异方法,即为目标变异方法。
[0082] 本实施例的技术方案,能够高效的根据众多变异位置,分析出变异效果较好的变异位置区间,以及筛选出有效的变异方法。
[0083] S280、确定各目标变异方法的权重,并根据各目标变异方法的权重,对各目标变异方法进行排序。
[0084] 在本实施例中,筛选得到有效的目标变异方法以及目标变异位置区间之后,需要将目标变异方法以及目标变异位置区间进行进一步的调整,再应用到后续的模糊测试中。
[0085] 在本实施例中,计算得到各目标变异方法的权重,并根据权重对目标变异方法进行排序,便于后续模糊测试时,对目标变异方法进行选择。
[0086] 相应的,S280又可以通过以下步骤实现:
[0087] D1、确定各目标变异方法对应的目标模糊数据的数量,以及,对各目标变异位置区间,分别确定对应的目标模糊数据数量最多的目标变异方法。
[0088] 其中,目标变异方法对应的目标模糊数据的数量越多,表示目标变异方法的适用性越好,目标变异方法对不同初始样本进行变异后得到的模糊数据中,有效模糊数据的概率越高。
[0089] 对于在目标变异位置区间中对应的目标模糊数据数量最多的目标变异方法,表明该目标变异方法在该目标变异位置区间中得到的有效模糊数据更集中。
[0090] D2、根据各目标变异方法对应的目标模糊数据的数量,以及各目标变异位置区间对应的目标模糊数据数量最多的目标变异方法,确定各目标变异方法的权重。
[0091] 在本实施例中,综合考虑各目标变异方法对应的目标模糊数据的数量,以及各目标变异方法是否是各目标变异位置区间对应的目标模糊数据数量最多的目标变异方法,确定各目标变异方法的权重。
[0092] 具体的,将目标模糊数据的数量作为第一指标,将是否是各目标变异位置区间对应的目标模糊数据数量最多的目标变异方法作为第二指标,并分别确定第一指标的权重和第二指标的权重,第一指标的权重和第二指标的权重相加为1,本实施例对第一指标和第二指标分别的权重大小,以及权重的确定方式不进行限制。将第一指标的指标值和权重的乘积,与第二指标的指标值和权重的乘积之和,作为目标变异方法的权重。
[0093] 进一步的,对于第一指标的指标值的确定:可以直接将各目标变异方法对应的目标模糊数据的数量作为第一指标的指标值,也可以对各目标变异方法对应的目标模糊数据的数量进行归一化处理,将归一化后的数值作为指标值,还可以预设不同的数量区间,不同的数量区间对应不同的指标值,根据目标变异方法对应的目标模糊数据的数量所在的数量区间,确定目标变异方法的第一指标的指标值。
[0094] 对于第二指标的指标值的确定:当某目标变异方法不是各目标变异位置区间对应的目标模糊数据数量最多的目标变异方法时,可以将其第二指标的指标值确定为0。当某目标变异方法是某一个或几个目标变异位置区间对应的目标模糊数据数量最多的目标变异方法时,可以根据上述目标变异位置区间的数量,确定第二指标的指标值。具体的,当对应的目标变异位置区间的数量是1时,也即该目标变异方法是某一目标变异位置区间对应的目标模糊数据数量最多的目标变异方法时,可以将其第二指标的指标值确定为1。当对应的目标变异位置区间的数量是多个时,可以直接将对应的目标变异位置区间的数量作为第二指标的指标值,也可以预设不同的数量区间,不同的数量区间对应不同的指标值,根据目标变异方法对应的目标变异位置区间的数量所在的数量区间,确定目标变异方法的第二指标的指标值。
[0095] 需要进行说明的是,本实施例对第一指标和第二指标的指标值的确定方式不进行限制。
[0096] S290、根据各目标变异方法的排序结果,确定对所述待测试程序进行模糊测试所需的目标变异方法。
[0097] 在本实施例中,对各目标变异方法,按照其权重由高到低的顺序进行排序,可以取前预设数量个目标变异方法进行模糊测试,也可以取全部目标变异方法进行模糊测试,本实施例对此不进行限制。
[0098] 进一步的,预设数量可以根据目标变异方法的总数与预设比例的乘积进行确定,例如,可以预先设置比例为80%,当目标变异方法共10个时,取权重最高的前8个目标变异方法进行模糊测试。预设数量也可以根据经验值或者待测试程序模糊测试的实际需要进行灵活设置,本实施例对预设数量的确定方式不进行限制。
[0099] S2100、确定进行模糊测试所需的各目标变异方法对应的目标变异位置区间。
[0100] 在本实施例中,确定了进行模糊测试所需的目标变异方法之后,对模糊测试所需的各目标变异方法,分别确定其存在有效模糊数据对应的目标变异位置区间。示例性的,若目标变异方法S对应的有效模糊数据的变异位置分布在4‑6MB、6‑8MB以及8‑10MB时,4‑6MB、6‑8MB以及8‑10MB是目标变异方法S对应的目标变异位置区间。
[0101] 进一步的,确定了进行模糊测试所需的目标变异方法对应的目标变异位置区间之后,可以对目标变异位置区间进行进一步的调整。
[0102] 具体的,可以根据目标变异位置区间内,有效模糊数据(也即模糊程序覆盖率大于初始程序覆盖率的目标模糊数据)对应的变异位置的分布情况,对目标变异位置区间进行进一步的缩小。示例性的,对于目标变异位置区间4‑6MB,若有效模糊数据对应的变异位置集中分布在5‑6MB中,可以将目标变异位置区间4‑6MB缩小至5‑6MB,或者,根据预设缩小比例对目标变异位置区间进行缩小,本实施例对预设缩小比例的具体数值以及确定方式不进行限制。这样设置的好处在于,能够进一步限制变异的随机性,提高模糊数据的有效性。
[0103] 考虑到在进行模糊测试过程中,有效的变异位置可能会发生变化,因此,还可以对目标变异位置区间进行适当扩充。示例性的,可以将目标变异位置区间扩充为原区间大小的120%,当目标变异位置区间为4‑6MB时,可以将其扩充为3.8‑6.2MB。这样设置的好处在于,可以减少测试过程中有效变异位置变化对模糊数据的有效性以及模糊测试结果的影响。
[0104] S2110、根据进行模糊测试所需的各目标变异方法以及其对应的目标变异位置区间,生成模糊数据,并对所述待测试程序进行模糊测试。
[0105] 在本实施例中,确定了进行模糊测试所需的目标变异方法,以及目标变异方法进行模糊测试所对应的目标变异位置区间之后,根据各目标变异方法及其对应的目标变异位置区间对初始样本进行变异,得到模糊数据。模糊数据作为模糊测试器的输入,对待测试程序进行模糊测试。
[0106] 实施例三
[0107] 图3为本发明实施例三提供的一种模糊测试装置的结构示意图。如图3所示,该装置包括:数据获取模块310、模糊数据生成模块320、目标变异信息确定模块330以及模糊测试模块340。其中:
[0108] 数据获取模块310,用于获取初始样本集合、至少两个候选变异方法以及至少两个变异位置;
[0109] 模糊数据生成模块320,用于根据各候选变异方法以及各变异位置,对所述初始样本集合中的各初始样本进行一次变异,得到模糊数据;
[0110] 目标变异信息确定模块330,用于根据所述模糊数据以及待测试程序,确定目标变异方法以及目标变异位置区间;
[0111] 模糊测试模块340,用于根据所述目标变异方法以及所述目标变异位置区间,对所述待测试程序进行模糊测试。
[0112] 本发明实施例的技术方案,通过对初始样本集合中的初始样本,根据多个候选变异方法和变异位置,进行一次变异,得到模糊数据,根据模糊数据对待测试程序进行模糊测试,得到有效的目标变异方法和目标变异位置区间,根据目标变异方法和目标变异位置区间对待测试程序进行最终的模糊测试。解决了现有技术中的模糊测试方法中,变异较为随机,变异的效率低下,从而导致模糊测试的效率较低的问题,减少了变异的随机性,提高了模糊数据的有效性,从而提高模糊测试的效率。
[0113] 在上述实施例的基础上,模糊数据生成模块320,包括:
[0114] 变异单元,用于根据第一候选变异方法,对所述初始样本集合中的各初始样本的第一变异位置处进行一次变异;
[0115] 变异位置迭代单元,用于重复执行对所述初始样本集合中的各初始样本的第一变异位置处进行一次变异的操作,直至完成对全部变异位置的变异;
[0116] 变异方法迭代单元,用于重复执行根据第一候选变异方法,对所述初始样本集合中的各初始样本的第一变异位置处进行一次变异的操作,直至完成对全部变异方法的处理。
[0117] 在上述实施例的基础上,目标变异信息确定模块330,包括:
[0118] 初始程序覆盖率确定单元,用于根据各初始样本和待测试程序进行模糊测试,得到与各初始样本匹配的初始程序覆盖率;
[0119] 模糊程序覆盖率确定单元,用于根据所述模糊数据和待测试程序进行模糊测试,得到与各模糊数据匹配的模糊程序覆盖率;
[0120] 目标变异信息确定单元,用于根据各初始程序覆盖率以及各模糊程序覆盖率,确定目标变异方法以及目标变异位置区间。
[0121] 在上述实施例的基础上,目标变异信息确定单元,具体用于:
[0122] 获取至少两个预设变异位置区间,其中,所述预设变异位置区间为根据各初始样本的样本大小而确定;
[0123] 若确定与预设变异位置区间匹配的各模糊数据中,存在模糊程序覆盖率大于初始程序覆盖率的目标模糊数据,则将预设变异位置区间作为目标变异位置区间;
[0124] 将与各目标模糊数据匹配的候选变异方法作为目标变异方法。
[0125] 在上述实施例的基础上,模糊测试模块340,包括:
[0126] 权重确定单元,用于确定各目标变异方法的权重,并根据各目标变异方法的权重,对各目标变异方法进行排序;
[0127] 目标变异方法确定单元,用于根据各目标变异方法的排序结果,确定对所述待测试程序进行模糊测试所需的目标变异方法;
[0128] 目标变异位置区间确定单元,用于确定进行模糊测试所需的各目标变异方法对应的目标变异位置区间;
[0129] 模糊测试单元,用于根据进行模糊测试所需的各目标变异方法以及其对应的目标变异位置区间,生成模糊数据,并对所述待测试程序进行模糊测试。
[0130] 在上述实施例的基础上,权重确定单元,具体用于:
[0131] 确定各目标变异方法对应的目标模糊数据的数量,以及,对各目标变异位置区间,分别确定对应的目标模糊数据数量最多的目标变异方法;
[0132] 根据各目标变异方法对应的目标模糊数据的数量,以及各目标变异位置区间对应的目标模糊数据数量最多的目标变异方法,确定各目标变异方法的权重。
[0133] 在上述实施例的基础上,所述装置,还包括:
[0134] 变异方法更新模块,用于若确定满足变异方法更新条件,则重新根据各候选变异方法以及各变异位置,确定目标变异方法以及目标变异位置区间;
[0135] 测试更新模块,用于根据重新确定的目标变异方法以及目标变异位置区间,对待测试程序进行模糊测试。
[0136] 本发明实施例所提供的模糊测试装置可执行本发明任意实施例所提供的模糊测试方法,具备执行方法相应的功能模块和有益效果。
[0137] 实施例四
[0138] 图4示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
[0139] 如图4所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
[0140] 电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0141] 处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(中央处理器)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如模糊测试方法。
[0142] 在一些实施例中,模糊测试方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的模糊测试方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行模糊测试方法。
[0143] 本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0144] 用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0145] 在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD‑ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0146] 为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0147] 可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
[0148] 计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端‑服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
[0149] 应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
[0150] 上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。