色谱数据图处理方法、计算机设备和计算机可读存储介质转让专利

申请号 : CN202310288238.8

文献号 : CN116310566B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王东强冀禹璋

申请人 : 华谱科仪(北京)科技有限公司

摘要 :

本公开的实施例公开了色谱数据图处理方法、计算机设备和计算机可读存储介质。该方法的一具体实施方式包括:获取预设历史时间段内色谱仪产生的色谱数据图集;对于色谱数据图集中的每个色谱数据图,执行如下处理步骤:基于设定的色谱图像识别模型,确定色谱数据图是否为扰动色谱数据图;响应于确定色谱数据图不为扰动色谱数据图,输出色谱数据图;将色谱数据图输入至预先训练的异常色谱图像识别模型中,得到异常色谱图像识别结果,其中,异常色谱图像识别结果表征色谱数据图是否为异常色谱数据图;响应于确定异常色谱图像识别结果表征色谱数据图为异常色谱数据图,对色谱数据图进行标记,得到标记色谱数据图。该实施方式缩短了技术人员的解析时间。

权利要求 :

1.一种色谱数据图处理方法,包括:

获取预设历史时间段内色谱仪产生的色谱数据图集;

对于所述色谱数据图集中的每个色谱数据图,执行如下处理步骤:基于设定的色谱图像识别模型,确定所述色谱数据图是否为扰动色谱数据图;

响应于确定所述色谱数据图不为扰动色谱数据图,输出所述色谱数据图;

将所述色谱数据图输入至预先训练的异常色谱图像识别模型中,得到异常色谱图像识别结果,其中,所述异常色谱图像识别结果表征所述色谱数据图是否为异常色谱数据图;

响应于确定所述异常色谱图像识别结果表征所述色谱数据图为异常色谱数据图,对所述色谱数据图进行标记,得到标记色谱数据图。

2.根据权利要求1所述的方法,其中,所述异常色谱图像识别模型是通过以下步骤训练得到的:获取样本色谱数据图集;

从所述样本色谱数据图集中选择出目标样本色谱数据图;

提取所述目标样本色谱数据图的显著图;

基于所述显著图,对初始异常色谱图像识别模型进行训练,得到训练后的异常色谱图像识别模型。

3.根据权利要求2所述的方法,其中,所述基于所述显著图,对初始异常色谱图像识别模型进行训练,包括:对所述显著图进行降维处理,以生成显著图降维特征;

通过对称网络结构,对所述显著图降维特征进行解码和重建,输出重建显著图;

确定所述显著图与所述重建显著图之间的损失值;

根据所述损失值与预设损失值,调整所述初始异常色谱图像识别模型的网络参数。

4.根据权利要求1所述的方法,其中,所述方法还包括:将所得到的每个标记色谱数据图确定为扰动样本色谱数据图,得到扰动样本色谱数据图组;

根据所述扰动样本色谱数据图组,对所述色谱图像识别模型进行更新。

5.一种计算机设备,其中,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如权利要求1‑4中任一所述的方法的步骤。

6.一种计算机可读存储介质,其中,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如权利要求1至4中任一所述的方法的步骤。

说明书 :

色谱数据图处理方法、计算机设备和计算机可读存储介质

技术领域

[0001] 本公开的实施例涉及色谱分析领域,具体涉及色谱数据图处理方法、计算机设备和计算机可读存储介质。

背景技术

[0002] 色谱仪是进行色谱分析的装置,灵敏度和自动化程度高,被广泛应用在化学产品分析实验中。目前,对于色谱数据图的分析,通常采用的方式为:将所生成的各个色谱数据图发送至技术人员的电脑终端进行解析。然而,采用上述方式通常会存在以下技术问题:由于色谱数据图较多,未进行分类,导致技术人员需要花费的解析时间较长。

发明内容

[0003] 本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0004] 本公开的一些实施例提出了色谱数据图处理方法、计算机设备和计算机可读存储介质,来解决以上背景技术部分提到的技术问题。
[0005] 第一方面,本公开的一些实施例提供了一种色谱数据图处理方法,该方法包括:获取预设历史时间段内色谱仪产生的色谱数据图集;对于上述色谱数据图集中的每个色谱数据图,执行如下处理步骤:基于设定的色谱图像识别模型,确定上述色谱数据图是否为扰动色谱数据图;响应于确定上述色谱数据图不为扰动色谱数据图,输出上述色谱数据图;将上述色谱数据图输入至预先训练的异常色谱图像识别模型中,得到异常色谱图像识别结果,其中,上述异常色谱图像识别结果表征上述色谱数据图是否为异常色谱数据图;响应于确定上述异常色谱图像识别结果表征上述色谱数据图为异常色谱数据图,对上述色谱数据图进行标记,得到标记色谱数据图。
[0006] 第二方面,本公开的一些实施例提供一种计算机设备,上述计算机设备包括处理器、存储器、以及存储在上述存储器上并可被上述处理器执行的计算机程序,其中上述计算机程序被上述处理器执行时,实现如上述第一方面任一实现方式所描述的方法。
[0007] 第三方面,本公开的一些实施例提供一种计算机可读存储介质,上述计算机可读存储介质上存储有计算机程序,其中上述计算机程序被处理器执行时,实现如上述第一方面任一实现方式所描述的方法。
[0008] 本公开的上述各个实施例具有如下有益效果:通过本公开的一些实施例的色谱数据图处理方法,可以对产生的色谱数据图进行检测标记。从而实现了对色谱数据图的分类,缩短了技术人员的解析时间。首先,获取预设历史时间段内色谱仪产生的色谱数据图集。由此,为对色谱数据图的分类,提供了数据支持。其次,对于上述色谱数据图集中的每个色谱数据图,执行如下处理步骤:首先,基于设定的色谱图像识别模型,确定上述色谱数据图是否为扰动色谱数据图。由此,可以确定色谱数据图是否为对抗图像(扰动图像)。接着,响应于确定上述色谱数据图不为扰动色谱数据图,输出上述色谱数据图。然后,将上述色谱数据图输入至预先训练的异常色谱图像识别模型中,得到异常色谱图像识别结果。其中,上述异常色谱图像识别结果表征上述色谱数据图是否为异常色谱数据图。由此,可以初步对色谱数据图进行检测识别。从而对色谱数据图进行分类。最后,响应于确定上述异常色谱图像识别结果表征上述色谱数据图为异常色谱数据图,对上述色谱数据图进行标记,得到标记色谱数据图。由此,可以对产生的色谱数据图进行检测标记。从而实现了对色谱数据图的分类,缩短了技术人员的解析时间。

附图说明

[0009] 结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
[0010] 图1是根据本公开的色谱数据图处理方法的一些实施例的流程图;
[0011] 图2是本公开实施例提供的一种计算机设备的结构示意性框图。

具体实施方式

[0012] 下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0013] 另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
[0014] 需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
[0015] 需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
[0016] 本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
[0017] 下面将参考附图并结合实施例来详细说明本公开。
[0018] 图1是根据本公开一些实施例的色谱数据图处理方法的一些实施例的流程图。示出了根据本公开的色谱数据图处理方法的一些实施例的流程100。该色谱数据图处理方法,包括以下步骤:
[0019] 步骤101,获取预设历史时间段内色谱仪产生的色谱数据图集。
[0020] 在一些实施例中,色谱数据图处理方法的执行主体(例如服务器)可以通过有线连接或无线连接的方式获取预设历史时间段内色谱仪产生的色谱数据图集。这里,对于预设历史时间段的设定,不做限定。色谱数据图可以是指色谱图。
[0021] 步骤102,对于上述色谱数据图集中的每个色谱数据图,执行如下处理步骤:
[0022] 步骤1021,基于设定的色谱图像识别模型,确定上述色谱数据图是否为扰动色谱数据图。
[0023] 在一些实施例中,上述执行主体可以基于设定的色谱图像识别模型,确定上述色谱数据图是否为扰动色谱数据图。这里,色谱图像识别模型可以是采用对抗训练得到的。扰动色谱数据图可以是表征添加了对抗性扰动的对抗图像。即,可以将色谱数据图输入至上述色谱图像识别模型中,用于确定上述色谱数据图是否为扰动色谱数据图。
[0024] 这里,上述色谱图像识别模型可以是通过对初始模型进行对抗训练增强得到的。此处的初始模型可以为图像分类模型。也就是说,在初始模型已训练完成的情况下,可以对其进行对抗训练。进而可以将对抗训练完成的初始模型作为色谱图像识别模型。既可以增强模型自身的防御能力,又可以减少对处理流程的改动。
[0025] 此外,上述色谱图像识别模型也可以是单独设置的。也就是说,可以通过对抗样本图像和正向样本图像作为训练数据,对初始模型进行对抗训练,从而得到色谱图像识别模型。其中,正向样本图像通常是未增加对抗性扰动的样本图像。例如,训练初始模型所使用的样本图像。这里的初始模型可以是具有任意神经网络模型结构的模型。此时,可以将色谱图像识别模型设置在初始模型的处理流程之前,以对色谱数据图进行对抗图像检测,从而实现对抗攻击的前置防御。
[0026] 步骤1022,响应于确定上述色谱数据图不为扰动色谱数据图,输出上述色谱数据图。
[0027] 在一些实施例中,上述执行主体可以响应于确定上述色谱数据图不为扰动色谱数据图,输出上述色谱数据图。即,若色谱数据图不是扰动色谱数据图,则执行主体可以输出色谱数据图。这里的输出并不限制。例如,若色谱图像识别模型为对抗训练增强后的初始模型,则执行主体可以将色谱数据图输出给(即输入)初始模型中的下一网络层,从而对色谱数据图做进一步分析处理。又例如,若色谱图像识别模型与初始模型为相互独立模型,则执行主体可以将色谱数据图输入初始模型。此时,初始模型可以继续对色谱数据图进行处理。
[0028] 步骤1023,将上述色谱数据图输入至预先训练的异常色谱图像识别模型中,得到异常色谱图像识别结果。
[0029] 在一些实施例中,上述执行主体可以将上述色谱数据图输入至预先训练的异常色谱图像识别模型中,得到异常色谱图像识别结果。其中,上述异常色谱图像识别结果表征上述色谱数据图是否为异常色谱数据图。这里,异常色谱图像识别模型可以是预先训练的以色谱数据图为输入,以异常色谱图像识别结果为输出的神经网络模型。例如,异常色谱图像识别模型可以是对抗网络(GAN,Generative Adversarial Networks)。
[0030] 可选地,上述异常色谱图像识别模型是通过以下步骤训练得到的:
[0031] 第一步,获取样本色谱数据图集。即,可以通过有线连接或无线连接的方式从终端设备中获取样本色谱数据图集。
[0032] 实践中,上述第一步,可以包括以下子步骤:
[0033] 第一子步骤,获取未标注样本色谱数据图集。这里,未标注样本色谱数据图可以是指未标注的色谱数据图样本。
[0034] 第二子步骤,对上述未标注样本色谱数据图集中的每个未标注样本色谱数据图,执行以下处理步骤:
[0035] 1、根据样本评分模型包括的图像分类子网络中的各个特征提取层,生成上述未标注样本色谱数据图对应的至少一个未标注样本色谱数据图特征。其中,上述样本评分模型是通过已标注样本色谱数据图集训练得到的。上述样本评分模型可以为用于对未标注图像样本进行打分的模型。上述图像分类子网络可以为用于对图像分类以及包括各个特征提取层的神经网络模型。例如,上述图像分类子网络可以为ResNet18模型。特征提取层可以为用于输出图像特征的卷积层。上述已标注样本色谱数据图可以为对未标注样本色谱数据图进行标注后的样本。即,可以将未标注样本色谱数据图输入至图像分类子网络中的各个特征提取层,得到至少一个未标注样本色谱数据图特征。一个特征提取层输出一个未标注样本色谱数据图特征。
[0036] 2、根据上述样本评分模型包括的图像评分子网络和上述至少一个未标注样本色谱数据图特征,生成对应上述未标注样本色谱数据图的样本评分。
[0037] 实践中,根据上述样本评分模型包括的图像评分子网络和上述至少一个未标注样本色谱数据图特征,生成对应上述未标注样本色谱数据图的样本评分,包括以下步骤:
[0038] 第一,对上述至少一个未标注样本色谱数据图特征中的每个未标注样本色谱数据图特征进行特征处理,以生成未标注样本色谱数据图特征处理信息,得到未标注样本色谱数据图特征处理信息组。首先,对上述未标注样本色谱数据图特征进行池化处理,以生成未标注样本色谱数据图池化特征信息。然后,对上述未标注样本色谱数据图池化特征信息进行全连接处理,以生成未标注样本色谱数据图全连接特征信息。最后,对上述未标注样本色谱数据图全连接特征信息进行激活处理,以生成未标注样本色谱数据图激活特征信息,作为未标注样本色谱数据图特征处理信息。即,可以通过激活函数对上述未标注样本色谱数据图全连接特征信息进行激活处理,以生成未标注样本色谱数据图激活特征信息。
[0039] 第二,将上述未标注样本色谱数据图特征处理信息组包括的各个未标注样本色谱数据图特征处理信息进行组合,得到未标注样本色谱数据图特征处理组合信息。组合可以是指拼接。
[0040] 第三,确定上述未标注样本色谱数据图特征处理组合信息对应的评分,作为样本评分。上述执行主体可以将上述未标注样本色谱数据图特征处理组合信息输入至上述图像评分子网络包括的全连接层,将上述图像评分子网络包括的全连接层的输出作为上述标注样本色谱数据图特征处理组合信息对应的评分。
[0041] 第三子步骤,基于所生成的各个样本评分,从上述未标注样本色谱数据图集中选择出满足目标条件的各个未标注样本色谱数据图作为待标注样本色谱数据图集。这里,目标条件可以是:样本评分大于等于预设评分。
[0042] 第四子步骤,对上述待标注样本色谱数据图集中的每个待标注样本色谱数据图进行标注处理,以生成标注样本色谱数据图作为样本色谱数据图,得到样本色谱数据图集。这里,标注处理可以是对待标注样本色谱数据图添加上样本标签。
[0043] 由此,可以筛选出高质量的样本,以减少模型训练所需样本的数量,提高模型训练速度。
[0044] 第二步,从上述样本色谱数据图集中选择出目标样本色谱数据图。即,可以随机从上述样本色谱数据图集中选择出一样本色谱数据图作为目标样本色谱数据图。
[0045] 第三步,提取上述目标样本色谱数据图的显著图。在这里,显著图的提取方式并不限制。例如可以通过模型可解释性方法来提取样本的显著图特征。
[0046] 第四步,基于上述显著图,对初始异常色谱图像识别模型进行训练,得到训练后的异常色谱图像识别模型。初始异常色谱图像识别模型可以为自编码器。
[0047] 实践中,上述第四步,可以包括以下子步骤:
[0048] 第一子步骤,对上述显著图进行降维处理,以生成显著图降维特征。即,可以通过自编码对对上述显著图进行降维处理,以生成显著图降维特征。
[0049] 第二子步骤,通过对称网络结构,对上述显著图降维特征进行解码和重建,输出重建显著图。
[0050] 第三子步骤,确定上述显著图与上述重建显著图之间的损失值。例如,可以通过损失函数确定上述显著图与上述重建显著图之间的损失值。损失函数可以是余弦损失函数。
[0051] 第四子步骤,根据上述损失值与预设损失值,调整上述初始异常色谱图像识别模型的网络参数。即,当损失值大于预设损失值,调整上述初始异常色谱图像识别模型的网络参数。例如,可以对损失值与预设损失值求差值,得到损失差值。在此基础上,利用反向传播、随机梯度下降等方法将损失差值从模型的最后一层向前传递,以调整每一层的参数。当然根据需要,也可以采用网络冻结(dropout)的方法,对其中的一些层的网络参数保持不变,不进行调整,对此,不做任何限定。当损失值小于等于预设损失值时,将初始异常色谱图像识别模型确定为训练完成的异常色谱图像识别模型。
[0052] 步骤1024,响应于确定上述异常色谱图像识别结果表征上述色谱数据图为异常色谱数据图,对上述色谱数据图进行标记,得到标记色谱数据图。
[0053] 在一些实施例中,上述执行主体可以响应于确定上述异常色谱图像识别结果表征上述色谱数据图为异常色谱数据图,对上述色谱数据图进行标记,得到标记色谱数据图。这里,对上述色谱数据图进行标记可以是在色谱数据图上打印上异常的标签字样。
[0054] 可选地,将所得到的每个标记色谱数据图确定为扰动样本色谱数据图,得到扰动样本色谱数据图组。
[0055] 在一些实施例中,上述执行主体可以将所得到的每个标记色谱数据图确定为扰动样本色谱数据图,得到扰动样本色谱数据图组。
[0056] 可选地,根据上述扰动样本色谱数据图组,对上述色谱图像识别模型进行更新。
[0057] 在一些实施例中,上述执行主体可以根据上述扰动样本色谱数据图组,对上述色谱图像识别模型进行更新。即,可以根据上述扰动样本色谱数据图组,利用半监督的训练方式对上述色谱图像识别模型进行训练,以完成对色谱图像识别模型的更新。
[0058] 图2为本公开实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以为终端。
[0059] 如图2所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
[0060] 非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种色谱数据图处理方法。
[0061] 处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
[0062] 内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种色谱数据图处理方法。
[0063] 该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图2中示出的结构,仅仅是与本公开方案相关的部分结构的框图,并不构成对本公开方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0064] 应当理解的是,处理器可以是中央处理单元 (Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路 (Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field‑Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0065] 其中,在一个实施例中,上述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:获取预设历史时间段内色谱仪产生的色谱数据图集;对于上述色谱数据图集中的每个色谱数据图,执行如下处理步骤:基于设定的色谱图像识别模型,确定上述色谱数据图是否为扰动色谱数据图;响应于确定上述色谱数据图不为扰动色谱数据图,输出上述色谱数据图;将上述色谱数据图输入至预先训练的异常色谱图像识别模型中,得到异常色谱图像识别结果,其中,上述异常色谱图像识别结果表征上述色谱数据图是否为异常色谱数据图;响应于确定上述异常色谱图像识别结果表征上述色谱数据图为异常色谱数据图,对上述色谱数据图进行标记,得到标记色谱数据图。
[0066] 本公开实施例还提供一种计算机可读存储介质,上述计算机可读存储介质上存储有计算机程序,上述计算机程序中包括程序指令,上述程序指令被执行时所实现的方法可参照本公开色谱数据图处理方法的各个实施例。
[0067] 其中,上述计算机可读存储介质可以是前述实施例上述的计算机设备的内部存储单元,例如上述计算机设备的硬盘或内存。上述计算机可读存储介质也可以是上述计算机设备的外部存储设备,例如上述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
[0068] 需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
[0069] 上述本公开实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。