一种室内有害气体浓度异常监测数据处理方法转让专利

申请号 : CN202310207127.X

文献号 : CN116070163B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 谭海文张辉李统养林惠强

申请人 : 深圳市特安电子有限公司

摘要 :

本发明涉及数据管理领域,具体涉及一种室内有害气体浓度异常监测数据处理方法,包括:获取气体浓度数据,得到气体浓度序列;根据气体浓度序列中各个气体浓度数据以及相邻气体浓度数据得到各个气体浓度数据的第一异常程度;根据不同数据周期以及不同季节周期得到各个气体浓度数据的趋势项以及残差项;根据各个气体浓度数据的第一异常程度以及在不同数据周期以及不同季节周期时对应的残差项得到各个气体浓度数据的各个第二异常程度;根据各个气体浓度数据的各个第二异常程度得到各个气体浓度数据的最终异常程度,进而得到各个异常数据。本发明更加准确、可靠。

权利要求 :

1.一种室内有害气体浓度异常监测数据处理方法,其特征在于,该方法包括以下步骤:获取气体浓度数据,得到气体浓度序列;

根据气体浓度序列中各个气体浓度数据以及相邻气体浓度数据得到各个气体浓度数据的第一异常程度;

对所述气体浓度序列进行不同尺度的STL时序分解,根据不同数据周期以及不同季节周期得到各个气体浓度数据的趋势项以及残差项,包括:第i个气体浓度数据的趋势项、季节项以及残差项的获取过程如下:

利用不同的数据周期值k对所述气体浓度序列进行多次分解,以获得不同k值对应的趋势项,其中,将第i个气体浓度数据在数据周期为k时对应的相邻数据集中,所有气体浓度数据的平均值作为第i个气体浓度数据的趋势项,在数据周期为k时,第i个气体浓度数据对应的趋势项为 ;

在不同数据周期值k对应的趋势项的基础上,利用不同的季节周期长度值f对同一气体浓度数据进行多次分解,以获得不同k值和f值对应的季节项,其中,在数据周期为k,季节周期为f时,第i个气体浓度数据对应的季节项为 ;

在数据周期为k,季节周期为f时,将第i个气体浓度数据对应的趋势项 与对应的季节项 之间的差值作为第i个气体浓度数据的残差项,记为 ;

根据各个气体浓度数据的第一异常程度以及在不同数据周期以及不同季节周期时对应的残差项得到各个气体浓度数据的各个第二异常程度;

根据各个气体浓度数据在同一季节周期、不同数据周期时对应的残差项得到各个气体浓度数据的第一方差和第一均值;根据同一数据周期下,所有气体浓度数据与对应的趋势项得到各个气体浓度数据的第二方差和第二均值;根据各个气体浓度数据的第一方差、第一均值、第二方差、第二均值以及各个第二异常程度得到各个气体浓度数据的最终异常程度;根据各个气体浓度数据的最终异常程度得到各个异常数据;

所述各个气体浓度数据的第一异常程度的获取表达式为:

其中, 表示第i个气体浓度数据的第一异常程度;为第i个气体浓度数据; 表示第i+1个气体浓度数据; 表示气体浓度序列的最大浓度变化幅值;

所述各个气体浓度数据的各个第二异常程度的获取表达式为:

其中, 表示在数据周期为k、季节周期为f时,第i个气体浓度数据的第二异常程度; 表示在数据周期为k、季节周期为f时,第i个气体浓度数据的残差项, 表示最大残差项; 表示在数据周期为k、季节周期为f时,第i个气体浓度数据相邻的第v个气体浓度数据对应的残差项;

所述各个气体浓度数据的最终异常程度的获取表达式为:

其中, 为第i个气体浓度数据的最终异常程度; 、 分别表示当季节周期为f时,第i个气体浓度数据的第一均值和第一方差; 、 分别表示当数据周期为k时,第i个气体浓度数据的第二均值和第二方差。

2.根据权利要求1所述的一种室内有害气体浓度异常监测数据处理方法,其特征在于,所述各个气体浓度数据的第一方差和第一均值的获取方法:对于一个季节周期,将各个气体浓度数据在不同数据周期下对应的所有残差项之间的方差和均值分别作为各个气体浓度数据的第一方差和第一均值。

3.根据权利要求1所述的一种室内有害气体浓度异常监测数据处理方法,其特征在于,所述各个气体浓度数据的第二方差和第二均值的获取方法为:对于一个数据周期,计算所有气体浓度数据与对应的趋势项之间的差值,将所有差值的均值以及方差分别记为各个气体浓度数据的第二均值和第二方差。

说明书 :

一种室内有害气体浓度异常监测数据处理方法

技术领域

[0001] 本发明涉及数据管理领域,具体涉及一种室内有害气体浓度异常监测数据处理方法。

背景技术

[0002] 随着人们健康意识的提升,各种健康监测逐步进入人们生活与生产过程中,比如在生产车间中,可能产生的有害气体对人体长生危害,甚至对人体生命安全产生威胁,所以在生产车间中对有害气体的监测至关重要。一般室内有害气体的检测主要根据电化学传感器,将有害气体浓度转换为电数字数据,此时所获得的有害气体浓度数据的异常值影响浓度异常检测,所以首先需要在所获得的气体浓度数据中,对影响气体浓度判断的异常数据进行筛选。
[0003] 已知室内有害气体浓度数据是持续变化的数据,即可理解为时序数据,此时对其进行异常数据识别常常利用STL分解进行分析,根据残差项反应气体浓度数据的异常;但是对于室内气体浓度数据时序分布的线性关系不明显,所以常规单次STL分解效果不佳且难以把握,导致所获得的残差数据难以直接反应各个气体浓度数据的偏离情况,所以其异常数据识别效果不佳。

发明内容

[0004] 本发明提供一种室内有害气体浓度异常监测数据处理方法,以解决现有的问题。
[0005] 本发明的一种室内有害气体浓度异常监测数据处理方法采用如下技术方案:
[0006] 本发明一个实施例提供了一种室内有害气体浓度异常监测数据处理方法,该方法包括以下步骤:
[0007] 获取气体浓度数据,得到气体浓度序列;
[0008] 根据气体浓度序列中各个气体浓度数据以及相邻气体浓度数据得到各个气体浓度数据的第一异常程度;根据不同数据周期以及不同季节周期得到各个气体浓度数据的趋势项以及残差项;
[0009] 根据各个气体浓度数据的第一异常程度以及在不同数据周期以及不同季节周期时对应的残差项得到各个气体浓度数据的各个第二异常程度;
[0010] 根据各个气体浓度数据在同一季节周期、不同数据周期时对应的残差项得到各个气体浓度数据的第一方差和第一均值;根据同一数据周期下,所有气体浓度数据与对应的趋势项得到各个气体浓度数据的第二方差和第二均值;根据各个气体浓度数据的第一方差、第一均值、第二方差、第二均值以及各个第二异常程度得到各个气体浓度数据的最终异常程度;根据各个气体浓度数据的最终异常程度得到各个异常数据。
[0011] 优选的,所述各个气体浓度数据的第一异常程度的获取表达式为:
[0012]
[0013] 其中, 表示第i个气体浓度数据的第一异常程度;为第i个气体浓度数据;表示第i+1个气体浓度数据; 表示气体浓度序列的最大浓度变化幅值。
[0014] 优选的,所述各个气体浓度数据的各个第二异常程度的获取表达式为:
[0015]
[0016] 其中, 表示在数据周期为k、季节周期为f时,第i个气体浓度数据的第二异常程度; 表示在数据周期为k、季节周期为f时,第i个气体浓度数据的残差项,表示最大残差项; 表示在数据周期为k、季节周期为f时,第i个气体浓度数据相邻的第v个气体浓度数据对应的残差项。
[0017] 优选的,所述各个气体浓度数据的第一方差和第一均值的获取方法:
[0018] 对于一个季节周期,将各个气体浓度数据在不同数据周期下对应的所有残差项之间的方差和均值分别作为各个气体浓度数据的第一方差和第一均值。
[0019] 优选的,所述各个气体浓度数据的第二方差和第二均值的获取方法为:
[0020] 对于一个数据周期,计算所有气体浓度数据与对应的趋势项之间的差值,将所有差值的均值以及方差分别记为各个气体浓度数据的第二均值和第二方差。
[0021] 优选的,所述各个气体浓度数据的最终异常程度的获取表达式为:
[0022]
[0023] 其中,为第i个气体浓度数据的最终异常程度; 、 分别表示当季节周期为f时,第i个气体浓度数据的第一均值和第一方差; 、 分别表示当数据周期为k时,第i个气体浓度数据的第二均值和第二方差。
[0024] 本发明的有益效果是:首先对气体浓度序列进行不同尺度的分解,得到多尺度的残差项,通过对各个气体浓度数据在不同尺度上对应的残差项进行分析,可以有效提高残差项的可信度,从而提高对应气体浓度数据异常程度判断结果的可信度;同时可以避免气体浓度数据因本身趋势的异常对气体浓度数据单次分解的影响程度,有效提高所获得残差项的容错性,提高异常数据识别的稳定性与可靠性;此外,在气体浓度数据的分解过程中,分别从趋势项与季节项进行多尺度分解,提高残差项尺度的多样性,有效提高残差项对气体浓度数据的异常表现程度,便于对异常数据的识别与检测。

附图说明

[0025] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0026] 图1为本发明的一种室内有害气体浓度异常监测数据处理方法的步骤流程图。

具体实施方式

[0027] 为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种室内有害气体浓度异常监测数据处理方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
[0028] 除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
[0029] 下面结合附图具体的说明本发明所提供的一种室内有害气体浓度异常监测数据处理方法的具体方案。
[0030] 请参阅图1,其示出了本发明一个实施例提供的一种室内有害气体浓度异常监测数据处理方法的步骤流程图,该方法包括以下步骤:
[0031] 步骤S001:获取气体浓度数据,得到气体浓度序列。
[0032] 首先需要获取室内有害气体浓度数据,比如一氧化碳气体。为了获得更加全面的气体浓度数据,此时需要在室内不同位置安装多个电化学传感器,每个传感器之间的间隔距离为L0,本实施例设置L0=10米;
[0033] 由于室内有害气体的产生为一个持续的过程,对应有害气体浓度数据的变化为连续变化,在分析连续数据的变化关系之前,需要确定数据颗粒度,即确定每个气体浓度数据的采集时间间隔,本实施例以一分钟为一个气体浓度数据对应时间单元,即将每个一分钟范围内获取的所有的气体浓度的均值作为一个气体浓度数据;则在预设时间内可以得到多个气体浓度数据,所有气体浓度数据构成了一个气体浓度序列,本实施例中的预设时间为15小时,该预设时间的大小可由实施者自行设定;
[0034] 而后将所有传感器采集的气体浓度数据传输到数据检测管理平台,通过后续筛选异常数据,从而进行有效的有害气体浓度异常监测。
[0035] 步骤S002:根据气体浓度序列中各个气体浓度数据以及相邻气体浓度数据得到各个气体浓度数据的第一异常程度;获取各个气体浓度数据的趋势项以及残差项。
[0036] 对于室内有害气体浓度数据,数据突变程度越大,其异常的可能性越大,在利用STL分解数据时,残差项对应的残差数据表现为数据偏离,不同的分解尺度会影响残差数据的偏离趋势,因此本实施例通过不同尺度的STL分解数据获得不同尺度下残差数据的偏离趋势,进而确定最终的异常数据。
[0037] 在气体浓度序列中,相邻两个气体浓度数据之间的差异,也就是相邻两个气体浓度数据之间差值的绝对值,可以反映短时间内有害气体的浓度变化幅度,一般情况下,由于设备故障等因素可能使得气体浓度序列中出现过高或过低的异常数据,即设备故障等因素会导致气体浓度序列中的数据变化剧烈,此时可以根据气体浓度的变化幅度,进行异常数据的判断,本实施例基于各个气体浓度数据的浓度变化幅度得到各个气体浓度数据的第一异常程度,则气体浓度序列中第i个气体浓度数据的第一异常程度 可以表示为:
[0038]
[0039] 其中, 表示第i个气体浓度数据的第一异常程度;为第i个气体浓度数据;表示第i+1个气体浓度数据; 表示第i个气体浓度数据对应的浓度变化幅度;
表示气体浓度序列的最大浓度变化幅值,该值为气体浓度序列中所有气体浓度数据对应的浓度变化幅度的最大值;
[0040] 表示第i个气体浓度数据对应的浓度变化幅度相对于最大浓度变化幅值的趋近程度,其值越大,表示第i个气体浓度数据的第一异常程度越大。
[0041] 利用各个气体浓度数据对应的浓度变化幅度得到各个气体浓度数据的第一异常程度,但是由于气体浓度序列中的数据是随着时间连续变化的,即气体浓度序列为一个时序变化序列,因此气体浓度数据是否异常还需要根据气体浓度数据的连续趋势进行判断,其中气体浓度数据的连续趋势具体表现在气体浓度数据的趋势性以及季节性,对于破坏气体浓度数据的趋势性以及季节性的数据即为数据异常。本实施例对气体浓度序列进行STL时序分解,得到气体浓度序列的趋势项、季节项以及残差项,其中第i个气体浓度数据的趋势项、季节项以及残差项的获取过程如下:
[0042] 1)趋势项计算:
[0043] 使用移动平均法获取第i个气体浓度数据的趋势项,即将第i个气体浓度数据在数据周期为k时对应的相邻数据集中,所有气体浓度数据的平均值作为第i个气体浓度数据的趋势项;
[0044] 本实施例中第i个气体浓度数据在数据周期为k时对应的相邻数据集是指:与第i个气体浓度数据相邻的2k个气体浓度数据构成的集合,其中第i个气体浓度数据对应的相邻数据集可以表示为: ,表示第i个气体浓度数据,为奇数阶,该值表示第i个气体浓度数据的相邻数据集中包含的气体浓度数据的总个数,此时m=2k+1;
[0045] 由于残差项可以反映各个气体浓度数据的数据趋势以及数据季节,即残差项可以反映各个气体浓度数据的异常表现,但是一个气体浓度数据的季节项与残差项都会受趋势项的影响,而在趋势项的计算过程中,k值的大小会直接影响数据趋势,且在不同的数据趋势下,各个气体浓度数据的残差项具有不同的异常表现,因此本实施例利用不同的k值对气体浓度序列进行多次分解,并根据不同k值对应的残差项进行异常分析。而不同数据周期k对应的奇数阶m的大小直接反映单个趋势项的求解过程所涉及的气体浓度数据的个数,因此在不同数据周期k下,同一气体浓度数据得到的相邻数据集也是不同的,故不同数据周期k对应的趋势项可以视为不同尺度下对应的趋势项,本实施例直接设置k的范围为[2,5],记在数据周期为k时,第i个气体浓度数据对应的趋势项为 。
[0046] 2)季节项计算:
[0047] 根据数据颗粒度计算第i个气体浓度数据的季节项,由于本实施例中数据颗粒度为一分钟,而气体浓度序列可以对应不同的数据颗粒度,所以在不同时间长度的季节周期中,可以进行不同周期分析,比如:计算每一小时中同一分钟对应的气体浓度数据之间的平均值与计算每两个小时中同一分钟对应气体浓度数据的平均值,可以分别获得时间长度为一小时与两小时的季节周期;此时不同时间长度的季节周期对应的残差数据也会具有不同的异常表现,所以为了提高残差项对异常数据的表现程度,本实施例在计算不同数据周期k对应的趋势项的基础上,继续进行不同时间长度的季节周期分析,从而综合判断同一气体浓度数据的异常程度;
[0048] 则当季节周期为1小时,数据周期为k时,计算各小时中同一分钟对应的气体浓度数据之间的平均值;假设第i个气体浓度数据对应的是第 个小时中的第r分钟,则计算预设时间内,各小时的第r分钟对应的气体浓度数据的平均值,记为第r分钟的第一均值;然后计算各小时的第r分钟对应的气体浓度数据与对应的趋势项 之间的差值,得到各小时的第r分钟对应的去趋势值,此时,第i个气体浓度数据对应的去趋势值为第 个小时中第r分钟的去趋势值;将各小时中第r分钟对应的所有去趋势值的平均值记为第r分钟的第二均值,将第r分钟的第一均值与第二均值之间的差值作为第r分钟的季节项,同时也是第i个气体浓度数据的季节项;
[0049] 由于一个气体浓度数据的季节项分析是基于去趋势值进行计算的,所以一个气体浓度数据的季节项是在不同数据周期k对应的去趋势值的基础上进行计算的,此时根据不同的季节周期确定不同的季节项,从而获得不同的残差表现。此时为了便于不同季节周期长度的选择,本实施例设置一小时为季节单元,不同季节周期长度为f个季节单元,f在实际分析中设置的范围为[1,5],然后通过f的值直接确定不同季节周期的时间长度,从而获得同一气体浓度数据的多个季节项,记在数据周期为k,季节周期为f时,第i个气体浓度数据对应的季节项为 。
[0050] 3)残差项计算:
[0051] 在数据周期为k,季节周期为f时,将第i个气体浓度数据对应的去趋势值与对应的季节项 之间的差值作为第i个气体浓度数据的残差项,记为 。
[0052] 同理,获取各个气体浓度数据的趋势项以及残差项;根据不同数据周期以及季节周期得到各个气体浓度数据的趋势项以及残差项。通过获得不同尺度下各个气体浓度数据的趋势项,避免因数据趋势的不准确,使得后续季节项与残差项存在误差的现象出现,进而保证残差项对异常数据的表现程度;同时利用不同季节周期确定不同的季节项,从而获得不同的残差项,通过对不同季节周期以及不同尺度下的残差项,提高各个气体浓度数据对应残差项的可信度以及残差项对异常数据的表现程度。
[0053] 步骤S003:根据各个气体浓度数据的第一异常程度以及在不同数据周期以及不同季节周期时对应的残差项得到各个气体浓度数据的各个第二异常程度。
[0054] 已知残差项的大小反映气体浓度数据相对于趋势项以及季节项的偏离程度,而趋势项与季节项可以反映气体浓度数据的规律分布,因此当一个气体浓度数据相对于规律分布发生了偏离时,即认为该气体浓度数据为异常数据,而偏离程度即为该气体浓度数据对应的异常程度,也就是说一个气体浓度数据的残差项的大小表示该气体浓度数据的异常程度,其值越大,对应的异常程度越大,并且残差的分布反映残差数据本身的异常程度,则在数据周期为k、季节周期为f时,第i个气体浓度数据的第二异常程度 可以表示为:
[0055]
[0056] 其中, 表示第i个气体浓度数据的第一异常程度, 表示在数据周期为k、季节周期为f时,第i个气体浓度数据的残差项, 表示最大残差项,该值为所有气体浓度数据对应残差项的最大值; 表示第i个气体浓度数据相邻的第v个气体浓度数据对应的残差项。
[0057] 表示第i个气体浓度数据对应残差项与周围最相邻的6个气体浓度数据对应的残差项之间的相对差异,其值越大,第i个气体浓度数据对应残差项本身的异常程度越大,对应第i个气体浓度数据的第二异常程度也越大,反之则第i个气体浓度数据的第二异常程度越小; 反映第i个气体浓度数据对应残差项相对于最大残差项的趋近程度,其值越大,第i个气体浓度数据的第二异常程度越大,反之则越小。
[0058] 步骤S004:根据各个气体浓度数据的各个第二异常程度得到各个气体浓度数据的最终异常程度,进而得到各个异常数据。
[0059] 根据各个气体浓度数据在不同数据周期以及不同季节周期对应的第二异常程度得到各个气体浓度数据的最终异常程度,则第i个气体浓度数据的最终异常程度 可表示为:
[0060]
[0061] 其中, 、 分别表示当季节周期为f时,第i个气体浓度数据在不同数据周期下对应的所有残差项之间的均值以及方差,分别记为第i个气体浓度数据的第一均值和第一方差; 、 分别表示当数据周期为k时,所有气体浓度数据与对应的趋势项之间差值的平均值以及方差,分别记为第i个气体浓度数据的第二均值和第二方差。
[0062] 越小,对应的趋势项与季节项分析越准确,即残差项的可信度越高,对应第i个气体浓度数据异常判断的可信度越高; 越大,残差差异越大,残差的大小关系越能反映各个气体浓度数据之间的差异,从而使得残差项所反映的数据异常越可信;
[0063] 表示在数据周期为k,季节周期为f时,第i个气体浓度数据的数据异常程度, 表示当数据周期为k时,不同季节周期所反映的数
据异常,其值越大,第i个气体浓度数据的最终异常程度越大;
[0064] 的值越小,对应趋势项越贴合气体浓度序列中的数据,此时对应去趋势项分布差异越大,更容易进行差异分析,便于异常残差分析, 值越大,对应去趋势项更能反映气体浓度数据的分布差异,即对应气体浓度数据的最终异常程度越可信。
[0065] 此时利用数据异常程度进行异常数据筛选,进而获得更加准确的原始气体浓度数据。设置判断阈值 ,在 时,对应的气体浓度数据为异常数据,否则对应的气体浓度数据为正常数据,本实施例中设置 ,其中 表示所有气体浓度数据对应最终异常程度的均值,表示所有气体浓度数据对应最终异常程度的标准差。
[0066] 获取各个气体浓度数据的最终异常程度,并根据 ,得到气体浓度序列中的所有异常数据。
[0067] 利用以上步骤,根据不同尺度下得到的趋势项与不同季节周期得到的季节项,获得多尺度下的残差项,通过不同尺度的残差项共同反映各个气体浓度数据的异常,避免单尺度分解中趋势项与季节项的误差对气体浓度数据异常的覆盖,同时从多个尺度的残差分析,有效提高残差的可信度,从而提高所对应数据异常程度的可信度。最后多尺度残差所反映的数据异常程度具有较高的兼容性,受具体数据分布的影响较小。
[0068] 根据上述步骤,确定了室内有害气体浓度监测过程中,采集的所有气体浓度数据中的异常数据,为了更加准确的进行有害气体浓度的异常监测,首先需要将气体浓度序列中的所有异常数据的剔除,即直接删除气体浓度序列中的异常数据,然后利用所获得的数据趋势项与季节项进行重新插值,从而获得完整的可信的室内有害气体浓度数据,便于进行有害气体浓度异常监测。
[0069] 本实施例首先对气体浓度序列进行不同尺度的分解,得到多尺度的残差项,通过对各个气体浓度数据在不同尺度上对应的残差项进行分析,可以有效提高残差项的可信度,从而提高对应气体浓度数据异常程度判断结果的可信度;同时可以避免气体浓度数据因本身趋势的异常对气体浓度数据单次分解的影响程度,有效提高所获得残差项的容错性,提高异常数据识别的稳定性与可靠性;此外,在气体浓度数据的分解过程中,分别从趋势项与季节项进行多尺度分解,提高残差项尺度的多样性,有效提高残差项对气体浓度数据的异常表现程度,便于对异常数据的识别与检测。
[0070] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。