一种基于相关性的报警关联变量检测方法及系统转让专利

申请号 : CN201710206963.0

文献号 : CN106778053B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王建东庞向坤黄越高嵩

申请人 : 国网山东省电力公司电力科学研究院国家电网公司

摘要 :

本发明公开了一种基于相关性的报警关联变量检测方法及系统,其中,该方法通过对关联变量建立二元时间序列,结合时间序列分段法和相关系数趋势法,快速自动地从历史数据中准确地获取异常数据段,从而进行异常数据检测,为实现多变量报警系统的动态报警阈值设计提供有利的条件,从而减少干扰报警,提高现场操作人员处理报警的效率,保障了生产安全性。

权利要求 :

1.一种基于相关性的报警关联变量检测方法,其特征在于,该方法在服务器或处理器内完成,其具体包括:步骤1:从历史检测数据中提取预设时间长度的报警变量及与其相关联的多个相关变量的数据,选择其中一组报警变量及相关变量作为检测对象;

步骤2:判断选择的报警变量及相关变量之间的动态延迟关系,进而建立二元时间序列T并将其标准化为T’;

步骤3:在由噪音引起的最小时间间隔的约束下,对二元时间序列T’进行分段;

步骤4:求取每一个分段的相关系数及其相关性趋势;

步骤5:根据相关性趋势与实际趋势比较,获取异常数据段及其相关信息;

在所述步骤3中对二元时间序列T’进行分段的过程包括:将二元时间序列T’作为待划分数据段;

根据待划分数据段中数据之间相关系数,判断待划分数据段所属的数据段分类属性;

其中,根据预设相关系数范围,数据段分类属性包括弱相关数据段、中相关数据段和强相关数据段。

2.如权利要求1所述的基于相关性的报警关联变量检测方法,其特征在于,在所述步骤

2中,若报警变量与相关变量之间存在动态延迟关系,则将预设时间长度的报警变量或者相关变量的时间长度进行平移并保持报警变量与相关变量之间存在动态延迟关系不变;如果报警变量与相关变量之间不存在动态延迟关系,则无需平移。

3.如权利要求1所述的基于相关性的报警关联变量检测方法,其特征在于,在所述步骤

3之前还包括:计算由噪音引起的最小时间间隔,其具体过程包括:(3.1.1)获取当前预设时间长度的报警变量的每一个下拐点,并求得相邻下拐点之间的距离,进而构成数组d;

(3.1.2)对数组d进行排序并去掉重复元素,得到数组d0;求取数组d0的斜率变化最大的点及其最接近的下拐点之间的距离dm,dm为报警变量中的最小时间间隔;

(3.1.3)对相关变量重复步骤(3.1.1)和(3.1.2),获得相关变量的最小时间间隔dh;

(3.1.4)将dm和dh中的较大值作为二元时间序列T’的最小时间间隔。

4.如权利要求1所述的基于相关性的报警关联变量检测方法,其特征在于,在所述步骤

3中对二元时间序列T’进行分段的过程,还包括:

针对待划分数据段,利用线性插值的方法,将二元时间序列T’中的数据点在其所属分段首尾数据点连线上的投影作为拟合点;

利用正交距离找到最远的点作为下一次分段的关键转折点,再确定待分数据段中是否存在强相关数据段,并更新关键转折点;

重复上述步骤,直到不再存在待划分数据段为止。

5.如权利要求4所述的基于相关性的报警关联变量检测方法,其特征在于,所述步骤4中,求取每一个分段的相关系数及其相关性趋势的具体过程,包括:(4.1):根据最终获得的关键转折点划分时间序列,利用相关系数公式来计算时间序列中每个分段的相关系数;

(4.2):对变量相关性进行单边假设检验,设置显著性水平,根据单边假设检验结果和显著性水平确认变量间的相关性,确定相关系数趋势。

6.一种基于相关性的报警关联变量检测系统,其特征在于,包括:数据提取模块,其用于从历史检测数据中提取预设时间长度的报警变量及与其相关联的多个相关变量的数据,选择其中一组报警变量及相关变量作为检测对象;

时间序列建立模块,其用于判断选择的报警变量及相关变量之间的动态延迟关系,进而建立二元时间序列T并将其标准化为T’;

时间序列分段模块,其用于在由噪音引起的最小时间间隔的约束下,对二元时间序列T’进行分段;

相关系数求取模块,其用于求取每一个分段的相关系数及其相关性趋势;

异常数据获取模块,其用于根据相关性趋势与实际趋势比较,获取异常数据段及其相关信息;

在所述时间序列建立模块中,若报警变量与相关变量之间存在动态延迟关系,则将预设时间长度的报警变量或者相关变量的时间长度进行平移并保持报警变量与相关变量之间存在动态延迟关系不变;如果报警变量与相关变量之间不存在动态延迟关系,则无需平移;

进一步地,该系统还包括:最小时间间隔计算模块,其用于获取当前预设时间长度的报警变量的每一个下拐点,并求得相邻下拐点之间的距离,进而构成数组d;

对数组d进行排序并去掉重复元素,得到数组d0;求取数组d0的斜率变化最大的点及其最接近的相邻下拐点之间的距离dm,dm为报警变量中的最小时间间隔;

获取相关变量的下拐点及相邻下拐点之间的距离,进而获得相关变量的最小时间间隔dh;

将dm和dh中的较大值作为二元时间序列的最小时间间隔;

进一步地,所述时间序列分段模块,包括:待分数据段获取模块,其用于将二元时间序列T’作为待划分数据段;

根据待划分数据段中数据之间相关系数,判断待划分数据段所属的数据段分类属性;

其中,根据预设相关系数范围,数据段分类属性包括弱相关数据段、中相关数据段和强相关数据段。

7.如权利要求6所述的基于相关性的报警关联变量检测系统,其特征在于,所述时间序列分段模块,还包括:拟合点求取模块,其用于针对待划分数据段,利用线性插值的方法,将标准化后的二元时间序列T’中的数据点在其所属分段首尾数据点连线上的投影作为拟合点;

关键转折点计算更新模块,其用于利用正交距离找到最远的点作为下一次分段的关键转折点,再确定待分数据段中是否存在强相关数据段,并更新关键转折点,直到不再存在待划分数据段为止。

8.如权利要求7所述的基于相关性的报警关联变量检测系统,其特征在于,所述相关系数求取模块,包括:分段相关系数计算模块,其用于根据最终获得的关键转折点划分时间序列,利用相关系数公式来计算时间序列中每个分段的相关系数;

相关系数趋势确定模块,其用于对变量相关性进行单边假设检验,设置显著性水平,根据单边假设检验结果和显著性水平确认变量间的相关性,确定相关系数趋势。

说明书 :

一种基于相关性的报警关联变量检测方法及系统

技术领域

[0001] 本发明属于信号处理领域,尤其涉及一种基于相关性的报警关联变量检测方法及系统。

背景技术

[0002] 报警系统对保障燃煤发电机组的安全生产与高效运行发挥着至关重要的作用,由于实际工业过程中关联变量之间的相互影响,传统的单变量报警阈值设计方法可能产生大量干扰报警(漏报警和误报警)并导致“报警过多”的发生,使得现场操作人员的注意力受到影响,增大了在异常生产状况发生时做出正确处置的难度。
[0003] 基于流程过程中设备或系统出现异常时变量间相关性往往较正常工况发生明显变化的大量案例事实,寻找一种基于相关性的报警关联变量的检测方法来自动筛选出处于正常状况和异常状况数据段的检测方法是十分必要的。

发明内容

[0004] 为了解决上述问题,本发明的第一目的是提供了一种基于相关性的报警关联变量检测方法。该方法能够快速自动地从历史数据中准确地获取异常数据段,从而进行异常数据检测,为实现多变量报警系统的动态报警阈值设计提供有利的条件,从而减少干扰报警,提高现场操作人员处理报警的效率,保障了生产安全性。
[0005] 本发明的基于相关性的报警关联变量检测方法,该方法在服务器或处理器内完成,其具体包括:
[0006] 步骤1:从历史检测数据中提取预设时间长度的报警变量及与其相关联的多个相关变量的数据,选择其中一组报警变量及相关变量作为检测对象;
[0007] 步骤2:判断选择的报警变量及相关变量之间的动态延迟关系,进而建立二元时间序列T并将其标准化为T’;
[0008] 步骤3:在由噪音引起的最小时间间隔的约束下,对二元时间序列T’进行分段;
[0009] 步骤4:求取每一个分段的相关系数及其相关性趋势;
[0010] 步骤5:根据相关性趋势与实际趋势比较,获取异常数据段及其相关信息。
[0011] 进一步的,在所述步骤2中,若报警变量与相关变量之间存在动态延迟关系,则将预设时间长度的报警变量或者相关变量的时间长度进行平移并保持报警变量与相关变量之间存在动态延迟关系不变;如果报警变量与相关变量之间不存在动态延迟关系,则无需平移。
[0012] 本发明首先判断报警变量与相关变量之间的动态延迟关系,进而建立了准确的二元时间序列T,进而能够准确地获取异常数据段,提高了现场操作人员处理报警的效率,保障了生产安全性。
[0013] 进一步地,在所述步骤3之前还包括:计算由噪音引起的最小时间间隔,其具体过程包括:
[0014] (3.1.1)获取当前预设时间长度的报警变量的每一个下拐点,并求得相邻下拐点之间的距离,进而构成数组d;
[0015] (3.1.2)对数组d进行排序并去掉重复元素,得到数组d0;求取数组d0的斜率变化最大的点及其最接近的下拐点之间的距离dm,dm为报警变量中的最小时间间隔;
[0016] (3.1.3)对相关变量重复步骤(3.1.1)和(3.1.2),获得相关变量的最小时间间隔dh;
[0017] (3.1.4)将dm和dh中的较大值作为二元时间序列T’的最小时间间隔。
[0018] 最小时间间隔用于减少噪音对分段结果的影响,在处理实际工业过程数据时,噪声的干扰会导致关键点之间的时间间隔过短,因此,在最小时间间隔的邻域区域不进行关键点搜索。
[0019] 进一步地,在所述步骤3中对二元时间序列T’进行分段的过程包括:
[0020] 将二元时间序列T’作为待划分数据段;
[0021] 根据待划分数据段中数据之间相关系数,判断待划分数据段所属的数据段分类属性;
[0022] 其中,根据预设相关系数范围,数据段分类属性包括弱相关数据段、中相关数据段和强相关数据段。
[0023] 其中,划分弱相关数据段和中相关数据段可规避漏分段现象,强相关数据段可规避过拟合现象。
[0024] 进一步地,在所述步骤3中对二元时间序列T’进行分段的过程,还包括:
[0025] 针对待划分数据段,利用线性插值的方法,将二元时间序列T’中的数据点在其所属分段首尾数据点连线上的投影作为拟合点;
[0026] 利用正交距离找到最远的点作为下一次分段的关键转折点,再确定待分数据段中是否存在强相关数据段,并更新关键转折点;
[0027] 重复上述步骤,直到不再存在待划分数据段为止。
[0028] 本发明在最小时间间隔的约束下,只针对弱相关数据段,时间长度过长且相关性不显著数据段,以及时间长度过长且相关性显著,但划分之后的子数据段仍为强相关的数据段进行时间序列划分,获取待划分数据段的关键转折点,对原始时间序列进行分段线性表示,从而避免过度拟合和疏漏分段。
[0029] 进一步地,所述步骤4中,求取每一个分段的相关系数及其相关性趋势的具体过程,包括:
[0030] (4.1):根据最终获得的关键转折点划分时间序列,利用相关系数公式来计算时间序列中每个分段的相关系数;
[0031] (4.2):对变量相关性进行单边假设检验,设置显著性水平,根据单边假设检验结果和显著性水平确认变量间的相关性,确定相关系数趋势。
[0032] 本发明利用相关系数公式来计算时间序列中每个分段的相关系数,再对变量相关性进行单边假设检验,设置显著性水平,根据单边假设检验结果和显著性水平确认变量间的相关性,确定了相关系数趋势,为准确获取异常数据段及其相关信息提供了精确数据,进而提高了报警的效率。
[0033] 本发明的第二目的是提供一种基于相关性的报警关联变量检测系统。
[0034] 本发明的一种基于相关性的报警关联变量检测系统,包括:
[0035] 数据提取模块,其用于从历史检测数据中提取预设时间长度的报警变量及与其相关联的多个相关变量的数据,选择其中一组报警变量及相关变量作为检测对象;
[0036] 时间序列建立模块,其用于判断选择的报警变量及相关变量之间的动态延迟关系,进而建立二元时间序列T并将其标准化为T’;
[0037] 时间序列分段模块,其用于在由噪音引起的最小时间间隔的约束下,对二元时间序列T’进行分段;
[0038] 相关系数求取模块,其用于求取每一个分段的相关系数及其相关性趋势;
[0039] 异常数据获取模块,其用于根据相关性趋势与实际趋势比较,获取异常数据段及其相关信息。
[0040] 在所述时间序列建立模块中,若报警变量与相关变量之间存在动态延迟关系,则将预设时间长度的报警变量或者相关变量的时间长度进行平移并保持报警变量与相关变量之间存在动态延迟关系不变;如果报警变量与相关变量之间不存在动态延迟关系,则无需平移。
[0041] 本发明首先判断报警变量与相关变量之间的动态延迟关系,进而建立了准确的二元时间序列T,进而能够准确地获取异常数据段,提高了现场操作人员处理报警的效率,保障了生产安全性。
[0042] 进一步地,该系统还包括:最小时间间隔计算模块,其用于获取当前预设时间长度的报警变量的每一个下拐点,并求得相邻下拐点之间的距离,进而构成数组d;
[0043] 对数组d进行排序并去掉重复元素,得到数组d0;求取数组d0的斜率变化最大的点及其最接近的相邻下拐点之间的距离dm,dm为报警变量中的最小时间间隔;
[0044] 获取相关变量的下拐点及相邻下拐点之间的距离,进而获得相关变量的最小时间间隔dh;
[0045] 将dm和dh中的较大值作为二元时间序列的最小时间间隔;
[0046] 最小时间间隔用于减少噪音对分段结果的影响,在处理实际工业过程数据时,噪声的干扰会导致关键点之间的时间间隔过短,因此,在最小时间间隔的邻域区域不进行关键点搜索。
[0047] 进一步地,所述时间序列分段模块,包括:待分数据段获取模块,其用于将二元时间序列T’作为待划分数据段;
[0048] 根据待划分数据段中数据之间相关系数,判断待划分数据段所属的数据段分类属性;
[0049] 其中,根据预设相关系数范围,数据段分类属性包括弱相关数据段、中相关数据段和强相关数据段。
[0050] 进一步地,所述时间序列分段模块,还包括:
[0051] 拟合点求取模块,其用于针对待划分数据段,利用线性插值的方法,将标准化后的二元时间序列T’中的数据点在其所属分段首尾数据点连线上的投影作为拟合点;
[0052] 关键转折点计算更新模块,其用于利用正交距离找到最远的点作为下一次分段的关键转折点,再确定待分数据段中是否存在第三种待分数据段,并更新关键转折点,直到不再存在待划分数据段为止。
[0053] 本发明在最小时间间隔的约束下,只针对弱相关数据段,时间长度过长且相关性不显著数据段,以及时间长度过长且相关性显著,但划分之后的子数据段仍为强相关的数据段进行时间序列划分,获取待划分数据段的关键转折点,对原始时间序列进行分段线性表示,从而避免过度拟合和疏漏分段。
[0054] 进一步地,所述相关系数求取模块,包括:
[0055] 分段相关系数计算模块,其用于根据最终获得的关键转折点划分时间序列,利用相关系数公式来计算时间序列中每个分段的相关系数;
[0056] 相关系数趋势确定模块,其用于对变量相关性进行单边假设检验,设置显著性水平,根据单边假设检验结果和显著性水平确认变量间的相关性,确定相关系数趋势。
[0057] 本发明利用相关系数公式来计算时间序列中每个分段的相关系数,再对变量相关性进行单边假设检验,设置显著性水平,根据单边假设检验结果和显著性水平确认变量间的相关性,确定了相关系数趋势,为准确获取异常数据段及其相关信息提供了精确数据,进而提高了报警的效率。
[0058] 与现有技术相比,本发明的有益效果是:
[0059] 本发明选取工业变量之间的相关性作为判断工作点状态是否异常的特征,通过对关联变量建立多元时间序列,结合时间序列分段法和相关系数趋势法,最大程度地减少过拟合现象和漏分段现象,快速自动地从历史数据中准确地获取异常数据段,从而进行异常数据检测为实现多变量报警系统的动态报警阈值设计提供有利的条件,从而减少干扰报警,提高现场操作人员处理报警的效率,保障了生产安全性。

附图说明

[0060] 构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
[0061] 图1为本发明的基于相关性的报警关联变量检测方法流程图;
[0062] 图2(a)为本发明的空预器入口烟温的变量时间序列和分段结果图;
[0063] 图2(b)为本发明的空预器出口烟温的变量时间序列和分段结果图;
[0064] 图3为本发明具体实施例中各分段相关系数及其置信区间;
[0065] 图4为本发明具体实施例中变量在各分段的相关性趋势;
[0066] 图5(a)为本发明的第一组多元时间序列散点图及拟合直线;
[0067] 图5(b)为本发明的第二组多元时间序列散点图及拟合直线;
[0068] 图5(c)为本发明的第三组多元时间序列散点图及拟合直线;
[0069] 图5(d)为本发明的第四组多元时间序列散点图及拟合直线;
[0070] 图6为本发明的基于相关性的报警关联变量检测系统结构示意图;
[0071] 图7为本发明的相关系数求取模块结构示意图。

具体实施方式

[0072] 应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
[0073] 需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0074] 图1是本发明的基于相关性的报警关联变量检测方法流程图。
[0075] 如图1所示的基于相关性的报警关联变量检测方法,该方法在服务器或处理器内完成,其具体包括:
[0076] 步骤1:从历史检测数据中提取预设时间长度的报警变量及与其相关联的多个相关变量的数据并选择一组相关变量和报警变量作为检测对象。
[0077] 具体地,提取当前工作点之前时间长度为N的多个相关变量的原始数据,选择一组报警变量和一组相关变量进行检测。
[0078] 以本发明所述方法在具体示例中的具体应用场景为电厂为例:
[0079] 选定电厂中的空气预热器入口烟温,作为报警变量,空气预热器出口风温为相关变量。在电厂中的一次停机事故中,从历史数据中选取停机前采样周期为1秒,样本容量为N=3600数据,选择一组空气预热器入口烟温和空气预热器出口风温用于异常数据检测。
[0080] 步骤2:判断报警变量与相关变量之间的动态延迟关系,进而建立二元时间序列T并将其标准化为T’;
[0081] 具体地,判断变量之间是否存在动态延迟关系,如果存在,则需要获取这两个变量的一段初始数据来求取延迟时间h,再将现有长度为N的报警变量或者相关变量的时间长度平移h。如果变量之间不存在动态延迟关系,则无需平移;h为正数;
[0082] 对已完成平移的或者不需进行平移的两组变量建立二元时间序列T,并将二元时间序列标准化为T’。
[0083] 在具体实施过程中,判断空气预热器入口烟温和空气预热器出口风温之间不存在动态延迟关系,故延迟时间为0。然后对两组数据构建二元时间序列,并将其标准化,标准化之后的二元时间序列记为T′=[T1(t),T2(t)],其中t=1,…,N,N为正整数;T1代表空气预热器入口烟温,T2代表空气预热器出口风温。
[0084] 步骤3:在由噪音引起的最小时间间隔的约束下,对标准化后的二元时间序列T进行分段。
[0085] 其中,在步骤3之前还包括:计算由噪音引起的最小时间间隔,其具体过程包括:
[0086] (3.1.1)获取当前预设时间长度的报警变量的每一个下拐点,并求得相邻下拐点之间的距离,进而构成数组d={d1,d2,d3,……,dx};
[0087] (3.1.2)对数组d进行排序并去掉重复元素,得到数组d0={d1,d2,d3,……,dx0},其中x0<x,其中,x0和x均为正整数;求取数组d0的斜率变化最大的点m及其对应的相邻下拐点之间的距离dm,dm为报警变量中的最小时间间隔;
[0088] (3.1.3)对相关变量重复步骤(3.1.1)和(3.1.2),获得相关变量的最小时间间隔dh;
[0089] (3.1.4)将dm和dh中的较大值作为二元时间序列T’的最小时间间隔δ,0<δ<n,N为正整数。
[0090] 其中,在步骤(3.1.2)中,求取数组d0的斜率变化最大的点m的方法可以采用:绘制以d0为横坐标,x0为纵坐标的折线图,在折线图中找到斜率变化最大的点m。
[0091] 需要说明的是,上述求取数组d0的斜率变化最大的点m的方法仅是一种实施例,还可以采用其他的现有方法来实现。
[0092] 计算获得由噪音引起的最小时间间隔δ为40s,将最小时间间隔用于关键点搜索中,经过相关系数的计算以及待划分数据段的筛选之后,最终确定获得5个关键点,即4个分段。故时间序列分段图如图2(a)和图2(b)所示。
[0093] 最小时间间隔用于减少噪音对分段结果的影响,在处理实际工业过程数据时,噪声的干扰会导致关键点之间的时间间隔过短,因此,在最小时间间隔的邻域区域不进行关键点搜索。
[0094] 具体地,步骤3中对二元时间序列T’进行分段的过程包括:
[0095] 将二元时间序列T’作为待划分数据段;
[0096] 根据待划分数据段中数据之间相关系数,判断待划分数据段所属的数据段分类属性;
[0097] 其中,根据预设相关系数范围,数据段分类属性包括弱相关数据段、中相关数据段和强相关数据段。
[0098] 例如:在当前划分情况下,计算各个分段之间的相关系数,进而获取待分数据段;其中,待分数据段有弱相关数据段、中相关数据段和强相关数据段这三种:
[0099] 第一种,满足相关系数为0.5≥ρs≥0.3的弱相关数据段;
[0100] 第二种,满足 且0.9>ρs>0.5或者0.1<ρs<0.3的数据段;
[0101] 第三种,满足zs>N/3且ρs≥0.9或ρs≤0.1的数据段在被划分之后,其子数据段为强相关;其中,ρs≤0.1为标准化后的二元时间序列T’的第s个分段内变量之间的相关系数;zs为第s个分段内样本个数;N为二元时间序列T’的预设时间长度;N和s为正整数。
[0102] 需要说明的是,本发明还可以设置其他预设相关系数范围,对数据段分成弱相关数据段、中相关数据段和强相关数据段这三种数据段。
[0103] 时间序列T’的第s个分段内变量Xi和Xj之间的Spearman样本相关系数为:
[0104]
[0105] 其中,划分第一种和第二种数据段可规避漏分段现象,划分第三种数据段可规避过拟合现象。
[0106] 进一步地,在步骤3中对标准化后的二元时间序列T’进行分段的过程,还包括:
[0107] 针对待划分数据段,利用线性插值的方法,将标准化后的二元时间序列T’中的数据点在其所属分段首尾数据点连线上的投影作为拟合点;
[0108] 利用正交距离找到最远的点作为下一次分段的关键转折点,再确定待分数据段中是否存在所述步骤(3.2.1)中的第三种待分数据段,并更新关键转折点;
[0109] 重复上述步骤,直到不再存在待划分数据段为止。
[0110] 其中,空间中直线AB的参数方程可表示为:
[0111]
[0112] 直线AB上任意一点P0的坐标可表示为:
[0113] [(XiB-XiA)β+XiA,(tB-tA)β+tA]。
[0114] 其中,X代表变量,t代表时间变量,i=1,2,分别代表报警变量和相关变量,A和B分别代表直线AB的两端,β代表一个定值。因此,点P到直线AB的距离可被定义为:
[0115]
[0116] 其中 指的是P点到直线AB的距离
[0117] 其中, 当 取极小值时对应的参数 则数据点P到其所属分段首尾连线AB的最小
距离即正交距离为 每一个分段中的D的最大值即为该分段的关键
转折点。
[0118] 本发明分别以图5(a)-图5(d)这四组多元时间序列为例,利用线性插值的方法,将标准化后的二元时间序列T中的数据点在其所属分段首尾数据点连线上的投影作为拟合点,分别得到的拟合直线,如图5(a)-图5(d)所示。
[0119] 本发明在最小时间间隔的约束下,只针对弱相关数据段,时间长度过长且相关性不显著数据段,以及时间长度过长且相关性显著,但划分之后的子数据段仍为强相关的数据段进行时间序列划分,获取待划分数据段的关键转折点,对原始时间序列进行分段线性表示,从而避免过度拟合和疏漏分段。
[0120] 步骤4:求取每一个分段的相关系数及其相关性趋势。
[0121] 具体地,求取每一个分段的相关系数及其相关性趋势的具体过程,包括:
[0122] (4.1):根据最终获得的关键转折点划分时间序列,利用相关系数公式来计算时间序列中每个分段的相关系数;
[0123] 根据最终获得的关键转折点集合P={P1,P2,...,Pk}划分变量的时间序列,此时多元时间序列T’的分段线性表示为:
[0124] TPLR=
[0125] 其中f1[(Xi(p1),p1),(Xi(p2),p2)]表示在分段[pj,pj+1]内的线性拟合函数。
[0126] (4.2):对变量相关性进行单边假设检验,设置显著性水平,根据单边假设检验结果和显著性水平确认变量间的相关性,确定相关系数趋势。
[0127] 在步骤(4.2)中,单边假设检验:H0:ρs[Xi,Xj]=0vs H1:ρs[Xi,Xj]>0;
[0128] H0:ρs[Xi,Xj]=0 vs H2:ρs[Xi,Xj]<0;
[0129] 当参与假设检验的样本个数n>10时,随 机变量Us被定义为:给定显著性水平α,如果Us>tα(zs-2),则与H1相对的H0被拒绝,
如果Us<-tα(zs-2),则与H2相对的H0被拒绝,其中tα(zs-2)表示统计量Us的分位数,此时,第s个分段内Xi和Xj的相关性被认为是显著的,符号方向signs(Xi,Xj)分别取值为1或-1,如果|Us|<tα(zs-2),无论对于H1或者H2,H0都不能被拒绝,此时变量间无显著相关性,符号方向signs(Xi,Xj)取值为0。
[0130] 当样本个数n<10时,查询用于小样本容量假设检验的Spearman秩相关系数的临界值,将对应于给定zs和α的相关系数临界值表示为ρα(zs),如果|ρs[Xi,Xj]|>ρα(zs),H0被拒绝,signs(Xi,Xj)分别取值为1或-1,反之H0不能被拒绝,符号方向signs(Xi,Xj)取值为0。
[0131] 根据获得的分段数,计算每一个分段的相关系数,绘制相关系数置信区间,如图3所示,其中L代表段数,L为正整数。
[0132] 给定α=0.05,对每一个分段进行相关性检验,从而确定变量之间的相关性趋势,如图4所示。
[0133] 本发明利用相关系数公式来计算时间序列中每个分段的相关系数,再对变量相关性进行单边假设检验,设置显著性水平,根据单边假设检验结果和显著性水平确认变量间的相关性,确定了相关系数趋势,为准确获取异常数据段及其相关信息提供了精确数据,进而提高了报警的效率。
[0134] 步骤5:根据相关性趋势与实际趋势比较,获取异常数据段及其相关信息。
[0135] 在步骤5中,还包括:获得报警变量和相关变量的时间序列分段图、散点图及拟合直线图、相关系数置信区间,如果存在动态延迟关系,还要获得发生平移之前的时间序列原图。
[0136] 根据相关性趋势分析结果可知,空气预热器入口烟温和空气预热器出口风温在正常情况下时正相关的关系,但是在两个变量在t=2142-2522s时间段是呈不相关,此时该段属于异常数据段。分析可知,在该数据段,有可能是引风机的故障引起空气预热器入口风速降低,风量减少,从而使得在空气预热器入口烟温不变的情况下,空气预热器出口风温略有升高,当调整引风机之后,两个变量之间的关系恢复正常。
[0137] 本发明选取工业变量之间的相关性作为判断工作点状态是否异常的特征,通过对关联变量建立二元时间序列,结合时间序列分段法和相关系数趋势法,最大程度地减少过拟合现象和漏分段现象,快速自动地从历史数据中准确地获取异常数据段,从而进行异常数据检测为实现多变量报警系统的动态报警阈值设计提供有利的条件,从而减少干扰报警,提高现场操作人员处理报警的效率,保障了生产安全性。
[0138] 图6是本发明的基于相关性的报警关联变量检测系统的结构示意图。
[0139] 如图6所示的,本发明的一种基于相关性的报警关联变量检测系统,包括:
[0140] (1)数据提取模块,其用于从历史检测数据中提取预设时间长度的报警变量及与其相关联的多个相关变量的数据并作为检测对象。
[0141] (2)时间序列建立模块,其用于判断选择的报警变量及相关变量之间的动态延迟关系,进而建立二元时间序列T并将其标准化为T’。
[0142] 进一步地,在所述时间序列建立模块中,若报警变量与相关变量之间存在动态延迟关系,则获取这两个变量的一段初始数据来求取延迟时间h,再将预设时间长度的报警变量或者相关变量的时间长度平移h;如果报警变量与相关变量之间不存在动态延迟关系,则无需平移。
[0143] 本发明首先判断报警变量与相关变量之间的动态延迟关系,进而建立了准确的二元时间序列T,进而能够准确地获取异常数据段,提高了现场操作人员处理报警的效率,保障了生产安全性。
[0144] (3)时间序列分段模块,其用于在由噪音引起的最小时间间隔的约束下,对二元时间序列T’进行分段。
[0145] 进一步地,所述时间序列分段模块,包括:待分数据段获取模块,其用于将二元时间序列T’作为待划分数据段;
[0146] 根据待划分数据段中数据之间相关系数,判断待划分数据段所属的数据段分类属性;
[0147] 其中,根据预设相关系数范围,数据段分类属性包括弱相关数据段、中相关数据段和强相关数据段。
[0148] 具体地,预设相关系数范围,将数据段分类属性包括弱相关数据段、中相关数据段和强相关数据段以下列范围为例:
[0149] 待分数据段有三种:
[0150] 第一种,满足相关系数为0.5≥ρs≥0.3的弱相关数据段;
[0151] 第二种,满足 且0.9>ρs>0.5或者0.1<ρs<0.3的数据段;
[0152] 第三种,满足zs>n/3且ρs≥0.9或ρs≤0.1的数据段在被划分之后,其子数据段仍为强相关;其中,ρs≤0.1为标准化后的二元时间序列T’的第s个分段内变量之间的相关系数;zs为第s个分段内样本个数;N为二元时间序列T’的预设时间长度;N和s为正整数。。
[0153] 其中,划分第一种和第二种数据段可规避漏分段现象,划分第三种数据段可规避过拟合现象。
[0154] 进一步地,所述时间序列分段模块,还包括:
[0155] 拟合点求取模块,其用于针对待划分数据段,利用线性插值的方法,将标准化后的二元时间序列T’中的数据点在其所属分段首尾数据点连线上的投影作为拟合点;
[0156] 关键转折点计算更新模块,其用于利用正交距离找到最远的点作为下一次分段的关键转折点,再确定待分数据段中是否存在第三种待分数据段,并更新关键转折点,直到不再存在待划分数据段为止。
[0157] 本发明在最小时间间隔的约束下,只针对弱相关数据段,时间长度过长且相关性不显著数据段,以及时间长度过长且相关性显著,但划分之后的子数据段仍为强相关的数据段进行时间序列划分,获取待划分数据段的关键转折点,对原始时间序列进行分段线性表示,从而避免过度拟合和疏漏分段。
[0158] (4)相关系数求取模块,其用于求取每一个分段的相关系数及其相关性趋势。
[0159] 如图7所示,相关系数求取模块,包括:
[0160] 分段相关系数计算模块,其用于根据最终获得的关键转折点划分时间序列,利用相关系数公式来计算时间序列中每个分段的相关系数;
[0161] 相关系数趋势确定模块,其用于对变量相关性进行单边假设检验,设置显著性水平,根据单边假设检验结果和显著性水平确认变量间的相关性,确定相关系数趋势。
[0162] 本发明利用相关系数公式来计算时间序列中每个分段的相关系数,再对变量相关性进行单边假设检验,设置显著性水平,根据单边假设检验结果和显著性水平确认变量间的相关性,确定了相关系数趋势,为准确获取异常数据段及其相关信息提供了精确数据,进而提高了报警的效率。
[0163] (5)异常数据获取模块,其用于根据相关性趋势与实际趋势比较,获取异常数据段及其相关信息。
[0164] 进一步地,该系统还包括:最小时间间隔计算模块,其用于获取当前预设时间长度的报警变量的每一个下拐点,并求得相邻下拐点之间的距离,进而构成数组d;
[0165] 对数组d进行排序并去掉重复元素,得到数组d0;求取数组d0的斜率变化最大的点及其最接近的下拐点之间的距离dm,dm为报警变量中的最小时间间隔;
[0166] 获取相关变量的下拐点及相邻下拐点之间的距离,进而获得相关变量的最小时间间隔dh;
[0167] 将dm和dh中的较大值作为二元时间序列T’的最小时间间隔。
[0168] 最小时间间隔用于减少噪音对分段结果的影响,在处理实际工业过程数据时,噪声的干扰会导致关键点之间的时间间隔过短,因此,在最小时间间隔的邻域区域不进行关键点搜索。
[0169] 本发明选取工业变量之间的相关性作为判断工作点状态是否异常的特征,通过对关联变量建立二元时间序列,结合时间序列分段法和相关系数趋势法,最大程度地减少过拟合现象和漏分段现象,快速自动地从历史数据中准确地获取异常数据段,从而进行异常数据检测为实现多变量报警系统的动态报警阈值设计提供有利的条件,从而减少干扰报警,提高现场操作人员处理报警的效率,保障了生产安全性。
[0170] 上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。