一种火力发电厂时间序列变量异常监测方法及系统转让专利

申请号 : CN201910620134.6

文献号 : CN110298767B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王建东王振杨子江周东华

申请人 : 山东科技大学

摘要 :

本发明公开了一种火力发电厂时间序列变量异常监测方法及系统,包括:采集火力发电厂模拟信号监测变量的时间序列数据;将整个时间序列数据作为初始的最佳PLR段,计算所述最佳PLR段的决定系数,将历史样本数据中整个时间序列作为第一层原始数据段;对原始数据段进行分割,形成两个新的数据段,并分别计算两个新的数据段的决定系数;判断分段是否允许,如果允许,继续分段;判断分段是否结束,得到最佳的PLR分段数。本发明通过决定系数的方法来确定PLR的最优分段数,克服了使用L方法高度依赖拟合误差以及时间序列中左右点问题。

权利要求 :

1.一种火力发电厂时间序列变量异常监测方法,其特征在于,包括:

(1)采集火力发电厂模拟信号监测变量的时间序列数据;将整个时间序列数据作为初始的最佳PLR段,计算所述最佳PLR段的决定系数,并设定阈值所述PLR,即分段线性表示方法,能够从历史时间序列数据样本中提取内在信息,通过分段线性表示方法对火力发电厂中模拟信号的监测变量数据进行分段处理,能够提取火力发电厂监测变量中连续变化的趋势,及时发现系统运行过程中的异常情况;

(2)将历史样本数据中整个时间序列作为第一层原始数据段;

(3)对原始数据段进行分割,形成两个新的数据段,并分别计算两个新的数据段的决定系数;

(4)如果所述的两个决定系数中,至少一个满足分割条件,则表示分段允许,进入步骤(5);否则,分段结束;

所述分割条件具体为:当前决定系数大于原始数据段的决定系数,并且大于设定阈值(5)将分段后的两个数据段分别作为下一层原始数据段,对下一层每一个原始数据段重复步骤(3)-(4);

(6)直到所有分割后的数据段均不满足分割条件,分段结束,得到的分段数作为PLR最佳分段数;

(7)对每一个分段的时间序列数据进行线性拟合,通过拟合结果判断火力发电厂模拟信号监测变量是否存在异常。

2.如权利要求1所述的一种火力发电厂时间序列变量异常监测方法,其特征在于,将时间序列x(1:N)=[x(1),x(2),…,x(N)]分为多个连续不重叠的数据段x(t1:t2-1),x(t2:t3-

1),…x(tK:N);对于第k个数据段x(tk:tk+1-1),决定系数为:其中,N为历史样本数据的个数,K为数据段个数,x(t)为某个数据样本的线性回归值,是x(t)的估计值。

3.如权利要求1所述的一种火力发电厂时间序列变量异常监测方法,其特征在于,将最佳PLR段初始化为历史样本数据中整个时间序列,即0=[1,N]作为决定系数树的第一层;其中,N为历史样本数据的个数;

将历史样本数据中整个时间序列分割成两个数据段PLR1和PLR2,如果分段允许,则将时间索引tk0插入到T0中,T1=[T0,tk0],对T1中的时间索引进行升序排列,得到T1=[1,tk0,N]作为决定系数树的第二层;

将数据段PLR1分割成两个数据段PLR1-1和PLR1-2,如果分段允许,则时间索引tk1插入到T1并进行升序排列,形成T2=[1,tk1,tk0,N]或者T2=[1,tk0,tk1,N],作为决定系数树的第三层;

将数据段PLR2分割成两个数据段PLR2-1和PLR2-2,如果分段允许,则时间索引tk2插入到T2并进行升序排列,形成T3=[1,tk1,tk0,tk2,N]或者T3=[1,tk2,tk0,tk1,N],作为决定系数树的第四层;

依次类推,直到所有的数据段都不满足分割条件;插入的时间索引的数量即为PLR最佳分段数。

4.如权利要求1所述的一种火力发电厂时间序列变量异常监测方法,其特征在于,采用自底向上的分段线性表示方法从历史数据样本中将长连续时间序列分割成多个短数据段,每个短数据段用直线表示。

5.一种火力发电厂时间序列变量异常监测系统,其特征在于,包括:

用于采集火力发电厂模拟信号监测变量的时间序列数据的模块;

用于将整个时间序列数据作为初始的最佳PLR段,计算所述最佳PLR段的决定系数,并设定阈值 的模块;

所述PLR,即分段线性表示方法,能够从历史时间序列数据样本中提取内在信息,通过分段线性表示方法对火力发电厂中模拟信号的监测变量数据进行分段处理,能够提取火力发电厂监测变量中连续变化的趋势,及时发现系统运行过程中的异常情况;

用于将历史样本数据中整个时间序列作为原始数据段的模块;

用于对原始数据段进行分割,形成两个新的数据段,并分别计算两个新的数据段的决定系数的模块;

用于根据所述的两个决定系数判断分段是否允许的模块;

如果所述的两个决定系数中,至少一个满足分割条件,则表示分段允许,否则,分段结束;

所述分割条件具体为:当前决定系数大于原始数据段的决定系数,并且大于设定阈值用于判断分段过程是否结束的模块;

用于获取PLR最佳分段数的模块;

用于对每一个分段的时间序列数据进行线性拟合,通过拟合结果判断火力发电厂模拟信号监测变量是否存在异常的模块。

6.一种终端设备,其包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,其特征在于,所述指令适于由处理器加载并执行权利要求1-4任一项所述的火力发电厂时间序列变量异常监测方法。

7.一种计算机可读存储介质,其中存储有多条指令,其特征在于,所述指令适于由终端设备的处理器加载并执行权利要求1-4任一项所述的火力发电厂时间序列变量异常监测方法。

说明书 :

一种火力发电厂时间序列变量异常监测方法及系统

技术领域

[0001] 本发明涉及火力发电厂模拟信号变量监测技术领域,尤其涉及一种火力发电厂时间序列变量异常监测方法及系统。

背景技术

[0002] 本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
[0003] 时间序列是指按照时间先后顺序排列的各个观测记录的有序集合,广泛存在于商业、经济、科学工程和社会科学等领域。近年来,时间序列数据上的数据挖掘研究受到普遍关注,包括关联规则挖掘、相似性查询、模式发现、异常检测等。
[0004] 分段线性表示方法(PLR)能够从历史时间序列数据样本中提取内在信息,通过分段线性表示方法对火力发电厂中模拟信号的监测变量数据进行分段处理,能够提取火力发电厂监测变量中连续变化的趋势,及时发现系统运行过程中的异常情况。
[0005] 但是,发明人发现,基于分段线性表示方法对火力发电厂中时间序列的模拟信号变量进行分段时,往往不能选择出最佳的分段数,而分段数过大或者过小都会导致无法获得数据准确地变化趋势,进而无法准确判断火力发电厂系统的异常运行情况。

发明内容

[0006] 为了解决上述问题,本发明提出一种火力发电厂时间序列变量异常监测方法及系统,通过查看决定系数的变化来选择最佳PLR段,进而准确提取火力发电厂监测数据的变化趋势,及时发现系统的异常状况。
[0007] 在一些实施方式中,采用如下技术方案:
[0008] 一种火力发电厂时间序列变量异常监测方法,包括:
[0009] (1)采集火力发电厂模拟信号监测变量的时间序列数据;将整个时间序列数据作为初始的最佳PLR段,计算所述最佳PLR段的决定系数,并设定阈值
[0010] (2)将历史样本数据中整个时间序列作为第一层原始数据段;
[0011] (3)对原始数据段进行分割,形成两个新的数据段,并分别计算两个新的数据段的决定系数;
[0012] (4)如果所述的两个决定系数中,至少一个满足分割条件,则表示分段允许,进入步骤(5);否则,分段结束;
[0013] (5)将分段后的两个数据段分别作为下一层原始数据段,对下一层每一个原始数据段重复步骤(3)-(4);
[0014] (6)直到所有分割后的数据段均不满足分割条件,分段结束,得到的分段数作为PLR最佳分段数;
[0015] (7)对每一个分段的时间序列数据进行线性拟合,通过拟合结果判断火力发电厂模拟信号监测变量是否存在异常。
[0016] 进一步地,所述分割条件具体为:当前决定系数大于原始数据段的决定系数,并且大于设定阈值
[0017] 在另一些实施方式中,采用如下技术方案:
[0018] 一种火力发电厂时间序列变量异常监测的系统,包括:
[0019] 用于采集火力发电厂模拟信号监测变量的时间序列数据的模块;
[0020] 用于将整个时间序列数据作为初始的最佳PLR段,计算所述最佳PLR段的决定系数,并设定阈值 的模块;
[0021] 用于将历史样本数据中整个时间序列作为原始数据段的模块;
[0022] 用于对原始数据段进行分割,形成两个新的数据段,并分别计算两个新的数据段的决定系数的模块;
[0023] 用于根据所述的两个决定系数判断分段是否允许的模块;
[0024] 用于判断分段过程是否结束的模块;
[0025] 用于获取PLR最佳分段数的模块;
[0026] 用于对每一个分段的时间序列数据进行线性拟合,通过拟合结果判断火力发电厂模拟信号监测变量是否存在异常的模块。
[0027] 在另一些实施方式中,采用如下技术方案:
[0028] 一种终端设备,其包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,其特征在于,所述指令适于由处理器加载并执行上述的火力发电厂时间序列变量异常监测方法。
[0029] 在另一些实施方式中,采用如下技术方案:
[0030] 一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行上述的火力发电厂时间序列变量异常监测方法。
[0031] 与现有技术相比,本发明的有益效果是:
[0032] 基于决定系数确定最佳的分段数,可以保证PLR的分段效果,有利于准确提取监测变量的变化趋势,进而准确地实现火力发电厂时间序列的模拟信号变量的异常监测。
[0033] 通过引入更多PLR段,时间序列与其PLR之间的近似误差会减少,从而引起决定系数的增加。但是决定系数随着较短PLR段中的幅度变化减小而减小。本发明充分平衡了上述两个条件的限制,根据决定系数的增量确定是否进行分段,分段更加合理,分段效率更高,提高火力发电厂时间序列的模拟信号变量的异常监测效率和准确率。
[0034] 通过决定系数的方法来确定PLR的最优分段数,克服了现有技术中确定最佳分段数时高度依赖拟合误差以及时间序列中左右点问题;既保留了原始时间序列的整体特征,又保证了拟合误差最小,并提高了时间效率。

附图说明

[0035] 图1为本发明实施例一中分段数K分别为1,2,3,4的近似直线;
[0036] 图2为本发明实施例一中不同K时的决定系数树。

具体实施方式

[0037] 应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本发明使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
[0038] 需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0039] 实施例一
[0040] 专业术语解释:
[0041] 所述分段线性表示,是指将一定长度的时间序列X分割成较短的段,且每段用直线表示,本公开采用自底向上的方法进行PLR分段。
[0042] 所述输出时间序列,是指输出数值按其发生的时间先后顺序排列而成的数列。
[0043] 所述输入时间序列,是指输入变量值按其发生的时间先后顺序排列而成的数列。
[0044] 火力发电厂中每个监测变量都会有不同的阶段(信号上升阶段、下降阶段)或状态(正常、异常等),监测变量的单点数据无法反映这样的阶段或状态,需要时间连续的若干数据才能反映监测变量中这些阶段或状态。PLR可以以直线段对相同趋势时间连续的若干数据进行拟合,通过PLR拟合结果提取每个直线段的变化幅值和变化时长等信息,有利于发现系统中的异常。
[0045] 在一个或多个实施方式中,公开了一种火力发电厂时间序列变量异常监测方法,包括以下步骤:
[0046] (1)采集火力发电厂模拟信号监测变量的时间序列数据;将整个时间序列数据作为初始的最佳PLR段,计算所述最佳PLR段的决定系数,并设定阈值
[0047] 其中,火力发电厂模拟信号监测变量的时间序列数据可以是:有效发电量数据、各种液位数据、流量数据、温度数据、发电机频率数据、压力数据或者耗煤量等等。
[0048] (2)将历史样本数据中整个时间序列作为第一层原始数据段;
[0049] (3)对原始数据段进行分割,形成两个新的数据段,并分别计算两个新的数据段的决定系数;
[0050] (4)如果所述的两个决定系数中,至少一个满足分割条件:大于原始数据段的决定系数,并且大于设定阈值 则表示分段允许,否则,分段结束;
[0051] (5)将分段后的两个数据段分别作为下一层原始数据段,对下一层每一个原始数据段重复步骤(3)-(4);
[0052] (6)直到所有分割后的数据段均不满足分割条件,分段结束,得到的分段数作为PLR最佳分段数;
[0053] (7)对每一个分段的时间序列数据进行线性拟合,通过拟合结果判断火力发电厂模拟信号监测变量是否存在异常。
[0054] 本实施例上述方法中,
[0055] 1.采用自底向上的方法将一定长度的时间序列x分割成较短的段,且每段用直线表示:
[0056] 将时间序列x(1:N)=[x(1),x(2),…,x(N)]分为多个连续不重叠的数据段x(t1:t2-1),x(t2:t3-1),…x(tK:N),且每段用直线表示。对于第k个数据段x(tk:tk+1-1),tk表示第k段中第一个数据样本,k∈[1,K];
[0057] 用线性回归模型来描述:
[0058] x(t)=ak+bkt+e(t);
[0059] 其中,ak,bk分别是截距和斜率参数,e(t)是具有零均值和方差为 的高斯白噪声;
[0060] 得到拟合线性方程:
[0061]
[0062] 其中, 和 分别是x(t)、ak和bk的估计值,用K表示数据段个数;
[0063] 估计参数 和 均来自最小二乘法的解析表达式:
[0064]
[0065] 其中,
[0066] 2.决定系数(R平方统计量)用来测量K个PLR段中第k段x(tk:tk+1-1)的变化比例:
[0067]
[0068] 其中, 近似成为等式:
[0069]
[0070] 其中, 噪声方差, 是PLR段x(tk:tk+1-1)的近似直线的幅度变化。因此, 和 分别代表噪声和原始信号对 所占比例,在与噪声方
差 的比较中,当幅度变化Ax,K非常大(小)时,将导致 接近′1′(或′0′)。给定最佳分段K0,如果分段数小于K0时,则可以通过引入更多的直线来近似x(t)来进一步减小 从而增加 因此,对 的上述观察意味着最佳PLR段是达到 的最大值的段。
[0071] 如果新PLR段的两个决定系数中的至少一个明显大于该PLR段的决定系数且大于给定阈值时,那么之前的PLR段被分割成两个PLR段是被接受的,如图1所示。由于 的理论范围是[0,1],因此默认的重要阈值是 表示对 的噪声和信号所占比例是相等的。事实上,重要的阈值 用是由户进行定义的。所提出的方法同样适用于 的不同值。
[0072] 3.本实施例方法的具体实现过程如下:
[0073] 将最佳PLR段初始化为整个时间序列,即T0=[1,N]的决定系数为
[0074] T0=[1,N]作为决定系数树的第一层;其中,N为历史样本数据的个数;
[0075] 将历史样本数据中整个时间序列分割成两个数据段PLR1和PLR2,如果分段允许,则将时间索引tk0插入到T0中,T1=[T0,tk0],对T1中的时间索引进行升序排列,得到T1=[1,tk0,N]作为决定系数树的第二层;
[0076] 分段允许的条件为:
[0077] 数据段PLR1和数据段PLR2中,至少有一个数据段的决定系数满足分割条件:决定系数大于整个时间序列的决定系数,并且大于设定阈值
[0078] 将数据段PLR1分割成两个数据段PLR1-1和PLR1-2,如果分段允许,则时间索引tk1插入到T1并进行升序排列,形成T2=[1,tk1,tk0,N]或者T2=[1,tk0,tk1,N],作为决定系数树的第三层;
[0079] 将数据段PLR2分割成两个数据段PLR2-1和PLR2-2,如果分段允许,则时间索引tk2插入到T2并进行升序排列,形成T3=[1,tk1,tk0,tk2,N]或者T3=[1,tk2,tk0,tk1,N],作为决定系数树的第四层;
[0080] 依次类推,直到所有的数据段都不满足分割条件得到如图2所示的决定系数树;
[0081] 插入的时间索引的数量即为PLR最佳分段数。
[0082] 需要说明的是,本实施例通过线性分段拟合的结果可以用来判断变量是否发生异常,除此之外,还可以根据拟合直线判断平稳的数据(直线斜率几乎为零时)、变化幅度比较显著的数据段等等。
[0083] 另外需要说明的是,本实施例方法不仅适用于对火力发电厂中模拟信号的监测变量数据的异常情况监测,还可以扩展应用到对石油化工、制造业等等流程工业中的模拟信号的监测变量数据的异常情况监测,适用范围广。
[0084] 4.以下是本实施例所述方法在具体示例中的应用。
[0085] 所有工业实例都基于过程变量x作为来自大型发电厂的单位MW中的有效发电量。
[0086] 对一组历史时间序列x进行自底向上PLR分段,且每段用直线表示;
[0087] 计算出每段的决定系数;
[0088] 参照图2,决定系数树第一层整个PLR段具有决定系数 在第二层被分成两个PLR段决定系数为 和 其满足分割条件,则认为分段是
值得的,在第二层 的那段,再分成两个PLR段,其决定系数为 和
依旧满足分割条件,因此从K=2到K=3也是值得的。对于其余层,在第10层之
前分离都是不值得的。当第9层 的第5个PLR段在第10层被分成两个PLR段,其
中 和 再次满足分割条件。最后,所提出的方法产生5个PLR
段,即T0=[1446,2132,2221,3310,3600]。
[0089] 上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。