通过模式序列使用内核回归建模的监控系统转让专利

申请号 : CN201280035581.1

文献号 : CN103842922B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : J.P.赫措

申请人 : 智能信号公司

摘要 :

本发明提供一种用于确定对象状态的监控系统,所述监控系统包括经验模型,所述经验模型具有:参考数据,所述参考数据指示所述对象的常规运行状态;以及输入模式阵列。每个输入模式阵列具有多个按时间排序的输入向量,而每个输入向量具有输入值,所述输入值代表指示所述对象的当前状态的多个参数。所述经验模型基于使用输入模式阵列和所述参考数据进行的计算而产生估值,以确定所述输入值与所述参考数据之间的相似性度量。差分模块将所述估值与对应的输入值进行比较,以便可以使用比较所得的值确定所述对象的状态。

权利要求 :

1.一种用于确定对象状态的监控系统,所述系统包括:

经验模型,所述经验模型具有指示所述对象的常规运行状态的参考数据以及输入模式阵列,每个输入模式阵列具有多个按时间排序的输入向量,每个输入向量具有输入值,所述输入值代表指示所述对象的当前状态的多个参数,所述经验模型配置成基于使用输入模式阵列和所述参考数据进行的计算而产生估值,以确定所述输入值与所述参考数据之间的相似性度量;以及差分模块,所述差分模块将所述估值与对应的输入值进行比较,以便比较所得的值可用于确定所述对象的状态;

其中,所述输入模式阵列描述模式动窗,当所述模式动窗沿时间线移动时,改变所述输入向量。

2.根据权利要求1所述的系统,其中至少一个所述输入向量处于多个输入模式阵列中。

3.根据权利要求1所述的系统,其中每个输入模式阵列代表时间段,所述时间段包括多个时间点,所述多个时间点沿着代表所述对象的运行状态的输入向量序列分布。

4.根据权利要求3所述的系统,其中每个输入模式阵列代表时间段,所述时间段与至少其他一个输入模式阵列的时间段不同但重叠。

5.根据权利要求3所述的系统,其中每个输入模式阵列具有当前主向量,所述当前主向量来自所述输入向量序列并且代表所述输入模式阵列内的最近时间点。

6.根据权利要求5所述的系统,其中为每个输入模式阵列选择所述输入向量的方法是沿着所述序列移动回溯窗口、选择所述当前主向量以及沿着所述序列选择位于所述当前主向量之后并且适合在所述窗口内的一个或多个较早向量。

7.根据权利要求6所述的系统,其中所述较早向量是沿着所述序列的连续向量。

8.根据权利要求6所述的系统,其中所述较早向量不是沿所述序列的连续向量。

9.根据权利要求1所述的系统,其中表示为输入模式阵列内的所述输入向量的时间点之间的时间间隔是均匀的。

10.根据权利要求1所述的系统,其中表示为输入模式阵列内的所述输入向量的时间点之间的时间间隔是不相等的。

11.根据权利要求1所述的系统,其中对于表示为输入模式阵列内的所述输入向量的时间点而言,较近期输入向量之间的时间间隔短于同一输入模式阵列内的较晚输入向量之间的时间间隔。

12.根据权利要求1所述的系统,其中表示为所述输入模式阵列的总持续时间不同。

13.根据权利要求1所述的系统,其中所述计算基于包括以下项的方程式:

14.根据权利要求1所述的系统,其中所述计算基于包括以下项的方程式:

15.根据权利要求1所述的系统,其中所述相似性度量是指示输入值的有界范围中的值,并且参考值在所述范围的一端上相同并且在所述范围的另一端上完全不同。

16.根据权利要求1所述的系统,其中所述参考数据包括至少一个习得序列化模式矩阵,每个习得序列化模式矩阵具有多个参考向量,每个参考向量具有代表多个参数的参考值。

17.根据权利要求16所述的系统,其中所述参考数据形成所述习得序列化模式矩阵的三维集合。

18.根据权利要求17所述的系统,其中所述三维集合定义为三个维度,所述维度表示沿第一维度的参数、沿第二维度的所述习得序列化模式矩阵,以及表示为第三维度中的所述参考向量的时间。

19.根据权利要求17所述的系统,其中将每个输入模式阵列与所述三维集合中的每个习得序列化模式矩阵进行比较,以确定每个习得序列化模式矩阵的相似性度量。

20.根据权利要求17所述的系统,其中每个习得序列化模式矩阵代表特定时间段,所述时间段包括表示为所述参考向量的时间点,其中所述时间段与所述三维集合中的一些或全部其他习得序列化模式矩阵的时间段不同、但是重叠。

21.根据权利要求17所述的系统,其中所述习得序列化模式矩阵中的向量数量与所述输入模式阵列相同。

22.根据权利要求17所述的系统,其中所述习得序列化模式与所述输入模式阵列矩阵所代表的时间点相同。

23.根据权利要求17所述的系统,其中一个所述习得序列化模式矩阵与一个所述输入模式阵列之间的相似性基于相应参考值与输入值之间的相似性,其中所述参考值和输入值代表相对于其对应阵列中的其他向量位置的相同向量位置。

24.根据权利要求17所述的系统,其中一个所述习得序列化模式矩阵与一个所述输入模式阵列之间的相似性包括计算表示为所述阵列的每个参数的平均标量相似性值。

25.根据权利要求17所述的系统,其中一些或全部所述输入模式阵列代表某时间段,所述时间段与表示为至少一个所述习得序列化模式矩阵的时间段不同。

26.根据权利要求17所述的系统,其中由所述习得序列模式矩阵代表的时段变化。

27.根据权利要求1所述的系统,其中所述经验模型配置成产生所述估值,所述估值采用具有多个估值向量的估值矩阵的形式。

28.根据权利要求27所述的系统,其中每个估值矩阵中的所述估值向量对应于表示为所述输入模式阵列中的所述输入向量的所述时间点。

29.根据权利要求27所述的系统,其中使用所述估值矩阵内的部分所述估值确定所述对象的状态。

30.根据权利要求27所述的系统,其中所述差分模块仅使用代表每个估值矩阵内的最近时间点的估值来确定所述对象的状态。

31.根据权利要求27所述的系统,包括为多个估值矩阵的每个时间点提供单个估值向量以确定所述对象的状态。

32.根据权利要求31所述的系统,其中通过使用以下项中的至少一项来提供所述单个估值向量:在多个估值矩阵的所述时间点上选择具有一个或多个估值的估值向量,所述估值具有相对于其他估值向量的最大值、最小值或中间值,在多个估值矩阵的所述时间点上,计算所述估值的平均值、加权平均值或加权范数,以及在多个估值矩阵的所述时间点上选择估值向量,所述估值向量相对于其他估值向量与对应的输入向量最相似。

33.根据权利要求27所述的系统,其中所述经验模型提供估值向量,以使用以下项中的至少一项确定所述对象的状态:每个估值矩阵中的估值向量,所述估值向量具有最大、最小或中间估值,所述估值矩阵中用于为每个矩阵形成单个估值的估值加权平均值或加权范数,以及所述估值矩阵内与各自的对应输入向量最相似的估值向量。

34.根据权利要求1所述的系统,其中所述经验模型配置成使用所述相似性度量作为权重来计算习得序列化模式矩阵的三维集合,所述三维集合代表所述输入模式阵列中不涉及的参数。

35.根据权利要求34所述的系统,其中用于产生所述相似性度量的参考数据不代表表示为所述三维集合的所有参数。

36.根据权利要求34所述的系统,其中所述三维集合仅代表不表示为所述输入模式阵列的参数。

37.根据权利要求35所述的系统,其中所述三维集合代表所述输入模式阵列中未被代表的参数和所述输入模式阵列中被代表的参数。

38.根据权利要求1所述的系统,包括局部化模块,所述局部化模块用于重新确定使用哪些参考数据来产生每个输入模式阵列的估值。

39.根据权利要求1所述的系统,包括适配模块,所述适配模块配置成当所述估值指示代表常规运行状态的对应输入模式阵列时,将所述输入模式阵列添加到所述参考数据中。

40.一种用于确定对象状态的监控系统,包括:

经验模型,所述经验模型由至少一个处理器操作并且包括参考数据,所述参考数据指示所述对象的常规运行状态并且采用多个习得序列化模式矩阵的形式,每个习得序列化模式矩阵具有多个参考向量,每个参考向量具有代表多个参数的参考值,以及输入数据,所述输入数据代表指示所述对象的当前状态的多个参数,其中所述经验模型配置成基于使用所述输入数据与所述习得序列化模式矩阵进行的计算而产生估值,以确定所述输入数据与所述多个参考矩阵中的参考值之间的相似性测量;以及差分模块,所述差分模块将所述估值与对应的输入值进行比较,以便可以使用比较所得的值确定所述对象的状态;

其中,所述输入模式阵列描述模式动窗,当所述模式动窗沿时间线移动时,改变所述输入向量。

41.一种用于确定对象状态的监控系统,包括:

经验模型,所述经验模型包括参考数据,所述参考数据指示所述对象的常规运行状态,以及输入数据,所述输入数据代表指示所述对象的当前状态的多个参数,其中所述经验模型配置成基于使用所述输入数据和所述参考数据进行的计算而产生估值,以确定所述输入数据与所述参考数据之间的相似性测量,其中所述估值以估值矩阵的形式产生,所述估值矩阵具有多个按时间排序的估值向量,每个估值向量具有代表多个参数的估值;以及差分模块,所述差分模块将表示为所述估值矩阵的每个时间段的至少一个估值向量与所述输入数据进行比较,以便可以使用比较所得的值确定所述对象的状态;

其中,所述输入模式阵列描述模式动窗,当所述模式动窗沿时间线移动时,改变所述输入向量。

说明书 :

通过模式序列使用内核回归建模的监控系统

技术领域

[0001] 本发明总体上涉及用于对诸如机器、系统或进程等对象进行预测性状态监控和预测的内核回归建模领域,确切地说,涉及使用多变量模型来分析参数度量以评估所监控的对象。

背景技术

[0002] 内核回归是一种建模形式,用于确定数据集中的值之间的非线性函数或关系,并且用于监控机器或系统以确定所述机器或系统的状态。一种已知的内核回归建模形式是第5,764,509和6,181,975号美国专利中公开的基于相似性的建模(SBM)。对于SBM,多个传感器信号测量受监控的机器、系统或其他对象的物理关联参数,以提供传感器数据。所述参数数据可以包括信号的实际值或当前值或者其他计算数据,无论是否基于传感器信号。所述参数数据随后由经验模型进行处理,以提供这些值的估值。随后将估值与实际值或当前值进行比较,以确定受监控系统中是否存在故障。
[0003] 具体来说,所述模型使用选定传感器值历史模式的参考库来产生估值,所述参考库代表已知运行状态。这些模式还参考向量、快照或观测数据,并且包括来自多个传感器的值或其他输入数据,所述数据指示受监控机器在特定时刻的状态。在参考向量来自参考库的的情况下,所述向量通常指示受监控机器的常规状态。所述模型将当前时间的向量与参考库中已知状态的多个选定习得向量进行比较,以估计系统的当前状态。一般来说,将当前向量与由参考库中的选定向量构成的矩阵进行比较,以形成权向量。在下一步骤中,用权向量乘以所述矩阵,以计算估值的向量。随后将所述估值向量与当前向量进行比较。如果向量中的估值与实际值的相似度不足,则可以指示受监控对象中存在故障。
[0004] 但是,所述内核回归技术并不显式使用传感器信号中的时域信息,而是在计算估值时使用不同且分散的同时模式来处理数据。例如,由于每个当前向量单独地与参考库向量进行比较,因此无论当前向量以哪种顺序与参考库的向量进行比较,结果均无区别,也就是说,每个当前向量将接收到自己的相应估值向量。
[0005] 一些已知模型的确在内核回归建模构造内捕获时域信息。例如,复杂的信号分解技术将时变信号转换成第6,957,172和7,409,320号美国专利中公开的频率分量,或者第7,085,675号美国专利中公开的频谱特征。这些分量或特征作为单独的输入值提供到经验建模引擎中,以便单个复杂信号表示为同时发生的频率值的模式或向量。所述经验建模引擎将提取的分量输入值(当前向量或实际向量)与预期值进行比较,以得出有关实际信号或者有关产生时变信号的系统的状态的更多信息。这些方法设计成与诸如声响信号或振动信号等单个周期信号一起使用。但是即使使用所述系统来处理复杂信号,在计算当前向量的估值时,时域信息并不重要,因为每个当前向量均与具有参考向量或预期向量的向量矩阵进行比较,无论输入向量代表哪个时间段。

发明内容

[0006] 一方面,一种用于监测对象状态的方法包括获得指示对象正常运行状态的参考数据,并获得输入模式阵列。每个输入模式阵列具有多个按时间排序的输入向量,而每个输入向量具有代表多个参数的输入值,所述参数指示了对象的当前状态。然后,至少有一个处理器根据计算生成估计值,所述计算使用输入模式阵列和参考数据来确定输入值与参考数据之间的相似性度量。将所述估计值与对应的输入值比较,从比较中得到的数值可用于确定所述对象的状态。
[0007] 另一方面,一种监测对象状态的方法包括获得指示对象正常运行状态并且以多个习得序列模式矩阵为形式的参考数据。在这种情况下,每个习得序列模式矩阵具有多个参考向量,而每个参考向量具有代表多个参数的参考值。所述方法还包括获得代表指示所述对象当前状态的多个参数的输入数据,然后,使用至少一个处理器根据计算生成估计值,所述计算使用所述输入数据和习得序列模式矩阵确定所述多个参考矩阵中参考值和输入数据之间的相似性度量。然后,将所述估计值与对应的输入数据比较,从比较中得到的数值可用于确定所述对象的状态。
[0008] 又一方面,一种监测对象状态的方法包括获得指示对象正常运行状态的参考数据和获得代表指示所述对象当前状态的多个参数的输入数据。所述方法还包括由至少一个处理器根据计算生成估计值,所述计算使用所述输入数据和参考数据确定所述输入数据和参考数据之间的相似性度量。所述估计值以具有多个按时间排序的估计向量的估计矩阵的形式被生成,每个估计向量具有代表多参数的估计值。所述方法还包括将所述估计矩阵代表的各时段的至少一个估计向量与输入数据比较,从比较中得到的数值可用于确定所述对象的状态。
[0009] 在另一种形式中,一种用于确定对象状态的监测系统具有一个经验模型和输入模式阵列,所述经验模型具有指示对象正常运行状况的参考数据,所述每个输入模式阵列都具有多个按时间排序的输入向量。每个输入向量具有代表多个参数的输入值,所述多个参数指示了对象的当前状态。经验模型可用于根据计算生成估计值,所述计算使用输入模式阵列和参考数据来确定输入值和参考数据之间的相似性度量。然后,差分模块将所述估计值与对应的输入值比较,从比较中得到的数值可用于确定所述对象的状态。
[0010] 在另一种形式中,一种用于确定对象状态的监测系统具有由至少一个处理器运算的经验模型。所述模型包含指示对象正常运行状态的参考数据,所述参考数据是多个习得序列模式矩阵形式。每个习得序列模式矩阵具有多个参考向量,而每个参考向量具有代表多个参数的参考值。所述模型还具有代表多个参数的输入数据,所述多个参数指示了对象的当前状态。所述经验模型根据计算生成估计值,所述计算使用所述输入数据和习得序列模式矩阵确定所述多个参考矩阵中参考值和输入数据之间的相似性度量。所述系统还具有差分模块,所述差分模块将估计值与对应的输入值比较,从比较中得到的数值可用于确定所述对象的状态。
[0011] 在另一种形式中,一种用于确定对象状态的监测系统具有经验模型,所述经验模型具有指示对象正常运行状态的参考数据。所述模型还具有代表多个参数的输入数据,所述多个参数指示了对象的当前状态。此外,所述经验模型根据计算生成估计值,所述计算使用输入数据和参考数据确定输入数据和参考数据之间的相似性度量。所述估计值以具有多个按时间排序的估计向量的估计矩阵形式生成。每个估计向量具有代表多个参数的估计值。所述系统还具有差分模块,所述差分模块将所述估计矩阵代表的各时段的至少一个估计向量与输入数据比较,从比较中得到的数值可用于确定所述对象的状态。

附图说明

[0012] 图1是监测系统的结构实例框图;
[0013] 图2是监测系统的基本操作过程流程图;
[0014] 图3是基于建模公式的自联想相似性(autoassociative similarity)的示意图;
[0015] 图4是基于建模公式的推理相似性(inferential similarity)的一种形式的示意图;
[0016] 图5是基于建模公式的推理相似性的另一种形式的示意图;
[0017] 图6是基于建模公式的自联想序列相似性的示意图;
[0018] 图7是基于建模公式的推理序列相似性的一种形式的示意图,所述建模公式在模型化传感器维度上进行推断;
[0019] 图8是基于建模公式的推理序列相似性的另一种形式的示意图,所述建模公式在模型化传感器维度上进行推断;
[0020] 图9是基于建模公式的推理序列相似性的示意图,所述建模公式在时间维度上进行推断;
[0021] 图10是基于建模公式的推理序列相似性的示意图,所述建模公式在时间维度上进行推断;
[0022] 图11是基于建模公式的推理序列相似性的示意图,所述建模公式在时间维度和传感器维度上进行推断。

具体实施方式

[0023] 已确定核回归模型中特别是基于相似性模型中,估计的准确性可通过向模型引入时域信息得到大幅提升。因此,本监测系统和方法的技术效果在于通过从监测工业过程、系统、机器或其他对象的大量周期性和非周期性的传感器信号中捕捉时域信息生成估计数据。本系统的技术效果还在于运行经验模型,所述经验模型将核回归模型核心的基本非线性数学从向量对向量运算扩展到矩阵到矩阵(或阵列到阵列)运算,详细描述见下文。所述监测系统和方法的另一个技术效果是生成将来时间点的虚拟或推导的估计值,以此确定被监测对象的将来状态,不管用于生成估计值的参考数据是否是代表被监测对象正常运行的数据还是与来自对象的指示故障的数据更好匹配的故障模式数据。
[0024] 参考图1,纳入时域信息的监测系统10可在计算机中以一个或多个模块的形式实现,并在一个或多个计算机100上由一个或多个处理器102执行。计算机100可具有一个或多个存储装置104,所述存储器内置与外置均可,用于永久或临时储存传感器数据或计算机程序。在一种形式中,由一台独立计算机运行用于接收传感器数据的程序,所述数据来自装有仪器的机器、工序或其他包括实时测量参数(温度、压力等)的对象上的传感器。被监测对象(不特别局限于)可以是工厂中的一台或多台机器、一个或多个车辆、或者是车辆上的特殊机器,例如一些实例中提及的喷气发动机。传感器数据可以通过计算机网络或互联网有线或无线传送到例如计算机或执行数据收集的数据库。具有一个或多个处理器的计算机可执行所有模块的所有监测任务,或者每个任务或模块可具有其自己运行模块的计算机或处理器。因此,应当理解的是,可在单个位置进行处理,或者在许多与网络有线或无线相连的不同位置进行处理。
[0025] 参考图2,在监测系统10执行的程序(300)中,系统接收来自上述被监测对象16上传感器12的数据或信号。将所述数据整理形成输入向量32以供经验模型14使用。在本文中,术语“输入”、“实际(actual)”和“当前(current)”互换使用,并且术语“向量”、“快照”和“观察数据(observation)”可互换使用。所述输入向量(或例如实际快照)代表被监测机器某一时刻的运行状态。
[0026] 此外,或者可选择地,输入向量32可以包括计算数据,所述数据可以基于或者可以不基于传感器数据(或原始数据)进行计算。这可包括,例如,平均压力或压力下降。输入向量32还可具有一些值,该些值代表未由监测对象16上传感器代表的其他变量。这可以是,例如,接收的传感器数据的当年当天的平均环境温度等等。
[0027] 经验模型14获得(302)输入向量32形式的数据,并将输入向量整理(304)形成输入阵列或矩阵。但是应当理解地是,经验模型14本身可从输入数据形成输入向量32,或者从收集或输入计算机或处理器接收向量,所述收集或输入计算机或处理器将数据整理形成向量和阵列。因此,输入的数据可由计算机100、或计算机100附近的另一台计算机、或另一个位置例如靠近监测对象16,整理形成输入向量32。
[0028] 经验模型14还从参考资料库18获得(306)参考向量或矩阵(有时称为矩阵H)形式的参考数据。参考资料库18可包括系统内所有历史参考向量。然后,经验模型14使用参考数据并输入阵列以生成所产生的估计矩阵或阵列形式的估计值(310)。将估计矩阵提供给差分模块20,所述差分模块确定(312)估计矩阵中估计值与输入阵列中对应输入值之间的差异(或残差)。然后,警示或分析管理模块(或者只有报警模块)22使用所述残差确定(314)是否存在故障。
[0029] 如虚线部分所示,监测系统10还可具有局部化模块(Localization module)28,其改变用于来自参考资料库的数据,该参考资料库的数据形成(308)子集或矩阵D(t)(以下称为习得序列模式矩阵的三维集合(图6))以与每个输入阵列中的向量进行比较。否则,参考数据的矩阵D(t)会对于所有输入矩阵保持不变,详细描述如下文。此外,监测系统还可具有一个适应模块30,不断地或当某一事件发生时,例如该模块收到指示机器未出现过的新的正常状态的数据,将输入向量放入参考资料库,对资料库的数据进行更新。这一点将在下文进行详细说明。
[0030] 报警模块22可直接向界面或输出模块24提供警报和残差(residual),以便用户进行他们自己的诊断分析,或者诊断模块26对故障原因的确切性质进行分析,将诊断结论和严重程度级别通过输出模块24报告给用户。
[0031] 输出模块24可包括显示这些结果的装置(例如计算机屏幕、PDA屏幕、打印输出或网络服务器)、存储结果的装置(例如具有查询能力的数据库、平面文件、XML文件)和/或与远程地点或其他计算机程序通信结果的装置(例如,软件界面、XML数据报、电子邮件数据包、异步消息、同步消息、FTP文件、服务、管道命令等)。
[0032] 对经验模型14更为详细的说明要求一定的核回归方面的知识。在模式识别技术中,如核回归技术中,由输入数据(如上所述)构成一个模式,所述输入数据归为一组成为向量。在一个共同时间点处从一台设备收集各向量的数据。但是,与现有核回归方法相关的同期传感器值的模式(向量)用时间相关信息(例如连续时刻的序列模式或应用于连续时刻模式的时变函数的输出(例如筛选、时间导数等))得到增大,下文将此做更为详细的说明。因此,由传统核回归方法处理的单独模式(向量)被形成阵列的模式的时间相关序列(或简单模式阵列或模式矩阵)替代。
[0033] 所有基于核的建模技术可由以下公式描述,其中包括核回归、径向基函数和基于相似性的建模:
[0034]
[0035] 式中传感器信号或传感器估计值的向量xest作为核函数K结果的加权和被生成,其将传感器测量值的输入向量xnew与传感器数据的L习得模式xi相比较。xi由向量(也称为观察数据、模式、快照或样本)形式的参考数据或习得数据构成。核函数结果根据权重ci合并,其可以是向量形式,通过多种方式确定。上述形式是一种“自联想”形式,在这种形式中,所有估计输出信号也由输入信号表现。换句话说,对于每一个输入值,计算出一个估计输出值。将其与“推理”形式进行对比,所述“推理”形式中,某些估计输出值不代表现有输入值,而是从输入中推导出来:
[0036]
[0037] 在该情况下,yest是从其他参数的输入向量xnew与这些参数的L个习得样本xi的基于核的比较中获得的推理传感器估计值。每个习得样本xi都与将进行估计的参数的另一个样本向量yi相关联,这些参数根据核K和向量ci(至少是部分yi的函数)以加权的方式合并,以预测输出yest。以相似的方式,可同时对不止一个传感器进行推导。
[0038] 基于核的估计器的共同点是核函数,从样本的线性组合(例如样本或向量矩阵)得到的结果是以体现样本的向量ci和核结果为基础。核函数K是广义内积,但其一种形式具有的另一个特点是xnew和xi相等时其绝对值最大。
[0039] 根据本发明的一个实施例,可用于提供模型的基于核的估计器为核回归,以Nadaraya-Watson核回归形式为例:
[0040]
[0041]
[0042] 在推理形式中,推理参数的多元估计yest如此产生:核K算子关于参数测量值的输入向量xnew和L个习得样本xi的结果,根据各各习得向量yi被线性组合(每个yi与每个xi相关联),然后通过核结果求和进行规范化。yi代表Y中参数的习得测量值的L个集合,与X中参数的习得测量值相关(例如同时测量)。通过实例,X可包括多个压力读数,而Y可代表一个共同系统中相应的多个温度读数。换句话说,压力读数可用于计算权重,然后使用权重和yi(具有遗漏参数先前值的参考向量)计算估计的温度读数或yest的传感器值。
[0043] 在核回归的自联想形式中,参数的多元估计xest如此产生:由那些参数xi的习得度量的规范化线性组合(例如,下文所述的样本矩阵D形式)乘以输入向量xnew关于习得观察数据xi的核运算结果。
[0044] 在本实例的核回归中,由上述公式1和公式2得到的ci由通过核比较值总和的规范化的习得样本组成。根据实例,估计向量yest或xest包括一个估计参数集,该估计参数集与实际测得值(xnew,或ynew,在推理形式中未输入到模型中)不同以提供残差。
[0045] 在核回归的一个特殊实例中,根据本发明,基于相似性的模型(SBM,similarity-based model)可作为模型使用。由于Nadaraya-Watson核回归提供估计值,该估计值是给定习得实例集合(可能是噪声)平滑估计值,SBM提供内偛的估计值,当估计值恰好也是输入值时,例如输入向量与习得样本之一相同时,其与习得样本相符合。这对于检测参数偏差有利,由于这些信号中的噪声在一定程度上过拟合(如果噪声同样出现在从其制成的模型样本中),因此与Nadaraya-Watson核回归方法相比,从残差中稍微去除了一些噪声。SBM可以理解为是一种形式的基于核的估计器:其通过重写核函数K作为算子 使习得样本集xi相等于矩阵D,所述矩阵D具有形成行的xi元素,并且xi观察数据形成其列。于是:
[0046]
[0047] 式中D已被移项,这产生核值列向量,每个D中观察数据xi对应一个。同样地,所有样本的相互比较可用以下公式表示:
[0048]
[0049] 然后,SBM的自联想形式根据以下公式生成一个估计向量:
[0050]
[0051] 式中,xest是估计向量,xnew是输入观察数据,D是包括参数习得实例观察数据集合(或子集)的习得向量矩阵。相似性算子或核用 符号表示,具有对各操作数的任意两个向量的比较补偿相似性得分的一般特性。因此,从第一项 将得出与D中观察数据数量相等的尺寸数值的方阵,如上述公式(6)所示。项 将得到相似值的向量,如
公式5所示,D中每个向量有一个相似值。下文将对该相似性算子进行更为详细的介绍。图3示意性地显示该公式,并显示了长方形框中表示的向量如何构成公式的每个分量。在该实例中,每个向量包含传感器值参数1-5(但这也可能包括其他上文所述的非传感器值)。应当理解的是,数字1-5是指代表的参数,而不是确切的传感器值。因此,公式不同部分的传感器值本身会有所不同(例如,xnew与D和xest中参数1的值可能是不同的)。
[0052] 还应当理解的是,对于公式(7),输入向量群中的时域信息忽略不计,以生成估计值。换句话说,由于公式(7)使用单个向量xnew生成一个估计向量,对输入向量群中的向量按次序进行分析,以生成估计向量,而次序在很大程度上是无足轻重的。例如,如果在后来需要工序中某一与时间相关的次序(例如时序)确定是否存在故障或诊断特殊类型故障,可在生成估计值后对向量按需排序。
[0053] 根据以下公式,可通过使估计值独立于数据来源进一步改进估计值,通过除以相似性算子产生的“权重”和使估计值规范化:
[0054]
[0055] 在相似性模型的推理形式中,根据以下公式从习得的观察数据和输入数据对推理参数向量yes进行估计:
[0056]
[0057] 式中,Din的行数与xin中实际传感器值(或参数)相等,而Dout的行数与包括推理参数或传感器的参数的总数相等。图4示意性地显示了公式(9),显示了向量的位置、输入值(1至5)和得出的推理值(6-7)。
[0058] 在一种形式中,习得样本的矩阵Da可以理解为集结矩阵,所述集结矩阵包含映射到输入向量xin中的传感器值的行以及映射到推理传感器的行:
[0059]
[0060] 如前使用权重和进行规范化:
[0061]
[0062] 应当注意地是,用习得样本的全矩阵Da代替Dout时,相似性建模可同时计算输入传感器(自联想形式)估计值和推理传感器(推理形式)估计值:
[0063]
[0064] 参考图5,公式12使用具有输入值和推理值的矩阵Da参考值。生成具有代表性输入值和推理值的估计向量。
[0065] 另一个与前文所述相似的基于核的建模技术是径向基函数技术。以神经结构为基础,径向基函数使用感受野(receptive field),以神经网络的特殊形式,其中各基函数在输入向量的n维空间中形成一个感受野,并由神经网络中的隐层节点表示。感受野具有上述的核形式,感受野的“中心”是特定的隐单元代表样本。有多少隐单元感受野,就有多少样本。将多元输入观察数据输入与隐层完全连接的输入层。因此,各隐单元接收完整的多元输入观察数据并产生结果,并且当输入与感受野的“中心”匹配时,该结果生成一个最大值,当它们的差异逐渐增大时(与前文所述的SBM相似),值逐渐减小。感受野节点隐层的输出根据权重ci合并(上述公式1)。
[0066] 如上所述,可从多种可能的核中选择核,选择的核的形式应使其返回一个值(或相似性得分),以对所有被该核返回的所有值中两个具有最大绝对值的相同向量进行比较。本文提供了几个实例,但并不限制本发明。以下是根据本发明用于比较任意两个向量xa和xb的核/相似性算子的实例。
[0067]
[0068]
[0069]
[0070] 在公式13-15中,使用了两个向量的向量差或“范数(norm)”;通常是2-范数,也可能是1-范数或p-范数。参数h通常为常数,经常称为核的“带宽”,并且影响“域(field)”的大小,各样本通过域返回一个显著结果。也可使用幂λ,但可设置为等于一。各样本xi可能使用不同的h和λ。在一种方法中,当利用使用向量差或范数的核时,测得的数据应首先规范化至范围0到1(或其他指定范围),例如,通过从所有传感器值中加上或减去那个传感器数据集的最小读数,然后通过那个传感器的范围划分所有结果。可选择地,可通过将数据转换为具有标准偏差设置为一(或其他常数)的以零为中心的平均数据,规范化该数据。此外,根据本发明的核/相似性算子还可根据观察数据元素进行定义,即,在每一维向量中确定一个相似性,并且这些单独的元素相似性以某些方式合并,以提供一个全面的向量相似性。通常情况下,这可以简单地计算元素相似性的平均值,对任意两个向量x和y进行核比较。
[0071]
[0072] 根据本发明,使用的元素相似性算子包括但不局限于:
[0073]
[0074]
[0075]
[0076] 对于如上所述的元素核可选择带宽h,以作为观察数据向量的第m个参数的预期范围的某种测量。例如,可以通过找出所有样本中的一个参数的最大值和最小值之间的差来确定。可选择地,可使用领域(domain)知识设置带宽,不必考虑样本或参考向量中出现的数据。此外,应当注意地是,对于使用差函数时的向量和元素核,如果这个差除以带宽大于1,可将其置为等于1,使核值为零,以适用公式14、15、18和19。而且,显而易见地是,核或相似性算子可通过不同常数的加法或乘法进行修改,代替一、h、λ等。也可使用三角函数,例如:
[0077]
[0078] 在一种形式中,相似性算子或核通常提供相似性得分,对两个相同维度的向量进行比较,其中,相似性得分:
[0079] 1.处于标量范围内,该范围在每端有界;
[0080] 2.如果两个向量相等,在边界端之一处的值是一(或其他指定的值);
[0081] 3.在标量范围内单调变化
[0082] 4.具有一个绝对值,该值随着两个向量趋于相等而增大。
[0083] 上述所有建模方法都使用了前述的基于核的方法,并使用样本参考资料库。样本(也称为参考观察数据或参考向量)代表模型化系统的“正常”运行状态。可选地,可向下选择(down-select)现有参考数据来建立特征子集作为样本的资料库,在这种情况下,可采用多种“训练”基于核的模型的技术。此时,该向下选择的资料库本身可形成上述公式中使用的矩阵D。根据一种训练方法,资料库中至少包括这些观察数据,其具有所有现有参考观察数据中指定参数的最高值或最低值。这可通过随机选择额外观察数据来对此进行补充,或通过忠实代表数据分散或集中的筛选进行补充。可选择的,可将参考数据集中,集群的具有代表性的“质心”形成新的人工合成样本,然后形成资料库。本领域已经有各种用于选择观察数据以组成样本资料库的已知技术。因此,至少在一般情况下,在公式(7)中矩阵D对于所有输入向量xin保持不变,除非资料库改变(即,例如资料库更新时)。
[0084] 在经验基于核的模型的推理形式和自联想形式的另一种设置中,可以对于每个输入向量xin重新配置矩阵D,以便可根据输入观察数据的特性“即时”(on-the-fly)生成模型,并从大量习得的观察数据即参考集进行提取。美国专利No.7,403,869对一个实例做了描述。这个过程称为局部化(localization)。因此,在输入观察数据的基础上,可使用习得的观察数据xi集(矩阵D)来进行基于核的建模的推理形式和自联想形式,所述观察数据是从大量参考观察数据中选择出来的。基于核的模型极其适于这种局部化,这是因为它们一次性地通过了训练,可以迅速更新。有益的是,通过建立大量候选样本,除了出于生成估计目的选择具有新输入观察数的子集,可降低建模计算的速度,提高模型稳定性,同时仍能极好地表现模型化系统的动态。
[0085] 对于监测系统10,局部化模块28可使用多种标准为集合D(t)建立局部化矩阵成员,其中包括相似性算子本身的使用。但是,一般情况下,输入观察数据包括参数集或导出特征,作为监测过程的一部分,模型对这些参数或导出特征进行评估,这些参数集或导出特征被提供给局部化模块28,局部化模块访问以参考资料库18形式的大量样本观察数据,以便选出这些样本观察数据的子集以建立模型。局部化模块28从参考资料库18中选择与输入观察数据相关的样本,所选样本集比资料库规模小得多。通过举例的方式,参考资料库18可包括100,000个以模型化参数表示的代表系统正常动态特征的样本观察数据,但局部化模块28可能响应于接收输入观察数据只选择几十个观察数据来建立局部化模型。然后将选出的样本观察数据提供给当前的局部化的经验模型14。在基于向量的系统中,这些观察数据由于核估计器(显示为与上述SBM关联的D)的原因包括习得样本xi集。然后生成上述的估计观察数据xest。对于监测系统10,所选出的每个习得样本可代表时间点tp的向量,这样对于每个在tp处的向量建立一个序列模式矩阵,形成下述的D(t)集合。当下一个输入观察数据被呈现给监测系统10中时,重复以下步骤,根据新输入观察数据从参考资料库18中选择新的有可能不同的样本子集。
[0086] 根据一个方法,可根据聚类技术将输入观察数据与习得观察数据的参考资料库18进行比较。因此,使用现在技术中已知的许多技术中的任意一种技术对参考资料库18中的样本观察数据进行聚类,以便对向量进行聚类,局部化模块28识别出输入观察数据最接近哪一个聚类,然后选出该聚类中的成员样本作为提供给局部化的经验模型14的局部化观察数据。适宜的聚类方法包括k-均值和模糊c-均值聚类,或者自组织映射神经网络。
[0087] 根据另一种方法,核可被用于将输入观察数据与参考资料库18中的各样本进行比较以得到相似性值,该值提供参考观察数据相对于输入观察数据的排序。这些值中的特定靠前部分可包括在局部化集合D(t)中。作为此局部化方面的进一步改进,所有参考观察数据排序表中的观察数据包括在局部化集合D(t)中以便其中一个构成元素提供了“涵盖(bracket)”输入向量中的相应值的值。例如,对排序表进行向下搜索,直到输入向量中的数值被括号包括在按照参考观察数据之一中的一个值的低侧和高侧上。然后,这些“涵盖的”观察数据被包含在局部化集合D(t)中,即使参考资料库18中的其他观察数据与输入数据具有更高相似性。搜索继续进行,直到输入变量中的所有输入值被涵盖,直到包括在集合D(t)内的用于建立序列模式矩阵的向量达到用户可选最大极限,或者直到不再有更多与输入数据具有足够高相似性的参考数据超过用于包括的相似性阈值。
[0088] 期望在确定局部化集合D(t)成员方面的其他更改。通过实例,在上述的聚类选择方法和相似性选择方法中,元素集,即用于包括被聚类的向量或与核进行相似性比较的向量的参数,可不与那些用于生成模型和估计的元素集相同,而是一个子集或参数部分交叠集。如上所述,对监测系统10和经验模型14增加一个步骤,以生成集合D(t)。更具体地,选出向量(称为主向量tp)加入集合D(t)后,为每个主向量选出其他与时间相关的向量(不论是前瞻还是回顾),形成每个主向量的习得序列模式矩阵,所述与时间相关的向量包括在集合D(t)内。下面将对选择与时间相关的向量步骤进行说明。应当理解地是,通过局部化模块28进行局部化可应用于所述下述习得序列模式矩阵的任意三维集合。
[0089] 现在转到将时域信息并入经验模型14中,借助本说明书中所述的一种用于监控系统10的方法,以上进行运算以比较两个向量相似性的内核函数替换为扩展内核函数K,所述内核函数对两个相同维度的阵列进行运算:
[0090]
[0091] 式中,Xnew为输入模式阵列,Xi为习得模式阵列。模式阵列或模式矩阵由与时间相关的向量序列构成,其每个组成向量包含不同时刻的传感器测量值。模式阵列向量中的一个被指定为当前主向量,其数据来源的时刻被指定为当前基本时间点tp。其他向量以系统的方式与时间点相关,所述时间点与基本时间点相关。
[0092] 在一种形式中,基本时间点是模式阵列中构成按时间排序的点的序列(或代表时间点的按时间排序的向量)中的最新时间点。在一种方法中,其他时间点被等距离分隔,以时间步长Δt整数倍处于基本时间点之前,该时间步长在时间点之间形成均匀的时间隔。对于给定数量的样本nlb,时间点形成一个有序序列:(tp–nlbΔt,tp–(nlb-1)Δt,…,tp–2Δt,tp–Δt,tp)。时间点序列定义回顾模式阵列,
[0093]
[0094] 如图6所示,主向量tp位于每个模式阵列的最右列,其他(nlb)数据向量是位于主向量tp左侧的列向量。模式阵列的行与来自模型化传感器的时变信号的短节段相对应。
[0095] 通过使用回顾(look-back)模式阵列,公式(20)中的扩展核函数可应用于实时系统监测。输入模式阵列Xnew中的主向量tp(是指时间点tp的向量)包含当前时间点的系统数据,阵列余项由过去的最新时间点的数据向量构成。因此,输入模式阵列不仅包含传统核方法使用的当前向量,虽然是静态向量,而且还包含代表被监测系统的进行中的动态状态的向量。随着系统时间的前进,新的输入模式阵列形成,其中的大部分数据与之前阵列相同,只是新的主向量出现在阵列的最右位置,最先的向量从最左位置被丢掉。因此,代表单个瞬时时间的输入向量将用在多元输入模式阵列Xnew中,并且假设按顺序使用向量,由于阵列中有向量,因此向量使用次数相同。通过这种方式,输入模式阵列描述了一个穿越时间的模式动窗。这里的动窗是指按时间顺序的固定数量的向量的集合或组群,当窗口沿时间线移动或沿以时间为顺序的传感器值向量按次序移动时,它改变了集合中包括的向量。
[0096] 上述公式(21)定义的模式阵列包含nlb数据向量,所述向量分布在等于n1b*Δt的时间窗口中。。在这个实例中,数据向量在时间上均匀分隔。也可以说,每个输入模式阵列或矩阵只由输入模式阵列Xnew中输入向量代表的时间点之间均匀的时间间隔定义。
[0097] 可选择地,核可用于比较跨越不同时间长度的模式阵列。如果一个模式阵列包含来自时间点的数据,这些数据以一个时间步长Δt1为间隔(例如,相隔一秒),并且如果另一个模式阵列的时间点相差第二时间步长Δt2(例如,相隔十秒),则所述模式阵列将跨越两个不同的时间窗口:nlb*Δt1和nlb*Δt2,因此,有两个代表不同持续时间的模式阵列。在一种形式中,只要模式阵列包含相同数量的向量,即使一个模式阵列与另一个模式阵列相比具有向量(或时间点)间不同的时间间隔,与两个模式阵列中同一位置的向量相匹配(例如最右匹配最右,最右第二个匹配最右第二个,最左匹配最左)的核函数将能够跨越变化的时间尺度进行运算。因此,在一个实例中,矩阵可跨越间隔不同的时间点进行扩展,以使时间间隔距离可与谱时间信号中的波峰的谐波(1/f)相对应。还应理解地是,这种模式阵列涵盖的时间周期或时间段的差异可用在习得模式阵列和输入模式阵列之间,从输入模式阵列到输入模式阵列,从习得模式阵列到习得模式阵列,或者这些的任意组合,只要在习得输入模式阵列中,输入模式阵列中的各向量具有对应的习得样本(或者换名话说,习得模式矩阵和输入矩阵具有相同数量的向量)。
[0098] 根据另一个实例,核可用于比较模式阵列,所述模式阵列的模式向量的时间间隔不等。分隔模式向量的不是恒定的时间间隔或步长,模式阵列中的时间步长可随位置发生变化。对最新向量(靠近阵列的右侧)使用小时间步长,对于较陈旧的向量(靠近阵列的左侧)使用较大的时间步长,核函数将重点关注最新变化,但仍然保留较远历史中的变化产生的效果。
[0099] 再次参考图1,可在使用核函数(公式(21))进行分析前通过过滤模块106进行额外的过滤步骤。当进行过滤时,对参考向量和输入向量都进行过滤,以避免两个用于生成估计值的所得信号值之间发生实质的意外失配。在过滤步骤中,对每个时变传感器片段(模式阵列的行)用滤除算法处理,以使片段中的数据平滑或计算数据的统计特征。平滑算法(例如动窗平均、三次样条过滤或Savitsky-Golay过滤)捕捉原始信号中的重要趋向,减小信号中的噪声。由于平滑算法为输入信号中的每个元素生成了平滑的数值,这些数值形成一个与传感器数据原始模式阵列维度相同的模式阵列。可选择地,过滤步骤是使用一种或多种特征提取算法计算各信号中的数据统计特征。这些特征可包括信号数据的平均值、方差或时间导数。如果对模式阵列中的数据使用相同数量的特征提取算法,原始模式阵列中数据变量的数量可以有所不同。
[0100] 如上所述,在很多种方法中,使用模式阵列表示来自模型化系统的时域信息。这些方法包括但不局限于,来自间隔相等时间点的数据向量序列、跨越不同时段的数据向量序列以使模式阵列具有变化的持续时间、以及数据向量时间间隔不同的序列。与参考模式阵列相比,输入模式阵列可具有不同的时间间隔,或者是相同的时间间隔。此外,可通过平滑算法或特征提取算法对模式序列进行过滤。对模式阵列形式或由过滤算法产生的阵列的唯一限制是由扩展核函数(公式20)处理的两个阵列是相同维数的(即,具有相同数量的行和列)。
[0101] 与上述基于向量的核函数相似,扩展核函数返回标量值或相似性度量,但此处的标量值表示两个阵列的相似性而不是两个向量的相似性。扩展核函数生成相似性得分,所述相似性得分展示与上面列举的基于向量的核函数相同的性质。也就是说,相似性得分是一个标量,其范围是界定的,在两个阵列相同时其中一个边界的值为一(或其他指定的值),相似性得分在范围内单调地变化,并且其绝对值随着两个阵列趋近于相等而增大。此外,扩展核函数对两个阵列的匹配时间分量进行运算。这就意味着,以两个回顾模式阵列为例,扩展内核函数发现两个主向量tp分别与参考模式阵列和输入模式阵列之间的相似性,然后发现主向量-1左侧的两个数据向量之间的相似性,然后以此比较阵列中前面的向量。
[0102] 扩展核函数的一个实例是基于美国专利No.6,952,662所描述的相似性算子。令Xnew和Xi是两个维数相同的模式阵列,包含来自nsens传感器的数据(或参数)以及跨越nlb序列时间点,扩展核函数书写如下:
[0103]
[0104] 式中,ρ和λ是常数。公式(22)中的时变函数θ(t)对模式阵列的时间元素进行运算,对来自两个阵列中同一时间点的向量的数据进行匹配。完成这种时间数据匹配的一种方法是对指定传感器j使用时间数据的加权平均。
[0105]
[0106] 将指定传感器j的数据元素之间的相似性(sj,k)定义为该数据元素的绝对差值,所述数据元素通过传感器rangej正常运行数据的范围规范化。因此,指定传感器数据的时变相似性函数θ(t)为:
[0107]
[0108] 合并公式22和24,生成两个模式阵列的扩展核函数:
[0109]
[0110] 扩展核函数的另一个实例是基于美国专利No.7,373,283描述的相似性算子。同样的,令Xnew和Xi为两相同维度的模式阵列,包含来自nsens传感器和跨越nlb序列时间点,这个第二扩展核函数书写如下:
[0111]
[0112] 这个扩展核函数使用由公式23和24定义的同一时变函数θ(t)对两模式矩阵中的指定传感器的时间数据进行比较:
[0113]
[0114] 参考图6,两个扩展核函数(公式25和27)的差异仅在于它们如何从模型化传感器收集信息,第一个公式表示核函数的元素形式,而第二个公式表示核函数的向量差形式(1-范数(norm))。两个公式都使用了加权平均来解释两个阵列Xnew和Xi中时变信号片段之间的差异。更具体地,就例举的公式25和27来讲,对于每个序列习得模式矩阵a到g,计算每一对习得值和输入值的绝对差值。当数值表示(1)同一个传感器(或参数)和(2)模式阵列内的同一时间点(例如基本时间tp的两个数值)或与阵列内其他向量相关的同一位置(例如当两个数值都在模式阵列的右侧第二向量上时),数值相当。将每对习得值和输入值的绝对差值通过加权平均进行合并,得到特殊传感器的所得单个平均值。对模式矩阵a到g和模式阵列Xnew代表的各个传感器或参数(1到5)重复以上步骤,因此在加权平均步骤中每个各传感器/参数有一个产生的平均标量。
[0115] 然后,在第一扩展核函数(公式25)中,加权平均步骤得出的结果是所有传感器依次平均,以生成一个阵列对阵列比较的标量值。最后,将这个标量值转化成符合上述相似性得分性质的数值,因此其落入在例如零到一的范围内,一表示相等。对三维集合D(t)中的每个习得序列模式矩阵a到g重复该步骤。在第二扩展核函数(公式27)中,立即将从加权平均步骤得到的结果转换成相似性得分,每个传感器一个。然后,对相似性得分的该向量进行平均,由此函数对三维集合D(t)中的每个习得序列模式矩阵a到g返回单个信号相似性得分。
[0116] 当在基于相似性的建模中使用时,上述扩展核函数也可称为不失一般性的扩展相似性算子。在上述公式中的符号(S(Xnew,Xi))也可使用传统的相似性算子符号写出。
[0117] 上面(例如公式13至20)所定义的其他基于向量的核函数的扩展版本可通过使用加权平均进行构建,对两个序列模式阵列中同一时间点的时间数据进行匹配。例如,令Xnew和Xi为两个相同维度的模式阵列,包含来自nsens传感器和跨越nlb序列时间点的数据,公式6中定义的使用公式17的元素相似性算子的核函数扩展版本为:
[0118]
[0119] 加权平均(公式22)用于计算模式阵列中的时变信号段之间的差值,因为可选择权重以使较新数据的权重重于陈旧数据。因此,基本时间点tp的数据通常被指定为最重权重,之前时间点的数据(公式21)被给予逐渐减小的权重。有很多方案可用于定义权重,例如使其随基本时间点线性或指数下降。
[0120] 应当理解地是,可使用其他各种时变函数θ(t)对来自两个时变信号片段的序列时间点的数据进行匹配。这些方法包括但不局限于,其他加权范数(2-范数和p-范数)和最大、最小或平均差值。所有这些方法对函数的要求是,如果两个序列相同并且数值随序列差异变大而增大,函数返回一个最小化的标量值(0值)。
[0121] 为了将序列模式阵列概念并入SBM自联想形式(公式7)中的扩展相似性算子(例如,公式25或27),对基于向量的习得向量矩阵D概念进行扩展。在前面所述的SBM的标准形式中,习得向量矩阵由选自正常运行时间段中不同时间点的习得样本(向量)集构成。令选出的这些向量的时间点表示基本时间点,可通过收集每个基本时间点前面的时间点序列的数据将每个习得向量扩展为习得序列模式矩阵。通过这种方式,将习得向量矩阵D扩展为习得序列模式矩阵集合D(t)。这个习得模式矩阵的集合形成一个三维矩阵,其中的维数表示第一维数中的模型化传感器或参数、第二维度中不同基本时间点的习得样本(向量)以及第三维数中的与基本时间点相关的时间。
[0122] 前面所述用于构建SBM基于向量的形式中使用的习得向量矩阵的训练方法可用于创建SBM序列模式形式所需的习得序列模式矩阵三维集合D(t)。扩大由训练算法从前面时间点的参考向量中选出的每个参考向量来构建一个序列模式矩阵,实现上述方法。从代表模型化系统“正常”行为的样本的参考资料库18中获得习得模式矩阵集合(每个习得模式矩阵用于由训练算法选出的参考向量)。如果使用序列SBM的时间推理形式(下文将进行描述),则将后面时间点的其他向量加入各序列模式矩阵。
[0123] 通过用于SBM基于向量形式的训练方法从正常运行期间的不同时间点中选出样本(向量),不必考虑参考数据中的固有的时域信息。在SBM的序列模式阵列形式中,通过扩大具有数据向量的所选样本来提供时域信息,所述数据向量来自紧挨基本时间点前面和(可能)后面的时间点序列。在用于建立和定位序列习得模式矩阵集合D(t)同时在时域信息中进行因式分解的另一种方法中,可将各输入模式阵列与每个参考向量序列进行比较,所述参考向量序列的数目(即,nlb+1)与输入模式阵列中向量数目相等。使用相似性算子的扩展形式(例如,公式25或27)识别这些与输入模式阵列极其相似的参考向量序列,借此完成比较。每个识别出的参考向量序列形成集合D(t)中的一个序列习得模式矩阵。不管选择步骤如何进行,训练方法都可能从相互极为靠近的基本时间点中选出样本。当从附近的基本时间点中选出两个样本时,相应的序列模式矩阵可能包含相同数据向量。
[0124] 参考图6,用输入模式阵列Xnew和习得序列模式矩阵三维集合D(t)表示公式7。输入模式阵列Xnew也可称为当前或实际模式阵列或矩阵,这是因为它包括代表当前瞬时的向量tp,而D(t)中的习得模式矩阵则相反。在图示实例中,输入模式阵列Xnew包括四个向量,其中向量tp是阵列中最后一个向量(最右)。为简便起见,将其他向量编号为-3至-1,表示tp前时间间隔数量。因此,应当理解地是,图6中的向量-3与(tp–n1bΔt)所表示的相同,其中nlb=3。如图6所示,习得序列模式矩阵(模型化传感器、基本时间点和图形序列)集合的三个维度的说明如下:数字1至5表示来自五个模型化传感器的数据,四个数字列(或向量)表示四个序列时间点,七个分层的矩形分别表示序列模式矩阵a至g,每个序列模式矩阵都具有选自正常运转状态不同时期的基本时间点tp。习得序列模式矩阵的三维集合D(t)包含七个序列模式矩阵a至g。因此,序列模式矩阵a至g中的每一个都包括来自五个传感器和四个序列时间点的数据,并具有与输入模式矩阵Xnew相同的维数。出于比较目的,显现具有二维矩阵D(图
3)的现有基于向量的公式与习得序列模式矩阵的三维集合D(t)(图6)之间的差异的另一种方式是,现有二维阵列仅由穿过(cutting across)七个序列模式阵列a至g的单一矩阵形成,以只包括来自三维集合D(t)的tp向量。
[0125] 在图6中的最右括弧中,如上所述,扩展相似性算子 对输入模式阵列Xnew和七个习得序列模式矩阵a至g之间的相似性进行计算。在图6所示实例中,通过使用公式25或27中的加权平均步骤,模型将序列模式矩阵a中传感器1的时变信号与输入模式阵列Xnew中传感器1的时变信号相比较,得到传感器1的单个平均值。对传感器2-5重复以上操作,直至得到每个传感器的一个平均值。然后,对这些标量值(或者公式27所需的相似性得分)进行平均,确定序列模式矩阵a的单个相似性度量值。然后对所有序列模式矩阵b到g重复以上操作,返回包含七个相似性得分的相似性向量,每个习得序列模式矩阵a至g对应一个相似性得分。
[0126] 中间括弧中的操作产生相似性值的7乘7的方形相似性矩阵,每一个用于集合D(t)中的一对习得序列模式矩阵a至g的每一次合并。得到的相似性矩阵的与相似性向量相乘得到一个包含七个元素的权向量。在最后一个步骤中,权向量乘以集合D(t)生成一个估计矩阵Xest。在一种形式中,估计矩阵Xest与输入模式阵列Xnew大小相同,因此,估计矩阵具有与输入模式阵列中输入向量代表的时间段的每一个对应的估计向量。在图6所示的实例中,估计矩阵Xest具有当前时刻tp及三个前面时间点-1到-3的每一个的估计向量,好像形成于一个回顾窗口之中。估计矩阵Xest的使用将在下文中详细说明。还应当注意地是,与当前向量或主向量成组或未与当前向量或主向量成组的先前向量在本文中称为回顾窗口,与当前向量或主向量成组或未与当前向量或主向量成组的后面向量在本文中被称为前瞻窗口,将在下文进行说明。
[0127] 显而易见,对SBM推理形式(公式9)的扩展是用扩展的相似性算子使用序列模式矩阵。类似于推理模型化的基于向量的形式,习得序列模式矩阵的三维集合Da(t)可以理解为一个集结矩阵,其包含映射到输入模式阵列Xin中传感器值的习得序列模式矩阵a到g和映射到推断传感器Dout(t)的序列模式矩阵a到g。参考图7,公式9用输入模式阵列Xin和习得序列模式矩阵三维集合Din(t)表示,所述习得序列模式矩阵三维集合具有五个传感器1至5的七个习得序列模式阵列a到g。应当理解,集结矩阵Da(t)是公式10所定义的二维集结矩阵的三维扩展。将图7中的图表与图6中的图表比较,两个图中括弧内的矩阵除标示方法外,其余都是相同的。因此,对于推理模型的权向量计算以与上述自联想模型相同的方式进行。然后,如图4所示的,对于图7中的推理传感器,用权向量乘以习得序列模式阵列,只是这里的矩阵Dout(t)是习得序列模式矩阵的三维集合,并且从本步骤中得到只代表推理传感器的估计矩阵Yest。对于上述的推理模型化的基于向量的形式,也可将权向量乘以包括Din(t)和Dout(t)在内的整个习得序列模式矩阵三维集合Da(t),以得到输入传感器和推理传感器的估计矩阵(见图8)。
[0128] 推理模型化使得能够计算传感器估计值,传感器的数据不包括在输入数据流内,这是因为这些传感器的参考数据包括在习得序列模式矩阵的三维集合Da(t)或Dout(t)内。从概念上讲,推理模型是沿模型化传感器的维数进行外推。也有可能建立一个在时间维数上进行外推的推理模型。可将此理解为对公式21的基本时间点和回顾窗口(look-back window)概念的再探讨。回顾窗口中的时间点先于基本时间点,这说明相对于基本时间,它们处在过去。可将处于基本时间之后的时间点所形成的窗口定义为前瞻窗口(look-ahead window)。相对于基本时间,前瞻窗口中的时间点处在将来。认为时间点有序序列是由指定数量(nlb)的先于基本时间点的时间点和指定数量(nla)的后于基本时间点的时间点构成:
(tp–nlbΔt,tp–(nlb-1)Δt,…,tp–2Δt,tp–Δt,tp,tp+Δt,tp+2Δt,…,tp+(nla-1)Δt,tp+nlaΔt)。时间点序列定义了包含回顾数据和前瞻数据的模式阵列。
[0129]
[0130] 参考图9,如果习得序列模式矩阵的三维集合Da(t)是由包含回顾数据和前瞻数据的序列模式矩阵a到g创建,则产生支持向时间维度进行外推的对SBM推理形式(公式9)的扩展。由于输入模式阵列Xin只包含来自当前时间点和过去时间点(来自将来时间点的数据还不存在)的数据,习得序列模式矩阵的集合Da(t)是一个由两个时间维度独立的子矩阵组成的集结矩阵。第一个子矩阵Dlb(t)包含来自不同基本时间点和回顾时间点的数据。第二子矩阵Dla(t)包含来自前瞻时间点的数据。公式9用五个输入传感器的输入模式阵列Xin以及时间点tp至-3间的三个时间间隔的回顾窗口来表示。回顾部分或子矩阵Dlb(t)是习得序列模式矩阵的三维集合,其包含来自五个输入传感器(1-5)的数据、在各自序列模式矩阵a到g上的七个基本时间点以及在各自序列模式矩阵a到g上的四个回顾时间点或参考向量tp到-3。所述回顾部分或子矩阵Dla(t)是习得序列模式矩阵的三维集合,其包含来自五个输入传感器(1-5)的数据、每个具有各自基本时间点的七个习得序列模式矩阵a到g、以及两个将来或后面时间点或向量+1和+2。通过两套括弧内的运算得到的权向量乘以习得序列模式矩阵的前瞻集合Dla(t),得到按时间进行外推的估计矩阵Yla。在本实例中,为估计矩阵Yla计算两个推断估计向量+1和+2,其代表的时间点是将来的一个和两个步长Δt。正如上述的向量公式(图5),权向量也可乘以包含Dla(t)和Dlb(t)在内的整个习得序列模式矩阵集合Da(t),在估计矩阵XYe1内生成估计矩阵X1b和Yla,所述估计矩阵XYe1包含过去、当前和将来时间点的估计数据(见图10)。
[0131] 将图9和图10中的实例与图7和图8中的实例进行比较,四个图中括弧内的矩阵计算是相同的。这说明,对于按时间维度进行推断的推理模型,其权向量的计算与按模型化传感器维度进行推断的推理模型是相同的。这两种推理建模形式的唯一区别在于包括在整个习得序列模式矩阵集合内的数据。包括相对于基本时间点处于将来的时间点的数据的模型推断到将来。包括未在输入数据流内的传感器数据的模型推断到这些传感器。参考图11,图中显示了向时间维度和模型化传感器维度推断的推理模型。其习得序列模式矩阵的三维集合Da(t)是一个由四个按模型化传感器维度和时间维度相互独立的子矩阵组成的集结矩阵。它的子矩阵包括输入传感器Dlb(t)的回顾窗口数据、输入传感器Dla(t)的前瞻窗口数据、输出(推理)传感器Dlbout(t)的回顾窗口数据以及输出(推理)传感器Dlaout(t)的前瞻窗口数据。上述计算生成了估计矩阵XYe2内的估计矩阵X1b和Yla,所述估计矩阵XYe2包含输入和输出(推理)传感器的过去、当前和将来时间点(见图10)的估计数据。
[0132] 每个具有上述序列模式阵列的核回归建模形式都产生一个模型估计数据的估计矩阵。在一个实例中,为每个输入模式阵列Xnew(图6)形成估计矩阵Xest。从上述实例中可以理解,除了与当前时间点对应的估计向量外,估计矩阵还包含回顾窗口和/或前瞻窗口中的每个时间点的向量。估计矩阵中序列向量的数量取决于建模公式的形式(自联想或者推理)、回顾窗口中时间点的数量nlb和前瞻窗口中时间点的数量nla。随着系统时间的前进,当输入模式阵列到达、穿过并且经过时间点时,沿时间线的各个固定时间点累积多个估计向量。将要计算的某个固定时刻的估计向量的总数与序列模式矩阵中序列模式(向量)的总数相等,并且用模型进行分析。对于按传感器维度进行推断的自联想模型或推理模型,指定该总数为nlb+1,对应于回顾窗口中每个模式的估计向量和基本(当前)时间点的估计向量。对于按时间维度进行推断的推理模型,指定该总数为nlb+1+nla,对应于回顾窗口和前瞻窗口中每个模式的估计向量和基本(当前)时间点的估计向量。
[0133] 由于多个估计向量是对于固定时间点进行计算,使用序列核回归模型(sequential kernel regression model)对算法提供信息以进行状态监测或诊断由于下列事实而复杂:许多这些算法期望一个时间点只存在一个估计向量。处理多个估计向量最简单的方法是仅指定估计矩阵中所有多个向量的一部分作为模型估计值的来源,而忽略其他部分。在一种形式中,每个估计矩阵中只有一个估计向量被选出用于进一步诊断分析。通常情况下,这意味着当扫视多个估计矩阵时,在估计矩阵中对于任意一个固定时间点ti选出的估计向量是该时间点成为当前时间点(ti=tcur)或换言之最新时间点(图6至8中估计矩阵实例中的tp)时产生的估计向量。当输入图形窗口越过ti走向新的当前时间点,ti成为回顾窗口的一部分时,忽略对于ti计算出的新估计数据。也就是说,忽略在估计矩阵中相对于当前向量tp陈旧的或前面的向量。
[0134] 另外,可使用更多复杂方法来生成或选择多个估计矩阵中对于每个固定时间点的单一估计向量,同时利用多个向量中的信息。这样的方法包括但不局限于平均、加权平均、其他权重范数(2-范数和p-范数)、最大值、最小值或中间值等等。通过诊断分析选出的估计向量也可以是具有与其对应的输入向量最大相似性的向量,可使用类似的用于确定权向量的相似性公式。还应当理解地是,这些方法可用于提供对于每个估计矩阵的单个估计向量来表示估计矩阵中的多个序列时间点,而不是多个估计矩阵中的单个固定时间点。
[0135] 对于按时间维度进行推断的推理模型,预测模块34(图1)可使用将来估计矩阵Xla为预测算法提供信息,例如资产余下的使用寿命的计算(或者换种说法,确定被监测对象的将来状态或运行状况)。这是以模型化传感器的推理估计值是一条趋势线为基础的,所述趋势线预测模型化传感器的将来状态。随着系统时间的前进,包含新主向量的新输入模式阵列形成了,计算出新的将来估计矩阵。和上述其他核回归模型一样,新估计矩阵与之前的矩阵基本重叠,这说明生成了每个传感器在各时间点的多个估计值。
[0136] 而且,与其他核回归模型相似,推理时间外推模型可使用不同方法减少在一个固定时间点计算出的多个估计值至适于传感器趋势的单值。最简单的方法是选出最新计算出的估计矩阵,以提供回顾窗口中各时间点的估计数据。具体地,对于固定时间点ti顺利进入将来,当前瞻模式窗口首先到达该时间点时,将生成该时间点的估计向量:ti=tcur+nla*Δt。在前瞻窗口穿过固定时间点的每个后续时间步,计算出该时间点的新估计向量来替代前一个向量。因此,所有估计向量都用于建立一条趋势线,估计向量所代表的各时间点(或固定点)的结果被更多最近估计值不断更新,以便当向量穿过前瞻窗口用于建立估计矩阵时与这些向量相对应。
[0137] 除了简单外,该方法还生成对动态变化快速反应的传感器趋势,因为只使用最新计算出来的估计矩阵。由于趋势线中的估计数据被替换为各后续时间步,趋势易受随机波动影响。这说明在一个固定时间点的趋势值可在连续的时间步长间发生剧烈变化。其他更为复杂的方法,例如平均、加权平均、或其他加权范数使用两个或更多的或者全部计算出的多个估计矩阵中在一个固定时间点的估计值,以生成该时间点的单个估计值。通过这些方法生成的趋势线更平滑,但对于快速动态变化反应较差。除了上述用于生成代表预期系统行为的趋势线的方法外,可生成其他指示可能行为范围的趋势线。例如,连接各将来时间点最大估计值的趋势线与连接最小估计值的趋势线连在一起,界定模型生成的结果。
[0138] 再回到图1,整个估计矩阵Xest或单个典型估计向量,如上所述,被传送到差分机20。所述差分机从输入模式阵列(Xin或Xnew)中减去估计矩阵,或者从当前时间点的输入向量中减去典型估计向量。具体地,从来自输入模式阵列的对应输入值中减去从估计矩阵中选出的各估计值。然后将残差向量阵列或单个典型残余向量提供给报警模块22。报警模块22对残余数据使用统计检验来确定估计数据和输入数据是否在统计上有不同之处。报警模块
22可执行任意一种测试来确定故障。这可包括使用一个或多个残值评估规则逻辑的规则引擎。规则可以是各种常用规则中的任一种,从简单的单变量阈值测量到多变量和/或时间序列逻辑。此外,一些规则输出可以是其他规则的输入,例如,当一个简单的阈值规则进入到加窗警报计数规则(例如,y观察数据中的x阈值警报)时。而且,可对残差数据使用统计技术来得到其他测量值和信号,这些测量值和信号本身可被输入到规则中。可从本领域已知的大量技术中选择适用的统计分析,包括但不局限于动窗统计(平均值、中间值、标准偏差、最大值、最小值、偏度、峰度等)、统计假设测试(例如,序贯概率比检验(SPRT))、趋势化和统计过程控制(例如,累积和(CUSUM),S-图表(S-chart))。
[0139] 报警模块22可确定估计数据与输入数据之间的所有差异是由训练时未遇到的正常运转状态引起的。在这种情况下,例如,将指示新运行状态的传感器数据提供给可选的适应模块30,该模块通过参考资料库18将该数据并入经验模型14的学习中。此外,适应模块30可选择执行其本身对数据和/或残差分析结果的自动检验,以确定应使用哪些输入向量或输入阵列以更新经验模型14。
[0140] 模型适应的过程包括添加表示新运行状态的传感器数据到资料库H中的参考数据集,对来自所述资料库的原始基于核的模型进行“训练”。在最简单的实施例中,所有参考数据用作模型样本,因此,模型适应意味着添加新传感器数据至模型样本集。由于序列核回归模型在设计上对观察向量序列进行运算,添加到参考数据的新的运行数据必须由观察向量序列组成。在所有适应事件中,添加的向量的最小数量与模型分析的序列模式(向量)的总数相等。如上所述,所述总数指定为自联想模型或沿传感器维度推断的推理模型的nlb+1,或沿时间维度推断的推理模型的nlb+1+nla。如果已使用训练方法向下选择参考观察数据为上述作为“典型”系统动态储存的子集,用于形成习得序列模式矩阵的三维集合D(t),则将新观察向量序列(或者换句话说,整个输入模式阵列)添加到原始参考数据集中,向下选择技术用于获得新的典型样本集,所述新典型样本集应包括新观察数据的表述。还有可能只添加新序列至习得模式阵列的向下选择的集合中,而不必再使用向下选择技术。此外,在这种情况下,从模型中去除一些习得模式阵列可能是有用的,以使它们被新数据有效替换,并且模型始终保持可控制大小。去除陈旧习得模式阵列的准则可包括使用上述公式进行聚类和相似性确定,将新基本时间点的观察数据与旧时间点的观察数据比较,并替换那些与新序列模式阵列最相似的序列模式阵列。
[0141] 在这一点上,本发明对受到正常运行状态时的典型数据训练的序列核回归模型进行了描述。已经证实,这种模型可用于检测和诊断系统故障。此外,本发明的时间推理形式生成了可以推断系统将来行为的模型。但是由于模型只用正常运行状态数据训练,产生故障时模型的效用受到限制,这是因为系统行为离正常运行状态越来越远。
[0142] 为了提高发生故障时的诊断和预测,可使用独立的序列核回归模型,该模型是用故障状态(或故障模式参考数据)时收集的数据训练的。这种故障模型只有在出现系统产生故障的指示时才会激活。故障指示可由受到正常系统数据训练的序列模型或许多其他方法提供,包括但不局限于基于向量的核回归模型(例如,SBM)、神经网络、k-均值聚类模型和基于规则的故障检测模型。用被监测资产的已知故障事件的全部瞬态历史记录对故障模型时行训练。这些故障事件不需要是该实际资产在过去时间内发生,它们可以是发生在与被监测资产基本相似的其他机器上的。所述的故障历史是由指示故障最初发生的时间至事件终态(例如系统故障或系统关闭)时间内所收集的所有系统数据组成。
[0143] 本领域技术人员应理解,可对本文中提到的实施例在各个方面进行更改。显然,也可在本发明精神范围内有其他变化。可以认为,本发明的精神和范围包括对本文实施例所作的更改和变化,这些更改和变化对本领域技术人员是显而易见并且与本申请的教义密切相关。