过程设计与分析的系统和方法转让专利

申请号 : CN201880070170.3

文献号 : CN111279347A

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : T·S·加德纳

申请人 : 瑞芬股份有限公司

摘要 :

提供用于产生产品或分析信息的过程的过程设计和分析的系统和方法。维持超图数据存储区,并且所述超图数据存储区包括每个过程的各个版本。版本包括具有代表所述过程的阶段的节点及边线的超图。阶段具有与阶段输入特性相关联的参数化资源输入,以及输入规格界限。阶段具有与输出特性相关联的资源输出及输出规格界限。边线将节点的输出连接到其它节点的输入。维持具有多个过程轮次的轮次数据存储区,每个轮次识别过程版本、对应超图中的节点的输入的值、它们的输入特性、节点的资源输出,以及资源输出的输出特性的获得值。当质询识别存在于所述轮次数据存储区中的一个或多个输入和/或输出时,会将它们格式化以供分析。

权利要求 :

1.一种用于提供一个或多个过程的过程设计和分析的非暂时性计算机可读存储介质,所述一个或多个过程中的每个过程产生相应产品或分析信息,其中所述非暂时性计算机可读存储介质存储指令,所述指令在由第一装置执行时使所述第一装置进行以下操作:(A)维持超图数据存储区,其针对所述一个或多个过程中的每个相应过程包括所述相应过程的相应多个版本,每个相应版本包括:超图,其包括由多个边线中的边线连接的多个节点,

所述多个边线中的每个相应边线包括表示对应过程中的相应阶段的过程阶段标记,并且与以下各项相关联:(i)所述对应过程中的所述相应阶段的一组参数化资源输入,其中所述一组参数化资源输入中的至少一个参数化资源输入与一个或多个输入特性相关联,所述一个或多个输入特性包含一个或多个输入规格界限,以及(ii)所述对应过程中的所述相应阶段的一组参数化资源输出,其中所述一组参数化资源输出中的至少一个参数化资源输出与一个或多个输出特性相关联,所述一个或多个输出特性包含一个或多个对应的输出规格界限,且所述多个节点中的每个相应节点指定所述多个边线中的边线的所述一组参数化资源输出被包含在所述多个边线中的至少一个其它边线的所述一组参数化资源输入中;

(B)维持轮次数据存储区,其中所述轮次数据存储区包括多个过程轮次,每个过程轮次包括:(i)所述一个或多个过程中的过程的所述多个版本中的版本的识别,(ii)所述相应版本的所述超图中的所述第一边线的相应一组参数化资源输入和输出,和(iii)所述相应版本的所述超图中的所述第一边线的相应一组参数化资源输出中的参数化资源输出的至少一个输入或输出特性的值;以及(C)维持统计模块,响应于接收到识别存在于所述轮次数据存储区中的一个或多个过程轮次中的一个或多个第一参数化资源输入和/或参数化资源输出的质询,所述统计模块对所述一个或多个第一参数化资源输入和/或参数化资源输出进行格式化以供分析。

2.根据权利要求1所述的非暂时性计算机可读存储介质,其中所述质询另外识别存在于所述轮次数据存储区中的一个或多个轮次中的一个或多个第二参数化资源输入和/或参数化资源输出,其中所述指令在由所述第一装置执行时进一步使所述第一装置进行以下操作:使所述一个或多个第一参数化资源输入和/或参数化资源输出和所述一个或多个第二参数化资源输入和/或参数化资源输出相关;以及对相关性的数值量度进行格式化以供呈现。

3.根据权利要求1所述的非暂时性计算机可读存储介质,其中所述指令在由所述第一装置执行时进一步使所述第一装置进行以下操作:将所述一个或多个第一参数化资源输入和/或参数化资源输出导出到第二装置以供分析。

4.根据权利要求1所述的非暂时性计算机可读存储介质,其中所述指令在由所述第一装置执行时进一步使所述第一装置进行以下操作:(D)维持过程评估模块,当所述多个过程轮次中的过程轮次的一组参数化资源输出中的参数化资源输出的输出特性的获得值在所述输出规格界限之外时,所述过程评估模块生成呈计算机数据传输形式的警告。

5.根据权利要求1所述的非暂时性计算机可读存储介质,其中所述一个或多个过程中的过程的相应多个版本中的第一版本和第二版本在以下方面不同于彼此:节点的数目、边线的数目、边线的过程阶段标记、一组参数化资源输入中的参数化资源输入,或一组参数化资源输出中的参数化资源输出。

6.根据权利要求1所述的非暂时性计算机可读存储介质,其中所述质询另外识别存在于所述轮次数据存储区中的一个或多个轮次中的一个或多个第二参数化资源输入和/或参数化资源输出,并且其中所述统计模块另外使用多变量分析技术识别以下在存在于所述轮次数据存储区中的所有所述参数化资源输入和/或参数化资源输出当中存在于所述轮次数据存储区中的一个或多个过程轮次中的两者之间的相关性:(i)所述一个或多个第一参数化资源输入和/或参数化资源输出,和(ii)所述一个或多个第二参数化资源输入和/或参数化资源输出。

7.根据权利要求6所述的非暂时性计算机可读存储介质,其中所述多变量分析包括特征选择技术。

8.根据权利要求7所述的非暂时性计算机可读存储介质,其中所述特征选择技术是最小角回归。

9.根据权利要求7所述的非暂时性计算机可读存储介质,其中所述特征选择技术是逐步回归。

10.根据权利要求1所述的非暂时性计算机可读存储介质,其中所述统计模块另外基于预测所述一个或多个过程中的第一过程中不存在于所述轮次数据存储区中的额外过程轮次的所述一个或多个第二参数化资源输入的建议值将改变所述一个或多个过程轮次的数值属性,提供所述一个或多个第二参数化资源输入的所述建议值。

11.根据权利要求10所述的非暂时性计算机可读存储介质,其中所述数值属性是所述一个或多个第一参数化资源输入的方差的减小。

12.根据权利要求10所述的非暂时性计算机可读存储介质,其中所述质询另外识别存在于所述轮次数据存储区中的一个或多个轮次中的一个或多个第三参数化资源输入和/或参数化资源输出,并且其中所述数值属性是所述一个或多个第一参数化资源输入和/或参数化资源输出与所述一个或多个第三参数化资源输入和/或参数化资源输出之间的相关性的置信度。

13.根据权利要求6所述的非暂时性计算机可读存储介质,其中所述一个或多个过程是多个过程,并且根据所述多个过程的子集中的过程轮次识别所述相关性。

14.根据权利要求6所述的非暂时性计算机可读存储介质,其中所述一个或多个过程是多个过程,并且根据所述多个过程中的单个过程中的过程轮次识别所述相关性。

15.根据权利要求1所述的非暂时性计算机可读存储介质,其中所述一个或多个过程是多个过程,并且所述质询另外识别过程轮次将通过所述统计模块格式化的所述多个过程的子集。

16.根据权利要求1所述的非暂时性计算机可读存储介质,其中所述一个或多个过程是多个过程,并且所述质询另外识别所述多个过程中的过程轮次将通过所述统计模块格式化的单个过程。

17.根据权利要求1所述的非暂时性计算机可读存储介质,其中所述质询另外识别所述一个或多个过程中的过程轮次子集。

18.根据权利要求1所述的非暂时性计算机可读存储介质,其中所述统计模块另外识别以下两者之间的相关性:(i)包括所述轮次数据存储区中的一个或多个过程轮次的第一组,和(ii)包括所述轮次数据存储区中的一个或多个过程轮次的第二组,其中所述第二组中的过程轮次不在所述第一组中。

19.根据权利要求18所述的非暂时性计算机可读存储介质,其中计算存在于所述第一组和第二组中的多个参数化资源输入和/或参数化资源输出之间的相关性。

20.根据权利要求1所述的非暂时性计算机可读存储介质,其中所述相应多个过程版本中的过程版本的超图的所述多个边线中的边线的所述一组参数化资源输入包括第一和第二参数化资源输入,所述第一参数化资源输入指定第一资源并且与第一输入特性相关联,所述第二参数化资源输入指定第二资源并且与第二输入特性相关联,其中所述第一输入特性不同于所述第二输入特性。

21.根据权利要求20所述的非暂时性计算机可读存储介质,其中所述第一输入特性是所述第一资源的粘度值、纯度值、组成值、温度值、重量值、质量值、体积值或批次标识符。

22.根据权利要求20所述的非暂时性计算机可读存储介质,其中所述第一资源是单个资源或复合资源。

23.根据权利要求1所述的非暂时性计算机可读存储介质,其中所述相应多个过程版本中的过程版本的超图的所述多个边线中的第一边线的所述一组参数化资源输入包括第一参数化资源输入,所述第一参数化资源输入指定和与所述第一边线相关联的所述过程的对应阶段相关联的过程条件。

24.根据权利要求23所述的非暂时性计算机可读存储介质,其中所述过程条件包括温度、暴露时间、混合时间、设备类型或批次标识符。

25.根据权利要求1所述的非暂时性计算机可读存储介质,其中所述指令进一步使所述第一装置进行以下操作:(D)针对所述一个或多个过程中的相应过程,执行数据驱动器,所述数据驱动器包含:

用于接收所述相应过程的数据集的指令;

用于解析所述数据集以获得以下各项的指令:(i)所述轮次数据存储区中的过程轮次的识别,和(ii)与所述过程轮次的所述相应过程的所述超图中的第一边线的所述相应一组参数化资源输出相关联的输出特性值;以及用于用解析值填充所述轮次数据存储区中的所述第一边线的参数化资源输出的所述输出特性值的指令。

26.根据权利要求1所述的非暂时性计算机可读存储介质,其中所述对应的输出规格界限包括对应参数化资源输出的上限和下限值。

27.根据权利要求1所述的非暂时性计算机可读存储介质,其中所述对应的输出规格界限包括允许类型的枚举列表。

28.根据权利要求1所述的非暂时性计算机可读存储介质,其中所述一个或多个过程是多个过程,并且所述多个过程中的第一过程产生第一产品,所述多个过程中的第二过程产生第二产品,其中所述第一产品不同于所述第二产品。

29.根据权利要求1所述的非暂时性计算机可读存储介质,其中所述轮次数据存储区另外包括展示以下关系的系谱图:(i)过程的所述多个版本中的单个过程的各版本之间的关系,或(ii)两个或更多个过程的所述相应多个版本中的两个或更多个过程的各版本之间的关系。

30.一种计算机系统,包括:

一个或多个处理器;

存储器;以及

一个或多个程序,其存储在所述存储器中以供所述一个或多个处理器执行,所述一个或多个程序包括用于进行以下操作的指令:(A)维持超图数据存储区,所述超图数据存储区针对一组一个或多个过程中的每个相应过程包括所述相应过程的相应多个版本,所述一组一个或多个过程中的每个过程产生相应产品或分析信息,每个相应版本包括:超图,其包括由多个边线中的边线连接的多个节点,

所述多个边线中的每个相应边线包括表示对应过程中的相应阶段的过程阶段标记,并且与以下各项相关联:(i)所述对应过程中的所述相应阶段的一组参数化资源输入,其中所述一组参数化资源输入中的至少一个参数化资源输入与一个或多个输入特性相关联,所述一个或多个输入特性包含一个或多个输入规格界限,以及(ii)所述对应过程中的所述相应阶段的一组参数化资源输出,其中所述一组参数化资源输出中的至少一个参数化资源输出与一个或多个输出特性相关联,所述一个或多个输出特性包含一个或多个对应的输出规格界限,且所述多个节点中的每个相应节点指定所述多个边线中的边线的所述一组参数化资源输出被包含在所述多个边线中的至少一个其它边线的所述一组参数化资源输入中;

(B)维持轮次数据存储区,其中所述轮次数据存储区包括多个过程轮次,每个过程轮次包括:(i)所述一个或多个过程中的过程的所述多个版本中的版本的识别,(ii)所述相应版本的所述超图中的所述第一边线的所述相应一组参数化资源输入和输出,和(iii)所述相应版本的所述超图中的每个边线的所述相应一组参数化资源输出中的参数化资源输出的至少一个输入或输出特性的值;以及(C)维持统计模块,响应于接收到识别存在于所述轮次数据存储区中的一个或多个过程轮次中的一个或多个第一参数化资源输入和/或参数化资源输出的质询,所述统计模块对所述一个或多个第一参数化输入和/或参数化输出进行格式化以供分析。

31.一种用于提供一个或多个过程的过程设计和分析的非暂时性计算机可读存储介质,所述一个或多个过程中的每个过程产生相应产品或分析信息,其中所述非暂时性计算机可读存储介质存储指令,所述指令在由第一装置执行时使所述第一装置进行以下操作:(A)维持超图数据存储区,其针对所述一个或多个过程中的每个相应过程包括所述相应过程的相应多个版本,每个相应版本包括:超图,其包括由多个节点中的节点连接的多个边线,

所述多个边线中的每个相应边线包括表示对应过程中的相应阶段的过程阶段标记,并且与一个或多个输入和至少一个输出相关联;且所述多个节点中的每个相应节点与对应一组参数化资源相关联,并且指定所述对应一组参数化资源中的每个相应参数化资源与所述多个边线中的第一边线的所述至少一个输出中的至少一对应输出相关联,并且还与所述多个边线中的至少一个其它边线的所述一个或多个输入中的至少一对应输入相关联,并且其中所述一组参数化资源中的至少一个参数化资源与一个或多个特性相关联,所述一个或多个特性包含一个或多个对应的规格界限;

(B)维持轮次数据存储区,其中所述轮次数据存储区包括多个过程轮次,每个过程轮次包括:(i)所述一个或多个过程中的过程的所述多个版本中的版本的识别,和(ii)对应于所述相应版本的所述超图中的所述多个节点中的至少一个节点的相应一组参数化资源和它们相关联的一个或多个特性的值;以及(C)维持统计模块,响应于接收到识别存在于所述轮次数据存储区中的一个或多个过程轮次中的一个或多个第一参数化资源的质询,所述统计模块对所述一个或多个第一参数化资源进行格式化以供分析。

32.根据权利要求31所述的非暂时性计算机可读存储介质,其中所述质询另外识别存在于所述轮次数据存储区中的一个或多个轮次中的一个或多个第二参数化资源,其中所述指令在由所述第一装置执行时进一步使所述第一装置进行以下操作:使所述一个或多个第一参数化资源和所述一个或多个第二参数化资源相关;以及对相关性的数值量度进行格式化以供呈现。

33.根据权利要求31所述的非暂时性计算机可读存储介质,其中所述指令在由所述第一装置执行时进一步使所述第一装置进行以下操作:将所述一个或多个第一参数化资源导出到第二装置以供分析。

34.根据权利要求31所述的非暂时性计算机可读存储介质,其中所述指令在由所述第一装置执行时进一步使所述第一装置进行以下操作:(D)维持过程评估模块,当所述多个过程轮次中的过程轮次的一组参数化资源中的参数化资源的特性的获得值在所述对应的规格界限之外时,所述过程评估模块生成呈计算机数据传输形式的警告。

35.根据权利要求31所述的非暂时性计算机可读存储介质,其中所述一个或多个过程中的过程的相应多个版本中的第一版本和第二版本在以下方面不同于彼此:节点的数目、边线的数目、边线的过程阶段标记,或一组参数化资源中的参数化资源。

36.根据权利要求31所述的非暂时性计算机可读存储介质,其中所述质询另外识别存在于所述轮次数据存储区中的一个或多个轮次中的一个或多个第二参数化资源,并且其中所述统计模块另外使用多变量分析技术识别以下在存在于所述轮次数据存储区中的所有所述参数化资源当中存在于所述轮次数据存储区中的一个或多个过程轮次中的两者之间的相关性:(i)所述一个或多个第一参数化资源,和(ii)所述一个或多个第二参数化资源。

37.根据权利要求36所述的非暂时性计算机可读存储介质,其中所述多变量分析包括特征选择技术。

38.根据权利要求37所述的非暂时性计算机可读存储介质,其中所述特征选择技术是最小角回归。

39.根据权利要求37所述的非暂时性计算机可读存储介质,其中所述特征选择技术是逐步回归。

40.根据权利要求31所述的非暂时性计算机可读存储介质,其中所述统计模块另外基于预测所述一个或多个过程中的第一过程中不存在于所述轮次数据存储区中的额外过程轮次的一个或多个第二参数化资源的建议值将改变所述一个或多个过程轮次的数值属性,提供所述一个或多个第二参数化资源的所述建议值。

41.根据权利要求40所述的非暂时性计算机可读存储介质,其中所述数值属性是跨所述一个或多个过程轮次展现的所述一个或多个第一参数化资源的方差的减小。

42.根据权利要求40所述的非暂时性计算机可读存储介质,其中所述质询另外识别存在于所述轮次数据存储区中的一个或多个轮次中的一个或多个第三参数化资源,并且其中所述数值属性是所述一个或多个第一参数化输入资源和所述一个或多个第三参数化资源之间的相关性的置信度。

43.根据权利要求36所述的非暂时性计算机可读存储介质,其中所述一个或多个过程是多个过程,并且识别所述多个过程的子集中的过程轮次中的所述相关性。

44.根据权利要求36所述的非暂时性计算机可读存储介质,其中所述一个或多个过程是多个过程,并且识别所述多个过程中的单个过程中的过程轮次中的所述相关性。

45.根据权利要求31所述的非暂时性计算机可读存储介质,其中所述一个或多个过程是多个过程,并且所述质询另外识别过程轮次将通过所述统计模块格式化的所述多个过程的子集。

46.根据权利要求31所述的非暂时性计算机可读存储介质,其中所述一个或多个过程是多个过程,并且所述质询另外识别所述多个过程中的过程轮次将通过所述统计模块格式化的单个过程。

47.根据权利要求31所述的非暂时性计算机可读存储介质,其中所述质询另外识别所述一个或多个过程中的过程轮次子集。

48.根据权利要求31所述的非暂时性计算机可读存储介质,其中所述统计模块另外识别以下两者之间的相关性:(i)包括所述轮次数据存储区中的一个或多个过程轮次的第一组,和(ii)包括所述轮次数据存储区中的一个或多个过程轮次的第二组,其中所述第二组中的过程轮次不在所述第一组中。

49.根据权利要求38所述的非暂时性计算机可读存储介质,其中计算存在于所述第一组和第二组中的多个参数化资源之间的相关性。

50.根据权利要求31所述的非暂时性计算机可读存储介质,其中所述相应多个过程版本中的过程版本的超图的所述多个节点中的节点的所述一组参数化资源包括第一和第二参数化资源,所述第一参数化资源指定第一资源并且与第一特性相关联,所述第二参数化资源指定第二资源并且与第二特性相关联,其中所述第一特性不同于所述第二特性。

51.根据权利要求50所述的非暂时性计算机可读存储介质,其中所述第一输入特性是所述第一资源的粘度值、纯度值、组成值、温度值、重量值、质量值、体积值或批次标识符。

52.根据权利要求50所述的非暂时性计算机可读存储介质,其中所述第一资源是单个资源或复合资源。

53.根据权利要求31所述的非暂时性计算机可读存储介质,其中所述相应多个过程版本中的过程版本的超图的所述多个节点中的第一节点的所述一组参数化资源包括第一参数化资源,所述第一参数化资源指定和与对应的第一边线相关联的所述过程的对应阶段相关联的过程条件。

54.根据权利要求53所述的非暂时性计算机可读存储介质,其中所述过程条件包括温度、暴露时间、混合时间、设备类型或批次标识符。

55.根据权利要求31所述的非暂时性计算机可读存储介质,其中所述指令进一步使所述第一装置进行以下操作:(D)针对所述一个或多个过程中的相应过程,执行数据驱动器,所述数据驱动器包含:

用于接收所述相应过程的数据集的指令;

用于解析所述数据集以获得以下各项的指令:(i)所述轮次数据存储区中的过程轮次的识别,和(ii)与所述过程轮次的所述相应过程的所述超图中的第一节点的所述相应一组参数化资源相关联的特性值;以及用于用解析值填充所述轮次数据存储区中的对应第一节点的参数化资源的所述特性值的指令。

56.根据权利要求31所述的非暂时性计算机可读存储介质,其中所述一个或多个对应的规格界限中的对应规格界限包括对应参数化资源的上限和下限值。

57.根据权利要求31所述的非暂时性计算机可读存储介质,其中所述对应的规格界限包括允许类型的枚举列表。

58.根据权利要求31所述的非暂时性计算机可读存储介质,其中所述一个或多个过程是多个过程,并且所述多个过程中的第一过程产生第一产品,所述多个过程中的第二过程产生第二产品,其中所述第一产品不同于所述第二产品。

59.根据权利要求31所述的非暂时性计算机可读存储介质,其中所述轮次数据存储区另外包括展示以下关系的系谱图:(i)过程的所述多个版本中的单个过程的各版本之间的关系,或(ii)两个或更多个过程的所述相应多个版本中的两个或更多个过程的各版本之间的关系。

60.一种计算机系统,包括:

一个或多个处理器;

存储器;以及

一个或多个程序,其存储在所述存储器中以供所述一个或多个处理器执行,所述一个或多个程序包括用于进行以下操作的指令:(A)维持超图数据存储区,所述超图数据存储区针对一组一个或多个过程中的每个相应过程包括所述相应过程的相应多个版本,所述一组一个或多个过程中的每个过程产生相应产品或分析信息,每个相应版本包括:超图,其包括由多个节点中的节点连接的多个边线,

所述多个边线中的每个相应边线包括表示对应过程中的相应阶段的过程阶段标记,并且与一个或多个输入和至少一个输出相关联;

所述多个节点中的每个相应节点与对应一组参数化资源相关联,并且指定所述对应一组参数化资源中的每个相应参数化资源与所述多个边线中的第一边线的所述至少一个输出中的至少一对应输出相关联,并且还与所述多个边线中的至少一个其它边线的所述一个或多个输入中的至少一对应输入相关联,并且其中所述一组参数化资源中的至少一个参数化资源与一个或多个特性相关联,所述一个或多个特性包含一个或多个对应的规格界限;

(B)维持轮次数据存储区,其中所述轮次数据存储区包括多个过程轮次,每个过程轮次包括:(i)所述一个或多个过程中的过程的所述多个版本中的版本的识别,和(ii)对应于所述相应版本的所述超图中的所述多个节点中的至少一个节点的相应一组参数化资源和它们相关联的一个或多个特性的值;以及(C)维持统计模块,响应于接收到识别存在于所述轮次数据存储区中的一个或多个过程轮次中的一个或多个第一参数化资源的质询,所述统计模块对所述一个或多个第一参数化资源进行格式化以供分析。

说明书 :

过程设计与分析的系统和方法

[0001] 相关申请的交叉引用
[0002] 本申请要求2017年8月29日提交的标题为《用于过程设计和分析的系统和方法(Systems and Methods for Process Design and Analysis)》的第15/690,134号美国专利申请的优先权,所述申请特此以引用的方式并入本文中。

技术领域

[0003] 本公开大体上涉及用于产生分析信息或产品的过程的过程设计和分析的系统和方法。

背景技术

[0004] 多阶段过程依赖于各种产品的研究和制造,仅举几例,包含生物制剂、药物、机械装置、电气装置和食物。不幸的是,此类过程通常具有许多变化来源。虽然这些来源大多微小,可以忽略不计,但是主要变化来源可能会对此类过程的效率甚至是可行性产生不利影响。但是,如果已经确定来源,那么可以使用用来去除这些主要变化来源的资源,并且这些主要变化来源有可能会被去除、最大限度地减少或被遏制。一旦解决了这些主要变化来源,过程就可以被认为是稳定的。当过程稳定时,它的变化应该保持在已知的一组限值内。也就是说,至少直到出现另一个可被指出的变化来源为止。例如,洗衣皂包装线可以设计成使每个洗衣皂盒装有十四盎司的洗衣皂。一些盒子会略超过十四盎司,一些盒子会略少于十四盎司。在测量包装重量时,数据会展示净重的分布。如果制造过程、它的输入或它的环境(例如,生产线上的机器)改变,那么数据的分布会改变。例如,由于机器的凸轮和滑轮出现磨损,洗衣皂填充机可能会将超过规定量的肥皂放到每个盒子中。这可能有利于消费者,但是从制造商的角度来说,这会产生浪费,并且会使生产成本增加。如果制造商及时发现了这一改变和它的来源,那么可以将这一改变校正(例如,更换凸轮和滑轮)。
[0005] 虽然理论上可以很好地识别过程的变化,但是实际上,查找这种变化有很多障碍。大多数过程组合了许多不同的功能组成部分,每个功能组成部分具有它们自己的数据形式和错误类型。举例来说,用于使用细胞培养制造合成化合物的过程组合了化学组成部分、生物组成部分、发酵组成部分和工业设备组成部分。这些组成部分中的每一个涉及不同量化、测量和误差单位。因而,用于产生和稳定过程的限速步骤并不是开发用于此类过程的算法,而是获取此类过程中的数据和并将其置于背景中加以考虑。这需要跨许多不同的系统和功能性进行数据聚合和可再生性评定,使得科学推理是基于可再生的数据,而不是基于噪声和不确定性的产物。常规系统没有足够的能力来进行这种分析。它们集中于存储文件和数据,而不提供用于实现实时分析和对用户的反馈的结构、背景或灵活性。
[0006] 举例来说,电子实验室笔记本(ELN)基本上都是“玻璃上的纸”,没有足够的能力来简化不同研究的纵向分析。实验室信息管理系统(LIMS)集中于样本数据收集,但是不提供协议或研究背景来促进分析,也不具有适应不断改变的“运行中”工作流和通常在过程中发现的许多不同功能性的灵活性。因此,协议和结果之间的关系仍是不清楚的,甚至是难以理解的,信息系统变成了体制政策所指定的旧有工作的“死”存档,而不是可以促进过程稳定化的资产。
[0007] 因此,每年会在材料和生命科学研究上损失数十亿美元,这些研究不稳定,所以它们的可再生率也不令人满意。此外,在过程向制造转移期间,仍然有很大的几率出现数百万美元的损失。因此,鉴于上述背景,本领域中需要的是有所改进的用于过程的过程设计和分析的系统和方法,这些系统和方法使得过程稳定。

发明内容

[0008] 所公开的实施例解决了本领域中对有所改进的用于使产生分析信息或产品的过程稳定的系统和方法的需要。如本文所使用,术语“产品”是指例如有形产品,如材料、组成物、成分、药品、块体材料等等;并且术语“分析信息”是指例如描述材料、设备或过程设定的测量值的类别或定量数据。所公开的系统和方法有利地且独特地减少了实验噪声以及研究开发与制造之间的协同摩擦。所公开的系统和方法有助于相对于实验过程的演变图显示数据,以突出显示质量问题和时机,显露根据时间、实验和队伍而变的趋势和因果关系,促进实验和过程质量的协同改进,并使过程稳定。
[0009] 所公开的系统和方法维持具有一个或多个过程的一个或多个版本的超图数据存储区。过程的版本包括具有代表过程的阶段的节点及边线的超图。阶段具有与阶段输入特性相关联的参数化资源输入,以及输入规格界限。阶段具有与输出特性相关联的资源输出及输出规格界限。边线将节点输出连接到其它节点的输入,代表资源从输出到输入的预期或实际转移。
[0010] 所公开的系统和方法还维持具有多个过程轮次的轮次数据存储区。每个过程轮次识别过程版本、对应过程的超图中第一节点的输入的值、它们的输入特性、第一节点的资源输出和资源输出的输出特性的获得值。当质询识别存在于所述轮次数据存储区中的一个或多个输入和/或输出时,会将它们格式化以供分析。
[0011] 既然已经概述了所公开的系统和方法的综述,就将呈现所公开的系统和方法的更具体实施例。
[0012] 实施例1-连接资源(节点)的步骤(边线)。本公开的一个方面提供一种非暂时性计算机可读存储介质,其用于提供一个或多个过程的过程设计和分析。所述一个或多个过程中的每个过程产生相应产品或分析信息。所述非暂时性计算机可读存储介质存储指令,所述指令在由第一装置执行时使所述第一装置维持超图数据存储区,所述超图数据存储区针对所述一个或多个过程中的每个相应过程包括所述相应过程的相应多个版本。每个相应版本包括超图,所述超图包括由多个边线中的边线连接的多个节点。所述多个边线中的每个相应边线包括表示对应过程中的相应阶段的过程阶段标记,并且与以下各项相关联:(i)对应过程中的所述相应阶段的一组参数化资源输入,其中所述一组参数化资源输入中的至少一个参数化资源输入与一个或多个输入特性相关联,所述一个或多个输入特性包含输入规格界限;和(ii)对应过程中的所述相应阶段的一组参数化资源输出,其中所述一组参数化资源输出中的至少一个参数化资源输出与一个或多个输出特性相关联,所述一个或多个输出特性包含对应的输出规格界限。所述多个节点中的每个相应节点指定所述多个节点中的边线的所述一组参数化资源输出被包含在所述多个边线中的至少一个其它边线的所述一组参数化资源输入中。
[0013] 第一装置另外维持轮次数据存储区。所述轮次数据存储区包括多个过程轮次。每个过程轮次包括:(i)所述一个或多个过程中的过程的所述多个版本中的版本的识别,(ii)相应版本的超图中的第一边线的相应一组参数化资源输入和它们相关联的输入特性的值,(iii)相应版本的超图中的第一边线的相应一组参数化资源输出,和(iv)相应版本的超图中的第一边线的相应一组参数化资源输出中的参数化资源输出的至少一个输出特性的获得值。
[0014] 第一装置另外维持统计模块,响应于接收到识别存在于所述轮次数据存储区中的一个或多个过程轮次中的一个或多个第一参数化资源输入和/或参数化资源输出的质询,统计模块对所述一个或多个第一参数化资源输入和/或参数化资源输出进行格式化以供分析。
[0015] 在一些实施例中,质询另外识别存在于轮次数据存储区中的一个或多个轮次中的一个或多个第二参数化资源输入和/或参数化资源输出。所述指令在由第一装置执行时进一步使第一装置进行以下操作:使所述一个或多个第一参数化资源输入和/或参数化资源输出和所述一个或多个第二参数化资源输入和/或参数化资源输出相关;以及对相关性的数值量度进行格式化以供呈现。
[0016] 在一些实施例中,所述指令在由第一装置执行时进一步使第一装置进行以下操作:将所述一个或多个第一参数化资源输入和/或参数化资源输出导出到第二装置以供分析。
[0017] 在一些实施例中,所述指令在由第一装置执行时进一步使第一装置进行以下操作:维持过程评估模块,当所述多个过程轮次中的过程轮次的一组参数化资源输出中的参数化资源输出的输出特性的获得值在输出规格界限之外时,所述过程评估模块生成呈计算机数据传输形式的警告。
[0018] 在一些实施例中,所述一个或多个过程中的过程的相应多个版本中的第一版本第二版本在以下方面不同于彼此:节点的数目、边线的过程阶段标记、一组参数化资源输入中的参数化资源输入,或一组参数化资源输出中的参数化资源输出。
[0019] 在一些实施例中,质询另外识别存在于轮次数据存储区中的一个或多个轮次中的一个或多个第二参数化资源输入和/或参数化资源输出。此外,统计模块另外使用多变量分析技术识别以下在存在于轮次数据存储区中的所有参数化资源输入和/或参数化资源输出当中存在于轮次数据存储区中的一个或多个过程轮次中的两者之间的相关性:(i)所述一个或多个第一参数化资源输入和/或参数化资源输出,和(ii)所述一个或多个第二参数化资源输入和/或参数化资源输出。在一些实施例中,多变量分析包括特征选择技术(例如,最小角回归、逐步回归等)。
[0020] 在一些实施例中,统计模块另外基于预测所述一个或多个过程中的第一过程中不存在于所述轮次数据存储区中的额外过程轮次的所述一个或多个第二参数化输入的建议值将改变所述一个或多个过程轮次的数值属性,提供所述一个或多个第二参数化输入的所述建议值。在一些此类实施例中,数值属性是所述一个或多个第一参数化资源输入的方差的减小。在一些实施例中,所述质询另外识别存在于所述轮次数据存储区中的一个或多个轮次中的一个或多个第三参数化资源输入和/或参数化资源输出,并且数值属性是所述一个或多个第一参数化资源输入和/或参数化资源输出与所述一个或多个第三参数化资源输入和/或参数化资源输出之间的相关性的置信度。
[0021] 在一些实施例中,所述一个或多个过程是多个过程,并且识别所述多个过程的子集中的过程轮次中的相关性。在一些实施例中,所述一个或多个过程是多个过程,并且识别所述多个过程中的单个过程中的过程轮次中的相关性。在一些实施例中,所述一个或多个过程是多个过程,并且所述质询另外识别过程轮次将通过统计模块格式化的所述多个过程的子集。
[0022] 在一些实施例中,所述一个或多个过程是多个过程,并且所述质询另外识别所述多个过程中的过程轮次将通过统计模块格式化的单个过程。
[0023] 在一些实施例中,所述质询另外识别所述一个或多个过程中的过程轮次子集。
[0024] 在一些实施例中,统计模块另外识别以下两者之间的相关性:(i)包括所述轮次数据存储区中的一个或多个过程轮次的第一组,和(ii)包括所述轮次数据存储区中的一个或多个过程轮次的第二组,其中所述第二组中的过程轮次不在所述第一组中。在一些此类实施例中,计算存在于所述第一组和第二组中的多个参数化资源输入和/或参数化资源输出之间的相关性。
[0025] 在一些实施例中,相应多个过程版本中的过程版本的超图的多个边线中的边线的一组参数化资源输入包括第一和第二参数化资源输入,所述第一参数化资源输入指定第一资源并且与第一输入特性相关联,第二参数化资源输入指定第二资源并且与第二输入特性相关联,其中所述第一输入特性不同于所述第二输入特性。在一些此类实施例中,第一输入特性是第一资源的粘度值、纯度值、组成值、温度值、重量值、质量值、体积值或批次标识符。在一些此类实施例中,第一资源是单个资源或复合资源。
[0026] 在一些实施例中,相应多个过程版本中的过程版本的超图的多个节点中的第一边线的一组参数化资源输入包括第一参数化资源输入,并且此第一参数化资源输入指定和与第一边线相关联的过程的对应阶段相关联的过程条件。在一些此类实施例中,过程条件包括温度、暴露时间、混合时间、设备类型或批次标识符。
[0027] 在一些实施例中,所述指令进一步使第一装置执行所述一个或多个过程中的相应过程的数据驱动器,所述数据驱动器包含:用于接收相应过程的数据集的指令;用于解析数据集以获得以下各项的指令:(i)轮次数据存储区中的过程轮次的识别和(ii)与所述过程轮次的相应过程的超图中的第一边线的相应一组参数化资源输出相关联的输出特性值;以及用于用解析值填充轮次数据存储区中的第一边线的参数化资源输出的输出特性值的指令。
[0028] 在一些实施例中,对应的输出规格界限包括对应参数化资源输出的上限和下限值。
[0029] 在一些实施例中,对应的输出规格界限包括允许类型的枚举列表。
[0030] 在一些实施例中,所述一个或多个过程是多个过程,并且所述多个过程中的第一过程产生第一产品,所述多个过程中的第二方法产生第二产品,其中第一产品不同于第二产品。
[0031] 在一些实施例中,轮次数据存储区另外包括展示以下关系的系谱图:(i)过程的多个版本中的单个过程的各版本之间的关系,或(ii)两个或更多个过程的相应多个版本中的两个或更多个过程的各版本之间的关系。
[0032] 本公开的另一方面提供一种计算机系统,包括:一个或多个处理器、存储器,和存储在所述存储器中以供所述一个或多个处理器执行的一个或多个程序。所述一个或多个程序包括用于维持超图数据存储区的指令,针对一组一个或多个过程中的每个相应过程,所述超图数据存储区包括所述相应过程的相应多个版本,所述一组一个或多个过程中的每个过程产生相应产品或分析信息。每个相应版本包括超图,所述超图包括由多个边线中的边线连接的多个节点。所述多个边线中的每个相应边线包括表示对应过程中的相应阶段的过程阶段标记,并且与以下各项相关联:(i)对应过程中的所述相应阶段的一组参数化资源输入,其中所述一组参数化资源输入中的至少一个参数化资源输入与一个或多个输入特性相关联,所述一个或多个输入特性包含输入规格界限;和(ii)对应过程中的所述相应阶段的一组参数化资源输出,其中所述一组参数化资源输出中的至少一个参数化资源输出与一个或多个输出特性相关联,所述一个或多个输出特性包含对应的输出规格界限。所述多个节点中的每个相应节点指定所述多个边线中的边线的所述一组参数化资源输出被包含在所述多个边线中的至少一个其它边线的所述一组参数化资源输入中。维持轮次数据存储区。轮次数据存储区包括多个过程轮次,每个过程轮次包括:(i)所述一个或多个过程中的过程的所述多个版本中的版本的识别,(ii)相应版本的超图中的第一边线的相应一组参数化资源输入和它们相关联的输入特性的值,(iii)相应版本的超图中的第一边线的相应一组参数化资源输出,和(iv)相应版本的超图中的每个边线的相应一组参数化资源输出中的参数化资源输出的至少一个输出特性的获得值。维持统计模块,响应于接收到识别存在于所述轮次数据存储区中的一个或多个过程轮次中的一个或多个第一参数化资源输入和/或参数化资源输出的质询,统计模块对所述一个或多个第一参数化输入和/或参数化输出进行格式化以供分析。
[0033] 实施例2-通过通用实体(节点)连接的步骤(边线),其中资源列表与那些节点相关联。本公开的另一方面提供一种非暂时性计算机可读存储介质,其用于提供一个或多个过程的过程设计和分析。所述一个或多个过程中的每个过程产生相应产品或分析信息。非暂时性计算机可读存储介质存储指令,所述指令在由第一装置执行时使所述第一装置维持超图数据存储区,所述超图数据存储区针对所述一个或多个过程中的每个相应过程包括所述相应过程的相应多个版本。每个相应版本包括超图,所述超图包括由多个节点中的节点连接的多个边线。所述多个边线中的每个相应边线包括表示对应过程中的相应阶段的过程阶段标记,并且与一个或多个输入和至少一个输出相关联。所述多个节点中的每个相应节点与对应一组参数化资源相关联,并且指定所述对应一组参数化资源形成所述多个边线中的第一边线的至少一个输出中的输出,还形成所述多个边线中的至少一个其它边线的一个或多个输入中的输入。一组参数化资源中的至少一个参数化资源与一个或多个特性相关联。所述一个或多个特性包含一个或多个对应的规格界限。在此类实施例中,维持轮次数据存储区。所述轮次数据存储区包括多个过程轮次。每个过程轮次包括:(i)所述一个或多个过程中的过程的所述多个版本中的版本的识别,和(ii)对应于相应版本的超图中的第一节点的第一输出或第一节点的至少一个其它节点的第一输入中的至少一个的相应一组参数化资源和它们相关联的一个或多个特性的值。与边线的输出侧相关联的资源的值可不同于与相同边线的输入侧相关联的资源的值。在此类实施例中,维持统计模块,响应于接收到识别存在于所述轮次数据存储区中的一个或多个过程轮次中的一个或多个第一参数化资源的质询,所述统计模块对所述一个或多个第一参数化资源进行格式化以供分析。
[0034] 在一些实施例中,质询另外识别存在于轮次数据存储区中的一个或多个轮次中的一个或多个第二参数化资源。所述指令在由第一装置执行时进一步使第一装置进行以下操作:使所述一个或多个第一参数化资源和所述一个或多个第二参数化资源相关,并对相关性的数值量度进行格式化以供呈现。
[0035] 在一些实施例中,所述指令在由第一装置执行时进一步使第一装置将所述一个或多个第一参数化资源导出到第二装置以供分析。
[0036] 在一些实施例中,所述指令在由第一装置执行时进一步使第一装置进行以下操作:维持过程评估模块,当所述多个过程轮次中的过程轮次的一组参数化资源中的参数化资源的特性的获得值在对应的规格界限之外时,所述过程评估模块生成呈计算机数据传输形式的警告。
[0037] 在一些实施例中,所述一个或多个过程中的过程的相应多个版本中的第一版本和第二版本在以下方面不同于彼此:节点的数目、节点的过程阶段标记,或一组参数化资源中的参数化资源。
[0038] 在一些实施例中,质询另外识别存在于轮次数据存储区中的一个或多个轮次中的一个或多个第二参数化资源,并且统计模块另外使用多变量分析技术(例如,使用特征选择技术,如最小角回归、逐步回归等)识别以下在存在于轮次数据存储区中的所有参数化资源当中存在于轮次数据存储区中的一个或多个过程轮次中的两者之间的相关性:(i)所述一个或多个第一参数化资源和(ii)所述一个或多个第二参数化资源。在一些实施例中,统计模块另外基于预测所述一个或多个过程中的第一过程中不存在于轮次数据存储区中的额外过程轮次的一个或多个第二参数化资源的建议值将改变所述一个或多个过程轮次的数值属性,提供所述一个或多个第二参数化资源的所述建议值。
[0039] 在一些实施例中,数值属性是跨一个或多个过程轮次展现的所述一个或多个第一参数化资源的方差的减小。在一些实施例中,质询另外识别存在于所述轮次数据存储区中的一个或多个轮次中的一个或多个第三参数化资源,并且数值属性是所述一个或多个第一参数化资源和所述一个或多个第三参数化资源之间的相关性的置信度。在一些实施例中,所述一个或多个过程是多个过程,并且识别所述多个过程的子集中的过程轮次中的相关性。在一些实施例中,所述一个或多个过程是多个过程,并且识别所述多个过程中的单个过程中的过程轮次中的相关性。
[0040] 在一些实施例中,所述一个或多个过程是多个过程,并且所述质询另外识别过程轮次将通过统计模块格式化的所述多个过程的子集。在一些实施例中,所述一个或多个过程是多个过程,并且所述质询另外识别所述多个过程中的过程轮次将通过统计模块格式化的单个过程。在一些实施例中,所述质询另外识别所述一个或多个过程中的过程轮次子集。在一些实施例中,统计模块另外识别以下两者之间的相关性:(i)包括所述轮次数据存储区中的一个或多个过程轮次的第一组,和(ii)包括所述轮次数据存储区中的一个或多个过程轮次的第二组,其中所述第二组中的过程轮次不在所述第一组中。
[0041] 在一些实施例中,计算存在于第一组和第二组中的多个参数化资源之间的相关性。在一些实施例中,相应多个过程版本中的过程版本的超图的多个节点中的节点的一组参数化资源包括第一和第二参数化资源,所述第一参数化资源指定第一资源且与第一特性相关联,所述第二参数化资源指定第二资源且与第二特性相关联,其中所述第一特性不同于所述第二特性。在一些实施例中,第一特性是第一资源的粘度值、纯度值、组成值、温度值、重量值、质量值、体积值或批次标识符。在一些实施例中,第一资源是单个资源或复合资源。
[0042] 在一些实施例中,相应多个过程版本中的过程版本的超图的多个节点中的第一节点的一组参数化资源包括第一参数化资源,并且所述第一参数化资源指定和与对应的第一边线相关联的过程的对应阶段相关联的过程条件。在一些此类实施例中,过程条件包括温度、暴露时间、混合时间、设备类型或批次标识符。
[0043] 在一些实施例中,所述指令进一步使第一装置执行一个或多个过程中的相应过程的数据驱动器。数据驱动器包含:用于接收相应过程的数据集的指令;用于解析数据集以获得以下各项的指令:(i)所述轮次数据存储区中的过程轮次的识别和(ii)与所述过程轮次的相应过程的超图中的第一节点的相应一组参数化资源相关联的特性值;以及用于用解析值填充轮次数据存储区中的对应第一节点的参数化资源的特性值的指令。
[0044] 在一些实施例中,对应的规格界限包括对应参数化资源的上限和下限值。
[0045] 在一些实施例中,对应的规格界限包括允许类型的枚举列表。
[0046] 在一些实施例中,所述一个或多个过程是多个过程,并且所述多个过程中的第一过程产生第一产品,所述多个过程中的第二方法产生第二产品,其中第一产品不同于第二产品。
[0047] 在一些实施例中,轮次数据存储区另外包括展示以下关系的系谱图:(i)过程的多个版本中的单个过程的各版本之间的关系,或(ii)两个或更多个过程的相应多个版本中的两个或更多个过程的各版本之间的关系。
[0048] 本公开的另一方面提供一种计算机系统,包括:一个或多个处理器、存储器,和存储在所述存储器中以供所述一个或多个处理器执行的一个或多个程序。所述一个或多个程序包括用于维持超图数据存储区的指令。针对一组一个或多个过程中的每个相应过程,超图数据存储区包括所述相应过程的相应多个版本,所述一组一个或多个过程中的每个过程产生相应产品或分析信息。每个此类相应版本包括超图,所述超图包括由多个边线中的边线连接的多个节点,所述多个边线中的每个相应边线包括表示对应过程中的相应阶段的过程阶段标记且与一个或多个输入和至少一个输出相关联,并且所述多个节点中的每个相应节点与对应一组参数化资源相关联,并指定所述对应一组参数化资源形成所述多个边线中的第一边线的至少一个输出中的输出,还形成所述多个边线中的至少一个其它边线的一个或多个输入中的输入,并且其中所述一组参数化资源中的至少一个参数化资源与一个或多个特性相关联,所述一个或多个特性包含一个或多个对应规格界限。另外维持轮次数据存储区。所述轮次数据存储区包括多个过程轮次。每个过程轮次包括:(i)所述一个或多个过程中的过程的所述多个版本中的版本的识别,和(ii)对应于相应版本的超图中的第一节点的第一输出或第一节点的至少一个其它节点的第一输入中的至少一个的相应一组参数化资源和它们相关联的一个或多个特性的值。与边线的输出侧相关联的资源的值可不同于与相同边线的输入侧相关联的资源的值。维持统计模块,响应于接收到识别存在于所述轮次数据存储区中的一个或多个过程轮次中的一个或多个第一参数化资源的质询,所述统计模块对所述一个或多个第一参数化资源进行格式化以供分析。
[0049] 实施例3-由不具有相关联列表的通用实体(节点)连接的步骤(边线)。本公开的另一方面提供一种非暂时性计算机可读存储介质,其用于提供一个或多个过程的过程设计和分析。所述一个或多个过程中的每个过程产生相应产品或分析信息。所述非暂时性计算机可读存储介质存储指令,所述指令在由第一装置执行时使所述第一装置维持超图数据存储区,所述超图数据存储区针对所述一个或多个过程中的每个相应过程包括所述相应过程的相应多个版本。每个相应版本包括超图,所述超图包括由多个节点中的节点连接的多个边线。所述多个边线中的每个相应边线包括表示对应过程中的相应阶段的过程阶段标记,并且与一个或多个输入和至少一个输出相关联。所述多个节点中的每个相应节点形成所述多个边线中的第一边线的至少一个输出中的输出,还形成所述多个边线中的至少一个其它边线的一个或多个输入中的输入。
[0050] 维持轮次数据存储区。所述轮次数据存储区包括多个过程轮次。每个过程轮次包括所述一个或多个过程中的过程的所述多个版本中的版本的识别。
[0051] 维持统计模块,响应于接收到识别存在于所述轮次数据存储区中的一个或多个过程轮次中的一个或多个第一参数化资源的质询,所述统计模块对所述一个或多个第一参数化资源进行格式化以供分析。
[0052] 在一些实施例中,所述方法另外包括使所述多个节点中的每个相应节点与对应一组参数化资源相关联,并指定所述对应一组参数化资源形成所述多个边线中的第一边线的至少一个输出中的输出,还形成所述多个边线中的至少一个其它边线的一个或多个输入中的输入。所述一组参数化资源中的至少一个参数化资源与一个或多个特性相关联,所述一个或多个特性包含一个或多个对应的规格界限。此外,针对所述多个过程轮次中的每个相应过程轮次,轮次数据存储区还包括对应于相应版本的超图中的第一节点的第一输出或第一节点的至少一个其它节点的第一输入中的至少一个的相应一组参数化资源和它们相关联的一个或多个特性的值。
[0053] 在一些实施例中,质询另外识别存在于轮次数据存储区中的一个或多个轮次中的一个或多个第二参数化资源。所述指令在由第一装置执行时进一步使第一装置进行以下操作:使所述一个或多个第一参数化资源和所述一个或多个第二参数化资源相关,并对相关性的数值量度进行格式化以供呈现。
[0054] 在一些实施例中,所述指令在由第一装置执行时进一步使第一装置将所述一个或多个第一参数化资源导出到第二装置以供分析。
[0055] 在一些实施例中,所述指令在由第一装置执行时进一步使第一装置维持过程评估模块,当所述多个过程轮次中的过程轮次的一组参数化资源输出中的参数化资源的特性的获得值在输出规格界限之外时,所述过程评估模块生成呈计算机数据传输形式的警告。
[0056] 在一些实施例中,所述一个或多个过程中的过程的相应多个版本中的第一版本和第二版本在以下方面不同于彼此:节点的数目、节点的过程阶段标记,或一组参数化资源输入中的参数化资源。
[0057] 在一些实施例中,质询另外识别存在于轮次数据存储区中的一个或多个轮次中的一个或多个第二参数化资源。统计模块另外使用多变量分析技术识别以下在存在于轮次数据存储区中的所有参数化资源当中存在于轮次数据存储区中的一个或多个过程轮次中的两者之间的相关性:(i)所述一个或多个第一参数化资源和(ii)所述一个或多个第二参数化资源在一些实施例中,多变量分析包括特征选择技术,例如,最小角回归、逐步回归等。
[0058] 在一些实施例中,统计模块另外基于预测所述一个或多个过程中的第一过程中不存在于轮次数据存储区中的额外过程轮次的一个或多个第二资源的建议值将改变所述一个或多个过程轮次的数值属性,提供所述一个或多个第二资源的所述建议值。在一些此类实施例中,数值属性是跨一个或多个过程轮次展现的所述一个或多个第一参数化资源的方差的减小。在一些此类实施例中,质询另外识别存在于所述轮次数据存储区中的一个或多个轮次中的一个或多个第三参数化资源,并且数值属性是所述一个或多个第一资源和所述一个或多个第三资源之间的相关性的置信度。
[0059] 在一些实施例中,所述一个或多个过程是多个过程,并且识别所述多个过程的子集中的过程轮次中的相关性。在一些实施例中,所述一个或多个过程是多个过程,并且识别所述多个过程中的单个过程中的过程轮次中的相关性。在一些实施例中,所述一个或多个过程是多个过程,并且所述质询另外识别过程轮次将通过统计模块格式化的所述多个过程的子集。在一些实施例中,所述一个或多个过程是多个过程,并且所述质询另外识别所述多个过程中的过程轮次将通过统计模块格式化的单个过程。
[0060] 在一些实施例中,所述质询另外识别所述一个或多个过程中的过程轮次子集。在一些实施例中,统计模块另外识别以下两者之间的相关性:(i)包括所述轮次数据存储区中的一个或多个过程轮次的第一组,和(ii)包括所述轮次数据存储区中的一个或多个过程轮次的第二组,其中所述第二组中的过程轮次不在所述第一组中。在一些实施例中,计算存在于第一组和第二组中的多个参数化资源之间的相关性。
[0061] 在一些实施例中,相应多个过程版本中的过程版本的超图的多个节点中的节点的一组资源包括第一和第二参数化资源,所述第一参数化资源指定第一资源并且与第一特性相关联,第二参数化资源指定第二资源并且与第二特性相关联,其中所述第一特性不同于所述输入特性。在一些此类实施例中,第一特性是第一资源的粘度值、纯度值、组成值、温度值、重量值、质量值、体积值或批次标识符。在一些此类实施例中,第一资源是单个资源或复合资源。
[0062] 在一些实施例中,相应多个过程版本中的过程版本的超图的多个节点中的第一节点的一组参数化资源包括第一参数化资源,所述第一参数化资源指定过程条件。在一些此类实施例中,过程条件包括温度、暴露时间、混合时间、设备类型或批次标识符。
[0063] 在一些实施例中,所述指令进一步使第一装置执行一个或多个过程中的相应过程的数据驱动器。所述数据驱动器包含:用于接收相应过程的数据集的指令;用于解析数据集以获得以下各项的指令:(i)轮次数据存储区中的过程轮次的识别和(ii)与所述过程轮次的相应过程的超图中的第一节点的相应一组参数化资源相关联的特性值;以及用于用解析值填充轮次数据存储区中的第一节点的参数化资源的特性值的指令。
[0064] 在一些实施例中,对应的规格界限包括对应参数化资源的上限和下限值。在一些实施例中,对应的输出规格界限包括允许类型的枚举列表。
[0065] 在一些实施例中,所述一个或多个过程是多个过程,并且所述多个过程中的第一过程产生第一产品,所述多个过程中的第二方法产生第二产品,其中第一产品不同于第二产品。
[0066] 在一些实施例中,轮次数据存储区另外包括展示以下关系的系谱图:(i)过程的多个版本中的单个过程的各版本之间的关系,或(ii)两个或更多个过程的相应多个版本中的两个或更多个过程的各版本之间的关系。
[0067] 本公开的另一方面提供一种计算机系统,包括:一个或多个处理器、存储器,和存储在所述存储器中以供所述一个或多个处理器执行的一个或多个程序。所述一个或多个程序包括用于维持超图数据存储区的指令,针对一组一个或多个过程中的每个相应过程,所述超图数据存储区包括所述相应过程的相应多个版本,所述一组一个或多个过程中的每个过程产生相应产品或分析信息。每个此类相应版本包括超图,所述超图包括由多个节点中的节点连接的多个边线。所述多个边线中的每个相应边线包括表示对应过程中的相应阶段的过程阶段标记,并且与一个或多个输入和至少一个输出相关联。所述多个节点中的每个相应节点形成所述多个边线中的第一边线的至少一个输出中的输出,还形成所述多个边线中的至少一个其它边线的一个或多个输入中的输入。维持轮次数据存储区。所述轮次数据存储区包括多个过程轮次。每个过程轮次包括所述一个或多个过程中的过程的所述多个版本中的版本的识别。维持统计模块,响应于接收到识别存在于所述轮次数据存储区中的一个或多个过程轮次中的一个或多个第一参数化资源的质询,所述统计模块对所述一个或多个第一资源进行格式化以供分析。

附图说明

[0068] 图1说明根据本公开的系统拓扑,其包含装置,即计算机系统200,以及过程的多个阶段20。
[0069] 图2说明根据本公开的实施例的计算机系统。
[0070] 图3说明根据本公开的实施例的过程版本。
[0071] 图4说明根据本公开的实施例的轮次数据存储区。
[0072] 图5说明根据本公开的实施例的过程评估模块。
[0073] 图6A、6B、6C、6D和6E共同说明根据本公开的实施例的提供其中步骤(边线)连接资源(节点)的一个或多个过程的过程设计和分析的流程图。
[0074] 图7说明根据本公开的实施例的包括通过边线连接的多个节点的超图,其中突出显示了发酵器设置阶段。
[0075] 图8说明根据本公开的实施例的图7的超图,其中突出显示了生长接种物阶段。
[0076] 图9说明根据本公开的实施例的图7的超图,其中突出显示了接种发酵器阶段。
[0077] 图10说明根据本公开的实施例的图7的超图,其中突出显示了分批补料发酵阶段。
[0078] 图11说明根据本公开的实施例的图7的超图,其中向图7的超图添加新阶段。
[0079] 图12说明根据本公开的实施例的图11的超图,其中向图7的超图添加DW测定阶段和废气测定阶段。
[0080] 图13说明根据本公开的实施例的图12的超图,其中向图7的超图添加新的一组阶段。
[0081] 图14说明根据本公开的实施例的图13的超图,其中定义了所述新的一组阶段。
[0082] 图15说明根据本公开的实施例的如何定义在图13和14的超图中定义的所述新的一组阶段。
[0083] 图16说明根据本公开的实施例的如何定义在图13和14的超图中定义的所述新的一组阶段中的新标样制备阶段。
[0084] 图17说明根据本公开的实施例的如何定义在图13和14的超图中定义的所述新的一组阶段中的新仪器校准阶段。
[0085] 图18进一步说明根据本公开的实施例的如何定义在图13和14的超图中定义的所述新的一组阶段中的新仪器校准阶段。
[0086] 图19说明根据本公开的实施例的如何定义在图13和14的超图中定义的所述新的一组阶段中的新轮次样本阶段。
[0087] 图20说明根据本公开的实施例的使用在图13和14的超图中定义的所述新的一组阶段来设置过程轮次。
[0088] 图21进一步说明根据本公开的实施例的使用在图13和14的超图中定义的所述新的一组阶段来设置过程轮次。
[0089] 图22进一步说明根据本公开的实施例的使用在图13和14的超图中定义的所述新的一组阶段来设置过程轮次。
[0090] 图23进一步说明根据本公开的实施例的在图13和14的超图中定义的所述新的一组阶段中的新轮次样本阶段的三个不同过程轮次的原始数据。
[0091] 图24进一步说明根据本公开的实施例的进行选择以分析在图23中说明的数据。
[0092] 图25说明根据本公开的实施例的对图23中说明的数据的分析。
[0093] 图26说明根据本公开的实施例的对图23中说明的数据的进一步分析。
[0094] 图27A、27B、27C、27D和27E共同说明根据本公开的另一实施例的提供其中步骤(边线)通过通用实体(节点)连接的一个或多个过程的过程设计和分析的流程图,其中资源列表与那些节点相关联。
[0095] 图28A、28B、28C、28D和28E共同说明根据本公开的另一实施例的提供其中步骤(边线)通过不具有相关联列表的通用实体(节点)连接的一个或多个过程的过程设计和分析的流程图。
[0096] 贯穿附图的若干视图,相似的附图标记指代对应的部分。

具体实施方式

[0097] 现将详细参照实施例,在附图中展示所述实施例的实例。在以下详细描述中,阐述了许多具体细节以便彻底理解本公开。然而,对本领域普通技术人员而言将显而易见的是,本公开可以在没有这些具体细节的情况下实施。在其它例子中,并未详细描述熟知的方法、程序、组件、电路以及网络,以免不必要地模糊实施例的各个方面。
[0098] 还应理解,虽然术语“第一”、“第二”等可在本文中用于描述各种元件,但这些元件不应受这些术语限制。这些术语仅用于将一个元件与另一元件区分开来。例如,在不脱离本公开的范围的情况下,第一主体可以被称为第二主体,并且类似地,第二主体可以被称为第一主体。虽然第一主体和第二主体都为主体,但这些主体不是同一个主体。
[0099] 在本公开中使用的术语仅用于描述特定实施例,并不旨在限制本发明。如在本发明和所附权利要求书的描述中所使用的,除非上下文以其它方式明确指示,否则单数形式“一个/一种(a/an)”和“所述(the)”旨在同样包含复数形式。还应理解,如本文使用的术语“和/或”指代并且涵盖一个或多个相关联的列举项的任何和所有可能组合。另外应理解,当在本说明书中使用术语“包括(comprises/comprising)”时,该术语指定陈述的特征、整数、步骤、操作、要素和/或组件的存在,但不排除一个或多个其它特征、整数、步骤、操作、要素、组件和/或它们的群组的存在或添加。
[0100] 如本文中所使用的,根据上下文,术语“如果”可以被解释为意指“当……时(when)”或“在……时(upon)”或“响应于确定”或“响应于检测到”。类似地,根据上下文,短语“如果确定”或“如果检测到[所陈述的条件或事件]”可以被解释为意指“在确定……时”或“响应于确定”或“在检测到[所陈述的条件或事件]时”或“响应于检测到[所陈述的条件或事件]”。
[0101] 结合图1至5描述根据本公开的用于提供一个或多个过程的过程设计和分析的系统48的详细描述。具体地说,图1说明具有多个阶段20的过程或管线。图1中的每个相应阶段20由示例性反应室示出,以指示发生了一种形式的材料转换。但是,不要求这种材料转换在反应室内进行。在图1所说明的实施例中,每个阶段20包括一组参数化输入308和一组参数化输出314。更一般地说,在一些实施例中,多个阶段中的每个相应阶段与一个或多个输入和至少一个输出相关联。
[0102] 在一些实施例中,如图1所说明,将这些输入308和输出314的描述提供给计算机系统200,这可能通过通信网络106来进行。举例来说,在阶段20-2,当过程轮次完成此阶段时,将包含此阶段的参数化输出的文件存储在与此阶段相关联的目录中。然后,扫描或监视过程获取此新文件,并将其发送到计算机系统200,在此将其上载到存储在计算机系统200中的对应过程轮次中。更详细地说,在一些实施例中,输入308或输出314由测量装置进行电子测量。举例来说,在一些实施例中,作为后台进程(如Google Drive或Dropbox Sync)在任何附接到阶段20的仪器或其它组件上的计算机上运行的同步引擎等软件组件监视同步文件夹。当新仪器数据文件被添加到文件夹中时,软件解析并通过通信网络106向计算机系统200发送与所述阶段相关联的数据。在一些实施例中,使用硬件解决方案来传送过程的阶段
20的一组输入308和输出314。在这种方法中,通过与阶段20的仪器或其它组件直接介接来进行数据获取和转移。举例来说,在一些实施例中,使用BeagleBone black微控制器(http://beagleboard.org/BLACK)通过网络106将此类数据传输到计算机系统200。在一些实施例中,数据(例如,与过程的阶段20相关联的一组参数化资源输入310的值和/或一组参数化资源输出314的值)通过HTTPS端口443借助HTTP POST或表述性状态转移从相应阶段20传送到计算机系统。
[0103] 当然,系统48的其它拓扑是可能的,举例来说,计算机系统200实际上可以构成在网络中连接在一起的数个计算机,也可以是云计算背景中的虚拟机。因此,图1中所示的示例性拓扑结构仅用于以本领域的技术人员易于理解的方式来描述本公开的实施例的特征。
[0104] 参考图2,在典型的实施例中,用于提供一个或多个过程的过程设计和分析的计算机系统200包括一个或多个计算机。出于图2中的说明的目的,计算机系统200表示为单个计算机,包含计算机系统200的所有功能性。然而,本公开不限于此。计算机系统200的功能性可以分布在任何数目个联网计算机上,和/或驻留在数个联网计算机中的每一个上,和/或托管在位于可通过通信网络106访问的远程位置处的一个或多个虚拟机上。本领域的技术人员将了解,计算机系统200的各种不同计算机拓扑是可能的,并且所有这种拓扑都在本公开的范围内。
[0105] 计算机系统200具有独特的结构,用于通过最小的工作量以可计算方式记录和存储数据,定量搜索所有实验设计和数据或其任何子集,应用实时统计分析,通过设计获得质量,更新实验过程和数据收集系统,通过自动关键质量分析识别有意义的变量,按常规获得真实且不容置疑的结果,访问透明数据和结果,使得结果公开并且可被访问(安全地控制对任何人或任何小组的访问),对其他人的设计和结果进行定量和直接的构建,并明确地向小组成员或合作伙伴传达支持结论的证据。
[0106] 考虑到前述内容,转向图2,计算机系统200包括一个或多个处理单元(CPU)274、网络或其它通信接口284、存储器192(例如,随机存取存储器)、任选地由一个或多个控制器288访问的一个或多个磁盘存储装置和/或持久性装置290、用于将前述组件互连的一个或多个通信总线112,以及用于对前述组件供电的电源276。存储器192中的数据可以使用高速缓存等已知的计算技术而与非易失性存储器290无缝共享。存储器192和/或存储器290可包含相对于一个或多个中央处理单元274远程定位的大容量存储装置。换句话说,存储在存储器192和/或存储器290中的一些数据实际上可托管在计算机系统200外部的计算机上,但是这些计算机可以由计算机系统通过因特网、内联网或其它形式的网络或电子缆线(在图2中示出为元件106)使用网络接口284以电子方式访问。
[0107] 计算机系统200的存储器192存储:
[0108] ●操作系统202,其包含用于处理各种基本系统服务的程序;
[0109] ●超图数据存储区204,其针对一个或多个过程中的每个相应过程206包括所述相应过程206的相应多个版本208;
[0110] ●轮次数据存储区206,其存储多个过程轮次,每个过程轮次包括所述一个或多个过程中的过程的多个版本中的版本208的识别;
[0111] ●统计模块212,其用于分析过程数据;
[0112] ●过程评估模块216,其用于在过程中出现特定条件时发起警告;以及
[0113] ●一个或多个可选数据驱动器218,每个数据驱动器用于所述一个或多个过程中的相应过程,所述数据驱动器包含用于接收所述相应过程的数据集的指令和用于处理所述数据集的指令。
[0114] 在一些实施方案中,计算机系统200中的上文指出的数据元或模块中的一个或多个存储在先前提及的存储器装置中的一个或多个中,并且对应于用于执行上文所描述的功能的指令集。上文指出的数据、模块或程序(例如,指令集)无需实施为单独的软件程序、过程或模块形式,并且因此在各种实施方案中可以组合或以其它方式重新布置这些模块的各个子集。在一些实施方案中,存储器192和/或290任选地存储上文指出的模块和数据结构的子集。此外,在一些实施例中,存储器192和/或206存储上文未描述的额外模块和数据结构。
[0115] 转到图3,描述了过程版本208的实施例的更多细节。过程版本包括超图302。超图302包括多个节点,并且具有方向性、因果性和顺序性。举例来说,多个节点中的每个相应节点322通过多个边线中的边线304连接到多个节点中的至少一个其它节点。在一些实施例中,所述多个边线中的每个相应边线304包括表示对应过程中的相应阶段的过程阶段标记
306。在一些替代实施例中,并不是所述多个边线中的边线304,而是所述多个节点中的每个相应节点322包括表示对应过程中的相应阶段的过程阶段标记306。
[0116] 在一些实施例中,节点322是可用于构建更大过程的转换性事件的完整独立描述。在一些实施例中,节点322具有足够的通用性,可以用于各种过程,例如化学过程、生命科学过程和食物制备过程。有利的是,节点322在复制到另一过程中时不会失去它们的意义或实用性。因而,在优选实施例中,特定节点322的定义并不取决于超图302中的另一节点的定义。
[0117] 如图3中所示,在一些实施例中,边线322结构化成以独特的方式与数据相关联,以便促进后续数据挖掘和推理引擎基于过程版本208分析过程轮次。
[0118] 在一些实施例中,多个边线中的每个相应边线304与对应过程中的相应阶段的一组参数化资源输入308相关联。所述一组参数化资源输入308中的至少一个参数化资源输入310与一个或多个输入特性312相关联,所述一个或多个输入特性包含输入规格界限314。输入特性312的实例是人、设备、材料和数据等事物的属性(例如,测量值、数量等)。单个参数化资源输入可具有多个输入特性(例如,温度、流速、粘度、pH、纯度等)。在一些实施例中,特定参数化资源输入具有单个输入特性。在此类实施例中,多个边线中的每个相应边线304还与对应过程中的相应阶段的一组参数化资源输出314相关联。所述一组参数化资源输出314中的至少一个参数化资源输出316与一个或多个输出特性318相关联,所述一个或多个输出特性包含对应的输出规格界限320。输出特性318的实例包含人、设备、材料和数据等事物的属性(例如,测量值、数量等)。单个参数化资源输出可具有多个输出特性。在一些实施例中,特定参数化资源输出具有单个输出特性。
[0119] 图17和18说明了上述概念。图17说明超图302的一部分,并且说明在超图的所述部分中的节点322。节点“仪器校准”322-14被突出显示。在图17的右侧示出了连接到这一节点的边线的一组参数化资源输入308和一组参数化资源输出314。连接到这一节点的边线的这一组参数化资源输入308包含硫酸310-1、柱310-2、柠檬酸310-3、葡萄糖310-4、甘油310-5和HPLC 310-6。这样,这一组示例性参数化资源输入308说明多种可能参数化输入中的两种是:(i)组成物(例如,硫酸、柠檬酸、葡萄糖、甘油等)和(ii)设备类型(例如,柱、HLLC等)。连接到节点“仪器校准”的边线的这一组参数化资源输出314由HPLC 316组成。
[0120] 转到图18,提供了关于参数化资源输入310-2“柱”和参数化资源输入310-3“柠檬酸”的更多细节。参数化资源输入310-3“柠檬酸”与包含输入规格界限314的一个或多个输入特性312相关联。举例来说,参数化资源输入310-3“柠檬酸”的一个输入特性是“pH”312-3-1,并且这个特性包含输入规格界限314-3-1。实际上,输入规格界限314-3-1表示为下限(pH 3.5)、目标界限(pH 4)和上限(pH 4.5)。参数化资源输入310-3“柠檬酸”的另一输入特性是“浓度”312-3-2,并且这个特性包含输入规格界限314-3-2。输入规格界限314-3-2表示为下限(9.75g/L单位)、目标界限(10g/L单位)和上限(10.25g/L单位)。
[0121] 返回图3,每个超图302包括多个节点。多个节点中的每个相应节点322指定多个边线中的源边线304的一组参数化资源输出314被包含在多个边线中的至少一个其它目的地边线304的一组参数化资源输入308。换句话说,节点指定输入到给定过程中的一个边线(目的地边线)中的材料、设备、人或其它事物的状态与已经从所述过程的超图中的另一边线(源边线)输出的材料、设备、人或其它事物的状态相同。在一些实施例中,节点指定输入到给定过程中的多个边线(目的地节点)中的材料、设备、人或其它事物的状态与已经从所述过程的超图中的另一边线(源边线)输出的材料、设备、人或其它事物的状态相同。此外,目的地边线可以连接到两个或更多个源边线,这意味着目的地边线的输入所包含的材料、设备、人或其它事物的状态与其在给定过程的所述两个或更多个源边线的输出中的状态相同。
[0122] 过程版本管理208是所公开的系统和方法的有利特征。例如,当通过跨过程的各个过程轮次的相关性分析将特定边线的输入或输出识别为使总体过程具有不良可再生性时,可以在过程的后续版本中在有问题的边线之前和之后添加额外边线,接着可以执行所述过程的这些新版本的过程轮次。此外,有利的是,来自过程的较早版本和较新版本的数据可以一起用于相关性分析,在一些实施例中,可以用于所有过程版本的所有过程轮次,从而确定与有问题的边线相关联的可变性或其它不利属性的根因,并由此建立一个充分解决问题的过程版本。实际上,制造类似但不相同的产品或产生类似但不相同的分析信息的多个过程中的过程轮次可以进行分析以便识别此类问题。
[0123] 如图3所说明,每个边线304具有输入(一组参数化资源输入308),并且这些参数化资源输入310中的每一个具有一个或多个输入特性312,这些输入特性中的每一个具有输入规格界限314。此外,每个边线304具有一个或多个参数化资源输出(一组参数化资源输出314),并且这些参数化资源输出316中的每一个具有一个或多个输出特性318。此外,这些输出特性中的每一个具有输出规格界限320。所述一组参数化资源输出用作其它边线的输入,这种关系由节点表示。此外,特定边线的一组参数化资源输出314可用作超过一个边线的输入,因此节点和边线构成超图。通过用这种方式定义过程,很容易创建过程版本208,集成来自不同源和装置的数据获取,以及质询过程轮次以识别相关性、减小实验方差并改进过程可再生性。过程轮次调用过程版本,并产生所述过程版本中的超图中的边线的一组输入和一组输出的值(例如,测量值)。
[0124] 为了说明过程中的节点的概念,可以考虑设计成测量发酵器发酵液的温度的节点。包含去往此节点的一个或多个输入的去往此节点的边线的一组参数化输入308包含进行温度测量的发酵器发酵液和热电偶的描述。热电偶将包含输入特性,所述输入特性包含它的清洁状态、校准状态和热电偶的其它特性。连接到此节点的一个或多个输出的边线的一组参数化输出包含发酵器发酵液的温度以及此温度的输出规格界限(例如,温度的可接受范围)。节点322的边线的另一可能参数化资源输出316是热电偶自身,以及在已经获取温度之后的热电偶的特性316,例如它的清洁状态和校准状态。这些特性316中的每一个同样具有对应的输出规格界限。
[0125] 在一些情况下,目的地节点326包含多个边线304,每个这种边线来自不同源节点324。在这种情况下,每个这种边线的一组参数化资源输出314构成通向目的地节点326的边线的一组参数化资源输入308。
[0126] 转到图4,提供了轮次数据存储区210的更多细节。轮次数据存储区210包括多个过程轮次。也就是说,当运行过程的节点时,获得实际材料批次或各件设备等和/或将其用作特定过程版本406的现实世界实例。因而,每个过程轮次402包括一个或多个过程中的过程206的多个版本中的所识别404过程版本208的节点406的识别。对于过程版本208的所识别节点406,过程轮次402另外包括相应过程版本208的超图302中的第一边线304的相应一组参数化资源输入308和它们相关联的输入特性312的值。对于所识别过程版本208,过程轮次
402还包括第一边线304的相应一组参数化资源输出314。此外,对于所识别过程版本208,过程轮次402还包括相应过程版本的超图302中的第一边线304的相应一组参数化资源输出
314中的参数化资源输出316的至少一个输出特性318的获得值。图19至24说明特定过程版本的三个过程轮次402,其中每个过程轮次402的特征在于不同条件(例如,过程版本的超图中的一个或多个节点的一个或多个参数化输入的一个或多个输入特性的不同量)。
[0127] 在一些实施例中,轮次数据存储区210包含包括一个或多个过程集422的系谱图420。每个过程集422包括相关过程版本424的标识424。举例来说,在一些实施例中,过程集
420中的第一过程版本404和过程集420中的第二过程版本404具有相同超图,但是超图中的一个边线的输出特性、输出规格界限、输入特性或输入规格界限是不同的。在另一实例中,过程集420中的第一过程版本404和过程集420中的第二过程版本404具有超图,所述超图中除一个以外其余所有节点和/或边线、除两个以外其余所有节点和/或边线、除三个以外其余所有节点和/或边线或除四个以外其余所有节点和/或边线都是共同的。通常,从过程随时间推移越来越细化且过程的各个版本保存为过程版本的意义上来说,过程集中的过程版本彼此相关。过程的细化包含以下各项的任何组合:向超图添加或从超图去除节点;向超图添加或从超图去除边线;添加或去除超图中的一个或多个边线的参数化资源输入;添加或去除超图中的一个或多个边线的参数化资源输出;添加、去除或改变超图中的一个或多个边线的参数化资源输入的输入特性或输入规格界限;和/或添加、去除或改变超图中的一个或多个边线的参数化资源输出的输出特性或输出规格界限。
[0128] 转到图5,提供了过程评估模块216的更多细节。过程评估模块216利用所公开过程的独特架构。具体地说,在评估特定边线304的参数化资源输出316是否满足相关联的特定输出规格界限320时,只需要评估过程轮次中所述边线的对应参数化资源输出的值。为此,不需要评估其它边线的输入和输出。因此,当过程版本的超图中的边线的轮次的一组参数化资源输出中的参数化资源输出的输出特性的获得值在输出规格界限之外时,有可能生成呈计算机数据传输形式的警告。此外,此警告可移植到使用同一边线的其它过程版本。因此,在一些实施例中,过程评估模块由过程版本502组织。对于每个过程版本,识别需要过程警告的边线504。对于每个这种边线504,识别边线的一个或多个参数化资源输出506。对于一个或多个参数化资源输出中的每一个,识别参数化资源输出的一个或多个警告值508。如果触发了特定过程版本的特定边线的参数化资源输出的特性的警告值,那么传送对应于所述警告的计算机数据传输510。在一些实施例中,计算机数据传输510是发送到用户界面或客户端计算机的指示警告已经被触发的消息。在一些实施例中,计算机数据传输呈文本消息、电子邮件、SMS消息或声音警告的形式。为了说明,考虑其中边线304的参数化资源输出316的输出特性318的输出规格界限320指定输出pH不应超过7的情况。因此,针对该输出特性设置警告508。如果在过程轮次502中,资源输出的pH确实超过7.0,那么传送对应于此警告的计算机数据传输510。
[0129] 系统48以实现过程的性能目标(例如,令人满意地使过程稳定)所需要的分辨率水平通过明确定义状态(例如,边线输入和边线输出的状态)来为过程提供唯一的设计。这种状态包含例如边线输入和输出中的每一个“是什么”以及“有多少”。仅举几例,“是什么”的实例可以是一件设备、人力资源、材料类型或物质组成。系统48有利地提供了一种将多个不同的功能性区域(例如,化学、生物学、发酵、分析、不同控制系统等)合并成可以进行版本管理的可重复材料转换(节点)的无缝过程的方式,其中可以使用统计技术评估过程轮次中的数据来实现产品控制(例如,识别不想要的可变性的根因)。
[0130] 有利的是,所公开的数据结构完全定义了节点和边线(它们的输入、它们的输出,以及因此定义的在每个节点处进行的转换),在每个边线输入和每个边线输出的相关特性方面不具有任何模糊性。然而,应注意,出于记录保持和识别的目的,不一定需要在基本描述(阶段标记)之外定义在节点内进行的实际转换。在一些情况下,运行其中过程中的节点和/或边线的输入改变的过程轮次,并且考虑到这些发生改变的输入,对过程的输出或最终产品进行统计分析以确定输入的改变是否改进了过程的最终产品的方面(例如,可再生性、良率等)。所公开的系统和方法的一个益处在于:它们提供了能够真正理解过程的动力学(例如,某些边线输入的方差或边线输入的特性如何影响最终产品)的机制,并且因此使得过程的规模能够更容易成功扩大。由于在所公开的系统和方法中定义过程的方式,有可能找到导致所定义过程中不合需要的结果(例如,不良的良率、不良的可再生性等),或就此而言,产生所要结果的误差源。过程中的非所要误差的实例是应用依赖型的,并且例如取决于边线输入或输出的类型,但是举例来说,可以是测量误差或未成功量化或甚至识别边线输入或边线输出的相关特性。举例来说,如果边线输入是糖,那么可能会产生测量误差,因为测量输入到边线的糖重量的过程并不是足够准确的。在另一实例中,如果边线输入是糖,那么糖的相关特性可以是批号,因为在特定过程中,糖批号会对总体产品良率产生重大影响。
[0131] 既然已经公开了用于提供一个或多个过程的过程设计和分析的系统48的细节,就参考图6公开根据本公开的实施例的关于网络的过程和特征的流程图的细节。
[0132] 如图6A的框602中所说明,维持超图数据存储区204。超图数据存储区204针对一个或多个过程中的每个相应过程206包括所述相应过程的相应多个版本。每个相应版本208包括超图302,所述超图302包括由多个边线中的边线304连接的多个节点322。所述多个节点中的每个相应节点304包括表示对应过程中的相应阶段的过程阶段标记。
[0133] 图7说明过程版本208。过程版本包含超图,所述超图包含对应于过程的相应阶段(例如,“发酵器制备”、“发酵器设置”、“培养基制备”、“生长接种物”、“接种发酵器”、“分批补料发酵”和“量度T、Ph、D、DO”)的多个节点322。在一些实施例中,支持并行操作。也就是说,各自在与计算机系统200通信的不同客户端计算机处操作的多个用户可以查看图7中显示的过程版本的实例,对它进行改变,并且查看和分析来自利用它的过程轮次的数据。
[0134] 每个边线304与一组参数化资源输入308相关联。这一组参数化资源输入308中的至少一个参数化资源输入310与一个或多个输入特性312相关联。所述一个或多个输入特性包含输入规格界限314。每个边线304还与一组参数化资源输出314相关联。这一组参数化资源输出中的至少一个参数化资源输出316与一个或多个输出特性相关联。所述一个或多个输出特性包含对应的输出规格界限。图7说明连接到节点304-4“发酵器设置”的边线的一组参数化资源输入308和一组参数化资源输出314。图8说明连接到节点304-3“生长接种物”的边线的一组参数化资源输入308和一组参数化资源输出314。图9说明连接到节点304-5“接种发酵器”的边线的一组参数化资源输入308和一组参数化资源输出314。图10说明连接到节点304-6“分批补料发酵”的边线的一组参数化资源输入308和一组参数化资源输出314。在一些实施例中,用户只要简单地点击节点322和/或边线304,就能看到它们的输入和输出。此外,可以将呈视频、图片或评论形式的非结构化数据添加到节点322和/或边线304中。
例如,示出执行与节点相关联的程序的适当方式的视频可以通过简单地将视频的图标链接拖动到节点322的表示上而链接到节点。例如,可以将关于执行发酵器设置的适当方式的视频拖动到图7的“发酵器设置”节点322-4上。随后,当用户点击节点322-4时,除非用户另外请求,否则播放视频。
[0135] 所述多个节点中的每个相应节点322指定所述多个边线中的边线的所述一组参数化资源输出被包含在所述多个边线中的至少一个其它边线的所述一组参数化资源输入中。
[0136] 图11和12说明将新节点322-8“DW测定”和322-9“废气测定”添加到现有超图,图13和14说明将标题为“HPLC测定”的节点群组添加到超图。HPLC测定群组是图7的现有超图的扩展,并且包含此扩展的节点和边线。参考图15和16,HPLC测定开始于三个初始节点,即节点322-10“溶剂制备”、节点322-11“柱制备”和节点322-12“标样制备”。在一些实施例中,节点的名称由用户从所允许节点名称的数据库中选择,以便确保节点名称的一致性。在一些实施例中,边线输入310和316的名称还由用户从所允许边线输入和输出名称的数据库中选择,以便确保边线输入和输出名称的一致性。在一些实施例中,边线输入特性312和边线输出特性318的名称还由用户从所允许边线输入特性名称和边线输出特性名称的数据库中选择,以便确保它们的一致性。图17说明被“HPLC测定”包围的超图302的部分,在被“HPLC测定”包围之前,在超图的此部分中定义了更多节点。在图17中选择节点“仪器校准”304-14。因此,在图17的右侧示出连接到节点304-14的边线的一组参数化资源输入308和一组参数化资源输出314。
[0137] 如上文所论述,过程206的版本208彼此相关。在一些实施例中,过程604的每个版本208产生相同产品。然而,过程的相应多个版本中的第一版本和第二版本通常在一定程度上不同于彼此,例如列举一些可能性,在以下方面不同:节点的数目、边线的数目、边线的过程阶段标记、一组参数化资源输入中的参数化资源输入、一组参数化资源输出中的参数化资源输出、参数化资源输入规格界限或参数化资源输出规格界限(604)。
[0138] 为了说明一组参数化资源输入308,在一些实施例中,相应多个过程版本中的过程版本208的超图302的多个边线中的边线304的一组参数化资源输入308包括第一参数化资源输入310-1和第二参数化资源输入310-2。第一参数化资源输入指定第一资源,并且与第一输入特性312-1相关联(606)。第二参数化资源输入310-2指定第二资源,并且与第二输入特性312-2相关联。在一些实施例中,第一输入特性是第一资源的粘度值、纯度值、组成值、温度值、重量值、质量值、体积值或批次标识符(608)。图7说明了这种情况。连接到节点322-4“发酵器设置”的边线在它相关联的一组参数化资源输入308中包含发酵器310-3和废瓶
310-5以及其它资源输入。尽管图7中未示出,但是发酵器310-3与第一输入特性相关联,例如发酵器的大小或发酵器的品牌/型号。此外,废瓶310-5与第二输入特性相关联,例如废瓶
310-5的大小或废瓶310-5的品牌和型号。
[0139] 在一些实施例中,资源输入310是单个资源。举例来说,在图7中,资源310-1至310-10都是单个资源的实例。在一些实施例中,资源输入310是复合资源。复合资源的实例包含但不限于组成物(例如,培养基、发酵液等)的混合物和多组件设备。
[0140] 参考图6B,在一些实施例中,相应多个过程版本中的过程版本208的超图302的多个边线中的第一边线304的一组参数化资源输入308包括第一参数化资源输入310,并且此第一参数化资源输入指定和与第一边线304相关联的过程的对应阶段相关联的过程条件(612)。例如,在一些实施例中,此过程条件是温度、暴露时间、混合时间、浓度、设备类型或批次标识符(614)。
[0141] 如上文所提到,对于给定边线,边线的一组参数化资源输出中的至少一个参数化资源输出与一个或多个输出特性相关联,并且所述一个或多个输出特性包含对应的输出规格界限。在一些实施例中,此对应的输出规格界限包括对应参数化资源输出的上限和下限值(616)。为了说明,输出特性的一个实例是组成物的pH。在此实例中,输出规格界限指定组成物的pH的所允许上限和组成物的pH的所允许下限值。在替代实施例中,此对应的输出规格界限包括允许类型枚举列表(618)。为了说明,输出特性的实例是材料的结晶取向。在此类实例中,输出规格界限指定材料的所允许结晶取向的枚举列表。
[0142] 在一些实施例中,超图数据存储区中的一个或多个过程实际上是多个过程。此外,多个过程中的第一过程产生第一产品,且多个过程中的第二过程产生不同的第二产品(620)。举例来说,超图数据存储区中的第一过程可以导致一种类型的组成物的制造,而超图数据存储区中的另一过程可以导致另一组成物的制造。
[0143] 参考图6B的框622,还维持轮次数据存储区210。轮次数据存储区包括多个过程轮次402。在典型的实施例中,在执行过程版本208的过程轮次402之前锁定过程版本208,使得无法对过程版本208做出其它改变。在此类实施例中,如果想要改变基础过程206,那么定义新的过程版本208。
[0144] 每个过程轮次402包括一个或多个过程中的过程206的多个版本中的过程版本404(208)的识别,如图4中所说明。此外,在过程轮次中提供相应版本的超图302中的第一边线406(304)的相应一组参数化资源输入408和它们相关联的输入特性410的值。更精确地说,在过程轮次中提供相应版本的超图302中的边线406的一组参数化资源输入408中的参数化资源输入的特性的值。图20至22说明基于图19中所说明的超图而设置过程版本的特定边线的三个过程轮次402-1、402-2和402-3。在图22中,输入参数化资源输入“柠檬酸”和“柱”的特性的值。具体地说,参考图22,参数化资源输入“柠檬酸”的特性“pH”设置为5,且参数化资源输入“柱”的特性“包装材料”的值设置为“Saphadex HR”。图23示出来自此类过程轮次的原始数据。图24示出进行选择来分析这些过程轮次,图25示出此类过程轮次的所得分析。方便地,如图25和26中所说明,质询2502和切换键2504可用于选择查看哪些过程轮次的哪些特性(例如,基础过程版本的边线的输入或输出特性)。此外,参考图26,可以查看基于来自此类过程轮次的原始数据而计算出的特性(例如,最终产品的量除输入材料的数量)以及计算出的特性之间的相关性。有利的是,由于基于基础过程版本的边线定义过程轮次的结构化方式,有可能自动建立所执行过程轮次的原始数据(例如,图23中所说明的原始数据)的预定义过程计算(例如,过程良率计算),使得在执行新过程轮次时,此类过程计算自动应用于原始数据。这大大减少了分析过程轮次的工作量。
[0145] 每个过程轮次402包括相应版本208的超图302中的主体边线304的相应一组参数化资源输出412。过程轮次402另外包括节点的相应一组参数化资源输出中的参数化资源输出的至少一个输出特性的获得值。
[0146] 在一些实施例中,轮次数据存储区210另外包括展示以下关系的系谱图420:(i)过程的所述多个版本中在所述多个过程轮次中的单个过程的各版本之间的关系,或(ii)两个或更多个过程的相应多个版本中在所述多个过程轮次中的两个或更多个过程的各版本之间的关系(624)。举例来说,在一些实施例中,过程集420中的第一过程版本404和过程集420中的第二过程版本404具有相同超图,但是超图中的一个边线的输出特性、输出规格界限、输入特性或输入规格界限是不同的。在另一实例中,过程集420中的第一过程版本404和过程集420中的第二过程版本404具有超图,所述超图中除一个以外其余所有边线和/或节点、除两个以外其余所有边线和/或节点、除三个以外其余所有边线和/或节点或除四个以外其余所有边线和/或节点等等都是共同的。系谱图提供一种有利的辨别给定过程的各个过程版本之间的关系的方式。
[0147] 转到图6C,还维持统计模块212(626)。统计模块212利用轮次数据存储区210和超图数据存储区204的结构来实现对过程轮次的分析。具体地说,与轮次数据存储区210和超图数据存储区204的独特结构组合的统计模块212提供有利的平台来支持对过程206的许多不同组成部分的统计过程控制(SPC),并因此提供有力的用于分析和稳定此类过程的工具。SPC是一种使用统计方法的质量控制方法。应用它是为了监视和控制过程。监视和控制过程可以确保它们充分发挥作用。举例来说,在充分发挥作用的情况下,过程206可以在最大限度地减少废物的同时制造尽可能多的合格产品。SPC可以应用于可以测量“合格产品”(符合规格的产品)输出的任何过程206。SPC利用控制图,重点在于过程轮次402(例如,实验)的持续改进和设计。例如,参见1992年Barlow和Irony的《统计质量控制的基础(Foundations of statistical quality control)》,Ghosh M.和Pathak P.K.(编者),《统计推断的当前问题:纪念D.Basu的论文(Current Issues in Statistical Inference:Essays in Honor of D.Basu)》,加利福尼亚州海沃德,数学统计研究所,第99-112页,其在此以引用的方式并入。
[0148] 有利的是,为了支持SPC,响应于接收到识别存在于轮次数据存储区中的一个或多个过程轮次中的一个或多个第一参数化资源输入和/或参数化资源输出的质询,统计模块212能够轻易地检索和格式化所述一个或多个第一参数化资源输入和/或参数化资源输出以供分析,而不必跟踪呈与过程相关联,或确切地说,与利用过程的节点和/或边线的过程轮次相关联的不同形式的不同数据。在一些实施例中,例如,数据格式化为一个或多个由制表符分隔的文件、CSV文件、EXCEL电子数据表、谷歌表格,和/或以适用于关系数据库的形式导出。具体地说,数据结构化成确保此类数据可以进行高效分析,使得潜在的相关性在后续分析中不会被忽略。作为SPC的部分执行的此类分析的实例是相关性分析,例如图26中所说明的根因分析。例如,根因分析描述于1993年Wilson等人的《根因分析:全面质量管理的工具(Root Cause Analysis:A Tool for Total Quality Management)》,威斯康星州密尔沃基,ASQ质量出版社,第8-17页,其在此以引用的方式并入本文中。至于图26中所说明的根因分析,质询识别存在于轮次数据存储区中的一个或多个过程轮次中的一个或多个第一参数化资源输入(例如,氨基酸类型)和/或参数化资源输出(例如,柠檬酸盐浓度)。接着,对一个或多个第一参数化资源输入和/或参数化资源的数据进行格式化和输出以供分析。利用此格式化数据进行分析,例如图26的根因分析。在一些实施例中,针对第三方统计分析软件包格式化质询结果,所述软件包例如是JMP(SAS,英格兰白金汉郡,http://www.jmp.com/en_dk/software.html)。使用此类第三方统计分析软件包的分析通常会得到对新过程版本的提议,其中添加或去除了节点和/或边线,或者现有边线的输入或输出被进一步定义或重新定义,以便识别并去除不想要的过程可变性(例如,使过程稳定)。
[0149] 质询可以是可用于轮次数据存储区210中的一个或多个过程的任何组合的过程版本的任何组合的资源输入或输出或这些输入或输出的特性中的任一个。因而,在一些实施例中,质询另外识别存在于轮次数据存储区中的一个或多个轮次中的一个或多个第二参数化资源输入和/或参数化资源输出(或其特性),并且所述一个或多个第一参数化资源输入和/或参数化资源输出和所述一个或多个第二参数化资源输入和/或参数化资源输出相关,并且此相关性的数值量度进行格式化以供呈现(628)。在一些实施例中,相关性的数值量度的标度在低值和高值之间,其中低值(例如,零)指示所述一个或多个第一参数化资源输入和/或参数化资源输出和所述一个或多个第二参数化资源输入和/或参数化资源输出之间无相关性,且高值(例如,一)指示所述一个或多个第一参数化资源输入和/或参数化资源输出和所述一个或多个第二参数化资源输入和/或参数化资源输出之间完全相关。
[0150] 在一些实施例中,质询另外识别存在于轮次数据存储区中的一个或多个轮次中的一个或多个第二参数化输入和/或参数化输出(或它们的特性),并且统计模块另外使用多变量分析技术识别以下在存在于轮次数据存储区中的所有参数化输入和/或参数化输出当中存在于轮次数据存储区中的一个或多个过程轮次中的两者之间的相关性:(i)所述一个或多个第一参数化输入和/或参数化输出,与(ii)所述一个或多个第二参数化输入和/或参数化输出(630)。
[0151] 在一些实施例中,质询识别存在于轮次数据存储区中的一个或多个轮次中的:(i)一个或多个第一参数化输入和/或参数化输出的一个或多个特性,和(ii)一个或多个第二参数化输入和/或参数化输出的一个或多个特性,并且统计模块另外使用多变量分析技术寻求以下在存在于轮次数据存储区中的所有参数化输入和/或参数化输出当中存在于轮次数据存储区中的一个或多个过程轮次中的两者之间的相关性:(i)所述一个或多个第一参数化输入和/或参数化输出的所识别特性,与(ii)所述一个或多个第二参数化输入和/或参数化输出的一个或多个所识别特性。
[0152] 在一些实施例中,上述过程调用多变量分析技术,所述多变量分析技术包括特征选择技术(632)(例如,最小角回归、逐步回归)。特征选择技术在跨多组过程轮次存在的多个变量(例如,节点的输入的输入特性的值和输出的输出特性的值)当中识别哪些变量(例如,哪些节点的输入的哪些输入特性和/或哪些节点的输出的哪些输出特性)对过程的产品的特性具有显著的因果影响(例如,哪些变量是不良可再生性、不良良率的原因,或相反地,哪些变量是极佳可再生性、较高良率的原因)时是特别有利的。例如,特征选择技术描述于2007年Saeys等人的《生物信息学中特征选择技术的评述(A  review of feature 
selection techniques in bioinformatics)》,《生物信息学(Bioinformatics)》23,2507-
2517,以及1996年Tibshirani的《通过Lasso进行回归、收缩和选择(Regression and Shrinkage and Selection via the Lasso)》《,皇家统计学会期刊B辑(J.R.Statist.Soc B)》,第267-288页,上述文献中的每一个在此以引用方式并入。
[0153] 在一些实施例中,所述一个或多个过程是多个过程,并且识别所述多个过程的子集中的过程轮次中的相关性(634)。在此类实施例中,并不需要识别此相关性的每一个过程都制造相同产品。此类实施例是非常有利的,因为它们能够研究用于制造不同产品的过程轮次之间不合需要的过程可变性。举例来说,用于相关性分析的一些过程轮次可以制造生物制剂A,而用于相同相关性分析的其它过程轮次可以制造生物制剂B。使用来自生物制剂A和B的过程轮次的数据的相关性分析能够研究独立于产品的变化原因,例如,定义不清的发酵步骤。例如,在生物制剂A和B的过程轮次中输入到此发酵步骤中的糖可能没有得到充分定义来确保过程稳定。例如,这些过程版本共同的变化来源的另一实例可以通过生物制剂A和B的过程轮次之间的相关性分析来识别,并被识别为由于老化而开始失效的一件设备。这都是有可能的,因为所公开的系统和方法向制造不同产品的过程轮次有利地施加了一致的框架。因此,有可能聚合来自不同产品的过程轮次,并对这些过程轮次中所要的任何一组输入、输入特性、输出和/或输出特性或其规格界限执行截面过滤(cross-sectional filtering),例如,以便发现独立(或依赖)于通过此类过程产生的实际产品的过程可变性的来源。
[0154] 在一些实施例中,所述一个或多个过程是多个过程,并且识别所述多个过程中的单个过程中的过程轮次中的相关性(636)。在此类实施例中,识别此相关性的每一个过程都制造相同产品或产生相同分析信息。例如,此类实施例用于精确地识别通过所述过程制造产品或产生分析信息时出现的可变性的关键来源。
[0155] 在一些实施例中,所述一个或多个过程是多个过程,并且所述质询另外识别过程轮次将通过统计模块格式化的所述多个过程的子集(638)。
[0156] 转向图6D,在一些实施例中,统计模块212另外基于预测所述一个或多个过程中的第一过程中不存在于轮次数据存储区210中的一个或多个额外过程轮次的一个或多个第二参数化输入的建议值将改变此类过程轮次的数值属性,提供所述一个或多个第二参数化输入的所述建议值(640)。在一些实施例中,数值属性是所述一个或多个第一参数化输入的方差的减小(642)。例如,此类实施例用于识别以下情形:被过程轮次中的边线的参数化资源输入310涵盖的输入空间不足以找到先前以足够高的置信度执行的过程轮次的某些过程变量之间的相关性,或完全无法找到相关性。在这些情况下,提供被参数化资源输入310涵盖的输入空间的建议值,以便对相关性进行测试。在其它实例中,当根据现有过程轮次的分析识别潜在的问题时,使用此类实施例。在此类实施例中,进行所提议的对不存在于轮次数据存储区中的过程轮次中的输入空间的添加,这有助于确定所述潜在的问题是不是真实的。如果所述潜在的问题是真实的,那么可以建立一种新版本的过程,它进一步定义了过程中的现有或新的边线的输入或输出的状态(特性),以便尝试去除过程状态模糊性,并由此使过程稳定。
[0157] 在一些实施例中,质询识别存在于轮次数据存储区中的轮次中的一个或多个第三参数化输入和/或参数化输出,并且上述数值属性是第一参数化输入和/或输出和第三参数化输入和/或输出之间的相关性的置信度(644)。在一些实施例中,所述一个或多个过程是多个过程,并且所述质询另外识别所述多个过程中的过程轮次将通过统计模块格式化的单个过程(646)。在此类实施例中,质询所识别的所有过程轮次都制造相同产品或产生相同形式的分析信息。
[0158] 在一些实施例中,所述质询另外识别所述一个或多个过程中的过程轮次子集(648)。在此类实施例中,不需要质询所识别的所有过程轮次都制造相同产品或产生相同形式的分析信息。实际上,响应于所述质询,一些过程轮次可以制造不同产品或产生不同类型的分析信息。
[0159] 在一些实施例中,统计模块另外识别以下两者之间的相关性:(i)包括所述轮次数据存储区中的一个或多个过程轮次的第一组,和(ii)包括所述轮次数据存储区中的一个或多个过程轮次的第二组,其中所述第二组中的过程轮次不在所述第一组中(650)。举例来说,在一些实施例中,计算存在于所述第一组和第二组中的多个参数化输入和/或参数化输出之间的相关性(652)。
[0160] 参考图6E,任选地,所述一个或多个第一参数化资源输入和/或参数化资源输出导出到另一装置以供分析(654),例如,导出为一个或多个由制表符分隔的文件、CSV文件、EXCEL电子数据表、谷歌表格,或者以适用于SQL数据库的形式导出。
[0161] 任选地,在一些实施例中,如上文关于图5所论述,在一些实施例中,维持当过程版本的超图中的边线的一组参数化资源输出中的参数化资源输出的输出特性的获得值在输出规格界限之外时生成呈计算机数据传输形式的警告的过程评估模块(656)。
[0162] 任选地,在一些实施例中,针对所述一个或多个过程中的相应过程,执行数据驱动器218(658)。数据驱动器包含用于接收相应过程的数据集的指令,并且另外包含用于解析数据集以获得以下各项的指令:(i)轮次数据存储区中的过程轮次的识别,和(ii)与所述过程轮次的相应过程的超图中的第一边线的相应一组参数化资源输出相关联的输出特性值。数据驱动器另外包含用于用解析值填充轮次数据存储区中的第一边线的参数化资源输出的输出特性值的指令。举例来说,在一些实施例中,与过程中的边线相关联的同步引擎监视相关联的同步文件夹。在一些实施例中,与边线相关联的同步引擎作为后台进程(如Google Drive或Dropbox Sync)在附接到与所述节点相关联的仪器上的任何PC上运行。当新仪器数据文件被添加到文件夹中时,软件解析并向数据驱动器218发送数据。在一些实施例中,数据集与过程轮次的正确协议变量(参数化资源输出)的关联通过与用户交互来完成,该用户被呈现包含他们能够访问的过程轮次的选择的通知。在一些实施例中,数据驱动器218已经包含数据集中的值和过程轮次的正确协议变量(参数化资源输入和/或输出)之间的关联。
[0163] 在一些实施例中,传送到过程轮次502的节点504的计算机系统的一组参数化资源输出314中的数据包括节点标识符406(例如,仪器标识符,如蓝牙UUID)、过程版本404的识别和参数化资源输入410的值。在一些实施例中,数据呈JSON结构的形式。参见网址json.org。
[0164] 本公开的另一方面提供一种计算机系统200,其包括一个或多个处理器274、存储器192/290,以及存储在所述存储器中以供所述一个或多个处理器执行的一个或多个程序。所述一个或多个程序包括用于维持超图数据存储区204的指令。超图数据存储区204针对一个或多个过程中的每个相应过程206包括所述相应过程的相应多个版本208。每个相应版本
208包括超图302,所述超图302包括由多个边线中的边线304连接的多个节点322。所述多个边线中的每个相应边线304包括表示对应过程206中的相应阶段的过程阶段标记306。所述多个边线中的每个相应边线304与对应过程206中的相应阶段306的一组参数化资源输入
308相关联。这一组参数化资源输入308中的至少一个参数化资源输入310与一个或多个输入特性312相关联。所述一个或多个输入特性包含输入规格界限314。所述多个边线中的每个相应边线304还与对应过程206中的相应阶段306的一组参数化资源输出314相关联。这一组参数化资源输出314中的至少一个参数化资源输出316与一个或多个输出特性318相关联。所述一个或多个输出特性318包含对应的输出规格界限320。多个节点中的每个相应节点322指定多个边线中的边线304的一组参数化资源输出314被包含在多个边线中的至少一个其它边线304的一组参数化资源输入308中。所述一个或多个程序另外包括用于维持轮次数据存储区210的指令。轮次数据存储区210包括多个过程轮次402。每个过程轮次402包括:
(i)一个或多个过程中的过程206的多个版本中的过程版本404的识别,(ii)相应版本208的超图302中的第一边线304的相应一组参数化输入408(图4)和它们相关联的输入特性410的值,(iii)第一边线304的相应一组参数化资源输出412,以及(iv)第一边线的相应一组参数化资源输出中的参数化资源输出414的至少一个输出特性416的获得值。所述一个或多个程序另外包括用于维持统计模块212的指令,响应于接收到识别存在于轮次数据存储区中的一个或多个过程轮次402中的一个或多个第一参数化输入和/或参数化输出的质询,统计模块212对所述一个或多个第一参数化输入和/或参数化输出进行格式化以供统计分析。以此方式,可以以令人满意的可再生性执行过程的实例(过程轮次)。
[0165] 步骤(边线)通过通用实体(节点)连接的实施例,其中资源列表与那些节点相关联。参考图27公开了根据本公开的另一实施例的关于网络的过程和特征的流程图的细节。
[0166] 如图27A的框2702中所说明,维持超图数据存储区204。超图数据存储区204针对一个或多个过程中的每个相应过程206包括所述相应过程的相应多个版本。每个相应版本208包括超图302,所述超图302包括由多个边线中的边线304连接的多个节点322。所述多个边线中的每个相应边线304包括表示对应过程中的相应阶段的过程阶段标记。
[0167] 在根据图27的实施例中,所述多个节点中的每个相应节点322与对应一组参数化资源相关联,并且所述对应一组参数化资源指定所述对应一组参数化资源中的每个相应参数化资源与所述多个边线中的第一边线的至少一个输出中的至少一对应输出相关联,还与所述多个边线中的至少一个其它边线的一个或多个输入中的至少一对应输入相关联。此外,与节点的输出侧相关联的资源的值可不同于与相同节点的输入侧相关联的资源的值。在一些实施例中,用户只要简单地点击边线304,就能看到它们的输入和输出。此外,可以将呈视频、图片或评论形式的非结构化数据添加到节点322或边线304中。例如,示出执行与节点或边线相关联的程序的适当方式的视频可以通过简单地将视频的图标链接拖动到节点
322或边线204的表示上而链接到节点或边线。例如,可以将关于执行发酵器设置的适当方式的视频拖动到图7的“发酵器设置”节点322-4上。然后,当用户点击节点322-4时,播放视频。
[0168] 如上文所论述,过程206的版本208彼此相关。在一些实施例中,过程604的每个版本208产生相同产品。然而,过程的相应多个版本中的第一版本和第二版本通常在一定程度上不同于彼此,例如列举一些可能性,在以下方面不同:节点的数目、边线的数目、边线的过程阶段标记、一组参数化资源中的参数化资源(2704)。
[0169] 在一些实施例中,资源310是单个资源。在一些实施例中,资源是复合资源。复合资源的实例包含但不限于组成物(例如,培养基、发酵液等)的混合物和多组件设备(2710)。
[0170] 参考图27B,在一些实施例中,相应多个过程版本中的过程版本208的超图302的多个节点中的第一节点的一组参数化资源包括第一参数化资源,并且此第一参数化资源指定和与对应边线相关联的过程的对应阶段相关联的过程条件(2712)。例如,在一些实施例中,此过程条件是温度、暴露时间、混合时间、浓度、设备类型或批次标识符(2714)。
[0171] 如上文所提到,对于给定节点,节点的一组参数化资源中的至少一个资源与一个或多个特性相关联,并且所述一个或多个特性包含对应的规格界限。在一些实施例中,此对应的规格界限包括对应参数化资源的上限和下限值(2716)。为了说明,特性的实例是组成物的pH。在此实例中,规格界限指定组成物的pH的所允许上限和组成物的pH的所允许下限值。在替代实施例中,此对应的规格界限包括允许类型的枚举列表(2718)。为了说明,特性的实例是材料的结晶取向。在此实例中,规格界限指定材料的所允许结晶取向的枚举列表。
[0172] 在一些实施例中,超图数据存储区中的一个或多个过程实际上是多个过程。此外,所述多个过程中的第一过程产生第一产品,所述多个过程中的第二过程产生不同第二产品(2720)。举例来说,超图数据存储区中的第一过程可以导致一种类型的组成物的制造,而超图数据存储区中的另一过程可以导致另一组成物的制造。
[0173] 参考图27B的框2722,还维持轮次数据存储区210。轮次数据存储区包括多个过程轮次402。在典型的实施例中,在执行过程版本208的过程轮次402之前锁定过程版本208,使得无法对过程版本208做出其它改变。在此类实施例中,如果想要改变基础过程206,那么定义新的过程版本208。
[0174] 在一些实施例中,每个过程轮次402包括一个或多个过程中的过程206的多个版本中的过程版本404(208)的第一边线的识别,如图4中所说明。此外,在过程轮次中提供对应于相应版本的超图302中的多个节点中的至少一个节点的相应一组参数化资源和它们相关联的一个或多个特性的值。
[0175] 在一些实施例中,轮次数据存储区210另外包括展示以下关系的系谱图420:(i)过程的所述多个版本中在所述多个过程轮次中的单个过程的各版本之间的关系,或(ii)两个或更多个过程的相应多个版本中在所述多个过程轮次中的两个或更多个过程的各版本之间的关系(2724)。举例来说,在一些实施例中,过程集420中的第一过程版本404和过程集420中的第二过程版本404具有相同超图,但是超图中的一个节点的特性或规格界限是不同的。在另一实例中,过程集420中的第一过程版本404和过程集420中的第二过程版本404具有超图,所述超图中除一个以外其余所有节点或边线、除两个以外其余所有节点或边线、除三个以外其余所有节点或边线、除四个以外其余所有节点或边线等等都是共同的。系谱图提供一种有利的辨别给定过程的各个过程版本之间的关系的方式。
[0176] 转向图27C,还维持统计模块212(2726)。统计模块212利用轮次数据存储区210和超图数据存储区204的结构来实现对过程轮次的分析。具体地说,与轮次数据存储区210和超图数据存储区204的独特结构组合的统计模块212提供有利的平台来支持对过程206的许多不同组成部分的统计过程控制(SPC),并因此提供有力的用于分析和稳定此类过程的工具。SPC是一种使用统计方法的质量控制方法。应用它是为了监视和控制过程。监视和控制过程可以确保它们充分发挥作用。举例来说,在充分发挥作用的情况下,过程206可以在最大限度地减少废物的同时制造尽可能多的合格产品。SPC可以应用于可以测量“合格产品”(符合规格的产品)输出的任何过程206。SPC利用控制图,重点在于过程轮次402(例如,实验)的持续改进和设计。例如,参见1992年Barlow和Irony的《统计质量控制的基础(Foundations of statistical quality control)》,Ghosh M.和Pathak P.K.(编者),《统计推断的当前问题:纪念D.Basu的论文(Current Issues in Statistical Inference:
Essays in Honor of D.Basu)》,加利福尼亚州海沃德,数学统计研究所,第99-112页,其在此以引用的方式并入。
[0177] 有利的是,为了支持SPC,响应于接收到识别存在于轮次数据存储区中的一个或多个过程轮次中的一个或多个第一参数化资源的质询,统计模块212能够轻易地检索和格式化所述一个或多个资源以供分析,而不必跟踪呈与过程相关联,或确切地说,与利用过程的节点的过程轮次相关联的不同形式的不同数据。在一些实施例中,例如,数据格式化为一个或多个由制表符分隔的文件、CSV文件、EXCEL电子数据表、谷歌表格,和/或以适用于关系数据库的形式导出。具体地说,数据结构化成确保此类数据可以进行高效分析,使得潜在的相关性在后续分析中不会被忽略。作为SPC的部分执行的此类分析的实例是相关性分析,例如图26中所说明的根因分析。例如,根因分析描述于1993年Wilson等人的《根因分析:全面质量管理的工具(Root Cause Analysis:A Tool for Total Quality Management)》,威斯康星州密尔沃基,ASQ质量出版社,第8-17页,其在此以引用的方式并入本文中。至于图26中所说明的根因分析,质询识别存在于轮次数据存储区中的一个或多个过程轮次中的一个或多个第一参数化资源(例如,氨基酸类型)。然后将一个或多个第一参数化资源的数据格式化并输出以供分析。利用此格式化数据进行分析,例如图26的根因分析。在一些实施例中,针对第三方统计分析软件包格式化质询结果,所述软件包例如是JMP(SAS,英格兰白金汉郡,参见网址www.jmp.com/en_dk/software.html)。使用此类第三方统计分析软件包的分析通常会得到对新过程版本的提议,其中添加或去除了节点,或者与节点相关联的一组资源被进一步定义或重新定义,以便识别并去除不想要的过程可变性(例如,使过程稳定)。
[0178] 质询可以是可用于轮次数据存储区210中的一个或多个过程的任何组合的过程版本的任何组合的资源或这些资源的特性中的任一个。因而,在一些实施例中,质询另外识别存在于轮次数据存储区中的一个或多个轮次中的一个或多个第二参数化资源(或其特性),并且所述一个或多个第一资源和所述一个或多个第二资源相关,并且此相关性的数值量度进行格式化以供呈现(2728)。在一些实施例中,相关性的数值量度的标度在低值和高值之间,其中低值(例如,零)指示所述一个或多个第一参数化资源和所述一个或多个第二参数化资源之间无相关性,且高值(例如,一)指示所述一个或多个第一参数化资源和所述一个或多个第二参数化资源之间完全相关。
[0179] 在一些实施例中,质询另外识别存在于轮次数据存储区中的一个或多个轮次中的一个或多个第二资源(或它们的特性),并且统计模块另外使用多变量分析技术识别以下在存在于轮次数据存储区中的所有参数化资源当中存在于轮次数据存储区中的一个或多个过程轮次中的两者之间的相关性:(i)所述一个或多个第一参数化资源,和(ii)所述一个或多个第二参数化资源(2730)。
[0180] 在一些实施例中,质询识别存在于轮次数据存储区中的一个或多个轮次中的(i)一个或多个第一资源的一个或多个特性和(ii)一个或多个第二资源的一个或多个特性,并且统计模块另外使用多变量分析技术寻求以下在存在于轮次数据存储区中的所有参数化资源当中存在于轮次数据存储区中的一个或多个过程轮次中的两者之间的相关性:(i)所述一个或多个第一资源的所识别特性,与(ii)所述一个或多个第二资源的一个或多个所识别特性。
[0181] 在一些实施例中,上述过程调用多变量分析技术,所述多变量分析技术包括特征选择技术(2732)(例如,最小角回归、逐步回归)。特征选择技术在跨多组过程轮次存在的多个变量(例如,与边线相关联的多组资源中的资源的特性的值)当中识别哪些变量(例如,哪些节点的资源的哪些特性)对过程的产品的特性具有显著的因果影响(例如,哪些变量是不良可再生性、不良良率的原因,或相反地,哪些变量是极佳可再生性、较高良率的原因)时是特别有利的。例如,特征选择技术描述于2007年Saeys等人的《生物信息学中特征选择技术的评述(A review of feature selection techniques in bioinformatics)》,《生物信息学(Bioinformatics)》23,2507-2517,以及1996年Tibshirani的《通过Lasso进行回归、收缩和选择(Regression and Shrinkage and Selection via the Lasso)》,《皇家统计学会期刊B辑(J.R.Statist.Soc B)》,第267-288页,上述文献中的每一个在此以引用方式并入。
[0182] 在一些实施例中,所述一个或多个过程是多个过程,并且识别所述多个过程的子集中的过程轮次中的相关性(2734)。在此类实施例中,并不需要识别此相关性的每一个过程都制造相同产品。此类实施例是非常有利的,因为它们能够研究用于制造不同产品的过程轮次之间不合需要的过程可变性。举例来说,用于相关性分析的一些过程轮次可以制造生物制剂A,而用于相同相关性分析的其它过程轮次可以制造生物制剂B。使用来自生物制剂A和B的过程轮次的数据的相关性分析能够研究独立于产品的变化原因,例如,定义不清的发酵步骤。例如,在生物制剂A和B的过程轮次中输入到此发酵步骤中的糖可能没有得到充分定义来确保过程稳定。例如,这些过程版本共同的变化来源的另一实例可以通过生物制剂A和B的过程轮次之间的相关性分析来识别,并被识别为由于老化而开始失效的一件设备。这都是有可能的,因为所公开的系统和方法向制造不同产品的过程轮次有利地施加了一致的框架。因此,有可能聚合来自不同产品的过程轮次,并对这些过程轮次中所要的任何一组资源和资源的特性或其规格界限执行截面过滤,例如,以便发现独立(或依赖)于通过此类过程产生的实际产品的过程可变性的来源。
[0183] 在一些实施例中,所述一个或多个过程是多个过程,并且识别所述多个过程中的单个过程中的过程轮次中的相关性(2736)。在此类实施例中,识别此相关性的每一个过程都制造相同产品或产生相同分析信息。例如,此类实施例用于精确地识别通过所述过程制造产品或产生分析信息时出现的可变性的关键来源。
[0184] 在一些实施例中,所述一个或多个过程是多个过程,并且所述质询另外识别过程轮次将通过统计模块格式化的所述多个过程的子集(2738)。
[0185] 转向图27D,在一些实施例中,统计模块212另外基于预测所述一个或多个过程中的第一过程中不存在于轮次数据存储区210中的一个或多个额外过程轮次的一个或多个第二参数化资源的建议值(例如,界限)将改变此类过程轮次的产品的数值属性,提供所述一个或多个第二参数化资源的所述建议值(2740)。在一些实施例中,数值属性是所述一个或多个第一参数化资源的方差的减小(2742)。例如,此类实施例用于识别以下情形:被过程轮次中的节点的参数化资源涵盖的资源空间不足以找到先前以足够高的置信度执行的过程轮次的某些过程变量之间的相关性,或完全无法找到相关性。在这些情况下,提供被参数化资源涵盖的空间的建议值,以便对相关性进行测试。在其它实例中,当根据现有过程轮次的分析识别潜在的问题时,使用此类实施例。在此类实施例中,进行所提议的对不存在于轮次数据存储区中的过程轮次中的资源空间的添加,这有助于确定所述潜在的问题是不是真实的。如果所述潜在的问题是真实的,那么可以建立一种新版本的过程,它进一步定义了过程中的现有或新的节点的资源的状态(特性),以便尝试去除过程状态模糊性,并由此使过程稳定。
[0186] 在一些实施例中,质询识别存在于轮次数据存储区中的轮次中的一个或多个第三参数化资源,并且上述数值属性是第一资源和第三参数化资源之间的相关性的置信度(2744)。在一些实施例中,所述一个或多个过程是多个过程,并且所述质询另外识别所述多个过程中的过程轮次将通过统计模块格式化的单个过程(2746)。在此类实施例中,质询所识别的所有过程轮次都制造相同产品或产生相同形式的分析信息。
[0187] 在一些实施例中,所述质询另外识别所述一个或多个过程中的过程轮次子集(2748)。在此类实施例中,不需要质询所识别的所有过程轮次都制造相同产品或产生相同形式的分析信息。实际上,响应于所述质询,一些过程轮次可以制造不同产品或产生不同类型的分析信息。
[0188] 在一些实施例中,统计模块另外识别以下两者之间的相关性:(i)包括所述轮次数据存储区中的一个或多个过程轮次的第一组,和(ii)包括所述轮次数据存储区中的一个或多个过程轮次的第二组,其中所述第二组中的过程轮次不在所述第一组中(2750)。举例来说,在一些实施例中,计算存在于第一组和第二组中的多个参数化资源之间的相关性(2752)。
[0189] 参考图27E,任选地,所述一个或多个第一参数化资源导出到另一装置以供分析(2754),例如,导出为一个或多个由制表符分隔的文件、CSV文件、EXCEL电子数据表、谷歌表格,或者以适用于SQL数据库的形式导出。
[0190] 任选地,在一些实施例中,如上文关于图5所论述,在一些实施例中,维持当过程版本的超图中的节点的一组参数化资源中的参数化资源的特性的获得值在资源的规格界限之外时生成呈计算机数据传输形式的警告的过程评估模块(2756)。
[0191] 任选地,在一些实施例中,针对所述一个或多个过程中的相应过程,执行数据驱动器218(2758)。数据驱动器包含用于接收相应过程的数据集的指令,并且另外包含用于解析数据集以获得以下各项的指令:(i)轮次数据存储区中的过程轮次的识别,和(ii)与所述过程轮次的相应过程的超图中的第一节点的相应一组参数化资源相关联的特性值。数据驱动器另外包含用于用解析值填充轮次数据存储区中的第一节点的参数化资源的特性值的指令。举例来说,在一些实施例中,与过程中的节点相关联的同步引擎监视相关联的同步文件夹。在一些实施例中,与节点相关联的同步引擎作为后台进程(如Google Drive或Dropbox Sync)在附接到与所述节点相关联的仪器上的任何PC上运行。当新仪器数据文件被添加到文件夹中时,软件解析并向数据驱动器218发送数据。在一些实施例中,数据集与过程轮次的正确协议变量(参数化资源)的关联通过与用户交互来完成,该用户被呈现包含他们能够访问的过程轮次的选择的通知。在一些实施例中,数据驱动器218已经包含数据集中的值和过程轮次的正确协议变量(参数化资源)之间的关联。
[0192] 步骤(边线)通过不具有相关联列表的通用实体(节点)连接的实施例参考图28公开了根据本公开的另一实施例的关于网络的过程和特征的流程图的细节。
[0193] 如图28A的框2802中所说明,维持超图数据存储区204。超图数据存储区204针对一个或多个过程中的每个相应过程206包括所述相应过程的相应多个版本。每个相应版本208包括超图302,所述超图302包括由多个节点中的节点322连接的多个边线304。所述多个边线中的每个相应边线304包括表示对应过程中的相应阶段的过程阶段标记。
[0194] 在根据图28的实施例中,多个节点中的每个相应节点322包括多个边线中的第一边线的至少一个输出处的输出,并且还包括多个边线中的至少一个其它边线的一个或多个输入中的第一输入。在一些实施例中,用户只要简单地点击边线304,就能看到它们的输入和输出。此外,可以将呈视频、图片或评论形式的非结构化数据添加到边线304中。例如,示出执行与边线相关联的程序的适当方式的视频可以通过简单地将视频的图标链接拖动到边线304的表示上而链接到边线。
[0195] 参考图28A的框2804,还维持轮次数据存储区210。轮次数据存储区包括多个过程轮次402。在典型的实施例中,在执行过程版本208的过程轮次402之前锁定过程版本208,使得无法对过程版本208做出其它改变。在此类实施例中,如果想要改变基础过程206,那么定义新的过程版本208。参考图28A的框2806,在一些实施例中,多个节点中的每个相应节点与对应一组参数化资源相关联。所述对应一组参数化资源包括多个边线中的第一边线的至少一个输出中的第一输出,并且还包括多个边线中的至少一个其它边线的一个或多个输入中的第一输入。一组参数化资源中的至少一个参数化资源与一个或多个特性相关联。所述一个或多个特性包含一个或多个对应的规格界限。针对多个过程轮次中的每个相应过程轮次,轮次数据存储区另外包括对应于与所述相应版本的超图中的第一节点相关联的第一边线的第一输出或至少一个其它边线的第一输入中的至少一个的相应一组参数化资源和它们相关联的一个或多个特性的值。
[0196] 如上文所论述,过程206的版本208彼此相关。在一些实施例中,过程604的每个版本208产生相同产品。然而,过程的相应多个版本中的第一版本和第二版本通常在一定程度上不同于彼此,例如列举一些可能性,在以下方面不同:节点或边线的数目、边线的过程阶段标记、一组参数化资源中的参数化资源(2808)。
[0197] 参考图28A的框2810,在一些实施例中,相应多个过程版本中的过程版本的超图的多个节点中的节点的一组参数化资源包括第一和第二参数化资源。第一参数化资源指定第一资源且与第一特性相关联,第二参数化资源指定第二资源且与第二特性相关联。参考框2812,在一些此类实施例中,第一特性是第一资源的粘度值、纯度值、组成值、温度值、重量值、质量值、体积值或批次标识符。在一些实施例中,资源310是单个资源。在一些实施例中,资源是复合资源。复合资源的实例包含但不限于组成物(例如,培养基、发酵液等)的混合物和多组件设备(2814)。
[0198] 参考图28B,在一些实施例中,相应多个过程版本中的过程版本208的超图302的多个节点中的第一节点的一组参数化资源包括第一参数化资源,并且此第一参数化资源指定过程条件(2816)。例如,在一些实施例中,此过程条件是温度、暴露时间、混合时间、浓度、设备类型或批次标识符(2818)。
[0199] 如上文所提到,一组参数化资源中的至少一个资源与一个或多个特性相关联,并且所述一个或多个特性包含对应的规格界限。在一些实施例中,此对应的规格界限包括对应参数化资源的上限和下限值(2820)。为了说明,特性的实例是组成物的pH。在此实例中,规格界限指定组成物的pH的所允许上限和组成物的pH的所允许下限值。在替代实施例中,此对应的规格界限包括允许类型的枚举列表(2822)。为了说明,特性的实例是材料的结晶取向。在此实例中,规格界限指定材料的所允许结晶取向的枚举列表。
[0200] 在一些实施例中,超图数据存储区中的一个或多个过程实际上是多个过程。此外,所述多个过程中的第一过程产生第一产品,所述多个过程中的第二过程产生不同第二产品(2824)。举例来说,超图数据存储区中的第一过程可以导致一种类型的组成物的制造,而超图数据存储区中的另一过程可以导致另一组成物的制造。
[0201] 在一些实施例中,轮次数据存储区210另外包括展示以下关系的系谱图420:(i)过程的所述多个版本中在所述多个过程轮次中的单个过程的各版本之间的关系,或(ii)两个或更多个过程的相应多个版本中在所述多个过程轮次中的两个或更多个过程的各版本之间的关系(2826)。举例来说,在一些实施例中,过程集420中的第一过程版本404和过程集420中的第二过程版本404具有相同超图,但是超图中的一个节点的特性或规格界限是不同的。在另一实例中,过程集420中的第一过程版本404和过程集420中的第二过程版本404具有超图,所述超图中除一个以外其余所有节点或边线、除两个以外其余所有节点或边线、除三个以外其余所有节点或边线、除四个以外其余所有节点或边线等等都是共同的。系谱图提供一种有利的辨别给定过程的各个过程版本之间的关系的方式。
[0202] 转到图28C,还维持统计模块212(2828)。统计模块212利用轮次数据存储区210和超图数据存储区204的结构来实现对过程轮次的分析。具体地说,与轮次数据存储区210和超图数据存储区204的独特结构组合的统计模块212提供有利的平台来支持对过程206的许多不同组成部分的统计过程控制(SPC),并因此提供有力的用于分析和稳定此类过程的工具。SPC是一种使用统计方法的质量控制方法。应用它是为了监视和控制过程。监视和控制过程可以确保它们充分发挥作用。举例来说,在充分发挥作用的情况下,过程206可以在最大限度地减少废物的同时制造尽可能多的合格产品。SPC可以应用于可以测量“合格产品”(符合规格的产品)输出的任何过程206。SPC利用控制图,重点在于过程轮次402(例如,实验)的持续改进和设计。例如,参见1992年Barlow和Irony的《统计质量控制的基础(Foundations of statistical quality control)》,Ghosh M.和Pathak P.K.(编者),《统计推断的当前问题:纪念D.Basu的论文(Current Issues in Statistical Inference:
Essays in Honor of D.Basu)》,加利福尼亚州海沃德,数学统计研究所,第99-112页,其在此以引用的方式并入。
[0203] 有利的是,为了支持SPC,响应于接收到识别存在于轮次数据存储区中的一个或多个过程轮次中的一个或多个第一参数化资源的质询,统计模块212能够轻易地检索和格式化所述一个或多个资源以供分析,而不必跟踪呈与过程相关联,或确切地说,与利用过程的节点的过程轮次相关联的不同形式的不同数据。在一些实施例中,例如,数据格式化为一个或多个由制表符分隔的文件、CSV文件、EXCEL电子数据表、谷歌表格,和/或以适用于关系数据库的形式导出。具体地说,数据结构化成确保此类数据可以进行高效分析,使得潜在的相关性在后续分析中不会被忽略。作为SPC的部分执行的此类分析的实例是相关性分析,例如图26中所说明的根因分析。例如,根因分析描述于1993年Wilson等人的《根因分析:全面质量管理的工具(Root Cause Analysis:A Tool for Total Quality Management)》,威斯康星州密尔沃基,ASQ质量出版社,第8-17页,其在此以引用的方式并入本文中。至于图26中所说明的根因分析,质询识别存在于轮次数据存储区中的一个或多个过程轮次中的一个或多个第一参数化资源(例如,氨基酸类型)。然后将一个或多个第一参数化资源的数据格式化并输出以供分析。利用此格式化数据进行分析,例如图26的根因分析。在一些实施例中,针对第三方统计分析软件包格式化质询结果,所述软件包例如是JMP(SAS,英格兰白金汉郡,on the Internet at jmp.com/en_dk/software.html)。使用此类第三方统计分析软件包的分析通常会得到对新过程版本的提议,其中添加或去除了节点和/或边线,或者与节点相关联的一组资源被进一步定义或重新定义,以便识别并去除不想要的过程可变性(例如,使过程稳定)。
[0204] 质询可以是可用于轮次数据存储区210中的一个或多个过程的任何组合的过程版本的任何组合的资源或这些资源的特性中的任一个。因而,在一些实施例中,质询另外识别存在于轮次数据存储区中的一个或多个轮次中的一个或多个第二参数化资源(或其特性),并且所述一个或多个第一资源和所述一个或多个第二资源相关,并且此相关性的数值量度进行格式化以供呈现(2830)。在一些实施例中,相关性的数值量度的标度在低值和高值之间,其中低值(例如,零)指示所述一个或多个第一参数化资源和所述一个或多个第二参数化资源之间无相关性,且高值(例如,一)指示所述一个或多个第一参数化资源和所述一个或多个第二参数化资源之间完全相关。
[0205] 在一些实施例中,质询另外识别存在于轮次数据存储区中的一个或多个轮次中的一个或多个第二资源(或它们的特性),并且统计模块另外使用多变量分析技术识别以下在存在于轮次数据存储区中的所有参数化资源当中存在于轮次数据存储区中的一个或多个过程轮次中的两者之间的相关性:(i)所述一个或多个第一参数化资源,和(ii)所述一个或多个第二参数化资源(2830)。
[0206] 在一些实施例中,所述质询使用多变量分析技术识别在存在于轮次数据存储区中的所有参数化资源当中存在于轮次数据存储区中的一个或多个过程轮次中的两者之间的相关性:(i)一个或多个第一参数化资源,和(ii)一个或多个第二参数化资源(2832)。在一些实施例中,上述过程调用多变量分析技术,所述多变量分析技术包括特征选择技术(2834)(例如,最小角回归、逐步回归)。特征选择技术在跨多组过程轮次存在的多个变量(例如,与边线相关联的多组资源中的资源的特性的值)当中识别哪些变量(例如,资源的哪些特性)对过程的产品的特性具有显著的因果影响(例如,哪些变量是不良可再生性、不良良率的原因,或相反地,哪些变量是极佳可再生性、较高良率的原因)时是特别有利的。例如,特征选择技术描述于2007年Saeys等人的《生物信息学中特征选择技术的评述(A review of feature selection techniques in bioinformatics)》,《生物信息学(Bioinformatics)》23,2507-2517,以及1996年Tibshirani的《通过Lasso进行回归、收缩和选择(Regression and Shrinkage and Selection via the Lasso)》,《皇家统计学会期刊B辑(J.R.Statist.Soc B)》,第267-288页,上述文献中的每一个在此以引用方式并入。
[0207] 在一些实施例中,一个或多个过程是多个过程,并且识别所述多个过程的子集中的过程轮次中的相关性(2836)。在此类实施例中,并不需要识别此相关性的每一个过程都制造相同产品。此类实施例是非常有利的,因为它们能够研究用于制造不同产品的过程轮次之间不合需要的过程可变性。举例来说,用于相关性分析的一些过程轮次可以制造生物制剂A,而用于相同相关性分析的其它过程轮次可以制造生物制剂B。使用来自生物制剂A和B的过程轮次的数据的相关性分析能够研究独立于产品的变化原因,例如,定义不清的发酵步骤。例如,在生物制剂A和B的过程轮次中输入到此发酵步骤中的糖可能没有得到充分定义来确保过程稳定。例如,这些过程版本共同的变化来源的另一实例可以通过生物制剂A和B的过程轮次之间的相关性分析来识别,并被识别为由于老化而开始失效的一件设备。这都是有可能的,因为所公开的系统和方法向制造不同产品的过程轮次有利地施加了一致的框架。因此,有可能聚合来自不同产品的过程轮次,并对这些过程轮次中所要的任何一组资源和资源的特性或其规格界限执行截面过滤,例如,以便发现独立(或依赖)于通过此类过程产生的实际产品的过程可变性的来源。
[0208] 在一些实施例中,所述一个或多个过程是多个过程,并且识别所述多个过程中的单个过程中的过程轮次中的相关性(2838)。在此类实施例中,识别此相关性的每一个过程都制造相同产品或产生相同分析信息。例如,此类实施例用于精确地识别通过所述过程制造产品或产生分析信息时出现的可变性的关键来源。
[0209] 在一些实施例中,所述一个或多个过程是多个过程,并且所述质询另外识别过程轮次将通过统计模块格式化的所述多个过程的子集(2839)。
[0210] 转向图28D,在一些实施例中,统计模块212另外基于预测所述一个或多个过程中的第一过程中不存在于轮次数据存储区210中的一个或多个额外过程轮次的一个或多个第二参数化资源的建议值(例如,界限)将改变此类过程轮次的产品的数值属性,提供所述一个或多个第二参数化资源的所述建议值(2840)。在一些实施例中,数值属性是跨所述多个轮次展现的所述一个或多个第一参数化资源的方差的减小(2742)。例如,此类实施例用于识别以下情形:被过程轮次中的参数化资源涵盖的资源空间不足以找到先前以足够高的置信度执行的过程轮次的某些过程变量之间的相关性,或完全无法找到相关性。在这些情况下,提供被参数化资源涵盖的空间的建议值,以便对相关性进行测试。在其它实例中,当根据现有过程轮次的分析识别潜在的问题时,使用此类实施例。在此类实施例中,进行所提议的对不存在于轮次数据存储区中的过程轮次中的资源空间的添加,这有助于确定所述潜在的问题是不是真实的。如果所述潜在的问题是真实的,那么可以建立一种新版本的过程,它进一步定义了过程中的现有或新的边线的资源的状态(特性),以便尝试去除过程状态模糊性,并由此使过程稳定。
[0211] 在一些实施例中,质询识别存在于轮次数据存储区中的轮次中的一个或多个第三参数化资源,并且上述数值属性是第一资源和第三参数化资源之间的相关性的置信度(2844)。在一些实施例中,所述一个或多个过程是多个过程,并且所述质询另外识别所述多个过程中的过程轮次将通过统计模块格式化的单个过程(2846)。在此类实施例中,质询所识别的所有过程轮次都制造相同产品或产生相同形式的分析信息。
[0212] 在一些实施例中,所述质询另外识别所述一个或多个过程中的过程轮次子集(2848)。在此类实施例中,不需要质询所识别的所有过程轮次都制造相同产品或产生相同形式的分析信息。实际上,响应于所述质询,一些过程轮次可以制造不同产品或产生不同类型的分析信息。
[0213] 在一些实施例中,统计模块另外识别以下两者之间的相关性:(i)包括所述轮次数据存储区中的一个或多个过程轮次的第一组,和(ii)包括所述轮次数据存储区中的一个或多个过程轮次的第二组,其中所述第二组中的过程轮次不在所述第一组中(2850)。举例来说,在一些实施例中,计算存在于第一组和第二组中的多个参数化资源之间的相关性(2852)。
[0214] 参考图28E,任选地,所述一个或多个第一参数化资源导出到另一装置以供分析(2754),例如,导出为一个或多个由制表符分隔的文件、CSV文件、EXCEL电子数据表、谷歌表格,或者以适用于SQL数据库的形式导出。
[0215] 任选地,在一些实施例中,如上文关于图5所论述,在一些实施例中,维持当过程版本的超图中的节点的一组参数化资源中的参数化资源的特性的获得值在资源的规格界限之外时生成呈计算机数据传输形式的警告的过程评估模块(2856)。
[0216] 任选地,在一些实施例中,针对所述一个或多个过程中的相应过程,执行数据驱动器218(2858)。数据驱动器包含用于接收相应过程的数据集的指令,并且另外包含用于解析数据集以获得以下各项的指令:(i)轮次数据存储区中的过程轮次的识别,和(ii)与所述过程轮次的相应过程的超图中的第一节点的相应一组参数化资源相关联的特性值。数据驱动器另外包含用于用解析值填充轮次数据存储区中的第一节点的参数化资源的特性值的指令。举例来说,在一些实施例中,与过程相关联的同步引擎监视相关联的同步文件夹。在一些实施例中,同步引擎作为后台进程(如Google Drive或Dropbox Sync)在附接到与所述边线相关联的仪器上的任何PC上运行。当新仪器数据文件被添加到文件夹中时,软件解析并向数据驱动器218发送数据。在一些实施例中,数据集与过程轮次的正确协议变量(参数化资源)的关联通过与用户交互来完成,该用户被呈现包含他们能够访问的过程轮次的选择的通知。在一些实施例中,数据驱动器218已经包含数据集中的值和过程轮次的正确协议变量(参数化资源)之间的关联。
[0217] 引用文献和替代性实施例
[0218] 本文中所引用的全部参考文献以全文引用的方式并入本文中并且出于所有目的,其程度如同每个单独的出版物或专利或专利申请具体地或单独地被指示出于所有目的以全文引用的方式并入本文中。
[0219] 本发明可以实施为包括嵌入在非暂时性计算机可读存储介质中的计算机程序机制的计算机程序产品。举例来说,计算机程序产品可包含在图1、2、3、4和/或5的任何组合中所示的程序模块。这些程序模块可以存储在CD-ROM、DVD、磁盘存储产品或任何其它有形的计算机可读数据或程序存储产品上。
[0220] 对本领域的技术人员而言显而易见的是,在不背离本发明的精神和范围的情况下,可以对本发明进行许多修改和变化。本文中所描述的具体实施例仅以实例的方式给出。为了最佳地解释本发明的原理及其实际应用,对实施例加以选择和描述,由此使本领域的其他技术人员能够最好地利用本发明以及具有适合于所设想的特定用途的各种修改的各个实施例。本发明仅由所附权利要求书的条款以及所述权利要求书所授权的等效物的完整范畴来限制。