一种基于时间滞后XGBOOST模型的熟料游离钙含量软测量方法转让专利

申请号 : CN202210611461.7

文献号 : CN114692515B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 袁亦斌张公政刘继林王璟琳朱永治

申请人 : 中材邦业(杭州)智能技术有限公司

摘要 :

本发明公开了一种基于时间滞后XGBOOST模型的熟料游离钙含量软测量方法,该方法包括获取水泥生产流程对应生产参数的生产数据和化验室针对水泥样本的质量数据;将生产数据和质量数据确认为输入数据,将游离氧化钙含量确认为输出数据,并对输入数据与输出数据进行数据清洗;分别计算各输入数据与输出数据的皮尔逊相关性;基于输入数据在水泥生产流程中的生产时间节点确定各输入数据的时间提前量,将各输入数据与输出数据进行时间滞后对齐;确定均方差最小的目标XGBOOST模型;当接收到新的生产数据时,将生产数据输入至回归模型,得到游离氧化钙含量预测值。本发明实现了在复杂时变问题上具有更好的预测能力和更低的预测误差,能够更加准确的捕捉时变特性。

权利要求 :

1.一种基于时间滞后XGBOOST模型的熟料游离钙含量软测量方法,其特征在于,所述方法包括:获取水泥生产流程对应各生产参数的生产数据和化验室针对水泥样本的各质量数据,所述质量数据包括游离氧化钙含量;

将同一时刻的各所述生产数据和除所述游离氧化钙含量外的各所述质量数据确认为输入数据,将所述游离氧化钙含量确认为输出数据,并对所述输入数据与输出数据进行数据清洗,用以剔除不在预设数值范围内的异常数据;

分别计算各所述输入数据与所述输出数据的皮尔逊相关性,并筛除所述皮尔逊相关性低于预设值的所述输入数据;

基于所述输入数据在所述水泥生产流程中的生产时间节点确定各所述输入数据的时间提前量,将各所述输入数据与输出数据进行时间滞后对齐;

基于所述输入数据与输出数据构建XGBOOST模型,调整所述XGBOOST模型的模型参数,确定均方差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型;

当接收到新的所述生产数据时,将所述生产数据输入至所述回归模型,得到游离氧化钙含量预测值,并基于上一时刻所述游离氧化钙含量预测值与游离氧化钙含量实际值的偏差对当前时刻的所述游离氧化钙含量预测值进行矫正;

其中,所述对所述输入数据与输出数据进行数据清洗,用以剔除不在预设数值范围内的异常数据,包括:分别获取各所述输入数据与输出数据对应的预设数值范围,确定不在所述预设数值范围内的异常数据;

剔除各所述异常数据,并填充等数量的均值数据,所述均值数据为所述异常数据对应的所述输入数据的正常数据均值;

对处理后的所述输入数据与输出数据进行均值滤波。

2.根据权利要求1所述的方法,其特征在于,所述生产数据包括窑电流、二次风温、三次风温、烟室温度、头煤量、氨水量、分解炉温度、篦下压力、熟料温度、烟室压力、高温风机转速、一级筒出口温度、一级筒出口压力、二级筒出口温度、二级筒出口压力、三级筒出口温度、三级筒出口压力、四级筒出口温度、四级筒出口压力、五级筒出口温度、五级筒出口压力、六级筒出口温度、六级筒出口压力、冷却机温度、一室压力、第一风机出口压力和第二风机出口压力,所述质量数据还包括生料饱和比、生料硅率和生料铝率。

3.根据权利要求1所述的方法,其特征在于,所述基于所述输入数据与输出数据构建XGBOOST模型,调整所述XGBOOST模型的模型参数,确定均方差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型,包括:将所述输入数据与输出数据按照预设比例划分为训练集和测试集;

基于所述训练集训练得到XGBOOST模型,并调整所述XGBOOST模型的模型参数;

将所述测试集输入至所述XGBOOST模型,确定测试数据预测值与测试数据真实值的均方误差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型。

4.根据权利要求3所述的方法,其特征在于,所述调整所述XGBOOST模型的模型参数,包括:将最大迭代次数调整为75;将子树深度调整为5;将随机抽取样本比例submaple调整为

1,随机抽取特征比例调整为0.9;将L1正则化参数reg_alpha调整为0.01,L2正则化参数reg_lambda调整为1;将学习率调整为0.1。

5.根据权利要求3所述的方法,其特征在于,所述将所述测试集输入至所述XGBOOST模型,确定测试数据预测值与测试数据真实值的均方误差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型,包括:将所述测试集输入至所述XGBOOST模型,并调用XGBRegressor的predict方法,得到所述XGBOOST模型输出的测试数据预测值;

从所述测试集中确定测试数据真实值,计算测试数据预测值与测试数据真实值的均方误差;

基于网格搜索GridSearchCV方法优化所述均方误差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型。

6.一种基于时间滞后XGBOOST模型的熟料游离钙含量软测量装置,其特征在于,所述装置包括:获取模块,用于获取水泥生产流程对应各生产参数的生产数据和化验室针对水泥样本的各质量数据,所述质量数据包括游离氧化钙含量;

清洗模块,用于将同一时刻的各所述生产数据和除所述游离氧化钙含量外的各所述质量数据确认为输入数据,将所述游离氧化钙含量确认为输出数据,并对所述输入数据与输出数据进行数据清洗,用以剔除不在预设数值范围内的异常数据;

计算模块,用于分别计算各所述输入数据与所述输出数据的皮尔逊相关性,并筛除所述皮尔逊相关性低于预设值的所述输入数据;

滞后模块,用于基于所述输入数据在所述水泥生产流程中的生产时间节点确定各所述输入数据的时间提前量,将各所述输入数据与输出数据进行时间滞后对齐;

调整模块,用于基于所述输入数据与输出数据构建XGBOOST模型,调整所述XGBOOST模型的模型参数,确定均方差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型;

预测模块,用于当接收到新的所述生产数据时,将所述生产数据输入至所述回归模型,得到游离氧化钙含量预测值,并基于上一时刻所述游离氧化钙含量预测值与游离氧化钙含量实际值的偏差对当前时刻的所述游离氧化钙含量预测值进行矫正;

其中,清洗模块包括:

第一获取单元,用于分别获取各所述输入数据与输出数据对应的预设数值范围,确定不在所述预设数值范围内的异常数据;

剔除单元,用于剔除各所述异常数据,并填充等数量的均值数据,所述均值数据为所述异常数据对应的所述输入数据的正常数据均值;

均值滤波单元,用于对处理后的所述输入数据与输出数据进行均值滤波。

7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1‑5任一项所述方法的步骤。

8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1‑5任一项所述方法的步骤。

说明书 :

一种基于时间滞后XGBOOST模型的熟料游离钙含量软测量

方法

技术领域

[0001] 本申请涉及水泥熟料生产技术领域,具体而言,涉及一种基于时间滞后XGBOOST模型的熟料游离钙含量软测量方法。

背景技术

[0002] 在水泥回转窑生产过程中,生产工艺复杂,主要生产环节包括原料破碎、生料粉磨、煤磨、烧成(预热器、分解炉、篦冷机)、余热发电及熟料入库等过程。烧成过程的核心是控制熟料质量,其中熟料游离钙含量是水泥熟料质量最有代表性的指标。目前水泥回转窑并没有实时测量游离钙含量的仪器,大多数采用两小时一次人工取样化验测量的方式。这样的人工取样化验的方式有比较多的局限性,例如取样不具有代表性、不连续性、结果获取时间延后等,无法较为准确的测量熟料游离钙含量。虽然目前存在一些游离钙预测方法,但常用的游离钙预测方法一般为线性回归、深度神经网络,在实际应用过程中,线性回归往往难以达到较高精准度,会因为变量之间本身的非线性关系,导致模型不够准确;深度神经网络在图像文本领域有较高的适用性,但是由于工业领域数据量较少、数据分布变化极大,从而也难有比较好的预测效果。综上,目前并没有一种能够较为准确预测出熟料游离钙含量的方法。

发明内容

[0003] 为了解决上述问题,本申请实施例提供了一种基于时间滞后XGBOOST模型的熟料游离钙含量软测量方法。
[0004] 第一方面,本申请实施例提供了一种基于时间滞后XGBOOST模型的熟料游离钙含量软测量方法,所述方法包括:
[0005] 获取水泥生产流程对应各生产参数的生产数据和化验室针对水泥样本的各质量数据,所述质量数据包括游离氧化钙含量;
[0006] 将同一时刻的各所述生产数据和除所述游离氧化钙含量外的各所述质量数据确认为输入数据,将所述游离氧化钙含量确认为输出数据,并对所述输入数据与输出数据进行数据清洗,用以剔除不在预设数值范围内的异常数据;
[0007] 分别计算各所述输入数据与所述输出数据的皮尔逊相关性,并筛除所述皮尔逊相关性低于预设值的所述输入数据;
[0008] 基于所述输入数据在所述水泥生产流程中的生产时间节点确定各所述输入数据的时间提前量,将各所述输入数据与输出数据进行时间滞后对齐;
[0009] 基于所述输入数据与输出数据构建XGBOOST模型,调整所述XGBOOST模型的模型参数,确定均方差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型;
[0010] 当接收到新的所述生产数据时,将所述生产数据输入至所述回归模型,得到游离氧化钙含量预测值,并基于上一时刻所述游离氧化钙含量预测值与游离氧化钙含量实际值的偏差对当前时刻的所述游离氧化钙含量预测值进行矫正。
[0011] 优选的,所述生产数据包括窑电流、二次风温、三次风温、烟室温度、头煤量、氨水量、分解炉温度、篦下压力、熟料温度、烟室压力、高温风机转速、一级筒出口温度、一级筒出口压力、二级筒出口温度、二级筒出口压力、三级筒出口温度、三级筒出口压力、四级筒出口温度、四级筒出口压力、五级筒出口温度、五级筒出口压力、六级筒出口温度、六级筒出口压力、冷却机温度、一室压力、第一风机出口压力和第二风机出口压力,所述质量数据还包括生料饱和比、生料硅率和生料铝率。
[0012] 优选的,所述对所述输入数据与输出数据进行数据清洗,用以剔除不在预设数值范围内的异常数据,包括:
[0013] 分别获取各所述输入数据与输出数据对应的预设数值范围,确定不在所述预设数值范围内的异常数据;
[0014] 剔除各所述异常数据,并填充等数量的均值数据,所述均值数据为所述异常数据对应的所述输入数据的正常数据均值;
[0015] 对处理后的所述输入数据与输出数据进行均值滤波。
[0016] 优选的,所述基于所述输入数据与输出数据构建XGBOOST模型,调整所述XGBOOST模型的模型参数,确定均方差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型,包括:
[0017] 将所述输入数据与输出数据按照预设比例划分为训练集和测试集;
[0018] 基于所述训练集训练得到XGBOOST模型,并调整所述XGBOOST模型的模型参数;
[0019] 将所述测试集输入至所述XGBOOST模型,确定测试数据预测值与测试数据真实值的均方误差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型。
[0020] 优选的,所述调整所述XGBOOST模型的模型参数,包括:
[0021] 将最大迭代次数调整为75;将子树深度调整为5;将随机抽取样本比例submaple调整为1,随机抽取特征比例调整为0.9;将L1正则化参数reg_alpha调整为0.01,L2正则化参数reg_lambda调整为1;将学习率调整为0.1。
[0022] 优选的,所述将所述测试集输入至所述XGBOOST模型,确定测试数据预测值与测试数据真实值的均方误差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型,包括:
[0023] 将所述测试集输入至所述XGBOOST模型,并调用XGBRegressor的predict方法,得到所述XGBOOST模型输出的测试数据预测值;
[0024] 从所述测试集中确定测试数据真实值,计算测试数据预测值与测试数据真实值的均方误差;
[0025] 基于网格搜索GridSearchCV方法优化所述均方误差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型。
[0026] 第二方面,本申请实施例提供了一种基于时间滞后XGBOOST模型的熟料游离钙含量软测量装置,所述装置包括:
[0027] 获取模块,用于获取水泥生产流程对应各生产参数的生产数据和化验室针对水泥样本的各质量数据,所述质量数据包括游离氧化钙含量;
[0028] 清洗模块,用于将同一时刻的各所述生产数据和除所述游离氧化钙含量外的各所述质量数据确认为输入数据,将所述游离氧化钙含量确认为输出数据,并对所述输入数据与输出数据进行数据清洗,用以剔除不在预设数值范围内的异常数据;
[0029] 计算模块,用于分别计算各所述输入数据与所述输出数据的皮尔逊相关性,并筛除所述皮尔逊相关性低于预设值的所述输入数据;
[0030] 滞后模块,用于基于所述输入数据在所述水泥生产流程中的生产时间节点确定各所述输入数据的时间提前量,将各所述输入数据与输出数据进行时间滞后对齐;
[0031] 调整模块,用于基于所述输入数据与输出数据构建XGBOOST模型,调整所述XGBOOST模型的模型参数,确定均方差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型;
[0032] 预测模块,用于当接收到新的所述生产数据时,将所述生产数据输入至所述回归模型,得到游离氧化钙含量预测值,并基于上一时刻所述游离氧化钙含量预测值与游离氧化钙含量实际值的偏差对当前时刻的所述游离氧化钙含量预测值进行矫正。
[0033] 第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面或第一方面的任意一种可能的实现方式提供的方法的步骤。
[0034] 第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面或第一方面的任意一种可能的实现方式提供的方法。
[0035] 本发明的有益效果为:1.设置了基于均值滤波和时间滞后对齐的XGBOOST模型,并且通过实时校正的方式,使得该模型在复杂时变问题上具有更好的预测能力和更低的预测误差,能够更加准确的捕捉时变特性。相较于传统的建模方法,本申请设计的XGBOOST模型能够更加准确的捕捉过程时变特征,并且通过时间对齐滤波的方法有效的解决了数据波动对于预测的负面影响。
[0036] 2.通过限制树的深度有效的解决了在少量数据集上面的过拟合现象,而且通过实时矫正的方式,有效的解决了变量漂移和数据分布变化导致预测不准的问题。

附图说明

[0037] 为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0038] 图1为本申请实施例提供的一种基于时间滞后XGBOOST模型的熟料游离钙含量软测量方法的流程示意图;
[0039] 图2为本申请实施例提供的一种基于时间滞后XGBOOST模型的熟料游离钙含量软测量装置的结构示意图;
[0040] 图3为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

[0041] 下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
[0042] 在下述介绍中,术语“第一”、“第二”仅为用于描述的目的,而不能理解为指示或暗示相对重要性。下述介绍提供了本申请的多个实施例,不同实施例之间可以替换或者合并组合,因此本申请也可认为包含所记载的相同和/或不同实施例的所有可能组合。因而,如果一个实施例包含特征A、B、C,另一个实施例包含特征B、D,那么本申请也应视为包括含有A、B、C、D的一个或多个所有其他可能的组合的实施例,尽管该实施例可能并未在以下内容中有明确的文字记载。
[0043] 下面的描述提供了示例,并且不对权利要求书中阐述的范围、适用性或示例进行限制。可以在不脱离本申请内容的范围的情况下,对描述的元素的功能和布置做出改变。各个示例可以适当省略、替代或添加各种过程或组件。例如所描述的方法可以以所描述的顺序不同的顺序来执行,并且可以添加、省略或组合各种步骤。此外,可以将关于一些示例描述的特征组合到其他示例中。
[0044] 参见图1,图1是本申请实施例提供的一种基于时间滞后XGBOOST模型的熟料游离钙含量软测量方法的流程示意图。在本申请实施例中,所述方法包括:
[0045] S101、获取水泥生产流程对应各生产参数的生产数据和化验室针对水泥样本的各质量数据,所述质量数据包括游离氧化钙含量。
[0046] 本申请的执行主体可以是服务器。
[0047] 在本申请实施例中,为了构建并训练XGBOOST模型,首先需要获取用于进行训练的数据,考虑到水泥复杂的生产过程,将会获取水泥生产过程中各个流程环节的生产参数所对应的生产数据,还会获取化验室所检测到质量数据。其中,生产数据可以通过连接dcs数据库获取,质量数据可以通过水泥厂的mes系统导出。获取到的生产数据和质量数据拼接后可以存储到本地的服务器之中。
[0048] 在一种可实施方式中,所述生产数据包括窑电流、二次风温、三次风温、烟室温度、头煤量、氨水量、分解炉温度、篦下压力、熟料温度、烟室压力、高温风机转速、一级筒出口温度、一级筒出口压力、二级筒出口温度、二级筒出口压力、三级筒出口温度、三级筒出口压力、四级筒出口温度、四级筒出口压力、五级筒出口温度、五级筒出口压力、六级筒出口温度、六级筒出口压力、冷却机温度、一室压力、第一风机出口压力和第二风机出口压力,所述质量数据还包括生料饱和比、生料硅率和生料铝率。
[0049] 在本申请实施例中,考虑到复杂的生产环节中可能会对游离氧化钙含量造成影响的因素,将获取上述这些数据来作为样本数据,最终可以得到数据表格如下:
[0050]
[0051] S102、将同一时刻的各所述生产数据和除所述游离氧化钙含量外的各所述质量数据确认为输入数据,将所述游离氧化钙含量确认为输出数据,并对所述输入数据与输出数据进行数据清洗,用以剔除不在预设数值范围内的异常数据。
[0052] 在本申请实施例中,将t时刻的水泥生产流程的生产数据和化验室的质量数据中的生料饱和比、生料硅率、生料铝率作为输入数据x(t),将t时刻的熟料质量游离钙含量作为输出数据y(t)。对于输入数据与输出数据,首先将进行数据清洗,来将异常数据排除,以保证接下来模型训练的准确性。
[0053] 在一种可实施方式中,所述对所述输入数据与输出数据进行数据清洗,用以剔除不在预设数值范围内的异常数据,包括:
[0054] 分别获取各所述输入数据与输出数据对应的预设数值范围,确定不在所述预设数值范围内的异常数据;
[0055] 剔除各所述异常数据,并填充等数量的均值数据,所述均值数据为所述异常数据对应的所述输入数据的正常数据均值;
[0056] 对处理后的所述输入数据与输出数据进行均值滤波。
[0057] 在本申请实施例中,对于每一种数据而言,均预先设置有预设数值范围,预设数值范围可以看作是该种类数据的正常数值范围,数据清洗的过程即为将不在正常范围的数据异常值剔除,并剔除后缺失的值用均值填充,然后对处理好的数据进行均值滤波。
[0058] 示例性的,以上表中二次风温为例,填充的正常数据均值为:二次风温(缺失)=(1271+1262+1279+1278+1259+1262+1265+1279+1250+1270)/n,其中n为该类数据的总样本数。
[0059] S103、分别计算各所述输入数据与所述输出数据的皮尔逊相关性,并筛除所述皮尔逊相关性低于预设值的所述输入数据。
[0060] 在本申请实施例中,前述过程获取到的输入数据涵盖了生产环节中的每一个可能造成影响的数据,但是实际上并不是每一种数据都与输出数据,即熟料质量游离钙含量具有较强的关联性。故数据清洗后还需要计算各个输入数据x(t)与输出数据y(t)的皮尔逊相关性。具体计算公式如下:
[0061]
[0062] 进行计算时,将采用同一时刻t的输入数据x与输出数据y进行计算。
[0063] 示例性的,本申请将选取相关性>0.2的数据作为后续使用的数据,经实际测验,将包括有二次风温、三次风温、烟室温度、头煤量、氨水量、篦下压力、熟料温度、烟室压力、高温风机转速、一级筒出口压力、二级筒出口压力、三级筒出口压力、四级筒出口压力、五级筒出口温度、六级筒出口温度、六级筒出口压力、冷却机温度、一室压力、第一风机出口压力、第二风机出口压力。
[0064] S104、基于所述输入数据在所述水泥生产流程中的生产时间节点确定各所述输入数据的时间提前量,将各所述输入数据与输出数据进行时间滞后对齐。
[0065] 在本申请实施例中,由于在整个生产流程中,原料需要花费较长的时间来依次经过各个生产环节进行加工处理,这使得在同一时刻下所获取的各个数据之间并不是属于同一批次的数据,也就无法较好在后续模型训练过程中训练出较为准确的预测结果。因此,将根据各个输入数据在水泥生产流程中的生产时间节点,来确定各个输入数据的时间提前量,以此分别对各个输入数据进行时间滞后,使得滞后完成的各输入数据能够在时间上对齐,对应于同一个输出数据。
[0066] 示例性的,滞后公式为x(t) = x(t‑a),其中a为滞后时间。为了将输入数据逐一对齐,二次风温、三次风温、篦下压力、熟料温度、冷却机温度、一室压力、F1风机出口压力、F2风机出口压力提前20分钟,窑电流、烟室温度、头煤、氨水、烟室压力提前30分钟,高温风机转速、一级筒出口压力、二级筒出口压力、三级筒出口压力、四级筒出口压力、五级筒出口压力、六级筒出口压力提前40分钟,以此找到每个小时的y(t)和与之对应的x(t)。处理结果对应的表格如下:
[0067]
[0068]
[0069] S105、基于所述输入数据与输出数据构建XGBOOST模型,调整所述XGBOOST模型的模型参数,确定均方差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型。
[0070] 在本申请实施例中,通过输入数据与输出数据能够构建出训练集构建XGBOOST模型。XGBOOST,即极限梯度提升算法,是集成算法中的一种,XGBOOST通过在数据上逐一构建多个弱评估器,经过多次迭代逐渐累积并汇总多个弱评估器的建模结果,以获得比单个模型更好的回归或者分类表现。
[0071] 这种以单个决策树作为弱评估器的叠加策略,可以表示为加法形式,如下所示:
[0072]
[0073] 其中y表示整个模型的预测结果,K表示弱评估器数量,f表示决策树,x表示对应的特征向量。
[0074] 此外,XGBOOST引入了模型复杂度来衡量算法的运行效率,目标函数如下所示:
[0075]
[0076] 其中,Obj表示模型的目标函数,n表示导入第k棵树的数据总量,第一项代表传统的损失函数,衡量真实标签yi和预测值 之间的差异,第二项代表模型的复杂度,使用树模型的某种变换 表示。
[0077] 模型构建好后,将通过XGBOOST模型的模型参数,来确定均方差最小的XGBOOST模型,此模型即为最终所需要得到的用于预测的回归模型。
[0078] 在一种可实施方式中,所述基于所述输入数据与输出数据构建XGBOOST模型,调整所述XGBOOST模型的模型参数,确定均方差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型,包括:
[0079] 将所述输入数据与输出数据按照预设比例划分为训练集和测试集;
[0080] 基于所述训练集训练得到XGBOOST模型,并调整所述XGBOOST模型的模型参数;
[0081] 将所述测试集输入至所述XGBOOST模型,确定测试数据预测值与测试数据真实值的均方误差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型。
[0082] 在本申请实施例中,将按照3:1的比例划分训练集和测试集。接着将训练集传入XGBOOST模型中进行训练,具体的训练过程可以调用XGBRegressor中的fit函数。模型训练构建好之后,为了能够得到效果最好的模型,即均方误差最小的回归模型,首先将会根据具体的实际情况对模型进行模型参数的调整,以此将对模型影响较大的参数固定。
[0083] 在一种可实施方式中,所述调整所述XGBOOST模型的模型参数,包括:
[0084] 将最大迭代次数调整为75;将子树深度调整为5;将随机抽取样本比例submaple调整为1,随机抽取特征比例调整为0.9;将L1正则化参数reg_alpha调整为0.01,L2正则化参数reg_lambda调整为1;将学习率调整为0.1。
[0085] 在本申请实施例中,确定均方差最小的XGBOOST模型结构时,将会对上述参数进行调整固定,以保证最终能得到符合实际生产情况的效果最好的模型。
[0086] 在一种可实施方式中,所述将所述测试集输入至所述XGBOOST模型,确定测试数据预测值与测试数据真实值的均方误差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型,包括:
[0087] 将所述测试集输入至所述XGBOOST模型,并调用XGBRegressor的predict方法,得到所述XGBOOST模型输出的测试数据预测值;
[0088] 从所述测试集中确定测试数据真实值,计算测试数据预测值与测试数据真实值的均方误差;
[0089] 基于网格搜索GridSearchCV方法优化所述均方误差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型。
[0090] 在本申请实施例中,运用测试集对XGBOOST模型进行预测时,将调用XGBRegressor的predict方法,以此来使用predict_classes()函数进行结果预测,其返回的是类别的索引,即该样本所属的类别标签。XGBOOST模型将会输出测试数据预测值y_hat,将其与测试数据真实值y进行均方误差的计算,即能够根据计算结果评估模型效果,均方误差越小,模型效果越好。最终,将根据网格搜索GridSearchCV方法,即通过遍历给定的参数组合来优化选取的均方误差最小的模型,得到最终所需的回归模型。
[0091] S106、当接收到新的所述生产数据时,将所述生产数据输入至所述回归模型,得到游离氧化钙含量预测值,并基于上一时刻所述游离氧化钙含量预测值与游离氧化钙含量实际值的偏差对当前时刻的所述游离氧化钙含量预测值进行矫正。
[0092] 在本申请实施例中,得到能够进行软测量的回归模型后,便能够开始真正的数据预测过程。具体而言,当接收到新的生产数据时,调用基于XGBOOST模型的算法y_pred(t)=f(x(t)),得到游离氧化钙含量预测值y_pred(t)。此外,为了进一步保证数据结果的准确性,还会实时矫正数据偏差。将根据上一个时刻的预测值和实际值y_real(t‑1)的偏差进行矫正,即y_out(t)=y_pred(t)+(y_real(t‑1)‑y_pred(t‑1)),其中,y_out(t)作为t时刻的预测值输出。
[0093] 下面将结合附图2,对本申请实施例提供的基于时间滞后XGBOOST模型的熟料游离钙含量软测量装置进行详细介绍。需要说明的是,附图2所示的基于时间滞后XGBOOST模型的熟料游离钙含量软测量装置,用于执行本申请图1所示实施例的方法,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请图1所示的实施例。
[0094] 请参见图2,图2是本申请实施例提供的一种基于时间滞后XGBOOST模型的熟料游离钙含量软测量装置的结构示意图。如图2所示,所述装置包括:
[0095] 获取模块201,用于获取水泥生产流程对应各生产参数的生产数据和化验室针对水泥样本的各质量数据,所述质量数据包括游离氧化钙含量;
[0096] 清洗模块202,用于将同一时刻的各所述生产数据和除所述游离氧化钙含量外的各所述质量数据确认为输入数据,将所述游离氧化钙含量确认为输出数据,并对所述输入数据与输出数据进行数据清洗,用以剔除不在预设数值范围内的异常数据;
[0097] 计算模块203,用于分别计算各所述输入数据与所述输出数据的皮尔逊相关性,并筛除所述皮尔逊相关性低于预设值的所述输入数据;
[0098] 滞后模块204,用于基于所述输入数据在所述水泥生产流程中的生产时间节点确定各所述输入数据的时间提前量,将各所述输入数据与输出数据进行时间滞后对齐;
[0099] 调整模块205,用于基于所述输入数据与输出数据构建XGBOOST模型,调整所述XGBOOST模型的模型参数,确定均方差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型;
[0100] 预测模块206,用于当接收到新的所述生产数据时,将所述生产数据输入至所述回归模型,得到游离氧化钙含量预测值,并基于上一时刻所述游离氧化钙含量预测值与游离氧化钙含量实际值的偏差对当前时刻的所述游离氧化钙含量预测值进行矫正。
[0101] 在一种可实施方式中,所述生产数据包括窑电流、二次风温、三次风温、烟室温度、头煤量、氨水量、分解炉温度、篦下压力、熟料温度、烟室压力、高温风机转速、一级筒出口温度、一级筒出口压力、二级筒出口温度、二级筒出口压力、三级筒出口温度、三级筒出口压力、四级筒出口温度、四级筒出口压力、五级筒出口温度、五级筒出口压力、六级筒出口温度、六级筒出口压力、冷却机温度、一室压力、第一风机出口压力和第二风机出口压力,所述质量数据还包括生料饱和比、生料硅率和生料铝率。
[0102] 在一种可实施方式中,清洗模块202包括:
[0103] 第一获取单元,用于分别获取各所述输入数据与输出数据对应的预设数值范围,确定不在所述预设数值范围内的异常数据;
[0104] 剔除单元,用于剔除各所述异常数据,并填充等数量的均值数据,所述均值数据为所述异常数据对应的所述输入数据的正常数据均值;
[0105] 均值滤波单元,用于对处理后的所述输入数据与输出数据进行均值滤波。
[0106] 在一种可实施方式中,调整模块205包括:
[0107] 划分单元,用于将所述输入数据与输出数据按照预设比例划分为训练集和测试集;
[0108] 调整单元,用于基于所述训练集训练得到XGBOOST模型,并调整所述XGBOOST模型的模型参数;
[0109] 测试单元,用于将所述测试集输入至所述XGBOOST模型,确定测试数据预测值与测试数据真实值的均方误差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型。
[0110] 在一种可实施方式中,调整单元包括:
[0111] 调整元件,用于将最大迭代次数调整为75;将子树深度调整为5;将随机抽取样本比例submaple调整为1,随机抽取特征比例调整为0.9;将L1正则化参数reg_alpha调整为0.01,L2正则化参数reg_lambda调整为1;将学习率调整为0.1。
[0112] 在一种可实施方式中,测试单元包括:
[0113] 调用元件,用于将所述测试集输入至所述XGBOOST模型,并调用XGBRegressor的predict方法,得到所述XGBOOST模型输出的测试数据预测值;
[0114] 计算元件,用于从所述测试集中确定测试数据真实值,计算测试数据预测值与测试数据真实值的均方误差;
[0115] 确定元件,用于基于网格搜索GridSearchCV方法优化所述均方误差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型。
[0116] 本领域的技术人员可以清楚地了解到本申请实施例的技术方案可借助软件和/或硬件来实现。本说明书中的“单元”和“模块”是指能够独立完成或与其他部件配合完成特定功能的软件和/或硬件,其中硬件例如可以是现场可编程门阵列(Field-Programmable Gate Array,FPGA)、集成电路(Integrated Circuit,IC)等。
[0117] 本申请实施例的各处理单元和/或模块,可通过实现本申请实施例所述的功能的模拟电路而实现,也可以通过执行本申请实施例所述的功能的软件而实现。
[0118] 参见图3,其示出了本申请实施例所涉及的一种电子设备的结构示意图,该电子设备可以用于实施图1所示实施例中的方法。如图3所示,电子设备300可以包括:至少一个中央处理器301,至少一个网络接口304,用户接口303,存储器305,至少一个通信总线302。
[0119] 其中,通信总线302用于实现这些组件之间的连接通信。
[0120] 其中,用户接口303可以包括显示屏(Display)、摄像头(Camera),可选用户接口303还可以包括标准的有线接口、无线接口。
[0121] 其中,网络接口304可选的可以包括标准的有线接口、无线接口(如WI‑FI接口)。
[0122] 其中,中央处理器301可以包括一个或者多个处理核心。中央处理器301利用各种接口和线路连接整个电子设备300内的各个部分,通过运行或执行存储在存储器305内的指令、程序、代码集或指令集,以及调用存储在存储器305内的数据,执行终端300的各种功能和处理数据。可选的,中央处理器301可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field‑Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。中央处理器301可集成中央中央处理器(Central Processing Unit,CPU)、图像中央处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到中央处理器301中,单独通过一块芯片进行实现。
[0123] 其中,存储器305可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read‑Only Memory)。可选的,该存储器305包括非瞬时性计算机可读介质(non‑transitory computer‑readable storage medium)。存储器305可用于存储指令、程序、代码、代码集或指令集。存储器305可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器305可选的还可以是至少一个位于远离前述中央处理器301的存储装置。如图3所示,作为一种计算机存储介质的存储器305中可以包括操作系统、网络通信模块、用户接口模块以及程序指令。
[0124] 在图3所示的电子设备300中,用户接口303主要用于为用户提供输入的接口,获取用户输入的数据;而中央处理器301可以用于调用存储器305中存储的基于时间滞后XGBOOST模型的熟料游离钙含量软测量应用程序,并具体执行以下操作:
[0125] 获取水泥生产流程对应各生产参数的生产数据和化验室针对水泥样本的各质量数据,所述质量数据包括游离氧化钙含量;
[0126] 将同一时刻的各所述生产数据和除所述游离氧化钙含量外的各所述质量数据确认为输入数据,将所述游离氧化钙含量确认为输出数据,并对所述输入数据与输出数据进行数据清洗,用以剔除不在预设数值范围内的异常数据;
[0127] 分别计算各所述输入数据与所述输出数据的皮尔逊相关性,并筛除所述皮尔逊相关性低于预设值的所述输入数据;
[0128] 基于所述输入数据在所述水泥生产流程中的生产时间节点确定各所述输入数据的时间提前量,将各所述输入数据与输出数据进行时间滞后对齐;
[0129] 基于所述输入数据与输出数据构建XGBOOST模型,调整所述XGBOOST模型的模型参数,确定均方差最小的目标XGBOOST模型,所述目标XGBOOST模型即为回归模型;
[0130] 当接收到新的所述生产数据时,将所述生产数据输入至所述回归模型,得到游离氧化钙含量预测值,并基于上一时刻所述游离氧化钙含量预测值与游离氧化钙含量实际值的偏差对当前时刻的所述游离氧化钙含量预测值进行矫正。
[0131] 本申请还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。其中,计算机可读存储介质可以包括但不限于任何类型的盘,包括软盘、光盘、DVD、CD‑ROM、微型驱动器以及磁光盘、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、闪速存储器设备、磁卡或光卡、纳米系统(包括分子存储器IC),或适合于存储指令和/或数据的任何类型的媒介或设备。
[0132] 需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
[0133] 在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0134] 在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些服务接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
[0135] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0136] 另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0137] 所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(Read‑Only Memory, ROM)、随机存取存储器(Random Access Memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0138] 本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通进程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(Read‑Only Memory, ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
[0139] 以上所述者,仅为本公开的示例性实施例,不能以此限定本公开的范围。即但凡依本公开教导所作的等效变化与修饰,皆仍属本公开涵盖的范围内。本领域技术人员在考虑说明书及实践这里的公开后,将容易想到本公开的其实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未记载的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的范围和精神由权利要求限定。