融合KPLS与FNN的生产过程主导变量精简化软测量方法转让专利

申请号 : CN201210551632.8

文献号 : CN102967327B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 苏盈盈姚立忠颜克胜李太福胡文金王美丹

申请人 : 重庆科技学院

摘要 :

本发明公开了一种融合KPLS与FNN的生产过程主导变量精简化软测量方法其特征在于按如下步骤进行:一,确定与主导变量可能相关的n个原始辅助变量,采集n个原始辅助变量和主导变量取值数据并组成样本集;二,融合KPLS和FNN方法分别计算n个原始辅助变量的权重值;三,组成原始辅助变量序列;四,建模并根据最小均方误差MSE确定最佳辅助变量;五,得到精简化软测量模型。本发明能够在建模效果最佳的基础上找出含辅助变量个数最少的辅助变量集对主导变量进行建模,实现对主导变量精简化的软测量。

权利要求 :

1.一种融合KPLS与FNN的生产过程主导变量精简化软测量方法,其特征在于按如下步骤进行:步骤一:确定与主导变量可能相关的n个原始辅助变量,采集n个原始辅助变量和主导变量的取值,组成样本集,样本集大小为m;

T

将n个原始辅助变量数据写成矩阵X=[x1,…,xm] 形式,主导变量数据写成矩阵Y=T[y1,…,ym],其中, 并将它们进行标准化处理;

步骤二:融合KPLS和FNN方法分别计算n个原始辅助变量的权重值;

步骤三:n个原始辅助变量组成原始辅助变量序列;

步骤四:确定最佳辅助变量集,包括以下步骤:第一步,设定循环次数N=n;

第二步,随机从样本集中选择p个样本作为训练样本,剩下的m-p个样本作为检验样本;

第三步,根据所述训练样本,利用BP神经网络建立原始辅助变量序列中所包含变量的非线性模型;

第四步,将所述检验样本的原始辅助变量值输入至所述非线性模型,得到m-p个检验样本对应的主导变量预测值;

第五步,计算m-p个检验样本预测值的均方误差MSE;

第六步,删除当前原始辅助变量序列中权重值最小的原始辅助变量,组成新的原始辅助变量序列,并设定N=N-1,判断此时N是否为0:如果N≠0,则回到第三步;

如果N=0,则最小的MSE对应原始辅助变量序列即为最佳辅助变量集;

步骤五:最佳辅助变量集在步骤四中对应的非线性模型即为精简化软测量模型;

所述融合KPLS和FNN方法计算某个原始辅助变量A的权重值按如下步骤进行:(一):利用KPLS算法计算样本集的k个KPLS主元得分向量组成的主元得分矩阵T=[t1,…,tk],按如下步骤进行:(1):计算核矩阵K,其中,K的第ij位元素为Kij=κ(xi,xj),i,j=1,2,…,m;

(2):中心化核矩阵 其中,Im为m阶单位矩阵,

(3):初始化对偶投影方向向量ui=Y,并令K1=K;

(4):从i=1,2,……循环执行步骤:①

判断ui+1是否收敛,即判断||ui-ui+1||≤0.001是否成立,若成立,则认为ui+1已收敛,则进入步骤(5),并得到KPLS主元得分向量个数k=i,否则认为ui+1仍未收敛,则执行④;

④执行缩进

⑤执行缩进

⑥返回至①;

(5):得到矩阵U=[u1,…,uk]和k个KPLS主元得分向量组成的主元得分矩阵T=[t1,…,tk];

(二):借助FNN方法计算某个原始辅助变量A的权重值,按如下步骤进行:(1):将原始样本集中的原始辅助变量A的取值全部设置为零,其他原始辅助变量取值不变,得到新的样本集矩阵 其中,(2):计算核矩阵 其中, 的第ij位元素为其中,c为高斯核宽度参数,一般取0.1-1范围内;

(3):中心化核矩阵 其中,Im为m阶单位矩阵,

(4):计算原始辅助变量A置零下的KPLS主元得分矩阵其中,U,T,K均为步骤(一)中计算得到的相应矩阵;

(5):执行如下计算

其中,T(i,:),WΑ(i,:)均表示矩阵的第i行,亦即原始样本集和将原始辅助变量A置零后所得样本集的第i个样本在KPLS主元空间中的投影坐标;

(6):

d值即是原始辅助变量A的权重值。

2.根据权利要求1所述的融合KPLS与FNN的生产过程主导变量精简化软测量方法,其特征在于:在利用BP神经网络建立原始辅助变量序列中所包含变量的非线性模型的过程中,输入层的节点个数等于当前原始辅助变量序列中所包含的变量个数,隐含层的节点个数通过交互验证法确定,输出层的节点个数为1,其中,隐含层的传递函数为:输出层的传递函数为:purelin(x)=x。

说明书 :

融合KPLS与FNN的生产过程主导变量精简化软测量方法

技术领域

[0001] 本发明属于软测量技术领域,具体涉及一种融合核偏最小二乘(Kernel Partial Least Squares,KPLS)与虚假最近邻点(False Nearest Neighbors,FNN)的生产过程主导变量精简化软测量方法。

背景技术

[0002] 到目前为止,在实际生产过程中,存在着许多因为技术或经济原因无法直接测量的变量,在这种情况下,软测量技术应运而生。软测量就是依据可测、易测的过程变量(称为辅助变量)与难以直接检测的待测变量(称为主导变量)的数学关系,根据某种最优准则,采用各种计算方法,用软件实现对待测变量的测量或估计。软测量技术是目前研究的一个热点,例如中国专利(专利号:200410017533.7)就提出了一种基于支持向量机的软测量建模方法。
[0003] 在软测量过程中,辅助变量的选择是第一步。在大多数实际生产过程中,人们经常不能确定哪个辅助变量与主导变量相关,或有多大程度的相关,因而导致参与计算的辅助变量数量众多。将众多辅助变量通过计算,实现对主导变量的软测量,会带来庞大的计算量,不仅耗时耗力,并且得到的软测量结果也并不一定是最好的,这是在生成过程中不希望看到的事情。如何利用最少的辅助变量集对主导变量实现效果最好的的软测量,成为人们追求的目标。

发明内容

[0004] 本发明的目的在于提供一种融合KPLS与FNN的生产过程主导变量精简化软测量方法,能够在建模效果最佳的准则上找出含辅助变量个数最少的辅助变量集对主导变量进行建模,实现对主导变量精简化的软测量。
[0005] 本发明的技术方案如下:一种融合KPLS与FNN的生产过程主导变量精简化软测量方法,其关键在于按如下步骤进行:
[0006] 步骤一:确定与主导变量可能相关的n个原始辅助变量,采集n个原始辅助变量和主导变量的取值,组成样本集,样本集大小为m;
[0007] 将n个原始辅助变量数据写成矩阵X=[x1,…,xm]T形式,主导变量数据写成矩阵T n×1Y=[y1,…,ym],其中,xi∈R ,yi∈R,i=1,2,…,m,并将它们标准化处理;
[0008] 所 述 标 准 化 处 理 就 是:若n 个 原 始 辅 助 变 量 数 据 写 成 矩 阵T形式,主导变量数据写成矩阵Y=[y1,…,ym] 形式,其
n×1
中,xi∈R ,yi∈R,i=1,2,…,m,标准化处理后得到的数据矩阵如下:
[0009]
[0010]
[0011] 步骤二:融合KPLS和FNN方法分别计算n个原始辅助变量的权重值;
[0012] 步骤三:n个原始辅助变量组成原始辅助变量序列;
[0013] 步骤四:确定最佳辅助变量集,包括以下步骤:
[0014] 第一步,设定循环次数N=n;
[0015] 第二步,随机从样本集中选择p个样本作为训练样本,剩下的m-p个样本作为检验样本,所述训练样本个数p一般选取总样本数m的 左右为宜;
[0016] 第三步,根据所述训练样本,利用BP神经网络建立原始辅助变量序列中所包含变量的非线性模型;
[0017] 第四步,将所述检验样本的原始辅助变量值输入至所述非线性模型,得到m-p个检验样本对应的主导变量预测值;
[0018] 第五步,计算m-p个检验样本预测值的均方误差MSE,其中,均方误差MSE按下式计算:
[0019] 上式中,Pt表示所述m-p个检验样本中第t个样本的主导变量取值,PCt表示所述m-p个检验样本中第t个样本的主导变量预测值;
[0020] 第六步,删除当前原始辅助变量序列中权重值最小的原始辅助变量,组成新的原始辅助变量序列,并设定N=N-1,判断此时N是否为0:
[0021] 如果N≠0,则回到第三步;
[0022] 如果N=0,则最小的MSE对应原始辅助变量序列即为最佳辅助变量集;
[0023] 步骤五:最佳辅助变量集在步骤四中对应的非线性模型即为精简化软测量模型。
[0024] 所述融合KPLS和FNN方法计算某个原始辅助变量A的权重值按如下步骤进行:
[0025] (一):利用KPLS算法计算样本集的k个KPLS主元得分向量组成的主元得分矩阵T=[t1,…,tk],按如下步骤进行:
[0026] (1):计算核矩阵K,其中,K的第ij位元素为Kij=κ(xi,xj),i,j=1,2,…,m;
[0027] 在核矩阵的计算,一般采用高斯核,即
[0028] Kij=κ(xi,xj)=exp(-||xi-xj||2/c),i,j=1,2,…,m,
[0029] 其中,c为高斯核宽度参数,一般取0.1-1范围内;
[0030] (2):中心化核矩阵 其中,Im为m阶单位矩阵,
[0031] (3):初始化对偶投影方向向量ui=Y,并令K1=K;
[0032] (4):从i=1,2,……循环执行步骤:
[0033] ①
[0034] ②
[0035] ③
[0036] 判断ui+1是否收敛,即判断||ui-ui+1||≤0.001是否成立,若成立,则认为ui+1已收敛,则进入步骤(5),并得到KPLS主元得分向量个数k=i,否则认为ui+1仍未收敛,则执行④;
[0037] ④执行缩并
[0038] ⑤执行缩并
[0039] ⑥返回至①;
[0040] (5):得到矩阵U=[u1,...,uk]和k个KPLS主元得分向量组成的主元得分矩阵T=[t1,…,tk];
[0041] (二):借助FNN方法计算某个原始辅助变量A的权重值,按如下步骤进行:
[0042] (1):将原始样本集中的原始辅助变量A的取值全部设置为零,其他原始辅助变量取值不变,得到新的样本集矩阵 其中,
[0043] i=1,2,…,m;
[0044] (2):计算核矩阵 其中, 的第ij位元素为
[0045] i,j=1,2,…,m;
[0046] (3):中心化核矩阵 其中,Im为m阶单位矩阵,
[0047] (4):计算原始辅助变量A置零下的KPLS主元得分矩阵
[0048] 其中,U,T,K均为步骤(一)中计算得到的相应矩阵;
[0049] (5):执行如下计算
[0050]
[0051] 其中,T(i,:),WA(i,:)均表示矩阵的第i行,亦即原始样本集和将原始辅助变量A置零后所得样本集的第i个样本在KPLS主元空间中的投影坐标;
[0052] (6):
[0053] d值即是原始辅助变量A的权重值。
[0054] 此d值刻画了原始辅助变量A置零前后对样本集在KPLS主元空间中的投影坐标的变化情况,d值越大,说明原始辅助变量A置零前后投影坐标的改变越大,从而说明原始辅助变量A对主导变量的解释能力越强,即可用d值来度量原始辅助变量A的权重值。
[0055] 所有n个原始辅助变量的权重值按原始辅助变量A的权重值计算方法计算得到。
[0056] 在利用BP神经网络建立原始辅助变量序列中所包含变量的非线性模型的过程中,输入层的节点个数等于当前原始辅助变量序列中所包含的变量个数,隐含层的节点个数通过交互验证法确定,输出层的节点个数为1,其中,隐含层的传递函数为:输出层的传递函数为:purelin(x)=x;
[0057] 得到精简化软测量模型后,在以后的生产过程中,只需要测量最佳辅助变量集中辅助变量的值,代入精简化软测量模型,就可以得到主导变量的值。
[0058] 本发明的显著效果:在众多原始辅助变量中,找出与主导变量具有关键作用的关键辅助变量,实现了利用含辅助变量个数最少的辅助变量集对主导变量实现效果最好的软测量,节约了人力物力财力,并大大提高了测量的效率。

附图说明

[0059] 图1是本发明的流程图;
[0060] 图2是本发明中确定最佳辅助变量集的流程图;
[0061] 图3是实施例1中的电池化成工艺流程图。

具体实施方式

[0062] 下面结合附图和实施例对本发明作进一步说明:
[0063] 实施例1:
[0064] 如图1,融合KPLS与FNN的生产过程主导变量精简化软测量方法,按如下步骤进行:
[0065] 步骤一:确定与主导变量可能相关的n个原始辅助变量,采集n个原始辅助变量和主导变量的取值,组成样本集,样本集大小为m,并将n个原始辅助变量数据写成矩阵形式,主导变量数据写成矩阵Y=[y1,…,ym]T形式,其中,xi∈Rn×1,yi∈R,i=1,2,…,m,并进一步将它们作如下标准化处理,得到处理之后的数据矩阵:
[0066]
[0067]
[0068] 步骤二:融合KPLS和FNN方法分别计算n个原始辅助变量的权重值;
[0069] 所述融合KPLS和FNN方法计算某个原始辅助变量A的权重值按如下步骤进行:
[0070] (一):利用KPLS算法计算样本集的k个KPLS主元得分向量组成的主元得分矩阵T=[t1,...,tk],按如下步骤进行:
[0071] (1):计算核矩阵K,其中,K的第ij位元素为Kij=κ(xi,xj),i,j=1,2,…,m;
[0072] (2):中心化核矩阵 其中,Im为m阶单位矩阵,
[0073] (3):初始化对偶投影方向向量ui,不妨取ui=Y,并令K1=K;
[0074] (4):从i=1,2,……循环执行步骤:
[0075] ①
[0076] ②
[0077] ③
[0078] 判断ui+1是否收敛,即判断||ui-ui+1||≤0.001是否成立,若成立,则认为ui+1已收敛,则进入步骤(5),并得到KPLS主元得分向量个数k=i,否则认为ui+1仍未收敛,则执行④;
[0079] ④执行缩并
[0080] ⑤执行缩并
[0081] ⑥返回至①;
[0082] (5):得到矩阵U=[u1,...,uk]和k个KPLS主元得分向量组成的主元得分矩阵T=[t1,...,tk];
[0083] 在步骤(1)中核矩阵的计算,一般采用高斯核,即
[0084] Kij=κ(xi,xj)=exp(-||xi-xj||2/c),i,j=1,2,…,m,其中,c为高斯核宽度参数,一般取0.1-1范围内;
[0085] (二):借助FNN方法计算某个原始辅助变量A的权重值,按如下步骤进行:
[0086] (1):将原始样本集中的原始辅助变量A的取值全部设置为零,其他原始辅助变量取值不变,得到新的样本集矩阵 其中,
[0087] i=1,2,…,m;
[0088] (2):计算核矩阵 其中, 的第ij位元素为
[0089] i,j=1,2,…,m;
[0090] (3):中心化核矩阵 其中,Im为m阶单位矩阵,
[0091] (4):计算原始辅助变量A置零下的KPLS主元得分矩阵
[0092] 其中,U,T,K均为步骤(一)中计算得到的相应矩阵;
[0093] (5):执行如下计算
[0094]
[0095] 其中,T(i,:),WA(i,:)均表示矩阵的第i行,亦即原始样本集和将原始辅助变量A置零后所得样本集的第i个样本在KPLS主元空间中的投影坐标;
[0096] (6):
[0097] 此d值刻画了原始辅助变量A置零前后对样本集在KPLS主元空间中的投影坐标的变化情况,d值越大,说明原始辅助变量A置零前后投影坐标的改变越大,从而说明原始辅助变量A对主导变量的解释能力越强,即可用d值来度量原始辅助变量A的权重值。
[0098] 所有n个原始辅助变量的权重值按原始辅助变量A的权重值计算方法计算得到。
[0099] 步骤三:n个原始辅助变量组成原始辅助变量序列;
[0100] 步骤四:确定最佳辅助变量集,如图2所示,包括以下步骤:
[0101] 第一步,设定循环次数N=n;
[0102] 第二步,随机从样本集中选择p个样本作为训练样本,剩下的m-p个样本作为检验样本,所述训练样本个数p一般选取总样本数m的 左右为宜;
[0103] 第三步,根据所述训练样本,利用BP神经网络建立原始辅助变量序列中所包含变量的非线性模型;
[0104] 建模过程中,BP神经网络输入层的节点个数等于当前原始辅助变量序列中所包含的变量个数,隐含层的节点个数通过交互验证法确定,输出层的节点个数为1,其中,隐含层的传递函数为: 输出层的传递函数为:purelin(x)=x;
[0105] 第四步,将所述检验样本的原始辅助变量值输入至所述非线性模型,得到m-p个检验样本对应的主导变量预测值;
[0106] 第五步,计算m-p个检验样本预测值的均方误差MSE,其中,均方误差MSE按下式计算:
[0107] 上式中,Pt表示所述m-p个检验样本中第t个样本的主导变量取值,PCt表示所述m-p个检验样本中第t个样本的主导变量预测值;
[0108] 第六步,删除当前原始辅助变量序列中权重值最小的原始辅助变量,组成新的原始辅助变量序列,并设定N=N-1,判断此时N是否为0:
[0109] 如果N≠0,则回到第三步;
[0110] 如果N=0,则最小的MSE对应原始辅助变量序列即为最佳辅助变量集;
[0111] 步骤五:最佳辅助变量集在步骤四中对应的非线性模型即为精简化软测量模型。
[0112] 得到精简化软测量模型后,在以后的生产过程中,只需要测量最佳辅助变量集中辅助变量的值,代入精简化软测量模型,就可以得到主导变量的值。
[0113] 以推导铅酸蓄电池生产过程中的容量放电终止电压为例,在电池生产过程中,电池化成的工艺图如图2所示,电池化成要经过六个阶段的充放电以后再进行容量放电检验,而容量放电检测中涉及到测量10小时率放电终止电压。
[0114] 我们确定主导变量为10h率放电终止电压,选择电池电导、充电8h电池电压、充电31h电池电压、充电26h电池电压、化成放电0h电池电压、化成放电6h终止电压、充电6h电池电压、充电32h电池电压作为原始辅助变量。
[0115] 按步骤一,收集到主导变量和8个原始辅助变量的样本集,样本大小为9,样本集大小为172,即有172个大小为9的样本,见表1:
[0116] 表1.样本集
[0117]
[0118]
[0119] 续表1
[0120]
[0121] 融合KPLS和FNN方法得到8个原始辅助变量的权重值依次为:
[0122]
[0123]
[0124] 从样本集中随机选取130个样本作为训练样本,剩下的42个为检验样本。依次删除原始辅助变量序列中权重值最小的原始辅助变量,利用BP神经网络建立非线性模型后,计算得到的检验样本的均方误差MSE,以下依次列出了原始辅助变量序列中变量个数分别为8、7、6、5、4、3、2和1时检验样本的均方误差MSE:
[0125]
[0126] 均方误差0.0013对应的原始辅助变量序列中的原始辅助变量为最佳辅助变量,对应的非线性模型即为精简化软测量模型。
[0127] 本实施例中的最佳辅助变量集包括:电池电导、充电6h电池电压、充电26h电池电压、充电31h电池电压、充电8h电池电压。在建立精简化软测量模型中,BP神经网络的输入层节点为上述五个最佳辅助变量值,经过交互验证法确定BP神经网络的隐含层节点数为11个。
[0128] 从而得到本例的精简化软测量模型:
[0129] BP神经网络隐含层第i个神经元输出 i=1,2,…,11,
[0130] 输出层神经元输出 k=1,其中,
[0131]
[0132] b2=-0.9691,w1,w2分别为输入层到隐含层、隐含层到输出层的连接权重值矩阵,b1,b2分别为隐含层、输出层的阈值矩阵,xj为输入样本x的第j维辅助变量取值。