一种基于多传感器快速学习的气体种类识别方法及系统转让专利

申请号 : CN202011583594.5

文献号 : CN112580741B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 沈廼桐刘金星樊海春张涛李超徐卫郭稳薛天成

申请人 : 天津同阳科技发展有限公司

摘要 :

本发明提出一种基于多传感器快速学习的气体种类识别方法,构建基础气体识别模型库;标定调整分类坐标系模型;矫正调整模型;通过对坐标系进行反复调整,使得利用LDA算法生成的坐标系可以对气体进行有效分类。本发明减低了模型训练的时间复杂度和空间复杂度,降低了运算量,降低了模型运算时所需要的硬件处理能力;提高了生产效率,避免了需要为所有设备都进行多次标定以获取大量模型数据的问题;提高了气体识别的准确性,增加了模型矫正能力。

权利要求 :

1.一种基于多传感器快速学习的气体种类识别方法,其特征在于,包括:S1、构建基础气体识别模型库;向测试传感器阵列所在的气室内分别通入不同浓度和不同种类的待测气体,采集传感器数据进行LDA数据处理,得到气体种类映射坐标系,再在该坐标系下,根据不同气体浓度变化,建立浓度坐标系;建立好的坐标系作为基础气体识别模型库;

S2、标定调整分类坐标系模型:根据当前标定与前次标定之间的时间差,调整本次标定权值,再将新标定得到的传感器数据信息拼接到原有数据队列后面,再在现有拼接后的队列基础上,计算LDA新坐标;

S3、矫正调整模型:在新坐标实现后,根据现有标定数据,对模型进行矫正计算;利用增加数据列后的模型对当前标定气体进行识别,根据识别后数据在新坐标系下坐标与现有气体分类数据重心差值,调整坐标系;通过对坐标系进行反复调整,使得利用LDA算法生成的坐标系对气体进行有效分类;

步骤S2所述调整本次标定权值的方法采用动态权重系数算法,根据仪器标定时间动态计算模型输出算法权重系数;具体包括:S211、存储策略:在传感器采集到数据进行数据拼接后,将数据读取时间进行记录,在时间存储的同时记录标识数据失效时间以及衰减系数;

S212、模型计算:在利用LDA进行数据降维分析、计算类别均值时,增加时间衰减函数进行计算;在计算全局样本均值时,同样利用衰减函数,对数据进行衰减盘点,同时读取数据失效时间信息,判断数据信息是否可以继续作为全局样本继续作为有效数据;

步骤S212中所述利用LDA进行数据降维分析的具体方法为:(1)计算各传感器不同气体氛围下的AD值均值ui,计算所有传感器AD值u;

(2)计算历史有效数据在衰减函数作用后的散度矩阵Sw,计算所有传感器衰减函数作用后的散度矩阵St,传感器之间的散度矩阵Sb;

‑1

(3)对矩阵Sw Sb做特征分解;

(4)取最大d'个特征值所对应的特征向量;

(5)计算投影矩阵;

(6)计算投影坐标系;

衰减函数表示为:

k‑i

Y=e *p*Xi+q

其中Y为衰减运算后AD值均值,k为时间衰减系数,p为传感器原始衰减比例,q为传感器衰减调整值,Xi为拼接调整后存储训练集中数据向量。

2.根据权利要求1所述的一种基于多传感器快速学习的气体种类识别方法,其特征在于,步骤S2中所述拼接采用多模态数据拼接融合算法,具体包括:S201、前置条件:利用多台仪器,采集传感器在规定状态污染物氛围内,传感器采集值变化规律,包括传感器采集值定时间段内AD值变化均量,定时间段内传感器方差偏移量,定时间段内传感器AD值中心距变化量,并结合气体氛围变化规律,根据传感器AD值数据计算出该种传感器在当前气体氛围种变化的特征向量,将该特征向量作为当前传感器在该种气体氛围变化规律模式下的模式观察规律特征向量;

S202、执行条件:将需要进行数据训练拼接的不同传感器观测数据,即多模态数据,进行数据融合,利用基于步骤S201特征向量的基础上,对传感器测量数据与特征向量进行按位乘法运算,并将计算后所得到的结果进行数据拼接,得到气体氛围变化规律传感器特征向量空间下的恶臭污染因子特征空间数据模型;

S203、校准拼接:利用已知气体变化氛围,结合各个传感器观察结果变化规律,修改当前传感器监测数据结果的特征向量空间;将优化修改后的数据与特征向量相乘,将结果拼接到数据模型后部;使得拼接后的数据训练模型,越靠后的记录,数据特征向量利用的为最新数据变化特征向量;

S204、有损拼接:对于部分传感器对某些种物质无有效响应的情况,在数据处理时,将特征向量非零特征值相同的特征值进行单独记录,通过快速特征向量0值检索,快速进行污染因子种类判别。

3.根据权利要求1所述的一种基于多传感器快速学习的气体种类识别方法,其特征在于,步骤S3所述矫正计算采用标定矫正模型算法,具体包括:S301、利用已经经过LDA处理过的坐标信息对当前标定结果进行重新判断,判断依照当前校准信息,能否对当前恶臭因子进行判断,如果可以进行判断,且新生成数据结果到各坐标轴间距离方差小于阈值系数,则认定该模型可用;

S302、否则进入重新调整阶段,通过贪婪算法,调整权值系数,使得边距方差阈值小于给定的阈值系数;则将该模型作为新校正后的模型进行使用。

4.一种基于多传感器快速学习的气体种类识别系统,其特征在于,包括:模型构建模块,用于构建基础气体识别模型库;向测试传感器阵列所在的气室内分别通入不同浓度和不同种类的待测气体,采集传感器数据进行LDA数据处理,得到气体种类映射坐标系,再在该坐标系下,根据不同气体浓度变化,建立浓度坐标系;建立好的坐标系作为基础气体识别模型库;

标定模块,用于标定调整分类坐标系模型:根据当前标定与前次标定之间的时间差,调整本次标定权值,再将新标定得到的传感器数据信息拼接到原有数据队列后面,再在现有拼接后的队列基础上,计算LDA新坐标;

矫正模块,用于矫正调整模型:在新坐标实现后,根据现有标定数据,对模型进行矫正计算;利用增加数据列后的模型对当前标定气体进行识别,根据识别后数据在新坐标系下坐标与现有气体分类数据重心差值,调整坐标系;通过对坐标系进行反复调整,使得利用LDA算法生成的坐标系可以对气体进行有效分类;

所述标定模块还设有动态权重系数单元,用于根据仪器标定时间动态计算模型输出算法权重系数;具体包括:

存储策略子单元:在传感器采集到数据进行数据拼接后,将数据读取时间进行记录,在时间存储的同时记录标识数据失效时间以及衰减系数;

模型计算子单元:在利用LDA进行数据降维分析、计算类别均值时,增加时间衰减函数进行计算;在计算全局样本均值时,同样利用衰减函数,对数据进行衰减盘点,同时读取数据失效时间信息,判断数据信息是否可以继续作为全局样本继续作为有效数据;

模型计算子单元中利用LDA进行数据降维分析:(1)计算各传感器不同气体氛围下的AD值均值ui,计算所有传感器AD值u;

(2)计算历史有效数据在衰减函数作用后的散度矩阵Sw,计算所有传感器衰减函数作用后的散度矩阵St,传感器之间的散度矩阵Sb;

‑1

(3)对矩阵Sw Sb做特征分解;

(4)取最大d'个特征值所对应的特征向量;

(5)计算投影矩阵;

(6)计算投影坐标系;

衰减函数表示为:

k‑i

Y=e *p*Xi+q

其中Y为衰减运算后AD值均值,k为时间衰减系数,p为传感器原始衰减比例,q为传感器衰减调整值,Xi为拼接调整后存储训练集中数据向量。

5.根据权利要求4所述的一种基于多传感器快速学习的气体种类识别系统,其特征在于,所述标定模块设有多模态数据拼接融合单元,包括:前置条件子单元:利用多台仪器,采集传感器在规定状态污染物氛围内,传感器采集值变化规律,包括传感器采集值定时间段内AD值变化均量,定时间段内传感器方差偏移量,定时间段内传感器AD值中心距变化量,并结合气体氛围变化规律,根据传感器AD值数据计算出该种传感器在当前气体氛围种变化的特征向量,将该特征向量作为当前传感器在该种气体氛围变化规律模式下的模式观察规律特征向量;

执行条件子单元:将需要进行数据训练拼接的不同传感器观测数据,即多模态数据,进行数据融合,利用基于前置条件子单元的特征向量的基础上,对传感器测量数据与特征向量进行按位乘法运算,并将计算后所得到的结果进行数据拼接,得到气体氛围变化规律传感器特征向量空间下的恶臭污染因子特征空间数据模型;

校准拼接子单元:利用已知气体变化氛围,结合各个传感器观察结果变化规律,修改当前传感器监测数据结果的特征向量空间;将优化修改后的数据与特征向量相乘,将结果拼接到数据模型后部;使得拼接后的数据训练模型,越靠后的记录,数据特征向量利用的为最新数据变化特征向量;

有损拼接子单元:对于部分传感器对某些种物质无有效响应的情况,在数据处理时,将特征向量非零特征值相同的特征值进行单独记录,通过快速特征向量0值检索,快速进行污染因子种类判别。

6.根据权利要求4所述的一种基于多传感器快速学习的气体种类识别系统,其特征在于,所述矫正模块设有标定矫正模型单元,具体包括:判断子单元:利用已经经过LDA处理过的坐标信息对当前标定结果进行重新判断,判断依照当前校准信息,能否对当前恶臭因子进行判断,如果可以进行判断,且新生成数据结果到各坐标轴间距离方差小于阈值系数,则认定该模型可用;

重调整子单元:进入重新调整阶段,通过贪婪算法,调整权值系数,使得边距方差阈值小于给定的阈值系数;则将该模型作为新校正后的模型进行使用。

说明书 :

一种基于多传感器快速学习的气体种类识别方法及系统

技术领域

[0001] 本发明属于气体检测技术领域,特别涉及到一种基于多传感器快速学习的气体种类识别方法及系统。

背景技术

[0002] 随着人们生活水平的不断提高,人们对生活环境的要求也在不断提升,而空气污染也正在成为人们最关心的问题之一。如何快速获取当气空气污染物成分,对气体污染物
进行快速识别,是解决这一问题的关键因素。目前主要使用的方法为利用传感器进行检测,
但受传感器技术和反应原理的影响,传感器在气体识别过程中存在交叉干扰以及漂移等问
题,不能快速准确的对气体进行识别。
[0003] 传统方法主要利用大量数据对传感器反应性质进行实验,并通过数据挖掘对数据规律进行总结,进而获取气体识别模型。但该方法在实际应用中主要存在如下问题:
[0004] 1、受传感器生产技术影响,传感器个体之间存在较大差异;
[0005] 2、受监测仪器生产规模影响,无法做到实验规模要求的数据测试量;
[0006] 3、受设备现场使用环境差异影响,设备运行一段时间后,传感器间差异明显增大,原有规律可能失效。
[0007] 因此目前亟需一种方案,既可以快速识别出待测气体种类,还需要对模型进行快速学习。

发明内容

[0008] 本发明提出一种基于多传感器快速学习的气体种类识别方法及系统,既可以快速识别出待测气体种类,还可以对模型进行快速学习。
[0009] 为达到上述目的,本发明的技术方案是这样实现的:
[0010] 一种基于多传感器快速学习的气体种类识别方法,包括:
[0011] S1、构建基础气体识别模型库;向测试传感器阵列所在的气室内分别通入不同浓度和不同种类的待测气体,采集传感器数据进行LDA数据处理,得到气体种类映射坐标系,
再在该坐标系下,根据不同气体浓度变化,建立浓度坐标系;建立好的坐标系作为基础气体
识别模型库;
[0012] S2、标定调整分类坐标系模型:根据当前标定与前次标定之间的时间差,调整本次标定权值,再将新标定得到的传感器数据信息拼接到原有数据队列后面,再在现有拼接后
的队列基础上,计算LDA新坐标;
[0013] S3、矫正调整模型:在新坐标实现后,根据现有标定数据,对模型进行矫正计算;利用增加数据列后的模型对当前标定气体进行识别,根据识别后数据在新坐标系下坐标与现
有气体分类数据重心差值,调整坐标系;通过对坐标系进行反复调整,使得利用LDA算法生
成的坐标系可以对气体进行有效分类。
[0014] 进一步的,步骤S2中所述拼接采用多模态数据拼接融合算法,具体包括:
[0015] S201、前置条件:利用多台仪器,采集传感器在规定状态污染物氛围内,传感器采集值变化规律,包括传感器采集值定时间段内AD值变化均量,定时间段内传感器方差偏移
量,定时间段内传感器AD值中心距变化量,并结合气体氛围变化规律,根据传感器AD值数据
计算出该种传感器在当前气体氛围种变化的特征向量,将该特征向量作为当前传感器在该
种气体氛围变化规律模式下的模式观察规律特征向量;
[0016] S202、执行条件:将需要进行数据训练拼接的不同传感器观测数据,即多模态数据,进行数据融合,利用基于步骤S201特征向量的基础上,对传感器测量数据与特征向量进
行按位乘法运算,并将计算后所得到的结果进行数据拼接,得到气体氛围变化规律传感器
特征向量空间下的恶臭污染因子特征空间数据模型;
[0017] S203、校准拼接:利用已知气体变化氛围,结合各个传感器观察结果变化规律,修改当前传感器监测数据结果的特征向量空间;将优化修改后的数据与特征向量相乘,将结
果拼接到数据模型后部;使得拼接后的数据训练模型,越靠后的记录,数据特征向量利用的
为最新数据变化特征向量;
[0018] S204、有损拼接:对于部分传感器对某些种物质无有效响应的情况,在数据处理时,将特征向量非零特征值相同的特征值进行单独记录,通过快速特征向量0值检索,快速
进行污染因子种类判别。
[0019] 进一步的,步骤S2所述调整本次标定权值的方法采用动态权重系数算法,根据仪器标定时间动态计算模型输出算法权重系数;具体包括:
[0020] S211、存储策略:在传感器采集到数据进行数据拼接后,将数据读取时间进行记录,在时间存储的同时记录标识数据失效时间以及衰减系数;
[0021] S212、模型计算:在利用LDA进行数据降维分析、计算类别均值时,增加时间衰减函数进行计算;在计算全局样本均值时,同样利用衰减函数,对数据进行衰减盘点,同时读取
数据失效时间信息,判断数据信息是否可以继续作为全局样本继续作为有效数据。
[0022] 更进一步的,步骤S212中所述利用LDA进行数据降维分析的具体方法为:
[0023] (1)计算各传感器不同气体氛围下的AD值均值ui,计算所有传感器AD值u;
[0024] (2)计算历史有效数据在衰减函数作用后的散度矩阵Sw,计算所有传感器衰减函数作用后的散度矩阵St,传感器之间的散度矩阵Sb;
[0025] (3)对矩阵Sw‑1Sb做特征分解;
[0026] (4)取最大d'个特征值所对应的特征向量;
[0027] (5)计算投影矩阵;
[0028] (6)计算投影坐标系;
[0029] 衰减函数表示为:
[0030] Y=ek‑i*p*Xi+q
[0031] 其中Y为衰减运算后AD值均值,k为时间衰减系数,p为传感器原始衰减比例,q为传感器衰减调整值,Xi为拼接调整后存储训练集中数据向量。
[0032] 进一步的,步骤S3所述矫正计算采用标定矫正模型算法,具体包括:
[0033] S301、利用已经经过LDA处理过的坐标信息对当前标定结果进行重新判断,判断依照当前校准信息,能否对当前恶臭因子进行判断,如果可以进行判断,且新生成数据结果到
各坐标轴间距离方差小于阈值系数,则认定该模型可用;
[0034] S302、否则进入重新调整阶段,通过贪婪算法,调整权值系数,使得边距方差阈值小于给定的阈值系数;则将该模型作为新校正后的模型进行使用。
[0035] 本发明另一方面还提出了一种基于多传感器快速学习的气体种类识别系统,包括:模型构建模块,用于构建基础气体识别模型库;向测试传感器阵列所在的气室内分别通
入不同浓度和不同种类的待测气体,采集传感器数据进行LDA数据处理,得到气体种类映射
坐标系,再在该坐标系下,根据不同气体浓度变化,建立浓度坐标系;建立好的坐标系作为
基础气体识别模型库;
[0036] 标定模块,用于标定调整分类坐标系模型:根据当前标定与前次标定之间的时间差,调整本次标定权值,再将新标定得到的传感器数据信息拼接到原有数据队列后面,再在
现有拼接后的队列基础上,计算LDA新坐标;
[0037] 矫正模块,用于矫正调整模型:在新坐标实现后,根据现有标定数据,对模型进行矫正计算;利用增加数据列后的模型对当前标定气体进行识别,根据识别后数据在新坐标
系下坐标与现有气体分类数据重心差值,调整坐标系;通过对坐标系进行反复调整,使得利
用LDA算法生成的坐标系可以对气体进行有效分类。
[0038] 进一步的,所述标定模块设有多模态数据拼接融合单元,包括:
[0039] 前置条件子单元:利用多台仪器,采集传感器在规定状态污染物氛围内,传感器采集值变化规律,包括传感器采集值定时间段内AD值变化均量,定时间段内传感器方差偏移
量,定时间段内传感器AD值中心距变化量,并结合气体氛围变化规律,根据传感器AD值数据
计算出该种传感器在当前气体氛围种变化的特征向量,将该特征向量作为当前传感器在该
种气体氛围变化规律模式下的模式观察规律特征向量;
[0040] 执行条件子单元:将需要进行数据训练拼接的不同传感器观测数据,即多模态数据,进行数据融合,利用基于前置条件子单元的特征向量的基础上,对传感器测量数据与特
征向量进行按位乘法运算,并将计算后所得到的结果进行数据拼接,得到气体氛围变化规
律传感器特征向量空间下的恶臭污染因子特征空间数据模型;
[0041] 校准拼接子单元:利用已知气体变化氛围,结合各个传感器观察结果变化规律,修改当前传感器监测数据结果的特征向量空间;将优化修改后的数据与特征向量相乘,将结
果拼接到数据模型后部;使得拼接后的数据训练模型,越靠后的记录,数据特征向量利用的
为最新数据变化特征向量;
[0042] 有损拼接子单元:对于部分传感器对某些种物质无有效响应的情况,在数据处理时,将特征向量非零特征值相同的特征值进行单独记录,通过快速特征向量0值检索,快速
进行污染因子种类判别。
[0043] 进一步的,所述标定模块还设有动态权重系数单元,用于根据仪器标定时间动态计算模型输出算法权重系数;具体包括:
[0044] 存储策略子单元:在传感器采集到数据进行数据拼接后,将数据读取时间进行记录,在时间存储的同时记录标识数据失效时间以及衰减系数;
[0045] 模型计算子单元:在利用LDA进行数据降维分析、计算类别均值时,增加时间衰减函数进行计算;在计算全局样本均值时,同样利用衰减函数,对数据进行衰减盘点,同时读
取数据失效时间信息,判断数据信息是否可以继续作为全局样本继续作为有效数据。
[0046] 更进一步的,模型计算子单元中利用LDA进行数据降维分析:
[0047] (1)计算各传感器不同气体氛围下的AD值均值ui,计算所有传感器AD值u;
[0048] (2)计算历史有效数据在衰减函数作用后的散度矩阵Sw,计算所有传感器衰减函数作用后的散度矩阵St,传感器之间的散度矩阵Sb;
[0049] (3)对矩阵Sw‑1Sb做特征分解;
[0050] (4)取最大d'个特征值所对应的特征向量;
[0051] (5)计算投影矩阵;
[0052] (6)计算投影坐标系;
[0053] 衰减函数表示为:
[0054] Y=ek‑i*p*Xi+q
[0055] 其中Y为衰减运算后AD值均值,k为时间衰减系数,p为传感器原始衰减比例,q为传感器衰减调整值,Xi为拼接调整后存储训练集中数据向量。
[0056] 进一步的,所述矫正模块设有标定矫正模型单元,具体包括:
[0057] 判断子单元:利用已经经过LDA处理过的坐标信息对当前标定结果进行重新判断,判断依照当前校准信息,能否对当前恶臭因子进行判断,如果可以进行判断,且新生成数据
结果到各坐标轴间距离方差小于阈值系数,则认定该模型可用;
[0058] 重调整子单元:进入重新调整阶段,通过贪婪算法,调整权值系数,使得边距方差阈值小于给定的阈值系数;则将该模型作为新校正后的模型进行使用。
[0059] 与现有技术相比,本发明具有如下的有益效果:
[0060] 1、减低了模型训练的时间复杂度和空间复杂度,降低了运算量,降低了模型运算时所需要的硬件处理能力;
[0061] 2、提高了生产效率,避免了需要为所有设备都进行多次标定以获取大量模型数据的问题;
[0062] 3、提高了气体识别的准确性,增加了模型矫正能力。

附图说明

[0063] 图1是本发明实施例的部分原始数据训练集截图;
[0064] 图2是本发明实施例的恶臭因子分析数据模型的部分数据集截图;
[0065] 图3是本发明实施例的直接拼接后的数据分析模型训练集的部分数据截图;
[0066] 图4是本发明实施例的校准拼接和动态权重系数调整后的压缩拼接后的数据集的部分数据截图;
[0067] 图5是本发明实施例的衰减后数据特征向量组的部分数据截图;
[0068] 图6是本发明实施例的新采集数据在投影坐标系下的坐标数据的部分数据截图。

具体实施方式

[0069] 需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
[0070] 为使本发明专利的目的、特征更明显易懂,下面结合附图对本发明专利的具体实施方式作进一步的说明。需说明的是,附图均采用非常简化的形式且均使用非精准的比率,
仅用以方便、明晰地辅助说明本发明专利实施例的目的。
[0071] 下面结合附图对本发明的具体实施做进一步的详细说明。
[0072] 本发明所提出的基于多传感器快速学习的气体种类识别方法和系统,包括:
[0073] 一、构建基础气体识别模型库:向测试传感器所在的气室内分别通入不同浓度和不同种类的待测气体,通过内部电路采集功能,对传感器数据进行采集和统计,根据不同种
类的气体,进行LDA数据处理,得到气体种类映射坐标系,再在该坐标系下,根据不同气体浓
度变化,建立浓度坐标系。将建立好的坐标系存储在仪器内,作为基础气体识别模型库。
[0074] 二、标定调整分类坐标系模型:根据当前标定与前次标定之间的时间差,调整本次标定权值,再将新标定得到的传感器数据信息拼接到原有数据队列后面,再在现有拼接后
的队列基础上,计算LDA新坐标,进而实现ONE‑SHOT学习的目的。
[0075] 三、矫正调整模型:在新坐标实现后,根据现有标定数据,对模型进行矫正计算。利用增加数据列后的模型对当前标定气体进行识别,根据识别后数据在新坐标系下坐标与现
有气体分类数据重心差值,调整坐标系。
[0076] 通过对坐标系进行反复调整,使得利用LDA算法生成的坐标系可以对气体进行有效分类,同时利用标定时的一次学习机会,通过调整数据拼接,权值调整和模型矫正的方
法,实现小样本学习的效果。
[0077] 在上述过程中使用了三大算法:
[0078] 1、模型数据拼接算法,即利用标定时监测得到的数据拼接在模型数据后,作为整体训练模型使用;
[0079] 2、动态权重系数算法,根据仪器标定时间动态计算模型输出算法权重系数;
[0080] 3、标定矫正模型算法,在系统标定稳定后,结合计算得到的新模型,重新校验系统自身模型,降低模型数据灵敏度。
[0081] 对于这三种算法的具体内容价绍如下:
[0082] 1、多模态数据拼接融合算法:
[0083] 由于恶臭监测设备利用传感器阵列计算对恶臭污染因子及恶臭污染趋势进行污染监测,不同传感器对不同恶臭污染因子响应规律是不一样的,具有一定的多模态性,因此
将具有多模态性数据进行融合,得出恶臭因子分析模型,便是恶臭因子数据分析需要解决
的基础技术问题。同时还需要解决由于传感器工作原理特点,传感器对不同物质可能出现
不反应的现象,进而导致多模态数据不完整的情况。
[0084] 多模态数据拼接融合算法主要以传感器为分析研究对象,分析讨论不同传感器在不同恶臭污染物质作用的情况下,监测数据变化的情况,并对所出现的情况进行进行数据
融合分析。
[0085] 具体方法为:(1)前置条件:利用多台仪器,采集传感器在规定状态污染物氛围内,传感器采集值变化规律,包括传感器采集值定时段内AD值变化均量,定时间段内传感器方
差偏移量,定时间段内传感器AD值中心距变化量等数据,并结合气体氛围变化规律,根据传
感器AD值数据计算出该种传感器在当前气体氛围种变化的特征向量,将该特征向量作为当
前传感器在该种气体氛围变化规律模式下的模式观察规律特征向量;(2)执行条件:将需要
进行数据训练拼接的不同传感器观测数据(即多模态数据)进行数据融合,利用基于前一步
特征向量的基础上,对传感器测量数据与特征向量进行按位乘法运算,并将计算后所得到
的结果进行数据拼接,得到气体氛围变化规律传感器特征向量空间下的恶臭污染因子特征
空间数据模型。(3)校准拼接:在校准模式下,利用已知气体变化氛围,结合各个传感器观察
结果(多模态监测数据)变化规律,修改当前传感器监测数据结果的特征向量空间。将优化
修改后的数据与特征向量相乘,将结果拼接到数据模型后部。使得拼接后的数据训练模型,
越靠后的记录,数据特征向量利用的为最新数据变化特征向量。(4)有损拼接:对于部分传
感器对某些种物质无有效响应的情况,该拼接算法在数据处理时,将特征向量非零特征值
相同的特征值进行单独记录,可以通过快速特征向量0值检索,快速进行污染因子种类判
别。
[0086] 2、动态权重系数算法,根据仪器标定时间动态计算模型输出算法权重系数;在数据拼接完成后,需要对数据记录表中的数据变化规律进行模型建立,在模型建立过程中,需
要根据系统中存储的数据内容以及对应数据内容的获取时间,对数据集进行优化调整,避
免由于传感器变化,导致历史久远的数据对当前数据造成影响。因此本算法利用传感器数
据集中数据获取的时间,结合数据可信度衰减函数,对数据进行优化处理。提高数据的可用
度。
[0087] 具体方法为:(1)存储策略:在传感器采集到数据进行数据拼接后,将数据读取时间进行记录,在时间存储的同时记录标识数据失效时间以及衰减系数。(2)模型计算:在利
用LDA进行数据降维分析,计算类别均值时,增加时间衰减函数进行计算。在计算全局样本
均值时,同样利用衰减函数,对数据进行衰减盘点,同时读取数据失效时间信息,判断数据
信息是否可以继续作为全局样本继续作为有效数据。
[0088] 其中,LDA降维方法为:
[0089] (2.1)计算各传感器不同气体氛围下的AD值均值ui,计算所有传感器AD值u;
[0090] (2.2)计算历史有效数据在衰减函数作用后的散度矩阵Sw,计算所有传感器衰减函数作用后的散度矩阵St,传感器之间的散度矩阵Sb;
[0091] (2.3)对矩阵Sw‑1Sb做特征分解;
[0092] (2.4)取最大d'个特征值所对应的特征向量;
[0093] (2.5)计算投影矩阵;
[0094] (2.6)计算投影坐标系;
[0095] 衰减系数函数表示:
[0096] Y=ek‑i*p*Xi+q
[0097] 其中Y为衰减运算后AD值均值,k为时间衰减系数,p为传感器原始衰减比例,q为传感器衰减调整值,Xi为拼接调整后存储训练集中数据向量。
[0098] 3、标定矫正模型算法,在系统标定稳定后,结合计算得到的新模型,重新校验系统自身模型,降低模型数据灵敏度。
[0099] 具体方法为:(1)利用已经经过LDA处理过的坐标信息对当前标定结果进行重新判断,判断依照当前校准信息,能否对当前恶臭因子进行判断,如果可以进行判断,且新生成
数据结果到各坐标轴间距离方差小于阈值系数,则认定该模型可用。(2)否则进入重新调整
阶段,通过贪婪算法,调整权值系数,使得边距方差阈值小于给定的阈值系数。则可将该模
型作为新校正后的模型进行使用。
[0100] 下面是具体应用本发明的方法的具体实施例。
[0101] 如图1所示的表格内为部分原始数据训练集截图,原始数据为数据采集原始值,纵向为各个通道原始AD值,依时间次序进行排列。
[0102] 如图2为恶臭因子分析数据模型的部分数据集,将图1的时间次序数据进行加权平均,并根据列向量数据作为单次统计量,根据传统计算公式,进行传感器方差偏移量以及中
心距计算。根据计算结果修正测量数据,将计算的方差值和中心距作为向量值,一次存入对
应传感器AD测量值数据后面,再将所有传感器依照上述方法所得数据,按仪器规定的顺序
进行排列。将排列好的数据进行指纹图谱模型计算,结合现有污染场景指纹图谱数据,利用
图谱的特征向量乘以图1表中的行向量,得到图2的数据。
[0103] 一段时间后,通过标定新得到的数据依照上面所述的方法,通过计算数据方差和中心距增加数据统计量,之后再利用特征向量,计算当前环境下调整后的AD值,拼接在现有
数据后面,得到如图3所示的直接拼接后的数据分析模型训练集,图3为部分数据。
[0104] 根据本发明方法中的衰减函数公式,对图3直接拼接后的表格数据进行计算,以数据行向量为一组向量,利用衰减公式,对直接所得的原始数据中的数据进行计算,将计算后
的结果放入表格的原位置(表中数据间隔以等时间间隔为数据记录间隔)。进而得到利用衰
减公式、计算衰减后的数据模型队列,即得到图4,校准拼接、和动态权重系数调整后的压缩
拼接后的数据集,图4所示为部分数据。
[0105] 然后利用前一步所述的衰减后的数据,求取数据的特征向量,其中每一列为一组特征向量,如图5表格中所示数据,将特征向量进行组合,组成LDA变换矩阵,作为后续采集
时数据获取后的变换矩阵,进而得到数据投影坐标系。
[0106] 将新采集到的数据,与上一步投影坐标系相乘,求得采集数据在投影坐标系下的坐标数据,如图6所示,再通过数据分类,实现目标算法。
[0107] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。