一种基于深度学习的在产化工园区环境污染风险评估方法转让专利

申请号 : CN202310645532.X

文献号 : CN116384754B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 韩亚萌郭丽莉王蓓丽李书鹏杨旭宋倩李亚秀张孟昭许铁柱

申请人 : 北京建工环境修复股份有限公司

摘要 :

本发明公开了一种基于深度学习的在产化工园区环境污染风险评估方法,包括:获取目标在产化工园区的多源数据,根据多源数据获取污染物类别信息,并读取各类别污染物对应污染源的空间分布;根据预设时间内多源数据时序序列获取主要污染物,基于图卷积神经网络提取园区范围内污染的时空融合特征;基于深度学习构建在产化工园区的环境污染评估模型,根据时空融合特征进行训练;获取目标在产化工园区的实时多源数据,生成当前目标在产化工园区污染的风险评估等级。本发明通过获取时空融合特征,分析各污染特征的潜在关联,实现精确的在产化工园区的环境污染风险评估,为化工园区早期的污染预防和污染治理提供数据基础,防止对环境造成更深度的污染。

权利要求 :

1.一种基于深度学习的在产化工园区环境污染风险评估方法,其特征在于,包括以下步骤:获取目标在产化工园区的多源数据,根据所述多源数据获取污染物类别信息,并读取各类别污染物对应污染源的空间分布;

将所述多源数据进行预处理,生成预设时间内多源数据时序序列获取主要污染物,基于图卷积神经网络提取园区范围内污染的时序特征及空间特征,将所述时序特征及空间特征进行融合获取时空融合特征;

基于深度学习构建在产化工园区的环境污染评估模型,根据所述时空融合特征进行训练;

获取目标在产化工园区的实时多源数据,进行数据分析处理完成特征提取与分类,生成当前目标在产化工园区污染的风险评估等级;

基于图卷积神经网络提取园区范围内污染的时序特征及空间特征,具体为:

根据目标在产化工园区中各格栅区域构建无向图,将格栅区域节点对应的主要污染物、土壤岩性及气象特征作为无向图中各格栅区域节点的附加特征;

计算各格栅区域节点的特征相似度选取邻接格栅区域节点,构建相似度邻接矩阵,计算各格栅区域节点的欧式距离获取,选取符合距离要求的格栅区域节点构建距离邻接矩阵;

根据不同格栅区域之间的皮尔逊相关系数作为格栅区域节点的聚合权重,通过特征传递和特征聚合机制利用相似度邻接矩阵及距离邻接矩阵分别生成主要污染物的空间特征;

利用时间卷积神经网络设置时序特征提取层,在时序特征提取层中引入空洞卷积并使用残差网络进行连接,设置与格栅区域节点相同的卷积核,利用不同邻接矩阵进行图卷积的输出提取主要污染物浓度时序序列的时序特征;

引入注意力机制,设置注意力机制融合模块,将时序特征及空间特征进行融合,并将相似度邻接矩阵及距离邻接矩阵对应的融合特征进行合并,生成时空融合特征。

2.根据权利要求1所述的一种基于深度学习的在产化工园区环境污染风险评估方法,其特征在于,根据所述多源数据获取污染物类别信息,并读取各类别污染物对应污染源的空间分布,具体为:收集目标在产化工园区的多源数据,所述多源数据包括园区企业类型、企业生产信息、企业数量及园区水资源、土壤和大气的环境数据,所述环境数据包括水资源、土壤和大气中的污染物及污染物浓度信息;

读取多源数据中的企业相关信息,通过分词处理获取若干词向量,根据所述词向量获取污染物关键词,根据所述污染物关键词获取污染物类别信息与企业进行关联,为企业设置污染物类别标签;

获取各企业地理位置信息,将园区区域划分为若干格栅区域,根据企业的地理位置信息判断所属格栅区域,在格栅区域中进行标记,生成污染源位置标记,获取各类别污染物对应污染的空间分布;

将格栅区域中企业的污染物类别标签进行去重操作后作为所述格栅区域的污染物类别标签,并根据园区水资源、土壤和大气的环境数据进行污染物类别标签的验证及修正。

3.根据权利要求2所述的一种基于深度学习的在产化工园区环境污染风险评估方法,其特征在于,获取各格栅区域的主要污染物,具体为:获取各格栅区域预设时间内的多源数据时序序列,提取各格栅区域中不同类别污染物的浓度时序序列;

根据不同格栅区域中不同类别污染物的浓度时序序列计算不同格栅区域的皮尔逊相关系数,当两格栅区域中的某种污染物浓度对应皮尔逊相关系数大于预设阈值且有一格栅区域的污染物类别标签不包括该种污染物,则在此格栅区域中增设污染物类别标签;

遍历所有格栅区域,更新格栅区域的污染物类别标签,根据更新后的污染物类别标签确定各格栅区域的主要污染物。

4.根据权利要求1所述的一种基于深度学习的在产化工园区环境污染风险评估方法,其特征在于,基于深度学习构建在产化工园区的环境污染评估模型,具体为:根据各格栅区域的主要污染物及对应的污染物浓度信息获取目标在产化工园区的污染物分布;

通过数据检索根据预设时间内多源数据时序序列获取历史污染物分布及对应的时空融合特征,根据目标在产化工园区的历史污染物分布及对应的时空融合特征构建训练集,对LSTM网络进行训练;

当LSTM网络的输出精度符合预设标准时,则输出训练后的LSTM网络,基于目标在产化工园区的当前污染物分布获取预设时间后的污染物分布。

5.根据权利要求4所述的一种基于深度学习的在产化工园区环境污染风险评估方法,其特征在于,基于深度学习构建在产化工园区的环境污染评估模型,还包括:基于LSTM网络结合模糊综合分析构建在产化工园区的环境污染评估模型,获取目标在产化工园区的主要污染物、地理位置信息及地质水文信息作为园区特征;

根据所述园区特征获取敏感目标,基于所述敏感目标构建数据检索任务,在预设数据检索空间中通过相似度计算获取环境风险因素数据集,对所述环境风险因素数据集进行统计分析;

根据预设数量选取相似度及使用频率大于预设阈值的环境风险因素,确定评价指标,并根据层次分析法生成评价指标的权重信息;

根据所述评价指标构成模糊综合评价的风险评价集,预设目标在产化工园区污染的风险评估等级,根据三角函数判断评价因素对于各个评价等级的隶属度,得到隶属度矩阵;

根据所述隶属度矩阵及指标权重计算目标层中模糊综合评价结果,生成目标在产化工园区污染的风险评估等级。

6.根据权利要求5所述的一种基于深度学习的在产化工园区环境污染风险评估方法,其特征在于,根据预设时间后的污染物分布生成预警信息,具体为:通过目标在产化工园区的历史污染物分布获取预设时间步长的污染物分布变化特征,根据所述预设时间步长的污染物分布变化特征获取预设时间后的污染物分布的标准值;

获取预设时间的预测污染物分布,当所述预测污染物分布与所述污染物分布的标准值进行对比,获取污染物分布偏差;

当所述污染物分布偏差大于预设偏差阈值,则生成对应污染物的预警信息;

根据所述预警信息确定对应的格栅区域,根据格栅区域的地理水文信息及位置信息生成污染物治理措施。

7.根据权利要求1所述的一种基于深度学习的在产化工园区环境污染风险评估方法,其特征在于,还包括:基于数字孪生将目标在产化工园区的物理模型映射到三维孪生体模型,构建三维可视化模型,根据所述三维可视化模型进行特征分析、环境风险评价及数据管理;

通过所述三维可视化模型对目标在产化工园区进行监测,获取各类别预警信息及新增污染物、污染源信息。

说明书 :

一种基于深度学习的在产化工园区环境污染风险评估方法

技术领域

[0001] 本发明涉及环境污染风险评估技术领域,更具体的,涉及一种基于深度学习的在产化工园区环境污染风险评估方法。

背景技术

[0002] 近年来,随着我国经济的高速发展,化工企业数量不断增加,建立了大量的化工园区,由于化工企业使用化学物品比较多,生产工艺比较复杂,除了使用大量的化学原料之外,在生产过程中还会产生多种副产物。生产过程中产生的“三废”成分复杂、数量大,产生的废水、废渣、废气等可能对环境造成长期、潜在的危害或直接对人群的健康造成影响。及时对在产化工园区的环境污染风险进行评估,可以为化工园区早期的污染预防和污染治理提供技术支撑,防止对环境造成更深度的污染。由于化工园区的环境风险具有复杂性、综合性和不确定性,目前还未有报道对在产化工园区环境污染风险评估方法。
[0003] 对于在产化工园区环境污染风险评估,有助于了解化工园区区域内环境状况,为区域内环境治理提供重要的数据参考。现阶段,在环境污染风险评估中,根据现有特征指标进行污染风险评估往往只考虑指标自身特征,而大量污染特征之间存在众多潜在关联,潜在关联有助于实现更准确的污染风险评估。因此,在在产化工园区环境污染风险评估中如何通过深度学习获取各评估数据的关联特征实现精准评估是亟不可待需要解决的问题。

发明内容

[0004] 为了解决上述技术问题,本发明提出了涉及一种基于深度学习的在产化工园区环境污染风险评估方法。
[0005] 本发明第一方面提供了一种基于深度学习的在产化工园区环境污染风险评估方法,包括:
[0006] 获取目标在产化工园区的多源数据,根据所述多源数据获取污染物类别信息,并读取各类别污染物对应污染源的空间分布;
[0007] 将所述多源数据进行预处理,生成预设时间内多源数据时序序列获取主要污染物,基于图卷积神经网络提取园区范围内污染的时序特征及空间特征,将所述时序特征及空间特征进行融合获取时空融合特征;
[0008] 基于深度学习构建在产化工园区的环境污染评估模型,根据所述时空融合特征进行训练;
[0009] 获取目标在产化工园区的实时多源数据,进行数据分析处理完成特征提取与分类,生成当前目标在产化工园区污染的风险评估等级。
[0010] 本方案中,根据所述多源数据获取污染物类别信息,并读取各类别污染物对应污染源的空间分布,具体为:
[0011] 收集目标在产化工园区的多源数据,所述多源数据包括园区企业类型、企业生产信息、企业数量及园区水资源、土壤和大气的环境数据,所述环境数据包括水资源、土壤和大气中的污染物及污染物浓度信息;
[0012] 读取多源数据中的企业相关信息,通过分词处理获取若干词向量,根据所述词向量获取污染物关键词,根据所述污染物关键词获取污染物类别信息与企业进行关联,为企业设置污染物类别标签;
[0013] 获取各企业地理位置信息,将园区区域划分为若干格栅区域,根据企业的地理位置信息判断所属格栅区域,在格栅区域中进行标记,生成污染源位置标记,获取各类别污染物对应污染的空间分布;
[0014] 将格栅区域中企业的污染物类别标签进行去重操作后作为所述格栅区域的污染物类别标签,并根据园区水资源、土壤和大气的环境数据进行污染物类别标签的验证及修正。
[0015] 本方案中,获取各格栅区域的主要污染物,具体为:
[0016] 获取各格栅区域预设时间内的多源数据时序序列,提取各格栅区域中不同类别污染物的浓度时序序列;
[0017] 根据不同格栅区域中不同类别污染物的浓度时序序列计算不同格栅区域的皮尔逊相关系数,当两格栅区域中的某种污染物浓度对应皮尔逊相关系数大于预设阈值且有一格栅区域的污染物类别标签不包括该种污染物,则在此格栅区域中增设污染物类别标签;
[0018] 遍历所有格栅区域,更新格栅区域的污染物类别标签,根据更新后的污染物类别标签确定各格栅区域的主要污染物。
[0019] 本方案中,基于图卷积神经网络提取园区范围内污染的时序特征及空间特征,具体为:
[0020] 根据目标在产化工园区中各格栅区域构建无向图,将格栅区域节点对应的主要污染物、土壤岩性及气象特征作为无向图中各格栅区域节点的附加特征;
[0021] 计算各格栅区域节点的特征相似度选取邻接格栅区域节点,构建相似度邻接矩阵,计算各格栅区域节点的欧式距离获取,选取符合距离要求的格栅区域节点构建距离邻接矩阵;
[0022] 根据不同格栅区域之间的皮尔逊相关系数作为格栅区域节点的聚合权重,通过特征传递和特征聚合机制利用相似度邻接矩阵及距离邻接矩阵分别生成主要污染物的空间特征;
[0023] 利用时间卷积神经网络设置时序特征提取层,在时序特征提取层中引入空洞卷积并使用残差网络进行连接,设置与格栅区域节点相同的卷积核,利用不同邻接矩阵进行图卷积的输出提取主要污染物浓度时序序列的时序特征;
[0024] 引入注意力机制,设置注意力机制融合模块,将时序特征及空间特征进行融合,并将相似度邻接矩阵及距离邻接矩阵对应的融合特征进行合并,生成时空融合特征。
[0025] 本方案中,基于深度学习构建在产化工园区的环境污染评估模型,具体为:
[0026] 根据各格栅区域的主要污染物及对应的污染物浓度信息获取目标在产化工园区的污染物分布;
[0027] 通过数据检索根据预设时间内多源数据时序序列获取历史污染物分布及对应的时空融合特征,根据目标在产化工园区的历史污染物分布及对应的时空融合特征构建训练集,对LSTM网络进行训练;
[0028] 当LSTM网络的输出精度符合预设标准时,则输出训练后的LSTM网络,基于目标在产化工园区的当前污染物分布获取预设时间后的污染物分布。
[0029] 本方案中,基于深度学习构建在产化工园区的环境污染评估模型,还包括:
[0030] 基于LSTM网络结合模糊综合分析构建在产化工园区的环境污染评估模型,获取目标在产化工园区的主要污染物、地理位置信息及地质水文信息作为园区特征;
[0031] 根据所述园区特征获取敏感目标,基于所述敏感目标构建数据检索任务,在预设数据检索空间中通过相似度计算获取环境风险因素数据集,对所述环境风险因素数据集进行统计分析;
[0032] 根据预设数量选取相似度及使用频率大于预设阈值的环境风险因素,确定评价指标,并根据层次分析法生成评价指标的权重信息;
[0033] 根据所述评价指标构成模糊综合评价的风险评价集,预设目标在产化工园区污染的风险评估等级,根据三角函数判断评价因素对于各个评价等级的隶属度,得到隶属度矩阵;
[0034] 根据所述隶属度矩阵及指标权重计算目标层中模糊综合评价结果,生成目标在产化工园区污染的风险评估等级。
[0035] 本方案中,根据预设时间后的污染物分布生成预警信息,具体为:
[0036] 通过目标在产化工园区的历史污染物分布获取预设时间步长的污染物分布变化特征,根据所述预设时间步长的污染物分布变化特征获取预设时间后的污染物分布的标准值;
[0037] 获取预设时间的预测污染物分布,当所述预测污染物分布与所述污染物分布的标准值进行对比,获取污染物分布偏差;
[0038] 当所述污染物分布偏差大于预设偏差阈值,则生成对应污染物的预警信息;
[0039] 根据所述预警信息确定对应的格栅区域,根据格栅区域的地理水文信息及位置信息生成污染物治理措施。
[0040] 本方案中,还包括:基于数字孪生将目标在产化工园区的物理模型映射到三维孪生体模型,构建三维可视化模型,根据所述三维可视化模型进行特征分析、环境风险评价及数据管理;
[0041] 通过所述三维可视化模型对目标在产化工园区进行监测,获取各类别预警信息及新增污染物、污染源信息。
[0042] 本发明第二方面还提供了基于深度学习的在产化工园区环境污染风险评估系统,该系统包括:存储器、处理器,所述存储器中包括基于深度学习的在产化工园区环境污染风险评估方法程序,所述基于深度学习的在产化工园区环境污染风险评估方法程序被所述处理器执行时实现如下步骤:
[0043] 获取目标在产化工园区的多源数据,根据所述多源数据获取污染物类别信息,并读取各类别污染物对应污染源的空间分布;
[0044] 将所述多源数据进行预处理,生成预设时间内多源数据时序序列获取主要污染物,基于图卷积神经网络提取园区范围内污染的时序特征及空间特征,将所述时序特征及空间特征进行融合获取时空融合特征;
[0045] 基于深度学习构建在产化工园区的环境污染评估模型,根据所述时空融合特征进行训练;
[0046] 获取目标在产化工园区的实时多源数据,进行数据分析处理完成特征提取与分类,生成当前目标在产化工园区污染的风险评估等级。
[0047] 本发明公开了一种基于深度学习的在产化工园区环境污染风险评估方法,包括:获取目标在产化工园区的多源数据,根据多源数据获取污染物类别信息,并读取各类别污染物对应污染源的空间分布;将多源数据进行预处理,生成预设时间内多源数据时序序列获取主要污染物,基于图卷积神经网络提取园区范围内污染的时序特征及空间特征,进行融合后获取时空融合特征;基于深度学习构建在产化工园区的环境污染评估模型,根据所述时空融合特征进行训练;获取目标在产化工园区的实时多源数据,进行数据分析处理完成特征提取与分类,生成当前目标在产化工园区污染的风险评估等级。本发明通过获取时空融合特征,分析各污染特征的潜在关联,实现精确的在产化工园区的环境污染风险评估,为化工园区早期的污染预防和污染治理提供数据基础,防止对环境造成更深度的污染。

附图说明

[0048] 图1示出了本发明一种基于深度学习的在产化工园区环境污染风险评估方法的流程图;
[0049] 图2示出了本发明提取园区范围内污染时空融合特征的方法流程图;
[0050] 图3示出了本发明构建环境污染评估模型生成风险评估等级的方法流程图;
[0051] 图4示出了本发明一种基于深度学习的在产化工园区环境污染风险评估系统的框图。

具体实施方式

[0052] 为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
[0053] 在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
[0054] 图1示出了本发明一种基于深度学习的在产化工园区环境污染风险评估方法的流程图。
[0055] 如图1所示,本发明第一方面提供了一种基于深度学习的在产化工园区环境污染风险评估方法,包括:
[0056] S102,获取目标在产化工园区的多源数据,根据所述多源数据获取污染物类别信息,并读取各类别污染物对应污染源的空间分布;
[0057] S104,将所述多源数据进行预处理,生成预设时间内多源数据时序序列获取主要污染物,基于图卷积神经网络提取园区范围内污染的时序特征及空间特征,将所述时序特征及空间特征进行融合获取时空融合特征;
[0058] S106,基于深度学习构建在产化工园区的环境污染评估模型,根据所述时空融合特征进行训练;
[0059] S108,获取目标在产化工园区的实时多源数据,进行数据分析处理完成特征提取与分类,生成当前目标在产化工园区污染的风险评估等级。
[0060] 需要说明的是,收集目标在产化工园区的多源数据,所述多源数据包括园区企业类型、企业生产信息、企业数量及园区水资源、土壤和大气的环境数据,所述环境数据包括水资源、土壤和大气中的污染物及污染物浓度信息;读取多源数据中的企业相关信息,即企业类型、企业基本信息等数据,通过分词处理获取若干词向量,根据所述词向量获取污染物关键词,根据所述污染物关键词获取污染物类别信息与企业进行关联,为企业设置污染物类别标签,一个企业能够包括多个污染物类别标签;获取各企业地理位置信息,将园区区域划分为若干格栅区域,根据企业的地理位置信息判断所属格栅区域,在格栅区域中进行标记,生成污染源位置标记,获取各类别污染物对应污染的空间分布;将格栅区域中企业的污染物类别标签进行重复标签去除操作后作为所述格栅区域的污染物类别标签,并根据园区水资源、土壤和大气的环境数据进行污染物类别标签的验证及修正,当环境数据中含有某污染物类别标签对应的污染物,则验证成功,若没有,则进行补充或删除。
[0061] 图2示出了本发明提取园区范围内污染时空融合特征的方法流程图。
[0062] 根据本发明实施例,基于图卷积神经网络提取园区范围内污染的时序特征及空间特征,具体为:
[0063] S202,根据目标在产化工园区中各格栅区域构建无向图,将格栅区域节点对应的主要污染物、土壤岩性及气象特征作为无向图中各格栅区域节点的附加特征;
[0064] S204,计算各格栅区域节点的特征相似度选取邻接格栅区域节点,构建相似度邻接矩阵,计算各格栅区域节点的欧式距离获取,选取符合距离要求的格栅区域节点构建距离邻接矩阵;
[0065] S206,根据不同格栅区域之间的皮尔逊相关系数作为格栅区域节点的聚合权重,通过特征传递和特征聚合机制利用相似度邻接矩阵及距离邻接矩阵分别生成主要污染物的空间特征;
[0066] S208,利用时间卷积神经网络设置时序特征提取层,在时序特征提取层中引入空洞卷积并使用残差网络进行连接,设置与格栅区域节点相同的卷积核,利用不同邻接矩阵进行图卷积的输出提取主要污染物浓度时序序列的时序特征;
[0067] S210,引入注意力机制,设置注意力机制融合模块,将时序特征及空间特征进行融合,并将相似度邻接矩阵及距离邻接矩阵对应的融合特征进行合并,生成时空融合特征。
[0068] 需要说明的是,将格栅化后的每一个网格视为图上的一个节点,每一个格栅区域对应目标在产化工园区当中的一个具体区域,设置不同的相似度邻接矩阵及距离邻接矩阵充分提取污染物空间关系,另外在空间关系模拟中利用皮尔逊相关系数作为聚合权重,表征邻接格栅区域节点的特征贡献,使得模型更加专注于空间关联大的格栅区域。另外在时间卷积神经网络中引入空洞卷积及残差连接,防止出现过拟合现象并且扩大了感受野,极大的保留了污染物浓度时序序列的时间关联。
[0069] 将多源数据进行数据清洗、筛选等预处理,获取各格栅区域预设时间内的多源数据时序序列,提取各格栅区域中不同类别污染物的浓度时序序列;根据不同格栅区域中不同类别污染物的浓度时序序列计算不同格栅区域的皮尔逊相关系数,当两格栅区域中的某种污染物浓度对应皮尔逊相关系数大于预设阈值且有一格栅区域的污染物类别标签不包括该种污染物,则在此格栅区域中增设污染物类别标签;遍历所有格栅区域,更新格栅区域的污染物类别标签,根据更新后的污染物类别标签确定各格栅区域的主要污染物。
[0070] 图3示出了本发明构建环境污染评估模型生成风险评估等级的方法流程图。
[0071] 根据本发明实施例,基于深度学习构建在产化工园区的环境污染评估模型,还包括:
[0072] S302,基于LSTM网络结合模糊综合分析构建在产化工园区的环境污染评估模型,获取目标在产化工园区的主要污染物、地理位置信息及地质水文信息作为园区特征;
[0073] S304,根据所述园区特征获取敏感目标,基于所述敏感目标构建数据检索任务,在预设数据检索空间中通过相似度计算获取环境风险因素数据集,对所述环境风险因素数据集进行统计分析;
[0074] S306,根据预设数量选取相似度及使用频率大于预设阈值的环境风险因素,确定评价指标,并根据层次分析法生成评价指标的权重信息;
[0075] S308,根据所述评价指标构成模糊综合评价的风险评价集,预设目标在产化工园区污染的风险评估等级,根据三角函数判断评价因素对于各个评价等级的隶属度,得到隶属度矩阵;
[0076] S310,根据所述隶属度矩阵及指标权重计算目标层中模糊综合评价结果,生成目标在产化工园区污染的风险评估等级。
[0077] 需要说明的是,根据园区特征获取敏感目标,例如目标在产化工园区附件的居民区域,需要考虑人体健康风险,土壤中的重金属污染,部分重金属具备迁移属性,需要考虑迁移风险等等。
[0078] 根据各格栅区域的主要污染物及对应的污染物浓度信息获取目标在产化工园区的污染物分布;通过数据检索根据预设时间内多源数据时序序列获取历史污染物分布及对应的时空融合特征,根据目标在产化工园区的历史污染物分布及对应的时空融合特征构建训练集,对LSTM网络进行训练;当LSTM网络的输出精度符合预设标准时,则输出训练后的LSTM网络,基于目标在产化工园区的当前污染物分布获取预设时间后的污染物分布。
[0079] 需要说明的是,根据预设时间后的污染物分布生成预警信息,具体为:通过目标在产化工园区的历史污染物分布获取预设时间步长的污染物分布变化特征,根据所述预设时间步长的污染物分布变化特征获取预设时间后的污染物分布的标准值;获取预设时间的预测污染物分布,当所述预测污染物分布与所述污染物分布的标准值进行对比,获取污染物分布偏差;当所述污染物分布偏差大于预设偏差阈值,则生成对应污染物的预警信息;根据所述预警信息确定对应的格栅区域,根据格栅区域的地理水文信息及位置信息利用大数据手段生成污染物治理措施。
[0080] 获取历史污染物分布时序序列,按照预设时间步长将目标时间段进行拆分,获取各时间步的污染物分布变化特征,获取各时间步的起始时间戳,判断所述起始时间戳污染物对应企业的生产工况;
[0081] 将所述生产工况与时间步的污染物分布变化特征相匹配,存入数据库中,获取污染物对应企业的当前生产工况,利用所述当前生成工况在数据库中进行相似度计算;
[0082] 获取相似度符合预设标准的数据,提取对应的污染物分布变化特征,读取所述污染物分布变化特征的时间戳,选取最新时间戳的污染物分布变化特征进行预设时间后的污染物分布的标准值的计算;
[0083] 若不存在相似度符合预设标准的数据,则获取污染物的类别信息及特征信息,选取相似污染物进行重新检索。
[0084] 需要说明的是,基于数字孪生将目标在产化工园区的物理模型映射到三维孪生体模型,构建三维可视化模型,根据所述三维可视化模型进行特征分析、环境风险评价及数据管理;通过所述三维可视化模型对目标在产化工园区进行监测,获取各类别预警信息及新增污染物、污染源信息。管理人员可以对目标在产化工园区的基本信息、污染物含量、污染物空间分布情况和场地风险情况进行直观的分析,也能够对场地信息进行数字化管理,并以此系统为基础,针对污染情况提出后续场地修复与治理的相关建议与措施,为场地修复与治理工作提供帮助。
[0085] 图4示出了本发明一种基于深度学习的在产化工园区环境污染风险评估系统的框图。
[0086] 本发明第二方面还提供了一种基于深度学习的在产化工园区环境污染风险评估系统4,该系统包括:存储器41、处理器42,所述存储器中包括基于深度学习的在产化工园区环境污染风险评估方法程序,所述基于深度学习的在产化工园区环境污染风险评估方法程序被所述处理器执行时实现如下步骤:
[0087] 获取目标在产化工园区的多源数据,根据所述多源数据获取污染物类别信息,并读取各类别污染物对应污染源的空间分布;
[0088] 将所述多源数据进行预处理,生成预设时间内多源数据时序序列获取主要污染物,基于图卷积神经网络提取园区范围内污染的时序特征及空间特征,将所述时序特征及空间特征进行融合获取时空融合特征;
[0089] 基于深度学习构建在产化工园区的环境污染评估模型,根据所述时空融合特征进行训练;
[0090] 获取目标在产化工园区的实时多源数据,进行数据分析处理完成特征提取与分类,生成当前目标在产化工园区污染的风险评估等级。
[0091] 需要说明的是,收集目标在产化工园区的多源数据,所述多源数据包括园区企业类型、企业生产信息、企业数量及园区水资源、土壤和大气的环境数据,所述环境数据包括水资源、土壤和大气中的污染物及污染物浓度信息;读取多源数据中的企业相关信息,即企业类型、企业基本信息等数据,通过分词处理获取若干词向量,根据所述词向量获取污染物关键词,根据所述污染物关键词获取污染物类别信息与企业进行关联,为企业设置污染物类别标签,一个企业能够包括多个污染物类别标签;获取各企业地理位置信息,将园区区域划分为若干格栅区域,根据企业的地理位置信息判断所属格栅区域,在格栅区域中进行标记,生成污染源位置标记,获取各类别污染物对应污染的空间分布;将格栅区域中企业的污染物类别标签进行重复标签去除操作后作为所述格栅区域的污染物类别标签,并根据园区水资源、土壤和大气的环境数据进行污染物类别标签的验证及修正,当环境数据中含有某污染物类别标签对应的污染物,则验证成功,若没有,则进行补充或删除。
[0092] 根据本发明实施例,基于图卷积神经网络提取园区范围内污染的时序特征及空间特征,具体为:
[0093] 根据目标在产化工园区中各格栅区域构建无向图,将格栅区域节点对应的主要污染物、土壤岩性及气象特征作为无向图中各格栅区域节点的附加特征;
[0094] 计算各格栅区域节点的特征相似度选取邻接格栅区域节点,构建相似度邻接矩阵,计算各格栅区域节点的欧式距离获取,选取符合距离要求的格栅区域节点构建距离邻接矩阵;
[0095] 根据不同格栅区域之间的皮尔逊相关系数作为格栅区域节点的聚合权重,通过特征传递和特征聚合机制利用相似度邻接矩阵及距离邻接矩阵分别生成主要污染物的空间特征;
[0096] 利用时间卷积神经网络设置时序特征提取层,在时序特征提取层中引入空洞卷积并使用残差网络进行连接,设置与格栅区域节点相同的卷积核,利用不同邻接矩阵进行图卷积的输出提取主要污染物浓度时序序列的时序特征;
[0097] 引入注意力机制,设置注意力机制融合模块,将时序特征及空间特征进行融合,并将相似度邻接矩阵及距离邻接矩阵对应的融合特征进行合并,生成时空融合特征。
[0098] 需要说明的是,将格栅化后的每一个网格视为图上的一个节点,每一个格栅区域对应目标在产化工园区当中的一个具体区域,设置不同的相似度邻接矩阵及距离邻接矩阵充分提取污染物空间关系,另外在空间关系模拟中利用皮尔逊相关系数作为聚合权重,表征邻接格栅区域节点的特征贡献,使得模型更加专注于空间关联大的格栅区域。另外在时间卷积神经网络中引入空洞卷积及残差连接,防止出现过拟合现象并且扩大了感受野,极大的保留了污染物浓度时序序列的时间关联。
[0099] 将多源数据进行数据清洗、筛选等预处理,获取各格栅区域预设时间内的多源数据时序序列,提取各格栅区域中不同类别污染物的浓度时序序列;根据不同格栅区域中不同类别污染物的浓度时序序列计算不同格栅区域的皮尔逊相关系数,当两格栅区域中的某种污染物浓度对应皮尔逊相关系数大于预设阈值且有一格栅区域的污染物类别标签不包括该种污染物,则在此格栅区域中增设污染物类别标签;遍历所有格栅区域,更新格栅区域的污染物类别标签,根据更新后的污染物类别标签确定各格栅区域的主要污染物。
[0100] 根据本发明实施例,基于深度学习构建在产化工园区的环境污染评估模型,还包括:
[0101] 基于LSTM网络结合模糊综合分析构建在产化工园区的环境污染评估模型,获取目标在产化工园区的主要污染物、地理位置信息及地质水文信息作为园区特征;
[0102] 根据所述园区特征获取敏感目标,基于所述敏感目标构建数据检索任务,在预设数据检索空间中通过相似度计算获取环境风险因素数据集,对所述环境风险因素数据集进行统计分析;
[0103] 根据预设数量选取相似度及使用频率大于预设阈值的环境风险因素,确定评价指标,并根据层次分析法生成评价指标的权重信息;
[0104] 根据所述评价指标构成模糊综合评价的风险评价集,预设目标在产化工园区污染的风险评估等级,根据三角函数判断评价因素对于各个评价等级的隶属度,得到隶属度矩阵;
[0105] 根据所述隶属度矩阵及指标权重计算目标层中模糊综合评价结果,生成目标在产化工园区污染的风险评估等级。
[0106] 需要说明的是,根据各格栅区域的主要污染物及对应的污染物浓度信息获取目标在产化工园区的污染物分布;通过数据检索根据预设时间内多源数据时序序列获取历史污染物分布及对应的时空融合特征,根据目标在产化工园区的历史污染物分布及对应的时空融合特征构建训练集,对LSTM网络进行训练;当LSTM网络的输出精度符合预设标准时,则输出训练后的LSTM网络,基于目标在产化工园区的当前污染物分布获取预设时间后的污染物分布。
[0107] 需要说明的是,根据预设时间后的污染物分布生成预警信息,具体为:通过目标在产化工园区的历史污染物分布获取预设时间步长的污染物分布变化特征,根据所述预设时间步长的污染物分布变化特征获取预设时间后的污染物分布的标准值;获取预设时间的预测污染物分布,当所述预测污染物分布与所述污染物分布的标准值进行对比,获取污染物分布偏差;当所述污染物分布偏差大于预设偏差阈值,则生成对应污染物的预警信息;根据所述预警信息确定对应的格栅区域,根据格栅区域的地理水文信息及位置信息利用大数据手段生成污染物治理措施。
[0108] 需要说明的是,基于数字孪生将目标在产化工园区的物理模型映射到三维孪生体模型,构建三维可视化模型,根据所述三维可视化模型进行特征分析、环境风险评价及数据管理;通过所述三维可视化模型对目标在产化工园区进行监测,获取各类别预警信息及新增污染物、污染源信息。管理人员可以对目标在产化工园区的基本信息、污染物含量、污染物空间分布情况和场地风险情况进行直观的分析,也能够对场地信息进行数字化管理,并以此系统为基础,针对污染情况提出后续场地修复与治理的相关建议与措施,为场地修复与治理工作提供帮助。
[0109] 本发明第三方面还提供一种计算机可读存储介质,所述计算机可读存储介质中包括基于深度学习的在产化工园区环境污染风险评估方法程序,所述基于深度学习的在产化工园区环境污染风险评估方法程序被处理器执行时,实现如上述任一项所述的基于深度学习的在产化工园区环境污染风险评估方法的步骤。
[0110] 在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
[0111] 上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
[0112] 另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
[0113] 本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read‑Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0114] 或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
[0115] 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。