一种大气污染来源的解析方法、装置、存储介质及终端转让专利

申请号 : CN202011398750.0

文献号 : CN112505254B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 林久人王帅周政男刘慧灵张潮晏平仲秦东明郭方方

申请人 : 中科三清科技有限公司

摘要 :

本发明公开了一种大气污染来源的解析方法、装置、存储介质及终端,所述方法包括:获取预设时间段内选定区域的大气环境监测数据;将大气环境监测数据输入基于经验结果的PMF正交矩阵因子分解模型中进行解析,输出以图像方式呈现的解析结果,解析结果用于表征预设时间段内选定区域的大气污染来源组成;将解析结果推送至指定用户的终端设备上,因此,采用本申请实施例,解析结果以图像方式呈现,这样,通过以图像方式呈现的解析结果能够直观地看到预设时间段内选定区域的大气污染来源组成,从而提高了用户体验度;此外,将解析结果推送至指定用户的终端上,能够使得定制该推送服务的指定用户能够实时获取到最新的解析结果。

权利要求 :

1.一种大气污染来源的解析方法,其特征在于,所述方法包括:获取预设时间段内选定区域的大气环境监测数据;

将所述大气环境监测数据输入基于经验结果的PMF正交矩阵因子分解模型中进行解析,输出以图像方式呈现的解析结果,所述解析结果用于表征所述预设时间段内所述选定区域的大气污染来源组成;

所述将所述大气环境监测数据输入基于经验结果的PMF正交矩阵因子分解模型中进行解析包括:

对所述PMF正交矩阵因子分解模型中的各项参数进行自动调参;

所述对所述PMF正交矩阵因子分解模型中的各项参数进行自动调参包括:将满足第一预设条件的监测区域污染物组分输入至所述PMF正交矩阵因子分解模型中进行运算,得到各项特征值;第一预设条件包括:处于预设时间段内、且数据有效率大于预设有效率阈值的组分;

根据各项特征值确定各个拐点因子数;

根据各个拐点因子数确定出符合的各个因子数,并在各个因子数中将物种间残差差异最小的因子数作为选取的因子数,用于确定符合的各个因子数的判断条件包括各个因子数对应的物种间残差差异小于或等于某一残差差异标准值;

根据预设配置的因子‑源匹配关系和第二预设条件,对各个选取的因子数进行筛选,得到筛选后的各个因子数,以根据筛选后的各个因子数对所述PMF正交矩阵因子分解 模型进行自动调参,所述第二预设条件为每个筛选后的因子与对应的来源之间的关联关系;

将所述解析结果推送至指定用户的终端设备上。

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据监测区域污染物实测组分与模型拟合结果的相关性以及第三预设条件,判断所述实测组分是否与所述模型拟合结果相关,若所述相关性满足所述第三预设条件,则判断所述实测组分与所述模型拟合结果相关,否则,判断所述实测组分与所述模型拟合结果不相关,并删除所述实测组分。

3.根据权利要求2所述的方法,其特征在于,所述第三预设条件包括:所述实测组分与所述模型拟合结果的相关性接近1、拟合线斜率接近1、且截距接近零。

4.根据权利要求1所述的方法,其特征在于,在所述将满足第一预设条件的组分输入至PMF正交矩阵因子分解模型中进行运算,得到各项特征值之前,所述方法还包括:获取监测区域污染物组分的检出限和不确定度。

5.根据权利要求4所述的方法,其特征在于,在所述获取监测区域污染物组分的检出限和不确定度之前,所述方法还包括:将质控数据中的监测因子阈值下限作为所述监测区域污染物组分的检出限;或者,从仪器端读取出所述监测区域污染物组分的检出限。

6.一种大气污染来源的解析装置,其特征在于,所述装置包括:获取单元,用于获取预设时间段内选定区域的大气环境监测数据;

解析单元,用于将所述获取单元获取的所述大气环境监测数据输入基于经验结果的PMF正交矩阵因子分解模型中进行解析,输出以图像方式呈现的解析结果,所述解析结果用于表征所述预设时间段内所述选定区域的大气污染来源组成;

所述解析单元用于:对所述PMF正交矩阵因子分解模型中的各项参数进行自动调参;

所述解析单元具体用于:将满足第一预设条件的监测区域污染物组分输入至所述PMF正交矩阵因子分解模型中进行运算,得到各项特征值;第一预设条件包括:处于预设时间段内、且数据有效率大于预设有效率阈值的组分;

根据各项特征值确定各个拐点因子数;

根据各个拐点因子数确定出符合的各个因子数,并在各个因子数中将物种间残差差异最小的因子数作为选取的因子数,用于确定符合的各个因子数的判断条件包括各个因子数对应的物种间残差差异小于或等于某一残差差异标准值;

根据预设配置的因子‑源匹配关系和第二预设条件,对各个选取的因子数进行筛选,得到筛选后的各个因子数,以根据筛选后的各个因子数对所述PMF正交矩阵因子分解 模型进行自动调参,所述第二预设条件为每个筛选后的因子与对应的来源之间的关联关系;

推送单元,用于将所述解析单元解析的所述解析结果推送至指定用户的终端设备上。

7.一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1至5任意一项的方法步骤。

8.一种终端,其特征在于,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1至5任意一项的方法步骤。

说明书 :

一种大气污染来源的解析方法、装置、存储介质及终端

技术领域

[0001] 本发明涉及计算机技术领域,特别涉及一种大气污染来源的解析方法、装置、存储介质及终端。

背景技术

[0002] 近年来,随着城市发展,空气污染日益严重,PM2.5作为主要的空气污染物已引起全世界极大关注。PM2.5是指环境空气中空气动力学当量直径小于2.5μm的颗粒物,其化学
组成复杂,包含多种化学成分如水溶性离子、碳成分、地壳元素及各种微量元素等,其不仅
对人体健康、太阳辐射、能见度、云雾形成、粒子增长和气粒转化过程等产生影响,还会直接
或间接的影响平流层臭氧及气候环境。目前国内外的研究中针对含碳组分、重金属元素、氮
氧化物和硫氧化物的研究较为普遍和深入。近年来对PM2.5中的二次无机水溶性离子种类、
含量及来源的分析也受到广泛关注。水溶性离子是PM2.5重要的组成部分,二次无机离子
2‑ ‑ +
SO4 、NO3和NH4是颗粒物污染过程中重要的化学物种,在我国东部城市三者占比之和高
达40%~57%,对大气的消光系数具有较高的分担率,这是造成许多城市能见度降低的主
要原因。硫酸根离子、硝酸根离子浓度还是影响降水酸碱度的重要原因。大气颗粒物污染日
益严重,颗粒物源解析技术用于识别并评估污染源的贡献,为大气污染防治提供科学支撑。
随着监测技术的发展,高时间分辨率的在线监测仪器广泛地应用于大气污染物观测,获得
的在线监测数据与受体模型结合应用于大气污染物源解析研究。
[0003] 经典受体模型PMF(正交矩阵因子分解)多被利用于离线采样数据的来源解析研究。正定矩阵因子PMF模型最早由Paatero等提出,是一种多元因子分析工具,利用不存在显
著负源的约束条件,通过最小二乘法将特定样本数据的矩阵分为两个矩阵:因子贡献(G)和
因子概要(F)。这些因子概要需要由用户判断、识别、解释,从而得到颗粒物排放源的贡献。
基本原理就是首先利用权重计算出颗粒物中各化学组分的误差,然后通过最小二乘法来确
定出其主要的污染源及其贡献率:假设X为n×m矩阵,n为样品数,m为化学成分数目,将矩阵
X分解为矩阵G和矩阵F:其中,G为n×p的颗粒物排放源源贡献矩阵,F为p×m的污染物源成
分谱矩阵,p为主要污染源的数目。其基本公式为:
[0004] X=G×F+E (1)
[0005] 上述公式(1)中,E表示模型计算的不确定性。其中,E为残差矩阵,表示X与GF之间的差异,Q表示实际数据与解析结果之间的差值。为解析出G和F,正矩阵因子模式解析过程
即要求Q趋于最小:
[0006]
[0007] 上述公式(2)中,sij为X的标准偏差;Xij、gij、fkj、eij分别为X、G、F、E矩阵元素,在gij≥0、fkj≥0的约束条件下,通过迭代最小化算法对Q求解。
[0008] 在线监测数据几何式增长对数据的深度分析和融合分析需求迫切。受限与空气质量模式解析所需环境的高要求,数学法的PMF成为源解析软件在线实现的突破口。目前,很
多软件厂商已成功改进并具备成熟的PMF在线数据源解析软件,并于多地平台上线运行。
[0009] 现有的大气污染来源的解析方法中,得到的解析结果的形式往往是大量的文档或者数据,用户无法直观地通过得到的解析结果获知当地的大气污染来源以及不同大气污染
来源的污染状况,用户体验度差。

发明内容

[0010] 本申请实施例提供了一种大气污染来源的解析方法、装置、存储介质及终端。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是
泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是
用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
[0011] 第一方面,本申请实施例提供了一种大气污染来源的解析方法,所述方法包括:
[0012] 获取预设时间段内选定区域的大气环境监测数据;
[0013] 将所述大气环境监测数据输入基于经验结果的PMF正交矩阵因子分解模型中进行解析,输出以图像方式呈现的解析结果,所述解析结果用于表征所述预设时间段内所述选
定区域的大气污染来源组成;
[0014] 将所述解析结果推送至指定用户的终端设备上。
[0015] 在一种实施方式中,所述将所述大气环境监测数据输入基于经验结果的PMF正交矩阵因子分解模型中进行解析还包括:对所述PMF正交矩阵因子分解模型中的各项参数进
行自动调参。
[0016] 在一种实施方式中,所述对所述PMF正交矩阵因子分解模型中的各项参数进行自动调参包括:
[0017] 将满足第一预设条件的监测区域污染物组分输入至所述PMF正交矩阵因子分解模型中进行运算,得到各项特征值;
[0018] 根据各项特征值确定各个拐点因子数;
[0019] 根据各个拐点因子数确定出符合的各个因子数,并在各个因子数中将物种间残差差异最小的因子数作为选取的因子数,用于确定符合的各个因子数的判断条件包括各个因
子数对应的物种间残差差异小于或等于某一残差差异标准值;
[0020] 根据预设配置的因子‑源匹配关系和第二预设条件,对各个选取的因子数进行筛选,得到筛选后的各个因子数,以根据筛选后的各个因子数对所述PMF模型进行自动调参,
所述第二预设条件为每个筛选后的因子与对应的来源之间的关联关系。
[0021] 在一种实施方式中,所述方法还包括:
[0022] 根据监测区域污染物实测组分与模型拟合结果的相关性以及第三预设条件,判断所述实测组分是否与所述模型拟合结果相关,若所述相关性满足所述第三预设条件,则判
断所述实测组分与所述模型拟合结果相关,否则,判断所述实测组分与所述模型拟合结果
不相关,并删除所述实测组分。
[0023] 在一种实施方式中,所述第三预设条件包括:
[0024] 所述实测组分与所述模型拟合结果的相关性接近1、拟合线斜率接近1、且截距接近零。
[0025] 在一种实施方式中,在所述将满足第一预设条件的组分输入至PMF正交矩阵因子分解模型中进行运算,得到各项特征值之前,所述方法还包括:
[0026] 获取监测区域污染物组分的检出限和不确定度。
[0027] 在一种实施方式中,在所述获取监测区域污染物组分的检出限和不确定度之前,所述方法还包括:
[0028] 将质控数据中的监测因子阈值下限作为所述监测区域污染物组分的检出限;或者,
[0029] 从仪器端读取出所述监测区域污染物组分的检出限。
[0030] 第二方面,本申请实施例提供了一种大气污染来源的解析装置,所述装置包括:
[0031] 获取单元,用于获取预设时间段内选定区域的大气环境监测数据;
[0032] 解析单元,用于将所述获取单元获取的所述大气环境监测数据输入基于经验结果的PMF正交矩阵因子分解模型中进行解析,输出以图像方式呈现的解析结果,所述解析结果
用于表征所述预设时间段内所述选定区域的大气污染来源组成;
[0033] 推送单元,用于将所述解析单元解析的所述解析结果推送至指定用户的终端设备上。
[0034] 第三方面,本申请实施例提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。
[0035] 第四方面,本申请实施例提供一种终端,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
[0036] 本申请实施例提供的技术方案可以包括以下有益效果:
[0037] 在本申请实施例中,获取预设时间段内选定区域的大气环境监测数据;将大气环境监测数据输入基于经验结果的PMF正交矩阵因子分解模型中进行解析,输出以图像方式
呈现的解析结果,解析结果用于表征预设时间段内选定区域的大气污染来源组成;将解析
结果推送至指定用户的终端设备上,因此,采用本申请实施例,解析结果以图像方式呈现,
这样,通过以图像方式呈现的解析结果能够直观地看到预设时间段内选定区域的大气污染
来源组成,从而提高了用户体验度;此外,将解析结果推送至指定用户的终端上,能够使得
定制该推送服务的指定用户能够实时获取到最新的解析结果。
[0038] 应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。

附图说明

[0039] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
[0040] 图1是本申请实施例提供的一种大气污染来源的解析方法的流程示意图;
[0041] 图2是本申请实施例提供的一种大气污染来源的解析过程中自动调参的流程示意图;
[0042] 图3是本申请实施例具体应用场景下的PMF模型的自动调参方法的流程示意图;
[0043] 图4是本申请实施例提供的一具体应用场景下的以图像方式呈现的解析结果的示意图;
[0044] 图5是本申请实施例提供的一种大气污染来源的解析装置的结构示意图;
[0045] 图6是本申请实施例提供的一种终端的结构示意图。

具体实施方式

[0046] 以下描述和附图充分地示出本发明的具体实施方案,以使本领域的技术人员能够实践它们。
[0047] 应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其
它实施例,都属于本发明保护的范围。
[0048] 基于现有的方法,无法直观地通过得到的解析结果获知当地的大气污染来源以及不同大气污染来源的污染状况。为此,本申请提供了一种大气污染来源的解析方法、装置、
存储介质及终端,以解决上述相关技术问题中存在的问题。本申请提供的技术方案中,获取
预设时间段内选定区域的大气环境监测数据;将大气环境监测数据输入基于经验结果的
PMF正交矩阵因子分解模型中进行解析,输出以图像方式呈现的解析结果,解析结果用于表
征预设时间段内选定区域的大气污染来源组成;将解析结果推送至指定用户的终端设备
上,因此,采用本申请实施例,解析结果以图像方式呈现,这样,通过以图像方式呈现的解析
结果能够直观地看到预设时间段内选定区域的大气污染来源组成,从而提高了用户体验
度;此外,将解析结果推送至指定用户的终端上,能够使得定制该推送服务的指定用户能够
实时获取到最新的解析结果,下面采用示例性的实施例进行详细说明。
[0049] 下面将结合图1‑图4,对本申请实施例提供的大气污染来源的解析方法进行详细介绍。该大气污染来源的解析方法可依赖于计算机程序实现,可运行于大气污染来源的解
析装置上。该计算机程序可集成在应用中,也可作为独立的工具类应用运行。其中,本申请
实施例中的用户终端,包括但不限于:个人电脑、平板电脑、手持设备、车载设备、可穿戴设
备、计算设备或连接到无线调制解调器的其它处理设备等。在不同的网络中用户终端可以
叫做不同的名称,例如:用户设备、接入终端、用户单元、用户站、移动站、移动台、远方站、远
程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置、蜂窝电话、无绳电
话、个人数字处理(personal digital assistant,PDA)、5G网络或未来演进网络中的终端
设备等。
[0050] 如图1所示,是本申请实施例提供的一种大气污染来源的解析方法的流程示意图;如图1所示,本申请实施例的大气污染来源的解析方法可以包括以下步骤:
[0051] S101,获取预设时间段内选定区域的大气环境监测数据;
[0052] 在本申请实施例中,预设时间段、选定区域均可以根据不同应用场景进行配置,在此不再赘述。
[0053] S102,将大气环境监测数据输入基于经验结果的PMF正交矩阵因子分解模型中进行解析,输出以图像方式呈现的解析结果,解析结果用于表征预设时间段内选定区域的大
气污染来源组成;通过以图像方式呈现的解析结果能够直观地看到预设时间段内选定区域
的大气污染来源组成,从而提高了用户体验度。
[0054] S103,将解析结果推送至指定用户的终端设备上;将解析结果推送至指定用户的终端上,能够使得定制该推送服务的指定用户能够实时获取到最新的解析结果。
[0055] 在本申请实施例中,将大气环境监测数据输入基于经验结果的PMF正交矩阵因子分解模型中进行解析包括以下步骤:
[0056] 对PMF正交矩阵因子分解模型中的各项参数进行自动调参。
[0057] 请参见图2,为本申请实施例提供的一种大气污染来源的解析过程中自动调参的流程示意图。如图2所示,本申请实施例提供的解析方法中对PMF正交矩阵因子分解模型中
的各项参数进行自动调参可以包括以下步骤:
[0058] S201,将满足第一预设条件的监测区域污染物组分输入至PMF正交矩阵因子分解模型中进行运算,得到各项特征值。
[0059] 在本申请实施例中,各项特征值可以为各个因子数的Q/Qexp值,各项特征值还可以为组分残差,或者各项特征值为Q/Qexp值对应的时间序列。
[0060] 在本申请实施例中,针对各个因子数Q/Qexp值的详细描述参见美国国家环境保护局官网的文件名为“EPA PMF5.0 USER GUIDE FINAL FINAL”的第35页至第36页的相关描
述,美国国家环境保护局官网的网址具体如下所述:“https://cfpub.epa.gov/si/si_
public_record_report.cfm?Lab=NERL&count=10000&dirEntryId=308292&searchall
=&showcriteria=2&simplesearch=0&timstype=”,在此不再赘述。
[0061] 在本申请实施例中,第一预设条件包括:处于预设时间段内、且数据有效率大于预设有效率阈值的组分。
[0062] 例如,可以预先配置能够对数据有效性进行自动识别的预设时间段,即:仅仅在该预设时间段内,才能自动对数据有效率进行自动识别。
[0063] 在某一具体应用场景下,预先配置数据有效率为百分之八十以上的组分才能输入至PMF正交矩阵因子分解模型中,这样,通过运算,得到的各项特征值与实际情况更加匹配,
提高了自动调参的精准度。
[0064] 如图3所示,示出了本申请实施例具体应用场景下的PMF模型的自动调参方法的流程示意图;开始选择M条数据,判断其中的有效数据的条数,若有效数据的条数大于N条时,
则从至少N条有效数据中确定因子数;若有效数据的条数小于或者等于N条时,则重新选择M
+X条数据,直至有效数据的条数大于N条时,从中确定因子数,其中,M、N、X均为自然数,M可
以为200、300、400、500等,N可以为50、100、150等,X可以为50、100、150等,优选地,M、N、X分
别为300、100、100。
[0065] 在本申请实施例中,因子数是用于指当前某一类大气污染的几类重要来源的数量。例如,在某一种具体应用场景中,确定出当前某一类大气污染的因子数为7,则当前某一
类大气污染主要有7个类型的污染物来源。这里仅仅是示例,可以根据不同应用场景,确定
不同的因子数,在此不再赘述。
[0066] 在一种可能的实现方式中,在将满足第一预设条件的组分输入至PMF正交矩阵因子分解模型中进行运算,得到各项特征值之前,所述方法还包括以下步骤:
[0067] 获取监测区域污染物组分的检出限和不确定度。
[0068] 在本申请实施例中,确定组分的检出限可以通过如下两种方式,具体如下所述:
[0069] 将质控数据中的监测因子阈值下限作为监测区域污染物组分的检出限;或者,从仪器端读取出监测区域污染物组分的检出限。上述仅仅罗列了常见的两种确定组分的检出
限的方式,还可以通过其它方法确定或读取出来,在此不再赘述。
[0070] 在本申请实施例中,组分的不确定度根据组分的监测原理,按照现有常规方法对应生成,或者人工配置,在此不再赘述。
[0071] 在某一应用场景下,对于来源贡献度为零的情况,做如下处理:
[0072] 对于来源贡献度为零的情况,将自动对预设时间段内的数据重新进行自动调参,并对该源指示物种的不确定度进行减少处理,直至来源贡献度大于零为止。
[0073] 在本申请实施例中,预先配置了当前某一类大气污染的几类来源,并分别对不同类别的来源预先配置了预设条件。例如,在某一具体应用场景下,预先配置了当前某一类大
气污染的一类主要来源,来源A,并针对来源A预先配置了预设条件A。上述步骤中的来源贡
献度为零的情况是指对该源指示物种的不确定度进行减少处理,直至得到的来源与预先配
置的预设条件A不相匹配。其中,来源贡献度为零的情况是指对该源指示物种的不确定度进
行减少处理,得到的来源与预先配置的预设条件A不符合。
[0074] S202,根据各项特征值确定各个拐点因子数。
[0075] 在本申请实施例中,各个拐点因子数为各个因子数Q/Qexp值对应的拐点因子数。
[0076] 针对各个因子数Q/Qexp值的详细描述参见美国国家环境保护局官网的文件名为“EPAPMF5.0USERGUIDEFINALFINAL”的第35页至第36页的相关描述,美国国家环境保护局官
网的网址具体如下所述:
[0077] “https://cfpub.epa.gov/si/si_public_record_report.cfm?Lab=NERL&count=10000&dirEntryId=308292&searchall=&showcriteria=2&simplesearch=0&
timstype=”,在此不再赘述。
[0078] 在本申请实施例中,拐点因子数是指发生数据突变的因子的数值,例如,在某一种应用场景下,当前某一类大气污染的因子数为7,即:当前某一类大气污染的主要来源为7大
类,数据(例如,组分浓度数据)发生突变的点对应的因子数值即为拐点因子数,例如,数据
发生突变的点对应的因子数值为6,即:第六类主要来源,即:在该应用场景下,确定出的拐
点因子数为6。
[0079] 如图3所示,示出了确定各个因子数Q/Qexp值的各个拐点因子数的方法,若任意一个因子数Q/Qexp值的拐点因子数对应的组分残差中各组分差异小于或者等于某一残差差
异标准值(该残差差异标准值是根据多次试验得到的经验值),则该拐点因子数为可用的拐
点因子数,若任意一个因子数Q/Qexp值的拐点因子数对应的组分残差中各组分差异大于某
一残差差异标准值(该残差差异标准值是根据多次试验得到的经验值),则选取另一拐点因
子数进行上述判断过程,若所有的拐点因子数均不符合要求,则将残差与其他组分差异较
大者不确定度调大,通过运行一定数量(该数量与需调整的组分数有关)的不确定度设置策
略,直至得到符合的因子数为止。
[0080] 在本申请实施例中,针对各个因子数Q/Qexp值的详细描述参见美国国家环境保护局官网的文件名为“EPAPMF5.0USERGUIDEFINALFINAL”的第35页至第36页的相关描述,美国
国家环境保护局官网的网址具体如下所述:
[0081] “https://cfpub.epa.gov/si/si_public_record_report.cfm?Lab=NERL&count=10000&dirEntryId=308292&searchall=&showcriteria=2&simplesearch=0&
timstype=”,在此不再赘述。
[0082] 在本申请实施例中,对上述某一残差差异标准值的确定过程做如下说明:
[0083] 考虑到各物种残差值或有数量级差异,因此,对于“某一残差差异标准值”的设定将通过取各组分残差结果的对数再做差的方法来确定,此外,还要结合样本数据进行判断,
在此不再赘述。
[0084] S203,根据各个拐点因子数确定出符合的各个因子数,并在各个因子数中将物种间残差差异最小的因子数作为选取的因子数,用于确定符合的各个因子数的判断条件包括
各个因子数对应的物种间残差差异小于或等于某一残差差异标准值。
[0085] S204,根据预设配置的因子‑源匹配关系和第二预设条件,对各个选取的因子数进行筛选,得到筛选后的各个因子数,以根据筛选后的各个因子数对PMF模型进行自动调参,
第二预设条件为每个筛选后的因子与对应的来源之间的关联关系。
[0086] 在本申请实施例中,预先配置的因子‑源匹配关系可以根据不同的应用场景进行配置。例如,在一种具体应用场景下,因子‑源匹配关系可以为:因子为硝酸盐,源为二次污
染。上述仅仅是示例,还可以根据不同的应用场景,配置其余的因子‑源关系,在此不再一一
赘述。
[0087] 在某一种具体应用场景下,第二预设条件中的每个筛选后的因子与对应的来源之间的关联关系可以为:例如,一种筛选后的因子为钙离子,第二预设条件中的钙离子与对应
的来源之间的关联关系具体为:钙离子的来源可以为地壳,钙离子的来源还可以为海洋。
[0088] 在本申请实施例中,预设配置的因子‑源匹配关系往往是根据大量的大数据统计结果得到的匹配关系,上述匹配关系是可以从现有的资料库中查找到的,在此不再赘述。
[0089] 在本申请实施例中,对于示踪物种同时指示多种源的情况,将选取该因子不同组分共同指示的源;这样,能够确保每个筛选后的因子数与对应的源识别之间具有一一对应
的映射关系。
[0090] 在本申请实施例中,为了进一步地确保自动调参的精准度,本申请实施例提供的自动调参方法,还可以对实测组分进行判断和筛选,具体步骤如下所述:
[0091] 根据监测区域污染物实测组分与模型拟合结果的相关性以及第三预设条件,判断实测组分是否与模型拟合结果相关,若相关性满足第三预设条件,则判断实测组分与模型
拟合结果相关,否则,判断实测组分与模型拟合结果不相关,并删除实测组分。
[0092] 在本申请实施例中,模型拟合结果是指根据预先配置的因子数,运行基于经验结果的PMF正交矩阵因子分解模型到的拟合结果,拟合结果包括各个监测区域污染物模拟组
分浓度数据。
[0093] 在本申请实施例提供的大气污染来源的解析方法中,可以配置不同的因子数,即;若将当前某一类大气污染的因子数配置为7,即:当前某一类大气污染的主要来源为7大类,
则对应的模型拟合结果为根据预先配置的因子数7,运行基于经验结果的PMF正交矩阵因子
分解模型到的拟合结果,拟合结果包括各个监测区域污染物模拟组分浓度数据。
[0094] 在得到各个监测区域污染物模拟组分浓度数据之后,将各个监测区域污染物模拟组分浓度,与同样的监测区域污染物实测组分浓度比较,判断二者是否接近,若判断出二者
数值接近,二者的差值在预设差值阈值范围内,则判断出实测组分与模型拟合结果相关。
[0095] 在实际应用中,二者的差值可以根据不同应用场景进行配置,在此,对二者的差值并不做具体限制。
[0096] 在本申请实施例中,在某一具体应用场景中,第三预设条件包括:实测组分与模型拟合结果的相关性接近1、拟合线斜率接近1、且截距接近零。除了上述罗列的第三预设条件
之外,还可以根据不同应用场景的需求配置其它的第三预设条件,在此不再赘述。
[0097] 若监测区域污染物实测组分与模型拟合结果的相关性满足上述第三预设条件时,则判断监测区域污染物实测组分与模型拟合结果相关,则判断下一个实测组分是否与模型
拟合结果具有相关性;若监测区域污染物实测组分与模型拟合结果的相关性不满足上述第
三预设条件时,则判断监测区域污染物实测组分与模型拟合结果不具有相关性,并删除该
实测组分;这样,经过上述判断过程,可以确保每一个筛选出的监测区域污染物实测组分均
是与模型拟合结果具有相关性、且二者之间的相关性符合上述第三预设条件。
[0098] 在本申请实施例提供的大气污染来源的解析方法中,通过引入自动调参过程,能够有效地减少人工调参时间,从而提高数据处理速度。
[0099] 如图3所示,是本申请实施例具体应用场景下的PMF模型的自动调参方法的流程示意图。
[0100] 如图3所示的自动调参的方法步骤如下所述:
[0101] 从M条数据中选择有效数据,若有效数据的条数大于N条时,则进一步确定因子数,若有效数据的条数小于或者等于N条时,则重新选择近M+X条数据,从M+X条数据中选择有效
数据,直至有效数据的条数大于N条为止;其中,M、N、X均为自然数,M可以为200、300、400、
500等,N可以为50、100、150等,X可以为50、100、150等,优选地,M、N、X分别为300、100、100。
在确定因子数之后,进一步确定组分;在确定组分之后,进一步确定检出限、不确定度;在预
先配置数据有效率大于预设数据有效率(例如,预设数据有效率大于百分之八十时)以上的
组分才能输入至PMF正交矩阵因子分解模型中,运行PMF正交矩阵因子分解模型;确定各个
因子数Q/Qexp值的各个拐点因子数,确定各个因子数Q/Qexp值的各个拐点因子数的过程参
见图1的相关或相似描述,在此不再赘述;选取物种间残差差异最小的因子数;判断实测组
分与模型拟合结果的相关性R2是否接近1、拟合线斜率接近1、且截距接近零,若实测组分与
模型拟合结果的相关性R2接近1、拟合线斜率接近1、且截距接近零时,则进行因子‑源匹配,
得到筛选后的各个因子数,以根据筛选后的各个因子数对PMF模型进行自动调参。
[0102] 在本申请实施例中,针对各个因子数Q/Qexp值的详细描述参见美国国家环境保护局官网的文件名为“EPA PMF5.0 USER GUIDE FINAL FINAL”的第35页至第36页的相关描
述,美国国家环境保护局官网的网址具体如下所述:“https://cfpub.epa.gov/si/si_
public_record_report.cfm?Lab=NERL&count=10000&dirEntryId=308292&searchall
=&showcriteria=2&simplesearch=0&timstype=”,在此不再赘述。
[0103] 针对图3的自动调参方法的说明,参见针对图2的相关或相似描述,在此不再赘述。
[0104] 根据实际的测试结果可知,本公开实施例提供的自动调参方法可成功实现数据采集时间频率为5min(走航车监测)的源解析结果,并可通过调整计算资源进一步缩短更新时
间;根据获取到的小时监测数据,可减少人工调参80%工作量。对比与人工调参结果,误差
范围在‑13.4%~21.3%。如下表1为本申请公开实施例提供的自动调参结果与人工调参结
果的对比表,具体如下所述:
[0105]
[0106]
[0107] 表1:自动调参结果与人工调参结果的对比表
[0108] 针对上述表1中的注释做如下说明:
[0109] 注释1:样本取每日24小时结果;
[0110] 注释2:
[0111] 其中,i为不同的源,n为总源数;Rm为自动解析的污染源百分比贡献,Ra为人工解析的百分比贡献。当Factor自动<人工时,误差取负值。
[0112] 如图4所示,是本申请实施例提供的一具体应用场景下的以图像方式呈现的解析结果的示意图。如图4所示的解析结果的示意图,通过以图像方式呈现的解析结果能够直观
地看到预设时间段内选定区域的大气污染来源组成,从而提高了用户体验度。
[0113] 在本申请实施例中,获取预设时间段内选定区域的大气环境监测数据;将大气环境监测数据输入基于经验结果的PMF正交矩阵因子分解模型中进行解析,输出以图像方式
呈现的解析结果,解析结果用于表征预设时间段内选定区域的大气污染来源组成;将解析
结果推送至指定用户的终端设备上,因此,采用本申请实施例,解析结果以图像方式呈现,
这样,通过以图像方式呈现的解析结果能够直观地看到预设时间段内选定区域的大气污染
来源组成,从而提高了用户体验度;此外,将解析结果推送至指定用户的终端上,能够使得
定制该推送服务的指定用户能够实时获取到最新的解析结果。
[0114] 下述为本发明大气污染来源的解析装置实施例,可以用于执行本发明大气污染来源的解析方法实施例。对于本发明大气污染来源的解析装置实施例中未披露的细节,请参
照本发明大气污染来源的解析方法实施例。
[0115] 请参见图5,其示出了本发明一个示例性实施例提供的大气污染来源的解析装置的结构示意图。该大气污染来源的解析装置可以通过软件、硬件或者两者的结合实现成为
终端的全部或一部分。该大气污染来源的解析装置包括获取单元10、解析单元20和推送单
元30。
[0116] 具体而言,获取单元10,用于获取预设时间段内选定区域的大气环境监测数据;
[0117] 解析单元20,用于将获取单元10获取的大气环境监测数据输入基于经验结果的PMF正交矩阵因子分解模型中进行解析,输出以图像方式呈现的解析结果,解析结果用于表
征预设时间段内选定区域的大气污染来源组成;
[0118] 推送单元30,用于将解析单元20解析的解析结果推送至指定用户的终端设备上。
[0119] 可选的,解析单元20用于对PMF正交矩阵因子分解模型中的各项参数进行自动调参。
[0120] 可选的,解析单元20具体用于:
[0121] 将满足第一预设条件的监测区域污染物组分输入至PMF正交矩阵因子分解模型中进行运算,得到各项特征值;
[0122] 根据各项特征值确定各个拐点因子数;
[0123] 根据各个拐点因子数确定出符合的各个因子数,并在各个因子数中将物种间残差差异最小的因子数作为选取的因子数,用于确定符合的各个因子数的判断条件包括各个因
子数对应的物种间残差差异小于或等于某一残差差异标准值;
[0124] 根据预设配置的因子‑源匹配关系和第二预设条件,对各个选取的因子数进行筛选,得到筛选后的各个因子数,以根据筛选后的各个因子数对PMF模型进行自动调参,第二
预设条件为每个筛选后的因子与对应的来源之间的关联关系。
[0125] 可选的,所述装置还包括:
[0126] 判断单元(在图5中未示出),用于根据监测区域污染物实测组分与模型拟合结果的相关性以及第三预设条件,判断实测组分是否与模型拟合结果相关,若相关性满足第三
预设条件,则判断实测组分与模型拟合结果相关,否则,判断实测组分与模型拟合结果不相
关;
[0127] 删除单元(在图5中未示出),用于在判断单元判断出实测组分与模型拟合结果不相关时,删除实测组分。
[0128] 可选的,第三预设条件包括:实测组分与模型拟合结果的相关性接近1、拟合线斜率接近1、且截距接近零。
[0129] 可选的,获取单元10还用于:在解析单元20将满足第一预设条件的组分输入至PMF正交矩阵因子分解模型中进行运算,得到各项特征值之前,获取监测区域污染物组分的检
出限和不确定度。
[0130] 可选的,所述装置还包括:
[0131] 检出限确定单元(在图5中未示出),用于在获取单元10获取监测区域污染物组分的检出限和不确定度之前,将质控数据中的监测因子阈值下限作为监测区域污染物组分的
检出限;或者,从仪器端读取出监测区域污染物组分的检出限。
[0132] 需要说明的是,上述实施例提供的大气污染来源的解析装置在执行大气污染来源的解析方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将
上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完
成以上描述的全部或者部分功能。另外,上述实施例提供的大气污染来源的解析装置与大
气污染来源的解析方法实施例属于同一构思,其体现实现过程详见大气污染来源的解析方
法实施例,这里不再赘述。
[0133] 在本申请实施例中,获取单元用于获取预设时间段内选定区域的大气环境监测数据;解析单元用于将获取单元获取的大气环境监测数据输入基于经验结果的PMF正交矩阵
因子分解模型中进行解析,输出以图像方式呈现的解析结果,解析结果用于表征预设时间
段内选定区域的大气污染来源组成;以及推送单元用于将解析单元解析到的解析结果推送
至指定用户的终端设备上。由于本申请提供的大气污染来源的解析方法解析得到的解析结
果以图像方式呈现,这样,通过以图像方式呈现的解析结果能够直观地看到预设时间段内
选定区域的大气污染来源组成,从而提高了用户体验度;此外,将解析结果推送至指定用户
的终端上,能够使得定制该推送服务的指定用户能够实时获取到最新的解析结果。
[0134] 本发明还提供一种计算机可读介质,其上存储有程序指令,该程序指令被处理器执行时实现上述各个方法实施例提供的大气污染来源的解析方法。
[0135] 本发明还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各个方法实施例所述的大气污染来源的解析方法。
[0136] 请参见图6,为本申请实施例提供了一种终端的结构示意图。如图6所示,终端1000可以包括:至少一个处理器1001,至少一个网络接口1004,用户接口1003,存储器1005,至少
一个通信总线1002。
[0137] 其中,通信总线1002用于实现这些组件之间的连接通信。
[0138] 其中,用户接口1003可以包括显示屏(Display)、摄像头(Camera),可选用户接口1003还可以包括标准的有线接口、无线接口。
[0139] 其中,网络接口1004可选的可以包括标准的有线接口、无线接口(如WI‑FI接口)。
[0140] 其中,处理器1001可以包括一个或者多个处理核心。处理器1001利用各种借口和线路连接整个电子设备1000内的各个部分,通过运行或执行存储在存储器1005内的指令、
程序、代码集或指令集,以及调用存储在存储器1005内的数据,执行电子设备1000的各种功
能和处理数据。
[0141] 可选的,处理器1001可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field‑Programmable Gate Array,FPGA)、可编程逻辑阵列
(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器1001可集成中央
处理器(Central Processing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)
和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程
序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通
信。可以理解的是,上述调制解调器也可以不集成到处理器1001中,单独通过一块芯片进行
实现。
[0142] 其中,存储器1005可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read‑Only Memory)。可选的,该存储器1005包括非瞬时性计算机可读介质
(non‑transitory computer‑readable storage medium)。存储器1005可用于存储指令、程
序、代码、代码集或指令集。存储器1005可包括存储程序区和存储数据区,其中,存储程序区
可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功
能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各
个方法实施例中涉及到的数据等。存储器1005可选的还可以是至少一个位于远离前述处理
器1001的存储装置。如图6所示,作为一种计算机存储介质的存储器1005中可以包括操作系
统、网络通信模块、用户接口模块以及大气污染来源的解析应用程序。
[0143] 在图6所示的终端1000中,用户接口1003主要用于为用户提供输入的接口,获取用户输入的数据;而处理器1001可以用于调用存储器1005中存储的大气污染来源的解析应用
程序,并具体执行以下操作:
[0144] 获取预设时间段内选定区域的大气环境监测数据;
[0145] 将大气环境监测数据输入基于经验结果的PMF正交矩阵因子分解模型中进行解析,输出以图像方式呈现的解析结果,解析结果用于表征预设时间段内选定区域的大气污
染来源组成;
[0146] 将解析结果推送至指定用户的终端设备上。
[0147] 在一种实施例中,处理器1001在执行将大气环境监测数据输入基于经验结果的PMF正交矩阵因子分解模型中进行解析执行以下操作:
[0148] 对PMF正交矩阵因子分解模型中的各项参数进行自动调参。
[0149] 在一种实施例中,处理器1001在执行对PMF正交矩阵因子分解模型中的各项参数进行自动调参具体执行以下操作:
[0150] 将满足第一预设条件的监测区域污染物组分输入至PMF正交矩阵因子分解模型中进行运算,得到各项特征值;
[0151] 根据各项特征值确定各个拐点因子数;
[0152] 根据各个拐点因子数确定出符合的各个因子数,并在各个因子数中将物种间残差差异最小的因子数作为选取的因子数,用于确定符合的各个因子数的判断条件包括各个因
子数对应的物种间残差差异小于或等于某一残差差异标准值;
[0153] 根据预设配置的因子‑源匹配关系和第二预设条件,对各个选取的因子数进行筛选,得到筛选后的各个因子数,以根据筛选后的各个因子数对PMF模型进行自动调参,第二
预设条件为每个筛选后的因子与对应的来源之间的关联关系。
[0154] 在一种实施例中,处理器1001还执行以下操作:
[0155] 根据监测区域污染物实测组分与模型拟合结果的相关性以及第三预设条件,判断实测组分是否与模型拟合结果相关,若相关性满足第三预设条件,则判断实测组分与模型
拟合结果相关,否则,判断实测组分与模型拟合结果不相关,并删除实测组分。
[0156] 在一个实施例中,第三预设条件包括:实测组分与模型拟合结果的相关性接近1、拟合线斜率接近1、且截距接近零。
[0157] 在一个实施例中,处理器1001在执行在将满足第一预设条件的组分输入至PMF正交矩阵因子分解模型中进行运算,得到各项特征值之前,还执行以下操作:
[0158] 获取监测区域污染物组分的检出限和不确定度。
[0159] 在一个实施例中,处理器1001在执行在获取监测区域污染物组分的检出限和不确定度之前,还执行以下操作:
[0160] 将质控数据中的监测因子阈值下限作为监测区域污染物组分的检出限;或者,从仪器端读取出监测区域污染物组分的检出限。
[0161] 在本申请实施例中,获取预设时间段内选定区域的大气环境监测数据;将大气环境监测数据输入基于经验结果的PMF正交矩阵因子分解模型中进行解析,输出以图像方式
呈现的解析结果,解析结果用于表征预设时间段内选定区域的大气污染来源组成;将解析
结果推送至指定用户的终端设备上。由于本申请解析方法得到的解析结果以图像方式呈
现,这样,通过以图像方式呈现的解析结果能够直观地看到预设时间段内选定区域的大气
污染来源组成,从而提高了用户体验度;此外,将解析结果推送至指定用户的终端上,能够
使得定制该推送服务的指定用户能够实时获取到最新的解析结果。
[0162] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质
中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁
碟、光盘、只读存储记忆体或随机存储记忆体等。
[0163] 以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。