一种基于运渣车活动的城市扬尘污染源分类方法转让专利

申请号 : CN202311804382.9

文献号 : CN117473398B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 韩科喻磊

申请人 : 四川国蓝中天环境科技集团有限公司

摘要 :

本发明公开了一种基于运渣车活动的城市扬尘污染源分类方法,涉及城市扬尘污染源分类领域。该方法包括:获取多种数据源历史数据,并根据多种数据源历史数据构建污染源数据集;构建城市扬尘污染源分类神经网络模型,利用污染源数据集对城市扬尘污染源分类神经网络模型进行训练验证,并利用人工核查对训练验证后的城市扬尘污染源分类神经网络模型进行更新;获取多种数据源实时数据,并根据多种数据源实时数据和更新后的城市扬尘污染源分类神经网络模型,确定城市扬尘污染源分类结果。本发明基于运渣车GPS轨迹数据在内的多种数据源,对城市扬尘污染源进行分类,提升了城市扬尘污染源分类结果的时效性和准确性。

权利要求 :

1.一种基于运渣车活动的城市扬尘污染源分类方法,其特征在于,包括以下步骤:S1、获取多种数据源历史数据,并根据多种数据源历史数据构建污染源数据集;

多种数据源包括运渣车GPS轨迹数据、城市土地覆盖数据、城市POI数据和城市已知扬尘污染源数据;

根据多种数据源历史数据构建污染源数据集包括以下步骤:

A1、根据运渣车GPS轨迹数据、城市土地覆盖数据和城市POI数据确定污染源数据集的特征向量;

步骤A1包括以下步骤:

A11、根据运渣车GPS轨迹数据确定污染源数据集的地理特征值和车流特征值;

步骤A11包括以下步骤:

A111、根据运渣车GPS轨迹数据确定污染源数据集的第一形状值、第二形状值、大小值和中心距离值,以确定污染源数据集的地理特征值;

A112、根据运渣车GPS轨迹数据确定运渣车的OD数据;

A113、根据步骤A112中运渣车的OD数据确定运渣车的入流量值、运渣车的出流量值、污染源的入度值和污染源的出度值;

A114、根据步骤A112中运渣车的OD数据,计算运渣车标准工作时间值,表示为:其中: 为运渣车经过第 个污染源的标准工作时间值, 为经过第 个污染源的总运渣车次数, 为第 辆运渣车经过第 个污染源, 为第 辆运渣车进入第 个污染源的时刻, 为第 辆运渣车离开第 个污染源的时刻;

A115、根据步骤A112中运渣车的OD数据和步骤A114中的运渣车标准工作时间值,计算运渣车工作时间稳定性值,表示为:其中: 为运渣车经过第 个污染源的工作时间稳定性值;

A116、根据步骤A113中运渣车的入流量值、运渣车的出流量值、污染源的入度值、污染源的出度值、步骤A114中的运渣车标准工作时间值和步骤A115中的运渣车工作时间稳定性值,确定污染源数据集的车流特征值;

A12、根据城市土地覆盖数据确定污染源数据集的城市土地覆盖特征值;

A13、根据城市POI数据计算污染源数据集的城市POI特征值,表示为:其中: 为第 个污染源的第 类城市POI特征值,为第 类城市POI中POI点的序号,为第 类城市POI中POI点的总数, 为判别函数,判别函数判别成立时取值为1,判别函数判别不成立时取值为0, 为第 个污染源的几何中心横坐标, 为第 类城市POI中第 个POI点的投影横坐标, 为第 个污染源的几何中心纵坐标, 为第 类城市POI中第 个POI点的投影纵坐标;

A14、根据步骤A11中污染源数据集的地理特征值和车流特征值、步骤A12中污染源数据集的城市土地覆盖特征值和步骤A13中污染源数据集的城市POI特征值,确定污染源数据集的特征向量,表示为:其中: 为第 个污染源的特征向量, 为第 个污染源的第一形状值, 为第 个污染源的第二形状值, 为第个污染源的大小值, 为第个污染源的中心距离值, 为第个污染源的城市土地覆盖特征值, 为第个污染源的城市POI特征值, 为时间 内运渣车的入流量值, 为时间 内运渣车的出流量值, 为第 个污染源的入度值,为第 个污染源的出度值, 为运渣车经过第 个污染源的标准工作时间值, 为运渣车经过第个污染源的工作时间稳定性值;

A2、根据城市已知扬尘污染源数据确定污染源数据集的标签向量;

A3、根据步骤A1中污染源数据集的特征向量和步骤A2中污染源数据集的标签向量确定污染源数据集;

S2、构建城市扬尘污染源分类神经网络模型,利用步骤S1中的污染源数据集对城市扬尘污染源分类神经网络模型进行训练验证,并利用人工核查对训练验证后的城市扬尘污染源分类神经网络模型进行更新;

S3、获取多种数据源实时数据,并根据多种数据源实时数据和步骤S2中更新后的城市扬尘污染源分类神经网络模型,确定城市扬尘污染源分类结果。

2.根据权利要求1所述的一种基于运渣车活动的城市扬尘污染源分类方法,其特征在于,在步骤A2中,根据城市已知扬尘污染源数据确定污染源数据集的标签向量,表示为:其中: 为第个污染源的标签向量, 为第 个已知污染源的标签类型, 为判别函数,判别函数判别成立时取值为1,判别函数判别不成立时取值为0, 为第 个污染源的左边界坐标, 为第 个已知污染源的经度坐标, 为第 个污染源的右边界坐标,为逻辑运算符中的且, 为第 个污染源的下边界坐标, 为第 个已知污染源的纬度坐标,为第 个污染源的上边界坐标。

3.根据权利要求1所述的一种基于运渣车活动的城市扬尘污染源分类方法,其特征在于,在步骤S2中,构建的城市扬尘污染源分类神经网络模型包括依次连接的第一线性层、第一Relu层、第一dropout层、第二线性层、第二Relu层、第二dropout层和第三线性层;

第一线性层用于接收污染源数据,利用第一权重项系数和第一偏置项系数对污染源数据进行升维以获取第一高维污染源数据,并将第一高维污染源数据传输至第一Relu层;

第一Relu层用于接收第一高维污染源数据,利用最大值函数对第一高维污染源数据进行非线性化变换以获取第一高维增强污染源数据,并将第一高维增强污染源数据传输至第一dropout层;

第一dropout层用于接收第一高维增强污染源数据,利用正则化方法对第一高维增强污染源数据进行降维以获取第二污染源数据,并将第二污染源数据传输至第二线性层;

第二线性层用于接收第二污染源数据,并利用第二权重项系数和第二偏置项系数对污染源数据进行降维以获取第二低维污染源数据,并将第二低维污染源数据传输至第二Relu层;

第二Relu层用于接收第二低维污染源数据,利用最大值函数对第一高维污染源数据进行非线性化变换以获取第二低维增强污染源数据,并将第二低维增强污染源数据传输至第二dropout层;

第二dropout层用于接收第二低维增强污染源数据,利用正则化方法对第二低维增强污染源数据进行降维以获取第三污染源数据,并将第三污染源数据传输至第三线性层;

第三线性层用于接收第三污染源数据,并利用第三权重项系数和第三偏置项系数将第三污染源数据映射到三维空间以获取城市扬尘污染源分类结果数据。

说明书 :

一种基于运渣车活动的城市扬尘污染源分类方法

技术领域

[0001] 本发明涉及城市扬尘污染源分类领域,具体涉及一种基于运渣车活动的城市扬尘污染源分类方法。

背景技术

[0002] 在城市环境管理中,扬尘污染源的分类一直是重要的任务。现有方法通常利用遥感数据、传感器技术或者其他数据采集手段来监测、识别城市扬尘污染源,并对城市扬尘污染源进行分类。现有方法对扬尘污染源的识别和分类取得了一定的成就。但现有方法中利用的城市也存在以下缺点:
[0003] 1、监测方法的依赖性:现有城市扬尘污染源监测方法通常依赖于固定的监测设备,这些设备在城市各处分布不均匀,因此无法实时全面地监测城市扬尘污染源;
[0004] 2、数据准确性和时效性:现有方法使用的监测设备会受到故障、损坏或维护不当的影响,导致了采集到的数据存在准确性和时效性的问题,进而影响了城市扬尘污染源的准确识别;
[0005] 3、人工成本高:现有方法过度依赖于人工排查,通常无法提供高效的分类标签,也缺乏与现有数据库的有效连接。

发明内容

[0006] 针对现有技术中的上述不足,本发明提供了一种基于运渣车活动的城市扬尘污染源分类方法,能基于运渣车GPS轨迹数据在内的多种数据源,对城市扬尘污染源进行分类,提升了城市扬尘污染源分类结果的时效性和准确性。
[0007] 为了达到上述发明目的,本发明采用的技术方案为:
[0008] 一种基于运渣车活动的城市扬尘污染源分类方法,包括以下步骤:
[0009] S1、获取多种数据源历史数据,并根据多种数据源历史数据构建污染源数据集;
[0010] S2、构建城市扬尘污染源分类神经网络模型,利用步骤S1中的污染源数据集对城市扬尘污染源分类神经网络模型进行训练验证,并利用人工核查对训练验证后的城市扬尘污染源分类神经网络模型进行更新;
[0011] S3、获取多种数据源实时数据,并根据多种数据源实时数据和步骤S2中更新后的城市扬尘污染源分类神经网络模型,确定城市扬尘污染源分类结果。
[0012] 进一步地,在步骤S1中,多种数据源包括运渣车GPS轨迹数据、城市土地覆盖数据、城市POI数据和城市已知扬尘污染源数据。
[0013] 进一步地,在步骤S1中,根据多种数据源历史数据构建污染源数据集包括以下步骤:
[0014] A1、根据运渣车GPS轨迹数据、城市土地覆盖数据和城市POI数据确定污染源数据集的特征向量;
[0015] A2、根据城市已知扬尘污染源数据确定污染源数据集的标签向量;
[0016] A3、根据步骤A1中污染源数据集的特征向量和步骤A2中污染源数据集的标签向量确定污染源数据集。
[0017] 进一步地,步骤A1包括以下步骤:
[0018] A11、根据运渣车GPS轨迹数据确定污染源数据集的地理特征值和车流特征值;
[0019] A12、根据城市土地覆盖数据确定污染源数据集的城市土地覆盖特征值;
[0020] A13、根据城市POI数据计算污染源数据集的城市POI特征值;
[0021] A14、根据步骤A11中污染源数据集的地理特征值和车流特征值、步骤A12中污染源数据集的城市土地覆盖特征值和步骤A13中污染源数据集的城市POI特征值,确定污染源数据集的特征向量。
[0022] 进一步地,步骤A11包括以下步骤:
[0023] A111、根据运渣车GPS轨迹数据确定污染源数据集的第一形状值、第二形状值、大小值和中心距离值,以确定污染源数据集的地理特征值;
[0024] A112、根据运渣车GPS轨迹数据确定运渣车的OD数据;
[0025] A113、根据步骤A112中运渣车的OD数据确定运渣车的入流量值、运渣车的出流量值、污染源的入度值和污染源的出度值;
[0026] A114、根据步骤A112中运渣车的OD数据,计算运渣车标准工作时间值,表示为:
[0027]
[0028] 其中: 为运渣车经过第 个污染源的标准工作时间值, 为经过第 个污染源的总运渣车次数, 为第 辆运渣车经过第 个污染源, 为第 辆运渣车进入第 个污染源的时刻, 为第 辆运渣车离开第 个污染源的时刻;
[0029] A115、根据步骤A112中运渣车的OD数据和步骤A114中的运渣车标准工作时间值,计算运渣车工作时间稳定性值,表示为:
[0030]
[0031] 其中: 为运渣车经过第 个污染源的工作时间稳定性值;
[0032] A116、根据步骤A113中运渣车的入流量值、运渣车的出流量值、污染源的入度值、污染源的出度值、步骤A114中的运渣车标准工作时间值和步骤A115中的运渣车工作时间稳定性值,确定污染源数据集的车流特征值。
[0033] 进一步地,在步骤A13中,根据城市POI数据计算污染源数据集的城市POI特征值,表示为:
[0034] 其中: 为第 个污染源的第 类城市POI特征值,为第 类城市POI中POI点的序号, 为第 类城市POI中POI点的总数, 为判别函数,判别函数判别成立时取值为1,判别函数判别不成立时取值为0, 为第个污染源的几何中心横坐标, 为第 类城市POI中第 个POI点的投影横坐标, 为第 个污染源的几何中心纵坐标, 为第 类城市POI中第 个POI点的投影纵坐标。
[0035] 进一步地,在步骤A14中,确定污染源数据集的特征向量,表示为:
[0036]
[0037] 其中: 为第个污染源的特征向量, 为第 个污染源的第一形状值, 为第个污染源的第二形状值, 为第 个污染源的大小值, 为第 个污染源的中心距离值,为第个污染源的城市土地覆盖特征值, 为第 个污染源的城市POI特征值, 为时间 内运渣车的入流量值, 为时间 内运渣车的出流量值, 为第 个污染源的入度值,为第 个污染源的出度值, 为运渣车经过第 个污染源的标准工作时间值, 为运渣车经过第个污染源的工作时间稳定性值。
[0038] 进一步地,在步骤A2中,根据城市已知扬尘污染源数据确定污染源数据集的标签向量,表示为:
[0039]
[0040] 其中: 为第 个污染源的标签向量, 为第 个已知污染源的标签类型,为判别函数,判别函数判别成立时取值为1,判别函数判别不成立时取值为0, 为第个污染源的左边界坐标, 为第 个已知污染源的经度坐标, 为第 个污染源的右边界坐标,为逻辑运算符中的且, 为第 个污染源的下边界坐标, 为第 个已知污染源的纬度坐标, 为第 个污染源的上边界坐标。
[0041] 进一步地,在步骤S2中,构建的城市扬尘污染源分类神经网络模型包括依次连接的第一线性层、第一Relu层、第一drop out层、第二线性层、第二Relu层、第二drop out层和第三线性层;
[0042] 第一线性层用于接收污染源数据,利用第一权重项系数和第一偏置项系数对污染源数据进行升维以获取第一高维污染源数据,并将第一高维污染源数据传输至第一Relu层;
[0043] 第一Relu层用于接收第一高维污染源数据,利用最大值函数对第一高维污染源数据进行非线性化变换以获取第一高维增强污染源数据,并将第一高维增强污染源数据传输至第一drop out层;
[0044] 第一drop out层用于接收第一高维增强污染源数据,利用正则化方法对第一高维增强污染源数据进行降维以获取第二污染源数据,并将第二污染源数据传输至第二线性层;
[0045] 第二线性层用于接收第二污染源数据,并利用第二权重项系数和第二偏置项系数对污染源数据进行降维以获取第二低维污染源数据,并将第二低维污染源数据传输至第二Relu层;
[0046] 第二Relu层用于接收第二低维污染源数据,利用最大值函数对第一高维污染源数据进行非线性化变换以获取第二低维增强污染源数据,并将第二低维增强污染源数据传输至第二drop out层;
[0047] 第二drop out层用于接收第二低维增强污染源数据,利用正则化方法对第二低维增强污染源数据进行降维以获取第三污染源数据,并将第三污染源数据传输至第三线性层;
[0048] 第三线性层用于接收第三污染源数据,并利用第三权重项系数和第三偏置项系数将第三污染源数据映射到三维空间以获取城市扬尘污染源分类结果。
[0049] 本发明具有以下有益效果:
[0050] (1)本发明获取多种数据源,并根据多种数据源构建污染源数据集,实现了对多种数据源的有效融合,并利用融合多种数据源后的污染源数据集对扬尘污染源进行分类,能提升城市扬尘污染源分类结果的准确性;
[0051] (2)本发明基于运渣车活动数据即运渣车GPS轨迹数据,可实时监测运渣车活动,提供实时的、全面的扬尘污染源信息以对城市扬尘污染源进行分类,提升了城市扬尘污染源分类结果的时效性;
[0052] (3)本发明采用自动化的数据处理方法降低了人工干预,提高了数据处理效率,使得城市扬尘污染源分类更具可实施性;
[0053] (4)本发明利用人工核查可动态更新城市已知扬尘污染源数据,并利用更新后的城市已知扬尘污染源数据对训练验证后的城市扬尘污染源分类神经网络模型进行更新,使城市扬尘污染源分类神经网络模型具有更高的分类精度,最终提升了城市扬尘污染源分类结果的准确性。

附图说明

[0054] 图1为一种基于运渣车活动的城市扬尘污染源分类方法流程示意图;
[0055] 图2为城市扬尘污染源分类神经网络模型结构示意图。

具体实施方式

[0056] 下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
[0057] 如图1所示,一种基于运渣车活动的城市扬尘污染源分类方法,包括以下步骤:
[0058] S1、获取多种数据源历史数据,并根据多种数据源历史数据构建污染源数据集。
[0059] 在本发明的一个可选实施例中,多种数据源包括运渣车GPS轨迹数据、城市土地覆盖数据、城市POI数据和城市已知扬尘污染源数据。
[0060] 本发明获取的运渣车GPS轨迹数据包括所有运渣车的活动轨迹。
[0061] 本发明从公开数据集中获取分辨率为1m的城市土地覆盖数据。
[0062] 本发明获取的城市POI数据包括餐饮服务数据、道路附属设施数据、风景名胜数据、公共设施数据、公司企业数据、购物服务数据、交通设施服务数据、金融保险服务数据、科教文化服务数据、汽车服务数据、汽车维修数据、商务住宅数据、生活服务数据、体育休闲服务数据、医疗保健服务数据、政府机构及社会团队数据、住宿服务数据,共17类数据。
[0063] 本发明通过城市已知扬尘污染源数据线下排查获取城市已知扬尘污染源数据。城市已知扬尘污染源数据包括施工工地数据、渣土倾倒场数据、砂石场数据、商混站数据和重型停车场数据。
[0064] 本发明根据多种数据源历史数据构建污染源数据集包括以下步骤:
[0065] A1、根据运渣车GPS轨迹数据、城市土地覆盖数据和城市POI数据确定污染源数据集的特征向量。
[0066] 具体地,本发明对运渣车GPS轨迹数据进行数据清洗,获取运渣车停驻点,将运渣车每12小时的停驻点通过二次DBSCAN聚类算法识别出所有污染源,结合城市土地覆盖数据和城市POI数据确定所有污染源的特征向量,以确定污染源数据集的特征向量。
[0067] 步骤A1包括以下步骤:
[0068] A11、根据运渣车GPS轨迹数据确定污染源数据集的地理特征值和车流特征值。
[0069] 步骤A11包括以下步骤:
[0070] A111、根据运渣车GPS轨迹数据确定污染源数据集的第一形状值、第二形状值、大小值和中心距离值,以确定污染源数据集的地理特征值。
[0071] 具体地,第一形状值为污染源左右边界的距离。第二形状值为污染源上下边界的距离。大小值为污染源包含划分网格的数量。中心距离值为污染源距离城市中心的欧氏距离。
[0072] A112、根据运渣车GPS轨迹数据确定运渣车的OD数据。
[0073] 运渣车的一次OD指的是运渣车从一个污染源(起点O)到另一个污染源(终点D)的一次行程。本发明根据运渣车GPS轨迹数据确定运渣车在一个污染源(起点O)的最后一次出现时间和运渣车在另一个污染源(终点D)的第一次出现时间,并将运渣车在一个污染源(起点O)的最后一次出现时间和运渣车在另一个污染源(终点D)的第一次出现时间作为运渣车的一次OD数据,以此获取所有运渣车在所有污染源的第一次出现时间和最后一次出现时间,以确定运渣车的OD数据。
[0074] A113、根据步骤A112中运渣车的OD数据确定运渣车的入流量值、运渣车的出流量值、污染源的入度值和污染源的出度值。
[0075] 具体地,运渣车入流量值为时间 内运渣车的入流量值。运渣车出流量值为时间内运渣车的出流量值。时间 内运渣车的入流量值即时间 内进入第 个污染源的运渣车数量。时间 内运渣车的出流量值即时间 内离开第 个污染源的运渣车数量。本发明中时间t取为一个小时。
[0076] 本发明将运渣车的一次OD数据中相邻两个污染源分别作为两个节点,一次OD数据中的一个污染源(起点O)指向另一个污染源(终点D)的方向作为有向边。本发明根据节点和有向边构建有向图。对于有向图,污染源的入度值为指向该污染源(节点)的有向边的数量。污染源的出度值为从该污染源出发指向其他污染源的有向边的数量。
[0077] A114、根据步骤A112中运渣车的OD数据,计算运渣车标准工作时间值,表示为:
[0078]
[0079] 其中: 为运渣车经过第 个污染源的标准工作时间值, 为经过第 个污染源的总运渣车次数, 为第 辆运渣车经过第 个污染源, 为第 辆运渣车进入第 个污染源的时刻, 为第 辆运渣车离开第 个污染源的时刻。
[0080] 本发明将运渣车的OD数据中运渣车在污染源的第一次出现时间确定为进入污染源的时刻,将运渣车的OD数据中运渣车在污染源的最后一次出现时间确定为离开污染源的时刻。
[0081] A115、根据步骤A112中运渣车的OD数据和步骤A114中的运渣车标准工作时间值,计算运渣车工作时间稳定性值,表示为:
[0082]
[0083] 其中: 为运渣车经过第 个污染源的工作时间稳定性值。
[0084] 具体地,工作时间为运渣车从进入到离开一个污染源的时间。
[0085] A116、根据步骤A113中运渣车的入流量值、运渣车的出流量值、污染源的入度值、污染源的出度值、步骤A114中的运渣车标准工作时间值和步骤A115中的运渣车工作时间稳定性值,确定污染源数据集的车流特征值。
[0086] A12、根据城市土地覆盖数据确定污染源数据集的城市土地覆盖特征值。
[0087] 具体地,本发明根据城市土地覆盖数据确定污染源数据集的城市土地覆盖特征值。城市土地覆盖特征值包括交通线路、树木、草地、农田、建筑、稀疏植被、水域、苔藓地衣,共八种类型城市土地覆盖特征值。
[0088] 本发明计算城市土地覆盖特征值,表示为:
[0089]
[0090] 其中: 为第个污染源的第 类城市土地覆盖特征值, 为划分网格的边长,设为200m, 为第 个污染源的大小值, 为第 个污染源的第类城市土地覆盖特征值的总面积。
[0091] A13、根据城市POI数据计算污染源数据集的城市POI特征值。
[0092] 本发明根据城市POI数据计算污染源数据集的城市POI特征值,表示为:
[0093] 其中: 为第 个污染源的第 类城市POI特征值,为第 类城市POI中POI点的序号, 为第 类城市POI中POI点的总数, 为判别函数,判别函数判别成立时取值为1,判别函数判别不成立时取值为0, 为第个污染源的几何中心横坐标, 为第 类城市POI中第 个POI点的投影横坐标, 为第 个污染源的几何中心纵坐标, 为第 类城市POI中第 个POI点的投影纵坐标。
[0094] 本发明中共选取17类城市POI(Point of Interest,兴趣点)。本发明获取的城市POI数据为每类城市POI中POI点的投影坐标。17类城市POI数据具体为餐饮服务数据、道路附属设施数据、风景名胜数据、公共设施数据、公司企业数据、购物服务数据、交通设施服务数据、金融保险服务数据、科教文化服务数据、汽车服务数据、汽车维修数据、商务住宅数据、生活服务数据、体育休闲服务数据、医疗保健服务数据、政府机构及社会团队数据和住宿服务数据。本发明中的 为17。每类城市POI包含多个POI点。本发明将这17类城市POI数据中的POI点进行编号,确定每类城市POI数据中POI点的序号。
[0095] A14、根据步骤A11中污染源数据集的地理特征值和车流特征值、步骤A12中污染源数据集的城市土地覆盖特征值和步骤A13中污染源数据集的城市POI特征值,确定污染源数据集的特征向量。
[0096] 本发明确定污染源数据集的特征向量,表示为:
[0097]
[0098] 其中: 为第个污染源的特征向量, 为第 个污染源的第一形状值, 为第个污染源的第二形状值, 为第 个污染源的大小值, 为第 个污染源的中心距离值,为第个污染源的城市土地覆盖特征值, 为第 个污染源的城市POI特征值, 为时间 内运渣车的入流量值, 为时间 内运渣车的出流量值, 为第 个污染源的入度值,为第 个污染源的出度值, 为运渣车经过第 个污染源的标准工作时间值, 为运渣车经过第个污染源的工作时间稳定性值。
[0099] A2、根据城市已知扬尘污染源数据确定污染源数据集的标签向量。
[0100] 本发明根据城市已知扬尘污染源数据确定污染源数据集的标签向量,表示为:
[0101]
[0102] 其中: 为第 个污染源的标签向量, 为第 个已知污染源的标签类型,为判别函数,判别函数判别成立时取值为1,判别函数判别不成立时取值为0, 为第个污染源的左边界坐标, 为第 个已知污染源的经度坐标, 为第 个污染源的右边界坐标,为逻辑运算符中的且, 为第 个污染源的下边界坐标, 为第 个已知污染源的纬度坐标, 为第 个污染源的上边界坐标。
[0103] 具体地, 包括 、 和 。 为重度污染源, 为中度污染源, 为轻度污染源。 包括无标签、重度污染源、中度污染源和轻度污染源,共4种标签。
[0104] A3、根据步骤A1中污染源数据集的特征向量和步骤A2中污染源数据集的标签向量确定污染源数据集。
[0105] S2、构建城市扬尘污染源分类神经网络模型,利用步骤S1中的污染源数据集对城市扬尘污染源分类神经网络模型进行训练验证,并利用人工核查对训练验证后的城市扬尘污染源分类神经网络模型进行更新。
[0106] 在本发明的一个可选实施例中,本发明构建城市扬尘污染源分类神经网络模型,利用污染源数据集对城市扬尘污染源分类神经网络模型进行训练验证,并利用人工核查对训练验证后的城市扬尘污染源分类神经网络模型进行更新。
[0107] 如图2所示,本发明构建的城市扬尘污染源分类神经网络模型包括依次连接的第一线性层、第一Relu层、第一drop out层、第二线性层、第二Relu层、第二drop out层和第三线性层。
[0108] 本发明中第一线性层、第一Relu层和第一drop_out层构成城市扬尘污染源分类神经网络模型的第一隐藏层。第二线性层、第二Relu层和第二drop out层构成城市扬尘污染源分类神经网络模型的第二隐藏层。由于神经网络模型的结构复杂度相比于输入数据,若过于复杂则会导致过拟合,否则会导致欠拟合。本发明采用两个隐藏层,以使得城市扬尘污染源分类神经网络模型的参数量和结构复杂度与特征的数据量和复杂度相匹配。本发明中最后接第三线性层,将高维空间的特征矩阵映射到三维空间,以获取城市扬尘污染源分类结果。
[0109] 第一线性层用于接收污染源数据,利用第一权重项系数和第一偏置项系数对污染源数据进行升维以获取第一高维污染源数据,并将第一高维污染源数据传输至第一Relu层。
[0110] 具体地,第一线性层的计算式表示为:
[0111]
[0112] 其中: 为第一高维污染源数据, ,为污染源数据的样本数量,为污染源数据, ,为污染源数据的特征维数, , 为第一权重项系数,
为第一偏置项系数。
[0113] 本发明通过第一线性层将污染源数据的特征维数从低维空间(65维)升到高维空间(256维),以获取第一高维污染源数据,有利于将低维空间不显著的信息映射到高维空间显著信息,以提升城市扬尘污染源分类神经网络模型学习效果。
[0114] 第一Relu层用于接收第一高维污染源数据,利用最大值函数对第一高维污染源数据进行非线性化变换以获取第一高维增强污染源数据,并将第一高维增强污染源数据传输至第一drop out层。
[0115] 具体地,第一Relu层的计算式表示为:
[0116]
[0117] 其中: 为第一高维增强污染源数据, 。
[0118] 本发明通过第一Relu层将第一高维污染源数据进行非线性化变换,能增强城市扬尘污染源分类神经网络模型学习能力,以学习第一高维污染源数据的特征与标签间复杂的映射关系,获取第一高维增强污染源数据。
[0119] 第一drop out层用于接收第一高维增强污染源数据,利用正则化方法对第一高维增强污染源数据进行降维以获取第二污染源数据,并将第二污染源数据传输至第二线性层。
[0120] 具体地,第一drop out层的计算式表示为:
[0121]
[0122] 其中: 为第二污染源数据, , 为元素乘法, 为掩码矩阵,掩码矩阵中的元素为0或1。
[0123] 本发明利用第一drop out层将第一高维增强污染源数据的特征维数从高维空间(256维)降到低维空间(179维),以获取第二污染源数据,能够在城市扬尘污染源分类神经网络模型训练过程中随机丢弃一些神经元,以减少城市扬尘污染源分类神经网络模型过拟合的风险。
[0124] 第二线性层用于接收第二污染源数据,并利用第二权重项系数和第二偏置项系数对污染源数据进行降维以获取第二低维污染源数据,并将第二低维污染源数据传输至第二Relu层。
[0125] 具体地,第二线性层的计算式表示为:
[0126]
[0127] 其中: 为第二低维污染源数据, , 为第二权重项系数, 为第二偏置项系数。
[0128] 第二Relu层用于接收第二低维污染源数据,利用最大值函数对第二低维污染源数据进行非线性化变换以获取第二低维增强污染源数据,并将第二低维增强污染源数据传输至第二drop out层。
[0129] 具体地,第二Relu层的计算式表示为:
[0130]
[0131] 其中: 为第二低维增强污染源数据, 。
[0132] 本发明将第二低维污染源数据进行非线性化变换,增强城市扬尘污染源分类神经网络模型学习能力,以学习第二低维污染源数据的特征与标签间复杂的映射关系,获取第二低维增强污染源数据。
[0133] 第二drop out层用于接收第二低维增强污染源数据,利用正则化方法对第二低维增强污染源数据进行降维以获取第三污染源数据,并将第三污染源数据传输至第三线性层。
[0134] 具体地,第二drop out层的计算式表示为:
[0135]
[0136] 其中: 为第三污染源数据, 。
[0137] 本发明利用第二drop out层将第二低维增强污染源数据从128维降维到89,能够在城市扬尘污染源分类神经网络模型训练过程中随机丢弃一些神经元,以减少城市扬尘污染源分类神经网络模型过拟合的风险。
[0138] 第三线性层用于接收第三污染源数据,并利用第三权重项系数和第三偏置项系数将第三污染源数据映射到三维空间以获取城市扬尘污染源分类结果数据。
[0139] 具体地,第三线性层的计算式表示为:
[0140]
[0141] 其中: 为城市扬尘污染源分类结果数据, , 为第三权重项系数,为第三偏置项系数。
[0142] 本发明将污染源数据集的70%作为训练集,将污染源数据集的30%作为验证集。本发明使用交叉熵损失函数作为目标函数训练城市扬尘污染源分类神经网络模型的参数。
[0143] 本发明利用人工核查对训练验证后的城市扬尘污染源分类神经网络模型进行更新,具体为:将未知标签的污染源数据输入至训练好的城市扬尘污染源分类神经网络模型,可以预测出未知标签的污染源数据的标签,即预测出污染源的污染类别;然后进行人工核查,若发现城市扬尘污染源分类神经网络模型预测的污染类型与实际的污染类型不符合,则将此污染源的信息添加至城市已知扬尘污染源数据。
[0144] S3、获取多种数据源实时数据,并根据多种数据源实时数据和步骤S2中更新后的城市扬尘污染源分类神经网络模型,确定城市扬尘污染源分类结果。
[0145] 在本发明的一个可选实施例中,本发明获取多种数据源实时数据,并对多种数据源实时数据采用上述方式构建成污染源实时数据,并将污染源实时数据输入至更新后的城市扬尘污染源分类神经网络模型,以确定城市扬尘污染源分类结果。
[0146] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0147] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0148] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0149] 本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
[0150] 本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。