基于机器学习和遥感技术的城市人为热排放量估算方法转让专利

申请号 : CN202210854057.2

文献号 : CN115204691B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 田静张永强

申请人 : 中国科学院地理科学与资源研究所

摘要 :

本发明公开了一种基于机器学习和遥感技术的城市人为热排放量估算方法,包括以下步骤:S1、获取遥感数据、S2、预处理遥感数据、S3、遥感反演地表参数、S4、构建随机森林模型、S5、估算城区人为热量。本发明通过遥感信息和机器学习手段实现了人为热排放量的估算,利用城市郊区忽略人为热排放影响的事实,在城市郊区建立地表温度及其影响因子的随机森林模型,基于此模型估算城区范围内无人为热排放影响的地表温度,再结合辐射平衡方程实现城区人为热排放量的估算。本发明使用遥感数据,因此数据获取便捷,易操作,应用性强,具有较强的推广性。

权利要求 :

1.一种基于机器学习和遥感技术的城市人为热排放量估算方法,其特征在于,包括以下步骤:S1、获取数据:

下载时间相同的遥感数据和气象数据;所述遥感数据包括:地表反照率产品Albedo,地表反射率产品,比辐射率产品,地表温度产品LST,叶面积指数产品LAI,土地覆盖/土地利用产品,地形数据DEM和夜间灯光数据;

S2、预处理数据:

根据下载的地表反照率产品的空间分辨率,空间范围和投影坐标,将下载的地表反照率产品,地表反射率产品,比辐射率产品,地表温度产品、叶面积指数产品,土地覆盖/土地利用产品,DEM数据和夜间灯光数据分别做几何裁剪、几何纠正、重投影和空间重采样,使得不同数据源的地表参数数据完全配准;

S3、遥感反演地表参数:

根据遥感数据计算归一化水体指数MNDWI、归一化建筑指数NDBI、归一化植被指数NDVI;根据高、低反照率获取不透水地表覆盖度ISA;根据地表辐射平衡方程获取地表净辐射通量;

S4、构建随机森林模型:

将郊区范围内遥感影像所有像元的LST作为因变量样本集,所有像元的NDVI、LAI、Albedo、ISA、NDBI、MNDWI、和DEM作为自变量样本集,根据自变量参数对地表温度进行响应拟合得到随机森林模型;将地表温度的遥感产品与随机森林模型的估算结果进行对比分析,分析模拟误差的大小及分布;对拟合函数进行纠偏,得到最后使用的随机森林模型;

S5、估算城区人为热排放量:

将建立的随机森林模型应用于城区,得到城区无人为热排放时地表温度的估算结果;

根据地表温度遥感产品得到地表净辐射真实值;基于辐射平衡方程,根据随机森林模型估算的地表温度结果得到无人为热排放时的地表净辐射值,计算两者之间的差值,即得到城区的人为热排放量。

2.根据权利要求1所述的基于机器学习和遥感技术的城市人为热排放量估算方法,其特征在于,步骤S1中,气象数据为太阳短波辐射和近地表,距地面2米的空气温度。

3.根据权利要求1所述的基于机器学习和遥感技术的城市人为热排放量估算方法,其特征在于,步骤S3的具体方法包括以下子步骤:S3‑1、根据公式:

获取归一化水体指数MNDWI;其中,GREEN和MIR分别为遥感数据的绿波段、中红外波段的反射率;

S3‑2、根据公式:

获取归一化建筑指数NDBI;其中,NIR和MIR分别为遥感数据的近红外和中红外波段的反射率;

S3‑3、根据公式:

获取归一化植被指数NDVI;其中,RED和NIR分别为遥感数据的红波段和近红外波段的反射率;

S3‑4、根据公式:

Rimp,b=flowRlow,b+fhighRhigh,b+e0获取不透水地表覆盖度ISA,即Rimp,b;其中,Rlow,b和Rhight,b是低、高反照率,flow和fhigh是低、高反照率端元所占比例,e0是残差;

S3‑5、根据地表辐射平衡方程:

4 4

Rn=(1‑α)Rs+εaδT‑εsδLST

获取地表净辐射通量Rn;其中,α为地表反照率,Rs为太阳短波辐射,εs为地表比辐射率,

2 4

δ为斯蒂芬‑波耳兹曼常数,取值5.67×10‑8W/(m·K),εa为无云状态下的大气有效比辐射率,T是近地表的空气温度,LST是地表温度。

说明书 :

基于机器学习和遥感技术的城市人为热排放量估算方法

技术领域

[0001] 本发明属于人为热排放量估算技术领域,具体涉及一种基于机器学习和遥感技术的城市人为热排放量估算方法。

背景技术

[0002] 人为热排放(Anthropologic Heat)主要来源于工业活动、建筑(供暖、通风和空调)系统、人体代谢和汽车尾气的排放。研究证明,快速的城市化导致了城市人为热排放的大量增加。作为城市地表能量平衡的重要热源,人为热排放对城市热岛效应和城市局地气候具有重要贡献。在未来城市人口和能源消耗仍不断增加的趋势下,定量估算人为热排放量对制定合理的城市发展规划方案,进而改善人居环境和城市生态环境具有重要意义。
[0003] 目前,城市人为热排放量的估算主要包括排放清单法和城市地表能量平衡法。前者以大量能耗统计数据为基础,但能耗数据通常难以获取,限制了排放清单法的应用。后者通过计算地表感热通量、潜热通量、地表热通量和净辐射,再基于城市地表能量平衡方程计算余项,即是人为热排放量。计算过程复杂,难以推广应用,且针对城市地区的计算不确定性很大,导致由它们计算出的人为热排放量误差较大。

发明内容

[0004] 针对现有技术中的上述不足,本发明提供一种基于机器学习和遥感技术的城市人为热排放量估算方法。
[0005] 为了达到上述发明目的,本发明采用的技术方案为:
[0006] 提供一种基于机器学习和遥感技术的城市人为热排放量估算方法,包括以下步骤:
[0007] 一种基于机器学习和遥感技术的城市人为热排放量估算方法,其特征在于,包括以下步骤:
[0008] S1、获取数据:
[0009] 下载时间相同的遥感数据和气象数据;遥感数据包括:地表反照率产品Albedo,地表反射率产品,比辐射率产品,地表温度产品LST,叶面积指数产品LAI,土地覆盖/土地利用产品,地形数据DEM和夜间灯光数据;
[0010] S2、预处理数据:
[0011] 根据下载的地表反照率产品的空间分辨率,空间范围和投影坐标,将下载的地表反照率产品,地表反射率产品,比辐射率产品,地表温度产品、叶面积指数产品,土地覆盖/土地利用产品,DEM数据和夜间灯光数据进行完全配准;
[0012] S3、遥感反演地表参数:
[0013] 根据遥感数据计算归一化水体指数MNDWI、归一化建筑指数NDBI、归一化植被指数NDVI;根据高、低反照率获取不透水地表覆盖度ISA;根据地表辐射平衡方程获取地表净辐射通量;
[0014] S4、构建随机森林模型:
[0015] 将郊区范围内遥感影像所有像元的LST作为因变量样本集,所有像元的NDVI、LAI、Albedo、ISA、NDBI、MNDWI、和DEM作为自变量样本集,根据自变量参数对地表温度进行响应拟合得到随机森林模型;将地表温度的遥感产品与随机森林模型的估算结果进行对比分析,分析模拟误差的大小及分布;对拟合函数进行纠偏,得到最后使用的随机森林模型;
[0016] S5、估算城区人为热排放量:
[0017] 将建立的随机森林模型应用于城区,得到城区无人为热排放时地表温度的估算结果;根据地表温度遥感产品得到地表净辐射真实值;基于辐射平衡方程,根据随机森林模型估算的地表温度结果得到无人为热排放时的地表净辐射值,计算两者之间的差值,即得到城区的人为热排放量。
[0018] 进一步地,步骤S1中,气象数据为太阳短波辐射和近地表,距地面2米的空气温度。
[0019] 进一步地,步骤S2中,将下载的地表反照率产品,地表反射率产品,比辐射率产品,地表温度产品、叶面积指数产品,土地覆盖/土地利用产品,DEM数据和夜间灯光数据分别做几何裁剪、几何纠正、重投影和空间重采样,使得不同数据源的地表参数数据完全配准。
[0020] 进一步地,步骤S3的具体方法包括以下子步骤:
[0021] S3‑1、根据公式:
[0022]
[0023] 获取归一化水体指数MNDWI;其中,GREEN和MIR分别为遥感数据的绿波段、中红外波段的反射率;
[0024] S3‑2、根据公式:
[0025]
[0026] 获取归一化建筑指数NDBI;其中,NIR和MIR分别为遥感数据的近红外和中红外波段的反射率;
[0027] S3‑3、根据公式:
[0028]
[0029] 获取归一化植被指数NDVI;其中,RED和NIR分别为遥感数据的红波段和近红外波段的反射率;
[0030] S3‑4、根据公式:
[0031] Rimp,b=flowRlow,b+fhighRhigh,b+e0
[0032] 获取不透水地表覆盖度ISA,即Rimp,b;其中Rlow,b和Rhigh,b是低、高反照率,flow和fhigh是低、高反照率端元所占比例,e0是残差;
[0033] S3‑5、根据地表辐射平衡方程:
[0034] Rn=(1‑α)Rs+εaδT4‑εsδLST4
[0035] 获取地表净辐射通量Rn;其中,α为地表反照率,Rs为太阳短波辐射,εs为地表比辐2 4
射率,δ为斯蒂芬‑波耳兹曼常数,取值5.67×10‑8W/(m·K),εa为无云状态下的大气有效比辐射率,通常设为1,T是近地表的空气温度,LST是地表温度。
[0036] 本发明的有益效果为:
[0037] 本发明通过遥感信息和机器学习手段实现了人为热排放量的估算,利用城市郊区忽略人为热排放影响的事实,在城市郊区建立地表温度及其影响因子(包括NDVI、LAI、Albedo、ISA、NDBI、MNDWI和DEM)的随机森林模型,基于此模型估算城区范围内无人为热排放影响的地表温度,再结合辐射平衡方程实现城区人为热排放量的估算。该方法全部使用较易获取的遥感数据和气象数据,因此数据获取便捷,易操作,应用性强,具有较强的推广性。与现有的方法相比,克服了排放清单法使用的城市能耗数据难以获取的瓶颈问题,避免了城市地表能量平衡法复杂的计算过程。

附图说明

[0038] 图1为本发明方法流程图;
[0039] 图2为实施例1提供的北京市土地利用分布及环线分布图;
[0040] 图3为对比例1提供的方法结果图;
[0041] 图4为对比例2提供的方法结果图;
[0042] 图5为对比例3提供的方法结果图;
[0043] 图6为实施例1提供的本申请方法结果图;
[0044] 图7为本申请在2000年与对比例4在2000年的AHF结果与高空间分辨率的数据对比图;
[0045] 图8为本申请在2005年与对比例4在2004年的AHF结果与高空间分辨率的数据对比图;
[0046] 图9为本申请在2009年与对比例4在2008年的AHF结果与高空间分辨率的数据对比图;
[0047] 图10为本申请在2014年与对比例4在2016年的AHF结果与高空间分辨率的数据对比图。

具体实施方式

[0048] 下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
[0049] 实施例1
[0050] 参照图1,一种基于机器学习和遥感技术的城市人为热排放量估算方法,包括以下步骤:
[0051] (1)遥感数据获取
[0052] 下载时间和空间分辨率相同的遥感数据、气象数据、夜间灯光数据,其中遥感数据包括:地表反照率产品Albedo,地表反射率产品,比辐射率产品,地表温度产品LST,与地表反照率产品时间最接近的植被无明显变化时期的叶面积指数产品LAI,下垫面地表类型没有发生明显变化时期的土地覆盖/土地利用产品,地形数据DEM和夜间灯光数据;气象数据为太阳短波辐射和近地表(距地面2米)的空气温度。
[0053] 具体地说,由于城市扩张、人类活动极度频繁、大量工业排放等共同因素作用,北京城市生态环境形势严峻,城市热岛效应尤为突出。本实施例选择北京市6个主城区(东城区、西城区、海淀区、石景山区、丰台区和朝阳区)和新兴发展的3个卫星城区(昌平区、顺义区、通州区)为研究区域。参照图2,建设用地集中分布在主城区,林地和草地集中分布于研究区西部及城市公园,昌平区、顺义区、通州区的土地类型主要为耕地。
[0054] 本实施例共使用了5景覆盖研究区的,几乎无云的Landsat遥感影像,见下表:
[0055]日期 卫星系列 云量(%)
2000/05/24 Landsat5 0.94
2005/07/25 Landsat5 1.99
2009/07/20 Landsat5 3.58
2014/08/19 Landsat8 1.35
2020/08/13 Landsat8 0.2
[0056] (2)遥感数据预处理
[0057] 根据下载的地表反照率产品的空间分辨率,空间范围和投影坐标,将下载的地表反照率产品,地表反射率产品,比辐射率产品,地表温度产品、叶面积指数产品,土地覆盖/土地利用产品,DEM数据和夜间灯光数据分别做几何裁剪、几何纠正、重投影和空间重采样,使得不同数据源的地表参数数据进行完全配准。
[0058] (3)地表参数遥感反演
[0059] 改进型归一化水体指数(MNDWI):
[0060] 在近红外波段到中红外波段中,建筑物的反射率增强而水体的反射率持续降低,改进型归一化差异水体指数(ModifiedNDWI,MNDWI)利用此地物光谱特征能够有效区分水体与建筑物,可更有效突出水体信息。
[0061]
[0062] 式中,GREEN和MIR分别为Landsat数据的绿波段、中红外波段的反射率。
[0063] 归一化建筑指数(NDBI):
[0064] 建筑物在近红外波段和中红外波段的反射率增强,而其他类均减弱,因此NDBI指数可较为准确地提取城市中的建筑用地信息,高值通常意味着城市密集发展的地区。
[0065]
[0066] 式中,NIR和MIR分别为Landsat数据的近红外和中红外波段的反射率。
[0067] 归一化植被指数(NDVI):
[0068] 基于近红外波段和红波段反射率信号组合的归一化植被指数(Normalized Vegetation Index,NDVI)是对全球大部分区域植被状况变化最为敏感、同时应用最为广泛的指数之一。
[0069]
[0070] 式中,RED和NIR分别为Landsat数据的红波段和近红外波段的反射率。
[0071] 不透水地表覆盖度(ISA):
[0072] 使用线性光谱混合模型对混合像元中不透水地表的端元所占比例,将城市地表分为高反照率、地反照率、植被和裸土四种地表,高、低反照率分量之和为混合像元中不透水覆盖度:
[0073] Rimp,b=flowRlow,b+fhighRhigh,b+e0
[0074] 式中,Rimp,b为不透水地表覆盖度ISA,Rlow,b和Rhigh,b是低、高反照率,flow和fhigh是低、高反照率端元所占比例,e0是残差。
[0075] 地表净辐射估算:
[0076] 地表净辐射通量根据地表辐射平衡方程求得:
[0077] Rn=(1‑α)Rs+εaδT4‑εsδLST4
[0078] 式中α为地表反照率,Rs为太阳短波辐射,εs为地表比辐射率,δ为斯蒂芬—波耳兹曼常数,取值5.67×10‑8W/(m2·K4),εa为无云状态下的大气有效比辐射率通常设为1,T是近地表的空气温度,LST是地表温度。
[0079] (4)构建随机森林模型
[0080] 将郊区范围内遥感影像所有像元的LST作为因变量样本集,所有像元的NDVI、LAI、Albedo、ISA、NDBI、MNDWI、和DEM作为自变量样本集,根据自变量参数对地表温度进行响应拟合得到随机森林模型;对地表温度的遥感产品与随机森林模型的估算结果进行对比分析,分析模拟误差的大小及分布;对拟合函数进行纠偏,得到最后使用的随机森林模型。
[0081] 具体地说,本实施例利用5幅遥感影像分别构建了北京郊区(6环外)随机森林模型。随机森林模型的约束函数为均方根误差(RMSE)最小,为获取最优算法,使用网格搜索法历遍所有网格,求解目标函数并选择最优参数。估算精度结果如下表所示,相关系数都在0.8以上,RMSE小于1.5K,由此说明所构建的随机森林模型的有效性。
[0082]
[0083] (5)城区人为热估算
[0084] 将建立的随机森林模型应用于城区,得到城区无人为热排放时地表温度的估算结果;根据地表温度遥感产品得到地表净辐射真实值;根据辐射平衡方程,根据随机森林模型估算的地表温度结果得到无人为热排放时的地表净辐射值,计算两者之间的差值,即得到城区的人为热排放量。
[0085] 对比例1
[0086] 文献Global anthropogenic heat flux database with high spatial resolution[J].Atmospheric Environment,2017,150:276‑94.
[0087] 对比例2
[0088] 文献Global 1‑km present and future hourly anthropogenic heat flux[J].Sci Data,2021,8(1):64.
[0089] 对比例3
[0090] 文献A new global gridded anthropogenic heat flux dataset with high spatial resolution and long‑term time series[J].Sci Data,2019,6(1):139.[0091] 对比例4
[0092] 文献Mapping China's time‑series anthropogenic heat flux with inventory method and multi‑source remotely sensed data.Sci Total Environ,
2020,734:139457.
[0093] 实施例2
[0094] 实施例1基于城市区域的辐射平衡方程,将输入遥感反演产品与模型估算的两类地表温度数据,得到的辐射通量差值作为本申请中造成地表温度升温的人为热排放(AHF)。为验证本研究中人为热排放数据的可靠性,本实施例结合对比例1‑4现有的AHF数据集,对不同的估计结果进行比较分析。
[0095] 对比例1基于工业、交通与商业住宅等一次能源消耗开发了一种自上而下的估算全球人为热辐射(AHE)的方法,通过夜间灯光数据调节了中心城区的低估现象,数据具有30弧秒的空间分辨率和1小时的时间分辨率。对比例2在对比例1的数据基础上,考虑了城市道路扩张、社会GDP和人口分布的现在及未来AHE数据集。对比例3利用夜间灯光数据与不透水地表数据提取了城市区域,并根据人口密度与工业消耗量估算了全球1970‑2050年的人为热排放数据。由于研究方法和来源数据不同,估算结果往往具有不同的空间表达。因此,本申请的估计结果与最近年份的AHF产品数据集进行了比较,以进一步探讨不同估计方法的有效性和估计结果的空间表达性能。
[0096] 四种AHF产品在北京市主城区的结果如图3‑图6所示。总体而言,对于AHF高区域的检测范围是一致的,高排放区值普遍聚集在城市中心。本研究的AHF估计结果在数值和分布‑2范围上与对比例3的估计结果基本一致。北京市三环内的高值AHF可达40~50W·m ,三环至‑2
六环内的大部分区域为10‑30W·m 。从空间表达的角度来看,本研究的估计结果具有较高的空间异质性,能够反映人为热排放的局部特征。
[0097] 为进一步验证结果的可靠性,将本申请提出的北京市六环内各时段计算结果与现有的中国区域500m×500m的AHF数据产品进行空间分布与数值上的比较(对比例4),对比年份为相同时间或邻近年份。2000年、2005年、2009年、2014年的皮尔逊相关系数分别为:0.69、0.65、0.72、0.68。两种产品的空间分布一致(上部图组为对比例4,下部图组为本申请),四个时间段的东城区和西城区均为高值区域,海淀区、朝阳区与丰台区的中心区域人为热值明显高于其他区域。但本研究的结果数值偏高,由于采用的计算方法不同,年份不同,数值存在一定差异。两类数据具有较高的空间一致性。因此本研究的人为热排放数据具有一定的可信度。
[0098] 本发明通过遥感信息和机器学习手段实现了人为热排放量的估算,利用城市郊区忽略人为热排放影响的事实,在城市郊区建立地表温度及其影响因子(包括NDVI、LAI、Albedo、ISA、NDBI、MNDWI和DEM)的随机森林模型,基于此模型估算城区范围内无人为热排放影响的地表温度,再结合辐射平衡方程实现城区人为热排放量的估算。本方法全部使用较易获取的遥感数据和气象数据,因此数据获取便捷,易操作,应用性强,具有较强的推广性。与现有的方法相比,克服了排放清单法使用的城市能耗数据难以获取的瓶颈问题,避免了城市地表能量平衡法复杂的计算过程。
[0099] 于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
[0100] 此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。