一种遥感智能解译样本数据集生成方法转让专利

申请号 : CN202311662340.6

文献号 : CN117349462B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张耘峰付垒谢涛郭超卢婷高海峰李宁杨张瑜柴茜冯晓天郝旋捷张辉李映

申请人 : 自然资源陕西省卫星应用技术中心西北工业大学

摘要 :

本申请属于遥感影像技术领域,具体公开了一种遥感智能解译样本数据集生成方法,包括:对标注矢量的属性表进行处理;对影像数据和已有的标注矢量进行处理,将标注矢量转为栅格并将其与影像数据进行对齐;将设置好的影像数据进行切割,使用栅格处理工具对数据进行处理,生成大规模样本集;对样本集进行挑选;将样本集进行整理,并按区域进行命名。本申请利用已有的标注矢量数据,通过挖掘矢量数据和遥感影像之间的关系,批量化生产样本,大幅提升了数据集的规模,提升了效率,降低了制作样本集成本。

权利要求 :

1.一种遥感智能解译样本数据集生成方法,包括变化检测样本集的生成和语义分割样本集的生成,其特征在于,包括以下步骤:步骤1:对标注矢量的属性表进行处理;

步骤2:对影像数据和影像数据已有的标注矢量进行处理,将标注矢量转为栅格并将其与影像数据进行对齐,得到已处理影像数据;

步骤3:将已处理影像数据进行切割,使用栅格处理工具对数据进行处理,生成大规模样本集,在切割时通过分割越界模块判断边缘是否存在分割越界,若存在分割越界,则舍弃边缘越界的样本;

所述分割越界模块包括判断单元、验证框单元和滑动窗口单元;

所述判断单元用于判断影像数据的大小;

所述验证框单元基于切割窗口设定,用于对分割边界进行检测;

所述滑动窗口单元设置在验证框单元上部,并在所述切割窗口内部按照预设轨迹滑动,用于判断分割边界是否越界;

步骤4:对样本集进行挑选;

步骤5:将样本集进行整理,并按区域进行命名;

所述步骤1中,对于变化检测样本,所述标注矢量的属性表进行处理包括:为分类矢量图层属性表添加字段,并使用字段计算器批量赋值,设置变化灰度值、未变化灰度值以及影像区域外的灰度值;

所述步骤1中,对于语义分割样本,所述标注矢量的属性表进行处理包括:栅格数据中各类别的像元灰度值设置为不同的大小并设置影像区域外灰度值;

所述步骤2中,对于变化检测样本:

所述影像数据包括两景影像,并保证所述两景影像的像元大小和空间参考坐标保持一致;所述影像数据和已有的标注矢量进行处理包括:将两景影像进行裁剪,所述裁剪是以行列更小的为基准进行裁剪或根据地图边界进行裁剪;

使用ArcMap数据管理工具中的合并功能,将所有的变化矢量图层进行合并;

对合并的矢量图层添加面矢量,得到分类矢量;

所述步骤1和步骤2中,对于语义分割样本:

所述的标注矢量选自第三次全国国土调查,并按照预先设置的类别对标注矢量进行处理;所述影像数据和已有的标注矢量进行处理包括:使用ArcMap转换工具中的面转栅格功能将标注矢量图层转换为栅格数据。

2.根据权利要求1所述的一种遥感智能解译样本数据集生成方法,其特征在于,所述类别至少包括耕地、园地、林地、草地、建设用地、道路、水体用地。

3.根据权利要求2所述的一种遥感智能解译样本数据集生成方法,其特征在于,所述步骤3中,影像数据进行切割包括:使用栅格空间数据转换库对栅格数据进行处理,使用预设的固定分辨率对整个栅格数据进行自动化切割,生成固定分辨率的样本。

4.根据权利要求3所述的一种遥感智能解译样本数据集生成方法,其特征在于,所述切割的顺序是从左上到右下依次对数据进行切割,切割窗口分辨率设置为512*512。

5.根据权利要求4所述的一种遥感智能解译样本数据集生成方法,其特征在于,所述步骤4中,通过样本筛选模块对样本进行挑选;

所述样本筛选模块包括传输单元和若干个筛选单元,每个所述筛选单元对应设置有一标记单元;

所述筛选单元用于读取每一样本的数值矩阵,并检测数值矩阵的灰度值;

所述标记单元用于标记每一样本的权值,并基于所述权值选择传输单元;

所述传输单元至少包括变化检测样本传输单元和语义分割样本传输单元;

所述筛选单元读取样本集中的每一个样本的数值矩阵,并检测数值矩阵的灰度值,所述标记单元对每一个样本进行权值标记,基于所述权值标记判断样本属性,所述样本属性包括变化检测样本和语义分割样本;所述变化检测样本传输单元将变化检测样本中未变化灰度值以及影像区域外的灰度值的样本全部剔除,得到变化检测样本集;所述语义分割样本传输单元将语义分割样本中影像区域外灰度值的样本全部剔除,得到语义分割样本集。

6.根据权利要求5所述的一种遥感智能解译样本数据集生成方法,其特征在于,利用神经网络模型分别对所述变化检测样本集和语义分割样本集进行评估和修正,输出数据集;

所述神经网络模型内置有分割评估模块、检测评估模块和样本集修正模块;

所述分割评估模块与所述分割越界模块连接,用于将所述变化检测样本集和语义分割样本集的样本进行边缘越界判断,若存在分割边缘越界,则舍弃边缘越界的样本,所述样本集修正模块更新所述变化检测样本集和语义分割样本集;

所述检测评估模块与样本筛选模块连接,用于将所述变化检测样本集中未变化灰度值以及影像区域外的灰度值的样本全部剔除,所述样本集修正模块更新变化检测样本集;以及,将语义分割样本集中影像区域外灰度值的样本全部剔除,所述样本集修正模块更新语义分割样本集。

说明书 :

一种遥感智能解译样本数据集生成方法

技术领域

[0001] 本申请涉及一种遥感智能解译样本数据集生成方法,属于遥感影像技术领域。

背景技术

[0002] 遥感作为一项对地观测综合性技术,具有探测范围广、采集数据快、获取数据综合性与动态性强等特征,在山水林田湖草沙冰等自然资源监测工作中有其他技术无法比拟的优势,但是依靠传统人机交互进行识别解译,不仅效率较低,而且过多主观判断的加入也容易导致标准执行不统一,为了解决自然资源要素解译生产工作量大、人工采集耗费时间长等问题,需要引入人工智能等先进技术。目前大部分人工智能遥感智能解译大多采取监督学习的方法,利用监督学习的方法对海量遥感数据进行智能解译的基础是对同样海量的特定解译对象已标注样本的训练工作,因此建立遥感智能解译样本数据集非常重要,是实现遥感智能解译的首要条件。
[0003] 目前大多数的遥感智能解译样本数据集生成方法是依靠传统人机交互解译、定性评价,再对遥感影像和标注矢量结果进行切分得到数据集,但是这样的方法耗时耗力,效率低下,质量难以保证,难以构建大规模的样本集。

发明内容

[0004] 本发明的目的在于克服现有技术样本解译效率低的缺陷,提供了一种遥感智能解译样本数据集生成方法。
[0005] 本申请提供了一种遥感智能解译样本数据集生成方法,该方法利用已有的标注矢量数据,通过挖掘矢量数据和遥感影像中像元和具体标注信息之间的关系,批量化生产样本,大幅提升了数据集的规模,提升了效率,降低了制作样本集成本。
[0006] 所述遥感智能解译样本数据集生成方法,包括变化检测样本集的生成和语义分割样本集的生成,包括以下步骤:
[0007] 步骤1:对标注矢量的属性表进行处理;
[0008] 步骤2:对影像数据和影像数据已有的标注矢量进行处理,将标注矢量转为栅格并将其与影像数据进行对齐,得到已处理影像数据;
[0009] 步骤3:将已处理影像数据进行切割,使用栅格处理工具对数据进行处理,生成大规模样本集;
[0010] 步骤4:对样本集进行挑选;
[0011] 步骤5:将样本集进行整理,并按区域进行命名。
[0012] 可选地,所述步骤2中,对于变化检测样本:
[0013] 所述影像数据包括两景影像,并保证所述两景影像的像元大小和空间参考坐标保持一致;所述影像数据和已有的标注矢量进行处理包括:
[0014] 将两景影像进行裁剪,所述裁剪是以行列更小的为基准进行裁剪或根据地图边界进行裁剪;
[0015] 使用ArcMap数据管理工具中的合并功能,将所有的变化矢量图层进行合并;
[0016] 对合并的矢量图层添加面矢量,得到分类矢量;
[0017] 所述步骤1和步骤2中,对于语义分割样本:
[0018] 所述的标注矢量选自第三次全国国土调查,并按照预先设置的类别对标注矢量进行处理;所述影像数据和已有的标注矢量进行处理包括:使用ArcMap转换工具中的面转栅格功能将标注矢量图层转换为栅格数据。
[0019] 可选地,所述类别至少包括耕地、园地、林地、草地、建设用地、道路、水体以及其他用地。
[0020] 可选地,所述步骤1中,对于变化检测样本,所述标注矢量的属性表进行处理包括:为分类矢量图层属性表添加字段,并使用字段计算器批量赋值,设置变化灰度值、未变化灰度值以及影像区域外的灰度值;
[0021] 所述步骤1中,对于语义分割样本,所述标注矢量的属性表进行处理包括:栅格数据中各类别的像元灰度值设置为不同的大小并设置影像区域外灰度值。
[0022] 可选地,所述步骤3中,影像数据进行切割包括:使用栅格空间数据转换库对栅格数据进行处理,使用预设的固定分辨率对整个栅格数据进行自动化切割,生成固定分辨率的样本。
[0023] 可选地,所述切割的顺序是从左上到右下依次对数据进行切割,切割窗口分辨率设置为512*512。
[0024] 可选地,在切割时通过分割越界模块判断边缘是否存在分割越界,若存在分割越界,则舍弃边缘越界的样本;
[0025] 所述分割越界模块包括判断单元、验证框单元和滑动窗口单元;
[0026] 所述判断单元用于判断影像数据的大小;
[0027] 所述验证框单元基于所述切割窗口设定,用于对分割边界进行检测;
[0028] 所述滑动窗口单元设置在验证框单元上部,并在所述切割窗口内部按照预设轨迹滑动,用于判断分割边界是否越界。
[0029] 可选地,所述步骤4中,通过样本筛选模块对样本进行挑选;
[0030] 所述样本筛选模块包括传输单元和若干个筛选单元,每个所述筛选单元对应设置有一标记单元;
[0031] 所述筛选单元用于读取每一样本的数值矩阵,并检测数值矩阵的灰度值;
[0032] 所述标记单元用于标记每一样本的权值,并基于所述权值选择传输单元;
[0033] 所述传输单元至少包括变化检测样本传输单元和语义分割样本传输单元;
[0034] 所述筛选单元读取样本集中的每一个样本的数值矩阵,并检测数值矩阵的灰度值,所述标记单元对每一个样本进行权值标记,基于所述权值标记判断样本属性,所述样本属性包括变化检测样本和语义分割样本;所述变化检测样本传输单元将变化检测样本中未变化灰度值以及影像区域外的灰度值的样本全部剔除,得到变化检测样本集;所述语义分割样本传输单元将语义分割样本中影像区域外灰度值的样本全部剔除,得到语义分割样本集。
[0035] 可选地,利用神经网络模型分别对所述变化检测样本集和语义分割样本集进行评估和修正,输出数据集;
[0036] 所述神经网络模型内置有分割评估模块、检测评估模块和样本集修正模块;
[0037] 所述分割评估模块与所述分割越界模块连接,用于将所述变化检测样本集和语义分割样本集的样本进行边缘越界判断,若存在分割边缘越界,则舍弃边缘越界的样本,所述样本集修正模块更新所述变化检测样本集和语义分割样本集;
[0038] 所述检测评估模块与样本筛选模块连接,用于将所述变化检测样本集中未变化灰度值以及影像区域外的灰度值的样本全部剔除,所述样本集修正模块更新变化检测样本集;以及,将语义分割样本集中影像区域外灰度值的样本全部剔除,所述样本集修正模块更新语义分割样本集。
[0039] 本申请能产生的有益效果包括:
[0040] 1、本发明利用已有的标注矢量数据,通过挖掘矢量数据和遥感影像之间的关系,批量化生产样本,大幅提升了数据集的规模,提升了效率,降低了制作样本集成本。
[0041] 2、本发明通过样本挑选算法对生成的样本进行处理,提升样本的质量,清除了非影像数据以及非变化数据,确保样本集的质量,大大降低了人工成本,提升了样本质量。
[0042] 3、本发明通过深度学习算法以迭代的方式提升样本集的可用性,使用变化检测、语义分割等算法对生成的样本进行训练、测试,对于样本集中有问题的样本进行修改,不断对样本集进行改进,确保样本可以用于后期的行业应用。
[0043] 4、本发明利用地学分析库,可以快速、批量裁剪影像和标注数据,并可以去除地理坐标等敏感信息,减少冗余操作,提高样本集的安全性。

附图说明

[0044] 图1为本发明的遥感智能解译样本数据集生成方法示意图;
[0045] 图2 为本发明样本筛选方法示意图;
[0046] 图3为本发明变化检测算法召回率变化示意图;
[0047] 图4为本发明变化检测算法精准率变化示意图;
[0048] 图5为本发明语义分割样本集结果示意图;
[0049] 图6为本发明变化检测样本集结果示意图;
[0050] 图7为本发明中进行边缘检测时的示意图;
[0051] 其中,图3和图4为本发明提供的深度学习模型训练结果图,即该模型在训练过程中,通过不断的迭代得到的召回率和精确率的曲线图。

具体实施方式

[0052] 为了使本发明的目的、技术方案、设计方法及优点更加清楚明了,以下结合附图通过具体实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。
[0053] 如图1所示,本发明提供了一种遥感智能解译样本数据集生成方法,用于生成通用变化检测和语义分割样本集流程图,其输入为遥感原始影像和标注矢量,经过数据处理,样本生成,样本质量提升,输出目标样本集;包括变化检测样本集的生成和语义分割样本集的生成,包括以下步骤:
[0054] S1:对标注矢量的属性表进行处理,对于变化检测样本,将变化灰度值设置为255,未变化灰度值设置为0,对于影像区域外的灰度值设置为200特殊值便于后期筛选,对于语义分割样本,将耕地、园地、林地、草地、建设用地、道路、水体以及其他用地的灰度值分别设置为30,60,90,120,150,180,210以及240。
[0055] S2:对影像和S1中处理好的标注矢量进行处理,将矢量转为栅格并将其与影像数据进行对齐,其中,对齐包括像元大小和行列大小。
[0056] S3:将S2中处理好的栅格数据进行切割,使用栅格处理工具对数据进行处理,生成大规模样本,采用从左上到右下的顺序,依次对数据进行切割,为了使用方便,将切割窗口大小设置为512*512,遇到边缘部分可能存在分割越界情况,故添加是否超出边界判断条件,若切割数据范围超过边界,则进行舍弃,在本实施例中,通过分割越界模块判断边缘是否存在分割越界,具体的,所述分割越界模块包括判断单元、验证框单元和滑动窗口单元;
[0057] 所述判断单元用于判断影像数据的大小;
[0058] 所述验证框单元基于所述切割窗口设定,用于对分割边界进行检测;
[0059] 所述滑动窗口单元设置在验证框单元上部,并在所述切割窗口内部按照预设轨迹滑动,用于判断分割边界是否越界。
[0060] 在上述中,所述验证框单元基于所述切割窗口设定是指:通过获取切割窗口的配置参数,将所述配置参数应用在所述验证框单元,其中,配置参数仅包含了规则参数,也就是说,所述验证框单元具有所述切割窗口的规格参数(一般不能设置相同或者大于切割窗口的大小,在本申请中,由于切割后的影像样本图像是既定大小的,因此将影像样本图像输入至指定位置,且该位置的规格大小与影像样本图像一致,因此不需要进行位置的重复定位),或者是小于切割窗口的规格参数。
[0061] 当所述验证框单元的规格小于切割窗口的规格参数时,在进行对分割边界检测时,将所述验证框单元沿切割后的影像样本图像的某一个边进行设置,并使得影像样本图像的边缘的部分位于验证框单元内;同时设定所述验证框单元沿滑动窗口单元的移动而同步移动,以使得所述滑动窗口单元在滑动检测过程中能够对影像样本图像进行全面覆盖检测。
[0062] 其中,所述验证框单元为一正方形的验证框,以正方形的中心构成的横向设置的第一轴线和竖向设置的第二轴线交叉,且所述验证框单元以第一轴线沿影像样本图像横向边缘移动,以第二轴线进行竖向边缘移动。
[0063] 附图7中是由A位置移动至B位置的示意图。
[0064] S4:对样本进行挑选,将影像区域外,以及未含有变化区域的样本剔除;如图2所示,将样本集中的每一个样本进行读取数值矩阵,对于变化检测样本集中的样本,将含有影像区域外数值200的全部去除,并将未含有变化数值255的全部去除,对于语义分割数据集,将含有影像区域外数值200的全部去除即可。在本实施例中,通过样本筛选模块对样本进行挑选;具体的,所述样本筛选模块包括传输单元和若干个筛选单元,每个所述筛选单元对应设置有一标记单元;
[0065] 所述筛选单元用于读取每一样本的数值矩阵,并检测数值矩阵的灰度值;
[0066] 所述标记单元用于标记每一样本的权值,并基于所述权值选择传输单元;
[0067] 所述传输单元至少包括变化检测样本传输单元和语义分割样本传输单元;
[0068] 所述筛选单元读取样本集中的每一个样本的数值矩阵,并检测数值矩阵的灰度值,所述标记单元对每一个样本进行权值标记,基于所述权值标记判断样本属性,所述样本属性包括变化检测样本和语义分割样本;所述变化检测样本传输单元将变化检测样本中未变化灰度值以及影像区域外的灰度值的样本全部剔除,得到变化检测样本集;所述语义分割样本传输单元将语义分割样本中影像区域外灰度值的样本全部剔除,得到语义分割样本集。
[0069] S5:训练深度神经网络模型。对于变化检测样本集,使用基于FCNN设计的端到端变化检测算法fully‑convolutional‑change‑detection,将样本集全部划分为训练集对模型进行训练,使用SGD优化器,动量为0.9,采用小批量梯度下降的策略进行模型参数更新,每一次的迭代选取定量的数据进行训练,误差随着训练迭代次数的增加而减少,最后不断收敛,将训练好的模型对样本集进行测试并可视化效果,精确率和召回率曲线如图3、图4所示,对于模型结果与标注结果有较大的差距的进行判断后选择性删除样本。对于语义分割样本集,使用DeepLabv3+高分辨率遥感影像语义分割,它的编码器的主体是带有空洞卷积的DCNN,可以采用常用的分类网络如ResNet,带有空洞卷积的空间金字塔池化模块,主要是为了引入多尺度信息,相比DeepLabv3,v3+引入了Decoder模块,其将底层特征与高层特征进一步融合,提升分割边界准确度,训练策略与上文的变化检测样本集训练策略一致。在本实施例中,神经网络模型在对样本集进行测试的同时,还可以对样本集进行评估和修正,具体的,通过分割评估模块、检测评估模块和样本集修正模块实现;所述分割评估模块与所述分割越界模块连接,用于将所述变化检测样本集和语义分割样本集的样本进行边缘越界判断,若存在分割边缘越界,则舍弃边缘越界的样本,所述样本集修正模块更新所述变化检测样本集和语义分割样本集;
[0070] 所述检测评估模块与样本筛选模块连接,用于将所述变化检测样本集中未变化灰度值以及影像区域外的灰度值的样本全部剔除,所述样本集修正模块更新变化检测样本集;以及,将语义分割样本集中影像区域外灰度值的样本全部剔除,所述样本集修正模块更新语义分割样本集。
[0071] S6:将样本进行整理,并按区域进行命名,得到高质量、高可用的大规模样本集,如图5和图6所示。
[0072] 基于上述方法,本发明还具体公开了变化检测样本集和语义分割样本集的生成方法,其中变化检测样本集的生成方法包括:
[0073] 步骤A1、查看两景影像的像元大小和空间参考坐标系是否一致,若不一致调整为一致的像元大小和空间参考;
[0074] 步骤A2、将两景影像进行裁剪,以便大小对齐,一般裁剪是以行列更小的为基准进行裁剪,也可以根据地图边界进行裁剪;
[0075] 步骤A3 、使用ArcMap数据管理工具中的合并功能,将所有的变化矢量图层进行合并;
[0076] 步骤A4、 对合并的矢量图层添加面矢量,以便包含整个全图,得到分类矢量;
[0077] 步骤A5 、为分类矢量图层属性表添加字段,并使用字段计算器批量赋值,图斑值设为0,外框值设为255,以便于分类;
[0078] 步骤A6 、使用ArcMap转换工具中的面转栅格功能将分类矢量转换为栅格;
[0079] 步骤A7 、为了修改value值进行重分类,不同数值代表不同类别,可以自定义设置,在变化检测中一般变化设置为0,未变化设置为255。
[0080] 步骤A8 、为了修改像素通道和NoData值,使用复制栅格工具,一般变化标注使用单通道即可;
[0081] 步骤A9、使用GDAL(栅格空间数据转换库)对栅格数据进行处理,使用预设的固定大小对整个栅格数据进行自动化切割,生成固定分辨率的样本,比如512*512;
[0082] 步骤A10、对样本进行挑选,将影像区域外以及没有发生变化的样本全部剔除,只留下含有变化的样本,即,将含有影像区域外数值200的全部去除,并将未含有变化数值255的全部去除;
[0083] 步骤A11、采用变化检测算法对生成的样本进行模型训练,并对样本进行测试,查看样本用于训练是否达到理想的效果。
[0084] 语义分割样本集的生成方法包括以下步骤:
[0085] 步骤B1、将三调中的标注矢量按照设计的类别进行处理;
[0086] 步骤B2、使用ArcMap转换工具中的面转栅格功能将标注矢量图层转换为栅格数据;
[0087] 步骤B3、将栅格数据中各类别的像元灰度值设置为不同的大小;
[0088] 步骤B4、将标注矢量和遥感影像通过切割的方式进行行列对齐和像元大小对齐;
[0089] 步骤B5、使用GDAL(栅格空间数据转换库)对栅格数据进行处理,使用预设的固定大小对整个栅格数据进行自动化切割,生成固定分辨率的样本;
[0090] 步骤B6、对样本进行挑选,将影像区域外的样本全部剔除,只留下含有完整数据的样本;
[0091] 步骤B7、采用语义分割算法对生成的样本进行模型训练,并对样本进行测试,查看样本用于训练是否达到理想的效果;
[0092] 以上所述,仅是本申请的实施例,并非对本申请做任何形式的限制,虽然本申请以较佳实施例揭示如上,然而并非用以限制本申请,任何熟悉本专业的技术人员,在不脱离本申请技术方案的范围内,利用上述揭示的技术内容做出些许的变动或修饰均等同于等效实施案例,均属于技术方案范围内。