基于滑坡形态复杂度的众包标注任务难度评估方法及系统转让专利

申请号 : CN202210983649.4

文献号 : CN115063694B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 殷跃平朱赛楠黄坚佟彬杜博文赵慧李鑫涂博文

申请人 : 中国地质环境监测院(自然资源部地质灾害技术指导中心)

摘要 :

本发明涉及一种基于滑坡形态复杂度的众包标注任务难度评估方法及系统,其方法包括:步骤S1:对于待发布的标注任务,利用事先训练好的基于光学遥感影像的滑坡语义分割识别模型进行预识别,得到一个滑坡标注结果;步骤S2:提取滑坡标注结果的轮廓曲线,计算轮廓曲线的全局距离熵与非圆性凹凸损失,根据全局距离熵和非圆性凹凸损失计算轮廓曲线的形态复杂度,根据形态复杂度确定待发布的标注任务的难度等级。本发明提供的方法可以在完全不需要任何地质专业知识的情况下自动完成对标注任务的难度的评估,并消除了滑坡大小差异对滑坡标注难度评估的影响。

权利要求 :

1.一种基于滑坡形态复杂度的众包标注任务难度评估方法,其特征在于,包括:步骤S1:对于待发布的标注任务,利用事先训练好的基于光学遥感影像的滑坡语义分割识别模型进行预识别,得到一个滑坡标注结果;

步骤S2:提取所述滑坡标注结果的轮廓曲线,计算所述轮廓曲线的全局距离熵与非圆性凹凸损失,根据所述全局距离熵和所述非圆性凹凸损失计算所述轮廓曲线的形态复杂度,根据所述形态复杂度确定所述待发布的标注任务的难度等级,具体包括:步骤S21:提取出所述滑坡标注结果的轮廓曲线,计算所述轮廓曲线的重心位置,如公式(1)所示: (1)

其中,(xo,yo)表示重心O的坐标,(xi,yi)表示所述轮廓曲线上任一点Pi的坐标,N为所述轮廓曲线上点的总数;

步骤S22:计算所有点Pi到O的欧氏距离,并找到距离O最远的点PD及其对应的距离D,以D/n为标准,设立n个距离区间;统计每个所述距离区间包含的轮廓点数量,得到全局距离分布A=[A0,A1,……,An−1],如公式(2)所示: (2)

其中,di表示所述轮廓曲线上的点Pi到重心O的距离,count()代表满足表达式的轮廓点的数量,Aj∈A;

步骤S23:计算所述轮廓曲线的全局距离熵Cd,公式(3)~(4)如下所示:(3)

 (4)

其中,pj表示距离分布的概率函数,公式(4)中系数 是为消除信息熵的量纲,将Cd归一化到[0,1]范围中;

步骤S24:定义一个与所述轮廓曲线具有相同周长的圆作为等效圆,计算非圆性凹凸损失M,公式(5)如下所示: (5)

其中,SE为所述等效圆面积,S为所述轮廓曲线的面积;

步骤S25:定义所述轮廓曲线的形态复杂度C,公式(6)如下所示: (6);

步骤S26:根据C的取值范围确定所述待发布的标注任务的难度等级。

2.一种基于滑坡形态复杂度的众包标注任务难度评估系统,其特征在于,包括下述模块:滑坡标注模块,用于对于待发布的标注任务,利用事先训练好的基于光学遥感影像的滑坡语义分割识别模型进行预识别,得到一个滑坡标注结果;

标注任务的难度等级确定模块,用于提取所述滑坡标注结果的轮廓曲线,计算所述轮廓曲线的全局距离熵与非圆性凹凸损失,根据所述全局距离熵和所述非圆性凹凸损失计算所述轮廓曲线的形态复杂度,根据所述形态复杂度确定所述待发布的标注任务的难度等级;具体包括:提取出所述滑坡标注结果的轮廓曲线,计算所述轮廓曲线的重心位置,如公式(1)所示: (1)

其中,(xo,yo)表示重心O的坐标,(xi,yi)表示所述轮廓曲线上任一点Pi的坐标,N为所述轮廓曲线上点的总数;

计算所有点Pi到O的欧氏距离,并找到距离O最远的点PD及其对应的距离D,以D/n为标准,设立n个距离区间;统计每个所述距离区间包含的轮廓点数量,得到全局距离分布A=[A0,A1,……,An−1],如公式(2)所示: (2)

其中,di表示所述轮廓曲线上的点Pi到重心O的距离,count()代表满足表达式的轮廓点的数量,Aj∈A;

计算所述轮廓曲线的全局距离熵Cd,公式(3)~(4)如下所示:(3)

 (4)

其中,pj表示距离分布的概率函数,公式(4)中系数 是为消除信息熵的量纲,将Cd归一化到[0,1]范围中;

定义一个与所述轮廓曲线具有相同周长的圆作为等效圆,计算非圆性凹凸损失M,公式(5)如下所示: (5)

其中,SE为所述等效圆面积,S为所述轮廓曲线的面积;

定义所述轮廓曲线的形态复杂度C,公式(6)如下所示: (6);

根据C的取值范围确定所述待发布的标注任务的难度等级。

说明书 :

基于滑坡形态复杂度的众包标注任务难度评估方法及系统

技术领域

[0001] 本发明涉及软件众包标注领域,具体涉及一种基于滑坡形态复杂度的众包标注任务难度评估方法及系统。

背景技术

[0002] 随着标注数据使用方式的不断发展,标注系统也经历了数次迭代。最初,大部分标注系统都是针对特定领域的特定任务所设计,典型的如序列标注、指代消解、句法结构等,或是多个任务的组合。随着数据规模的增长,单用户的系统己经不能满足需求,标注系统开始向多用户拓展。基于众包方法的高位远程地质灾害数据标注平台根据客户的目标场景补充训练和评测数据,通过自动化处理能力和海量标注能力,帮助用户解决大量数据需要加工和标注的场景,让用户快速获取到加工后的目标数据,为滑坡的研究提供数据支撑。
[0003] 然而,随着平台的不断建设,用户的能力评价体系已趋于完善,但与之配套的滑坡标注任务难度评定方法还没有落实,如何消除主观因素的影响,做到尽可能客观的难度评定,是平台任务分配流程中必不可少的一环。

发明内容

[0004] 为了解决上述技术问题,本发明提供一种基于滑坡形态复杂度的众包标注任务难度评估方法及系统。
[0005] 本发明技术解决方案为:一种基于滑坡形态复杂度的众包标注任务难度评估方法,包括:
[0006] 步骤S1:对于待发布的标注任务,利用事先训练好的基于光学遥感影像的滑坡语义分割识别模型进行预识别,得到一个滑坡标注结果;
[0007] 步骤S2:提取所述滑坡标注结果的轮廓曲线,计算所述轮廓曲线的全局距离熵与非圆性凹凸损失,根据所述全局距离熵和所述非圆性凹凸损失计算所述轮廓曲线的形态复杂度,根据所述形态复杂度确定所述待发布的标注任务的难度等级。
[0008] 本发明与现有技术相比,具有以下优点:
[0009] 本发明公开了一种基于滑坡形态复杂度的众包标注任务难度评估方法,可以在完全不需要任何地质专业知识的情况下自动完成对标注任务的难度的评估,消除了主观因素的干扰。本发明将圆作为最简单的图案,计算滑坡的非圆性凹凸损失,消除了滑坡大小差异对滑坡标注难度评估的影响。

附图说明

[0010] 图1为本发明实施例中一种基于滑坡形态复杂度的众包标注任务难度评估方法的流程图;
[0011] 图2为本发明实施例中滑坡语义分割识别模型输出的二值灰度示意图;
[0012] 图3为本发明实施例中全局距离分布的区间示意图;
[0013] 图4为本发明实施例中一种基于滑坡形态复杂度的众包标注任务难度评估系统的结构框图。

具体实施方式

[0014] 本发明提供了一种基于滑坡形态复杂度的众包标注任务难度评估方法,可以在完全不需要任何地质专业知识的情况下自动完成对标注任务的难度的评估,并消除了滑坡大小差异对滑坡标注难度评估的影响。
[0015] 为了使本发明的目的、技术方案及优点更加清楚,以下通过具体实施,并结合附图,对本发明进一步详细说明。
[0016] 实施例一
[0017] 如图1所示,本发明实施例提供的一种基于滑坡形态复杂度的众包标注任务难度评估方法,包括下述步骤:
[0018] 步骤S1:对于待发布的标注任务,利用事先训练好的基于光学遥感影像的滑坡语义分割识别模型进行预识别,得到一个滑坡标注结果;
[0019] 本发明实施例采用训练好的基于DeepLebv3的滑坡语义分割识别模型,并加入了分组机制与注意力机制,提升了模型识别效果。该模型的输入为滑坡的光学遥感影像,输出为0/255的二值灰度图,如图2所示,再通过opencv开源模块,可以提取出该灰度图中的滑坡轮廓作为滑坡标注结果;
[0020] 步骤S2:提取滑坡标注结果的轮廓曲线,计算轮廓曲线的全局距离熵与非圆性凹凸损失,根据全局距离熵和非圆性凹凸损失计算轮廓曲线的形态复杂度,根据形态复杂度确定待发布的标注任务的难度等级。
[0021] 为了评估滑坡轮廓的形态复杂度,本发明实施例从全局距离熵与非圆性凹凸损失两个维度进行评估。
[0022] 在一个实施例中,上述步骤S2:提取滑坡标注结果的轮廓曲线,计算轮廓曲线的全局距离熵与非圆性凹凸损失,根据全局距离熵和非圆性凹凸损失计算轮廓曲线的形态复杂度,根据形态复杂度确定待发布的标注任务的难度等级,具体包括:
[0023] 步骤S21:提取出初始结果的轮廓曲线,计算轮廓曲线的重心位置,如公式(1)所示:
[0024]  (1)
[0025] 其中,(xo,yo)表示重心O的坐标,(xi,yi)表示轮廓曲线上任一点Pi的坐标,N为轮廓曲线上点的总数;
[0026] 步骤S22:计算所有点Pi到O的欧氏距离,并找到距离O最远的点PD及其对应的距离D,以D/n为标准,设立n个距离区间;统计每个距离区间包含的轮廓点数量,得到全局距离分布A=[A0,A1,……,An−1],如公式(2)所示:
[0027]  (2)
[0028] 其中,di表示轮廓曲线上的点Pi到重心O的距离,count()代表满足该表达式的轮廓点的数量,Aj∈A;n的值由标注任务请求方自行决定;
[0029] 如图3所示,全局距离分布的区间示意图;
[0030] 步骤S23:计算轮廓曲线的全局距离熵Cd,如公式(3)~(4)所示:
[0031]  (3)
[0032]  (4)
[0033] 其中,pj表示距离分布的概率函数,公式(4)中系数 是为消除信息熵的量纲,将Cd归一化到[0,1]范围中,使得全局距离熵与后续的非圆性凹凸损失保持一致的量纲;当Cd→0时,说明全局距离波动越小,轮廓复杂度越低;当Cd→1时,轮廓复杂度越高;
[0034] 步骤S24:定义一个与轮廓曲线具有相同周长的圆作为等效圆,计算非圆性凹凸损失M,公式(5)如下所示:
[0035]  (5)
[0036] 其中,SE为等效圆面积,S为轮廓曲线的面积;
[0037] 本发明实施例中非圆性凹凸损失的定义来自于“圆是最简单的多边形”这一心理测试的结果,可以用于衡量滑坡原始轮廓在凹凸方面表现出来的复杂度。因此通过定义一个与滑坡轮廓具有相同周长的圆作为等效圆来计算滑坡轮廓的非圆性凹凸损失;由于在相同周长下,圆的面积最大,因此M的取值范围为[0,1],当M→0时,则轮廓越接近圆,复杂度越低;反之,复杂度越高;
[0038] 步骤S25:定义轮廓曲线的形态复杂度C,公式(6)如下所示:
[0039]  (6);
[0040] 步骤S26:根据C的取值范围确定待发布的标注任务的难度等级。
[0041] 本发明实施例以0.2为间隔可以设立5个难度等级:0≤C≤0.2对应难度一,0.2≤C≤0.4对应难度二,0.4
[0042] 本发明公开了一种基于滑坡形态复杂度的众包标注任务难度评估方法,可以在完全不需要任何地质专业知识的情况下自动完成对标注任务的难度的评估,消除了主观因素的干扰。本发明将圆作为最简单的图案,计算滑坡的非圆性凹凸损失,消除了滑坡大小差异对滑坡标注难度评估的影响。
[0043] 实施例二
[0044] 如图4所示,本发明实施例提供了一种基于滑坡形态复杂度的众包标注任务难度评估系统,包括下述模块:
[0045] 滑坡标注模块31,用于对于待发布的标注任务,利用事先训练好的基于光学遥感影像的滑坡语义分割识别模型进行预识别,得到一个滑坡标注结果;
[0046] 标注任务的难度等级确定模块32,用于提取滑坡标注结果的轮廓曲线,计算轮廓曲线的全局距离熵与非圆性凹凸损失,根据全局距离熵和非圆性凹凸损失计算轮廓曲线的形态复杂度,根据形态复杂度确定待发布的标注任务的难度等级。
[0047] 提供以上实施例仅仅是为了描述本发明的目的,而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改,均应涵盖在本发明的范围之内。