一种基于大数据计算的航空重力数据物性层析处理方法转让专利

申请号 : CN201810087931.8

文献号 : CN108205161B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 熊盛青王林飞刘国峰薛典军李芳何辉闫浩飞

申请人 : 中国国土资源航空物探遥感中心

摘要 :

一种基于大数据计算的航空重力数据物性层析处理方法,包括以下步骤:对地下网格剖分形成的小立方体总数进行切分,构建RDD,并持久化到内存;计算概率函数;计算地下网格的密度;迭代计算地表网格重力正演数据和地下网格密度;输出地下网格密度。本发明将重力层析反演问题由传统的欠定方程求解方法,转变成为正演迭代计算方法,计算步骤简单、计算过程稳定、计算结果准确度高;采用大数据分布式并行计算框架Spark,使上述迭代计算和复杂多路处理过程可以充分借助内存数据存储实现,达到了接近实时的处理效果。

权利要求 :

1.一种基于大数据计算的航空重力数据物性层析处理方法,其特征在于:包括以下步骤:B1:对地下网格剖分形成的小立方体总数进行切分,构建RDD,并持久化到内存;

B2:通过按照地表网格采集到的航空重力数据d1,计算概率函数ηq:其中,N为航空重力数据d1中数据采集点的数量,Δg(x,y,z)为航空重力数据d1中位于地表(x,y,z)采集点的重力异常测量值,Δgu(x,y,z)为地表(x,y,z)采集点重力异常的格林函数;

B3:计算地下网格的密度mq:

mq=Δρ·ηq(2)

B4:迭代计算地表网格重力正演数据d2和地下网格密度mq;

所述步骤B4中计算地表网格重力正演数据d2和地下网格密度mq的迭代步骤如下:B4.1:对RDD进行MAP算子,按照地表网格计算各自的重力正演数据d2;

其中,Δg(x,y,z)为重力正演数据d2中位于地表(x,y,z)采集点的重力异常正演值,G为万有引力常数,Q为地下网格剖分形成的小立方体的数量,(xq,yq,zq)为地下网格剖分形成的某个小立方体的中心点坐标,Δρq是所述小立方体的密度,Δvq是所述小立方体的体积;

B4.2:对RDD进行Reduce算子,合并重力正演数据d2;

B4.3对重力正演数据与航空重力数据之间的差值d2-d1,应用公式(1)计算得到概率函数偏差ηq′;

B4.4更新地下网格密度mq:

mq=mq+Δρ·ηq′(4)

B4.5:重复步骤B4.1至B4.4,直到重力正演数据d2与航空重力数据d1均方误差恒定或最小;

B5:输出地下网格密度mq。

说明书 :

一种基于大数据计算的航空重力数据物性层析处理方法

技术领域

[0001] 本发明属于重力勘探技术领域,涉及一种航空重力数据物性层析反演计算方法,特别是涉及一种基于大数据计算的航空重力数据物性层析处理方法。

背景技术

[0002] 重力勘探是一种传统的地球物理勘探方法,是矿产资源和地质构造研究的主要技术手段。例如,《重力勘探及其应用》(科技创新导报,2013.08,第240页)公开了一种重力勘探方法,通过对地表采集的重力异常数据进行数学计算,可以反演出地下不同深度的岩石密度分布。传统的重力反演方法是通过将采集的数据和模型计算的数据的差值最小二乘意义下最小化建立目标函数,进而反演求解。该方法通常面临欠定方程求解问题,解不稳定、计算量巨大、计算结果精细度低,难以将大面积区域采集的大规模航空重力数据进行反演计算。

发明内容

[0003] 本发明的目的在于克服现有技术的缺陷,提供一种计算步骤简单、计算过程稳定快捷、计算结果准确度高的基于大数据计算的航空重力数据物性层析处理方法[0004] 为实现上述目的,本发明采用了如下技术方案:
[0005] 一种基于大数据计算的航空重力数据物性层析处理方法,包括以下步骤:
[0006] B1:对地下网格剖分形成的小立方体总数进行切分,构建RDD,并持久化到内存;
[0007] B2:通过按照地表网格采集到的航空重力数据d1,计算概率函数ηq:
[0008]
[0009] 其中,N为航空重力数据d1中数据采集点的数量,Δg(x,y,z)为航空重力数据d1中位于地表(x,y,z)采集点的重力异常测量值,Δgu(x,y,z)为地表(x,y,z)采集点重力异常的格林函数;
[0010] B3:计算地下网格的密度mq:
[0011] mq=Δρ·ηq  (2)
[0012] B4:迭代计算地表网格重力正演数据d2和地下网格密度mq;
[0013] B5:输出地下网格密度mq。
[0014] 进一步,所述步骤B4中迭代计算地表网格重力正演数据d2和地下网格密度mq的步骤如下:
[0015] B4.1:对RDD进行MAP算子,按照地表网格计算各自的重力正演数据d2;
[0016]
[0017] 其中,Δg(x,y,z)为重力正演数据d2中位于地表(x,y,z)采集点的重力异常正演值,G为万有引力常数,Q为地下网格剖分形成的小立方体的数量,(xq,yq,zq)为地下网格剖分形成的某个小立方体的中心点坐标,Δρq是所述小立方体的密度,Δvq是所述小立方体的体积;
[0018] B4.2:对RDD进行Reduce算子,合并重力正演数据d2;
[0019] B4.3对重力正演数据与航空重力数据之间的差值d2-d1,应用公式(1)计算得到概率函数偏差ηq′;
[0020] B4.4更新地下网格密度mq:
[0021] mq=mq+Δρ·ηq′  (4)
[0022] B4.5:重复步骤B4.1至B4.4,直到重力正演数据d2与航空重力数据d1均方误差恒定或最小。
[0023] 本发明提出的一种基于大数据计算的航空重力数据物性层析处理方法,一是将重力层析反演问题由传统的欠定方程求解方法,转变成为正演迭代计算方法,计算步骤简单、计算过程稳定、计算结果准确度高;二是采用大数据分布式并行计算框架Spark,使上述迭代计算和复杂多路处理过程可以充分借助内存数据存储实现,通过分布式内存动态数据集RDD实现内存数据共享,将过程中生成的正演计算结果保存在内存不是将其写入磁盘,同时使用成本更低的Shuffle操作对重力数据计算结果进行合并,有效减少磁盘IO的时间、提升了运算速度,达到了接近实时的处理效果。

附图说明

[0024] 图1是采用传统的单CPU计算方法与采用实施例2所述计算方法的计算耗时对比图;
[0025] 图2是采用实施例2所述计算方法对数据模型的三维反演效果叠合示意图。

具体实施方式

[0026] 以下结合附图1,进一步说明本发明一种应用于大数据计算的航空重力数据物性层析计算方法的具体实施方式。本发明一种应用于大数据计算的航空重力数据物性层析计算方法不限于以下实施例的描述。
[0027] 实施例1:
[0028] 本实施例给出一种应用于大数据计算的航空重力数据物性层析计算方法的计算原理及步骤。
[0029] 重力层析反演的基本原理是将地下反演空间剖分成大小相等的小立方体,在每个立方体内,认为密度恒定。重力层析反演公式的推导要从重力正演计算公式出发,重力正演计算公式为:
[0030]
[0031] 其中,Δg(x,y,z)为地表(x,y,z)处的重力异常值,G为万有引力常数,(xq,yq,zq)为地下网格剖分形成的某个小立方体的中心点坐标,Δρq为所述小立方体的密度,Δvq为所述小立方体的体积,Q为地下网格剖分形成的小立方体的数量,该公式表示地下Q个小立方体对地表(x,y,z)处产生的重力异常贡献的和(即测量或计算获得的重力数据)。
[0032] 对于单位质量的小立方体,其ΔρqΔvq为单位值,其产生的重力数据可表示为:
[0033]
[0034] 公式(5)是重力异常的格林函数。
[0035] 结合公式(3)和(5),可建立如下的方程:
[0036]
[0037] 其中,N为重力数据中数据采集点的数量,ηq为概率函数,表示地下某个小立方体在对地表重力异常(即重力数据)的贡献值的概率。
[0038] 对于按照地表网格采集的航空重力数据,通过公式(1)进行迭代计算,可以将概率函数ηq转化成为地下网格的密度ρq,具体步骤如下:
[0039] A1:通过按照地表网格采集到的航空重力数据d1,计算概率函数ηq:
[0040]
[0041] 其中,N为航空重力数据d1中数据采集点的数量,Δg(x,y,z)为航空重力数据d1中位于地表(x,y,z)采集点的重力异常测量值,Δgu(x,y,z)为地表(x,y,z)采集点重力异常的格林函数;
[0042] A2:计算地下网格的密度mq:
[0043] mq=Δρ·ηq  (2)
[0044] 其中,Δρ为迭代计算的步进量,为一个预设的密度值;当Δρ取值较小时,计算结果将更为精准,但是需要进行更多的迭代计算次数;
[0045] A3:按照地表网格计算重力正演数据d2;
[0046]
[0047] 其中,Δg(x,y,z)为重力正演数据d2中位于地表(x,y,z)采集点的重力异常正演值,G为万有引力常数,Q为地下网格剖分形成的小立方体的数量,(xq,yq,zq)为地下网格剖分形成的某个小立方体的中心点坐标,Δρq是所述小立方体的密度,Δvq是所述小立方体的体积;
[0048] A4:对重力正演数据与航空重力数据之间的差值d2-d1,应用公式(1)计算得到概率函数偏差ηq′。
[0049] A5:更新地下网格密度mq:
[0050] mq=mq+Δρ·ηq′  (4)
[0051] A6:重复步骤A3至A5,直到重力正演数据d2与航空重力数据d1均方误差恒定或最小,输出地下网格密度mq。
[0052] 本实施例给出的一种应用于大数据计算的航空重力数据物性层析计算方法,一是计算步骤简单、计算过程稳定、计算结果准确度高;二是将重力层析反演问题由传统的欠定方程求解方法,转变成为正演迭代计算方法,通过对概率函数的迭代式密度转化实现航空重力数据的物性分布计算,非常适用于大数据计算框架Spark进行运算加速。
[0053] 实施例2:
[0054] 本实施例给出一种采用大数据计算框架Spark进行实施例1所述航空重力数据物性层析计算方法的具体实施方式。
[0055] Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab(加州大学伯克利分校的AMP实验室)所开源的类似Hadoop MapReduce的通用并行框架。Spark可以利用DAG进行调度执行规划,可以处理多步复杂的作业,并且对于每一个任务启动一个线程,而不是启动进程,大大缩短了任务启动时间。实施例1中所述航空重力数据物性层析计算方法可通过大数据框架Spark进行加速计算,其中的迭代计算非常适合Spark框架进行处理,因此可以获得非常好的加速效果。具体步骤如下:
[0056] B1:对地下网格剖分形成的小立方体总数进行切分,构建RDD,并持久化到内存;
[0057] B2:通过按照地表网格采集到的航空重力数据d1,计算概率函数ηq:
[0058]
[0059] 其中,N为航空重力数据d1中数据采集点的数量,Δg(x,y,z)为航空重力数据d1中位于地表(x,y,z)采集点的重力异常测量值,Δgu(x,y,z)为地表(x,y,z)采集点重力异常的格林函数;
[0060] B3:计算地下网格的密度mq:
[0061] mq=Δρ·ηq  (2)
[0062] B4:迭代计算地表网格重力正演数据d2和地下网格密度mq,具体步骤如下:
[0063] B4.1:对RDD进行MAP算子,按照地表网格计算各自的重力正演数据d2;
[0064]
[0065] 其中,Δg(x,y,z)为重力正演数据d2中位于地表(x,y,z)采集点的重力异常正演值,G为万有引力常数,Q为地下网格剖分形成的小立方体的数量,(xq,yq,zq)为地下网格剖分形成的某个小立方体的中心点坐标,Δρq是所述小立方体的密度,Δvq是所述小立方体的体积;
[0066] B4.2:对RDD进行Reduce算子,合并重力正演数据d2;
[0067] B4.3对重力正演数据与航空重力数据之间的差值d2-d1,应用公式(1)计算得到概率函数偏差ηq′;
[0068] B4.4更新地下网格密度mq:
[0069] mq=mq+Δρ·ηq′  (4)
[0070] B4.5:重复步骤B4.1至B4.4,直到重力正演数据d2与航空重力数据d1均方误差恒定或最小;
[0071] B5:输出地下网格密度mq。
[0072] 本实施例给出的一种基于大数据计算的航空重力数据物性层析处理方法,采用大数据框架Spark,通过分布式内存动态数据集RDD实现内存数据共享,过程中生成的正演计算结果保存在内存不是将其写入磁盘,同时使用成本更低的Shuffle操作对重力数据计算结果进行合并,有效减少磁盘IO的时间、提升了运算效率。
[0073] 实施例3:
[0074] 本实施例给出实施例2所述实施方式的计算效率的仿真结果。
[0075] 采用具有18个节点的CPU计算集群对实施例2所述实施方式进行测试,并通过相同的单CPU计算进行对比。每个节点搭配Intel Xeon E5-2680v2CPU,浮点计算能力为211.2Gflops,DDR3内存120G,节点间通过InfiniBand连接。
[0076] 如图1所示,是单CPU计算和Spark框架下并行计算的计算时间对比。从图中可以看出,随着地下网格规模的增加,Spark框架下并行计算具有明显的优势。
[0077] 如图2所示,是针对数据模型的三维反演效果叠合示意图。其中,a、b为纵向剖面,c、d为水平切片;图片中黑色线框是实际的数据模型,灰度色块是反演的结果。从不同剖面的叠合示意图中可以看出,本方法具有非常好的反演效果。
[0078] 以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。