基于大数据可视化分析的K-近邻岩爆预测方法和装置转让专利

申请号 : CN202110621619.4

文献号 : CN113094641B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张昱郭茂祖李继涛吕召勇苏仡琳高凯龙刘开峰

申请人 : 北京建筑大学

摘要 :

本发明公开一种基于大数据可视化分析的K‑近邻岩爆预测方法和装置,包括:步骤S1、根据岩石数据,得到岩石的频谱特征和振幅/能量特征;步骤S2、根据所述频谱特征和振幅/能量特征,通过K‑近邻算法对岩爆的精准预测。采用本发明的技术方案,可以对岩爆进行精准预测,以避免造成巨大的经济以及人员损失。

权利要求 :

1.一种基于大数据可视化分析的K‑近邻岩爆预测方法,其特征在于,包括:步骤S1、根据岩石数据,得到岩石的频谱特征和振幅/能量特征;

步骤S2、根据所述频谱特征和振幅/能量特征,通过K‑近邻算法对岩爆的精准预测;

其中,步骤S1,具体包括:

步骤11、获取岩石数据;

步骤12、将所述岩石数据的时域数据通过傅里叶变换,得到岩石数据的频域数据;

步骤13、根据岩石数据的频域数据,提取岩石数据的频谱特征和振幅/能量特征;

步骤13中,提取岩石数据的频谱特征包括:步骤1311、根据岩石数据的频域数据,得到岩爆发生时刻的实时时间,并依次存储到“主频.TXT”文件中,其中,“主频.TXT”文件中,第1列为岩爆发生时间,第2列为整个岩爆过程通过快速傅里叶变换提取后的最大主频值,第3列为整个岩爆过程通过快速傅里叶变换提取后的最大振幅值;

步骤1312、将“主频.TXT”文件中的第1列时间序列作为X轴,将“主频.TXT”文件中的第2列主频序列作为Y轴,做出散点图所得为主频分布图;

步骤1313、对“主频.TXT”文件进行数据分析,得到主频中位数在84.472KHz,主频平均值在134.410KHz;

步骤1314、根据主频分布图,将主频划分为五个主频带,分别为:小于50KHz称为低频带,在大于等于50KHz且小于150KHz之间称为中低频带,在大于等于150KHz且小于250KHz之间称为中频带,在大于等于250KHz且小于350KHz之间称为中高频带,大于350KHz称为高频带;其中,小于50KHz的个数为203个,处于50KHz‑‑150KHz的个数为18464个,处于150KHz‑‑

250KHz的个数为1149个,处于250KHz‑‑350KHz的个数为5678个,大于350KHz的个数为459个,并计算五个主频带的数量比例后进行岩石主频分布饼状图可视化;

步骤1315、根据主频分布图、主频中位数、主频平均值、主频分布饼状图,得到岩爆频谱规律。

2.如权利要求1所述的基于大数据可视化分析的K‑近邻岩爆预测方法,其特征在于,步骤12中,得到岩石数据的频域数据包括:步骤121、对岩石数据进行解析;

步骤122、提取解析后的波形文件数据,并将波形文件数据按照岩爆发生时间顺序进行排序;

步骤123、将排序后的波形文件数据进行快速傅里叶变换,得到频域‑振幅值,即为岩石数据的频域数据。

3.如权利要求1所述的基于大数据可视化分析的K‑近邻岩爆预测方法,其特征在于,步骤S2,具体包括:

步骤21、获取岩石数据频谱特征和振幅/能量特征;

步骤22、根据频谱特征和振幅/能量特征,通过K‑近邻算法对岩爆的精准预测。

4.如权利要求1所述的基于大数据可视化分析的K‑近邻岩爆预测方法,其特征在于,步骤2中,根据“主频.TXT”文件中,第1列为岩爆发生时间,第2列为整个岩爆过程通过快速傅里叶变换提取后的最大主频值,第3列为整个岩爆过程通过快速傅里叶变换提取后的最大振幅值;将“主频.TXT”文件中第2列的最大主频值和第3列的最大振幅值分别进行标准化,归一化为0‑1的数据,处理如下:其中: 为所求特征值 , 为所求特征值标准化后的值 , 为所属特征类中的最小值, 为所属特征类中的最大值;

在数据归一化的基础上,利用声发射主频和振幅数据作为输入的特征数据,以自动识别得到的是否岩爆结果作为分类标签,即将岩爆实验过程中岩爆时的数据标签作为1,其余不发生岩爆的数据标签作为0。

5.一种基于大数据可视化分析的K‑近邻岩爆预测装置,其特征在于,包括:提取模块,用于根据岩石数据,得到岩石的频谱特征和振幅/能量特征;

预测模块,用于根据所述频谱特征和振幅/能量特征,通过K‑近邻算法对岩爆的精准预测。

说明书 :

基于大数据可视化分析的K‑近邻岩爆预测方法和装置

技术领域

[0001] 本发明属于岩爆预测技术领域,尤其涉及一种基于大数据可视化分析的K‑近邻岩爆预测方法和装置。

背景技术

[0002] 随着岩体工程进入深部以后,因受高地应力、高地温、高水压以及工程扰动因素的共同影响,在煤矿、地下水电站泵、深埋隧道以及引水隧洞一些地下工程中,围岩会发生突
然猛烈的破坏,同时伴随能量的快速释放,岩体的这种破坏通常称为岩爆。岩爆规模巨大,
同时岩爆的发生不仅严重影响生产,还会造成设备损坏、人员伤亡,造成不可估量的经济损
失。目前还不能对岩爆进行精准预测,以避免造成巨大的经济以及人员损失。

发明内容

[0003] 本发明要解决的技术问题是,提供一种基于大数据可视化分析的K‑近邻岩爆预测方法和装置,可以对岩爆进行精准预测,以避免造成巨大的经济以及人员损失。
[0004] 为实现上述目的,本发明采用如下的技术方案:
[0005] 一种基于大数据可视化分析的K‑近邻岩爆预测方法,包括:
[0006] 步骤S1、根据岩石数据,得到岩石的频谱特征和振幅/能量特征;
[0007] 步骤S2、根据所述频谱特征和振幅/能量特征,通过K‑近邻算法对岩爆的精准预测。
[0008] 作为优选,步骤S1,具体包括:
[0009] 步骤11、获取岩石数据;
[0010] 步骤12、将所述岩石数据的时域数据通过傅里叶变换,得到岩石数据的频域数据;
[0011] 步骤13、根据岩石数据的频域数据,提取岩石数据的频谱特征和振幅/能量特征,
[0012] 作为优选,步骤12中,得到岩石数据的频域数据包括:
[0013] 步骤121、对岩石数据进行解析;
[0014] 步骤122、提取解析后的波形文件数据,并将波形文件数据按照岩爆发生时间顺序进行排序;
[0015] 步骤123、将排序后的波形文件数据进行快速傅里叶变换,得到频域‑振幅值,即为岩石数据的频域数据。
[0016] 作为优选,步骤S2,具体包括:
[0017] 步骤21、获取岩石数据频谱特征和振幅/能量特征;
[0018] 步骤22、根据频谱特征和振幅/能量特征,通过K‑近邻算法对岩爆的精准预测。
[0019] 作为优选,步骤13中,提取岩石数据的频谱特征包括:
[0020] 步骤1311、根据岩石数据的频域数据,得到岩爆发生时刻的实时时间,并依次存储到“主频.TXT”文件中,其中,“主频.TXT”文件中,第1列为岩爆发生时间,第2列为整个岩爆
过程通过快速傅里叶变换提取后的最大主频值,第3列为整个岩爆过程通过快速傅里叶变
换提取后的最大振幅值;
[0021] 步骤1312、将“主频.TXT”文件中的第1列时间序列作为X轴,将“主频.TXT”文件中的第2列主频序列作为Y轴,做出散点图所得为主频分布图;
[0022] 步骤1313、对“主频.TXT”文件进行数据分析,得到主频中位数在84.472KHz,主频平均值在134.410KHz;
[0023] 步骤1314、根据主频分布图,将主频划分为五个主频带,分别为:小于50KHz称为低频带,在大于等于50KHz且小于150KHz之间称为中低频带,在大于等于150KHz且小于250KHz
之间称为中频带,在大于等于250KHz且小于350KHz之间称为中高频带,大于350KHz称为高
频带;其中,小于50KHz的个数为203个,处于50KHz‑‑150KHz的个数为18464个,处于
150KHz‑‑250KHz的个数为1149个,处于250KHz‑‑350KHz的个数为5678个,大于350KHz的个
数为459个,并计算五个主频带的数量比例后进行岩石主频分布饼状图可视化;
[0024] 步骤1315、根据主频分布图、主频中位数、主频平均值、主频分布饼状图,得到岩爆频谱规律。
[0025] 作为优选,步骤2中,根据“主频.TXT”文件中,第1列为岩爆发生时间,第2列为整个岩爆过程通过快速傅里叶变换提取后的最大主频值,第3列为整个岩爆过程通过快速傅里
叶变换提取后的最大振幅值;将“主频.TXT”文件中第2列的最大主频值和第3列的最大振幅
值分别进行标准化,归一化为0‑1的数据,处理如下:
[0026]
[0027] 其中: 为所求特征值 , 为所求特征值标准化后的值 , 为所属特征类中的最小值, 为所属特征类中的最大值。
[0028] 在数据归一化的基础上,利用声发射主频和振幅数据作为输入的特征数据,以自动识别得到的是否岩爆结果作为分类标签,即将岩爆实验过程中岩爆时的数据标签作为1,
其余不发生岩爆的数据标签作为0。
[0029] 本发明还提供一种基于大数据可视化分析的K‑近邻岩爆预测装置,其特征在于,包括:
[0030] 提取模块,用于根据岩石数据,得到岩石的频谱特征和振幅/能量特征;
[0031] 预测模块,用于根据所述频谱特征和振幅/能量特征,通过K‑近邻算法对岩爆的精准预测。
[0032] 本发明根据岩石数据,得到岩石的频谱特征和振幅/能量特征;根据所述频谱特征和振幅/能量特征,通过K‑近邻算法对岩爆的精准预测。采用本发明的技术方案,可以对岩
爆进行精准预测,以避免造成巨大的经济以及人员损失。

附图说明

[0033] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例 或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是
本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还
可以根据这些附图获得其他的附图。
[0034] 图1为本发明基于大数据可视化分析的K‑近邻岩爆预测方法流程图;
[0035] 图2为本发明基于大数据可视化分析的K‑近邻岩爆预测装置的结构示意图。

具体实施方式

[0036] 以下实施例会结合附图对本发明进行详述,在附图或说明中,相似或相同的部分使用相同的标号,并且在实际应用中,各部件的形状、厚度或高度可扩大或缩小。本发明所
列举的各实施例仅用以说明本发明,并非用以限制本发明的范围。对本发明所作的任何显
而易知的修饰或变更都不脱离本发明的精神与范围。
[0037] 如图1所示,本发明提供一种基于大数据可视化分析的K‑近邻岩爆预测方法,包括:
[0038] 步骤S1、根据岩石数据,得到岩石的频谱特征和振幅/能量特征;
[0039] 步骤S2、根据所述频谱特征和振幅/能量特征,通过K‑近邻算法对岩爆的精准预测。
[0040] 进一步,步骤S1,具体包括:
[0041] 步骤11、获取岩石数据;
[0042] 步骤12、将所述岩石数据的时域数据通过傅里叶变换,得到岩石数据的频域数据;
[0043] 步骤13、根据岩石数据的频域数据,提取岩石数据的频谱特征和振幅/能量特征,
[0044] 进一步,步骤12中,得到岩石数据的频域数据包括:
[0045] 步骤121、对岩石数据进行解析;
[0046] 步骤122、提取解析后的波形文件数据,并将波形文件数据按照岩爆发生时间顺序进行排序;
[0047] 步骤123、将排序后的波形文件数据进行快速傅里叶变换,得到频域‑振幅值,即为岩石数据的频域数据。
[0048] 进一步,步骤13中,提取岩石数据的频谱特征包括:
[0049] 步骤1311、根据岩石数据的频域数据,得到岩爆发生时刻的实时时间,并依次存储到“主频.TXT”文件中,其中,“主频.TXT”文件中,第1列为岩爆发生时间,第2列为整个岩爆
过程通过快速傅里叶变换提取后的最大主频值,第3列为整个岩爆过程通过快速傅里叶变
换提取后的最大振幅值;
[0050] 步骤1312、将“主频.TXT”文件中的第1列时间序列作为X轴,将“主频.TXT”文件中的第2列主频序列作为Y轴,做出散点图所得为主频分布图;
[0051] 步骤1313、对“主频.TXT”文件进行数据分析,得到主频中位数大约在84.472KHz,主频平均值在134.410KHz左右;
[0052] 步骤1314、、根据主频分布图,将主频划分为五个主频带,分别为小于50KHz称为低频带,在大于等于50KHz且小于150KHz之间称为中低频带,在大于等于150KHz且小于250KHz
之间称为中频带,在大于等于250KHz且小于350KHz之间称为中高频带,大于350KHz称为高
频带,可得小于50KHz(低频)的个数为203个,处于大于等于50KHz且小于150KHz之间(中低
频)的个数为18464个,处于大于等于150KHz且小于250KHz之间(中频)的个数为1149个,处
于大于等于250KHz且小于350KHz之间(中高频)的个数为5678个,大于350KHz(高频)的个数
为459个,并计算五个主频带的数量比例后进行岩石主频分布饼状图可视化;
[0053] 步骤1315、根据主频分布图、主频中位数、主频平均值、主频分布饼状图可得岩爆频谱规律大致如下:
[0054] ①主频频率大多数都在大于等于50KHz且小于150KHz之间、大于等于150KHz且小于250KHz之间、大于等于250KHz且小于350KHz之间这三个分布区间,其中主频分布在大于
等于50KHz且小于150KHz之间最多,其次分布在大于等于250KHz且小于350KHz之间、大于等
于150KHz且小于250KHz之间,而分布在小于50KHz及大于等于350KHz这两部分最少。
[0055] ②其声发射信号的主频值大多数分布在“中低频—中频—中高频”这三部分,从整体来看,岩爆主频呈现“中低频—中频—中高频—中频”的演化规律。
[0056] 进一步,步骤13中,提取岩石数据的振幅/能量特征包括:
[0057] 步骤1321、根据“主频.TXT”文件中,第1列为岩爆发生时间,第2列为整个岩爆过程通过快速傅里叶变换提取后的最大主频值,第3列为整个岩爆过程通过快速傅里叶变换提
取后的最大振幅值;将“主频.TXT”文件中的第1列时间序列作为X轴,将“主频.TXT”文件中
的第3列主频序列作为Y轴,做出折线图所得为大理岩声发射振幅图;
[0058] 步骤1322、根据定理已知,任何振动的物体都有能量,而其能量可用以下公式来计算,
[0059] 假设质点密度为 ,端坐标为 ,质点振动时位移为 , 为角速度, 为波速,为振幅:
[0060] 质点的振动方程:
[0061]
[0062] 可得振动质点的速度为:
[0063]
[0064] 体元动能为:
[0065]
[0066] 体元势能为:
[0067]
[0068] 质点的机械能为:
[0069]
[0070] 其中, 为体元的体积, 为体元的质量, 为倔强系数,可以推出结论1:声波能量大小与声音振幅的平方成正比。
[0071] 由结论1可得岩石能量与振幅存在潜在关系,并且振幅越高,能量越大,同时岩爆过程初期和中期能量较小,岩爆过程后期能量急剧增大,在岩爆发生的同时,存在能量急剧
下降的现象。
[0072] 步骤1323、根据“主频.TXT”文件中,第1列为岩爆发生时间,第2列为整个岩爆过程通过快速傅里叶变换提取后的最大主频值,第3列为整个岩爆过程通过快速傅里叶变换提
取后的最大振幅值;将“主频.TXT”文件中的第1列时间序列作为X轴,将“主频.TXT”文件中
的第2列主频序列作为Y轴,将“主频.TXT”文件中的第3列主频序列作为Z轴,刻画岩爆实验
声发射特征的岩石三维主频振幅图。
[0073] 可得以下结论:
[0074] ①岩爆整个过程初期和中期振幅幅值变化较小,岩爆过程后期幅值突然增大;
[0075] ②由结论1可得岩爆过程初期和中期能量较小,岩爆过程后期能量急剧增大,在岩爆发生的同时,存在能量急剧下降的现象;
[0076] ③岩爆过程中声发射信号的主频区间集中分布在“中低频、中频、中高频”这三部分,主频特征呈现“中低频→中频→中高频→中频”的演化规律;尤其岩爆时刻,声发射频谱
表现为中频高幅值的特征;
[0077] ④岩爆初期和中期,幅值、能量变化不大,岩爆后期主要是岩爆时刻的主频主要集中在中频带(150KHz—250KHz)分布区间,此区间的幅值突然增大,然后急速变小。由此可知
岩爆初期具有较低能量,然后下降,后期岩爆能量急剧上升,再急剧下降,并且此时的声发
射频谱表现为中频高幅值的特征。
[0078] 进一步,步骤S2,具体包括:
[0079] 步骤21、获取岩石数据频谱特征和振幅/能量特征;
[0080] 步骤22、根据频谱特征和振幅/能量特征,通过K‑近邻算法对岩爆的精准预测。
[0081] 进一步,通过K‑近邻算法对岩爆的精准预测,包括:
[0082] 步骤21、根据“主频.TXT”文件中,第1列为岩爆发生时间,第2列为整个岩爆过程通过快速傅里叶变换提取后的最大主频值,第3列为整个岩爆过程通过快速傅里叶变换提取
后的最大振幅值;为确保预测模型的预测效果,将“主频.TXT”文件中第2列的最大主频值和
第3列的最大振幅值分别进行标准化,归一化为0‑1的数据,处理如下:
[0083]
[0084] 其中: 为所求特征值 , 为所求特征值标准化后的值 , 为所属特征类中的最小值, 为所属特征类中的最大值。
[0085] 步骤22、在上述数据归一化的基础上,利用声发射主频和振幅数据作为输入的特征数据,以自动识别、标识算法得到的是否岩爆结果作为分类标签,即将岩爆实验过程中岩
爆时的数据标签作为1,其余不发生岩爆的数据标签作为0。
[0086] 步骤23、在上述处理后的数据基础上,将数据集的大小按照9:1的比例划分为训练集和测试集,采用K‑近邻算法训练预测模型,来实现对岩爆的精准预测。采用准确率
(Accuracy)评估分类模型的好坏,其代表预测正确的结果占总样本的百分比;召回率
(Recall)表示实际为正的样本中被预测为正样本的概率;F1值(精确率与召回率的调和平
均值)是一种统计的量,它在数值上等于精确率与召回率的调和平均值,也经常被用来评价
模型的好坏,利用这三个特征,采用K‑近邻算法将它们用于处理后的上述数据,对它们进行
计算分析。
[0087] 如图2所示,本发明提供一种基于大数据可视化分析的K‑近邻岩爆预测装置,实现基于大数据可视化分析的K‑近邻岩爆预测方法,包括:
[0088] 提取模块,用于根据岩石数据,得到岩石的频谱特征和振幅/能量特征;
[0089] 预测模块,用于根据所述频谱特征和振幅/能量特征,通过K‑近邻算法对岩爆的精准预测。
[0090] 实施例1:莱州花岗岩岩爆预测
[0091] 步骤1、将本发明的预测方法用于实际中莱州花岗岩的岩爆预测,按照提取岩石数据的频域步骤,提取莱州花岗岩岩石数据的频域‑振幅值,即为莱州花岗岩岩石数据的频域
数据;
[0092] 步骤2、根据岩石数据的频域数据,提取岩石数据的频谱特征方法,提取莱州花岗岩的频谱特征;分别得到莱州花岗岩的莱州花岗岩主频分布图、莱州花岗岩主频分布饼状
图,
[0093] 根据莱州花岗岩的莱州花岗岩主频分布图、莱州花岗岩主频分布饼状图及对主频值进行数据分析计算,可得莱州花岗岩岩爆规律为岩爆过程中声音信号的主频分布区间主
要分布在“中低频、中频、中高频”这三部分,从总体上看主频特征呈现“中低频→中频→中
高频→中频”的演化规律,
[0094] 步骤3、根据岩石数据的频域数据,提取岩石数据的振幅/能量特征方法,提取莱州花岗岩的振幅‑能量特征,分布得到莱州花岗岩声发射振幅图、三维主频振幅图,根据莱州
花岗岩声发射振幅图、三维主频振幅图,可得莱州花岗岩岩爆规律为主频振幅能量经历“逐
渐增加→逐渐下降→急剧增加→急剧下降”的变化规律。
[0095] 步骤4、据频谱特征和振幅/能量特征,通过K‑近邻算法对岩爆的精准预测部分,采用K‑近邻算法对莱州花岗岩岩爆进行预测分析,可得算法效果如下:
[0096] 算法效果如表1所示:
[0097]
[0098] 由表1可知,本发明的KNN岩爆预测算法的对莱州花岗岩的预测准确率(Accuracy)高达96.687%,即此模型对岩爆事件预测正确的次数与岩爆事件总数比值为96.687%;同时
模型的召回率(Recall)达81.899%,F1 值达88.681%。
[0099] 由以上数据结果可得该模型对岩爆预测具有良好性能,不仅预测准确率较高,还可用于其他种类岩石的岩爆预测。
[0100] 应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说
明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以
理解的其他实施方式。