一种边坡稳定性预测评估方法转让专利

申请号 : CN202110376378.1

文献号 : CN112966425B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张科张凯保瑞刘享华李娜

申请人 : 昆明理工大学

摘要 :

本发明公开了一种边坡稳定性预测评估方法,包括以下步骤:1选择边坡稳定性判定指标并确定容许安全系数[K];2根据待预测的边坡构建边坡模型,利用工程仿真软件,获得判定指标和对应稳定性结果的数据集;3对数据集进行最大值和最小值归一化处理;4根据归一化处理后的数据集,构建基于集成学习算法的边坡稳定性预测模型;5评估时,获取待检测边坡的实际判定指标数据,带入边坡稳定性预测模型,获得边坡稳定性预测结果。本申请能够在不破坏土体结构的基础上实现边坡的稳定性安全预测,具有预测可靠性高,精确度好的优点。

权利要求 :

1.一种边坡稳定性预测评估方法,其特征在于,包括以下步骤:

1选择边坡稳定性判定指标并确定容许安全系数[K],所选择判定指标分别为:容重γ、内聚力c、摩擦角 边坡角Φ、边坡高度H以及孔隙压力比ru;

2根据待预测的边坡构建边坡模型,利用工程仿真软件,计算获得判定指标和对应的安全系数的数据集;再进行稳定性判断,如果边坡安全系数大于或等于容许安全系数则视为稳定,小于则视为失稳,进而获得判定指标和对应稳定性结果的数据集;

3对数据集进行最大值和最小值归一化处理;

4根据归一化处理后的数据集,构建基于集成学习算法的边坡稳定性预测模型;

5评估时,获取待检测边坡的实际判定指标数据,带入边坡稳定性预测模型,获得边坡稳定性预测结果;

步骤2具体包括以下步骤:

2.1采用Matlab软件中随机生成不低于100组指标参数,得到关于判定指标的数据集其中γ,c, Φ,H,ru分别为一维列向量;

2.2根据待预测的边坡构建边坡模型,利用工程仿真软件,输入随机生成的指标参数,采用强度折减法对每组指标参数对应的安全系数K进行求解;

2.3将计算得到的安全系数K与容许安全系数[K]进行比较,若K≥[K]认为稳定,用0表示,K<[K]认为失稳,用1表示;得到判定指标和对应稳定性结果的数据集R∈{0,1},且为1维列向量;

步骤2.2具体为,先在CAD软件中建立待检测边坡的模型,输出为工程仿真软件能识别的格式文件,接着将格式文件导入工程仿真软件;然后在工程仿真软件中首先进行网格划分,确定边界条件,边界条件将左右两侧水平约束,下部固定,上部为自由边界;初始地应力选择为自重地应力场;再输入随机生成的指标参数,即γ,c, Φ,H,ru,采用强度折减法对安全系数K进行求解;

工程仿真软件采用OptumG2软件实现;

步骤2具体还包括以下步骤:2.4对数据集T1进行Pearson相关性分析,得到相关系数矩阵,若相关性小于等于预设值,说明所选用指标和生成数据合理;否则应重新生成数据。

2.如权利要求1所述的边坡稳定性预测评估方法,其特征在于,边坡容许安全系数[K]设定为1.3,边坡安全系数大于或等于1.3则视为稳定,小于1.3则视为失稳。

3.如权利要求1所述的边坡稳定性预测评估方法,其特征在于,步骤3具体包括:对数据集进行最大值最小值归一化处理,以减小量纲对预测结果的影响,其中映射区间为[0,1];

具体公式如下:

*

式中:z为原本的特征值,zmax和zmin分别为该特征最大值和最小值,z为该特征归一化后的取值。

4.如权利要求1所述的边坡稳定性预测评估方法,其特征在于:步骤4具体包括以下步骤:

4.0将归一化处理后的数据集T1划分为训练集A和测试集B,其中训练集A的长度大于测试集B;

4.1利用训练集A的样本构建基于XGBoost集成学习算法的边坡稳定倾向性预测模型:

4.2采用网格搜索算法和5折交叉验证对基于XGBoost集成学习算法的边坡稳定倾向性预测模型的主要参数进行优化:

4.3利用测试集B中样本对优化参数后的模型进行预测结果测试,如果误差率低于阈值视为测试通过。

5.如权利要求4所述的边坡稳定性预测评估方法,其特征在于,步骤4.1中,基于XGBoost集成学习算法的边坡稳定倾向性预测模型的表达式为:式中:yr为模型中第r个样本的预测值,fk为第k个分类回归树的基函数,K为分类回归树总数量,xr为第r个输入样本,F为假设空间;

其中,对于每一个分类回归树,其目标函数L表示为:式中:M为样本总数量,l(·)表示损失函数,yi和 分别为实际值和预测值,Ω(·)为正则项;

其中,基于XGBoost集成学习算法的边坡稳定倾向性预测模型的输入:A中的其中,基于XGBoost集成学习算法的边坡稳定倾向性预测模型的输出:利用XGBoost算法中的softmax作为目标函数,最后返回预测的类别,即判断是0还是1;

其中,基于XGBoost集成学习算法的边坡稳定倾向性预测模型的损失函数:采用默认的二分类错误率。

6.如权利要求4所述的边坡稳定性预测评估方法,其特征在于,步骤4还包括步骤4.4:构建混淆矩阵来对模型的泛化能力进行判定;具体过程为:混淆矩阵建立如表3所示,预测为稳定的样本中,实际稳定的样本数为TP,实际为失稳的样本数为FP;预测为失稳的样本中,实际为稳定的样本数为FN,实际为失稳的样本数为TN;

表3混淆矩阵

提出4类指标对预测结果进行综合评价:

准确率:

精确率:

召回率:

精确率和召回率的调和平均值:

计算出的4个指标的值大于预设阈值,则认为泛化能力达到要求。

说明书 :

一种边坡稳定性预测评估方法

技术领域

[0001] 本发明涉及边坡土体安全监控技术领域,具体涉及一种边坡稳定性预测评估方法。

背景技术

[0002] 边坡稳定性是指边坡岩、土体在一定坡高和坡角条件下的稳定程度。按照成因,边坡分为天然斜坡和人工边坡两类,后者又分为开挖边坡和堤坝边坡等。不稳定的天然斜坡和设计坡角过大的人工边坡,在岩、土体重力,水压力,振动力以及其他外力作用下,常发生滑动或崩塌破坏。大规模的边坡岩、土体破坏能引起交通中断,建筑物倒塌,江河堵塞,水库淤填,给人民生命财产带来巨大损失。故研究边坡失稳的预测和监控具有重要意义。
[0003] 现有边坡稳定性监控方法,通常为在边坡土体内埋设传感器或者通过在边坡上方设置摄像头的方式实现监控。例如CN207335617U公开的一种既有路基、边坡稳定性的监测结构,CN112432661A公开的一种基于BIM平台的边坡稳定性监测系统。均属于这种技术。边坡内埋设传感器的方式,容易对边坡自身的结构和稳定性造成影响。而摄像头监控的方式,可靠性较差。
[0004] 现有技术中,还有一些对边坡稳定性进行预测的方法,例如CN101718876B公开的一种基于岩土体应变状态突变的边坡稳定性监测及失稳预测方法;CN103163563B公开的一种三维边坡稳定性预测方法。但仍然存在对边坡结构影响较大,以及考虑因素较少,预测精度不高等缺陷。
[0005] 故如何提供一种考虑更加全面,可靠性更好的边坡稳定性监控方法,成为本领域技术人员需要考虑的问题。

发明内容

[0006] 针对上述现有技术的不足,本发明所要解决的技术问题是:怎样提供一种在不破坏土体结构的基础上能够实现边坡的稳定性安全预测,预测可靠性高的边坡稳定性预测评估方法。
[0007] 为了解决上述技术问题,本发明采用了如下的技术方案:
[0008] 一种边坡稳定性预测评估方法,其特征在于,包括以下步骤:
[0009] 1选择边坡稳定性判定指标并确定容许安全系数[K],所选择判定指标分别为:容重γ、内聚力c、摩擦角 边坡角Φ、边坡高度H以及孔隙压力比ru;
[0010] 2根据待预测的边坡构建边坡模型,利用工程仿真软件,计算获得判定指标和对应的安全系数的数据集;再进行稳定性判断,如果边坡安全系数大于或等于容许安全系数则视为稳定,小于则视为失稳,进而获得判定指标和对应稳定性结果的数据集;
[0011] 3对数据集进行最大值和最小值归一化处理;
[0012] 4根据归一化处理后的数据集,构建基于集成学习算法的边坡稳定性预测模型;
[0013] 5评估时,获取待检测边坡的实际判定指标数据,带入边坡稳定性预测模型,获得边坡稳定性预测结果。
[0014] 这样,本发明方法中,选取的判定指标,均具有和边坡稳定性之间的内在关联性,但同时相互之间为非线性关系,故根据该判定指标可以更加全面地提高预测精度。具体地说边坡角Φ和边坡高度H属于几何因素,是指边坡体的本身,在其它因素不变的条件下,边坡高度越高,即边坡角越大,则边坡的安全系数越低,越容易失稳;相反,边坡高度越小,即边坡角越小,则边坡的安全系数越高,此时,边坡越稳定。容重γ、内聚力c、摩擦角 以及孔隙压力比ru均为坡体的土力学指标,土体容重愈大,内聚力愈大,摩擦角愈大,边坡的稳定系数越高,即安全系数越大,坡体愈稳定;反之,土体容重愈小,内聚力愈小,摩擦角愈小,边坡的稳定系数愈低,即安全系数越低,坡体易产生失稳。同时这6个影响因素与边坡稳定性之间是复杂的非线性关系,传统方法不能准确地描述。同时,本方法中,利用了工程仿真软件获取判定指标和对应安全系数的数据集,这样,利用了工程仿真软件强大的仿真能力,无需现场采集数据,解决了数据匮乏的缺陷,能够更好地提高预测精度。
[0015] 进一步地,边坡容许安全系数[K]设定为1.3,边坡安全系数大于或等于1.3则视为稳定,小于1.3则视为失稳。
[0016] 边坡容许安全系数一般在1.1‑1.35之间,本方案中优选较大的安全系数,可以更好地确保安全。
[0017] 进一步地,步骤2具体包括以下步骤:
[0018] 2.1采用Matlab软件中随机生成不低于100组指标参数,得到关于判定指标的数据集 其中γ,c, Φ,H,ru分别为一维列向量;
[0019] 2.2根据待预测的边坡构建边坡模型,利用工程仿真软件,输入随机生成的指标参数(需要的其它参数选择默认),采用强度折减法对每组指标参数对应的安全系数K进行求解;
[0020] 2.3将计算得到的安全系数K与容许安全系数[K]进行比较,若K≥[K]认为稳定,用0 表示,K<[K]认为失稳,用1表示;得到判定指标和对应稳定性结果的数据集R∈{0,1},且为1维列向量。
[0021] 其中,Matlab软件是一种用于数据分析的现有数学软件,采用该软件随机生成指标参数,能够更好地使得指标参数分别的均值接近真实的指标参数,提高参考价值。其中,所述工程仿真软件,可以采用有限元、离散元、有限差分等软件实现,均为成熟的工程仿真软件,具有强大的仿真模拟能力,能够用于建筑类或地质类工程单元的仿真模拟和性能计算。具体模拟仿真过程为软件自身功能实现的现有技术,不在此详述。采用强度折减法对安全系数进行求解,可以更好地保证解出安全系数的可靠性。
[0022] 进一步地,步骤2.2中,可以是,先在CAD软件中建立待检测边坡的模型,输出为工程仿真软件能识别的格式文件(如*.dxf格式),接着将格式文件导入工程仿真软件;然后在工程仿真软件中首先进行网格划分,确定边界条件,边界条件一般将左右两侧水平约束,下部固定,上部为自由边界;初始地应力选择为自重地应力场;再输入随机生成的指标参数,即γ,c, Φ,H,ru(其它参数选择默认),采用强度折减法对安全系数K进行求解。
[0023] 这样,具有更好的可操作性,操作方便快捷。
[0024] 进一步地,工程仿真软件采用OptumG2软件实现。
[0025] 该软件为一款现有的有限元分析的岩土分析软件,采用该软件获得边坡安全系数的数据集,更加精确可靠。当然实施时,也可以采用其他现有的有限元分析软件、离散元分析软件或者有限差分软件实现。
[0026] 进一步地,步骤2具体还包括以下步骤:2.4对数据集T1进行Pearson相关性分析,得到相关系数矩阵,若相关性绝对值小于等于预设值,说明所选用指标和生成数据合理;否则应重新生成数据。
[0027] 这样,可以剔除不够合理的随机生成数据,更好地确保后续训练采用的数据的合理性,提高评估模型的可靠性。此处预设值通常可选用0.5,根据研究表明,当相关系数绝对值 R=1,则表示完全相关;当R大于等于0.8小于1,则表示高度相关;当R大于等于0.5小于0.8,则表示显著相关,小于0.5则表示低度相关或不相关。因此可将0.5设置为一个临界阈值,作为我们的预设值。当相关性越小时,则所生成的数据之间独立性较好,存在较复杂的非线性关系,可直接用于本模型;若相关性较大,则所生成的数据之间独立性较差,此时选用指标的有效性会降低,与实际不符合。
[0028] 进一步地,步骤3具体包括:对数据集进行最大值最小值归一化处理,以减小量纲对预测结果的影响,其中映射区间为[0,1];具体公式如下:
[0029]
[0030] 式中:z为原本的特征值,zmax和zmin分别为该类别特征最大值和最小值,z*为该特征归一化后的取值。
[0031] 这样对数据进行归一化处理后,可以减小量纲对预测结果的影响,保证后续训练模型的可靠性。
[0032] 进一步地,步骤4具体包括以下步骤:
[0033] 4.0将归一化处理后的数据集T1划分为训练集A和测试集B,一般来说训练集A的长度大于测试集B;
[0034] 4.1利用训练集A的样本构建基于XGBoost集成学习算法的边坡稳定倾向性预测模型:
[0035] 4.2采用网格搜索算法和5折交叉验证对基于XGBoost集成学习算法的边坡稳定倾向性预测模型的主要参数进行优化:
[0036] 4.3利用测试集B中样本对优化参数后的模型进行预测结果测试,如果误差率低于阈值(通常误差率≤0.1,则表明测试合格,否则应重新优化模型中的参数,直至满足要求。) 视为测试通过。
[0037] 这样,可以更好地确保模型的可靠性。
[0038] 进一步地,步骤4.1中,基于XGBoost集成学习算法的边坡稳定倾向性预测模型的表达式为:
[0039]
[0040] 式中:yr为模型中第r个样本的预测值,fk为第k个分类回归树的基函数,K为分类回归树总数量,xr为第r个输入样本,F为假设空间;
[0041] 其中,对于每一个分类回归树,其目标函数L表示为:
[0042]
[0043] 式中:M为样本总数量,l(·)表示损失函数,yi和 分别为实际值和预测值,Ω(·) 为正则项;
[0044] 其中,基于XGBoost集成学习算法的边坡稳定倾向性预测模型的输入:A中的[0045] 其中,基于XGBoost集成学习算法的边坡稳定倾向性预测模型的输出:利用XGBoost 算法中的softmax作为目标函数,最后返回预测的类别,即判断是0还是1;
[0046] 其中,基于XGBoost集成学习算法的边坡稳定倾向性预测模型的损失函数:采用默认的二分类错误率(error)。
[0047] 采用该模型能够更加精确可靠地实现预测。
[0048] 进一步地,步骤4.2可以包括以下步骤:
[0049] 第一步,确定需要的调节参数,这里选择对模型影响较大的8个参数,即:分类回归树数量、随机抽取样本比例、分类回归树最大深度、学习速率、特征随机采用比例、复杂度惩罚项、L2正则项、叶子节点权重和最小值;
[0050] 第二步,确定调节参数的取值范围,如表2所示,同时设置优化标准为error≤0.01;
[0051] 表2参数设定范围
[0052]
[0053] 第三步,依据每个参数不同的取值范围初步构造网格,设定合适步长,计算网格内每一点经5次迭代计算后的二分类错误率error均值,对数据进行记录;
[0054] 第四步,判断记录值与0.01的大小关系,若小于等于0.01,则确定为最优参数组合;若大于0.01,则进行第五步;
[0055] 第五步,对第三步中误差值最小的点为中心,以相邻点为边界,设置更小的步长,得到更精细网格划分,同时计算网格内每一点经5次迭代计算后的二分类错误率error,对数据进行记录;
[0056] 重复第四步,直至满足要求。
[0057] 采用上述方法实现对模型参数的优化,利用网格搜索法对XGBoost算法模型进行参数优化,调优过程简单,可以得到全局的最优参数,进而提高模型的准确性;同时,5折交叉验证的使用,在一定程度上可有效规避测试的偶然误差。
[0058] 进一步地,步骤4还包括步骤4.4:构建混淆矩阵来对模型的泛化能力进行判定;具体过程为:
[0059] 混淆矩阵建立如表3所示,预测为稳定的样本中,实际稳定的样本数为TP,实际为失稳的样本数为FP;预测为失稳的样本中,实际为稳定的样本数为FN,实际为失稳的样本数为TN;
[0060] 表3混淆矩阵
[0061]
[0062] 提出4类指标对预测结果进行综合评价:
[0063] 准确率:
[0064] 精确率:
[0065] 召回率:
[0066] 精确率和召回率的调和平均值:
[0067] 计算出的4个指标的值大于预设值(一般认为Acc、Pre、Rec以及F1‑Score大于等于0.90符合要求,但指标值越大,则模型的预测月准确,泛化能力越强;方法预测能力越准确),则认为泛化能力达到要求。
[0068] 这样,经过泛化能力判定,能够更好地保证模型预测的可靠性和精确度。
[0069] 实施时,步骤5中,6个指标实际数值的获取方式,均为成熟现有技术,具体地说,对于边坡角Φ和边坡高度H可以通过全站仪等设备进行获取;对于容重γ、内聚力c、摩擦角以及孔隙压力比ru可以对研究的坡土体进行采样,然后将样本运输到实验室进行相应的土力学实验,进而得到相关参数,获取过程不是本申请对现有技术做出贡献的地方,不在此详述。
[0070] 综上所述,本申请能够在不破坏土体结构的基础上实现边坡的稳定性安全预测,具有预测可靠性高,精确度好的优点。

附图说明

[0071] 图1为cad软件中建立的待检测边坡模型示意图。
[0072] 图2为工程仿真软件中进行网格划分示意图及边界条件示意图。
[0073] 图3为实施时,本方法的流程示意图。
[0074] 图4为实施时,本方法步骤4.2的流程示意图。

具体实施方式

[0075] 下面结合具体实施方式对本发明作进一步的详细说明。
[0076] 具体实施方式:参见图1‑4,一种边坡稳定性预测评估方法,包括以下步骤(参见图 3):
[0077] 1选择边坡稳定性判定指标并确定容许安全系数[K],所选择判定指标分别为:容重γ、内聚力c、摩擦角 边坡角Φ、边坡高度H以及孔隙压力比ru;
[0078] 2根据待预测的边坡构建边坡模型,利用工程仿真软件,计算获得判定指标和对应的安全系数的数据集;再进行稳定性判断,如果边坡安全系数大于或等于容许安全系数则视为稳定,小于则视为失稳,进而获得判定指标和对应稳定性结果的数据集;
[0079] 3对数据集进行最大值和最小值归一化处理;
[0080] 4根据归一化处理后的数据集,构建基于集成学习算法的边坡稳定性预测模型;
[0081] 5评估时,获取待检测边坡的实际判定指标数据,带入边坡稳定性预测模型,获得边坡稳定性预测结果。
[0082] 这样,本发明方法中,选取的判定指标,均具有和边坡稳定性之间的内在关联性,但同时相互之间为非线性关系,故根据该判定指标可以更加全面地提高预测精度。具体地说边坡角Φ和边坡高度H属于几何因素,是指边坡体的本身,在其它因素不变的条件下,边坡高度越高,即边坡角越大,则边坡的安全系数越低,越容易失稳;相反,边坡高度越小,即边坡角越小,则边坡的安全系数越高,此时,边坡越稳定。容重γ、内聚力c、摩擦角 以及孔隙压力比ru均为坡体的土力学指标,土体容重愈大,内聚力愈大,摩擦角愈大,边坡的稳定系数越高,即安全系数越大,坡体愈稳定;反之,土体容重愈小,内聚力愈小,摩擦角愈小,边坡的稳定系数愈低,即安全系数越低,坡体易产生失稳。同时这6个影响因素与边坡稳定性之间是复杂的非线性关系,传统方法不能准确地描述。同时,本方法中,利用了工程仿真软件获取判定指标和对应安全系数的数据集,这样,利用了工程仿真软件强大的仿真能力,无需现场采集数据,解决了数据匮乏的缺陷,能够更好地提高预测精度。
[0083] 具体实施时,边坡容许安全系数[K]设定为1.3,边坡安全系数大于或等于1.3则视为稳定,小于1.3则视为失稳。
[0084] 边坡容许安全系数一般在1.1‑1.35之间,本方案中优选较大的安全系数,可以更好地确保安全。
[0085] 具体实施时,步骤2具体包括以下步骤:
[0086] 2.1采用Matlab软件中随机生成不低于100组指标参数,得到关于判定指标的数据集 其中γ,c, Φ,H,ru分别为一维列向量;实施时其分别的均值以接近真实的指标参数为优;
[0087] 2.2根据待预测的边坡构建边坡模型,利用工程仿真软件,输入随机生成的指标参数 (需要的其它参数选择默认),采用强度折减法对每组指标参数对应的安全系数K进行求解;
[0088] 2.3将计算得到的安全系数K与容许安全系数[K]进行比较,若K≥[K]认为稳定,用0 表示,K<[K]认为失稳,用1表示;得到判定指标和对应稳定性结果的数据集R∈{0,1},且为1维列向量。
[0089] 表1所示为采用inOptumG2模块得到的部分数据集。
[0090] 表1数据集
[0091]
[0092] 其中,Matlab软件是一种用于数据分析的现有数学软件,采用该软件随机生成指标参数,能够更好地使得指标参数分别的均值接近真实的指标参数,提高参考价值。其中,所述工程仿真软件,可以采用有限元、离散元、有限差分等软件实现,均为成熟的工程仿真软件,具有强大的仿真模拟能力,能够用于建筑类或地质类工程单元的仿真模拟和性能计算。具体模拟仿真过程为软件自身功能实现的现有技术,不在此详述。采用强度折减法对安全系数进行求解,可以更好地保证解出安全系数的可靠性。
[0093] 步骤2.2中,可以是,先在CAD软件中建立待检测边坡的模型(如图1所示),输出为工程仿真软件能识别的格式文件(如*.dxf格式),接着将格式文件导入工程仿真软件;然后在工程仿真软件中首先进行网格划分(如图2所示),确定边界条件,边界条件一般将左右两侧水平约束,下部固定,上部为自由边界;初始地应力选择为自重地应力场;再输入随机生成的指标参数,即γ,c, Φ,H,ru(其它参数选择默认),采用强度折减法对安全系数K进行求解。
[0094] 这样,具有更好的可操作性,操作方便快捷。
[0095] 其中,工程仿真软件采用OptumG2软件实现。
[0096] 该软件为一款现有的有限元分析的岩土分析软件,采用该软件获得边坡安全系数的数据集,更加精确可靠。当然实施时,也可以采用其他现有的有限元分析软件、离散元分析软件或者有限差分软件实现。
[0097] 实施时,步骤2具体还包括以下步骤:2.4对数据集T1进行Pearson相关性分析,得到相关系数矩阵,若相关性小于等于预设值(本实施方式中预设值选用0.5,),说明所选用指标和生成数据合理;否则应重新生成数据。
[0098] 这样,可以剔除不够合理的随机生成数据,更好地确保后续训练采用的数据的合理性,提高评估模型的可靠性。此处预设值通常可选用0.5,根据研究表明,当相关系数绝对值 R=1,则表示完全相关;当R大于等于0.8小于1,则表示高度相关;当R大于等于0.5小于0.8,则表示显著相关,小于0.5则表示低度相关或不相关。因此可将0.5设置为一个临界阈值,作为我们的预设值。当相关性越小时,则所生成的数据之间独立性较好,存在较复杂的非线性关系,可直接用于本模型;若相关性较大,则所生成的数据之间独立性较差,此时选用指标的有效性会降低,与实际不符合。
[0099] 实施时,步骤3具体包括:对数据集进行最大值最小值归一化处理,以减小量纲对预测结果的影响,其中映射区间为[0,1];具体公式如下:
[0100]
[0101] 式中:z为原本的特征值,zmax和zmin分别为该类别特征最大值和最小值,z*为该特征归一化后的取值。
[0102] 这样对数据进行归一化处理后,可以减小量纲对预测结果的影响,保证后续训练模型的可靠性。
[0103] 实施时,步骤4具体包括以下步骤:
[0104] 4.0将归一化处理后的数据集T1划分为训练集A和测试集B,一般来说训练集A的长度大于测试集B;
[0105] 4.1利用训练集A的样本构建基于XGBoost集成学习算法的边坡稳定倾向性预测模型:
[0106] 4.2采用网格搜索算法和5折交叉验证对基于XGBoost集成学习算法的边坡稳定倾向性预测模型的主要参数进行优化:
[0107] 4.3利用测试集B中样本对优化参数后的模型进行预测结果测试,如果误差率≤0.1,则表明测试合格,否则应重新优化模型中的参数,直至满足要求。
[0108] 这样,可以更好地确保模型的可靠性。
[0109] 实施时,步骤4.1中,基于XGBoost集成学习算法的边坡稳定倾向性预测模型的表达式为:
[0110]
[0111] 式中:yr为模型中第r个样本的预测值,fk为第k个分类回归树的基函数,K为分类回归树总数量,xr为第r个输入样本,F为假设空间;
[0112] 其中,对于每一个分类回归树,其目标函数L表示为:
[0113]
[0114] 式中:M为样本总数量,l(·)表示损失函数,yi和 分别为实际值和预测值,Ω(·) 为正则项;
[0115] 其中,基于XGBoost集成学习算法的边坡稳定倾向性预测模型的输入:A中的[0116] 其中,基于XGBoost集成学习算法的边坡稳定倾向性预测模型的输出:利用XGBoost 算法中的softmax作为目标函数,最后返回预测的类别,即判断是0还是1;
[0117] 其中,基于XGBoost集成学习算法的边坡稳定倾向性预测模型的损失函数:采用默认的二分类错误率(error)。
[0118] 采用该模型能够更加精确可靠地实现预测。
[0119] 实施时,参见图4,步骤4.2可以包括以下步骤:(实施时,本申请中涉及参数取值范围时,通常未做说明时为基于对应软件操作时常规方式的经验值进行取值)[0120] 第一步,确定需要的调节参数,这里选择对模型影响较大的8个参数,即:分类回归树数量、随机抽取样本比例、分类回归树最大深度、学习速率、特征随机采用比例、复杂度惩罚项、L2正则项、叶子节点权重和最小值;
[0121] 第二步,确定调节参数的取值范围,如表2所示,同时设置优化标准为error≤0.01;
[0122] 表2参数设定范围
[0123]
[0124] 第三步,依据每个参数不同的取值范围初步构造网格,设定合适步长,计算网格内每一点经5次迭代计算后的二分类错误率error均值,对数据进行记录;
[0125] 第四步,判断记录值与0.01的大小关系,若小于等于0.01,则确定为最优参数组合;若大于0.01,则进行第五步;
[0126] 第五步,对第三步中误差值最小的点为中心,以相邻点为边界,设置更小的步长,得到更精细网格划分,同时计算网格内每一点经5次迭代计算后的二分类错误率error,对数据进行记录;
[0127] 重复第四步,直至满足要求。
[0128] 采用上述方法实现对模型参数的优化,利用网格搜索法对XGBoost算法模型进行参数优化,调优过程简单,可以得到全局的最优参数,进而提高模型的准确性;同时,5折交叉验证的使用,在一定程度上可有效规避测试的偶然误差。
[0129] 其中,步骤4还包括步骤4.4:构建混淆矩阵来对模型的泛化能力进行判定;具体过程为:
[0130] 混淆矩阵建立如表3所示,预测为稳定的样本中,实际稳定的样本数为TP,实际为失稳的样本数为FP;预测为失稳的样本中,实际为稳定的样本数为FN,实际为失稳的样本数为TN;
[0131] 表3混淆矩阵
[0132]
[0133] 提出4类指标对预测结果进行综合评价:
[0134] 准确率:
[0135] 精确率:
[0136] 召回率:
[0137] 精确率和召回率的调和平均值:
[0138] 计算出的4个指标的值大于预设值(一般认为Acc、Pre、Rec以及F1‑Score大于等于0.90符合要求,但指标值越大,则模型的预测月准确,泛化能力越强;方法预测能力越准确),则认为泛化能力达到要求。
[0139] 这样,经过泛化能力判定,能够更好地保证模型预测的可靠性和精确度。
[0140] 实施时,步骤5中,6个指标实际数值的获取方式,均为成熟现有技术,具体地说,对于边坡角Φ和边坡高度H可以通过全站仪等设备进行获取;对于容重γ、内聚力c、摩擦角以及孔隙压力比ru可以对研究的坡土体进行采样,然后将样本运输到实验室进行相应的土力学实验,进而得到相关参数,获取过程不是本申请对现有技术做出贡献的地方,不在此详述。