会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 渔场 / 一种基于集成学习的金枪鱼渔场预测方法及系统

一种基于集成学习的金枪鱼渔场预测方法及系统

申请号 CN202311593073.1 申请日 2023-11-27 公开(公告)号 CN117635361A 公开(公告)日 2024-03-01
申请人 宁波渔遥科技有限公司; 发明人 何宏昌; 范冬林; 赵燕来;
摘要 本发明公开了一种基于集成学习的金枪鱼渔场预测方法及系统,涉及计算机应用技术领域,方法包括:获取研究区域中的待预测渔场的渔获数据和海洋环境数据,计算单位捕捞努力量渔获量,根据海洋环境特征变量进行空间自相关控制,将单位捕捞努力量渔获量和海洋环境特征数据进行归一化处理,构建集成学习模型,模型最优参数选择,构建集成学习模型的总体准确度、召回率、精度作为模型评价指标,将模型的输出进行综合评价。本发明能够对南太平洋不同等级长鳍金枪鱼渔场的高精度预测,通过特征分析,揭示了海洋环境因子对待测渔场预测精度的影响。
权利要求

1.一种基于集成学习的金枪鱼渔场预测方法,其特征在于,包括:

S1,获取研究区域中的待预测渔场的渔获数据和海洋环境数据;

S2,将所述渔获数据分为特征数据和验证数据,根据所述特征数据确定单位捕捞努力量渔获量,根据所述单位捕捞努力量渔获量对所述海洋环境数据进行空间自相关控制,确定所述待预测渔场的海洋环境特征;

S3,将所述单位捕捞努力量渔获量和所述海洋环境特征进行归一化处理,得到第一单位捕捞努力量渔获量以及第一海洋环境特征;

S4,根据所述单位捕捞努力量渔获量对所述待预测渔场进行等级划分;

S5,根据集成学习算法构建预测集成学习模型,根据十折交叉验证和网格搜索法对所述预测集成学习模型进行参数调优,得到最佳模型;

S6,将所述第一单位捕捞努力量渔获量和所述第一海洋环境特征输入到所述最佳模型中进行预测,得到所述待预测渔场的预测结果。

2.根据权利要求1所述的一种基于集成学习的金枪鱼渔场预测方法,其特征在于,所述海洋环境数据包括:海表温度、叶绿素a浓度、海表盐度、海面高度、海面风速、海洋混合层厚度、海水流速、待预测渔场位置的经度以及待预测渔场位置的纬度。

3.根据权利要求1所述的一种基于集成学习的金枪鱼渔场预测方法,其特征在于,所述单位捕捞努力量渔获量根据捕捞努力量、满足预设条件下的时间和空间内的渔获量确定。

4.根据权利要求1所述的一种基于集成学习的金枪鱼渔场预测方法,其特征在于,对所述待预测渔场进行等级划分包括:根据所述单位捕捞努力量渔获量将所述待预测渔场分为低产渔场和高产渔场。

5.根据权利要求1所述的一种基于集成学习的金枪鱼渔场预测方法,其特征在于,所述集成学习算法包括:RF、SVM、KNN、XGBoost和GP中的至少一种。

6.根据权利要求1所述的一种基于集成学习的金枪鱼渔场预测方法,其特征在于,所述S6后还包括:S7,根据所述待预测渔场的预测结果和所述验证数据计算所述最佳模型的评价指标,基于所述评价指标确定所述最佳模型的预测精度。

7.根据权利要求6所述的一种基于集成学习的金枪鱼渔场预测方法,其特征在于,所述评价指标包括:所述最佳模型的总体准确度、不同等级渔场的准确度和不同等级渔场的召回率。

8.一种基于集成学习的金枪鱼渔场预测系统,其特征在于,包括:

获取模块,用于获取研究区域中的待预测渔场的渔获数据和海洋环境数据;

第一处理模块,用于将所述渔获数据分为特征数据和验证数据,根据所述特征数据确定单位捕捞努力量渔获量,根据所述单位捕捞努力量渔获量对所述海洋环境数据进行空间自相关控制,确定所述待预测渔场的海洋环境特征;

第二处理模块,用于将所述单位捕捞努力量渔获量和所述海洋环境特征进行归一化处理,得到第一单位捕捞努力量渔获量以及第一海洋环境特征;

等级模型,用于根据所述单位捕捞努力量渔获量对所述待预测渔场进行等级划分;

模型模块,用于根据集成学习算法构建预测集成学习模型,根据十折交叉验证和网格搜索法对所述预测集成学习模型进行参数调优,得到最佳模型;预测模块,用于将所述第一单位捕捞努力量渔获量和所述第一海洋环境特征输入到所述最佳模型中进行预测,得到所述待预测渔场的预测结果。

说明书全文

一种基于集成学习的金枪鱼渔场预测方法及系统

技术领域

[0001] 本发明涉及计算机应用技术领域,尤其涉及一种基于集成学习的金枪鱼渔场预测方法及系统。

背景技术

[0002] 传统模型和机器学习算法已成为渔场预测的重要方法,渔场预测已经从小规模和短期渔业数据转向大规模渔业数据,传统模型受到输入数据维度的限制,这使得大规模、复杂、多变的高维海洋数据难以实现高精度的渔场预报。同时,传统模型也存在受人为因素影响、不具备泛化能力、特征转换困难、拟合不足等问题,机器学习算法在许多分类和回归研究中已经有效地抑制了这些问题。然而,在建模过程中,由于海洋环境因素的复杂性和可变性,以及单模型算法的局限性,如稳定性差、容易过拟合、泛化能力差等,机器学习模型很难实现对不同等级渔场分布的高精度预测。而集成学习可以有效解决这些问题,集成学习算法通过整合多个基模型的优势,使用多个学习器共同解决问题,从而产生更稳定的结果,可以有效地抑制模型过拟合,提高模型预测。
[0003] 长鳍金枪鱼的中心渔场分布受海表温度、叶绿素a浓度、海水溶解氧浓度、海表盐度、海面风速、海面高度和海水流速等多种环境因子影响,这些环境因素对渔场的预测具有决定性的作用,因此需要对这些环境因素进行实时监测和分析以提高预测的精确度。由于全球各海域的气候条件不同,因此形成的渔场环境条件也各异,这对渔业生物和捕捞作业有着重要的影响,故在预测时,充分考虑了渔场所处的具体地理位置。总的来说,通过综合考虑各种环境因素及自然因素并利用本发明的先进预测技术,可以有效地提高长鳍金枪鱼渔场预测的精度。

发明内容

[0004] 本发明所要解决的技术问题是针对现有技术的不足,具体针对现有的渔场预测精度不足、范围受限,无法为渔民提高捕捞效率等问题,具体提供了一种基于集成学习的金枪鱼渔场预测方法及系统,具体如下:
[0005] 1)第一方面,本发明提供一种基于集成学习的金枪鱼渔场预测方法,具体技术方案如下:
[0006] S1,获取研究区域中的待预测渔场的渔获数据和海洋环境数据;
[0007] S2,将所述渔获数据分为特征数据和验证数据,根据所述特征数据确定单位捕捞努力量渔获量,根据所述单位捕捞努力量渔获量对所述海洋环境数据进行空间自相关控制,确定所述待预测渔场的海洋环境特征;
[0008] S3,将所述单位捕捞努力量渔获量和所述海洋环境特征进行归一化处理,得到第一单位捕捞努力量渔获量以及第一海洋环境特征;
[0009] S4,根据所述单位捕捞努力量渔获量对所述待预测渔场进行等级划分;
[0010] S5,根据集成学习算法构建预测集成学习模型,根据十折交叉验证和网格搜索法对所述预测集成学习模型进行参数调优,得到最佳模型;
[0011] S6,将所述第一单位捕捞努力量渔获量和所述第一海洋环境特征输入到所述最佳模型中进行预测,得到所述待预测渔场的预测结果。
[0012] 本发明提供的一种基于集成学习的金枪鱼渔场预测方法的有益效果如下:
[0013] 本发明中,集成学习模型对南太平洋不同等级长鳍金枪鱼渔场进行高精度预测;探讨集成学习模型在不同等级长鳍鱼渔场的应用效果;定量评价不同海洋环境因子对南太平洋不同等级长鳍金枪鱼渔场预测的影响,可以避免现有的渔场预测精度不足、范围受限,无法为渔民提高捕捞效率等问题。
[0014] 在上述方案的基础上,本发明还可以做如下改进。
[0015] 进一步,所述海洋环境数据包括:海表温度、叶绿素a浓度、海表盐度、海面高度、海面风速、海洋混合层厚度、海水流速、待预测渔场位置的经度以及、待预测渔场位置的纬度。
[0016] 采用上述改进有益效果如下:
[0017] 这些环境因素对渔场的预测具有决定性的作用,因此需要对这些环境因素进行实时监测和分析以提高预测的精确度。由于全球各海域的气候条件不同,因此形成的渔场环境条件也各异,这对渔业生物和捕捞作业有着重要的影响,通过综合考虑各种环境因素及自然因素并利用本发明的先进预测技术,可以有效地提高长鳍金枪鱼渔场预测的精度。
[0018] 进一步,所述单位捕捞努力量渔获量根据满足预设条件下的时间和空间内的渔获量和捕捞努力量计算确定。
[0019] 进一步,对所述待预测渔场进行等级划分包括:根据所述单位捕捞努力量渔获量将所述待预测渔场分为低产渔场和高产渔场。
[0020] 进一步,所述集成学习算法包括:RF、SVM、KNN、XGBoost和GP中的至少一种。
[0021] 进一步,所述S6后还包括:
[0022] S7,根据所述待预测渔场的预测结果和所述验证数据计算所述最佳模型的评价指标,基于所述评价指标确定所述最佳模型的预测精度。
[0023] 进一步,所述评价指标包括:所述最佳模型的总体准确度、不同等级渔场的准确度和不同等级渔场的召回率。
[0024] 2)第二方面,本发明还提供一种基于集成学习的金枪鱼渔场预测系统,具体技术方案如下:
[0025] 获取模块,用于获取研究区域中的待预测渔场的渔获数据和海洋环境数据;
[0026] 第一处理模块,用于将所述渔获数据分为特征数据和验证数据,根据所述特征数据确定单位捕捞努力量渔获量,根据所述单位捕捞努力量渔获量对所述海洋环境数据进行空间自相关控制,确定所述待预测渔场的海洋环境特征;
[0027] 第二处理模块,用于将所述单位捕捞努力量渔获量和所述海洋环境特征进行归一化处理,得到第一单位捕捞努力量渔获量以及第一海洋环境特征;
[0028] 等级模型,用于根据所述单位捕捞努力量渔获量对所述待预测渔场进行等级划分;
[0029] 模型模块,用于根据集成学习算法构建预测集成学习模型,根据十折交叉验证和网格搜索法对所述预测集成学习模型进行参数调优,得到最佳模型;
[0030] 预测模块,用于将所述第一单位捕捞努力量渔获量和所述第一海洋环境特征输入到所述最佳模型中进行预测,得到所述待预测渔场的预测结果。
[0031] 在上述方案的基础上,本发明还可以做如下改进。
[0032] 进一步,所述海洋环境数据包括:海表温度、叶绿素a浓度、海表盐度、海面高度、海面风速、海洋混合层厚度、海水流速、待预测渔场位置的经度以及、待预测渔场位置的纬度。
[0033] 进一步,所述单位捕捞努力量渔获量根据满足预设条件下的时间和空间内的渔获量和捕捞努力量计算确定。
[0034] 进一步,对所述待预测渔场进行等级划分包括:根据所述单位捕捞努力量渔获量将所述待预测渔场分为低产渔场和高产渔场。
[0035] 进一步,所述集成学习算法包括:RF、SVM、KNN、XGBoost和GP中的至少一种。
[0036] 进一步,所述系统还包括:
[0037] 评价模块,用于根据所述待预测渔场的预测结果和所述验证数据计算所述最佳模型的评价指标,基于所述评价指标确定所述最佳模型的预测精度。
[0038] 进一步,所述评价指标包括:所述最佳模型的总体准确度、不同等级渔场的准确度和不同等级渔场的召回率。
[0039] 需要说明的是,本发明的第二方面的技术方案及对应的可能的实现方式所取得的有益效果,可以参见上述对第一方面及其对应的可能的实现方式的技术效果,此处不再赘述。

附图说明

[0040] 通过阅读参照以下附图所作的对非限制性实施例的详细描述,本发明的其它特征、目的和优点将会变得更明显:
[0041] 图1为本发明实施例的步骤的流程示意图;
[0042] 图2为本发明实施例的技术流程图;
[0043] 图3为本发明实施例的集成学习模型结构流程图;
[0044] 图4为本发明实施例的预设超参数示意图。

具体实施方式

[0045] 为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
[0046] 如图1所示,本发明实施例的一种基于集成学习的金枪鱼渔场预测方法,包括如下步骤:
[0047] S1,获取研究区域中的待预测渔场的渔获数据和海洋环境数据;
[0048] S2,将所述渔获数据分为特征数据和验证数据,根据所述特征数据确定单位捕捞努力量渔获量,根据所述单位捕捞努力量渔获量对所述海洋环境数据进行空间自相关控制,确定所述待预测渔场的海洋环境特征;
[0049] S3,将所述单位捕捞努力量渔获量和所述海洋环境特征进行归一化处理,得到第一单位捕捞努力量渔获量以及第一海洋环境特征;
[0050] S4,根据所述单位捕捞努力量渔获量对所述待预测渔场进行等级划分;
[0051] S5,根据集成学习算法构建预测集成学习模型,根据十折交叉验证和网格搜索法对所述预测集成学习模型进行参数调优,得到最佳模型;
[0052] S6,将所述第一单位捕捞努力量渔获量和所述第一海洋环境特征输入到所述最佳模型中进行预测,得到所述待预测渔场的预测结果。
[0053] 本发明提供的一种基于集成学习的金枪鱼渔场预测方法的有益效果如下:
[0054] 本发明中,集成学习模型对南太平洋不同等级长鳍金枪鱼渔场进行高精度预测;探讨集成学习模型在不同等级长鳍鱼渔场的应用效果;定量评价不同海洋环境因子对南太平洋不同等级长鳍金枪鱼渔场预测的影响,可以避免现有的渔场预测精度不足、范围受限,无法为渔民提高捕捞效率等问题。
[0055] 如图2,本发明所实现的具体技术流程如下:
[0056] S1,获取研究区域中的待预测渔场的渔获数据和海洋环境数据;
[0057] 本发明实施例的研究区域位于太平洋西部和中部的南部(0°~50°S,130°E~130°W),数据选自2009年至2019年的南太平洋长鳍金枪鱼捕捞数据和海洋环境数据。
[0058] 根据上述数据下载相应的南太平洋长鳍金枪鱼渔获数据和海洋环境数据;其中,渔获数据来自WCPFC(中西部太平洋渔业委员会(Western and Central Fisheries Commission)),包括作业时间(年、月)、作业地点(纬度、经度)和渔获量统计信息(延绳钓钓钩数、渔获吨数、渔获尾数)。海洋环境数据来自CMEMS(哥白尼海洋环境观测服务(The Copernicus Marine Environment Monitoring Service)),包括海表温度(SST)、叶绿素a浓度(Chl‑a)、海表盐度(SSS)、海面高度(SSH)、海面风速(SSW)、海洋混合层厚度(Mlotst)、海水流速(V0)和渔场位置的经度(Lon)、纬度(Lat),类似的,本发明的实施例也可以用于探讨其他的可影响的海洋环境因子如气候、全球变暖、核污染等可能对渔场预报精度产生影响。本发明对渔获量和海洋环境数据进行网格化,并以5°×5°的统一空间分辨率进行匹配。
[0059] S2,将所述渔获数据分为特征数据和验证数据,根据所述特征数据确定单位捕捞努力量渔获量,根据所述单位捕捞努力量渔获量对所述海洋环境数据进行空间自相关控制,确定所述待预测渔场的海洋环境特征;
[0060] 特征数据和验证数据以年限区分,特征数据用于模型训练,验证数据用于对模型的输出结果进行检测校验,例如:
[0061] 基于2009‑2019年南太平洋长鳍金枪鱼捕捞数据和海洋环境数据进行预处理,生成特征数据集,并以2018‑2019年数据作为验证数据集。将2009‑2019年的数据对模型进行训练,以2018‑2019年数据对模型的输出结果进行校验。
[0062] 根据特征数据中的渔获数据,计算得到单位捕捞努力量渔获量,如下:单位捕捞努力量渔获量根据捕捞努力量、满足预设条件下的时间和空间内的渔获量确定,单位捕捞努力量渔获量(CPUE,catch per unit effort)是资源丰度的一个指标,主要反映渔业资源丰度的变化。CPUE由第一公式确定,第一公式如下:
[0063]
[0064] 其中,CPUEymij表示特定时间(第y年m月)和空间(i经度j纬度5°×5°渔场内)的单位捕捞努力量渔获量(CPUE),Catchymij是特定时间(第y年m月)和空间(i经度j纬度5°×5°渔场)内的渔获量,以尾数为单位计算;Effortymij是特定时间(第y年m月)和空间(i经度j纬度5°×5°渔场)内的捕捞努力量。
[0065] 将海洋环境数据和CPUE进行空间相关关联,即根据相同空间下的海洋环境数据和相同空间下的CPUE一一对应,剔除与CPUE小于0.5相关的海洋环境特征,依次循环得到最终用于渔场分类的海洋环境特征(Lat、Lon、SST、SSS、SSH、SSW、V0、Mlotst和Chl‑a)。其中,当空间(i经度j纬度5°×5°渔场)一致时,则视为处于相同空间。需注意,上述海洋环境特征中包含的符号已在上文中给出解释,在此不进行赘述。
[0066] S3,将所述单位捕捞努力量渔获量和所述海洋环境特征进行归一化处理,得到第一单位捕捞努力量渔获量以及第一海洋环境特征;
[0067] 在进行环境变量和CPUE预报时,考虑到CPUE时空分布的不同以及各环境因子的数值范围差异较大,为了提高预报精度,对CPUE、Lat、Lon、SST、SSS、SSH、SSW、V0、Mlotst和Chl‑a等因素进行了归一化处理。归一化结果由第二公式确定,第二公式如下:
[0068]
[0069] 其中,X'为CPUE和海洋环境特征分别对应的归一化值,X为CPUE和各海洋环境特征分别的实际初始值,Xmin和Xmax分别表示CPUE和各海洋环境特征分别在每个月中的最小值和最大值。容易理解的是,将CPUE和各海洋环境特征(Lat、Lon、SST、SSS、SSH、SSW、V0、Mlotst和Chl‑a)分别代入到上述公式中,求出一一对应的归一化值。
[0070] 该步骤的有益效果如下:将CPUE和各海洋环境特征分别代入第二公式中,分别求得对应的归一化值,消除由于它们的时空分布和数值范围的差异引起的异常变量,进而减少对预报结果的影响。
[0071] S4,根据所述单位捕捞努力量渔获量对所述待预测渔场进行等级划分;
[0072] 本发明实施例剔除了与CPUE零值对应的数据,并按照三分位点将各月份的数据划分为“低产”和“高产”渔场。具体操作如下:
[0073] (1)将各月份的CPUE数据进行排序,并计算第一个三分位点,即CPUE数据总数低于33.3%的CPUE值;
[0074] (2)将各月份的总数低于33.3%的数据划分为“低产”渔场,高于33.3%的数据划分为“高产”渔场。
[0075] 该步骤的有益效果如下:目的在于消除月份间的差异,确保对各个渔场的评估具有可比性和稳定性,为金枪鱼资源的合理利用提供科学依据。
[0076] S5,根据集成学习算法构建预测集成学习模型,根据十折交叉验证和网格搜索法对所述预测集成学习模型进行参数调优,得到最佳模型;
[0077] 如图3,利用RF、SVM、KNN、XGBoost和GP集成学习算法,构建了基于南太平洋环境特征变量以及长鳍金枪鱼捕捞数据数据集的渔场预报集成学习模型,将2009‑2019年的特征训练数据集,按照7:3比例随机分为训练集和测试集,并将训练集平均划分为train1,train2,train3,train4,train5用于对南太平洋长鳍金枪鱼不同等级的渔场进行训练。,[0078] 其他机器学习算法如CNN、DT等也可实现本方案中的效果,本发明实施例是示例性的,不能理解为对本发明的限制。
[0079] 为提高集成学习模型对长鳍金枪鱼不同等级渔场的预报能力,本发明基于十折交叉验证并结合网格搜索法(GridSearchCV)进行参数调优。具体的,使用网格搜索法将预设的超参数对集成学习模型进行迭代训练,当集成学习模型的评价指标值达到最优时,得到模型参数的最佳取值,此时,所对应的预报模型为最佳模型。其中,预设的超参数如图4所示;集成学习模型的评价指标指在模型训练过程中的总体准确度(ACC)、不同等级渔场的准确度(P)和不同等级渔场的召回率(R),上述三类指标的计算公式与下述S7中的评价指标计算公式一致此处不赘述,不同的是上述三类指标是根据模型训练过程中的输出数据计算得到,仅用作该步骤中参数调优的评价;评价指标值达到最优可以理解为,总体准确度(ACC)越高越好,或者不同等级渔场的准确度(P)越高越好,或者不同等级渔场的召回率(R)越高越好;网格搜索法中使用的某个性能度量(比如均方误差)在交叉验证过程中取得最小值时,表示寻找到的最优超参数组合是在这个性能度量上取得最小值的情况,最优超参数组合如表1所示。
[0080] 表1
[0081]
[0082] 该步骤的有益效果如下:集成学习模型将不同基础模型的输出组合在一起进行预测,通过整合各个机器学习算法的性能来改变单一算法的参数化设置,从而获得更可靠的结果。
[0083] S6,将所述第一单位捕捞努力量渔获量和所述第一海洋环境特征输入到所述最佳模型中进行预测,得到所述待预测渔场的预测结果;
[0084] S7,根据所述待预测渔场的预测结果和所述验证数据计算所述最佳模型的评价指标,基于所述评价指标确定所述最佳模型的预测精度;所述评价指标包括:所述最佳模型的总体准确度、不同等级渔场的准确度和不同等级渔场的召回率。
[0085] 构建长鳍金枪鱼渔场预测的集成学习模型(ELM)中最佳模型的总体准确度(ACC)、不同等级渔场的准确度(P)和不同等级渔场的召回率(R)作为模型预测精度的评价指标。具体的,总体准确度(Accuracy,ACC)是指预测正确的渔场数占总渔场数的比例,由第三公式确定,第三公式如下:
[0086]
[0087] 其中,TP(True Positive)表示真正例,即南太平洋长鳍金枪鱼实际高产渔场被正确预测为高产渔场的渔场个数,TN(True Negative)表示真反例,即南太平洋长鳍金枪鱼实际低产渔场被正确预测为低产渔场的渔场个数集合,FP(False Positive)表示假正例,即实际为南太平洋长鳍金枪鱼低产渔场却被错误预测为高产渔场的个数集合,FN(False Negative)表示假反例,即实际为南太平洋长鳍金枪鱼高产渔场却被错误预测为低产渔场的个数集合。
[0088] 不同等级渔场的准确度(Precision,P)是指被模型预测为高产(低产)渔场的集合中,实际为高产(低产)渔场的比例,低产渔场的精度P1由第六公式确定,第六公式确定如下:
[0089]
[0090] 高产渔场的精度P2由第七公式确定,第七公式确定如下:
[0091]
[0092] 其中,P1和P2取值范围为0~1,越接近1说明模型预测越好,预测渔场与实际渔场的符合度越高。
[0093] 不同等级渔场的召回率(Recall,R)是指实际为高产(低产)渔场的集合中,被预测为高产(低产)渔场的比例,低产渔场的召回率R1由第四公式确定,第四公式确定如下:
[0094]
[0095] 高产渔场的召回率R2由第五公式确定,第五公式如下:
[0096]
[0097] 其中,R1和R2取值范围均为0~1,越接近1说明模型预测效果越好,预测渔场与实际渔场符合程度越高。
[0098] 将模型的输出结果按照总体准确度、不同等级渔场的准确度和不同等级渔场的召回率评价指标进行综合评价。
[0099] 表2展示了集成学习模型对2018‑2019年1‑12月长鳍金枪鱼渔场预报的精度,由表1可知,集成学习模型对1‑12月南太平洋长鳍金枪鱼渔场预报不同精度指标的范围分别为
74.71%~93.81%(ACC)、47.37%~96.15%(R1)、81.82%~98.00%(R2)、64.10%~
94.44%(P1)和76.92%~98.48%(P2)。
[0100] 表2
[0101]
[0102]
[0103] 该步骤的有益效果如下:集成学习模型对长鳍金枪鱼高产渔场的预报精度高且稳定,其高产渔场召回率在不同月份均在80%以上,渔场预报的效果较好与真实渔场符合程度最高。
[0104] 本发明还提供一种基于集成学习的金枪鱼渔场预测系统,具体技术方案如下:
[0105] 获取模块,用于获取研究区域中的待预测渔场的渔获数据和海洋环境数据;
[0106] 第一处理模块,用于将所述渔获数据分为特征数据和验证数据,根据所述特征数据确定单位捕捞努力量渔获量,根据所述单位捕捞努力量渔获量对所述海洋环境数据进行空间自相关控制,确定所述待预测渔场的海洋环境特征;
[0107] 第二处理模块,用于将所述单位捕捞努力量渔获量和所述海洋环境特征进行归一化处理,得到第一单位捕捞努力量渔获量以及第一海洋环境特征;
[0108] 等级模型,用于根据所述单位捕捞努力量渔获量对所述待预测渔场进行等级划分;
[0109] 模型模块,用于根据集成学习算法构建预测集成学习模型,根据十折交叉验证和网格搜索法对所述预测集成学习模型进行参数调优,得到最佳模型;
[0110] 预测模块,用于将所述第一单位捕捞努力量渔获量和所述第一海洋环境特征输入到所述最佳模型中进行预测,得到所述待预测渔场的预测结果。
[0111] 进一步,所述海洋环境数据包括:海表温度、叶绿素a浓度、海表盐度、海面高度、海面风速、海洋混合层厚度、海水流速、待预测渔场位置的经度以及、待预测渔场位置的纬度。
[0112] 进一步,所述单位捕捞努力量渔获量根据满足预设条件下的时间和空间内的渔获量和捕捞努力量计算确定。
[0113] 进一步,对所述待预测渔场进行等级划分包括:根据所述单位捕捞努力量渔获量将所述待预测渔场分为低产渔场和高产渔场。
[0114] 进一步,所述集成学习算法包括:RF、SVM、KNN、XGBoost和GP中的至少一种。
[0115] 进一步,所述系统还包括:
[0116] 评价模块,用于根据所述待预测渔场的预测结果和所述验证数据计算所述最佳模型的评价指标,基于所述评价指标确定所述最佳模型的预测精度。
[0117] 进一步,所述评价指标包括:所述最佳模型的总体准确度、不同等级渔场的准确度和不同等级渔场的召回率。
[0118] 在上述各实施例中,虽然对步骤进行了编号S1、S2等,但只是本发明给出的具体实施例,本领域的技术人员可根据实际情况调整S1、S2等的执行顺序,此也在本发明的保护范围内,可以理解,在一些实施例中,可以包含如上述各实施方式中的部分或全部。
[0119] 需要说明的是,上述实施例提供的一种基于集成学习的金枪鱼渔场预测系统的有益效果与上述一种基于集成学习的金枪鱼渔场预测方法的有益效果相同,在此不再赘述。此外,上述实施例提供的系统在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将系统根据实际情况划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的系统与方法实施例属于同一构思,其具体实现过程详见方法实施例,在此不再赘述。
[0120] 需要说明的是,本申请的说明书和权利要求书中的术语“第一”、“第二”、等是用于区别类似的对象,而代表对特定的顺序或先后次序进行限定。在适当情况下对于类似的对象的使用顺序可以互换,以便这里描述的本申请的实施例能够以除了图示或描述的顺序以外的顺序实施。
[0121] 尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。