会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 渔场 / 一种基于蚁群分类算法的渔场预报方法

一种基于蚁群分类算法的渔场预报方法

申请号 CN201510177021.5 申请日 2015-04-15 公开(公告)号 CN104834966A 公开(公告)日 2015-08-12
申请人 中国水产科学研究院东海水产研究所; 发明人 崔雪森; 唐峰华; 张衡; 伍玉梅; 戴阳;
摘要 本发明涉及一种基于蚁群分类算法的渔场预报方法,包括以下步骤:利用近实时的卫星遥感技术得到的环境数据,并将环境数据和渔获数据进行预处理;对环境数据进行有监督的离散化处理;通过蚁群算法中的AntMiner方法,经训练后得到一系列的渔场判别规则,利用得到的渔场判别规则;将实时或现场环境数据代入渔场判别规则后即可得到实时的渔场预报数据和分布图。
权利要求

1.一种基于蚁群分类算法的渔场预报方法,其特征在于,包括以下步骤:

(1)利用近实时的卫星遥感技术得到的环境数据,并将环境数据和渔获数据进行预处理;

(2)对环境数据进行有监督的离散化处理;

(3)通过蚁群算法中的AntMiner方法,经训练后得到一系列的渔场判别规则,利用得到的渔场判别规则;

(4)将实时或现场环境数据代入渔场判别规则后即可得到实时的渔场预报数据和分布图。

2.根据权利要求1所述的基于蚁群分类算法的渔场预报方法,其特征在于,所述步骤(1)中所述渔获数据包括日期、经度、纬度、产量、作业次数和平均日产量,时间分辨率为天,计算CPUE值: 其中ΣCatch为1°×1°网格中一个月的总产量,ΣFishingdays为当月总的船天数,并将渔区按CPUE值的分位数划分为2类,分别定义为高CPUE渔区和低CPUE渔区;所述环境数据包括海域的海水表层温度、表层叶绿素a浓度、海面高度异常、SST梯度强度、chl梯度强度和SST异常数据;将渔获数据和环境数据按

1°×1°的空间分辨率进行网格化处理。

3.根据权利要求1所述的基于蚁群分类算法的渔场预报方法,其特征在于,所述步骤(2)具体包括:选择显著性水平,根据自由度得到对应的卡方值阈值,根据卡方分析方法将具有最小卡方值的相邻区间连续迭代合并,直到满足停止准则。

4.根据权利要求1所述的基于蚁群分类算法的渔场预报方法,其特征在于,所述步骤(3)具体包括:利用Ant-miner算法模仿蚂蚁觅食行为进行分类规则的构造,每只蚂蚁的寻路过程相当于规则的生成过程,每次蚂蚁选择一个方向前进的过程相当于蚂蚁选择一个属性节点加入规则前件的过程,以上是一个迭代过程,每次迭代后将规则所正确覆盖的事例从训练集中剔除,在下一个迭代过程中是在更小的训练集中寻找新规则,这一过程重复进行直至找到的规则能够覆盖绝大部分训练集,得到一系列的渔场判别规则。

说明书全文

一种基于蚁群分类算法的渔场预报方法

技术领域

[0001] 本发明涉及渔场预报技术领域,特别是涉及一种基于蚁群分类算法的渔场预报方法。

背景技术

[0002] 西北太平洋是中国远洋渔船从事大规模商业性捕捞的重要作业海域,柔鱼是该海域的主要捕捞对象之一。据FAO统计,2006-2010年日本在北太平洋捕捞柔鱼年捕捞量达0.8~7.4万t,平均为3.6万t。中国自20世纪90年代以来,鱿钓生产规模呈扩大趋势,近年来在西北太平洋海域的作业渔船数达200~280艘,年捕捞量在3.6~11.3万t,在中国远洋渔业生产中占重要地位。北太平洋柔鱼通常分为4个群体,分别为中部秋生群、东部秋生群、西部冬春生群和中东部冬春生群,其中在170°E以西为冬春生群,是中国鱿钓船的传统捕捞对象。但柔鱼CPUE分布及其渔场的形成和变化受海洋环境因子的影响较大,且渔场分布具有区域性、时空易变性等特点,传统渔业捕捞中,对渔场判断的方法较为落后,难以快速、准确确定渔场位置,束缚了柔鱼在该海域生产效率和捕捞产量。

发明内容

[0003] 本发明所要解决的技术问题是提供一种基于蚁群分类算法的渔场预报方法,能够快速准确确定渔场位置,降低渔场寻鱼时间、提高渔获产量。
[0004] 本发明解决其技术问题所采用的技术方案是:提供一种基于蚁群分类算法的渔场预报方法,包括以下步骤:
[0005] (1)利用近实时的卫星遥感技术得到的环境数据,并将环境数据和渔获数据进行预处理;
[0006] (2)对环境数据进行有监督的离散化处理;
[0007] (3)通过蚁群算法中的AntMiner方法,经训练后得到一系列的渔场判别规则,利用得到的渔场判别规则;
[0008] (4)将实时或现场环境数据代入渔场判别规则后即可得到实时的渔场预报数据和分布图。
[0009] 所述步骤(1)中所述渔获数据包括日期、经度、纬度、产量、作业次数和平均日产量,时间分辨率为天,计算CPUE值: 其中ΣCatch为1°×1°网格中一个月的总产量,ΣFishingdays为当月总的船天数,并将渔区按CPUE值的分位数划分为2类,分别定义为高CPUE渔区和低CPUE渔区;所述环境数据包括海域的海水表层温度、表层叶绿素a浓度、海面高度异常、SST梯度强度、chl梯度强度和SST异常数据;将渔获数据和环境数据按1°×1°的空间分辨率进行网格化处理。
[0010] 所述步骤(2)具体包括:选择显著性水平,根据自由度得到对应的卡方值阈值,根据卡方分析方法将具有最小卡方值的相邻区间连续迭代合并,直到满足停止准则。
[0011] 所述步骤(3)具体包括:利用Ant-miner算法模仿蚂蚁觅食行为进行分类规则的构造,每只蚂蚁的寻路过程相当于规则的生成过程,每次蚂蚁选择一个方向前进的过程相当于蚂蚁选择一个属性节点加入规则前件的过程,以上是一个迭代过程,每次迭代后将规则所正确覆盖的事例从训练集中剔除,在下一个迭代过程中是在更小的训练集中寻找新规则,这一过程重复进行直至找到的规则能够覆盖绝大部分训练集,得到一系列的渔场判别规则。有益效果
[0012] 由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明利用近实时的卫星遥感技术得到的环境数据,经过有监督的离散化后,通过蚁群算法中的AntMiner方法,经训练后得到一系列的渔场判别规则。利用这些规则,经代入实时或现场环境数据后即可实时地得到实时的渔场预报数据和分布图,从而能够快速准确确定渔场位置,降低渔场寻鱼时间、提高渔获产量。

附图说明

[0013] 图1是不同离散化时显著性水平与CPUE分位点下交叉验证的精度分布图;
[0014] 图2是不同离散化时显著性水平与CPUE分位点下交叉验证的精度提升值分布图;
[0015] 图3是实施例中北太平洋柔鱼渔场预报与实际生产叠加图。

具体实施方式

[0016] 下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
[0017] 本发明的实施方式涉及一种基于蚁群分类算法的渔场预报方法,包括以下步骤:
[0018] (一)训练数据的准备和处理方法
[0019] 渔获数据时间范围为2002~2011年,海域的空间范围为144°E-170°E、34°N-50°N,数据内容包括日期、经度、纬度、产量、作业次数和平均日产量。时间分辨率为天,计算CPUE值,即
[0020]
[0021] 其中,ΣCatch为1°×1°网格中一个月的总产量,ΣFishingdays为当月总的船天数,CPUE的单位为t/(船·天)。将渔区按CPUE的分位数划分为2类,分别定义为高CPUE渔区(High CPUE)和低CPUE渔区(Low CPUE)。
[0022] 环境数据包括该海域的海水表层温度(SST)、表层叶绿素a浓度(chl)、海面高度异常(SSHA)、SST梯度强度(SSTG)、chl梯度强度(chlG)、SST异常(SSTA)数据。前两者均取自http://oceancolor.gsfc.nasa.gov/的月平均数据,海面高度异常数据来自于http://www.aviso.oceanobs.com/的月平均数据。为了使环境数据与渔获数据匹配,在此将生产数据和环境数据按1°×1°的空间分辨率进行网格化处理。其中,梯度强度可应用求梯度幅值(GradientMagnitude,简称GM)的公式来进行。设当前渔区的上下左右四个网格点的海表温度为SSTi±1,j和SSTi,j±1,以差分的格式表示表温梯度为
[0023]
[0024] 其中,i和j分别为当前渔区格点的列和行的索引值,Δy表示i-1行和i+1行之间的距离,Δx表示j-1列和j+1列之间的距离,单位为km。
[0025] 同理可得到叶绿素a浓度的梯度为
[0026]
[0027] 其中,chli±1,j和chli,j±1为当前渔区的上下左右四个网格点的叶绿素a浓度。
[0028] SST异常通过公式(4)得到
[0029]
[0030] 其中,SSTi,j为第i行j列的SST值, 分别为第i行j列多年SST平均值。
[0031] (二)解释变量的离散化
[0032] ChiMerge是有监督、自底向上的数据离散化,根据卡方分析方法将具有最小卡方值的相邻区间连续迭代合并,直到满足停止准则。要离散化某一属性,首先选择显著性水平α,根据自由度(输出变量的类别数-1)得到对应的卡方值阈值。当类别和属性独立时,有1-α的可能性使计算得到的卡方值会小于阈值,而大于阈值的卡方值说明属性和类别之间不是相互独立的,因此不能合并。离散化输出变量CPUE较简单,是通过确定一个0到1之间的分位数完成。
[0033] 环境属性变量在不同显著水平α下离散程度不同,训练后得到的规则也不同。同样CPUE取不同的分位数q,也会对训练结果和渔场精度的验证产生不同的影响。因此,通过以下方法筛选出一对最佳(α,q)组合:设渔区总个数为N,划分高、低CPUE的分位数为q,意味着在测试数据集中,高、低CPUE渔区出现的概率分为q和1-q,则高CPUE渔场个数为NH=N(1-q),低CPUE渔场个数NL=Nq。在不经任何训练、按此高、低CPUE固有的概率随机为各个渔区分配渔场类型(High或Low)的情况下,仍然可以得到渔场精度[0034]
[0035] 假设经训练后的预报精度为pα,q,显然,单纯以pα,q作为衡量训练的效果,是不合理的。而应从pα,q中去除pq'的影响,得到计算精度提升值
[0036] Δpα,q=pα,q-pq' (6)
[0037] 当Δpα,q取最大值时,即可确定出(α,q)的最佳组合。
[0038] (三)机器学习过程
[0039] 利用Ant-miner算法模仿蚂蚁觅食行为进行分类规则的构造,每只蚂蚁的寻路过程相当于规则的生成过程,每次蚂蚁选择一个方向前进的过程相当于蚂蚁选择一个属性节点加入规则前件的过程。以上是一个迭代过程,每次迭代后将规则所正确覆盖的事例从训练集中剔除,因此在下一个迭代过程中是在更小的训练集中寻找新规则,这一过程重复进行直至找到的规则能够覆盖绝大部分训练集,得到一系列的IF-THEN规则。其伪代码如下所示:
[0040] 表1 Ant-Miner实现的步骤
[0041]
[0042]
[0043] 在渔场环境中,假设环境属性节点i具有j值,记为(i|j),则(i|j)被蚂蚁选中的概率为
[0044]
[0045] 其中,a是所有环境属性值,bi是属性i的所有离散值,I为没有被蚂蚁选择过的属性集。
[0046] τij(t)为节点(i|j)在t时刻的信息素。当一条规则Rule完成,之后与规则相关的属性节点的信息素都将被更新,即
[0047] τij(t+1)=τij+τij×Q,i|j∈Rule,(8)
[0048] 其中,Q为规则质量标准,为规则应用到训练集实例时的敏感度与特异度的乘积表示,具体如下:
[0049]
[0050] 其中TruePos是被规则覆盖,所属类与规则类相同的记录数目;FalsePos是被规则覆盖,所属类与规则类不同的记录数目;FalseNeg是未被规则覆盖,所属类别与规则类一致的记录数目;TrueNeg为不被规则覆盖,所属类与规则类不同的记录数目。
[0051] ηi,j为属性节点(i|j)的启发式函数,公式表示为
[0052]
[0053] 其中,infoTij为节点的信息熵,由下列公式表示
[0054]
[0055] 其中,k是数据集中类别数,|Ti,j|是数据集中所属性i的值为j的实例总数, 为第i个属性值为j且属于w类的实例数。
[0056] 现结合具体实施例进一步说明本发明:
[0057] (1)预报模型训练
[0058] 设蚂蚁数量60只,每条规则实例数(No_Rules_Converg)为5,未覆盖的实例最大数(Max_Uncovered_Cases)为10,计算最大迭代次数1500。选取2002-2011年共10年的北-1太平洋柔鱼产量数据共计1024条记录作为训练集,设定不同的CPUE分位点qj=j×10 (j-3
=1,2,…,9)和不同的ChiMerger离散化显著性水平αi=i×10 (i=1,2,…,10),对环境数据进行离散化并与分级的CPUE数据匹配,构成训练数据集,利用10折交叉验证测试模型的分类精度,得到 分布图(如图1所示)。再利用公式(6)计算得到各个点的精度提升值 其分布如图2所示。
[0059] 从图2可以看出,当CPUE分位点为0.8和0.3时、均出现了精度提升值的高峰带,但为了避免预报时高CPUE渔场出现的范围过大,所以CPUE分位点取0.8,且当ChiMerger离散化显著性水平取0.006时,精度提升出现了一个高峰值13.82%,其10折交叉验证的精度为81.82%,标准差为±0.23%。因此将(0.006,0.8)作为离散化显著性水平和CPUE分位点,对训练数据集进行离散化并依Ant-Miner原理重新进行训练,得到表2的IF-THEN规则集。
[0060] 表2 训练得到的渔场预报规则
[0061]
[0062]
[0063] (2)预报结果
[0064] 将2012年6-12月份的环境数据代入表2中的规则,可得到各个月份每个渔区的预报渔场,经与实际生产渔场叠加后,如图3所示。