一种预测小麦收获期呕吐毒素含量的方法及系统转让专利

申请号 : CN202110714115.7

文献号 : CN113505920B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王松雪叶金李森蔡娣李冰杰

申请人 : 国家粮食和物资储备局科学研究院

摘要 :

本发明提供一种预测小麦收获期呕吐毒素含量的方法及系统,基于历史数据通过计算与小麦收获期呕吐毒素含量的相关系数以及方差膨胀因子筛选出适合建立预测模型的综合因素,通过综合因素建立预测模型;同时又基于历史生长数据预测到当年生长数据,基于当年生长数据得到预测模型所需要的相关因素,通过预测模型与相关因素预测小麦收获期呕吐毒素含量并进行预警。相比现有技术,预测模型中的统计项更加完备,通过两次不同的筛选模型所筛选的因素显著性更高,进而通过多元线性回归算法所建立的预测模型精准度更高。

权利要求 :

1.一种预测小麦收获期呕吐毒素含量的方法,其特征在于,所述方法包括:获取预测区域预设历史年度的第一小麦相关数据;

利用所述第一小麦相关数据预处理得到规范化的第一数据样本;

根据所述第一数据样本建立预测模型;

根据所述第一小麦相关数据获取预测区域未来一段时间内的第二小麦相关数据;

根据所述第二小麦相关数据,通过预处理得到规范化的第二数据样本;

通过第二数据样本与预测模型进行风险预测,得到预测结果;根据所述预测结果进行区域风险地图绘制;

所述获取预测区域预设历史年度的第一小麦相关数据,具体包括:获取预测区域预测点的地理数据,通过所述地理数据得到所述预测区域内或距离所述预测区域最近的气象站,其中,所述地理数据包括:经度信息和纬度信息;

从所述气象站得到预设历史年度的小麦生长期数据,所述预设历史年度的小麦生长期数据包括:第一开花期、第一收获期;

根据所述第一开花期和所述第一收获期和预设规则得到第一基准时间段;

利用预测区域预测点的历年气象数据映射至所述第一基准时间段,得到所对应的第一气象因素;

基于第一基准时间段获取第一小麦收获期呕吐毒素含量和所述第一基准时间段所处年份的第一耕种数据;

所述第一小麦相关数据包括:所述第一气象因素、所述第一耕种数据、所述第一小麦收获期呕吐毒素含量以及所述地理数据。

2.根据权利要求1所述一种预测小麦收获期呕吐毒素含量的方法,其特征在于,利用所述第一小麦相关数据预处理得到规范化的第一数据样本,包括:将所述第一气象因素进行归一化处理得到第一气象因素样本;

根据所述第一耕种数据与所述地理数据分别得到第一耕种因素和地理因素;

所述第一数据样本包括:所述第一气象因素样本、所述第一耕种因素和所述第一小麦收获期呕吐毒素含量。

3.根据权利要求2所述一种预测小麦收获期呕吐毒素含量的方法,其特征在于,所述根据所述第一数据样本建立预测模型,包括:将所述第一气象因素样本与所述第一小麦收获期呕吐毒素含量进行相关系数计算,得到气象相关系数集;将所述第一耕种因素与所述第一小麦收获期呕吐毒素含量进行相关系数计算,得到耕种相关系数集;将所述地理因素与所述第一小麦收获期呕吐毒素含量进行相关系数计算,得到地理相关系数集;

设定第一阈值,从所述气象相关系数集、所述耕种相关系数集和所述地理相关系数集中筛选出达到所述第一阈值的系数,并利用达到所述第一阈值的系数所对应的因素形成第一综合因素集;

计算所述第一综合因素集中各个因素的方差膨胀因子;

设定第二阈值,筛选出所述方差膨胀因子小于所述第二阈值所对应的因素,得到第二综合因素集;

基于多元线性回归,通过第二综合因素集建立预测模型。

4.根据权利要求3所述一种预测小麦收获期呕吐毒素含量的方法,其特征在于,所述根据所述第一小麦相关数据获取预测区域未来一段时间内的第二小麦相关数据,根据所述第二小麦相关数据,通过预处理得到规范化的第二数据样本,包括:将所述预设历史年度的所述第一开花期进行均值处理得到第二开花期;

将所述预设历史年度的所述第一收获期进行均值处理得到第二收获期;

根据所述第二开花期和所述第二收获期利用预设规则建立第二基准时间段;

基于所述地理数据获取所述第二基准时间段预测区域的第二气象因素、预测当年的第二耕种数据;

所述第二小麦相关数据包括:所述第二气象因素、所述第二耕种数据和所述地理因素;

将所述第二气象因素进行归一化处理得到第二气象因素样本;

基于所述第二耕种数据获取第二耕种因素;

所述第二数据样本包括:所述第二气象因素样本、所述第二耕种因素。

5.根据权利要求4所述一种预测小麦收获期呕吐毒素含量的方法,其特征在于,得到所述第一基准时间段与所述第二基准时间段的预设规则,其包括:选取从所述第一开花期/所述第二开花期前24天至所述第一开花期/所述第二开花期后17天,作为第一选定时间段;

以7天为间隔,将所述第一选定时间段划分为第一至第六时间段;

选取从所述第一收获期/所述第二收获期前24天至所述第一收获期/所述第二收获期后3天,作为第二选定时间段;

以7天为间隔,将所述第二选定时间段划分为第七至第十时间段;

所述第一基准时间段/所述第二基准时间段包括所述第一至第六时间段和所述第七至第十时间段。

6.根据权利要求5所述一种预测小麦收获期呕吐毒素含量的方法,其特征在于,历年气象数据包括:历年的逐小时气温、相对湿度、降雨量、日照小时数;所述第一气象因素/所述第二气象因素包括:所述第一至第十时间段内的“平均气温”、“高于25摄氏度的小时数”、“总降雨量”、“相对湿度高于80%的小时数”、“连续2小时相对湿度高于80%的平均气温之和”、“连续4小时相对湿度高于80%的平均气温之和”、“平均日照小时数”。

7.根据权利要求6所述一种预测小麦收获期呕吐毒素含量的方法,其特征在于,历年的第一耕种数据包括:历年小麦的轮作情况、秸秆处理方式、地形、种子用量、土壤类型、翻耕方式、是否使用除草剂、是否使用杀真菌剂、是否有病虫害、是否对病虫害施药;其中,所述轮作情况为上季度土地轮作的农作物,其包括:“稻谷”、“玉米”、“小麦”、“大豆”、“花生”和“蔬菜”;

所述秸秆处理方式包括:“收集使用”和“粉碎还田”;

所述地形包括:“平原”、“丘陵”、“坡地”和“高原”,土壤类型分类为“粘土”、“沙土”、“粘壤土”、“沙壤土”、“粉壤”和“红壤‑盐碱土‑岩性土”,翻耕方式分类为“免耕”、“平翻”、“深松”和“深耕”。

8.根据权利要求4所述的一种预测小麦收获期呕吐毒素含量的方法,其特征在于,所述预测模型的公式为:

其中,ak为第k个因素的系数,b为常数项;

g(x)在小于等于500时,呕吐毒素含量无污染风险,g(x)在(500,1500]时,呕吐毒素含量存在轻度污染风险,g(x)在(1500,2500]时,呕吐毒素含量存在中度污染风险,g(x)在大于2500时,呕吐毒素含量存在重度污染风险。

9.一种预测小麦收获期呕吐毒素含量的系统,其特征在于,所述系统包括:第一获取模块、预处理模块、预测模型建立模块、第二获取模块和展示模块;

所述第一获取模块用于获取预测区域预设历史年度的第一小麦相关数据;

所述预处理模块用于利用所述第一小麦相关数据预处理得到规范化的第一数据样本;

所述预测模型建立模块用于根据所述第一数据样本建立预测模型;

所述第二获取模块用于根据所述第一小麦相关数据获取预测区域未来一段时间内的第二小麦相关数据;

所述预处理模块还用于根据所述第二小麦相关数据,通过预处理得到规范化的第二数据样本;

通过第二数据样本与预测模型进行风险预测,得到预测结果;

所述展示模块用于根据所述预测结果进行区域风险地图绘制;

所述获取预测区域预设历史年度的第一小麦相关数据,具体包括:获取预测区域预测点的地理数据,通过所述地理数据得到所述预测区域内或距离所述预测区域最近的气象站,其中,所述地理数据包括:经度信息和纬度信息;

从所述气象站得到预设历史年度的小麦生长期数据,所述预设历史年度的小麦生长期数据包括:第一开花期、第一收获期;

根据所述第一开花期和所述第一收获期和预设规则得到第一基准时间段;

利用预测区域预测点的历年气象数据映射至所述第一基准时间段,得到所对应的第一气象因素;

基于第一基准时间段获取第一小麦收获期呕吐毒素含量和所述第一基准时间段所处年份的第一耕种数据;

所述第一小麦相关数据包括:所述第一气象因素、所述第一耕种数据、所述第一小麦收获期呕吐毒素含量以及所述地理数据。

说明书 :

一种预测小麦收获期呕吐毒素含量的方法及系统

技术领域

[0001] 本发明涉及信息处理领域,特别是涉及一种预测小麦收获期呕吐毒素含量的方法及系统。

背景技术

[0002] 粮食中呕吐毒素污染分别由产前和产后两个阶段产生,随着科技进步和我国储粮方式的不断改进,目前粮食中真菌毒素的发生主要存在于粮食收获前。收获前,由于粮食作
物在田间生长过程中真菌感染、耕作方式影响和天气条件不稳定,导致真菌毒素积累,且不
同地区,不同年份间差异较大。因此,在收获前预测粮食中呕吐毒素含量,从而实施有针对
性的预防措施,从根本上降低粮食呕吐毒素污染非常重要。
[0003] 粮食中导致呕吐毒素产生的因素众多,主要指标为天气情况、作物熟性与耕种条件、病虫害情况等。由于作物熟性、耕种条件和病虫害情况均要在采样完成后才能获得,因
此在收获之前,我们仅根据气象数据对小麦收获后呕吐毒素含量进行预测。现有技术中存
在仅考虑气象因素与呕吐毒素之间的相关性,而忽略耕种因素与呕吐毒素之间的相关性,
从而导致样本集不完整;并且现有技术中对于因素的相关性的验证方法简单单一,导致样
本集中因素的相关性不显著;最终导致预测结果不准确。

发明内容

[0004] 本发明的目的是为了解决现有技术中存在的缺点,而提出的一种预测小麦收获期呕吐毒素含量的方法及系统。
[0005] 本发明实施例提供如下技术方案:
[0006] 第一方面,为本实施例提供了一种预测小麦收获期呕吐毒素含量的方法,所述方法包括:
[0007] 获取预测区域预设历史年度的第一小麦相关数据;
[0008] 利用所述第一小麦相关数据预处理得到规范化的第一数据样本;
[0009] 根据所述第一数据样本建立预测模型;
[0010] 根据所述第一小麦相关数据获取预测区域未来一段时间内的第二小麦相关数据;
[0011] 根据所述第二小麦相关数据,通过预处理得到规范化的第二数据样本;
[0012] 通过第二数据样本与预测模型进行风险预测,得到预测结果;根据所述预测结果进行区域风险地图绘制。
[0013] 进一步地,所述获取预测区域历年小麦第一小麦相关数据;包括:
[0014] 获取预测区域预测点的地理数据,通过所述地理数据得到所述预测区域内或距离所述预测区域最近的气象站,其中,所述地理数据包括:经度信息和纬度信息;
[0015] 从所述气象站得到预设历史年度的小麦生长期数据,所述预设历史年度的小麦生长期数据包括:第一开花期、第一收获期;
[0016] 根据所述第一开花期和所述第一收获期和预设规则得到第一基准时间段;
[0017] 利用预测区域预测点的历年气象数据映射至所述得到所述第一基准时间段,得到所对应的第一气象因素;
[0018] 基于第一基准时间段获取所述第一小麦收获期呕吐毒素含量和所述第一基准时间段所处年份的第一耕种数据;
[0019] 所述第一小麦相关数据包括:所述第一气象数据、所述第一耕种数据、所述第一小麦收获期呕吐毒素含量以及所述地理数据。
[0020] 进一步地,利用所述第一小麦相关数据预处理得到规范化的第一数据样本,包括:
[0021] 将所述第一气象因素进行归一化处理得到第一气象因素样本;
[0022] 根据所述第一耕种数据与所述地理数据分别得到第一耕种因素和地理因素;
[0023] 所述第一数据样本包括:所述第一气象因素样本、所述第一耕种因素和所述第一小麦收获期呕吐毒素含量。
[0024] 进一步地,根据所述第一数据样本建立预测模型,包括:
[0025] 将所述第一气象因素样本与所述第一小麦收获期呕吐毒素含量进行相关系数计算,得到气象相关系数集;将所述第一耕种因素与所述第一小麦收获期呕吐毒素含量进行
相关系数计算,得到耕种相关系数集;将所述地理因素与所述第一小麦收获期呕吐毒素含
量进行相关系数计算,得到地理相关系数集;
[0026] 设定第一阈值,从所述气象相关系数集、所述耕种相关系数集和所述地理相关系数集中筛选出达到所述第一阈值的系数,并利用达到所述第一阈值的系数所对应的因素形
成第一综合因素集;
[0027] 计算所述第一综合因素集中各个因素的方差膨胀因子;
[0028] 设定第二阈值,筛选出所述方差膨胀因子小于所述第二阈值所对应的因素,得到第二综合因素集;
[0029] 基于多元线性回归,通过第二综合因素集建立预测模型。
[0030] 进一步地,根据所述第一小麦相关数据获取预测区域未来一段时间内的第二小麦相关数据,根据所述第二小麦相关数据,通过预处理得到规范化的第二数据样本,包括:
[0031] 将所述预设历史年度的所述第一开花期进行均值处理得到第二开花期;
[0032] 将所述预设历史年度的所述第一收获期进行均值处理得到第二收获期;
[0033] 根据所述第二开花期和所述第二收获期利用预设规则建立第二基准时间段段;
[0034] 基于所述地理数据获取所述第二基准时间段预测区域的第二气象因素、预测当年的第二耕种数据;
[0035] 所述第二小麦相关数据包括:所述第二气象数据、所述第二耕种数据和所述地理因素;
[0036] 将所述第二气象因素进行归一化处理得到第二气象因素样本;
[0037] 基于所述第二耕种数据获取第二耕种因素;
[0038] 所述第二数据样本包括:所述第二气象因素样本、所述第二耕种因素。
[0039] 优选地,得到所述第一基准时间段与所述第二基准时间段的预设规则,其包括:
[0040] 选取从所述第一开花期/所述第二开花期前24天至所述第一开花期/所述第二开花期后17天,作为第一选定时间段;
[0041] 以7天为间隔,将所述第一选定时间段划分为第一至第六时间段;
[0042] 选取从所述第一收获期/所述第二收获期前24天至所述第一收获期/所述第二收获期后3天,作为第二选定时间段;
[0043] 以7天为间隔,将所述第二选定时间段划分为第七至第十时间段;
[0044] 所述所述第一基准时间段/所述第二基准时间段包括所述第一至第六时间段和所述第七至第十时间段。
[0045] 进一步地,历年气象数据包括:历年的主小时气温、相对湿度、降雨量、日照小时数;所述第一气象因素/所述第二气象因素包括:所述第一至第十时间段内的“平均气温”、
“高于25摄氏度的小时数”、“总降雨量”、“相对湿度高于80%的小时数”、“连续2小时相对湿
度高于80%的平均气温之和”、“连续4小时相对湿度高于80%的平均气温之和”、“平均日照
小时数”。
[0046] 进一步地,所述历年小麦耕种数据包括:历年小麦的轮作情况、秸秆处理方式、地形、种子用量、土壤类型、翻耕方式、是否使用除草剂、是否使用杀真菌剂、是否有病虫害、是
否对病虫害施药;其中,所述轮作情况为上季度土地轮作的农作物,其包括:“稻谷”、“玉
米”、“小麦”、“大豆”、“花生”和“蔬菜”;
[0047] 所述秸秆处理方式包括:“收集使用”和“粉碎还田”;
[0048] 所述地形包括:“平原”、“丘陵”、“坡地”和“高原”,土壤类型分类为“粘土”、“沙土”、“粘壤土”、“沙壤土”、“粉壤”和“红壤‑盐碱土‑岩性土”,翻耕方式分类为“免耕”、“平
翻”、“深松”和“深耕”。
[0049] 进一步地,所述预测模型的公式为:
[0050]
[0051]
[0052] 其中,ak为第k个因素的系数,b为常数项;
[0053] g(x)在小于等于500时,呕吐毒素含量无污染风险,
[0054] g(x)在(500,1500]时,呕吐毒素含量存在轻度污染风险,
[0055] g(x)在(1500,2500]时,呕吐毒素含量存在中度污染风险,
[0056] g(x)在大于2500时,呕吐毒素含量存在重度污染风险。
[0057] 第二方面,为本实施例提供了一种预测小麦收获期呕吐毒素含量的系统,所述系统包括:
[0058] 第一获取模块、预处理模块、预测模型建立模块、第二获取模块和展示模块;
[0059] 所述第一获取模块用于获取预测区域预设历史年度的第一小麦相关数据;
[0060] 所述预处理模块用于利用所述第一小麦相关数据预处理得到规范化的第一数据样本;
[0061] 所述预测模型建立模块用于根据所述第一数据样本建立预测模型;
[0062] 所述第二获取模块用于根据所述第一小麦相关数据获取预测区域未来一段时间内的第二小麦相关数据;
[0063] 所述预处理模块还用于根据所述第二小麦相关数据,通过预处理得到规范化的第二数据样本;
[0064] 通过第二数据样本与预测模型进行风险预测,得到预测结果;
[0065] 所述展示模块用于根据所述预测结果进行区域风险地图绘制。
[0066] 本发明提供一种小麦收获期呕吐毒素含量的预测方法及系统,基于历史数据通过计算与小麦收获期呕吐毒素含量的相关系数以及方差膨胀因子筛选出适合建立预测模型
的综合因素,通过综合因素建立预测模型;同时又基于历史生长数据预测到当年生长数据,
基于当年生长数据得到预测模型所需要的相关因素,通过预测模型与相关因素预测小麦收
获期呕吐毒素含量并进行预警。相比现有技术,预测模型中的统计项更加完备,通过两次不
同的筛选模型所筛选的因素显著性更高,进而通过多元线性回归算法所建立的预测模型精
准度更高。

附图说明

[0067] 为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅
仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据
提供的附图引申获得其它的实施附图。
[0068] 本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的
实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功
效及所能达成的目的下,均应仍落在本发明所揭示的技术内容得能涵盖的范围内。
[0069] 图1为本发明一个实施例提供了一种预测小麦收获期呕吐毒素含量的系统;
[0070] 图2为本发明一个实施例提供了一种预测小麦收获期呕吐毒素含量的方法;
[0071] 图3位本发明一个实施例提供了气象统计时间段;
[0072] 图4为本发明一个实施例提供了2016‑2019年开花日期与均值差值统计;
[0073] 图5为本发明一个实施例提供了2016‑2019年收获日期与均值差值统计;
[0074] 图6为本发明一个实施例提供了黄淮海区域收获期时间分布;
[0075] 图7为本发明一个实施例提供了实时气象数据获取界面;
[0076] 图8位本发明一个实施例提供了气象预报数据获取界面;
[0077] 图9为本发明一个实施例提供了2020年小麦收获期呕吐毒素含量风险分类预测结果统计;
[0078] 图10为本发明一个实施例提供了收获后呕吐毒素污染风险图。

具体实施方式

[0079] 以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一
部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做
出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0080] 参考图1,为本发明一个实施例提供了一种预测小麦收获期呕吐毒素含量的系统,所述系统包括:第一获取模块01、预处理模块03、预测模型建立模块04、第二获取模块02和
展示模块05。
[0081] 所述第一获取模块01用于获取预测区域预设历史年度的第一小麦相关数据;所述预处理模块03用于利用所述第一小麦相关数据预处理得到规范化的第一数据样本;所述预
测模型04建立模块用于根据所述第一数据样本建立预测模型;所述第二获取模块02用于根
据所述第一小麦相关数据获取预测区域未来一段时间内的第二小麦相关数据;所述预处理
模块03还用于根据所述第二小麦相关数据,通过预处理得到规范化的第二数据样本;通过
第二数据样本与预测模型进行风险预测,得到预测结果;所述展示模块05用于根据所述预
测结果进行区域风险地图绘制。
[0082] 与上述公开的一种预测小麦收获期呕吐毒素含量的系统相对应,本发明实施例还公开了一种预测小麦收获期呕吐毒素含量的方法。以下结合上述描述的一种预测小麦收获
期呕吐毒素含量的系统详细介绍本发明实施例中公开的一种预测小麦收获期呕吐毒素含
量的方法。
[0083] 参考图2,为本发明一个实施例提供了一种预测小麦收获期呕吐毒素含量的方法,所述方法包括:获取预测区域预设历史年度的第一小麦相关数据;利用所述第一小麦相关
数据预处理得到规范化的第一数据样本;根据所述第一数据样本建立预测模型;根据所述
第一小麦相关数据获取预测区域未来一段时间内的第二小麦相关数据;根据所述第二小麦
相关数据,通过预处理得到规范化的第二数据样本;通过第二数据样本与预测模型进行风
险预测,得到预测结果;根据所述预测结果进行区域风险地图绘制。
[0084] 进一步地,获取预测区域历年小麦第一小麦相关数据;包括:获取预测区域预测点的地理数据,通过所述地理数据得到所述预测区域内或距离所述预测区域最近的气象站,
其中,所述地理数据包括:经度信息和纬度信息;从所述气象站得到预设历史年度的小麦生
长期数据,所述预设历史年度的小麦生长期数据包括:第一开花期、第一收获期;根据所述
第一开花期和所述第一收获期和预设规则得到第一基准时间段;利用预测区域预测点的历
年气象数据映射至所述得到所述第一基准时间段,得到所对应的第一气象因素;基于第一
基准时间段获取所述第一小麦收获期呕吐毒素含量和所述第一基准时间段所处年份的第
一耕种数据;所述第一小麦相关数据包括:所述第一气象数据、所述第一耕种数据、所述第
一小麦收获期呕吐毒素含量以及所述地理数据。
[0085] 在一个实施例中,寻找距离预测区域最近的气象站的方法为:步骤一:读取当前地点经纬度信息,搜索当前位置南北方向1经度、东西方向1纬度范围内所有气象站,当搜索到
气象站个数不为零时进入步骤三,否则,进行步骤二,直至搜索到气象站个数不为零时进入
步骤三;步骤二:在当前基础上南北方向延伸1经度、东西方向延伸1纬度;步骤三:使用枚举
法计算当前地点分别距所有气象站的距离,距离最小的即为目标气象站。
[0086] 在一个实施例中,以484个气象站点为预测基准点。
[0087] 进一步地,利用所述第一小麦相关数据预处理得到规范化的第一数据样本,包括:将所述第一气象因素进行归一化处理得到第一气象因素样本;根据所述第一耕种数据与所
述地理数据分别得到第一耕种因素和地理因素;所述第一数据样本包括:所述第一气象因
素样本、所述第一耕种因素和所述第一小麦收获期呕吐毒素含量。其中,所述归一化处理包
括将因素映射到[0,1]空间,形成规范化的因素样本,归一化公式为:
[0088]
[0089] 其中,xk为归一化后的样本数据,x'k为样本的原始数据,xmax、xmin分别为样本数据中的最大值和最小值。
[0090] 进一步地,根据所述第一数据样本建立预测模型,包括:将所述第一气象因素样本与所述第一小麦收获期呕吐毒素含量进行相关系数计算,得到气象相关系数集;将所述第
一耕种因素与所述第一小麦收获期呕吐毒素含量进行相关系数计算,得到耕种相关系数
集;将所述地理因素与所述第一小麦收获期呕吐毒素含量进行相关系数计算,得到地理相
关系数集;设定第一阈值,从所述气象相关系数集、所述耕种相关系数集和所述地理相关系
数集中筛选出达到所述第一阈值的系数,并利用达到所述第一阈值的系数所对应的因素形
成第一综合因素集;计算所述第一综合因素集中各个因素的方差膨胀因子;设定第二阈值,
筛选出所述方差膨胀因子小于所述第二阈值所对应的因素,得到第二综合因素集;基于多
元线性回归,通过第二综合因素集建立预测模型。
[0091] 具体地,上述将所述第一气象因素样本与所述第一小麦收获期呕吐毒素含量进行相关系数计算,得到气象相关系数集;将所述第一耕种因素与所述第一小麦收获期呕吐毒
素含量进行相关系数计算,得到耕种相关系数集,所述相关系数可以为皮尔森相关系数,皮
尔森相关系数计算公式具体如下:
[0092]
[0093] 具体地,上述计算所述第一综合因素集的方差膨胀因子,方差膨胀因子计算公式如下:
[0094] j=1,2,....,p(p为因素个数),
[0095] 其中, 为第j个因素与其余因素的判断系数。
[0096] 进一步地,据所述第一小麦相关数据获取预测区域未来一段时间内的第二小麦相关数据,根据所述第二小麦相关数据,通过预处理得到规范化的第二数据样本,包括:将所
述预设历史年度的所述第一开花期进行均值处理得到第二开花期;将所述预设历史年度的
所述第一收获期进行均值处理得到第二收获期;根据所述第二开花期和所述第二收获期利
用预设规则建立第二基准时间段段;基于所述地理数据获取所述第二基准时间段预测区域
的第二气象因素、预测当年的第二耕种数据;所述第二小麦相关数据包括:所述第二气象数
据、所述第二耕种数据和所述地理因素;将所述第二气象因素进行归一化处理得到第二气
象因素样本;基于所述第二耕种数据获取第二耕种因素;所述第二数据样本包括:所述第二
气象因素样本、所述第二耕种因素。
[0097] 在一个实施例中,为了确定2020年的第二开花期与第二收获期,预测模型中气象因素以第一开花期和第二收获期为基础进行统计。在进行2020年小麦收获期呕吐毒素含量
预测过程中,采用的第二开花期与第二收获期为2016至2019年的第一开花期与第一收获期
平均值。参考图4为本发明一个实施例提供了2016‑2019年开花日期与均值差值统计,根据
图中统计结果,其中71%的差值在±3天内,90%的差值在±5天内。进而,参考图5为本发明
一个实施例提供了2016‑2019年收获日期与均值差值统计,其中87%的差值在±4天内,
97%的差值在±6天内。由此,可以看出,历年第一开花期与第一收获期数据均值与当年第
二开花期与第二收获期差异较小,因此应用历史生长期数据均值代替2020年的生长期较为
可靠。
[0098] 在一个实施例中,通过2016至2019年生长期数据均值,得到了2020年小麦收获期估计值,参考图6为本发明一个实施例提供了黄淮海区域收获期时间分布;从图中可以看出
收获最早的地区在5月18日小麦已经成熟,收获最晚的为6月17日,模型要使用收获前3天的
气象数据,6月15日即可对所有地区完成收获前的预测。
[0099] 参考图3,为本发明一个实施例提供了气象统计时间段;所述第一基准时间段与所述第二基准时间段的预设规则,其包括:
[0100] 选取从所述第一开花期/所述第二开花期前24天至所述第一开花期/所述第二开花期后17天,作为第一选定时间段;以7天为间隔,将所述第一选定时间段划分为第一至第
六时间段;选取从所述第一收获期/所述第二收获期前24天至所述第一收获期/所述第二收
获期后3天,作为第二选定时间段;以7天为间隔,将所述第二选定时间段划分为第七至第十
时间段;所述所述第一基准时间段/所述第二基准时间段包括所述第一至第六时间段和所
述第七至第十时间段。
[0101] 进一步地,历年气象数据包括:历年的主小时气温、相对湿度、降雨量、日照小时数;所述第一气象因素/所述第二气象因素包括:所述第一至第十时间段内的“平均气温”、
“高于25摄氏度的小时数”、“总降雨量”、“相对湿度高于80%的小时数”、“连续2小时相对湿
度高于80%的平均气温之和”、“连续4小时相对湿度高于80%的平均气温之和”、“平均日照
小时数”。
[0102] 进一步地,历年小麦耕种数据包括:历年小麦的轮作情况、秸秆处理方式、地形、种子用量、土壤类型、翻耕方式、是否使用除草剂、是否使用杀真菌剂、是否有病虫害、是否对
病虫害施药;其中,所述轮作情况为上季度土地轮作的农作物,其包括:“稻谷”、“玉米”、“小
麦”、“大豆”、“花生”和“蔬菜”;所述秸秆处理方式包括:“收集使用”和“粉碎还田”;所述地
形包括:“平原”、“丘陵”、“坡地”和“高原”,土壤类型分类为“粘土”、“沙土”、“粘壤土”、“沙
壤土”、“粉壤”和“红壤‑盐碱土‑岩性土”,翻耕方式分类为“免耕”、“平翻”、“深松”和“深
耕”。
[0103] 在一个实施例中,参考图3和表1,通过将表1的数据投影到图3的统计时间段上,能够得到与基准时间轴对应的气象因素。
[0104]
[0105] 表1气象统计指标
[0106] 在一个实施例中,根据2017至2018年黄淮海地区呕吐毒素数据和气象数据、耕种数据等,建立了预警模型,见表2。该预警模型为定量预测模型,预测值与真实值的相关性R
为0.77。
[0107]
[0108]
[0109] 表2.黄淮海呕吐毒素预测模型
[0110] 在一个实施例中,在进行小麦收获期呕吐毒素含量预测过程中,由于耕种数据和气象数据获得的局限性,以小麦生长期数据基准,获得模型所需变量如表3所示。从表中可
以看出,模型是在采样结束后,获得耕种数据之后对小麦收获期呕吐毒素含量进行预测。定
量预测模型的相关系数(简称,R值)达到0.77,分类预测模型的准确率达到78.44%。
[0111]
[0112] 表3显著性较高的因素所构成的预测模型
[0113] 在一个实施例中,为了选取合适的第二气象数据参与预测,通过利用例如气象大数据等气象数据平台获取上述第二气象数据,2020年黄淮海预测小麦收获期呕吐毒素含量
的方法中应用的第二气象数据分为两部分,一部分为2020年3月1日至预测当日的实时气象
数据,参考图7为本发明一个实施例提供了实时气象数据获取界面,具体提供当前或当前以
前的气象实时数据;参考图8为本发明一个实施例提供了气象预报数据获取界面,具体提供
为预测日期之后15天内的预报数据,为气象中心根据气象学推测的天气情况。虽然可以获
得15天内的预报数据,但7天内的预报数据较为准确,鉴于模型中统计的时间间隔为7天,为
了使预报数据发挥最大作用,且统计结果较为可靠,故选用10天的预报数据作为第二气象
数据参与预测,这样可以保证小麦中呕吐毒素预测结果的时效性和准确性。
[0114] 进一步地,基于多元线性回归,通过第二综合因素集建立预测模型包括:
[0115]
[0116] 其中,g(x)包括:
[0117]
[0118] 其中,ak为第k个因素的系数,b为常数项;
[0119] g(x)在小于等于500时,呕吐毒素含量无污染风险,
[0120] g(x)在(500,1500]时,呕吐毒素含量存在轻度污染风险,
[0121] g(x)在(1500,2500]时,呕吐毒素含量存在中度污染风险,
[0122] g(x)在大于2500时,呕吐毒素含量存在重度污染风险。
[0123] 在一个实施例中,在得到上述预测模型和上述第二气象数据后,处理后得到第二气象因素样本,获取第二耕种因素,第二气象因素样本与第二耕种因素构成第二数据样本,
再进行风险预测,图9为本发明一个实施例提供了2020年小麦收获期呕吐毒素含量风险分
类预测结果统计;其中,447个预测点小麦收获期呕吐毒素含量污染风险为一级,即小麦收
获期呕吐毒素含量污染水平低于500μg/kg,占比92%,25个预测点风险等级为二级(小麦收
获期呕吐毒素含量污染水平在500‑1500μg/kg),占比5.2%,仅有13个预测点预测的等级为
3‑4等级,即小麦收获期呕吐毒素含量污染风险高于1500μg/kg,占比2.7%。
[0124] 在一个实施例中,参考图10为本发明一个实施例提供了收获后呕吐毒素污染风险图;根据小麦收获期呕吐毒素含量风险等级预测结果,绘制小麦收获期呕吐毒素含量的污
染风险地图。
[0125] 本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置
而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说
明即可。
[0126] 对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的
一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明
将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一
致的最宽的范围。