一种预测小麦收获期呕吐毒素含量的方法及系统转让专利
申请号 : CN202110714115.7
文献号 : CN113505920B
文献日 : 2022-03-18
发明人 : 王松雪 , 叶金 , 李森 , 蔡娣 , 李冰杰
申请人 : 国家粮食和物资储备局科学研究院
摘要 :
权利要求 :
1.一种预测小麦收获期呕吐毒素含量的方法,其特征在于,所述方法包括:获取预测区域预设历史年度的第一小麦相关数据;
利用所述第一小麦相关数据预处理得到规范化的第一数据样本;
根据所述第一数据样本建立预测模型;
根据所述第一小麦相关数据获取预测区域未来一段时间内的第二小麦相关数据;
根据所述第二小麦相关数据,通过预处理得到规范化的第二数据样本;
通过第二数据样本与预测模型进行风险预测,得到预测结果;根据所述预测结果进行区域风险地图绘制;
所述获取预测区域预设历史年度的第一小麦相关数据,具体包括:获取预测区域预测点的地理数据,通过所述地理数据得到所述预测区域内或距离所述预测区域最近的气象站,其中,所述地理数据包括:经度信息和纬度信息;
从所述气象站得到预设历史年度的小麦生长期数据,所述预设历史年度的小麦生长期数据包括:第一开花期、第一收获期;
根据所述第一开花期和所述第一收获期和预设规则得到第一基准时间段;
利用预测区域预测点的历年气象数据映射至所述第一基准时间段,得到所对应的第一气象因素;
基于第一基准时间段获取第一小麦收获期呕吐毒素含量和所述第一基准时间段所处年份的第一耕种数据;
所述第一小麦相关数据包括:所述第一气象因素、所述第一耕种数据、所述第一小麦收获期呕吐毒素含量以及所述地理数据。
2.根据权利要求1所述一种预测小麦收获期呕吐毒素含量的方法,其特征在于,利用所述第一小麦相关数据预处理得到规范化的第一数据样本,包括:将所述第一气象因素进行归一化处理得到第一气象因素样本;
根据所述第一耕种数据与所述地理数据分别得到第一耕种因素和地理因素;
所述第一数据样本包括:所述第一气象因素样本、所述第一耕种因素和所述第一小麦收获期呕吐毒素含量。
3.根据权利要求2所述一种预测小麦收获期呕吐毒素含量的方法,其特征在于,所述根据所述第一数据样本建立预测模型,包括:将所述第一气象因素样本与所述第一小麦收获期呕吐毒素含量进行相关系数计算,得到气象相关系数集;将所述第一耕种因素与所述第一小麦收获期呕吐毒素含量进行相关系数计算,得到耕种相关系数集;将所述地理因素与所述第一小麦收获期呕吐毒素含量进行相关系数计算,得到地理相关系数集;
设定第一阈值,从所述气象相关系数集、所述耕种相关系数集和所述地理相关系数集中筛选出达到所述第一阈值的系数,并利用达到所述第一阈值的系数所对应的因素形成第一综合因素集;
计算所述第一综合因素集中各个因素的方差膨胀因子;
设定第二阈值,筛选出所述方差膨胀因子小于所述第二阈值所对应的因素,得到第二综合因素集;
基于多元线性回归,通过第二综合因素集建立预测模型。
4.根据权利要求3所述一种预测小麦收获期呕吐毒素含量的方法,其特征在于,所述根据所述第一小麦相关数据获取预测区域未来一段时间内的第二小麦相关数据,根据所述第二小麦相关数据,通过预处理得到规范化的第二数据样本,包括:将所述预设历史年度的所述第一开花期进行均值处理得到第二开花期;
将所述预设历史年度的所述第一收获期进行均值处理得到第二收获期;
根据所述第二开花期和所述第二收获期利用预设规则建立第二基准时间段;
基于所述地理数据获取所述第二基准时间段预测区域的第二气象因素、预测当年的第二耕种数据;
所述第二小麦相关数据包括:所述第二气象因素、所述第二耕种数据和所述地理因素;
将所述第二气象因素进行归一化处理得到第二气象因素样本;
基于所述第二耕种数据获取第二耕种因素;
所述第二数据样本包括:所述第二气象因素样本、所述第二耕种因素。
5.根据权利要求4所述一种预测小麦收获期呕吐毒素含量的方法,其特征在于,得到所述第一基准时间段与所述第二基准时间段的预设规则,其包括:选取从所述第一开花期/所述第二开花期前24天至所述第一开花期/所述第二开花期后17天,作为第一选定时间段;
以7天为间隔,将所述第一选定时间段划分为第一至第六时间段;
选取从所述第一收获期/所述第二收获期前24天至所述第一收获期/所述第二收获期后3天,作为第二选定时间段;
以7天为间隔,将所述第二选定时间段划分为第七至第十时间段;
所述第一基准时间段/所述第二基准时间段包括所述第一至第六时间段和所述第七至第十时间段。
6.根据权利要求5所述一种预测小麦收获期呕吐毒素含量的方法,其特征在于,历年气象数据包括:历年的逐小时气温、相对湿度、降雨量、日照小时数;所述第一气象因素/所述第二气象因素包括:所述第一至第十时间段内的“平均气温”、“高于25摄氏度的小时数”、“总降雨量”、“相对湿度高于80%的小时数”、“连续2小时相对湿度高于80%的平均气温之和”、“连续4小时相对湿度高于80%的平均气温之和”、“平均日照小时数”。
7.根据权利要求6所述一种预测小麦收获期呕吐毒素含量的方法,其特征在于,历年的第一耕种数据包括:历年小麦的轮作情况、秸秆处理方式、地形、种子用量、土壤类型、翻耕方式、是否使用除草剂、是否使用杀真菌剂、是否有病虫害、是否对病虫害施药;其中,所述轮作情况为上季度土地轮作的农作物,其包括:“稻谷”、“玉米”、“小麦”、“大豆”、“花生”和“蔬菜”;
所述秸秆处理方式包括:“收集使用”和“粉碎还田”;
所述地形包括:“平原”、“丘陵”、“坡地”和“高原”,土壤类型分类为“粘土”、“沙土”、“粘壤土”、“沙壤土”、“粉壤”和“红壤‑盐碱土‑岩性土”,翻耕方式分类为“免耕”、“平翻”、“深松”和“深耕”。
8.根据权利要求4所述的一种预测小麦收获期呕吐毒素含量的方法,其特征在于,所述预测模型的公式为:
其中,ak为第k个因素的系数,b为常数项;
g(x)在小于等于500时,呕吐毒素含量无污染风险,g(x)在(500,1500]时,呕吐毒素含量存在轻度污染风险,g(x)在(1500,2500]时,呕吐毒素含量存在中度污染风险,g(x)在大于2500时,呕吐毒素含量存在重度污染风险。
9.一种预测小麦收获期呕吐毒素含量的系统,其特征在于,所述系统包括:第一获取模块、预处理模块、预测模型建立模块、第二获取模块和展示模块;
所述第一获取模块用于获取预测区域预设历史年度的第一小麦相关数据;
所述预处理模块用于利用所述第一小麦相关数据预处理得到规范化的第一数据样本;
所述预测模型建立模块用于根据所述第一数据样本建立预测模型;
所述第二获取模块用于根据所述第一小麦相关数据获取预测区域未来一段时间内的第二小麦相关数据;
所述预处理模块还用于根据所述第二小麦相关数据,通过预处理得到规范化的第二数据样本;
通过第二数据样本与预测模型进行风险预测,得到预测结果;
所述展示模块用于根据所述预测结果进行区域风险地图绘制;
所述获取预测区域预设历史年度的第一小麦相关数据,具体包括:获取预测区域预测点的地理数据,通过所述地理数据得到所述预测区域内或距离所述预测区域最近的气象站,其中,所述地理数据包括:经度信息和纬度信息;
从所述气象站得到预设历史年度的小麦生长期数据,所述预设历史年度的小麦生长期数据包括:第一开花期、第一收获期;
根据所述第一开花期和所述第一收获期和预设规则得到第一基准时间段;
利用预测区域预测点的历年气象数据映射至所述第一基准时间段,得到所对应的第一气象因素;
基于第一基准时间段获取第一小麦收获期呕吐毒素含量和所述第一基准时间段所处年份的第一耕种数据;
所述第一小麦相关数据包括:所述第一气象因素、所述第一耕种数据、所述第一小麦收获期呕吐毒素含量以及所述地理数据。
说明书 :
一种预测小麦收获期呕吐毒素含量的方法及系统
技术领域
背景技术
物在田间生长过程中真菌感染、耕作方式影响和天气条件不稳定,导致真菌毒素积累,且不
同地区,不同年份间差异较大。因此,在收获前预测粮食中呕吐毒素含量,从而实施有针对
性的预防措施,从根本上降低粮食呕吐毒素污染非常重要。
此在收获之前,我们仅根据气象数据对小麦收获后呕吐毒素含量进行预测。现有技术中存
在仅考虑气象因素与呕吐毒素之间的相关性,而忽略耕种因素与呕吐毒素之间的相关性,
从而导致样本集不完整;并且现有技术中对于因素的相关性的验证方法简单单一,导致样
本集中因素的相关性不显著;最终导致预测结果不准确。
发明内容
相关系数计算,得到耕种相关系数集;将所述地理因素与所述第一小麦收获期呕吐毒素含
量进行相关系数计算,得到地理相关系数集;
成第一综合因素集;
“高于25摄氏度的小时数”、“总降雨量”、“相对湿度高于80%的小时数”、“连续2小时相对湿
度高于80%的平均气温之和”、“连续4小时相对湿度高于80%的平均气温之和”、“平均日照
小时数”。
否对病虫害施药;其中,所述轮作情况为上季度土地轮作的农作物,其包括:“稻谷”、“玉
米”、“小麦”、“大豆”、“花生”和“蔬菜”;
翻”、“深松”和“深耕”。
的综合因素,通过综合因素建立预测模型;同时又基于历史生长数据预测到当年生长数据,
基于当年生长数据得到预测模型所需要的相关因素,通过预测模型与相关因素预测小麦收
获期呕吐毒素含量并进行预警。相比现有技术,预测模型中的统计项更加完备,通过两次不
同的筛选模型所筛选的因素显著性更高,进而通过多元线性回归算法所建立的预测模型精
准度更高。
附图说明
仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据
提供的附图引申获得其它的实施附图。
实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功
效及所能达成的目的下,均应仍落在本发明所揭示的技术内容得能涵盖的范围内。
具体实施方式
部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做
出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
展示模块05。
测模型04建立模块用于根据所述第一数据样本建立预测模型;所述第二获取模块02用于根
据所述第一小麦相关数据获取预测区域未来一段时间内的第二小麦相关数据;所述预处理
模块03还用于根据所述第二小麦相关数据,通过预处理得到规范化的第二数据样本;通过
第二数据样本与预测模型进行风险预测,得到预测结果;所述展示模块05用于根据所述预
测结果进行区域风险地图绘制。
期呕吐毒素含量的系统详细介绍本发明实施例中公开的一种预测小麦收获期呕吐毒素含
量的方法。
数据预处理得到规范化的第一数据样本;根据所述第一数据样本建立预测模型;根据所述
第一小麦相关数据获取预测区域未来一段时间内的第二小麦相关数据;根据所述第二小麦
相关数据,通过预处理得到规范化的第二数据样本;通过第二数据样本与预测模型进行风
险预测,得到预测结果;根据所述预测结果进行区域风险地图绘制。
其中,所述地理数据包括:经度信息和纬度信息;从所述气象站得到预设历史年度的小麦生
长期数据,所述预设历史年度的小麦生长期数据包括:第一开花期、第一收获期;根据所述
第一开花期和所述第一收获期和预设规则得到第一基准时间段;利用预测区域预测点的历
年气象数据映射至所述得到所述第一基准时间段,得到所对应的第一气象因素;基于第一
基准时间段获取所述第一小麦收获期呕吐毒素含量和所述第一基准时间段所处年份的第
一耕种数据;所述第一小麦相关数据包括:所述第一气象数据、所述第一耕种数据、所述第
一小麦收获期呕吐毒素含量以及所述地理数据。
气象站个数不为零时进入步骤三,否则,进行步骤二,直至搜索到气象站个数不为零时进入
步骤三;步骤二:在当前基础上南北方向延伸1经度、东西方向延伸1纬度;步骤三:使用枚举
法计算当前地点分别距所有气象站的距离,距离最小的即为目标气象站。
述地理数据分别得到第一耕种因素和地理因素;所述第一数据样本包括:所述第一气象因
素样本、所述第一耕种因素和所述第一小麦收获期呕吐毒素含量。其中,所述归一化处理包
括将因素映射到[0,1]空间,形成规范化的因素样本,归一化公式为:
一耕种因素与所述第一小麦收获期呕吐毒素含量进行相关系数计算,得到耕种相关系数
集;将所述地理因素与所述第一小麦收获期呕吐毒素含量进行相关系数计算,得到地理相
关系数集;设定第一阈值,从所述气象相关系数集、所述耕种相关系数集和所述地理相关系
数集中筛选出达到所述第一阈值的系数,并利用达到所述第一阈值的系数所对应的因素形
成第一综合因素集;计算所述第一综合因素集中各个因素的方差膨胀因子;设定第二阈值,
筛选出所述方差膨胀因子小于所述第二阈值所对应的因素,得到第二综合因素集;基于多
元线性回归,通过第二综合因素集建立预测模型。
素含量进行相关系数计算,得到耕种相关系数集,所述相关系数可以为皮尔森相关系数,皮
尔森相关系数计算公式具体如下:
述预设历史年度的所述第一开花期进行均值处理得到第二开花期;将所述预设历史年度的
所述第一收获期进行均值处理得到第二收获期;根据所述第二开花期和所述第二收获期利
用预设规则建立第二基准时间段段;基于所述地理数据获取所述第二基准时间段预测区域
的第二气象因素、预测当年的第二耕种数据;所述第二小麦相关数据包括:所述第二气象数
据、所述第二耕种数据和所述地理因素;将所述第二气象因素进行归一化处理得到第二气
象因素样本;基于所述第二耕种数据获取第二耕种因素;所述第二数据样本包括:所述第二
气象因素样本、所述第二耕种因素。
预测过程中,采用的第二开花期与第二收获期为2016至2019年的第一开花期与第一收获期
平均值。参考图4为本发明一个实施例提供了2016‑2019年开花日期与均值差值统计,根据
图中统计结果,其中71%的差值在±3天内,90%的差值在±5天内。进而,参考图5为本发明
一个实施例提供了2016‑2019年收获日期与均值差值统计,其中87%的差值在±4天内,
97%的差值在±6天内。由此,可以看出,历年第一开花期与第一收获期数据均值与当年第
二开花期与第二收获期差异较小,因此应用历史生长期数据均值代替2020年的生长期较为
可靠。
收获最早的地区在5月18日小麦已经成熟,收获最晚的为6月17日,模型要使用收获前3天的
气象数据,6月15日即可对所有地区完成收获前的预测。
六时间段;选取从所述第一收获期/所述第二收获期前24天至所述第一收获期/所述第二收
获期后3天,作为第二选定时间段;以7天为间隔,将所述第二选定时间段划分为第七至第十
时间段;所述所述第一基准时间段/所述第二基准时间段包括所述第一至第六时间段和所
述第七至第十时间段。
“高于25摄氏度的小时数”、“总降雨量”、“相对湿度高于80%的小时数”、“连续2小时相对湿
度高于80%的平均气温之和”、“连续4小时相对湿度高于80%的平均气温之和”、“平均日照
小时数”。
病虫害施药;其中,所述轮作情况为上季度土地轮作的农作物,其包括:“稻谷”、“玉米”、“小
麦”、“大豆”、“花生”和“蔬菜”;所述秸秆处理方式包括:“收集使用”和“粉碎还田”;所述地
形包括:“平原”、“丘陵”、“坡地”和“高原”,土壤类型分类为“粘土”、“沙土”、“粘壤土”、“沙
壤土”、“粉壤”和“红壤‑盐碱土‑岩性土”,翻耕方式分类为“免耕”、“平翻”、“深松”和“深
耕”。
为0.77。
以看出,模型是在采样结束后,获得耕种数据之后对小麦收获期呕吐毒素含量进行预测。定
量预测模型的相关系数(简称,R值)达到0.77,分类预测模型的准确率达到78.44%。
的方法中应用的第二气象数据分为两部分,一部分为2020年3月1日至预测当日的实时气象
数据,参考图7为本发明一个实施例提供了实时气象数据获取界面,具体提供当前或当前以
前的气象实时数据;参考图8为本发明一个实施例提供了气象预报数据获取界面,具体提供
为预测日期之后15天内的预报数据,为气象中心根据气象学推测的天气情况。虽然可以获
得15天内的预报数据,但7天内的预报数据较为准确,鉴于模型中统计的时间间隔为7天,为
了使预报数据发挥最大作用,且统计结果较为可靠,故选用10天的预报数据作为第二气象
数据参与预测,这样可以保证小麦中呕吐毒素预测结果的时效性和准确性。
再进行风险预测,图9为本发明一个实施例提供了2020年小麦收获期呕吐毒素含量风险分
类预测结果统计;其中,447个预测点小麦收获期呕吐毒素含量污染风险为一级,即小麦收
获期呕吐毒素含量污染水平低于500μg/kg,占比92%,25个预测点风险等级为二级(小麦收
获期呕吐毒素含量污染水平在500‑1500μg/kg),占比5.2%,仅有13个预测点预测的等级为
3‑4等级,即小麦收获期呕吐毒素含量污染风险高于1500μg/kg,占比2.7%。
染风险地图。
而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说
明即可。
一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明
将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一
致的最宽的范围。