一种基于神经网络的呼吸系统疾病患病人次动态预测方法转让专利

申请号 : CN201810471661.0

文献号 : CN108846503B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 邱航周力潘惊萍王利亚朱晓娟陈梦蝶邓韧段占祺

申请人 : 电子科技大学四川省卫生和计划生育信息中心

摘要 :

本发明公开了一种基于神经网络的呼吸系统疾病患病人次动态预测方法。该方法通过从病案中提取呼吸系统疾病门急诊和住院患者人次分布,综合区域空气污染物浓度、区域气象数据、节假日、星期几效应和区域社会经济水平等信息。该方法是利用一种基于LSTM神经网络模型来实现的,该方法包括如下几个步骤:步骤一:多源数据整合;步骤二:数据预处理;步骤三:构建LSTM神经网络模型;步骤四:模型验证与调优;步骤五:增量学习与动态预测。通过以较高的精确度动态预测区域范围内呼吸系统疾病患病人次,为解决区域医疗卫生资源优化配置和研究空气污染对疾病负担的影响等问题提供科学依据。

权利要求 :

1.一种基于神经网络的呼吸系统疾病患病人次动态预测方法,其特征在于:该方法整合多源数据;多源数据包括大气污染的主要污染物PM2.5、PM10、NO2、SO2、CO、O3浓度数据,每天的日均温度和相对湿度气象数据,区域社会经济水平数据,区域疾病住院人次数据和门急诊就诊人次数据;采用LSTM神经网络来构建呼吸系统疾病患病人次的预测模型;随着时间的变化,模型中不断加入最新真实数据,反复迭代优化模型,达到增量学习和动态预测的目的;具有如下步骤:步骤一:多源数据整合;

步骤二:数据预处理;该方法需要先对多维数据关联整合与预处理,所述的预处理包括以下子步骤:S101:数据清洗,修正填写不规范的字段;

S102:在多源数据关联整合的过程中,字段进行统一标准化处理;

S103:样本筛选:选择数据质量高、信息量全的呼吸系统疾病数据;

S104:序列构建:通过序列图分析以及自相关性检验,判断序列的平稳性,对非平稳时间序列采用差分的方式进行平稳化处理;

步骤三:构建LSTM神经网络模型;基于LSTM神经网络患病人次的预测模型构建,包括以下子步骤:S201:序列选取:选择时间序列,加入事件变量,构建预测模型;

S202:模型验证与评价:采用回顾性验证和前瞻性验证相结合的方式;

S203:模型调优:模型调优分两块,一是数据优化即输入时间序列的选取,二是模型参数调优,通过这两部分调整最终训练出一个可靠的预测模型;

步骤四:模型验证与调优;

步骤五:增量学习与动态预测;所述的动态预测包括以下子步骤:S301:模型增量学习:随着时间的变化,模型中不断加入最新真实数据供模型学习和优化;

S302:通过时间序列的变化,反复迭代优化模型,动态预测下一周期的患病人次。

2.根据权利要求1所述的一种基于神经网络的呼吸系统疾病患病人次动态预测方法,其特征在于:所述的预测周期以周或日为佳。

说明书 :

一种基于神经网络的呼吸系统疾病患病人次动态预测方法

技术领域

[0001] 本发明涉及患病人次预测方法、数据预处理技术、人工神经网络技术相关领域,具体来讲涉及一种基于神经网络的呼吸系统疾病患病人次动态预测方法。

背景技术

[0002] 随着工业化的发展和城市化进程的加快,空气污染问题日益严重,导致近年来我国雾霾天气频发。大气污染对人类健康造成了极大威胁,引起了国内外各界人民的广泛关注。人们迫切希望政府及相关部门依据天气和大气污染状况及时给出相关敏感性疾病预报,以便提前采取防护措施,最大限度地减少大气污染对人体健康的不良影响。
[0003] 大气污染对人体健康的影响已成为研究热点。虽然国内诸多环境医学工作者在大气污染及其对人体健康影响方面进行了相关研究,但相比于国外,国内仍处于起步阶段,此项研究仍需深入,且其预报研究工作还比较少见。
[0004] 在此背景下,希望通过综合大气污染的主要污染物(PM2.5、PM10、NO2、SO2、CO、O3)浓度数据,每天的日均温度和相对湿度等气象数据,区域社会经济水平数据,区域疾病住院人次数据和门急诊就诊人次数据,提供一种采用长短期记忆网络(Long Short‑Term Memory,LSTM)来构建呼吸系统疾病患病人次的预测方法,使得以较高的精确度动态预测区域范围内呼吸系统疾病患病人次,为解决区域医疗卫生资源优化配置和研究空气污染对疾病负担的影响等问题提供科学依据。
[0005] 经过检索分析发现,目前,LSTM神经网络模型在医药卫生科技领域的应用较少,在国内,有部分学者应用LSTM神经网络模型预测疾病复发风险,但尚未检索到应用LSTM神经网络模型预测患病人次的相关文献。另外,有部分学者应用神经网络模型研究了环境污染与急诊人次/住院人次的关联性,但未采用适合于处理和预测时间序列的LSTM神经网络模型,且尚未做到动态预测。

发明内容

[0006] 因此,本发明的研究目的在于通过综合大气污染的主要污染物(PM2.5、PM10、NO2、SO2、CO、O3)浓度数据,每天的日均温度和相对湿度等气象数据,区域社会经济水平数据,区域疾病住院人次数据和门急诊就诊人次数据,提供一种采用长短期记忆网络(Long Short‑Term Memory,LSTM)来构建呼吸系统疾病患病人次的预测方法,使得以较高的精确度动态预测区域范围内呼吸系统疾病患病人次,为解决区域医疗卫生资源优化配置和研究空气污染对疾病负担的影响等问题提供科学依据。
[0007] 本发明是这样实现的,构造一种基于神经网络的呼吸系统疾病患病人次动态预测方法,其特征在于:该方法整合多源数据;采用LSTM神经网络来构建呼吸系统疾病患病人次的预测模型;随着时间的变化,模型中不断加入最新真实数据,反复迭代优化模型,达到增量学习和动态预测的目的;具有如下步骤:
[0008] 步骤一:多源数据整合;
[0009] 步骤二:数据预处理;
[0010] 步骤三:构建LSTM神经网络模型;
[0011] 步骤四:模型验证与调优;
[0012] 步骤五:增量学习与动态预测。
[0013] 根据本发明所述的一种基于神经网络的呼吸系统疾病患病人次动态预测方法,其特征在于:该方法需要先对多维数据关联整合与预处理,所述的预处理包括以下子步骤:
[0014] S101:数据清洗,修正填写不规范的字段;
[0015] S102:在多源数据关联整合的过程中,字段进行统一标准化处理;
[0016] S103:样本筛选:选择数据质量高、信息量全的呼吸系统疾病数据;
[0017] S104:序列构建:通过序列图分析以及自相关性检验,判断序列的平稳性,对非平稳时间序列采用差分的方式进行平稳化处理。
[0018] 根据本发明所述一种基于神经网络的呼吸系统疾病患病人次动态预测方法,其特征在于:基于LSTM神经网络患病人次的预测模型构建,包括以下子步骤:
[0019] S201:序列选取:选择时间序列,加入事件变量,构建预测模型;
[0020] S202:模型验证与评价:采用回顾性验证和前瞻性验证相结合的方式;
[0021] S203:模型调优:模型调优分两块,一是数据优化即输入时间序列的选取,二是模型参数调优,通过这两部分调整最终训练出一个可靠的预测模型。
[0022] 根据本发明所述一种基于神经网络的呼吸系统疾病患病人次动态预测方法,其特征在于:所述的动态预测包括以下子步骤:
[0023] S301:模型增量学习:随着时间的变化,模型中不断加入最新真实数据供模型学习和优化;
[0024] S302:通过时间序列的变化,反复迭代优化模型,动态预测下一周期的患病人次。
[0025] 根据本发明所述的一种基于神经网络的呼吸系统疾病患病人次动态预测方法,其特征在于:所述的预测周期一般以周或日为佳。
[0026] 根据本发明所述的一种基于神经网络的呼吸系统疾病患病人次动态预测方法,其特征在于,该方法所述的多源数据包括大气污染的主要污染物(PM2.5、PM10、NO2、SO2、CO、O3)浓度数据,每天的日均温度和相对湿度等气象数据,区域社会经济水平数据,区域疾病住院人次数据和门急诊就诊人次数据。
[0027] 本发明具有如下优点:本发明公开了一种基于神经网络的呼吸系统疾病患病人次动态预测方法。该方法通过从病案中提取不同病种门急诊和住院患者人次分布,综合区域空气污染物浓度、区域气象数据、节假日、星期几效应和区域社会经济水平等信息。该方法是利用一种基于LSTM神经网络模型来实现的,该方法包括如下几个步骤:步骤一:多源数据整合;步骤二:数据预处理;步骤三:构建LSTM神经网络模型;步骤四:模型验证与调优;步骤五:增量学习与动态预测。通过以较高的精确度动态预测区域范围内呼吸系统疾病患病人次,为解决区域医疗卫生资源优化配置和研究空气污染对疾病负担的影响等问题提供科学依据。

附图说明

[0028] 图1为本发明的基本思想流程图;
[0029] 图2为本发明的数据预处理流程图;
[0030] 图3为本发明的基于LSTM神经网络构建流程图;
[0031] 图4为本发明的动态预测模型流程图。

具体实施方式

[0032] 下面将结合附图1—图4对本发明进行详细说明,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0033] 本发明通过改进在此提供一种基于神经网络的呼吸系统疾病患病人次动态预测方法,可以按照如下方式予以实施:如图1所示,该方法整合多源数据,即综合大气污染的主要污染物(PM2.5、PM10、NO2、SO2、CO、O3)浓度数据,每天的日均温度和相对湿度等气象数据,区域社会经济水平数据,区域疾病住院人次数据和门急诊就诊人次数据来构建动态预测模型;采用了一种适合于处理和预测时间序列中重要事件的LSTM神经网络来构建呼吸系统疾病患病人次的预测模型;随着时间的变化,模型中不断加入最新真实数据,反复迭代优化模型,达到增量学习和动态预测的目的。本发明具有如下步骤:
[0034] 步骤一:多源数据整合;
[0035] 步骤二:数据预处理;
[0036] 步骤三:构建LSTM神经网络模型;
[0037] 步骤四:模型验证与调优;
[0038] 步骤五:增量学习与动态预测。
[0039] 如图2所示,需要先对主要的大气污染物浓度、气象数据、区域社会经济水平、区域疾病住院人次数据和门急诊就诊人次等多维数据关联整合与预处理,所述的预处理包括以下子步骤:
[0040] S101:数据清洗,修正填写不规范的字段;
[0041] S102:在多源数据关联整合的过程中,字段进行统一标准化处理;
[0042] S103:样本筛选:选择数据质量高、信息量全的呼吸系统疾病数据;
[0043] S104:序列构建:通过序列图分析以及自相关性检验,判断序列的平稳性,对非平稳时间序列采用差分的方式进行平稳化处理。
[0044] 如图3所示,基于LSTM神经网络患病人次的预测模型构建,包括以下子步骤:
[0045] S201:序列选取:选择时间序列,加入事件变量,构建预测模型;
[0046] S202:模型验证与评价:采用回顾性验证和前瞻性验证相结合的方式;
[0047] S203:模型调优:模型调优分两块,一是数据优化即输入时间序列的选取,二是模型参数调优,通过这两部分调整最终训练出一个可靠的预测模型。
[0048] 如图4所示,所述的动态预测包括以下子步骤:
[0049] S301:模型增量学习:随着时间的变化,模型中不断加入最新真实数据供模型学习和优化;
[0050] S302:通过时间序列的变化,反复迭代优化模型,动态预测下一周期的患病人次;那么所述的预测周期一般以周或日为佳。
[0051] 本发明通过从病案中提取不同病种门急诊和住院患者人次分布,综合区域空气污染物浓度、区域气象数据、节假日、星期几效应和区域社会经济水平等信息。该方法是利用一种基于LSTM神经网络模型来实现的,该方法包括如下几个步骤:步骤一:多源数据整合;步骤二:数据预处理;步骤三:构建LSTM神经网络模型;步骤四:模型验证与调优;步骤五:增量学习与动态预测。通过以较高的精确度动态预测区域范围内呼吸系统疾病患病人次,为解决区域医疗卫生资源优化配置和研究空气污染对疾病负担的影响等问题提供科学依据。
[0052] 对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。