一种PaCO2实时预警模型建立方法及系统转让专利

申请号 : CN202211469759.5

文献号 : CN115512780B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 涂燕晖陈虎姚振杰程海博陈一昕

申请人 : 山东未来网络研究院(紫金山实验室工业互联网创新应用基地)

摘要 :

本发明提供的一种PaCO2实时预警模型建立方法及系统,涉及医疗检测领域;其中,方法包括:确定与PaCO2数值变化相关的若干特征;根据PaCO2时间戳,预设预警期和特征观测窗口,获取样本数据;构建带超参数的卷积深度和宽度神经网络模型,记为CDWNN;根据获取的样本数据,采用遗传算法确定CDWNN的拓扑结构和超参数,获得优化CDWNN;根据优化CDWNN预测PaCO2数值;根据预测值进行归因分析和决策干预。本发明利用ICU中常见的呼吸和生命体征指标即可完成PaCO2的实时预测,应用简单且高效。

权利要求 :

1.一种PaCO2实时预警模型建立方法,其特征在于,包括:

确定与PaCO2数值变化相关的若干特征;

根据PaCO2时间戳,预设预警期和特征观测窗口,获取样本数据;

构建带超参数的卷积深度和宽度神经网络模型,记为CDWNN;

根据获取的样本数据,采用遗传算法确定CDWNN的拓扑结构和超参数,获得优化CDWNN;

根据优化CDWNN预测PaCO2数值;

其中,构建CDWNN的具体过程为:

构建神经网络框架,包括构成输入端的一维卷积层Conv1D、依次设置在一维卷积层Conv1D输出端的一Flatten层、若干中间结构块和一输出块;其中,对任一中间结构块Block_n,其输入为Flatten层输出以及在中间结构块Block_n之前的所有中间结构块Block_k的输出,k=0,1,...,n‑1;任一所述中间结构块Block_n均包括一concatenate层、一Dense层、一BatchNormalization层和一Dropout层,所述concatenate层将Flatten层输出向量以及在中间结构块Block_n之前的所有中间结构块Block_k的输出向量集进行列方向拼接后,再依次经Dense层特征空间变换、BatchNormalization层标准化处理以及Dropout层权重更新后向输出块Block_out输出;

确定神经网络框架的超参数,包括一维卷积层Conv1D中卷积核的个数p1、中间结构块中Dense层的神经元个数p2和Dropout层的权重不更新率p3;

确定神经网络框架的拓扑结构,包括中间结构块的个数n。

2.根据权利要求1所述的PaCO2实时预警模型建立方法,其特征在于,还包括:对预测优化CDWNN的预测结果进行归因分析;

根据归因分析结果,对PaCO2数值进行决策干预。

3.根据权利要求1所述的PaCO2实时预警模型建立方法,其特征在于,所述采用遗传算法确定CDWNN的拓扑结构和超参数的具体过程为:初始化种群大小以及子代数目、交叉概率变异概率、神经网络拓扑结构及所有超参数;

随机划分样本数据为训练集和测试集,在测试集分别进行N次模型的独立训练,并计算获得N次独立训练的绝对误差均值;其中,N≥100;

以绝对误差均值作为适应度,执行遗传算法的遗传更新,直至种群子代数目达到设定值,输出最佳拓扑结构、超参数集合以及对应的适应度。

4.根据权利要求2所述的PaCO2实时预警模型建立方法,其特征在于,所述归因分析的具体过程为:获取一测试样本,采用优化CDWNN进行预测;

采用SHAP算法计算该测试样本对应的特征贡献值;

判断特征贡献值的正负,评估该特征变化对PaCO2预测值的影响,以确定有利特征和有害特征;其中,特征变化对PaCO2预测值的影响包括:当特征贡献值为负值,表明增大该特征的值会减弱PaCO2预测值;当特征贡献值为正值表明增大该特征的值会增大PaCO2预测值;

当特征贡献值为0,表明该特征与PaCO2预测值无关。

5.根据权利要求4所述的PaCO2实时预警模型建立方法,其特征在于,所述决策干预的具体过程为:对未来某一时刻的PaCO2预期值引入DiCE方法,自动计算并输出若干组当前某个或几个有害特征的调整值。

6.一种PaCO2实时预警模型建立系统,其特征在于,包括:

确定模块,用于确定与PaCO2数值变化相关的若干特征;

获取模块,用于根据PaCO2时间戳,预设预警期和特征观测窗口,获取样本数据;

构建模块,用于构建带超参数的卷积深度和宽度神经网络模型,记为CDWNN;

优化模块,用于根据获取的样本数据,采用遗传算法确定CDWNN的拓扑结构和超参数,获得优化CDWNN;

预测模块,用于根据优化CDWNN预测PaCO2数值;

其中,所述构建模块构建CDWNN的执行单元,包括:

构建单元,用于构建神经网络框架,包括构成输入端的一维卷积层Conv1D、依次设置在一维卷积层Conv1D输出端的一Flatten层、若干中间结构块和一输出块;其中,对任一中间结构块Block_n,其输入为Flatten层输出以及在中间结构块Block_n之前的所有中间结构块Block_k的输出,k=0,1,...,n‑1;任一所述中间结构块Block_n均包括一concatenate层、一Dense层、一BatchNormalization层和一Dropout层,所述concatenate层将Flatten层输出向量以及在中间结构块Block_n之前的所有中间结构块Block_k的输出向量集进行列方向拼接后,再依次经Dense层特征空间变换、BatchNormalization层标准化处理以及Dropout层权重更新后向输出块Block_out输出;

第一确定单元,用于确定神经网络框架的超参数,包括一维卷积层Conv1D中卷积核的个数p1、中间结构块中Dense层的神经元个数p2和Dropout层的权重不更新率p3;

第二确定单元,用于确定神经网络框架的拓扑结构,包括中间结构块的个数n。

7.根据权利要求6所述的PaCO2实时预警模型建立系统,其特征在于,还包括:归因分析模块,用于对预测优化CDWNN的预测结果进行归因分析;

决策干预模块,用于根据归因分析结果,对PaCO2数值进行决策干预。

8.根据权利要求7所述的PaCO2实时预警模型建立系统,其特征在于,所述优化模块采用遗传算法确定CDWNN的拓扑结构和超参数的执行单元,包括:初始化单元,用于初始化种群大小以及子代数目、交叉概率变异概率、神经网络拓扑结构以及所有超参数;

第一计算单元,用于随机划分样本数据为训练集和测试集,在测试集分别进行N次模型的独立训练,并计算获得N次独立训练的绝对误差均值;其中,N≥100;

执行单元,用于以绝对误差均值作为适应度,执行遗传算法的遗传更新,直至种群子代数目达到设定值,输出最佳拓扑结构、超参数集合以及对应的适应度。

9.根据权利要求7所述的PaCO2实时预警模型建立系统,其特征在于,所述归因分析模块进行归因分析的执行单元,包括:获取单元,用于获取一测试样本,采用优化CDWNN进行预测;

第二计算单元,用于采用SHAP算法计算该测试样本对应的特征贡献值;

判断单元,用于判断特征贡献值的正负,评估该特征变化对PaCO2预测值的影响,以确定有利特征和有害特征;其中,特征变化对PaCO2预测值的影响包括:当特征贡献值为负值,表明增大该特征的值会减弱PaCO2预测值;当特征贡献值为正值表明增大该特征的值会增大PaCO2预测值;当特征贡献值为0,表明该特征与PaCO2预测值无关。

10.一种如权利要求1‑5任一项所述的PaCO2实时预警模型建立方法在临床诊治过程中测量及干预PaCO2数值的应用。

11.一种生命健康监测系统,其特征在于,包括处理器和存储器;

所述存储器用于存储程序指令,并将所述程序指令传输给所述处理器;

其中,当所述程序指令被所述处理器执行时,使得所述处理器实现如权利要求1‑5中任一项所述的PaCO2实时预警模型建立方法。

说明书 :

一种PaCO2实时预警模型建立方法及系统

技术领域

[0001] 本发明涉及医疗检测技术领域,具体涉及一种PaCO2实时预警模型建立方法及系统。

背景技术

[0002] PaCO2具有较高临床价值,可以用来判断呼吸衰竭类型与程度,也可量化呼吸性酸碱平衡失调程度,同时也可以用来确定代谢性酸碱失调的代偿反应。PaCO2指标主要是通过血气分析仪获取,主要流程包括抽血前患者身心准备、血液保存以及血液化验等程序,任何一道程序都可能导致测量误差,对临床专家经验和患者配合度要求较高。具体实施时,也有临床专家根据呼吸机的EtCO2指标估算呼吸功能正常患者的PaCO2,此时PaCO2≈EtCO2。
[0003] 上述方案中采用血气分析仪测量PaCO2和使用呼吸机的EtCO2指标估算PaCO2均存在应用缺陷。
[0004] 例如,对于采用血气分析仪测量PaCO2存在的固有缺陷包括:(1)有创检测伤害大:随着患者病情加重,动脉血采集的频率也会增加,患者经受身心痛苦,严重时会出现休克;
(2)无法做到实时性:尽管患者每天需采集0 4次动脉血,但这与患者瞬息万变的生命体征~
无法对应,血气分析仪的分析结果是滞后患者数据采集时间的,容易出现漏诊或错诊,错过最佳干预时间;(3)PaCO2结果的归因分析存在主观性:临床专家的经验直接决定PaCO2预测结果的归因是否正确,一旦受经验及内外环境影响出现决策失误,对患者而言有时是致命的;(4)无法确定干预后PaCO2是否达到预期结果:临床专家无法提前知道干预方案实施后,在未来某个具体时刻患者PaCO2会升(降)到具体的数值,这种干预方案存在风险,若事后PaCO2没达到预期,患者很可能失去治疗机会。
[0005] 又例如,使用呼吸机的EtCO2指标估算PaCO2同样存在的不足包括:(1)当患者呼吸及主要脏器功能正常时,可以用EtCO2估算PaCO2,但当患者功能损伤或脏腑受损严重时,PaCO2与EtCO2相差较大,失去估算价值;(2)使用呼吸机指标估算PaCO2尽管可以避免动脉有创血检,但这种方式仍不能实现PaCO2的早期实时预测,也无法规避临床专家主观决策带来的医疗风险。

发明内容

[0006] 本发明目的在于提供一种PaCO2实时预警模型建立方法及系统,其中,方法通过构建神经网络模型CDWNN,利用ICU中常见的呼吸和生命体征指标即可完成PaCO2的实时预测,不仅无创伤、流程简单,且支持自定义预警时间,设置多个未来时间对应的PaCO2值以制定对应的干预预案,实用价值高。
[0007] 为达成上述目的,本发明提出如下技术方案:一种PaCO2实时预警模型建立方法,包括:
[0008] 确定与PaCO2数值变化相关的若干特征;
[0009] 根据PaCO2时间戳,预设预警期和特征观测窗口,获取样本数据;
[0010] 构建带超参数的卷积深度和宽度神经网络模型,记为CDWNN;
[0011] 根据获取的样本数据,采用遗传算法确定CDWNN的拓扑结构和超参数,获得优化CDWNN;
[0012] 根据优化CDWNN预测PaCO2数值。
[0013] 进一步的,还包括:
[0014] 对预测优化CDWNN的预测结果进行归因分析;
[0015] 根据归因分析结果,对PaCO2数值进行决策干预。
[0016] 进一步的,构建CDWNN的具体过程为:
[0017] 构建神经网络框架,包括构成输入端的一维卷积层Conv1D、依次设置在一维卷积层Conv1D输出端的一Flatten层、若干中间结构块和一输出块;其中,对任一中间结构块Block_n,其输入为Flatten层输出以及中间结构块Block_k(k=0,1,...,n‑1)输出;任一所述中间结构块Block_n均包括一concatenate层、一Dense层、一BatchNormalization层和一Dropout层,所述concatenate层将Flatten层输出向量以及中间结构块Block_k(k=0,1,...,n‑1)输出向量集进行列方向拼接后,再依次经Dense层特征空间变换、BatchNormalization层标准化处理以及Dropout层权重更新后向输出块Block_out输出;
[0018] 确定神经网络框架的超参数,包括一维卷积层Conv1D中卷积核的个数p1、中间结构块中Dense层的神经元个数p2和Dropout层的权重不更新率p3;
[0019] 确定神经网络框架的拓扑结构,包括中间结构块的个数n。
[0020] 进一步的,所述采用遗传算法确定CDWNN的拓扑结构和超参数的具体过程为:
[0021] 初始化种群大小以及子代数目、交叉概率变异概率、神经网络拓扑结构以及所有超参数;
[0022] 随机划分样本数据为训练集和测试集,在测试集分别进行N次模型的独立训练,并计算获得N次独立训练的绝对误差均值;其中,N≥100;
[0023] 以绝对误差均值作为适应度,执行遗传算法的遗传更新,直至种群子代数目达到设定值,输出最佳超参数集合以及对应的适应度。
[0024] 进一步的,所述归因分析的具体过程为:
[0025] 获取一测试样本,采用优化CDWNN进行预测;
[0026] 采用SHAP算法计算该测试样本对应的特征贡献值;
[0027] 判断特征贡献值的正负,评估该特征变化对PaCO2预测值的影响,以确定有利特征和有害特征;其中,特征变化对PaCO2预测值的影响包括:当特征贡献值为负值,表明增大该特征的值会减弱PaCO2预测值;当特征贡献值为正值表明增大该特征的值会增大PaCO2预测值;当特征贡献值为0,表明该特征与PaCO2预测值无关。
[0028] 进一步的,所述决策干预的具体过程为:
[0029] 对未来某一时刻的PaCO2预期值引入DiCE方法,自动计算并输出若干组当前某个或几个有害特征的调整值。
[0030] 本发明另一技术方案在于公开一种PaCO2实时预警模型建立系统,该系统包括:
[0031] 确定模块,用于确定与PaCO2数值变化相关的若干特征;
[0032] 获取模块,用于根据PaCO2时间戳,预设预警期和特征观测窗口,获取样本数据;
[0033] 构建模块,用于构建带超参数的卷积深度和宽度神经网络模型,记为CDWNN;
[0034] 优化模块,用于根据获取的样本数据,采用遗传算法确定CDWNN的拓扑结构和超参数,获得优化CDWNN;
[0035] 预测模块,用于根据优化CDWNN预测PaCO2数值。
[0036] 进一步的,该系统还包括:
[0037] 归因分析模块,用于对预测优化CDWNN的预测结果进行归因分析;
[0038] 决策干预模块,用于根据归因分析结果,对PaCO2数值进行决策干预。
[0039] 进一步的,所述构建模块构建CDWNN的执行单元,包括:
[0040] 构建单元,用于构建神经网络框架,包括构成输入端的一维卷积层Conv1D、依次设置在一维卷积层Conv1D输出端的一Flatten层、若干中间结构块和一输出块;其中,对任一中间结构块Block_n,其输入为Flatten层输出以及中间结构块Block_k(k=0,1,...,n‑1)输出;任一所述中间结构块Block_n均包括一concatenate层、一Dense层、一BatchNormalization层和一Dropout层,所述concatenate层将Flatten层输出向量以及中间结构块Block_k(k=0,1,...,n‑1)输出向量集进行列方向拼接后,再依次经Dense层特征空间变换、BatchNormalization层标准化处理以及Dropout层权重更新后向输出块Block_out输出;
[0041] 第一确定单元,用于确定神经网络框架的超参数,包括一维卷积层Conv1D中卷积核的个数p1、中间结构块中Dense层的神经元个数p2和Dropout层的权重不更新率p3;
[0042] 第二确定单元,用于确定神经网络框架的拓扑结构,包括中间结构块的个数n。
[0043] 进一步的,所述优化模块采用遗传算法确定CDWNN的拓扑结构和超参数的执行单元,包括:
[0044] 初始化单元,用于初始化种群大小以及子代数目、交叉概率变异概率、神经网络框架的所有超参数;
[0045] 第一计算单元,用于随机划分样本数据为训练集和测试集,在测试集分别进行N次模型的独立训练,并计算获得N次独立训练的绝对误差均值;其中,N≥100;
[0046] 执行单元,用于以绝对误差均值作为适应度,执行遗传算法的遗传更新,直至种群子代数目达到设定值,输出最佳拓扑结构、超参数集合以及对应的适应度。
[0047] 进一步的,所述归因分析模块进行归因分析的执行单元,包括:
[0048] 获取单元,用于获取一测试样本,采用优化CDWNN进行预测;
[0049] 第二计算单元,用于采用SHAP算法计算该测试样本对应的特征贡献值;
[0050] 判断单元,用于判断特征贡献值的正负,评估该特征变化对PaCO2预测值的影响,以确定有利特征和有害特征;其中,特征变化对PaCO2预测值的影响包括:当特征贡献值为负值,表明增大该特征的值会减弱PaCO2预测值;当特征贡献值为正值表明增大该特征的值会增大PaCO2预测值;当特征贡献值为0,表明该特征与PaCO2预测值无关。
[0051] 本发明还提出上述的PaCO2实时预警模型建立方法在临床诊治过程中测量及干预PaCO2数值的应用。
[0052] 本发明上述的应用,如提出一种生命健康监测系统,所述生命健康监测系统包括处理器和存储器;
[0053] 所述存储器用于存储程序指令,并将所述程序指令传输给所述处理器;
[0054] 其中,当所述程序指令被所述处理器执行时,使得所述处理器实现上述的PaCO2实时预警模型建立方法。
[0055] 由以上技术方案可知,本发明的技术方案获得了如下有益效果:
[0056] 本发明公开的PaCO2实时预警模型建立方法及系统,为了克服当前PaCO2测量或预测技术的不足,通过提出的新型深度学习算法CDWNN模型解决了现有技术的如下技术问题:
[0057] (1)该算法模式不需要使用血气分析仪设备,对患者身心无创伤,直接规避血气分析繁杂的流程;只要使用训练好的神经网络模型和ICU中常见的呼吸和生命体征指标即可完成PaCO2的实时预测;该算法支持自定义预警时间,可以设置多个未来时间对应的PaCO2值,临床专家能根据不同时间上的PaCO2预测值,制定对应的干预预案。
[0058] (2)CDWNN模型采用独特的神经网络设计大幅提高PaCO2预测精度,主要表现为采用一维卷积实现输入数据的滤波降噪,采用多组卷积核挖掘出高价值耦合特征,采用宽深兼备的神经网络降低过拟合并提高模型的预测准确性,采用遗传算法联调CDWNN模型的超参数。
[0059] (3)CDWNN模型与SHAP算法结合可以根据PaCO2的预测结果量化群体和个体的风险因素贡献值,并筛分出有益风险因素、有害风险因素及无关联因素,临床专家可以直接针对个体有害风险因素进行干预。
[0060] (4)CDWNN模型与DiCE方法结合可以调整有害风险因素的数值,使个体预测的PaCO2数值调整到某个预设的正常PaCO2值;CDWNN模型、SHAP算法以及DiCE方法结合实现了归因筛查及量化、干预决策的数据驱动决策,大幅缩减临床专家决策风险,为患者疾病的治疗争取足够的时间裕量。
[0061] 应当理解,前述构思以及在下面更加详细地描述的额外构思的所有组合只要在这样的构思不相互矛盾的情况下都可以被视为本公开的发明主题的一部分。
[0062] 结合附图从下面的描述中可以更加全面地理解本发明教导的前述和其他方面、实施例和特征。本发明的其他附加方面例如示例性实施方式的特征和/或有益效果将在下面的描述中显见,或通过根据本发明教导的具体实施方式的实践中得知。

附图说明

[0063] 附图不表示按照真实参照物比例绘制。在附图中,在各个图中示出的每个相同或近似相同的组成部分可以用相同的标号表示。为了清晰起见,在每个图中,并非每个组成部分均被标记。现在,将通过例子并参考附图来描述本发明的各个方面的实施例,其中:
[0064] 图1为本发明PaCO2实时预警模型建立方法流程图;
[0065] 图2为本发明CDWNN结构图;
[0066] 图3为本发明遗传算法确定CDWNN拓扑结构及超参数流程图;
[0067] 图4为本发明生命健康监测系统的结构图;
[0068] 图5为本发明PaCO2前端实时展示图;
[0069] 图6(a)为本发明优化CDWNN拓扑结构及超参数结果的可视化图一;
[0070] 图6(b)为本发明优化CDWNN拓扑结构及超参数结果的可视化图二;
[0071] 图6(c)为本发明优化CDWNN拓扑结构及超参数结果的可视化图三;
[0072] 图6(d)为本发明优化CDWNN拓扑结构及超参数结果的可视化图四;
[0073] 图6(e)为本发明优化CDWNN拓扑结构及超参数结果的可视化图五;
[0074] 图7为本发明个体样本的SHAP归因分析图。

具体实施方式

[0075] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。除非另作定义,此处使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。
[0076] 本发明专利申请说明书以及权利要求书中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样,除非上下文清楚地指明其它情况,否则单数形式的“一个”“一”或者“该”等类似词语也不表示数量限制,而是表示存在至少一个。“包括”或者“包含”等类似的词语意指出现在“包括”或者“包含”前面的元件或者物件涵盖出现在“包括”或者“包含”后面列举的特征、整体、步骤、操作、元素和/或组件,并不排除一个或多个其它特征、整体、步骤、 操作、元素、组件和/或其集合的存在或添加。
[0077] 基于PaCO2指标的高临床价值,而现有技术中采用血气分析仪测量PaCO2和使用呼吸机的EtCO2指标估算PaCO2的方法都存在显著的缺陷,如有创性、测试数据具有迟缓性、测试过程繁琐等;本发明旨在于针对上述问题提出一种PaCO2实时预警模型建立方法及系统,该方法及系统通过构建神经网络模型CDWNN,利用ICU中常见的呼吸和生命体征指标即可完成PaCO2的实时预测和ICU中常见的呼吸和生命体征指标即可完成PaCO2的实时预测。
[0078] 结合图1所示,实施例提出的PaCO2实时预警模型建立方法,包括如下步骤:
[0079] 步骤S102,确定与PaCO2数值变化相关的若干特征;
[0080] 实施例中采用MIMIC‑IV数据库的特征工程,并通过SPSS单因素分析确定MIMIC‑IV数据库中与PaCO2数值变化相关的若干特征;实施发现MIMIC‑IV数据库存在13个常见的特征与PaCO2数值存在关联性,显著性系数P<0.05;获取的多个特征如下表1所示。
[0081] 表1 特征及标签信息表
[0082]
[0083] 步骤S104,根据PaCO2时间戳,预设预警期和特征观测窗口,获取样本数据;
[0084] 若当前时刻为t,则定义当前时刻t对应的PaCO2数值为样本标签,每一个时刻t都对应一个样本数据,样本数据包括各常见特征的特征值及对应的PaCO2数值。设定预警期为d小时,即CDWNN具备提前d小时预测出PaCO2数值的功能,特征观测窗口宽度记为w,样本的数据为特征观测窗t‑d‑w t‑d内最接近t‑d时刻的特征数据。其中,作为预警期的时间d,可~以自定义设置,以获得多个未来时间对应的PaCO2值,以便临床专家能根据不同时间上的PaCO2预测值,制定对应的干预预案。
[0085] 医疗系统中充斥大量多源异构数据,MIMIC‑IV中的数据来源包括呼吸机、生命体征监测仪、血气分析仪。其次各种数据类型、取值范围也不同。为了无量纲化各特征值并加速模型收敛速度,实施中,在获取样本数据后将特征数据对应的数据集进行标准化处理,首先是对缺失值按均值填充处理,然后对训练集进行标准正态化处理,最后将训练集的均值和标准差应用于测试集。该处理策略能够更加客观合理评估模型在落地应用中的泛化能力。
[0086] 步骤S106,构建带超参数的卷积深度和宽度神经网络模型,记为CDWNN;
[0087] 具体过程为:构建神经网络框架,包括构成输入端的一维卷积层Conv1D、依次设置在一维卷积层Conv1D输出端的一Flatten层、若干中间结构块和一输出块;其中,中间结构块Block_n的输入是Flatten层输出以及中间结构块Block_k(k=0,1,...,n‑1)输出;任一中间结构块均包括一concatenate层、Dense层、一BatchNormalization层和一Dropout层,其中,concatenate层将Flatten层输出向量以及Block_k(k=0,1,...,n‑1)输出向量集进行列方向拼接后,再依次经Dense层特征空间变换,BatchNormalization层标准化处理以及Dropout层进行权重更新后向输出块Block_out输出。
[0088] 由于医疗数据受设备采集故障、人为主观评估误差、空缺插值不合理以及数据存储错误等影响,导致其数据存在噪声。因此,本发明实施例创新性的在输入端就采用大小为1x1的一维卷积层Conv1D进行滤波且只使用卷积层以后的数据参与后续层的短路及拼接;
Conv1D能够尽可能挖掘高层次耦合特征,有助于增强PaCO2预测精度。另外,足够的深度及宽度的神经网络能够使模型预测性能明显提高,但过高的深度容易造成过拟合和梯度消失。根据链式法则,距离输出越远的网络层参数其损失函数后向传播的权重变化率越小;即便采用relu函数作为激活函数,当参数初始值为0至1之间高斯等分布时,权重变化率仍然很小,这将导致远层网络的参数收敛缓慢甚至停滞。因此,基于DenseNet算法短路拼接的启发,解决深层神经网络梯度过深的问题。DenseNet算法是图像分类经典算法,每层的输入是之前所有层输入矩阵的拼接,当采用链式法则将损失函数反向传播时,远层伸出最远的短路拼接线能够保证远层梯度不至太小,如此就能保证远层参数快速收敛。
[0089] 本发明基于DenseNet算法的启发,搭建获得图2所示的神经网络框架;In‑x是框架的输入值,其中,x是由一个批次的样本数据拼接而成的矩阵;然后通过一维卷积层Conv1D挖掘出p1个耦合特征集y,并经Flatten层将p1个耦合特征集y转化为一维向量y0再输入到中间结构块;最后输出块Block‑out中out表示CDWNN模型的预测概率值;CDWNN模型为回归预测模型,所以框架的损失函数选择‘mae’,即绝对误差均值为损失函数。很明显图2的神经网络框架可以避免了梯度消失,但图2中存在大量的全连接层(Dense层),这很容易造成模型过拟合。为了解决过拟合问题,对任意结构块Block_n(n=0,1,2,...,10)块中的全连接层Dense的输出均需进行批标准化处理(BatchNormalization层),这相当于对损失函数增加正则惩罚,能够一定程度上削弱过拟合;标准化处理后的数据还需输入到Dropout层,Dropout层作用是当模型处于训练模式时,损失函数反向传播将随机忽略一定比率特征的权重更新,这有助于削弱模型的过拟合;例如,图2所示的中间结构块Block_1将y0与y1进行列方向拼接、中间结构块Block_n将y0 yn进行列方向拼接,其中,中间结构块Block_1与中~间结构块Block_n之间还存在中间结构块Block_k,且k=2,3,…,n‑1。当神经网络的结构块增多,全连接层表达复杂非线性能力就越强,过拟合风险就越大,但同时
BatchNormalization层与Dropout层削弱过拟合的能力也在增强,宽深网络的优势与过拟合劣势存在博弈。
[0090] 综上所述及图2所示,本发明构建的CDWNN模型并未完全固定网络拓扑结构和超参数,旨在于解决过去的模型开发环境与将来的应用场景必然存在的不匹配,若固定网络拓扑结构和超参数会导致严重预测事故的问题。所以,方案中一维卷积层Conv1D的卷积核的个数p1、结构块中Dense层的神经元个数p2、Dropout层的权重不更新率p3以及中间结构块的个数n作为模型CDWNN的待定数值,并且这四个待定数值模型CDWNN预测性能提升最关键的因素;另外,在本模型具体应用时,当新场景数据变化较大时,还可以使用新数据在线优化上述四个待定数值。
[0091] 步骤S108,根据获取的样本数据,采用遗传算法确定CDWNN的拓扑结构和超参数,获得优化CDWNN;
[0092] 遗传算法GA(Genetic Algorithm)是基于进化理论和种群遗传理论,通过计算机模拟生物界自然选择和遗传的机制,利用遗传复制、交叉变异的思想,进化得到适应于指定环境下的最优成果,具有随机性、并行性和全局性,能自动的积攒全局范围内的空间信息,自适应的达到逼近最优值的状态,是一种鲁棒性强、效率高的优化方法,其实现过程如图3所示。
[0093] 具体的,首先初始化种群大小以及子代数目、交叉概率变异概率、神经网络拓扑结构以及所有超参数,其中,交叉概率就是模仿遗传学的子代继承父母基因的概率,变异概率模仿子代本身受环境影响发生基因变异的概率,并且本实施例中设定每个子代的种群数目相同;
[0094] 其次,随机将上述获取的样本数据按照8:2随机划分为训练集和测试集,在测试集分别进行N次模型的独立训练,并计算获得N次独立训练的绝对误差(MAE)均值;其中,N≥100;以绝对误差均值作为适应度,执行遗传算法的遗传更新,直至种群子代数目达到设定值,输出最佳拓扑结构、超参数集合以及对应的适应度。其中,执行遗传算法的遗传更新的过程包括,先对中间结构块个数以及超参数值进行二进制编码;中间结构块个数和超参数通常为类别参数或数值参数,对于数值型参数需要离散化处理,然后对类别参数以及离散化的数值参数按照设定的规则进行二进制编码;以绝对误差均值作为适应度,逐个计算种群中所有个体的适应度值,确定最小的适应度对应个体中间结构块个数以及超参数的取值;再采用轮盘赌算法赋予最小的适应度对应的个体的中间结构块个数以及超参数取值遗传到下一代,并依据适应度去除部分个体。
[0095] 随后,依照交叉概率,随机选择两个个体的二进制编码完成任意位置的互补交换,即执行交叉操作;再依照变异概率,随机选择个体二进制编码取反,当其编码为1则取0,当其编码为0则取1,即执行变异操作;完成轮盘赌以及交叉和变异,则更新个体拓扑结构及超参数对应的二进制编码。最后,根据编码规则对更新后的二进制编码进行译码,获得机器学习更新后的拓扑结构和超参数;再判断种群子代数目是否达到设定值,若达到设定值则输出机器学习模型的最小适应度、及对应的拓扑结构和最佳超参数集合,否则重复上述过程。
[0096] 步骤S110,根据优化CDWNN预测PaCO2数值。
[0097] 最佳超参数集合对应的CDWNN即为优化CDWNN,根据该优化CDWNN,通过实时获取各特征对应的数据,即可实时预测PaCO2数值。
[0098] 作为一可选的实施方式,在预测PaCO2数值后还包括:对预测优化CDWNN的预测结果进行归因分析;以及,根据归因分析结果,对PaCO2数值进行决策干预。
[0099] CDWNN与SHAP算法结合可以量化个体风险因素贡献值,并筛分有利因素、有害因素和无关系因素,其中,SHAP算法在文献S.M., Lee S.‑I. A Unified Approach to Interpreting Model Predictions. 31st Conference on Neural Information Processing Systems (NIPS 2017), Long Beach, CA, USA.中提出。
[0100] 获取一测试样本i,将测试样本i送入已训练的CDWNN模型进行预测,并使用SHAP算法自动计算出该样本的编号为j的特征贡献值f(xi,j)。通过判断特征贡献值的正负,评估该特征变化对PaCO2预测值的影响,以确定有利特征和有害特征;具体的,对于样本i,当f(xi,j)<0时,表明增大特征j的值会减弱PaCO2预测值;当f(xi,j)>0时,表明增大特征j的值会增大PaCO2预测值;当f(xi,j)=0时,表明特征j与PaCO2预测值没有关系。对于f(xi,j)≠0的特征,需要明确PaCO2不同取值空间的利害关系确定,如果增加f(xi,j)>0且增加特征j的观测值会使相应增大后的PaCO2值落入疾病恶化的空间,那么特征j就是有害因素,反之,特征j就是有利因素。对于f(xi,j)<0的特征也可确定出有利和有害因素。SHAP可以量化因素的贡献值,并筛选出有害因素,但无法实现数据驱动的干预方案推荐。因此实施时,通过引入DiCE方法来辅助决策,DiCE方法在文献Ramaravind K Mothilal, Amit Sharma, and Chenhao Tan. Explaining machine learning classifiers through diverse counterfactual explanations. In Proceedings of the 2020 Conference on Fairness, Accountability, and Transparency, pages 607–617, 2020.中提出;DiCE方法通过预设未来某个时刻的预期PaCO2数值,自动计算出若干组当前某个或几个有害特征的调整值,有权限调整的人选择任一方案执行,按照数据进行调整即可。
[0101] DiCE有效规避了临床专家凭经验干预的不确定性,为患者病情干预提供足够的时间裕量,临床专家可以自主决定患者预期的PaCO2数值,至于如何调整特征数值完全交给算法处理。
[0102] 本发明公开的PaCO2实时预警模型建立方法,提出的PaCO2实时预警模型为新型深度学习算法模型CDWNN(Convolutional Deep‑and‑Wide Neutral Networks);该模型采用独特的神经网络设计大幅提高PaCO2预测精度,主要表现为采用一维卷积实现输入数据的滤波降噪,采用多组卷积核挖掘出高价值耦合特征,采用宽深兼备的神经网络降低过拟合并提高模型的预测准确性,及采用遗传算法联调CDWNN的超参数。
[0103] 下面结合模型训练测试和模型迁移应用的实施例进一步说明本方案构建的模型CDWNN预测的准确性、归因的合理性和干预的有效性。
[0104] 实施例:模型训练测试
[0105] 基于MIMIC‑IV数据库共获取有效样本986个,每一次试验都要将随机将986个样本按照2:8的比例拆分为测试集和训练集。为了验证CDWNN的性能,我们基于同等试验条件,试验次数N取值为100,预警期d取0.5小时,特征观测窗口宽度w取3小时,入模训练单批次的样本量为16,并设定种群大小为20,演化更新的子代数目为20,交叉概率为0.6,变异概率为0.1,使用GA算法同时优化了CDWNN、lightGBM、random forest以及Logistic regression。
最终确定出CDWNN对应Block_n的n为3,卷积核个数p1为1000,全连接层神经元个数p2为
300,Dropout层梯度反向传播不更新率p3为0.565,CDWNN的绝对误差MAE均值最小值为
4.74,如图6所示;lightGBM的训练迭代次数为160,学习率为0.145,树最大深度为5,以最小叶子节点样本权重为4;random forest的最大特征个数为10,决策树最大深度为5,弱学习器最大迭代次数为150,叶结点最少样本数为2;Logistic regression的正则化参数为L2,损失函数优化器为‘lbfgs’。GA优化后四种机器学习算法的最小绝对误差MAE均值,如下表2所示,很明显模型CDWNN性能最优。
[0106] 表2 GA优化后四种算法的最小绝对误差MAE均值
[0107]
[0108] 实施例:模型的迁移应用
[0109] 为了验证PaCO2实时预警模型的外部测试效果,中国人民解放军总医院呼吸科组织并完成了算法模型的线上测试。按照分层抽样法,随机抽取不同年龄段ICU患者作为测试对象。抽取样本的入组规则为患者具有表1所列的13种数据特征以及PaCO2标签值,样本的排除规则为年龄不满50岁。预警期d为0.5小时,即提前半小时预测PaCO2的误差结果如表3所示。
[0110] 表3 各年龄段的绝对误差MAE均值(mmHg)
[0111]
[0112] 由表3可以看出,随着患者年龄增大,绝对误差MAE均值逐渐增大。原因是年龄越大发病率越高,病情越严重,EtCO2与PaCO2相关性降低,算法性能略降低。另外半小时预警期内,年龄越大的老年人出现突发病情概率增大。
[0113] 随机抽取一个样本,该样本为男性,年龄72岁,住院第55小时,CDWNN预测出第55.5小时的PaCO2为52mmHg属于Ⅱ型呼吸衰竭,SHAP归因分析结果如图7所示。凡是能将PaCO2降低到35 45mmHg的因素将是有利因素,很显然NBPm、Temperature F、FiO2等都是有利因素,~因为这些因素贡献值都为负值,会降低PaCO2数值;而EtCO2是有害因素,因为它的贡献值为正值且数值较大,EtCO2会大幅提升PaCO2数值。根据SHAP归因分析结果,首先要考虑如何降低EtCO2的特征观测值,使用DiCE方法可以确定EtCO2需调整到的具体数值。预设第55.5小时的PaCO2数值为43mmHg,使用DiCE方法反向计算出EtCO2需要调整到44mmHg;实践中,呼吸治疗师通过呼吸模式设置以及其他辅助措施,在半小时内顺利将该患者的EtCO2调整到
44mmHg附近,经现场实测发现患者在第55.5小时的PaCO2为43.2mmHg,这与DiCE预设值基本一致。该实例充分说明了CDWNN模型预测的准确性、SHAP归因分析的合理性以及DiCE干预的有效性,大幅降低了临床决策负担以及风险。
[0114] 本发明实施例还提供一种电子设备,包括处理器和存储器,存储器用于存储程序指令,并将程序指令传输给处理器;当程序指令被处理器执行时,使得处理器实现上述实施例公开的PaCO2实时预警模型建立方法。
[0115] 上述程序可以运行在处理器中,或者也可以存储在存储器中(或称为计算机可读存储介质),计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器 (CD‑ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
[0116] 这些计算机程序也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤,对应与不同的步骤可以通过不同的模块来实现。
[0117] 本申请的实施例中就提供了这样的一种系统,该系统被称为PaCO2实时预警模型建立系统,其组成包括:确定模块,用于基于MIMIC‑IV数据库的特征工程,确定与PaCO2数值变化相关的若干特征;获取模块,用于根据PaCO2时间戳,预设预警期和特征观测窗口,获取样本数据;构建模块,用于构建带超参数的卷积深度和宽度神经网络模型,记为CDWNN;优化模块,用于根据获取的样本数据,采用遗传算法确定CDWNN的拓扑结构和超参数,获得优化CDWNN;预测模块,用于根据优化CDWNN预测PaCO2数值;归因分析模块,用于对预测优化CDWNN的预测结果进行归因分析;决策干预模块,用于根据归因分析结果,对PaCO2数值进行决策干预。
[0118] 该系统用于实现上述的实施例中的方法的功能,该系统中的每个模块与方法中的每个步骤相对应,已经在方法中进行过说明的,在此不再赘述。
[0119] 例如,构建模块构建CDWNN的执行单元,包括:构建单元,用于构建神经网络框架,包括构成输入端的一维卷积层Conv1D、依次设置在一维卷积层Conv1D输出端的一Flatten层、若干中间结构块和一输出块;其中,对任一中间结构块Block_n,其输入为Flatten层输出以及中间结构块Block_k(k=0,1,...,n‑1)输出;任一所述中间结构块Block_n均包括一concatenate层、一Dense层、一BatchNormalization层和一Dropout层,所述concatenate层将Flatten层输出向量以及中间结构块Block_k(k=0,1,...,n‑1)输出向量集进行列方向拼接后,再依次经Dense层特征空间变换、BatchNormalization层标准化处理以及Dropout层权重更新后向输出块Block_out输出;第一确定单元,用于确定神经网络框架的超参数,包括一维卷积层Conv1D中卷积核的个数p1、中间结构块中Dense层的神经元个数p2和Dropout层的权重不更新率p3;第二确定单元,用于确定神经网络框架的拓扑结构,包括中间结构块的个数n。
[0120] 又例如,优化模块采用遗传算法确定CDWNN的拓扑结构和超参数的执行单元,包括:初始化单元,用于初始化种群以及子代数目、交叉概率变异概率、神经网络框架的所有超参数;第一计算单元,用于随机划分样本数据为训练集和测试集,在测试集分别进行N次模型的独立训练,并计算获得N次独立训练的绝对误差均值;其中,N≥100;执行单元,用于以绝对误差均值作为适应度,执行遗传算法的遗传更新,直至种群子代数目达到设定值,输出最佳拓扑结构、超参数集合以及对应的适应度。
[0121] 又例如,归因分析模块进行归因分析的执行单元,包括:获取单元,用于获取一测试样本,采用优化CDWNN进行预测;第二计算单元,用于采用SHAP算法计算该测试样本对应的特征贡献值;判断单元,用于判断特征贡献值的正负,评估该特征变化对PaCO2预测值的影响,以确定有利特征和有害特征;其中,特征变化对PaCO2预测值的影响包括:当特征贡献值为负值,表明增大该特征的值会减弱PaCO2预测值;当特征贡献值为正值表明增大该特征的值会增大PaCO2预测值;当特征贡献值为0,表明该特征与PaCO2预测值无关。
[0122] 在本申请的实施例中,还提供了上述的PaCO2实时预警模型建立方法在临床诊治过程中测量及干预PaCO2数值的应用,例如,上述的电子设备具体应用时可为图4所示的生命健康监测系统;ICU床旁站的呼吸机及生命监测仪将多个患者的呼吸参数及生命体征数据实时地传输到服务器;服务器中采用Docker镜像开发出PaCO2高并发实时提前d,(0≤d≤2)小时预警接口;该服务器可在1.92s内同时完成多个患者的PaCO2预测任务,并将结果实时返回到中心站及iPad应用端以供临床专家及时对患者做出干预措施,其中iPad为无线连接。中心站及iPad端的前端展示如图5所示,图5中的PaCO2为提前30分钟的预测结果。
[0123] 本发明提供的PaCO2实时预警模型建立方法及系统在进行PaCO2数值确定时,一方面不需要使用血气分析仪设备,无创伤且规避血气分析繁杂的流程,另一方面通过预警模型与SHAP算法结合能量化群体和个体的风险因素贡献值,分析有利/有害风险因素,再与DiCE方法结合能调整有害风险因素的数值,使个体预测的PaCO2数值调整到某个预设的正常PaCO2值,为疾病的治疗争取时间裕量。
[0124] 虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视权利要求书所界定者为准。