败血症临床用药方案自动生成系统转让专利

申请号 : CN202210984717.9

文献号 : CN115050451B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 傅天童欧阳波杨善林乔灵杰马志敏

申请人 : 合肥工业大学

摘要 :

本发明提供一种败血症临床用药方案自动生成系统,涉及医疗技术领域。本发明中,训练模块根据每个分类簇中的历史临床数据,采用Decision‑Transformer深度学习网络获取离线轨迹数据集,所述离线轨迹数据集包括预测得到的患者生理状态、药物治疗剂量组合和奖励大小;验证模块将预测得到的所述药物治疗剂量组合返回验证集进行验证,比较所述验证集中的实际药物治疗剂量与前述预测得到的药物治疗剂量组合比较类似程度,若患者的存活率状况满足预设条件,则将对应的参数返回Decision‑Transformer深度学习网络进行迭代。在每个子空间中使用Decision Transformer架构进行训练,基于过去真实的用药数据,选取最好治疗效果的药物集,效果更优。

权利要求 :

1.一种败血症临床用药方案自动生成系统,其特征在于,包括:预处理模块,用于获取并预处理败血症患者的历史临床数据,并将预处理后的历史临床数据划分为训练集和验证集;

聚类模块,用于根据所述训练集,采用子空间聚类算法进行聚类,获取若干分类簇;

训练模块,用于根据每个分类簇中的历史临床数据,采用Decision‑Transformer深度学习网络获取离线轨迹数据集,所述离线轨迹数据集包括预测得到的患者生理状态、药物治疗剂量组合和奖励大小;

验证模块,用于将预测得到的所述药物治疗剂量组合返回验证集进行验证,比较所述验证集中的实际药物治疗剂量与前述预测得到的药物治疗剂量组合比较类似程度,若患者的存活率状况满足预设条件,则将对应的参数返回Decision‑Transformer深度学习网络进行迭代;

生成模块,根据败血症患者的当前临床数据,选定患者的存活率最高的网络模型自动生成临床用药方案;

所述预处理模块具体用于:

S11、用于在重症监护医疗数据集MIMIC‑IV中依据国际Spesis‑3标准,提取入院后24h内,被诊断为败血症的成年患者,在医院接受诊断及治疗前72h的历史临床数据;

S12、用于平均划分每位患者前72h的历史临床数据为M段,将其编码为具有∆t=72/M时间步长的多维离散时间序列,由此对每位患者得到M*L维数据表,每一个患者的数据记作:,其中Pnim表示第n个患者的第m条时间序列数据向量,L表示历史临床数据的总类数;

所述聚类模块具体用于:

S21、将训练集中所有患者的历史临床数据定义为L*1*N维,记作去id化、去时间序列的N条特征向量,其中N表示训练集对应的患者总数;

S22、初始化特征空间,把空间划分若不重叠的矩形单元,并计算每个网格的密度,根据给定的阈值,识别密集网格和非密集网格,将这N条特征向量的数据集放入初始化特征空间;

S23、遍历训练集,得到1维密集网格单元之后,进行迭代,由k‑1维单元产生候选的k维密集网格单元,之后再遍历一次训练集确定真正的k维密集网格单元,直至无法产生新的候选密集k维密集网格单元,迭代结束;

S24、标记相同的密集网格组成分类簇;

S25、重复执行S23和S24,直至产生t个分类簇,其中同一分类簇对应的各个患者属于同一病理特征;

所述训练模块具体用于:

对每个分类簇中抽取序列长度为M的历史临床数据,训练与输入标记St对应的预测头,预测离散动At作的交叉熵损失、以及连续动作的均方误差,并对每个时间步的损失进行平均,获取所述离线轨迹数据集,其中患者数据轨迹记为τ:

其中 、st、at分别为t时刻的Reward,state和action,t=1,2,⋯,T;

设置为t时刻之后的所有奖励之和,最终患者存活为奖励,患者死亡为惩罚;

state设置为患者的N*L维数据表;

action设置为药物治疗剂量组合。

2.如权利要求1所述的败血症临床用药方案自动生成系统,其特征在于,所述历史临床数据包括47种:(1)基础数据:患者id、性别,年龄,身高,首次测量体重,身体质量指数;

(2)生理数据:心率,呼吸频率,平均压,收缩压,舒张压;

(3)血液元素值:白蛋白,过量碱,碳酸氢盐,血尿素氮,钙,钾,氯,钠,二氧化碳,肌酐,游离钙,葡萄糖,血红蛋白,国际标准化比值,乳酸,镁,酸碱度,血小板,凝血酶原时间,凝血激活酶时间,血氧饱和度,总胆红素,白细胞计数;

(4)医学诊断标准:急性生理功能评分系统首次评分值,序贯器官衰竭的检测首次评分值,序贯器官衰竭的检测最大评分值,患者于重症监护病房停留日长,患者于重症监护病房死亡率——布尔值,患者于医院内停留日长,患者于医院内死亡率——布尔值;

(5)用药情况:多巴胺,肾上腺素,去甲肾上腺素,苯肾上腺素,氢吗啡酮,超过4小时的静脉输液摄入。

3.如权利要求1所述的败血症临床用药方案自动生成系统,其特征在于,所述预处理模块执行步骤S12前,还用于若某一患者的历史临床数据符合以下情形,剔除该患者的数据;

入院时未成年;

最终死亡或存活未被记录;

未有静脉输液和血管升压药使用记录;

缺失部分较多;

超出临床数据正常范围过大;

由于患者病情严重,采取大剂量血液升压药的急救治疗策略,且于12h内死亡。

4.如权利要求1所述的败血症临床用药方案自动生成系统,其特征在于,所述S24中标记相同的密集网格组成分类簇,具体包括:当发现第一个密集网格时,以该网格开始扩展,若一个网格与已知密集区域内的网格邻接并且其自身也是密集的,则合并网格到该密集区域,直到不再有这样的网格被发现为止。

5.如权利要求1所述的败血症临床用药方案自动生成系统,其特征在于,所述聚类模块在执行步骤S 25后,还具体用于:S26、统计每t个分类簇中患者的死亡率,若大于预设的死亡率阈值,则剔除该部分分类簇,否则保留用于训练模块学习Decision‑Transformer深度学习网络。

6.如权利要求1所述的败血症临床用药方案自动生成系统,其特征在于,所述药物治疗剂量组合具体设置为静脉输液剂量和和血管升压药剂量和的若干种剂量组合。

7.如权利要求6所述的败血症临床用药方案自动生成系统,其特征在于,所述若干种剂量组合包括25种:接受血管升压药剂量和为0、1 50、50 200、200 500、>500mg,与接受静脉输液剂量和为~ ~ ~

0、0.001 0.08、0.08 0.22、0.22 0.45、>0.45ml之间的两两组合。

~ ~ ~

说明书 :

败血症临床用药方案自动生成系统

技术领域

[0001] 本发明涉及医疗技术领域,具体涉及一种败血症临床用药方案自动生成系统。

背景技术

[0002] 随着医疗信息化的快速发展,电子病历和健康档案的实行,产生了大量的文档、表格、图像、语音等多媒体信息。利用人工智能技术辅助开展医疗过程,对数据进行整合分析,为提升医疗卫生服务能力,解决医疗资源紧缺带来了新契机。
[0003] 目前,部分回顾性研究利用过往数据调查研究患者死亡率、统计患者死亡原因等,为医务工作者提供相对准确的医学经验,但由于每位患者自身状态各不相同,不能以经验主义一概而论,其实际意义相对低微。还有部分预测性研究通过EMR或公开数据集提取相应数据,对患者进行个性化分析和诊断,提高患者的生存率。由于如下原因:(1)患者病情较为复杂,用药数量、剂量不确定;(2)临床医生由于医学责任、既往经验等顾虑而更相信自己的判断。大多数研究止步于病情的预测、预后,而未有根据诊断结果进行辅助用药预测。
[0004] 此外,采用的机器学习训练方案各不相同,算法设计较为复杂或不合适,例如败血症临床用药方案自动生成方案中,对高维数据采用k‑means聚类算法,可能导致聚类效果不理想的问题,进而导致药物使用集合估计结果不准确。

发明内容

[0005] (一)解决的技术问题
[0006] 针对现有技术的不足,本发明提供了一种败血症临床用药方案自动生成系统,解决了药物使用集合估计结果不准确的技术问题。
[0007] (二)技术方案
[0008] 为实现以上目的,本发明通过以下技术方案予以实现:
[0009] 一种败血症临床用药方案自动生成系统,包括:
[0010] 预处理模块,用于获取并预处理败血症患者的历史临床数据,并将预处理后的历史临床数据划分为训练集和验证集;
[0011] 聚类模块,用于根据所述训练集,采用子空间聚类算法进行聚类,获取若干分类簇;
[0012] 训练模块,用于根据每个分类簇中的历史临床数据,采用Decision‑Transformer深度学习网络获取离线轨迹数据集,所述离线轨迹数据集包括预测得到的患者生理状态、药物治疗剂量组合和奖励大小;
[0013] 验证模块,用于将预测得到的所述药物治疗剂量组合返回验证集进行验证,比较所述验证集中的实际药物治疗剂量与前述预测得到的药物治疗剂量组合比较类似程度,若患者的存活率状况满足预设条件,则将对应的参数返回Decision‑Transformer深度学习网络进行迭代;
[0014] 生成模块,根据败血症患者的当前临床数据,选定患者的存活率最高的网络模型自动生成临床用药方案。
[0015] 优选的,所述预处理模块具体用于:
[0016] S11、用于在重症监护医疗数据集MIMIC‑IV中依据国际Spesis‑3标准,提取入院后24h内,被诊断为败血症的成年患者,在医院接受诊断及治疗前72h的历史临床数据;
[0017] S12、用于平均划分每位患者前72h的历史临床数据为M段,将其编码为具有∆t=72/M时间步长的多维离散时间序列,由此对每位患者得到M*L维数据表,每一个患者的数据记作:
[0018] ,其中Pn im表示第n个患者的第m条时间序列数据向量,L表示历史临床数据的总类数。
[0019] 优选的,所述历史临床数据包括47种:
[0020] (1)基础数据:患者id、性别,年龄,身高,首次测量体重,身体质量指数;
[0021] (2)生理数据:心率,呼吸频率,平均压,收缩压,舒张压;
[0022] (3)血液元素值:白蛋白,过量碱,碳酸氢盐,血尿素氮,钙,钾,氯,钠,二氧化碳,肌酐,游离钙,葡萄糖,血红蛋白,国际标准化比值,乳酸,镁,酸碱度,血小板,凝血酶原时间,凝血激活酶时间,血氧饱和度,总胆红素,白细胞计数;
[0023] (4)医学诊断标准:急性生理功能评分系统首次评分值,序贯器官衰竭的检测首次评分值,序贯器官衰竭的检测最大评分值,患者于重症监护病房停留日长,患者于重症监护病房死亡率——布尔值,患者于医院内停留日长,患者于医院内死亡率——布尔值;
[0024] (5)用药情况:多巴胺,肾上腺素,去甲肾上腺素,苯肾上腺素,氢吗啡酮,超过4小时的静脉输液摄入。
[0025] 优选的,所述预处理模块执行步骤S12前,还用于
[0026] 若某一患者的历史临床数据符合以下情形,剔除该患者的数据;
[0027] (1)入院时未成年;
[0028] (2)最终死亡或存活未被记录;
[0029] (3)未有静脉输液和血管升压药使用记录;
[0030] (4)缺失部分较多;
[0031] (5)超出临床数据正常范围过大;
[0032] (6)由于患者病情严重,采取大剂量血液升压药的急救治疗策略,且于12h内死亡。
[0033] 优选的,所述聚类模块具体用于:
[0034] S21、将训练集中所有患者的历史临床数据定义为L*1*N维,记作去id化、去时间序列的N条特征向量,其中N表示训练集对应的患者总数;
[0035] S22、初始化特征空间,把空间划分若不重叠的矩形单元,并计算每个网格的密度,根据给定的阈值,识别密集网格和非密集网格,将这N条特征向量的数据集放入初始化特征空间;
[0036] S23、遍历训练集,得到1维密集网格单元之后,进行迭代,由k‑1维单元产生候选的k维密集网格单元,之后再遍历一次训练集确定真正的k维密集网格单元,直至无法产生新的候选密集k维密集网格单元,迭代结束;
[0037] S24、标记相同的密集网格组成分类簇;
[0038] S25、重复执行S23和S24,直至产生t个分类簇,其中同一分类簇对应的各个患者属于同一病理特征。
[0039] 优选的,所述S24中标记相同的密集网格组成分类簇,具体包括:
[0040] 当发现第一个密集网格时,以该网格开始扩展,若一个网格与已知密集区域内的网格邻接并且其自身也是密集的,则合并网格到该密集区域,直到不再有这样的网格被发现为止。
[0041] 优选的,所述聚类模块在执行步骤25后,还具体用于:
[0042] S26、统计每t个分类簇中患者的死亡率,若大于预设的死亡率阈值,则剔除该部分分类簇,否则保留用于训练模块学习Decision‑Transformer深度学习网络。
[0043] 优选的,所述训练模块具体用于:
[0044] 对每个分类簇中抽取序列长度为M的历史临床数据,训练与输入标记St对应的预测头,预测离散动作At的交叉熵损失、以及连续动作的均方误差,并对每个时间步的损失进行平均,获取所述离线轨迹数据集,
[0045] 其中患者数据轨迹记为τ:
[0046]
[0047] 其中 、st、at分别为t时刻的Reward,state和action,t=1,2,⋯,T;
[0048] 设置为 t 时刻之后的所有奖励之和,最终患者存活为奖励,患者死亡为惩罚;
[0049] state设置为患者的N*L维数据表;
[0050] action设置为药物治疗剂量组合。
[0051] 优选的,所述药物治疗剂量组合具体设置为静脉输液剂量和和血管升压药输入剂量的若干种剂量组合。
[0052] 优选的,所述若干种剂量组合包括25种:
[0053] 接受血管升压药剂量和为0、1 50、50 200、200 500、>500mg,与接受静脉输液剂量~ ~ ~和为0、0.001 0.08、0.08 0.22、0.22 0.45、>0.45ml之间的两两组合。
~ ~ ~
[0054] (三)有益效果
[0055] 本发明提供了一种败血症临床用药方案自动生成系统。与现有技术相比,具备以下有益效果:
[0056] 本发明中,训练模块根据每个分类簇中的历史临床数据,采用Decision‑Transformer深度学习网络获取离线轨迹数据集,所述离线轨迹数据集包括预测得到的患者生理状态、药物治疗剂量组合和奖励大小;验证模块将预测得到的所述药物治疗剂量组合返回验证集进行验证,比较所述验证集中的实际药物治疗剂量与前述预测得到的药物治疗剂量组合比较类似程度,若患者的存活率状况满足预设条件,则将对应的参数返回Decision‑Transformer深度学习网络进行迭代。在每个子空间中使用Decision Transformer架构进行训练,基于过去真实的用药数据,选取最好治疗效果的药物集,效果更优。

附图说明

[0057] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0058] 图1为本发明实施例提供的一种败血症临床用药方案自动生成系统的结构框图。

具体实施方式

[0059] 为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0060] 本申请实施例通过提供一种败血症临床用药方案自动生成系统,解决了药物使用集合估计结果不准确的技术问题。
[0061] 本申请实施例中的技术方案为解决上述技术问题,总体思路如下:
[0062] 之前的研究在对数据集选取时未考虑部分生理数据值在发病前并未测量,数据缺失量极大。本实施例将每位患者第一次测量心率数据的时间作为判定该患者接受诊断及治疗的开始时间,并提取此后其他生理检测的全部数据,最大程度的确保数据完整性及准确性。
[0063] 之前的研究使用基于距离进行聚类的k‑means++算法。由于本申请中数据维度较高,数据较低维空间中数据分布要稀疏,在高维空间中基于距离来构建簇误差较大。因此本发明实施例采用子空间聚类算法对患者数据进行聚类,更好的对患者状态作出区分。
[0064] 之前的研究采用传统强化学习中的TD差分学习,本发明实施例在每个子空间中使用Decision Transformer架构进行训练,基于过去真实的用药数据,选取最好治疗效果的药物集,效果更优。
[0065] 为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
[0066] 实施例:
[0067] 如图1所示,本发明实施例提供了一种败血症临床用药方案自动生成系统,包括:
[0068] 预处理模块,用于获取并预处理败血症患者的历史临床数据,并将预处理后的历史临床数据划分为训练集和验证集;
[0069] 聚类模块,用于根据所述训练集,采用子空间聚类算法进行聚类,获取若干分类簇;
[0070] 训练模块,用于根据每个分类簇中的历史临床数据,采用Decision‑Transformer深度学习网络获取离线轨迹数据集,所述离线轨迹数据集包括预测得到的患者生理状态、药物治疗剂量组合和奖励大小;
[0071] 验证模块,用于将预测得到的所述药物治疗剂量组合返回验证集进行验证,比较所述验证集中的实际药物治疗剂量与前述预测得到的药物治疗剂量组合比较类似程度,若患者的存活率状况满足预设条件,则将对应的参数返回Decision‑Transformer深度学习网络进行迭代;
[0072] 生成模块,根据败血症患者的当前临床数据,选定患者的存活率最高的网络模型自动生成临床用药方案。
[0073] 本发明实施例在每个子空间中使用Decision Transformer架构进行训练,基于过去真实的用药数据,选取最好治疗效果的药物集,效果更优。
[0074] 接下来将结合具体内容详细介绍上述技术方案的各个模块:
[0075] 在预处理模块中,其用于获取并预处理败血症患者的历史临床数据,并将预处理后的历史临床数据划分为训练集和验证集;具体用于:
[0076] S11、用于在重症监护医疗数据集MIMIC‑IV贝斯以色列迪康医学中心2001年6月——2012年10月重症监护室病人的临床数据记录)中依据国际Spesis‑3标准,提取入院后24h内,被诊断为败血症的成年患者,在医院接受诊断及治疗前72h的历史临床数据;
[0077] S12、用于平均划分每位患者前72h的历史临床数据为M段,将其编码为具有∆t=72/M时间步长的多维离散时间序列,由此对每位患者得到M*L维数据表,每一个患者的数据记作:
[0078] ,其中Pn im表示第n个患者的第m条时间序列数据向量,L表示历史临床数据的总类数,在此本发明实施取M=18,则∆t=4h。
[0079] 所述历史临床数据包括L=47种:
[0080] (1)基础数据:患者id、性别,年龄,身高,首次测量体重,身体质量指数;
[0081] (2)生理数据:心率,呼吸频率,平均压,收缩压,舒张压;
[0082] (3)血液元素值:白蛋白,过量碱,碳酸氢盐,血尿素氮,钙,钾,氯,钠,二氧化碳,肌酐,游离钙,葡萄糖,血红蛋白,国际标准化比值,乳酸,镁,酸碱度,血小板,凝血酶原时间,凝血激活酶时间,血氧饱和度,总胆红素,白细胞计数;
[0083] (4)医学诊断标准:急性生理功能评分系统首次评分值,序贯器官衰竭的检测首次评分值,序贯器官衰竭的检测最大评分值,患者于重症监护病房停留日长,患者于重症监护病房死亡率——布尔值,患者于医院内停留日长,患者于医院内死亡率——布尔值;
[0084] (5)用药情况:多巴胺,肾上腺素,去甲肾上腺素,苯肾上腺素,氢吗啡酮,超过4小时的静脉输液摄入。
[0085] 特别的,所述预处理模块执行步骤S12前,还用于
[0086] 若某一患者的历史临床数据符合以下情形,剔除该患者的数据;
[0087] (1)入院时未成年;
[0088] (2)最终死亡或存活未被记录;
[0089] (3)未有静脉输液和血管升压药使用记录;
[0090] (4)缺失部分较多;
[0091] (5)超出临床数据正常范围过大;
[0092] (6)由于患者病情严重,采取大剂量血液升压药的急救治疗策略,且于12h内死亡。
[0093] 由预处理模块获取的M*L维数据表,能够较为清楚的展示了患者生理状态随着用药剂量而变化的趋势。选取其中80%作为样本训练,其余20%留作模型验证。
[0094] 在聚类模块中,其用于根据所述训练集,采用子空间聚类算法进行聚类,获取若干分类簇;
[0095] 由于高维空间中数据较低维空间中数据分布要稀疏,其中数据间距离几乎相等是普遍现象,而传统聚类方法是基于距离进行聚类的,因此在高维空间中无法基于距离来构建簇。所以本发明实施例采用子空间聚类(Subspace Clustering)算法对患者数据进行聚类,它先将原始特征空间分为若干个网格,再以落到某网格中样本点的概率表示该子空间的密度情况。对于密度超过一定阈值的子空间作为密集单元进行保留,而对非密集子空间进行舍弃。
[0096] 算法流程如下:
[0097] (1)将数据划分成m个子空间,识别每个子空间包含的t个簇;
[0098] (2)识别这t个簇;
[0099] (3)生成描述这些簇的集群CT。
[0100] 具体用于:
[0101] S21、将训练集中所有患者的历史临床数据定义为L*1*N维,记作去id化、去时间序列的N条特征向量,其中N表示训练集对应的患者总数,根据上文的介绍可知L=47。
[0102] S22、初始化特征空间,把空间划分若不重叠的矩形单元,并计算每个网格的密度,根据给定的阈值,识别密集网格和非密集网格,将这N条特征向量的数据集放入初始化特征空间。
[0103] 如果一个向量点集(簇)S是47维空间的一个簇,那么S是该空间的任意k−1维子空间中某个簇的一部分。因此,单次迭代过程包括如下S23和S24:
[0104] S23、遍历训练集,得到1维密集网格单元之后,进行迭代,由k‑1维单元产生候选的k维密集网格单元,之后再遍历一次训练集确定真正的k维密集网格单元,直至无法产生新的候选密集k维密集网格单元,迭代结束。
[0105] S24、标记相同的密集网格组成分类簇;具体包括:
[0106] 当发现第一个密集网格时,以该网格开始扩展,若一个网格与已知密集区域内的网格邻接并且其自身也是密集的,则合并网格到该密集区域,直到不再有这样的网格被发现为止。
[0107] S25、重复执行S23和S24,直至产生t个分类簇,其中同一分类簇对应的各个患者属于同一病理特征。
[0108] S26、统计每t个分类簇中患者的死亡率,若大于预设的死亡率阈值,则剔除该部分分类簇,否则保留用于训练模块学习Decision‑Transformer深度学习网络。
[0109] 在训练模块中,其用于根据每个分类簇中的历史临床数据,采用Decision‑Transformer深度学习网络获取离线轨迹数据集,所述离线轨迹数据集包括预测得到的患者生理状态、药物治疗剂量组合和奖励大小;具体用于:
[0110] 对每个分类簇中抽取序列长度为M(M=18)的历史临床数据,训练与输入标记St对应的预测头,预测离散动作At的交叉熵损失、以及连续动作的均方误差,并对每个时间步的损失进行平均,获取所述离线轨迹数据集,
[0111] 其中患者数据轨迹记为τ:
[0112]
[0113] 其中 、st、at分别为t时刻的Reward,state和action,t=1,2,⋯,T;
[0114] 设置为 t 时刻之后的所有奖励之和,最终患者存活为奖励+100,患者死亡为惩罚‑100;
[0115] state设置为患者的N*L维数据表;
[0116] action设置为药物治疗剂量组合。
[0117] 如表1所示,所述药物治疗剂量组合具体设置为静脉输液剂量和和血管升压药输入剂量的若干种剂量组合,即包括以下25种:
[0118] 接受血管升压药剂量和为0、1 50、50 200、200 500、>500mg,与接受静脉输液剂量~ ~ ~和为0、0.001 0.08、0.08 0.22、0.22 0.45、>0.45ml之间的两两组合。
~ ~ ~
[0119] 表1
[0120]
[0121] 上文所言的Decision Transformer对Transformer架构进行较小修改,它对轨迹进行自回归建模——即对状态、动作和奖励序列的联合分布建模,以替代传统RL算法。它根据过往已经收集到的经验——即患者过往的生理状态数据表及治疗过程,使用序列建模目标来训练Transformer模型。
[0122] 特别的,患者第一条被完整记录的4h时间步长序列被当作初始状态,作为初始生成的条件信息。将每个P n im*47数据向量经过一个嵌入,再加上位置编码得到tokens,经过Transformer处理得到输出tokens,再经过多层感知机的decoder 层得到输出的action(用药组合),训练网络通过执行每一个当前的给药状态生成操作后,通过患者最终生存或死亡的结果而设置的奖惩设置,以取得的奖励来减少目标回报,并一直重复到这一患者记录的数据状态终止。
[0123] 本发明实施例将每位患者第一次测量心率数据的时间作为判定该患者接受诊断及治疗的开始时间,并提取此后其他生理检测的全部数据,最大程度的确保数据完整性及准确性。
[0124] 在验证模块中,其用于将预测得到的所述药物治疗剂量组合返回验证集进行验证,比较所述验证集中的实际药物治疗剂量与前述预测得到的药物治疗剂量组合比较类似程度,若患者的存活率状况满足预设条件,则将对应的参数返回Decision‑Transformer深度学习网络进行迭代;
[0125] 在生成模块中,其根据败血症患者的当前临床数据,选定患者的存活率最高的网络模型自动生成临床用药方案,为临床医生提供辅助治疗建议。
[0126] 综上所述,与现有技术相比,具备以下有益效果:
[0127] 本发明实施例中,训练模块根据每个分类簇中的历史临床数据,采用Decision‑Transformer深度学习网络获取离线轨迹数据集,所述离线轨迹数据集包括预测得到的患者生理状态、药物治疗剂量组合和奖励大小;验证模块将预测得到的所述药物治疗剂量组合返回验证集进行验证,比较所述验证集中的实际药物治疗剂量与前述预测得到的药物治疗剂量组合比较类似程度,若患者的存活率状况满足预设条件,则将对应的参数返回Decision‑Transformer深度学习网络进行迭代。在每个子空间中使用Decision Transformer架构进行训练,基于过去真实的用药数据,选取最好治疗效果的药物集,效果更优。
[0128] 需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0129] 以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。