一种基于因果结构不变性的多中心慢性病预测装置转让专利

申请号 : CN202310701410.8

文献号 : CN116434969B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王丰李劲松池胜强谭笑周天舒

申请人 : 之江实验室

摘要 :

本发明公开了一种基于因果结构不变性的多中心慢性病预测装置,包括以下步骤,根据单个中心患者特征数据与其结局,建立每个中心的因果关系,使患者的特征数据在该因果关系下拟合其结局,根据患者的特征数据在该因果关系下的拟合结局对比实际结局的差异性,与不同医疗中心的因果关系之间的差异性共同修正该因果关系,当拟合误差和不同中心因果关系之间的差异达到预设要求时,该因果关系经噪声处理后得到多中心场景下稳定的因果结构;通过因果结构建立更为直观的因果结构图;通过因果结构图构建慢性病结局预测模型。本发明挖掘数据中更深层次的因果逻辑关系,解决了传统方法可解释性不足的问题,为慢性病决策支持提供更加合理的决策建议。

权利要求 :

1.一种基于因果结构不变性的多中心慢性病预测装置,其特征在于,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述一个或多个处理器执行所述可执行代码,以实现以下步骤:步骤1,采集数据:采集不同医疗中心慢性病患者的数据;

步骤2,数据预处理:将步骤1得到患者数据进行预处理,对齐不同医疗中心具有相同语义概念、不同表述的特征,建立多中心患者的特征数据集合和多中心患者的结局集合;

步骤3,得到多中心场景下稳定的因果结构矩阵:根据单个中心患者特征数据与其结局,基于预构建的图神经网络模型建立每个中心的因果关系,使患者的特征数据在该因果关系下拟合其结局,根据患者的特征数据在该因果关系下的拟合结局对比实际结局的差异性,与不同医疗中心的因果关系之间的差异性共同修正该因果关系,当拟合误差和不同中心因果关系之间的差异达到预设要求时,该因果关系经噪声处理后得到多中心场景下稳定的因果结构矩阵,其中,所述图神经网络为二层网络结构,第一层神经网络逐一将单个中心患者的特征数据集合与随机初始化的该中心因果关系卷积,激活后得到第一层网络输出,第二层图神经网络将该中心因果关系与第一层网络输出卷积,激活后得到第二层网络输出,两层图神经网络后接全连接网络,激活后得到拟合结局,其中的网络参数和所述的因果关系使用优化器优化;

步骤4,因果结构矩阵转化:通过因果结构矩阵建立更为直观的因果结构图;

步骤5,预测结局:通过因果结构图构建慢性病结局预测模型,将患者的特征数据输入预测模型后得出慢性病的预测结局。

2.根据权利要求1所述的基于因果结构不变性的多中心慢性病预测装置,其特征在于,所述的修正采用的公式为:,

其中,c为医疗中心个数, 为第i个医疗中心患者人数, 为第i个医疗中心第j个患者的实际结局,发生表示1,未发生表示0, 为第i个医疗中心第j个患者的数据经过模型后的拟合结局,为多中心拟合结局,Y为多中心实际结局, 为多中心拟合结局和实际结局的差异, 表示不同医疗中心的因果关系 的方差, 为不同中心因果关系的差异。

3.根据权利要求1所述的基于因果结构不变性的多中心慢性病预测装置,其特征在于,所述步骤3中,当拟合误差和不同中心因果关系之间的差异达到预设要求时,所述因果关系通过异质性映射反推得出 因果结构矩阵 ,其中表示不同医疗中心的因果关系。

4.根据权利要求1所述的基于因果结构不变性的多中心慢性病预测装置,其特征在于,所述步骤4中,通过因果结构矩阵建立更为直观的因果结构图的具体方法为:因果结构矩阵的中位数为 ,如果因果结构矩阵中第i行第j列的元素 ,则代表特征j是特征i的原因,在因果结构图中特征i与特征j构成j指向i的单向边,若 则特征i与特征j不构成因果关系。

5.根据权利要求4所述的基于因果结构不变性的多中心慢性病预测装置,其特征在于,所述步骤5中,通过因果结构图构建慢性病结局预测模型的具体方法为:构建大小N*N的全局邻接矩阵 ,其中,如果因果结构图中特征i与特征j构成j指向i的单向边,则 第i行第j列的元素为1,否则为0;利用全局邻接矩阵 构建2层图卷积神经网络,用于预测患者慢性病结局的发生情况。

6.根据权利要求5所述的基于因果结构不变性的多中心慢性病预测装置,其特征在于,所述利用全局邻接矩阵 构建2层图卷积神经网络,用于预测患者慢性病结局的发生情况,采用公式如下:,

其中, 为患者的特征数据, 为患者慢性病的预测结局,ReLU()、 为激活函数, 、 为可训练的网络参数, 的计算公式为:,

为 的度数矩阵,为单位对角矩阵。

7.根据权利要求6所述的基于因果结构不变性的多中心慢性病预测装置,其特征在于,通过损失 使用交叉熵,来更新 、 ,损失 的具体公式为:,

其中, 为第i个医疗中心患者人数, 为第i个医疗中心第j个患者的实际结局,发生表示1,未发生表示0, 为第i个医疗中心第j个患者的数据经过模型后的拟合结局。

8.一种基于因果结构不变性的多中心慢性病预测装置,其特征在于,包括:数据采集模块,用于采集不同医疗中心慢性病患者的特征数据;

数据预处理模块,用于患者数据预处理;

多中心图结构学习模块,包括图神经网络训练单元和异质性映射单元,图神经网络训练单元用于拟合多中心患者结局,并通过拟合误差和不同医疗中心的因果关系之间的差异得出多中心因果关系,异质性映射单元将该因果关系进行噪声处理后得到多中心通用的因果结构;

因果结构表示模块,用于通过因果结构建立更为直观的因果结构图;

慢性病预测模块,用于通过因果结构图构建慢性病结局预测模型,将患者的特征数据输入预测模型后得出慢性病的预测结局。

说明书 :

一种基于因果结构不变性的多中心慢性病预测装置

技术领域

[0001] 本发明属于医疗健康信息技术领域,尤其涉及一种基于因果结构不变性的多中心慢性病预测装置。

背景技术

[0002] 近年来,慢性病发病率呈现上升趋势, 严重影响居民健康和生活质量,造成巨大疾病负担。根据世界卫生组织最新数据显示,2019年全球死于慢性病的人数高达4100万,占全球死亡人数的74%;并且慢性病占前十大死亡原因的80%,占全球年死亡数的44%。我国慢性病患病和发病率亦呈快速上升之势,2019年我国居民因心脑血管疾病、癌症、慢性呼吸系统疾病和糖尿病等四类重大慢性病导致的过早死亡率为16.5%。因此,对慢性病发病风险进行早期预测,以便积极采取干预措施,对疾病的防控工作十分重要。
[0003] 随着人工智能技术的不断发展,机器学习和深度学习的算法被广泛应用于健康医疗领域。现有的慢性病诊断及预测方法主要使用支持向量机、逻辑回归、朴素贝叶斯等基于机器学习的方法。比如利用传感器和年龄等数据,通过支持向量机方法预测肺癌分期情况;利用基因表达信息,通过随机森林、k近邻方法进行慢性肝炎阶段分析等。然而在现实生活中,由于地域、人口、干预类型、数据统计方法等方面的差异,导致医疗中心之间的数据具有异质性。若直接使用这些方法对异质性数据进行跨中心分析,会导致相同模型针对不同地域、不同医疗中心的预测结果差异较大。然而同一个场景的医学决策问题的内在的因果关联应该是稳定的,不应随数据分布差异而变化。
[0004] 传统机器学习方法基于相关关系拟合函数与数据,无法区分临床特征与疾病发生之间具有因果关系还是伪相关关系。基于伪相关关系构建的模型系统,无法解释其预测背后真正的原因。传统的可解释性方法,如变量重要性方法SHAP,可以通过计算SHAP值来细分预测结果,评估每个特征对结果的影响程度。
[0005] 公告号为CN106169165B的中国发明专利公开了一种面向诊疗数据的症状层次关联及预测方法,该方法基于层次主题模型构建症状主题层次空间,采用最大概率准则实现诊疗记录及病人的层次化映射,并综合考虑病人的诊疗地点、年龄、性别、时间多种属性信息实现疾病的动态预测。
[0006] 公布号为CN113744870A的中国发明专利申请公开了一种病案首页主要诊断预测系统及方法,该系统从数据库中提取病人关联的临床数据,对病人关联的临床数据进行数据清洗与特征构建,获得病人关联的特征,存入建模样本库;然后根据病人关联的特征对病人进行第一轮分组,获得病人关联第一轮分组标识;针对每个第一轮分组分别生成对应的病案首页主要诊断预测模型;当所述系统接收到主要诊断预测请求时,依据请求携带的新增病人标识,依次通过数据组织模块和人群分组模块,获得新增病人关联第一轮分组标识,然后调用该第一轮分组标识对应的主要诊断预测模型,获得该新增病人的主要诊断预测结果。
[0007] 这些方法仅针对独立变量对结局的影响进行相关性的解释,缺乏对变量与结果之间因果结构的解释性分析。

发明内容

[0008] 为了解决现有技术的不足,本发明提供了一种基于因果结构不变性的多中心慢性病预测装置,通过多层图神经网络挖掘数据中更深层次的因果逻辑关系,并通过因果结构表示模块进行了因果关系的可视化展示,解决了传统方法可解释性不足的问题,为慢性病决策支持提供更加合理的决策建议。
[0009] 一种基于因果结构不变性的多中心慢性病预测装置,包括以下步骤:
[0010] 步骤1,采集数据:采集不同医疗中心慢性病患者的数据;
[0011] 步骤2,数据预处理:将步骤1得到患者数据进行预处理,对齐不同医疗中心具有相同语义概念、不同表述的特征,建立多中心患者的特征数据集合和多中心患者的结局集合;
[0012] 步骤3,得到多中心场景下稳定的因果结构矩阵:根据单个中心患者特征数据与其结局,建立每个中心的因果关系,使患者的特征数据在该因果关系下拟合其结局,根据患者的特征数据在该因果关系下的拟合结局对比实际结局的差异性,与不同医疗中心的因果关系之间的差异性共同修正该因果关系,当拟合误差和不同中心因果关系之间的差异达到预设要求时,该因果关系经噪声处理后得到多中心场景下稳定的因果结构矩阵;
[0013] 步骤4,因果结构矩阵转化:通过因果结构矩阵建立更为直观的因果结构图;
[0014] 步骤5,预测结局:通过因果结构图构建慢性病结局预测模型,将患者的特征数据输入预测模型后得出慢性病的预测结局。
[0015] 优选地,在步骤3中,建立每个中心的因果关系,使患者的特征数据在该因果关系下拟合其结局,根据患者的特征数据在该因果关系下的拟合结局对比实际结局的差异性,与不同医疗中心的因果关系之间的差异性共同修正该因果关系通过图神经网络训练进行。
[0016] 进一步地,图神经网络为二层网络结构,第一层神经网络逐一将单个中心患者的特征数据集合与随机初始化的该中心因果关系卷积,激活后得到第一层网络输出,第二层图神经网络将该中心因果关系与第一层网络输出卷积,激活后得到第二层网络输出,两层图神经网络后接全连接网络,激活后得到拟合结局,其中的网络参数和因果关系使用优化器优化。
[0017] 进一步地,修正采用公式为:
[0018]
[0019]
[0020]
[0021]
[0022] 其中,c为医疗中心个数, 为第i个医疗中心患者人数, 为第i个医疗中心第j个患者的实际结局,发生表示1,未发生表示0, 为第i个医疗中心第j个患者的数据经过模型后的拟合结局,为多中心拟合结局,Y为多中心实际结局, 为多中心拟合结局和实际结局的差异, 表示不同医疗中心的因果关系 的方差,为不同中心因果关系的差异。
[0023] 优选地,在步骤3中,当拟合误差和不同中心因果关系之间的差异达到预设要求时,因果关系通过异质性映射反推得出因果结构矩阵 ,其中表示不同医疗中心的因果关系。
[0024] 优选地,在步骤4中,通过因果结构矩阵建立更为直观的因果结构图的具体方法为:因果结构矩阵的中位数为 ,如果因果结构矩阵中第i行第j列的元素 ,则代表特征j是特征i的原因,在因果结构图中特征i与特征j构成j指向i的单向边,若则特征i与特征j不构成因果关系。
[0025] 优选地,在步骤5中,通过因果结构图构建慢性病结局预测模型的具体方法为:构建大小N*N的全局邻接矩阵 ,其中,如果因果结构图中特征i与特征j构成j指向i的单向边,则 第i行第j列的元素为1,否则为0;利用全局邻接矩阵 构建2层图卷积神经网络,用于预测患者慢性病结局的发生情况。
[0026] 进一步地,利用全局邻接矩阵 构建2层图卷积神经网络,用于预测患者慢性病结局的发生情况,采用公式如下:
[0027]
[0028]
[0029] 其中, 为患者的特征数据,为患者慢性病的预测结局,ReLU()、 为激活函数, 、 为可训练的网络参数, 的计算公式为:
[0030]
[0031]
[0032] 为 的度数矩阵,为单位对角矩阵。
[0033] 进一步地。通过损失 使用交叉熵,来更新 、 ,损失 的具体公式为:
[0034]
[0035]
[0036] 其中, 为第i个医疗中心患者人数, 为第i个医疗中心第j个患者的实际结局,发生表示1,未发生表示0, 为第i个医疗中心第j个患者的数据经过模型后的拟合结局。
[0037] 本发明还提供了一种基于因果结构不变性的多中心慢性病预测装置,包括:
[0038] 数据采集模块,用于采集不同医疗中心慢性病患者的特征数据;
[0039] 数据预处理模块,用于患者数据预处理;
[0040] 多中心图结构学习模块,包括图神经网络训练单元和异质性映射单元,图神经网络训练单元用于拟合多中心患者结局,并通过拟合误差和不同医疗中心的因果关系之间的差异得出多中心因果关系,异质性映射单元将该因果关系进行噪声处理后得到多中心通用的因果结构;
[0041] 因果结构表示模块,用于通过因果结构建立更为直观的因果结构图;
[0042] 慢性病预测模块,用于通过因果结构图构建慢性病结局预测模型,将患者的特征数据输入预测模型后得出慢性病的预测结局。
[0043] 本发明的有益效果:
[0044] 针对传统预后预测模型难以处理异质性数据的问题,本发明利用不同医疗中心之间因果结构不变的特性,提出了多中心慢性病预测装置,通过异质性映射模块模拟不同医疗中心之间的特征的异质关系,通过多层图神经网络学习不变的因果结构,提高了模型针对不同分布样本的泛化性,能够对异质的临床数据通过可靠的因果关系来进行慢性病预后预测。
[0045] 针对传统机器学习可解释性方法仅定量描述变量重要性而无法提供定性的因果结构性解释的问题,本发明挖掘数据中更深层次的因果逻辑关系,解决了传统方法可解释性不足的问题,为慢性病决策支持提供更加合理的决策建议。

附图说明

[0046] 图1为本发明提供的基于因果结构不变性的多中心慢性病预测方法的流程图。
[0047] 图2为本发明提供的多中心患者特征数据的示意图。
[0048] 图3为本发明提供的多中心图结构学习过程图。
[0049] 图4为本发明提供的图神经网络的网络结构。
[0050] 图5为本发明提供的因果结构图 的生成过程示意图。
[0051] 图6为本发明提供的慢性病预测装置的模块示意图。

具体实施方式

[0052] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0053] 图1是本发明提供的基于因果结构不变性的多中心慢性病预测方法的流程图,如图1所示,本发明提供的多中心慢性病预测方法,包括以下步骤:
[0054] 步骤1,采集数据:采集不同医疗中心慢性病患者的特征数据。
[0055] 实施例中,采集患者的特征数据类型包括人口统计学、手术、用药、化验、诊断和日常监测数据等方面。特征信息具体地包括:
[0056] 人口统计学信息包括性别、年龄、民族、地区等;用药信息包括并发症用药等;化验信息包括血常规、肝功能等;诊断信息包括慢性病诊断、并发症以及合并症等;日常监测信息包括血压、体重等;基于上述特征信息,采集慢性病患者的原始数据。
[0057] 步骤2,数据预处理:将步骤1中得到的患者数据进行预处理。
[0058] 实施例中,基于慢性病患者的原始数据,统一不同医疗中心概念相同、表述不同的特征,同时,删除原始数据中的不合理数据、错误数据、重复数据等,采用均值填充缺失的连续型数据,采用众数填充缺失的离散型数据。
[0059] 如图2所示为多中心患者特征数据的示意图。将所有医疗中心慢性病相关的特征合集记为F,其中包含特征类型的数量记为N。将第i个医疗中心患者的特征数据集合表示成大小为 的二维矩阵 ,其中, 为第i个医疗中心的患者数量, 每1列表示第i个医疗中心某1个患者所有类型特征的取值, 每1行表示第i个医疗中心某1种类型特征所有患者的取值。
[0060] 特征合集F中还包含患者的实际结局y,当未发生结局事件时,y取值为0;当发生结局事件时,y取值为1。以慢性肾病心血管事件预测为例,y表示慢性肾病患者1年内是否会发生心血管事件,当y的取值为1时,表示该患者发生了心血管事件,当y的取值为0时,表示该患者未发生心血管事件。第i个医疗中心的患者结局集合表示为长度为 的向量 ,的每一列表示第i个医疗中心某1个患者的目标结局事件。可以理解的,当 的一行全为0时,表示第i个医疗中心慢性病患者中尚未发生目标结局事件的患者的特征数据集合。
[0061] 参与统计的医疗中心的数量记为c,多中心患者的特征数据集合为,多中心患者结局集合为 。以患者的特征数据集合和结局集合构建患者图数据{X,Y}。
[0062] 步骤3,得到多中心场景下稳定的因果结构矩阵:根据单个中心患者特征数据与其结局,建立每个中心的因果关系,使患者的特征数据在该因果关系下拟合其结局,根据患者的特征数据在该因果关系下的拟合结局对比实际结局的差异性,与不同医疗中心的因果关系之间的差异性共同修正该因果关系,当拟合误差和不同中心因果关系之间的差异达到预设要求时,该因果关系经噪声处理后得到多中心通用的因果结构矩阵。
[0063] 实施例中,在多中心场景下学习特征合集F中N个类型特征间的因果关系,基于图神经网络训练和异质性映射来学习多中心场景下稳定的因果结构矩阵 。如图3所示为多中心图结构学习过程图,其中将第i个医疗中心特征间的因果关系结构表示为可学习的关系邻接矩阵 ,多中心因果关系为 。
[0064] 如图4所示为本发明图神经网络的网络结构。随机初始化多中心因果关系A,利用图神经网络,通过拟合多中心患者结局Y来学习多中心因果关系A。具体地,图神经网络为二层网络结构,第一层神经网络将多中心因果关系A和多中心患者的特征数据X卷积,之后接1 1
sigmoid激活得到第一层网络输出X ,记作X=sigmoid(AX)=sigmoid(A1X1,…, AiXi,…,
1
AcXc)。第二层图神经网络将多中心因果关系A与第一层网络输出X卷积,之后接sigmoid激
2 2 1
活得到第二层网络输出X ,记作X =sigmoid(AX )= sigmoid(A1sigmoid(A1X1),…,Aisigmoid(AiXi),…,Acsigmoid(AcXc))。两层图神经网络后接全连接网络,sigmoid激活后
2
得到拟合结局 =sigmoid(XW+B)。其中,W、B为网络参数。
[0065] 训练过程中根据患者的特征数据在该因果关系下的拟合结局对比实际结局的差异性,与不同医疗中心的因果关系之间的差异性共同修正多中心因果关系A,修正采用的公式为:
[0066]
[0067]
[0068]
[0069]
[0070] 其中,c为医疗中心个数, 为第i个医疗中心患者人数, 为第i个医疗中心第j个患者的实际结局,发生表示1,未发生表示0, 为第i个医疗中心第j个患者的数据经过模型后的拟合结局,为拟合结局,Y为实际结局, 为拟合结局和实际结局的差异, 表示不同医疗中心的 的方差, 为不同中心因果关系的差异。
[0071] 使用优化器如adam算法优化多中心因果关系A、网络参数W、网络参数 。模型稳定收敛后即可求得多中心因果关系A。
[0072] 多中心因果关系A通过异质性映射反推得出因果结构矩阵 。具体地,第i个医疗中心的关系邻接矩阵 可表示为因果结构矩阵 的异质性映射,即。多中心因果关系A= =  ,令噪声
表示为noise 。因此,多中心因果关系 。由于
项使得不同医疗中心的方差尽可能小,所以令因果结构矩阵 时总噪声最小,即因果结构矩阵 。
[0073] 步骤4,因果结构矩阵转化:通过因果结构矩阵建立更为直观的因果结构图。
[0074] 实施例中,如图5所示为因果结构图 的生成过程示意图,其中特征1、特征2、特征3、特征4和特征5分别表示 的5个类型不同的特征。因果结构图 是一个有向图,表示各特征与结局之间的因果结构。具体地,因果结构矩阵 的中位数为 ,如果因果结构矩阵 中第i行第j列的元素 ,则代表特征j是特征i的原因,在因果结构图 中特征i与特征j构成j→i的单向边,反之,若 则不构成因果关系。如图5所示的因果结构矩阵 中,第2行第4列的元素为1,则特征3是特征1的原因,在 中特征1与特征3构成特征3→特征1的单向边;第4行第2列的元素为0,则特征1不是特征3的原因。
[0075] 步骤5,预测结局:通过因果结构图构建慢性病结局预测模型,将患者的特征数据输入预测模型后得出慢性病的预测结局。
[0076] 实施例中,构建大小N*N的全局邻接矩阵 。其中,如果因果结构图 中特征i与特征j构成i→j的单向边,则 第j行第i列的元素为1,否则为0。利用全局邻接矩阵 可以构建2层图卷积神经网络,用于预测慢性病结局事件的发生情况。具体地,公式如下:
[0077]
[0078]
[0079] 其中, 为患者的特征数据,为患者慢性病的预测结局,ReLU()、 为激活函数, 、 为可训练的网络参数, 的计算公式为:
[0080]
[0081]
[0082] 为 的度数矩阵,为单位对角矩阵。
[0083] 损失 使用交叉熵,用来更新 、 ,具体公式:
[0084]
[0085]
[0086] 其中, 为第i个医疗中心患者人数, 为第i个医疗中心第j个患者的实际结局,发生表示1,未发生表示0。 为第i个医疗中心第j个患者的数据经过模型后的拟合结局。使用优化器如adam算法优化网络参数 、 。模型稳定收敛后即可用于慢性病结局的预测。
[0087] 基于以上方法,实施例还提供了一种基于因果结构不变性的多中心慢性病预测装置,包括存储器和一个或多个处理器,存储器中存储有可执行代码,一个或多个处理器执行所述可执行代码,以实现上述方法,包括以下步骤:
[0088] 步骤1,采集数据;
[0089] 步骤2,数据预处理;
[0090] 步骤3,得到多中心场景下稳定的因果结构矩阵;
[0091] 步骤4,因果结构矩阵转化;
[0092] 步骤5,预测结局。
[0093] 图6还提供了一种基于因果结构不变性的多中心慢性病预测装置,包括数据采集模块、数据预处理模块、多中心图结构学习模块、因果结构表示模块和慢性病预测模块。
[0094] 数据采集模块用于采集不同医疗中心慢性病患者的特征数据,并将特征数据传递至数据预处理模块。
[0095] 具体地,采集患者的特征数据类型包括人口统计学、手术、用药、化验、诊断和日常监测数据等方面。特征信息具体地包括:人口统计学信息包括性别、年龄、民族、地区等;用药信息包括并发症用药等;化验信息包括血常规、肝功能等;诊断信息包括慢性病诊断、并发症以及合并症等;日常监测数据包括血压、体重等;基于上述特征信息,采集慢性病患者的原始数据。
[0096] 数据预处理模块将慢性病患者的特征数据进行预处理,并传递至多中心结构学习模块。
[0097] 具体地,数据预处理模块将数据采集模块得到患者数据进行预处理,对齐不同医疗中心具有相同语义概念、不同表述的特征,建立多中心患者的特征数据集合X和多中心患者的结局集合Y。
[0098] 多中心结构学习模块用于拟合多中心患者结局,并通过拟合误差和不同医疗中心的因果关系之间的差异得出多中心因果关系,该因果关系经噪声处理后得到多中心场景下稳定的因果结构。
[0099] 具体地,多中心学习模块包括图神经网络训练单元和异质性映射单元,图神经网络训练单元拟合多中心患者实际结局Y来学习多中心因果关系A。
[0100] 首先随机初始化多中心因果关系A,利用图神经网络,通过拟合多中心患者结局Y来学习多中心因果关系A。图神经网络为二层网络结构,第一层神经网络将多中心因果关系1 1
A和多中心患者的特征数据集合X卷积,之后接sigmoid激活得到第一层网络输出X ,记作X=sigmoid(AX)= sigmoid(A1X1,…, AiXi,…,AcXc)。第二层图神经网络经多中心因果关系A与
1 2 2 1
第一层网络输出X 卷积,之后接sigmoid激活得到第二层网络输出X ,记作X=sigmoid(AX)=sigmoid(A1sigmoid(A1X1),…,Aisigmoid(AiXi),…, Acsigmoid(AcXc))。两层图神经网络
2
后接全连接网络,sigmoid激活后得到拟合结局 =sigmoid(XW+B)。其中,W、B为网络参数。
[0101] 训练过程中根据患者的特征数据在该因果关系下的拟合结局对比实际结局的差异性,与不同医疗中心的因果关系之间的差异性共同修正多因果关系A,具体公式为:
[0102]
[0103]
[0104]
[0105]
[0106] 其中,c为医疗中心个数, 为第i个医疗中心患者人数, 为第i个医疗中心第j个患者的实际结局,发生表示1,未发生表示0, 为第i个医疗中心第j个患者的数据经过模型后的拟合结局,为拟合结局,Y为实际结局, 为拟合结局和实际结局的差异, 表示不同医疗中心的 的方差, 为不同中心因果关系的差异。
[0107] 使用优化器如adam算法优化多中心因果关系A、网络参数W、网络参数 。模型稳定收敛后即可求得多中心因果关系A。
[0108] 异质性映射单元将多中心因果关系A反推得出因果结构矩阵 。多中心因果关系矩阵A= = ,令噪声表示为noise 。因此,多中心因果关系矩阵 。由于 项
使得不同医疗中心的方差尽可能小,所以令因果结构矩阵 时总噪声最小,即因果结构矩阵 。
[0109] 因果结构表示模块将因果结构矩阵转换为更为直观的因果结构图 ,提高了慢性病的因果结构的解释性并降低了因果结构的理解难度。
[0110] 具体地,因果结构图 是一个有向图,表示各特征与结局之间的因果结构。因果结构矩阵 的中位数为 ,如果因果结构矩阵 中第i行第j列的元素 ,则代表特征j是特征i的原因,在因果结构图 中特征i与特征j构成j→i的单向边,反之,若 则不构成因果关系。
[0111] 慢性病预测模块通过因果结构图构建慢性病结局预测模型,将患者的特征数据输入预测模型后得出慢性病的预测结局。
[0112] 具体地,构建大小N*N的全局邻接矩阵 。其中,如果因果结构图 中特征i与特征j构成i→j的单向边,则 第j行第i列的元素为1,否则为0。利用全局邻接矩阵 可以构建2层图卷积神经网络,用于预测慢性病结局事件的发生情况。公式如下:
[0113]
[0114]
[0115] 其中, 为患者的特征数据,为患者慢性病的预测结局,ReLU()、 为激活函数, 、 为可训练的网络参数, 的计算公式为:
[0116]
[0117]
[0118] 为 的度数矩阵,为单位对角矩阵。
[0119] 损失 使用交叉熵,用来更新 、 ,具体公式:
[0120]
[0121]
[0122] 其中, 为第i个医疗中心患者人数, 为第i个医疗中心第j个患者的实际结局,发生表示1,未发生表示0。 为第i个医疗中心第j个患者的数据经过模型后的拟合结局。使用优化器如adam算法优化网络参数 、 。模型稳定收敛后即可用于慢性病结局的预测。
[0123] 尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。