一种胃癌错配修复基因缺陷的预测方法转让专利

申请号 : CN202211204717.9

文献号 : CN115294231B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 程向东佟雅涵徐志远胡灿

申请人 : 浙江省肿瘤医院

摘要 :

本发明关于肿瘤诊断技术领域,具体涉及一种胃癌错配修复基因缺陷的预测方法,包括:获得患者临床信息;获得患者CT图像;从CT图像中提取得到放射组学特征;依据所述放射组学特征得到放射组学标签;将临床信息和放射组学标签输入预测模型进行计算;依据输出结果预测胃癌错配修复基因缺陷。提供了一种仅仅应用易于术前获取的临床信息和提取自CT图像的放射组学特征的胃癌错配修复基因缺陷的预测方法,本方法预测效能较好,是一种可靠的、无创的胃癌术前预测DNA错配修复缺陷的方法,便于推广,易于应用。

权利要求 :

1.一种胃癌错配修复基因缺陷的预测方法,其特征在于包括:S100、获得患者临床信息;

S200、获得患者CT图像;

S300、从CT图像中提取得到放射组学特征;

S400、依据所述放射组学特征得到放射组学标签;

S500、依据临床信息和放射组学标签构建胃癌错配修复基因预测模型,所述胃癌错配修复基因预测模型根据临床信息和放射组学标签进行胃癌错配修复基因的预测;

所述放射组学特征包括original_shape_Maximum2DDiameterColumn和original_firstorder_Median;

所述放射组学标签具体是Radscore=0.666*original_shape_Maximum2DDiameterColumn+(‑0.283)*original_firstorder_Median +(‑0.747);

所述临床信息包括年龄、肿瘤位置和性别;

所述预测模型是

Nomoscore=Intercept*(‑7.56566042486333)+Age*0.127948643930096+Location*(‑1.49110528477808)+Sex*1.64766133092359+Radscore*2.22277808425775;

其中,Intercept取1;Age 是患者年龄,取具体年龄数值;Location是肿瘤位置,肿瘤位置在胃窦部时Location=0,肿瘤位置在胃体部时Location=1,肿瘤位置在贲门时Location=

2;Sex是患者性别,患者性别为男性时Sex=0,患者性别为女性时Sex=1;Radscore是放射组学标签。

2.根据权利要求1所述的方法,其特征在于:所述从CT图像中提取得到放射组学特征的具体步骤是:S310、将CT图像导入影像学特征提取平台,提取影像组学特征;

S320、对已勾画病灶的感兴趣区域和其周边区域内提取的特征进行特征稳定性检验;

S330、利用类内相关算法过滤出对感兴趣区域变化较小的不稳定特征;

S340、通过将病灶感兴趣区域的边界扩展一个图像像素来实现对病灶感兴趣区域的扩展;

S350、最后使用最大相关最小冗余(mRMR)和最小绝对收缩和选择算子(LASSO)方法进行特征选择以确定放射组学特征。

3.根据权利要求1或2所述的方法,其特征在于:所述依据临床信息和放射组学标签构建胃癌错配修复基因预测模型的具体步骤是:S510、将临床信息和放射组学标签导入R软件,采用最大相关最小冗余(mRMR)、最小绝对收缩和选择算子方法进行特征选择;

S520、利用logistic回归分析构建放射组标签Radscore;

S530、建立包含临床信息和放射组学标签的列线图模型;

S540、依据临床信息和放射组学标签对模型进行训练。

4.根据权利要求1或2所述的方法,其特征在于:所述CT图像是上腹部或全腹部增强CT图像。

5.根据权利要求1所述的方法,其特征在于:所述胃癌错配修复基因预测模型根据临床信息和放射组学标签进行胃癌错配修复基因的预测具体是以‑0.9649085作为预测模型值的分界值,当Nomoscore≥‑0.9649085时病例判定为胃癌DNA错配修复缺陷,当Nomoscore<‑0.9649085时病例判定为无胃癌DNA错配修复缺陷。

6.一种计算机装置,包括处理器和存储计算机程序的存储器,其特征在于:所述计算机程序经所述处理器运行时执行权利要求1‑5任一项所述方法。

7.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质存储有计算机指令,所述指令使计算机执行权利要求1‑5任一项所述胃癌错配修复基因缺陷的预测方法。

说明书 :

一种胃癌错配修复基因缺陷的预测方法

技术领域

[0001] 本发明涉及肿瘤诊断技术领域,更具体来说,涉及胃癌DNA错配修复缺陷预测方法,通过结合放射组学特征和临床危险因素,提供一种预测胃癌错配修复基因缺陷的模型,以此模型提供一种胃癌错配修复基因缺陷的预测方法。

背景技术

[0002] 根据中国国家癌症中心的统计数据,2016年胃癌的发病率和死亡率在全国恶性肿瘤中排名第三。早期胃癌的症状隐匿,常被忽视,因此在中国许多胃癌患者在诊断时已是局部晚期。自1993年在遗传性非息肉病性结直肠癌中发现微卫星不稳定性(microsatellite instability, MSI)以来,在膀胱癌、肺癌等恶性肿瘤中也可检测到MSI。越来越多的临床试验证实MSI在胃癌(GC)的发生和预后中发挥着重要作用。基因错配修复不仅可通过修复在DNA复制和重组过程中产生的碱基错配来维持基因组的稳定性,还能通过识别DNA损伤介导细胞的凋亡,因此细胞的错配修复功能与化疗疗效也有密切相关性,甚至于肿瘤错配修复状况已成为选择治疗方法的重要决定因素。癌症基因组图谱已经确定MSI或DNA错配修复缺陷(dMMR)是GC的第二分子亚型的标志。胃癌错配修复基因状态的检测对临床决策至关重要,因为它可以识别不同治疗反应和预后的患者。2021年胃癌NCCN指南中建议,所有初诊胃癌患者均应采用基于聚合酶链反应(PCR)的分子检测或免疫组化(ICH)的DNA错配修复(MMR)蛋白检测。但仍有许多患者未检测。DNA错配修复缺陷的测试是昂贵的,并且在不同的主要模态之间的解释存在观察者之间的差异。如果能在术前预测错配修复基因在胃癌中的表达状态,对于治疗方案的选择、预后的评估以及生活质量的提高都具有重要意义。对于GC患者来说,开发一种客观、广泛、经济、有效、无创、前置的检测方法是非常重要的。
[0003] 放射组学可以获得比传统CT图像更多的信息,放射组学的兴起使影像学数据转化为高维特征数据成为可能,生物信息学从原始图像中提取的多种定量特征可以预测肿瘤潜在的生物学行为。近年来,许多研究发现某些放射学特征具有诊断和预后价值。在放射基因组学领域,其影像学特征与遗传特征密切相关。预后差的肿瘤也往往具有较大的肿瘤组织基因组异质性。放射基因组学是在放射组学基础上的进一步发展,它假设微观层面的基因组异质性可以表现为肿瘤的异质性,肿瘤微环境的变化可以表现在形态学特征和宏观图像上。因此,放射组学的应用为解决传统活检方法的局限性提供了一条新的途径。
[0004] 本发明力图解决这些和本领域中的其他待解决的需要。

发明内容

[0005] 为解决上述背景技术中提及的至少一种技术问题,本发明的目的旨在提供一种仅仅应用易于术前获取的临床信息和提取自CT图像的放射组学特征的胃癌错配修复基因缺陷的预测方法,本方法预测效能较好,是一种可靠的、无创的胃癌术前预测DNA错配修复缺陷的方法,便于推广,易于应用。
[0006] 在一个方面,本发明针对一种胃癌错配修复基因缺陷的预测方法,包括:
[0007] S100、获得患者临床信息;
[0008] S200、获得患者CT图像;
[0009] S300、从CT图像中提取得到放射组学特征;
[0010] S400、依据所述放射组学特征得到放射组学标签;
[0011] S500、依据临床信息和放射组学标签构建胃癌错配修复基因预测模型,所述胃癌错配修复基因预测模型根据临床信息和放射组学标签进行胃癌错配修复基因的预测。
[0012] 在一个具体实施例中,所述临床信息包括年龄、肿瘤位置和性别。
[0013] 在一个具体实施例中,所述CT图像是上腹部或全腹部增强CT图像。
[0014] 在一个具体实施例中,所述放射组学特征包括original_shape_Maximum2DDiameterColumn和original_firstorder_Median。
[0015] 在一个具体实施例中,所述从CT图像中提取得到放射组学特征的具体步骤是:
[0016] S310、将CT图像导入影像学特征提取平台,提取影像组学特征;
[0017] S320、对已勾画病灶的感兴趣区域和其周边区域内提取的特征进行特征稳定性检验;
[0018] S330、利用类内相关算法过滤出对感兴趣区域变化较小的不稳定特征;
[0019] S340、通过将病灶感兴趣区域的边界扩展一个图像像素来实现对病灶感兴趣区域的扩展;
[0020] S350、最后使用最大相关最小冗余(mRMR)和最小绝对收缩和选择算子(LASSO)方法进行特征选择以确定放射组学特征。
[0021] 在另一个具体实施例中,所述影像学特征提取平台包括YITU AI Enabler、3DSlicer或pyradiomics。
[0022] 在一个具体实施例中,所述放射组学标签具体是Radscore=0.666*original_shape_Maximum2DDiameterColumn+(‑0.283)*original_firstorder_Median +(‑0.747)。
[0023] 在另一个具体实施例中,所述依据临床信息和放射组学标签构建胃癌错配修复基因预测模型的具体步骤是:
[0024] S510、将临床信息和放射组学标签导入R软件,采用最大相关最小冗余(mRMR)、最小绝对收缩和选择算子方法进行特征选择;
[0025] S520、利用利用logistic回归分析构建放射组标签Radscore;
[0026] S530、建立包含临床信息和放射组学标签的列线图模型;
[0027] S540、依据临床信息和放射组学标签对模型进行训练。
[0028] 首创性的,本发明选取了两个与胃癌DNA错配修复缺陷最具相关性的放射组学特征,并依据其权重构建了放射组学标签,旨在揭示放射组学特征背后隐藏的肿瘤特性;然后依据放射组学标签和术前易于获得的三种临床信息年龄、肿瘤位置和性别构建胃癌错配修复基因预测模型,并将其用于胃癌错配修复基因的预测,便于临床应用,可作为胃癌术前预测DNA错配修复缺陷的一种可靠的、无创的、准确的方法。
[0029] 在一个具体实施例中,所述胃癌错配修复基因预测模型是
[0030] Nomoscore=Intercept*(‑7.56566042486333)
[0031] +Age*0.127948643930096
[0032] +Location*(‑1.49110528477808)
[0033] +Sex*1.64766133092359
[0034] +Radscore*2.22277808425775;
[0035] 其中,Intercept取1;Age 是患者年龄,取具体年龄数值;Location是肿瘤位置;Sex是患者性别;Radscore是放射组学标签。
[0036] 在一个具体实施例中,所述肿瘤位置在胃窦部时Location=0,肿瘤位置在胃体部时Location=1,肿瘤位置在贲门时Location=2。
[0037] 在一个具体实施例中,所述患者性别为男性时Sex=0,患者性别为女性时Sex=1。
[0038] 在一个具体实施例中,所述胃癌错配修复基因预测模型根据临床信息和放射组学标签进行胃癌错配修复基因的预测具体是以‑0.9649085作为预测模型值的分界值,当Nomoscore≥‑0.9649085时病例判定为胃癌DNA错配修复缺陷,当Nomoscore<‑0.9649085时病例判定为无胃癌DNA错配修复缺陷。
[0039] 本发明中,仅应用胃癌患者临床信息如年龄、肿瘤位置和性别以及提取自CT图像的放射组学特征,输入预测模型并依据输出结果即可预测胃癌患者胃癌错配修复基因缺陷,用于胃癌患者DNA错配修复缺陷的术前预测,且本发明方法是无创的、可靠的、低成本的,便于推广,易于应用,有利于临床的术前诊断及术后个体化治疗方案的制定,具有广泛的临床应用前景。
[0040] 在另一个方面,本发明针对前述所述方法在对胃癌患者胃癌错配修复基因缺陷预测中的用途。
[0041] 在另一个方面,本发明针对一种计算机装置,包括处理器和存储计算机程序的存储器,所述计算机程序经所述处理器运行时执行前述所述方法。
[0042] 在另一个方面,本发明针对一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述指令使计算机执行前述所述胃癌错配修复基因缺陷的预测方法。
[0043] 在符合本领域常识的基础上,上述各优选条件,可以相互组合,得到具体实施方式。
[0044] 本发明的有益效果为:
[0045] 1)选择了临床因素方面只包含三个易于术前获取的因素(性别、年龄、肿瘤位置)以及两个与胃癌DNA错配修复缺陷最具相关性的放射组学特征,其易于从术前的CT图像中获得,并依据放射组学特征权重构建了放射组学标签,旨在揭示放射组学特征背后隐藏的肿瘤特征。
[0046] 2)依据本发明方法计算得到的预测结果ROC曲线,其AUC值为0.93,具有较好的预测效能,而且预测结果有正有负,说明三种临床因素及放射组学标签与疾病是成正或者负相关的。
[0047] 3)本发明方法可以作为胃癌术前预测DNA错配修复缺陷的一种可靠的、无创的方法,便于推广,易于应用,有利于临床的术前诊断及术后个体化治疗方案的制定,具有广泛的临床应用前景。
[0048] 本发明为实现上述目的而采用了上述技术方案,弥补了现有技术的不足,设计合理,操作方便。

附图说明

[0049] 旨在为使得本领域技术人员更加迅速明确的了解本申请的上述和/或其他目的、特征、优点与实例,提供了部分附图,应当指出的是,构成本申请的说明书附图、示意性实施例及其说明用来提供对本申请的进一步理解,并不构成对本申请的不当限定。
[0050] 图1是胃癌错配修复基因缺陷的预测方法步骤流程图;
[0051] 图2是从CT图像中提取得到放射组学特征的流程图;
[0052] 图3是依据临床信息和放射组学标签构建胃癌错配修复基因预测模型的具体步骤流程图;
[0053] 图4是方法应用于预测胃癌错配修复基因缺陷流程图;
[0054] 图5是训练集的检验示意图;
[0055] 图6是内部验证集的检验示意图。

具体实施方式

[0056] 本领域技术人员可以借鉴本文内容,适当替换和/或改动工艺参数实现,然而特别需要指出的是,所有类似的替换和/或改动对本领域技术人员来说是显而易见的,它们都被视为包括在本发明。本发明所述内容已经通过较佳实例进行了描述,相关人员明显能在不脱离本发明内容、精神和范围内对本文所述的内容进行改动或适当变更与组合,来实现和应用本发明技术。
[0057] 应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
[0058] 需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制本申请的技术方案。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0059] 以下详细描述本发明。
[0060] 实施例1:
[0061] 如图1‑4所示,提供一种胃癌错配修复基因缺陷的预测方法,包括:
[0062] S100、获得患者临床信息;所述临床信息包括年龄Age(岁数)、肿瘤位置Location(胃窦部、胃体部或贲门)和性别Sex(男性或女性);
[0063] S200、获得患者CT图像;所述CT图像是患者上腹部或全腹部增强CT图像;
[0064] S300、从CT图像中提取得到放射组学特征;
[0065] S310、将CT图像导入影像学特征提取平台YITU AI Enabler,提取影像组学特征;
[0066] S320、对已勾画病灶的感兴趣区域和其周边区域内提取的特征进行特征稳定性检验;
[0067] S330、利用类内相关算法过滤出对感兴趣区域变化较小的不稳定特征;
[0068] S340、通过将病灶感兴趣区域的边界扩展一个图像像素来实现对病灶感兴趣区域的扩展;
[0069] S350、最后使用最大相关最小冗余(mRMR)和最小绝对收缩和选择算子(LASSO)方法进行特征选择以确定放射组学特征original_shape_Maximum2DDiameterColumn和original_firstorder_Median;
[0070] S400、依据所述放射组学特征得到放射组学标签Radscore;Radscore=0.666*original_shape_Maximum2DDiameterColumn+(‑0.283)*original_firstorder_Median +(‑0.747);
[0071] S500、依据临床信息和放射组学标签构建胃癌错配修复基因预测模型:
[0072] S510、将临床信息和放射组学标签导入R软件,采用最大相关最小冗余(mRMR)、最小绝对收缩和选择算子方法进行特征选择;
[0073] S520、利用利用logistic回归分析构建放射组标签Radscore;
[0074] S530、建立包含临床信息和放射组学标签的列线图模型;模型是
[0075] Nomoscore=Intercept*(‑7.56566042486333)
[0076] +Age*0.127948643930096
[0077] +Location*(‑1.49110528477808)
[0078] +Sex*1.64766133092359
[0079] +Radscore*2.22277808425775;
[0080] 其中,Intercept取1;Age 是患者年龄,取具体年龄数值;Location是肿瘤位置,肿瘤位置在胃窦部时Location=0,肿瘤位置在胃体部时Location=1,肿瘤位置在贲门时Location=2;Sex指患者性别,患者性别为男性时Sex=0,患者性别为女性时Sex=1;
[0081] S540、依据临床信息和放射组学标签对模型进行训练;
[0082] 所述胃癌错配修复基因预测模型根据临床信息和放射组学标签进行胃癌错配修复基因的预测:以‑0.9649085作为预测模型值的分界值,当Nomoscore≥‑0.9649085时病例判定为胃癌DNA错配修复缺陷,当Nomoscore<‑0.9649085时病例判定为无胃癌DNA错配修复缺陷。
[0083] 实施例2:
[0084] 在前述实施例的基础上,选取4位胃癌患者,所有患者均已经过免疫组化检测评估,结果证实患者1和2均为胃癌错配修复基因缺陷,而患者3和4均无胃癌错配修复基因缺陷,进行了相关胃癌DNA错配修复缺陷的预测,如表1所示。
[0085] 表1、预测胃癌DNA错配修复缺陷
[0086]
[0087] 注:dMMR:胃癌DNA错配修复缺陷,pMMR:无胃癌DNA错配修复缺陷。
[0088] 由表1可知,患者1和患者2通过模型预测结果显示他们的Nomoscore值均大于‑0.9649085,预测该两位患者均为胃癌DNA错配修复缺陷;而患者3和患者4的Nomoscore值均小于‑0.9649085,预测他们均为胃癌DNA错配修复缺陷;因此依据本申请方法对患者1‑4进行胃癌错配修复基因缺陷的预测均可得到正确的评估。本发明的预测方法仅通过3个易于获取的临床指标(性别、年龄、肿瘤位置)和一个放射组学标签(Radscore),即可实现可靠的、无创的胃癌术前DNA错配修复缺陷的预测,有利于临床的术前诊断及术后个体化治疗方案的制定。
[0089] 实施例3:
[0090] 在前述实施例的基础上,选取来自两家医院(医院1为训练集内部验证集(n=101);以医院2为外部验证集(n=60))的胃癌患者进行扩大测试,所有患者术前均行增强CT检查。
模型训练采用10倍交叉验证,在内部测试集中对放射组学、临床和放射临床模型的诊断性能进行验证。计算列线图ROC曲线下面积(AUC)。
[0091] 入组标准包括:
[0092] 1)术后病理证实为T3或T4期胃腺癌病例;
[0093] 2)术前1个月内行上腹部或全腹CT增强扫描;
[0094] 3)术后病理组织进行免疫组化检测评估DNA错配修复基因表达状态。
[0095] 排除标准包括:
[0096] 1)临床或病理资料不完整;
[0097] 2)病理类型为印戒细胞癌或粘液腺癌;
[0098] 3)既往接受其他治疗的患者;
[0099] 4)CT图像质量不佳,无法识别肿瘤病灶。
[0100] 所有统计分析均使用R软件(版本3.4.1;http://www.Rproject.org)完成。
[0101] 应用“glmnet”软件包进行LASSO logistic回归分析。
[0102] 多变量logistic回归分析使用“rms”包进行。
[0103] 使用“pROC”包进行放射组学模型的ROC图绘制。
[0104] 扩大测试结果如图5和图6所示,示出了模型构建过程中训练集及内部验证集对模型效能的检验,可以看出无论训练集曲线还是内部验证集曲线均为远离(0,0)‑(1,1)的曲线,而图5显示出训练集中受试者工作特性曲线下面积(AUC)达0.93,图6显示出内部验证集中受试者工作特性曲线下面积(AUC)达0.82,外部验证集中模型的曲线下面积(AUC)为0.80,表明模型具有较好的预测效能。
[0105] 本发明方法仅应用胃癌患者临床信息如年龄、肿瘤位置和性别以及提取自CT图像的放射组学特征,输入预测模型并依据输出结果即可预测胃癌患者胃癌错配修复基因缺陷,用于胃癌患者DNA错配修复缺陷的术前预测,且本发明方法是无创的、可靠的、低成本的,便于推广,易于应用,有利于临床的术前诊断及术后个体化治疗方案的制定,具有广泛的临床应用前景。
[0106] 上述实施例中的常规技术为本领域技术人员所知晓的现有技术,故在此不再详细赘述。
[0107] 本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
[0108] 尽管对本发明已作出了详细的说明并引证了一些具体实施例,但是对本领域熟练技术人员来说,只要不离开本发明的精神和范围可作各种变化或修正是显然的。
[0109] 以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
[0110] 本发明未尽事宜均为公知技术。