一种检测BRAF V600E突变的近红外光谱方法转让专利

申请号 : CN201910332553.X

文献号 : CN110763652B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 范琦张雪王娅兰杨洋

申请人 : 重庆医科大学

摘要 :

本发明公开了一种检测BRAF V600E突变的近红外光谱方法,先收集BRAF V600E野生型与突变型的癌组织切片,测量其近红外光谱,采用化学计量学方法进行光谱数据处理,采用模式识别分析方法建立检测BRAF V600E野生型与突变型的模型;再取未知BRAF V600E突变与否的癌组织切片,按相同方法采集光谱并进行光谱数据处理,最后应用所建模型进行预测。本发明方法能够灵敏、特异、准确、耐用、简便、快速、无损和低费用的检测癌组织BRAF V600E野生型与突变型,适用于可能发生BRAF V600E突变的多种癌组织,也适用于病理组织从储存到病理诊断过程中多个环节的组织形式,可用于临床辅助诊断。

权利要求 :

1.一种检测BRAF V600E突变的近红外光谱方法,所述方法是非治疗和/或诊断目的的,其特征在于,包括以下步骤:(1)收集并记录BRAF V600E野生型与突变型的癌组织切片;

‑1

(2)设置透反射光谱测量参数:分辨率8cm 、扫描次数不低于64次、扫描范围12000~‑1

4000cm ,测量步骤(1)所得每片切片的近红外透反射光谱,每次扫描切片前以相同参数扫描并扣除背景;

‑1

(3)对步骤(2)所得光谱,不经预处理,选择建模光谱范围为9000~6800cm 和6500~‑1

4000cm ,采用PCA降维,按照方差贡献率由高到低的顺序以及累积方差贡献率大于85%选取前4~8个主成分作为建模特征变量,采用对向传播人工神经网络CP‑ANN建立BRAF V600E野生型与突变型的预测模型;

(4)取未知BRAF V600E突变与否的癌组织切片,按照步骤(2)中的透反射光谱测量参数测量其光谱,按照步骤(3)中的操作方法进行光谱数据处理,然后应用步骤(3)中的预测模型预测该癌组织切片是否发生BRAF V600E突变;

步骤(1)和步骤(4)中所述癌组织为大肠癌组织或/和甲状腺癌组织;

步骤(1)中所述切片为石蜡切片、脱蜡切片或/和苏木素‑伊红染色切片。

2.根据权利要求1所述的一种检测BRAF V600E突变的近红外光谱方法,其特征在于:步骤(2)中测量光谱时是在每片切片的3个不同位置各测量一张光谱,每张光谱均用于建模。

3.根据权利要求1所述的一种检测BRAF V600E突变的近红外光谱方法,其特征在于:步骤(2)中测量切片的光谱时,是取BRAF V600E野生型与突变型的癌组织切片交替测量。

4.根据权利要求1所述的一种检测BRAF V600E突变的近红外光谱方法,其特征在于:步骤(3)中所述模型检测性能的评价参数包括临床诊断性能和模型性能,所述临床诊断性能包括灵敏度、特异度和准确度,所述模型性能包括校正集正判率、交叉验证正判率和验证集正判率。

说明书 :

一种检测BRAF V600E突变的近红外光谱方法

技术领域

[0001] 本发明涉及人体基因突变的检测方法,更具体地说,涉及一种检测BRAF V600E突变的近红外光谱分析方法。

背景技术

[0002] 鼠类肉瘤滤过性毒菌致癌同源体B1(v‑raf murine sarcoma viral oncogene homolog B1,BRAF)是一个重要的丝氨酸/苏氨酸蛋白激酶,由它参与的丝裂原活化蛋白激酶(mitogen‑activated protein kinase,MAPK)信号通路调控细胞的增殖、分化和凋亡。BRAF基因突变常见于结直肠癌、甲状腺癌和黑色素瘤等恶性肿瘤中,目前已发现有超过30种BRAF突变类型,其中V600E突变被认为是最常见的,其导致蛋白质产物中第600位的缬氨酸(V)被谷氨酸(E)替代。
[0003] 对BRAF V600E突变的检测,在癌症诊断(参考文献:Guoren Deng,Ian Bell,Suzanne Crawley,et al.BRAF Mutation Is Frequently Present in Sporadic Colorectal Cancer with Methylated hMLH1,But Not in Hereditary Nonpolyposis Colorectal Cancer[J].Clinical Cancer Research,2004,10:191‑195.)、靶向治疗(参考文献:Federica Di Nicolantonio,Miriam Martini,Francesca Molinari,et al.Wild‑Type BRAF Is Required for Response to Panitumumab or Cetuximab in Metastatic Colorectal Cancer[J].Journal of Clinical Oncology,2008,26:5705‑5712.)、癌症预后(参考文献:Jolien Tol,JeroenR.Dijkstra,Marjolein Klomp,et al.Markers for EGFR Pathway Activation as Predictor of Outcome in Metastatic Colorectal Cancer Patients Treated with or without Cetuximab[J].European Journal of Cancer,2010,46:1997‑2009.)等方面均具有重要意义。
[0004] 目前用于临床检测BRAF V600E突变的常用方法包括免疫组织化学(IHC)结合显微镜检查、聚合酶链式反应(PCR)和基因测序。然而,在IHC‑显微技术中,IHC是一个多步骤过程,很容易受各种因素的影响而导致染色失败,包括全阴性、全阳性、背景太深、阳性对照染色良好但阳性样品未染色、染色强度不均匀。此外,在显微镜观察中,由于形态学方法的主观性和复杂性,突变检测的准确性严重受限于病理学家的经验。另一方面,聚合酶链反应(PCR)和基因测序至少存在操作繁琐、耗时和高费用等缺陷。因此,建立一种灵敏、特异、准确、耐用、简便、快速、无损和低费用的方法来辅助检测BRAF V600E突变是一个亟待解决的问题。

发明内容

[0005] 本发明的目的在于克服现有技术存在的不足,提供一种灵敏、特异、准确、耐用、简便、快速、无损和低费用的检测BRAF V600E突变的近红外光谱分析方法。
[0006] 经研究,本发明的技术方案如下:
[0007] 一种检测BRAF V600E突变的近红外光谱方法,包括以下步骤:
[0008] (1)收集并记录BRAF V600E野生型与突变型的癌组织切片;
[0009] (2)测量步骤(1)所得每片切片的近红外光谱;
[0010] (3)对步骤(2)所得光谱,采用化学计量学方法进行光谱数据处理,采用模式识别分析方法建立BRAF V600E野生型与突变型的预测模型;
[0011] (4)取未知BRAF V600E突变与否的癌组织切片,按照步骤(2)所述方法测量近红外光谱,按照步骤(3)所述方法进行光谱数据处理,然后应用步骤(3)所建模型预测该癌组织切片是否发生BRAF V600E突变。
[0012] 本发明方法是基于BRAF V600E野生型与突变型的特征信息即缬氨酸与谷氨酸的结构差异来对癌组织中BRAF V600E突变进行检测,所以本发明方法不受疾病部位的影响,即本发明方法适用于可能发生BRAF V600E突变的多种癌组织切片,如大肠癌组织切片、甲状腺癌组织切片、黑色素瘤组织切片等。本发明提供了运用基于大肠癌BRAF V600E野生型和突变型组织切片建立的模型准确预测甲状腺癌BRAF V600E突变型组织切片的实施例,以及运用基于大肠癌BRAF V600E野生型和甲状腺癌BRAF V600E突变型组织切片建立的模型准确预测大肠癌BRAF V600E突变型的实施例,这些实施例都证实了上述结论。
[0013] 优选的,一种检测BRAF V600E突变的近红外光谱方法,包括以下步骤:
[0014] (1)收集并记录BRAF V600E野生型与突变型的癌组织切片;
[0015] (2)设置透反射光谱测量参数:分辨率8cm‑1、扫描次数不低于64次、扫描范围12000‑1~4000cm ,测量步骤(1)所得每片切片的近红外透反射光谱,每次扫描切片前以相同参数扫描并扣除背景;
[0016] (3)对步骤(2)所得光谱,不经或经化学计量学预处理,选择建模光谱范围,采用主成分分析法即PCA降维,根据模型性能选取1个或多个主成分作为建模特征变量,采用非线性模式识别分析方法建立BRAF V600E野生型与突变型的预测模型;
[0017] (4)取未知BRAF V600E突变与否的癌组织切片,按照步骤(2)所述方法测量近红外光谱,按照步骤(3)所述方法进行光谱数据处理,然后应用步骤(3)所建模型预测该组织切片是否发生BRAF V600E突变。
[0018] 上述步骤(2)中的光谱测量模式和参数均经过了优选。只有采用适合于癌组织切片检测BRAF V600E突变的近红外光谱测量模式和参数,才能获得表征性能强的近红外光谱,从而为建立预测性能优良的BRAF V600E突变检测模型提供高质量的数据。
[0019] 由于癌组织切片较薄,样品信息较少,本发明优选测量癌组织切片的透反射光谱。测量时,分析光从积分球检测窗射出,穿透样品后在载玻片制样专用红外透反射光谱测量附件(专利申请号:201811655256.0)的金箔内表面被反射,在返回积分球检测窗的途中再次穿透样品,因此,透反射光谱中样品信号强度是透射光谱的两倍,大大提高了检测灵敏度。
[0020] 高的分辨率可以获得更多的数据,但同时也伴随着噪音的增加。为了确定最佳的‑1 ‑1 ‑1 ‑1 ‑1分辨率,本发明固定扫描次数为32次,分别以分辨率为2cm 、4cm 、8cm 、16cm 、32cm 对‑1 ‑1
同一切片平行测量6次,综合方差大小及方差光谱的平滑程度得出分辨率为8cm 和16cm‑1
时光谱最佳,但由于16cm 的分辨率较低,切片信息数据较少,因此,光谱测量的分辨率优选‑1
为8cm 。
[0021] 增加扫描次数可降低光谱的噪音,但光谱的采集时间会相应增加。为了确定最佳‑1的扫描次数,本发明固定分辨率为8cm ,分别以扫描次数为16、32、64、128次对同一切片平行测量6次,结果发现,扫描次数为16次和32次时光谱的方差较大,扫描次数为64次和128次时光谱的方差无明显差异,而扫描次数越多,光谱的采集时间越长,因此,光谱测量的扫描次数优选为不低于64次。
[0022] 优选的,上述步骤(3)中所述模型检测性能的评价参数包括临床诊断性能和模型性能。临床诊断性能为灵敏度、特异度和准确度,模型性能为校正集正判率、交叉验证正判率和验证集正判率。本发明方法使用临床诊断性能和模型性能两类评价参数对所建模型进行评价,保证了所建模型具有良好的预测性能和实用性能。
[0023] 具体的,一种检测BRAF V600E突变的近红外光谱方法,包括以下步骤:
[0024] (1)收集并记录BRAF V600E野生型与突变型的癌组织切片;
[0025] (2)设置透反射光谱测量参数:分辨率8cm‑1、扫描次数不低于64次、扫描范围12000‑1~4000cm ,测量步骤(1)所得每片切片的近红外透反射光谱,每次扫描切片前以相同参数扫描并扣除背景;
[0026] (3)对步骤(2)所得光谱,不经预处理,选择建模光谱范围为9000~6800cm‑1和6500‑1~4000cm ,采用PCA降维,按照方差贡献率由高到低的顺序以及累积方差贡献率大于85%选取前4~8个主成分作为建模特征变量,采用对向传播人工神经网络即CP‑ANN方法建立BRAF V600E野生型与突变型的预测模型;
[0027] (4)取未知BRAF V600E突变与否的癌组织切片,按照步骤(2)所述方法测量近红外光谱,按照步骤(3)所述方法进行光谱数据处理,然后应用步骤(3)所建模型预测该组织切片是否发生BRAF V600E突变。
[0028] 上述步骤(3)中的光谱预处理方案、建模光谱范围和建模特征变量均为适于癌组织切片检测BRAF V600E突变的优选方案。建模光谱范围和建模特征变量的优化有助于提取癌组织中BRAF V600E野生型与突变型的特征信息以提高预测模型的特异性。本发明的实施例显示,在基于大肠癌组织切片和甲状腺癌组织切片的近红外透反射光谱建立BRAF V600E野生型与突变型的预测模型时,使用不同的光谱预处理方案、建模光谱范围和建模特征变量,所建模型的性能存在明显差异。
[0029] 具体的,上述方法的步骤(1)和步骤(4)中所述癌组织为大肠癌组织或/和甲状腺癌组织。本发明提供了基于大肠癌组织切片或/和甲状腺癌组织切片建立模型预测大肠癌组织切片或/和甲状腺癌组织切片中BRAF V600E野生型与突变型的实施例。从这些实施例可以看出,本发明方法可以大肠癌组织切片建模,也可以大肠癌组织切片和甲状腺癌组织切片组合建模,所建模型均能够灵敏、特异、准确地检测大肠癌组织切片和甲状腺癌组织切片中BRAF V600E野生型与突变型,校正集正判率、交叉验证正判率和验证集正判率均达到84.0%以上。
[0030] 具体的,上述方法的步骤(1)中所述癌组织切片可为石蜡切片、脱蜡切片或/和苏木素‑伊红即HE染色切片。以上三种组织切片是病理学诊断常用的组织切片形式,也代表了病理组织从基本的储存形式到免疫组化病理诊断的整个过程。本发明对三种组织切片进行了分别建模和组合建模,结果表明,以不同类型切片所建立的多个模型均能够灵敏、特异、准确地预测癌组织切片中的BRAF V600E野生型与突变型。由于石蜡切片是病理组织的基本储存形式,以其为检测样品无需进行繁琐耗时的样品前处理就可以快速、无损地进行临床辅助诊断,可先于病理诊断、分子诊断等复杂诊断进行,而且用石蜡切片建立的模型具有良好的临床诊断性能(特别是灵敏度100.0%)和最佳的模型性能,因此,优选癌组织切片为石蜡切片。
[0031] 优选的,上述方法的步骤(2)是在每片组织切片的3个不同位置各测量一张光谱,每张光谱均用于建模,以最大限度地利用组织切片中BRAF V600E野生型与突变型的特征信息,尽可能灵敏、特异、准确地进行检测。
[0032] 优选的,上述方法的步骤(2)中测量切片的光谱时,是取BRAF V600E野生型与突变型的癌组织切片交替测量。采用野生型与突变型不同类别样品交替测量的方式可避免因采用相同类别样品顺序测量可能导致的系统误差对所建模型的预测可靠性产生干扰。
[0033] 优选的,上述方法的步骤(3)中所述采用CP‑ANN方法建立的预测模型结构为12×12。CP‑ANN模型的结构对模型的拟合及预测性能有较大的影响,本发明研究结果显示,CP‑ANN模型结构为12×12时,模型性能优于10×10,与15×15基本相当,所以优选CP‑ANN结构为12×12。
[0034] 本发明是基于癌组织切片的近红外光谱,结合化学计量学技术,检测BRAF V600E野生型与突变型,具有以下优点:
[0035] 1)本发明方法不受疾病部位的影响,适用于可能发生BRAF V600E突变的多种癌组织切片,包括大肠癌组织切片、甲状腺癌组织切片、黑色素瘤组织切片;
[0036] 2)本发明方法不受癌组织切片形式的影响,适用于病理组织从储存到免疫组化病理诊断多个阶段的病理组织切片,即石蜡切片、脱蜡切片或/和HE染色切片,无需额外制备组织切片;尤其是以石蜡切片作为检测样品时,无需进行脱蜡、HE染色等繁琐、耗时的样品前处理就可以快速、无损地完成检测,可作为临床辅助诊断先于病理诊断、分子诊断等复杂诊断进行;
[0037] 3)本发明方法使用临床诊断性能和模型性能两类评价参数对所建模型进行评价,保证所建模型具有良好的预测性能和实用性能;
[0038] 4)本发明方法操作简便、快速(单张光谱测量时间以秒计)、无损、耐用性好、检测费用低,能够灵敏、特异、准确地检测癌组织中BRAF V600E野生型与突变型。

附图说明

[0039] 图1为大肠癌组织切片BRAF V600E野生型平均光谱与突变型平均光谱的差异图。
[0040] 图2为实施例1预测大肠癌BRAF V600E野生型与突变型的大肠癌石蜡切片最优CP‑ANN模型的分布图:白色区域代表野生型,灰色区域代表突变型;W和M分别代表野生型和突变型的校正集切片,w和m分别代表野生型和突变型的验证集切片。
[0041] 图3为实施例1预测甲状腺癌BRAF V600E突变的大肠癌石蜡切片最优CP‑ANN模型的分布图:白色区域代表野生型,灰色区域代表突变型;W和M分别代表野生型与突变型的校正集切片,w和m分别代表野生型和突变型的验证集切片,p代表甲状腺癌预测集切片。
[0042] 图4为实施例2预测大肠癌BRAF V600E野生型与突变型的大肠癌脱蜡切片最优CP‑ANN模型的分布图:白色区域代表野生型,灰色区域代表突变型;W和M分别代表野生型和突变型的校正集切片,w和m分别代表野生型和突变型的验证集切片。
[0043] 图5为实施例3预测大肠癌BRAF V600E野生型与突变型的大肠癌HE染色切片最优CP‑ANN模型的分布图:白色区域代表野生型,灰色区域代表突变型;W和M分别代表野生型与突变型的校正集切片,w和m分别代表野生型和突变型的验证集切片。
[0044] 图6为实施例6预测大肠癌与甲状腺癌BRAF V600E突变的大肠癌野生型与甲状腺癌突变型石蜡切片最优CP‑ANN模型的分布图:白色区域代表野生型,灰色区域代表突变型;W和M分别代表野生型与突变型的校正集切片,w和m分别代表野生型和突变型的验证集切片。
[0045] 图7为实施例7预测大肠癌与甲状腺癌BRAF V600E突变的大肠癌野生型与大肠癌和甲状腺癌突变型石蜡切片最优CP‑ANN模型的分布图:白色区域代表野生型,灰色区域代表突变型;W和M分别代表野生型与突变型的校正集切片,w和m分别代表野生型和突变型的验证集切片。

具体实施方式

[0046] 为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明的优选实施例进行详细的描述。
[0047] 优选实施例中使用的近红外光谱仪为Nicolet iS50 FT‑IR光谱仪(Thermo Fisher Scientific),配置积分球附件和载玻片制样专用红外透反射光谱测量附件(专利申请号:201811655256.0)。
[0048] 优选实施例中,所建模型检测性能的评价参数包括临床诊断性能和模型性能。临床诊断性能为灵敏度、特异度和准确度,模型性能为校正集正判率、交叉验证正判率和验证集正判率。计算临床诊断性能即灵敏度、特异度和准确度时,当1个样品的3张光谱的3个预测结果均为BRAF V600E野生型时,样品的最终检测结果为BRAF V600E野生型,否则为BRAF V600E突变型。换句话说,当1个样品的3张光谱的3个预测结果中至少有一个是BRAF V600E突变型时,样品的最终检测结果为BRAF V600E突变型。
[0049] 实施例1 基于大肠癌野生型与突变型建立的检测石蜡切片中BRAF V600E突变的近红外光谱方法
[0050] 1.样品的收集
[0051] 收集并记录来自不同患者的大肠癌组织石蜡切片共104片,其中包括52片BRAF V600E野生型和52片BRAF V600E突变型。
[0052] 2.光谱的测量
[0053] 将光谱仪预热2小时并通过校验后,设置光谱测量参数为分辨率8cm‑1、扫描次数64‑1次、扫描范围12000~4000cm ,将载玻片制样专用红外透反射光谱测量附件罩在置于积分球检测窗上的切片(载玻片向上)上方以完全遮蔽切片后,测量每片切片的近红外透反射光谱,每次扫描切片前以相同参数扫描并扣除背景,每片切片分别在3个不同位置各测量一张光谱,每张光谱均用于建模,BRAF V600E野生型与突变型组织切片交替测量。
[0054] 3.光谱特征变量的提取与建模
[0055] (1)光谱预处理方案的选择
[0056] 为了使所建模型具有优良的预测性能,对包括未处理即NP、多元散射校正即MSC、标准正则变换即SNV、一阶导数即FD、二阶导数即SD、Savitzky‑Golay平滑即SGS、Norris平滑即NDS的多种光谱预处理技术进行了筛选与组合,见表1中的模型1‑10。结果表明,所得光谱不经预处理时,所建模型的预测性能最优,如表1中的模型1。
[0057] (2)建模光谱范围的选择
[0058] 采用前述优选的光谱预处理方案,根据石蜡切片中BRAF V600E野生型与突变型的‑1近红外特征吸收的差异,如图1所示,人工优化建模光谱范围为9000~6800cm 和6500~‑1
4000cm 。比较表1中的模型1和13可以发现,选择不同建模光谱范围时,所建模型的性能存在明显差异。
[0059] (3)光谱数据的降维与主成分的选择
[0060] 对所选建模光谱范围内的光谱数据进行PCA降维,当使用不同的主成分建模时,模型的性能存在明显差异,如表1中的模型1、11和12,最终按照方差贡献率由高到低的顺序以及累积方差贡献率大于85%选取前6个主成分作为建模特征变量。
[0061] (4)模型的建立与验证
[0062] 采用CP‑ANN方法建立石蜡切片中BRAF V600E突变的预测模型。从10×10、12×12和15×15三种结构中筛选最优CP‑ANN模型结构,见表1中的模型1、14和15。结果发现,CP‑ANN模型的结构为12×12时,模型性能优于10×10与15×15,所以优选CP‑ANN模型结构为12×12。
[0063] 从52片BRAF V600E野生型和52片BRAF V600E突变型大肠癌组织石蜡切片中随机选取12片BRAF V600E野生型和12片BRAF V600E突变型作为验证集切片,其余为校正集切片。使用校正集与验证集光谱数据的主成分得分建立与验证检测石蜡切片中BRAF V600E野生型与突变型的CP‑ANN模型。结果显示,所建最优CP‑ANN模型(表1模型1)的临床诊断性能即灵敏度为100.0%、特异度为87.5%、准确度为93.8%,模型性能即校正集正判率为98.0%、交叉验证正判率为95.0%、验证集正判率为94.4%,说明该模型具有优良的检测性能,能够准确检测石蜡切片中BRAF V600E野生型与突变型。最优CP‑ANN模型的分布图如图2所示。
[0064] 表1 检测石蜡切片中BRAF V600E突变的CP‑ANN模型的主要建模参数与模型性能[0065]
[0066] 4.未知样品的预测
[0067] (1)未知样品为大肠癌组织石蜡切片
[0068] 取1片未知BRAF V600E突变与否的大肠癌组织石蜡切片,按照前述方法采集光谱并进行光谱数据处理,然后应用所建CP‑ANN模型进行BRAF V600E野生型与突变型预测。结果该大肠癌组织石蜡切片预测为BRAF V600E突变型,与荧光聚合酶链式反应(PCR)方法的检测结果一致,说明本实施例所建方法能够对大肠癌组织石蜡切片中BRAF V600E野生型与突变型进行准确检测。
[0069] (2)未知样品为甲状腺癌组织石蜡切片
[0070] 取8片未知BRAF V600E突变与否的甲状腺癌组织石蜡切片,按照前述方法采集光谱并进行光谱数据处理,然后应用所建CP‑ANN模型进行BRAF V600E野生型与突变型预测。结果显示:8片甲状腺癌组织石蜡切片均预测为BRAF V600E突变型,与各自的荧光PCR方法检测结果一致,说明本实施例所建方法能够对甲状腺癌组织石蜡切片中BRAF V600E野生型与突变型进行准确检测。预测甲状腺癌BRAF V600E突变的大肠癌石蜡切片最优CP‑ANN模型的分布图如图3所示。
[0071] 综合上述实验结果可知,基于大肠癌野生型与突变型建立的检测石蜡切片中BRAF V600E突变的近红外光谱方法不仅适用于大肠癌BRAF V600E突变型检测,也适用于甲状腺癌BRAF V600E突变型检测,一方面证实了本发明方法确实是基于BRAF V600E野生型与突变型的特征信息即缬氨酸与谷氨酸的结构差异来检测BRAF V600E突变,另一方面也证实了本发明方法不受病变部位的影响,适用于可能发生BRAF V600E突变的多种癌症如大肠癌、甲状腺癌、黑色素瘤的BRAF V600E突变检测。
[0072] 实施例2 基于大肠癌野生型与突变型建立的检测脱蜡切片中BRAF V600E突变的近红外光谱方法
[0073] 1.样品的收集
[0074] 收集并记录来自不同患者的大肠癌组织脱蜡切片共104片,其中包括52片BRAF V600E野生型和52片BRAF V600E突变型。
[0075] 2.光谱的测量
[0076] 同实施例1。
[0077] 3.光谱特征变量的提取与建模
[0078] (1)光谱预处理方案的选择
[0079] 为了使所建模型具有优良的预测性能,对包括NP、MSC、SNV、FD、SD、SGS、NDS的多种光谱预处理技术进行了筛选与组合,见表2中的模型1‑10。结果表明,所得光谱不经预处理时,所建模型的预测性能最优,如表2中的模型1。
[0080] (2)建模光谱范围的选择
[0081] 由于本实施例与实施例1均是基于BRAF V600E野生型与突变型的特征信息即缬氨酸与谷氨酸的结构差异来检测BRAF V600E突变,所以本实施例优选的建模光谱范围与实施‑1 ‑1例1相同,为9000~6800cm 和6500~4000cm ,如图1所示。
[0082] (3)光谱数据的降维与主成分的选择
[0083] 对所选建模光谱范围内的光谱数据进行PCA降维,当使用不同的主成分建模时,模型的性能存在明显差异,如表2中的模型1、11和12,最终按照方差贡献率由高到低的顺序以及累积方差贡献率大于85%选取前8个主成分作为建模特征变量。
[0084] (4)模型的建立与验证
[0085] 采用CP‑ANN方法建立脱蜡切片中BRAF V600E突变的预测模型。从10×10、12×12和15×15三种结构中筛选最优CP‑ANN模型结构,见表2中的模型1、14和15。结果发现,CP‑ANN模型的结构为12×12时,模型性能优于10×10与15×15,所以优选CP‑ANN模型结构为12×12。
[0086] 从52片BRAF V600E野生型和52片BRAF V600E突变型大肠癌组织脱蜡切片中随机选取12片BRAF V600E野生型和12片BRAF V600E突变型作为验证集切片,其余为校正集切片。使用校正集与验证集光谱数据的主成分得分建立与验证检测脱蜡切片中BRAF V600E野生型与突变型的CP‑ANN模型。结果显示,所建最优CP‑ANN模型(表2模型1)的临床诊断性能即灵敏度为100.0%、特异度为92.5%、准确度为96.3%,模型性能即校正集正判率为97.0%、交叉验证正判率为88.0%、验证集正判率为94.4%,说明该模型具有优良的检测性能,能够准确检测脱蜡切片中BRAF V600E野生型与突变型。最优CP‑ANN模型的分布图如图4所示。
[0087] 表2 检测脱蜡切片中BRAF V600E突变的CP‑ANN模型的主要建模参数与模型性能[0088]
[0089] 4.未知样品的预测
[0090] 取1片未知BRAF V600E突变与否的大肠癌组织脱蜡切片,按照前述方法采集光谱并进行光谱数据处理,然后应用所建CP‑ANN模型进行BRAF V600E野生型与突变型预测。结果该大肠癌组织脱蜡切片预测为BRAF V600E野生型,与荧光PCR方法的检测结果一致,说明本实施例所建方法能够对大肠癌组织脱蜡切片中BRAF V600E野生型与突变型进行准确检测。
[0091] 实施例3 基于大肠癌野生型与突变型建立的检测HE染色切片中BRAF V600E突变的近红外光谱方法
[0092] 1.样品的收集
[0093] 收集并记录来自不同患者的大肠癌组织HE染色切片共104片,其中包括52片BRAF V600E野生型和52片BRAF V600E突变型。
[0094] 2.光谱的测量
[0095] 同实施例1。
[0096] 3.光谱特征变量的提取与建模
[0097] (1)光谱预处理方案的选择
[0098] 为了使所建模型具有优良的预测性能,对包括NP、MSC、SNV、FD、SD、SGS、NDS的多种光谱预处理技术进行了筛选与组合,见表3中的模型1‑10。结果表明,所得光谱不经预处理时,所建模型的预测性能最优,如表3中的模型1。
[0099] (2)建模光谱范围的选择
[0100] 由于本实施例与实施例1均是基于BRAF V600E野生型与突变型的特征信息即缬氨酸与谷氨酸的结构差异来检测BRAF V600E突变,所以本实施例优选的建模光谱范围与实施‑1 ‑1例1相同,为9000~6800cm 和6500~4000cm ,如图1所示。
[0101] (3)光谱数据的降维与主成分的选择
[0102] 对所选建模光谱范围内的光谱数据进行PCA降维,当使用不同的主成分建模时,模型的性能存在明显差异,如表3中的模型1、11和12,最终按照方差贡献率由高到低的顺序以及累积方差贡献率大于85%选取前5个主成分作为建模特征变量。
[0103] (4)模型的建立与验证
[0104] 采用CP‑ANN方法建立HE染色切片中BRAF V600E突变的预测模型。从10×10、12×12和15×15三种结构中筛选最优CP‑ANN模型结构,见表3中模型1、14和15。结果发现,CP‑ANN模型的结构为12×12时,模型性能优于10×10,几乎与15×15相当,所以优选CP‑ANN模型结构为12×12。
[0105] 从52片BRAF V600E野生型和52片BRAF V600E突变型大肠癌组织HE染色切片中随机选取12片BRAF V600E野生型和12片BRAF V600E突变型作为验证集切片,其余为校正集切片。使用校正集与验证集光谱数据的主成分得分建立与验证检测HE染色切片中BRAF V600E野生型与突变型的CP‑ANN模型。结果显示,所建最优CP‑ANN模型(表3模型1)的临床诊断性能即灵敏度为100.0%、特异度为80.0%、准确度为90.0%,模型性能即校正集正判率为93.0%、交叉验证正判率为84.0%、验证集正判率为86.1%,说明该模型具有优良的检测性能,能够准确检测HE染色切片中BRAF V600E野生型与突变型。最优CP‑ANN模型的分布图如图5所示。
[0106] 表3 检测HE染色切片中BRAF V600E突变的CP‑ANN模型的主要建模参数与模型性能
[0107]
[0108] 4.未知样品的预测
[0109] 取1片未知BRAF V600E突变与否的大肠癌组织HE染色切片,按照前述方法采集光谱并进行光谱数据处理,然后应用所建CP‑ANN模型进行BRAF V600E野生型与突变型预测。结果该大肠癌组织HE染色切片预测为BRAF V600E突变型,与荧光PCR方法的检测结果一致,说明本实施例所建方法能够对大肠癌组织HE染色切片中BRAF V600E野生型与突变型进行准确检测。
[0110] 实施例4 基于大肠癌野生型与突变型建立的检测脱蜡切片和石蜡切片中BRAF V600E突变的近红外光谱方法
[0111] 1.样品的收集
[0112] 收集并记录来自不同患者的大肠癌组织切片共104片。其中,52片BRAF V600E野生型组织切片包括26片脱蜡切片和26片石蜡切片,52片BRAF V600E突变型组织切片包括26片脱蜡切片和26片石蜡切片。
[0113] 2.光谱的测量
[0114] 同实施例1。
[0115] 3.光谱特征变量的提取与建模
[0116] (1)光谱预处理方案的选择
[0117] 由实施例1和2可知,石蜡切片和脱蜡切片的最优光谱预处理方案均为不经预处理,所以本实施例的光谱预处理方案优选为不经预处理。
[0118] (2)建模光谱范围的选择
[0119] 由于本实施例与实施例1均是基于BRAF V600E野生型与突变型的特征信息即缬氨酸与谷氨酸的结构差异来检测BRAF V600E突变,所以本实施例优选的建模光谱范围与实施‑1 ‑1例1相同,为9000~6800cm 和6500~4000cm 。
[0120] (3)光谱数据的降维与主成分的选择
[0121] 对所选建模光谱范围内的光谱数据进行PCA降维,按照方差贡献率由高到低的顺序以及累积方差贡献率大于85%选取前5个主成分作为建模特征变量。
[0122] (4)模型的建立与验证
[0123] 采用CP‑ANN方法建立脱蜡切片和石蜡切片中BRAF V600E突变的预测模型。由实施例1和2可知,石蜡切片和脱蜡切片的最优CP‑ANN模型结构均为12×12,所以本实施例优选CP‑ANN模型结构为12×12。
[0124] 从52片BRAF V600E野生型和52片BRAF V600E突变型大肠癌组织切片中随机选取12片BRAF V600E野生型(6片脱蜡切片和6片石蜡切片)和12片BRAF V600E突变型(6片脱蜡切片和6片石蜡切片)作为验证集切片,其余为校正集切片。使用校正集与验证集光谱数据的主成分得分建立与验证检测脱蜡切片和石蜡切片中BRAF V600E野生型与突变型的CP‑ANN模型。结果显示,所建CP‑ANN模型的临床诊断性能即灵敏度为100.0%、特异度为
90.0%、准确度为95.0%,模型性能即校正集正判率为96.0%、交叉验证正判率为94.0%、验证集正判率为95.8%,说明该模型具有优良的检测性能,能够准确检测脱蜡切片和石蜡切片中BRAF V600E野生型与突变型。
[0125] 4.未知样品的预测
[0126] 分别取未知BRAF V600E突变与否的大肠癌组织石蜡切片1片和大肠癌组织脱蜡切片1片,按照前述方法采集光谱并进行光谱数据处理,然后应用所建CP‑ANN模型进行BRAF V600E野生型与突变型预测。结果该大肠癌组织石蜡切片和大肠癌组织脱蜡切片均预测为BRAF V600E突变型,与各自荧光PCR方法的检测结果一致,说明本实施例所建方法能够对大肠癌组织石蜡切片和脱蜡切片中BRAF V600E野生型与突变型进行准确检测。
[0127] 实施例5 基于大肠癌野生型与突变型建立的检测脱蜡切片和HE染色切片中BRAF V600E突变的近红外光谱方法
[0128] 1.样品的收集
[0129] 收集并记录来自不同患者的大肠癌组织切片共104片。其中,52片BRAF V600E野生型组织切片包括26片脱蜡切片和26片HE染色切片,52片BRAF V600E突变型组织切片包括26片脱蜡切片和26片HE染色切片。
[0130] 2.光谱的测量
[0131] 同实施例1。
[0132] 3.光谱特征变量的提取与建模
[0133] (1)光谱预处理方案的选择
[0134] 由实施例2和3可知,脱蜡切片和HE染色切片的最优光谱预处理方案均为不经预处理,所以本实施例的光谱预处理方案优选为不经预处理。
[0135] (2)建模光谱范围的选择
[0136] 由于本实施例与实施例1均是基于BRAF V600E野生型与突变型的特征信息即缬氨酸与谷氨酸的结构差异来检测BRAF V600E突变,所以本实施例优选的建模光谱范围与实施‑1 ‑1例1相同,为9000~6800cm 和6500~4000cm ,如图1所示。
[0137] (3)光谱数据的降维与主成分的选择
[0138] 对所选建模光谱范围内的光谱数据进行PCA降维,按照方差贡献率由高到低的顺序以及累积方差贡献率大于85%选取前7个主成分作为建模特征变量。
[0139] (4)模型的建立与验证
[0140] 采用CP‑ANN方法建立脱蜡切片和HE染色切片中BRAF V600E突变的预测模型。由实施例2和3可知,脱蜡切片和HE染色切片的最优CP‑ANN模型结构均为12×12,所以本实施例优选CP‑ANN模型结构为12×12。
[0141] 从52片BRAF V600E野生型和52片BRAF V600E突变型大肠癌组织切片中随机选取12片BRAF V600E野生型(6片脱蜡切片和6片HE染色切片)和12片BRAF V600E突变型(6片脱蜡切片和6片HE染色切片)作为验证集切片,其余为校正集切片。使用校正集与验证集光谱数据的主成分得分建立与验证检测脱蜡切片和HE染色切片中BRAF V600E野生型与突变型的CP‑ANN模型。结果显示,所建CP‑ANN模型的临床诊断性能即灵敏度为100.0%、特异度为
85.0%、准确度为92.5%,模型性能即校正集正判率为96.0%、交叉验证正判率为95.0%、验证集正判率为84.7%,说明该模型具有优良的检测性能,能够准确检测脱蜡切片和HE染色切片中BRAF V600E野生型与突变型。
[0142] 4.未知样品的预测
[0143] 分别取未知BRAF V600E突变与否的大肠癌组织HE染色切片1片和大肠癌组织脱蜡切片1片,按照前述方法采集光谱并进行光谱数据处理,然后应用所建CP‑ANN模型进行BRAF V600E野生型与突变型预测。结果该大肠癌组织HE染色切片和大肠癌组织脱蜡切片均预测为BRAF V600E突变型,与各自荧光PCR方法的检测结果一致,说明本实施例所建方法能够对大肠癌组织HE染色切片和脱蜡切片中BRAF V600E野生型与突变型进行准确检测。
[0144] 实施例1‑5建立的最优CP‑ANN模型的性能比较见表4。
[0145] 表4 样品类型与相应CP‑ANN模型的性能
[0146]
[0147] 由表4可以看出:
[0148] (1)实施例1‑5建立的检测石蜡切片、脱蜡切片、HE染色切片中BRAF V600E突变的5个CP‑ANN模型都能够灵敏、准确地预测大肠癌BRAF V600E野生型与突变型,5个模型的灵敏度都达到100.0%,说明本发明所建方法可用于癌组织不同类型切片中BRAF V600E突变的临床辅助诊断,同时也证明了癌组织中BRAF V600E野生型与突变型之间的差异可以通过近红外光谱进行表征。
[0149] (2)实施例4的校正集样品包括40个BRAF V600E突变型样品(20个脱蜡切片和20个石蜡切片)与40个BRAF V600E野生型样品(20个脱蜡切片和20个石蜡切片),这些样品之间存在两种类型的差异:第一种差异是BRAF V600E野生型与突变型的差异即缬氨酸与谷氨酸的结构差异,第二种差异是脱蜡切片与石蜡切片的差异即有无石蜡的差异。但实施例4所建模型相比实施例1所建模型具有更好的临床诊断性能,证明其是基于BRAF V600E野生型与突变型的差异来检测BRAF V600E突变,而不是基于脱蜡切片与石蜡切片的差异来检测BRAF V600E突变。
[0150] 同理,实施例5的校正集样品之间也存在两种类型的差异:第一种差异是BRAF V600E野生型与突变型的差异即缬氨酸与谷氨酸的结构差异,第二种差异是脱蜡切片与HE染色切片的差异即有无HE染色的差异,但实施例5所建模型相比实施例3所建模型具有更好的临床诊断性能,也证明了其是基于BRAF V600E野生型与突变型的差异而不是基于有无HE染色的差异来检测BRAF V600E突变。
[0151] (3)实施例2所建模型具有最佳的临床诊断性能,原因可能在于脱蜡切片的近红外光谱中没有来自石蜡或HE染色剂的干扰。实施例3所建模型具有最差的临床诊断性能,原因可能在于HE染色剂对样品近红外光谱吸收的干扰强于石蜡。但综合来看,实施例1使用的石蜡切片最适合于BRAF V600E突变的近红外临床辅助诊断,原因如下:①石蜡切片是病理组织的基本储存形式,直接以石蜡切片作为检测样品,则无需进行脱蜡、HE染色等繁琐、耗时的样品前处理就可以快速、无损地进行临床辅助诊断,检测后的石蜡切片可继续供其它临床检测使用。②使用石蜡切片建立的CP‑ANN模型具有良好的临床诊断性能:灵敏度为100.0%、特异性为87.5%、准确度为93.8%;同时,具有最佳的模型性能:校正集正判率为
98.0%、交叉验证正判率95.0%、验证集正判率94.4%。
[0152] 实施例6 基于大肠癌野生型与甲状腺癌突变型建立的检测石蜡切片中BRAF V600E突变的近红外光谱方法
[0153] 1.样品的收集
[0154] 收集并记录来自不同患者的大肠癌BRAF V600E野生型石蜡切片8片和甲状腺癌BRAF V600E突变型石蜡切片8片。
[0155] 2.光谱的测量
[0156] 同实施例1。
[0157] 3.光谱特征变量的提取与建模
[0158] (1)光谱预处理方案的选择
[0159] 为了使所建模型具有优良的预测性能,对包括NP、MSC、SNV、FD、SD、SGS、NDS的多种光谱预处理技术进行了筛选与组合。结果表明,所得光谱不经预处理时,所建模型的预测性能最优。
[0160] (2)建模光谱范围的选择
[0161] 由于本实施例与实施例1均是基于BRAF V600E野生型与突变型的特征信息即缬氨酸与谷氨酸的结构差异来检测BRAF V600E突变,所以本实施例优选的建模光谱范围与实施‑1 ‑1例1相同,为9000~6800cm 和6500~4000cm 。
[0162] (3)光谱数据的降维与主成分的选择
[0163] 对所选建模光谱范围内的光谱数据进行PCA降维,按照方差贡献率由高到低的顺序以及累积方差贡献率大于85%选取前4个主成分作为建模特征变量。
[0164] (4)模型的建立与验证
[0165] 采用CP‑ANN方法建立石蜡切片中BRAF V600E突变的预测模型。从10×10、12×12和15×15三种结构中筛选最优CP‑ANN模型结构。结果发现,CP‑ANN模型的结构为12×12时,模型性能优于10×10,与15×15基本相当,所以本实施例优选CP‑ANN模型结构为12×12。
[0166] 从8片BRAF V600E野生型大肠癌组织石蜡切片和8片BRAF V600E突变型甲状腺癌组织石蜡切片中分别取2片BRAF V600E野生型和2片BRAF V600E突变型作为验证集切片,其余为校正集切片。使用校正集与验证集光谱数据的主成分得分建立与验证检测石蜡切片中BRAF V600E野生型与突变型的CP‑ANN模型。结果显示,所建最优CP‑ANN模型的临床诊断性能即灵敏度为100.0%、特异度为100.0%、准确度为100.0%,模型性能即校正集正判率为100.0%、交叉验证正判率为97.0%、验证集正判率为91.7%,说明该模型具有优良的检测性能,能够准确检测不同癌组织中BRAF V600E野生型与突变型。最优CP‑ANN模型的分布图如图6所示。
[0167] 4.未知样品的预测
[0168] 分别取未知BRAF V600E突变与否的甲状腺癌组织石蜡切片1片和大肠癌组织石蜡切片2片,按照前述方法采集光谱并进行光谱数据处理,然后应用所建CP‑ANN模型进行BRAF V600E野生型与突变型预测。结果该甲状腺癌组织切片预测为BRAF V600E突变型,2片大肠癌组织切片中1片预测为BRAF V600E突变型,另1片预测为BRAF V600E野生型,与各自的荧光PCR方法检测结果一致,说明本实施例所建方法能够对大肠癌和甲状腺癌组织中BRAF V600E野生型与突变型进行准确检测。
[0169] 实施例7 基于大肠癌野生型与大肠癌、甲状腺癌突变型建立的检测石蜡切片中BRAF V600E突变的近红外光谱方法
[0170] 1.样品的收集
[0171] 收集并记录来自不同患者的大肠癌BRAF V600E野生型石蜡切片8片、大肠癌BRAF V600E突变型石蜡切片4片和甲状腺癌BRAF V600E突变型石蜡切片4片。
[0172] 2.光谱的测量
[0173] 同实施例1。
[0174] 3.光谱特征变量的提取与建模
[0175] (1)光谱预处理方案的选择
[0176] 为了使所建模型具有优良的预测性能,对包括NP、MSC、SNV、FD、SD、SGS、NDS的多种光谱预处理技术进行了筛选与组合。结果表明,所得光谱不经预处理时,所建模型的预测性能最优。
[0177] (2)建模光谱范围的选择
[0178] 由于本实施例与实施例1均是基于BRAF V600E野生型与突变型的特征信息即缬氨酸与谷氨酸的结构差异来检测BRAF V600E突变,所以本实施例优选的建模光谱范围与实施‑1 ‑1例1相同,为9000~6800cm 和6500~4000cm ,如图1所示。
[0179] (3)光谱数据的降维与主成分的选择
[0180] 对所选建模光谱范围内的光谱数据进行PCA降维,按照方差贡献率由高到低的顺序以及累积方差贡献率大于85%选取前4个主成分作为建模特征变量。
[0181] (4)模型的建立与验证
[0182] 采用CP‑ANN方法建立石蜡切片中BRAF V600E突变的预测模型。从10×10、12×12和15×15三种结构中筛选最优CP‑ANN模型结构。结果发现,CP‑ANN模型的结构为12×12时,模型性能优于10×10,与15×15基本相当,所以本实施例优选CP‑ANN模型结构为12×12。
[0183] 从8片BRAF V600E野生型石蜡切片(大肠癌)和8片BRAF V600E突变型石蜡切片(大肠癌和甲状腺癌各4片)中分别取2片BRAF V600E野生型和2片BRAF V600E突变型(大肠癌和甲状腺癌各1片)作为验证集切片,其余为校正集切片。使用校正集与验证集光谱数据的主成分得分建立与验证检测石蜡切片中BRAF V600E野生型与突变型的CP‑ANN模型。结果显示,所建最优CP‑ANN模型的临床诊断性能即灵敏度为100.0%、特异度为100.0%、准确度为100.0%,模型性能即校正集正判率为100.0%、交叉验证正判率为94.0%、验证集正判率为
91.7%,说明该模型具有优良的检测性能,能够准确检测不同癌组织中BRAF V600E野生型与突变型。最优CP‑ANN模型的分布图如图7所示。
[0184] 4.未知样品的预测
[0185] 分别取未知BRAF V600E突变与否的甲状腺癌组织石蜡切片1片和大肠癌组织石蜡切片2片,按照前述方法采集光谱并进行光谱数据处理,然后应用所建CP‑ANN模型进行BRAF V600E野生型与突变型预测。结果该甲状腺癌组织预测为BRAF V600E突变型,2片大肠癌组织中1片预测为BRAF V600E突变型,另1片预测为BRAF V600E野生型,均与各自的荧光PCR方法检测结果一致,说明本实施例所建方法能够对不同部位的癌组织中BRAF V600E野生型与突变型进行准确检测。
[0186] 实施例1、6和7均是检测石蜡切片中BRAF V600E突变的近红外光谱方法,只是建模样品的癌症部位或/和基因型不同,其各自建立的最优CP‑ANN模型的性能比较见表5。
[0187] 表5 癌症类型与相应CP‑ANN模型的性能
[0188]
[0189] 由表5可以看出:
[0190] 实施例6使用大肠癌BRAF V600E野生型石蜡切片与甲状腺癌BRAF V600E突变型石蜡切片进行建模,所建CP‑ANN模型的临床诊断性能与模型性能均好。实施例6使用的建模样品包含了两种类型的差异,即①BRAF V600E野生型与突变型之间的差异,②大肠癌与甲状腺癌之间的差异。实施例6的实验结果显示其所建CP‑ANN模型不仅能够准确预测用于建模的大肠癌BRAF V600E野生型石蜡切片和甲状腺癌BRAF V600E突变型石蜡切片,还能够准确预测未用于建模的大肠癌BRAF V600E突变型石蜡切片。从而再次证明了本发明方法是基于BRAF V600E野生型与突变型之间的差异进行的检测,因为如果其是基于大肠癌与甲状腺癌之间的差异进行的检测,则大肠癌BRAF V600E突变型石蜡切片便会被预测为大肠癌的野生型,但事实并非如此,大肠癌BRAF V600E突变型石蜡切片被准确预测为突变型。
[0191] 实施例7使用大肠癌BRAF V600E野生型石蜡切片与大肠癌BRAF V600E突变型、甲状腺癌BRAF V600E突变型石蜡切片进行建模,所建CP‑ANN模型的临床诊断性能与模型性能均较好,说明本发明方法能够对不同部位癌组织进行准确检测。
[0192] 综上所述,本发明方法是基于癌组织中BRAF V600E野生型与突变型之间的差异进行的检测,能够对不同部位癌组织BRAF V600E野生型与突变型进行准确检测,不受疾病部位的干扰,适用于可能发生BRAF V600E突变的多种癌组织切片的辅助诊断。
[0193] 最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管通过参照本发明的优选实施例已经对本发明进行了描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离所附权利要求书所限定的本发明的保护范围。