基于NGS的微小残留病变自动化测序分析方法及装置转让专利

申请号 : CN202010168265.8

文献号 : CN111261226B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 邓望龙吴增丁马圣肖念清任用

申请人 : 江苏先声医学诊断有限公司南京先声医学检验有限公司江苏先声医疗器械有限公司

摘要 :

本申请提供一种基于NGS的微小残留病变自动化测序分析方法、装置及应用。本申请通过自动化测序分析方法、装置追踪初诊患者优势克隆在复诊中的占比来判断患者的治疗情况,检测灵敏度高达10‑6,适于应用。

权利要求 :

1.一种基于NGS的微小残留病变自动化测序分析方法,其特征在于:所述方法包括:初诊生信分析和复诊生信分析,所述初诊生信分析步骤包括:

1)序列质控,获得序列集1,所述序列质控采用fastp v0.19.3,具体参数设置如下:a)length_required=30,低于该设置长度的reads被过滤掉;

b)poly_x_min_len=8,去掉尾端homopolymer X序列;

c)n_base_limit=15,去掉双端reads大于15个N碱基的序列;

d)cut_window_size=8,设置滑动窗口大小为8;

e)cut_mean_quality=20,设置滑动窗口平均碱基质量为20;

2)序列拼接,获得序列集2,序列拼接采用flash v1.2.11,具体参数设置如下:a)min-overlap=10,两端reads最小overlap的碱基数;

b)max-overlap=300,两端reads最大overlap的碱基数;

c)max-mismatch-density=0.25,两端reads允许错配的比例;

3)序列聚类,获得序列集3,所述3)序列聚类采用cd-hit v4.7具体参数设置如下:a)identity=1,短序列与长序列的一致性阈值;

b)coverage-s=0.9,短序列长度与长序列长度比值最小值;

c)coverage-aL=0.9,匹配区间长度与长序列长度比值;

d)coverage-aS=0.9,匹配区间长度与短序列长度比值;

进一步采用blast v2.7.1+在IGHV和IGHJ参考数据库中进行比对,若比对成功,则提取出代表序列的CDR3区域;基于提取的代表序列CDR3区域对序列集3’进行二次聚类,将含有相同CDR3类聚到一起,得到聚类序列集3;

4)优势克隆确定,所述4)优势克隆确定步骤为统计每类中含有的序列数,计算每种CDR3的占比,将占比大于5%的CDR3作为优势克隆;

所述复诊生信分析步骤包括:

5)序列质控,采用fastp v0.19.3,具体参数设置如下:a)length_required=30,低于该设置长度的reads被过滤掉;

b)poly_x_min_len=8,去掉尾端homopolymer X序列;

c)n_base_limit=15,去掉双端reads大于15个N碱基的序列;

d)cut_window_size=8,设置滑动窗口大小为8;

e)cut_mean_quality=20,设置滑动窗口平均碱基质量为20;

6)序列拼接,采用flash v1.2.11,具体参数设置如下:a)min-overlap=10,两端reads最小overlap的碱基数;

b)max-overlap=300,两端reads最大overlap的碱基数;

c)max-mismatch-density=0.25,两端reads允许错配的比例;

7)复诊定量,具体为:

基于Blast进行对步骤6获得的序列集进行序列比对,计算复诊定量结果,公式如下所示:其中,b为建库过程中投入质粒的序列数,m为内参CDR3检测到的质粒序列数,a为最开始投入建库的DNA量,n为基于Blast进行对步骤6获得的序列集进行序列比对所计算的数据中初诊优势CDR3数量。

2.一种基于NGS的微小残留病变自动化测序分析装置,其特征在于:所述分析装置包括,初诊生信分析模块和复诊生信分析模块,初诊生信分析模块包括:

1)序列质控模块,获得序列集1,序列质控模块采用fastp v0.19.3,具体参数设置如下:a)length_required=30,低于该设置长度的reads被过滤掉;

b)poly_x_min_len=8,去掉尾端homopolymer X序列;

c)n_base_limit=15,去掉双端reads大于15个N碱基的序列;

d)cut_window_size=8,设置滑动窗口大小为8;

e)cut_mean_quality=20,设置滑动窗口平均碱基质量为20;

2)序列拼接模块,获得序列集2,序列拼接模块采用flash v1.2.11,具体参数设置如下:a)min-overlap=10,两端reads最小overlap的碱基数;

b)max-overlap=300,两端reads最大overlap的碱基数;

c)max-mismatch-density=0.25,两端reads允许错配的比例;

3)序列聚类模块,获得序列集3,序列聚类模块采用cd-hit v4.7具体参数设置如下:a)identity=1,短序列与长序列的一致性阈值;

b)coverage-s=0.9,短序列长度与长序列长度比值最小值;

c)coverage-aL=0.9,匹配区间长度与长序列长度比值;

d)coverage-aS=0.9,匹配区间长度与短序列长度比值;

进一步采用blast v2.7.1+在IGHV和IGHJ参考数据库中进行比对,若比对成功,则提取出代表序列的CDR3区域;基于提取的代表序列CDR3区域对序列集3’进行二次聚类,将含有相同CDR3类聚到一起,得到聚类序列集3;

4)优势克隆确定模块,优势克隆确定模块为统计每类中含有的序列数,计算每种CDR3的占比,将占比大于5%的CDR3作为优势克隆;

复诊生信分析模块包括:

5)序列质控模块,获得序列集1’,序列质控模块采用fastp v0.19.3,具体参数设置如下:a)length_required=30,低于该设置长度的reads被过滤掉;

b)poly_x_min_len=8,去掉尾端homopolymer X序列;

c)n_base_limit=15,去掉双端reads大于15个N碱基的序列;

d)cut_window_size=8,设置滑动窗口大小为8;

e)cut_mean_quality=20,设置滑动窗口平均碱基质量为20;

6)序列拼接模块,获得序列集2’,序列拼接模块采用flash v1.2.11,具体参数设置如下:a)min-overlap=10,两端reads最小overlap的碱基数;

b)max-overlap=300,两端reads最大overlap的碱基数;

c)max-mismatch-density=0.25,两端reads允许错配的比例;

7)复诊定量模块,具体为:

基于Blast进行对步骤6获得的序列集进行序列比对,计算复诊定量结果,公式如下所示:其中,b为建库过程中投入质粒的序列数,m为内参CDR3检测的质粒序列数,a为最开始投入建库的DNA量,n为基于Blast进行对步骤6获得的序列集进行序列比对所计算的数据中初诊优势CDR3数量。

3.一种基于NGS的微小残留病变测序检测装置,其特征在于,包括权利要求2所述装置,还包括:捕获扩增模块:该模块针对B淋巴细胞的V区和J区的设计引物池,一种是设计于V区FR2区域的34种引物和设计于J区的4种引物所组成的引物池,另一种是设计于V区FR3区域的33种引物和设计于J区的4种引物所组成的引物池,这两种引物池能与所有的V区和J区进行特异性结合,能全面且特异性的捕获扩增VDJ区域,利用上述引物池对B淋巴细胞的V/J区进行第一轮PCR扩增,获得扩增产物;

建库测序模块:该模块对上述扩增产物进行二轮PCR扩增建库,基于常规流程制备上机文库,在Nextseq测序仪上进行测序。

说明书 :

基于NGS的微小残留病变自动化测序分析方法及装置

技术领域

[0001] 本申请涉及生物技术领域,具体涉及一种基于NGS的微小残留病变自动化测序分析方法及装置。

背景技术

[0002] 淋巴细胞有T淋巴细胞、B淋巴细胞、NK淋巴细胞等多种类型。相应淋巴细胞可发展成肿瘤。其中以B淋巴细胞肿瘤为主,包括急性淋巴细胞性白血病(ALL),慢性淋巴细胞性白血病(CLL),各种淋巴瘤和多发性骨髓瘤(MM)。近年来由于寿命延长,各种B淋巴细胞肿瘤,特别是CLL,淋巴瘤和MM的发病率都呈大幅增长趋势,如淋巴瘤,目前中国人发病率在4-6人/10万,而大都市如北京则在10-12人/10万,在人种相似的邻国日本则高达16人/10万。虽然淋巴瘤恶性程度各异,但易治疗后复发,而目前临床上的诊断主要依靠组织形态学和免疫组化,这些方法难以检测出少量肿瘤细胞的残留,然而,这些残存的肿瘤细胞往往就是白血病复发的根源。因此需要一种灵敏度更好的方法来检测微小残留病变,从而监控治疗及复发可能性。
[0003] B淋巴细胞从原始的胚系构型到分化成熟,其抗原受体Ig基因通过基因重排而形成有功能的基因。每一个B淋巴细胞或其克隆性后代均为特异的Ig基因重排,B淋巴细胞恶性肿瘤是由发生基因异常的B淋巴细胞单克隆增殖形成,故出现克隆性改变。B淋巴细胞Ig克隆性重排作为B淋巴细胞克隆特异性标志为约90%的B淋巴细胞恶性肿瘤提供了微小残留病变检测的靶分子。微小残留病变(MRD)是指在白血病经诱导化疗获完全缓解后或是骨髓移植治疗后,体内仍留有少量白血病细胞的状态。
[0004] 目前已有的MRD检测方法有不少缺陷,如传统的CT等影像学方法具有敏感性和特异性低、对人体有潜在危害等问题;流式细胞分选结果判断需要具备丰富的经验,且检测敏感度不高;ASO-PCR法需要针对每位患者进行个性化设计,费时费力,较适合进行复诊验证使用。另外这些方法无法对治疗中进化新出现的细胞亚克隆进行检测,易造成假阴性结果。
[0005] 得益于高通量测序的快速发展和应用,已有利用高通量测序应用于B淋巴细胞和MRD的检测,但目前针对B细胞的高通量测序数据,还没有一套成熟的分析流程,因此需要一套自动化的流程去处理大量的高通量测序数据。
[0006] 有鉴于此,提出本申请。

发明内容

[0007] 本申请的目的在于追踪初诊患者优势克隆在复诊中的占比来判断患者的治疗情况。
[0008] 为达到上述目的,本申请提供一种基于NGS的微小残留病变自动化测序分析方法,其特征在于:所述方法包括:初诊生信分析和复诊生信分析。
[0009] 在一些实施方式中,所述的所述初诊生信分析步骤包括:
[0010] 1)序列质控,获得序列集1;
[0011] 2)序列拼接,获得序列集2;
[0012] 3)序列聚类,获得序列集3;
[0013] 4)优势克隆确定;
[0014] 在一些实施方式中,所述复诊生信分析步骤包括:
[0015] 5)序列质控,获得序列集1;
[0016] 6)序列拼接,获得序列集2;
[0017] 7)复诊定量。
[0018] 在一些实施方式中,所述1)序列质控采用fastp v0.19.3,具体参数设置如下:
[0019] length_required=30,低于该设置长度的reads被过滤掉;
[0020] poly_x_min_len=8,去掉尾端homopolymer X序列;
[0021] n_base_limit=15,去掉双端reads大于15个N碱基的序列;
[0022] cut_window_size=8,设置滑动窗口大小为8;
[0023] cut_mean_quality=20,设置滑动窗口平均碱基质量为20;
[0024] 在一些实施方式中,所述2)序列拼接采用flash v1.2.11,具体参数设置如下:
[0025] min-overlap=10,两端reads最小overlap的碱基数;
[0026] max-overlap=300,两端reads最大overlap的碱基数;
[0027] max-mismatch-density=0.25,两端reads允许错配的比例;
[0028] 在一些实施方式中,所述3)序列聚类采用cd-hit v4.7具体参数设置如下:
[0029] identity=1,短序列与长序列的一致性阈值;
[0030] coverage-s=0.9,短序列长度与长序列长度比值最小值;
[0031] coverage-aL=0.9,匹配区间长度与长序列长度比值;
[0032] coverage-aS=0.9,匹配区间长度与短序列长度比值;
[0033] 在一些实施方式中,进一步采用blast v2.7.1+在IGHV和IGHJ参考数据库中进行比对,若比对成功,则提取出代表序列的CDR3区域;基于提取的代表序列CDR3区域对序列集3’进行二次聚类,将含有相同CDR3类聚到一起,得到聚类序列集3。
[0034] 在一些实施方式中,所述4)优势克隆确定步骤为统计每类中含有的序列数,计算每种
[0035] CDR3的占比,将占比大于5%的CDR3作为优势克隆。
[0036] 在一些实施方式中,所述5)序列质控采用fastp v0.19.3,具体参数设置如下:
[0037] length_required=30,低于该设置长度的reads被过滤掉;
[0038] poly_x_min_len=8,去掉尾端homopolymer X序列;
[0039] n_base_limit=15,去掉双端reads大于15个N碱基的序列;
[0040] cut_window_size=8,设置滑动窗口大小为8;
[0041] cut_mean_quality=20,设置滑动窗口平均碱基质量为20;
[0042] 在一些实施方式中,所述6)序列拼接采用flash v1.2.11,具体参数设置如下:
[0043] min-overlap=10,两端reads最小overlap的碱基数;
[0044] max-overlap=300,两端reads最大overlap的碱基数;
[0045] max-mismatch-density=0.25,两端reads允许错配的比例;
[0046] 在一些实施方式中,所述7)复诊定量具体为:
[0047] 基于Blast进行对步骤6获得的序列集2进行序列比对,计算复诊定量结果,公式如下所示:
[0048]
[0049]
[0050]
[0051] 其中,b为建库过程中投入质粒的序列数,m为内参CDR3检测的质粒序列数,a为最开始投入建库的DNA量,n为基于Blast进行对步骤3获得的序列集2进行序列比对所计算的数据中初诊优势CDR3数量。
[0052] 本申请还提供一种基于NGS的微小残留病变自动化测序分析装置,其特征在于:所述分析装置包括:初诊生信分析模块和复诊生信分析模块。
[0053] 在一些实施方式中,所述初诊生信分析模块包括:
[0054] 1)序列质控模块,获得序列集1;
[0055] 2)序列拼接模块,获得序列集2;
[0056] 3)序列聚类模块,获得序列集3;
[0057] 4)优势克隆确定模块;
[0058] 在一些实施方式中,所述复诊生信分析步骤包括:
[0059] 5)序列质控模块,获得序列集1;
[0060] 6)序列拼接模块,获得序列集2;
[0061] 7)复诊定量模块。
[0062] 在一些实施方式中,所述1)序列质控模块采用fastp v0.19.3,具体参数设置如下:
[0063] length_required=30,低于该设置长度的reads被过滤掉;
[0064] poly_x_min_len=8,去掉尾端homopolymer X序列;
[0065] n_base_limit=15,去掉双端reads大于15个N碱基的序列;
[0066] cut_window_size=8,设置滑动窗口大小为8;
[0067] cut_mean_quality=20,设置滑动窗口平均碱基质量为20;
[0068] 在一些实施方式中,所述2)序列拼接模块采用flash v1.2.11,具体参数设置如下:
[0069] min-overlap=10,两端reads最小overlap的碱基数;
[0070] max-overlap=300,两端reads最大overlap的碱基数;
[0071] max-mismatch-density=0.25,两端reads允许错配的比例;
[0072] 在一些实施方式中,所述3)序列聚类模块采用cd-hit v4.7具体参数设置如下:
[0073] identity=1,短序列与长序列的一致性阈值;
[0074] coverage-s=0.9,短序列长度与长序列长度比值最小值;
[0075] coverage-aL=0.9,匹配区间长度与长序列长度比值;
[0076] coverage-aS=0.9,匹配区间长度与短序列长度比值;
[0077] 在一些实施方式中,进一步采用blast v2.7.1+在IGHV和IGHJ参考数据库中进行比对,若比对成功,则提取出代表序列的CDR3区域;基于提取的代表序列CDR3区域对序列集3’进行二次聚类,将含有相同CDR3类聚到一起,得到聚类序列集3。
[0078] 在一些实施方式中,所述4)优势克隆确定模块为统计每类中含有的序列数,计算每种CDR3的占比,将占比大于5%的CDR3作为优势克隆。
[0079] 在一些实施方式中,所述5)序列质控模块采用fastp v0.19.3,具体参数设置如下:
[0080] length_required=30,低于该设置长度的reads被过滤掉;
[0081] poly_x_min_len=8,去掉尾端homopolymer X序列;
[0082] n_base_limit=15,去掉双端reads大于15个N碱基的序列;
[0083] cut_window_size=8,设置滑动窗口大小为8;
[0084] cut_mean_quality=20,设置滑动窗口平均碱基质量为20;
[0085] 在一些实施方式中,所述6)序列拼接模块采用flash v1.2.11,具体参数设置如下:
[0086] min-overlap=10,两端reads最小overlap的碱基数;
[0087] max-overlap=300,两端reads最大overlap的碱基数;
[0088] max-mismatch-density=0.25,两端reads允许错配的比例;
[0089] 在一些实施方式中,所述7)复诊定量模块具体为:
[0090] 基于Blast进行对步骤6获得的序列集2进行序列比对,计算复诊定量结果,公式如下所示:
[0091]
[0092]
[0093]
[0094] 其中,b为建库过程中投入质粒的序列数,m为内参CDR3检测的质粒序列数,a为最开始投入建库的DNA量,n为基于Blast进行对步骤3获得的序列集2进行序列比对所计算的数据中初诊优势CDR3数量。
[0095] 本发明还提供一种基于NGS的微小残留病变测序检测装置,其特征在于,包括上述所述的装置,还包括
[0096] 捕获扩增模块:该模块针对B淋巴细胞的V区和J区的设计引物池,本申请共使用了两种引物池,一种是设计于V区FR2区域的34种引物和设计于J区的4种引物所组成的引物池,另一种是设计于V区FR3区域的33种引物和设计于J区的4种引物所组成的引物池,这两种引物池能与所有的V区和J区进行特异性结合,能全面且特异性的捕获扩增VDJ区域。利用上述引物池对B淋巴细胞的V/J区进行第一轮PCR扩增,获得扩增产物;
[0097] 建库测序模块:该模块对上述扩增产物进行二轮PCR扩增建库,基于常规流程制备上机文库,在Nextseq测序仪上进行测序。
[0098] 本申请还提供一种自动化测序分析装置在追踪初诊患者优势克隆在复诊中的占比来判断患者的治疗情况中的应用;
[0099] 本申请还提供一种自动化测序分析装置在制备白血病复诊检测装置中的应用。
[0100] 本申请有益的技术效果:
[0101] 1、本申请提供一种自动化分析初诊优势克隆的CDR3并后续监控对应样本微小残留病变的分析流程,通过生信分析流程参数选取和优化,实现检测灵敏度高达10-6。
[0102] 2、本申请针对IgH基因的保守FR区域,通过V区和J区的引物池全面靶向捕获VDJ区域,保证引物覆盖所有VDJ基因片段,避免产生多重PCR引物偏好性,利于高通量测序。
[0103] 3、本申请针对性的分析特异性优势单克隆序列,保证复诊检出效果。可较好地降低检测成本,并且由于在建库中加入了已知优势克隆的质粒序列,检测灵敏度高,具有较强技术优势。

附图说明

[0104] 为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0105] 图1:抗体VDJ重排过程图

具体实施方式

[0106] 下面将结合实施例对本申请的实施方案进行详细描述,但本领域技术人员将会理解,下列实施例仅用于说明本申请,而不应视为限制本申请的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购买获得的常规产品。
[0107] 实施例1分析方法构建
[0108] 1、捕获扩增:基于抗体VDJ重排过程(见图1),针对B细胞的V区和J区的设计引物池,本申请共使用了两种引物池,一种是设计于V区FR2区域的34种引物和设计于J区的4种引物所组成的引物池,另一种是设计于V区FR3区域的33种引物和设计于J区的4种引物所组成的引物池,这两种引物池能与所有的V区和J区进行特异性结合,能全面且特异性的捕获扩增VDJ区域。利用上述引物池对B细胞的V/J区进行第一轮PCR扩增,获得扩增产物。
[0109] 2、建库测序:对上述扩增产物进行二轮PCR扩增,基于常规流程构建上机文库,在Nextseq测序仪上进行测序。
[0110] 3、生信分析:
[0111] 本申请通过单因素和多因素分析验证,确定一套符合MRD检测的生信分析流程,具体优化后流程如下:
[0112] A、初诊分析步骤如下:
[0113] (1)fastp v0.19.3序列质控,获得序列集1:
[0114] 得到原始的下机数据后,用fastp v0.19.3对原始序列进行质控,去除低质量的序列。质控规则:去除短序列、去除末端的homopolyer序列、去除双端reads大于15个N碱基的序列、用滑动窗口方式进行低质量过滤。得到去除低质量之后的高质量的序列集1。本步骤设置参数如下:
[0115] 1)length_required=30,低于该设置长度的reads被过滤掉;
[0116] 2)poly_x_min_len=8,去掉尾端homopolymer X序列;
[0117] 3)n_base_limit=15,去掉双端reads大于15个N碱基的序列;
[0118] 4)cut_window_size=8,设置滑动窗口大小为8;
[0119] 5)cut_mean_quality=20,设置滑动窗口平均碱基质量为20;
[0120] (2)flash v1.2.11序列拼接获得序列集2:
[0121] 将序列的read1和read2用flash v1.2.11软件进行拼接。拼接规则:设置两端reads最小overlap数为10,最大overlap数为300,允许错配的比例为25%。经过拼接后,可以得到拼接后的序列以及未拼接成功的序列。合并所有序列,组成最终经过拼接步骤后得到的序列集2。本步骤中设置的参数:
[0122] 1)min-overlap=10,两端reads最小overlap的碱基数;
[0123] 2)max-overlap=300,两端reads最大overlap的碱基数;
[0124] 3)max-mismatch-density=0.25,两端reads允许错配的比例;
[0125] (3)cd-hit v4.7和blast v2.7.1+序列聚类获得序列集3:
[0126] 用cd-hit v4.7将拼接后的序列进行聚类。聚类规则:设置序列覆盖度coverage为90%,序列一致性identity为1,聚类得到每类的代表序列,获得序列集3’,即:
[0127] 1)identity=1,短序列与长序列的一致性阈值;
[0128] 2)coverage-s=0.9,短序列长度与长序列长度比值最小值;
[0129] 3)coverage-aL=0.9,匹配区间长度与长序列长度比值;
[0130] 4)coverage-aS=0.9,匹配区间长度与短序列长度比值;
[0131] 用blast v2.7.1+在IGHV和IGHJ参考数据库中进行比对,若比对成功,则提取出代表序列的CDR3区域。
[0132] 基于提取的代表序列CDR3区域对序列集3’进行二次聚类,将含有相同CDR3类聚到一起,得到聚类序列集3。
[0133] (4)优势克隆确定:
[0134] 统计每类中含有的序列数,计算每种CDR3的占比,将占比大于5%的CDR3,认为是优势克隆。
[0135] B、复诊分析步骤如下:
[0136] (1)捕获扩增:同初诊分析步骤1。
[0137] (2)建库测序:同初诊分析步骤2。
[0138] (3)生信分析:同初诊分析步骤3的1)和2)。
[0139] (4)复诊定量:基于Blast进行对步骤3获得的序列集2进行序列比对,计算数据当中初诊优势CDR3数量,定义为n。
[0140] 为实现定量,在建库过程中加入内参CDR3质粒序列,因此需通过blast比对并计算出数据中内参CDR3质粒序列的数量,定义为m。最开始投入建库的DNA量定义为a微克,投入质粒的序列数为b条。计算定量公式如下所示:
[0141]
[0142]
[0143]
[0144] 根据以上公式,即可得到复诊时样本微小残留病变MRD的定量结果。
[0145] 实施例2参数优化
[0146] 本申请对分析方法中各步条件和参数进行优化,部分优化试验示例如下:
[0147] 对序列聚类步骤中identity和coverage参数优化:
[0148] identity选择参数为0.8、0.85、0.9、0.95、1;coverage中的参数s、aL和aS分别选择0.3、0.4、0.5、0.6、0.7、0.8、0.9。使用两个参数的组合进行验证,具体的结果如下表所示:
[0149] 表1样本cdhit聚类结果
[0150]
[0151]
[0152] 上表中数值表示经过聚类并将相同CDR3的类合并到一起之后,得到的样本优势克隆的序列数,而样本真实优势克隆序列数为36767(即不经聚类、单独统计的真实结果)。从上述数据可以看出,当coverage为0.9,identity为1时聚类结果36754与真实结果36767最为接近。因此,该聚类步骤最优参数确定为coverage=0.9,identity=1。
[0153] 实施例3验证实验
[0154] 采用实施例1的方法步骤,对5个白血病患者的骨髓样本进行检测分析,样本编号命名:(送检次数+)送检医院+样本编号+人名。
[0155] 实验设定两组:组1:本申请优化分析的NGS流程;组2:ddPCR(Droplet Digital PCR)对照组。ddPCR是将样品分成大量的反应孔,并对目标基因进行PCR,包含目标基因的孔通过PCR扩增计数为阳性,不包含阴性的孔计数。由于ddPCR涉及计数阳性孔(阳性率),因此在无需直接与参考样品或标准样品进行比较下即可进行直接和绝对定量的优势,可作为本申请的参考对照。表1为基于NGS和ddPCR的检测结果比较,可评估NGS的定量灵敏度。
[0156] 表1样本NGS和ddPCR定量结果
[0157] 样本编号 NGS ddPCR验证结果2ZS190726PFY 3.45x 10-4 6.47x 10-4
2CZ190322ZWL 1.25x 10-6 4.97x 10-6
BD150823CZY 8.99x 10-4 3.03x 10-4
BD151008LXY 1.35x 10-5 1.59x 10-5
2SD190424SBQ 7.17x 10-4 2.29x 10-4
[0158] 从上述5个样本的定量结果来看,NGS定量结果与ddPCR相比,结果一致性100%,本申请的分析流程能够很好检出白血病的微小残留病变,并且最终能检测到10-6的检测限样本,灵敏度极高,适于应用。
[0159] 最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,但本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。