系统性红斑狼疮图谱模型的构建方法转让专利

申请号 : CN201510281935.6

文献号 : CN105040111B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 眭维国戴勇侯显良

申请人 : 眭维国戴勇

摘要 :

一种系统性红斑狼疮图谱模型的构建方法,包括以下步骤:设置系统性红斑狼疮组与正常对照组,每组包括若干份相异人体的已经脱离人体的外周血标本;分别提取各所述外周血标本中的DNA,得到DNA待测液;测定DNA待测液中DNA含量及完整性,检测是否合格,是则执行下一步骤;采用多重PCR技术,构建基因文库,并检测所述基因文库,检测是否合格,是则执行下一步骤;采用高通量测序技术,对所述基因文库进行测序;对测序结果进行分析,构建系统性红斑狼疮图谱模型。上述系统性红斑狼疮图谱模型的构建方法,设计合理可行,能够有效地获取作为中间结果的SLE相关信息。

权利要求 :

1.一种系统性红斑狼疮图谱模型的构建方法,其特征在于,包括以下步骤:设置系统性红斑狼疮组与正常对照组,每组包括若干份相异人体的已经脱离人体的外周血标本;

分别提取各所述外周血标本中的DNA,得到DNA待测液;

测定DNA待测液中DNA含量及完整性,检测是否合格,是则执行下一步骤;

采用多重PCR技术,构建基因文库,并检测所述基因文库,检测是否合格,是则执行下一步骤;

采用高通量测序技术,对所述基因文库进行测序;

对测序结果进行分析,构建系统性红斑狼疮图谱模型;

对所述测序结果进行分析包括:

对所述测序数据进行预处理、对所述测序数据进行比对分析及对所述测序数据的序列结构进行分析;

免疫组库的构建,其具体包括:根据比对分析得到的结果,统计每一个克隆的表达情况,分别统计DNA序列,氨基酸序列,V-J组合三种不同分辨率情况下得到的各个样本的表达情况;

免疫组库的差异分析,其主要包括:样本多样性差异和克隆表达差异两部分,样本多样性差异旨在找出样品间整体克隆表达模式的差别,表达差异则旨在找出差异显著的克隆;

所述系统性红斑狼疮图谱模型包括:10个TRβV和6个TRβJ亚类,所述10个TRβV亚类分别为TRBV3-1,TRBV6-2,TRBV6-3,TRBV6-4,TRBV7-1,TRBV12-5,TRBV18和TRBV21-1,TRBV10-2和TRBV23-1,所述6个TRβJ亚类分别为TRBJ1-4,TRBJ1-5,TRBJ2-4,TRBJ2-5,TRBJ2-6和TRBJ2-7;

所述系统性红斑狼疮图谱模型还包括:3个CDR3DNA序列和4个氨基酸序列,所述3个CDR3DNA序列分别为:TGCGCCAGGGTCCCCAGGGCTGTGCGAACACCGGGGAGCTGTTTTTT、TGTGCTAACTATGGCTACACCTTC及TGTGCCAGCAGTTCTTC,所述4个氨基酸序列分别为:CARVPRAV~NTGELFF、CANYGYTF、CASSLGYEQYF、CAS~FF。

2.根据权利要求1所述的构建方法,其特征在于,提取各所述外周血标本中的DNA包括以下步骤:取5mL外周血加入至EDTA抗凝管;

加入20mg/mL蛋白酶K 20μl,混合均匀,室温放置15分钟;

加入200μL结合液,充分混匀,再在70℃水浴放置10分钟;

加入100μL异丙醇,混匀,得到混合液;

将所述混合液加入吸附柱,然后将吸附柱放入收集管中,在转速为10000rpm的条件下,离心30秒,弃废液;

加入500μL抑制物去除液,在转速为12000rpm的条件下,离心30秒,弃废液;

加700μL漂洗液,在转速为12000rpm的条件下,离心30秒,弃废液;

继续加入500μL漂洗液,在转速为12000rpm的条件下,离心30秒,弃废液;

将吸附柱重新放回收集管中,在转速为13000rpm的条件下,离心2分钟,除去残留的漂洗液;

将吸附柱放入一干净离心管中,加100μL已预热的洗脱缓冲液,室温放置3~5分钟,转速为12000rpm的条件下,离心30秒,将得到的溶液重新加入吸附柱中,室温放置2分钟,转速为12000rpm的条件下,离心1分钟;

收集DNA并在2~8℃的环境中保存。

3.根据权利要求1所述的构建方法,其特征在于,测定DNA含量包括以下步骤:配制DNA染料工作液;

制备标准品溶液,并制作标准曲线;

将DNA待测液与DNA染料工作液混合,室温静置2分钟后,进行荧光检测;

根据标准曲线,计算得出DNA待测液的DNA含量。

4.根据权利要求1所述的构建方法,其特征在于,采用琼脂糖凝胶电泳法测定DNA待测液的完整性。

5.根据权利要求4所述的构建方法,其特征在于,测定所述DNA待测液的完整性包括如下步骤:将DNA待测液与加样缓冲液混合后加入孔板通电进行电泳,在电压为120V的条件下电泳45分钟;

取出凝胶,并在紫外灯下检查。

6.根据权利要求1所述的构建方法,其特征在于,检测所述基因文库包括检测所述基因文库的插入片段范围及定量测定所述基因文库的浓度。

7.根据权利要求1所述的构建方法,其特征在于,对所述测序数据进行预处理包括对所述测序数据进行过滤处理。

8.根据权利要求1所述的构建方法,其特征在于,构建基因文库包括以下步骤:取适量DNA待测液,加入V区引物和J区引物进行多重PCR;

电泳检测回收PCR产物,得到第一样本;

取所述第一样本补平末端,纯化得到第二样本;

在所述第二样本的3’端加A碱基,纯化得到第三样本;

取3’末端具有T碱基的接头与所述第三样本连接,得到第四样本;

将所述第四样本进行PCR扩增,电泳,切取目的片段后,纯化回收,得到所述基因文库。

9.根据权利要求8所述的构建方法,其特征在于,所述适量DNA待测液中,DNA含量为

500ng。

说明书 :

系统性红斑狼疮图谱模型的构建方法

技术领域

[0001] 本发明涉及一种获取作为中间结果的系统性红斑狼疮信息,特别是涉及一种系统性红斑狼疮图谱模型的构建方法。

背景技术

[0002] 系统性红斑狼疮(systemic lupus erythematosus,SLE)是一种经典的自身免疫性疾病,以自身抗体产生、补体激活、免疫复合物沉积以及多种组织器官损伤为特征。SLE的临床表现多样化,可以累积皮肤、肾脏、造血系统、神经系统、肺脏、浆膜等多个组织和器官的受累。患者体内存在多种免疫功能异常,如T细胞数量及功能减低;B细胞过度活化增殖、产生多种自身抗体;免疫复合物清除功能障碍,补体系统缺陷;细胞凋亡异常和大量细胞因子的产生引发体内持续的自身反应性炎症,最终器官功能丧失,甚至死亡。
[0003] 为了阐明系统性红斑狼疮的致病机理,研究者从个体到细胞,从基因到蛋白,从遗传学到表观调控进行了广泛而深入的研究。由于系统性红斑狼疮是一种具临床和血清学多样性的自身免疫性疾病,其复杂的发病机理和多样化的临床表现,很难用单一的生物学标志来说明SLE广泛的特性,合适的生物学标志物对于SLE进行早期诊断和精确评估预后及治疗效果具有重要价值。此前我们通过蛋白组学和代谢组学寻找与SLE疾病相关的生物标志物,发现了一些潜在的有利用价值的生物标志物。但由于SLE是多因素的、遗传素质、性激素和环境因素相互作用引起自身免疫疾病,病变细胞和正常细胞之间无论在基因组还是基因表达水平,蛋白组等方面的差别都不大。而且即使有差别,在外周血里面也很难察觉。因此,从新的角度阐释SLE的发病机制以及寻找新的生物标志物仍然是当前SLE研究的主要目标和挑战之一。

发明内容

[0004] 基于此,有必要针对上述问题,提供一种系统性红斑狼疮图谱模型的构建方法。
[0005] 一种系统性红斑狼疮图谱模型的构建方法,包括以下步骤:
[0006] 设置系统性红斑狼疮组与正常对照组,每组包括若干份相异人体的已经脱离人体的外周血标本;
[0007] 分别提取各所述外周血标本中的DNA,得到DNA待测液;
[0008] 测定DNA待测液中DNA含量及完整性,检测是否合格,是则执行下一步骤;
[0009] 采用多重PCR技术,构建基因文库,并检测所述基因文库,检测是否合格,是则执行下一步骤;
[0010] 采用高通量测序技术,对所述基因文库进行测序;
[0011] 对测序结果进行分析,构建系统性红斑狼疮图谱模型。
[0012] 在其中一个实施例中,提取各所述外周血标本中的DNA包括以下步骤:
[0013] 取5mL外周血加入至EDTA抗凝管;
[0014] 加入20mg/mL蛋白酶K 20μl,混合均匀,室温放置15分钟;
[0015] 加入200μL结合液,充分混匀,再在70℃水浴放置10分钟;
[0016] 加入100μL异丙醇,混匀,得到混合液;
[0017] 将所述混合液加入吸附柱,然后将吸附柱放入收集管中,在转速为10000rpm的条件下,离心30秒,弃废液;
[0018] 加入500μL抑制物去除液,在转速为12000rpm的条件下,离心30秒,弃废液;
[0019] 加700μL漂洗液,在转速为12000rpm的条件下,离心30秒,弃废液;
[0020] 继续加入500μL漂洗液,在转速为12000rpm的条件下,离心30秒,弃废液;
[0021] 将吸附柱重新放回收集管中,在转速为13000rpm的条件下,离心2分钟,除去残留的漂洗液;
[0022] 将吸附柱放入一干净离心管中,加100μL已预热的洗脱缓冲液,室温放置3~5分钟,转速为12000rpm的条件下,离心30秒,将得到的溶液重新加入吸附柱中,室温放置2分钟,转速为12000rpm的条件下,离心1分钟;
[0023] 收集DNA并在2~8℃的环境中保存。
[0024] 在其中一个实施例中,测定DNA含量包括以下步骤:
[0025] 配制DNA染料工作液;
[0026] 制备标准品溶液,并制作标准曲线;
[0027] 将DNA待测液与DNA染料工作液混合,室温静置2分钟后,进行荧光检测;
[0028] 根据标准曲线,计算得出DNA待测液的DNA含量。
[0029] 在其中一个实施例中,采用琼脂糖凝胶电泳法测定DNA待测液的完整性。
[0030] 在其中一个实施例中,测定所述DNA待测液的完整性包括如下步骤:
[0031] 将DNA待测液与加样缓冲液混合后加入孔板通电进行电泳,在电压为120V的条件下电泳45分钟;
[0032] 取出凝胶,并在紫外灯下检查。
[0033] 在其中一个实施例中,检测所述基因文库包括检测所述基因文库的插入片段范围及定量测定所述基因文库的浓度。
[0034] 在其中一个实施例中,对所述测序结果进行分析包括:对所述测序数据进行预处理、对所述测序数据进行比对分析及对所述测序数据的序列结构进行分析。
[0035] 在其中一个实施例中,对所述测序数据进行预处理包括对所述测序数据进行过滤处理。
[0036] 在其中一个实施例中,构建基因文库包括以下步骤:
[0037] 取适量DNA待测液,加入V区引物和J区引物进行多重PCR;
[0038] 电泳检测回收PCR产物,得到第一样本;
[0039] 取所述第一样本补平末端,纯化得到第二样本;
[0040] 在所述第二样本的3’端加A碱基,纯化得到第三样本;
[0041] 取3’末端具有T碱基的接头与所述第三样本连接,得到第四样本;
[0042] 将所述第四样本进行PCR扩增,电泳,切取目的片段后,纯化回收,得到所述基因文库。
[0043] 在其中一个实施例中,所述适量DNA待测液中,DNA含量为500ng。
[0044] 上述系统性红斑狼疮图谱模型的构建方法,设计合理可行,能够有效地获取作为中间结果的SLE相关信息,可用于SLE的后续分析,对这些信息进一步进行验证分析和研究将有助于SLE的原理分析,有助于揭示SLE的致病机制和疾病进程,对于SLE临床诊断及病情了解具有重要的意义,并为从蛋白质组学的角度探讨SLE的发病机制及早期诊断提供新思路和新依据。

附图说明

[0045] 图1为本发明一实施例中系统性红斑狼疮图谱模型的构建方法示意图;
[0046] 图2为SLE组和NC组中TRBV基因亚家族使用频率的比较柱状图;
[0047] 图3为SLE组和NC组中TRBJ基因亚家族使用频率的比较柱状图。

具体实施方式

[0048] 为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施例的限制。
[0049] 例如,一种系统性红斑狼疮图谱模型的构建方法,包括以下步骤:设置系统性红斑狼疮组与正常对照组,每组包括若干份相异人体的已经脱离人体的外周血标本;分别提取各所述外周血标本中的DNA,得到DNA待测液;测定DNA待测液中DNA含量及完整性,检测是否合格,是则执行下一步骤;采用多重PCR技术,构建基因文库,并检测所述基因文库,检测是否合格,是则执行下一步骤;采用高通量测序技术,对所述基因文库进行测序;对测序结果进行分析,构建系统性红斑狼疮图谱模型。
[0050] 请参阅图1,本发明的一个实施例是,一种系统性红斑狼疮图谱模型的构建方法,其包括如下步骤。
[0051] S110、设置系统性红斑狼疮组与正常对照组,每组包括若干份相异人体的已经脱离人体的外周血标本。
[0052] 例如,本发明各实施例采用两组外周血标本,分别来自10名系统性红斑狼疮患者和10名健康正常对照组,对应作为SLE(系统性红斑狼疮)组与NC(正常对照)组。这两组全血标本均来自中国广西桂林第一八一医院,所有患者均符合1997/1982年美国风湿病学院(ACR)和2012年系统性狼疮国际协作组(SLICC)修订的SLE诊断标准。需要说明的是,标本收集的方案与执行,均获得广西代谢性疾病重点实验室和第一八一医院伦理委员会的批准。
[0053] 例如,在室温条件下,获取脱离人体的外周静脉血3mL置于5mL EDTA抗凝真空采血管,盖上盖子后,将EDTA抗凝真空采血管轻轻颠倒混匀数次后,放入-80℃超低温冰箱保存备用。
[0054] S120、分别提取各所述外周血标本中的DNA,得到DNA待测液。
[0055] 例如,步骤S120具体包括以下步骤:
[0056] 取5mL外周血加入至10mL EDTA抗凝管中;
[0057] 加入20mg/mL蛋白酶K 20μl,颠倒混匀数次,室温放置15分钟;
[0058] 加入200μL结合液,充分混匀,再置于70℃水浴中放置10分钟;
[0059] 例如,加入200μLNaCl后,充分混匀,例如,快速充分混匀,又如,在1秒之内放到转速大于200rpm的旋转设备上混合5~20秒;又如,立刻上下颠倒使其充分混匀,又如,立刻摇晃使其充分混匀。
[0060] 加入100μL异丙醇,混匀,得到混合液;
[0061] 例如,在室温条件下,将加入结合液后的所述血浆自然冷却至室温,加入异丙醇,混匀,得到混合液;又如,在室温条件下,在加入结合液后的所述血浆中加入预冷的异丙醇,混匀,得到混合液。
[0062] 将所述混合液加入吸附柱,然后将吸附柱放入收集管中,在转速为10000rpm的条件下,离心30秒,弃废液;
[0063] 例如,在转速为10000rpm的条件下,离心30秒,待分层后,除去上层清液。又如,在转速为10000rpm的条件下,离心30秒,倒掉收集管中的液体。
[0064] 加入500μL抑制物去除液,在转速为12000rpm的条件下,离心30秒,弃废液;
[0065] 例如,加入500μL抑制物去除液IR,在转速为12000rpm的条件下,离心30秒,倒掉收集管中的液体。
[0066] 加700μL漂洗液,在转速为12000rpm的条件下,离心30秒,弃废液;
[0067] 例如,加700μL漂洗液WB,在转速为12000rpm的条件下,离心30秒,倒掉收集管中的液体。
[0068] 继续加入500μL漂洗液,在转速为12000rpm的条件下,离心30秒,弃废液;
[0069] 例如,继续加入500μL漂洗液WB,在转速为12000rpm的条件下,离心30秒,倒掉收集管中的液体;
[0070] 将吸附柱重新放回收集管中,在转速为13000rpm的条件下,离心2分钟,除去残留的漂洗液;
[0071] 例如,将吸附柱重新放回收集管中,在转速为13000rpm的条件下,离心2分钟,倒掉收集管中的液体。又如,继续在在转速为13000rpm的条件下,离心2分钟,倒掉收集管中的液体。又如,重复上述操作2~3次。
[0072] 将吸附柱放入一干净离心管中,加100μL已预热的洗脱缓冲液,室温放置3~5分钟,转速为12000rpm的条件下,离心30秒,将得到的溶液重新加入吸附柱中,室温放置2分钟,转速为12000rpm的条件下,离心1分钟;
[0073] 例如,将洗脱缓冲液预热至60~80℃,优选的,将洗脱缓冲液预热至65~75℃,优选的,将洗脱缓冲液预热至70℃。
[0074] 收集DNA并在2~8℃的环境中保存。
[0075] S130、测定DNA待测液中DNA含量及完整性,检测合格,则执行下一步骤。
[0076] 例如,测定DNA含量包括以下步骤:
[0077] 配制DNA染料工作液;
[0078] 例如,DNA染料为Quant-iTTMreagent,通过用Quant-iTTMbuffer将其稀释200倍得到Quant-iTTMWorking Solution。
[0079] 制备标准品溶液,并制作标准曲线;
[0080] 例如,分别取Quant-iTTMstandard1(100ng/μL)和Quant-iTTMstandard2(100ng/μL)0~10μL混合后,其中Quant-iTTMstandard1和Quant-iTTMstandard2的总体积为10μL,再与190μL Quant-iTTMWorking Solution混合后,按照 Fluorometer已设定好的程序进行标准曲线的制作。
[0081] 将DNA待测液与DNA染料工作液混合,室温静置2分钟后,进行荧光检测;
[0082] 分别取2~20μL的DNA待测液与180~198μL的Quant-iTTMWorking Solution混合后,其中,DNA待测液与Quant-iTTMWorking Solution总体积为200μL,室温静置2分钟,使DNA与染料充分结合,然后置于 Fluorometer中进行荧光检测。
[0083] 根据标准曲线,计算得出DNA待测液的DNA含量。
[0084] 例如,本发明一个实施例中,采用琼脂糖凝胶电泳法测定DNA待测液的完整性。又如,测定DNA待测液的完整性包括如下步骤。
[0085] 将DNA待测液与加样缓冲液混合后加入孔板通电进行电泳,在电压为120V的条件下电泳45分钟;取出凝胶,并在紫外灯下检查。
[0086] 具体地,将DNA待测液在冰上融化后,充分混匀后离心,取3μL DNA样品与加样缓冲液混合后加入孔板,其中孔板中的一孔加入2μL DNA marker,选用0.6%的琼脂糖凝胶在120V电压下电泳45分钟,电泳至溴酚蓝在凝胶中迁移出适当距离,切断电流,取出凝胶,在紫外灯下检查并扫描图像。
[0087] S140、采用多重PCR技术,构建基因文库,并检测所述基因文库,检测合格,则执行下一步骤。
[0088] 取适量DNA待测液,加入V区引物和J区引物进行多重PCR;
[0089] 例如,取DNA含量为500ng的所述DNA待测液,加入设计好的V区家族引物和J区家族引物后用QIAGEN multiplex PCR Kit进行多重PCR,进行30循环(cycles)。
[0090] 电泳检测回收PCR产物,得到第一样本;
[0091] 例如,电泳检测回收100~190bp的多重PCR产物,并使用QIAquick Gel Extraction kit进行回收,得到第一样本。
[0092] 取所述第一样本补平末端,纯化得到第二样本;
[0093] 例如,在20℃条件下,加入10×End Repair buffer及End Repair Mix,进行末端修复反应,并使用QIAquick PCR Purification Kit进行纯化,得到第二样本。
[0094] 在所述第二样本的3’端加A碱基,纯化得到第三样本;
[0095] 例如,利用NEBNext dA-tailing module在已补平末端的DNA片段3’端加入腺嘌呤(A)。又如,在37℃的条件下,在第二样本中加入NEBNext dA-tailing buffer及NEBNext dA-tailing enzyme,反应30分钟。
[0096] 取3’末端具有T碱基的接头与所述第三样本连接,得到第四样本;
[0097] 例如,用Adapter oligo mix和DNA ligase配制接头连接反应体系,与第三样本进行接头连接。
[0098] 将所述第四样本进行PCR扩增,电泳,切取目的片段后,纯化回收,得到所述基因文库。
[0099] 在本实施例中,将第四样本进行PCR扩增后,对PCR产物进行琼脂糖凝胶电泳,切取目的片段后,使用QIAquick Gel Extraction kit进行胶纯化回收,溶于洗脱缓冲液中。
[0100] 例如,检测所述基因文库包括检测所述基因文库的插入片段范围及定量测定所述基因文库的浓度。又如,使用Agilent 2100Bioanalyzer(Agilent DNA 1000Reagents)检测文库的插入片段范围,又如,使用ABI StepOnePlus Real-Time PCR System(TaqMan Probe)对文库进行浓度的定量。
[0101] S150、采用高通量测序技术,对所述基因文库进行测序。
[0102] 例如,按照预期上机数据量,在检测合格的基因文库加入0.5mmol/L的NaOH溶液,变性30分钟,使双链DNA片段变性形成单链DNA。并将变性后的文库加入到FlowCell内,与FlowCell上的接头进行杂交,然后在簇生成平台cBot上结合TruSeq PE Cluster Kit v3-cBot-HS试剂完成桥式PCR扩增。最后将制备好的FlowCell采用HiSeq 2000测序系统和TruSeq SBS KIT-HS v3试剂进行上机测序。
[0103] S160、对测序结果进行分析,构建系统性红斑狼疮图谱模型。例如,通过上述分析得到一个图谱模型,即所述系统性红斑狼疮图谱模型。
[0104] 例如,对所述测序结果进行分析包括:对所述测序数据进行预处理、对所述测序数据进行比对分析及对。又如,对所述测序数据进行预处理包括对所述测序数据进行过滤处理。
[0105] 例如,对所述测序数据进行预处理具体包括:在所述测序数据的序列结构进行分析数据下机后,首先对原始数据做过滤处理,过滤的过程中,首先过滤掉含有接头的序列;将平局质量低于15(Illumina 0-41质量体系)的reads去掉;对于未知碱基(N碱基),要求碱基数不能多于5%;针对序列尾部质量较差的序列,截取低质量部分(质量小于10的碱基),保证截取后的序列平均质量高于15,同时,截取后剩余序列的长度要求大于60。根据以上过滤条件,获得过滤后的cleandata。过滤完成后,将Pair-end(PE)数据的两条序列拼接成一条完整的contig(片段重叠群),在读长是100的情况下,拼接过程分为两步:1、将两条序列的尾部比对,寻找匹配序列,这样的拼接需要最小10个碱基的重叠,重叠区域碱基的匹配率要大于90%;2、鉴于免疫组库捕获区域的长短不同,在某些情况下会存在端序列被测通的情况,在第1部分尾部拼接剩下的序列中,尝试用头部将其继续拼接。最终得到的合并后的序列及合并的序列contig的长度分布图。
[0106] 例如,对10个SLE患者和10个健康者的外周血T淋巴细胞TCRβCDR3区域进行测序。正常对照组中平均每个样本获得18772948.4条Total Reads。SLE组中平均每个样本获得
20898195.9条Total Reads。然后对这些原始数据做过滤处理,例如,滤掉含有接头、平均质量低于15、未知碱基(N碱基)多于5%的Reads,正常对照组的平均过滤率为4.63%,SLE组的平均过滤率为5.80%。过滤完成后,将Pair-end(PE)数据的两条序列拼接成一条完整的contig,最终得到的合并后的序列。正常组中平均有10674277.8条Total good sequences,SLE疾病组平均有11537754.7条Total good sequences。而正常对照组和SLE组的平均Clones数分别为87125和57174.4。
[0107] 例如,对所述测序数据进行比对分析具体包括:使用milaboratory开发的miTCR对T细胞受体进行自动校正,校正由PCR、测序等原因带来的序列错误。比对完成后,自动统计CDR3克隆的表达及插入缺失情况。
[0108] 使用BLASTn软件对B细胞受体进行比对分析,分别与IMGT数据库的V、D、J基因家族进行比对,根据比对结果,选取最佳匹配基因。
[0109] 例如,对所述测序数据的序列结构进行分析具体包括:根据比对分析得到的结果,得到比对得到V基因序列的最后位点,D基因的起始位点,D基因的终止位点及J基因的起始位点,通过位点信息找到V-D-J插入缺失的碱基并统计其长度分布。根据比对找到的CDR3区域,并统计CDR3序列的长度分布。
[0110] 例如,对所述测序结果进行分析还包括:
[0111] 1、免疫组库的构建,其具体包括:根据比对分析得到的结果,统计每一个克隆的表达情况,分别统计DNA序列,氨基酸序列,V-J组合三种不同分辨率情况下得到的各个样本的表达情况。例如,为了衡量样品的多样性,分别统计和计算各个样本的distinct clone数,辛普森系数及香农威纳系数,三个系数分别针对DNA、氨基酸、V-J组合三种不同的分辨率。对于每一个样本中每个克隆的表达情况,按照DNA序列、氨基酸序列、V-J组合三种不同分辨率统计每个克隆的表达。筛选出各细胞亚群的高度克隆性扩增(频率大于0.5%)的DNA序列,氨基酸序列,V-J组合。在T细胞发育过程中,TCR的V、D、J基因片段发生重排,结果在V-J片段间或在V-D-J片段间可随机插入不同数量的核苷酸,形成具有高度多样性的可变区CDR3,其在长度和氨基酸序列上存在较大差异,即CDR3序列决定了一个独特的TCR克隆型,通过免疫组库的建立,统计每一个克隆的表达情况,为后续的分析提供数据支持。
[0112] 2、免疫组库的差异分析,其主要包括:样本多样性差异和克隆表达差异两部分。其中,样本多样性差异旨在找出样品间整体克隆表达模式的差别,表达差异则旨在找出差异显著的克隆。样本多样性差异首先针对的是每个样本计算出的多样性系数,即Distinct(uniq)clone数,辛普森和香农威纳系数。根据不同组间样本属性,针对的是DNA序列、氨基酸序列、V-J组合三种分辨率,统计计算差异显著性。而对于单克隆表达,根据之前设定的分组方案,在DNA序列、氨基酸序列和V-J组合三个层面进行分析,使用泊松分布等相应的检验方案计算出每一个差异对的P值,同时使用FDR和bonferroni对P值做校正。
[0113] 例如,将克隆扩增程度划分为≥0.5%,0.05~0.5%,0.005~0.05%,0.0005~0.005%和<0.0005%五个等级,定义克隆频率大于0.5%的Clones为高度扩增性克隆(highly expanded clones,HEC),并从DNA序列、氨基酸序列、V-J组合三种不同分辨率统计每个克隆的克隆扩增程度。每一个Clone的克隆性扩增程度的计算方法是:该Clone在测试样本中出现的次数/该样本的总Total good sequences数。在DNA序列中,发现SLE组和NC组的高度扩增性克隆数分别106和73个,在氨基酸序列中,SLE组和NC组的高度扩增性克隆数分别107和72个,在V-J组合中,SLE组和NC组的高度扩增性克隆数分别472和398个。由表1可知,在所有Clones中,高度扩增性克隆(HEC)所占的比例很小。在DNA序列中,SLE组中仅2.87×10-2%(范围从2.95×10-3%到7.42×10-2%)的clones为HEC,而NC组中更小,仅9.42×
10-3%(范围从9.67×10-4%到2.30×10-2%)的clones其克隆频率大于0.5%,两组间具有显著性差异(p<0.03),表明SLE组中高度扩增性克隆数明显多于NC组。从整体克隆性扩增程度来看,SLE组中克隆频率分布在≥0.5%,0.05~0.5%和0.005~0.05%区间的Clones数量都明显多于NC组。而对于分布在低扩增性克隆区间(0.0005~0.005%和<0.0005%)的Clones,其在SLE组的数量明显少于NC组。该结果表明SLE组中的Clones的扩增性程度明显高于正常对照组。
[0114] 表1.克隆性扩增程度和T细胞克隆的影响
[0115]
[0116] 由表1可知,大部分T细胞的Clones在total good sequences中的频率较低,表明这些Clones没有经历克隆性扩增。而在每个个体的TCR BV CDR3图谱中都发现一些高度扩增性克隆(HECs),可能是机体在环境中的抗原或病原体的刺激下形成的。虽然NC组和SLE组的Clones都有克隆性扩增的现象,但SLE组的克隆性扩增程度要高于NC组。由于较NC组,SLE患者体内存在大量的自身抗原,而慢性炎症条件下这些自身抗原将引发新的自身反应性克隆。然而,本发明没有发现SLE组不同个体间存在相同的高度扩增性克隆(HECs),可能源于SLE是一种复杂的自身免疫性疾病,体内的自身抗原具有多态性,很难发现共有的HECs。
[0117] 例如,为了定量SLE组和NC组的TCRβCDR3多态性,进一步使用辛普森系数(1/Ds)统计每一个Clone的频率。该指数的变化范围从1到∞,该值越大表明所分析的样本中所有Clones的扩增性程度越相近,同时多态性越高。从DNA序列、氨基酸序列、V-J组合三种分辨率分析SLE组和NC组的TCRβCDR3多态性,三种分辨率均显示SLE组的TCRβCDR3多态性(DNA水平:1/Ds=1.017;氨基酸和V-J组合水平:1.024)低于NC组(DNA水平:1/Ds=1.029;氨基酸和V-J组合水平:1.039。
[0118] 根据对10个SLE患者和10个健康者的T细胞免疫组库进行测序,在SLE组中获得了5.4×105个核苷酸序列,对应于5.0×105个氨基酸序列。在NC组中获得了8.5×105个核苷酸序列,对应于7.8×105个氨基酸序列(非冗余序列)。将各组(SLE组和NC组)的所有个体的非冗余TCRβ序列视为一个整体,筛选出SLE组之间的共有序列作为SLE疾病的潜在生物标志物。从表1中可以得出,3个CDR3DNA(占所有序列的~5.52×10-4%)和4个氨基酸序列(占所有序列的~8.05×10-4%)在所有的SLE患者(n=10)中存在。15个DNA(占所有序列的~1.77×10-3%)和30个氨基酸序列(占所有序列的~3.86×10-3%)被所有的健康者共有。
[0119] 表2.SLE组和NC组中共有的DNA序列和氨基酸(AA)序列
[0120]
[0121]
[0122] 例如,采用上述构建方法得到的系统性红斑狼疮图谱模型包括:3个CDR3DNA序列和4个氨基酸序列,所述3个CDR3 DNA序列分别为:TGCGCCAGGGTCCCCAGGGCTGTGCGAACACCGGGGAGCTGTTTTTT、TGTGCTAACTATGGCTACACCTTC及TGTGCCAGCAGTTCTTC,所述4个氨基酸序列分别为:CARVPRAV~NTGELFF、CANYGYTF、CASSLGYEQYF、CAS~FF。
[0123] 根据比较SLE组和NC组中各TRβV和TRβJ亚类的表达水平来筛选出具有差异性表达的基因亚类。请参阅图2及图3,条形图描述了SLE组(n=10)和NC组(n=10)中每个TRBV及TRBJ基因亚家族的平均使用频率和标准差。采用F统计方法来计算显著性差异(*p<0.05,*p<0.01),由图2及图3可知,SLE组中10个TRβV和6个TRβJ亚类的表达水平明显异于正常对照组。在50个Vβ基因亚类中,TRBV3-1(P=0.015),TRBV6-2(P=0.02),TRBV6-3(P=0.02),TRBV6-4(P=0.006),TRBV7-1(P=0.011),TRBV12-5(P=0.004),TRBV18(P=0.009)和TRBV21-1(P=0.035)在SLE患者组中低表达。然而TRBV10-2(P=0.037)和TRBV23-1(P=0.009)在SLE患者组中高表达。在13个Jβ基因亚类中,TRBJ1-4(P=0.026),TRBJ1-5(P=
0.003),TRBJ2-4(P=0.004),TRBJ2-5(P=0.02),TRBJ2-6(P=0.013)在SLE患者组的外周血中低表达,而TRBJ2-7(P<0.001)在SLE患者组的外周血中高表达。
[0124] 例如,所述系统性红斑狼疮图谱模型包括:10个TRβV和6个TRβJ亚类,所述10个TRβV亚类分别为TRBV3-1,TRBV6-2,TRBV6-3,TRBV6-4,TRBV7-1,TRBV12-5,TRBV18和TRBV21-1,TRBV10-2和TRBV23-1,所述6个TRβJ亚类分别为TRBJ1-4,TRBJ1-5,TRBJ2-4,TRBJ2-5,TRBJ2-6和TRBJ2-7。
[0125] 本发明利用TCR Vβ亚家族的CDR3的特点,采用多重PCR和高通量测序技术分析了SLE组和NC组外周血单个核细胞TCR的CDR3区域中V和J基因亚家族的表达水平,发现SLE组中10个TRβV和6个TRβJ亚类的表达水平明显异于正常对照组。这些异常表达的TRβV和TRβJ亚家族可能参与SLE疾病的发生发展过程,即在自身抗原的刺激下,TCR V/J基因存在优势取用的现象。正常人TCR区域的VDJ基因重排是随机的,故外周血T细胞表现为多家族多克隆性的特点。而在疾病状态下,由于体内存在某些特异的相关抗原,刺激TCR基因发生针对性和选择性的重排,故可表现为选择性表达某些家族的T细胞,即所谓的优势表达,出现某些TCR特异性的T细胞克隆性增殖的现象,破坏TCR的多态性。而TCR的多样性对健康起着至关重要的作用,免疫蛋白的亚型越多,越能有效抵抗病原体,亚型越少越容易感染疾病。
[0126] 上述构建方法通过高通量测序为基础对SLE患者已经脱离人体的全血标本单个核细胞TCR的CDR3区域进行分析,发现SLE患者的部分TRβV和TRβJ亚类的表达与正常人存在一定差异,且发现SLE患者中存在特定的共有序列,虽然这类差异是广泛存在的,但是在深入进行后续研究之后,很有可能确定其中可能存在作为中间结果的信息,从而发现系统性红斑狼疮的诊断和预后的生物标志物或是治疗靶点。然而,本文的研究数据只是初步阶段,该图谱模型只能够作为后续分析诊断的参考依据,如何利用该图谱模型还有待于进一步的医学研究,需要更多的标本数以及更深入的研究才有可能作为更进一步的参考依据。
[0127] 需要补充的是,本发明的直接目的不是获得诊断结果或健康状况,而只是对已经脱离人体的体液,即外周血,进行处理或检测以获取作为中间结果的信息的方法,或处理该信息的方法,根据目前的医学知识和本发明所公开的内容,从所获得的信息本身不能够直接得出疾病的诊断结果。
[0128] 以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0129] 以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。