用于结肠直肠癌的微RNA表达谱分析的组合物和方法转让专利

申请号 : CN200980150545.8

文献号 : CN102439169B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 吴莹朱虹光李健许亮W·F·J·韦哈格任一萍A·亚内夫斯基N·瓦拉丹李兆勇N·迪米特罗瓦

申请人 : 复旦大学

摘要 :

本发明涉及用于结肠直肠癌的微RNA(miRNA)表达谱分析的组合物和方法。具体地,本发明涉及用于鉴别显示结肠直肠癌或具有发生结肠直肠癌倾向的一或多种哺乳动物靶细胞的分子标记物的诊断试剂盒,所述试剂盒包含多种核酸分子,每种核酸分子编码miRNA序列,其中所述多种核酸分子中的一或多种在靶细胞中及在一或多种对照细胞中差异表达,且其中所述一或多种差异表达的核酸分子一起代表核酸表达特征,所述核酸表达特征是存在结肠直肠癌或发生结肠直肠癌倾向的指征。本发明进一步涉及使用这种核酸表达特征鉴别显示结肠直肠癌或具有发生结肠直肠癌倾向的一或多种哺乳动物靶细胞以及预防或治疗这种疾病的相应方法。最后,本发明涉及用于预防和/或治疗结肠直肠癌的药物组合物。

权利要求 :

1.用于鉴别显示结肠直肠癌或具有发生结肠直肠癌倾向的一或多种哺乳动物靶细胞的分子标记诊断试剂盒,所述试剂盒包含多种核酸分子,每种核酸分子编码微RNA序列,其中所述多种核酸分子包括编码hsa-miR-376a、hsa-miR-424、hsa-miR-378、hsa-miR-375、hsa-miR-139-3p、hsa-miR-18b、hsa-miR-18a、hsa-miR-650、hsa-miR-194*、hsa-miR-194、hsa-miR-29c、hsa-miR-139-5p、hsa-miR-497、hsa-miR-378*、hsa-miR-182、hsa-miR-20b、hsa-miR-17*、hsa-miR-376c和hsa-miR-20a*的微RNA序列的人靶细胞衍生的核酸分子,其中所述多种核酸分子的一或多种在所述靶细胞和一或多种对照细胞中差异表达,及其中所述一或多种差异表达的核酸分子一起代表核酸表达特征,所述核酸表达特征是存在结肠直肠癌或发生结肠直肠癌倾向的指征。

2.权利要求1的试剂盒,其中所述多种核酸分子进一步包括一或多种编码选自hsa-miR-429、hsa-miR-451、hsa-miR-99a、hsa-miR-365、hsa-miR-939、hsa-miR-181c、hsa-miR-513c、hsa-miR-572、hsa-miR-130b、hsa-miR-30e、hsa-miR-455-3p、hsa-miR-192*、hsa-miR-301a、hsa-miR-452、hsa-miR-98、hsa-miR-486-5p、hsa-miR-662、hsa-miR-19b、hsa-miR-30e*、hsa-miR-151-3p、hsa-miR-29c*、hsa-miR-623、hsa-miR-550*、hsa-miR-134、hsa-miR-128和hsa-miR-21*、hsa-miR-638、hsa-miR-335*、hsa-miR-342-5p、hsa-miR-34b*、hsa-miR-145*和hsa-miR-552的微RNA序列的人靶细胞衍生的核酸分子。

3.权利要求1或2的试剂盒,其中所述结肠直肠癌表现为腺癌。

说明书 :

用于结肠直肠癌的微RNA表达谱分析的组合物和方法

技术领域

[0001] 本发明涉及用于结肠直肠癌、特别是腺癌的微RNA(microRNA)表达谱分析的组合物和方法。

背景技术

[0002] 大多数癌症源于上皮并且通过逐步发展从正常细胞经发育异常变成恶性细胞而发生,恶性细胞侵袭周围组织并具有转移潜力。结肠直肠癌(CRC;也称为结肠癌或大肠癌)是一种经历这种肿瘤发展的主要癌症类型。
[0003] CRC包括在结肠、直肠和阑尾中的癌性生长。结肠直肠癌(CRC)是最有影响的人类癌症,在2007年全世界有约1百万个新病例。它是世界上第3位最常见癌症及第4位最主要的癌症死亡原因(综述参见例如Gryfe,R.et al.(1997)Curr.Probl.Cancer 21,233-300;Petersen,G.M.et al.(1999)Cancer 86,2540-2550)。如果在发育早期阶段被诊断,CRC是可治愈的。在这一早期阶段,大多数患者不表现该病的表型症状。早期检测可以显著改善长期存活几率。
[0004] 最初,CRC的特征是结肠中发生过度增殖性(发育异常)上皮,所述过度增殖性上皮首先转变为炎性腺瘤性息肉,然后转变为腺瘤,腺瘤是在结肠或直肠的内衬层(inner lining)中的异常赘生物(即良性肿瘤)。通常所形成的腺瘤中仅有一小亚组(到60岁时发生率为60-70%)发展为恶性腺癌。超过95%的CRC病例表现为腺癌(Muto,T.et al.(1975)Cancer 36,2251-2270;Fearon,E.R.and Vogelstein,B.(1990)Cell 61,759-767)。
[0005] 分子研究表明结肠癌发生的病因学来自于多种表观遗传学和遗传学改变的累积,这些改变包括K-ras原癌基因的激活突变、APC及p53肿瘤抑制基因和DNA修复基因的失活突变等(综述参见,例如,Forrester,K.et al.(1987)Nature 327,298-303;Baker,S.J.et al.(1989)Science 244,217-221)。
[0006] 基因组不稳定性是从腺瘤发展为腺癌的另一种关键步骤并且在CRC中以两种方式发生(Lengauer,C.et al.(1997)Nature 386,623-627)。导致微卫星不稳定性的DNA错配修复缺陷仅解释由腺瘤发展为腺癌的病例中的大约15%(Umar,A.et al.(2004)J.Natl.Cancer Inst.96,261-268;di Pietro,M.et al.(2005)Gastroenterology 129,1047-1059)。在其它的85%中,基因组不稳定性在染色体水平发生(CIN),导致非整倍性。在CRC中频繁报道的染色体畸变是7pq、8q、13q及20q的获得以及4pq、5q、8p、15q、17p及18q的丢失(Douglas,E.J.et al.(2004)Cancer Res.64,4817-4825)。
[0007] 但是,尽管cDNA微阵列分析揭示了一组差异表达的基因明显参与CRC的发生(Kitahara,O.et al.(2001)Cancer Res.61,3544-3549),目前尚未鉴别这样的特异的分子标记,其可以用于可靠诊断CRC、优选表现为腺癌的CRC,和/或良性腺瘤向这种恶性肿瘤的发展(Kitahara,O.et al.(2001)Cancer Res.61,3544-3549)。
[0008] 这样的分子标记的鉴别在临床中非常重要,特别是如果这些标记使得能够在肿瘤发展的早期进行诊断,从而允许癌症的早期治疗,避免非必要的外科手术。理想的是这些标记应该使得能在恶性细胞的存在尚不能由原位技术或生物活检样品或切除物的显微镜分析检测到的阶段鉴别癌症。
[0009] 许多诊断测定也由如下事实妨碍,即它们通常是基于分析仅仅单个分子标记,这可能影响检测可靠性和/或准确度。另外,单个标记通常不能进行有关潜伏期、肿瘤发展等的详细预测。因此,仍然需要鉴别其它的分子标记和测定模式以克服这些限制。
[0010] 一种解决这一问题的途径可以基于小的调节RNA分子,特别是微RNA(miRNA),它们是一类进化保守的内源表达的小非编码RNA,大小为20-25个核苷酸(nt),可以介导靶mRNA的表达,因此自从它们在大约10年前被发现后,被认为在细胞发育、分化、增殖和凋亡中有重要功能。
[0011] miRNA是从初级转录物产生的,初级转录物被RNase III Drosha加工为茎-环结构的前体(pre-miRNA)。在转运到细胞质后,另一种称为Dicer的RNase III裂解pre-miRNA发夹的环以形成短的双链(ds)RNA,其中一条链作为成熟miRNA掺入miRNA-蛋白质(miRNP)中。miRNA指导miRNP到达它们的靶mRNA,以发挥它们的功能(综述参见例如Bartel,D.P.(2004)Cell 23,281-292;He,L.and Hannon,G.J.(2004)Nat.Rev.Genet.5,522-531)。
[0012] 根据miRNA与其靶之间的互补性程度,miRNA可以指导不同的调节过程。与miRNA高度互补的靶mRNA被与RNA干扰(RNAi)相同的机制特异性裂解。因此,在这种情况中,miRNA的功能是小干扰RNA(siRNA)。与miRNA互补性较低的靶mRNA或者被导入细胞降解途径或者被翻译阻遏而不影响mRNA水平。但是,miRNA如何阻遏它们的靶mRNA的翻译的机制尚有争论。
[0013] 可获得的现有数据表明miRNA表达的调节异常(dysregulation)可能与某些类型的癌症的发生和/或发展相关。例如,已表明两种miRNA,miR-15及miR-16-1,定位于在慢性淋巴性白血病(CLL)中缺失的基因座上,并且发现在大约70%的CLL患者中,两种miRNA基因被缺失或下调。另外,在结肠直肠赘生物中观察到miR-143及miR-145的下调,而miRNA let-7的表达在肺癌中经常被降低(Michael,M.Z.et al.(2003)Mol.Cancer Res.1,882-891;Mayr,C.et al.(2007)Science 315,1576-1579)。
[0014] 事实上,基于miRNA表达中的癌症相关改变和miRNA通常位于癌症相关基因组区域的观察,推测miRNA可能既作为肿瘤抑制物也作为癌基因(综述参见例如
Esquela-Kerscher,A.and Slack,F.J(2006)Nat.Rev.Cancer 6,259-269;Calin,G.A.and Croce,C.M.(2007)J.Clin.Invest.117,2059-2066;Blenkiron,C.and Miska,E.A.(2007)Hum.Mol.Genet.16,R106-R113)。
[0015] 更多的系统性基于珠的流式细胞术miRNA表达分析已经揭示在肿瘤中的全局性miRNA调节,表明宿主细胞的miRNA谱分析可能确实适合用于癌症诊断(综述参见例如Lu J.et al.(2005)Nature 435,834-838;Volinia,S.et al.(2006)Proc.Natl.Acad.Sci.USA 103,2257-2261)并且已经鉴别了多种miRNA,它们的表达看起来是特定肿瘤的特征(Calin,G.A.and Croce,C.M.(2007),supra)。但是,目前仅有极少数这些异常表达的miRNA与用于肿瘤发生和/或发展的临床相关的预后因子直接相关联。
[0016] 因此,仍需要(一组)诊断标记,特别是“表达特征”或“分子足迹”形式的诊断标记,以使得可以快速、可靠和节省费用地鉴别和/或治疗显示结肠直肠癌或具有发生结肠直肠癌的倾向的细胞。另外,还持续需要相应的方法以鉴别和治疗展示这种癌表型的靶细胞。
[0017] 发明目的和发明概述
[0018] 本发明的一个目的是提供通过确定多种核酸分子而诊断和/或治疗结肠直肠癌(CRC)、特别是表现为腺癌的CRC和/或发生这种疾病的倾向的新方法,每种核酸分子编码微RNA(miRNA)序列,其中与健康对照细胞相比,所述多种核酸分子中的一或多种在所分析的靶细胞中差异表达,并且其中所述一或多种差异表达的核酸分子一起代表这样的核酸表达特征(signature),该核酸表达特征是存在结肠直肠癌或发生结肠直肠癌倾向的指征。
[0019] 更具体地,本发明的一个目的是提供用于诊断从腺瘤发展为腺癌的组合物,即用于可靠区分良性和恶性结肠直肠肿瘤。
[0020] 另外,本发明的一个目的是提供相应的方法用于鉴别显示结肠直肠癌或具有发生结肠直肠癌的倾向的一或多种哺乳动物靶细胞以及用于预防或治疗这种疾病。
[0021] 这些及其它目的从以下描述而变得明了,它们由独立权利要求的主题实现。本发明的一些优选实施方案由从属权利要求的主题限定。
[0022] 在第一方面,本发明涉及分子标记诊断试剂盒,其用于鉴别显示结肠直肠癌或具有发生结肠直肠癌的倾向的一或多种哺乳动物靶细胞,所述试剂盒包含多种核酸分子,每种核酸分子均编码微RNA序列,其中所述多种核酸分子中的一或多种在靶细胞和在一或多种对照细胞中差异表达,并且其中所述一或多种差异表达的核酸分子一起代表这样的核酸表达特征,该核酸表达特征是存在结肠直肠癌或发生结肠直肠癌倾向的指征。
[0023] 优选地,结肠直肠癌表现为腺癌。
[0024] 在本发明的优选的实施方案中,所述诊断试剂盒进一步用于鉴别发生结肠直肠腺瘤的倾向或发生结肠直肠癌的倾向或发生结肠直肠腺瘤和结肠直肠癌的倾向,或鉴别腺瘤向腺癌的发展或腺瘤向腺癌发展的倾向。
[0025] 在其它具体的实施方案中,所述核酸表达特征包含至少一种编码其表达在一或多种靶细胞中与一或多种对照细胞相比被上调的微RNA序列的核酸分子,以及包含至少一种编码其表达在一或多种靶细胞中与一或多种对照细胞相比被下调的微RNA序列的核酸分子。
[0026] 本文所述的核酸表达特征可包括至少三种核酸分子,优选地至少五种核酸分子,特别优选地至少十种核酸分子。
[0027] 优选地,所述核酸表达特征包括编码hsa-miR-224、hsa-miR-183及hsa-miR-18b的核酸分子。更优选地,所述核酸表达特征进一步包括编码hsa-miR-96、hsa-miR-182及hsa-miR-106a的核酸分子。
[0028] 在特别优选的实施方案中,所述核酸表达特征包括编码hsa-miR-224、hsa-miR-96、hsa-miR-21、hsa-miR-182、hsa-miR-183、hsa-miR-221、hsa-miR-497、hsa-miR-106b、hsa-miR-106a、hsa-miR-18b及hsa-miR-30a的核酸分子。
[0029] 在具体的实施方案中,所述核酸表达特征包括编码hsa-miR-224、hsa-miR-96、hsa-miR-21、hsa-miR-182、hsa-miR-183、hsa-miR-221、hsa-miR-497、hsa-miR-106b、hsa-miR-106a、hsa-miR-18b及hsa-miR-30a 的 核 酸 分 子,并 进 一 步 包 括 编 码hsa-miR-135b、hsa-miR-93、hsa-miR-17、hsa-miR-20b及hsa-miR-24的核酸分子。
[0030] 在另外的特别优选的实施方案中,与所述一或多种对照细胞相比,在所述一或多种靶细胞中编码hsa-miR-224、hsa-miR-96、hsa-miR-21、hsa-miR-182、hsa-miR-183、hsa-miR-221、hsa-miR-106b、hsa-miR-106a、hsa-miR-18b、hsa-miR-135b、hsa-miR-93、hsa-miR-17、hsa-miR-20b及hsa-miR-24的核酸分子的表达被上调,核酸分子hsa-miR-497及hsa-miR-30a的表达被下调。
[0031] 用于鉴别发生结肠直肠腺瘤的倾向的核酸表达特征,如本文所进一步定义,可以包括至少四种核酸分子,优选地至少两种(twofour)核酸分子。
[0032] 用于鉴别发生结肠直肠癌的倾向的核酸表达特征,如本文所进一步定义,可以包括至少32种核酸分子,优选地至少12种核酸分子,以及特别优选地至少6种核酸分子。
[0033] 用于鉴别发生结肠直肠腺瘤和癌的倾向的核酸表达特征,如本文所进一步定义,可以包括至少14种核酸分子,优选地至少8种核酸分子,以及特别优选地至少4种核酸分子。
[0034] 在本发明进一步优选的实施方案中,用于显示结肠直肠腺瘤或具有发生结肠直肠腺瘤的倾向的诊断试剂盒的核酸表达特征包括任意一或多种人靶细胞来源的编码微RNA序列的核酸分子,所述微RNA序列选自由hsa-miR-376a、hsa-miR-429、hsa-miR-451和hsa-miR-99a组成的组。
[0035] 优选地,所述用于显示结肠直肠腺瘤或具有发生结肠直肠腺瘤的倾向的诊断试剂盒的核酸表达特征包括任意一或多种人靶细胞来源的编码微RNA序列的核酸分子,所述微RNA序列选自hsa-miR-376a和hsa-miR-99a。
[0036] 特别优选地,与一或多种对照细胞相比,在一或多种靶细胞中编码hsa-miR-429的核酸分子的任意一或多种的表达被上调并且核酸分子hsa-miR-376a、hsa-miR-451和hsa-miR-99a的任意一或多种的表达被下调。
[0037] 在本发明另外的实施方案中,用于显示结肠直肠腺瘤和结肠直肠癌或具有发生结肠直肠腺瘤和结肠直肠癌的倾向的诊断试剂盒的核酸表达特征包括任意一或多种人靶细胞来源的编码微RNA序列的核酸分子,所述微RNA序列选自由hsa-miR-139-5p、* *hsa-miR-497、hsa-miR-378、hsa-miR-182、hsa-miR-20b、hsa-miR-17、hsa-miR-376c、* * *
hsa-miR-20a、hsa-miR-638、hsa-miR-335、hsa-miR-342-5p、hsa-miR-34b、hsa-miR-145和hsa-miR-552组成的组。
[0038] 优选地,用于显示结肠直肠腺瘤和结肠直肠癌或具有发生结肠直肠腺瘤和结肠直肠癌的倾向的诊断试剂盒的核酸表达特征包括任意一或多种人靶细胞来源的编码微RNA*序列的核酸分子,所述微RNA序列选自由hsa-miR-139-5p、hsa-miR-497、hsa-miR-378、* *
hsa-miR-182、hsa-miR-20b、hsa-miR-17、hsa-miR-376c和hsa-miR-20a 组成的组。
[0039] 更优选地,用于显示结肠直肠腺瘤和结肠直肠癌或具有发生结肠直肠腺瘤和结肠直肠癌的倾向的诊断试剂盒的核酸表达特征包括任意一或多种人靶细胞来源的编码微RNA*序列的核酸分子,所述微RNA序列选自由hsa-miR-139-5p、hsa-miR-497、hsa-miR-378 和hsa-miR-182组成的组。
[0040] 特别优选地,与一或多种对照细胞相比,在一或多种靶细胞中编码hsa-miR-182、* * *hsa-miR-20b、hsa-miR-17、hsa-miR-20a、hsa-miR-335 和hsa-miR-34b 的核酸分子的*
任意一或多种的表达被上调并且核酸分子hsa-miR-139-5p、hsa-miR-497、hsa-miR-378、*
hsa-miR-376c、hsa-miR-638、hsa-miR-342-5p和hsa-miR-145 的任意一或多种的表达被下调。
[0041] 在本发明的其它实施方案中,用于显示结肠直肠癌或具有发生结肠直肠癌的倾向的诊断试剂盒的核酸表达特征包括任意一或多种人靶细胞来源的编码微RNA序列的核酸分子,所述微RNA序列选自由hsa-miR-424、hsa-miR-378、hsa-miR-375、
*
hsa-miR-139-3p、hsa-miR-18b、hsa-miR-18a、hsa-miR-650、hsa-miR-194、hsa-miR-194、hsa-miR-29c、hsa-miR-939、hsa-miR-181c、hsa-miR-513c、hsa-miR-572、hsa-miR-130b、*
hsa-miR-30e、hsa-miR-455-3p、hsa-miR-192、hsa-miR-301a、hsa-miR-452、hsa-miR-98、*
hsa-miR-486-5p、hsa-miR-662、hsa-miR-19b、hsa-miR-30e、hsa-miR-151-3p、
* * *
hsa-miR-29c、hsa-miR-623、hsa-miR-550、hsa-miR-134、hsa-miR-128和hsa-miR-21 组成的组。
[0042] 优选地,用于显示结肠直肠癌或具有发生结肠直肠癌的倾向的诊断试剂盒的核酸表达特征包括任意一或多种人靶细胞来源的编码微RNA序列的核酸分子,所述微RNA序列选自由hsa-miR-424、hsa-miR-378、hsa-miR-375、hsa-miR-139-3p、hsa-miR-18b、*hsa-miR-18a、hsa-miR-650、hsa-miR-194、hsa-miR-194、hsa-miR-29c、hsa-miR-939、hsa-miR-181c组成的组。
[0043] 更优选地,优选地,用于显示结肠直肠癌或具有发生结肠直肠癌的倾向的诊断试剂盒的核酸表达特征包括任意一或多种人靶细胞来源的编码微RNA序列的核酸分子,所述微RNA序列选自由hsa-miR-424、hsa-miR-378、hsa-miR-375、hsa-miR-139-3p、hsa-miR-18b、hsa-miR-18a组成的组。
[0044] 特别优选地,与一或多种对照细胞相比,在一或多种靶细胞中编码hsa-miR-424、hsa-miR-18b、hsa-miR-18a、hsa-miR-181c、hsa-miR-130b、hsa-miR-455-3p、*
hsa-miR-301a、hsa-miR-452、hsa-miR-98、hsa-miR-19b、hsa-miR-151-3p、hsa-miR-550、*
hsa-miR-128和hsa-miR-21 的核酸分子的任意一或多种的表达被上调并且核酸分子
*
hsa-miR-378、hsa-miR-375、hsa-miR-139-3p、hsa-miR-650、hsa-miR-194、hsa-miR-194、*
hsa-miR-29c、hsa-miR-939、hsa-miR-513c、hsa-miR-572、hsa-miR-30e、hsa-miR-192、* *
hsa-miR-486-5p、hsa-miR-662、hsa-miR-30e、hsa-miR-29c、hsa-miR-623和hsa-miR-134的任意一或多种的表达被下调。
[0045] 在第二方面中,本发明涉及一种用于鉴别显示结肠直肠癌或具有发生结肠直肠癌的倾向的一或多种哺乳动物靶细胞的方法,所述方法包括:(a)确定在一或多种靶细胞中多种核酸分子的表达水平,其中每种核酸分子均编码微RNA序列;(b)确定在一或多种对照细胞中所述多种核酸分子的表达水平;及(c)通过比较在步骤(a)和(b)中获得的各自的表达水平,从所述多种核酸分子中鉴别出在靶细胞和对照细胞中差异表达的一或多种核酸分子,其中所述一或多种差异表达的核酸分子一起代表本文所述的核酸表达特征,所述核酸表达特征是存在结肠直肠癌或具有发生结肠直肠癌的倾向的指征。
[0046] 优选地,所述结肠直肠癌表现为腺癌。
[0047] 在本发明的优选的实施方案中,所述方法进一步用于鉴别发生结肠直肠腺瘤的倾向或发生结肠直肠癌的倾向或发生结肠直肠腺瘤和结肠直肠癌的倾向,或鉴别腺瘤向腺癌的发展或腺瘤向腺癌发展的倾向。
[0048] 在第三方面,本发明涉及用于预防或治疗一或多种哺乳动物靶细胞中的结肠直肠癌的方法,所述方法包括:(a)用本文所述的方法鉴别一或多种靶细胞中的核酸表达特征;和(b)修饰所述一或多种细胞中包含在所述核酸表达特征中的编码微RNA序列的一或多种核酸分子的表达,由此其表达在一或多种靶细胞中被上调的核酸分子的表达被下调,其表达在一或多种靶细胞中被下调的核酸分子的表达被上调。
[0049] 优选地,所述结肠直肠癌表现为腺癌。
[0050] 在第四方面,本发明涉及用于预防和/或治疗在一或多种哺乳动物靶细胞中的结肠直肠癌的药物组合物,所述结肠直肠癌优选地表现为腺癌,所述组合物包含一或多种核酸分子,每种核酸分子编码与由本文所述的其表达在一或多种靶细胞中被上调的核酸分子编码的微RNA至少部分互补的序列,和/或相应于由本文所述的其表达在一或多种靶细胞中被下调的核酸分子编码的微RNA序列的序列。
[0051] 最后,在第五方面,本发明涉及所述药物组合物在生产用于预防和/或治疗结肠直肠癌的药物中的用途,其中所述结肠直肠癌优选表现为腺癌。
[0052] 本发明的其它实施方案从以下详细描述变得明了。
[0053] 附图简述
[0054] 图1示出 包含 在本 发明 的特 别优 选的 表达 特征 中的 16种人 类miRNA(hsa-miR-224、hsa-miR-96、hsa-miR-21、hsa-miR-182、hsa-miR-183、hsa-miR-221、hsa-miR-497、hsa-miR-106b、hsa-miR-106a、hsa-miR-18b、hsa-miR-30a、hsa-miR-135b、hsa-miR-93、hsa-miR-17、hsa-miR-20b及hsa-miR-24)的核酸序列,其用于鉴别显示结肠直肠癌或具有发生结肠直肠癌的倾向的一或多种靶细胞,优选地用于诊断腺癌和/或腺瘤向腺癌的发展。
[0055] 图2描绘了流程图,示意性示出用于确定本发明的表达特征的关键方法步骤,所述表达特征用于鉴别显示结肠直肠癌或具有发生结肠直肠癌的倾向的一或多种靶细胞,优选地用于诊断腺癌。
[0056] 图3描绘了图1所示16种人类miRNA在不同结肠直肠样品中各自的表达水平。所述表达水平用本发明方法确定。样品1是正常(健康)结肠直肠组织,样品2来自炎性腺瘤性息肉,样品3来自管状腺瘤(tubular adenoma),样品4到6来自根据Dukes系统分类的各种腺癌(样品4:Dukes A,样品5:Dukes B,样品6:Dukes C)。所获得的数据针对在所有所测试的组织样品中稳定表达的miRNA hsa-miR-423-5p的表达水平归一化。
[0057] 图4描绘了图1所示的16种人类miRNA的特征的接受者操作特性(receiveroperating characteristic)(ROC)曲线。ROC曲线基于分析138个样品,其中有51个正常组织/炎性息肉和67个结肠直肠赘生物。曲线下面积为1,表明所测试的miRNA特征的良好的诊断效果。
[0058] 图5示出包含在本发明特别优选表达特征的进一步鉴别的结肠直肠肿瘤中的人类miRNA,其用于鉴别显示结肠直肠癌或具有发生结肠直肠癌的倾向的一或多种靶细胞。还表明了这些miRNA在肿瘤组织中与对照组织(结肠直肠正常和炎性息肉)相比的表达水平(调控)和准确度,表示为上调或下调。
[0059] 图6描绘了另一个流程图,示意性示出用于确定本发明的表达特征的关键方法步骤,所述表达特征用于鉴别显示肝细胞癌或具有发生肝细胞癌的倾向的一或多种靶细胞。
[0060] 图7描绘了12种鉴别的miRNA在结肠直肠癌的转化和发展中各自的表达水平。潜在临床价值为1)前癌(pre-cancer)(腺瘤)检测,2)早期癌症(癌)检测,3)具有腺瘤的患者的CRC风险评价。另外,它们是用于前癌以及CRC早期的药物开发的潜在靶。
[0061] 图8描绘了由所应用的三种分类算法的任意两种预测的8种鉴别的miRNA,用于在结肠直肠活组织检查和外科手术样本中将腺瘤/癌与正常/炎性息肉组织区分开。潜在临床价值为1)前癌(pre-cancer)(腺瘤)检测,2)早期癌症(癌)检测,3)具有腺瘤的患者的CRC风险评价。另外,它们是用于前癌以及CRC早期的药物开发的潜在靶。
[0062] 图9描绘了由所应用的三种分类算法的任意两种预测的4种鉴别的miRNA,用于在结肠直肠活组织检查和外科手术样本中将腺瘤与癌区分开。潜在临床价值为1)前癌(pre-cancer)(腺瘤)检测,2)早期癌症(癌)检测,3)具有腺瘤的患者的CRC风险评价。另外,它们是用于前癌以及CRC早期的药物开发的潜在靶。
[0063] 图10描绘了平台比较的实验数据,所述数据使用17种miRNA,来自14对结肠直肠肿瘤组织。
[0064] 图11描绘了17种miRNA每种的表达模式。
[0065] 图12描绘了训练数据组中的水平-1分类器的总体CV图(A),训练数据组中的交叉验证混淆矩阵(B)和测试数据组(C)。
[0066] 图13描绘了训练数据组中的水平-2分类器的总体CV图(A),训练数据组中的交叉验证混淆矩阵(B)和测试数据组(C)。

发明内容

[0067] 本发明基于如下出乎意料的发现,即显示或具有发生结肠直肠癌优选为腺癌的倾向的细胞可以基于特定的miRNA表达特征以高准确度和高灵敏度被可靠地鉴别,其中本文所述表达特征通常包括被上调和下调的人类miRNA。更具体地,所述miRNA表达特征—通过分析整体miRNA表达模式和/或各单独的miRNA的表达水平—使得能评估良性腺瘤转化为恶性腺癌的风险,由此检测早期疾病状态下的结肠直肠癌。
[0068] 以下例证的本发明可以合适地在不存在未在本文中具体揭示的任何一或多种元件、一或多种限制的条件下实施。本发明将根据特定的实施方案参照附图加以描述,但是本发明不受其限制,仅受权利要求书限制。所描述的附图仅是示意性的,被认为是非限制性的。
[0069] 当术语“包含”被用于本发明说明书和权利要求书中时,其不排除其它元件或步骤。为本发明目的,术语“由……组成”被认为是术语“包含”的优选实施方案。如果在下文中组被限定为包含至少一定数目的实施方案,这也被理解为揭示了优选地仅由这些实施方案组成的组。
[0070] 当指代单数形式名词使用不定冠词或定冠词例如“以(a)”或“以(an)”,“the”时,包括该名词的复数形式,除非特别指出。
[0071] 术语“大约”在本发明中是指本领域技术人员理解仍能保证目的特征的技术效果的准确度区间。该术语通常表示偏离指示值的±10%,优选±5%。
[0072] 另外,术语第一、第二、第三、(a)、(b)、(c)等在说明书和权利要求书中用于区分类似的元件,不是必须描述顺序或时间次序。应理解如此应用的术语在合适情况下可互换,并且本发明描述的实施方案能以不同于本文所述或例证的其它顺序操作。
[0073] 术语的进一步定义在下文中使用术语时给出。
[0074] 以下术语或定义仅为了帮助理解本发明。这些定义不应被认为具有小于本领域技术人员理解的范围。
[0075] 在第一方面,本发明涉及分子标记的诊断试剂盒,用于鉴别显示肝细胞癌或具有发生结肠直肠癌倾向的一或多种哺乳动物靶细胞,所述试剂盒包含多种核酸分子,每种核酸分子均编码微RNA序列,其中所述多种核酸分子中的一或多种在靶细胞和在一或多种对照细胞中差异表达,并且其中所述一或多种差异表达的核酸分子一起代表这样的核酸表达特征,该核酸表达特征是存在结肠直肠癌或发生结肠直肠癌倾向的指征。
[0076] 优选地,结肠直肠癌表现为腺癌。
[0077] 在本发明的优选的实施方案中,所述诊断试剂盒进一步用于鉴别发生结肠直肠腺瘤的倾向或发生结肠直肠癌的倾向或发生结肠直肠腺瘤和结肠直肠癌的倾向,或鉴别腺瘤向腺癌的发展或腺瘤向腺癌发展的倾向。
[0078] 本文所用术语“结肠直肠”涉及结肠、直肠和/或阑尾,即完整的大肠。
[0079] 本文所用术语“癌症”(也称为“癌”)通常指任何类型的恶性赘生物,即与未受影响的(健康)野生型对照细胞相比显示癌特征或具有发生癌特征的倾向的靶细胞的任何形态学和/或生理学改变(基于遗传重编程(genetic re-programming))。这种改变的例子可涉及细胞大小和形状(变大或变小)、细胞增殖(细胞数增加)、细胞分化(生理学状态中的变化)、凋亡(程序性细胞死亡)或细胞存活。因此,术语“结肠直肠癌”是指在结肠、直肠和阑尾中的癌性生长。
[0080] 本文所用术语“具有发生癌症的倾向”是指任何指示癌前病变(pre-cancerous state)即正常细胞转化为肿瘤细胞过程中的中间状态的细胞表型。换句话说,该术语表示发生癌症的风险的状态。
[0081] 最常见的结肠直肠癌(CRC)细胞类型是腺癌,其占大约95%的病例。其它类型的CRC包括淋巴瘤和鳞状细胞癌等。
[0082] 本文所用术语“腺癌”涉及结肠直肠粘膜上皮细胞的恶性赘生物。通常,腺癌是源自腺组织的癌症类型。这一组织是称作上皮组织的更广义的组织类型的一部分。上皮组织包括皮肤、腺体以及内衬(lining)/包围机体腔和器官的各种其它组织。
[0083] 胚胎学上,上皮源自外胚层、内胚层和中胚层。为了被分类为腺癌,细胞不必须是腺体的一部分,只要它们具有分泌性质即可。因此,腺癌通常也称作“腺体癌(glandular cancer)″或″腺体癌(glandular carcinoma)″。高度分化的腺癌倾向于与它们所来源的腺体组织相象,而分化差的则可能不是这样。
[0084] 在结肠中出现过度增殖上皮是癌发展的第一步。这种发育异常表皮转变为炎性腺瘤性息肉,随后转变为腺瘤,腺瘤是在结肠或直肠的内衬层中的异常但良性的赘生物(即肿瘤)。因此,本文所用术语“腺瘤“涉及良性表皮赘生物。腺瘤通常是边界清楚的并可以是扁平的或息肉样的。良性腺瘤的赘生物细胞不浸润或侵袭相邻组织并且极少转移。术语“腺瘤”应理解为等价于“非进展性腺瘤”。但是恶性腺癌侵袭其它组织并在时间足够时经常转移。恶性细胞的特征经常是进展性和不受控的生长。它们可以局部扩散或通过血流和淋巴系统扩散到机体的其它部分。具体地,肝转移(即在肝中的转移)常被发现与腺癌相关。这种转移的发生可被认为是结肠直肠癌的晚期(或甚至是癌后期(post-cancerous stage))。
[0085] 本文所用术语“进展性腺瘤(progressed adenoma)”是指携带癌症病灶的腺瘤。这也称作“恶性息肉”。结肠直肠腺瘤在老年人群中常见,但仅少部分这些前恶性肿瘤(估计约5%)发展为恶性肿瘤。这种恶性肿瘤在本文中称作(结肠直肠)“腺癌”。
[0086] 腺癌可根 据Dukes系统分 类(Dukes,C.E.(1932)J.Pathol.Bacteriol.35,323-325),其区分如下阶段:Dukes A-限于肠壁的肿瘤;Dukes B-侵袭通过肠壁的肿瘤;
Dukes C-还包括淋巴结的肿瘤;Dukes D-具有远距离转移的肿瘤。
[0087] 本发明还涉及特定的腺癌相关疾病状态的鉴别,所述疾病状态即与腺癌(密切)相关但不同于腺癌的疾病状态。因此,本文所用术语“腺癌相关疾病状态”特别涉及发生腺癌的倾向、腺瘤向腺癌的发展及腺瘤向腺癌发展的倾向。
[0088] 在本发明中“发生腺癌的倾向”是指发生腺癌的风险状态,例如具有腺瘤的状态。优选地,发生腺癌的倾向可能存在于这样的实例(即被分析的一或多种靶细胞)中,其中包含在本文所述的核酸表达特征中的核酸分子差异表达的程度(水平)与在明显显示腺癌的一或多种靶细胞中确定的程度相比降低。术语“降低”涉及差异基因表达的水平,其与在明显显示腺癌的一或多种靶细胞中确定的水平相比降低大约40%至大约90%,优选降低大约45%至大约75%,特别优选降低大约50%至大约60%。差异基因表达水平的这种降低指示发生腺癌的倾向。
[0089] 本文所用术语“腺瘤向腺癌的发展”涉及这样的疾病状态,其中包含在本文所述核酸表达特征中的核酸分子的差异表达程度(水平)与在明显显示腺瘤的一或多种靶细胞中确定的程度相比增加。该术语涉及这样的实例,其中基因表达水平与在明显显示腺瘤的一或多种靶细胞中确定的水平相比升高大约5%至大约50%,优选地大约10%至大约40%,特别优选地大约20%至大约30%。差异基因表达水平中的这种增加是腺瘤向腺癌发展的指征。
[0090] 本文所用术语“腺瘤向腺癌发展的倾向”涉及与腺瘤向腺癌的发展类似的(疾病)状态。但是包含在本文所述核酸表达特征中的核酸分子的差异表达程度(水平)与在明显显示腺瘤的一或多种靶细胞中确定的水平相比升高大约1%至大约15%,优选地大约3%至大约12%,特别优选地大约5%至大约10%。这种差异基因表达水平的增加是腺瘤向腺癌发展的倾向的指征。
[0091] 本发明中采用的哺乳动物靶细胞可以是人或非人来源的。本发明通常用人类细胞进行。本文所用术语“一或多种细胞”应被理解为不仅包括个体细胞,也包括组织、器官和生物体。本文所用术语“靶细胞”是指被至少认定是显示结肠直肠癌或具有发生结肠直肠癌倾向的细胞,其中术语“对照细胞”通常是指不具有这种癌性表型的特征的(健康)野生型细胞。但是在一些应用中,例如当比较显示不同癌或癌前状态的细胞时,具有不太严重疾病特征的细胞通常被认为是“对照细胞”。
[0092] 通常,所用的靶细胞和对照细胞衍生自从待诊断是否存在结肠直肠癌或具有发生结肠直肠癌倾向的对象中收集的生物学样品。另外,为了确证数据,“比较样品”也可以从患有给定的已知疾病状态的对象中收集。生物学样品可包括身体组织和液体,如血液、痰和尿。另外,生物学样品可含有衍生自以下细胞的细胞提取物或含有以下细胞的细胞群:上皮细胞,优选癌性上皮细胞或衍生自疑为癌性的组织的上皮细胞。还更优选的是,生物学样品包含衍生自腺组织的细胞群。另外,如果需要,细胞可以从获得的身体组织和液体中纯化,然后用作生物学样品。根据本发明,本发明的核酸标记的表达水平在对象衍生的生物学样品中确定。
[0093] 用于在本发明的体外方法中检测的样品通常应以临床可接受的方式收集,优选以保存核酸(特别是RNA)或蛋白质的方式收集。待分析的样品通常是结肠直肠活组织检查样品或切除物。来自肿瘤组织的完整细胞或细胞裂解物也可以不经介入而从结肠脱落,并最终在粪便中。因此,大便样品也被认为是分离RNA的合适来源。另外,结肠直肠腺癌细胞可迁移进其它组织。因此,血液及其它类型样品也可以使用。活组织检查样品或切除物可含有大部分腺瘤细胞和仅少部分腺癌细胞。为增加信号/背景比,切除物可以在分析之前分成不同的亚样品(例如,通过激光捕获显微切割)。即使活组织检查样品或切除物中的癌细胞总数有限,至少一个亚样品可含有增加的腺癌对腺瘤细胞比率。样品特别在最初加工之后可以合并。但是也可以使用未合并的样品。
[0094] 本文所用术语“微RNA”(或“miRNA”)具有其在本领域的普通含义(综述参见例如Bartel,D.P.(2004)Cell 23,281-292;He,L.and Hannon,G.J.(2004)Nat.Rev.Genet.5,522-531)。因此,“微RNA”是指衍生自基因组基因座的RNA分子,其从可以形成局部RNA前体miRNA结构的转录物加工而来。成熟miRNA通常长度为20、21、22、23、24或25个核苷酸,其它数目的核苷酸也可存在,例如18、19、26或27个核苷酸。
[0095] miRNA编码序列具有与侧翼基因组序列配对的潜力,使成熟miRNA放置在不完美RNA双链体之内(本文也称作茎-环或发夹结构或pre-miRNA),其作为从更长的前体转录物进行miRNA加工的中间体。这一加工通常通过分别称为Drosha和Dicer的两种特异的内切核酸酶的连续作用而发生。Drosha从初级转录物(本文也称作“pri-miRNA”)产生通常折叠成发夹或茎-环结构的miRNA前体(本文也称作“pre-miRNA”)。从这一miRNA前体,通过Dicer切出miRNA双链体,其在发夹或茎-环结构的一条臂包含成熟miRNA,在另*一条臂包含类似大小的节段(通常称为miRNA)。miRNA然后被导向其靶mRNA以发挥其功*
能,而miRNA 被降解。另外,miRNA通常衍生自与预测的蛋白质编码区不同的基因组节段。
[0096] 本文所用术语“miRNA前体”(或“前体miRNA”或“pre-miRNA”)是指从其加工出成熟miRNA的miRNA初级转录物部分。通常,pre-miRNA折叠成稳定的发夹(即双链体)或茎-环结构。发夹结构通常长度为50-80个核苷酸,优选60-70个核苷酸(计数miRNA残基、与miRNA配对的残基及任何间插节段,但排除更远的序列)。
[0097] 本文所用术语“编码微RNA序列的核酸分子”是指编码微RNA(miRNA)的任何核酸分子。因此,该术语不仅指成熟miRNA,也指如上所述的各种前体miRNA及初级miRNA转录物。另外,本发明不限于RNA分子,也包括相应的编码微RNA的DNA分子,例如通过逆转录miRNA序列产生的DNA分子。一个编码本发明的微RNA序列的核酸分子通常编码单个miRNA序列(即个体miRNA)。但是,也可能这样的核酸分子编码两个或多个miRNA序列(即两个或多个miRNA),例如转录单位包含在常用调节序列如启动子或转录终止子控制下的两个或多个miRNA序列。
[0098] 本文所用术语“编码微RNA序列的核酸分子”也被理解为包括“有义核酸分子”(即核酸序列(5′→3′)匹配或相应于所编码的miRNA(5′→3′)序列的分子)及“反义核酸分子”(即核酸序列互补于所编码的miRNA(5′→3′)序列或者换句话说匹配所编码的miRNA序列的反向互补序列(3′→5′)的分子)。本文所用术语“互补”是指“反义”核酸分子序列与相应的“有义”核酸分子序列(具有互补于反义序列的序列)形成碱基对、优选Watson-Crick碱基对的能力。
[0099] 在本发明范围内,两个核酸分子(即“有义”和“反义”分子)可以完全互补,即它们不含有任何碱基错配和/或额外的或缺失的核苷酸。或者,两个分子包含一或多个碱基错配或者它们的核苷酸总数不同(由于添加或缺失导致)。优选地,“互补”核酸分子包含显示与包含在相应的“有义”核酸分子中的序列完全互补的至少10个连续核苷酸。
[0100] 因此,包含在本发明的诊断试剂盒中的编码miRNA序列的多种核酸分子可包括一或多种“有义核酸分子”和/或一或多种“反义核酸分子”。有时,诊断试剂盒包括一或多种“有义核酸分子”(即miRNA序列本身),所述分子被认为组成了差异表达的miRNA(即分子标记)的全体或至少一个亚组,是特定疾病或发生特定疾病的倾向指征,所述特定疾病在本文中是结肠直肠癌,优选表现为腺癌的结肠直肠癌。另一方面,当诊断试剂盒包括一或多种“反义核酸分子”(即与miRNA序列互补的序列)时,所述分子可包含适合用于检测和/或定量给定样品中的一或多种特定(互补)miRNA序列的探针分子(用于进行杂交测定)和/或寡核苷酸引物(例如用于逆转录或PCR应用)等。
[0101] 在本发明中定义的多种核酸分子可以包含至少2个、至少10个、至少50个、至少100个、至少200个、至少500个、至少1000个、至少10000个或至少100000个核酸分子,每个分子均编码miRNA序列。
[0102] 本文所用术语“差异表达”是指特定miRNA在靶细胞中的表达水平相比于健康对照细胞被改变,其可以是上调(即在靶细胞中增加的miRNA浓度)或下调(即在靶细胞中降低的或消失的miRNA浓度)。换句话说,核酸分子在靶细胞中被激活至比在对照细胞中更高或更低的水平。
[0103] 在本发明范围内,在以下情况中核酸分子被认为是差异表达的,即该核酸分子在靶细胞和对照细胞中的相应表达水平通常相差至少5%或至少10%,优选地至少20%或至少25%,最优选地至少30%或至少50%。因此,后者的值相应于给定核酸分子在靶细胞中的表达水平相比于野生型对照细胞上调至少1.3倍或至少1.5倍,或者反之在靶细胞中的表达水平下调至少0.7倍或至少0.5倍。
[0104] 本文所用术语“表达水平”是指特定的miRNA序列从其基因组基因座被转录的程度,即miRNA在一或多种被分析细胞中的浓度。
[0105] 如上所述,术语“对照细胞”通常是指不具有CRC表型特征的(健康的)野生型细胞。但是,在一些应用中,例如,当比较显示不同的癌或癌前状态的细胞时,具有较不严重疾病特征的细胞通常被认为是“对照细胞”。
[0106] 表达水平的确定通常遵循本领域熟知的已建立的标准程序(参见例如Sambrook,J.et al.(1989)Molecular Cloning:A Laboratory Manual.2nd Ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY;Ausubel,F.M.et al.(2001)Current Protocols in Molecular Biology.Wiley & Sons,Hoboken,NJ)。确定可以使用例如miRNA特异性探针进行Northern印迹分析在RNA水平进行,或者在逆转录(及克隆)RNA群后用例如定量PCR或实时PCR技术在DNA水平进行。本文所用术语“确定”包括分析编码上述微RNA序列的任何核酸分子。但是,由于pri-miRNA及前-mRNA半衰期短,通常仅测量成熟miRNA的浓度。
[0107] 在具体的实施方案中,在给定样品的若干独立测量(例如两个、三个、五个或十个测量)和/或在一群靶细胞或对照细胞内的若干测量中获得的表达水平标准值被用于分析。标准值可以用本领域已知的任何方法获得。例如,平均值±2SD(标准差)或平均值±3SD的范围可被用作标准值。
[0108] 所获得的一或多种靶细胞和一或多种对照细胞的表达水平之间的差异可以归一化至另外的对照核酸例如管家基因的表达水平,管家基因的表达水平已知不根据细胞的疾病状态而不同。举例的管家基因包括β-肌动蛋白、甘油醛-3-磷酸脱氢酶和核糖体蛋白P1等。
[0109] 在优选的实施方案中,用于归一化所获得的表达水平的对照核酸是已知在细胞的各种非癌和癌(前)状态中稳定表达的另一种miRNA。
[0110] 但是,也可以基于实验证据和/或现有技术数据定义针对特定细胞表型(即疾病状态)的一或多个截断值,代替在任何实验中确定一或多种对照细胞的表达水平。在这种情况中,一或多种靶细胞的相应表达水平可以用用于归一化的稳定表达的对照miRNA确定。如果计算的“归一化”表达水平高于相应的定义的截断值,则这一发现指示基因表达上调。反之,如果计算的“归一化”的表达水平低于相应的定义的截断值,则这一发现指示基因表达下调。
[0111] 在本发明中,术语“鉴别显示结肠直肠癌或具有发生结肠直肠癌的倾向的一或多种哺乳动物靶细胞”也包括预测和可能性分析(“诊断”意义上)。本文公开的组合物和方法意在临床应用,以决定治疗形式,包括治疗性介入,诊断标准如疾病阶段,和疾病监控和疾病监视。根据本发明,可提供用于检查对象状态的中间结果。这种中间结果可与额外信息组合以帮助医生、护士或其它从业人员诊断出该对象患有该疾病。或者,本发明可用于检测对象衍生的组织中的癌细胞,并提供有用信息给医生以诊断出该对象患有该疾病。
[0112] 在本发明中,所鉴别的一或多种差异表达的核酸分子一起代表核酸表达特征,该核酸表达特征是在靶细胞中存在结肠直肠癌或发生结肠直肠癌的倾向的指征。本文所用术语“表达特征”是指一组核酸分子(例如miRNA),其中各个核酸分子的表达水平在(癌性)靶细胞和(非癌性)对照细胞之间不同。本文中,核酸表达特征也指一组标记并代表最低数目的(不同)核酸分子,每个都编码能用于鉴别靶细胞的表型状态的miRNA序列。
[0113] 在具体的实施方案中,核酸表达特征包含至少三种核酸分子,每种编码(不同的)miRNA序列。优选地,核酸表达特征包含至少五种或至少八种(不同的)核酸分子。特别优选地,核酸特征包含至少十种或至少十二种(不同的)核酸分子。
[0114] 在其它具体的实施方案中,本文所定义的核酸表达特征,例如用于鉴别发生结肠直肠腺瘤的倾向,可以包含至少两种(不同)核酸分子,优选至少4种(不同)核酸分子。
[0115] 在另外的具体实施方案中,本文所定义的核酸表达特征,例如用于鉴别发生结肠直肠癌的倾向,可以包含至少6种(不同)核酸分子,优选至少12种(不同)核酸分子,并特别优选至少32(不同)核酸分子。
[0116] 在其它具体的实施方案中,本文所定义的核酸表达特征,例如用于鉴别发生结肠直肠瘤和癌的倾向,可以包含至少4种(不同)核酸分子,优选至少8种(不同)核酸分子,并特别优选至少14(不同)核酸分子。
[0117] 通常,包含在核酸表达特征中的核酸分子是人类序列(以后称为“hsa”(人(Homo sapiens)))。
[0118] 在进一步优选的实施方案中,核酸表达特征包含至少一种编码其表达在一或多种靶细胞中与一或多种对照细胞相比被上调(即其浓度增加)的miRNA序列的核酸分子,以及包含至少一种编码其表达在一或多种靶细胞中与一或多种对照细胞相比被下调(即其浓度降低)的miRNA序列的核酸分子。
[0119] 在本发明的优选的实施方案中,诊断试剂盒的核酸表达特征包含任意一或多种人类靶细胞衍生的核酸分子,所述核酸分子编码选自如下一组的微RNA序列:
hsa-miR-224(SEQ ID NO:1)、hsa-miR-96(SEQ ID NO:2)、hsa-miR-21(SEQ ID NO:3)、hsa-miR-182(SEQ ID NO:4)、hsa-miR-183(SEQ ID NO:5)、hsa-miR-221(SEQ ID NO:6)、hsa-miR-497(SEQ ID NO:7)、hsa-miR-106b(SEQ ID NO:8)、hsa-miR-106a(SEQ ID NO:9)、hsa-miR-18b(SEQ ID NO:10)、hsa-miR-30a(SEQ ID NO:11)、hsa-miR-135b(SEQ ID NO:12)、hsa-miR-93(SEQ ID NO:13)、hsa-miR-17(SEQ ID NO:14)、hsa-miR-20b(SEQ ID NO:15)及hsa-miR-24(SEQ ID NO:16)(参见图1)。
[0120] 上述miRNA的核酸序列列于表1。
[0121] 表1
[0122]miRNA 序列(5′→3′)
hsa-miR-224 caagucacuagugguuccguu
hsa-miR-96 uuuggcacuagcacauuuuugcu
hsa-miR-21 uagcuuaucagacugauguuga
hsa-miR-182 uuuggcaaugguagaacucacacu
hsa-miR-183 uauggcacugguagaauucacu
hsa-miR-221 agcuacauugucugcuggguuuc
hsa-miR-497 cagcagcacacugugguuugu
hsa-miR-106a aaaagugcuuacagugcagguag
hsa-miR-106b uaaagugcugacagugcagau
hsa-miR-18b uaaggugcaucuagugcaguuag
hsa-miR-30a uguaaacauccucgacuggaag
hsa-miR-135b uauggcuuuucauuccuauguga
hsa-miR-93 caaagugcuguucgugcagguag
hsa-miR-17 caaagugcuuacagugcagguag
hsa-miR-20b caaagugcucauagugcagguag
hsa-miR-24 uggcucaguucagcaggaacag
hsa-miR-423-5p ugaggggcagagagcgagacuuu
hsa-let-7a ugagguaguagguuguauaguu
[0123] 为了归一化包含在所述核酸表达特征中的编码微RNA序列的核酸分子的所获得的表达水平,可优选使用miRNA hsa-miR-423-5p(SEQ ID NO:17),其在结肠直肠组织中稳定表达。为了校准目的(即确立标准浓度曲线),可优选应用miRNA hsa-let-7a(SEQ ID:18)。
[0124] 如本文所用,术语“多种核酸分子中的一或多种”及“任意一或多种人靶细胞来源的核酸分子”可涉及本文所述核酸表达特征中包含的多种核酸分子的任何亚群,例如任一种、任两种、任三种、任四种、任五种、任六种、任七种、任八种、任九种、任十种等核酸分子,每种核酸分子均编码微RNA序列。
[0125] 在本发明优选的实施方案中,所述核酸表达特征包含编码hsa-miR-224(SEQ ID NO:1)、hsa-miR-183(SEQ ID NO:5)和hsa-miR-18b(SEQ ID NO:10)的核酸分子。换句话说,所述核酸表达特征包括至少编码hsa-miR-224、hsa-miR-183和hsa-miR-18b的核酸分子,但是可以含有编码在靶细胞中与在一或多种分析的对照细胞中差异表达的任何其它miRNA序列的一或多种其它核酸分子,特别是编码上述任一其它的miRNA序列(即hsa-miR-96、hsa-miR-21、hsa-miR-182、hsa-miR-221、hsa-miR-497、hsa-miR-106b、hsa-miR-106a、hsa-miR-30a、hsa-miR-135b、hsa-miR-93、hsa-miR-17、hsa-miR-20b和hsa-miR-24)的一或多种其它核酸分子。
[0126] 在本发明的其它优选实施方案中,所述核酸表达特征进一步(即除了hsa-miR-224、hsa-miR-183和hsa-miR-18b之外)包含编码hsa-miR-96(SEQ ID NO:2)、hsa-miR-182(SEQ ID NO:4)和hsa-miR-106a(SEQ ID NO:9)的核酸分子。因此,换句话说,所述核酸表达特征包括至少编码hsa-miR-224、hsa-miR-183、hsa-miR-18b、hsa-miR-96、hsa-miR-182和hsa-miR-106a的核酸分子,但是可以含有编码在靶细胞中与在一或多种分析的对照细胞中差异表达的任何其它miRNA序列的一或多种其它核酸分子,特别是编码上述任一其他miRNA序列(即hsa-miR-21、hsa-miR-221、hsa-miR-497、hsa-miR-106b、hsa-miR-30a、hsa-miR-135b、hsa-miR-93、hsa-miR-17、hsa-miR-20b和hsa-miR-24)的一或多种其它核酸分子。
[0127] 在本发明的一个特别优选的实施方案中,所述核酸表达特征包含编码hsa-miR-224、hsa-miR-96、hsa-miR-21、hsa-miR-182、hsa-miR-183、hsa-miR-221、hsa-miR-497、hsa-miR-106b、hsa-miR-106a、hsa-miR-18b和hsa-miR-30a的核酸分子。
[0128] 在具体的实施方案中,所述核酸表达特征包含编码hsa-miR-224、hsa-miR-96、hsa-miR-21、hsa-miR-182、hsa-miR-183、hsa-miR-221、hsa-miR-497、hsa-miR-106b、hsa-miR-106a、hsa-miR-18b和hsa-miR-30a的核酸分子,进一步包含编码hsa-miR-135b、hsa-miR-93、hsa-miR-17、hsa-miR-20b和hsa-miR-24的核酸分子。
[0129] 在进一步特别优选的实施方案中,与一或多种对照细胞相比,在所述一或多种靶细胞中编码hsa-miR-224、hsa-miR-96、hsa-miR-21、hsa-miR-182、hsa-miR-183、hsa-miR-221、hsa-miR-106b、hsa-miR-106a、hsa-miR-18b、hsa-miR-135b、hsa-miR-93、hsa-miR-17、hsa-miR-20b和hsa-miR-24的核酸分子的表达被上调,编码hsa-miR-497和hsa-miR-30a的核酸分子的表达被下调。
[0130] 在本发明另外的实施方案中,所述核酸表达特征包括编码上文指定的miRNA的至少任一或多种核酸分子,且也含有编码在靶细胞中和在一或多种分析的对照细胞中差异表达的任何其它miRNA序列的一或多种另外的核酸分子,特别是编码选自如下序列组成的组的微RNA序列的任一或多种人靶细胞衍生的核酸分子:miR-374a(SEQ ID NO:19)、*hsa-miR-21(SEQ ID NO:20)、hsa-miR-34a(SEQ ID NO:21)、hsa-miR-203(SEQ ID NO:22)、hsa-miR-29b(SEQ ID NO:23)、hsa-miR-145(SEQ ID NO:24)、hsa-miR-195(SEQ ID NO:25)、*
hsa-miR-27a(SEQ ID NO:26)、hsa-miR-30e(SEQ ID NO:27)、hsa-miR-30c(SEQ ID NO:28)、hsa-miR-29c(SEQ ID NO:29)、hsa-miR-342-3p(SEQ ID NO:30)、hsa-miR-125a-3p(SEQ ID NO:31)、hsa-miR-23a(SEQ ID NO:32)、hsa-miR-31(SEQ ID NO:33)、hsa-miR-375(SEQ ID NO:34)、hsa-miR-551b(SEQ ID NO:35)、hsa-miR-572(SEQ ID NO:36)、hsa-miR-638(SEQ ID NO:37)、hsa-miR-650(SEQ ID NO:38)、hsa-miR-7(SEQ ID NO:39)、hsa-miR-939(SEQ ID NO:
40)、hsa-miR-150(SEQ ID NO:41)、hsa-miR-18a(SEQ ID NO:42)、hsa-miR-19a(SEQ ID NO:
43)、hsa-miR-424(SEQ ID NO:44)、hsa-miR-552(SEQ ID NO:45)、hsa-miR-92a(SEQ ID NO:
46)、hsa-miR-1(SEQ ID NO:47)、hsa-miR-133b(SEQ ID NO:48)、hsa-miR-20a(SEQ ID NO:
*
49)、hsa-miR-378(SEQ ID NO:50)、hsa-miR-378(SEQ ID NO:51)、hsa-miR-181c(SEQ ID NO:
52)、hsa-miR-592(SEQ ID NO:53)、hsa-miR-452(SEQ ID NO:54)、hsa-miR-139-5p(SEQ ID NO:55)、hsa-miR-192(SEQ ID NO:56)、hsa-miR-194(SEQ ID NO:57)、hsa-miR-374b(SEQ ID NO:58)、hsa-miR-95(SEQ ID NO:59)、hsa-miR-139-3p(SEQ ID NO:60)、hsa-miR-29a(SEQ ID NO:61)、hsa-miR-455-3p(SEQ ID NO:62)、hsa-miR-25(SEQ ID NO:63)、hsa-miR-130b(SEQ * *
ID NO:64)、hsa-miR-17(SEQ ID NO:65)、hsa-miR-20a(SEQ ID NO:66)、hsa-miR-215(SEQ ID NO:67)、hsa-miR-10b(SEQ ID NO:68)、hsa-miR-19b(SEQ ID NO:69)、hsa-miR-451(SEQ *
ID NO:70)、hsa-miR-143(SEQ ID NO:71)、hsa-miR-145(SEQ ID NO:72)、hsa-miR-22(SEQ ID NO:73)、hsa-miR-222(SEQ ID NO:74)、hsa-miR-122(SEQ ID NO:75)、hsa-miR-199b-5p(SEQ ID NO:76)、hsa-miR-365(SEQ ID NO:77)、hsa-miR-660(SEQ ID NO:78)、hsa-miR-100(SEQ ID NO:79)、hsa-miR-107(SEQ ID NO:80)、hsa-miR-148b(SEQ ID NO:81)、hsa-miR-204(SEQ ID NO:82)、hsa-miR-376c(SEQ ID NO:83)、hsa-miR-625(SEQ ID NO:84)、hsa-miR-429(SEQ ID NO:85)、hsa-miR-127-3p(SEQ ID NO:86)、hsa-miR-199b-3p(SEQ ID NO:87)、*
hsa-miR-26b(SEQ ID NO:88)、hsa-miR-31(SEQ ID NO:89)、hsa-miR-483-3p(SEQ ID NO:
90)、hsa-miR-483-5p(SEQ ID NO:91)、hsa-miR-503(SEQ ID NO:92)、hsa-miR-513c(SEQ ID NO:93)、hsa-miR-26a(SEQ ID NO:94)、hsa-miR-1225-5p(SEQ ID NO:95)、
*
hsa-miR-128(SEQ ID NO:96)、hsa-miR-134(SEQ ID NO:97)、hsa-miR-194(SEQ ID NO:
*
98)、hsa-miR-29b-1(SEQ ID NO:99)、hsa-miR-30e(SEQ ID NO:100)、hsa-miR-338-3p(SEQ *
ID NO:101)、hsa-miR-34b (SEQ ID NO:102)、hsa-miR-623(SEQ ID NO:103)、
hsa-miR-662(SEQ ID NO:104)、hsa-miR-98(SEQ ID NO:105)、hsa-miR-99a(SEQ ID NO:106)、*
hsa-miR-19b-1(SEQ ID NO:107)、hsa-miR-335(SEQ ID NO:108)、hsa-miR-766(SEQ ID NO:
*
109)、hsa-miR-550(SEQ ID NO:110)、hsa-miR-151-3p(SEQ ID NO:111)、hsa-miR-301a(SEQ *
ID NO:112)、hsa-miR-335(SEQ ID NO:113)、hsa-miR-342-5p(SEQ ID NO:114)、*
hsa-miR-132(SEQ ID NO:115)、hsa-miR-135a(SEQ ID NO:116)、hsa-miR-146b-5p(SEQ ID * *
NO:117)、hsa-miR-192(SEQ ID NO:118)、hsa-miR-23b(SEQ ID NO:119)、hsa-miR-29c(SEQ ID NO:120)、hsa-miR-376a(SEQ ID NO:121)、hsa-miR-486-5p(SEQ ID NO:122) 和hsa-miR-196b(SEQ ID NO:123)。
[0131] 在本发明的特异实施方案中,如上文定义的核酸表达特征进一步用于详细识别腺瘤,且包括至少任一或多种核酸分子编码选自hsa-miR-100、hsa-miR-107、
hsa-miR-148b、hsa-miR-204、hsa-miR-376c、hsa-miR-625、hsa-miR-429、hsa-miR-127-3p、hsa-miR-199b-3p(SEQ ID NO:79至SEQ ID NO:87)的微RNA序列。
[0132] 在本发明的其它具体实施方案中,如上文定义的核酸表达特征进一步用于具体识别分类为Dukes A的腺癌,且包括至少任一或多种下述的核酸分子,其编码
*
选 自 hsa-miR-26b、hsa-miR-31、hsa-miR-483-3p、hsa-miR-483-5p、hsa-miR-503、hsa-miR-513c、hsa-miR-26a(SEQ ID NO:88至SEQ ID NO:94)的微RNA序列。
[0133] 在本发明的另一个具体实施方案中,如上文定义的核酸表达特征进一步用于详细识别分类为Dukes B的腺癌,且包括至少任一或多种核酸分子,其编码选
* *
自 hsa-miR-1225-5p、hsa-miR-128、hsa-miR-134、hsa-miR-194、hsa-miR-29b-1 、*
hsa-miR-30e、hsa-miR-338-3p、hsa-miR-34b、hsa-miR-623、hsa-miR-662、hsa-miR-98、* *
hsa-miR-99a、hsa-miR-19b-1、hsa-miR-335、hsa-miR-766、hsa-miR-550(SEQ ID:95至SEQ ID:110)的微RNA序列。
[0134] 在本发明的另一个具体实施方案中,如上文定义的核酸表达特征进一步用于详细识别分类为Dukes C的腺癌,且包括至少任一或多种核酸分子,其编码选自
*
hsa-miR-151-3p、hsa-miR-301a、hsa-miR-335、hsa-miR-342-5p(SEQ ID NO:111至SEQ ID NO:114)的微RNA序列。
[0135] 在本发明的其它具体实施方案中,如上文定义的核酸表达特征进一步用于详细识别分类为Dukes D的腺癌,且包括至少任一或多种核酸分子,其编码选自hsa-miR-132、* * *hsa-miR-135a 、hsa-miR-146b-5p、hsa-miR-192、hsa-miR-23b、hsa-miR-29c 、
hsa-miR-376a、hsa-miR-486-5p、hsa-miR-196b(SEQ ID NO:115至SEQ ID NO:123)的微RNA序列。
[0136] 在本发明进一步优选的实施方案中,用于显示结肠直肠癌或具有发生结肠直肠癌倾向的诊断试剂盒的核酸表达特征包括任一或多种人靶细胞来源的核酸分子,其编码选自hsa-miR-376a(SEQ ID NO:121)、hsa-miR-429(SEQ ID NO:85)、hsa-miR-451(SEQ ID NO:70)、hsa-miR-99a(SEQ ID NO:106)的微RNA序列。
[0137] 优选地,所述用于显示结肠直肠腺瘤或具有发生结肠直肠腺瘤的倾向的诊断试剂盒的核酸表达特征包括任意一或多种人靶细胞来源的核酸分子,其编码选自
hsa-miR-376a(SEQ ID NO:121)和hsa-miR-99a(SEQ ID NO:106)的微RNA序列。
[0138] 上述miRNA的序列的核酸序列列于表2。
[0139] 表2
[0140]miRNA 序列(5′to 3′)
hsa-miR-376a aucauagagg aaaauccacg u
hsa-miR-429 uaauacuguc ugguaaaacc gu
hsa-miR-451 aaaccguuac cauuacugag uu
hsa-miR-99a aacccguaga uccgaucuug ug
[0141] 特别优选地,与一或多种对照细胞相比,在一或多种靶细胞中编码hsa-miR-429的核酸分子的任意一或多种的表达被上调并且核酸分子bsa-miR-376a、hsa-miR-451和hsa-miR-99a的任意一或多种的表达被下调(参见图5)。
[0142] 在本发明另外的实施方案中,用于显示结肠直肠腺瘤和癌或具有发生结肠直肠腺瘤和癌的倾向的诊断试剂盒的核酸表达特征包括任意一或多种人靶细胞来源的编码微RNA序列的核酸分子,所述微RNA序列选自由hsa-miR-139-5p(SEQ ID NO:55)、hsa-miR-497(SEQ ID NO:7)、hsa-miR-378*(SEQ ID NO:51)、hsa-miR-182(SEQ ID NO:4)、hsa-miR-20b(SEQ ID NO:15)、hsa-miR-17*(SEQ ID NO:65)、hsa-miR-376c(SEQ ID NO:83)、hsa-miR-20a(SEQ ID NO:66)、hsa-miR-638(SEQ ID NO:37)、hsa-miR-335*(SEQ ID NO:113)、hsa-miR-342-5p(SEQ ID NO:114)、hsa-miR-34b*(SEQ ID NO:102)、hsa-miR-145*(SEQ ID NO:
72)和hsa-miR-552(SEQ ID NO:45)组成的组。
[0143] 优选地,用于显示结肠直肠腺瘤和结肠直肠癌或具有发生结肠直肠腺瘤和结肠直肠癌的倾向的诊断试剂盒的核酸表达特征包括任意一或多种人靶细胞来源的编码微RNA序列的核酸分子,所述微RNA序列选自由hsa-miR-139-5p(SEQ ID NO:55)、hsa-miR-497(SEQ ID NO:7)、hsa-miR-378*(SEQ ID NO:51)、hsa-miR-182(SEQ ID NO:4)、hsa-miR-20b(SEQ ID NO:15)、hsa-miR-17*(SEQ ID NO:65)、hsa-miR-376c(SEQ ID NO:83)和hsa-miR-20a(SEQ ID NO:66)组成的组。
[0144] 更优选地,用于显示结肠直肠腺瘤和结肠直肠癌或具有发生结肠直肠腺瘤和结肠直肠癌的倾向的诊断试剂盒的核酸表达特征包括任意一或多种人靶细胞来源的编码微RNA序列的核酸分子,所述微RNA序列选自由hsa-miR-139-5p(SEQ ID NO:55)、hsa-miR-497(SEQ ID NO:7)、hsa-miR-378*(SEQ ID NO:51)和hsa-miR-182(SEQ ID NO:4)组成的组。
[0145] 上述miRNA的序列的核酸序列列于表3。
[0146] 表3
[0147]miRNA 序列(5′to 3′)
hsa-miR-139-5p ucuacagugc acgugucucc ag
hsa-miR-497 cagcagcaca cugugguuug u
hsa-miR-378* cuccugacuc cagguccugu gu
hsa-miR-182 uuuggcaaug guagaacuca cacu
hsa-miR-20b caaagugcuc auagugcagg uag
hsa-miR-17* acugcaguga aggcacuugu ag
hsa-miR-376c aacauagagg aaauuecacg u
*
hsa-miR-20a acugcauuau gagcacuuaa ag
hsa-miR-638 agggaucgcg ggcggguggc ggccu
hsa-miR-335* uuuuucauua uugcuccuga cc
hsa-miR-342-5p aggggugcua ucugugauug a
hsa-miR-34b* uaggcagugu cauuagcuga uug
hsa-miR-145* ggauuccugg aaauacuguu cu
hsa-miR-552 aacaggugac ugguuagaca a
[0148] 特别优选地,与一或多种对照细胞相比,在一或多种靶细胞中编码hsa-miR-182、* * *hsa-miR-20b、hsa-miR-17、hsa-miR-20a、hsa-miR-335、hsa-miR-34b 和 hsa-miR-552的核酸分子的任意一或多种的表达被上调并且核酸分子hsa-miR-139-5p、hsa-miR-497、* *
hsa-miR-378、hsa-miR-376c、hsa-miR-638、hsa-miR-342-5p和hsa-miR-145 的任意一或多种的表达被下调(参见图5)。
[0149] 在本发明的其它实施方案中,用于显示结肠直肠癌或具有发生结肠直肠癌的倾向的诊断试剂盒的核酸表达特征包括任意一或多种人靶细胞来源的编码微RNA序列的核酸分子,所述微RNA序列选自由hsa-miR-424(SEQ ID NO:44)、hsa-miR-378(SEQ ID NO:50)、hsa-miR-375(SEQ ID NO:34)、hsa-miR-139-3p(SEQ ID NO:60)、hsa-miR-18b(SEQ ID NO:*
10)、hsa-miR-18a(SEQ ID NO:42)、hsa-miR-650(SEQ ID NO:38)、hsa-miR-194(SEQ ID NO:
98)、hsa-miR-194(SEQ ID NO:57)、hsa-miR-29c(SEQ ID NO:120)、hsa-miR-939(SEQ ID NO:
40)、hsa-miR-181c(SEQ ID NO:52)、hsa-miR-513c(SEQ ID NO:93)、hsa-miR-572(SEQ ID NO:
36)、hsa-miR-130b(SEQ ID NO:64)、hsa-miR-30e(SEQ ID NO:100)、hsa-miR-455-3p(SEQ ID *
NO:62)、hsa-miR-192(SEQ ID NO:118)、hsa-miR-301a(SEQ ID NO:112)、hsa-miR-452(SEQ ID NO:54)、hsa-miR-98(SEQ ID NO:105)、hsa-miR-486-5p(SEQ ID NO:122)、
*
hsa-miR-662(SEQ ID NO:104)、hsa-miR-19b(SEQ ID NO:69)、hsa-miR-30e(SEQ ID NO:27)、*
hsa-miR-151-3p(SEQ ID NO:111)、hsa-miR-29c(SEQ ID NO:120)、hsa-miR-623(SEQ ID NO:
*
103)、hsa-miR-550(SEQ ID NO:110)、hsa-miR-134(SEQ ID NO:97)、hsa-miR-128(SEQ ID *
NO:96)和hsa-miR-21(SEQ ID NO:20)组成的组。
[0150] 优选地,用于显示结肠直肠癌或具有发生结肠直肠癌的倾向的诊断试剂盒的核酸表达特征包括任意一或多种人靶细胞来源的编码微RNA序列的核酸分子,所述微RNA序列选自由hsa-miR-424(SEQ ID NO:44)、hsa-miR-378(SEQ ID NO:50)、hsa-miR-375(SEQ ID NO:34)、hsa-miR-139-3p(SEQ ID NO:60)、hsa-miR-18b(SEQ ID NO:10)、hsa-miR-18a(SEQ ID *
NO:42)、hsa-miR-650(SEQ ID NO:38)、hsa-miR-194(SEQ ID NO:98)、hsa-miR-194(SEQ ID NO:57)、hsa-miR-29c(SEQ ID NO:120)、hsa-miR-939(SEQ ID NO:40)、hsa-miR-181c(SEQ ID NO:52)组成的组。
[0151] 更优选地,用于显示结肠直肠癌或具有发生结肠直肠癌的倾向的诊断试剂盒的核酸表达特征包括任意一或多种人靶细胞来源的编码微RNA序列的核酸分子,所述微RNA序列选自由hsa-miR-424(SEQ ID NO:44)、hsa-miR-378(SEQ ID NO:50)、hsa-miR-375(SEQ ID NO:34)、hsa-miR-139-3p(SEQ ID NO:60)、hsa-miR-18b(SEQ ID NO:10)、hsa-miR-18a(SEQ ID NO:42)组成的组。
[0152] 上述miRNA的序列的核酸序列列于表4。
[0153] 表4
[0154]miRNA 序列(5′to 3′)
hsa-miR-424 cagcagcaau ucauguuuug aa
hsa-miR-378 acuggacuug gagucagaag g
hsa-miR-375 uuuguucguu cggcucgcgu ga
hsa-miR-139-3p ggagacgcgg cccuguugga gu
hsa-miR-18b uaaggugcau cuagugcagu uag
hsa-miR-18a uaaggugcau cuagugcaga uag
hsa-miR-650 aggaggcagc gcucucagga c
hsa-miR-194* ccaguggggc ugcuguuauc ug
hsa-miR-194 uguaacagca acuccaugug ga
hsa-miR-29c uagcaccauu ugaaaucggu ua
hsa-miR-939 uggggagcug aggcucuggg ggug
hsa-miR-181c aacauucaac cugucgguga gu
hsa-miR-513c uucucaagga ggugucguuu au
hsa-miR-572 guccgcucgg cgguggccca
hsa-miR-130b cagugcaaug augaaagggc au
hsa-miR-30e uguaaacauc cuugacugga ag
hsa-miR-455-3p gcaguccaug ggcauauaca c
hsa-miR-192* cugccaauuc cauaggucac ag
hsa-miR-301a cagugcaaua guauugucaa agc
hsa-miR-452 aacuguuugc agaggaaacu ga
hsa-miR-98 ugagguagua aguuguauug uu
hsa-miR-486-5p uccuguacug agcugccccg ag
hsa-miR-662 ucccacguug uggcccagca g
hsa-miR-19b ugugcaaauc caugcaaaac uga
hsa-miR-30e* cuuucagucg gauguuuaca gc
hsa-miR-151-3p cuagacugaa gcuccuugag g
hsa-miR-29c* ugaccgauuu cuccuggugu uc
hsa-miR-623 aucccuugca ggggcuguug ggu
hsa-miR-550* ugucuuacuc ccucaggcac au
hsa-miR-134 ugugacuggu ugaccagagg gg
hsa-miR-128 ucacagugaa ccggucucuu u
*
hsa-miR-21 caacaccagu cgaugggcug u
[0155]
[0156] 特别优选地,与一或多种对照细胞相比,在一或多种靶细胞中编码hsa-miR-424、hsa-miR-18b、hsa-miR-18a、hsa-miR-181c、hsa-miR-130b、hsa-miR-455-3p、*
hsa-miR-301a、hsa-miR-452、hsa-miR-98、hsa-miR-19b、hsa-miR-151-3p、hsa-miR-550、*
hsa-miR-128和hsa-miR-21 的核酸分子的任意一或多种的表达被上调并且核酸分子
*
hsa-miR-378、hsa-miR-375、hsa-miR-139-3p、hsa-miR-650、hsa-miR-194、hsa-miR-194、*
hsa-miR-29c、hsa-miR-939、hsa-miR-513c、hsa-miR-572、hsa-miR-30e、hsa-miR-192、* *
hsa-miR-486-5p、hsa-miR-662、hsa-miR-30e、hsa-miR-29c、hsa-miR-623和hsa-miR-134的任意一或多种的表达被下调(参见图5)。
[0157] 在本发明另外的实施方案中,所述核酸表达特征包括编码上文指定的miRNA的至少任一或多种核酸分子,且也含有编码在靶细胞中和在一或多种分析的对照细胞中差异表达的任何其它miRNA序列的一或多种另外的核酸分子,特别是编码选自SEQ ID NO:1至SEQ ID NO:123的miRNA序列的任一或多种核酸分子。
[0158] 本文揭示的所有miRNA序列均已经保存在miRBase数据库中(http://microma.sanger.ac.uk/;也参见Griffiths-Jones S.et al.(2008)Nucl.Acids Res.36,D154-D158)。第二方面,本发明涉及鉴别显示结肠直肠癌或具有发生结肠直肠癌倾向的一或多种哺乳动物靶细胞的方法,所述方法包括:
[0159] (a)确定一或多种靶细胞中多种核酸分子的表达水平,每种核酸分子编码一种微RNA序列;
[0160] (b)确定一或多种对照细胞中所述多种核酸分子的表达水平;及
[0161] (c)通过对比在步骤(a)和(b)中获得的各自的表达水平,从所述多种核酸分子中鉴定出在靶细胞和对照细胞中差异表达的一或多种核酸分子,
[0162] 其中所述一或多种差异表达的核酸分子一起代表如本文定义的核酸表达特征,所述核酸表达特征是存在结肠直肠癌或发生结肠直肠癌的倾向的指征。
[0163] 优选地,所述结肠直肠癌表现为腺癌。
[0164] 在本发明的优选实施方案中,所述方法进一步用于鉴别腺瘤向腺癌的发展或者腺瘤向腺癌发展的倾向。
[0165] 本发明的方法包括确定并比较在被认为显示结肠直肠癌或具有发生结肠直肠癌倾向的一或多种靶细胞及在一或多种对照细胞中编码微RNA序列的多种核酸分子的表达水平,所述对照细胞即未示出这种癌性表型特征的典型的野生型细胞(参见上文所述)。
[0166] 第三方面,本发明涉及在一或多种哺乳动物靶细胞中预防或治疗结肠直肠癌、优选表现为腺癌的结肠直肠癌的方法,所述方法包括:
[0167] (a)通过使用如本文所述方法在一或多种靶细胞中鉴别核酸表达特征;及
[0168] (b)修饰所述一或多种细胞中核酸表达特征中所包含的编码微RNA序列的一或多种核酸分子的表达,由此其表达在所述一或多种靶细胞中被上调的核酸分子的表达被下调,且其表达在所述一或多种靶细胞中被下调的核酸分子的表达被上调。
[0169] 如本文所用,术语“修饰编码miRNA序列的核酸分子的表达”是指导致所述分子的表达水平改变的对特定核酸分子的任何操纵,即与“野生型”(即未修饰的对照)核酸分子的表达相比产生不同量的相应miRNA。如本文所用,术语“不同量”包括与未修饰的对照相比较高的量以及较低的量。换句话说,如本文所定义的操纵可以是上调(即激活)或下调(即抑制)核酸分子的表达(即特别是转录)。
[0170] 在本发明中,编码核酸表达特征中所包含的微RNA序列的一或多种核酸分子的表达以这样的方式被修饰,由此其表达在所述一或多种靶细胞中被上调的核酸分子的表达被下调,且其表达在所述一或多种靶细胞中被下调的核酸分子的表达被上调。换句话说,编码miRNA序列的特定核酸分子的表达的修饰以所述分子在所述一或多种癌性靶细胞中的调节作用的反循环(anti-cyclical)方式发生,以在所述一或多种靶细胞中干扰被上调的分子的“过度活性”和/或恢复被下调的分子的“缺陷活性”。
[0171] 在本发明方法的一个优选实施方案中,下调核酸分子的表达包括将编码与待下调的核酸分子编码的微RNA序列互补的序列的核酸分子导入一或多种靶细胞中。
[0172] 如本文所用,术语“导入细胞中”是指允许一或多种核酸分子转移进入细胞中的任何处理。这种技术的例子包括本领域熟知的转染或转导技术(参见例如Sambrook,J.et al.(1989)Molecular,Cloning:A Laboratory Manual,2nd ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY;Ausubel,F.M.et al.(2001)Current Protocols in Molecular Biology,Wiley & Sons,Hoboken,NJ)。
[0173] 如本文所用,术语“互补序列”应当理解为导入一或多种细胞中的“互补”核酸分子(本文也称作“反义核酸分子”)能与上调的内源“有义”核酸分子形成碱基对,优选Watson-Crick碱基对。
[0174] 两种核酸分子(即“有义”和“反义”分子)可以是完全互补的,即其不含有任何碱基错配和/或添加或缺失核苷酸。在其它实施方案中,这两种分子包含一或多个碱基错配或者其核苷酸总数不同(由于添加或缺失所致)。在另外的实施方案中,“互补的”核酸分子包含与上调的“有义”核酸分子中包含的序列完全互补的至少十个连续的核苷酸。
[0175] “互补的”核酸分子(即编码与待下调核酸分子所编码微RNA序列互补的核酸序列的核酸分子)可以是天然存在的DNA-或RNA分子或者在其序列中包含相同类型或一或多种不同类型的一或多个修饰的核苷酸的合成的核酸分子。
[0176] 例如,可能的是这样的核酸分子包含至少一个核糖核苷酸主链单位及至少一个脱氧核糖核苷酸主链单位。此外,所述核酸分子可含有一或多个将RNA主链修饰为2′-O-甲基基团或者2′-O-甲氧基基团(也称作2′-O-甲基化)的修饰,其防止培养基中的核酸酶降解,并且重要地是也防止RNA诱导的沉默复合核酸酶的内切核苷酸裂解,其导致miRNA的不可逆抑制。另一可能的修饰—其功能等价于2′-O-甲基化—包含锁核酸(LNA),代表含有一或多个LNA核苷酸单体的核酸类似物,其具有在RNA模拟糖构象中锁定的双环呋喃糖单位(参见例如Orom,U.A.et al.(2006)Gene 372,137-141)。
[0177] 最近开发了另一类别的miRNA表达沉默剂(silencer)。这些称作“antagomirs”的化学工程化的寡核苷酸代表与胆固醇缀合的23个核苷酸单链RNA分子(Krutzfeldt,J.et al.(2005)Nature 438,685-689)。作为这种化学修饰的寡核苷酸的另一选择,产生了作为RNA从转基因中产生的可以在细胞中表达的微RNA抑制剂。称作“微RNA海绵(sponges)”的这些竞争性抑制剂是从强启动子中表达的转录体,含有感兴趣的微RNA的多个串联结合位点(Ebert,M.S.et al.(2007)Nat.Methods 4,721-726)。
[0178] 在本发明方法的特别优选的实施方案中,表达被下调的一或多种核酸分子编码选自hsa-miR-224、hsa-miR-96、hsa-miR-21、hsa-miR-182、hsa-miR-183、hsa-miR-221、hsa-miR-106b、hsa-miR-106a和hsa-miR-18b的微RNA序列。
[0179] 在本发明方法的另一优选的实施方案中,上调核酸分子的表达包括将编码待上调的核酸分子编码的微RNA序列的核酸分子导入一或多种靶细胞中。换句话说,编码miRNA序列的核酸分子表达的上调通过将所述miRNA序列的另一拷贝(即另外的“有义”核酸分子)导入所述一或多种靶细胞中而实现。导入一或多种靶细胞中的所述“有义”核酸分子可包含与上述“反义”核酸分子相同的修饰。
[0180] 在特别优选的实施方案中,表达被上调的一或多种核酸分子编码选自hsa-miR-497和hsa-miR-30a的微RNA序列。
[0181] 导入一或多种靶细胞中以修饰核酸表达特征中所包含的一或多种编码微RNA序列的核酸分子表达的“有义”和/或“反义”核酸分子可以与调节序列可操纵地连接,以使得所述核苷酸序列表达。
[0182] 为了阐明癌性或癌前病变样品中鉴别的miRNA的任何潜在意义,可以进行关于所述miRNA可以结合的mRNA靶序列的鉴别的初步功能分析。基于miRNA既可以参与肿瘤阻抑也可以参与肿瘤发生的发现(综述参见例如Esquela-Kerscher,A.and Slack,F.J(2006)如前;Calin,G.A.and Croce,C.M.(2007)如前;Blenkiron,C.and Miska,E.A.(2007)如前),可以推测这种miRNA的mRNA靶位点包括肿瘤抑制基因以及癌基因。
[0183] 如果核酸分子包含含有关于转录和/或翻译调节信息的序列元件,且这种序列“可操纵地”与编码多肽的核苷酸序列连接,则称该核酸分子“能表达核酸分子”或者能“使得核酸序列表达”。可操纵地连接是其中所述调节序列元件与待表达的序列(和/或互相表达的序列)以能使得基因表达的方式相连的连接。
[0184] 基因表达所必需的调节区的确切性质在不同物种中可以不同,但是通常这些区域均包含启动子,在原核生物中其含有两个启动子,即指导转录起始的DNA元件以及当转录成RNA时发出翻译起始信号的DNA元件。这种启动子区域通常包括参与转录和翻译起始的5′非编码区,如在原核生物中的-35/-10盒和Shine-Dalgamo元件,或者在真核细胞中的TATA盒、CAAT序列和5′-加帽元件。这些区域也可以包含增强子或抑制子元件以及翻译信号和前导序列以将天然多肽靶向于宿主细胞的特定区室。
[0185] 另外,3′非编码序列可含有参与转录终止、聚腺苷酸化等的调节元件。然而,如果这些终止序列在特定的宿主细胞中的功能不令人满意,则可以被在该细胞中发挥功能的信号取代。
[0186] 此外,如本文定义的核酸分子的表达也可以通过例如存在修饰的核苷酸而影响(如上所述)。例如锁核酸(LNA)单体被认为通过增强对降解的抗性及通过稳定对于沉默活性关键的miRNA-靶双链体结构而增加体内miRNA的功能性半衰期(见例如Naguibneva,I.et al.(2006)Biomed.Pharmacother.60,633-638)。
[0187] 因此,提供的待导入一或多种细胞中的本发明的核酸分子可包含调节序列,优选启动子序列,任选还包含转录终止序列。
[0188] 所述启动子可以允许组成型或者诱导型基因表达。合适的启动子包括大肠杆菌lacUV5和tet(四环素应答性)启动子、T7启动子以及SV40启动子或者CMV启动子。
[0189] 本发明的核酸分子也可以包含在载体或者其它克隆载体如质粒、噬菌粒、噬菌体、粘粒或人工染色体中。在优选的实施方案中,所述核酸分子包含在载体中,特别是包含在表达载体中。除了上述调节序列及编码如本发明定义的遗传构建体的核酸序列以外,这样的表达载体可包括衍生自与用于表达的宿主相容的物种的复制和控制序列以及赋予转染的细胞可选择表型的选择标记。本领域已知且可商购许多合适的载体如pSUPER和pSUPERIOR。
[0190] 第四方面,本发明涉及用于在一或多种靶细胞中预防和/或治疗优选表现为腺癌的结肠直肠癌的组合物,所述组合物包含一或多种核酸分子,每种核酸分子编码一种序列,该序列与由其表达在一或多种靶细胞中被上调的核酸分子编码的微RNA序列至少部分互补,和/或该序列相应于由其表达在一或多种靶细胞中被下调的核酸分子编码的微RNA序列。
[0191] 在最后一方面中,本发明涉及所述的药物学组合物在生产用于预防和/或治疗优选表现为腺癌的结肠直肠癌的药物中的用途。
[0192] 在本发明中,合适的药物学组合物包括适于口服、经直肠、经鼻、局部(包括含服和舌下)、经腹膜和经胃肠外(包括经肌内、皮下或静脉内)施用的那些组合物,或者通过吸入或吹入施用的那些组合物。可以局部或全身性施用。优选通过口服、经直肠或静脉内途径施用。所述配制品可以包装为独立剂量单位。
[0193] 本发明的药物组合物包括本领域已建立的任何药物剂量形式,例如胶囊、微囊、扁囊、丸剂、片剂、粉末、小丸剂(pellet)、多颗粒制剂(例如珠、颗粒或晶体)、气雾剂、喷雾剂、泡沫、溶液、分散剂、酊剂、糖浆、酏剂、悬浮液、油包水乳状液如软膏剂,及水包油乳状液如乳液、洗剂和香脂。
[0194] 使用药物学可接受的成分以及已建立的配制方法,可以将上述(有义和反义)和核酸分子配制为药物组合物(Gennaro,A.L.and Gennaro,A.R.(2000)Remington:The Science and Practice of Pharmacy,20th Ed.,Lippincott Williams & Wilkins,Philadelphia,PA;Crowder,T.M.et al.(2003)A Guide toPharmaceutical Particulate Science.Interpharm/CRC,Boca Raton,FL;Niazi,S.K.(2004)Handbook of Pharmaceutical Manufacturing Formulations,CRC Press,Boca Raton,FL)。
[0195] 为了制备药物组合物,可以使用药物学惰性的无机或有机赋形剂(即载体)。为了制备例如丸剂、片剂、胶囊或颗粒剂,可以使用例如乳糖、滑石、硬脂酸及其盐、脂肪、蜡、固体或液体多元醇、天然油或硬化油。用于生产溶液、悬浮液、乳状液、气雾剂混合物或在使用之前重配为溶液或气雾剂混合物的粉末的合适赋形剂包括水、醇、甘油、多元醇及其合适的混合物以及植物油。所述药物学组合物也可以含有添加剂,如充填剂、结合剂、增湿剂、助流剂、稳定剂、防腐剂、乳化剂,及另外的溶剂或者增溶剂或者实现储存效果的试剂。后者可理解为可以将核酸分子掺入缓释或持续释放或靶向输送系统中,如脂质体、纳米颗粒和微囊中。
[0196] 为了靶向体内的大多数组织,需要临床可行的非侵入性策略以将如本文定义的这种药物学组合物定向于细胞。在过去,一些方法在通过将合理剂量的siRNA经静脉内注入小鼠和灵长类动物体内已经达到相当的治疗益处,而无明显的限制毒性。
[0197] 一种方法包括将miRNA的过客链(passenger strand)(miRNA*链)与胆固醇或其衍生物/缀合物共价结合,以促进通过遍在表达的细胞表面LDL受体的吸收(Soutschek,J.et al.(2004)Nature 432,173-178)。或者,未缀合的PBS-配制的锁核酸修饰的寡核苷酸(LNA-反义miR)可以用于全身性输送(Elmen,J.et al.(2008)Nature 452,896-899)。另一种输送miRNA的方法包括使miRNA包裹进使用聚乙二醇形成的特定的脂质体,以降低清除细胞的吸收并增加循环时间。这些特定的核酸颗粒(稳定的核酸-脂质颗粒或者SNALP)有效地将miRNA输送至肝脏(且不到达其它器官(综述参见例如Zimmermann,T.S.etal.(2006)Nature 441,111-114所述))。近年来,描述了一类称作lipidoid的新型脂质样输送分子(基于烷基丙烯酸酯或者烷基-丙烯酰胺与伯胺或仲胺的缀合而合成)作为RNAi治疗的输送剂(Akinc,A.et al.(2008)Nat.Biotechnol.26,561-569)。
[0198] 另外的细胞特异性靶向策略包括将miRNA与一种融合蛋白混合,该融合蛋白由与鱼精蛋白连接的靶向抗体片段组成,所述鱼精蛋白是使精子中的DNA成核并通过电荷结合miRNA的碱性蛋白(Song,E.et al.(2005)Nat.Biotechnol.23,709-717)。近来已经开发了对上述基本输送方法进行的多种修改和改变。这些技术为本领域所已知,其综述参见例如de Fougerolles,A.et al.(2007)Nat.Rev.Drug Discov.6,443-453;Kim,D.H.and Rossi,J.J.(2007)Nat.Genet.8,173-184)所述。
[0199] 本发明通过附图和如下实施例进一步描述,所述实施例只是例证了本发明的具体实施方案,无以任何方式限制本发明范围之意。实施例
[0200] 实施例1:样品收集与制备
[0201] 鉴别患者样品中显示结肠直肠癌或具有发生结肠直肠癌倾向的一或多种靶细胞的主要方法步骤示于图2。
[0202] 将手术样品在收集后立即于液氮中速冻。样品可以贮存于-80℃。使用如下临床样品:51个正常组织样品,13个炎性腺瘤性息肉样品,16个管状腺瘤样品,及59个腺癌样品(13个Dukes A样品、19个Dukes B样品、19个Dukes C样品、5个Dukes D样品及3个肝转移样品)。
[0203] 患者资料(年龄、性别、影像资料、治疗方法、其它医疗状况、家族史等)得自医院数据库用于匹配所收集的各种样品。病理学跟踪研究(例如通过苏木精和伊红(H&E)染色进行组织学分析)用于明确确定给定样品的疾病状态(即健康对照、腺瘤、腺癌或中间状态)以及保证样品的一致分级。
[0204] 对每个癌样品任选进行激光捕获显微切割技术,以特异性分离肿瘤细胞群(大约200000个细胞)。简而言之,将透明的转移膜应用于组织切片或样品的表面。在显微镜下,观察置于载玻片上的薄组织切片,并鉴别细胞群以进行分离。当选择的细胞位于观察视野的中心时,激活显微镜光学器件与集成的近红外激光二极管(near IR laser diode integral with the microscope optics)。脉冲激光束激活转移膜上的斑点(spot),使该膜与下面的选择的细胞融合。然后将具有结合的细胞的转移膜从所述薄组织切片中剥离(参见例如Emmert-Buck,M.R.et al.(1996).Science 274,998-1001;Espina,V.et al.(2007)Expert Rev.Mol.Diagn.7,647-657)。
[0205] 制备恒冷箱切片并基本如厂商指导使用激光捕获显微镜(Arcturus VeritasTM Laser Capture Microdissection Instrument(Molecular Devices,Inc.,Sunnyvale,CA,USA)进行捕获步骤。
[0206] 使用mirVanaTM miRNA分离试剂盒(Ambion,Inc.,Austin,TX,USA),根据厂商指导从临床样品中纯化miRNA。
[0207] 实施例2:样品中miRNA表达谱的分析
[0208] 可以任选地使用Agilent miRNA微阵列平台(Agilent Technologies,Santa Clara,CA,USA)根据厂商指导对特定样品中(差异)表达的miRNA进行定性分析。通过应用Quantile方法并使用本领域已知的R软件将针对单色(CY3)杂交获得的原始数据归一化。
[0209] 获得的miRNA表达数据的定量分析(验证)典型地应用TaqMan微RNA测定法(Applied Biosystems,Foster City,CA,USA)根据厂商指导通过实时定量RT-PCR进行分析。
[0210] 或者,miRNA的定量可以通过使用实时定量RT-PCR应用SYBR Green I(Sigma Aldrich Corporation,St.Louis,MO,USA)进行,SYBR Green I是一种结合双链DNA的不对称花青染料。获得的DNA-染料-复合物吸收蓝光(λmax=488nm)并发射绿光(λmax=522nm)。
[0211] 为了定量miRNA,用合成的hsa-let-7a miRNA(SEQ ID NO:18)制定标准浓度曲线,并且在数据分析期间使用一种稳定的内部miRNA(hsa-miR-423-5p,SEQ ID NO:17)进行归一化。
[0212] 在进行miRNA表达分析之前,可以向样品中加入(“掺入(spiked-in)”)与总RNA浓度成一定比率的合成的异源miRNA,作为定量分析的内部阳性对照。这种掺入miRNA可以是植物miRNA,例如ath-miR168a、ath-miR162a、ppt-miR898b或者smo-miR1100,其与人基因或转录物序列具有较低的同源性。或者,“掺入”miRNA可以是长度为18-30个核苷酸的任何序列,其与人基因或转录物序列的同源性低于70%。
[0213] 为了评估一特定miRNA在癌性靶细胞中与在健康对照细胞中相比是否差异表达,使用如下标准:
[0214] (i)在至少50%的肿瘤样品中表达水平的变化≥2且p值(概率值)≤0.05;及[0215] (ii)p值≤0.05/295(系数295归因于Bonferroni校正,因为在Agilent miRNA微阵列上295个人miRNA显示阳性信号)。
[0216] 如果满足这些标准中的至少一个,则认为所述miRNA在靶细胞和对照细胞中分别差异表达。
[0217] 为了进行定量确定,选择图1和表1中列出的11个miRNA:hsa-miR-224(SEQ ID NO:1)、hsa-miR-96(SEQ ID NO:2)、hsa-miR-21(SEQ ID NO:3)、hsa-miR-182(SEQ ID NO:4)、hsa-miR-183(SEQ ID NO:5)、hsa-miR-221(SEQ ID NO:6)、hsa-miR-497(SEQ ID NO:7)、hsa-miR-106b(SEQ ID NO:8)、hsa-miR-106a(SEQ ID NO:9)、hsa-miR-18b(SEQ ID NO:10)、hsa-miR-30a(SEQ ID NO:11)、hsa-miR-135b(SEQ ID NO:12)、hsa-miR-93(SEQ ID NO:13)、hsa-miR-17(SEQ ID NO:14)、hsa-miR-20b(SEQ ID NO:15)和hsa-miR-24(SEQ ID NO:16)。
[0218] 第一步,根据标准程序,使用表5列出的寡核苷酸引物对所述miRNA进行逆转录。所述引物的3′-末端与各自miRNA的3′-末端的8个末端核苷酸(以小写字母和黑体
表示)互补。所述引物的5′-末端具有用于随后进行实时PCR的共有序列(以大写字母表示)。
[0219] 表5
[0220]
[0221]
[0222] 进行逆转录的反应混合物(每个样品)包括:
[0223]
[0224] 逆转录反应在PCR热循环仪(例如7500 Real-Time PCR System,AppliedBiosystems,Inc.,Foster City,CA,USA)中进行,使用如下参数:
[0225]
[0226] 在根据已建立的标准程序合成第二cDNA链之后,进行实时PCR。用于PCR扩增的5′(上游)寡核苷酸引物列于表6中。通用3′(下游)引物具有序列
5′-TGTAAAACGACGGCCAG-3′,该序列与用于逆转录反应的引物(见表5)的5′-末端互补。
[0227] 进行实时PCR的反应混合物(每个样品)包括:
[0228]
[0229]
[0230] 表6
[0231]miRNA 上游实时PCR引物(5′→3′)
hsa-miR-224 CAAGTCACTAGTGGTTCCG
hsa-miR-96 TTTGGCACTAGCACATTTTTG
hsa-miR-21 TAGCTTATCAGACTGATGTTGA
hsa-miR-182 TTTGGCAATGGTAGAACTCAC
hsa-miR-183 TATGGCACTGGTAGAATTCAC
hsa-miR-221 AGCTACATTGTCTGCTGG
hsa-miR-497 CAGCAGCACACTGTGG
hsa-miR-106a AAAAGTGCTTACAGTGCAG
hsa-miR-106b TAAAGTGCTGACAGTGCA
hsa-miR-18b TAAGGTGCATCTAGTGCAG
hsa-miR-135b TGTAAACATCCTCGACTGG
hsa-miR-93 TATGGCTTTTCATTCCTATG
hsa-miR-17 CAAAGTGCTGTTCGTGC
hsa-miR-20b CAAAGTGCTTACAGTGCA
hsa-miR-24 CAAAGTGCTCATAGTGC
hsa-miR-24 TGGCTCAGTTCAGCAGG
hsa-miR-423-5p TGAGGGGCAGAGAGC
hsa-let-7a TGAGGTAGTAGGTTGTAT
[0232] 实时PCR在PCR热循环仪(例如the 7500 Real-Time PCR System,AppliedBiosystems,Inc.,Foster City,CA,USA)中进行,使用如下参数:
[0233] 步骤类型 时间 温度(℃)
[0234] 保持 3分钟 96
[0235] 循环 15秒 95
[0236] 循环 1分钟 60
[0237] 共40次循环。
[0238] 在60℃和490nm吸收波长及530nm发射波长收集各自的数据。根据厂商指导,计算每个PCR反应的Ct值并随后对miRNA进行定量。
[0239] 通常,对于每个测量进行至少三个独立实验,所确定的miRNA表达水平代表所获得的各自的各个数据的平均值。所选择的11种miRNA的平均表达水平根据稳定表达的对照miRNA hsa-mir-423-5p(SEQ ID NO:17)的平均表达水平使用下式归一化:
[0240] log2([miRNA表达水平]/[hsa-miR-423-5p表达水平])
[0241] 处于不同时期的结肠直肠癌的所述16种miRNA的各自表达水平(示例数据)示于图3。使用如下样品:样品1为正常(健康)结肠直肠组织,样品2得自炎性腺瘤性息肉,样品3得自管状腺瘤,样品4-6得自根据Dukes系统分类的不同腺癌(样品4:Dukes A,样品5:Dukes B,样品6:Dukes C)。
[0242] 各圆圈表示在各个实验中确定的值(样品)。曲线表示每个样品中的平均表达水平。获得的结果总结示于表7。如下缩写用于表示不同疾病时期:CON,正常(健康)结肠直肠组织;POL,炎性腺瘤性息肉;ADE,管状腺瘤;ACA,腺癌。关于ACA给出的miRNA表达值代表针对所分析的Dukes A、Dukes B和Dukes C腺癌获得的测定值(表7中右侧的三列)的平均值。
[0243] 表7:CRC不同时期的miRNA表达
[0244]
[0245]
[0246] 获 得 的 结 果 证 实 hsa-miR-224、hsa-miR-96、hsa-miR-21、hsa-miR-182、hsa-miR-183、hsa-miR-221、hsa-miR-106b、hsa-miR-106a和hsa-miR-18b的表达依赖于疾病的发展而相继被上调(CON<POL<ADE<ACA),而hsa-miR-497和hsa-miR-30a的表达依赖于疾病的发展而相继被下调(CON>POL>ADE>ACA)。
[0247] 另外,hsa-miR-135b、hsa-miR-93、hsa-miR-17、hsa-miR-20b和hsa-miR-24的表达依赖于疾病的发展也被上调。然而,在CON和POL样品中获得的值基本相同(CON≈/<POL<ADE<ACA)。因此,这些额外的miRNA也是区别非癌与癌状态的合适的诊断标记。
[0248] 因此,选择用于分析的11或16种miRNA的各自亚组一起代表结肠直肠癌的表达谱分析的一个独特的miRNA表达特征,其不仅使得可以鉴别这种癌症状态,还可以区别不同疾病时期。
[0249] 当将截断值(cut-off)用于每种miRNA以进行统计学数据分析时(见表8),获得的结果不仅可以高灵敏度及准确度鉴别CRC,特别是腺癌,而且也可以可靠地区别CRC发展的不同时期。
[0250] 因此,本文定义的miRNA表达特征不仅可以鉴别CRC,特别是腺癌,而且还可以对显示或怀疑具有癌前状态(即炎性腺瘤性息肉或腺瘤)的患者进行可靠的风险评价,无论所述癌前状态是否将发展为癌症。
[0251] 换句话说,本文定义的miRNA表达特征使得可以预测具有发生结肠直肠癌、优选腺癌的倾向或者腺瘤向腺癌发展倾向的患者的疾病发展情况。
[0252] 表8:miRNA特征的灵敏度/特异性
[0253] 如果上述16种miRNA一起用作小组(panel)/特征(见表9和10以及图4),则这个特征使得可以高灵敏度和准确度区别腺瘤/腺癌与正常组织/炎性息肉,因此强调了一组生物标记的影响,用以增强CRC检测的灵敏度。表9示出基于138个临床样品对本文定义的16种miRNA的小组/特征进行的多元分析,所述138个临床样品是51个正常组织/炎性息肉(39个CON,12个POL)及67个结肠直肠肿瘤(11个ADE,56个ACA)。表10描
述了这些样品的交叉验证结果,示出这种小组区别的高度灵敏度和特异性。同样,如下缩写用于表示不同的疾病时期:CON,正常(健康)结肠直肠组织;POL,炎性腺瘤性息肉;ADE,管状腺瘤;ACA,腺癌。
[0254] 表9:多元分析(Wilks′Lambda标准)
[0255]Lambda 0.159
概率 <0.0001
[0256] 表10:交叉验证结果的混淆矩阵(confusion matrix)
[0257]ADE/ACA CON/POL 总数 %准确度
ADE/ACA 67 0 67 100%
CON/POL 2 49 51 96.08%
总数 69 49 118 98.31%
[0258] 这种癌症发展风险的评价体系在若干方面具有显著的临床重要性。本发明的miRNA表达特征的鉴别提供了独特的分子标记,使得可以在早期阶段检测CRC(即在通过原位技术或者显微镜分析活组织检查或切除材料还不能检测到恶性细胞的阶段),从而CRC仍可以显著有效地得以治疗。另外,癌症发展的预测可用于指导对表现出CRC癌前病变的患者的治疗决定。
[0259] 对于其余的本发明揭示的miRNA序列(SEQ ID NO:19至SEQ ID NO:123),其各自的表达数据列于下表11中。在ID栏中,缩写k表示已知的miRNA,n表示新鉴别的miRNA。差异表达的表达水平和程度列于“几何平均数”栏中(NOR是正常组织,TUM是肿瘤组织,F是倍数)。临床样品如上文描述:正常组织、腺瘤、腺癌Dukes A-D期,及肝转移。
[0260] 表11
[0261]
[0262]
[0263]
[0264]
[0265]
[0266]
[0267]
[0268]
[0269]
[0270]
[0271]
[0272] 实施例3:样品收集和制备
[0273] 鉴别患者样品中显示结肠直肠癌或具有发生结肠直肠癌倾向的一或多种靶细胞的主要方法步骤示于图6。
[0274] 手术切除来自结肠直肠癌患者的225个组织样本。所述组织在手术后立即获得,包埋与最优切片温度(optimum cutting temperature(OCT))化合物中,在液氮中迅速冰冻并储存于-80℃。用于发现和验证研究的肿瘤样本的基线特征示于表12。匹配的正常结肠直肠组织(至少离肿瘤部位10cm)、炎性息肉和腺瘤来自患癌的相同患者。
[0275] 表12
[0276] 肿瘤样本的基线特征
[0277]结肠直肠样本 发现 验证
对照组织
正常 40 34
炎性息肉 10 8
腺瘤 15 13

Dukes′A 12 8
Dukes′B 12 9
Dukes′C 16 15
Dukes′D 17 16
组织样本数目 122 103
[0278] 患者资料(年龄、性别、影像资料、治疗方法、其它医疗状况、家族史等)得自医院数据库用于匹配所收集的不同样品。病理学追踪研究(例如通过苏木精和伊红(H&E)染色进行的组织学分析)用于明确确定给定样品的疾病状态(即健康对照、腺瘤、腺癌或中间状态)以及保证样本的一致分级。
[0279] 对每个癌样品任选进行激光捕获显微切割以特异性分离肿瘤细胞群(大约200000个细胞)。简而言之,将透明的转移膜应用于组织切片或样本的表面。在显微镜下,观察置于载玻片上的薄组织切片,并鉴别细胞群以进行分离。当选择的细胞位于观察视野的中心时,激活显微镜光学器件集成的近红外激光二极管。脉冲激光束激活转移膜上的斑点(spot),使该膜与下面的选择的细胞融合。然后将具有结合的细胞的转移膜从所述薄组织切片中剥离(综述于例如Emmert-Buck,M.R.et al.(1996).Science 274,998-1001;
Espina,V.et al.(2007)Expert Rev.Mol.Diagn.7,647-657)。
TM
[0280] 基本如厂商指导制备冷冻切片并使用激光捕获显微镜(Arcturus Veritas Laser Capture Microdissection Instrument(Molecular Devices,Inc.,Sunnyvale,CA,USA)进行捕获步骤。
[0281] 使用mirVana miRNA分离试剂盒(Ambion,Austin,TX)根据厂商指导从组织切片提取总RNA。通过NanoDrop 1000分光光度计(NanoDrop Technologies,Waltham,MA)对浓度进行定量。RNA质量控制通过2100 Bioanalyzer使用RNA 6000 Pico LabChip试剂盒(Agilent Technologies,Santa Clara,CA)进行。
[0282] 实施例4:样品中的全基因组miRNA分析
[0283] 任选使用Agilent miRNA微阵列平台(Agilent Technologies,Santa Clara,CA,USA)根据厂商指导对特定样品中(差异)表达的miRNA进行定性分析。该微阵列含有来自Sanger数据库v.10.1的723种人miRNA的探针。来自225个经LCM选择的肝脏样品各自的总RNA(100ng)用作通过Cy3掺入标记的输入。微阵列片通过XDR Scan(PMT100,PMT5)扫描。标记和杂交按照Agilent miRNA微阵列系统中的方案进行。
[0284] 实施例5:微阵列数据的数据分析
[0285] 针对单色(CY3)杂交获得的原始数据通过应用Quantile方法并使用本领域已知的GeneSpring GX10软件(Agilent Technologies,Santa Clara,CA,USA)进行归一化。在Agilent miRNA微阵列的723种miRNA中,285种miRNA选作阳性信号用于全部随后的分析。
[0286] 差异miRNA表达分析。使用Fisher检验(F检验)后的非配对t-检验鉴定在对照组织分别和腺瘤或者癌之间差异表达的基本miRNA。从归一化的值计算正常和肿瘤样品之间的表达信号倍数变化。
[0287] 对于作为诊断标记物的个体miRNA的特异性和灵敏度,使用MedCalc软件对个体miRNA进行接受者操作特性(receiver operating characteristic)(ROC)曲线分析,分别是对照组织对腺瘤或者对照组织对癌。使用95%置信区间确定显著性。
[0288] 为了评估一特定miRNA在癌发生靶细胞中与在对照细胞中相比是否差异表达,使用如下标准:
[0289] (i)在发现和验证研究中差异表达≥2倍改变且p值(概率值)≤0.05;及
[0290] (ii)在发现和验证研究中AUC(作为诊断标记物的准确度)AUC>0.700。
[0291] 如果满足至少这些标准,则认为所述miRNA在靶细胞和对照细胞中分别差异表达。
[0292] 疾病状态发展分析:对于随着CRC时期的每种邻近转换,正常组织到腺瘤、腺瘤到Duke’s A/B癌以及Duke’s A/B到Duke’s C/D癌,miRNA表达水平的改变使用双样品t-检验和Bonferroni-Hochberg校正(Benjamini et al.(1995)J.Royal Statistical Society Series B-Methodological.57,289-300)估计,错误发现率选定为0.05。
[0293] 分类/预测分析:采用三种监督分类算法(微阵列的预测分析、遗传学算法-SVM和一环朴素贝叶斯(one-loop Bayesian))从得自微阵列的用于发现和验证研究的两个数据组预测结肠直肠腺瘤和腺癌。在所有这些机器学习方法中都利用了交叉验证的方法。
[0294] 使用Nearest Shrunken Centroids算法以缺省参数进行微阵列预测分析(Tibshirani et al.(2002).Proc.Natl.Acad.Sci.USA.99,6567-6572;http://www-stat.stanford.edu/~tibs/PAM)。在来自发现研究的训练数据组中,使用10倍交叉验证来计算总体预测准确度以及寻找作为预测器(predictor)的最小的一组miRNA。所述来源于训练数据组的miRNA预测器然后在来自验证研究的独立测试数据组上进行测试。鉴别的miRNA分类器的再现性在这一步中评估。
[0295] 一环朴素贝叶斯分析根据经较小修改(参数设定、过滤标准的选择以及分类器)的先前描述的方案(Wessels et al.(2006)Bioinformatics.21,3755-3762)进行。特征分级(rangking)基于对输出的Pearson相关性分析。通过用朴素贝叶斯分类器在一个10倍内层评价环(inner evaluation loop)计算平衡的准确度,使用了优化的特征数目。
[0296] 使用我们的进化搜索工具进行围绕SVM的遗传算法(GA)包装器(wrapper),一种遗传算法(GA)上的特征选择方法(Schaffer et al.(2005)In:Janevski A,editor;pp.1-8)。该软件在http://www.csie.ntu.edu.tw/~cjlin/libsvm可获得。用线性内核来进行特征亚组选择。在一GA配置(1-环)中,在重复100次的发现过程中可获得所有的发现样品。在另一GA配置(2-环)中,设置交叉验证,将发现数据分离100次,分离成打乱的维持类型分布的学习和(内部)验证(即用来测试输出亚组的鲁棒性的来自发现组的样品)组。然后,搜索仅对学习数据工作并从不遇见验证数据中的样品,指导以后的验证。在GA执行外使用一验证数据组作为最终(外部)验证。表13显示对GA输出和在内部和外部验证样品极佳地验证的亚组的表现的总结。
[0297] 表13
[0298]
[0299] 实施例6:微阵列数据的检验
[0300] 为检验(和/或定量)获得的miRNA表达数据,根据厂商指导使用已建立的实时定量RT-PCR,其采用TaqMan MicroRNA测定法(Applied Biosystems,Foster City,CA,USA)。简要地,根据Applied Biosystem的指导使用Taqman微RNA RT试剂盒进行逆转录(RT)。
在15ul RT溶液混合物中逆转录10ng总RNA,所述混合物含有1X逆转录缓冲液、1X RT引物、1nM dNTP、4U RNA酶抑制剂和50U MultiScribe逆转录酶。然后所述RT溶液在PCR机器(Thermal cycler alpha engine,Bio-rad)上使用热程序16℃,30min;42℃,30min;85℃,
5min进行逆转录。定量PCR根据Applied Biosystem的指导使用TaqMan Universal PCR Master Mix试剂盒和Taqman微RNA测定试剂盒进行定量PCR。2ul RT产物在1X TaqMan Universal PCR Master混合物、无AmpErase UNG、1X TaqMan MicroRNA Assay混合物中进行PCR扩增。每个反应三个重复。实时PCR在Roch Light Cycling 480机器上进行,程序为
96℃,5min初始加热;然后95℃,15s;60℃,60s进行45或50个循环。Cp值在LC480软件上用二阶导数法计算。然后用标准样品Cp值绝对定量miRNA.
[0301] 来自14对结肠直肠肿瘤组织的用17种miRNA对平台比较的实验数据示于图10。17种miRNA每种的表达模式示于图11。Agilent miRNA微阵列和定量RT-PCR之间的倍数变化的定量相关性为0.90。该结果阐明使用Agilent miRNA微阵列发现的miRNA是高度可靠的。
[0302] 差异miRNA表达分析中的实验数据总结于下表14-17。表14-16列出鉴别的在结肠直肠腺瘤和癌中显示差异表达的miRNA。缩略语“Sen.”指灵敏度,而“Spec”指特异性。“倍数”指对照组织对肿瘤样品(腺瘤或癌)的比率。特别优选的RUC>0.900的miRNA(分别表14、15和16中的SEQ ID NO:121、SEQ ID NO:55、SEQ ID NO:7、SEQ ID NO:51、SEQ ID NO:
4、SEQ ID NO:15、SEQ ID NO:65、SEQ ID NO:83、SEQ ID NO:66和SEQ ID NO:44、SEQ ID NO:50、SEQ ID NO:34、SEQ ID NO:60、SEQ ID NO:10、SEQ ID NO:42、SEQ ID NO:38、SEQ ID NO:98、SEQ ID NO:57和SEQ ID NO:120)以粗体显示。表17列出文献记载的结肠直肠癌中的miRNA。45种已知的结肠直肠癌中的miRNA中,38种(84%)与本发明和已发表数据的调控相符合。
[0303] 表14
[0304] 验证的结肠直肠腺瘤中鉴别的miRNA
[0305]
[0306] 表15
[0307] 验证的结肠直肠腺瘤和癌中鉴别的miRNA
[0308]
[0309] 表16
[0310] 验证的结肠直肠癌中鉴别的miRNA
[0311]
[0312] 表17
[0313] 验证的文献记载的结肠直肠癌中的miRNA
[0314]
[0315]
[0316] 疾病状态发展分析中的实验数据总结于下表18-20。表18列出验证的随着正常至腺瘤转化其表达水平变化的miRNA。“倍数”指对照组织对腺瘤的比率。表19列出验证的随着腺瘤至癌Dukes’A/B转换其表达水平变化的miRNA。“倍数”指腺瘤对癌Dukes’A/B的比率。表20列出随着正常至腺瘤以及腺瘤至癌Dukes’A/B发展其表达水平始终变化的miRNA。特别优选的鉴别的miRNA(分别在表18、19和20中的SEQ ID NO:55、SEQ ID NO:72、SEQ ID NO:4、SEQ ID NO:45、SEQ ID NO:57、SEQ ID NO:100、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:42、SEQ ID NO:10、SEQ ID NO:62和SEQ ID NO:40)以粗体显示。在“ID”栏中,缩略语“k”指已知miRNA,而“n”指在结肠直肠癌症的转化和发展中新鉴别的miRNA。
[0317] 表18
[0318] 验证的随着正常至腺瘤转化其表达水平变化的miRNA
[0319]
[0320]
[0321] 表19
[0322] 验证的随着腺瘤至癌Dukes’A/B转换其表达水平变化的miRNA
[0323]
[0324] 表20
[0325] 验证的随着正常至腺瘤以及腺瘤至癌Dukes’A/B发展
[0326] 其表达水平始终变化的miRNA
[0327]
[0328] 在预测分析中,通过三种监督分类算法产生三组用于从正常/息肉情况中区别腺瘤/癌的生物标记物(命名为水平-1分类器),以及三组用于进一步区别腺瘤和癌的生物标记物(命名为水平-2分类器)。预测分析的表达数据总结于表21-30和图12和13中。在“ID”栏中,缩略语“k”指已知miRNA,而“n”指在结肠直肠腺瘤和癌的预测中新鉴别的miRNA。
[0329] i)水平-1分类器(腺瘤/癌对正常/息肉)
[0330] 水平-1 PAM分类器:从发现研究中在训练数据组中鉴别出最小的一套13种miRNA。每种miRN相应于其区别腺瘤/癌和正常-息肉样品的能力的PAM得分列于表21。
10倍交叉验证分析(图12B)显示该分类器的94.26%的训练平衡准确度。在来自验证研究的测试数据组(n=13)上应用获得的预测器(predictor)给出95.15%的平衡准确度(图12C)。
[0331] 表21
[0332] 训练数据组中水平-1分类器的PAM得分(n=122)
[0333]
[0334] 水平-1 GA分类器:从训练数据组(n=122)中鉴别出19种miRNA的分级最高的特征,并在进一步用内部(n=21)和外部(n=103)验证样品在区分结肠直肠腺瘤/癌和正常/息肉样品中进行验证。分级最高的特征的表现显示于表22。最高亚组的平均准确度为94.02%。
[0335] 表22
[0336] 水平-1 GA分类器中分级最高的特征的表现
[0337]ID 计数 亚组 灵敏度 特异性
n 7 hsa-miR-497 100% 92%
n 7 hsa-miR-139-3p 91% 94%
k 8 hsa-miR-192 93% 94%
k 8 hsa-miR-381 91% 94%
k 7 hsa-miR-96 95% 91%
k 7 hsa-miR-195 91% 94%
k 7 hsa-let-7g 100% 90%
k 7 hsa-miR-29b 98% 90%
k 7 hsa-miR-21 100% 88%
k 7 hsa-miR-183 98% 91%
k 7 hsa-miR-27a 100% 91%
k 7 hsa-miR-193a-3p 98% 90%
k 7 hsa-miR-135b 98% 92%
k 7 hsa-miR-16 100% 92%
k 7 hsa-miR-29a 95% 92%
k 7 hsa-miR-10b 95% 94%
k 7 hsa-miR-320 98% 92%
k 7 hsa-miR-24 98% 91%
k 7 hsa-let-7c 91% 91%
[0338] 水平-1一环朴素贝叶斯分类器:来自发现研究的训练数据组(n=122)的特征选择步骤获得在区分结肠直肠腺瘤/癌和正常/息肉样品中的74种特征。该74种miRNA以重要性降序列于表23。交叉验证分析(表24)显示该分类器在区分结肠直肠腺瘤/癌和正常/息肉样品(n=122)中的96.9%的训练平衡准确度。在来自验证研究的测试数据组(n=103)上应用所获得预测器给出96.7%的平衡准确度。
[0339] 表23
[0340] 在水平-1一环朴素贝叶斯分类器中最频繁选择的miRNA
[0341]ID 名字 分级 ID 名字 分级
k hsa-miR-135b 1 k hsa-miR-106a 38
k hsa-miR-195 2 k hsa-miR-145 39
n hsa-miR-497 3 n hsa-miR-29c 40
k hsa-miR-183 4 n hsa-miR-552 41
k hsa-miR-96 5 k hsa-miR-572 42
k hsa-miR-221 6 n hsa-miR-638 43
k hsa-miR-17 7 k hsa-miR-192 44
n hsa-miR-182 8 n hsa-miR-181c 45
k hsa-miR-224 9 k hsa-miR-381 46
n hsa-miR-378* 10 n hsa-miR-194* 47
n hsa-miR-139-5p 11 k hsa-miR-25 48
k hsa-miR-23a 12 k hsa-miR-181d 49
n hsa-miR-424 13 n hsa-miR-34b* 50
n hsa-miR-20b 14 k hsa-miR-106b 51
k hsa-miR-20a 15 k hsa-miR-194 52
n hsa-miR-378 16 k hsa-miR-34a 53
k hsa-miR-30a 17 k hsa-miR-301b 54
n hsa-miR-375 18 n hsa-miR-513c 55
n hsa-miR-139-3p 19 n hsa-miR-130b 56
n hsa-miR-18b 20 n hsa-miR-145* 57
k hsa-miR-133b 21 k hsa-miR-31 58
n hsa-miR-939 22 k hsa-miR-19a 59
k hsa-miR-10b 23 k hsa-miR-21 60
k hsa-miR-24 24 k hsa-miR-365 61
k hsa-miR-92a 25 k hsa-miR-421 62
k hsa-miR-27a 26 k hsa-miR-592 63
n hsa-miR-335* 27 n hsa-miR-301a 64
n hsa-miR-18a 28 n hsa-miR-452 65
n hsa-miR-17* 29 k hsa-miR-187* 66
n hsa-miR-342-5p 30 n hsa-miR-98 67
n hsa-miR-650 31 k hsa-miR-574-3p 68
n hsa-miR-20a* 32 n hsa-miR-662 69
k hsa-miR-215 33 n hsa-miR-376c 70
k hsa-miR-150 34 k hsa-miR-204 71
k hsa-miR-93 35 n hsa-miR-30e 72
k hsa-miR-342-3p 36 k hsa-miR-140-3p 73
k hsa-miR-1 37 n hsa-miR-192* 74
[0342] 表24
[0343] 水平-1一环朴素贝叶斯分类器的混淆矩阵
[0344] A训练数据组上的混淆矩阵(n=122)
[0345]真实\预测 正常+息肉 腺瘤+癌 预测错误率
正常+息肉 49 1 0.02
腺瘤+癌 3 69 0.04
[0346] B测试数据组上的混淆矩阵(n=103)
[0347]真实\预测 正常+息肉 腺瘤+癌 预测错误率
正常+息肉 42 0 0.00
腺瘤+癌 4 57 14.25
[0348] 水平-1分类器的重叠miRNA:对三种水平-1分类器的组分进行比较。由所采用的分类算法中任两种共有的鉴别为分类器组分的miRNA更有希望作为具有强诊断能力的miRNA,特别是由所有三种监督分类算法共鉴别的小组miRNA。共有的miRNA列于表25。特别优选的鉴别的miRNA(表16中的SEQ ID NO:7、SEQ ID NO:60、SEQ ID NO:55、SEQ ID NO:34、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:44和SEQ ID NO:4)以粗体显示。
[0349] 表25
[0350] 分类器比较和水平-1分类器共有的miRNA
[0351]
[0352] ii)水平-2分类器(腺瘤对癌)
[0353] 水平-2 PAM分类器:从发现研究中的训练数据组中鉴别出最小的一套36种miRNA。每种miRN相应于其区别腺瘤/癌和正常-息肉样品的能力的PAM得分列于表26。
10倍交叉验证分析(图13)显示该分类器的93.06%的训练平衡(balance)准确度。在来自验证研究的测试数据组(n=103)上应用获得的预测器给出93.44%的平衡准确度(图
13C)。
[0354] 表26
[0355] 训练数据组中水平-2分类器的PAM得分(n=122)
[0356]
[0357]
[0358] 水平-2 GA分类器:从训练数据组(n=122)中鉴别出20种miRNA的分级最高的特征,并在进一步用内部(n=21)和外部(n=103)验证样品进行验证以区分结肠直肠腺瘤和癌样品。分级最高的特征的表现显示于表27。最高亚组的平均准确度为91.51%。
[0359] 表27
[0360] 水平-2 GA分类器中分级最高的特征的表现
[0361]
[0362] 水平-2一环朴素贝叶斯分类器:来自发现研究的训练数据组(n=122)的特征选择步骤获得用于区分结肠直肠腺瘤和癌的27种特征。该27种miRNA以重要性降序列于表28。交叉验证分析(表29)显示该分类器99.9%的训练平衡准确度。在来自验证研究的测试数据组(n=103)上应用所获得预测器给出87.4%的平衡准确度。
[0363] 表28
[0364] 在水平-2一环朴素贝叶斯分类器中最频繁选择的miRNA
[0365]ID 名字 分级 ID 名字 分级
n hsa-miR-99a 1 n hsa-miR-486-5p 15
n hsa-miR-650 2 n hsa-miR-378 16
n hsa-miR-424 3 k hsa-miR-20a 17
*
k hsa-miR-92a 4 n hsa-miR-194 18
k hsa-miR-125b 5 k hsa-miR-215 19
n hsa-miR-375 6 n hsa-miR-194 20
k hsa-miR-7 7 n hsa-miR-29c 21
k hsa-miR-144 8 n hsa-miR-513c 22
n hsa-miR-451 9 k hsa-miR-100 23
k hsa-miR-218 10 n hsa-miR-139-3p 24
k hsa-miR-214 11 k hsa-miR-365 25
k hsa-miR-494 12 k hsa-miR-146a 26
k hsa-miR-801 13 n hsa-miR-30e 27
k hsa-miR-17 14
[0366] 表29
[0367] 水平-2一环朴素贝叶斯分类器的混淆矩阵
[0368] A训练数据组上的混淆矩阵(n=122)
[0369]真实\预测 腺瘤 癌 预测错误率
腺瘤 15 0 0.00
癌 1 56 0.02
[0370] B测试数据组上的混淆矩阵(n=103)
[0371]真实\预测 腺瘤 癌 预测错误率
腺瘤 10 3 0.30
癌 1 47 0.02
[0372]
[0373] 水平-2分类器的重叠miRNA:对三种水平-1分类器的组分进行比较。由所采用的分类算法中任两种共有的鉴别为分类器组分的miRNA更有希望作为具有强诊断能力的miRNA,特别是由所有三种监督分类算法共鉴别的小组miRNA。共有的miRNA列于表30。特别优选的鉴别的miRNA(表30中的SEQ ID NO:34,SEQ ID NO:44,SEQ ID NO:70 and SEQ ID NO:106)以粗体显示。
[0374] 表30
[0375] 分类器比较及水平-2分类器共有的miRNA
[0376]
[0377] 在此举例描述的本发明可以适当地在不存在本文特别揭示的任何因素、限制的条件下进行。因此,例如术语“包含”、“包括”“含有”等应具有广泛含义且无限制。另外,本文采用的术语和表达法用于描述本发明而无限制之意,且使用这些术语和表达法没有排除所示和所述特征的任何等同物或其部分之意,而是能意识到在权利要求范围内可以对本发明进行各种修改。因此,应理解尽管通过实施方案和任选的特征对本发明进行了特别揭示,但是本领域技术人员可以对本发明进行修改和改变,这种修改和改变包含在本发明的范围内。
[0378] 本文广泛及上位地描述了本发明。落入上位描述范围内的每个较窄的下位概念和亚上位集合也组成了本发明的一部分。这包括用条件或从上位中除去任何主题的否定限制对本发明的上位描述,而无论所除去的主题是否在本文中特别引述。
[0379] 其它实施方案在如下权利要求范围内。另外,当本发明的特征或各个方面用马库什组方式描述时,本领域技术人员能意识到本发明也以马库什组的任何各个成员或成员亚组方式被描述。
[0380] 本发明还涉及如下所描述的进一步的实施方案:
[0381] 1.用于鉴别显示结肠直肠癌或具有发生结肠直肠癌倾向的一或多种哺乳动物靶细胞的分子标记诊断试剂盒,所述试剂盒包含多种核酸分子,每种核酸分子编码微RNA序列,
[0382] 其中所述多种分子的一或多种在所述靶细胞和一或多种对照细胞中差异表达,及[0383] 其中所述一或多种差异表达的核酸分子一起代表核酸表达特征,所述核酸表达特征是存在结肠直肠癌或发生结肠直肠癌倾向的指征。
[0384] 2.1的试剂盒,其中所述结肠直肠癌表现为腺癌。
[0385] 3.2的试剂盒,可进一步用于鉴别腺瘤向腺癌的发展或者腺瘤向腺癌发展的倾向。
[0386] 4.1-3的试剂盒,其中所述核酸表达特征包含至少一种编码其表达在一或多种靶细胞中与在一或多种对照细胞中相比被上调的微RNA序列的核酸分子;及包含至少一种编码其表达在一或多种靶细胞中与在一或多种对照细胞中相比被下调的微RNA序列的核酸分子。
[0387] 5.1-4的试剂盒,其中所述核酸表达特征包含至少三种核酸分子,优选至少五种核酸分子,特别优选至少十种核酸分子。
[0388] 6.1-5任一项的试剂盒,其中所述核酸表达特征包含编码hsa-miR-224、hsa-miR-183和hsa-miR-18b的核酸分子。
[0389] 7.6的试剂盒,其中所述核酸表达特征进一步包含编码hsa-miR-96、hsa-miR-182和hsa-miR-106a的核酸分子。
[0390] 8.1-7任一项的试剂盒,其中所述核酸表达特征包含编码hsa-miR-224、hsa-miR-96、hsa-miR-21、hsa-miR-182、hsa-miR-183、hsa-miR-221、hsa-miR-497、hsa-miR-106b、hsa-miR-106a、hsa-miR-18b和hsa-miR-30a的核酸分子。
[0391] 9.8的试剂盒,其中所述核酸表达特征进一步包含编码hsa-miR-135b、hsa-miR-93、hsa-miR-17、hsa-miR-20b和hsa-miR-24的核酸分子。
[0392] 10.8或9的试剂盒,其中在所述一或多种靶细胞中与在一或多种对照细胞中相比,编码hsa-miR-224、hsa-miR-96、hsa-miR-21、hsa-miR-182、hsa-miR-183、hsa-miR-221、hsa-miR-106b、hsa-miR-106a、hsa-miR-18b、hsa-miR-135b、hsa-miR-93、hsa-miR-17、hsa-miR-20b和hsa-miR-24的核酸分子的表达被上调,而核酸分子hsa-miR-497和hsa-miR-30a的表达被下调。
[0393] 11.鉴别显示优选表现为腺癌的结肠直肠癌或具有发生优选表现为腺癌的结肠直肠癌的倾向的一或多种哺乳动物靶细胞的方法,所述方法包括:
[0394] (a)确定在所述一或多种靶细胞中多种核酸分子的表达水平,每种核酸分子均编码微RNA序列;
[0395] (b)确定在一或多种对照细胞中所述多种核酸分子的表达水平;及
[0396] (c)通过对比在步骤(a)和(b)中获得的各自的表达水平,从所述多种核酸分子中鉴别出在所述靶细胞和对照细胞中差异表达的一或多种核酸分子,
[0397] 其中所述一或多种差异表达的核酸分子一起代表如在1-10任一项中定义的核酸表达特征,所述核酸表达特征是存在结肠直肠癌或发生结肠直肠癌的倾向的指征。
[0398] 12.11的方法,其进一步用于鉴别腺瘤向腺癌的发展,或者腺瘤向腺癌发展的倾向。
[0399] 13.在一或多种哺乳动物靶细胞中预防或治疗优选表现为腺癌的结肠直肠癌的方法,所述方法包括:
[0400] (a)通过使用11或12的方法在一或多种靶细胞中鉴别核酸表达特征;及
[0401] (b)修饰所述一或多种细胞中包含在核酸表达特征中的编码微RNA序列的一或多种核酸分子的表达,由此其表达在所述一或多种靶细胞中被上调的核酸分子的表达被下调,且其表达在所述一或多种靶细胞中被下调的核酸分子的表达被上调。
[0402] 14.预防和/或治疗一或多种靶细胞中优选表现为腺癌的结肠直肠癌的药物组合物,所述组合物包含一或多种核酸分子,每种核酸分子均编码与如1-9任一项所定义的其表达在所述一或多种靶细胞中被上调的核酸分子编码的微RNA序列至少部分互补的序列,和/或相应于如1-10任一项所定义的其表达在所述一或多种靶细胞中被下调的核酸分子编码的微RNA序列的序列。
[0403] 15.14的药物组合物在制备预防和/或治疗优选表现为腺癌的结肠直肠癌的药物中的应用。