Click-iG:一种多类型完整糖肽的鉴定方法转让专利

申请号 : CN202211018274.4

文献号 : CN115420821B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 陈兴刘嘉琳

申请人 : 北京大学

摘要 :

本发明公开了Click‑iG:一种多类型完整糖肽的鉴定方法,具体是利用非天然糖代谢标记技术,在细胞或活体组织样品中多种类型糖基化修饰蛋白的聚糖链上引入一个叠氮基团,然后通过生物正交的点击化学反应,使糖蛋白的聚糖链上连接有生物素基团标签,随后将蛋白酶解为肽段,再通过链霉亲和素‑生物素相互作用对糖基化修饰肽段进行富集,最后通过基于sceHCDpdEThcD碎裂技术的静电轨道离子阱高分辨质谱进行质谱鉴定,并使用pGlyco3软件进行搜库分析。所述的方法流程具有鉴定糖基化修饰种类多、修饰位点信息与糖链组成信息完全、鉴定覆盖度高等优点,可以对复杂生物样品的N‑糖基化、黏蛋白型O‑糖基化和O‑GlcNAc糖基化完整糖肽进行统一鉴定,从而实现对同一样品中多类型糖基化修饰组学的综合研究。

权利要求 :

1.一种多类型完整糖肽的鉴定方法,包括如下步骤:

1)对待鉴定细胞或组织样品进行非天然糖代谢标记,即,将叠氮基团整合到多种类型糖基化修饰的聚糖结构中,使样品中糖蛋白的聚糖链上标记有叠氮基团;

步骤1)中,所述待鉴定细胞或组织样品为活细胞或活体组织样品;

步骤1)的操作为:向细胞培养基或小鼠腹腔内加入或注射含有叠氮基团的单糖类似物,对细胞或活体组织样品的糖基化修饰蛋白进行聚糖标记,使糖蛋白的聚糖链上标记有可用于生物正交点击化学反应的叠氮基团;

所述含有叠氮基团的单糖类似物为1,6‑Pr2GalNAz或1,6‑Pr2ManNAz;

2)蛋白提取并利用点击化学反应使糖蛋白的聚糖链标记上生物素基团;

3)对所提取的蛋白进行变性、还原、烷基化和胰蛋白酶酶解,使其消化为肽段;

4)通过链霉亲和素‑琼脂糖小珠对所得肽段进行富集,并在紫外光照射的条件下将其释放、收集;

5)对收集的糖肽进行基于sceHCD pd EThcD碎裂方法的液相色谱‑串联质谱检测,最后通过pGlyco3软件对质谱数据进行完整糖肽解析;

步骤5)中,用于肽段分离的色谱柱为EasySpray反向色谱柱;填料为PepMap C18颗粒;

色谱系统装置为Dionex Ultimate 3000RPLC纳喷雾系统;

质谱采集系统为Orbitrap Fusion Lumos质谱仪,其串级质谱碎裂模式为阶梯能量高能碰撞解离‑靶标离子激发‑电子转移解离sceHCD pd EThcD;

阶梯能量高能碰撞解离‑靶标离子激发‑电子转移和高能碰撞解离sceHCD pd EThcD的参数为:归一化碰撞能量NCE为20‑30‑40;EThcD的辅助激发能SA为35;

质谱设置相关参数:肽段母离子采集范围是350‑2000Th,其中AGC设置为400000,分辨率设置为200m/z的条件下12000。

2.根据权利要求1所述的方法,其特征在于:步骤2)的操作为:向步骤1)所得体系中加入裂解液,进行超声破碎、离心吸取上清液,获取裂解液;在裂解液中加入炔基‑光切割‑生物素探针、CuSO4和BTTAA、抗坏血酸钠,反应,使生物素连接到目标蛋白上,向所得反应体系中加入甲醇沉淀蛋白;

所述反应在室温下进行,所述反应的时间为2‑3小时。

3.根据权利要求2所述的方法,其特征在于:所述炔基‑光切割‑生物素探针的结构式为。

4.根据权利要求1‑3中任一项所述的方法,其特征在于:步骤3)的操作为:将步骤2)得到的蛋白沉淀用尿素复溶,加入NH4HCO3,加入二硫苏糖醇DTT,还原反应;向反应后的溶液中加入碘乙酰胺IAA,烷基化反应;向反应后的溶液中加入NH4HCO3,加入胰蛋白酶,酶解反应;

其中,所述还原反应的温度为32‑37°,时间为0.5‑1小时;

所述烷基化反应的温度为25‑29°,时间为0.5‑1小时;

所述酶解反应的温度为32‑37°,时间为16‑20小时。

5.根据权利要求1‑3中任一项所述的方法,其特征在于:步骤4)的操作为:向酶解后所得溶液中加入链霉亲和素‑琼脂糖小珠,孵育;离心,吸除上清液;将收集到的链霉亲和素‑琼脂糖小珠用甲酸溶液重悬后置于紫外光下照射,释放糖肽;离心,收集上清液,干燥,得到糖肽干粉;

其中,所述孵育在室温下进行,所述孵育在旋转下进行,所述孵育的时间为2‑3小时;

所述甲酸溶液为体积百分浓度为0.1%甲酸溶液;

所述紫外光下照射的时间为5‑15分钟。

6.根据权利要求1‑3中任一项所述的方法,其特征在于:步骤5)中,色谱流动相A相为0.1%甲酸的水溶液,B相为80%乙腈,0.1%甲酸的水溶液;

色谱流动相的梯度参数为:0‑10min:B相从1%到7%;11‑311min:B相从7%到35%;

311‑353min:B相从35%到44%;353‑356min:B相从44%到99%。

说明书 :

Click‑iG:一种多类型完整糖肽的鉴定方法

技术领域

[0001] 本发明属于蛋白质组学研究方向中化学糖基化蛋白质组学领域,具体涉及多类型糖基化修饰完整糖肽的综合鉴定。

背景技术

[0002] 蛋白质糖基化修饰是一类存在非常广泛的翻译后修饰,它具有极高的微观不均一性,表现为复杂多变的聚糖结构以不同种类的糖苷键形式,连接于蛋白质特定氨基酸上,参与调控如细胞粘附、细胞间通讯及信号转导等众多重要生物学过程。根据连接方式的不同,糖基化修饰可主要分为N‑连接糖基化、黏蛋白型O‑连接糖基化和O‑GlcNAc糖基化。N‑糖链通常具有五糖核心结构,修饰在蛋白质的天冬酰胺残基上,按照糖单元组成与连接方式的不同,可再分为高甘露型、混合型和复杂型。黏蛋白型O‑连接糖基化以N‑乙酰半乳糖胺作为起始糖单元,通过O‑糖苷键的形式修饰在丝氨酸或苏氨酸残基上,其糖链主要有8种核心结构,并可进一步被延展。O‑GlcNAc则是一种发生于胞质的糖基化修饰,受唯一的一对糖基转移酶(OGT)与糖基水解酶(OGA)的调控,由单个N‑乙酰葡萄糖胺(GlcNAc)连接在丝氨酸或苏氨酸残基上。不同类型的糖基化修饰具有独特的糖链结构与理化性质,它们在功能发挥上既相对独立又相互协同,共同维持生命活动的有序进行。异常的糖基化修饰与许多人类重大疾病,尤其是癌症的发生发展密切相关。因此,开发一种能够系统性地鉴定生物体系中多类型糖基化修饰的分析方法,具有十分重要的意义。
[0003] 目前蛋白质糖基化修饰的鉴定主要面临的困难是,不同类型糖基化修饰的鉴定方法彼此独立,很难从同一样品获取全面而综合的多类型糖基化修饰图谱,极大地限制了人们对不同生物体系中糖基化修饰调控网络的认识,阻碍了对糖生物学功能的探索。例如对于N‑连接糖基化修饰的鉴定,目前应用较为广泛的技术是基于亲水作用色谱,对N‑糖基化肽段进行富集,而后基于高能碰撞碎裂(HCD)的串级质谱方法进行完整N‑糖肽的鉴定。对于O‑GlcNAc修饰的研究,则主要基于化学酶法标记或非天然糖代谢标记技术对其修饰蛋白或修饰肽段进行富集,而后基于电子转移/高能碰撞解离(EThcD)的模式对其修饰位点进行鉴定。而对于黏蛋白型O‑连接糖基化修饰的研究,由于其富集技术尚不完善、糖链结构微观不均一性较高以及修饰位点缺乏明确的序列特征,目前仍缺乏较为成熟的技术能够对完整黏蛋白型O‑糖肽进行深度鉴定。这些因素极大地增加了在同一样品中对多类型完整糖肽进行综合鉴定的困难。科学家们曾试图基于非天然糖代谢标记技术实现多种类型糖基化修饰肽段的综合鉴定,但是由于非天然糖类别、富集技术路线、串级质谱分析技术以及完整糖肽质谱数据解析等众多因素的限制,其实现的鉴定规模十分有限,且不包含糖基化修饰位点信息。
[0004] 非天然糖代谢标记技术,利用生物体自身的糖合成途径,可以有效地将携带有生物正交反应活性的化学基团整合到聚糖结构中,用于糖蛋白或糖肽的高效富集。在脊椎动物中,聚糖结构均由9中单糖组合而成,不同类型的糖基化修饰共用着相同或可以在自身糖合成途径中相互转化的单糖单元,如N‑乙酰葡萄糖胺(GlcNAc)和N‑乙酰半乳糖胺(GalNAc)。选用合适的非天然糖单元,即可实现对多类型糖基化修饰蛋白或糖基化修饰肽段的统一标记与富集。此外,质谱的碎裂方式对于完整糖肽的鉴定也极为重要。完整N‑糖肽由于其N‑糖链结构复杂,需要整合不同能量的HCD方法,获取信息最丰富的糖碎片离子、肽碎片离子以及携带有部分糖链结构的糖肽碎片离子,实现其高效鉴定。对于O‑GlcNAc修饰,由于O‑连接糖苷键较为脆弱,其在HCD的碎裂模式下不易被保留,而其糖基化修饰位点又缺乏明确的序列特征,因此需要使用EThcD的碎裂方法,获取其侧链结构完整的肽段碎片离子,实现其完整糖肽的鉴定。因此,对于多类型完整糖肽的综合鉴定,需要有机的将不同碎裂方法整合起来。阶梯能量高能碰撞解离‑靶标离子激发‑电子转移解离(sceHCD pd EThcD)的碎裂模式,可以利用sceHCD产生足够丰富的碎片离子用于完整N‑糖肽的鉴定,而通过靶标糖碎片离子激发的EThcD,可以在肽段碎片离子上保留黏蛋白型O‑连接糖基化修饰以及O‑GlcNAc糖基化修饰的糖链结构,实现多类型完整糖肽的高效鉴定。

发明内容

[0005] 本发明的目的是准确高效地实现多种类型完整糖肽的综合鉴定,即实现包括N‑连接糖基化修饰、黏蛋白型O‑连接糖基化修饰和O‑GlcNAc糖基化修饰在内的糖基化肽段序列、修饰位点信息以及糖链组成的同时鉴定,从而描绘不同生命体系中的糖基化修饰图谱。
[0006] 为实现上述目的,本发明使用的方案为:
[0007] 本发明所提供的用于多类型完整糖肽的鉴定方法包括如下步骤:
[0008] 1)对待鉴定细胞或组织样品进行非天然糖代谢标记,即,将叠氮基团整合到多种类型糖基化修饰的聚糖结构中,使样品中糖蛋白的聚糖链上标记有叠氮基团;
[0009] 2)蛋白提取并利用点击化学反应使糖蛋白的聚糖链标记上生物素基团;
[0010] 3)对所提取的蛋白进行变性、还原、烷基化和胰蛋白酶酶解,使其消化为肽段;
[0011] 4)通过链霉亲和素‑琼脂糖小珠对所得肽段进行富集,并在紫外光照射的条件下将其释放、收集;
[0012] 5)对收集的糖肽进行基于sceHCD pd EThcD碎裂方法的LC‑MS/MS检测,最后通过pGlyco3软件对质谱数据进行完整糖肽解析。
[0013] 上述方法步骤1)中,所述待鉴定样品为活细胞或活体组织样品;
[0014] 步骤1)的操作为:向细胞培养基或小鼠腹腔内加入或注射含有叠氮基团的单糖类似物,对细胞或活体组织样品的糖基化修饰蛋白进行聚糖标记,使糖蛋白的聚糖链上标记有可用于生物正交点击化学反应的叠氮基团;
[0015] 其中,所述含有叠氮基团的单糖类似物具体可为1,6‑Pr2GalNAz或1,6‑Pr2ManNAz,结构式如下所示:
[0016]
[0017] 1,6‑Pr2GalNAz1,6‑Pr2ManNAz
[0018] 上述方法步骤2)的操作为:向步骤1)所得体系中加入裂解液,进行超声破碎、离心吸取上清液,获取裂解液;在裂解液中加入炔基‑光切割‑生物素探针、CuSO4/BTTAA、抗坏血酸钠,反应,使生物素连接到目标糖肽上,向所得反应体系中加入甲醇沉淀蛋白;
[0019] 其中,所述炔基‑光切割‑生物素探针,其结构为炔基官能团‑可被紫外光切割断裂的邻硝基苄基基团‑PEG‑生物素基团,在紫外光的照射下,与炔基相邻的酰胺化学键发生断裂,暴露为氨基基团;
[0020] 具体地,所述炔基‑光切割‑生物素探针的结构式如下所示:
[0021]
[0022] 所述炔基‑光切割‑生物素探针与CuSO4、BTTAA和抗坏血酸钠的配比可为100‑500μM:25‑100μM:100‑500μM:0.2‑1mg/mL,具体可为120μM:50μM:100μM:0.6mg/mL;
[0023] 所述反应在室温下进行,所述反应的时间可为2‑3小时。
[0024] 上述方法步骤3)的操作为:将步骤2)得到的蛋白沉淀用尿素复溶,加入NH4HCO3,加入二硫苏糖醇DTT,还原反应;向反应后的溶液中加入碘乙酰胺IAA,烷基化反应;向反应后的溶液中加入NH4HCO3,加入胰蛋白酶,酶解反应;
[0025] 其中,所述还原反应的温度可为32‑37°,时间可为0.5‑1小时,具体可为1小时,所述还原反应在震荡下进行;
[0026] 所述烷基化反应的温度可为25‑29°,时间可为0.5‑1小时,具体可为30分钟,所述烷基化反应在避光、震荡下进行;
[0027] 所述酶解反应的温度可为32‑37°,时间可为16‑20小时,具体可为20小时;所述酶解反应在震荡下进行;
[0028] 其中样品与酶的质量比可为20‑100:1,具体可为50:1;
[0029] 上述方法步骤4)的操作为:向酶解后所得溶液中加入链霉亲和素‑琼脂糖小珠,孵育;离心,吸除上清液;将收集到的链霉亲和素‑琼脂糖小珠用甲酸溶液重悬后置于紫外光下照射,释放糖肽;离心,收集上清液,干燥,得到糖肽干粉;
[0030] 所述孵育在室温下进行,所述孵育在旋转下进行,所述孵育的时间可为2‑3小时;
[0031] 所述甲酸溶液为0.1%(体积浓度)甲酸溶液;
[0032] 所述紫外光下照射的时间可为5‑15分钟,具体可为10分钟。
[0033] 上述方法步骤5)中,用于肽段分离的色谱柱为EasySpray反向色谱柱(柱长50cm,内径75μm);填料为PepMap C18颗粒( 2μm);
[0034] 色谱系统装置为Dionex Ultimate 3000RPLC纳喷雾系统;
[0035] 质谱采集系统为Orbitrap Fusion Lumos质谱仪,其串级质谱碎裂模式为阶梯能量高能碰撞解离‑靶标离子激发‑电子转移解离(sceHCD pd EThcD);
[0036] 阶梯能量高能碰撞解离‑靶标离子激发‑电子转移/高能碰撞解离(sceHCD pd EThcD)的具体参数为:归一化碰撞能量(NCE)为20‑30‑40;EThcD的辅助激发能量(SA)为35;
[0037] 色谱流动相A相为0.1%甲酸的水溶液,B相为80%乙腈,0.1%甲酸的水溶液;
[0038] 色谱流动相的梯度参数为:0‑10min:B相从1%到7%;11‑311min:B相从7%到35%;311‑353min:B相从35%到44%;353‑356min:B相从44%到99%;
[0039] 质谱设置相关参数:肽段母离子采集范围是350‑2000Th,其中AGC设置为400000,分辨率设置为200m/z的条件下120000。
[0040] 本发明具有以下优点:1)鉴定种类多,可实现在同一样品中对多种类型糖基化修饰肽段的同时解析;2)鉴定信息全,可同时提供糖基化修饰蛋白、糖基化修饰位点以及修饰位点上的糖组成信息;3)鉴定准确性高,基于pGlyco3搜库软件,肽段层面、糖链层面以及完整糖肽层面分别对假阳性率(FDR)进行质控,确保的鉴定结果的准确性;4)覆盖深度广,单一样品中可实现上千个高置信O‑GlcNAc修饰位点、数百个完整O‑连接糖基化肽段的解析。
[0041] 本发明包含从实验操作到质谱数据搜索的完整操作流程,其主要面向活细胞或活体组织样品的多类型完整糖肽的综合分析。该方法联合非天然糖代谢标记技术与sceHCD pd EThcD碎裂方法,突破了现有技术只能鉴定单一类型完整糖肽的局限,实现了多类型完整糖肽的统一富集与综合分析,可较大的促进糖生物学领域的发展。

附图说明

[0042] 图1为本发明的多类型完整糖肽综合分析流程图,其中a)基于非天然糖代谢标记技术的完整糖肽制备流程。被标记的糖蛋白首先经过生物正交的点击化学反应,连接上既带有生物素基团,又可被紫外光照射发生断裂的化合物,而后经过胰蛋白酶(Trypsin)的酶解消化与链霉亲和素富集,最后在365nm紫外光的照射下释放富集后的糖基化肽段。b)含有非天然糖单元糖型数据库的建立。将非天然糖视作一个全新的单糖单元,与天然糖型数据库里所对应的单糖单元进行逐一的替换,产生一个全新的含有非天然糖组成成分的糖型库。c)sceHCDpdEThcD二级质谱碎裂模式的提出与建立。样品进入质谱后,首先在sceHCD的模式下进行二级质谱碎裂,在其二级谱图中实时检索目标氧鎓离子的特征峰(m/z=204.09,300.13等),之后对产生目标离子的一级母离子重新做一次EThcD碎裂。d)使用pGlyco3软件搜库后对高置信糖肽的筛选策略。e)一张黏蛋白型O‑糖肽的质谱图鉴定实例。
[0043] 图2为本发明实施例1中1,6‑Pr2GalNAz和1,6‑Pr2ManNAz对HeLa细胞的代谢标记效果。
[0044] 图3为本发明实施例1中HeLa细胞裂解液中完整糖位点的大规模鉴定与分析。a)1,6‑Pr2GalNAz标记的HeLa全细胞4%SDS裂解液(SDS‑WCL)、PBS裂解组分(PBS‑S)与PBS裂解后所得沉淀的4%SDS裂解组分(PBS‑P)的完整糖位点鉴定情况。b)1,6‑Pr2GalNAz标记的HeLa细胞三组样品中所鉴定到的完整N‑糖位点、完整O‑糖位点与O‑GlcNAc修饰位点的比例分布。c)1,6‑Pr2GalNAz标记的HeLa细胞三组样品中所鉴定到的完整糖位点与1,6‑Pr2ManNAz标记的HeLa全细胞4%SDS裂解液所鉴定到的完整糖位点对比。d)1,6‑Pr2GalNAz与1,6‑Pr2ManNAz标记的HeLa细胞各组样品中所鉴定到的所有糖蛋白的糖基化修饰类型比例分布。e)1,6‑Pr2GalNAz与1,6‑Pr2ManNAz标记的HeLa细胞各组样品中所鉴定到的所有完整糖位点的糖基化修饰类型比例分布。f)1,6‑Pr2GalNAz与1,6‑Pr2ManNAz标记的HeLa细胞各组样品中所鉴定到的完整N‑糖位点、完整O‑糖位点、完整O‑唾液酸化糖位点以及O‑GlcNAc修饰位点的特征序列分析。g)1,6‑Pr2GalNAz标记的HeLa细胞的三组样品与1,6‑Pr2ManNAz标记的HeLa全细胞裂解液中所鉴定到完整N‑糖位点其糖型分布情况。h)1,6‑Pr2GalNAz标记的HeLa细胞的三组样品与1,6‑Pr2ManNAz标记的HeLa全细胞裂解液中所鉴定到完整O‑糖位点其糖型分布情况。i)1,6‑Pr2GalNAz标记的HeLa细胞的三组样品与1,6‑Pr2ManNAz标记的HeLa全细胞裂解液中所鉴定到完整唾液酸化糖位点其糖型分布情况。j)蛋白糖基化修饰的不均一性表征,纵轴为某一个蛋白上鉴定到的糖组成数量,横轴是该蛋白鉴定到的糖基化修饰位点数量。k)DSG2蛋白被鉴定到的所有完整糖位点展示。
[0045] 图4为本发明实施例1中HeLa细胞中完整糖位点所包含的糖型组成。a)HeLa细胞裂解液中鉴定到的完整糖位点所包含的N‑糖链糖型组成。b)HeLa细胞裂解液中鉴定到的完整糖位点所包含的O‑糖链糖型组成。
[0046] 图5为本发明实施例2中1,6‑Pr2GalNAz在小鼠肺、心和脾中的糖基化标记情况。
[0047] 图6为本发明实施例2中小鼠肺、心和脾组织中糖蛋白质组学的鉴定概况。a)小鼠心脏组织中完整糖位点鉴定的4次生物学重复结果。b)小鼠肺组织中完整糖位点鉴定的4次生物学重复结果。c)小鼠脾脏组织中完整糖位点鉴定的4次生物学重复结果。
[0048] 图7为本发明实施例2中小鼠肺、心和脾组织中糖蛋白质的组学鉴定与综合分析。a)1,6‑Pr2GalNAz代谢标记小鼠活体组织的示意图。b)小鼠心、肺和脾组织中所有完整糖位点的鉴定结果。c)小鼠心、肺和脾组织中所有糖基化位点的鉴定结果。d)小鼠心、肺和脾组织中所有糖基化蛋白的鉴定结果。e)小鼠心、肺和脾组织中所鉴定到的完整糖位点所含糖型分布。f)小鼠心、肺和脾组织中所鉴定到的完整N‑糖位点其糖型丰度比列。g)小鼠心、肺和脾组织中所鉴定到的含有4种代表性N‑糖链的完整糖位点,其糖基化修饰位点与糖基化修饰蛋白的数量分布情况。h)小鼠心、肺和脾组织中所鉴定到的黏蛋白型完整O‑糖位点与O‑GlcNAc修饰位点所含糖型分布情况。

具体实施方式

[0049] 下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
[0050] 下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
[0051] 参照图1所示的流程图进行实验操作
[0052] 本发明确立了一套新的基于非天然糖代谢标记技术来实现一步式N‑和O‑完整糖肽,以及O‑GlcNAc修饰位点综合分析的质谱分析方法,并且针对于非天然糖代谢标记的完整糖肽样品,对其二级质谱碎裂模式和最佳适用能量进行了考察与优化。
[0053] 首先在样品制备方面,基于非天然糖代谢标记技术将携带叠氮基团的非天然糖整合在细胞或组织样品中的糖基化蛋白上,然后经过细胞或组织裂解将蛋白质提取出来,再通过一价Cu催化的环加成反应使同时带有生物素基团并可以经过紫外光释放的化合物连接在目标糖蛋白上,而后将蛋白酶解消化成肽段,再使用偶联着链霉亲和素的琼脂糖珠子通过生物素‑链霉亲合素亲和反应实现对目标糖肽的富集,最后在365nm紫外光的照射下将目标糖肽从小珠上释放下来,富集后的糖基化肽段送入质谱进行分析鉴定(图1a)。
[0054] 为了实现带有非天然糖标记糖肽的质谱解析,首先需要建立一个带有非天然糖修饰的糖链组成库。在这里,我们结合pGlyco3软件,利用一种可变修饰的策略,也就是将非天然糖视作是一种全新的单糖单元,在原有天然糖型库的基础上,与其所对应的糖单元进行逐一替换,产生一个全新的带有非天然糖单元的糖型库。比如,使用GalNAz类似物进行代谢标记时,经过生命体内的糖生物合成路径,最后会出现GalNAz和GlcNAz两种形式的单糖被整合到糖链上,这两种形式的单糖单元,经过点击化学反应与紫外光释放,最后以GalNAt和GlcNAt的形式整合在聚糖结构中。这时,我们就把原来天然糖库里的GalNAc和GlcNAc逐一的替换成GalNAt和GlcNAt,形成一个全新的含有非天然糖型的库,如图1b所示。
[0055] 接着在质谱鉴定的技术中,我们首次有机结合在N‑完整糖肽鉴定领域里具有明显优势的sceHCD二级质谱碎裂技术与解析位点特异性的O‑完整糖肽时必不可少的EThcD碎裂模式,开发了sceHCD pd EThcD的组合碎裂模式。如图1c所示,质谱中的一级母离子首先在sceHCD的模式下进行二级质谱碎裂,并对sceHCD的二级谱图进行在线的检索,当发现有如204.09,300.13这样的氧鎓离子的存在时,产生此碎片的一级母离子会被重新选择进行碎裂模式为EThcD的二级质谱碎裂。这种二级碎裂组合模式既可以保证对于N‑完整糖肽的高效解析,又可以满足对O‑完整糖肽位点定位的需要,同时还可以有效的节约二级质谱碎裂时间,提高质谱分析效率。
[0056] 然后,我们选用pGlyco3的糖肽解析软件对所得的质谱数据进行搜库分析,并建立了一套高置信糖肽的筛选流程,如图1d所示。对于N‑完整糖肽而言,我们首先筛选出整体假阳性率(FDR)小于0.01的N‑糖肽,在此基础上去除结果里不含有非天然糖成分的肽段,也就是非特异性吸附的肽段。对于O‑完整糖肽,我们在筛选出FDR小于0.01和含有非天然糖组成的肽段的基础上,进一步去除了缺少EThcD图谱或者在糖肽序列中包含N‑糖基化位点信息的糖肽,最大程度上确保O‑糖肽的解析和位点定位不受干扰。在此基础上,我们还基于定位和可信度打分对鉴定到的O‑完整糖肽的位点结果进行严格筛选,只有达到单个氨基酸分辨率并且其位点可信度打分大于0.75的那些O‑糖肽才被视为高置信的O‑完整糖肽。
[0057] 图1e展现了一个高置信的黏蛋白型O‑糖肽的鉴定谱图,其肽段序列为LQAAGLPHTEVPQGK,修饰位点为T,糖型为GalNAc‑Gal‑Neu5Ac,其中GalNAc被非天然糖GalNAz所替代,并且在一系列的反应后变成一个分子量为299.1的糖单元残基GalNAt。
[0058] 实施例1、HeLa细胞样品的多类型完整糖肽综合分析
[0059] 1、使用含有终浓度为200μM1,6‑Pr2GalNAz、10%(体积浓度)胎牛血清、100U/mL青霉素以及100μg/mL链霉素的细胞完全培养基(DMEM),在37℃的条件下培养HeLa细胞48小时。
[0060] 2、使用PBS溶液润洗细胞3次后,向每10cm培养皿的细胞中加入300μL 4%SDS裂解液,在35%幅值的条件下超声细胞,每超声3秒,暂停3秒,循环10次。超声结束后,将细胞裂解液放入离心机中,20000g的转速条件下离心5分钟,使用移液枪,将样品离心后的上清液转移至新的EP管中。
[0061] 3、使用BCA蛋白定量试剂盒(Thermo公司)对细胞裂解液中的蛋白浓度进行定量。
[0062] 4、取步骤2得到的是细胞裂解液至新的康宁管,使用PBS溶液将其稀释4倍,而后加入点击化学试剂,其体系终浓度为120μM炔基‑光切割‑生物素探针、50μM CuSO4、100μM BTTAA、0.6mg/mL抗坏血酸钠,室温反应2小时。
[0063] 5、向反应体系中加入8倍体积的甲醇,将蛋白沉淀下来,在‑80℃的条件下过夜冻存。
[0064] 6、将过夜冻存后的溶液放入离心机中,在4000g转速的条件下离心20分钟,使用移液枪去除液体,只保留蛋白沉淀。
[0065] 7、向蛋白沉淀中加入1mL的8M尿素,震荡溶液使蛋白复溶。
[0066] 8、向尿素复溶后的溶液中加入1mL的100mM NH4HCO3,再加入DTT(终浓度为10mM DTT),在37摄氏度的条件下,震荡反应1小时。
[0067] 9、向上一步反应后的溶液中加入IAA(终浓度为20mM IAA),在避光的条件下,室温震荡反应30分钟。
[0068] 10、向上一步反应后的溶液中加入6mL的50mM NH4HCO3,加入胰蛋白酶(蛋白样品与酶的质量比为50:1),在37摄氏度的条件下,震荡反应20小时。
[0069] 11、向上一步反应后的溶液中加入50μL链霉亲和素‑琼脂糖小珠,其厂家为热电公司(Thermo)、货号为20353,室温条件下,旋转孵育3小时。
[0070] 12、将上一步反应后的溶液放入离心机中,在4000g转速的条件下离心2分钟,使小珠沉于管子底部,吸除上清液;将链霉亲和素‑琼脂糖小珠先用PBS洗五次,再用水洗5次。
[0071] 13、将上一步反应后所得链霉亲和素‑琼脂糖小珠使用300μL0.1%(体积浓度)甲酸溶液进行重悬,将其放置在365nm紫外灯管下(样品距灯管3cm),照射10分钟。
[0072] 14、将上一步反应后所得溶液放入离心机中,在4000g转速的条件下离心2分钟,使用移液枪吸取上清,放置于新的EP管中,放入旋转浓缩机中进行旋干。
[0073] 15、使用7μL0.1%(体积浓度)甲酸将旋干后的糖肽进行复溶,送入LC‑MS/MS中进行分析。用于肽段分离的色谱柱为购买于热电公司(Thermo)的50cm的EasySpray反向色谱柱,其内径为75μm,里面填充着 2μm的PepMap C18颗粒。色谱系统装置为热电公司(Thermo)的Dionex Ultimate 3000RPLC纳喷雾系统。质谱采集系统为热电公司(Thermo)的Orbitrap Fusion Lumos质谱仪。色谱流动相A相为0.1%(体积浓度)甲酸的水溶液,B相为80%(体积浓度)乙腈,0.1%(体积浓度)甲酸的水溶液。色谱流动相的梯度参数为:0‑
10min:B相从1%到7%;11‑311min:B相从7%到35%;311‑353min:B相从35%到44%;353‑
356min:B相从44%到99%。质谱设置相关参数:肽段母离子采集范围是350‑2000Th,其中AGC设置为400000,分辨率设置为200m/z的条件下120000。最长入射时间为50ms,RF射频为
60%。在母离子筛选与隔离时,其同位素峰也包括在内,只选择有2‑8个电荷的母离子,并且携带电荷量较多的母离子和质核比较低的一级母离子会被优先筛选,隔离母离子操作由质谱仪器中的四极杆执行,选择窗口为2Th,针对于一张一级谱图其做二级质谱的碎裂时间为
3s。在做二级质谱碎裂时,我们使用sceHCD pd EThcD的策略,一级母离子首先进行阶梯能量的HCD碎裂,所使用的能量为30±10,其中AGC设为50000,最大入射时间设为54ms,分辨率设置为200m/z的条件下30000。如果在HCD的谱图中出现以下离子碎片:m/z 168.0654、
186.076、204.0865、274.092、292.1027、300.1302、366.1395,并且质量误差在10ppm以内,将会触发产生这些碎片的一级母离子进行第二次二级质谱碎裂,其碎裂模式为EThcD,辅助激发的归一化能量设置为35%。
[0074] 16、使用pGlyco3软件对质谱数据进行搜索。首先通过pGlyco3软件建立了一个含有非天然糖单元的糖型库,具体通过一种可变修饰的策略和模块,将1,6‑Pr2GalNAz经细胞内转化整合到蛋白聚糖修饰上,并将经过点击化学反应以及紫外光释放所形成的非天然糖残基(m/z为299.13)设置为一个新的糖单元PG,将其与原天然糖库里所对应的HexNAc糖单元进行逐一的替换,形成一个新的包含非天然糖单元的糖型库,其中替换规则为N~PG,允许一个糖链上至多存在的替换数为2,糖库的最大规模设置为1000000。原始的天然糖库在N‑糖的搜索模式下为Human糖型库,在O‑糖的搜索模式下为Multi‑site糖型库。在搜库的其他参数设置中,RAW文件的碎裂模式选择为HCD+EThcD。蛋白序列的fasta文件为Uniprot上下载的UP000005640_9606,更新于2016年8月。酶解所用的酶设置为Trypsin,酶切位点为K和R,允许肽段上的最大漏切数为2。肽段上的可变修饰设置为在M位点上的氧化(Oxidation)修饰以及在蛋白N端的乙酰化修饰(Acetyl),肽段上的固定修饰设为C位点上的Carbamidimethyl修饰。母离子匹配的误差范围为±10ppm,碎片离子匹配的误差范围为±20ppm,进程处理数设置为3,糖肽FDR设置为0.01。
[0075] 为了实现HeLa细胞裂解液中完整糖肽鉴定的深度覆盖,我们使用1,6‑Pr2GalNAz对细胞进行代谢标记,并且在样品制备时选用不同的裂解方式将细胞组分进行了粗提纯。同时,我们也通过1,6‑Pr2ManNAz对细胞内的唾液酸化修饰进行特异性标记,来考察细胞内唾液酸糖基化修饰的表达水平。
[0076] 图2展示了1,6‑Pr2GalNAz标记的HeLa全细胞4%SDS裂解液(SDS‑WCL)、PBS裂解组分(PBS‑S)与PBS裂解后所得沉淀的4%SDS裂解组分(PBS‑P)中的标记情况和强度,以及1,6‑Pr2ManNAz在全细胞裂解液中的标记情况。结果表明,1,6‑Pr2GalNAz标记的样品中,PBS裂解组分(PBS‑S)的标记强度最高,这主要是因为胞质蛋白具有较好的可溶性,以及存在着大量的O‑GlcNAc糖基化修饰,并且1,6‑Pr2GalNAz对O‑GlcNAc修饰的标记有着极高的效率。而PBS‑P组分标记强度次之,则是由于该组分存在大量高丰度糖基化修饰的膜蛋白。
[0077] 我们对HeLa细胞中鉴定到的完整糖位点进行分析:通过1,6‑Pr2GalNAz标记的HeLa细胞的SDS‑WCL组、PBS‑S组和PBS‑P组,如图3a所示,分别鉴定到了2887、3841和3778条完整糖肽,总计6067条完整糖位点;其中,完整N‑糖位点更多的被PBS‑P组所鉴定到,而O‑GlcNAc位点则更多的被PBS‑S组所鉴定,如图3b所示。这个结果在一定程度上表明了对样品进行简单分离提纯,即可有效地提高完整糖肽的鉴定深度。
[0078] 为了更好的表征细胞中的唾液酸修饰情况,我们使用1,6‑Pr2ManNAz特异性标记HeLa细胞内的唾液酸修饰蛋白,如图3c所示,一共鉴定到820个完整糖位点。其中,429个完整糖位点也在1,6‑Pr2GalNAz标记的HeLa样品中鉴定到。这个结果表明了非天然糖代谢标记技术的稳定性与普适性。
[0079] 接着,我们把1,6‑Pr2GalNAz标记的三组HeLa样品与1,6‑Pr2ManNAz标记的HeLa全细胞裂解液所鉴定到糖基化修饰蛋白进行分类。如图3d所示,在所有被鉴定的1298个糖蛋白中,有206个为黏蛋白型O‑糖蛋白、355个N‑糖蛋白以及824个O‑GlcNAc修饰蛋白,其中有4个蛋白的完整黏蛋白型O‑糖位点、完整N‑糖位点和O‑GlcNAc修饰位点被Click‑iG同时鉴定到,体现出该项技术所具有的卓越性能。而后,我们在完整糖位点水平上分析了三种糖基化修饰类型的比例分布,如图3e所示,在所有6454个被鉴定的完整糖位点中,有3034个为完整N‑糖位点、511个为完整O‑糖位点以及2909个O‑GlcNAc修饰位点,该结果充分展现出Click‑iG技术在细胞样品的糖基化组学鉴定中可达到较深的鉴定覆盖度。
[0080] 接下来,我们对不同糖基化类型的糖基化位点序列进行了特征分析。如图3f所示,结果表明O‑GlcNAc修饰的位点前可观察到PPV/T的特异性序列,而O‑唾液酸修饰的位点的‑1和+3位存在P富集的特征,但整个黏蛋白类O‑糖基化修饰并没有显著的序列特征;而N‑糖基化修饰只观察到最常见的的NXS/T特征序列,并没有其他新的富集序列。这些结果也可以表明非天然糖代谢标记技术所得到的结论与使用其他手段表征完整糖肽的结果是大致相同的。因此,这些发现既可以说明设计的非天然糖代谢标记技术的合理性,也可以体现该技术在全面富集糖基化肽段方面的优越性。
[0081] 随即,我们考察了1,6‑Pr2GalNAz标记的HeLa细胞所鉴定到的所有完整糖位点中的糖型分布情况。对于完整N‑糖点,如图3g所示,整体而言,复杂型或混合型要多与高甘露糖型,含有岩藻糖修饰的N‑糖链要多于含有唾液酸修饰的。而对于完整黏蛋白型O‑糖位点,如图3h所示,Tn抗原的比例远高于其他修饰糖型。此外,对于含有唾液酸修饰的完整糖位点,含有LacNAc结构单元的N‑糖链占据了主要比例。这些成果展示了基于Click‑iG技术进行糖蛋白质组学研究,其数据结果的全面性与多样性。
[0082] 最后,我们分析了HeLa细胞中鉴定到的修饰蛋白所具有的糖基化修饰不均一性。如图3j所示,我们观察到糖基化位点超过20个的蛋白基本都是O‑GlcNAc修饰的糖基化蛋白,其中,位点数在30个以上的基本都是核孔复合物蛋白;而N‑糖基化蛋白或者同时具有N‑和O‑糖基化修饰的蛋白通常具有较高的糖链不均一性,即较少的糖基化修饰位点上鉴定到比较多的糖链组成。而对于一些特定的蛋白,如DSG2,如图3k所示,其跨膜胞内区具有7个O‑GlcNAc修饰位点,而胞外区则具有丰富的黏蛋白型O‑糖基化修饰和N‑糖基化修饰。其中,N182位点处被鉴定具有28种N‑糖链组成,具有极高的微观不均一性。Click‑iG技术可以实现同一样品中多种糖基化修饰类型的同时解析,对于生物体内糖基化修饰调控网络的综合探究提供了有力工具。
[0083] 我们对在HeLa细胞系中鉴定到的所有完整糖糖位点所包含的糖型组成进行了统计,一共鉴定到213种N‑糖链组成(图4a)和34种O‑糖链组成(图4b),这是迄今为止基于非天然糖代谢标记技术所鉴定到最大规模的糖链组成数据,此数据反应了生物体内糖基化修饰具有的高度不均一性,也说明了非天然糖代谢技术对于大规模表征生物体内糖基化修饰具有高效性。
[0084] 实施例2、活体组织样品的多类型完整糖肽综合分析
[0085] 1、准备5只8周大的C57BL/6雄性小鼠。配置400μL的50mg/mL的1,6‑Pr2GalNAz水溶液以及准备100μL去离子水。向4只小鼠的腹腔注射1,6‑Pr2GalNAz水溶液,每只100μL。向另外一只小鼠注射水溶液,100μL做对照组。每24小时重复一次注射一次,共标记72小时。
[0086] 2、准备5%的水合氯醛。向每只老鼠的腹腔内注射250μL的水合氯醛来麻醉小鼠。待小鼠被麻醉后,使用注射针头将小鼠四肢固定,使用剪刀剪开胸腔。用灌流针插入小鼠左心室后,使用剪刀在小鼠的右心耳上剪开一个小口。用PBS溶液以50rpm的速度灌流约50mL,来去除组织中的血液。以肝脏变白为标准。剪下小鼠的肺、脾脏和心脏,收在1.5mL EP管中,加入PBS,放入冰上备用。将小鼠尸体放入专用的医疗废弃袋,放入‑80℃冰箱等待处理。
[0087] 3、将陶瓷研磨钵洗净后放入‑80℃冰箱中预冷。将小鼠组织放入研磨钵中,倒入液氮。待组织变坚硬后,使用陶瓷研磨杵进行研磨。待液氮快要蒸发完时补加液氮溶液,继续研磨。待组织被研磨成细致的粉末时用小勺将其取出,转移到1.5mL EP管中,加入4%SDS裂解液(含有蛋白酶抑制剂)后使用超声法裂解蛋白,后续操作与实例1所述相一致。
[0088] 备注:小鼠组织的搜库时使用的是小鼠的fasta文件UP000000589,下载自UniProt数据库。N‑糖数据库选自软件中的N‑mouse;O‑糖数据库使用的是multi‑site。其他的搜库设置参数与搜索细胞样品时相一致。
[0089] 我们将非天然糖代谢标记辅助的完整糖肽组学分析策略,应用于小鼠组织中糖基化的研究。通过腹腔注射1,6‑Pr2GalNAz水溶液(每24小时注射一次,共三次),我们对活体小鼠中的糖蛋白进行了代谢标记。接着,用点击化学反应对肺、心脏和脾脏等三个组织的裂解液进行了荧光标记。胶内荧光扫描成像结果显示,1,6‑Pr2GalNAz在三个组织中均有标记,其中肺和脾脏组织具有较强的标记,而心脏组织中的标记相对较弱(图5)。
[0090] 然后,采用质谱分析流程对1,6‑Pr2GalNAz标记的三种小鼠组织进行了大规模完整糖肽鉴定。图6a、b和c分别展示了小鼠心脏组织、肺组织和脾脏组织在4次生物学重复的条件下所鉴定到的完整糖位点结果,其数据证明了非天然糖代谢标记用于活体组织层面的完整糖肽鉴定具有较好的稳定性和可重复性,可作为一项优质技术用来进一步探究糖生物学功能。
[0091] 我们对小鼠活体组织中鉴定到的完整糖肽数据进行了综合分析。如图7a所示,非天然糖1,6‑Pr2GalNAz通过腹腔注射进入小鼠体内后,以自由扩散的方式被组织细胞所摄取,经过生物体内的糖合成路径,代谢整合到组织内的糖链上。根据质谱结果,我们在心、肺和脾脏组织中分别鉴定到了1995、2762和1502完整糖位点(图7b),对应于1449、1758和1149糖基化位点(图7c)以及627、790和550个糖基化蛋白(图7d)。
[0092] 接着,我们所三种组织中所鉴定到的完整糖位点的糖型分布进行了统计。如图7e所示,我们发现组织中主要以O‑GlcNAc修饰糖链和N‑糖链为主,肺组织中的岩藻糖修饰比例分布最高;在唾液酸方面,Neu5Ac型唾液酸在心脏组织内的表达水平最高,而Neu5Gc型唾液酸则是在肺组织中有较高的表达水平。随后,我们对完糖位点数据所包含的N‑糖链类型分布进行了分析。如图7f,可观察到心脏组织中具有较高的唾液酸化修饰水平,其中Neu5Ac型唾液酸所占比例(12%)远高于肺和脾脏,Neu5Gc型唾液酸化修饰比例也有13.1%;而在肺组织中,唾液酸化修饰则主要以Neu5Gc型为主(18.3%),其中Neu5Ac型修饰只占4.2%。此外,三种组织中的高甘露糖型所占比例相差不大,均为40%;而对于岩藻糖修饰的分布情况,心脏和肺组织比较类似,均为30%,但脾脏组织中相对较少,约为20%。再者,我们选取了4种典型的N‑糖链结构,如图7g所示,分析了含有这4种糖链结构的糖基化修饰位点数目与糖基化修饰蛋白数目在三种组织中的分布情况,发现含有9个甘露糖的高甘露糖型特异性在心脏组织中高表达。最后,我们对完糖位点数据所包含的黏蛋白型O‑糖链和O‑GlcNAc修饰类型分布进行了分析,如图7h所示,发现O‑GlcNAc修饰与Tn抗原的数量最多,核心1型(Core1)与核心3型(Core3)次之。黏蛋白类O‑糖基化修饰一直是完整糖肽鉴定领域的一大难点,因为其经常在同一条酶解肽段中发生密集性修饰,同时还缺少高特异性的富集方法。
相比于使用特定方法专门做黏蛋白类O‑完整糖肽研究结果,Click‑iG技术对活体组织的糖蛋白质组学研究,其鉴定类型的广度与鉴定规模的深度均具有较强优势。
[0093] 以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。