通过O-联糖基化序列的肽的糖基化转让专利

申请号 : CN200780034551.8

文献号 : CN101516388B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : S·德弗利斯

申请人 : 诺和诺德公司

摘要 :

本发明提供了序列肽段多肽,其具有包含一个或多个本发明的外源O-联糖基化序列的氨基酸序列。此外,本发明提供了制备多肽缀合物的方法,以及使用此类缀合物及其药物组合物的方法。本发明进一步提供了序列肽段多肽文库,其中此类文库的每个成员包含至少一个本发明的外源O-联糖基化序列。还提供了制备和使用此类文库的方法。

权利要求 :

1.糖基化或非糖基化的序列肽段多肽和聚合物修饰基团之间的共价缀合物,所述序列肽段多肽对应于亲本多肽并且包含外源O-联糖基化序列,所述聚合物修饰基团通过糖基连接基团在所述O-联糖基化序列处缀合至所述序列肽段多肽,其中所述糖基连接基团插入在所述序列肽段多肽和所述聚合物修饰基团之间并且共价连接至所述序列肽段多肽和所述聚合物修饰基团,条件是所述亲本多肽不是选自人生长激素(hGH)、粒细胞集落刺激因子(G-CSF)、干扰素-α(INF-α)、胰高血糖素样肽-1(GLP-1)和成纤维细胞生长因子(FGF)的成员。

2.权利要求1的共价缀合物,其中所述聚合物修饰基团是选自线性和支化的成员并且包含一个或多个聚合物部分,其中每个聚合物部分独立地进行选择。

3.权利要求2的共价缀合物,其中所述聚合物部分是选自聚(乙二醇)和甲氧基-聚(乙二醇)(m-PEG)的成员。

4.权利要求1的共价缀合物,其中所述糖基连接基团是完整的糖基连接基团。

5.权利要求4的共价缀合物,其包含根据式(III)的部分:其中

9

R 是H、负电荷或盐抗衡离子;和

p

R 是选自下列的成员:

其中n是选自1至20的整数,并且f和e是独立地选自1-2500的整数。

6.权利要求1的共价缀合物,其中所述亲本多肽是选自下列的成员:骨形态发生蛋白2(BMP-2)、骨形态发生蛋白7(BMP-7)、骨形态发生蛋白15(BMP-15)、神经营养蛋白-3(NT-3)、冯维勒布兰德因子(vWF)蛋白酶、促红细胞生成素(EPO)、α1-抗胰蛋白酶(α-1蛋白酶抑制剂)、葡糖脑苷脂酶、组织型血纤维蛋白溶酶原活化因子(TPA)、瘦蛋白、蛭素、尿激酶、人DNA酶、胰岛素、乙型肝炎表面蛋白(HbsAg)、嵌合的白喉毒素-IL-2、人绒毛膜促性腺激素(hCG)、甲状腺过氧化物酶(TPO)、α-半乳糖苷酶、α-L-艾杜糖苷酸酶、β-葡糖苷酶、α-半乳糖苷酶A、酸性α-葡糖苷酶(酸性麦芽糖酶)、抗凝血酶III(AT III)、促卵泡激素(FSH)、胰高血糖素样肽-2(GLP-2)、因子VII、因子VIII、B-结构域缺失的因子VIII、因子IX、因子X、因子XIII、prokinetisin、extendin-4、CD4、肿瘤坏死因子受体(TNF-R)、α-CD20、P-选择蛋白糖蛋白配体-1(PSGL-1)、补体、转铁蛋白、依赖于糖基化的细胞粘着分子(GlyCAM)、神经细胞粘着分子(N-CAM)、TNF受体-IgG Fc区融合蛋白、抗-HER2单克隆抗体、针对呼吸道合胞病毒的单克隆抗体、针对呼吸道合胞病毒的蛋白F的单克隆抗体、针对TNF-α的单克隆抗体、针对糖蛋白IIb/IIIa的单克隆抗体、针对CD20的单克隆抗体、针对VEGF-A的单克隆抗体、针对PSGL-1的单克隆抗体、针对CD4的单克隆抗体、针对a-CD3的单克隆抗体、针对EGF的单克隆抗体、针对癌胚抗原(CEA)的单克隆抗体和针对IL-2受体的单克隆抗体。

7.权利要求1的共价缀合物,其中所述外源O-联糖基化序列是选自下列的成员:(X)mPTP、(X)mPTEI(P)n、(X)mPTQA(P)n、(X)mPTINT(P)n、(X)mPTTVS(P)n、(X)mPTTVL(P)n、(X)mPTQGAM(P)n、(X)mTET(P)n、(X)mPTVL(P)n、(X)mPTLS(P)n、(X)mPTDA(P)n、(X)mPTEN(P)n、(X)mPTQD(P)n、(X)mPTAS(P)n、(X)mPTQGA(P)n、(X)mPTSAV(P)n、(X)mPTTLYV(P)n、(X)mPSSG(P)n和(X)mPSDG(P)n,其中

m和n是独立地选自0和1的整数;

P是脯氨酸;和

X是独立地选自谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和不带电荷的氨基酸的成员。

8.权利要求7的共价缀合物,其中所述外源O-联糖基化序列是选自下列的成员:PTP、PTEI、PTEIP、PTQA、PTQAP、PTINT、PTINTP、PTTVS、PTTVL、PTQGAM、PTQGAMP和TETP。

9.药物组合物,其包含权利要求1的共价缀合物和可药用载体。

10.包含序列肽段多肽的多肽缀合物,所述序列肽段多肽对应于亲本多肽并且具有外源O-联糖基化序列,所述多肽缀合物包含根据式(V)的部分:其中

w是选自0和1的整数;

q是选自0和1的整数;

AA-O-是从具有被羟基取代的侧链的氨基酸衍生而得的部分,所述氨基酸位于所述O-联糖基化序列内;

Z 是选自糖基部分和糖基连接基团的成员;和

X 是选自聚合物修饰基团和共价连接至聚合物修饰基团的糖基连接基团的成员,条件是所述亲本多肽不是选自人生长激素(hGH)、粒细胞集落刺激因子(G-CSF)、干扰素-α(INF-α)、胰高血糖素样肽-1(GLP-1)和成纤维细胞生长因子(FGF)的成员。

11.权利要求10的多肽缀合物,其中所述氨基酸是丝氨酸(S)或苏氨酸(T)。

12.权利要求10的多肽缀合物,其中所述外源O-联糖基化序列是选自下列的成员:(X)mPTP、(X)mPTEI(P)n、(X)mPTQA(P)n、(X)mPTINT(P)n、(X)mPTTVS(P)n、(X)mPTTVL(P)n、(X)mPTQGAM(P)n、(X)mTET(P)n、(X)mPTVL(P)n、(X)mPTLS(P)n、(X)mPTDA(P)n、(X)mPTEN(P)n、(X)mPTQD(P)n、(X)mPTAS(P)n、(X)mPTQGA(P)n、(X)mPTSAV(P)n、(X)mPTTLYV(P)n、(X)mPSSG(P)n和(X)mPSDG(P)n,其中

m和n是独立地选自0和1的整数;

P是脯氨酸;和

X是独立地选自谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和不带电荷的氨基酸的成员。

13.权利要求12的多肽缀合物,其中所述外源O-联糖基化序列是选自下列的成员:PTP、PTEI、PTEIP、PTQA、PTQAP、PTINT、PTINTP、PTTVS、PTTVL、PTQGAM、PTQGAMP和TETP。

14.权利要求10的多肽缀合物,其中Z 是选自GalNAc、GalNAc-Gal、GalNAc-Gal-Sia和GalNAc-Sia的成员。

15.权利要求10的多肽缀合物,其中所述聚合物修饰基团是选自线性和支化的成员并且包含一个或多个聚合物部分,其中每个所述聚合物部分独立地进行选择。

16.权利要求15的多肽缀合物,其中所述聚合物部分是选自聚(乙二醇)和其衍生物的成员。

17.权利要求10的多肽缀合物,其中w是1。

18.权利要求17的多肽缀合物,其中X 包含这样的部分,该部分是选自唾液酸基(Sia)部分、半乳糖基(Gal)部分、GalNAc部分和Gal-Sia部分的成员。

19.权利要求10的多肽缀合物,其中所述亲本多肽是选自下列的成员:骨形态发生蛋白2(BMP-2)、骨形态发生蛋白7(BMP-7)、骨形态发生蛋白15(BMP-15)、神经营养蛋白-3(NT-3)、冯维勒布兰德因子(vWF)蛋白酶、促红细胞生成素(EPO)、α1-抗胰蛋白酶(α-1蛋白酶抑制剂)、葡糖脑苷脂酶、组织型血纤维蛋白溶酶原活化因子(TPA)、瘦蛋白、蛭素、尿激酶、人DNA酶、胰岛素、乙型肝炎表面蛋白(HbsAg)、嵌合的白喉毒素-IL-2、人绒毛膜促性腺激素(hCG)、甲状腺过氧化物酶(TPO)、α-半乳糖苷酶、α-L-艾杜糖苷酸酶、β-葡糖苷酶、α-半乳糖苷酶A、酸性α-葡糖苷酶(酸性麦芽糖酶)、抗凝血酶III(AT III)、促卵泡激素、胰高血糖素样肽-2(GLP-2)、因子VII、因子VIII、B-结构域缺失的因子VIII、因子IX、因子X、因子XIII、prokinetisin、extendin-4、CD4、肿瘤坏死因子受体(TNF-R)、α-CD20、P-选择蛋白糖蛋白配体-1(PSGL-1)、补体、转铁蛋白、依赖于糖基化的细胞粘着分子(GlyCAM)、神经细胞粘着分子(N-CAM)、TNF受体-IgG Fc区融合蛋白、抗-HER2单克隆抗体、针对呼吸道合胞病毒的单克隆抗体、针对呼吸道合胞病毒的蛋白F的单克隆抗体、针对TNF-α的单克隆抗体、针对糖蛋白IIb/IIIa的单克隆抗体、针对CD20的单克隆抗体、针对VEGF-A的单克隆抗体、针对PSGL-1的单克隆抗体、针对CD4的单克隆抗体、针对a-CD3的单克隆抗体、针对EGF的单克隆抗体、针对癌胚抗原(CEA)的单克隆抗体和针对IL-2受体的单克隆抗体。

20.权利要求17的多肽缀合物,其中X 包含根据式(VI)的部分:其中

E是选自O、S、NR27和CHR28的成员,

其中

R27和R28是独立地选自H、取代或未取代的烷基、取代或未取代的杂烷基、取代或未取代的芳基、取代或未取代的杂芳基和取代或未取代的杂环烷基的成员;

E1是选自O和S的成员;

R2是选自H、-R1、-CH2R1和-C(X1)R1的成员,其中R1是选自OR9、SR9、NR10R11、取代或未取代的烷基和取代或未取代的杂烷基的成员,其中

R9是选自H、负电荷、金属离子、取代或未取代的烷基、取代或未取代的杂烷基和酰基的成员;

R10和R11是独立地选自H、取代或未取代的烷基、取代或未取代的杂烷基和酰基的成员;

X1是选自取代或未取代的链烯基、O、S和NR8的成员,

其中

R8是选自H、OH、取代或未取代的烷基和取代或未取代的杂烷基的成员;

Y是选自CH2、CH(OH)CH2、CH(OH)CH(OH)CH2、CH、CH(OH)CH、CH(OH)CH(OH)CH、CH(OH)、CH(OH)CH(OH)和CH(OH)CH(OH)CH(OH)的成员;

Y2是 选自H、OR6、R6、取代或 未取 代的烷 基、取代 或未 取代的 杂烷基、的成员,

其中

6 7 a 6b 6b a 6b

R 和R 是独立地选自H、L-R 、C(O)R 、C(O)-L-R 、取代或未取代的烷基和取代或未

6b

取代的杂烷基的成员,其中R 是选自H、取代或未取代的烷基、取代或未取代的杂烷基和修饰基团的成员;

3 3 4 3 3

R、R’和R 是独立地选自H、OR”、SR”、取代或未取代的烷基、取代或未取代的杂烷基a 6c a 6c a 6c a 6c a 6c、-L-R 、-C(O)-L-R 、-NH-L-R 、=N-L-R 和-NHC(O)-L-R 的成员,其中

3

R”是选自H、取代或未取代的烷基和取代或未取代的杂烷基的成员;和

6c

R 是选自H、取代或未取代的烷基、取代或未取代的杂烷基、取代或未取代的芳基、取

13 14 13 14

代或未取代的杂芳基、取代或未取代的杂环烷基、NR R 和修饰基团的成员,其中R 和R是独立地选自H、取代或未取代的烷基和取代或未取代的杂烷基的成员;和a

每个L 是独立地选自键和接头基团的成员。

21.权利要求20的多肽缀合物,其中X 包含根据式(VII)的部分:

22.权利要求20的多肽缀合物,其中R6b和R6c中的至少一个是选自下列的成员:其中

s、j和k是独立地选自0至20的整数;

每个n是独立地选自0至2500的整数;

m是1-5的整数;

Q是选自H和C1-C6烷基的成员;

R16和R17是独立选择的聚合物部分;

X2和X4是独立选择的将聚合物部分R16和R17连接到C上的连接片段;

X5是除聚合物部分之外的其他非反应性基团;和

A1、A2、A3、A4、A5、A6、A7、A8、A9、A10和A11是独立地选自H、取代或未取代的烷基、取代或未取代的杂烷基、取代或未取代的杂环烷基、取代或未取代的芳基、取代或未取代的杂芳基、-NA12A13、-OA12和-SiA12A13的成员,其中

A12和A13是独立地选自取代或未取代的烷基、取代或未取代的杂烷基、取代或未取代的杂环烷基、取代或未取代的芳基和取代或未取代的杂芳基的成员。

23.药物组合物,其包含权利要求10的多肽缀合物和可药用载体。

24.对应于亲本多肽的序列肽段多肽,其中所述序列肽段多肽包含选自SEQ ID NO:1和SEQ ID NO:2的外源O-联糖基化序列:*

(X)m PO U(B)p(Z)r(J)s(O)t(P)n (SEQ ID NO:1);和1

(X)m(B)pTUB(Z)r(J)s(P)n (SEQ ID NO:2)其中

m、n、p、r、s和t是独立地选自0和1的整数;

P是脯氨酸;

O 是选自丝氨酸(S)和苏氨酸(T)的成员;

U是选自脯氨酸(P)、谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和不带电荷的氨基酸的成员;

1

X、B和B 是独立地选自谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和不带电荷的氨基酸的成员;和Z、J和O是独立地选自谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)、酪氨酸(Y)、甲硫氨酸(M)和不带电荷的氨基酸的成员,条件是所述亲本多肽不是选自人生长激素(hGH)、粒细胞集落刺激因子(G-CSF)、干扰素-α(INF-α)、胰高血糖素样肽-1(GLP-1)和成纤维细胞生长因子(FGF)的成员。

25.权利要求24的序列肽段多肽,其中所述外源O-联糖基化序列是选自下列的成员:(X)mPTP、(X)mPTEI(P)n、(X)mPTQA(P)n、(X)mPTINT(P)n、(X)mPTTVS(P)n、(X)mPTTVL(P)n、(X)mPTQGAM(P)n、(X)mTET(P)n、(X)mPTVL(P)n、(X)mPTLS(P)n、(X)mPTDA(P)n、(X)mPTEN(P)n、(X)mPTQD(P)n、(X)mPTAS(P)n、(X)mPTQGA(P)n、(X)mPTSAV(P)n、(X)mPTTLYV(P)n、(X)mPSSG(P)n和(X)mPSDG(P)n,其中

m和n是独立地选自0和1的整数;

P是脯氨酸;和

X是独立地选自谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和不带电荷的氨基酸的成员。

26.权利要求25的序列肽段多肽,其中所述外源O-联糖基化序列是选自下列的成员:PTP、PTEI、PTEIP、PTQA、PTQAP、PTINT、PTINTP、PTTVS、PTTVL、PTQGAM、PTQGAMP和TETP。

27.权利要求24的序列肽段多肽,其中所述外源O-联糖基化序列是GalNAc-转移酶的底物。

28.权利要求24的序列肽段多肽,其中至少三个氨基酸存在于所述O 和赖氨酸(K)或精氨酸(R)残基之间。

29.权利要求24的序列肽段多肽,其中所述亲本多肽是治疗性多肽。

30.权利要求24的序列肽段多肽,其中所述亲本多肽是选自下列的成员:骨形态发生蛋白2(BMP-2)、骨形态发生蛋白7(BMP-7)、骨形态发生蛋白15(BMP-15)、神经营养蛋白-3(NT-3)、冯维勒布兰德因子(vWF)蛋白酶、促红细胞生成素(EPO)、α1-抗胰蛋白酶(α-1蛋白酶抑制剂)、葡糖脑苷脂酶、组织型血纤维蛋白溶酶原活化因子(TPA)、瘦蛋白、蛭素、尿激酶、人DNA酶、胰岛素、乙型肝炎表面蛋白(HbsAg)、嵌合的白喉毒素-IL-2、人绒毛膜促性腺激素(hCG)、甲状腺过氧化物酶(TPO)、α-半乳糖苷酶、α-L-艾杜糖苷酸酶、β-葡糖苷酶、α-半乳糖苷酶A、酸性α-葡糖苷酶(酸性麦芽糖酶)、抗凝血酶III(AT III)、促卵泡激素、胰高血糖素样肽-2(GLP-2)、因子VII、因子VIII、B-结构域缺失的因子VIII、因子IX、因子X、因子XIII、prokinetisin、extendin-4、CD4、肿瘤坏死因子受体(TNF-R)、α-CD20、P-选择蛋白糖蛋白配体-1(PSGL-1)、补体、转铁蛋白、依赖于糖基化的细胞粘着分子(GlyCAM)、神经细胞粘着分子(N-CAM)、TNF受体-IgG Fc区融合蛋白、抗-HER2单克隆抗体、针对呼吸道合胞病毒的单克隆抗体、针对呼吸道合胞病毒的蛋白F的单克隆抗体、针对TNF-α的单克隆抗体、针对糖蛋白IIb/IIIa的单克隆抗体、针对CD20的单克隆抗体、针对VEGF-A的单克隆抗体、针对PSGL-1的单克隆抗体、针对CD4的单克隆抗体、针对a-CD3的单克隆抗体、针对EGF的单克隆抗体、针对癌胚抗原(CEA)的单克隆抗体和针对IL-2受体的单克隆抗体。

31.分离的核酸,其编码权利要求24的所述序列肽段多肽。

32.表达载体,其包含权利要求31的所述核酸。

33.细胞,其包含权利要求31的所述核酸。

34.对应于亲本多肽的序列肽段多肽,其中所述序列肽段多肽包含选自下列的外源O-联糖基化序列:* * * * * * *

XPO P、XPO EI(P)n、(X)mPO EI、XPO QA(P)n、XPO TVS、(X)mPO TVSP、XPO QGA、(X)* * * * * * *mPO QGAP、XPO QGAM(P)n、XTEO P、(X)mPO VL、XPO VL(P)n、XPO TVL、(X)mPO TVLP、(X)* * * * * *mPO TLYVP、XPO TLYV(P)n、(X)mPO LS(P)n、(X)mPO DA(P)n、(X)mPO EN(P)n、(X)mPO QD(P)* * * * * *n、(X)mPO AS(P)n、XPO SAV、(X)mPO SAVP、(X)mPO SG(P)n、XTEO P和(X)mPO DG(P)n,其中m和n是独立地选自0和1的整数;

O 是选自丝氨酸(S)和苏氨酸(T)的成员;

X是选自谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和不带电荷的氨基酸的成员;

每个S(丝氨酸)任选地并独立地用T(苏氨酸)替代;和

每个T(苏氨酸)任选地并独立地用S(丝氨酸)替代。

35.权利要求34的序列肽段多肽,其中所述O-联糖基化序列是GalNAc-转移酶的底物。

36.权利要求34的序列肽段多肽,其中至少三个氨基酸存在于所述O 和赖氨酸(K)或精氨酸(R)残基之间。

37.权利要求34的序列肽段多肽,其中所述亲本多肽是治疗性多肽。

38.权利要求34的序列肽段多肽,其中所述亲本多肽是选自下列的成员:骨形态发生蛋白2(BMP-2)、骨形态发生蛋白7(BMP-7)、骨形态发生蛋白15(BMP-15)、神经营养蛋白-3(NT-3)、冯维勒布兰德因子(vWF)蛋白酶、促红细胞生成素(EPO)、粒细胞集落刺激因子(G-CSF)、粒细胞-巨噬细胞集落刺激因子(GM-CSF)、干扰素α、干扰素β、干扰素γ、α1-抗胰蛋白酶(α-1蛋白酶抑制剂)、葡糖脑苷脂酶、组织型血纤维蛋白溶酶原活化因子(TPA)、白细胞介素-2(IL-2)、瘦蛋白、蛭素、尿激酶、人DNA酶、胰岛素、乙型肝炎表面蛋白(HbsAg)、嵌合的白喉毒素-IL-2、人生长激素(hGH)、人绒毛膜促性腺激素(hCG)、甲状腺过氧化物酶(TPO)、α-半乳糖苷酶、α-L-艾杜糖苷酸酶、β-葡糖苷酶、α-半乳糖苷酶A、酸性α-葡糖苷酶(酸性麦芽糖酶)、抗凝血酶III(AT III)、促卵泡激素(FSH)、胰高血糖素样肽-1(GLP-1)、胰高血糖素样肽-2(GLP-2)、成纤维细胞生长因子7(FGF-7)、成纤维细胞生长因子21(FGF-21)、成纤维细胞生长因子23(FGF-23)、因子VII、因子VIII、B-结构域缺失的因子VIII、因子IX、因子X、因子XIII、prokinetisin、extendin-4、CD4、肿瘤坏死因子受体(TNF-R)、α-CD20、P-选择蛋白糖蛋白配体-1(PSGL-1)、补体、转铁蛋白、依赖于糖基化的细胞粘着分子(GlyCAM)、神经细胞粘着分子(N-CAM)、TNF受体-IgG Fc区融合蛋白、抗-HER2单克隆抗体、针对呼吸道合胞病毒的单克隆抗体、针对呼吸道合胞病毒的蛋白F的单克隆抗体、针对TNF-α的单克隆抗体、针对糖蛋白IIb/IIIa的单克隆抗体、针对CD20的单克隆抗体、针对VEGF-A的单克隆抗体、针对PSGL-1的单克隆抗体、针对CD4的单克隆抗体、针对a-CD3的单克隆抗体、针对EGF的单克隆抗体、针对癌胚抗原(CEA)的单克隆抗体和针对IL-2受体的单克隆抗体。

39.分离的核酸,其编码权利要求34的所述序列肽段多肽。

40.表达载体,其包含权利要求39的所述核酸。

41.细胞,其包含权利要求39的所述核酸。

42.包含多个不同成员的序列肽段多肽文库,其中所述文库的每个成员对应于共同的亲本多肽并且其中所述文库的每个成员包含外源O-联糖基化序列,其中所述O-联糖基化序列中的每一个是独立地选自SEQID NO:1和SEQ ID NO:2的成员:*

(X)m PO U(B)p(Z)r(J)s(O)t(P)n (SEQ ID NO:1);和1

(X)m(B)pTUB(Z)r(J)s(P)n (SEQ ID NO:2)其中

m、n、p、r、s和t是独立地选自0和1的整数;

P是脯氨酸;

O 是选自丝氨酸(S)和苏氨酸(T)的成员;

U是选自脯氨酸(P)、谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和不带电荷的氨基酸的成员;

1

X、B和B 是独立地选自谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和不带电荷的氨基酸的成员;和Z、J和O是独立地选自谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)、酪氨酸(Y)、甲硫氨酸(M)和不带电荷的氨基酸的成员。

43.权利要求42的文库,其中所述外源O-联糖基化序列是选自下列的成员:(X)mPTP、(X)mPTEI(P)n、(X)mPTQA(P)n、(X)mPTINT(P)n、(X)mPTTVS(P)n、(X)mPTTVL(P)n、(X)mPTQGAM(P)n、(X)mTET(P)n、(X)mPTVL(P)n、(X)mPTLS(P)n、(X)mPTDA(P)n、(X)mPTEN(P)n、(X)mPTQD(P)n、(X)mPTAS(P)n、(X)mPTQGA(P)n、(X)mPTSAV(P)n、(X)mPTTLYV(P)n、(X)mPSSG(P)n和(X)mPSDG(P)n,其中m和n是独立地选自0和1的整数;

P是脯氨酸;和

X是独立地选自谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和不带电荷的氨基酸的成员。

44.权利要求43的文库,其中所述外源O-联糖基化序列是选自下列的成员:PTP、PTEI、PTEIP、PTQA、PTQAP、PTINT、PTINTP、PTTVS、PTTVL、PTQGAM、PTQGAMP和TETP。

45.权利要求42的文库,其中所述文库的每个成员在所述亲本多肽内的不同氨基酸位置处包含相同的O-联糖基化序列。

46.权利要求42的文库,其中所述文库的每个成员在所述亲本多肽内的相同氨基酸位置处包含不同的O-联糖基化序列。

47.权利要求42的文库,其中所述亲本多肽具有m个氨基酸,每个氨基酸对应于一个氨基酸位置,所述文库包括:(a)第一种序列肽段多肽,其在第一个氨基酸位置(AA)n处具有所述O-联糖基化序列,其中n是选自1至m的成员;和(c)至少一种额外的序列肽段多肽,每个额外的序列肽段多肽在额外的氨基酸位置处具有所述O-联糖基化序列,所述额外的氨基酸位置是选自(AA)n+x和(AA)n-x的成员,其中x是选自1至(m-n)的成员。

48.权利要求47的文库,其包括第二种序列肽段多肽,所述第二种序列肽段多肽在第二个氨基酸位置处具有所述O-联糖基化序列,所述第二个氨基酸位置选自(AA)n+p和(AA)n-p,其中p选自1至10。

49.权利要求47的文库,其中所述额外的氨基酸位置中的每一个与之前所选择的氨基酸位置相邻。

50.权利要求42的文库,其中所述O-联糖基化序列是GalNAc-转移酶的底物。

51.权利要求50的文库,其中所述GalNAc-转移酶是选自凝集素结构域缺失的GalNAc-T2和凝集素结构域截短的GalNAc-T2的成员。

52.权利要求42的文库,其中所述亲本多肽是治疗性多肽。

53.权利要求42的文库,其中所述亲本多肽是选自下列的成员:骨形态发生蛋白2(BMP-2)、骨形态发生蛋白7(BMP-7)、骨形态发生蛋白15(BMP-15)、神经营养蛋白-3(NT-3)、冯维勒布兰德因子(vWF)蛋白酶、促红细胞生成素(EPO)、粒细胞集落刺激因子(G-CSF)、粒细胞-巨噬细胞集落刺激因子(GM-CSF)、干扰素α、干扰素β、干扰素γ、α1-抗胰蛋白酶(α-1蛋白酶抑制剂)、葡糖脑苷脂酶、组织型血纤维蛋白溶酶原活化因子(TPA)、白细胞介素-2(IL-2)、瘦蛋白、蛭素、尿激酶、人DNA酶、胰岛素、乙型肝炎表面蛋白(HbsAg)、嵌合的白喉毒素-IL-2、人生长激素(hGH)、人绒毛膜促性腺激素(hCG)、甲状腺过氧化物酶(TPO)、α-半乳糖苷酶、α-L-艾杜糖苷酸酶、β-葡糖苷酶、α-半乳糖苷酶A、酸性α-葡糖苷酶(酸性麦芽糖酶)、抗凝血酶III(AT III)、促卵泡激素(FSH)、胰高血糖素样肽-1(GLP-1)、胰高血糖素样肽-2(GLP-2)、成纤维细胞生长因子7(FGF-7)、成纤维细胞生长因子21(FGF-21)、成纤维细胞生长因子23(FGF-23)、因子VII、因子VIII、B-结构域缺失的因子VIII、因子IX、因子X、因子XIII、prokinetisin、extendin-4、CD4、肿瘤坏死因子受体(TNF-R)、α-CD20、P-选择蛋白糖蛋白配体-1(PSGL-1)、补体、转铁蛋白、依赖于糖基化的细胞粘着分子(GlyCAM)、神经细胞粘着分子(N-CAM)、TNF受体-IgG Fc区融合蛋白、抗-HER2单克隆抗体、针对呼吸道合胞病毒的单克隆抗体、针对呼吸道合胞病毒的蛋白F的单克隆抗体、针对TNF-α的单克隆抗体、针对糖蛋白IIb/IIIa的单克隆抗体、针对CD20的单克隆抗体、针对VEGF-A的单克隆抗体、针对PSGL-1的单克隆抗体、针对CD4的单克隆抗体、针对a-CD3的单克隆抗体、针对EGF的单克隆抗体、针对癌胚抗原(CEA)的单克隆抗体和针对IL-2受体的单克隆抗体。

54.方法,其包括:在宿主细胞中表达序列肽段多肽,所述序列肽段多肽对应于亲本多肽并且包含选自SEQ ID NO:1和SEQ ID NO:2的外源O-联糖基化序列:*

(X)mPO U(B)p(Z)r(J)s(O)t(P)n (SEQ ID NO:1);和1

(X)m(B)pTUB(Z)r(J)s(P)n (SEQ ID NO:2)其中

m、n、p、r、s和t是独立地选自0和1的整数;

P是脯氨酸;

O 是选自丝氨酸(S)和苏氨酸(T)的成员;

U是选自脯氨酸(P)、谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和不带电荷的氨基酸的成员;

1

X、B和B 是独立地选自谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和不带电荷的氨基酸的成员;和Z、J和O是独立地选自谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)、酪氨酸(Y)、甲硫氨酸(M)和不带电荷的氨基酸的成员,条件是所述亲本多肽不是选自人生长激素(hGH)、粒细胞集落刺激因子(G-CSF)、干扰素-α(INF-α)、胰高血糖素样肽-1(GLP-1)和成纤维细胞生长因子(FGF)的成员。

55.权利要求54的方法,其进一步包括分离所述序列肽段多肽。

56.权利要求54的方法,其进一步包括在所述O-联糖基化序列处酶促糖基化所述序列肽段多肽。

57.权利要求56的方法,其中使用糖基转移酶来实现所述酶促糖基化。

58.权利要求57的方法,其中所述糖基转移酶是GalNAc-T2。

59.权利要求58的方法,其中所述GalNAc-T2是选自凝集素结构域缺失的GalNAc-T2和凝集素结构域截短的GalNAc-T2的成员。

60.权利要求54的方法,其进一步包括产生表达载体,所述表达载体包含编码所述序列肽段多肽的核酸序列。

61.权利要求60的方法,其进一步包括用所述表达载体转染所述宿主细胞。

62.权利要求54的方法,其中所述亲本多肽是治疗性多肽。

63.权利要求54的方法,其中所述亲本多肽是选自下列的成员:骨形态发生蛋白2(BMP-2)、骨形态发生蛋白7(BMP-7)、骨形态发生蛋白15(BMP-15)、神经营养蛋白-3(NT-3)、冯维勒布兰德因子(vWF)蛋白酶、促红细胞生成素(EPO)、α1-抗胰蛋白酶(α-1蛋白酶抑制剂)、葡糖脑苷脂酶、组织型血纤维蛋白溶酶原活化因子(TPA)、瘦蛋白、蛭素、尿激酶、人DNA酶、胰岛素、乙型肝炎表面蛋白(HbsAg)、嵌合的白喉毒素-IL-2、人绒毛膜促性腺激素(hCG)、甲状腺过氧化物酶(TPO)、α-半乳糖苷酶、α-L-艾杜糖苷酸酶、β-葡糖苷酶、α-半乳糖苷酶A、酸性α-葡糖苷酶(酸性麦芽糖酶)、抗凝血酶III(AT III)、促卵泡激素(FSH)、胰高血糖素样肽-2(GLP-2)、因子VII、因子VIII、B-结构域缺失的因子VIII、因子IX、因子X、因子XIII、prokinetisin、extendin-4、CD4、肿瘤坏死因子受体(TNF-R)、α-CD20、P-选择蛋白糖蛋白配体-1(PSGL-1)、补体、转铁蛋白、依赖于糖基化的细胞粘着分子(GlyCAM)、神经细胞粘着分子(N-CAM)、TNF受体-IgG Fc区融合蛋白、抗-HER2单克隆抗体、针对呼吸道合胞病毒的单克隆抗体、针对呼吸道合胞病毒的蛋白F的单克隆抗体、针对TNF-α的单克隆抗体、针对糖蛋白IIb/IIIa的单克隆抗体、针对CD20的单克隆抗体、针对VEGF-A的单克隆抗体、针对PSGL-1的单克隆抗体、针对CD4的单克隆抗体、针对a-CD3的单克隆抗体、针对EGF的单克隆抗体、针对癌胚抗原(CEA)的单克隆抗体和针对IL-2受体的单克隆抗体。

64.制备权利要求10的多肽缀合物的方法,其包括下列步骤:(i)重组产生所述序列肽段多肽;和

(ii)在所述O-联糖基化序列处酶促糖基化所述序列肽段多肽。

65.权利要求64的方法,其中使用GalNAc转移酶来实现步骤(ii)的所述酶促糖基化。

66.权利要求65的方法,其中所述GalNAc转移酶是人GalNAc-T2。

67.权利要求66的方法,其中所述GalNAc-T2是选自凝集素结构域缺失的GalNAc-T2和凝集素结构域截短的GalNAc-T2的成员。

68.制备权利要求47的序列肽段多肽文库的方法,所述方法包括:(i)通过在第一个氨基酸位置(AA)n处引入所述O-联糖基化序列而重组产生第一种序列肽段多肽;和(ii)通过在选自(AA)n+x和(AA)n-x的额外的氨基酸位置处引入所述O-联糖基化序列而重组产生至少一种额外的序列肽段多肽,其中x是选自1至(m-n)的成员。

69.鉴定先导多肽的方法,所述方法包括:

(i)产生权利要求42的序列肽段多肽文库;和

(ii)使所述文库的至少一个成员进行酶促糖基化反应,从而将糖基部分从糖基供体分子转移到至少一个所述O-联糖基化序列上,其中任选地用修饰基团来对所述糖基部分进行衍生化,由此鉴定出所述先导多肽。

70.权利要求69的方法,其进一步包括,对于所述文库的至少一个成员,测量所述酶促糖基化反应的产率。

71.权利要求70的方法,其中通过选自质谱法、凝胶电泳、核磁共振(NMR)和HPLC的成员来实现所述测量。

72.权利要求70的方法,其中所述先导多肽的所述产率为约50%至约100%。

73.权利要求69的方法,其进一步包括,在步骤(ii)之前,纯化所述文库的至少一个成员。

74.权利要求69的方法,其中步骤(ii)的所述糖基部分包含选自半乳糖部分和GalNAc部分的成员。

75.权利要求69的方法,其中步骤(ii)的所述酶促糖基化反应在宿主细胞内发生,在所述宿主细胞中表达所述文库的所述至少一个成员。

76.权利要求69的方法,其进一步包括:

(iii)使步骤(ii)的产物进行PEG化反应,其中所述PEG化反应是选自化学PEG化反应和酶促糖PEG化反应的成员。

77.权利要求76的方法,其中在单个反应容器中进行步骤(ii)和步骤(iii)。

78.权利要求76的方法,其进一步包括测量所述PEG化反应的产率。

79.权利要求78的方法,其中通过选自质谱法、凝胶电泳、核磁共振(NMR)和HPLC的成员来实现所述测量。

80.权利要求78的方法,其中所述先导多肽的所述PEG化反应的所述产率为约50%至约100%。

81.权利要求76的方法,其中在所述PEG化反应后的所述先导多肽具有与所述亲本多肽的治疗活性基本上相同的治疗活性。

82.权利要求76的方法,其中在所述PEG化反应后的所述先导多肽具有与所述亲本多肽的治疗活性不同的治疗活性。

83.权利要求69的方法,其进一步包括产生包含编码所述序列肽段多肽的核酸序列的表达载体。

84.权利要求83的方法,其进一步包括用所述表达载体转染所述宿主细胞。

说明书 :

通过O-联糖基化序列的肽的糖基化

相关申请的交叉引用

[0001] 本申请要求2006年7月21日提交的美国临时专利申请号60/832,461、2007年1月25日提交的美国临时专利申请号60/886,616、2007年6月4日提交的美国临时专利申
请号60/941,920和2007年1月18日提交的美国临时专利申请号60/881,130的优先权,
这些文献中的每一篇通过提及而以其整体合并入本文以用于所有目的。
发明领域
[0002] 本发明属于通过糖基化来进行多肽修饰的领域。具体地,本发明涉及用短的被酶所识别的O-联或S-联糖基化序列制备经糖基化的多肽的方法。

发明背景

[0003] 本发明涉及多肽(优选具有治疗价值的多肽)的糖基化和修饰。施用糖基化的和非糖基化的多肽以引起特定生理学应答是医学领域中公知的。例如,纯化的和重组的hGH
都用于治疗与hGH缺乏相关的病状和疾病,如儿童中的侏儒症。其他例子涉及已知具有抗
病毒活性的干扰素,以及刺激白细胞产生的粒细胞集落刺激因子(G-CSF)。
[0004] 缺少可用于生产具有野生型糖基化模式的多肽的表达系统已经限制了将此类多肽用作治疗剂。本领域已知,不正确或不完全糖基化的多肽可能是免疫原性的,这导致该肽
的快速中和和/或变态反应的形成。重组产生的糖肽的其他缺点包括亚最佳的功效和从血
流中的快速清除。
[0005] 一种解决在生产糖基化多肽治疗剂方面所固有的问题的方法是在其表达后在体外修饰这些多肽。多肽的表达后体外修饰已经被用于修饰现有的聚糖结构和将糖基部
分附着至非糖基化的氨基酸残基。已经可以广泛选择重组真核生物糖基转移酶,这使得
在体外酶促合成具有定制的糖基化模式和糖基结构的哺乳动物糖缀合物成为可能。参
见例如,美国专利号5,876,980;6,030,815;5,728,554;5,922,577;以及WO/9831826;
US2003180835;和WO 03/031464。
[0006] 此外,糖肽已经用一种或多种非糖修饰基团例如水溶性聚合物来进行衍生化。已经被缀合至肽的示例性聚合物是聚(乙二醇)(“PEG”)。PEG-缀合(其增加多肽的分子大
小)已被用于降低免疫原性和延长PEG-缀合的多肽在循环中的清除时间。例如,Davis等
人的美国专利号4,179,337公开了偶联至聚乙二醇(PEG)或聚丙二醇(PPG)的非免疫原性
多肽,如酶和多肽-激素。
[0007] 将PEG和其衍生物附着至多肽的主要方法涉及通过氨基酸残基的非特异性键合(参见例如,美国专利号4,088,538、美国专利号4,496,689、美国专利号4,414,147、美国专
利号4,055,635和PCT WO87/00056)。另一种PEG-缀合方法涉及糖肽的糖基残基的非特异
性氧化(参见例如,WO 94/05332)。
[0008] 在这些非特异性方法中,PEG以随机且非特异性的方式加入到在多肽主链上的反应性残基上。该方法具有显著缺点,包括终产物缺少同质性,和经修饰的多肽的生物学或酶
活性可能会降低。因此,非常需要用于治疗性多肽的衍生化方法,其导致形成经特异性地标
记的、可容易地表征的和基本上同质的产物。
[0009] 在体外通过使用酶可以产生经特异性地修饰的、同质的多肽治疗剂。不像用于将修饰基团(例如合成的聚合物)附着至多肽的非特异性方法,基于酶的合成具有区域选择
性和立体选择性的优点。用于合成经标记的多肽的两种主要类别的酶是糖基转移酶(例
如,唾液酸转移酶、寡糖基转移酶、N-乙酰葡糖胺转移酶)和糖苷酶。这些酶可以用于特异
地附着糖,该糖可以随后被改变以包含修饰基团。备选地,糖基转移酶和经修饰的糖苷酶可
以用于将经修饰的糖直接转移至多肽主链(参见例如,美国专利6,399,336,和美国专利申
请公开20030040037、20040132640、20040137557、20040126838和20040142856,它们各自
通过提及而合并入本文)。组合了化学和酶促方法的方法也是已知的(参见例如,Yamamoto
等人,Carbohydr.Res.305:415-422(1998),和美国专利申请公开20040137557,其通过提
及而合并入本文)。
[0010] 以几种方法将碳水化合物连接至糖肽,其中N-连接至天冬酰胺和O-连接至丝氨酸和苏氨酸对于重组糖蛋白治疗剂是最相关的。在所有真核细胞的分泌型和细胞表面结合
型糖蛋白上均发现O-联糖基化。在通过O-联糖基化产生的结构中具有很大的多样性。通
过存在于高尔基体中的数百种酶(糖基转移酶)的催化活性而产生此类聚糖。多样性存
在于聚糖结构水平上和存在于O-聚糖与蛋白质主链附着的位置中。尽管具有高度的潜在
多样性,但是显然O-联糖基化是受高度调控的过程,其在多细胞生物中显示出高度的保守
性。
[0011] 抗体在它们的恒定区中保守位置上被糖基化(Jefferis和Lund(1997)Chem.Immunol.65:111-128;Wright和Morrison(1997)TibTECH 15:26-32)。抗体的寡糖侧
链影响它们的功能(Wittwer&Howard.(1990)Biochem.29:4175;Boyd等人,(1996)Mol.
Immunol.32:1311)以及分子间和分子内相互作用(Goochee等人,(1991)Bio/Technology,
9:1347;Parekh,(1991)Curr.Opin.Struct.Biol.,1:750;Hart,(1992)Curr.Opin.Cell
Biol.,4:1017;Jefferis & Lund同上;Wyss & Wagner(1996)Curr.Opin.Biotech.7:409)。
[0012] 对于人IgG,核心寡糖通常由GlcNAc2Man3GlcNAc组成,在外部残基的数目中有轻微差异。例如,个体IgG中的变异通过半乳糖和/或半乳糖-唾液酸附着在两个末端GlcNAc
处或者通过第三个GlcNAc臂(等分GlcNAc)的附着而发生。已经发现,通过糖苷酶切割
或诱变来除去碳水化合物部分会影响与C1q和FcγR的结合和下游应答,例如补体激活和
ADCC。(Leatherbarrow等人Molec.Immunol.22:407-415(1985);Duncan等人Nature 332:
738-740(1988);Walker等人Biochem.J.259:347-353(1989))。当存在碳水化合物时,糖残
基的性质可以影响IgG效应子功能(Wright等人J.Immunol.160:3393-3402(1998))。
[0013] 并不是所有多肽都包含糖基化序列作为其氨基酸序列的一部分。此外,现有的糖基化序列对于修饰基团的附着可能并不合适。此类修饰可以例如引起经修饰的多肽的生物
活性的不希望的降低。因此,本领域需要允许在多肽的氨基酸序列内精确地产生糖基化序
列和能够精确地指导对于那些位点的修饰的方法。本发明解决了这些和其他需求。
发明概述
[0014] 本发明描述了如下发现:酶促糖缀合(glycoconjugation)反应可以可以特异地靶向多肽内的某些O-联或S-联糖基化序列。然后,可以通过酶或化学方法向所得的糖
缀合物添加任选含有修饰基团的额外的糖基残基。在一个实例中,通过突变在亲本多肽
(例如,野生型多肽)中引入被靶定的糖基化序列,从而产生包含糖基化序列的突变型多
肽,其中该糖基化序列在相应的亲本多肽中不存在或者在相应的亲本多肽中的相同位置
处不存在(外源糖基化序列)。此类突变型多肽在本文中被称作“序列肽段多肽(sequon
polypeptides)”。因此,本发明提供了这样的序列肽段多肽,其包含一个或多个O-联或
S-联糖基化序列。在一个实施方案中,每个糖基化序列是酶的底物,所述酶例如为糖基转
移酶,如GalNAc-转移酶(例如,GalNAc-T2)。此外,本发明提供了序列肽段多肽和修饰基
团(例如,水溶性聚合物修饰基团)之间的缀合物。本发明进一步提供了制备序列肽段多
肽的方法以及制备和使用所述多肽缀合物的方法。本发明进一步提供了包含本发明的多肽
缀合物的药物组合物。本发明还提供了序列肽段多肽文库,其中此类文库的每个成员包含
至少一个本发明的O-联糖基化序列。还提供了制备和使用此类文库的方法。
[0015] 在第一方面,本发明提供了糖基化或非糖基化的序列肽段多肽和聚合物修饰基团之间的共价缀合物。所述序列肽段多肽包含本发明的外源O-联糖基化序列。所述聚合物
修饰基团通过糖基连接基团在所述O-联糖基化序列处缀合至所述序列肽段多肽,其中所
述糖基连接基团插入在所述序列肽段多肽和所述聚合物修饰基团之间并且共价连接至所
述序列肽段多肽和所述聚合物修饰基团。在一个实施方案中,所述亲本多肽不是人生长激
素(hGH)。在另一个实施方案中,所述亲本多肽不是粒细胞集落刺激因子(G-CSF)。在另外
一个实施方案中,所述亲本多肽不是干扰素-α(INF-α)。在进一步的实施方案中,所述亲
本多肽不是胰高血糖素样肽-1(GLP-1)。在另一个实施方案中,所述亲本多肽不是成纤维细
胞生长因子(FGF)。
[0016] 在第二方面,本发明提供了包含序列肽段多肽的多肽缀合物,其中所述序列肽段多肽包含外源O-联糖基化序列。所述多肽缀合物包含根据式(V)的部分,其中q可以是0
或1:
[0017] 在式(V)中,w是选自0和1的整数。AA-O-是从具有被羟基取代的侧链的氨基酸(例如,丝氨酸或苏氨酸)衍生而得的部分。该氨基酸存在于所述O-联糖基化序列内。当
q为1时,所述氨基酸是内部氨基酸,和当q为0时,所述氨基酸是N-末端或C-末端氨基
酸。在一个实施方案中,Z*是糖基部分。在另一个实施方案中,Z*是糖基连接基团。在一
个实施方案中,X*是聚合物修饰基团。在另一个实施方案中,X*是共价连接至聚合物修饰
基团的糖基连接基团。在一个实施方案中,所述亲本多肽不是人生长激素(hGH)。在另一个
实施方案中,所述亲本多肽不是粒细胞集落刺激因子(G-CSF)。在另外一个实施方案中,所
述亲本多肽不是干扰素-α(INF-α)。在进一步的实施方案中,所述亲本多肽不是胰高血糖
素样肽-1(GLP-1)。在另一个实施方案中,所述亲本多肽不是成纤维细胞生长因子(FGF)。
[0018] 本发明还提供了包含本发明的多肽缀合物和可药用载体的药物组合物。
[0019] 在第三方面,本发明提供了包含外源O-联糖基化序列的序列肽段多肽。在一个实施方案中,所述O-联糖基化序列具有根据式(I)的氨基酸序列。在另一个实施方案中,所

述O-联糖基化序列具有根据式(II)的氨基酸序列:(X)mPO U(B)p(Z)r(J)s(O)t(P)n (I)
1
(SEQ ID NO:1);和(X)m(B)pTUB(Z)r(J)s(P)n (II)(SEQ ID NO:2)。
[0020] 在一个实施方案中,在式(I)和式(II)中,整数m为0。在另一个实施方案中,m为1。在一个实施方案中,整数n为0。在另一个实施方案中,n为1。在一个实施方案中,
整数p为0。在另一个实施方案中,p为1。在一个实施方案中,整数r为0。在另一个实施
方案中,r为1。在一个实施方案中,整数s为0。在另一个实施方案中,s为1。在一个实
施方案中,整数t为0。在另一个实施方案中,t为1。
[0021] 在式(I)和式(II)中,P为脯氨酸。在一个实施方案中,O*为丝氨酸(S)。在另一*
个实施方案中,O 为苏氨酸(T)。在一个实施方案中,U为脯氨酸(P)。在另一个实施方案
中,U为谷氨酸(E)。在另外一个实施方案中,U为谷氨酰胺(Q)。在进一步的实施方案中,
U为天冬氨酸(D)。在相关的实施方案中,U为天冬酰胺(N)。在另一个实施方案中,U为苏
氨酸(T)。在另外一个实施方案中,U为丝氨酸(S)。在进一步的实施方案中,U为不带电
1
荷的氨基酸,例如甘氨酸(G)或丙氨酸(A)。X、B和B 是独立地选自谷氨酸(E)、谷氨酰胺
(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和不带电荷的氨基酸的成员。Z、
J和O是独立地选自谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝
氨酸(S)、酪氨酸(Y)、甲硫氨酸(M)和不带电荷的氨基酸的成员。在一个实施方案中,所述
亲本多肽不是人生长激素(hGH)。在另一个实施方案中,所述亲本多肽不是粒细胞集落刺激
因子(G-CSF)。在另外一个实施方案中,所述亲本多肽不是干扰素-α(INF-α)。在进一步
的实施方案中,所述亲本多肽不是胰高血糖素样肽-1(GLP-1)。在另一个实施方案中,所述
亲本多肽不是成纤维细胞生长因子(FGF)。
[0022] 在一个实施方案中,所述O-联糖基化序列是XPO*P。在另一个实施方案中,所述*
O-联糖基化序列是XPO EI(P)n。在另外一个实施方案中,所述O-联糖基化序列是(X)mPO
* *
EI。在进一步的实施方案中,所述O-联糖基化序列是XPO QA(P)n。在一个实施方案中,

所述O-联糖基化序列是XPO TVS。在另一个实施方案中,所述O-联糖基化序列是(X)mPO
* *
TVSP。在另外一个实施方案中,所述O-联糖基化序列是XPO QGA。在进一步的实施方案

中,所述O-联糖基化序列是(X)mPO QGAP。在一个实施方案中,所述O-联糖基化序列是XPO
* *
QGAM(P)n。在另一个实施方案中,所述O-联糖基化序列是XTEO P。在另外一个实施方案

中,所述O-联糖基化序列是(X)mPO VL。在进一步的实施方案中,所述O-联糖基化序列是
* *
XPO VL(P)n。在一个实施方案中,所述O-联糖基化序列是XPO TVL。在另一个实施方案

中,所述O-联糖基化序列是(X)mPO TVLP。在另外一个实施方案中,所述O-联糖基化序列
* *
是(X)mPO TLYVP。在进一步的实施方案中,所述O-联糖基化序列是XPO TLYV(P)n。在一

个实施方案中,所述O-联糖基化序列是(X)mPO LS(P)n。在另一个实施方案中,所述O-联
* *
糖基化序列是(X)mPO DA(P)n。在另外一个实施方案中,所述O-联糖基化序列是(X)mPO

EN(P)n。在进一步的实施方案中,所述O-联糖基化序列是(X)mPO QD(P)n。在一个实施方

案中,所述O-联糖基化序列是(X)mPO AS(P)n。在另一个实施方案中,所述O-联糖基化序
* *
列是XPO SAV。在另外一个实施方案中,所述O-联糖基化序列是(X)mPO SAVP。在进一步

的实施方案中,所述O-联糖基化序列是(X)mPO SG(P)n。在一个实施方案中,所述O-联糖
* * n
基化序列是XTEO P。在另一个实施方案中,所述O-联糖基化序列是(X)mPO DG(P)。
[0023] 在上面的序列中,m、n、O*和X如上定义。
[0024] 在另一方面,本发明提供了包含多个成员的序列肽段多肽文库,其中所述文库的每个成员对应于共同的亲本多肽并且其中所述文库的每个成员包含外源O-联糖基化序
列。在一个实施方案中,所述O-联糖基化序列具有根据式(I)的氨基酸序列(SEQ ID NO:
1)。在另一个实施方案中,所述O-联糖基化序列具有根据式(II)的氨基酸序列(SEQ ID
NO:2)。式(I)和式(II)如本文上面所述。在一个实施方案中,所述亲本多肽不是人生长
激素(hGH)。在另一个实施方案中,所述亲本多肽不是粒细胞集落刺激因子(G-CSF)。在另
外一个实施方案中,所述亲本多肽不是干扰素-α(INF-α)。在进一步的实施方案中,所述
亲本多肽不是胰高血糖素样肽-1(GLP-1)。在另一个实施方案中,所述亲本多肽不是成纤维
细胞生长因子(FGF)。
[0025] 在另一方面,本发明提供了这样的方法,其包括:在宿主细胞中表达序列肽段多肽,其中所述序列肽段多肽包含本发明的外源O-联糖基化序列。在一个实施方案中,所述
O-联糖基化序列具有根据式(I)的氨基酸序列(SEQ ID NO:1)。在另一个实施方案中,所
述O-联糖基化序列具有根据式(II)的氨基酸序列(SEQ ID NO:2)。式(I)和式(II)如
本文上面所述。在一个实施方案中,所述亲本多肽不是人生长激素(hGH)。在另一个实施方
案中,所述亲本多肽不是粒细胞集落刺激因子(G-CSF)。在另外一个实施方案中,所述亲本
多肽不是干扰素-α(INF-α)。在进一步的实施方案中,所述亲本多肽不是胰高血糖素样
肽-1(GLP-1)。在另一个实施方案中,所述亲本多肽不是成纤维细胞生长因子(FGF)。
[0026] 在另外一个方面,本发明提供了制备本发明的多肽缀合物的方法。该方法包括:(i)重组产生所述序列肽段多肽;和(ii)在所述外源O-联糖基化序列处酶促糖基化所述
序列肽段多肽。该方法可以进一步包括:糖PEG化(glycoPEGylating)步骤(ii)的经糖基
化的多肽。
[0027] 本发明还提供了制备序列肽段多肽文库的方法,其中每个序列肽段多肽对应于共同的亲本多肽。该方法包括:(i)通过在亲本多肽内的第一个氨基酸位置处引入O-联糖基
化序列而重组产生第一种序列肽段多肽;和(ii)通过在亲本多肽内的额外的氨基酸位置
处引入相同的O-联糖基化序列而重组产生至少一种额外的序列肽段多肽。
[0028] 此外,本发明提供了鉴定先导多肽的方法。该方法包括:(i)产生本发明的序列肽段多肽文库;和(ii)使所述文库的至少一个成员进行酶促糖基化反应,从而将糖基部分从
糖基供体分子转移到至少一个所述O-联糖基化序列上,其中任选地用修饰基团来对所述
糖基部分进行衍生化。
[0029] 根据下面的详细描述,本发明的另外方面、优点和目的将会是显而易见的。附图简述
[0030] 图1显示了示例性的非糖基化的和示例性的糖基化的突变型NT-3多肽(表16中**
的A.2)(SEQ ID NO: )的MALFI-TOF质谱图。图1A显示了非糖基化的NT-3的MALFI-TOF
质谱图。该多肽在W3110大肠杆菌(E.coli)中表达为内含体,重折叠,并纯化。图1B显示
了糖基化的NT-3的MALFI-TOF质谱图。如实施例2中所描述的,将纯化的NT-3突变体与糖
基转移酶GalNAc-T2和UDP-GalNAc一起进行温育。反应产物通过约203Da的预期的质量
增加来表征(预期值:+203.2),其对应于当与未糖基化的多肽相比较时添加了单个GalNAc
残基。
[0031] 图2显示了示例性的非糖基化的和示例性的糖基化的突变型FGF-21多肽(表**
18中的B.20)(SEQ ID NO: )的MALFI-TOF质谱图。图2A显示了非糖基化的FGF-21的
MALFI-TOF质谱图。该多肽在trxB、gor、supp大肠杆菌菌株中表达为可溶蛋白,重折叠,并
纯化。图2B显示了糖基化的FGF-21的MALFI-TOF质谱图。如实施例4中所描述的,将纯
化的FGF-21突变体与糖基转移酶GalNAc-T2和UDP-GalNAc一起进行温育。反应产物通过
约203Da的预期的质量增加来表征(预期值:+203.2,测定值:209),其对应于当与未糖基
化的多肽相比较时添加了单个GalNAc残基。
[0032] 图3显示了各种非PEG化的和糖PEG化的人NT-3突变型多肽的SDS PAGE凝胶电泳的结果。如实施例2中所描述的,纯化并糖PEG化NT-3变体。反应体系通过SDS PAGE
进行分析,并用SimplyBlue safestain进行染色。凝胶A:用GalNAc-T2处理的表16中的
**
NT-3变体A.1(SEQ ID NO: )(泳道1);用GalNAc-T2/ST6GalNAc1处理的表16中的NT-3
**
变体A.1(SEQ IDNO: )(泳道2);分子量标准参照物(泳道3);用GalNAc-T2处理的表16
**
中的NT-3变体A.2(SEQ ID NO: )(泳道4);用GalNAc-T2/ST6GalNAc1处理的表16中的
**
NT-3变体A.2(SEQ IDNO: )(泳道5);用GalNAc-T2处理的表16中的NT-3变体A.4(SEQ
**
ID NO: )(泳道6);用GalNAc-T2/ST6GalNAc1处理的表16中的NT-3变体A.4(SEQ ID
** **
NO: )(泳道7);用GalNAc-T2处理的表16中的NT-3变体A.5(SEQ ID NO: )(泳道
**
8);用GalNAc-T2/ST6GalNAc1处理的表16中的NT-3变体A.5(SEQ IDNO: )(泳道9);
**
用GalNAc-T2处理的表16中的NT-3变体A.7(SEQ ID NO: )(泳道10);用GalNAc-T2/
**
ST6GalNAc1处理的表16中的NT-3变体A.7(SEQ ID NO: )(泳道11);用GalNAc-T2/
**
Core-1处理的表16中的NT-3变体A.1(SEQ ID NO: )(泳道12);用GalNAc-T2/Core-1/
**
ST3Gal1处理的表16中的NT-3变体A.1(SEQ ID NO: )(泳道13);用GalNAc-T2/Core-1
**
处理的表16中的NT-3变体A.2(SEQ ID NO: )(泳道14);用GalNAc-T2/Core-1/ST3Gal1
**
处理的表16中的NT-3变体A.2(SEQ IDNO: )(泳道15);用GalNAc-T2/Core-1处理的表
**
16中的NT-3变体A.4(SEQ ID NO: )(泳道16);用GalNAc-T2/Core-1/ST3Gal1处理的
**
表16中的NT-3变体A.4(SEQ ID NO: )(泳道17);用GalNAc-T2/Core-1处理的表16中
**
的NT-3变体A.5(SEQ ID NO: )(泳道18);分子量标准参照物(泳道19);用GalNAc-T2/
**
Core-1/ST3Gal1处理的表16中的NT-3变体A.5(SEQ IDNO: )(泳道20);用GalNAc-T2/
**
Core-1处理的表16中的NT-3变体A.7(SEQ ID NO: )(泳道21);用GalNAc-T2/Core-1/
**
ST3Gal1处理的表16中的NT-3变体A.7(SEQ ID NO: )(泳道22)。分子量为约14kD的
在下方加框区域中的条带对应于非PEG化的NT-3突变体。分子量为约49-62kD的在上方
加框区域中的条带对应于糖PEG化的NT-3变体。
[0033] 图4显示了因子VIII的示例性氨基酸序列。
[0034] 图5显示了B-结构域缺失的(BDD)因子VIII的示例性氨基酸序列。
[0035] 图6是示例性的亲本多肽/O-联糖基化序列组合的概括。每行代表本发明的一个实施方案,其中将所示的O-联糖基化序列(例如,PTP)引入所指明的亲本多肽(例如,
BMP-7)中,从而得到本发明的序列肽段多肽。可以将O-联糖基化序列于不同的氨基酸位置
处(例如,在N-末端处、在C-末端处或者在内部氨基酸位置处)引入亲本多肽中。可以在
替代或不替代现有氨基酸的情况下将O-联糖基化序列引入亲本多肽中。发明详述I.缩写
[0036] PEG,聚(乙二醇);m-PEG,甲氧基-聚(乙二醇);PPG,聚(丙二醇);m-PPG,甲氧基-聚(丙二醇);Fuc,岩藻糖或岩藻糖基;Gal,半乳糖或半乳糖基;GalNAc,N-乙酰
半乳糖胺或N-乙酰半乳糖胺基;Glc,葡萄糖或葡萄糖基;GlcNAc,N-乙酰葡糖胺或N-乙
酰葡糖胺基;Man,甘露糖或甘露糖基;ManAc,乙酸甘露糖胺或甘露糖胺基乙酸酯;Sia,
唾液酸或唾液酸基;和NeuAc,N-乙酰神经胺(N-acetylneuramine)或N-乙酰神经胺基
(N-acetylneuraminyl)。II.定义
[0037] 除非另有定义,本文使用的所有技术和科学术语一般具有与本发明所属领域普通技术人员通常理解相同的含义。通常,在细胞培养、分子遗传学、有机化学以及核酸化学和
杂交方面的本文所使用的命名以及实验室操作程序是本领域熟知并通常采用的那些。标准
技术用于核酸和肽合成。所述技术和操作程序通常根据本领域的常规方法和本文件中各处
所提供的各种一般参考文献(通常参见Sambrook等人,MOLECULAR CLONING:A LABORATORY
MANUAL,第2版(1989)Cold Spring Harbor Laboratory Press,Cold Spring Harbor,
N.Y.,其通过提及而合并入本文)来进行。下面所描述的分析和合成有机化学方面的本文
所使用的命名以及实验室操作程序是本领域熟知并通常采用的那些。标准技术或其修改形
式用于化学合成和化学分析。
[0038] 本文所描述的所有寡糖以下列方式进行描述:非还原糖的名称或缩写(即Gal),接着是糖苷键的构型(α或β)、环键(1或2)、参与该键的还原糖的环位置(2、3、4、6或8),
然后是还原糖的名称或缩写(即GlcNAc)。每种糖优选是吡喃糖。标准糖生物学命名法的
综述参见例如Essentials of Glycobiology Varki等人(编辑),CSHL Press(1999)。寡
糖可以包括糖基模拟部分作为糖组分之一。寡糖被认为具有还原端和非还原端,不论在还
原端处的糖是否实际上为还原糖。
[0039] 术语“糖基部分”是指衍生自糖残基的任何基团。“糖基部分”包括单糖和寡糖并且包括“糖基模拟部分”。
[0040] 如本文所使用的,术语“糖基模拟部分”是指结构上类似于糖基部分(例如,己糖或戊糖)的部分。“糖基模拟部分”的实例包括这样的部分,其中糖基部分的糖苷氧原子或
环氧原子或者两者已经用键或另一原子(例如,硫),或者另一部分例如含碳基团(例如,
CH2)或含氮基团(例如,NH)替代。实例包括取代或未取代的环己基衍生物、环硫醚、环仲
胺、包含硫代糖苷键的部分,等等。在一个实例中,“糖基模拟部分”在酶催化的反应中转移
到多肽的氨基酸残基或糖肽的糖基部分上。这可以例如通过下列方式来完成:用离去基团
例如卤素来活化“糖基模拟部分”。
[0041] 术语“核酸”或“多核苷酸”指单链或双链形式的脱氧核糖核酸(DNA)或核糖核酸(RNA)和其聚合物。除非特别限制,该术语包括含有天然核苷酸的已知类似物的核酸,所述
核酸具有与参考核酸相似的结合性质并且以与天然存在的核苷酸相似的方式被代谢。除非
另外指出,特定的核酸序列还含蓄地包括其经保守修饰的变体(例如,简并密码子取代)、
等位基因、直向同源物、SNP和互补序列以及明确指出的序列。具体地,可以通过下列方式来
实现简并密码子取代:产生其中一个或多个所选择的(或所有)密码子的第三个位置被混
合碱基和/或脱氧肌苷残基取代的序列(Batzer等人,NucleicAcid Res.19:5081(1991);
Ohtsuka等人,J.Biol.Chem.260:2605-2608(1985);和Rossolini等人,Mol.Cell.Probes
8:91-98(1994))。术语核酸可以与基因、cDNA和由基因所编码的mRNA互换使用。
[0042] 术语“基因”是指参与产生多肽链的DNA区段。它可以包括编码区之前和之后的区域(前导区和非转录尾区)以及各编码区段(外显子)之间的间插序列(内含子)。
[0043] 术语“分离的”,当应用于核酸或蛋白质时,表示该核酸或蛋白质基本上没有在天然状态下其所结合的其他细胞组分。其优选处于同质状态,尽管它可以在无水或含水溶液
中。通常使用分析化学技术例如聚丙烯酰胺凝胶电泳或高效液相色谱法来测定纯度和同质
性。为存在于制剂中的主要种类的蛋白质是基本上经纯化的。具体地,分离的基因是与位
于该基因侧翼并且编码除目的基因之外的其他蛋白质的开放阅读框相分开的。术语“纯化
的”表示,核酸或蛋白质在电泳凝胶中产生基本上一条带。具体地,它并表示,该核酸或蛋白
质为至少85%纯的,更优选至少95%纯的,和最优选至少99%纯的。
[0044] 术语“氨基酸”是指天然存在的和合成的氨基酸,以及以类似于天然存在的氨基酸的方式发挥功能的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的
那些,以及后来进行修饰的那些氨基酸,例如羟脯氨酸、γ-羧基谷氨酸和O-磷酸丝氨酸。
氨基酸类似物是指具有与天然存在的氨基酸相同的基本化学结构(即,结合至氢、羧基、氨
基和R基团的α碳)的化合物,例如高丝氨酸、正亮氨酸、甲硫氨酸亚砜、甲硫氨酸甲基锍。
此类类似物具有经修饰的R基团(例如,正亮氨酸)或经修饰的肽主链,但是保留了与天然
存在的氨基酸相同的基本化学结构。“氨基酸模拟物”是指这样的化合物,所述化合物具有
与氨基酸的一般化学结构不同的结构但是以类似于天然存在的氨基酸的方式发挥功能。
[0045] 术语“不带电荷的氨基酸”是指不包含酸性官能团(例如,-COOH)或碱性官能团(例如,-NH2)的氨基酸。碱性氨基酸包括赖氨酸(K)和精氨酸(R)。酸性氨基酸包括天冬
氨酸(D)和谷氨酸(E)。不带电荷的氨基酸包括,例如甘氨酸(G)、缬氨酸(V)、亮氨酸(L)、
苯丙氨酸(F),以及包含-OH或-SH基团的那些氨基酸(例如,苏氨酸(T)、丝氨酸(S)、酪氨
酸(Y)和半胱氨酸(C))。
[0046] 本领域中有多种已知的方法允许在多肽链中以位点特异性方式掺入非天然氨基酸衍生物,参见例如,WO 02/086075。
[0047] 在本文中,氨基酸可以通过公知的三字母符号或者通过IUPAC-IUB BiochemicalNomenclature Commission所推荐的单字母符号来表示。同样地,核苷酸可以通过它们的所
公认的单字母代码来表示。
[0048] “经保守修饰的变体”应用于氨基酸和核酸序列。关于特定核酸序列,“经保守修饰的变体”是指编码相同或基本上相同的氨基酸序列的那些核酸,或者当核酸不编码氨基酸
序列时,是指基本上相同的序列。由于遗传密码的简并性,大量功能上相同的核酸编码任意
给定的蛋白质。例如,密码子GCA、GCC、GCG和GCU都编码氨基酸丙氨酸。因此,在由密码
子指定了丙氨酸的每个位置处,该密码子可以被改变成任何所描述的相应密码子而不改变
所编码的多肽。此类核酸变异是“沉默变异”,其是经保守修饰的变异中的一个种类。编码
多肽的本文中的每个核酸序列也描述了该核酸的每种可能的沉默变异。技术人员将会认识
到,核酸中的每个密码子(除了AUG(其通常是甲硫氨酸的唯一密码子)和TGG(其通常是
色氨酸的唯一密码子)之外)可以被修饰以产生功能上相同的分子。因此,编码多肽的核
酸的每种沉默变异暗含在每个所描述的序列中。
[0049] 对于氨基酸序列,技术人员将会认识到,对核酸、肽、多肽或蛋白质序列的独个取代、缺失或添加(其在所编码的序列中改变、添加或删除单个氨基酸或者小百分比的氨基
酸)是“经保守修饰的变体”,其中该改变导致氨基酸被化学上相似的氨基酸取代。提供了
功能上相似的氨基酸的保守取代表是本领域公知的。此类经保守修饰的变体是除本发明的
多态性变体、种间同源物和等位基因以外进一步的,但不排除本发明的多态性变体、种间同
源物和等位基因。
[0050] 下面的八组中的每一组包含相互作为保守取代的氨基酸:1)丙氨酸(A)、甘氨酸(G);2)天冬氨酸(D)、谷氨酸(E);3)天冬酰胺(N)、谷氨酰胺(Q);4)精氨酸(R)、赖氨
酸(K);5)异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V);6)苯丙氨酸(F)、酪氨酸
(Y)、色氨酸(W);7)丝氨酸(S)、苏氨酸(T);和8)半胱氨酸(C)、甲硫氨酸(M)(参见例如,
Creighton,Proteins(1984))。
[0051] “肽”是指这样的聚合物,其中单体是氨基酸并且通过酰胺键连接在一起。本发明的肽的大小可以例如从两个氨基酸到数百或数千个氨基酸变化。备选地,较大的肽(例
如,至少10个、至少20个、至少30个或至少50个氨基酸残基)被称作“多肽”或“蛋白
质”。另外,非天然氨基酸,例如,β-丙氨酸、苯基甘氨酸、高精氨酸和高苯丙氨酸也包括
在内。不由基因编码的氨基酸也可以用于本发明。此外,进行修饰以包括反应性基团、糖
基化序列、聚合物、治疗性部分、生物分子等等的氨基酸也可以用于本发明。在本发明中所
使用的所有氨基酸可以是D-或L-异构体。L-异构体通常是优选的。另外,其他肽模拟物
(peptidomimetics)也可用于本发明。如本文所使用的,“肽”或“多肽”是指糖基化的和非
糖基化的肽或“多肽”。还包括被表达该多肽的系统不完全糖基化的多肽。一般性的综述可
参见,Spatola,A.F.,CHEMISTRY AND BIOCHEMISTRY OF AMINO ACIDS,PEPTIDES AND PROTEINS,B.Weinstein,eds.,Marcel Dekker,NewYork,p.267(1983)。
[0052] 在本申请中,氨基酸残基根据它们与多肽的N-末端氨基酸(例如,N-末端甲硫氨酸)(其编号为“1”)的相对位置来进行编号(通常以上标)。N-末端氨基酸可以是甲硫氨
酸(M),其编号为“1”。如果多肽的N-末端不以甲硫氨酸开始,那么与每个氨基酸残基相关
的编号可以容易地进行调整以反映N-末端甲硫氨酸的缺失。应当理解,示例性多肽的N-末
端可以以或不以甲硫氨酸开始。
[0053] 术语“亲本多肽”是指任何多肽,其氨基酸序列不包含本发明的“外源”O-联或S-联糖基化序列。然而,“亲本多肽”可以包含一个或多个天然存在的(内源的)O-联或
S-联糖基化序列。例如,野生型多肽可以包含O-联糖基化序列PTP。术语“亲本多肽”是
指任何多肽,包括野生型多肽、融合多肽、合成多肽、重组多肽(例如,治疗性多肽)以及其
任何变体(例如,之前通过一次或多次氨基酸的替代、氨基酸的插入、氨基酸的删除等等进
行了修饰),只要此类修饰不等同于形成本发明的O-联或S-联糖基化序列。在一个实施
方案中,亲本多肽的氨基酸序列或者编码亲本多肽的核酸序列进行了定义并以任何方式可
被公众获得。例如,亲本多肽是野生型多肽并且该野生型多肽的氨基酸序列或核苷酸序
列是公众可获得的蛋白质数据库(例如,EMBL核苷酸序列数据库、NCBI Entrez、ExPasy、
ProteinData Bank等等)的一部分。在另一实例中,亲本多肽不是野生型多肽但是被用作
治疗性多肽(即,经批准的药物),并且公众可在科学出版物或专利中获得此类多肽的序
列。在另外一个实例中,亲本多肽的氨基酸序列或编码亲本多肽的核酸序列在本发明时可
以以任何方式被公众获得。在一个实施方案中,亲本多肽是更大结构的一部分。例如,亲本
多肽对应于抗体的恒定区(Fc)或CH2结构域,其中这些结构域可以是完整抗体的一部分。
在一个实施方案中,亲本多肽不是具有已知序列的抗体。
[0054] 术语“突变型多肽”或“多肽变体”是指这样的多肽形式,其中它的氨基酸序列与它的对应的野生型形式、天然存在的形式或任何其他亲本形式不同。突变型多肽可以含有
一个或多个突变,例如,替代、插入、缺失,等等,这导致形成突变型多肽。
[0055] 术语“序列肽段多肽”是指这样的多肽变体,其在它的氨基酸序列中包含本发明的“外源O-联糖基化序列”。“序列肽段多肽”含有至少一个外源O-联糖基化序列,但是也可
以包含一个或多个内源(例如,天然存在的)O-联糖基化序列。
[0056] 术语“外源O-联糖基化序列”是指被引入亲本多肽(例如,野生型多肽)的氨基酸序列中的本发明的O-联糖基化序列,其中所述亲本多肽不包含O-联糖基化序列或者在不
同的位置处包含O-联糖基化序列。在一个实例中,将O-联糖基化序列引入不具有O-联糖
基化序列的野生型多肽中。在另一实例中,野生型多肽天然地在第一个位置处包含第一个
O-联糖基化序列。将第二个O-联糖基化序列在第二个位置处引入该野生型多肽中。该修
饰导致在第二个位置处具有“外源O-联糖基化序列”的多肽。可以通过突变来将外源O-联
糖基化序列引入亲本多肽中。备选地,可以通过化学合成来制备具有外源O-联糖基化序列
的多肽。
[0057] 术语“对应于亲本多肽”(或者该术语的语法变化形式)用于描述本发明的序列肽段多肽,其中该序列肽段多肽的氨基酸序列与对应的亲本多肽的氨基酸序列之间的差异仅
仅在于存在有至少一个本发明的外源O-联糖基化序列。通常,序列肽段多肽和亲本多肽的
氨基酸序列显示出高的同一性百分比。在一个实例中,“对应于亲本多肽”表示,序列肽段
多肽的氨基酸序列与亲本多肽的氨基酸序列具有至少约50%同一性、至少约60%同一性、
至少约70%同一性、至少约80%同一性、至少约90%同一性、至少约95%同一性或至少约
98%同一性。在另一实例中,编码序列肽段多肽的核酸序列与编码亲本多肽的核酸序列具
有至少约50%同一性、至少约60%同一性、至少约70%同一性、至少约80%同一性、至少约
90%同一性、至少约95%同一性或至少约98%同一性。
[0058] 术语“在亲本多肽中引入(或加入等等)糖基化序列(例如,O-联糖基化序列)”(或其语法变化形式),或者“修饰亲本序列”以包含糖基化序列(或者其语法变化形
式),并不必需表示亲本多肽是这种转化的物理起始材料,而是表示亲本多肽提供了用于制
备另一多肽的指导性氨基酸序列。在一个实例中,“在亲本多肽中引入糖基化序列”表示,通
过合适的突变来修饰亲本多肽的基因以产生编码序列肽段多肽的核苷酸序列。在另一实例
中,“在亲本多肽中引入糖基化序列”表示,使用亲本多肽序列作为指导,在理论上设计所得
的多肽。然后通过化学或其他手段来产生所设计的多肽。
[0059] 术语“先导多肽”是指可以被有效地糖基化和/或糖PEG化的本发明的序列肽段多肽。对于适合作为先导多肽的本发明的序列肽段多肽,当经历合适的反应条件时,此类多
肽被糖基化或糖PEG化,其反应产率为至少约50%,优选至少约60%,更优选至少约70%,
和更加优选约80%、约85%、约90%或约95%。最优选的是这样的本发明的先导多肽,其
可以以大于95%的反应产率被糖基化或糖PEG化。在一个优选的实施方案中,先导多肽以
这样的方式被糖基化或糖PEG化,即每个O-联糖基化序列中仅一个氨基酸残基被糖基化或
糖PEG化(单糖基化)。
[0060] 术语“文库”是指不同多肽的集合,每个多肽对应于共同的亲本多肽。文库中的每个多肽种类被称作文库的成员。优选地,本发明的文库代表了多肽的集合,其具有足够的数
目和多样性以提供从中鉴定出先导多肽的群体。文库包括至少两种不同的多肽。在一个实
施方案中,文库包括约2至约10个成员。在另一个实施方案中,文库包括约10至约20个
成员。在另外一个实施方案中,文库包括约20至约30个成员。在进一步的实施方案中,文
库包括约30至约50个成员。在另一个实施方案中,文库包括约50至约100个成员。在另
外一个实施方案中,文库包括超过100个成员。文库的成员可以是混合物的一部分或者可
以相互分离。在一个实例中,文库的成员为混合物的一部分,该混合物任选地包括其他组
分。例如,至少两种序列肽段多肽存在于一定体积的细胞培养液中。在另一实例中,文库的
成员各自分开地表达并且任选地进行分离。分离的序列肽段多肽可以任选地包含在多孔容
器中,其中每个孔含有不同类型的序列肽段多肽。
[0061] 术语本发明的“CH2”结构域意在描述免疫球蛋白重链恒定CH2结构域。在定义免疫球蛋白CH2结构域方面,参考一般的免疫球蛋白,特别是由Kabat E.A.(1978)Adv.Protein
Chem.32:1-75描述的应用于人IgG1的免疫球蛋白结构域结构。
[0062] 术语“包含CH2结构域的多肽”或“包含至少一个CH2结构域的多肽”意在包括完整的抗体分子、抗体片段(例如,Fc结构域)或融合蛋白(其包括等同于免疫球蛋白CH2区
的区域)。
[0063] 术语“多肽缀合物”是指这样的本发明种类,其中多肽用本文所示的糖部分(例如,经修饰的糖)进行糖缀合。在代表性的实例中,所述多肽是具有外源O-联糖基化序列
的序列肽段多肽。
[0064] 如本文所使用的,“接近脯氨酸残基”或“与脯氨酸残基接近”是指与脯氨酸残基相距小于约10个氨基酸,优选与脯氨酸残基相距小于约9、8、7、6或5个氨基酸,更优选与脯
氨酸残基相距小于约4、3或2个残基的氨基酸。“接近脯氨酸残基”的氨基酸可以在脯氨酸
残基的C-或N-末端侧上。
[0065] 术语“唾液酸”是指九碳羧基化糖家族中的任何成员。唾液酸家族中的最常见的成员是N-乙酰神经氨酸(2-酮-5-乙酰氨基-3,5-二脱氧-D-甘油基-D-galactononulo
吡喃糖-1-酮酸(通常简写为Neu5Ac、NeuAc或NANA)。该家族的第二个成员是N-羟乙
酰-神经氨酸(Neu5Gc或NeuGc),其中NeuAc的N-乙酰基被羟基化。第三个唾液酸家
族成员是2-酮-3-脱氧-nonulosonic酸(KDN)(Nadano等人(1986)J.Biol.Chem.261:
11550-11557;Kanamori等人,J.Biol.Chem.265:21811-21819(1990))。还包括9-取代
的唾液酸,例如9-O-C1-C6酰基-Neu5Ac,如9-O-乳酰基-Neu5Ac或9-O-乙酰基-Neu5Ac、
9-脱氧-9-氟-Neu5Ac和9-叠氮基-9-脱氧-Neu5Ac。关于唾液酸家族的综述,参见
例如,Varki,Glycobiology 2:25-40(1992);SialicAcids:Chemistry,Metabolism and
Function,R.Schauer,Ed.(Springer-Verlag,New York(1992))。唾液酸化操作程序中唾
液酸化合物的合成和使用公开在1992年10月1日公布的国际申请WO92/16640中。
[0066] 如本文所使用的,术语“经修饰的糖”是指天然或非天然存在的碳水化合物。在一个实施方案中,使用本发明的方法,将“经修饰的糖”酶促添加入到多肽的氨基酸或者糖基
残基上。经修饰的糖选自许多酶底物,包括但不限于糖核苷酸(单、二和三磷酸)、活化的糖
(例如,糖基卤化物、糖基甲磺酸酯)和既未活化也非核苷酸的糖。“经修饰的糖”用“修饰
基团”来共价官能化。可用的修饰基团包括,但不限于,聚合物修饰基团(例如,水溶性聚合
物)、治疗性部分、诊断性部分、生物分子等等。在一个实施方案中,修饰基团不是天然存在
的糖基部分(例如,天然存在的多糖)。修饰基团优选是非天然存在的。在一个实例中,“非
天然存在的修饰基团”是聚合物修饰基团,其中至少一个聚合物部分是非天然存在的。在另
一实例中,非天然存在的修饰基团是经修饰的碳水化合物。选择用修饰基团进行官能化的
位置,从而使得它不妨碍“经修饰的糖”被酶促添加至多肽。“经修饰的糖”也指任何糖基模
拟部分,其用修饰基团官能化并且是天然的或经修饰的酶(例如糖基转移酶)的底物。
[0067] 如本文所使用的,术语“聚合物修饰基团”是包含至少一个聚合物部分(聚合物)的修饰基团。被添加至多肽的聚合物修饰基团可以改变此类多肽的性质,如例如它在身体
中的生物利用率、生物活性或半寿期。示例性的聚合物包括水溶性和水不溶性聚合物。聚合
物修饰基团可以是线性或支化的,并且可以包含一个或多个独立选择的聚合物部分,例如
聚(亚烷基二醇)和其衍生物。在一个实例中,聚合物是非天然存在的。在一个示例性实施
方案中,聚合物修饰基团包括水溶性聚合物,例如,聚(乙二醇)和其衍生物(PEG、m-PEG)、
聚(丙二醇)和其衍生物(PPG、m-PPG)等等。在优选的实施方案中,聚(乙二醇)或聚(丙
二醇)具有基本上均匀分散的分子量。在一个实施方案中,聚合物修饰基团不是天然存在
的多糖。
[0068] 术语“水溶性(的)”是指在水中具有一定的可检测程度的溶解度的部分。用于检测和/或定量水溶性的方法是本领域公知的。示例性的水溶性聚合物包括肽、糖、聚(醚)、
聚(胺)、聚(羧酸)等等。肽可以具有由单一氨基酸组成的混合序列,例如聚(赖氨酸)。
示例性的多糖是聚(唾液酸)。示例性的聚(醚)是聚(乙二醇),例如m-PEG。聚(乙烯
亚胺)是示例性的聚胺,聚(丙烯酸)是代表性的聚(羧酸)。
[0069] 水溶性聚合物的聚合物主链可以是聚(乙二醇)(即,PEG)。然而,应该理解,其他相关的聚合物也适合用于实施本发明,并且术语PEG或聚(乙二醇)的使用在该方面意在
是包括性的而不是排他性的。术语PEG包括以其任何形式的聚(乙二醇),包括烷氧基PEG、
双官能PEG、多臂PEG、叉状PEG、支化PEG、悬挂型PEG(即具有一个或多个悬挂在聚合物主
链上的官能团的PEG或相关聚合物)或者其中具有可降解的键的PEG。
[0070] 聚合物主链可以是线性或支化的。支化的聚合物主链是本领域普遍已知的。通常,支化的聚合物具有中央分枝核心部分和多个连接至该中央分枝核心的线性聚合物链。PEG
通常以支化形式使用,其可以通过向各种多元醇例如甘油、季戊四醇和山梨糖醇中添加环
氧乙烷来制备。中央分枝部分也可以衍生自几种氨基酸,例如赖氨酸或半胱氨酸。在一个
实例中,支化的聚(乙二醇)可以表示为诸如R(-PEG-OH)m的通式,其中R代表核心部分,
例如甘油或季戊四醇,和m代表臂的数目。多臂PEG分子,例如美国专利号5,932,462(该
专利通过提及而以其整体合并入本文)中描述的那些,也可以用作聚合物主链。
[0071] 许多其他聚合物也适合于本发明。非肽且水溶性的聚合物主链尤其可用于本发明。合适的聚合物的实例包括,但不限于,其他聚(亚烷基二醇)例如聚(丙二醇)(“PPG”)、
乙二醇和丙二醇的共聚物等、聚(氧乙基化多元醇)、聚(烯醇)、聚(乙烯吡咯烷酮)、聚
(羟丙基甲基丙烯酰胺)、聚(α-羟基酸)、聚(乙烯醇)、聚磷腈、聚噁唑啉、聚(N-丙烯酰
吗啉),如美国专利号5,629,384(该专利通过提及而以其整体合并入本文)中所描述的,以
及其共聚物、三元共聚物和混合物。尽管聚合物主链的每条链的分子量可以变化,但是它通
常在约100Da至约100,000Da,常常约5,000Da至约80,000Da的范围内。
[0072] 如本文所使用的,术语“糖缀合”是指经修饰的糖种类与多肽(例如本发明的突变型人生长激素)的氨基酸或糖基残基的由酶介导的缀合。在一个实例中,将经修饰的
糖共价附着至一个或多个修饰基团。“糖缀合”的亚类别是“糖基-PEG化”或“糖-PEG化
(glyco-PEGylation)”,其中经修饰的糖的修饰基团是聚(乙二醇)或其衍生物,例如烷基
衍生物(例如,m-PEG)或具有反应性官能团的衍生物(例如,H2N-PEG、HOOC-PEG)。
[0073] 术语“大规模”和“工业规模”可互换使用并且指这样的反应周期,所述反应周期在单个反应周期完成时产生至少约250mg,优选至少约500mg,和更优选至少约1g的糖缀合
物。
[0074] 术语“O-联糖基化序列”或“序列肽段”是指包含具有羟基的氨基酸残基(例如,丝氨酸或苏氨酸)的任何氨基酸序列(例如,含有约3至约9个氨基酸,优选约3至约6个
氨基酸)。在一个实施方案中,O-联糖基化序列是酶例如糖基转移酶的底物,优选地当多
肽的氨基酸序列的一部分时。在典型的实施方案中,所述酶通过修饰上述羟基(其被称作
“糖基化位点”)而将糖基部分转移到O-联糖基化序列上。本发明区分在野生型多肽或其
任何其他亲本形式中天然存在的O-联糖基化序列(内源O-联糖基化序列)和“外源O-联
糖基化序列”。包含外源O-联糖基化序列的多肽被称作“序列肽段多肽”。可以通过重组技
术、化学合成或其他方法来修饰亲本多肽的氨基酸序列以包含外源O-联糖基化序列。相关
术语“S-联糖基化序列”是类似的并且是指包含具有巯基的氨基酸残基(例如,半胱氨酸、
Me-半胱氨酸)的任何氨基酸序列,而且是酶例如糖基转移酶的底物,优选地当多肽的氨基
酸序列的一部分时。
[0075] 如本文所使用的,术语“糖基连接基团”是指共价附着有修饰基团(例如,PEG部分、治疗性部分、生物分子)的糖基残基;所述糖基连接基团将修饰基团连接至缀合物的其
余部分。在本发明的方法中,“糖基连接基团”变成共价附着至糖基化或未糖基化的多肽,
从而将修饰基团连接至多肽的氨基酸和/或糖基残基。“糖基连接基团”通常通过“经修饰
的糖”酶促附着至多肽的氨基酸和/或糖基残基而衍生自“经修饰的糖”。糖基连接基团可
以是糖衍生的结构,该结构在修饰基团-经修饰的糖盒形成(例如,氧化→席夫碱形成→
还原)期间被降解,或者糖基连接基团可以是完整的。“完整的糖基连接基团”是指衍生自
这样的糖基部分的连接基团,在所述糖基部分中将修饰基团连接至缀合物的其余部分的糖
单体不被降解,例如被氧化(例如,通过偏过碘酸钠)。通过添加糖基单位或者从亲本糖结
构中除去一个或多个糖基单位,可以从天然存在的寡糖得到本发明的“完整的糖基连接基
团”。“糖基连接基团”可以包括糖基-模拟部分。例如,用于将经修饰的糖添加至经糖基化
的多肽的糖基转移酶(例如,唾液酸转移酶)显示出对于糖基-模拟底物(例如,经修饰的
糖,其中糖部分是糖基-模拟部分——例如,唾液酸基-模拟部分)的耐受性。经修饰的糖
基-模拟糖的转移导致获得具有糖基连接基团的缀合物,所述糖基连接基团是糖基-模拟
部分。
[0076] 如本文所使用的,术语“靶向性部分”是指将选择性地定位于身体的特定组织或区域中的种类。所述定位由分子决定子的特异识别、靶向性试剂或缀合物的分子大小、离子相
互作用、疏水相互作用等等介导。将试剂靶向特定组织或区域的其他机制是本领域技术人
员已知的。示例性的靶向性部分包括抗体、抗体片段、转铁蛋白、HS-糖蛋白、凝血因子、血
清蛋白、β-糖蛋白、G-CSF、GM-CSF、M-CSF、EPO等等。
[0077] 如本文所使用的,“治疗性部分”意指可用于治疗的任何试剂,包括但不限于,抗生素、抗炎剂、抗肿瘤药物、细胞毒素和放射性试剂。“治疗性部分”包括生物活性试剂的前体
药物,其中超过一个的治疗性部分结合至载体的构建体,例如多价试剂。治疗性部分还包
括蛋白质和包含蛋白质的构建体。示例性的蛋白质包括但不限于,促红细胞生成素(EPO)、
粒细胞集落刺激因子(GCSF)、粒细胞巨噬细胞集落刺激因子(GMCSF)、干扰素(例如,干扰
素-α、-β、-γ)、白细胞介素(例如,白细胞介素II)、血清蛋白(例如,因子VII、VIIa、
VIII、IX和X)、人绒毛膜促性腺激素(HCG)、促卵泡激素(FSH)和黄体生成素(LH)以及抗
体融合蛋白(例如,肿瘤坏死因子受体(TNFR)/Fc结构域融合蛋白)。
[0078] 如本文所使用的,“抗肿瘤药物”意指用于抗癌的任何试剂,包括但不限于,细胞毒素和诸如下列的试剂:抗代谢物、烷化剂、蒽环类、抗生素、抗有丝分裂药、丙卡巴肼、羟基
脲、天冬酰胺酶、皮质类固醇、干扰素和放射性试剂。在术语“抗肿瘤药物”的范围内也包括
具有抗肿瘤活性的多肽(例如TNF-α)的缀合物。缀合物包括但不限于在治疗性蛋白质和
本发明的糖蛋白之间形成的那些缀合物。代表性的缀合物是在PSGL-1和TNF-α之间形成
的缀合物。
[0079] 如本文所使用的,“细胞毒素或细胞毒性试剂”意指对细胞有害的任何试剂。实例包括紫杉醇、细胞松弛素B、短杆菌肽D、溴化乙锭、依米丁、丝裂霉素、依托
泊苷、替尼泊苷、长春新碱、长春碱、秋水仙碱、多柔比星、柔红霉素、二羟基蒽二酮
(dihydroxyanthracenedione)、米托蒽醌、光神霉素、放线菌素D、1-去氢睾酮、糖皮质激
素、普鲁卡因、丁卡因、利多卡因、普萘洛尔和嘌呤霉素以及其类似物或同源物。其他毒素包
括,例如蓖麻毒蛋白、CC-1065和类似物、倍癌霉素。另外的其他毒素包括白喉毒素和蛇毒
(例如,眼镜蛇蛇毒)。
[0080] 如本文所使用的,“放射性试剂”包括在诊断或破坏肿瘤方面有效的任何放射性同位素。实例包括但不限于,铟-111、钴-60。此外,天然存在的放射性元素,例如铀、镭和钍
(其通常表现为放射性同位素的混合物)是放射性试剂的合适的实例。金属离子通常与有
机螯合部分相螯合。
[0081] 许多可用的螯合基团、冠醚、穴状配体等是本领域已知的,并且可以掺入本发明的化合物中(例如,EDTA、DTPA、DOTA、NTA、HDTA等等,以及它们的膦酸盐类似物,如DTPP、
EDTP、HDTP、NTP等等)。参见例如,Pitt等人,“The Design of ChelatingAgents for the
Treatment of Iron Overload”,INORGANIC CHEMISTRYIN BIOLOGY AND MEDICINE;Martell,Ed.;American Chemical Society,Washington,D.C.,1980,pp.279-312;Lindoy,THE CHEMISTRY OFMACROCYCLIC LIGAND COMPLEXES;Cambridge University Press,Cambridge,1989;Dugas,BIOORGANIC CHEMISTRY;
Springer-Verlag,New York,1989,以及其中所含的参考文献。
[0082] 此外,允许将螯合剂、冠醚和环糊精附着至其他分子的许多途径是本领域技术人员可以得到的。参见例如,Meares等人,“Properties of In Vivo Chelate-Tagged
Proteins and Polypeptides.”MODIFICATION OF PROTEINS:FOOD,NUTRITIONAL,ANDPHARMACOLOGICAL ASPECTS”Feeney等 人,Eds.,American ChemicalSociety,Washington,D.C.,1982,pp.370-387;Kasina
等 人,Bioconjugate Chem.,9:108-117(1998);Song 等 人,Bioconjugate Chem.,8:
249-255(1997)。
[0083] 如本文所使用的,“可药用载体”包括当与缀合物相组合时保留该缀合物的活性并且不与受试者的免疫系统反应的任何物质。“可药用载体”包括固体和液体,例如承载体、稀
释剂和溶剂。实例包括但不限于,任何标准药物载体,例如磷酸盐缓冲盐水溶液、水、乳液例
如油/水乳液以及各种类型的湿润剂。其他载体可以还包括无菌溶液、片剂(包括包衣片
剂)和胶囊。通常,此类载体包含赋形剂,例如淀粉、乳、糖、某些类型的粘土、明胶、硬脂酸
或其盐、硬脂酸镁或硬脂酸钙、滑石、植物脂肪或油、树胶、二元醇或者其他已知的赋形剂。
此类载体可以还包括香料和颜色添加剂或其他成分。通过公知的常规方法来配制包含此类
载体的组合物。
[0084] 如本文所使用的,“施用”意指对受试者口服施用,作为栓剂施用,局部接触、静脉内、腹膜内、肌内、损害内或皮下施用,通过吸入施用,或者植入缓释装置,例如微型渗透泵。
施用通过任何途径进行,包括肠胃外和透粘膜(例如,口腔的、鼻的、阴道的、直肠的或经皮
的),特别是通过吸入。肠胃外施用包括,例如静脉内、肌内、小动脉内、皮内、皮下、腹膜内、心室内和颅内施用。此外,当进行注射以用于治疗肿瘤,例如诱导细胞凋亡时,可以直接施
用至肿瘤和/或施用到肿瘤周围的组织中。其他递送方式包括但不限于,使用脂质体制剂、
静脉内输注、透皮贴剂,等等。
[0085] 术语“改善”是指在治疗病理学状态或病状中任何成功的征候,包括任何客观或主观的参数,例如症状的减轻、缓解或减少或者患者身体或精神状态的变好。症状的改善可以
基于客观或主观的参数;包括身体检查和/或精神病学评估的结果。
[0086] 术语“治疗”或“疗法”是指对疾病或病状的“治疗”或“处理”,其包括预防疾病或病状在倾向于患该疾病但是仍未经历或显示该疾病症状的受试者(例如人)中发生(预防
性治疗)、抑制疾病(减缓或阻止其发展)、提供疾病的症状或副作用的减轻(包括姑息疗
法)和解除疾病(使疾病消退)。
[0087] 术语“有效量”或“对......有效的量”或“治疗有效量”或任何语法上等价的术语是指当施用于动物或人以治疗疾病时足够实现对该疾病的治疗的量。
[0088] 术语“分离的”是指这样的材料,其实质上或基本上不含用于制备该材料的组分。对于本发明的多肽缀合物,术语“分离的”是指这样的材料,其实质上或基本上不含在用于
制备该多肽缀合物的混合物中通常伴随该材料的组分。“分离的”和“纯的”可互换使用。
通常,本发明的分离的多肽缀合物具有优选表示为一定范围的纯度水平。所述多肽缀合物
的纯度范围的下端为约60%、约70%或约80%,而纯度范围的上端为约70%、约80%、约
90%或大于约90%。
[0089] 当多肽缀合物大于约90%纯时,它们的纯度也优选表示为范围。纯度范围的下端为约90%、约92%、约94%、约96%或约98%。纯度范围的上端为约92%、约94%、约96%、
约98%或约100%的纯度。
[0090] 通过任何本领域公认的分析方法(例如,经银染的凝胶上的条带强度、聚丙烯酰胺凝胶电泳、HPLC、质谱法或类似方法)来测定纯度。
[0091] 如本文所使用的,“群体的基本上每个成员”描述本发明多肽缀合物群体的特征,其中所选百分比的添加至多肽的经修饰的糖被添加至该多肽上多个相同的接纳体位点。
“群体的基本上每个成员”是说在与经修饰的糖相缀合的多肽上的位点的“同质性”,并且是
指至少约80%、优选至少约90%和更优选至少约95%同质的本发明缀合物。
[0092] “同质性”是指在与经修饰的糖相缀合的接纳体部分群体中的结构一致性。因此,在这样的本发明多肽缀合物(其中每个经修饰的糖部分缀合至这样的接纳体位点,所述接
纳体位点具有和与每个其他经修饰的糖相缀合的接纳体位点相同的结构)中,所述多肽缀
合物被称为约100%同质的。同质性通常表示为范围。多肽缀合物的同质性范围的下端为
约50%、约60%、约70%或约80%,而纯度范围的上端为约70%、约80%、约90%或大于约
90%。
[0093] 当多肽缀合物大于或等于约90%同质时,它们的同质性也优选表示为范围。同质性范围的下端为约90%、约92%、约94%、约96%或约98%。纯度范围的上端为约92%、约
94%、约96%、约98%或约100%的同质性。通常,通过一种或多种本领域技术人员已知的
方法,例如液相色谱法-质谱法(LC-MS)、基质辅助激光解吸飞行时间质谱法(MALDITOF)、
毛细管电泳等,来测定多肽缀合物的纯度。
[0094] 当涉及糖肽种类时,“基本上均一的糖形”或“基本上均一的糖基化模式”是指被目的糖基转移酶(例如,GalNAc转移酶)糖基化的接纳体部分的百分比。例如,在α1,2岩
藻糖基转移酶的情况下,如果在本发明的肽缀合物中基本上所有的(如下文定义)Galβ1,
4-GlcNAc-R及其唾液酸化的类似物均被岩藻糖基化,那么存在基本上均一的岩藻糖基化模
式。本领域技术人员将会理解,起始材料可以含有糖基化的接纳体部分(例如,岩藻糖基化
的Galβ1,4-GlcNAc-R部分)。因此,计算出的糖基化百分比将包括通过本发明的方法糖基
化的接纳体部分,以及在起始材料中已经被糖基化的那些接纳体部分。
[0095] 在“基本上均一的”上述定义中的术语“基本上”一般是指对于特定糖基转移酶而言,至少约40%、至少约70%、至少约80%、或更优选至少约90%、和更加优选至少约95%
的接纳体部分被糖基化。
[0096] 当取代基由其从左至右书写的常规化学式来指定时,它们同等地包括由将该结构从右到左书写而产生的化学上相同的取代基,例如,-CH2O-意在也叙述了-OCH2-。
[0097] 除非另有说明,术语“烷基”自身或作为另一取代基的一部分,是指具有指定碳原子数(即,C1-C10是指1至10个碳)的直链或支链的或环状的(即环烷基)烃基或者其组
合,其可以是完全饱和的、单或多不饱和的并且可以包括二价(例如,亚烷基)和多价基团。
饱和烃基的实例包括但不限于诸如下列的基团:甲基,乙基,正丙基,异丙基,正丁基,叔丁
基,异丁基,仲丁基,环己基,(环己基)甲基,环丙基甲基,例如正戊基、正己基、正庚基、正
辛基的同系物和异构体,等等。不饱和烷基是具有一个或多个双键或三键的烷基。不饱和
烷基的实例包括但不限于,乙烯基、2-丙烯基、2-丁烯基、2-异戊烯基、2-(丁二烯基)、2,
4-戊二烯基、3-(1,4-戊二烯基)、乙炔基、1-和3-丙炔基、3-丁炔基以及高级同系物和异
构体。除非另有说明,术语“烷基”还意味着包括下面更详细定义的那些烷基衍生物,例如
“杂烷基”。局限于碳氢化合物基团的烷基被称作“同烷基(homoalkyl)”。
[0098] 术语“亚烷基”自身或作为另一取代基的一部分,是指衍生自烷烃的二价基团,例如但不限于-CH2CH2CH2CH2-,并且进一步包括下面描述为“杂亚烷基”的那些基团。通常,烷
基(或亚烷基)将具有1至24个碳原子,在本发明中优选的是具有10个或更少碳原子的
那些基团。“低级烷基”或“低级亚烷基”是较短链的烷基或亚烷基,其通常具有8个或更少
碳原子。
[0099] 术语“烷氧基”、“烷基氨基”和“烷硫基”(或硫代烷氧基)以它们的常规含义使用,并且是指各自通过氧原子、氨基或硫原子附着至该分子的其余部分的那些烷基。
[0100] 除非另有说明,术语“杂烷基”自身或与另一术语相组合地指稳定的直链或支链的或者环状的烃基或其组合,其由指定数目的碳原子和至少一个选自O、N、Si和S的
杂原子组成,并且其中氮和硫原子可以任选地被氧化以及氮杂原子可以任选地被季铵
化。可以将杂原子O、N和S及Si置于所述杂烷基的任何内部位置处或者置于该烷基
附着至该分子的其余部分的位置处。实例包括但不限于,-CH2-CH2-O-CH3、-CH2-CH2-NH-C
H3、-CH2-CH2-N(CH3)-CH3、-CH2-S-CH2-CH3、-CH2-CH2-S(O)-CH3、-CH2-CH2-S(O)2-CH3、-CH =CH-O-CH3、-Si(CH3)3、-CH2-CH=N-OCH3和-CH=CH-N(CH3)-CH3。至多两个杂原子可以是
连续的,例如-CH2-NH-OCH3和-CH2-O-Si(CH3)3。类似地,术语“杂亚烷基”自身或作为另一
取代基的一部分,是指衍生自杂烷基的二价基团,例如但不限于-CH2-CH2-S-CH2-CH2-和-CH
2-S-CH2-CH2-NH-CH2-。对于杂亚烷基,杂原子也可以占据链末端之一或两端(例如,亚烷基
氧基、亚烷基二氧基、亚烷基氨基、亚烷基二氨基,等等)。另外,对于亚烷基和杂亚烷基连
接基团,连接基团式的书写方向并不意味着连接基团的取向。例如,式-CO2R’-表示-C(O)
OR’-和-OC(O)R’-两者。
[0101] 除非另有说明,术语“环烷基”和“杂环烷基”自身或与其他术语相组合地分别表示“烷基”和“杂烷基”的环状形式。另外,对于杂环烷基,杂原子可以占据该杂环附着至该分
子的其余部分的位置。环烷基的实例包括但不限于环戊基、环己基、1-环己烯基、3-环己烯
基、环庚基等。杂环烷基的实例包括但不限于1-(1,2,5,6-四氢吡啶基)、1-哌啶基、2-哌
啶基、3-哌啶基、4-吗啉基、3-吗啉基、四氢呋喃-2-基、四氢呋喃-3-基、四氢噻吩-2-基、
四氢噻吩-3-基、1-哌嗪基、2-哌嗪基等。
[0102] 除非另有说明,术语“卤代”或“卤素”自身或作为另一取代基的一部分,是指氟、氯、溴或碘原子。另外,诸如“卤代烷基”的术语意味着包括单卤代烷基和多卤代烷基。例
如,术语“卤代(C1-C4)烷基”意味着包括但不限于,三氟甲基、2,2,2-三氟乙基、4-氯丁基、
3-溴丙基等。
[0103] 除非另有说明,术语“芳基”是指多不饱和的芳香族取代基,其可以是单环或者稠合在一起或共价连接的多个环(优选1-3个环)。术语“杂芳基”是指包含1-4个选自N、
O、S、Si和B的杂原子的芳基(或环),其中氮和硫原子任选地被氧化以及氮原子任选地被
季铵化。杂芳基可以通过杂原子附着至该分子的其余部分。芳基和杂芳基的非限制性实例
包括苯基、1-萘基、2-萘基、4-联苯基、1-吡咯基、2-吡咯基、3-吡咯基、3-吡唑基、2-咪唑
基、4-咪唑基、吡嗪基、2-噁唑基、4-噁唑基、2-苯基-4-噁唑基、5-噁唑基、3-异噁唑基、
4-异噁唑基、5-异噁唑基、2-噻唑基、4-噻唑基、5-噻唑基、2-呋喃基、3-呋喃基、2-噻吩
基、3-噻吩基、2-吡啶基、3-吡啶基、4-吡啶基、2-嘧啶基、4-嘧啶基、5-苯并噻唑基、嘌呤
基、2-苯并咪唑基、5-吲哚基、1-异喹啉基、5-异喹啉基、2-喹喔啉基、5-喹喔啉基、3-喹啉
基和6-喹啉基。上述各芳基和杂芳基环体系的取代基选自下述可接受的取代基。
[0104] 简言之,术语“芳基”,当与其他术语组合使用时(例如芳氧基、芳硫氧基(arylthioxy)、芳基烷基),包括如上定义的芳基和杂芳基环两者。因此,术语“芳基烷基”
意味着包括其中芳基附着至烷基的那些基团(例如苄基、苯乙基、吡啶基甲基等),包括其
中碳原子(例如亚甲基)被例如氧原子代替的那些烷基(例如苯氧基甲基、2-吡啶氧基甲
基、3-(1-萘氧基)丙基等)。
[0105] 上述术语(例如“烷基”、“杂烷基”、“芳基”和“杂芳基”)各自意味着包括所述基团的取代的和未取代的形式两者。下面提供了每种类型的基团的优选取代基。
[0106] 烷基和杂烷基(包括通常被称为亚烷基、链烯基、亚杂烷基、杂链烯基、炔基、环烷基、杂环烷基、环烯基和杂环烯基的那些基团)的取代基通称为“烷基取代基”,而且它们
可以是选自但不限于以下的多种基团中的一个或多个:取代或未取代的芳基、取代或未取
代的杂芳基、取代或未取代的杂环烷基、-OR’、=O、=NR’、=N-OR’、-NR’R”、-SR’、-卤素、-SiR’R”R”’、-OC(O)R’、-C(O)R’、-CO2R’、-CONR’R”、-OC(O)NR’R”、-NR”C(O)R’、-NR’-C(O)NR”R”’、-NR”C(O)2R’、-NR-C(NR’R”R”’) = NR””、-NR-C(NR’R”) =NR”’、-S(O)R’、-S(O)2R’、-S(O)2NR’R”、-NRSO2R’、-CN和-NO2,数目从0至(2m’+1),其中m’为此类基团中碳原子的总数。R’、R”、R”’和R””各自优选独立地指氢、取代或未取代的杂烷基、取代或未取代的芳基(例如被1-3个卤素取代的芳基)、取代或未取代的烷基、烷
氧基或硫代烷氧基、或者芳基烷基。例如当本发明的化合物包含超过一个R基团时,独立
地选择各个R基团,当存在超过一个R’、R”、R”’和R””基团时,这些基团也一样选择。当
R’和R”附着至同一个氮原子时,它们可以与该氮原子相组合以形成5-、6-或7-元环。例
如,-NR’R”意味着包括但不限于1-吡咯烷基和4-吗啉基。从取代基的上述论述中,本领
域技术人员将会理解,术语“烷基”意味着包括这样的基团,所述基团含有与除氢基团之外
的其他基团例如卤代烷基(例如-CF3和-CH2CF3)和酰基(例如-C(O)CH3、-C(O)CF3、-C(O)
CH2OCH3等)结合的碳原子。
[0107] 类似于对于烷基所描述的取代基,将芳基和杂芳基的取代基通称为“芳基取代基”。所述取代基选自例如:取代或未取代的烷基、取代或未取代的杂烷基、取代或未
取代的芳基、取代或未取代的杂芳基、取代或未取代的杂环烷基、-OR’、=O、=NR’、=
N-OR’、-NR’R”、-SR’、-卤素、-SiR’R”R”’、-OC(O)R’、-C(O)R’、-CO2R’、-CONR’R”、-OC(O)NR’R”、-NR”C(O)R’、-NR’-C(O)NR”R”’、-NR”C(O)2R’、-NR-C(NR’R”R”’) =
NR””、-NR-C(NR’R”) = NR”’、-S(O)R’、-S(O)2R’、-S(O)2NR’R”、-NRSO2R’、-CN
和-NO2、-R’、-N3、-CH(Ph)2、氟代(C1-C4)烷氧基和氟代(C1-C4)烷基,数目从0至该芳环体
系上开放价的总数;并且其中R’、R”、R”’和R””优选独立地选自氢、取代或未取代的烷基、取代或未取代的杂烷基、取代或未取代的芳基和取代或未取代的杂芳基。例如当本发明的
化合物包含超过一个R基团时,独立地选择各个R基团,当存在超过一个R’、R”、R”’和R””
基团时,这些基团也一样选择。
[0108] 在芳基或杂芳基环的相邻原子上的取代基中的两个可以任选地被式-T-C(O)-(CRR’)q-U-的取代基代替,其中T和U独立地是-NR-、-O-、-CRR’-或单键,
以及q是0-3的整数。备选地,在芳基或杂芳基环的相邻原子上的取代基中的两个可以任
选地被式-A-(CH2)r-B-的取代基代替,其中A和B独立地是-CRR’-、-O-、-NR-、-S-、-S(O)-
、-S(O)2-、-S(O)2NR’-或单键,以及r是1-4的整数。如此形成的新环的单键之一可以任选
地被双键代替。备选地,在芳基或杂芳基环的相邻原子上的取代基中的两个可以任选地被
式-(CRR’)s-X-(CR”R”’)d-的取代基代替,其中s和d独立地是0-3的整数,以及X是-O-
、-NR’-、-S-、-S(O)-、-S(O)2-或-S(O)2NR’-。取代基R、R’、R”和R”’优选独立地选自氢或者取代或未取代的(C1-C6)烷基。
[0109] 如本文所使用的,术语“酰基”描述了含有羰基残基的取代基,C(O)R。R的示例性种类包括H、卤素、烷氧基、取代或未取代的烷基、取代或未取代的芳基、取代或未取代的杂
芳基和取代或未取代的杂环烷基。
[0110] 如本文所使用的,术语“稠合的环体系”是指至少两个环,其中每个环与另一个环共有至少两个原子。稠合的环体系可以包括芳族以及非芳族环。“稠合的环体系”的实例是
萘类、吲哚类、喹啉类、色烯类等等。
[0111] 如本文所使用的,术语“杂原子”包括氧(O)、氮(N)、硫(S)、硅(Si)和硼(B)。
[0112] 符号“R”是一般性缩写,其代表取代基。示例性的取代基包括取代或未取代的烷基、取代或未取代的杂烷基、取代或未取代的芳基、取代或未取代的杂芳基和取代或未取代
的杂环烷基。
[0113] 术语“可药用盐”包括活性化合物的盐,取决于在本文所述的化合物上发现的特定取代基,所述盐用相对无毒性的酸或碱来制备。当本发明的化合物含有相对酸性的官能度
时,可以通过使此类化合物的中性形式与足够量的所希望的碱(纯粹的或在合适的惰性溶
剂中)接触来获得碱加成盐。可药用碱加成盐的实例包括钠、钾、钙、铵、有机氨基或镁盐,
或者类似的盐。当本发明的化合物含有相对碱性的官能度时,可以通过使此类化合物的中
性形式与足够量的所希望的酸(纯粹的或在合适的惰性溶剂中)接触来获得酸加成盐。可
药用酸加成盐的实例包括源自无机酸如盐酸、氢溴酸、硝酸、碳酸、碳酸氢根、磷酸、磷酸一
氢根、磷酸二氢根、硫酸、硫酸氢根、氢碘酸或者亚磷酸等等的那些盐,以及源自相对无毒的
有机酸如乙酸、丙酸、异丁酸、马来酸、丙二酸、苯甲酸、琥珀酸、辛二酸、富马酸、乳酸、扁桃酸、邻苯二甲酸、苯磺酸、对甲苯磺酸、柠檬酸、酒石酸、甲磺酸等等的盐。还包括氨基酸例如
精氨酸等的盐,和有机酸如葡糖醛酸或半乳糖醛酸等的盐(参见例如,Berge等人,Journal
ofPharmaceutical Science,66:1-19(1977))。本发明的某些具体化合物同时含有允许所
述化合物转化成碱或酸加成盐的碱性和酸性官能度
[0114] 所述化合物的中性形式优选通过使该盐与碱或酸接触并且以常规方式分离亲本化合物来再生。所述化合物的亲本形式在某些物理性质,例如在极性溶剂中的溶解度方面
与所述各种盐形式不同,但是对于本发明的目的,所述盐等同于所述化合物的亲本形式。
[0115] 除了盐形式之外,本发明还提供了前体药物形式的化合物。本文所述的化合物的前体药物是在生理条件下容易经历化学改变以提供本发明化合物的那些化合物。此外,可
以在离体环境中通过化学或生物化学方法将前体药物转化为本发明的化合物。例如,当被
置于具有合适的酶或化学试剂的透皮贴剂贮库中时,前体药物可以缓慢地转化为本发明的
化合物。
[0116] 本发明的某些化合物可以以非溶剂化形式以及溶剂化形式(包括水合形式)存在。通常,溶剂化形式等同于非溶剂化形式,并且被包括在本发明的范围内。本发明的某些
化合物可以以多晶或无定形形式存在。通常,所有物理形式对于本发明所考虑的用途而言
是等同的,并且旨在在本发明的范围内。
[0117] 本发明的某些化合物具有不对称碳原子(光学中心)或双键;外消旋物、非对映异构体、几何异构体和独个异构体被包括在本发明的范围内。
[0118] 可以将本发明的化合物制备为单一的异构体(例如,对映异构体、顺反异构体、位置异构体、非对映异构体)或制备为异构体的混合物。在优选的实施方案中,将所述化合物
制备为基本上单一的异构体。用于制备基本上异构体纯的化合物的方法是本领域已知的。
例如,可以通过下列方式来制备对映异构体富集的混合物和纯的对映异构体化合物:使用
对映异构体纯的合成中间体,并结合使得在手性中心的立体化学保持不变或者导致其完全
转化的反应。备选地,可以将沿着合成途径的终产物或中间体拆分为单一的立体异构体。用
于转化特定的手性中心或者使其保持不变的技术以及用于拆分立体异构体混合物的技术
是本领域公知的,并且完全在本领域技术人员就具体情况而选择合适方法的能力之内。一
TH
般地,可参见,Furniss等人(eds.),VOGEL’S ENCYCLOPEDIA OF PRACTICAL ORGANIC CHEMISTRY 5 ED.,Longman Scientific and Technical Ltd.,Essex,1991,pp.809-816;和Heller,Acc.Chem.Res.23:
128(1990)。
[0119] 本文所使用的外消旋的、ambiscalemic和scalemic或对映异构体纯的化合物的图形显示来自Maehr,J.Chem.Ed.,62:114-120(1985):实心且间断的楔形用于表示手性元
素的绝对构型;波浪线表示否定了它所代表的键可以产生的任何立体化学暗示;实心且间
断的粗线是几何描述符,其指出所显示的相对构型但是不暗示任何绝对立体化学;以及楔
形轮廓和点线或虚线表示具有不确定的绝对构型的对映异构体纯的化合物。
[0120] 术语“对映异构体过量”和“非对映异构体过量”在本文中可互换使用。具有单个立体中心的化合物被称作以“对映异构体过量”存在,具有至少两个立体中心的化合物被称
作以“非对映异构体过量”存在。
[0121] 本发明的化合物还可以在构成此类化合物的一个或多个原子处含有非天然比3 125
例的原子同位素。例如,所述化合物可以用放射性同位素例如氚(H)、碘-125( I)或
14
碳-14( C)来进行放射性标记。本发明化合物的所有同位素变化形式(不论是否为放射性
的)意在被包括在本发明的范围内。
[0122] 如本文所使用的,“反应性官能团”是指这样的基团,所述基团包括但不限于,烯烃、炔、醇、酚、醚、氧化物、卤化物、醛、酮、羧酸、酯、酰胺、氰酸盐、异氰酸盐、硫氰酸盐、异硫氰酸盐、胺、肼、腙、酰肼、重氮基、重氮化物(diazonium)、硝基、腈、硫醇、硫化物、二硫化物、亚砜、砜、磺酸、亚磺酸、缩醛、缩酮、酐、硫酸盐、次磺酸、异腈、脒、酰亚胺、亚胺酸盐、硝酮、羟胺、肟、异羟肟酸、硫代异羟肟酸、丙二烯类、原酸酯、亚硫酸盐、烯胺、炔胺、脲、假脲、氨基脲、碳二亚胺、氨基甲酸酯、亚胺、叠氮化物、偶氮化合物、氧化偶氮化合物和亚硝基化合
物。反应性官能团还包括用于制备生物缀合物的那些,例如N-羟基琥珀酰亚胺酯、马来酰
亚胺类等等。用于制备每一种这些官能团的方法是本领域公知的,并且它们对于具体目的
的应用或修饰在本领域技术人员的能力范围之内(参见例如,Sandler和Karo,eds.ORGANIC
FUNCTIONAL GROUPPREPARATIONS,Academic Press,San Diego,1989)。
[0123] “非共价蛋白质结合基团”是以联合方式与完整的或变性的多肽相互作用的部分。该相互作用在生物环境中可以是可逆的或不可逆的。向本发明的螯合剂或络合物中掺入
“非共价蛋白质结合基团”给该试剂或络合物提供了非共价方式与多肽相互作用的能力。示
例性的非共价相互作用包括疏水-疏水和静电相互作用。示例性的“非共价蛋白质结合基
团”包括阴离子基团,例如,磷酸盐、硫代磷酸盐、膦酸盐、羧酸盐、硼酸盐、硫酸盐、砜、磺酸盐、硫代硫酸盐和硫代磺酸盐。
[0124] “糖基转移酶截短”或“截短的糖基转移酶”或者语法变化形式,以及“结构域缺失的糖基转移酶”或者语法变化形式,是指这样的糖基转移酶,其具有比天然存在的糖基转移
酶更少的氨基酸残基,但是保留了某种酶促活性。截短的糖基转移酶包括例如,截短的GnT1
酶,截短的GalT1酶,截短的ST3GalIII酶,截短的GalNAc-T2酶,截短的Core-1-GalT1酶,
约32至约90个氨基酸残基(参见例如,人的酶);截短的ST3Gal1酶,截短的ST6GalNAc-1
酶和截短的GalNAc-T2酶。可以删除任何数目的氨基酸残基,只要该酶保留活性。在一些
实施方案中,可以删除结构域或结构域的一部分,例如,可以删除信号-锚结构域,而留下
包含干区(stem region)和催化结构域的截短;可以删除信号-锚结构域和干区的一部分,
而留下包含剩余的干区和催化结构域的截短;或者可以删除信号-锚结构域和干区,而留
下包含催化结构域的截短。糖基转移酶截短也可以发生在该蛋白质的C-末端。例如,一些
GalNAcT酶,如GalNAc-T2,具有C-末端凝集素结构域,其可以被删除而不减少酶促活性。
[0125] “重折叠表达系统”是指具有氧化性细胞内环境的细菌或其他微生物,当在该微生物中表达含有二硫键的蛋白质时,所述微生物能够以它们的正确/活性形式重折叠所述
TM
蛋白质。实例包括基于大肠杆菌(E.coli)(例如,Origami (经修饰的大肠杆菌trxB-/
TM
gor-)、Origami2 等等)、假单胞菌(Pseudomonas)(例如,荧光假单胞菌(Pseudomonas
TM
fluorescens))的系统。关于Origami 技术的示例性参考文献,参见例如,Lobel等人
(2001)Endocrine 14(2),205-212;和Lobel等人(2002)Protein Express.Purif.25(1),
124-133。III.引言
[0126] 本发明提供了序列肽段多肽,其包含至少一个外源O-联或S-联糖基化序列。每个序列肽段多肽对应于亲本多肽。在一个实施方案中,亲本多肽不包含O-联或S-联糖基化
序列。在另一个实施方案中,亲本多肽(例如,野生型多肽)天然地包含O-联或S-联糖基
化序列。对应于此类亲本多肽的序列肽段多肽在不同的位置处包含额外的O-联或S-联糖
基化序列。在一个实施方案中,每个糖基化序列是酶(例如,糖基转移酶,如GalNAc-T2)的
底物。该酶催化糖基部分从糖基供体分子转移至氨基酸侧链的氧或硫原子,所述氨基酸侧
链被羟基取代(例如,丝氨酸或苏氨酸)或被巯基取代(例如,半胱氨酸)。所述氨基酸是
O-联或S-联糖基化序列的一部分。可以缀合至糖基化序列的示例性糖基部分包括GalNAc、
半乳糖、甘露糖、GlcNAc、葡萄糖、岩藻糖或木糖部分。
[0127] 本发明还提供了多肽缀合物,其中经修饰的糖部分直接(例如,通过糖PEG化反应)或间接(例如,通过间插性糖基残基)附着至多肽内的O-联或S-联糖基化序列。该
多肽可以为任何多肽,包括野生型多肽和经批准的生物药物(其氨基酸序列或核苷酸序列
是已知的)。在一个实施方案中,亲本多肽是治疗性多肽,例如人生长激素(hGH)、促红细胞
生成素(EPO)、治疗性抗体、骨形态发生蛋白(例如,BMP-7)或血液因子(例如,因子VI、因
子VIII或FIX)。因此,本发明提供了治疗性多肽变体,其在它们的氨基酸序列内包含一个
或多个外源O-联或S-联糖基化序列。本发明还提供了此类多肽的糖缀合物。
[0128] 还提供了产生此类多肽缀合物的方法。本发明的糖基化和糖PEG化方法可以在掺入了O-联或S-联糖基化序列的任何多肽上实施。所述方法特别可用于产生序列肽段多肽
的多肽缀合物,所述序列肽段多肽由于包含了外源糖基化序列而与对应的亲本多肽不同。
[0129] 本发明的方法提供了具有延长的治疗半寿期的多肽缀合物,所述延长的治疗半寿期是由于例如降低的清除速率或者降低的被免疫或网状内皮系统(RES)摄取的速率而引
起的。此外,本发明的方法提供了用于掩蔽多肽上的抗原决定簇从而减小或消除针对该多
肽的宿主免疫应答的方法。使用合适的经修饰的糖将靶向性试剂选择性地附着至多肽可以
用于将多肽靶向特定组织或细胞表面受体(其对于特定的靶向性试剂是特异的)。还提供
了显示出增强的对于蛋白水解降解的抗性的蛋白质,这是通过改变该蛋白质上被蛋白水解
酶切割或识别的某些位点而实现的结果。在一个实施方案中,此类位点被本发明的O-联或
S-联糖基化序列替代或部分替代。
[0130] 另外,本发明的方法可以用于调节亲本多肽的“生物学活性谱”。发明人已经认识到,使用本发明的方法将修饰基团例如水溶性聚合物(例如,mPEG)共价附着至亲本多
肽可以不仅改变所得多肽种类的生物利用率、药效动力学性质、免疫原性、代谢稳定性、生
物分布和水溶性,而且可以导致不希望的治疗活性降低或者导致所希望的治疗活性增强。
例如,前者以在造血剂促红细胞生成素(EPO)上观察到。例如,某些化学PEG化的EPO变
体显示出降低的促红细胞生成活性,而同时保持了野生型多肽的组织保护性活性。此类
结果描述于例如美国专利6,531,121;WO2004/096148,WO2006/014466,WO2006/014349,
WO2005/025606和WO2002/053580中。可用于评估所选多肽的差别生物学活性的示例性细
胞系概述于下面的表1中:表1:用于各种多肽的生物学评估的细胞系
多肽 细胞系 生物学活性
EPO UT7 红细胞生成
SYSY 神经保护作用
BMP-7 MG-63 骨诱导
HK-2 肾毒性
NT-3 Neuro2 神经保护作用(结合TrkC)
NIH3T3 神经保护作用(结合p75)
[0131] 在一个实施方案中,本发明的多肽缀合物显示出降低或增强的对于生物学靶蛋白(例如,受体)、天然配体或非天然配体例如抑制剂的结合亲和力。例如,消除对一类特定
受体的结合亲和力可以减少或消除相关的细胞信号传导和下游生物学事件(例如,免疫应
答)。因此,本发明的方法可以用于产生多肽缀合物,其具有与所述缀合物所对应的亲本
多肽相同、相似或不同的治疗谱。本发明的方法可以用于鉴定具有特定的(例如改进的)
生物学功能的经糖PEG化的治疗剂以及“细调”任何治疗性多肽或其他生物学活性多肽
TM
的治疗谱。GlycoPEGylation 是Neose Technologies的商标,并且是指在普遍所拥有的
专利和专利申请例如(WO2007/053731;WO2007/022512;WO2006/127896;WO2005/055946;
WO2006/121569和WO2005/070138)中公开的技术。IV.组合物多肽
[0132] 在第一方面,本发明提供了序列肽段多肽。序列肽段多肽具有包含至少一个本发明的外源O-联或S-联糖基化序列的氨基酸序列。在一个实施方案中,序列肽段多肽的氨
基酸序列包含外源O-联糖基化序列,其是一种或多种野生型的、突变的或截短的糖基转移
酶的底物。优选的糖基转移酶包括GalNAc转移酶,例如全长或截短的GalNAc-T2(例如,人
**
GalNAc-T2)。示例性的GalNAc-T2酶显示在表13中(SEQ ID NOs: )。
[0133] 在示例性的实施方案中,采用重组技术通过改变对应的亲本多肽(例如,野生型多肽)的氨基酸序列来产生本发明的序列肽段多肽。制备重组多肽的方法是本领域技术人
员已知的。示例性的方法在下文中描述。序列肽段多肽的氨基酸序列可以含有天然存在的
和外源的(即非天然存在的)O-联糖基化序列的组合。
[0134] 亲本多肽可以是任何多肽。示例性的亲本多肽包括野生型多肽及其片段以及从它们的天然存在的对应物进行修饰(例如,通过事先的突变或截短)而得的多肽。亲本多肽
也可以是融合蛋白。在另一个实施方案中,亲本多肽是治疗性多肽(即,经批准的药物),例
如目前用作药物试剂的那些。亲本多肽的非限制性选择显示在于2006年6月8日提交的
美国专利申请10/552,896(其通过提及而合并入本文)的图28中。
[0135] 示例性的亲本多肽包括生长因子,例如成纤维细胞生长因子(例如,FGF-1、FGF-2、FGF-3、FGF-4、FGF-5、FGF-6、FGF-7、FGF-8、FGF-9、FGF-10、FGF-11、FGF-12、FGF-13、FGF-14、FGF-15、FGF-16、FGF-17、FGF-18、FGF-19、FGF-20、FGF-21、FGF-22和FGF-23)、凝
血因子(例如,因子V、因子VII、因子VIII、B-结构域缺失的因子VIII、因子IX、因子X和
因子XIII)、激素(例如,人生长激素(hGH)和促卵泡激素(FSH))以及细胞因子(例如,白
细胞介素(例如,IL-1、IL-2、IL-12)和干扰素(例如,INF-α、INF-β、INF-γ))。
[0136] 其他示例性的亲本多肽包括酶,例如葡糖脑苷脂酶、α-半乳糖苷酶(例如,TM
Fabrazyme )、酸性-α-葡糖苷酶(酸性麦芽糖酶)、α-L-艾杜糖苷酸酶(例如,
TM
Aldurazyme )、甲状腺过氧化物酶(TPO)、β-葡糖苷酶(参见例如,在美国专利申请号
10/411,044中描述的酶)和α-半乳糖苷酶A(参见例如,在美国专利号7,125,843中描述
的酶)。
[0137] 其他示例性的亲本多肽包括骨形态发生蛋白(例如,BMP-1、BMP-2、BMP-3、BMP-4、BMP-5、BMP-6、BMP-7、BMP-8、BMP-9、BMP-10、BMP-11、BMP-12、BMP-13、BMP-14、BMP-15)、
神经营养蛋白(例如,NT-3、NT-4、NT-5)、促红细胞生成素(EPO)、生长分化因子(例如,
GDF-5)、神经胶质细胞系衍生神经营养因子(GDNF)、脑衍生神经营养因子(BDNF)、神经生
长因子(NGF)、冯维勒布兰德因子(vWF)蛋白酶、粒细胞集落刺激因子(G-CSF)、粒细胞-巨
噬细胞集落刺激因子(GM-CSF)、α1-抗胰蛋白酶(ATT或α-1蛋白酶抑制剂)、组织型血
纤维蛋白溶酶原活化因子(TPA)、蛭素、瘦蛋白、尿激酶、人DNA酶、胰岛素、乙型肝炎表面蛋
白(HbsAg)、人绒毛膜促性腺激素(hCG)、嵌合的白喉毒素-IL-2、胰高血糖素样肽(例如,
GLP-1和GLP-2)、抗凝血酶III(AT-III)、prokinetisin、CD4、α-CD20、肿瘤坏死因子受体
(TNF-R)、P-选择蛋白糖蛋白配体-1(PSGL-1)、补体、转铁蛋白、依赖于糖基化的细胞粘着
分子(GlyCAM)、神经细胞粘着分子(N-CAM)、TNF受体-IgG Fc区融合蛋白和伸展蛋白-4。
[0138] 也在本发明范围内的是为抗体的亲本多肽。术语“抗体”意在包括抗体片段(例如,Fc结构域)、单链抗体、Lama抗体、纳米抗体(nano-bodies)等等。该术语还包括抗体
融合蛋白,例如Ig嵌合体。优选的抗体包括人源化的单克隆抗体或其片段。此类抗体的
所有已知的同种型在本发明范围内。示例性的抗体包括针对生长因子,例如内皮生长因子
TM
(EGF)、血管内皮生长因子(例如,针对VEGF-A的单克隆抗体,如雷珠单抗(Lucentis ))
和成纤维细胞生长因子(例如,FGF-7、FGF-21和FGF-23)的抗体,以及针对它们各自
受体的抗体。其他示例性的抗体包括抗TNF-α单克隆抗体(参见例如,美国专利申请
TM
号10/411,043),TNF受体-IgG Fc区融合蛋(例如,Enbrel ),抗HER2单克隆抗体(例
TM TM
如,Herceptin ),针对呼吸道合胞病毒的蛋白F的单克隆抗体(例如,Synagis ),针对
TM
TNF-α的单克隆抗体(例如,Remicade ),针对糖蛋白例如IIb/IIIa的单克隆抗体(例如,
TM TM
Reopro ),针对CD20(例如,Rituxan )、CD4和α-CD3的单克隆抗体,针对PSGL-1和CEA
的单克隆抗体。任一上面所列多肽的任何经修饰的(例如,事先经突变的)形式也在本发
明的范围内。
[0139] 在一个示例性实施方案中,所述亲本多肽不是G-CSF。在另一个示例性实施方案中,所述亲本多肽不是hGH。在另外一个示例性实施方案中,所述亲本多肽不是INF-α。在
进一步的示例性实施方案中,所述亲本多肽不是FGF。在另一个示例性实施方案中,所述亲
本多肽不是野生型G-CSF。在另一个示例性实施方案中,所述亲本多肽不是野生型hGH。在
另外一个示例性实施方案中,所述亲本多肽不是野生型INF-α。在进一步的示例性实施方
案中,所述亲本多肽不是野生型FGF多肽。糖基化序列
[0140] 本发明的糖基化序列包括O-联糖基化序列和S-联糖基化序列。O-联糖基化序列的下面的讨论是示例性的,而并不意在限制本发明的范围。
[0141] 在一个实施方案中,本发明的O-联糖基化序列天然存在于野生型多肽中。此类野生型多肽的多肽缀合物在本发明的范围内。在另一个实施方案中,O-联糖基化序列不存
在于亲本多肽中或不存在于亲本多肽中的相同位置处(外源O-联糖基化序列)。将外源
O-联糖基化序列引入亲本多肽中产生了本发明的序列肽段多肽。O-联糖基化序列可以通
过突变而引入亲本多肽中。在另一个实例中,通过化学合成序列肽段多肽来将O-联糖基化
序列引入亲本多肽的氨基酸序列中。
[0142] 本发明的O-联糖基化序列可以是任意的短氨基酸序列。在一个实施方案中,O-联糖基化序列包含约2至约20个,优选约2至约10个,更优选约3至约9个和最优选约3至
约6个氨基酸残基。本发明的O-联糖基化序列包含至少一个具有含羟基的侧链的氨基酸
(例如,丝氨酸或苏氨酸)。在一个实施方案中,当序列肽段多肽经历酶促糖基化反应时,该
羟基变成糖基化位点。在该糖基化反应过程中,羟基的氢原子被糖基部分替代。因此,具有
在糖基化反应过程中被糖基部分修饰的羟基的氨基酸被称作“糖基化的位点”或者“糖基化
位点”。O-联糖基化序列的定位
[0143] 在一个实施方案中,当作为多肽(例如,本发明的序列肽段多肽)的一部分时,O-联或S-联糖基化序列是糖基转移酶的底物。在一个实例中,糖基化序列是GalNAc转移
酶的底物(例如,人GalNAc-T2)。在另一个实例中,糖基化序列是经修饰的酶的底物,所述
经修饰的酶例如为凝集素结构域缺失的GalNAc转移酶(例如,人GalNAc-T2)或凝集素结
构域截短的GalNAc转移酶(例如,GalNAc-T2)。在合适的糖基化反应期间每个本发明的
O-联糖基化序列被糖基化的效率可以取决于酶的类型和性质,也可以取决于糖基化序列的
背景,尤其是糖基化位点周围的多肽的三维结构。
[0144] 一般地,可以在多肽的氨基酸序列内的任何位置处引入O-联糖基化序列。在一个实例中,在亲本多肽的N-末端(即,第一个氨基酸之前或者紧接第一个氨基酸之后)引入
糖基化序列(氨基末端突变体)。在另一个实例中,在亲本多肽的氨基末端附近(例如,在
N-末端的10个氨基酸残基内)引入糖基化序列。在另一个实例中,糖基化序列位于亲本多
肽的C-末端紧接亲本多肽最后一个氨基酸之后(羧基末端突变体)。在另外一个实例中,
在亲本多肽的C-末端附近(例如,在C-末端的10个氨基酸残基内)引入糖基化序列。在
另外一个实例中,O-联糖基化序列位于亲本多肽的N-末端和C-末端之间的任何位置(内
部突变体)。一般优选的是,经修饰的多肽是生物学上有活性的,即使生物活性从对应的亲
本多肽的生物活性发生了改变。
[0145] 影响序列肽段多肽的糖基化效率的一个重要因素是糖基化位点(例如,苏氨酸侧链)对于糖基转移酶(例如,GalNAc转移酶)和其他反应参与物(包括溶剂分子)的可接
近性。如果糖基化序列位于多肽的内部结构域内,那么糖基化将可能是无效率的。因此,在
一个实施方案中,在多肽的这样的区域中引入糖基化序列,所述区域对应于该多肽的溶剂
暴露表面。示例性的多肽构象是这样的,即其中糖基化序列的羟基不是向内的,与多肽的其
他区域形成氢键。另一示例性的构象是这样的,即其中羟基不可能与邻近的蛋白质形成氢
键。
[0146] 在一个实例中,在亲本蛋白质的预先选择的特定区域内产生糖基化序列。实际上,多肽主链的糖基化常常发生在该多肽的环区域内并且通常不发生在螺旋或β-折叠片结
构内。因此,在一个实施方案中,通过在亲本多肽的对应于环结构域的区域中引入O-联糖
基化序列来产生本发明的序列肽段多肽。
[0147] 例如,蛋白质BMP-7的晶体结构在Ala72和Ala86之间以及在Ile96和Pro103之间含有两个延伸的环区域。产生BMP-7突变体(其中O-联糖基化序列被置于多肽序列的那些
区域内)可以导致这样的多肽,其中所述突变引起该多肽的最初三级结构的很小的破坏或
无破坏(参见例如,实施例1.9)。
[0148] 然而,发明人已经发现,在位于β-折叠片或α-螺旋构象内的氨基酸位置处引入O-联糖基化序列还可以导致在新引入的O-联糖基化序列处被有效糖基化的序列肽段多
肽。在β-折叠片或α-螺旋结构域中引入O-联糖基化序列可以引起多肽的结构改变,这
又使得可以有效糖基化。
[0149] 蛋白质的晶体结构可以用于鉴定野生型或亲本多肽的最适合于引入O-联糖基化序列的那些结构域,并且可以允许预先选择有希望的修饰位点。
[0150] 当晶体结构不可得时,多肽的氨基酸序列可以用于预先选择有希望的修饰位点(例如,预测环结构域对α-螺旋结构域)。然而,即使多肽的三维结构是已知的,结构动力
学和酶/受体相互作用在溶液中也是可变的。因此,合适的突变位点的鉴定以及合适的糖
基化序列的选择可以涉及产生一些序列肽段多肽(例如,本发明的序列肽段多肽文库),以
及使用合适的筛选方案(例如,本文所述的那些方案)就所希望的特征来测试那些变体。
[0151] 在一个实施方案中,亲本多肽是抗体或抗体片段。在一个实例中,用本发明的O-联糖基化序列来修饰抗体或抗体片段的恒定区(例如,CH2结构域)。在一个实例中,以
这样的方式引入O-联糖基化序列,即使得天然存在的N-联糖基化序列被替代或在功能上
受损。在另一个实施方案中,通过CH2结构域的所选区域来进行序列肽段扫描,从而产生抗
体文库,每个抗体包含本发明的外源O-联糖基化序列。在另外一个实施方案中,使所得的
多肽变体经历酶促糖基化反应,从而向所引入的糖基化序列添加糖基部分。可以就它们结
合合适受体(例如,Fc受体,如FcγRIIIa)的能力来分析被充分糖基化的那些变体。在一
个实施方案中,当与亲本抗体或其经天然糖基化的形式相比较时,此类经糖基化的抗体或
抗体片段显示出增加的与Fc受体的结合亲和力。本发明的该方面进一步描述在于2007年
1月18日提交的美国临时专利申请60/881,130(该专利申请的公开内容以其整体合并入
本文)中。所描述的修饰可以改变抗体的效应子功能。在一个实施方案中,经糖基化的抗
体变体显示出降低的效应子功能,例如降低的与存在于天然杀伤细胞表面上或存在于杀伤
T-细胞表面上的受体的结合亲和力。
[0152] 在另一个实施方案中,不将O-联或S-联糖基化序列引入亲本多肽序列之内,而是通过在该亲本多肽的N-或C-末端处添加肽接头片段来延伸亲本多肽的序列,其中所述肽
接头片段包含本发明的O-联或S-联糖基化序列,例如“PTP”。肽接头片段可以具有任何
数目的氨基酸。在一个实施方案中,肽接头片段包含至少约5个、至少约10个、至少约15
个、至少约20个、至少约30个、至少约50个或超过50个氨基酸残基。肽接头片段任选地
包含内部或末端氨基酸残基,其具有反应性官能团,例如氨基(例如,赖氨酸)或巯基(例
如,半胱氨酸)。此类反应性官能团可以用于将该多肽连接至另一部分,例如另一多肽、细胞
毒素、小分子药物或另一个本发明的修饰基团。本发明的该方面进一步描述在于2007年1
月18日提交的美国临时专利申请60/881,130(该专利申请的公开内容以其整体合并入本
文)中。
[0153] 在代表性的实施方案中,本发明提供了这样的多肽,其包含具有下式的C-末端序列,其中整数s是0或1:
[0154] 本领域技术人员将会意识到,上面结构的二聚体和寡聚体可以用于形成其上附着了肽接头片段的多肽的更高级寡聚体。在示例性的实施方案中,肽接头片段包含赖氨酸残
基,其用作该接头的分支点,例如赖氨酸的氨基用作该接头的“臂”的附着点。在示例性的
实施方案中,赖氨酸替代甲硫氨酸部分。
[0155] 在示例性的实施方案中,肽接头片段的至少一个苏氨酸残基可以被糖基化。在另一个实施方案中,肽接头片段的两个、更优选三个和更加优选四个苏氨酸部分被糖基化。
[0156] 在另一个示例性的实施方案中,通过形成二硫键,用具有相同或不同结构的另一个接头片段来二聚化该接头片段。因此,本发明的代表性多肽包括具有下式的连接基团:
其中,指数u和s独立地选
自0和1。
[0157] 在一个实施方案中,用本发明的肽接头片段修饰的亲本多肽是抗体或抗体片段。在根据该实施方案的一个实例中,亲本多肽是scFv。本文所述的方法可用于制备本发明
的scFvs,其中scFv或接头用糖基部分或者用通过糖基连接基团附着至该肽的修饰基团
来进行修饰。糖基化和糖缀合的示例性方法在例如PCT/US02/32263和美国专利申请号
10/411,012中给出,这些文献中的每一篇通过提及而以其整体合并入本文。碱性氨基酸残
基的存在影响糖基化效率
[0158] 发明人已经发现,当O-联糖基化序列在糖基化位点附近包含脯氨酸(P)残基时,糖基化是最有效的。另外,对于某些O-联糖基化序列(例如,PTEI),并且在一些情况下,
当使用GalNAc-T2作为糖基转移酶时,紧接在糖基化序列之后的第二个脯氨酸残基(例如
PTEIP)进一步促进糖基化效率。
[0159] 然而,发明人还发现,示例性的序列PTxP和PSxP基本上不被GalNAc-T2糖基化,其中x代表任意氨基酸,并且其中这两个脯氨酸残基相隔仅仅两个氨基酸。因此,在一个实
施方案中,本发明的O-联糖基化序列不包含PSxP和PTxP。
[0160] 发明人进一步发现,当使用某些酶时,用不带电荷的氨基酸代替与O-联糖基化位点接近的碱性氨基酸残基(例如,赖氨酸)导致显著提高的糖基化率。
[0161] 例如,人GalNAc-T2酶优选地识别本发明的O-联糖基化序列,其中在糖基化位点(例如,O-联糖基化序列内的苏氨酸或丝氨酸残基)和任一赖氨酸(K)或精氨酸(R)残基
之间存在有至少三个氨基酸残基。例如,尽管序列PTxyzK(其中x、y和z代表任意非碱性
氨基酸)可以被GalNAc-T2糖基化,但是序列PTxyK不可能被GalNAc-T2糖基化。因此,在
其中将GalNAc-T2用于进行糖基化的优选实施方案中,将本发明的O-联糖基化序列引入在
亲本多肽的氨基酸内不与赖氨酸(K)或精氨酸(R)残基接近的位置上。在另一个实施方
案中,延伸该突变以将一个或多个接近的碱性氨基酸替代为非碱性氨基酸例如不带电荷的
氨基酸(例如,丙氨酸),或者酸性氨基酸例如天冬氨酸或谷氨酸。示例性的序列在实施例
**
1.3.中给出(SEQ IDNOs: )。
[0162] 发明人还发现,如果两个O-联糖基化序列以单个脯氨酸残基为中心(方案1中的P,下文),那么GalNAc-T2可以向此类结构添加多个GalNAc残基。取决于序列,假如存在苏
氨酸或丝氨酸残基,那么该酶在位置4或位置1处添加GalNAc部分。有趣的是,如果第一
个GalNAc部分被添加在位置4处,那么第二个GalNAc部分可以被添加在位置3和/或6
处(如果存在合适的氨基酸残基的话)。然而,如果位置4不被糖基化,那么位置3和6也
不被糖基化。这可以通过下列原因来解释:酶的凝集素结构域与最初所添加的GalNAc残基
结合,并且随后将催化活性导向位置3和/或6。因此,在一个实施方案中,为了减小多重
糖基化,在糖基化反应中可以使用具有删除的或截短的凝集素结构域的糖基转移酶。在本
**
文的表13中提供了示例性的截短的GalNAc-T2酶的氨基酸序列(例如,SEQ ID NOs: )。
方案1:示例性的O-联糖基化序列的一般结构
[0163] 在方案1中,氨基酸位置1-7代表谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)或任何其他不带电荷的氨基酸。
[0164] 在一个实施方案中,某些氨基酸残基被包括在O-联糖基化序列中以调节经突变的多肽在特定生物(例如大肠杆菌)中的表达能力(比较例如,实施例1),该多肽的蛋白水
解稳定性、结构特征和/或其他性质。
[0165] 在一个实施方案中,本发明的O-联糖基化序列包含根据式(I)的氨基酸序列。在另一个实施方案中,O-联糖基化序列包含根据式(II)的氨基酸序列。在另外一个实施方案
中,O-联糖基化序列具有根据式(I)的氨基酸序列。在进一步的实施方案中,O-联糖基化
序列具有根据式(II)的氨基酸序列。(X)mPO*U(B)p(Z)r(J)s(O)t(P)n (I)(SEQ ID NO:
1);和(X)m(B1)pTUB(Z)r(P)n(J)s (II)(SEQ ID NO:2)。
[0166] 在式(I)和(II)中,整数m、n、p、r、s和t独立地选自0和1。X、U、B、Z、J和O可以是任意氨基酸。在优选的实施方案中,U是选自脯氨酸(P)、谷氨酸(E)、谷氨酰胺(Q)、
天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和不带电荷的氨基酸的成员。X、B1和
B优选地是独立地选自谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、
丝氨酸(S)和不带电荷的氨基酸的成员。Z、J和O优选地是独立地选自谷氨酸(E)、谷氨酰
胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)、酪氨酸(Y)、甲硫氨酸(M)和
不带电荷的氨基酸的成员。P是脯氨酸,T是苏氨酸,和S是丝氨酸。
[0167] 在一个实施方案中,O-联糖基化序列是(X)mPO*(P)n(SEQ ID NO:**)。在另一个*
实施方案中,O-联糖基化序列是(X)mPO EI(P)n。在另一个实施方案中,O-联糖基化序列是
* *
(X)mPO QA(P)n。在另一个实施方案中,O-联糖基化序列是(X)mPO QAS(P)n。在另一个实

施方案中,O-联糖基化序列是(X)mPO QAY(P)n。在另一个实施方案中,O-联糖基化序列是
* *
(X)mPO QTY(P)n。在另一个实施方案中,O-联糖基化序列是(X)mPO INT(P)n。在另一个实

施方案中,O-联糖基化序列是(X)mPO INA(P)n。在另一个实施方案中,O-联糖基化序列是
* *
(X)mPO VGS(P)n。在另一个实施方案中,O-联糖基化序列是(X)mPO TGS(P)n。在另一个实

施方案中,O-联糖基化序列是(X)mPO TVS(P)n。在另一个实施方案中,O-联糖基化序列是
* *
(X)mPO TVA(P)n。在另一个实施方案中,O-联糖基化序列是(X)mPO TVL(P)n。在另一个实

施方案中,O-联糖基化序列是(X)mPO VL(P)n。在另一个实施方案中,O-联糖基化序列是
* *
(X)mPO VGS(P)n。在另一个实施方案中,O-联糖基化序列是(X)mPO QGA(P)n。在另一个实

施方案中,O-联糖基化序列是(X)mPO QGAM(P)n。在另一个实施方案中,O-联糖基化序列

是(X)mTET(P)n。在另一个实施方案中,O-联糖基化序列是(X)mPO ETQI(P)n。在另一个实

施方案中,O-联糖基化序列是(X)mPO VL(P)n。在另一个实施方案中,O-联糖基化序列是
* *
(X)mPO TTQ(P)n。在另一个实施方案中,O-联糖基化序列是(X)mPO TLY(P)n。在另一个实

施方案中,O-联糖基化序列是(X)mPO TLYV(P)n。在另一个实施方案中,O-联糖基化序列
* *
是(X)mPO LS(P)n。在另一个实施方案中,O-联糖基化序列是(X)mPO DA(P)n。在另一个

实施方案中,O-联糖基化序列是(X)mPO EN(P)n。在另一个实施方案中,O-联糖基化序列
* *
是(X)mPO SG(P)n。在另一个实施方案中,O-联糖基化序列是(X)mPO QD(P)n。在另一个

实施方案中,O-联糖基化序列是(X)mPO AS(P)n。在另一个实施方案中,O-联糖基化序列
* *
是(X)mPO LS(P)n。在另一个实施方案中,O-联糖基化序列是(X)mPO SS(P)n。在另一个

实施方案中,O-联糖基化序列是(X)mPO SMV(P)n。在另一个实施方案中,O-联糖基化序列
* *
是(X)mPO ATQ(P)n。在另一个实施方案中,O-联糖基化序列是(X)mPO SAV(P)n。在另一个

实施方案中,O-联糖基化序列是(X)mPO SVG(P)n。在另一个实施方案中,O-联糖基化序列
* *
是(X)mPEO Y(P)n。在另一个实施方案中,O-联糖基化序列是(X)mPO SG(P)n。在另一个实

施方案中,O-联糖基化序列是(X)mPO DG(P)n。在另一个实施方案中,O-联糖基化序列是
* *
(X)mPO TGS(P)n。在另一个实施方案中,O-联糖基化序列是(X)mPO SAD(P)n。在另一个实

施方案中,O-联糖基化序列是(X)mPO SGA(P)n。在另一个实施方案中,O-联糖基化序列是

(X)mPO INA(P)n。在另一个实施方案中,O-联糖基化序列是(X)mTGS(P)n。在另一个实施方

案中,O-联糖基化序列是(X)mTQS(P)n。在另一个实施方案中,O-联糖基化序列是(X)mPO

NQE(P)n。在另一个实施方案中,O-联糖基化序列是(X)mPO GYA(P)n。在另一个实施方案
中,O-联糖基化序列是(X)mMIAT(P)n。
[0168] 在一个实施方案中,在上面的序列中,整数m是0。在另一个实施方案中,m是1。*
在一个实施方案中,整数n是0。在另一个实施方案中,n是1。在一个实施方案中,O 是丝

氨酸(S)。在另一个实施方案中,O 是苏氨酸(T)。P是脯氨酸。X可以是任意氨基酸。在
一个实施方案中,X是谷氨酸(E)。在另一个实施方案中,X是谷氨酰胺(Q)。在另一个实施
方案中,X是天冬氨酸(D)。在另一个实施方案中,X是天冬酰胺(N)。在另一个实施方案
中,X是苏氨酸(T)。在另一个实施方案中,X是丝氨酸(S)。在另外一个实施方案中,X是
不带电荷的氨基酸,例如丙氨酸(A)、甘氨酸(G)或缬氨酸(V)。在上面的序列中,每个T(苏
氨酸)任选地并独立地被S(丝氨酸)替代,和每个丝氨酸(S)任选地并独立地被T(苏氨
酸)替代。
[0169] 根据该实施方案的示例性O-联糖基化序列包括:(X)mPTP、(X)mPTEI(P)n、(X)mPTQA(P)n、(X)mPTQAS(P)n、(X)mPTQAY(P)n、(X)mPTQTY(P)n、(X)mPTINT(P)n、(X)mPTINA(P)n、(X)mPTVGS(P)n、(X)mPTTGS(P)n、(X)mPTTVS(P)n、(X)mPTTVA(P)n、(X)mPTTVL(P)n、(X)mPTVL(P)n、(X)mPTVGS(P)n、(X)mPTQGA(P)n、(X)mPTQGAM(P)n、(X)mTET(P)n、(X)mPTETQI(P)n、(X)
mPTVL(P)n、(X)mPTTTQ(P)n、(X)mPTTLY(P)n、(X)mPTTLYV(P)n、(X)mPTLS(P)n、(X)mPTDA(P)n、(X)mPTEN(P)n、(X)mPSSG(P)n、(X)mPTQD(P)n、(X)mPTAS(P)n、(X)mPTLS(P)n、(X)mPTSS(P)n、(X)mPTSMV(P)n、(X)mPTATQ(P)n、(X)mPTSAV(P)n、(X)mPTSVG(P)n、(X)mPETY(P)n、(X)mPSSG(P)n、(X)mPSDG(P)n、(X)mPSTGS(P)n、(X)mPTSAD(P)n、(X)mPTSGA(P)n、(X)mPTINA(P)n、(X)mTGS(P)n、(X)mTQS(P)n、(X)mPTNQE(P)n、(X)mPTGYA(P)n和(X)mMIAT(P)n,其中m、n和X如上文定义。在一
个实施方案中,在这些序列中,每个T(苏氨酸)任选地并独立地被S(丝氨酸)替代,和每
个丝氨酸(S)任选地并独立地被T(苏氨酸)替代。
[0170] 在另一个示例性的实施方案中,本发明的O-联糖基化序列具有选自下列的氨基* * * * * *
酸序列:XPO P、XPO QA(P)n、XPO EI(P)n、XPO INT(P)n、XPO TVS 、(X)mPO TVSP、XPO
* * * * * * *
QGA 、(X)mPO QGAP、XPO QGAM(P)n、(X)mPO VL、XPO VL(P)n、XPO TVL、(X)mPO TVLP、
* * * * * *
(X)mPO TLYVP、XPO TLYV(P)n、(X)mPO DA(P)n、(X)mPO QD(P)n、(X)mPO AS(P)n、XPO SAV、
* n
(X)mPO SAVP和XTET(P)。在这些序列中,每个T(苏氨酸)可以任选地并独立地被S(丝
氨酸)替代,和每个丝氨酸(S)可以任选地并独立地被T(苏氨酸)替代。整数m和n以及
X如上文定义。
[0171] 在另外一个示例性的实施方案中,本发明的O-联糖基化序列具有选自下列的氨基酸序列:XPTP、XPTQA(P)n、XPTEI(P)n、XPTINT(P)n、XPTTVS、(X)mPTTVSP、XPTQGA、(X)
mPTQGAP、XPTQGAM(P)n、XTETP、(X)mPTVL、XPTVL(P)n、XPTTVL、(X)mPTTVLP、(X)mPTTLYVP、
XPTTLYV(P)n、(X)mPTDA(P)n、(X)mPTQD(P)n、(X)mPTAS(P)n、XPTSAV、(X)mPTSAVP和XTET(P)n。
在一个实施方案中,每个T(苏氨酸)任选地并独立地被S(丝氨酸)替代,和每个丝氨酸
(S)任选地并独立地被T(苏氨酸)替代。整数m和n以及X如上文定义。
[0172] 在一个实施方案中,本发明的O-联糖基化序列是PTP(SEQ ID NO:**)。在另一个**
实施方案中,O-联糖基化序列是PTEI(SEQ ID NO: )。在另一个实施方案中,O-联糖基
**
化序列是PTEIP(SEQ ID NO: )。在另一个实施方案中,O-联糖基化序列是PTQA(SEQ ID
** **
NO: )。在另一个实施方案中,O-联糖基化序列是PTQAP(SEQ ID NO: )。在另一个实
**
施方案中,O-联糖基化序列是PTINT(SEQ ID NO: )。在另一个实施方案中,O-联糖基化
**
序列是PTINTP(SEQ ID NO: )。在另一个实施方案中,O-联糖基化序列是PTTVS(SEQ ID
** **
NO: )。在另一个实施方案中,O-联糖基化序列是PTTVL(SEQ ID NO: )。在另一个实
**
施方案中,O-联糖基化序列是PTQGAM(SEQ ID NO: )。在另一个实施方案中,O-联糖基
**
化序列是PTQGAMP(SEQ ID NO: )。在另一个实施方案中,O-联糖基化序列是TETP(SEQ
** **
ID NO: )。在另一个实施方案中,O-联糖基化序列是PTVL(SEQ ID NO: )。在另一个
**
实施方案中,O-联糖基化序列是PTVLP(SEQ ID NO: )。在另一个实施方案中,O-联糖基
**
化序列是PTLSP(SEQ ID NO: )。在另一个实施方案中,O-联糖基化序列是PTDAP(SEQ ID
** **
NO: )。在另一个实施方案中,O-联糖基化序列是PTENP(SEQ ID NO: )。在另一个实
**
施方案中,O-联糖基化序列是PTQDP(SEQ ID NO: )。在另一个实施方案中,O-联糖基化
**
序列是PTASP(SEQ ID NO: )。在另一个实施方案中,O-联糖基化序列是PTTVSP(SEQ ID
** **
NO: )。在另一个实施方案中,O-联糖基化序列是PTQGA(SEQ ID NO: )。在另一个实
**
施方案中,O-联糖基化序列是PTSAV(SEQ ID NO: )。在另一个实施方案中,O-联糖基化
**
序列是PTTLYV(SEQ ID NO: )。在另一个实施方案中,O-联糖基化序列是PTTLYVP(SEQ
** **
ID NO: )。在另一个实施方案中,O-联糖基化序列是PSSGP(SEQ ID NO: )。在另一个
**
实施方案中,O-联糖基化序列是PSDGP(SEQ ID NO: )。
[0173] 在其中亲本多肽是胰高血糖素样肽-1(GLP-1)的示例性实施方案中,O-联糖基化序列优选地不选自PTQ、PTT、PTQA、PTQG、PTQGA、PTQGAMP、PTQGAM、PTINT、PTQAY、PTTLY、
PTGSLP、PTTSEP、PTAVIP、PTSGEP、PTTLYP、PTVLP、TETP、PSDGP和PTEVP。在其中亲本多肽是
野生型GLP-1的另一个示例性实施方案中,O-联糖基化序列优选地不选自PTQ、PTT、PTQA、
PTQG、PTQGA、PTQGAMP、PTQGAM、PTINT、PTQAY、PTTLY、PTGSLP、PTTSEP、PTAVIP、PTSGEP、
PTTLYP、PTVLP、TETP、PSDGP和PTEVP。在其中亲本多肽是野生型GLP-1的另一个示例性实
施方案中,O-联糖基化序列优选地不选自PTQ、PTT、PTQA、PTQG、PTQGA、PTQGAMP、PTQGAM、
PTINT、PTQAY、PTTLY、PTGSLP、PTTSEP、PTAVIP、PTSGEP、PTTLYP、PTVLP、TETP、PSDGP 和
PTEVP,除非O-联糖基化序列不被设计成位于存在于野生型G-CSF多肽中的脯氨酸残基周
围。
[0174] 在其中亲本多肽是G-CSF的另一个示例性实施方案中,O-联糖基化序列优选地不选自PTQGA、PTQGAM、PTQGAMP、APTP和PTP。在其中亲本多肽是野生型G-CSF的另一个示
例性实施方案中,O-联糖基化序列优选地不选自PTQGA、PTQGAM、PTQGAMP、APTP和PTP。在
其中亲本多肽是野生型G-CSF的另一个示例性实施方案中,O-联糖基化序列优选地不选自
PTQGA、PTQGAM、PTQGAMP、APTP和PTP,除非O-联糖基化序列不被设计成位于存在于野生型
G-CSF多肽中的脯氨酸残基周围。
[0175] 在其中亲本多肽是人生长激素(hGH)的另一个示例性实施方案中,O-联糖基化序列优选地不选自PTQGA、PTQGAM、PTQGAMP、PTVLP、PTTVS、PTTLYV、PTINT、PTEIP、PTQA和
TETP。在其中亲本多肽是野生型hGH的另一个示例性实施方案中,O-联糖基化序列优选
地不选自PTQGAM、PTQGAMP、PTTVS、PTTLYV、PTINT、PTQA和TETP。在其中亲本多肽是野生
型hGH的另外一个示例性实施方案中,O-联糖基化序列优选地不选自PTQGAM、PTQGAMP、
PTTVS、PTTLYV、PTINT、PTQA和TETP,除非O-联糖基化序列不被设计成位于存在于野生型
hGH多肽中的脯氨酸残基周围。
[0176] 在其中亲本多肽是INF-α的另一个示例性实施方案中,O-联糖基化序列优选地不是TETP。在其中亲本多肽是野生型INF-α的另一个示例性实施方案中,O-联糖基化序列
优选地不是TETP。在其中亲本多肽是野生型INF-α的另外一个示例性实施方案中,O-联
糖基化序列优选地不是TETP,除非O-联糖基化序列不被设计成位于存在于野生型INF-α
多肽中的脯氨酸残基周围。
[0177] 在其中亲本多肽是FGF(例如,FGF-1、FGF-2、FGF-18、FGF-20、FGF-21)的另一个示例性实施方案中,O-联糖基化序列优选地不选自PTP、PTQGA、PTQGAM、PTQGAMP、PTEIP、
PTTVS、PTINT、PTINTP、PTQA、PTQAP、PTSAV和PTSAVAA。在其中亲本多肽是野生型FGF的另一
个示例性实施方案中,O-联糖基化序列优选地不选自PTP、PTQGA、PTQGAM、PTQGAMP、PTEIP、
PTTVS、PTINT、PTINTP、PTQA、PTQAP、PTSAV和PTSAVAA。在其中亲本多肽是野生型FGF的
另外一个示例性实施方案中,O-联糖基化序列优选地不选自PTP、PTQGA、PTQGAM、PTQGAMP、
PTEIP、PTTVS、PTINT、PTINTP、PTQA、PTQAP、PTSAV和PTSAVAA,除非O-联糖基化序列不被设
计成位于存在于野生型FGF多肽中的脯氨酸残基周围。
[0178] 在一个实施方案中,当经历合适的糖基化反应时,O-联糖基化序列以高效率被糖基化。例如,合适的糖基化反应的反应产率为至少约50%、至少约60%、至少约70%、至少
约80%、至少约90%或至少约95%。在另一个实施方案中,当所述酶是GalNAc-T2时,每一
糖基化序列在仅一个氨基酸残基处用GalNAc残基来糖基化O-联糖基化序列。序列肽段多

[0179] 可以将本发明的O-联糖基化序列引入任何亲本多肽中,从而产生本发明的序列肽段多肽。可以使用本领域已知和在下文描述的方法(例如,通过重组技术或化学合成)
来产生本发明的序列肽段多肽。在一个实施方案中,以这样的方式来修饰亲本序列,即使得
O-联糖基化序列插入到亲本序列中,从而向亲本多肽的氨基酸序列中添加全长和各自数目
的氨基酸。在另一个实施方案中,O-联糖基化序列替代了亲本多肽的一个或多个氨基酸。
在另一个实施方案中,在亲本多肽中引入变异,使用一个或多个现有的氨基酸作为糖基化
序列的一部分。例如,保持亲本肽中的脯氨酸残基并使紧接该脯氨酸之后的那些氨基酸进
行突变,以产生本发明的O-联糖基化序列。在另外一个实施方案中,通过采用氨基酸插入
和现有氨基酸替代的组合,产生O-联糖基化序列。
[0180] 在某些实施方案中,本发明的特定亲本多肽与本发明的特定O-联糖基化序列组合使用。示例性的亲本多肽/O-联糖基化序列组合概述在表2(图6)中。图6中的每行代
表本发明的示例性实施方案。所显示的组合可以用于本发明的所有方面,包括本发明的单
一序列肽段多肽、序列肽段多肽文库、序列肽段多肽缀合物和方法。本领域技术人员将会意
识到,在图6中对于所指明的亲本多肽而给出的实施方案同样可以应用于本文所示的其他
亲本多肽。序列肽段多肽文库
[0181] 用于鉴定多肽(其当经历糖基化或糖PEG化反应时被有效地糖基化或糖PEG化(例如,以满意的产率))的一种策略是在亲本多肽的氨基酸序列内的各个不同位置(包括
例如,β-折叠片结构域和α-螺旋结构域)处插入本发明的O-联糖基化序列,然后就它
们作为糖基转移酶(例如,人GalNAc-T2)的有效底物的能力来测试许多所得的序列肽段多
肽。
[0182] 因此,在另一个方面,本发明提供了序列肽段多肽文库,其包括多个不同的成员,其中该文库的每个成员对应于共同的亲本多肽并且包含至少一个独立选择的本发明的外
源O-联或S-联糖基化序列。在一个实施方案中,该文库的每个成员包含相同的O-联糖基
化序列,它们各自在亲本多肽内的不同氨基酸位置处。在另一个实施方案中,该文库的每个
成员包含不同的O-联糖基化序列,但是在亲本多肽内的相同氨基酸位置处。本文描述了可
与本发明的文库组合使用的O-联糖基化序列。在一个实施方案中,在本发明的文库中使用
的O-联糖基化序列具有根据式(I)的氨基酸序列(SEQ ID NO:1)。在另一个实施方案中,
在本发明的文库中使用的O-联糖基化序列具有根据式(II)的氨基酸序列(SEQ ID NO:2)。
式(I)和式(II)在下文描述。
[0183] 在优选的实施方案中,与本发明的文库组合使用的O-联糖基化序列具有来自下列的氨基酸序列:(X)mPT(P)n、(X)mPTEI(P)n、(X)mPTQA(P)n、(X)mPTQAS(P)n、(X)mPTQAY(P)
n、(X)mPTQTY(P)n、(X)mPTINT(P)n、(X)mPTINA(P)n、(X)mPTVGS(P)n、(X)mPTTGS(P)n、(X)
mPTTVS(P)n、(X)mPTTVA(P)n、(X)mPTTVL(P)n、(X)mPTVL(P)n、(X)mPTVGS(P)n、(X)mPTQGA(P)n、(X)mPTQGAM(P)n、(X)mTET(P)n、(X)mPTETQI(P)n、(X)mPTVL(P)n、(X)mPTTTQ(P)n、(X)mPTTLY(P)n、(X)mPTTLYV(P)n、(X)mPTLS(P)n、(X)mPTDA(P)n、(X)mPTEN(P)n、(X)mPSSG(P)n、(X)mPTQD(P)n、(X)mPTAS(P)n、(X)mPTLS(P)n、(X)mPTSS(P)n、(X)mPTSMV(P)n、(X)mPTATQ(P)n、(X)mPTSAV(P)n、(X)mPTSVG(P)n、(X)mPETY(P)n、(X)mPSSG(P)n、(X)mPSDG(P)n、(X)mPSTGS(P)n、(X)mPTSAD(P)n、(X)mPTSGA(P)n、(X)mPTINA(P)n、(X)mTGS(P)n、(X)mTQS(P)n、(X)mPTNQE(P)n、(X)mPTGYA(P)n和(X)mMIAT(P)n,其中m和n是独立地选自0和1的整数。X可以是任意氨基酸,并且优选地
是选自谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和不
带电荷的氨基酸的成员。每个T(苏氨酸)任选地并独立地被S(丝氨酸)替代。
[0184] 在其中文库的每个成员具有共同的O-联糖基化序列的一个实施方案中,亲本多肽具有包括“m”个氨基酸的氨基酸序列。在一个实例中,序列肽段多肽文库包括:(a)第一
种序列肽段多肽,其在亲本多肽内的第一个氨基酸位置(AA)n处具有O-联糖基化序列,其
中n是选自1至m的成员;和(b)至少一种额外的序列肽段多肽,其中在每个额外的序列肽
段多肽中,在额外的氨基酸位置处引入O-联糖基化序列,每个额外的氨基酸位置选自(AA)
n+x和(AA)n-x,其中x是选自1至(m-n)的成员。例如,通过在第一个氨基酸位置处引入所选
的O-联糖基化序列来产生第一种序列肽段多肽。然后,可以通过在其定位进一步朝向亲本
多肽的N-或C-末端的氨基酸位置处引入相同的O-联糖基化序列来产生随后的序列肽段
多肽。
[0185] 在该情况下,当n-x是0(AA0)时,那么在紧接亲本多肽的N-末端氨基酸之前引入1
糖基化序列。示例性的序列肽段多肽可以具有部分序列:“PTPM...”。
[0186] 第一个氨基酸位置(AA)n可以在亲本多肽的氨基酸序列内的任何地方。在一个实施方案中,选择第一个氨基酸位置(例如,在环结构域的开始处)。
[0187] 每个额外的氨基酸位置可以在亲本多肽内的任何地方。在一个实例中,序列肽段多肽文库包括第二种序列肽段多肽,其在选自(AA)n+p和(AA)n-p的氨基酸位置处具有O-联
糖基化序列,其中p选自1至约10,优选1至约8,更优选1至约6,更加优选1至约4,和最
优选1至约2。在一个实施方案中,序列肽段多肽文库包括在氨基酸位置(AA)n处具有O-联
糖基化序列的第一种序列肽段多肽和在氨基酸位置(AA)n+1或(AA)n-1处具有O-联糖基化序
列的第二种序列肽段多肽。
[0188] 在另一个实例中,每个额外的氨基酸位置紧邻之前所选的氨基酸位置。在另外一个实例中,每个额外的氨基酸位置与之前所选的氨基酸位置准确地相距1、2、3、4、5、6、7、8、
9或10个氨基酸。
[0189] 在亲本多肽的“给定氨基酸位置”处引入O-联或S-联糖基化序列表示,从紧接给定氨基酸位置开始(朝向C-末端),引入突变。引入可以通过完整插入(不替代任何现有
的氨基酸)或者通过替代任何数目的现有氨基酸来进行。
[0190] 在示例性的实施方案中,通过在亲本多肽的连续氨基酸位置处引入O-联糖基化序列来产生序列肽段多肽文库,每个所述氨基酸位置与之前所选的氨基酸位置紧邻,从而
经过该氨基酸链而“扫描”糖基化序列,直至到达所希望的最终氨基酸位置。紧邻是指进一
步朝向亲本多肽的N-或C-末端正好一个氨基酸位置。例如,通过在氨基酸位置AAn处引入
糖基化序列来产生第一种突变体。通过在氨基酸位置AAn+1处引入糖基化位点来产生文库
的第二个成员,通过在氨基酸位置AAn+2处引入糖基化位点来产生第三种突变体,等等。该
步骤程序被称作“序列肽段扫描”。序列肽段扫描的实例提供在本文中,例如在实施例1.9
中。本领域技术人员将会意识到,序列肽段扫描可以涉及设计文库,从而使得第一个成员在
氨基酸位置(AA)n处具有糖基化序列,第二个成员在氨基酸位置(AA)n+2处具有糖基化序列、
第三个成员在氨基酸位置(AA)n+4处具有糖基化序列,等等。同样地,文库的成员可以通过糖
基化序列的其他策略性放置来表征。例如:A)成员1:(AA)n;成员2:(AA)n+3;成员3:(AA)
n+6;成员4:(AA)n+9等等;B)成员1:(AA)n;成员2:(AA)n+4;成员3:(AA)n+8;成员4:(AA)n+12等等;C)成员1:(AA)n;成员2:(AA)n+5;成员3:(AA)n+10;成员4:(AA)n+15等等。
[0191] 在一个实施方案中,通过下列方式来产生第一个序列肽段多肽文库:经过亲本多肽的特定区域(例如,从特定环区域的开始处到该环区域的结束处)扫描所选的本发明
O-联或S-联糖基化序列。然后,通过下列方式来产生第二个文库:经过多肽的另一个区域
扫描相同的糖基化序列,“跳过”位于所述第一个区域和所述第二个区域之间的那些氨基酸
位置。该多肽链的不被考虑的部分可以例如对应于对于生物活性重要的结合结构域或者
已知不适合于糖基化的该多肽序列的另一个区域。通过对多肽的另外的序列段进行“序列
肽段扫描”,可以产生任意数目的额外文库。在示例性的实施方案中,通过下列方式来产生
文库:经过整个多肽扫描O-联糖基化序列,其中在亲本多肽内的每个氨基酸位置处引入突
变。
[0192] 在一个实施方案中,文库的成员是多肽混合物的一部分。例如,用多种表达载体感染细胞培养物,其中每种载体包含本发明的不同序列肽段多肽的核酸序列。在表达后,培养
液可以含有多种不同的序列肽段多肽,并从而包括序列肽段多肽文库。该技术可以用于确
定文库的哪个序列肽段多肽在给定的表达系统中被最有效地表达。
[0193] 在另一个实施方案中,文库的成员相互分离地存在。例如,可以分离上述混合物中的至少两种序列肽段多肽。所分离的多肽一起代表了一个文库。备选地,文库的每个序列
肽段多肽分开地表达,并且任选地分离所述序列肽段多肽。在另一个实例中,通过化学方法
来合成文库的每个成员并任选地进行纯化。示例性的序列肽段多肽
[0194] 示例性的亲本多肽是重组人BMP-7。选择BMP-7作为示例性的亲本多肽是为了举例说明目的,并且不意在限制本发明的范围。本领域技术人员将会意识到,任何亲本多肽
(例如,本文所示的那些)同样适合于下面的示例性修饰。如此获得的任何多肽变体落入本
发明的范围内。本发明的生物学活性BMP-7变体包括任何BMP-7多肽(部分的或完整的),
其包含至少一个不导致其生物活性基本上或完全丧失的修饰,如通过本领域技术人员已知
的任何合适的功能测定法所测量的。下面的序列(140个氨基酸)代表全长BMP-7序列(序
1
列S.1)的生物学活性部分:MSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGW
QDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR
**
NMVVRACGCH(SEQ ID NO: )。
[0195] 基于上述亲本多肽序列的示例性BMP-7变体多肽在下面的表3-11中列出。在优选的实施方案中,通过考虑糖基转移酶的底物要求,而产生序列肽段多肽。例如,当使用全
长或截短的GalNAc-T2(优选人GalNAc-T2)作为糖基转移酶时,将与糖基化位点(例如,苏
氨酸)接近(例如,在三个氨基酸之内)的任何碱性氨基酸残基,例如赖氨酸(K)或精氨酸
(R)任选地用另一氨基酸替代。在下面的表1-10中,此类碱性氨基酸通过下划线标出。替
代氨基酸优选为不带电荷的氨基酸,例如丙氨酸。
[0196] 在一个示例性的实施方案中,在野生型BMP-7氨基酸序列S.1(SEQ ID NO:**)中引入突变,以替代亲本序列中相应数目的氨基酸,从而得到含有与亲本多肽相同数目的氨
基酸残基的序列肽段多肽。例如,用O-联糖基化序列“脯氨酸-苏氨酸-脯氨酸”(PTP)直
接取代通常在BMP-7中的三个氨基酸,然后将PTP序列朝向该多肽的C-末端顺次移动,从
而提供了137个BMP-7变体,每个包含PTP。根据该实施方案的示例性序列在下面的表3中
列出。表3:包含140个氨基酸的BMP-7变体的示例性文库,其中三个现有的氨基酸被O-联
糖基化序列“PTP”替代通过下划线而标出与糖基化位点接近的碱性氨基酸,其可以任选地
1
被不带电荷的氨基酸替代。在位置1处引入,替代3个现有的氨基酸:MPTPSKQRSQNRSKTPK
NQEALRMANVAENS S SDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLV
**
HFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO: )在位置2处引入,
1
替代3个现有的氨基酸:MSPTPKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDW
IIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMV
** 1
VRACGCH(SEQ ID NO: )在位置3处引入,替代3个现有的氨基酸:MSTPTPQRSQNRSKTPKN
QEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFI
**
NPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMVVRACGCH(SEQ ID NO: )通过以上述方式经
过整个序列“扫描”糖基化序列可以产生另外的BMP-7变体。如此获得的所有变体BMP-7序
列都在本发明的范围内。如此产生的最终序列肽段多肽具有下面的序列:在位置137处引
1
入,替代3个现有的氨基酸:MSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGW
QDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR
**
NMVVRACPTP(SEQ ID NO: )
[0197] 在另一个示例性的实施方案中,通过向亲本序列添加一个或多个氨基酸来将**
O-联糖基化序列引入野生型BMP-7氨基酸序列S.1(SEQ ID NO: )中。例如,将O-联糖
基化序列PTP添加至亲本BMP-7序列,从而替代亲本序列中的2、1或0个氨基酸。在该实
例中,所添加的氨基酸残基的最大数目相应于所插入的糖基化序列的长度。在示例性的实
施方案中,亲本序列延伸正好一个氨基酸。例如,将O-联糖基化序列PTP添加至亲本BMP-7
肽,从而替代正常存在于BMP-7中的2个氨基酸。根据该实施方案的示例性序列在下面的
表4中列出。表4:包含141个氨基酸的突变型BMP-7多肽的示例性文库,其中两个现有
的氨基酸被O-联糖基化序列“PTP”替代通过下划线而标出与糖基化位点接近的碱性氨基
1
酸,其可以任选地被不带电荷的氨基酸替代。在位置1处引入,替代2个氨基酸(ST)MPTP
GSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYM
**
NATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO: )在
1
位置2处引入,替代2个氨基酸(TG)MSPTPSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHEL
YVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS
** 1
SNVILKKYRNMVVRACGCH(SEQ ID NO: )在位置3处引入,替代2个氨基酸(GS)MSTPTPKQR
SQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNH
**
AIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO: )在位置4
1
处引入,替代2个氨基酸(SK)MSTGPTPQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDL
GWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKK
** 1
YRNMVVRACGCH(SEQ ID NO: )在位置5处引入,替代2个氨基酸(KQ)MSTGSPTPRSQNRSKT
PKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLV
**
HFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO: )通过以上述方式
经过整个序列“扫描”糖基化序列可以产生另外的BMP-7变体,直至达到下面的序列:在位
1
置138处引入,替代2个现有的氨基酸(CH):MSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQA
CKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISV
**
LYFDDSSNVILKKYRNMVVRACGPTP(SEQ ID NO: )如此获得的所有BMP-7变体都在本发明的
范围内。
[0198] 另一个实例涉及向亲本多肽(例如,BMP-7)添加O-联糖基化序列(例如,PTP),从而替代正常存在于亲本多肽中的1个氨基酸(双氨基酸插入)。根据该实施方案的示例
性序列在下面的表5中列出。表5:包含PTP的BMP-7突变体的示例性文库;替代一个现有
的氨基酸(142个氨基酸)通过下划线而标出与糖基化位点接近的碱性氨基酸,其可以任选
1
地被不带电荷的氨基酸替代。在位置1处引入,替代1个氨基酸(S)MPTPTGSKQRSQNRSKTP
KNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVH
**
FINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO: )在位置2处引入,
1
替代1个氨基酸(T)MSPTPGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWI
IAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVV
** 1
RACGCH(SEQ ID NO: )在位置3处引入,替代1个氨基酸(G)MSTPTPSKQRSQNRSKTPKNQEA
LRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPE
**
TVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO: )在位置4处引入,替代1
1
个氨基酸(S)MSTGPTPKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGY
AAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH
** 1
(SEQ ID NO: )在位置5处引入,替代1个氨基酸(K)MSTGSPTPQRSQNRSKTPKNQEALRMANV
AENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPC
**
CAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO: )通过以上述方式经过整个序列
“扫描”糖基化序列可以产生另外的BMP-7变体,直至达到下面的序列:在位置139处引入,
1
替代1个现有的氨基酸(H):MSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLG
WQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKY
**
RNMVVRACGCPTP(SEQ ID NO: )如此获得的所有BMP-7变体都在本发明的范围内。
[0199] 另外一个实例涉及在亲本多肽(例如,BMP-7)内产生O-联糖基化序列,其中不替代正常存在于亲本多肽内的氨基酸,并且添加整个长度的糖基化序列(例如,PTP的三氨基
酸插入)。根据该实施方案的示例性序列在下面的表6中列出。表6:包含PTP的BMP-7变
体的示例性文库;添加3个氨基酸(143个氨基酸)通过下划线而标出与糖基化位点接近的
1
碱性氨基酸,其可以任选地被不带电荷的氨基酸替代。在位置1处引入,添加3个氨基酸M
PTPSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFP

LNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO:
* 1
,如上)在位置2处引入,添加3个氨基酸MSPTPTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQ
ACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAIS
** 1
VLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO: )在位置3处引入,添加3个氨基酸MSTPTP
GSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYM
**
NATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO: )在
1
位置4处引入,添加3个氨基酸MSTGPTPSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYV
SFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSN
**
VILKKYRNMVVRACGCH(SEQ ID NO: )通过以上述方式经过整个序列“扫描”糖基化序列可
1
以产生另外的BMP-7变体,直至达到最终的序列:在位置140处引入,添加3个氨基酸:MST
GSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYM
**
NATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCHPTP(SEQ ID NO: )
如此获得的所有BMP-7变体都在本发明的范围内。
[0200] 使用任一种本发明的O-联糖基化序列可以产生类似于表1-5中那些实例的BMP-7变体。所有得到的BMP-7变体都在本发明的范围内。例如,可以使用序列PTINT(SEQ ID NO:
** **
)或PTTVS(SEQ ID NO: ),而不是PTP。在示例性的实施方案中,将PTINT引入亲本多
肽中,从而替代正常存在于BMP-7中的5个氨基酸。根据该实施方案的示例性序列在下面
的表7中列出。表7:包含PTINT的BMP-7变体的示例性文库;替代5个氨基酸(140个氨
1
基 酸 )MPTINTQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEG
ECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID
** 1
NO: )MSPTINTRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEG
ECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID
** 1
NO: )MSTPTINTSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEG
ECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID
** 1
NO: )MSTGPTINTQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEG
ECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID
**
NO: )通过以上述方式经过整个序列“扫描”糖基化序列可以产生另外的BMP-7变体,直
1
至达到最终的序列:MSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIA
PEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRP
**
TINT(SEQ ID NO: )如此获得的所有突变型BMP-7序列都在本发明的范围内。
[0201] 在另一个实例中,在亲本序列的N-或C-末端处或接近亲本序列的N-或C-末端处向亲本多肽(例如,BMP-7)添加O-联糖基化序列PTINT,从而向亲本多肽添加1-5个氨基
酸。根据该实施方案的示例性序列在下面的表8列出。表8:包含PTINT的BMP-7变体的示
1
例性文库(141-145个氨基酸)氨基末端突变体:在位置1处引入,添加5个氨基酸MPTIN
TSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLN
**
SYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO: )
1
在位置1处引入,添加4个氨基酸,替代1个氨基酸(S)MPTINTTGSKQRSQNRSKTPKNQEALRMAN
VAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKP
**
CCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO: )在位置1处引入,添加3个氨
1
基酸,替代2个氨基酸(ST)MPTINTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRD
LGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILK
**
KYRNMVVRACGCH(SEQ ID NO: )在位置1处引入,添加2个氨基酸,替代3个氨基酸(STG)
1
MPTINTSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAF
PLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO:
** 1
)在位置1处引入,添加1个氨基酸,替代4个氨基酸(STGS)MPTINTKQRSQNRSKTPKNQEA
LRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPE
**
TVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO: )羧基末端突变体:在位
1
置140处引入,添加5个氨基酸MSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRD
LGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILK
**
KYRNMVVRACGCHPTINT(SEQ ID NO: )在位置139处引入,添加4个氨基酸,替代1个氨基
1
酸 (H)MSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGE
CAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCPTINT(SEQ
** 1
ID NO: )在位置138处引入,添加3个氨基酸,替代2个氨基酸(CH)MSTGSKQRSQNRSKTP
KNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVH
**
FINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGPTINT(SEQ ID NO: )在位置137处
1
引入,添加2个氨基酸,替代3个氨基酸(GCH)MSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQ
ACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAIS
**
VLYFDDSSNVILKKYRNMVVRACPTINT(SEQ ID NO: )在位置136处引入,添加1个氨基酸,替
1
代4个氨基酸(CGCH)MSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWII
APEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVR
**
APTINT(SEQ ID NO: )
[0202] 另外一个实例涉及向亲本多肽(例如,BMP-7)中插入O-联糖基化序列PTTVS(SEQ**
ID NO: ),从而向亲本序列添加1至5个氨基酸。根据该实施方案的示例性序列在下面
的表9中列出。表9:包含PTTVS的BMP-7变体的示例性文库通过下划线而标出与糖基化
1
位点接近的碱性氨基酸,其可以任选地被不带电荷的氨基酸替代。插入一个氨基酸MPTTV
SKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMN
** 1
ATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO: )MSP
TTVSQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSY
** 1
MNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO: )M
STPTTVSRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLN
**
SYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO: )
通过以上述方式经过整个序列“扫描”糖基化序列可以产生另外的BMP-7变体,直至达到最
1
终的序列:MSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY
CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRAPTTVS(S
** 1
EQ ID NO: )如此获得的所有BMP-7变体都在本发明的范围内。插入两个氨基酸MPTTV
SSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYM
** 1
NATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO: )MS
PTTVSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLN
**
SYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO: )
1
MSTPTTVSQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAF
PLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO:
**
)通过以上述方式经过整个序列“扫描”糖基化序列可以产生另外的BMP-7变体,直至达
1
到最终的序列:MSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGY
AAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACPTT
**
VS(SEQ ID NO: )如此获得的所有BMP-7变体都在本发明的范围内。插入三个氨基酸M
1
PTTVSGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAF
PLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO:
** 1
)MSPTTVSSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEG
ECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID
** 1
NO: )MSTPTTVSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY
CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ
**
ID NO: )通过以上述方式经过整个序列“扫描”糖基化序列可以产生另外的BMP-7变体,
1
直至达到最终的序列:MSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWI
IAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVV
**
RACGPTTVS(SEQ ID NO: )如此获得的所有BMP-7变体都在本发明的范围内。插入四个氨
1
基 酸 MPTTVSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY
CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ
** 1
ID NO: )MSPTTVSGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEG
YAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGC
** 1
H(SEQ ID NO: )MSTPTTVSSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWI
IAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVV
**
RACGCH(SEQ ID NO: )通过以上述方式经过整个序列“扫描”糖基化序列可以产生另外的
1
BMP-7变体,直至达到最终的序列:MSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVS
FRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNV
**
ILKKYRNMVVRACGCPTTVS(SEQ ID NO: )如此获得的所有BMP-7变体都在本发明的范围内。
1
插入五个氨基酸MPTTVSSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWI
IAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVV
** 1
RACGCH(SEQ ID NO: )MSPTTVSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDL
GWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKK
** 1
YRNMVVRACGCH(SEQ ID NO: )MSTPTTVSGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELY
V SFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS
**
SNVILKKYRNMVVRACGCH(SEQ ID NO: )通过以上述方式经过整个序列“扫描”糖基化序列
1
可以产生另外的BMP-7变体,直至达到最终的序列:MSTGSKQRSQNRSKTPKNQEALRMANVAENSS
SDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQ
**
LNAISVLYFDDSSNVILKKYRNMVVRACGCHPTTVS(SEQ ID NO: )如此获得的所有BMP-7变体都
在本发明的范围内。
[0203] 含有O-联糖基化序列的序列肽段多肽的其他实例公开在于2005年8月22日提交的美国临时专利申请60/710,401;和于2005年9月23日提交的60/720,030;
WO2004/99231和WO2004/10327中,它们为了所有目的通过提及而合并入本文。
[0204] 在一个实例中,通过取代现有的氨基酸和/或通过插入来将O-联糖基化序列(例如,PTP)置于所选多肽区域内所有可能的氨基酸位置处。根据该实施方案的示例性序列在
73 82
下面的表10和表11中列出。表10:在A 和A 之间包含PTP的BMP-7变体的示例性文库取
73 82 95 103 **
代现有的氨基酸---A FPLNSYMNA TNHAIVQTLVHFI NPETVPKP ---(SEQ IDNO: )(亲本)
73 82 95 103 ** 73 82
---P TPLNSYMNA TNHAIVQTLVHFI NPETVPKP ---(SEQ IDNO: )---A PTPNSYMNA TNHAIV
95 103 ** 73 82 95 103
QTLVHFI NPETVPKP ---(SEQ IDNO: )---A FPTPSYMNA TNHAIVQTLVHFI NPETVPKP ---(
** 73 82 95 103 ** 73
SEQ IDNO: )---A FPPTPYMNA TNHAIVQTLVHFI NPETVPKP ---(SEQ IDNO: )---A FPLP
82 95 103 ** 73 82 95
TPMNA TNHAIVQTLVHFI NPETVPKP ---(SEQ IDNO: )---A FPLNPTPNA TNHAIVQTLVHFI N
103 ** 73 82 95 103
PETVPKP ---(SEQ IDNO: )---A FPLNSPTPA TNHAIVQTLVHFI NPETVPKP ---(SEQ IDNO:
** 73 82 95 103 ** 95 103
)---A FPLNSYPTP TNHAIVQTLVHFI NPETVPKP ---(SEQ IDNO: )表11:在I 和P
之间包含PTP的BMP-7变体的示例性文库通过下划线而标出与糖基化位点接近的碱性氨基
73 82
酸,其可以任选地被不带电荷的氨基酸替代。取代现有的氨基酸---A FPLNSYMNA TNHAIVQ
95 103 ** 73 82 95 103
TLVHFP TPETVPKP ---(SEQ IDNO: )---A FPLNSYMNA TNHAIVQTLVHFI PTPTVPKP ---(S
** 73 82 95 103 ** 73
EQ IDNO: )---A FPLNSYMNA TNHAIVQTLVHFI NPTPVPKP ---(SEQ IDNO: )---A FPLNS
82 95 103 ** 73 82 95
YMNA TNHAIVQTLVHFI NPPTPPKP ---(SEQ IDNO: )---A FPLNSYMNA TNHAIVQTLVHFI NP
103 ** 73 82 95 103
EPTPKP ---(SEQ IDNO: )---A FPLNSYMNA TNHAIVQTLVHFI NPETPTPP ---(SEQ IDNO:
** 73 82 95 103 **
)---A FPLNSYMNA TNHAIVQTLVHFI NPETVPTP ---(SEQ IDNO: )在现有的氨基酸之
73 82 95 103
间插入(添加一个氨基酸)---P TPPLNSYMNA TNHAIVQTLVHFI NPETVPKP ---(SEQ IDNO:
** 73 82 95 103 ** 73 8
)---A PTPLNSYMNA TNHAIVQTLVHFI NPETVPKP ---(SEQ IDNO: )---A FPTPNSYMNA
2 95 103 ** 73 82 95
TNHAIVQTLVHFI NPETVPKP ---(SEQ IDNO: )---A FPPTPSYMNA TNHAIVQTLVHFI NPETV
103 ** 73 82 95 103 *
PKP ---(SEQ IDNO: )---A FPLPTPYMNA TNHAIVQTLVHFI NPETVPKP ---(SEQ IDNO:
* 73 82 95 103 ** 73 82
)---A FPLNPTPMNA TNHAIVQTLVHFI NPETVPKP ---(SEQ IDNO: )---A FPLNSPTPNA TN
95 103 ** 73 82 95 1
HAIVQTLVHFI NPETVPKP ---(SEQ IDNO: )---A FPLNSYPTPA TNHAIVQTLVHFI NPETVPKP
03 ** 73 82 95 103 **
---(SEQ IDNO: )---A FPLNSYMPTP TNHAIVQTLVHFI NPETVPKP ---(SEQ IDNO: )在
73 82 95 103
现有的氨基酸之间插入(添加一个氨基酸)---A FPLNSYMNA TNHAIVQTLVHFP TPPETVPKP
** 73 82 95 103 **
---(SEQ IDNO: )---A FPLNSYMNA TNHAIVQTLVHFI PTPETVPKP ---(SEQ IDNO: )---A
73 82 95 103 ** 73 82
FPLNSYMNA TNHAIVQTLVHFI NPTPTVPKP ---(SEQ IDNO: )---A FPLNSYMNA TNHAIVQTL
95 103 ** 73 82 95 103
VHFI NPPTPVPKP ---(SEQ IDNO: )---A FPLNSYMNA TNHAIVQTLVHFI NPEPTPPKP ---(S
** 73 82 95 103 ** 73
EQ IDNO: )---A FPLNSYMNA TNHAIVQTLVHFI NPETPTPKP ---(SEQ IDNO: )---A FPLN
82 95 103 ** 73 82 95
SYMNA TNHAIVQTLVHFI NPETVPTPP ---(SEQ IDNO: )---A FPLNSYMNA TNHAIVQTLVHFI
103 **
NPETVPPTP ---(SEQ IDNO: )
[0205] 可以使用任一种本发明的O-联糖基化序列来进行上面的取代和插入,例如SEQ ID** **
NOs: 至 。如此获得的所有BMP-7变体都在本发明的范围内。
[0206] 在另一个示例性的实施方案中,将一个或多个O-糖基化序列,例如上文所示的那些,插入到凝血因子例如因子VII、因子VIII或因子IX多肽中。如在BMP-7的情况下所给
出,可以在用BMP-7例示的各种基序的任一种之中插入O-糖基化序列。例如,可以将O-糖
基化序列插入到野生型序列中,而不替代任何对于野生型序列而言天然的氨基酸。在示例
性的实施方案中,将O-糖基化序列插入在多肽的N-或C-末端处或者多肽的N-或C-末端
附近。在另一个示例性的实施方案中,在插入O-糖基化位点之前,除去一个或多个对于野
生型多肽序列而言天然的氨基酸残基。在另外一个示例性的实施方案中,一个或多个对于
野生型序列而言天然的氨基酸残基是O-糖基化序列的组分(例如,脯氨酸)并且O-糖基
化序列包含野生型氨基酸。野生型氨基酸可以在O-糖基化序列的任一末端或者在O-糖基
化序列的内部。
[0207] 此外,可以用本发明的O-联糖基化序列替代任何现有的N-联糖基化序列。另外,可以在与一个或多个N-联糖基化序列相邻之处插入O-联糖基化序列。在优选的实施方案
中,O-联糖基化序列的存在阻止了N-联糖基化序列的糖基化。
[0208] 在代表性的实例中,亲本多肽是因子VIII。在该实施方案中,根据上述任一基序,可以将O-联糖基化序列插入到A-、B-或C-结构域中。再次,根据上面的任一基序,可以将
超过一个O-联糖基化位点插入到单个结构域或超过一个结构域中。例如,可以将O-糖基
化位点插入到A、B和C结构域中的每一个,A和C结构域,A和B结构域,或者B和C结构
域之中。备选地,O-联糖基化序列可以在A和B结构域或者B和C结构域的侧翼。在图4
中提供了因子VIII的示例性氨基酸序列。
[0209] 在另一个示例性的实施方案中,因子VIII多肽是B-结构域缺失的(BDD)因子VIII多肽。在该实施方案中,可以将O-联糖基化序列插入到连接因子VIII异二聚体的
80Kd和90Kd亚基的肽接头中。备选地,O-联糖基化序列可以位于A结构域和接头或者C
结构域和接头的侧翼。如在上面在BMP-7的情况下所示的,可以插入O-联糖基化序列,其
中不替代现有的氨基酸,或者可以插入O-联糖基化序列,其中替代亲本多肽的一个或多个
氨基酸。在图5中提供了B-结构域缺失的(BDD)因子VIII的示例性序列。
[0210] 其他B-结构域缺失的因子VII多肽也适合用于本发明,包括例如,在Sandberg等人,Seminars in Hematology 38(2):4-12(2000)中公开的B-结构域缺失的因子VII多肽,
其公开内容通过提及而合并入本文。
[0211] 在进一步的示例性实施方案中,亲本多肽是hGH,并且根据任一上述基序来添加O-糖基化位点。
[0212] 如对于本领域技术人员而言将是明显的,包含超过一个本发明的突变型O-联糖基化序列的多肽也在本发明的范围内。可以引入额外的突变以允许调节多肽性质,例如生
物活性、代谢稳定性(例如,降低的蛋白水解)、药物代谢动力学等等。
[0213] 一旦制备了各种变体,就可以例如使用GalNAc转移酶,如GalNAc-T2,来评估它们作为O-联糖基化或糖PEG化的底物的能力。可以使用本领域已知的方法来检测和定量成
功的糖基化和/或糖PEG化,例如质谱法(例如,MALDI-TOF或Q-TOF)、凝胶电泳(例如,与
光密度分析法相组合)或色谱分析(例如,HPLC)。生物学测定法,例如酶抑制测定法、受
体结合测定法和/或基于细胞的测定法,可以用于分析给定的多肽或多肽缀合物的生物活
性。评估策略在下文中更详细地描述(参见例如,“先导多肽的鉴定”,实施例2,实施例4和
图1-3)。选择和/或开放可用于每种多肽的化学和生物学评估的合适测定法系统在本领域
技术人员的能力范围之内。多肽缀合物
[0214] 在另一个方面,本发明提供了在糖基化或非糖基化的多肽(例如,序列肽段多肽)和所选的修饰基团(例如,聚合物修饰基团)之间的共价缀合物,其中修饰基团通过糖基
连接基团(例如,完整的糖基连接基团)而缀合至多肽。糖基连接基团插入在所述多肽和
所述修饰基团之间,并且共价连接至所述多肽和所述修饰基团。糖基连接基团直接结合至
本发明的O-联糖基化序列的氨基酸残基,或者备选地,它通过一个或多个额外的糖基残
基而结合至O-联糖基化序列。用于制备本发明的缀合物的方法在本文中和在美国专利
号5,876,980;6,030,815;5,728,554;和5,922,577,以及WO 98/31826;WO2003/031464;
WO2005/070138;WO2004/99231;WO2004/10327;WO2006/074279;和美国专利申请公开
2003180835中给出,所有这些文献为了所有目的通过提及而合并入本文。
[0215] 本 发 明 的 缀 合 物 将 通 常 对 应 于 下 列 的 一 般 性 结 构:其中,
符号a、b、c、d和s代表正的非零整数;并且t为0或正整数。“修饰基团”包括治疗剂、生
物活性试剂、可检测的标记、聚合物(例如,水溶性聚合物)等等。接头可以是一大批接头
基团中的任一种(下文)。备选地,接头可以是单键。多肽的身份没有限制。
[0216] 示例性的多肽缀合物包括结合至O-联糖基化序列(例如,通过GalNAc转移酶的作用)的O-联GalNAc残基。在一个实施方案中,GalNAc自身用修饰基团衍生化并代表糖
基连接基团。在另一个实施方案中,将额外的糖基残基结合至GalNAc部分。例如,向GalNAc
基团添加Gal或Sia部分,所述部分各自可以作为糖基连接基团。在代表性的实施方案
中,O-联糖基残基是GalNAc-X*、GalNAc-Gal-X*、GalNAc-Sia-X*、GalNAc-Gal-Sia-X*或
GalNAc-Gal-Gal-Sia-X*,其中X*是修饰基团。
[0217] 多肽优选地在O-联糖基化序列处用GalNAc部分进行O-糖基化。通过使用已知向GalNAc进行添加的糖基转移酶,例如Core-1-Gal转移酶和ST6GalNAc转移酶(例如,
ST6GalNAc-1),可以将额外的糖残基添加至O-联GalNAc部分。备选地,超过一个糖部分可
以直接添加至多肽或者添加至已经存在的O-联GalNAc残基。可用于该实施方案的糖基转
移酶包括ST3Gal转移酶(例如,ST3Gal1和CST-I或CST-II)和ST8-唾液酸转移酶。这
些方法一起可以导致获得包含两个或更多糖残基的糖基结构。
[0218] 在一个实施方案中,本发明提供了多肽缀合物,其在它们的取代模式方面是高度同质的。使用本发明的方法,可能形成这样的多肽缀合物,其中在本发明的缀合物群体中
基本上所有经修饰的糖部分都附着至结构上相同的氨基酸或糖基残基。因此,在示例性的
实施方案中,本发明提供了序列肽段多肽缀合物,其包含通过糖基连接基团而共价结合至
O-联糖基化序列内的氨基酸残基(例如,丝氨酸或苏氨酸)的一个或多个水溶性聚合物部
分。在一个实例中,每个具有与之附着的糖基连接基团的氨基酸残基都具有相同的结构。在
另一个示例性的实施方案中,水溶性聚合物部分的群体的基本上每个成员都通过糖基连接
基团而结合至多肽的糖基残基,并且每个其上附着了糖基连接基团的多肽的糖基残基具有
相同的结构。
[0219] 在一个方面,本发明提供了共价缀合物,其包含具有O-联糖基化序列(例如,外源O-联糖基化序列)的序列肽段多肽,所述多肽缀合物包含根据式(V)的部分:
[0220] 在式(V)中,w是选自0和1的整数。AA-O-是衍生自O-联糖基化序列内的氨基酸的部分。通常,部分AA-O-衍生自具有羟基(OH)的氨基酸(例如,丝氨酸或苏氨酸)。在
一个实施方案中,整数q是0,并且所述氨基酸是N-末端或C-末端氨基酸。在另一个实施
方案中,q是1,并且所述氨基酸是内部氨基酸。Z*是糖基部分,其选自单糖和寡糖。Z*可
以是糖基模拟部分。
[0221] 在一个实施方案中,式(V)中的w是1,并且本发明的多肽缀合物包含至少一个修饰基团。在一个实例中,X*是修饰基团(例如,聚合物修饰基团)。在另一个实例中,X*是
共价连接至修饰基团的糖基连接基团。在示例性的实施方案中,式(V)中的X*包含唾液酸
基部分(Sia)。在另一个实施方案中,X*包含半乳糖基部分(Gal)。在另外一个实施方案
中,X*包含Sia和Gal部分的组合(例如,Gal-Sia部分)。在进一步的实施方案中,X*包
含GalNAc部分。在优选的实施方案中,X*是Sia部分。
[0222] 在示例性的实施方案中,式(V)中的Z*包含Gal部分。在另一个示例性的实施方案中,Z*包含GalNAc部分。在另外一个实施方案中,Z*包含GlcNAc部分。在进一步的
实施方案中,Z*包含Xyl、Glc或Sia部分。Z*也可以是Gal、GalNAc、GlcNAc、Sia、Xyl和
Glc部分的组合。在一个实施方案中,Z*包含GalNAc-模拟部分。在一个实施方案中,Z*
是GalNAc部分。在另一个实施方案中,Z*是GalNAc-Gal部分。在另外一个实施方案中,Z
*是GalNAc-Sia部分。在进一步的实施方案中,Z*是GalNAc-Gal-Sia部分。
[0223] 在示例性的实施方案中,共价缀合物包含具有下式的部分,其中R40是H或C1-C3未取代的烷基:
[0224] 在优选的实施方案中,上式中的R40为甲基。糖基连接基团
[0225] 当插入在多肽和修饰基团之间时,经修饰的糖的糖组分变成“糖基连接基团”。在示例性的实施方案中,从单糖或寡糖形成糖基连接基团,所述单糖或寡糖在用修饰基团进
行修饰后,是合适的糖基转移酶的底物。在另一个示例性的实施方案中,从糖基模拟部分形
成糖基连接基团。本发明的多肽缀合物可以包含单价或多价的糖基连接基团(例如,触角
结构)。因此,本发明的缀合物包含两个种类,其中所选的部分通过单价糖基连接基团而附
着至多肽。本发明还包括这样的缀合物,其中超过一个修饰基团通过多价连接基团而附着
至多肽。
[0226] 在示例性的 实施方案中,式(V)中的X*包 含根据式(VI)的部 分:
[0227] 在一个实施方案中,在式(VI)中,E是O。在另一个实施方案中,E是S。在另外一个实施方案中,E是NR27或CHR28,其中R27和R28是独立地选自H、取代或未取代的烷基、取代
或未取代的杂烷基、取代或未取代的芳基、取代或未取代的杂芳基和取代或未取代的杂环
烷基的成员。在一个实施方案中,E1是O。在另一个实施方案中,E1是S。
[0228] 在一个实施方案中,在式(VI)中,R2是H。在另一个实施方案中,R2是-R1。在另外一个实施方案中,R2是-CH2R1。在进一步的实施方案中,R2是-C(X1)R1。在这些实施方案
中,R1是OR9、SR9、NR10R11、取代或未取代的烷基或者取代或未取代的杂烷基,其中R9是选自
H、金属离子、取代或未取代的烷基、取代或未取代的杂烷基和酰基的成员。R10和R11是独立
地选自H、取代或未取代的烷基、取代或未取代的杂烷基和酰基的成员。在一个实施方案中,
X1是O。在另一个实施方案中,X1是选自取代或未取代的链烯基、S和NR8的成员,其中R8是
选自H、OH、取代或未取代的烷基和取代或未取代的杂烷基的成员。
[0229] 在一个实施方案中,在式(VI)中,Y是CH2。在另一个实施方案中,Y是CH(OH)CH2。在另外一个实施方案中,Y是CH(OH)CH(OH)CH2。在进一步的实施方案中,Y是CH。在一个
实施方案中,Y是CH(OH)CH。在另一个实施方案中,Y是CH(OH)CH(OH)CH。在另外一个实
施方案中,Y是CH(OH)。在进一步的实施方案中,Y是CH(OH)CH(OH)。在一个实施方案中,
Y是CH(OH)CH(OH)CH(OH)。Y2是选自H、OR6、R6、取代或未取代的烷基、取代或未取代的杂烷
6 7
基、 的成员,其中R 和R 是独立地选自H、
a 6b 6b a 6b a 6b a 6b
L-R 、C(O)R 、C(O)-L-R 、C(O)NH-L-R 、C(O)-L-R 、取代或未取代的烷基和取代或未取
6b
代的杂烷基的成员。R 是选自H、取代或未取代的烷基、取代或未取代的杂烷基和修饰基团
的成员。
[0230] 在式(VI)中,R3、R3’和R4是独立地选自H、OR3”、SR3”、取代或未取代的烷基、取代或a 6c a 6c a 6c a 6c a 6c未取代的杂烷基、-L-R 、-C(O)-L-R 、-NH-L-R 、=N-L-R 和-NHC(O)-L-R 、-NHC(O)
a 6c a 6c 3
NH-L-R 、-NHC(O)O-L-R 的成员,其中R”是选自H、取代或未取代的烷基和取代或未取代
6c
的杂烷基的成员。R 是选自H、取代或未取代的烷基、取代或未取代的杂烷基、取代或未取
13 14
代的芳基、取代或未取代的杂芳基、取代或未取代的杂环烷基、NR R 和修饰基团的成员,
13 14
其中R 和R 是独立地选自H、取代或未取代的烷基和取代或未取代的杂烷基的成员。
[0231] 在上面的实施方案中,每个La是独立地选自键和接头基团的成员。
[0232] 在另 一个实 施方 案中,式 (VI)中的X* 包含 根据 式(VII)的部 分:1 a 3 6c
其中,R、L、R”和R 如上文定义。在
1 9 9
一个实施方案中,在式(VII)中,R 是OR。在根据该实施方案的一个实例中,R 是H、负电
荷或金属抗衡离子。
[0233] 在 另 外 一 个 实 施 方 案 中 ,R 6b( 式 V I ) 和6c
R ( 式 VI 或 式 VII) 中 的 至 少 一 个 是 选 自 下 列 的 成 员:
其中,s、j和k是独立地选自0至20的
整数;每个n是独立地选自0至2500的整数;和m是1-5的整数。Q是选自H和C1-C6烷基
16 17 2 4
的成员。R 和R 是独立地选择的聚合物部分;X 和X 是独立地选择的连接片段(linkage
16 17 5 1 2 3 4 5 6
fragment),其将聚合物部分R 和R 连接至C。X 是非反应性基团。A、A、A、A、A、A、
7 8 9 10 11
A、A、A、A 和A 是独立地选自H、取代或未取代的烷基、取代或未取代的杂烷基、取代或未
12 13 12 12 13
取代的杂环烷基、取代或未取代的芳基、取代或未取代的杂芳基、-NA A 、-OA 和-SiA A
12 13
的成员,其中A 和A 是独立地选自取代或未取代的烷基、取代或未取代的杂烷基、取代或
未取代的杂环烷基、取代或未取代的芳基和取代或未取代的杂芳基的成员。
[0234] 在另 一个实 施方 案中,式 (VI)中的X* 包含 根据 式(III)的部 分:其中,R9是H、单个负电荷或金属抗衡离子。
a 6c p
(-L-R 在本文中也称作R)。
[0235] 在一个实施方案中,在式(VIII)中,-La-R6c是:a 6c
[0236] 在 另 一 个 实 施 方 案 中, 在 式 (VIII) 中,-L -R 是 :*
其中,用“ ”指出的立体中心可以是外消旋的或确定的。
在一个实施方案中,立体中心具有(S)构型。在另一个实施方案中,立体中心具有(R)构型。
[0237] 在 另 外 一 个 实 施 方 案 中, 在 式 (VIII) 中,-La-R6c 是:
[0238] 在 另 外 一 个 实 施 方 案 中, 在 式 (VIII),-La-R6c 是:
[0239] 在式(VIII)的上面实施方案的每一个中,r是选自1至20的整数,并且f和e是独立地选自1-5000的整数。修饰基团
[0240] 本发明的修饰基团可以是任何化学部分。示例性的修饰基团在下文讨论。可以就它们改变给定多肽的性质(例如,生物学或物理化学性质)的能力来选择修饰基团。通过
使用修饰基团可以改变的示例性多肽性质包括但不限于,药物代谢动力学、药效动力学、代
谢稳定性、生物分布、水溶性、亲脂性、组织靶向能力和治疗活性谱。优选的修饰基团是这样
的修饰基团,其改良用此类修饰基团修饰的本发明多肽缀合物的药效动力学和药物代谢动
力学。其他修饰基团可以用于修饰多肽,所述多肽可用于诊断应用或体外生物学测定法系
统。
[0241] 例如,用聚乙二醇(PEG)部分可以增强治疗性糖肽的体内半寿期。用PEG对多肽进行化学修饰(PEG化)增加它们的分子大小并且通常减小表面-和官能团-可接近性,
每种都取决于附着至多肽的PEG部分的数目和大小。通常,该修饰导致血浆半寿期和蛋
白水解稳定性的改良,以及免疫原性和肝摄取的减小(Chaffee等人J.Clin.Invest.89:
1643-1651(1992);Pyatak等人Res.Commun.Chem.PatholPharmacol.29:113-127(1980))。
例如,据报导,白细胞介素-2的PEG化增强了它的体内抗肿瘤效力(Katre等人Proc.Natl.
Acad.Sci.USA.84:1487-1491(1987)),并且源自单克隆抗体A7的F(ab’)2的PEG化具有
改良的其肿瘤定位(Kitamura等人Biochem.Biophys.Res.Commun.28:1387-1394(1990))。
因此,在另一个实施方案中,相对于非衍生化的亲本多肽的体内半寿期而言,通过本发明的
方法用PEG部分衍生化的多肽的体内半寿期得到了增加。
[0242] 多肽体内半寿期的增加可以表示为相对于亲本多肽的增加百分比范围。增加百分比范围的下端为约40%、约60%、约80%、约100%、约150%或约200%。范围的上端为约
60%、约80%、约100%、约150%或大于约250%。水溶性聚合物修饰基团
[0243] 在一个实施方案中,修饰基团是选自线性和支化的聚合物修饰基团。在一个实例中,修饰基团包含一个或多个聚合物部分,其中每个聚合物部分独立地进行选择。
[0244] 许多水溶性聚合物是本领域技术人员已知的,并且可用于实施本发明。术语“水溶性聚合物”包括下列种类:例如糖类(例如,葡聚糖、直链淀粉、透明质酸、聚(唾液酸)、
乙酰肝素类、肝素类,等等);聚(氨基酸),例如聚(天冬氨酸)和聚(谷氨酸);核酸;合
成聚合物(例如,聚(丙烯酸),聚(醚),例如聚(乙二醇);肽,蛋白质等等。本发明可以
用任何水溶性聚合物来实施,唯一的限制是所述聚合物必须包含缀合物的其余部分的附着
点。
[0245] 使用修饰基团的反应性衍生物(例如,反应性PEG类似物)将修饰基团附着至一个或多个多肽部分在本发明的范围内。本发明不受反应性类似物的身份的限制。
[0246] 在优选的实施方案中,修饰基团是PEG或PEG类似物。聚(乙二醇)的许多经活化的衍生物可以通过商业途径获得,并且描述在文献中。选择和(如果需要)合成合适
的经活化的PEG衍生物(其用于制备在本发明中可使用的底物)完全在本领域技术人员
的能力范围之内。参见,Abuchowski等人Cancer Biochem.Biophys.,7:175-186(1984);
Abuchowski等人,J.Biol.Chem.,252:3582-3586(1977);Jackson等人,Anal.Biochem.,
165:114-127(1987);Koide等 人,Biochem Biophys.Res.Commun.,111:659-667(1983),
三氟乙磺酸酯(Nilsson等人,Methods Enzymol.,104:56-69(1984);Delgado等人,
Biotechnol.Appl.Biochem.,12:119-128(1990));N-羟基琥珀酰亚胺衍生的活性酯类
(Buckmann等人,Makromol.Chem.,182:1379-1384(1981);Joppich等人,Makromol.Chem.,
180:1381-1384(1979);Abuchowski等人,Cancer Biochem.Biophys.,7:175-186(1984);
Katre等人Proc.Natl.Acad.Sci.U.S.A.,84:1487-1491(1987);Kitamura等 人,Cancer
Res.,51:4310-4315(1991);Boccu等 人,Z.Naturforsch.,38C:94-99(1983));碳 酸 酯
类(Zalipsky等人,Poly(ethylene glycol)Chemistry:Biotechnical and Biomedical
Applications,Harris,Ed.,Plenum Press,New York,1992,pp.347-370;Zalipsky 等
人,Biotechnol.Appl.Biochem.,15:100-114(1992);Veronese 等 人,Appl.Biochem.
Biotech.,11:141-152(1985));咪唑基甲酸酯类(Beauchamp等人,Anal.Biochem.,131:
25-33(1983);Berger等人,Blood,71:1641-1647(1988));4-联硫基吡啶类(Woghiren等
人,Bioconjugate Chem.,4:314-318(1993));异氰酸酯类(Byun等人,ASAIO Journal,
M649-M-653(1992))和环氧化物(美国专利号4,806,595,颁发给Noishiki等人,(1989))。
其他连接基团包括氨基和活化的PEG之间的氨基甲酸乙酯连接。参见,Veronese等人,
Appl.Biochem.Biotechnol.,11:141-152(1985)。
[0247] 用于活化聚合物的方法可以在WO 94/17039、美国专利号5,324,844、WO94/18247、WO 94/04193、美国专利号5,219,564、美国专利号5,122,614、WO 90/13540、美
国专利号5,281,698以及WO93/15189中找到,和关于经活化的聚合物和肽之间的缀合,所
述肽例如为凝固因子VIII(WO 94/15625)、血红蛋白(WO 94/09027)、载氧分子(美国专利
号4,412,989)、核糖核酸酶和超氧化物歧化酶(Veronese等人,App.Biochem.Biotech.11:
141-45(1985))。
[0248] 可用于本发明的经活化的PEG分子以及制备那些试剂的方法是本领域已知的,并且描述于例如WO04/083259中。
[0249] 适 合 于 活 化 用 于 制 备 本 文 所 示 化 合 物 的 线性 PEG 的 活 化 基 团 或 离 去 基 团 包 括 但 不 限 于 下 列 种 类:
[0250] 示例性的水溶性聚合物是这样的聚合物,其中聚合物样品中实质比例的聚合物分子具有大约相同的分子量;此类聚合物是“均匀分散的”。
[0251] 通过提及聚(乙二醇)缀合物来进一步举例说明本发明。关于PEG的官能化和缀合的一些综述和专著是可得的。参见例如,Harris,Macronol.Chem.Phys.
C25:325-373(1985);Scouten,Methods inEnzymology 135:30-65(1987);Wong 等 人,
Enzyme Microb.Technol.14:866-874(1992);Delgado 等 人,Critical Reviews in
Therapeutic DrugCarrier Systems 9:249-304(1992);Zalipsky,Bioconjugate Chem.6:
150-165(1995);和Bhadra等人,Pharmazie,57:5-29(2002)。使用反应性分子来制备反应
性PEG分子和形成缀合物的途径是本领域已知的。例如,美国专利号5,672,662公开了聚合
物酸的活性酯的水溶性且可分离的缀合物,所述聚合物酸选自线性或支化的聚(环氧烷)、
聚(氧乙基化多元醇)、聚(烯醇)和聚(丙烯酰吗啉)。
[0252] 美国专利号6,376,604提出了通过将聚合物的末端羟基与二(1-苯并三唑基)碳酸酯在有机溶剂中进行反应来制备水溶性且非肽聚合物的水溶性1-苯丙三唑基碳酸酯的
方法。将活性酯用于与生物学活性试剂例如多肽一起形成缀合物。
[0253] WO 99/45964描述了包含生物学活性试剂和经活化的水溶性聚合物的缀合物,所述聚合物包含聚合物主链,所述聚合物主链具有至少一个通过稳定的连接而连接至聚合物
主链的末端,其中至少一个末端包含分支部分,所述分支部分具有连接至该分支部分的近
侧反应性基团,其中所述生物学活性试剂连接至所述近侧反应性基团中的至少一个。其他
支化的聚(乙二醇)描述于WO 96/21469中,美国专利号5,932,462描述了用支化的PEG
分子形成的缀合物,所述支化的PEG分子包含含有反应性官能团的支化末端。游离的反应
性基团可以用于与生物学活性种类例如多肽反应,从而在聚(乙二醇)和生物学活性种类
之间形成缀合物。美国专利号5,446,090描述了双官能PEG接头以及它在形成在每个PEG
接头末端具有多肽的缀合物中的用途。
[0254] 包含可降解的PEG连接的缀合物描述于WO 99/34833;和WO 99/14259,以及美国专利号6,348,558中。此类可降解的连接可应用于本发明。
[0255] 上面给出的聚合物活化的本领域公认的方法可用于本发明的情况,从而形成本文所示的支化的聚合物,并且还可用于将这些支化的聚合物缀合至其他种类,例如糖、糖核苷
酸等等。
[0256] 示例性的水溶性聚合物是聚(乙二醇),例如甲氧基-聚(乙二醇)。用于本发明的聚(乙二醇)不限于任何具体的形式或分子量范围。对于非支化的聚(乙二醇)分子,
分子量优选为500至100,000。优选使用2000-60,000,更优选约5,000至约40,000的分
子量。
[0257] 用于本发明的示例性的聚(乙二醇)分子包括但不限于,具有下式的那些:8
其中,R 是H、OH、NH2、取代或未取代的烷基、取
代或未取代的芳基、取代或未取代的杂芳基、取代或未取代的杂环烷基、取代或未取代的杂
1
烷基,例如缩醛、OHC-、H2N-(CH2)q-、HS-(CH2)q或-(CH2)qC(Y)Z。指数“e”表示1至2500的
1
整数。指数b、d和q独立地表示0至20的整数。符号Z和Z 独立地表示OH,NH2,离去基
9 1
团,例如咪唑,对硝基苯基,HOBT,四唑,卤化物,S-R,经活化的酯的醇部分;-(CH2)pC(Y)V,
1 10 1 1
或-(CH2)pU(CH2)sC(Y)v。符号Y表示H(2)、=O、=S、=N-R 。符号X、Y、Y、A 和U独立
11 12
地表示部分O、S、N-R 。符号V表示OH、NH2、卤素、S-R 、经活化的酯的醇组分、经活化的酰
胺的胺组分、糖核苷酸和蛋白质。指数p、q、s和v是独立地选自0至20的整数的成员。符
9 10 11 12
号R、R 、R 和R 独立地表示H、取代或未取代的烷基、取代或未取代的杂烷基、取代或未
取代的芳基、取代或未取代的杂环烷基和取代或未取代的杂芳基。
[0258] 可用于形成本发明缀合物的聚(乙二醇)是线性的或支化的。适合用于本发明的支化的聚(乙二醇)分子包括但不限于,下式描述的那些:
8 8 8
其中,R 和R’是独立地选自上面对于R 所定义的基团
的成员。A1和A2是独立地选自上面对于A1所定义的基团的成员。指数e、f、o和q如上所
述。Z和Y如上所述。X1和X1’是独立地选自S、SC(O)NH、HNC(O)S、SC(O)O、O、NH、NHC(O)、
(O)CNH和NHC(O)O、OC(O)NH的成员。
[0259] 在其他示例性的实施方案中,支化的PEG基于半胱氨酸、丝氨酸或二赖氨酸核心。在另一个示例性的实施方案中,聚(乙二醇)分子选自下列的结构:
[0260] 在进一步的实施方案中,聚(乙二醇)是附着有超过一个PEG部分的支化的PEG。支化的PEG的实例描述于下列文献中:美国专利号5,932,462;美国专利号5,342,940;
美国专利号5,643,575;美国专利号5,919,455;美国专利号6,113,906;美国专利号
5,183,660;WO02/09766;Kodera Y.,Bioconjugate Chemistry 5:283-288(1994); 和
Yamasaki等人,Agric.Biol.Chem.,52:2125-2127,1998。在优选的实施方案中,支化的PEG
的每个聚(乙二醇)的分子量小于或等于40,000道尔顿。
[0261] 代表性的聚合物修饰部分包含基于含有侧链的氨基酸例如丝氨酸、半胱氨酸、赖氨酸以及小肽例如lys-lys的结构。示例性的结构包括:
[0262] 本领域技术人员将会意识到,二赖氨酸结构中的游离胺也可以通过酰胺或氨基甲酸乙酯键用PEG部分进行PEG化。
[0263] 在另外一个实施方案中,聚合物修饰部分是基于三赖氨酸肽的支化的PEG部分。该三赖氨酸可以被单-、二-、三-或四-PEG化。根据该实施方案的示例性种类具有下式:
其中,指数e、
f和f’是1至2500的独立选择的整数;和指数q、q’和q”是1至20的独立选择的整数。
[0264] 如对于本领域技术人员而言将是明显的,用于本发明的支化的聚合物包括上述专题中的变化形式。例如,上面所示的二赖氨酸-PEG缀合物可以包括三个聚合物亚单位,第
三个亚单位键合到上面结构中显示为未修饰的α-胺。类似地,使用以所希望的方式用标
记有聚合物修饰部分的3或4个聚合物亚单位进行官能化的三赖氨酸在本发明的范围内。
[0265] 可用于形成具有支化的修饰基团(其包含一个或多个聚合物部分(例如,PEG))的多肽缀合物的示例性前体具有下式:
[0266] 在一个实施方案中,根据该式的支化的聚合物种类是基本上纯的水溶性聚合物。3
X’是包含可电离的官能团(例如,OH、COOH、H2PO4、HSO3、NH2和其盐等等)或其他反应性官
5
能团(例如,下文)的部分。C是碳。X 是非反应性基团(例如,H、CH3、OH等等)。在一个
5 16 17
实施方案中,X 优选地不是聚合物部分。R 和R 独立地选自非反应性基团(例如,H、未取
2 4
代的烷基、未取代的杂烷基)和聚合物臂(例如,PEG)。X 和X 是优选在生理条件下基本
2 4
上不具有反应性的连接片段。X 和X 独立地进行选择。示例性的接头既不包含芳香族部
分也不包含酯部分。备选地,这些连接可以包含被设计成在生理学相关条件下降解的一个
2 4 16 17
或多个部分,例如酯、二硫化物,等等。X 和X 将聚合物臂R 和R 连接至C。在一个实施
3 3
方案中,当X’与接头、糖或接头-糖盒上的具有互补反应性的反应性官能团反应时,X’被
转化为连接片段的组分。
[0267] 包括X2和X4的示例性连接片段独立地进行选择,并且包括S、SC(O)NH、HNC(O)S、SC(O)O、O、NH、NHC(O)、(O)CNH和NHC(O)O、和OC(O)NH、CH2S、CH2O、CH2CH2O、CH2CH2S、(CH2)oO、(CH2)oS或(CH2)oY’-PEG,其中Y’为S、NH、NHC(O)、C(O)NH、NHC(O)O、OC(O)NH或O,和o
2 4
为1至50的整数。在示例性的实施方案中,连接片段X 和X 是不同的连接片段。
[0268] 在示例性的实施方案中,上述前体之一或其活化的衍生物与糖、活化的糖或糖核苷酸反应并从而结合至糖、活化的糖或糖核苷酸,所述反应是通
3
过X’和糖部分上的具有互补反应性的基团例如胺之间的反应来进行的。备选
3 a
地,根据下面的方案2,X’与接头L 的前体上的反应性官能团进行反应。方案
2
[0269] 在示例性的实施方案中,修饰基团衍生自天然或非天然的氨基酸、氨基酸类似物或氨基酸模拟物,或者从一种或多种这些种类形成的小肽。例如,在本发明化合物中发现的
某些支化的聚合物具有下列通式:
[0270] 在该实例中,通过支化的聚合物修饰部分的前体上的反应性官能团(例如X3’)和糖部分或接头前体上的反应性官能团之间的反应来形成连接片段C(O)La。例如,当X3’是
羧酸时,它可以被活化并直接结合至从氨基-糖(例如Sia、GalNH2、GlcNH2、ManNH2等等)
上悬挂出的胺基团,从而形成酰胺。另外的示例性的反应性官能团和活化的前体在下文描
述。所述符号具有与上面所讨论的相同的身份。
[0271] 在另一个示例性的实施方案中,La是具有下列结构的连接部分:a b 1
其中,X 和X 是独立选择的连接片段,并且L 选自键、取代或未
取代的烷基或者取代或未取代的杂烷基。
a b
[0272] X 和X 的示例性种类包括S、SC(O)NH、HNC(O)S、SC(O)O、O、NH、NHC(O)、C(O)NH和NHC(O)O、和OC(O)NH。
4 17 17
[0273] 在另一个示例性的实施方案中,X 是结合至R 的肽键,R 是氨基酸、二肽(例如,Lys-Lys)或三肽(例如,Lys-Lys-Lys),其中α-胺部分和/或侧链杂原子用聚合物修饰
部分进行修饰。
[0274] 上面给出的本发明的实施方案通过参考如下种类来进一步举例说明,在所述种类中,聚合物是水溶性聚合物,特别是聚(乙二醇)(“PEG”),例如甲氧基-聚(乙二醇)。本
领域技术人员将会意识到,下面部分中的焦点是为了清楚地举例说明,并且使用PEG作为
示例性聚合物而给出的各种基序同样可应用于其中利用除PEG之外的其他聚合物的种类。
[0275] 在本发明中使用任何分子量例如1kDa、2kDa、5kDa、10kDa、15kDa、20kDa、25kDa、30kDa、35kDa、40kDa、45kDa、50kDa、55kDa、60kDa、65kDa、70kDa、75kDa和80kDa的PEG。
[0276] 在其他示例性的实施方案中,多肽缀合物包含选自下列的部分:
[0277] 在上面的式中的每一个中,指数e和f独立地选自1至2500的整数。在进一步的示例性实施方案中,选择e和f以提供为约1kDa、2kDa、5kDa、10kDa、15kDa、20kDa、25kDa、
30kDa、35kDa、40kDa、45kDa、50kDa、55kDa、60kDa、65kDa、70kDa、75kDa和80kDa的PEG部分。
符号Q表示取代或未取代的烷基(例如,C1-C6烷基,例如甲基)、取代或未取代的杂烷基或
H。
[0278] 其他支化的聚合物具有基于二赖氨酸(Lys-Lys)肽的结构,例如:
和基于三赖氨酸肽(Lys-Lys-Lys)的结构,例如:
[0279] 在上面的图式中的每一个中,指数e、f、f’和f”表示独立地选自1至2500的整数。指数q、q’和q”表示独立地选自1至20的整数。
[0280] 在另一个示例性的实施方案中,本发明的缀合物包含为选自下列的成员的式:其中,Q是选自H和取代或未取代的C1-C6烷基的成员。指数e和f是独立地选自1至2500
的整数,和指数q是选自0至20的整数。
[0281] 在另一个示例性的实施方案中,本发明的缀合物包含为选自下列的成员的式:其中,Q是选自H和取代或未取
代的C1-C6烷基的成员,优选Me。指数e、f和f’是独立地选自1至2500的整数,以及q和
q’是独立地选自1至20的整数。
[0282] 在另一个示例性的实施方案中,本发明的缀合物包含根据下式的结构:其中,指数m和n是独立地选自0至5000的整数。指
1 2 3 4 5 6 7 8 9 10 11
数j和k是独立地选自0至20的整数。A、A、A、A、A、A、A、A、A、A 和A 是独立地选
自H、取代或未取代的烷基、取代或未取代的杂烷基、取代或未取代的芳基、取代或未取代的
12 13 12 12 13
环烷基、取代或未取代的杂环烷基、取代或未取代的杂芳基、-NA A 、-OA 和-SiA A 的成
12 13
员。A 和A 是独立地选自取代或未取代的烷基、取代或未取代的杂烷基、取代或未取代的
环烷基、取代或未取代的杂环烷基、取代或未取代的芳基和取代或未取代的杂芳基的成员。
[0283] 在根据上式的一个实施方案中,支化的聚合物具有根据下式的结构:1 2
在示例性的实施方案中,A 和A 是独立地选
自-OCH3和OH的成员。
a
[0284] 在另一个示例性的实施方案中,接头L 是选自氨基甘氨酸衍生物的成员。根据该实施方案的示例性的聚合物修饰基团具有根据下式的结构:
1 2
[0285] 在 一 个 实 例 中,A 和 A 是 独 立 地 选 自 OCH3 和 OH 的成 员。 根 据 该 实 例 的 示 例 性 的 聚 合 物 修 饰 基 团 包 括:
[0286] 在每个上面的实施方案(其中修饰基团包含立体中心,例如,包含氨基酸接头或基于甘油的接头的那些)中,立体中心可以是外消旋的或者确定的。在一个实施方案(其
中此类立体中心是确定的)中,它具有(S)构型。在另一个实施方案中,立体中心具有(R)
构型。
[0287] 本领域技术人员将会意识到,支化的聚合物的一个或多个m-PEG臂可以用具有不同末端(例如,OH、COOH、NH2、C2-C10-烷基等等)的PEG部分来代替。此外,上面的结构容易
地通过在α-碳原子和侧链的官能团之间插入烷基接头(或者除去碳原子)来进行修饰。
因此,“同型(homo)”衍生物和高级同系物,以及低级同系物在用于本发明的支化PEG的核
心的范围内。
[0288] 通过诸如在下面方案3中给出的方法可以容易地制备本文所示的支化的PEG种类:方案3:支化的PEG种类的制备
其中,Xa是O或S,并且r是1至5的整数。指数e和f是1至2500的独立选择的整数。
[0289] 因而,根据方案3,将天然或非天然的氨基酸与活化的m-PEG衍生物接触,在甲苯磺酸酯的情况中,通过使侧链杂原子Xa烷基化而形成1。使单官能化的m-PEG氨基酸与反应
性m-PEG衍生物一起经历N-酰化条件,从而装配出支化的m-PEG 2。如本领域技术人员将
会意识到的,甲苯磺酸酯离去基团可以用任何合适的离去基团例如卤素、甲磺酸酯、三氟甲
磺酸酯等来代替。类似地,用于使胺酰化的反应性碳酸酯可以用活性酯例如N-羟基琥珀酰
亚胺等来代替,或者该酸可以用脱水剂例如二环己基碳二亚胺、羰基二咪唑等在原位活化。
[0290] 在示例性的实施方案中,修饰基团是PEG部分,然而,任何修饰基团,例如水溶性聚合物、水不溶性聚合物、治疗性部分等可以通过合适的连接而掺入糖基部分中。通过酶学
方法、化学方法或其组合来形成经修饰的糖,从而产生经修饰的糖。在示例性的实施方案
中,所述糖在任何位置被活性胺取代,所述位置允许修饰部分的附着,然而仍然允许该糖用
作能够将经修饰的糖偶联至G-CSF多肽的酶的底物。在示例性的实施方案中,当半乳糖胺
为所述经修饰的糖时,胺部分附着至6-位的碳原子。水不溶性聚合物
[0291] 在另一个实施方案中,类似于上面讨论的那些,经修饰的糖包含水不溶性聚合物,而不是水溶性聚合物。本发明的缀合物也可以包含一种或多种水不溶性聚合物。本发明的
该实施方案通过使用缀合物作为载体来举例说明,使用该载体以受控的方式递送治疗性多
肽。聚合物药物递送系统是本领域已知的。参见例如,Dunn等人,Eds.Polymeric Drugs And
Drug Delivery Systems,ACS Symposium SeriesVol.469,American Chemical Society,
Washington,D.C.1991。本领域技术人员将会意识到,实质上任何已知的药物递送系统均可
应用于本发明的缀合物。
[0292] 代表性的水不溶性聚合物包括但不限于,聚膦嗪、聚(乙烯醇)、聚酰胺、聚碳酸酯、聚亚烷基(polyalkylenes)、聚丙烯酰胺、聚亚烷基二醇、聚环氧烷、聚亚烷基对苯二
甲酸酯、聚乙烯醚、聚乙烯酯、聚卤乙烯、聚乙烯吡咯烷酮、聚乙交酯、聚硅氧烷、聚氨酯、聚
(甲基丙烯酸甲酯)、聚(甲基丙烯酸乙酯)、聚(甲基丙烯酸丁酯)、聚(甲基丙烯酸异丁
酯)、聚(甲基丙烯酸己酯)、聚(甲基丙烯酸异癸酯)、聚(甲基丙烯酸月桂酯)、聚(甲基
丙烯酸苯酯)、聚(丙烯酸甲酯)、聚(丙烯酸异丙酯)、聚(丙烯酸异丁酯)、聚(丙烯酸
十八烷基酯)、聚乙烯、聚丙烯、聚(乙二醇)、聚(环氧乙烷)、聚(对苯二甲酸乙二醇酯)、
聚(乙酸乙烯酯)、聚氯乙烯、聚苯乙烯、聚乙烯吡咯烷酮、普流罗尼克类(pluronics)和聚
乙烯基苯酚以及其共聚物。
[0293] 用于本发明缀合物的经合成修饰的天然聚合物包括但不限于,烷基纤维素、羟烷基纤维素、纤维素醚、纤维素酯和硝酸纤维素。广泛类别的经合成修饰的天然聚合物中特别
优选的成员包括但不限于,甲基纤维素、乙基纤维素、羟丙基纤维素、羟丙基甲基纤维素、羟
丁基甲基纤维素、乙酸纤维素、丙酸纤维素、乙酸丁酸纤维素、乙酸邻苯二甲酸纤维素、羧甲
基纤维素、三乙酸纤维素、硫酸纤维素钠盐以及丙烯酸和甲基丙烯酸酯与藻酸的聚合物。
[0294] 本文讨论的这些和其他聚合物可以容易地从商业来源例如Sigma ChemicalCo.(St.Louis,MO.)、Polysciences(Warrenton,PA.)、Aldrich(Milwaukee,WI.)、
Fluka(Ronkonkoma,NY)和BioRad(Richmond,CA)获得,或者使用标准技术从获自这些供应
商的单体来合成。
[0295] 用于本发明缀合物的代表性的生物可降解聚合物包括但不限于,聚丙交酯、聚乙交酯及其共聚物、聚(对苯二甲酸乙二醇酯)、聚(丁酸)、聚(戊酸)、聚(丙交酯-共-己
内酯)、聚(丙交酯-共-乙交酯)、聚酐、聚原酸酯、其共混物和共聚物。特别有用的是形
成凝胶的组合物,例如包含胶原、普流罗尼克类等的那些。
[0296] 用于本发明的聚合物包括“杂合”聚合物,其包含在它们的结构的至少一部分内具有生物可吸收分子的水不溶性物质。此类聚合物的实例是包含水不溶性共聚物的聚合物,
所述共聚物的每条聚合物链具有生物可吸收区域、亲水性区域和多个可交联官能团。
[0297] 对于本发明的目的,“水不溶性物质”包括基本上不溶于水或含水环境的物质。因此,尽管共聚物的某些区域或链段可以是亲水性的或者甚至水溶性的,但是聚合物分子
(作为整体)在水中没有任何显著程度的溶解。
[0298] 对于本发明的目的,术语“生物可吸收分子”包含能够由身体进行代谢或分解和吸收和/或通过正常排泄途径消除的区域。此类代谢物或分解产物优选地对身体是基本上无
毒的。
[0299] 生物可吸收区域可以是疏水性的或亲水性的,只要该共聚物组合物作为整体不变得水溶性。因此,基于聚合物作为整体保持水不溶性的优先情况来选择生物可吸收区域。因
此,选择生物可吸收区域和亲水性区域的相对性质,即生物可吸收区域和亲水性区域所包
含的官能团的种类,以及生物可吸收区域和亲水性区域的相对比例,以确保可用的生物可
吸收组合物保持水不溶性。
[0300] 示例性的可吸收的聚合物包括,例如合成产生的聚(α-羟基-羧酸)/聚氧化烯的可吸收的嵌段共聚物(参见,Cohn等人,美国专利号4,826,945)。这些共聚物不是交联
的并且是水溶性的,从而使得身体可以排泄出经降解的嵌段共聚物组合物。参见Younes
等人,JBiomed.Mater.Res.21:1301-1316(1987);和Cohn等人,J Biomed.Mater.Res.22:
993-1009(1988)。
[0301] 目前优选的生物可吸收聚合物包括选自下列的一种或多种组分:聚酯、聚羟基酸、聚内酯、聚酰胺、聚(酯-酰胺)、聚氨基酸、聚酐、聚原酸酯、聚碳酸酯、聚膦嗪、聚磷酸酯、聚硫酯、多糖及其混合物。更优选地,生物可吸收聚合物包括聚羟基酸组分。在聚羟基酸中,
优选聚乳酸、聚乙醇酸、聚己酸、聚丁酸、聚戊酸以及其共聚物和混合物。
[0302] 除了形成在体内被吸收(“生物吸收”)的片段外,用于本发明方法的优选的聚合物包衣也可以形成可排泄和/或可代谢的片段。
[0303] 本发明中还可以使用高级共聚物。例如,Casey等人,美国专利号4,438,253(于1984年3月20日颁发)公开了从聚(乙醇酸)和具有羟基末端的聚(亚烷基二醇)的酯
交换产生的三嵌段共聚物。此类组合物被公开用作可吸收的单丝缝合线。通过向共聚物结
构中掺入芳香族原碳酸酯,例如原碳酸四对甲苯酯来控制此类组合物的柔韧性。
[0304] 也可以利用其他基于乳酸和/或乙醇酸的聚合物。例如,Spinu,美国专利号5,202,413(于1993年4月13日颁发)公开了生物可降解多嵌段共聚物,其具有顺序排列
的聚丙交酯和/或聚乙交酯嵌段,通过丙交酯和/或乙交酯开环聚合至低聚二醇或二胺残
基上,接着用双官能化合物例如二异氰酸酯、二酰氯或二氯硅烷进行链延伸来产生。
[0305] 可用于本发明的包衣的生物可吸收区域可以被设计成可水解和/或可酶促切割的。对于本发明的目的,“可水解切割的”是指共聚物,尤其是生物可吸收区域在水或含水环
境中对于水解的易感性。类似地,如本文所使用的,“可酶促切割的”是指共聚物,尤其是生
物可吸收区域对于内源或外源酶切割的易感性。
[0306] 当置于身体中时,亲水性区域可以被加工成可排泄和/或可代谢的片段。因此,亲水性区域可以包括,例如聚醚、聚环氧烷、多元醇、聚乙烯吡咯烷酮、聚乙烯醇、聚烷基噁唑
啉、多糖、碳水化合物、肽、蛋白质以及其共聚物和混合物。此外,亲水性区域还可以是例如
聚环氧烷。此类聚环氧烷可以包括,例如聚环氧乙烷、聚环氧丙烷以及其混合物和共聚物。
[0307] 作为水凝胶的组分的聚合物也可以用于本发明。水凝胶是能够吸收相对大量的水的聚合物材料。形成水凝胶的化合物的实例包括但不限于,聚丙烯酸、羧甲基纤维素钠、聚
乙烯醇、聚乙烯吡咯烷、明胶、角叉菜聚糖和其他多糖、羟基亚乙基甲基丙烯酸(HEMA)以及
其衍生物,等等。可以产生稳定的、生物可降解的和生物可吸收的水凝胶。此外,水凝胶组
合物可以包括显示出一种或多种这些性质的亚单位。
[0308] 其完整性可以通过交联来进行控制的生物相容的水凝胶组合物是已知的,并且目前优选用于本发明的方法中。例如,Hubbell等人,美国专利号5,410,016(于1995年4月
25日颁发)和5,529,914(于1996年6月25日颁发)公开了水溶性系统,其是交联的嵌段
共聚物,该共聚物具有夹在两个水解不稳定的延长部分之间的水溶性中心嵌段链段。此类
共聚物进一步用可光聚合的丙烯酸酯官能度进行封端。当交联时,这些系统变成水凝胶。此
类共聚物的水溶性中心嵌段包含聚(乙二醇);而水解不稳定的延长部分可以是聚(α-羟
基酸),例如聚乙醇酸或聚乳酸。参见Sawhney等人,Macromolecules 26:581-587(1993)。
[0309] 在另一个实施方案中,所述凝胶是热致可逆的凝胶。包含诸如下列组分的热致可逆的凝胶目前是优选的:普流罗尼克类、胶原、明胶、透明质酸、多糖、聚氨酯水凝胶、聚氨
酯-脲水凝胶及其组合。
[0310] 在另外一个示例性的实施方案中,本发明的缀合物包含脂质体的组分。可以根据本领域技术人员已知的方法(例如,在Eppstein等人,美国专利号4,522,811(于1985年6
月11日颁发)所描述的)来制备脂质体。例如,可以通过下列方式来制备脂质体制剂:将
合适的脂质(例如,硬脂酰磷脂酰乙醇胺、硬脂酰磷脂酰胆碱、花生酰(arachadoyl)磷脂酰
胆碱和胆固醇)溶解在无机溶剂中,然后蒸发所述无机溶剂,从而在容器表面上留下干燥
脂质的薄膜。然后向容器中引入活性化合物或其可药用盐的水溶液。然后用手旋动容器以
从容器侧面释放脂质物质并分散脂质聚集体,从而形成脂质体悬浮液。
[0311] 为了举例而提供上述微粒和制备微粒的方法,并且它们并不意在限定用于本发明的微粒的范围。对于本领域技术人员而言明显的是,通过不同方法制造的一大批微粒可用
于本发明。
[0312] 上面在直连和支化的水溶性聚合物情况下所讨论的结构形式一般也可应用于水不溶性聚合物。因此,例如,半胱氨酸、丝氨酸、二赖氨酸和三赖氨酸分枝核心可以用两个水
不溶性聚合物部分来官能化。用于产生这些种类的方法一般与用于产生水溶性聚合物的那
些方法非常相似。其他修饰基团
[0313] 本发明还提供了类似于上面所讨论的那些的缀合物,其中多肽通过糖基连接基团而缀合至治疗性部分、诊断性部分、靶向性部分、毒素部分等等。上述部分中的每一种可以
是小分子、天然聚合物(例如,多肽)或合成聚合物。
[0314] 在进一步的实施方案中,本发明提供了这样的缀合物,其由于存在作为该缀合物的组分的靶向性试剂而选择性地定位于特定组织中。在示例性的实施方案中,所述靶向性
试剂是蛋白质。示例性的蛋白质包括转铁蛋白(脑、血池),HS-糖蛋白(骨、脑、血池),
抗体(脑、具有抗体特异性抗原的组织、血池),凝血因子V-XII(受损的组织、血块、癌症、
血池),血清蛋白,例如α-酸性糖蛋白,胎球蛋白,α-胎儿蛋白(脑、血池),β2-糖蛋白
(肝脏、动脉粥样硬化斑、脑、血池),G-CSF,GM-CSF,M-CSF和EPO(免疫刺激、癌症、血池、红
细胞过量产生、神经保护),白蛋白(半寿期增加),IL-2和IFN-α。
[0315] 在示例性的靶向缀合物中,将干扰素-α2β(IFN-α2β)通过双官能接头缀合至转铁蛋白,所述双官能接头在PEG部分的每个末端包含糖基连接基团(方案1)。例如,PEG
接头的一个末端用附着至转铁蛋白的完整唾液酸接头进行官能化,和另一末端用附着至
IFN-α2β的完整C-联Man接头进行官能化。生物分子
[0316] 在另一个实施方案中,经修饰的糖携带有生物分子。在进一步的实施方案中,生物分子是功能性蛋白质、酶、抗原、抗体、肽、核酸(例如,单核苷酸或核苷、寡核苷酸、多核苷
酸以及单链或更高链的核酸)、凝集素、受体或其组合。
[0317] 优选的生物分子是基本上不发荧光的,或者发出如此少量的荧光从而使得它们不适合在测定法中用作荧光标记物。此外,通常优选使用不是糖类的生物分子。该优选情况
的一个例外是使用通过共价附着另一实体(例如,PEG、生物分子、治疗性部分、诊断性部分
等)而进行修饰的天然存在的糖。在示例性的实施方案中,通过本发明的方法将糖部分(其
是生物分子)缀合至接头臂并随后将该糖-接头臂盒缀合至多肽。
[0318] 可用于实施本发明的生物分子可以来自任何来源。生物分子可以分离自天然来源或者它们可以通过合成方法来产生。多肽可以是天然多肽或突变的多肽。可以通过化学诱
变、位点定向诱变或者其他本领域技术人员已知的诱导突变的方法来实现突变。可用于实
施本发明的多肽包括,例如酶、抗原、抗体和受体。抗体可以是多克隆的或单克隆的;完整的
或者片段。多肽可以任选是定向进化程序的产物。
[0319] 天然来源的和合成的多肽和核酸可用于本发明;这些分子可以通过任何可利用的反应性基团而附着至糖残基组分或者交联剂。例如,多肽可以通过反应性胺、羧基、巯基或
羟基来进行附着。反应性基团可以位于多肽末端或者多肽链的内部位点。核酸可以通过碱
基上的反应性基团(例如,环外胺)或者糖部分上的可利用的羟基(例如,3’-或5’-羟
基)来进行附着。肽和核酸链可以在一个或多个位点处进一步衍生化以允许合适的反应性
基团附着至链上。参见Chrisey等人Nucleic Acids Res.24:3031-3039(1996)。
[0320] 在进一步的实施方案中,选择生物分子以将通过本发明方法进行修饰的多肽导向特定组织,从而相对于递送到该组织的未衍生化的多肽的量而言增强该多肽向该组织的递
送。在更进一步的实施方案中,在所选时间段内递送到特定组织的经衍生化的多肽的量通
过衍生化而增加至少约20%,更优选至少约40%,和更加优选至少约100%。目前,用于靶
向应用的优选生物分子包括抗体、激素和细胞表面受体的配体。
[0321] 在更加进一步的示例性实施方案中,提供了具有生物素的缀合物。因此,例如,通过附着携带有一个或多个修饰基团的抗生物素蛋白或链霉抗生物素蛋白部分来制作选择
性生物素化的多肽。治疗性部分
[0322] 在另一个实施方案中,经修饰的糖包含治疗性部分。本领域技术人员将会意识到,在治疗性部分和生物分子类别之间存在重叠;许多生物分子具有治疗性质或潜力。
[0323] 治疗性部分可以是已经被接受用于临床使用的试剂,或者它们可以是这样的药物,所述药物的使用是试验性的或者所述药物的活性或作用机制还在研究中。治疗性部分
可以在给定疾病状态中具有经证明的作用,或者可以仅仅假设在给定疾病状态中显示出所
希望的作用。在另一个实施方案中,治疗性部分是化合物,所述化合物正在就其与所选组织
相互作用的能力而进行筛选。可用于实施本发明的治疗性部分包括来自具有各种药理学活
性的宽范围药物类别的药物。优选的治疗性部分是基本上不发荧光的,或者发出如此少量
的荧光从而使得它们不适合在测定法中用作荧光标记物。此外,一般优选使用不是糖的治
疗性部分。该优选情况的一个例外是使用通过共价附着另一实体(例如PEG、生物分子、治
疗性部分、诊断性部分等)而进行修饰的糖。在另一个示例性的实施方案中,通过本发明的
方法将治疗性糖部分缀合至接头臂并随后将该糖-接头臂盒缀合至多肽。
[0324] 用于将治疗剂和诊断剂缀合至各种其他种类的方法是本领域技术人员公知的。参见例如,Hermanson,BIOCONJUGATETECHNIQUES,Academic Press,San Diego,1996;和Dunn等人,Eds.POLYMERIC DRUGS AND DRUG DELIVERY SYSTEMS,ACS SymposiumSeries Vol.469,American Chemical Society,Washington,D.C.1991。
[0325] 在示例性的实施方案中,治疗性部分通过在所选条件下被切割的连接而附着至经修饰的糖。示例性的条件包括但不限于,所选的pH(例如,胃、肠、胞吞液泡)、活性酶的存
在(例如,酯酶、还原酶、氧化酶)、光、热等等。许多可切割的基团是本领域已知的。参见
例如,Jung等人,Biochem.Biophys.Acta,761:152-162(1983);Joshi等人,J.Biol.Chem.,
265:14518-14525(1990);Zarling等人,J.Immunol.,124:913-920(1980);Bouizar等人,
Eur.J.Biochem.,155:141-147(1986);Park 等 人,J.Biol.Chem.,261:205-210(1986);
Browning等人,J.Immunol.,143:1859-1867(1989)。
[0326] 可用的治疗性部分的类别包括,例如非类固醇抗炎药物(NSAIDS)。NSAIDS可以例如选自下面的类别:(例如,丙酸衍生物、乙酸衍生物、灭酸衍生物、联苯羧酸衍生物和昔康
类);类固醇抗炎药物,包括氢化可的松等等;抗组胺药(例如,氯苯那敏、曲普利啶);止咳
药(例如,右美沙芬、可待因、卡拉美芬和喷托维林);止痒药(例如,甲地嗪和阿利马嗪);
抗胆碱能药(例如,东莨菪碱、阿托品、后马托品、左旋多巴);止吐药和止恶心药(例如,赛
克力嗪、美克洛嗪、氯丙嗪、布克力嗪);减食欲药(例如,苄非他明、芬特明、对氯苯丁胺、芬
氟拉明);中枢兴奋药(例如,苯丙胺、去氧麻黄碱、右苯丙胺和哌甲酯);抗心律不齐药(例
如,普萘洛尔、普鲁卡因胺、丙吡胺、奎尼丁、恩卡尼);β-肾上腺素能阻断药(例如,美托洛
尔、醋丁洛尔、倍他洛尔、拉贝洛尔和噻吗洛尔);强心药(例如,米力农、氨力农和多巴酚丁
胺);抗高血压药(例如,依那普利、可乐定、肼屈嗪、米诺地尔、胍那决尔、胍乙啶);利尿药
(例如,阿米洛利和氢氯噻嗪);血管舒张药(例如,地尔硫 胺碘酮、异克舒令、布酚宁、
妥拉唑林和维拉帕米);血管收缩药(例如,双氢麦角胺、麦角胺和二甲麦角新碱);抗溃疡
药(例如,雷尼替丁和西咪替丁);麻醉药(例如,利多卡因、布比卡因、氯普鲁卡因、地布卡
因);抗抑郁药(例如,丙咪嗪、地昔帕明、阿米替林、去甲替林);安定药和镇静药(例如,氯
氮 贝那替秦、苯喹胺、氟西泮、羟嗪、洛沙平和丙嗪);抗精神病药(例如,氯普噻吨、氟
奋乃静、氟哌啶醇、吗茚酮、硫利达嗪和三氟拉嗪);抗微生物药(抗细菌、抗真菌、抗原生动
物和抗病毒药物)。
[0327] 优选掺入本组合物的抗微生物药物包括,例如下列药物的可药用盐:β-内酰胺类药物、喹诺酮类药物、环丙沙星、诺氟沙星、四环素、红霉素、阿米卡星、三氯生、多西环素、卷曲霉素、氯己定、金霉素、土霉素、克林霉素、乙胺丁醇、异硫羰酸己脒定、甲硝唑、喷他脒、庆大霉素、卡那霉素、林可霉素(lineomycin)、甲烯土霉素、乌洛托品、米诺环素、新霉素、乙
基西梭霉素、巴龙霉素、链霉素、妥布霉素、咪康唑和金刚烷胺。
[0328] 用于实施本发明的其他药物部分包括抗肿瘤药(例如,抗雄激素药(例如,亮丙立德或氟他胺)、杀细胞剂(例如,阿霉素、多柔比星、紫杉醇、环磷酰胺、白消安、顺铂、
β-2-干扰素)、抗雌激素药(例如,他莫昔芬)、抗代谢物(例如,氟尿嘧啶、氨甲蝶呤、巯基
嘌呤、硫代鸟嘌呤)。该类别中还包括用于诊断和治疗的基于放射性同位素的试剂,和缀合
的毒素,例如蓖麻毒蛋白、格尔德霉素、美登素、CC-1065、倍癌霉素、刺孢霉素及其相关的结
构和类似物。
[0329] 治疗性部分也可以是激素(例如,甲羟孕酮、雌二醇、亮丙立德、甲地孕酮、奥曲肽或促生长素抑制素);肌肉松弛药(例如,桂美君、环苯扎林、黄酮哌酯、奥芬那君、罂粟碱、
美贝维林、异达维林、利托君、地芬诺酯、丹曲林和阿珠莫林);解痉药;骨活性药物(例如,
二膦酸盐和膦酰基烷基次膦酸盐药物化合物);内分泌调节药物(例如,避孕药(例如,炔
诺醇、炔雌醇、炔诺酮、美雌醇、去氧孕烯、甲羟孕酮)、糖尿病调节剂(例如,格列本脲或氯
磺丙脲)、同化激素类药(例如,睾内酯或司坦唑醇)、雄激素类(例如,甲睾酮、睾酮或氟甲
睾酮)、抗利尿药(例如,去氨加压素)和降钙素)。
[0330] 也可以用于本发明的是雌激素类(例如,己烯雌酚)、糖皮质激素类(例如,曲安西龙、倍他米松,等等)和孕激素类(例如,炔诺酮、炔诺醇、炔诺酮、左炔诺孕酮);甲状腺
剂(例如,碘塞罗宁或左甲状腺素)或抗甲状腺剂(例如,甲巯咪唑);抗高催乳素血症药
物(例如,卡麦角林);激素抑制剂(例如,达那唑或戈舍瑞林),催产药(例如,甲麦角新碱
或催产素)和前列腺素类(例如,米索前列醇、前列地尔或地诺前列酮)。
[0331] 其他有用的修饰基团包括免疫调节药物(例如,抗组织胺药,肥大细胞稳定剂,例如洛度沙胺和/或色甘酸钠(cromolyn),类固醇(例如,曲安西龙、beclomethazone、可的
松、地塞米松、泼尼松龙、甲泼尼龙、丙酸倍氯米松(beclomethasone)或氯倍他索),组胺H2
拮抗剂(例如,法莫替丁、西咪替丁、雷尼替丁),免疫抑制剂(例如,硫唑嘌呤、环孢菌素),
等等。还可以使用具有抗炎活性的基团,如舒林酸、依托度酸、酮洛芬和酮咯酸。用于本发
明的其他药物对于本领域技术人员而言将是明显的。经修饰的糖
[0332] 经修饰的糖基供体种类(“经修饰的糖”)优选选自经修饰的糖核苷酸、活化的经修饰的糖和为简单糖(其既不是核苷酸也没有被活化)的经修饰的糖。使用本发明的方法
可以向多肽添加任何所希望的碳水化合物或非碳水化合物结构。通常,该结构将是单糖,但
是本发明不限于使用经修饰的单糖糖类;也可以使用寡糖、多糖和糖基模拟部分。
[0333] 通过酶促方法、化学方法或其组合将修饰基团附着至糖部分,从而产生经修饰的糖。所述糖在任何位置被取代,所述位置允许连接修饰基团,而其仍然允许所述糖用作用于
将经修饰的糖连接至多肽的酶的底物。在示例性的实施方案中,当唾液酸为所述糖时,唾液
酸在丙酮酰基(pyruvyl)侧链或者在胺部分上的5-位(其在唾液酸中通常被乙酰化)用
修饰基团取代。糖核苷酸
[0334] 在本发明的某些实施方案中,经修饰的糖核苷酸用于向多糖添加经修饰的糖。以它们的修饰形式在本发明中使用的示例性的糖核苷酸包括核苷酸一磷酸、二磷酸或三磷酸
或其类似物。在优选的实施方案中,经修饰的糖核苷酸选自UDP-糖苷、CMP-糖苷和GDP糖
苷。更加优选地,经修饰的糖核苷酸选自UDP-半乳糖、UDP-半乳糖胺、UDP-葡萄糖、UDP-葡
糖胺、GDP-甘露糖、GDP-岩藻糖、CMP-唾液酸和CMP-NeuAc。糖核苷酸的N-乙酰基胺衍生
物也可用于本发明的方法中。
[0335] 在一个实例中,用水溶性聚合物修饰核苷酸糖种类。示例性的经修饰的糖核苷酸携带有通过糖上的胺部分进行修饰的糖基团。经修饰的糖核苷酸,例如,糖核苷酸的糖
基-胺衍生物也可用于本发明的方法。例如,糖基胺(没有修饰基团)可以酶促缀合至多
肽(或者其他种类),并且游离的糖基胺部分随后缀合至所希望的修饰基团。备选地,经修
饰的糖核苷酸可以用作酶的底物,所述酶将经修饰的糖转移至多肽上的糖基接纳体。
[0336] 在示例性的实施方案中,经修饰的糖基于6-氨基-N-乙酰基-糖基部分。如下面方案4中对于N-乙酰半乳糖胺所显示的,可以使用标准方法而容易地制备经修饰的糖核苷
酸。方案4:示例性经修饰的糖核苷酸的制备
[0337] 在上面的方案4中,指数n表示0至2500,优选10至1500,和更优选10至1200的整数。符号“A”表示活化基团,例如卤代、活化的酯(例如,N-羟基琥珀酰亚胺酯)的组
分、碳酸酯(例如,碳酸对硝基苯酯)的组分等等。本领域技术人员将会意识到,通过该方
法和类似方法可以容易地制备其他PEG-酰胺核苷酸糖。
[0338] 在其他示例性的实施方案中,用诸如氨基甲酸乙酯或脲的基团替代所述酰胺部分。
[0339] 在进一步的实施方案中,R1是支化的PEG,例如上面给出的那些种类之一。根据该实施方案的举例说明性化合物包括:
4
其中,X 为键或者O,和J为S或O。
[0340] 此外,如上文所讨论的,本发明提供了这样的多肽缀合物,其用核苷酸糖形成,所述核苷酸糖用直链或支化的水溶性聚合物进行修饰。例如,具有下面所示的式的化合物在
本发明的范围内:
4
其中,X 是O或键,和J是S或O。
[0341] 类似地,本发 明提供 了这样 的多肽 缀合 物,其用 那些经 修饰 的糖种类 的核苷 酸糖形 成,在所 述经修 饰的糖 种类 中6-位的碳 被修饰:
4
其中,X 是键或
O,J是S或O,和y是0或1。
[0342] 还提供了具有下式的多肽和糖肽缀合物:其中,J是S
或O。活化的糖
[0343] 在其他实施方案中,经修饰的糖是活化的糖。可用于本发明的经活化的、经修饰的糖通常是被合成改变以包含离去基团的糖苷。在一个实例中,在酶促反应中使用活化的糖
以将活化的糖转移到多肽或糖肽上的接纳体上。在另一个实例中,通过化学方法将活化的
糖添加至多肽或糖肽。“离去基团”(或活化基团)指那些部分,其在酶调节的亲核取代反
应中容易被置换,或者备选地,在利用亲核反应参与物(例如,携带巯基的糖基部分)的化
学反应中被替代。为每种类型的反应选择合适的离去基团在技术人员的能力范围之内。许
多活化的糖是本领域已知的。参见例如,Voeadlo等人,CARBOHYDRATECHEMISTRY AND BIOLOGY,Vol.2,Ernst等人Ed.,Wiley-VCH Verlag:Weinheim,Germany,2000;Kodama等人,Tetrahedron
Lett.34:6419(1993);Lougheed等人,J.Biol.Chem.274:37717(1999)。
[0344] 离去基团的实例包括卤素(例如,氟、氯、溴)、甲苯磺酸酯、甲磺酸酯、三氟甲磺酸酯,等等。用于在酶介导的反应中使用的优选的离去基团是在立体上不显著阻碍糖苷向接
纳体的酶促转移的那些离去基团。因此,活化的糖苷衍生物的优选实施方案包括糖基氟和
糖基甲磺酸酯,糖基氟是特别优选的。在糖基氟中,最优选的是α-半乳糖基氟、α-甘露糖
基氟、α-葡糖基氟、α-岩藻糖基氟、α-木糖基氟、α-唾液酸基氟、α-N-乙酰葡糖胺基
氟、α-N-乙酰半乳糖胺基氟、β-半乳糖基氟、β-甘露糖基氟、β-葡糖基氟、β-岩藻糖
基氟、β-木糖基氟、β-唾液酸基氟、β-N-乙酰葡糖胺基氟和β-N-乙酰半乳糖胺基氟。
对于非酶促的亲核取代,可以使用这些和其他离去基团。例如,活化的供体糖苷可以是二硝
基苯基(DNP)或溴代-糖苷。
[0345] 作为举例说明,可以通过下列方式来从游离糖制备糖基氟:首先乙酰化,然后用HF/吡啶处理所述糖部分。这产生受保护的(乙酰化的)糖基氟的热力学上最稳定的端基
异构体(即,α-糖基氟)。如果希望较不稳定的端基异构体(即,β-糖基氟),那么可以
通过下列方式来制备:用HBr/HOAc或用HCl来转化过乙酰化的糖从而产生端基异构的溴化
物或氯化物。该中间体与氟化物盐例如氟化银反应,从而产生糖基氟。乙酰化的糖基氟可
以通过与在甲醇中的温和的(催化性的)碱(例如,NaOMe/MeOH)反应来去保护。此外,许
多糖基氟可以通过商业途径获得。
[0346] 使用本领域技术人员已知的常规方法可以制备其他活化的糖基衍生物。例如,可以通过下列方式来制备糖基甲磺酸酯:用甲磺酰氯处理糖的完全苄基化的半缩醛形式,随
后催化氢化以除去苄基。
[0347] 在进一步的示例性实施方案中,经修饰的糖是具有触角结构的寡糖。在另一个实施方案中,所述触角的一个或多个末端携带有修饰部分。当超过一个的修饰部分附着至具
有触角结构的寡糖时,该寡糖可用于“扩增”修饰部分;每个缀合至多肽的寡糖单位将多个
拷贝的修饰基团附着至多肽。在上面的图式中所示的本发明典型缀合物的一般结构包括多
价种类,其是由于利用触角结构来制备本发明的缀合物而产生的。许多触角糖结构是本领
域已知的,并且可以用它们来实施本方法,而没有限制。经修饰的糖的制备
[0348] 一般地,通过使用反应性官能团在糖部分和修饰基团之间形成共价键,所述反应性官能团通常通过连接过程而被转化成新的有机官能团或者非反应性种类。为了形成该
键,修饰基团和糖部分携带互补的反应性官能团。反应性官能团可以位于糖部分上的任何
位置。
[0349] 可用于实施本发明的反应性基团和反应类别一般地是生物缀合物化学领域中公知的那些。用反应性糖部分可得的目前有利的反应类别是在相对温和的条件下进行的那
些。这些反应包括但不限于亲核取代(例如,胺和醇与酰卤、活性酯的反应)、亲电取代(例
如,烯胺反应)和与碳-碳和碳-杂原子多重键加成(例如,迈克尔反应、第尔斯-阿尔德
加成)。这些和其他有用的反应在下列文献中讨论:例如March,ADVANCED ORGANIC CHEMISTRY,第3版,John Wiley &Sons,New York,1985;Hermanson,BIOCONJUGATE TECHNIQUES,Academic Press,San Diego,1996;和Feeney等人,MODIFICATION OFPROTEINS;Advances in Chemistry Series,Vol.198,AmericanChemical Society,Washington,D.C.,1982。反应性官能团
[0350] 从糖核心或修饰基团上悬挂出的可用的反应性官能团包括,但不限于:(a)羧基和其各种衍生物,包括但不限于,N-羟基琥珀酰亚胺酯、N-羟基苯并三唑酯、酰基卤、酰基
咪唑类、硫酯、对硝基苯酯、烷基、链烯基、炔基和芳香族酯;(b)羟基,其可以被转化成例如
酯、醚、醛等等;(c)卤代烷基,其中该卤化物可以以后用亲核基团例如胺、羧酸根阴离子、
硫羟基阴离子、碳负离子或醇盐离子置换,从而导致在该卤素原子的官能团处共价附着新
的基团;(d)亲二烯基团,其能够参与第尔斯-阿尔德反应,例如马来酰亚氨基;(e)醛和酮
基团,从而可能通过形成羰基衍生物例如亚胺、腙、缩氨基脲或肟,或者通过诸如格利雅加
成或烷基锂加成的机制来进行随后的衍生化;(f)磺酰卤基团,其用于随后与例如胺反应
从而形成磺酰胺;(g)硫羟基,其可以例如转化为二硫化物或者与酰卤反应;(h)胺或巯基,
其可以例如被酰化、烷基化或氧化;(i)链烯烃,其可以经历例如环加成、酰化、迈克尔加
成,等等;和(j)环氧化物,其可以例如与胺和羟基化合物反应。
[0351] 可以如此选择反应性官能团,从而它们不参与或者干扰对于装配反应性糖核心或者修饰基团而言所必需的反应。备选地,可以在保护基存在下保护反应性官能团免于参与
所述反应。本领域技术人员了解如何保护具体的官能团,从而使得它不干扰所选的一组反
应条件。可用的保护基的实例参见例如,Greene等人,PROTECTIVEGROUPS IN ORGANIC SYNTHESIS,John Wiley & Sons,New York,1991。交联基团
[0352] 用于本发明方法的经修饰的糖的制备包括将修饰基团附着至糖残基并形成稳定的加合物,其是糖基转移酶的底物。糖和修饰基团可以通过零级或高级交联剂进行偶联。
可以用于将修饰基团附着至碳水化合物部分的示例性双官能化合物包括,但不限于,双官
能聚(乙二醇)、聚酰胺、聚醚、聚酯等等。用于将碳水化合物连接至其他分子的一般方法
是本领域已知的。参见例如,Lee等人,Biochemistry 28:1856(1989);Bhatia等人,Anal.
Biochem.178:408(1989);Janda等人,J.Am.Chem.Soc.112:8886(1990);和Bednarski等
人,WO 92/18135。在下面的讨论中,将反应性基团对待为在新生经修饰的糖的糖部分上是
良性的。讨论的焦点是为了清楚地举例说明。本领域技术人员将会意识到,该讨论也与修
饰基团上的反应性基团相关。
[0353] 使用各种试剂,以分子内化学交联来修饰经修饰的糖的组分(交联试剂和交联程序的综述见:Wold,F.,Meth.Enzymol.25:623-651,1972;Weetall,H.H.和Cooney,D.A.,
ENZYMES AS DRUGS.(Holcenberg和Roberts,eds.)pp.395-442,Wiley,New York,1981;Ji,T.H.,Meth.Enzymol.91:580-609,1983;Mattson等人,Mol.Biol.Rep.17:167-183,1993,它们都
通过提及而合并入本文)。优选的交联试剂源自各种零长度的、同双官能的和异双官能的交
联试剂。零长度的交联试剂包括直接缀合两个固有的化学基团而不引入外来物质。催化二
硫键形成的试剂属于该类别。另一个实例是诱导羧基和伯氨基的缩合从而形成酰胺键的试
剂,例如碳二亚胺、氯甲酸乙酯、伍德瓦德试剂K(2-乙基-5-苯基异噁唑鎓-3′-磺酸盐)
和羰基二咪唑。除了这些化学试剂外,转谷氨酰胺酶(谷氨酰基-肽γ-谷氨酰转移酶;EC
2.3.2.13)可以用作零长度的交联试剂。该酶在蛋白质结合的谷氨酰胺酰基残基的羧酰胺
基团处催化酰基转移反应,通常使用伯氨基作为底物。优选的同和异双官能试剂分别含有
两个相同或两个不同的位点,其可以对于氨基、巯基、胍基、吲哚或非特异性基团是反应性
的。
[0354] 除了使用位点特异性反应性部分外,本发明还考虑使用非特异性反应性基团来将糖连接至修饰基团。
[0355] 示例性的非特异性交联剂包括在黑暗中完全惰性的光可活化的基团,其在吸收合适能量的光子后转化为反应性种类。在一个实施方案中,光可活化的基团选自在加热或光
解叠氮化物后产生的氮宾的前体。缺电子的氮宾是极具反应性的并且可以与各种化学键反
应,所述化学键包括N-H、O-H、C-H和C=C。尽管可以使用三种类型的叠氮化物(芳基、烷
基和酰基衍生物),但是目前为芳基叠氮化物。在光解后芳基叠氮化物与N-H和O-H键的反
应性比与C-H键更好。缺电子的芳基氮宾快速环扩张从而形成脱氢氮杂 其倾向于与亲
核体反应,而不是形成C-H插入产物。通过在环中吸电子取代基例如硝基或羟基的存在可
以增加芳基叠氮化物的反应性。此类取代基将芳基叠氮化物的最大吸收推向更长的波长。
未取代的芳基叠氮化物具有在260-280nm范围内的最大吸收,而羟基和硝基芳基叠氮化物
吸收305nm外的大量光。因此,羟基和硝基芳基叠氮化物是最优选的,因为与未取代的芳基
叠氮化物相比,它们允许使用对于亲和组分的有害性更低的光解条件。
[0356] 在更进一步的实施方案中,为接头基团提供可以被切割从而从糖残基释放出修饰基团的基团。许多可切割的基团是本领域已知的。参见例如,Jung等人,Biochem.
Biophys.Acta 761:152-162(1983);Joshi等人,J.Biol.Chem.265:14518-14525(1990);
Zarling 等 人,J.Immunol.124:913-920(1980);Bouizar 等 人,Eur.J.Biochem.155:
141-147(1986);Park 等 人,J.Biol.Chem.261:205-210(1986);Browning 等 人,
J.Immunol.143:1859-1867(1989)。此外,宽范围的可切割的双官能(同和异双官能)接头
基团可以通过商业途径从供应商例如Pierce获得。
[0357] 用光、热或者试剂例如硫醇、羟胺、碱、高碘酸盐等等可以切割示例性的可切割部分。此外,作为对于被胞吞而作出的应答,某些优选的基团在体内被切割(例如,顺乌头酰
基;参见,Shen等人,Biochem.Biophys.Res.Commun.102:1048(1991))。优选的可切割基团
包括可切割的部分,其是选自二硫化物、酯、酰亚胺、碳酸酯、硝基苄基、苯甲酰甲基和苯偶
姻基团的成员。
[0358] 在下面的讨论中,给出了许多可用于实施本发明的经修饰的糖的具体实例。在示例性的实施方案中,将唾液酸衍生物用作糖核心,修饰基团附着至所述糖核心。关于唾液酸
衍生物的讨论的焦点仅仅是为了清楚地举例说明,而不应当被解释为限制本发明的范围。
本领域技术人员将会意识到,可以以与使用唾液酸作为实例而给出的方式类似的方式来活
化和衍生化各种其他糖部分。例如,许多方法可以用于修饰半乳糖、葡萄糖、N-乙酰半乳糖
胺和岩藻糖等糖底物,其可以通过公认的方法容易地进行修饰。参见例如,Elhalabi等人,
Curr.Med.Chem.6:93(1999);和Schafer等人,J.Org.Chem.65:24(2000)。
[0359] 在示例性的实施方案中,通过本发明方法修饰的多肽是在原核细胞(例如,大肠杆菌)、真核细胞(包括酵母和哺乳动物细胞(例如,CHO细胞)或转基因动物中产生的糖
肽,并且从而含有不完全唾液酸化的N-和/或O-联寡糖链。缺少唾液酸并且含有末端半
乳糖残基的糖肽的寡糖链可以被糖-PEG化、糖-PPG化或修饰,用经修饰的唾液酸。
[0360] 在方案5中,用受保护的氨基酸(例如,甘氨酸)衍生物的活性酯来处理氨基糖苷1,从而将糖胺残基转化成相应的受保护的氨基酸酰胺加合物。用醛缩酶处理该加合物,从
而形成α-羟基羧酸盐2。通过CMP-SA合成酶的作用将化合物2转化为相应的CMP衍生
物,接着催化氢化该CMP衍生物,从而产生化合物3。将通过形成甘氨酸加合物而引入的胺
用作通过使化合物3与活化的(m-)PEG或(m-)PPG衍生物(例如,PEG-C(O)NHS、PPG-C(O)
NHS)反应来进行的PEG或PPG附着的位点,从而分别产生4或5。方案5
[0361] 下面的表11给出了用PEG或PPG部分来衍生化的单磷酸糖的代表性实例。通过方案4的方法来制备表2的某些化合物。通过本领域公认的方法来制备其他衍生物。参
见例如,Keppler等人,Glycobiology 11:11R(2001);和Charter等人,Glycobiology 10:
1049(2000)。其他的胺反应性PEG和PPG类似物可通过商业途径获得,或者它们可以通过
本领域技术人员容易得到的方法来制备。表11:用PEG或PPG衍生化的单磷酸糖的实例
[0362] 用于实施本 发明的经修 饰的磷酸糖 可以在其他 位置以及上 面给出 的位 置处 被取 代。唾液 酸的 目前 优选 的取 代在 式(VIII)中给 出:
其 中,X 是 连 接 基 团,其 优 选 选
1 5
自-O-、-N(H)-、-S、CH2-和-N(R)2,其中每个R是独立地选自R-R 的成员。符号Y、Z、A和
B各自表示选自关于X的身份而在上面给出的基团的基团。X、Y、Z、A和B各自独立地进行
1 2 3 4 5
选择,因此它们可以是相同或不同的。符号R、R、R、R 和R 表示H、水溶性聚合物、治疗性
部分、生物分子或其他部分。备选地,这些符号表示接头,其结合至水溶性聚合物、治疗性部
分、生物分子或其他部分。
[0363] 附着至本文公开的缀合物的示例性部分包括,但不限于,PEG衍生物(例如,烷基-PEG、酰基-PEG、酰基-烷基-PEG、烷基-酰基-PEG、氨基甲酰基-PEG、芳基-PEG)、PPG
衍生物(例如,烷基-PPG、酰基-PPG、酰基-烷基-PPG、烷基-酰基-PPG、氨基甲酰基-PPG、
芳基-PPG)、治疗性部分、诊断性部分、甘露糖-6-磷酸、肝素、乙酰肝素、SLex、甘露糖、甘
露糖-6-磷酸、唾液酸基Lewis X、FGF、VFGF、蛋白质、软骨素、角质素、皮肤素、白蛋白、整
联蛋白、触角寡糖、肽等等。将各种修饰基团缀合至糖部分的方法是本领域技术人员容易
得到的(POLY(ETHYLENE GLYCOL)CHEMISTRY:BIOTECHNICAL AND BIOMEDICAL APPLICATIONS,J.Milton Harris,Ed.,Plenum Pub.Corp.,1992;POLY(ETHYLENE GLYCOL)CHEMICAL ANDBIOLOGICAL APPLICATIONS,J.Milton Harris,Ed.,ACS SymposiumSeries No.680,American Chemical Society,1997;Hermanson,
BIOCONJUGATE TECHNIQUES,Academic Press,San Diego,1996;和Dunn等人,Eds.POLYMERIC DRUGS AND DRUG DELIVERY SYSTEMS,ACS Symposium Series Vol.469,American Chemical Society,Washington,D.C.1991)。
[0364] 示例性的策略涉及通过使用异双官能交联剂SPDP(n-琥珀酰亚胺基-3-(2-吡啶基联硫基)丙酸酯)来将受保护的巯基掺入到糖上,然后使巯基去保护,以与修饰基团上的
另一巯基形成二硫键。
[0365] 如果SPDP有害地影响经修饰的糖作为糖基转移酶底物的能力,那么使用一大批其他交联剂之一,例如2-亚氨基硫杂环戊烷(2-iminothiolane)或者S-乙酰基硫代乙酸
N-琥珀酰亚胺基酯(SATA)以形成二硫键。2-亚氨基硫杂环戊烷与伯胺反应,立即将未受
保护的巯基掺入到含胺的分子上。SATA也与伯胺反应,但是掺入受保护的巯基,其在后来用
羟胺进行脱乙酰化从而产生游离的巯基。在每种情况中,所掺入的巯基与其他巯基或者受
保护的巯基(像SPDP)自由反应,形成所需的二硫键。
[0366] 上述策略是用于本发明的示例性的而非限制性的接头。可利用其他交联剂,其可在将修饰基团与多肽交联的不同策略中使用。例如,TPCH(S-(2-硫代吡啶基)-L-半胱氨
酸酰肼)和TPMPH(S-(2-硫代吡啶基)巯基-丙酰肼)与之前通过温和的高碘酸盐处理而
氧化的碳水化合物部分反应,从而在交联剂的酰肼部分和由高碘酸盐产生的醛之间形成腙
键。TPCH和TPMPH在糖上引入由2-吡啶基硫酮保护的巯基,其可以用DTT去保护,然后用
于缀合,例如在组分之间形成二硫键。
[0367] 如果发现二硫键对于产生稳定的经修饰的糖是不合适的,那么可以使用在组分之间掺入更稳定的键的其他交联剂。异双官能交联剂GMBS(N-γ-马来酰亚氨基丁酰氧基)琥
珀酰亚胺)和SMCC(琥珀酰亚胺基4-(N-马来酰亚氨基-甲基)环己烷)与伯胺反应,从而
在该组分上引入马来酰亚胺基团。该马来酰亚胺基团随后可以与另一组分上的巯基(其可
以通过先前所提及的交联剂而引入)反应,从而在组分之间形成稳定的硫醚键。如果组分
之间的位阻干扰组分的活性或者干扰经修饰的糖作为糖基转移酶的能力,那么可以使用这
样的交联剂,其在组分之间引入长的间隔臂,并且包括一些先前提及的交联剂(例如SPDP)
的衍生物。因此,存在大量可用的合适交联剂;每一种根据其对于最佳的多肽缀合物和经修
饰的糖产生所具有的影响来进行选择。
[0368] 使用各种试剂,以分子内化学交联来修饰经修饰的糖的组分(交联试剂和交联程序的综述见:Wold,F.,Meth.Enzymol.25:623-651,1972;Weetall,H.H.和Cooney,D.A.,
ENZYMES AS DRUGS.(Holcenberg和Roberts,eds.)pp.395-442,Wiley,New York,1981;Ji,T.H.,Meth.Enzymol.91:580-609,1983;Mattson等人,Mol.Biol.Rep.17:167-183,1993,它们都
通过提及而合并入本文)。优选的交联试剂源自各种零长度的、同双官能的和异双官能的交
联试剂。零长度的交联试剂包括直接缀合两个固有的化学基团而不引入外来物质。催化二
硫键形成的试剂属于该类别。另一个实例是诱导羧基和伯氨基的缩合从而形成酰胺键的试
剂,例如碳二亚胺、氯甲酸乙酯、伍德瓦德试剂K(2-乙基-5-苯基异噁唑鎓-3′-磺酸盐)
和羰基二咪唑。除了这些化学试剂外,转谷氨酰胺酶(谷氨酰基-肽γ-谷氨酰转移酶;EC
2.3.2.13)可以用作零长度的交联试剂。该酶在蛋白质结合的谷氨酰胺酰基残基的羧酰胺
基团处催化酰基转移反应,通常使用伯氨基作为底物。优选的同和异双官能试剂分别含有
两个相同或两个不同的位点,其可以对于氨基、巯基、胍基、吲哚或非特异性基团是反应性
的。交联试剂中优选的特异性位点1.氨基-反应性基团
[0369] 在一个实施方案中,交联剂上的位点是氨基-反应性基团。氨基-反应性基团的可用的非限制性实例包括N-羟基琥珀酰亚胺(NHS)酯、亚氨酸酯、异氰酸酯、酰卤、芳基叠
氮化物、对硝基苯酯、醛和磺酰氯。
[0370] NHS酯优先与经修饰的糖组分的伯(包括芳香族)氨基反应。已知组氨酸的咪唑基团与伯胺竞争反应,但是反应产物是不稳定和容易水解的。该反应涉及在NHS酯的酸性
羧基上胺的亲核攻击,从而形成酰胺,释放出N-羟基琥珀酰亚胺。因而,失去原始氨基的正
电荷。
[0371] 亚氨酸酯是与经修饰的糖组分的胺基团反应的最特异的酰化试剂。在7至10的pH下,亚氨酸酯仅与伯胺反应。伯胺亲核攻击亚氨酸酯从而产生中间体,该中间体在高pH
下分解成脒或者在低pH下分解成新的亚氨酸酯。该新的亚氨酸酯可以与另一伯胺反应,从
而交联两个氨基,这是被认为是单官能的亚氨酸酯进行双官能反应的情形。与伯胺反应的
主要产物是脒,其是比原始的胺更强的碱。因此,保留原始氨基的正电荷。
[0372] 异氰酸酯(和异硫氰酸酯)与经修饰的糖组分的伯胺反应,从而形成稳定的键。它们与巯基、咪唑和酪氨酰基团反应,从而得到相对不稳定的产物。
[0373] 酰叠氮也用作氨基-特异性试剂,其中亲和组分的亲核胺在弱碱性条件例如pH8.5下攻击酸性羧基。
[0374] 芳基卤例如1,5-二氟-2,4-二硝基苯优先与经修饰的糖组分的氨基和酪氨酸酚基反应,但是也与巯基和咪唑基团反应。
[0375] 单和二羧酸的对硝基苯酯也是可用的氨基-反应性基团。尽管试剂特异性不是非常高,但是α-和ε-氨基看起来最快地进行反应。
[0376] 醛例如戊二醛与经修饰的糖的伯胺反应。尽管在氨基与醛反应后形成不稳定的席夫碱,但是戊二醛能够以稳定的交联来修饰经修饰的糖。在pH 6-8(典型交联条件的pH)
下,环状聚合物经历脱水,从而形成α-β不饱和醛聚合物。然而,当与另一双键共轭时,席
夫碱是稳定的。这两个双键的共振相互作用阻止了席夫键的水解。此外,高局部浓度下的
胺可以攻击该烯属双键,从而形成稳定的迈克尔加成产物。
[0377] 芳香族磺酰氯与经修饰的糖组分的各个位点反应,但是与氨基的反应是最主要的,其导致稳定的磺酰胺键。2.巯基-反应性基团
[0378] 在另一实施方案中,所述位点是巯基-反应性基团。巯基-反应性基团的可用的非限制性实例包括马来酰亚胺类、烷基卤、吡啶基二硫化物类和硫代邻苯二甲酰亚胺类。
[0379] 马来酰亚胺类优先与经修饰的糖组分的巯基反应,从而形成稳定的硫醚键。它们也可以以低得多的速率与伯胺基和组氨酸的咪唑基团反应。然而,在pH7下,可以将马来酰
亚胺基团认为是巯基-特异性基团,因为在该pH下,简单硫醇的反应速率是相应胺的1000
倍。
[0380] 烷基卤与巯基、硫化物、咪唑类和氨基反应。然而,在中性到弱碱性pH下,烷基卤主要与巯基反应从而形成稳定的硫醚键。在较高pH下,有利于与氨基的反应。
[0381] 吡啶基二硫化物类通过二硫键交换而与游离的巯基反应,从而得到混合的二硫化物。因而,吡啶基二硫化物类是最特异的巯基-反应性基团。
[0382] 硫代邻苯二甲酰亚胺类与游离巯基反应,从而形成二硫化物。3.羧基-反应性残基
[0383] 在另一个实施方案中,将溶于水和有机溶剂中的碳二亚胺用作羧基-反应试剂。这些化合物与游离羧基反应,从而形成假脲,其然后偶联至可用的胺,产生酰胺键。教导了
如何用碳二亚胺来修饰羧基(Yamada等人,Biochemistry 20:4836-4842,1981)。交联试剂
中优选的非特异性位点
[0384] 除了使用位点特异性反应性部分外,本发明还考虑使用非特异性反应性基团来将糖连接至修饰基团。
[0385] 示例性的非特异性交联剂包括在黑暗中完全惰性的光可活化的基团,其在吸收合适能量的光子后转化为反应性种类。在一个实施方案中,光可活化的基团选自在加热或光
解叠氮化物后产生的氮宾的前体。缺电子的氮宾是极具反应性的并且可以与各种化学键反
应,所述化学键包括N-H、O-H、C-H和C=C。尽管可以使用三种类型的叠氮化物(芳基、烷
基和酰基衍生物),但是目前为芳基叠氮化物。在光解后芳基叠氮化物与N-H和O-H键的反
应性比与C-H键更好。缺电子的芳基氮宾快速环扩张从而形成脱氢氮杂 其倾向于与亲
核体反应,而不是形成C-H插入产物。通过在环中吸电子取代基例如硝基或羟基的存在可
以增加芳基叠氮化物的反应性。此类取代基将芳基叠氮化物的最大吸收推向更长的波长。
未取代的芳基叠氮化物具有在260-280nm范围内的最大吸收,而羟基和硝基芳基叠氮化物
吸收305nm外的大量光。因此,羟基和硝基芳基叠氮化物是最优选的,因为与未取代的芳基
叠氮化物相比,它们允许使用对于亲和组分的有害性更低的光解条件。
[0386] 在另一个优选的实施方案中,光可活化的基团选自氟化的芳基叠氮化物。氟化的芳基叠氮化物的光解产物是芳基氮宾,它们都以高效率经历该基团的特征性反应,包括C-H
键插入(Keana等人,J.Org.Chem.55:3640-3647,1990)。
[0387] 在另一个实施方案中,光可活化的基团选自二苯酮残基。二苯酮试剂通常给出比芳基叠氮化物试剂更高的交联产率。
[0388] 在另一个实施方案中,光可活化的基团选自重氮化合物,其在光解后形成缺电子的卡宾。这些卡宾经历各种反应,包括插入C-H键中、与双键(包括芳香族系统)加成、氢
吸引和配位到亲核中心从而得到碳离子。
[0389] 在另外一个实施方案中,光可活化的基团选自重氮基丙酮酸酯。例如,重氮基丙酮酸对硝基苯酯的对硝基苯酯与脂肪族胺反应,从而得到重氮基丙酮酸酰胺,其经历紫外线
光解而形成醛。经光解的经重氮基丙酮酸酯修饰的亲和组分将像甲醛或戊二醛一样进行反
应,从而形成交联。同双官能试剂1.与伯胺具有反应性的同双官能交联剂
[0390] 胺-反应性交联剂的合成、性质和应用在文献中作了商业上的描述(交联程序和试剂的综述见上文)。许多试剂是可得的(例如,Pierce Chemical Company,Rockford,
Ill.;Sigma ChemicalCompany,St.Louis,Mo.;Molecular Probes,Inc.,Eugene,OR.)。
[0391] 同双官能NHS酯的优选的非限制性实例包括戊二酸二琥珀酰亚胺基酯(DSG)、辛二酸二琥珀酰亚胺基酯(DSS)、辛二酸二(磺基琥珀酰亚胺基)酯(BS)、酒石酸二琥
珀酰亚胺基酯(DST)、酒石酸二磺基琥珀酰亚胺基酯(sulfo-DST)、二-2-(琥珀酰亚氨
基氧基羰基氧基)乙基砜(BSOCOES)、二-2-(磺基琥珀酰亚氨基氧基羰基氧基)乙基砜
(sulfo-BSOCOES)、二(琥珀酰亚胺基琥珀酸)乙二醇酯(EGS)、二(磺基琥珀酰亚胺基琥珀
酸)乙二醇酯(sulfo-EGS)、联硫基双(琥珀酰亚胺基丙酸酯(DSP)和联硫基双(磺基琥
珀酰亚胺基丙酸酯(sulfo-DSP)。同双官能亚氨酸酯的优选的非限制性实例包括丙二酰亚
氨酸二甲酯(DMM)、琥珀酰亚氨酸二甲酯(DMSC)、己二酰亚氨酸二甲酯(DMA)、庚二酰亚氨
酸二甲酯(DMP)、辛二酰亚氨酸二甲酯(DMS)、3,3′-氧联二丙酰亚氨酸二甲酯(DODP)、3,
3′-(亚甲基二氧基)二丙酰亚氨酸二甲酯(DMDP)、3,3′-(二亚甲基二氧基)二丙酰亚
氨酸二甲酯(DDDP)、3,3′-(四亚甲基二氧基)二丙酰亚氨酸二甲酯(DTDP)和3,3′-联
硫基二丙酰亚氨酸二甲酯(DTBP)。
[0392] 同双官能异硫氰酸酯的优选的非限制性实例包括:对苯撑二异硫氰酸酯(DITC),和4,4’-二异硫氰基-2,2′-二磺酸茋(DIDS)。
[0393] 同双官能异氰酸酯的优选的非限制性实例包括二甲苯-二异氰酸酯、甲苯-2,4-二异氰酸酯、甲苯-2-异氰酸酯-4-异硫氰酸酯、3-甲氧基二苯基甲烷-4,4′-二异氰
酸酯、2,2′-二羧基-4,4′-偶氮苯基二异氰酸酯和六亚甲基二异氰酸酯。
[0394] 同双官能芳基卤的优选的非限制性实例包括1,5-二氟-2,4-二硝基苯(DFDNB)和4,4′-二氟-3,3′-二硝基苯基-砜。
[0395] 同双官能脂肪族醛试剂的优选的非限制性实例包括乙二醛、丙二醛和戊二醛。
[0396] 同双官能酰化试剂的优选的非限制性实例包括二羧酸的硝基苯酯。
[0397] 同双官能芳香族磺酰氯的优选的非限制性实例包括苯酚-2,4-二磺酰氯和α-萘酚-2,4-二磺酰氯。
[0398] 另外的氨基-反应性同双官能试剂的优选的非限制性实例包括赤藓醇二碳酸酯,其与胺反应而生成双氨基甲酸酯。2.与游离的巯基具有反应性的同双官能交联剂
[0399] 此类试剂的合成、性质和应用描述于文献中(交联程序和试剂的综述见上文)。这些试剂中的许多是通过商业途径可获得的(例如,Pierce Chemical Company,Rockford,
Ill.;Sigma ChemicalCompany,St.Louis,Mo.;Molecular Probes,Inc.,Eugene,OR)。
[0400] 同双官能马来酰亚胺类的优选的非限制性实例包括双马来酰亚氨基己烷(BMH)、N,N′-(1,3-亚苯基)双马来酰亚胺、N,N′-(1,2-亚苯基)双马来酰亚胺、偶氮苯基二
马来酰亚胺和二(N-马来酰亚氨基甲基)醚。
[0401] 同双官能吡啶基二硫化物类的优选的非限制性实例包括1,4-二-3′-(2′-吡啶基联硫基)丙酰氨基丁烷(DPDPB)。
[0402] 同双官能烷基卤的优选的非限制性实例包括2,2′-二羧基-4,4′-二碘代乙酰氨基偶氮苯、α,α′-二碘代-对二甲苯磺酸、α,α′-二溴代-对二甲苯磺酸、N,
N′-二(b-溴乙基)苄胺、N,N′-二(溴代乙酰基)苯肼和1,2-二(溴代乙酰基)氨
基-3-苯基丙烷。3.同双官能光可活化的交联剂
[0403] 此类试剂的合成、性质和应用描述于文献中(交联程序和试剂的综述见上文)。这些试剂中的一些是通过商业途径可获得的(例如,Pierce Chemical Company,Rockford,
Ill.;Sigma ChemicalCompany,St.Louis,Mo.;Molecular Probes,Inc.,Eugene,OR)。
[0404] 同双官能光可活化的交联剂的优选的非限制性实例包括二-β-(4-叠氮基水杨酰氨基)乙基二硫化物(BASED)、二-N-(2-硝基-4-叠氮基苯基)-胱胺-S,S-二氧化物
(DNCO)和4,4′-联硫基二苯基叠氮化物。异双官能试剂1.具有吡啶基二硫化物部分的
氨基-反应性异双官能试剂
[0405] 此类试剂的合成、性质和应用描述于文献中(交联程序和试剂的综述见上文)。这些试剂中的许多是通过商业途径可获得的(例如,Pierce Chemical Company,Rockford,
Ill.;Sigma ChemicalCompany,St.Louis,Mo.;Molecular Probes,Inc.,Eugene,OR)。
[0406] 具有吡啶基二硫化物部分和氨基-反应性NHS酯的异双官能试剂的优选的非限制性实例包括N-琥珀酰亚胺基-3-(2-吡啶基联硫基)丙酸酯(SPDP)、6-3-(2-吡啶基联硫
基)丙酰氨基己酸琥珀酰亚胺基酯(LC-SPDP)、6-3-(2-吡啶基联硫基)丙酰氨基己酸磺基
琥珀酰亚胺基酯(sulfo-LCSPDP)、4-琥珀酰亚胺基氧基羰基-α-甲基-α-(2-吡啶基联
硫基)甲苯(SMPT)和6-α-甲基-α-(2-吡啶基联硫基)甲苯甲酰氨基己酸磺基琥珀酰
亚胺基酯(sulfo-LC-SMPT)。2.具有马来酰亚胺部分的氨基-反应性异双官能试剂
[0407] 此类试剂的合成、性质和应用描述于文献中。具有马来酰亚胺部分和氨基-反应性NHS酯的异双官能试剂的优选的非限制性实例包括马来酰亚胺基乙酸琥珀酰亚胺基
酯(AMAS)、3-马来酰亚胺基丙酸琥珀酰亚胺基酯(BMPS)、N-γ-马来酰亚氨基丁酰氧基
琥珀酰亚胺酯(GMBS)、N-γ-马来酰亚氨基丁酰氧基磺基琥珀酰亚胺酯(sulfo-GMBS)、
6-马来酰亚胺基己酸琥珀酰亚胺基酯(EMCS)、3-马来酰亚胺基苯甲酸琥珀酰亚胺基酯
(SMB)、间-马来酰亚氨基苯甲酰基-N-羟基琥珀酰亚胺酯(MBS)、间-马来酰亚氨基苯甲酰
基-N-羟基磺基琥珀酰亚胺酯(sulfo-MBS)、4-(N-马来酰亚氨基甲基)-环己烷-1-羧酸
琥珀酰亚胺基酯(SMCC)、4-(N-马来酰亚氨基甲基)环己烷-1-羧酸磺基琥珀酰亚胺基酯
(sulfo-SMCC)、4-(对-马来酰亚氨基苯基)丁酸琥珀酰亚胺基酯(SMPB)和4-(对-马来
酰亚氨基苯基)丁酸磺基琥珀酰亚胺基酯(sulfo-SMPB)。3.具有烷基卤部分的氨基-反
应性异双官能试剂
[0408] 此类试剂的合成、性质和应用描述于文献中。具有烷基卤部分和氨基-反应性NHS酯的异双官能试剂的优选的非限制性实例包括N-琥珀酰亚胺基-(4-碘代乙酰基)氨基苯
甲酸酯(SIAB)、磺基琥珀酰亚胺基-(4-碘代乙酰基)氨基苯甲酸酯(sulfo-SIAB)、琥珀酰
亚胺基-6-(碘代乙酰基)氨基己酸酯(SIAX)、琥珀酰亚胺基-6-(6-((碘代乙酰基)-氨
基)己酰基氨基)己酸酯(SIAXX)、琥珀酰亚胺基-6-(((4-(碘代乙酰基)-氨基)-甲
基)-环己烷-1-羰基)氨基己酸酯(SIACX)和琥珀酰亚胺基-4((碘代乙酰基)-氨基)
甲基环己烷-1-羧酸酯(SIAC)。
[0409] 具有氨基-反应性NHS酯和烷基二卤部分的异双官能试剂的一个实例是2,3-二溴代丙酸N-羟基琥珀酰亚胺基酯(SDBP)。SDBP通过缀合其氨基而向亲和组分中引入分
子内交联。而二溴代丙酰基部分对伯胺基的反应性通过反应温度来控制(McKenzie等人,
Protein Chem.7:581-592(1988))。
[0410] 具有烷基卤部分和氨基-反应性对硝基苯酯部分的优选的非限制性实例包括碘代乙酸对硝基苯酯(NPIA)。
[0411] 其他交联剂是本领域技术人员已知的。参见例如,Pomato等人,美国专利号5,965,106。为具体反应选择合适的交联剂在本领域技术人员的能力范围之内。可切割的
接头基团
[0412] 在更进一步的实施方案中,为接头基团提供可以被切割从而从糖残基释放出修饰基团的基团。许多可切割的基团是本领域已知的。参见例如,Jung等人,Biochem.
Biophys.Acta 761:152-162(1983);Joshi等人,J.Biol.Chem.265:14518-14525(1990);
Zarling 等 人,J.Immunol.124:913-920(1980);Bouizar 等 人,Eur.J.Biochem.155:
141-147(1986);Park 等 人,J.Biol.Chem.261:205-210(1986);Browning 等 人,
J.Immunol.143:1859-1867(1989)。此外,宽范围的可切割的双官能(同和异双官能)接头
基团可以通过商业途径从供应商例如Pierce获得。
[0413] 用光、热或者试剂例如硫醇、羟胺、碱、高碘酸盐等等可以切割示例性的可切割部分。此外,作为对于被胞吞而作出的应答,某些优选的基团在体内被切割(例如,顺乌头酰
基;参见,Shen等人,Biochem.Biophys.Res.Commun.102:1048(1991))。优选的可切割基团
包括可切割的部分,其是选自二硫化物、酯、酰亚胺、碳酸酯、硝基苄基、苯甲酰甲基和苯偶
姻基团的成员。
[0414] 根据本发明的具体实施方案包括: 和这些种类的碳酸酯和活性酯,例如: 本发明的
示例性缀合物
[0415] 在示例性的实施方案中,所述多肽是干扰素。干扰素是抗病毒糖蛋白,其在人类中在用病毒或双链RNA诱导后由人初级成纤维细胞分泌。有益的是,干扰素作为治
疗剂,例如抗病毒剂(例如,乙型和丙型肝炎)、抗肿瘤剂(例如,肝细胞癌),和用于治
疗多发性硬化。关于与干扰素-α相关的参考文献,参见Asano等人,Eur.J.Cancer,
27(Suppl 4):S21-S25(1991);Nagy等 人,Anticancer Research,8(3):467-470(1988);
Dron等 人,J.Biol.Regul.Homeost.Agents,3(1):13-19(1989);Habib等 人,Am.Surg.,
67(3):257-260(3/2001);和Sugyiama等人,Eur.J.Biochem.,217:921-927(1993)。讨
论干扰素-β的参考文献,参见例如,Yu等人,J.Neuroimmunol.,64(1):91-100(1996);
Schmidt,J.,J.Neurosci.Res.,65(1):59-67(2001);Wender等 人,FoliaNeuropathol.,
39(2):91-93(2001);Martin等人,Springer Semin.Immunopathol.,18(1):1-24(1996);
Takane 等 人,J.Pharmacol.Exp.Ther.,294(2):746-752(2000);Sburlati 等 人,
Biotechnol.Prog.,14:189-192(1998);Dodd 等 人,Biochimica et Biophysica Acta,
787:183-187(1984);Edelbaum 等 人,J.Interferon Res.,12:449-453(1992);Conradt
等 人,J.Biol.Chem.,262(30):14600-14605(1987);Civas 等 人,Eur.J.Biochem.,
173:311-316(1988);Demolder 等 人,J.Biotechnol.,32:179-189(1994);Sedmak 等
人,J.Interferon Res.,9(Suppl 1):S61-S65(1989);Kagawa 等 人,J.Biol.Chem.,
263(33):17508-17515(1988);Hershenson等人,美国专利号4,894,330;Jayaram等人,
J.Interferon Res.,3(2):177-180(1983);Menge 等 人,Develop.Biol.Standard.,66:
391-401(1987);Vonk等人,J.Interferon Res.,3(2):169-175(1983);和Adolf等人,
J.Interferon Res.,10:255-267(1990)。
[0416] 在示例性的干扰素缀合物中,将干扰素α,例如干扰素α2b和2a,通过完整的糖基接头缀合至水溶性聚合物。
[0417] 在进一步的示例性实施方案中,本发明提供了人粒细胞集落刺激因子(G-CSF)的缀合物。G-CSF是刺激中性白细胞生成性祖细胞增殖、分化和激活成功能上成熟
的嗜中性粒细胞的糖蛋白。注射的G-CSF从身体中快速清除。参见例如,Nohynek
等 人,CancerChemother.Pharmacol.,39:259-266(1997);Lord 等 人,Clinical
CancerResearch,7(7):2085-2090(07/2001);Rotondaro等人,MolecularBiotechnology,
11(2):117-128(1999); 和 等 人,Bone MarrowTransplantation,28:
259-264(2001)。
[0418] 本发明包括用于修饰GM-CSF的方法。GM-CSF在本领域公知为由激活的T-细胞、巨噬细胞、内皮细胞和基质成纤维细胞产生的细胞因子。GM-CSF主要作用于骨髓从而增加
炎性白细胞的产生,并进一步作为内分泌激素以起始在炎症功能期间消耗的嗜中性粒细胞
的补充。此外,GM-CSF是巨噬细胞激活因子并且促进朗格汉斯细胞分化成树突细胞。像
G-CSF一样,GM-CSF也在化疗后的骨髓更换中具有临床应用。核酸
[0419] 在另一个方面,本发明提供了编码本发明的序列肽段多肽的分离的核酸。所述序列肽段多肽在其氨基酸序列内包含一个或多个本发明的外源O-联糖基化序列。在一个实
施方案中,本发明的核酸是表达载体的一部分。在另一个相关的实施方案中,本发明提供了
包含本发明的核酸的细胞。示例性的细胞包括宿主细胞,例如大肠杆菌的各种菌株、昆虫细
胞和哺乳动物细胞,如CHO细胞。药物组合物
[0420] 本发明的多肽缀合物具有宽范围的药物学应用。例如,糖缀合的促红细胞生成素(EPO)可用于治疗全身性贫血、再生障碍性贫血、化学诱导的损伤(例如骨髓损伤)、慢性肾
衰竭、肾炎和地中海贫血。经修饰的EPO可以进一步用于治疗神经病学病症,例如脑/脊柱
损伤、多发性硬化和阿尔茨海默病。
[0421] 第二个实例是干扰素-α(IFN-α),其可以用于治疗AIDS和乙型或丙型肝炎,由各种病毒例如人乳头瘤病毒(HBV)、冠状病毒、人免疫缺陷病毒(HIV)、单纯疱疹病毒(HSV)
和水痘带状疱疹病毒(VZV)引起的病毒感染,癌症例如多毛细胞白血病、AIDS相关的卡波
西肉瘤、恶性黑素瘤、滤泡型非霍奇金淋巴瘤、费城染色体(Ph)-阳性、慢性期髓性白血病
(CML)、肾癌、骨髓瘤、慢性髓性白血病、头和颈癌、骨癌,以及宫颈上皮结构不良和中枢神经
系统(CNS)的病症例如多发性硬化。此外,根据本发明方法进行修饰的IFN-α可用于治疗
各种各样的其他疾病和病状,例如舍格伦综合征(自身免疫疾病)、贝赫切特病(自身免疫
炎性疾病)、纤维肌痛(骨骼肌疼痛/疲劳病症)、口疮性溃疡(复发性口溃疡)、慢性疲劳
综合征和肺纤维化。
[0422] 另一个实例是干扰素-β,其可用于治疗CNS病症,例如多发性硬化(复发性/弛张性的或者慢性进行性的),AIDS和乙型或丙型肝炎,由各种病毒例如人乳头瘤病毒
(HBV)、人免疫缺陷病毒(HIV)、单纯疱疹病毒(HSV)和水痘带状疱疹病毒(VZV)引起的病毒
感染,耳科感染,骨骼肌感染,以及癌症,包括乳腺癌、脑癌、结肠直肠癌、非小细胞肺癌、头
和颈癌、基底细胞癌、宫颈上皮结构不良、黑素瘤、皮肤癌和肝癌。根据本发明方法进行修饰
的IFN-β还可用于治疗其他疾病和病状,例如移植排斥(例如骨髓移植)、亨廷顿舞蹈病、
结肠炎、脑炎症、肺纤维化、黄斑变性、肝硬化和角膜结膜炎。
[0423] 粒细胞集落刺激因子(G-CSF)是另一个实例。根据本发明方法进行修饰的G-CSF可以在用于治疗癌症的化疗中用作辅助剂,和用于预防或减轻与某些医学操作程序相关的
病状或并发症,例如化学诱导的骨髓损伤;白细胞减少(全身性);化学诱导的热性中性白
细胞减少;与骨髓移植相关的中性白细胞减少;和严重的慢性中性白细胞减少。经修饰的
G-CSF还可以用于移植;外周血细胞活动化;使外周血祖细胞活动化以收集在将接受重度
骨髓抑制性或骨髓抑制性化疗的患者中;以及减少中性白细胞减少、发热、抗生素使用、在
急性粒细胞白血病(AML)的诱导/巩固治疗后住院的持续时间。可以用经修饰的G-CSF治
疗的其他病状或病症包括哮喘和过敏性鼻炎。
[0424] 作为一个另外的实例,根据本发明方法进行修饰的人生长激素(hGH)可用于治疗生长相关的病状,例如侏儒症、儿童和成人中的身材矮小症、恶病质/肌肉萎缩(muscle
wasting)、全身性肌萎缩和性染色体异常(例如,特纳综合征)。可以使用经修饰的hGH来
治疗的其他病状包括:短肠综合征、脂肪营养不良、骨质疏松症、尿毒症、烧伤、女性不孕症、
骨再生、全身性糖尿病、II型糖尿病、骨关节炎、慢性阻塞性肺疾病(COPD)和失眠症。此外,
经修饰的hGH还可以用于促进各种过程,例如一般性组织再生、骨再生和伤口愈合,或者用
作疫苗辅助剂。
[0425] 因此,在另一个方面,本发明提供了药物组合物,其包含至少一种本发明的多肽或多肽缀合物和可药用的稀释剂、载体、承载体、添加剂或其组合。在示例性的实施方案中,
该药物组合物包含水溶性聚合物(例如,非天然存在的水溶性聚合物)和本发明的糖基化
或非糖基化的多肽之间的共价缀合物,以及可药用稀释剂。示例性的水溶性聚合物包括聚
(乙二醇)和甲氧基-聚(乙二醇)。备选地,将多肽缀合至除聚(乙二醇)衍生物之外的
其他修饰基团,例如治疗性部分或生物分子。修饰基团通过完整的糖基连接基团而缀合至
多肽,所述糖基连接基团插入在所述多肽和所述修饰基团之间并且共价连接至所述多肽和
所述修饰基团。在另一个示例性的实施方案中,
[0426] 本发明的药物组合物适合于在各种药物递送系统中使用。用于本发明的合适的制剂可在Remington′s PharmaceuticalSciences,Mace Publishing Company,
Philadelphia,PA,第17版(1985)中找到。药物递送方法的简要综述可参见Langer,
Science 249:1527-1533(1990)。
[0427] 可以配制药物组合物以用于任何合适方式的施用,包括例如,局部、口服、鼻、静脉内、颅内、腹膜内、皮下或肌内施用。对于肠胃外施用,例如皮下注射,载体优选包括水、盐
水、醇、脂肪、蜡或缓冲剂。对于口服施用,可以使用任一种上述载体或固体载体,例如甘露
醇、乳糖、淀粉、硬脂酸镁、糖精钠、滑石、纤维素、葡萄糖、蔗糖和碳酸镁。生物可降解的基
质,例如微球(例如聚乳酸酯、聚乙醇酸酯),可以用作本发明药物组合物的载体。合适的生
物可降解的微球例如公开于美国专利号4,897,268和5,075,109中。
[0428] 通常,皮下或肠胃外例如静脉内施用药物组合物。因而,本发明提供了用于肠胃外施用的组合物,其包含溶解或悬浮在可接受的载体,优选水性载体(例如,水、经缓冲的水、
盐水、PBS等等)中的化合物。所述组合物还可以含有去污剂,例如Tween 20和Tween80;
稳定剂,例如甘露醇、山梨糖醇、蔗糖和海藻糖;和防腐剂,例如EDTA和间甲酚。所述组合物
可以含有为了接近生理条件而所需的可药用辅助物质,例如pH调节剂和缓冲剂、张度调节
剂、润湿剂、去污剂,等等。
[0429] 这些组合物可以通过常规灭菌技术来进行灭菌,或者可以过滤除菌。所得的水溶液可以进行包装以就这样使用,或者进行冻干,并在施用前将冻干制剂与无菌水性载体相
组合。制剂的pH通常为3至11,更优选5至9,和最优选7至8。
[0430] 在一些实施方案中,可以将本发明的糖肽掺入到从标准的形成小泡的脂质形成的脂质体中。各种方法可用于制备脂质体,如Szoka等人,Ann.Rev.Biophys.Bioeng.9:
467(1980),美国专利号4,235,871、4,501,728和4,837,028中所描述的。使用各种靶向性
试剂(例如,本发明的唾液酸基半乳糖苷)来对脂质体实施靶向是本领域公知的(参见例
如,美国专利号4,957,773和4,603,044)。
[0431] 可以使用用于将靶向性试剂偶联至脂质体的标准方法。这些方法通常涉及向脂质体中掺入脂质组分,例如磷脂酰乙醇胺,其可以被活化以用于附着靶向性试剂,或者掺入衍
生化的亲脂性化合物,例如本发明的用脂质衍生化的糖肽。
[0432] 靶向机制通常要求,靶向性试剂以这样的方式位于脂质体的表面上,从而使得靶向部分可用于与靶标例如细胞表面受体相互作用。可以使用本领域技术人员已知的方法,
在形成脂质体之前将本发明的碳水化合物附着至脂质分子(例如,分别用长链烷基卤或脂
肪酸对存在于碳水化合物上的羟基进行烷基化或酰化)。备选地,脂质体可以这样进行制
备:形成膜时首先将衔接体部分掺入膜中。所述衔接体部分必须具有亲脂性部分,其牢固地
包埋并锚定在膜中。它必须还具有反应性部分,其在脂质体的水性表面上是化学上可用的。
如此选择反应性部分,从而使得它在化学上适合于与后来添加的靶向性试剂或碳水化合物
形成稳定的化学键。在一些情况下,可能将靶向性试剂直接附着至衔接体分子,但是在大多
数情况下,更合适的是使用第三种分子作为化学桥,从而将在膜中的衔接体分子与从小泡
表面上三维地伸出的靶向性试剂或碳水化合物相连接。
[0433] 通过本发明方法制备的化合物还可以用作诊断试剂。例如,经标记的化合物可以用于在被怀疑患有炎症的患者中定位炎症或肿瘤转移区域。对应该用途,化合物可以用
125 14
I、C或氚进行标记。
[0434] 并不意在限制本发明的范围,在上面给出的每个实施方案(例如,涉及组合物的那些,如序列肽段多肽、多肽缀合物、多肽文库、药物组合物、编码多肽的核酸,等等)中,通
常优选下面的示例性实施方案:在其中亲本多肽是高血糖素样肽-1(GLP-1)的一个示例
性实施方案,O-联糖基化序列优选不选自PTQ、PTT、PTQA、PTQG、PTQGA、PTQGAMP、PTQGAM、
PTINT、PTQAY、PTTLY、PTGSLP、PTTSEP、PTAVIP、PTSGEP、PTTLYP、PTVLP、TETP、PSDGP 和
PTEVP。在其中亲本多肽是野生型GLP-1的另一个示例性实施方案,O-联糖基化序列优选不
选自PTQ、PTT、PTQA、PTQG、PTQGA、PTQGAMP、PTQGAM、PTINT、PTQAY、PTTLY、PTGSLP、PTTSEP、PTAVIP、PTSGEP、PTTLYP、PTVLP、TETP、PSDGP和PTEVP。在其中亲本多肽是野生型GLP-1
的另一个示例性实施方案中,O-联糖基化序列优选不选自PTQ、PTT、PTQA、PTQG、PTQGA、
PTQGAMP、PTQGAM、PTINT、PTQAY、PTTLY、PTGSLP、PTTSEP、PTAVIP、PTSGEP、PTTLYP、PTVLP、TETP、PSDGP和PTEVP,除非O-联糖基化序列不被设计成位于存在于野生型G-CSF多肽中的
脯氨酸残基周围。
[0435] 在其中亲本多肽是G-CSF的另一个示例性实施方案中,O-联糖基化序列优选地不选自PTQGA、PTQGAM、PTQGAMP、APTP和PTP。在其中亲本多肽是野生型G-CSF的另一个示
例性实施方案中,O-联糖基化序列优选地不选自PTQGA、PTQGAM、PTQGAMP、APTP和PTP。在
其中亲本多肽是野生型G-CSF的另一个示例性实施方案中,O-联糖基化序列优选地不选自
PTQGA、PTQGAM、PTQGAMP、APTP和PTP,除非O-联糖基化序列不被设计成位于存在于野生型
G-CSF多肽中的脯氨酸残基周围。
[0436] 在其中亲本多肽是人生长激素(hGH)的另一个示例性实施方案中,O-联糖基化序列优选地不选自PTQGA、PTQGAM、PTQGAMP、PTVLP、PTTVS、PTTLYV、PTINT、PTEIP、PTQA和
TETP。在其中亲本多肽是野生型hGH的另一个示例性实施方案中,O-联糖基化序列优选
地不选自PTQGAM、PTQGAMP、PTTVS、PTTLYV、PTINT、PTQA和TETP。在其中亲本多肽是野生
型hGH的另外一个示例性实施方案中,O-联糖基化序列优选地不选自PTQGAM、PTQGAMP、
PTTVS、PTTLYV、PTINT、PTQA和TETP,除非O-联糖基化序列不被设计成位于存在于野生型
hGH多肽中的脯氨酸残基周围。
[0437] 在其中亲本多肽是INF-α的另一个示例性实施方案中,O-联糖基化序列优选地不是TETP。在其中亲本多肽是野生型INF-α的另一个示例性实施方案中,O-联糖基化序列
优选地不是TETP。在其中亲本多肽是野生型INF-α的另外一个示例性实施方案中,O-联
糖基化序列优选地不是TETP,除非O-联糖基化序列不被设计成位于存在于野生型INF-α
多肽中的脯氨酸残基周围。
[0438] 在其中亲本多肽是FGF(例如,FGF-1、FGF-2、FGF-18、FGF-20、FGF-21)的另一个示例性实施方案中,O-联糖基化序列优选地不选自PTP、PTQGA、PTQGAM、PTQGAMP、PTEIP、
PTTVS、PTINT、PTINTP、PTQA、PTQAP、PTSAV和PTSAVAA。在其中亲本多肽是野生型FGF的另一
个示例性实施方案中,O-联糖基化序列优选地不选自PTP、PTQGA、PTQGAM、PTQGAMP、PTEIP、
PTTVS、PTINT、PTINTP、PTQA、PTQAP、PTSAV和PTSAVAA。在其中亲本多肽是野生型FGF的
另外一个示例性实施方案中,O-联糖基化序列优选地不选自PTP、PTQGA、PTQGAM、PTQGAMP、
PTEIP、PTTVS、PTINT、PTINTP、PTQA、PTQAP、PTSAV和PTSAVAA,除非O-联糖基化序列不被设
计成位于存在于野生型FGF多肽中的脯氨酸残基周围。V.方法鉴定作为糖基转移酶的底物
的序列肽段多肽
[0439] 用于鉴定当进行糖基化反应时可以以令人满意的产率被糖基化的序列肽段多肽的一种策略是制备序列肽段多肽文库,其中每个序列肽段多肽包含至少一个本发明的
O-联或S-联糖基化序列,并就其用作糖基转移酶的有效底物的能力来测试每个序列肽段
多肽。通过在亲本多肽的氨基酸序列内的不同位置处包含所选的本发明O-联或S-联糖基
化序列,可以产生序列肽段多肽文库。序列肽段多肽文库
[0440] 在一个方面,本发明提供了用于产生一个或多个序列肽段多肽文库的方法,其中序列肽段多肽对应于亲本多肽(例如,野生型多肽)。在一个实施方案中,亲本多肽具有包
括m个氨基酸的氨基酸序列。氨基酸序列内的每个氨基酸位置由(AA)n表示,其中n是选自
1至m的成员。产生序列肽段多肽文库的示例性方法包括下列步骤:(i)通过在亲本多肽内
的第一个氨基酸位置(AA)n处引入本发明的O-联糖基化序列而产生第一种序列肽段多肽
(例如,通过重组方法、通过化学方法或通过其他方法);和(ii)通过在额外的氨基酸位置
处引入O-联糖基化序列而产生至少一种额外的序列肽段多肽。在一个实施方案中,所述额
外的氨基酸位置是(AA)n+x。在另一个实施方案中,所述额外的氨基酸位置是(AA)n-x。在这
些实施方案中,x是选自1至(m-n)的成员。在一个实施方案中,所述额外的序列肽段多肽
包含与第一种序列肽段多肽相同的O-联糖基化序列。在另一个实施方案中,所述额外的序
列肽段多肽包含与第一种序列肽段多肽不同的O-联糖基化序列。在示例性的实施方案中,
通过上文描述的“序列肽段扫描”来产生序列肽段多肽文库。可用于本发明文库的示例性
亲本多肽和O-联糖基化序列也描述在本文中。先导多肽的鉴定
[0441] 可能希望在文库成员中选择出这样的多肽,所述多肽当进行酶促糖基化和/或糖PEG化反应时被有效地糖基化和/或糖PEG化。将被发现被有效地糖基化和/或糖PEG化
的序列肽段多肽称作“先导多肽”。在示例性的实施方案中,酶促糖基化或糖PEG化反应的
产率用于选择一种或多种先导多肽。在另一个示例性的实施方案中,先导多肽的酶促糖基
化或糖PEG化产率为约10%至约100%,优选约30%至约100%,更优选约50%至约100%,
和最优选约70%至约100%。任选地,通过使经糖基化的先导多肽进行另一酶促糖基化或
糖PEG化反应来进一步评估可被有效地糖基化的先导多肽。
[0442] 因此,本发明提供了用于鉴定先导多肽的方法。示例性的方法包括下列步骤:(i)产生本发明的序列肽段多肽文库;和(ii)使所述文库的至少一个成员进行酶促糖基化反
应(或任选地,酶促糖PEG化反应)。在一个实施方案中,在该反应期间,将糖基部分从糖
基供体分子转移到至少一个O-联糖基化序列上,其中所述糖基部分任选地用修饰基团进
行衍生化。该方法可以进一步包括:(iii)对于文库的至少一个成员,测量酶促糖基化或糖
PEG化反应的产率。可以使用本领域已知的任何方法和下文所描述的那些方法来完成所述
测量。该方法可以在步骤(ii)之前进一步包括:(iv)纯化文库的至少一个成员。
[0443] 步骤(ii)的被转移的糖基部分可以是任何糖基部分,包括单糖和寡糖以及糖基模拟基团。在示例性的实施方案中,在最初的糖基化反应中被添加至序列肽段多肽的糖基
部分是Gal部分。在另一个示例性的实施方案中,糖基部分是GalNAc部分。可以使用后继
的糖基化反应以向所得的GalNAc-多肽添加额外的糖基残基(例如,Gal)。修饰基团可以是
本发明的任何修饰基团,包括水溶性聚合物,例如mPEG。在一个实施方案中,步骤(ii)的酶
促糖基化反应在其中表达所述多肽的宿主细胞之中发生。在另一个实施方案中,步骤(ii)
和步骤(ii)在相同的反应容器中进行。该方法可以进一步包括(v):使步骤(ii)的产物进
行PEG化反应。在一个实施方案中,所述PEG化反应是酶促糖PEG化反应。在另一个实施
方案中,所述PEG化反应是化学PEG化反应。该方法可以进一步包括:(vi)测量PEG化反应
的产率。可用于测量PEG化反应的产率的方法在下文描述。该方法可以进一步包括:(vii)
产生包含编码序列肽段多肽的核酸序列的表达载体。该方法可以进一步包括:(viii)用该
表达载体转染宿主细胞。
[0444] 用于产生序列肽段多肽(包括任何先导多肽)的方法是本领域已知的。示例性的方法描述在本文中。该方法可以包括:(i)产生包含对应于序列肽段多肽的核酸序列的表
达载体。该方法可以进一步包括:(ii)用该表达载体转染宿主细胞。该方法可以进一步包
括:(iii)在宿主细胞中表达所述序列肽段多肽。该方法可以进一步包括:(iv)分离所述序
列肽段多肽。该方法可以进一步包括:(v)例如,使用糖基转移酶例如GalNAc-T2,在O-联
糖基化序列处酶促糖基化所述序列肽段多肽。目的序列肽段多肽(例如,所选的先导多肽)
可以以工业规模进行表达(例如,导致分离出超过250mg,优选超过500mg的蛋白质)。
[0445] 在示例性的实施方案中,使序列肽段多肽文库的每个成员进行酶促糖基化反应。例如,每种序列肽段多肽分开地进行糖基化反应,并且对于一种或多种所选的反应条件,测
定糖基化反应的产率。
[0446] 在示例性的实施方案中,在进一步的加工例如糖基化和/或糖PEG化之前,纯化文库的一种或多种序列肽段多肽。
[0447] 在另一个实例中,可以合并几组序列肽段多肽,并使所得的序列肽段多肽混合物进行糖基化或糖PEG化反应。在一个示例性的实施方案中,使含有文库的所有成员的混合
物进行糖基化反应。在一个实例中,根据该实施方案,可以以少于化学计算量的量(相对于
存在的糖基化位点)将糖基供体试剂添加入糖基化反应混合物中,从而产生其中序列肽段
多肽竞争作为酶的底物的环境。然后,可以例如通过质谱分析来鉴定作为酶的底物的那些
序列肽段多肽,事先进行或不进行经糖基化的混合物的分离或纯化。该相同方法可以用于
这样的一组序列肽段多肽,其中每个序列肽段多肽含有不同的本发明的O-联糖基化序列。
[0448] 可以使用本领域已知的任何合适的方法来测定酶促糖基化反应、酶促糖PEG化反应或化学糖PEG化反应的产率。在示例性的实施方案中,使用涉及质谱法的技术(例如,
LC-MS、MALDI-TOF)来确定用于区分经糖基化或糖PEG化的多肽和未反应的(例如,非糖基
化或糖PEG化的)多肽的方法。在另一个示例性的实施方案中,使用涉及凝胶电泳的技术
来测定产率。在另外一个示例性的实施方案中,使用涉及核磁共振(NMR)的技术来测定产
率。在进一步的示例性实施方案中,使用涉及色谱法的技术,例如HPLC或GC,来测定产率。
在一个实施方案中,使用多孔平板(例如,96-孔平板)来平行地进行许多糖基化反应。该
平板可以任选地在每个孔的底部装备分离或过滤介质(例如,凝胶过滤膜)。在通过质谱法
或其他方法进行分析之前,可以使用旋转来预处理每个样品。宿主细胞内的糖基化
[0449] 作为本发明序列肽段多肽的一部分的突变型O-联糖基化序列的最初的糖基化也可以在其中表达所述多肽的宿主细胞内发生。该技术例如描述在于2006年9月6日提交
的美国临时专利申请号60/842,926中,其通过提及而以其整体合并入本文。宿主细胞可以
是原核微生物,例如大肠杆菌或假单胞菌菌株。在示例性的实施方案中,宿主细胞是trxB
gor supp突变型大肠杆菌细胞。
[0450] 在另一个示例性的实施方案中,通过下列方式来完成细胞内糖基化:在宿主细胞中共表达所述多肽和可以在细胞内将所述多肽用作底物并糖基化所述多肽的酶,并且在允
许糖部分在细胞内转移至糖基化序列的条件下使所述宿主细胞进行生长。一种示例性的酶
是“活性核苷酸糖:多肽糖基转移酶蛋白”(例如,可溶的活性真核生物N-乙酰半乳糖胺转
移酶)。在另一个示例性的实施方案中,其中表达序列肽段多肽的微生物具有细胞内氧化环
境。所述微生物可以被遗传修饰,从而具有细胞内氧化环境。细胞内糖基化不限于转移单
个糖基残基。可以通过共表达所需的酶和存在各自的糖基供体,而顺次添加几个糖基残基。
该方法也可以用于以商业规模产生序列肽段多肽。
[0451] 方法可用于确定序列肽段多肽是否在宿主细胞中在突变型O-联糖基化序列内被有效地糖基化。例如,通过质谱法来分析细胞裂解物(在一个或多个纯化步骤后),以测量
糖基化的和非糖基化的序列肽段多肽之间的比例。在另一个实例中,通过凝胶电泳来分析
细胞裂解物,从而将糖基化的多肽与非糖基化的多肽分开。先导多肽的进一步评估
[0452] 在其中最初的筛选程序涉及使用未修饰的糖基部分来进行酶促糖基化(例如,通过GalNAc-T2来转移GalNAc部分)的一个实施方案中,可以就其作为有效底物的能力来
进一步评估所选的先导多肽,以用于例如通过另一酶促反应或化学修饰来进行进一步的修
饰。在示例性的实施方案中,随后的“筛选”涉及使经糖基化的先导多肽进行另一糖基化
(例如,添加Gal)和/或PEG化反应。
[0453] PEG化反应可以例如是化学PEG化反应或酶促糖PEG化反应。为了鉴定被有效地糖PEG化的先导多肽,使至少一种先导多肽(任选地事先经糖基化)进行PEG化反应并测定
该反应的产率。在一个实例中,测定每种先导多肽的PEG化产率。在示例性的实施方案中,
PEG化反应的产率为约10%至约100%,优选约30%至约100%,更优选约50%至约100%,
和最优选约70%至约100%。可以使用适合于多肽分析的本领域已知的任何分析方法来测
定PEG化产率,所述分析方法例如为质谱法(例如,MALDI-TOF、Q-TOF)、凝胶电泳(例如,与
用于定量的方法例如光密度测定法相组合)、NMR技术以及色谱方法,例如HPLC(使用可用
于分开所分析的多肽的PEG化和非PEG化的种类的合适柱材料)。如上面关于糖基化所描
述的,可以使用多孔平板(例如,96-孔平板)来平行地进行许多PEG化反应。该平板可以
任选地在每个孔的底部装备分离或过滤介质(例如,凝胶过滤膜)。在通过质谱法或其他方
法进行分析之前,可以使用旋转和重构来预处理每个样品。
[0454] 在另一个示例性的实施方案中,在下述的“单罐反应”中发生序列肽段多肽的糖基化和糖PEG化。在一个实例中,将序列肽段多肽与第一种酶(例如,GalNAc-T2)和合适的
供体分子(例如,UDP-GalNAc)接触。将该混合物温育合适的时间,随后加入第二种酶(例
如,Core-1-GalT1)和第二种糖基供体(例如,UDP-Gal)。可以以该方式进行任何次数的额
外的糖基化/糖PEG化反应。备选地,可以将超过一种的酶和超过一种的糖基供体与突变
型多肽接触,以在一个反应步骤中添加超过一个的糖基残基。例如,将突变型多肽与3种不
同的酶(例如,GalNAc-T2、Core-1-GalT1和ST3Gal1)和三种不同的糖基供体部分(例如,
UDP-GalNAc、UDP-Gal和CMP-SA-PEG)在合适的缓冲液系统中接触,以产生经糖PEG化的突
变型多肽,例如多肽-GalNAc-Gal-SA-PEG(参见实施例4.6)。可以使用上述方法来测定总
产率。多肽缀合物的形成
[0455] 在另一个方面,本发明提供了在修饰基团和多肽之间形成共价缀合物的方法。在糖基化的或非糖基化的多肽和各种不同种类例如水溶性聚合物、治疗性部分、生物分子、诊
断性部分、靶向性部分等等之间形成本发明的多肽缀合物。将所述聚合物、治疗性部分或生
物分子通过糖基连接基团而缀合至所述多肽,所述糖基连接基团插入在所述多肽和所述修
饰基团(例如,水溶性聚合物)之间并且共价连接至所述多肽和所述修饰基团。经修饰的
糖的糖部分优选选自核苷酸糖、活化的糖和既不是核苷酸也没有活化的糖。
[0456] 在示例性的实施方案中,通过将经修饰的糖酶促附着至多肽而形成多肽缀合物。所述经修饰的糖直接添加至O-联糖基化序列,或者添加至直接或间接(例如,通过一个或
多个糖基残基)附着至O-联糖基化序列的糖基残基。
[0457] 用于制备本发明的多肽缀合物的示例性方法包括下列步骤:(i)重组产生包含本发明的O-联糖基化序列的序列肽段多肽,和(ii)在O-联糖基化序列处酶促糖基化所述序
列肽段多肽。在示例性的实施方案中,该方法包括将突变型多肽与包含糖基供体(例如,经
修饰的糖)和酶例如糖基转移酶(例如,人GalNAc-T2)的混合物接触,其中所述糖基供体
是所述酶的底物。在适合于该酶在糖基部分和多肽之间形成共价键的条件下进行该反应。
[0458] 例用酶例如糖基转移酶的极佳的选择性,本方法提供了在一个或多个特定位置处携带有修饰基团的多肽。因此,根据本发明,将经修饰的糖直接附着至在多肽链内的O-联
糖基化序列,或者备选地,将经修饰的糖附加在糖肽的碳水化合物部分上。这样的多肽也在
本发明的范围内,在所述多肽中,经修饰的糖结合至经糖基化的位点和直接结合至多肽主
链的氨基酸残基。
[0459] 与已知的化学和酶促的肽精细制作策略不同,本发明的方法使得可能装配具有基本上均一的衍生化模式的多肽和糖肽。用于本发明的酶一般对于多肽的特定氨基酸残基或
者氨基酸残基的组合而言是选择性的。本发明的方法还为大规模生产经修饰的多肽和糖肽
提供了实际手段。
[0460] 在示例性的实施方案中,以下面的方式使多肽进行O-糖基化和用水溶性聚合物进行官能化。产生具有可利用的O-联糖基化序列的多肽。将GalNAc添加至在糖基化序列
内的丝氨酸或苏氨酸残基,并使用ST6Gal-1用唾液酸-修饰基团盒使所得的GalNAc-肽
唾液酸化。备选地,使用Core-1-GalT-1使GalNac-肽半乳糖基化,并使用ST3Gal-1用
唾液酸-修饰基团盒使产物唾液酸化。根据该方法的示例性缀合物具有下面的连接:
* *
Thr-α-1-GalNAc-β-1,3-Gal-α2,3-Sia ,其中Sia 是唾液酸-修饰基团盒。
[0461] 糖基化步骤可以分开地进行,或者在“单罐”反应中使用多种酶和糖基供体组合进行。例如,在上述三酶反应中,可以在单个容器中合并GalNAc转移酶、GalT和SiaT以及各
自的糖基供体分子。备选地,可以首先进行GalNAc反应,并随后添加GalT和SiaT以及合
适的糖基供体。另一个实例涉及顺次添加每种酶和合适的糖基供体,并以“单罐”模式进行
该反应。上述方法的组合也可以用于制备本发明的化合物。
[0462] 在本发明的缀合物中,Sia-修饰基团盒可以以α-2,6或α-2,3键连接至Gal。
[0463] 本发明还提供了手段以向多肽添加(或除去)一个或多个所选的糖基残基,之后将经修饰的糖缀合至多肽的至少一个所选的糖基残基上。例如,当希望将经修饰的糖缀合
至不存在于多肽上或不以所希望的量存在的所选糖基残基时,本实施方案是有用的。因此,
在将经修饰的糖偶联至多肽之前,通过酶促或化学偶联将所选的糖基残基缀合至所述多
肽。在另一个实施方案中,在缀合经修饰的糖之前,通过从糖肽上除去碳水化合物残基来改
变该糖肽的糖基化模式。参见例如,WO 98/31826。
[0464] 通过化学或酶促方法来完成存在于糖肽上的任何碳水化合物部分的添加或除去。优选地,通过将多肽暴露于三氟甲磺酸或等同的化合物来进行化学去糖基化。该处理导致
除了连接性糖(N-乙酰葡糖胺或N-乙酰半乳糖胺)之外的大多数或所有糖的切割,而使该
多肽保持完整。化学去糖基化由Hakimuddin等人,Arch.Biochem.Biophys.259:52(1987)
和Edge等人,Anal.Biochem.118:131(1981)进行了描述。通过使用由Thotakura等人,
Meth.Enzymol.138:350(1987)所描述的各种内切和外切糖苷酶可以实现多肽变体上碳水
化合物部分的酶促切割。
[0465] 通过任何本领域公认的方法来进行糖基部分的化学添加。优选地,使用本文所述方法的修正形式(其中用天然糖基单位代替在本发明中使用的经修饰的糖)来实现糖
部分的酶促添加。用于添加糖部分的其他方法公开在美国专利号5,876,980;6,030,815;
5,728,554和5,922,577中。用于本发明的示例性方法描述在于1987年9月11日公布的
WO 87/05330中以及在Aplin和Wriston,CRC CRIT.REV.BIOCHEM.,pp.259-306(1981)中。包含
两个或更多多肽的多肽缀合物
[0466] 还提供了包含通过接头臂连接在一起的两个或更多多肽的缀合物,即多功能缀合物;至少一个多肽被O-糖基化或者包含突变型O-联糖基化序列。本发明的多功能缀合物
可以包含两个或更多拷贝的相同多肽或者具有不同结构和/或性质的各种不同多肽的集
合。在根据该实施方案的示例性缀合物中,两个多肽之间的接头通过O-联糖基残基,例如
O-联糖基完整糖基连接基团,而附着至所述多肽中的至少一个。
[0467] 在一个实施方案中,本发明提供了用于通过连接基团来连接两个或更多多肽的方法。连接基团可以具有任何有用的结构并且可以选自直链和支链结构。优选地,附着至多
肽的接头的每个末端包含经修饰的糖(即,新生的完整糖基连接基团)。
[0468] 在本发明的示例性方法中,两个多肽通过包含PEG接头的接头部分而连接在一起。该构建体符合上面图式中给出的一般结构。如本文所述,本发明的构建体包含两个完
整的糖基连接基团(即,s+t=1)。聚焦于包含两个糖基基团的PEG接头是为了清楚的目
的,并不应当被解释为限制了用于在本发明的该实施方案中使用的接头臂的身份。
[0469] 因此,PEG部分在第一个末端处用第一糖基单位进行官能化,并在第二个末端处用第二糖基单位进行官能化。所述第一和第二糖基单位优选是不同的转移酶的底物,从而
允许第一个和第二个多肽分别正交附着至所述第一和第二糖基单位。在实践中,将(糖
1 2
基)-PEG-(糖基) 接头与第一种多肽和第一种转移酶(所述第一糖基单位是其底物)接
1 1 2
触,从而形成(肽)-(糖基)-PEG-(糖基)。然后,任选地从反应混合物中除去转移酶和
1 1 2
/或未反应的多肽。向该(肽)-(糖基)-PEG-(糖基) 缀合物添加第二种多肽和第二种
1 1 2 2
转移酶(所述第二糖基单位是其底物),从而形成(肽)-(糖基)-PEG-(糖基)-(肽) ;
所述糖基残基中的至少一个是直接或间接地O-联的。本领域技术人员将会意识到,上面所
概述的方法也可应用于在超过两个的多肽之间形成缀合物,例如通过使用支化的PEG、树枝
状聚合物、聚(氨基酸)、多糖等等。
[0470] 在示例性的实施方案中,将干扰素α2β(IFN-α2β)通过双官能接头而缀合至转铁蛋白,所述接头在PEG部分的每个末端包含完整的糖基连接基团(方案6)。该IFN缀
合物由于该缀合物的更大的分子尺寸而具有比单独的IFN更长的体内半寿期。此外,IFN
与转铁蛋白的缀合用于将该缀合物选择性地靶向脑。例如,将PEG接头的一个末端用CMP
唾液酸进行官能化,并且另一个末端用UDP GalNAc进行官能化。在GalNAc转移酶存在下
将该接头与IFN相组合,从而导致接头的GalNAc附着至在IFN上的丝氨酸和/或苏氨酸残
基。方案6
[0471] 上述过程可以如所希望的进行许多循环,并且不限于用单个接头在两个多肽之间形成缀合物。此外,本领域技术人员将会意识到,用多肽使在PEG(或其他)接头的末端处
的完整糖基连接基团官能化的反应可以在同一个反应容器中同时进行,或者它们可以以逐
步的方式进行。当反应以逐步的方式进行时,将在每步产生的缀合物任选地从一种或多种
反应组分(例如,酶、肽)中纯化出来。
[0472] 更进一步的示例性实施方案在方案7中给出。方案7显示了制备缀合物的方法,所述缀合物将所选的蛋白质例如GM-CSF靶向骨并且增加所选的蛋白质的循环半寿期。方
案7
其中,G是在活化的糖部分(例如,糖核苷酸)上的糖基残基,其在缀合物中被转化为完整
的糖基接头基团。当s大于0时,L是糖基连接基团,例如GalNAc或GalNAc-Gal。
[0473] 在其中利用了反应性PEG衍生物的另一个示例性实施方案中,本发明提供了用于延长所选多肽的血液循环半寿期、大体上将该多肽靶向血池的方法,
该方法通过将所述多肽缀合至合成的或天然的聚合物(例如,白蛋白)来完成,
所述聚合物的大小足以阻碍肾小球滤过该蛋白质。本发明的该实施方案在方
案8中举例说明,其中使用化学和酶促修饰的组合,通过PEG接头将示例性的
多肽G-CSF缀合至白蛋白。方案8:使用活化的PEG类似物来形成多肽缀合物
[0474] 如方案8中所显示的,用反应性PEG衍生物例如X-PEG-(CMP-唾液酸)来修饰白蛋白的残基(例如,氨基酸侧链),其中X是活化基团(例如,活性酯、异硫氰酸酯等等)。将
PEG衍生物和G-CSF合并,并与转移酶接触,其中CMP-唾液酸是该转移酶的底物。在进一
步的举例说明性的实施方案中,将赖氨酸的ε-胺与PEG-接头的N-羟基琥珀酰亚胺酯反
应,从而形成白蛋白缀合物。将接头的CMP-唾液酸酶促缀合至在GCSF上的合适残基,例如
Gal或GalNAc,从而形成缀合物。本领域技术人员将会意识到,上述方法并不限于所示的反
应参与物。此外,可以实施该方法以形成包含超过两个的蛋白质部分的缀合物,例如通过利
用具有超过两个末端的支化的接头。将经修饰的糖酶促缀合至多肽
[0475] 将经修饰的糖缀合至糖基化或非糖基化的多肽,其中使用合适的酶来介导该缀合。优选地,选择修饰的供体糖、酶和接纳体多肽的浓度,从而使得糖基化反应持续进行,直
到接纳体被耗尽。下面所讨论的考虑尽管是在唾液酸转移酶的情况下给出的,但是通常可
应用于其他糖基转移酶反应。
[0476] 使用糖基转移酶来合成所希望的寡糖结构的许多方法是已知的并且通常可应用于本发明。示例性的方法例如描述于下列文献中:WO 96/32491和Ito等人,Pure Appl.
Chem.65:753(1993),以及美国专利号5,352,670、5,374,541和5,545,553。
[0477] 使用单种糖基转移酶或者糖基转移酶的组合来实施本发明。例如,可以使用唾液酸转移酶和半乳糖基转移酶的组合。在使用超过一种酶的那些实施方案中,优选地将酶和
底物合并在最初的反应混合物中,或者一旦第一个酶促反应完成或者接近完成,就将用于
第二个酶促反应的酶和试剂加入反应介质中。通过在单个容器中依次进行两个酶促反应,
总产率相对于其中分离出中间体种类的程序而言得到了提高。此外,减少了多余的溶剂和
副产物的清除和处置。
[0478] 本发明缀合物的O-联糖基部分通常以附着至多肽的GalNAc部分为起始。GalNAc转移酶家族中的任何成员(例如,在本文表13中所描述的那些)可以用于将GalNAc
部分结合至多肽(参见例如,Hassan H,Bennett EP,Mandel U,Hollingsworth MA和
Clausen H(2000);Control of Mucin-Type O-Glycosylation:O-GlycanOccupancy is
Directed by Substrate Specificities of PolypeptideGalNAc-Transferases;Eds.
Ernst,Hart和Sinay;Wiley-VCH chapter″Carbohydrates in Chemistry and Biology-a
ComprehensionHandbook″,273-292)。GalNAc部分自身可以是糖基连接基团,并用修饰基
团来进行衍生化。备选地,使用一种或多种酶和一种或多种合适的糖基供体底物来扩建糖
基残基。那么,可以将经修饰的糖添加至延伸的糖基部分。
[0479] 所述酶通常通过与内切聚糖酶水解步骤的逆反应类似的合成步骤来催化该反应。在这些实施方案中,糖基供体分子(例如,所希望的寡糖或单糖结构)含有离去基团,并且
通过将供体分子添加至在蛋白质上的GlcNAc残基而持续进行该反应。例如,离去基团可以
是卤素,例如氟化物。在其他实施方案中,离去基团是Asn,或Asn-肽部分。在进一步的实
施方案中,修饰在糖基供体分子上的GlcNAc残基。例如,GlcNAc残基可以包含1,2噁唑啉
部分。
[0480] 在另一个实施方案中,用于产生本发明缀合物的每种酶以催化量存在。特定酶的催化量依据该酶的底物的浓度以及反应条件例如温度、时间和pH值而变。在预选的底物浓
度和反应条件下测定给定酶的催化量的方法是本领域技术人员公知的。
[0481] 施行上述方法所处的温度可以为从刚刚高于冰点到大多数敏感的酶变性的温度。优选的温度范围是约0℃至约55℃,和更优选约20℃至约32℃。在另一个示例性的实施方
案中,在升高的温度下使用嗜热的酶来进行本发明方法的一个或多个组成部分。
[0482] 让反应混合物保持足够使接纳体被糖基化的一段时间,从而形成所希望的缀合物。数小时后通常可以检测到一些缀合物,通常在24小时或更短时间内获得可回收的量。
本领域技术人员理解,反应速率取决于许多可变因素(例如,酶浓度、供体浓度、接纳体浓
度、温度、溶剂体积),它们对于所选的系统进行优化。
[0483] 本发明还提供了经修饰的多肽的工业规模的生产。如本文所使用的,工业规模通常产生至少约250mg,优选至少约500mg,和更优选至少约1g完成的纯化的缀合物,优选在
单次反应循环后,即所述缀合物不是来自相同的连续重复的合成循环的反应产物的组合。
[0484] 在下面的讨论中,通过将经修饰的唾液酸部分缀合至经糖基化的多肽来举例说明本发明。该示例性的经修饰的唾液酸用(m-)PEG进行标记。下面关于经PEG修饰的唾液酸
和经糖基化的多肽的使用的讨论焦点是为了清楚地举例说明,而并不意在暗示本发明局限
于这两种配偶体的缀合。技术人员理解,该讨论通常可应用于添加除唾液酸之外的其他经
修饰的糖基部分。此外,该讨论同样可应用于用除PEG之外的其他试剂(包括其他水溶性
聚合物、治疗性部分和生物分子)来修饰糖基单位。
[0485] 酶促方法可用于在多肽或糖肽上选择性地引入修饰基团(例如,mPEG或mPPG)。在一个实施方案中,该方法利用包含修饰基团的经修饰的糖与合适的糖基转移酶或糖合酶
(glycosynthase)的组合。通过选择将会产生所希望的碳水化合物连接的糖基转移酶和利
用经修饰的糖作为供体底物,可以将修饰基团直接引入到多肽主链上,引入到糖肽的现有
糖残基上,或者引入到被添加至多肽的糖残基上。在另一个实施方案中,该方法利用经修饰
的糖,其携带被掩蔽的反应性官能团,该官能团在经修饰的糖转移到多肽或糖肽上后可以
用于附着修饰基团。
[0486] 在一个实例中,糖基转移酶是唾液酸转移酶,其用于在糖肽上附加经修饰的唾液酸基残基。唾液酸基残基的糖苷接纳体可以例如在多肽表达期间被添加至O-联糖基化序
列或者可以在多肽表达后通过化学或酶促方法添加,通过使用合适的糖苷酶、糖基转移酶
或其组合。合适的接纳体部分包括,例如半乳糖基接纳体,例如GalNAc、Galβ1,4GlcNAc、
Galβ1,4GalNAc、Galβ1,3GalNAc、乳-N-四 糖(lacto-N-tetraose)、Galβ1,3GlcNAc、
Galβ1,3Ara、Galβ1,6GlcNAc、Galβ1,4Glc(乳糖),和本领域技术人员已知的其他接纳
体(参见例如,Paulson等人,J.Biol.Chem.253:5617-5624(1978))。
[0487] 在示例性的实施方案中,通过GalNAc转移酶的作用将GalNAc残基添加至O-联糖 基 化 序列。Hassan H,Bennett EP,MandelU,Hollingsworth MA和 Clausen
H(2000),Control of Mucin-TypeO-glycosylation:O-Glycan Occupancy is Directed
by SubstrateSpecificities of Polypeptide GalNAc-Transferases(Eds.Ernst,
Hart 和 Sinay),Wiley-VCH chapter ″ Carbohydrates in Chemistry andBiology-a
Comprehension Handbook″,第273-292页。该方法包括将待修饰的多肽与含有合适量的
半乳糖基转移酶和合适的半乳糖基供体的反应混合物一起进行温育。允许该反应基本上进
行到完成,或者备选地,当加入预选量的半乳糖残基时该反应被终止。用于装配所选的糖接
纳体的其他方法对于本领域技术人员而言将是明显的。
[0488] 在下面的讨论中,通过使用附着有水溶性聚合物的经修饰的糖来举例说明本发明的方法。讨论的焦点是为了清楚地举例说明。技术人员将会意识到,该讨论同样与其中经
修饰的糖携带有治疗性部分、生物分子等的那些实施方案相关。
[0489] 在另一个示例性的实施方案中,经由经修饰的半乳糖基(Gal)残基将水溶性聚合物添加至GalNAc残基。备选地,可以将未修饰的Gal添加至末端GalNAc残基。
[0490] 在更进一步的实例中,使用经修饰的唾液酸部分和合适的唾液酸转移酶将水溶性聚合物(例如,PEG)添加到末端Gal残基上。该实施方案
在下面的方案9中图解说明。方案9:向糖蛋白添加经修饰的唾液酸基部分
[0491] 在更进一步的方法中,掩蔽的反应官能度存在于唾液酸上。掩蔽的反应性基团优选地不受用于将经修饰的唾液酸附着至多肽的条件的影响。在将经修饰的唾液酸共价附着
至多肽后,除去掩蔽物,并通过在经修饰的糖残基上的未掩蔽的反应性基团与反应性修饰
基团的反应,将多肽缀合至修饰基团,例如水溶性聚合物(例如,PEG或PPG)。该策略在下
面的方案10中图解说明。方案10:使用携带有反应性官能团的唾液酸基部分来修饰糖肽
[0492] 任何 经 修饰 的糖 可 以与 合 适的 糖基 转 移酶 组合 使 用,这 取 决于 糖 肽 的 寡 糖 侧 链 的 末 端 糖 (表 12)。 表12:示 例 性 的 经 修 饰 的 糖
X=O,NH,S,CH2,N-(R1-5)2。
Y=X;Z=X;A=X;B=X。 目的配体=酰基-PEG、酰基-PPG、烷基-PEG、酰基-烷基-PEG、
酰基-烷基-PEG、氨基甲酰基-PEG、氨基甲酰基-PPG、PEG、
Q=H2,O,S,NH,N-R。 PPG、酰基-芳基-PEG、酰基-芳基-PPG、芳基-PEG、芳基
-PPG、甘露糖-6-磷酸、肝素、乙酰肝素、SLex、甘露糖、
R,R1-4=H,接头-M,M。 FGF、VFGF、蛋白质、软骨素、角质素、皮肤素、白蛋白、
M=目的配体 整联蛋白、肽,等等。
[0493] 在一个备选的实施方案中,通过使用已知将糖残基转移至在多肽主链上的O-联糖基化序列的糖基转移酶,来将经修饰的糖直接添加至肽主链。该示例性的实施方案在下
面的方案11中给出。可用于实施本发明的示例性糖基转移酶包括,但不限于,GalNAc转移
酶(GalNAc T1至GalNAc T20)、GlcNAc转移酶、岩藻糖基转移酶、葡糖基转移酶、木糖基转
移酶、甘露糖基转移酶,等等。该方法的使用允许将经修饰的糖直接添加到缺少任何碳水化
合物的多肽上,或者添加到现有的糖肽上。方案11:将示例性的经修饰的糖转移到无预先
糖基化的多肽上
[0494] 在上面给出的每个示例性实施方案中,在将经修饰的糖缀合至多肽后,可以利用一个或多个额外的化学或酶促修饰步骤。在示例性的实施方案中,酶(例如,岩藻糖基转移
酶)用于将糖基单位(例如,岩藻糖)附加在附着至多肽的末端的经修饰的糖上。在另一
个实例中,利用酶促反应来“帽化”(例如,唾液酸化)经修饰的糖所不能缀合的位点。备
选地,利用化学反应来改变缀合的经修饰的糖的结构。例如,将缀合的经修饰的糖与这样的
试剂反应,所述试剂使它与附着了经修饰的糖的多肽组分的连接稳定化或去稳定化。在另
一个实例中,经修饰的糖的组分在其缀合至多肽后被去保护。技术人员将会意识到,在经修
饰的糖缀合至多肽后的阶段,存在有许多可用于本发明方法的酶促和化学程序。经修饰的
糖-肽缀合物的进一步精细制作在本发明的范围内。
[0495] 在另一个示例性的实施方案中,将糖肽缀合至靶向性试剂,例如,转铁蛋白(以将多肽递送穿过血脑屏障,并至内体),肉碱(以将多肽递送到肌细胞;参见例如,LeBorgne等
人,Biochem.Pharmacol.59:1357-63(2000)),和膦酸例如二膦酸(以将多肽靶向骨和其他
含钙组织;参见例如,Modern Drug Discovery,2002年8月,第10页)。可用于靶向的其
他试剂对于本领域技术人员而言是明显的。例如,葡萄糖、谷氨酰胺和IGF也可用于靶向肌
肉。
[0496] 通过本文讨论的或本领域已知的任何方法来缀合靶向性部分和治疗性多肽。技术人员将会意识到,除了上面所示的那些之外的其他多肽也可以如本文所述的进行衍生化。
示例性的多肽在共同待决的共有的美国临时专利申请号60/328,523(2001年10月10日提
交)的附录中给出。
[0497] 在示例性的实施方案中,靶向性试剂和治疗性多肽通过接头部分而偶联。在该实施方案中,根据本发明的方法,将治疗性多肽或靶向性试剂中的至少一个经由完整的糖基
连接基团而偶联至接头部分。在示例性的实施方案中,接头部分包括聚(醚),例如聚(乙
二醇)。在另一个示例性的实施方案中,接头部分包括至少一个在体内降解的键,从而在将
缀合物递送到身体的所靶向的组织或区域后,从靶向性试剂上释放出治疗性多肽。
[0498] 在另外一个示例性的实施方案中,通过改变治疗性部分上的糖形而不将治疗性多肽缀合至靶向性部分,来改变治疗性部分的体内分布。例如,通过用唾液酸(或其衍生物)
来帽化糖基基团的末端半乳糖部分,可以避免治疗性多肽被网状内皮系统摄取。酶糖基转
移酶
[0499] 糖基转移酶催化以逐步方式将活化的糖(供体NDP-糖)添加至蛋白质、糖肽、脂质或糖脂,或者添加至正在生长的寡糖的非还原末端。如此来合成N-联糖肽:经由转移酶,
以及连接了脂质的寡糖供体Dol-PP-NAG2Glc3Man9的整个儿转移,随后修整该核心。在该情
况下,“核心”糖的性质与随后的附着物稍有不同。非常大量的糖基转移酶是本领域已知的。
[0500] 待用于本发明的糖基转移酶可以是任一种,只要它可以利用经修饰的糖作为糖供体。此类酶的实例包括Leloir途径糖基转移酶,例如半乳糖基转移酶、N-乙酰葡糖胺转移
酶、N-乙酰半乳糖胺转移酶、岩藻糖基转移酶、唾液酸转移酶、甘露糖基转移酶、木糖基转移
酶、葡糖苷酸基转移酶等等。
[0501] 对于涉及糖基转移酶反应的酶促糖合成,可以从任何来源克隆或分离糖基转移酶。许多经克隆的糖基转移酶以及它们的多核苷酸序列是已知的。糖基转移酶的氨基酸序
列和编码糖基转移酶的核苷酸序列(从其可以推导出氨基酸序列)可在各种公众可得的数
据库中找到,包括GenBank、Swiss-Prot、EMBL等等。
[0502] 可用于本发明方法的糖基转移酶包括但不限于,半乳糖基转移酶、岩藻糖基转移酶、葡糖基转移酶、N-乙酰半乳糖胺转移酶、N-乙酰葡糖胺转移酶、葡糖苷酸基转移酶、唾
液酸转移酶、甘露糖基转移酶、葡糖醛酸转移酶、半乳糖醛酸转移酶和寡糖基转移酶。合适
的糖基转移酶包括从真核生物中以及从原核生物中获得的那些。
[0503] 编码糖基转移酶的DNA可以通过化学合成而获得,通过筛选来自合适细胞或细胞系培养物的mRNA的反转录物而获得,通过筛选来自合适细胞的基因组文库而获得,或者通
过这些程序的组合而获得。mRNA或基因组DNA的筛选可以用从糖基转移酶基因序列产生
的寡核苷酸探针来进行。探针可以根据已知的程序用可检测基团例如荧光基团、放射性原
子或化学发光基团进行标记,并用于常规的杂交测定法中。备选地,可以使用从糖基转移
酶基因序列产生的PCR寡核苷酸引物,通过采用聚合酶链式反应(PCR)程序来获得糖基转
移酶基因序列(参见例如,Mullis等人的美国专利号4,683,195和Mullis的美国专利号
4,683,202)。
[0504] 可以在用含有编码糖基转移酶的DNA的载体转化的宿主细胞中合成糖基转移酶。载体用于扩增编码糖基转移酶的DNA和/或表达编码糖基转移酶的DNA。表达载体是可复
制的DNA构建体,其中编码糖基转移酶的DNA序列有效地连接至合适的控制序列,所述控制
序列能够实现糖基转移酶在合适宿主中的表达。对于此类控制序列的需要将依据所选的宿
主和所选的转化方法而变。一般地,控制序列包括转录启动子,用于控制转录的任选的操纵
基因序列,编码合适的mRNA核糖体结合位点的序列,以及控制转录和翻译终止的序列。扩
增载体不需要表达控制结构域。所有所需要的是在宿主中复制的能力,这通常由复制起点
来赋予,和有助于识别转化体的选择基因。
[0505] 在示例性的实施方案中,本发明利用原核生物的酶。此类糖基转移酶包括参与脂寡糖(LOS)合成的酶,所述脂寡糖由许多革兰氏阴性细菌产生(Preston等人,
Critical Reviews in Microbiology23(3):139-180(1996))。此类酶包括但不限于,
诸如大肠杆菌和鼠伤寒沙门氏菌(Salmonella typhimurium)的物种的rfa操纵子的蛋
白质,包括β1,6半乳糖基转移酶和β1,3半乳糖基转移酶(参见,例如EMBL登录号
M80599和M86935(大肠杆菌);EMBL登录号S56361(鼠伤寒沙门氏菌)),葡糖基转移酶
(Swiss-Prot登录号P25740(大肠杆菌)),β1,2-葡糖基转移酶(rfaJ)(Swiss-Prot登录
号P27129(大肠杆菌)和Swiss-Prot登录号P19817(鼠伤寒沙门氏菌)),和β1,2-N-乙
酰葡糖胺转移酶(rfaK)(EMBL登录号U00039(大肠杆菌))。氨基酸序列已知的其他糖基
转移酶包括由诸如rfaB(其已经在诸如肺炎克雷伯氏菌(Klebsiella pneumoniae)、大
肠杆菌、鼠伤寒沙门氏菌、肠沙门氏菌(Salmonella enterica)、小肠结肠炎耶尔森氏菌
(Yersiniaenterocolitica)、麻风分枝杆菌(Mycobacterium leprosum)的生物中得到表
征)的操纵子所编码的那些,以及由铜绿假单胞菌(Pseudomonas aeruginosa)的rh1操纵
子所编码的那些。
[0506] 也适合用于本发明的是参与产生这样的结构的糖基转移酶,所述结构包含乳-N-新四糖(lacto-N-neotetraose),D-半乳糖基-β-1,4-N-乙酰基-D-葡糖胺
k
基-β-1,3-D-半乳糖基-β-1,4-D-葡萄糖,和P 血型三糖序列,D-半乳糖基-α-1,
4-D-半乳糖基-β-1,4-D-葡萄糖,它们已经在粘膜病原体淋病奈瑟氏球菌(Neisseria
gonnorhoeae)和脑膜炎奈瑟氏球菌(N.meningitidis)的LOS中得到了鉴定(Scholten等
人,J.Med.Microbiol.41:236-243(1994))。来自脑膜炎奈瑟氏球菌和淋病奈瑟氏球菌的
基因(其编码参与这些结构的生物合成的糖基转移酶)已经从脑膜炎奈瑟氏球菌免疫型
L3和L1(Jennings等人,Mol.Microbiol.18:729-740(1995))和淋病奈瑟氏球菌突变体
F62(Gotshlich,J.Exp.Med.180:2181-2190(1994))中鉴定出来。在脑膜炎奈瑟氏球菌中,
由三个基因即lgtA、lgtB和lgE组成的基因座编码糖基转移酶,该酶是添加乳-N-新四糖
链中的最后三个糖所必需的(Wakarchuk等人,J.Biol.Chem.271:19166-73(1996))。最近,
证明了lgtB和lgtA基因产物的酶活性,这提供了所提出的它们的糖基转移酶功能的第一
个直接证据(Wakarchuk等人,J.Biol.Chem.271(45):28271-276(1996))。在淋病奈瑟氏球
菌中,存在两个额外的基因,即lgtD和lgtC,lgtD向乳-N-新四糖结构的末端半乳糖的3
k
位添加β-D-GalNAc,lgtC向截短的LOS的乳糖元件添加末端α-D-Gal,从而产生P 血型
k
抗原结构(Gotshlich(1994),同上)。在脑膜炎奈瑟氏球菌中,分开的免疫型L1也表达P
血型抗原并且已经显示出携带lgtC基因(Jennings等人,(1995),同上)。奈瑟氏球菌糖基
转移酶和相关的基因还描述于USPN 5,545,553(Gotschlich)中。还已经表征了来自幽门
螺杆菌(Helicobacter pylori)的α1,2-岩藻糖基转移酶和α1,3-岩藻糖基转移酶的基
因(Martin等人,J.Biol.Chem.272:21349-21356(1997))。空肠弯曲杆菌(Campylobacter
jejuni)的糖基转移酶也可用于本发明(参见例如,http://afmb.cnrs-mrs.fr/~pedro/
CAZY/gtf_42.html)。(a)GalNAc转移酶
[0507] O-联糖基化中的第一步可以通过UDP-GalNAc:多肽N-乙酰半乳糖胺转移酶(GalNAc-转移酶)大家族中的一个或多个成员来催化,它们通常将GalNAc转移至丝氨
酸和苏氨酸接纳体位点(Hassan等人,J.Biol.Chem.275:38197-38205(2000))。迄今已
经鉴定和表征了哺乳动物GalNAc-转移酶家族的12个成员(Schwientek等人,J.Biol.
Chem.277:22623-22638(2002)),并且已经从基因组数据库的分析中预测出了该基因家
族的几个另外的推定的成员。GalNAc-转移酶同种型具有不同的动力学性质并且显示出
在时间和空间上有差别的表达模式,这暗示它们具有不同的生物学功能(Hassan等人,
J.Biol.Chem.275:38197-38205(2000))。GalNAc-转移酶的序列分析已经导致这样的假
设,即这些酶含有两个不同的亚基:中心催化单位和C-末端单位,该C-末端单位与植物凝
集素蓖麻毒蛋白具有序列相似性,被称作“凝集素结构域”(Hagen等人,J.Biol.Chem.274:
6797-6803(1999);Hazes,Protein Eng.10:1353-1356(1997);Breton等 人,Curr.Opin.
Struct.Biol.9:563-571(1999))。涉及所选保守残基的位点特异性诱变的先前实验证实,
催化结构域中的突变消除了催化活性。相反地,“凝集素结构域”中的突变对于GalNAc-转
移酶同种型GalNAc-T1的催化活性没有显著影响(Tenno等人,J.Biol.Chem.277(49):
47088-96(2002))。因此,认为C-末端“凝集素结构域”没有功能,并且在GalNAc-转移酶
的酶促功能中不起作用(Hagen等人,J.Biol.Chem.274:6797-6803(1999))。
[0508] 没有展示出表观GalNAc-糖肽特异性的多肽GalNAc-转移酶也似乎受它们的推定的凝集素结构域的调节(PCT WO 01/85215A2)。近来,发现GalNAc-T1推定的凝集
素结构域中的突变,类似于以前在GalNAc-T4中分析的那些突变(Hassan等人,J.Biol.
Chem.275:38197-38205(2000)),以类似于GalNAc-T4的方式调节该酶的活性。因此,尽
管野生型GalNAc-T1向具有多个接纳体位点的多肽底物添加多个连续的GalNAc残基,但
是突变的GalNAc-T1不能向相同底物添加超过一个的GalNAc残基(Tenno等人,J.Biol.
Chem.277(49):47088-96(2002))。更近来,测定了鼠GalNAc-T1(Fritz等人,PNAS 2004,
101(43):15307-15312)以及人类GalNAc-T2(Fritz等人,J.Biol.Chem.2006,281(13):
8613-8619)的x射线晶体结构。人GalNAc-T2结构揭示了在催化性结构域和凝集素结构域
之间的出乎意料的柔韧性,并且暗示了被GalNAc-T2用于捕获糖基化的底物的新机制。对
于缺少凝集素结构域的GalNAc-T2的动力学分析证实了该结构域在作用于糖肽底物中的
重要性。然而,除去凝集素结构域没有显著地影响对于非糖基化的底物的酶活性。因此,缺
少凝集素结构域的截短的人GalNAc-T2酶或者具有截短的凝集素结构域的那些酶可用于
多肽底物的糖基化,其中所得的单糖基化的多肽的进一步糖基化不是所希望的。
[0509] 最近的证据证明,一些GalNAc-转移酶对于部分地GalNAc-糖基化的糖肽显示出独特的活性。至少三种GalNAc-转移酶同种型(GalNAc-T4、-T7和-T10)的催化作用选择
性地作用于对应于粘蛋白串联重复结构域的糖肽,其中仅仅一些簇集的潜在糖基化序列已
被其他GalNAc-转移酶GalNAc糖基化(Bennett等人,FEBS Letters 460:226-230(1999);
Ten Hagen等人,J.Biol.Chem.276:17395-17404(2001);Bennett等人,J.Biol.Chem.273:
30472-30481(1998);TenHagen等人,J.Biol.Chem.274:27867-27874(1999))。除了以前
利用的那些以外,GalNAc-T4和-T7识别不同的GalNAc-糖基化的多肽并且催化将GalNAc
转移至接纳体底物位点。预测此类GalNAc-转移酶活性的一个功能是代表了在具有高密度
O-联糖基化的糖蛋白中O-聚糖占有密度的控制步骤。
[0510] 其一个实例是癌症相关的粘蛋白MUC1的糖基化。MUC1含有20个残基(HGVAPD RPAPG APPA)的串联重复O-联糖基化的区域,其具有5个潜在的O-联糖基化
序列。GalNAc-T1、-T2和-T3可以起始MUC1串联重复的糖基化,并且可以仅在三个位点
处掺入(HGVTSAPDTRPAPGSTAPPA,GalNAc附着位点加有下划线)。GalNAc-T4是独特的,
因为它是迄今鉴定的可以完成下列功能的唯一的GalNAc-转移酶同种型:将O-联聚糖
附着至乳腺癌相关的粘蛋白MUC1的20个氨基酸的串联重复序列中所有5个接纳位点。
GalNAc-T4将GalNAc转移至GalNAc4TAP24糖肽(TAPPAHGVT APD RPAPGSTAPP,独特的
GalNAc-T4附着位点以粗体表示)上不被其他GalNAc-转移酶同种型使用的至少两个位点
(Bennett等人,J.Biol.Chem.273:30472-30481(1998))。活性,例如由GalNAc-T4所展示
出的活性,似乎是产生由癌细胞表达的MUC1的糖形所必需的,其中所有潜在位点都被糖基
化(Muller等人,J.Biol.Chem.274:18165-18172(1999))。来自哺乳期乳腺的正常MUC1具
有约2.6个O-联聚糖/重复(Muller等人,J.Biol.Chem.272:24780-24793(1997)),和源
自癌细胞系T47D的MUC1具有4.8个O-联聚糖/重复(Muller等人,J.Biol.Chem.274:
18165-18172(1999))。因此,MUC1的癌症相关的形式与更高密度的O-联聚糖占有相关,并
且这通过与GalNAc-T4相同或相似的GalNAc-转移酶活性来完成。另一种酶,GalNAc-T11,
例如描述在T.Schwientek等人,J.Biol.Chem.2002,277(25):22623-22638中。
[0511] 通过遗传工程从经克隆的基因产生蛋白质如酶GalNAcTI-XX是公知的。参见例如,美国专利号4,761,371。一种方法涉及收集足够的样品,然后通过N-末端测序来测定该酶
的氨基酸序列。然后将该信息用于分离编码全长(膜结合的)转移酶的cDNA克隆,其在昆
虫细胞系Sf9中表达后导致合成具有完全活性的酶。然后,通过使用下列方式来测定该酶
的接纳体特异性:半定量分析16种不同蛋白质中在已知的糖基化序列周围的氨基酸,接着
进行合成的肽的体外糖基化研究。该工作已经证明,某些氨基酸残基在糖基化的肽区段中
过度呈现并且在糖基化的丝氨酸和苏氨酸残基周围特定位置中的残基可以具有相比于其
他氨基酸部分而言更显著的对于接纳体效率的影响。
[0512] 因为已经证明GalNAc转移酶的突变可以用于产生与由野生型酶所产生的那些不同的糖基化模式,所以在制备本发明的O-联糖基化的多肽中利用一种或多种突变型或截
短的GalNAc转移酶在本发明的范围内。GalNAc-T2蛋白质的催化结构域和截短突变体描述
于例如于2004年6月3日提交的美国临时专利申请60/576,530;和于2004年8月3日提
交的美国临时专利申请60/598584中,这两篇文献通过提及而合并入本文以用于所有目
的。还可以通过与已知的糖基转移酶进行比对来鉴定催化结构域。截短的GalNAc-T2酶,
例如人GalNAc-T2(Δ51)、人GalNAc-T2(Δ51Δ445),以及获得这些酶的方法也描述于WO
06/102652(PCT/US06/011065,于2006年3月24日提交)和PCT/US05/00302(于2005年
1月6日提交)中,它们通过提及而合并入本文以用于所有目的。示例性的GalNAc-T1、
GalNAc-T2、GalNAc-T3和GalNAc-T11序列概述在下面的表13中。表13:示例性的
GalNAc-T1、GalNA c-T2、GalNAc-T3和GalNAc-T11序列1.人UDP-N-乙酰半乳糖胺转移酶
**
2(GalNAc-T2)SEQ ID NO: MRRRSRMLLCFAFLWVLGIAYYMYSGGGSALAGGAGGGAGRKEDWNEIDPIK
KKDLHHSNGEEKAQSMETLPPGKVRWPDFNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRK
QWRVDLPATSVVITFHNEARSALLRTVVSVLKKSPPHLIKEIILVDDYSNDPEDGALLGKIEKVRVLRNDRREGLMR
SRVRGADAAQAKVLTFLDSHCECNEHWLEPLLERVAEDRTRVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWD
YMTPEQRRSRQGNP IKTPMIAGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRV
GHVFRKQHPYTFPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVPSARNVPYGNIQSRLELRKKLSCKPFKWYLENVY
PELRVPDHQDIAFGALQQGTNCLDTLGHFADGVVGVYECHNAGGNQEWALTKEKSVKHMDLCLTVVDRAPGSLIKLQ
GCRENDSRQKWEQIEGNSKLRHVGSNLCLDSRTAKSGGLSVEVCGPALSQQWKFTLNLQQ2. 截 短 的 人
**
UDP-N-乙酰半乳糖胺转移酶2(GalNAc-T2Δ51)SEQ ID NO: KKKDLHHSNGEEKAQSMETLPPGK
VRWPDFNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRKQWRVDLPATSVVITFHNEARSAL
LRTVVSVLKKSPPHLIKEIILVDDYSNDPEDGALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCEC
NEHWLEPLLERVAEDRTRVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSRQGNPVAPIKTPMI
AGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHVFRKQHPYTFPGGSGTVFARNTRR
AAEVWMDEYKNFYYAAVPSARNVPYGNIQSRLELRKKLSCKPFKWYLENVYPELRVPDHQDIAFGALQQGTNCLDTL
GHFADGVVGVYECHNAGGNQEWALTKEKSVKHMDLCLTVVDRAPGSLIKLQGCRENDSRQKWEQIEGNSKLRHVGSN
LCLDSRTAKSGGLSVEVCGPALSQQWKFTLNLQQ3.截短的人UDP-N-乙酰半乳糖胺转 移酶
**
2(GalNAc-T2Δ1-51Δ445-571)SEQ ID NO: KKKDLHHSNGEEKAQSMETLPPGKVRWPDFNQEAYVG
GTMVRSGQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRKQWRVDLPATSVVITFHNEARSALLRTVVSVLKKSPP
HLIKEIILVDDYSNDPEDGALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLERVA
EDRTRVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSRQGNPVAPIKTPMIAGGLFVMDKFYFE
ELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHVFRKQHPYTFPGGSGTVFARNTRRAAEVWMDEYKNFY
YAAVPSARNVPYGNIQSRLELRKKLSCKPFKWYLENVYPELRVPDHQD4.截短的人UDP-N-乙酰半乳糖胺
**
转移酶2(GalNAc-T2Δ51)(备选形式)SEQ ID NO: MSKKKDLHHSNGEEKAQSMETLPPGKVRWPD
FNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRKQWRVDLPATSVVITFHNEARSALLRTVV
SVLKKSPPHLIKEIILVDDYSNDPEDGALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWL
EPLLERVAEDRTRVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSRQGNPVAPIKTPMIAGGLF
VMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHVFRKQHPYTFPGGSGTVFARNTRRAAEVW
MDEYKNFYYAAVPSARNVPYGNIQSRLELRKKLSCKPFKWYLENVYPELRVPDHQDIAFGALQQGTNCLDTLGHFAD
GVVGVYECHNAGGNQEWALTKEKSVKHMDLCLTVVDRAPGSLIKLQGCRENDSRQKWEQIEGNSKLRHVGSNLCLDS
RTAKSGGLSVEVCGPALSQQWKFTLNLQQ5.截 短 的 人 UDP-N-乙 酰 半 乳 糖 胺 转 移 酶
**
2(GalNAc-T2Δ1-51Δ445-571)备选形式SEQ ID NO: MSKKKDLHHSNGEEKAQSMETLPPGKVRW
PDFNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRKQWRVDLPATSVVITFHNEARSALLRT
VVSVLKKSPPHLIKEIILVDDYSNDPEDGALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEH
WLEPLLERVAEDRTRVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSRQGNPVAPIKTPMIAGG
LFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHVFRKQHPYTFPGGSGTVFARNTRRAAE
VWMDEYKNFYYAAVPSARNVPYGNIQSRLELRKKLSCKPFKWYLENVYPELRVPDHQD6.截短的人UDP-N-乙
**
酰半乳糖胺转移酶2(GalNAc-T2Δ53)SEQ ID NO: KDLHHSNGEEKAQSMETLPPGKVRWPDFNQEA
YVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRKQWRVDLPATSVVITFHNEARSALLRTVVSVLKK
SPPHLIKEIILVDDYSNDPEDGALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLE
RVAEDRTRVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSRQGNPVAPIKTPMIAGGLFVMDKF
YFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHVFRKQHPYTFPGGSGTVFARNTRRAAEVWMDEYK
NFYYAAVPSARNVPYGNIQSRLELRKKLSCKPFKWYLENVYPELRVPDHQDIAFGALQQGTNCLDTLGHFADGVVGV
YECHNAGGNQEWALTKEKSVKHMDLCLTVVDRAPGSLIKLQGCRENDSRQKWEQIEGNSKLRHVGSNLCLDSRTAKS
GGLSVEVCGPALSQQWKFTLNLQQ7. 截 短 的 人 UDP-N- 乙 酰 半 乳 糖 胺 转 移 酶
**
2(GalNAc-T2Δ1-53Δ445-571)SEQ ID NO: KDLHHSNGEEKAQSMETLPPGKVRWPDFNQEAYVGGT
MVRSGQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRKQWRVDLPATSVVITFHNEARSALLRTVVSVLKKSPPHL
IKEIILVDDYSNDPEDGALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLERVAED
RTRVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSRQGNPVAPIKTPMIAGGLFVMDKFYFEEL
GKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHVFRKQHPYTFPGGSGTVFARNTRRAAEVWMDEYKNFYYA
AVPSARNVPYGNIQSRLELRKKLSCKPFKWYLENVYPELRVPDHQD8.截短的人UDP-N-乙酰半乳糖胺转
**
移酶2(GalNAc-T2Δ53)备选形式SEQ ID NO: MSKDLHHSNGEEKAQSMETLPPGKVRWPDFNQEAY
VGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRKQWRVDLPATSVVITFHNEARSALLRTVVSVLKKS
PPHLIKEIILVDDYSNDPEDGALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLER
VAEDRTRVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSRQGNPVAPIKTPMIAGGLFVMDKFY
FEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHVFRKQHPYTFPGGSGTVFARNTRRAAEVWMDEYKN
FYYAAVPSARNVPYGNIQSRLELRKKLSCKPFKWYLENVYPELRVPDHQDIAFGALQQGTNCLDTLGHFADGVVGVY
ECHNAGGNQEWALTKEKSVKHMDLCLTVVDRAPGSLIKLQGCRENDSRQKWEQIEGNSKLRHVGSNLCLDSRTAKSG
GLSVEVCGPALSQQWKFTLNLQQ9. 截 短 的 人 UDP-N- 乙 酰 半 乳 糖 胺 转 移 酶
**
2(GalNAc-T2Δ1-53Δ445-571)备选形式SEQ ID NO: MSKDLHHSNGEEKAQSMETLPPGKVRWPD
FNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRKQWRVDLPATSVVITFHNEARSALLRTVV
SVLKKSPPHLIKEIILVDDYSNDPEDGALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWL
EPLLERVAEDRTRVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSRQGNPVAPIKTPMIAGGLF
VMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHVFRKQHPYTFPGGSGTVFARNTRRAAEVW
MDEYKNFYYAAVPSARNVPYGNIQSRLELRKKLSCKPFKWYLENVYPELRVPDHQD10.截短的人UDP-N-乙
**
酰半乳糖胺转移酶1(GalNAc-T1Δ40)SEQ ID NO: GLPAGDVLEPVQKPHEGPGEMGKPVVIPKEDQ
EKMKEMFKINQFNLMASEMIALNRSLPDVRLEGCKTKVYPDNLPTTSVVIVFHNEAWSTLLRTVHSVINRSPRHMIE
EIVLVDDASERDFLKRPLESYVKKLKVPVHVIRMEQRSGLIRARLKGAAVSKGQVITFLDAHCECTVGWLEPLLARI
KHDRRTVVCPIIDVISDDTFEYMAGSDMTYGGFNWKLNFRWYPVPQREMDRRKGDRTLPVRTPTMAGGLFSIDRDYF
QEIGTYDAGMDIWGGENLEISFRIWQCGGTLEIVTCSHVGHVFRKATPYTFPGGTGQIINKNNRRLAEVWMDEFKNF
FYIISPGVTKVDYGDISSRVGLRHKLQCKPFSWYLENIYPDSQIPRHYFSLGEIRNVETNQCLDNMARKENEKVGIF
NCHGMGGNQVFSYTANKEIRTDDLCLDVSKLNGPVTMLKCHHLKGNQLWEYDPVKLTLQHVNSNQCLDKATEEDSQV
PSIRDCNGSRSQQWLLRNVTLPEIF11.截短的人UDP-N-乙酰半乳糖胺转移酶1(GalNAc-T1Δ40)
**
备选形式SEQ ID NO: MGLPAGDVLEPVQKPHEGPGEMGKPVVIPKEDQEKMKEMFKINQFNLMASEMIALN
RSLPDVRLEGCKTKVYPDNLPTTSVVIVFHNEAWSTLLRTVHSVINRSPRHMIEEIVLVDDASERDFLKRPLESYVK
KLKVPVHVIRMEQRSGLIRARLKGAAVSKGQVITFLDAHCECTVGWLEPLLARIKHDRRTVVCPIIDVISDDTFEYM
AGSDMTYGGFNWKLNFRWYPVPQREMDRRKGDRTLPVRTPTMAGGLFSIDRDYFQEIGTYDAGMDIWGGENLEISFR
IWQCGGTLEIVTCSHVGHVFRKATPYTFPGGTGQIINKNNRRLAEVWMDEFKNFFYIISPGVTKVDYGDISSRVGLR
HKLQCKPFSWYLENIYPDSQIPRHYFSLGEIRNVETNQCLDNMARKENEKVGIFNCHGMGGNQVFSYTANKEIRTDD
LCLDVSKLNGPVTMLKCHHLKGNQLWEYDPVKLTLQHVNSNQCLDKATEEDSQVPSIRDCNGSRSQQWLLRNVTLPE
**
IF12.人UDP-N-乙酰半乳糖胺转移酶3(GalNAc-T3)SEQ ID NO: MAHLKRLVKLHIKRHYHKKF
WKLGAVIFFFIIVLVLMQREVSVQYSKEESRMERNMKNKNKMLDLMLEAVNNIKDAMPKMQIGAPVRQNIDAGERPC
LQGYYTAAELKPVLDRPPQDSNAPGASGKAFKTTNLSVEEQKEKERGEAKHCFNAFASDRISLHRDLGPDTRPPECI
EQKFKRCPPLPTTSVIIVFHNEAWSTLLRTVHSVLYSSPAILLKEIILVDDASVDEYLHDKLDEYVKQFSIVKIVRQ
RERKGLITARLLGATVATAETLTFLDAHCECFYGWLEPLLARIAENYTAVVSPDIASIDLNTFEFNKPSPYGSNHNR
GNFDWSLSFGWESLPDHEKQRRKDETYPIKTPTFAGGLFSISKEYFEYIGSYDEEMEIWGGENIEMSFRVWQCGGQL
EIMPCSVVGHVFRSKSPHSFPKGTQVIARNQVRLAEVWMDEYKEIFYRRNTDAAKIVKQKAFGDLSKRFEIKHRLRC
KNFTWYLNNIYPEVYVPDLNPVISGYIKSVGQPLCLDVGENNQGGKPLIMYTCHGLGGNQYFEYSAQHEIRHNIQKE
LCLHAAQGLVQLKACTYKGHKTVVTGEQIWEIQKDQLLYNPFLKMCLSANGEHPSLVSCNPSDPLQKWILSQND13.
**
果蝇UDP-N-乙酰半乳糖胺转移酶3(GalNAc-T3)SEQ ID NO: MGLRFQQLKKLWLLYLFLLFFAF
FMFAISINLYVASIQGGDAEMRHPKPPPKRRSLWPHKNIVAHYIGKGDIFGNMTADDYNINLFQPINGEGADGRPVV
VPPRDRFRMQRFFRLNSFNLLASDRIPLNRTLKDYRTPECRDKKYASGLPSTSVIIVFHNEAWSVLLRTITSVINRS
PRHLLKEIILVDDASDRSYLKRQLESYVKVLAVPTRIFRMKKRSGLVPARLLGAENARGDVLTFLDAHCECSRGWLE
PLLSRIKESRKVVICPVIDIISDDNFSYTKTFENHWGAFNWQLSFRWFSSDRKRQTAGNSSKDSTDPIATPGMAGGL
FAIDRKYFYEMGSYDSNMRVWGGENVEMSFRIWQCGGRVEISPCSHVGHVFRSSTPYTFPGGMSEVLTDNLARAATV
WMDDWQYFIMLYTSGLTLGAKDKVNVTERVALRERLQCKPFSWYLENIWPEHFFPAPDRFFGKIIWLDGETECAQAY
SKHMKNLPGRALSREWKRAFEEIDSKAEELMALIDLERDKCLRPLKEDVPRSSLSAVTVGDCTSHAQSMDMFVITPK
GQIMTNDNVCLTYRQQKLGVIKMLKNRNATTSNVMLAQCASDSSQLWTYDMDTQQISHRDTKLCLTLKAATNSRLQK
VEKVVLSMECDFKDITQKWGFIPLPWRM14.小鼠UDP-N-乙酰半乳糖胺转移酶3(GalNAc-T3)SEQ
**
ID NO: MAHLKRLVKLHIKRHYHRKFWKLGAVIFFFLVVLILMQREVSVQYSKEESKMERNLKNKNKMLDFMLE
AVNNIKDAMPKMQIGAPIKENIDVRERPCLQGYYTAAELKPVFDRPPQDSNAPGASGKPFKITHLSPEEQKEKERGE
TKHCFNAFASDRISLHRDLGPDTRPPECIEQKFKRCPPLPTTSVIIVFHNEAWSTLLRTVHSVLYSSPAILLKEIIL
VDDASVDDYLHEKLEEYIKQFSIVKIVRQQERKGLITARLLGAAVATAETLTFLDAHCECFYGWLEPLLARIAENYT
AVVSPDIASIDLNTFEFNKPSPYGNNHNRGNFDWSLSFGWESLPDHEKQRRKDETYPIKTPTFAGGLFSISKKYFEH
IGSYDEEMEIWGGENIEMSFRVWQCGGQLEIMPCSVVGHVFRSKSPHTFPKGTQVIARNQVRLAEVWMDEYKEIFYR
RNTDAAKIVKQKSFGDLSKRFEIKKRLQCKNFTWYLNTIYPEAYVPDLNPVISGYIKSVGQPLCLDVGENNQGGKPL
ILYTCHGLGGNQYFEYSAQREIRHNIQKELCLHATQGVVQLKACVYKGHRTIAPGEQIWEIRKDQLLYNPLFKMCLS
SNGEHPNLVPCDATDLLQKWIFSQND15.人UDP-N-乙酰半乳糖胺转移酶11(GalNAc-T11)SEQ ID
**
NO: MGSVTVRYFCYGCLFTSATWTVLLFVYFNFSEVTQPLKNVPVKGSGPHGPSPKKFYPRFTRGPSRVLEPQF
KANKIDDVIDSRVEDPEEGHLKFSSELGMIFNERDQELRDLGYQKHAFNMLISDRLGYHRDVPDTRNAACKEKFYPP
DLPAASVVICFYNEAFSALLRTVHSVIDRTPAHLLHEIILVDDDSDFDDLKGELDEYVQKYLPGKIKVIRNTKREGL
IRGRMIGAAHATGEVLVFLDSHCEVNVMWLQPLLAAIREDRHTVVCPVIDIISADTLAYSSSPVVRGGFNWGLHFKW
DLVPLSELGRAEGATAPIKSPTMAGGLFAMNRQYFHELGQYDSGMDIWGGENLEISFRIWMCGGKLFIIPCSRVGHI
FRKRRPYGSPEGQDTMTHNSLRLAHVWLDEYKEQYFSLRPDLKTKSYGNISERVELRKKLGCKSFKWYLDNVYPEMQ
ISGSHAKPQQPIFVNRGPKRPKVLQRGRLYHLQTNKCLVAQGRPSQKGGLVVLKACDYSDPNQIWIYNEEHELVLNS
LLCLDMSETRSSDPPRLMKCHGSGGSQQWTFGKNNRLYQVSVGQCLRAVDPLGQKGSVAMAICDGSSSQQWHLEG(
b)岩藻糖基转移酶
[0513] 在一些实施方案中,用于本发明方法中的糖基转移酶是岩藻糖基转移酶。岩藻糖基转移酶是本领域技术人员已知的。示例性的岩藻糖基转移酶包括将L-岩藻糖从GDP-岩
藻糖转移至接纳体糖的羟基位置的酶。将非核苷酸糖转移至接纳体的岩藻糖基转移酶也可
用于本发明。
[0514] 在一些实施方案中,接纳体糖是例如在寡糖糖苷中Galβ(1→3,4)GlcNAcβ-基团中的GlcNAc。对于该反应而言合适的岩藻糖基转移酶包括最初从人乳中得到表征的
Galβ(1→3,4)GlcNAcβ1-α(1→3,4)岩藻糖基转移酶(FTIII E.C.No.2.4.1.65)(参
见Palcic等人,Carbohydrate Res.190:1-11(1989);Prieels等人,J.Biol.Chem.256:
10456-10463(1981);和Nunez等人,Can.J.Chem.59:2086-2095(1981)),和在人血清中
发现的Galβ(1→4)GlcNAcβ-α岩藻糖基转移酶(FTIV、FTV、FTVI)。还已经表征了
FTVII(E.C.No.2.4.1.65)——一种唾液酸基α(2→3)Galβ((1→3)GlcNAcβ岩藻糖基
转移酶。还已经表征了重组形式的Galβ(1→3,4)GlcNAcβ-α(1→3,4)岩藻糖基转
移酶(参见,Dumas等人,Bioorg.Med.Letters 1:425-428(1991);和Kukowska-Latallo
等人,Genes and Development 4:1288-1303(1990))。其他示例性的岩藻糖基转移酶包
括例如α1,2岩藻糖基转移酶(E.C.No.2.4.1.69)。可以通过在Mollicone等人,Eur.
J.Biochem.191:169-176(1990)或者美国专利号5,374,655中所描述的方法来进行酶促岩
藻糖基化。用于产生岩藻糖基转移酶的细胞也将包括用于合成GDP-岩藻糖的酶系统。(c)
半乳糖基转移酶
[0515] 在另一组实施方案中,糖基转移酶是半乳糖基转移酶。示例性的半乳糖基转移酶包括α(1,3)半乳糖基转移酶(E.C.No.2.4.1.151,参见例如,Dabkowski等人,Transplant
Proc.25:2921(1993) 和 Yamamoto 等 人 Nature 345:229-233(1990),牛 的 (GenBank
j04989,Joziasse等人,J.Biol.Chem.264:14290-14297(1989)),鼠的(GenBankm26925;
Larsen等人,Proc.Nat’l.Acad.Sci.USA 86:8227-8231(1989)),猪的(GenBank L36152;
Strahan等人,Immunogenetics 41:101-105(1995))。另一种合适的α1,3半乳糖基转
移酶是参与血型B抗原合成的半乳糖基转移酶(EC 2.4.1.37,Yamamoto等人,J.Biol.
Chem.265:1146-1151(1990)(人的))。也适于实施本发明的是可溶形式的α1,3-半乳糖
基转移酶,例如由Cho,S.K.和Cummings,R.D.(1997)J.Biol.Chem.,272,13622-13628所报
导的那种。
[0516] 在另一个实施方案中,半乳糖基转移酶是β(1,3)-半乳糖基转移酶,例如Core-1-GalT1。已经描述了人Core-1-β1,3-半乳糖基转移酶(参见例如,Ju等人,J.Biol.
Chem.2002,277(1):178-186)。黑腹果蝇(Drosophila melanogaster)酶描述于Correia
等人,PNAS 2003,100(11):6404-6409;和Muller等人,FEBS J.2005,272(17):4295-4305
中。另外的Core-1-β3半乳糖基转移酶,包括其截短形式,公开在WO/0144478和于2006年
9月6日提交的美国临时专利申请号60/842,926中。在示例性的实施方案中,β(1,3)-半
乳糖基转移酶是选自由PubMed登录号AAF52724(CG9520-PC的转录物)所描述的酶和其
经修饰的形式,例如为在细菌中表达而进行密码子优化的那些变化形式。示例性的可溶性
Core-1-GalT1(Core-1-GalT1Δ31)酶的序列显示在下面:Core-1-GalT1Δ31的序列(SEQ
**
ID NO: )GFCLAELFVYSTPERSEFMPYDGHRHGDVNDAHHSHDMMEMSGPEQDVGGHEHVHENSTIAERLYSE
VRVLCWIMTNPSNHQKKARHVKRTWGKRCNKLIFMSSAKDDELDAVALPVGEGRNNLWGKTKEAYKYIYEHHINDAD
WFLKADDDTYTIVENMRYMLYPYSPETPVYFGCKFKPYVKQGYMSGGAGYVLSREAVRRFVVEALPNPKLCKSDNSG
AEDVEIGKCLQNVNVLAGDSRDSNGRGRFFPFVPEHHLIPSHTDKKFWYWQYIFYKTDEGLDCCSDNAISFHYVSPN
QMYVLDYLIYHLRPYGIINTPDALPNKLAVGELMPEIKEQATESTSDGVSKRSAETKTQ
[0517] 也适合用于本发明方法的是β(1,4)半乳糖基转移酶,其包括例如EC2.4.1.90(LacNAc合成酶)和EC 2.4.1.22(乳糖合成酶)(牛的(D′Agostaro等
人,Eur.J.Biochem.183:211-217(1989)),人 的(Masri 等 人,Biochem.Biophys.Res.
Commun.157:657-663(1988)),鼠 的(Nakazawa等人,J.Biochem.104:165-168(1988)),
以及E.C.2.4.1.38和神经酰胺半乳糖基转移酶(EC 2.4.1.45,Stahl等人,J.Neurosci.
Res.38:234-242(1994))。其他合适的半乳糖基转移酶包括例如,α1,2半乳糖基转移酶
(来自例如,粟酒裂殖酵母(Schizosaccharomyces pombe),Chapell等人,Mol.Biol.Cell
5:519-528(1994))。(d)唾液酸转移酶
[0518] 唾液酸转移酶是可用于本发明的重组细胞和反应混合物的另一类型的糖基转移酶。产生重组唾液酸转移酶的细胞将也产生CMP-唾液酸,其是用于唾液酸转移酶
的唾液酸供体。适合用于本发明的唾液酸转移酶的实例包括ST3Gal III(例如,大鼠
或 人ST3GalIII)、ST3Gal IV、ST3Gal I、ST6Gal I、ST3Gal V、ST6Gal II、ST6GalNAc
I、ST6GalNAc II和ST6GalNAc III(本文所使用的唾液酸转移酶命名如Tsuji等人,
Glycobiology 6:v-xiv(1996)中所描述)。被称作α(2,3)唾液酸转移酶(EC 2.4.99.6)
的示例性α(2,3)唾液酸转移酶将唾液酸转移至Galβ1→3Glc二糖或糖苷的非还原性
末端Gal。参见,Vanden Eijnden等人,J.Biol.Chem.256:3159(1981);Weinstein等人,
J.Biol.Chem.257:13845(1982);和Wen等人,J.Biol.Chem.267:21011(1992)。另一个示
例性的α2,3-唾液酸转移酶(EC 2.4.99.4)将唾液酸转移至该二糖或糖苷的非还原性末
端Gal。参见,Rearick等人,J.Biol.Chem.254:4444(1979);和Gillespie等人,J.Biol.
Chem.267:21004(1992)。其他示例性的酶包括Gal-β-1,4-GlcNAcα-2,6唾液酸转移酶
(参见,Kurosawa等人Eur.J.Biochem.219:375-381(1994))。
[0519] 优选地,为了糖基化糖肽的碳水化合物,唾液酸转移酶将能够将唾液酸转移至序列Galβ1,4GlcNAc-,其是在完全唾液酸化的碳水化合物结构上最常见的处于末端唾液酸
之下的倒数第二的序列(参见,下表14)。表14:使用Galβ1,4GlcNAc序列作为接纳体底
物的唾液酸转移酶
唾液酸转移酶 来源 所形成的序列 Ref.
ST6Gal I 哺乳动物 NeuAcα2,6Galβ1,4GlcNAc- 1
NeuAcα2,3Galβ1,4GlcNAc-
ST3Gal III 哺乳动物 1
NeuAcα2,3Galβ1,3GlcNAc-
NeuAcα2,3Galβ1,4GlcNAc-
ST3Gal IV 哺乳动物 1
NeuAcα2,3Galβ1,3GlcNAc-
ST6Gal II 哺乳动物 NeuAcα2,6Galβ1,4GlcNAc
ST6Gal II 发光细菌 NeuAcα2,6Galβ1,4GlcNAc- 2
脑膜炎奈瑟氏球菌
ST3Gal V NeuAcα2,3Galβ1,4GlcNAc- 3
淋病奈瑟氏球菌
1)Goochee等人,Bio/Technology 9:1347-1355(1991)2)Yamamoto等人,J.Biochem.120:
104-110(1996)3)Gilbert等人,J.Biol.Chem.271:28271-28276(1996)
[0520] 可用于所要求保护的方法中的唾液酸转移酶的一个实例是ST3Gal III,其也被称作α(2,3)唾液酸转移酶(EC 2.4.99.6)。该酶催化将唾液酸转移至Galβ1,3GlcNAc
或Galβ1,4GlcNAc糖苷的Gal(参见,例如,Wen等人,J.Biol.Chem.267:21011(1992);
Van den Eijnden等人,J.Biol.Chem.256:3159(1991)),并且负责糖肽中天冬酰胺-联
寡糖的唾液酸化。将唾液酸连接至Gal,在两个糖之间形成α-连接。所述糖之间的
键合(连接)在NeuAc的2-位和Gal的3-位之间。该特定的酶可以分离自大鼠肝脏
(Weinstein等人,J.Biol.Chem.257:13845(1982));人cDNA(Sasaki等人(1993)J.Biol.
Chem.268:22782-22787;Kitagawa & Paulson(1994)J.Biol.Chem.269:1394-1401)和基
因组(Kitagawa等人(1996)J.Biol.Chem.271:931-938)DNA序列是已知的,这有助于通过
重组表达来产生该酶。在另一个实施方案中,所要求保护的唾液酸化方法使用大鼠ST3Gal
III。
[0521] 用于本发明的其他示例性唾液酸转移酶包括从空肠弯曲杆菌中分离的那些,包括α(2,3)。参见例如,WO99/49051。
[0522] 表5中列出的那些其他唾液酸转移酶也可在用于唾液酸化商业上重要的糖肽的经济且有效的大规模方法中使用。作为用于发现这些其他酶的效用的简单测试,将各种不
同量的每种酶(1-100mU/mg蛋白质)与脱唾液酸-α1AGP(1-10mg/ml)反应,以比较相对于
牛ST6Gal I、ST3Gal III或这两种唾液酸转移酶而言目的唾液酸转移酶唾液酸化糖肽的能
力。备选地,其他糖肽或者从多肽主链上酶促释放出的N-联寡糖可以代替脱唾液酸-α1AGP
而用于该评估。能够比ST6Gal I更有效地唾液酸化糖肽的N-联寡糖的唾液酸转移酶可以
在用于多肽唾液酸化的实际的大规模方法中使用(如本公开中对于ST3GalIII所举例说明
的)。其他示例性的唾液酸转移酶显示在图10中。融合蛋白
[0523] 在其他示例性的实施方案中,本发明的方法利用融合蛋白,其具有超过一种的参与所希望的糖肽缀合物合成的酶促活性。所述融合多肽可以例如由与附属酶的催化活性
结构域相连接的糖基转移酶的催化活性结构域组成。附属酶催化结构域可以例如催化在
形成作为用于该糖基转移酶的供体的核苷酸糖中的步骤,或者催化参与糖基转移酶循环的
反应。例如,编码糖基转移酶的多核苷酸可以按阅读框连接至编码参与核苷酸糖合成的酶
的多核苷酸。那么,所得的融合蛋白不仅催化核苷酸糖的合成,而且将糖部分转移至接纳体
分子。融合蛋白可以是连接入一个可表达的核苷酸序列中的两个或更多个循环酶(cycle
enzymes)。在其他实施方案中,融合蛋白包含两种或更多种糖基转移酶的催化活性结构
域。参见例如,5,641,668。利用各种合适的融合蛋白,可以容易地设计和制备本发明的经
修饰的糖肽(参见例如,于1999年6月24日作为WO 99/31224公布的PCT专利申请PCT/
CA98/01180)。固定化的酶
[0524] 除了细胞结合的酶外,本发明还提供使用固定在固体和/或可溶性支持物上的酶。在示例性的实施方案中,提供了根据本发明方法通过完整的糖基接头而缀合至PEG的
糖基转移酶。该PEG-接头-酶缀合物任选地附着至固体支持物。在本发明的方法中使用
由固体支持的酶简化了反应混合物的制备和反应产物的纯化,并且还使得能够容易地回收
酶。所述糖基转移酶缀合物用于本发明的方法中。酶和支持物的其他组合对于本领域技术
人员而言将是明显的。多肽缀合物的纯化
[0525] 通过本文上面所描述的方法产生的多肽缀合物可以不纯化而进行使用。然而,通常优选回收此类产物。用于纯化经糖基化的糖的标准公知技术为例如薄层或厚层色谱法、
柱色谱法、离子交换色谱法或者膜过滤。优选使用膜过滤,更优选利用反渗透膜的膜过滤,
或者一种或多种柱色谱技术,如在下文中和在本文引用的文献中所讨论的。例如,其中膜具
有约3000至约10,000的分子量截止值的膜过滤可用于除去蛋白质例如糖基转移酶。然后
可以使用纳米过滤或者反渗透来除去盐和/或纯化产物糖(参见,例如,WO 98/15581)。纳
米滤膜是一类反渗透膜,取决于所使用的膜,纳米滤膜让单价盐通过但是截留多价盐和大
于约100至约2,000道尔顿的不带电荷的溶质。因此,在典型的应用中,通过本发明的方法
制备的糖将被保留在膜中,和污染性盐将穿过膜。
[0526] 如果在细胞内产生经修饰的糖蛋白,那么作为第一步,例如通过离心或超滤除去颗粒状碎屑,包括细胞和细胞碎片。任选地,可以用商购可得的蛋白质浓缩滤器来浓缩蛋
白质,接着通过一个或多个色谱法步骤来分开多肽变体与其他杂质,所述色谱法步骤例
如为免疫亲和色谱法、离子交换色谱法(例如,在二乙基氨基乙基(DEAE)或含有羧甲基
或磺丙基的基质上)、羟基磷灰石色谱法和疏水相互作用色谱法(HIC)。示例性的固定
相包括Blue-Sepharose、CMBlue-Sepharose、MONO-Q、MONO-S、兵豆凝集素-Sepharose、
WGA-Sepharose、Con A-Sepharose、Ether Toyopearl、ButylToyopearl、Phenyl Toyopearl、
SP-Sepharose或A蛋白Sepharose。
[0527] 其他色谱技术包括SDS-PAGE色谱法、二氧化硅色谱法、色谱聚焦、反相HPLC(例如,具有附加的脂肪族基团的硅胶)、凝胶过滤(使用例如Sephadex分子筛或大小排阻色谱
法)、在选择性地结合所述多肽的柱上的色谱法、和乙醇或硫酸铵沉淀。
[0528] 培养产生的经修饰的糖肽通常通过下列方式来进行分离:最初从细胞、酶等中进行提取,随后进行一个或多个浓缩、盐析、水性离子交换或者大小排阻色谱法步骤,例如SP
Sepharose。另外,可以通过亲和色谱法来纯化经修饰的糖蛋白。HPLC也可以用于一个或多
个纯化步骤。
[0529] 蛋白酶抑制剂,例如甲基磺酰氟(PMSF)可以被包括在任一前述步骤中以抑制蛋白水解,并且可以包括抗生素以防止外来污染物的生长。
[0530] 在另一个实施方案中,首先使用商购可得的蛋白质浓缩滤器,例如Amicon或Millipore Pellicon超滤单元来浓缩来自产生本发明的经修饰的糖肽的系统的上清液。在
该浓缩步骤后,可以将浓缩物施加至合适的纯化基质。例如,合适的亲和基质可以包含所述
多肽的配体、结合至合适支持物的凝集素或抗体分子。备选地,可以使用阴离子交换树脂,
例如具有侧DEAE基团的基质或基材。合适的基质包括丙烯酰胺、琼脂糖、葡聚糖、纤维素或
者其他类型的常用于蛋白质纯化的基质。备选地,可以使用阳离子交换步骤。合适的阳离
子交换剂包括含有磺丙基或羧甲基的各种不溶性基质。特别优选的是磺丙基。
[0531] 最后,一个或多个使用疏水性RP-HPLC介质(例如具有侧甲基或其他脂肪族基团的硅胶)的RP-HPLC步骤,可以用于进一步纯化多肽变体组合物。前述纯化步骤中的一些
或所有步骤(以各种组合)也可以用于提供同质的经修饰的糖蛋白。
[0532] 由大规模发酵产生的本发明的经修饰的糖肽可以通过类似于Urdal等人,J.Chromatog.296:171(1984)所公开的方法来纯化。该参考文献描述了用于在制备型HPLC
柱上纯化重组人IL-2的两个相继的RP-HPLC步骤。备选地,可以使用诸如亲和色谱法的技
术来纯化经修饰的糖蛋白。多肽编码序列的获得一般的重组技术
[0533] 通过突变或多肽的完全化学合成来改变对应的亲本多肽的氨基酸序列,可以产生出掺入了本发明的O-联糖基化序列的突变型多肽。优选通过DNA水平上的变化来改变多
肽氨基酸序列,特别是通过在预先选择的碱基处突变编码所述多肽的DNA序列以产生将会
翻译成所希望的氨基酸的密码子。优选使用本领域已知的方法来进行DNA突变。
[0534] 本发明依赖于重组遗传学领域中的常规技术。公开了用于本发明的一般方法的基础教科书包括Sambrook和Russell,Molecular Cloning,A Laboratory Manual(第3
版2001);Kriegler,Gene Transfer and Expression:A Laboratory Manual(1990);和
Ausubel等人,eds.,Current Protocols in Molecular Biology(1994)。
[0535] 核酸大小以千碱基(kb)或碱基对(bp)给出。这些是来自琼脂糖或丙烯酰胺凝胶电泳、来自经测序的核酸或来自公开的DNA序列的估计值。对于蛋白质,大小以千道尔顿
(kDa)或氨基酸残基数给出。从凝胶电泳、从经测序的蛋白质、从衍生的氨基酸序列、或从公
开的蛋白质序列估计蛋白质大小。
[0536] 不能商购得到的寡核苷酸可以化学合成,例如,根据首次由Beaucage &Caruthers,Tetrahedron Lett.22:1859-1862(1981)描述的固相亚磷酰胺三酯方法,使
用自动合成仪,如Van Devanter等人,Nucleic Acids Res.12:6159-6168(1984)中所描
述的。也可以化学合成完整基因。使用任何本领域公认的策略来进行寡核苷酸的纯化,
例如非变性丙烯酰胺凝胶电泳或阴离子交换HPLC,如Pearson & Reanier,J.Chrom.255:
137-149(1983)中所描述的。
[0537] 经克隆的野生型多肽基因、编码突变型多肽的多核苷酸和合成的寡核苷酸的序列可以在克隆后进行验证,例如使用Wallace等人,Gene 16:21-26(1981)的用于对双链模板
进行测序的链终止方法。
[0538] 在示例性的实施方案中,通过改组多核苷酸来添加糖基化序列。可以用DNA改组方案来调节编码候选多肽的多核苷酸。DNA改组是一种递归重组和突变的方法,其通过相关
基因的库的随机片段化,接着经聚合酶链式反应样的过程对所述片段进行重装配来进行。
参见,例如,Stemmer,Proc.Natl.Acad.Sci.USA 91:10747-10751(1994);Stemmer,Nature
370:389-391(1994);和美国专利号5,605,793、5,837,458、5,830,721和5,811,238。野生
型肽编码序列的克隆和亚克隆
[0539] 许多编码野生型多肽的多核苷酸序列已被测定并且可以从供应商处得到,例如,人生长激素,例如GenBank登录号NM 000515、NM 002059、NM 022556、NM 022557、NM
022558、NM 022559、NM 022560、NM 022561和NM 022562。
[0540] 人类基因组研究的快速进步已经使得这一的克隆方法成为可能,其中可以在人类DNA序列数据库中搜索与已知的核苷酸序列(例如,编码以前鉴定的多肽的核苷酸序列)具
有某一序列同源性百分比的任何基因区段。随后,可以通过化学合成和/或聚合酶链式反
应(PCR)技术例如重叠延伸方法来获得任何如此鉴定出的DNA序列。对于短序列,完全的
从头合成可能是足够的;而为了获得更大的基因,则可能必需使用合成探针从人cDNA或基
因组文库中进一步分离全长编码序列。
[0541] 备选地,可以使用标准克隆技术例如聚合酶链式反应(PCR)从人cDNA或基因组DNA文库中分离出编码多肽的核酸序列,其中基于同源性的引物可以通常源自已知的编
码多肽的核酸序列。对于该目的最常使用的技术描述于标准教科书中,例如Sambrook和
Russell,同上。
[0542] 可以商购获得或者可以构建适合于获得野生型多肽的编码序列的cDNA文库。分离mRNA、通过逆转录制备cDNA、将cDNA连接入重组载体中、转染入重组宿主中以用
于增殖、筛选和克隆的一般方法是公知的(参见,例如,Gubler和Hoffman,Gene,25:
263-269(1983);Ausubel等人,同上)。在通过PCR获得经扩增的核苷酸序列区段后,该区
段可进一步用作探针以从cDNA文库中分离出编码野生型多肽的全长多核苷酸序列。合适
程序的一般性描述可以在Sambrook和Russell(同上)中找到。
[0543] 可以按照类似的程序从人基因组文库中获得编码野生型多肽的全长序列,例如上述GenBank登录号中的任一个。人类基因组文库是商购可得的,或者可以根据各种本领域
公认的方法来构建。一般地,为了构建基因组文库,首先从可能发现多肽的组织中提取DNA。
然后,将DNA进行机械剪切或酶促消化以产生长度为约12-20kb的片段。然后,通过梯度离
心将所述片段与具有不希望的大小的多核苷酸片段分开,并插入噬菌体λ载体中。这些载
体和噬菌体在体外进行包装。通过在Benton和Davis,Science,196:180-182(1977)中所
描述的噬菌斑杂交来分析重组噬菌体。如Grunstein等人,Proc.Natl.Acad.Sci.USA,72:
3961-3965(1975)所描述的,进行菌落杂交。
[0544] 基于序列同源性,可以设计简并寡核苷酸作为引物组,并在合适的条件下进行PCR(参见,例如,White等人,PCR Protocols:Current Methods and Applications,1993;
Griffin和Griffin,PCRTechnology,CRC Press Inc.1994),以从cDNA或基因组文库中扩
增核苷酸序列区段。通过使用扩增的区段作为探针,获得编码野生型多肽的全长核酸。
[0545] 在获得编码野生型多肽的核酸序列后,可以将编码序列亚克隆入载体,例如表达载体中,从而可以从所得的构建体产生重组的野生型多肽。随后,可以对野生型多肽编码序
列进行进一步修饰,例如核苷酸取代,以改变分子的特征。向多肽序列中引入突变
[0546] 从编码性多核苷酸序列中,可以确定出野生型多肽的氨基酸序列。随后,可以通过在氨基酸序列中的各个位置处引入额外的糖基化序列来修饰该氨基酸序列以改变该蛋白
质的糖基化模式。
[0547] 一些类型的蛋白质糖基化序列是本领域公知的。例如,在真核生物中,N-联糖基化发生在共有序列Asn-Xaa-Ser/Thr的天冬酰胺上,其中Xaa是除了脯氨酸之外的任意
氨基酸(Kornfeld等人,AnnRev Biochem 54:631-664(1985);Kukuruzinska等人,Proc.
Natl.Acad.Sci.USA 84:2145-2149(1987);Herscovics等人,FASEB J 7:540-550(1993);
和Orlean,Saccharomyces Vol.3(1996))。O-联糖基化发生在丝氨酸或苏氨酸残基处
(Tanner等人,Biochim.Biophys.Acta.906:81-91(1987);和Hounsell等人,Glycoconj.
J.13:19-26(1996))。通过将糖基磷脂酰肌醇连接至蛋白质的羧基末端的羧基而形成其他
糖基化模式(Takeda等人,Trends Biochem.Sci.20:367-371(1995);和Udenfriend等人,
Ann.Rev.Biochem.64:593-591(1995))。基于该知识,因而可以向野生型多肽序列中引入合
适的突变以形成新的糖基化序列。
[0548] 尽管直接修饰多肽序列内的氨基酸残基可能适合于引入新的N-联或O-联糖基化序列,但是更经常通过突变编码多肽的多核苷酸序列来完成新的糖基化序列的引入。这可
以通过使用任何已知的诱变方法来完成,所述诱变方法中的一些在下文讨论。
[0549] 在本领域中建立和描述了各种产生突变的方法。参见,例如,Zhang等人,Proc.Natl.Acad.Sci.USA,94:4504-4509(1997);和Stemmer,Nature,370:389-391(1994)。这
些程序可以分开地或相组合地使用以产生一组核酸的变体,并因而产生所编码的多肽的变
体。用于诱变、文库构建和其他产生多样性的方法的试剂盒是可通过商业途径获得的。
[0550] 产生多样性的突变方法包括例如,位点定向诱变(Botstein和Shortle,Science,229:1193-1201(1985)),使用含有尿嘧啶的模板的诱变(Kunkel,Proc.Natl.Acad.Sci.
USA,82:488-492(1985)),寡核苷酸指导的诱变(Zoller和Smith,Nucl.Acids Res.,10:
6487-6500(1982)),硫代磷酸酯修饰的DNA诱变(Taylor等人,Nucl.Acids Res.,13:
8749-8764和8765-8787(1985)),和使用缺口双链体DNA的诱变(Kramer等人,Nucl.Acids
Res.,12:9441-9456(1984))。
[0551] 用于产生突变的其他方法包括,点错配修复(Kramer等人,Cell,38:879-887(1984)),使用修复缺陷的宿主株系的诱变(Carter等人,Nucl.Acids Res.,
13:4431-4443(1985)),缺 失 诱 变 (Eghtedarzadeh 和 Henikoff,Nucl.Acids Res.,
14:5115(1986)),限 制- 选 择 和 限 制 - 纯 化 (Wells 等 人,Phil.Trans.R.Soc.
Lond.A,317:415-423(1986)),通过 全基 因 合成 的诱 变(Nambiar等 人,Science,
223:1299-1301(1984)),双 链 断 裂 修 复 (Mandecki,Proc.Natl.Acad.Sci.USA,83:
7177-7181(1986)),通过多核苷酸链终止方法的诱变(美国专利号5,965,408),和易错
PCR(Leung等人,Biotechniques,1:11-15(1989))。为了宿主生物中的偏爱密码子使用而
修饰核酸
[0552] 可以进一步改变编码多肽变体的多核苷酸序列以与特定宿主的偏爱密码子使用相符。例如,一种菌株的细菌细胞的偏爱密码子使用可以用于得到这样的多核苷酸,其编码
本发明的多肽变体并且包括该菌株喜欢的密码子。通过将由宿主细胞所表达的大量基因
中偏爱密码子使用频率进行平均,可以计算出该宿主细胞所展示出的偏爱密码子使用频率
(例如,计算服务可以从Kazusa DNA ResearchInstitute,Japan的网站得到)。该分析优
选地限于被宿主细胞高水平表达的基因。例如,美国专利号5,824,864提供了双子叶植物
和单子叶植物所展示出的高水平表达的基因的密码子使用频率。
[0553] 在修饰完成时,通过测序来验证多肽变体的编码序列,然后亚克隆到合适的表达载体中以便用于以与野生型多肽相同的方式重组产生。突变型多肽的表达
[0554] 在序列验证后,取决于编码本文所公开的多肽的多核苷酸序列,可以使用重组遗传学领域中的常规技术来产生本发明的多肽变体。表达系统
[0555] 为了获得编码本发明的突变型多肽的核酸的高水平表达,通常将编码突变型多肽的多核苷酸亚克隆到表达载体中,该表达载体包含用于指导转录的强启动子、转录/翻译
终止子和用于翻译起始的核糖体结合位点。合适的细菌启动子是本领域公知的,并且描述
于例如Sambrook和Russell(同上少以及Ausubel等人(同上)中。用于表达野生型或突
变型多肽的细菌表达系统例如可以在大肠杆菌、芽孢杆菌属物种(Bacillus sp.)、沙门氏
菌属(Salmonella)和柄杆菌属(Caulobacter)中得到。用于此类表达系统的试剂盒是商
购可得的。哺乳动物细胞、酵母和昆虫细胞的真核生物表达系统是本领域公知的,并且也是
商购可得的。在一个实施方案中,真核生物表达载体是腺病毒载体、腺伴随病毒载体或者逆
转录病毒载体。
[0556] 用于指导异源核酸表达的启动子取决于具体应用。任选地,启动子与异源转录起始位点的距离和它在天然背景中与转录起始位点的距离大致相同。然而,如本领域已知的,
可以允许该距离有一定的改变而不丧失启动子功能。
[0557] 除了启动子外,表达载体通常包含转录单位或表达盒,其含有对于突变型多肽在宿主细胞中表达而言所需的所有另外的元件。因此,典型的表达盒包含与编码突变型多肽
和对于转录物有效聚腺苷酸化而言所需的信号的核酸序列有效连接的启动子、核糖体结合
位点和翻译终止。编码多肽的核酸序列通常连接至可切割的信号肽序列以促进经转化的细
胞对于该多肽的分泌。此类信号肽尤其包括来自组织纤溶酶原激活物、胰岛素和神经元生
长因子以及烟芽夜蛾(Heliothis virescens)的保幼激素酯酶的信号肽。该盒的另外的元
件可以包括增强子,和如果将基因组DNA用作结构基因,还包括具有功能性剪接供体和接
纳体位点的内含子。
[0558] 除了启动子序列外,表达盒还应当包含结构基因下游的转录终止区以提供有效终止。终止区可以从与启动子序列相同的基因获得,或者可以从不同的基因获得。
[0559] 用于将遗传信息转运到细胞中的具体表达载体不是特别关键的。可以使用用于在真核或原核细胞中进行表达的任何常规载体。标准的细菌表达载体包括质粒例如基
于pBR322的质粒,pSKF,pET23D,和融合表达系统例如GST和LacZ。也可以将附加表位
(epitope tag)添加至重组蛋白质以提供方便的分离方法,例如c-myc。
[0560] 包含来自真核生物病毒的调节元件的表达载体通常用于真核表达载体中,例如SV40载体、乳头瘤病毒载体和源自EB病毒的载体。其他示例性的真核生物载体包括pMSG,
+ +
pAV009/A,pMTO10/A,pMAMneo-5,杆状病毒pDSVE,和任何其他这样的载体,所述载体允许
蛋白质在SV40早期启动子、SV40晚期启动子、金属硫蛋白启动子、鼠乳腺肿瘤病毒启动子、
劳斯肉瘤病毒启动子、多角体蛋白启动子或显示出对于在真核细胞中表达而言有效的其他
启动子的指导下进行表达。
[0561] 在一些示例性的实施方案中,表达载体选自pCWin1、pCWin2、pCWin2/MBP、pCWin2-MBP-SBD(pMS39)和pCWin2-MBP-MCS-SBD(pMXS39),在2004年4月9日提交的共有的
美国专利申请中公开的,该专利申请通过提及而合并入本文。
[0562] 一些表达系统具有提供基因扩增的标记物,例如胸苷激酶、潮霉素B磷酸转移酶和二氢叶酸还原酶。备选地,不涉及基因扩增的高产率表达系统也是合适的,如昆虫细胞中
的杆状病毒载体,其中编码突变型多肽的多核苷酸序列处于多角体蛋白启动子或其他强的
杆状病毒启动子的指导下。
[0563] 通常包含在表达载体中的元件还包括在大肠杆菌中发挥功能的复制子,编码抗生素抗性以允许选择含有重组质粒的细菌的基因,和允许插入真核生物序列的在质粒的非必
需区域中的独特限制酶切位点。所选择的具体抗生素抗性基因不是关键的,本领域已知的
许多抗性基因中的任何一种均是合适的。如果需要,任选地如此选择原核生物序列,即使得
它们不干扰真核细胞中DNA的复制。
[0564] 当希望获得重组蛋白质(例如,本发明的hgh突变体)的周质表达时,表达载体进一步包含编码分泌信号(例如大肠杆菌OppA(周质寡肽结合蛋白)分泌信号或其修饰形
式)的序列,该序列直接连接至待表达的蛋白质的编码序列的5’。该信号序列指导在细胞
质中产生的重组蛋白质通过细胞膜进入周质空间。表达载体可以进一步包含信号肽酶1的
编码序列,当重组蛋白质进入周质空间时,所述信号肽酶1能够酶促切割信号序列。关于重
组蛋白质的周质产生的更详细的描述可以在例如Gray等人,Gene 39:247-254(1985),美
国专利号6,160,089和6,436,674中找到。
[0565] 如上文所讨论的,本领域技术人员将会认识到,可以对任何野生型或突变型多肽或者其编码序列进行各种保守取代而仍然保留该多肽的生物活性。此外,还可以修饰多核
苷酸编码序列以适应特定表达宿主中的偏爱密码子使用而不改变所得的氨基酸序列。转染
方法
[0566] 将标准的转染方法用于产生表达大量突变型多肽的细菌、哺乳动物、酵母或昆虫细胞系,然后使用标准技术来纯化所述突变型多肽(参见例如,Colley等人,J.Biol.
Chem.264:17619-17622(1989);Guide to Protein Purification,in Methods in
Enzymology,vol.182(Deutscher,ed.,1990))。根据标准技术来进行真核和原核细胞的转
化(参见例如,Morrison,J.Bact.132:349-351(1977);Clark-Curtiss& Curtiss,Methods
in Enzymology 101:347-362(Wu等人,eds,1983))。
[0567] 可以使用任何公知的用于将外源核苷酸序列引入宿主细胞中的程序。这些程序包括使用磷酸钙转染、Polybrene、原生质体融合、电穿孔、脂质体、显微注射、原生质载体
(plasma vector)、病毒载体和任何其他公知的用于将经克隆的基因组DNA、cDNA、合成的
DNA或其他外源遗传物质引入宿主细胞中的方法(参见,例如,Sambrook和Russell,同
上)。唯一必需的是,所使用的具体遗传工程程序能够成功地将至少一个基因引入能够表达
突变型多肽的宿主细胞中。检测突变型多肽在宿主细胞中的表达
[0568] 在将表达载体引入合适的宿主细胞后,在有利于突变型多肽表达的条件下培养经转染的细胞。然后,就该重组多肽的表达来筛选细胞,所述重组多肽随后用标准技术从培养
物中回收(参见,例如,Scopes,Protein Purification:Principles and Practice(1982);
美国专利号4,673,641;Ausubel等人,同上;和Sambrook和Russell,同上)。
[0569] 几种用于筛选基因表达的一般方法是本领域技术人员公知的。首先,可以在核酸水平上检测基因表达。通常使用各种利用核酸杂交技术来进行特异DNA和RNA测量的方
法(例如,Sambrook和Russell,同上)。一些方法涉及电泳分离(例如,用于检测DNA的
Southern印迹和用于检测RNA的Northern印迹),但是也可以不用电泳来进行DNA或RNA
的检测(例如,通过斑点印迹)。使用序列特异性引物,通过PCR或RT-PCR也可以检测在经
转染的细胞中编码突变型多肽的核酸的存在。
[0570] 其次,可以在多肽水平上检测基因表达。本领域技术人员常规地使用各种免疫学测定法来测量基因产物的水平,特别是使用与本发明的突变型多肽特异性地反应的多克隆
或单克隆抗体(例如,Harlow和Lane,Antibodies,A Laboratory Manual,Chapter 14,
ColdSpring Harbor,1988;Kohler和Milstein,Nature,256:495-497(1975))。此类技术
需要通过选择对突变型多肽和其抗原性部分具有高特异性的抗体来进行抗体制备。产生多
克隆和单克隆抗体的方法是成熟的,并且它们的描述可以在文献中找到,参见例如,Harlow
和Lane,同上;Kohler和Milstein,Eur.J.Immunol.,6:511-519(1976)。关于制备针对本
发明突变型多肽的抗体和施行用于检测突变型多肽的免疫学测定法的更详细描述在后面
的部分中提供。纯化重组产生的突变型多肽
[0571] 一旦证实了重组突变型多肽在经转染的宿主细胞中的表达,那么就以合适的规模培养所述宿主细胞以便纯化所述重组多肽。1.从细菌中纯化
[0572] 当通过经转化的细菌大量重组产生本发明的突变型多肽(通常在启动子诱导后,尽管表达可以是诱导型的)时,蛋白质可以形成不溶性聚集体。存在有几种适于纯化蛋白
质内含体的方案。例如,聚集体蛋白质(下文中称作内含体)的纯化通常包括:通过破坏
细菌细胞,例如通过在约100-150μg/ml溶菌酶和0.1%Nonidet P40(一种非离子型去
污剂)的缓冲液中进行温育,来提取、分离和/或纯化内含体。可以使用Polytron研磨器
(Brinkman Instruments,Westbury,NY)来研磨细菌悬浮液。备选地,可以在冰上对细胞
进行超声处理。裂解细菌的备选方法描述在Ausubel等人以及Sambrook和Russell(都同
上)中,并且对于本领域技术人员而言将是明显的。
[0573] 一般地,离心细胞悬浮液,并将含有内含体的粒状沉淀重悬浮在缓冲液中,该缓冲液不溶解但是洗涤内含体,例如,20mMTris-HCl(pH 7.2),1mM EDTA,150mM NaCl和2%
Triton-X 100(一种非离子型去污剂)。必需重复洗涤步骤以除去尽可能多的细胞碎片。可
以将剩余的内含体的粒状沉淀重悬浮在合适的缓冲液(例如,20mM磷酸钠,pH 6.8,150mM
NaCl)中。其他合适的缓冲液对于本领域技术人员而言将是明显的。
[0574] 在洗涤步骤后,通过添加既是强的氢接纳体又是强的氢供体的溶剂(或者几种溶剂的组合,每种溶剂具有这些性质之一)来溶解内含体。然后,可以通过用相容的缓冲液稀
释或透析来使形成内含体的蛋白质复性。合适的溶剂包括但不限于,尿素(约4M至约8M)、
甲酰胺(至少约80%,基于体积/体积)和盐酸胍(约4M至约8M)。一些能够溶解形成聚
集体的蛋白质的溶剂,例如SDS(十二烷基硫酸钠)和70%甲酸对于在该程序中的使用可
能是不合适的,因为蛋白质可能被不可逆地变性,伴随着免疫原性和/或活性的缺乏。尽管
盐酸胍和类似的试剂是变性剂,但是该变性不是不可逆的,并且当除去(例如通过透析)或
稀释所述变性剂时可以发生复性,从而允许再次形成免疫学和/或生物学上有活性的目的
蛋白质。在溶解后,可以通过标准分离技术来分开所述蛋白质与其他细菌蛋白质。关于从
细菌内含体中纯化重组多肽的进一步描述,参见例如,Patra等人,Protein Expressionand
Purification 18:182-190(2000)。
[0575] 备选地,可能从细菌周质中纯化重组多肽,例如突变型多肽。当重组蛋白质被输出到细菌的周质中时,除了本领域技术人员已知的其他方法之外,可以通过冷渗压震扰来分
离细菌的周质级分(参见例如,Ausubel等人,同上)。为了从周质中分离重组蛋白质,离心
细菌细胞从而形成粒状沉淀。将粒状沉淀重悬浮在含有20%蔗糖的缓冲液中。为了裂解
细胞,将细菌离心,并将粒状沉淀重悬浮在冰冷的5mM MgSO4中并在冰浴中保持约10分钟。
离心细胞悬浮液,并且倒出并保存上清液。可以通过本领域技术人员公知的标准分离技术
来分开存在于上清液中的重组蛋白质与宿主蛋白质。2.用于纯化的标准蛋白质分离技术
[0576] 当重组多肽例如本发明的突变型多肽在宿主细胞中以可溶形式表达时,其纯化可以按照标准蛋白质纯化程序,例如下文所描述的那些来进行,或者纯化可以使用别处公开
的方法,例如PCT公开号WO2006/105426(其通过提及而合并入本文)中公开的方法来完
成。溶解度分级分离
[0577] 常常作为最初的步骤,并且如果蛋白质混合物是复杂的,那么最初的盐分级分离可以将许多不想要的宿主细胞蛋白质(或者源自细胞培养基的蛋白质)与目的重组蛋白质
例如本发明的突变型多肽相分开。优选的盐是硫酸铵。硫酸铵通过有效地减少蛋白质混合
物中的水量来沉淀蛋白质。然后,蛋白质基于它们的溶解度而沉淀出来。蛋白质越是疏水
性的,其越可能在较低的硫酸铵浓度下沉淀。典型的方案是向蛋白质溶液中添加饱和硫酸
铵,从而使得所得的硫酸铵浓度为20-30%。这将沉淀出多数疏水性的蛋白质。丢弃沉淀
(除非目的蛋白是疏水性的),并向上清液中添加硫酸铵至已知沉淀目的蛋白质的浓度。然
后,将沉淀溶解在缓冲液中,并且如果需要,通过透析或渗滤除去过量的盐。依赖于蛋白质
溶解度的其他方法,例如冷乙醇沉淀法,是本领域技术人员公知的,并且可以用于分级分离
复杂的蛋白质混合物。超滤
[0578] 基于计算出的分子量,可以使用经过不同孔径的膜(例如,Amicon或Millipore膜)的超滤来分离具有较大和较小尺寸的蛋白质。作为第一步,经过其孔径具有低于目的
蛋白质(例如突变型多肽)分子量的分子量截止值的膜来超滤蛋白质混合物。然后,将该
超滤的滞留物对具有大于目的蛋白质分子量的分子截止值的膜进行超滤。重组蛋白质将通
过该膜进入滤液。然后,如下所述,对滤液实施色谱法。柱色谱法
[0579] 还可以基于它们的大小、净表面电荷、疏水性或者对配体的亲和力来分开目的蛋白质(例如本发明的突变型多肽)与其他蛋白质。此外,可以将针对多肽而产生的抗体缀
合至柱基质,并免疫纯化该多肽。所有这些方法是本领域公知的。
[0580] 对于本领域技术人员而言将是明显的是,可以在任何规模上并使用来自许多不同生产商(例如,Pharmacia Biotech)的设备来施行色谱技术。用于检测突变型多肽表达的
免疫测定法
[0581] 为了证实重组突变型多肽的产生,免疫学测定法可以用于检测样品中多肽的表达。免疫学测定法也可以用于定量重组激素的表达水平。针对突变型多肽的抗体是施行这
些免疫学测定法所必需的。产生针对突变型多肽的抗体
[0582] 用于产生与目的免疫原特异性地反应的多克隆和单克隆抗体的方法是本领域技术人员已知的(参见例如,Coligan,CurrentProtocols in Immunology Wiley/
Greene,NY,1991;Harlow 和 Lane,Antibodies:A Laboratory Manual Cold Spring
Harbor Press,NY,1989;Stites 等 人 (eds.)Basic and Clinical Immunology( 第 4
版)LangeMedical Publications,Los Altos,CA,和其中所引用的参考文献;Goding,
Monoclonal Antibodies:Principles and Practice(第2版)Academic Press,New York,
NY,1986;和Kohler和Milstein Nature 256:495-497,1975)。此类技术包括通过从在噬
菌体或类似载体中的重组抗体文库中选择抗体来进行抗体制备(参见,Huse等人,Science
246:1275-1281,1989;和Ward等人,Nature 341:544-546,1989)。
[0583] 为了产生含有具有所希望的特异性的抗体的抗血清,可以将目的多肽(例如,本发明的突变型多肽)或其抗原片段用于免疫合适的动物,例如小鼠、兔或灵长类动物。可以
根据标准的免疫方案来使用标准的佐剂,例如弗氏佐剂。备选地,可以将源自该特定多肽的
合成的抗原性肽缀合至载体蛋白,并随后用作免疫原。
[0584] 通过获取测试血样并测定对于目的抗原的反应性滴度来监测动物对于所述免疫原制剂的免疫应答。当获得适当高滴度的针对该抗原的抗体时,从动物中收集血液并制备
抗血清。随后可以进行抗血清的进一步分级分离以富集与该抗原特异性地反应的抗体,和
进行抗体的纯化,参见,Harlow和Lane(同上),以及上面提供的蛋白质纯化的一般性描述。
[0585] 使用本领域技术人员熟悉的各种技术来获得单克隆抗体。通常,来自用所希望的抗原进行免疫的动物的脾细胞常常通过与骨髓瘤细胞融合而永生化(参见,Kohler和
Milstein,Eur.J.Immunol.6:511-519,1976)。备选的永生化方法包括,例如,用EB病毒、癌
基因或逆转录病毒进行转化,或者本领域公知的其他方法。就具有所希望的对于所述抗原
的特异性和亲和力的抗体产生来筛选从单个永生化细胞生成的集落,并且由此类细胞产生
的单克隆抗体的产率可以通过各种技术来增强,所述技术包括注射到脊椎动物宿主的腹膜
腔中。
[0586] 另外,还可以在通过根据Huse等人(同上)所概述的一般性方案筛选人B细胞cDNA文库而鉴定出编码具有所希望的特异性的抗体或此类抗体的结合片段的核酸序列之
后,重组产生单克隆抗体。上面所讨论的关于重组多肽产生的一般性原理和方法可应用于
通过重组方法来进行的抗体产生。
[0587] 当希望时,可以就它们针对野生型多肽的交叉反应性来测试能够特异性地识别本发明的突变型多肽的抗体,并从而与针对野生型蛋白质的抗体相区分。例如,可以让从用突
变型多肽进行免疫的动物中获得的抗血清走过柱,在所述柱上固定了野生型多肽。经过柱
的抗血清的部分仅识别突变型多肽而不识别野生型多肽。类似地,也可以就它们在仅识别
突变型多肽而不识别野生型多肽中的排他性来筛选针对突变型多肽的单克隆抗体。
[0588] 仅特异性地识别本发明的突变型多肽而不识别野生型多肽的多克隆或单克隆抗体可用于从野生型蛋白质中分离突变型蛋白质,例如,通过将样品与固定在固体支持物上
的突变型肽-特异性多克隆或单克隆抗体一起进行温育。用于检测重组多肽表达的免疫测
定法
[0589] 一旦可得对于本发明的突变型多肽特异的抗体,就可以通过各种免疫测定方法来测量样品(例如细胞裂解物)中所述多肽的量,从而为技术人员提供定性和定量结
果。关于一般性的免疫学和免疫测定法程序的综述,参见例如,Stites,同上;美国专利号
4,366,24l、4,376,110、4,517,288和4,837,168。在免疫测定法中进行标记
[0590] 免疫测定法常常利用标记试剂来特异性地结合并标记由抗体和靶蛋白形成的结合复合物。标记试剂可以自身是包含抗体/靶蛋白复合物的部分之一,或者可以是第三个
部分,例如另一抗体,其特异性地结合至抗体/靶蛋白复合物。标记可以通过光谱学、光化
学、生物化学、免疫化学、电学、光学或者化学方法来检测。实例包括但不限于,磁珠(例如,
TM
Dynabeads )、荧光染料(例如,异硫氰酸荧光素、德克萨斯红、罗丹明等等)、放射性标记
3 125 35 14 32
(例如,H、I、S、C或 P)、酶(例如,辣根过氧化物酶、碱性磷酸酶和其他通常用于ELISA
中的酶)和比色法标记例如胶体金或者有色的玻璃或塑料(例如,聚苯乙烯、聚丙烯、胶乳,
等等)珠。
[0591] 在一些情况中,标记试剂是携带有可检测标记的二抗。备选地,二抗可以缺少标记,但是它又可以被经标记的三抗结合,该三抗特异于所述二抗所对应的物种的抗体。二抗
可以用可检测的部分例如生物素来进行修饰,第三种经标记的分子可以特异性地结合至所
述可检测的部分,例如经酶标记的链霉抗生物素蛋白。
[0592] 能够特异性地结合免疫球蛋白恒定区的其他蛋白质,例如A蛋白或G蛋白也可以用作标记试剂。这些蛋白质是链球菌细胞壁的正常组分。它们展示出强烈的与来自各种
物种的免疫球蛋白恒定区的非免疫原性反应性(一般参见Kronval等人J.Immunol.,111:
1401-1406(1973);和Akerstrom等人,J.Immunol.,135:2589-2542(1985))。免疫测定法
形式
[0593] 用于检测来自样品的目的靶蛋白(例如,突变型人生长激素)的免疫测定法可以是竞争性的或非竞争性的。非竞争性免疫测定法是这样的测定法,其中直接测量被捕获的
靶蛋白的量。在一个优选的“夹心”测定法中,例如,对于靶蛋白特异的抗体可以直接结合
至固体基材,在那里固定所述抗体。然后,它捕获测试样品中的靶蛋白。然后,如此固定的
抗体/靶蛋白复合物被标记试剂(例如,携带有标记的二抗或三抗,如上所述)结合。
[0594] 在竞争性测定法中,通过测量被样品中存在的靶蛋白从对该靶蛋白特异的抗体上置换出(或者竞争去除)的所加入的(外源的)靶蛋白的量,来间接测量样品中靶蛋白的
量。在此类测定法的典型实例中,将抗体固定化并标记外源靶蛋白。因为结合至抗体的外
源靶蛋白的量与样品中存在的靶蛋白的浓度成反比,所以可以基于结合至抗体从而被固定
的外源靶蛋白的量来测定样品中的靶蛋白水平。
[0595] 在一些情况中,使用Western印迹(免疫印迹)分析来检测和定量样品中突变型多肽的存在。该技术通常包括基于分子量通过凝胶电泳来分开样品蛋白质,将分开的蛋白
质转移到合适的固体支持物(例如硝酸纤维素滤膜、尼龙滤膜或者衍生化的尼龙滤膜)上,
并将样品与特异性地结合靶蛋白的抗体一起温育。这些抗体可以直接进行标记,或者备选
地,可以随后使用与针对突变型多肽的抗体特异性地结合的经标记的抗体(例如,经标记
的绵羊抗小鼠抗体)来检测。
[0596] 其他测定法形式包括脂质体免疫测定法(LIA),其使用被设计成结合特定分子(例如抗体)并释放所包裹的试剂或标记物的脂质体。然后,根据标准技术来检测释放的化
学物质(参见,Monroe等人,Amer.Clin.Prod.Rev.,5:34-41(1986))。治疗方法
[0597] 除了上面所讨论的缀合物外,本发明还提供了通过给处于形成疾病的风险中的受试者或者已患有疾病的受试者施用本发明的多肽缀合物来预防、治愈或改善疾病的方法。
此外,本发明提供了将本发明的缀合物靶向身体的特定组织或区域的方法。
[0598] 提供下面的实例以举例说明本发明的组合物和方法,但并不是限制所要求保护的发明。本发明的优选实施方案:
[0599] 在一个实施方案中,本发明提供了糖基化或非糖基化的序列肽段多肽和聚合物修饰基团之间的共价缀合物,所述序列肽段多肽对应于亲本多肽并且包含外源O-联糖基化
序列,所述聚合物修饰基团通过糖基连接基团在所述O-联糖基化序列处缀合至所述序列
肽段多肽,其中所述糖基连接基团插入在所述序列肽段多肽和所述聚合物修饰基团之间
并且共价连接至所述序列肽段多肽和所述聚合物修饰基团,条件是所述亲本多肽不是选
自人生长激素(hGH)、粒细胞集落刺激因子(G-CSF)、干扰素-α(INF-α)、胰高血糖素样
肽-1(GLP-1)和成纤维细胞生长因子(FGF)的成员。
[0600] 上面实施方案的共价缀合物,其中所述聚合物修饰基团是选自线性和支化的成员并且包含一个或多个聚合物部分,其中每个聚合物部分独立地进行选择。
[0601] 上述任一实施方案的共价缀合物,其中所述聚合物部分是选自聚(乙二醇)和甲氧基-聚(乙二醇)(m-PEG)的成员。
[0602] 上述任一实施方案的共价缀合物,其中所述糖基连接基团是完整的糖基连接基团。
[0603] 上述任 一实施 方案的 共价缀 合物,其包 含根据 式(III)的部 分:9 p
其中R 是H、负电荷或盐抗衡离子;和R 是
选自下列的成员:
其中n是选自1至20的整数,并且f和e是独立地选自1-2500的整数。
[0604] 上述任一实施方案的共价缀合物,其中所述亲本多肽是选自下列的成员:骨形态发生蛋白2(BMP-2)、骨形态发生蛋白7(BMP-7)、骨形态发生蛋白15(BMP-15)、神经营养蛋
白-3(NT-3)、冯维勒布兰德因子(vWF)蛋白酶、促红细胞生成素(EPO)、α1-抗胰蛋白酶
(α-1蛋白酶抑制剂)、葡糖脑苷脂酶、组织型血纤维蛋白溶酶原活化因子(TPA)、瘦蛋白、
蛭素、尿激酶、人DNA酶、胰岛素、乙型肝炎表面蛋白(HbsAg)、嵌合的白喉毒素-IL-2、人绒
毛膜促性腺激素(hCG)、甲状腺过氧化物酶(TPO)、α-半乳糖苷酶、α-L-艾杜糖苷酸酶、
β-葡糖苷酶、α-半乳糖苷酶A、酸性α-葡糖苷酶(酸性麦芽糖酶)、抗凝血酶III(AT
III)、促卵泡激素(FSH)、胰高血糖素样肽-2(GLP-2)、因子VII、因子VIII、B-结构域缺失
的因子VIII、因子IX、因子X、因子XIII、prokinetisin、extendin-4、CD4、肿瘤坏死因子
受体(TNF-R)、α-CD20、P-选择蛋白糖蛋白配体-1(PSGL-1)、补体、转铁蛋白、依赖于糖基
化的细胞粘着分子(GlyCAM)、神经细胞粘着分子(N-CAM)、TNF受体-IgG Fc区融合蛋白、
抗-HER2单克隆抗体、针对呼吸道合胞病毒的单克隆抗体、针对呼吸道合胞病毒的蛋白F的
单克隆抗体、针对TNF-α的单克隆抗体、针对糖蛋白IIb/IIIa的单克隆抗体、针对CD20的
单克隆抗体、针对VEGF-A的单克隆抗体、针对PSGL-1的单克隆抗体、针对CD4的单克隆抗
体、针对a-CD3的单克隆抗体、针对EGF的单克隆抗体、针对癌胚抗原(CEA)的单克隆抗体
和针对IL-2受体的单克隆抗体。
[0605] 上述任一实施方案的共价缀合物,其中所述外源O-联糖基化序列是选自下列的成员:(X)mPTP、(X)mPTEI(P)n、(X)mPTQA(P)n、(X)mPTINT(P)n、(X)mPTTVS(P)n、(X)mPTTVL(P)n、(X)mPTQGAM(P)n、(X)mTET(P)n、(X)mPTVL(P)n、(X)mPTLS(P)n、(X)mPTDA(P)n、(X)mPTEN(P)n、(X)mPTQD(P)n、(X)mPTAS(P)n、(X)mPTQGA(P)n、(X)mPTSAV(P)n、(X)mPTTLYV(P)n、(X)mPSSG(P)n和(X)mPSDG(P)n,其中,m和n是独立地选自0和1的整数;P是脯氨酸;和X是独立地选自
谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和不带电荷
的氨基酸的成员。
[0606] 上述任一实施方案的共价缀合物,其中所述外源O-联糖基化序列是选自下列的成员:PTP、PTEI、PTEIP、PTQA、PTQAP、PTINT、PTINTP、PTTVS、PTTVL、PTQGAM、PTQGAMP和
TETP。
[0607] 药物组合物,其包含上述任一实施方案的共价缀合物和可药用载体。
[0608] 包含序列肽段多肽的多肽缀合物,所述序列肽段多肽对应于亲本多肽并且具有外源O-联糖基化序列,所述多肽缀合物包含根据式(V)的部分:
其中,w是选自0和1的整数;q是选自0
和1的整数;AA-O-是从具有被羟基取代的侧链的氨基酸衍生而得的部分,所述氨基酸位于
* *
所述O-联糖基化序列内;Z 是选自糖基部分和糖基连接基团的成员;和X 是选自聚合物
修饰基团和共价连接至聚合物修饰基团的糖基连接基团的成员,条件是所述亲本多肽不是
选自人生长激素(hGH)、粒细胞集落刺激因子(G-CSF)、干扰素-α(INF-α)、胰高血糖素样
肽-1(GLP-1)和成纤维细胞生长因子(FGF)的成员。
[0609] 根据上述任一实施方案的多肽缀合物,其中所述氨基酸是丝氨酸(S)或苏氨酸(T)。
[0610] 上述任一实施方案的多肽缀合物,其中所述外源O-联糖基化序列是选自下列的成员:(X)mPTP、(X)mPTEI(P)n、(X)mPTQA(P)n、(X)mPTINT(P)n、(X)mPTTVS(P)n、(X)mPTTVL(P)n、(X)mPTQGAM(P)n、(X)mTET(P)n、(X)mPTVL(P)n、(X)mPTLS(P)n、(X)mPTDA(P)n、(X)mPTEN(P)n、(X)mPTQD(P)n、(X)mPTAS(P)n、(X)mPTQGA(P)n、(X)mPTSAV(P)n、(X)mPTTLYV(P)n、(X)mPSSG(P)n和(X)mPSDG(P)n,其中,m和n是独立地选自0和1的整数;P是脯氨酸;和X是独立地选自
谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和不带电荷
的氨基酸的成员。
[0611] 上述任一实施方案的多肽缀合物,其中所述外源O-联糖基化序列是选自下列的成员:PTP、PTEI、PTEIP、PTQA、PTQAP、PTINT、PTINTP、PTTVS、PTTVL、PTQGAM、PTQGAMP和
TETP。

[0612] 根据上述任一实施方案的多肽缀合物,其中Z 是选自GalNAc、GalNAc-Gal、GalNAc-Gal-Sia和GalNAc-Sia的成员。
[0613] 根据上述任一实施方案的多肽缀合物,其中所述聚合物修饰基团是选自线性和支化的成员并且包含一个或多个聚合物部分,其中每个所述聚合物部分独立地进行选择。
[0614] 根据上述任一实施方案的多肽缀合物,其中所述聚合物部分是选自聚(乙二醇)和其衍生物的成员。
[0615] 根据上述任一实施方案的多肽缀合物,其中w是1。*
[0616] 根据上述任一实施方案的多肽缀合物,其中X 包含这样的部分,该部分是选自唾液酸基(Sia)部分、半乳糖基(Gal)部分、GalNAc部分和Gal-Sia部分的成员。
[0617] 根据上述任一实施方案的多肽缀合物,其中所述亲本多肽是选自下列的成员:骨形态发生蛋白2(BMP-2)、骨形态发生蛋白7(BMP-7)、骨形态发生蛋白15(BMP-15)、神经营
养蛋白-3(NT-3)、冯维勒布兰德因子(vWF)蛋白酶、促红细胞生成素(EPO)、α1-抗胰蛋白
酶(α-1蛋白酶抑制剂)、葡糖脑苷脂酶、组织型血纤维蛋白溶酶原活化因子(TPA)、瘦蛋
白、蛭素、尿激酶、人DNA酶、胰岛素、乙型肝炎表面蛋白(HbsAg)、嵌合的白喉毒素-IL-2、
人绒毛膜促性腺激素(hCG)、甲状腺过氧化物酶(TPO)、α-半乳糖苷酶、α-L-艾杜糖苷
酸酶、β-葡糖苷酶、α-半乳糖苷酶A、酸性α-葡糖苷酶(酸性麦芽糖酶)、抗凝血酶
III(AT III)、促卵泡激素、胰高血糖素样肽-2(GLP-2)、因子VII、因子VIII、B-结构域缺
失的因子VIII、因子IX、因子X、因子XIII、prokinetisin、extendin-4、CD4、肿瘤坏死因子
受体(TNF-R)、α-CD20、P-选择蛋白糖蛋白配体-1(PSGL-1)、补体、转铁蛋白、依赖于糖基
化的细胞粘着分子(GlyCAM)、神经细胞粘着分子(N-CAM)、TNF受体-IgG Fc区融合蛋白、
抗-HER2单克隆抗体、针对呼吸道合胞病毒的单克隆抗体、针对呼吸道合胞病毒的蛋白F的
单克隆抗体、针对TNF-α的单克隆抗体、针对糖蛋白IIb/IIIa的单克隆抗体、针对CD20的
单克隆抗体、针对VEGF-A的单克隆抗体、针对PSGL-1的单克隆抗体、针对CD4的单克隆抗
体、针对a-CD3的单克隆抗体、针对EGF的单克隆抗体、针对癌胚抗原(CEA)的单克隆抗体
和针对IL-2受体的单克隆抗体。
[0618] 根据上述任一实施方案的多肽缀合物,其中X*包含根据式(VI)的部分:其中,E是选自O、S、NR27和CHR28的成员,其
27 28
中R 和R 是独立地选自H、取代或未取代的烷基、取代或未取代的杂烷基、取代或未取代
1
的芳基、取代或未取代的杂芳基和取代或未取代的杂环烷基的成员;E 是选自O和S的成
2 1 1 1 1 1 9 9 10 11
员;R 是选自H、-R、-CH2R 和-C(X)R 的成员,其中R 是选自OR、SR、NR R 、取代或未
9
取代的烷基和取代或未取代的杂烷基的成员,其中R 是选自H、负电荷、金属离子、取代或
10 11
未取代的烷基、取代或未取代的杂烷基和酰基的成员;R 和R 是独立地选自H、取代或未
1
取代的烷基、取代或未取代的杂烷基和酰基的成员;X 是选自取代或未取代的链烯基、O、
8 8
S和NR 的成员,其中R 是选自H、OH、取代或未取代的烷基和取代或未取代的杂烷基的成
员;Y是选自CH2、CH(OH)CH2、CH(OH)CH(OH)CH2、CH、CH(OH)CH、CH(OH)CH(OH)CH、CH(OH)、
2 6 6
CH(OH)CH(OH)和CH(OH)CH(OH)CH(OH)的成员;Y 是选自H、OR、R、取代或未取代的烷
基、取代或未取代的杂烷基、 的成员,其
中R6和R7是独立地选自H、La-R6b、C(O)R6b、C(O)-La-R6b、取代或未取代的烷基和取代或未
取代的杂烷基的成员,其中R6b是选自H、取代或未取代的烷基、取代或未取代的杂烷基和
修饰基团的成员;R3、R3’和R4是独立地选自H、OR3”、SR3”、取代或未取代的烷基、取代或未取代的杂烷基、-La-R6c、-C(O)-La-R6c、-NH-La-R6c、=N-La-R6c和-NHC(O)-La-R6c的成员,其中R3”是选自H、取代或未取代的烷基和取代或未取代的杂烷基的成员;和R6c是选自H、取
代或未取代的烷基、取代或未取代的杂烷基、取代或未取代的芳基、取代或未取代的杂芳
基、取代或未取代的杂环烷基、NR13R14和修饰基团的成员,其中R13和R14是独立地选自H、
取代或未取代的烷基和取代或未取代的杂烷基的成员;和每个La是独立地选自键和接头
基团的成员。根据上述任一实施方案的多肽缀合物,其中X*包含根据式(VII)的部分:
[0619] 根据上述任一实施方案的多肽缀合物,其中R6b和R6c中的至少一个是选自下列的成员: 其
中,s、j和k是独立地选自0至20的整数;每个n是独立地选自0至2500的整数;m是1-5
16 17 2 4
的整数;Q是选自H和C1-C6烷基的成员;R 和R 是独立选择的聚合物部分;X 和X 是独立
16 17 5
选择的将聚合物部分R 和R 连接到C上的连接片段;X 是除聚合物部分之外的其他非反
1 2 3 4 5 6 7 8 9 10 11
应性基团;和A、A、A、A、A、A、A、A、A、A 和A 是独立地选自H、取代或未取代的烷基、
取代或未取代的杂烷基、取代或未取代的杂环烷基、取代或未取代的芳基、取代或未取代的
12 13 12 12 13 12 13
杂芳基、-NA A 、-OA 和-SiA A 的成员,其中A 和A 是独立地选自取代或未取代的烷
基、取代或未取代的杂烷基、取代或未取代的杂环烷基、取代或未取代的芳基和取代或未取
代的杂芳基的成员。
[0620] 药物组合物,其包含根据上述任一实施方案的多肽缀合物和可药用载体。
[0621] 对应于亲本多肽的序列肽段多肽,其中所述序列肽段多肽包含选自SEQ ID NO:1*
和SEQ ID NO:2的外源O-联糖基化序列:(X)mPO U(B)p(Z)r(J)s(O)t(P)n (SEQ ID NO:1);
1
和(X)m(B)pTUB(Z)r(J)s(P)n (SEQ ID NO:2)其中,m、n、p、r、s和t是独立地选自0

和1的整数;P是脯氨酸;O 是选自丝氨酸(S)和苏氨酸(T)的成员;U是选自脯氨酸(P)、
谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和不带电荷
1
的氨基酸的成员;X、B和B 是独立地选自谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰
胺(N)、苏氨酸(T)、丝氨酸(S)和不带电荷的氨基酸的成员;和Z、J和O是独立地选自谷氨
酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)、酪氨酸(Y)、甲
硫氨酸(M)和不带电荷的氨基酸的成员,条件是所述亲本多肽不是选自人生长激素(hGH)、
粒细胞集落刺激因子(G-CSF)、干扰素-α(INF-α)、胰高血糖素样肽-1(GLP-1)和成纤维
细胞生长因子(FGF)的成员。
[0622] 根据上述任一实施方案的序列肽段多肽,其中所述外源O-联糖基化序列是选自下列的成员:(X)mPTP、(X)mPTEI(P)n、(X)mPTQA(P)n、(X)mPTINT(P)n、(X)mPTTVS(P)n、(X)
mPTTVL(P)n、(X)mPTQGAM(P)n、(X)mTET(P)n、(X)mPTVL(P)n、(X)mPTLS(P)n、(X)mPTDA(P)n、(X)mPTEN(P)n、(X)mPTQD(P)n、(X)mPTAS(P)n、(X)mPTQGA(P)n、(X)mPTSAV(P)n、(X)mPTTLYV(P)n、(X)mPSSG(P)n和(X)mPSDG(P)n,其中,m和n是独立地选自0和1的整数;P是脯氨酸;和X是独
立地选自谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和
不带电荷的氨基酸的成员。
[0623] 根据上述任一实施方案的序列肽段多肽,其中所述外源O-联糖基化序列是选自下列的成员:PTP、PTEI、PTEIP、PTQA、PTQAP、PTINT、PTINTP、PTTVS、PTTVL、PTQGAM、PTQGAMP和TETP。
[0624] 根据上述任一实施方案的序列肽段多肽,其中所述外源O-联糖基化序列是GalNAc-转移酶的底物。
[0625] 根据上述任一实施方案的序列肽段多肽,其中至少三个氨基酸存在于所述O*和赖氨酸(K)或精氨酸(R)残基之间。
[0626] 根据上述任一实施方案的序列肽段多肽,其中所述亲本多肽是治疗性多肽。
[0627] 根据上述任一实施方案的序列肽段多肽,其中所述亲本多肽是选自下列的成员:骨形态发生蛋白2(BMP-2)、骨形态发生蛋白7(BMP-7)、骨形态发生蛋白15(BMP-15)、神经
营养蛋白-3(NT-3)、冯维勒布兰德因子(vWF)蛋白酶、促红细胞生成素(EPO)、α1-抗胰蛋
白酶(α-1蛋白酶抑制剂)、葡糖脑苷脂酶、组织型血纤维蛋白溶酶原活化因子(TPA)、瘦蛋
白、蛭素、尿激酶、人DNA酶、胰岛素、乙型肝炎表面蛋白(HbsAg)、嵌合的白喉毒素-IL-2、
人绒毛膜促性腺激素(hCG)、甲状腺过氧化物酶(TPO)、α-半乳糖苷酶、α-L-艾杜糖苷
酸酶、β-葡糖苷酶、α-半乳糖苷酶A、酸性α-葡糖苷酶(酸性麦芽糖酶)、抗凝血酶
III(AT III)、促卵泡激素、胰高血糖素样肽-2(GLP-2)、因子VII、因子VIII、B-结构域缺
失的因子VIII、因子IX、因子X、因子XIII、prokinetisin、extendin-4、CD4、肿瘤坏死因子
受体(TNF-R)、α-CD20、P-选择蛋白糖蛋白配体-1(PSGL-1)、补体、转铁蛋白、依赖于糖基
化的细胞粘着分子(GlyCAM)、神经细胞粘着分子(N-CAM)、TNF受体-IgG Fc区融合蛋白、
抗-HER2单克隆抗体、针对呼吸道合胞病毒的单克隆抗体、针对呼吸道合胞病毒的蛋白F的
单克隆抗体、针对TNF-α的单克隆抗体、针对糖蛋白IIb/IIIa的单克隆抗体、针对CD20的
单克隆抗体、针对VEGF-A的单克隆抗体、针对PSGL-1的单克隆抗体、针对CD4的单克隆抗
体、针对a-CD3的单克隆抗体、针对EGF的单克隆抗体、针对癌胚抗原(CEA)的单克隆抗体
和针对IL-2受体的单克隆抗体。
[0628] 分离的核酸,其编码根据上述任一实施方案的所述序列肽段多肽。
[0629] 表达载体,其包含根据上述任一实施方案的所述核酸。
[0630] 细胞,其包含根据上述任一实施方案的所述核酸。
[0631] 对应于亲本多肽的序列肽段多肽,其中所述序列肽段多肽包含选自下列的外源* * * * * *
O-联糖基化序列:XPO P、XPO EI(P)n、(X)mPO EI、XPO QA(P)n、XPO TVS、(X)mPO TVSP、
* * * * * * *
XPO QGA、(X)mPO QGAP、XPO QGAM(P)n、XTEO P、(X)mPO VL、XPO VL(P)n、XPO TVL、(X)
* * * * * *
mPO TVLP、(X)mPO TLYVP、XPO TLYV(P)n、(X)mPO LS(P)n、(X)mPO DA(P)n、(X)mPO EN(P)
* * * * * *
n、(X)mPO QD(P)n、(X)mPO AS(P)n、XPO SAV、(X)mPO SAVP、(X)mPO SG(P)n、XTEO P和(X)
* *
mPO DG(P)n,其中,m和n是独立地选自0和1的整数;O 是选自丝氨酸(S)和苏氨酸(T)
的成员;X是选自谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨
酸(S)和不带电荷的氨基酸的成员;每个S(丝氨酸)任选地并独立地用T(苏氨酸)替代;
和每个T(苏氨酸)任选地并独立地用S(丝氨酸)替代。
[0632] 根据上述任一实施方案的序列肽段多肽,其中所述O-联糖基化序列是GalNAc-转移酶的底物。
[0633] 根据上述任一实施方案的序列肽段多肽,其中至少三个氨基酸存在于所述O*和赖氨酸(K)或精氨酸(R)残基之间。
[0634] 根据上述任一实施方案的序列肽段多肽,其中所述亲本多肽是治疗性多肽。
[0635] 根据上述任一实施方案的序列肽段多肽,其中所述亲本多肽是选自下列的成员:骨形态发生蛋白2(BMP-2)、骨形态发生蛋白7(BMP-7)、骨形态发生蛋白15(BMP-15)、神经
营养蛋白-3(NT-3)、冯维勒布兰德因子(vWF)蛋白酶、促红细胞生成素(EPO)、粒细胞集落
刺激因子(G-CSF)、粒细胞-巨噬细胞集落刺激因子(GM-CSF)、干扰素α、干扰素β、干扰
素γ、α1-抗胰蛋白酶(α-1蛋白酶抑制剂)、葡糖脑苷脂酶、组织型血纤维蛋白溶酶原活
化因子(TPA)、白细胞介素-2(IL-2)、瘦蛋白、蛭素、尿激酶、人DNA酶、胰岛素、乙型肝炎表
面蛋白(HbsAg)、嵌合的白喉毒素-IL-2、人生长激素(hGH)、人绒毛膜促性腺激素(hCG)、甲
状腺过氧化物酶(TPO)、α-半乳糖苷酶、α-L-艾杜糖苷酸酶、β-葡糖苷酶、α-半乳糖苷
酶A、酸性α-葡糖苷酶(酸性麦芽糖酶)、抗凝血酶III(ATIII)、促卵泡激素(FSH)、胰高
血糖素样肽-1(GLP-1)、胰高血糖素样肽-2(GLP-2)、成纤维细胞生长因子7(FGF-7)、成纤
维细胞生长因子21(FGF-21)、成纤维细胞生长因子23(FGF-23)、因子VII、因子VIII、B-结
构域缺失的因子VIII、因子IX、因子X、因子XIII、prokinetisin、extendin-4、CD4、肿瘤坏
死因子受体(TNF-R)、α-CD20、P-选择蛋白糖蛋白配体-1(PSGL-1)、补体、转铁蛋白、依赖
于糖基化的细胞粘着分子(GlyCAM)、神经细胞粘着分子(N-CAM)、TNF受体-IgG Fc区融合
蛋白、抗-HER2单克隆抗体、针对呼吸道合胞病毒的单克隆抗体、针对呼吸道合胞病毒的蛋
白F的单克隆抗体、针对TNF-α的单克隆抗体、针对糖蛋白IIb/IIIa的单克隆抗体、针对
CD20的单克隆抗体、针对VEGF-A的单克隆抗体、针对PSGL-1的单克隆抗体、针对CD4的单
克隆抗体、针对a-CD3的单克隆抗体、针对EGF的单克隆抗体、针对癌胚抗原(CEA)的单克
隆抗体和针对IL-2受体的单克隆抗体。
[0636] 分离的核酸,其编码根据上述任一实施方案的所述序列肽段多肽。
[0637] 表达载体,其包含根据上述任一实施方案的所述核酸。
[0638] 细胞,其包含根据上述任一实施方案的所述核酸。
[0639] 包含多个不同成员的序列肽段多肽文库,其中所述文库的每个成员对应于共同的亲本多肽并且其中所述文库的每个成员包含外源O-联糖基化序列,其中所述O-联糖基化

序列中的每一个是独立地选自SEQ ID NO:1和SEQ ID NO:2的成员:(X)mPO U(B)p(Z)r(J)
1
s(O)t(P)n(SEQ ID NO:1);和(X)m(B)pTUB(Z)r(J)s(P)n(SEQ ID NO:2)其中,m、n、p、r、s和*
t是独立地选自0和1的整数;P是脯氨酸;O 是选自丝氨酸(S)和苏氨酸(T)的成员;U是
选自脯氨酸(P)、谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨
1
酸(S)和不带电荷的氨基酸的成员;X、B和B 是独立地选自谷氨酸(E)、谷氨酰胺(Q)、天
冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和不带电荷的氨基酸的成员;和Z、J和
O是独立地选自谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸
(S)、酪氨酸(Y)、甲硫氨酸(M)和不带电荷的氨基酸的成员。
[0640] 根据上述任一实施方案的文库,其中所述外源O-联糖基化序列是选自下列的成员:(X)mPTP、(X)mPTEI(P)n、(X)mPTQA(P)n、(X)mPTINT(P)n、(X)mPTTVS(P)n、(X)mPTTVL(P)n、(X)mPTQGAM(P)n、(X)mTET(P)n、(X)mPTVL(P)n、(X)mPTLS(P)n、(X)mPTDA(P)n、(X)mPTEN(P)n、(X)mPTQD(P)n、(X)mPTAS(P)n、(X)mPTQGA(P)n、(X)mPTSAV(P)n、(X)mPTTLYV(P)n、(X)mPSSG(P)n和(X)mPSDG(P)n,其中,m和n是独立地选自0和1的整数;P是脯氨酸;和X是独立地选自谷
氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和不带电荷的
氨基酸的成员。
[0641] 根据上述任一实施方案的文库,其中所述外源O-联糖基化序列是选自下列的成员:PTP、PTEI、PTEIP、PTQA、PTQAP、PTINT、PTINTP、PTTVS、PTTVL、PTQGAM、PTQGAMP和TETP。
[0642] 根据上述任一实施方案的文库,其中所述文库的每个成员在所述亲本多肽内的不同氨基酸位置处包含相同的O-联糖基化序列。
[0643] 根据上述任一实施方案的文库,其中所述文库的每个成员在所述亲本多肽内的相同氨基酸位置处包含不同的O-联糖基化序列。
[0644] 根据上述任一实施方案的文库,其中所述亲本多肽具有m个氨基酸,每个氨基酸对应于一个氨基酸位置,所述文库包括:(a)第一种序列肽段多肽,其在第一个氨基酸位置
(AA)n处具有所述O-联糖基化序列,其中n是选自1至m的成员;和(b)至少一种额外的序
列肽段多肽,每个额外的序列肽段多肽在额外的氨基酸位置处具有所述O-联糖基化序列,
所述额外的氨基酸位置是选自(AA)n+x和(AA)n-x的成员,其中x是选自1至(m-n)的成员。
[0645] 根据上述任一实施方案的文库,其包括第二种序列肽段多肽,所述第二种序列肽段多肽在第二个氨基酸位置处具有所述O-联糖基化序列,所述第二个氨基酸位置选自
(AA)n+p和(AA)n-p,其中p选自1至10。
[0646] 根据上述任一实施方案的文库,其中所述额外的氨基酸位置中的每一个与之前所选择的氨基酸位置相邻。
[0647] 根据上述任一实施方案的文库,其中所述O-联糖基化序列是GalNAc-转移酶的底物。
[0648] 根据上述任一实施方案的文库,其中所述GalNAc-转移酶是选自凝集素结构域缺失的GalNAc-T2和凝集素结构域截短的GalNAc-T2的成员。
[0649] 根据上述任一实施方案的文库,其中所述亲本多肽是治疗性多肽。
[0650] 根据上述任一实施方案的文库,其中所述亲本多肽是选自下列的成员:骨形态发生蛋白2(BMP-2)、骨形态发生蛋白7(BMP-7)、骨形态发生蛋白15(BMP-15)、神经营养蛋
白-3(NT-3)、冯维勒布兰德因子(vWF)蛋白酶、促红细胞生成素(EPO)、粒细胞集落刺激因
子(G-CSF)、粒细胞-巨噬细胞集落刺激因子(GM-CSF)、干扰素α、干扰素β、干扰素γ、
α1-抗胰蛋白酶(α-1蛋白酶抑制剂)、葡糖脑苷脂酶、组织型血纤维蛋白溶酶原活化因子
(TPA)、白细胞介素-2(IL-2)、瘦蛋白、蛭素、尿激酶、人DNA酶、胰岛素、乙型肝炎表面蛋白
(HbsAg)、嵌合的白喉毒素-IL-2、人生长激素(hGH)、人绒毛膜促性腺激素(hCG)、甲状腺过
氧化物酶(TPO)、α-半乳糖苷酶、α-L-艾杜糖苷酸酶、β-葡糖苷酶、α-半乳糖苷酶A、
酸性α-葡糖苷酶(酸性麦芽糖酶)、抗凝血酶III(ATIII)、促卵泡激素(FSH)、胰高血糖素
样肽-1(GLP-1)、胰高血糖素样肽-2(GLP-2)、成纤维细胞生长因子7(FGF-7)、成纤维细胞
生长因子21(FGF-21)、成纤维细胞生长因子23(FGF-23)、因子VII、因子VIII、B-结构域缺
失的因子VIII、因子IX、因子X、因子XIII、prokinetisin、extendin-4、CD4、肿瘤坏死因子
受体(TNF-R)、α-CD20、P-选择蛋白糖蛋白配体-1(PSGL-1)、补体、转铁蛋白、依赖于糖基
化的细胞粘着分子(GlyCAM)、神经细胞粘着分子(N-CAM)、TNF受体-IgG Fc区融合蛋白、
抗-HER2单克隆抗体、针对呼吸道合胞病毒的单克隆抗体、针对呼吸道合胞病毒的蛋白F的
单克隆抗体、针对TNF-α的单克隆抗体、针对糖蛋白IIb/IIIa的单克隆抗体、针对CD20的
单克隆抗体、针对VEGF-A的单克隆抗体、针对PSGL-1的单克隆抗体、针对CD4的单克隆抗
体、针对a-CD3的单克隆抗体、针对EGF的单克隆抗体、针对癌胚抗原(CEA)的单克隆抗体
和针对IL-2受体的单克隆抗体。
[0651] 方法,其包括:在宿主细胞中表达序列肽段多肽,所述序列肽段多肽对应于亲本多*
肽并且包含选自SEQ ID NO:1和SEQ IDNO:2的外源O-联糖基化序列:(X)mPO U(B)p(Z)
1
r(J)s(O)t(P)n (SEQ ID NO:1);和(X)m(B)pTUB(Z)r(J)s(P)n (SEQ ID NO:2)其中,

m、n、p、r、s和t是独立地选自0和1的整数;P是脯氨酸;O 是选自丝氨酸(S)和苏氨酸
(T)的成员;U是选自脯氨酸(P)、谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、
1
苏氨酸(T)、丝氨酸(S)和不带电荷的氨基酸的成员;X、B和B 是独立地选自谷氨酸(E)、
谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏氨酸(T)、丝氨酸(S)和不带电荷的氨基酸的
成员;和Z、J和O是独立地选自谷氨酸(E)、谷氨酰胺(Q)、天冬氨酸(D)、天冬酰胺(N)、苏
氨酸(T)、丝氨酸(S)、酪氨酸(Y)、甲硫氨酸(M)和不带电荷的氨基酸的成员,条件是所述亲
本多肽不是选自人生长激素(hGH)、粒细胞集落刺激因子(G-CSF)、干扰素-α(INF-α)、胰
高血糖素样肽-1(GLP-1)和成纤维细胞生长因子(FGF)的成员。根据上述任一实施方案的
方法,其进一步包括分离所述序列肽段多肽。
[0652] 根据上述任一实施方案的方法,其进一步包括在所述O-联糖基化序列处酶促糖基化所述序列肽段多肽。
[0653] 根据上述任一实施方案的方法,其中使用糖基转移酶来实现所述酶促糖基化。
[0654] 根据上述任一实施方案的方法,其中所述糖基转移酶是GalNAc-T2。
[0655] 根据上述任一实施方案的方法,其中所述GalNAc-T2是选自凝集素结构域缺失的GalNAc-T2和凝集素结构域截短的GalNAc-T2的成员。
[0656] 根据上述任一实施方案的方法,其进一步包括产生表达载体,所述表达载体包含编码所述序列肽段多肽的核酸序列。
[0657] 根据上述任一实施方案的方法,其进一步包括用所述表达载体转染所述宿主细胞。
[0658] 根据上述任一实施方案的方法,其中所述亲本多肽是治疗性多肽。
[0659] 根据上述任一实施方案的方法,其中所述亲本多肽是选自下列的成员:骨形态发生蛋白2(BMP-2)、骨形态发生蛋白7(BMP-7)、骨形态发生蛋白15(BMP-15)、神经营养蛋
白-3(NT-3)、冯维勒布兰德因子(vWF)蛋白酶、促红细胞生成素(EPO)、α1-抗胰蛋白酶
(α-1蛋白酶抑制剂)、葡糖脑苷脂酶、组织型血纤维蛋白溶酶原活化因子(TPA)、瘦蛋白、
蛭素、尿激酶、人DNA酶、胰岛素、乙型肝炎表面蛋白(HbsAg)、嵌合的白喉毒素-IL-2、人绒
毛膜促性腺激素(hCG)、甲状腺过氧化物酶(TPO)、α-半乳糖苷酶、α-L-艾杜糖苷酸酶、
β-葡糖苷酶、α-半乳糖苷酶A、酸性α-葡糖苷酶(酸性麦芽糖酶)、抗凝血酶III(AT
III)、促卵泡激素(FSH)、胰高血糖素样肽-2(GLP-2)、因子VII、因子VIII、B-结构域缺失
的因子VIII、因子IX、因子X、因子XIII、prokinetisin、extendin-4、CD4、肿瘤坏死因子
受体(TNF-R)、α-CD20、P-选择蛋白糖蛋白配体-1(PSGL-1)、补体、转铁蛋白、依赖于糖基
化的细胞粘着分子(GlyCAM)、神经细胞粘着分子(N-CAM)、TNF受体-IgG Fc区融合蛋白、
抗-HER2单克隆抗体、针对呼吸道合胞病毒的单克隆抗体、针对呼吸道合胞病毒的蛋白F的
单克隆抗体、针对TNF-α的单克隆抗体、针对糖蛋白IIb/IIIa的单克隆抗体、针对CD20的
单克隆抗体、针对VEGF-A的单克隆抗体、针对PSGL-1的单克隆抗体、针对CD4的单克隆抗
体、针对a-CD3的单克隆抗体、针对EGF的单克隆抗体、针对癌胚抗原(CEA)的单克隆抗体
和针对IL-2受体的单克隆抗体。
[0660] 制备根据上述任一实施方案的多肽缀合物的方法,其包括下列步骤:(i)重组产生所述序列肽段多肽;和(ii)在所述O-联糖基化序列处酶促糖基化所述序列肽段多肽。
[0661] 根据上述任一实施方案的方法,其中使用GalNAc转移酶来实现步骤(ii)的所述酶促糖基化。
[0662] 根据上述任一实施方案的方法,其中所述GalNAc转移酶是人GalNAc-T2。
[0663] 根据上述任一实施方案的方法,其中所述GalNAc-T2是选自凝集素结构域缺失的GalNAc-T2和凝集素结构域截短的GalNAc-T2的成员。
[0664] 制备根据上述任一实施方案的序列肽段多肽的文库的方法,所述方法包括:(i)通过在第一个氨基酸位置(AA)n处引入所述O-联糖基化序列而重组产生第一种序列肽段
多肽;和(ii)通过在选自(AA)n+x和(AA)n-x的额外的氨基酸位置处引入所述O-联糖基化序
列而重组产生至少一种额外的序列肽段多肽,其中x是选自1至(m-n)的成员。鉴定先导
多肽的方法,所述方法包括:(i)产生根据上述任一实施方案的序列肽段多肽文库;和(ii)
使所述文库的至少一个成员进行酶促糖基化反应,从而将糖基部分从糖基供体分子转移到
至少一个所述O-联糖基化序列上,其中任选地用修饰基团来对所述糖基部分进行衍生化,
由此鉴定出所述先导多肽。根据上述任一实施方案的方法,其进一步包括,对于所述文库的
至少一个成员,测量所述酶促糖基化反应的产率。
[0665] 根据上述任一实施方案的方法,其中通过选自质谱法、凝胶电泳、核磁共振(NMR)和HPLC的成员来实现所述测量。
[0666] 根据上述任一实施方案的方法,其中所述先导多肽的所述产率为约50%至约100%。
[0667] 根据上述任一实施方案的方法,其进一步包括,在步骤(ii)之前,纯化所述文库的至少一个成员。
[0668] 根据上述任一实施方案的方法,其中步骤(ii)的所述糖基部分包含选自半乳糖部分和GalNAc部分的成员。
[0669] 根据上述任一实施方案的方法,其中步骤(ii)的所述酶促糖基化反应在宿主细胞内发生,在所述宿主细胞中表达所述文库的所述至少一个成员。
[0670] 根据上述任一实施方案的方法,其进一步包括:(iii)使步骤(ii)的产物进行PEG化反应,其中所述PEG化反应是选自化学PEG化反应和酶促糖PEG化反应的成员。根据上
述任一实施方案的方法,其中在单个反应容器中进行步骤(ii)和步骤(iii)。
[0671] 根据上述任一实施方案的方法,其进一步包括测量所述PEG化反应的产率。
[0672] 根据上述任一实施方案的方法,其中通过选自质谱法、凝胶电泳、核磁共振(NMR)和HPLC的成员来实现所述测量。
[0673] 根据上述任一实施方案的方法,其中所述先导多肽的所述PEG化反应的所述产率为约50%至约100%。
[0674] 根据上述任一实施方案的方法,其中在所述PEG化反应后的所述先导多肽具有与所述亲本多肽的治疗活性基本上相同的治疗活性。
[0675] 根据上述任一实施方案的方法,其中在所述PEG化反应后的所述先导多肽具有与所述亲本多肽的治疗活性不同的治疗活性。
[0676] 根据上述任一实施方案的方法,其进一步包括产生包含编码所述序列肽段多肽的核酸序列的表达载体。
[0677] 根据上述任一实施方案的方法,其进一步包括用所述表达载体转染所述宿主细胞。
[0678] 并不意在限制本发明的范围,在上面给出的每个实施方案(例如,涉及制备序列肽段多肽的方法、制备文库的方法和鉴定序列肽段多肽的方法的那些实施方案)中,下面
的示例性的实施方案一般是优选的:在其中亲本多肽是胰高血糖素样肽-1(GLP-1)的一个
示例性实施方案中,O-联糖基化序列优选地不选自PTQ、PTT、PTQA、PTQG、PTQGA、PTQGAMP、
PTQGAM、PTINT、PTQAY、PTTLY、PTGSLP、PTTSEP、PTAVIP、PTSGEP、PTTLYP、PTVLP、TETP、PSDGP和PTEVP。在其中亲本多肽是野生型GLP-1的另一个示例性实施方案中,O-联糖基化序列
优选地不选自PTQ、PTT、PTQA、PTQG、PTQGA、PTQGAMP、PTQGAM、PTINT、PTQAY、PTTLY、PTGSLP、PTTSEP、PTAVIP、PTSGEP、PTTLYP、PTVLP、TETP、PSDGP和PTEVP。在其中亲本多肽是野生型
GLP-1的另一个示例性实施方案中,O-联糖基化序列优选地不选自PTQ、PTT、PTQA、PTQG、
PTQGA、PTQGAMP、PTQGAM、PTINT、PTQAY、PTTLY、PTGSLP、PTTSEP、PTAVIP、PTSGEP、PTTLYP、PTVLP、TETP、PSDGP和PTEVP,除非O-联糖基化序列不被设计成位于存在于野生型G-CSF多
肽中的脯氨酸残基周围。
[0679] 在其中亲本多肽是G-CSF的另一个示例性实施方案中,O-联糖基化序列优选地不选自PTQGA、PTQGAM、PTQGAMP、APTP和PTP。在其中亲本多肽是野生型G-CSF的另一个示
例性实施方案中,O-联糖基化序列优选地不选自PTQGA、PTQGAM、PTQGAMP、APTP和PTP。在
其中亲本多肽是野生型G-CSF的另一个示例性实施方案中,O-联糖基化序列优选地不选自
PTQGA、PTQGAM、PTQGAMP、APTP和PTP,除非O-联糖基化序列不被设计成位于存在于野生型
G-CSF多肽中的脯氨酸残基周围。
[0680] 在其中亲本多肽是人生长激素(hGH)的另一个示例性实施方案中,O-联糖基化序列优选地不选自PTQGA、PTQGAM、PTQGAMP、PTVLP、PTTVS、PTTLYV、PTINT、PTEIP、PTQA和
TETP。在其中亲本多肽是野生型hGH的另一个示例性实施方案中,O-联糖基化序列优选
地不选自PTQGAM、PTQGAMP、PTTVS、PTTLYV、PTINT、PTQA和TETP。在其中亲本多肽是野生
型hGH的另外一个示例性实施方案中,O-联糖基化序列优选地不选自PTQGAM、PTQGAMP、
PTTVS、PTTLYV、PTINT、PTQA和TETP,除非O-联糖基化序列不被设计成位于存在于野生型
hGH多肽中的脯氨酸残基周围。
[0681] 在其中亲本多肽是INF-α的另一个示例性实施方案中,O-联糖基化序列优选地不是TETP。在其中亲本多肽是野生型INF-α的另一个示例性实施方案中,O-联糖基化序列
优选地不是TETP。在其中亲本多肽是野生型INF-α的另外一个示例性实施方案中,O-联
糖基化序列优选地不是TETP,除非O-联糖基化序列不被设计成位于存在于野生型INF-α
多肽中的脯氨酸残基周围。
[0682] 在其中亲本多肽是FGF(例如,FGF-1、FGF-2、FGF-18、FGF-20、FGF-21)的另一个示例性实施方案中,O-联糖基化序列优选地不选自PTP、PTQGA、PTQGAM、PTQGAMP、PTEIP、
PTTVS、PTINT、PTINTP、PTQA、PTQAP、PTSAV和PTSAVAA。在其中亲本多肽是野生型FGF的另一
个示例性实施方案中,O-联糖基化序列优选地不选自PTP、PTQGA、PTQGAM、PTQGAMP、PTEIP、
PTTVS、PTINT、PTINTP、PTQA、PTQAP、PTSAV和PTSAVAA。在其中亲本多肽是野生型FGF的
另外一个示例性实施方案中,O-联糖基化序列优选地不选自PTP、PTQGA、PTQGAM、PTQGAMP、
PTEIP、PTTVS、PTINT、PTINTP、PTQA、PTQAP、PTSAV和PTSAVAA,除非O-联糖基化序列不被设
计成位于存在于野生型FGF多肽中的脯氨酸残基周围。实施例
[0683] 提供下面的实施例仅用于阐明并且不意在限制本发明的范围。本领域技术人员将容易认识到可以改变或修饰以产生基本上相似结果的多种非关键参数。尽管参考人BMP-7
和人NT-3示例该方法,但是技术人员将认识到以下面的方式可以将糖基化位点掺入其他
蛋白的肽序列中,所述蛋白质包括其他骨形态发生蛋白和神经营养蛋白,如BMP-2。实施例
1:将糖基化位点掺入骨形态发生蛋白-7(BMP-7)中1.1.BMP-7序列信息
[0684] 示例性的BMP-7序列显示在下面(S.1)。人骨形态发生蛋白-7(SEQ ID NO:**)M1STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNS
YMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH
[0685] 在任何BMP-7突变体中可以存在或不存在N-末端甲硫氨酸。在该实例中,氨基酸残基的编号基于最初的未修饰的序列,其中最左边的残基,甲硫氨酸(M),被编为位置1。为
了突出显示突变型序列与未修饰的序列如何不同,当它们在下面的突变型序列中出现时,
未修饰的氨基酸的编号在修饰后保持不变。超过一个的所描述的序列修饰可以存在于本发
明的BMP-7突变体中。
[0686] 用于引入突变以产生不存在于野生型多肽中的糖基化位点的优选区域是编码氨基酸1-6、10-21、27-36、55-65、73-80、75-85和117-125的核苷酸序列。使用本发明的任何
突变型O-联糖基化序列(例如,PTP或PTINT)来进行的序列肽段扫描可以用于在BMP-7亲
本多肽中插入新的糖基化位点。
[0687] 该实施例描述了氨基酸序列突变,其在野生型骨形态发生蛋白-7序列中引入O-联糖基化序列,例如丝氨酸或苏氨酸残基。通过在该肽序列的7个不同区域(包括氨基
末端)中引入O-联糖基化序列来产生许多突变型BMP-7多肽。分别使用O-联糖基化序列
PTP和PTINT,经过在氨基酸72-86之间和在氨基酸96-103之间的两个环区域进行序列肽
1
段扫描。制备所有BMP-7突变体的内含体。1.2.MSTGSK的突变
[0688] 在BMP-7的这些氨基末端突变体中,野生型序列M1STGSK(SEQ ID NO:**)用氨基1 ** 1
酸插入和氨基酸置换来替代。优选的突变包括:MFPSTGSK (SEQ ID NO: ),C.1MFPTTGSK
** 1 ** 1 **
(SEQ ID NO: ),C.2MFPSTGSA (SEQ ID NO: ),C.3MFPTINTK (SEQ ID NO: ),
1 **
C.4MFPTINTA (SEQ ID NO: ),C.5
[0689] 在该实例中,将苯丙氨酸(F)包括在O-联糖基化序列中,以便提高所述N-末端突9 16
变体的大肠杆菌表达产率。1.3.QNRSKTP KNQEA的突变
[0690] 在这些BMP-7突变体中,野生型Q9NRSKTP16KNQEA(SEQ ID NO:**)用在脯氨酸9 16
16附近产生糖基化位点的氨基酸残基或插入来替代。优选的实例包括:QNGTETP KNQEA
** 9 16 ** 9 16
(SEQ ID NO: ),C.6QNRSKTP TNQEA (SEQ ID NO: ),C.7QNRSKTP TINTA (SEQ ID
** 9 16 ** 9 16 **
NO: ),C.8QNRSATP TINTA (SEQ ID NO: ),C.9QNRSATP TTVSA (SEQ ID NO: ),
30
C.101.4.VAEN SSDQR的突变
[0691] 在这些突变体中,野生型VAEN30SSDQR序列(SEQ IDNO:**)用产生糖基化30 **
位点的氨基酸残基来替代。优选的实例包括:VAEP SSSDQR (SEQ ID NO: ),
30 ** 30 **
C.11VAEP TSADQR (SEQ ID NO: ),C.12VATP TSADQR (SEQ ID NO: ),
60
C.131.5.DWIIAP EGYAA的突变
[0692] 在这些BMP-7突变体中,野生型DWIIAP60EGYAA(SEQID NO:**)序列用产生糖60 **
基化位点的氨基酸残基来替代。优选的实例包括:DWIIAP TGYAA (SEQ ID NO: ),
60 ** 60 **
C.14DWIIAP TINTA (SEQ ID NO: ),C.15DWIIAP TTVSA (SEQ ID NO: ),
75
C.161.6.AFP LNSYM的突变
[0693] 在这些突变体中,野生型AFP75LNSYM(SEQ ID NO:**)序列用产生糖基化位点的氨75 ** 75
基酸残基来替代。优选的实例包括:AFP TNSYM (SEQ ID NO: ),C.17AFP TINTM
** 75 ** 75
(SEQ ID NO: ),C.18AFP TTVSM (SEQ ID NO: ),C.19ASP TINTM (SEQ
** 75
ID NO: ),C.201.7.P LNSYMNATNH的突变
[0694] 在这些BMP-7突变体中,野生型P75LNSYMNATNH(SEQ ID NO:**)序列用产75
生糖基化位点的氨基酸残基来替代。优选的实例包括:P TQAPMNATNH (SEQ ID NO:
* * 75 * * 75 *
),C.21P TINTPNATNH (SEQ ID NO: ),C.22P TTVSPNATNH (SEQ ID NO:
* 75 * * 75 *
),C.23P TEIPMNATNH (SEQ ID NO: ),C.24P LNSYPTATNH (SEQ ID NO:
* 75 ** 75 **
),C.25P LNSSPTINTH (SEQ ID NO: ),C.26P LNSPTINTNH (SEQ ID NO: ),
75 ** 120
C.27P LNSPTTVSNH (SEQ ID NO: ),C.281.8.YFDD SSNVI的突变
[0695] 在这些BMP-7突变体中,野生型YFDD120SSNVI(SEQ IDNO:**)序列用产生糖120 **
基化位点的氨基酸残基来替代。优选的实例包括:YFDP SSNVI (SEQ ID NO: ),
120 ** 120 **
C.29YFDP TTVSI (SEQ ID NO: ),C.30YFSP TTVSI (SEQ ID NO: ),C.311.9.在
BMP-7内的序列肽段扫描
[0696] 在这些突变体中,使用本发明的O-糖基化序列来突变BMP-7序列的两个不同的区域。下面分开地考虑每个区域中的突变。示例性的突变包括:使用PTP和PTINT在
72
C AFPLNSYMNATHA内的序列肽段扫描:
[0697] 在这些BMP-7突变体中,将野生型序列C72AFPLNSYMNATHA(SEQ ID NO:**)的氨基酸用PTP或PTINT来替代,并跨越整个区域扫描突变,从而在每个突变体内产生糖基化
72 *
序列。实例包括:使用PTP的示例性序列肽段扫描:C APTPNSYMNATHA (SEQ ID NO:
* 72 ** 72 *
),C.32C AFPTPSYMNATHA (SEQ ID NO: ),C.33C AFPPTPYMNATHA (SEQ ID NO:
* 72 ** 72 *
),C.34C AFPLPTPMNATHA (SEQ ID NO: ),C.35C AFPLNPTPNATHA (SEQ ID NO:
* 72 ** 72 *
),C.36C AFPLNSPTPATHA (SEQ ID NO: ),C.37C AFPLNSYPTPTHA (SEQ ID NO:
* 72 ** 72 *
),C.38C AFPLNSYMPTPHA (SEQ ID NO: ),C.39C AFPLNSYMNPTPA (SEQ ID NO:
* 72 **
),C.40C AFPLNSYMNAPTP (SEQ ID NO: ),C.41使用PTINT的示例性序列肽段扫
72 ** 72 **
描:C APTINTYMNATHA (SEQ ID NO: ),C.42C AFPTINTMNATHA (SEQ ID NO: ),
72 ** 72 **
C.43C AFPPTINTNATHA (SEQ ID NO: ),C.44C AFPLPTINTATHA (SEQ ID NO: ),
72 ** 72 **
C.45C AFPLNPTINTTHA (SEQ ID NO: ),C.46C AFPLNSPTINTHA (SEQ ID NO: ),
72 ** 72 **
C.47C AFPLNSYPTINTA (SEQ ID NO: ),C.48C AFPLNSYMPTINT (SEQ ID NO: ),C.49
96
使用PTP和PTINT在N PETVPKPCC内的序列肽段扫描:
[0698] 在这些突变体中,野生型序列N96PETVPKPCC(SEQ IDNO:**)用PTP或PTINT来替代,并跨越整个区域扫描突变,从而在每个突变体内产生糖基化序列。优选的实例包括:使
96 ** 96
用PTP的示例性序列肽段扫描:P TPTVPKPCC (SEQ ID NO: ),C.50N PTPVPKPCC (SEQ
** 96 ** 96 **
ID NO: ),C.51N PPTPPKPCC (SEQ ID NO: ),C.52N PEPTPKPCC (SEQ ID NO: ),
96 ** 96 **
C.53N PETPTPPCC (SEQ ID NO: ),C.54N PETVPTPCC (SEQ ID NO: ),C.55使用
96 ** 96
PTINT的示例性序列肽段扫描:P TINTPKPCC (SEQ ID NO: ),C.56N PTINTKPCC (SEQ
** 96 ** 96 **
ID NO: ),C.57N PPTINTPCC (SEQ ID NO: ),C.58N PEPTINTCC (SEQ ID NO: ),
C.591.10.BMP-7突变体的纯化
[0699] 根据下面的步骤来处理所有BMP-7突变体C.1到C.59:(a)发酵,(b)细胞裂解,(c)内含体(IB)分离(例如,通过离心),(d)IB溶解,(e)IB纯化(例如,S-sepharose),
和(f)IB重折叠。实施例2:将糖基化序列掺入神经营养蛋白-3(NT-3)中2.1.NT-3序列
信息
[0700] 人NT-3的示例性野生型氨基酸序列(S.2)显示在下面。人神经营养蛋白-3(SEQ**
ID NO: ):MYAEHKSHRGEYSVCDSESLWVTDKSSAIDIRGHQVTVLGEIKTGNSPVKQYFYETRCKEARPVKN
GCRGIDDKHWNSQCKTSQTYVRALTSENNKLVGWRWIRIDTSCVCALSRKIGRT
[0701] 该实施例描述了向野生型NT-3序列S.2(SEQ ID NO:**)或其任何修饰形式(例如,以前经突变的)中引入O-联糖基化序列的氨基酸序列突变。产生了许多突变体,它们
在3个环区域以及氨基末端中引入了O-联糖基化位点。
[0702] 在任何NT-3突变体中可以存在或不存在N-末端甲硫氨酸(M)。在该实例中,氨基酸残基的编号基于最初的未修饰的序列,其中N-末端残基,甲硫氨酸(M),被编为位置1。为
了突出显示突变型序列与未修饰的序列如何不同,当它们在下面的突变型序列中出现时,
未修饰的氨基酸的编号在修饰后保持不变。超过一个的所描述的序列修饰可以存在于本发
明的NT-3突变体中。
[0703] 用于引入突变以在NT-3多肽内产生本发明的糖基化序列的优选区域是编码野生型NT-3氨基酸序列(S.2)的氨基酸1-9、22-30、45-54和91-99的核苷酸序列。
1
2.2.MYAEHKSHR的突变
[0704] 在这些氨基末端突变体中,野生型序列M1YAEHKSHR(SEQ ID NO:**)用氨基酸插入1 ** 1
和氨基酸置换来替代。示例性的突变包括:MFPTEIPLSR (SEQ ID NO: ),A.1MFPTEIPSHR
** 25
(SEQ ID NO: ),A.22.3.VTDK SSAID的突变
[0705] 在这些突变体中,野生型VTDK25SSAID序列(SEQ IDNO:**)用产生糖基化序列25 ** 25
的氨基酸残基来替代。优选的实例包括:VTDP TINTD (SEQ ID NO: ),A.3VTDP TTVSD
** 24 ** 48
(SEQ ID NO: ),A.4VTP TTVSID (SEQ ID NO: ),A.52.4.GNSP VKQYFY的突变
[0706] 在这些突变体中,野生型序列GNSP48VKQYFY(SEQ IDNO:**)用产生糖基化序列的48 ** 48
氨基酸残基来替代。优选的实例包括:GNSP TTVSFY (SEQ ID NO: ),A.6GNSP TINTFY
** 48 ** 93
(SEQ ID NO: ),A.7GNAP TINTFY (SEQ ID NO: ),A.82.5.TSE NNKLVG的突变
[0707] 在这些突变体中,野生型序列TSE93NNKLVG(SEQ IDNO:**)用产生糖基化序列的氨93 ** 93
基酸残基来替代。优选的实例包括:TSP TINTVG (SEQ ID NO: ),A.9TAP TINTVG (SEQ
** 93 ** 93 **
ID NO: ),A.10TSP TTVSVG (SEQ ID NO: ),A.11TAP TTVSVG (SEQ ID NO: ),
93 ** 93 ** 93
A.12TSP TQGAVG (SEQ ID NO: ),A.13TAP TQGAVG (SEQ ID NO: ),A.14TSE PTINTG
** 93 **
(SEQ ID NO: ),A.15TSE PTTVSG (SEQ ID NO: ),A.162.6.人NT-3突变体的表达和
纯化表达
[0708] 就它们于37℃在W3110大肠杆菌中的表达能力来测试各种NT-3突变体。结果:**
所有经测试的突变体A.1至A.16(SEQ ID NOs )都得到表达。在细胞裂解后,通过离心
来分离内含体。hNT-3内含体的溶解和亚硫酸盐化
[0709] 将经洗涤的IB粒状沉淀以100mg/ml溶解在缓冲液中,该缓冲液含有100mMTris-HCl,pH8.5,100mM NaCl,5mM EDTA,100mM亚硫酸钠,10mM连四硫酸钠,和7.5M尿素。
通过在室温下搅拌~20分钟来进行溶解。将悬浮液在4℃下再次搅拌2小时。添加PEI(聚
乙烯亚胺)至0.15%的终浓度并在4℃下搅拌~1小时,接着再次温育1小时。使用Sorvall
RC-3B离心机,将混合物在5000rpm/4℃下离心30分钟。将上清液通过0.45μm注射器滤
器过滤,用SP-Sepharose FastFlow(SPFF)平衡缓冲液(50mM乙酸钠,5M尿素,pH5)稀释至
少10倍,然后加载到SPFF柱上。将该柱用所述平衡缓冲液进行洗涤。用50mM MOPS,5M尿
素,10mM甘氨酸,pH 7.0来洗脱蛋白质。hNT-3突变体的重折叠和纯化
[0710] 重折叠缓冲液由0.1M Tris,2M尿素,0.1M NaCl,15%PEG300,10mM甘氨酸,25mM乙醇胺,pH 9.1组成。汇集来自SPFF的主峰级分,并以0.1mg/ml的浓度稀释在重折叠缓
冲液中。通过添加L-半胱氨酸至约5mM来起始重折叠,并于4℃在温和搅拌下温育5天。
[0711] 将经重折叠的汇集物的pH调节至pH 7,通过0.45μm滤器过滤,并加载到用50mM磷酸钠,pH 7.0平衡的Macroprep High S阳离子交换色谱柱上。用具有浓度渐增的
NaCl(0-1.5M)和氯化四甲基铵(TMAC,0-0.25M)的线性梯度的相同缓冲液来洗脱蛋白质。
收集主峰中的蛋白质,并用于糖基化和糖PEG化研究。2.7.hNT-3突变体的糖PEG化筛选
hNT-3突变体以用于糖基化和糖PEG化
[0712] 所有hNT-3突变型蛋白质用High S色谱法来纯化,然后交换到含有50mM TrisHCl(pH 7.5),20mM NaCl,0.001%聚山梨醇酯80和0.02%NaN3的反应缓冲液中。在由~
1mg/ml hNT-3,50mUGalNAc-T2/mg hNT-3,0.7mM UDP-GalNAc,和0.7mM MnCl2组成的50μl
反应体系中,于32℃过夜施行GalNAc向蛋白质的添加。通过MALDI来监测GalNAc的掺入。
**
通过添加GalNAc而有效地糖基化了A.1-A.16(SEQ ID NOs )中的各种突变体。对于这
些突变体,发现糖基化率大于50%。
[0713] 当完成时,将反应混合物分成两个相等的等分试样。一个等分试样用于由ST6GalNAcI催化的直接PEG化。添加具有各种PEG大小(20K、30K和支化的40K(NOF))的
SA-CMP-PEG储液至相对于hNT-3而言约3∶1的最终摩尔比。添加ST6GalNAcI至终浓度
为至少20mU/mg hNT-3。在32℃下进行反应,并通过SDS-PAGE来分析测定PEG化。
[0714] 将第二个等分试样与由UDP-Gal储液(42mM)、Core-1-GalT1(1.4U/ml)和上述反应缓冲液组成的酶混合物相混合。在32℃下过夜施行半乳糖基化,并通过MALDI来监测半
乳糖基的掺入。当半乳糖基化完成时,添加具有各种PEG大小(20K、30K和支化的40K(NOF))
的SA-CMP-PEG储液至相对于hNT-3而言约3∶1的最终摩尔比。添加ST3GalI至终浓度
为至少20mU/mg hNT-3。在32℃下进行反应,并通过SDS-PAGE来分析测定PEG化。2.8.经
修饰的hNT-3突变体的制备型糖PEG化和纯化
[0715] 以3个步骤来完成所选的hNT-3突变体的制备型糖PEG化:(a)由GalNAc-T2催化的GalNAc的添加;(b)由Core-1-GalT1催化的半乳糖基的掺入;(c)由ST3GalI催化的
SA-PEG-20kDa的添加。
[0716] 向含有约236μg蛋白质的hNT-3蛋白质溶液中添加UDP-GalNAc(50mM)、MnCl2(100mM)和GalNAc-T2(2.1U/ml)。在32℃下进行反应~20小时,并在补充了
UDP-GalNAc(50mM)和GalNAc-T2(2.1U/ml)之后继续反应3个多小时以促使反应完成。
然后,向反应混合物中添加UDP-Gal(42mM)和Core-1-GalT1(1.4U/ml)。在32℃下过夜
进行反应。MALDI分析证明了约100%半乳糖基化。然后,添加ST3GalI(0.65U/ml)和
SA-CMP-PEG-20K(0.1mg/μl)。让温育继续过夜进行。
[0717] 将反应混合物用水稀释至~10ml,并加载到用50mM磷酸钠,pH 7.0预平衡的Source 15S柱(~2ml CV)上。用50mM磷酸钠,pH 7.0,1.5M NaCl,0.25M TMAC的线性梯
度,在80分钟内以0.5ml/分钟来洗脱蛋白质。汇集含有经PEG化的hNT-3的级分,浓缩,
并通过使用SUPERDEX200柱的大小排阻色谱法来进一步纯化。2.9.结果的概括
[0718] 所选的人NT-3突变体的表达、体外糖基化和体外糖PEG化的结果概括在下面的表16中。表16:重折叠的人NT-3突变体的体外糖基化和糖PEG化
突变体 序列 糖基化 糖PEG化
编号
GalNAc-Gal-SA-PEG
A.1 M1FPTEIPLSR GalNAc SEQ ID NO:**
(20K,30K,支化的40K*)
GalNAc-Gal-SA-PEG
A.2 M1FPTEIPSHR GalNAc SEQ ID NO:**
(20K,30K,支化的40K*)
GalNAc-Gal-SA-PEG
A.3 VTDP25TINTD GalNAc SEQ ID NO:**
(20K)
GalNAc-Gal-SA-PEG
A.4 VTDP25TTVSD GalNAc SEQ ID NO:**
(20K)
GalNAc-Gal-SA-PEG
A.5 VTP24TTVSID GalNAc SEQ ID NO:**
(20K)
GalNAc-Gal-SA-PEG
A.6 GNSP48TTVSFY GalNAc SEQ ID NO:**
(20K)
GalNAc-Gal-SA-PEG
A.7 GNSP48TINTFY GalNAc SEQ ID NO:**
(20K)
GalNAc-Gal-SA-PEG
A.8 GNAP48TINTFY GalNAc SEQ ID NO:**
(20K)
GalNAc-Gal-SA-PEG
A.9 TSP93TINTVG GalNAc SEQ ID NO:**
(20K)
GalNAc-Gal-SA-PEG
A.10 TAP93TINTVG GalNAc SEQ ID NO:**
(20K)
GalNAc-Gal-SA-PEG
A.11 TSP93TTVSVG GalNAc SEQ ID NO:**
(20K)

40K-NOF-PEG实施例3:使用各种载体和大肠杆菌宿主细胞来表达人BMP-7和人NT-3
[0719] 使用各种载体在不同的大肠杆菌宿主细胞中可以表达BMP-7天然序列S.1(SEQ** **
ID NO: )和上述的BMP-7突变体C.1至C.31(SEQ ID NOs )(实施例1)以及NT-3
** **
天然序列S.2(SEQ ID NO: )和上述的NT-3突变体A.1-A.16(SEQ ID NOs )(实
施例2)。天然序列的实验结果概括在下面的表17中。此外,所有BMP-7突变体C.1
**
至C.31(SEQ ID NOs: )于37℃在W3110大肠杆菌中表达为内含体。表17:天然人
** **
BMP-7(S.1)(SEQ ID NO: )和天然NT-3(S.2)(SEQ ID NO: )在大肠杆菌中的表达
[0720] 可以将BMP-7和NT-3或者经突变的BMP-7和NT-3糖基化或糖缀合(参见WO03/31464,其通过提及而合并入本文)。优选地,将经突变的BMP-7或NT-3糖PEG化,其中聚
乙二醇(PEG)部分通过糖基连接而缀合至经突变的BMP-7或NT-3多肽(参见WO03/31464,
其通过提及而合并入本文)。预期所述蛋白质的糖PEG化导致改良的生物物理学性质,其可
以包括但不限于改良的半寿期、改良的曲线下面积(AUC)值、减少的清除以及降低的免疫
原性。实施例4:将O-联糖基化序列引入FGF-21中4.1.序列信息
[0721] FGF-21的示例性氨基酸序列(S.3)显示在下面。成纤维细胞生长因子21(FGF-21)** 3 5 9 50
(SEQ ID NO: )MHPIPDSSPLLQFGGQVRQRYLYTDDAQQTEAHLEIREDGTVGGAADQSP ESLLQLKALK
61 79 91 116 120 125
P GVIQILGVKTSRFLCQRP DGALYGSLHFDP EACSFRELLLEDGYNVYQSEAHGLP LHLP GNKSP HRD
129 134 139 141 144 145 148 150 151 156 158 159 166 172
P AP131RGP ARFLP LP GLP P ALP EP P GILAP QP P DVGSSDP LSMVGP SQGRSP
178
SYAS
[0722] 制备并检查了总共48种O-糖基化突变体。通过在现有的脯氨酸残基周围建立突变来将突变型O-联糖基化序列引入亲本多肽中。在9个不同脯氨酸残基处的突变可以被
糖基化(GalNAc-Gal)和糖PEG化(用支化的40K-cys-PEG)。4.2.诱变和克隆
[0723] 基于公开的序列(NCBI Accession#NM 019113)来合成编码全长成熟形式的人FGF21蛋白的cDNA。使用两组寡核苷酸来PCR扩增该基因,所述寡核苷酸将会掺入所希望的
突变和用于构建表达载体的限制酶切位点。用侧翼的5’NdeI和3’XhoI将合成的基因亚
克隆入表达载体骨架中。所使用的载体为具有经修饰的前导序列的pCWin2或pCWM3。使用
标准技术来进行PCR、克隆和细菌转化(例如,Current Protocols in Molecular Biology,
Ausubel,FM等人,JohnWiley & Sons,Inc.1998)。4.3.FGF-21的表达
[0724] 在第一步中,在trxB gor supp突变型大肠杆菌细胞中表达野生型FGF-21,并测试生物活性。在使用人原代脂肪细胞的葡萄糖摄取测定法中发现所述经纯化的多肽是生物学
上有活性的。然后,使用相同的程序来表达所有突变型多肽。将经转化的trxB gor supp突
变型大肠杆菌细胞的过夜小规模培养物用于接种50-150mL含有50μg/ml卡那霉素的预热
的无动物的LB。在摇动下于37℃温育该培养物,并在OD600处进行监测。当OD600达到0.6
时,将培养物转移到18℃摇动培养箱中30分钟。然后,于18℃用IPTG诱导经转化的细胞。
添加IPTG至0.1mM终浓度,并且于18℃继续摇动温育16-20小时。通过在4℃、7000xg下
离心15分钟来收获细胞。发现表达水平为15至20%裂解物蛋白质,如通过经扫描的电泳
凝胶的光密度分析法所测定的。4.4.FGF-21的纯化
[0725] 通过穿过微射流装置(microfluidizer)两次,在40ml50mM BisTris pH7.0中裂解从代表性的200ml的表达FGF-21的trxBgor supp突变型菌株获得的冷冻的细胞粒状沉
淀。使用Sorvall SS34转子,通过在13,000rpm下离心15分钟来使不溶性物质形成粒状
沉淀。使用两次色谱法步骤来纯化所有FGF-21突变体。使最终的可溶性物质以1ml/分钟
穿过0.22微米滤器,并吸附到1ml QFF柱上。将该柱连接至AKTA,并用20CV梯度洗脱至在
50mM BisTris pH 7.0中的500mMNaCl。通过SDS-PAGE来分开跨越该梯度的早期部分的级
分,并用考马斯染色以确定汇集哪些级分。然后,使用TBS缓冲液在以0.5mls/分钟运行的
SEC柱(Superdex 7516/60)上进一步分开汇集的级分。4.5.FGF-21的糖基化
[0726] 就它们用作酶GalNAc-T2的底物的能力来测试经纯化的FGF-21突变型多肽。MALDI用于监测反应。示例性的反应条件如下:将在20mM BisTris pH 6.7,50mM NaCl,10mM
MnCl2中的10mcg每种突变型FGF-21蛋白与40mU hGalNAc-T2/mg蛋白和10摩尔当量的
UDP-GalNAc于30℃温育6小时。结果概括在下面的表18中。
[0727] 添加3倍反应混合物体积的丙酮,并在微量离心机(microfuge)中以最大速率旋转以沉淀该蛋白质。除去丙酮,并让所述粒状沉淀风干,然后将其用水重悬浮。取0.5ul与
0.5ul的10mg/ml芥子酸混合。然后,通过MALDI来分析所述混合物。
[0728] 使用GalNAc-T2,可以用GalNAc完全糖基化突变体B.1-B.4、B.18、B.20、B.22、B.28、B.29、B.31-B.36、B.41和B.42。突变体B.19、B.23、B.37-B.40和B.43-B.44被部分
糖基化。几种突变体,例如B.18、B.20、B.29和B.31-B.36被糖基化,但是将额外的GalNAc
残基添加至一定百分比的这些突变体。通过使用MALDI谱获得产物峰(AUC)与反应物峰的
比例来估计糖基化的程度。4.6.FGF-21的糖PEG化
[0729] 一般地,当用GalNAc来糖基化多肽时,Gal和SA-PEG的随后添加是有效的。具体地,就Gal和40kDa PEG向糖基化的(GalNAc)多肽的添加而评估了FGF-21突变体B.1-B.4、
B.22、B.28、B.41和B.42。示例性的反应条件概括在下面:反应1:GalNAc的添加
[0730] 将10mcg的FGF-21多肽(1mg/ml)在含有10摩尔当量(0.4mM)的UDP-GalNAc和MBP-hGalNAcT2(40mU/mg)的20mMBisTris pH 6.7,50mM NaCl,10mM MnCl2中于30℃温育6
小时。反应2:GalNAc、Gal和40kDa-PEG的添加
[0731] 将10mcg的FGF-21多肽(1mg/ml)在含有10摩尔当量(0.4mM)的UDP-GalNAc、10摩尔当量的UDP-Gal(0.4mM)、2摩尔当量的CMP-SA-40kPEG(0.08mM)(40KDa-cys-PEG)、
MBP-hGalNAcT2(40mU/mg)、MBP-dCore-1-GalT1(40mU/mg) 和 ST3Gal1(50mU/mg) 的 20mM
BisTris pH 6.7,50mM NaCl,10mMMnCl2中于30℃温育16小时。使用SDS-PAGE来分析所
述反应(参见图3)。4.7.结果的概括
[0732] FGF-21突变体在trxB gor supp突变型大肠杆菌细胞中的表达、糖基化和糖PEG化反应的结果概括在下面的表18中。将在使用人原代脂肪细胞的基于细胞的葡萄糖摄取
测定法中评估所选的突变体。表18:FGF-21突变体的评估
突变体 序列肽段序列 GalNAc 糖PEG化*
编号 的添加
B.1 P5TSSP 100% GalNAc-Gal-SA-PEG(40K) SEQ ID NO:**
B.2 P5TQAP 100% GalNAc-Gal-SA-PEG(40K) SEQ ID NO:**
B.3 P3TPDSS 100% GalNAc-Gal-SA-PEG(40K) SEQ ID NO:**
B.4 M1FPTP 100% GalNAc-Gal-SA-PEG(40K) SEQ ID NO:**
B.5 P50TSLL 0% NT SEQ ID NO:**
B.6 P50TINT NT NT SEQ ID NO:**
B.7 P50TVGS NT NT SEQ ID NO:**
B.8 P50TQAG NT NT SEQ ID NO:**
B.9 AP61TV NT NT SEQ ID NO:**
B.10 AP61TSVG NT NT SEQ ID NO:**
B.11 AP61TINT NT NT SEQ ID NO:**
B.12 SP61TINT NT NT SEQ ID NO:**
79 **
B.13 SP T 0% NT SEQ ID NO:
B.14 AP79TQ NT NT SEQ ID NO:**
B.15 AP79TINT NT NT SEQ ID NO:**
B.16 P116TQAP NT NT SEQ ID NO:**
B.17 TP116TEI NT NT SEQ ID NO:**
B.18 P120TINT 100% NT SEQ ID NO:**
B.19 P120TSVG 10% NT SEQ ID NO:**
B.20 P120TET 100% NT SEQ ID NO:**
B.21 P125TQA 40% NT SEQ ID NO:**
B.22 P125TEI 100% GalNAc-Gal-SA-PEG(40K) SEQ ID NO:**
B.23 P129T 10% NT SEQ ID NO:**
B.24 ADP129TP131A NT NT SEQ ID NO:**
134 **
B.25 PRGP TINT NT NT SEQ ID NO:
B.26 PRGP134TSVG NT NT SEQ ID NO:**
B.27 PAGP134TINT NT NT SEQ ID NO:**
B.28 P139TPG 100% GalNAc-Gal-SA-PEG(40K) SEQ ID NO:**
B.29 P148TPPG 100% NT SEQ ID NO:**
B.30 P151TINAP NT NT SEQ ID NO:**
B.31 P151TINTP 100% NT SEQ ID NO:**
B.32 P151TTV 100% NT SEQ ID NO:**
B.33 P151TTVS 100% NT SEQ ID NO:**
B.34 P156TPPD 100% NT SEQ ID NO:**
B.35 P159TVGSS 100% NT SEQ ID NO:**
B.36 P159TINT 100% NT SEQ ID NO:**
166 **
B.37 TETP 70% NT SEQ ID NO:
B.38 P166TSMV 10% NT SEQ ID NO:**
B.39 P166TSVG 50% NT SEQ ID NO:**
B.40 P166TQGAM 90% NT SEQ ID NO:**
B.41 P172TQGAS 100% GalNAc-Gal-SA-PEG(40K) SEQ ID NO:**
B.42 P172TQGAM 100% GalNAc-Gal-SA-PEG(40K) SEQ ID NO:**
B.43 P178TQ 10% NT SEQ ID NO:**
B.44 P178TINT 10% NT SEQ ID NO:**
NT=未测试;PEG(40K)=40KDa-cys-PEG实施例5:C-末端接头的糖基化
[0733] 在200μL中,将肽H2N-Met-Val-Thr-Pro-Thr-Pro-Thr-Pro-Thr-CO2(40μg)与Sf9来源的GalNAc T2(200mUnit)、UDP-GalNAc(1mM,终浓度)、MnCl2(10mM,终浓度)和Tris
pH7.0(50mM,终浓度)一起温育。在37℃下温育18小时后,将反应体系贮存于4℃。然后,
通过LC/MS/MS来分析样品以测定掺入肽中的GalNAc残基的数目。
[0734] 尽管已经关于具体实施方案公开了本发明,但是明显的是,本领域技术人员可以设想出本发明的其他实施方案和变化形式,而不背离本发明的真正的精神和范围。
[0735] 本申请中所引用的所有专利、专利申请和其他出版物都通过提及而以其整体合并入本文。