合成双功能复合物的方法转让专利

申请号 : CN200380104764.5

文献号 : CN1720331B

文献日 : 2013-01-02

本发明公开了一种合成包含反应产物和编码区域的双功能复合物的方法。该复合物是新生双功能复合物和构件之间的杂交产物。新生双功能复合物包含连接到寡核苷酸标识符区的连接实体，构件包含和与该标识符区足够互补以允许杂交的寡核苷酸连接的功能实体。然后，功能实体可通过化学反应转移到连接实体上。互补标识符区还包含独特密码子，它明确地标识该功能实体。该密码子在使用酶(例如聚合酶)延伸该标识符区域时用作模板以形成独特密码子。独特密码子可用于解码几轮功能实体转移后反应产物的合成历史。

1.一种用于得到包含展示分子和包含编码部分的标识符寡核苷酸的双功能复合物的方法，该编码部分包含标识已经参与了该展示分子之形成的反应物的标签，其中包含化学反应部位和用于酶加入标签的引发部位的新生双功能复合物在化学反应部位上与一种或多种反应物反应，并使用一种或多种酶向此新生双功能复合物在引发部位上提供标识反应物的各自的标签，其中，反应物和标识该反应物的标签在它们分别与新生双功能复合物的化学反应部位和引发部位反应之前不连接。

2.权利要求1的方法，其中使新生双功能复合物进行一轮或者多轮在化学反应部位的反应物反应和在引发部位的标签添加。

3.权利要求2的方法，其中前一轮反应的反应产物用作平行合成的随后每轮反应中的化学反应部位，并且其中最后引入的标签提供了随后一轮反应中另外标签的酶加入的引发部位。

4.权利要求1的方法，其中通过将一种或者多种反应物与化学反应部位反应并将各自的标签与引发部位反应获得的双功能复合物被进一步与一种或者多种另外的反应物和另外的各自标签反应一次或者多次，产生包含反应产物和标识符寡核苷酸的另外的双功能复合物，所述标识符寡核苷酸包含标识已经参与了该反应产物之形成的反应物的标签。

5.权利要求1的方法，其中所述展示分子通过将一种以上的反应物与所述化学反应部位反应而形成。

6.权利要求1的方法，其中所述双功能复合物的标识符寡核苷酸的标签的序列被用于破译已经参与所述展示分子之形成的反应物的结构。

7.权利要求1的方法，其中所述标签的顺序确定了反应物引入展示分子中的顺序。

8.权利要求1的方法，其中在单个反应周期中单个反应物与化学反应部位反应，所述反应周期进一步包括将标识反应物的标签与引发部位进行酶促反应。

9.权利要求1的方法，其中在单个反应周期中多个反应物与化学反应部位反应，所述反应周期进一步包括将标识反应物的各自标签与引发部位进行酶促反应。

10.权利要求1的方法，其中所述双功能复合物通过同时加入标签和使反应物进行反应来制备。

11.权利要求1的方法，其中所述双功能复合物通过顺序加入标签和使反应物进行反应来制备。

12.权利要求1的方法，其中在化学反应部位反应物的反应发生在在引发部位添加标签之后。

13.权利要求1的方法，其中在引发部位添加标签发生在在化学反应部位反应物反应之后。

14.权利要求1的方法，其中化学反应部位包含单个反应基团。

15.权利要求1的方法，其中化学反应部位包含连接有一个或者多个反应基团的支架。

16.权利要求15的方法，其中提供了支架“X”，支架“X”与标识所述支架的标签“x”相连，其中反应物“A”与支架“X”反应，所述反应导致“A”与“X”相连，并且其中标签“a”被添加到支架标签“x”上。

17.权利要求15的方法，其中所述支架选自苯并二氮杂类，甾族，hydantiones，哌嗪类，二酮哌嗪类，吗啉类，托烷类，香豆素类，喹啉类，吲哚类，呋喃类，吡咯类，唑类，氨基酸前体，和噻唑类。

18.权利要求1的方法，其中所述化学反应部位包含多个能与一种或者多种反应物反应的反应基团。

19.权利要求1的方法，其中反应物包含化学结构，该化学结构包含一个、两个或者更多个可与化学反应部位反应的反应基团。

20.权利要求19的方法，其中所述一个或者多个反应基团选自羟基、羧酸基团、硫醇基、异氰酸酯基、胺基、酯基、和硫酯基。

21.权利要求1的方法，其中反应物包含反应基团或者可活化的反应基团前体。

22.权利要求1的方法，其中反应物和化学反应部位的反应在存在介导该反应物和该化学反应部位之间连接的另外反应物的情况下进行。

23.权利要求1的方法，其中反应物是被引入到展示分子中的结构实体的前体。

24.权利要求1的方法，其中反应物的反应基团的数目为1-10个。

25.权利要求24的方法，其中反应基团包括氨基基团。

26.权利要求24的方法，其中所述一个或者多个反应基团包括羧酸。

27.权利要求24的方法，其中所述一个或者多个反应基团包括硫基团(thio group)。

28.权利要求24的方法，其中所述一个或者多个反应基团包括醛。

29.权利要求24的方法，其中所述一个或者多个反应基团包括羟基。

30.权利要求1-4任一项的方法，其中在聚合物或者支架的末端位置使用以仅仅一个反应基团为特征的反应物。

31.权利要求1-4任一项的方法，其中使用具有两个反应基团的反应物来形成能够被进一步反应的聚合物或者支架的体部分。

32.权利要求1的方法，其中两个或者更多个反应基团存在于核心结构形式的支架上，它们与不同反应物反应，由此产生不同的支架起来的展示分子。

33.权利要求32的方法，其中与支架反应的反应物含有一个、两个或者几个能够与所述支架形成连接的反应基团。

34.权利要求1的方法，其中所述新生双功能复合物进一步包含连接化学反应部位和引发部位的连接部分。

35.权利要求34的方法，其中新生双功能复合物的连接部分包含与化学反应部位的身份有关的信息。

36.权利要求34的方法，其中所述连接部分是互补性寡核苷酸能够与之杂交的核酸序列。

37.权利要求34的方法，其中所述连接部分通过包含可选择性地断裂的接头的间隔基连接到化学反应部位。

38.权利要求37的方法，其中在形成最终双功能复合物之后，可选择性地断裂的接头被断裂，展示分子与双功能复合物的标识符寡核苷酸脱离。

39.权利要求37的方法，其中可选择性断裂的接头通过电磁辐射来断裂。

40.权利要求1的方法，其中所述双功能复合物包含能够被电磁辐射断裂的可选择性地断裂的接头，其中所述双功能复合物选自

1 2

其中R 和R 选自展示分子和标识符寡核苷酸，所述标识符寡核苷酸包含标识已经参与了该展示分子之形成的反应物的标签；

其中R 是H或者OCH3；且

其中X是O或者NH。

41.权利要求1的方法，其中所述双功能复合物包含能够被UV辐射断裂的可选择性断裂的接头，其中所述双功能复合物具有如下结构式：

1 2

其中R 和R 选自展示分子和标识符寡核苷酸，所述标识符寡核苷酸包含标识已经参与了该展示分子之形成的反应物的标签。

1 2

42.权利要求41的方法，其中所述R 是展示分子，而R 是标识符寡核苷酸，所述标识符寡核苷酸包含标识已经参与了该展示分子之形成的反应物的标签。

43.权利要求1的方法，其中所述双功能复合物包含能够被化学试剂断裂的可选择性断裂的接头，其中所述双功能复合物具有如下结构式：

1 2

其中R 和R 选自展示分子和标识符寡核苷酸，所述标识符寡核苷酸包含标识已经参与了该展示分子之形成的反应物的标签；

3 4 5 6

其中R、R、R 和R 选自H、CN、F、NO2和SO2NR2。

44.权利要求37的方法，其中所述可选择性断裂的接头是二硫化物接头。

45.权利要求37的方法，其中所述可选择性断裂的接头被蛋白酶断裂。

46.权利要求1的方法，其中所述标识符寡核苷酸包含3、4、5或者更多个标签。

47.权利要求1的方法，其中所述引发部位包含互补性寡核苷酸能够与之杂交的1个、

2个或者更多个核苷酸。

48.权利要求47的方法，其中所述引发部位包含核苷酸的3’-OH或者5’-磷酸基团。

49.权利要求1的方法，其中所述标识符的至少一个标签通过酶催化的反应连接，而且其中另外的标签可以使用化学反应或者酶促反应来连接。

50.权利要求2-4任一项的方法，其中所述另外的标签连接到先前的标签上，产生直链或者支链标识符寡核苷酸。

51.权利要求50的方法，其中标识符寡核苷酸的所有标签都使用酶催化的反应来连接。

52.权利要求50或者51的方法，其中所述标签是独特的标签。

53.权利要求1的方法，其中双功能复合物的所述标识符寡核苷酸包含双链寡核苷酸，以便减少该寡核苷酸和反应物之间的反应。

54.权利要求1的方法，其中双功能复合物的所述标识符寡核苷酸是可扩增的。

55.权利要求1的方法，其中所述标识符寡核苷酸的核苷酸选自DNA和RNA。

56.权利要求1的方法，其中所述标识符寡核苷酸的核苷酸由核酸碱基部分和主链单元组成，其中主链单元由糖部分和核苷间接头组成。

57.权利要求56的方法，其中所述标识符寡核苷酸部分的核苷酸的核酸碱基选自天然存在的核酸碱基和非天然存在的核酸碱基。

58.权利要求57的方法，其中所述核酸碱基选自嘌呤杂环、嘧啶杂环和杂环类似物及其互变异构体。

59.权利要求58的方法，其中所述核酸碱基选自腺嘌呤，鸟嘌呤，胸腺嘧啶，胞嘧啶，6

尿嘧啶，嘌呤，黄嘌呤，二氨基嘌呤，8-氧代-N-甲基腺嘌呤，7-去氮黄嘌呤，7-去氮鸟

4 4 6 6

嘌呤，N，N-桥亚乙基胞嘧啶，N，N-桥亚乙基-2，6-二氨基-嘌呤，5-甲基胞嘧啶，

3 6

5-(C-C)-炔基胞嘧啶，5-氟尿嘧啶，5-溴尿嘧啶，假异胞嘧啶，2-羟基-5-甲基-4-三唑并吡啶，异胞嘧啶，异鸟嘌呤和次黄嘌呤核苷。

60.权利要求58的方法，其中所述核酸碱基选自腺嘌呤，鸟嘌呤，胸腺嘧啶，胞嘧啶，

5-甲基胞嘧啶，和尿嘧啶。

61.权利要求56的方法，其中所述标识符寡核苷酸的主链单元选自：其中B表示核酸碱基。

62.权利要求56的方法，其中所述主链单元的糖部分是戊糖。

63.权利要求62的方法，其中所述戊糖选自核糖，2’-脱氧核糖，2’-O-甲基-核糖，

2’-氟-核糖，和2’-4’-O-亚甲基-核糖(LNA)。

64.权利要求62或者63的方法，其中核苷酸的核酸碱基连接到戊糖的1’位上。

65.权利要求56的方法，其中所述连接标识符寡核苷酸两个相邻核苷酸的核苷间接头选自磷酸二酯键、硫代磷酸酯键、甲基膦酸酯键、氨基磷酸酯键、磷酸三酯键、和二硫代磷酸酯键。

66.权利要求56的方法，其中所述标识符寡核苷酸包含通过磷酸二酯键连接的DNA和RNA家族天然存在的核苷。

67.权利要求66的方法，其中所述脱氧核苷选自脱氧腺苷，脱氧鸟嘌呤核苷，脱氧胸腺嘧啶核苷，和脱氧胞苷，而其中所述核苷选自腺苷，鸟嘌呤核苷，尿嘧啶核苷，胞苷，和次黄嘌呤核苷。

68.权利要求2-4任一项的方法，其中每一个标签编码不同的反应物，而且其中展示分子的结构通过考虑不同的连接化学、位阻和正交保护基团(orthogonal protection groups)的去保护来推导。

69.权利要求2-4任一项的方法，其中对具有共性的一组反应物使用相同标签，所述共性选自亲油性质、分子量和连接化学。

70.权利要求2-4任一项的方法，其中每一个标签都是独特的。

71.权利要求2-4任一项的方法，其中对相同反应物使用几个不同的标签。

72.权利要求2-4任一项的方法，其中标识相同反应物的两个或者更多个标签还携带用于所述反应物反应的不同反应条件的信息。

73.权利要求2-4任一项的方法，其中单一标签指定两种或者多种反应物。

74.权利要求2-4任一项的方法，其中各个标签彼此的区别仅在于单个核苷酸。

75.权利要求2-4任一项的方法，其中在标签与任何其它标签之间有两个或者更多个不同。

76.权利要求2-4任一项的方法，其中标签的长度是5个核苷酸，而且其中为了产生任何两个标签之间两个或者更多个不同，存在100个以上核苷酸组合。

77.权利要求2-4任一项的方法，其中所述标签具有2-100个核苷酸。

78.权利要求77的方法，其中所述标签具有3-50个核苷酸。

79.权利要求77的方法，其中所述标签具有4-20个核苷酸。

80.权利要求77的方法，其中所述标签具有5-15个核苷酸。

81.权利要求2-4任一项的方法，其中每个标签被1-20个核苷酸的结合区域分开。

82.权利要求81的方法，其中每个结合区域标识所述标识符寡核苷酸中标签的位置。

83.权利要求81或者82的方法，其中所述结合区域包含一个或者多个与相关核酸碱基形成三个氢键的核酸碱基。

84.权利要求83的方法，其中所述核酸碱基是鸟嘌呤和胞嘧啶。

85.权利要求82或者83的方法，其中所述结合区域具有主链修饰，该主链修饰选自核糖部分的2’-O-甲基取代，核糖部分的2’-4’O-亚甲基环化(锁定的核酸；LNA)，和肽核酸(PNA)。

86.权利要求2-4任一项的方法，其中两个或者更多个反应物与化学反应部位反应，并且其中标识符寡核苷酸的标签被结合区域所分开。

87.权利要求86的方法，其中所述结合区域是被选自聚合酶和连接酶的酶识别的底物。

88.权利要求2-4任一项的方法，其中每个标签包含标识反应物的核苷酸和标识该反应物合成历史的构架序列。

89.权利要求2-4任一项的方法，其中所述标识还包含侧翼区域，该侧翼区域包含信号基团，例如荧光团或者放射性活性基团，允许检测双功能复合物。

90.权利要求89的方法，其中所述侧翼区域包含可被检测的标记，如生物素。

91.权利要求89的方法，其中所述侧翼区域包含PCR扩增用的引发位点。

92.权利要求1的方法，其中所述展示分子是两个或者更多个反应物的反应产物。

93.权利要求1的方法，其中所述展示分子是多于1个的反应物和所述双功能复合物的化学反应部位之间的反应产物。

94.权利要求1的方法，其中所述展示分子是具有少于1000Da的分子量的非聚合分子。

95.权利要求1的方法，其中所述展示分子是具有多于1000Da的分子量的非聚合分子。

96.权利要求1的方法，其中所述展示分子是聚合物分子。

97.权利要求2-4任一项的方法，其中第一反应物通过与化学反应部位反应形成中间产物，第二反应物与该中间产物反应获得展示分子或者其前体。

98.权利要求1的方法，其中两个或者更多个反应物彼此反应形成中间产物，化学反应部位与该中间产物反应，获得展示分子或者其前体。

99.权利要求1的方法，其中用于酶加入标签到引发部位的酶选自聚合酶、连接酶和重组酶。

100.权利要求1的方法，其中所述标签通过使用酶促延伸反应被连接到新生双功能复合物的反应部位上。

101.权利要求100的方法，其中所述延伸反应通过聚合酶或者连接酶或者它们的组合来进行。

102.权利要求1的方法，其中包含标识反应物的标签的标识符寡核苷酸通过延伸过程被转化成双链标识符寡核苷酸，在所述延伸过程中，引物与标识符寡核苷酸的3’端退火，并使用聚合酶延伸。

103.权利要求102的方法，其中所述延伸反应使用反标签寡核苷酸作为引物。

104.权利要求102的方法，其中所述聚合酶使用的底物是选自 dATP、dGTP、dTTP、dCTP、rATP、rGTP、rTTP、rCTP和rUTP的三磷酸核苷酸的混合物。

105.权利要求1的方法，进一步包括将标识反应物的反标签寡核苷酸的单链突出端与新生双功能复合物的标识符寡核苷酸的3’端退火的步骤。

106.权利要求105的方法，其中反标签被用作转录新生双功能复合物的标识符寡核苷酸产生双链寡核苷酸标识符的引物，其中所述转录使用聚合酶和dNTPs混合物。

107.权利要求102和106任一项的方法，其中所述聚合物选自DNA聚合酶、RNA聚合酶、逆转录酶、DNA连接酶、RNA连接酶、Taq DNA聚合酶、Pfu聚合酶、Vent聚合酶、HIV-1逆转录酶和Klenow片段。

108.权利要求102和106任一项的方法，其中所述聚合酶选自允许错配延伸的聚合酶。

109.权利要求108的方法，其中所述聚合酶选自DNA聚合酶η和DNA聚合酶ι。

110.权利要求1的方法，其中用于酶加入标签到引发部位的酶是连接酶。

111.权利要求110的方法，其中所述连接酶的底物是包含两个或者更多个核苷酸的寡核苷酸。

112.权利要求110的方法，其中所述连接酶介导单链连接，其中寡核苷酸标签连接到新生双功能分子上。

113.权利要求112的方法，其中所述单链连接通过将选自所述引发部位和所述寡核苷酸标签的第一核酸的3’-OH基团与选自所述引发部位和所述寡核苷酸标签的第二核酸的

5’-磷酸基团连接来进行，前提条件是这两个核酸带有不同的、能够被连接的反应基团。

114.权利要求110的方法，其中所述连接酶介导双链连接，其中所述新生双功能复合物的引发部位在与寡核苷酸标签连接前与互补性寡核苷酸杂交。

115.权利要求110的方法，其中双链连接在存在第三寡核苷酸的条件下进行，所述第三寡核苷酸与第一和第二核酸分别的3’端的一部分和5’端的一部分互补，所述第一和第二核酸选自所述引发部位和寡核苷酸标签。

116.权利要求110的方法，其中所述酶选自Taq DNA聚合酶、T4DNA聚合酶、T4 RNA聚合酶、T7 DNA聚合酶和大肠杆菌DNA连接酶。

117.权利要求114和115任一项的方法，其中待连接的双链寡核苷酸具有平端，而且其中使用T4RNA连接酶连接所述平端。

118.权利要求114和115任一项的方法，其中待连接的双链寡核苷酸具有粘性末端，而且其中使用Taq DNA连接酶连接所述粘性末端。

119.权利要求110的方法，其中采用被杂交且互补的寡核苷酸的聚合酶转录和连接偶联的组合来产生双链标识符寡核苷酸。

120.权利要求119的方法，其中在其它方面双链的标识符寡核苷酸中的间隙首先用聚合酶填满，然后用连接酶连接到上游寡核苷酸上，产生完全双链的标识符寡核苷酸。

121.权利要求2-4任一项的方法，其中所述酶反应在含水溶剂中进行，而且其中至少在反应物和化学反应部位之间的一些反应在有机溶剂中进行。

122.权利要求121的方法，其中所述酶反应首先在含水溶剂中进行，然后将反应混合物冻干，随后将反应产物溶解或者分散在不同溶剂中，之后进行在化学反应部位的反应。

123.权利要求122的方法，其中该方法无冻干步骤，并且其中适当的反应条件通过将添加溶剂到含水溶剂中获得。

124.权利要求123的方法，其中添加的溶剂是与含水溶剂混溶的，其中溶剂的添加产生均相反应溶剂。

125.权利要求124的方法，其中添加的溶剂是与含水溶剂不混溶的，其中溶剂的添加产生两相反应溶剂。

126.权利要求1的方法，其中不使用保护基团保护新生双功能复合物的展示分子或标识符寡核苷酸。

127.权利要求1的方法，其中新生双功能复合物的展示分子被保护基保护。

128.权利要求1的方法，其中，化学反应部位的反应基团最初处于可被活化的前体形式(pro-form)，其中在与反应物反应之前激活可被活化的前体形式反应基团。

129.权利要求128的方法，其中，用防止与反应物反应的基团保护可被活化的前体形式的反应基团。

130.制备不同双功能复合物的库的方法，所述的方法包括通过权利要求1-129任一项的方法合成不同的双功能复合物的步骤，其中，所述库中的每个不同的双功能复合物包含展示分子和标识符寡核苷酸，所述标识符寡核苷酸包含标识已参与各个展示分子之形成的反应物的标签。

131.权利要求130的方法，还包括步骤：

d)在分开的反应隔室中提供新生双功能复合物，每个新生双功能复合物包含化学反应部位和用于酶加入标签的引发部位，所述标签是连续核苷酸的序列的形式e)在每个反应隔室中，进行新生双功能复合物的化学反应部位和供给到所述反应隔室中的一种或多种反应物之间的反应，和，f)在每个反应隔室中，在新生双功能复合物的引发部位上加入供给到所述反应隔室中的一种或多种标识所述一种或多种反应物的各自的标签，其中的步骤e)和f)可以以任何顺序发生。

132.权利要求131的方法，其中，供给到每个分开的反应隔室中的新生双功能复合物是相同的。

133.权利要求131的方法，其中，提供到每个分开的反应隔室中的新生双功能复合物是不同的。

134.权利要求129的方法，其中，新生双功能复合物在化学反应部位不同，并且其中每个新生双功能复合物包含标识化学反应部位的结构的标签。

135.权利要求131-134任一项的方法，其中，施加到每个分开的反应隔室中的反应物是相同的。

136.权利要求131-134任一项的方法，其中，施加到每个分开的反应隔室中的反应物是不同的。

137.权利要求131-136任一项的方法，其中，在每个分开的反应隔室中的反应条件是相同的。

138.权利要求131-136任一项的方法，其中，在每个分开的反应隔室中的反应条件是不同的。

139.权利要求131-138任一项的方法，其中，新生双功能复合物与1个以上的反应物反应。

140.权利要求131-139任一项的方法，其中，在每个反应隔室中形成双功能复合物后，两个或更多个反应隔室的内容物被合并在一起并随后为新一轮反应而分开到另外的一系列反应隔室中。

141.权利要求140的方法，包括一轮以上的双功能复合物的合成，其中，先前轮合成的反应产物用作随后轮合成的新生双功能复合物，以得到不同双功能复合物的库，其中每个双功能复合物包含展示分子和标识符寡核苷酸，所述标识符寡核苷酸包含标识已参与各个展示分子之形成的反应物的标签。

142.权利要求141的方法，其中，在每轮合成之间，将分开的反应隔室混合在一起并且随后被分开到另外的反应隔室中。

143.权利要求141的方法，其中，在标签加入到引发部位之前发生两个或者两个以上反应物反应。

144.权利要求141的方法，其中，双功能复合物的最后一轮合成包括含有引发部位的寡核苷酸的引入。

3 6

145.权利要求130的方法，其中，库包括10-10 个不同的双功能复合物。

3 8

146.权利要求130的方法，其中，库包括10-10 个不同的双功能复合物。

3 10

147.权利要求130的方法，其中，库包括10-10 个不同的双功能复合物。

5 6

148.权利要求130的方法，其中，库包括10-10 个不同的双功能复合物。

5 8

149.权利要求130的方法，其中，库包括10-10 个不同的双功能复合物。

5 10

150.权利要求130的方法，其中，库包括10-10 个不同的双功能复合物。

151.用于鉴定具有预定性能的展示分子的方法，所述方法包括步骤：a)将根据权利要求130-150任一项的方法制成的双功能复合物的库经受一种选择条件，其中具有所述预定性能的一种或多种展示分子与该双功能复合物的库的剩余部分分开，和b)通过解码该分开的1种或者多种双功能复合物的标识符寡核苷酸而鉴定所述具有所述预定性能的1种或者多种展示分子。

152.权利要求151的方法，其中，选择条件包括用靶与双功能复合物的库接触的步骤，其中具有对该靶的亲和性的双功能复合物通过将非结合双功能复合物与对靶具有亲和性的双功能复合物分离和随后在更严格的条件下洗脱对所述靶具有亲和力的双功能复合物而与该库的剩余部分分开。

153.权利要求151和152任一项的方法，其中，分开的双功能复合物的标识符寡核苷酸在去除非结合双功能复合物之后从展示分子上切离。

154.权利要求153的方法，其中，分开的双功能复合物的标识符寡核苷酸被回收和解码以鉴定各自的展示分子。

155.权利要求151-154任一项的方法，其中，针对特定靶进行单轮选择，随后扩增所选的双功能复合物变型。

156.权利要求155的方法，其中，所选的双功能复合物变型在分析中分开测试。

157.权利要求151-154任一项的方法，其中，针对特定靶进行多轮选择，随后扩增所选的双功能复合物变型。

158.权利要求157的方法，其中，使用日益严格的条件进行所述几轮选择。

159.权利要求157和158任一项的方法，其中，在每个选择步骤之间扩增所选择的复合物。

160.权利要求155和159任一项的方法，其中，使用产生两个独特的切割位点的引物和PCR扩增标识符寡核苷酸的标签。

161.权利要求160的方法，其中，所述切割位点通过克隆标识符寡核苷酸的标签到适于测序的载体中而用于标签的多聚化。

162.权利要求160的方法，其中，可使用TA克隆直接克隆扩增得到的PCR产物到合适的载体中。

163.权利要求160的方法，其中，扩增得到的PCR产物被导入到微阵列以鉴定展示分子。

合成双功能复合物的方法

[0001] 该申请要求2002年10月30日递交的U.S.临时申请系列No.60/422,167；2002年12月19日递交的U.S.临时申请系列No.60/434,425，和2003年7月11日递交的U.S.临时申请系列No.60/486,199的权益，这些申请在此作为参考完全并入本发明。在这些专利申请中或在本申请中引用的所有专利和非专利参考文件在此作为参考完全并入本发明。

[0002] 发明技术领域

[0003] 本发明涉及一种用于得到包含展示分子部分和编码部分的双功能复合物的方法。本发明还涉及一种用于生成双功能复合物库的方法，一种用于鉴定具有预选性能的展示分子的方法。

[0004] 背景

[0005] 已经开发出能够对多肽和其它生化聚合物进行合成编码的方法。该方法的一个例子公开于US 5,723,598，其中涉及双功能分子库的生成。双功能复合物的一个部分是多肽且另一部分是包含用于编码和鉴别已参与形成多肽的氨基酸的核苷酸序列的标识符寡核苷酸。在生成双功能分子的库之后，在对靶亲和性方面进行分配且双功能分子的标识符寡核苷酸部分利用PCR进行扩增。最终，PCR扩增子被测序和解码用于鉴别具有靶亲和性的多肽。双功能复合物库通过一种通常称作分开-和-混合的方法而制成。该方法意味着接头分子被分开至空间分离的隔室中并在每个隔室中在一端与特定氨基酸前体反应并在另一端通过正交化学反应添加编码该特定氨基酸前体的核酸标签。随后，收集(混合)各隔室的内容物并随后再次分开至数个隔室，用于新一轮的与氨基酸前体和核苷酸标签的交替反应。继续该分开-和-混合法直至多肽达到所需长度。

[0006] 该已有技术方法在其应用中受到局限，因为用于加入化学单元或用于加入核苷酸或寡核苷酸序列的两种交替合成步骤之间必须存在相容的化学。根据已有技术，合成相容性问题通过在合成交替聚合物时正确选择相容的保护基团，和通过正确选择用于在一种生长中的聚合物保持被封闭的同时选择性地去保护另一生长中的聚合物的方法而解决。

[0007] Halpin和Harbury在WO 00/23458中建议了另一方案，其中所形成的分子不仅被核酸标签鉴别而且被它指导。该方案也基于分开-和-混合技术，其中使用两个或多个合成步骤得到组合库。使用多个核酸模板，其中每个在一端具有化学反应部位点和在整个链中分散多个密码子区域，每个所述密码子区域又规定不同的密码子。模板通过密码子杂交至固定化探针上而分离和随后每个链在化学反应部位与特定选择的试剂反应。随后，所有的链被集中并基于第二密码子区域进行第二分配。该分开-和-混合法进行合适的次数以得3 6
到通常10 至10 种不同的化合物的库。该方法的缺点在于必须提供大量的核酸模板。如
6 6
果需要10 种不同化合物的最终库，必须合成总共10 个核酸模板。这种合成一般麻烦或昂贵，因为核酸模板必须具有相当的长度以确保密码子区域和探针之间足够的杂交。

[0008] 在WO 02/074929中，公开了一种用于合成化合物的方法。这些化合物通过起始将包含反密码子和反应性单元的转移单元与具有与其相连的反应性单元的模板在允许反密码子杂交至模板上的条件下接触和随后使反应性单元反应而合成。另外，该方法的缺点在于，必须起始提供大量的核酸模板。

[0009] 使用模板的已有技术方法的缺点在于，编码取决于反密码子和模板之间的鉴别。两种寡核苷酸之间的杂交可在两者之间存在足够互补性时发生。有时，杂交甚至在寡核苷酸之间不存在完全匹配的情况下发生。其后果是，如果存在多个转移单元，那么有时模板的密码子序列不对应于实际反应的反应性单元。该不希望的后果在希望形成库时甚至更加明显，因为多个模板和构件被估计在反应介质中相互寻找。如果杂交步骤不完全适当，会产生被在模板上的不正确密码子编码的分子。这对针对该库进行的选择方法产生两种主要作用。首先，具有编码结合配体的密码子组合的模板会在选择过程中损失。第二，而且更重要的是，具有编码非结合性配体的密码子组合的模板将被富集。

[0010] 本发明的一个方面的目的是提供一种用于得到被编码分子的非模板依赖性方法，所述方法使得多种化学能够被应用于被编码分子的形成，因为可避免相容的正交保护基团在被编码分子和寡核苷酸标签的交替形成中的应用。本发明在一个优选方面意欲改进以前在密码子鉴别过程中显示的易错杂交方法。另外，本发明的目的是减少所形成的非特异性反应产物。因此，在本发明的一个方面，本方法具有固有校正性质以确保表现型被基因型准确地编码。

[0011] 发明概述

[0012] 本发明涉及一种用于得到包含展示分子(display molecule)部分和编码部分的双功能复合物的方法，其中包含化学反应部位和用于酶加入标签(tag)的引发部位(priming site)的新生双功能复合物在化学反应部位与一种或多种反应物反应，并且在引发部位上使用一种或多种酶给该复合物提供标识反应物的各自的标签。

[0013] 酶一般是底物特异性的，因此标签至引发部位上的酶加入不可能干扰正在形成的展示分子。因此，保护基团在编码部分以及新生展示分子上的应用因此可被避免。但可因为其它原因需要保护正生长中的展示分子。可得到在含水和有机介质中具有活性的酶。但大多数酶在水介质中具有高于在有机介质中的活性。因此，在提供标签之前或之后，可能需要改变介质以得到可用于反应物在化学反应部位上反应的条件。

[0014] 一般，展示分子部分通过一种或多种反应物和化学反应部位之间一轮以上的反应而形成。在本发明的某些方面，与一种或多种反应物反应和提供有各自的标签的新生双功能复合物进一步一次或多次与一种或多种反应物反应和向其提供各自的标识标签，得到作为双功能复合物的一部分的反应产物和包含标签的标识部分，所述标识部分编码已参与形成反应产物的反应物的身份(identity)。

[0015] 在本发明的某些方面，反应的轮或周期是指，单个反应物与化学反应部位反应且用于标识反应物的各自的标签被提供在用于酶加入的引发部位上。在本发明的另一方面，一轮反应意味着多个反应物在化学反应部位上反应且用于标识一种或多个，但不必所有的，反应物的标签被提供在用于酶加入的引发部位上。在化学反应部位上的反应和标签的加入可按照任何顺序发生，即反应可在标签加入之后，同时，或之前发生。对顺序的选择可取决于酶种类，反应条件，和反应物种类，以及其它。

[0016] 新生双功能复合物包含化学反应部位和用于标签的酶加入的引发部位。任选地，新生双功能复合物还包含连接部分(linking moiety)，它连接化学反应部位与引发部位。连接部分可用于各种目的，如使引发部位与化学反应部位彼此相距足够远以允许酶进行标签加入和提供杂交区域。在本发明的一个方面，连接部分是核酸序列。寡核苷酸的长度优选适用于与互补性寡核苷酸杂交，即连接部分中的核苷酸的数目合适地是8或以上。在某些实施方案中，连接部分通过间隔基连接到化学反应部位上，间隔基包含可选择性地断裂的接头以使展示分子能够在形成最终双功能复合物之后的步骤中脱离编码部分。新生双功能复合物也被称作生长中的复合物和表示待根据本发明方法处理的起始或中间复合物。中间复合物表示已进行一轮或多轮反应物反应和标签加入的起始复合物。

[0017] 化学反应部位可包含单个或多个能够与一种或多种反应物反应的反应基团。在某些方面，化学反应部位包含连接有一个或多个反应基团的支架(scaffold)。合适的反应基团的例子包括胺，羧酸，硫(thio)，醛，和羟基基团。支架的例子包括苯并二氮杂_类，甾族，hydantiones，哌嗪类，二酮哌嗪类，吗啉类，托烷类，香豆素类，喹啉类，吲哚类，呋喃类，吡咯类，噁唑类，氨基酸前体，和噻唑类。另外，化学反应部位的反应基团可以是在可与反应物进行反应之前必须被活化的前形(pro-form)。例如，反应基团可用合适的基团保护，后者需要在可与反应物进行反应之前被去除。本说明书或权利要求中的展示分子表示已与一种或多种反应物反应的化学反应部位。

[0018] 本发明的反应物包括游离反应物以及包含功能实体(funcitionalentity)和核酸序列的反应物。游离反应物参与与化学反应部位的反应和可得到最终展示分子的化学结构。连接到核酸上的功能实体在本文中可被称作构件(building block)和表示功能实体能够在化学反应部位上反应的化学实体。在本发明的某些方面，功能实体从核酸部分上分开和转移至化学反应部位。构件的寡核苷酸可具有或不具有关于功能实体身份的信息。在本发明的某些实施方案中，反应物是包含与连接部分足够互补从而能够杂交的寡核苷酸，可转移的功能实体，和用于标识该功能实体的反密码子的构件。游离反应物一般不连接到核酸上，除非在最终展示分子中需要核酸组分。游离反应物可具有任何化学结构和优选包含反应基团或其前体，它们能够与化学反应部位反应。反应基团的例子包括羟基基团，羧酸基团，硫醇，异氰酸酯，胺，酯，和硫酯。任选地，可存在其它的反应物介导游离反应物和化学反应部位之间的连接。构件的功能实体就与化学反应部位反应的要求而言类似游离反应物。但是，另外，在大多数情况下需要在该反应之后断开功能实体和核酸之间的连接。任选地，反应和断裂可在单个步骤中发生。以下详细公开各类构件。在本发明的某些方面，游离反应物或功能实体不包括核苷酸。

[0019] 新生双功能复合物的编码部分通过使用一种或多种酶向引发部位加入至少一个标签而形成。进一步的标签可连接到以前的标签上以得到直链或支链标识符(identifier)。只要标识符的至少一个标签通过酶催化反应而连接，进一步的标签可使用化学方式或酶方式根据试验者的意愿而提供。在本发明的某些实施方案中，所有的标签使用酶催化反应而提供。标签合适地包含识别单元，即可被识别基团识别的单元。识别单元具有携带信息以标识反应物的能力。实际上存在各种不同种类的识别。例子是识别表位的抗体，识别另一蛋白质的蛋白质，识别蛋白质的mRNA，和识别互补性寡核苷酸序列的寡核苷酸。一般优选的是，标签是核苷酸序列。

[0020] 双功能复合物的编码部分在本发明的优选方面是可扩增的。被扩增的能力使得能够在选择过程中使用低量的双功能复合物。如果标签是蛋白质，该蛋白质可通过连接已编码其合成的mRNA，由mRNA生成cDNA和使所述mRNA经受翻译体系而扩增。这些体系公开于WO98/31700，其内容在此通过参考并入本发明。用于扩增蛋白质标签的另一方法是使用噬菌体展示的蛋白质。但一般来说，标签是可使用标准技术如PCR扩增的核苷酸序列。如果两个或多个标签存在于线性标识性寡核苷酸中，所述寡核苷酸一般由某一种类的主链结构组成，以允许酶识别该寡核苷酸作为底物。例如，主链结构可以是DNA或RNA。

[0021] 新生双功能复合物的引发部位能够接受标签。引发部位的化学身份取决于所用的标签和特定酶的种类以及其它。如果标签是多核苷酸，引发部位一般包含接受性核苷酸的3’-OH或5’-磷酸基团，或这些基团的功能衍生物。可用于将标签酶促加入引发部位上的酶包括选自聚合酶，连接酶，和重组酶，和这些酶的组合的酶。

[0022] 化学反应部位和一种或多种反应物之间的反应可在有利于该反应的合适的条件下进行。在本发明的一些方面，该反应在杂交条件下进行，即在反应条件下保持两种互补性寡核苷酸之间的退火。在本发明的其它方面，该反应在变性条件下进行以使条件合适反应发生。如果生长中的复合物的编码部分包含寡核苷酸；所述寡核苷酸在本发明的一个方面在反应过程中是双链形式以减少寡核苷酸的组分和反应物之间副反应的可能性。

[0023] 用于标识反应物的标签可使用任何合适的酶而加至引发部位。在某些实施方案中，标签采用酶延伸反应被提供在新生双功能复合物的引发部位。延伸反应可通过聚合酶或连接酶或其组合而进行。使用聚合酶的延伸作用合适地使用反标签寡核苷酸(anti-tagoligonucleotide)作为模板而进行。反标签寡核苷酸在新生双功能复合物的寡核苷酸部分的3’端退火，并有一个包含能够标识反应物的反密码子的单链突出端。反标签的反密码子可使用聚合酶和dNTPs混合物被转录至标识符部分上。或者，连接酶用于使用一种或多种寡核苷酸作为底物而加入标签。连接可根据所用的酶在单链或双链态下进行。一般来说优选在双链态下连接，即所要连接在一起的寡核苷酸通过一种能够互补这两个寡核苷酸的末端的互补性寡核苷酸而保持在一起。

[0024] 合适的酶的例子包括DNA聚合酶，RNA聚合酶，反转录酶，DNA连接酶，RNA连接酶，Taq DNA聚合酶，Pfu聚合酶，Vent聚合酶，HIV-1反转录酶，Klenow片段，或任何能够催化互补性元件如单-，二-或多核苷酸的引入的其它酶。也可使用允许错配延伸的其它种类的聚合酶，例如DNA聚合酶η(Washington等人，(2001)JBC 276：2263-2266)，DNA聚合酶ι(Vaisman等人，(2001)JBC 276：30615-30622)，或允许延伸错配退火碱基对的任何其它酶。另一方面，如果使用连接酶，合适的例子包括Taq DNA连接酶，T4 DNA连接酶，T4 RNA连接酶，T7 DNA连接酶，和大肠杆菌(E.coli)DNA连接酶。对连接酶的选择在一定程度上取决于所要连接在一起的末端的设计。因此，如果末端是平端，T4 RNA连接酶可以是优选的，而对于粘性末端连接，即其中每端上的突出端是相互互补的连接，Taq DNA连接酶可以是优选的。

[0025] 加至新生双功能复合物的引发部位上的标签具有有关反应物的信息。在本发明中以及权利要求书中，涉及反应物的信息被称作密码子。除了编码反应物身份的核苷酸的组合，标签可包含其它核苷酸。在本发明的某些方面，标签包含构架序列(framing sequence)。构架序列可用于各种目的，如用于反标签的退火区域和/或用作提供相关反应物已反应的合成历史的时间点信息的序列。

[0026] 密码子和反应物的身份之间的相关可根据所需输出而变化。在某些实施方案中，密码子用于编码几种不同的反应物。在随后的鉴定步骤中，展示分子的结构可根据对不同的连接化学，位阻，正交保护基团(orthogonal protection groups)的去保护，等的知识而推断。在另一实施方案中，同一密码子用于具有共性，如亲油性质，分子量，某些连接化学，等的一组反应物。但在一个优选实施方案中，密码子是独特的，即核苷酸的类似组合不标识另一反应物。在实际方案中，对于特定反应物，仅使用核苷酸的单个组合。在本发明的一些方面，可针对相同的反应物有利地使用几种不同的密码子。两种或多种标识相同反应物的密码子可携带有关不同的反应条件的其它信息。在本发明的另一方面，单个密码子指定两种或多种反应物。

[0027] 在本发明的一个方面，每种双功能复合物通过同时或顺序标记和反应物反应而制成，如以下方案所说明：

[0028] x-X—→ax-XA—→1ax-XA1

[0029] 大写字母表示反应物或化学反应部位。小写字母表示标签。

[0030] 支架“X”连接至标签“x”上。反应物连接至“X”上，如“A”，并连接针对该片段的标签，如“a”。合适地，标签是独特的。

[0031] 最终形成的双功能复合物的编码部分包含所有的密码子。每个密码子的序列用于破译已参与形成展示分子，即反应产物的反应物的结构。密码子的顺序也可用于确定反应物的引入顺序。这在形成线性聚合物时可具有特殊的意义，因为聚合物的准确序列可通过解码该编码序列而确定。通常，为了有助于解码步骤，恒定或结合区域与密码子一起被转移至双功能复合物上。该恒定区域可包含有关所相关的反应物在展示分子的合成路径中的位置的信息。

[0032] 本发明还涉及一种用于鉴定具有预选性能的展示分子的方法，包括步骤：将根据上述方法制成的库经受一种条件，其中具有预定性能的展示分子或展示分子的子集与该库的剩余部分分开，和通过解码复合物的编码部分而鉴定具有预选功能的展示分子。

[0033] 一般称作选择的以上方法包括，将库经受一种条件以选择具有对该条件起反应的性能的展示分子。该条件可包括该库暴露于靶。具有对该靶的亲和性的双功能复合物可通过去除非结合复合物和随后在更严格的条件下洗脱已结合到靶上的复合物而与该库的剩余部分分开。或者，双功能复合物的编码部分可在去除非结合复合物之后从展示分子上切离并可将编码部分回收和解码以鉴定展示分子。

[0034] 可针对特定靶进行单轮或几轮选择，随后扩增所选的变型。所得的这些变型随后在合适的分析中分开测试。选择条件可以是严格的和特异的以在一轮选择中得到结合分子。可有利地使用单轮选择进行该方法，因为可能的结合物的数目或多样性与其中可能损失潜在结合物的使用更多选择的方法相比而言较大。在另一实施方案中，选择程序包括使用日益严格的条件进行几轮选择。在每次选择之间，可有益地扩增所选的复合物。

[0035] 编码部分可通过使用产生两个独特的切割位点的引物进行PCR扩增。这些切割位点可通过克隆到适用于测序的载体中而用于编码区域的多聚化。该方案能够对许多编码区域同时测序。或者，PCR产物使用例如TA克隆而被直接克隆到合适的载体中。在另一方案中，展示分子的身份通过将PCR产物应用于合适的微阵列而确立。

[0036] 本领域熟练技术人员完全能够构建寡核苷酸的所需设计。如果需要特定退火温度，那么建议合适的核酸单体的组成和其长度是标准步骤。合适设计的构建可通过软件，如Vector NTI Suite或因特网地址http：//www.nwfsc.noaa.gov/protocols/oligoTMcalc.html上的公众数据库而辅助。两种寡核苷酸能够杂交的条件受许多因素的影响，包括温度，盐浓度，缓冲剂的种类，和酸度。本领域熟练技术人员完全能够选择合适的条件以确保两种寡核苷酸之间的接触在杂交条件下进行。两种单链寡核苷酸形成双螺旋时的温度被称作退火温度或融解温度。融解曲线通常是不尖锐的，表明退火在一温度范围内发生。

[0037] 本发明可按照两种基本模式进行。第一模式使用这样的反应物，其中密码子或反密码子共价连接至其所要标识的功能实体上。第二模式使用不共价连接到密码子或反密码子上的反应物。标签通过与反应物分开的实体被提供在双功能复合物的引发部位上。如果进行一轮以上，第一和第二模式可按照任何顺序结合。如果要生成不同的双功能复合物的库，那么两种模式按照两种不同的方案进行。使用第一模式制成的库可在单个容器中进行，这在本文中称作一罐合成，而根据第二模式制成的库需要分开-和-混合合成，即针对每种复合物反应和标签加入必须在不同的隔室中进行。在本发明的某些实施方案中，在涉及两种或多种反应物和化学反应部位的反应之前或之后，提供一种或多种分别编码该两种或多种反应物的标签。

[0038] 模式1：

[0039] 本发明在第一模式中涉及一种用于编码被转移至双功能复合物上的化学实体的身份的方法，所述方法包括步骤

[0040] a)提供包含反应基团和寡核苷酸标识符区域的新生双功能复合物，

[0041] b)提供包含对标识符区域足够互补从而允许杂交的寡核苷酸，可转移的功能实体，和标识该功能实体的反密码子的构件，

[0042] c)将新生双功能复合物和构件在杂交条件下混合形成杂交产物，

[0043] d)通过涉及新生双功能复合物的反应基团的反应将构件的功能实体转移至新生双功能复合物上，和

[0044] e)酶促延伸该寡核苷酸标识符区域，以得到连接到已接收该化学实体的双功能复合物上的密码子。

[0045] 本发明方法包括为被转移至复合物上的功能实体引入密码子。密码子的引入通过使用合适的酶，即对核酸有活性的酶在构件的反密码子上延伸而进行。编码区域的转录可通过酶，如聚合酶或连接酶而进行。一般来说优选使用对底物和最终产物特异性的酶，这样尽可能精确地转录反密码子。高度的特异性一般为核酸活性酶可得到，因为非特异活性可破坏活细胞存活的能力。根据本发明特别优选的酶是具有校正活性以用于精确编码但保存上游核酸碱基的聚合酶。

[0046] 酶延伸可在功能实体转移之后或同时或甚至在转移之前进行。但一般优选在转移步骤之后进行延伸步骤，这样避免酶和功能实体之间的任何可能相互作用。

[0047] 因为酶仅当标识符区域和互补性标识符区域已相互杂交形成双螺旋时进行延伸，所以确保功能实体和反应基团在给该复合物提供密码子时紧密靠近。与以前所建议的杂交方法相比，本发明的优点在于，通过非定向反应而提供功能实体的复合物不会被提供以密码子。因此，假阳性分子可由于不存在密码子而容易被检测。

[0048] 本发明还涉及一种用于得到由展示分子部分和编码部分组成的双功能复合物的方法，其中用于编码被转移至双功能复合物上的化学实体的身份的方法进一步包括步骤f)分开杂交产物的组成部分和回收该复合物。

[0049] 本发明可通过仅将单个功能实体和相应的密码子转移至新生双功能复合物上而进行。但一般来说，优选构建由两个或多个功能实体组成的展示分子。因此，在本发明优选方面，提供了一种用于得到由展示分子部分和编码部分组成的双功能复合物的方法，所述展示分子部分是功能实体和起始复合物的反应基团的反应产物，其中步骤c)至f)适当地重复。在制备双功能复合物的最终周期中，步骤f)可省去，尤其是在其中得到双链标识符寡核苷酸的情况下，因为双链核酸通常比相应的单链寡核苷酸更稳定。标识符寡核苷酸也可通过延伸过程而变成双链，其中引物被退火至该寡核苷酸的3’端和使用合适的聚合酶延伸。双链性在随后选择过程中可能是一个优点，因为单链核酸可按照一种类似于aptamers的方式进行与生物学靶的相互作用。在周期的重复过程中，以前周期中的所得双功能复合物，即已接收功能实体和密码子的新生双功能复合物，在功能实体转移和密码子引入的下一周期中用作新生双功能复合物。

[0050] 根据本方法使用的寡核苷酸具有合理的长度。因此，一般避免在已有技术(在WO00/23458中，建议使用至少220和优选420个核苷酸的寡核苷酸)中建议的长预制模板。

[0051] 本发明还涉及一种用于产生双功能复合物库的方法，包括步骤：

[0052] a)提供一种或多种不同的包含反应基团和寡核苷酸标识符区域的新生双功能复合物，

[0053] b)提供每个构件包含与标识符区域足够互补从而允许杂交的寡苷酸，可转移的功能实体，和标识该功能实体的反密码子的多个不同的构件，

[0054] c)将新生双功能复合物和多个构件在杂交条件下混合以形成杂交产物，[0055] d)通过涉及新生双功能复合物的反应基团的反应将构件的功能实体转移至新生双功能复合物上，

[0056] e)酶促延伸该寡核苷酸标识符区域，以得到连接到已接收该化学实体的双功能复合物上的密码子，

[0057] f)分开杂交产物的组分和回收复合物，

[0058] g)适当地重复步骤c)至f)一次或多次。

[0059] 与已有技术中所建议的杂交技术有关的缺点在考虑形成库时变得明显。即使两种双链寡核苷酸具有相同数目的核苷酸，也决不能确保它们具有相同的融解温度。这至少部分由于，不同的碱基对涉及不同数目的氢键(C-G对涉及三个氢键和A-T碱基对涉及两个氢键)。因此，确立用于将各种构件退火至模板的温度要兼顾避免错配和确保足够的退火。本发明意欲通过在本发明一个优选的实施方案中提供对所有构件具有类似亲和性的标识符区域而避免该缺点。

[0060] 如果使用一个以上的标识符序列，如在存在一种以上的反应基团或支架时，构件有时可被错退火至其上。但转移的功能实体实际上通过延伸过程被正确地编码在复合物上。该方案类似于自然中使用的安排：在DNA水平上允许碱基错误掺入(与构件的错配退火相比)，得到多样性，但坚持对表型的正确编码(与复合物上的正确密码子的延伸相比)。

[0061] 标识符和构件之间的退火可以是随机过程或通过标识符区域和互补性标识符区域中的序列而引导。随机过程可通过在所有的标识符区域和互补性标识符区域中使用相同的序列而实现。因此标识符和构件的混合物随机或半随机地退火并得到功能实体的独特组合。或者，随机或半随机过程可通过在与标识符核酸碱基相对的构件位置上使用通用碱基而实现，其中所述标识符核酸碱基编码特定支架或反应基团的身份。标识符寡核苷酸和构件寡核苷酸的序列可被优化以确保退火过程涉及的库中的序列以相等的退火程度组装，而与连接到构件上的功能实体无关。因此，在选择步骤中没有或较少有由于特定构件的不同的退火性能产生的偏差。另外，在每个退火步骤中和针对库中的每种杂交产物的退火过程类似性可确保为反应基团/支架同等地提供功能实体。这样提供用于转移步骤的最佳条件。

[0062] 新生双功能复合物包含寡核苷酸标识符区域和反应基团。反应基团可通过可断裂的接头连接至寡核苷酸上，允许最终反应产物与寡核苷酸分离。可存在单个反应基团或多个反应基团可作为支架的一部分而存在。支架可通过可断裂的接头连接到寡核苷酸，这样能够随后分离反应过的支架。反应基团可选自任何能够接受功能实体的基团。合适的反应基团的例子包括胺，羧酸，硫(thio)，和羟基基团。另外，新生双功能复合物的反应基团可以是在开始本发明的方法之前必需被活化的前形。新生双功能复合物也被称作生长中的复合物和表示要根据本发明方法进一步处理的起始或中间复合物。

[0063] 标识符分子的标识符区域中的核苷酸数根据标识符和构件之间的退火的强度和特异性而确定。较强的和更特异的退火过程一般使用较长的核苷酸序列而得到。通常约10-20个核苷酸足以实现特异和有效的退火。但在本发明的一些方面，该范围可以是2-1000，最优选15-30个核苷酸。

[0064] 标识符区域可在某些实施方案中包含有关新生双功能复合物的反应基团或支架的身份的信息。这些支架密码子的位置一般远离支架，这样允许在包含所要转移的功能实体和支架的部分形成稳定的双螺旋。支架密码子可具有任何长度，但一般选择为与规定功能实体的密码子相同的长度。标识符区域的后部一般提供有恒定或结合序列。结合序列在被退火至构件的合适部分上时提供酶进行延伸的底物。

[0065] 构件包含与至少一部分标识符区域足够互补从而允许杂交的寡核苷酸。构件的寡核苷酸可不完全与标识符互补，即，可允许一个或多个错配，但必须确保构件能够退火至标识符区域上。为简便起见，构件寡核苷酸的能够退火至标识符上的部分被称作互补性标识符区域。在本说明书和权利要求书中，术语杂交要理解为将两个单链寡核苷酸相互附着使得形成杂交产物的过程。

[0066] 构件还包含由寡核苷酸组成的反密码子区域。反密码子标识构件的功能实体的身份。在某些实施方案中，相同的反密码子用于编码几种不同的功能实体。在随后鉴定步骤中，展示分子的结构可根据对不同的连接化学，位阻，正交保护基团的去保护，等的认识而推断。在另一实施方案中，同一反密码子用于具有共性，如亲油性质，某些连接化学，等的一组功能实体。但在一个优选实施方案中，反密码子是独特的，即核苷酸的类似组合不出现在携带另一功能实体的另一构件上。在实际方案中，对于特定功能实体，仅使用核苷酸的单个组合。在本发明的一些方面，可有利地为相同的功能实体使用几种反密码子，其方式非常类似于自然界为单个氨基酸使用最高六个不同的反密码子。两种或多种标识相同的功能实体的反密码子可携带有关不同的反应条件的更多信息。

[0067] 各个反密码子与库中的另一反密码子的区别可仅在于单个核苷酸。但为了有助于随后解码过程，一般最好在特定的反密码子和出现在各种构件上的任何其它反密码子之间存在两个或多个错配。例如，如果选择5个核苷酸的密码子/反密码子长度，那么存在100个以上的核苷酸组合，其中出现两个或多个错配。对于密码子中的一定数目的核苷酸，一般希望优化特定密码子/反密码子相对于出现在该库中的任何其它密码子/反密码子的错配数。

[0068] 功能实体与互补性标识符区域的偶联可使用合适的偶联反应进行。本领域已知的这些反应的任何偶联反应或组合可适当地使用，这是本领域熟练技术人员所容易认识。连接至互补性标识符区域上的功能实体为优选包含至少一个反应基团从而允许键接至标识符的反应基团上的分子。

[0069] 反密码子的序列标识连接在相同的构件中的功能实体。该反密码子序列直接包括在构件序列中或例如使用聚合酶或连接酶连接到预先存在的构件上。在例如详细公开于实施例7的某些实施方案中，在实施例中被称作载体oligo的互补性标识符区域最初用各种功能实体加载。每个加载的载体oligo随后使用夹板oligo(splint oligo)连接至反密码子oligo上以组装这两个寡核苷酸。连接反应用于将所要转移的功能实体与指定功能实体的结构的反密码子连接。反密码子oligo可按照各种方式设计。通常，允许夹板退火的区域被包括在该设计中。但一些连接酶如T4RNA连接酶无需双链DNA的区段。因此，夹板和退火至夹板上的反密码子oligo的部分可在一些实施方案中可被省去。如果标识符区域包含编码支架的身份的密码子，那么反密码子oligo包含一串通用碱基，如次黄嘌呤核苷。如果与标识符区域上的结合区域互补的区域被包括在下游，那么通用碱可被省去。后一实施方案通常要求一部分标识符环出。互补性结合区域通常被选择使得聚合酶能够识别与新生双功能分子的结合区域所形成的双螺旋作为底物。反密码子合适地位于互补性结合区域的5’侧，这样它可通过延伸反应被转移至新生复合物上。合适地，设计互补性结合区域使得可鉴别出现在最后双功能复合物上的密码子序列中的特定密码子的位置。

[0070] 反密码子序列通过延伸过程被转录至标识符以形成在标识符分子上的密码子。这可通过本领域任何方法而进行，包括，但不限于，聚合酶延伸反应。聚合酶延伸反应通常需要在合适的缓冲剂中存在足够的聚合酶活性以及四种天然核苷酸三磷酸(ATP，CTP，GTP，和TTP)中的每一种。因此，当构件和标识符分子已退火并在功能实体和接受性反应基团之间进行反应时，特定反密码子的序列仅被转移至标识符上作为密码子。

[0071] 四种天然核苷酸可编码4N变型，其中N是密码子的长度。例如，如果独特密码子是5个核苷酸的长度，那么用于不同的功能实体的可能编码的数目是1024。密码子也可在每个位置上使用四种天然核苷酸的子集而设计。这可有利地与通用核酸碱基结合使用。每个构件中的反密码子为相同的构件中的功能实体编码。该序列在本发明的一个方面可通过利用功能实体引物和反密码子引物的互补性标识符区域的PCR而引入。

[0072] 构件的功能实体所起的作用是用作最终被引入展示分子中的结构实体的前体。因此，在本申请和权利要求书中，如果叙述到功能实体被转移至新生双功能复合物上，这要理解为未必该原始功能实体的所有原子会出现在最终形成的展示分子中。另外，由于该连接所涉及的反应，功能实体的结构可在它出现在新生展示分子上时被改变。尤其，导致释放功能实体的断裂作用可产生在随后步骤中可参与形成新生展示分子和功能实体之间连接的反应基团。

[0073] 构件的功能实体优选包含至少一个能够参与反应的反应基团，该反应导致构件的功能实体和携带反应基团的标识符之间的连接。出现在功能实体上的反应基团的数目合适地是1至10。以仅一个反应基团为特征的功能实体用于例如聚合物或支架的末端位置，而具有两个反应基团的功能实体适用于形成能够进一步反应的聚合物或支架的体部分。意欲用于形成连接的两个或多个反应基团通常存在于支架上。支架是核心结构，构成用于产生多个变型的基础。支架的变型形式通常通过支架的反应基团与其它功能实体的反应基团，任选地在填入基团或催化剂的媒介下反应而形成。所要连接至支架上的功能实体可包含一个，两个或几个能够形成连接的反应基团。支架的例子包括甾族，hydantions，苯并二氮杂_，等。

[0074] 构件的反应基团可以能够形成与标识符的反应基团的直接连接或构件的反应基团可以能够通过桥接填入基团而形成与标识符的反应基团的连接。可以理解，不是反应基团的所有原子必需保持在所形成的连接中。相反，反应基团要被认为是用于该连接结构的前体。

[0075] 在形成连接之后或同时，进行断裂以使功能实体转移至标识符上。断裂可按照任何合适的方式进行。在本发明的一个方面，断裂包括试剂或和酶的使用。断裂导致功能实体转移至新生双功能复合物上或导致复合物转移至构件的功能实体上。在某些情况下，可有利地通过接头断裂而引入新化学基团。新化学基团可用于在随后周期中，直接或在已被活化之后进一步反应。在其它情况下，最好在断裂之后没有留下接头的痕迹(trace)。

[0076] 另一方面，连接和断裂作为同时反应而进行，即构件的功能实体或新生展示分子是该反应的离去基团。在本发明的一些方面，优选设计该体系使得连接和断裂同时发生，因为这样可减少步骤数和复杂性。同时连接和断裂也可设计使得没有留下接头的痕迹或使得用于进一步反应的新化学基团被引入，如上所述。在本发明其它方面，优选进行分开的交联和断裂步骤，因为逐步方案能够控制每个子步骤并能够减少非特异性转移的可能性。

[0077] 优选，至少一个接头在断裂步骤之后保持完整。该至少一个接头将新生展示分子连接至编码区域上。如果该方法基本上包括功能实体至支架或正形成的聚合物上的转移，那么最终支架上的分子或聚合物可与可选择性地断裂的接头连接。可选择性地断裂的接头设计使得它在导致功能实体转移至新生模板引导的分子上的条件下不断裂。

[0078] 可断裂的接头可选自大量的化学结构。接头的例子包括，但不限于此，具有酶断裂位点的接头，包含化学可降解组分的接头，和可通过电磁辐射而断裂的接头。特别有意义的可断裂的接头目前是可通过光断裂的接头。合适的实施例包括位于展示分子和标识符区域之间的o-硝基苄基基团。

[0079] 用于根据本发明的方法使用的构件可按照该构件所涉及的特定实体而设计。例如，反密码子可用聚乙二醇(PEG)接头连接到互补性标识符区域上且功能实体可直接连接到所述互补性标识符区域上。在另一和优选的实施例中，反密码子、互补性标识符区域和功能实体是邻接的线性寡核苷酸。在本发明的某些实施方案中，构件设计使得一部分标识符环出。常常发生标识符的环出，因为构件oligo不退火至整个长度的标识符上。通常，构件设计使得它能够退火至双功能复合物的至少标识符区域上和标识符后面部分的结合区域上。互补性标识符区域和反密码子可通过单个键直接连接，通过合适的长度的PEG接头，或核酸碱基序列而连接，其中所述核酸碱基序列可或可不包含与标识符上的各种密码子和结合区域互补的核酸碱基。在本发明的某些实施方案中，构件被设计成仅退火至结合区域上，通常在与已连接展示分子的末端相对的标识符末端。在本发明的一个方面，构件和/或新生标识符由两个或多个能够相互杂交以形成杂交复合物的单独的核苷酸组成。寡核苷酸之间的间隙可使用合适的酶活性，如聚合酶和连接酶填充以合适的核苷酸，得到连贯的标识符和/或构件。

[0080] 功能实体与互补性标识符区域的连接通常通过接头而进行。优选接头将功能实体与互补性标识符区域在末端核苷酸或寡核苷酸下游一个或两个核苷酸的核苷酸处连接。功能实体的连接可处于任何可用于连接的实体上，即功能实体可连接到寡核苷酸的核苷酸的核酸碱基上，或主链上。一般来说，优选在核苷酸间键的磷上或在核酸碱基上连接功能实体。

[0081] 在本发明的某些方面，功能实体的反应基团连接到接头寡核苷酸上。反应基团优选能够通过相应的反应基团之间的直接反应或通过使用合适的填入基团而产生与新生展示分子的连接。将功能实体与接头偶联的反应基团优选在建立连接的同时被断裂。功能实体在一些情况下可包含能够在随后周期中涉及形成连接的第二反应基团。第二反应基团可在它能够参与形成连接之前需要活化。

[0082] 如果两个或多个功能实体要被转移至复合物上，密码子可被恒定区域或结合区域分开。结合区域的一个功能可以是确立一个聚合酶可在其上结合的平台。根据所形成的被编码分子，标识符可包含其它的密码子，如3，4，5，或更多的密码子。其它密码子每一个可通过合适的结合区域而分开。优选，标识符的所有的或至少大多数的密码子通过结合序列与相邻密码子分开。结合区域可具有任何合适数目的核苷酸，如1至20个。

[0083] 除了用作酶的底物，结合区域(如果有的话)可用于各种目的。在本发明的一种设置中，结合区域标识密码子的位置。通常，在密码子的上游或下游的结合区域包含允许确定密码子的位置的信息。在另一设置中，结合区域具有交替序列(alternating sequences)，允许在形成库时由两个池(pool)加入构件。另外，结合区域可调节退火温度至所需水平。

[0084] 具有高亲和性的结合区域可通过引入一个或多个与相关核酸碱基形成三个氢键的核酸碱基而提供。具有该性能的核酸碱基的例子是鸟嘌呤和胞嘧啶。作为替代方案，或在此之外，结合区域可经受主链修饰。几种主链修饰提供较高亲和性，如核糖部分的2’-O-甲基取代，肽核酸(PNA)，和也被称作LNA(锁定的核酸)的核糖部分的2’-4’O-亚甲基环化。

[0085] 标识符可包含在密码子周围的侧翼区域。侧翼区域可包括信号基团，如荧光团或放射性活性基团从而能够检测复合物的存在或不存在或侧翼区域可包含可被检测的标记，如生物素。如果标识符包含生物素部分，标识符可容易被回收。

[0086] 侧翼区域也可用作扩增反应，如PCR的引发部位。通常，在形成双功能复合物的最后周期包括引发部位的引入。双功能复合物的标识符区域通常用作另一引发部位，这样允许对双功能复合物的编码区域进行PCR扩增。

[0087] 可以理解，当术语标识符用于本说明书和权利要求书时，标识符可以是有义或反义形式，即标识符可包含实际编码该分子的密码子的序列或可以是与其互补的序列。另外，标识符可根据需要是单链或双链的。

[0088] 一般在活性反密码子之前包含一个或多个反密码子的那部分互补性标识符区域或构件寡核苷酸的设计可以是随机或半随机的且可允许与标识符区域的一个或多个错配。但尤其是当考虑库时，可有利地在与前面的密码子互补的区域中引入一个或多个非特异碱基配对的核酸碱基。非特异碱基配对的核酸碱基是当连接到主链上时能够与五种自然存在的核酸碱基(C，T，G，A，和U)中的至少两种配对的碱基。优选，此两种或多种天然核酸碱基和该非特异性碱基配对的核酸碱基之间的碱基配对基本上等能量地发生，即所形成的键具有同数量级的强度。术语“非特异性碱基配对的核酸碱基”在本文中可与术语“通用碱基”互换使用。

[0089] 在天然tRNA中，存在核酸碱基次黄嘌呤核苷。次黄嘌呤核苷具有与三种核酸碱基，即胞嘧啶，胸腺嘧啶，和腺嘌呤非特异性杂交的能力。以下描述次黄嘌呤核苷和具有与天然核酸碱基非特异性碱基配对的相同能力的其它合成化合物的例子

[0090] 通用碱基的例子

[0091]

[0092] 次黄苷 5-硝基吲哚 3-硝基吡咯 N8-8氮杂-7脱氮腺嘌呤

[0093]

[0094] MICS 5MICS PIM

[0095]

[0096] dP dK 水粉蕈素

[0097] 通用碱基在本方法中的使用在生成库方面具有优点，因为以前转移的密码子的核酸碱基可与构件的互补区上的通用碱基匹配。用过的密码子与通用碱基序列的互补使得相同的构件能够用于各种正生长的双功能复合物。

[0098] 通过延伸原理的编码也可使用三链程序进行。每个步骤涉及被杂交至功能实体载体上的组装平台分子库(图7)。组装平台包含通过标识符区域同样地结合所有的或子集的标识符分子的固定序列(互补性标识符区域)。或者，该互补性标识符序列也可以是随机或半随机的以增加该库的多样性，因为这样能够使用不同的支架分子。组装平台还包含具有特定序列的独特反密码子区域。该特定序列会退火至载体中的独特密码子区域，因此形成其中可转移的功能实体通过杂交被偶联至独特反密码子上的构件。独特反密码子和独特反密码子区域的序列被连接，这样能够在这两个序列之间直接偶联。该偶联例如在合成组装平台时得到。

[0099] 独特反密码子可与独特反密码子区域相同或可以是更短或更长的序列。但先决条件是，这两个序列(独特反密码子和独特反密码子区域)例如通过互补性标识符区域和可有可无的连接区域而相互连接。独特反密码子的序列可用于独特反密码子区域的解码。这样得到为功能实体编码的独特密码子区域。连接区域任选地是一种可变化以在功能实体和连接实体(attachment entity)之间得到最佳反应性的序列。如果聚合物使用该体系而产生，那么连接区域可通过装配周期而延伸。

[0100] 标识符展示的分子通过三链装配原理的形成在顺序步骤中进行。各个单个步骤包括将载体和标识符分子退火至组装平台上。在退火步骤之后，进行两个重要的事情：1)连接实体和功能实体之间反应以实现功能实体至标识符分子上的转移，和2)使用组装平台上的独特反密码子序列作为读取序列将独特密码子序列延伸到标识符分子中。

[0101] 按照本发明的双功能复合物库的形成可使用平台分子的固体支持物而进行，如图9和10所示。这样允许顺序转移，其中取决于特定步骤不同地加入非编码区域和互补性结合区域的组装平台分子的每个库被固定在单独的小瓶中并提供标识符和构件分子的库。在退火-反应/转移-延伸步骤之后，该库被移出(如使用升高的温度)和被转移至带有固定的组装平台库(具有附加的非编码和互补性连接区域)的另一小瓶中从而进行该过程的下一步骤。

[0102] 模式2：

[0103] 本发明在本发明的第二模式中公开了一种用于生成包含展示分子部分和编码部分的双功能复合物的方法，其中包含化学反应部位和用于酶加入标签的引发部位的新生双功能复合物在化学反应部位与一种或多种反应物反应，和使用一种或多种酶在引发部位上被提供以标识该一种或多种反应物的各自的标签。

[0104] 构件的反应性部分和编码部分之间的共价键的缺少意味着，库要通过分开-和-混合策略而制成。在第一步骤中，新生双功能复合物被分配在一个或多个分开的隔室中并随后暴露于在化学反应部位上反应的每个隔室中的反应物，和用于在引发部位上提供标识所述反应物的标签的试剂。用于提供标签的试剂包括酶和其底物。在本发明的某些实施方案中，标签通过使用聚合酶在反密码子上延伸而提供。在本发明另一实施方案中，标签通过具有有关反应物身份的密码子寡核苷酸的连接被提供在引发部位上。

[0105] 如果酶是聚合酶，底物通常是选自dATP，dGTP，dTTP，dCTP，rATP，rGTP，rTTP，rCTP，rUTP的三磷酸核苷酸的共混物。用于连接酶的底物是寡聚-和多核苷酸，即包含两个或多个核苷酸的核酸。酶连接可按照单链或双链方式进行。如果进行单链连接，第一核酸的3’OH基团被连接至第二核酸的5’磷酸基团上。双链连接使用与第一和第二核酸的3’端和5’端的一部分互补的第三寡核苷酸以帮助连接。一般，优选进行双链连接。

[0106] 在本发明一些实施方案中，使用聚合酶转录和连接偶联的组合。例如，在其它方面双链的核酸中的间隙可用聚合酶填入且连接酶可连接延伸产物至上游寡核苷酸以得到完全双链核酸。

[0107] 模式2如上所讨论的针对每种反应在单独的隔室中进行。因此，加入标签而不竞争所存在的核酸且明显减少交叉编码的可能性。标签的酶促加入可在反应之前，之后，或同时进行。在本发明的一些方面，优选将标签在反应之前加入新生双功能复合物，因为可优选应用不同于该酶所用条件的反应条件。一般，酶反应在水介质中进行，而用于某些反应的反应物和化学反应部位之间的反应受到有机溶剂的促进。得到适于两种反应的条件的合适方案是在水介质中进行酶反应，冻干和随后溶解或分散在适合在化学反应部位上发生反应的介质中。在另一方案中，冻干步骤可被省去，因为合适的反应条件可通过将溶剂加入水介质中而得到。溶剂可与水介质混溶以得到均相反应介质或不混溶以得到两相介质。

[0108] 根据第二模式的反应物可以是游离反应物或拉链构件(zipperbuilding block)。游离反应物不连接到标识反应物的另一部分的密码上。在大多数情况下，游离反应物包括包含一个，两个或多个可与化学反应部位反应的反应基团的化学结构。拉链构件是连接到化学实体上的功能实体，所述化学实体在化学反应部位的附近结合。结合性化学实体可以是在反应之前杂交至新生双功能复合物的连接部分上的寡核苷酸。杂交作用会增加功能实体和化学反应部位之间的接近度，这样降低副反应的可能性和由于高局部浓度而促进反应。

[0109] 新生双功能复合物要考虑编码方法来构建。因此，如果聚合酶用于编码，杂交区域通常被提供在接头部分。杂交区域允许包含反密码子的互补性寡核苷酸的结合区域杂交至新生双功能复合物上。结合区域用作聚合酶的结合位点，随后聚合酶可使用反密码子寡核苷酸作为模板生产延伸产物。如果连接酶用于编码，新生双功能复合物的引发部位包含一个或多个核苷酸，该连接酶可将其当作底物。在单链连接中，存在于介质中和携带有关反应基团身份的信息的寡核苷酸被连接至新生双功能分子上。双链连接要求新生双功能复合物的引发部位能够在连接之前杂交至互补性寡核苷酸上。合适地，引发部位包含一个，两个，或多个互补性寡核苷酸可与其杂交的核苷酸。此互补性寡核苷酸在另一端杂交至具有特定反应物信息的密码子寡核苷酸上。

[0110] 新生双功能复合物的接头部分可包含涉及化学反应部位的身份的信息。在适合的方案中，接头部分包含具有化学反应部位身份的信息的密码子。

[0111] 除了标识反应物的核苷酸组合，带有相关反应物的信息的寡核苷酸可包含侧翼区域。侧翼区域可用作能够杂交至新生双功能复合物上的结合区域。结合区域可设计成混杂地杂交至一个以上新生双功能复合物上。或者，编码寡核苷酸上的结合区域能够使用夹板寡核苷酸作为媒介而连接至新生双功能复合物的结合区域上。

[0112] 本发明可通过将单个反应物与新生双功能复合物反应和加入相应的标签而进行。但一般来说，优选构建包含两个或多个反应物的反应产物的展示分子。因此，在本发明的某些方面，提出了一种用于得到由展示分子部分和编码部分组成的双功能复合物的方法，所述展示分子部分是反应物和起始复合物的化学反应部位的反应产物。在本发明的一个方面，进行两种交替的平行合成，这样标签被酶连接至新生双功能复合物上，同时化学反应部位和反应物之间进行反应。在每轮中，标签的加入在反应物和化学反应部位之间的反应之后或之前。在随后的每轮平行合成中，以前反应的反应产物用作化学反应部位且被最后引入的标签提供允许标签的酶加入的引发部位。在本发明的其它方面，两个或多个标签在与各自的反应物反应之前或之后被提供。

[0113] 包含所有的标签的编码部分可通过延伸过程被转换至双链形式，其中引物被退火至寡核苷酸的3’端和使用合适的聚合酶延伸。双链性在随后选择过程过程中可能是一个优点，因为单链核酸可按照一种类似于aptamers的方式进行与生物靶的相互作用。

[0114] 在模式2的某些方面，提供了一种用于生成包含展示分子部分和编码部分的双功能复合物的库的方法。该方法包括步骤：在单独的隔室中提供分别包含化学反应部位和用于酶加入标签的引发部位的新生双功能复合物，和按照任何顺序在每个隔室中进行化学反应部位和一种或多种反应物之间的反应，和使用一种或多种酶在引发部位上加入一种或多种标识该一种或多种反应物的各自的标签。

[0115] 每个隔室中的新生双功能复合物可以是相同的或不同的。如果新生双功能复合物在化学反应部位上不同，那么新生双功能复合物合适地包含用于标识化学反应部位的结构的密码子。类似地，施用到每个隔室中的反应物可以是相同的或不同的，看情况而定。另外，每个隔室中的反应条件可以是类似的或不同的。

[0116] 通常，最好使复合物与一个以上的反应物反应。在本发明的某些方面，两个或多个隔室的内容物被合并在一起并随后为新一轮反应而分入一系列隔室中。因此，在第一轮之后的任一轮中，前一轮反应的最终产物用作新生双功能复合物以得到双功能复合物库，其中该库的每个成员包含试剂特异性反应产物和相应的标签，所述标签为已参与形成反应产物的每种反应物的身份编码。在每轮反应之间，各隔室的内容物在本发明的一个方面被混合在一起并再次分入隔室中。在本发明的其它方面，隔室的内容物在已接收密码子之后但在已发生反应之前被分入其它的隔室中，其中接收进一步的密码子并发生与已被编码的两个反应物的反应。在本发明的另一方面，在化学反应部位和反应物之间能够发生反应之前，两个以上的密码子被编码。或者，两个或多个反应可在开始用相应的标签编码之前发生。

[0117] 各个密码子与库中的另一密码子的区别可仅在于单个核苷酸。但为了便于随后解码过程，一般理想地在特定密码子和任何其它密码子之间具有两种或多种差别。例如，如果选择5个核苷酸的密码子/反密码子长度，那么存在100个以上的核苷酸组合，其中出现两个或多个差别。对于密码子中的一定数目的核苷酸，一般需要优化特定密码子/反密码子相对于出现在该库中的任何其它密码子/反密码子的差别的数目。寡核苷酸密码子可包含任何合适数目的核苷酸，如2至100，3至50，4至20或5至15个核苷酸。

[0118] 反应物可以是游离反应物或拉链构件。反应物所起的功能是用作最终被引入展示分子部分中的结构实体的前体。反应物的结构可在与化学反应部位反应之后在随后一轮中被改变。如果反应物是拉链构件，功能实体和寡核苷酸之间的键的断裂通常在反应之后进行。最后一轮是个例外，其中断裂可被省去。断裂可在与化学反应部位反应之后或同时进行。断裂可产生在随后步骤中可参与形成新生展示分子和反应物之间连接的反应基团。

[0119] 游离反应物或拉链构件的功能实体优选包含至少一个能够参与反应以导致连接至新生双功能分子的化学反应部位上的反应基团。出现在游离反应物和功能实体上的反应基团的数目合适地是1至10。以仅一个反应基团为特征的游离反应物或功能实体例如用于聚合物或支架的末端位置，而具有两个反应基团的功能实体适用于形成能够进一步反应的聚合物或支架的体部分。意欲用于形成连接的两个或多个反应基团通常存在于支架上。支架是核心结构，构成用于产生多个变型的基础。支架的变型形式通常通过支架的反应基团与其它反应物的反应基团，任选地在填入基团或催化剂的媒介下反应而形成。所要连接至支架上的功能实体或游离反应物可包含一个，两个或几个能够形成连接的反应基团。支架的例子包括甾族，hydantions，苯并二氮杂_，等。

[0120] 连接到包含拉链区域，即混杂地结合至新生双功能复合物的连接部分上的区域的核酸的游离反应物或功能实体的反应基团可以能够形成与化学反应部位的反应基团的直接连接或该反应物能够通过桥接填入基团而形成与化学反应部位的反应基团的连接。可以理解，不是反应基团的所有原子必需保持在所形成的连接中。相反，反应基团要被认为是该连接结构的前体。

[0121] 如果使用拉链构件，断裂可在形成化学反应部位和功能实体之间连接之前或同时进行。断裂可按照任何合适的方式进行。在本发明的一个方面，断裂包括试剂或酶的使用。断裂导致功能实体转移至新生双功能复合物上或导致复合物转移至拉链构件的功能实体上。在某些情况下，可有利地通过断裂而引入新化学基团。新化学基团可用于在随后周期中，直接或在已被活化之后进一步反应。在其它情况下，最好在断裂之后没有留下接头的痕迹。在本发明的一些方面，可能最好不断裂一个或多个化学键。例如，可理想地在最后一轮中保持拉链区域和功能实体之间的连接。

[0122] 在本发明的一些方面，连接和断裂作为同时的反应而进行，即拉链构件的功能实体或新生双功能复合物的化学反应部位是该反应的离去基团。在本发明的一些方面，优选设计这样的体系，该体系使得断裂同时发生，因为这样可减少步骤数和复杂性。同时连接和断裂也可设计使得没有留下接头的痕迹或使得用于进一步反应的新化学基团被引入，如上所述。在本发明其它方面，优选进行分开的交联和断裂步骤，因为逐步方案能够控制每个子步骤并能够减少非特异性转移的可能性。

[0123] 功能实体至包含拉链区域的寡核苷酸上的连接通常通过接头而进行。优选接头将功能实体与寡核苷酸在末端核苷酸或该寡核苷酸下游一个或两个核苷酸的核苷酸处连接。功能实体的连接可在任何可用于连接的实体上，即功能实体可连接到寡核苷酸的核苷酸的核酸碱基上，或主链上。一般来说，优选在核苷酸间键的磷上或在核酸碱基上连接功能实体。

[0124] 在本发明的某些方面，功能实体的反应基团任选地通过合适的间隔基而连接到寡核苷酸上。反应基团优选能够通过相应的反应基团之间的直接反应或通过使用合适的填入基团而产生与新生展示分子的连接。将功能实体与寡核苷酸偶联的反应基团优选在进行连接的同时被断裂。功能实体在一些情况下可包含能够在随后周期中参与形成连接的第二反应基团。第二反应基团可在它能够参与形成连接之前需要活化。

[0125] 优选，至少一个接头在断裂步骤之后保持完整。所述至少一个接头可将展示分子连接至编码部分，即包含一个或多个标签的部分，所述标签用于标识已参与形成展示分子的各种反应物。可想要地通过包含可选择性地断裂的接头的间隔基将展示分子部分连接至双功能复合物的编码部分上。可选择性地断裂的接头设计使得它在导致功能实体转移至化学反应部位上的条件下不断裂。

[0126] 可断裂的接头可选自大量的化学结构。接头的例子包括，但不限于此，具有酶促断裂位点的接头，包含化学可降解组分的接头，和可通过电磁辐射而断裂的接头。特别有意义的可断裂的接头目前是可通过光断裂的接头。合适的实例包括位于展示分子和双功能复合物的编码部分之间的o-硝基苄基基团。

[0127] 如果两个或多个反应物与化学反应部位反应，那么编码部分的密码子可被恒定区域或结合区域分开。结合区域的一个功能可以是确立其上酶，如聚合酶或连接酶可识别为底物的平台。根据所形成的编码分子，标识符可包含其它的密码子，如3，4，5，或更多的密码子。其它密码子分别可通过合适的结合区域而分开。优选，标识符的所有的或至少大多数的密码子通过结合序列与相邻密码子分开。结合区域可具有任何合适数目的核苷酸，如1至20个。

[0128] 除了用作酶的底物，结合区域(如果有)可用于各种目的。在本发明的一种设置中，结合区域标识密码子的位置。通常，在密码子的上游或下游的结合区域包含允许确定密码子的位置的信息。在另一设置中，结合区域具有交替序列，允许在形成库时由两个池加入构件。另外，结合区域可调节退火温度至所需水平。

[0129] 具有高亲和性的结合区域可通过引入一个或多个与相关的核酸碱基形成三个氢键的核酸碱基而提供。具有该性能的核酸碱基的例子是鸟嘌呤和胞嘧啶。作为替代方案，或在此之外，连接区域可经受主链修饰。几种主链修饰提供较高亲和性，如核糖部分的2’-O-甲基取代，肽核酸(PNA)，和也被称作LNA(锁定的核酸)的核糖部分的2’-4’O-亚甲基环化。

[0130] 标识符可包含在密码子周围的侧翼区域。侧翼区域可包括信号基团，如荧光团或放射性活性基团从而能够检测复合物的存在或不存在或侧翼区域可包含可被检测的标记，如生物素。如果标识符包含生物素部分，标识符可容易被回收。

[0131] 侧翼区域也可用作扩增反应，如PCR的引发部位。通常，在形成双功能复合物的最后周期包括引发部位的引入。双功能复合物的靠近展示分子的区域，如展示分子和为支架分子编码的密码子之间的核酸序列，通常用作另一引发部位，这样允许对双功能复合物的编码区域进行PCR扩增。

[0132] 模式1和模式2的结合：

[0133] 在本发明的某些方面中，结合上述的模式1和模式2，即不同的反应物用于不同的轮。另外在模式1和模式2内，不同的构件可用于不同的轮。

[0134] 在形成库时，可有利地使用一罐合成技术(模式1)和分开-和-混合技术(模式2)的联合，因为模式1和模式2分别具有其优点。一罐技术提供在反应之前使反应基团紧密靠近的可能性，因此得到高局部浓度和具有单个容器的便利。分开和混合技术提供具有游离反应物和非杂交反应条件的可能性，提供通用的反应。可合适地参照图15，其中显示各种单编码酶方法。分开-和-混合合成技术一般用于反应物/功能实体和密码子/反密码子之间不具有共价连接的反应物，即游离反应物和拉链构件。一罐合成技术一般用于其中在功能实体和标识所述功能实体的密码子/反密码子之间存在共价连接的反应物，即E2构件，环形构件，和N构件。

[0135] 在本发明的某些实施方案中，双功能复合物的中间体库使用一罐合成技术而生成。该中间体库随后用于通过分开-和-混合合成而生成最终库。中间体库可使用单轮或多轮一罐合成而生成且最终库可采用单轮或多轮分开-和-混合而制成。分开-和-混合合成在最后一轮库生成中的应用为最终反应物提供使用与维持杂交不相容的反应介质，如高离子强度或有机溶剂的可能性。

[0136] 在另一实施方案中，中间体库使用分开和混合合成技术而制成。中间体库用于使用一罐合成技术生成最终库。中间体库可使用单轮或多轮分开-和-混合合成而制成而最终库可采用一轮或多轮一罐合成而制造。最后一轮的一罐合成在生长中的被编码分子和功能实体之间提供紧密接近。这种紧密接近度导致高局部浓度，即使对于具有较低反应倾向的反应物也促进反应。

[0137] 多编码(multiple encoding)

[0138] 多编码意味着，两种或多种密码子在化学反应部位和两种或多种反应物之间的反应之前或之后被提供在标识符中。多编码具有各种优点，例如可使反应的范围更宽，因为许多化合物只能通过三(或更多)种组分反应而合成，这是由于第一反应物和化学反应部位之间的中间体不是稳定的。其它优点涉及有机溶剂的使用和两种或多种游离反应物在某些实施方案中的可得性。

[0139] 因此在本发明的某些方面，本发明涉及一种用于得到包含展示分子部分和编码部分的双功能复合物的方法，其中展示分子通过将化学反应部位与两种或多种反应物反应而制成且编码部分包含用于标识反应物的标签。

[0140] 在本发明的某些方面，第一反应物在与化学反应部位反应后形成中间体产物且第二反应物与该中间体产物反应得到展示分子或其前体。在本发明的另一方面，两种或多种反应物相互反应形成中间体产物且化学反应部位与该中间体产物反应得到展示分子或其前体。中间体产物可通过将两种或多种反应物分开地反应并随后在随后步骤中将中间体产物与化学反应部位反应而得到。在一个单独步骤中进行的反应物的反应提供使用其中标签不能经受的条件的可能性。因此，如果编码部分包含核酸，反应物之间的反应可在本来会降解核酸的条件下进行。

[0141] 反应可按照以下给出的方案进行。该方案给出了一个例子，其中连接到化学反应部位上的用于两种反应物和化学反应部位(支架)的标识标签被提供在分开的隔室中。这些隔室被排列成阵列，如微量滴定板，允许不同的酰基化剂和不同的烷基化剂进行任何组合。

[0142] 起始情形：

[0143]

[0144] X表示化学反应部位如支架。

[0145] 两种反应物按照任何组合单独地相互反应或随后按照编码部分的标签加入每个隔室中或反应物可按照任何顺序加入每个隔室中以允许直接反应。以下方案显示反应的结果。

[0146] 产物板

[0147]

[0148] 例如，XA2表示处于其最终状态的展示分子XA2，即由片段X，A和2完全组装。

[0149] 包含两个或多个用于标识反应物的标签的编码部分可按照任何合适的方式在反应前或后制备。在本发明的一个方面，每个编码部分通过标准亚磷酰胺化学而合成。在另一方面，标签被预先制备并通过化学或酶连接而组装到最终编码部分中。

[0150] 化学连接存在各种可能性。合适的例子包括

[0151] a)第一寡核苷酸末端包含3’-OH基团和第二寡核苷酸末端包含5’-磷酸-2-咪唑基团(5′-phosphor-2-imidazole group)。反应时，形成磷酸二酯核苷间键，[0152] b)第一寡核苷酸末端包含处于3’-端的磷酸imidazolide基团和处于5’-端的磷酸imidazolide基团。如果在一起反应，形成磷酸二酯核苷间键，

[0153] c)第一寡核苷酸末端包含3’-硫代磷酸酯基团和第二寡核苷酸包含5’-碘。如果两个基团反应，形成3’-O-P(＝O)(OH)-S-5’核苷间键，和

[0154] d)第一寡核苷酸末端包含3’-硫代磷酸酯基团和第二寡核苷酸包含5’-甲苯磺酸酯。反应时，形成3’-O-P(＝O)(OH)-S-5’核苷间键。

[0155] 合适地，标签有效地连接在一起，这样核酸活性酶能够识别连接区域为底物。显然，在一个优选实施方案中，进行连接使得聚合酶能够识别连接链作为模板。因此，在优选方面，用于偶联步骤的化学反应策略一般包括磷酸二酯核苷间键的形成。按照该方面，以上的方法a)和b)是优选的。

[0156] 在另一方面，如果连接酶用于连接，合适的例子包括Taq DNA连接酶，T4 DNA连接酶，T7 DNA连接酶，和大肠杆菌DNA连接酶。对连接酶的选择在一定程度上取决于所要连接在一起的末端的设计。因此，如果末端是平端，T4 DNA连接酶可以是优选的，而对于粘性末端连接，即其中每端上的突出端是互补性的连接，Taq DNA连接酶可以是优选的。

[0157] 在本发明的某些方面，酶编码由于酶所提供的特异性而优选。图17公开了用于酶编码双功能分子的编码部分中的两种或多种反应物的方法。对编码方法的选择取决于各种因素，如对游离反应物的需求，对接近度的需求，和对便利性的需求。图17所示的酶双编码方法可容易地扩展至三，四，等编码。

[0158] 按照某些实施方案，功能实体连接到标识标签上，和每个功能实体携带一个或多个反应基团。所有的功能实体相互反应，生成包含与功能实体一样多的标签的最终产物。标签可通过分子间反应或结合作用随后断裂两个接头而合并成单个编码部分(通常寡核苷酸)，如下所示：

[0159]

[0160] 粗线表示标签。细线表示接头或键。“*”表示引发部位。在本发明的一些方面，X被认为是化学反应部位。

[0161] 在以上实施方案的一个方面，标签是寡核苷酸，它们通过化学连接或酶催化连接而结合在一起。

[0162] 或者，标签在功能实体反应之前被偶联。在该过程中，功能实体从其标签上断裂或随后断裂。如

[0163]

[0164] 以上示意表示化的一个实施方案包括，如果标签是核苷酸，标签通过化学连接或酶催化连接而组合。

[0165] 实施例9说明一种多组分反应，其中使用三重编码。因此在三种游离反应物与化学反应部位反应之后，编码部分通过酶连接而提供三种标识性标签。

[0166] 能够转移功能实体的构件。

[0167] 以下部分描述能够将功能实体转移至双功能复合物的反应基团上的示例性构件的形成和使用。粗线表示寡核苷酸。

[0168] A.酰基化反应

[0169] 形成酰基化构件的总体路线和这些构件的用途：

[0170]

[0171] N-羟基马来酰亚胺(1)可通过使用酰氯如乙酰氯而酰化或在如THF中通过使用二环己基碳二亚胺或二异丙基碳二亚胺和酸如乙酸而酰化。中间体可通过使用过量1，3-丙烷二硫醇而进行Michael加成，随后与4，4’-二吡啶基二硫化物或2，2′-二吡啶基二硫化物反应。该中间体(3)可随后被加载到携带硫醇把手(handle)的寡核苷酸上，得到构件(4)。显然，中间体(2)可使用不是二硫键的另一键，如酰胺键而连接到寡核苷酸上和N-羟基马来酰亚胺可使用各种间隔基而与寡核苷酸隔离。

[0172] 构件(4)可与包含受体胺基团的标识符寡核苷酸如通过以下步骤而反应：构件(4)(1nmol)与氨基-寡核苷酸(1nmol)在hepes-缓冲剂(20pL 100mM hepes和1M NaCl溶液，pH＝7.5)和水(39μL)中混合。寡核苷酸通过加热至50摄氏度和冷却(2摄氏度/秒)至30摄氏度而退火在一起。混合物随后处于波动温度下(10摄氏度1秒，随后35摄氏度1秒)过夜，得到产物(5)。

[0173] 更一般地说，下示的构件能够将化学实体(CE)转移至受体亲核基团，通常是胺基团。粗体的下方水平线说明构件和垂直线说明间隔基。5-元取代的N-羟基琥珀酰亚胺(NHS)环用作活化剂，即在连接到NHS环上的氧原子和化学实体之间形成不稳定键。该不稳定键可通过如位于支架上的亲核基团而断裂

[0174]

[0175] 可形成酰胺键的另一构件是

[0176]

[0177] R可不存在或是NO2，CF3，卤素，优选Cl，Br，或I，和Z可以是S或O。这种类型的构件公开于丹麦专利申请No.PA 2002 0951和US临时专利申请(2002年12月20日递交，题为“能够将功能实体转移至接受性反应基团上的构件”)。这两篇专利申请的内容在此作为参考完全并入本发明。

[0178] 亲核基团可断裂Z和羰基基团之间的键，这样将化学实体-(C＝O)-CE’转移至所述亲核基团上。

[0179] B.烷基化

[0180] 形成烷基化/乙烯基化构件的总体路线和这些构件的用途：

[0181] 烷基化构件可具有以下一般结构：

[0182]

[0183] R1＝H，Me，Et，iPr，Cl，NO2

[0184] R2＝H，Me，Et，iPr，Cl，NO2

[0185] R1和R2可用于调整硫酸酯的反应性以使反应性合适。氯和硝基取代可增加反应性。烷基基团可降低反应性。硫酸酯上的邻位取代基由于空间原因而引导进入的亲核试剂选择性地进攻R-基团和避免进攻硫。

[0186] 以下描述形成烷基化构件和转移功能实体的一个例子：

[0187]

[0188] 3-氨基苯酚(6)用马来酸酐处理，随后用酸如H2SO4或P2O5处理并加热得到马来酰亚胺(7)。马来酰亚胺的闭环作用也可在以下情况下实现：使用酸稳定的O-保护基团时，通过用Ac2O处理(加热或不加热)，随后O-去保护。或者，在Ac2O中回流，随后在热水/二噁烷中O-脱乙酰化，得到(7)。

[0189] 用SO2Cl2，在有或没有三乙基胺或碳酸钾的情况下在二氯甲烷或更高沸点的溶剂中进一步处理(7)，得到中间体(8)，后者可被分离或通过用合适的醇(在这种情况下，MeOH)淬灭而直接进一步转化成芳基烷基硫酸酯，这样形成(9)。

[0190] 有机部分(9)可连接至寡核苷酸上，如下：将携带硫醇的寡核苷酸在缓冲剂50mM MOPS或hepes或磷酸盐(pH 7.5)中用有机构件(9)在DMSO或DMF中的1-100mM溶液和优选7.5mM溶液处理，使得DMSO/DMF浓度是5-50％，和优选10％。该混合物在25摄氏度下放置1-16h和优选2-4h，得到烷基化剂(在这种情况下，甲基化构件(10))。

[0191] 烷基化构件(10)与带有胺的新生双功能复合物的反应可进行如下：将双功能复合物(1nmol)与构件(10)(1nmol)在hepes-缓冲剂(20μL100mM hepes和1M NaCl溶液，pH＝7.5)和水(39μL)中混合。寡核苷酸通过加热至50摄氏度和冷却(2摄氏度/秒)至30摄氏度而相互退火。混合物随后处于波动温度(10摄氏度1秒，随后35摄氏度1秒)过夜(o/n)，得到甲基胺反应产物(11)。

[0192] 更一般地说，能够将化学实体转移至接受性反应基团上以形成单键的构件是[0193]

[0194] 接受基团可以是亲核试剂，如包含杂原子的基团，这样形成化学实体和杂原子之间的单键，或接受基团可以是电负性碳原子，这样形成化学实体和支架之间的C-C键。

[0195] C.乙烯基化反应

[0196] 乙烯基化构件可类似于以上烷基化构件所述而制备和使用。尽管不将氯磺酸酯(以上的8)与醇反应，将中间体氯硫酸酯分离并用烯醇化物或O-三烷基甲硅烷基烯醇化物在存在或不存在氟化物的情况下处理。例如

[0197]

[0198] 示例性乙烯基化构件(13)的形成：

[0199] 将携带硫醇的寡核苷酸在缓冲剂50mM MOPS或hepes或磷酸盐(pH7.5)中用有机部分(12)在DMSO或DMF中的1-100mM溶液和优选7.5mM溶液处理，使得DMSO/DMF浓度是5-50％，和优选10％。将该混合物在25摄氏度下放置1-16h和优选2-4h，得到乙烯基化构件(13)。

[0200] 磺酰基烯醇化物(13)可用于与携带胺的支架反应得到烯胺(14a和/或14b)或如与碳负离子反应得到(15a和/或15b)。如

[0201]

[0202] 乙烯基化构件(13)和携带胺或硝基烷基的标识符的反应可进行如下：

[0203] 氨基-寡核苷酸(1nmol)或硝基烷基-寡核苷酸(1nmol)标识符与构件(1nmol)(13)在0.1M TAPS，磷酸盐或hepes-缓冲剂和300mMNaCl溶液(pH＝7.5-8.5和优选pH＝8.5)中混合。寡核苷酸通过加热至50摄氏度和冷却(2摄氏度/秒)至30摄氏度而退火至模板上。混合物随后处于波动温度(10摄氏度1秒，随后35摄氏度1秒)过夜，得到反应产物(14a/b或15a/b)。上述烷基和乙烯基硫酸酯的替代物可以是一样有效的磺酸酯如(31)(但R″是烷基或乙烯基)，可用作烷基化和乙烯基化剂，所述(31)如下所述由(28，其中苯基基团被烷基基团取代)和(29)制备。

[0204] 以下给出能够通过将化学实体转移至受体醛基团上而形成双键的另一构件。醛的碳和化学实体之间的双键通过该反应而形成。

[0205]

[0206] 以上构件包括在丹麦专利专利申请No.DK PA 2002 01952和US临时专利申请(2002年12月20日递交，题为“能够将功能实体转移至接受性反应基团上以形成C＝C双键的构件”)中。这两篇专利申请的内容在此作为参考完全并入本发明。

[0207] D.链烯基化(Alkenylidation)反应

[0208] 形成Wittig和HWE构件的总体路线和这些构件的使用：

[0209] 市售化合物(16)可通过标准方式，即DCC或DIC偶联而被转化成NHS酯(17)。将携带胺的寡核苷酸在缓冲剂50mM MOPS或hepes或磷酸盐(pH 7.5)中用有机化合物在DMSO或DMF中的1-100mM溶液和优选7.5mM溶液处理，使得DMSO/DMF浓度是5-50％，和优选10％。

[0210] 将该混合物在25摄氏度下放置1-16h和优选2-4h，得到膦键接的前体构件(18)。该前体构件通过加入合适的烷基卤化物，如N，N-二甲基-2-碘乙酰胺(作为在DMSO或DMF中的1-100mM和优选7.5mM溶液，使得DMSO/DMF浓度是5-50％，和优选10％)而进一步转化。该混合物在25摄氏度下放置1-16h和优选2-4h，得到构件(19)。作为一种替代方式，有机化合物(17)可用烷基卤化物进行P-烷基化并随后偶联到携带胺的寡核苷酸上，得到(19)。

[0211] 携带醛的标识符(20)可通过4-甲酰基苯甲酸的NHS酯和携带胺的寡核苷酸之间使用类似于上述的条件进行反应而形成。标识符(20)与(19)在稍微碱性的条件下反应，得到烯烃(21)。

[0212]

[0213] 单体构件(19)和标识符(20)的反应可进行如下：标识符(20)(1nmol)与构件(19)(1nmol)在0.1M TAPS，磷酸盐或hepes-缓冲剂和1M NaCl溶液(pH＝7.5-8.5和优选pH＝8.0)中混合。将反应混合物在35-65摄氏度优选58摄氏度下放置过夜，得到反应产物(21)。

[0214] 作为(17)的替代，可使用膦酸酯(24)。它们可通过二乙基氯亚磷酸酯(22)和合适的携带羧基的醇之间的反应而制成。羧酸随后转化成NHS酯(24)并可采用上述的方法或替换物。尽管不是简单的P-烷基化，亚磷酸酯可经历Arbuzov′s反应和产生膦酸酯。构件(25)的益处在于，它比其磷鎓对应物(19)更具反应性。

[0215]

[0216] E.过渡金属催化的芳基化，杂芳基化(hetaylation)和乙烯基化反应

[0217] 能够转移芳基，杂芳基(hetaryl)或乙烯基官能度的亲电性构件(31)可由有机化合物(28)和(29)通过使用用于马来酰亚胺衍生物偶联至上述携带SH的寡核苷酸上的步骤而制成。替代马来酰亚胺，NHS-酯衍生物可由如羧基苯磺酸衍生物制备，通过将这些偶联至胺携带性寡核苷酸上而使用。(28)和(29)的R-基团用于调节磺酸酯的反应性以得到合适的反应性。

[0218] 过渡金属催化交叉偶联可进行如下：将1.4mM Na2PdCl4和2.8mMP(p-SO3C6H4)3在水中放置15min的预混物加入标识符(30)和构件(3)(都是1nmol)在0.5M NaOAc缓冲剂(pH＝5)和75mM NaCl(最终[Pd]＝0.3mM)中的混合物中。混合物随后被放置在35-65摄氏度优选58摄氏度过夜，得到反应产物(32)。

[0219]

[0220] R″＝芳基、杂芳基(hetaryl)或乙烯基

[0221] 能够转移芳基，杂芳基(hetaryl)或乙烯基官能度的相应的亲核单体构件可由种类(35)的有机化合物制备。这可通过将烃基代硼酸用二醇如(33)酯化，随后转化成NHS-酯衍生物而实现。NHS-酯衍生物可随后通过使用用于将NHS-酯衍生物偶联至胺携带性寡核苷酸上的上述步骤而被偶联至寡核苷酸上，生成构件类型(37)。或者，马来酰亚胺衍生物可如上所述制备并加载到携带SH的寡核苷酸上。

[0222] 过渡金属催化交叉偶联进行如下：

[0223] 将1.4mM Na2PdCl4和2.8mM P(p-SO3C6H4)3在水中放置15min的预混物加入标识符(36)和构件(37)(都是1nmol)在0.5M NaOAc缓冲剂(pH＝5)和75mM NaCl(最终[Pd]＝0.3mM)中的混合物。混合物随后放置在35-65摄氏度优选58摄氏度下过夜，得到模板结合的(38)。

[0224]

[0225] R＝芳基，hetaryl或乙烯基

[0226] F.烯胺和烯醇醚单体构件的反应

[0227] 加载有烯胺和烯醇醚的构件可制备如下：

[0228] 对于Z＝NHR(R＝H，烷基，芳基，杂芳基(hetaryl))，2-巯基乙基胺可与二吡啶基二硫化物反应生成活化二硫化物(40)，后者可随后在脱水条件下缩合至酮或醛上，生成烯胺(41)。对于Z＝OH，2-巯基乙醇与二吡啶基二硫化物反应，随后O-甲苯磺酰基化(Z＝OTs)。甲苯磺酸酯(40)可随后直接与烯醇化物或在氟化物的存在下与O-三烷基甲硅烷基烯醇化物反应，生成烯醇化物(41)。

[0229] 烯胺或烯醇化物(41)可随后如上所述偶联到携带SH的寡核苷酸上，得到构件(42)。

[0230]

[0231] 构件(42)可与羰基携带性标识符寡核苷酸如(44)或与烷基卤化物携带性寡核苷酸如(43)反应如下：

[0232] 构件(42)(1nmol)与标识符(43)(1nmol)在50mM MOPS，磷酸盐或hepes-缓冲剂缓冲剂和250mM NaCl溶液(pH＝7.5-8.5和优选pH＝7.5)中混合。反应混合物在35-65摄氏度优选58摄氏度下放置过夜或处于波动温度(10摄氏度1秒，随后35摄氏度1秒)，得到反应产物(46)，其中Z＝O或NR。对于其中Z＝NR的化合物，可采用稍微酸性的条件以得到产物(46)，其中Z＝O。

[0233] 构件(42)(1nmol)与标识符(44)(1nmol)在0.1M TAPS，磷酸盐或hepes-缓冲剂缓冲剂和300mM NaCl溶液(pH＝7.5-8.5和优选pH＝8.0)中混合。反应混合物在35-65摄氏度优选58摄氏度下放置过夜或处于波动温度(10摄氏度1秒，随后35摄氏度1秒)，得到反应产物(45)，其中Z＝O或NR。对于其中Z＝NR的化合物，可采用稍微酸性的条件以得到产物(45)，其中Z＝O。

[0234]

[0235] 烯醇醚种类(13)可经历有或没有催化的环加成。类似地，二烯醇醚可例如通过(8)与α，β-不饱和酮或醛的烯醇化物或三烷基甲硅烷基烯醇化物(在氟化物的存在下)反应生成(47)而制备或使用，(47)可被加载到携带SH的寡核苷酸上，生成单体构件(48)。

[0236]

[0237] 二烯(49)，烯(50)和1，3-偶极子(1，3-dipole)(51)可通过携带氨基的寡核苷酸和相应的有机化合物的NHS-酯之间的简单反应而形成。(13)或(31，R″＝乙烯基)与二烯如(49)反应生成(52)或与如1，3-偶极子(1，3-dipole)(51)反应生成(53)以及(48)或(31，R″＝二烯基)与烯如(50)反应生成(54)，可进行如下：

[0238] 构件(13)或(48)(1nmol)与标识符(49)或(50)或(51)(1nmol)在50mM MOPS，磷酸盐或hepes-缓冲剂缓冲剂和2.8M NaCl溶液(pH＝7.5-8.5和优选pH＝7.5)中混合。反应混合物在35-65摄氏度优选58摄氏度下放置过夜或处于波动温度(10摄氏度1秒，随后35摄氏度1秒)，分别生成模板结合的(52)，(53)或(54)。

[0239]

[0240] 交联断裂构件

[0241] 可有利地将化学实体至接受性反应基团上的转移分成两个不同的步骤，即交联步骤和断裂步骤，因为每个步骤可被优化。以下示例给出适用于这种两个步骤过程的构件：

[0242]

[0243] 起始，出现在功能实体前体(简称FEP)上的反应基团与接受性反应基团，如出现在支架上的反应基团反应，这样形成交联。随后，通常通过加入含水氧化剂如I2，Br2，Cl2，+H，或Lewis酸而进行断裂。断裂导致基团HZ-FEP-转移至受体部分，如支架上。

[0244] 在以上结构式中

[0245] Z是O，S，NR4

[0246] Q是N，CR1

[0247] P是价键，O，S，NR4，或基团C5-7亚芳基，C1-6亚烷基，C1-6O-亚烷基，C1-6S-亚烷基，1 4 5
NR-亚烷基，C1-6亚烷基-O，C1-6亚烷基-S(任选地，所述基团被0-3个R，0-3个R 和0-3
9 4 4 8 4 8
个R 取代)或C1-C3亚烷基-NR2，C1-C3亚烷基-NRC(O)R，C1-C3亚烷基-NRC(O)OR，C1-C2
4 4 8 4 8 9
亚烷基-O-NR2，C1-C2亚烷基-O-NRC(O)R，C1-C2亚烷基-O-NRC(O)OR(被0-3个R 取代)，[0248] B是包含D-E-F的基团，其中

[0249] D是价键或基团C1-6亚烷基，C1-6亚链烯基，C1-6亚炔基，C5-7亚芳基，或C5-7亚杂芳11
基，所述基团任选地被1至4个基团R 取代，

[0250] E是，如果存在的话，价键，O，S，NR4，或基团C1-6亚烷基，C1-6亚链烯基，C1-6亚炔基，11
C5-7亚芳基，或C5-7亚杂芳基，所述基团任选地被1至4个基团R 取代，

[0251] F是，如果存在的话，价键，O，S，或NR4，

[0252] A是使化学结构离开互补性成分的间隔基团，可以是核酸，

[0253] R1，R2，和R3相互独立地选自H，C1-C6烷基，C2-C6链烯基，C2-C6炔基，C4-C8链二烯4 5
基，C3-C7环烷基，C3-C7环杂烷基，芳基，和杂芳基，所述基团被0-3个R，0-3个R 和0-3个
9 4 4 8 4 8
R 取代，或C1-C3亚烷基-NR2，C1-C3亚烷基-NRC(O)R，C1-C3亚烷基-NRC(O)OR，C1-C2亚
4 4 8 4 8 9
烷基-O-NR2，C1-C2亚烷基-O-NRC(O)R，C1-C2亚烷基-O-NRC(O)OR(被0-3个R 取代)，[0254] FEP是基团选自H，C1-C6烷基，C2-C6链烯基，C2-C6炔基，C4-C8链二烯基，C3-C7环烷
4 5 9
基，C3-C7环杂烷基，芳基，和杂芳基(所述基团被0-3个R，0-3个R 和0-3个R 取代)或
4 4 8 4 8 4
C1-C3亚烷基-NR2，C1-C3亚烷基-NRC(O)R，C1-C3亚烷基-NRC(O)OR，C1-C2亚烷基-O-NR2，
4 8 4 8 9
C1-C2亚烷基-O-NRC(O)R，C1-C2亚烷基-O-NRC(O)OR(被0-3个R 取代)，

[0255] 其中R4是H或独立地选自C1-C6烷基，C2-C6链烯基，C2-C6炔基，C3-C7环烷基，C3-C79
环杂烷基，芳基，杂芳基，所述基团被0-3个R 取代和

[0256] R5 独立地选自 -N3，-CNO，-C(NOH)NH2，-NHOH，-NHNHR6，-C(O)6 6 6 6
R，-SnR3，-B(OR)2，-P(O)(OR)2或选自C2-C6链烯基，C2-C6炔基，C4-C8链二烯基(所述基
7
团被0-2个R 取代)。

[0257] 其中R6独立地选自H，C1-C6烷基，C3-C7环烷基，芳基或C1-C6亚烷基-芳基(被7 6 6
0-5个选自F，-Cl，-Br，和-I的卤素原子取代)；和R 独立地选自NO2，-COOR，-COR，-CN，
6 6 6
-OSiR3，-OR 和-NR2。

[0258] R8是H，C1-C6烷基，C2-C6链烯基，C2-C6炔基，C3-C7环烷基，芳基或C1-C6亚烷基-芳3 3 3
基(被0-3个独立地选自-F，-Cl，-NO2，-R，-OR，-SiR3的取代基取代)

[0259] R9 是＝ O，-F，-Cl，-Br，-I，-CN，-NO2，-OR6，-NR62，-NR6-C(O)R8，-NR6-C(O)8 6 6 6 6 6 6
OR，-SR，-S(O)R，-S(O)2R，-COOR，-C(O)NR2和-S(O)2NR2。

[0260] 在一个优选实施方案中，z是O或S，P是价键，Q是CH，B是CH2，和R1，R2，和R3是H。羰基基团和Z之间的键可用含水I2断裂。

[0261] 可断裂的接头

[0262] 可断裂的接头可位于靶和固体支持物之间或可能的药物候选物和标识符区域之间或任何可确保包含来自成功复合物的密码子的核酸序列与非特异性结合复合物分离的其它位置。可断裂的接头可以是可选择性地断裂的，即可选择仅断裂特定接头的条件。

[0263] 可断裂的接头可选自大量的化学结构。接头的例子包括，但不限于此，具有酶切割位点的接头，包含化学可降解组分的接头，可通过电磁辐射断裂的接头。

[0264] 可通过电磁辐射(光)断裂的接头的例子

[0265] o-硝基苄基 p-烷氧基

[0266]

[0267] 处于外位(exo position)上的o-硝基苄基

[0268]

[0269] 更详细内容参见Holmes CP.J.Org.Chem.1997，62，2370-23803-硝基苯基氧基[0270]

[0271] 更详细内容参见 Rajasekharan Pillai，V.N.Synthesis.1980，1-26

[0272] 丹磺酰衍生物：

[0273]

[0274] 更详细内容参见Rajasekharan Pillai，V.N.Synthesis.1980，1-26

[0275] 香豆素衍生物

[0276]

[0277] 更详细内容参见R.O.Schoenleber，B.Giese.Synlett 2003，501-5041 2 1 2

[0278] R 和R 可分别是可能的药物候选物和标识符。或者，R 和R 可分别是靶或固体载体。3

[0279] R ＝H或OCH3

[0280] 如果X是O，那么产物可以是羧酸

[0281] 如果X是NH，产物可以是甲酰胺

[0282] 一个具体例子是PC Spacer亚磷酰胺(Glen research目录#10-4913-90)，它可在合成过程中被引入寡核苷酸中和通过将样品在水中经受UV光(约300-350nm)30秒至1分钟而断裂。

[0283]

[0284] DMT＝4，4′-二甲氧基三苯甲基

[0285] iPr＝异丙基

[0286] CNEt＝氰基乙基

[0287] 以上PC Spacer亚磷酰胺在标识符和可能的药物候选物之间的位置上被合适地引入复合物库中。此间隔基可根据以下反应而断裂。

[0288]

[0289] R1和R2可分别是被编码分子和标识分子中之一。在优选方面，R2是寡核苷酸标识1
符和R 是可能的药物候选物。如果接头被断裂，那么生成磷酸酯基团以允许进一步生物学反应。例如，磷酸酯基团可位于寡核苷酸的5’端以允许进行酶连接过程。

[0290] 可通过化学剂而断裂的接头的例子：

[0291] 酯接头可通过使用如氢氧离子亲核攻击而断裂。实际上，这通过将靶-配体复合物短时间暴露于碱而实现。

[0292]

[0293] R1和R2可分别是可能的药物候选物或标识符中的一种。R4-6可以是任何以下基团：H，CN，F，NO2，SO2NR2。

[0294] 二硫化物接头可有效地通过三(2-羧基乙基)膦(TCEP)而断裂/还原。TCEP在宽pH范围内选择性地和完全还原甚至最稳定的水溶性烷基二硫化物。这些还原作用在室温下往往需要不足5分钟。TCEP是一种非挥发性和无味还原剂和不同于大多数其它还原剂，它耐受空气氧化。三烷基膦如TCEP在水溶液中稳定，选择性地还原二硫键，和基本上对通常存在于蛋白质中的其它官能团不起反应。

[0295]

[0296] 二硫键还原的更多细节可参见Kirley，T.L.(1989)，用于随后结构分析的含半胱氨酸的蛋白质的还原和荧光标记，Anal.Biochem.180，231和Levison，M.E.，等人(1969)，水溶性膦对生物物质的还原：γ-球蛋白，Experentia 25，126-127。

[0297] 可通过酶而断裂的接头

[0298] 连接可能的药物候选物与标识符或固体支持物和靶的接头可包括能够使用蛋白酶进行特异性切割的肽区域。这在分子生物学中是一种熟知的技术。位点特异的蛋白酶和其同类的靶氨基酸序列常用于去除有助于增加融合蛋白质的表达，溶解度，分泌或纯化的融合蛋白质标签。

[0299] 各种蛋白酶可用于实现特异断裂。如果断裂位点与其它序列例如融合蛋白一起被提供，该特异性是尤其重要的。各种条件已被优化以增加断裂效率和控制特异性。这些条件是本领域可得的或已知的。

[0300] 肠激酶是能够切割特定氨基酸序列的酶(丝氨酸蛋白酶)的一个例子。肠激酶识别位点是Asp-Asp-Asp-Asp-Lys(DDDDK)，它在Lys的C-端切割。纯化重组物肠激酶是市售和在宽范围的pH(pH 4.5-9.5)和温度(4-45摄氏度)下有高度活性。

[0301] 来自烟草刻蚀病毒(TEV)的核内包涵体蛋白酶是可用于在特异氨基酸序列上切割的另一市售和得到很好表征的蛋白酶。TEV蛋白酶以高特异性在Gln-Gly或Gln-Ser之间断裂序列Glu-Asn-Leu-Tyr-Phe-Gln-Gly/Ser(ENLYFQG/S)。

[0302] 另一熟知的蛋白酶是在 Arg-Gly 之间特异地断裂序列Leu-Val-Pro-Arg-Gly-Ser(LVPAGS)的凝血酶。凝血酶还用于重组物融合蛋白的断裂。其它序列也可用于凝血酶断裂；这些序列或多或少是特异性的且或多或少通过凝血酶有效地断裂。凝血酶是一种高度活性蛋白酶且各种反应条件为公众所已知。

[0303] 活化的凝血因子FX(FXa)也是一种已知的特异性和有用的蛋白酶。该酶断裂序列Ile-Glu-Gly-Arg(IEGR)上的Arg的C-端。如果用重组物技术生产蛋白质，FXa常用于融合蛋白之间的切割。其它识别序列也可用于FXa。

[0304] 也可使用其它种类的能够识别特定氨基酸序列的蛋白水解酶。另外，如果在复合物分子中仅接头包含氨基酸序列，也可使用以非特异性方式断裂氨基酸序列的蛋白水解酶。

[0305] 也可使用其它种类的分子如核酶，催化活性抗体，或脂肪酶。唯一的先决条件是，催化活性分子可断裂用作连接编码区域和被展示的分子或连接固体支持物和靶的接头，或用作接头的一部分的特异性结构。

[0306] 可得到能够识别和断裂具有特定核苷酸序列的双链核酸的各种核酸内切酶。核酸内切酶Eco RI是有效地切割包含序列GAATTC的核苷酸序列接头(如果该序列接近核苷酸序列长度)的核酸酶的一个例子。纯化重组物Eco RI是市售的和在多种缓冲剂条件内有高度活性。例如，Eco RI可在如下所示各种程序中工作(NEBuffer可购自New EnglandBiolabs)：

[0307] NEBuffer 1：[10mM Bis Tris丙烷-HCl，10mM MgCl2，1mM二硫苏糖醇(pH 7.0在25℃)]，

[0308] NEBuffer 2：[50mM NaCl，10mM Tris-HCl，10mM MgCl2，1mM二硫苏糖醇(pH 7.9在25℃)]，

[0309] NEBuffer 3：[100mM NaCl，50mM Tris-HCl，10mM MgCl2，1mM二硫苏糖醇(pH 7.9在25℃)]，

[0310] NEBuffer 4：[50mM乙酸钾，20mM Tris-乙酸盐，10mM乙酸镁，1mM二硫苏糖醇(pH7.9在25℃)]。

[0311] 延伸缓冲剂：mM KCl，20mM Tris-HCl(Ph 8.8，在25摄氏度下)，10mM (NH4)2SO4，2mM MgSO4和0.1％Triton X-100，和200μM dNTPs。

[0312] 核苷酸

[0313] 用于本发明的核苷酸可在核苷酸序列，即寡核苷酸中被连接在一起。每个核苷酸单体通常由两个部分，即核酸碱基(nucleobase)部分和主链组成。主链在某些情况下可被再分成糖部分和核苷间接头。

[0314] 核酸碱基部分可选自自然存在的核酸碱基以及非自然存在的核酸碱基。因此，″核酸碱基″不仅包括已知的嘌呤和嘧啶杂环，而且包括杂环类似物和其互变异构体。核酸碱基的说明性例子是腺嘌呤，鸟嘌呤，胸腺嘧啶，胞嘧啶，尿嘧啶，嘌呤，黄嘌呤，二氨基嘌6 4 4 6
呤，8-氧代-N-甲基腺嘌呤，7-去氮黄嘌呤，7-去氮鸟嘌呤，N，N-桥亚乙基胞嘧啶，N，
6 3 6
N-桥亚乙基-2，6-二氨基-嘌呤，5-甲基胞嘧啶，5-(C-C)-炔基胞嘧啶，5-氟尿嘧啶，
5-溴尿嘧啶，假异胞嘧啶，2-羟基-5-甲基-4-三唑并吡啶，异胞嘧啶，异鸟嘌呤，次黄嘌呤核苷和描述于Benner等人，U.S.Pat No.5,432,272的″非自然存在的″核酸碱基。术语″核酸碱基″意味着包括这些例子以及其类似物和互变异构体。尤其有意义的核酸碱基是腺嘌呤，鸟嘌呤，胸腺嘧啶，胞嘧啶，5-甲基胞嘧啶，和尿嘧啶，它们被认为是自然存在的核酸碱基。

[0315] 以下给出核酸碱基的合适的特异性对的例子：

[0316] 天然碱基对

[0317]

[0318] 合成碱基对

[0319]

[0320] 与天然嘧啶配对的合成嘌呤碱

[0321]

[0322] 以下给出主链单元的合适例子(B表示核酸碱基)：

[0323]

[0324] 主链的糖部分合适地是戊糖但可以是PNA或六-元环的合适部分。可能戊糖的合适例子包括核糖，2’-脱氧核糖，2’-O-甲基-核糖，2’-氟-核糖，和2’-4’-O-亚甲基-核糖(LNA)。合适地，核酸碱基连接到戊糖实体的1’位上。

[0325] 如果主链的糖部分是戊糖，如核糖或2-脱氧核糖，核苷间接头将前述单体的3’端连接至后继的单体的5’端。核苷间键可以是天然存在的磷酸二酯键或其衍生物。这些衍生物的例子包括硫代磷酸酯，甲基膦酸酯，氨基磷酸酯，磷酸三酯，和二硫代磷酸酯。另外，核苷间接头可以是本领域已知的许多非含磷的接头中的任何一种。

[0326] 优选的核酸单体包括通过磷酸二酯键连接的构成DNA及RNA的家族一部分的自然存在的核苷。DNA系列的成员包括脱氧腺苷，脱氧鸟嘌呤核苷，脱氧胸腺嘧啶核苷，和脱氧胞苷。RNA系列的成员包括腺苷，鸟嘌呤核甙，尿嘧啶核苷，胞苷，和次黄嘌呤核苷。

[0327] 选择

[0328] 一旦库已根据本文所公开的方法而进行，必需从库中筛选出具有预定想要的特性的那类化合物。预定想要的特性可包括结合至靶上，催化改变靶，与靶化学反应以改变/修饰靶或该靶的官能活性，和共价连接至靶上(如在自杀抑制剂中)。除了如上所公开而制成的库，按照以下方法A和B制成的库可根据本发明进行筛选。

[0329] A.展示分子可以是各个地和分开地被标记的处于其最终“态”的单个化合物。如单个化合物可各个地连接到独特标签上。每个独特标签具有关于该特定化合物的信息，如结构，分子量等。

[0330] B.展示分子可以是可被认为处于其最终“态”的化合物的混合物。这些展示分子通常各个地和分开地被标记，即化合物混合物中的每个单个化合物可连接到相同的标签上。另一标签可用于另一化合物混合物。每个独特标签具有关于该特定混合物的信息，如在板上的空间位置。

[0331] 靶可以是任何所关心的化合物。靶可以是蛋白质，肽，碳水化合物，多糖，糖蛋白，激素，受体，抗原，抗体，病毒，底物，代谢物，过渡态模拟物，辅因子，抑制剂，药物，染料，营养素，生长因子，细胞，组织，等，但不限于此。尤其优选的靶包括，但不限于此，血管紧张素转化酶，肾素，环加氧酶，5-脂肪氧化酶，IIL-10转化酶，细胞因子受体，PDGF受体，II型次黄嘌呤核苷单磷酸脱氢酶，β-内酰胺酶，和真菌细胞色素P-450。靶可包括，但不限于此，缓激肽，嗜中性白细胞弹性蛋白酶，HIV蛋白质，包括tat，rev，gag，int，RT，核壳等，VEGF，bFGF，TGFβ，KGF，PDGF，凝血酶，茶碱，咖啡因，P物质，IgE，sPLA2，红血细胞，恶性胶质瘤，纤维蛋白凝块，PBMCs，hCG，植物凝血素，selectins，细胞因子，ICP4，补体蛋白质，等。

[0332] 该严格条件的程度的上限是包含展示分子和编码区域的复合物的分解。筛选条件是本领域普通技术人员已知的。

[0333] 具有预定想要的特性的复合物可通过本领域普通技术人员已知的各种方法与该库的其余部分分开，同时仍连接到核酸标识符标签上。在本发明的一个实施方案中，需要的产物从整个库中分离而所连接的核酸不会化学降解，使得标识符核酸是可扩增的。包含密码子的标识符部分可随后被扩增，要么仍连接到需要的化合物上或在从需要的化合物中分离之后。

[0334] 在某些实施方案中，需要的展示分子作用于靶而连接到需要的显示化合物上的编码序列和靶之间没有任何相互作用。在一个实施方案中，需要的化合物结合至靶上，随后通过许多方法将该复合物从未结合的产物中分离。这些方法包括塑料结合，硝基纤维素过滤器结合，柱色谱，过滤，亲和性色谱，离心，和用于固定靶的其它熟知的方法。

[0335] 简要地，将库经受分配步骤，这可包括将库和其上连接有靶的柱接触。不编码具有对靶的活性的反应产物的所有的标识符序列会通过该柱。其它的非所需化学实体(如，与其它靶交叉反应的实体)可通过反选择方法而去除。需要的复合物结合至柱上和可通过改变柱的条件(如，盐，等)而洗脱或与需要的化合物连接的标识符序列可直接被断裂和洗脱。

[0336] 在某些实施方案中，基本步骤包括将复合物库与所关心的固定靶混合。靶可通过直接固定作用或利用抗体结合或其它高亲和性相互作用连接到柱基质或微滴定孔上。在另一实施方案中，靶和展示分子相互作用而不固定该靶。结合至靶上的展示的分子保留在该表面上，同时未结合的展示分子在单个或一系列洗涤步骤过程中被去除。结合至靶上的复合物的标识符可随后通过裂开与合成分子的物理连接而分离。在洗涤步骤之后或替代洗涤步骤而进行色谱步骤可被认为是有利的。在断裂合成分子和标识符之间的物理连接之后，标识符可从介质中被回收和任选地在解码步骤之前扩增。

[0337] 在传统洗脱程序中，难以规避由于亚最佳结合和洗涤条件而产生的假阳性且可需要精确地调整实验条件。但难以得到超过100至1000的富集。用于本文实施例7的选择过程缓和了与所得假阳性有关的问题，因为非特异结合复合物在相当程度上留在反应腔中。7
本文所报告的实验表明，可得到超过10 的富集。

[0338] 另外，与靶反应的化合物可从不与靶反应的那些产物中分离。在一个例子中，共价连接至靶上的化合物(如自杀抑制剂)可在非常严格的条件下洗涤。所得复合物可随后用蛋白酶，DNA酶或其它合适的试剂处理以断裂接头和释放与需要的化合物连接的核酸。所释放的核酸可被扩增。

[0339] 在另一例子中，需要的产物的预定想要的特性是该产物转移化学基团(如酰基转移)至靶上和这样钝化该靶的能力。可得到其中所有的产物具有硫代酯化学基团，或类似活化化学基团的产品库。通过与靶接触，需要的产物将化学基团转移至靶上，同时将需要的产物从硫代酯改变为硫醇。因此，可鉴别目前是硫醇(而非硫代酯)的产物的分配方法可选择需要的产物和扩增与其有关的核酸。

[0340] 本领域普通技术人员已知其它与本发明相容的分配和筛选方法。在一个实施方案中，产物可通过许多常见方法而分级分离并随后分析每个级分的活性。分级分离方法可包括大小，pH，憎水性，等。

[0341] 本方法所固有的是根据所需功能进行化学实体的选择；这可扩展至对具有所需功能和特异性的小分子的选择。特异性可在选择过程中通过首先提取能够与非所需″靶″相互作用(负选择，或反选择)的化合物的标识符序列，随后对所需靶进行正选择而获得。例如，真菌细胞色素P-450的抑制剂已知在一定程度上与哺乳动物细胞色素P-450交叉反应(导致严重的副作用)。真菌细胞色素的高度特异性抑制剂可通过首先去除能够与哺乳动物细胞色素相互作用的那些产物，随后保留能够与真菌细胞色素相互作用的剩余产物而从库中选出。

[0342] 富集

[0343] 本发明还涉及一种用于确定具有预选性质的化学实体的身份的方法，包括步骤：

[0344] i)通过将独特标识符标签附加至化学实体上而产生化学实体的经标记库，[0345] ii)将该库经受一种条件，其中将具有预定性质的化学实体或化学实体的亚集与该库的剩余部分分离，

[0346] iii)从该分离的库中回收反标签，所述反标签能够与独特标识符标签以特异的方式相互作用，和

[0347] iv)通过解码反标签而鉴定具有预选功能的化学实体。

[0348] 标签通过合适的方法附加至化学实体上。尤其是，每个化学实体通过包括化学实体的反应基团和标签的反应基团之间化学反应的反应，如“选择”章节的方法A和B而附加标签。化学实体可直接或通过桥接分子部分而连接。分子部分可以是能够将化学实体连接至标签上的任何合适的化学结构。

[0349] 反标签具有与独特标识符标签以特异性方式相互作用的能力。反标签的化学结构在较大程度上取决于对独特标签的选择。例如，如果独特标签被选择为抗体，那么反标签被选择为能够与抗体结合的表位。一般来说，优选使用包含与独特标识符标签互补的核苷酸序列的反标签。

[0350] 该方法可在某些实施方案中无需扩增而进行。但如果希望较大的库，一般优选使用可扩增的反标签。包含核苷酸序列的反标签可使用标准技术如PCR扩增。如果反标签是蛋白质，该蛋白质可通过连接已编码其合成的mRNA，由mRNA生成cDNA并将所述mRNA经受翻译体系而扩增。这些体系描述于WO 98/31700(其内容在此通过参考并入本发明)。用于扩增蛋白质标签的另一方法是使用噬菌体展示的蛋白质。

[0351] 如果标签以及反标签是核酸序列，标签：反标签杂交体可在该库经受分离条件之前或在分离步骤之后形成。在本发明的一些实施方案中，优选在分离步骤之前形成标签：反标签杂交体以使所附加的核苷酸序列相对该体系惰性，因为人们熟知，核苷酸的某些序列可结合至靶上或催化化学反应。

[0352] 寡核苷酸反标签可按照各种方式形成。在本发明的一个实施方案中，反标签通过酶延伸反应而形成。延伸包括，起始将引物退火至独特标识符标签上和随后使用聚合酶和dNTPs延伸该引物。也可考虑其它种类的延伸反应。例如，连接酶可由二-或三核苷酸底物起始用于产生引物且延伸可使用合适的聚合酶而进行。

[0353] 可有益地在该过程的各种步骤回收反标签。为此，在本发明的一些方面优选提供具有能够结合至合适的亲和性配偶者(partner)上的把手(handle)的引物。本领域熟练技术人员可得到大量不同的把手和亲和性配偶者。最广泛使用的把手是生物素，它根据本发明一般也是优选的。生物素结合亲和性配偶者链霉抗生物素蛋白或抗生物素蛋白。实验室中的标准技术是使用覆盖有链霉抗生物素蛋白的固相回收已连接生物素的生化实体。合适地，固体相是珠粒，该珠粒可在连接作用之后通过旋转或在固体珠粒包含磁性颗粒的情况下通过磁场而从液体中分离。

[0354] 在本发明的其它方面，反标签作为单独的寡核苷酸被提供。所述单独的寡核苷酸可使用标准amidite合成技术而制成或可使用其它有用的方法而提供。一般优选至少部分地通过合成而提供寡核苷酸，因为生物素amidite容易被引入新生寡核苷酸链中。在将寡核苷酸反标签加入包含用互补性寡核苷酸标签标记的化学实体的液体之后，双链库作为独特标识符标签和反标签寡核苷酸之间的杂交产物而形成。

[0355] 如上所述，反标签寡核苷酸可具有能够结合亲和性配偶者，如链霉抗生物素蛋白或抗生物素蛋白上的把手，如生物素。

[0356] 在将反标签寡核苷酸加入标记的化学实体中之后，存在于介质中的一些寡核苷酸可能不会找到配偶者。在本发明的一个方面，优选的是，没有被杂交至同类的独特标识符和/或反标签上的寡核苷酸被转化成双螺旋。在本发明的其它方面，单链寡核苷酸在步骤ii)之前被降解以避免非所需的干扰。

[0357] 把手可用于在分离步骤之前或之后纯化该库。在本发明的一些实施方案中，纯化步骤在分离步骤之前进行以减少该体系的噪声。在另一方面，把手在步骤 ii)之后用于纯化分离的库以回收可被扩增的双链产物。

[0358] 库经受一种条件以选择出具有对该条件有响应的性质的化学实体。该条件可包括将库暴露于靶和分离对该靶具有亲和性的化学实体。另一条件可以是将该库暴露于底物和分离相对该底物具有催化活性的化学实体。

[0359] 反标签可在分离步骤之后形成。在本发明的一个方面，用作标签的单链核苷酸被形成双链，同时将化学实体连接到亲和性分离的靶上。任选地，在重复的温度循环中，多个反标签可作为延伸产物使用标签作为模板而形成。在本发明的另一方面，带有单链寡核苷酸的化学实体从靶上脱离并随后制备出互补性反标签。

[0360] 如果反标签包含把手，该把手可用于纯化分离的库。反标签的回收随后通过从分离的双链库中熔解所述反标签而进行。任选地，反标签的量可通过常规扩增技术，如PCR而增加。

[0361] 根据本发明的方法可使用单个分离(partitioning)步骤而进行。但通常优选使用一个以上的分离步骤以从大的库中选择出具有所需性能的候选者。因此，回收的反标签可与起始库或其子集混合且分离(步骤ii))和回收(步骤iii))的步骤可重复所需次数。任选地，混合物中的单链部分可如上所述被降解或去除或变得惰性。

[0362] 一般，将在步骤ii)中得到的分离库经受一个或多个进一步的接触步骤，其中使用更加严格的条件。该严格的条件可通过增加温度，盐浓度，酸度，碱性，等而增加。

[0363] 在本发明的一个实施方案中，将分离的库在重复的接触步骤之前不经受中间处理步骤。尤其，分离库不经受反标签的中间扩增。该实施方案可在使用相对小的库时有利。

[0364] 本发明的方法终止于解码步骤，即其中一个或多个化学实体的身份通过分析反标签被破译的步骤。如果反标签是寡核苷酸，解码步骤iv)可通过测序反标签核苷酸而进行。各种用于测序的方法对熟练技术人员是显然的，包括克隆的使用和对微阵列的暴露。

[0365] 标签包含识别基团如核苷酸序列，表位以及其它。标签携带其所连接的实体的信息，如实体结构，质量，空间位置(板信息)等。标签可由单克隆抗体，肽，蛋白质，寡核苷酸，DNA，RNA，LNA，PNA，天然肽，非天然的肽，聚合物或低聚物肼基芳基和烷基羧酸，聚合物或低聚物氨基氧基芳基和烷基羧酸，类肽(peptoids)，其它天然聚合物或低聚物，非天然的聚合物(分子量＞1000Da)或低聚物(分子量＜1000Da)，小非聚合分子(分子量＜1000Da)或大非聚合分子(分子量＞1000Da)组成。

[0366] 在一优选实施方案中，实体由小的非聚合分子(分子量＜1000Da)组成。小分子一般是寻求药物口服候选物时所关心的化合物。尤其，自然界不存在的小分子在药物发现过程中是所关心的，而且在本发明的一个方面，该方法被设计成选择口服药物候选物。各种药物候选物库可在市场上得到。该库的药物候选物通常包含反应基团或可被改变成反应基团的基团。在本发明的一个优选方面，药物候选物库的每个成员通过库成员的所述反应基团和核酸上的反应基团附加上核酸标签。优选，核酸是寡核苷酸。

[0367] 在本发明的另一方面，实体由大的非聚合分子(分子量＞1000Da)组成。在另一实施方案中，实体由聚合物分子组成。

[0368] 标签和反标签可由连接至单克隆抗体，蛋白质，LNA，PNA，天然多肽，非天然的多肽，聚合物或低聚物肼基芳基或烷基羧酸，聚合物或低聚物氨基氧基芳基或烷基羧酸，其它天然聚合物或低聚物，非天然的聚合物(分子量＞1000Da)或低聚物(分子量＜1000Da)，小非聚合分子(分子量＜1000Da)或大非聚合分子(分子量＞1000Da)上的RNA组成。

[0369] 或者，反标签可由连接至单克隆抗体，蛋白质，LNA，PNA，天然多肽，非天然多肽，聚合物或低聚物肼基芳基或烷基羧酸，聚合物或低聚物氨基氧基芳基或烷基羧酸，其它天然聚合物或低聚物，非天然的聚合物(分子量＞1000Da)或低聚物(分子量＜1000Da)，小非聚合分子(分子量＜1000Da)或大非聚合分子(分子量＞1000Da)上的DNA组成。或者，反标签仅由寡核苷酸，DNA或RNA组成。在一个优选实施方案中，反标签由DNA组成。在另一优选的实施方案，反标签由RNA组成。

[0370] 连接至DNA或RNA上的反标签也由连接至其上的该DNA/RNA编码，如噬菌体展示或多核糖体展示的抗体，肽或蛋白质，和通过反标签的DNA-模板化合成而编码，其中DNA编码在其合成过程中连接至其DNA上的反标签的合成。

[0371] 每种化合物或每组化合物可通过形成共价或非共价键而与标签连接。对于共价键形成，标记过程可包括，但不限于，形成环加成产物，烷基化产物，芳基化产物，酰基化产物，酰胺键，羧酸酯键，磺酰胺键，二硫键，S-烷基键，NR-烷基键，O-烷基键，芳基-乙烯基键，炔-乙烯基键，肟键，亚胺键，双环产物，三唑，己烯，7-氧杂-双环[2.2.1]庚-2-烯衍生物，7-氮杂-双环[2.2.1]庚-2-烯衍生物或7-甲基-7-氮杂-双环[2.2.1]庚-2-烯。非共价键可包括，但不限于此，通过如氢键，van der Waals相互作用，π-堆积或通过杂交而连接。杂交可在DNA，RNA，PNA或LNA或其混合物的互补链之间。在这些情况下，标签和化合物都携带这种相互互补的链。标记实体，化合物或化合物混合物可如通过实体的转化或通过标签的转化而转化成新标记实体。转化可通过化学或物理转化如加入试剂(如氧化或还原剂，pH调节以及其它)或经受UV-照射或热而引起。

[0372] 标签和反标签之间的复合物可在单个地标记的实体上在标记之后立即形成。或者，在混合单个地标记的实体之后，在任选地使用库纯化之前或之后，或在针对特定性能富集的库之前或之后。

[0373] 如果标签和反标签由核苷酸组成，该复合物由双链核苷酸，如双螺旋DNA或杂交DNA/RNA组成。

[0374] 纯化把手(表示为“@”)可连接至反标签上。纯化把手包含识别基团如核苷酸序列，表位，反应基团，高亲和性配体以及其它。纯化把手可由单克隆抗体，肽，蛋白质，DNA，RNA，LNA，PNA，天然肽，非天然的肽，聚合物或低聚物肼芳基或烷基羧酸，聚合物或低聚物氨基氧基芳基或烷基羧酸，其它天然聚合物或低聚物，非天然的聚合物(分子量＞1000Da)或低聚物(分子量＜1000Da)，小非聚合分子(分子量＜1000Da)或大非聚合分子(分子量＞1000Da)组成。纯化把手可以是如核苷酸序列，生物素，链霉抗生物素蛋白，抗生物素蛋白，“his-标签”，巯基基团或二硫化物/活化二硫化物基团。纯化把手可以是反标签的一部分，如在反标签是基于核苷酸的或是例如其中抗体的一部分可用作另一抗体的表位的抗体(如用作纯化过滤器的固定抗体)的情况下。

[0375] 纯化过滤器包含与纯化把手连接，相互作用或反应从而形成复合物的组分。该复合物允许不形成复合物的标记实体和形成复合物的标记实体的分离。纯化过滤器包含识别基团如核苷酸序列，表位，反应基团，高亲和性配体以及其它。纯化过滤器可由单克隆抗体，肽，蛋白质，DNA，RNA，LNA，PNA，天然肽，非天然的肽，聚合物或低聚物肼基芳基或烷基羧酸，聚合物或低聚物氨基氧基芳基或烷基羧酸，其它天然聚合物或低聚物，非天然的聚合物(分子量＞1000Da)或低聚物(分子量＜1000Da)，小非聚合分子(分子量＜1000Da)或大非聚合分子(分子量＞1000Da)组成。纯化过滤器可以是如核苷酸序列，生物素，链霉抗生物素蛋白，抗生物素蛋白，“his-标签”，巯基基团或二硫化物/活化二硫化物基团。

[0376] 依据性质探测和富集库。性质可以是亲和性，催化活性或膜渗透能力以及其它。

[0377] 扩增可使用PCR或RTPCR技术。反标签在本发明的一些方面是可扩增的。反标签可通过使用物理或化学方式，如UV-照射，热，pH-调节，使用盐溶液以及其它而与标签分离。

[0378] 分离的标记实体可通过其标签或反标签而鉴定。鉴定可通过克隆反标签和测序其DNA/RNA或通过对标记实体或反标签或反标签/标记实体的复合物的质谱分析而实现。

[0379] 标记实体的库可包括10-1020或10-1014或10-102或10-103或102-103或102-1043 6 3 8 3 10 3 14 5 6 5 8 5 10 5 14
或10-10 或10-10 或10-10 或10-10 或10-10 或10-10 或10-10 或10-10 或
8 14 14 20
10-10 或10 -10 个实体。

[0380] 标记实体和反标签的库复合物可依据性质在纯化之前通过使用纯化把手和纯化过滤器或在纯化之后富集。

[0381] 术语“独特的”在与核苷酸序列一起使用时意味着，该序列的至少一个核酸碱基和/或主链实体不与不同的化学实体一起出现。优选，特定序列是独特的，因为没有其它化学实体与相同的核酸碱基序列相关。

[0382] 一旦已形成库，必须筛选出具有预定想要的特性的化合物的库。预定想要的特性可包括连接至靶上，催化改变靶，与靶化学反应以改变/修饰该靶或靶的功能活性，和共价连接至靶上(如在自杀抑制剂的情况下)。

[0383] 靶可以是任何所关心的化合物。靶可以是蛋白质，肽，碳水化合物，多糖，糖蛋白，激素，受体，抗原，抗体，病毒，底物，代谢物，过渡态类似物，辅因子，抑制剂，药物，染料，营养素，生长因子，细胞，组织，等，但不限于此。尤其优选的靶包括，但不限于此，血管紧张素转化酶，肾素，环加氧酶，5-脂肪氧化酶，IIL-10转化酶，细胞因子受体，PDGF受体，II型次黄嘌呤核苷单磷酸脱氢酶，β-内酰胺酶，和真菌细胞色素P-450。靶可包括，但不限于此，缓激肽，嗜中性白细胞弹性蛋白酶，HIV蛋白质，包括tat，rev，gag，int，RT，核壳等，VEGF，bFGF，TGFβ，KGF，PDGF，凝血酶，茶碱，咖啡因，P物质，IgE，sPLA2，红血细胞，恶性胶质瘤，纤维蛋白凝块，PBMCs，hCG，植物凝血素，selectins，细胞因子，ICP4，补体蛋白质，等。

[0384] 库筛选时的严格条件通常局限于使得在标识符标签和反标签之间保持杂交的那些条件。但可采用高严格条件，随后重新合成或连接反标签。筛选条件是本领域普通技术人员已知的。

[0385] 具有预定想要的特性的化合物可通过本领域普通技术人员已知的各种方法与该库的剩余部分分开，同时仍连接到核酸标识符标签上。在本发明的一个实施方案中，想要的产物从整个库中分开而所连接的核酸没有化学降解，使得标识符核酸是可扩增的。标识符标签可随后被扩增，此时或者仍连接到想要的化合物上或在从想要的化合物中分离之后。

[0386] 在最优选的实施方案中，想要的化合物作用于靶而连接到想要的化合物上的标签和靶之间没有任何相互作用。在一个实施方案中，想要的化合物结合至靶上且结合的标签-所需化合物-靶复合物可通过许多方法从未结合的产物中分开。这些方法包括硝基纤维素过滤器结合，柱色谱，过滤，亲和性色谱，离心，和其它熟知的方法。

[0387] 简要地，将库经受分离(partitioning)步骤，这可包括将库和其上连接有靶的柱接触。没有与化学实体-标签聚集体形成杂交产物的所有标签或与非所需化学实体连接的那些标签可通过该柱。其它的非所需化学实体(如，与其它靶相互反应的实体)可通过反选择方法而去除。想要的复合物连接至柱上和可通过改变柱的条件(如，盐，等)而洗脱或与想要的化合物连接的标签可直接被断裂和洗脱。

[0388] 或者，与靶反应的化合物可和不与靶反应的那些产物分离。在一个例子中，共价连接至靶上的化合物(如自杀抑制剂)可在非常严格的条件下洗涤。所得复合物可随后用蛋白酶，DNA酶或其它合适的试剂处理以断裂接头和释放与想要的化合物连接的核酸。所释放的核酸可被扩增。

[0389] 在另一例子中，想要的产物的预定想要的特性是该产物转移化学基团(如酰基转移)至靶上和这样钝化该靶的能力。可得到其中所有的产物具有硫代酯化学基团的产品库。通过与靶接触，想要的产物将化学基团转移至靶上，同时将想要的产物从硫代酯改变为硫醇。因此，可鉴别目前是硫醇(而非硫代酯)的产物的分离方法可选择想要的产物和扩增与其有关的核酸。

[0390] 本领域普通技术人员已知其它与本发明相容的分离和筛选方法。在一个实施方案中，产物可通过许多普通方法而分级分离并随后分析每个级分的活性。分级分离方法可包括大小，pH，憎水性，等。

[0391] 本方法包括根据所需功能进行化学实体的选择；这可扩展至对具有所需功能和特异性的小分子的选择。特异性可在选择过程中通过首先提取能够与非所需″靶″相互作用(负选择，或反选择)的化合物的标识符序列，随后用所需靶进行正选择而获得。例如，真菌细胞色素P-450的抑制剂已知在一定程度上与哺乳动物细胞色素P-450相互反应(导致严重的副作用)。真菌细胞色素的高度特异性抑制剂可通过首先去除能够与哺乳动物细胞色素相互作用的那些产物，随后保留能够与真菌细胞色素相互作用的剩余产物而从库中选出。

[0392] 在选择步骤之后，回收反标签。回收可通过将所选的复合物经受严格条件以使反标签序列从标识符标签上脱离而进行。如果标签和反标签是核酸，严格条件可通过逐渐增加温度直至双螺旋的两个链融解开而增加。反标签序列的另外复本可通过使用合适的引物和聚合酶延伸标识符序列而提供。或者，回收的反标签序列和/或标识符序列标签可经受PCR以形成双链产物。包含与至少一部分独特的标识符序列互补的序列的链随后被分离。

[0393] 所选的化学实体可在延伸或扩增过程中连接至靶上或可从靶上脱离。在本发明的一个方面，优选的是，靶被固定而且化合物在延伸或扩增过程中保持连接到靶上，这样容易通过简单的洗脱而回收延伸或扩增产物。另一方面，所选的化学实体在回收富集序列之前，同时或之后与独特的标识符序列分离。

[0394] 为了回收所需反标签序列，可合适地给自然的以及扩增的(如果存在)反标签序列提供分子亲和性对的一方。所述分子亲和性对的一方在本文中也被称作把手。反标签可随后通过使用可分离的连接到固体相上的分子亲和性对的另一方而回收。分子亲和性对的基本性能是，这两方能够相互作用以组装成分子亲和性对。在生物技术领域中，各种相互作用分子部分已知可用作分子亲和性对。例子包括，但是不限制至蛋白质-蛋白质相互作用，蛋白质-多糖相互作用，RNA-蛋白质相互作用，DNA-DNA相互作用，DNA-RNA相互作用，RNA-RNA相互作用，生物素-链霉抗生物素蛋白相互作用，酶-配体相互作用，抗体-配体相互作用，蛋白质-配体相互作用，等。

[0395] 合适的分子亲和性对是生物素-链霉抗生物素蛋白。反标签序列可如通过在扩增或延伸步骤中使用连接到生物素部分上的引物和将生物素标记的反标签序列与涂有链霉抗生物素蛋白的珠粒接触而提供生物素。

[0396] 在回收反标签序列之后，将这些与起始库或其部分接触并通过将反标签序列杂交至独特标识符标签的同类的序列上而能够形成富集库。

[0397] 根据本发明的方法可重复一次或多次。在该方法的第二轮中，不被反标签序列识别的那部分单链库可从反应介质中被清除或单链库的剩余部分可留在与富集库的混合物中。一般来说，在富集的双链库进行与靶的第二次接触之前无需将单链库的剩余部分从介质中分离，因为用于预选功能的条件通常比第一轮更严格，因此单链库的成员估计不结合靶。但为了减少该体系的噪声，可在某些情况下有用地从介质中取出不与反标签序列相配的单链起始库的成员。如果反标签序列提供有分子亲和性对的一方，如生物素，那么所关心的化合物可通过用固定链霉抗生物素蛋白，如涂有链霉抗生物素蛋白的珠粒处理而从介质中提取。

[0398] 如上所述，用于进行第二或进一步选择步骤的条件一般比第一或先前步骤更严格。在顺序选择轮中不断增加的严格条件有利于形成在数目上变窄但在所需性质上被富集的化合物的子库。

[0399] 在本说明书和权利要求中，术语核酸，寡核苷酸，oligo，和核苷酸频繁地使用。术语核苷酸，核苷酸单体，或单核苷酸用于表示通常由两部分，即核酸碱基部分和主链组成的化合物。主链在一些情况下可被再分为糖部分和核苷间接头。单核苷酸可相互连接以形成寡核苷酸。通常，单核苷酸通过核苷间键而连接。术语核酸包括单核苷酸以及寡核苷酸。但该术语通常表示具有2至30个通过核苷间接头连接在一起的单核苷酸的寡核苷酸。

[0400] 确定双功能复合物的编码部分

[0401] 测定存在于分离的双功能分子或分离的标识符寡核苷酸中的标识符序列的编码部分以鉴别参与形成展示分子的化学实体。如果可从标识符寡核苷酸推导出有关功能实体以及它们被引入展示分子时的时间点的信息，那么可确立展示分子的合成方法。获得有关已参与展示分子的各种化学实体的化学结构的信息可由于在形成过程中的结构限制而足以推导出完整分子。例如，不同种类的连接化学的使用可确保构件上的化学实体仅可被转移至支架上的单个位置。另一种类的化学限制可由于支架分子或所要转移的功能实体上的位阻而存在。但一般优选的是，该信息可由能够鉴定已参与形成被编码分子的每种化学实体以及该化学实体已被引入(新生)展示分子的合成历史中的时间点的标识符序列推断。

[0402] 尽管常规DNA测序方法容易得到且可用于该确定，但分离的双功能分子的量和质量可需要在测序反应之前的附加操作。

[0403] 如果该量低，优选通过聚合酶链式反应(PCR)使用被针对存在于标识符序列中的引物结合位点的PCR引物而增加标识符序列的量。

[0404] 另外，分离的双功能分子的质量可能是这样的：双功能分子的多种种类利用结合靶的类似能力而共分离。如果分离了一种以上的双功能分子，不同的分离种类必须在标识符寡核苷酸的测序之前分离。

[0405] 因此在一个实施方案中，分离的双功能复合物的不同的标识符序列在通过DNA测序方法确定其序列之前被克隆到不同的测序载体中。这通常通过本文所述的PCR扩增所有的不同的标识符序列，并随后使用该扩增产物上的独特的限制性内切酶位点将扩增片段定向性地克隆到测序载体中而实现。扩增片段的克隆和测序是一个可通过本领域已知的许多分子生物方法中的任何方法进行的常规程序。

[0406] 或者，双功能复合物或PCR扩增的标识符序列可在微阵列中分析。该阵列可被设计成分析单个密码子或多个密码子在标识符序列中的存在。

[0407] 核酸的合成

[0408] 寡核苷酸可通过各种熟知的化学而合成。为了以3′至5′的方向在基质上合成寡核苷酸，需要可根据需要方便地被封端或解封端的游离羟基末端。优选的羟基末端封端基团是二甲氧基三苯甲基醚(DMT)。DMT封端的末端首先被解封，例如用在二氯甲烷(DCM)中的3％二氯乙酸处理，这是寡核苷酸合成所熟知的，这样形成游离羟基末端。

[0409] 用于以3′至5′的方向加到游离羟基末端上的前体形式的核苷酸需要一个在核苷酸的3′末端上具有氨基二异丙基侧链的氨基磷酸酯部分。另外，氨基磷酸酯的游离羟基用氰基乙基酯(OCNET)封端，和5′末端用DMT醚封端。5′DMT-，3′OCNET-封端的氨基磷酸酯核苷酸至游离羟基上的添加需要在乙腈中的四唑，随后进行碘氧化并将未反应的羟基用乙酸酐封端，这是寡核苷酸合成所熟知的。所得产物包含具有DMT封端的5′末端的添加的核苷酸残基，备用于如前所述的随后的封端核苷酸的解封和添加。

[0410] 为了在5’至3′的方向上合成寡核苷酸，如前所述需要一个在接头上的游离羟基末端。但所要添加的封端核苷酸具有在其5′和3′末端上相反的封端化学以有助于在相反的取向上的添加。具有游离3′羟基和5′DMT醚的核苷酸首先在3′羟基末端上通过与TBS-C1在咪唑中反应形成在3′末端上的TBS酯而封端。随后将DMT-封端5′末端如前所述用在DCM中的DCA解封，形成游离5′羟基末端。具有氨基二异丙基基团和OCNET酯的试剂(N，N-二异丙基氨基)(氰基乙基)phosphonamidic chloride在四氢呋喃(THF)中与5′解封核苷酸反应形成在5′末端上的氨基二异丙基-，OCNET-封端氨基磷酸酯基团。然后将3′TBS酯用在DCM中的氟化四丁基铵(TBAF)去除，以形成具有氨基磷酸酯-封端的5′末端和游离3′羟基末端的核苷酸。在碱中与DMT-Cl的反应向3′羟基末端上加成一个DMT醚封端基团。

[0411] 3′DMT-，5′OCNET-封端的氨基磷酸酯化核苷酸至具有游离羟基末端的接头基质上的添加随后使用以前四唑反应而进行，这是寡核苷酸聚合反应所熟知的。所得产物包含具有DMT-封端的3′末端的添加核苷酸残基，备用于如前所述的使用DCA(在DCM中)的解封和随后封端核苷酸的添加。

[0412] 附图的简要描述

[0413] 图1显示标识符和构件的组分

[0414] 图2显示通过延伸而编码的原理

[0415] 图3显示构件的延伸区域

[0416] 图4显示具有内部密码子的标识符和构件的组分

[0417] 图5显示通过使用特异退火的延伸而编码的原理

[0418] 图6显示支架起来的分子(scaffolded molecules)和聚合物分子的编码[0419] 图7显示通过使用三链组装原理延伸而编码

[0420] 图8显示通过使用三链组装原理(使用特异退火)延伸而编码

[0421] 图9显示使用固相方案的三链标识符展示的分子的合成。

[0422] 图10显示使用平台组装的顺序反应/延伸。

[0423] 图11公开了一种用于交替平行合成组合库的一般方案。

[0424] 图12公开了一种使用连接编码和游离反应物的编码方法。

[0425] 图13公开了一种库产生方法，其中反应之后进行编码步骤。

[0426] 图14公开了一种使用聚合酶编码的库生成方法。

[0427] 图15公开了用于单编码方法的各种实施方案。

[0428] 图16公开了双编码方法。

[0429] 图17公开了各种双编码方法。

[0430] 图18公开了使用环形构件的编码。

[0431] 图19公开了一种方法，其中柔性接头用于构件中。

[0432] 图20公开了一种凝胶，显示根据实施例6的实验的结果。

[0433] 图21公开了一种三重编码方法。

[0434] 图22具有用于实施例9的设置。

[0435] 图23显示用于实施例9的分开-和-混合结构。

[0436] 图24公开了库富集，扩增和鉴定的一个实施方案。

[0437] 图25显示一个实施方案，其中不杂交至标识符序列上的反标签序列变成双链和因此惰性。

[0438] 图26显示一个实施方案，其中富集步骤在纯化步骤之前。

[0439] 图27显示库富集，扩增，和鉴定的一般原理。

[0440] 图28显示库富集，扩增，和鉴定的一般原理，省略了在随后富集程序之间的中间扩增步骤。

[0441] 图29显示库富集，扩增，和鉴定的一般原理，其中起始单链库在富集之前变成双链。

[0442] 图30显示用于库富集的一般原理，其中反标签直到一个或多个富集过程之后才形成。

[0443] 图31显示在实施例13中报道的两种凝胶。

[0444] 图32显示在实施例14中报道的实验的结果。

[0445] 图33显示在实施例14中报道的实验的结果。

[0446] 附图的详细描述

[0447] 图1在图片A中公开了一种在新生双功能复合物和构件之间的杂交产物。新生双功能复合物(简称标识符)包含通过接头部分连接至寡核苷酸标识符区域上的连接实体(attachment entity)。连接实体可以是已适应接收功能实体的单个接受性反应基团或可以是包含一个或多个接受性反应基团的支架结构。在图片A中，连接实体被表示为具有四个能够接受功能实体的反应基团的支架。

[0448] 构件包含连接到寡核苷酸上的功能实体，该寡核苷酸与标识符区域足够互补以允许形成杂交产物。功能实体能够通过化学反应转移至连接实体。互补性标识符区域进一步在其3’或5’端包含独特密码子。独特密码子以一种明确的方式标识功能实体。

[0449] 在形成标识符和构件之间的杂交产物之后，功能实体和独特反密码子被转移至标识符上。在本发明的一个方面，连接功能实体和互补性标识符区域的接头在与连接实体反应的同时被断裂，导致功能实体转移至连接实体上。在转移之前，同时或之后，发生密码子的转录。转录通过一种能够使用模板寡核苷酸使寡核苷酸聚合或低聚的酶而进行，以形成互补性链。通常聚合酶，如Pfu聚合酶与合适的dNTPs，即ATP，CTP，GTP，和TTP的混合物一起使用，使用构件的独特反密码子作为模板而延伸标识符链，形成独特密码子。

[0450] 图1，图片B说明一种用于功能实体的第二次转移的典型设置。标识符已提供有第一功能实体和已延伸了一个密码子。另外，该密码子随着密码子的延伸还包含结合区域。结合区域通常是通过第一构件在第一转移周期中被转移至标识符上的恒定区域。标识符与第二构件形成杂交产物。第二构件包含连接至寡核苷酸上的第二功能实体，该寡核苷酸与标识符的标识符区域足够互补以进行杂交。一部分互补性标识符区域包含非编码区域和与结合区域互补的区域。非编码区域与在第一周期中被转移的密码子相对且互补性结合区域与结合区域互补以允许杂交足够强地使酶能结合至螺旋上。第二独特反密码子连接到互补性连接区域上和标识第二功能实体。第二密码子使用第二反密码子作为模板按照以上所述的第一密码子的相同的方式转移至标识符上。

[0451] 图2说明功能实体和密码子转移的四个周期。在第一周期中，杂交产物在标识符和构件之间形成。杂交产物确保功能实体和支架紧密地空间接近，这样增加发生反应的可能性。在两个寡核苷酸之间的双螺旋的形成也提供聚合酶的结合区域。在聚合酶，dNTPs混合物和合适的缓冲剂如包含20mM HEPES-KOH，40mM KCl和8mM MgCl2和pH调节至7，4的水溶液的存在下，独特反密码子(UA1)作为密码子被转移至标识符上。

[0452] 在分别转移功能实体和密码子之后，将用过的构件通过增加严格性而与标识符分离。通常，严格性通过增加温度，改变pH或通过增加离子强度而增加。在双螺旋结构破裂之后，标识符被回收。在本发明的一个方面，标识符被固定以便于与用过的构件分离。在另一方面，用过的构件被化学或酶方式降解。在回收标识符之后，新周期可可通过将标识符与另一构件接触而开始。

[0453] 在四个转移周期之后的最终产物是双功能复合物，它包含在一端上的反应产物和在另一端上的编码区域。反应产物包含来自转移的功能实体和起始支架的成分。编码区域包含何种实体已按照何种顺序被转移的遗传密码。因此，合成历史可由编码区域解码。

[0454] 图3显示编码区域的设计的例子。图片A，描绘了根据图1，图片B的设计的一个例子的详细图。在第一周期中被转移的独特密码子与部分错配区域相对。为了补偿亲和性的下降，在该密码子之后跟有结合区域。结合区域与构件的匹配互补性结合区域相对。

[0455] 在图3，图片B中，在第一周期中被引入的独特密码子与已在互补性标识符区域中引入中性结合区域的第二构件相对。中性结合区域不能够辨别各种独特密码子，但能够对每种密码子显示某种亲和性。通常，中性结合区域包含一个或多个通用碱基且更优选的中性结合区域包含与标识符上的至少一部分密码子区域相对的通用碱基的序列。

[0456] 图4显示标识符和构件之间的杂交产物，其中标识符具有内部密码子而且构件具有相应的反密码子。标识符区域和互补性标识符区域也可分别包含特异独特密码子和反密码子。

[0457] 当预期进行几轮选择时，尤其当编码分子由前轮的PCR产物形成时，内部密码子的用途是特别重要的。构件中的内部反密码子可完全或部分匹配标识符序列或可包含一个或多个通用碱基以提供亲和性而非特异性。内部独特密码子的作用是仅引导标识符分子和构件分子之间的退火。正确的编码由在延伸过程中产生的独特密码子负责。这些独特密码子行进到下一代分子处并用于解码被展示的分子的合成历史。该体系不完全依赖于该内部独特密码子的精确的编码功能以使正确的基因型传递至下一代的标识符分子。

[0458] 在图片A中杂交产物在功能实体和连接实体之间提供空间接近性，因此增加发生反应的可能性。独特密码子通过酶延伸反应而在标识符序列上模板合成密码子。在图片B中，结合区域被引入每个独特的编码序列之间以提供两条链相互的亲和性，即使一个或多个错配碱基出现在以前使用的密码子的密码子：非编码区域中。

[0459] 图5给出了一种当扩增步骤被包括在选择之间时有用的实施方案。起始，复合物库如图2所示而制成。该复合物库可经受选择过程。选择过程可包括将复合物上的展示分子提供给靶和随后选择对该靶表现出所需相互作用的展示分子。可在选择过程中有利地使用相对温和的条件，以得到子库。子库可被解码以得到有关整个子库的合成历史的信息。但通常优选在进行解码之前进一步减少子库。

[0460] 子库可通过将它再次暴露于靶并使用更严格的条件而减少。但为了在第二选择之前得到较高数目的每种子库成员，一般优选扩增该复合物。因此，将加载有支架的引物首先在编码区域的一端退火至引物位置。随后形成转录产物。优选存在反向引物以得到具有连接其上的支架的双链PCR产物。

[0461] 该PCR是用于生成子库的扩增作用的基础。标识符序列被分隔成许多内部独特密码子，在附图中简称IUC。IUCs的数目对应于参与形成展示分子的功能实体的数目。IUCs的序列表达各个功能实体的身份且IUCs的顺序表示功能实体的反应的顺序。优选，引物区域被提供在IUCs序列的附近以允许随后扩增该核酸序列。

[0462] 子库与多个包含可转移的功能实体和对至少一个IUCs互补的内部独特反密码子(IUA)的构件接触。互补性标识符区域具有足够的互补性以允许与寡核苷酸标识符区域的杂交。在一个优选实施方案中，不标识所要转移的功能实体的IUCs在互补性标识符区域中与中性结合区域相对。如上所述，中性结合区域可包含通用碱基，即能够与两种或多种自然存在的核酸碱基配对的碱基。邻近包含特异碱基配对的序列和非特异碱基配对的序列的区域，即互补性标识符区域的是独特反密码子(UA)。UA包含与互补性标识符区域的IUA相同的信息，典型地，UA和IUA具有相同的核苷酸序列。

[0463] 转移步骤和反应步骤如上所述在几个周期中进行以形成双功能复合物。在图5中进行四个周期，但可理解，进行较少的周期，如3或2个周期以生产包含分别来自3或2种功能实体的组分的反应产物。还可进行四个以上的周期，如5至20个周期以形成更多样的展示分子库。得自这些周期的复合物是功能实体和支架之间的反应产物，和寡核苷酸。寡核苷酸可被分成引导区域，即，引导各个构件的退火的区域，和包含已从构件转移至标识符上的独特密码子的编码区域。

[0464] 使用以上编码方法，能够扩增越来越聚焦的子库，得到足够量的能够解码的材料。

[0465] 图6所示的编码方法可产生单体和聚合物编码的分子。图片A：复合物反应产物可使用已与多个功能实体反应的连接实体而产生。图片B：聚合物可使用一种连接实体而产生，后者具有一个能够与具有至少两个反应基团的功能实体连接的反应基团。

[0466] 图7说明一个用于通过延伸原理编码的三链组装程序。A：标识符和构件可在组装平台上组合。该组装平台包含独特反密码子区域和独特反密码子，其中这些两个成分直接通过其序列连接。可以有一个将独特反密码子区域与互补性标识符区域连接在一起的连接区域。B：描述连续反应中使用的标识符，构件和组装平台的所有的组分，其中标识符还包含独特密码子和结合区域，组装平台还包含非编码区域和互补性结合区域。

[0467] 图8显示，内部密码子也可用于三链组装原理。如果选择在具有中间扩增步骤的多轮中进行，这是有用的。

[0468] 图9给出了固相三链展示分子合成。组装平台分子连接到固体支持物上以允许随后将构件连接至连接实体上。用合适的非编码区域和互补性结合区域延伸的组装平台分子的不同库可在单独的小瓶中用于每个步骤。这样能够在每个步骤中使用相同的构件和标识符分子。

[0469] 图10显示使用组装平台原理的顺序转移/延伸。每个孔包含平台分子库。平台分子在随后孔中延伸一个独特反密码子。将标识符和构件分子的库加入第一孔中以允许功能实体的特异退火和转移。反应混合物被转移至下一孔，最后生成标识符展示的库。

[0470] 图11公开了一个用于组合库的交替平行合成的一般方案。在第一步骤中，提供新生双功能分子。新生双功能分子包含作为分子一部分的反应基团，它可出现在化学支架上，且有时在本文中被称作化学反应部位。双功能分子的另一部分包含用于加入标签的引发部位。在标签是核苷酸的情况下，引发部位可以是核苷酸的3’-OH基团或5’-磷酸基团。化学反应部位和引发部位可任选地被连接基团隔开。如果存在连接基团，它可以是核苷酸或核苷酸序列。间隔实体可进一步包含亲水接头，如聚乙烯或聚丙烯以使化学反应部位离开核苷酸。还包含在连接部分中的可以是可选择性断裂的接头以允许实验者将展示分子与编码部分分离。

[0471] 新生双功能分子被分成多个隔室，通常是微滴定板或类似设备的孔，这样容易处理多个空间分开的容器。每个隔室与特定小的分子片段(本文也称作反应物)反应。因此，在第一隔室中，新生双功能分子与第一小分子片段(F1)反应，在第二隔室中；新生双功能分子与第二小分子片段(F2)反应，等。隔室的数目原则上是不确定的，但由于实际原因，该数目通常是5至5000，如10至500。在每个隔室中，小分子片段视情况而定可以是相同的或不同的。在每个隔室中，一种，两种，或更多反应物可参与反应。在药物片段和新生双功能分子之间的反应已在每个隔室中发生之后，加入标签，所述标签可标识小分子片段。在本发明的某些方面，标签是核酸。因此，在第一隔室中，第一核酸标签(T1)被加入反应产物的引发部位，在第二隔室中，第二核酸标签(T2)被加入第二反应产物的引发部位，等。本文考虑和讨论了各种用于酶编码的方法。在每个隔室中酶促加入标签之后，收集隔室的内容物。

[0472] 在第二轮中，将双功能分子的混合物再次分入隔室中。第二轮的隔室的数目不必与第一轮的隔室的数目相同。在每个隔室中，以前轮的产物用作新生双功能分子。因此，出现在支架和第一轮的小分子片段之间的反应产物上的反应基团与第二轮的一个或多个小分子片段反应。因此，在第一隔室中，第一轮的混合反应产物与第一小分子片段(F1)反应，在第二隔室中，第一轮的混合反应产物与第二小分子片段(F2)反应，等。第二轮的小分子片段F1，F2，…Fx可与用于第一轮的小分子片段相同或不同。

[0473] 在反应已发生之后，加入用于指定小分子片段的标签。在第一轮中加入的标签通常包含可用于在第二轮中加入标签以得到包含这些标签的线性标识符的引发部位。在第一隔室中，向反应的产物中加入第一标签，该标签用于标识已与新生双功能分子的反应性反应部位反应的第二轮的反应物；在第二隔室中，向与第二轮的第二小分子片段反应的产物中加入用于标识所述反应物的标签，等。在每个隔室中加入标签之后，将各隔室的内容物在一个共同池中混合。断裂-反应-合并周期可重复适当次数，以得到包含展示分子部分和编码部分的双功能分子的库。该库可用于本文别处公开的选择过程。

[0474] 以上公开了分开-和-混合的一般原理，其中小分子片段和化学反应部位的反应在编码步骤之前发生。显然，这些事件可按照相反的顺序或同时发生。

[0475] 图12在左边示意地显示96孔微滴定板。在每个孔中或在所选数目的孔中，进行右边所示过程。起始，提供双功能分子。双功能分子包含通过接头(线)连接到密码子(长方形)上的化学反应部位(椭圆形)。向密码子的左侧提供结合区域。然后，加入密码子寡核苷酸和夹板寡核苷酸。密码子寡核苷酸具有密码子和侧翼结合区域。夹板设计具有与新生双功能分子的结合区域和密码子寡核苷酸的结合区域互补的序列，使得末端在杂交条件下相互邻接。新生双功能复合物，夹板和密码子寡核苷酸在合适的条件下形成杂交产物。加入连接酶以将密码子oligo偶联至新生双功能复合物上。在第二步骤中，加入药物片段，即反应物并设立条件以提供与化学反应部位的反应。

[0476] 随后将每个孔的内容物合并和，任选地再次分成多个孔用于第二轮反应和编码。在最终步骤中，将孔的合并的内容物用于选择或分离步骤，如本文所公开。

[0477] 图13概述了与图12所示实施方案相比其中编码和反应步骤被颠倒的实施方案。在各种孔中，分配具有连接到寡核苷酸(水平线)上的反应基团(Rx)的新生双功能复合物。在第一步骤中，每个隔室中的反应基团与反应物反应，在第二步骤中，密码子寡核苷酸和夹板与连接酶一起被加入以将密码子寡核苷酸共价连接至反应的新生双功能复合物上，和在第三步骤中，回收连接产物。各孔的内容物可随后被合并和用作双功能复合物的库或再循环用于另一轮反应和加入标签。

[0478] 图14公开了按照图13制成的库，或具有编码部分和展示分子部分的任何其它库在另一轮中的使用。起始，将来自的图13实施方案的孔的合并内容物分配在分开的各孔中。随后将具有与新生双功能分子结合区域互补的结合区域的反密码子寡核苷酸在杂交条件下，即有利于在新生双功能复合物和反密码子寡核苷酸之间杂交产物组装的条件下加入。随后，或在加入反密码子寡核苷酸的同时，加入聚合酶，dNTP混合物(通常，dATP，dGTP，dCTP，和dTTP)，和合适的盐和缓冲剂以使发生延伸。延伸(虚线箭头)将反密码子转录至标识符，因此连接上编码随后在化学反应部位反应的反应物的身份的标签。反密码子寡核苷酸连接至生物素(b)上以允许去除寡核苷酸。

[0479] 图15公开了与多种反应物相结合的各种编码方法的方案。所有的组合都按照本发明。

[0480] 游离反应物/聚合酶编码：新生双功能复合物包括包含反应基团的支架(＝化学反应部位)和包含标识支架的密码子的寡核苷酸部分。密码子与能够与反密码子寡核苷酸的互补性结合区域形成杂交产物的寡核苷酸结合区域连接。将杂交产物经受延伸反应，其中支架寡核苷酸在反密码子上延伸，这样提供具有密码子的支架寡核苷酸。随后，在延伸反应的同时或之前，将反密码子所编码的游离反应物与支架反应。

[0481] 拉链(zipper)构件/聚合酶：新生双功能复合物包括包含反应基团的支架(＝化学反应部位)和包含标识支架的密码子的寡核苷酸部分。密码子与能够与反密码子寡核苷酸的互补性结合区域和反应物的互补性结合区域形成杂交产物的两个寡核苷酸结合区域连接。将杂交产物进行延伸反应，其中支架寡核苷酸在反密码子上延伸，这样提供具有密码子的支架寡核苷酸。随后，在延伸反应的同时或之前，将反密码子所编码的功能实体与支架反应。聚合酶的选择可决定反应或编码的顺序，因为一些聚合酶，如测序酶能够置换连接到功能实体上的结合区域，而其它聚合酶，如Taq聚合酶则不进行结合区域的置换。如果使用拉链构件，那么在支架和功能实体之间得到紧密接近度，这样促进反应的发生。

[0482] E2构件/聚合酶编码：新生双功能复合物包含化学支架和寡核苷酸部分，后者包含用于标识支架的密码子。寡核苷酸部分在密码子的每侧包含两个结合区域。E2构件退火至支架寡核苷酸上使得功能实体与支架紧密接近或就在反密码子的前面形成双螺旋，因此使得聚合酶能够识别双螺旋为结合区域。采用合适的条件和底物能够使标识符寡核苷酸在反密码子上延伸，因此将功能实体的遗传信息转录至标识符上。与支架密码子相对的是通用结合核苷酸，如次黄嘌呤核苷的区段。E2构件的使用允许一罐合成库。

[0483] 环形构件/聚合酶编码：新生双功能复合物包含化学支架和寡核苷酸部分，后者包含用于标识支架的密码子。寡核苷酸部分在密码子的每侧包含两个结合区域。环形构件退火至支架寡核苷酸上使得功能实体与支架紧密接近且就在反密码子的前面形成双螺旋，因此使得聚合酶能够识别双螺旋为结合区域。采用合适的条件和底物能够使标识符寡核苷酸在反密码子上延伸，因此将功能实体的遗传信息转录至标识符。因为构件没有序列能够互补支架密码子序列，该密码子序列环出(loop out)。环形构件的使用允许一罐合成库。

[0484] N构件/聚合酶编码：新生双功能复合物包含通过接头连接到支架密码子上的化学支架。在密码子的一侧或每侧存在结合区域。N构件包含与支架结合区域互补的结合区域和反密码子。功能实体被连接到密码子或结合区域上。在杂交条件下，互补性连接区域杂交且聚合酶在两个方向上延伸，这样将反密码子的遗传信息转移至共价连接至支架上的寡核苷酸。在延伸反应之前，之后或同时，功能实体和支架之间可进行反应。通常，功能实体通过可断裂的接头连接到反密码子寡核苷酸上以允许功能实体转移至支架结构上。

[0485] 游离反应物/连接酶：支架实体连接到包含密码子的寡核苷酸上。支架寡核苷酸进一步包含其连接密码子寡核苷酸的引发部位。连接通过连接酶而进行。连接可以单链或双链形式进行。在单链形式中，支架寡核苷酸的3’OH(或5’-磷酸)被连接至密码子寡核苷酸的5’-磷酸(或3’-OH)上。在双链形式中，使用分别与支架和密码子寡核苷酸的末端互补的寡核苷酸并设计使得末端相互邻接。任选地，连接在两个双链寡核苷酸之间发生，即具有突出端(“粘性端”)的双链支架寡核苷酸被连接至具有互补性突出端的双链密码子寡核苷酸上。连接的种类取决于所选的酶。通常，双链连接是优选的，因为与末端互补的寡核苷酸的引导作用带来较快的反应。互补性寡核苷酸在本文中也被称作夹板寡核苷酸。在将密码子寡核苷酸连接至支架寡核苷酸上之后，之前，或同时，游离反应物和支架之间进行反应。

[0486] 拉链构件/连接酶：支架实体被连接到包含密码子和在支架和密码子之间的结合区域的寡核苷酸上。支架寡核苷酸进一步包含其连接密码子寡核苷酸的引发部位。连接通过连接酶而进行。连接可按照单链或双链形式进行。在单链形式中，支架寡核苷酸的3’OH(或5’-磷酸)被连接至密码子寡核苷酸的5’-磷酸(或3’-OH)上。在双链形式中，使用分别与支架和密码子寡核苷酸的末端互补的寡核苷酸并设计使得末端相互邻接。任选地，连接在两个双链寡核苷酸之间发生，即具有突出端(“粘性端”)的双链支架寡核苷酸被连接至具有互补性突出端的双链密码子寡核苷酸上。连接的种类取决于所选的酶。通常，双链连接是优选的，因为与末端互补的寡核苷酸的引导作用带来较快的反应。互补性寡核苷酸在本文中也被称作夹板寡核苷酸。拉链构件是连接到结合寡核苷酸上的功能实体。结合寡核苷酸与支架寡核苷酸的结合区域互补，因此在杂交条件下形成杂交产物。在密码子寡核苷酸连接至支架寡核苷酸上之后，之前，或同时，功能实体和支架之间进行反应。结合区域在反应物上的使用确保功能实体和支架之间的紧密接近。

[0487] E2构件/连接编码(Ligational encoding)：起始提供一种包含连接到寡核苷酸上的支架的新生双功能复合物，所述寡核苷酸包含密码子和在支架密码子和支架密码子之间的结合区域。支架寡核苷酸还包含其上可连接密码子寡核苷酸的引发部位。支架寡核苷酸被杂交至携带双链部分的E2构件上。与反密码子互补的寡核苷酸使用E2构件作为模板被连接至支架寡核苷酸上。在连接之前，之后或同时，功能实体和支架之间进行反应。

[0488] 环形构件/连接编码：提供包含连接到寡核苷酸上的支架的双功能复合物，其中支架寡核苷酸包含侧翼有两个结合区域的密码子。提供具有与支架寡核苷酸结合区域互补的结合区域的环形构件。在杂交后，支架寡核苷酸的密码子部分环出。环形构件还包含双链密码子部分。与环形构件的反密码子部分互补的寡核苷酸被连接至支架寡核苷酸的游离结合区域。在连接之前，之后或同时，功能实体和支架之间进行反应。

[0489] N构件/连接编码：起始提供新生双功能复合物，其中支架通过合适的接头连接至用于标识所述支架的密码子上或连接到与该密码子连接的结合区域上。具有连接至密码子上的功能实体的构件被连接至支架寡核苷酸上以使支架寡核苷酸与功能实体寡核苷酸连接。连接可在单链或在双链态下进行，这取决于选择用于连接的特定酶。随后，功能实体与支架反应。作为替代方案，功能实体和支架在连接相应的寡核苷酸之前反应。

[0490] 如果已经按照任何的以上编码方法完成一轮，即与新生双功能复合物的反应和标记，可根据任何的以上反应/编码方法开始新一轮。因此，第一轮中的编码和反应可与随后第二或更多轮相同或不同。可生成单个双功能复合物或复合物库。如果考虑库，一罐-合成可使用这样的构件进行，其中使用功能实体和密码子/反密码子之间的共价键，即E2构件，环形构件和N构件列。如果功能实体/反应物和密码子/反密码子之间不存在共价键，即在说明游离反应物和拉链构件的栏中，可进行分开和混合合成。

[0491] 图16显示一种双编码(double encoding)方法，即用于一次编码两种或多种反应物的方法。在某些实施方案中，多编码(multipleencoding)方法允许反应物和支架之间的多种反应。起始，将连接至包含杂交区域，支架密码子和结合区域的寡核苷酸上的支架退火至E2构件上。随后，进行延伸，其中构件的反密码子被转移至标识符上。几种聚合酶形成一个或多个单链核苷酸的突出端。该突出端在本发明中用于连接反密码子oligo和允许聚合酶将标识符寡核苷酸在反密码子寡核苷酸的反密码子区域上进一步延伸。反密码子寡核苷酸的信息的转移允许编码第三游离反应物C。携带A的寡核苷酸和携带B的寡核苷酸之间的退火提供A和B之间的紧密接近和因此提供高局部浓度。因此，当加入游离反应物C时，有利于三种组分之间的反应。双编码的一个优点在于可更换溶剂，使得反应无需在与发生延伸时相同的溶剂中进行。

[0492] 右边说明一个例子，其中以上方法被应用于100种不同的支架寡核苷酸和100种构件。支架寡核苷酸和构件寡核苷酸之间的杂交产物被分成100个不同的孔。在每个孔6
中，允许反密码子寡核苷酸的延伸，加入和与特定游离反应物的反应。生成总共10 种不同的双功能分子。

[0493] 图17公开了用于进行双编码的各种方法。在所有的例子中，编码显示为在反应之前进行，但熟练技术人员能够实现先进行反应并随后编码。当考虑库时，可使用N构件并结合任何编码方法在单个容器中进行反应(一罐合成)。对于剩余的反应物，需要进行一个或多个分开-和-混合步骤。在拉链构件，E2构件，和环形构件与任何编码方法的组合中，单个分开-和-混合步骤是必需的，而两个分开-和-混合步骤对于游离反应物与任何编码方法的组合是必需的。该方案使得熟练技术人员可选择出可用于特定反应的反应/编码方法。如果考虑三-，四-，或多编码，可一次或多次结合使用双编码方案的实施方案和图15的单编码方案的实施方案进行这些编码，得到一种适合特定化学反应的要求的编码/反应方法。

[0494] 图21公开了一种三编码(triple encoding)方法。起始，提供连接到支架寡核苷酸上的支架。支架被连接到支架寡核苷酸的连接区域，并向支架寡核苷酸进一步提供密码子。E2型的两个构件被退火至支架寡核苷酸上，这样使功能实体BBl和BB2与支架紧密接近。在加入构件的同时，之前或之后，提供包含与第一构件的核苷酸序列互补的部分的密码子寡核苷酸用于编码第三反应物(BB3)。使该体系的组分能够相互杂交并提供聚合酶和连接酶。聚合酶进行延伸(如果可能)且连接酶将延伸的寡核苷酸连接在一起以形成双链产物。在编码过程之后，加入第三反应物并提供促进支架和反应物之间反应的条件。最后，进行选择以选择出对靶表现出某种功能的反应产物。所选双功能复合物的标识性寡核苷酸通过PCR扩增和鉴定。

[0495] 右边显示一个用于实施本发明的特定实施方案。相应地，每个密码子是5个核苷酸长且支架两侧的结合区域分别是20个核苷酸。被设计成杂交至支架的结合区域上的构件包含20个核苷酸的互补性序列以及5个核苷酸的密码子。

[0496] 图24显示本发明富集方法的一个实施方案。起始，将库中的每个化学实体(表示为字母A，B，C，..)连接到独特标识符标签(表示为a，b，c，..)上。标识符标签包含有关那个特定化合物或化合物组的例如结构，质量，组成，空间位置，等方面的信息。在第二步骤中，标记的化合物与一组反标签序列(表示为a’，b’，c’，..)混合。每个反标签序列携带把手，如生物素，用于纯化目的。反标签序列包含与标识符序列的序列互补的区段。反标签序列和标识符序列的混合允许形成杂交产物。任选地，可存在不被反标签识别的标记的化学实体。在第三步骤中，携带把手的序列被移出，即标记化合物留在介质中，同时包含把手的物质被转移至第二介质上。如果把手是生物素，它可使用固定化的链霉抗生物素蛋白被转移至第二介质上。

[0497] 纯化的物质可包含不杂交至同源序列上的反标签序列。因为这些反标签序列不偶联至所要选择的化合物上，富集序列可留在介质中。但在一些场合中可优选使过量的反标签序列变成双链，如图25所示，因为双螺旋通常相对选择程序是惰性的。过量的反标签序列可通过使用引物以及合适的聚合酶和核苷三磷酸而被转化成双螺旋态。

[0498] 将步骤4中纯化级分经受选择过程。选择包括探测一组性质，如但不限于对特定蛋白质的亲和性。在这种情况下，不结合特定蛋白质的实体被消除。与结合特定蛋白质的实体复合的反标签可通过如使用其纯化把手而被回收/分离。

[0499] 在步骤5中，分离的反标签任选地通过使用PCR或RTPCR而扩增。

[0500] 在步骤6中，在步骤1中制成的标记实体的起始库可经历另外轮次的复合(complexation)和筛选，即来自步骤5的反标签可被加入步骤1的标记实体的库中并随后进行步骤3，步骤4和步骤5。步骤6可重复。

[0501] 在步骤7中，步骤5的分离的反标签可被克隆并可揭示其身份。如在DNA的情况下，可进行测序，这样标记实体库中具有所选性质的特定实体的身份可被揭示。

[0502] 图26所示的实施方案类似图24，只是使非复合的组分变成惰性的，如果标签和/或反标签由单链DNA或RNA组成，它们可被转化成双链DNA，RNA或其杂交物。这可通过使用引物，核苷三磷酸和聚合酶或转录酶而实现。另外，与图24的方法相比，改变了纯化(通过使用反标签上的纯化把手)和探测性质的顺序。

[0503] 在图27，步骤1中，许多实体(表示为字母A，B，C...)(是混合物或单个化合物)被连接到独特标签，更具体地DNA或RNA序列或其衍生物上，该标签具有关于该化合物或混合物的信息，如结构，质量，组成，空间信息等。

[0504] 在步骤2中，标记实体的所有的标签通过使用引物(任选地携带@-把手如生物素)，核苷酸三磷酸和聚合酶或转录酶而变成双链。剩余的单链DNA或RNA可任选地通过使用核酸酶而被消化。

[0505] 该混合物在步骤3中被探测一组性能，如但不限于对特定蛋白质的亲和性。在这种情况下，不结合至特定蛋白质上的实体被消除。与结合特定蛋白质的实体复合的反标签可通过如使用其@-把手而被回收/分离。

[0506] 分离的反标签可任选地在步骤4中通过使用PCR或RTPCR而扩增。

[0507] 在步骤5中，步骤1的标记实体库可经历与步骤3和4的分离的和任选地扩增的反标签的复合。

[0508] 单链组分在步骤6中通过使用如核酸酶而被消化。该库的剩余的双链子组任选地根据步骤3-6经受更新的库富集。步骤3-6可重复足够次数以得到具有所需性质的合适的化学实体。

[0509] 在步骤7中，步骤4的分离反标签可被克隆并可揭示其身份，如在DNA的情况下，可进行测序，这样标记实体库中的特定实体的身份被揭示。

[0510] 图28涉及一种包括单链寡核苷酸的消化的方法。在第一步骤中，许多实体(表示为字母A，B，C...)(是混合物或单个化合物)被连接到独特标签上，该标签具有关于该化合物或混合物的信息，如结构，质量，组成，空间信息等。

[0511] 在步骤2中，标记实体的混合物与一组互补性反标签合并。反标签可以是，但不限于核苷酸衍生物。反标签可任选地携带@-把手。允许标签和反标签形成复合物。复合可以是，但不限于杂交。一些反标签不与标记实体形成复合物而一些标记实体不与反标签形成复合物。

[0512] 未复合的组分在步骤3中使用如核酸酶(如果标签和/或反标签由DNA或RNA或其杂交物组成)消化。

[0513] 步骤3的混合物在步骤4中被探测一组性质，如但不限于对特定蛋白质的亲和性。在这种情况下，不结合特定蛋白质的实体被消除。与结合特定蛋白质的实体复合的反标签可通过如使用其@把手被回收/分离。步骤4可重复一次或多次。

[0514] 分离的反标签可任选地通过使用PCR或RTPCR而扩增，如步骤5所示。反标签可随后还如图24-27所述而使用。

[0515] 分离的反标签可被克隆且可在步骤6中揭示其身份，如在DNA的情况下，可进行测序，这样标记实体库中的特定实体的身份被揭示。

[0516] 在图29，步骤1中，许多实体(表示为字母A，B，C...)(是混合物或单个化合物)被连接到独特标签，更具体地DNA或RNA序列或其衍生物上，该标签具有关于该化合物或混合物的信息，如结构，质量，组成，空间信息等。

[0517] 标记实体的所有的标签在步骤2中通过使用引物(任选地携带@-把手如生物素)，核苷酸三磷酸和聚合酶或转录酶而变成双链。剩余的单链DNA或RNA可任选地通过使用如核酸酶而被消化。

[0518] 在步骤3中，该混合物被探测一组性质，如但不限于对特定蛋白质的亲和性。在这种情况下，不结合至特定蛋白质上的实体被消除。与附加有结合至特定蛋白质上的实体的标签复合的反标签可通过如使用其@把手被回收/分离。步骤3可重复一次或多次。

[0519] 根据步骤4，分离的反标签可任选地通过使用PCR或RTPCR而扩增。反标签也可随后按照图24-27所述而使用。

[0520] 分离的反标签可在步骤5中被克隆并可揭示其身份，如在DNA的情况下，可进行测序。这样标记实体库中的特定实体的身份被揭示。

[0521] 图30，步骤1产生许多实体(表示为字母A，B，C...)(是混合物或单个化合物)，它们被连接到独特标签，更具体地DNA或RNA序列或其衍生物上，该标签具有关于该化合物或混合物的信息，如结构，质量，组成，空间信息等。

[0522] 在步骤2中，该混合物被探测一组性能，如但不限于对特定蛋白质的亲和性。在这种情况下，不结合至特定蛋白质上的实体被消除。步骤2可被重复。

[0523] 标记实体的所有的标签在步骤3中通过使用引物(任选地携带@-把手如生物素)，核苷酸三磷酸和聚合酶或转录酶而变成双链。剩余的单链DNA或RNA可任选地通过使用如核酸酶而被消化。

[0524] 与结合特定蛋白质的实体的标签复合的反标签可在步骤4中通过如使用其@-把手被回收/分离。反标签可任选地通过使用PCR或RTPCR而扩增。反标签也可随后如图24-27所述而使用。

[0525] 分离的反标签可在步骤5中被克隆并可揭示其身份，如在DNA的情况下，可进行测序，这样标记实体库中的特定实体的身份被揭示。

[0526] 实施例

[0527] 实施例1：支架到标识符分子上的加载

[0528] 氨基-修饰剂(amino-modifier)C6 5’-标记的标识符oligo(5’-X-TCGTAACGACTGAATGACGT-3’，其中X可得自Glen research，cat.#10-1039-90)使用SPDP活化(参见下文)被加载上肽支架(Cys-Phe-Phe-Lys-Lys-Lys，CFFKKK)。氨基-oligo的SPDP-活化使用在100mM Hepes-KOH(pH＝7.5)中的160μl 10nmol oligo，和40μl20mM SPDP进行并在30摄氏度下孵育2h。活化的氨基-oligo用500μlEtOAc提取3次，在Speed-vac中干燥10min和使用以100mMHepes-KOH平衡的微bio-spin柱纯化。随后通过加入10μl 100mM连接实体和在30摄氏度下孵育过夜加载支架。

[0529] 加载的标识符oligo用2M NH4OAc和2体积96％乙醇在80摄氏度下沉淀15min并随后在4摄氏度和15.000g下离心15min。将沉淀块再悬浮在水中并重复沉淀。oligo-沉淀块的洗涤通过加入100μl70％乙醇并随后简短地离心而进行。将oligo重新溶解在50μl H2O中和通过MS进行分析。在将10μl水中的100pmol oligo用10μl离子交换器树脂处理和在25摄氏度下在振荡器上孵育最低2h之后，进行MS分析。在孵育之后，树脂通过离心而去除并将15μl上层清液与7μl水，2μl哌啶和咪唑(分别625mM)和24μl乙腈混合。样品使用质谱仪(Bruker Daltonics，Esquire 3000plus)分析。从以下可以看出，所观察到的质量是7244.93Da，完全符合计算质量，7244.00Da。该实验数据例证了将支架加载到标识符寡核苷酸上的可能性。该加载标识符分子可用于接收来自构件的功能实体。该特定支架具有三个相同的反应基团，即赖氨酸(lycin)侧链的胺基团，和因此可被转移上一个，两个，或三个能够与胺基团反应的功能实体。

[0530]

[0531] 成分解卷积质量分子绝对丰度相对丰度

[0532] A 7244.93 [M-H]- 296744 99.25

[0533] 实施例2：功能实体在构件上的加载

[0534] 功能实体到构件分子上的加载可使用硫醇-oligo(参见下文)进行。生物素5’标记的和thio-modifier C6 S-S(可得自Glen research，cat#10-1936-90)3’-标记的构件oligo(5’-BTGCAGACGTCATTCAGTCGTTACGA-3’)使用NHM被转化成NHS-oligo。

[0535] 将10nmol oligo在Speed-vac中干燥，重新溶解在50μl 100mMDTT，100mM磷酸钠(pH 8.0)中和在37摄氏度下孵育1小时。硫醇-oligo随后使用微bio-spin柱纯化，该柱用100mM Hepes-KOH(pH7.5)平衡。硫醇-oligo通过加入在100mM Hepes-KOH中的100mMNHM(pH.7.5)而转化成NHS-oligo。样品在25摄氏度下孵育过夜。NHS-oligo随后使用bio-spin柱纯化，该柱用MS-级H2O平衡。

[0536]

[0537] 在将10μl水中的100pmol oligo用l0μl离子交换器树脂处理和在25摄氏度下在振荡器上孵育最低2h之后，进行MS分析。在孵育之后，树脂通过离心被去除并将15μl上层清液与7μl水，2μl哌啶和咪唑(分别625mM)和24μl乙腈混合。样品使用质谱仪(BrukerDaltonics，Esquire 3000plus)分析。从以下可看出的所观察到的质量是
8369.32，完全符合计算质量，8372.1。这些实验数据例证了转化构件寡核苷酸上的连接实体的可能性。该产物可随后用于连接可转移的功能实体。

[0538]

[0539] 成分解卷积质量分子绝对丰度相对丰度

[0540] A 8369.32 [M-H]- 160905 96.87

[0541] NHS-oligo随后用于加载功能实体。进行功能实体(4-戊炔酸)的EDC活化，其中将50μl在DMF中的200mM功能实体与50μl在DMF中的200mM EDC混合和在25摄氏度下在振荡器上孵育30min。加载随后使用在Speed-vac中冻干的1nmol NHS-oligo和10μl活化构件(参见下文)进行。将它在25摄氏度下孵育5min并随后与30μl 100mMMES(pH6.0)混合。将加载的NHS-oligo使用bio-spin柱纯化，该柱用100mM MES pH 6.0平衡。
加载的构件oligo随后立即用于转移反应而不进行任何MS分析。这是由于功能实体在用于MS测量的条件下结构不稳定。

[0542]

[0543] 该实验例证了功能实体在构件分子上的完全加载，所述分子备用于转移至接受性反应基团(当退火至互补性标识符分子上时)上。

[0544] 可如上所述被加载到构件上的功能实体的另一例子是如下所示的5-己炔酸。同样，对该化合物不进行MS分析，因为功能实体在用于MS测量的条件下结构不稳定。

[0545]

[0546] 实施例3：功能实体从构件转移至标识符分子

[0547] 以下实验中的连接实体(attachment entity，AE)是被加载到如实施例1制备的标识符上的支架，如肽，CFFKKK，或接受性反应基团例如为在实施例1中用作起始原料的氨基修饰的寡核苷酸。这些连接实体允许转移分别三个或一个功能实体。

[0548] 用于该实验的标识符是如实施例1所述加载有CFFKKK的标识符寡核苷酸。该实验中的功能实体(FE)是4-戊炔酸，其加载描述于实施例2。加载有支架的标识符分子被退火至加载构件分子上以使连接实体和功能实体紧密接近。退火通过标识符分子中的标识符区域和构件分子中的互补性序列引导。

[0549] AE-TCGTAACGACTGAATGACGT

[0550] +

[0551] FE-AGCATTGCTGACTTACTGCAGACGTB

[0552] ↓

[0553] AE-TCGTAACGACTGAATGACGT

[0554] FE-AGCATTGCTGACTTACTGCAGACGTB

[0555] 在标识符和构件分子之间的退火步骤之后，发生转移反应，其中功能实体被转移至标识符分子上。

[0556] 退火使用在0.1M MES缓冲剂中的600pmol构件和400pmol标识符分子在25摄氏度下在振荡器中进行2小时。构件的反应性部分(功能实体)在退火(参见下文)过程中被转移至标识符分子上的连接实体上的一个氨基基团上。在退火之后，样品通过微旋凝胶过滤而纯化和通过MS进行分析。使用等量的样品(约100pmol)和离子交换器树脂制备用于MS分析的样品和在25度下在振荡器中孵育最低2h。在孵育之后，树脂被离心掉并向15μl上层清液中加入7μl水，2μl哌啶和咪唑(分别625mM)和24μl乙腈。样品在质谱仪(Bruker Daltonics，Esquire 3000plus)上进行分析。所观察到的质量(参见下文)是7323.45Da，完全符合计算质量，7324.00Da。因此，标识符分子在转移反应之后的MS光谱显示出对应于标识符分子上的被转移功能实体的质量。

[0557]

[0558] 成分解卷积质量分子绝对丰度相对丰度

[0559] A 8369.18 [M-H]- 75183 99.24→NHS-CUGU

[0560] B 7323.45 [M-H]- 38073 50.26→TEANGER

[0561] C 7244.34 [M-H]- 20775 27.42→GCAFFULD

[0562] 以下给出功能实体的转移的另一例子，其中使用氨基oligo直接作为在标识符分子上的AE。用于该实验的构件分子上的功能实体是4-戊炔酸，其公开于实施例2。

[0563] 退火使用在0.1M MES缓冲剂中的500pmol构件和标识符分子和并将该混合物在25摄氏度下在振荡器中孵育2小时而进行。构件的反应性部分(功能实体)在退火(参见下文)过程中被转移至标识符分子上的氨基基团。在退火和转移之后，样品通过微旋凝胶过滤而纯化和通过MS进行分析。使用等量的样品(约100pmol)和离子交换器树脂制备用于MS分析的样品和在25度下在振荡器中孵育最低2h。在孵育之后，树脂通过离心被去除并向15μl上层清液中加入7μl水，2μl哌啶和咪唑(分别625mM)和24μl乙腈。

[0564]

[0565] 样品在质谱仪(Bruker Daltonics，Esquire 3000plus)上进行分析。所观察到的质量是6398.04Da，完全符合计算质量，6400.00Da。因此，标识符分子在转移功能实体之后的MS光谱显示出对应于标识符分子上的被转移功能实体的质量。该实施例表明，功能实体可使用构件分子和标识符分子的这种设置被转移。

[0566]

[0567] 成分解卷积质量分子绝对丰度相对丰度

[0568] A 8368.93 [M-H]- 85789 99.30

[0569] B 6398.04 [M-H]- 77957 90.23

[0570] 以下给出功能实体的转移的另一例子，其中使用氨基oligo直接作为标识符分子。用于该实验的功能实体是5-己炔酸，如实施例2所示制备。

[0571] 退火使用在0.1M MES缓冲剂中的500pmol构件和500pmol标识符分子并在25摄氏度下在振荡器中孵育2小时而进行。构件的反应性部分(功能实体)被转移至标识符分子(参见下文)上的氨基基团。在退火和转移之后，样品通过微旋凝胶过滤而纯化和通过MS进行分析。使用等量的样品(约100pmol)和离子交换器树脂制备用于MS分析的样品和在25摄氏度下在振荡器中孵育最低2h。在孵育之后，树脂通过离心被去除并向15μl上层清液中加入7μl水，2μl哌啶和咪唑(分别625mM)和24μl乙腈。

[0572]

[0573] 样品在质谱仪(Bruker Daltonics，Esquire 3000plus)上进行分析。所观察到的质量是6411.96Da，完全符合计算质量，6414Da。因此，标识符分子在转移功能实体之后的MS光谱表现出对应于转移到标识符分子上的功能实体的质量。该实施例表明，功能实体可使用构件分子和标识符分子的这种设置被转移。

[0574]

[0575] 成分解卷积质量分子绝对丰度相对丰度

[0576] A 6411.96 [M-H]- 86999 98.85

[0577] B 8368.87 [M-H]- 84433 93.78

[0578] 实施例4：标识符分子的延伸以转移独特密码子

[0579] 在功能实体(FE)转移至标识符分子上的连接实体(AE)上之后，标识符分子被延伸以使标识被转移功能实体的独特密码子转移至标识符分子上。这通过加入合适的聚合酶和包含野生型核苷酸(dATP，dTTP，dCTP，dGTP)的聚合酶缓冲剂而实现。这会将标识符分子的3’-端延伸至构件分子的5’-端的末端。

[0580] 延伸标识符分子以转移独特反密码子优选在转移FE之后进行，如下所示。

[0581] FE-AE-TCGTAACGACTGAATGACGT

[0582] -AGCATTGCTGACTTACTGCAGACGTB

[0583] ↓

[0584] FE-AE-TCGTAACGACTGAATGACGTCTGCT

[0585] -AGCATTGCTGACTTACTGCAGACGTB

[0586] 延伸使用在缓冲剂中的15单位的Taq聚合酶而进行，所述缓冲剂在延伸缓冲剂(20mM HEPES-KOH，40mM KCl，8mM MgCl2，pH＝7,4)中包含0.4mM的每种核苷酸。在延伸反应之后，样品使用MS进行分析。MS分析使用约100pmol纯化的延伸混合物在一半体积的离子交换器树脂中进行和在25摄氏度下在振荡器中孵育最低2h。在孵育之后，树脂通过离心而被去除并将15μl上层清液与7μl水，2μl哌啶和咪唑(分别625mM)和24μl乙腈混合。样品在质谱仪(Bruker Daltonics，Esquire 3000plus)上分析。

[0587] 以下给出在带有转移的4-戊炔酸的标识符分子上的延伸作用的MS数据。

[0588]

[0589] 成分解卷积质量分子绝对丰度相对丰度

[0590] A 8368.79 [M-H]- 60417 98.68

[0591] B 7922.53 [M-H]- 51334 83.85

[0592] 所观察到质量是7922.53Da，完全符合计算质量，7924.00Da。标识符分子在功能实体的转移反应和编码区域(独特密码子)的延伸反应之后的MS光谱显示出对应于被转移的功能实体和标识符分子上的延伸的质量。该实施例表明，功能实体可使用具有长于标识符分子的构件分子的这种设置而转移且标识符分子可使用聚合酶在转移过程之后延伸。这表现出将来自相同的构件的功能实体和独特密码子转移至标识符分子的可能性。

[0593] 显示转移和延伸的另一例子是针对具有功能实体5-己炔酸的构件。以下给出在具有转移的5-己炔酸的标识符分子上延伸的MS数据

[0594]

[0595] 成分解卷积质量分子绝对丰度相对丰度

[0596] A 7936.99 [M-H]- 107170 97.88

[0597] B 8369.04 [M-H]- 79840 72.92

[0598] 所观察到的质量是7936.99Da，完全符合计算质量，7938.00Da。标识符分子在功能实体的转移反应和编码区域(独特密码子)的延伸反应之后的MS光谱表现出对应于被转移的功能实体和在标识符分子上的延伸的质量。该实施例还表明，功能实体可使用具有长于标识符分子的构件分子的这种设置而转移且标识符分子可使用聚合酶在转移过程之后延伸。这例证了将功能实体和独特密码子两者从一个构件分子转移至一个标识符分子上的可能性。

[0599] 实施例5：库设计

[0600] 标识符分子可被设计成在各种条件下操作最想要。但它应该包含对该功能极重要的一些成分。标识符分子应该包含可退火至构件上的序列和可容纳各种功能实体的连接实体。以下是关于标识符分子在延伸区域中如何可被设计的例子。在转移和编码的每个步骤过程中被延伸的区域可使用各种方案设计。重要的是，在构件和标识符之间必须存在碱基对匹配以使用聚合酶有效地延伸。这可使用恒定的区域，例如描述于图3(a)的结合区域，或也如图3(b)所示的允许结合至任何给定序列上的区域而实现。也可使用这些方案的组合。

[0601] 由于标识符和构件分子的匹配(以下所示的步骤1)，延伸过程中的第一步骤无需特殊结合区域。但随后的步骤需要对标识符分子足够互补的结合区域以允许杂交，因为酶，优选聚合酶必须能够结合至双螺旋上和进行延伸。以下实例显示编码程序中的四个步骤。该延伸过程可继续以得到合适的构件转移数。该实例中的结合区域包含6个核苷酸，但这可根据构件的设计而变化。

[0602] 在以前反密码子中容纳可能错配的可能性是使用通用核酸碱基，即能够与一种以上的天然核酸碱基进行碱基成对的核酸碱基。可能的碱基是可与胞苷，胸腺嘧啶核苷，和腺苷形成碱基对的次黄嘌呤核苷(尽管次黄嘌呤核苷：腺苷成对大概在双链DNA中不十分正确地配合，因此当螺旋在该嘌呤：嘌呤成对处凸出时可能付出能量代价)。原则上，可使用允许独特密码子延伸的任何设计。

[0603]

[0604] 在每个步骤中通过转移独特密码子而编码和延伸编码区域的例子：

[0605] 1.

[0606] GCA CAC ATG CAT GAG CAC AC G

[0607] CGT GTG TAC GTA CTC GTG TG CGT GTG TCGATG TGA CTA

[0608] 2.

[0609] GCA CAC ATG CAT GAG CAC AC GCA CAC AGCTAC ACT GAT

[0610] CGT GTG TAC GTA CTC GTG TG CGT GTG TCGATG TGA CTA

[0611] 3.

[0612] GCA CAC ATG CAT GAG CAC AC GCA CAC AGCTAC ACT GAT

[0613] CGT GTG TAC GTA CTC GTG TG CGT GTG IIIIII TGA CTA CAATCG TGC AAC[0614] 4.

[0615] GCA CAC ATG CAT GAG CAC AC GCA CAC AGCTAC ACT GAT GTTAGC ACG TTG[0616] CGT GTG TAC GTA CTC GTG TG CGT GTG IIIIII TGA CTA CAATCG TGC AAC[0617] 5.

[0618] GCA CAC ATG CAT GAG CAC AC GCA CAC AGCTAC ACT GAT GTTAGC ACG TTG[0619] CGT GTG TAC GTA CTC GTG TG CGT GTG IIIIII TGA CTA IIIIII TGC AAC CTCTGT ACT TTG

[0620] 6.

[0621]

[0622] 延伸使用60pmol引物和模板在延伸缓冲剂(20mM HEPES-KOH，40mM KCl，8mM MgCl2，pH＝7,4)和10mM DTT中进行。对于该实验中的延伸，使用20U AMV-RT(Promega M510b)。

[0623] MS分析使用约100pmol延伸混合物在一半体积的离子交换器树脂中进行和在25摄氏度下在振荡器中孵育最低2h。在孵育之后，树脂通过离心而被去除并将15μl上层清液与7μl水，2μl哌啶和咪唑(分别625mM)和24μl乙腈混合。样品使用质谱仪(Bruker Daltonics，Esquire 3000plus)分析。

[0624] 以上实例所示的在步骤3中的引物/模板组合的延伸在以下的数据MS图中给出。分析显示模板的质量，15452.14Da(预期15453.86Da)和延伸的引物的质量，15328.92(预期15331.90Da)。没有鉴定出未延伸(或部分延伸)引物的质量，表明引物完全延伸。该实验例证了将密码子转移至标识符分子上的可能性，即使反密码子之前是另一反密码子。

[0625]

[0626] 成分解卷积质量分子绝对丰度相对丰度

[0627] A 15452.14 [M-H]- 161269 100.00 -EKO46

[0628] B 15328.92 [M-H]- 89333 55.39 -EXT.

[0629] 在单独的实验中，检查如上所述在步骤7中的引物/模板组合的延伸。MS数据在下图中给出。数据显示出延伸的引物的质量，28058.14Da(预期28052.30Da)。同样，没有鉴定出未延伸(或部分延伸)引物的质量，表明引物完全延伸。该实验例证了将密码子转移至标识符分子上的可能性，即使反密码子之前是多个反密码子。因此，一种制造包含独特密码子的编码区域的完整方法对于库是可行的。

[0630]

[0631] 成分解卷积质量分子绝对丰度相对丰度

[0632] A 16184.59 [M+H]+ 48389 66.47

[0633] B 28058.14 [M+H]+ 64120 88.08

[0634] +ETT.

[0635] 总之，这些实验表明，当使用具有包含次黄嘌呤核苷的螺旋的相邻独特密码子时，聚合酶可延伸独特反密码子序列。这样能够在转移功能实体的每个步骤中将独特反密码子转移至标识符分子上。该实验显示可在将要在编码过程中被延伸的反密码子之前的反密码子区域之后使用结合区域。相同的方案可用于连续步骤中以允许编码带有连接到连接实体上的多个功能实体的分子。

[0636] 在库已生成且已进行第一轮选择之后，所选的标识符分子可用作用于下一轮库的来源。所选的标识符分子可使用例如PCR扩增和如下所示的限制酶消化而用于随后轮的选择。

[0637] 新标识符分子的PCR产物：

[0638] GCA CAC AGCTAC ACT GAT GTTAGC ACG TTG GAGACA TGA AAC ATTCGA

[0639] CCG TTA TGC GTA ATG GC

[0640] 用EcoRI切割以得到新标识符分子：

[0641] GCA CAC AGCTAC ACT GAT GTTAGC ACG TTG GAGACA TGA AAC ATTCGA C[0642] 该新标识符分子包含编码以前轮选择中所选的被展示的分子的独特密码子。该标识符分子引导下一库的组装以得到具有优选的功能实体的库。但正确的编码仍通过延伸过程而确定。

[0643] 实施例6.通过延伸程序编码时的柔性接头和环出结构(loop-outstructure)。

[0644] 编码过程可被设计成允许在标识符分子中形成环出区域。编码过程也可使用在互补性标识符区域和互补性结合区域之间的柔性接头进行。

[0645] 环出技术在图18中给出，其中标识符区域退火至互补性标识符区域上且结合区域退火至互补性结合区域上。这形成一段不直接参与退火过程的单链核苷酸。该退火允许通过延伸而转移反密码子区域和优选另一可用于下一轮延伸的结合区域。结合区域应该足够长以确保正确退火和生产性延伸。如果结合区域太短，该延伸不完全。熟练技术人员能够通过简单的反复实验确定结合区域的长度。通常5至7个核苷酸足够用于结合区域。

[0646] 另一例子是在互补性标识符区域和互补性结合区域之间使用柔性接头。这在图19中显示。标识符区域确保构件至标识符上的有效退火。柔性接头随后确保互补性结合区域退火至结合区域上以允许延伸。接头可以是允许互补性结合区域和互补性结合区域之间间隔的任何种类的化学结构，例如，聚乙二醇(PEG)，多胺，多核苷酸(如DNA，RNA，LNa)和聚碳水化合物。接头长度可变化但标识符区域和结合区域的同时退火必须是可能的。

[0647] 使用柔性接头的设置使用不同的PEG接头和不同长度的互补性结合区域进行了测试。用于该实例的PEG接头(空间亚磷酰胺(spacephosphoramidite)9和18)得自Glen research(分别为目录#10-1909和10-1918)。

[0648] 以下显示延伸的标识符分子的序列。在标识符区域和互补性标识符区域之间有21个核苷酸长的退火。因此有42个核苷酸的区域，表示以前轮编码中的延伸密码子。促进延伸的互补性结合区域是9核苷酸区域，另外测试5和14核苷酸区域的延伸。最后有允许延伸的14核苷酸区域。

[0649] F引物引发位点延伸

[0650] [----- 21-----------] [------------------------ 42-----------------------] [-- 9 --] [----- 14 ----]

[0651] ACCTCACCTGTGTATCGAGCG GCAGTAGCG GGCCT CGTACGACC TGTTC GGCTACTGC CGAGC CCGCATCGC

[0652] TGGAGTCGACACATAGCTCGC-------------------------- X --------------------------GGCGTAGCG CATAG CGCAATCGC

[0653] ▲↑

[0654] 互补性柔性接头互补性

[0655] 标识符区结合区

[0656] 具有柔性接头的构件oligo使用标准程序(Promega，cat#4103)使用T4多核苷酸32
激酶用 P进行5’-标记。该标识符分子与构件在延伸缓冲剂(20mM Hepes，40mM KCl，8mM MgCl2，pH 7.4，10mM DTT)中通过加热至80摄氏度2min并随后慢慢冷却至约20摄氏度而退火。延伸在30摄氏度下使用约20个单位的测序酶(USB)1小时而进行。寡核苷酸复合物随后使用微旋凝胶过滤(BioRad)纯化。将甲酰胺染料加入样品中，然后加载到10％脲聚丙烯酰胺凝胶上。该凝胶使用放射自显影法(Kodak，BioMax胶卷)显影。该实验的结果在图20中给出。

[0657] 该凝胶显示：泳道1，在结合区域中有5、9或14个核苷酸的三个5’-标记(32P)构件oligo的混合物；泳道2，使用具有9空间接头和18核苷酸结合区域的构件oligo延伸；泳道3，使用具有9空间接头和9核苷酸结合区域的构件oligo延伸；泳道4，使用不具有接头和具有9核苷酸结合区域的构件oligo延伸；泳道5，使用具有9空间接头和14核苷酸结合区域的构件oligo延伸；泳道6，使用具有18空间接头和14核苷酸结合区域的构件oligo延伸；泳道7，使用不具有接头和具有14核苷酸结合区域的构件oligo延伸；泳道8，使用不具有接头和具有5核苷酸结合区域的构件oligo延伸。

[0658] 结果显示，有效延伸可使用柔性接头以及结合区域而实现。结果还显示，延伸在没有柔性接头和仅小(5个核苷酸)结合区域时是可能的。最后的结果是在该实施例开始处描述的环出设置的一个例子，其中环出区域是在以上序列中描述的42个核苷酸。

[0659] 实施例7：从通过chemeticsTM编码的484-元小分子库中选择整合蛋白αVβ3配体

[0660] 程序的概述

[0661]

[0662] DF：药物片段/功能实体

[0663] B：生物素

[0664] SA：链霉抗生物素蛋白

[0665] 用于生产双功能复合物库(其中库的每个成员包含合成分子和可被解码以确立合成分子的合成历史的标识符)的方法包括几个步骤，例证如下。在第一步骤(一般程序1)中，四种不同的标识符寡核苷酸被加载以支架分子或药物片段。在该实施例中，加载使用在标识符oligo上的氨基基团作为用于药物片段/支架分子的连接点而进行。标识符可被认为是新生双功能复合物。

[0666] 为了制备构件oligo，相同的载体(carrier)oligo起始使用一般程序2被加载以十一种不同的药物片段。十一种加载的载体oligo随后使用一般程序3被连接至第一和第二轮的反密码子oligo上，这样得到11种用于第一轮的构件和十一种用于第二轮的构件。

[0667] 库形成在一般程序4中详细描述和包括将四种不同的标识符oligo与第一轮的十一种不同的构件混合。为了偏离库，一种标识符和一种第一轮构件以低于其它组分量100倍的量加入。在提供用于标识符和构件之间退火的条件下，标识符oligo的支架分子和药物片段之间进行交联。标识符oligo随后使用聚合酶和使用构件反密码子作为标识符而延伸。在延伸之后，药物片段通过断裂药物片段和oligo之间的键而从构件中释放。用过的构件oligo通过链霉抗生物素蛋白珠粒被分离。

[0668] 第二轮包括将构件加入在第一轮中得到的新生标识符-合成分子复合物中。为了偏离库，将十一种第二轮构件之一以低于10种其它构件的用量100倍的量加入。第二轮遵循与第一轮上述的相同的方案。所形成的库是4*11*11＝484个成员。已知是靶的配体的8
一个成员仅以3*10 双功能复合物之一的库浓度出现。

[0669] 库随后经受选择过程，例如公开于一般程序5。选择包括将库加入涂覆有固定靶的孔中。在该库与靶孵育之后，将库的未结合成员通过洗涤而去除并断裂合成分子和标识符之间的键。裂开的标识符被收集和通过PCR而扩增。扩增的标识符使用一般程序6解码。

[0670] 一般程序1：标识符oligo的加载

[0671] 将10μL三乙醇胺(TEA)(0.1M，在DMF中)与10μL具有戊-4-烯醛作为胺保护基团的构件(BB)(0.1M，在DMSO中)混合。从该混合物中取出6.7μL并与3.3μL EDC[1-乙基-3-(3-二甲基氨基丙基)碳二亚胺盐酸盐](0.1M，在DMF中)混合和在25摄氏度下孵育30分钟。将10μL构件-EDC-TEA混合物加入在0.1M HEPES缓冲剂((4-(2-羟基乙基)-1-哌嗪乙烷磺酸，SIGMA)(pH 7.5)中的10μL氨基oligo并与oligo孵育30分钟。

[0672] 在该半小时过程中，将另一6.7μL BB-TEA混合物与3.3μLEDC(0.1M，在DMF中)混合和在25摄氏度下孵育30分钟。将10μL该第二BB-EDC-TEA混合物与10μL 0.1M HEPES缓冲剂一起随后加入氨基oligo混合物中以保持1∶1比率的DMSO/DMF∶H2O。随后混合物被孵育30分钟。

[0673] 在该半小时过程中，将另一6.7μL BB-TEA混合物与3.3μLEDC(0.1M，在DMF中)混合和在25摄氏度下孵育30分钟。将10μL该第三BB-EDC-TEA混合物与10μL 0.1M HEPES缓冲剂一起随后加入氨基oligo混合物中以保持1∶1比率的DMSO/DMF∶H2O。随后混合物被孵育30分钟。

[0674] 加载的oligo随后通过使用以水平衡的柱(Biospin P-6，BioRad)进行凝胶过滤而纯化。戊-4-烯醛胺保护基团随后通过加入0.25倍体积的25mM I2(在1∶1水∶四氢呋喃(THF)中)和在37摄氏度下孵育2小时而去除。该混合物随后通过使用以水平衡的旋转柱(Biospin P-6，BioRad)进行凝胶过滤而纯化。加载的标识符oligo通过ES-MS进行分析。

[0675] 实施例7.1.1

[0676] 标识符oligo 1.1：

[0677]

[0678] N：5′-氨基-修饰剂5(Glen research cat#10-1905-90)

[0679] S：间隔基C3 CPG(Glen research cat#20-2913-01)

[0680] P：PC Spacer亚磷酰胺(Glen research cat#10-4913-90)

[0681]

[0682] 加载的标识符oligo 1.1通过ES-MS进行分析：

[0683] 预期的质量：11709Da

[0684] 观察到的质量：11708Da

[0685] 实施例7.1.2

[0686] 标识符oligo 1.2：

[0687] 5’NSPACCTCAGCTGTGTATCGAGCGGCAGCAGTGCCG-TCG-3’

[0688] N：5′-氨基-修饰剂5(Glen research cat#10-1905-90)

[0689] S：间隔基C3CPG(Glen research cat#20-2913-01)

[0690] P：PC Spacer亚磷酰胺(Glen research cat#10-4913-90)

[0691]

[0692] 加载的标识符oligo 1.2通过ES-MS进行分析：

[0693] 预期的质量：11647Da

[0694] 观察到的质量：11641Da

[0695] 实施例7.1.3

[0696] 标识符oligo 1.3：

[0697] 5’-NSPACCTCAGCTGTGTATCGAGCGGCAGCGCACACG-TCG-3’

[0698] N：5′-氨基-修饰剂5(Glen research cat#10-1905-90)

[0699] S：间隔基C3 CPG(Glen research cat#20-2913-01)

[0700] P：PC Spacer亚磷酰胺(Glen research cat#10-4913-90)

[0701]

[0702] 加载的标识符oligo 1.2通过ES-MS进行分析：

[0703] 预期的质量：11761Da

[0704] 观察到的质量：11759Da

[0705] 实施例7.1.4

[0706] 标识符oligo 1.4：

[0707] 5’-NSPACCTCAGCTGTGTATCGAGCGGCAGCGGATACG-TCG-3’

[0708] N：5′-氨基-修饰剂5(Glen research cat#10-1905-90)

[0709] S：间隔基C3 CPG(Glen research cat#20-2913-01)

[0710] P：PC Spacer亚磷酰胺(Glen research cat#10-4913-90)

[0711] 加载的标识符oligo：

[0712]

[0713] 预期的质量：11775Da

[0714] 观察到的质量：11775Da

[0715] 一般程序2：载体oligo的加载

[0716] 将10-15nmol载体oligo 2冻干和重新溶解在27.5μl H2O中。向其中加入7.5μl1M HEPES pH 7.5，10μl 2-氨基-戊-4-烯醛保护(烯丙基甘氨酸)构件(0.1M在二甲基亚砜中)，和5μl DMT-MM[4-(4，6-二甲氧基-1，3，5-噻嗪-2-基)-4-甲基吗啉鎓氯化物](0.5M在水)。混合物在25-30摄氏度下孵育4-16小时。oligo通过凝胶过滤(Biospin P-6，BioRad)而纯化。为了将构件的甲基酯部分转化成羧酸，加入5μl 0.4M NaOH并将混合物在80摄氏度下孵育20min。混合物随后通过加入10μl 0.5M HEPES pH 7.5和5μl
0.4M HCl而中和。加载的构件oligo通过凝胶过滤(Biospin P-6，BioRad)而纯化和通过ES-MS而分析。

[0717] 载体oligo 2：

[0718] 3’-2GGAGTCGACACATAGCTCGCp-5’

[0719] 2：羧基dT(Glen research cat#10-1035-90)

[0720] p：5’磷酸

[0721] 实施例7.2.1

[0722]

[0723] 加载的载体oligo 2.1通过ES-MS进行分析：

[0724] 预期的质量：6856Da

[0725] 观察到的质量：6857Da

[0726] 实施例7.2.2

[0727]

[0728] 加载的载体oligo 2.2通过ES-MS进行分析：

[0729] 预期的质量：6944Da

[0730] 观察到的质量：6945Da

[0731] 实施例7.2.3

[0732]

[0733] 加载的载体oligo 2.3通过ES-MS进行分析：

[0734] 预期的质量：6798Da

[0735] 观察到的质量：6800Da

[0736] 实施例7.2.4

[0737]

[0738] 加载的载体oligo 2.4通过ES-MS进行分析：

[0739] 预期的质量：6917Da

[0740] 观察到的质量：6919Da

[0741] 表I

[0742]

[0743] 一般程序3：反密码子低聚物与加载的载体oligo的连接

[0744] 将500pmol加载的载体oligo与750pmol反密码子低聚物和750pmol夹板oligo混合。将混合物冻干和重新溶解在15μl水中。低聚物通过加热和慢慢冷却至20摄氏度而退火。加入15μl TaKaRa连接酶混合物(Takara Bio Inc)并将反应体系在20摄氏度下孵育l小时。将混合物通过凝胶过滤(Biospin P-6，BioRad)纯化并通过在NovexTBE-脲凝胶(Invitrogen)上跑胶等分试样而检测连接效率。

[0745] 用于第一轮编码的构件oligo的实施例

[0746] 实施例7.3.1.1

[0747]

[0748] 2：羧基dT(Glen research cat#10-1035-90)

[0749] P：5’磷酸

[0750] X：5’生物素

[0751] 连接效率：＞95％

[0752] 实施例7.3.1.2

[0753]

[0754] 连接效率：＞95％

[0755] 实施例7.3.1.3

[0756]

[0757] 连接效率：＞95％

[0758] 表II

[0759]

[0760]

[0761] 用于第二轮编码的构件oligo的实施例

[0762] 实施例7.3.2.1

[0763] 构件oligo 3.2.1：

[0764]

[0765] 连接效率：＞95％

[0766] 实施例7.3.2.2

[0767]

[0768] 连接效率：＞95％

[0769] 实施例7.3.2.3

[0770]

[0771] 连接效率：＞95％

[0772] 表III

[0773]

[0774]TM

[0775] 一般程序4：通过chemetics 编码小分子库TM

[0776] 实施例7.4.1：通过chemetics 编码484-元小分子库

[0777] 实施例7.4.1.1第一编码轮

[0778] 将2pmol加载的标识符oligo 1.1与200pmol每个加载的标识符oligo 1.2，1.3，和1.4合并(总共602pmol加载的标识符oligo)。将这些与0.7pmol构件oligo 3.1.3.，和10种不同的其它第一轮构件oligo各72.7pmol混合(如3.1.1和3.1.2；总共727pmol加载的构件oligo)。将oligo冻干和重新溶解在50μl延伸缓冲剂(EX)[20mMHEPES，150mM NaCl，8mM MgCl2]中。混合物被加热至80摄氏度和慢慢冷却至20摄氏度以使标识符和构件oligo有效退火。加入5μl 0.5M DMT-MM(在水中)并将混合物在37摄氏度下孵育4小时。

[0779] 标识符oligo在构件oligo标识符上的延伸通过加入3μl每种脱氧核苷酸三磷酸[dATP，dGTP，dCTP，dTTP]的10mM混合物和3μl 13个单位/μl测序酶(Amersham Biosciences)而进行。混合物随后在30摄氏度孵育过夜。随后将3μl 2M NaOH加入并将混合物在80摄氏度下孵育10分钟，随后通过加入3μl 2M HCl而中和。将该混合物随后通过从凝胶过滤柱(Biospin P-6，BioRad)中经过而纯化。加入0.25倍体积的25mM I2(在1∶1THF∶水中)，混合和在37摄氏度下孵育2小时。加入60μl结合缓冲剂(BF)[100mM HEPES，150mM NaCl]和水300μl。

[0780] 将混合物加入在BF缓冲剂中预洗涤3次的链霉抗生物素蛋白-琼脂糖珠粒(Amersham Biosciences)中并在室温下孵育10分钟，随后在轻微搅拌下在冰上孵育10分钟。珠粒随后用水洗涤三次。延伸的标识符oligo通过施用100μl NH3 1∶1(在水中)和在室温下孵育5分钟而从结合到链霉抗生物素蛋白-琼脂糖珠粒上的构件oligo中脱离。

[0781] 7.4.1.2第二编码轮

[0782] 向洗脱物中加入0.36pmol第二轮加载的构件oligo 3.2.2和各36.4pmol的10种不同的其它第二轮构件oligo(如3.2.1和3.2.3；总共364pmol加载的第二轮构件oligo)并将混合物冻干和重新溶解在50μl EX缓冲剂中。编码基本上按照7.1.1所述而进行。

[0783] 7.4.1.3最终延伸

[0784] 将洗脱的标识符oligo冻干和溶解在50μl EX缓冲剂中。随后将200pmol引物E38[5’-XTTTTAGATGGCAGAT-3’，X＝CXS生物素]。退火通过将混合物在80摄氏度下加热并慢慢冷却至20摄氏度而进行。标识符oligo的延伸通过加入3μl每种脱氧核苷酸三磷酸[dATP，dGTP，dCTP，dTTP]的10mM混合物和3μl 13单元/μl测序酶而进行。混合物随后在30摄氏度孵育2小时。将该混合物随后通过从凝胶过滤柱(Biospin P-6，BioRad)中经过而纯化。该洗脱物用于选择。取出等分试样(样品7.1.3)，用于分析选择程序中的输入。

[0785] 一般程序5：选择

[0786] Maxisorp ELISA孔(NUNC A/S，Denmark)在4摄氏度下用在PBS缓冲剂[2.8mM NaH2PO4，7.2mM Na2HPO4，0.15M NaCl，pH 7.2]中的各100μL 的2μg/mL 整合蛋白αVβ3(Bachem)包被过夜。随后整合蛋白溶液被替换为200μl封闭缓冲剂[TBS，0.05％ Tween 20(SigmaP-9416)，1％牛血清白蛋白(Sigma A-7030)，1mM MnCl2]，在室温下放置3小时。随后孔用封闭缓冲剂洗涤10次并将编码的库在用封闭缓冲剂稀释100倍之后加入至孔中。在室温下2小时孵育之后，孔用封闭缓冲剂洗涤10次。在最终洗涤之后，清除孔的洗涤缓冲剂并随后倒置并暴露于300-350nm的UV光30秒。随后将100μl没有Tween-20的封闭缓冲剂立即加入每个孔中，将孔振荡30秒，并取出包含洗脱的标识符的溶液用于PCR分析(样品5.1)

[0787] 一般程序6：选择输入和输出的分析

[0788] 使用对应于标识符oligo的5’端的引物和E38引物针对选择的输入(样品7.3.1)和输出(样品5.1)进行PCR。PCR使用Ready-To-Go(RTG)PCR珠粒(Amersham Biosciences)和10pmol每种引物在25μl的反应体积中进行。PCR反应包括，94摄氏度下2分钟的起始变性步骤，随后在94摄氏度下变性30秒、在58摄氏度下退火1分钟和在72摄氏度下延伸1分钟的30-45个周期。包括在72摄氏度下2分钟的最终延伸步骤。PCR产物通过琼脂糖凝胶电泳而分离并将对应于预期大小的带从凝胶上切割并使用QIA快速凝胶提取试剂盒(QIAGEN)纯化。

[0789] 为了测序各个PCR片段，将纯化PCR产物根据制造商的教导克隆到pCR4-TOPO载体(Invitrogen)中。所得混合物使用标准步骤用于转化TOPl0大肠杆菌细胞(Invitrogen)。细胞在包含100μg/ml氨苄西林的生长培养基上涂板和在37摄氏度下放置12-16小时。

[0790] 挑取各个E.coli克隆并转移至包含50μl水的PCR孔。这些孔随后煮沸5分钟并将来自每个孔的20μl混合物使用RTG PCR珠粒和5pmol每种M13正和反向引物根据制造商的教导用于PCR反应。每种PCR产物的样品随后用外切核酸酶I(USb)和虾碱性磷酸酶(USb)处理以去除降解的单链DNA和dNTPs并使用DYEnamic ET循环测序试剂盒(Amersham Biosciences)根据制造商的教导测序并在MegaBace 4000毛细管测序仪(Amersham Biosciences)上分析该反应。序列输出用ContigExpress软件(Informax Inc.)分析。

[0791] 存在于库中的药物片段的概述：

[0792] 表IV

[0793]

[0794]8

[0795] 该库具有编码来自3*10 标识符之一的整合蛋白αVβ3配体A(Feuston B.P.等人，Journal of Medicinal Chemistry，2002，45，5640-5648中的分子7)的能力。

[0796]

[0797] 从上表可以看出，该库具有每3*108标识符编码一个配体A的能力(1×1×1＝18
个/301×1001×1001约3*10 个)

[0798] 实施例7.6.1：选择步骤的输入和选择步骤的输出的测序分析结果。

[0799] 与编码配体A相容的密码子组合未在来自选择之前的编码库的28个序列中发现，8
这与该密码子组合预期的低丰度(3*10 中的1个)相符。

[0800] 在整合蛋白αVβ3-包被的孔中进行选择之后，与配体A的编码相容的密码子组合存在于来自编码库的19个序列中的5个中。

[0801] 这些数对应于富集系数(3*108/(19/7))＝8*107。

[0802] 实施例8：使用大小排阻柱选择编码的分子

[0803] 该实施例说明可以使用柱分离针对各种靶进行复合物选择。在该实施例中，使用大小排阻层析(SEC)，但也可使用其它种类的层析，其中将靶结合的复合物从未结合的复合物中分离出来。

[0804] 复合物在该实施例中以连接到具有预定序列的寡核苷酸序列上的生物素分子为例。因此，标识符的核苷酸序列确定了作为生物素的合成分子的身份。编码序列可具有任何长度且可被分成用于编码各种构件的离散区域，见本文在别处的讨论。另外，展示分子可具有线性或支架结构。

[0805] 生物素-AATTCCGGAACATACTAGTCAACATGA

[0806] 生物素已知结合链霉抗生物素蛋白。生物素与链霉抗生物素蛋白的结合可使标识符与靶分子连接和因此改变标识符的物理和化学性能，如表观分子量。该改变可使用如大小排阻层析检测：

[0807] 将78pmol复合物分子加载到Superdex 200，PC 3.2/30柱 (_KTA-FPLC，AmershamPharmaciaBiotech)上并在PBS冲剂中在流速0.050ml/min下分析。如下可看出，复合物分子停留时间是约35分钟。如果靶(83pmol链霉抗生物素蛋白)在相同的条件下被分析，停留时间是约相同的。靶分子的低吸收是由于用于测量的波长(260nm)所致。在该波长下，消光系数对于复合物中的核苷酸是高的但对于蛋白质靶是低的。

[0808]

[0809] 但如果复合物分子与靶分子(78pmol复合物和83pmol靶在PBS缓冲剂中温育约1h)预混合以允许结合并随后在相同的条件下分析，停留时间变化明显(28分钟)。该变化是由于复合物结合至靶上而导致的分子量(或流体力学体积)增加所致。这使得靶结合的复合物与未结合的复合物分离。包含复合物和靶分子的级分被合并并使用合适的引物扩增。该扩增的标识符可随后用于解码所富集的展示分子的结构。

[0810] 对双功能复合物的库进行柱选择的策略具有两个主要优点。首先，富集(靶结合的)的复合物在未结合的复合物之前被洗脱，这急剧降低来自未结合的复合物的背景。第二，在柱上的富集由于在基质孔中的所有的分离步骤而是大程度的。

[0811] 使用该方案对靶结合的复合物的分离取决于该复合物的分子量但主要是靶分子量。靶分子量可通过将靶连接至能够增加表观分子量的支持物上而调节。增加的分子量可通过减少在柱上的停留时间而提高分离作用。这可例如使用融合蛋白质，抗体，珠粒，或以多聚体形式交联靶而进行。因此，靶蛋白质可被表达为融合蛋白质或特定抗体可用于增加分子量。靶可被固定在能够允许分离的小珠粒上且靶可使用标准试剂交联形成多聚体或交联至载体分子，例如另一蛋白质上。优选，增加分子量使得靶分子在柱的外水体积中洗脱。

[0812] 可使用的其它种类的柱分离的例子是亲和层析，疏水相互作用层析(HIC)，和离子交换层析。可用于大小排阻层析的除Superdex之外的柱介质的例子是：Sephacryl，Sepharose或Sephadex。

[0813] 实施例9：通过分开-和-混合而形成25-元库和配体选择

[0814] 人整合蛋白受体αv/βIII涉及许多生物功能如炎症反应和血栓形成以及细胞迁移和转移瘤传播。αv/βIII的天然配体包含与受体结合袋相互作用的RGD三-肽共有基序。因此，许多医学研究集中于合成和鉴定对αv/βIII受体具有增加的亲和性的小分子RGD-模拟物。包含偶联至GD二肽上的精氨酸生物等排物(bioisostere)的一种模拟物，Feuston 5(Feuston等人，J Med Chem.2002 Dec 19；45(26)：5640-8.)与RGD-三肽相比具有10倍增加的αv/βIII(KD＝111nM)亲和性。

[0815]

[0816] 在此，使用分开和混合方法合成25元小分子库，其中包括Feuston 5配体和24种其它的小分子。库根据与受体的相互作用而筛选且DNA通过PCR而扩增，测序和鉴定相应的小-分子配体。

[0817] 方案

[0818] 库生成：

[0819] 图22和图23显示用于合成库的一般方案。起始，36nt寡核苷酸(ID)

[0820] 5′-XACCTCAGCTGTGTATCGAGCGGCAGCGGCCTCGTCG

[0821] 通过标准亚磷酰胺化学(购自DNA Technology A/S Denmark)而合成，其中包含通过间隔基-PEGl8(Glen research目录#10-1918-90)和光可断裂的(Glen research目录#10-4913)间隔基键接的5’-端氨基-基团(Glen research目录#10-1905-90)。1nmol ID寡核苷酸使用以下支架加载程序A加载上戊烯酰基-Asp(OMe)-OH：

[0822] 将1nmol ID寡核苷酸冻干并随后溶解在20μl具有90mM磺基-N-羟基琥珀酰亚胺(sNHS，Merck)的100mM Na-硼酸盐缓冲剂(pH 8.0)中。支架的预活化：将15μl在DMSO中的100mM戊烯酰基-Asp(OMe)-OH与15μl在DMF中的100mM1-乙基-3-[3-二甲基氨基丙基]碳二亚胺盐酸盐(EDC，Merck)温育并在加入至ID溶液之前在30摄氏度下温育30min。在30摄氏度下温育45min之后，加入另外30μl预活化支架并将溶液在30摄氏度下温育另外45min。过量的支架，活化剂，溶剂和盐通过双凝胶过滤使用Bio-rad Microspin柱6去除在MS-级H2O中洗脱。加载通过电喷雾-MS(Bruker Inc)分析而检验。随后，氨基-保护基团通过加入0.2倍体积的在混合物THF/H2O(1∶1)中的25mM碘并在37摄氏度下温育2h而去除。过量碘通过加入20mM 2-巯基乙醇而淬灭，之后使用Bio-rad 6 Microspin柱进行凝胶过滤纯化。根据MS-分析，加载的和去保护的ID寡核苷酸被估计＞75％纯(数据未示)。

[0823] 500pmol D-加载的ID oligo通过在80摄氏度下变性2min随后慢慢冷却至环境温度而被退火至500pmol具有序列5’-TGTGCGACGAGGCCGCTGC的互补性oligo上。具有4nt突出端(用于有效退火和连接)的双链oligo对(ID-ds)使用以下步骤用于分开&混合反应程序，以下示意给出：

[0824] 加入第2位的密码子和游离反应物：将500pmol ID-ds分成5个孔(在此，eppendorf管)。将100pmol具有以下序列的特定第二位密码子寡核苷酸

[0825] Z1-0：pCACAAGTACGAACGTGCATCAGAG/pTCCTCTCTGATGCACGTTCGTACT

[0826] Z1-1：pCACATAGTCTCCTCCACTTCCATG/pTCCTCATGGAAGTGGAGGAGACTA

[0827] Z1-2：pCACATACATCGTTCCAGATACCG/pTCCTCATGGAAGTGGAGGAGACTA

[0828] Z1-3：pCACATCCAGTGCAAGACTGAACAG/pTCCTCTGTTCAGTCTTGCACTGGA

[0829] Z1-4：pCACAAGCATCACTACTCTGTCTGG/pTCCTCCAGACAGAGTAGTGATGCT

[0830] 加入每个孔中并将oligo在20μl体积中使用连接缓冲剂[30mMTris-HCl(pH7.9)，10mM MgCl2，10mM DTT，1mM ATP]和10个单位的T4-DNA连接酶在环境温度下连接1小时。

[0831] 随后，将5种连接产物使用Biorad 6旋转柱根据制造商的教导各个纯化并冻干。然后，使特定反应物与支架根据图22所示的方案使用上述的加载方案A进行反应。过量游离反应物，试剂和缓冲剂通过凝胶过滤而去除。将洗脱物合并，冻干和再悬浮在40μl H2O中，然后加入10μl 25mM碘(在THF/H2O中，比率1∶1)用于去保护。

[0832]

[0833] N-戊烯酰基保护的甘氨酸反应物与ID oligo反应和随后使用碘去保护。反应在37摄氏度下温育2h。过量碘通过加入1μl 1M 2-巯基乙醇而淬灭并在环境温度下放置
5min，然后使用spin-凝胶过滤(Bio-rad 6)而纯化样品。

[0834] 样品被分成5个孔用于使用下列密码子寡核苷酸而加入第三位密码子：

[0835] Z0-0 ：pAGGACGAGCAGGACCTGGAACCTGGTGCGTTCCTCCACCACGTCTCCG/pGCACCAGGTTCCAGGTCCTGCTCG

[0836] Z0-1 ：pAGGACTCGACCACTGCAGGTGGAGCTCCGTTCCTCCACCACGTCTCCG/pGGAGCTCCACCTGCAGTGGTCGAG

[0837] Z0-2 ：pAGGACGTGCTTCCTCTGCTGCACCACCGGTTCCTCCACCACGTCTCCG/pCGGTGGTGCAGCAGAGGAAGCACG

[0838] Z0-3 ：pAGGACCTGGTGTCGAGGTGAGCAGCAGCGTTCCTCCACCACGTCTCCG/pGCTGCTGCTCACCTCGACACCAGG

[0839] Z0-4 ：pAGGACTCGACGAGGTCCATCCTGGTCGCGTTCCTCCACCACGTCTCCG/pGCGACCAGGATGGACCTCGTCGAG

[0840] p＝5’磷酸。

[0841] 然后与游离反应物反应，方式如在第二位时描述的或在图22中给出的，只是以下不同：F3反应物使用方案A不能有效地反应，因为F3在有机溶剂中的溶解度差。因此，F3使用以下方案(方案B)进行反应：将连接的和冻干的样品溶解在35μl 100mM Na-硼酸盐缓冲剂(pH8.0)中，然后加入10μl在水中的100mM F3反应物和5μl 500mM 4-(4，6-二甲氧基-1，3，5-三嗪-2-基)-4-甲基吗啉鎓氯化物(DMT-MM，羧酸活化剂)并在25摄氏度下温育2h。在偶联反应之后，过量反应物，试剂和盐通过凝胶过滤而去除，方式如描述于方案A中的。剩余的步骤如对于位置2所述的方式而进行。

[0842] 在进行选择步骤之前，进行链交换反应以确保没有组装错误退火的oligo。链-交换通过总共体积80μl的包含200μM脱氧核糖核苷酸(dNTP)的测序酶缓冲剂中退火200pmolAH361oligo(5’-CGGAGACGTGGTGGAGGAAC-3’)，然后加入20个单位的测序酶和在30摄氏度下温育1h而进行。在延伸之后，反应混合物用于选择步骤而没有进一步纯化。

[0843] 选择

[0844] Maxisorp ELISA孔(NUNC A/S，Denmark)分别用在PBS缓冲剂[2.8mM NaH2PO4，7.2mM Na2HPO4，0.15M NaCl，pH 7.2]中的100μL 2μg/mL整合蛋白αVβ3(Bachem)在4摄氏度下包被过夜。随后将整合蛋白溶液替换为200μl封闭缓冲剂[TBS，0.05％Tween
20(Sigma P-9416)，1％牛血清白蛋白(Sigma A-7030)，1mM MnCl2]，在室温下置1小时。随后将孔用250μl封闭缓冲剂洗涤2次并在用封闭缓冲剂稀释编码库20倍之后将5μl编码库加入孔中。在室温下2小时孵育之后，孔用20×250μl封闭缓冲剂洗涤。

[0845] 洗脱

[0846] 在最终洗涤之后，清除孔的洗涤缓冲剂并随后倒置并使用被设定为70％功率的透过式照明器(trans-illuminator)使孔暴露于300-350nm的UV光30秒

[0847] 将100μl没有Tween-20的封闭缓冲剂立即加入每个孔中，将孔振荡30秒，并取出包含洗脱模板的溶液用于PCR分析。

[0848] PCR扩增

[0849] 关于输入和输出的PCR使用对应于Frw-27oligo(ACCTCAGCTGTGTATCGAG)的5’端的引物和AH361引物。5μl洗脱的DNA用于25μl反应体系的PCR，其中使用10μl Eppendorphhotmastermix 2.5×和AH361&Frw-27各10pmol。进行PCR：(ENRICH30)：94摄氏度2min，随后30周期[94摄氏度30sec，58摄氏度1min，72摄氏度1min]，随后72摄氏度10min。

[0850] 克隆和测序

[0851] 将TOP0-TA(Invitrogen Cat#K4575-J10)连接物与4μl PCR产物，1μl盐溶液，1μl载体反应。反应物在RT下孵育30min。将热休克的感受态TOPl0大肠杆菌细胞融化并放在冰上。加入5μl连接反应物。在冰上30min之后，在42摄氏度水中热休克30sec，随后放在冰上。加入250μl SOC并将细胞在37摄氏度下孵育1h，然后铺展在LB-氨苄青霉素板上，随后在37摄氏度下孵育过夜。

[0852] 挑选大肠杆菌单克隆并转移至包含50μl水的PCR孔。菌落在94摄氏度下孵育5分钟并将20μl用于与各5pmol的TOP0引物M13前&M13反(AH365/AH366)和Ready-To-Go PCR珠粒(Amersham)在25μl PCR反应中使用，其中使用PCR程序EK 050：94摄氏度2min，随后30×(94摄氏度4sec，50摄氏度30sec，72摄氏度1min)，随后72摄氏度10min。

[0853] 引物和游离核苷酸通过将1μl EXO/SAP混合物1∶1加入2μl PCR产物中而降解。孵育在37摄氏度下进行15min并随后在80摄氏度下进行15min。加入5pmol T7引物(AH368)并加入水至12μl.随后，加入8μl DYEnamic ET循环测序终止剂混合物，随后使用30轮(95摄氏度20sec，50摄氏度15sec，60摄氏度1min)进行PCR-循环。纯化使用seq96 spin板(Amersham)进行，随后在MegaBace排序器上进行分析。

[0854] 库序列输出

[0855] 18个成功的序列提供来自选择步骤的分离DNA的信息并在以下给出

[0856] 输出序列

[0857]

[0858] 在1位上被加亮的5聚体序列对应于天门冬氨酸，在2位(中心)上的加亮20聚体序列对应于甘氨酸和加亮的20聚体序列(距连接突出物+4个碱基)对应于F3构件。因此，18个序列中的16个鉴别出确切的Feuston-5配体(F3-G-D)为结合整合蛋白αv/βIII受体的单个优势小分子。注意，仅F3 BB在3位上被鉴别，这支持了向该精氨酸生物等排物的非常强的偏移。

[0859] 数据表明，小分子库的化学合成，标记，选择和鉴别法在使用本技术时是高度有效8 10
的，预期可容易地规模化和可应用于包含超过10-10 种不同分子的库。

[0860] 图22显示对库生成的概述，其中使用加载有D(天冬氨酸)的独特的第一位oligo，在第二位上5种不同的反应物/oligo对和在第三位上5种不同的反应物/oligo对。最终，组装成由1×5×5＝25种分别连接到其相应的独特DNA密码子上的不同三聚体组成的库。箭头表示连接的位置。

[0861] 实施例9：编码的多组分反应(MCR)产物

[0862] 9.1使用4-羧基苯甲醛制备包含醛的支架-oligo

[0863] 将4-羧基苯甲醛(支架)在DMF(25μL，150mM)中的溶液与25μLEDC在DMF中的150mM溶液混合。混合物在25摄氏度下放置30min。加入50μL在100mM HEPES缓冲剂pH 7.5中的氨基oligo(10nmol)并将反应混合物在25摄氏度下放置20min。过量支架通过用EtOAc(500μL)提取而去除并将剩余的EtOAc通过在speedvac中旋转10min而真空去除。该混合物随后通过使用水平衡的旋转柱(BiospinP-6，BioRad)进行凝胶过滤而纯化。加载的oligo通过ES-MS而分析。

[0864]

[0865] 成分解卷积质量分子绝对丰度相对丰度

[0866] A 6716.11 [M-H]- 301899 100.00←—

[0867] B 6737.93 [M-H]- 50426 16.70

[0868] 氨基oligo L1.1用于章节9.2：Mw＝7154

[0869] L1.1：5’-5CG ATG GTA CGT CCA GGT CGC AX

[0870] 3′X＝3′生物素

[0871] 5′5＝5’氨基C6(Glen research目录#10-1906-90)

[0872] 氨基oligo L1.2用于章节9.3：Mw＝6585

[0873] L1.2：5’-GCG ACC TGG AGC ATC CAT CGX

[0874] 3′X＝氨基-C2-dT-3′-PO4(Glen research目录#10-1037-90)

[0875] 9.2多组分反应

[0876] 将苯甲醛加载的L1.1 oligo(200pmol)的溶液冻干和重新溶解在10μl H2O中。加入在甲醇中的2-甲氧基乙基胺(10μl，40mM)，在甲醇中的3-呋喃-2-基-丙烯酸(10μl，40mM)，和在甲醇中的环己基异氰化物(10μl，40mM)并在37摄氏度下孵育过夜。将反应混合物用40H2O稀释并通过凝胶过滤使用以水平衡的旋转柱(Biospin P-6，BioRad)纯化。
oligo上的MCR-产物通过ES-MS而分析。

[0877] 起始苯甲醛加载的L1 oligo(A)在MS-光谱中与UGI产物(B)一起被鉴定。

[0878]

[0879] 成分解卷积质量分子绝对丰度相对丰度

[0880] A 7205.25 [M-H]- 25420 100.00

[0881] B 7599.64 [M-H]- 52950 70.20

[0882] C 7307.54 [M-H]- 30545 90.50

[0883] D 7463.73 [M-H]- 25475 33.77

[0884] 9.3多组分反应

[0885] 将苯甲醛加载的L1.2 oligo(320pmol)的溶液冻干和重新溶解在10μL H2O中。加入在甲醇中的2-氨基乙醇(10μL，40mM)，在甲醇中的3-甲氧基-丙酸(10μL，40mM)，和在甲醇中的异氰基乙酸乙酯(10μL，40mM)和在37摄氏度下孵育过夜。将反应混合物用
40μL H2O稀释并通过凝胶过滤使用以水平衡的旋转柱(Biospin P-6，BioRad)纯化。oligo上的MCR-产物通过ES-MS而分析。

[0886] 起始苯甲醛加载的L1 oligo(A)在MS-光谱中与三种产物，B二酮基哌嗪，C UGI产物和H胺产物一起被鉴别。

[0887]

[0888] 成分解卷积质量分子绝对丰度相对丰度

[0889] A 6716.10 [M-E]- 27984 100.00

[0890] B 6845.98 [M-H]- 13154 47.01

[0891] C 6976.15 [M-H]- 8913 31.85

[0892] D 6818.39 [M-H]- 10156 36.29

[0893] E 6887.71 [M-H]- 10187 36.40

[0894] F 6872.09 [M-H]- 8871 31.70

[0895] G 6913.59 [M-H]- 5551 19.84

[0896] H 6894.50 [M-H]- 4579 16.36

[0897] 9.4编码

[0898] 过量反应物，活化剂，溶剂和盐通过双凝胶-过滤使用Bio-rad微旋柱(Microspin column)6而去除并在MS-级H2O中洗脱，并且加载通过电喷雾-MS(Bruker Inc)分析而确认，然后编码连接到寡核苷酸L1上的展示分子。

[0899] 将已与其它三种组分反应形成如上所述的展示分子的章节9.2中的苯甲醛加载的寡核苷酸L1.1与密码子寡核苷酸L2，L3和L4以及夹板寡核苷酸S1，S2和S3(下示的序列)混合和使用连接酶(T4 DNA连接酶)连接。连接使用以下条件进行。双链寡核苷酸通过将编码链(L1，L2，L3和L4)与夹板寡核苷酸(S1，S2和S3)混合形成7寡核苷酸杂交产物(用于有效退火和连接)而实现。使用各约50pmol的特定寡核苷酸并将寡核苷酸在20μl的体积中使用连接缓冲剂[30mM Tris-HCl(pH7.9)，10mM MgCl2，10mM DTT，1mM ATP]和10个单位的T4-DNA连接酶在环境温度下连接1小时。

[0900] L1：5′-CGATGGTACGTCCAGGTCGCA-3′

[0901] S1：5′-ATCGTGCTGCGACCT-3′

[0902] L2：5′-GCACGATATGTACGATACACTGA-3′

[0903] S2：5′-GTGCCATTCAGTGT-3′

[0904] L3：5′-ATGGCACTTAATGGTTGTAATGC-3′

[0905] S3：5′-TGTATGCGCATTAC-3′

[0906] L4：5′-GCATA AAATCGATAATGCAC-3′

[0907] 包含标签的标识符使用正向(FP)和反向(RP)引物使用以下条件扩增：5μl连接的标识符寡核苷酸在使用10μl Eppendorphhotmastermix 2.5×和各10pmol的AH361&Frw-27的25μl反应体系中用于PCR。进行PCR：(ENRICH30)：94摄氏度2min，随后30个周期的[94摄氏度30sec，58摄氏度1min，72摄氏度1min]，随后72摄氏度10min。

[0908] FP：5′-CGATGGTACGTCCAGGTCGCA-3′

[0909] RP：5′-GTGCATTATCGATTTGTATGC-3′

[0910] 扩增的标识符寡核苷酸被克隆以确认组装的寡核苷酸包含密码子区域(CGTCC，GTACG，AATGG和TCGAT)。将TOP0-TA(InvitrogenCat#K4575-J10)连接物与4μl PCR产物，1μl盐溶液，lμl载体反应。反应在RT下孵育30min。将热休克的感受态TOP10大肠杆菌细胞融化并放在冰上。加入5μl连接反应物。在冰上30min之后，在42摄氏度水中热休克30sec，并随后放在冰上。加入250μl SOC并将细胞在37摄氏度下孵育1h，然后铺展在LB-氨苄青霉素板上，随后在37摄氏度下孵育过夜。

[0911] 挑选大肠杆菌单克隆并转移至包含50μl水的PCR孔。菌落在94摄氏度下孵育5分钟并将20μl与各5pmol的TOP0引物M13正&M13反(AH365/AH366)和Ready-To-Go PCR珠粒(Amersham)用于25μl PCR反应，其中使用PCR程序：94摄氏度2min，随后30×(94摄氏度4sec，50摄氏度30sec，72摄氏度1min)，随后72摄氏度10min。

[0912] 引物和游离核苷酸通过将1μl EXO/SAP混合物1∶1加入2μl PCR产物中而降解。孵育在37摄氏度下进行15min并随后在80摄氏度下进行15min。加入5pmol T7引物(AH368)并加入水至12μl.随后，加入8μl DYEnamic ET循环测序终止剂混合物，随后使用30轮(95摄氏度20sec，50摄氏度15sec，60摄氏度1min)进行PCR-循环。纯化使用seq96 spin板(Amersham)进行，随后在MegaBace测序器上进行分析。

[0913] 实施例10：实体加载到标签上。

[0914]

[0915] 步骤：

[0916] 将25μL在DMF中的150mM构件溶液与25μL在DMF中的150mM EDC溶液混合。混合物在25摄氏度下放置30min。加入50μL 100mM HEPES缓冲剂pH 7.5中的氨基oligo(10nmol)并将反应混合物在25摄氏度下放置20min。过量的构件通过用EtOAc(500μL)提取而去除。过量EtOAC在减压下在speedvac中被去除。构件加载的氨基oligo使用NH40ac经乙醇沉淀两次并通过电喷雾质谱(ES-MS)而分析。

[0917] 实施例11：

[0918] 以下实施例说明标记(tagging)原理用于鉴别从实体库中分离的具有期望的性能的实体的用途。该原理在图1中示意给出。

[0919] 用于鉴别与整合蛋白受体αV/β3结合的复合物的肽的DNA-标记(tagging)。

[0920] 材料：

[0921] ·纯化的人整合蛋白αV/β3(Chemicon Inc.)

[0922] ·链霉亲合素Sepharose 6B(AmershamPharmacia)

[0923] ·Nunc Immuno moduleU8 Maxisorp(Biotecline cat#Nun-475078)

[0924] ·剪切的鲱鱼DNA(Sigma)

[0925] ·Taq-聚合酶(Promega)和10X Taq-pol缓冲剂

[0926] ·结合缓冲剂[100mM NaCl，5mM MgCl2，50mM Tris-HCl，pH 7.5]

[0927] ·UV-透过式照明器(transilluminator)

[0928] ·SPDP[N-琥珀酰亚胺基3(2-吡啶基二硫代)丙酸酯](MolecularProbes，Cat：S-1531)

[0929] ·Micro Bio-Spin 6(Bio-Rad cat：732-6221)

[0930] ·具有以下序列的6种标记寡核苷酸：

[0931] TO#1：5’-XCTATGCGGACTGACTGGTAC-3’

[0932] TO#2：5’-XCTATGATGCTTAGGCGGTAC-3’

[0933] TO#3：5’-XCTATGTACCGTACGTGGTAC-3’

[0934] TO#4：5’-XCTATGAATGCTAGCTGGTAC-3’

[0935] TO#5：5’-XCTATGGATTGCGCGTGGTAC-3’

[0936] TO#6：6’-XCTATGCCACTATTAGGGTAC-3’

[0937] 其中X＝适用于连接功能实体如肽，小分子或聚合物的5’C6氨基修饰剂(Glen research cat#10-1916-90)。

[0938] ·具有以下序列的互补性(模板)寡核苷酸：

[0939] CO#1：

[0940] 5’-BPTATAGGATCCGTACCAGTCAGTCCGCATAGGAATTCTAGT-3’

[0941] CO#2：

[0942] 5’-BPTATAGGATCCGTACCGCCTAAGCATCATAGGAATTCTAGT-3’

[0943] CO#3：

[0944] 5’-BPTATAGGATCCGTACCACGTACGGTACATAGGAATTCTAGT-3’

[0945] CO#4：

[0946] 5’-BPTATAGGATCCGTACCAGCTAGCATTCATAGGAATTCTAGT-3’

[0947] CO#5：

[0948] 5’-BPTATAGGATCCGTACCACGCGCAATCCATAGGAATTCTAGT-3’

[0949] CO#6：

[0950] 5’-BPTATAGGATCCGTACCCTAATAGTGGCATAGGAATTCTAGT-3’

[0951] 其中，B＝5’-生物素(Glen research Cat#10-1953-95)和P＝光可断裂的接头(Glen research cat#10-4913-90)。

[0952] 下划线的10核苷酸序列对于每种标记寡核苷酸都是独特的且具有独特的互补性寡核苷酸对应物。

[0953] 粗体加亮的序列适用于克隆目的。

[0954] ·用于PCR扩增的寡核苷酸

[0955] AO#1：5’-BPTATAGGATCCGTACC-3’

[0956] AO#2：5’-ACTAGAATTCCTATG-3’

[0957] ·具有以下组成的6种肽

[0958] P#1：GRGDSPC

[0959] P#2：GRADSPC

[0960] P#3：GRGESPC

[0961] P#4：GDGRSPC

[0962] P#5：CKKK

[0963] P#6：CFFKKK

[0964] A＝丙氨酸，G＝甘氨酸，R＝精氨酸，D＝天门冬氨酸，P＝脯氨酸，F＝苯丙氨酸，K＝赖氨酸和E＝谷氨酸盐。所有肽通过N-端羧基化和C-端酰胺化而封端。肽由Schafer-N A/S，DK-Denmark供给。

[0965] 方案

[0966] 步骤1：用特定寡核苷酸(TO#1-6)标记肽#1-6。

[0967] 每个TO寡核苷酸包含单个5’末端氨基亲核试剂(X)，后者可在以下反应中使用异双官能交联剂SPDP被共价键接至肽的半胱氨酸硫醇-基团上。

[0968]

[0969] 方法：将5nmol氨基-寡核苷酸干燥和重新悬浮在160μl 100mMHepes-OH，(pH7.5)中。加入40μl 20mM SPDP(在DMSO中)和在30摄氏度下温养2h。样品用3×500μl乙酸乙酯提取和在speedvac中干燥10min。样品使用以100mM Hepes-OH平衡的Micro bio-spin 6柱纯化。添加10μl 0.1M肽和在25摄氏度下温育2h。用2M NH4OAC/乙醇沉淀两次。重新溶解在50μl H2O中和通过电喷雾-MS分析(BrukerInc.)而确认标记。

[0970] 步骤2：将互补性寡核苷酸(CO#1-6)退火至来自步骤1的TO-肽复合物上。

[0971] 方法：

[0972] 将10pmol加载了相应的肽的TO#1-6加入在结合缓冲剂[100mMNaCl，5mM MgCl2，50mM Hepes-OH，pH 7.5]中包含CO#1-6各20pmol和总体积100μl的混合物。样品在80摄氏度下加热2分钟并经30分钟慢慢冷却至室温。

[0973] 步骤3：纯化双链DNA-肽复合物(可有可无的！)。

[0974] 在退火之后，仅已被退火至其互补性寡核苷酸序列上的标记分子包含功能实体和生物素把手(参见图1)。因此，为了减少选择步骤中的“噪音”，单链标记分子可在预选步骤中使用生物素把手从库中被去除。

[0975] 方法：

[0976] 将50μl链霉抗生物素蛋白-琼脂糖6B浆在3×1ml结合缓冲剂中洗涤，然后将珠粒重新悬浮在100μl结合缓冲剂中。将CO/TO-肽退火混合物加入链霉抗生物素蛋白珠粒中和在25摄氏度下在搅拌下温育30min。随后，沉淀链霉抗生物素蛋白珠粒，丢弃上层清液并将珠粒用1ml结合缓冲剂洗涤三次。将珠粒重新悬浮在100μl结合缓冲剂中并最后使用光断裂方法释放CO/TO-肽复合物。光断裂反应通过将样品在Vilber-Lourmat UV-透过照明器TFX-20M上以70％效能温养30秒而进行。将洗脱的CO/TO-肽复合物移出至新管。

[0977] 步骤4：针对与整合蛋白αV/β3受体结合的配体富集文库。

[0978] 测试分子库与固定在塑料表面上的整合蛋白αV/β3受体的结合。

[0979] 方法：

[0980] 将Nunc 8板的单个孔在标准磷酸盐-缓冲盐水(PBS)中与100μl的1μg/ml整合蛋白受体温育过夜。将该孔用100μl PBS洗涤五次，随后使用100μl在PBS-缓冲剂中的0.5mg/ml剪切的鲱鱼DNA在室温下封闭2h。

[0981] 最后将该孔使用100μl整联蛋白结合连接缓冲剂[Tris-HCl(pH7.5)，137mM NaCl，1mM KCl，1mM MgCl2，1mM CaCl2和1mM MnCl2]洗涤五次。

[0982] 将CO/TO-肽复合物加入固定的整合蛋白中和在37摄氏度下温育30min。上层清液被去除并将固定的整合蛋白使用100μl整合蛋白结合缓冲剂洗涤5次。洗脱CO/TO-配体复合物，其中将样品在80摄氏度下加热5min。样品被冷却至室温。1μl样品用于PCR扩增，中在包含10mM Tris-HCl pH 9.0，50mM KCl，1mM MgCl2，0.1％TritonX-100，dATP，dCTP，dGTP和dTTP各250mM的反应体系中使用AO#1和2各10pmol作为外部引物。样品起始在94摄氏度下变性2min接着进行30个周期：在94摄氏度下变性30秒，在44摄氏度下退火
30秒和在72摄氏度上延伸15秒。最后，样品被沉淀。

[0983] 步骤5：分离单链模板。

[0984] 为了随后的选择和扩增轮，扩增的PCR产物的非模板链应该被去除。该步骤通过生物素化的模板oligo的特定纯化而进行。

[0985] 方法：

[0986] 将50μl链霉抗生物素蛋白-琼脂糖6B用1ml结合缓冲剂洗涤三次。将洗涤的珠粒与25μl(＜10pmol)来自步骤4的PCR产物在100μl结合缓冲剂中在25摄氏度下温育30min。短暂地离心样品以收集珠粒。去除上层清液并使用800μl H2O洗涤五次。珠粒在室温下被重新悬浮在500μl 10mM NaOH中2min。将上层清液去除并将珠粒重新悬浮在100mM生物素(在100μl H2O中)中。为了洗脱，将样品在95摄氏度下在搅拌下温育10min。随后，过量的生物素通过Micro-spin凝胶-过滤而去除。

[0987] 步骤6：将模板oligo的新群体与来自步骤1的标记肽库退火。

[0988] 单链模板寡核苷酸的新群体如步骤2所述与来自步骤1的标记肽库退火并进行另一轮选择和扩增，其中所述寡核苷酸新群体中富集了代表整合蛋白αV/β3受体的配体的序列。

[0989] 选择和扩增步骤(步骤2-6)重复5轮。

[0990] 步骤7：配体的鉴别。

[0991] 对一个或多个配体实体特异的、富集的双链DNA片链的身份通过在M13mp18质粒载体中进行DNA克隆和序列分析检查各个克隆而确立。为了统计目的，将30个以上的克隆测序以在克隆的序列标签集合内鉴别占优势的序列。因为克隆的优势DNA序列对应于配体，该序列偏离直接鉴别适用于进一步检查的配体候选物。

[0992] 实施例12

[0993] 以下实施例说明如何应用标记原理鉴别代表从序列库中分离的小分子的DNA序列。该原理在图中示意给出。

[0994] 用于鉴别与链霉抗生物素蛋白结合的复合物的生物素和谷胱甘肽的DNA-标记。

[0995] 材料：

[0996] ·链霉抗生物素蛋白Sepharose 6B(AmershamPharmacia)

[0997] ·Taq-聚合酶(Promega)和10X Taq-pol缓冲剂

[0998] ·结合缓冲剂[100mM NaCl，5mM MgCl2，50mM Tris-HCl，pH 7.5]

[0999] ·SPDP[N-琥珀酰亚胺基3(2-吡啶基二硫代)丙酸酯](MolecularProbes，Cat：S-1531)

[1000] ·N-羟基琥珀酰亚胺基酯-生物素(Fluka#14405)

[1001] ·谷胱甘肽(Sigma)

[1002] ·Micro Bio-Spin 6(Bio-Rad cat：732-6221)

[1003] ·T7外切核酸酶(基因6)和5x缓冲剂

[1004] ·具有以下序列的标记寡核苷酸：

[1005] TO#1：5’-XCTATGCGGACTGACTGGTAC-3’

[1006] TO#2：5’-XCTATGANNNNNNNNCGGTAC-3’，(65.536种序列的组合)

[1007] 其中X＝适用于连接功能实体如肽，小分子或聚合物的5’C6氨基修饰剂(Glen research cat#10-1039-90)。N是G，A，T或C

[1008] ·具有以下序列的互补性(模板)寡核苷酸：

[1009] CO#1：

[1010] 5’-TsAsTsGGATCCGTACCAGTCAGTCCGCATAGGAATTCTAGT-3’

[1011] CO#2：

[1012] 5’-TsAsTsAGGATCCGTACCGNNNNNNNNTCATAGGAATTCTAGT-3’

[1013] 其中，S表示硫代磷酸酯在DNA主链中的位置。

[1014] 下划线的10核苷酸序列对于每种标记寡核苷酸或标记寡核苷酸集合是独特的且具有独特的互补性寡核苷酸对应物。粗体加亮的序列适用于克隆目的。

[1015] ·用于PCR扩增的寡核苷酸

[1016] AO#1：5’-TsAsTsAGGATCCGTACC-3′

[1017] AO#2：5’-ACTAGAATTCCTATG-3′

[1018] 其中，S表示硫代磷酸酯在DNA主链中的位置。

[1019] 方案

[1020] 步骤1：用TO#1标记生物素和用TO#2标记谷胱甘肽。

[1021] 所有的TO寡核苷酸包含可以用于共价连接小分子的单个5’末端氨基亲核试剂(X)。生物素使用NHS-生物素(Merck)在以下反应中键接至TO#1氨基-基团上。

[1022]

[1023] 谷胱甘肽使用杂双功能交联剂SPDP在以下反应中键接至寡核苷酸集合上。

[1024]

[1025] 方法：

[1026] 用TO#1标记生物素：

[1027] 将5nmol TO#1寡核苷酸干燥并重新悬浮在80μl 100mM Hepes-OH缓冲剂(pH7.5)中。将20μl 50mM NHS-生物素(在DMSO中)加入寡核苷酸中并将样品在30摄氏度下温育2小时。样品使用200μl乙酸乙酯提取两次，然后在Micro-spin 6柱上纯化。生物素的标记使用电喷雾-MS(Bruker Inc.)确认。

[1028] 用TO#2标记谷胱甘肽(GSH)：

[1029] 将5nmol TO#2干燥和重新悬浮在160μl 100mM Hepes-OH，(pH 7.5)中。加入40μl 20mM SPDP(在DMSO中)并将样品在30摄氏度下温育2h。样品用3×500μl乙酸乙酯提取和在speedvac中干燥10min。样品使用以100mM Hepes-OH平衡的Micro bio-spin
6柱纯化。加入10μl 0.1M GSH并将样品在25摄氏度下温育2h。用2M NH4OAc/乙醇沉淀两次。重新溶解在50μl H2O中和通过电喷雾-MS分析(BrukerInc.)而确认标记。

[1030] 单个生物素序列标签和65.536种不同的谷胱甘肽序列标签构成总共65.537种不同的序列标签。将库混合成包含等-摩尔量的每种序列标签。因此，该库由相对于标记生物素而言65.536-倍过量的标记谷胱甘肽组成。

[1031] 步骤2：将互补性寡核苷酸(CO#1&2)退火至来自步骤1的TO复合物上。

[1032] 方法：

[1033] 将总共10pmol标记库分子加入在结合缓冲剂[100mM NaCl，5mMMgCl2，50mM Hepes-OH，pH 7.5]中包含20pmol模板分子(CO#1&2)(相对于CO#1包含65.536倍过量的CO#2)且总体积100μl的混合物中。样品在80摄氏度下加热2分钟并经30分钟慢慢冷却至室温。

[1034] 步骤3：纯化双链DNA复合物(可有可无的！)。

[1035] 在退火之后，仅已被退火至其互补性寡核苷酸序列上的标记分子包含功能实体和硫代磷酸酯主链把手(参见图1)。因此，为了减少选择步骤中的“噪音”，单链标记-分子可在预选择步骤中使用硫代磷酸酯把手从库中去除。

[1036] 方法：

[1037] 将50μl活化的硫代丙基-琼脂糖浆在3×1ml结合缓冲剂中洗涤，然后将珠粒重新悬浮在100μl结合缓冲剂中。将CO/TO-退火混合物加入硫代丙基-琼脂糖珠粒中和在30摄氏度下在搅拌下温育30min。随后，沉淀珠粒，丢弃上层清液并将珠粒用1ml结合缓冲剂洗涤三次。将珠粒重新悬浮在100μl结合缓冲剂中和最后将CO/TO复合物通过与100μl
50mM DTT在结合缓冲剂中温育而释放。洗脱的CO/TO复合物被移出至新管。

[1038] 步骤4：针对与链霉抗生物素蛋白结合的配体富集文库。

[1039] 测试分子库与链霉抗生物素蛋白-琼脂糖6B的结合。

[1040] 方法：

[1041] 将50μl链霉抗生物素蛋白-琼脂糖6B浆用1ml结合缓冲剂洗涤三次。将10μl在步骤3中洗脱的库分子与链霉抗生物素蛋白在100μl结合缓冲剂中在25摄氏度下在搅拌下温育10分钟。随后，样品使用1ml结合缓冲剂洗涤五次。配体DNA通过将样品在100μl H2O中在95摄氏度下温育5分钟而洗脱。样品被冷却至室温。1μl样品用于PCR扩增，其中在包含10mM Tris-HCl pH 9.0，50mM KCl，1mM MgCl2，0.1％Triton X-100，dATP，dCTP，dGTP和dTTP各250mM的反应体系中使用AO#1和2各10pmol作为外部引物。样品起始在94摄氏度下变性2min之后进行30个周期：在94摄氏度下变性30秒，在44摄氏度下退火
30秒和在72摄氏度延伸15秒。最后，样品被沉淀

[1042] 步骤5：分离单链模板。

[1043] 对于随后选择和扩增轮，扩增的PCR产物的非模板链应该被去除。该步骤使用包含硫代磷酸酯主链的模板oligo链的特殊纯化而进行。

[1044] 方法：

[1045] 双链PCR产物使用噬菌体T7(基因6)外切核酸酶进行外切核酸酶消化。该酶是一种双链特异性5’外切核酸酶，受到存在于DNA主链中的硫代磷酸酯的抑制。将20μl来自步骤4的双链PCR产物在外切核酸酶T7缓冲剂中温育，然后加入50单位的T7外切核酸酶。样品在30摄氏度下温育10分钟。样品用100μl苯酚提取一次，然后使用NH4-乙酸盐/乙醇沉淀。将样品再悬浮在H2O中。

[1046] 步骤6：将模板oligo的新群体与来自步骤1的标记分子的文库退火。

[1047] 将针对代表链霉抗生物素蛋白的配体的序列而富集的单链模板寡核苷酸的新群体如步骤2所述与来自步骤1的标记分子库退火并进行另一轮的选择和扩增。

[1048] 选择和扩增步骤(步骤2-6)重复5轮。

[1049] 步骤7：配体的鉴定。

[1050] 对一种或多种配体实体特异的富集的双链DNA片段的身份通过在M13mp18质粒载体中进行DNA克隆和序列分析检查各个克隆而确立。

[1051] 为了统计目的，对30个以上的克隆测序以在克隆的序列标签集合内鉴定出优势序列。因为克隆的优势DNA序列对应于配体，该序列偏离直接鉴别适用于进一步检查的配体候选物。

[1052] 实施例13：使用分开的隔室编码法(模式2)在得自集合编码(pool-encoding)法(模式1)的标识符上编码。

[1053] 该实施例描述用于在包含已使用模式1编码而得到的密码子的标识符上进行反应物的模式2编码的试验条件。模式1编码如以前实施例，尤其是实施例7所述而进行。本实施例说明组合编码模式1和2的一般原理。

[1054] 编码的标识符的延伸和反应物的转移在分开的孔中进行，其中将一种特定拉链构件和一种特定反密码子寡核苷酸混合，后者编码被加载到拉链构件上的功能实体。该方案也可用于游离反应物。

[1055] 使用编码模式2的延伸。

[1056] 在该实施例中，如下所示，放射性活性标记的标识符寡核苷酸(E57)与特定拉链构件(E32)和具有反密码子序列(反密码子1)的反密码子寡核苷酸(CD-M-8-0172-0001)混合。在另一实验中，具有不同的反密码子序列(反密码子X)的不同的反密码子寡核苷酸(E60)用作参考样品。

[1057]

[1058]

[1059] 寡核苷酸组合(如下所示)在分开的隔室中混合在一起以允许成对的拉链构件和反密码子寡核苷酸的特异退火。延伸在延伸缓冲剂(20mM Hepes，8mM MgCl，150mM NaCl)中使用1pmol标识符寡核苷酸，2pmol拉链构件，2pmol反密码子在10μl的最终体积中进行。在PCR-机器中寡核苷酸被加热并随后慢慢地从80摄氏度再退火至20摄氏度。在退火之后，加入0.5mM dNTP和13U测序酶的混合样品(～20μl)并在30摄氏度下延伸1h。样品随后通过10％尿素聚丙烯酰胺凝胶电泳而分析，如图31A所示。

[1060] 凝胶分析显示，标识符用长反密码子1(道2)和较短的反密码子X(道3)完全延伸。结果还表明，在反密码子寡核苷酸之间没有出现杂乱，如果它们首先被允许退火至标识符寡核苷酸上，然后再被混合和延伸的话(道4)。

[1061] 交联。

[1062] 试剂在模式1编码的分子上的模式2编码使用具有三种密码子和展示分子的标识符而测试。反应物的转移在本实施例中通过拉链构件上的反应物交联至标识符寡核苷酸中的展示分子上而说明。转移通过交联而测试以在凝胶上简化该分析，但并不限于这类反应。

[1063] 如下所示的功能实体(化学结构)被键接至oligo上以形成可以通过互补性区域退火至标识符寡核苷酸上的拉链构件(CX-1)。该拉链构件与具有如下所示的反密码子序列(反密码子1)的反密码子寡核苷酸(CD-M-8-0172-0001)一起使用。在另一(对照)实验中，不同的拉链构件(E32)与具有不同的反密码子序列(反密码子X)的不同的反密码子寡核苷酸(E60)一起使用。

[1064]

[1065]

[1066]

[1067] 寡核苷酸组合在分开的隔室中混合在一起以允许成对的拉链构件和反密码子寡核苷酸的特异退火。退火在延伸缓冲剂(20mM Hepes，8mM MgCl，150mM NaCl)中使用1pmol标识符寡核苷酸，2pmol拉链构件，2pmol反密码子在10μl的最终体积中进行。寡核苷酸在PCR-机器中被加热并随后慢慢地从80摄氏度再退火至20摄氏度。交联通过加入5mM DMT-MM试剂和37摄氏度下温育2h而进行。样品随后通过10％尿素聚丙烯酰胺凝胶电泳而分析，如图31B所示。

[1068] 凝胶分析显示，拉链构件(CX-1)上的功能实体交联至包含该密码子的标识符寡核苷酸上(道2)，而缺少该试剂的拉链构件(E32)不能与标识符寡核苷酸反应。结果还表明，在拉链构件寡核苷酸之间不会出现杂乱，如果它们首先被允许退火至标识符寡核苷酸上，然后再被混合和交联的话(道4)。

[1069] 尽管本发明已根据特定方法和实施方案进行描述，但可以理解，可进行各种改变和变化而不背离本发明。

[1070] 实施例14：来自展示整合蛋白受体avβ3配体的双官能复合物的编码部分的富集。

[1071] 实施例14.1 L1-RGD和L1-cRGD的形成：

[1072] 寡核苷酸L1-NH2用于分别标记cRGD肽和RGD肽，其中将4nmolL1-NH2混入80μl500mM Hepes KOH，pH 7.5和20μL在DMSO中的25mM BMPS的混合物中并随后在30摄氏度下温育2小时。将BMPS活化的L1-NH2寡核苷酸用EtOAc洗涤三次，以去除未键接BMPS，并将过量的EtOAc通过真空蒸馏而蒸发掉。加入10μL 100mM cRGD或RGD肽并将反应体系在室温下温育过夜。在温育之后，通过凝胶过滤去除cRGD或RGD标记的寡核苷酸中的过量未键接肽。肽的标记通过质谱分析而证实并将标记产物分别称作L1-cRGD和L1-RGD。

[1073] 材料：

[1074] L1-NH2(6-8-CAGCTTGGACACCACGTCATAC，6 ＝ LH193，8 ＝ PCspacer) 得自DNA-Technology，Aarhus，DENMARK，PCspacer是一种光可断裂的间隔基(Glen research产品cat#10-4913)，BMPS(N-[β-马来酰亚氨基丙基氧基]琥珀酰亚胺酯)得自Pierce(cat#22298)。LH193(二异丙基-氨基磷酸2-氰基-乙基酯
2-[2-(2-{2-[2-(2-{[(4-甲氧基-苯基)-二苯基-甲基]氨基)-乙氧基)-乙氧基]乙氧基}-乙氧基)-乙氧基]-乙基酯)根据以下方法合成：

[1075]

[1076] 市售六甘醇使用TBDMS-C1，咪唑和DMAP选择性地单TBDMS保护，57％产率。将游离醇官能团通过标准三步骤程序而转化成胺官能团：用甲苯磺酰氯在吡啶中活化，随后用叠氮化钠在DMF中亲核置换和随后使用Pd/C和H2还原，总体产率95％(对于三个步骤)。胺官能随后用4-单甲氧基三苯甲基(MMT)保护，99％产率，并将TBDMS基团使用TBAF去除。
游离羟基官能最后与氰基乙基-N，N，N’，N’-四异丙基磷酰二胺在四唑催化下反应并得到所需化合物，82％产率。31Pnmr(CDCl3)＝148.5ppm。

[1077] 14.2 L1-F5的形成：

[1078] 将5nmol L1-NH2，50mM DMTMM和10mM F5在100mM Na-BoratpH 8.0中的50μL混合物在30摄氏度下温育过夜并通过凝胶过滤去除寡核苷酸标记的F5中过量的未键接F5.随后将加载的oligo通过速度真空蒸馏(speed vacucom distillation)而干燥并重新悬浮在50μL 100mM NaOH中，然后在50摄氏度下放置过夜以对F5分子进行去保护(酯断裂和N-乙酰胺断裂)。在去保护之后，将悬浮液用HCl中和并通过质谱分析而确认F5的加载。F5的标记通过质谱分析而确认。标记产物被称作L1-F5。

[1079] 材料：

[1080] DMTMM(4-(4，6-二甲氧基-1，3，5-三嗪-2-基)-4-甲基吗啉鎓氯化物)由市售N-甲基吗啉和2-氯-4，6-二甲氧基-1，3，5-三嗪根据Kaminski等(JOC(1998)，63，4248-55)而制成。

[1081] F5(酯和N-乙酰基衍生物)根据以下方法合成：

[1082]

[1083] 标记产物L1-F5携带游离羧酸(高甘氨酸部分)和游离氨基基团(环氨基吡啶)。

[1084] 使用4-硝基苯甲酰氯，市售四甘醇被4-硝基苯甲酸单保护，67％产率。使用TEMPO，亚氯酸盐和次氯酸盐的混合物随后将剩余的伯醇氧化成相应的羧酸，81％产率。将化合物连接到2-氯三苯甲基氯树脂上和随后与KCN在MeOH-DMF(1∶5)中反应以去保护4-硝基苯甲酰基酯。N-(2-硝基苯基磺酰基)活化的β-丙氨酸甲基酯使用Mitsunobu方案连接。4-硝基苯基磺酰基基团通过用过量巯基乙醇/DBU处理而去除并使用标准Fmoc-化学将所形成的胺用两个随后构件酰化。最终分子通过用在醚-DCM(1∶4)中的0.4M HCl+ +
处理而从树脂上切下。[M+H](计算值)＝595.30.[M+H](实测值)＝595.28。

[1085] 14.3库组分1的形成。

[1086] 双链标记L1-cRGD(称作L1-cRGD-T1)的形成：

[1087] 将200pmol DNA模板，T1

[1088] (GCTAGAGACGTGGTGGAGGAAGTCTTCCTAGAAGCTGGATATCACCACATCTC

[1089] TAGCAGCTAGTATGACGTGGTGTCCAAGCTG) 退火至 50pmol L1-cRGD 上。随后L1-cRGDoligo通过DNA聚合酶(测序酶)进行延伸。

[1090] 测序酶得自Upstate Biotechnology(Cat#70775Y)。

[1091] 14.4库组分2的形成。

[1092] 双链标记L1-RGD。称作L1-RGD-T2：

[1093] 将200pmol T2

[1094] (GCTAGAGACGTGGTGGAGGAAGTCTTCCTAGAAGCTGGATATCAGGTCTTCT

[1095] GTCTTCTTCCGTATGACGTGGTGTCCAAGCTG) 退火至 50pmol L1-RGD 上。随后L1-RGDoligo通过DNA聚合酶如上所述而延伸。

[1096] 14.5库组分3的形成。

[1097] 双链L1-F5。称作L1-F5-T3：

[1098] 将200pmol T3

[1099] (GCTAGAGACGTGGTGGAGGAAGTCTTCCTAGAAGCTGGATATCTTCAGTTCTC

[1100] GACTCCTGAGTATGACGTGGTGTCCAAGCTG)退火至50pmol L1-F5上。随后L1-F5oligo通过DNA聚合酶如上所述而延伸。

[1101] 14.6库组分4的形成。

[1102] 双链L1-NH2。称作L1-NH2-T4：

[1103] 将50pmol T4

[1104] (GCTAGAGACGTGGTGGAGGAAGTCTTCCTAGAAGCTGGATATCTGACGTGTT

[1105] GACGTACACAGTATGACGTGGTGTCCAAGGTG) 退火至 200pmol L1-NH2 上。随后L1-NH2oligo通过DNA聚合酶如上所述而延伸。

[1106] 总共生产出每种库组分L1-cRGD-T1，L1-RGD-T2，L1-F5-T3和L1-NH2-T4各50pmol。

[1107] 14.7富集

[1108] 整合蛋白结合复合物的富集通过在Nunc Immunomodule U8Maxisorp孔(Biotecline cat#nun-47507)中涂覆0.04mg/孔整合蛋白受体avβ3而进行。

[1109] 在一个实验(图32)中，L1-cRGD-T1，L1-RGD-T2，L1-F5-T3和L1-NH2-T4按照1pmol L1-NH2-T4复合物，1/1000000pmolL1-cRGD-T1复合物，1/100000pmol L1-RGD-T2复合物和1/10000pmolL1-F5-T3复合物的比率在100μl缓冲剂A(Tris缓冲盐水，0.05％Tween 20，1％牛血清白蛋白，0.1mg/mL鲱鱼精子DNA)中混合。在整合蛋白包被的孔中在
25摄氏度下进行90min温育。在配体结合之后，所有的孔用250μL缓冲剂A在1小时洗涤20次。然后将100μL缓冲剂A应用于每个孔并将孔暴露于350纳米UV光30秒以断裂PCspacer，这样从配体分子上释放DNA模板。在暴露于UV光之后，立即取出洗脱物质并通过定量聚合酶链反应(Q-PCR)而分析DNA链T1，T2，T3和T4的存在。

[1110] 在类似实验(图33)中，L1-cRGD-T1，L1-RGD-T2，L1-F5-T3和L1-NH2-T4按照1pmol L1-NH2-T4复合物，1/10000pmol L1-cRGD-T1复合物，1/10000pmol L1-RGD-T2复合物和1/10000pmol L1-F5-T3复合物的比率在100μL缓冲剂A中混合。其它分析条件如上所述。

[1111] 对于5mL预混物(用于一种96孔板)，将2.5mL TaqmanUniversal PCR Master Mix(Applied Biosystems)与450μLRPv2(GTCAGAGACGTGGTGGAGGAA)(10pmol/μl)，25μL Taqman探针(6-FAM-TCCAGCTTCTAGGAAGAC-MGBNFQ；50μM)和1075μL H2O混合。

[1112] 将40.5μL预混物等分到每个孔中并加入4.5μL相关上游PCR引物(FPv2(CAGCTTGGACACCACGTCATAC)(用于标准曲线)或模板特异引物P1(GTCATACTAGCTGCTAGAGATGTGGTGATA)(对T1特异)，P-2(CATACGGAAGAAGACAGAAGACCTGATA)(对T2特异)，P-3(TCATACTCAGGAGTCGAGAACTGAAGATA)(对T3特异)或P-4(CATACTGTGTACGTCAACACGTCAGATA)(对T4特异)之一；10pmol/μL)和5μL样品(对于阴性对照，在孔中为H20)。

[1113] 用于标准曲线的样品通过稀释T4至108拷贝/5μL和随后对该样品进行10-倍系列稀释而制成。5μL用于每个Q-PCR反应。

[1114] 热循环/荧光的测量在Applied Biosystems ABI Prism 7900HT实时仪器上进行，其中采用循环参数：95摄氏度10min，40周期95摄氏度15sec及64摄氏度1min。

[1115] 从图32可以看出，如果与富集输出比率比较来考虑输入比率，双链DNA复合物Li-cRGD-T1，L1-RGD-T2，L1-F5-T3相对L1-NH2-T4复合物分别被富集约1百万倍，100000倍和30000倍。L1-cRGD-T1，L1-RGD-T2和L1-F5-T3在没有整合蛋白受体的孔中孵育之后不能被检出。

[1116] 图33分别显示L1-cRGD-T1，L1-RGD-T2和L1-F5-T3的富集。配体DNA复合物被各异地富集。这最可能是由于三种分子具有不同的解离常数。L1-cRGD-T1，L1-RGD-T2和L1-F5-T3在没有整合蛋白受体的孔中孵育之后不能被检出。

合成双功能复合物的方法转让专利

申请号 : CN200380104764.5

文献号 : CN1720331B

文献日 : 2013-01-02

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : P-O·弗里斯克加德 , T·弗朗奇 , A·H·古利艾夫 , M·D·伦多夫 , J·费尔丁 , E·K·奥尔森 , A·霍尔特曼 , S·N·雅克布森 , C·萨姆斯 , S·S·格莱德 , K·B·延森 , H·佩德森

申请人 : 纽韦卢森公司

摘要 :

权利要求 :

说明书 :

合成双功能复合物的方法