会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 信息素 / 人类信息素L(H-SemaL)和其它物种中相应的信息素

人类信息素L(H-SemaL)和其它物种中相应的信息素

申请号 CN98103356.3 申请日 1998-07-09 公开(公告)号 CN1209436A 公开(公告)日 1999-03-03
申请人 德国赫彻斯特马里奥罗塞尔有限公司; 发明人 B·弗莱肯斯汀; A·恩塞尔;
摘要 本发明涉及由一特定的结构域结构所区别的新的信息素和其衍生物,并且涉及编码这些信息素的核酸(DNA,RNA,cDNA)和其衍生物,以及它们的用途。本发明涉及在免疫系统中具有生化功能并且具有迄今未公开和未预料到的结构域结构的信息素(免疫调节信息素)。这些新的信息素被认为是L型信息素(Sema-L)。它们包含一个N端信号肽、一个特征性Sema结构域。并且在蛋白质C端区含义一个免疫球蛋白样结构域和代表潜在跨膜结构域的疏水结构域。
权利要求

1.一种包含一个特征性Sema结构域的信息素,其中该蛋白质具有一个N 端信号肽,并且在C端区具有一个免疫球蛋白样结构域以及一跨膜结构域。所 说的信息素被认为是L型信息素(Sema-L),以及L型信息素的衍生物。

2.如权利要求1中所要求的信息素,其中所说的蛋白质(人类L型信息素(H- SemaL))具有氨基酸序列SEQ ID NO.3。

3.如权利要求1和2中之一个或多个所要求的信息素,其中所说的蛋白质在 Sema结构域区域中与H-SemaL的Sema结构域具有至少40%的氨基酸等同性。

4.如权利要求1至2之一个或多个所要求的信息素,其中所说的蛋白质包含 部分氨基酸序列SEQ ID NO.4(鼠信息素(M-SemaL))。

5.一种包含编码如权利要求1至4中之一个或多个所要求的L型信息素的核 酸序列的核酸以及其衍生物。

6.如权利要求5所要求的核酸,其中所说的核酸序列是信息素L基因。

7.如权利要求5和6中之一个或多个所要求的核酸,其中所说的核酸序列包 含H-SemaL的基因。

8.如权利要求5所要求的核酸,其中所说的核酸序列包含L型信息素的 cDNA。

9.如权利要求8所要求的核酸,其中所说的cDNA是H-SemaL的cDNA。

10.如权利要求8所要求的核酸,其中所说的cDNA是M-SemaL的cDNA。

11.一种制备如权利要求1至4中之一个或多个所要求的L型信息素的方法, 该方法包括将编码L型信息素或者其衍生物的核酸序列克隆进表达载体并且表表达 之。

12.如权利要求11所要求的方法,其中将真核细胞用于表达。

13.L型信息素或其衍生物或编码L型信息素的核酸序列或其衍生物在产生可 以用于治疗或预防免疫疾病的药物中的用途。

14.如权利要求13所要求的核酸序列或其衍生物在基因治疗中的用途。

15.L型信息素或编码L型信息素核酸序列在鉴别免疫调节剂的方法中的用 途。

16.一种鉴别免疫调节剂的方法,该方法包括在特定的条件下将L型信息素 与待测药剂一起温育,在没有待测药剂但是其它方面相同的条件下进行第二批平 行培养,然后确定待测药剂的抑制或激活作用。

17.一种鉴别免疫调节剂的方法,该方法包括在特定的条件下和在待测药剂 存在下表达编码L型信息素的核酸序列,并且测定其表达程度。

18.一种制备编码L型信息素的核酸的方法,其中用特异性引物通过聚合酶 链式反应扩增这种核酸。

19.一种信息素抗体,该抗体识别相应于SEQ ID NO.4中的179-378位氨基 酸的H-SemaL的表位,或者识别相应于SEQ ID NO.4中的480-666位氨基酸的 H-SemaL的表位。

20.一种制备如权利要求19所要求的信息素抗体的方法,其中作为具有表位 标记的融合蛋白表达所说的表位,通过这一表位标记纯化所说的表位,并且将纯 化的融合蛋白用于免疫接种。

说明书全文

本发明涉及由一特定的结构域结构识别的新的信息素(semaphorin)和其衍生 物,涉及编码这些信息素的核酸(DNA、RNA、cDNA)和其衍生物,以及它们 的制备和用途。

Kolodkin首次描述了信息素作为保守基因家族的成员{Kolodkin等(1993)细胞 75:1389-1399}。

现在已经克隆出(并且在某些情况下已经描绘出)其它信息素的基因或部分基 因。到目前为止,已经公开了总共5种人类信息素(H-SemaⅢ,H-SemaⅤ,H- SemaⅣ,H-SemaB和H-SemaE){(Kolodkin等(1993);Poche等(1996)癌基因12: 1289-1297;Sekido等(1996)美国科学院院报93:4120-4125;Xiang等(1996) 基因组32:39-48;Hall等(1996)美国科学院院报39:11780-11785;Yamada 等(1997)(GenBank登记号AB000220)},8种鼠类信息素(小鼠基因;M-Sema A 到M-Sema-H){(Püschel等(1995)神经元14:941-948;Messerschmidt等(1995) 神经元14:949-959;Inigaki等(1995)FEBS通讯370:269-272;Adams等 (1996)Mech.Dev57:33-45;Christensen等(1996)(GenBank登记号Z80941, Z93948)},5种鸡精蛋白(小鸡)脑衰蛋白-1到-5){Luo等(1993);Luo等(1995)神经 元14:1131-1140},以及来自大鼠(R-Sema-Ⅲ){Giger等(1996)J.Comp.Neurol. 375:378-392},斑马鱼,昆虫毛(果蝇(果蝇D melanogaster:D-SemaⅠ和D- SemaⅡ),甲虫Tribolium confusum:T-Sema-l),蚱蜢(Schistocerca americana:G- Sema-l)){Kolodkin等(1993)},以及线虫(C.elegans:Ce-Sema){Roy等 (1994)(GemBank登记号U15667)}的基因。此外,两种痘病毒(牛痘(ORF-A39)和 天花(ORFA39-同源物)){Kolodkin等(1993)}和alcelaphine疱疹病毒1型(AHV- 1)(AHV-Sema){Ensser和Fleckenstein(1995)普通病毒学76:1063-1067}具有与信息 素同源的基因。

表-1总结了到目前为止在各种物种中鉴别的信息素。表1显示了信息素的名 称(第1列),所使用的同义词(第2列),分离特定信息素的物种(第3列);和其中 已知的关于所说的编码蛋白质的结构域结构的数据和关于染色体位点的数据(表1 的第4列),存储在基因数据库(例如,EST(表达序列标记)数据库,EMBL(欧洲 分子生物学实验室,Heidelberg)数据库或NCBI(国家生物技术信息中心,马里 兰,美国)的基因序列的登记号,以及这些数据出版的参考信息(表1的第5列)。

到目前为止,所有公开的信息素基因的基因产物(编码的信息素)都具有一个N 端信号肽。它在C端具有大约450至500个氨基酸长度的特有Sema结构域。高 度保守的氨基酸基元和一些高度保守的半胱氨酸残基被已在Sema结构域中找 到。基因产物(信息素)在C端序列方面是不同的,这些序列跟随在Sema结构域之 后,并且由一个或多个结构域组成。例如,在这些C端氨基酸序列中有跨膜结构 域(TM),免疫球蛋白样结构域(Ig)(免疫球蛋白恒定区),胞质序列(CP),加工信 号(P)(例如有共有序列(RXR),其中R是精氨酸,X是任何氨基酸)和/或亲水C端 (HPC)。到目前为止所公开的信息素根据C端的结构域结构的不同可以划分为5 个不同的子群(Ⅰ到Ⅴ): Ⅰ     分泌性,没有其它结构域(例如ORF-A49) Ⅱ lg  分泌性(没有跨膜结构,例如AHV-Sema) Ⅲ lg, TM,CP具有胞质序列,膜锚着(例如CD100) Ⅳ lg, (P),HPC具有亲水性C端,分泌性(例如H-SemaⅢ,M-SemaD,脑 衰蛋白-l) V  lg, TM,CP具有C端7血小板反应蛋白基元。膜锚着(例如M-SemaF 和G)

到此为止还没有描述过信息素受体或胞外配体。已经公开了与信息素-介导作 用相关连的胞内杂合三聚体GTP结合性蛋白质复合物。在小鸡中已被鉴别的这些 蛋白质复合物的一个组分称为CRMP(脑衰蛋白应答介导蛋白质),并且被假定是 信息素诱导的胞内信号级联的一个组分(Goshima等(1995)自然376:509-514)。 例如,CRMP62与unc-33、线虫蛋白质(对轴突定向成长来说是十分重要的)都具 有同源性。同样地,已知人类蛋白质98%的氨基酸与CRMP62具有等同性 (Hamajima等(1996)基因180:157-163)。类似地描述了大鼠中的几个CRMP-相关 基因(Wang等(1996)神经科学16:6197-6207)。

所说的分泌性或跨膜信息素为增长的神经芽体传达排斥信号。在神经系统 (CNS)的发育中,它们起着重要的作用,并且特别是在肌肉和神经组织中表达 (Kolodkin等(1993);Luo等(1993)细胞75:217-227)。

与密切相关的M-SemaF相对比,M-SemaG的显著表达不仅在所说的CNS 中而且在淋巴与造血系统的细胞中已经观察到(Furuyima等(1996)生物化学杂志 271:33376-33381)。

近来已经鉴别出两个其它的人类信息素,H-SemaⅣ和H-SemaⅤ(特别是染 色体3p21.3区域),其缺失与各种类型的支气管癌有关。H-SemaⅣ{(Roche等 (1996),Xiang等(1996),Sekido等(1996)}与M-SemaE在氨基酸水平上大约有 50%的等同性,而H-SemaⅤ{Sekido等(1996)}是M-SemaA的直接同系物(86%的 氨基酸等同性)。因为在所切除的3p21.3基因座上进行DNA测序工程期间发现了 这些基因(H-SemaⅣ和Ⅴ),这两个基因复合物的内含子-外显子结构是已知的。两 个基因都能在各种神经元和非神经元组织中表达。

同样仅仅在前不久,细胞表面分子CD100(人)(在活化的T细胞上表达并诱导) 已经鉴别为是一种信息素(表1中同样列出)。它通过CD40受体和相应配体CD40L 帮助与B细胞相互作用。CD100是一个150kd(千道尔顿)的膜锚着糖蛋白二聚 体。已经描述了CD100的外胞质C端与一迄今未知的激酶的结合{Hall等 (1996)}。这就意味CD100是第一个并且是迄今为止仅有的已证明在免疫系统的细 胞中表达的信息素。

在“rhadinoviruses的转化基因”方案中,已经克隆和测序了alcelaphine疱疹 病毒1型(AHV-1)的完全基因组{Ensser等(1995)}。AHV-1是恶性卡他发热、各 种与淋巴增殖综合症有关的反刍动物疾病的诱发剂(并且通常是致命的)。经过分 析,发现了一个开放读框,在病毒基因组的一端具有与痘苗病毒基因远程的但是 显著的同源性(ORF-A39相应于Ensser等(1995)普通病毒学76:1063-1067的 VAC-A39),后者已经被归为信息素基因家族。而AHV-1信息素(AHV-Sema)具有 非常保守的信息素结构,痘病毒基因(ORF-A39和ORF-A39-同源物,参见表1)具 有C端截短。即其中仅仅非完全地存在保守Sema结构域。

所发现的AHV-Sema与dbEST(EST(表达序列标志)数据库(db))的数据库比较 提从人胎盘的2种独立cDNA克隆都提供了两种EST序列(登记号H02902, H03806(克隆151129),登记号R33439和R33537(克隆135941))。与迄今为止所 描述的神经元信息相比。这些明显地显示了与AHV-1的信息素更大的同源性。

本发明涉及这样的信息素,它们具有新的迄今未公开的和未曾预料到的结构域 结构,并且其具有在免疫系统中的生化功能(免疫调节信息素)。这些新的信息素被 称为L型信息素(SemaL)。它们包含一个N端信号肽。一个特征性Sema结构域。 并且在蛋白质的C端区包括一个免疫球蛋白样结构域和一个代表潜在跨膜结构域 的疏水结构域。

信号肽的氨基酸序列可以有少于70个氨基酸,优选地少于60个,而多于20 个,更优选地多于30个氨基酸,并且特别优选的长度是约40到50个氨基酸,在 本发明的特定实施方案中,所说的信号肽具有44个氨基酸长度,即信号肽酶的切 割位点被定位在44到45个氨基酸之间。

Sema结构域的长度可以是从300到700或更多个氨基酸,优选的是大约400 到600个氨基酸,更优选的Sema结构域的长度是450至550个氨基酸,优选的 是大约500个氨基酸,在本发明更优选的实施方案中,Sema结构域被加上信号 肽,此时Sema结构域优选地达到545个氨基酸。

免疫球蛋白样结构域的长度可以是大约30至110个或更多个氨基酸,以及优 选的长度是在50与90个之间的,特别优选的是大约70个氨基酸。

跨膜结构域的长度可以是大约10至35个氨基酸,优选的是大约15至30个, 特别优选的是大约20至25个氨基酸。

本发明涉及来自不同物种的L型信息素,特别是脊椎动物,例如鸟类和/或鱼 类,优选是哺乳动物,例如灵长目动物,大鼠、兔、狗、猫、绵羊、山羊、母牛、 马、猪、特别优选的是人和小鼠。本发明也涉及来自微生物的相应的信息素,尤 其是病原微生物,例如细菌,酵母和/或病毒,例如反转录病毒,尤其是人-病原微 生物。

本发明的一个实施方案是相应的人类信息素(H-SemaL),它具有信号肽, Sema结构域。免疫球蛋白样结构域和跨膜结构域。特定的实施方案是由表4中显 示的氨基酸序列给出的信息素。

本发明的另一个实施方案包含其它物种中相应的信息素,它们在Sema结构 域区域中与H-SenaL的Sema结构域(表4中序列的45至545个氨基酸)相比具有 超过40%,优选的是超过50%,特别优选的是超过60%的氨基酸等同性。。在密 切相关物种(例如灵长目动物,小鼠)中相应的信息素可能很完美地具有超过 70%,优选的是超过80%,特别优选的是超过90%的氨基酸等同性。例如可以利 用GAP程序来确定或计算出百分同源性(GCG程序包。遗传计算机组(1991))。

本发明这样的实施方案是相应的小鼠信息素(鼠信息素(M-SemaL))。例如,它 含有在表5中所显示的部分氨基酸序列(鼠信息素(M-SemaL))。

本发明也涉及这样的相应信息素,在较少相关的物种(系统发育上相互之间十 分远的)中,它与表4中显示的H-SemaL完全氨基酸序列相比仅仅具有大约15至 20%的氨基酸等同性(在蛋白质氨基酸序列的整个长度上考虑),优选的是25至 30%,特别优选的是35至40%,或是更高的等同性。

编码L型信息素的基因具有外显子-内含子结构。例如,这些基因可能具有10 到20个外显子,优选的是大约11至18个,特别优选的是12至16个外显子和相 应的数量的内含子。然而,它们也可以具有与H-SemaL基因相同数量的外显子和 内含子(13或15个外显子,优选的是14个外显子)。本发明的一个特定实施方案 涉及H-SemaL基因。这一基因的长度优选的是8888至10,000或更多个核苷酸。 人类信息素基因优选地包含素14所给出的核苷酸序列或在GenBank_数据库中储 存的登记号AF030697的核苷酸序列。这些核苷酸序列含有至少13个内含子。此 外,人类信息素基因在5'端具有一个附加序列区域。合适时这一区域进一步含有 编码和非编码序列,例如一或两个另外的内含子或外显子。

试图将人类L型信息素定位在染色体上,这揭示了将相应的基因定在位置 15q22.3-23。对于M-SemaL的基因,相应地定位在位置9A3.3-B。

作为内含子-外显子复合结构的结果,信息素mRNA初级转录物的剪接可能 发生变化。其结果将导致产生信息素的不同剪接变体。这些剪接变体所翻译的蛋 白质是本发明信息素的衍生物。它们的氨基酸序列,实质上其结构域结构相应于 本发明描述的L型信息素,但是与后者相比较适当地方却被截短了。例如,可以 形成完全或部分缺失跨膜结构域的剪接变体。含有一个不完全(或没有)跨膜结构域 但是含有信号肽的信息素衍生物可能是具有分泌性的,并且通过这种方式对细胞 外部,局部或其它相对较远的距离起作用,例如对其它细胞起作用。例如,另一 个剪接变体可以不再含有编码信号肽的序列,同时,在适当时也没有编码代表潜 在跨膜结构域的疏水氨基酸序列的序列。一种结果将是其信息素衍生物不能掺入 到膜内,也不能进行分泌(除非通过分泌泡)。这样的信息素衍生物可以进入胞内过 程,例如信号转导过程。这样就可能以相同的基本分子(L型信息素)和其衍生物(例 如剪接变体)控制和/或协调各种胞内和胞外的过程。

本发明一个特定的实施方案涉及从本发明L型信息素产生的信息素衍生物, 但是它含有一个不完全的(或没有)跨膜结构域。

本发明的另一个实施方案涉及从本发明L型信息素产生的信息素衍生物,但 是它不含有信号肽。

信号肽也可以在翻译后切除。这导致以截短的结构域结构形成了膜结合性 (TM结构域)或分泌性(没有TM结构域的剪接变体)信息素衍生物。现在一种以这 种方式经过翻译后加工的信息素衍生物仅仅含有Sema结构域。1g结构域。同时 在适当时具有跨膜结构域。信号肽切割位点可以正好定位在信号肽的末端,但也 可以例如定位在距离氨基端40至50个氨基酸或更远。

"截短的"(即包含更少的结构域)信息素L衍生物可以与其它不衍生自L型信息 素的信息素的区别是,在存在的结构域中与L型信息素具有很大(>90%)的氨基酸 等同性或具有同一氨基酸序列。

根据本发明的信息素也可以用其它方法经过翻译后修饰。例如,它们可以通 过一次,两次,三次,四次,五次,六次,七次,八次,九次,十次或更多次的 糖基化(N-和/或O-糖基化)。于是,信息素的氨基酸序列可能具有相等数量或更多 的潜在糖基化位点的共有序列,优选的有5个这样的位点。本发明的一个实施方 案涉及这样的信息素,其中糖基化位点位于与H-SemaL氨基酸序列(表4)相一致 的位置105,157,258,330和602。

此外,所说的信息素可以是它们磷酸化衍生物的形式。信息素可以是不同激 酶的底物,例如氨基酸序列可能有蛋白激酶C,酪氨酸激酶和/或肌酸激酶的共有 序列。此外,信息素的氨基酸序列可能有潜在的肉豆蔻酰化位点的共有序列。相 应的信息素衍生物在这些位点上可以用肉豆蔻酸进行酯化。

本发明的L型信息素和它们的衍生物可以是单体,二聚体和/或多聚体的形 式。例如两个或更多信息素或他们的衍生物可以用分子间的二硫键连接在一起。 形成分子内的二硫键也是可能的。

本发明信息素的其它衍生物是融合蛋白。这一类型的融合蛋白一方面含有L 型信息素或其部分,同时,另外还含有其它的肽或蛋白质或它的一部分。例如, 肽或蛋白质或其部分可能是表位标记(例如His标记(6X组氨酸),Myc标记。流 感标记),因而可以利用它们,例如,用于纯化融合蛋白,或它们也可以用于标记 融合蛋白,例如GFP(绿色荧光蛋白质)。例如,L型信息素衍生物的例子在实施 例的构建体中已经说明。在表7至15中可以发现这些构建体序列,并在适当时考 虑质粒的注释来解释。

本发明进一步涉及编码本发明L型信息素和/或它们的衍生物的核酸序列,优 选DNA和RNA序列,例如相应的基因,mRNA的不同剪接变体,与此相应的 cDNA,以及其衍生物(例如DNA或RNA的盐)。本发明的衍生物是经过如分子 生物学方法修饰并且适应特定需要的序列或序列片段,如截短的基因或基因片段 (例如启动子序列,终止子序列),cDNA或它的嵌合体,用于表达和克隆的构建 体和其盐。

一个实施方案涉及L型信息素的基因组序列(基因)。本发明涉及内含子和外 显子序列,以及基因调控序列,例如启动子,增强子和沉默子序列。

这个实施方案一方面涉及H-SemaL的或其衍生物的基因。本发明一方面涉及 包含表14中给出的核苷酸序列的基因。本发明进一步涉及包含以登记号 AF030697收藏在GenBank数据库的核苷酸序列的基因。

这一实施方案进一步涉及M-SemaL的基因和它的衍生物。

本发明进一步涉及H-SemaL的cDNA或它的衍生物(例如cDNA片段)。一个 特定的实施方案是根据表2中的核苷酸序列H-SemaL的cDNA。本发明进一步涉 及以登记号AF030698收藏在GenBank数据库的H-SemaL的cDNA。本发明也涉 及相应于这些cDNA的mRNA或它的片段。

本发明进一步涉及M-SemaL的cDNA或它的衍生物(例如cDNA片段)。一个 特定的实施方案是在表3中所显示的M-SemaL的部分cDNA序列,以及包含这 部分cDNA序列的cDNA序列。另一个本发明的实施方案涉及以登记号AF030699 收藏在GenBank数据库的M-SemaL的cDNA。本发明也涉及相应于这些cDNA 的mRNA或它的部分。

本发明也包含了等位基因和/或与上述的信息素序列相比仅仅轻微不同并编 码同一或仅仅轻微修饰之蛋白质(氨基酸序列的不同少于或等于10%)的基因 /mRNA/cDNA的个体表达形式(衍生物的进一步例子)。在实施例中所表明的构建 体提供了其衍生物的进一步例子。在表7至14表中描述了这些构建体的序列,可 考虑质粒的注释来解释。

本发明进一步涉及包含编码L型信息素或其衍生物之DNA的质粒。例如, 这种类型的质粒可能是适合于例如在大肠杆菌中DNA扩增的具有高复制率的质 粒。

特定实施方案为具有信息素或其片段或其衍生物的可以在原核和/或真核表 达系统中表达的表达质粒。组成型表达质粒和那些包含诱导型启动子的质粒都是 合适的。

本发明也涉及制备编码L型信息素或其衍生物的核酸的方法。这些核酸(例如 DNA或RNA)可以是合成得来的,例如用化学手段。尤其是,对这些核酸(例如相 应的基因或cDNA或它的片段)来说利用特异性扩增引物和合适的起始原料作为 模板通过PCR进行扩増是可能的。(例如来自合适的组织或基因组DNA的 cDNA)。制备信息素LcDNA和H-SemaL基因的特定方法在实施例中描述。

本发明也涉及制备L型信息素的方法。例如,信息素L或它的衍生物可以通 过克隆相应的编码L型信息素或其衍生物的核酸序列进入表达载体,并且利用后 者重组载体来转化合适细胞来制备。例如,利用原核或真核细胞是可能的。L型 信息素或其衍生物也可以在合适时用化学手段制备。

此外,L型信息素和其衍生物可以作为与例如蛋白质或肽的融合蛋白表达, 所说的蛋白质或肽使得表达的融合蛋白可以被检测,例如作为与GFP(绿色荧光蛋 白质)的融合蛋白。信息素也能作为具有一个,两个,三个或更多个表位标记的融 合蛋白进行表达,例如具有Myc和/或His(6×组氨酸)和/或流感标记。相应地利 用或制备包含编码这些融合蛋白的DNA序列的质粒是可能的。例如,编码信息 素的序列可以克隆进含有编码GFP和/或表位标记(例如Myc标记。His标记。流 感标记)的DNA序列的质粒。其特定的例子在表中列出的例子和序列中给出,在 适当时参考关于质粒的注释。

本发明进一步涉及抗体,具体地说。这些抗体结合或认别L型信息素,它的 衍生物或部分。其可能的例子是可以在如小鼠,兔,山羊,绵羊,小鸡等等中产 生的多克隆或单克隆抗体。

本发明这种主题的特定实施方案包含直接针对如下表位的抗体,所述表位相 应于表4中显示的H-SemaL序列的179至378或480至666位的氨基酸序列。 本发明也涉及用于制备特异性抗-信息素L抗体的方法该制备中使用包含所说的表 位的抗原。

本发明也涉及制备抗体的方法,为了这一目的,优选地利用包含特有信鼠素 表位和可以用于重组融合蛋白随后纯化的表位标记的融合蛋白。纯化的融合蛋白 可以用于随后的免疫。为了制备重组融合蛋白,应制备相应的重组表达载体,然 后用来转化合适的细胞。可以从这种细胞中分离出重组融合蛋白。例如,该方法 可以是如同在实施例8中所描述的那样。

这些抗体可以用来纯化相应的信息素,例如H-SemaL和它的衍生物,例如在 亲和柱上纯化,或用于蛋白质的免疫检测,例如利用ELISA,蛋白质印迹法和/ 或免疫组织化学。这些抗体也可以用于分析H-SemaL的表达,例如在不同的细胞 类型或细胞系中。

H-SemaL的cDNA的长度有2636个核苷酸(表2)。H-SemaLcDNA的基因产 物的长度有大约666个氨基酸(表4),并且显示了典型的L型信息素结构域结构。 基因产物具有一个N端信号肽(第1至44个氨基酸),一个Sema结构域(第45个 氨基酸至大约第545个氨基酸),以及一个Ig(免疫球蛋白)结构域(大约第550至 620个氨基酸);同时,在C端具有一个代表潜在的跨膜结构域的疏水氨基酸序列。 这个结构域结构对于信息素以前从来没有描述过。它涉及可能定位在细胞表面并 且属于一个新的亚组的膜结合糖蛋白。以这以前未知的结构域结构为基础,现在 可以将信息素划分成Ⅵ个子群:

Ⅰ    分泌性,没有其它结构域(例如ORF-A49)

Ⅱ lg 分泌性,(没有跨膜结构域)(例如AHV-Sema)

Ⅲ lg,TM,CP具有胞质序列,膜锚着(例如CD100)

Ⅳ Ig,(P),HPC具有亲水C端,分泌性(例如H-Sema-Ⅲ,M-SemaD, 脑衰蛋白-l)

Ⅴ Ig,TM,CP具有C端7血小板反应蛋白基元,膜锚着(例如M- SemaF和G)

Ⅵ Ig,TM膜锚着(例如H-SemaL,M-SemaL)

一个H-SemaL的非糖基化未加工形式的计算分子量大约是74.8kd(74823道 尔顿)(利用肽-分选程序(Peptide-Sort),GCG程序包计算)。计算的等电点是pH =7.56。一个可能的信号肽切割位点定位在44和45个氨基酸之间(表3;以Signal P计算(http.//www.cbs.dtu.dk/services/Signal.P),用于分析信号序列的基于神经网络 的一种程序{Niesen H.等(1997)蛋白质工程10:1-6}),这给出了加工的蛋白质 (没有信号肽)的分子量(MW)是70.3kd(70323道尔顿)和等电点是pH=7.01。

实际上也同样阐明了基因组的结构。H-SemaL基因有13或15或更多个外显 子,优选地14个外显子,以及有12或14个内含子,优选地13个内含子。由于 这种外显子-内含子复合结构,不同的剪接变体是可能的。在RNA印迹法中发现 了所转录的H-SemaL基因的mRNA,特别是在胎盘,性腺,胸腺和脾中。在神 经组织或肌肉组织中还没有发现任何mRNA。有证据显示在内皮细胞中的表异性 调节性表达。

变异剪接也可以导致具有牵涉到胞内信号转导的胞质内序列的H-SemaL形 式(例如,类似于CD100)。同样地,变异剪接导致分泌性H-SemaL形式(类似于病 毒AHV-Sema)将也是可能的。

借助于GCG程序包(遗传学计算机小组(1991)GCG包的程序手册,版本7, 575Science Drive,威斯康星,美国53711),FASTA(Pearson和Lipman(Proc.Natl. Acad.Sci.85,2444-2448)和BLAST程序(Gish和States(1993)Nat.Genet.3, 266-272;Altschul等(1990)J.Mel.Biol.215,403-410)完成了核苷酸和氨基酸的 序列分析。这些程序也与GenBank(版本102.0)和Swiss Prot(版本34.0)一起用于序 列比较。

如H-SemaL的糖基化和肉豆蔻酰化翻译后修饰也同样是可能的。借助于 Prosite程序(GCG程序包)在H-SemaL的氨基酸序列的位置105,157,258, 330和602发现了N-糖基化位点的共有序列(表4中显示),而肉豆蔻酰化位点的 共有序列在位置114,139,271,498,499,502和654发现了(共有序列:G~(E,D,R, K,H,P,F,Y,W)x(S,T,A,G,C,N)~(P))。此外,H-SemaL的氨基酸序列含有几个 不同激酶的潜在的磷酸化的共有序列。因此,可以认为H-SemaL可以是不同激酶 的底物,例如肌酸激酶2,蛋白激酶C和酪氨酸激酶的磷酸化位点。

推定肌酸激酶2的磷酸化位点(共有序列Ck2:(S,T)x2(D,E))(Prosite, GCG)在氨基酸序列的位置119,131,173,338,419和481。推定蛋白激酶C的磷酸 化位点(共有序列PkC:(S,T)x(R,K))(Prosite,GCG)在氨基酸序列的位置107,115, 190,296,350,431,524和576。推定酪氨酸激酶的磷酸化位点(共有序列:(R, K)x{2,3}(D,E){2,3}Y)(Prosite,GCG)在氨基酸序列的位置205。

以氨基酸的单字母代码表明了所说的共有序列。

整联蛋白的特征性"RGD″基元(精氨酸-甘氨酸-天冬氨酸)位于位置267。糖基 化位点在病毒AHV-Sema,H-SemaL和(就目前所知的)M-SemaL之间是高度保守 的。

H-SemaL的二-或多聚化是可能的,并且对于其它信息素(如CD100)已经描述 过{Hall等(1996)}。同样地,CD100分子是150kd的膜锚着糖蛋白二聚体。然而, CD100与本发明的人类信息素(H-SemaL)不是密切相关的。

M-SemaL的部分cDNA序列的长度是1195个核苷酸。这种编码蛋白质的序 列具有394个氨基酸。这394个氨基酸相当于H-SemaL的1至396个氨基酸。在 M-SemaL中的信号肽为从1至44个氨基酸(恰如在H-SemaL中)。Sema结构域从 第45个氨基酸开始,并且延伸到末端或有可能超出表4中所显示的序列末端。

利用Clustal W程序(Thompson等(1994))进行多重序列对比。利用人工 SEAVIEW(Galtier等(1996)Comput.Appl Biosci 12,543-548)进一步进行序列对 比。利用Clustal W(Thompson等(1994))来确定系统发育距离。

已知蛋白质序列和所说的新的信息素序列的比较以及这些序列的系统发育分 析显示了根据它们的系统发育关系可以对基因进行分类。当然一般说来,相应的 信息素亚型的C端结构域结构是牵涉到决定相同子群的信息素比不同子群的信息 素在系统发育上更密切的原因的一个因素。分离出信息素的物种也有影响,即相 应的物种在系统发育上相互之间是否存在密切的关系。

利用CLUSTALW程序{ThompsonJ.D等(1994)核酸研究22:4673-4680}对已 知信息素氨基酸序列(全序列和/或部分序列,利用在表4和5中所显示的H-SemaL 和M-SemaL的氨基酸序列和所有其它以所述登记号入库的序列或从这些序列中 衍生的所编码的氨基酸序列)进行系统发育分析(比较图3),显示出H-SemaL和 M-SemaL的氨基酸序列相互之间在系统发育上非常密切,并且形成一个独立的系 统发育群。反过来H-SemaL和M-SemaL与AHV-Sema和Vac-A39在系统发育上 最密切。与任何其它以前所公开的信息素相比,它们相互之间明显地是更加密切 相关的。这种分析也显示了其它信息素相互之间在系统发育上也密切相关,并且 形成具有信息素的独立群。例如,具有分泌性的信息素(例如H-SemaⅢ,-Ⅳ,- V和-E)属于一个系统发育群。它们在其它物种中的同系物也属于这个亚族,而人 类(跨膜)CD100与相应的小鼠同系物(M-SemaG2)和脑衰蛋白4一起属于一个系 统发育群。

关于完全的氨基酸序列,关于十分密切相关基因(例如,H-和M-SemaE或- Ⅲ/D)在系统发育群之内所观察到的同源性是大约在90%和80%之间的氨基酸等 同性,而在低相关信息素基因的情况下不到40%。在Sema结构域之内,所观察 的氨基酸等同性百分比稍高一点,并且由于它对整个蛋白质的氨基酸序列的高贡 献率(蛋白质的50-80%属于Sema结构域),这一点显著影响整个等同性。

对于完全蛋白质来计算,H-SemaL与AHV-Sema有46%的同一性,但是 如果只考虑Sema结构域本身,那么氨基酸的等同性是53%。例如,这高于相关 的M-Sema-B-和-C(完全蛋白质37%的等同性,Sema结构域43%的等同性),类似 于M-SemaA和-E(完全蛋白质43%,Sema结构域53%)。在Sema结构域区域中 部分M-SemaL序列(表6)和H-SemaL(表5)之间的氨基酸等同性是93%,那么可以 假定涉及了相应的同源小鼠基因。

与H-SemaL相比,在其它物种中相应于H-SemaL和M-SemaL的信息素在超 过40%的Sema结构域之内可以具有氨基酸等同性。在密切相关的脊椎动物(哺乳 动物,鸟)中,发现氨基酸等同性高于70%。

所说的信息素属于一个与病毒的AHV-Sema具有比与以前所公开的人和鼠的 信息素更大的氨基酸等同性的新的亚族,并且具有一个以前对于人类信素未公 开过的C端结构。由于它们的结构域结构,通过是否属于亚组Ⅳ和/或与H-SemaL 和M-SemaL是同一系统发育群,和/或对于完全氨基酸序列而言,与H-SemaL具 有至少30至40%的氨基酸等同性,优选的是50至60%,特别优选的是70至 80%,或具有更大的等同性,和/或对于Sema结构域而言,与H-SemaL具有至少 70%的氨基酸等同性,优选的是大于80%,特别优选的是大于90%来识别这些新 的信息素(亚族成员)。

L型信息素也有一种不同类型的生化功能。这些信息素的一种新的功能是调 节免疫系统。

与H-SemaL最密切相关的是病毒AHV信息素(AHV-Sema)。后者具有相似大 小,但是,与H-SemaL相对比,它没有任何跨膜结构域。在天然的宿主(蓝wildeest) 中,病毒感染细胞大概以分泌AHV-Sema来阻止H-SemaL的等同受体(蓝 wildebeest中的L型信息素),并且这样躲开了受到免疫系统的攻击。也可以想象 的是,对于免疫系统细胞来说。它的一个功能是作为排斥剂(化学排斥物)。

一般地,新的L型信息素和其衍生物的生化功能将被认为是具有免疫调节和/ 或炎症调节功能。一方面,它们能够

A)作为抑制免疫应答的分子,它们可能显示它们作为化学排斥物和/或免疫抑 制剂对细胞的作用,局部地或远距离起作用,例如在细胞表面上作为跨膜蛋白质, 例如若由于加工(例如蛋白水解酶)或变异剪接引起它们分泌,例如通过组织扩散。 例如,这些新的L型信息素的表达(如在脉管内皮细胞的表面)可以阻止白细胞的 吸附和迁移通过容器壁。新的信息素在维持屏障作用方面可能起着重要的作用, 例如在特别"重要的"或暴露的器官中阻止感染,例如保持血-脑屏障,胎盘循环和/ 或其它免疫特权位置(例如胰岛)和/或预防自身免疫疾病。此外,新的信息素和/或 它们的衍生物也可以在各种组织的排斥信号中涉及,例如对于免疫系统细胞(例如 白细胞),阻止防卫机制非故意的活化。

B)此外,新的信息素和/或其衍生物可能具有附件分子功能。例如,在细胞 表面上表达,作为防卫机制活化的一部分它们可以参予与免疫系统细胞的相互作 用,例如在病毒感染的情况下。

这揭示了新的L型信息素和其衍生物,以及编码这些蛋白质的核酸的几个可 能用法。

功能A):这包含免疫抑制和/或抗炎原理:在器官移植,烧伤治疗,免疫治疗 和基因治疗领域中有许多利用的潜在可能性。

例如,借助于信息素-编码DNA或其衍生物,可以产生非人类转基因动物。 对这些动物的一种可能应用是在器官移植的转基因模型中抑制移植排斥。例如, 能够产生抑制排斥的转基因动物器官用于异种移植。例如,与其它转基因(例如, 如DAF或CD59一类的补体调节剂)一起应该也是可能的。另一应用是产生非人 类“剔除”(knock-out)动物,例如“剔除”小鼠("基因导向的实验室手则",Torres 和Kiihn(1997)牛津大学大学出版社,ISBN0-19-963677-X):例如,通过剔除小鼠 M-SemaL基因以发现该基因的其它功能是可能的。如果小鼠没有信息素基因可以 生存,那么它们也阐明了对于炎症疾病的潜在模型系统。如果M-SemaL对免疫调 节来说是重要的,那么将要期待大量的这样的小鼠。此外,可以产生非人类 knock-in动物(例如小鼠)。例如,这使得能够以通常的/修饰的H-SemaL或修饰 M-SemaL(例如组成型和/或诱导型启动子控制下的新的信息素亚型的整合)来代替 M-SemaL。例如,为了进一步寻找新的信息素的功能(例如人基因或这些基因衍生 物的功能),可以利用这种类型的动物,或用于确定和鉴定免疫调节剂。

例如,利用编码L型信息素或其衍生物的核酸来产生如重组免疫抑制剂,其 它可溶性蛋白质或从L型信息素氨基酸序列(例如H-SemaL或相应的核酸,如基 因)衍生出来的肽。以一种类似的方法可能产生具有结构相似性的激动剂。这些免 疫抑制剂或激动剂也可以用于自身免疫疾病和炎症疾病和/或器官移植。

利用L型信息素的基因治疗,例如用编码H-SemaL或其衍生物的核酸,例如 利用病毒或非病毒的方法。用于自身免疫疾病和炎症疾病器官转移和移植前/间/ 后以阻止移植排斥。

特别地,使用新的信息素和/或编码这些信息素的核酸,以及其衍在物(特别是 H-SemaL,编码H-SemaL的DNA,以及其衍生物),用于药剂筛选(特别是确定 和鉴定免疫调节剂)是可能的。

功能B):H-SemaL是在细胞表面表达并牵涉到与细胞(例如免疫系统的细胞) 的相互作用的附件分子,例如在信号途径活化中作为附件分子。例如,病毒基因 或病毒基因产物或其它病原基因(例如起源于微生物的)可以充当该附件分子的竞 争性抑制剂。具有这种功能的新的信息素同样地用于器官移植,炎症治序,免疫 治疗和/或基因治疗领域。

例如,新的信息素可以用于拮抗剂或抑制剂的筛选。以这种方法鉴别的药剂可 以用于例如阻断信息素受体。可溶性和/或分泌性H-SemaL拮抗剂或抑制剂例如可 以是化学物质或新的信息素或其衍生物本身(例如适合阻断相应受体的其部分/截 短形式。如没有膜结构域或作为Ig融合蛋白或从后者衍生的肽)。以这种方法鉴别 的特异性拮抗剂和/或抑制剂例如可能具有竞争性作用,并且用于抑制排斥(例如在 器官移植的转基因模型中),以及用于自身免疫疾病,炎症和器官移植。编码新的 信息素的核酸(例如DNA)或其借助于分子生物学方法产生的衍生物例如可能用于 产生非人类转基因动物。在这些转基因动物中,H-SemaL的超量表达能导致提高 对自身免疫疾病和/或炎症的易感性。于是这样的转基因动物适合筛选新的特异性 免疫调节剂。

同样地,这样的核酸可以用于产生非人类“剔除”动物,例如“剔除”小鼠, 其中失去了小鼠M-SemaL基因。利用这样的“剔除”动物可以找到基因的进一步 生化功能。如果没有M-SemaL基因的小鼠能够生存,那么它们也为炎症提供了潜 在的模型系统。

这种DNA同样可以用来产生非人类knock-in动物,例如小鼠。这使得可以用 修饰M-SemaL基因/cDNA或任选修饰的(例如变异)另一物种的L型信息素基因 /cDNA(例如H-SemaL)来代替M-SemaL基因。这样的转基因动物用来寻找本发明 信息素的进一步功能。

本发明也涉及L型信息素及其衍生物以及编码这些蛋白质的核酸(例如基因 /cDNA和其衍生物)和/或借助于这些信息素鉴别的药剂在生产药物中的应用。例 如,生产可以用于基因治疗以及包含L型信息素(例如H-SemaL)表达的激动剂和/ 或拮抗剂的药物是可能的。为此目的例如也使用病毒的和/或非病毒方法。这些药 物例如可以用于自身免疫疾病和炎症,在移植之后和/或期间和/或之前,来阻止器 官移植排斥。

编码新的信息素的核酸(例如基因,cDNA以及其衍生物)在分子生物学中也 可以作为工具试剂。

此外,新的信息素,尤其是H-SemaL以及核酸(例如其基因/cDNA)可以用于筛 选新的药剂。例如,修饰蛋白质和/或从H-SemaL和/或M-SemaL衍生的肽在功能 化验上可以用来寻找相应的受体和/或它的拮抗剂或激动剂,例如利用H-SemaL和 同系物的表达构建体。

本发明也涉及L型信息素或编码L型信息素的核酸序列在鉴别药剂(尤其是免 疫调节剂)的方法中的应用。

本发明也涉及使用L型信息素或其衍生物或编码L型信息素的核酸序列或其 衍生物鉴别药剂的方法,以鉴别药理活性剂,例如免疫调节剂。例如,本发明涉 及这样的方法,其中,在特定条件下L型信息素与待测药剂一起培养,平行地, 第二批培养中没有待测药剂但是其它条件都相同,然后确定待测药剂的抑制或激 活作用。

例如,本发明也涉及这样的鉴别药剂的方法,其中,编码L型信息素或其衍 生物的核酸序列在有待测药剂存在下在特定条件下表达,并测定其表达程度。适 当时也可能在这种方法中在相同的平行条件下但是包含不同量的待测药剂下进行 两批或多批试验。

例如,待测药剂能够阻止或激活转录和/或翻译。

如同它的病毒同系物一样,L型信息素可以结合到新近描述的受体分子 VESPR(Comeau等,(1998)免疫,卷8,473-482)上,并且,在单核细胞中推定 可以造成对细胞粘附分子(如ICAM-1)和细胞因子(诸如白介素-6和白介素-8)的诱 导,这可以导致其活化和细胞聚集。VESPR受体的表达模式显示了某些令人感兴 趣的与H-SemaL的相似性,例如,胎盘中的强烈表达和脾组织的显著表达。plexin 家族迄今未知的其它受体或其它受体的相互作用是可能的。它也能与自身或其它 信息素-样分子相互作用。L型信息素的相互作用可能特别通过Sema结构域的C 端区保守结构域来发生。

关于质粒的注释:

pMeIBacA(Invitrogen,De Schelp,NL)中的pMeIBacA-H-SemaL(6622bp) (SEQ ID NO.42)。核苷酸96-98ATG为起始密码子,核苷酸96-168为蜂毒肽信号 序列,核苷酸168-173为BamHⅠ切割位点(PCR/克隆),核苷酸171-1998为读框 SEMA-L氨基酸42-649(没有自的信号序列和跨膜序列),核苷酸1993-1998为 EcoRⅠ切割位点(PCR/克隆)和核苷酸1992-1994为终止密码子

质粒pCDNA3.1-H-SemaL-MychisA(7475bp)(SEQ ID NO.35):核苷酸954-959 为BamHⅠ切割位点(克隆),核苷酸968-970为ATG SEMAL,核苷酸968-2965为 读框SEMAL,核苷酸2963-2968为PmlⅠ切割位点,核苷酸2969-2974为HindⅢ 切割位点,核苷酸2981-3013为Myc标记。核苷酸3026-3033为6xHis标商,核 苷酸3034-3036为终止密码子

质粒pCDNA3.1-H-SemaL-EGF P-MychisA(8192bp)(SEQ ID NO.36):核苷酸 954-959为BamHⅠ切割位点(克隆),核苷酸968-970为ATG SEMA-L,核苷酸 968-2965为读框SEMA-L,核苷酸2963-2965为一半PmlⅠ切割位点,核苷酸 2966-3682为读框EGFP(克隆在PmlⅠ处),核苷酸3683-3685为一半PmlⅠ切割位 点,核苷酸3685-3691为HindⅢ,核苷酸3698-3730为Myc标记。核苷酸3743- 3760为6xHis标记,以及核苷酸3761-3763为终止密码子

载体pIND(Invitrogen,De Schelp,NL)中的质粒pIND-H-SemaL-EA(7108 bp)(SEQ ID NO.38):核苷酸为533-538 BamHⅠ切割位点(克隆),核苷酸为546-548 ATG SEMA-L,核苷酸546-为读框SEMA-L,核苷酸为2542-2547 PmlⅠ切割位 点,核苷酸2548-2553为HindⅢ切割位点和核苷酸2563-2565为终止密码子。

载体pIND(Invitrogen,De Schelp,NL)中的质粒pIND-H-SemaL-EE(全长 7102bp)(SEQ ID号37):核苷酸533-538为BamHⅠ切割位点(克隆),核苷酸546- 548为ATG SEMA-L,核苷酸546-为读框SEMA-L,核苷酸2542-2547为PmlⅠ 切割位点,核苷酸2548-2553为HindⅢ切割位点,核苷酸2560-2592为Myc标记, 核苷酸2605-2622为6xHis标记和核苷酸2623-2625为终止密码子。

相当于pQE30-H-SemaLBH的载体pQE31(Qiagen,Hilden)中的质粒pQE30- H-SemaL-179-378.seq(4019bp)(SEQ ID号39):核苷酸115-117为ATG,核苷酸 127-144为6xHis标记,核苷酸145-750为BamHⅠ-HindⅢPCP片段SEMA-L氨基 酸(aa)179-378和核苷酸758-760为终止密码子。

载体pQE31(Qiagen,Hilden)中的质粒pQE31-H-SemaL-(SH(3999 bp)(SEQ ID号40):核苷酸115-117为ATG,核苷酸127-144为6xHis标记,核 苷酸147-152为BamHⅠ位点,核苷酸159-729为Sacl-HindⅢ片段SEMA-L(C 端)aa480-666和核苷酸734-736为终止密码子。

实施例

用于实施例的实验条件:

使用的PCR程序:

Taq52-60(Ampli-TaqR聚合酶,Perkin Elmer,Weil der Stadt,德国)

96℃/60s                     1个循环

96℃/15s-52℃/20s-70℃/60s   40个循环

70℃/60s                     1个循环

Taq60-30

96℃/60s                     1个循环

96℃/15s-60℃/20s-70℃/30s   35个循环

70℃/60s                      1个循环

Taq60-60

96℃/60s                      1个循环

96℃/15s-60℃/20s-70℃/60s    35个循环

70℃/60s                      1个循环

Taq62-40

96℃/60s                      1个循环

96℃/15s-62℃/20s-70/40s      35个循环

70℃/60s                      1个循环

用Taq聚合酶的PCR反应条件:

50μl反应混合物中具有100-200ng模板,200μM dNTP,0.2-0.4μM每一引 物,2.5U Ampli-TaqR,5μl10x供给的反应缓冲液

使用的程序: 1.XL62-6(加长模板PCR SystemR,Boehringer Mannheim,德国) 94℃/60s                         1个循环 94℃/15s-62℃/30s-68℃/6min      10个循环 94℃/15s-62℃/30s-68℃/(6min+15s/个循环)25个循环 68℃/7min                         1个循环 2.XL62-12(加长模板PCR SystemR,Boehringer Mannheim,德国) 94℃/60s                          1个循环 94℃/15s-62℃/30s-68℃/12min      10个循环 94℃/15s-62℃/30s-68℃/(12min+5s/个循环)25个循环 68℃/7min                         1个循环

用加长模板PCR系统的PCR反应条件

50μl反应混合物中具有100-200ng模板,500μM dNTP,0.2-0.4μM每一引 物,0.75μl酶混合物,5μl10x供给的No.2反应缓冲液。

实施例1:

从AHV-Sema序列开始(Ensser和Fleckenstein(1995),普通病毒学杂志76: 1063-1067),进行PCR和RACE-PCR。用于这里的起始材料是来自胎盘组织的人 cDNA,为进行RACE扩增其上已连接了衔接子(MarathonTM-cDNA扩增试剂盒, Clontech Laboratories GmbH,Tullastraβe4,69126Heidelberg,德国)。最初特异 性引物(No.121234+No.121236,表6)用于扩增长度约为800bp(碱基对)的PCR 片段(PCR程序:(Taq60-60))。克隆与测序该片段(Taq染料标记脱氧终止子测序 试剂盒,应用生物系统。Foster City,CA,USA/Brunnenweg 13,Weil der Stadt)。 PCR产物的测序揭示了与AHV-Sema的DNA序列具有高度同源性的序列,与两 个EST序列相同。

使用引物对(No.121237+No.121239,表6)鉴别出600bp的PCR片段。这表明 它们是来自相同基因的DNA序列的克隆。

实施例2:

对实施例1的800bp PCR片段进行放射性标记(通过{Feinberg(1983)Anal. Biochem 132:6-13}的方法利用32P-α-dCTP进行随机引导),并且作为多组织 Northem印迹法(人类多组织Northem印迹法Ⅱ,Clontech,Heidelberg,德国) 的探针,这包括来自脾、胸腺、前列腺、睾丸、卵巢、小肠、大肠和白细胞(PBL) 的mRNA样品。这清楚地显示了在脾和性腺(睾丸,卵巢)中长度约为3.3kb的 mRNA的表达,并且在胸腺和肠道中较弱。主印迹法杂交(许多组织RNA的点印 迹法(Human RNA Master BlotTM,Clontech))确认了这一结果,并且在胎盘组织 中也显示出强的表达。

在42℃严格条件(5xSSC,50mM磷酸钠pH6.8,50%甲酰胺,100μg/ml 酵母RNA)下杂交16小时。对印迹严格地冲洗(65℃,0.2×SSC,0.1%SDS) 并且对Fuji BAS2000 PhosphoimagerTM暴光。

实施例3:

用这种探针筛选在噬菌体λgt10(人脾5’STRETCHPLUScDNA,Clontech) 中克隆的来自人脾的cDNA文库,同时鉴别到-个λ克隆。插入这个克隆的1.6kb 长的cDNA利用载体特异性引物No.207608+No.207609(表6)(位于EcoRⅠ克隆 位点的侧面)由PCR(ExpandTM长模板PCR系统,Boehringer Mannhein GmbH, Sandhofer Straβe116,68305Mannhein)扩增,同时对产生的PCR片段进行测序。 这个克隆包含cDNA的5’端,并且在3’方向也扩展已知的cDNA序列。从新 的cDNA部分序列开始,设计出RACE-PCR的新引物(No.232643,No.232644, No.233084,表6)。利用一种改进的热循环技术(MJ-Research,Biozym Diagnostik GmbH,31833 Hess的PTC-200.Oldendorf),其具有明显更有效的运行参数(加热 和冷却速率),利用引物No.232644和No.232643和AP1扩增3’RACE-PCR产 物,并且将它克隆到载体pCR2.1(Invitrogen,De Schelp12,9351NVLeek,荷 兰)中。对3’RACE-PCR产物进行测序,用这种方法确定cDNA的3’端。在 5’方向的RACE扩增(引物No.31990和No.233084和AP1)以几个核苷酸延伸过 cDNA5’端,并且确认在鉴别的λ克隆中发现的H-SemaL的氨基端。

实施例4:

从一短的鼠EST(登记号260340)开始,以从中产生的引物No.260813(表6)和 H-SemaL特异性引物No.121234(表6)进行PCR(条件:Taq52-60)扩增长约840bp 的鼠cDNA的DNA片段,随后克隆至载体pCR2.1中。包含该DNA片段的基因 称为M-SemaL。产生的M-SemaL DNA片段用于从小鼠脾(小鼠脾5’STRETCH cDNA,Clontech)调查cDNA库,鉴定几个克隆是可能的。

从鼠内皮cDNA用引物No.260812和No.260813进行PCR(Taq60-30)提供了 长为244碱基对的PCR片段。PCR结果表明在鼠内皮细胞中有明显基线表达, 用细胞因子干扰素-γ和脂多糖刺激后则下降。

实施例5:

采用荧光原位杂交(FISH)来调查染色体的定位情况。为了这一目的,从人血 液样品和小鼠细胞系BINE4.8开始分别制备人和鼠的中期染色体(Keyna等(1995) 免疫学杂志155,5536-5542)(Kraus等(1994)遗传学23,272-274)。利用RNase 和胃蛋白酶处理载玻片(Liehr等(1995)应用细胞遗传学21,185-188)。对于杂交, 利用120mg人切口平移信息素样品和200mg相应的小鼠样品。每种情况下,杂 交在37℃,20μgSTD以及4.0μgCOT1-DNA存在下在湿室中进行3天。

用50%甲酰胺/2xSSC冲洗载玻片(45℃下3次,每次5min),然后,用2xSSC 冲洗(37℃下3次,每次5min),以及用FITC-亲和素系统(Liehr等(1995))检测生物 素化样品。利用荧光显微镜测评载玻片。每个实验以双份进行,测定了25个中期 /样品。表明H-SemaL位于染色体15q23上。定位在邻近染色体是Bardet-Biedls综 合症和Tay-Sachs疾病的基因座(氨基已糖苷酶)。

实施例6:

H-SemaL基因的基因组内含子-外显子结构的大部分已被阐明。

基因组DNA片段扩增从已从PHA-刺激外周淋巴细胞(血液)分离出来的250mg 人基因组DNA开始。较短的片段利用Ampli TaqR(Perkin Elmer)进行扩增,较长的 片段利用加长模板PCR SystemR(Boehringer Mannheim)进行扩增。

到目前为止,通过PCR扩增来克隆和鉴别H-SemaL的几乎完全的基因组座 是可能的。现已可能鉴别总共超过8888bp的基因组序列,从而基本阐明该基因 的内含子-外显子结构。

实施例7:

表达克隆:

因为不能从lambda-gt10cDNA库分离出来信息素基因完全克隆,同时也不能经 PCR获得完全克隆,所以使用N端DNA片段的引物No.240655和No.121339 以及C端DNA片段的引物No.240656(含有HindⅢ和PmeⅠ切割位点)和No. 121234通过PCR(XL62-6)在2个重叠亚片段上扩增出cDNA的编码区。产生的 DNA片段(亚片段)克隆到载体pCR21中。对两个亚片段完全测序,最后通过插入 0.6kb C端Sstl-HindⅢ限制片段到质粒(包含N端DNA片段,并且已经用限制酶 SstⅠ与HindⅢ酶切)中来制备完全的H-SemaL cDNA。利用EcoRⅠ切割位点(在 pCR2.1中)和HindⅡ切割位点(在表6的引物No.240656中)从质粒pCR2.1-H- SemaL(表7中显示的序列,SEQ ID NO.34)上切除完全基因,并且连接到相应切 割的组成性表达载体pCDNA3.1(-)MycHisA(Invitrogen)上。EcoRⅠ-ApaⅠ片段(没有 Myc-His标记)从所产生的重组质粒pCDNA3.1(-)H-SemaL-MycHisA(表8中显示的 序列)中切下,并且连接到诱导型载体pIND(同样已用EcoRⅠ-ApaⅠ酶切)(蜕皮激素 诱导型哺乳动物表达系统,Invitrogen)上。重组质粒称为pIND-H-SemaLEA(表11 中显示的序列)。将pCDNA3.1(-)H-SemaL-Myc-HisA(表9中显示的序列)的 EcoRⅠ-Pmel片段(具有Myc-His标记)插人到EcoRⅠ-EcoRⅤ-切割的载体pIND中。 重组质粒称为pIND-H-SemaL-EE(表10中显示的序列)。

通过连接PCR-扩增EGFP读框(来自载体pEGFP-Cl(Clontech),利用引物No. 243068+No.243069,Taq52-60)到pCDNA3.1(-)H-SemaL-MycHisA的Pmel切割 位点上制备具有增强绿色荧光蛋白质(EGFP)的H-SemaL融合基因,形成质粒 pCDNA3.1(-)H-SemaL-EGFP-MycHisA(表9中显示的序列)。

在表7至13表中用小写字母标出了H-SemaL的序列,其部分片段或衍生物, 同时用大写字母标出了质粒序列。

实施例8:

为了制备H-SemaL-特异性抗体,将H-SemaL的cDNA片段整合进原核表达 载体,并且在大肠杆菌中表达,以及纯化信息素衍生物。信息素衍生物作为具有 His标记的融合蛋白来表达。因此,利用包含His标记序列并允许信息素cDNA片 段整合入读框的载体。例如,N端6x组氨酸标记使用镍螯合亲和性层析纯化成 为可能(Qiagen GmbH,Max-Volmer Straβe4,40724Hilden):

1.利用引物No.150788和No.150789通过PCR扩增编码179-378位氨基酸的 部分H-SemaLcDNA,并将这条DNA片段连接到载体pQE30(已用限制性酶 BamHⅠ和HindⅢ切割)(Qiagen)上(构建体pQE30-H-SemaL-BH(表12中显示的序 列))。

2.从质粒pCR2.1上用限制性酶SstⅠ与HindⅢ切下编码C端480-666位氨基 酸的H-SemaLcDNA部分,并且连接到载体pQE3l(已用SstⅠ和HindⅢ切割)(Qiagen) 上(构建体pQE31-H-SemaL-SH(表13中显示的序列)。

通过DNA测序检查序列在正确读框中的正确整合。通过Ni2+亲和性层析纯 化由N端6x组氨酸标记和部分信息素H-SemaL组成的融合蛋白。纯化的融合蛋 白用于对各种动物(兔,小鸡,小鼠)的免疫。

实施例9:

各种细胞类型的FACS分析(图4和5)

在FACS缓冲液(含有5%胎牛血清(FCS)和0.1%Na叠氮化钠的磷酸缓冲盐水 (PBS)中冲洗细胞(大约0.2-0.5×106),然后在每种情况中与抗血清(在冰上)培养1 小时。用于对照(上层小鸡预免疫前血清(1∶5))和特异性检测(特异性染色)的初 级抗体为H-SemaL-特异性小鸡抗血清(1∶50)。用通过镍螯合亲和性层析(如实施 例8所描述的)纯化的蛋白质免疫小鸡产生含有抗H-SemaL氨基酸(Aa)179-378(具 有N端His标记)抗体的特异性抗血清。所使用的次级抗体是来自兔的FITC-标记 抗小鸡F(ab’)抗体(Dianova Jackson实验室,Order No.303-095-006,汉堡,德 国)(1mg/ml)。FITC-标记的兔抗小鼠IgG用于CD100染色。次级抗体每种情况下 在FACS缓冲液中以1∶50进行稀释。

然后冲洗细胞,在PBS中进行重悬浮,并且在FACS中分析。利用FACS-跟 踪仪(Becton-Dickinson)进行FACS分析。原理:单细胞悬浮液穿过一个测量通道, 其中以488nm的激光光线照射这些细胞,从而激发荧光染料(FITC)。测量散射正 向光线(正向散射,FSC:与细胞大小相关),和其侧向光线(侧向散射,SSC:与 颗粒量相关:不同细胞类型有差异)以及通道1的荧光(FL1)(FITC发射范围的波 长,530nm处最大值)。以这种方法每次测量10,000件(细胸)。

点印迹(图4a-k)(左图):SSC对FSC(大小对颗粒量/散射),右边窗口中分析了 (界线内)相似大小和颗粒含量的(均一)细胞群。。右边窗口显示了FL1的强 度(X轴)对事件数(Y轴),也就是说频度分布。

在每个这样的图中,对照血清的结果(不光滑曲线)叠加在特异性染色(光滑曲线) 的结果上面。与对照相比较特异性染色的曲线的右移相当于H-SemaL在相应细胞 中的表达。一种移出越大意味着更强的表达。

用于FACS分析的细胞系: a)U937细胞系

美国典型培养物保藏中心ATCC;ATCC号CRL-1593

名称U-937

组织:淋巴瘤;组织细胞;单细胞样

物种:人;

保藏者:H.Koren b)THP-1细胞系

ATCC保藏号:TIE-202

组织:单核细胞;急性单核细胞白血病

物种:人

保藏者:S.Tsuchiya c)K-562细胞系

ATCC保藏号:CCL-243

组织:慢性骨髓性白血病

物种:人;

保藏者:H.T.Holden d)L-428细胞系

DSMZ-德意志微生物保藏中心,DSMZ No:ACCl97

细胞类型:人Hodgkin淋巴瘤 e)Jurkat细胞系

DSMZ-德意志微生物保藏中心,DSMZ No:ACC282

细胞类型:人T细胞白血病

f)Daudi细胞系

ATCC保藏号CCL-213

组织:Burkitt淋巴瘤;B淋巴母细胞;B细胞

物种:人;

保藏者:G.Klein

g)LCL细胞系 EBV-转化的淋巴母细胞样B-细胞系。 h)Jiyoye(P-2003)细胞系

ATCC保藏号CCL-87 组织:Burkitt淋巴瘤;B细胞,B淋巴细胞 物种:人 保藏者:W.Henle i)CBL-Mix57

用重组体H.Saimiri(没有缺失的野生型)转化的人T-细胞系(从血液中分离) j)CBL-Mix59 用H.Saimiri(ORF71缺失)转化的人T-细胞系(从血液中分离)。

实施例10:蛋白质凝胶和蛋白质印迹法

将可分泌的人SEMA-L(表4的氨基酸42-649(没有信号肽和跨膜结构域))克隆 到质粒pMelBac-A(Invitrogen De Schelp,Leck,荷兰,Cv1950-20)中,这样就 产生了质粒pMeIBacA-H-SemaL(长度6622bp)(图8)。H-SemaL衍生物在杆状病毒 系统中表达(Bac-N-Blue,Invitrogen)。在从昆虫卵细胞Sf9(来自Spodoptera frugiperda)和High FiveTM(来自粉纹夜蛾U.S.Pat.No.5,300,435,从Invitrogen购得) 中通过具有重组体嗜斑纯化的杆状病毒的感染产生的细胞系中进行表达。

根据制造商的说明进行表达。

然后在凝胶中对蛋白质进行分级分离,并用蛋白质印迹法检测H-SemaL衍生 物。用H-SemaL-特异性小鸡抗血清进行检测(比较实施例8和图7)(稀释液1∶ 100)。根据制造商的说明利用抗-IgY-HRP偶联物(稀释液:1∶3000,来自驴; Dianova Jackson实验室)检测特异性小鸡抗体。

实施例11:pMeIBacA-H-SEMAL的制备

通过克隆适当的编码H-SemaL的氨基酸42-649的DNA片段到载体 pMeIBacA(4.8kbInvitrogen)中来制备重组载体(pMeIBacA-H-SEMAL,6622bp)(比 较pMeIBacA-H-SEMAL的注释)。通过BamHⅠ和EcoRⅠ,克隆发生在载体中的信 号序列(“蜜蜂蜂毒肽信号序列”)之后的读框中。利用引物对h-sema-l杆状病毒5’ 和第h-sema-l杆状病毒3’,扩增相应的H-SemaLDNA片段。

扩增(TaKaRa ExTa9标记聚合酶)和克隆的引物:用于没有信号序列的扩增并 引入BamHⅠ切割位点的"h-sema-l杆状病毒5’" 5’-CCGGATCCGCCCAGGGCCACCTAAGGAGCGG-3’(SEQ ID NO.43),用 于没有跨膜结构域的扩增并引入EcoRⅠ切割位点的"h-sema-l杆状病毒3’"5’- CTGAATTCAGGAGCCAGGGCACAGGCATG-3’(SEQ ID NO.44)。 附图:

图1:H-Sema-L的组织特异性表达

A)多组织RNA印迹(Clontech,Heidelberg,德国)。从左至右的载样:每泳道 20μg来自脾,胸腺,前列腺,睾丸。卵巢,小肠,大肠粘膜,外周(血液)白细胞 的Poly-A-RNA。标记大小标准。

在严格条件下,印迹与800碱基对长的H-SemaL探针进行杂交。

图2:H-SemaLcDNA的克隆和编码序列H-SemaL(H-SemaL基因)的基因组结 构的图示。

上:EST序列的定位(登记号;EST序列的定位以与AHV-Sema序列相关的 形式显示。

下:扩增的PCR和RACE产物和与在完全H-SemaLcDNA中相关cDNA克 隆的定位以及编码蛋白质的开放读框(ORF)。

底部:在H-SemaL基因中与基因组序列相关的外显子的相对定位。用箭头表 明了寡核苷酸引物的位置。

图3:系统发育树:从列出的信息素序列的多重对比获得。信息素的系统发育 关系在系统树中可以从它们的组群中推出。

图4:在各种细胞系和各种细胞类型中的H-SemaL表达的FACS分析(比较实 施例8)。

图5:CD100和H-SemaL表达的比较分析(比较实施例9)。

图6:在HiFive和Sf9细胞中可分泌的SEMA-L(H-SemaL)的表达(比较实施 例10)。

在杆状病毒系统(Bac-N-Blue,Invitrogen)中的pMelBac-A(Invitrogen)的aa 42- 649

用特异性小鸡抗血清1(1∶100)和抗-IgY-HRP偶联物(1∶3000,来自兔。 Jackson Lab.)的检测

1,4,6未感染的HiFive细胞(无血清)

2,3,5,7,8以重组体杆状病毒感染的HiFive细胞(无血清)

MRainbow分子量标志(AmershamRPN756)

9,10感染的Sf9细胞(包含血清的介质)。

图7:抗血清的特异性

泳道1-3:小鸡1;泳道4-6:小鸡2

泳道1和泳道4:免疫前血清

泳道2和5:免疫60天的血清

泳道4和6:免疫105天的血清

用H-SemaL的179-378位氨基酸(具有氨基端His标记)进行免疫(比较实施例 8,部分1)。

图8:对pMeIBacA-H-SEMAL的质粒图谱的描绘。

如实施例11的描述制备重组质粒。

表1来自不同物种的信息素的不同亚型     名称     别名    物种                  参考文献 H-SemaⅢ (H-SemaD) 人 Sec. (Kolodkin等,1993) CD-100 人 TM,IC;与CD45相连,在T细胞中表达 (Hall等,1996) H-SemaⅤ (H-SemaA) 人 Sec.;基因座3p21.3 (Sekido等,1996;Roche等,1996) H-SemaⅣ (H-Sema3F) 人 Sec.;基因座3p21.3 (Xiang等,1996;Sekido等,1996) H-SemaE 人 Sec.;不同于M-Sema-E的3’端(提高读框对比) AB000220(Yamada1997未发表) H-SemaK KIAA0311 人 Sec.; (Nagase等,1997) H-SemaL SEMAL 人 TM,无IC 本申请 M-SemaA 小鼠 Sec. (Püschel等,1995) M-SemaB 小鼠 TM,IC (Püschel等,1995) M-SemaC 小鼠 TM,IC (Püschel等,1995) M-SemaD M-SemaⅢ 小鼠 Sec. (Messersmith等,1995;Püschel等,1995 M-SemaE 小鼠 Sec,;5'部分序列 (Püschel等,1995) M-SemaF1 M-SemaF 小鼠 TM,IC (Inagaki等,1995) M-SemaG2 M-SemaG 小鼠 TM,IC;在淋巴细胞中表达,CD100的小鼠同系物 (Furuyama等,1996) M-SemaF2 M-SemaF 小鼠 TM,IC;凝血调节蛋白基元 (Adams等,1996) M-SemaG1 M-SemaG 小鼠 TM,IC;凝血调节蛋白基元 (Adams等,1996) M-SemaH 小鼠 Sec. (Christensen1996未发表)Z80941 M-SemaⅥa 小鼠 TM,IC (Zhou等,1997) M-SemaL Semal 小鼠 部分序列 本申请 脑衰蛋白-1 小鸡 Sec. (Luo等,1993) 脑衰蛋白-2 小鸡 Sec. (Luo等,1995) 脑衰蛋白-3 小鸡 Sec. (Luo等,1995) 脑衰蛋白-4 小鸡 部分序列 (Luo等,1995) 脑衰蛋白-5 小鸡 Sec. (Lou等,1995)  R-SemaⅢ 大鼠 Sec. (Giger等,1996) T-SemaⅠ Tribolum oonfusum TM,IC (Kolodkin等,1993) Ce-SemaⅠ C.elegans TM,IC U15667(Roy1994未出版) G-SemaⅠ Fasciclin-Ⅳ 蚱蜢 TM,IC (Kolodkin等,1993) D-SemaⅠ 果蝇属 TM,IC (Kolodkin等,1993) D-SemaⅡ 果蝇属 Sec. (Kolodkin等,1993) AHV-Sema AHV-1 Sec. (Ensser和Fleckenstein,1995) ORF-A39 牛痘 Sec. (Kolodkin等,1993) ORF-A39 同系物 天花 Sec.; (Kolodkin等,1993)

TM:跨膜区Sec:分泌性IC:推定的胞内胞浆序列基元 表2:H-SemaL的cDNA序列(2636个核苷酸)(SEQ ID NO.:1)

1     cggggccacg ggatgacgcc tcctccgccc ggacgtgccg cccccagcgc

51    accgcgcgcc cgcgtccctg gcccgccggc tcggttgggg cttccgctgc

101   ggctgcggct gctgctgctg ctctgggcgg ccgccgcctc cgcccagggc

151   cacctaagga gcggaccccg catcttcgcc gtctggaaag gccatgtagg

201   gcaggaccgg gtggactttg gccagactga gccgcacacg gtgcttttcc

251   acgagccagg cagctcctct gtgtgggtgg gaggacgtgg caaggtctac

301   ctctttgact tccccgaggg caagaacgca tctgtgcgca cggtgaatat

351   cggctccaca aaggggtcct gtctggataa gcgggactgc gagaactaca

401   tcactctcct ggagaggcgg agtgaggggc tgctggcctg tggcaccaac

451   gcccggcacc ccagctgctg gaacctggtg aatggcactg tggtgccact

501   tggcgagatg agaggctacg cccccttcag cccggacgag aactccctgg

551   ttctgtttga aggggacgag gtgtattcca ccatccggaa gcaggaatac

601   aatgggaaga tccctcggtt ccgccgcatc cggggcgaga gtgagctgta

651   caccagtgat actgtcatgc agaacccaca gttcatcaaa gccaccatcg

701   tgcaccaaga ccaggcttac gatgacaaga tctactactt cttccgagag

751   gacaatcctg acaagaatcc tgaggctcct ctcaatgtgt cccgtgtggc

801   ccagttgtgc aggggggacc agggtgggga aagttcactg tcagtctcca

851   agtggaacac ttttctgaaa gccatgctgg tatgcagtga tgctgccacc

901   aacaagaact tcaacaggct gcaagacgtc ttcctgctcc ctgaccccag

951   cggccagtgg agggacacca gggtctatgg tgttttctcc aacccctgga

1001  actactcagc cgtctgtgtg tattccctcg gtgacattga caaggtcttc

1051  cgtacctcct cactcaaggg ctaccactca agccttccca acccgcggcc

1101  tggcaagtgc ctcccagacc agcagccgat acccacagag accttccagg

1151  tggctgaccg tcacccagag gtggcgcaga gggtggagcc catggggcct

1201  ctgaagacgc cattgttcca ctctaaatac cactaccaga aagtggccgt

1251  tcaccgcatg caagccagcc acggggagac ctttcatgtg ctttacctaa

1301  ctacagacag gggcactatc cacaaggtgg tggaaccggg ggagcaggag

1351  cacagcttcg ccttcaacat catggagatc cagcccttcc gccgcgcggc

1401  tgccatccag accatgtcgc tggatgctga gcggaggaag ctgtatgtga

1451  gctcccagtg ggaggtgagc caggtgcccc tggacctgtg tgaggtctat

1501  ggcgggggct gccacggttg cctcatgtcc cgagacccct actgcggctg

1551  ggaccagggc cgctgcatct ccatctacag ctccgaacgg tcagtgctgc

1601  aatccattaa tccagccgag ccacacaagg agtgtcccaa ccccaaacca

1651  gacaaggccc cactgcagaa ggtttccctg gccccaaact ctcgctacta

1701  cctgagctgc cccatggaat cccgccacgc cacctactca tggcgccaca

1751  aggagaacgt ggagcagagc tgcgaacctg gtcaccagag ccccaactgc

1801  atcctgttca tcgagaacct cacggcgcag cagtacggcc actacttctg

1851  cgaggcccag gagggctcct acttccgcga ggctcagcac tggcagctgc

1901  tgcccgagga cggcatcatg gccgagcacc tgctgggtca tgcctgtgcc

1951  ctggctgcct ccctctggct gggggtgctg cccacactca ctcttggctt

2001  gctggtccac tagggcctcc cgaggctggg catgcctcag gcttctgcag

2051  cccagggcac tagaacgtct cacactcaga gccggctggc ccgggagctc

2101  cttgcctgcc acttcttcca ggggacagaa taacccagtg gaggatgcca

2151  ggcctggaga cgtccagccg caggcggctg ctgggcccca ggtggcgcac

2201  ggatggtgag gggctgagaa tgagggcacc gactgtgaag ctggggcatc

2251  gatgacccaa gactttatct tctggaaaat atttttcaga ctcctcaaac

2301  ttgactaaat gcagcgatgc tcccagccca agagcccatg ggtcggggag

2351  tgggtttgga taggagagct gggactccat ctcgaccctg gggctgaggc

2401  ctgagtcctt ctggactctt ggtacccaca ttgcctcctt cccctccctc

2451  tctcatggct gggtggctgg tgttcctgaa gacccagggc taccctctgt

2501  ccagccctgt cctctgcagc tccctctctg gtcctgggtc ccacaggaca

2551  gccgccttgc atgtttattg aaggatgttt gctttccgga cggaaggacg

2601  gaaaaagctc tgaaaaaaaa aaaaaaaaaa aaaaaa 表3:M-SemaL的cDNA的核苷酸序列(部分,1195个核苷酸)(SEQ ID NO.:2)

1     cggggctgcg ggatgacgcc tcctcctccc ggacgtgccg cccccagcgc

51    accgcgcgcc cgcgtcctca gcctgccggc tcggttcggg ctcccgctgc

101   ggctgcggct tctgctggtg ttctgggtgg ccgccgcctc cgcccaaggc

151   cactcgagga gcggaccccg catctccgcc gtctggaaag ggcaggacca

201   tgtggacttt agccagcctg agccacacac cgtgcttttc catgagccgg

251   gcagcttctc tgtctgggtg ggtggacgtg gcaaggtcta ccacttcaac

301   ttccccgagg gcaagaatgc ctctgtgcgc acggtgaaca tcggctccac

351   aaaggggtcc tgtcaggaca aacaggactg tgggaattac atcactcttc

401   tagaaaggcg gggtaatggg ctgctggtct gtggcaccaa tgcccggaag

451   cccagctgct ggaacttggt gaatgacagt gtggtgatgt cacttggtga

501   gatgaaaggc tatgccccct tcagcccgga tgagaactcc ctggttctgt

551   ttgaaggaga tgaagtgtac tctaccatcc ggaagcagga atacaacggg

601   aagatccctc ggtttcgacg cattcggggc gagagtgaac tgtacacaag

651   tgatacagtc atgcagaacc cacagttcat caaggccacc attgtgcacc

701   aagaccaagc ctatgatgat aagatctact acttcttccg agaagacaac

751   cctgacaaga accccgaggc tcctctcaat gtgtcccgag tagcccagtt

801   gtgcaggggg gaccagggtg gtgagagttc gttgtctgtc tccaagtgga

851   acaccttcct gaaagccatg ttggtctgca gc gatgcagc caccaacagg

901   aacttcaatc ggctgcaaga tgtcttcctg ctccctgacc ccagtggcca

951   gtggagagat accagggtct atggcgtttt ctccaacccc tggaactact

1001  cagctgtctg cgtgtattcg cttggtgaca ttgacagagt cttccgtacc

1051  tcatcgctca aaggctacca catgggcctt tccaaccctc gacctggcat

1101  gtgcctccca aaaaagcagc ccatacccac agaaaccttc caggtagctg

1151  atagtcaccc agaggtggct cagagggtgg aacctatggg gcccc 表4:H-SemaL的氨基酸序列(666个氨基酸)(SEQ ID NO.:3) 1      MTPPPPGRAA PSAPRARVPG PPARLGLPLR LRLLLLLWAA AASAQGHLRS 51     GPRIFAVWKG HVGQDRVDFG QTEPHTVLFH EPGSSSVWVG GRGKVYLFDF 101    PEGKNASVRT VNIGSTKGSC LDKRDCENYI TLLERRSEGL LACGTNARHP 151    SCWNLVNGTV VPLGEMRGYA PFSPDENSLV LFEGDEVYST IRKQEYNGKI 201    PRFRRIRGES ELYTSDTVMQ NPQFIKATIV HQDQAYDDKI YYFFREDNPD 251    KNPEAPLNVS RVAQLCRGDQ GGESSLSVSK WNTFLKAMLV CSDAATNKNF 301    NRLQDVFLLP DPSGQWRDTR VYGVFSNPWN YSAVCVYSLG DIDKVFRTSS 351    LKGYHSSLPN PRPGKCLPDQ QPIPTETFQV ADRHPEVAQR VEPMGPLKTP 401    LFHSKYHYQK VAVHRMQASH GETFHVLYLT TDRGTIHKVV EPGEQEHSFA 451    FNIMEIQPFR RAAAIQTMSL DAERRKLYVS SQWEVSQVPL DLCEVYGGGC 501    HGCLMSRDPY CGWDQGRCIS IYSSERSVLQ SINPAEPHKE CPNPKPDKAP 551    LQKVSLAPNS RYYLSCPMES RHATYSWRHK ENVEQSCEPG HQSPNCILFI 601    ENLTAQQYGH YFCEAQEGSY FREAQHWQLL PEDGIMAEHL LGHACALAAS 651    LWLGVLPTLTLGLLVH 表5:M-SemaL的(部分)氨基酸序列(394个氨基酸,相应于H-SemaL的1-396 位)(SEQ ID NO.:4)

1      MTPPPPGRAA PSAPRARVLS LPARFGLPLR LRLLLVFWVA AASAQGHSRS

51     GPRISAVWKG QDHVDFSQPE PHTVLFHEPG SFSVWVGGRG KVYHFNFPEG

101    KNASVRTVNI GSTKGSCQDK QDCGNYITLL ERRGNGLLVC GTNARKPSCW

151    NLVNDSVVMS LGEMKGYAPF SPDENSLVLF EGDEVYSTIR KQEYNGKIPR

201    FRRIRGESEL YTSDTVMQNP QFIKATIVHQ DQAYDDKIYY FFREDNPDKN

251    PEAPLNVSRV AQLCRGDQGG ESSLSVSKWN TFLKAMLVCS DAATNRNFNR

301    LQDVFLLPDP SGQWRDTRVY GVFSNPWNYS AVCVYSLGDI DRVFRTSSLK

351    GYHMGLSNPR PGMCLPKKQP IPTETFQVAD SHPEVAQRVE PMGP 表6:合成寡核苷酸(Eurogentec,Seraing,比利时) 引物的编号/名称                          引物(合成寡核苷酸)的核苷酸序列

91506/AP2     actcactatagggctcgagcggc              (SEQ ID NO.:5)

121234        agccgcacacggtgcttttc                 (SEQ ID NO.:6)

121235/Est2   gcacagatgcgttcttgccc                 (SEQ ID NO.:7)

121236/Est3   accatagaccctggtgtccc                 (SEQ ID NO.:8)

121237/Est4   gcagtgatgctgccaccaac                 (SEQ ID NO.:9)

121238        ccagaccatgtcgctggatg                 (SEQ ID NO.:10)

121239/Est6   acatgaggcaaccgtggcag                 (SEQ ID NO.:11)

131989/AP1    ccatcctaatacgactcactatagggc          (SEQ ID NO.:12)

131990/Est7   aggtagaccttgccacgtcc                 (SEQ ID NO.:13)

131991        gaacttcaacaggctgcaagacg              (SEQ ID NO.:14)

131992        atgctgagcggaggaagctg                 (SEQ ID NO.:15)

131993        ccgccatacacctcacacag                 (SEQ ID NO.:16)

150788        ctggaagctttctgtgggtatcggctgc         (SEQ ID NO.:17)

150789        tttggatccctggttctgtttgaag            (SEQ ID NO.:18)

167579/cDNA   ttctagaattcagcggccgcttttttttttttttttttttttttttttttvn 合成引物(SEQ ID NO.:19)

168421        ggggaaagttcactgtcagtctccaag          (SEQ ID NO.:20)

168422        gggaatacacacagacggctgagtag           (SEQ ID NO.:21)

207608/            agcaagttcagcctggttaagt          (SEQ ID NO.:22) λgt10插入物的扩增

207609/             ttatgagtatttcttccaggg          (SEQ ID NO.:23) λgt10插入物的扩增

232643/Est13  ccattaatccagccgagccacacaag           (SEQ ID NO.:24)

232644/Est14  catctacagctccgaacggtcagtg            (SEQ ID NO.:25)

233084        cagcggaagccccaaccgag                 (SEQ ID NO.:26)

240655/hs5    gggatgacgcctcctccgcccgg              (SEQ ID NO.:27)

240656/hs3    aagcttcacgtggaccagcaagccaagagtg      (SEQ ID NO.:28)

240657/hs3c   aagctttttccgtccttccgtccgg            (SEQ ID NO.:29)

243068      atggtgagcaagggcgaggagctg  (SEQ ID NO.:30)

243069      cttgtacagctcgtccatgccgag  (SEQ ID NO.:31)

280812      GGGTGGTGAGAGTTCGTTGTCTGTC (SEQ ID NO.:32)

260813      GAGCGATGAGGTACGGAAGACTCTG (SEQ ID NO.:33) 表7:重组质粒pCR2.1-H-SemaL的核苷酸序列(SEQ ID NO.:34)   1  AGCGCCCAAT ACGCAAACCG CCTCTCCCCG CGCGTTGGCC GATTCATTAA  51  TGCAGCTGGC ACGACAGGTT TCCCGACTGG AAAGCGGGCA GTGAGCGCAA 101  CGCAATTAAT GTGAGTTAGC TCACTCATTA GGCACCCCAG GCTTTACACT 151  TTATGCTTCC GGCTCGTATG TTGTGTGGAA TTGTGAGCGG ATAACAATTT 201  CACACAGGAA ACAGCTATGA CCATGATTAC GCCaagcttc acgtggacca 251  gcaagccaag agtgagtgtg ggcagcaccc ccagccagag ggaggcagcc 301  agggcacagg catgacccag caggtgctcg gccatgatgc cgtcctcggg 351  cagcagctgc cagtgctgag cctcgcggaa gtaggagccc tcctgggcct 401  cgcagaagta gtggccgtac tgctgcgccg tgaggttctc gatgaacagg 451  atgcagttgg ggctctggtg accaggttcg cagctctgct ccacgttctc 501  cttgtggcgc catgagtagg tggcgtggcg ggattccatg gggcagctca 551  ggtagtagcg agagtttggg gccagggaaa ccttctgcag tggggccttg 601  tctggtttgg ggttgggaca ctccttgtgt ggctcggctg gattaatgga 651  ttgcagcact gaccgttcgg agctgtagat ggagatgcag cggccctggt 701  cccagccgca gtaggggtct cgggacatga ggcaaccgtg gcagcccccg 751  ccatagacct cacacaggtc caggggcacc tggctcacct cccactggga 801  gctcacatac agcttcctcc gctcagcatc cagcgacatg gtctggatgg 851  cagccgcgcg gcggaagggc tggatctcca tgatgttgaa ggcgaagctg 901  tgctcctgct cccccggttc caccaccttg tggatagtgc ccctgtctgt 951  agttaggtaa agcacatgaa aggtctcccc gtggctggct tgcatgcggt 1001 gaacggccac tttctggtag tggtatttag agtggaacaa tggcgtcttc 1051 agaggcccca tgggctccac cctctgcgcc acctctgggt gacggtcagc 1101 cacctggaag gtctctgtgg gtatcggctg ctggtctggg aggcacttgc 1151 caggccgcgg gttgggaagg cttgagtggt agcccttgag tgaggaggta 1201 cggaagacct tgtcaatgtc accgagggaa tacacacaga cggctgagta 1251 gttccagggg ttggagaaaa caccatagac cctggtgtcc ctccactggc 1301 cgctggggtc agggagcagg aagacgtctt gcagcctgtt gaagttcttg 1351 ttggtggcag catcactgca taccagcatg gctttcagaa aagtgttcca 1401 cttggagact gacagtgaac tttccccacc ctggtccccc ctgcacaact 1451 gggccacacg ggacacattg agaggagcct caggattctt gtcaggattg 1501 tcctctcgga agaagtagta gatcttgtca tcgtaagcct ggtcttggtg 1551 cacgatggtg gctttgatga actgtgggtt ctgcatgaca gtatcactgg 1601 tgtacagctc actctcgccc cggatgcggc ggaaccgagg gatcttccca 1651 ttgtattcct gcttccggat ggtggaatac acctcgtccc cttcaaacag 1701 aaccagggag ttctcgtccg ggctgaaggg ggcgtagcct ctcatctcgc 1751 caagtggcac cacagtgcca ttcaccaggt tccagcagct ggggtgccgg 1801 gcgttggtgc cacaggccag cagcccctca ctccgcctct ccaggagagt 1851 gatgtagttc tcgcagtccc gcttatccag acaggacccc tttgtggagc 1901 cgatattcac cgtgcgcaca gatgcgttct tgccctcggg gaagtcaaag 1951 aggtagacct tgccacgtcc tcccacccac acagaggagc tgcctggctc 2001 gtggaaaagc accgtgtgcg gctcagtctg gccaaagtcc acccggtcct 2051 gccctacatg gcctttccag acggcgaaga tgcggggtcc gctccttagg 2101 tggccctggg cggaggcggc ggccgcccag agcagcagca gcagccgcag 2151 ccgcagcgga agccccaacc gagccggcgg gccagggacg cgggcgcgcg 2201 gtgcgctggg ggcggcacgt ccgggcggag gaggcgtcat cccaagccga 2251 attcTGCAGA TATCCATCAC ACTGGCGGCC GCTCGAGCAT GCATCTAGAG 2301 GGCCCAATTC GCCCTATAGT GAGTCGTATT ACAATTCACT GGCCGTCGTT 2351 TTACAACGTC GTGACTGGGA AAACCCTGGC GTTACCCAAC TTAATCGCCT 2401 TGCAGCACAT CCCCCTTTCG CCAGCTGGCG TAATAGCGAA GAGGCCCGCA 2451 CCGATCGCCC TTCCCAACAG TTGCGCAGCC TGAATGGCGA ATGGGACGCG 2501 CCCTGTAGCG GCGCATTAAG CGCGGCGGGT GTGGTGGTTA CGCGCAGCGT 2551 GACCGCTACA CTTGCCAGCG CCCTAGCGCC CGCTCCTTTC GCTTTCTTCC 2601 CTTCCTTTCT CGCCACGTTC GCCGGCTTTC CCCGTCAAGC TCTAAATCGG 2651 GGGCTCCCTT TAGGGTTCCG ATTTAGAGCT TTACGGCACC TCGACCGCAA 2701 AAAACTTGAT TTGGGTGATG GTTCACGTAG TGGGCCATCG CCCTGATAGA 2751 CGGTTTTTCG CCCTTTGACG TTGGAGTCCA CGTTCTTTAA TAGTGGACTC 2801 TTGTTCCAAA CTGGAACAAC ACTCAACCCT ATCGCGGTCT ATTCTTTTGA 2851 TTTATAAGGG ATTTTGCCGA TTTCGGCCTA TTGGTTAAAA AATGAGCTGA 2901 TTTAACAAAT TCAGGGCGCA AGGGCTGCTA AAGGAACCGG AACACGTAGA 2951 AAGCCAGTCC GCAGAAACGG TGCTGACCCC GGATGAATGT CAGCTACTGG 3001 GCTATCTGGA CAAGGGAAAA CGCAAGCGCA AAGAGAAAGC AGGTAGCTTG 3051 CAGTGGGCTT ACATGGCGAT AGCTAGACTG GGCGGTTTTA TGGACAGCAA 3101 GCGAACCGGA ATTGCCAGCT GGGGCGCCCT CTGGTAAGGT TGGGAAGCCC 3151 TGCAAAGTAA ACTGGATGGC TTTCTTGCCG CCAAGGATCT GATGGCGCAG 3201 GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATCGTTT CGCATGATTG 3251 AACAAGATGG ATTGCACGCA GGTTCTCCGG CCGCTTGGGT GGAGAGGCTA 3301 TTCGGCTATG ACTGGGCACA ACAGACAATC GGCTGCTCTG ATGCCGCCGT 3351 GTTCCGGCTG TCAGCGCAGG GGCGCCCGGT TCTTTTTGTC AAGACCGACC 3401 TGTCCGGTGC CCTGAATGAA CTGCAGGACG AGGCAGCGCG GCTATCGTGG 3451 CTGGCCACGA CGGGCGTTCC TTGCGCAGCT GTGCTCGACG TTGTCACTGA 3501 AGCGGGAAGG GACTGGCTGC TATTGGGCGA AGTGCCGGGG CAGGATCTCC 3551 TGTCATCTCG CCTTGCTCCT GCCGAGAAAG TATCCATCAT GGCTGATGCA 3601 ATGCGGCGGC TGCATACGCT TGATCCGGCT ACCTGCCCAT TCGACCACCA 3651 AGCGAAACAT CGCATCGAGC GAGCACGTAC TCGGATGGAA GCCGGTCTTG 3701 TCGATCAGGA TGATCTGGAC GAAGAGCATC AGGGGCTCGC GCCAGCCGAA 3751 CTGTTCGCCA GGCTCAAGGC GCGCATGCCC GACGGCGAGG ATCTCGTCGT 3801 GATCCATGGC GATGCCTGCT TGCCGAATAT CATGGTGGAA AATGGCCGCT 3851 TTTCTGGATT CAACGACTGT GGCCGGCTGG GTGTGGCGGA CCGCTATCAG 3901 GACATAGCGT TGGATACCCG TGATATTGCT GAAGAGCTTG GCGGCGAATG 3951 GGCTGACCGC TTCCTCGTGC TTTACGGTAT CGCCGCTCCC GATTCGCAGC 4001 GCATCGCCTT CTATCGCCTT CTTGACGAGT TCTTCTGAAT TGAAAAAGGA 4051 AGAGTATGAG TATTCAACAT TTCCGTGTCG CCCTTATTCC CTTTTTTGCG 4101 GCATTTTGCC TTCCTGTTTT TGCTCACCCA GAAACGCTGG TGAAAGTAAA 4151 AGATGCTGAA GATCAGTTGG GTGCACGAGT GGGTTACATC GAACTGGATC 4201 TCAACAGCGG TAAGATCCTT GAGAGTTTTC GCCCCGAAGA ACGTTTTCCA 4251 ATGATGAGCA CTTTTAAAGT TCTGCTATGT CATACACTAT TATCCCGTAT 4301 TGACGCCGGG CAAGAGCAAC TCGGTCGCCG GGCGCGGTAT TCTCAGAATG 4351 ACTTGGTTGA GTACTCACCA GTCACAGAAA AGCATCTTAC GGATGGCATG 4401 ACAGTAAGAG AATTATGCAG TGCTGCCATA ACCATGAGTG ATAACACTGC 4451 GGCCAACTTA CTTCTGACAA CGATCGGAGG ACCGAAGGAG CTAACCGCTT 4501 TTTTGCACAA CATGGGGGAT CATGTAACTC GCCTTGATCG TTGGGAACCG 4551 GAGCTGAATG AAGCCATACC AAACGACGAG AGTGACACCA CGATGCCTGT 4601 AGCAATGCCA ACAACGTTGC GCAAACTATT AACTGGCGAA CTACTTACTC 4651 TAGCTTCCCG GCAACAATTA ATAGACTGGA TGGAGGCGGA TAAAGTTGCA 4701 GGACCACTTC TGCGCTCGGC CCTTCCGGCT GGCTGGTTTA TTGCTGATAA 4751 ATCTGGAGCC GGTGAGCGTG GGTCTCGCGG TATCATTGCA GCACTGGGGC 4801 CAGATGGTAA GCCCTCCCGT ATCGTAGTTA TCTACACGAC GGGGAGTCAG 4851 GCAACTATGG ATGAACGAAA TAGACAGATC GCTGAGATAG GTGCCTCACT 4901 GATTAAGCAT TGGTAACTGT CAGACCAAGT TTACTCATAT ATACTTTAGA 4951 TTGATTTAAA ACTTCATTTT TAATTTAAAA GGATCTAGGT GAAGATCCTT 5001 TTTGATAATC TCATGACCAA AATCCCTTAA CGTGAGTTTT CGTTCCACTG 5051 AGCGTCAGAC CCCGTAGAAA AGATCAAAGG ATCTTCTTGA GATCCTTTTT 5101 TTCTGCGCGT AATCTGCTGC TTGCAAACAA AAAAACCACC GCTACCAGCG 5151 GTGGTTTGTT TGCCGGATCA AGAGCTACCA ACTCTTTTTC CGAAGGTAAC 5201 TGGCTTCAGC AGAGCGCAGA TACCAAATAC TGTCCTTCTA GTGTAGCCGT 5251 AGTTAGGCCA CCACTTCAAG AACTCTGTAG CACCGCCTAC ATACCTCGCT 5301   CTGCTAATCC TGTTACCAGT GGCTGCTGCC AGTGGCGATA AGTCGTGTCT 5351   TACCGGGTTG GACTCAAGAC GATAGTTACC GGATAAGGCG CAGCGGTCGG 5401   GCTGAACGGG GGGTTCGTGC ACACAGCCCA GCTTGGAGCG AACGACCTAC 5451   ACCGAACTGA GATACCTACA GCGTGAGCAT TGAGAAAGCG CCACGCTTCC 5501   CGAAGGGAGA AAGGCGGACA GGTATCCGGT AAGCGGCAGG GTCGGAACAG 5551   GAGAGCGCAC GAGGGAGCTT CCAGGGGGAA ACGCCTGGTA TCTTTATAGT 5601   CCTGTCGGGT TTCGCCACCT CTGACTTGAG CGTCGATTTT TGTGATGCTC 5651   GTCAGGGGGG CGGAGCCTAT GGAAAAACGC CAGCAACGCG GCCTTTTTAC 5701   GGTTCCTGGC CTTTTGCTGG CCTTTTGCTC ACATGTTCTT TCCTGCGTTA 5751   TCCCCTGATT CTGTGGATAA CCGTATTACC GCCTTTGAGT GAGCTGATAC 5801   CGCTCGCCGC AGCCGAACGA CCGAGCGCAG CGAGTCAGTG AGCGAGGAAG 5851   CGGAAG 表8:重组表达质粒pCDNA3.1(-)H-SemaL-MycHisA的核苷酸序列(SED ID NO.:35)

  1  GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC

 51  TGCTCTGATG CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT

101  GGAGGTCGCT GAGTAGTGCG CGAGCAAAAT TTAAGCTACA ACAAGGCAAG

151  GCTTGACCGA CAATTGCATG AAGAATCTGC TTAGGGTTAG GCGTTTTGCG

201  CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT GATTATTGAC

251  TAGTTATTAA TAGTAATCAA TTACGGGGTC ATTAGTTCAT AGCCCATATA

301  TGGAGTTCCG CGTTACATAA CTTACGGTAA ATGGCCCGCC TGGCTGACCG

351  CCCAACGACC CCCGCCCATT GACGTCAATA ATGACGTATG TTCCCATAGT

401  AACGCCAATA GGGACTTTCC ATTGACGTCA ATGGGTGGAC TATTTACGGT

451  AAACTGCCCA CTTGGCAGTA CATCAAGTGT ATCATATGCC AAGTACGCCC

501  CCTATTGACG TCAATGACGG TAAATGGCCC GCCTGGCATT ATGCCCAGTA

551  CATGACCTTA TGGGACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA

601  TCGCTATTAC CATGGTGATG CGGTTTTGGC AGTACATCAA TGGGCGTGGA

651  TAGCGGTTTG ACTCACGGGG ATTTCCAAGT CTCCACCCCA TTGACGTCAA

701  TGGGAGTTTG TTTTGGCACC AAAATCAACG GGACTTTCCA AAATGTCGTA

751  ACAACTCCGC CCCATTGACG CAAATGGGCG GTAGGCGTGT ACGGTGGGAG

801  GTCTATATAA GCAGAGCTCT CTGGCTAACT AGAGAACCCA CTGCTTACTG

851  GCTTATCGAA ATTAATACGA CTCACTATAG GGAGACCCAA GCTGGCTAGC

901  GTTTAAACGG GCCCTCTAGA CTCGAGCGGC CGCCACTGTG CTGGATATCT

951  GCAgaattcg gcttgggatg acgcctcctc cgcccggacg tgccgccccc

1001 agcgcaccgc gcgcccgcgt ccctggcccg ccggctcggt tggggcttcc 1051 gctgcggctg cggctgctgc tgctgctctg ggcggccgcc gcctccgccc 1101 agggccacct aaggagcgga ccccgcatct tcgccgtctg gaaaggccat 115t gtagggcagg accgggtgga ctttggccag actgagccgc acacggtgct 1201 tttccacgag ccaggcagct cctctgtgtg ggtgggagga cgtggcaagg 1251 tctacctctt tgacttcccc gagggcaaga acgcatctgt gcgcacggtg 1301 aatatcggct ccacaaaggg gtcctgtctg gataagcggg actgcgagaa 1351 ctacatcact ctcctggaga ggcggagtga ggggctgctg gcctgtggca 1401 ccaacgcccg gcaccccagc tgctggaacc tggtgaatgg cactgtggtg 1451 ccacttggcg agatgagagg ctacgccccc ttcagcccgg acgagaactc 1501 cctggttctg tttgaagggg acgaggtgta ttccaccatc cggaagcagg 1551 aatacaatgg gaagatccct cggttccgcc gcatccgggg cgagagtgag 1601 ctgtacacca gtgatactgt catgcagaac ccacagttca tcaaagccac 1651 catcgtgcac caagaccagg cttacgatga caagatctac tacttcttcc 1701 gagaggacaa tcctgacaag aatcctgagg ctcctctcaa tgtgtcccgt 1751 gtggcccagt tgtgcagggg ggaccagggt ggggaaagtt cactgtcagt 1801 ctccaagtgg aacacttttc tgaaagccat gctggtatgc agtgatgctg 1851 ccaccaacaa gaacttcaac aggctgcaag acgtcttcct gctccctgac 1901 cccagcggcc agtggaggga caccagggtc tatggtgttt tctccaaccc 1951 ctggaactac tcagccgtct gtgtgtattc cctcggtgac attgacaagg 2001 tcttccgtac ctcctcactc aagggctacc actcaagcct tcccaacccg 2051 cggcctggca agtgcctccc agaccagcag ccgataccca cagagacctt 2101 ccaggtggct gaccgtcacc cagaggtggc gcagagggtg gagcccatgg 2151 ggcctctgaa gacgccattg ttccactcta aataccacta ccagaaagtg 2201 gccgttcacc gcatgcaagc cagccacggg gagacctttc atgtgcttta 2251 cctaactaca gacaggggca ctatccacaa ggtggtggaa ccgggggagc 2301 aggagcacag cttcgccttc aacatcatgg agatccagcc cttccgccgc 2351 gcggctgcca tccagaccat gtcgctggat gctgagcgga ggaagctgta 2401 tgtgagctcc cagtgggagg tgagccaggt gcccctggac ctgtgtgagg 2451 tctatggcgg gggctgccac ggttgcctca tgtcccgaga cccctactgc 2501 ggctgggacc agggccgctg catctccatc tacagctccg aacggtcagt 2551 gctgcaatcc attaatccag ccgagccaca caaggagtgt cccaacccca 2601 aaccagacaa ggccccactg cagaaggttt ccctggcccc aaactctcgc 2651 tactacctga gctgccccat ggaatcccgc cacgccacct actcatggcg 2701 ccacaaggag aacgtggagc agagctgcga acctggtcac cagagcccca 2751 actgcatcct gttcatcgag aacctcacgg cgcagcagta cggccactac 2801 ttctgcgagg cccaggaggg ctcctacttc cgcgaggctc agcactggca 2851 gctgctgccc gaggacggca tcatggccga gcacctgctg ggtcatgcct 2901 gtgccctggc tgcctccctc tggctggggg tgctgcccac actcactctt 2951 ggcttgctgg tccacgtgaa gcttGGGCCC GAACAAAAAC TCATCTCAGA 3001 AGAGGATCTG AATAGCGCCG TCGACCATCA TCATCATCAT CATTGAGTTT 3051 AAACCGCTGA TCAGCCTCGA CTGTGCCTTC TAGTTGCCAG CCATCTGTTG 3101 TTTGCCCCTC CCCCGTGCCT TCCTTGACCC TGGAAGGTGC CACTCCCACT 3151 GTCCTTTCCT AATAAAATGA GGAAATTGCA TCGCATTGTC TGAGTAGGTG 3201 TCATTCTATT CTGGGGGGTG GGGTGGGGCA GGACAGCAAG GGGGAGGATT 3251 GGGAAGACAA TAGCAGGCAT GCTGGGGATG CGGTGGGCTC TATGGCTTCT 3301 GAGGCGGAAA GAACCAGCTG GGGCTCTAGG GGGTATCCCC ACGCGCCCTG 3351 TAGCGGCGCA TTAAGCGCGG CGGGTGTGGT GGTTACGCGC AGCGTGACCG 3401 CTACACTTGC CAGCGCCCTA GCGCCCGCTC CTTTCGCTTT CTTCCCTTCC 3451 TTTCTCGCCA CGTTCGCCGG CTTTCCCCGT CAAGCTCTAA ATCGGGGCAT 3501 CCCTTTAGGG TTCCGATTTA GTGCTTTACG GCACCTCGAC CCCAAAAAAC 3551 TTGATTAGGG TGATGGTTCA CGTAGTGGGC CATCGCCCTG ATAGACGGTT 3601 TTTCGCCCTT TGACGTTGGA GTCCACGTTC TTTAATAGTG GACTCTTGTT 3651 CCAAACTGGA ACAACACTCA ACCCTATCTC GGTCTATTCT TTTGATTTAT 3701 AAGGGATTTT GGGGATTTCG GCCTATTGGT TAAAAAATGA GCTGATTTAA 3751 CAAAAATTTA ACGCGAATTA ATTCTGTGGA ATGTGTGTCA GTTAGGGTGT 3801 GGAAAGTCCC CAGGCTCCCC AGGCAGGCAG AAGTATGCAA AGCATGCATC 3851 TCAATTAGTC AGCAACCAGG TGTGGAAAGT CCCCAGGCTC CCCAGCAGGC 3901 AGAAGTATGC AAAGCATGCA TCTCAATTAG TCAGCAACCA TAGTCCCGCC 3951 CCTAACTCCG CCCATCCCGC CCCTAACTCC GCCCAGTTCC GCCCATTCTC 4001 CGCCCCATGG CTGACTAATT TTTTTTATTT ATGCAGAGGC CGAGGCCGCC 4051 TCTGCCTCTG AGCTATTCCA GAAGTAGTGA GGAGGCTTTT TTGGAGGCCT 4101 AGGCTTTTGC AAAAAGCTCC CGGGAGCTTG TATATCCATT TTCGGATCTG 4151 ATCAAGAGAC AGGATGAGGA TCGTTTCGCA TGATTGAACA AGATGGATTG 4201 CACGCAGGTT CTCCGGCCGC TTGGGTGGAG AGGCTATTCG GCTATGACTG 4251 GGCACAACAG ACAATCGGCT GCTCTGATGC CGCCGTGTTC CGGCTGTCAG 4301 CGCAGGGGCG CCCGGTTCTT TTTGTCAAGA CCGACCTGTC CGGTGCCCTG 4351 AATGAACTGC AGGACGAGGC AGCGCGGCTA TCGTGGCTGG CCACGACGGG 4401 CGTTCCTTGC GCAGCTGTGC TCGACGTTGT CACTGAAGCG GGAAGGGACT 4451 GGCTGCTATT GGGCGAAGTG CCGGGGCAGG ATCTCCTGTC ATCTCACCTT 4501 GCTCCTGCCG AGAAAGTATC CATCATGGCT GATGCAATGC GGCGGCTGCA 4551 TACGCTTGAT CCGGCTACCT GCCCATTCGA CCACCAAGCG AAACATCGCA 4601 TCGAGCGAGC ACGTACTCGG ATGGAAGCCG GTCTTGTCGA TCAGGATGAT 4651 CTGGACGAAG AGCATCAGGG GCTCGCGCCA GCCGAACTGT TCGCCAGGCT 4701 CAAGGCGCGC ATGCCCGACG GCGAGGATCT CGTCGTGACC CATGGCGATG 4751 CCTGCTTGCC GAATATCATG GTGGAAAATG GCCGCTTTTC TGGATTCATC 4801 GACTGTGGCC GGCTGGGTGT GGCGGACCGC TATCAGGACA TAGCGTTGGC 4851   TACCCGTGAT ATTGCTGAAG AGCTTGGCGG CGAATGGGCT GACCGCTTCC 4901   TCGTGCTTTA CGGTATCGCC GCTCCCGATT CGCAGCGCAT CGCCTTCTAT 4951   CGCCTTCTTG ACGAGTTCTT CTGAGCGGGA CTCTGGGGTT CGAAATGACC 5001   GACCAAGCGA CGCCCAACCT GCCATCACGA GATTTCGATT CCACCGCCGC 5051   CTTCTATGAA AGGTTGGGCT TCGGAATCGT TTTCCGGGAC GCCGGCTGGA 5101   TGATCCTCCA GCGCGGGGAT CTCATGCTGG AGTTCTTCGC CCACCCCAAC 5151   TTGTTTATTG CAGCTTATAA TGGTTACAAA TAAAGCAATA GCATCACAAA 5201   TTTCACAAAT AAAGCATTTT TTTCACTGCA TTCTAGTTGT GGTTTGTCCA 5251   AACTCATCAA TGTATCTTAT CATGTCTGTA TACCGTCGAC CTCTAGCTAG 5301   AGCTTGGCGT AATCATGGTC ATAGCTGTTT CCTGTGTGAA ATTGTTATCC 5351   GCTCACAATT CCACACAACA TACGAGCCGG AAGCATAAAG TGTAAAGCCT 5401   GGGGTGCCTA ATGAGTGAGC TAACTCACAT TAATTGCGTT GCGCTCACTG 5451   CCCGCTTTCC AGTCGGGAAA CCTGTCGTGC CAGCTGCATT AATGAATCGG 5501   CCAACGCGCG GGGAGAGGCG GTTTGCGTAT TGGGCGCTCT TCCGCTTCCT 5551   CGCTCACTGA CTCGCTGCGC TCGGTCGTTC GGCTGCGGCG AGCGGTATCA 5601   GCTCACTCAA AGGCGGTAAT ACGGTTATCC ACAGAATCAG GGGATAACGC 5651   AGGAAAGAAC ATGTGAGCAA AAGGCCAGCA AAAGGCCAGG AACCGTAAAA 5701   AGGCCGCGTT GCTGGCGTTT TTCCATAGGC TCCGCCCCCC TGACGAGCAT 5751   CACAAAAATC GACGCTCAAG TCAGAGGTGG CGAAACCCGA CAGGACTATA 5801   AAGATACCAG GCGTTTCCCC CTGGAAGCTC CCTCGTGCGC TCTCCTGTTC 5851   CGACCCTGCC GCTTACCGGA TACCTGTCCG CCTTTCTCCC TTCGGGAAGC 5901   GTGGCGCTTT CTCAATGCTC ACGCTGTAGG TATCTCAGTT CGGTGTAGGT 5951   CGTTCGCTCC AAGCTGGGCT GTGTGCACGA ACCCCCCGTT CAGCCCGACC 6001   GCTGCGCCTT ATCCGGTAAC TATCGTCTTG AGTCCAACCC GGTAAGACAC 6051   GACTTATCGC CACTGGCAGC AGCCACTGGT AACAGGATTA GCAGAGCGAG 6101   GTATGTAGGC GGTGCTACAG AGTTCTTGAA GTGGTGGCCT AACTACGGCT 6151   ACACTAGAAG GACAGTATTT GGTATCTGCG CTCTGCTGAA GCCAGTTAcc 6201   TTCGGAAAAA GAGTTGGTAG CTCTTGATCC GGCAAACAAA CCACCGCTGG 6251   TAGCGGTGGT TTTTTTGTTT GCAAGCAGCA GATTACGCGC AGAAAAAAAG 6301   GATCTCAAGA AGATCCTTTG ATCTTTTCTA CGGGGTCTGA CGCTCAGTGG 6351   AACGAAAACT CACGTTAAGG GATTTTGGTC ATGAGATTAT CAAAAAGGAT 6401   CTTCACCTAG ATCCTTTTAA ATTAAAAATG AAGTTTTAAA TCAATCTAAA 6451   GTATATATGA GTAAACTTGG TCTGACAGTT ACCAATGCTT AATCAGTGAG 6501   GCACCTATCT CAGCGATCTG TCTATTTCGT TCATCCATAG TTGCCTGACT 6551   CCCCGTCGTG TAGATAACTA CGATACGGGA GGGCTTACCA TCTGGCCCCA 6601   GTGCTGCAAT GATACCGCGA GACCCACGCT CACCGGCTCC AGATTTATCA 6651   GCAATAAACC AGCCAGCCGG AAGGGCCGAG CGCAGAAGTG GTCCTGCAAC 6701   TTTATCCGCC TCCATCCAGT CTATTAATTG TTGCCGGGAA GCTAGAGTAA

6751   GTAGTTCGCC AGTTAATAGT TTGCGCAACG TTGTTGCCAT TGCTACAGGC

6801   ATCGTGGTGT CACGCTCGTC GTTTGGTATG GCTTCATTCA GCTCCGGTTC

6851   CCAACGATCA AGGCGAGTTA CATGATCCCC CATGTTGTGC AAAAAAGCGG

6901   TTAGCTCCTT CGGTCCTCCG ATCGTTGTCA GAAGTAAGTT GGCCGCAGTG

6951   TTATCACTCA TGGTTATGGC AGCACTGCAT AATTCTCTTA CTGTCATGCC

7001   ATCCGTAAGA TGCTTTTCTG TGACTGGTGA GTACTCAACC AAGTCATTCT

7051   GAGAATAGTG TATGCGGCGA CCGAGTTGCT CTTGCCCGGC GTCAATACGG

7101   GATAATACCG CGCCACATAG CAGAACTTTA AAAGTGCTCA TCATTGGAAA

7151   ACGTTCTTCG GGGCGAAAAC TCTCAAGGAT CTTACCGCTG TTGAGATCCA

7201   GTTCGATGTA ACCCACTCGT GCACCCAACT GATCTTCAGC ATCTTTTACT

7251   TTCACCAGCG TTTCTGGGTG AGCAAAAACA GGAAGGCAAA ATGCCGCAAA

7301   AAAGGGAATA AGGGCGACAC GGAAATGTTG AATACTCATA CTCTTCCTTT

7351   TTCAATATTA TTGAAGCATT TATCAGGGTT ATTGTCTCAT GAGCGGATAC

7401   ATATTTGAAT GTATTTAGAA AAATAAACAA ATAGGGGTTC CGCGCACATT

7451   TCCCCGAAAA GTGCCACCTG ACGTC 表9:重组质粒pcDA3.1-SemaL-EGFP-MychisA的核苷酸序列(SEQ ID NO.:36)

  1   GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC

 51   TGCTCTGATG CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT

101   GGAGGTCGCT GAGTAGTGCG CGAGCAAAAT TTAAGCTACA ACAAGGCAAG

151   GCTTGACCGA CAATTGCATG AAGAATCTGC TTAGGGTTAG GCGTTTTGCG

201   CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT GATTATTGAC

251   TAGTTATTAA TAGTAATCAA TTACGGGGTC ATTAGTTCAT AGCCCATATA

301   TGGAGTTCCG CGTTACATAA CTTACGGTAA ATGGCCCGCC TGGCTGACCG

351   CCCAACGACC CCCGCCCATT GACGTCAATA ATGACGTATG TTCCCATAGT

401   AACGCCAATA GGGACTTTCC ATTGACGTCA ATGGGTGGAC TATTTACGGT

451   AAACTGCCCA CTTGGCAGTA CATCAAGTGT ATCATATGCC AAGTACGCCC

501   CCTATTGACG TCAATGACGG TAAATGGCCC GCCTGGCATT ATGCCCAGTA

551   CATGACCTTA TGGGACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA

601   TCGCTATTAC CATGGTGATG CGGTTTTGGC AGTACATCAA TGGGCGTGGA

651   TAGCGGTTTG ACTCACGGGG ATTTCCAAGT CTCCACCCCA TTGACGTCAA

701   TGGGAGTTTG TTTTGGCACC AAAATCAACG GGACTTTCCA AAATGTCGTA

751   ACAACTCCGC CCCATTGACG CAAATGGGCG GTAGGCGTGT ACGGTGGGAG

801   GTCTATATAA GCAGAGCTCT CTGGCTAACT AGAGAACCCA CTGCTTACTG

851   GCTTATCGAA ATTAATACGA CTCACTATAG GGAGACCCAA GCTGGCTAGC

901   GTTTAAACGG GCCCTCTAGA CTCGAGCGGC CGCCACTGTG CTGGATATCT  951 GCAgaattcg gcttgggatg acgcctcctc cgcccggacg tgccgccccc 1001 agcgcaccgc gcgcccgcgt ccctggcccg ccggctcggt tggggcttcc 1051 gctgcggctg cggctgctgc tgctgctctg ggcggccgcc gcctccgccc 1101 agggccacct aaggagcgga ccccgcatct tcgccgtctg gaaaggccat 1151 gtagggcagg accgggtgga ctttggccag actgagccgc acacggtgct 1201 tttccacgag ccaggcagct cctctgtgtg ggtgggagga cgtggcaagg 1251 tctacctctt tgacttcccc gagggcaaga acgcatctgt gcgcacggtg 1301 aatatcggct ccacaaaggg gtcctgtctg gataagcggg actgcgagaa 1351 ctacatcact ctcctggaga ggcggagtga ggggctgctg gcctgtggca 1401 ccaacgcccg gcaccccagc tgctggaacc tggtgaatgg cactgtggtg 1451 ccacttggcg agatgagagg ctacgccccc ttcagcccgg acgagaactc 1501 cctggttctg tttgaagggg acgaggtgta ttccaccatc cggaagcagg 1551 aatacaatgg gaagatccct cggttccgcc gcatccgggg cgagagtgag 1601 ctgtacacca gtgatactgt catgcagaac ccacagttca tcaaagccac 1651 catcgtgcac caagaccagg cttacgatga caagatctac tacttcttcc 1701 gagaggacaa tcctgacaag aatcctgagg ctcctctcaa tgtgtcccgt 1751 gtggcccagt tgtgcagggg ggaccagggt ggggaaagtt cactgtcagt 1801 ctccaagtgg aacacttttc tgaaagccat gctggtatgc agtgatgctg 1851 ccaccaacaa gaacttcaac aggctgcaag acgtcttcct gctccctgac 1901 cccagcggcc agtggaggga caccagggtc tatggtgttt tctccaaccc 1951 ctggaactac tcagccgtct gtgtgtattc cctcggtgac attgacaagg 2001 tcttccgtac ctcctcactc aagggctacc actcaagcct tcccaacccg 2051 cggcctggca agtgcctccc agaccagcag ccgataccca cagagacctt 2101 ccaggtggct gaccgtcacc cagaggtggc gcagagggtg gagcccatgg 2151 ggcctctgaa gacgccattg ttccactcta aataccacta ccagaaagtg 2201 gccgttcacc gcatgcaagc cagccacggg gagacctttc atgtgcttta 2251 cctaactaca gacaggggca ctatccacaa ggtggtggaa ccgggggagc 2301 aggagcacag cttcgccttc aacatcatgg agatccagcc cttccgccgc 2351 gcggctgcca tccagaccat gtcgctggat gctgagcgga ggaagctgta 2401 tgtgagctcc cagtgggagg tgagccaggt gcccctggac ctgtgtgagg 2451 tctatggcgg gggctgccac ggttgcctca tgtcccgaga cccctactgc 2501 ggctgggacc agggccgctg catctccatc tacagctccg aacggtcagt 2551 gctgcaatcc attaatccag ccgagccaca caaggagtgt cccaacccca 2601 aaccagacaa ggccccactg cagaaggttt ccctggcccc aaactctcgc 2651 tactacctga gctgccccat ggaatcccgc cacgccacct actcatggcg 2701 ccacaaggag aacgtggagc agagctgcga acctggtcac cagagcccca 2751 actgcatcct gttcatcgag aacctcacgg cgcagcagta cggccactac 2801 ttctgcgagg cccaggaggg ctcctacttc cgcgaggctc agcactggca 2851 gctgctgccc gaggacggca tcatggccga gcacctgctg ggtcatgcct 2901 gtgccctggc tgcctccctc tggctggggg tgctgcccac actcactctt 2951 ggcttgctgg tccacATGGT GAGCAAGGGC GAGGAGCTGT TCACCGGGGT 3001 GGTGCCCATC CTGGTCGAGC TGGACGGCGA CGTAAACGGC CACAAGTTCA 3051 GCGTGTCCGG CGAGGGCGAG GGCGATGCCA CCTACGGCAA GCTGACCCTG 3101 AAGTTCATCT GCACCACCGG CAAGCTGCCC GTGCCCTGGC CCACCCTCGT 3151 GACCACCCTG ACCTACGGCG TGCAGTGCTT CAGCCGCTAC CCCGACCACA 3201 TGAAGCAGCA CGACTTCTTC AAGTCCGCCA TGCCCGAAGG CTACGTCCAG 3251 GAGCGCACCA TCTTCTTCAA GGACGACGGC AACTACAAGA CCCGCGCCGA 3301 GGTGAAGTTC GAGGGCGACA CCCTGGTGAA CCGCATCGAG CTGAAGGGCA 3351 TCGACTTCAA GGAGGACGGC AACATCCTGG GGCACAAGCT GGAGTACAAC 3401 TACAACAGCC ACAACGTCTA TATCATGGCC GACAAGCAGA AGAACGGCAT 3451 CAAGGTGAAC TTCAAGATCC GCCACAACAT CGAGGACGGC AGCGTGCAGC 3501 TCGCCGACCA CTACCAGCAG AACACCCCCA TCGGCGACGG CCCCGTGCTG 3551 CTGCCCGACA ACCACTACCT GAGCACCCAG TCCGCCCTGA GCAAAGACCC 3601 CAACGAGAAG CGCGATCACA TGGTCCTGCT GGAGTTCGTG ACCGCCGCCG 3651 GGATCACTCT CGGCATGGAC GAGCTGTACA Aggtgaagct tGGGCCCGAA 3701 CAAAAACTCA TCTCAGAAGA GGATCTGAAT AGCGCCGTCG ACCATCATCA 3751 TCATCATCAT TGAGTTTAAA CCGCTGATCA GCCTCGACTG TGCCTTCTAG 3801 TTGCCAGCCA TCTGTTGTTT GCCCCTCCCC CGTGCCTTCC TTGACCCTGG 3851 AAGGTGCCAC TCCCACTGTC CTTTCCTAAT AAAATGAGGA AATTGCATCG 3901 CATTGTCTGA GTAGGTGTCA TTCTATTCTG GGGGGTGGGG TGGGGCAGGA 3951 CAGCAAGGGG GAGGATTGGG AAGACAATAG CAGGCATGCT GGGGATGCGG 4001 TGGGCTCTAT GGCTTCTGAG GCGGAAAGAA CCAGCTGGGG CTCTAGGGGG 4051 TATCCCCACG CGCCCTGTAG CGGCGCATTA AGCGCGGCGG GTGTGGTGGT 4101 TACGCGCAGC GTGACCGCTA CACTTGCCAG CGCCCTAGCG CCCGCTCCTT 4151 TCGCTTTCTT CCCTTCCTTT CTCGCCACGT TCGCCGGCTT TCCCCGTCAA 4201 GCTCTAAATC GGGGCATCCC TTTAGGGTTC CGATTTAGTG CTTTACGGCA 4251 CCTCGACCCC AAAAAACTTG ATTAGGGTGA TGGTTCACGT AGTGGGCCAT 4301 CGCCCTGATA GACGGTTTTT CGCCCTTTGA CGTTGGAGTC CACGTTCTTT 4351 AATAGTGGAC TCTTGTTCCA AACTGGAACA ACACTCAACC CTATCTCGGT 4401 CTATTCTTTT GATTTATAAG GGATTTTGGG GATTTCGGCC TATTGGTTAA 4451 AAAATGAGCT GATTTAACAA AAATTTAACG CGAATTAATT CTGTGGAATG 4501 TGTGTCAGTT AGGGTGTGGA AAGTCCCCAG GCTCCCCAGG CAGGCAGAAG 4551 TATGCAAAGC ATGCATCTCA ATTAGTCAGC AACCAGGTGT GGAAAGTCCC 4601 CAGGCTCCCC AGCAGGCAGA AGTATGCAAA GCATGCATCT CAATTAGTCA 4651 GCAACCATAG TCCCGCCCCT AACTCCGCCC ATCCCGCCCC TAACTCCGCC 4701 CAGTTCCGCC CATTCTCCGC CCCATGGCTG ACTAATTTTT TTTATTTATG 4751   CAGAGGCCGA GGCCGCCTCT GCCTCTGAGC TATTCCAGAA GTAGTGAGGA 4801   GGCTTTTTTG GAGGCCTAGG CTTTTGCAAA AAGCTCCCGG GAGCTTGTAT 4851   ATCCATTTTC GGATCTGATC AAGAGACAGG ATGAGGATCG TTTCGCATGA 4901   TTGAACAAGA TGGATTGCAC GCAGGTTCTC CGGCCGCTTG GGTGGAGAGG 4951   CTATTCGGCT ATGACTGGGC ACAACAGACA ATCGGCTGCT CTGATGCCGC 5001   CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT GTCAAGACCG 5051   ACCTGTCCGG TGCCCTGAAT GAACTGCAGG ACGAGGCAGC GCGGCTATCG 5101   TGGCTGGCCA CGACGGGCGT TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC 5151   TGAAGCGGGA AGGGACTGGC TGCTATTGGG CGAAGTGCCG GGGCAGGATC 5201   TCCTGTCATC TCACCTTGCT CCTGCCGAGA AAGTATCCAT CATGGCTGAT 5251   GCAATGCGGC GGCTGCATAC GCTTGATCCG GCTACCTGCC CATTCGACCA 5301   CCAAGCGAAA CATCGCATCG AGCGAGCACG TACTCGGATG GAAGCCGGTC 5351   TTGTCGATCA GGATGATCTG GACGAAGAGC ATCAGGGGCT CGCGCCAGCC 5401   GAACTGTTCG CCAGGCTCAA GGCGCGCATG CCCGACGGCG AGGATCTCGT 5451   CGTGACCCAT GGCGATGCCT GCTTGCCGAA TATCATGGTG GAAAATGGCC 5501   GCTTTTCTGG ATTCATCGAC TGTGGCCGGC TGGGTGTGGC GGACCGCTAT 5551   CAGGACATAG CGTTGGCTAC CCGTGATATT GCTGAAGAGC TTGGCGGCGA 5601   ATGGGCTGAC CGCTTCCTCG TGCTTTACGG TATCGCCGCT CCCGATTCGC 5651   AGCGCATCGC CTTCTATCGC CTTCTTGACG AGTTCTTCTG AGCGGGACTC 5701   TGGGGTTCGA AATGACCGAC CAAGCGACGC CCAACCTGCC ATCACGAGAT 5751   TTCGATTCCA CCGCCGCCTT CTATGAAAGG TTGGGCTTCG GAATCGTTTT 5801   CCGGGACGCC GGCTGGATGA TCCTCCAGCG CGGGGATCTC ATGCTGGAGT 5851   TCTTCGCCCA CCCCAACTTG TTTATTGCAG CTTATAATGG TTACAAATAA 5901   AGCAATAGCA TCACAAATTT CACAAATAAA GCATTTTTTT CACTGCATTC 5951   TAGTTGTGGT TTGTCCAAAC TCATCAATGT ATCTTATCAT GTCTGTATAC 6001   CGTCGACCTC TAGCTAGAGC TTGGCGTAAT CATGGTCATA GCTGTTTCCT 6051   GTGTGAAATT GTTATCCGCT CACAATTCCA CACAACATAC GAGCCGGAAG 6101   CATAAAGTGT AAAGCCTGGG GTGCCTAATG AGTGAGCTAA CTCACATTAA 6151   TTGCGTTGCG CTCACTGCCC GCTTTCCAGT CGGGAAACCT GTCGTGCCAG 6201   CTGCATTAAT GAATCGGCCA ACGCGCGGGG AGAGGCGGTT TGCGTATTGG 6251   GCGCTCTTCC GCTTCCTCGC TCACTGACTC GCTGCGCTCG GTCGTTCGGC 6301   TGCGGCGAGC GGTATCAGCT CACTCAAAGG CGGTAATACG GTTATCCACA 6351   GAATCAGGGG ATAACGCAGG AAAGAACATG TGAGCAAAAG GCCAGCAAAA 6401   GGCCAGGAAC CGTAAAAAGG CCGCGTTGCT GGCGTTTTTC CATAGGCTCC 6451   GCCCCCCTGA CGAGCATCAC AAAAATCGAC GCTCAAGTCA GAGGTGGCGA 6501   AACCCGACAG GACTATAAAG ATACCAGGCG TGTCCCCCTG GAAGCTCCCT 6551   CGTGCGCTCT CCTGTTCCGA CCCTGCCGCT TACCGGATAC CTGTCCGCCT 6601   TTCTCCCTTC GGGAAGCGTG GCGCTTTCTC AATGCTCACG CTGTAGGTAT 6651   CTCAGTTCGG TGTAGGTCGT TCGCTCCAAG CTGGGCTGTG TGCACGAACC 6701   CCCCGTTCAG CCCGACCGCG GCGCCTTATC CGGTAACTAT CGTCTTGAGT 6751   CCAACCCGGT AAGACACGAC TTATCGCCAC TGGCAGCAGC CACTGGTAAC 6801   AGGATTAGCA GAGCGAGGTA TGTAGGCGGT GCTACAGAGT TCTTGAAGTG 6851   GTGGCCTAAC TACGGCTACA CTAGAAGGAC AGTATTTGGT ATCTGCGCTC 6901   TGCTGAAGCC AGTTACCTTC GGAAAAAGAG TTGGTAGCTC TTGATCCGGC 6951   AAACAAACCA CCGCTGGTAG CGGTGGTTTT TTTGTTTGCA AGCAGCAGAT 7001   TACGCGCAGA AAAAAAGGAT CTCAAGAAGA TCCTTTGATC TTTTCTACGG 7051   GGTCTGACGC TCAGTGGAAC GAAAACTCAC GTTAAGGGAT TTTGGTCATG 7101   AGATTATCAA AAAGGATCTT CACCTAGATC CTTTTAAATT AAAAATGAAG 7151   TTTTAAATCA ATCTAAAGTA TATATGAGTA AACTTGGTCT GACAGTTACC 7201   AATGCTTAAT CAGTGAGGCA CCTATCTCAG CGATCTGTCT ATTTCGTTCA 7251   TCCATAGTTG CCTGACTCCC CGTCGTGTAG ATAACTACGA TACGGGAGGG 7301   CTTACCATCT GGCCCCAGTG CTGCAATGAT ACCGCGAGAC CCACGCTCAC 7351   CGGCTCCAGA TTTATCAGCA ATAAACCAGC CAGCCGGAAG GGCCGAGCGC 7401   AGAAGTGGTC CTGCAACTTT ATCCGCCTCC ATCCAGTCTA TTAATTGTTG 7451   CCGGGAAGCT AGAGTAAGTA GTTCGCCAGT TAATAGTTTG CGCAACGTTG 7501   TTGCCATTGC TACAGGCATC GTGGTGTCAC GCTCGTCGTT TGGTATGGCT 7551   TCATTCAGCT CCGGTTCCCA ACGATCAAGG CGAGTTACAT GATCCCCCAT 7601   GTTGTGCAAA AAAGCGGTTA GCTCCTTCGG TCCTCCGATC GTTGTCAGAA 7651   GTAAGTTGGC CGCAGTGTTA TCACTCATGG TTATGGCAGC ACTGCATAAT 7701   TCTCTTACTG TCATGCCATC CGTAAGATGC TTTTCTGTGA CTGGTGAGTA 7751   CTCAACCAAG TCATTCTGAG AATAGTGTAT GCGGCGACCG AGTTGCTCTT 7801   GCCCGGCGTC AATACGGGAT AATACCGCGC CACATAGCAG AACTTTAAAA 7851   GTGCTCATCA TTGGAAAACG TTCTTCGGGG CGAAAACTCT CAAGGATCTT 7901   ACCGCTGTTG AGATCCAGTT CGATGTAACC CACTCGTGCA CCCAACTGAT 7951   CTTCAGCATC TTTTACTTTC ACCAGCGTTT CTGGGTGAGC AAAAACAGGA 8001   AGGCAAAATG CCGCAAAAAA GGGAATAAGG GCGACACGGA AATGTTGAAT 8051   ACTCATACTC TTCCTTTTTC AATATTATTG AAGCATTTAT CAGGGTTATT 8101   GTCTCATGAG CGGATACATA TTTGAATGTA TTTAGAAAAA TAAACAAATA 8151   GGGGTTCCGC GCACATTTCC CCGAAAAGTG CCACCTGACG TC 表10:重组质粒pIND-H-SemaL-EE的核苷酸序列(SEQ ID NO.:37)   1  AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT  51  TGTTCTCGTT AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC 101  GATGGACAAG TGCATTGTTC TCTTGCTGAA AGCTCGATGG ACAAGTGCAT 151  TGTTCTCTTG CTGAAAGCTC AGTACCCGGG AGTACCCTCG ACCGCCGGAG 201  TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT TCAAACAAGC 251  AAAGTGAACA CGTCGCTAAG CGAAAGCTAA GCAAATAAAC AAGCGCAGCT 301  GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA 351  AAAGTAACCA GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA 401  GAAGTAATTA TTGAATACAA GAAGAGAACT CTGAATACTT TCAACAAGTT 451  ACCGAGAAAG AAGAACTCAC ACACAGCTAG CGTTTAAACT TAAGCTTGGT 501  ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGgaattcgg cttgggatga 551  cgcctcctcc gcccggacgt gccgccccca gcgcaccgcg cgcccgcgtc 601  cctggcccgc cggctcggtt ggggcttccg ctgcggctgc ggctgctgct 651  gctgctctgg gcggccgccg cctccgccca gggccaccta aggagcggac 701  cccgcatctt cgccgtctgg aaaggccatg tagggcagga ccgggtggac 751  tttggccaga ctgagccgca cacggtgctt ttccacgagc caggcagctc 801  ctctgtgtgg gtgggaggac gtggcaaggt ctacctcttt gacttccccg 851  agggcaagaa cgcatctgtg cgcacggtga atatcggctc cacaaagggg 901  tcctgtctgg ataagcggga ctgcgagaac tacatcactc tcctggagag 951  gcggagtgag gggctgctgg cctgtggcac caacgcccgg caccccagct 1001 gctggaacct ggtgaatggc actgtggtgc cacttggcga gatgagaggc 1051 tacgccccct tcagcccgga cgagaactcc ctggttctgt ttgaagggga 1101 cgaggtgtat tccaccatcc ggaagcagga atacaatggg aagatccctc 1151 ggttccgccg catccggggc gagagtgagc tgtacaccag tgatactgtc 1201 atgcagaacc cacagttcat caaagccacc atcgtgcacc aagaccaggc 1251 ttacgatgac aagatctact acttcttccg agaggacaat cctgacaaga 1301 atcctgaggc tcctctcaat gtgtcccgtg tggcccagtt gtgcaggggg 1351 gaccagggtg gggaaagttc actgtcagtc tccaagtgga acacttttct 1401 gaaagccatg ctggtatgca gtgatgctgc caccaacaag aacttcaaca 1451 ggctgcaaga cgtcttcctg ctccctgacc ccagcggcca gtggagggac 1501 accagggtct atggtgtttt ctccaacccc tggaactact cagccgtctg 1551 tgtgtattcc ctcggtgaca ttgacaaggt cttccgtacc tcctcactca 1601 agggctacca ctcaagcctt cccaacccgc ggcctggcaa gtgcctccca 1651 gaccagcagc cgatacccac agagaccttc caggtggctg accgtcaccc 1701 agaggtggcg cagagggtgg agcccatggg gcctctgaag acgccattgt 1751 tccactctaa ataccactac cagaaagtgg ccgttcaccg catgcaagcc 1801 agccacgggg agacctttca tgtgctttac ctaactacag acaggggcac 1851 tatccacaag gtggtggaac cgggggagca ggagcacagc ttcgccttca 1901 acatcatgga gatccagccc ttccgccgcg cggctgccat ccagaccatg 1951 tcgctggatg ctgagcggag gaagctgtat gtgagctccc agtgggaggt 2001 gagccaggtg cccctggacc tgtgtgaggt ctatggcggg ggctgccacg 2051 gttgcctcat gtcccgagac ccctactgcg gctgggacca gggccgctgc 2101 atctccatct acagctccga acggtcagtg ctgcaatcca ttaatccagc 2151 cgagccacac aaggagtgtc ccaaccccaa accagacaag gccccactgc 2201 agaaggtttc cctggcccca aactctcgct actacctgag ctgccccatg 2251 gaatcccgcc acgccaccta ctcatggcgc cacaaggaga acgtggagca 2301 gagctgcgaa cctggtcacc agagccccaa ctgcatcctg ttcatcgaga 2351 acctcacggc gcagcagtac ggccactact tctgcgaggc ccaggagggc 2401 tcctacttcc gcgaggctca gcactggcag ctgctgcccg aggacggcat 2451 catggccgag cacctgctgg gtcatgcctg tgccctggct gcctccctct 2501 ggctgggggt gctgcccaca ctcactcttg gcttgctggt ccacgtgaag 2551 cttGGGCCCG TTTAAACCCG CTGATCAGCC TCGACTGTGC CTTCTAGTTG 2601 CCAGCCATCT GTTGTTTGCC CCTCCCCCGT GCCTTCCTTG ACCCTGGAAG 2651 GTGCCACTCC CACTGTCCTT TCCTAATAAA ATGAGGAAAT TGCATCGCAT 2701 TGTCTGAGTA GGTGTCATTC TATTCTGGGG GGTGGGGTGG GGCAGGACAG 2751 CAAGGGGGAG GATTGGGAAG ACAATAGCAG GCATGCTGGG GATGCGGTGG 2801 GCTCTATGGC TTCTGAGGCG GAAAGAACCA GCTGGGGCTC TAGGGGGTAT 2851 CCCCACGCGC CCTGTAGCGG CGCATTAAGC GCGGCGGGTG TGGTGGTTAC 2901 GCGCAGCGTG ACCGCTACAC TTGCCAGCGC CCTAGCGCCC GCTCCTTTCG 2951 CTTTCTTCCC TTCCTTTCTC GCCACGTTCG CCGGCTTTCC CCGTCAAGCT 3001 CTAAATCGGG GCATCCCTTT AGGGTTCCGA TTTAGTGCTT TACGGCACCT 3051 CGACCCCAAA AAACTTGATT AGGGTGATGG TTCACGTAGT GGGCCATCGC 3101 CCTGATAGAC GGTTTTTCGC CCTTTGACGT TGGAGTCCAC GTTCTTTAAT 3151 AGTGGACTCT TGTTCCAAAC TGGAACAACA CTCAACCCTA TCTCGGTCTA 3201 TTCTTTTGAT TTATAAGGGA TTTTGGGGAT TTCGGCCTAT TGGTTAAAAA 3251 ATGAGCTGAT TTAACAAAAA TTTAACGCGA ATTAATTCTG TGGAATGTGT 3301 GTCAGTTAGG GTGTGGAAAG TCCCCAGGCT CCCCAGGCAG GCAGAAGTAT 3351 GCAAAGCATG CATCTCAATT AGTCAGCAAC CAGGTGTGGA AAGTCCCCAG 3401 GCTCCCCAGC AGGCAGAAGT ATGCAAAGCA TGCATCTCAA TTAGTCAGCA 3451 ACCATAGTCC CGCCCCTAAC TCCGCCCATC CCGCCCCTAA CTCCGCCCAG 3501 TTCCGCCCAT TCTCCGCCCC ATGGCTGACT AATTTTTTTT ATTTATGCAG 3551 AGGCCGAGGC CGCCTCTGCC TCTGAGCTAT TCCAGAAGTA GTGAGGAGGC 3601 TTTTTTGGAG GCCTAGGCTT TTGCAAAAAG CTCCCGGGAG CTTGTATATC 3651   CATTTTCGGA TCTGATCAAG AGACAGGATG AGGATCGTTT CGCATGATTG 3701   AACAAGATGG ATTGCACGCA GGTTCTCCGG CCGCTTGGGT GGAGAGGCTA 3751   TTCGGCTATG ACTGGGCACA ACAGACAATC GGCTGCTCTG ATGCCGCCGT 3801   GTTCCGGCTG TCAGCGCAGG GGCGCCCGGT TCTTTTTGTC AAGACCGACC 3851   TGTCCGGTGC CCTGAATGAA CTGCAGGACG AGGCAGCGCG GCTATCGTGG 3901   CTGGCCACGA CGGGCGTTCC TTGCGCAGCT GTGCTCGACG TTGTCACTGA 3951   AGCGGGAAGG GACTGGCTGC TATTGGGCGA AGTGCCGGGG CAGGATCTCC 4001   TGTCATCTCA CCTTGCTCCT GCCGAGAAAG TATCCATCAT GGCTGATGCA 4051   ATGCGGCGGC TGCATACGCT TGATCCGGCT ACCTGCCCAT TCGACCACCA 4101   AGCGAAACAT CGCATCGAGC GAGCACGTAC TCGGATGGAA GCCGGTCTTG 4151   TCGATCAGGA TGATCTGGAC GAAGAGCATC AGGGGCTCGC GCCAGCCGAA 4201   CTGTTCGCCA GGCTCAAGGC GCGCATGCCC GACGGCGAGG ATCTCGTCGT 4251   GACCCATGGC GATGCCTGCT TGCCGAATAT CATGGTGGAA AATGGCCGCT 4301   TTTCTGGATT CATCGACTGT GGCCGGCTGG GTGTGGCGGA CCGCTATCAG 4351   GACATAGCGT TGGCTACCCG TGATATTGCT GAAGAGCTTG GCGGCGAATG 4401   GGCTGACCGC TTCCTCGTGC TTTACGGTAT CGCCGCTCCC GATTCGCAGC 4451   GCATCGCCTT CTATCGCCTT CTTGACGAGT TCTTCTGAGC GGGACTCTGG 4501   GGTTCGAAAT GACCGACCAA GCGACGCCCA ACCTGCCATC ACGAGATTTC 4551   GATTCCACCG CCGCCTTCTA TGAAAGGTTG GGCTTCGGAA TCGTTTTCCG 4601   GGACGCCGGC TGGATGATCC TCCAGCGCGG GGATCTCATG CTGGAGTTCT 4651   TCGCCCACCC CAACTTGTTT ATTGCAGCTT ATAATGGTTA CAAATAAAGC 4701   AATAGCATCA CAAATTTCAC AAATAAAGCA TTTTTTTCAC TGCATTCTAG 4751   TTGTGGTTTG TCCAAACTCA TCAATGTATC TTATCATGTC TGTATACCGT 4801   CGACCTCTAG CTAGAGCTTG GCGTAATCAT GGTCATAGCT GTTTCCTGTG 4851   TGAAATTGTT ATCCGCTCAC AATTCCACAC AACATACGAG CCGGAAGCAT 4901   AAAGTGTAAA GCCTGGGGTG CCTAATGAGT GAGCTAACTC ACATTAATTG 4951   CGTTGCGCTC ACTGCCCGCT TTCCAGTCGG GAAACCTGTC GTGCCAGCTG 5001   CATTAATGAA TCGGCCAACG CGCGGGGAGA GGCGGTTTGC GTATTGGGCG 5051   CTCTTCCGCT TCCTCGCTCA CTGACTCGCT GCGCTCGGTC GTTCGGCTGC 5101   GGCGAGCGGT ATCAGCTCAC TCAAAGGCGG TAATACGGTT ATCCACAGAA 5151   TCAGGGGATA ACGCAGGAAA GAACATGTGA GCAAAAGGCC AGCAAAAGGC 5201   CAGGAACCGT AAAAAGGCCG CGTTGCTGGC GTTTTTCCAT AGGCTCCGCC 5251   CCCCTGACGA GCATCACAAA AATCGACGCT CAAGTCAGAG GTGGCGAAAC 5301   CCGACAGGAC TATAAAGATA CCAGGCGTTT CCCCCTGGAA GCTCCCTCGT 5351   GCGCTCTCCT GTTCCGACCC TGCCGCTTAC CGGATACCTG TCCGCCTTTC 5401   TCCCTTCGGG AAGCGTGGCG CTTTCTCAAT GCTCACGCTG TAGGTATCTC 5451   AGTTCGGTGT AGGTCGTTCG CTCCAAGCTG GGCTGTGTGC ACGAACCCCC 5501   CGTTCAGCCC GACCGCTGCG CCTTATCCGG TAACTATCGT CTTGAGTCCA 5551   ACCCGGTAAG ACACGACTTA TCGCCACTGG CAGCAGCCAC TGGTAACAGG 5601   ATTAGCAGAG CGAGGTATGT AGGCGGTGCT ACAGAGTTCT TGAAGTGGTG 5651   GCCTAACTAC GGCTACACTA GAAGGACAGT ATTTGGTATC TGCGCTCTGC 5701   TGAAGCCAGT TACCTTCGGA AAAAGAGTTG GTAGCTCTTG ATCCGGCAAA 5751   CAAACCACCG CTGGTAGCGG TGGTTTTTTT GTTTGCAAGC AGCAGATTAC 5801   GCGCAGAAAA AAAGGATCTC AAGAAGATCC TTTGATCTTT TCTACGGGGT 5851   CTGACGCTCA GTGGAACGAA AACTCACGTT AAGGGATTTT GGTCATGAGA 5901   TTATCAAAAA GGATCTTCAC CTAGATCCTT TTAAATTAAA AATGAAGTTT 5951   TAAATCAATC TAAAGTATAT ATGAGTAAAC TTGGTCTGAC AGTTACCAAT 6001   GCTTAATCAG TGAGGCACCT ATCTCAGCGA TCTGTCTATT TCGTTCATCC 6051   ATAGTTGCCT GACTCCCCGT CGTGTAGATA ACTACGATAC GGGAGGGCTT 6101   ACCATCTGGC CCCAGTGCTG CAATGATACC GCGAGACCCA CGCTCACCGG 6151   CTCCAGATTT ATCAGCAATA AACCAGCCAG CCGGAAGGGC CGAGCGCAGA 6201   AGTGGTCCTG CAACTTTATC CGCCTCCATC CAGTCTATTA ATTGTTGCCG 6251   GGAAGCTAGA GTAAGTAGTT CGCCAGTTAA TAGTTTGCGC AACGTTGTTG 6301   CCATTGCTAC AGGCATCGTG GTGTCACGCT CGTCGTTTGG TATGGCTTCA 6351   TTCAGCTCCG GTTCCCAACG ATCAAGGCGA GTTACATGAT CCCCCATGTT 6401   GTGCAAAAAA GCGGTTAGCT CCTTCGGTCC TCCGATCGTT GTCAGAAGTA 6451   AGTTGGCCGC AGTGTTATCA CTCATGGTTA TGGCAGCACT GCATAATTCT 6501   CTTACTGTCA TGCCATCCGT AAGATGCTTT TCTGTGACTG GTGAGTACTC 6551   AACCAAGTCA TTCTGAGAAT AGTGTATGCG GCGACCGAGT TGCTCTTGCC 6601   CGGCGTCAAT ACGGGATAAT ACCGCGCCAC ATAGCAGAAC TTTAAAAGTG 6651   CTCATCATTG GAAAACGTTC TTCGGGGCGA AAACTCTCAA GGATCTTACC 6701   GCTGTTGAGA TCCAGTTCGA TGTAACCCAC TCGTGCACCC AACTGATCTT 6751   CAGCATCTTT TACTTTCACC AGCGTTTCTG GGTGAGCAAA AACAGGAAGG 6801   CAAAATGCCG CAAAAAAGGG AATAAGGGCG ACACGGAAAT GTTGAATACT 6851   CATACTCTTC CTTTTTCAAT ATTATTGAAG CATTTATCAG GGTTATTGTC 6901   TCATGAGCGG ATACATATTT GAATGTATTT AGAAAAATAA ACAAATAGGG 6951   GTTCCGCGCA CATTTCCCCG AAAAGTGCCA CCTGACGTCG ACGGATCGGG 表11:重组质粒pIND-H-SemaL-EA的核苷酸序列(SEQ ID NO.:38)   1   AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT  51   TGTTCTCGTT AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC 101   GATGGACAAG TGCATTGTTC TCTTGCTGAA AGCTCGATGG ACAAGTGCAT 151   TGTTCTCTTG CTGAAAGCTC AGTACCCGGG AGTACCCTCG ACCGCCGGAG 201  TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT TCAAACAAGC 251  AAAGTGAACA CGTCGCTAAG CGAAAGCTAA GCAAATAAAC AAGCGCAGCT 301  GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA 351  AAAGTAACCA GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA 401  GAAGTAATTA TTGAATACAA GAAGAGAACT CTGAATACTT TCAACAAGTT 451  ACCGAGAAAG AAGAACTCAC ACACAGCTAG CGTTTAAACT TAAGCTTGGT 501  ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGgaattcgg cttgggatga 551  cgcctcctcc gcccggacgt gccgccccca gcgcaccgcg cgcccgcgtc 601  cctggcccgc cggctcggtt ggggcttccg ctgcggctgc ggctgctgct 651  gctgctctgg gcggccgccg cctccgccca gggccaccta aggagcggac 701  cccgcatctt cgccgtctgg aaaggccatg tagggcagga ccgggtggac 751  tttggccaga ctgagccgca cacggtgctt ttccacgagc caggcagctc 801  ctctgtgtgg gtgggaggac gtggcaaggt ctacctcttt gacttccccg 851  agggcaagaa cgcatctgtg cgcacggtga atatcggctc cacaaagggg 901  tcctgtctgg ataagcggga ctgcgagaac tacatcactc tcctggagag 951  gcggagtgag gggctgctgg cctgtggcac caacgcccgg caccccagct 1001 gctggaacct ggtgaatggc actgtggtgc cacttggcga gatgagaggc 1051 tacgccccct tcagcccgga cgagaactcc ctggttctgt ttgaagggga 1101 cgaggtgtat tccaccatcc ggaagcagga atacaatggg aagatccctc 1151 ggttccgccg catccggggc gagagtgagc tgtacaccag tgatactgtc 1201 atgcagaacc cacagttcat caaagccacc atcgtgcacc aagaccaggc 1251 ttacgatgac aagatctact acttcttccg agaggacaat cctgacaaga 1301 atcctgaggc tcctctcaat gtgtcccgtg tggcccagtt gtgcaggggg 1351 gaccagggtg gggaaagttc actgtcagtc tccaagtgga acacttttct 1401 gaaagccatg ctggtatgca gtgatgctgc caccaacaag aacttcaaca 1451 ggctgcaaga cgtcttcctg ctccctgacc ccagcggcca gtggagggac 1501 accagggtct atggtgtttt ctccaacccc tggaactact cagccgtctg 1551 tgtgtattcc ctcggtgaca ttgacaaggt cttccgtacc tcctcactca 1601 agggctacca ctcaagcctt cccaacccgc ggcctggcaa gtgcctccca 1651 gaccagcagc cgatacccac agagaccttc caggtggctg accgtcaccc 1701 agaggtggcg cagagggtgg agcccatggg gcctctgaag acgccattgt 1751 tccactctaa ataccactac cagaaagtgg ccgttcaccg catgcaagcc 1801 agccacgggg agacctttca tgtgctttac ctaactacag acaggggcac 1851 tatccacaag gtggtggaac cgggggagca ggagcacagc ttcgccttca 1901 acatcatgga gatccagccc ttccgccgcg cggctgccat ccagaccatg 1951 tcgctggatg ctgagcggag gaagctgtat gtgagctccc agtgggaggt 2001 gagccaggtg cccctggacc tgtgtgaggt ctatggcggg ggctgccacg 2051 gttgcctcat gtcccgagac ccctactgcg gctgggacca gggccgctgc 2101 atctccatct acagctccga acggtcagtg ctgcaatcca ttaatccagc 2151 cgagccacac aaggagtgtc ccaaccccaa accagacaag gccccactgc 2201 agaaggtttc cctggcccca aactctcgct actacctgag ctgccccatg 2251 gaatcccgcc acgccaccta ctcatggcgc cacaaggaga acgtggagca 2301 gagctgcgaa cctggtcacc agagccccaa ctgcatcctg ttcatcgaga 2351 acctcacggc gcagcagtac ggccactact tctgcgaggc ccaggagggc 2401 tcctacttcc gcgaggctca gcactggcag ctgctgcccg aggacggcat 2451 catggccgag cacctgctgg gtcatgcctg tgccctggct gcctccctct 2501 ggctgggggt gctgcccaca ctcactcttg gcttgctggt ccacgtgaag 2551 cttGGGCCCG AACAAAAACT CATCTCAGAA GAGGATCTGA ATAGCGCCGT 2601 CGACCATCAT CATCATCATC ATTGAGTTTA TCCAGCACAG TGGCGGCCGC 2651 TCGAGTCTAG AGGGCCCGTT TAAACCCGCT GATCAGCCTC GACTGTGCCT 2701 TCTAGTTGCC AGCCATCTGT TGTTTGCCCC TCCCCCGTGC CTTCCTTGAC 2751 CCTGGAAGGT GCCACTCCCA CTGTCCTTTC CTAATAAAAT GAGGAAATTG 2801 CATCGCATTG TCTGAGTAGG TGTCATTCTA TTCTGGGGGG TGGGGTGGGG 2851 CAGGACAGCA AGGGGGAGGA TTGGGAAGAC AATAGCAGGC ATGCTGGGGA 2901 TGCGGTGGGC TCTATGGCTT CTGAGGCGGA AAGAACCAGC TGGGGCTCTA 2951 GGGGGTATCC CCACGCGCCC TGTAGCGGCG CATTAAGCGC GGCGGGTGTG 3001 GTGGTTACGC GCAGCGTGAC CGCTACACTT GCCAGCGCCC TAGCGCCCGC 3051 TCCTTTCGCT TTCTTCCCTT CCTTTCTCGC CACGTTCGCC GGCTTTCCCC 3101 GTCAAGCTCT AAATCGGGGC ATCCCTTTAG GGTTCCGATT TAGTGCTTTA 3151 CGGCACCTCG ACCCCAAAAA ACTTGATTAG GGTGATGGTT CACGTAGTGG 3201 GCCATCGCCC TGATAGACGG TTTTTCGCCC TTTGACGTTG GAGTCCACGT 3251 TCTTTAATAG TGGACTCTTG TTCCAAACTG GAACAACACT CAACCCTATC 3301 TCGGTCTATT CTTTTGATTT ATAAGGGATT TTGGGGATTT CGGCCTATTG 3351 GTTAAAAAAT GAGCTGATTT AACAAAAATT TAACGCGAAT TAATTCTGTG 3401 GAATGTGTGT CAGTTAGGGT GTGGAAAGTC CCCAGGCTCC CCAGGCAGGC 3451 AGAAGTATGC AAAGCATGCA TCTCAATTAG TCAGCAACCA GGTGTGGAAA 3501 GTCCCCAGGC TCCCCAGCAG GCAGAAGTAT GCAAAGCATG CATCTCAATT 3551 AGTCAGCAAC CATAGTCCCG CCCCTAACTC CGCCCATCCC GCCCCTAACT 3601 CCGCCCAGTT CCGCCCATTC TCCGCCCCAT GGCTGACTAA TTTTTTTTAT 3651 TTATGCAGAG GCCGAGGCCG CCTCTGCCTC TGAGCTATTC CAGAAGTAGT 3701 GAGGAGGCTT TTTTGGAGGC CTAGGCTTTT GCAAAAAGCT CCCGGGAGCT 3751 TGTATATCCA TTTTCGGATC TGATCAAGAG ACAGGATGAG GATCGTTTCG 3801 CATGATTGAA CAAGATGGAT TGCACGCAGG TTCTCCGGCC GCTTGGGTGG 3851 AGAGGCTATT CGGCTATGAC TGGGCACAAC AGACAATCGG CTGCTCTGAT 3901 GCCGCCGTGT TCCGGCTGTC AGCGCAGGGG CGCCCGGTTC TTTTTGTCAA 3951 GACCGACCTG TCCGGTGCCC TGAATGAACT GCAGGACGAG GCAGCGCGGC 4001   TATCGTGGGT GGCCACGAGG GGCGTTCCTT GCGCAGCTGT GCTCGACGTT 4051   GTCACTGAAG CGGGAAGGGA CTGGCTGCTA TTGGGCGAAG TGCCGGGGCA 4101   GGATCTCCTG TCATCTCACC TTGCTCCTGC CGAGAAAGTA TCCATCATGG 4151   CTGATGCAAT GCGGCGGCTG CATACGCTTG ATCCGGCTAC CTGCCCATTC 4201   GACCACCAAG CGAAACATCG CATCGAGCGA GCACGTACTC GGATGGAAGC 4251   CGGTCTTGTC GATCAGGATG ATCTGGACGA AGAGCATCAG GGGCTCGCGC 4301   CAGCCGAACT GTTCGCCAGG CTCAAGGCGC GCATGCCCGA CGGCGAGGAT 4351   CTCGTCGTGA CCCATGGCGA TGCCTGCTTG CCGAATATCA TGGTGGAAAA 4401   TGGCCGCTTT TCTGGATTCA TCGACTGTGG CCGGCTGGGT GTGGCGGACC 4451   GCTATCAGGA CATAGCGTTG GCTACCCGTG ATATTGCTGA AGAGCTTGGC 4501   GGCGAATGGG CTGACCGCTT CCTCGTGCTT TACGGTATCG CCGCTCCCGA 4551   TTCGCAGCGC ATCGCCTTCT ATCGCCTTCT TGACGAGTTC TTCTGAGCGG 4601   GACTCTGGGG TTCGAAATGA CCGACCAAGC GACGCCCAAC CTGCCATCAC 4651   GAGATTTCGA TTCCACCGCC GCCTTCTATG AAAGGTTGGG CTTCGGAATC 4701   GTTTTCCGGG ACGCCGGCTG GATGATCCTC CAGCGCGGGG ATCTCATGCT 4751   GGAGTTCTTC GCCCACCCCA ACTTGTTTAT TGCAGCTTAT AATGGTTACA 4801   AATAAAGCAA TAGCATCACA AATTTCACAA ATAAAGCATT TTTTTCACTG 4851   CATTCTAGTT GTGGTTTGTC CAAACTCATC AATGTATCTT ATCATGTCTG 4901   TATACCGTCG ACCTCTAGCT AGAGCTTGGC GTAATCATGG TCATAGCTGT 4951   TTCCTGTGTG AAATTGTTAT CCGCTCACAA TTCCACACAA CATACGAGCC 5001   GGAAGCATAA AGTGTAAAGC CTGGGGTGCC TAATGAGTGA GCTAACTCAC 5051   ATTAATTGCG TTGCGCTCAC TGCCCGCTTT CCAGTCGGGA AACCTGTCGT 5101   GCCAGCTGCA TTAATGAATC GGCCAACGCG CGGGGAGAGG CGGTTTGCGT 5151   ATTGGGCGCT CTTCCGCCTC CTCGCTCACT GACTCGCTGC GCTCGGTCGT 5201   TCGGCTGCGG CGAGCGGTAT CAGCTCACTC AAAGGCGGTA ATACGGTTAT 5251   CCACAGAATC AGGGGATAAC GCAGGAAAGA ACATGTGAGC AAAAGGCCAG 5301   CAAAAGGCCA GGAACCGTAA AAAGGCCGCG TTGCTGGCGT TTTTCCATAG 5351   GCTCCGCCCC CCTGACGAGC ATCACAAAAA TCGACGCTCA AGTCAGAGGT 5401   GGCGAAACCC GACAGGACTA TAAAGATACC AGGCGTTTCC CCCTGGAAGC 5451   TCCCTCGTGC GCTCTCCTGT TCCGACCCTG CCGCTTACCG GATACCTGTC 5501   CGCCTTTCTC CCTTCGGGAA GCGTGGCGCT TTCTCAATGC TCACGCTGTA 5551   GGTATCTCAG TTCGGTGTAG GTCGTTCGCT CCAAGCTGGG CTGTGTGCAC 5601   GAACCCCCCG TTCAGCCCGA CCGCTGCGCC TTATCCGGTA ACTATCGTCT 5651   TGAGTCCAAC CCGGTAAGAC ACGACTTATC GCCACTGGCA GCAGCCACTG 5701   GTAACAGGAT TAGCAGAGCG AGGTATGTAG GCGGTGCTAC AGAGTTCTTG 5751   AAGTGGTGGC CTAACTACGG CTACACTAGA AGGACAGTAT TTGGTATCTG 5801   CGCTCTGCTG AAGCCAGTTA CCTTCGGAAA AAGAGTTGGT AGCTCTTGAT 5851   CCGGCAAACA AACCACCGCT GGTAGCGGTG GTTTTTTTGT TTGCAAGCAG 5901   CAGATTACGC GCAGAAAAAA AGGATCTCAA GAAGATCCTT TGATCTTTTC 5951   TACGGGGTCT GACGCTCAGT GGAACGAAAA CTCACGTTAA GGGATTTTGG 6001   TCATGAGATT ATCAAAAAGG ATCTTCACCT AGATCCTTTT AAATTAAAAA 6051   TGAAGTTTTA AATCAATCTA AAGTATATAT GAGTAAACTT GGTCTGACAG 6101   TTACCAATGC TTAATCAGTG AGGCACCTAT CTCAGCGATC TGTCTATTTC 6151   GTTCATCCAT AGTTGCCTGA CTCCCCGTCG TGTAGATAAC TACGATACGG 6201   GAGGGCTTAC CATCTGGCCC CAGTGCTGCA ATGATACCGC GAGACCCACG 6251   CTCACCGGCT CCAGATTTAT CAGCAATAAA CCAGCCAGCC GGAAGGGCCG 6301   AGCGCAGAAG TGGTCCTGCA ACTTTATCCG CCTCCATCCA GTCTATTAAT 6351   TGTTGCCGGG AAGCTAGAGT AAGTAGTTCG CCAGTTAATA GTTTGCGCAA 6401   CGTTGTTGCC ATTGCTACAG GCATCGTGGT GTCACGCTCG TCGTTTGGTA 6451   TGGCTTCATT CAGCTCCGGT TCCCAACGAT CAAGGCGAGT TACATGATCC 6501   CCCATGTTGT GCAAAAAAGC GGTTAGCTCC TTCGGTCCTC CGATCGTTGT 6551   CAGAAGTAAG TTGGCCGCAG TGTTATCACT CATGGTTATG GCAGCACTGC 6601   ATAATTCTCT TACTGTCATG CCATCCGTAA GATGCTTTTC TGTGACTGGT 6651   GAGTACTCAA CCAAGTCATT CTGAGAATAG TGTATGCGGC GACCGAGTTG 6701   CTCTTGCCCG GCGTCAATAC GGGATAATAC CGCGCCACAT AGCAGAACTT 6751   TAAAAGTGCT CATCATTGGA AAACGTTCTT CGGGGCGAAA ACTCTCAAGG 6801   ATCTTACCGC TGTTGAGATC CAGTTCGATG TAACCCACTC GTGCACCCAA 6851   CTGATCTTCA GCATCTTTTA CTTTCACCAG CGTTTCTGGG TGAGCAAAAA 6901   CAGGAAGGCA AAATGCCGCA AAAAAGGGAA TAAGGGCGAC ACGGAAATGT 6951   TGAATACTCA TACTCTTCCT TTTTCAATAT TATTGAAGCA TTTATCAGGG 7001   TTATTGTCTC ATGAGCGGAT ACATATTTGA ATGTATTTAG AAAAATAAAC 7051   AAATAGGGGT TCCGCGCACA TTTCCCCGAA AAGTGCCACC TGACGTCGAC 7101   GGATCGGG 表12:重组质粒pQE30-H-SemaL-BH的序列(SEQ ID NO.:39)   1  CTCGAGAAAT CATAAAAAAT TTATTTGCTT TGTGAGCGGA TAACAATTAT  51  AATAGATTCA ATTGTGAGCG GATAACAATT TCACACAGAA TTCATTAAAG 101  AGGAGAAATT AACTATGAGA GGATCGCATC ACCATCACCA TCACGGAtcc 151  ctggttctgt ttgaagggga cgaggtgtat tccaccatcc ggaagcagga 201  atacaatggg aagatccctc ggttccgccg catccggggc gagagtgagc 251  tgtacaccag tgatactgtc atgcagaacc cacagttcat caaagccacc 301  atcgtgcacc aagaccaggc ttacgatgac aagatctact acttcttccg 351  agaggacaat cctgacaaga atcctgaggc tcctctcaat gtgtcccgtg 401  tggcccagtt gtgcaggggg gaccagggtg gggaaagttc actgtcagtc 451  tccaagtgga acacttttct gaaagccatg ctggtatgca gtgatgctgc 501  caccaacaag aacttcaaca ggctgcaaga cgtcttcctg ctccctgacc 551  ccagcggcca gtggagggac accagggtct atggtgtttt ctccaacccc 601  tggaactact cagccgtctg tgtgtattcc ctcggtgaca ttgacaaggt 651  cttccgtacc tcctcactca agggctacca ctcaagcctt cccaacccgc 701  ggcctggcaa gtgcctccca gaccagcagc cgatacccac agaAAGCTTA 751  ATTAGCTGAG CTTGGACTCC TGTTGATAGA TCCAGTAATG ACCTCAGAAC 801  TCCATCTGGA TTTGTTCAGA ACGCTCGGTT GCCGCCGGGC GTTTTTTATT 851  GGTGAGAATC CAAGCTAGCT TGGCGAGATT TTCAGGAGCT AAGGAAGCTA 901  AAATGGAGAA AAAAATCACT GGATATACCA CCGTTGATAT ATCCCAATGG 951  CATCGTAAAG AACATTTTGA GGCATTTCAG TCAGTTGCTC AATGTACCTA 1001 TAACCAGACC GTTCAGCTGG ATATTACGGC CTTTTTAAAG ACCGTAAAGA 1051 AAAATAAGCA CAAGTTTTAT CCGGCCTTTA TTCACATTCT TGCCCGCCTG 1101 ATGAATGCTC ATCCGGAATT TCGTATGGCA ATGAAAGACG GTGAGCTGGT 1151 GATATGGGAT AGTGTTCACC CTTGTTACAC CGTTTTCCAT GAGCAAACTG 1201 AAACGTTTTC ATCGCTCTGG AGTGAATACC ACGACGATTT CCGGCAGTTT 1251 CTACACATAT ATTCGCAAGA TGTGGCGTGT TACGGTGAAA ACCTGGCCTA 1301 TTTCCCTAAA GGGTTTATTG AGAATATGTT TTTCGTCTCA GCCAATCCCT 1351 GGGTGAGTTT CACCAGTTTT GATTTAAACG TGGCCAATAT GGACAACTTC 1401 TTCGCCCCCG TTTTCACCAT GGGCAAATAT TATACGCAAG GCGACAAGGT 1451 GCTGATGCCG CTGGCGATTC AGGTTCATCA TGCCGTCTGT GATGGCTTCC 1501 ATGTCGGCAG AATGCTTAAT GAATTACAAC AGTACTGCGA TGAGTGGCAG 1551 GGCGGGGCGT AATTTTTTTA AGGCAGTTAT TGGTGCCCTT AAACGCCTGG 1601 GGTAATGACT CTCTAGCTTG AGGCATCAAA TAAAACGAAA GGCTCAGTCG 1651 AAAGACTGGG CCTTTCGTTT TATCTGTTGT TTGTCGGTGA ACGCTCTCCT 1701 GAGTAGGACA AATCCGCCGC TCTAGAGCTG CCTCGCGCGT TTCGGTGATG 1751 ACGGTGAAAA CCTCTGACAC ATGCAGCTCC CGGAGACGGT CACAGCTTGT 1801 CTGTAAGCGG ATGCCGGGAG CAGACAAGCC CGTCAGGGCG CGTCAGCGGG 1851 TGTTGGCGGG TGTCGGGGCG CAGCCATGAC CCAGTCACGT AGCGATAGCG 1901 GAGTGTATAC TGGCTTAACT ATGCGGCATC AGAGCAGATT GTACTGAGAG 1951 TGCACCATAT GCGGTGTGAA ATACCGCACA GATGCGTAAG GAGAAAATAC 2001 CGCATCAGGC GCTCTTCCGC TTCCTCGCTC ACTGACTCGC TGCGCTCGGT 2051 CTGTCGGCTG CGGCGAGCGG TATCAGCTCA CTCAAAGGCG GTAATACGGT 2101 TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG AGCAAAAGGC 2151 CAGCAAAAGG CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA 2201 TAGGCTCCGC CCCCCTGACG AGCATCACAA AAATCGACGC TCAAGTCAGA 2251 GGTGGCGAAA CCCGACAGGA CTATAAAGAT ACCAGGCGTT TCCCCCTGGA 2301   AGCTCCCTCG TGCGCTCTCC TGTTCCGACC CTGCCGCTTA CCGGATACCT 2351   GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC GCTTTCTCAA TGCTCACGCT 2401   GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG 2451   CACGAACCCC CCGTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG 2501   TCTTGAGTCC AACCCGGTAA GACACGACTT ATCGCCACTG GCAGCAGCCA 2551   CTGGTAACAG GATTAGCAGA GCGAGGTATG TAGGCGGTGC TACAGAGTTC 2601   TTGAAGTGGT GGCCTAACTA CGGCTACACT AGAAGGACAG TATTTGGTAT 2651   CTGCGCTCTG CTGAAGCCAG TTACCTTCGG AAAAAGAGTT GGTAGCTCTT 2701   GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG 2751   CAGCAGATTA CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT 2801   TTCTACGGGG TCTGACGCTC AGTGGAACGA AAACTCACGT TAAGGGATTT 2851   TGGTCATGAG ATTATCAAAA AGGATCTTCA CCTAGATCCT TTTAAATTAA 2901   AAATGAAGTT TTAAATCAAT CTAAAGTATA TATGAGTAAA CTTGGTCTGA 2951   CAGTTACCAA TGCTTAATCA GTGAGGCACC TATCTCAGCG ATCTGTCTAT 3001   TTCGTTCATC CATAGCTGCC TGACTCCCCG TCGTGTAGAT AACTACGATA 3051   CGGGAGGGCT TACCATCTGG CCCCAGTGCT GCAATGATAC CGCGAGACCC 3101   ACGCTCACCG GCTCCAGATT TATCAGCAAT AAACCAGCCA GCCGGAAGGG 3151   CCGAGCGCAG AAGTGGTCCT GCAACTTTAT CCGCCTCCAT CCAGTCTATT 3201   AATTGTTGCC GGGAAGCTAG AGTAAGTAGT TCGCCAGTTA ATAGTTTGCG 3251   CAACGTTGTT GCCATTGCTA CAGGCATCGT GGTGTCACGC TCGTCGTTTG 3301   GTATGGCTTC ATTCAGCTCC GGTTCCCAAC GATCAAGGCG AGTTACATGA 3351   TCCCCCATGT TGTGCAAAAA AGCGGTTAGC TCCTTCGGTC CTCCGATCGT 3401   TGTCAGAAGT AAGTTGGCCG CAGTGTTATC ACTCATGGTT ATGGCAGCAC 3451   TGCATAATTC TCTTACTGTC ATGCCATCCG TAAGATGCTT TTCTGTGACT 3501   GGTGAGTACT CAACCAAGTC ATTCTGAGAA TAGTGTATGC GGCGACCGAG 3551   TTGCTCTTGC CCGGCGTCAA TACGGGATAA TACCGCGCCA CATAGCAGAA 3601   CTTTAAAAGT GCTCATCATT GGAAAACGTT CTTCGGGGCG AAAACTCTCA 3651   AGGATCTTAC CGCTGTTGAG ATCCAGTTCG ATGTAACCCA CTCGTGCACC 5701   CAACTGATCT TCAGCATCTT TTACTTTCAC CAGCGTTTCT GGGTGAGCAA 3751   AAACAGGAAG GCAAAATGCC GCAAAAAAGG GAATAAGGGC GACACGGAAA 3801   TGTTGAATAC TCATACTCTT CCTTTTTCAA TATTATTGAA GCATTTATCA 3851   GGGTTATTGT CTCATGAGCG GATACATATT TGAATGTATT TAGAAAAATA 3901   AACAAATAGG GGTTCCGCGC ACATTTCCCC GAAAAGTGCC ACCTGACGTC 3951   TAAGAAACCA TTATTATCAT GACATTAACC TATAAAAATA GGCGTATCAC 4001   GAGGCCCTTT CGTCTTCAC 表13:重组质粒pQE31-H-SemaL-SH的序列(SEQ ID NO.:40)   1  CTCGAGAAAT CATAAAAAAT TTATTTGCTT TGTGAGCGGA TAACAATTAT  51  AATAGATTCA ATTGTGAGCG GATAACAATT TCACACAGAA TTCATTAAAG 101  AGGAGAAATT AACTATGAGA GGATCGCATC ACCATCACCA TCACACGGAT 151  CCGCATGCga gctcccagtg ggaggtgagc caggtgcccc tggacctgtg 201  tgaggtctat ggcgggggct gccacggttg cctcatgtcc cgagacccct 251  actgcggctg ggaccagggc cgctgcatct ccatctacag ctccgaacgg 301  tcagtgctgc aatccattaa tccagccgag ccacacaagg agtgtcccaa 351  ccccaaacca gacaaggccc cactgcagaa ggtttccctg gccccaaact 401  ctcgctacta cctgagctgc cccatggaat cccgccacgc cacctactca 451  tggcgccaca aggagaacgt ggagcagagc tgcgaacctg gtcaccagag 501  ccccaactgc atcctgttca tcgagaacct cacggcgcag cagtacggcc 551  actacttctg cgaggcccag gagggctcct acttccgcga ggctcagcac 601  tggcagctgc tgcccgagga cggcatcatg gccgagcacc tgctgggtca 651  tgcctgtgcc ctggctgcct ccctctggct gggggtgctg cccacactca 701  ctcttggctt gctggtccac gtgaagcttA ATTAGCTGAG CTTGGACTCC 751  TGTTGATAGA TCCAGTAATG ACCTCAGAAC TCCATCTGGA TTTGTTCAGA 801  ACGCTCGGTT GCCGCCGGGC GTTTTTTATT GGTGAGAATC CAAGCTAGCT 851  TGGCGAGATT TTCAGGAGCT AAGGAAGCTA AAATGGAGAA AAAAATCACT 901  GGATATACCA CCGTTGATAT ATCCCAATGG CATCGTAAAG AACATTTTGA 951  GGCATTTCAG TCAGTTGCTC AATGTACCTA TAACCAGACC GTTCAGCTGG 1001 ATATTACGGC CTTTTTAAAG ACCGTAAAGA AAAATAAGCA CAAGTTTTAT 1051 CCGGCCTTTA TTCACATTCT TGCCCGCCTG ATGAATGCTC ATCCGGAATT 1101 TCGTATGGCA ATGAAAGACG GTGAGCTGGT GATATGGGAT AGTGTTCACC  1151 CTTGTTACAC CGTTTTCCAT GAGCAAACTG AAACGTTTTC ATCGCTCTGG 1201 AGTGAATACC ACGACGATTT CCGGCAGTTT CTACACATAT ATTCGCAAGA 1251 TGTGGCGTGT TACGGTGAAA ACCTGGCCTA TTTCCCTAAA GGGTTTATTG 1301 AGAATATGTT TTTCGTCTCA GCCAATCCCT GGGTGAGTTT CACCAGTTTT 1351 GATTTAAACG TGGCCAATAT GGACAACTTC TTCGCCCCCG TTTTCACCAT 1401 GGGCAAATAT TATACGCAAG GCGACAAGGT GCTGATGCCG CTGGCGATTC 1451 AGGTTCATCA TGCCGTCTGT GATGGCTTCC ATGTCGGCAG AATGCTTAAT 1501 GAATTACAAC AGTACTGCGA TGAGTGGCAG GGCGGGGCGT AATTTTTTTA 1551 AGGCAGTTAT TGGTGCCCTT AAACGCCTGG GGTAATGACT CTCTAGCTTG 1601 AGGCATCAAA TAAAACGAAA GGCTCAGTCG AAAGACTGGG CCTTTCGTTT 1651 TATCTGTTGT TTGTCGGTGA ACGCTCTCCT GAGTAGGACA AATCCGCCGC 1701 TCTAGAGCTG CCTCGCGCGT TTCGGTGATG ACGGTGAAAA CCTCTGACAC 1751   ATGCAGCTCC CGGAGACGGT CACAGCTTGT CTGTAAGCGG ATGCCGGGAG 1801   CAGACAAGCC CGTCAGGGCG CGTGAGCGGG TGTTGGCGGG TGTCGGGGCG 1851   CAGCCATGAC CCAGTCACGT AGCGATAGCG GAGTGTATAC TGGCTTAACT 1901   ATGCGGCATC AGAGCAGATT GTACTGAGAG TGCACCATAT GCGGTGTGAA 1951   ATACCGCACA GATGCGTAAG GAGAAAATAC CGCATCAGGC GCTCTTCCGC 2001   TTCCTCGCTC ACTGACTCGC TGCGCTCGGT CTGTCGGCTG CGGCGAGCGG 2051   TATCAGCTCA CTCAAAGGCG GTAATACGGT TATCCACAGA ATCAGGGGAT 2101   AACGCAGGAA AGAACATGTG AGCAAAAGGC CAGCAAAAGG CCAGGAACCG 2151   TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC CCCCCTGACG 2201   AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA CCCGACAGGA 2251   CTATAAAGAT ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC 2301   TGTTCCGACC CTGCCGCTTA CCGGATACCT GTCCGCCTTT CTCCCTTCGG 2351   GAAGCGTGGC GCTTTCTCAA TGCTCACGCT GTAGGTATCT CAGTTCGGTG 2401   TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG CACGAACCCC CCGTTCAGCC 2451   CGACCGCTGC GCCTTATCCG GTAACTATGG TCTTGAGTCC AACCCGGTAA 2501   GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG GATTAGCAGA 2551   GCGAGGTATG TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA 2601   CGGCTACACT AGAAGGACAG TATTTGGTAT CTGCGCTCTG CTGAAGCCAG 2651   TTACCTTCGG AAAAAGAGTT GGTAGCTCTT GATCCGGCAA ACAAACCACC 2701   GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG CAGCAGATTA CGCGCAGAAA 2751   AAAAGGATCT CAAGAAGATC CTTTGATCTT TTCTACGGGG TCTGACGCTC 2801   AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG ATTATCAAAA 2851   AGGATCTTCA CCTAGATCCT TTTAAATTAA AAATGAAGTT TTAAATCAAT 2901   CTAAAGTATA TATGAGTAAA CTTGGTCTGA CAGTTACCAA TGCTTAATCA 2951   GTGAGGCACC TATCTCAGCG ATCTGTCTAT TTCGTTCATC CATAGCTGCC 3001   TGACTCCCCG TCGTGTAGAT AACTACGATA CGGGAGGGCT TACCATCTGG 3051   CCCCAGTGCT GCAATGATAC CGCGAGACCC ACGCTCACCG GCTCCAGATT 3101   TATCAGCAAT AAACCAGCCA GCCGGAAGGG CCGAGCGCAG AAGTGGTCCT 3151   GCAACTTTAT CCGCCTCCAT CCAGTCTATT AATTGTTGCC GGGAAGCTAG 3201   AGTAAGTAGT TCGCCAGTTA ATAGTTTGCG CAACGTTGTT GCCATTGCTA 3251   CAGGCATCGT GGTGTCACGC TCGTCGTTTG GTATGGCTTC ATTCAGCTCC 3301   GGTTCCCAAC GATCAAGGCG AGTTACATGA TCCCCCATGT TGTGCAAAAA 3351   AGCGGTTAGC TCCTTCGGTC CTCCGATCGT TGTCAGAAGT AAGTTGGCCG 3401   CAGTGTTATC ACTCATGGTT ATGGCAGCAC TGCATAATTC TCTTACTGTC 3451   ATGCCATCCG TAAGATGCTT TTCTGTGACT GGTGAGTACT CAACCAAGTC 3501   ATTCTGAGAA TAGTGTATGC GGCGACCGAG TTGCTCTTGC CCGGCGTCAA 3551   TACGGGATAA TACCGCGCCA CATAGCAGAA CTTTAAAAGT GCTCATCATT 3601   GGAAAACGTT CTTCGGGGCG AAAACTCTCA AGGATCTTAC CGCTGTTGAG 3651   ATCCAGTTCG ATGTAACCCA CTCGTGCACC CAACTGATCT TCAGCATCTT 3701   TTACTTTCAC CAGCGTTTCT GGGTGAGCAA AAACAGGAAG GCAAAATGCC 3751   GCAAAAAAGG GAATAAGGGC GACACGGAAA TGTTGAATAC TCATACTCTT 3801   CCTTTTTCAA TATTATTGAA GCATTTATCA GGGTTATTGT CTCATGAGCG 3851   GATACATATT TGAATGTATT TAGAAAAATA AACAAATAGG GGTTCCGCGC 3901   ACATTTCCCC GAAAAGTGCC ACCTGACGTC TAAGAAACCA TTATTATCAT 3951   GACATTAACC TATAAAAATA GGCGTATCAC GAGGCCCTTT CGTCTTCAC 表14:人信息素L基团的(部分)核苷酸序列(8888个核苷酸)(SEQ ID NO.:41) GAGCCGCACACGGTGCTTTTCCACGAGCCAGGCAGCTCCTCTGTGTGGGTGGGAGGACGT GGCAAGGTCTACCTCTTTGACTTCCCCGAGGGCAAGAACGCATCTGTGCGCACGGTGAGC CTCTCTCTTCCCCCAACACCCCCCCTACCCTCTTATCTCCCCTCTGGCCCTGCCAAGGGT CCTCAGGGAATCCGAGGGAGCTGGCTTCTCTTCCTAAACTGCCCCCACCTCCGTATCCTA TAAATGGCTCCTGGGGGAGGCTCCCTAAAGGTAGTCCAGATTGGAGTGGGGAGCTGGGGC GGTGTGGAGAAAAACAGGAGCTAATGGGCCTGGCCAGCTGGGCAGCGCTGCTGCGGAAAG CCCAGGCTGGAAGCTGGGCCCCAGAGCCCATGCCTGGTCTTCTGAACCCTCTGGGCCTCA GCTCTGGATATGAGACCCTGTTTGACCTCAGGTAGATCACTCACCCTCTCAGAGCCCCAG TTGCTCATCTGTCAGATGAGAATAATGGTTGCTTCCTTTGGGGCTTATCCTGAGGCTGTG TGGAAAGCATTTCAGGGGTACCTCACCCCTGGCAGATTGAACTAATGCTTCTCCCCTTCC CCAGGTGAATATCGGCTCCACAAAGGGGTCCTGTCTGGATAAGCGGGTGAGCGGGGGAGG GATCTGGAGGGGTCTGAGCCACTTGGTAAAGGGAGAGGAGACCCTGAGGGTCTAAGGAAG GAAGCATGGCCCTGCCCCACGAGTCCCAGACTGATGGGGAGACGTGGTCCTCTGTGCTTA GGGGATGGCGTCAGCTGCACACACTCTGGGCTGTCCCGGGAGGCTGTCACCTATGCTAAG CCCTTCTGACACCTTCTTCCCTGATCCTGGGGGTCCTAGTGCTAGGCTTGCCAGGGCCTT CCAGCAACCAATTTCTCTCCTCCCTTCTCTCTTCCCCGGGCAGGACTGCGAGAACTACAT CACTCTCCTGGAGAGGCGGAGTGAGGGGCTGCTGGCCTGTGGCACCAACGCCCGGCACCC CAGCTGCTGGAACCTGGTGAGAAGGCTGCTCCCCATGTGCCTGATCAGCTCACCTTCTAC TGCGTGGGCTTCTGCCCCTCATGGTGGGAAGGAGATGGCGAGACTCCAATGCTGGCCTTG CCCTGGGAGGATGGGGCTCCTGGCCGAGAAACTGGCCGTCATGGGAGGCAGTGGCTGTGG GATTATGTGGCCATCCAACCCTCTGGATCTCCCACAGGTGAATGGCACTGTGGTGCCACT TGGCGAGATGAGAGGCTACGCCCCCTTCAGCCCGGACGAGAACTCCCTGGTTCTGTTTGA AGGTTGGGGCATGCTTCGGAACTGGGCTGGGAGCAGGATGGTCAGCTCTTTGTCCAGTGT CCGGAGGAGGGACTTCCAGGAGCTGCCTGCCCTTACTCATTTCTCCCTCCCACTGACCCC AGGGGACGAGGTGTATTCCACCATCCGGAAGCAGGAATACAATGGGAAGATCCCTCGGTT CCGCCGCATCCGGGGCGAGAGTGAGCTGTACACCAGTGATACTGTCATGCAGAGTGAGTC AGGCTCCGGCTGGGCTGAGGGTGGGCAAGGGGGTGTGAGCACTTAAGGTGGCAGATGGGA TCCTGATGTTTCTGGGAGGGCTCCCTGAGGGCCGCTGGGGCCATGCAGGAAAGCAGGACC TTGGTATAGGCCTGAGAAGTTAGGGTTGGCTGGGAGCAGAGGAACAGACAAGGTATAGCA GTGGGATGGGCCCAGCCCTCTTCAGGAACACAAACAGAGGGAGCCCCAGACCCAGTGCAG GGTCCCCAGGAGCCAAAGTTTATCCTCTGCTGAGTTCACGTGGAGGCAGCCCCCCAACTC CCTCCTCATCAGGGCTCTGCCAATTGAGCAGAAGTGACATAGGGGCCCCCAGGGACCTTC CCCCACTCCCCAGGCATGAAGTCATTGCTCCTGGGCCGATGACATCTTTGTAGGAAGAGG GCAAAACAGGTGTGGGGTGGAGGTGCAGGGTCTAGGGCCCCTCGGGGAGTTGGACCTGAT GTTATGAGTCCTATTCCAGATCTGATTTGCCATGGTTTGTGCAGACCCGAAGGAGGGAGG AGAGTGTGCAGGGTTGGAATGGTCTCCCGGGCAAGCTTCCCAGCCTTACGCCCATTCGCT TCTGTGCCCTGGCAGACCCACAGTTCATCAAAGCCACCATCGTGCACCAAGACCAGGCTT ACGATGACAAGATCTACTACTTCTTCCGAGAGGACAATCCTGACAAGAATCCTGAGGCTC CTCTCAATGTGTCCCGTGTGGCCCAGTTGTGCAGGGTGAACACGGGCGTGAGGGCTGCTG GCTACGTGTCTGTGCATGAATAGGCCTGAGTGAGGGTGAGTTCTGTGTGTCCGTGTGCAT GTAGAAGTTGTGTGGATGTATGAGTGGGTCTGTGTCAGGGACTGTGGGAGCAGCTGTGTG TGCATGGAGCATCATGTGTCTGTGTGTGGGTAAAGGTGGCTGAGCTCCTGTGCACGTATG ATGGCGTGTGAGCGTGTGTATGATGGGGTGTGTGTGTGTGTGTGTGTGTGTGTTTTGCCT GTGTGAATGTGCTGTGCCACGTATGTGGGTGCGTGAGTCAGTAAATGTGTGTCTGAGTCC GTCTGCTCTGTGGGGACCTGGCACTCTCACCTGCCCTGACCCTGGGCACTGCTGGCCCTG GGCTCTGGATCAGCCAGGCCTGCTTGCAGGAGTCTCATCTGGAGACCTGCCCTGAGTCCT GGGGCACCCCCGGCAGGTCCTGGCCCCTCGCAGCCTGCCTTCCTCCTCTGGGCCCAGGTG TTGATATTGCTGGCAGTGGTTTCCTGGGGTGTGTGGGGAAGCCCGGGCAGGTGCTGAGGG GCCTCTTCTCCCCTCTACCCTTCCAGGGGGACCAGGGTGGGGAAAGTTCACTGTCAGTCT CCAAGTGGAACACTTTTCTGAAAGCCATGCTGGTATGCAGTGATGCTGCCACCAACAAGA ACTTCAACAGGCTGCAAGACGTCTTCCTGCTCCCTGACCCCAGCGGCCAGTGGAGGGACA CCAGGGTCTATGGTGTTTTCTCCAACCCCTGGTGAGTGGCCCTTGTCCTGGGGCCGGGGC TGGCATTGGTTCAGTGTCCAGTAGGGACAGGAGGCCTTGGGCCCTGCTGAGGGCCTCCCT GGTGTGGCAGGAGCAGGGGCTGCAGGCTCAAGAGGCTGGGCTGTTGCTGGGTGTGGGGTG GGGGGACAGCCAGTGCGATGTATGTACTGTTGTGTGAGTGAGTCTGCACTCATGGGTGTG TGTGCATGCCCTATATGCACACTCATGACTGCACTTGTGCCTGTGTGTCCCACCACCTGC TTGTGCCGAGAGTGGACACTGGGCCCAGGAGGAAGCTGCTGAAGCATCTCTCGGGGAGCT GGGTGCTATTACACCTGCTCAGGCACTGCCTGAGCCCGATAATTCACACTTCTTAATCAC TCTCATTGATTGAACACACGGCAGGCGGAAGTGTTGGGTGTGTGTGGGGAGAGTTAGGGA TAGAGTGGAGGAAGCCAAGACCCTGCTCTGTGGCTCCTGGGTGAGTGGGTCCCCCAGGCT GGGAAGGGGTTGGGGGTCTGGCCTCCTGGGGCATCAGCACCCCACAGCCTGTGCCCAGGG AGGGCTAGAGAACTGCTCAGCCTATGATGGGGTTCCTCCTGCCTTGGGGTTGGGTAGAGC AGATGGCCTCTAGACTCAGTGATTCTGTAACAGGATACAAGTTTGTGGTTTTAAATTGCA GCACAAAGAAATTAGGCTGAACTCCTCTCCTTCCTCCTCTCCATCCCTCCCCATTTTCAG TGGTGGTTGGCAACTCAGTGCCAGGCACAAGGCTGGCCTGGGTGAGTGGAGGTGGATGGG TGGGTTCTGGGCCCCCCATTGAGCTGGTCTCCATGTCACTGCAGGAACTACTCAGCCGTC TGTGTGTATTCCCTCGGTGACATTGACAAGGTCTTCCGTACCTCCTCACTCAAGGGCTAC CACTCAAGCCTTCCCAACCCGCGGCCTGGCAAGGTGAGCGTGACACCAGCCGTGGCCCAG GCCCAGCCCTCCTTCTGCCTCACCTCCCACCACCCCACTGACCTGGGCCTGCTCTCCTTG CCCAGTGCCTCCCAGACCAGCAGCCGATACCCACAGAGACCTTCCAGGTGGCTGACCGTC ACCCAGAGGTGGCGCAGAGGGTGGAGCCCATGGGGCCTCTGAAGACGCCATTGTTCCACT CTAAATACCACTACCAGAAAGTGGCCGTCCACCGCATGCAAGCCAGCCACGGGGAGACCT TTCATGTGCTTTACCTAACTACAGGTGAGAGGCTACCCCGGGACCCTCAGTTTGCTTTGT AAAAACGGGCATGAAAGGTGTAAGGAATAATGTAGTTAACATCTGGTTGGATCTTTACAT GTGGAAGGAATAATTGAGTGACTGGAGTTGTCAGGGGTTAATGTGTGTGGGTGTGGAAGA GCCAGGCAGGGAGAGCTTCCTGGAGGAGGTAGGGGCAAGAGGGAAAGGGGGATGGGAGAA AAGCAAGCACTGGGATTTGGAGGCGGAAATCTGGAGAGTCTGAGCAAAGCCAGGTGCACC TTTGGTCCAGATGTCTGACTCAGGGAAGAAGATGGTAGGAAGAGACGTGGCAAATGAGGA GGAGGGGCCTGAACCACAGGGATACTGGCCTCTGCCAGGCAGAATGAGGGAGTCAGGCCC TGCGCCTGTCTTTGGGATTGTGCAGGTGAGAAGAAACATTTGAGGAGTTGATGGGGCACA AATTAGGTATGGGGAAGGAGTTCCAGGGGGCAGAACCTTTGCCATCTCACAGAGGACAGG GGCAGCTTCTCTTCTTCCCTGGAGTAGGCCCTGCTGGGGGAAGCTGGGTGGAATGCCGTG GGAGATGCTCCTGCTTTCTGGAAAGCCACAGGACACGGAGGAGCCAGTCCTGAGTTGGGT TTGTCGCAGCTTCCCATGCCAGCTGCCTTCCTTGAGACTGGAAAGGGCCTCTAGCACCCC TGGGGCCATTCAATTCAGGCCCAGGCGCCCAACCTCAGTTGTTCACATTCCCCATGTGAT CTCCTGTTGCTGCTTCACCTTGGGACTGTCTCGGCTTTGGTGACCTTGTAGGAAACTGGA ACCCCAGCACCATTGTTTGGCTCCTGGAAGCCTTGGGGAGAGGAATTTCCCACAGGGCAG GGCCTGGGTCCTGATTCCCTGCCTCTTTACTCCCTATTCATCCCGGCTACACCCTTGGGC CCCCATCCTTGCTTGGCTCCAGTACTGGCTGGCACAGCTGTTGTGGTCATCCAGGGATGG CAGGGCACTGGGGAACAGAAGAGAGAGGTCACACAGTGCGGAACTGGGAGCAGGAGCTAG GACAAGGAAGGCTGGACTTGGGCCATGGACTCCCTTCCTGCAGACTTGGGAAGTGAGCAC ACTTGAGTGATTAGAGAAGGTGTCTTCGTTCTAAGGGCAGTGGAGGAGGCACCATTTTGG AGCCTGCATCATTCGTATTTGGGCTAGATTGAAAAATAGAGCTTTCTAAGTCCTCTGCAG AGAATGGGAGGCTCTCACAACTGGGAGAAGTATTGGCTCTTTTCCTGAGAATTTTGCCAA GGGTATGCTGTTACTGGGGCTGGTTTGGAAGGAGTATAGGGCATTATGTCTGTGAAGGCA GTGGCTGGGGTGGGGCCTTATCAGGCCCAAGGAGCATCTGGCCACATCTCAGAGTCCACA GATGAGGATCACGGATGTGTAGAGGAAACATCCTAGGCAGGCAATCATCTGACTGCTTTT TTGGGGCAGGTGATGCCCTGGGAAATTGGGAGGGAGGGAGAGAGGGAGGTAGGCTATTCT AGAAACTGGGAGAGCAGGTGAGGTAGGATTGGGAGGACCAGGGGTCAGGGTCCCCATTGG TCCCTAATTGAGAACGGAGAGAGCATTGGTCTAGGAGGCAGGCAGCTCGGTTATAAGACC TTGGGAACTCTTGATTTAGAATCCAAGATCCTTTTTAGATCTAGGATTTTATAAAATTAA GATATCCCCTAAGATCAAATGCAACGTGGAGTCCTGAATTGGATCCTAGAACAGAAGAAG GACATTTGTGGAAAAACTAGTGAAATCCAAATAAAGTCTGTAGTTTTGTTAATAGTAATG CACCAATGTCAGTTGCCTAGTTGTGACAAATATACCGTGGTTATGTAAGATGGTAACATT AGGGGGAACTGGAGAAGGGTAGATTGGAGCTCTCTGTACTATCTTTGCAACTTTTCTGGG AATCTAAAATTACTCCAAAATAAAAAAAAAATGTATTTAAAGTAAATATATTCCCTAAGA GTCCAGGAGGCAGGGGAGTTGTAGAAGCAGCTGAGTGGTTGGGTTCTGACAGATTTGGTT CCAACTCGGTCTCTGCTGCTCACCAGCTGTGTGACCTTGAGCAAGTGGCTTAGCCTTTCT GAGCCTGATTTCCTTATCTGTGGAGTGGGGAAGATGACAGCCACCTCGCAGGGCTGTGGA GGGTTAAACGAGGTGATGCATGGACAGCAGCCGCACTGACCTTGCTGGTGTGGGGCTCCT GCTTCTGTTCTTCCCGTGCAGCCTTGGGAATGTTGGAGGCCGTATCCAGGGACCCCTGGG CCTCCTGGGATGGCCTCTCTGGATCAGCCTTGGAAGGTTCCAGGCTGCCCTTAGGCTCCC ACATTCTTCCCCAGTCACGCTCTCCTCGCCCTGCCCACACCAGTCCTGTGACCCTTGCCT GAGTTGTGACTTCCCACCCCTCCCCGGCCTAGAGGAAAGCTGCCTGGCCCCTCAGTGGGA CTCCCGCCCACTGACCCTCTGTCCACCATACACAGACAGGGGCACTATCCACAAGGTGGT GGAACCGGGGGAGCAGGAGCACAGCTTCGCCTTCAACATCATGGAGATCCAGCCCTTCCG CCGCGCGGCTGCCATCCAGACCATGTCGCTGGATGCTGAGCGGGTGAGCCTTCCCCCACT GCGTCCCATGGGCTATGCAGTGACTGCAGCTGAGGACAGGGCTCCTTTGCATGTGATTTG TGTGTTCTTTTAAGAGCTTCTAGGCCTTAGGGCCTGGACATTTAGGACTGAGTGTGGGGT GGGGCCCGGGCCTGACCCAATCCTGCTGTCCTTCCAGAGGAAGCTGTATGTGAGCTCCCA GTGGGAGGTGAGCCAGGTGCCCCTGGACCTGTGTGAGGTCTATGGCGGGGGCTGCCACGG TTGCCTCATGTCCCGAGACCCCTACTGCGGCTGGGACCAGGGCCGCTGCATCTCCATCTA CAGCTCCGAACGGTACGTTGGCCGGGATCCCTCCGTCCCTGGGACAAGGTGGGCATGGGA CAGGGGGAGGTGTTGTCGGGCTGGAAGAGGTGGCGGTACTGGGCCTTTCTTGTGGGACCT CCTCTCTACTGGAACTGCACTAGGGGTAAGGATATGAGGGTCAGGTCTGCAGCCTTGTAT CTGCTGATCCTCTTTCGTCCTTCCCACTCCAGGTCAGTGCTGCAATCCATTAATCCAGCC GAGCCACACAAGGAGTGTCCCAACCCCAAACCAGGTACCTGATCTGGCCCTGCTGGCGGC TGTGGCCCAATGAGTGGGGTACTGCCCTGCCCTGATTGTCCTGGTCTGAGGGAAACATGG CCTTGTCCTGTGGGCCCCAGGTACATGGGGCAGGATACAGTCCTGCAGAGGGAGCCCTCT TGGTGGGATGAGCGAGACGGGAGAAAAAAGGAGGACGCTGAGGGCTGGGTTCCCCACGTT CATTCAGAAGCCTTGTCCTGGGATCCCAGTCGGTGGGGAGGACACATCCTCCCCTGGGAG CTCTTTGTCCCTCCTCACGGCTGCTTCCCCACTGCCTCCCCAGACAAGGCCCCACTGCAG AAGGTTTCCCTGGCCCCAAACTCTCGCTACTACCTGAGCTGCCCCATGGAATCCCGCCAC GCCACCTACTCATGGCGCCACAAGGAGAACGTGGAGCAGAGCTGCGAACCTGGTCACCAG AGCCCCAACTGCATCCTGTTCATCGAGAACCTCACGGCGCAGCAGTACGGCCACTACTTC TGCGAGGCCCAGGAGGGCTCCTACTTCCGCGAGGCTCAGCACTGGCAGCTGCTGCCCGAG GACGGCATCATGGCCGAGCACCTGCTGGGTCATGCCTGTGCCCTGGCCGCCTCCCTCTGG CTGGGGGTGCTGCCCACACTCACTCTTGGCTTGCTGGTCCACTAGGGCCTCCCGAGGCTG GGCATGCCTCAGGCTTCTGCAGCCCAGGGCACTAGAACGTCTCACACTCAGAGCCGGCTG GCCCGGGAGCTCCTTGCCTGCCACTTCTTCCAGGGGACAGAATAACCCAGTGGAGGATGC CAGGCCTGGAGACGTCCAGCCGCAGGCGGCTGCTGGGCCCCAGGTGGCGCACGGATGGTG AGGGGCTGAGAATGAGGGCACCGACTGTGAAGCTGGGGCATCGATGACCCAAGACTTTAT CTTCTGGAAAATATTTTTCAGACTCCTCAAACTTGACTAAATGCAGCGATGCTCCCAGCC CAAGAGCCCATGGGTCGGGGAGTGGGTTTGGATAGGAGAGCTGGGACTCCATCTCGACCC TGGGGCTGAGGCCTGAGTCCTTCTGGACTCTTGGTACCCACATTGCCTCCTTCCCCTCCC TCTCTCATGGCTGGGTGGCTGGTGTTCCTGAAGACCCAGGGCTACCCTCTGTCCAGCCCT GTCCTCTGCAGCTCCCTCTCTGGTCCTGGGTCCCACAGGACAGCCGCCTTGCATGTTTAT TGAAGGATGTTTGCTTTCCGGACGGAAGGACGGAAAAAGCTCTGAAAAAAAAAAAAAAAA AAAAAAAA 表15:pMelBacA-H-SEMAL的核苷酸序列(6622bp)(SEQ ID NO.:42)   1  GATATCATGG AGATAATTAA AATGATAACC ATCTCGCAAA TAAATAAGTA  51  TTTTACTGTT TTCGTAACAG TTTTGTAATA AAAAAACCTA TAAATATGAA 101  ATTCTTAGTC AACGTTGCCC TTGTTTTTAT GGTCGTATAC ATTTCTTACA 151  TCTATGCGGA TCGATGG                          gga  tccgcccagg gccacctaag gagcggaccc 201  cgcatcttcg ccgtctggaa aggccatgta gggcaggacc gggtggactt 251  tggccagact gagccgcaca cggtgctttt ccacgagcca ggcagctcct 301  ctgtgtgggt gggaggacgt ggcaaggtct acctctttga cttccccgag 351  ggcaagaacg catctgtgcg cacggtgaat atcggctcca caaaggggtc 401  ctgtctggat aagcgggact gcgagaacta catcactctc ctggagaggc 451  ggagtgaggg gctgctggcc tgtggcacca acgcccggca ccccagctgc 501  tggaacctgg tgaatggcac tgtggtgcca cttggcgaga tgagaggcta 551  tgcccccttc agcccggacg agaactccct ggttctgttt gaaggggacg 601  aggtgtattc caccatccgg aagcaggaat acaatgggaa gatccctcgg 651  ttccgccgca tccggggcga gagtgagctg tacaccagtg atactgtcat 701  gcagaaccca cagttcatca aagccaccat cgtgcaccaa gaccaggctt 751  acgatgacaa gatctactac ttcttccgag aggacaatcc tgacaagaat 801  cctgaggctc ctctcaatgt gtcccgtgtg gcccagttgt gcagggggga 851  ccagggtggg gaaagttcac tgtcagtctc caagtggaac acttttctga 901  aagccatgct ggtatgcagt gatgctgcca ccaacaagaa cttcaacagg 951  ctgcaagacg tcttcctgct ccctgacccc agcggccagt ggagggacac 1001 cagggtctat ggtgttttct ccaacccctg gaactactca gccgtctgtg 1051 tgtattccct cggtgacatt gacaaggtct tccgtacctc ctcactcaag 1101 ggctaccact caagccttcc caacccgcgg cctggcaagt gcctcccaga 1151 ccagcagccg atacccacag agaccttcca ggtggctgac cgtcacccag 1201 aggtggcgca gagggtggag cccatggggc ctctgaagac gccattgttc 1251 cactctaaat accactacca gaaagtggcc gttcaccgca tgcaagccag 1301 ccacggggag acctttcatg tgctttacct aactacagac aggggcacta 1351 tccacaaggt ggtggaaccg ggggagcagg agcacagctt cgccttcaac 1401 atcatggaga tccagccctt ccgccgcgcg gctgccatcc agaccatgtc 1451 gctggatgct gagcggagga agctgtatgt gagctcccag tgggaggtga 1501 gccaggtgcc cctggacctg tgtgaggtct atggcggggg ctgccacggt 1551 tgcctcatgt cccgagaccc ctactgcggc tgggaccagg gccgctgcat 1601 ctccatctac agctccgaac ggtcagtgct gcaatccatt aatccagccg 1651 agccacacaa ggagtgtccc aaccccaaac cagacaaggc cccactgcag t701 aaggtttccc tggccccaaa ctctcgctac tacctgagct gccccatgga 1751 atcccgccac gccacctact catggcgcca caaggagaac gtggagcaga 1801 gctgcgaacc tggtcaccag agccccaact gcatcctgtt catcgagaac 1851 ctcacggcgc agcagtacgg ccactacttc tgcgaggccc aggagggctc 1901 ctacttccgc gaggctcagc actggcagct gctgcccgag gacggcatca 1951 tggccgagca cctgctgggt catgcctgtg ccctggctgc ctgaattc                                                           GA 2001 AGCTTGGAGT CGACTCTGCT GAAGAGGAGG AAATTCTCCT TGAAGTTTCC 2051 CTGGTGTTCA AAGTAAAGGA GTTTGCACCA GACGCACCTC TGTTCACTGG 2101 TCCGGCGTAT TAAAACACGA TACATTGTTA TTAGTACATT TATTAAGCGC 2151 TAGATTCTGT GCGTTGTTGA TTTACAGACA ATTGTTGTAC GTATTTTAAT 2201 AATTCATTAA ATTTATAATC TTTAGGGTGG TATGTTAGAG CGAAAATCAA 2251 ATGATTTTCA GCGTCTTTAT ATCTGAATTT AAATATTAAA TCCTCAATAG 2301 ATTTGTAAAA TAGGTTTCGA TTAGTTTCAA ACAAGGGTTG TTTTTCCGAA 2351 CCGATGGCTG GACTATCTAA TGGATTTTCG CTCAACGCCA CAAAACTTGC 2401 CAAATCTTGT AGCAGCAATC TAGCTTTGTC GATATTCGTT TGTGTTTTGT 2451 TTTGTAATAA AGGTTCGACG TCGTTCAAAA TATTATGCGC TTTTGTATTT 2501   CTTTCATCAC TGTCGTTAGT GTACAATTGA CTCGACGTAA ACACGTTAAA 2551   TAAAGCCTGG ACATATTTAA CATCGGGCGT GTTAGCTTTA TTAGGCCGAT 2601   TATCGTCGTC GTCCCAACCC TCGTCGTTAG AAGTTGCTTC CGAAGACGAT 2651   TTTGCCATAG CCACACGACG CCTATTAATT GTGTCGGCTA ACACGTCCGC 2701   GATCAAATTT GTAGTTGAGC TTTTTGGAAT TATTTCTGAT TGCGGGCGTT 2751   TTTGGGCGGG TTTCAATCTA ACTGTGCCCG ATTTTAATTC AGACAACACG 2801   TTAGAAAGCG ATGGTGCAGG CGGTGGTAAC ATTTCAGACG GCAAATCTAC 2851   TAATGGCGGC GGTGGTGGAG CTGATGATAA ATCTACCATC GTGGAGGCG 2901   CAGGCGGGGC TGGCGGCGGA GGCGGAGGCG GAGGTGGTGG GGTGATGCA 2951   GACGGCGGTT TAGGCTCAAA TTGTCTCTTT CAGGCAACAC AGTCGGCACC 3001   TCAACTATTG TACTGGTTTC GGGCGTATGG TGCACTCTCA GTACAATCTG 3051   CTCTGATGCC GCATAGTTAA GCCAGCCCCG ACACCCGCCA ACACCCGCTG 3101   ACGCGCCCTG ACGGGCTTGT CTGCTCCCGG CATCCGCTTA CAGACAAGCT 3151   GTGACCGTCT CCGGGAGCTG CATGTGTCAG AGGTTTTCAC CGTCATCACC 3201   GAAACGCGCG AGACGAAAGG GCCTCGTGAT ACGCCTATTT TTATAGGTTA 3251   ATGTCATGAT AATAATGGTT TCTTAGACGT CAGGTGGCAC TTTTCGGGGA 3301   AATGTGCGCG GAACCCCTAT TTGTTTATTT TTCTAAATAC ATTCAAATAT 3351   GTATCCGCTC ATGAGACAAT AACCCTGATA AATGCTTCAA TAATATTGAA 3401   AAAGGAAGAG TATGAGTATT CAACATTTCC GTGTCGCCCT TATTCCCTTT 3451   TTTGCGGCAT TTTGCCTTCC TGTTTTTGCT CACCCAGAAA CGCTGGTGAA 3501   AGTAAAAGAT GCTGAAGATC AGTTGGGTGC ACGAGTGGGT TACATCGAAC 3551   TGGATCTCAA CAGCGGTAAG ATCCTTGAGA GTTTTCGCCC CGAAGAACGT 3601   TTTCCAATGA TGAGCACTTT TAAAGTTCTG CTATGTGGCG CGGTATTATC 3651   CCGTATTGAC GCCGGGCAAG AGCAACTCGG TCGCCGCATA CACTATTCTC 3701   AGAATGACTT GGTTGAGTAC TCACCAGTCA CAGAAAAGCA TCTTACGGAT 3751   GGCATGACAG TAAGAGAATT ATGCAGTGCT GCCATAACCA TGAGTGATAA 3801   CACTGCGGCC AACTTACTTC TGACAACGAT CGGAGGACCG AAGGAGCTAA 3851   CCGCTTTTTT GCACAACATG GGGGATCATG TAACTCGCCT TGATCGTTGG 3901   GAACCGGAGC TGAATGAAGC CATACCAAAC GACGAGCGTG ACACCACGAT 3951   GCCTGTAGCA ATGGCAACAA CGTTGCGCAA ACTATTAACT GGCGAACTAC 4001   TTACTCTAGC TTCCCGGCAA CAATTAATAG ACTGGATGGA GGCGGATAAA 4051   GTTGCAGGAC CACTTCTGCG CTCGGCCCTT CCGGCTGGCT GGTTTATTGC 4101   TGATAAATCT GGAGCCGGTG AGCGTGGGTC TCGCGGTATC ATTGCAGCAC 4151   TGGGGCCAGA TGGTAAGCCC TCCCGTATCG TAGTTATCTA CACGACGGGG 4201   AGTCAGGCAA CTATGGATGA ACGAAATAGA CAGATCGCTG AGATAGGTGC 4251   CTCACTGATT AAGCATTGGT AACTGTCAGA CCAAGTTTAC TCATATATAC 4301   TTTAGATTGA TTTAAAACTT CATTTTTAAT TTAAAAGGAT CTAGGTGAAG 4351   ATCCTTTTTG ATAATCTCAT GACCAAAATC CCTTAACGTG AGTTTTCGTT 4401   CCACTGAGCG TCAGACCCCG TAGAAAAGAT CAAAGGATCT TCTTGAGATC 4451   CTTTTTTTCT GCGCGTAATC TGCTGCTTGC AAACAAAAAA ACCACCGCTA 4501   CCAGCGGTGG TTTGTTTGCC GGATCAAGAG CTACCAACTC TTTTTCCGAA 4551   GGTAACTGGC TTCAGCAGAG CGCAGATACC AAATACTGTT CTTCTAGTGT 4601   AGCCGTAGTT AGGCCACCAC TTCAAGAACT CTGTAGCACC GCCTACATAC 4651   CTCGCTCTGC TAATCCTGTT ACCAGTGGCT GCTGCCAGTG GCGATAAGTC 4701   GTGTCTTACC GGGTTGGACT CAAGACGATA GTTACCGGAT AAGGCGCAGC 4751   GGTCGGGCTG AACGGGGGGT TCGTGCACAC AGCCCAGCTT GGAGCGAACG 4801   ACCTACACCG AACTGAGATA CCTACAGCGT GAGCTATGAG AAAGCGCCAC 4851   GCTTCCCGAA GGGAGAAAGG CGGACAGGTA TCCGGTAAGC GGCAGGGTCG 4901   GAACAGGAGA GCGCACGAGG GAGCTTCCAG GGGGAAACGC CTGGTATCTT 4951   TATAGTCCTG TCGGGTTTCG CCACCTCTGA CTTGAGCGTC GATTTTTGTG 5001   ATGCTCGTCA GGGGGGCGGA GCCTATGGAA AAACGCCAGC AACGCGGCCT 5051   TTTTACGGTT CCTGGCCTTT TGCTGGCCTT TTGCTCACAT GTTCTTTCCT 5101   GCGTTATCCC CTGATTCTGT GGATAACCGT ATTACCGCCT TTGAGTGAGC 5151   TGATACCGCT CGCCGCAGCC GAACGACCGA GCGCAGCGAG TCAGTGAGCG 5201   AGGAAGCATC CTGCACCATC GTCTGCTCAT CCATGACCTG ACCATGCAGA 5251   GGATGATGCT CGTGACGGTT AACGCCTCGA ATCAGCAACG GCTTGCCGTT 5301   CAGCAGCAGC AGACCATTTT CAATCCGCAC CTCGCGGAAA CCGACATCGC 5351   AGGCTTCTGC TTCAATCAGC GTGCCGTCGG CGGTGTGCAG TTCAACCACC 5401   GCACGATAGA GATTCGGGAT TTCGGCGCTC CACAGTTTCG GGTTTTCGAC 5451   GTTCAGACGT AGTGTGACGC GATCGGTATA ACCACCACGC TCATCGATAA 5501   TTTCACCGCC GAAAGGCGCG GTGCCGCTGG CGACCTGCGT TTCACCCTGC 5551   CATAAAGAAA CTGTTACCCG TAGGTAGTCA CGCAACTCGC CGCACATCTG 5601   AACTTCAGCC TCCAGTACAG CGCGGCTGAA ATCATCATTA AAGCGAGTGG 5651   CAACATGGAA ATCGCTGATT TGTGTAGTCG GTTTATGCAG CAACGAGACG 5701   TCACGGAAAA TGCCGCTCAT CCGCCACATA TCCTGATCTT CCAGATAACT 5751   GCCGTCACTC CAACGCAGCA CCATCACCGC GAGGCGGTTT TCTCCGGCGC 5801   GTAAAAATGC GCTCAGGTCA AATTCAGACG GCAAACGACT GTCCTGGCCG 5851   TAACCGACCC AGCGCCCGTT GCACCACAGA TGAAACGCCG AGTTAACGCC 5901   ATCAAAAATA ATTCGCGTCT GGCCTTCCTG TAGCCAGCTT TCATCAACAT 5951   TAAATGTGAG CGAGTAACAA CCCGTCGGAT TCTCCGTGGG AACAAACGGC 6001   GGATTGACCG TAATGGGATA GGTCACGTTG GTGTAGATGG GCGCATCGTA 6051   ACCGTGCATC TGCCAGTTTG AGGGGACGAC GACAGTATCG GCCTCAGGAA 6101   GATCGCACTC CAGCCAGCTT TCCGGCACCG CTTCTGGTGC CGGAAACCAG 6151   GCAAAGCGCC ATTCGCCATT CAGGCTGCGC AACTGTTGGG AAGGGCGATC 6201   GGTGCGGGCC TCTTCGCTAT TACGCCAGCT GGCGAAAGGG GGATGTGCTG 6251   CAAGGCGATT AAGTTGGGTA ACGCCAGGGT TTTCCCAGTC ACGACGTTGT 6301   AAAACGACGG GATCTATCAT TTTTAGCAGT GATTCTAATT GCAGCTGCTC 6351   TTTGATACAA CTAATTTTAC GACGACGATG CGAGCTTTTA TTCAACCGAG 6401   CGTGCATGTT TGCAATCGTG CAAGCGTTAT CAATTTTTCA TTATCGTATT 6451   GTTGCACATC AACAGGCTGG ACACCACGTT GAACTCGCCG CAGTTTTGCG 6501   GCAAGTTGGA CCCGCCGCGC ATCCAATGCA AACTTTCCGA CATTCTGTTG 6551   CCTACGAACG ATTGATTCTT TGTCCATTGA TCGAAGCGAG TGCCTTCGAC 6601   TTTTTCGTGT CCAGTGTGGC TT

               序列表

(1)一般信息:

 (ⅰ)申请人:

  (A)名称:Hoechst Marion Roussel Deutschland GmbH

  (B)街道:

  (C)城市:Frankfurt

  (D)州:

  (E)国家:德国

  (F)邮区代码(ZIP):69926

  (G)电话:069-305-7072

  (H)传真:069-35-7175

  (I)电传:

 (ⅱ)发明名称:人类信息素L和其它物种中相应的信息素

 (ⅲ)序列数:44

 (ⅳ)计算机可读形式:

  (A)介质类型:软盘

  (B)计算机:IBMPC兼容机

  (C)操作系统:PC-DOS/MS-DOS

  (D)软件:PatentIn Release#1.0,版本#1.25(EPO)

(2)SEQ ID NO:1的信息:

 (ⅰ)序列特征:

  (A)长度:2636个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..2636

 (ⅹⅰ)序列描述:SEQ ID NO:1: CGGGGCCACG GGATGACGCC TCCTCCGCCC GGACGTGCCG CCCCCAGCGC ACCGCGCGCC        60 CGCGTCCCTG GCCCGCCGGC TCGGTTGGGG CTTCCGCTGC GGCTGCCGCT GCTGCTGCTG       120 CTCTGGGCGG CCGCCGCCTC CGCCCAGGGC CACCTAAGGA GCGGACCCCG CATCTTCGCC       180 GTCTGGAAAG GCCATGTAGG GCAGGACCGG GTGGACTTTG GCCAGACTGA GCCGCACACG       240 GTGCTTTTCC ACGAGCCAGG CAGCTCCTCT GTGTGGGTGG GAGGACGTGG CAAGGTCTAC       300 CTCTTTGACT TCCCCGAGGG CAAGAACGCA TCTGTGCGCA CGGTGAATAT CGGCTCCACA       360 AAGGGGTCCT GTCTGGATAA GCGGGACTGC GAGAACTACA TCACTCTCCT GGAGAGGCGG       420 AGTGAGGGGC TGCTGGCCTG TGGCACCAAC GCCCGGCACC CCAGCTGCTG GAACCTGGTG       480 AATGGCACTG TGGTGCCACT TGGCGAGATG AGAGGCTACG CCCCCTTCAG CCCGGACGAG       540 AACTCCCTGG TTCTGTTTGA AGGGGACGAG GTGTATTCCA CCATCCGGAA GCAGGAATAC       600 AATGGGAAGA TCCCTCGGTT CCGCCGCATC CGGGGCGAGA GTGAGCTGTA CACCAGTGAT       660 ACTGTCATGC AGAACCCACA GTTCATCAAA GCCACCATCG TGCACCAAGA CCAGGCTTAC       720 GATGACAAGA TCTACTACTT CTTCCGAGAG GACAATCCTG ACAAGAATCC TGAGGCTCCT       780 CTCAATGTGT CCCGTGTGGC CCAGTTGTGC AGGGGGGACC AGGGTGGGGA AAGTTCACTG       840 TCAGTCTCCA AGTGGAACAC TTTTCTGAAA GCCATGCTGG TATGCAGTGA TGCTGCCACC       900 AACAAGAACT TCAACAGGCT GCAAGACGTC TTCCTGCTCC CTGACCCCAG CGGCCAGTGG       960 AGGGACACCA GGGTCTATGG TGTTTTCTCC AACCCCTGGA ACTACTCAGC CGTCTGTGTG      1020 TATTCCCTCG GTGACATTGA CAAGGTCTTC CGTACCTCCT CACTCAAGGG CTACCACTCA      1080 AGCCTTCCCA ACCCGCGGCC TGGCAAGTGC CTCCCAGACC AGCAGCCGAT ACCCACAGAG      1140 ACCTTCCAGG TGGCTGACCG TCACCCAGAG GTGGCGCAGA GGGTGGAGCC CATGGGGCCT      1200 CTGAAGACGC CATTGTTCCA CTCTAAATAC CACTACCAGA AAGTGGCCGT TCACCGCATG      1260 CAAGCCAGCC ACGGGGAGAC CTTTCATGTG CTTTACCTAA CTACAGACAG GGGCACTATC      1320 CACAAGGTGG TGGAACCGGG GGAGCAGGAG CACAGCTTCG CCTTCAACAT CATGGAGATC      1380 CAGCCCTTCC GCCGCGCGGC TGCCATCCAG ACCATGTCGC TGGATGCTGA GCGGAGGAAG      1440 CTGTATGTGA GCTCCCAGTG GGAGGTGAGC CAGGTGCCCC TGGACCTGTG TGAGGTCTAT      1500 GGCGGGGGCT GCCACGGTTG CCTCATGTCC CGAGACCCCT ACTGCGGCTG GGACCAGGGC     1560 CGCTGCATCT CCATCTACAG CTCCGAACGG TCAGTGCTGC AATCCATTAA TCCAGCCGAG     1620 CCACACAAGG AGTGTCCCAA CCCCAAACCA GACAAGGCCC CACTGCAGAA GGTTTCCCTG     1680 GCCCCAAACT CTCGCTACTA CCTGAGCTGC CCCATGGAAT CCCGCCACGC CACCTACTCA     1740 TGGCGCCACA AGGAGAACGT GGAGCAGAGC TGCGAACCTG GTCACCAGAG CCCCAACTGC     1800 ATCCTGTTCA TCGAGAACCT CACGGCGCAG CAGTACGGCC ACTACTTCTG CGAGGCCCAG     1860 GAGGGCTCCT ACTTCCGCGA GGCTCAGCAC TGGCAGCTGC TGCCCGAGGA CGGCATCATG     1920 GCCGAGCACC TGCTGGGTCA TGCCTGTGCC CTGGCTGCCT CCCTCTGGCT GGGGGTGCTG     1980 CCCACACTCA CTCTTGGCTT GCTGGTCCAC TAGGGCCTCC CGAGGCTGGG CATGCCTCAG     2040 GCTTCTGCAG CCCAGGGCAC TAGAACGTCT CACACTCAGA GCCGGCTGGC CCGGGAGCTC     2100 CTTGCCTGCC ACTTCTTCCA GGGGACAGAA TAACCCAGTG GAGGATGCCA GGCCTGGAGA     2160 CGTCCAGCCG CAGGCGGCTG CTGGGCCCCA GGTGGCGCAC GGATGGTGAG GGGCTGAGAA     2220 TGAGGGCACC GACTGTGAAG CTGGGGCATC GATGACCCAA GACTTTATCT TCTGGAAAAT     2280 ATTTTTCAGA CTCCTCAAAC TTGACTAAAT GCAGCGATGC TCCCAGCCCA AGAGCCCATG     2340 GGTCGGGGAG TGGGTTTGGA TAGGAGAGCT GGGACTCCAT CTCGACCCTG GGGCTGAGGC     2400 CTGAGTCCTT CTGGACTCTT GGTACCCACA TTGCCTCCTT CCCCTCCCTC TCTCATGGCT     2460 GGGTGGCTGG TGTTCCTGAA GACCCAGGGC TACCCTCTGT CCAGCCCTGT CCTCTGCAGC     2520 TCCCTCTCTG GTCCTGGGTC CCACAGGACA GCCGCCTTGC ATGTTTATTG AAGGATGTTT     2580 GCTTTCCGGA CGGAAGGACG GAAAAAGCTC TGAAAAAAAA AAAAAAAAAA AAAAAA         2636

(2)SEQ ID NO:2的信息:

 (ⅰ)序列特征:

  (A)长度:1195个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..1195

 (ⅹⅰ)序列描述:SEQ ID NO:2: CGGGGCTGCG GGATGACGCC TCCTCCTCCC GGACGTGCCG CCCCCAGCGC ACCGCGCGCC       60 CGCGTCCTCA GCCTGCCGGC TCGGTTCGGG CTCCCGCTGC GGCTGCGGCT TCTGCTGGTG      120 TTCTGGGTGG CCGCCGCCTC CGCCCAAGGC CACTCGAGGA GCGGACCCCG CATCTCCGCC      180 GTCTGGAAAG GGCAGGACCA TGTGGACTTT AGCCAGCCTG AGCCACACAC CGTGCTTTTC      240 CATGAGCCGG GCAGCTTCTC TGTCTGGGTG GGTGGACGTG GCAAGGTCTA CCACTTCAAC      300 TTCCCCGAGG GCAAGAATGC CTCTGTGCGC ACGGTGAACA TCGGCTCCAC AAAGGGGTCC      360 TGTCAGGACA AACAGGACTG TGGGAATTAC ATCACTCTTC TAGAAAGGCG GGGTAATGGG      420 CTGCTGGTCT GTGGCACCAA TGCCCGGAAG CCCAGCTGCT GGAACTTGGT GAATGACAGT      480 GTGGTGATGT CACTTGGTGA GATGAAAGGC TATGCCCCCT TCAGCCCGGA TGAGAACTCC      540 CTGGTTCTGT TTGAAGGAGA TGAAGTGTAC TCTACCATCC GGAAGCAGGA ATACAACGGG      600 AAGATCCCTC GGTTTCGACG CATTCGGGGC GAGAGTGAAC TGTACACAAG TGATACAGTC      660 ATGCAGAACC CACAGTTCAT CAAGGCCACC ATTGTGCACC AAGACCAAGC CTATGATGAT      720 AAGATCTACT ACTTCTTCCG AGAAGACAAC CCTGACAAGA ACCCCGAGGC TCCTCTCAAT      780 GTGTCCCGAG TAGCCCAGTT GTGCAGGGGG GACCAGGGTG GTGAGAGTTC GTTGTCTGTC      840 TCCAAGTGGA ACACCTTCCT GAAAGCCATG TTGGTCTGCA GCGATGCAGC CACCAACAGG      900 AACTTCAATC GGCTGCAAGA TGTCTTCCTG CTCCCTGACC CCAGTGGCCA GTGGAGAGAT      960 ACCAGGGTCT ATGGCGTTTT CTCCAACCCC TGGAACTACT CAGCTGTCTG CGTGTATTCG     1020 CTTGGTGACA TTGACAGAGT CTTCCGTACC TCATCGCTCA AAGGCTACCA CATGGGCCTT     1080 TCCAACCCTC GACCTGGCAT GTGCCTCCCA AAAAAGCAGC CCATACCCAC AGAAACCTTC     1140 CAGGTAGCTG ATAGTCACCC AGAGGTGGCT CAGAGGGTGG AACCTATGGG GCCCC          1195

(2)SEQ ID NO:3的信息:

 (ⅰ)序列特征:

  (A)长度:666个氨基酸

  (B)类型:氨基酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:蛋白质

 (ⅸ)特征:

  (A)名称/关键词:蛋白质

  (B)位置:1..666

 (ⅸ)特征:

  (A)名称/关键词:蛋白质

  (B)位置:1..666

 (ⅹⅰ)序列描述:SEQ ID NO:3: Met Thr Pro Pro Pro Pro Gly Arg Ala Ala Pro Ser Ala Pro Arg Ala 1                5                   10                  15 Arg Val Pro Gly Pro Pro Ala Arg Leu Gly Leu Pro Leu Arg Leu Arg

         20                  25                  30 Leu Leu Leu Leu Leu Trp Ala Ala Ala Ala Ser Ala Gln Gly His Leu

     35                  40                  45 Arg Ser Gly Pro Arg Ile Phe Ala Val Trp Lys Gly His Val Gly Gln

 50                  55                  60 Asp Arg Val Asp Phe Gly Gln Thr Glu Pro His Thr Val Leu Phe His 65                  70                  75                  80 Glu Pro Gly Ser Ser Ser Val Trp Val Gly Gly Arg Gly Lys Val Tyr

            85                  90                  95 Leu Phe Asp Phe Pro Glu Gly Lys Asn Ala Ser Val Arg Thr Val Asn

        100                 105                 110 Ile Gly Ser Thr Lys Gly Ser Cys Leu Asp Lys Arg Asp Cys Glu Asn

    115                 120                 125 Tyr Ile Thr Leu Leu Glu Arg Arg Ser Glu Gly Leu Leu Ala Cys Gly

130                 135                 140 Thr Asn Ala Arg His Pro Ser Cys Trp Asn Leu Val Asn Gly Thr Val 145                 150                 155                 160 Val Pro Leu Gly Glu Met Arg Gly Tyr Ala Pro Phe Ser Pro Asp Glu

        165                     170                 175 Asn Ser Leu Val Leu Phe Glu Gly Asp Glu Val Tyr Ser Thr Ile Arg

        180                 185                 190 Lys Gln Glu Tyr Asn Gly Lys Ile Pro Arg Phe Arg Arg Ile Arg Gly

    195                 200                 205 Glu Ser Glu Leu Tyr Thr Ser Asp Thr Val Met Gln Asn Pro Gln Phe

210                 215                 220 Ile Lys Ala Thr Ile Val His Gln Asp Gln Ala Tyr Asp Asp Lys Ile 225                 230                 235                 240 Tyr Tyr Phe Phe Arg Glu Asp Asn Pro Asp Lys Asn Pro Glu Ala Pro

            245                 250                 255 Leu Asn Val Ser Arg Val Ala Gln Leu Cys Arg Gly Asp Gln Gly Gly

        260                 265                 270 Glu Ser Ser Leu Ser Val Ser Lys Trp Asn Thr Phe Leu Lys Ala Met

    275                 280                 285 Leu Val Cys Ser Asp Ala Ala Thr Asn Lys Asn Phe Asn Arg Leu Gln

290                 295                 300 Asp Val Phe Leu Leu Pro Asp Pro Ser Gly Gln Trp Arg Asp Thr Arg 305                 310                 315                 320 Val Tyr Gly Val Phe Ser Asn Pro Trp Asn Tyr Ser Ala Val Cys Val

            325                 330                 335 Tyr Ser Leu Gly Asp Ile Asp Lys Val Phe Arg Thr Ser Ser Leu Lys

        340                 345                 350 Gly Tyr His Ser Ser Leu Pro Asn Pro Arg Pro Gly Lys Cys Leu Pro

    355                 360                 365 Asp Gln Gln Pro Ile Pro Thr Glu Thr Phe Gln Val Ala Asp Arg His

370                 375                 380 Pro Glu Val Ala Gln Arg Val Glu Pro Mer Gly Pro Leu Lys Thr Pro 385                 390                 395                 400 Leu Phe His Ser Lys Tyr His Tyr Gln Lys Val Ala Val His Arg Met

            405                 410                 415 Gln Ala Ser His Gly Glu Thr Phe His Va1 Leu Tyr Leu Thr Thr Asp

        420                 425                 430 Arg Gly Thr Ile His Lys Val Val Glu Pro Gly Glu Gln Glu His Ser

    435                 440                 445 Phe Ala Phe Asn Ile Met Glu Ile Gln Pro Phe Arg Arg Ala Ala Ala

450                 455                 460 Ile Gln Thr Met Ser Leu Asp Ala Glu Arg Arg Lys Leu Tyr Val Ser 465                 470                 475                 480 Ser Gln Trp Glu Val Ser Gln Val Pro Leu Asp Leu Cys Glu Val Tyr

            485                 490                 495 Gly Gly Gly Cys His Gly Cys Leu Met Ser Arg Asp Pro Tyr Cys Gly

        500                 505                 510 Trp Asp Gln G1y Arg Cys Ile Ser Ile Tyr Ser Ser Glu Arg Ser Val

    515                 520                 525 Leu Gln Ser Ile Asn Pro Ala Glu Pro His Lys Glu Cys Pro Asn Pro

530                 535                 540 Lys Pro Asp Lys Ala Pro Leu Gln Lys Val Ser Leu Ala Pro Asn Ser 545                 550                 555                 560 Arg Tyr Tyr Leu Ser Cys Pro Met Glu Ser Arg His Ala Thr Tyr Ser

            565                570                 575 Trp Arg His Lys Glu Asn Val Glu Gln Ser Cys Glu Pro Gly His Gln

        580                 585                 590 Ser Pro Asn Cys Ile Leu Phe Ile Glu Asn Leu Thr Ala Gln Gln Tyr

    595                 600                 605 Gly His Tyr Phe Cys Glu Ala Gln Glu Gly Ser Tyr Phe Arg Glu Ala

610                 615                 620 Gln His Trp Gln Leu Leu Pro Glu Asp Gly Ile Met Ala Glu His Leu 625                 630                 635                 640 Leu Gly His Ala Cys Ala Leu Ala Ala Ser Leu Trp Leu Gly Val Leu

            645                 650                 655 Pro Thr Leu Thr Leu Gly Leu Leu Val His

        660                 665

(2)SEQ ID NO:4的信息:

 (ⅰ)序列特征:

  (A)长度:394个氨基酸

  (B)类型:氨基酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:蛋白质

 (ⅸ)特征:

  (A)名称/关键词:蛋白质

  (B)位置:1..394

 (ⅹⅰ)序列描述:SEQ ID NO:4: Met Thr Pro Pro Pro Pro Gly Arg Ala Ala Pro Ser Ala Pro Arg Ala 1               5                    10                  15 Arg Val Leu Ser Leu Pro Ala Arg Phe Gly Leu Pro Leu Arg Leu Arg

        20                  25                  30 Leu Leu Leu Val Phe Trp Val Ala Ala Ala Ser Ala Gln Gly His Ser

    35                  40                  45 Arg Ser Gly Pro Arg Ile Ser Ala Va1 Trp Lys Gly Gln Asp His Val

50                  55                  60 Asp Phe Ser Gln Pro Glu Pro His Thr Val Leu Phe His Glu Pro Gly 65                  70                  75                  80 Ser Phe Ser Val Trp Val Gly Gly Arg Gly Lys Val Tyr Hia Phe Asn

            85                  90                  95 Phe Pro Glu Gly Lys Asn Ala Ser Val Arg Thr Val Asn Ile Gly Ser

        100                 105                 110 Thr Lys Gly Ser Cys Gln Asp Lys Gln Asp Cys Gly Asn Tyr Ile Thr

    115                 120                 125 Leu Leu Glu Arg Arg Gly Asn Gly Leu Leu Val Cys Gly Thr Asn Ala

130                 135                 140 Arg Lys Pro Ser Cys Trp Asn Leu Val Asn Asp Ser Val Val Met Ser 145                 150                 155                 160 Leu Gly Glu Met Lys Gly Tyr Ala Pro Phe Ser Pro Asp Glu Asn Ser

            165                 170                 175 Leu Val Leu Phe Glu Gly Asp Glu Val Tyr Ser Thr Ile Arg Lys Gln

        180                 185                 190 Glu Tyr Asn Gly Lys Ile Pro Arg Phe Arg Arg Ile Arg Gly Glu Ser

    195                 200                 205 Glu Leu Tyr Thr Ser Asp Thr Val Met Gln Asn Pro Gln Phe Ile Lys

210                 215                 220 Ala Thr Ile Val His Gln Asp Gln Ala Tyr Asp Asp Lys Ile Tyr Tyr 225                 230                 235                 240 Phe Phe Arg Glu Asp Asn Pro Asp Lys Asn Pro Glu Ala Pro Leu Asn

            245                 250                 255 Val Ser Arg Val Ala Gln Leu Cys Arg Gly Asp Gln Gly Gly Glu Ser

        260                 265                 270 Ser Leu Ser Val Ser Lys Trp Asn Thr Phe Leu Lys Ala Met Leu Val

    275                 280                 285 Cys Ser Asp Ala Ala Thr Asn Arg Asn Phe Asn Arg Leu Gln Asp Val

290                 295                 300 Phe Leu Leu Pro Asp Pro Ser Gly Gln Trp Arg Asp Thr Arg Val Tyr 305                 310                 315                 320 Gly Val Phe Ser Asn Pro Trp Asn Tyr Ser Ala Val Cys Val Tyr Ser

            325                 330                 335 Leu Gly Asp Ile Asp Arg Val Phe Arg Thr Ser Ser Leu Lys Gly Tyr

        340                 345                 350 His Met Gly Leu Ser Asn Pro Arg Pro Gly Met Cys Leu Pro Lys Lys

    355                 360                 365 Gln Pro Ile Pro Thr Glu Thr Phe Gln Val Ala Asp Ser His Pro Glu

370                 375                 380 Val Ala Gln Arg Val Glu Pro Met Gly Pro 385                 390

(2)SEQ ID NO:5的信息:

 (ⅰ)序列特征:

  (A)长度:23个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..23

 (ⅹⅰ)序列描述:SEQ ID NO:5: ACTCACTATAGGGCTCGAGCGGC    23

(2)SEQ ID NO:6的信息:

 (ⅰ)序列特征:

  (A)长度:20个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..20

 (ⅹⅰ)序列描述:SEQ ID NO:6: AGCCGCACACGGTGCTTITC    20

(2)SEQ ID NO:7的信息:

 (ⅰ)序列特征:

  (A)长度:20个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..20

 (ⅹⅰ)序列描述:SEQ ID NO:7: GCACAGATGCGITCITGCCC    20

(2)SEQ ID NO:8的信息:

 (ⅰ)序列特征:

  (A)长度:20个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..20

 (ⅹⅰ)序列描述:SEQ ID NO:8: ACCATAGACCCTGGTGTCCC

(2)SEQ ID NO:9的信息:

 (ⅰ)序列特征:

  (A)长度:20个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..20

 (ⅹⅰ)序列描述:SEQ ID NO:9: GCAGTGATGCTGCCACCAAC    20

(2)SEQ ID NO:10的信息:

 (ⅰ)序列特征:

  (A)长度:20个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..20

 (ⅹⅰ)序列描述:SEQ ID NO:10: CCAGACCATGTCGCTGGATG    20

(2)SEQ ID NO:11的信息:

 (ⅰ)序列特征:

  (A)长度:20个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..20

 (ⅹⅰ)序列描述:SEQ ID NO:11: ACATGAGGCAACCGTGGGCAG    20

(2)SEQ ID NO:12的信息:

 (ⅰ)序列特征:

  (A)长度:27个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..27

 (ⅹⅰ)序列描述:SEQ ID NO:12: CCATCCTAATACGACTCACTATAGGGC    27

(2)SEQ ID NO:13的信息:

 (ⅰ)序列特征:

  (A)长度:20个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..20

 (ⅹⅰ)序列描述:SEQ ID NO:13: AGGTAGACCTTGCCACGTCC    20

(2)SEQ ID NO:14的信息:

 (ⅰ)序列特征:

  (A)长度:23个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..23

 (ⅹⅰ)序列描述:SEQ ID NO:14: GAACTTCAACAGGCTGCAAG ACG    23

(2)SEQ ID NO:15的信息:

 (ⅰ)序列特征:

  (A)长度:20个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..20

 (ⅹⅰ)序列描述:SEQ ID NO:15: ATGCTGAGCGGAGGAACGCTG    20

(2)SEQ ID NO:16的信息:

 (ⅰ)序列特征:

  (A)长度:20个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..20

 (ⅹⅰ)序列描述:SEQ ID NO:16: CCGCCATACACCTCACACAG    20

(2)SEQ ID NO:17的信息:

 (ⅰ)序列特征:

  (A)长度:28个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..28

 (ⅹⅰ)序列描述:SEQ ID NO:17: CTGGAAGCTTTCTGTGGGTATCGGCTGC    28

(2)SEQ ID NO:18的信息:

 (ⅰ)序列特征:

  (A)长度:25个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..25

 (ⅹⅰ)序列描述:SEQ ID NO:18: TTTGGATCCCTGGTTCTGTTTGAAG    25

(2)SEQ ID NO:19的信息:

 (ⅰ)序列特征:

  (A)长度:50个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..50

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..50

 (ⅹⅰ)序列描述:SEQ ID NO:19: TTCTAGAATT CAGCGGCCGC TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT 50

(2)SEQ ID NO:20的信息:

 (ⅸ)序列特征:

  (A)长度:27个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..27

 (ⅹⅰ)序列描述:SEQ ID NO:20: GGGGAAAGTTCACTGTCAGTCTCCAAG    27

(2)SEQ ID NO:21的信息:

 (ⅰ)序列特征:

  (A)长度:26个碱基对

  (8)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..26

 (ⅹⅰ)序列描述:SEQ ID NO:21: GGGAATACACACAGACGGCTGAGTAG    26

(2)SEQ ID NO:22的信息:

 (ⅰ)序列特征:

  (A)长度:22个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..22

 (ⅹⅰ)序列描述:SEQ ID NO:22: AGCAAGTTCAGCCTGGTTAAGT    22

(2)SEQ ID NO:23的信息:

 (ⅰ)序列特征:

  (A)长度:21个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..21

 (ⅹⅰ)序列描述:SEQ ID NO:23: TTATGAGTATTTCTTCCAGGG    21

(2)SEQ ID NO:24的信息:

 (ⅰ)序列特征:

  (A)长度:26个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..26

 (ⅹⅰ)序列描述:SEQ ID NO:24: CCAITAATCCAGCCGAGCCACACAAG    26

(2)SEQ ID NO:25的信息:

 (ⅰ)序列特征:

  (A)长度:25个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..25

 (ⅹⅰ)序列描述:SEQ ID NO:25: CATCTACAGCTCCGAACGGTCAGTG    25

(2)SEQ ID NO:26的信息:

 (ⅰ)序列特征:

  (A)长度:20个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..20

 (ⅹⅰ)序列描述:SEQ ID NO:26: CAGCGGAAGCCCCAACCGAG    20

(2)SEQ ID NO:27的信息:

 (ⅰ)序列特征:

  (A)长度:23个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..23

 (ⅹⅰ)序列描述:SEQ ID NO:27: GGGATGACGCCTCCTCCGCCCGG    23

(2)SEQ ID NO:28的信息:

 (ⅰ)序列特征:

  (A)长度:31个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..31

 (ⅹⅰ)序列描述:SEQ ID NO:28: AAGCTTCACGTGGACCAGCAAGCCAAGAGTG    31

(2)SEQ ID NO:29的信息:

 (ⅰ)序列特征:

  (A)长度:25个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..25

 (ⅹⅰ)序列描述:SEQ ID NO:29: AAGCTTTTTCCGTCCTTCCGTCCGG    25

(2)SEQ ID NO:30的信息:

 (ⅰ)序列特征:

  (A)长度:24个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..24

 (ⅹⅰ)序列描述:SEQ ID NO:30: ATGGTGAGCAAGGGCGAGGAGCTG    24

(2)SEQ ID NO:31的信息:

 (ⅰ)序列特征:

  (A)长度:24个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..24

 (ⅹⅰ)序列描述:SEQ ID NO:31: CITGTACAGCTCGTCCATGCCGAG    24

(2)SEQ ID NO:32的信息:

 (ⅰ)序列特征:

  (A)长度:25个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..25

 (ⅹⅰ)序列描述:SEQ ID NO:32: GGGTGGTGAGAGTTCGTTGTCTGTC    25

(2)SEQ ID NO::33的信息:

 (ⅰ)序列特征:    .

  (A)长度:25个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..25

 (ⅹⅰ)序列描述:SEQ ID NO:33: GAGCGATGAGGTACGGAAGACTCTG    25

(2)SEQ ID NO:34的信息:

 (ⅰ)序列特征:

  (A)长度:5856个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..5856

 (ⅹⅰ)序列描述:SEQ ID NO:34: AGCGCCCAAT ACGCAAACCG CCTCTCCCCG CGCGTTGGCC GATTCATTAA TGCAGCTGGC      60 ACGACAGGTT TCCCGACTGG AAAGCGGGCA GTGAGCGCAA CGCAATTAAT GTGAGTTAGC     120 TCACTCATTA GGCACCCCAG GCTTTACACT TTATGCTTCC GGCTCGTATG TTGTGTGGAA     180 TTGTGAGCGG ATAACAATTT CACACAGGAA ACAGCTATGA CCATGATTAC GCCAAGCTTC     240 ACGTGGACCA GCAAGCCAAG AGTGAGTGTG GGCAGCACCC CCAGCCAGAG GGAGGCAGCC     300 AGGGCACAGG CATGACCCAG CAGGTGCTCG GCCATGATGC CGTCCTCGGG CAGCAGCTGC     360 CAGTGCTGAG CCTCGCGGAA GTAGGAGCCC TCCTGGGCCT CGCAGAAGTA GTGGCCGTAC     420 TGCTGCGCCG TGAGGTTCTC GATGAACAGG ATGCAGTTGG GGCTCTGGTG ACCAGGTTCG     480 CAGCTCTGCT CCACGTTCTC CTTGTGGCGC CATGAGTAGG TGGCGTGGCG GGATTCCATG     540 GGGCAGCTCA GGTAGTAGCG AGAGTTTGGG GCCAGGGAAA CCTTCTGCAG TGGGGCCTTG     600 TCTGGTTTGG GGTTGGGACA CTCCTTGTGT GGCTCGGCTG GATTAATGGA TTGCAGCACT     660 GACCGTTCGG AGCTGTAGAT GGAGATGCAG CGGCCCTGGT CCCAGCCGCA GTAGGGGTCT     720 CGGGACATGA GGCAACCGTG GCAGCCCCCG CCATAGACCT CACACAGGTC CAGGGGCACC     780 TGGCTCACCT CCCACTGGGA GCTCACATAC AGCTTCCTCC GCTCAGCATC CAGCGACATG     840 GTCTGGATGG CAGCCGCGCG GCGGAAGGGC TGGATCTCCA TGATGTTGAA GGCGAAGCTG     900 TGCTCCTGCT CCCCCGGTTC CACCACCTTG TGGATAGTGC CCCTGTCTGT AGTTAGGTAA     960 AGCACATGAA AGGTCTCCCC GTGGCTGGCT TGCATGCGGT GAACGGCCAC TTTCTGGTAG    1020 TGGTATTTAG AGTGGAACAA TGGCGTCTTC AGAGGCCCCA TGGGCTCCAC CCTCTGCGCC    1080 ACCTCTGGGT GACGGTCAGC CACCTGGAAG GTCTCTGTGG GTATCGGCTG CTGGTCTGGG    1140 AGGCACTTGC CAGGCCGCGG GTTGGGAAGG CTTGAGTGGT AGCCCTTGAG TGAGGAGGTA    1200 CGGAAGACCT TGTCAATGTC ACCGAGGGAA TACACACAGA CGGCTGAGTA GTTCCAGGGG    1260 TTGGAGAAAA CACCATAGAC CCTGGTGTCC CTCCACTGGC CGCTGGGGTC AGGGAGCAGG    1320 AAGACGTCTT GCAGCCTGTT GAAGTTCTTG TTGGTGGCAG CATCACTGCA TACCAGCATG    1380 CCTTTCAGAA AAGTGTTCCA CTTGGAGACT GACAGTGAAC TTTCCCCACC CTGGTCCCCC    1440 CTGCACAACT GGGCCACACG GGACACATTG AGAGGAGCCT CAGGATTCTT GTCAGGATTG    1500 TCCTCTCGGA AGAAGTAGTA GATCTTGTCA TCGTAAGCCT GGTCTTGGTG CACGATGGTG    1560 GCTTTGATGA ACTGTGGGTT CTGCATGACA GTATCACTGG TGTACAGCTC ACTCTCGCCC    1620 CGGATGCGGC GGAACCGAGG GATGTTCCCA TTGTATTCCT GCTTCCGGAT GGTGGAATAC    1680 ACCTCGTCCC CTTCAAACAG AACCAGGGAG TTCTCGTCCG GGCTGAAGGG GGCGTAGCCT    1740 CTCATCTCGC CAAGTGGCAC CACAGTGCCA TTCACCAGGT TCCAGCAGCT GGGGTGCCGG    1800 GCGTTGGTGC CACAGGCCAG CAGCCCCTCA CTCCGCCTCT CCAGGAGAGT GATGTAGTTC    1860 TCGCAGTCCC GCTTATCCAG ACAGGACCCC TTTGTGGAGC CGATATTCAC CGTGCGCACA    1920 GATGCGTTCT TGCCCTCGGG GAAGTCAAAG AGGTAGACCT TGCCACGTCG TCCCACCCAC    1980 ACAGAGGAGC TGCCTGGCTC GTGGAAAAGC ACCGTGTGCG GCTCAGTCTG GCCAAAGTCC    2040 ACCCGGTCCT GCCCTACATG GCCTTTCCAG ACGGCGAAGA TGCGGGGTCC GCTCCTTAGG    2100 TGGCGCTGGG CGGAGGCGGC GGCCGCCCAG AGCAGCAGCA GCAGCCGCAG CCGCAGCGGA    2160 AGCCCCAACC GAGCCGGCGG GCCAGGGACG CGGGCGCGCG GTGCGCTGGG GGCGGCACGT    2220 CCGGGCGGAG GAGGCGTCAT CCCAAGCCGA ATTCTGCAGA TATCCATCAC ACTGGCGGCC    2280 GCTCGAGCAT GCATCTAGAG GGCCCAATTC GCCCTATAGT GAGTCGTATT ACAATTCACT    2340 GGCCGTCGTT TTACAACGTC GTGACTGGGA AAACCCTGGC GTTACCCAAC TAAATCGCCT    2400 TGCAGCACAT CCCCCTTTCG CCAGCTGGCG TAATAGCGAA GAGGCCCGCA CCGATCGCCC    2460 TTCCCAACAG TTGCGCAGCC TGAATGGCGA ATGGGACGCG CCCTGTAGCG GCGCATTAAG    2520 CGCGGCGGGT GTGGTGGTTA CGCGCAGCGT GACCGCTACA CTTGCGAGCG CCGTAGCGCC    2580 CGCTCCTTTC GCTTTCTTCC CTTCCTTTCT CGCCACGTTC GCCGGCTTTC CCCGTCAAGC    2640 TCTAAATCGG GGGCTCCCTT TAGGGTTCCG ATTTAGAGCT TTACGGCACC TCGACCGCAA    2700 AAAACTTGAT TTGGGTGATG GTTCACGTAG TGGGCCATCG CGCTGATAGA CGGTTTTTCG    2760 CCCTTTGAGG TTGGAGTCCA CGTTCTTTAA TAGTGGACTC TTGTTCCAAA CTGGAACAAC    2820 ACTCAACCCT ATCGCGGTCT ATTCTTTTGA TTTATAAGGG ATTTTGCCGA TTTCGGCCTA    2880 TTGGTTAAAA AATGAGCTGA TTTAACAAAT TCAGGGGGCA AGGGCTGCTA AAGGAACCGG    2940 AACACGTAGA AAGCCAGTCC GCAGAAACGG TGCTGAGCCC GGATGAATGT CAGCTACTGG    3000 GCTATCTGGA CAAGGGAAAA CGCAAGCGCA AAGAGAAAGC AGGTAGCTTG CAGTGGGCTT    3060 ACATGGCGAT AGCTAGACTG GGCGGTTTTA TGGACAGCAA GCGAACCGGA ATTGCCAGCT    3120 GGGGCGCCCT CTGGTAAGGT TGGGAAGCCC TGCAAAGTAA ACTGGATGGC TTTCTTGCCG    3180 CCAAGGATCT GATGGCGCAG GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATCGTTT    3240 CGCATGATTG   AACAAGATGG   ATTGCACGCA   GGTTCTCCGG   CCGCTTGGGT   GGAGAGGCTA     3300 TTCGGCTATG   ACTGGGCACA   ACAGACAATC   GGCTGCTCTG   ATGCCGCCGT   GTTCCGGCTG     3360 TCAGCGCAGG   GGCGCCCGGT   TCTTTTTGTC   AAGACCGACC   TGTCCGGTGC   CCTGAATGAA     3420 CTGCAGGACG   AGGCAGCGCG   GCTATCGTGG   CTGGCCACGA   CGGGCGTTCC   TTGCGCAGCT     3480 GTGCTCGACG   TTGTCACTGA   AGCGGGAAGG   GACTGGCTGC   TATTGGGCGA   AGTGCCGGGG     3540 CAGGATCTCC   TGTCATCTCG   CCTTGCTCCT   GCCGAGAAAG   TATCCATCAT   GGCTGATGCA     3600 ATGCGGCGGC   TGCATACGCT   TGATCCGGCT   ACCTGCCCAT   TCGACCACCA   AGCGAAACAT     3660 CGCATCGAGC   GAGCACGTAC   TCGGATGGAA   GCCGGTCTTG   TCGATCAGGA   TGATCTGGAC     3720 GAAGAGCATC   AGGGGCTCGC   GCCAGCCGAA   CTGTTCGCCA   GGCTCAAGGC   GCGCATGCCC     3780 GACGGCGAGG   ATCTCGTCGT   GATCCATGGC   GATGCCTGCT   TGCCGAATAT   CATGGTGGAA     3840 AATGGCCGCT   TTTCTGGATT   CAACGACTGT   GGCCGGCTGG   GTGTGGCGGA   CCGCTATCAG     3900 GACATAGCGT   TGGATACCCG   TGATATTGCT   GAAGAGCTTG   GCGGCGAATG   GGCTGACCGC     3960 TTCCTCGTGC   TTTAcGGTAT   CGCCGCTCCC   GATTCGCAGC   GCATCGCCTT   CTATCGCCTT     4020 CTTGACGAGT   TCTTCTGAAT   TGAAAAAGGA   AGAGTATGAG   TATTCAACAT   TTCCGTGTCG     4080 CCCTTATTCC   CTTTTTTGCG   GCATTTTGCC   TTCCTGTTTT   TGCTCACCCA   GAAACGCTGG     4140 TGAAAGTAAA   AGATGCTGAA   GATCAGTTGG   GTGCACGAGT   GGGTTACATC   GAACTGGATC     4200 TCAACAGCGG   TAAGATCCTT   GAGAGTTTTC   GCCCCGAAGA   ACGTTTTCCA   ATGATGAGCA     4260 CTTTTAAAGT   TCTGCTATGT   CATACACTAT   TATCCCGTAT   TGACGCCGGG   CAAGAGCAAC     4320 TCGGTCGCCG   GGCGCGGTAT   TCTCAGAATG   ACTTGGTTGA   GTACTCACCA   GTCACAGAAA     4380 AGCATCTTAC   GGATGGCATG   ACAGTAAGAG   AATTATGCAG   TGCTGCCATA   ACCATGAGTG     4440 ATAACACTGC   GGCCAACTTA   CTTCTGACAA   CGATCGGAGG   ACCGAAGGAG   CTAACCGCTT     4500 TTTTGCACAA   CATGGGGGAT   CATGTAACTC   GCCTTGATCG   TTGGGAACCG   GAGCTGAATG     4560 AAGCCATACC   AAACGACGAG   AGTGACACCA   CGATGCCTGT   AGCAATGCCA   ACAACGTTGC     4620 GCAAACTATT   AACTGGCGAA   CTACTTACTC   TAGCTTCCCG   GCAACAATTA   ATAGACTGGA     4680 TGGAGGCGGA   TAAAGTTGCA   GGACCACTTC   TGCGCTCGGC   CCTTCCGGCT   GGCTGGTTTA     4740 TTGCTGATAA   ATCTGGAGCC   GGTGAGCGTG   GGTCTCGCGG   TATCATTGCA   GCACTGGGGC     4800 CAGATGGTAA   GCCCTCCCGT   ATCGTAGTTA   TCTACACGAC   GGGGAGTCAG   GCAACTATGG     4860 ATGAACGAAA   TAGACAGATC   GCTGAGATAG   GTGCCTCACT   GATTAAGCAT   TGGTAACTGT     4920 CAGACCAAGT   TTACTCATAT   ATACTTTAGA   TTGATTTAAA   ACTTCATTTT   TAATTTAAAA     4980 GGATCTAGGT   GAAGATCCTT   TTTGATAATC   TCATGACCAA   AATCCCTTAA   CGTGAGTTTT     5040 CGTTCCACTG   AGCGTCAGAC   CCCGTAGAAA   AGATCAAAGG   ATCTTCTTGA   GATCCTTTTT     5100 TTCTGCGCGT   AATCTGCTGC   TTGCAAACAA   AAAAACCACC   GCTACCAGCG   GTGGTTTGTT     5160 TGCCGGATCA   AGAGCTACCA   ACTCTTTTTC   CGAAGGTAAC   TGGCTTCAGC   AGAGCGCAGA     5220 TACCAAATAC   TGTCCTTCTA   GTGTAGCCGT   AGTTAGGCCA   CCACTTCAAG   AACTCTGTAG     5280 CACCGCCTAC   ATACCTCGCT   CTGCTAATCC   TGTTACCAGT   GGCTGCTGCC   AGTGGCGATA     5340 AGTCGTGTCT   TACCGGGTTG   GACTCAAGAC   GATAGTTACC   GGATAAGGCG   CAGCGGTCGG     5400 GCTGAACGGG   GGGTTCGTGC   ACACAGCCCA   GCTTGGAGCG   AACGACCTAC   ACCGAACTGA     5460 GATACCTACA   GCGTGAGCAT   TGAGAAAGCG   CCACGCTTCC   CGAAGGGAGA   AAGGCGGACA     5520 GGTATCCGGT   AAGCGGCAGG   GTCGGAACAG   GAGAGCGCAC   GAGGGAGCTT   CCAGGGGGAA     5580 ACGCCTGGTA   TCTTTATAGT   CCTGTCGGGT   TTCGCCACCT   CTGACTTGAG   CGTCGATTTT     5640 TGTGATGCTC   GTCACGGGGG   CGGAGCCTAT   GGAAAAACGC   CAGCAACGCG   GCCTTTTTAC     5700 GGTTCCTGGC   CTTTTGCTGG   CCTTTTGCTC   ACATGTTCTT   TCCTGCGTTA   TCCGCTGATT     5760 CTGTGGATAA   CCGTATTACC   GCCTTTGAGT   GAGCTGATAC   CGCTCGCCGC   AGCCGAACGA     5820 CCGAGCGCAG   CGAGTCAGTG   AGCGAGGAAG   CGGAAG                                   5856 (2)SEQ ID NO:35的信息:

(ⅰ)序列特征:

  (A)长度:7475个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

(ⅱ)分子类型:DNA(基因组的)

(ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..7475

(ⅹⅰ)序列描述:SEQ ID NO:35: GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC TGCTCTGATG      60 CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT GGAGGTCGCT GAGTAGTGCG     120 CGAGCAAAAT TTAAGCTACA ACAAGGCAAG GCTTGACCGA CAATTGCATG AAGAATCTGC     180 TTAGGGTTAG GCGTTTTGCG CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT     240 GATTATTGAC   TAGTTATTAA   TAGTAATCAA   TTACGGGGTC   ATTAGTTCAT   AGCCCATATA      300 TGGAGTTCCG   CGTTACATAA   CTTACGGTAA   ATGGCCCGCC   TGGCTGACCG   CCCAACGACC      360 CCCGCCCATT   GACGTCAATA   ATGACGTATG   TTCCCATAGT   AACGCCAATA   GGGACTTTCC      420 ATTGACGTCA   ATGGGTGGAC   TATTTACGGT   AAACTGCCCA   CTTGGCAGTA   CATCAAGTGT      480 ATCATATGCC   AAGTACGCCC   CCTATTGACG   TCAATGACGG   TAAATGGCCC   GCCTGGCATT      540 ATGCCCAGTA   CATGACCTTA   TGGGACTTTC   CTACTTGGCA   GTACATCTAC   GTATTAGTCA      600 TCGCTATTAC   CATGGTGATG   CGGTTTTGGC   AGTACATCAA   TGGGCGTGGA   TAGCGGTTTG      660 ACTCACGGGG   ATTTCCAAGT   CTCCACCCCA   TTGACGTCAA   TGGGAGTTTG   TTTTGGCACC      720 AAAATCAACG   GGACTTTCCA   AAATGTCGTA   ACAACTCCGC   CCCATTGACG   CAAATGGGCG      780 GTAGGCGTGT   ACGGTGGGAG   GTCTATATAA   GCAGAGCTCT   CTGGCTAACT   AGAGAACCCA      840 CTGCTTACTG   GCTTATCGAA   ATTAATACGA   CTCACTATAG   GGAGACCCAA   GCTGGCTAGC      900 GTTTAAACGG   GCCCTCTAGA   CTCGAGCGGC   CGCCACTGTG   CTGGATATCT   GCAGAATTCG      960 GCTTGGGATG   ACGCCTCCTC   CGCCCGGACG   TGCCGCCCCC   AGCGCACCGC   GCGCCCGCGT     1020 CCCTGGCCCG   CCGGCTCGGT   TGGGGCTTCC   GCTGCGGCTG   CGGCTGCTGC   TGCTGCTCTG     1080 GGCGGCCGCC   GCCTCCGCCC   AGGGCCACCT   AAGGAGCGGA   CCCCGCATCT   TCGCCGTCTG     1140 GAAAGGCCAT   GTAGGGCAGG   ACCGGGTGGA   CTTTGGCCAG   ACTGAGCCGC   ACACGGTGCT     1200 TTTCCACGAG   CCAGGCAGCT   CCTCTGTGTG   GGTGGGAGGA   CGTGGCAAGG   TCTACCTCTT     1260 TGACTTCCCC   GAGGGCAAGA   ACGCATCTGT   GCGCACGGTG   AATATCGGCT   CCACAAAGGG     1320 GTCCTGTCTG   GATAAGCGGG   ACTGCGAGAA   CTACATCACT   CTCCTGGAGA   GGCGGAGTGA     1380 GGGGCTGCTG   GCCTGTGGCA   CCAACGCCCG   GCACCCCAGC   TGCTGGAACC   TGGTGAATGG     1440 CACTGTGGTG   CCACTTGGCG   AGATGAGAGG   CTACGCCCCC   TTCAGCCCGG   ACGAGAACTC     1500 CCTGGTTCTG   TTTGAAGGGG   ACGAGGTGTA   TTCCACCATC   CGGAAGCAGG   AATACAATGG     1560 GAAGATCCCT   CGGTTCCGCC   GCATCCGGGG   CGAGAGTGAG   CTGTACACCA   GTGATACTGT     1620 CATGCAGAAC   CCACAGTTCA   TCAAAGCCAC   CATCGTGCAC   CAAGACCAGG   CTTACGATGA     1680 CAAGATCTAC   TACTTCTTCC   GAGAGGACAA   TCCTGACAAG   AATCCTGAGG   CTCCTCTCAA     1740 TGTGTCCCGT   GTGGCCCAGT   TGTGCAGGGG   GGACCAGGGT   GGGGAAAGTT   CACTGTCAGT     1800 CTCCAAGTGG   AACACTTTTC   TGAAAGCCAT   GCTGGTATGC   AGTGATGCTG   CCACCAACAA     1860 GAACTTCAAC   AGGCTGCAAG   ACGTCTTCCT   GCTCCCTGAC   CCCAGCGGCC   AGTGGAGGGA     1920 CACCAGGGTC   TATGGTGTTT   TCTCCAACCC   CTGGAACTAC   TCAGCCGTCT   GTGTGTATTC     1980 CCTCGGTGAC   ATTGACAAGG   TCTTCCGTAC   CTCCTCACTC   AAGGGCTACC   ACTCAAGCCT     2040 TCCCAACCCG   CGGCCTGGCA   AGTGCCTCCC   AGACCAGCAG   CCGATACCCA   CAGAGACCTT     2100 CCAGGTGGCT   GACCGTCACC   CAGAGGTGGC   GCAGAGGGTG   GAGCCCATGG   GGCCTCTGAA     2160 GACGCCATTG   TTCCACTCTA   AATACCACTA   CCAGAAAGTG   GCCGTTCACC   GCATGCAAGC     2220 CAGCCACGGG   GAGACCTTTC   ATGTGCTTTA   CCTAACTACA   GACAGGGGCA   CTATCCACAA     2280 GGTGGTGGAA   CCGGGGGAGC   AGGAGCACAG   CTTCGCCTTC   AACATCATGG   AGATCCAGCC     2340 CTTCCGCCGC   GCGGCTGCCA   TCCAGACCAT   GTCGCTGGAT   GCTGAGCGGA   GGAAGCTGTA     2400 TGTGAGCTCC   CAGTGGGAGG   TGAGCCAGGT   GCCCCTGGAC   CTGTGTGAGG   TCTATGGCGG     2460 GGGCTGCCAC   GGTTGCCTCA   TGTCCCGAGA   CCCCTACTGC   GGCTGGGACC   AGGGCCGCTG     2520 CATCTCCATC   TACAGCTCCG   AACGGTCAGT   GCTGCAATCC   ATTAATCCAG   CCGAGCCACA     2580 CAAGGAGTGT   CCCAACCCCA   AACCAGACAA   GGCCCCACTG   CAGAAGGTTT   CCCTGGCCCC     2640 AAACTCTCGC   TACTACCTGA   GCTGCCCCAT   GGAATCCCGC   CACGCCACCT   ACTCATGGCG     2700 CCACAAGGAG   AACGTGGAGC   AGAGCTGCGA   ACCTGGTCAC   CAGAGCCCCA   ACTGCATCCT     2760 GTTCATCGAG   AACCTCACGG   CGCAGCAGTA   CGGCCACTAC   TTCTGCGAGG   CCCAGGAGGG     2820 CTCCTACTTC   CGCGAGGCTC   AGCACTGGCA   GCTGCTGCCC   GAGGACGGCA   TCATGGCCGA     2880 GCACCTGCTG   GGTCATGCCT   GTGCCCTGGC   TGCCTCCCTC   TGGCTGGGGG   TGCTGCCCAC     2940 ACTCACTCTT   GGCTTGCTGG   TCCACGTGAA   GCTTGGGCCC   GAACAAAAAC   TCATCTCAGA     3000 AGAGGATCTG   AATAGCGCCG   TCGACCATCA   TCATCATCAT   CATTGAGTTT   AAACCGCTGA     3060 TCAGCCTCGA   CTGTGCCTTC   TAGTTGCCAG   CCATCTGTTG   TTTGCCCCTC   CCCCGTGCCT     3120 TCCTTGACCC   TGGAAGGTGC   CACTCCCACT   GTCCTTTCCT   AATAAAATGA   GGAAATTGCA     3180 TCGCATTGTC   TGAGTAGGTG   TCATTCTATT   CTGGGGGGTG   GGGTGGGGCA   GGACAGCAAG     3240 GGGGAGGATT   GGGAAGACAA   TAGCAGGCAT   GCTGGGGATG   CGGTGGGCTC   TATGGCTTCT     3300 GAGGCGGAAA   GAACCAGCTG   GGGCTCTAGG   GGGTATCCCC   ACGCGCCCTG   TAGCGGCGCA     3360 TTAAGCGCGG   CGGGTGTGGT   GGTTACGCGC   AGCGTGACCG   CTACACTTGC   CAGCGCCCTA     3420 GCGCCCGCTC   CTTTCGCTTT   CTTCCCTTCC   TTTCTCGCCA   CGTTCGCCGG   CTTTCCCCGT     3480 CAAGCTCTAA   ATCGGGGCAT   CCCTTTAGGG   TTCCGATTTA   GTGCTTTACG   GCACCTCGAC     3540 CCCAAAAAAC   TTGATTAGGG   TGATGGTTCA   CGTAGTGGGC   CATCGCCCTG   ATAGACGGTT     3600 TTTCGCCCTT   TGACGTTGGA   GTCCACGTTC   TTTAATAGTG   GACTCTTGTT   CCAAACTGGA     3660 ACAACACTCA   ACCCTATCTC   GGTCTATTCT   TTTGATTTAT   AAGGGATTTT   GGGGATTTCG     3720 GCCTATTGGT   TAAAAAATGA   GCTGATTTAA   CAAAAATTTA   ACGCGAATTA   ATTCTGTGGA     3780 ATGTGTGTCA   GTTAGGGTGT   GGAAAGTCCC   CAGGCTCCCC   AGGCAGGCAG   AAGTATGCAA     3840 AGCATGCATC   TCAATTAGTC   AGCAACCAGG   TGTGGAAAGT   CCCCAGGCTC   CCCAGCACGC     3900 AGAAGTATGC   AAAGCATGCA   TCTCAATTAG   TCAGCAACCA   TAGTCCCGCC   CCTAACTCCG     3960 CCCATCCCGC   CCCTAACTCC   GCCCAGTTCC   GCCCATTCTC   CGCCCCATGG   CTGACTAATT     4020 TTTTTTATTT   ATGCAGAGGC   CGAGGCCGCC   TCTGCCTCTG   AGCTATTCCA   GAAGTAGTGA     4080 GGAGGCTTTT   TTGGAGGCCT   AGGCTTTTGC   AAAAAGCTCC   CGGGAGCTTG   TATATCCATT     4140 TTCGGATCTG   ATCAAGAGAC   AGGATGAGGA   TCGTTTCGCA   TGATTGAACA   AGATGGATTG     4200 CACGCAGGTT   CTCCGGCCGC   TTGGGTGGAG   AGGCTATTCG   GCTATGACTG   GGCACAACAG     4260 ACAATCGGCT   GCTCTGATGC   CGCCGTGTTC   CGGCTGTCAG   CGCAGGGGCG   CCCGGTTCTT     4320 TTTGTCAAGA   CCGACCTGTC   CGGTGCCCTG   AATGAACTGC   AGGACGAGGC   AGCGCGGCTA     4380 TCGTGGCTGG   CCACGACGGG   CGTTCCTTGC   GCAGCTGTGC   TCGACGTTGT   CACTGAAGCG     4440 GGAAGGGACT   GGCTGCTATT   GGGCGAAGTG   CCGGGGCAGG   ATCTCCTGTC   ATCTCACCTT     4500 GCTCCTGCCG   AGAAAGTATC   CATCATGGCT   GATGCAATGC   GGCGGCTGCA   TACGCTTGAT     4560 CCGGCTACCT   GCCCATTCGA   CCACCAAGCG   AAACATCGCA   TCGAGCGAGC   ACGTACTCGG     4620 ATGGAAGCCG   GTCTTGTCGA   TCAGGATGAT   CTGGACGAAG   AGCATCAGGG   GCTCGCGCCA     4680 GCCGAACTGT   TCGCCAGGCT   CAAGGCGCGC   ATGCCCGACG   GCGAGGATCT   CGTCGTGACC     4740 CATGGCGATG   CCTGCTTGCC   GAATATCATG   GTGGAAAATG   GCCGCTTTTC   TGGATTCATC     4800 GACTGTGGCC   GGCTGGGTGT   GGCGGACCGC   TATCAGGACA   TAGCGTTGGC   TACCCGTGAT     4860 ATTGCTGAAG   AGCTTGGCGG   CGAATGGGCT   GACCGCTTCC   TCGTGCTTTA   CGGTATCGCC     4920 GCTCCCGATT   CGCAGCGCAT   CGCCTTCTAT   CGCCTTCTTG   ACGAGTTCTT   CTGAGCGGGA     4980 CTCTGGGGTT   CGAAATGACC   GACCAAGCGA   CGCCCAACCT   GCCATCACGA   GATTTCGATT     5040 CCACCGCCGC   CTTCTATGAA   AGGTTGGGCT   TCGGAATCGT   TTTCCGGGAC   GCCGGCTGGA     5100 TGATCCTCCA   GCGCGGGGAT   CTCATGCTGG   AGTTCTTCGC   CCACCCCAAC   TTGTTTATTG     5160 CAGCTTATAA   TGGTTACAAA   TAAAGCAATA   GCATCACAAA   TTTCACAAAT   AAAGCATTTT     5220 TTTCACTGCA   TTCTAGTTGT   GGTTTGTCCA   AACTCATCAA   TGTATCTTAT   CATGTCTGTA     5280 TACCGTCGAC   CTCTAGCTAG   AGCTTGGCGT   AATCATGGTC   ATAGCTGTTT   CCTGTGTGAA     5340 ATTGTTATCC   GCTCACAATT   CCACACAACA   TACGAGCCGG   AAGCATAAAG   TGTAAAGCCT     5400 GGGGTGCCTA   ATGAGTGAGC   TAACTCACAT   TAATTGCGTT   GCGCTCACTG   CCCGCTTTCC      5460 AGTCGGGAAA   CCTGTCGTGC   CAGCTGCATT   AATGAATCGG   CCAACGCGCG   GGGAGAGGCG      5520 GTTTGCGTAT   TGGGCGCTCT   TCCGCTTCCT   CGCTCACTGA   CTCGCTGCGC   TCGGTCGTTC      5580 GGCTGCGGCG   AGCGGTATCA   GCTCACTCAA   AGGCGGTAAT   ACGGTTATCC   ACAGAATCAG      5640 GGGATAACGC   AGGAAAGAAC   ATGTGAGCAA   AAGGCCAGCA   AAAGGCCAGG   AACCGTAAAA      5700 AGGCCGCGTT   GCTGGCGTTT   TTCCATAGGC   TCCGCCCCCC   TGACGAGCAT   CACAAAAATC      5760 GACGCTCAAG   TCAGAGGTGG   CGAAACCCGA   CAGGACTATA   AAGATACCAG   GCGTTTCCCC      5820 CTGGAAGCTC   CCTCGTGCGC   TCTCCTGTTC   CGACCCTGCC   GCTTACCGGA   TACCTGTCCG      5880 CCTTTCTCCC   TTCGGGAAGC   GTGGCGCTTT   CTCAATGCTC   ACGCTGTAGG   TATCTCAGTT      5940 CGGTGTAGGT   CGTTCGCTCC   AAGCTGGGCT   GTGTGCACGA   ACCCCCCGTT   CAGCCCGACC      6000 GCTGCGCCTT   ATCCGGTAAC   TATCGTCTTG   AGTCCAACCC   GGTAAGACAC   GACTTATCGC      6060 CACTGGCAGC   AGCCACTGGT   AACAGGATTA   GCAGAGCGAG   GTATGTAGGC   GGTGCTACAG      6120 AGTTCTTGAA   GTGGTGGCCT   AACTACGGCT   ACACTAGAAG   GACAGTATTT   GGTATCTGCG      6180 CTCTGCTGAA   GCCAGTTACC   TTCGGAAAAA   GAGTTGGTAG   CTCTTGATCC   GGCAAACAAA      6240 CCACCGCTGG   TAGCGGTGGT   TTTTTTGTTT   GCAAGCAGCA   GATTACGCGC   AGAAAAAAAG      6300 GATCTCAAGA   AGATCCTTTG   ATCTTTTCTA   CGGGGTCTGA   CGCTCAGTGG   AACGAAAACT      6360 CACGTTAAGG   GATTTTGGTC   ATGAGATTAT   CAAAAAGGAT   CTTCACCTAG   ATCCTTTTAA      6420 ATTAAAAATG   AAGTTTTAAA   TCAATCTAAA   GTATATATGA   GTAAACTTGG   TCTGACAGTT      6480 ACCAATGCTT   AATCAGTGAG   GCACCTATCT   CAGCGATCTG   TCTATTTCGT   TCATCCATAG      6540 TTGCCTGACT   CCCCGTCGTG   TAGATAACTA   CGATACGGGA   GGGCTTACCA   TCTGGCCCCA      6600 GTGCTGCAAT   GATACCGCGA   GACCCACGCT   CACCGGCTCC   AGATTTATCA   GCAATAAACC      6660 AGCCAGCCGG   AAGGGCCGAG   CGCAGAAGTG   GTCCTGCAAC   TTTATCCGCC   TCCATCCAGT      6720 CTATTAATTG   TTGCCGGGAA   GCTAGAGTAA   GTAGTTCGCC   AGTTAATAGT   TTGCGCAACG      6780 TTGTTGCCAT   TGCTACAGGC   ATCGTGGTGT   CACGCTCGTC   GTTTGGTATG   GCTTCATTCA      6840 GCTCCGGTTC   CCAACGATCA   AGGCGAGTTA   CATGATCCCC   CATGTTGTGC   AAAAAAGCGG      6900 TTAGCTCCTT   CGGTCCTCCG   ATCGTTGTCA   GAAGTAAGTT   GGCCGCAGTG   TTATCACTCA      6960 TGGTTATGGC   AGCACTGCAT   AATTCTCTTA   CTGTCATGCC   ATCCGTAAGA   TGCTTTTCTG      7020 TGACTGGTGA   GTACTCAACC   AAGTCATTCT   GAGAATAGTG   TATGCGGCGA   CCGAGTTGCT      7080 CTTGCCCGGC   GTCAATACGG   GATAATACCG   CGCCACATAG   CAGAACTTTA   AAAGTGCTCA      7140 TCATTGGAAA   ACGTTCTTCG   GGGCGAAAAC   TCTCAAGGAT   CTTACCGCTG   TTGAGATCCA      7200 GTTCGATGTA   ACCCACTCGT   GCACCCAACT   GATCTTCAGC   ATCTTTTACT   TTCACCAGCG      7260 TTTCTGGGTG   AGCAAAAACA   GGAAGGCAAA   ATGCCGCAAA   AAAGGGAATA   AGGGCGACAC      7320 GGAAATGTTG   AATACTCATA   CTCTTCCTTT   TTCAATATTA   TTGAAGCATT   TATCAGGGTT      7380 ATTGTCTCAT   GAGCGGATAC   ATATTTGAAT   GTATTTAGAA   AAATAAACAA   ATAGGGGTTC      7440 CGCGCACATT   TCCCCGAAAA   GTGCCACCTG   ACGTC                                     7475

(2)SEQ ID NO:36的信息:

 (ⅰ)序列特征:

  (A)长度:8192个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..8192

 (ⅹⅰ)序列描述:SEQ ID NO:36: GACGGATCGG   GAGATCTCCC   GATCCCCTAT   GGTCGACTCT   CAGTACAATC   TGCTCTGATG        60 CCGCATAGTT   AAGCCAGTAT   CTGCTCCCTG   CTTGTGTGTT   GGAGGTCGCT   GAGTAGTGCG       120 CGAGCAAAAT   TTAAGCTACA   ACAAGGCAAG   GCTTGACCGA   CAATTGCATG   AAGAATCTGC       180 TTAGGGTTAG   GCGTTTTGCG   CTGCTTCGCG   ATGTACGGGC   CAGATATACG   CGTTGACATT       240 GATTATTGAC   TAGTTATTAA   TAGTAATCAA   TTACGGGGTC   ATTAGTTCAT   AGCCCATATA       300 TGGAGTTCCG   CGTTACATAA   CTTACGGTAA   ATGGCCCGCC   TGGCTGACCG   CCCAACGACC       360 CCCGCCCATT   GACGTCAATA   ATGACGTATG   TTCCCATAGT   AACGCCAATA   GGGACTTTCC       420 ATTGACGTCA   ATGGGTGGAC   TATTTACGGT   AAACTGCCCA   CTTGGCAGTA   CATCAAGTGT       480 ATCATATGCC   AAGTACGCCC   CCTATTGACG   TCAATGACGG   TAAATGGCCC   GCCTGGCATT       540 ATGCCCAGTA   CATGACCTTA   TGGGACTTTC   CTACTTGGCA   GTACATCTAC   GTATTAGTCA       600 TCGCTATTAC   CATGGTGATG   CGGTTTTGGC   AGTACATCAA   TGGGCGTGGA   TAGCGGTTTG       660 ACTCACGGGG   ATTTCCAAGT   CTCCACCCCA   TTGACGTCAA   TGGGAGTTTG   TTTTGGCACC       720 AAAATCAACG   GGACTTTCCA   AAATGGTCGTA  ACAACTCCGC   CCCATTGACG   CAAATGGGCG       780 GTAGGCGTGT   ACGGTGGGAG   GTCTATATAA   GCAGAGCTCT   CTGGCTAACT   AGAGAACCCA       840 CTGCTTACTG   GCTTATCGAA   ATTAATACGA   CTCACTATAG   GGAGACCCAA   GCTGGCTAGC       900 GTTTAAACGG   GCCCTCTAGA   CTCGAGCGGC   CGCCACTGTG   CTGGATATCT   GCAGAATTCG       960 GCTTGGGATG   ACGCCTCCTC   CGCCCGGACG   TGCCGCCCCC   AGCGCACCGC   GCGCCCGCGT      1020 CCCTGGCCCG   CCGGCTCGGT   TGGGGCTTCC   GCTGCGGCTG   CGGCTGCTGC   TGCTGCTCTG      1080 GGCGGCCGCC   GCCTCCGCCC   AGGGCCACCT   AAGGAGCGGA   CCCCGCATCT   TCGCCGTCTG      1140 GAAAGGCCAT   GTAGGGCAGG   ACCGGGTGGA   CTTTGGCCAG   ACTGAGCCGC   ACACGGTGCT      1200 TTTCCACGAG   CCAGGCAGCT   CCTCTGTGTG   GGTGGGAGGA   CGTGGCAAGG   TCTACCTCTT      1260 TGACTTCCCC   GAGGGCAAGA   ACGCATCTGT   GCGCACGGTG   AATATCGGCT   CCACAAAGGG      1320 GTCCTGTCTG   GATAAGCGGG   ACTGCGAGAA   CTACATCACT   CTCCTGGAGA   GGCGGAGTGA      1380 GGGGCTGCTG   GCCTGTGGCA   CCAACGCCCG   GCACCCCAGC   TGCTGGAACC   TGGTGAATGG      1440 CACTGTGGTG   CCACTTGGCG   AGATGAGAGG   CTACGCCCCC   TTCAGCCCGG   ACGAGAACTC      1500 CCTGGTTCTG   TTTGAAGGGG   ACGAGGTGTA   TTCCACCATC   CGGAAGCAGG   AATACAATGG      1560 GAAGATCCCT   CGGTTCCGCC   GCATCCGGGG   CGAGAGTGAG   CTGTACACCA   GTGATACTGT      1620 CATGCAGAAC   CCACAGTTCA   TCAAAGCCAC   CATCGTGCAC   CAAGACCAGG   CTTACGATGA      1680 CAAGATCTAC   TACTTCTTCC   GAGAGGACAA   TCCTGACAAG   AATCCTGAGG   CTCCTCTCAA      1740 TGTGTCCCGT   GTGGCCCAGT   TGTGCAGGGG   GGACCAGGGT   GGGGAAAGTT   CACTGTCAGT      1800 CTCCAAGTGG   AACACTTTTC   TGAAAGCCAT   GCTGGTATGC   AGTGATGCTG   CCACCAACAA      1860 GAACTTCAAC   AGGCTGCAAG   ACGTCTTCCT   GCTCCCTGAC   CCCAGCGGCC   AGTGGAGGGA      1920 CACCAGGGTC   TATGGTGTTT   TCTCCAACCC   CTGGAACTAC   TCAGCCGTCT   GTGTGTATTC      1980 CCTCGGTGAC   ATTGACAAGG   TCTTCCGTAC   CTCCTCACTC   AAGGGCTACC   ACTCAAGCCT      2040 TCCCAACCCG   CGGCCTGGCA   AGTGCCTCCC   AGACCAGCAG   CCGATACCCA   CAGAGACCTT      2100 CCAGGTGGCT   GACCGTCACC   CAGAGGTGGC   GCAGAGGGTG   GAGCCCATGG   GGCCTCTGAA      2160 GACGCCATTG   TTCCACTCTA   AATACCACTA   CCAGAAAGTG   GCCGTTCACC   GCATGCAAGC      2220 CAGCCACGGG   GAGACCTTTC   ATGTGCTTTA   CCTAACTACA   GACAGGGGCA   CTATCCACAA      2280 GGTGGTGGAA   CCGGGGGAGC   AGGAGCACAG   CTTCGCCTTC   AACATCATGG   AGATCCAGCC      2340 CTTCCGCCGC   GCGGCTGCCA   TCCAGACCAT   GTCGCTGGAT   GCTGAGCGGA   GGAAGCTGTA      2400 TGTGAGCTCC   CAGTGGGAGG   TGAGCCAGGT   GCCCCTGGAC   CTGTGTGAGG   TCTATGGCGG      2460 GGGCTGCCAC GGTTGCCTCA  TGTCCCGAGA   CCCCTACTGC   GGCTGGGACC   AGGGCCGCTG     2520 CATCTCCATC TACAGCTCCG  AACGGTCAGT   GCTGCAATCC   ATTAATCCAG   CCGAGCCACA     2580 CAAGGAGTGT CCCAACCCCA  AACCAGACAA   GGCCCCACTG   CAGAAGGTTT   CCCTGGCCCC     2640 AAACTCTCGC TACTACCTGA  GCTGCCCCAT   GGAATCCCGC   CACGCCACCT   ACTCATGGCG     2700 CCACAAGGAG AACGTGGAGC  AGAGCTGCGA   ACCTGGTCAC   CAGAGCCCCA   ACTGCATCCT     2760 GTTCATCGAG AACCTCACGG  CGCAGCAGTA   CGGCCACTAC   TTCTGCGAGG   CCCAGGAGGG     2820 CTCCTACTTC CGCGAGGCTC  AGCACTGGCA   GCTGCTGCCC   GAGGACGGCA   TCATGGCCGA     2880 GCACCTGCTG GGTCATGCCT  GTGCCCTGGC   TGCCTCCCTC   TGGCTGGGGG   TGCTGCCCAC     2940 ACTCACTCTT GGCTTGCTGG  TCCACATGGT   GAGCAAGGGC   GAGGAGCTGT   TCACCGGGGT     3000 GGTGCCCATC CTGGTCGAGC  TGGACGGCGA   CGTAAACGGC   CACAAGTTCA   GCGTGTCCGG     3060 CGAGGGCGAG GGCGATGCCA  CCTACGGCAA   GCTGACCCTG   AAGTTCATCT   GCACCACCGG     3120 CAAGCTGCCC GTGCCCTGGC  CCACCCTCGT   GACCACCCTG   ACCTACGGCG   TGCAGTGCTT     3180 CAGCCGCTAC CCCGACCACA  TGAAGCAGCA   CGACTTCTTC   AAGTCCGCCA   TGCCCGAAGG     3240 CTACGTCCAG GAGCGCACCA  TCTTCTTCAA   GGACGACGGC   AACTACAAGA   CCCGCGCCGA     3300 GGTGAAGTTC GAGGGCGACA  CCCTGGTGAA   CCGCATCGAG   CTGAAGGGCA   TCGACTTCAA     3360 GGAGGACGGC AACATCCTGG  GGCACAAGCT   GGAGTACAAC   TACAACAGCC   ACAACGTCTA     3420 TATCATGGCC GACAAGCAGA  AGAACGGCAT   CAAGGTGAAC   TTCAAGATCC   GCCACAACAT     3480 CGAGGACGGC AGCGTGCAGC  TCGCCGACCA   CTACCAGCAG   AACACCCCCA   TCGGCGACGG     3540 CCCCGTGCTG CTGCCCGACA  ACCACTACCT   GAGCACCCAG   TCCGCCCTGA   GCAAAGACCC     3600 CAACGAGAAG CGCGATCACA  TGGTCCTGCT   GGAGTTCGTG   ACCGCCGCCG   GGATCACTCT     3660 CGGCATGGAC GAGCTGTACA  AGGTGAAGCT   TGGGCCCGAA   CAAAAACTCA   TCTCAGAAGA     3720 GGATCTGAAT AGCGCCGTCG  ACCATCATCA   TCATCATCAT   TGAGTTTAAA   CCGCTGATCA     3780 GCCTCGACTG TGCCTTCTAG  TTGCCAGCCA   TCTGTTGTTT   GCCCCTCCCC   CGTGCCTTCC     3840 TTGACCCTGG AAGGTGCCAC  TCCCACTGTC   CTTTCCTAAT   AAAATGAGGA   AATTGCATCG     3900 CATTGTCTGA GTAGGTGTCA  TTCTATTCTG   GGGGGTGGGG   TGGGGCAGGA   CAGCAAGGGG     3960 GAGGATTGGG AAGACAATAG  CAGGCATGCT   GGGGATGCGG   TGGGCTCTAT   GGCTTCTGAG     4020 GCGGAAAGAA CCAGCTGGGG  CTCTAGGGGG   TATCCCCACG   CGCCCTGTAG   CGGCGCATTA     4080 AGCGCGGCGG GTGTGGTGGT  TACGCGCAGC   GTGACCGCTA   CACTTGCCAG   CGCCCTAGCG     4140 CCCGCTCCTT TCGCTTTCTT  CCCTTCCTTT   CTCGCCACGT   TCGCCGGCTT   TCCCCGTCAA     4200 GCTCTAAATC   GGGGCATCCC   TTTAGGGTTC   CGATTTAGTG   CTTTACGGCA   CCTCGACCCC      4260 AAAAAACTTG   ATTAGGGTGA   TGGTTCACGT   AGTGGGCCAT   CGCCCTGATA   GACGGTTTTT      4320 CGCCCTTTGA   CGTTGGAGTC   CACGTTCTTT   AATAGTGGAC   TCTTGTTCCA   AACTGGAACA      4380 ACACTCAACC   CTATCTCGGT   CTATTCTTTT   GATTTATAAG   GGATTTTGGG   GATTTCGGCC      4440 TATTGGTTAA   AAAATGAGCT   GATTTAACAA   AAATTTAACG   CGAATTAATT   CTGTGGAATG      4500 TGTGTCAGTT   AGGGTGTGGA   AAGTCCCCAG   GCTCCCCAGG   CAGGCAGAAG   TATGCAAAGC      4560 ATGCATCTCA   ATTAGTCAGC   AACCAGGTGT   GGAAAGTCCC   CAGGCTCCCC   AGCAGGCAGA      4620 AGTATGCAAA   GCATGCATCT   CAATTAGTCA   GCAACCATAG   TCCCGCCCCT   AACTCCGCCC      4680 ATCCCGCCCC   TAACTCCGCC   CAGTTCCGCC   CATTCTCCGC   CCCATGGCTG   ACTAATTTTT      4740 TTTATTTATG   CAGAGGCCGA   GGCCGCCTCT   GCCTCTGAGC   TATTCCAGAA   GTAGTGAGGA      4800 GGCTTTTTTG   GAGGCCTAGG   CTTTTGCAAA   AAGCTCCCGG   GAGCTTGTAT   ATCCATTTTC      4860 GGATCTGATC   AAGAGACAGG   ATGAGGATCG   TTTCGCATGA   TTGAACAAGA   TGGATTGCAC      4920 GCAGGTTCTC   CGGCCGCTTG   GGTGGAGAGG   CTATTCGGCT   ATGACTGGGC   ACAACAGACA      4980 ATCGGCTGCT   CTGATGCCGC   CGTGTTCCGG   CTGTCAGCGC   AGGGGCGCCC   GGTTCTTTTT      5040 GTCAAGACCG   ACCTGTCCGG   TGCCCTGAAT   GAACTGCAGG   ACGAGGCAGC   GCGGCTATCG      5100 TGGCTGGCCA   CGACGGGCGT   TCCTTGCGCA   GCTGTGCTCG   ACGTTGTCAC   TGAAGCGGGA      5160 AGGGACTGGC   TGCTATTGGG   CGAAGTGCCG   GGGCAGGATC   TCCTGTCATC   TCACCTTGCT      5220 CCTGCCGAGA   AAGTATCCAT   CATGGCTGAT   GCAATGCGGC   GGCTGCATAC   GCTTGATCCG      5280 GCTACCTGCC   CATTCGACCA   CCAAGCGAAA   CATCGCATCG   AGCGAGCACG   TACTCGGATG      5340 GAAGCCGGTC   TTGTCGATCA   GGATGATCTG   GACGAAGAGC   ATCAGGGGCT   CGCGCCAGCC      5400 GAACTGTTCG   CCAGGCTCAA   GGCGCGCATG   CCCGACGGCG   AGGATCTCGT   CGTGACCCAT      5460 GGCGATGCCT   GCTTGCCGAA   TATCATGGTG   GAAAATGGCC   GCTTTTCTGG   ATTCATCGAC      5520 TGTGGCCGGC   TGGGTGTGGC   GGACCGCTAT   CAGGACATAG   CGTTGGCTAC   CCGTGATATT      5580 GCTGAAGAGC   TTGGCGGCGA   ATGGGCTGAC   CGCTTCCTCG   TGCTTTACGG   TATCGCCGCT      5640 CCCGATTCGC   AGCGCATCGC   CTTCTATCGC   CTTCTTGACG   AGTTCTTCTG   AGCGGGACTC      5700 TGGGGTTCGA   AATGACCGAC   CAAGCGACGC   CCAACCTGCC   ATCACGAGAT   TTCGATTCCA      5760 CCGCCGCCTT   CTATGAAAGG   TTGGGCTTCG   GAATCGTTTT   CCGGGACGCC   GGCTGGATGA      5820 TCCTCCAGCG   CGGGGATCTC   ATGCTGGAGT   TCTTCGCCCA   CCCCAACTTG   TTTATTGCAG      5880 CTTATAATGG   TTACAAATAA   AGCAATAGCA   TCACAAATTT   CACAAATAAA   GCATTTTTTT      5940 CACTGCATTC   TAGTTGTGGT   TTGTCCAAAC   TCATCAATGT   ATCTTATCAT   GTCTGTATAC      6000 CGTCGACCTC   TAGCTAGAGC   TTGGCGTAAT   CATGGTCATA   GCTGTTTCCT   GTGTGAAATT      6060 GTTATCCGCT   CACAATTCCA   CACAACATAC   GAGCCGGAAG   CATAAAGTGT   AAAGCCTGGG      6120 GTGCCTAATG   AGTGAGCTAA   CTCACATTAA   TTGCGTTGCG   CTCACTGCCC   GCTTTCCAGT      6180 CGGGAAACCT   GTCGTGCCAG   CTGCATTAAT   GAATCGGCCA   ACGCGCGGGG   AGAGGCGGTT      6240 TGCGTATTGG   GCGCTCTTCC   GCTTCCTCGC   TCACTGACTC   GCTGCGCTCG   GTCGTTCGGC      6300 TGCGGCGAGC   GGTATCAGCT   CACTCAAAGG   CGGTAATACG   GTTATCCACA   GAATCAGGGG      6360 ATAACGCAGG   AAAGAACATG   TGAGCAAAAG   GCCAGCAAAA   GGCCAGGAAC   CGTAAAAAGG      6420 CCGCGTTGCT   GGCGTTTTTC   CATAGGCTCC   GCCCCCCTGA   CGAGCATCAC   AAAAATCGAC      6480 GCTCAAGTCA   GAGGTGGCGA   AACCCGACAG   GACTATAAAG   ATACCAGGCG   TTTCCCCCTG      6540 GAAGCTCCCT   CGTGCGCTCT   CCTGTTCCGA   CCCTGCCGCT   TACCGGATAC   CTGTCCGCCT      6600 TTCTCCCTTC   GGGAAGCGTG   GCGCTTTCTC   AATGCTCACG   CTGTAGGTAT   CTCAGTTCGG      6660 TGTAGGTCGT   TCGCTCCAAG   CTGGGCTGTG   TGCACGAACC   CCCCGTTCAG   CCCGACCGCT      6720 GCGCCTTATC   CGGTAACTAT   CGTCTTGAGT   CCAACCCGGT   AAGACACGAC   TTATCGCCAC      6780 TGGCAGCAGC   CACTGGTAAC   AGGATTAGCA   GAGCGAGGTA   TGTAGGCGGT   GCTACAGAGT      6840 TCTTGAAGTG   GTGGCCTAAC   TACGGCTACA   CTAGAAGGAC   AGTATTTGGT   ATCTGCGCTC      6900 TGCTGAAGCC   AGTTACCTTC   GGAAAAAGAG   TTGGTAGCTC   TTGATCCGGC   AAACAAACCA      6960 CCGCTGGTAG   CGGTGGTTTT   TTTGTTTGCA   AGCAGCAGAT   TACGCGCAGA   AAAAAAGGAT      7020 CTCAAGAAGA   TCCTTTGATC   TTTTCTACGG   GGTCTGACGC   TCAGTGGAAC   GAAAACTCAC      7080 GTTAAGGGAT   TTTGGTCATG   AGATTATCAA   AAAGGATCTT   CACCTAGATC   CTTTTAAATT      7140 AAAAATGAAG   TTTTAAATCA   ATCTAAAGTA   TATATGAGTA   AACTTGGTCT   GACAGTTACC      7200 AATGCTTAAT   CAGTGAGGCA   CCTATCTCAG   CGATCTGTCT   ATTTCGTTCA   TCCATAGTTG      7260 CCTGACTCCC   CGTCGTGTAG   ATAACTACGA   TACGGGAGGG   CTTACCATCT   GGCCCCAGTG      7320 CTGCAATGAT   ACCGCGAGAC   CCACGCTCAC   CGGCTCCAGA   TTTATCAGCA   ATAAACCAGC      7380 CAGCCGGAAG   GGCCGAGCGC   AGAAGTGGTC   CTGCAACTTT   ATCCGCCTCC   ATCCAGTCTA      7440 TTAATTGTTG   CCGGGAAGCT   AGAGTAAGTA   GTTCGCCAGT   TAATAGTTTG   CGCAACGTTG      7500 TTGCCATTGC   TACAGGCATC   GTGGTGTCAC   GCTCGTCGTT   TGGTATGGCT   TCATTCAGCT      7560 CCGGTTCCCA   ACGATCAAGG   CGAGTTACAT   GATCCCCCAT   GTTGTGCAAA   AAAGCGGTTA      7620 AGATCTCGGC   CGCATATTAA   GTGCATTGTT   CTCGATACCG   CTAAGTGCAT   TGTTCTCGTT        60 AGCTCGATGG   ACAAGTGCAT   TGTTCTCTTG   CTGAAAGCTC   GATGGACAAG   TGCATTGTTC       120 TCTTGCTGAA   AGCTCGATGG   ACAAGTGCAT   TGTTCTCTTG   CTGAAAGCTC   AGTACCCGGG       180 AGTACCCTCG   ACCGCCGGAG   TATAAATAGA   GGCGCTTCGT   CTACGGAGCG   ACAATTCAAT       240 TCAAACAAGC   AAAGTGAACA   CGTCGCTAAG   CGAAAGCTAA   GCAAATAAAC   AAGCGCAGCT       300 GAACAAGCTA   AACAATCTGC   AGTAAAGTGC   AAGTTAAAGT   GAATCAATTA   AAAGTAACCA       360 GCAACCAAGT   AAATCAACTG   CAACTACTGA   AATCTGCCAA   GAAGTAATTA   TTGAATACAA       420 GAAGAGAACT   CTGAATACTT   TCAACAAGTT   ACCGAGAAAG   AAGAACTCAC   ACACAGCTAG       480 CGTTTAAACT   TAAGCTTGGT   ACCGAGCTCG   GATCCACTAG   TCCAGTGTGG   TGGAATTCGG       540

(2)SEQ ID NO:37的信息:

 (ⅰ)序列特征:

  (A)长度:7000个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..7000

 (ⅹⅰ)序列描述:SEQ ID NO:37: GCTCCTTCGG   TCCTCCGATC   GTTGTCAGAA   GTAAGTTGGC   CGCAGTGTTA   TCACTCATGG      7680 TTATGGCAGC   ACTGCATAAT   TCTCTTACTG   TCATGCCATC   CGTAAGATGC   TTTTCTGTGA      7740 CTGGTGAGTA   CTCAACCAAG   TCATTCTGAG   AATAGTGTAT   GCGGCGACCG   AGTTGCTCTT      7800 GCCCGGCGTC   AATACGGGAT   AATACCGCGC   CACATAGCAG   AACTTTAAAA   GTGCTCATCA      7860 TTGGAAAACG   TTCTTCGGGG   CGAAAACTCT   CAAGGATCTT   ACCGCTGTTG   AGATCCAGTT      7920 CGATGTAACC   CACTCGTGCA   CCCAACTGAT   CTTCAGCATC   TTTTACTTTC   ACCAGCGTTT      7980 CTGGGTGAGC   AAAAACAGGA   AGGCAAAATG   CCGCAAAAAA   GGGAATAAGG   GCGACACGGA      8040 AATGTTGAAT   ACTCATACTC   TTCCTTTTTC   AATATTATTG   AAGCATTTAT   CAGGGTTATT      8100 GTCTCATGAG   CGGATACATA   TTTGAATGTA   TTTAGAAAAA   TAAACAAATA   GGGGTTCCGC      8160 GCACATTTCC   CCGAAAAGTG   CCACCTGACG   TC                                        8192 CTTGGGATGA CGCCTCCTCC GCCCGGACGT GCCGCCCCCA GcGCAccGCG CGCCCGCGTC       600 CCTGGCCCGC CGGCTCGGTT GGGGCTTCCG CTGCGGCTGC GGCTGCTGCT GCTGCTCTGG       660 GCGGCCGCCG CCTCCGCCCA GGGCCACCTA AGGAGCGGAC CCCGCATCTT CGCCGTCTGG       720 AAAGGCCATG TAGGGCAGGA CCGGGTGGAC TTTGGCCAGA CTGAGCCGCA CACGGTGCTT       780 TTCCACGAGC CAGGCAGCTC CTCTGTGTGG GTGGGAGGAC GTGGCAAGGT CTACCTCTTT       840 GACTTCCCCG AGGGCAAGAA CGCATCTGTG CGCACGGTGA ATATCGGCTC CACAAAGGGG       900 TCCTGTCTGG ATAAGCGGGA CTGCGAGAAC TACATCACTC TCCTGGAGAG GCGGAGTGAG       960 GGGCTGCTGG CCTGTGGCAC CAACGCCCGG CACCCCAGCT GCTGGAACCT GGTGAATGGC      1020 ACTGTGGTGC CACTTGGCGA GATGAGAGGC TACGCCCCCT TCAGCCCGGA CGAGAACTCC      1080 CTGGTTCTGT TTGAAGGGGA CGAGGTGTAT TCCACCATCC GGAAGCAGGA ATACAATGGG      1140 AAGATCCCTC GGTTCCGCCG CATCCGGGGC GAGAGTGAGC TGTACACCAG TGATACTGTC      1200 ATGCAGAACC CACAGTTCAT CAAAGCCACC ATCGTGCACC AAGACCAGGC TTACGATGAC      1260 AAGATCTACT ACTTCTTCCG AGAGGACAAT CCTGACAAGA ATCCTGAGGC TCCTCTCAAT      1320 GTGTCCCGTG TGGCCCAGTT GTGCAGGGGG GACCAGGGTG GGGAAAGTTC ACTGTCAGTC      1380 TCCAAGTGGA ACACTTTTCT GAAAGCCATG CTGGTATGCA GTGATGCTGC CACCAACAAG      1440 AACTTCAACA GGCTGCAAGA CGTCTTCCTG CTCCCTGACC CCAGCGGCCA GTGGAGGGAC      1500 ACCAGGGTCT ATGGTGTTTT CTCCAACCCC TGGAACTACT CAGCCGTCTG TGTGTATTCC      1560 CTCGGTGACA TTGACAAGGT CTTCCGTACC TCCTCACTCA AGGGCTACCA CTCAAGCCTT      1620 CCCAACCCGC GGCCTGGCAA GTGCCTCCCA GACCAGCAGC CGATACCCAC AGAGACCTTC      1680 CAGGTGGCTG ACCGTCACCC AGAGGTGGCG CAGAGGGTGG AGCCCATGGG GCCTCTGAAG      1740 ACGCCATTGT TCCACTCTAA ATACCACTAC CAGAAAGTGG CCGTTCACCG CATGCAAGCC      1800 AGCCACGGGG AGACCTTTCA TGTGCTTTAC CTAACTACAG ACAGGGGCAC TATCCACAAG      1860 GTGGTGGAAC CGGGGGAGCA GGAGCACAGC TTCGCCTTCA ACATCATGGA GATCCAGCCC      1920 TTCCGCCGCG CGGCTGCCAT CCAGACCATG TCGCTGGATG CTGAGCGGAG GAAGCTGTAT      1980 GTGAGCTCCC AGTGGGAGGT GAGCCAGGTG CCCCTGGACC TGTGTGAGGT CTATGGCGGG      2040 GGCTGCCACG GTTGCCTCAT GTCCCGAGAC CCCTACTGCG GCTGGGACCA GGGCCGCTGC      2100 ATCTCCATCT ACAGCTCCGA ACGGTCAGTG CTGCAATCCA TTAATCCAGC CGAGCCACAC      2160 AAGGAGTGTC CCAACCCCAA ACCAGACAAG GCCCCACTGC AGAAGGTTTC CCTGGCCCCA      2220 AACTCTCGCT ACTACCTGAG CTGCCCCATG GAATCCCGCC ACGCCACCTA CTCATGGCGC      2280 CACAAGGAGA   ACGTGGAGCA   GAGCTGCGAA   CCTGGTCACC   AGAGCCCCAA   CTGCATCCTG      2340 TTCATCGAGA   ACCTCACGGC   GCAGCAGTAC   GGCCACTACT   TCTGCGAGGC   CCAGGAGGGC      2400 TCCTACTTCC   GCGAGGCTCA   GCACTGGCAG   CTGCTGCCCG   AGGACGGCAT   CATGGCCGAG      2460 CACCTGCTGG   GTCATGCCTG   TGCCCTGGCT   GCCTCCCTCT   GGCTGGGGGT   GCTGCCCACA      2520 CTCACTCTTG   GCTTGCTGGT   CCACGTGAAG   CTTGGGCCCG   TTTAAACCCG   CTGATCAGCC      2580 TCGACTGTGC   CTTCTAGTTG   CCAGCCATCT   GTTGTTTGCC   CCTCCCCCGT   GCCTTCCTTG      2640 ACCCTGGAAG   GTGCCACTCC   CACTGTCCTT   TCCTAATAAA   ATGAGGAAAT   TGCATCGCAT      2700 TGTCTGAGTA   GGTGTCATTC   TATTCTGGGG   GGTGGGGTGG   GGCAGGACAG   CAAGGGGGAG      2760 GATTGGGAAG   ACAATAGCAG   GCATGCTGGG   GATGCGGTGG   GCTCTATGGC   TTCTGAGGCG      2820 GAAAGAACCA   GCTGGGGCTC   TAGGGGGTAT   CCCCACGCGC   CCTGTAGCGG   CGCATTAAGC      2880 GCGGCGGGTG   TGGTGGTTAC   GCGCAGCGTG   ACCGCTACAC   TTGCCAGCGC   CCTAGCGCCC      2940 GCTCCTTTCG   CTTTCTTCCC   TTCCTTTCTC   GCCACGTTCG   CCGGCTTTCC   CCGTCAAGCT      3000 CTAAATCGGG   GCATCCCTTT   AGGGTTCCGA   TTTAGTGCTT   TACGGCACCT   CGACCCCAAA      3060 AAACTTGATT   AGGGTGATGG   TTCACGTAGT   GGGCCATCGC   CCTGATAGAC   GGTTTTTCGC      3120 CCTTTGACGT   TGGAGTCCAC   GTTCTTTAAT   AGTGGACTCT   TGTTCCAAAC   TGGAACAACA      3180 CTCAACCCTA   TCTCGGTCTA   TTCTTTTGAT   TTATAAGGGA   TTTTGGGGAT   TTCGGCCTAT      3240 TGGTTAAAAA   ATGAGCTGAT   TTAACAAAAA   TTTAACGCGA   ATTAATTCTG   TGGAATGTGT      3300 GTCAGTTAGG   GTGTGGAAAG   TCCCCAGGCT   CCCCAGGCAG   GCAGAAGTAT   GCAAAGCATG      3360 CATCTCAATT   AGTCAGCAAC   CAGGTGTGGA   AAGTCCCCAG   GCTCCCCAGC   AGGCAGAAGT      3420 ATGCAAAGCA   TGCATCTCAA   TTAGTCAGCA   ACCATAGTCC   CGCCCCTAAC   TCCGCCCATC      3480 CCGCCCCTAA   CTCCGCCCAG   TTCCGCCCAT   TCTCCGCCCC   ATGGCTGACT   AATTTTTTTT      3540 ATTTATGCAG   AGGCCGAGGC   CGCCTCTGCC   TCTGAGCTAT   TCCAGAAGTA   GTGAGGAGGC      3600 TTTTTTGGAG   GCCTAGGCTT   TTGCAAAAAG   CTCCCGGGAG   CTTGTATATC   CATTTTCGGA      3660 TCTGATCAAG   AGACAGGATG   AGGATCGTTT   CGCATGATTG   AACAAGATGG   ATTGCACGCA      3720 GGTTCTCCGG   CCGCTTGGGT   GGAGAGGCTA   TTCGGCTATG   ACTGGGCACA   ACAGACAATC      3780 GGCTGCTCTG   ATGCCGCCGT   GTTCCGGCTG   TCAGCGCAGG   GGCGCCCGGT   TCTTTTTGTC      3840 AAGACCGACC   TGTCCGGTGC   CCTGAATGAA   CTGCAGGACG   AGGCAGCGCG   GCTATCGTGG      3900 CTGGCCACGA   CGGGCGTTCC   TTGCGCAGCT   GTGCTCGACG   TTGTCACTGA   AGCGGGAAGG      3960 GACTGGCTGC   TATTGGGCGA   AGTGCCGGGG   CAGGATCTCC   TGTCATCTCA   CCTTGCTCCT      4020 GCCGAGAAAG   TATCCATCAT   GGCTGATGCA   ATGCGGCGGC   TGCATACGCT   TGATCCCGCT      4080 ACCTGCCCAT   TCGACCACCA   AGCGAAACAT   CGCATCGAGC   GAGCACGTAC   TCGGATGGAA      4140 GCCGGTCTTG   TCGATCAGGA   TGATCTGGAC   GAAGAGCATC   AGGGGCTCGC   GCCAGCCGAA      4200 CTGTTCGCCA   GGCTCAAGGC   GCGCATGCCC   GACGGCGAGG   ATCTCGTCGT   GACCCATGGC      4260 GATGCCTGCT   TGCCGAATAT   CATGGTGGAA   AATGGCCGCT   TTTCTGGATT   CATCGACTGT      4320 GGCCGGCTGG   GTGTGGCGGA   CCGCTATCAG   GACATAGCGT   TGGCTACCCG   TGATATTGCT      4380 GAAGAGCTTG   GCGGCGAATG   GGCTGACCGC   TTCCTCGTGC   TTTACGGTAT   CGCCGCTCCC      4440 GATTCGCAGC   GCATCGCCTT   CTATCGCCTT   CTTGACGAGT   TCTTCTGAGC   GGGACTCTGG      4500 GGTTCGAAAT   GACCGACCAA   GCGACGCCCA   ACCTGCCATC   ACGAGATTTC   GATTCCACCG      4560 CCGCCTTCTA   TGAAAGGTTG   GGCTTCGGAA   TCGTTTTCCG   GGACGCCGGC   TGGATGATCC      4620 TCCAGCGCGG   GGATCTCATG   CTGGAGTTCT   TCGCCCACCC   CAACTTGTTT   ATTGCAGCTT      4680 ATAATGGTTA   CAAATAAAGC   AATAGCATCA   CAAATTTCAC   AAATAAAGCA   TTTTTTTCAC      4740 TGCATTCTAG   TTGTGGTTTG   TCCAAACTCA   TCAATGTATC   TTATCATGTC   TGTATACCGT      4800 CGACCTCTAG   CTAGAGCTTG   GCGTAATCAT   GGTCATAGCT   GTTTCCTGTG   TGAAATTGTT      4860 ATCCGCTCAC   AATTCCACAC   AACATACGAG   CCGGAAGCAT   AAAGTGTAAA   GCCTGGGGTG      4920 CCTAATGAGT   GAGCTAACTC   ACATTAATTG   CGTTGCGCTC   ACTGCCCGCT   TTCCAGTCGG      4980 GAAACCTGTC   GTGCCAGCTG   CATTAATGAA   TCGGCCAACG   CGCGGGGAGA   GGCGGTTTGC      5040 GTATTGGGCG   CTCTTCCGCT   TCCTCGCTCA   CTGACTCGCT   GCGCTCGGTC   GTTCGGCTGC      5100 GGCGAGCGGT   ATCAGCTCAC   TCAAAGGCGG   TAATACGGTT   ATCCACAGAA   TCAGGGGATA      5160 ACGCAGGAAA   GAACATGTGA   GCAAAAGGCC   AGCAAAAGGC   CAGGAACCGT   AAAAAGGCCG      5220 CGTTGCTGGC   GTTTTTCCAT   AGGCTCCGCC   CCCCTGACGA   GCATCACAAA   AATCGACGCT      5280 CAAGTCAGAG   GTGGCGAAAC   CCGACAGGAC   TATAAAGATA   CCAGGCGTTT   CCCCCTGGAA      5340 GCTCCCTCGT   GCGCTCTCCT   GTTCCGACCC   TGCCGCTTAC   CGGATACCTG   TCCGCCTTTC      5400 TCCCTTCGGG   AAGCGTGGCG   CTTTCTCAAT   GCTCACGCTG   TAGGTATCTC   AGTTCGGTGT      5460 AGGTCGTTCG   CTCCAAGCTG   GGCTGTGTGC   ACGAACCCCC   CGTTCAGCCC   GACCGCTGCG      5520 CCTTATCCGG   TAACTATCGT   CTTGAGTCCA   ACCCGGTAAG   ACACGACTTA   TCGCCACTGG      5580 CAGCAGCCAC   TGGTAACAGG   ATTAGCAGAG   CGAGGTATGT   AGGCGGTGCT   ACAGAGTTCT      5640 TGAAGTGGTG   GCCTAACTAC   GGCTACACTA   GAAGGACAGT   ATTTGGTATC   TGCGCTCTGC      5700 TGAAGCCAGT   TACCTTCGGA   AAAAGAGTTG   GTAGCTCTTG   ATCCGGCAAA   CAAACCACCG            5760 CTGGTAGCGG   TGGTTTTTTT   GTTTGCAAGC   AGCAGATTAC   GCGCAGAAAA   AAAGGATCTC            5820 AAGAAGATCC   TTTGATCTTT   TCTACGGGGT   CTGACGCTCA   GTGGAACGAA   AACTCACGTT            5880 AAGGGATTTT   GGTCATGAGA   TTATCAAAAA   GGATCTTCAC   CTAGATCCTT   TTAAATTAAA            5940 AATGAAGTTT   TAAATCAATC   TAAAGTATAT   ATGAGTAAAC   TTGGTCTGAC   AGTTACCAAT            6000 GCTTAATCAG   TGAGGCACCT   ATCTCAGCGA   TCTGTCTATT   TCGTTCATCC   ATAGTTGCCT            6060 GACTCCCCGT   CGTGTAGATA   ACTACGATAC   GGGAGGGCTT   ACCATCTGGC   CCCAGTGCTG            6120 CAATGATACC   GCGAGACCCA   CGCTCACCGG   CTCCAGATTT   ATCAGCAATA   AACCAGCCAG            6180 CCGGAAGGGC   CGAGCGCAGA   AGTGGTCCTG   CAACTTTATC   CGCCTCCATC   CAGTCTATTA            6240 ATTGTTGCCG   GGAAGCTAGA   GTAAGTAGTT   CGCCAGTTAA   TAGTTTGCGC   AACGTTGTTG            6300 CCATTGCTAC   AGGCATCGTG   GTGTCACGCT   CGTCGTTTGG   TATGGCTTCA   TTCAGCTCCG            6360 GTTCCCAACG   ATCAAGGCGA   GTTACATGAT   CCCCCATGTT   GTGCAAAAAA   GCGGTTAGCT            6420 CCTTCGGTCC   TCCGATCGTT   GTCAGAAGTA   AGTTGGCCGC   AGTGTTATCA   CTCATGGTTA            6480 TGGCAGCACT   GCATAATTCT   CTTACTGTCA   TGCCATCCGT   AAGATGCTTT   TCTGTGACTG            6540 GTGAGTACTC   AACCAAGTCA   TTCTGAGAAT   AGTGTATGCG   GCGACCGAGT   TGCTCTTGCC            6600 CGGCGTCAAT   ACGGGATAAT   ACCGCGCCAC   ATAGCAGAAC   TTTAAAAGTG   CTCATCATTG            6660 GAAAACGTTC   TTCGGGGCGA   AAACTCTCAA   GGATCTTACC   GCTGTTGAGA   TCCAGTTCGA            6720 TGTAACCCAC   TCGTGCACCC   AACTGATCTT   CAGCATCTTT   TACTTTCACC   AGCGTTTCTG            6780 GGTGAGCAAA   AACAGGAAGG   CAAAATGCCG   CAAAAAAGGG   AATAAGGGCG   ACACGGAAAT            6840 GTTGAATACT   CATACTCTTC   CTTTTTCAAT   ATTATTGAAG   CATTTATCAG   GGTTATTGTC            6900 TCATGAGCGG   ATACATATTT   GAATGTATTT   AGAAAAATAA   ACAAATAGGG   GTTCCGCGCA            6960 CATTTCCCCG   AAAAGTGCCA   CCTGACGTCG   ACGGATCGGG                                      7000 (2)SEQ ID NO:38的信息:

(ⅰ)序列特征:

  (A)长度:7108个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

(ⅱ)分子类型:DNA(基因组的)

(ⅹⅰ)序列描述:SEQ ID NO:38: AGATCTCGGC   CGCATATTAA   GTGCATTGTT   CTCGATACCG   CTAAGTGCAT   TGTTCTCGTT                60 AGCTCGATGG   ACAAGTGCAT   TGTTCTCTTG   CTGAAAGCTC   GATGGACAAG   TGCATTGTTC               120 TCTTGCTGAA   AGCTCGATGG   ACAAGTGCAT   TGTTCTCTTG   CTGAAAGCTC   AGTACCCGGG               180 AGTACCCTCG   ACCGCCGGAG   TATAAATAGA   GGCGCTTCGT   CTACGGAGCG   ACAATTCAAT               240 TCAAACAAGC   AAAGTGAACA   CGTCGCTAAG   CGAAAGCTAA   GCAAATAAAC   AAGCGCAGCT               300 GAACAAGCTA   AACAATCTGC   AGTAAAGTGC   AAGTTAAAGT   GAATCAATTA   AAAGTAACCA               360 GCAACCAAGT   AAATCAACTG   CAACTACTGA   AATCTGCCAA   GAAGTAATTA   TTGAATACAA               420 GAAGAGAACT   CTGAATACTT   TCAACAAGTT   ACCGAGAAAG   AAGAACTCAC   ACACAGCTAG               480 CGTTTAAACT   TAAGCTTGGT   ACCGAGCTCG   GATCCACTAG   TCCAGTGTGG   TGGAATTCGG               540 CTTGGGATGA   CGCCTCCTCC   GCCCGGACGT   GCCGCCCCCA   GCGCACCGCG   CGCCCGCGTC               600 CCTGGCCCGC   CGGCTCGGTT   GGGGCTTCCG   CTGCGGCTGC   GGCTGCTGCT   GCTGCTCTGG               660 GCGGCCGCCG   CCTCCGCCCA   GGGCCACCTA   AGGAGCGGAC   CCCGCATCTT   CGCCGTCTGG               720 AAAGGCCATG   TAGGGCAGGA   CCGGGTGGAC   TTTGGCCAGA   CTGAGCCGCA   CACGGTGCTT               780 TTCCACGAGC   CAGGCAGCTC   CTCTGTGTGG   GTGGGAGGAC   GTGGCAAGGT   CTACCTCTTT               840 GACTTCCCCG   AGGGCAAGAA   CGCATCTGTG   CGCACGGTGA   ATATCGGCTC   CACAAAGGGG               900 TCCTGTCTGG   ATAAGCGGGA   CTGCGAGAAC   TACATCACTC   TCCTGGAGAG   GCGGAGTGAG               960 GGGCTGCTGG   CCTGTGGCAC   CAACGCCCGG   CACCCCAGCT   GCTGGAACCT   GGTGAATGGC              1020 ACTGTGGTGC   CACTTGGCGA   GATGAGAGGC   TACGCCCCCT   TCAGCCCGGA   CGAGAACTCC              1080 CTGGTTCTGT   TTGAAGGGGA   CGAGGTGTAT   TCCACCATCC   GGAAGCAGGA   ATACAATGGG              1140 AAGATCCCTC   GGTTCCGCCG   CATCCGGGGC   GAGAGTGAGC   TGTACACCAG   TGATACTGTC              1200 ATGCAGAACc   CACAGTTCAT   CAAAGCCACC   ATCGTGCACC   AAGACCAGGC   TTACGATGAC              1260 AAGATCTACT   ACTTCTTCCG   AGAGGACAAT   CCTGACAAGA   ATCCTGAGGC   TCCTCTCAAT              1320 GTGTCCCGTG   TGGCCCAGTT   GTGCAGGGGG   GACCAGGGTG   GGGAAAGTTC   ACTGTCAGTC              1380 TCCAAGTGGA   ACACTTTTCT   GAAAGCCATG   CTGGTATGCA   GTGATGCTGC   CACCAACAAG              1440 AACTTCAACA   GGCTGCAAGA   CGTCTTCCTG   CTCCCTGACC   CCAGCGGCCA   GTGGAGGGAC              1500 ACCAGGGTCT   ATGGTGTTTT   CTCCAACcCC   TGGAACTACT   CAGCCGTCTG   TGTGTATTCC              1560 CTCGGTGACA   TTGACAAGGT   CTTCCGTACC   TCCTCACTCA   AGGGCTACCA   CTCAAGCCTT              1620 CCCAACCCGC   GGCCTGGCAA   GTGCCTCCCA   GACCAGCAGC   CGATACCCAC   AGAGACCTTC              1680 CAGGTGGCTG   ACCGTCACCC   AGAGGTGGCG   CAGAGGGTGG   AGCCCATGGG   GCCTCTGAAG           1740 ACGCCATTGT   TCCACTCTAA   ATACCACTAC   CAGAAAGTGG   CCGTTCACCG   CATGCAAGCC           1800 AGCCACGGGG   AGACCTTTCA   TGTGCTTTAC   CTAACTACAG   ACAGGGGCAC   TATCCACAAG           1860 GTGGTGGAAC   CGGGGGAGCA   GGAGCACAGC   TTCGCCTTCA   ACATCATGGA   GATCCAGCCC           1920 TTCCGCCGCG   CGGCTGCCAT   CCAGACCATG   TCGCTGGATG   CTGAGCGGAG   GAAGCTGTAT           1980 GTGAGCTCCC   AGTGGGAGGT   GAGCCAGGTG   CCCCTGGACC   TGTGTGAGGT   CTATGGCGGG           2040 GGCTGCCACG   GTTGCCTCAT   GTCCCGAGAC   CCCTACTGCG   GCTGGGACCA   GGGCCGCTGC           2100 ATCTCCATCT   ACAGCTCCGA   ACGGTCAGTG   CTGCAATCCA   TTAATCCAGC   CGAGCCACAC           2160 AAGGAGTGTC   CCAACCCCAA   ACCAGACAAG   GCCCCACTGC   AGAAGGTTTC   CCTGGCCCCA           2220 AACTCTCGCT   ACTACCTGAG   CTGCCCCATG   GAATCCCGCC   ACGCCACCTA   CTCATGGCGC           2280 CACAAGGAGA   ACGTGGAGCA   GAGCTGCGAA   CCTGGTCACC   AGAGCCCCAA   CTGCATCCTG           2340 TTCATCGAGA   ACCTCACGGC   GCAGCAGTAC   GGCCACTACT   TCTGCGAGGC   CCAGGAGGGC           2400 TCCTACTTCC   GCGAGGCTCA   GCACTGGCAG   CTGCTGCCCG   AGGACGGCAT   CATGGCCGAG           2460 CACCTGCTGG   GTCATGCCTG   TGCCCTGGCT   GCCTCCCTCT   GGCTGGGGGT   GCTGCCCACA           2520 CTCACTCTTG   GCTTGCTGGT   CCACGTGAAG   CTTGGGCCCG   AACAAAAACT   CATCTCAGAA           2580 GAGGATCTGA   ATAGCGCCGT   CGACCATCAT   CATCATCATC   ATTGAGTTTA   TCCAGCACAG           2640 TGGCGGCCGC   TCGAGTCTAG   AGGGCCCGTT   TAAACCCGCT   GATCAGCCTC   GACTGTGCCT           2700 TCTAGTTGCC   AGCCATCTGT   TGTTTGCCCC   TCCCCCGTGC   CTTCCTTGAC   CCTGGAAGGT           2760 GCCACTCCCA   CTGTCCTTTC   CTAATAAAAT   GAGGAAATTG   CATCGCATTG   TCTGAGTAGG           2820 TGTCATTCTA   TTCTGGGGGG   TGGGGTGGGG   CAGGACAGCA   AGGGGGAGGA   TTGGGAAGAC           2880 AATAGCAGGC   ATGCTGGGGA   TGCGGTGGGC   TCTATGGCTT   CTGAGGCGGA   AAGAACCAGC           2940 TGGGGCTCTA   GGGGGTATCC   CCACGCGCCC   TGTAGCGGCG   CATTAAGCGC   GGCGGGTGTG           3000 GTGGTTACGC   GCAGCGTGAC   CGCTACACTT   GCCAGCGCCC   TAGCGCCCGC   TCCTTTCGCT           3060 TTCTTCCCTT   CCTTTCTCGC   CACGTTCGCC   GGCTTTCCCC   GTCAAGCTCT   AAATCGGGGC           3120 ATCCCTTTAG   GGTTCCGATT   TAGTGCTTTA   CGGCACCTCG   ACCCCAAAAA   ACTTGATTAG           3180 GGTGATGGTT   CACGTAGTGG   GCCATCGCCC   TGATAGACGG   TTTTTCGCCC   TTTGACGTTG           3240 GAGTCCACGT   TCTTTAATAG   TGGACTCTTG   TTCCAAACTG   GAACAACACT   CAACCCTATC           3300 TCGGTCTATT   CTTTTGATTT   ATAAGGGATT   TTGGGGATTT   CGGCCTATTG   GTTAAAAAAT           3360 GAGCTGATTT   AACAAAAATT   TAACGCGAAT   TAATTCTGTG   GAATGTGTGT   CAGTTAGGGT            3420 GTGGAAAGTC   CCCAGGCTCC   CCAGGCAGGC   AGAAGTATGC   AAAGCATGCA   TCTCAATTAG            3480 TCAGCAACCA   GGTGTGGAAA   GTCCCCAGGC   TCCCCAGCAG   GCAGAAGTAT   GCAAAGCATG            3540 CATCTCAATT   AGTCAGCAAC   CATAGTCCCG   CCCCTAACTC   CGCCCATCCC   GCCCCTAACT            3600 CCGCCCAGTT   CCGCCCATTC   TCCGCCCCAT   GGCTGACTAA   TTTTTTTTAT   TTATGCAGAG            3660 GCCGAGGCCG   CCTCTGCCTC   TGAGCTATTC   CAGAAGTAGT   GAGGAGGCTT   TTTTGGAGGC            3720 CTAGGCTTTT   GCAAAAAGCT   CCCGGGAGCT   TGTATATCCA   TTTTCGGATC   TGATCAAGAG            3780 ACAGGATGAG   GATCGTTTCG   CATGATTGAA   CAAGATGGAT   TGCACGCAGG   TTCTCCGGCC            3840 GCTTGGGTGG   AGAGGCTATT   CGGCTATGAC   TGGGCACAAC   AGACAATCGG   CTGCTCTGAT            3900 GCCGCCGTGT   TCCGGCTGTC   AGCGCAGGGG   CGCCCGGTTC   TTTTTGTCAA   GACCGACCTG            3960 TCCGGTGCCC   TGAATGAACT   GCAGGACGAG   GCAGCGCGGC   TATCGTGGCT   GGCCACGACG            4020 GGCGTTCCTT   GCGCAGCTGT   GCTCGACGTT   GTCACTGAAG   CGGGAAGGGA   CTGGCTGCTA            4080 TTGGGCGAAG   TGCCGGGGCA   GGATCTCCTG   TCATCTCACC   TTGCTCCTGC   CGAGAAAGTA            4140 TCCATCATGG   CTGATGCAAT   GCGGCGGCTG   CATACGCTTG   ATCCGGCTAC   CTGCCCATTC            4200 GACCACCAAG   CGAAACATCG   CATCGAGCGA   GCACGTACTC   GGATGGAAGC   CGGTCTTGTC            4260 GATCAGGATG   ATCTGGACGA   AGAGCATCAG   GGGCTCGCGC   CAGCCGAACT   GTTCGCCAGG            4320 CTCAAGGCGC   GCATGCCCGA   CGGCGAGGAT   CTCGTCGTGA   CCCATGGCGA   TGCCTGCTTG            4380 CCGAATATCA   TGGTGGAAAA   TGGCCGCTTT   TCTGGATTCA   TCGACTGTGG   CCGGCTGGGT            4440 GTGGCGGACC   GCTATCAGGA   CATAGCGTTG   GCTACCCGTG   ATATTGCTGA   AGAGCTTGGC            4500 GGCGAATGGG   CTGACCGCTT   CCTCGTGCTT   TACGGTATCG   CCGCTCCCGA   TTCGCAGCGC            4560 ATCGCCTTCT   ATCGCCTTCT   TGACGAGTTC   TTCTGAGCGG   GACTCTGGGG   TTCGAAATGA            4620 CCGACCAAGC   GACGCCCAAC   CTGCCATCAC   GAGATTTCGA   TTCCACCGCC   GCCTTCTATG            4680 AAAGGTTGGG   CTTCGGAATC   GTTTTCCGGG   ACGCCGGCTG   GATGATCCTC   CAGCGCGGGG            4740 ATCTCATGCT   GGAGTTCTTC   GCCCACCCCA   ACTTGTTTAT   TGCAGCTTAT   AATGGTTACA            4800 AATAAAGCAA   TAGCATCACA   AATTTCACAA   ATAAAGCATT   TTTTTCACTG   CATTCTAGTT            4860 GTGGTTTGTC   CAAACTCATC   AATGTATCTT   ATCATGTCTG   TATACCGTCG   ACCTCTAGCT            4920 AGAGCTTGGC   GTAATCATGG   TCATAGCTGT   TTCCTGTGTG   AAATTGTTAT   CCGCTCACAA            4980 TTCCACACAA   CATACGAGCC   GGAAGCATAA   AGTGTAAAGC   CTGGGGTGCC   TAATGAGTGA            5040 GCTAACTCAC   ATTAATTGCG   TTGCGCTCAC   TGCCCGCTTT   CCAGTCGGGA   AACCTGTCGT            5100 GCCAGCTGCA   TTAATGAATC   GGCCAACGCG   CGGGGAGAGG   CGGTTTGCGT   ATTGGGCGCT            5160 CTTCCGCTTC   CTCGCTCACT   GACTCGCTGC   GCTCGGTCGT   TCGGCTGCGG   CGAGCGGTAT            5220 CAGCTCACTC   AAAGGCGGTA   ATACGGTTAT   CCACAGAATC   AGGGGATAAC   GCAGGAAAGA            5280 ACATGTGAGC   AAAAGGCCAG   CAAAAGGCCA   GGAACCGTAA   AAAGGCCGCG   TTGCTGGCGT            5340 TTTTCCATAG   GCTCCGCCCC   CCTGACGAGC   ATCACAAAAA   TCGACGCTCA   AGTCAGAGGT            5400 GGCGAAACCC   GACAGGACTA   TAAAGATACC   AGGCGTTTCC   CCCTGGAAGC   TCCCTCGTGC            5460 GCTCTCCTGT   TCCGACCCTG   CCGCTTACCG   GATACCTGTC   CGCCTTTCTC   CCTTCGGGAA            5520 GCGTGGCGCT   TTCTCAATGC   TCACGCTGTA   GGTATCTCAG   TTCGGTGTAG   GTCGTTCGCT            5580 CCAAGCTGGG   CTGTGTGCAC   GAACCCCCCG   TTCAGCCCGA   CCGCTGCGCC   TTATCCGGTA            5640 ACTATCGTCT   TGAGTCCAAC   CCGGTAAGAC   ACGACTTATC   GCCACTGGCA   GCAGCCACTG            5700 GTAACAGGAT   TAGCAGAGCG   AGGTATGTAG   GCGGTGCTAC   AGAGTTCTTG   AAGTGGTGGC            5760 CTAACTACGG   CTACACTAGA   AGGACAGTAT   TTGGTATCTG   CGCTCTGCTG   AAGCCAGTTA            5820 CCTTCGGAAA   AAGAGTTGGT   AGCTCTTGAT   CCGGCAAACA   AACCACCGCT   GGTAGCGGTG            5880 GTTTTTTTGT   TTGCAAGCAG   CAGATTACGC   GCAGAAAAAA   AGGATCTCAA   GAAGATCCTT            5940 TGATCTTTTC   TACGGGGTCT   GACGCTCAGT   GGAACGAAAA   CTCACGTTAA   GGGATTTTGG            6000 TCATGAGATT   ATCAAAAAGG   ATCTTCACCT   AGATCCTTTT   AAATTAAAAA   TGAAGTTTTA            6060 AATCAATCTA   AAGTATATAT   GAGTAAACTT   GGTCTGACAG   TTACCAATGC   TTAATCAGTG            6120 AGGCACCTAT   CTCAGCGATC   TGTCTATTTC   GTTCATCCAT   AGTTGCCTGA   CTCCCCGTCG            6180 TGTAGATAAC   TACGATACGG   GAGGGCTTAC   CATCTGGCCC   CAGTGCTGCA   ATGATACCGC            6240 GAGACCCACG   CTCACCGGCT   CCAGATTTAT   CAGCAATAAA   CCAGCCAGCC   GGAAGGGCCG            6300 AGCGCAGAAG   TGGTCCTGCA   ACTTTATCCG   CCTCCATCCA   GTCTATTAAT   TGTTGCCGGG            6360 AAGCTAGAGT   AAGTAGTTCG   CCAGTTAATA   GTTTGCGCAA   CGTTGTTGCC   ATTGCTACAG            6420 GCATCGTGGT   GTCACGCTCG   TCGTTTGGTA   TGGCTTCATT   CAGCTCCGGT   TCCCAACGAT            6480 CAAGGCGAGT   TACATGATCC   CCCATGTTGT   GCAAAAAAGC   GGTTAGCTCC   TTCGGTCCTC            6540 CGATCGTTGT   CAGAAGTAAG   TTGGCCGCAG   TGTTATCACT   CATGGTTATG   GCAGCACTGC            6600 ATAATTCTCT   TACTGTCATG   CCATCCGTAA   GATGCTTTTC   TGTGACTGGT   GAGTACTCAA            6660 CCAAGTCATT   CTGAGAATAG   TGTATGCGGC   GACCGAGTTG   CTCTTGCCCG   GCGTCAATAC            6720 GGGATAATAC   CGCGCCACAT   AGCAGAACTT   TAAAAGTGCT   CATCATTGGA   AAACGTTCTT            6780 CGGGGCGAAA    ACTCTCAAGG   ATCTTACCGC   TGTTGAGATC   CAGTTCGATG   TAACCCACTC      6840 GTGCACCCAA    CTGATCTTCA   GCATCTTTTA   CTTTCACCAG   CGTTTCTGGG   TGAGCAAAAA      6900 CAGGAAGGCA    AAATGCCGCA   AAAAAGGGAA   TAAGGGCGAC   ACGGAAATGT   TGAATACTCA      6960 TACTCTTCCT    TTTTCAATAT   TATTGAAGCA   TTTATCAGGG   TTATTGTCTC   ATGAGCGGAT      7020 ACATATTTGA    ATGTATTTAG   AAAAATAAAC   AAATAGGGGT   TCCGCGCACA   TTTCCCCGAA      7080 AAGTGCCACC    TGACGTCGAC   GGATCGGG                                               7108

(2)SEQ ID NO:39的信息:

 (ⅰ)序列特征:

  (A)长度:4019个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..4019

 (ⅹⅰ)序列描述:SEQ ID NO:39: CTCGAGAAAT   CATAAAAAAT   TTATTTGCTT   TGTGAGCGGA   TAACAATTAT   AATAGATTCA        60 ATTGTGAGCG   GATAACAATT   TCACACAGAA   TTCATTAAAG   AGGAGAAATT   AACTATGAGA       120 GGATCGCATC   ACCATCACCA   TCACGGATCC   CTGGTTCTGT   TTGAAGGGGA   CGAGGTGTAT       180 TCCACCATCC   GGAAGCAGGA   ATACAATGGG   AAGATCCCTC   GGTTCCGCCG   CATCCGGGGC       240 GAGAGTGAGC   TGTACACCAG   TGATACTGTC   ATGCAGAACC   CACAGTTCAT   CAAAGCCACC       300 ATCGTGCACC   AAGACCAGGC   TTACGATGAC   AAGATCTACT   ACTTCTTCCG   AGAGGACAAT       360 CCTGACAAGA   ATCCTGAGGC   TCCTCTCAAT   GTGTCCCGTG   TGGCCCAGTT   GTGCAGGGGG       420 GACCAGGGTG   GGGAAAGTTC   ACTGTCAGTC   TCCAAGTGGA   ACACTTTTCT   GAAAGCCATG       480 CTGGTATGCA   GTGATGCTGC   CACCAACAAG   AACTTCAACA   GGCTGCAAGA   CGTCTTCCTG       540 CTCCCTGACC   CCAGCGGCCA   GTGGAGGGAC   ACCAGGGTCT   ATGGTGTTTT   CTCCAACCCC       600 TGGAACTACT   CAGCCGTCTG   TGTGTATTCC   CTCGGTGACA   TTGACAAGGT   CTTCCGTACC       660 TCCTCACTCA   AGGGCTACCA   CTCAAGCCTT   CCCAACCCGC   GGCCTGGCAA   GTGCCTCCCA       720 GACCAGCAGC   CGATACCCAC   AGAAAGCTTA   ATTAGCTGAG   CTTGGACTCC   TGTTGATAGA       780 TCCAGTAATG   ACCTCAGAAC   TCCATCTGGA   TTTGTTCAGA   ACGCTCGGTT   GCCGCCGGGC             840 GTTTTTTATT   GGTGAGAATC   CAAGCTAGCT   TGGCGAGATT   TTCAGGAGCT   AAGGAAGCTA             900 AAATGGAGAA   AAAAATCACT   GGATATACCA   CCGTTGATAT   ATCCCAATGG   CATCGTAAAG             960 AACATTTTGA   GGCATTTCAG   TCAGTTGCTC   AATGTACCTA   TAACCAGACC   GTTCAGCTGG            1020 ATATTACGGC   CTTTTTAAAG   ACCGTAAAGA   AAAATAAGCA   CAAGTTTTAT   CCGGCCTTTA            1080 TTCACATTCT   TGCCCGCCTG   ATGAATGCTC   ATCCGGAATT   TCGTATGGCA   ATGAAAGACG            1140 GTGAGCTGGT   GATATGGGAT   AGTGTTCACC   CTTGTTACAC   CGTTTTCCAT   GAGCAAACTG            1200 AAACGTTTTC   ATCGCTCTGG   AGTGAATACC   ACGACGATTT   CCGGCAGTTT   CTACACATAT            1260 ATTCGCAAGA   TGTGGCGTGT   TACGGTGAAA   ACCTGGCCTA   TTTCCCTAAA   GGGTTTATTG            1320 AGAATATGTT   TTTCGTCTCA   GCCAATCCCT   GGGTGAGTTT   CACCAGTTTT   GATTTAAACG            1380 TGGCCAATAT   GGACAACTTC   TTCGCCCCCG   TTTTCACCAT   GGGCAAATAT   TATACGCAAG            1440 GCGACAAGGT   GCTGATGCCG   CTGGCGATTC   AGGTTCATCA   TGCCGTCTGT   GATGGCTTCC            1500 ATGTCGGCAG   AATGCTTAAT   GAATTACAAC   AGTACTGCGA   TGAGTGGCAG   GGCGGGGCGT            1560 AATTTTTTTA   AGGCAGTTAT   TGGTGCCCTT   AAACGCCTGG   GGTAATGACT   CTCTAGCTTG            1620 AGGCATCAAA   TAAAACGAAA   GGGTCAGTCG   AAAGACTGGG   CCTTTCGTTT   TATCTGTTGT            1680 TTGTCGGTGA   ACGCTCTCCT   GAGTAGGACA   AATCCGCCGC   TCTAGAGCTG   CCTCGCGCGT            1740 TTCGGTGATG   ACGGTGAAAA   CCTCTGACAC   ATGCAGCTCC   CGGAGACGGT   CACAGCTTGT            1800 CTGTAAGCGG   ATGCCGGGAG   CAGACAAGCC   CGTCAGGGCG   CGTCAGCGGG   TGTTGGCGGG            1860 TGTCGGGGCG   CAGCCATGAC   CCAGTCACGT   AGCGATAGCG   GAGTGTATAC   TGGCTTAACT            1920 ATGCGGCATC   AGAGCAGATT   GTACTGAGAG   TGCACCATAT   GCGGTGTGAA   ATACCGCACA            1980 GATGCGTAAG   GAGAAAATAC   CGCATCAGGC   GCTCTTCCGC   TTCCTCGCTC   ACTGACTCGC            2040 TGCGCTCGGT   CTGTCGGCTG   CGGCGAGCGG   TATCAGCTCA   CTCAAAGGCG   GTAATACGGT            2100 TATCCACAGA   ATCAGGGGAT   AACGCAGGAA   AGAACATGTG   AGCAAAAGGC   CAGCAAAAGG            2160 CCAGGAACCG   TAAAAAGGCC   GCGTTGCTGG   CGTTTTTCCA   TAGGCTCCGC   CCCCCTGACG            2220 AGCATCACAA   AAATCGACGC   TCAAGTCAGA   GGTGGCGAAA   CCCGACAGGA   CTATAAAGAT            2280 ACCAGGCGTT   TCCCCCTGGA   AGCTCCCTCG   TGCGCTCTCC   TGTTCCGACC   CTGCCGCTTA            2340 CCGGATACCT   GTCCGCCTTT   CTCCCTTCGG   GAAGCGTGGC   GCTTTCTCAA   TGCTCACGCT            2400 GTAGGTATCT   CAGTTCGGTG   TAGGTCGTTC   GCTCCAAGCT   GGGCTGTGTG   CACGAACCCC            2460 CCGTTCAGCC   CGACCGCTGC   GCCTTATCCG   GTAACTATCG   TCTTGAGTCC   AACCCGGTAA            2520 GACACGACTT   ATCGCCACTG   GCAGCAGCCA   CTGGTAACAG   GATTAGCAGA   GCGAGGTATG            2580 TAGGCGGTGC   TACAGAGTTC   TTGAAGTGGT   GGCCTAACTA   CGGCTACACT   AGAAGGACAG            2640 TATTTGGTAT   CTGCGCTCTG   CTGAAGCCAG   TTACCTTCGG   AAAAAGAGTT   GGTAGCTCTT            2700 GATCCGGCAA   ACAAACCACC   GCTGGTAGCG   GTGGTTTTTT   TGTTTGCAAG   CAGCAGATTA            2760 CGCGCAGAAA   AAAAGGATCT   CAAGAAGATC   CTTTGATCTT   TTCTACGGGG   TCTGACGCTC            2820 AGTGGAACGA   AAACTCACGT   TAAGGGATTT   TGGTCATGAG   ATTATCAAAA   AGGATCTTCA            2880 CCTAGATCCT   TTTAAATTAA   AAATGAAGTT   TTAAATCAAT   CTAAAGTATA   TATGAGTAAA            2940 CTTGGTCTGA   CAGTTACCAA   TGCTTAATCA   GTGAGGCACC   TATCTCAGCG   ATCTGTCTAT            3000 TTCGTTCATC   CATAGCTGCC   TGACTCCCCG   TCGTGTAGAT   AACTACGATA   CGGGAGGGCT            3060 TACCATCTGG   CCCCAGTGCT   GCAATGATAC   CGCGAGACCC   ACGCTCACCG   GCTCCAGATT            3120 TATCAGCAAT   AAACCAGCCA   GCCGGAAGGG   CCGAGCGCAG   AAGTGGTCCT   GCAACTTTAT            3180 CCGCCTCCAT   CCAGTCTATT   AATTGTTGCC   GGGAAGCTAG   AGTAAGTAGT   TCGCCAGTTA            3240 ATAGTTTGCG   CAACGTTGTT   GCCATTGCTA   CAGGCATCGT   GGTGTCACGC   TCGTCGTTTG            3300 GTATGGCTTC   ATTCAGCTCC   GGTTCCCAAC   GATCAAGGCG   AGTTACATGA   TCCCCCATGT            3360 TGTGCAAAAA   AGCGGTTAGC   TCCTTCGGTC   CTCCGATCGT   TGTCAGAAGT   AAGTTGGCCG            3420 CAGTGTTATC   ACTCATGGTT   ATGGCAGCAC   TGCATAATTC   TCTTACTGTC   ATGCCATCCG            3480 TAAGATGCTT   TTCTGTGACT   GGTGAGTACT   CAACCAAGTC   ATTCTGAGAA   TAGTGTATGC            3540 GGCGACCGAG   TTGCTCTTGC   CCGGCGTCAA   TACGGGATAA   TACCGCGCCA   CATAGCAGAA            3600 CTTTAAAAGT   GCTCATCATT   GGAAAACGTT   CTTCGGGGCG   AAAACTCTCA   AGGATCTTAC            3660 CGCTGTTGAG   ATCCAGTTCG   ATGTAACCCA   CTCGTGCACC   CAACTGATCT   TCAGCATCTT            3720 TTACTTTCAC   CAGCGTTTCT   GGGTGAGCAA   AAACAGGAAG   GCAAAATGCC   GCAAAAAAGG            3780 GAATAAGGGC   GACACGGAAA   TGTTGAATAC   TCATACTCTT   CCTTTTTCAA   TATTATTGAA            3840 GCATTTATCA   GGGTTATTGT   CTCATGAGCG   GATACATATT   TGAATGTATT   TAGAAAAATA            3900 AACAAATAGG   GGTTCCGCGC   ACATTTCCCC   GAAAAGTGCC   ACCTGACGTC   TAAGAAACCA            3960 TTATTATCAT   GACATTAACC   TATAAAAATA   GGCGTATCAC   GAGGCCCTTT   CGTCTTCAC             4019

(2)SEQ ID NO:40的信息:

 (ⅰ)序列特征:

  (A)长度:3999个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:DNA(基因组的)

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..3999

(ⅹⅰ)序列描述:SEQ ID NO:40: CTCGAGAAAT   CATAAAAAAT   TTATTTGCTT   TGTGAGCGGA   TAACAATTAT   AATAGATTCA               60 ATTGTGAGCG   GATAACAATT   TCACACAGAA   TTCATTAAAG   AGGAGAAATT   AACTATGAGA              120 GGATCGCATC   ACCATCACCA   TCACACGGAT   CCGCATGCGA   GCTCCCAGTG   GGAGGTGAGC              180 CAGGTGCCCC   TGGACCTGTG   TGAGGTCTAT   GGCGGGGGCT   GCCACGGTTG   CCTCATGTCC              240 CGAGACCCCT   ACTGCGGCTG   GGACCAGGGC   CGCTGCATCT   CCATCTACAG   CTCCGAACGG              300 TCAGTGCTGC   AATCCATTAA   TCCAGCCGAG   CCACACAAGG   AGTGTCCCAA   CCCCAAACCA              360 GACAAGGCCC   CACTGCAGAA   GGTTTCCCTG   GCCCCAAACT   CTCGCTACTA   CCTGAGCTGC              420 CCCATGGAAT   CCCGCCACGC   CACCTACTCA   TGGCGCCACA   AGGAGAACGT   GGAGCAGAGC              480 TGCGAACCTG   GTCACCAGAG   CCCCAACTGC   ATCCTGTTCA   TCGAGAACCT   CACGGCGCAG              540 CAGTACGGCC   ACTACTTCTG   CGAGGCCCAG   GAGGGCTCCT   ACTTCCGCGA   GGCTCAGCAC              600 TGGCAGCTGC   TGCCCGAGGA   CGGCATCATG   GCCGAGCACC   TGCTGGGTCA   TGCCTGTGCC              660 CTGGCTGCCT   CCCTCTGGCT   GGGGGTGCTG   CCCACACTCA   CTCTTGGCTT   GCTGGTCCAC              720 GTGAAGCTTA   ATTAGCTGAG   CTTGGACTCC   TGTTGATAGA   TCCAGTAATG   ACCTCAGAAC              780 TCCATCTGGA   TTTGTTCAGA   ACGCTCGGTT   GCCGCCGGGC   GTTTTTTATT   GGTGAGAATC              840 CAAGCTAGCT   TGGCGAGATT   TTCAGGAGCT   AAGGAAGCTA   AAATGGAGAA   AAAAATCACT              900 GGATATACCA   CCGTTGATAT   ATCCCAATGG   CATCGTAAAG   AACATTTTGA   GGCATTTCAG              960 TCAGTTGCTC   AATGTACCTA   TAACCAGACC   GTTCAGCTGG   ATATTACGGC   CTTTTTAAAG             1020 ACCGTAAAGA   AAAATAAGCA   CAAGTTTTAT   CCGGCCTTTA   TTCACATTCT   TGCCCGCCTG             1080  ATGAATGCTC   ATCCGGAATT   TCGTATGGCA   ATGAAAGACG   GTGAGCTGGT   GATATGGGAT             1140 AGTGTTCACC   CTTGTTACAC   CGTTTTCCAT   GAGCAAACTG   AAACGTTTTC   ATCGCTCTGG             1200 AGTGAATACC   ACGACGATTT   CCGGCAGTTT   CTACACATAT   ATTCGCAAGA   TGTGGCGTGT             1260 TACGGTGAAA   ACCTGGCCTA   TTTCCCTAAA   GGGTTTATTG   AGAATATGTT   TTTCGTCTCA             1320 GCCAATCCCT   GGGTGAGTTT   CACCAGTTTT   GATTTAAACG   TGGCCAATAT   GGACAACTTC             1380 TTCGCCCCCG   TTTTCACCAT   GGGCAAATAT   TATACGCAAG   GCGACAAGGT   GCTGATGCCG            1440 CTGGCGATTG   AGGTTCATCA   TGCCGTCTGT   GATGGCTTCC   ATGTCGGCAG   AATGCTTAAT            1500 GAATTACAAC   AGTACTGCGA   TGAGTGGCAG   GGCGGGGCGT   AATTTTTTTA   AGGCAGTTAT            1560 TGGTGCCCTT   AAACGCCTGG   GGTAATGACT   CTCTAGCTTG   AGGCATCAAA   TAAAACGAAA            1620 GGCTCAGTCG   AAAGACTGGG   CCTTTCGTTT   TATCTGTTGT   TTGTCGGTGA   ACGCTCTCCT            1680 GAGTAGGACA   AATCCGCCGC   TCTAGAGCTG   CCTCGCGCGT   TTCGGTGATG   ACGGTGAAAA            1740 CCTCTGACAC   ATGCAGCTCC   CGGAGACGGT   CACAGCTTGT   CTGTAAGCGG   ATGCCGGGAG            1800 CAGACAAGCC   CGTCAGGGCG   CGTCAGCGGG   TGTTGGCGGG   TGTCGGGGCG   CAGCCATGAC            1860 CCAGTCACGT   AGCGATAGCG   GAGTGTATAC   TGGCTTAACT   ATGCGGCATC   AGAGCAGATT            1920 GTACTGAGAG   TGCACCATAT   GCGGTGTGAA   ATACCGCACA   GATGCGTAAG   GAGAAAATAC            1980 CGCATCAGGC   GCTCTTCCGC   TTCCTCGCTC   ACTGACTCGC   TGCGCTCGGT   CTGTCGGCTG            2040 CGGCGAGCGG   TATCAGCTCA   CTCAAAGGCG   GTAATACGGT   TATCCACAGA   ATCAGGGGAT            2100 AACGCAGGAA   AGAACATGTG   AGCAAAAGGC   CAGCAAAAGG   CCAGGAACCG   TAAAAAGGCC            2160 GCGTTGCTGG   CGTTTTTCCA   TAGGCTCCGC   CCCCCTGACG   AGCATCACAA   AAATCGACGC            2220 TCAAGTCAGA   GGTGGCGAAA   CCCGACAGGA   CTATAAAGAT   ACCAGGCGTT   TCCCCCTGGA            2280 AGCTCCCTCG   TGCGCTCTCC   TGTTCCGACC   CTGCCGCTTA   CCGGATACCT   GTCCGCCTTT            2340 CTCCCTTCGG   GAAGCGTGGC   GCTTTCTCAA   TGCTCACGCT   GTAGGTATCT   CAGTTCGGTG            2400 TAGGTCGTTC   GCTCCAAGCT   GGGCTGTGTG   CACGAACCCC   CCGTTCAGCC   CGACCGCTGC            2460 GCCTTATCCG   GTAACTATCG   TCTTGAGTCC   AACCCGGTAA   GACACGACTT   ATCGCCACTG            2520 GCAGCAGCCA   CTGGTAACAG   GATTAGCAGA   GCGAGGTATG   TAGGCGGTGC   TACAGAGTTC            2580 TTGAAGTGGT   GGCCTAACTA   CGGCTACACT   AGAAGGACAG   TATTTGGTAT   CTGCGCTCTG            2640 CTGAAGCCAG   TTACCTTCGG   AAAAAGAGTT   GGTAGCTCTT   GATCCGGCAA   ACAAACCACC            2700 GCTGGTAGCG   GTGGTTTTTT   TGTTTGCAAG   CAGCAGATTA   CGCGCAGAAA   AAAAGGATCT            2760 CAAGAAGATC   CTTTGATCTT   TTCTACGGGG   TCTGACGCTC   AGTGGAACGA   AAACTCACGT            2820 TAAGGGATTT   TGGTCATGAG   ATTATCAAAA   AGGATCTTCA   CCTAGATCCT   TTTAAATTAA            2880 AAATGAAGTT   TTAAATCAAT   CTAAAGTATA   TATGAGTAAA   CTTGGTCTGA   CAGTTACCAA            2940 TGCTTAATCA   GTGAGGCACC   TATCTCAGCG   ATCTGTCTAT   TTCGTTCATC   CATAGCTGCC            3000 TGACTCCCCG   TCGTGTAGAT   AACTACGATA   CGGGAGGGCT   TACCATCTGG   CCCCAGTGCT            3060 GCAATGATAC   CGCGAGACCC   ACGCTCACCG   GCTCCAGATT   TATCAGCAAT   AAACCAGCCA            3120 GCCGGAAGGG   CCGAGCGCAG   AAGTGGTCCT   GCAACTTTAT   CCGCCTCCAT   CCAGTCTATT           3180 AATTGTTGCC   GGGAAGCTAG   AGTAAGTAGT   TCGCCAGTTA   ATAGTTTGCG   CAACGTTGTT           3240 GCCATTGCTA   CAGGCATCGT   GGTGTCACGC   TCGTCGTTTG   GTATGGCTTC   ATTCAGCTCC           3300 GGTTCCCAAC   GATCAAGGCG   AGTTACATGA   TCCCCCATGT   TGTGCAAAAA   AGCGGTTAGC           3360 TCCTTCGGTC   CTCCGATCGT   TGTCAGAAGT   AAGTTGGCCG   CAGTGTTATC   ACTCATGGTT           3420 ATGGCAGCAC   TGCATAATTC   TCTTACTGTC   ATGCCATCCG   TAAGATGCTT   TTCTGTGACT           3480 GGTGAGTACT   CAACCAAGTC   ATTCTGAGAA   TAGTGTATGC   GGCGACCGAG   TTGCTCTTGC           3540 CCGGCGTCAA   TACGGGATAA   TACCGCGCCA   CATAGCAGAA   CTTTAAAAGT   GCTCATCATT           3600 GGAAAACGTT   CTTCGGGGCG   AAAACTCTCA   AGGATCTTAC   CGCTGTTGAG   ATCCAGTTCG           3660 ATGTAACCCA   CTCGTGCACC   CAACTGATCT   TCAGCATCTT   TTACTTTCAC   CAGCGTTTCT           3720 GGGTGAGCAA   AAACAGGAAG   GCAAAATGCC   GCAAAAAAGG   GAATAAGGGC   GACACGGAAA           3780 TGTTGAATAC   TCATACTCTT   CCTTTTTCAA   TATTATTGAA   GCATTTATCA   GGGTTATTGT           3840 CTCATGAGCG   GATACATATT   TGAATGTATT   TAGAAAAATA   AACAAATAGG   GGTTCCGCGC           3900 ACATTTCCCC   GAAAAGTGCC   ACCTGACGTC   TAAGAAACCA   TTATTATCAT   GACATTAACC           3960 TATAAAAATA   GGCGTATCAC   GAGGCCCTTT   CGTCTTCAC                                      3999 (2)SEQ ID NO:41的信息:

(ⅰ)序列特征:

  (A)长度:8888个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

(ⅱ)分子类型:DNA(基因组的)

(ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..8888

(ⅹⅰ)序列描述:SEQ ID NO:41: GAGCCGCACA   CGGTGCTTTT   CCACGAGCCA  GGCAGCTCCT   CTGTGTGGGT   GGGAGGACGT        60 GGCAAGGTCT   ACCTCTTTGA   CTTCCCCGAG   GGCAAGAACG  CATCTGTGCG   CACGGTGAGC       120 CTCTCTCTTC   CCCCAACACC   CCCCCTACCC   TCTTATCTCC  CCTCTGGCCC   TGCCAAGGGT       180 CCTCAGGGAA   TCCGACGGAG   CTGGCTTCTC   TTCCTAAACT   GCCCCCACCT   CCGTATCCTA              240 TAAATGGCTC   CTGGGGGAGG   CTCCCTAAAG   GTAGTCCAGA   TTGGAGTGGG   GAGCTGCGGC              300 GGTGTGGAGA   AAAACAGGAG   CTAATGGGCC   TGGCCAGCTG   GGCAGCGCTG   CTGCGGAAAG              360 CCCAGGCTGG   AAGCTGGGCC   CCAGAGCCCA   TGCCTGGTCT   TCTGAACCCT   CTGGGCCTCA              420 GCTCTGGATA   TGAGACCCTG   TTTGACCTCA   GGTAGATCAC   TCACCCTCTC   AGAGCCCCAG              480 TTGCTCATCT   GTCAGATGAG   AATAATGGTT   GCTTCCTTTG   GGGCTTATCC   TGAGGCTGTG              540 TGGAAAGCAT   TTCAGGGGTA   CCTCACCCCT   GGCAGATTGA   ACTAATGCTT   CTCCCCTTCC              600 CCAGGTGAAT   ATCGGCTCCA   CAAAGGGGTC   CTGTCTGGAT   AAGCGGGTGA   GCGGGCGAGG              660 GATCTGGAGG   GGTCTGAGCC   ACTTGGTAAA   GGGAGAGGAG   ACCCTGAGGG   TCTAAGGAAG              720 GAAGCATGGC   CCTGCCCCAC   GAGTCCCAGA   CTGATGGGGA   GACGTGGTCC   TCTGTGCTTA              780 GGGGATGGCG   TCAGCTGCAC   ACACTCTGGG   CTGTCCCGGG   AGGCTGTCAC   CTATGCTAAG              840 CCCTTCTGAC   ACCTTCTTCC   CTGATCCTGG   GGGTCCTAGT   GCTAGGCTTG   CCAGGGCCTT              900 CCAGCAACCA   ATTTCTCTCC   TCCCTTCTCT   CTTCCCCGGG   CAGGACTGCG   AGAACTACAT              960 CACTCTCCTG   GAGAGGCGGA   GTGAGGGGCT   GCTGGCCTGT   GGCACCAACG   CCCGGCACCC             1020 CAGCTGCTGG   AACCTGGTGA   GAAGGCTGCT   CCCCATGTGC   CTGATCAGCT   CACCTTCTAC             1080 TGCGTGGGCT   TCTGCCCCTC   ATGGTGGGAA   GGAGATGGCG   AGACTCCAAT   GCTGGCCTTG             1140 CCCTGGGAGG   ATGGGGCTCC   TGGCCGAGAA   ACTGGCCGTC   ATGGGAGGCA   GTGGCTGTGG             1200 GATTATGTGG   CCATCCAACC   CTCTGGATCT   CCCACAGGTG   AATGGCACTG   TGGTGCCACT             1260 TGGCGAGATG   AGAGGCTACG   CCCCCTTCAG   CCCGGACGAG   AACTCCCTGG   TTCTGTTTGA             1320 AGGTTGGGGC   ATGCTTCGGA   ACTGGGCTGG   GAGCAGGATG   GTCAGCTCTT   TGTCCAGTGT             1380 CCGGAGGAGG   GACTTCCAGG   AGCTGCCTGC   CCTTACTCAT   TTCTCCCTCC   CACTGACCCC             1440 AGGGGACGAG   GTGTATTCCA   CCATCCGGAA   CCAGGAATAC   AATGGGAAGA   TCCCTCGGTT             1500 CCGCCGCATC   CGGGGCGAGA   GTGAGCTGTA   CACCAGTGAT   ACTGTCATGC   AGAGTGAGTC             1560 AGGCTCCGGC   TGGGCTGAGG   GTGGGCAAGG   GGGTGTGAGC   ACTTAAGGTG   GCAGATGGGA             1620 TCCTGATGTT   TCTGGGAGGG   CTCCCTGAGG   GCCGCTGGGG   CCATGCAGGA   AAGCAGGACC             1680 TTGGTATAGG   CCTGAGAAGT   TAGGGTTGGC   TGGGAGCAGA   GGAACAGACA   AGGTATAGCA             1740 GTGGGATGGG   CCCAGCCCTC   TTCAGGAACA   CAAACAGAGG   GAGCCCCAGA   CCCAGTGCAG             1800 GGTCCCCAGG   AGCCAAAGTT   TATCCTCTGC   TGAGTTCACG   TGGAGGCAGC   CCCCCAACTC             1860 CCTCCTCATC   AGGGCTCTGC   CAATTGAGCA   GAAGTGACAT   AGGGGCCCCC   AGGGACCTTC             1920 CCCCACTCCC   CAGGCATGAA   GTCATTGCTC   CTGGGCCGAT   GACATCTTTG   TAGGAAGAGG     1980 GCAAAACAGG   TGTGGGGTGG   AGGTGCAGGG   TCTAGGGCCC   CTCGGGGAGT   TGGACCTGAT     2040 GTTATGAGTC   CTATTCCAGA   TCTGATTTGC   CATGGTTTGT   GCAGACCCGA   AGGAGGGAGG     2100 AGAGTGTGCA   GGGTTGGAAT   GGTCTCCCGG   GCAAGCTTCC   CAGCCTTACG   CCCATTCGCT     2160 TCTGTGCCCT   GGCAGACCCA   CAGTTCATCA   AAGCCACCAT   CGTGCACCAA   GACCAGGCTT     2220 ACGATGACAA   GATCTACTAC   TTCTTCCGAG   AGGACAATCC   TGACAAGAAT   CCTGAGGCTC     2280 CTCTCAATGT   GTCCCGTGTG   GCCCAGTTGT   GCAGGGTGAA   CACGGGCGTG   AGGGCTGCTG     2340 GCTACGTGTC   TGTGCATGAA   TAGGCCTGAG   TGAGGGTGAG   TTCTGTGTGT   CCGTGTGCAT     2400 GTAGAAGTTG   TGTGGATGTA   TGAGTGGGTC   TGTGTCAGGG   ACTGTGGGAG   CAGCTGTGTG     2460 TGCATGGAGC   ATCATGTGTC   TGTGTGTGGG   TAAAGGTGGC   TGAGCTCCTG   TGCACGTATG     2520 ATGGCGTGTG   AGCGTGTGTA   TGATGGGGTG   TGTGTGTGTG   TGTGTGTGTG   TGTTTTGCCT     2580 GTGTGAATGT   GCTGTGCCAC   GTATGTGGGT   GCGTGAGTCA   GTAAATGTGT   GTCTGAGTCC     2640 GTCTGCTCTG   TGGGGACCTG   GCACTCTCAC   CTGCCCTGAC   CCTGGGCACT   GCTGGCCCTG     2700 GGCTCTGGAT   CAGCCAGGCC   TGCTTGCAGG   AGTCTCATCT   GGAGACCTGC   CCTGAGTCCT     2760 GGGGCACCCC   CGGCAGGTCC   TGGCCCCTCG   CAGCCTGCCT   TCCTCCTCTG   GGCCCAGGTG     2820 TTGATATTGC   TGGCAGTGGT   TTCCTGGGGT   GTGTGGGGAA   GCCCGGGCAG   GTGCTGAGGG     2880 GCCTCTTCTC   CCCTCTACCC   TTCCAGGGGG   ACCAGGGTGG   GGAAAGTTCA   CTGTCAGTCT     2940 CCAAGTGGAA   CACTTTTCTG   AAAGCCATGC   TGGTATGCAG   TGATGCTGCC   ACCAACAAGA     3000 ACTTCAACAG   GCTGCAAGAC   GTCTTCCTGC   TCCCTGACCC   CAGCGGCCAG   TGGAGGGACA     3060 CCAGGGTCTA   TGGTGTTTTC   TCCAACCCCT   GGTGAGTGGC   CCTTGTCCTG   GGGCCGGGGC     3120 TGGCATTGGT   TCAGTGTCCA   GTAGGGACAG   GAGGCCTTGG   GCCCTGCTGA   GGGCCTCCCT     3180 GGTGTGGCAG   GAGCAGGGGC   TGCAGGCTCA   AGAGGCTGGG   CTGTTGCTGG   GTGTGGGGTG     3240 GGGGGACAGC   CAGTGCGATG   TATGTACTGT   TGTGTGAGTG   AGTCTGCACT   CATGGGTGTG     3300 TGTGCATGCC   CTATATGCAC   ACTCATGACT   GCACTTGTGC   CTGTGTGTCC   CACCACCTGC     3360 TTGTGCCGAG   AGTGGACACT   GGGCCCAGGA   GGAAGCTGCT   GAAGCATCTC   TCGGGGAGCT     3420 GGGTGCTATT   ACACCTGCTC   AGGCACTGCC   TGAGCCCGAT   AATTCACACT   TCTTAATCAC     3480 TCTCATTGAT   TGAACACACG   GCAGGCGGAA   GTGTTGGGTG   TGTGTGGGGA   GAGTTAGGGA     3540 TAGAGTGGAG   GAAGCCAAGA   CCCTGCTCTG   TGGCTCCTGG   GTGAGTGGGT   CCCCCAGGCT     3600 GGGAAGGGGT   TGGGGGTCTG   GCCTCCTGGG   GCATCAGCAC   CCCACAGCCT   GTGCCCAGGG     3660 AGGGCTAGAG   AACTGCTCAG   CCTATGATGG   GGTTCCTCCT   GCCTTGGGGT   TGGGTAGAGC     3720 AGATGGCCTC   TAGACTCAGT   GATTCTGTAA   CAGGATACAA   GTTTGTGGTT   TTAAATTGCA     3780 GCACAAAGAA   ATTAGGCTGA   ACTCCTCTCC   TTCCTCCTCT   CCATCCCTCC   CCATTTTCAG     3840 TGGTGGTTGG   CAACTCAGTG   CCAGGCACAA   GGCTGGCCTG   GGTGAGTGGA   GGTGGATGGG     3900 TGGGTTCTGG   GCCCCCCATT   GAGCTGGTCT   CCATGTCACT   GCAGGAACTA   CTCAGCCGTC     3960 TGTGTGTATT   CCCTCGGTGA   CATTGACAAG   GTCTTCCGTA   CCTCCTCACT   CAAGGGCTAC     4020 CACTCAAGCC   TTCCCAACCC   GCGGCCTGGC   AAGGTGAGCG   TGACACCAGC   CGTGGCCCAG     4080 GCCCAGCCCT   CCTTCTGCCT   CACCTCCCAC   CACCCCACTG   ACCTGGGCCT   GCTCTCCTTG     4140 CCCAGTGCCT   CCCAGACCAG   CAGCCGATAC   CCACAGAGAC   CTTCCAGGTG   GCTGACCGTC     4200 ACCCAGAGGT   GGCGCAGAGG   GTGGAGCCCA   TGGGGCCTCT   GAAGACGCCA   TTGTTCCACT     4260 CTAAATACCA   CTACCAGAAA   GTGGCCGTCC   ACCGCATGCA   AGCCAGCCAC   GGGGAGACCT     4320 TTCATGTGCT   TTACCTAACT   ACAGGTGAGA   GGCTACCCCG   GGACCCTCAG   TTTGCTTTGT     4380 AAAAACGGGC   ATGAAAGGTG   TAAGGAATAA   TGTAGTTAAC   ATCTGGTTGG   ATCTTTACAT     4440 GTGGAAGGAA   TAATTGAGTG   ACTGGAGTTG   TCAGGGGTTA   ATGTGTGTGG   GTGTGGAAGA     4500 GCCAGGCAGG   GAGAGCTTCC   TGGAGGAGGT   AGGGGCAAGA   GGGAAAGGGG   GATGGGAGAA     4560 AAGCAAGCAC   TGGGATTTGG   AGGCGGAAAT   CTGGAGAGTC   TGAGCAAAGC   CAGGTGCACC     4620 TTTGGTCCAG   ATGTCTGACT   CAGGGAAGAA   GATGGTAGGA   AGAGACGTGG   CAAATGAGGA     4680 GGAGGGGCCT   GAACCACAGG   GATACTGGCC   TCTGCCAGGC   AGAATGAGGG   AGTCAGGCCC     4740 TGCGCCTGTC   TTTGGGATTG   TGCAGGTGAG   AAGAAACATT   TGAGGAGTTG   ATGGGGCACA     4800 AATTAGGTAT   GGGGAAGGAG   TTCCAGGGGG   CAGAACCTTT   GCCATCTCAC   AGAGGACAGG     4860 GGCAGCTTCT   CTTCTTCCCT   GGAGTAGGCC   CTGCTGGGGG   AAGCTGGGTG   GAATGCCGTG     4920 GGAGATGCTC   CTGCTTTCTG   GAAAGCCACA   GGACACGGAG   GAGCCAGTCC   TGAGTTGGGT     4980 TTGTCGCAGC   TTCCCATGCC   AGCTGCCTTC   CTTGAGACTG   GAAAGGGCCT   CTAGCACCCC     5040 TGGGGCCATT   CAATTCAGGC   CCAGGCGCCC   AACCTCAGTT   GTTCACATTC   CCCATGTGAT     5100 CTCCTGTTGC   TGCTTCACCT   TGGGACTGTC   TCGGCTTTGG   TGACCTTGTA   GGAAACTGGA     5160 ACCCCAGCAC   CATTGTTTGG   CTCCTGGAAG   CCTTGGGGAG   AGGAATTTCC   CACAGGGCAG     5220 GGCCTGGGTC   CTGATTCCCT   GCCTCTTTAC   TCCCTATTCA   TCCCGGCTAC   ACCCTTGGGC     5280 CCCCATCCTT   GCTTGGCTCC   AGTACTGGCT   GGCACAGCTG   TTGTGGTCAT   CCAGGGATGG     5340 CAGGGCACTG   GGGAACAGAA   GAGAGAGGTC   ACACAGTGCG   GAACTGGGAG   CAGGAGCTAG      5400 GACAAGGAAG   GCTGGACTTG   GGCCATGGAT   TCCCTTCCTG   CAGACTTGGG   AAGTGAGCAC      5460 ACTTGAGTGA   TTAGAGAAGG   TGTCTTCGTT   CTAAGGGCAG   TGGAGGAGGC   ACCATTTTGG      5520 AGCCTGCATC   ATTCGTATTT   GGGCTAGATT   GAAAAATAGA   GCTTTCTAAG   TCCTCTGCAG      5580 AGAATGGGAG   GCTCTCACAA   CTGGGAGAAG   TATTGGCTCT   TTTCCTGAGA   ATTTTGCCAA      5640 GGGTATGCTG   TTACTGGGGC   TGGTTTGGAA   GGAGTATAGG   GCATTATGTC   TGTGAAGGCA      5700 GTGGCTGGGG   TGGGGCCTTA   TCAGGCCCAA   GGAGCATCTG   GCCACATCTC   AGAGTCCACA      5760 GATGAGGATC   ACGGATGTGT   AGAGGAAACA   TCCTAGGCAG   GCAATCATCT   GACTGCTTTT      5820 TTGGGGCAGG   TGATGCCCTG   GGAAATTGGG   AGGGAGGGAG   AGAGGGAGGT   AGGCTATTCT      5880 AGAAACTGGG   AGAGCAGGTG   AGGTAGGATT   GGGAGGACCA   GGGGTCAGGG   TCCCCATTGG      5940 TCCCTAATTG   AGAACGGAGA   GAGCATTGGT   CTAGGAGGCA   GGCAGCTCGG   TTATAAGACC      6000 TTGGGAACTC   TTGATTTAGA   ATCCAAGATC   CTTTTTAGAT   CTAGGATTTT   ATAAAATTAA      6060 GATATCCCCT   AAGATCAAAT   GCAACGTGGA   GTCCTGAATT   GGATCCTAGA   ACAGAAGAAG      6120 GACATTTGTG   GAAAAACTAG   TGAAATCCAA   ATAAAGTCTG   TAGTTTTGTT   AATAGTAATG      6180 CACCAATGTC   AGTTGCCTAG   TTGTGACAAA   TATACCGTGG   TTATGTAAGA   TGGTAACATT      6240 AGGGGGAACT   GGAGAAGGGT   AGATTGGAGC   TCTCTGTACT   ATCTTTGCAA   CTTTTCTGGG      6300 AATCTAAAAT   TACTCCAAAA   TAAAAAAAAA   ATGTATTTAA   AGTAAATATA   TTCCCTAAGA      6360 GTCCAGGAGG   CAGGGGAGTT   GTAGAAGCAG   CTGAGTGGTT   GGGTTCTGAC   AGATTTGGTT      6420 CCAACTCGGT   CTCTGCTGCT   CACCAGCTGT   GTGACCTTGA   GCAAGTGGCT   TAGCCTTTCT      6480 GAGCCTGATT   TCCTTATCTG   TGGAGTGGGG   AAGATGACAG   CCACCTCGCA   GGGCTGTGGA      6540 GGGTTAAACG   AGGTGATGCA   TGGACAGCAG   CCGCACTGAC   CTTGCTGGTG   TGGGGCTCCT      6600 GCTTCTGTTC   TTCCCGTGCA   GCCTTGGGAA   TGTTGGAGGC   CGTATCCAGG   GACCCCTGGG      6660 CCTCCTGGGA   TGGCCTCTCT   GGATCAGCCT   TGGAAGGTTC   CAGGCTGCCC   TTAGGCTCCC      6720 ACATTCTTCC   CCAGTCACGC   TCTCCTCGCC   CTGCCCACAC   CAGTCCTGTG   ACCCTTGCCT      6780 GAGTTGTGAC   TTCCCACCCC   TCCCCGGCCT   AGAGGAAAGC   TGCCTGGCCC   CTCAGTGGGA      6840 CTCCCGCCCA   CTGACCCTCT   GTCCACCATA   CACAGACAGG   GGCACTATCC   ACAAGGTGGT      6900 GGAACCGGGG   GAGCAGGAGC   ACAGCTTCGC   CTTCAACATC   ATGGAGATCC   AGCCCTTCCG      6960 CCGCGCGGCT   GCCATCCAGA   CCATGTCGCT   GGATGCTGAG   CGGGTGAGCC   TTCCCCCACT      7020 GCGTCCCATG GGCTATGCAG TGACTGCAGC TGAGGACAGG GCTCCTTTGC ATGTGATTTG      7080 TGTGTTCTTT TAAGAGCTTC TAGGCCTTAG GGCCTGGACA TTTAGGACTG AGTGTGGGGT      7140 GGGGCCCGGG CCTGACCCAA TCCTGCTGTC CTTCCAGAGG AAGCTGTATG TGAGCTCCCA      7200 GTGGGAGGTG AGCCAGGTGC CCCTGGACCT GTGTGAGGTC TATGGCGGGG GCTGCCACGG      7260 TTGCCTCATG TCCCGAGACC CCTACTGCGG CTGGGACCAG GGCCGCTGCA TCTCCATCTA      7320 CAGCTCCGAA CGGTACGTTG GCCGGGATCC CTCCGTCCCT GGGACAAGGT GGGCATGGGA      7380 CAGGGGGAGG TGTTGTCGGG CTGGAAGAGG TGGCGGTACT GGGCCTTTCT TGTGGGACCT      7440 CCTCTCTACT GGAACTGCAC TAGGGGTAAG GATATGAGGG TCAGGTCTGC AGCCTTGTAT      7500 CTGCTGATCC TCTTTCGTCC TTCCCACTCC AGGTCAGTGC TGCAATCCAT TAATCCAGCC      7560 GAGCCACACA AGGAGTGTCC CAACCCCAAA CCAGGTACCT GATCTGGCCC TGCTGGCGGC      7620 TGTGGCCCAA TGAGTGGGGT ACTGCCCTGC CCTGATTGTC CTGGTCTGAG GGAAACATGG      7680 CCTTGTCCTG TGGGCCCCAG GTACATGGGG CAGGATACAG TCCTGCAGAG GGAGCCCTCT      7740 TGGTGGGATG AGCGAGACGG GAGAAAAAAG GAGGACGCTG AGGGCTGGGT TCCCCACGTT     7800 CATTCAGAAG CCTTGTCCTG GGATCCCAGT CGGTGGGGAG GACACATCCT CCCCTGGGAG     7860 CTCTTTGTCC CTCCTCACGG CTGCTTCCCC ACTGCCTGCC CAGACAAGGC CCCACTGCAG     7920 AAGGTTTCCC TGGCCCCAAA CTCTCGCTAC TACCTGAGCT GCCCCATGGA ATCCCGCCAC     7980 GCCACCTACT CATGGCGCCA CAAGGAGAAC GTGGAGCAGA GCTGCGAACC TGGTCACCAG     8040 AGCCCCAACT GCATCCTGTT CATCGAGAAC CTCACGGCGC AGCAGTACGG CCACTACTTC     8100 TGCGAGGCCC AGGAGGGCTC CTACTTCCGC GAGGCTCAGC ACTGGCAGCT GCTGCCCGAG     8160 GACGGCATCA TGGCCGAGCA CCTGCTGGGT CATGCCTGTG CCCTGGCCGC CTCCCTCTGG     8220 CTGGGGGTGC TGCCCACACT CACTCTTGGC TTGCTGGTCC ACTAGGGCCT CCCGAGGCTG     8280 GGCATGCCTC AGGCTTCTGC AGCCCAGGGC ACTAGAACGT CTCACACTCA GAGCCGGCTG     8340 GCCCGGGAGC TCCTTGCCTG CCACTTCTTC CAGGGGACAG AATAACCCAG TGGAGGATGC     8400 CAGGCCTGGA GACGTCCAGC CGCAGGCGGC TGCTGGGCCC CAGGTGGCGC ACGGATGGTG     8460 AGGGGCTGAG AATGAGGGCA CCGACTGTGA AGCTGGGGCA TCGATGACCC AAGACTTTAT     8520 CTTCTGGAAA ATATTTTTCA GACTCCTCAA ACTTGACTAA ATGCAGCGAT GCTCCCAGCC     8580 CAAGAGCCCA TGGGTCGGGG AGTGGGTTTG GATAGGAGAG CTGGGACTCC ATCTCGACCC     8640 TGGGGCTGAG GCCTGAGTCC TTCTGGACTC TTGGTACCCA CATTGCCTCC TTCCCCTCCC     8700 TCTCTCATGG CTGGGTGGCT GGTGTTCCTG AAGACCCAGG GCTACCCTCT GTCCAGCCCT     8760 GTCCTCTGCA GCTCCCTCTC TGGTCCTGGG TCCCACAGGA CAGCCGCCTT GCATGTTTAT     8820 TGAAGGATGT TTGCTTTCCG GACGGAAGGA CGGAAAAAGC TCTGAAAAAA AAAAAAAAAA     8880 AAAAAAAA                                                              8888

(2)SEQ ID NO:42的信息:

 (ⅰ)序列特征:

  (A)长度:6622个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:基因组DNA

 (ⅸ)特征:

  (A)名称/关键词:外显子

  (B)位置:1..6622

(ⅹⅰ)序列描述:SEQ ID NO:42: GATATCATGG   AGATAATTAA   AATGATAACC   ATCTCGCAAA   TAAATAAGTA   TTTTACTGTT               60 TTCGTAACAG   TTTTGTAATA   AAAAAACCTA   TAAATATGAA   ATTCTTAGTC   AACGTTGCCC              120 TTGTTTTTAT   GGTCGTATAC   ATTTCTTACA   TCTATGCGGA   TCGATGGGGA   TCCGCCCAGG              180 GCCACCTAAG   GAGCGGACCC   CGCATCTTCG   CCGTCTGGAA   AGGCCATGTA   GGGCAGGACC              240 GGGTGGACTT   TGGCCAGACT   GAGCCGCACA   CGGTGCTTTT   CCACGAGCCA   GGCAGCTCCT              300 CTGTGTGGGT   GGGAGGACGT   GGCAAGGTCT   ACCTCTTTGA   CTTCCCCGAG   GGCAAGAACG              360 CATCTGTGCG   CACGGTGAAT   ATCGGCTCCA   CAAAGGGGTC   CTGTCTGGAT   AAGCGGGACT              420 GCGAGAACTA   CATCACTCTC   CTGGAGAGGC   GGAGTGAGGG   GCTGCTGGCC   TGTGGCACCA              480 ACGCCCGGCA   CCCCAGCTGC   TGGAACCTGG   TGAATGGCAC   TGTGGTGCCA   CTTGGCGAGA              540 TGAGAGGCTA   TGCCCCCTTC   AGCCCGGACG   AGAACTCCCT   GGTTCTGTTT   GAAGGGGACG              600 AGGTGTATTC   CACCATCCGG   AAGCAGGAAT   ACAATGGGAA   GATCCCTCGG   TTCCGCCGCA              660 TCCGGGGCGA   GAGTGAGCTG   TACACCAGTG   ATACTGTCAT   GCAGAACCCA   CAGTTCATCA              720 AAGCCACCAT   CGTGCACCAA   GACCAGGCTT   ACGATGACAA   GATCTACTAC   TTCTTCCGAG              780 AGGACAATCC   TGACAAGAAT   CCTGAGGCTC   CTCTCAATGT   GTCCCGTGTG   GCCCAGTTGT              840 GCAGGGGGGA   CCAGGGTGGG   GAAAGTTCAC   TGTCAGTCTC   CAAGTGGAAC   ACTTTTCTGA              900 AAGCCATGCT   GGTATGCAGT   GATGCTGCCA   CCAACAAGAA   CTTCAACAGG   CTGCAAGACG              960 TCTTCCTGCT   CCCTGACCCC   AGCGGCCAGT   GGAGGGACAC   CAGGGTCTAT   GGTGTTTTCT             1020 CCAACCCCTG   GAACTACTCA   GCCGTCTGTG   TGTATTCCCT   CGGTGACATT   GACAAGGTCT             1080 TCCGTACCTC   CTCACTCAAG   GGCTACCACT   CAAGCCTTCC   CAACCCGCGG   CCTGGCAAGT             1140 GCCTCCCAGA   CCAGCAGCCG   ATACCCACAG   AGACCTTCCA   GGTGGCTGAC   CGTCACCCAG             1200 AGGTGGCGCA   GAGGGTGGAG   CCCATGGGGC   CTCTGAAGAC   GCCATTGTTC   CACTCTAAAT             1260 ACCACTACCA   GAAAGTGGCC   GTTCACCGCA   TGCAAGCCAG   CCACGGGGAG   ACCTTTCATG             1320 TGCTTTACCT   AACTACAGAC   AGGGGCACTA   TCCACAAGGT   GGTGGAACCG   GGGGAGCAGG             1380 AGCACAGCTT   CGCCTTCAAC   ATCATGGAGA   TCCAGCCCTT   CCGCCGCGCG   GCTGCCATCC             1440 AGACCATGTC   GCTGGATGCT   GAGCGGAGGA   AGCTGTATGT   GAGCTCCCAG   TGGGAGGTGA             1500 GCCAGGTGCC   CCTGGACCTG   TGTGAGGTCT   ATGGCGGGGG   CTGCCACGGT   TGCCTCATGT             1560 CCCGAGACCC   CTACTGCGGC   TGGGACCAGG   GCCGCTGCAT   CTCCATCTAC   AGCTCCGLAC             1620 GGTCAGTGCT   GCAATCCATT   AATCCAGCCG   AGCCACACAA   GGAGTGTCCC   AACCCCAAAC             1680 CAGACAAGGC   CCCACTGCAG   AAGGTTTCCC   TGGCCCCAAA   CTCTCGCTAC   TACCTGAGCT        1740 GCCCCATGGA   ATCCCGCCAC   GCCACCTACT   CATGGCGCCA   CAAGGAGAAC   GTGGAGCAGA        1800 GCTGCGAACC   TGGTCACCAG   AGCCCCAACT   GCATCCTGTT   CATCGAGAAC   CTCACGGCGC        1860 AGCAGTACGG   CCACTACTTC   TGCGAGGCCC   AGGAGGGCTC   CTACTTCCGC   GAGGCTCAGC        1920 ACTGGCAGCT   GCTGCCCGAG   GACGGCATCA   TGGCCGAGCA   CCTGCTGGGT   CATGCCTGTG        1980 CCCTGGCTGC   CTGAATTCGA   AGCTTGGAGT   CGACTCTGCT   GAAGAGGAGG   AAATTCTCCT        2040 TGAAGTTTCC   CTGGTGTTCA   AAGTAAAGGA   GTTTGCACCA   GACGCACCTC   TGTTCACTGG        2100 TCCGGCGTAT   TAAAACACGA   TACATTGTTA   TTAGTACATT   TATTAAGCGC   TAGATTCTGT        2160 GCGTTGTTGA   TTTACAGACA   ATTGTTGTAC   GTATTTTAAT   AATTCATTAA   ATTTATAATC        2220 TTTAGGGTGG   TATGTTAGAG   CGAAAATCAA   ATGATTTTCA   GCGTCTTTAT   ATCTGAATTT        2280 AAATATTAAA   TCCTCAATAG   ATTTGTAAAA   TAGGTTTCGA   TTAGTTTCAA   ACAAGGGTTG        2340 TTTTTCCGAA   CCGATGGCTG   GACTATCTAA   TGGATTTTCG   CTCAACGCCA   CAAAACTTGC        2400 CAAATCTTGT   AGCAGCAATC   TAGCTTTGTC   GATATTCGTT   TGTGTTTTGT   TTTGTAATAA        2460 AGGTTCGACG   TCGTTCAAAA   TATTATGCGC   TTTTGTATTT   CTTTCATCAC   TGTCGTTAGT        2520 GTACAATTGA   CTCGACGTAA   ACACGTTAAA   TAAAGCCTGG   ACATATTTAA   CATCGGGCGT        2580 GTTAGCTTTA   TTAGGCCGAT   TATCGTCGTC   GTCCCAACCC   TCGTCGTTAG   AAGTTGCTTC        2640 CGAAGACGAT   TTTGCCATAG   CCACACGACG   CCTATTAATT   GTGTCGGCTA   ACACGTCCGC        2700 GATCAAATTT   GTAGTTGAGC   TTTTTGGAAT   TATTTCTGAT   TGCGGGCGTT   TTTGGGCGGG        2760 TTTCAATCTA   ACTGTGCCCG   ATTTTAATTC   AGACAACACG   TTAGAAAGCG   ATGGTGCAGG        2820 CGGTGGTAAC   ATTTCAGACG   GCAAATCTAC   TAATGGCGGC   GGTGGTGGAG   CTGATGATAA        2880 ATCTACCATC   GGTGGAGGCG   CAGGCGGGGC   TGGCGGCGGA   GGCGGAGGCG   GAGGTGGTGG        2940 CGGTGATGCA   GACGGCGGTT   TAGGCTCAAA   TTGTCTCTTT   CAGGCAACAC   AGTCGGCACC        3000 TCAACTATTG   TACTGGTTTC   GGGCGTATGG   TGCACTCTCA   GTACAATCTG   CTCTGATGCC        3060 GCATAGTTAA   GCCAGCCCCG   ACACCCGCCA   ACACCCGCTG   ACGCGCCCTG   ACGGGCTTGT        3120 CTGCTCCCGG   CATCCGCTTA   CAGACAAGCT   GTGACCGTCT   CCGGGAGCTG   CATGTGTCAG        3180 AGGTTTTCAC   CGTCATCACC   GAAACGCGCG   AGACGAAAGG   GCCTCGTGAT   ACGCCTATTT        3240 TTATAGGTTA   ATGTCATGAT   AATAATGGTT   TCTTAGACGT   CAGGTGGCAC   TTTTCGGGGA        3300 AATGTGCGCG   GAACCCCTAT   TTGTTTATTT   TTCTAAATAC   ATTCAAATAT   GTATCCGCTC        3360 ATGAGACAAT   AACCCTGATA   AATGCTTCAA   TAATATTGAA   AAAGGAAGAG   TATGAGTATT        3420 CAACATTTCC   GTGTCGCCCT   TATTCCCTTT   TTTGCGGCAT   TTTGCCTTCC   TGTTTTTGCT        3480 CACCCAGAAA   CGCTGGTGAA   AGTAAAAGAT   GCTGAAGATC   AGTTGGGTGC   ACGAGTGGGT        3540 TACATCGAAC   TGGATCTCAA   CAGCGGTAAG   ATCCTTGAGA   GTTTTCGCCC   CGAAGAACGT            3600 TTTCCAATGA   TGAGCACTTT   TAAAGTTCTG   CTATGTGGCG   CGGTATTATC   CCGTATTGAC            3660 GCCGGGCAAG   AGCAACTCGG   TCGCCGCATA   CACTATTCTC   AGAATGACTT   GGTTGAGTAC            3720 TCACCAGTCA   CAGAAAAGCA   TCTTACGGAT   GGCATGACAG   TAAGAGAATT   ATGCAGTGCT            3780 GCCATAACCA   TGAGTGATAA   CACTGCGGCC   AACTTACTTC   TGACAACGAT   CGGAGGACCG            3840 AAGGAGCTAA   CCGCTTTTTT   GCACAACATG   GGGGATCATG   TAACTCGCCT   TGATCGTTGG            3900 GAACCGGAGC   TGAATGAAGC   CATACCAAAC   GACGAGCGTG   ACACCACGAT   GCCTGTAGCA            3960 ATGGCAACAA   CGTTGCGCAA   ACTATTAACT   GGCGAACTAC   TTACTCTAGC   TTCCCGGCAA            4020 CAATTAATAG   ACTGGATGGA   GGCGGATAAA   GTTGCAGGAC   CACTTCTGCG   CTCGGCCCTT            4080 CCGGCTGGCT   GGTTTATTGC   TGATAAATCT   GGAGCCGGGG   AGCGTGGGTC   TCGCGGTATC            4140 ATTGCAGCAC   TGGGGCCAGA   TGGTAAGCCC   TCCCGTATCG   TAGTTATCTA   CACGACGGGG            4200 AGTCAGGCAA   CTATGGATGA   ACGAAATAGA   CAGATCGCTG   AGATAGGTGC   CTCACTGATT            4260 AAGCATTGGT   AACTGTCAGA   CCAAGTTTAC   TCATATATAC   TTTAGATTGA   TTTAAAACTT            4320 CATTTTTAAT   TTAAAAGGAT   CTAGGTGAAG   ATCCTTTTTG   ATAATCTCAT   GACCAAAATC            4380 CCTTAACGTG   AGTTTTCGTT   CCACTGAGCG   TCAGACCCCG   TAGAAAAGAT   CAAAGGATCT            4440 TCTTGAGATC   CTTTTTTTCT   GCGCGTAATC   TGCTGCTTGC   AAACAAAAAA   ACCACCGCTA            4500 CCAGCGGTGG   TTTGTTTGCC   GGATCAAGAG   CTACCAACTC   TTTTTCCGAA   GGTAACTGCC            4560 TTCAGCAGAG   CGCAGATACC   AAATACTGTT   CTTCTAGTGT   AGCCGTAGTT   AGGCCACCAC            4620 TTCAAGAACT   CTGTAGCACC   GCCTACATAC   CTCGCTCTGC   TAATCCTGTT   ACCAGTGGCT            4680 GCTGCCAGTG   GCGATAAGTC   GTGTCTTACC   GGGTTGGACT   CAAGACGATA   GTTACCGGAT            4740 AAGGCGCAGC   GGTCGGGCTG   AACGGGGGGT   TCGTGCACAC   AGCCCAGCTT   GGAGCGAACG            4800 ACCTACACCG   AACTGAGATA   CCTACAGCGT   GAGCTATGAG   AAAGCGCCAC   GCTTCCCGAA            4860 GGGAGAAAGG   CGGACAGGTA   TCCGGTAAGC   GGCAGGGTCG   GAACAGGAGA   GCGCACGAGG            4920 GAGCTTCCAG   GGGGAAACGC   CTGGTATCTT   TATAGTCCTG   TCGGGTTTCG   CCACCTCTGA            4980 CTTGAGCGTC   GATTTTTGTG   ATGCTCGTCA   GGGGGGCGGA   GCCTATGGAA   AAACGCCAGC            5040 AACGCGGCCT   TTTTACGGTT   CCTGGCCTTT   TGCTGGCCTT   TTGCTCACAT   GTTCTTTCCT            5100 GCGTTATCCC   CTGATTCTGT   GGATAACCGT   ATTACCGCCT   TTGAGTGAGC   TGATACCGCT            5160 CGCCGCAGCC   GAACGACCGA   GCGCAGCGAG   TCAGTGAGCG   AGGAAGCATC   CTGCACCATC            5220 GTCTGCTCAT   CCATGACCTG   ACCATGCAGA   GGATGATGCT   CGTGACGGTT   AACGCCTCGA            5280 ATCAGCAACG   GCTTGCCGTT   CAGCAGCAGC   AGACCATTTT   CAATCCGCAC   CTCGCGGAAA            5340 CCGACATCGC   AGGCTTCTGC   TTCAATCAGC   GTGCCGTCGG   CGGTGTGCAG   TTCAACCACC            5400 GCACGATAGA   GATTCGGGAT   TTCGGCGCTC   CACAGTTTCG   GGTTTTCGAC   GTTCAGACGT            5460 AGTGTGACGC   GATCGGTATA   ACCACCACGC   TCATCGATAA   TTTCACCGCC   GAAAGGCGCG           5520 GTGCCGCTGG   CGACCTGCGT   TTCACCCTGC   CATAAAGAAA   CTGTTACCCG   TAGGTAGTCA           5580 CGCAACTCGC   CGCACATCTG   AACTTCAGCC   TCCAGTACAG   CGCGGCTGAA   ATCATCATTA           5640 AAGCGAGTGG   CAACATGGAA   ATCGCTGATT   TGTGTAGTCG   GTTTATGCAG   CAACGAGACG           5700 TCACGGAAAA   TGCCGCTCAT   CCGCCACATA   TCCTGATCTT   CCAGATAACT   GCCGTCACTC           5760 CAACGCAGCA   CCATCACCGC   GAGGCGGTTT   TCTCCGGCGC   GTAAAAATGC   GCTCAGGTCA           5820 AATTCAGACG   GCAAACGACT   GTCCTGGCCG   TAACCGACCC   AGCGCCCGTT   GCACCACAGA           5880 TGAAACGCCG   AGTTAACGCC   ATCAAAAATA   ATTCGCGTCT   GGCCTTCCTG   TAGCCAGCTT           5940 TCATCAACAT   TAAATGTGAG   CGAGTAACAA   CCCGTCGGAT   TCTCCGTGGG   AACAAACGGC           6000 GGATTGACCG   TAATGGGATA   GGTCACGTTG   GTGTAGATGG   GCGCATCGTA   ACCGTGCATC           6060 TGCCAGTTTG   AGGGGACGAC   GACAGTATCG   GCCTCAGGAA   GATCGCACTC   CAGCCAGCTT           6120 TCCGGCACCG   CTTCTGGTGC   CGGAAACCAG   GCAAAGCGCC   ATTCGCCATT   CAGGCTGCGC           6180 AACTGTTGGG   AAGGGCGATC   GGTGCGGGCC   TCTTCGCTAT   TACGCCAGCT   GGCGAAAGGG           6240 GGATGTGCTG   CAAGGCGATT   AAGTTGGGTA   ACGCCAGGGT   TTTCCCAGTC   ACGACGTTGT           6300 AAAACGACGG   GATCTATCAT   TTTTAGCAGT   GATTCTAATT   GCAGCTGCTC   TTTGATACAA           6360 CTAATTTTAC   GACGACGATG   CGAGCTTTTA   TTCAACCGAG   CGTGCATGTT   TGCAATCGTG           6420 CAAGCGTTAT   CAATTTTTCA   TTATCGTATT   GTTGCACATC   AACAGGCTGG   ACACCACGTT           6480 GAACTCGCCG   CAGTTTTGCG   GCAAGTTGGA   CCCGCCGCGC   ATCCAATGCA   AACTTTCCGA           6540 CATTCTGTTG   CCTACGAACG   ATTGATTCTT   TGTCCATTGA   TCGAAGCGAG   TGCCTTCGAC           6600 TTTTTCGTGT   CCAGTGTGGC   TT                                                          6622

(2)SEQ ID NO:43的信息:

 (ⅰ)序列特征:

  (A)长度:31个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:基因组DNA

 (ⅸ)特征:

  (A)名称/关键词:外显子

(B)位置:1..31

 (ⅹⅰ)序列描述:SEQ ID NO:43:

(2)SEQ ID NO:44的信息:

 (ⅰ)序列特征:

  (A)长度:29个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线型

 (ⅱ)分子类型:基因组DNA

 (ⅹⅰ)序列描述:SEQ ID NO:44: CTGAATTCAGGAGCCAGGGCACAGGCATG       29