人类信息素L(H－SemaL)和其它物种中相应的信息素

IPRDB

API 数据接口

专利申请

使用指引 chat嘟嘟

会员体验

联系我们

交流群

现在联系顾问~

人类信息素L(H－SemaL)和其它物种中相应的信息素
申请号	CN98103356.3	申请日	1998-07-09	公开(公告)号	CN1209436A	公开(公告)日	1999-03-03
申请人	德国赫彻斯特马里奥罗塞尔有限公司;			发明人	B·弗莱肯斯汀; A·恩塞尔;
摘要	本发明涉及由一特定的结构域结构所区别的新的信息素和其衍生物,并且涉及编码这些信息素的核酸(DNA,RNA,cDNA)和其衍生物,以及它们的用途。本发明涉及在免疫系统中具有生化功能并且具有迄今未公开和未预料到的结构域结构的信息素(免疫调节信息素)。这些新的信息素被认为是L型信息素(Sema－L)。它们包含一个N端信号肽、一个特征性Sema结构域。并且在蛋白质C端区含义一个免疫球蛋白样结构域和代表潜在跨膜结构域的疏水结构域。
权利要求	1．一种包含一个特征性Sema结构域的信息素，其中该蛋白质具有一个N 端信号肽，并且在C端区具有一个免疫球蛋白样结构域以及一跨膜结构域。所说的信息素被认为是L型信息素(Sema-L)，以及L型信息素的衍生物。 2．如权利要求1中所要求的信息素，其中所说的蛋白质(人类L型信息素(H- SemaL))具有氨基酸序列SEQ ID NO.3。 3．如权利要求1和2中之一个或多个所要求的信息素，其中所说的蛋白质在 Sema结构域区域中与H-SemaL的Sema结构域具有至少40％的氨基酸等同性。 4．如权利要求1至2之一个或多个所要求的信息素，其中所说的蛋白质包含部分氨基酸序列SEQ ID NO.4(鼠信息素(M-SemaL))。 5．一种包含编码如权利要求1至4中之一个或多个所要求的L型信息素的核酸序列的核酸以及其衍生物。 6．如权利要求5所要求的核酸，其中所说的核酸序列是信息素L基因。 7．如权利要求5和6中之一个或多个所要求的核酸，其中所说的核酸序列包含H-SemaL的基因。 8．如权利要求5所要求的核酸，其中所说的核酸序列包含L型信息素的 cDNA。 9．如权利要求8所要求的核酸，其中所说的cDNA是H-SemaL的cDNA。 10．如权利要求8所要求的核酸，其中所说的cDNA是M-SemaL的cDNA。 11．一种制备如权利要求1至4中之一个或多个所要求的L型信息素的方法，该方法包括将编码L型信息素或者其衍生物的核酸序列克隆进表达载体并且表表达之。 12．如权利要求11所要求的方法，其中将真核细胞用于表达。 13．L型信息素或其衍生物或编码L型信息素的核酸序列或其衍生物在产生可以用于治疗或预防免疫疾病的药物中的用途。 14．如权利要求13所要求的核酸序列或其衍生物在基因治疗中的用途。 15．L型信息素或编码L型信息素核酸序列在鉴别免疫调节剂的方法中的用途。 16．一种鉴别免疫调节剂的方法，该方法包括在特定的条件下将L型信息素与待测药剂一起温育，在没有待测药剂但是其它方面相同的条件下进行第二批平行培养，然后确定待测药剂的抑制或激活作用。 17．一种鉴别免疫调节剂的方法，该方法包括在特定的条件下和在待测药剂存在下表达编码L型信息素的核酸序列，并且测定其表达程度。 18．一种制备编码L型信息素的核酸的方法，其中用特异性引物通过聚合酶链式反应扩增这种核酸。 19．一种信息素抗体，该抗体识别相应于SEQ ID NO.4中的179-378位氨基酸的H-SemaL的表位，或者识别相应于SEQ ID NO.4中的480-666位氨基酸的 H-SemaL的表位。 20．一种制备如权利要求19所要求的信息素抗体的方法，其中作为具有表位标记的融合蛋白表达所说的表位，通过这一表位标记纯化所说的表位，并且将纯化的融合蛋白用于免疫接种。
说明书全文	本发明涉及由一特定的结构域结构识别的新的信息素(semaphorin)和其衍生物，涉及编码这些信息素的核酸(DNA、RNA、cDNA)和其衍生物，以及它们的制备和用途。 Kolodkin首次描述了信息素作为保守基因家族的成员{Kolodkin等(1993)细胞 75:1389-1399}。现在已经克隆出(并且在某些情况下已经描绘出)其它信息素的基因或部分基因。到目前为止，已经公开了总共5种人类信息素(H-SemaⅢ,H-SemaⅤ,H- SemaⅣ,H-SemaB和H-SemaE){(Kolodkin等(1993)；Poche等(1996)癌基因12: 1289-1297；Sekido等(1996)美国科学院院报93:4120-4125；Xiang等(1996) 基因组32:39-48；Hall等(1996)美国科学院院报39:11780-11785；Yamada 等(1997)(GenBank登记号AB000220)},8种鼠类信息素(小鼠基因；M-Sema A 到M-Sema-H){(Püschel等(1995)神经元14:941-948；Messerschmidt等(1995) 神经元14:949-959；Inigaki等(1995)FEBS通讯370:269-272；Adams等 (1996)Mech.Dev57:33-45；Christensen等(1996)(GenBank登记号Z80941, Z93948)},5种鸡精蛋白(小鸡)脑衰蛋白-1到-5){Luo等(1993)；Luo等(1995)神经元14:1131-1140}，以及来自大鼠(R-Sema-Ⅲ){Giger等(1996)J.Comp.Neurol. 375:378-392}，斑马鱼，昆虫毛(果蝇(果蝇D melanogaster:D-SemaⅠ和D- SemaⅡ)，甲虫Tribolium confusum:T-Sema-l)，蚱蜢(Schistocerca americana:G- Sema-l)){Kolodkin等(1993)}，以及线虫(C.elegans:Ce-Sema){Roy等 (1994)(GemBank登记号U15667)}的基因。此外，两种痘病毒(牛痘(ORF-A39)和天花(ORFA39-同源物)){Kolodkin等(1993)}和alcelaphine疱疹病毒1型(AHV- 1)(AHV-Sema){Ensser和Fleckenstein(1995)普通病毒学76:1063-1067}具有与信息素同源的基因。表-1总结了到目前为止在各种物种中鉴别的信息素。表1显示了信息素的名称(第1列)，所使用的同义词(第2列)，分离特定信息素的物种(第3列)；和其中已知的关于所说的编码蛋白质的结构域结构的数据和关于染色体位点的数据(表1 的第4列)，存储在基因数据库(例如，EST(表达序列标记)数据库，EMBL(欧洲分子生物学实验室，Heidelberg)数据库或NCBI(国家生物技术信息中心，马里兰，美国)的基因序列的登记号，以及这些数据出版的参考信息(表1的第5列)。到目前为止，所有公开的信息素基因的基因产物(编码的信息素)都具有一个N 端信号肽。它在C端具有大约450至500个氨基酸长度的特有Sema结构域。高度保守的氨基酸基元和一些高度保守的半胱氨酸残基被已在Sema结构域中找到。基因产物(信息素)在C端序列方面是不同的，这些序列跟随在Sema结构域之后，并且由一个或多个结构域组成。例如，在这些C端氨基酸序列中有跨膜结构域(TM)，免疫球蛋白样结构域(Ig)(免疫球蛋白恒定区)，胞质序列(CP)，加工信号(P)(例如有共有序列(RXR)，其中R是精氨酸，X是任何氨基酸)和/或亲水C端 (HPC)。到目前为止所公开的信息素根据C端的结构域结构的不同可以划分为5 个不同的子群(Ⅰ到Ⅴ)： Ⅰ 分泌性，没有其它结构域(例如ORF-A49) Ⅱ lg 分泌性(没有跨膜结构，例如AHV-Sema) Ⅲ lg, TM,CP具有胞质序列，膜锚着(例如CD100) Ⅳ lg, (P),HPC具有亲水性C端，分泌性(例如H-SemaⅢ,M-SemaD，脑衰蛋白-l) V lg, TM,CP具有C端7血小板反应蛋白基元。膜锚着(例如M-SemaF 和G) 到此为止还没有描述过信息素受体或胞外配体。已经公开了与信息素-介导作用相关连的胞内杂合三聚体GTP结合性蛋白质复合物。在小鸡中已被鉴别的这些蛋白质复合物的一个组分称为CRMP(脑衰蛋白应答介导蛋白质)，并且被假定是信息素诱导的胞内信号级联的一个组分(Goshima等(1995)自然376:509-514)。例如，CRMP62与unc-33、线虫蛋白质(对轴突定向成长来说是十分重要的)都具有同源性。同样地，已知人类蛋白质98％的氨基酸与CRMP62具有等同性 (Hamajima等(1996)基因180:157-163)。类似地描述了大鼠中的几个CRMP-相关基因(Wang等(1996)神经科学16:6197-6207)。所说的分泌性或跨膜信息素为增长的神经芽体传达排斥信号。在神经系统 (CNS)的发育中，它们起着重要的作用，并且特别是在肌肉和神经组织中表达 (Kolodkin等(1993)；Luo等(1993)细胞75:217-227)。与密切相关的M-SemaF相对比，M-SemaG的显著表达不仅在所说的CNS 中而且在淋巴与造血系统的细胞中已经观察到(Furuyima等(1996)生物化学杂志 271:33376-33381)。近来已经鉴别出两个其它的人类信息素，H-SemaⅣ和H-SemaⅤ(特别是染色体3p21.3区域)，其缺失与各种类型的支气管癌有关。H-SemaⅣ{(Roche等 (1996),Xiang等(1996),Sekido等(1996)}与M-SemaE在氨基酸水平上大约有 50％的等同性，而H-SemaⅤ{Sekido等(1996)}是M-SemaA的直接同系物(86％的氨基酸等同性)。因为在所切除的3p21.3基因座上进行DNA测序工程期间发现了这些基因(H-SemaⅣ和Ⅴ)，这两个基因复合物的内含子-外显子结构是已知的。两个基因都能在各种神经元和非神经元组织中表达。同样仅仅在前不久，细胞表面分子CD100(人)(在活化的T细胞上表达并诱导) 已经鉴别为是一种信息素(表1中同样列出)。它通过CD40受体和相应配体CD40L 帮助与B细胞相互作用。CD100是一个150kd(千道尔顿)的膜锚着糖蛋白二聚体。已经描述了CD100的外胞质C端与一迄今未知的激酶的结合{Hall等 (1996)}。这就意味CD100是第一个并且是迄今为止仅有的已证明在免疫系统的细胞中表达的信息素。在“rhadinoviruses的转化基因”方案中，已经克隆和测序了alcelaphine疱疹病毒1型(AHV-1)的完全基因组{Ensser等(1995)}。AHV-1是恶性卡他发热、各种与淋巴增殖综合症有关的反刍动物疾病的诱发剂(并且通常是致命的)。经过分析，发现了一个开放读框，在病毒基因组的一端具有与痘苗病毒基因远程的但是显著的同源性(ORF-A39相应于Ensser等(1995)普通病毒学76:1063-1067的 VAC-A39)，后者已经被归为信息素基因家族。而AHV-1信息素(AHV-Sema)具有非常保守的信息素结构，痘病毒基因(ORF-A39和ORF-A39-同源物，参见表1)具有C端截短。即其中仅仅非完全地存在保守Sema结构域。所发现的AHV-Sema与dbEST(EST(表达序列标志)数据库(db))的数据库比较提从人胎盘的2种独立cDNA克隆都提供了两种EST序列(登记号H02902, H03806(克隆151129)，登记号R33439和R33537(克隆135941))。与迄今为止所描述的神经元信息相比。这些明显地显示了与AHV-1的信息素更大的同源性。本发明涉及这样的信息素，它们具有新的迄今未公开的和未曾预料到的结构域结构，并且其具有在免疫系统中的生化功能(免疫调节信息素)。这些新的信息素被称为L型信息素(SemaL)。它们包含一个N端信号肽。一个特征性Sema结构域。并且在蛋白质的C端区包括一个免疫球蛋白样结构域和一个代表潜在跨膜结构域的疏水结构域。信号肽的氨基酸序列可以有少于70个氨基酸，优选地少于60个，而多于20 个，更优选地多于30个氨基酸，并且特别优选的长度是约40到50个氨基酸，在本发明的特定实施方案中，所说的信号肽具有44个氨基酸长度，即信号肽酶的切割位点被定位在44到45个氨基酸之间。 Sema结构域的长度可以是从300到700或更多个氨基酸，优选的是大约400 到600个氨基酸，更优选的Sema结构域的长度是450至550个氨基酸，优选的是大约500个氨基酸，在本发明更优选的实施方案中，Sema结构域被加上信号肽，此时Sema结构域优选地达到545个氨基酸。免疫球蛋白样结构域的长度可以是大约30至110个或更多个氨基酸，以及优选的长度是在50与90个之间的，特别优选的是大约70个氨基酸。跨膜结构域的长度可以是大约10至35个氨基酸，优选的是大约15至30个，特别优选的是大约20至25个氨基酸。本发明涉及来自不同物种的L型信息素，特别是脊椎动物，例如鸟类和/或鱼类，优选是哺乳动物，例如灵长目动物，大鼠、兔、狗、猫、绵羊、山羊、母牛、马、猪、特别优选的是人和小鼠。本发明也涉及来自微生物的相应的信息素，尤其是病原微生物，例如细菌，酵母和/或病毒，例如反转录病毒，尤其是人-病原微生物。本发明的一个实施方案是相应的人类信息素(H-SemaL)，它具有信号肽， Sema结构域。免疫球蛋白样结构域和跨膜结构域。特定的实施方案是由表4中显示的氨基酸序列给出的信息素。本发明的另一个实施方案包含其它物种中相应的信息素，它们在Sema结构域区域中与H-SenaL的Sema结构域(表4中序列的45至545个氨基酸)相比具有超过40％，优选的是超过50％，特别优选的是超过60％的氨基酸等同性。。在密切相关物种(例如灵长目动物，小鼠)中相应的信息素可能很完美地具有超过 70％，优选的是超过80％，特别优选的是超过90％的氨基酸等同性。例如可以利用GAP程序来确定或计算出百分同源性(GCG程序包。遗传计算机组(1991))。本发明这样的实施方案是相应的小鼠信息素(鼠信息素(M-SemaL))。例如，它含有在表5中所显示的部分氨基酸序列(鼠信息素(M-SemaL))。本发明也涉及这样的相应信息素，在较少相关的物种(系统发育上相互之间十分远的)中，它与表4中显示的H-SemaL完全氨基酸序列相比仅仅具有大约15至 20％的氨基酸等同性(在蛋白质氨基酸序列的整个长度上考虑)，优选的是25至 30％，特别优选的是35至40％，或是更高的等同性。编码L型信息素的基因具有外显子-内含子结构。例如，这些基因可能具有10 到20个外显子，优选的是大约11至18个，特别优选的是12至16个外显子和相应的数量的内含子。然而，它们也可以具有与H-SemaL基因相同数量的外显子和内含子(13或15个外显子，优选的是14个外显子)。本发明的一个特定实施方案涉及H-SemaL基因。这一基因的长度优选的是8888至10,000或更多个核苷酸。人类信息素基因优选地包含素14所给出的核苷酸序列或在GenBank_数据库中储存的登记号AF030697的核苷酸序列。这些核苷酸序列含有至少13个内含子。此外，人类信息素基因在5＇端具有一个附加序列区域。合适时这一区域进一步含有编码和非编码序列，例如一或两个另外的内含子或外显子。试图将人类L型信息素定位在染色体上，这揭示了将相应的基因定在位置 15q22.3-23。对于M-SemaL的基因，相应地定位在位置9A3.3-B。作为内含子-外显子复合结构的结果，信息素mRNA初级转录物的剪接可能发生变化。其结果将导致产生信息素的不同剪接变体。这些剪接变体所翻译的蛋白质是本发明信息素的衍生物。它们的氨基酸序列，实质上其结构域结构相应于本发明描述的L型信息素，但是与后者相比较适当地方却被截短了。例如，可以形成完全或部分缺失跨膜结构域的剪接变体。含有一个不完全(或没有)跨膜结构域但是含有信号肽的信息素衍生物可能是具有分泌性的，并且通过这种方式对细胞外部，局部或其它相对较远的距离起作用，例如对其它细胞起作用。例如，另一个剪接变体可以不再含有编码信号肽的序列，同时，在适当时也没有编码代表潜在跨膜结构域的疏水氨基酸序列的序列。一种结果将是其信息素衍生物不能掺入到膜内，也不能进行分泌(除非通过分泌泡)。这样的信息素衍生物可以进入胞内过程，例如信号转导过程。这样就可能以相同的基本分子(L型信息素)和其衍生物(例如剪接变体)控制和/或协调各种胞内和胞外的过程。本发明一个特定的实施方案涉及从本发明L型信息素产生的信息素衍生物，但是它含有一个不完全的(或没有)跨膜结构域。本发明的另一个实施方案涉及从本发明L型信息素产生的信息素衍生物，但是它不含有信号肽。信号肽也可以在翻译后切除。这导致以截短的结构域结构形成了膜结合性 (TM结构域)或分泌性(没有TM结构域的剪接变体)信息素衍生物。现在一种以这种方式经过翻译后加工的信息素衍生物仅仅含有Sema结构域。1g结构域。同时在适当时具有跨膜结构域。信号肽切割位点可以正好定位在信号肽的末端，但也可以例如定位在距离氨基端40至50个氨基酸或更远。＂截短的＂(即包含更少的结构域)信息素L衍生物可以与其它不衍生自L型信息素的信息素的区别是，在存在的结构域中与L型信息素具有很大(＞90％)的氨基酸等同性或具有同一氨基酸序列。根据本发明的信息素也可以用其它方法经过翻译后修饰。例如，它们可以通过一次，两次，三次，四次，五次，六次，七次，八次，九次，十次或更多次的糖基化(N-和/或O-糖基化)。于是，信息素的氨基酸序列可能具有相等数量或更多的潜在糖基化位点的共有序列，优选的有5个这样的位点。本发明的一个实施方案涉及这样的信息素，其中糖基化位点位于与H-SemaL氨基酸序列(表4)相一致的位置105,157,258,330和602。此外，所说的信息素可以是它们磷酸化衍生物的形式。信息素可以是不同激酶的底物，例如氨基酸序列可能有蛋白激酶C，酪氨酸激酶和/或肌酸激酶的共有序列。此外，信息素的氨基酸序列可能有潜在的肉豆蔻酰化位点的共有序列。相应的信息素衍生物在这些位点上可以用肉豆蔻酸进行酯化。本发明的L型信息素和它们的衍生物可以是单体，二聚体和/或多聚体的形式。例如两个或更多信息素或他们的衍生物可以用分子间的二硫键连接在一起。形成分子内的二硫键也是可能的。本发明信息素的其它衍生物是融合蛋白。这一类型的融合蛋白一方面含有L 型信息素或其部分，同时，另外还含有其它的肽或蛋白质或它的一部分。例如，肽或蛋白质或其部分可能是表位标记(例如His标记(6X组氨酸)，Myc标记。流感标记)，因而可以利用它们，例如，用于纯化融合蛋白，或它们也可以用于标记融合蛋白，例如GFP(绿色荧光蛋白质)。例如，L型信息素衍生物的例子在实施例的构建体中已经说明。在表7至15中可以发现这些构建体序列，并在适当时考虑质粒的注释来解释。本发明进一步涉及编码本发明L型信息素和/或它们的衍生物的核酸序列，优选DNA和RNA序列，例如相应的基因，mRNA的不同剪接变体，与此相应的 cDNA，以及其衍生物(例如DNA或RNA的盐)。本发明的衍生物是经过如分子生物学方法修饰并且适应特定需要的序列或序列片段，如截短的基因或基因片段 (例如启动子序列，终止子序列)，cDNA或它的嵌合体，用于表达和克隆的构建体和其盐。一个实施方案涉及L型信息素的基因组序列(基因)。本发明涉及内含子和外显子序列，以及基因调控序列，例如启动子,增强子和沉默子序列。这个实施方案一方面涉及H-SemaL的或其衍生物的基因。本发明一方面涉及包含表14中给出的核苷酸序列的基因。本发明进一步涉及包含以登记号 AF030697收藏在GenBank数据库的核苷酸序列的基因。这一实施方案进一步涉及M-SemaL的基因和它的衍生物。本发明进一步涉及H-SemaL的cDNA或它的衍生物(例如cDNA片段)。一个特定的实施方案是根据表2中的核苷酸序列H-SemaL的cDNA。本发明进一步涉及以登记号AF030698收藏在GenBank数据库的H-SemaL的cDNA。本发明也涉及相应于这些cDNA的mRNA或它的片段。本发明进一步涉及M-SemaL的cDNA或它的衍生物(例如cDNA片段)。一个特定的实施方案是在表3中所显示的M-SemaL的部分cDNA序列，以及包含这部分cDNA序列的cDNA序列。另一个本发明的实施方案涉及以登记号AF030699 收藏在GenBank数据库的M-SemaL的cDNA。本发明也涉及相应于这些cDNA 的mRNA或它的部分。本发明也包含了等位基因和/或与上述的信息素序列相比仅仅轻微不同并编码同一或仅仅轻微修饰之蛋白质(氨基酸序列的不同少于或等于10％)的基因 /mRNA/cDNA的个体表达形式(衍生物的进一步例子)。在实施例中所表明的构建体提供了其衍生物的进一步例子。在表7至14表中描述了这些构建体的序列，可考虑质粒的注释来解释。本发明进一步涉及包含编码L型信息素或其衍生物之DNA的质粒。例如，这种类型的质粒可能是适合于例如在大肠杆菌中DNA扩增的具有高复制率的质粒。特定实施方案为具有信息素或其片段或其衍生物的可以在原核和/或真核表达系统中表达的表达质粒。组成型表达质粒和那些包含诱导型启动子的质粒都是合适的。本发明也涉及制备编码L型信息素或其衍生物的核酸的方法。这些核酸(例如 DNA或RNA)可以是合成得来的，例如用化学手段。尤其是，对这些核酸(例如相应的基因或cDNA或它的片段)来说利用特异性扩增引物和合适的起始原料作为模板通过PCR进行扩増是可能的。(例如来自合适的组织或基因组DNA的 cDNA)。制备信息素LcDNA和H-SemaL基因的特定方法在实施例中描述。本发明也涉及制备L型信息素的方法。例如，信息素L或它的衍生物可以通过克隆相应的编码L型信息素或其衍生物的核酸序列进入表达载体，并且利用后者重组载体来转化合适细胞来制备。例如，利用原核或真核细胞是可能的。L型信息素或其衍生物也可以在合适时用化学手段制备。此外，L型信息素和其衍生物可以作为与例如蛋白质或肽的融合蛋白表达，所说的蛋白质或肽使得表达的融合蛋白可以被检测，例如作为与GFP(绿色荧光蛋白质)的融合蛋白。信息素也能作为具有一个，两个，三个或更多个表位标记的融合蛋白进行表达，例如具有Myc和/或His(6×组氨酸)和/或流感标记。相应地利用或制备包含编码这些融合蛋白的DNA序列的质粒是可能的。例如，编码信息素的序列可以克隆进含有编码GFP和/或表位标记(例如Myc标记。His标记。流感标记)的DNA序列的质粒。其特定的例子在表中列出的例子和序列中给出，在适当时参考关于质粒的注释。本发明进一步涉及抗体，具体地说。这些抗体结合或认别L型信息素，它的衍生物或部分。其可能的例子是可以在如小鼠，兔，山羊，绵羊，小鸡等等中产生的多克隆或单克隆抗体。本发明这种主题的特定实施方案包含直接针对如下表位的抗体，所述表位相应于表4中显示的H-SemaL序列的179至378或480至666位的氨基酸序列。本发明也涉及用于制备特异性抗-信息素L抗体的方法该制备中使用包含所说的表位的抗原。本发明也涉及制备抗体的方法，为了这一目的，优选地利用包含特有信鼠素表位和可以用于重组融合蛋白随后纯化的表位标记的融合蛋白。纯化的融合蛋白可以用于随后的免疫。为了制备重组融合蛋白，应制备相应的重组表达载体，然后用来转化合适的细胞。可以从这种细胞中分离出重组融合蛋白。例如，该方法可以是如同在实施例8中所描述的那样。这些抗体可以用来纯化相应的信息素，例如H-SemaL和它的衍生物，例如在亲和柱上纯化，或用于蛋白质的免疫检测，例如利用ELISA，蛋白质印迹法和/ 或免疫组织化学。这些抗体也可以用于分析H-SemaL的表达，例如在不同的细胞类型或细胞系中。 H-SemaL的cDNA的长度有2636个核苷酸(表2)。H-SemaLcDNA的基因产物的长度有大约666个氨基酸(表4)，并且显示了典型的L型信息素结构域结构。基因产物具有一个N端信号肽(第1至44个氨基酸)，一个Sema结构域(第45个氨基酸至大约第545个氨基酸)，以及一个Ig(免疫球蛋白)结构域(大约第550至 620个氨基酸)；同时，在C端具有一个代表潜在的跨膜结构域的疏水氨基酸序列。这个结构域结构对于信息素以前从来没有描述过。它涉及可能定位在细胞表面并且属于一个新的亚组的膜结合糖蛋白。以这以前未知的结构域结构为基础，现在可以将信息素划分成Ⅵ个子群： Ⅰ 分泌性，没有其它结构域(例如ORF-A49) Ⅱ lg 分泌性，(没有跨膜结构域)(例如AHV-Sema) Ⅲ lg,TM,CP具有胞质序列，膜锚着(例如CD100) Ⅳ Ig,(P),HPC具有亲水C端，分泌性(例如H-Sema-Ⅲ,M-SemaD，脑衰蛋白-l) Ⅴ Ig,TM,CP具有C端7血小板反应蛋白基元，膜锚着(例如M- SemaF和G) Ⅵ Ig,TM膜锚着(例如H-SemaL,M-SemaL) 一个H-SemaL的非糖基化未加工形式的计算分子量大约是74.8kd(74823道尔顿)(利用肽-分选程序(Peptide-Sort),GCG程序包计算)。计算的等电点是pH =7.56。一个可能的信号肽切割位点定位在44和45个氨基酸之间(表3；以Signal P计算(http.//www.cbs.dtu.dk/services/Signal.P)，用于分析信号序列的基于神经网络的一种程序{Niesen H.等(1997)蛋白质工程10:1-6})，这给出了加工的蛋白质 (没有信号肽)的分子量(MW)是70.3kd(70323道尔顿)和等电点是pH=7.01。实际上也同样阐明了基因组的结构。H-SemaL基因有13或15或更多个外显子，优选地14个外显子，以及有12或14个内含子，优选地13个内含子。由于这种外显子-内含子复合结构，不同的剪接变体是可能的。在RNA印迹法中发现了所转录的H-SemaL基因的mRNA，特别是在胎盘，性腺，胸腺和脾中。在神经组织或肌肉组织中还没有发现任何mRNA。有证据显示在内皮细胞中的表异性调节性表达。变异剪接也可以导致具有牵涉到胞内信号转导的胞质内序列的H-SemaL形式(例如，类似于CD100)。同样地，变异剪接导致分泌性H-SemaL形式(类似于病毒AHV-Sema)将也是可能的。借助于GCG程序包(遗传学计算机小组(1991)GCG包的程序手册，版本7, 575Science Drive，威斯康星，美国53711),FASTA(Pearson和Lipman(Proc.Natl. Acad.Sci.85,2444-2448)和BLAST程序(Gish和States(1993)Nat.Genet.3, 266-272；Altschul等(1990)J.Mel.Biol.215,403-410)完成了核苷酸和氨基酸的序列分析。这些程序也与GenBank(版本102.0)和Swiss Prot(版本34.0)一起用于序列比较。如H-SemaL的糖基化和肉豆蔻酰化翻译后修饰也同样是可能的。借助于 Prosite程序(GCG程序包)在H-SemaL的氨基酸序列的位置105,157,258, 330和602发现了N-糖基化位点的共有序列(表4中显示)，而肉豆蔻酰化位点的共有序列在位置114,139,271,498,499,502和654发现了(共有序列：G～(E,D,R, K,H,P,F,Y,W)x(S,T,A,G,C,N)～(P))。此外，H-SemaL的氨基酸序列含有几个不同激酶的潜在的磷酸化的共有序列。因此，可以认为H-SemaL可以是不同激酶的底物，例如肌酸激酶2，蛋白激酶C和酪氨酸激酶的磷酸化位点。推定肌酸激酶2的磷酸化位点(共有序列Ck2:(S,T)x2(D,E))(Prosite, GCG)在氨基酸序列的位置119,131,173,338,419和481。推定蛋白激酶C的磷酸化位点(共有序列PkC:(S,T)x(R,K))(Prosite,GCG)在氨基酸序列的位置107,115, 190,296,350,431,524和576。推定酪氨酸激酶的磷酸化位点(共有序列：(R, K)x{2,3}(D,E){2,3}Y)(Prosite,GCG)在氨基酸序列的位置205。以氨基酸的单字母代码表明了所说的共有序列。整联蛋白的特征性＂RGD″基元(精氨酸-甘氨酸-天冬氨酸)位于位置267。糖基化位点在病毒AHV-Sema,H-SemaL和(就目前所知的)M-SemaL之间是高度保守的。 H-SemaL的二-或多聚化是可能的，并且对于其它信息素(如CD100)已经描述过{Hall等(1996)}。同样地，CD100分子是150kd的膜锚着糖蛋白二聚体。然而， CD100与本发明的人类信息素(H-SemaL)不是密切相关的。 M-SemaL的部分cDNA序列的长度是1195个核苷酸。这种编码蛋白质的序列具有394个氨基酸。这394个氨基酸相当于H-SemaL的1至396个氨基酸。在 M-SemaL中的信号肽为从1至44个氨基酸(恰如在H-SemaL中)。Sema结构域从第45个氨基酸开始，并且延伸到末端或有可能超出表4中所显示的序列末端。利用Clustal W程序(Thompson等(1994))进行多重序列对比。利用人工 SEAVIEW(Galtier等(1996)Comput.Appl Biosci 12,543-548)进一步进行序列对比。利用Clustal W(Thompson等(1994))来确定系统发育距离。已知蛋白质序列和所说的新的信息素序列的比较以及这些序列的系统发育分析显示了根据它们的系统发育关系可以对基因进行分类。当然一般说来，相应的信息素亚型的C端结构域结构是牵涉到决定相同子群的信息素比不同子群的信息素在系统发育上更密切的原因的一个因素。分离出信息素的物种也有影响，即相应的物种在系统发育上相互之间是否存在密切的关系。利用CLUSTALW程序{ThompsonJ.D等(1994)核酸研究22:4673-4680}对已知信息素氨基酸序列(全序列和/或部分序列，利用在表4和5中所显示的H-SemaL 和M-SemaL的氨基酸序列和所有其它以所述登记号入库的序列或从这些序列中衍生的所编码的氨基酸序列)进行系统发育分析(比较图3)，显示出H-SemaL和 M-SemaL的氨基酸序列相互之间在系统发育上非常密切，并且形成一个独立的系统发育群。反过来H-SemaL和M-SemaL与AHV-Sema和Vac-A39在系统发育上最密切。与任何其它以前所公开的信息素相比，它们相互之间明显地是更加密切相关的。这种分析也显示了其它信息素相互之间在系统发育上也密切相关，并且形成具有信息素的独立群。例如，具有分泌性的信息素(例如H-SemaⅢ,-Ⅳ,- V和-E)属于一个系统发育群。它们在其它物种中的同系物也属于这个亚族，而人类(跨膜)CD100与相应的小鼠同系物(M-SemaG2)和脑衰蛋白4一起属于一个系统发育群。关于完全的氨基酸序列，关于十分密切相关基因(例如，H-和M-SemaE或- Ⅲ/D)在系统发育群之内所观察到的同源性是大约在90％和80％之间的氨基酸等同性，而在低相关信息素基因的情况下不到40％。在Sema结构域之内，所观察的氨基酸等同性百分比稍高一点，并且由于它对整个蛋白质的氨基酸序列的高贡献率(蛋白质的50-80％属于Sema结构域)，这一点显著影响整个等同性。对于完全蛋白质来计算，H-SemaL与AHV-Sema有46％的同一性，但是如果只考虑Sema结构域本身，那么氨基酸的等同性是53％。例如，这高于相关的M-Sema-B-和-C(完全蛋白质37％的等同性，Sema结构域43％的等同性)，类似于M-SemaA和-E(完全蛋白质43％,Sema结构域53％)。在Sema结构域区域中部分M-SemaL序列(表6)和H-SemaL(表5)之间的氨基酸等同性是93％，那么可以假定涉及了相应的同源小鼠基因。与H-SemaL相比，在其它物种中相应于H-SemaL和M-SemaL的信息素在超过40％的Sema结构域之内可以具有氨基酸等同性。在密切相关的脊椎动物(哺乳动物，鸟)中，发现氨基酸等同性高于70％。所说的信息素属于一个与病毒的AHV-Sema具有比与以前所公开的人和鼠的信息素更大的氨基酸等同性的新的亚族，并且具有一个以前对于人类信素未公开过的C端结构。由于它们的结构域结构，通过是否属于亚组Ⅳ和/或与H-SemaL 和M-SemaL是同一系统发育群，和/或对于完全氨基酸序列而言，与H-SemaL具有至少30至40％的氨基酸等同性，优选的是50至60％，特别优选的是70至 80％，或具有更大的等同性，和/或对于Sema结构域而言，与H-SemaL具有至少 70％的氨基酸等同性，优选的是大于80％，特别优选的是大于90％来识别这些新的信息素(亚族成员)。 L型信息素也有一种不同类型的生化功能。这些信息素的一种新的功能是调节免疫系统。与H-SemaL最密切相关的是病毒AHV信息素(AHV-Sema)。后者具有相似大小，但是，与H-SemaL相对比，它没有任何跨膜结构域。在天然的宿主(蓝wildeest) 中，病毒感染细胞大概以分泌AHV-Sema来阻止H-SemaL的等同受体(蓝 wildebeest中的L型信息素)，并且这样躲开了受到免疫系统的攻击。也可以想象的是，对于免疫系统细胞来说。它的一个功能是作为排斥剂(化学排斥物)。一般地，新的L型信息素和其衍生物的生化功能将被认为是具有免疫调节和/ 或炎症调节功能。一方面，它们能够 A)作为抑制免疫应答的分子，它们可能显示它们作为化学排斥物和/或免疫抑制剂对细胞的作用，局部地或远距离起作用，例如在细胞表面上作为跨膜蛋白质，例如若由于加工(例如蛋白水解酶)或变异剪接引起它们分泌，例如通过组织扩散。例如，这些新的L型信息素的表达(如在脉管内皮细胞的表面)可以阻止白细胞的吸附和迁移通过容器壁。新的信息素在维持屏障作用方面可能起着重要的作用，例如在特别＂重要的＂或暴露的器官中阻止感染，例如保持血-脑屏障，胎盘循环和/ 或其它免疫特权位置(例如胰岛)和/或预防自身免疫疾病。此外，新的信息素和/或它们的衍生物也可以在各种组织的排斥信号中涉及，例如对于免疫系统细胞(例如白细胞)，阻止防卫机制非故意的活化。 B)此外，新的信息素和/或其衍生物可能具有附件分子功能。例如，在细胞表面上表达，作为防卫机制活化的一部分它们可以参予与免疫系统细胞的相互作用，例如在病毒感染的情况下。这揭示了新的L型信息素和其衍生物，以及编码这些蛋白质的核酸的几个可能用法。功能A)：这包含免疫抑制和/或抗炎原理：在器官移植，烧伤治疗，免疫治疗和基因治疗领域中有许多利用的潜在可能性。例如，借助于信息素-编码DNA或其衍生物，可以产生非人类转基因动物。对这些动物的一种可能应用是在器官移植的转基因模型中抑制移植排斥。例如，能够产生抑制排斥的转基因动物器官用于异种移植。例如，与其它转基因(例如，如DAF或CD59一类的补体调节剂)一起应该也是可能的。另一应用是产生非人类“剔除”(knock-out)动物，例如“剔除”小鼠(＂基因导向的实验室手则＂，Torres 和Kiihn(1997)牛津大学大学出版社，ISBN0-19-963677-X)：例如，通过剔除小鼠 M-SemaL基因以发现该基因的其它功能是可能的。如果小鼠没有信息素基因可以生存，那么它们也阐明了对于炎症疾病的潜在模型系统。如果M-SemaL对免疫调节来说是重要的，那么将要期待大量的这样的小鼠。此外，可以产生非人类 knock-in动物(例如小鼠)。例如，这使得能够以通常的/修饰的H-SemaL或修饰 M-SemaL(例如组成型和/或诱导型启动子控制下的新的信息素亚型的整合)来代替 M-SemaL。例如，为了进一步寻找新的信息素的功能(例如人基因或这些基因衍生物的功能)，可以利用这种类型的动物，或用于确定和鉴定免疫调节剂。例如，利用编码L型信息素或其衍生物的核酸来产生如重组免疫抑制剂，其它可溶性蛋白质或从L型信息素氨基酸序列(例如H-SemaL或相应的核酸，如基因)衍生出来的肽。以一种类似的方法可能产生具有结构相似性的激动剂。这些免疫抑制剂或激动剂也可以用于自身免疫疾病和炎症疾病和/或器官移植。利用L型信息素的基因治疗，例如用编码H-SemaL或其衍生物的核酸，例如利用病毒或非病毒的方法。用于自身免疫疾病和炎症疾病器官转移和移植前/间/ 后以阻止移植排斥。特别地，使用新的信息素和/或编码这些信息素的核酸，以及其衍在物(特别是 H-SemaL，编码H-SemaL的DNA，以及其衍生物)，用于药剂筛选(特别是确定和鉴定免疫调节剂)是可能的。功能B)：H-SemaL是在细胞表面表达并牵涉到与细胞(例如免疫系统的细胞) 的相互作用的附件分子，例如在信号途径活化中作为附件分子。例如，病毒基因或病毒基因产物或其它病原基因(例如起源于微生物的)可以充当该附件分子的竞争性抑制剂。具有这种功能的新的信息素同样地用于器官移植，炎症治序，免疫治疗和/或基因治疗领域。例如，新的信息素可以用于拮抗剂或抑制剂的筛选。以这种方法鉴别的药剂可以用于例如阻断信息素受体。可溶性和/或分泌性H-SemaL拮抗剂或抑制剂例如可以是化学物质或新的信息素或其衍生物本身(例如适合阻断相应受体的其部分/截短形式。如没有膜结构域或作为Ig融合蛋白或从后者衍生的肽)。以这种方法鉴别的特异性拮抗剂和/或抑制剂例如可能具有竞争性作用，并且用于抑制排斥(例如在器官移植的转基因模型中)，以及用于自身免疫疾病，炎症和器官移植。编码新的信息素的核酸(例如DNA)或其借助于分子生物学方法产生的衍生物例如可能用于产生非人类转基因动物。在这些转基因动物中，H-SemaL的超量表达能导致提高对自身免疫疾病和/或炎症的易感性。于是这样的转基因动物适合筛选新的特异性免疫调节剂。同样地，这样的核酸可以用于产生非人类“剔除”动物，例如“剔除”小鼠，其中失去了小鼠M-SemaL基因。利用这样的“剔除”动物可以找到基因的进一步生化功能。如果没有M-SemaL基因的小鼠能够生存，那么它们也为炎症提供了潜在的模型系统。这种DNA同样可以用来产生非人类knock-in动物，例如小鼠。这使得可以用修饰M-SemaL基因/cDNA或任选修饰的(例如变异)另一物种的L型信息素基因 /cDNA(例如H-SemaL)来代替M-SemaL基因。这样的转基因动物用来寻找本发明信息素的进一步功能。本发明也涉及L型信息素及其衍生物以及编码这些蛋白质的核酸(例如基因 /cDNA和其衍生物)和/或借助于这些信息素鉴别的药剂在生产药物中的应用。例如，生产可以用于基因治疗以及包含L型信息素(例如H-SemaL)表达的激动剂和/ 或拮抗剂的药物是可能的。为此目的例如也使用病毒的和/或非病毒方法。这些药物例如可以用于自身免疫疾病和炎症，在移植之后和/或期间和/或之前，来阻止器官移植排斥。编码新的信息素的核酸(例如基因，cDNA以及其衍生物)在分子生物学中也可以作为工具试剂。此外，新的信息素，尤其是H-SemaL以及核酸(例如其基因/cDNA)可以用于筛选新的药剂。例如，修饰蛋白质和/或从H-SemaL和/或M-SemaL衍生的肽在功能化验上可以用来寻找相应的受体和/或它的拮抗剂或激动剂，例如利用H-SemaL和同系物的表达构建体。本发明也涉及L型信息素或编码L型信息素的核酸序列在鉴别药剂(尤其是免疫调节剂)的方法中的应用。本发明也涉及使用L型信息素或其衍生物或编码L型信息素的核酸序列或其衍生物鉴别药剂的方法，以鉴别药理活性剂，例如免疫调节剂。例如，本发明涉及这样的方法，其中，在特定条件下L型信息素与待测药剂一起培养，平行地，第二批培养中没有待测药剂但是其它条件都相同，然后确定待测药剂的抑制或激活作用。例如，本发明也涉及这样的鉴别药剂的方法，其中，编码L型信息素或其衍生物的核酸序列在有待测药剂存在下在特定条件下表达，并测定其表达程度。适当时也可能在这种方法中在相同的平行条件下但是包含不同量的待测药剂下进行两批或多批试验。例如，待测药剂能够阻止或激活转录和/或翻译。如同它的病毒同系物一样，L型信息素可以结合到新近描述的受体分子 VESPR(Comeau等，(1998)免疫，卷8,473-482)上，并且，在单核细胞中推定可以造成对细胞粘附分子(如ICAM-1)和细胞因子(诸如白介素-6和白介素-8)的诱导，这可以导致其活化和细胞聚集。VESPR受体的表达模式显示了某些令人感兴趣的与H-SemaL的相似性，例如，胎盘中的强烈表达和脾组织的显著表达。plexin 家族迄今未知的其它受体或其它受体的相互作用是可能的。它也能与自身或其它信息素-样分子相互作用。L型信息素的相互作用可能特别通过Sema结构域的C 端区保守结构域来发生。关于质粒的注释： pMeIBacA(Invitrogen,De Schelp,NL)中的pMeIBacA-H-SemaL(6622bp) (SEQ ID NO.42)。核苷酸96-98ATG为起始密码子，核苷酸96-168为蜂毒肽信号序列，核苷酸168-173为BamHⅠ切割位点(PCR/克隆)，核苷酸171-1998为读框 SEMA-L氨基酸42-649(没有自的信号序列和跨膜序列)，核苷酸1993-1998为 EcoRⅠ切割位点(PCR/克隆)和核苷酸1992-1994为终止密码子质粒pCDNA3.1-H-SemaL-MychisA(7475bp)(SEQ ID NO.35)：核苷酸954-959 为BamHⅠ切割位点(克隆)，核苷酸968-970为ATG SEMAL，核苷酸968-2965为读框SEMAL，核苷酸2963-2968为PmlⅠ切割位点，核苷酸2969-2974为HindⅢ 切割位点，核苷酸2981-3013为Myc标记。核苷酸3026-3033为6xHis标商，核苷酸3034-3036为终止密码子质粒pCDNA3.1-H-SemaL-EGF P-MychisA(8192bp)(SEQ ID NO.36)：核苷酸 954-959为BamHⅠ切割位点(克隆)，核苷酸968-970为ATG SEMA-L，核苷酸 968-2965为读框SEMA-L，核苷酸2963-2965为一半PmlⅠ切割位点，核苷酸 2966-3682为读框EGFP(克隆在PmlⅠ处)，核苷酸3683-3685为一半PmlⅠ切割位点，核苷酸3685-3691为HindⅢ，核苷酸3698-3730为Myc标记。核苷酸3743- 3760为6xHis标记，以及核苷酸3761-3763为终止密码子载体pIND(Invitrogen,De Schelp,NL)中的质粒pIND-H-SemaL-EA(7108 bp)(SEQ ID NO.38)：核苷酸为533-538 BamHⅠ切割位点(克隆)，核苷酸为546-548 ATG SEMA-L，核苷酸546-为读框SEMA-L，核苷酸为2542-2547 PmlⅠ切割位点，核苷酸2548-2553为HindⅢ切割位点和核苷酸2563-2565为终止密码子。载体pIND(Invitrogen,De Schelp,NL)中的质粒pIND-H-SemaL-EE(全长 7102bp)(SEQ ID号37)：核苷酸533-538为BamHⅠ切割位点(克隆)，核苷酸546- 548为ATG SEMA-L,核苷酸546-为读框SEMA-L，核苷酸2542-2547为PmlⅠ 切割位点，核苷酸2548-2553为HindⅢ切割位点，核苷酸2560-2592为Myc标记，核苷酸2605-2622为6xHis标记和核苷酸2623-2625为终止密码子。相当于pQE30-H-SemaLBH的载体pQE31(Qiagen,Hilden)中的质粒pQE30- H-SemaL-179-378.seq(4019bp)(SEQ ID号39)：核苷酸115-117为ATG，核苷酸 127-144为6xHis标记，核苷酸145-750为BamHⅠ-HindⅢPCP片段SEMA-L氨基酸(aa)179-378和核苷酸758-760为终止密码子。载体pQE31(Qiagen,Hilden)中的质粒pQE31-H-SemaL-(SH(3999 bp)(SEQ ID号40)：核苷酸115-117为ATG，核苷酸127-144为6xHis标记，核苷酸147-152为BamHⅠ位点，核苷酸159-729为Sacl-HindⅢ片段SEMA-L(C 端)aa480-666和核苷酸734-736为终止密码子。实施例用于实施例的实验条件：使用的PCR程序： Taq52-60(Ampli-TaqR聚合酶，Perkin Elmer,Weil der Stadt，德国) 96℃/60s 1个循环 96℃/15s-52℃/20s-70℃/60s 40个循环 70℃/60s 1个循环 Taq60-30 96℃/60s 1个循环 96℃/15s-60℃/20s-70℃/30s 35个循环 70℃/60s 1个循环 Taq60-60 96℃/60s 1个循环 96℃/15s-60℃/20s-70℃/60s 35个循环 70℃/60s 1个循环 Taq62-40 96℃/60s 1个循环 96℃/15s-62℃/20s-70/40s 35个循环 70℃/60s 1个循环用Taq聚合酶的PCR反应条件： 50μl反应混合物中具有100-200ng模板，200μM dNTP,0.2-0.4μM每一引物，2.5U Ampli-TaqR,5μl10x供给的反应缓冲液使用的程序： 1．XL62-6(加长模板PCR SystemR,Boehringer Mannheim，德国) 94℃/60s 1个循环 94℃/15s-62℃/30s-68℃/6min 10个循环 94℃/15s-62℃/30s-68℃/(6min+15s/个循环)25个循环 68℃/7min 1个循环 2．XL62-12(加长模板PCR SystemR,Boehringer Mannheim，德国) 94℃/60s 1个循环 94℃/15s-62℃/30s-68℃/12min 10个循环 94℃/15s-62℃/30s-68℃/(12min+5s/个循环)25个循环 68℃/7min 1个循环用加长模板PCR系统的PCR反应条件 50μl反应混合物中具有100-200ng模板，500μM dNTP,0.2-0.4μM每一引物，0.75μl酶混合物，5μl10x供给的No.2反应缓冲液。实施例1：从AHV-Sema序列开始(Ensser和Fleckenstein(1995)，普通病毒学杂志76: 1063-1067)，进行PCR和RACE-PCR。用于这里的起始材料是来自胎盘组织的人 cDNA，为进行RACE扩增其上已连接了衔接子(MarathonTM-cDNA扩增试剂盒， Clontech Laboratories GmbH,Tullastraβe4,69126Heidelberg，德国)。最初特异性引物(No.121234+No.121236，表6)用于扩增长度约为800bp(碱基对)的PCR 片段(PCR程序：(Taq60-60))。克隆与测序该片段(Taq染料标记脱氧终止子测序试剂盒，应用生物系统。Foster City,CA,USA/Brunnenweg 13,Weil der Stadt)。 PCR产物的测序揭示了与AHV-Sema的DNA序列具有高度同源性的序列，与两个EST序列相同。使用引物对(No.121237+No.121239，表6)鉴别出600bp的PCR片段。这表明它们是来自相同基因的DNA序列的克隆。实施例2：对实施例1的800bp PCR片段进行放射性标记(通过{Feinberg(1983)Anal. Biochem 132:6-13}的方法利用32P-α-dCTP进行随机引导)，并且作为多组织 Northem印迹法(人类多组织Northem印迹法Ⅱ,Clontech,Heidelberg，德国) 的探针，这包括来自脾、胸腺、前列腺、睾丸、卵巢、小肠、大肠和白细胞(PBL) 的mRNA样品。这清楚地显示了在脾和性腺(睾丸，卵巢)中长度约为3.3kb的 mRNA的表达，并且在胸腺和肠道中较弱。主印迹法杂交(许多组织RNA的点印迹法(Human RNA Master BlotTM,Clontech))确认了这一结果，并且在胎盘组织中也显示出强的表达。在42℃严格条件(5xSSC,50mM磷酸钠pH6.8,50％甲酰胺，100μg/ml 酵母RNA)下杂交16小时。对印迹严格地冲洗(65℃,0.2×SSC,0.1％SDS) 并且对Fuji BAS2000 PhosphoimagerTM暴光。实施例3：用这种探针筛选在噬菌体λgt10(人脾5’STRETCHPLUScDNA,Clontech) 中克隆的来自人脾的cDNA文库，同时鉴别到-个λ克隆。插入这个克隆的1.6kb 长的cDNA利用载体特异性引物No.207608+No.207609(表6)(位于EcoRⅠ克隆位点的侧面)由PCR(ExpandTM长模板PCR系统，Boehringer Mannhein GmbH, Sandhofer Straβe116,68305Mannhein)扩增，同时对产生的PCR片段进行测序。这个克隆包含cDNA的5’端，并且在3’方向也扩展已知的cDNA序列。从新的cDNA部分序列开始，设计出RACE-PCR的新引物(No.232643,No.232644, No.233084，表6)。利用一种改进的热循环技术(MJ-Research,Biozym Diagnostik GmbH,31833 Hess的PTC-200.Oldendorf)，其具有明显更有效的运行参数(加热和冷却速率)，利用引物No.232644和No.232643和AP1扩增3’RACE-PCR产物，并且将它克隆到载体pCR2.1(Invitrogen,De Schelp12,9351NVLeek，荷兰)中。对3’RACE-PCR产物进行测序，用这种方法确定cDNA的3’端。在 5’方向的RACE扩增(引物No.31990和No.233084和AP1)以几个核苷酸延伸过 cDNA5’端，并且确认在鉴别的λ克隆中发现的H-SemaL的氨基端。实施例4：从一短的鼠EST(登记号260340)开始，以从中产生的引物No.260813(表6)和 H-SemaL特异性引物No.121234(表6)进行PCR(条件：Taq52-60)扩增长约840bp 的鼠cDNA的DNA片段，随后克隆至载体pCR2.1中。包含该DNA片段的基因称为M-SemaL。产生的M-SemaL DNA片段用于从小鼠脾(小鼠脾5’STRETCH cDNA,Clontech)调查cDNA库，鉴定几个克隆是可能的。从鼠内皮cDNA用引物No.260812和No.260813进行PCR(Taq60-30)提供了长为244碱基对的PCR片段。PCR结果表明在鼠内皮细胞中有明显基线表达，用细胞因子干扰素-γ和脂多糖刺激后则下降。实施例5：采用荧光原位杂交(FISH)来调查染色体的定位情况。为了这一目的，从人血液样品和小鼠细胞系BINE4.8开始分别制备人和鼠的中期染色体(Keyna等(1995) 免疫学杂志155,5536-5542)(Kraus等(1994)遗传学23,272-274)。利用RNase 和胃蛋白酶处理载玻片(Liehr等(1995)应用细胞遗传学21,185-188)。对于杂交，利用120mg人切口平移信息素样品和200mg相应的小鼠样品。每种情况下，杂交在37℃,20μgSTD以及4.0μgCOT1-DNA存在下在湿室中进行3天。用50％甲酰胺/2xSSC冲洗载玻片(45℃下3次，每次5min)，然后，用2xSSC 冲洗(37℃下3次，每次5min)，以及用FITC-亲和素系统(Liehr等(1995))检测生物素化样品。利用荧光显微镜测评载玻片。每个实验以双份进行，测定了25个中期 /样品。表明H-SemaL位于染色体15q23上。定位在邻近染色体是Bardet-Biedls综合症和Tay-Sachs疾病的基因座(氨基已糖苷酶)。实施例6： H-SemaL基因的基因组内含子-外显子结构的大部分已被阐明。基因组DNA片段扩增从已从PHA-刺激外周淋巴细胞(血液)分离出来的250mg 人基因组DNA开始。较短的片段利用Ampli TaqR(Perkin Elmer)进行扩增，较长的片段利用加长模板PCR SystemR(Boehringer Mannheim)进行扩增。到目前为止，通过PCR扩增来克隆和鉴别H-SemaL的几乎完全的基因组座是可能的。现已可能鉴别总共超过8888bp的基因组序列，从而基本阐明该基因的内含子-外显子结构。实施例7：表达克隆：因为不能从lambda-gt10cDNA库分离出来信息素基因完全克隆，同时也不能经 PCR获得完全克隆，所以使用N端DNA片段的引物No.240655和No.121339 以及C端DNA片段的引物No.240656(含有HindⅢ和PmeⅠ切割位点)和No. 121234通过PCR(XL62-6)在2个重叠亚片段上扩增出cDNA的编码区。产生的 DNA片段(亚片段)克隆到载体pCR21中。对两个亚片段完全测序，最后通过插入 0.6kb C端Sstl-HindⅢ限制片段到质粒(包含N端DNA片段，并且已经用限制酶 SstⅠ与HindⅢ酶切)中来制备完全的H-SemaL cDNA。利用EcoRⅠ切割位点(在 pCR2.1中)和HindⅡ切割位点(在表6的引物No.240656中)从质粒pCR2.1-H- SemaL(表7中显示的序列，SEQ ID NO.34)上切除完全基因，并且连接到相应切割的组成性表达载体pCDNA3.1(-)MycHisA(Invitrogen)上。EcoRⅠ-ApaⅠ片段(没有 Myc-His标记)从所产生的重组质粒pCDNA3.1(-)H-SemaL-MycHisA(表8中显示的序列)中切下，并且连接到诱导型载体pIND(同样已用EcoRⅠ-ApaⅠ酶切)(蜕皮激素诱导型哺乳动物表达系统，Invitrogen)上。重组质粒称为pIND-H-SemaLEA(表11 中显示的序列)。将pCDNA3.1(-)H-SemaL-Myc-HisA(表9中显示的序列)的 EcoRⅠ-Pmel片段(具有Myc-His标记)插人到EcoRⅠ-EcoRⅤ-切割的载体pIND中。重组质粒称为pIND-H-SemaL-EE(表10中显示的序列)。通过连接PCR-扩增EGFP读框(来自载体pEGFP-Cl(Clontech)，利用引物No. 243068+No.243069,Taq52-60)到pCDNA3.1(-)H-SemaL-MycHisA的Pmel切割位点上制备具有增强绿色荧光蛋白质(EGFP)的H-SemaL融合基因，形成质粒 pCDNA3.1(-)H-SemaL-EGFP-MycHisA(表9中显示的序列)。在表7至13表中用小写字母标出了H-SemaL的序列，其部分片段或衍生物，同时用大写字母标出了质粒序列。实施例8：为了制备H-SemaL-特异性抗体，将H-SemaL的cDNA片段整合进原核表达载体，并且在大肠杆菌中表达，以及纯化信息素衍生物。信息素衍生物作为具有 His标记的融合蛋白来表达。因此，利用包含His标记序列并允许信息素cDNA片段整合入读框的载体。例如，N端6x组氨酸标记使用镍螯合亲和性层析纯化成为可能(Qiagen GmbH,Max-Volmer Straβe4,40724Hilden)： 1．利用引物No.150788和No.150789通过PCR扩增编码179-378位氨基酸的部分H-SemaLcDNA，并将这条DNA片段连接到载体pQE30(已用限制性酶 BamHⅠ和HindⅢ切割)(Qiagen)上(构建体pQE30-H-SemaL-BH(表12中显示的序列))。 2．从质粒pCR2.1上用限制性酶SstⅠ与HindⅢ切下编码C端480-666位氨基酸的H-SemaLcDNA部分，并且连接到载体pQE3l(已用SstⅠ和HindⅢ切割)(Qiagen) 上(构建体pQE31-H-SemaL-SH(表13中显示的序列)。通过DNA测序检查序列在正确读框中的正确整合。通过Ni2+亲和性层析纯化由N端6x组氨酸标记和部分信息素H-SemaL组成的融合蛋白。纯化的融合蛋白用于对各种动物(兔，小鸡，小鼠)的免疫。实施例9：各种细胞类型的FACS分析(图4和5) 在FACS缓冲液(含有5％胎牛血清(FCS)和0.1％Na叠氮化钠的磷酸缓冲盐水 (PBS)中冲洗细胞(大约0.2-0.5×106)，然后在每种情况中与抗血清(在冰上)培养1 小时。用于对照(上层小鸡预免疫前血清(1∶5))和特异性检测(特异性染色)的初级抗体为H-SemaL-特异性小鸡抗血清(1∶50)。用通过镍螯合亲和性层析(如实施例8所描述的)纯化的蛋白质免疫小鸡产生含有抗H-SemaL氨基酸(Aa)179-378(具有N端His标记)抗体的特异性抗血清。所使用的次级抗体是来自兔的FITC-标记抗小鸡F(ab’)抗体(Dianova Jackson实验室，Order No.303-095-006，汉堡，德国)(1mg/ml)。FITC-标记的兔抗小鼠IgG用于CD100染色。次级抗体每种情况下在FACS缓冲液中以1∶50进行稀释。然后冲洗细胞，在PBS中进行重悬浮，并且在FACS中分析。利用FACS-跟踪仪(Becton-Dickinson)进行FACS分析。原理：单细胞悬浮液穿过一个测量通道，其中以488nm的激光光线照射这些细胞，从而激发荧光染料(FITC)。测量散射正向光线(正向散射，FSC：与细胞大小相关)，和其侧向光线(侧向散射，SSC：与颗粒量相关：不同细胞类型有差异)以及通道1的荧光(FL1)(FITC发射范围的波长，530nm处最大值)。以这种方法每次测量10,000件(细胸)。点印迹(图4a-k)(左图)：SSC对FSC(大小对颗粒量/散射)，右边窗口中分析了 (界线内)相似大小和颗粒含量的(均一)细胞群。。右边窗口显示了FL1的强度(X轴)对事件数(Y轴)，也就是说频度分布。在每个这样的图中，对照血清的结果(不光滑曲线)叠加在特异性染色(光滑曲线) 的结果上面。与对照相比较特异性染色的曲线的右移相当于H-SemaL在相应细胞中的表达。一种移出越大意味着更强的表达。用于FACS分析的细胞系： a)U937细胞系美国典型培养物保藏中心ATCC；ATCC号CRL-1593 名称U-937 组织：淋巴瘤；组织细胞；单细胞样物种：人；保藏者：H.Koren b)THP-1细胞系 ATCC保藏号：TIE-202 组织：单核细胞；急性单核细胞白血病物种：人保藏者：S.Tsuchiya c)K-562细胞系 ATCC保藏号：CCL-243 组织：慢性骨髓性白血病物种：人；保藏者：H.T.Holden d)L-428细胞系 DSMZ-德意志微生物保藏中心，DSMZ No:ACCl97 细胞类型：人Hodgkin淋巴瘤 e)Jurkat细胞系 DSMZ-德意志微生物保藏中心，DSMZ No:ACC282 细胞类型：人T细胞白血病 f)Daudi细胞系 ATCC保藏号CCL-213 组织：Burkitt淋巴瘤；B淋巴母细胞；B细胞物种：人；保藏者：G.Klein g)LCL细胞系 EBV-转化的淋巴母细胞样B-细胞系。 h)Jiyoye(P-2003)细胞系 ATCC保藏号CCL-87 组织：Burkitt淋巴瘤；B细胞，B淋巴细胞物种：人保藏者：W.Henle i)CBL-Mix57 用重组体H.Saimiri(没有缺失的野生型)转化的人T-细胞系(从血液中分离） j)CBL-Mix59 用H.Saimiri(ORF71缺失)转化的人T-细胞系(从血液中分离)。实施例10：蛋白质凝胶和蛋白质印迹法将可分泌的人SEMA-L(表4的氨基酸42-649(没有信号肽和跨膜结构域))克隆到质粒pMelBac-A(Invitrogen De Schelp,Leck，荷兰，Cv1950-20)中，这样就产生了质粒pMeIBacA-H-SemaL(长度6622bp)(图8)。H-SemaL衍生物在杆状病毒系统中表达(Bac-N-Blue,Invitrogen)。在从昆虫卵细胞Sf9(来自Spodoptera frugiperda)和High FiveTM(来自粉纹夜蛾U.S.Pat.No.5,300,435，从Invitrogen购得) 中通过具有重组体嗜斑纯化的杆状病毒的感染产生的细胞系中进行表达。根据制造商的说明进行表达。然后在凝胶中对蛋白质进行分级分离，并用蛋白质印迹法检测H-SemaL衍生物。用H-SemaL-特异性小鸡抗血清进行检测(比较实施例8和图7)(稀释液1∶ 100)。根据制造商的说明利用抗-IgY-HRP偶联物(稀释液：1∶3000，来自驴； Dianova Jackson实验室)检测特异性小鸡抗体。实施例11:pMeIBacA-H-SEMAL的制备通过克隆适当的编码H-SemaL的氨基酸42-649的DNA片段到载体 pMeIBacA(4.8kbInvitrogen)中来制备重组载体(pMeIBacA-H-SEMAL,6622bp)(比较pMeIBacA-H-SEMAL的注释)。通过BamHⅠ和EcoRⅠ，克隆发生在载体中的信号序列(“蜜蜂蜂毒肽信号序列”)之后的读框中。利用引物对h-sema-l杆状病毒5’ 和第h-sema-l杆状病毒3’，扩增相应的H-SemaLDNA片段。扩增(TaKaRa ExTa9标记聚合酶)和克隆的引物：用于没有信号序列的扩增并引入BamHⅠ切割位点的＂h-sema-l杆状病毒5’＂ 5’-CCGGATCCGCCCAGGGCCACCTAAGGAGCGG-3’(SEQ ID NO.43)，用于没有跨膜结构域的扩增并引入EcoRⅠ切割位点的＂h-sema-l杆状病毒3’＂5’- CTGAATTCAGGAGCCAGGGCACAGGCATG-3’(SEQ ID NO.44)。附图：图1:H-Sema-L的组织特异性表达 A)多组织RNA印迹(Clontech,Heidelberg，德国)。从左至右的载样：每泳道 20μg来自脾，胸腺，前列腺，睾丸。卵巢，小肠，大肠粘膜，外周(血液)白细胞的Poly-A-RNA。标记大小标准。在严格条件下，印迹与800碱基对长的H-SemaL探针进行杂交。图2:H-SemaLcDNA的克隆和编码序列H-SemaL(H-SemaL基因)的基因组结构的图示。上：EST序列的定位(登记号；EST序列的定位以与AHV-Sema序列相关的形式显示。下：扩增的PCR和RACE产物和与在完全H-SemaLcDNA中相关cDNA克隆的定位以及编码蛋白质的开放读框(ORF)。底部：在H-SemaL基因中与基因组序列相关的外显子的相对定位。用箭头表明了寡核苷酸引物的位置。图3：系统发育树：从列出的信息素序列的多重对比获得。信息素的系统发育关系在系统树中可以从它们的组群中推出。图4：在各种细胞系和各种细胞类型中的H-SemaL表达的FACS分析(比较实施例8)。图5：CD100和H-SemaL表达的比较分析(比较实施例9)。图6：在HiFive和Sf9细胞中可分泌的SEMA-L(H-SemaL)的表达(比较实施例10)。在杆状病毒系统(Bac-N-Blue,Invitrogen)中的pMelBac-A(Invitrogen)的aa 42- 649 用特异性小鸡抗血清1(1∶100)和抗-IgY-HRP偶联物(1∶3000，来自兔。 Jackson Lab.)的检测 1,4,6未感染的HiFive细胞(无血清) 2,3,5,7,8以重组体杆状病毒感染的HiFive细胞(无血清) MRainbow分子量标志(AmershamRPN756) 9,10感染的Sf9细胞(包含血清的介质)。图7：抗血清的特异性泳道1-3：小鸡1；泳道4-6：小鸡2 泳道1和泳道4：免疫前血清泳道2和5：免疫60天的血清泳道4和6：免疫105天的血清用H-SemaL的179-378位氨基酸(具有氨基端His标记)进行免疫(比较实施例 8，部分1)。图8：对pMeIBacA-H-SEMAL的质粒图谱的描绘。如实施例11的描述制备重组质粒。表1来自不同物种的信息素的不同亚型名称别名物种参考文献 H-SemaⅢ (H-SemaD) 人 Sec. (Kolodkin等，1993) CD-100 人 TM,IC；与CD45相连，在T细胞中表达 (Hall等，1996) H-SemaⅤ (H-SemaA) 人 Sec.；基因座3p21.3 (Sekido等，1996；Roche等，1996) H-SemaⅣ (H-Sema3F) 人 Sec.；基因座3p21.3 (Xiang等，1996；Sekido等，1996) H-SemaE 人 Sec.；不同于M-Sema-E的3’端(提高读框对比) AB000220(Yamada1997未发表) H-SemaK KIAA0311 人 Sec.； (Nagase等，1997) H-SemaL SEMAL 人 TM,无IC 本申请 M-SemaA 小鼠 Sec. (Püschel等，1995) M-SemaB 小鼠 TM,IC (Püschel等，1995) M-SemaC 小鼠 TM,IC (Püschel等，1995) M-SemaD M-SemaⅢ 小鼠 Sec. (Messersmith等，1995；Püschel等，1995 M-SemaE 小鼠 Sec,；5＇部分序列 (Püschel等，1995) M-SemaF1 M-SemaF 小鼠 TM,IC (Inagaki等，1995) M-SemaG2 M-SemaG 小鼠 TM,IC；在淋巴细胞中表达，CD100的小鼠同系物 (Furuyama等，1996) M-SemaF2 M-SemaF 小鼠 TM,IC；凝血调节蛋白基元 (Adams等，1996) M-SemaG1 M-SemaG 小鼠 TM,IC；凝血调节蛋白基元 (Adams等，1996) M-SemaH 小鼠 Sec. (Christensen1996未发表)Z80941 M-SemaⅥa 小鼠 TM,IC (Zhou等，1997) M-SemaL Semal 小鼠部分序列本申请脑衰蛋白-1 小鸡 Sec. (Luo等，1993) 脑衰蛋白-2 小鸡 Sec. (Luo等，1995) 脑衰蛋白-3 小鸡 Sec. (Luo等，1995) 脑衰蛋白-4 小鸡部分序列 (Luo等，1995) 脑衰蛋白-5 小鸡 Sec. (Lou等，1995) R-SemaⅢ 大鼠 Sec. (Giger等，1996) T-SemaⅠ Tribolum oonfusum TM,IC (Kolodkin等，1993) Ce-SemaⅠ C.elegans TM,IC U15667(Roy1994未出版) G-SemaⅠ Fasciclin-Ⅳ 蚱蜢 TM,IC (Kolodkin等，1993) D-SemaⅠ 果蝇属 TM,IC (Kolodkin等，1993) D-SemaⅡ 果蝇属 Sec. (Kolodkin等，1993) AHV-Sema AHV-1 Sec. (Ensser和Fleckenstein,1995) ORF-A39 牛痘 Sec. (Kolodkin等，1993) ORF-A39 同系物天花 Sec.； (Kolodkin等，1993) TM：跨膜区Sec：分泌性IC：推定的胞内胞浆序列基元表2：H-SemaL的cDNA序列(2636个核苷酸)(SEQ ID NO.:1) 1 cggggccacg ggatgacgcc tcctccgccc ggacgtgccg cccccagcgc 51 accgcgcgcc cgcgtccctg gcccgccggc tcggttgggg cttccgctgc 101 ggctgcggct gctgctgctg ctctgggcgg ccgccgcctc cgcccagggc 151 cacctaagga gcggaccccg catcttcgcc gtctggaaag gccatgtagg 201 gcaggaccgg gtggactttg gccagactga gccgcacacg gtgcttttcc 251 acgagccagg cagctcctct gtgtgggtgg gaggacgtgg caaggtctac 301 ctctttgact tccccgaggg caagaacgca tctgtgcgca cggtgaatat 351 cggctccaca aaggggtcct gtctggataa gcgggactgc gagaactaca 401 tcactctcct ggagaggcgg agtgaggggc tgctggcctg tggcaccaac 451 gcccggcacc ccagctgctg gaacctggtg aatggcactg tggtgccact 501 tggcgagatg agaggctacg cccccttcag cccggacgag aactccctgg 551 ttctgtttga aggggacgag gtgtattcca ccatccggaa gcaggaatac 601 aatgggaaga tccctcggtt ccgccgcatc cggggcgaga gtgagctgta 651 caccagtgat actgtcatgc agaacccaca gttcatcaaa gccaccatcg 701 tgcaccaaga ccaggcttac gatgacaaga tctactactt cttccgagag 751 gacaatcctg acaagaatcc tgaggctcct ctcaatgtgt cccgtgtggc 801 ccagttgtgc aggggggacc agggtgggga aagttcactg tcagtctcca 851 agtggaacac ttttctgaaa gccatgctgg tatgcagtga tgctgccacc 901 aacaagaact tcaacaggct gcaagacgtc ttcctgctcc ctgaccccag 951 cggccagtgg agggacacca gggtctatgg tgttttctcc aacccctgga 1001 actactcagc cgtctgtgtg tattccctcg gtgacattga caaggtcttc 1051 cgtacctcct cactcaaggg ctaccactca agccttccca acccgcggcc 1101 tggcaagtgc ctcccagacc agcagccgat acccacagag accttccagg 1151 tggctgaccg tcacccagag gtggcgcaga gggtggagcc catggggcct 1201 ctgaagacgc cattgttcca ctctaaatac cactaccaga aagtggccgt 1251 tcaccgcatg caagccagcc acggggagac ctttcatgtg ctttacctaa 1301 ctacagacag gggcactatc cacaaggtgg tggaaccggg ggagcaggag 1351 cacagcttcg ccttcaacat catggagatc cagcccttcc gccgcgcggc 1401 tgccatccag accatgtcgc tggatgctga gcggaggaag ctgtatgtga 1451 gctcccagtg ggaggtgagc caggtgcccc tggacctgtg tgaggtctat 1501 ggcgggggct gccacggttg cctcatgtcc cgagacccct actgcggctg 1551 ggaccagggc cgctgcatct ccatctacag ctccgaacgg tcagtgctgc 1601 aatccattaa tccagccgag ccacacaagg agtgtcccaa ccccaaacca 1651 gacaaggccc cactgcagaa ggtttccctg gccccaaact ctcgctacta 1701 cctgagctgc cccatggaat cccgccacgc cacctactca tggcgccaca 1751 aggagaacgt ggagcagagc tgcgaacctg gtcaccagag ccccaactgc 1801 atcctgttca tcgagaacct cacggcgcag cagtacggcc actacttctg 1851 cgaggcccag gagggctcct acttccgcga ggctcagcac tggcagctgc 1901 tgcccgagga cggcatcatg gccgagcacc tgctgggtca tgcctgtgcc 1951 ctggctgcct ccctctggct gggggtgctg cccacactca ctcttggctt 2001 gctggtccac tagggcctcc cgaggctggg catgcctcag gcttctgcag 2051 cccagggcac tagaacgtct cacactcaga gccggctggc ccgggagctc 2101 cttgcctgcc acttcttcca ggggacagaa taacccagtg gaggatgcca 2151 ggcctggaga cgtccagccg caggcggctg ctgggcccca ggtggcgcac 2201 ggatggtgag gggctgagaa tgagggcacc gactgtgaag ctggggcatc 2251 gatgacccaa gactttatct tctggaaaat atttttcaga ctcctcaaac 2301 ttgactaaat gcagcgatgc tcccagccca agagcccatg ggtcggggag 2351 tgggtttgga taggagagct gggactccat ctcgaccctg gggctgaggc 2401 ctgagtcctt ctggactctt ggtacccaca ttgcctcctt cccctccctc 2451 tctcatggct gggtggctgg tgttcctgaa gacccagggc taccctctgt 2501 ccagccctgt cctctgcagc tccctctctg gtcctgggtc ccacaggaca 2551 gccgccttgc atgtttattg aaggatgttt gctttccgga cggaaggacg 2601 gaaaaagctc tgaaaaaaaa aaaaaaaaaa aaaaaa 表3：M-SemaL的cDNA的核苷酸序列(部分，1195个核苷酸)(SEQ ID NO.:2) 1 cggggctgcg ggatgacgcc tcctcctccc ggacgtgccg cccccagcgc 51 accgcgcgcc cgcgtcctca gcctgccggc tcggttcggg ctcccgctgc 101 ggctgcggct tctgctggtg ttctgggtgg ccgccgcctc cgcccaaggc 151 cactcgagga gcggaccccg catctccgcc gtctggaaag ggcaggacca 201 tgtggacttt agccagcctg agccacacac cgtgcttttc catgagccgg 251 gcagcttctc tgtctgggtg ggtggacgtg gcaaggtcta ccacttcaac 301 ttccccgagg gcaagaatgc ctctgtgcgc acggtgaaca tcggctccac 351 aaaggggtcc tgtcaggaca aacaggactg tgggaattac atcactcttc 401 tagaaaggcg gggtaatggg ctgctggtct gtggcaccaa tgcccggaag 451 cccagctgct ggaacttggt gaatgacagt gtggtgatgt cacttggtga 501 gatgaaaggc tatgccccct tcagcccgga tgagaactcc ctggttctgt 551 ttgaaggaga tgaagtgtac tctaccatcc ggaagcagga atacaacggg 601 aagatccctc ggtttcgacg cattcggggc gagagtgaac tgtacacaag 651 tgatacagtc atgcagaacc cacagttcat caaggccacc attgtgcacc 701 aagaccaagc ctatgatgat aagatctact acttcttccg agaagacaac 751 cctgacaaga accccgaggc tcctctcaat gtgtcccgag tagcccagtt 801 gtgcaggggg gaccagggtg gtgagagttc gttgtctgtc tccaagtgga 851 acaccttcct gaaagccatg ttggtctgca gc gatgcagc caccaacagg 901 aacttcaatc ggctgcaaga tgtcttcctg ctccctgacc ccagtggcca 951 gtggagagat accagggtct atggcgtttt ctccaacccc tggaactact 1001 cagctgtctg cgtgtattcg cttggtgaca ttgacagagt cttccgtacc 1051 tcatcgctca aaggctacca catgggcctt tccaaccctc gacctggcat 1101 gtgcctccca aaaaagcagc ccatacccac agaaaccttc caggtagctg 1151 atagtcaccc agaggtggct cagagggtgg aacctatggg gcccc 表4：H-SemaL的氨基酸序列(666个氨基酸)(SEQ ID NO.:3) 1 MTPPPPGRAA PSAPRARVPG PPARLGLPLR LRLLLLLWAA AASAQGHLRS 51 GPRIFAVWKG HVGQDRVDFG QTEPHTVLFH EPGSSSVWVG GRGKVYLFDF 101 PEGKNASVRT VNIGSTKGSC LDKRDCENYI TLLERRSEGL LACGTNARHP 151 SCWNLVNGTV VPLGEMRGYA PFSPDENSLV LFEGDEVYST IRKQEYNGKI 201 PRFRRIRGES ELYTSDTVMQ NPQFIKATIV HQDQAYDDKI YYFFREDNPD 251 KNPEAPLNVS RVAQLCRGDQ GGESSLSVSK WNTFLKAMLV CSDAATNKNF 301 NRLQDVFLLP DPSGQWRDTR VYGVFSNPWN YSAVCVYSLG DIDKVFRTSS 351 LKGYHSSLPN PRPGKCLPDQ QPIPTETFQV ADRHPEVAQR VEPMGPLKTP 401 LFHSKYHYQK VAVHRMQASH GETFHVLYLT TDRGTIHKVV EPGEQEHSFA 451 FNIMEIQPFR RAAAIQTMSL DAERRKLYVS SQWEVSQVPL DLCEVYGGGC 501 HGCLMSRDPY CGWDQGRCIS IYSSERSVLQ SINPAEPHKE CPNPKPDKAP 551 LQKVSLAPNS RYYLSCPMES RHATYSWRHK ENVEQSCEPG HQSPNCILFI 601 ENLTAQQYGH YFCEAQEGSY FREAQHWQLL PEDGIMAEHL LGHACALAAS 651 LWLGVLPTLTLGLLVH 表5：M-SemaL的(部分)氨基酸序列(394个氨基酸，相应于H-SemaL的1-396 位)(SEQ ID NO.:4) 1 MTPPPPGRAA PSAPRARVLS LPARFGLPLR LRLLLVFWVA AASAQGHSRS 51 GPRISAVWKG QDHVDFSQPE PHTVLFHEPG SFSVWVGGRG KVYHFNFPEG 101 KNASVRTVNI GSTKGSCQDK QDCGNYITLL ERRGNGLLVC GTNARKPSCW 151 NLVNDSVVMS LGEMKGYAPF SPDENSLVLF EGDEVYSTIR KQEYNGKIPR 201 FRRIRGESEL YTSDTVMQNP QFIKATIVHQ DQAYDDKIYY FFREDNPDKN 251 PEAPLNVSRV AQLCRGDQGG ESSLSVSKWN TFLKAMLVCS DAATNRNFNR 301 LQDVFLLPDP SGQWRDTRVY GVFSNPWNYS AVCVYSLGDI DRVFRTSSLK 351 GYHMGLSNPR PGMCLPKKQP IPTETFQVAD SHPEVAQRVE PMGP 表6：合成寡核苷酸(Eurogentec,Seraing，比利时) 引物的编号/名称引物(合成寡核苷酸)的核苷酸序列 91506/AP2 actcactatagggctcgagcggc (SEQ ID NO.:5) 121234 agccgcacacggtgcttttc (SEQ ID NO.:6) 121235/Est2 gcacagatgcgttcttgccc (SEQ ID NO.:7) 121236/Est3 accatagaccctggtgtccc (SEQ ID NO.:8) 121237/Est4 gcagtgatgctgccaccaac (SEQ ID NO.:9) 121238 ccagaccatgtcgctggatg (SEQ ID NO.:10) 121239/Est6 acatgaggcaaccgtggcag (SEQ ID NO.:11) 131989/AP1 ccatcctaatacgactcactatagggc (SEQ ID NO.:12) 131990/Est7 aggtagaccttgccacgtcc (SEQ ID NO.:13) 131991 gaacttcaacaggctgcaagacg (SEQ ID NO.:14) 131992 atgctgagcggaggaagctg (SEQ ID NO.:15) 131993 ccgccatacacctcacacag (SEQ ID NO.:16) 150788 ctggaagctttctgtgggtatcggctgc (SEQ ID NO.:17) 150789 tttggatccctggttctgtttgaag (SEQ ID NO.:18) 167579/cDNA ttctagaattcagcggccgcttttttttttttttttttttttttttttttvn 合成引物(SEQ ID NO.:19) 168421 ggggaaagttcactgtcagtctccaag (SEQ ID NO.:20) 168422 gggaatacacacagacggctgagtag (SEQ ID NO.:21) 207608/ agcaagttcagcctggttaagt (SEQ ID NO.:22) λgt10插入物的扩增 207609/ ttatgagtatttcttccaggg (SEQ ID NO.:23) λgt10插入物的扩增 232643/Est13 ccattaatccagccgagccacacaag (SEQ ID NO.:24) 232644/Est14 catctacagctccgaacggtcagtg (SEQ ID NO.:25) 233084 cagcggaagccccaaccgag (SEQ ID NO.:26) 240655/hs5 gggatgacgcctcctccgcccgg (SEQ ID NO.:27) 240656/hs3 aagcttcacgtggaccagcaagccaagagtg (SEQ ID NO.:28) 240657/hs3c aagctttttccgtccttccgtccgg (SEQ ID NO.:29) 243068 atggtgagcaagggcgaggagctg (SEQ ID NO.:30) 243069 cttgtacagctcgtccatgccgag (SEQ ID NO.:31) 280812 GGGTGGTGAGAGTTCGTTGTCTGTC (SEQ ID NO.:32) 260813 GAGCGATGAGGTACGGAAGACTCTG (SEQ ID NO.:33) 表7：重组质粒pCR2.1-H-SemaL的核苷酸序列(SEQ ID NO.:34) 1 AGCGCCCAAT ACGCAAACCG CCTCTCCCCG CGCGTTGGCC GATTCATTAA 51 TGCAGCTGGC ACGACAGGTT TCCCGACTGG AAAGCGGGCA GTGAGCGCAA 101 CGCAATTAAT GTGAGTTAGC TCACTCATTA GGCACCCCAG GCTTTACACT 151 TTATGCTTCC GGCTCGTATG TTGTGTGGAA TTGTGAGCGG ATAACAATTT 201 CACACAGGAA ACAGCTATGA CCATGATTAC GCCaagcttc acgtggacca 251 gcaagccaag agtgagtgtg ggcagcaccc ccagccagag ggaggcagcc 301 agggcacagg catgacccag caggtgctcg gccatgatgc cgtcctcggg 351 cagcagctgc cagtgctgag cctcgcggaa gtaggagccc tcctgggcct 401 cgcagaagta gtggccgtac tgctgcgccg tgaggttctc gatgaacagg 451 atgcagttgg ggctctggtg accaggttcg cagctctgct ccacgttctc 501 cttgtggcgc catgagtagg tggcgtggcg ggattccatg gggcagctca 551 ggtagtagcg agagtttggg gccagggaaa ccttctgcag tggggccttg 601 tctggtttgg ggttgggaca ctccttgtgt ggctcggctg gattaatgga 651 ttgcagcact gaccgttcgg agctgtagat ggagatgcag cggccctggt 701 cccagccgca gtaggggtct cgggacatga ggcaaccgtg gcagcccccg 751 ccatagacct cacacaggtc caggggcacc tggctcacct cccactggga 801 gctcacatac agcttcctcc gctcagcatc cagcgacatg gtctggatgg 851 cagccgcgcg gcggaagggc tggatctcca tgatgttgaa ggcgaagctg 901 tgctcctgct cccccggttc caccaccttg tggatagtgc ccctgtctgt 951 agttaggtaa agcacatgaa aggtctcccc gtggctggct tgcatgcggt 1001 gaacggccac tttctggtag tggtatttag agtggaacaa tggcgtcttc 1051 agaggcccca tgggctccac cctctgcgcc acctctgggt gacggtcagc 1101 cacctggaag gtctctgtgg gtatcggctg ctggtctggg aggcacttgc 1151 caggccgcgg gttgggaagg cttgagtggt agcccttgag tgaggaggta 1201 cggaagacct tgtcaatgtc accgagggaa tacacacaga cggctgagta 1251 gttccagggg ttggagaaaa caccatagac cctggtgtcc ctccactggc 1301 cgctggggtc agggagcagg aagacgtctt gcagcctgtt gaagttcttg 1351 ttggtggcag catcactgca taccagcatg gctttcagaa aagtgttcca 1401 cttggagact gacagtgaac tttccccacc ctggtccccc ctgcacaact 1451 gggccacacg ggacacattg agaggagcct caggattctt gtcaggattg 1501 tcctctcgga agaagtagta gatcttgtca tcgtaagcct ggtcttggtg 1551 cacgatggtg gctttgatga actgtgggtt ctgcatgaca gtatcactgg 1601 tgtacagctc actctcgccc cggatgcggc ggaaccgagg gatcttccca 1651 ttgtattcct gcttccggat ggtggaatac acctcgtccc cttcaaacag 1701 aaccagggag ttctcgtccg ggctgaaggg ggcgtagcct ctcatctcgc 1751 caagtggcac cacagtgcca ttcaccaggt tccagcagct ggggtgccgg 1801 gcgttggtgc cacaggccag cagcccctca ctccgcctct ccaggagagt 1851 gatgtagttc tcgcagtccc gcttatccag acaggacccc tttgtggagc 1901 cgatattcac cgtgcgcaca gatgcgttct tgccctcggg gaagtcaaag 1951 aggtagacct tgccacgtcc tcccacccac acagaggagc tgcctggctc 2001 gtggaaaagc accgtgtgcg gctcagtctg gccaaagtcc acccggtcct 2051 gccctacatg gcctttccag acggcgaaga tgcggggtcc gctccttagg 2101 tggccctggg cggaggcggc ggccgcccag agcagcagca gcagccgcag 2151 ccgcagcgga agccccaacc gagccggcgg gccagggacg cgggcgcgcg 2201 gtgcgctggg ggcggcacgt ccgggcggag gaggcgtcat cccaagccga 2251 attcTGCAGA TATCCATCAC ACTGGCGGCC GCTCGAGCAT GCATCTAGAG 2301 GGCCCAATTC GCCCTATAGT GAGTCGTATT ACAATTCACT GGCCGTCGTT 2351 TTACAACGTC GTGACTGGGA AAACCCTGGC GTTACCCAAC TTAATCGCCT 2401 TGCAGCACAT CCCCCTTTCG CCAGCTGGCG TAATAGCGAA GAGGCCCGCA 2451 CCGATCGCCC TTCCCAACAG TTGCGCAGCC TGAATGGCGA ATGGGACGCG 2501 CCCTGTAGCG GCGCATTAAG CGCGGCGGGT GTGGTGGTTA CGCGCAGCGT 2551 GACCGCTACA CTTGCCAGCG CCCTAGCGCC CGCTCCTTTC GCTTTCTTCC 2601 CTTCCTTTCT CGCCACGTTC GCCGGCTTTC CCCGTCAAGC TCTAAATCGG 2651 GGGCTCCCTT TAGGGTTCCG ATTTAGAGCT TTACGGCACC TCGACCGCAA 2701 AAAACTTGAT TTGGGTGATG GTTCACGTAG TGGGCCATCG CCCTGATAGA 2751 CGGTTTTTCG CCCTTTGACG TTGGAGTCCA CGTTCTTTAA TAGTGGACTC 2801 TTGTTCCAAA CTGGAACAAC ACTCAACCCT ATCGCGGTCT ATTCTTTTGA 2851 TTTATAAGGG ATTTTGCCGA TTTCGGCCTA TTGGTTAAAA AATGAGCTGA 2901 TTTAACAAAT TCAGGGCGCA AGGGCTGCTA AAGGAACCGG AACACGTAGA 2951 AAGCCAGTCC GCAGAAACGG TGCTGACCCC GGATGAATGT CAGCTACTGG 3001 GCTATCTGGA CAAGGGAAAA CGCAAGCGCA AAGAGAAAGC AGGTAGCTTG 3051 CAGTGGGCTT ACATGGCGAT AGCTAGACTG GGCGGTTTTA TGGACAGCAA 3101 GCGAACCGGA ATTGCCAGCT GGGGCGCCCT CTGGTAAGGT TGGGAAGCCC 3151 TGCAAAGTAA ACTGGATGGC TTTCTTGCCG CCAAGGATCT GATGGCGCAG 3201 GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATCGTTT CGCATGATTG 3251 AACAAGATGG ATTGCACGCA GGTTCTCCGG CCGCTTGGGT GGAGAGGCTA 3301 TTCGGCTATG ACTGGGCACA ACAGACAATC GGCTGCTCTG ATGCCGCCGT 3351 GTTCCGGCTG TCAGCGCAGG GGCGCCCGGT TCTTTTTGTC AAGACCGACC 3401 TGTCCGGTGC CCTGAATGAA CTGCAGGACG AGGCAGCGCG GCTATCGTGG 3451 CTGGCCACGA CGGGCGTTCC TTGCGCAGCT GTGCTCGACG TTGTCACTGA 3501 AGCGGGAAGG GACTGGCTGC TATTGGGCGA AGTGCCGGGG CAGGATCTCC 3551 TGTCATCTCG CCTTGCTCCT GCCGAGAAAG TATCCATCAT GGCTGATGCA 3601 ATGCGGCGGC TGCATACGCT TGATCCGGCT ACCTGCCCAT TCGACCACCA 3651 AGCGAAACAT CGCATCGAGC GAGCACGTAC TCGGATGGAA GCCGGTCTTG 3701 TCGATCAGGA TGATCTGGAC GAAGAGCATC AGGGGCTCGC GCCAGCCGAA 3751 CTGTTCGCCA GGCTCAAGGC GCGCATGCCC GACGGCGAGG ATCTCGTCGT 3801 GATCCATGGC GATGCCTGCT TGCCGAATAT CATGGTGGAA AATGGCCGCT 3851 TTTCTGGATT CAACGACTGT GGCCGGCTGG GTGTGGCGGA CCGCTATCAG 3901 GACATAGCGT TGGATACCCG TGATATTGCT GAAGAGCTTG GCGGCGAATG 3951 GGCTGACCGC TTCCTCGTGC TTTACGGTAT CGCCGCTCCC GATTCGCAGC 4001 GCATCGCCTT CTATCGCCTT CTTGACGAGT TCTTCTGAAT TGAAAAAGGA 4051 AGAGTATGAG TATTCAACAT TTCCGTGTCG CCCTTATTCC CTTTTTTGCG 4101 GCATTTTGCC TTCCTGTTTT TGCTCACCCA GAAACGCTGG TGAAAGTAAA 4151 AGATGCTGAA GATCAGTTGG GTGCACGAGT GGGTTACATC GAACTGGATC 4201 TCAACAGCGG TAAGATCCTT GAGAGTTTTC GCCCCGAAGA ACGTTTTCCA 4251 ATGATGAGCA CTTTTAAAGT TCTGCTATGT CATACACTAT TATCCCGTAT 4301 TGACGCCGGG CAAGAGCAAC TCGGTCGCCG GGCGCGGTAT TCTCAGAATG 4351 ACTTGGTTGA GTACTCACCA GTCACAGAAA AGCATCTTAC GGATGGCATG 4401 ACAGTAAGAG AATTATGCAG TGCTGCCATA ACCATGAGTG ATAACACTGC 4451 GGCCAACTTA CTTCTGACAA CGATCGGAGG ACCGAAGGAG CTAACCGCTT 4501 TTTTGCACAA CATGGGGGAT CATGTAACTC GCCTTGATCG TTGGGAACCG 4551 GAGCTGAATG AAGCCATACC AAACGACGAG AGTGACACCA CGATGCCTGT 4601 AGCAATGCCA ACAACGTTGC GCAAACTATT AACTGGCGAA CTACTTACTC 4651 TAGCTTCCCG GCAACAATTA ATAGACTGGA TGGAGGCGGA TAAAGTTGCA 4701 GGACCACTTC TGCGCTCGGC CCTTCCGGCT GGCTGGTTTA TTGCTGATAA 4751 ATCTGGAGCC GGTGAGCGTG GGTCTCGCGG TATCATTGCA GCACTGGGGC 4801 CAGATGGTAA GCCCTCCCGT ATCGTAGTTA TCTACACGAC GGGGAGTCAG 4851 GCAACTATGG ATGAACGAAA TAGACAGATC GCTGAGATAG GTGCCTCACT 4901 GATTAAGCAT TGGTAACTGT CAGACCAAGT TTACTCATAT ATACTTTAGA 4951 TTGATTTAAA ACTTCATTTT TAATTTAAAA GGATCTAGGT GAAGATCCTT 5001 TTTGATAATC TCATGACCAA AATCCCTTAA CGTGAGTTTT CGTTCCACTG 5051 AGCGTCAGAC CCCGTAGAAA AGATCAAAGG ATCTTCTTGA GATCCTTTTT 5101 TTCTGCGCGT AATCTGCTGC TTGCAAACAA AAAAACCACC GCTACCAGCG 5151 GTGGTTTGTT TGCCGGATCA AGAGCTACCA ACTCTTTTTC CGAAGGTAAC 5201 TGGCTTCAGC AGAGCGCAGA TACCAAATAC TGTCCTTCTA GTGTAGCCGT 5251 AGTTAGGCCA CCACTTCAAG AACTCTGTAG CACCGCCTAC ATACCTCGCT 5301 CTGCTAATCC TGTTACCAGT GGCTGCTGCC AGTGGCGATA AGTCGTGTCT 5351 TACCGGGTTG GACTCAAGAC GATAGTTACC GGATAAGGCG CAGCGGTCGG 5401 GCTGAACGGG GGGTTCGTGC ACACAGCCCA GCTTGGAGCG AACGACCTAC 5451 ACCGAACTGA GATACCTACA GCGTGAGCAT TGAGAAAGCG CCACGCTTCC 5501 CGAAGGGAGA AAGGCGGACA GGTATCCGGT AAGCGGCAGG GTCGGAACAG 5551 GAGAGCGCAC GAGGGAGCTT CCAGGGGGAA ACGCCTGGTA TCTTTATAGT 5601 CCTGTCGGGT TTCGCCACCT CTGACTTGAG CGTCGATTTT TGTGATGCTC 5651 GTCAGGGGGG CGGAGCCTAT GGAAAAACGC CAGCAACGCG GCCTTTTTAC 5701 GGTTCCTGGC CTTTTGCTGG CCTTTTGCTC ACATGTTCTT TCCTGCGTTA 5751 TCCCCTGATT CTGTGGATAA CCGTATTACC GCCTTTGAGT GAGCTGATAC 5801 CGCTCGCCGC AGCCGAACGA CCGAGCGCAG CGAGTCAGTG AGCGAGGAAG 5851 CGGAAG 表8：重组表达质粒pCDNA3.1(-)H-SemaL-MycHisA的核苷酸序列(SED ID NO.:35) 1 GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC 51 TGCTCTGATG CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT 101 GGAGGTCGCT GAGTAGTGCG CGAGCAAAAT TTAAGCTACA ACAAGGCAAG 151 GCTTGACCGA CAATTGCATG AAGAATCTGC TTAGGGTTAG GCGTTTTGCG 201 CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT GATTATTGAC 251 TAGTTATTAA TAGTAATCAA TTACGGGGTC ATTAGTTCAT AGCCCATATA 301 TGGAGTTCCG CGTTACATAA CTTACGGTAA ATGGCCCGCC TGGCTGACCG 351 CCCAACGACC CCCGCCCATT GACGTCAATA ATGACGTATG TTCCCATAGT 401 AACGCCAATA GGGACTTTCC ATTGACGTCA ATGGGTGGAC TATTTACGGT 451 AAACTGCCCA CTTGGCAGTA CATCAAGTGT ATCATATGCC AAGTACGCCC 501 CCTATTGACG TCAATGACGG TAAATGGCCC GCCTGGCATT ATGCCCAGTA 551 CATGACCTTA TGGGACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA 601 TCGCTATTAC CATGGTGATG CGGTTTTGGC AGTACATCAA TGGGCGTGGA 651 TAGCGGTTTG ACTCACGGGG ATTTCCAAGT CTCCACCCCA TTGACGTCAA 701 TGGGAGTTTG TTTTGGCACC AAAATCAACG GGACTTTCCA AAATGTCGTA 751 ACAACTCCGC CCCATTGACG CAAATGGGCG GTAGGCGTGT ACGGTGGGAG 801 GTCTATATAA GCAGAGCTCT CTGGCTAACT AGAGAACCCA CTGCTTACTG 851 GCTTATCGAA ATTAATACGA CTCACTATAG GGAGACCCAA GCTGGCTAGC 901 GTTTAAACGG GCCCTCTAGA CTCGAGCGGC CGCCACTGTG CTGGATATCT 951 GCAgaattcg gcttgggatg acgcctcctc cgcccggacg tgccgccccc 1001 agcgcaccgc gcgcccgcgt ccctggcccg ccggctcggt tggggcttcc 1051 gctgcggctg cggctgctgc tgctgctctg ggcggccgcc gcctccgccc 1101 agggccacct aaggagcgga ccccgcatct tcgccgtctg gaaaggccat 115t gtagggcagg accgggtgga ctttggccag actgagccgc acacggtgct 1201 tttccacgag ccaggcagct cctctgtgtg ggtgggagga cgtggcaagg 1251 tctacctctt tgacttcccc gagggcaaga acgcatctgt gcgcacggtg 1301 aatatcggct ccacaaaggg gtcctgtctg gataagcggg actgcgagaa 1351 ctacatcact ctcctggaga ggcggagtga ggggctgctg gcctgtggca 1401 ccaacgcccg gcaccccagc tgctggaacc tggtgaatgg cactgtggtg 1451 ccacttggcg agatgagagg ctacgccccc ttcagcccgg acgagaactc 1501 cctggttctg tttgaagggg acgaggtgta ttccaccatc cggaagcagg 1551 aatacaatgg gaagatccct cggttccgcc gcatccgggg cgagagtgag 1601 ctgtacacca gtgatactgt catgcagaac ccacagttca tcaaagccac 1651 catcgtgcac caagaccagg cttacgatga caagatctac tacttcttcc 1701 gagaggacaa tcctgacaag aatcctgagg ctcctctcaa tgtgtcccgt 1751 gtggcccagt tgtgcagggg ggaccagggt ggggaaagtt cactgtcagt 1801 ctccaagtgg aacacttttc tgaaagccat gctggtatgc agtgatgctg 1851 ccaccaacaa gaacttcaac aggctgcaag acgtcttcct gctccctgac 1901 cccagcggcc agtggaggga caccagggtc tatggtgttt tctccaaccc 1951 ctggaactac tcagccgtct gtgtgtattc cctcggtgac attgacaagg 2001 tcttccgtac ctcctcactc aagggctacc actcaagcct tcccaacccg 2051 cggcctggca agtgcctccc agaccagcag ccgataccca cagagacctt 2101 ccaggtggct gaccgtcacc cagaggtggc gcagagggtg gagcccatgg 2151 ggcctctgaa gacgccattg ttccactcta aataccacta ccagaaagtg 2201 gccgttcacc gcatgcaagc cagccacggg gagacctttc atgtgcttta 2251 cctaactaca gacaggggca ctatccacaa ggtggtggaa ccgggggagc 2301 aggagcacag cttcgccttc aacatcatgg agatccagcc cttccgccgc 2351 gcggctgcca tccagaccat gtcgctggat gctgagcgga ggaagctgta 2401 tgtgagctcc cagtgggagg tgagccaggt gcccctggac ctgtgtgagg 2451 tctatggcgg gggctgccac ggttgcctca tgtcccgaga cccctactgc 2501 ggctgggacc agggccgctg catctccatc tacagctccg aacggtcagt 2551 gctgcaatcc attaatccag ccgagccaca caaggagtgt cccaacccca 2601 aaccagacaa ggccccactg cagaaggttt ccctggcccc aaactctcgc 2651 tactacctga gctgccccat ggaatcccgc cacgccacct actcatggcg 2701 ccacaaggag aacgtggagc agagctgcga acctggtcac cagagcccca 2751 actgcatcct gttcatcgag aacctcacgg cgcagcagta cggccactac 2801 ttctgcgagg cccaggaggg ctcctacttc cgcgaggctc agcactggca 2851 gctgctgccc gaggacggca tcatggccga gcacctgctg ggtcatgcct 2901 gtgccctggc tgcctccctc tggctggggg tgctgcccac actcactctt 2951 ggcttgctgg tccacgtgaa gcttGGGCCC GAACAAAAAC TCATCTCAGA 3001 AGAGGATCTG AATAGCGCCG TCGACCATCA TCATCATCAT CATTGAGTTT 3051 AAACCGCTGA TCAGCCTCGA CTGTGCCTTC TAGTTGCCAG CCATCTGTTG 3101 TTTGCCCCTC CCCCGTGCCT TCCTTGACCC TGGAAGGTGC CACTCCCACT 3151 GTCCTTTCCT AATAAAATGA GGAAATTGCA TCGCATTGTC TGAGTAGGTG 3201 TCATTCTATT CTGGGGGGTG GGGTGGGGCA GGACAGCAAG GGGGAGGATT 3251 GGGAAGACAA TAGCAGGCAT GCTGGGGATG CGGTGGGCTC TATGGCTTCT 3301 GAGGCGGAAA GAACCAGCTG GGGCTCTAGG GGGTATCCCC ACGCGCCCTG 3351 TAGCGGCGCA TTAAGCGCGG CGGGTGTGGT GGTTACGCGC AGCGTGACCG 3401 CTACACTTGC CAGCGCCCTA GCGCCCGCTC CTTTCGCTTT CTTCCCTTCC 3451 TTTCTCGCCA CGTTCGCCGG CTTTCCCCGT CAAGCTCTAA ATCGGGGCAT 3501 CCCTTTAGGG TTCCGATTTA GTGCTTTACG GCACCTCGAC CCCAAAAAAC 3551 TTGATTAGGG TGATGGTTCA CGTAGTGGGC CATCGCCCTG ATAGACGGTT 3601 TTTCGCCCTT TGACGTTGGA GTCCACGTTC TTTAATAGTG GACTCTTGTT 3651 CCAAACTGGA ACAACACTCA ACCCTATCTC GGTCTATTCT TTTGATTTAT 3701 AAGGGATTTT GGGGATTTCG GCCTATTGGT TAAAAAATGA GCTGATTTAA 3751 CAAAAATTTA ACGCGAATTA ATTCTGTGGA ATGTGTGTCA GTTAGGGTGT 3801 GGAAAGTCCC CAGGCTCCCC AGGCAGGCAG AAGTATGCAA AGCATGCATC 3851 TCAATTAGTC AGCAACCAGG TGTGGAAAGT CCCCAGGCTC CCCAGCAGGC 3901 AGAAGTATGC AAAGCATGCA TCTCAATTAG TCAGCAACCA TAGTCCCGCC 3951 CCTAACTCCG CCCATCCCGC CCCTAACTCC GCCCAGTTCC GCCCATTCTC 4001 CGCCCCATGG CTGACTAATT TTTTTTATTT ATGCAGAGGC CGAGGCCGCC 4051 TCTGCCTCTG AGCTATTCCA GAAGTAGTGA GGAGGCTTTT TTGGAGGCCT 4101 AGGCTTTTGC AAAAAGCTCC CGGGAGCTTG TATATCCATT TTCGGATCTG 4151 ATCAAGAGAC AGGATGAGGA TCGTTTCGCA TGATTGAACA AGATGGATTG 4201 CACGCAGGTT CTCCGGCCGC TTGGGTGGAG AGGCTATTCG GCTATGACTG 4251 GGCACAACAG ACAATCGGCT GCTCTGATGC CGCCGTGTTC CGGCTGTCAG 4301 CGCAGGGGCG CCCGGTTCTT TTTGTCAAGA CCGACCTGTC CGGTGCCCTG 4351 AATGAACTGC AGGACGAGGC AGCGCGGCTA TCGTGGCTGG CCACGACGGG 4401 CGTTCCTTGC GCAGCTGTGC TCGACGTTGT CACTGAAGCG GGAAGGGACT 4451 GGCTGCTATT GGGCGAAGTG CCGGGGCAGG ATCTCCTGTC ATCTCACCTT 4501 GCTCCTGCCG AGAAAGTATC CATCATGGCT GATGCAATGC GGCGGCTGCA 4551 TACGCTTGAT CCGGCTACCT GCCCATTCGA CCACCAAGCG AAACATCGCA 4601 TCGAGCGAGC ACGTACTCGG ATGGAAGCCG GTCTTGTCGA TCAGGATGAT 4651 CTGGACGAAG AGCATCAGGG GCTCGCGCCA GCCGAACTGT TCGCCAGGCT 4701 CAAGGCGCGC ATGCCCGACG GCGAGGATCT CGTCGTGACC CATGGCGATG 4751 CCTGCTTGCC GAATATCATG GTGGAAAATG GCCGCTTTTC TGGATTCATC 4801 GACTGTGGCC GGCTGGGTGT GGCGGACCGC TATCAGGACA TAGCGTTGGC 4851 TACCCGTGAT ATTGCTGAAG AGCTTGGCGG CGAATGGGCT GACCGCTTCC 4901 TCGTGCTTTA CGGTATCGCC GCTCCCGATT CGCAGCGCAT CGCCTTCTAT 4951 CGCCTTCTTG ACGAGTTCTT CTGAGCGGGA CTCTGGGGTT CGAAATGACC 5001 GACCAAGCGA CGCCCAACCT GCCATCACGA GATTTCGATT CCACCGCCGC 5051 CTTCTATGAA AGGTTGGGCT TCGGAATCGT TTTCCGGGAC GCCGGCTGGA 5101 TGATCCTCCA GCGCGGGGAT CTCATGCTGG AGTTCTTCGC CCACCCCAAC 5151 TTGTTTATTG CAGCTTATAA TGGTTACAAA TAAAGCAATA GCATCACAAA 5201 TTTCACAAAT AAAGCATTTT TTTCACTGCA TTCTAGTTGT GGTTTGTCCA 5251 AACTCATCAA TGTATCTTAT CATGTCTGTA TACCGTCGAC CTCTAGCTAG 5301 AGCTTGGCGT AATCATGGTC ATAGCTGTTT CCTGTGTGAA ATTGTTATCC 5351 GCTCACAATT CCACACAACA TACGAGCCGG AAGCATAAAG TGTAAAGCCT 5401 GGGGTGCCTA ATGAGTGAGC TAACTCACAT TAATTGCGTT GCGCTCACTG 5451 CCCGCTTTCC AGTCGGGAAA CCTGTCGTGC CAGCTGCATT AATGAATCGG 5501 CCAACGCGCG GGGAGAGGCG GTTTGCGTAT TGGGCGCTCT TCCGCTTCCT 5551 CGCTCACTGA CTCGCTGCGC TCGGTCGTTC GGCTGCGGCG AGCGGTATCA 5601 GCTCACTCAA AGGCGGTAAT ACGGTTATCC ACAGAATCAG GGGATAACGC 5651 AGGAAAGAAC ATGTGAGCAA AAGGCCAGCA AAAGGCCAGG AACCGTAAAA 5701 AGGCCGCGTT GCTGGCGTTT TTCCATAGGC TCCGCCCCCC TGACGAGCAT 5751 CACAAAAATC GACGCTCAAG TCAGAGGTGG CGAAACCCGA CAGGACTATA 5801 AAGATACCAG GCGTTTCCCC CTGGAAGCTC CCTCGTGCGC TCTCCTGTTC 5851 CGACCCTGCC GCTTACCGGA TACCTGTCCG CCTTTCTCCC TTCGGGAAGC 5901 GTGGCGCTTT CTCAATGCTC ACGCTGTAGG TATCTCAGTT CGGTGTAGGT 5951 CGTTCGCTCC AAGCTGGGCT GTGTGCACGA ACCCCCCGTT CAGCCCGACC 6001 GCTGCGCCTT ATCCGGTAAC TATCGTCTTG AGTCCAACCC GGTAAGACAC 6051 GACTTATCGC CACTGGCAGC AGCCACTGGT AACAGGATTA GCAGAGCGAG 6101 GTATGTAGGC GGTGCTACAG AGTTCTTGAA GTGGTGGCCT AACTACGGCT 6151 ACACTAGAAG GACAGTATTT GGTATCTGCG CTCTGCTGAA GCCAGTTAcc 6201 TTCGGAAAAA GAGTTGGTAG CTCTTGATCC GGCAAACAAA CCACCGCTGG 6251 TAGCGGTGGT TTTTTTGTTT GCAAGCAGCA GATTACGCGC AGAAAAAAAG 6301 GATCTCAAGA AGATCCTTTG ATCTTTTCTA CGGGGTCTGA CGCTCAGTGG 6351 AACGAAAACT CACGTTAAGG GATTTTGGTC ATGAGATTAT CAAAAAGGAT 6401 CTTCACCTAG ATCCTTTTAA ATTAAAAATG AAGTTTTAAA TCAATCTAAA 6451 GTATATATGA GTAAACTTGG TCTGACAGTT ACCAATGCTT AATCAGTGAG 6501 GCACCTATCT CAGCGATCTG TCTATTTCGT TCATCCATAG TTGCCTGACT 6551 CCCCGTCGTG TAGATAACTA CGATACGGGA GGGCTTACCA TCTGGCCCCA 6601 GTGCTGCAAT GATACCGCGA GACCCACGCT CACCGGCTCC AGATTTATCA 6651 GCAATAAACC AGCCAGCCGG AAGGGCCGAG CGCAGAAGTG GTCCTGCAAC 6701 TTTATCCGCC TCCATCCAGT CTATTAATTG TTGCCGGGAA GCTAGAGTAA 6751 GTAGTTCGCC AGTTAATAGT TTGCGCAACG TTGTTGCCAT TGCTACAGGC 6801 ATCGTGGTGT CACGCTCGTC GTTTGGTATG GCTTCATTCA GCTCCGGTTC 6851 CCAACGATCA AGGCGAGTTA CATGATCCCC CATGTTGTGC AAAAAAGCGG 6901 TTAGCTCCTT CGGTCCTCCG ATCGTTGTCA GAAGTAAGTT GGCCGCAGTG 6951 TTATCACTCA TGGTTATGGC AGCACTGCAT AATTCTCTTA CTGTCATGCC 7001 ATCCGTAAGA TGCTTTTCTG TGACTGGTGA GTACTCAACC AAGTCATTCT 7051 GAGAATAGTG TATGCGGCGA CCGAGTTGCT CTTGCCCGGC GTCAATACGG 7101 GATAATACCG CGCCACATAG CAGAACTTTA AAAGTGCTCA TCATTGGAAA 7151 ACGTTCTTCG GGGCGAAAAC TCTCAAGGAT CTTACCGCTG TTGAGATCCA 7201 GTTCGATGTA ACCCACTCGT GCACCCAACT GATCTTCAGC ATCTTTTACT 7251 TTCACCAGCG TTTCTGGGTG AGCAAAAACA GGAAGGCAAA ATGCCGCAAA 7301 AAAGGGAATA AGGGCGACAC GGAAATGTTG AATACTCATA CTCTTCCTTT 7351 TTCAATATTA TTGAAGCATT TATCAGGGTT ATTGTCTCAT GAGCGGATAC 7401 ATATTTGAAT GTATTTAGAA AAATAAACAA ATAGGGGTTC CGCGCACATT 7451 TCCCCGAAAA GTGCCACCTG ACGTC 表9：重组质粒pcDA3.1-SemaL-EGFP-MychisA的核苷酸序列(SEQ ID NO.:36) 1 GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC 51 TGCTCTGATG CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT 101 GGAGGTCGCT GAGTAGTGCG CGAGCAAAAT TTAAGCTACA ACAAGGCAAG 151 GCTTGACCGA CAATTGCATG AAGAATCTGC TTAGGGTTAG GCGTTTTGCG 201 CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT GATTATTGAC 251 TAGTTATTAA TAGTAATCAA TTACGGGGTC ATTAGTTCAT AGCCCATATA 301 TGGAGTTCCG CGTTACATAA CTTACGGTAA ATGGCCCGCC TGGCTGACCG 351 CCCAACGACC CCCGCCCATT GACGTCAATA ATGACGTATG TTCCCATAGT 401 AACGCCAATA GGGACTTTCC ATTGACGTCA ATGGGTGGAC TATTTACGGT 451 AAACTGCCCA CTTGGCAGTA CATCAAGTGT ATCATATGCC AAGTACGCCC 501 CCTATTGACG TCAATGACGG TAAATGGCCC GCCTGGCATT ATGCCCAGTA 551 CATGACCTTA TGGGACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA 601 TCGCTATTAC CATGGTGATG CGGTTTTGGC AGTACATCAA TGGGCGTGGA 651 TAGCGGTTTG ACTCACGGGG ATTTCCAAGT CTCCACCCCA TTGACGTCAA 701 TGGGAGTTTG TTTTGGCACC AAAATCAACG GGACTTTCCA AAATGTCGTA 751 ACAACTCCGC CCCATTGACG CAAATGGGCG GTAGGCGTGT ACGGTGGGAG 801 GTCTATATAA GCAGAGCTCT CTGGCTAACT AGAGAACCCA CTGCTTACTG 851 GCTTATCGAA ATTAATACGA CTCACTATAG GGAGACCCAA GCTGGCTAGC 901 GTTTAAACGG GCCCTCTAGA CTCGAGCGGC CGCCACTGTG CTGGATATCT 951 GCAgaattcg gcttgggatg acgcctcctc cgcccggacg tgccgccccc 1001 agcgcaccgc gcgcccgcgt ccctggcccg ccggctcggt tggggcttcc 1051 gctgcggctg cggctgctgc tgctgctctg ggcggccgcc gcctccgccc 1101 agggccacct aaggagcgga ccccgcatct tcgccgtctg gaaaggccat 1151 gtagggcagg accgggtgga ctttggccag actgagccgc acacggtgct 1201 tttccacgag ccaggcagct cctctgtgtg ggtgggagga cgtggcaagg 1251 tctacctctt tgacttcccc gagggcaaga acgcatctgt gcgcacggtg 1301 aatatcggct ccacaaaggg gtcctgtctg gataagcggg actgcgagaa 1351 ctacatcact ctcctggaga ggcggagtga ggggctgctg gcctgtggca 1401 ccaacgcccg gcaccccagc tgctggaacc tggtgaatgg cactgtggtg 1451 ccacttggcg agatgagagg ctacgccccc ttcagcccgg acgagaactc 1501 cctggttctg tttgaagggg acgaggtgta ttccaccatc cggaagcagg 1551 aatacaatgg gaagatccct cggttccgcc gcatccgggg cgagagtgag 1601 ctgtacacca gtgatactgt catgcagaac ccacagttca tcaaagccac 1651 catcgtgcac caagaccagg cttacgatga caagatctac tacttcttcc 1701 gagaggacaa tcctgacaag aatcctgagg ctcctctcaa tgtgtcccgt 1751 gtggcccagt tgtgcagggg ggaccagggt ggggaaagtt cactgtcagt 1801 ctccaagtgg aacacttttc tgaaagccat gctggtatgc agtgatgctg 1851 ccaccaacaa gaacttcaac aggctgcaag acgtcttcct gctccctgac 1901 cccagcggcc agtggaggga caccagggtc tatggtgttt tctccaaccc 1951 ctggaactac tcagccgtct gtgtgtattc cctcggtgac attgacaagg 2001 tcttccgtac ctcctcactc aagggctacc actcaagcct tcccaacccg 2051 cggcctggca agtgcctccc agaccagcag ccgataccca cagagacctt 2101 ccaggtggct gaccgtcacc cagaggtggc gcagagggtg gagcccatgg 2151 ggcctctgaa gacgccattg ttccactcta aataccacta ccagaaagtg 2201 gccgttcacc gcatgcaagc cagccacggg gagacctttc atgtgcttta 2251 cctaactaca gacaggggca ctatccacaa ggtggtggaa ccgggggagc 2301 aggagcacag cttcgccttc aacatcatgg agatccagcc cttccgccgc 2351 gcggctgcca tccagaccat gtcgctggat gctgagcgga ggaagctgta 2401 tgtgagctcc cagtgggagg tgagccaggt gcccctggac ctgtgtgagg 2451 tctatggcgg gggctgccac ggttgcctca tgtcccgaga cccctactgc 2501 ggctgggacc agggccgctg catctccatc tacagctccg aacggtcagt 2551 gctgcaatcc attaatccag ccgagccaca caaggagtgt cccaacccca 2601 aaccagacaa ggccccactg cagaaggttt ccctggcccc aaactctcgc 2651 tactacctga gctgccccat ggaatcccgc cacgccacct actcatggcg 2701 ccacaaggag aacgtggagc agagctgcga acctggtcac cagagcccca 2751 actgcatcct gttcatcgag aacctcacgg cgcagcagta cggccactac 2801 ttctgcgagg cccaggaggg ctcctacttc cgcgaggctc agcactggca 2851 gctgctgccc gaggacggca tcatggccga gcacctgctg ggtcatgcct 2901 gtgccctggc tgcctccctc tggctggggg tgctgcccac actcactctt 2951 ggcttgctgg tccacATGGT GAGCAAGGGC GAGGAGCTGT TCACCGGGGT 3001 GGTGCCCATC CTGGTCGAGC TGGACGGCGA CGTAAACGGC CACAAGTTCA 3051 GCGTGTCCGG CGAGGGCGAG GGCGATGCCA CCTACGGCAA GCTGACCCTG 3101 AAGTTCATCT GCACCACCGG CAAGCTGCCC GTGCCCTGGC CCACCCTCGT 3151 GACCACCCTG ACCTACGGCG TGCAGTGCTT CAGCCGCTAC CCCGACCACA 3201 TGAAGCAGCA CGACTTCTTC AAGTCCGCCA TGCCCGAAGG CTACGTCCAG 3251 GAGCGCACCA TCTTCTTCAA GGACGACGGC AACTACAAGA CCCGCGCCGA 3301 GGTGAAGTTC GAGGGCGACA CCCTGGTGAA CCGCATCGAG CTGAAGGGCA 3351 TCGACTTCAA GGAGGACGGC AACATCCTGG GGCACAAGCT GGAGTACAAC 3401 TACAACAGCC ACAACGTCTA TATCATGGCC GACAAGCAGA AGAACGGCAT 3451 CAAGGTGAAC TTCAAGATCC GCCACAACAT CGAGGACGGC AGCGTGCAGC 3501 TCGCCGACCA CTACCAGCAG AACACCCCCA TCGGCGACGG CCCCGTGCTG 3551 CTGCCCGACA ACCACTACCT GAGCACCCAG TCCGCCCTGA GCAAAGACCC 3601 CAACGAGAAG CGCGATCACA TGGTCCTGCT GGAGTTCGTG ACCGCCGCCG 3651 GGATCACTCT CGGCATGGAC GAGCTGTACA Aggtgaagct tGGGCCCGAA 3701 CAAAAACTCA TCTCAGAAGA GGATCTGAAT AGCGCCGTCG ACCATCATCA 3751 TCATCATCAT TGAGTTTAAA CCGCTGATCA GCCTCGACTG TGCCTTCTAG 3801 TTGCCAGCCA TCTGTTGTTT GCCCCTCCCC CGTGCCTTCC TTGACCCTGG 3851 AAGGTGCCAC TCCCACTGTC CTTTCCTAAT AAAATGAGGA AATTGCATCG 3901 CATTGTCTGA GTAGGTGTCA TTCTATTCTG GGGGGTGGGG TGGGGCAGGA 3951 CAGCAAGGGG GAGGATTGGG AAGACAATAG CAGGCATGCT GGGGATGCGG 4001 TGGGCTCTAT GGCTTCTGAG GCGGAAAGAA CCAGCTGGGG CTCTAGGGGG 4051 TATCCCCACG CGCCCTGTAG CGGCGCATTA AGCGCGGCGG GTGTGGTGGT 4101 TACGCGCAGC GTGACCGCTA CACTTGCCAG CGCCCTAGCG CCCGCTCCTT 4151 TCGCTTTCTT CCCTTCCTTT CTCGCCACGT TCGCCGGCTT TCCCCGTCAA 4201 GCTCTAAATC GGGGCATCCC TTTAGGGTTC CGATTTAGTG CTTTACGGCA 4251 CCTCGACCCC AAAAAACTTG ATTAGGGTGA TGGTTCACGT AGTGGGCCAT 4301 CGCCCTGATA GACGGTTTTT CGCCCTTTGA CGTTGGAGTC CACGTTCTTT 4351 AATAGTGGAC TCTTGTTCCA AACTGGAACA ACACTCAACC CTATCTCGGT 4401 CTATTCTTTT GATTTATAAG GGATTTTGGG GATTTCGGCC TATTGGTTAA 4451 AAAATGAGCT GATTTAACAA AAATTTAACG CGAATTAATT CTGTGGAATG 4501 TGTGTCAGTT AGGGTGTGGA AAGTCCCCAG GCTCCCCAGG CAGGCAGAAG 4551 TATGCAAAGC ATGCATCTCA ATTAGTCAGC AACCAGGTGT GGAAAGTCCC 4601 CAGGCTCCCC AGCAGGCAGA AGTATGCAAA GCATGCATCT CAATTAGTCA 4651 GCAACCATAG TCCCGCCCCT AACTCCGCCC ATCCCGCCCC TAACTCCGCC 4701 CAGTTCCGCC CATTCTCCGC CCCATGGCTG ACTAATTTTT TTTATTTATG 4751 CAGAGGCCGA GGCCGCCTCT GCCTCTGAGC TATTCCAGAA GTAGTGAGGA 4801 GGCTTTTTTG GAGGCCTAGG CTTTTGCAAA AAGCTCCCGG GAGCTTGTAT 4851 ATCCATTTTC GGATCTGATC AAGAGACAGG ATGAGGATCG TTTCGCATGA 4901 TTGAACAAGA TGGATTGCAC GCAGGTTCTC CGGCCGCTTG GGTGGAGAGG 4951 CTATTCGGCT ATGACTGGGC ACAACAGACA ATCGGCTGCT CTGATGCCGC 5001 CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT GTCAAGACCG 5051 ACCTGTCCGG TGCCCTGAAT GAACTGCAGG ACGAGGCAGC GCGGCTATCG 5101 TGGCTGGCCA CGACGGGCGT TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC 5151 TGAAGCGGGA AGGGACTGGC TGCTATTGGG CGAAGTGCCG GGGCAGGATC 5201 TCCTGTCATC TCACCTTGCT CCTGCCGAGA AAGTATCCAT CATGGCTGAT 5251 GCAATGCGGC GGCTGCATAC GCTTGATCCG GCTACCTGCC CATTCGACCA 5301 CCAAGCGAAA CATCGCATCG AGCGAGCACG TACTCGGATG GAAGCCGGTC 5351 TTGTCGATCA GGATGATCTG GACGAAGAGC ATCAGGGGCT CGCGCCAGCC 5401 GAACTGTTCG CCAGGCTCAA GGCGCGCATG CCCGACGGCG AGGATCTCGT 5451 CGTGACCCAT GGCGATGCCT GCTTGCCGAA TATCATGGTG GAAAATGGCC 5501 GCTTTTCTGG ATTCATCGAC TGTGGCCGGC TGGGTGTGGC GGACCGCTAT 5551 CAGGACATAG CGTTGGCTAC CCGTGATATT GCTGAAGAGC TTGGCGGCGA 5601 ATGGGCTGAC CGCTTCCTCG TGCTTTACGG TATCGCCGCT CCCGATTCGC 5651 AGCGCATCGC CTTCTATCGC CTTCTTGACG AGTTCTTCTG AGCGGGACTC 5701 TGGGGTTCGA AATGACCGAC CAAGCGACGC CCAACCTGCC ATCACGAGAT 5751 TTCGATTCCA CCGCCGCCTT CTATGAAAGG TTGGGCTTCG GAATCGTTTT 5801 CCGGGACGCC GGCTGGATGA TCCTCCAGCG CGGGGATCTC ATGCTGGAGT 5851 TCTTCGCCCA CCCCAACTTG TTTATTGCAG CTTATAATGG TTACAAATAA 5901 AGCAATAGCA TCACAAATTT CACAAATAAA GCATTTTTTT CACTGCATTC 5951 TAGTTGTGGT TTGTCCAAAC TCATCAATGT ATCTTATCAT GTCTGTATAC 6001 CGTCGACCTC TAGCTAGAGC TTGGCGTAAT CATGGTCATA GCTGTTTCCT 6051 GTGTGAAATT GTTATCCGCT CACAATTCCA CACAACATAC GAGCCGGAAG 6101 CATAAAGTGT AAAGCCTGGG GTGCCTAATG AGTGAGCTAA CTCACATTAA 6151 TTGCGTTGCG CTCACTGCCC GCTTTCCAGT CGGGAAACCT GTCGTGCCAG 6201 CTGCATTAAT GAATCGGCCA ACGCGCGGGG AGAGGCGGTT TGCGTATTGG 6251 GCGCTCTTCC GCTTCCTCGC TCACTGACTC GCTGCGCTCG GTCGTTCGGC 6301 TGCGGCGAGC GGTATCAGCT CACTCAAAGG CGGTAATACG GTTATCCACA 6351 GAATCAGGGG ATAACGCAGG AAAGAACATG TGAGCAAAAG GCCAGCAAAA 6401 GGCCAGGAAC CGTAAAAAGG CCGCGTTGCT GGCGTTTTTC CATAGGCTCC 6451 GCCCCCCTGA CGAGCATCAC AAAAATCGAC GCTCAAGTCA GAGGTGGCGA 6501 AACCCGACAG GACTATAAAG ATACCAGGCG TGTCCCCCTG GAAGCTCCCT 6551 CGTGCGCTCT CCTGTTCCGA CCCTGCCGCT TACCGGATAC CTGTCCGCCT 6601 TTCTCCCTTC GGGAAGCGTG GCGCTTTCTC AATGCTCACG CTGTAGGTAT 6651 CTCAGTTCGG TGTAGGTCGT TCGCTCCAAG CTGGGCTGTG TGCACGAACC 6701 CCCCGTTCAG CCCGACCGCG GCGCCTTATC CGGTAACTAT CGTCTTGAGT 6751 CCAACCCGGT AAGACACGAC TTATCGCCAC TGGCAGCAGC CACTGGTAAC 6801 AGGATTAGCA GAGCGAGGTA TGTAGGCGGT GCTACAGAGT TCTTGAAGTG 6851 GTGGCCTAAC TACGGCTACA CTAGAAGGAC AGTATTTGGT ATCTGCGCTC 6901 TGCTGAAGCC AGTTACCTTC GGAAAAAGAG TTGGTAGCTC TTGATCCGGC 6951 AAACAAACCA CCGCTGGTAG CGGTGGTTTT TTTGTTTGCA AGCAGCAGAT 7001 TACGCGCAGA AAAAAAGGAT CTCAAGAAGA TCCTTTGATC TTTTCTACGG 7051 GGTCTGACGC TCAGTGGAAC GAAAACTCAC GTTAAGGGAT TTTGGTCATG 7101 AGATTATCAA AAAGGATCTT CACCTAGATC CTTTTAAATT AAAAATGAAG 7151 TTTTAAATCA ATCTAAAGTA TATATGAGTA AACTTGGTCT GACAGTTACC 7201 AATGCTTAAT CAGTGAGGCA CCTATCTCAG CGATCTGTCT ATTTCGTTCA 7251 TCCATAGTTG CCTGACTCCC CGTCGTGTAG ATAACTACGA TACGGGAGGG 7301 CTTACCATCT GGCCCCAGTG CTGCAATGAT ACCGCGAGAC CCACGCTCAC 7351 CGGCTCCAGA TTTATCAGCA ATAAACCAGC CAGCCGGAAG GGCCGAGCGC 7401 AGAAGTGGTC CTGCAACTTT ATCCGCCTCC ATCCAGTCTA TTAATTGTTG 7451 CCGGGAAGCT AGAGTAAGTA GTTCGCCAGT TAATAGTTTG CGCAACGTTG 7501 TTGCCATTGC TACAGGCATC GTGGTGTCAC GCTCGTCGTT TGGTATGGCT 7551 TCATTCAGCT CCGGTTCCCA ACGATCAAGG CGAGTTACAT GATCCCCCAT 7601 GTTGTGCAAA AAAGCGGTTA GCTCCTTCGG TCCTCCGATC GTTGTCAGAA 7651 GTAAGTTGGC CGCAGTGTTA TCACTCATGG TTATGGCAGC ACTGCATAAT 7701 TCTCTTACTG TCATGCCATC CGTAAGATGC TTTTCTGTGA CTGGTGAGTA 7751 CTCAACCAAG TCATTCTGAG AATAGTGTAT GCGGCGACCG AGTTGCTCTT 7801 GCCCGGCGTC AATACGGGAT AATACCGCGC CACATAGCAG AACTTTAAAA 7851 GTGCTCATCA TTGGAAAACG TTCTTCGGGG CGAAAACTCT CAAGGATCTT 7901 ACCGCTGTTG AGATCCAGTT CGATGTAACC CACTCGTGCA CCCAACTGAT 7951 CTTCAGCATC TTTTACTTTC ACCAGCGTTT CTGGGTGAGC AAAAACAGGA 8001 AGGCAAAATG CCGCAAAAAA GGGAATAAGG GCGACACGGA AATGTTGAAT 8051 ACTCATACTC TTCCTTTTTC AATATTATTG AAGCATTTAT CAGGGTTATT 8101 GTCTCATGAG CGGATACATA TTTGAATGTA TTTAGAAAAA TAAACAAATA 8151 GGGGTTCCGC GCACATTTCC CCGAAAAGTG CCACCTGACG TC 表10：重组质粒pIND-H-SemaL-EE的核苷酸序列(SEQ ID NO.:37) 1 AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT 51 TGTTCTCGTT AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC 101 GATGGACAAG TGCATTGTTC TCTTGCTGAA AGCTCGATGG ACAAGTGCAT 151 TGTTCTCTTG CTGAAAGCTC AGTACCCGGG AGTACCCTCG ACCGCCGGAG 201 TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT TCAAACAAGC 251 AAAGTGAACA CGTCGCTAAG CGAAAGCTAA GCAAATAAAC AAGCGCAGCT 301 GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA 351 AAAGTAACCA GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA 401 GAAGTAATTA TTGAATACAA GAAGAGAACT CTGAATACTT TCAACAAGTT 451 ACCGAGAAAG AAGAACTCAC ACACAGCTAG CGTTTAAACT TAAGCTTGGT 501 ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGgaattcgg cttgggatga 551 cgcctcctcc gcccggacgt gccgccccca gcgcaccgcg cgcccgcgtc 601 cctggcccgc cggctcggtt ggggcttccg ctgcggctgc ggctgctgct 651 gctgctctgg gcggccgccg cctccgccca gggccaccta aggagcggac 701 cccgcatctt cgccgtctgg aaaggccatg tagggcagga ccgggtggac 751 tttggccaga ctgagccgca cacggtgctt ttccacgagc caggcagctc 801 ctctgtgtgg gtgggaggac gtggcaaggt ctacctcttt gacttccccg 851 agggcaagaa cgcatctgtg cgcacggtga atatcggctc cacaaagggg 901 tcctgtctgg ataagcggga ctgcgagaac tacatcactc tcctggagag 951 gcggagtgag gggctgctgg cctgtggcac caacgcccgg caccccagct 1001 gctggaacct ggtgaatggc actgtggtgc cacttggcga gatgagaggc 1051 tacgccccct tcagcccgga cgagaactcc ctggttctgt ttgaagggga 1101 cgaggtgtat tccaccatcc ggaagcagga atacaatggg aagatccctc 1151 ggttccgccg catccggggc gagagtgagc tgtacaccag tgatactgtc 1201 atgcagaacc cacagttcat caaagccacc atcgtgcacc aagaccaggc 1251 ttacgatgac aagatctact acttcttccg agaggacaat cctgacaaga 1301 atcctgaggc tcctctcaat gtgtcccgtg tggcccagtt gtgcaggggg 1351 gaccagggtg gggaaagttc actgtcagtc tccaagtgga acacttttct 1401 gaaagccatg ctggtatgca gtgatgctgc caccaacaag aacttcaaca 1451 ggctgcaaga cgtcttcctg ctccctgacc ccagcggcca gtggagggac 1501 accagggtct atggtgtttt ctccaacccc tggaactact cagccgtctg 1551 tgtgtattcc ctcggtgaca ttgacaaggt cttccgtacc tcctcactca 1601 agggctacca ctcaagcctt cccaacccgc ggcctggcaa gtgcctccca 1651 gaccagcagc cgatacccac agagaccttc caggtggctg accgtcaccc 1701 agaggtggcg cagagggtgg agcccatggg gcctctgaag acgccattgt 1751 tccactctaa ataccactac cagaaagtgg ccgttcaccg catgcaagcc 1801 agccacgggg agacctttca tgtgctttac ctaactacag acaggggcac 1851 tatccacaag gtggtggaac cgggggagca ggagcacagc ttcgccttca 1901 acatcatgga gatccagccc ttccgccgcg cggctgccat ccagaccatg 1951 tcgctggatg ctgagcggag gaagctgtat gtgagctccc agtgggaggt 2001 gagccaggtg cccctggacc tgtgtgaggt ctatggcggg ggctgccacg 2051 gttgcctcat gtcccgagac ccctactgcg gctgggacca gggccgctgc 2101 atctccatct acagctccga acggtcagtg ctgcaatcca ttaatccagc 2151 cgagccacac aaggagtgtc ccaaccccaa accagacaag gccccactgc 2201 agaaggtttc cctggcccca aactctcgct actacctgag ctgccccatg 2251 gaatcccgcc acgccaccta ctcatggcgc cacaaggaga acgtggagca 2301 gagctgcgaa cctggtcacc agagccccaa ctgcatcctg ttcatcgaga 2351 acctcacggc gcagcagtac ggccactact tctgcgaggc ccaggagggc 2401 tcctacttcc gcgaggctca gcactggcag ctgctgcccg aggacggcat 2451 catggccgag cacctgctgg gtcatgcctg tgccctggct gcctccctct 2501 ggctgggggt gctgcccaca ctcactcttg gcttgctggt ccacgtgaag 2551 cttGGGCCCG TTTAAACCCG CTGATCAGCC TCGACTGTGC CTTCTAGTTG 2601 CCAGCCATCT GTTGTTTGCC CCTCCCCCGT GCCTTCCTTG ACCCTGGAAG 2651 GTGCCACTCC CACTGTCCTT TCCTAATAAA ATGAGGAAAT TGCATCGCAT 2701 TGTCTGAGTA GGTGTCATTC TATTCTGGGG GGTGGGGTGG GGCAGGACAG 2751 CAAGGGGGAG GATTGGGAAG ACAATAGCAG GCATGCTGGG GATGCGGTGG 2801 GCTCTATGGC TTCTGAGGCG GAAAGAACCA GCTGGGGCTC TAGGGGGTAT 2851 CCCCACGCGC CCTGTAGCGG CGCATTAAGC GCGGCGGGTG TGGTGGTTAC 2901 GCGCAGCGTG ACCGCTACAC TTGCCAGCGC CCTAGCGCCC GCTCCTTTCG 2951 CTTTCTTCCC TTCCTTTCTC GCCACGTTCG CCGGCTTTCC CCGTCAAGCT 3001 CTAAATCGGG GCATCCCTTT AGGGTTCCGA TTTAGTGCTT TACGGCACCT 3051 CGACCCCAAA AAACTTGATT AGGGTGATGG TTCACGTAGT GGGCCATCGC 3101 CCTGATAGAC GGTTTTTCGC CCTTTGACGT TGGAGTCCAC GTTCTTTAAT 3151 AGTGGACTCT TGTTCCAAAC TGGAACAACA CTCAACCCTA TCTCGGTCTA 3201 TTCTTTTGAT TTATAAGGGA TTTTGGGGAT TTCGGCCTAT TGGTTAAAAA 3251 ATGAGCTGAT TTAACAAAAA TTTAACGCGA ATTAATTCTG TGGAATGTGT 3301 GTCAGTTAGG GTGTGGAAAG TCCCCAGGCT CCCCAGGCAG GCAGAAGTAT 3351 GCAAAGCATG CATCTCAATT AGTCAGCAAC CAGGTGTGGA AAGTCCCCAG 3401 GCTCCCCAGC AGGCAGAAGT ATGCAAAGCA TGCATCTCAA TTAGTCAGCA 3451 ACCATAGTCC CGCCCCTAAC TCCGCCCATC CCGCCCCTAA CTCCGCCCAG 3501 TTCCGCCCAT TCTCCGCCCC ATGGCTGACT AATTTTTTTT ATTTATGCAG 3551 AGGCCGAGGC CGCCTCTGCC TCTGAGCTAT TCCAGAAGTA GTGAGGAGGC 3601 TTTTTTGGAG GCCTAGGCTT TTGCAAAAAG CTCCCGGGAG CTTGTATATC 3651 CATTTTCGGA TCTGATCAAG AGACAGGATG AGGATCGTTT CGCATGATTG 3701 AACAAGATGG ATTGCACGCA GGTTCTCCGG CCGCTTGGGT GGAGAGGCTA 3751 TTCGGCTATG ACTGGGCACA ACAGACAATC GGCTGCTCTG ATGCCGCCGT 3801 GTTCCGGCTG TCAGCGCAGG GGCGCCCGGT TCTTTTTGTC AAGACCGACC 3851 TGTCCGGTGC CCTGAATGAA CTGCAGGACG AGGCAGCGCG GCTATCGTGG 3901 CTGGCCACGA CGGGCGTTCC TTGCGCAGCT GTGCTCGACG TTGTCACTGA 3951 AGCGGGAAGG GACTGGCTGC TATTGGGCGA AGTGCCGGGG CAGGATCTCC 4001 TGTCATCTCA CCTTGCTCCT GCCGAGAAAG TATCCATCAT GGCTGATGCA 4051 ATGCGGCGGC TGCATACGCT TGATCCGGCT ACCTGCCCAT TCGACCACCA 4101 AGCGAAACAT CGCATCGAGC GAGCACGTAC TCGGATGGAA GCCGGTCTTG 4151 TCGATCAGGA TGATCTGGAC GAAGAGCATC AGGGGCTCGC GCCAGCCGAA 4201 CTGTTCGCCA GGCTCAAGGC GCGCATGCCC GACGGCGAGG ATCTCGTCGT 4251 GACCCATGGC GATGCCTGCT TGCCGAATAT CATGGTGGAA AATGGCCGCT 4301 TTTCTGGATT CATCGACTGT GGCCGGCTGG GTGTGGCGGA CCGCTATCAG 4351 GACATAGCGT TGGCTACCCG TGATATTGCT GAAGAGCTTG GCGGCGAATG 4401 GGCTGACCGC TTCCTCGTGC TTTACGGTAT CGCCGCTCCC GATTCGCAGC 4451 GCATCGCCTT CTATCGCCTT CTTGACGAGT TCTTCTGAGC GGGACTCTGG 4501 GGTTCGAAAT GACCGACCAA GCGACGCCCA ACCTGCCATC ACGAGATTTC 4551 GATTCCACCG CCGCCTTCTA TGAAAGGTTG GGCTTCGGAA TCGTTTTCCG 4601 GGACGCCGGC TGGATGATCC TCCAGCGCGG GGATCTCATG CTGGAGTTCT 4651 TCGCCCACCC CAACTTGTTT ATTGCAGCTT ATAATGGTTA CAAATAAAGC 4701 AATAGCATCA CAAATTTCAC AAATAAAGCA TTTTTTTCAC TGCATTCTAG 4751 TTGTGGTTTG TCCAAACTCA TCAATGTATC TTATCATGTC TGTATACCGT 4801 CGACCTCTAG CTAGAGCTTG GCGTAATCAT GGTCATAGCT GTTTCCTGTG 4851 TGAAATTGTT ATCCGCTCAC AATTCCACAC AACATACGAG CCGGAAGCAT 4901 AAAGTGTAAA GCCTGGGGTG CCTAATGAGT GAGCTAACTC ACATTAATTG 4951 CGTTGCGCTC ACTGCCCGCT TTCCAGTCGG GAAACCTGTC GTGCCAGCTG 5001 CATTAATGAA TCGGCCAACG CGCGGGGAGA GGCGGTTTGC GTATTGGGCG 5051 CTCTTCCGCT TCCTCGCTCA CTGACTCGCT GCGCTCGGTC GTTCGGCTGC 5101 GGCGAGCGGT ATCAGCTCAC TCAAAGGCGG TAATACGGTT ATCCACAGAA 5151 TCAGGGGATA ACGCAGGAAA GAACATGTGA GCAAAAGGCC AGCAAAAGGC 5201 CAGGAACCGT AAAAAGGCCG CGTTGCTGGC GTTTTTCCAT AGGCTCCGCC 5251 CCCCTGACGA GCATCACAAA AATCGACGCT CAAGTCAGAG GTGGCGAAAC 5301 CCGACAGGAC TATAAAGATA CCAGGCGTTT CCCCCTGGAA GCTCCCTCGT 5351 GCGCTCTCCT GTTCCGACCC TGCCGCTTAC CGGATACCTG TCCGCCTTTC 5401 TCCCTTCGGG AAGCGTGGCG CTTTCTCAAT GCTCACGCTG TAGGTATCTC 5451 AGTTCGGTGT AGGTCGTTCG CTCCAAGCTG GGCTGTGTGC ACGAACCCCC 5501 CGTTCAGCCC GACCGCTGCG CCTTATCCGG TAACTATCGT CTTGAGTCCA 5551 ACCCGGTAAG ACACGACTTA TCGCCACTGG CAGCAGCCAC TGGTAACAGG 5601 ATTAGCAGAG CGAGGTATGT AGGCGGTGCT ACAGAGTTCT TGAAGTGGTG 5651 GCCTAACTAC GGCTACACTA GAAGGACAGT ATTTGGTATC TGCGCTCTGC 5701 TGAAGCCAGT TACCTTCGGA AAAAGAGTTG GTAGCTCTTG ATCCGGCAAA 5751 CAAACCACCG CTGGTAGCGG TGGTTTTTTT GTTTGCAAGC AGCAGATTAC 5801 GCGCAGAAAA AAAGGATCTC AAGAAGATCC TTTGATCTTT TCTACGGGGT 5851 CTGACGCTCA GTGGAACGAA AACTCACGTT AAGGGATTTT GGTCATGAGA 5901 TTATCAAAAA GGATCTTCAC CTAGATCCTT TTAAATTAAA AATGAAGTTT 5951 TAAATCAATC TAAAGTATAT ATGAGTAAAC TTGGTCTGAC AGTTACCAAT 6001 GCTTAATCAG TGAGGCACCT ATCTCAGCGA TCTGTCTATT TCGTTCATCC 6051 ATAGTTGCCT GACTCCCCGT CGTGTAGATA ACTACGATAC GGGAGGGCTT 6101 ACCATCTGGC CCCAGTGCTG CAATGATACC GCGAGACCCA CGCTCACCGG 6151 CTCCAGATTT ATCAGCAATA AACCAGCCAG CCGGAAGGGC CGAGCGCAGA 6201 AGTGGTCCTG CAACTTTATC CGCCTCCATC CAGTCTATTA ATTGTTGCCG 6251 GGAAGCTAGA GTAAGTAGTT CGCCAGTTAA TAGTTTGCGC AACGTTGTTG 6301 CCATTGCTAC AGGCATCGTG GTGTCACGCT CGTCGTTTGG TATGGCTTCA 6351 TTCAGCTCCG GTTCCCAACG ATCAAGGCGA GTTACATGAT CCCCCATGTT 6401 GTGCAAAAAA GCGGTTAGCT CCTTCGGTCC TCCGATCGTT GTCAGAAGTA 6451 AGTTGGCCGC AGTGTTATCA CTCATGGTTA TGGCAGCACT GCATAATTCT 6501 CTTACTGTCA TGCCATCCGT AAGATGCTTT TCTGTGACTG GTGAGTACTC 6551 AACCAAGTCA TTCTGAGAAT AGTGTATGCG GCGACCGAGT TGCTCTTGCC 6601 CGGCGTCAAT ACGGGATAAT ACCGCGCCAC ATAGCAGAAC TTTAAAAGTG 6651 CTCATCATTG GAAAACGTTC TTCGGGGCGA AAACTCTCAA GGATCTTACC 6701 GCTGTTGAGA TCCAGTTCGA TGTAACCCAC TCGTGCACCC AACTGATCTT 6751 CAGCATCTTT TACTTTCACC AGCGTTTCTG GGTGAGCAAA AACAGGAAGG 6801 CAAAATGCCG CAAAAAAGGG AATAAGGGCG ACACGGAAAT GTTGAATACT 6851 CATACTCTTC CTTTTTCAAT ATTATTGAAG CATTTATCAG GGTTATTGTC 6901 TCATGAGCGG ATACATATTT GAATGTATTT AGAAAAATAA ACAAATAGGG 6951 GTTCCGCGCA CATTTCCCCG AAAAGTGCCA CCTGACGTCG ACGGATCGGG 表11：重组质粒pIND-H-SemaL-EA的核苷酸序列(SEQ ID NO.:38) 1 AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT 51 TGTTCTCGTT AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC 101 GATGGACAAG TGCATTGTTC TCTTGCTGAA AGCTCGATGG ACAAGTGCAT 151 TGTTCTCTTG CTGAAAGCTC AGTACCCGGG AGTACCCTCG ACCGCCGGAG 201 TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT TCAAACAAGC 251 AAAGTGAACA CGTCGCTAAG CGAAAGCTAA GCAAATAAAC AAGCGCAGCT 301 GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA 351 AAAGTAACCA GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA 401 GAAGTAATTA TTGAATACAA GAAGAGAACT CTGAATACTT TCAACAAGTT 451 ACCGAGAAAG AAGAACTCAC ACACAGCTAG CGTTTAAACT TAAGCTTGGT 501 ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGgaattcgg cttgggatga 551 cgcctcctcc gcccggacgt gccgccccca gcgcaccgcg cgcccgcgtc 601 cctggcccgc cggctcggtt ggggcttccg ctgcggctgc ggctgctgct 651 gctgctctgg gcggccgccg cctccgccca gggccaccta aggagcggac 701 cccgcatctt cgccgtctgg aaaggccatg tagggcagga ccgggtggac 751 tttggccaga ctgagccgca cacggtgctt ttccacgagc caggcagctc 801 ctctgtgtgg gtgggaggac gtggcaaggt ctacctcttt gacttccccg 851 agggcaagaa cgcatctgtg cgcacggtga atatcggctc cacaaagggg 901 tcctgtctgg ataagcggga ctgcgagaac tacatcactc tcctggagag 951 gcggagtgag gggctgctgg cctgtggcac caacgcccgg caccccagct 1001 gctggaacct ggtgaatggc actgtggtgc cacttggcga gatgagaggc 1051 tacgccccct tcagcccgga cgagaactcc ctggttctgt ttgaagggga 1101 cgaggtgtat tccaccatcc ggaagcagga atacaatggg aagatccctc 1151 ggttccgccg catccggggc gagagtgagc tgtacaccag tgatactgtc 1201 atgcagaacc cacagttcat caaagccacc atcgtgcacc aagaccaggc 1251 ttacgatgac aagatctact acttcttccg agaggacaat cctgacaaga 1301 atcctgaggc tcctctcaat gtgtcccgtg tggcccagtt gtgcaggggg 1351 gaccagggtg gggaaagttc actgtcagtc tccaagtgga acacttttct 1401 gaaagccatg ctggtatgca gtgatgctgc caccaacaag aacttcaaca 1451 ggctgcaaga cgtcttcctg ctccctgacc ccagcggcca gtggagggac 1501 accagggtct atggtgtttt ctccaacccc tggaactact cagccgtctg 1551 tgtgtattcc ctcggtgaca ttgacaaggt cttccgtacc tcctcactca 1601 agggctacca ctcaagcctt cccaacccgc ggcctggcaa gtgcctccca 1651 gaccagcagc cgatacccac agagaccttc caggtggctg accgtcaccc 1701 agaggtggcg cagagggtgg agcccatggg gcctctgaag acgccattgt 1751 tccactctaa ataccactac cagaaagtgg ccgttcaccg catgcaagcc 1801 agccacgggg agacctttca tgtgctttac ctaactacag acaggggcac 1851 tatccacaag gtggtggaac cgggggagca ggagcacagc ttcgccttca 1901 acatcatgga gatccagccc ttccgccgcg cggctgccat ccagaccatg 1951 tcgctggatg ctgagcggag gaagctgtat gtgagctccc agtgggaggt 2001 gagccaggtg cccctggacc tgtgtgaggt ctatggcggg ggctgccacg 2051 gttgcctcat gtcccgagac ccctactgcg gctgggacca gggccgctgc 2101 atctccatct acagctccga acggtcagtg ctgcaatcca ttaatccagc 2151 cgagccacac aaggagtgtc ccaaccccaa accagacaag gccccactgc 2201 agaaggtttc cctggcccca aactctcgct actacctgag ctgccccatg 2251 gaatcccgcc acgccaccta ctcatggcgc cacaaggaga acgtggagca 2301 gagctgcgaa cctggtcacc agagccccaa ctgcatcctg ttcatcgaga 2351 acctcacggc gcagcagtac ggccactact tctgcgaggc ccaggagggc 2401 tcctacttcc gcgaggctca gcactggcag ctgctgcccg aggacggcat 2451 catggccgag cacctgctgg gtcatgcctg tgccctggct gcctccctct 2501 ggctgggggt gctgcccaca ctcactcttg gcttgctggt ccacgtgaag 2551 cttGGGCCCG AACAAAAACT CATCTCAGAA GAGGATCTGA ATAGCGCCGT 2601 CGACCATCAT CATCATCATC ATTGAGTTTA TCCAGCACAG TGGCGGCCGC 2651 TCGAGTCTAG AGGGCCCGTT TAAACCCGCT GATCAGCCTC GACTGTGCCT 2701 TCTAGTTGCC AGCCATCTGT TGTTTGCCCC TCCCCCGTGC CTTCCTTGAC 2751 CCTGGAAGGT GCCACTCCCA CTGTCCTTTC CTAATAAAAT GAGGAAATTG 2801 CATCGCATTG TCTGAGTAGG TGTCATTCTA TTCTGGGGGG TGGGGTGGGG 2851 CAGGACAGCA AGGGGGAGGA TTGGGAAGAC AATAGCAGGC ATGCTGGGGA 2901 TGCGGTGGGC TCTATGGCTT CTGAGGCGGA AAGAACCAGC TGGGGCTCTA 2951 GGGGGTATCC CCACGCGCCC TGTAGCGGCG CATTAAGCGC GGCGGGTGTG 3001 GTGGTTACGC GCAGCGTGAC CGCTACACTT GCCAGCGCCC TAGCGCCCGC 3051 TCCTTTCGCT TTCTTCCCTT CCTTTCTCGC CACGTTCGCC GGCTTTCCCC 3101 GTCAAGCTCT AAATCGGGGC ATCCCTTTAG GGTTCCGATT TAGTGCTTTA 3151 CGGCACCTCG ACCCCAAAAA ACTTGATTAG GGTGATGGTT CACGTAGTGG 3201 GCCATCGCCC TGATAGACGG TTTTTCGCCC TTTGACGTTG GAGTCCACGT 3251 TCTTTAATAG TGGACTCTTG TTCCAAACTG GAACAACACT CAACCCTATC 3301 TCGGTCTATT CTTTTGATTT ATAAGGGATT TTGGGGATTT CGGCCTATTG 3351 GTTAAAAAAT GAGCTGATTT AACAAAAATT TAACGCGAAT TAATTCTGTG 3401 GAATGTGTGT CAGTTAGGGT GTGGAAAGTC CCCAGGCTCC CCAGGCAGGC 3451 AGAAGTATGC AAAGCATGCA TCTCAATTAG TCAGCAACCA GGTGTGGAAA 3501 GTCCCCAGGC TCCCCAGCAG GCAGAAGTAT GCAAAGCATG CATCTCAATT 3551 AGTCAGCAAC CATAGTCCCG CCCCTAACTC CGCCCATCCC GCCCCTAACT 3601 CCGCCCAGTT CCGCCCATTC TCCGCCCCAT GGCTGACTAA TTTTTTTTAT 3651 TTATGCAGAG GCCGAGGCCG CCTCTGCCTC TGAGCTATTC CAGAAGTAGT 3701 GAGGAGGCTT TTTTGGAGGC CTAGGCTTTT GCAAAAAGCT CCCGGGAGCT 3751 TGTATATCCA TTTTCGGATC TGATCAAGAG ACAGGATGAG GATCGTTTCG 3801 CATGATTGAA CAAGATGGAT TGCACGCAGG TTCTCCGGCC GCTTGGGTGG 3851 AGAGGCTATT CGGCTATGAC TGGGCACAAC AGACAATCGG CTGCTCTGAT 3901 GCCGCCGTGT TCCGGCTGTC AGCGCAGGGG CGCCCGGTTC TTTTTGTCAA 3951 GACCGACCTG TCCGGTGCCC TGAATGAACT GCAGGACGAG GCAGCGCGGC 4001 TATCGTGGGT GGCCACGAGG GGCGTTCCTT GCGCAGCTGT GCTCGACGTT 4051 GTCACTGAAG CGGGAAGGGA CTGGCTGCTA TTGGGCGAAG TGCCGGGGCA 4101 GGATCTCCTG TCATCTCACC TTGCTCCTGC CGAGAAAGTA TCCATCATGG 4151 CTGATGCAAT GCGGCGGCTG CATACGCTTG ATCCGGCTAC CTGCCCATTC 4201 GACCACCAAG CGAAACATCG CATCGAGCGA GCACGTACTC GGATGGAAGC 4251 CGGTCTTGTC GATCAGGATG ATCTGGACGA AGAGCATCAG GGGCTCGCGC 4301 CAGCCGAACT GTTCGCCAGG CTCAAGGCGC GCATGCCCGA CGGCGAGGAT 4351 CTCGTCGTGA CCCATGGCGA TGCCTGCTTG CCGAATATCA TGGTGGAAAA 4401 TGGCCGCTTT TCTGGATTCA TCGACTGTGG CCGGCTGGGT GTGGCGGACC 4451 GCTATCAGGA CATAGCGTTG GCTACCCGTG ATATTGCTGA AGAGCTTGGC 4501 GGCGAATGGG CTGACCGCTT CCTCGTGCTT TACGGTATCG CCGCTCCCGA 4551 TTCGCAGCGC ATCGCCTTCT ATCGCCTTCT TGACGAGTTC TTCTGAGCGG 4601 GACTCTGGGG TTCGAAATGA CCGACCAAGC GACGCCCAAC CTGCCATCAC 4651 GAGATTTCGA TTCCACCGCC GCCTTCTATG AAAGGTTGGG CTTCGGAATC 4701 GTTTTCCGGG ACGCCGGCTG GATGATCCTC CAGCGCGGGG ATCTCATGCT 4751 GGAGTTCTTC GCCCACCCCA ACTTGTTTAT TGCAGCTTAT AATGGTTACA 4801 AATAAAGCAA TAGCATCACA AATTTCACAA ATAAAGCATT TTTTTCACTG 4851 CATTCTAGTT GTGGTTTGTC CAAACTCATC AATGTATCTT ATCATGTCTG 4901 TATACCGTCG ACCTCTAGCT AGAGCTTGGC GTAATCATGG TCATAGCTGT 4951 TTCCTGTGTG AAATTGTTAT CCGCTCACAA TTCCACACAA CATACGAGCC 5001 GGAAGCATAA AGTGTAAAGC CTGGGGTGCC TAATGAGTGA GCTAACTCAC 5051 ATTAATTGCG TTGCGCTCAC TGCCCGCTTT CCAGTCGGGA AACCTGTCGT 5101 GCCAGCTGCA TTAATGAATC GGCCAACGCG CGGGGAGAGG CGGTTTGCGT 5151 ATTGGGCGCT CTTCCGCCTC CTCGCTCACT GACTCGCTGC GCTCGGTCGT 5201 TCGGCTGCGG CGAGCGGTAT CAGCTCACTC AAAGGCGGTA ATACGGTTAT 5251 CCACAGAATC AGGGGATAAC GCAGGAAAGA ACATGTGAGC AAAAGGCCAG 5301 CAAAAGGCCA GGAACCGTAA AAAGGCCGCG TTGCTGGCGT TTTTCCATAG 5351 GCTCCGCCCC CCTGACGAGC ATCACAAAAA TCGACGCTCA AGTCAGAGGT 5401 GGCGAAACCC GACAGGACTA TAAAGATACC AGGCGTTTCC CCCTGGAAGC 5451 TCCCTCGTGC GCTCTCCTGT TCCGACCCTG CCGCTTACCG GATACCTGTC 5501 CGCCTTTCTC CCTTCGGGAA GCGTGGCGCT TTCTCAATGC TCACGCTGTA 5551 GGTATCTCAG TTCGGTGTAG GTCGTTCGCT CCAAGCTGGG CTGTGTGCAC 5601 GAACCCCCCG TTCAGCCCGA CCGCTGCGCC TTATCCGGTA ACTATCGTCT 5651 TGAGTCCAAC CCGGTAAGAC ACGACTTATC GCCACTGGCA GCAGCCACTG 5701 GTAACAGGAT TAGCAGAGCG AGGTATGTAG GCGGTGCTAC AGAGTTCTTG 5751 AAGTGGTGGC CTAACTACGG CTACACTAGA AGGACAGTAT TTGGTATCTG 5801 CGCTCTGCTG AAGCCAGTTA CCTTCGGAAA AAGAGTTGGT AGCTCTTGAT 5851 CCGGCAAACA AACCACCGCT GGTAGCGGTG GTTTTTTTGT TTGCAAGCAG 5901 CAGATTACGC GCAGAAAAAA AGGATCTCAA GAAGATCCTT TGATCTTTTC 5951 TACGGGGTCT GACGCTCAGT GGAACGAAAA CTCACGTTAA GGGATTTTGG 6001 TCATGAGATT ATCAAAAAGG ATCTTCACCT AGATCCTTTT AAATTAAAAA 6051 TGAAGTTTTA AATCAATCTA AAGTATATAT GAGTAAACTT GGTCTGACAG 6101 TTACCAATGC TTAATCAGTG AGGCACCTAT CTCAGCGATC TGTCTATTTC 6151 GTTCATCCAT AGTTGCCTGA CTCCCCGTCG TGTAGATAAC TACGATACGG 6201 GAGGGCTTAC CATCTGGCCC CAGTGCTGCA ATGATACCGC GAGACCCACG 6251 CTCACCGGCT CCAGATTTAT CAGCAATAAA CCAGCCAGCC GGAAGGGCCG 6301 AGCGCAGAAG TGGTCCTGCA ACTTTATCCG CCTCCATCCA GTCTATTAAT 6351 TGTTGCCGGG AAGCTAGAGT AAGTAGTTCG CCAGTTAATA GTTTGCGCAA 6401 CGTTGTTGCC ATTGCTACAG GCATCGTGGT GTCACGCTCG TCGTTTGGTA 6451 TGGCTTCATT CAGCTCCGGT TCCCAACGAT CAAGGCGAGT TACATGATCC 6501 CCCATGTTGT GCAAAAAAGC GGTTAGCTCC TTCGGTCCTC CGATCGTTGT 6551 CAGAAGTAAG TTGGCCGCAG TGTTATCACT CATGGTTATG GCAGCACTGC 6601 ATAATTCTCT TACTGTCATG CCATCCGTAA GATGCTTTTC TGTGACTGGT 6651 GAGTACTCAA CCAAGTCATT CTGAGAATAG TGTATGCGGC GACCGAGTTG 6701 CTCTTGCCCG GCGTCAATAC GGGATAATAC CGCGCCACAT AGCAGAACTT 6751 TAAAAGTGCT CATCATTGGA AAACGTTCTT CGGGGCGAAA ACTCTCAAGG 6801 ATCTTACCGC TGTTGAGATC CAGTTCGATG TAACCCACTC GTGCACCCAA 6851 CTGATCTTCA GCATCTTTTA CTTTCACCAG CGTTTCTGGG TGAGCAAAAA 6901 CAGGAAGGCA AAATGCCGCA AAAAAGGGAA TAAGGGCGAC ACGGAAATGT 6951 TGAATACTCA TACTCTTCCT TTTTCAATAT TATTGAAGCA TTTATCAGGG 7001 TTATTGTCTC ATGAGCGGAT ACATATTTGA ATGTATTTAG AAAAATAAAC 7051 AAATAGGGGT TCCGCGCACA TTTCCCCGAA AAGTGCCACC TGACGTCGAC 7101 GGATCGGG 表12：重组质粒pQE30-H-SemaL-BH的序列(SEQ ID NO.:39) 1 CTCGAGAAAT CATAAAAAAT TTATTTGCTT TGTGAGCGGA TAACAATTAT 51 AATAGATTCA ATTGTGAGCG GATAACAATT TCACACAGAA TTCATTAAAG 101 AGGAGAAATT AACTATGAGA GGATCGCATC ACCATCACCA TCACGGAtcc 151 ctggttctgt ttgaagggga cgaggtgtat tccaccatcc ggaagcagga 201 atacaatggg aagatccctc ggttccgccg catccggggc gagagtgagc 251 tgtacaccag tgatactgtc atgcagaacc cacagttcat caaagccacc 301 atcgtgcacc aagaccaggc ttacgatgac aagatctact acttcttccg 351 agaggacaat cctgacaaga atcctgaggc tcctctcaat gtgtcccgtg 401 tggcccagtt gtgcaggggg gaccagggtg gggaaagttc actgtcagtc 451 tccaagtgga acacttttct gaaagccatg ctggtatgca gtgatgctgc 501 caccaacaag aacttcaaca ggctgcaaga cgtcttcctg ctccctgacc 551 ccagcggcca gtggagggac accagggtct atggtgtttt ctccaacccc 601 tggaactact cagccgtctg tgtgtattcc ctcggtgaca ttgacaaggt 651 cttccgtacc tcctcactca agggctacca ctcaagcctt cccaacccgc 701 ggcctggcaa gtgcctccca gaccagcagc cgatacccac agaAAGCTTA 751 ATTAGCTGAG CTTGGACTCC TGTTGATAGA TCCAGTAATG ACCTCAGAAC 801 TCCATCTGGA TTTGTTCAGA ACGCTCGGTT GCCGCCGGGC GTTTTTTATT 851 GGTGAGAATC CAAGCTAGCT TGGCGAGATT TTCAGGAGCT AAGGAAGCTA 901 AAATGGAGAA AAAAATCACT GGATATACCA CCGTTGATAT ATCCCAATGG 951 CATCGTAAAG AACATTTTGA GGCATTTCAG TCAGTTGCTC AATGTACCTA 1001 TAACCAGACC GTTCAGCTGG ATATTACGGC CTTTTTAAAG ACCGTAAAGA 1051 AAAATAAGCA CAAGTTTTAT CCGGCCTTTA TTCACATTCT TGCCCGCCTG 1101 ATGAATGCTC ATCCGGAATT TCGTATGGCA ATGAAAGACG GTGAGCTGGT 1151 GATATGGGAT AGTGTTCACC CTTGTTACAC CGTTTTCCAT GAGCAAACTG 1201 AAACGTTTTC ATCGCTCTGG AGTGAATACC ACGACGATTT CCGGCAGTTT 1251 CTACACATAT ATTCGCAAGA TGTGGCGTGT TACGGTGAAA ACCTGGCCTA 1301 TTTCCCTAAA GGGTTTATTG AGAATATGTT TTTCGTCTCA GCCAATCCCT 1351 GGGTGAGTTT CACCAGTTTT GATTTAAACG TGGCCAATAT GGACAACTTC 1401 TTCGCCCCCG TTTTCACCAT GGGCAAATAT TATACGCAAG GCGACAAGGT 1451 GCTGATGCCG CTGGCGATTC AGGTTCATCA TGCCGTCTGT GATGGCTTCC 1501 ATGTCGGCAG AATGCTTAAT GAATTACAAC AGTACTGCGA TGAGTGGCAG 1551 GGCGGGGCGT AATTTTTTTA AGGCAGTTAT TGGTGCCCTT AAACGCCTGG 1601 GGTAATGACT CTCTAGCTTG AGGCATCAAA TAAAACGAAA GGCTCAGTCG 1651 AAAGACTGGG CCTTTCGTTT TATCTGTTGT TTGTCGGTGA ACGCTCTCCT 1701 GAGTAGGACA AATCCGCCGC TCTAGAGCTG CCTCGCGCGT TTCGGTGATG 1751 ACGGTGAAAA CCTCTGACAC ATGCAGCTCC CGGAGACGGT CACAGCTTGT 1801 CTGTAAGCGG ATGCCGGGAG CAGACAAGCC CGTCAGGGCG CGTCAGCGGG 1851 TGTTGGCGGG TGTCGGGGCG CAGCCATGAC CCAGTCACGT AGCGATAGCG 1901 GAGTGTATAC TGGCTTAACT ATGCGGCATC AGAGCAGATT GTACTGAGAG 1951 TGCACCATAT GCGGTGTGAA ATACCGCACA GATGCGTAAG GAGAAAATAC 2001 CGCATCAGGC GCTCTTCCGC TTCCTCGCTC ACTGACTCGC TGCGCTCGGT 2051 CTGTCGGCTG CGGCGAGCGG TATCAGCTCA CTCAAAGGCG GTAATACGGT 2101 TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG AGCAAAAGGC 2151 CAGCAAAAGG CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA 2201 TAGGCTCCGC CCCCCTGACG AGCATCACAA AAATCGACGC TCAAGTCAGA 2251 GGTGGCGAAA CCCGACAGGA CTATAAAGAT ACCAGGCGTT TCCCCCTGGA 2301 AGCTCCCTCG TGCGCTCTCC TGTTCCGACC CTGCCGCTTA CCGGATACCT 2351 GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC GCTTTCTCAA TGCTCACGCT 2401 GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG 2451 CACGAACCCC CCGTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG 2501 TCTTGAGTCC AACCCGGTAA GACACGACTT ATCGCCACTG GCAGCAGCCA 2551 CTGGTAACAG GATTAGCAGA GCGAGGTATG TAGGCGGTGC TACAGAGTTC 2601 TTGAAGTGGT GGCCTAACTA CGGCTACACT AGAAGGACAG TATTTGGTAT 2651 CTGCGCTCTG CTGAAGCCAG TTACCTTCGG AAAAAGAGTT GGTAGCTCTT 2701 GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG 2751 CAGCAGATTA CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT 2801 TTCTACGGGG TCTGACGCTC AGTGGAACGA AAACTCACGT TAAGGGATTT 2851 TGGTCATGAG ATTATCAAAA AGGATCTTCA CCTAGATCCT TTTAAATTAA 2901 AAATGAAGTT TTAAATCAAT CTAAAGTATA TATGAGTAAA CTTGGTCTGA 2951 CAGTTACCAA TGCTTAATCA GTGAGGCACC TATCTCAGCG ATCTGTCTAT 3001 TTCGTTCATC CATAGCTGCC TGACTCCCCG TCGTGTAGAT AACTACGATA 3051 CGGGAGGGCT TACCATCTGG CCCCAGTGCT GCAATGATAC CGCGAGACCC 3101 ACGCTCACCG GCTCCAGATT TATCAGCAAT AAACCAGCCA GCCGGAAGGG 3151 CCGAGCGCAG AAGTGGTCCT GCAACTTTAT CCGCCTCCAT CCAGTCTATT 3201 AATTGTTGCC GGGAAGCTAG AGTAAGTAGT TCGCCAGTTA ATAGTTTGCG 3251 CAACGTTGTT GCCATTGCTA CAGGCATCGT GGTGTCACGC TCGTCGTTTG 3301 GTATGGCTTC ATTCAGCTCC GGTTCCCAAC GATCAAGGCG AGTTACATGA 3351 TCCCCCATGT TGTGCAAAAA AGCGGTTAGC TCCTTCGGTC CTCCGATCGT 3401 TGTCAGAAGT AAGTTGGCCG CAGTGTTATC ACTCATGGTT ATGGCAGCAC 3451 TGCATAATTC TCTTACTGTC ATGCCATCCG TAAGATGCTT TTCTGTGACT 3501 GGTGAGTACT CAACCAAGTC ATTCTGAGAA TAGTGTATGC GGCGACCGAG 3551 TTGCTCTTGC CCGGCGTCAA TACGGGATAA TACCGCGCCA CATAGCAGAA 3601 CTTTAAAAGT GCTCATCATT GGAAAACGTT CTTCGGGGCG AAAACTCTCA 3651 AGGATCTTAC CGCTGTTGAG ATCCAGTTCG ATGTAACCCA CTCGTGCACC 5701 CAACTGATCT TCAGCATCTT TTACTTTCAC CAGCGTTTCT GGGTGAGCAA 3751 AAACAGGAAG GCAAAATGCC GCAAAAAAGG GAATAAGGGC GACACGGAAA 3801 TGTTGAATAC TCATACTCTT CCTTTTTCAA TATTATTGAA GCATTTATCA 3851 GGGTTATTGT CTCATGAGCG GATACATATT TGAATGTATT TAGAAAAATA 3901 AACAAATAGG GGTTCCGCGC ACATTTCCCC GAAAAGTGCC ACCTGACGTC 3951 TAAGAAACCA TTATTATCAT GACATTAACC TATAAAAATA GGCGTATCAC 4001 GAGGCCCTTT CGTCTTCAC 表13：重组质粒pQE31-H-SemaL-SH的序列(SEQ ID NO.:40) 1 CTCGAGAAAT CATAAAAAAT TTATTTGCTT TGTGAGCGGA TAACAATTAT 51 AATAGATTCA ATTGTGAGCG GATAACAATT TCACACAGAA TTCATTAAAG 101 AGGAGAAATT AACTATGAGA GGATCGCATC ACCATCACCA TCACACGGAT 151 CCGCATGCga gctcccagtg ggaggtgagc caggtgcccc tggacctgtg 201 tgaggtctat ggcgggggct gccacggttg cctcatgtcc cgagacccct 251 actgcggctg ggaccagggc cgctgcatct ccatctacag ctccgaacgg 301 tcagtgctgc aatccattaa tccagccgag ccacacaagg agtgtcccaa 351 ccccaaacca gacaaggccc cactgcagaa ggtttccctg gccccaaact 401 ctcgctacta cctgagctgc cccatggaat cccgccacgc cacctactca 451 tggcgccaca aggagaacgt ggagcagagc tgcgaacctg gtcaccagag 501 ccccaactgc atcctgttca tcgagaacct cacggcgcag cagtacggcc 551 actacttctg cgaggcccag gagggctcct acttccgcga ggctcagcac 601 tggcagctgc tgcccgagga cggcatcatg gccgagcacc tgctgggtca 651 tgcctgtgcc ctggctgcct ccctctggct gggggtgctg cccacactca 701 ctcttggctt gctggtccac gtgaagcttA ATTAGCTGAG CTTGGACTCC 751 TGTTGATAGA TCCAGTAATG ACCTCAGAAC TCCATCTGGA TTTGTTCAGA 801 ACGCTCGGTT GCCGCCGGGC GTTTTTTATT GGTGAGAATC CAAGCTAGCT 851 TGGCGAGATT TTCAGGAGCT AAGGAAGCTA AAATGGAGAA AAAAATCACT 901 GGATATACCA CCGTTGATAT ATCCCAATGG CATCGTAAAG AACATTTTGA 951 GGCATTTCAG TCAGTTGCTC AATGTACCTA TAACCAGACC GTTCAGCTGG 1001 ATATTACGGC CTTTTTAAAG ACCGTAAAGA AAAATAAGCA CAAGTTTTAT 1051 CCGGCCTTTA TTCACATTCT TGCCCGCCTG ATGAATGCTC ATCCGGAATT 1101 TCGTATGGCA ATGAAAGACG GTGAGCTGGT GATATGGGAT AGTGTTCACC 1151 CTTGTTACAC CGTTTTCCAT GAGCAAACTG AAACGTTTTC ATCGCTCTGG 1201 AGTGAATACC ACGACGATTT CCGGCAGTTT CTACACATAT ATTCGCAAGA 1251 TGTGGCGTGT TACGGTGAAA ACCTGGCCTA TTTCCCTAAA GGGTTTATTG 1301 AGAATATGTT TTTCGTCTCA GCCAATCCCT GGGTGAGTTT CACCAGTTTT 1351 GATTTAAACG TGGCCAATAT GGACAACTTC TTCGCCCCCG TTTTCACCAT 1401 GGGCAAATAT TATACGCAAG GCGACAAGGT GCTGATGCCG CTGGCGATTC 1451 AGGTTCATCA TGCCGTCTGT GATGGCTTCC ATGTCGGCAG AATGCTTAAT 1501 GAATTACAAC AGTACTGCGA TGAGTGGCAG GGCGGGGCGT AATTTTTTTA 1551 AGGCAGTTAT TGGTGCCCTT AAACGCCTGG GGTAATGACT CTCTAGCTTG 1601 AGGCATCAAA TAAAACGAAA GGCTCAGTCG AAAGACTGGG CCTTTCGTTT 1651 TATCTGTTGT TTGTCGGTGA ACGCTCTCCT GAGTAGGACA AATCCGCCGC 1701 TCTAGAGCTG CCTCGCGCGT TTCGGTGATG ACGGTGAAAA CCTCTGACAC 1751 ATGCAGCTCC CGGAGACGGT CACAGCTTGT CTGTAAGCGG ATGCCGGGAG 1801 CAGACAAGCC CGTCAGGGCG CGTGAGCGGG TGTTGGCGGG TGTCGGGGCG 1851 CAGCCATGAC CCAGTCACGT AGCGATAGCG GAGTGTATAC TGGCTTAACT 1901 ATGCGGCATC AGAGCAGATT GTACTGAGAG TGCACCATAT GCGGTGTGAA 1951 ATACCGCACA GATGCGTAAG GAGAAAATAC CGCATCAGGC GCTCTTCCGC 2001 TTCCTCGCTC ACTGACTCGC TGCGCTCGGT CTGTCGGCTG CGGCGAGCGG 2051 TATCAGCTCA CTCAAAGGCG GTAATACGGT TATCCACAGA ATCAGGGGAT 2101 AACGCAGGAA AGAACATGTG AGCAAAAGGC CAGCAAAAGG CCAGGAACCG 2151 TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC CCCCCTGACG 2201 AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA CCCGACAGGA 2251 CTATAAAGAT ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC 2301 TGTTCCGACC CTGCCGCTTA CCGGATACCT GTCCGCCTTT CTCCCTTCGG 2351 GAAGCGTGGC GCTTTCTCAA TGCTCACGCT GTAGGTATCT CAGTTCGGTG 2401 TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG CACGAACCCC CCGTTCAGCC 2451 CGACCGCTGC GCCTTATCCG GTAACTATGG TCTTGAGTCC AACCCGGTAA 2501 GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG GATTAGCAGA 2551 GCGAGGTATG TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA 2601 CGGCTACACT AGAAGGACAG TATTTGGTAT CTGCGCTCTG CTGAAGCCAG 2651 TTACCTTCGG AAAAAGAGTT GGTAGCTCTT GATCCGGCAA ACAAACCACC 2701 GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG CAGCAGATTA CGCGCAGAAA 2751 AAAAGGATCT CAAGAAGATC CTTTGATCTT TTCTACGGGG TCTGACGCTC 2801 AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG ATTATCAAAA 2851 AGGATCTTCA CCTAGATCCT TTTAAATTAA AAATGAAGTT TTAAATCAAT 2901 CTAAAGTATA TATGAGTAAA CTTGGTCTGA CAGTTACCAA TGCTTAATCA 2951 GTGAGGCACC TATCTCAGCG ATCTGTCTAT TTCGTTCATC CATAGCTGCC 3001 TGACTCCCCG TCGTGTAGAT AACTACGATA CGGGAGGGCT TACCATCTGG 3051 CCCCAGTGCT GCAATGATAC CGCGAGACCC ACGCTCACCG GCTCCAGATT 3101 TATCAGCAAT AAACCAGCCA GCCGGAAGGG CCGAGCGCAG AAGTGGTCCT 3151 GCAACTTTAT CCGCCTCCAT CCAGTCTATT AATTGTTGCC GGGAAGCTAG 3201 AGTAAGTAGT TCGCCAGTTA ATAGTTTGCG CAACGTTGTT GCCATTGCTA 3251 CAGGCATCGT GGTGTCACGC TCGTCGTTTG GTATGGCTTC ATTCAGCTCC 3301 GGTTCCCAAC GATCAAGGCG AGTTACATGA TCCCCCATGT TGTGCAAAAA 3351 AGCGGTTAGC TCCTTCGGTC CTCCGATCGT TGTCAGAAGT AAGTTGGCCG 3401 CAGTGTTATC ACTCATGGTT ATGGCAGCAC TGCATAATTC TCTTACTGTC 3451 ATGCCATCCG TAAGATGCTT TTCTGTGACT GGTGAGTACT CAACCAAGTC 3501 ATTCTGAGAA TAGTGTATGC GGCGACCGAG TTGCTCTTGC CCGGCGTCAA 3551 TACGGGATAA TACCGCGCCA CATAGCAGAA CTTTAAAAGT GCTCATCATT 3601 GGAAAACGTT CTTCGGGGCG AAAACTCTCA AGGATCTTAC CGCTGTTGAG 3651 ATCCAGTTCG ATGTAACCCA CTCGTGCACC CAACTGATCT TCAGCATCTT 3701 TTACTTTCAC CAGCGTTTCT GGGTGAGCAA AAACAGGAAG GCAAAATGCC 3751 GCAAAAAAGG GAATAAGGGC GACACGGAAA TGTTGAATAC TCATACTCTT 3801 CCTTTTTCAA TATTATTGAA GCATTTATCA GGGTTATTGT CTCATGAGCG 3851 GATACATATT TGAATGTATT TAGAAAAATA AACAAATAGG GGTTCCGCGC 3901 ACATTTCCCC GAAAAGTGCC ACCTGACGTC TAAGAAACCA TTATTATCAT 3951 GACATTAACC TATAAAAATA GGCGTATCAC GAGGCCCTTT CGTCTTCAC 表14：人信息素L基团的(部分)核苷酸序列(8888个核苷酸)(SEQ ID NO.:41) GAGCCGCACACGGTGCTTTTCCACGAGCCAGGCAGCTCCTCTGTGTGGGTGGGAGGACGT GGCAAGGTCTACCTCTTTGACTTCCCCGAGGGCAAGAACGCATCTGTGCGCACGGTGAGC CTCTCTCTTCCCCCAACACCCCCCCTACCCTCTTATCTCCCCTCTGGCCCTGCCAAGGGT CCTCAGGGAATCCGAGGGAGCTGGCTTCTCTTCCTAAACTGCCCCCACCTCCGTATCCTA TAAATGGCTCCTGGGGGAGGCTCCCTAAAGGTAGTCCAGATTGGAGTGGGGAGCTGGGGC GGTGTGGAGAAAAACAGGAGCTAATGGGCCTGGCCAGCTGGGCAGCGCTGCTGCGGAAAG CCCAGGCTGGAAGCTGGGCCCCAGAGCCCATGCCTGGTCTTCTGAACCCTCTGGGCCTCA GCTCTGGATATGAGACCCTGTTTGACCTCAGGTAGATCACTCACCCTCTCAGAGCCCCAG TTGCTCATCTGTCAGATGAGAATAATGGTTGCTTCCTTTGGGGCTTATCCTGAGGCTGTG TGGAAAGCATTTCAGGGGTACCTCACCCCTGGCAGATTGAACTAATGCTTCTCCCCTTCC CCAGGTGAATATCGGCTCCACAAAGGGGTCCTGTCTGGATAAGCGGGTGAGCGGGGGAGG GATCTGGAGGGGTCTGAGCCACTTGGTAAAGGGAGAGGAGACCCTGAGGGTCTAAGGAAG GAAGCATGGCCCTGCCCCACGAGTCCCAGACTGATGGGGAGACGTGGTCCTCTGTGCTTA GGGGATGGCGTCAGCTGCACACACTCTGGGCTGTCCCGGGAGGCTGTCACCTATGCTAAG CCCTTCTGACACCTTCTTCCCTGATCCTGGGGGTCCTAGTGCTAGGCTTGCCAGGGCCTT CCAGCAACCAATTTCTCTCCTCCCTTCTCTCTTCCCCGGGCAGGACTGCGAGAACTACAT CACTCTCCTGGAGAGGCGGAGTGAGGGGCTGCTGGCCTGTGGCACCAACGCCCGGCACCC CAGCTGCTGGAACCTGGTGAGAAGGCTGCTCCCCATGTGCCTGATCAGCTCACCTTCTAC TGCGTGGGCTTCTGCCCCTCATGGTGGGAAGGAGATGGCGAGACTCCAATGCTGGCCTTG CCCTGGGAGGATGGGGCTCCTGGCCGAGAAACTGGCCGTCATGGGAGGCAGTGGCTGTGG GATTATGTGGCCATCCAACCCTCTGGATCTCCCACAGGTGAATGGCACTGTGGTGCCACT TGGCGAGATGAGAGGCTACGCCCCCTTCAGCCCGGACGAGAACTCCCTGGTTCTGTTTGA AGGTTGGGGCATGCTTCGGAACTGGGCTGGGAGCAGGATGGTCAGCTCTTTGTCCAGTGT CCGGAGGAGGGACTTCCAGGAGCTGCCTGCCCTTACTCATTTCTCCCTCCCACTGACCCC AGGGGACGAGGTGTATTCCACCATCCGGAAGCAGGAATACAATGGGAAGATCCCTCGGTT CCGCCGCATCCGGGGCGAGAGTGAGCTGTACACCAGTGATACTGTCATGCAGAGTGAGTC AGGCTCCGGCTGGGCTGAGGGTGGGCAAGGGGGTGTGAGCACTTAAGGTGGCAGATGGGA TCCTGATGTTTCTGGGAGGGCTCCCTGAGGGCCGCTGGGGCCATGCAGGAAAGCAGGACC TTGGTATAGGCCTGAGAAGTTAGGGTTGGCTGGGAGCAGAGGAACAGACAAGGTATAGCA GTGGGATGGGCCCAGCCCTCTTCAGGAACACAAACAGAGGGAGCCCCAGACCCAGTGCAG GGTCCCCAGGAGCCAAAGTTTATCCTCTGCTGAGTTCACGTGGAGGCAGCCCCCCAACTC CCTCCTCATCAGGGCTCTGCCAATTGAGCAGAAGTGACATAGGGGCCCCCAGGGACCTTC CCCCACTCCCCAGGCATGAAGTCATTGCTCCTGGGCCGATGACATCTTTGTAGGAAGAGG GCAAAACAGGTGTGGGGTGGAGGTGCAGGGTCTAGGGCCCCTCGGGGAGTTGGACCTGAT GTTATGAGTCCTATTCCAGATCTGATTTGCCATGGTTTGTGCAGACCCGAAGGAGGGAGG AGAGTGTGCAGGGTTGGAATGGTCTCCCGGGCAAGCTTCCCAGCCTTACGCCCATTCGCT TCTGTGCCCTGGCAGACCCACAGTTCATCAAAGCCACCATCGTGCACCAAGACCAGGCTT ACGATGACAAGATCTACTACTTCTTCCGAGAGGACAATCCTGACAAGAATCCTGAGGCTC CTCTCAATGTGTCCCGTGTGGCCCAGTTGTGCAGGGTGAACACGGGCGTGAGGGCTGCTG GCTACGTGTCTGTGCATGAATAGGCCTGAGTGAGGGTGAGTTCTGTGTGTCCGTGTGCAT GTAGAAGTTGTGTGGATGTATGAGTGGGTCTGTGTCAGGGACTGTGGGAGCAGCTGTGTG TGCATGGAGCATCATGTGTCTGTGTGTGGGTAAAGGTGGCTGAGCTCCTGTGCACGTATG ATGGCGTGTGAGCGTGTGTATGATGGGGTGTGTGTGTGTGTGTGTGTGTGTGTTTTGCCT GTGTGAATGTGCTGTGCCACGTATGTGGGTGCGTGAGTCAGTAAATGTGTGTCTGAGTCC GTCTGCTCTGTGGGGACCTGGCACTCTCACCTGCCCTGACCCTGGGCACTGCTGGCCCTG GGCTCTGGATCAGCCAGGCCTGCTTGCAGGAGTCTCATCTGGAGACCTGCCCTGAGTCCT GGGGCACCCCCGGCAGGTCCTGGCCCCTCGCAGCCTGCCTTCCTCCTCTGGGCCCAGGTG TTGATATTGCTGGCAGTGGTTTCCTGGGGTGTGTGGGGAAGCCCGGGCAGGTGCTGAGGG GCCTCTTCTCCCCTCTACCCTTCCAGGGGGACCAGGGTGGGGAAAGTTCACTGTCAGTCT CCAAGTGGAACACTTTTCTGAAAGCCATGCTGGTATGCAGTGATGCTGCCACCAACAAGA ACTTCAACAGGCTGCAAGACGTCTTCCTGCTCCCTGACCCCAGCGGCCAGTGGAGGGACA CCAGGGTCTATGGTGTTTTCTCCAACCCCTGGTGAGTGGCCCTTGTCCTGGGGCCGGGGC TGGCATTGGTTCAGTGTCCAGTAGGGACAGGAGGCCTTGGGCCCTGCTGAGGGCCTCCCT GGTGTGGCAGGAGCAGGGGCTGCAGGCTCAAGAGGCTGGGCTGTTGCTGGGTGTGGGGTG GGGGGACAGCCAGTGCGATGTATGTACTGTTGTGTGAGTGAGTCTGCACTCATGGGTGTG TGTGCATGCCCTATATGCACACTCATGACTGCACTTGTGCCTGTGTGTCCCACCACCTGC TTGTGCCGAGAGTGGACACTGGGCCCAGGAGGAAGCTGCTGAAGCATCTCTCGGGGAGCT GGGTGCTATTACACCTGCTCAGGCACTGCCTGAGCCCGATAATTCACACTTCTTAATCAC TCTCATTGATTGAACACACGGCAGGCGGAAGTGTTGGGTGTGTGTGGGGAGAGTTAGGGA TAGAGTGGAGGAAGCCAAGACCCTGCTCTGTGGCTCCTGGGTGAGTGGGTCCCCCAGGCT GGGAAGGGGTTGGGGGTCTGGCCTCCTGGGGCATCAGCACCCCACAGCCTGTGCCCAGGG AGGGCTAGAGAACTGCTCAGCCTATGATGGGGTTCCTCCTGCCTTGGGGTTGGGTAGAGC AGATGGCCTCTAGACTCAGTGATTCTGTAACAGGATACAAGTTTGTGGTTTTAAATTGCA GCACAAAGAAATTAGGCTGAACTCCTCTCCTTCCTCCTCTCCATCCCTCCCCATTTTCAG TGGTGGTTGGCAACTCAGTGCCAGGCACAAGGCTGGCCTGGGTGAGTGGAGGTGGATGGG TGGGTTCTGGGCCCCCCATTGAGCTGGTCTCCATGTCACTGCAGGAACTACTCAGCCGTC TGTGTGTATTCCCTCGGTGACATTGACAAGGTCTTCCGTACCTCCTCACTCAAGGGCTAC CACTCAAGCCTTCCCAACCCGCGGCCTGGCAAGGTGAGCGTGACACCAGCCGTGGCCCAG GCCCAGCCCTCCTTCTGCCTCACCTCCCACCACCCCACTGACCTGGGCCTGCTCTCCTTG CCCAGTGCCTCCCAGACCAGCAGCCGATACCCACAGAGACCTTCCAGGTGGCTGACCGTC ACCCAGAGGTGGCGCAGAGGGTGGAGCCCATGGGGCCTCTGAAGACGCCATTGTTCCACT CTAAATACCACTACCAGAAAGTGGCCGTCCACCGCATGCAAGCCAGCCACGGGGAGACCT TTCATGTGCTTTACCTAACTACAGGTGAGAGGCTACCCCGGGACCCTCAGTTTGCTTTGT AAAAACGGGCATGAAAGGTGTAAGGAATAATGTAGTTAACATCTGGTTGGATCTTTACAT GTGGAAGGAATAATTGAGTGACTGGAGTTGTCAGGGGTTAATGTGTGTGGGTGTGGAAGA GCCAGGCAGGGAGAGCTTCCTGGAGGAGGTAGGGGCAAGAGGGAAAGGGGGATGGGAGAA AAGCAAGCACTGGGATTTGGAGGCGGAAATCTGGAGAGTCTGAGCAAAGCCAGGTGCACC TTTGGTCCAGATGTCTGACTCAGGGAAGAAGATGGTAGGAAGAGACGTGGCAAATGAGGA GGAGGGGCCTGAACCACAGGGATACTGGCCTCTGCCAGGCAGAATGAGGGAGTCAGGCCC TGCGCCTGTCTTTGGGATTGTGCAGGTGAGAAGAAACATTTGAGGAGTTGATGGGGCACA AATTAGGTATGGGGAAGGAGTTCCAGGGGGCAGAACCTTTGCCATCTCACAGAGGACAGG GGCAGCTTCTCTTCTTCCCTGGAGTAGGCCCTGCTGGGGGAAGCTGGGTGGAATGCCGTG GGAGATGCTCCTGCTTTCTGGAAAGCCACAGGACACGGAGGAGCCAGTCCTGAGTTGGGT TTGTCGCAGCTTCCCATGCCAGCTGCCTTCCTTGAGACTGGAAAGGGCCTCTAGCACCCC TGGGGCCATTCAATTCAGGCCCAGGCGCCCAACCTCAGTTGTTCACATTCCCCATGTGAT CTCCTGTTGCTGCTTCACCTTGGGACTGTCTCGGCTTTGGTGACCTTGTAGGAAACTGGA ACCCCAGCACCATTGTTTGGCTCCTGGAAGCCTTGGGGAGAGGAATTTCCCACAGGGCAG GGCCTGGGTCCTGATTCCCTGCCTCTTTACTCCCTATTCATCCCGGCTACACCCTTGGGC CCCCATCCTTGCTTGGCTCCAGTACTGGCTGGCACAGCTGTTGTGGTCATCCAGGGATGG CAGGGCACTGGGGAACAGAAGAGAGAGGTCACACAGTGCGGAACTGGGAGCAGGAGCTAG GACAAGGAAGGCTGGACTTGGGCCATGGACTCCCTTCCTGCAGACTTGGGAAGTGAGCAC ACTTGAGTGATTAGAGAAGGTGTCTTCGTTCTAAGGGCAGTGGAGGAGGCACCATTTTGG AGCCTGCATCATTCGTATTTGGGCTAGATTGAAAAATAGAGCTTTCTAAGTCCTCTGCAG AGAATGGGAGGCTCTCACAACTGGGAGAAGTATTGGCTCTTTTCCTGAGAATTTTGCCAA GGGTATGCTGTTACTGGGGCTGGTTTGGAAGGAGTATAGGGCATTATGTCTGTGAAGGCA GTGGCTGGGGTGGGGCCTTATCAGGCCCAAGGAGCATCTGGCCACATCTCAGAGTCCACA GATGAGGATCACGGATGTGTAGAGGAAACATCCTAGGCAGGCAATCATCTGACTGCTTTT TTGGGGCAGGTGATGCCCTGGGAAATTGGGAGGGAGGGAGAGAGGGAGGTAGGCTATTCT AGAAACTGGGAGAGCAGGTGAGGTAGGATTGGGAGGACCAGGGGTCAGGGTCCCCATTGG TCCCTAATTGAGAACGGAGAGAGCATTGGTCTAGGAGGCAGGCAGCTCGGTTATAAGACC TTGGGAACTCTTGATTTAGAATCCAAGATCCTTTTTAGATCTAGGATTTTATAAAATTAA GATATCCCCTAAGATCAAATGCAACGTGGAGTCCTGAATTGGATCCTAGAACAGAAGAAG GACATTTGTGGAAAAACTAGTGAAATCCAAATAAAGTCTGTAGTTTTGTTAATAGTAATG CACCAATGTCAGTTGCCTAGTTGTGACAAATATACCGTGGTTATGTAAGATGGTAACATT AGGGGGAACTGGAGAAGGGTAGATTGGAGCTCTCTGTACTATCTTTGCAACTTTTCTGGG AATCTAAAATTACTCCAAAATAAAAAAAAAATGTATTTAAAGTAAATATATTCCCTAAGA GTCCAGGAGGCAGGGGAGTTGTAGAAGCAGCTGAGTGGTTGGGTTCTGACAGATTTGGTT CCAACTCGGTCTCTGCTGCTCACCAGCTGTGTGACCTTGAGCAAGTGGCTTAGCCTTTCT GAGCCTGATTTCCTTATCTGTGGAGTGGGGAAGATGACAGCCACCTCGCAGGGCTGTGGA GGGTTAAACGAGGTGATGCATGGACAGCAGCCGCACTGACCTTGCTGGTGTGGGGCTCCT GCTTCTGTTCTTCCCGTGCAGCCTTGGGAATGTTGGAGGCCGTATCCAGGGACCCCTGGG CCTCCTGGGATGGCCTCTCTGGATCAGCCTTGGAAGGTTCCAGGCTGCCCTTAGGCTCCC ACATTCTTCCCCAGTCACGCTCTCCTCGCCCTGCCCACACCAGTCCTGTGACCCTTGCCT GAGTTGTGACTTCCCACCCCTCCCCGGCCTAGAGGAAAGCTGCCTGGCCCCTCAGTGGGA CTCCCGCCCACTGACCCTCTGTCCACCATACACAGACAGGGGCACTATCCACAAGGTGGT GGAACCGGGGGAGCAGGAGCACAGCTTCGCCTTCAACATCATGGAGATCCAGCCCTTCCG CCGCGCGGCTGCCATCCAGACCATGTCGCTGGATGCTGAGCGGGTGAGCCTTCCCCCACT GCGTCCCATGGGCTATGCAGTGACTGCAGCTGAGGACAGGGCTCCTTTGCATGTGATTTG TGTGTTCTTTTAAGAGCTTCTAGGCCTTAGGGCCTGGACATTTAGGACTGAGTGTGGGGT GGGGCCCGGGCCTGACCCAATCCTGCTGTCCTTCCAGAGGAAGCTGTATGTGAGCTCCCA GTGGGAGGTGAGCCAGGTGCCCCTGGACCTGTGTGAGGTCTATGGCGGGGGCTGCCACGG TTGCCTCATGTCCCGAGACCCCTACTGCGGCTGGGACCAGGGCCGCTGCATCTCCATCTA CAGCTCCGAACGGTACGTTGGCCGGGATCCCTCCGTCCCTGGGACAAGGTGGGCATGGGA CAGGGGGAGGTGTTGTCGGGCTGGAAGAGGTGGCGGTACTGGGCCTTTCTTGTGGGACCT CCTCTCTACTGGAACTGCACTAGGGGTAAGGATATGAGGGTCAGGTCTGCAGCCTTGTAT CTGCTGATCCTCTTTCGTCCTTCCCACTCCAGGTCAGTGCTGCAATCCATTAATCCAGCC GAGCCACACAAGGAGTGTCCCAACCCCAAACCAGGTACCTGATCTGGCCCTGCTGGCGGC TGTGGCCCAATGAGTGGGGTACTGCCCTGCCCTGATTGTCCTGGTCTGAGGGAAACATGG CCTTGTCCTGTGGGCCCCAGGTACATGGGGCAGGATACAGTCCTGCAGAGGGAGCCCTCT TGGTGGGATGAGCGAGACGGGAGAAAAAAGGAGGACGCTGAGGGCTGGGTTCCCCACGTT CATTCAGAAGCCTTGTCCTGGGATCCCAGTCGGTGGGGAGGACACATCCTCCCCTGGGAG CTCTTTGTCCCTCCTCACGGCTGCTTCCCCACTGCCTCCCCAGACAAGGCCCCACTGCAG AAGGTTTCCCTGGCCCCAAACTCTCGCTACTACCTGAGCTGCCCCATGGAATCCCGCCAC GCCACCTACTCATGGCGCCACAAGGAGAACGTGGAGCAGAGCTGCGAACCTGGTCACCAG AGCCCCAACTGCATCCTGTTCATCGAGAACCTCACGGCGCAGCAGTACGGCCACTACTTC TGCGAGGCCCAGGAGGGCTCCTACTTCCGCGAGGCTCAGCACTGGCAGCTGCTGCCCGAG GACGGCATCATGGCCGAGCACCTGCTGGGTCATGCCTGTGCCCTGGCCGCCTCCCTCTGG CTGGGGGTGCTGCCCACACTCACTCTTGGCTTGCTGGTCCACTAGGGCCTCCCGAGGCTG GGCATGCCTCAGGCTTCTGCAGCCCAGGGCACTAGAACGTCTCACACTCAGAGCCGGCTG GCCCGGGAGCTCCTTGCCTGCCACTTCTTCCAGGGGACAGAATAACCCAGTGGAGGATGC CAGGCCTGGAGACGTCCAGCCGCAGGCGGCTGCTGGGCCCCAGGTGGCGCACGGATGGTG AGGGGCTGAGAATGAGGGCACCGACTGTGAAGCTGGGGCATCGATGACCCAAGACTTTAT CTTCTGGAAAATATTTTTCAGACTCCTCAAACTTGACTAAATGCAGCGATGCTCCCAGCC CAAGAGCCCATGGGTCGGGGAGTGGGTTTGGATAGGAGAGCTGGGACTCCATCTCGACCC TGGGGCTGAGGCCTGAGTCCTTCTGGACTCTTGGTACCCACATTGCCTCCTTCCCCTCCC TCTCTCATGGCTGGGTGGCTGGTGTTCCTGAAGACCCAGGGCTACCCTCTGTCCAGCCCT GTCCTCTGCAGCTCCCTCTCTGGTCCTGGGTCCCACAGGACAGCCGCCTTGCATGTTTAT TGAAGGATGTTTGCTTTCCGGACGGAAGGACGGAAAAAGCTCTGAAAAAAAAAAAAAAAA AAAAAAAA 表15:pMelBacA-H-SEMAL的核苷酸序列(6622bp)(SEQ ID NO.:42) 1 GATATCATGG AGATAATTAA AATGATAACC ATCTCGCAAA TAAATAAGTA 51 TTTTACTGTT TTCGTAACAG TTTTGTAATA AAAAAACCTA TAAATATGAA 101 ATTCTTAGTC AACGTTGCCC TTGTTTTTAT GGTCGTATAC ATTTCTTACA 151 TCTATGCGGA TCGATGG gga tccgcccagg gccacctaag gagcggaccc 201 cgcatcttcg ccgtctggaa aggccatgta gggcaggacc gggtggactt 251 tggccagact gagccgcaca cggtgctttt ccacgagcca ggcagctcct 301 ctgtgtgggt gggaggacgt ggcaaggtct acctctttga cttccccgag 351 ggcaagaacg catctgtgcg cacggtgaat atcggctcca caaaggggtc 401 ctgtctggat aagcgggact gcgagaacta catcactctc ctggagaggc 451 ggagtgaggg gctgctggcc tgtggcacca acgcccggca ccccagctgc 501 tggaacctgg tgaatggcac tgtggtgcca cttggcgaga tgagaggcta 551 tgcccccttc agcccggacg agaactccct ggttctgttt gaaggggacg 601 aggtgtattc caccatccgg aagcaggaat acaatgggaa gatccctcgg 651 ttccgccgca tccggggcga gagtgagctg tacaccagtg atactgtcat 701 gcagaaccca cagttcatca aagccaccat cgtgcaccaa gaccaggctt 751 acgatgacaa gatctactac ttcttccgag aggacaatcc tgacaagaat 801 cctgaggctc ctctcaatgt gtcccgtgtg gcccagttgt gcagggggga 851 ccagggtggg gaaagttcac tgtcagtctc caagtggaac acttttctga 901 aagccatgct ggtatgcagt gatgctgcca ccaacaagaa cttcaacagg 951 ctgcaagacg tcttcctgct ccctgacccc agcggccagt ggagggacac 1001 cagggtctat ggtgttttct ccaacccctg gaactactca gccgtctgtg 1051 tgtattccct cggtgacatt gacaaggtct tccgtacctc ctcactcaag 1101 ggctaccact caagccttcc caacccgcgg cctggcaagt gcctcccaga 1151 ccagcagccg atacccacag agaccttcca ggtggctgac cgtcacccag 1201 aggtggcgca gagggtggag cccatggggc ctctgaagac gccattgttc 1251 cactctaaat accactacca gaaagtggcc gttcaccgca tgcaagccag 1301 ccacggggag acctttcatg tgctttacct aactacagac aggggcacta 1351 tccacaaggt ggtggaaccg ggggagcagg agcacagctt cgccttcaac 1401 atcatggaga tccagccctt ccgccgcgcg gctgccatcc agaccatgtc 1451 gctggatgct gagcggagga agctgtatgt gagctcccag tgggaggtga 1501 gccaggtgcc cctggacctg tgtgaggtct atggcggggg ctgccacggt 1551 tgcctcatgt cccgagaccc ctactgcggc tgggaccagg gccgctgcat 1601 ctccatctac agctccgaac ggtcagtgct gcaatccatt aatccagccg 1651 agccacacaa ggagtgtccc aaccccaaac cagacaaggc cccactgcag t701 aaggtttccc tggccccaaa ctctcgctac tacctgagct gccccatgga 1751 atcccgccac gccacctact catggcgcca caaggagaac gtggagcaga 1801 gctgcgaacc tggtcaccag agccccaact gcatcctgtt catcgagaac 1851 ctcacggcgc agcagtacgg ccactacttc tgcgaggccc aggagggctc 1901 ctacttccgc gaggctcagc actggcagct gctgcccgag gacggcatca 1951 tggccgagca cctgctgggt catgcctgtg ccctggctgc ctgaattc GA 2001 AGCTTGGAGT CGACTCTGCT GAAGAGGAGG AAATTCTCCT TGAAGTTTCC 2051 CTGGTGTTCA AAGTAAAGGA GTTTGCACCA GACGCACCTC TGTTCACTGG 2101 TCCGGCGTAT TAAAACACGA TACATTGTTA TTAGTACATT TATTAAGCGC 2151 TAGATTCTGT GCGTTGTTGA TTTACAGACA ATTGTTGTAC GTATTTTAAT 2201 AATTCATTAA ATTTATAATC TTTAGGGTGG TATGTTAGAG CGAAAATCAA 2251 ATGATTTTCA GCGTCTTTAT ATCTGAATTT AAATATTAAA TCCTCAATAG 2301 ATTTGTAAAA TAGGTTTCGA TTAGTTTCAA ACAAGGGTTG TTTTTCCGAA 2351 CCGATGGCTG GACTATCTAA TGGATTTTCG CTCAACGCCA CAAAACTTGC 2401 CAAATCTTGT AGCAGCAATC TAGCTTTGTC GATATTCGTT TGTGTTTTGT 2451 TTTGTAATAA AGGTTCGACG TCGTTCAAAA TATTATGCGC TTTTGTATTT 2501 CTTTCATCAC TGTCGTTAGT GTACAATTGA CTCGACGTAA ACACGTTAAA 2551 TAAAGCCTGG ACATATTTAA CATCGGGCGT GTTAGCTTTA TTAGGCCGAT 2601 TATCGTCGTC GTCCCAACCC TCGTCGTTAG AAGTTGCTTC CGAAGACGAT 2651 TTTGCCATAG CCACACGACG CCTATTAATT GTGTCGGCTA ACACGTCCGC 2701 GATCAAATTT GTAGTTGAGC TTTTTGGAAT TATTTCTGAT TGCGGGCGTT 2751 TTTGGGCGGG TTTCAATCTA ACTGTGCCCG ATTTTAATTC AGACAACACG 2801 TTAGAAAGCG ATGGTGCAGG CGGTGGTAAC ATTTCAGACG GCAAATCTAC 2851 TAATGGCGGC GGTGGTGGAG CTGATGATAA ATCTACCATC GTGGAGGCG 2901 CAGGCGGGGC TGGCGGCGGA GGCGGAGGCG GAGGTGGTGG GGTGATGCA 2951 GACGGCGGTT TAGGCTCAAA TTGTCTCTTT CAGGCAACAC AGTCGGCACC 3001 TCAACTATTG TACTGGTTTC GGGCGTATGG TGCACTCTCA GTACAATCTG 3051 CTCTGATGCC GCATAGTTAA GCCAGCCCCG ACACCCGCCA ACACCCGCTG 3101 ACGCGCCCTG ACGGGCTTGT CTGCTCCCGG CATCCGCTTA CAGACAAGCT 3151 GTGACCGTCT CCGGGAGCTG CATGTGTCAG AGGTTTTCAC CGTCATCACC 3201 GAAACGCGCG AGACGAAAGG GCCTCGTGAT ACGCCTATTT TTATAGGTTA 3251 ATGTCATGAT AATAATGGTT TCTTAGACGT CAGGTGGCAC TTTTCGGGGA 3301 AATGTGCGCG GAACCCCTAT TTGTTTATTT TTCTAAATAC ATTCAAATAT 3351 GTATCCGCTC ATGAGACAAT AACCCTGATA AATGCTTCAA TAATATTGAA 3401 AAAGGAAGAG TATGAGTATT CAACATTTCC GTGTCGCCCT TATTCCCTTT 3451 TTTGCGGCAT TTTGCCTTCC TGTTTTTGCT CACCCAGAAA CGCTGGTGAA 3501 AGTAAAAGAT GCTGAAGATC AGTTGGGTGC ACGAGTGGGT TACATCGAAC 3551 TGGATCTCAA CAGCGGTAAG ATCCTTGAGA GTTTTCGCCC CGAAGAACGT 3601 TTTCCAATGA TGAGCACTTT TAAAGTTCTG CTATGTGGCG CGGTATTATC 3651 CCGTATTGAC GCCGGGCAAG AGCAACTCGG TCGCCGCATA CACTATTCTC 3701 AGAATGACTT GGTTGAGTAC TCACCAGTCA CAGAAAAGCA TCTTACGGAT 3751 GGCATGACAG TAAGAGAATT ATGCAGTGCT GCCATAACCA TGAGTGATAA 3801 CACTGCGGCC AACTTACTTC TGACAACGAT CGGAGGACCG AAGGAGCTAA 3851 CCGCTTTTTT GCACAACATG GGGGATCATG TAACTCGCCT TGATCGTTGG 3901 GAACCGGAGC TGAATGAAGC CATACCAAAC GACGAGCGTG ACACCACGAT 3951 GCCTGTAGCA ATGGCAACAA CGTTGCGCAA ACTATTAACT GGCGAACTAC 4001 TTACTCTAGC TTCCCGGCAA CAATTAATAG ACTGGATGGA GGCGGATAAA 4051 GTTGCAGGAC CACTTCTGCG CTCGGCCCTT CCGGCTGGCT GGTTTATTGC 4101 TGATAAATCT GGAGCCGGTG AGCGTGGGTC TCGCGGTATC ATTGCAGCAC 4151 TGGGGCCAGA TGGTAAGCCC TCCCGTATCG TAGTTATCTA CACGACGGGG 4201 AGTCAGGCAA CTATGGATGA ACGAAATAGA CAGATCGCTG AGATAGGTGC 4251 CTCACTGATT AAGCATTGGT AACTGTCAGA CCAAGTTTAC TCATATATAC 4301 TTTAGATTGA TTTAAAACTT CATTTTTAAT TTAAAAGGAT CTAGGTGAAG 4351 ATCCTTTTTG ATAATCTCAT GACCAAAATC CCTTAACGTG AGTTTTCGTT 4401 CCACTGAGCG TCAGACCCCG TAGAAAAGAT CAAAGGATCT TCTTGAGATC 4451 CTTTTTTTCT GCGCGTAATC TGCTGCTTGC AAACAAAAAA ACCACCGCTA 4501 CCAGCGGTGG TTTGTTTGCC GGATCAAGAG CTACCAACTC TTTTTCCGAA 4551 GGTAACTGGC TTCAGCAGAG CGCAGATACC AAATACTGTT CTTCTAGTGT 4601 AGCCGTAGTT AGGCCACCAC TTCAAGAACT CTGTAGCACC GCCTACATAC 4651 CTCGCTCTGC TAATCCTGTT ACCAGTGGCT GCTGCCAGTG GCGATAAGTC 4701 GTGTCTTACC GGGTTGGACT CAAGACGATA GTTACCGGAT AAGGCGCAGC 4751 GGTCGGGCTG AACGGGGGGT TCGTGCACAC AGCCCAGCTT GGAGCGAACG 4801 ACCTACACCG AACTGAGATA CCTACAGCGT GAGCTATGAG AAAGCGCCAC 4851 GCTTCCCGAA GGGAGAAAGG CGGACAGGTA TCCGGTAAGC GGCAGGGTCG 4901 GAACAGGAGA GCGCACGAGG GAGCTTCCAG GGGGAAACGC CTGGTATCTT 4951 TATAGTCCTG TCGGGTTTCG CCACCTCTGA CTTGAGCGTC GATTTTTGTG 5001 ATGCTCGTCA GGGGGGCGGA GCCTATGGAA AAACGCCAGC AACGCGGCCT 5051 TTTTACGGTT CCTGGCCTTT TGCTGGCCTT TTGCTCACAT GTTCTTTCCT 5101 GCGTTATCCC CTGATTCTGT GGATAACCGT ATTACCGCCT TTGAGTGAGC 5151 TGATACCGCT CGCCGCAGCC GAACGACCGA GCGCAGCGAG TCAGTGAGCG 5201 AGGAAGCATC CTGCACCATC GTCTGCTCAT CCATGACCTG ACCATGCAGA 5251 GGATGATGCT CGTGACGGTT AACGCCTCGA ATCAGCAACG GCTTGCCGTT 5301 CAGCAGCAGC AGACCATTTT CAATCCGCAC CTCGCGGAAA CCGACATCGC 5351 AGGCTTCTGC TTCAATCAGC GTGCCGTCGG CGGTGTGCAG TTCAACCACC 5401 GCACGATAGA GATTCGGGAT TTCGGCGCTC CACAGTTTCG GGTTTTCGAC 5451 GTTCAGACGT AGTGTGACGC GATCGGTATA ACCACCACGC TCATCGATAA 5501 TTTCACCGCC GAAAGGCGCG GTGCCGCTGG CGACCTGCGT TTCACCCTGC 5551 CATAAAGAAA CTGTTACCCG TAGGTAGTCA CGCAACTCGC CGCACATCTG 5601 AACTTCAGCC TCCAGTACAG CGCGGCTGAA ATCATCATTA AAGCGAGTGG 5651 CAACATGGAA ATCGCTGATT TGTGTAGTCG GTTTATGCAG CAACGAGACG 5701 TCACGGAAAA TGCCGCTCAT CCGCCACATA TCCTGATCTT CCAGATAACT 5751 GCCGTCACTC CAACGCAGCA CCATCACCGC GAGGCGGTTT TCTCCGGCGC 5801 GTAAAAATGC GCTCAGGTCA AATTCAGACG GCAAACGACT GTCCTGGCCG 5851 TAACCGACCC AGCGCCCGTT GCACCACAGA TGAAACGCCG AGTTAACGCC 5901 ATCAAAAATA ATTCGCGTCT GGCCTTCCTG TAGCCAGCTT TCATCAACAT 5951 TAAATGTGAG CGAGTAACAA CCCGTCGGAT TCTCCGTGGG AACAAACGGC 6001 GGATTGACCG TAATGGGATA GGTCACGTTG GTGTAGATGG GCGCATCGTA 6051 ACCGTGCATC TGCCAGTTTG AGGGGACGAC GACAGTATCG GCCTCAGGAA 6101 GATCGCACTC CAGCCAGCTT TCCGGCACCG CTTCTGGTGC CGGAAACCAG 6151 GCAAAGCGCC ATTCGCCATT CAGGCTGCGC AACTGTTGGG AAGGGCGATC 6201 GGTGCGGGCC TCTTCGCTAT TACGCCAGCT GGCGAAAGGG GGATGTGCTG 6251 CAAGGCGATT AAGTTGGGTA ACGCCAGGGT TTTCCCAGTC ACGACGTTGT 6301 AAAACGACGG GATCTATCAT TTTTAGCAGT GATTCTAATT GCAGCTGCTC 6351 TTTGATACAA CTAATTTTAC GACGACGATG CGAGCTTTTA TTCAACCGAG 6401 CGTGCATGTT TGCAATCGTG CAAGCGTTAT CAATTTTTCA TTATCGTATT 6451 GTTGCACATC AACAGGCTGG ACACCACGTT GAACTCGCCG CAGTTTTGCG 6501 GCAAGTTGGA CCCGCCGCGC ATCCAATGCA AACTTTCCGA CATTCTGTTG 6551 CCTACGAACG ATTGATTCTT TGTCCATTGA TCGAAGCGAG TGCCTTCGAC 6601 TTTTTCGTGT CCAGTGTGGC TT 序列表 (1)一般信息： (ⅰ)申请人： (A)名称：Hoechst Marion Roussel Deutschland GmbH (B)街道： (C)城市：Frankfurt (D)州： (E)国家：德国 (F)邮区代码(ZIP)：69926 (G)电话：069-305-7072 (H)传真：069-35-7175 (I)电传： (ⅱ)发明名称：人类信息素L和其它物种中相应的信息素 (ⅲ)序列数：44 (ⅳ)计算机可读形式： (A)介质类型：软盘 (B)计算机：IBMPC兼容机 (C)操作系统：PC-DOS/MS-DOS (D)软件：PatentIn Release#1.0，版本#1.25(EPO) (2)SEQ ID NO:1的信息： (ⅰ)序列特征： (A)长度：2636个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..2636 (ⅹⅰ)序列描述：SEQ ID NO:1: CGGGGCCACG GGATGACGCC TCCTCCGCCC GGACGTGCCG CCCCCAGCGC ACCGCGCGCC 60 CGCGTCCCTG GCCCGCCGGC TCGGTTGGGG CTTCCGCTGC GGCTGCCGCT GCTGCTGCTG 120 CTCTGGGCGG CCGCCGCCTC CGCCCAGGGC CACCTAAGGA GCGGACCCCG CATCTTCGCC 180 GTCTGGAAAG GCCATGTAGG GCAGGACCGG GTGGACTTTG GCCAGACTGA GCCGCACACG 240 GTGCTTTTCC ACGAGCCAGG CAGCTCCTCT GTGTGGGTGG GAGGACGTGG CAAGGTCTAC 300 CTCTTTGACT TCCCCGAGGG CAAGAACGCA TCTGTGCGCA CGGTGAATAT CGGCTCCACA 360 AAGGGGTCCT GTCTGGATAA GCGGGACTGC GAGAACTACA TCACTCTCCT GGAGAGGCGG 420 AGTGAGGGGC TGCTGGCCTG TGGCACCAAC GCCCGGCACC CCAGCTGCTG GAACCTGGTG 480 AATGGCACTG TGGTGCCACT TGGCGAGATG AGAGGCTACG CCCCCTTCAG CCCGGACGAG 540 AACTCCCTGG TTCTGTTTGA AGGGGACGAG GTGTATTCCA CCATCCGGAA GCAGGAATAC 600 AATGGGAAGA TCCCTCGGTT CCGCCGCATC CGGGGCGAGA GTGAGCTGTA CACCAGTGAT 660 ACTGTCATGC AGAACCCACA GTTCATCAAA GCCACCATCG TGCACCAAGA CCAGGCTTAC 720 GATGACAAGA TCTACTACTT CTTCCGAGAG GACAATCCTG ACAAGAATCC TGAGGCTCCT 780 CTCAATGTGT CCCGTGTGGC CCAGTTGTGC AGGGGGGACC AGGGTGGGGA AAGTTCACTG 840 TCAGTCTCCA AGTGGAACAC TTTTCTGAAA GCCATGCTGG TATGCAGTGA TGCTGCCACC 900 AACAAGAACT TCAACAGGCT GCAAGACGTC TTCCTGCTCC CTGACCCCAG CGGCCAGTGG 960 AGGGACACCA GGGTCTATGG TGTTTTCTCC AACCCCTGGA ACTACTCAGC CGTCTGTGTG 1020 TATTCCCTCG GTGACATTGA CAAGGTCTTC CGTACCTCCT CACTCAAGGG CTACCACTCA 1080 AGCCTTCCCA ACCCGCGGCC TGGCAAGTGC CTCCCAGACC AGCAGCCGAT ACCCACAGAG 1140 ACCTTCCAGG TGGCTGACCG TCACCCAGAG GTGGCGCAGA GGGTGGAGCC CATGGGGCCT 1200 CTGAAGACGC CATTGTTCCA CTCTAAATAC CACTACCAGA AAGTGGCCGT TCACCGCATG 1260 CAAGCCAGCC ACGGGGAGAC CTTTCATGTG CTTTACCTAA CTACAGACAG GGGCACTATC 1320 CACAAGGTGG TGGAACCGGG GGAGCAGGAG CACAGCTTCG CCTTCAACAT CATGGAGATC 1380 CAGCCCTTCC GCCGCGCGGC TGCCATCCAG ACCATGTCGC TGGATGCTGA GCGGAGGAAG 1440 CTGTATGTGA GCTCCCAGTG GGAGGTGAGC CAGGTGCCCC TGGACCTGTG TGAGGTCTAT 1500 GGCGGGGGCT GCCACGGTTG CCTCATGTCC CGAGACCCCT ACTGCGGCTG GGACCAGGGC 1560 CGCTGCATCT CCATCTACAG CTCCGAACGG TCAGTGCTGC AATCCATTAA TCCAGCCGAG 1620 CCACACAAGG AGTGTCCCAA CCCCAAACCA GACAAGGCCC CACTGCAGAA GGTTTCCCTG 1680 GCCCCAAACT CTCGCTACTA CCTGAGCTGC CCCATGGAAT CCCGCCACGC CACCTACTCA 1740 TGGCGCCACA AGGAGAACGT GGAGCAGAGC TGCGAACCTG GTCACCAGAG CCCCAACTGC 1800 ATCCTGTTCA TCGAGAACCT CACGGCGCAG CAGTACGGCC ACTACTTCTG CGAGGCCCAG 1860 GAGGGCTCCT ACTTCCGCGA GGCTCAGCAC TGGCAGCTGC TGCCCGAGGA CGGCATCATG 1920 GCCGAGCACC TGCTGGGTCA TGCCTGTGCC CTGGCTGCCT CCCTCTGGCT GGGGGTGCTG 1980 CCCACACTCA CTCTTGGCTT GCTGGTCCAC TAGGGCCTCC CGAGGCTGGG CATGCCTCAG 2040 GCTTCTGCAG CCCAGGGCAC TAGAACGTCT CACACTCAGA GCCGGCTGGC CCGGGAGCTC 2100 CTTGCCTGCC ACTTCTTCCA GGGGACAGAA TAACCCAGTG GAGGATGCCA GGCCTGGAGA 2160 CGTCCAGCCG CAGGCGGCTG CTGGGCCCCA GGTGGCGCAC GGATGGTGAG GGGCTGAGAA 2220 TGAGGGCACC GACTGTGAAG CTGGGGCATC GATGACCCAA GACTTTATCT TCTGGAAAAT 2280 ATTTTTCAGA CTCCTCAAAC TTGACTAAAT GCAGCGATGC TCCCAGCCCA AGAGCCCATG 2340 GGTCGGGGAG TGGGTTTGGA TAGGAGAGCT GGGACTCCAT CTCGACCCTG GGGCTGAGGC 2400 CTGAGTCCTT CTGGACTCTT GGTACCCACA TTGCCTCCTT CCCCTCCCTC TCTCATGGCT 2460 GGGTGGCTGG TGTTCCTGAA GACCCAGGGC TACCCTCTGT CCAGCCCTGT CCTCTGCAGC 2520 TCCCTCTCTG GTCCTGGGTC CCACAGGACA GCCGCCTTGC ATGTTTATTG AAGGATGTTT 2580 GCTTTCCGGA CGGAAGGACG GAAAAAGCTC TGAAAAAAAA AAAAAAAAAA AAAAAA 2636 (2)SEQ ID NO:2的信息： (ⅰ)序列特征： (A)长度：1195个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..1195 (ⅹⅰ)序列描述：SEQ ID NO:2: CGGGGCTGCG GGATGACGCC TCCTCCTCCC GGACGTGCCG CCCCCAGCGC ACCGCGCGCC 60 CGCGTCCTCA GCCTGCCGGC TCGGTTCGGG CTCCCGCTGC GGCTGCGGCT TCTGCTGGTG 120 TTCTGGGTGG CCGCCGCCTC CGCCCAAGGC CACTCGAGGA GCGGACCCCG CATCTCCGCC 180 GTCTGGAAAG GGCAGGACCA TGTGGACTTT AGCCAGCCTG AGCCACACAC CGTGCTTTTC 240 CATGAGCCGG GCAGCTTCTC TGTCTGGGTG GGTGGACGTG GCAAGGTCTA CCACTTCAAC 300 TTCCCCGAGG GCAAGAATGC CTCTGTGCGC ACGGTGAACA TCGGCTCCAC AAAGGGGTCC 360 TGTCAGGACA AACAGGACTG TGGGAATTAC ATCACTCTTC TAGAAAGGCG GGGTAATGGG 420 CTGCTGGTCT GTGGCACCAA TGCCCGGAAG CCCAGCTGCT GGAACTTGGT GAATGACAGT 480 GTGGTGATGT CACTTGGTGA GATGAAAGGC TATGCCCCCT TCAGCCCGGA TGAGAACTCC 540 CTGGTTCTGT TTGAAGGAGA TGAAGTGTAC TCTACCATCC GGAAGCAGGA ATACAACGGG 600 AAGATCCCTC GGTTTCGACG CATTCGGGGC GAGAGTGAAC TGTACACAAG TGATACAGTC 660 ATGCAGAACC CACAGTTCAT CAAGGCCACC ATTGTGCACC AAGACCAAGC CTATGATGAT 720 AAGATCTACT ACTTCTTCCG AGAAGACAAC CCTGACAAGA ACCCCGAGGC TCCTCTCAAT 780 GTGTCCCGAG TAGCCCAGTT GTGCAGGGGG GACCAGGGTG GTGAGAGTTC GTTGTCTGTC 840 TCCAAGTGGA ACACCTTCCT GAAAGCCATG TTGGTCTGCA GCGATGCAGC CACCAACAGG 900 AACTTCAATC GGCTGCAAGA TGTCTTCCTG CTCCCTGACC CCAGTGGCCA GTGGAGAGAT 960 ACCAGGGTCT ATGGCGTTTT CTCCAACCCC TGGAACTACT CAGCTGTCTG CGTGTATTCG 1020 CTTGGTGACA TTGACAGAGT CTTCCGTACC TCATCGCTCA AAGGCTACCA CATGGGCCTT 1080 TCCAACCCTC GACCTGGCAT GTGCCTCCCA AAAAAGCAGC CCATACCCAC AGAAACCTTC 1140 CAGGTAGCTG ATAGTCACCC AGAGGTGGCT CAGAGGGTGG AACCTATGGG GCCCC 1195 (2)SEQ ID NO:3的信息： (ⅰ)序列特征： (A)长度：666个氨基酸 (B)类型：氨基酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：蛋白质 (ⅸ)特征： (A)名称/关键词：蛋白质 (B)位置：1..666 (ⅸ)特征： (A)名称/关键词：蛋白质 (B)位置：1..666 (ⅹⅰ)序列描述：SEQ ID NO:3: Met Thr Pro Pro Pro Pro Gly Arg Ala Ala Pro Ser Ala Pro Arg Ala 1 5 10 15 Arg Val Pro Gly Pro Pro Ala Arg Leu Gly Leu Pro Leu Arg Leu Arg 20 25 30 Leu Leu Leu Leu Leu Trp Ala Ala Ala Ala Ser Ala Gln Gly His Leu 35 40 45 Arg Ser Gly Pro Arg Ile Phe Ala Val Trp Lys Gly His Val Gly Gln 50 55 60 Asp Arg Val Asp Phe Gly Gln Thr Glu Pro His Thr Val Leu Phe His 65 70 75 80 Glu Pro Gly Ser Ser Ser Val Trp Val Gly Gly Arg Gly Lys Val Tyr 85 90 95 Leu Phe Asp Phe Pro Glu Gly Lys Asn Ala Ser Val Arg Thr Val Asn 100 105 110 Ile Gly Ser Thr Lys Gly Ser Cys Leu Asp Lys Arg Asp Cys Glu Asn 115 120 125 Tyr Ile Thr Leu Leu Glu Arg Arg Ser Glu Gly Leu Leu Ala Cys Gly 130 135 140 Thr Asn Ala Arg His Pro Ser Cys Trp Asn Leu Val Asn Gly Thr Val 145 150 155 160 Val Pro Leu Gly Glu Met Arg Gly Tyr Ala Pro Phe Ser Pro Asp Glu 165 170 175 Asn Ser Leu Val Leu Phe Glu Gly Asp Glu Val Tyr Ser Thr Ile Arg 180 185 190 Lys Gln Glu Tyr Asn Gly Lys Ile Pro Arg Phe Arg Arg Ile Arg Gly 195 200 205 Glu Ser Glu Leu Tyr Thr Ser Asp Thr Val Met Gln Asn Pro Gln Phe 210 215 220 Ile Lys Ala Thr Ile Val His Gln Asp Gln Ala Tyr Asp Asp Lys Ile 225 230 235 240 Tyr Tyr Phe Phe Arg Glu Asp Asn Pro Asp Lys Asn Pro Glu Ala Pro 245 250 255 Leu Asn Val Ser Arg Val Ala Gln Leu Cys Arg Gly Asp Gln Gly Gly 260 265 270 Glu Ser Ser Leu Ser Val Ser Lys Trp Asn Thr Phe Leu Lys Ala Met 275 280 285 Leu Val Cys Ser Asp Ala Ala Thr Asn Lys Asn Phe Asn Arg Leu Gln 290 295 300 Asp Val Phe Leu Leu Pro Asp Pro Ser Gly Gln Trp Arg Asp Thr Arg 305 310 315 320 Val Tyr Gly Val Phe Ser Asn Pro Trp Asn Tyr Ser Ala Val Cys Val 325 330 335 Tyr Ser Leu Gly Asp Ile Asp Lys Val Phe Arg Thr Ser Ser Leu Lys 340 345 350 Gly Tyr His Ser Ser Leu Pro Asn Pro Arg Pro Gly Lys Cys Leu Pro 355 360 365 Asp Gln Gln Pro Ile Pro Thr Glu Thr Phe Gln Val Ala Asp Arg His 370 375 380 Pro Glu Val Ala Gln Arg Val Glu Pro Mer Gly Pro Leu Lys Thr Pro 385 390 395 400 Leu Phe His Ser Lys Tyr His Tyr Gln Lys Val Ala Val His Arg Met 405 410 415 Gln Ala Ser His Gly Glu Thr Phe His Va1 Leu Tyr Leu Thr Thr Asp 420 425 430 Arg Gly Thr Ile His Lys Val Val Glu Pro Gly Glu Gln Glu His Ser 435 440 445 Phe Ala Phe Asn Ile Met Glu Ile Gln Pro Phe Arg Arg Ala Ala Ala 450 455 460 Ile Gln Thr Met Ser Leu Asp Ala Glu Arg Arg Lys Leu Tyr Val Ser 465 470 475 480 Ser Gln Trp Glu Val Ser Gln Val Pro Leu Asp Leu Cys Glu Val Tyr 485 490 495 Gly Gly Gly Cys His Gly Cys Leu Met Ser Arg Asp Pro Tyr Cys Gly 500 505 510 Trp Asp Gln G1y Arg Cys Ile Ser Ile Tyr Ser Ser Glu Arg Ser Val 515 520 525 Leu Gln Ser Ile Asn Pro Ala Glu Pro His Lys Glu Cys Pro Asn Pro 530 535 540 Lys Pro Asp Lys Ala Pro Leu Gln Lys Val Ser Leu Ala Pro Asn Ser 545 550 555 560 Arg Tyr Tyr Leu Ser Cys Pro Met Glu Ser Arg His Ala Thr Tyr Ser 565 570 575 Trp Arg His Lys Glu Asn Val Glu Gln Ser Cys Glu Pro Gly His Gln 580 585 590 Ser Pro Asn Cys Ile Leu Phe Ile Glu Asn Leu Thr Ala Gln Gln Tyr 595 600 605 Gly His Tyr Phe Cys Glu Ala Gln Glu Gly Ser Tyr Phe Arg Glu Ala 610 615 620 Gln His Trp Gln Leu Leu Pro Glu Asp Gly Ile Met Ala Glu His Leu 625 630 635 640 Leu Gly His Ala Cys Ala Leu Ala Ala Ser Leu Trp Leu Gly Val Leu 645 650 655 Pro Thr Leu Thr Leu Gly Leu Leu Val His 660 665 (2)SEQ ID NO:4的信息： (ⅰ)序列特征： (A)长度：394个氨基酸 (B)类型：氨基酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：蛋白质 (ⅸ)特征： (A)名称/关键词：蛋白质 (B)位置：1..394 (ⅹⅰ)序列描述：SEQ ID NO:4: Met Thr Pro Pro Pro Pro Gly Arg Ala Ala Pro Ser Ala Pro Arg Ala 1 5 10 15 Arg Val Leu Ser Leu Pro Ala Arg Phe Gly Leu Pro Leu Arg Leu Arg 20 25 30 Leu Leu Leu Val Phe Trp Val Ala Ala Ala Ser Ala Gln Gly His Ser 35 40 45 Arg Ser Gly Pro Arg Ile Ser Ala Va1 Trp Lys Gly Gln Asp His Val 50 55 60 Asp Phe Ser Gln Pro Glu Pro His Thr Val Leu Phe His Glu Pro Gly 65 70 75 80 Ser Phe Ser Val Trp Val Gly Gly Arg Gly Lys Val Tyr Hia Phe Asn 85 90 95 Phe Pro Glu Gly Lys Asn Ala Ser Val Arg Thr Val Asn Ile Gly Ser 100 105 110 Thr Lys Gly Ser Cys Gln Asp Lys Gln Asp Cys Gly Asn Tyr Ile Thr 115 120 125 Leu Leu Glu Arg Arg Gly Asn Gly Leu Leu Val Cys Gly Thr Asn Ala 130 135 140 Arg Lys Pro Ser Cys Trp Asn Leu Val Asn Asp Ser Val Val Met Ser 145 150 155 160 Leu Gly Glu Met Lys Gly Tyr Ala Pro Phe Ser Pro Asp Glu Asn Ser 165 170 175 Leu Val Leu Phe Glu Gly Asp Glu Val Tyr Ser Thr Ile Arg Lys Gln 180 185 190 Glu Tyr Asn Gly Lys Ile Pro Arg Phe Arg Arg Ile Arg Gly Glu Ser 195 200 205 Glu Leu Tyr Thr Ser Asp Thr Val Met Gln Asn Pro Gln Phe Ile Lys 210 215 220 Ala Thr Ile Val His Gln Asp Gln Ala Tyr Asp Asp Lys Ile Tyr Tyr 225 230 235 240 Phe Phe Arg Glu Asp Asn Pro Asp Lys Asn Pro Glu Ala Pro Leu Asn 245 250 255 Val Ser Arg Val Ala Gln Leu Cys Arg Gly Asp Gln Gly Gly Glu Ser 260 265 270 Ser Leu Ser Val Ser Lys Trp Asn Thr Phe Leu Lys Ala Met Leu Val 275 280 285 Cys Ser Asp Ala Ala Thr Asn Arg Asn Phe Asn Arg Leu Gln Asp Val 290 295 300 Phe Leu Leu Pro Asp Pro Ser Gly Gln Trp Arg Asp Thr Arg Val Tyr 305 310 315 320 Gly Val Phe Ser Asn Pro Trp Asn Tyr Ser Ala Val Cys Val Tyr Ser 325 330 335 Leu Gly Asp Ile Asp Arg Val Phe Arg Thr Ser Ser Leu Lys Gly Tyr 340 345 350 His Met Gly Leu Ser Asn Pro Arg Pro Gly Met Cys Leu Pro Lys Lys 355 360 365 Gln Pro Ile Pro Thr Glu Thr Phe Gln Val Ala Asp Ser His Pro Glu 370 375 380 Val Ala Gln Arg Val Glu Pro Met Gly Pro 385 390 (2)SEQ ID NO:5的信息： (ⅰ)序列特征： (A)长度：23个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..23 (ⅹⅰ)序列描述：SEQ ID NO:5: ACTCACTATAGGGCTCGAGCGGC 23 (2)SEQ ID NO:6的信息： (ⅰ)序列特征： (A)长度：20个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..20 (ⅹⅰ)序列描述：SEQ ID NO:6: AGCCGCACACGGTGCTTITC 20 (2)SEQ ID NO:7的信息: (ⅰ)序列特征： (A)长度：20个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..20 (ⅹⅰ)序列描述：SEQ ID NO:7: GCACAGATGCGITCITGCCC 20 (2)SEQ ID NO:8的信息： (ⅰ)序列特征： (A)长度：20个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..20 (ⅹⅰ)序列描述：SEQ ID NO:8: ACCATAGACCCTGGTGTCCC (2)SEQ ID NO:9的信息： (ⅰ)序列特征： (A)长度：20个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..20 (ⅹⅰ)序列描述：SEQ ID NO:9: GCAGTGATGCTGCCACCAAC 20 (2)SEQ ID NO:10的信息： (ⅰ)序列特征： (A)长度：20个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..20 (ⅹⅰ)序列描述：SEQ ID NO:10: CCAGACCATGTCGCTGGATG 20 (2)SEQ ID NO:11的信息： (ⅰ)序列特征： (A)长度：20个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..20 (ⅹⅰ)序列描述：SEQ ID NO:11: ACATGAGGCAACCGTGGGCAG 20 (2)SEQ ID NO:12的信息： (ⅰ)序列特征： (A)长度：27个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..27 (ⅹⅰ)序列描述：SEQ ID NO:12: CCATCCTAATACGACTCACTATAGGGC 27 (2)SEQ ID NO:13的信息： (ⅰ)序列特征： (A)长度：20个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..20 (ⅹⅰ)序列描述：SEQ ID NO:13: AGGTAGACCTTGCCACGTCC 20 (2)SEQ ID NO:14的信息： (ⅰ)序列特征： (A)长度：23个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..23 (ⅹⅰ)序列描述：SEQ ID NO:14: GAACTTCAACAGGCTGCAAG ACG 23 (2)SEQ ID NO:15的信息： (ⅰ)序列特征： (A)长度：20个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..20 (ⅹⅰ)序列描述：SEQ ID NO:15: ATGCTGAGCGGAGGAACGCTG 20 (2)SEQ ID NO:16的信息： (ⅰ)序列特征： (A)长度：20个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..20 (ⅹⅰ)序列描述：SEQ ID NO:16: CCGCCATACACCTCACACAG 20 (2)SEQ ID NO:17的信息： (ⅰ)序列特征： (A)长度：28个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..28 (ⅹⅰ)序列描述：SEQ ID NO:17: CTGGAAGCTTTCTGTGGGTATCGGCTGC 28 (2)SEQ ID NO:18的信息： (ⅰ)序列特征： (A)长度：25个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..25 (ⅹⅰ)序列描述：SEQ ID NO:18: TTTGGATCCCTGGTTCTGTTTGAAG 25 (2)SEQ ID NO:19的信息： (ⅰ)序列特征： (A)长度：50个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..50 (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..50 (ⅹⅰ)序列描述：SEQ ID NO:19: TTCTAGAATT CAGCGGCCGC TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT 50 (2)SEQ ID NO:20的信息： (ⅸ)序列特征： (A)长度：27个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..27 (ⅹⅰ)序列描述：SEQ ID NO:20: GGGGAAAGTTCACTGTCAGTCTCCAAG 27 (2)SEQ ID NO:21的信息： (ⅰ)序列特征： (A)长度：26个碱基对 (8)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..26 (ⅹⅰ)序列描述：SEQ ID NO:21: GGGAATACACACAGACGGCTGAGTAG 26 (2)SEQ ID NO:22的信息： (ⅰ)序列特征： (A)长度：22个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..22 (ⅹⅰ)序列描述：SEQ ID NO:22: AGCAAGTTCAGCCTGGTTAAGT 22 (2)SEQ ID NO:23的信息： (ⅰ)序列特征： (A)长度：21个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..21 (ⅹⅰ)序列描述：SEQ ID NO:23: TTATGAGTATTTCTTCCAGGG 21 (2)SEQ ID NO:24的信息： (ⅰ)序列特征： (A)长度：26个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..26 (ⅹⅰ)序列描述：SEQ ID NO:24: CCAITAATCCAGCCGAGCCACACAAG 26 (2)SEQ ID NO:25的信息： (ⅰ)序列特征： (A)长度：25个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..25 (ⅹⅰ)序列描述：SEQ ID NO:25: CATCTACAGCTCCGAACGGTCAGTG 25 (2)SEQ ID NO:26的信息： (ⅰ)序列特征： (A)长度：20个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..20 (ⅹⅰ)序列描述：SEQ ID NO:26: CAGCGGAAGCCCCAACCGAG 20 (2)SEQ ID NO:27的信息： (ⅰ)序列特征： (A)长度：23个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..23 (ⅹⅰ)序列描述：SEQ ID NO:27: GGGATGACGCCTCCTCCGCCCGG 23 (2)SEQ ID NO:28的信息： (ⅰ)序列特征： (A)长度：31个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..31 (ⅹⅰ)序列描述：SEQ ID NO：28: AAGCTTCACGTGGACCAGCAAGCCAAGAGTG 31 (2)SEQ ID NO:29的信息: (ⅰ)序列特征： (A)长度：25个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..25 (ⅹⅰ)序列描述：SEQ ID NO:29: AAGCTTTTTCCGTCCTTCCGTCCGG 25 (2)SEQ ID NO:30的信息： (ⅰ)序列特征： (A)长度：24个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..24 (ⅹⅰ)序列描述：SEQ ID NO:30: ATGGTGAGCAAGGGCGAGGAGCTG 24 (2)SEQ ID NO:31的信息： (ⅰ)序列特征： (A)长度：24个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..24 (ⅹⅰ)序列描述：SEQ ID NO:31: CITGTACAGCTCGTCCATGCCGAG 24 (2)SEQ ID NO:32的信息： (ⅰ)序列特征： (A)长度：25个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..25 (ⅹⅰ)序列描述：SEQ ID NO:32: GGGTGGTGAGAGTTCGTTGTCTGTC 25 (2)SEQ ID NO::33的信息： (ⅰ)序列特征： . (A)长度：25个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..25 (ⅹⅰ)序列描述：SEQ ID NO:33: GAGCGATGAGGTACGGAAGACTCTG 25 (2)SEQ ID NO:34的信息： (ⅰ)序列特征： (A)长度：5856个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..5856 (ⅹⅰ)序列描述：SEQ ID NO:34: AGCGCCCAAT ACGCAAACCG CCTCTCCCCG CGCGTTGGCC GATTCATTAA TGCAGCTGGC 60 ACGACAGGTT TCCCGACTGG AAAGCGGGCA GTGAGCGCAA CGCAATTAAT GTGAGTTAGC 120 TCACTCATTA GGCACCCCAG GCTTTACACT TTATGCTTCC GGCTCGTATG TTGTGTGGAA 180 TTGTGAGCGG ATAACAATTT CACACAGGAA ACAGCTATGA CCATGATTAC GCCAAGCTTC 240 ACGTGGACCA GCAAGCCAAG AGTGAGTGTG GGCAGCACCC CCAGCCAGAG GGAGGCAGCC 300 AGGGCACAGG CATGACCCAG CAGGTGCTCG GCCATGATGC CGTCCTCGGG CAGCAGCTGC 360 CAGTGCTGAG CCTCGCGGAA GTAGGAGCCC TCCTGGGCCT CGCAGAAGTA GTGGCCGTAC 420 TGCTGCGCCG TGAGGTTCTC GATGAACAGG ATGCAGTTGG GGCTCTGGTG ACCAGGTTCG 480 CAGCTCTGCT CCACGTTCTC CTTGTGGCGC CATGAGTAGG TGGCGTGGCG GGATTCCATG 540 GGGCAGCTCA GGTAGTAGCG AGAGTTTGGG GCCAGGGAAA CCTTCTGCAG TGGGGCCTTG 600 TCTGGTTTGG GGTTGGGACA CTCCTTGTGT GGCTCGGCTG GATTAATGGA TTGCAGCACT 660 GACCGTTCGG AGCTGTAGAT GGAGATGCAG CGGCCCTGGT CCCAGCCGCA GTAGGGGTCT 720 CGGGACATGA GGCAACCGTG GCAGCCCCCG CCATAGACCT CACACAGGTC CAGGGGCACC 780 TGGCTCACCT CCCACTGGGA GCTCACATAC AGCTTCCTCC GCTCAGCATC CAGCGACATG 840 GTCTGGATGG CAGCCGCGCG GCGGAAGGGC TGGATCTCCA TGATGTTGAA GGCGAAGCTG 900 TGCTCCTGCT CCCCCGGTTC CACCACCTTG TGGATAGTGC CCCTGTCTGT AGTTAGGTAA 960 AGCACATGAA AGGTCTCCCC GTGGCTGGCT TGCATGCGGT GAACGGCCAC TTTCTGGTAG 1020 TGGTATTTAG AGTGGAACAA TGGCGTCTTC AGAGGCCCCA TGGGCTCCAC CCTCTGCGCC 1080 ACCTCTGGGT GACGGTCAGC CACCTGGAAG GTCTCTGTGG GTATCGGCTG CTGGTCTGGG 1140 AGGCACTTGC CAGGCCGCGG GTTGGGAAGG CTTGAGTGGT AGCCCTTGAG TGAGGAGGTA 1200 CGGAAGACCT TGTCAATGTC ACCGAGGGAA TACACACAGA CGGCTGAGTA GTTCCAGGGG 1260 TTGGAGAAAA CACCATAGAC CCTGGTGTCC CTCCACTGGC CGCTGGGGTC AGGGAGCAGG 1320 AAGACGTCTT GCAGCCTGTT GAAGTTCTTG TTGGTGGCAG CATCACTGCA TACCAGCATG 1380 CCTTTCAGAA AAGTGTTCCA CTTGGAGACT GACAGTGAAC TTTCCCCACC CTGGTCCCCC 1440 CTGCACAACT GGGCCACACG GGACACATTG AGAGGAGCCT CAGGATTCTT GTCAGGATTG 1500 TCCTCTCGGA AGAAGTAGTA GATCTTGTCA TCGTAAGCCT GGTCTTGGTG CACGATGGTG 1560 GCTTTGATGA ACTGTGGGTT CTGCATGACA GTATCACTGG TGTACAGCTC ACTCTCGCCC 1620 CGGATGCGGC GGAACCGAGG GATGTTCCCA TTGTATTCCT GCTTCCGGAT GGTGGAATAC 1680 ACCTCGTCCC CTTCAAACAG AACCAGGGAG TTCTCGTCCG GGCTGAAGGG GGCGTAGCCT 1740 CTCATCTCGC CAAGTGGCAC CACAGTGCCA TTCACCAGGT TCCAGCAGCT GGGGTGCCGG 1800 GCGTTGGTGC CACAGGCCAG CAGCCCCTCA CTCCGCCTCT CCAGGAGAGT GATGTAGTTC 1860 TCGCAGTCCC GCTTATCCAG ACAGGACCCC TTTGTGGAGC CGATATTCAC CGTGCGCACA 1920 GATGCGTTCT TGCCCTCGGG GAAGTCAAAG AGGTAGACCT TGCCACGTCG TCCCACCCAC 1980 ACAGAGGAGC TGCCTGGCTC GTGGAAAAGC ACCGTGTGCG GCTCAGTCTG GCCAAAGTCC 2040 ACCCGGTCCT GCCCTACATG GCCTTTCCAG ACGGCGAAGA TGCGGGGTCC GCTCCTTAGG 2100 TGGCGCTGGG CGGAGGCGGC GGCCGCCCAG AGCAGCAGCA GCAGCCGCAG CCGCAGCGGA 2160 AGCCCCAACC GAGCCGGCGG GCCAGGGACG CGGGCGCGCG GTGCGCTGGG GGCGGCACGT 2220 CCGGGCGGAG GAGGCGTCAT CCCAAGCCGA ATTCTGCAGA TATCCATCAC ACTGGCGGCC 2280 GCTCGAGCAT GCATCTAGAG GGCCCAATTC GCCCTATAGT GAGTCGTATT ACAATTCACT 2340 GGCCGTCGTT TTACAACGTC GTGACTGGGA AAACCCTGGC GTTACCCAAC TAAATCGCCT 2400 TGCAGCACAT CCCCCTTTCG CCAGCTGGCG TAATAGCGAA GAGGCCCGCA CCGATCGCCC 2460 TTCCCAACAG TTGCGCAGCC TGAATGGCGA ATGGGACGCG CCCTGTAGCG GCGCATTAAG 2520 CGCGGCGGGT GTGGTGGTTA CGCGCAGCGT GACCGCTACA CTTGCGAGCG CCGTAGCGCC 2580 CGCTCCTTTC GCTTTCTTCC CTTCCTTTCT CGCCACGTTC GCCGGCTTTC CCCGTCAAGC 2640 TCTAAATCGG GGGCTCCCTT TAGGGTTCCG ATTTAGAGCT TTACGGCACC TCGACCGCAA 2700 AAAACTTGAT TTGGGTGATG GTTCACGTAG TGGGCCATCG CGCTGATAGA CGGTTTTTCG 2760 CCCTTTGAGG TTGGAGTCCA CGTTCTTTAA TAGTGGACTC TTGTTCCAAA CTGGAACAAC 2820 ACTCAACCCT ATCGCGGTCT ATTCTTTTGA TTTATAAGGG ATTTTGCCGA TTTCGGCCTA 2880 TTGGTTAAAA AATGAGCTGA TTTAACAAAT TCAGGGGGCA AGGGCTGCTA AAGGAACCGG 2940 AACACGTAGA AAGCCAGTCC GCAGAAACGG TGCTGAGCCC GGATGAATGT CAGCTACTGG 3000 GCTATCTGGA CAAGGGAAAA CGCAAGCGCA AAGAGAAAGC AGGTAGCTTG CAGTGGGCTT 3060 ACATGGCGAT AGCTAGACTG GGCGGTTTTA TGGACAGCAA GCGAACCGGA ATTGCCAGCT 3120 GGGGCGCCCT CTGGTAAGGT TGGGAAGCCC TGCAAAGTAA ACTGGATGGC TTTCTTGCCG 3180 CCAAGGATCT GATGGCGCAG GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATCGTTT 3240 CGCATGATTG AACAAGATGG ATTGCACGCA GGTTCTCCGG CCGCTTGGGT GGAGAGGCTA 3300 TTCGGCTATG ACTGGGCACA ACAGACAATC GGCTGCTCTG ATGCCGCCGT GTTCCGGCTG 3360 TCAGCGCAGG GGCGCCCGGT TCTTTTTGTC AAGACCGACC TGTCCGGTGC CCTGAATGAA 3420 CTGCAGGACG AGGCAGCGCG GCTATCGTGG CTGGCCACGA CGGGCGTTCC TTGCGCAGCT 3480 GTGCTCGACG TTGTCACTGA AGCGGGAAGG GACTGGCTGC TATTGGGCGA AGTGCCGGGG 3540 CAGGATCTCC TGTCATCTCG CCTTGCTCCT GCCGAGAAAG TATCCATCAT GGCTGATGCA 3600 ATGCGGCGGC TGCATACGCT TGATCCGGCT ACCTGCCCAT TCGACCACCA AGCGAAACAT 3660 CGCATCGAGC GAGCACGTAC TCGGATGGAA GCCGGTCTTG TCGATCAGGA TGATCTGGAC 3720 GAAGAGCATC AGGGGCTCGC GCCAGCCGAA CTGTTCGCCA GGCTCAAGGC GCGCATGCCC 3780 GACGGCGAGG ATCTCGTCGT GATCCATGGC GATGCCTGCT TGCCGAATAT CATGGTGGAA 3840 AATGGCCGCT TTTCTGGATT CAACGACTGT GGCCGGCTGG GTGTGGCGGA CCGCTATCAG 3900 GACATAGCGT TGGATACCCG TGATATTGCT GAAGAGCTTG GCGGCGAATG GGCTGACCGC 3960 TTCCTCGTGC TTTAcGGTAT CGCCGCTCCC GATTCGCAGC GCATCGCCTT CTATCGCCTT 4020 CTTGACGAGT TCTTCTGAAT TGAAAAAGGA AGAGTATGAG TATTCAACAT TTCCGTGTCG 4080 CCCTTATTCC CTTTTTTGCG GCATTTTGCC TTCCTGTTTT TGCTCACCCA GAAACGCTGG 4140 TGAAAGTAAA AGATGCTGAA GATCAGTTGG GTGCACGAGT GGGTTACATC GAACTGGATC 4200 TCAACAGCGG TAAGATCCTT GAGAGTTTTC GCCCCGAAGA ACGTTTTCCA ATGATGAGCA 4260 CTTTTAAAGT TCTGCTATGT CATACACTAT TATCCCGTAT TGACGCCGGG CAAGAGCAAC 4320 TCGGTCGCCG GGCGCGGTAT TCTCAGAATG ACTTGGTTGA GTACTCACCA GTCACAGAAA 4380 AGCATCTTAC GGATGGCATG ACAGTAAGAG AATTATGCAG TGCTGCCATA ACCATGAGTG 4440 ATAACACTGC GGCCAACTTA CTTCTGACAA CGATCGGAGG ACCGAAGGAG CTAACCGCTT 4500 TTTTGCACAA CATGGGGGAT CATGTAACTC GCCTTGATCG TTGGGAACCG GAGCTGAATG 4560 AAGCCATACC AAACGACGAG AGTGACACCA CGATGCCTGT AGCAATGCCA ACAACGTTGC 4620 GCAAACTATT AACTGGCGAA CTACTTACTC TAGCTTCCCG GCAACAATTA ATAGACTGGA 4680 TGGAGGCGGA TAAAGTTGCA GGACCACTTC TGCGCTCGGC CCTTCCGGCT GGCTGGTTTA 4740 TTGCTGATAA ATCTGGAGCC GGTGAGCGTG GGTCTCGCGG TATCATTGCA GCACTGGGGC 4800 CAGATGGTAA GCCCTCCCGT ATCGTAGTTA TCTACACGAC GGGGAGTCAG GCAACTATGG 4860 ATGAACGAAA TAGACAGATC GCTGAGATAG GTGCCTCACT GATTAAGCAT TGGTAACTGT 4920 CAGACCAAGT TTACTCATAT ATACTTTAGA TTGATTTAAA ACTTCATTTT TAATTTAAAA 4980 GGATCTAGGT GAAGATCCTT TTTGATAATC TCATGACCAA AATCCCTTAA CGTGAGTTTT 5040 CGTTCCACTG AGCGTCAGAC CCCGTAGAAA AGATCAAAGG ATCTTCTTGA GATCCTTTTT 5100 TTCTGCGCGT AATCTGCTGC TTGCAAACAA AAAAACCACC GCTACCAGCG GTGGTTTGTT 5160 TGCCGGATCA AGAGCTACCA ACTCTTTTTC CGAAGGTAAC TGGCTTCAGC AGAGCGCAGA 5220 TACCAAATAC TGTCCTTCTA GTGTAGCCGT AGTTAGGCCA CCACTTCAAG AACTCTGTAG 5280 CACCGCCTAC ATACCTCGCT CTGCTAATCC TGTTACCAGT GGCTGCTGCC AGTGGCGATA 5340 AGTCGTGTCT TACCGGGTTG GACTCAAGAC GATAGTTACC GGATAAGGCG CAGCGGTCGG 5400 GCTGAACGGG GGGTTCGTGC ACACAGCCCA GCTTGGAGCG AACGACCTAC ACCGAACTGA 5460 GATACCTACA GCGTGAGCAT TGAGAAAGCG CCACGCTTCC CGAAGGGAGA AAGGCGGACA 5520 GGTATCCGGT AAGCGGCAGG GTCGGAACAG GAGAGCGCAC GAGGGAGCTT CCAGGGGGAA 5580 ACGCCTGGTA TCTTTATAGT CCTGTCGGGT TTCGCCACCT CTGACTTGAG CGTCGATTTT 5640 TGTGATGCTC GTCACGGGGG CGGAGCCTAT GGAAAAACGC CAGCAACGCG GCCTTTTTAC 5700 GGTTCCTGGC CTTTTGCTGG CCTTTTGCTC ACATGTTCTT TCCTGCGTTA TCCGCTGATT 5760 CTGTGGATAA CCGTATTACC GCCTTTGAGT GAGCTGATAC CGCTCGCCGC AGCCGAACGA 5820 CCGAGCGCAG CGAGTCAGTG AGCGAGGAAG CGGAAG 5856 (2)SEQ ID NO:35的信息： (ⅰ)序列特征： (A)长度：7475个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..7475 (ⅹⅰ)序列描述：SEQ ID NO:35: GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC TGCTCTGATG 60 CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT GGAGGTCGCT GAGTAGTGCG 120 CGAGCAAAAT TTAAGCTACA ACAAGGCAAG GCTTGACCGA CAATTGCATG AAGAATCTGC 180 TTAGGGTTAG GCGTTTTGCG CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT 240 GATTATTGAC TAGTTATTAA TAGTAATCAA TTACGGGGTC ATTAGTTCAT AGCCCATATA 300 TGGAGTTCCG CGTTACATAA CTTACGGTAA ATGGCCCGCC TGGCTGACCG CCCAACGACC 360 CCCGCCCATT GACGTCAATA ATGACGTATG TTCCCATAGT AACGCCAATA GGGACTTTCC 420 ATTGACGTCA ATGGGTGGAC TATTTACGGT AAACTGCCCA CTTGGCAGTA CATCAAGTGT 480 ATCATATGCC AAGTACGCCC CCTATTGACG TCAATGACGG TAAATGGCCC GCCTGGCATT 540 ATGCCCAGTA CATGACCTTA TGGGACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA 600 TCGCTATTAC CATGGTGATG CGGTTTTGGC AGTACATCAA TGGGCGTGGA TAGCGGTTTG 660 ACTCACGGGG ATTTCCAAGT CTCCACCCCA TTGACGTCAA TGGGAGTTTG TTTTGGCACC 720 AAAATCAACG GGACTTTCCA AAATGTCGTA ACAACTCCGC CCCATTGACG CAAATGGGCG 780 GTAGGCGTGT ACGGTGGGAG GTCTATATAA GCAGAGCTCT CTGGCTAACT AGAGAACCCA 840 CTGCTTACTG GCTTATCGAA ATTAATACGA CTCACTATAG GGAGACCCAA GCTGGCTAGC 900 GTTTAAACGG GCCCTCTAGA CTCGAGCGGC CGCCACTGTG CTGGATATCT GCAGAATTCG 960 GCTTGGGATG ACGCCTCCTC CGCCCGGACG TGCCGCCCCC AGCGCACCGC GCGCCCGCGT 1020 CCCTGGCCCG CCGGCTCGGT TGGGGCTTCC GCTGCGGCTG CGGCTGCTGC TGCTGCTCTG 1080 GGCGGCCGCC GCCTCCGCCC AGGGCCACCT AAGGAGCGGA CCCCGCATCT TCGCCGTCTG 1140 GAAAGGCCAT GTAGGGCAGG ACCGGGTGGA CTTTGGCCAG ACTGAGCCGC ACACGGTGCT 1200 TTTCCACGAG CCAGGCAGCT CCTCTGTGTG GGTGGGAGGA CGTGGCAAGG TCTACCTCTT 1260 TGACTTCCCC GAGGGCAAGA ACGCATCTGT GCGCACGGTG AATATCGGCT CCACAAAGGG 1320 GTCCTGTCTG GATAAGCGGG ACTGCGAGAA CTACATCACT CTCCTGGAGA GGCGGAGTGA 1380 GGGGCTGCTG GCCTGTGGCA CCAACGCCCG GCACCCCAGC TGCTGGAACC TGGTGAATGG 1440 CACTGTGGTG CCACTTGGCG AGATGAGAGG CTACGCCCCC TTCAGCCCGG ACGAGAACTC 1500 CCTGGTTCTG TTTGAAGGGG ACGAGGTGTA TTCCACCATC CGGAAGCAGG AATACAATGG 1560 GAAGATCCCT CGGTTCCGCC GCATCCGGGG CGAGAGTGAG CTGTACACCA GTGATACTGT 1620 CATGCAGAAC CCACAGTTCA TCAAAGCCAC CATCGTGCAC CAAGACCAGG CTTACGATGA 1680 CAAGATCTAC TACTTCTTCC GAGAGGACAA TCCTGACAAG AATCCTGAGG CTCCTCTCAA 1740 TGTGTCCCGT GTGGCCCAGT TGTGCAGGGG GGACCAGGGT GGGGAAAGTT CACTGTCAGT 1800 CTCCAAGTGG AACACTTTTC TGAAAGCCAT GCTGGTATGC AGTGATGCTG CCACCAACAA 1860 GAACTTCAAC AGGCTGCAAG ACGTCTTCCT GCTCCCTGAC CCCAGCGGCC AGTGGAGGGA 1920 CACCAGGGTC TATGGTGTTT TCTCCAACCC CTGGAACTAC TCAGCCGTCT GTGTGTATTC 1980 CCTCGGTGAC ATTGACAAGG TCTTCCGTAC CTCCTCACTC AAGGGCTACC ACTCAAGCCT 2040 TCCCAACCCG CGGCCTGGCA AGTGCCTCCC AGACCAGCAG CCGATACCCA CAGAGACCTT 2100 CCAGGTGGCT GACCGTCACC CAGAGGTGGC GCAGAGGGTG GAGCCCATGG GGCCTCTGAA 2160 GACGCCATTG TTCCACTCTA AATACCACTA CCAGAAAGTG GCCGTTCACC GCATGCAAGC 2220 CAGCCACGGG GAGACCTTTC ATGTGCTTTA CCTAACTACA GACAGGGGCA CTATCCACAA 2280 GGTGGTGGAA CCGGGGGAGC AGGAGCACAG CTTCGCCTTC AACATCATGG AGATCCAGCC 2340 CTTCCGCCGC GCGGCTGCCA TCCAGACCAT GTCGCTGGAT GCTGAGCGGA GGAAGCTGTA 2400 TGTGAGCTCC CAGTGGGAGG TGAGCCAGGT GCCCCTGGAC CTGTGTGAGG TCTATGGCGG 2460 GGGCTGCCAC GGTTGCCTCA TGTCCCGAGA CCCCTACTGC GGCTGGGACC AGGGCCGCTG 2520 CATCTCCATC TACAGCTCCG AACGGTCAGT GCTGCAATCC ATTAATCCAG CCGAGCCACA 2580 CAAGGAGTGT CCCAACCCCA AACCAGACAA GGCCCCACTG CAGAAGGTTT CCCTGGCCCC 2640 AAACTCTCGC TACTACCTGA GCTGCCCCAT GGAATCCCGC CACGCCACCT ACTCATGGCG 2700 CCACAAGGAG AACGTGGAGC AGAGCTGCGA ACCTGGTCAC CAGAGCCCCA ACTGCATCCT 2760 GTTCATCGAG AACCTCACGG CGCAGCAGTA CGGCCACTAC TTCTGCGAGG CCCAGGAGGG 2820 CTCCTACTTC CGCGAGGCTC AGCACTGGCA GCTGCTGCCC GAGGACGGCA TCATGGCCGA 2880 GCACCTGCTG GGTCATGCCT GTGCCCTGGC TGCCTCCCTC TGGCTGGGGG TGCTGCCCAC 2940 ACTCACTCTT GGCTTGCTGG TCCACGTGAA GCTTGGGCCC GAACAAAAAC TCATCTCAGA 3000 AGAGGATCTG AATAGCGCCG TCGACCATCA TCATCATCAT CATTGAGTTT AAACCGCTGA 3060 TCAGCCTCGA CTGTGCCTTC TAGTTGCCAG CCATCTGTTG TTTGCCCCTC CCCCGTGCCT 3120 TCCTTGACCC TGGAAGGTGC CACTCCCACT GTCCTTTCCT AATAAAATGA GGAAATTGCA 3180 TCGCATTGTC TGAGTAGGTG TCATTCTATT CTGGGGGGTG GGGTGGGGCA GGACAGCAAG 3240 GGGGAGGATT GGGAAGACAA TAGCAGGCAT GCTGGGGATG CGGTGGGCTC TATGGCTTCT 3300 GAGGCGGAAA GAACCAGCTG GGGCTCTAGG GGGTATCCCC ACGCGCCCTG TAGCGGCGCA 3360 TTAAGCGCGG CGGGTGTGGT GGTTACGCGC AGCGTGACCG CTACACTTGC CAGCGCCCTA 3420 GCGCCCGCTC CTTTCGCTTT CTTCCCTTCC TTTCTCGCCA CGTTCGCCGG CTTTCCCCGT 3480 CAAGCTCTAA ATCGGGGCAT CCCTTTAGGG TTCCGATTTA GTGCTTTACG GCACCTCGAC 3540 CCCAAAAAAC TTGATTAGGG TGATGGTTCA CGTAGTGGGC CATCGCCCTG ATAGACGGTT 3600 TTTCGCCCTT TGACGTTGGA GTCCACGTTC TTTAATAGTG GACTCTTGTT CCAAACTGGA 3660 ACAACACTCA ACCCTATCTC GGTCTATTCT TTTGATTTAT AAGGGATTTT GGGGATTTCG 3720 GCCTATTGGT TAAAAAATGA GCTGATTTAA CAAAAATTTA ACGCGAATTA ATTCTGTGGA 3780 ATGTGTGTCA GTTAGGGTGT GGAAAGTCCC CAGGCTCCCC AGGCAGGCAG AAGTATGCAA 3840 AGCATGCATC TCAATTAGTC AGCAACCAGG TGTGGAAAGT CCCCAGGCTC CCCAGCACGC 3900 AGAAGTATGC AAAGCATGCA TCTCAATTAG TCAGCAACCA TAGTCCCGCC CCTAACTCCG 3960 CCCATCCCGC CCCTAACTCC GCCCAGTTCC GCCCATTCTC CGCCCCATGG CTGACTAATT 4020 TTTTTTATTT ATGCAGAGGC CGAGGCCGCC TCTGCCTCTG AGCTATTCCA GAAGTAGTGA 4080 GGAGGCTTTT TTGGAGGCCT AGGCTTTTGC AAAAAGCTCC CGGGAGCTTG TATATCCATT 4140 TTCGGATCTG ATCAAGAGAC AGGATGAGGA TCGTTTCGCA TGATTGAACA AGATGGATTG 4200 CACGCAGGTT CTCCGGCCGC TTGGGTGGAG AGGCTATTCG GCTATGACTG GGCACAACAG 4260 ACAATCGGCT GCTCTGATGC CGCCGTGTTC CGGCTGTCAG CGCAGGGGCG CCCGGTTCTT 4320 TTTGTCAAGA CCGACCTGTC CGGTGCCCTG AATGAACTGC AGGACGAGGC AGCGCGGCTA 4380 TCGTGGCTGG CCACGACGGG CGTTCCTTGC GCAGCTGTGC TCGACGTTGT CACTGAAGCG 4440 GGAAGGGACT GGCTGCTATT GGGCGAAGTG CCGGGGCAGG ATCTCCTGTC ATCTCACCTT 4500 GCTCCTGCCG AGAAAGTATC CATCATGGCT GATGCAATGC GGCGGCTGCA TACGCTTGAT 4560 CCGGCTACCT GCCCATTCGA CCACCAAGCG AAACATCGCA TCGAGCGAGC ACGTACTCGG 4620 ATGGAAGCCG GTCTTGTCGA TCAGGATGAT CTGGACGAAG AGCATCAGGG GCTCGCGCCA 4680 GCCGAACTGT TCGCCAGGCT CAAGGCGCGC ATGCCCGACG GCGAGGATCT CGTCGTGACC 4740 CATGGCGATG CCTGCTTGCC GAATATCATG GTGGAAAATG GCCGCTTTTC TGGATTCATC 4800 GACTGTGGCC GGCTGGGTGT GGCGGACCGC TATCAGGACA TAGCGTTGGC TACCCGTGAT 4860 ATTGCTGAAG AGCTTGGCGG CGAATGGGCT GACCGCTTCC TCGTGCTTTA CGGTATCGCC 4920 GCTCCCGATT CGCAGCGCAT CGCCTTCTAT CGCCTTCTTG ACGAGTTCTT CTGAGCGGGA 4980 CTCTGGGGTT CGAAATGACC GACCAAGCGA CGCCCAACCT GCCATCACGA GATTTCGATT 5040 CCACCGCCGC CTTCTATGAA AGGTTGGGCT TCGGAATCGT TTTCCGGGAC GCCGGCTGGA 5100 TGATCCTCCA GCGCGGGGAT CTCATGCTGG AGTTCTTCGC CCACCCCAAC TTGTTTATTG 5160 CAGCTTATAA TGGTTACAAA TAAAGCAATA GCATCACAAA TTTCACAAAT AAAGCATTTT 5220 TTTCACTGCA TTCTAGTTGT GGTTTGTCCA AACTCATCAA TGTATCTTAT CATGTCTGTA 5280 TACCGTCGAC CTCTAGCTAG AGCTTGGCGT AATCATGGTC ATAGCTGTTT CCTGTGTGAA 5340 ATTGTTATCC GCTCACAATT CCACACAACA TACGAGCCGG AAGCATAAAG TGTAAAGCCT 5400 GGGGTGCCTA ATGAGTGAGC TAACTCACAT TAATTGCGTT GCGCTCACTG CCCGCTTTCC 5460 AGTCGGGAAA CCTGTCGTGC CAGCTGCATT AATGAATCGG CCAACGCGCG GGGAGAGGCG 5520 GTTTGCGTAT TGGGCGCTCT TCCGCTTCCT CGCTCACTGA CTCGCTGCGC TCGGTCGTTC 5580 GGCTGCGGCG AGCGGTATCA GCTCACTCAA AGGCGGTAAT ACGGTTATCC ACAGAATCAG 5640 GGGATAACGC AGGAAAGAAC ATGTGAGCAA AAGGCCAGCA AAAGGCCAGG AACCGTAAAA 5700 AGGCCGCGTT GCTGGCGTTT TTCCATAGGC TCCGCCCCCC TGACGAGCAT CACAAAAATC 5760 GACGCTCAAG TCAGAGGTGG CGAAACCCGA CAGGACTATA AAGATACCAG GCGTTTCCCC 5820 CTGGAAGCTC CCTCGTGCGC TCTCCTGTTC CGACCCTGCC GCTTACCGGA TACCTGTCCG 5880 CCTTTCTCCC TTCGGGAAGC GTGGCGCTTT CTCAATGCTC ACGCTGTAGG TATCTCAGTT 5940 CGGTGTAGGT CGTTCGCTCC AAGCTGGGCT GTGTGCACGA ACCCCCCGTT CAGCCCGACC 6000 GCTGCGCCTT ATCCGGTAAC TATCGTCTTG AGTCCAACCC GGTAAGACAC GACTTATCGC 6060 CACTGGCAGC AGCCACTGGT AACAGGATTA GCAGAGCGAG GTATGTAGGC GGTGCTACAG 6120 AGTTCTTGAA GTGGTGGCCT AACTACGGCT ACACTAGAAG GACAGTATTT GGTATCTGCG 6180 CTCTGCTGAA GCCAGTTACC TTCGGAAAAA GAGTTGGTAG CTCTTGATCC GGCAAACAAA 6240 CCACCGCTGG TAGCGGTGGT TTTTTTGTTT GCAAGCAGCA GATTACGCGC AGAAAAAAAG 6300 GATCTCAAGA AGATCCTTTG ATCTTTTCTA CGGGGTCTGA CGCTCAGTGG AACGAAAACT 6360 CACGTTAAGG GATTTTGGTC ATGAGATTAT CAAAAAGGAT CTTCACCTAG ATCCTTTTAA 6420 ATTAAAAATG AAGTTTTAAA TCAATCTAAA GTATATATGA GTAAACTTGG TCTGACAGTT 6480 ACCAATGCTT AATCAGTGAG GCACCTATCT CAGCGATCTG TCTATTTCGT TCATCCATAG 6540 TTGCCTGACT CCCCGTCGTG TAGATAACTA CGATACGGGA GGGCTTACCA TCTGGCCCCA 6600 GTGCTGCAAT GATACCGCGA GACCCACGCT CACCGGCTCC AGATTTATCA GCAATAAACC 6660 AGCCAGCCGG AAGGGCCGAG CGCAGAAGTG GTCCTGCAAC TTTATCCGCC TCCATCCAGT 6720 CTATTAATTG TTGCCGGGAA GCTAGAGTAA GTAGTTCGCC AGTTAATAGT TTGCGCAACG 6780 TTGTTGCCAT TGCTACAGGC ATCGTGGTGT CACGCTCGTC GTTTGGTATG GCTTCATTCA 6840 GCTCCGGTTC CCAACGATCA AGGCGAGTTA CATGATCCCC CATGTTGTGC AAAAAAGCGG 6900 TTAGCTCCTT CGGTCCTCCG ATCGTTGTCA GAAGTAAGTT GGCCGCAGTG TTATCACTCA 6960 TGGTTATGGC AGCACTGCAT AATTCTCTTA CTGTCATGCC ATCCGTAAGA TGCTTTTCTG 7020 TGACTGGTGA GTACTCAACC AAGTCATTCT GAGAATAGTG TATGCGGCGA CCGAGTTGCT 7080 CTTGCCCGGC GTCAATACGG GATAATACCG CGCCACATAG CAGAACTTTA AAAGTGCTCA 7140 TCATTGGAAA ACGTTCTTCG GGGCGAAAAC TCTCAAGGAT CTTACCGCTG TTGAGATCCA 7200 GTTCGATGTA ACCCACTCGT GCACCCAACT GATCTTCAGC ATCTTTTACT TTCACCAGCG 7260 TTTCTGGGTG AGCAAAAACA GGAAGGCAAA ATGCCGCAAA AAAGGGAATA AGGGCGACAC 7320 GGAAATGTTG AATACTCATA CTCTTCCTTT TTCAATATTA TTGAAGCATT TATCAGGGTT 7380 ATTGTCTCAT GAGCGGATAC ATATTTGAAT GTATTTAGAA AAATAAACAA ATAGGGGTTC 7440 CGCGCACATT TCCCCGAAAA GTGCCACCTG ACGTC 7475 (2)SEQ ID NO:36的信息： (ⅰ)序列特征： (A)长度：8192个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..8192 (ⅹⅰ)序列描述：SEQ ID NO:36: GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC TGCTCTGATG 60 CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT GGAGGTCGCT GAGTAGTGCG 120 CGAGCAAAAT TTAAGCTACA ACAAGGCAAG GCTTGACCGA CAATTGCATG AAGAATCTGC 180 TTAGGGTTAG GCGTTTTGCG CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT 240 GATTATTGAC TAGTTATTAA TAGTAATCAA TTACGGGGTC ATTAGTTCAT AGCCCATATA 300 TGGAGTTCCG CGTTACATAA CTTACGGTAA ATGGCCCGCC TGGCTGACCG CCCAACGACC 360 CCCGCCCATT GACGTCAATA ATGACGTATG TTCCCATAGT AACGCCAATA GGGACTTTCC 420 ATTGACGTCA ATGGGTGGAC TATTTACGGT AAACTGCCCA CTTGGCAGTA CATCAAGTGT 480 ATCATATGCC AAGTACGCCC CCTATTGACG TCAATGACGG TAAATGGCCC GCCTGGCATT 540 ATGCCCAGTA CATGACCTTA TGGGACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA 600 TCGCTATTAC CATGGTGATG CGGTTTTGGC AGTACATCAA TGGGCGTGGA TAGCGGTTTG 660 ACTCACGGGG ATTTCCAAGT CTCCACCCCA TTGACGTCAA TGGGAGTTTG TTTTGGCACC 720 AAAATCAACG GGACTTTCCA AAATGGTCGTA ACAACTCCGC CCCATTGACG CAAATGGGCG 780 GTAGGCGTGT ACGGTGGGAG GTCTATATAA GCAGAGCTCT CTGGCTAACT AGAGAACCCA 840 CTGCTTACTG GCTTATCGAA ATTAATACGA CTCACTATAG GGAGACCCAA GCTGGCTAGC 900 GTTTAAACGG GCCCTCTAGA CTCGAGCGGC CGCCACTGTG CTGGATATCT GCAGAATTCG 960 GCTTGGGATG ACGCCTCCTC CGCCCGGACG TGCCGCCCCC AGCGCACCGC GCGCCCGCGT 1020 CCCTGGCCCG CCGGCTCGGT TGGGGCTTCC GCTGCGGCTG CGGCTGCTGC TGCTGCTCTG 1080 GGCGGCCGCC GCCTCCGCCC AGGGCCACCT AAGGAGCGGA CCCCGCATCT TCGCCGTCTG 1140 GAAAGGCCAT GTAGGGCAGG ACCGGGTGGA CTTTGGCCAG ACTGAGCCGC ACACGGTGCT 1200 TTTCCACGAG CCAGGCAGCT CCTCTGTGTG GGTGGGAGGA CGTGGCAAGG TCTACCTCTT 1260 TGACTTCCCC GAGGGCAAGA ACGCATCTGT GCGCACGGTG AATATCGGCT CCACAAAGGG 1320 GTCCTGTCTG GATAAGCGGG ACTGCGAGAA CTACATCACT CTCCTGGAGA GGCGGAGTGA 1380 GGGGCTGCTG GCCTGTGGCA CCAACGCCCG GCACCCCAGC TGCTGGAACC TGGTGAATGG 1440 CACTGTGGTG CCACTTGGCG AGATGAGAGG CTACGCCCCC TTCAGCCCGG ACGAGAACTC 1500 CCTGGTTCTG TTTGAAGGGG ACGAGGTGTA TTCCACCATC CGGAAGCAGG AATACAATGG 1560 GAAGATCCCT CGGTTCCGCC GCATCCGGGG CGAGAGTGAG CTGTACACCA GTGATACTGT 1620 CATGCAGAAC CCACAGTTCA TCAAAGCCAC CATCGTGCAC CAAGACCAGG CTTACGATGA 1680 CAAGATCTAC TACTTCTTCC GAGAGGACAA TCCTGACAAG AATCCTGAGG CTCCTCTCAA 1740 TGTGTCCCGT GTGGCCCAGT TGTGCAGGGG GGACCAGGGT GGGGAAAGTT CACTGTCAGT 1800 CTCCAAGTGG AACACTTTTC TGAAAGCCAT GCTGGTATGC AGTGATGCTG CCACCAACAA 1860 GAACTTCAAC AGGCTGCAAG ACGTCTTCCT GCTCCCTGAC CCCAGCGGCC AGTGGAGGGA 1920 CACCAGGGTC TATGGTGTTT TCTCCAACCC CTGGAACTAC TCAGCCGTCT GTGTGTATTC 1980 CCTCGGTGAC ATTGACAAGG TCTTCCGTAC CTCCTCACTC AAGGGCTACC ACTCAAGCCT 2040 TCCCAACCCG CGGCCTGGCA AGTGCCTCCC AGACCAGCAG CCGATACCCA CAGAGACCTT 2100 CCAGGTGGCT GACCGTCACC CAGAGGTGGC GCAGAGGGTG GAGCCCATGG GGCCTCTGAA 2160 GACGCCATTG TTCCACTCTA AATACCACTA CCAGAAAGTG GCCGTTCACC GCATGCAAGC 2220 CAGCCACGGG GAGACCTTTC ATGTGCTTTA CCTAACTACA GACAGGGGCA CTATCCACAA 2280 GGTGGTGGAA CCGGGGGAGC AGGAGCACAG CTTCGCCTTC AACATCATGG AGATCCAGCC 2340 CTTCCGCCGC GCGGCTGCCA TCCAGACCAT GTCGCTGGAT GCTGAGCGGA GGAAGCTGTA 2400 TGTGAGCTCC CAGTGGGAGG TGAGCCAGGT GCCCCTGGAC CTGTGTGAGG TCTATGGCGG 2460 GGGCTGCCAC GGTTGCCTCA TGTCCCGAGA CCCCTACTGC GGCTGGGACC AGGGCCGCTG 2520 CATCTCCATC TACAGCTCCG AACGGTCAGT GCTGCAATCC ATTAATCCAG CCGAGCCACA 2580 CAAGGAGTGT CCCAACCCCA AACCAGACAA GGCCCCACTG CAGAAGGTTT CCCTGGCCCC 2640 AAACTCTCGC TACTACCTGA GCTGCCCCAT GGAATCCCGC CACGCCACCT ACTCATGGCG 2700 CCACAAGGAG AACGTGGAGC AGAGCTGCGA ACCTGGTCAC CAGAGCCCCA ACTGCATCCT 2760 GTTCATCGAG AACCTCACGG CGCAGCAGTA CGGCCACTAC TTCTGCGAGG CCCAGGAGGG 2820 CTCCTACTTC CGCGAGGCTC AGCACTGGCA GCTGCTGCCC GAGGACGGCA TCATGGCCGA 2880 GCACCTGCTG GGTCATGCCT GTGCCCTGGC TGCCTCCCTC TGGCTGGGGG TGCTGCCCAC 2940 ACTCACTCTT GGCTTGCTGG TCCACATGGT GAGCAAGGGC GAGGAGCTGT TCACCGGGGT 3000 GGTGCCCATC CTGGTCGAGC TGGACGGCGA CGTAAACGGC CACAAGTTCA GCGTGTCCGG 3060 CGAGGGCGAG GGCGATGCCA CCTACGGCAA GCTGACCCTG AAGTTCATCT GCACCACCGG 3120 CAAGCTGCCC GTGCCCTGGC CCACCCTCGT GACCACCCTG ACCTACGGCG TGCAGTGCTT 3180 CAGCCGCTAC CCCGACCACA TGAAGCAGCA CGACTTCTTC AAGTCCGCCA TGCCCGAAGG 3240 CTACGTCCAG GAGCGCACCA TCTTCTTCAA GGACGACGGC AACTACAAGA CCCGCGCCGA 3300 GGTGAAGTTC GAGGGCGACA CCCTGGTGAA CCGCATCGAG CTGAAGGGCA TCGACTTCAA 3360 GGAGGACGGC AACATCCTGG GGCACAAGCT GGAGTACAAC TACAACAGCC ACAACGTCTA 3420 TATCATGGCC GACAAGCAGA AGAACGGCAT CAAGGTGAAC TTCAAGATCC GCCACAACAT 3480 CGAGGACGGC AGCGTGCAGC TCGCCGACCA CTACCAGCAG AACACCCCCA TCGGCGACGG 3540 CCCCGTGCTG CTGCCCGACA ACCACTACCT GAGCACCCAG TCCGCCCTGA GCAAAGACCC 3600 CAACGAGAAG CGCGATCACA TGGTCCTGCT GGAGTTCGTG ACCGCCGCCG GGATCACTCT 3660 CGGCATGGAC GAGCTGTACA AGGTGAAGCT TGGGCCCGAA CAAAAACTCA TCTCAGAAGA 3720 GGATCTGAAT AGCGCCGTCG ACCATCATCA TCATCATCAT TGAGTTTAAA CCGCTGATCA 3780 GCCTCGACTG TGCCTTCTAG TTGCCAGCCA TCTGTTGTTT GCCCCTCCCC CGTGCCTTCC 3840 TTGACCCTGG AAGGTGCCAC TCCCACTGTC CTTTCCTAAT AAAATGAGGA AATTGCATCG 3900 CATTGTCTGA GTAGGTGTCA TTCTATTCTG GGGGGTGGGG TGGGGCAGGA CAGCAAGGGG 3960 GAGGATTGGG AAGACAATAG CAGGCATGCT GGGGATGCGG TGGGCTCTAT GGCTTCTGAG 4020 GCGGAAAGAA CCAGCTGGGG CTCTAGGGGG TATCCCCACG CGCCCTGTAG CGGCGCATTA 4080 AGCGCGGCGG GTGTGGTGGT TACGCGCAGC GTGACCGCTA CACTTGCCAG CGCCCTAGCG 4140 CCCGCTCCTT TCGCTTTCTT CCCTTCCTTT CTCGCCACGT TCGCCGGCTT TCCCCGTCAA 4200 GCTCTAAATC GGGGCATCCC TTTAGGGTTC CGATTTAGTG CTTTACGGCA CCTCGACCCC 4260 AAAAAACTTG ATTAGGGTGA TGGTTCACGT AGTGGGCCAT CGCCCTGATA GACGGTTTTT 4320 CGCCCTTTGA CGTTGGAGTC CACGTTCTTT AATAGTGGAC TCTTGTTCCA AACTGGAACA 4380 ACACTCAACC CTATCTCGGT CTATTCTTTT GATTTATAAG GGATTTTGGG GATTTCGGCC 4440 TATTGGTTAA AAAATGAGCT GATTTAACAA AAATTTAACG CGAATTAATT CTGTGGAATG 4500 TGTGTCAGTT AGGGTGTGGA AAGTCCCCAG GCTCCCCAGG CAGGCAGAAG TATGCAAAGC 4560 ATGCATCTCA ATTAGTCAGC AACCAGGTGT GGAAAGTCCC CAGGCTCCCC AGCAGGCAGA 4620 AGTATGCAAA GCATGCATCT CAATTAGTCA GCAACCATAG TCCCGCCCCT AACTCCGCCC 4680 ATCCCGCCCC TAACTCCGCC CAGTTCCGCC CATTCTCCGC CCCATGGCTG ACTAATTTTT 4740 TTTATTTATG CAGAGGCCGA GGCCGCCTCT GCCTCTGAGC TATTCCAGAA GTAGTGAGGA 4800 GGCTTTTTTG GAGGCCTAGG CTTTTGCAAA AAGCTCCCGG GAGCTTGTAT ATCCATTTTC 4860 GGATCTGATC AAGAGACAGG ATGAGGATCG TTTCGCATGA TTGAACAAGA TGGATTGCAC 4920 GCAGGTTCTC CGGCCGCTTG GGTGGAGAGG CTATTCGGCT ATGACTGGGC ACAACAGACA 4980 ATCGGCTGCT CTGATGCCGC CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT 5040 GTCAAGACCG ACCTGTCCGG TGCCCTGAAT GAACTGCAGG ACGAGGCAGC GCGGCTATCG 5100 TGGCTGGCCA CGACGGGCGT TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC TGAAGCGGGA 5160 AGGGACTGGC TGCTATTGGG CGAAGTGCCG GGGCAGGATC TCCTGTCATC TCACCTTGCT 5220 CCTGCCGAGA AAGTATCCAT CATGGCTGAT GCAATGCGGC GGCTGCATAC GCTTGATCCG 5280 GCTACCTGCC CATTCGACCA CCAAGCGAAA CATCGCATCG AGCGAGCACG TACTCGGATG 5340 GAAGCCGGTC TTGTCGATCA GGATGATCTG GACGAAGAGC ATCAGGGGCT CGCGCCAGCC 5400 GAACTGTTCG CCAGGCTCAA GGCGCGCATG CCCGACGGCG AGGATCTCGT CGTGACCCAT 5460 GGCGATGCCT GCTTGCCGAA TATCATGGTG GAAAATGGCC GCTTTTCTGG ATTCATCGAC 5520 TGTGGCCGGC TGGGTGTGGC GGACCGCTAT CAGGACATAG CGTTGGCTAC CCGTGATATT 5580 GCTGAAGAGC TTGGCGGCGA ATGGGCTGAC CGCTTCCTCG TGCTTTACGG TATCGCCGCT 5640 CCCGATTCGC AGCGCATCGC CTTCTATCGC CTTCTTGACG AGTTCTTCTG AGCGGGACTC 5700 TGGGGTTCGA AATGACCGAC CAAGCGACGC CCAACCTGCC ATCACGAGAT TTCGATTCCA 5760 CCGCCGCCTT CTATGAAAGG TTGGGCTTCG GAATCGTTTT CCGGGACGCC GGCTGGATGA 5820 TCCTCCAGCG CGGGGATCTC ATGCTGGAGT TCTTCGCCCA CCCCAACTTG TTTATTGCAG 5880 CTTATAATGG TTACAAATAA AGCAATAGCA TCACAAATTT CACAAATAAA GCATTTTTTT 5940 CACTGCATTC TAGTTGTGGT TTGTCCAAAC TCATCAATGT ATCTTATCAT GTCTGTATAC 6000 CGTCGACCTC TAGCTAGAGC TTGGCGTAAT CATGGTCATA GCTGTTTCCT GTGTGAAATT 6060 GTTATCCGCT CACAATTCCA CACAACATAC GAGCCGGAAG CATAAAGTGT AAAGCCTGGG 6120 GTGCCTAATG AGTGAGCTAA CTCACATTAA TTGCGTTGCG CTCACTGCCC GCTTTCCAGT 6180 CGGGAAACCT GTCGTGCCAG CTGCATTAAT GAATCGGCCA ACGCGCGGGG AGAGGCGGTT 6240 TGCGTATTGG GCGCTCTTCC GCTTCCTCGC TCACTGACTC GCTGCGCTCG GTCGTTCGGC 6300 TGCGGCGAGC GGTATCAGCT CACTCAAAGG CGGTAATACG GTTATCCACA GAATCAGGGG 6360 ATAACGCAGG AAAGAACATG TGAGCAAAAG GCCAGCAAAA GGCCAGGAAC CGTAAAAAGG 6420 CCGCGTTGCT GGCGTTTTTC CATAGGCTCC GCCCCCCTGA CGAGCATCAC AAAAATCGAC 6480 GCTCAAGTCA GAGGTGGCGA AACCCGACAG GACTATAAAG ATACCAGGCG TTTCCCCCTG 6540 GAAGCTCCCT CGTGCGCTCT CCTGTTCCGA CCCTGCCGCT TACCGGATAC CTGTCCGCCT 6600 TTCTCCCTTC GGGAAGCGTG GCGCTTTCTC AATGCTCACG CTGTAGGTAT CTCAGTTCGG 6660 TGTAGGTCGT TCGCTCCAAG CTGGGCTGTG TGCACGAACC CCCCGTTCAG CCCGACCGCT 6720 GCGCCTTATC CGGTAACTAT CGTCTTGAGT CCAACCCGGT AAGACACGAC TTATCGCCAC 6780 TGGCAGCAGC CACTGGTAAC AGGATTAGCA GAGCGAGGTA TGTAGGCGGT GCTACAGAGT 6840 TCTTGAAGTG GTGGCCTAAC TACGGCTACA CTAGAAGGAC AGTATTTGGT ATCTGCGCTC 6900 TGCTGAAGCC AGTTACCTTC GGAAAAAGAG TTGGTAGCTC TTGATCCGGC AAACAAACCA 6960 CCGCTGGTAG CGGTGGTTTT TTTGTTTGCA AGCAGCAGAT TACGCGCAGA AAAAAAGGAT 7020 CTCAAGAAGA TCCTTTGATC TTTTCTACGG GGTCTGACGC TCAGTGGAAC GAAAACTCAC 7080 GTTAAGGGAT TTTGGTCATG AGATTATCAA AAAGGATCTT CACCTAGATC CTTTTAAATT 7140 AAAAATGAAG TTTTAAATCA ATCTAAAGTA TATATGAGTA AACTTGGTCT GACAGTTACC 7200 AATGCTTAAT CAGTGAGGCA CCTATCTCAG CGATCTGTCT ATTTCGTTCA TCCATAGTTG 7260 CCTGACTCCC CGTCGTGTAG ATAACTACGA TACGGGAGGG CTTACCATCT GGCCCCAGTG 7320 CTGCAATGAT ACCGCGAGAC CCACGCTCAC CGGCTCCAGA TTTATCAGCA ATAAACCAGC 7380 CAGCCGGAAG GGCCGAGCGC AGAAGTGGTC CTGCAACTTT ATCCGCCTCC ATCCAGTCTA 7440 TTAATTGTTG CCGGGAAGCT AGAGTAAGTA GTTCGCCAGT TAATAGTTTG CGCAACGTTG 7500 TTGCCATTGC TACAGGCATC GTGGTGTCAC GCTCGTCGTT TGGTATGGCT TCATTCAGCT 7560 CCGGTTCCCA ACGATCAAGG CGAGTTACAT GATCCCCCAT GTTGTGCAAA AAAGCGGTTA 7620 AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT TGTTCTCGTT 60 AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC GATGGACAAG TGCATTGTTC 120 TCTTGCTGAA AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC AGTACCCGGG 180 AGTACCCTCG ACCGCCGGAG TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT 240 TCAAACAAGC AAAGTGAACA CGTCGCTAAG CGAAAGCTAA GCAAATAAAC AAGCGCAGCT 300 GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA AAAGTAACCA 360 GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA GAAGTAATTA TTGAATACAA 420 GAAGAGAACT CTGAATACTT TCAACAAGTT ACCGAGAAAG AAGAACTCAC ACACAGCTAG 480 CGTTTAAACT TAAGCTTGGT ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGGAATTCGG 540 (2)SEQ ID NO:37的信息： (ⅰ)序列特征： (A)长度：7000个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..7000 (ⅹⅰ)序列描述：SEQ ID NO:37: GCTCCTTCGG TCCTCCGATC GTTGTCAGAA GTAAGTTGGC CGCAGTGTTA TCACTCATGG 7680 TTATGGCAGC ACTGCATAAT TCTCTTACTG TCATGCCATC CGTAAGATGC TTTTCTGTGA 7740 CTGGTGAGTA CTCAACCAAG TCATTCTGAG AATAGTGTAT GCGGCGACCG AGTTGCTCTT 7800 GCCCGGCGTC AATACGGGAT AATACCGCGC CACATAGCAG AACTTTAAAA GTGCTCATCA 7860 TTGGAAAACG TTCTTCGGGG CGAAAACTCT CAAGGATCTT ACCGCTGTTG AGATCCAGTT 7920 CGATGTAACC CACTCGTGCA CCCAACTGAT CTTCAGCATC TTTTACTTTC ACCAGCGTTT 7980 CTGGGTGAGC AAAAACAGGA AGGCAAAATG CCGCAAAAAA GGGAATAAGG GCGACACGGA 8040 AATGTTGAAT ACTCATACTC TTCCTTTTTC AATATTATTG AAGCATTTAT CAGGGTTATT 8100 GTCTCATGAG CGGATACATA TTTGAATGTA TTTAGAAAAA TAAACAAATA GGGGTTCCGC 8160 GCACATTTCC CCGAAAAGTG CCACCTGACG TC 8192 CTTGGGATGA CGCCTCCTCC GCCCGGACGT GCCGCCCCCA GcGCAccGCG CGCCCGCGTC 600 CCTGGCCCGC CGGCTCGGTT GGGGCTTCCG CTGCGGCTGC GGCTGCTGCT GCTGCTCTGG 660 GCGGCCGCCG CCTCCGCCCA GGGCCACCTA AGGAGCGGAC CCCGCATCTT CGCCGTCTGG 720 AAAGGCCATG TAGGGCAGGA CCGGGTGGAC TTTGGCCAGA CTGAGCCGCA CACGGTGCTT 780 TTCCACGAGC CAGGCAGCTC CTCTGTGTGG GTGGGAGGAC GTGGCAAGGT CTACCTCTTT 840 GACTTCCCCG AGGGCAAGAA CGCATCTGTG CGCACGGTGA ATATCGGCTC CACAAAGGGG 900 TCCTGTCTGG ATAAGCGGGA CTGCGAGAAC TACATCACTC TCCTGGAGAG GCGGAGTGAG 960 GGGCTGCTGG CCTGTGGCAC CAACGCCCGG CACCCCAGCT GCTGGAACCT GGTGAATGGC 1020 ACTGTGGTGC CACTTGGCGA GATGAGAGGC TACGCCCCCT TCAGCCCGGA CGAGAACTCC 1080 CTGGTTCTGT TTGAAGGGGA CGAGGTGTAT TCCACCATCC GGAAGCAGGA ATACAATGGG 1140 AAGATCCCTC GGTTCCGCCG CATCCGGGGC GAGAGTGAGC TGTACACCAG TGATACTGTC 1200 ATGCAGAACC CACAGTTCAT CAAAGCCACC ATCGTGCACC AAGACCAGGC TTACGATGAC 1260 AAGATCTACT ACTTCTTCCG AGAGGACAAT CCTGACAAGA ATCCTGAGGC TCCTCTCAAT 1320 GTGTCCCGTG TGGCCCAGTT GTGCAGGGGG GACCAGGGTG GGGAAAGTTC ACTGTCAGTC 1380 TCCAAGTGGA ACACTTTTCT GAAAGCCATG CTGGTATGCA GTGATGCTGC CACCAACAAG 1440 AACTTCAACA GGCTGCAAGA CGTCTTCCTG CTCCCTGACC CCAGCGGCCA GTGGAGGGAC 1500 ACCAGGGTCT ATGGTGTTTT CTCCAACCCC TGGAACTACT CAGCCGTCTG TGTGTATTCC 1560 CTCGGTGACA TTGACAAGGT CTTCCGTACC TCCTCACTCA AGGGCTACCA CTCAAGCCTT 1620 CCCAACCCGC GGCCTGGCAA GTGCCTCCCA GACCAGCAGC CGATACCCAC AGAGACCTTC 1680 CAGGTGGCTG ACCGTCACCC AGAGGTGGCG CAGAGGGTGG AGCCCATGGG GCCTCTGAAG 1740 ACGCCATTGT TCCACTCTAA ATACCACTAC CAGAAAGTGG CCGTTCACCG CATGCAAGCC 1800 AGCCACGGGG AGACCTTTCA TGTGCTTTAC CTAACTACAG ACAGGGGCAC TATCCACAAG 1860 GTGGTGGAAC CGGGGGAGCA GGAGCACAGC TTCGCCTTCA ACATCATGGA GATCCAGCCC 1920 TTCCGCCGCG CGGCTGCCAT CCAGACCATG TCGCTGGATG CTGAGCGGAG GAAGCTGTAT 1980 GTGAGCTCCC AGTGGGAGGT GAGCCAGGTG CCCCTGGACC TGTGTGAGGT CTATGGCGGG 2040 GGCTGCCACG GTTGCCTCAT GTCCCGAGAC CCCTACTGCG GCTGGGACCA GGGCCGCTGC 2100 ATCTCCATCT ACAGCTCCGA ACGGTCAGTG CTGCAATCCA TTAATCCAGC CGAGCCACAC 2160 AAGGAGTGTC CCAACCCCAA ACCAGACAAG GCCCCACTGC AGAAGGTTTC CCTGGCCCCA 2220 AACTCTCGCT ACTACCTGAG CTGCCCCATG GAATCCCGCC ACGCCACCTA CTCATGGCGC 2280 CACAAGGAGA ACGTGGAGCA GAGCTGCGAA CCTGGTCACC AGAGCCCCAA CTGCATCCTG 2340 TTCATCGAGA ACCTCACGGC GCAGCAGTAC GGCCACTACT TCTGCGAGGC CCAGGAGGGC 2400 TCCTACTTCC GCGAGGCTCA GCACTGGCAG CTGCTGCCCG AGGACGGCAT CATGGCCGAG 2460 CACCTGCTGG GTCATGCCTG TGCCCTGGCT GCCTCCCTCT GGCTGGGGGT GCTGCCCACA 2520 CTCACTCTTG GCTTGCTGGT CCACGTGAAG CTTGGGCCCG TTTAAACCCG CTGATCAGCC 2580 TCGACTGTGC CTTCTAGTTG CCAGCCATCT GTTGTTTGCC CCTCCCCCGT GCCTTCCTTG 2640 ACCCTGGAAG GTGCCACTCC CACTGTCCTT TCCTAATAAA ATGAGGAAAT TGCATCGCAT 2700 TGTCTGAGTA GGTGTCATTC TATTCTGGGG GGTGGGGTGG GGCAGGACAG CAAGGGGGAG 2760 GATTGGGAAG ACAATAGCAG GCATGCTGGG GATGCGGTGG GCTCTATGGC TTCTGAGGCG 2820 GAAAGAACCA GCTGGGGCTC TAGGGGGTAT CCCCACGCGC CCTGTAGCGG CGCATTAAGC 2880 GCGGCGGGTG TGGTGGTTAC GCGCAGCGTG ACCGCTACAC TTGCCAGCGC CCTAGCGCCC 2940 GCTCCTTTCG CTTTCTTCCC TTCCTTTCTC GCCACGTTCG CCGGCTTTCC CCGTCAAGCT 3000 CTAAATCGGG GCATCCCTTT AGGGTTCCGA TTTAGTGCTT TACGGCACCT CGACCCCAAA 3060 AAACTTGATT AGGGTGATGG TTCACGTAGT GGGCCATCGC CCTGATAGAC GGTTTTTCGC 3120 CCTTTGACGT TGGAGTCCAC GTTCTTTAAT AGTGGACTCT TGTTCCAAAC TGGAACAACA 3180 CTCAACCCTA TCTCGGTCTA TTCTTTTGAT TTATAAGGGA TTTTGGGGAT TTCGGCCTAT 3240 TGGTTAAAAA ATGAGCTGAT TTAACAAAAA TTTAACGCGA ATTAATTCTG TGGAATGTGT 3300 GTCAGTTAGG GTGTGGAAAG TCCCCAGGCT CCCCAGGCAG GCAGAAGTAT GCAAAGCATG 3360 CATCTCAATT AGTCAGCAAC CAGGTGTGGA AAGTCCCCAG GCTCCCCAGC AGGCAGAAGT 3420 ATGCAAAGCA TGCATCTCAA TTAGTCAGCA ACCATAGTCC CGCCCCTAAC TCCGCCCATC 3480 CCGCCCCTAA CTCCGCCCAG TTCCGCCCAT TCTCCGCCCC ATGGCTGACT AATTTTTTTT 3540 ATTTATGCAG AGGCCGAGGC CGCCTCTGCC TCTGAGCTAT TCCAGAAGTA GTGAGGAGGC 3600 TTTTTTGGAG GCCTAGGCTT TTGCAAAAAG CTCCCGGGAG CTTGTATATC CATTTTCGGA 3660 TCTGATCAAG AGACAGGATG AGGATCGTTT CGCATGATTG AACAAGATGG ATTGCACGCA 3720 GGTTCTCCGG CCGCTTGGGT GGAGAGGCTA TTCGGCTATG ACTGGGCACA ACAGACAATC 3780 GGCTGCTCTG ATGCCGCCGT GTTCCGGCTG TCAGCGCAGG GGCGCCCGGT TCTTTTTGTC 3840 AAGACCGACC TGTCCGGTGC CCTGAATGAA CTGCAGGACG AGGCAGCGCG GCTATCGTGG 3900 CTGGCCACGA CGGGCGTTCC TTGCGCAGCT GTGCTCGACG TTGTCACTGA AGCGGGAAGG 3960 GACTGGCTGC TATTGGGCGA AGTGCCGGGG CAGGATCTCC TGTCATCTCA CCTTGCTCCT 4020 GCCGAGAAAG TATCCATCAT GGCTGATGCA ATGCGGCGGC TGCATACGCT TGATCCCGCT 4080 ACCTGCCCAT TCGACCACCA AGCGAAACAT CGCATCGAGC GAGCACGTAC TCGGATGGAA 4140 GCCGGTCTTG TCGATCAGGA TGATCTGGAC GAAGAGCATC AGGGGCTCGC GCCAGCCGAA 4200 CTGTTCGCCA GGCTCAAGGC GCGCATGCCC GACGGCGAGG ATCTCGTCGT GACCCATGGC 4260 GATGCCTGCT TGCCGAATAT CATGGTGGAA AATGGCCGCT TTTCTGGATT CATCGACTGT 4320 GGCCGGCTGG GTGTGGCGGA CCGCTATCAG GACATAGCGT TGGCTACCCG TGATATTGCT 4380 GAAGAGCTTG GCGGCGAATG GGCTGACCGC TTCCTCGTGC TTTACGGTAT CGCCGCTCCC 4440 GATTCGCAGC GCATCGCCTT CTATCGCCTT CTTGACGAGT TCTTCTGAGC GGGACTCTGG 4500 GGTTCGAAAT GACCGACCAA GCGACGCCCA ACCTGCCATC ACGAGATTTC GATTCCACCG 4560 CCGCCTTCTA TGAAAGGTTG GGCTTCGGAA TCGTTTTCCG GGACGCCGGC TGGATGATCC 4620 TCCAGCGCGG GGATCTCATG CTGGAGTTCT TCGCCCACCC CAACTTGTTT ATTGCAGCTT 4680 ATAATGGTTA CAAATAAAGC AATAGCATCA CAAATTTCAC AAATAAAGCA TTTTTTTCAC 4740 TGCATTCTAG TTGTGGTTTG TCCAAACTCA TCAATGTATC TTATCATGTC TGTATACCGT 4800 CGACCTCTAG CTAGAGCTTG GCGTAATCAT GGTCATAGCT GTTTCCTGTG TGAAATTGTT 4860 ATCCGCTCAC AATTCCACAC AACATACGAG CCGGAAGCAT AAAGTGTAAA GCCTGGGGTG 4920 CCTAATGAGT GAGCTAACTC ACATTAATTG CGTTGCGCTC ACTGCCCGCT TTCCAGTCGG 4980 GAAACCTGTC GTGCCAGCTG CATTAATGAA TCGGCCAACG CGCGGGGAGA GGCGGTTTGC 5040 GTATTGGGCG CTCTTCCGCT TCCTCGCTCA CTGACTCGCT GCGCTCGGTC GTTCGGCTGC 5100 GGCGAGCGGT ATCAGCTCAC TCAAAGGCGG TAATACGGTT ATCCACAGAA TCAGGGGATA 5160 ACGCAGGAAA GAACATGTGA GCAAAAGGCC AGCAAAAGGC CAGGAACCGT AAAAAGGCCG 5220 CGTTGCTGGC GTTTTTCCAT AGGCTCCGCC CCCCTGACGA GCATCACAAA AATCGACGCT 5280 CAAGTCAGAG GTGGCGAAAC CCGACAGGAC TATAAAGATA CCAGGCGTTT CCCCCTGGAA 5340 GCTCCCTCGT GCGCTCTCCT GTTCCGACCC TGCCGCTTAC CGGATACCTG TCCGCCTTTC 5400 TCCCTTCGGG AAGCGTGGCG CTTTCTCAAT GCTCACGCTG TAGGTATCTC AGTTCGGTGT 5460 AGGTCGTTCG CTCCAAGCTG GGCTGTGTGC ACGAACCCCC CGTTCAGCCC GACCGCTGCG 5520 CCTTATCCGG TAACTATCGT CTTGAGTCCA ACCCGGTAAG ACACGACTTA TCGCCACTGG 5580 CAGCAGCCAC TGGTAACAGG ATTAGCAGAG CGAGGTATGT AGGCGGTGCT ACAGAGTTCT 5640 TGAAGTGGTG GCCTAACTAC GGCTACACTA GAAGGACAGT ATTTGGTATC TGCGCTCTGC 5700 TGAAGCCAGT TACCTTCGGA AAAAGAGTTG GTAGCTCTTG ATCCGGCAAA CAAACCACCG 5760 CTGGTAGCGG TGGTTTTTTT GTTTGCAAGC AGCAGATTAC GCGCAGAAAA AAAGGATCTC 5820 AAGAAGATCC TTTGATCTTT TCTACGGGGT CTGACGCTCA GTGGAACGAA AACTCACGTT 5880 AAGGGATTTT GGTCATGAGA TTATCAAAAA GGATCTTCAC CTAGATCCTT TTAAATTAAA 5940 AATGAAGTTT TAAATCAATC TAAAGTATAT ATGAGTAAAC TTGGTCTGAC AGTTACCAAT 6000 GCTTAATCAG TGAGGCACCT ATCTCAGCGA TCTGTCTATT TCGTTCATCC ATAGTTGCCT 6060 GACTCCCCGT CGTGTAGATA ACTACGATAC GGGAGGGCTT ACCATCTGGC CCCAGTGCTG 6120 CAATGATACC GCGAGACCCA CGCTCACCGG CTCCAGATTT ATCAGCAATA AACCAGCCAG 6180 CCGGAAGGGC CGAGCGCAGA AGTGGTCCTG CAACTTTATC CGCCTCCATC CAGTCTATTA 6240 ATTGTTGCCG GGAAGCTAGA GTAAGTAGTT CGCCAGTTAA TAGTTTGCGC AACGTTGTTG 6300 CCATTGCTAC AGGCATCGTG GTGTCACGCT CGTCGTTTGG TATGGCTTCA TTCAGCTCCG 6360 GTTCCCAACG ATCAAGGCGA GTTACATGAT CCCCCATGTT GTGCAAAAAA GCGGTTAGCT 6420 CCTTCGGTCC TCCGATCGTT GTCAGAAGTA AGTTGGCCGC AGTGTTATCA CTCATGGTTA 6480 TGGCAGCACT GCATAATTCT CTTACTGTCA TGCCATCCGT AAGATGCTTT TCTGTGACTG 6540 GTGAGTACTC AACCAAGTCA TTCTGAGAAT AGTGTATGCG GCGACCGAGT TGCTCTTGCC 6600 CGGCGTCAAT ACGGGATAAT ACCGCGCCAC ATAGCAGAAC TTTAAAAGTG CTCATCATTG 6660 GAAAACGTTC TTCGGGGCGA AAACTCTCAA GGATCTTACC GCTGTTGAGA TCCAGTTCGA 6720 TGTAACCCAC TCGTGCACCC AACTGATCTT CAGCATCTTT TACTTTCACC AGCGTTTCTG 6780 GGTGAGCAAA AACAGGAAGG CAAAATGCCG CAAAAAAGGG AATAAGGGCG ACACGGAAAT 6840 GTTGAATACT CATACTCTTC CTTTTTCAAT ATTATTGAAG CATTTATCAG GGTTATTGTC 6900 TCATGAGCGG ATACATATTT GAATGTATTT AGAAAAATAA ACAAATAGGG GTTCCGCGCA 6960 CATTTCCCCG AAAAGTGCCA CCTGACGTCG ACGGATCGGG 7000 (2)SEQ ID NO:38的信息： (ⅰ)序列特征： (A)长度：7108个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅹⅰ)序列描述：SEQ ID NO:38: AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT TGTTCTCGTT 60 AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC GATGGACAAG TGCATTGTTC 120 TCTTGCTGAA AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC AGTACCCGGG 180 AGTACCCTCG ACCGCCGGAG TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT 240 TCAAACAAGC AAAGTGAACA CGTCGCTAAG CGAAAGCTAA GCAAATAAAC AAGCGCAGCT 300 GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA AAAGTAACCA 360 GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA GAAGTAATTA TTGAATACAA 420 GAAGAGAACT CTGAATACTT TCAACAAGTT ACCGAGAAAG AAGAACTCAC ACACAGCTAG 480 CGTTTAAACT TAAGCTTGGT ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGGAATTCGG 540 CTTGGGATGA CGCCTCCTCC GCCCGGACGT GCCGCCCCCA GCGCACCGCG CGCCCGCGTC 600 CCTGGCCCGC CGGCTCGGTT GGGGCTTCCG CTGCGGCTGC GGCTGCTGCT GCTGCTCTGG 660 GCGGCCGCCG CCTCCGCCCA GGGCCACCTA AGGAGCGGAC CCCGCATCTT CGCCGTCTGG 720 AAAGGCCATG TAGGGCAGGA CCGGGTGGAC TTTGGCCAGA CTGAGCCGCA CACGGTGCTT 780 TTCCACGAGC CAGGCAGCTC CTCTGTGTGG GTGGGAGGAC GTGGCAAGGT CTACCTCTTT 840 GACTTCCCCG AGGGCAAGAA CGCATCTGTG CGCACGGTGA ATATCGGCTC CACAAAGGGG 900 TCCTGTCTGG ATAAGCGGGA CTGCGAGAAC TACATCACTC TCCTGGAGAG GCGGAGTGAG 960 GGGCTGCTGG CCTGTGGCAC CAACGCCCGG CACCCCAGCT GCTGGAACCT GGTGAATGGC 1020 ACTGTGGTGC CACTTGGCGA GATGAGAGGC TACGCCCCCT TCAGCCCGGA CGAGAACTCC 1080 CTGGTTCTGT TTGAAGGGGA CGAGGTGTAT TCCACCATCC GGAAGCAGGA ATACAATGGG 1140 AAGATCCCTC GGTTCCGCCG CATCCGGGGC GAGAGTGAGC TGTACACCAG TGATACTGTC 1200 ATGCAGAACc CACAGTTCAT CAAAGCCACC ATCGTGCACC AAGACCAGGC TTACGATGAC 1260 AAGATCTACT ACTTCTTCCG AGAGGACAAT CCTGACAAGA ATCCTGAGGC TCCTCTCAAT 1320 GTGTCCCGTG TGGCCCAGTT GTGCAGGGGG GACCAGGGTG GGGAAAGTTC ACTGTCAGTC 1380 TCCAAGTGGA ACACTTTTCT GAAAGCCATG CTGGTATGCA GTGATGCTGC CACCAACAAG 1440 AACTTCAACA GGCTGCAAGA CGTCTTCCTG CTCCCTGACC CCAGCGGCCA GTGGAGGGAC 1500 ACCAGGGTCT ATGGTGTTTT CTCCAACcCC TGGAACTACT CAGCCGTCTG TGTGTATTCC 1560 CTCGGTGACA TTGACAAGGT CTTCCGTACC TCCTCACTCA AGGGCTACCA CTCAAGCCTT 1620 CCCAACCCGC GGCCTGGCAA GTGCCTCCCA GACCAGCAGC CGATACCCAC AGAGACCTTC 1680 CAGGTGGCTG ACCGTCACCC AGAGGTGGCG CAGAGGGTGG AGCCCATGGG GCCTCTGAAG 1740 ACGCCATTGT TCCACTCTAA ATACCACTAC CAGAAAGTGG CCGTTCACCG CATGCAAGCC 1800 AGCCACGGGG AGACCTTTCA TGTGCTTTAC CTAACTACAG ACAGGGGCAC TATCCACAAG 1860 GTGGTGGAAC CGGGGGAGCA GGAGCACAGC TTCGCCTTCA ACATCATGGA GATCCAGCCC 1920 TTCCGCCGCG CGGCTGCCAT CCAGACCATG TCGCTGGATG CTGAGCGGAG GAAGCTGTAT 1980 GTGAGCTCCC AGTGGGAGGT GAGCCAGGTG CCCCTGGACC TGTGTGAGGT CTATGGCGGG 2040 GGCTGCCACG GTTGCCTCAT GTCCCGAGAC CCCTACTGCG GCTGGGACCA GGGCCGCTGC 2100 ATCTCCATCT ACAGCTCCGA ACGGTCAGTG CTGCAATCCA TTAATCCAGC CGAGCCACAC 2160 AAGGAGTGTC CCAACCCCAA ACCAGACAAG GCCCCACTGC AGAAGGTTTC CCTGGCCCCA 2220 AACTCTCGCT ACTACCTGAG CTGCCCCATG GAATCCCGCC ACGCCACCTA CTCATGGCGC 2280 CACAAGGAGA ACGTGGAGCA GAGCTGCGAA CCTGGTCACC AGAGCCCCAA CTGCATCCTG 2340 TTCATCGAGA ACCTCACGGC GCAGCAGTAC GGCCACTACT TCTGCGAGGC CCAGGAGGGC 2400 TCCTACTTCC GCGAGGCTCA GCACTGGCAG CTGCTGCCCG AGGACGGCAT CATGGCCGAG 2460 CACCTGCTGG GTCATGCCTG TGCCCTGGCT GCCTCCCTCT GGCTGGGGGT GCTGCCCACA 2520 CTCACTCTTG GCTTGCTGGT CCACGTGAAG CTTGGGCCCG AACAAAAACT CATCTCAGAA 2580 GAGGATCTGA ATAGCGCCGT CGACCATCAT CATCATCATC ATTGAGTTTA TCCAGCACAG 2640 TGGCGGCCGC TCGAGTCTAG AGGGCCCGTT TAAACCCGCT GATCAGCCTC GACTGTGCCT 2700 TCTAGTTGCC AGCCATCTGT TGTTTGCCCC TCCCCCGTGC CTTCCTTGAC CCTGGAAGGT 2760 GCCACTCCCA CTGTCCTTTC CTAATAAAAT GAGGAAATTG CATCGCATTG TCTGAGTAGG 2820 TGTCATTCTA TTCTGGGGGG TGGGGTGGGG CAGGACAGCA AGGGGGAGGA TTGGGAAGAC 2880 AATAGCAGGC ATGCTGGGGA TGCGGTGGGC TCTATGGCTT CTGAGGCGGA AAGAACCAGC 2940 TGGGGCTCTA GGGGGTATCC CCACGCGCCC TGTAGCGGCG CATTAAGCGC GGCGGGTGTG 3000 GTGGTTACGC GCAGCGTGAC CGCTACACTT GCCAGCGCCC TAGCGCCCGC TCCTTTCGCT 3060 TTCTTCCCTT CCTTTCTCGC CACGTTCGCC GGCTTTCCCC GTCAAGCTCT AAATCGGGGC 3120 ATCCCTTTAG GGTTCCGATT TAGTGCTTTA CGGCACCTCG ACCCCAAAAA ACTTGATTAG 3180 GGTGATGGTT CACGTAGTGG GCCATCGCCC TGATAGACGG TTTTTCGCCC TTTGACGTTG 3240 GAGTCCACGT TCTTTAATAG TGGACTCTTG TTCCAAACTG GAACAACACT CAACCCTATC 3300 TCGGTCTATT CTTTTGATTT ATAAGGGATT TTGGGGATTT CGGCCTATTG GTTAAAAAAT 3360 GAGCTGATTT AACAAAAATT TAACGCGAAT TAATTCTGTG GAATGTGTGT CAGTTAGGGT 3420 GTGGAAAGTC CCCAGGCTCC CCAGGCAGGC AGAAGTATGC AAAGCATGCA TCTCAATTAG 3480 TCAGCAACCA GGTGTGGAAA GTCCCCAGGC TCCCCAGCAG GCAGAAGTAT GCAAAGCATG 3540 CATCTCAATT AGTCAGCAAC CATAGTCCCG CCCCTAACTC CGCCCATCCC GCCCCTAACT 3600 CCGCCCAGTT CCGCCCATTC TCCGCCCCAT GGCTGACTAA TTTTTTTTAT TTATGCAGAG 3660 GCCGAGGCCG CCTCTGCCTC TGAGCTATTC CAGAAGTAGT GAGGAGGCTT TTTTGGAGGC 3720 CTAGGCTTTT GCAAAAAGCT CCCGGGAGCT TGTATATCCA TTTTCGGATC TGATCAAGAG 3780 ACAGGATGAG GATCGTTTCG CATGATTGAA CAAGATGGAT TGCACGCAGG TTCTCCGGCC 3840 GCTTGGGTGG AGAGGCTATT CGGCTATGAC TGGGCACAAC AGACAATCGG CTGCTCTGAT 3900 GCCGCCGTGT TCCGGCTGTC AGCGCAGGGG CGCCCGGTTC TTTTTGTCAA GACCGACCTG 3960 TCCGGTGCCC TGAATGAACT GCAGGACGAG GCAGCGCGGC TATCGTGGCT GGCCACGACG 4020 GGCGTTCCTT GCGCAGCTGT GCTCGACGTT GTCACTGAAG CGGGAAGGGA CTGGCTGCTA 4080 TTGGGCGAAG TGCCGGGGCA GGATCTCCTG TCATCTCACC TTGCTCCTGC CGAGAAAGTA 4140 TCCATCATGG CTGATGCAAT GCGGCGGCTG CATACGCTTG ATCCGGCTAC CTGCCCATTC 4200 GACCACCAAG CGAAACATCG CATCGAGCGA GCACGTACTC GGATGGAAGC CGGTCTTGTC 4260 GATCAGGATG ATCTGGACGA AGAGCATCAG GGGCTCGCGC CAGCCGAACT GTTCGCCAGG 4320 CTCAAGGCGC GCATGCCCGA CGGCGAGGAT CTCGTCGTGA CCCATGGCGA TGCCTGCTTG 4380 CCGAATATCA TGGTGGAAAA TGGCCGCTTT TCTGGATTCA TCGACTGTGG CCGGCTGGGT 4440 GTGGCGGACC GCTATCAGGA CATAGCGTTG GCTACCCGTG ATATTGCTGA AGAGCTTGGC 4500 GGCGAATGGG CTGACCGCTT CCTCGTGCTT TACGGTATCG CCGCTCCCGA TTCGCAGCGC 4560 ATCGCCTTCT ATCGCCTTCT TGACGAGTTC TTCTGAGCGG GACTCTGGGG TTCGAAATGA 4620 CCGACCAAGC GACGCCCAAC CTGCCATCAC GAGATTTCGA TTCCACCGCC GCCTTCTATG 4680 AAAGGTTGGG CTTCGGAATC GTTTTCCGGG ACGCCGGCTG GATGATCCTC CAGCGCGGGG 4740 ATCTCATGCT GGAGTTCTTC GCCCACCCCA ACTTGTTTAT TGCAGCTTAT AATGGTTACA 4800 AATAAAGCAA TAGCATCACA AATTTCACAA ATAAAGCATT TTTTTCACTG CATTCTAGTT 4860 GTGGTTTGTC CAAACTCATC AATGTATCTT ATCATGTCTG TATACCGTCG ACCTCTAGCT 4920 AGAGCTTGGC GTAATCATGG TCATAGCTGT TTCCTGTGTG AAATTGTTAT CCGCTCACAA 4980 TTCCACACAA CATACGAGCC GGAAGCATAA AGTGTAAAGC CTGGGGTGCC TAATGAGTGA 5040 GCTAACTCAC ATTAATTGCG TTGCGCTCAC TGCCCGCTTT CCAGTCGGGA AACCTGTCGT 5100 GCCAGCTGCA TTAATGAATC GGCCAACGCG CGGGGAGAGG CGGTTTGCGT ATTGGGCGCT 5160 CTTCCGCTTC CTCGCTCACT GACTCGCTGC GCTCGGTCGT TCGGCTGCGG CGAGCGGTAT 5220 CAGCTCACTC AAAGGCGGTA ATACGGTTAT CCACAGAATC AGGGGATAAC GCAGGAAAGA 5280 ACATGTGAGC AAAAGGCCAG CAAAAGGCCA GGAACCGTAA AAAGGCCGCG TTGCTGGCGT 5340 TTTTCCATAG GCTCCGCCCC CCTGACGAGC ATCACAAAAA TCGACGCTCA AGTCAGAGGT 5400 GGCGAAACCC GACAGGACTA TAAAGATACC AGGCGTTTCC CCCTGGAAGC TCCCTCGTGC 5460 GCTCTCCTGT TCCGACCCTG CCGCTTACCG GATACCTGTC CGCCTTTCTC CCTTCGGGAA 5520 GCGTGGCGCT TTCTCAATGC TCACGCTGTA GGTATCTCAG TTCGGTGTAG GTCGTTCGCT 5580 CCAAGCTGGG CTGTGTGCAC GAACCCCCCG TTCAGCCCGA CCGCTGCGCC TTATCCGGTA 5640 ACTATCGTCT TGAGTCCAAC CCGGTAAGAC ACGACTTATC GCCACTGGCA GCAGCCACTG 5700 GTAACAGGAT TAGCAGAGCG AGGTATGTAG GCGGTGCTAC AGAGTTCTTG AAGTGGTGGC 5760 CTAACTACGG CTACACTAGA AGGACAGTAT TTGGTATCTG CGCTCTGCTG AAGCCAGTTA 5820 CCTTCGGAAA AAGAGTTGGT AGCTCTTGAT CCGGCAAACA AACCACCGCT GGTAGCGGTG 5880 GTTTTTTTGT TTGCAAGCAG CAGATTACGC GCAGAAAAAA AGGATCTCAA GAAGATCCTT 5940 TGATCTTTTC TACGGGGTCT GACGCTCAGT GGAACGAAAA CTCACGTTAA GGGATTTTGG 6000 TCATGAGATT ATCAAAAAGG ATCTTCACCT AGATCCTTTT AAATTAAAAA TGAAGTTTTA 6060 AATCAATCTA AAGTATATAT GAGTAAACTT GGTCTGACAG TTACCAATGC TTAATCAGTG 6120 AGGCACCTAT CTCAGCGATC TGTCTATTTC GTTCATCCAT AGTTGCCTGA CTCCCCGTCG 6180 TGTAGATAAC TACGATACGG GAGGGCTTAC CATCTGGCCC CAGTGCTGCA ATGATACCGC 6240 GAGACCCACG CTCACCGGCT CCAGATTTAT CAGCAATAAA CCAGCCAGCC GGAAGGGCCG 6300 AGCGCAGAAG TGGTCCTGCA ACTTTATCCG CCTCCATCCA GTCTATTAAT TGTTGCCGGG 6360 AAGCTAGAGT AAGTAGTTCG CCAGTTAATA GTTTGCGCAA CGTTGTTGCC ATTGCTACAG 6420 GCATCGTGGT GTCACGCTCG TCGTTTGGTA TGGCTTCATT CAGCTCCGGT TCCCAACGAT 6480 CAAGGCGAGT TACATGATCC CCCATGTTGT GCAAAAAAGC GGTTAGCTCC TTCGGTCCTC 6540 CGATCGTTGT CAGAAGTAAG TTGGCCGCAG TGTTATCACT CATGGTTATG GCAGCACTGC 6600 ATAATTCTCT TACTGTCATG CCATCCGTAA GATGCTTTTC TGTGACTGGT GAGTACTCAA 6660 CCAAGTCATT CTGAGAATAG TGTATGCGGC GACCGAGTTG CTCTTGCCCG GCGTCAATAC 6720 GGGATAATAC CGCGCCACAT AGCAGAACTT TAAAAGTGCT CATCATTGGA AAACGTTCTT 6780 CGGGGCGAAA ACTCTCAAGG ATCTTACCGC TGTTGAGATC CAGTTCGATG TAACCCACTC 6840 GTGCACCCAA CTGATCTTCA GCATCTTTTA CTTTCACCAG CGTTTCTGGG TGAGCAAAAA 6900 CAGGAAGGCA AAATGCCGCA AAAAAGGGAA TAAGGGCGAC ACGGAAATGT TGAATACTCA 6960 TACTCTTCCT TTTTCAATAT TATTGAAGCA TTTATCAGGG TTATTGTCTC ATGAGCGGAT 7020 ACATATTTGA ATGTATTTAG AAAAATAAAC AAATAGGGGT TCCGCGCACA TTTCCCCGAA 7080 AAGTGCCACC TGACGTCGAC GGATCGGG 7108 (2)SEQ ID NO:39的信息： (ⅰ)序列特征： (A)长度：4019个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..4019 (ⅹⅰ)序列描述：SEQ ID NO:39: CTCGAGAAAT CATAAAAAAT TTATTTGCTT TGTGAGCGGA TAACAATTAT AATAGATTCA 60 ATTGTGAGCG GATAACAATT TCACACAGAA TTCATTAAAG AGGAGAAATT AACTATGAGA 120 GGATCGCATC ACCATCACCA TCACGGATCC CTGGTTCTGT TTGAAGGGGA CGAGGTGTAT 180 TCCACCATCC GGAAGCAGGA ATACAATGGG AAGATCCCTC GGTTCCGCCG CATCCGGGGC 240 GAGAGTGAGC TGTACACCAG TGATACTGTC ATGCAGAACC CACAGTTCAT CAAAGCCACC 300 ATCGTGCACC AAGACCAGGC TTACGATGAC AAGATCTACT ACTTCTTCCG AGAGGACAAT 360 CCTGACAAGA ATCCTGAGGC TCCTCTCAAT GTGTCCCGTG TGGCCCAGTT GTGCAGGGGG 420 GACCAGGGTG GGGAAAGTTC ACTGTCAGTC TCCAAGTGGA ACACTTTTCT GAAAGCCATG 480 CTGGTATGCA GTGATGCTGC CACCAACAAG AACTTCAACA GGCTGCAAGA CGTCTTCCTG 540 CTCCCTGACC CCAGCGGCCA GTGGAGGGAC ACCAGGGTCT ATGGTGTTTT CTCCAACCCC 600 TGGAACTACT CAGCCGTCTG TGTGTATTCC CTCGGTGACA TTGACAAGGT CTTCCGTACC 660 TCCTCACTCA AGGGCTACCA CTCAAGCCTT CCCAACCCGC GGCCTGGCAA GTGCCTCCCA 720 GACCAGCAGC CGATACCCAC AGAAAGCTTA ATTAGCTGAG CTTGGACTCC TGTTGATAGA 780 TCCAGTAATG ACCTCAGAAC TCCATCTGGA TTTGTTCAGA ACGCTCGGTT GCCGCCGGGC 840 GTTTTTTATT GGTGAGAATC CAAGCTAGCT TGGCGAGATT TTCAGGAGCT AAGGAAGCTA 900 AAATGGAGAA AAAAATCACT GGATATACCA CCGTTGATAT ATCCCAATGG CATCGTAAAG 960 AACATTTTGA GGCATTTCAG TCAGTTGCTC AATGTACCTA TAACCAGACC GTTCAGCTGG 1020 ATATTACGGC CTTTTTAAAG ACCGTAAAGA AAAATAAGCA CAAGTTTTAT CCGGCCTTTA 1080 TTCACATTCT TGCCCGCCTG ATGAATGCTC ATCCGGAATT TCGTATGGCA ATGAAAGACG 1140 GTGAGCTGGT GATATGGGAT AGTGTTCACC CTTGTTACAC CGTTTTCCAT GAGCAAACTG 1200 AAACGTTTTC ATCGCTCTGG AGTGAATACC ACGACGATTT CCGGCAGTTT CTACACATAT 1260 ATTCGCAAGA TGTGGCGTGT TACGGTGAAA ACCTGGCCTA TTTCCCTAAA GGGTTTATTG 1320 AGAATATGTT TTTCGTCTCA GCCAATCCCT GGGTGAGTTT CACCAGTTTT GATTTAAACG 1380 TGGCCAATAT GGACAACTTC TTCGCCCCCG TTTTCACCAT GGGCAAATAT TATACGCAAG 1440 GCGACAAGGT GCTGATGCCG CTGGCGATTC AGGTTCATCA TGCCGTCTGT GATGGCTTCC 1500 ATGTCGGCAG AATGCTTAAT GAATTACAAC AGTACTGCGA TGAGTGGCAG GGCGGGGCGT 1560 AATTTTTTTA AGGCAGTTAT TGGTGCCCTT AAACGCCTGG GGTAATGACT CTCTAGCTTG 1620 AGGCATCAAA TAAAACGAAA GGGTCAGTCG AAAGACTGGG CCTTTCGTTT TATCTGTTGT 1680 TTGTCGGTGA ACGCTCTCCT GAGTAGGACA AATCCGCCGC TCTAGAGCTG CCTCGCGCGT 1740 TTCGGTGATG ACGGTGAAAA CCTCTGACAC ATGCAGCTCC CGGAGACGGT CACAGCTTGT 1800 CTGTAAGCGG ATGCCGGGAG CAGACAAGCC CGTCAGGGCG CGTCAGCGGG TGTTGGCGGG 1860 TGTCGGGGCG CAGCCATGAC CCAGTCACGT AGCGATAGCG GAGTGTATAC TGGCTTAACT 1920 ATGCGGCATC AGAGCAGATT GTACTGAGAG TGCACCATAT GCGGTGTGAA ATACCGCACA 1980 GATGCGTAAG GAGAAAATAC CGCATCAGGC GCTCTTCCGC TTCCTCGCTC ACTGACTCGC 2040 TGCGCTCGGT CTGTCGGCTG CGGCGAGCGG TATCAGCTCA CTCAAAGGCG GTAATACGGT 2100 TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG AGCAAAAGGC CAGCAAAAGG 2160 CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC CCCCCTGACG 2220 AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA CCCGACAGGA CTATAAAGAT 2280 ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC TGTTCCGACC CTGCCGCTTA 2340 CCGGATACCT GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC GCTTTCTCAA TGCTCACGCT 2400 GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG CACGAACCCC 2460 CCGTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG TCTTGAGTCC AACCCGGTAA 2520 GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG GATTAGCAGA GCGAGGTATG 2580 TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA CGGCTACACT AGAAGGACAG 2640 TATTTGGTAT CTGCGCTCTG CTGAAGCCAG TTACCTTCGG AAAAAGAGTT GGTAGCTCTT 2700 GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG CAGCAGATTA 2760 CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT TTCTACGGGG TCTGACGCTC 2820 AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG ATTATCAAAA AGGATCTTCA 2880 CCTAGATCCT TTTAAATTAA AAATGAAGTT TTAAATCAAT CTAAAGTATA TATGAGTAAA 2940 CTTGGTCTGA CAGTTACCAA TGCTTAATCA GTGAGGCACC TATCTCAGCG ATCTGTCTAT 3000 TTCGTTCATC CATAGCTGCC TGACTCCCCG TCGTGTAGAT AACTACGATA CGGGAGGGCT 3060 TACCATCTGG CCCCAGTGCT GCAATGATAC CGCGAGACCC ACGCTCACCG GCTCCAGATT 3120 TATCAGCAAT AAACCAGCCA GCCGGAAGGG CCGAGCGCAG AAGTGGTCCT GCAACTTTAT 3180 CCGCCTCCAT CCAGTCTATT AATTGTTGCC GGGAAGCTAG AGTAAGTAGT TCGCCAGTTA 3240 ATAGTTTGCG CAACGTTGTT GCCATTGCTA CAGGCATCGT GGTGTCACGC TCGTCGTTTG 3300 GTATGGCTTC ATTCAGCTCC GGTTCCCAAC GATCAAGGCG AGTTACATGA TCCCCCATGT 3360 TGTGCAAAAA AGCGGTTAGC TCCTTCGGTC CTCCGATCGT TGTCAGAAGT AAGTTGGCCG 3420 CAGTGTTATC ACTCATGGTT ATGGCAGCAC TGCATAATTC TCTTACTGTC ATGCCATCCG 3480 TAAGATGCTT TTCTGTGACT GGTGAGTACT CAACCAAGTC ATTCTGAGAA TAGTGTATGC 3540 GGCGACCGAG TTGCTCTTGC CCGGCGTCAA TACGGGATAA TACCGCGCCA CATAGCAGAA 3600 CTTTAAAAGT GCTCATCATT GGAAAACGTT CTTCGGGGCG AAAACTCTCA AGGATCTTAC 3660 CGCTGTTGAG ATCCAGTTCG ATGTAACCCA CTCGTGCACC CAACTGATCT TCAGCATCTT 3720 TTACTTTCAC CAGCGTTTCT GGGTGAGCAA AAACAGGAAG GCAAAATGCC GCAAAAAAGG 3780 GAATAAGGGC GACACGGAAA TGTTGAATAC TCATACTCTT CCTTTTTCAA TATTATTGAA 3840 GCATTTATCA GGGTTATTGT CTCATGAGCG GATACATATT TGAATGTATT TAGAAAAATA 3900 AACAAATAGG GGTTCCGCGC ACATTTCCCC GAAAAGTGCC ACCTGACGTC TAAGAAACCA 3960 TTATTATCAT GACATTAACC TATAAAAATA GGCGTATCAC GAGGCCCTTT CGTCTTCAC 4019 (2)SEQ ID NO:40的信息： (ⅰ)序列特征： (A)长度：3999个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..3999 (ⅹⅰ)序列描述：SEQ ID NO:40: CTCGAGAAAT CATAAAAAAT TTATTTGCTT TGTGAGCGGA TAACAATTAT AATAGATTCA 60 ATTGTGAGCG GATAACAATT TCACACAGAA TTCATTAAAG AGGAGAAATT AACTATGAGA 120 GGATCGCATC ACCATCACCA TCACACGGAT CCGCATGCGA GCTCCCAGTG GGAGGTGAGC 180 CAGGTGCCCC TGGACCTGTG TGAGGTCTAT GGCGGGGGCT GCCACGGTTG CCTCATGTCC 240 CGAGACCCCT ACTGCGGCTG GGACCAGGGC CGCTGCATCT CCATCTACAG CTCCGAACGG 300 TCAGTGCTGC AATCCATTAA TCCAGCCGAG CCACACAAGG AGTGTCCCAA CCCCAAACCA 360 GACAAGGCCC CACTGCAGAA GGTTTCCCTG GCCCCAAACT CTCGCTACTA CCTGAGCTGC 420 CCCATGGAAT CCCGCCACGC CACCTACTCA TGGCGCCACA AGGAGAACGT GGAGCAGAGC 480 TGCGAACCTG GTCACCAGAG CCCCAACTGC ATCCTGTTCA TCGAGAACCT CACGGCGCAG 540 CAGTACGGCC ACTACTTCTG CGAGGCCCAG GAGGGCTCCT ACTTCCGCGA GGCTCAGCAC 600 TGGCAGCTGC TGCCCGAGGA CGGCATCATG GCCGAGCACC TGCTGGGTCA TGCCTGTGCC 660 CTGGCTGCCT CCCTCTGGCT GGGGGTGCTG CCCACACTCA CTCTTGGCTT GCTGGTCCAC 720 GTGAAGCTTA ATTAGCTGAG CTTGGACTCC TGTTGATAGA TCCAGTAATG ACCTCAGAAC 780 TCCATCTGGA TTTGTTCAGA ACGCTCGGTT GCCGCCGGGC GTTTTTTATT GGTGAGAATC 840 CAAGCTAGCT TGGCGAGATT TTCAGGAGCT AAGGAAGCTA AAATGGAGAA AAAAATCACT 900 GGATATACCA CCGTTGATAT ATCCCAATGG CATCGTAAAG AACATTTTGA GGCATTTCAG 960 TCAGTTGCTC AATGTACCTA TAACCAGACC GTTCAGCTGG ATATTACGGC CTTTTTAAAG 1020 ACCGTAAAGA AAAATAAGCA CAAGTTTTAT CCGGCCTTTA TTCACATTCT TGCCCGCCTG 1080 ATGAATGCTC ATCCGGAATT TCGTATGGCA ATGAAAGACG GTGAGCTGGT GATATGGGAT 1140 AGTGTTCACC CTTGTTACAC CGTTTTCCAT GAGCAAACTG AAACGTTTTC ATCGCTCTGG 1200 AGTGAATACC ACGACGATTT CCGGCAGTTT CTACACATAT ATTCGCAAGA TGTGGCGTGT 1260 TACGGTGAAA ACCTGGCCTA TTTCCCTAAA GGGTTTATTG AGAATATGTT TTTCGTCTCA 1320 GCCAATCCCT GGGTGAGTTT CACCAGTTTT GATTTAAACG TGGCCAATAT GGACAACTTC 1380 TTCGCCCCCG TTTTCACCAT GGGCAAATAT TATACGCAAG GCGACAAGGT GCTGATGCCG 1440 CTGGCGATTG AGGTTCATCA TGCCGTCTGT GATGGCTTCC ATGTCGGCAG AATGCTTAAT 1500 GAATTACAAC AGTACTGCGA TGAGTGGCAG GGCGGGGCGT AATTTTTTTA AGGCAGTTAT 1560 TGGTGCCCTT AAACGCCTGG GGTAATGACT CTCTAGCTTG AGGCATCAAA TAAAACGAAA 1620 GGCTCAGTCG AAAGACTGGG CCTTTCGTTT TATCTGTTGT TTGTCGGTGA ACGCTCTCCT 1680 GAGTAGGACA AATCCGCCGC TCTAGAGCTG CCTCGCGCGT TTCGGTGATG ACGGTGAAAA 1740 CCTCTGACAC ATGCAGCTCC CGGAGACGGT CACAGCTTGT CTGTAAGCGG ATGCCGGGAG 1800 CAGACAAGCC CGTCAGGGCG CGTCAGCGGG TGTTGGCGGG TGTCGGGGCG CAGCCATGAC 1860 CCAGTCACGT AGCGATAGCG GAGTGTATAC TGGCTTAACT ATGCGGCATC AGAGCAGATT 1920 GTACTGAGAG TGCACCATAT GCGGTGTGAA ATACCGCACA GATGCGTAAG GAGAAAATAC 1980 CGCATCAGGC GCTCTTCCGC TTCCTCGCTC ACTGACTCGC TGCGCTCGGT CTGTCGGCTG 2040 CGGCGAGCGG TATCAGCTCA CTCAAAGGCG GTAATACGGT TATCCACAGA ATCAGGGGAT 2100 AACGCAGGAA AGAACATGTG AGCAAAAGGC CAGCAAAAGG CCAGGAACCG TAAAAAGGCC 2160 GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC CCCCCTGACG AGCATCACAA AAATCGACGC 2220 TCAAGTCAGA GGTGGCGAAA CCCGACAGGA CTATAAAGAT ACCAGGCGTT TCCCCCTGGA 2280 AGCTCCCTCG TGCGCTCTCC TGTTCCGACC CTGCCGCTTA CCGGATACCT GTCCGCCTTT 2340 CTCCCTTCGG GAAGCGTGGC GCTTTCTCAA TGCTCACGCT GTAGGTATCT CAGTTCGGTG 2400 TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG CACGAACCCC CCGTTCAGCC CGACCGCTGC 2460 GCCTTATCCG GTAACTATCG TCTTGAGTCC AACCCGGTAA GACACGACTT ATCGCCACTG 2520 GCAGCAGCCA CTGGTAACAG GATTAGCAGA GCGAGGTATG TAGGCGGTGC TACAGAGTTC 2580 TTGAAGTGGT GGCCTAACTA CGGCTACACT AGAAGGACAG TATTTGGTAT CTGCGCTCTG 2640 CTGAAGCCAG TTACCTTCGG AAAAAGAGTT GGTAGCTCTT GATCCGGCAA ACAAACCACC 2700 GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG CAGCAGATTA CGCGCAGAAA AAAAGGATCT 2760 CAAGAAGATC CTTTGATCTT TTCTACGGGG TCTGACGCTC AGTGGAACGA AAACTCACGT 2820 TAAGGGATTT TGGTCATGAG ATTATCAAAA AGGATCTTCA CCTAGATCCT TTTAAATTAA 2880 AAATGAAGTT TTAAATCAAT CTAAAGTATA TATGAGTAAA CTTGGTCTGA CAGTTACCAA 2940 TGCTTAATCA GTGAGGCACC TATCTCAGCG ATCTGTCTAT TTCGTTCATC CATAGCTGCC 3000 TGACTCCCCG TCGTGTAGAT AACTACGATA CGGGAGGGCT TACCATCTGG CCCCAGTGCT 3060 GCAATGATAC CGCGAGACCC ACGCTCACCG GCTCCAGATT TATCAGCAAT AAACCAGCCA 3120 GCCGGAAGGG CCGAGCGCAG AAGTGGTCCT GCAACTTTAT CCGCCTCCAT CCAGTCTATT 3180 AATTGTTGCC GGGAAGCTAG AGTAAGTAGT TCGCCAGTTA ATAGTTTGCG CAACGTTGTT 3240 GCCATTGCTA CAGGCATCGT GGTGTCACGC TCGTCGTTTG GTATGGCTTC ATTCAGCTCC 3300 GGTTCCCAAC GATCAAGGCG AGTTACATGA TCCCCCATGT TGTGCAAAAA AGCGGTTAGC 3360 TCCTTCGGTC CTCCGATCGT TGTCAGAAGT AAGTTGGCCG CAGTGTTATC ACTCATGGTT 3420 ATGGCAGCAC TGCATAATTC TCTTACTGTC ATGCCATCCG TAAGATGCTT TTCTGTGACT 3480 GGTGAGTACT CAACCAAGTC ATTCTGAGAA TAGTGTATGC GGCGACCGAG TTGCTCTTGC 3540 CCGGCGTCAA TACGGGATAA TACCGCGCCA CATAGCAGAA CTTTAAAAGT GCTCATCATT 3600 GGAAAACGTT CTTCGGGGCG AAAACTCTCA AGGATCTTAC CGCTGTTGAG ATCCAGTTCG 3660 ATGTAACCCA CTCGTGCACC CAACTGATCT TCAGCATCTT TTACTTTCAC CAGCGTTTCT 3720 GGGTGAGCAA AAACAGGAAG GCAAAATGCC GCAAAAAAGG GAATAAGGGC GACACGGAAA 3780 TGTTGAATAC TCATACTCTT CCTTTTTCAA TATTATTGAA GCATTTATCA GGGTTATTGT 3840 CTCATGAGCG GATACATATT TGAATGTATT TAGAAAAATA AACAAATAGG GGTTCCGCGC 3900 ACATTTCCCC GAAAAGTGCC ACCTGACGTC TAAGAAACCA TTATTATCAT GACATTAACC 3960 TATAAAAATA GGCGTATCAC GAGGCCCTTT CGTCTTCAC 3999 (2)SEQ ID NO:41的信息： (ⅰ)序列特征： (A)长度：8888个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：DNA(基因组的) (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..8888 (ⅹⅰ)序列描述：SEQ ID NO:41: GAGCCGCACA CGGTGCTTTT CCACGAGCCA GGCAGCTCCT CTGTGTGGGT GGGAGGACGT 60 GGCAAGGTCT ACCTCTTTGA CTTCCCCGAG GGCAAGAACG CATCTGTGCG CACGGTGAGC 120 CTCTCTCTTC CCCCAACACC CCCCCTACCC TCTTATCTCC CCTCTGGCCC TGCCAAGGGT 180 CCTCAGGGAA TCCGACGGAG CTGGCTTCTC TTCCTAAACT GCCCCCACCT CCGTATCCTA 240 TAAATGGCTC CTGGGGGAGG CTCCCTAAAG GTAGTCCAGA TTGGAGTGGG GAGCTGCGGC 300 GGTGTGGAGA AAAACAGGAG CTAATGGGCC TGGCCAGCTG GGCAGCGCTG CTGCGGAAAG 360 CCCAGGCTGG AAGCTGGGCC CCAGAGCCCA TGCCTGGTCT TCTGAACCCT CTGGGCCTCA 420 GCTCTGGATA TGAGACCCTG TTTGACCTCA GGTAGATCAC TCACCCTCTC AGAGCCCCAG 480 TTGCTCATCT GTCAGATGAG AATAATGGTT GCTTCCTTTG GGGCTTATCC TGAGGCTGTG 540 TGGAAAGCAT TTCAGGGGTA CCTCACCCCT GGCAGATTGA ACTAATGCTT CTCCCCTTCC 600 CCAGGTGAAT ATCGGCTCCA CAAAGGGGTC CTGTCTGGAT AAGCGGGTGA GCGGGCGAGG 660 GATCTGGAGG GGTCTGAGCC ACTTGGTAAA GGGAGAGGAG ACCCTGAGGG TCTAAGGAAG 720 GAAGCATGGC CCTGCCCCAC GAGTCCCAGA CTGATGGGGA GACGTGGTCC TCTGTGCTTA 780 GGGGATGGCG TCAGCTGCAC ACACTCTGGG CTGTCCCGGG AGGCTGTCAC CTATGCTAAG 840 CCCTTCTGAC ACCTTCTTCC CTGATCCTGG GGGTCCTAGT GCTAGGCTTG CCAGGGCCTT 900 CCAGCAACCA ATTTCTCTCC TCCCTTCTCT CTTCCCCGGG CAGGACTGCG AGAACTACAT 960 CACTCTCCTG GAGAGGCGGA GTGAGGGGCT GCTGGCCTGT GGCACCAACG CCCGGCACCC 1020 CAGCTGCTGG AACCTGGTGA GAAGGCTGCT CCCCATGTGC CTGATCAGCT CACCTTCTAC 1080 TGCGTGGGCT TCTGCCCCTC ATGGTGGGAA GGAGATGGCG AGACTCCAAT GCTGGCCTTG 1140 CCCTGGGAGG ATGGGGCTCC TGGCCGAGAA ACTGGCCGTC ATGGGAGGCA GTGGCTGTGG 1200 GATTATGTGG CCATCCAACC CTCTGGATCT CCCACAGGTG AATGGCACTG TGGTGCCACT 1260 TGGCGAGATG AGAGGCTACG CCCCCTTCAG CCCGGACGAG AACTCCCTGG TTCTGTTTGA 1320 AGGTTGGGGC ATGCTTCGGA ACTGGGCTGG GAGCAGGATG GTCAGCTCTT TGTCCAGTGT 1380 CCGGAGGAGG GACTTCCAGG AGCTGCCTGC CCTTACTCAT TTCTCCCTCC CACTGACCCC 1440 AGGGGACGAG GTGTATTCCA CCATCCGGAA CCAGGAATAC AATGGGAAGA TCCCTCGGTT 1500 CCGCCGCATC CGGGGCGAGA GTGAGCTGTA CACCAGTGAT ACTGTCATGC AGAGTGAGTC 1560 AGGCTCCGGC TGGGCTGAGG GTGGGCAAGG GGGTGTGAGC ACTTAAGGTG GCAGATGGGA 1620 TCCTGATGTT TCTGGGAGGG CTCCCTGAGG GCCGCTGGGG CCATGCAGGA AAGCAGGACC 1680 TTGGTATAGG CCTGAGAAGT TAGGGTTGGC TGGGAGCAGA GGAACAGACA AGGTATAGCA 1740 GTGGGATGGG CCCAGCCCTC TTCAGGAACA CAAACAGAGG GAGCCCCAGA CCCAGTGCAG 1800 GGTCCCCAGG AGCCAAAGTT TATCCTCTGC TGAGTTCACG TGGAGGCAGC CCCCCAACTC 1860 CCTCCTCATC AGGGCTCTGC CAATTGAGCA GAAGTGACAT AGGGGCCCCC AGGGACCTTC 1920 CCCCACTCCC CAGGCATGAA GTCATTGCTC CTGGGCCGAT GACATCTTTG TAGGAAGAGG 1980 GCAAAACAGG TGTGGGGTGG AGGTGCAGGG TCTAGGGCCC CTCGGGGAGT TGGACCTGAT 2040 GTTATGAGTC CTATTCCAGA TCTGATTTGC CATGGTTTGT GCAGACCCGA AGGAGGGAGG 2100 AGAGTGTGCA GGGTTGGAAT GGTCTCCCGG GCAAGCTTCC CAGCCTTACG CCCATTCGCT 2160 TCTGTGCCCT GGCAGACCCA CAGTTCATCA AAGCCACCAT CGTGCACCAA GACCAGGCTT 2220 ACGATGACAA GATCTACTAC TTCTTCCGAG AGGACAATCC TGACAAGAAT CCTGAGGCTC 2280 CTCTCAATGT GTCCCGTGTG GCCCAGTTGT GCAGGGTGAA CACGGGCGTG AGGGCTGCTG 2340 GCTACGTGTC TGTGCATGAA TAGGCCTGAG TGAGGGTGAG TTCTGTGTGT CCGTGTGCAT 2400 GTAGAAGTTG TGTGGATGTA TGAGTGGGTC TGTGTCAGGG ACTGTGGGAG CAGCTGTGTG 2460 TGCATGGAGC ATCATGTGTC TGTGTGTGGG TAAAGGTGGC TGAGCTCCTG TGCACGTATG 2520 ATGGCGTGTG AGCGTGTGTA TGATGGGGTG TGTGTGTGTG TGTGTGTGTG TGTTTTGCCT 2580 GTGTGAATGT GCTGTGCCAC GTATGTGGGT GCGTGAGTCA GTAAATGTGT GTCTGAGTCC 2640 GTCTGCTCTG TGGGGACCTG GCACTCTCAC CTGCCCTGAC CCTGGGCACT GCTGGCCCTG 2700 GGCTCTGGAT CAGCCAGGCC TGCTTGCAGG AGTCTCATCT GGAGACCTGC CCTGAGTCCT 2760 GGGGCACCCC CGGCAGGTCC TGGCCCCTCG CAGCCTGCCT TCCTCCTCTG GGCCCAGGTG 2820 TTGATATTGC TGGCAGTGGT TTCCTGGGGT GTGTGGGGAA GCCCGGGCAG GTGCTGAGGG 2880 GCCTCTTCTC CCCTCTACCC TTCCAGGGGG ACCAGGGTGG GGAAAGTTCA CTGTCAGTCT 2940 CCAAGTGGAA CACTTTTCTG AAAGCCATGC TGGTATGCAG TGATGCTGCC ACCAACAAGA 3000 ACTTCAACAG GCTGCAAGAC GTCTTCCTGC TCCCTGACCC CAGCGGCCAG TGGAGGGACA 3060 CCAGGGTCTA TGGTGTTTTC TCCAACCCCT GGTGAGTGGC CCTTGTCCTG GGGCCGGGGC 3120 TGGCATTGGT TCAGTGTCCA GTAGGGACAG GAGGCCTTGG GCCCTGCTGA GGGCCTCCCT 3180 GGTGTGGCAG GAGCAGGGGC TGCAGGCTCA AGAGGCTGGG CTGTTGCTGG GTGTGGGGTG 3240 GGGGGACAGC CAGTGCGATG TATGTACTGT TGTGTGAGTG AGTCTGCACT CATGGGTGTG 3300 TGTGCATGCC CTATATGCAC ACTCATGACT GCACTTGTGC CTGTGTGTCC CACCACCTGC 3360 TTGTGCCGAG AGTGGACACT GGGCCCAGGA GGAAGCTGCT GAAGCATCTC TCGGGGAGCT 3420 GGGTGCTATT ACACCTGCTC AGGCACTGCC TGAGCCCGAT AATTCACACT TCTTAATCAC 3480 TCTCATTGAT TGAACACACG GCAGGCGGAA GTGTTGGGTG TGTGTGGGGA GAGTTAGGGA 3540 TAGAGTGGAG GAAGCCAAGA CCCTGCTCTG TGGCTCCTGG GTGAGTGGGT CCCCCAGGCT 3600 GGGAAGGGGT TGGGGGTCTG GCCTCCTGGG GCATCAGCAC CCCACAGCCT GTGCCCAGGG 3660 AGGGCTAGAG AACTGCTCAG CCTATGATGG GGTTCCTCCT GCCTTGGGGT TGGGTAGAGC 3720 AGATGGCCTC TAGACTCAGT GATTCTGTAA CAGGATACAA GTTTGTGGTT TTAAATTGCA 3780 GCACAAAGAA ATTAGGCTGA ACTCCTCTCC TTCCTCCTCT CCATCCCTCC CCATTTTCAG 3840 TGGTGGTTGG CAACTCAGTG CCAGGCACAA GGCTGGCCTG GGTGAGTGGA GGTGGATGGG 3900 TGGGTTCTGG GCCCCCCATT GAGCTGGTCT CCATGTCACT GCAGGAACTA CTCAGCCGTC 3960 TGTGTGTATT CCCTCGGTGA CATTGACAAG GTCTTCCGTA CCTCCTCACT CAAGGGCTAC 4020 CACTCAAGCC TTCCCAACCC GCGGCCTGGC AAGGTGAGCG TGACACCAGC CGTGGCCCAG 4080 GCCCAGCCCT CCTTCTGCCT CACCTCCCAC CACCCCACTG ACCTGGGCCT GCTCTCCTTG 4140 CCCAGTGCCT CCCAGACCAG CAGCCGATAC CCACAGAGAC CTTCCAGGTG GCTGACCGTC 4200 ACCCAGAGGT GGCGCAGAGG GTGGAGCCCA TGGGGCCTCT GAAGACGCCA TTGTTCCACT 4260 CTAAATACCA CTACCAGAAA GTGGCCGTCC ACCGCATGCA AGCCAGCCAC GGGGAGACCT 4320 TTCATGTGCT TTACCTAACT ACAGGTGAGA GGCTACCCCG GGACCCTCAG TTTGCTTTGT 4380 AAAAACGGGC ATGAAAGGTG TAAGGAATAA TGTAGTTAAC ATCTGGTTGG ATCTTTACAT 4440 GTGGAAGGAA TAATTGAGTG ACTGGAGTTG TCAGGGGTTA ATGTGTGTGG GTGTGGAAGA 4500 GCCAGGCAGG GAGAGCTTCC TGGAGGAGGT AGGGGCAAGA GGGAAAGGGG GATGGGAGAA 4560 AAGCAAGCAC TGGGATTTGG AGGCGGAAAT CTGGAGAGTC TGAGCAAAGC CAGGTGCACC 4620 TTTGGTCCAG ATGTCTGACT CAGGGAAGAA GATGGTAGGA AGAGACGTGG CAAATGAGGA 4680 GGAGGGGCCT GAACCACAGG GATACTGGCC TCTGCCAGGC AGAATGAGGG AGTCAGGCCC 4740 TGCGCCTGTC TTTGGGATTG TGCAGGTGAG AAGAAACATT TGAGGAGTTG ATGGGGCACA 4800 AATTAGGTAT GGGGAAGGAG TTCCAGGGGG CAGAACCTTT GCCATCTCAC AGAGGACAGG 4860 GGCAGCTTCT CTTCTTCCCT GGAGTAGGCC CTGCTGGGGG AAGCTGGGTG GAATGCCGTG 4920 GGAGATGCTC CTGCTTTCTG GAAAGCCACA GGACACGGAG GAGCCAGTCC TGAGTTGGGT 4980 TTGTCGCAGC TTCCCATGCC AGCTGCCTTC CTTGAGACTG GAAAGGGCCT CTAGCACCCC 5040 TGGGGCCATT CAATTCAGGC CCAGGCGCCC AACCTCAGTT GTTCACATTC CCCATGTGAT 5100 CTCCTGTTGC TGCTTCACCT TGGGACTGTC TCGGCTTTGG TGACCTTGTA GGAAACTGGA 5160 ACCCCAGCAC CATTGTTTGG CTCCTGGAAG CCTTGGGGAG AGGAATTTCC CACAGGGCAG 5220 GGCCTGGGTC CTGATTCCCT GCCTCTTTAC TCCCTATTCA TCCCGGCTAC ACCCTTGGGC 5280 CCCCATCCTT GCTTGGCTCC AGTACTGGCT GGCACAGCTG TTGTGGTCAT CCAGGGATGG 5340 CAGGGCACTG GGGAACAGAA GAGAGAGGTC ACACAGTGCG GAACTGGGAG CAGGAGCTAG 5400 GACAAGGAAG GCTGGACTTG GGCCATGGAT TCCCTTCCTG CAGACTTGGG AAGTGAGCAC 5460 ACTTGAGTGA TTAGAGAAGG TGTCTTCGTT CTAAGGGCAG TGGAGGAGGC ACCATTTTGG 5520 AGCCTGCATC ATTCGTATTT GGGCTAGATT GAAAAATAGA GCTTTCTAAG TCCTCTGCAG 5580 AGAATGGGAG GCTCTCACAA CTGGGAGAAG TATTGGCTCT TTTCCTGAGA ATTTTGCCAA 5640 GGGTATGCTG TTACTGGGGC TGGTTTGGAA GGAGTATAGG GCATTATGTC TGTGAAGGCA 5700 GTGGCTGGGG TGGGGCCTTA TCAGGCCCAA GGAGCATCTG GCCACATCTC AGAGTCCACA 5760 GATGAGGATC ACGGATGTGT AGAGGAAACA TCCTAGGCAG GCAATCATCT GACTGCTTTT 5820 TTGGGGCAGG TGATGCCCTG GGAAATTGGG AGGGAGGGAG AGAGGGAGGT AGGCTATTCT 5880 AGAAACTGGG AGAGCAGGTG AGGTAGGATT GGGAGGACCA GGGGTCAGGG TCCCCATTGG 5940 TCCCTAATTG AGAACGGAGA GAGCATTGGT CTAGGAGGCA GGCAGCTCGG TTATAAGACC 6000 TTGGGAACTC TTGATTTAGA ATCCAAGATC CTTTTTAGAT CTAGGATTTT ATAAAATTAA 6060 GATATCCCCT AAGATCAAAT GCAACGTGGA GTCCTGAATT GGATCCTAGA ACAGAAGAAG 6120 GACATTTGTG GAAAAACTAG TGAAATCCAA ATAAAGTCTG TAGTTTTGTT AATAGTAATG 6180 CACCAATGTC AGTTGCCTAG TTGTGACAAA TATACCGTGG TTATGTAAGA TGGTAACATT 6240 AGGGGGAACT GGAGAAGGGT AGATTGGAGC TCTCTGTACT ATCTTTGCAA CTTTTCTGGG 6300 AATCTAAAAT TACTCCAAAA TAAAAAAAAA ATGTATTTAA AGTAAATATA TTCCCTAAGA 6360 GTCCAGGAGG CAGGGGAGTT GTAGAAGCAG CTGAGTGGTT GGGTTCTGAC AGATTTGGTT 6420 CCAACTCGGT CTCTGCTGCT CACCAGCTGT GTGACCTTGA GCAAGTGGCT TAGCCTTTCT 6480 GAGCCTGATT TCCTTATCTG TGGAGTGGGG AAGATGACAG CCACCTCGCA GGGCTGTGGA 6540 GGGTTAAACG AGGTGATGCA TGGACAGCAG CCGCACTGAC CTTGCTGGTG TGGGGCTCCT 6600 GCTTCTGTTC TTCCCGTGCA GCCTTGGGAA TGTTGGAGGC CGTATCCAGG GACCCCTGGG 6660 CCTCCTGGGA TGGCCTCTCT GGATCAGCCT TGGAAGGTTC CAGGCTGCCC TTAGGCTCCC 6720 ACATTCTTCC CCAGTCACGC TCTCCTCGCC CTGCCCACAC CAGTCCTGTG ACCCTTGCCT 6780 GAGTTGTGAC TTCCCACCCC TCCCCGGCCT AGAGGAAAGC TGCCTGGCCC CTCAGTGGGA 6840 CTCCCGCCCA CTGACCCTCT GTCCACCATA CACAGACAGG GGCACTATCC ACAAGGTGGT 6900 GGAACCGGGG GAGCAGGAGC ACAGCTTCGC CTTCAACATC ATGGAGATCC AGCCCTTCCG 6960 CCGCGCGGCT GCCATCCAGA CCATGTCGCT GGATGCTGAG CGGGTGAGCC TTCCCCCACT 7020 GCGTCCCATG GGCTATGCAG TGACTGCAGC TGAGGACAGG GCTCCTTTGC ATGTGATTTG 7080 TGTGTTCTTT TAAGAGCTTC TAGGCCTTAG GGCCTGGACA TTTAGGACTG AGTGTGGGGT 7140 GGGGCCCGGG CCTGACCCAA TCCTGCTGTC CTTCCAGAGG AAGCTGTATG TGAGCTCCCA 7200 GTGGGAGGTG AGCCAGGTGC CCCTGGACCT GTGTGAGGTC TATGGCGGGG GCTGCCACGG 7260 TTGCCTCATG TCCCGAGACC CCTACTGCGG CTGGGACCAG GGCCGCTGCA TCTCCATCTA 7320 CAGCTCCGAA CGGTACGTTG GCCGGGATCC CTCCGTCCCT GGGACAAGGT GGGCATGGGA 7380 CAGGGGGAGG TGTTGTCGGG CTGGAAGAGG TGGCGGTACT GGGCCTTTCT TGTGGGACCT 7440 CCTCTCTACT GGAACTGCAC TAGGGGTAAG GATATGAGGG TCAGGTCTGC AGCCTTGTAT 7500 CTGCTGATCC TCTTTCGTCC TTCCCACTCC AGGTCAGTGC TGCAATCCAT TAATCCAGCC 7560 GAGCCACACA AGGAGTGTCC CAACCCCAAA CCAGGTACCT GATCTGGCCC TGCTGGCGGC 7620 TGTGGCCCAA TGAGTGGGGT ACTGCCCTGC CCTGATTGTC CTGGTCTGAG GGAAACATGG 7680 CCTTGTCCTG TGGGCCCCAG GTACATGGGG CAGGATACAG TCCTGCAGAG GGAGCCCTCT 7740 TGGTGGGATG AGCGAGACGG GAGAAAAAAG GAGGACGCTG AGGGCTGGGT TCCCCACGTT 7800 CATTCAGAAG CCTTGTCCTG GGATCCCAGT CGGTGGGGAG GACACATCCT CCCCTGGGAG 7860 CTCTTTGTCC CTCCTCACGG CTGCTTCCCC ACTGCCTGCC CAGACAAGGC CCCACTGCAG 7920 AAGGTTTCCC TGGCCCCAAA CTCTCGCTAC TACCTGAGCT GCCCCATGGA ATCCCGCCAC 7980 GCCACCTACT CATGGCGCCA CAAGGAGAAC GTGGAGCAGA GCTGCGAACC TGGTCACCAG 8040 AGCCCCAACT GCATCCTGTT CATCGAGAAC CTCACGGCGC AGCAGTACGG CCACTACTTC 8100 TGCGAGGCCC AGGAGGGCTC CTACTTCCGC GAGGCTCAGC ACTGGCAGCT GCTGCCCGAG 8160 GACGGCATCA TGGCCGAGCA CCTGCTGGGT CATGCCTGTG CCCTGGCCGC CTCCCTCTGG 8220 CTGGGGGTGC TGCCCACACT CACTCTTGGC TTGCTGGTCC ACTAGGGCCT CCCGAGGCTG 8280 GGCATGCCTC AGGCTTCTGC AGCCCAGGGC ACTAGAACGT CTCACACTCA GAGCCGGCTG 8340 GCCCGGGAGC TCCTTGCCTG CCACTTCTTC CAGGGGACAG AATAACCCAG TGGAGGATGC 8400 CAGGCCTGGA GACGTCCAGC CGCAGGCGGC TGCTGGGCCC CAGGTGGCGC ACGGATGGTG 8460 AGGGGCTGAG AATGAGGGCA CCGACTGTGA AGCTGGGGCA TCGATGACCC AAGACTTTAT 8520 CTTCTGGAAA ATATTTTTCA GACTCCTCAA ACTTGACTAA ATGCAGCGAT GCTCCCAGCC 8580 CAAGAGCCCA TGGGTCGGGG AGTGGGTTTG GATAGGAGAG CTGGGACTCC ATCTCGACCC 8640 TGGGGCTGAG GCCTGAGTCC TTCTGGACTC TTGGTACCCA CATTGCCTCC TTCCCCTCCC 8700 TCTCTCATGG CTGGGTGGCT GGTGTTCCTG AAGACCCAGG GCTACCCTCT GTCCAGCCCT 8760 GTCCTCTGCA GCTCCCTCTC TGGTCCTGGG TCCCACAGGA CAGCCGCCTT GCATGTTTAT 8820 TGAAGGATGT TTGCTTTCCG GACGGAAGGA CGGAAAAAGC TCTGAAAAAA AAAAAAAAAA 8880 AAAAAAAA 8888 (2)SEQ ID NO:42的信息： (ⅰ)序列特征： (A)长度：6622个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：基因组DNA (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..6622 (ⅹⅰ)序列描述：SEQ ID NO:42: GATATCATGG AGATAATTAA AATGATAACC ATCTCGCAAA TAAATAAGTA TTTTACTGTT 60 TTCGTAACAG TTTTGTAATA AAAAAACCTA TAAATATGAA ATTCTTAGTC AACGTTGCCC 120 TTGTTTTTAT GGTCGTATAC ATTTCTTACA TCTATGCGGA TCGATGGGGA TCCGCCCAGG 180 GCCACCTAAG GAGCGGACCC CGCATCTTCG CCGTCTGGAA AGGCCATGTA GGGCAGGACC 240 GGGTGGACTT TGGCCAGACT GAGCCGCACA CGGTGCTTTT CCACGAGCCA GGCAGCTCCT 300 CTGTGTGGGT GGGAGGACGT GGCAAGGTCT ACCTCTTTGA CTTCCCCGAG GGCAAGAACG 360 CATCTGTGCG CACGGTGAAT ATCGGCTCCA CAAAGGGGTC CTGTCTGGAT AAGCGGGACT 420 GCGAGAACTA CATCACTCTC CTGGAGAGGC GGAGTGAGGG GCTGCTGGCC TGTGGCACCA 480 ACGCCCGGCA CCCCAGCTGC TGGAACCTGG TGAATGGCAC TGTGGTGCCA CTTGGCGAGA 540 TGAGAGGCTA TGCCCCCTTC AGCCCGGACG AGAACTCCCT GGTTCTGTTT GAAGGGGACG 600 AGGTGTATTC CACCATCCGG AAGCAGGAAT ACAATGGGAA GATCCCTCGG TTCCGCCGCA 660 TCCGGGGCGA GAGTGAGCTG TACACCAGTG ATACTGTCAT GCAGAACCCA CAGTTCATCA 720 AAGCCACCAT CGTGCACCAA GACCAGGCTT ACGATGACAA GATCTACTAC TTCTTCCGAG 780 AGGACAATCC TGACAAGAAT CCTGAGGCTC CTCTCAATGT GTCCCGTGTG GCCCAGTTGT 840 GCAGGGGGGA CCAGGGTGGG GAAAGTTCAC TGTCAGTCTC CAAGTGGAAC ACTTTTCTGA 900 AAGCCATGCT GGTATGCAGT GATGCTGCCA CCAACAAGAA CTTCAACAGG CTGCAAGACG 960 TCTTCCTGCT CCCTGACCCC AGCGGCCAGT GGAGGGACAC CAGGGTCTAT GGTGTTTTCT 1020 CCAACCCCTG GAACTACTCA GCCGTCTGTG TGTATTCCCT CGGTGACATT GACAAGGTCT 1080 TCCGTACCTC CTCACTCAAG GGCTACCACT CAAGCCTTCC CAACCCGCGG CCTGGCAAGT 1140 GCCTCCCAGA CCAGCAGCCG ATACCCACAG AGACCTTCCA GGTGGCTGAC CGTCACCCAG 1200 AGGTGGCGCA GAGGGTGGAG CCCATGGGGC CTCTGAAGAC GCCATTGTTC CACTCTAAAT 1260 ACCACTACCA GAAAGTGGCC GTTCACCGCA TGCAAGCCAG CCACGGGGAG ACCTTTCATG 1320 TGCTTTACCT AACTACAGAC AGGGGCACTA TCCACAAGGT GGTGGAACCG GGGGAGCAGG 1380 AGCACAGCTT CGCCTTCAAC ATCATGGAGA TCCAGCCCTT CCGCCGCGCG GCTGCCATCC 1440 AGACCATGTC GCTGGATGCT GAGCGGAGGA AGCTGTATGT GAGCTCCCAG TGGGAGGTGA 1500 GCCAGGTGCC CCTGGACCTG TGTGAGGTCT ATGGCGGGGG CTGCCACGGT TGCCTCATGT 1560 CCCGAGACCC CTACTGCGGC TGGGACCAGG GCCGCTGCAT CTCCATCTAC AGCTCCGLAC 1620 GGTCAGTGCT GCAATCCATT AATCCAGCCG AGCCACACAA GGAGTGTCCC AACCCCAAAC 1680 CAGACAAGGC CCCACTGCAG AAGGTTTCCC TGGCCCCAAA CTCTCGCTAC TACCTGAGCT 1740 GCCCCATGGA ATCCCGCCAC GCCACCTACT CATGGCGCCA CAAGGAGAAC GTGGAGCAGA 1800 GCTGCGAACC TGGTCACCAG AGCCCCAACT GCATCCTGTT CATCGAGAAC CTCACGGCGC 1860 AGCAGTACGG CCACTACTTC TGCGAGGCCC AGGAGGGCTC CTACTTCCGC GAGGCTCAGC 1920 ACTGGCAGCT GCTGCCCGAG GACGGCATCA TGGCCGAGCA CCTGCTGGGT CATGCCTGTG 1980 CCCTGGCTGC CTGAATTCGA AGCTTGGAGT CGACTCTGCT GAAGAGGAGG AAATTCTCCT 2040 TGAAGTTTCC CTGGTGTTCA AAGTAAAGGA GTTTGCACCA GACGCACCTC TGTTCACTGG 2100 TCCGGCGTAT TAAAACACGA TACATTGTTA TTAGTACATT TATTAAGCGC TAGATTCTGT 2160 GCGTTGTTGA TTTACAGACA ATTGTTGTAC GTATTTTAAT AATTCATTAA ATTTATAATC 2220 TTTAGGGTGG TATGTTAGAG CGAAAATCAA ATGATTTTCA GCGTCTTTAT ATCTGAATTT 2280 AAATATTAAA TCCTCAATAG ATTTGTAAAA TAGGTTTCGA TTAGTTTCAA ACAAGGGTTG 2340 TTTTTCCGAA CCGATGGCTG GACTATCTAA TGGATTTTCG CTCAACGCCA CAAAACTTGC 2400 CAAATCTTGT AGCAGCAATC TAGCTTTGTC GATATTCGTT TGTGTTTTGT TTTGTAATAA 2460 AGGTTCGACG TCGTTCAAAA TATTATGCGC TTTTGTATTT CTTTCATCAC TGTCGTTAGT 2520 GTACAATTGA CTCGACGTAA ACACGTTAAA TAAAGCCTGG ACATATTTAA CATCGGGCGT 2580 GTTAGCTTTA TTAGGCCGAT TATCGTCGTC GTCCCAACCC TCGTCGTTAG AAGTTGCTTC 2640 CGAAGACGAT TTTGCCATAG CCACACGACG CCTATTAATT GTGTCGGCTA ACACGTCCGC 2700 GATCAAATTT GTAGTTGAGC TTTTTGGAAT TATTTCTGAT TGCGGGCGTT TTTGGGCGGG 2760 TTTCAATCTA ACTGTGCCCG ATTTTAATTC AGACAACACG TTAGAAAGCG ATGGTGCAGG 2820 CGGTGGTAAC ATTTCAGACG GCAAATCTAC TAATGGCGGC GGTGGTGGAG CTGATGATAA 2880 ATCTACCATC GGTGGAGGCG CAGGCGGGGC TGGCGGCGGA GGCGGAGGCG GAGGTGGTGG 2940 CGGTGATGCA GACGGCGGTT TAGGCTCAAA TTGTCTCTTT CAGGCAACAC AGTCGGCACC 3000 TCAACTATTG TACTGGTTTC GGGCGTATGG TGCACTCTCA GTACAATCTG CTCTGATGCC 3060 GCATAGTTAA GCCAGCCCCG ACACCCGCCA ACACCCGCTG ACGCGCCCTG ACGGGCTTGT 3120 CTGCTCCCGG CATCCGCTTA CAGACAAGCT GTGACCGTCT CCGGGAGCTG CATGTGTCAG 3180 AGGTTTTCAC CGTCATCACC GAAACGCGCG AGACGAAAGG GCCTCGTGAT ACGCCTATTT 3240 TTATAGGTTA ATGTCATGAT AATAATGGTT TCTTAGACGT CAGGTGGCAC TTTTCGGGGA 3300 AATGTGCGCG GAACCCCTAT TTGTTTATTT TTCTAAATAC ATTCAAATAT GTATCCGCTC 3360 ATGAGACAAT AACCCTGATA AATGCTTCAA TAATATTGAA AAAGGAAGAG TATGAGTATT 3420 CAACATTTCC GTGTCGCCCT TATTCCCTTT TTTGCGGCAT TTTGCCTTCC TGTTTTTGCT 3480 CACCCAGAAA CGCTGGTGAA AGTAAAAGAT GCTGAAGATC AGTTGGGTGC ACGAGTGGGT 3540 TACATCGAAC TGGATCTCAA CAGCGGTAAG ATCCTTGAGA GTTTTCGCCC CGAAGAACGT 3600 TTTCCAATGA TGAGCACTTT TAAAGTTCTG CTATGTGGCG CGGTATTATC CCGTATTGAC 3660 GCCGGGCAAG AGCAACTCGG TCGCCGCATA CACTATTCTC AGAATGACTT GGTTGAGTAC 3720 TCACCAGTCA CAGAAAAGCA TCTTACGGAT GGCATGACAG TAAGAGAATT ATGCAGTGCT 3780 GCCATAACCA TGAGTGATAA CACTGCGGCC AACTTACTTC TGACAACGAT CGGAGGACCG 3840 AAGGAGCTAA CCGCTTTTTT GCACAACATG GGGGATCATG TAACTCGCCT TGATCGTTGG 3900 GAACCGGAGC TGAATGAAGC CATACCAAAC GACGAGCGTG ACACCACGAT GCCTGTAGCA 3960 ATGGCAACAA CGTTGCGCAA ACTATTAACT GGCGAACTAC TTACTCTAGC TTCCCGGCAA 4020 CAATTAATAG ACTGGATGGA GGCGGATAAA GTTGCAGGAC CACTTCTGCG CTCGGCCCTT 4080 CCGGCTGGCT GGTTTATTGC TGATAAATCT GGAGCCGGGG AGCGTGGGTC TCGCGGTATC 4140 ATTGCAGCAC TGGGGCCAGA TGGTAAGCCC TCCCGTATCG TAGTTATCTA CACGACGGGG 4200 AGTCAGGCAA CTATGGATGA ACGAAATAGA CAGATCGCTG AGATAGGTGC CTCACTGATT 4260 AAGCATTGGT AACTGTCAGA CCAAGTTTAC TCATATATAC TTTAGATTGA TTTAAAACTT 4320 CATTTTTAAT TTAAAAGGAT CTAGGTGAAG ATCCTTTTTG ATAATCTCAT GACCAAAATC 4380 CCTTAACGTG AGTTTTCGTT CCACTGAGCG TCAGACCCCG TAGAAAAGAT CAAAGGATCT 4440 TCTTGAGATC CTTTTTTTCT GCGCGTAATC TGCTGCTTGC AAACAAAAAA ACCACCGCTA 4500 CCAGCGGTGG TTTGTTTGCC GGATCAAGAG CTACCAACTC TTTTTCCGAA GGTAACTGCC 4560 TTCAGCAGAG CGCAGATACC AAATACTGTT CTTCTAGTGT AGCCGTAGTT AGGCCACCAC 4620 TTCAAGAACT CTGTAGCACC GCCTACATAC CTCGCTCTGC TAATCCTGTT ACCAGTGGCT 4680 GCTGCCAGTG GCGATAAGTC GTGTCTTACC GGGTTGGACT CAAGACGATA GTTACCGGAT 4740 AAGGCGCAGC GGTCGGGCTG AACGGGGGGT TCGTGCACAC AGCCCAGCTT GGAGCGAACG 4800 ACCTACACCG AACTGAGATA CCTACAGCGT GAGCTATGAG AAAGCGCCAC GCTTCCCGAA 4860 GGGAGAAAGG CGGACAGGTA TCCGGTAAGC GGCAGGGTCG GAACAGGAGA GCGCACGAGG 4920 GAGCTTCCAG GGGGAAACGC CTGGTATCTT TATAGTCCTG TCGGGTTTCG CCACCTCTGA 4980 CTTGAGCGTC GATTTTTGTG ATGCTCGTCA GGGGGGCGGA GCCTATGGAA AAACGCCAGC 5040 AACGCGGCCT TTTTACGGTT CCTGGCCTTT TGCTGGCCTT TTGCTCACAT GTTCTTTCCT 5100 GCGTTATCCC CTGATTCTGT GGATAACCGT ATTACCGCCT TTGAGTGAGC TGATACCGCT 5160 CGCCGCAGCC GAACGACCGA GCGCAGCGAG TCAGTGAGCG AGGAAGCATC CTGCACCATC 5220 GTCTGCTCAT CCATGACCTG ACCATGCAGA GGATGATGCT CGTGACGGTT AACGCCTCGA 5280 ATCAGCAACG GCTTGCCGTT CAGCAGCAGC AGACCATTTT CAATCCGCAC CTCGCGGAAA 5340 CCGACATCGC AGGCTTCTGC TTCAATCAGC GTGCCGTCGG CGGTGTGCAG TTCAACCACC 5400 GCACGATAGA GATTCGGGAT TTCGGCGCTC CACAGTTTCG GGTTTTCGAC GTTCAGACGT 5460 AGTGTGACGC GATCGGTATA ACCACCACGC TCATCGATAA TTTCACCGCC GAAAGGCGCG 5520 GTGCCGCTGG CGACCTGCGT TTCACCCTGC CATAAAGAAA CTGTTACCCG TAGGTAGTCA 5580 CGCAACTCGC CGCACATCTG AACTTCAGCC TCCAGTACAG CGCGGCTGAA ATCATCATTA 5640 AAGCGAGTGG CAACATGGAA ATCGCTGATT TGTGTAGTCG GTTTATGCAG CAACGAGACG 5700 TCACGGAAAA TGCCGCTCAT CCGCCACATA TCCTGATCTT CCAGATAACT GCCGTCACTC 5760 CAACGCAGCA CCATCACCGC GAGGCGGTTT TCTCCGGCGC GTAAAAATGC GCTCAGGTCA 5820 AATTCAGACG GCAAACGACT GTCCTGGCCG TAACCGACCC AGCGCCCGTT GCACCACAGA 5880 TGAAACGCCG AGTTAACGCC ATCAAAAATA ATTCGCGTCT GGCCTTCCTG TAGCCAGCTT 5940 TCATCAACAT TAAATGTGAG CGAGTAACAA CCCGTCGGAT TCTCCGTGGG AACAAACGGC 6000 GGATTGACCG TAATGGGATA GGTCACGTTG GTGTAGATGG GCGCATCGTA ACCGTGCATC 6060 TGCCAGTTTG AGGGGACGAC GACAGTATCG GCCTCAGGAA GATCGCACTC CAGCCAGCTT 6120 TCCGGCACCG CTTCTGGTGC CGGAAACCAG GCAAAGCGCC ATTCGCCATT CAGGCTGCGC 6180 AACTGTTGGG AAGGGCGATC GGTGCGGGCC TCTTCGCTAT TACGCCAGCT GGCGAAAGGG 6240 GGATGTGCTG CAAGGCGATT AAGTTGGGTA ACGCCAGGGT TTTCCCAGTC ACGACGTTGT 6300 AAAACGACGG GATCTATCAT TTTTAGCAGT GATTCTAATT GCAGCTGCTC TTTGATACAA 6360 CTAATTTTAC GACGACGATG CGAGCTTTTA TTCAACCGAG CGTGCATGTT TGCAATCGTG 6420 CAAGCGTTAT CAATTTTTCA TTATCGTATT GTTGCACATC AACAGGCTGG ACACCACGTT 6480 GAACTCGCCG CAGTTTTGCG GCAAGTTGGA CCCGCCGCGC ATCCAATGCA AACTTTCCGA 6540 CATTCTGTTG CCTACGAACG ATTGATTCTT TGTCCATTGA TCGAAGCGAG TGCCTTCGAC 6600 TTTTTCGTGT CCAGTGTGGC TT 6622 (2)SEQ ID NO:43的信息： (ⅰ)序列特征： (A)长度：31个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：基因组DNA (ⅸ)特征： (A)名称/关键词：外显子 (B)位置：1..31 (ⅹⅰ)序列描述：SEQ ID NO:43: (2)SEQ ID NO:44的信息： (ⅰ)序列特征： (A)长度：29个碱基对 (B)类型：核酸 (C)链型：单链 (D)拓扑结构：线型 (ⅱ)分子类型：基因组DNA (ⅹⅰ)序列描述：SEQ ID NO:44: CTGAATTCAGGAGCCAGGGCACAGGCATG 29