会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 有蹄类动物 / 유전자 변형된 면역계를 가지는 유제류

유전자 변형된 면역계를 가지는 유제류

申请号 KR1020077011667 申请日 2005-10-24 公开(公告)号 KR1020070072608A 公开(公告)日 2007-07-04
申请人 레비비코르 인코포레이션; 发明人 웰스케빈; 아야레스데이비드;
摘要 The present invention provides ungulate animals, tissue and organs as well as cells and cell lines derived from such animals, tissue and organs, which lack expression of functional endogenous immunoglobulin loci. The present invention also provides ungulate animals, tissue and organs as well as cells and cell lines derived from such animals, tissue and organs, which express xenogenous, such as human, immunoglobulin loci. The present invention further provides ungulate, such as porcine genomic DNA sequence of porcine heavy and light chain immunogobulins. Such animals, tissues, organs and cells can be used in research and medical therapy. In addition, methods are provided to prepare such animals, organs, tissues, and cells.
权利要求
  • 기능적 내인성 면역글로불린의 임의 발현이 결핍된 트랜스제닉 유제류(transgenic ungulate).
  • 제 1 항에 있어서, 내인성 중쇄 면역글로불린의 임의 발현이 결핍된 것인 트랜스제닉 유제류.
  • 제 1 항에 있어서, 내인성 경쇄 면역글로불린의 임의 발현이 결핍된 것인 트랜스제닉 유제류.
  • 제 3 항에 있어서, 내인성 카파쇄 면역글로불린의 임의 발현이 결핍된 것인 트랜스제닉 유제류.
  • 제 3 항에 있어서, 내인성 람다쇄 면역글로불린의 임의 발현이 결핍된 것인 트랜스제닉 유제류.
  • 제 1 항에 있어서, 돼지, 소, 양 및 염소로 구성된 그룹중에서 선택되는 트랜스제닉 유제류.
  • 제 6 항에 있어서, 돼지인 트랜스제닉 유제류.
  • 제 1 항에 있어서, 핵이입을 통해 생산된 트랜스제닉 유제류.
  • 제 1 항에 있어서, 외인성 면역글로불린 부위를 발현하는 트랜스제닉 유제류.
  • 제 9 항에 있어서, 외인성 면역글로불린 부위가 중쇄 면역글로불린 또는 그의 단편인 트랜스제닉 유제류.
  • 제 9 항에 있어서, 외인성 면역글로불린 부위가 경쇄 면역글로불린 또는 그의 단편인 트랜스제닉 유제류.
  • 제 11 항에 있어서, 경쇄 부위가 카파쇄 부위 또는 그의 단편인 트랜스제닉 유제류.
  • 제 11 항에 있어서, 경쇄 부위가 람다쇄 부위 또는 그의 단편인 트랜스제닉 유제류.
  • 제 9 항에 있어서, 이종 부위가 인간 면역글로불린 부위 또는 그의 단편인 트랜스제닉 유제류.
  • 제 9 항에 있어서, 인공 염색체가 이종 면역글로불린을 함유하는 트랜스제닉 유제류.
  • 제 15 항에 있어서, 인공 염색체가 포유동물 인공 염색체를 포함하는 트랜스제닉 유제류.
  • 제 16 항에 있어서, 포유동물 인공 염색체가 하나 이상의 인간 염색체 14, 인간 염색체 2 및 인간 염색체 22 또는 그의 단편을 포함하는 트랜스제닉 유제류.
  • 이종 면역글로불린 부위 또는 그의 단편을 발현하는 트랜스제닉 유제류로서, 면역글로불린은 내인성 유제류 염색체내에 통합된 면역글로불린 부위로부터 발현되는 유제류.
  • 제 18 항에 있어서, 이종 면역글로불린이 인간 면역글로불린 또는 그의 단편인 트랜스제닉 유제류.
  • 제 18 항에 있어서, 이종 면역글로불린 부위가 자손에 의해 유전되는 트랜스제닉 유제류.
  • 제 18 항에 있어서, 이종 면역글로불린 부위가 자손에 의해 수컷 생식계를 통해 유전되는 트랜스제닉 유제류.
  • 제 18 항에 있어서, 돼지, 양, 염소 또는 젖소인 트랜스제닉 유제류.
  • 제 22 항에 있어서, 돼지인 트랜스제닉 유제류.
  • 제 18 항에 있어서, 핵이입을 통해 생산된 트랜스제닉 유제류.
  • 제 18 항에 있어서, 면역글로불린 부위가 하나 이상의 항원 노출에 반응하여 B 세포에서 발현되어 이종 면역글로불린을 생성하는 트랜스제닉 유제류.
  • 제 18 항에 있어서, 인공 염색체가 이종 면역글로불린을 포함하는 트랜스제닉 유제류.
  • 제 18 항에 있어서, 인공 염색체가 포유동물 인공 염색체를 포함하는 트랜스제닉 유제류.
  • 제 27 항에 있어서, 인공 염색체가 효모 인공 염색체를 포함하는 트랜스제닉 유제류.
  • 제 26 항에 있어서, 인공 염색체가 하나 이상의 인간 염색체 14, 인간 염색체 2 및 인간 염색체 22 또는 그의 단편을 포함하는 트랜스제닉 유제류.
  • 제 1 항의 트랜스제닉 유제류로부터 유래된 트랜스제닉 유제류 세포, 조직 또는 기관.
  • 제 18 항의 트랜스제닉 유제류로부터 유래된 트랜스제닉 유제류 세포, 조직 또는 기관.
  • 제 30 항 또는 31 항에 있어서, 세포가 체세포, 생식세포 또는 배아세포인 세포.
  • 제 32 항에 있어서, 세포가 B 세포인 세포.
  • 제 33 항에 있어서, 세포가 섬유모세포인 세포.
  • 이종 면역글로불린 부위를 포함하는 돼지 동물.
  • 제 35 항에 있어서, 인공 염색체가 이종 부위를 함유하는 돼지.
  • 제 36 항에 있어서, 인공 염색체가 재배열된 하나 이상의 이종 면역글로불린 부위를 포함하고, 하나 이상의 항원 노출에 반응하여 이종 면역글로불린을 생성할 수 있는 돼지.
  • 제 35 항의 동물로부터 유래된 돼지 세포.
  • 제 36 항에 있어서, 세포가 체세포, B 세포 또는 섬유모세포인 돼지 세포.
  • 제 35 항에 있어서, 이종 면역글로불린이 인간 면역글로불린인 돼지.
  • 제 36 항에 있어서, 하나 이상의 인공 염색체가 포유동물 인공 염색체를 포함하는 돼지.
  • 제 41 항에 있어서, 포유동물 인공 염색체가 하나 이상의 인간 염색체 14, 인간 염색체 2 및 인간 염색체 22 또는 그의 단편을 포함하는 돼지.
  • (a) 관심의 대상이 되는 하나 이상의 항원을 유제류에 투여하여 하나 이상의 항원에 대한 이종 항체를 생성하는 단계로서, 상기 유제류의 세포는 하나 이상의 인공 염색체를 포함하고 기능적 내인성 면역글로불린의 임의 발현이 결핍된 것이며, 각 인공 염색체는 재배열된 하나 이상의 이종 면역글로불린 부위를 포함하는 것인 단계; 및
    (b) 유제류로부터 이종 항체를 회수하는 단계를 포함하여 이종 항체를 생성하는 방법.
  • 제 43 항에 있어서, 면역글로불린 부위가 B 세포에서 재배열되는 방법.
  • 제 43 항에 있어서, 외인성 면역글로불린 부위가 중쇄 면역글로불린 또는 그의 단편인 방법.
  • 제 43 항에 있어서, 외인성 면역글로불린 부위가 경쇄 면역글로불린 또는 그의 단편인 방법.
  • 제 43 항에 있어서, 이종 부위가 인간 면역글로불린 부위 또는 그의 단편인 방법.
  • 제 43 항에 있어서, 인공 염색체가 이종 면역글로불린을 함유하는 방법.
  • 제 48 항에 있어서, 인공 염색체가 포유동물 인공 염색체를 포함하는 방법.
  • 제 49 항에 있어서, 포유동물 인공 염색체가 하나 이상의 인간 염색체 14, 인간 염색체 2 및 인간 염색체 22 또는 그의 단편을 포함하는 방법.
  • 돼지 중쇄 면역글로불린 또는 그의 단편을 포함하며, 여기에서 중쇄 면역글로불린은 적어도 하나의 연결 영역 및 적어도 하나의 불변 면역글로불린 영역을 포함하는 단리된 뉴클레오티드 서열.
  • 제 51 항에 있어서, 중쇄 면역글로불린이 적어도 하나의 가변 영역, 적어도 두 개의 다양성 영역, 적어도 네 개의 연결 영역 및 적어도 하나의 불변 영역을 포함하는 뉴클레오티드 서열.
  • 제 52 항에 있어서, 중쇄 면역글로불린이 Seq ID No. 29를 포함하는 뉴클레오티드 서열.
  • 제 51 항에 있어서, 중쇄 면역글로불린이 Seq ID No. 4를 포함하는 뉴클레오티드 서열.
  • 제 53 항 또는 54 항에 있어서, 서열이 Seq ID No.4 또는 29와 적어도 80, 85, 90, 95, 98 또는 99% 상동성인 뉴클레오티드 서열.
  • 제 53 항 또는 54 항에 있어서, 서열이 Seq ED No 4의 적어도 17, 20, 25 또는 30개의 근접 뉴클레오티드 또는 Seq ID No 29의 잔기 1-9,070개를 함유하는 뉴클레오티드 서열.
  • 제 53 항 또는 54 항에 있어서, 서열이 Seq ID No 29의 잔기 9,070-11039개를 포함하는 뉴클레오티드 서열.
  • Seq DD No 4 또는 29에 하이브리드화하는 단리된 뉴클레오티드 서열.
  • (a) SEQ ID No 29에 상동성인 적어도 17개의 근접 핵산을 포함하는 제 1 뉴클레오티드 서열
    (b) 선택성 표지 유전자; 및
    (c) 제 1 뉴클레오티드 서열과 중복되지 않으며, SEQ ID No 29에 상동성인 적어도 17개의 근접 핵산을 포함하는 제 2 뉴클레오티드 서열을 포함하는 표적화 벡터.
  • 제 59 항에 있어서, 선택성 표지가 항생제 내성 유전자인 표적화 벡터.
  • 제 59 항에 있어서, 제 1 뉴클레오티드 서열이 5' 재조합 팔(arm)을 나타내 는 표적화 벡터.
  • 제 59 항에 있어서, 제 2 뉴클레오티드 서열이 3' 재조합 팔을 나타내는 표적화 벡터.
  • 제 59 항의 표적화 벡터로 형질감염된 세포.
  • 제 63 항에 있어서, 돼지 중쇄 면역글로불린 부위의 적어도 하나의 대립유전자가 불활성으로 된 세포.
  • 제 64 항의 세포를 포함하는 돼지 동물.
  • 유제류 카파 경쇄 면역글로불린 부위 또는 그의 단편을 포함하는 단리된 뉴클레오티드 서열.
  • 제 66 항에 있어서, 유제류가 돼지인 뉴클레오티드 서열.
  • 제 66 항에 있어서, 유제류 카파 경쇄 면역글로불린 부위가 적어도 하나의 연결 영역, 하나의 불변 영역 및/또는 하나의 인핸서 영역을 포함하는 뉴클레오티드 서열.
  • 제 66 항에 있어서, 적어도 다섯 개의 연결 영역, 하나의 불변 영역 및 하나의 인핸서 영역을 포함하는 뉴클레오티드 서열.
  • 제 69 항에 있어서, Seq ID No. 30을 포함하는 뉴클레오티드 서열.
  • 제 69 항에 있어서, Seq ID No. 12를 포함하는 뉴클레오티드 서열.
  • 제 70 항 또는 71 항에 있어서, 서열이 Seq ID No 12 또는 30의 적어도 17, 20, 25 또는 30개의 근접 뉴클레오티드를 포함하는 뉴클레오티드 서열.
  • Seq ID No 12 또는 30에 하이브리드화하는 단리된 뉴클레오티드 서열.
  • (a) SEQ ID No 30에 상동성인 적어도 17개의 근접 핵산을 포함하는 제 1 뉴클레오티드 서열
    (b) 선택성 표지 유전자; 및
    (c) 제 1 뉴클레오티드 서열과 중복되지 않으며, SEQ ID No 30에 상동성인 적어도 17개의 근접 핵산을 포함하는 제 2 뉴클레오티드 서열을 포함하는 표적화 벡터.
  • 제 74 항에 있어서, 선택성 표지가 항생제 내성 유전자인 표적화 벡터.
  • 제 74 항에 있어서, 제 1 뉴클레오티드 서열이 5' 재조합 팔을 나타내는 표적화 벡터.
  • 제 74 항에 있어서, 제 2 뉴클레오티드 서열이 3' 재조합 팔을 나타내는 표적화 벡터.
  • 제 74 항의 표적화 벡터로 형질감염된 세포.
  • 제 78 항에 있어서, 카파쇄 면역글로불린 부위의 적어도 하나의 대립유전자가 불활성으로 된 세포.
  • 제 79 항의 세포를 포함하는 돼지 동물.
  • 유제류 람다 경쇄 면역글로불린 부위를 포함하는 단리된 뉴클레오티드 서열.
  • 제 81 항에 있어서, 유제류가 돼지인 뉴클레오티드 서열.
  • 제 81 항에 있어서, 유제류가 소인 뉴클레오티드 서열.
  • 제 81 항에 있어서, 유제류 람다 경쇄 면역글로불린 부위가 J - C 단위의 콘카타머(concatamer)를 포함하는 뉴클레오티드 서열.
  • 제 81 항에 있어서, 유제류 람다 경쇄 면역글로불린 부위가, 예를 들어, Seq ID No. 31로 표시된 것과 같은 적어도 하나의 연결 영역-불변 영역쌍 및/또는 적어도 하나의 가변 영역을 포함하는 뉴클레오티드 서열.
  • 제 82 항에 있어서, Seq ID No. 28을 포함하는 뉴클레오티드 서열.
  • 제 83 항에 있어서, Seq ID No. 31을 포함하는 뉴클레오티드 서열.
  • 제 86 항 또는 87 항에 있어서, 서열이 Seq ID No 28 또는 31의 적어도 17, 20, 25 또는 30개의 근접 뉴클레오티드를 포함하는 뉴클레오티드 서열.
  • Seq ID No 28 또는 31에 하이브리드화하는 단리된 뉴클레오티드 서열.
  • (a) SEQ ID No 28 또는 31에 상동성인 적어도 17개의 근접 핵산을 포함하는 제 1 뉴클레오티드 서열
    (b) 선택성 표지 유전자; 및
    (c) 제 1 뉴클레오티드 서열과 중복되지 않으며, SEQ ID No 28 또는 31에 상동성인 적어도 17개의 근접 핵산을 포함하는 제 2 뉴클레오티드 서열을 포함하는 표적화 벡터.
  • 제 90 항에 있어서, 선택성 표지가 항생제 내성 유전자인 표적화 벡터.
  • 제 90 항에 있어서, 제 1 뉴클레오티드 서열이 5' 재조합 팔을 나타내는 표적화 벡터.
  • 제 90 항에 있어서, 제 2 뉴클레오티드 서열이 3' 재조합 팔을 나타내는 표적화 벡터.
  • 제 90 항의 표적화 벡터로 형질감염된 세포.
  • 제 94 항에 있어서, 카파쇄 면역글로불린 부위의 적어도 하나의 대립유전자가 불활성으로 된 세포.
  • 제 95 항의 세포를 포함하는 돼지 동물.
  • 적어도 100 kb의 DNA를 환화시키는 방법으로서, 이에 따라 DNA가 부위 특이 적 재조합효소에 의해 숙주 게놈으로 통합될 수 있는 방법.
  • 제 97 항에 있어서, 적어도 100, 200, 300, 400, 500, 1000, 2000, 5000, 10,000 kb의 DNA가 환화될 수 있는 방법.
  • 제 97 항에 있어서, DNA의 환화가 부위 특이적 재조합효소를 DNA 서열 말단에 부착시킨 후, 부위 특이적 재조합효소를 DNA 서열에 적용하는 것에 의해 이루어질 수 있는 방법.
  • 제 97 항에 있어서, 부위 특이적 재조합효소 표적 부위가 Lox인 방법.
  • 제 97 항에 있어서, 인공 염색체가 DNA 서열을 함유하는 방법.
  • 제 101 항에 있어서, 인공 염색체가 효모 인공 염색체 또는 포유동물 인공 염색체인 방법.
  • 제 101 항에 있어서, 인공 염색체가 인간 면역글로불린 부위 또는 그의 단편을 코딩하는 DNA 서열을 포함하는 방법.
  • 제 103 항에 있어서, 인간 면역글로불린 부위 또는 그의 단편이 인간 염색체 14, 인간 염색체 2 및/또는 인간 염색체 22를 포함하는 방법.
  • 중쇄, 카파 경쇄 및 람다 경쇄 또는 이들의 임의 조합으로부터 선택된 내인성 면역글로불린의 적어도 하나의 대립유전자 발현이 결핍된 트랜스제닉 유제류.
  • 제 105 항에 있어서, 이종 면역글로불린이 발현되는 트랜스제닉 유제류.
  • 중쇄, 카파 경쇄 및 람다 경쇄 또는 이들의 임의 조합으로부터 선택된 내인성 면역글로불린의 적어도 하나의 대립유전자 발현이 결핍된 트랜스제닉 유제류를 이종 면역글로불린을 발현하는 유제류와 교배시키는, 제 106 항의 트랜스제닉 유제류를 생산하는 방법.
  • 제 105 항 내지 107 항중 어느 한항에 있어서, 유제류가 돼지인 트랜스제닉 유제류.
  • 제 106 항 또는 107 항에 있어서, 이종 면역글로불린이 인간 면역글로불린 부위 또는 그의 단편인 트랜스제닉 유제류.
  • 제 109 항에 있어서, 인공 염색체가 인간 면역글로불린 부위 또는 그의 단편을 함유하는 트랜스제닉 유제류.
  • 제 105 항의 유제류로부터 유래된 세포.
  • 제 1 항, 18 항, 105 항 또는 106 항에 있어서, 이종 항원의 발현 제거를 위한 추가의 유전자 변형을 포함하는 트랜스제닉 유제류.
  • 제 112 항에 있어서, 알파-1,3-갈락토실트랜스퍼라제 유전자의 적어도 하나의 대립유전자 발현이 결핍된 트랜스제닉 유제류.
  • 제 112 항에 있어서, 유제류가 돼지인 트랜스제닉 유제류.
  • 내인성 람다쇄 면역글로불린의 임의 발현이 결핍된 트랜스제닉 포유동물.
  • 说明书全文

    유전자 변형된 면역계를 가지는 유제류{UNGULATES WITH GENETICALLY MODIFIED IMMUNE SYSTEMS}

    본 출원은 2004년 10월 22일에 출원된 미국 가출원 제 60/621,433호를 우선권으로 주장하며, 이것은 여기에 참조로 전체적으로 인용된다.

    본 발명은 기능적 내부 면역글로블린 부위의 발현이 결핍된 유제 동물, 조직 및 기관뿐 아니라 그러한 동물, 조직 및 기관으로부터 유래한 세포 및 세포주를 제공한다. 본 발명은 또한 인간과 같은 이종 면역글로블린 부위를 발현하는 유제 동물, 조직 및 기관뿐 아니라 그러한 동물, 조직 및 기관으로부터 유래한 세포 및 세포주를 제공한다. 본 발명은 나아가 돼지의 중쇄 및 경쇄 면역글로블린의 돼지 게놈 DNA 서열과 같은 유제동물을 제공한다. 그러한 동물, 조직, 기관 및 세포는 연구 및 의학적 치료에서 사용될 수 있다. 추가로, 그러한 동물, 기관, 조직 및 세포를 제조하는 방법을 제공한다.

    항원은 생체에서 "외부"로 인식될 수 있는 제제 또는 기질이다. 예를 들면 세균의 세포벽 구성성분과 같이 항원으로 작용하는 것은 종종 큰 외부 물질의 상대적으로 작은 화학적 그룹이다. 탄수화물도 약한 항원으로 작용할 수 있지만, 대부 분의 항원은 단백질이다. 세균, 바이러스 및 다른 미생물이 일반적으로 많은 항원을 포함하며, 화분, 먼지 진드기, 곰팡이, 음식 및 다른 물질들도 그러하다. 생체는 항체를 만듬으로써 항원에 반응한다. 항체 (또한 소위 면역글로블린 (Igs))은 항원 또는 외부 단백질과 결합하는 면역 시스템의 세포에 의해 제조되는 단백질이다. 항체는 혈액의 혈청을 순환하며 외부 항원을 검출하며 혈액 단백질의 감마 글로블린 부분을 구성한다. 이러한 항체들은 조각 그림 맞추기의 두 조각, 항원/항체 복합체, 또는 면역 복합체와 같이 화학적으로 매우 특정한 수단으로 항원과 상호작용한다. 이러한 결합은 항원을 중화시키거나 항원의 파괴를 일으킨다.

    척추동물이 항원을 만나면, 초기 체액성 면역 반응이 일어난다. 동물이 몇일 후에 동일한 항원을 만나게 되면, 면역반응은 더욱 빠르고 더 거대해진다. 초기 만남(encounter)은 특정 면역 세포 (B-세포) 클론의 증식 및 분열을 유발한다. 결과(progeny) 림포구는 작동세포 (항체 생성 세포)뿐만 아니라, 최초 항원에 의한 추후의 자극에 작동세포 및 기억세포를 생산할 수 있는 능력을 보유하는 기억세포의 클론 또한 포함한다. 작동세포는 단지 몇일 동안 생존한다. 기억세포는 일생동안 생존하며, 동일한 항원에 대한 두번째 자극에 의해 재활성화될 수 있다. 그러므로, 항원이 두번째 인식되었을 때, 이러한 기억세포가 다량의 항체를 급속하게 생산하는 작동세포를 빠르게 생산한다.

    매우 특정한 수단으로 항원과 상호작용하는 항체의 독특한 능력을 이용하여, 항체가 진단 및 치료 용도로 제조 및 이용될 수 있는 분자로 개발되어왔다. 항원 에피토프에 결합할 수 있는 독특한 능력 때문에, 다클론항체 및 단클론항체가 에피 토프를 가지고 있는 분자를 동정하기 위해서 사용될 수 있거나, 그 자체에 의해 또는 다른 부분과 접합하여 진단 또는 치료를 위한 특정 부위를 나타낼 수 있다. 다클론항체 및 단클론항체는 실직적으로 어떤 병원균 또는 생물학적 타겟에 대하여 생산될 수 있다. 용어 다클론항체는 일반적으로 다양한 아이소형 및 특이적 병원균-특이적 항체를 포함하는 면역 혈청을 말한다. 대조적으로, 단클론항체는 하나의 아이소형이 하나의 특이성을 나타내는 단일 면역글로블린 형으로 이루어진다.

    1890년에, Shibasaburo Kitazato와 Emil Behring는 면역이 면역 동물의 혈청이 비면역 동물로 전달됨으로써 하나의 동물로부터 다른 동물로 전달될 수 있다는 것을 증명하는 기초적인 실험을 수행하였다. 이 획기적 실험은 수동적 면역법의 임상으로의 도입에 관한 기초를 성립했다. 그러나, 큰 규모 혈청 치료는 1940년대에 이종 혈청의 주입 및 효율적 항생제 화학요법의 도입과 연관된 독성 때문에 포기되었다. 최근에는, 그러한 다클론항체 치료가 면역글로블린-결핍 환자에서 대체 치료, 몇 가지 바이러스 (예를 들면, 공수병, 홍역, A 및 B형 간염, 수두)에 대한 노출 후의 예방, 및 독소 중화 (디프테리아, 파상풍, 및 보툴리누스 중독)와 같은 상대적인 몇몇 상황에서 감염 질병을 치료할 수 있는 것으로 알려져 있다. 혈청 요법의 제한된 용도에도 불구하고, 미국에서는 인간 항체의 16미터톤 이상이 정맥 항체 요법을 위하여 매년 얻어진다. 용도가 비슷한 수준으로 가장 산업화된 국가의 경제에 존재하며, 수요가 개발 국가에서 급속하게 증가할 것으로 예상될 수 있다. 근래에는, 수동적 면역법을 위한 인간 항체가 공급자의 모아진 혈청으로부터 얻어진다. 그러므로, 치료적 및 예방적 요법에 이용가능한 인간 항체의 양에 있어 서 고유의 제한이 있다.

    생물학적 교전 제제에 대한 수동적 면역을 위한 항체의 이용은 매우 유망한 방어 전략을 나타낸다. 그러한 제제에 대한 방어의 최종 라인은 노출된 개인의 면역 시스템이다. 생물학적 무기에 대한 최근 방어 전략은 향상된 역학적 감시, 예방접종, 및 항균제와 같은 측정을 포함한다. 생물학적 교전 및 생화학 테러의 잠재적 위협이 반대로 목표화된 인구에서 면역된 사람의 수와 비례하기 때문에, 생물학적 제제는 단지 감염가능한 사람의 실질적인 부분의 인구에 대하여 잠재적인 무기이다.

    예방접종은 특정 위협에 대하여 인구의 감수성을 감소시킬 수 있으며, 안전한 백신의 존재는 보호적 반응을 유도할 수 있다. 불행하게도, 예방접종에 의해 유도된 보호적 반응은 노출 및 질병의 발병 사이의 시간보다 긴 시간이 걸린다. 게다가, 많은 백신이 보호적 면역 반응이 발생하기 위하여 다수의 복용이 필요하다. 여기서 보호적 면역 반응은 응급상황에서 공격 후 급속한 예방을 공급하기 위해서 그들의 유용성이 제한된다. 게다가, 모든 백신 수급인이 권고된 면역법 스케쥴을 받은 이후에도 보호적 반응을 달성하지는 못한다.

    약물은 어떠한 제제에 노출된 후 주입되었을 때 보호를 공급할 수 있다. 그러나 생물학적 교전의 수많은 잠재적 제제에 대해 이용가능하지는 않다. 근래에는, 어떠한 작은-분자 약물도 미리 형성된 독소에 노출된 결과로 인한 질병을 방지하기에 이용가능하지 못하다. 단지 즉각적인 면역 상태를 제공할 수 있는 근래에 이용가능한 중재는 보호적 항체의 수동적 면역법이다 (Arturo Casadevall "Passive Antibody Administration (Immediate Immunity) as a Specific Defense Aganist Biological Weapons" from Emerging Infectious Disease, Posted 09/12/2002).

    보호적 면역을 제공하는 것에 더불어, 최신 항체에 기초한 치료는 새롭게 나타난 병원성 세균, 곰팡이, 바이러스 및 기생충에 대하여 잠재적으로 유용한 옵션을 구성한다 (A. Casadevall and MDScharff, Clinical Infectious Diseases 1995; 150). 악성 종양 및 종양 환자의 치료 (C. Botti et al, Leukemia 1997; Suppl 2:S55-59; B. Bodey, SE Siegel, and HE Kaiser, Anticancer Res 1996; 16(2):661), 자가면역질환 뿐만 아니라 이식된 기관의 스테로이드 저항성 거부반응의 치료는 또한 단클론항체 또는 다클론항체 제제의 이용을 통하여 달성될 수 있다 (N. Bonnefoy-Berard and JPRevillard, J Heart Lung Transplant 1996; 15(5):435-442; C. Colby, et al Ann Pharmacother 1996; 30(10):1164-1174; MJDugan, et al, Ann Hematol 1997; 75(1-2):41 2; W. Cendrowski, Boll Ist Sieroter Milan 1997; 58(4):339-343; LKKastrukoff, et al Can J Neurol Sci 1978; 5(2):175178; JE Walker et al J Neurol Sci 1976; 29(2-4):303309).

    항체 생산 기술에 있어서 최근의 진보는 인간 항체 시약을 제조하기 위한 수단을 제공한다. 반면 인간 혈청 용법과 연관된 독성을 피할 수 있다. 항체에 기초한 치료의 이점은 변통성(versatility), 낮은 독성, 병원균 특이성, 면역 기능 증가 및 알맞은 약물동력을 포함한다.

    단클론항체 치료의 임상적 용도는 최근에 나타났다. 단클론항체는 현재 장기이식, 종양, 감염성 질병, 심혈관계 질환 및 염증에서 치료로 승인받았다. 다수 의 단클론항체가 넓은 범위의 질병 증상을 치료하기 위한 임상 시도의 마지막 단계에 있다. 결과적으로, 단클론항체는 최근에 개발중인 가장 큰 약물 분류 중 하나를 나타낸다.

    치료용으로 단클론항체의 최근 인기에도 불구하고, 그것의 사용에는 몇가지 장애물이 존재한다. 예를 들면, 단클론항체에 대한 많은 치료적 용도는 특별히 자가면역 또는 종양과 같은 만성적 질병에 대한 반복적 주입이 필요하다. 쥐가 면역화에 편리하며 대부분 인간 항원을 외부물로 인식하기 때문에, 인간에 대한 치료적 가능성을 가지는 단클론항체는 뮤린 기원인 것이 전형적이다. 그러나, 뮤린 단클론항체는 인간 치료용으로 고유의 단점이 있다. 예를 들면, 그것은 인간 항체에 비해 인간에서 짧은 순환 반감기 때문에 단클론항체의 치료적 수준을 유지하기 위해서는 더욱 자주 복용할 필요가 있다. 더욱 결정적으로, 뮤린 면역글로블린의 반복적 주입은 인간 면역 시스템이 쥐 단백질을 외부물로 인식하고, 심각한 알러지 반응을 유발할 수 있는 인간 항-마우스 항체 반응을 일으킬 수 있는 가능성을 발생시킨다. 감소된 효용성 및 안정성의 가능성은 뮤린 단클론항체의 면역원을 감소시키기 위하여 수많은 기술의 개발을 유도하였다.

    다클론항체는 다수의 항원성 표적에 대하여 매우 강력하다. 그것은 복합적 질병과 연관된 "진화하는 표적"의 과반수를 표적화하고 죽일 수 있는 독특한 능력을 가진다. 또한, 모든 약물 분류에서, 단클로항체는 항원 변이의 경우 활성을 유지할 가장 높은 가능성을 가진다. 게다가, 단클론항체는 감염성 제제에 대하여 제한된 치료적 활성을 가지지만, 다클론항체는 독소를 중화시킬 수 있고 생물학적 교 전 제제뿐 아니라, 병원균을 제거하기 위한 면역 반응을 나타낼 수 있다.

    생산력의 미래 수요를 충족시키기 위하여 다클론항체 및 단클론항체 채굴대(production platforms)의 개발은 최근 많은 연구의 주제인 장래성 있는 영역을 나타낸다. 한가지 특별히 장래성 있는 전략은 인간 면역글로블린 유전자를 쥐 또는 다른 가축에 도입하는 것이다. 이 기술의 확장은 그들의 내부 면역글로블린 유전자의 비활성화를 포함한다. 양, 돼지 및 소와 같은 큰 동물은 모두 최근에 인간에 대한 과다면역 혈청 및 응고인자와 같은 혈장 유래물의 생산에 사용된다. 이것은 안정성 및 윤리성에서 그러한 종으로부터 인간 다클론항체의 사용을 지원할 수 있다. 각각의 종은 자연적으로 혈청 및 우유에서 상당한 양의 항체를 생산한다.

    면역글로블린을 암호화하는 유전자의 배열

    항체 분자는 가변 유전자 요소의 조합으로부터 조립되며, 생식 계열에서 다수의 가변 유전자 요소의 조합으로 인한 가능성은 숙주가 다수의 드문(extraordinary) 항원에 대한 항체를 중합할 수 있게 한다. 각 항체 분자는 경쇄(L) (카파(κ) 경쇄 또는 람다(λ) 경쇄가 될 수 있다) 및 중쇄(H)의 두 분류의 폴리펩타이드 체인으로 이루어진다. 중쇄 및 경쇄는 서로 결합하여 에피토프에 대한 결합 부위를 나타낸다. 단일 항체 분자는 두 개의 동일한 경쇄 및 중쇄를 가진다. 각 쇄는 가변 부위(V) 및 비가변 부위(C)로 구성된다. 가변 부위는 분자의 원 결합 위치로 구성된다. 다양한 항원 인식을 달성하기 위하여, 가변 부위를 암호화하는 DNA는 유전자 재배열을 겪게 된다. 비가변 부위 아미노산 서열은 항체를 생산하는 숙주뿐 아니라 특별한 항체의 아이소형에 대하여 특정적이며, 그러하여 재배열을 겪지 않는다.

    비록 단 하나의 결합 현상이 경쇄 유전자를 생산하기 위하여 필요한 반면 두 개의 현상이 완전한 중쇄 유전자를 생산하기 위하여 필요하지만, 재배열 메카니즘은 중쇄 및 경쇄 부위의 가변 부위와 유사하다. 가장 공통적인 재배열 모드는 두 개 유전자 단편 사이에 DNA의 루핑 아웃(looping out) 및 결실과 포함한다. 이것은 두 유전자 단편의 코딩 서열이 DNA에서 동일한 방향일 때 일어난다. 재조합의 두번째 모드는 상반된 전사 방향을 가지는 두 유전자 단편 사이에서 발생할 수 있다. 비록 이러한 재배열이 모든 Vκ와 Jκ 결합의 절반까지 설명할 수 있으나, 이러한 재조합 모드는 덜 공통적이다. 인간 Vκ 유전자 단편의 절반은 전사적 방향이 Jκ 유전자 단편과 반대이다.

    완전한 V 부위를 암호화하는 DNA 서열은 각각의 유전자 단편의 체세포적 재조합에 의해 제조된다. 면역글로블린 중쇄 또는 경쇄의 V 부위, 또는 V 영역은 하나 이상의 유전자 단편에 의해 암호화된다. 첫번째 단편은 경쇄의 첫번째 95-101 아미노산을 암호화하며, 이것이 V 영역의 대부분을 암호화하기 때문에 V 유전자 단편이라고 불린다. 두번째 단편은 V 영역의 리마인더(13 아미노산까지)를 암호하며, 결합(joining) 또는 J 유전자 단편이라고 불린다. V 및 J 유전자 단편의 결합은 경쇄 V 부위 전체를 암호화하는 지속적인 엑손을 만든다. 완전한 면역글로블린 경쇄 메신저 RNA를 만들기 위해서, V-부위 엑손이 전사 이후에 RNA 스플라이싱에 의해 C 부위 서열에 결합된다.

    중쇄 V 부위는 세 개의 유전자 단편으로 암호화된다. V 및 J 유전자 단편 (경쇄의 V L 및 J L 의 그것과 구별하기 위하여 V H 및 J H 로 표시하는)에 더하여, V H 및 J H 사이에 있는 다이버시티 또는 D H 유전자 단편으로 불리는 세번째 유전자 단편이 있다. 완전한 중쇄 V 부위를 생산하는 재조합 과정은 두 개의 별개의 단계에서 발생한다. 첫번째로, D H 유전자 단편이 J H 유전자 단편에 결합한다. 그 후 V H 유전자 단편이 DJ H 유전자 단편에 재배열되어 완전한 V H 부위 엑손을 만든다. 경쇄 유전자처럼, RNA 스플라이싱은 조합된 V 부위 서열을 이웃의 C 부위 유전자에 결합시킨다.

    항체 레퍼토리의 다양화는 두 단계에서 발생한다. 골수에 있는 전구 B 세포에서 Ig V, D 및 J 유전자 단편의 재조합("V(D)J 재조합")에 의하여 최초로, 그 후 체세포적 변이 및 성숙한 B 세포가 활성화되었을 때 재배열된 Ig 유전자의 클래스 스위치 재조합에 의하여 발생한다. 면역글로블린 체세포적 변이 및 클래스 스위칭은 면역 반응의 성숙 및 "기억" 반응의 생성에 중심적이다.

    항체의 게놈 부위는 매우 크며, 그것은 다른 염색체에 위치한다. 면역글로블린 유전자 단편은 세 개의 무리 또는 유전적 부위(κ, λ 및 중쇄 부위)로 구성된다. 각각은 약간 다르게 구성된다. 예를 들면, 인간에 있어서 면역글로블린 유전자는 다음과 같이 구성된다. λ 경쇄 부위는 22번 염색체에 위치하며 V λ 유전자 단편의 무리가 단일 C λ 유전자에 연결된 J λ 유전자 단편의 4개 세트가 이어진다. κ 경쇄 부위는 2번 염색체에 위치하며, V κ 유전자 단편의 무리가 J λ 유전자 단편의 무리, 그리고 단일 C κ 유전자에 이어진다. V H , D H 및 J H 유전자 단편의 무리와 C H 유전자가 있는 14번 염색체 상에서 중쇄 부위의 구성은 κ 부위와 유사하다. 경쇄 부위는 한가지 중요한 방법에서 다르다. 단일 C 부위 대신, 이것은 다른 아이소형과 상응하는 순차적으로 배열된 C 부위 시리즈를 포함한다. 이것은 5개의 면역글로블린 중쇄 아이소형이다: IgM, IgG, IgA, IgE 및 IgD. 일반적으로, 세포는 Ig M으로 시작하여 동시에 단 하나를 발현한다. IgG와 같은 다른 아이소형의 발현은 아이소형 스위칭을 통하여 발생할 수 있다.

    다양한 V, D, 및 J 유전자의 결합은 전반적으로 대략적으로 50,000 다른 가능한 VDJ(H) 조합 및 1,000개의 VJ(L)가 발생하는 무작위적인 현상이다. 그 후 중쇄 및 경쇄의 무작위적 페어링은 약 10 7 수의 항체 특이성을 발생시킨다. 다양성은 다른 유전적 단편의 막연한 결합에 의해 더욱 증가한다. 재배열은 모든 DNA 가닥에서 발생하지만, 단 한 가닥만이 전사된다 (대립유전자 배제로 인하여). DNA에 있어서 비가역적 결실로 인하여 B 세포의 일생에 있어서 단 한번의 재배열이 발생한다. 결과적으로, 각 성숙 B 세포는 하나의 면역적 특이성을 유지하며 자손 또는 클론으로 유지된다. 이것은 클론 선택의 분자적 기초를 구성한다; 예를 들면, 각 항원 결정기가 특이적 수용체 분자를 가지는 B 림프구의 이미 존재하는 클론의 반응을 유발한다. V(D)J 재조합에 의해 설립된 B 세포의 초기 레파토리는 기본적으로 근접하게 연결된 유전자, 재조합 활성화 유전자 (RAG)-1 및 RAG-2에 의해 조절 된다.

    지난 10년 동안, Ig 유전자 다양성 및 항체 레파토리 개발에서 척추동물 사이의 상당한 다양성이 알려졌다. 설치류 및 인간은 5 분류의 중쇄, IgM, IgD, IgG, IgE 및 IgA를 가지며, 각각은 IgG의 4개의 소분류를 가지며 IgA의 한 개 또는 두 개의 소분류를 가진다. 반면에 토끼는 단일 IgG 중쇄 유전자를 가지나, 다른 IgA 소분류에 대한 13 유전자를 가진다 (Burnett, RC et al. EMBO J 8:4047; Honjo, In Honjo, T, Alt. FWTH eds, Immunoglobulin Genes p. 123 Academic Press, New York). 돼지는 적어도 6개의 IgG 소분류를 가지며 (Kacskovics, I et al. 1994 J Immunol 153:3565), IgD를 가지지 않는다 (Bulter et al. 1996 Inter. Immunol 8:1897-1904). IgD를 암호화하는 유전자는 단지 설치류 및 영장류에서 개시되어 왔다. 레파토리 메카니즘 개발에서 다양성은 닭, 토끼, 돼지 및 사육된 소에서 보고된 설치류 및 영장류에서 보여진 패턴과 반대로 예시된다. 전자 그룹은 7 내지 10 과(family)에 속하는 다수의 V H 유전자를 가지는 반면 (Rathbun, G. In Hongo, T. Alt. FW and Rabbitts, TH, eds, Immunoglobulin Genes, p 63, Academic press New York), 후자 그룹의 각 구성의 V H 유전자는 단일 V H 유전자 과에 속한다 (Sun, J. et al. 1994 J.Immunol. 1553:56118; Dufour, V et al. 1996, J Immunol. 156:2163). 토끼는 예외로 하여, 이 과는 25 미만의 유전자로 구성된다. 설치류 및 영장류는 4 내지 6 J H 단편을 이용할 수 있는 반면, 단일 J H 는 닭에 있어서 레파토리 개발로 이용할 수 있다 (Reynaud et al. 1989 Adv. Immunol. 57:353). 유사하게, Bulter et al (1996 Inter. Immunol 8:1897-1904)는 돼지가 단일 J H 유전자를 가지는 점에서 닭과 공통점이 있다고 가정하였다. 이러한 종은 일반적으로 적은 수의 V, D 및 J를 가진다; 돼지 및 소에는 20미만의 유전자 단편으로 이루어지는 단일 VH 유전자 과가 존재한다 (Bulter et al, Advances in Swine in Biomedical Research, eds: Tumbleson and Schook, 1996; Sinclair et al, J. Immunol. 159:3883, 1997). 적은 수의 J 및 D 유전자 단편과 함께, 이것은 유전자 재배열에 의해 제조되는 적은 다양성을 중요하게 발생시킨다. 그러나, 이러한 종에서 다수의 경쇄 유전자가 나타난다. 인간 및 쥐와 유사하게, 이러한 종에서 단일 κ 경쇄를 발현하지만, 다수의 λ 경쇄는 발현하지 못한다. 그러나, 이것은 재배열에 의해 달성되는 제한된 다양성에 영향을 주는 것으로 보이지 않는다.

    100 이상의 V H , 20-30 D H 및 4 내지 6 J H 유전자 단편의 조합적 결합은 인간에 있어서 항체 레파토리를 생산하는 주된 메카니즘이기 때문에, 적은 V H , D H 및 J H 단편을 가진 종은 적은 레파토리를 생산하거나 레파토르 개발을 위한 대체적인 메카니즘을 이용하여야 한다. 이러한 종에 있어서, 이것은 중요한 2차적 레파토리 개발로 보여지며, 회장 페이어 패취(ileal Peyer's patch)와 같은 매우 특정화된 림프 조직에서 발생한다 (Binns and Licence, Adv. Exp. Med. Biol. 186:661, 1985). 2차적 레파토리 개발은 이러한 종에 있어서 무작위적 및 완전하게 이해되지 않은 과정으로 체세포 변이의 과정에 의해 발생한다. 이러한 레파토리 다양성에 대한 메카니즘은 주형화된 변이, 또는 유전자 전환 (Sun et al, J. Immunol. 153: 5618, 1994) 및 체세포 과다변이로 나타난다.

    유전자 전환은 닭, 토끼 및 소와 같은 고등 척추동물에서 항체 다양성에 대해 중요하다. 그러나, 쥐에 있어서는 전환 현상이 내부 항체 유전자 사이에서 드물게 나타난다. 유전자 전환은 공급 항체 V 유전자 단편으로부터 수급 V 유전자 단편까지 상동 서열의 전달에 의해 특징화되는 독특한 다양한 메카니즘이다. 공급 및 수급 단편이 수많은 서열 차이를 가진다면, 유전자 전환이 단일 현상에 의해 V 부위로 서열 변이를 도입할 수 있다. 이러한 종에 있어서, 유전자 전환 현상은 B 세포 분열 동안 항원 노출 전 및/또는 후에 발생할 수 있다 (Tsai et al. International Immunology, Vol. 14, No. 1, 55-64, January 2002).

    체세포 과다변이는 모든 고등 척추 동물에서 항체 유전자의 다양성을 달성한다. 항체 V(D)J 단편으로 단일 포인트 변이의 도입에 의해 나타내어 질 수 있다. 일반적으로, 과다변이는 항원성 자극에 의해 B 세포에서 활성화되는 것으로 나타난다.

    인간화 면역 시스템을 가진 동물의 생산

    인간 치료를 위하여 쥐에서 생산된 항체의 면역성을 감소시키기 위하여, 다양한 시도가 현재 인간화로 알려진 과정에 있어서 쥐 단백질 서열을 인간 단백질 서열로 교체하기 위하여 이루어졌다. 트랜스제닉 마우스가 그 자신의 면역글로블린 유전자가 기능적으로 인간 면역글로블린 유전자로 교체되어 면역법에 의해 인간 항체를 생산할 수 있도록 제작되었다. 마우스 항체 생산의 제거는 마우스 Ig 유전 자 재배열 및 발현 과정에 연관되는 결정적인 시스-활성 서열을 제거하는 유전자-타겟팅 기술을 사용하여 배아 줄기(ES) 세포에서 마우스 Ig 유전자의 비활성화로 달성되었다. 이러한 변이 마우스에 있어서 B 세포 성장은 인간 생식계-구성 H 및 κ L-체인 작은 부분 도입유전자 (transgene)을 포함하는 메가베이스-사이즈 YACs의 도입에 의해 회복될 수 있다. 트랜스제닉 마우스에서 인간 항체의 충분한 발현은 혈액에서 100ug/l 수준으로 우세하다. 이러한 발현 수준은 인간 Ig 유전자를 발현하는 천연형 마우스에서 감지되는 것보다 몇 백배 높은 것이다. 이것은 마우스에 의해 생산되는 인간 항체를 증가시키기 위하여 내부 마우스 Ig 유전자를 비활성화하여야 하는 중요성을 나타낸다.

    첫번째 인간화 시도는 재조합 항체를 제작하기 위하여 이용된 분자 생물학 기술을 이용하였다. 예를 들면, 합텐(hapten)에 특이적인 마우스 항체로부터 상보성 결정부위(CDR)이 인간 항체 구조로 이식되었으며, CDR 교체를 나타냈다. 새로운 항체는 CDR 서열에 의해 옮겨지는 결합 특이성을 보유했다 (PT Jones et al. Nature 321: 522-525 (1986)). 인간화의 다음 수준은 전체적인 마우스 VH 부위를 감마와 같은 인간 비가변 부위로 조합하는 것을 포함하였다 (SLMorrison et al., Proc. Natl. Acad. Sci., 81, pp. 6851-6855 (1984)). 그러나, 이러한 30% 이상의 이종 서열을 포함하는 키메릭 항체는 때때로 단지 최저 면역성보다 낮은 총괄적인 이종 항체이다 (M. Bruggemann et al., J. Exp. Med., 170, pp. 2153-2157 (1989)).

    결과적으로, 시도는 인간 면역글로블린 유전자를 마우스에 도입하는 것으로 수행되었으며, 그리하여 인간 서열을 가지는 항체를 가지는 항원에 반응할 수 있는 트랜스제닉 마우스를 제조하였다 (Bruggemann et al. Proc. Nat'l. Acad. Sci. USA 86:6709-6713 (1989)). 인간 면역글로블린 게놈 부위의 큰 사이즈 때문에, 이러한 시도는 이용가능한 클로닝 비히클에 의해 안전하게 유지될 수 있는 DNA 양에 의해 제한되는 것으로 생각되었다. 결과적으로, 많은 연구자들이 제한된 수의 V 부위를 포함하는 미니-부위를 생산하고 자연적 또는 생식계 구성과 비교하여 유전자 사이에 변형된 공간적 거리를 가지는 것에 집중하였다 (예를 들어, US Pat. No. 5,569,825). 이러한 연구는 마우스에서 인간 서열 항체의 생산이 가능하지만, 증가하는 항체 요법의 수요를 충족시키기 위하여 이러한 트랜스제닉 동물로부터 다양한 결합 특이성 및 작동 기능 (아이소형)을 얻는 것을 고려할 때 심각한 장애가 남아있다.

    추가적인 다양성을 제공하기 위하여, 연구가 인간 Ig 부위의 거대한 생식계 절편을 트랜스제닉 포유동물에 첨가하는 것으로 이루어졌다. 예를 들면, 동일한 간격으로 배열된 인간 V, D 및 J 부위 유전자의 다수는 인간 게놈의 배열되지 않은 생식계에서 발견되며, 인간 Cμ 및 Cδ 비가변 부위가 효모 인공적 염색체 (YAC) 클로닝 벡터를 이용하여 마우스에 도입되었다 (예를 들면, WO 94/02602). 인간 감마-2 비가변 부위 및 클래스-스위치 재조합에 필요한 상류 서열을 암호화하는 서열을 포함하는 22Kb DNA 절편은 나중에 이전의 도입유전자에 부착되었다. 게다가, 또한 인간 게놈의 재배열되지 않은 생식계에 있어서 발견되는 실질적으로 동일한 간격으로 배열된 Vκ, Jκ 및 Cκ 부위 유전자를 포함하는 인간 카파 부위 부분이 YACS를 이용하여 마우스에 도입되었다. 유전자 타겟팅이 뮤린 IgH 및 카파 경쇄 면역글로블린 유전자 부위를 비활성화시키기 위하여 사용되었으며, 그러한 넉아웃 균주는 비활성화된 뮤린 면역글로블린 상황에서 인간 Vκ, Jκ 및 Cκ 부위 유전자뿐 아니라, 인간 V, D, J, Cμ, Cδ 및 Cγ2 비가변 부위를 가지는 마우스 라인을 제조하기 위하여 상기의 트랜스제닉 균주로 사육되었다 (예를 들면, PCT patent application WO94/02602 to Kucherlapati et al.; see also Mendez et al., Nature Genetics 15:146-156 (1997)).

    내생 로커스(loci)의 유전자 타겟팅과 컴비네이션된 클로닝 벡터로서의 효모 인공 크로모좀 및 트랜스제닉 마우스 스트레인의 브리딩(breeding)은 항체 다양성의 문제에 대한 한 해결책을 제공한다. 몇 가지의 장점은 상기 접근법으로 인해 얻어진다. 한 가지 장점은 YAC가 DNA의 수백 킬로베이스를 숙주 세포내로 트랜스퍼하는데에 사용될 수 있다는 점이다. 그러므로, YAC 클로닝 전달체의 사용으로 인하여 전체 인간 Ig 해비 및 라이트 체인 부위의 상당 부분이 트랜스제닉 마우스내로 함입(inclusion)되게 함으로써 인간에게 유용한 잠재적 다양성의 레벨에 도달하게 된다. 상기 접근법의 또 다른 장점은 많은 수의 V 유전자들이 뮤린 이뮤노글로불린 생산이 결핍된 마이스에서 풀(full) B 세포의 발달이 복구되는 것으로 나타났다는 점이다. 이는 이러한 개조된 마우스가 임의의 주어진 이뮤노젠에 대해 강화된 인간 항체 반응을 축적하기 위한 필수 세포를 제공하게 한다. (예를 들면, WO 94/02602.; L. Green and A. Jakobovits, J. Exp. Med. 188:483-495 (1998)참조). 또 다른 장점은 효모에서 고빈도 상동재조합(high frequency homologous recombination)을 사용하여 YAC 상에서 서열을 제거하거나 삽입할 수 있다는 점이다. 이는 YAC 트랜스유전자를 손쉽게 엔지니어링할 수 있게 해준다.

    덧붙여, Green et al. NaturejGenetics 7:13-21 (1994)에서는, 핵심 가변부 및 불변부를 함유하는 인간 해비 체인 로커스 및 카파 라이트 체인 로커스에 각각 245 kb 및 190 kb-크기의 점라인 배열(germline configuration)을 함유하는 YAC의 발생에 대해 개시하고 있다.

    그린 등의 연구에 의하면, 최근 인간 해비 체인 로커스 및 카파 라이트 체인 로커스의 메가베이스 크기의, 점라인 배열 YAC 조각 각각을 도입하여 인간 항체 레퍼토리를 대략 80% 이상 신장시켰으며, XenoMouse™을 생산하였다. 예를 들면, Mendez et al. Nature Genetics 15:146-156 (1997), Green and Jakobovits J. Exp. Med. 188:483-495 (1998), European Patent No. EP 0 463 151 Bl, PCT Publication Nos. WO 94/02602, WO 96/34096 and WO 98/24893 참조.

    인간 항체를 생산하는 포유류를 발생시키는 몇 가지 방법이 존재한다. 특히, "미니로커스(minilocus)" 접근법이 있는데, GenPharm International, Inc. 및 Medical Research Council에서 전형화한 방법이며, Abgenix, Inc.(기존의 Cell Genesys)가 전형화한 Ig 로커스의 거대한 실질적으로 점라인인 조각의 YAC 도입이다. 이러한 전제 또는 실질적으로 전체 로커스의 마이크로셀 퓨전을 사용한 도입은 Kirin Beer Kabushiki Kaisha에 의해 전형화되었다.

    미니로커스 접근법에 있어서, 외인성 Ig 로커스는 Ig 로커스로부터의 조각들(각각의 유전자)의 함입을 통해 모방된다. 따라서, 하나 이상의 VH 유전자, 하 나 이상의 DH 유전자, 하나 이상의 J H 유전자, mu 불변부, 및 2차 불변부 (예컨대 감마 불변부)는 동물내로 삽입되기 위한 작재물내에 형성된다. US Patent Nos. 5,545,807, 5,545,806, 5,625,825, 5,625,126, 5,633,425, 5,661,016, 5,770,429, 5,789,650, 5,814,318, 5,591,669, 5,612,205, 5,721,367, 5,789,215, 5,643,763; European Patent No. 0 546 073; PCT Publication Nos. WO 92/03918, WO 92/22645, WO 92/22647, WO 92/22670, WO 93/12227, WO 94/00569, WO 94/25585, WO 96/14436, WO 97/13852, and WO 98/24884; Taylor et al. Nucleic Acids Research 20:6287-6295 (1992), Chen et al. International Immunology 5:647-656 (1993), Tuaillon et al. J. Immunol. 154:6453-6465 (1995), Choi et al. Nature Genetics 4:117-123 (1993), Lonberg et al. Nature 368:856-859 (1994), Taylor et al. International Immunology 6:579-591 (1994), Tuaillon et al. J. Immunol. 154:6453-6465 (1995), and Fishwild et al. Nature Biotech. 14:845-851 (1996) 참조.

    마이크로세포 퓨전 접근법에서, 전제 또는 부분적 인간 크로모좀이 마우스내로 도입될 수 있다 (예컨대 European Patent Application No. EP 0 843 961 Al 참조). 이 접근법으로 발생한 인간 Ig 해비 체인 로커스를 함유하는 마우스는 보통 인간 불변부 유전자를 하나 이상, 및 잠재적으로 모두 포함한다. 상기 마우스는 그러므로 다수의 다른 불변부를 갖는 특정 항원에 결합하는 항체를 생산할 것이다.

    마우스는 인간에 있어서, 인간 이뮤노글로불린의 발현을 위한 가장 개발된 동물로 남아있으나, 최근 기술적 진보로 인하여 이러한 기술을 소와 같은 다른 동물에 적용하기 시작하는 등의 진보가 이루어졌다. 마우스에의 통상의 접근법은 마우스의 엠브리오닉 줄기세포를 유전적으로 변형시켜 뮤린 이뮤노글로불린을 녹-아웃시키고, 인간 이뮤노글로불린을 함유하는 YAC을 ES 세포 내로 삽입하는 것이었다. 그러나, ES 세포는 소 또는 다른 큰 동물, 예컨대 양 및 돼지에는 유용하지 않다. 따라서, 이뮤노글로불린 유전자가 녹-아웃된, 인간 항체를 발현하는 거대한 동물을 발생시키기 위한 가능성이 존재하는 몇 가지 기본적인 개발이 이루어졌다. 유전적으로 변형된 동물을 발달시키기 위한 ES 세포 조정(manipulation)에 대한 대안은 유전적으로 변형된 체세포를 이용한 클로닝이다. 핵 트랜스퍼를 위한 유전적으로 변형된 체세포를 이용한 클로닝만이 최근 달성되었다.

    1997년 (Wilmut, L, et al (1997) Nature 385: 810-813) 성인 체세포로부터 탄생한 돌리(복제양)이 발표된 이래, 소(cattle)를 포함한 유제동물(ungulates)(Cibelli, J et al 1998 Science 280: 1266-1258; Kubota, C. et al.2000 Proc. Natl. Acad. Sci 97: 990-995), 염소 (Baguisi, A. et al., (1999) Nat. Biotechnology 17: 456-461), 및 돼지 (Polejaeva, IA, et al. 2000 Nature 407: 86-90; Betthauser, J. et al. 2000 Nat. Biotechnology 18: 1055-1059)가 복제되었다.

    다음 기술적 진보는 핵 트랜스퍼에 우선하여 세포를 유전적으로 변형시켜 유전적으로 변형된 동물을 생산하는 기술의 개발이다. PPL 치료를 위한 PCT publication No. WO 00/51424에는 핵 트랜스퍼를 위한 체세포의 타겟팅된 유전적 변형이 개시되어 있다.

    상기 기본적인 개발에 이어서, 유전자의 단일 및 이중 대립유전자 녹-아웃 및 이러한 변형이 된 살아있는 동물의 탄생이 보고되었다. 2002년과 2004년 사이, 세 가지 독립적 그룹, Immerge Biotherapeutics, Inc.는 the University of Missouri와의 공동연구로 (Lai et al. (Science (2002) 295: 1089-1092) & Kolber-Simonds et al. (PNAS. (2004) 101(19):7335-40)), Alexion Pharmaceuticals (Ramsoondar et al. (Biol Reprod (2003)69: 437-445) 및 Revivicor, Inc. (Dai et al. (Nature Biotechnology (2002) 20: 251-255) & Phelps et al. (Science (2003) Jan 17;299(5605):411-4))는 목표하는 유전적 결손을 가진 체세포로부터 핵을 트랜스퍼하여 알파-1,3-GT 유전자의 한 대립유전자 또는 양 대립유전자가 결핍된 돼지를 생산하였다. 2003년, Sedai et al. (Transplantation (2003) 76:900-902)은 소의 알파-1,3-GT 유전자의 한 대립유전자를 목표로한 파괴(disruption)를 보고하였고, 이어서, 유전적으로 변형된 세포의 핵의 핵 트랜스퍼 및 트랜스제닉 태아의 생산에 성공하였다.

    따라서, 거대 동물에서 이뮤노글로불린 유전자의 녹킹-아웃 및 인간 이뮤노글로불린 로커스를 그들의 세포내로 삽입하는 것의 실행가능성은 현재 개발이 시작된 단계이다. 그러나, 이뮤노글로불린 유전자의 복잡성 및 종의 다양성으로 인해, Ig 카파, 람바 및 해비 체인의 유전적 서열 및 배열은 대부분의 종에 있어 그 이해가 부족한 상황이다. 예를 들면, 돼지의 경우, 부분적인 유전적 서열 및 조직(organization)만이 해비 체인 불변 알파, 해비 체인 불변 mu, 및 해비 체인 불 변 델타에서 발견된 상태이다 (Brown and Butler MoI Immunol. 1994 Jun;31(8):633-42, Butler et al Vet Immunol Immunopathol. 1994 Oct;43(l-3):5-12, and Zhao et al J Immunol. 2003 Aug l;171(3):1312-8).

    소의 경우, 이뮤노글로불린 해비 체인 로커스가 맵핑되었으며 (Zhao et al. 2003 J. Biol. Chem. 278:35024-32) 소의 카파 유전자에 대한 cDNA 서열이 알려졌다 (예를 들면, US Patent Publication No. 2003/0037347 참조). 또한, 대략 4.6kb의 소의 mu 해비 체인 로커스가 시퀀싱되었고, 소의 mu 해비 체인의 하나의 또는 양 대립유전자가 파괴되어 해비 체인 이뮤노글로불린의 발현이 감소된 트랜스제닉 송아지가 탄생되었다. 또한, 인간 Ig H-체인 및 K L-체인 전체의 비조정된(unarrange) 서열을 포함하는 포유류 인공 크로모좀(MAC) 벡터가 소의 태아상태의 파이브로블라스트 세포의 마이크로셀-매개 크로모좀 트랜스퍼 및 핵 트랜스퍼 기술로 소 (TC 소)내로 도입되었다 (예를 들면, Kuroiwa et al. 2002 Nature Biotechnology 20:889, Kuroiwa et al. 2004 Nat Genet. Jun 6 Epub, US Patent Publication Nos. 2003/0037347, 2003/0056237, 2004/0068760 and PCT Publication No. WO 02/07648 참조).

    인간 이뮤노글로불린을 발현하는 소의 생산에 있어서는 현저한 진보가 있었으나, 다른 거대 동물, 예컨대 양, 염소 및 돼지에 있어서는 그 성취정도가 미미하였다. 비록 양, 염소 및 돼지의 이뮤노글로불린 유전자에 대한 cDNA 서열 정보를 GenBANK에서 쉽게 얻을 수 있지만, 광범위하게 재배열 된 이뮤노글로불린 로커스의 유니크한 성질은 mRNA(또는 cDNA)에 존재하는 것으로 알려진 서열을 넘어 특성화될 필요가 있다. 이뮤노글로불린 로커스는 모듈적이고(modular), 코딩 부위는 잉여적이며(redundant), 공지된 코딩 부위의 결손은 로커스의 기능이 변형되는 것을 보증하지 않는다. 예를 들면, 만약 하나가 해비 페인의 가변부의 코딩 부위에서 결손되었다고 한다면, 그 로커스의 기능은 현저하게 변형되지는 않는데, 그 이유는 수백개의 다른 기능성 가변부 유전자가 그 부위에 남아있기 때문이다. 그러므로, 우선 잠재적 "아킬레스 건"을 발견하기 위하여 로커스를 특성화하여야 한다.

    소에 있어, 인간 항체를 발현하는 진보에 불구하고, 더 큰 도전이 남아있으며, 이는 내생 소의 Ig 유전자의 불활성화, 인간 항체의 발현 레벨 증가, 및 이뮤노글로불린 유전자의 서열 및 배열에 대해 잘 알려지지 않은 다른 거대 동물, 예컨대 돼지에 있어서 인간 항체 발현과 같은 도전이 남아있다.

    따라서, 본원 발명의 목적은 유제동물의 이뮤노글로불린 점라인 유전자 서열의 배열을 제공하는 것이다.

    본원 발명의 또 다른 목적은 새로운 유제동물의 이뮤노글로불린 유전 서열을 제공하는 것이다.

    본원 발명의 또 다른 목적은 해비 및/또는 라이트 체인 이뮤노글로불린 유전자의 적어도 하나의 대립유전자가 결핍된 세포, 조직 및 동물을 제공하는 것이다.

    본원 발명의 또 다른 목적은 인간 이뮤노글로불린을 발현하는 유제동물을 제공하는 것이다.

    본원 발명의 또 다른 목적은 새로운 유제동물의 이뮤노글로불린 유전자 서열의 적어도 하나의 대립유전자가 결핍된 세포, 조직 및 동물을 발생시키기 위한 방 법 및/또는 인간 이뮤노글로불린을 발현하는 방법을 제공하는 것이다.

    발명의 요약

    본원 발명은 처음으로 유제동물의 이뮤노글로불린 점라인 유전자 서열의 배열 뿐만 아니라 그들의 새로운 유전자 서열을 제공한다. 또한, 해비 또는 라이트 체인 이뮤노글로불린 유전자의 적어도 하나의 대립유전자가 결핍된 새로운 유제동물 세포, 조직 및 동물을 제공한다. 이러한 발견에 기초하여, 유제동물은 해비 또는 라이트 체인 이뮤노글로불린 유전자의 적어도 하나의 대립유전자가 완전히 결핍된 새로운 유제동물 세포, 조직 및 동물이 생산될 수 있다. 또한, 이러한 유제동물은 이종의, 예컨대 인간의 이뮤노글로불린 로커스 또는 그의 조각을 발현하기 위해 더욱 변형될 수 있다.

    본원 발명의 일면에서, 임의의 기능성 내생 이뮤노글로불린의 발현이 결핍된 트랜스제닉 유제동물이 제공된다. 구체예에서, 유제동물은 임의의 내생 해비 및/또는 라이트 체인 이뮤노글로불린의 발현이 결핍될 수 있다. 라이트 체인 이뮤노글로불린은 카파 및/또는 람다 이뮤노글로불린일 수 있다. 또한 구체예에서, 트랜스제닉 유제동물은 내생 이뮤노글로불린의 적어도 하나의 대립유전자의 발현이 결핍된 것이 제공되며, 여기에서 이뮤노글로불린은 해비 체인, 카파 라이트 체인 및 람다 라이트 체인 또는 그의 임의의 조합으로 이루어진 그룹에서 선택된다. 구체예에서, 기능성 내생 이뮤노글로불린의 발현은 내생 이뮤노글로불린 로커스의 유전적 타겟팅을 통해 성취될 수 있으며 그 결과 내생 이뮤노글로불린의 발현이 방지된 다. 또 다른 구체예에서, 유전적 타겟팅은 상동재조합을 통해 성취될 수 있다. 다른 구체예에서, 트랜스제닉 유제동물은 핵 트랜스퍼를 통해 생산될 수 있다.

    다른 구체예에서, 기능성 내생 이뮤노글로불린의 임의의 발현이 결핍된 트랜스제닉 유제동물은 이종 이뮤노글로불린 로커스를 발현하기 위하여 추가로 유전적으로 변형될 수 있다. 구체예에서, 이종 이뮤노글로불린 로커스를 함유하는 돼지과 동물이 제공된다. 구체예에서, 이종 이뮤노글로불린 로커스는 해비 및/또는 라이트 페인 이뮤노글로불린 또는 그의 조각일 수 있다. 또 다른 구체예에서, 이종 이뮤노글로불린 로커스는 카파 체인 로커스 또는 그의 조각 및/또는 람다 체인 로커스 또는 그의 조각일 수 있다. 또 다른 구체예에서, 인공 크로모좀 (AC)는 이종 이뮤노글로불린을 포함할 수 있다. 구체예에서, AC는 효모 AC 또는 포유류 AC 일 수 있다. 구체예에서, 이종 로커스는 인간 이뮤노글로불린 로커스 또는 그의 조각일 수 있다. 구체예에서, 인간 이뮤노글로불린 로커스는 인간 크로모좀 14, 인간 크로모좀 2, 및 인간 크로모좀 22 또는 그의 조각일 수 있다. 또 다른 구체예에서, 인간 이뮤노글로불린 로커스는 재배열될 수 있는 인간 이뮤노글로불린의 임의의 조각을 포함할 수 있다. 구체예에서, 인간 이뮤노글로불린 로커스는 재배열될 수 있는 인간 이뮤노글로불린 해비 체인 및 인간 이뮤노글로불린 라이트 체인의 임의의 조각을 포함할 수 있다. 구체예에서, 인간 이뮤노글로불린 로커스는 항원에 노출되었을 때 항체를 생산할 수 있는 임의의 인간 이뮤노글로불린 로커스 또는 그의 조각을 포함할 수 있따. 특정 구체예에서, 외인성 인간 이뮤노글로불린은 하나 이상의 항원에 노출되어 반응하여 B 세포에 발현되어 이종 이뮤노글로불린을 생산 할 수 있다.

    본 발명의 또 하나의 태양에서, 이종 면역 글로부린 유전자 좌 또는 그의 단편을 표현하는 유전자 도입 유제동물이 제공되며, 여기서 면역 글로부린은 내생적 유제동물 염색체 내에서 통합되어 있는 면역 글로부린 유전자 좌로부터 표현할 수 있다. 하나의 실시태양에서, 이종 변역 글로부린 유전자 좌는 자손에게 유전될 수 있다. 또 하나의 실시태양에서 이종 면역 글로부린 유전자 좌는 자손에 의한 남성 병원균을 통하여 유전될 수 있다. 또 하나의 실시태양에서, 인공 염색체 (AC)는 이종 면역 글로부린을 함유할 수 있다. 하나의 실시태양에서 AC는 효모 AC 또는 포유동물 AC일 수 있다. 추가의 실시태양에서, 이종 유전자 좌는 인간 면역 글로부린 유전자 좌 또는 그의 단편일 수 있다. 하나의 실시태양에서 인간 면역 글로부린 유전자 좌는 인간 염색체 14, 인간 염색체 2, 및 인간 염색체 22 또는 그의 단편일 수 있다. 또 하나의 실시태양에서 인간 면역 글로부린 유전자 좌는 재배열을 수행할 수 있는 인간 면역 글로부린의 단편을 포함할 수 있다. 추가의 실시태양에서, 인간 면역 글로부린 유전자 좌는 재배열을 수행할 수 있는 인간 면역 글로부린 경쇄 및 인간 면역 글로부린 중쇄의 단편을 포함할 수 있다. 추가의 실시태양에서, 인간 면역 글로부린 유전자 좌는 항원에 대한 노출시 항체를 생산할 수 있는 인간 면역 글로부린 유전자 좌 또는 그의 단편을 포함할 수 있다. 특별한 실시태양에서, 외인성 인간 면역 글로부린은 하나 이상의 항원 노출에 대한 반응에서 이종 면역 글로부린을 생산하기 위해 B세포로 표현할 수 있다.

    본원 발명의 일면에서, 유제동물의 이뮤노글로불린의 해비 체인 로커스를 코 딩하는 새로운 유전자 서열이 제공된다. 구체예에서, 적어도 하나의 가변부, 두 개의 다양성부(diversity region), 적어도 네 개의 연결부(joining region), 예컨대 mu 불변부를 포함하는 돼지의 해비 체인을 코딩하는 분리된 뉴클레오티드 서열이 제공되며, 예를 들면 서열번호 29로 대표된다. 다른 구체예에서, 돼지의 해비 체인 유전자 서열의 적어도 네 개의 연결부(joining region) 및 적어도 하나의 불변부, 예컨대 mu 불변부를 포함하는 분리된 뉴클레오티드 서열을 제공하며, 예를 들면, 서열번호 4로 대표된다. 구체예에서, 돼지의 해비 체인 유전자 서열의 최초 연결부에 대한 5'플랭킹 서열(flanking sequence)을 포함하는 뉴클레오티드 서열이 제공되며, 예를 들면, 서열번호 1로 대표된다. 구체예에서, 돼지의 해비 체인 유전자 서열의 최초 연결부에 대한 3'플랭킹 서열(flanking sequence)을 포함하는 뉴클레오티드 서열이 제공되며, 예를 들면, 서열번호 4의 3' 부위로 대표된다. 구체예에서, 서열번호 1, 4, 또는 29로 정의된 분리된 뉴클레오티드 서열이 제공된다. 핵산 서열은 서열번호 1, 4, 또는 29와 적어도 80, 85, 90, 95, 98 또는 99% 상동성이 있는 것이 또한 제공된다. 또한, 서열번호 1, 4, 또는 29에서 적어도 10, 15, 17, 20, 25 또는 30의 연속된 뉴클레오티드(contiguous nucleotides)가 제공된다. 구체예에서, 서열번호 4 또는 서열번호 29의 잔기 1-9,070에서 적어도 17, 20, 25 또는 30의 연속된 뉴클레오티드를 포함하는 뉴클레오티드 서열을 제공한다. 다른 구체예에서, 서열 29의 잔기 9,070-11039를 포함하는 뉴클레오티드 서열이 제공된다. 구체예에서, 임의로 엄격한 조건하에서, 서열번호 1, 4, 또는 29에 대한 하이브리드된 뉴클레오티드 서열, 뿐만 아니라 그와 상동인 뉴클레오티드가 제공된 다.

    또 다른 구체예에서, 유제동물의 이뮤노글로불린의 카파 라이트 체인 로커스를 코딩하는 새로운 유전자 서열이 제공된다. 본원 발명은 유제동물의 카파 라이트 체인 부위의 유전자 서열을 최초로 보고하는 것이다. 구체예에서, 돼지의 카파 라이트 체인 로커스를 코딩하는 핵산 서열이 제공된다. 또 다른 구체예에서, 카파 라이트 체인의 적어도 하나의 연결부, 하나의 불변부 및/또는 하나의 인헨서 부를 포함할 수 있는 핵산 서열이 제공된다. 구체예에서, 적어도 다섯 개의 연결 부, 하나의 불변부 및 하나의 인헨서 부를 포함하는 뉴클레오티드 서열이 제공될 수 있으며, 예를 들면 서열번호 30으로 대표된다. 구체예에서, 적어도 하나, 적어도 두 개, 적어도 세 개, 적어도 네 개 또는 다섯 개의 연결부 및 돼지의 유전자 카파 라이트 체인의 연결부에 대한 3' 플랜킹 서열을 포함하는 분리된 뉴클레오티드 서열이 제공되며, 예를 들면 서열번호 12로 대표된다. 또 다른 구체예에서, 돼지의 유전자 카파 라이트 체인의 분리된 뉴클레오티드 서열이 제공되며, 최초 연결부에 대한 5' 플랜킹 서열을 포함하고, 예를 들면 서열번호 25로 대표된다. 구체예에서, 돼지의 유전자 카파 라이트 체인의 불변부 및, 임의로, 인헨서 부위의 5' 부분에 대한 3' 플랜킹 서열을 포함하는 분리된 뉴클레오티드 서열이 제공되며, 서열번호 15, 16 및/또는 19로 대표된다.

    구체예에서, 서열번호 30, 12, 25, 15, 16 또는 19 인 분리된 뉴클레오티드 서열이 제공된다. 서열번호 30, 12, 25, 15, 16 또는 19에 대해 적어도 80, 85, 90, 95, 98 또는 99% 상동성이 있는 핵산 서열이 또한 제공된다. 또한, 서열번호 30, 12, 25, 15, 16 또는 19에서 적어도 10, 15, 17, 20, 25 또는 30 연속한 뉴클레오티드 서열을 포함하는 뉴클레오티드 서열이 제공된다. 또한, 서열번호 30, 12, 25, 15, 16 또는 19에 대해, 임의로 엄격한 조건하에서, 하이브리드된 뉴클레오티드 서열 뿐만 아니라 그에 상동적인 뉴클레오티드가 제공된다.

    구체예에서, 유제동물의 이뮤노글로불린의 람다 라이트 체인 로커스를 코딩하는 새로운 유전자 서열이 제공된다. 본원 발명은 최초로 유제동물의 람다 라이트 체인 부위의 유전자 서열을 제공한다. 구체예에서, 돼지의 람자 라이트 체인 뉴클레오티드는 J 내지 C 단위의 연쇄체(concatamer)를 포함한다. 특정 구체예에서, 분리된 돼지의 람다 뉴클레오티드 서열이 제공되며, 예컨대 서열번호 28과 같은 것이다. 구체예에서, 최초 람다 J/C 부위에 대한 5' 플랜킹 서열을 포함하는 뉴클레오티드 서열이 제공되며, 예를 들면 서열번호 32로 대표된다. 또한, 돼지의 람다 라이트 체인 유전자 서열의 J/C 클러스터 부위에 대한 3' 플랜킹 서열을 포함하는 뉴클레오티드 서열이 제공되며, 예를 들면 람다 J/C의 대략 200 염기 쌍 다운스트림에 있는 예컨대 서열번호 33과 같은 것이다. 또한, 돼지의 람다 라이트 체인 유전자 서열의 J/C 클러스터 부위에 대한 3' 플랜킹 서열을 포함하는 뉴클레오티드 서열이 제공되며, 예를 들면 서열번호 34, 35, 36, 37, 38, 및/또는 39로 대표된다. 구체예에서, 적어도 하나의 연결부-불변부 쌍 및/또는 적어도 하나의 가변부를 포함할 수 있는 소의 람다 라이트 체인 로커스를 코딩하는 핵산 서열이 제공되며, 예를 들면 서열번호 31로 대표된다. 구체예에서, 서열번호 28, 31, 32, 33, 34, 35, 36, 37, 38, 또는 39로 대표되는 분리된 뉴클레오티드 서열이 제공된 다. 서열번호 28, 31, 32, 33, 34, 35, 36, 37, 38, 또는 39와 적어도 80, 85, 90, 95, 98 또는 99% 상동성이 있는 핵산 서열이 또한 제공된다. 또한, 서열번호 28, 31, 32, 33, 34, 35, 36, 37, 38, 또는 39에서 적어도 10, 15, 17, 20, 25 또는 30의 연속의 뉴클레오티드를 포함하는 튜클레오티드가 제공된다. 또한, 서열번호 28, 31, 32, 33, 34, 35, 36, 37, 38, 또는 39에 대해 하이브리드된, 임의로 엄격한 조건하에 하이브리드된 뉴클레오티드 서열 뿐만 아니라 그에 상동적인 뉴클레오티드가 제공된다.

    구체예에서, 핵산 타켓팅 벡터 작재물이 제공된다. 타켓팅 벡터는 세포 내에서 상동재조합을 달성하기 위하여 디자인될 수 있다. 이러한 타켓팅 벡터는 유제동물의 해비 체인, 카파 라이트 체인 또는 람다 라이트 체인 유전자를 목표로 상동재조합을 통해 포유류 세포 내로 트랜스폼(transformed)될 수 있다. 구체예에서, 타켓팅 벡터는 3' 재조합 암(arm) 및 5' 재조합 암 (즉, 플랜킹 서열)을 포함할 수 있으며, 이는 유제동물의 해비 체인, 카파 라이트 체인 또는 람다 라이트 체인 유전자 서열에 대해 상동적이고, 예를 들면 상기 언급한 서열번호 1, 4, 29, 30, 12, 25, 15, 16, 19, 28 또는 31로 대표된다. 상동성 DNA 서열은 유전자 서열에 대해 상동성 서열의 적어도 15 bp, 20 bp, 25 bp, 50 bp, 100 bp, 500 bp, lkbp, 2 kbp, 4 kbp, 5 kbp, 10 kbp, 15 kbp, 20 kbp, 또는 50 kbp를 포함할 수 있다. 3' 및 5' 재조합 암은 유전자 서열의 적어도 하나의 기능성 가변, 연결, 다양 및/또는 불변부의 3' 및 5' 말단을 플랭크 하는 방식으로 디자인될 수 있다. 기능성 부위의 타켓팅은 그것을 불활성화하게 할 수 있으며, 세포의 불능을 야기하여 기능성 이뮤노글로불린 분자를 생산하게 한다. 다른 구체예에서, 상동성 DNA 서열은 하나 이상의 인트론 및/또는 엑손 서열을 포함할 수 있다. 핵산 서열에 덧붙여, 발현 벡터는 원핵 및/또는 진핵 숙주 세포에 있어서 작재물의 발현을 위해 제공되는 선택적인 마커 서열, 예컨대, 증진된 그린 형광 단백질 (eGFP) 유전자 서열, 개시 및/또는 인헨서 서열, 폴리 A-테일 서열, 및/또는 핵산 서열을 포함할 수 있다. 선택적인 마커는 5' 및 3' 재조합 암 서열 사이에 위치할 수 있다.

    한 특정 구체예에서, 타켓팅 벡터는 돼지의 이뮤노글로불린 해비 체인 로커스의 J6 부위의 3' 및 5' 플랜킹 서열에 대해 상동적인 서열을 함유하는 5' 및 3' 재조합 암을 포함할 수 있다. J6 부위는 돼지 이뮤노글로불린 해비 체인 로커스의 유일한 기능성 연결부이기 때문에, 이는 기능성 돼지 해비 체인 이뮤노글로불린의 발현을 막을 수 있을 것이다. 특정 구체예에서, 타겟팅 벡터는 J 1-4를 포함하는 J6 부위의 유전자 서열 5'과 상동적인 서열을 함유하는 5' 재조합 암 및 mu 불변부를 포함하는 J6 부위의 유전자 서열 3'에 대해 상동적인 서열을 포함하는 3' 재조합 암을 포함할 수 있으며 ("J6 타켓팅 작재물"), 예를 들면, 도1을 참고하면 된다. 또한, 이러한 J6 타겟팅 작재물은 또한 5' 및 3' 재조합 암 사이에 위치한 선택적인 마커 유전자를 포함할 수 있으며 예를 들면 서열번호 5 및 도1을 참고하면 된다. 다른 구체예에서, 타겟팅 벡터는 돼지의 해비 체인 로커스의 다양성부의 유전자 서열 5'에 대해 상동적인 서열을 포함하는 5' 재조합 암 및 다양성부의 유전자 서열 3'에 대해 상동적인 서열을 포함하는 3' 재조합 암을 포함할 수 있다. 구체예에서, 타겟팅 벡터는 돼지의 해비 체인 로커스의 mu 불변부의 유전자 서열 5' 에 대해 상동적인 서열을 포함하는 5' 재조합 암 및 mu 불변부의 유전자 서열 3'에 대해 상동적인 서열을 포함하는 3' 재조합 암을 포함할 수 있다. 또 다른 구체예에서, 타겟팅 벡터는 돼지의 이뮤노글로불린 해비 체인 로커스의 불변부의 3' 및 5' 프랠ㄴ킹 서열에 대해 상동적인 서열을 포함하는 5' 및 3' 재조합 암을 포함할 수 있다. 본원 발명은 돼지의 이뮤노글로불린 카파 라이트 체인 로커스는 오직 한 불변부가 있음을 발견하였기 때문에, 이는 기능성 돼지의 카파 라이트 체인 이뮤노글로불린의 발현을 막을 수 있다. 특정 구체예에서, 타겟팅 벡터는 불변부, 임의로 연결부의 유전자 서열 5'에 대해 상동적인 서열을 포함하는 5' 재조합 암 및 가변부, 임의로 적어도 인헨서의 부분을 포함하는 유전자 서열 3'에 대해 상동적인 서열을 포함하는 3' 재조합 암을 포함할 수 있으며"카파 불변 타켓팅 작재물"), 예를 들면 도2를 참고하면 된다.

    또한, 이러한 카파 불변 타겟팅 작재물은 또한 5' 및 3' 재조합 암 사이에 위치한 선택적인 마커 유전자를 포함할 수 있으며, 예를 들면 서열번호 20 및 도2를 참고하면 된다. 다른 구체예에서, 타겟팅 벡터는 돼지의 카파 라이트 체인 로커스의 연결부의 유전자 서열 5'에 대해 상동적인 서열을 포함하는 5' 재조합 암 및 연결부의 유전자 서열 3'에 대해 상동적인 서열을 포함하는 3' 재조합 암을 포함할 수 있다.

    또 다른 구체예에서, 타겟팅 벡터의 3' 및 5' 서열을 만들기 위하여 프라이머가 제공된다. 올리고뉴클레오티드 프라이머는 돼지의 이뮤노글로불린 유전자 서열, 예컨대 상기 언급된 서열번호 1, 4, 29, 30, 12, 25, 15, 16, 19, 28 또는 31 과 하이브리드될 수 있다. 특정 구체예에서, 프라이머는 엄격한 조건하에서, 상기 언급된 서열번호 1, 4, 29, 30, 12, 25, 15, 16, 19, 28 또는 31과 하이브리드된다. 또 다른 구체예에서, 돼지의 해비 체인, 카파 라이트 체인 또는 람다 라이트 체인 핵산 서열, 예컨대 상기 언급한 서열번호 1, 4, 29, 30, 12, 25, 15, 16, 19, 28 또는 31과 하이브리드된다. 또 다른 구체예에서, 돼지의 해비 체인, 카파 라이트 체인 또는 람다 라이트 체인 핵산 서열, 예컨대 상기 언급된 서열번호 1, 4, 29, 30, 12, 25, 15, 16, 19, 28 또는 31과 하이브리드될 수 있는 올리고뉴클레오티드 프로브(probe)가 제공된다. 폴리뉴클레오티드 프라이머 또는 프로브는 적어도 14 염기, 20 염기, 30 염기 또는 50 염기를 가질 수 있고, 본원 발명의 폴리뉴클레오티드와 하이브리드된다. 프로브 또는 프라이머는 적어도 14 뉴클레오티드의 길이일 수 있고, 특정 구체예에서, 적어도 15, 20, 25, 28, 또는 30 뉴클레오티드 길이일 수 있다.

    구체예에서, 기능성 연결부(J6 부위)를 포함하는 돼지의 Ig-해비 체인의 조각을 증폭하기 위한 프라이머가 제공된다. 비한정적 구체예에서, 해비 체인의 증폭된 조각은 서열번호 4에 의해 대표될 수 있고, 프라이머는 상기 조각이 J-부위의 부분, 예컨대 비한정적으로 서열번호 2에 대해 상보적일 수 있는 상기 조각을 증폭하기 위하여 사용되어 5' 재조합 암을 생성하며, Ig-해비 체인 mu 불변부의 부분, 예컨대 비한정적으로 서열번호 3에 대해 상보적일 수 있는 조각을 증폭하기 위하여 사용되느 3' 재조합 암을 생성한다. 또 다른 구체예에서, 돼지의 Ig 해비 체인 (예컨대, 비한정적 예로 서열번호 4)의 부위는 서브 클로닝 될 수 있고, 타겟팅 벡 터 내로 집합될 수 있다.

    다른 구체예에서, 불변부를 포함하는 돼지의 Ig 카파 라이트-체인의 조각을 증폭시키기 위한 프라이머가 제공된다. 또 다른 구체예에서, J 부위를 포함하는 돼지의 Ig 카파 라이트-체인의 조각을 증폭시키기 위한 프라이머가 제공된다. 비한정적 예로, 이러한 조각을 증폭하기 위하여 사용되는 프라이머는 J-부위, 예컨대 비한정적 예로 서열번호 21 또는 10의 부분에 대해 상보적일 수 있고, 5' 재조합 암을 생산하며, 불변부의 유전자 서열 3', 예컨대 비한정적 예로 서열번호 14, 24 또는 18에 대해 상보적일 수 있는 조각을 증폭하기 위하여 사용되는 프라이머는 3' 재조합 암을 생산한다. 또 다른 구체예에서, 돼지의 Ig 해비 체인 (예컨대, 비한정적 예로 서열번호 20)의 부위는 서브클로닝될 수 있고, 타겟팅 벡터내로 집합될 수 있다.

    본원 발명의 또 다른 일례에서, 여기에 설명된 방법, 서열 및/또는 작재물에 따라 제조된 유제동물의 해비 체인, 카파 라이트 체인 및/또는 람다 라이트 체인 로커스의 기능성 부위의 적어도 하나의 대립유전자가 결핍된 유제동물의 세포가 제공된다. 이러한 세포들은 상동재조합을 통해 얻어질 수 있다. 특히, 유제동물의 해비 체인, 카파 라이트 체인 또는 람타 라이트 체인 유전자의 적어도 하나의 대립유전자를 불활성화시킴으로써 유제동물의 항체의 발현 능력이 감소된 세포가 생산될 수 있다. 다른 구체예에서, 여기에 설명된 과정, 서열 및/또는 작재물에 따라 제조될 수 있는 유제동물의 해비 체인, 카파 라이트 체인 및/또는 람다 라이트 체인 유전자의 양 대립유전자가 결핍된 포유류 세포가 제공된다. 구체예에서, 여기 에 설명된 과정, 서열 및/또는 작재물에 따라 생산된 유제동물의 해비 체인, 카파 라이트 체인 및/또는 람다 라이트 체인 유전자의 적어도 하나의 대립유전자에 있어서, 유전적 타겟팅 이벤트를 경유하여 불활성화된 돼지과 동물이 제공된다. 본원 발명의 또 다른 일면에서, 유제동물의 해비 체인, 카파 라이트 체인 및/또는 람다 라이트 체인 유전자의 양 대립 유전자에 있어서, 유전적 타겟팅 이벤트를 경유하여 불활성화된 돼지과 동물이 제공된다. 유전자는 상동재조합을 통해 타겟팅될 수 있다.

    다른 구체예에서, 유전자를 파괴될 수 있는데, 즉, 유전적 코드의 부분이 변형될 수 있고, 그럼으로써 유전자의 그 부분의 전사 및/또는 해독에 영향을 준다. 예를 들면, 유전자의 파괴는 치환, 결손("녹-아웃") 또는 삽입 ("녹-인") 기술을 통해 일어날 수 있다. 목적하는 단백질을 위한 부가적 유전자 또는 존재하는 서열의 전사를 조절하는 조절 서열이 삽입될 수 있다. 구체예에서, 유제동물의 이뮤노글로불린 유전자의 다중 유전적 변형을 달성하기 위하여, 세포를 순차적으로 변형시킬 수 있으며, 그 결과 다중의 유전적 변형을 포함하게 된다. 다른 구체예에서, 동물은 함께 자랄 수 있고, 이뮤노글로불린 유전자의 다중의 유전적 변형을 포함하는 동물이 생산된다. 예시로서, 유제동물의 해비 체인 유전자의 적어도 하나의 대립유전자의 발현이 결핍된 동물이 추가로 유전적으로 변형되거나 카파 라이트 체인 유전자의 적어도 하나의 대립 유전자가 결핍된 동물과 함께 사육될 수 있다.

    본원 발명의 구체예에서, 유제동물의 해비 체인, 카파 라이트 체인 또는 람다 라이트 체인 유전자의 대립 유전자가 여기에 설명된 과정, 서열 및/또는 작재물 에 따라 불활성화될 수 있다. 구체예에서, 목표하는 이뮤노글로불린 유전자는 RNA 로 전사될 수 있으나, 단백질로 해독 되지는 않는다. 또 다른 구체예에서, 목표하는 이뮤노글로불린 유전자는 불활성화된 절단된 형태로 전사될 수 있다. 이러한 절단된 RNA는 비기능성 단백질로 해독되거나 전사되지 않을 수 있다. 구체예에서, 목표하는 이뮤노글로불린 유전자는 유전자의 전사가 일어나지 않는 방법으로 불활성화될 수 있다. 구체예에서, 목표하는 이뮤노글로불린 유전자는 전사된 후 비기능성 단백질로 해독될 수 있다.

    본원 발명의 일면에서, 유제동물, 예컨대 돼지 또는 소의 유제동물의 해비 체인, 카파 라이트 체인 및/도는 람다 라이트 체인 유전자의 하나의 대립유전자, 임의로 양 대립유전자가 수령자 세포내로 핵을 프랜스퍼하기 위한 공여체 세포로 사용될 수 있으며, 복제된 트랜스제닉 동물을 생산한다. 선택적으로, 유제동물의 해비 체인, 카파 라이트 체인 및/또는 람다 라이트 체인 유전자 녹아웃은 엠브리오닉 줄기세포에서 생성될 수 있고, 그 후 자손을 생산하는데 사용할 수 있다. 여기에 설명된 과정, 서열 및/또는 작재물에 따라 생산된 기능적 유제동물의 해비 체인, 카파 라이트 체인 및/도는 람타 라이트 체인 유전자의 단일 대립유전자가 결핍된 자손이 멘델 타입 유전을 통해 양 대립유전자에 있어 기능성이 결핍된 자손을 생산하기 위하여 또한 사육될 수 있다.

    본원 발명의 일면에서, 유제동물의 이뮤노글로불린 유전자의 발현을 막기 위한 방법이 제공되며, (i) 유제동물의 해비 체인, 카파 라이트 체인 또는 람다 라이트 체인 유전자 로커스의 점라인 구조를 분석; (ii) 로커스의 적어도 하나의 기능 성 부위의 5' 말단 및 3' 말단을 플랜크하는 뉴클레오티드 서열의 부위를 결정; 및 (iii) 플랜킹 서열을 갖는 타겟팅 작재물을 세포내로 감염시킴, 여기에서 성공적인 상동재조합인 경우, 이뮤노글로불린 로커스의 적어도 하나의 기능성 부위가 파괴되고, 그럼으로써 이뮤노글로불린 유전자의 발현이 감소 또는 방해된다. 구체예에서, 돼지의 해비 체인 로커스의 점라인 구조가 제공된다. 돼지의 해비 체인 로커스는 적어도 네 개의 가변부, 두 개의 다양성부, 여섯 개의 연결 부 및 다섯 개의 불변부를 포함하며, 예를 들면 도1에 도시되어 있다. 특정 구체예에서, 여섯 개의 연결 부 중 오직 하나인, J6이 기능성이 있다. 또 다른 구체예에서, 돼지의 카파 라이트 체인 로커스는 적어도 여섯 개의 가변부, 여섯 개의 연결부, 하나의 불변부 및 하나의 인헨서 부위를 포함하며, 예를 들면 도2에 도시되어 있다. 구체예에서, 돼지의 람다 라이트 체인 로커스의 점라인 구조가 제공된다.

    본원 발명의 일면에서, 여기에 성명된 과정, 서열 및/또는 작재물에 따라 생산된 유제동물의 해비 체인, 카파 라이트 체인 및/또는 람다 라이트 체인 로커스의 기능성 부위의 적어도 하나의 대립유전자가 결핍된 유제동물 및 유제동물세포라 제공되며, 이들은 적어도 인간 항체(즉, 이뮤노글로불린(Ig))의 부분을 발현하기 위하여 더 변형된다. 추가적 구체예에서, 이종 이뮤노글로불린을 발현하는 돼지과 동물이 제공된다. 이러한 인간 로커스는 유제동물에서, 인간 항체 분자의 다양한 파퓰레이션을 발현하거나 재배열될 수 있다. 이러한 복제된, 트랜스제닉 유제동물은 인간 항체(예컨대, 폴리클로날 항체)의 채워지는, 이론상 무한한 공급을 제공하며, 치료, 진단, 정제 및 다른 임상적 관련 목적에 사용될 수 있다. 특정 구체예 에서, 인공 크로모좀(ACs), 예컨대 효모 또는 포유류 인공 크로모좀(YACS 또는 MACS)이 인간 이뮤노글로불린 유전자가 유제동물의 세포 및 동물내에서 발현할 수 있게 하기 위하여 사용될 수 있다. 인간 이뮤노글로불린 유전자의 전체 또는 부분, 예컨대 Ig 해비 체인 유전자 (인간 크로모좀 414), Ig 카파 체인 유전자 (인간 크로모좀 #2) 및/또는 Ig 람다 체인 유전자 (크로모좀 #22)는 인공 크로모좀내로 삽입될 수 있드며, 그 후 유제동물 세포내로 삽입될 수 있다. 구체예에서, 인간 항체 분자의 다양한 파퓰레이션을 발현하고 재배열되는 적어도 하나의 인간 항체 유전자 로커스의 전체 또는 부분을 함유하는 유제동물 및 유제동물 세포가 제공된다.

    추가적 구체예에서, 이종 항체를 생산하는 방법이 제공되며, 여기에서 상기 방법은 (a) 하나 이상의 대상 항체를 유제동물, 그 세포가 하나 이상의 인공 크로모좀을 함유하며 기능성 내생 이뮤노글로불린의 임의의 발현이 결핍되었으며, 각각의 인공 크로모좀은 하나 이상의 재배열된 이종 이뮤노글로불린 로커스를 포함하는 유제동물에 도입하여, 하나 이상의 항체에 대항하는 이종 항체를 생산하고, (b) 유제동물로부터 이종 항체를 회복하는 것을 포함할 수 있다. 구체예에서, 이뮤노글로불린 로커스는 B 세포 내에서 재배열될 수 있다.

    본원 발명의 일면에서, 예컨대 돼지 또는 소와 같은 유제동물이 본원 발명의 임의의 일면에 따른 방법에 따라 제공될 수 있다. 이러한 복제된 트랜스제닉 유제동물 (예를 들면 돼지 및 소과 동물)은 인간 폴리클로날 항체의 채워지는, 이론상 무한한 공급을 제공하며, 치료, 진단 및 정제 목적으로 사용될 수 있다. 예를 들 면, 혈류에서 폴리클로날 인간 항체를 생산하는 여기에 설명된 과정, 서열 및/또는 작재물에 따라 생산된 트랜스제닉 동물은 목적하는 항체에 특이적인 다른 항체의 어레이를 생산하기 위하여 사용될 수 있다. 폴리클로날 항체가 거대량 입수가능한 경우, 감염성 질환의 치료 및 예방 목적, 생물학적 전투제, 면역계의 변형, 원치 않는 인간 세포, 예컨대 암세포의 제거, 및 특정 인간 분자의 변형에 대항한 백신으로 사용될 수 있다.

    다른 구체예에서, 여기에 개시된 과정, 서열 및/도는 작재물에 따라 생산된 기능성 이뮤노글로불린의 발현이 결힙된 동물 또는 세포는 이종항원의 발현을 제거하기 위하여 추가적 유전적 변형을 포함할 수 있다. 상기 동물은 알파-1,3-갈락토실트랜스퍼라제 유전자, CMP-Neu5Ac 하이드록실라제 유전자 (USSN 10/863,116 참조), iGb3 합성 유전자 (US Patent Application 60/517,524 참조), 및/또는 포스만 합성 유전자 (US Patent Application 60/568,922 참조)의 적어도 하나의 대립유전자의 발현을 제거하기 위하여 변형될 수 있다. 추가적 구체예에서, 본원 명세서에 개시된 동물은 또한 푸코실트랜스퍼라제 및/도는 시알릴트랜스퍼라제를 발현하기 위한 유전적 변형을 포함할 수도 있다. 이러한 추가적 유전적 변형을 위해, 구체예에서, 세포는 변형될 수 있고, 그 결과 다중 유전적 변형을 포함하게 된다. 다른 구체예에서, 동물을 함께 사육하여 다중 유전적 변형을 시킬 수 있다. 특정 구체예에서, 본원 명세서에 개시된 과정, 서열 및/또는 작재물에 따라 생산된 기능성 이뮤노글로불린의 발현이 결핍된 예컨대 돼지와 같은 동물을 알파-1,3-갈락토실 트랜스터라제의 발현이 결핍된 돼지와 같은 동물과 함께 사육할 수 있다 (WO 04/028243 참조).

    도면의 간단한 설명

    도1은 돼지의 해비 체인 이뮤노글로불린 유전자의 연결부의 발현을 방해하는 타겟팅 벡터의 디자인을 도시한 것이다.

    도2는 돼지의 카파 라이트 체인 이뮤노글로불린 유전자의 불변부의 발현을 방해하는 타겟팅 벡터의 디자인을 도시한 것이다.

    도3은 JC 서열의 연쇄체 뿐만 아니라 JC 부위에 대한 가변부 5'를 포함하는 프랜킹 부위를 포함하는 돼지의 람다 이뮤노글로불린 로커스의 유전적 조직화를 도시한 것이다. 세균성 인공 크로모좀 (BAC1 및 BAC2)는 BAC 라이브러리로부터 얻어질 수 있는 돼지의 이뮤노글로불린 유전자의 조각을 나타낸다.

    도4는 돼지의 람다 라이트 체인 이뮤노글로불린 유전자의 JC 클러스터 부위의 발현을 방해하는 타겟팅 유전자의 디자인을 나타낸 것이다. "SM"은 선택적인 마커 유전자를 나타내며, 타겟팅 벡터에서 사용될 수 있다.

    도5는 사이트 특이성 리콤비나제 타겟 또는 인식 사이트를 돼지 람다 이뮤노글로불린 로커스의 JC 클러스터 부위의 부위 5'내로 삽입하기 위한 타겟팅 전략을 도시한 것이다. "SM"은 선택적인 마커 유전자를 나타내며, 타겟팅 벡터에서 사용될 수 있다. "SSRRS"는 특이성 리콤비나제 타겟 또는 인식 사이트를 나타낸다.

    도6은 사이트 특이성 리콤비나제 타겟 또는 인식 사이트를 돼지 람다 이뮤노글로불린 로커스의 JC 클러스터 부위의 부위 3'내로 삽입하기 위한 타겟팅 전략을 도시한 것이다. "SM"은 선택적인 마커 유전자를 나타내며, 타겟팅 벡터에서 사용될 수 있다. "SSRRS"는 특이성 리콤비나제 타겟 또는 인식 사이트를 나타낸다.

    도7은 사이트 특이성 리콤비나제가 매개된 YAC의 숙주 유전자내로의 트랜스퍼를 도시한 것이다. "SSRRS"는 특이성 리콤비나제 타겟 또는 인식 사이트를 나타낸다.

    발명의 상세한 설명

    본원 발명은 유제동물의 점라인 유전자 서열 배열 뿐만 아니라 새로운 그의 새로운 유전자 서열을 최초로 제공한다. 또한, 해비 또는 라이트 체인 이뮤노글로불린 유전자의 적어도 한 대립유전자가 결핍된 새로운 유제동물 세포, 조직 및 동물이 제공된다. 이러한 발견에 기초하여, 해비 및/또는 라이트 체인 이뮤노글로불린 유전자의 적어도 하나의 대립유전자가 완전히 결핍된 유제동물이 제공될 수 있다. 또한, 이러한 유제동물은 추가로 변형되어 이종, 예컨대 인간, 이뮤노글로불린 로커스 또는 그의 조각을 발현할 수 있다.

    본원 발명의 일면에서, 기능성 내생 이뮤노글로불린의 임의의 발현이 결핍된 트랜스제닉 유제동물이 제공된다. 구체예에서, 유제동물은 내생 해비 및/또는 라이트 체인 이뮤노글로불린의 임의의 발현이 결핍될 수 있다. 라이트 체인 이뮤노글로불린은 카파 및/또는 람다 이뮤노글로불린일 수 있다. 추가적 구체예에서, 내생 이뮤노글로불린의 적어도 한 대립유전자의 발현이 결핍된 트랜스제닉 유제동물이 제공되며, 여기에서 이뮤노글로불린은 해비 체인, 카파 라이트 체인 및 람다 라 이트 체인 또는 그의 임의의 조합으로 이루어진 그룹에서 선택된다. 구체예예서, 기능성 내생 이뮤노글로불린의 발현은 내생 이뮤노글로불린 로커스의 유전적 타겟팅에 의해 성취될 수 있으며, 이는 내생 이뮤노글로불린의 발현을 막는다. 구체예에서, 유전적 타겟팅은 상동재조합을 경유하여 성취될 수 있다. 구체예에서, 핵 트랜스퍼를 통해 트랜스제닉 유제동물이 제공될 수 있다.

    다른 실시태양에서, 작용 내생적 면역 글로빈의 발현이 부족한 유전자 도입 유제동물은 이종 면역 글로불린 유전자 좌를 표현하기 위해 추가로 유전적으로 변형시킬 수 있다. 다른 실시태양에서, 이종 면역 글로불린 유전자 좌를 함유하는 돼지 같은 동물이 제공된다. 하나의 실시태양에서, 이종 면역 글로불린 유전자좌는 중쇄 및/또는 경쇄 면역 글로불린 또는 그의 단편일 수 있다. 또 하나의 실시태양에서, 이종 면역 글로불린 유전자좌는 케파 체인 유전자좌 또는 그의 분절 및/또는 람다 체인 유전자좌 또는 그의 단편일 수 있다. 또 다른 실시태양에서, 인공 염색체(AC)는 이종 면역 글로부린을 함유할 수 있다. 하나의 실시태양에서, AC는 효모AC 또는 포유동물 AC일 수 있다. 다른 실시태양에서, 이종 유전자 좌는 인간 면역글로부린 염색체좌 또는 그의 단편일 수 있다. 하나의 실시태양에서, 인간 면역글로부린 유전자 좌는 인간 염색체 14, 인간 염색체 2, 및 인간 염색체 22 또는 그의 단편일 수 있다. 또 하나의 실시태양에서긴간 면역 글로부린 유전자 좌는 재배열을 수행할 수 있는 인간 면역 글로부린의 단편을 포함할 수 있다. 추가의 실시태양에서, 인간 면역 글로부린 염색체좌는 재배열을 수행할 수 있는 인간 면역글로부릴 중쇄 및 인간 면역글로부린 경쇄를 포함할 수 있다. 또 하나의 실시태양에서, 인간 면역글로부린 염색체좌는 항원에 노출시 항체를 생산할 수 있는 특정한 인간 면역 글로부린 염색체좌 또는 그의 단편을 포함할 수 있다. 특별한 실시태양에서, 외인성 인간 면역 글로부린은 하나 이상의 항원에 노출에 대한 반응에서 이종 면역 글로불린을 생산하기 위하여 B세포로 표현할 수 있다.

    본 발명의 또 하나의 태양에서, 이종 면역 글로부린 유전자 좌 또는 그의 단편을 표현하는 유전자 도입 유제동물이 제공되며, 여기서 면역 글로부린은 내생적 유제동물 염색체 내에서 통합되어 있는 면역 글로부린 유전자 좌로부터 표현할 수 있다. 하나의 실시태양에서, 이종 변역 글로부린 유전자 좌는 자손에게 유전될 수 있다. 또 하나의 실시태양에서 이종 면역 글로부린 유전자 좌는 자손에 의한 남성 병원균을 통하여 유전될 수 있다. 또 하나의 실시태양에서, 인공 염색체 (AC)는 이종 면역 글로부린을 함유할 수 있다. 하나의 실시태양에서 AC는 효모 AC 또는 포유동물 AC일 수 있다. 추가의 실시태양에서, 이종 유전자 좌는 인간 면역 글로부린 유전자 좌 또는 그의 단편일 수 있다. 하나의 실시태양에서 인간 면역 글로부린 유전자 좌는 인간 염색체 14, 인간 염색체 2, 및 인간 염색체 22 또는 그의 단편일 수 있다. 또 하나의 실시태양에서 인간 면역 글로부린 유전자 좌는 재배열을 수행할 수 있는 인간 면역 글로부린의 단편을 포함할 수 있다. 추가의 실시태양에서, 인간 면역 글로부린 유전자 좌는 재배열을 수행할 수 있는 인간 면역 글로부린 경쇄 및 인간 면역 글로부린 중쇄의 단편을 포함할 수 있다. 추가의 실시태양에서, 인간 면역 글로부린 유전자 좌는 항원에 대한 노출시 항체를 생산할 수 있는 인간 면역 글로부린 유전자 좌 또는 그의 단편을 포함할 수 있다. 특별한 실시태양에서, 외인성 인간 면역 글로부린은 하나 이상의 항원 노출에 대한 반응에서 이종 면역 글로부린을 생산하기 위해 B세포로 표현할 수 있다.

    정의

    용어 "재조합 DNA 기술", "DNA 클로닝", "분자 클로닝", 또는 "유전자 클로닝"은 DNA 서열을 세포 또는 유기물로 전환하는 방법을 일컫는다. DNA 단편으로의 전환은 하나의 유기물로부터, 자기 복제 유전 인자 (예, 박테리아 플라스미드) 많은 다른 것들 중에서 선택되며 또한 무제한된 양으로 생산되는 DNA (또는 RNA)서열의 특정한 부분을 복제하는 자기 복제 유전 인자 (예, 박테리아 플라스미드)까지 일 수 있다. 플라스미드 및 다른 유형의 클로닝 벡터 예를 들어 인공 염색체는 추가의 연구를 위해 충분한 동일 물질을 발생시키기 위해 유전자 및 다른 편의 염색체를 복제하는데 사용할 수 있다. 20kg까지의 외래 DNA를 가질 수 있는 박테리아 플라스미드 외외에, 다른 클로닝 벡테는 바이러스, 코스미드, 및 인공 염색체 (예, 박테리아 인공 염색체 (BACs) 또는 효모 인공 염색체 (YACs))를 포함한다. 염색체 DNA의 단편이 궁극적으로 실험실에서 그의 클로닝 벡터로 조합하는 경우, "재조합 DNA 분자"로 부른다. 재조합 플라스미드가 적합한 숙주 세포내에 도입된 직후에, 새로 삽입된 단편은 숙주 세포 DNA와 함께 재생될 것이다.

    "코스미드"는 45kg까지의 외래 DNA를 가질 수 있는 인공적으로 건축된 클로닝 벡터이다. 이들은 이 콜라이 세포내에 감염을 위한 램브다파지 입자 내에 패키지 화 될 수 있다.

    여기서 사용되는 용어 "포유동물" ("유전적으로 변형된 (또는 변화된) 포유 동물에서와 같이)은 인간이 아닌 포유동물을 포함하며, 예를 들어 제한되지 않지만 돼지, 양, 염소, 소 (솟과 동물), 사슴, 노새, 말, 원숭이, 개, 고양이, 쥐, 마이스, 새, 닭, 파충류 동물, 어류, 및 곤충을 포함한다. 본 발명의 하나의 실시태양에서, 유전적으로 변화된 돼지 및 그의 생산방법이 제공된다.

    용어 "유제동물"(ungulate)는 발굽을 가진 동물을 일컫는다. 우제류는 영양, 낙타, 젖소, 사슴, 염소, 돼지, 및 양을 포함하는 균일한 발톱 (갈라진 발굽) 유제동물이다. 기제류는 한짝 발가락 유제동물이며, 말, 얼룩말, 무소, 및 맥을 포함한다. 여기서 사용되는 용어 "유제동물"은 성인, 태아 또는 태아 유제동물을 일컫는다.

    여기서 사용되는 용어 "돼지 류" "돼지 같은 동물". "새끼 돼지" 및 "돼지"는 성, 크기 또는 잡종에 상관없이 동일 유형의 동물을 언급하는 유전학적 용어이다.

    "상동 DNA 서열 또는 상동 DNA"는 참조 DNA 서열과 동일한 적어도 약 80%, 85%, 90%, 98% 또는 99%인 DNA서열이다. 상동 서열은 목표 서열에 대한 엄격한 조건하에 혼성화하며, 엄격한 혼성화는 서열 간에 적어도 85, 적어도 95% 또는 98%인 경우에 혼성화가 발생하는 것을 포함한다.

    "동질유전자형 또는 실질적으로 동질유전자형 DNA 서열"은 참조 DNA 서열과 동일하거나 또는 거의 동일한 DNA 서열이다. 용어 "실질적으로 동질유전자형"은 참조 DNA 서열과 동일한 적어도 약 97-99%이거나 또는 참조 DNA 서열과 동일한 적어도 약 99.5-99.9%이며, 또한 특정한 경우에 참조 DNA 서열과 동일한 100%를 사용하 는 DNA 서열을 일컫는다.

    "상동 재조합"은 서열 상동성을 기본으로 하는 DNA 재조합의 과정을 일컫는다.

    "유전자 표적화"는 두개의 DNA 서열 사이의 상동 재조합을 일컬으며, 이의 하나는 염색체에 위치하며 또한 다른 것은 그러하지 않다.

    "비-상동성 또는 불균일 통합"은 상동 재조합을 포함하지 않는 게놈 내에 DNA를 삽입하는 방법을 일컫는다.

    "선택 가능한 표시 유전자"는 그의 표현이 유전자 함유 세포를 식별시키는 유전자이다. 선택 가능한 표시는 유전자 없이 세포의 성장을 방지하거나 느리게 하는 매체 상에 세포를 증식시키는 것일 수 있다. 이의 예는 항생제 저항 유전자 및 유기물을 선택된 대사물에 성장시키는 유전자를 포함한다. 이와는 달리, 유전자는 용이하게 식별되는 표현형을 세포위에 부여함으로써 변이체의 시각적 스크리닝을 촉진할 수 있다. 이러한 식별 가능한 표현형은 예를 들어 발광의 생성 및 착색된 화합물의 생산, 또는 세포를 둘러싸는 매체중에 탐지 가능한 변화의 발생일 수 있다.

    용어 "인접한"은 방해 없이 또는 방해받지 않고 표준 의미로 여기서 사용된다.

    "엄격한 조건"은 (1) 낮은 이온 강도 및 높은 세척 온도, 예를 들어 50℃에서 0.015M NaCl/0.0015M 구연산 나트륨/0.1% SDS를 사용하거나, 또는 (2) 혼성화 도중에 변성제, 예를 들어 포름아미드를 사용하는 조건을 일컫는다. 당 업자들은 분명하고 탐색 가능한 혼성화 신호를 얻기 위해 대략적으로 엄격한 조건을 결정하고 변화시킬 수 있다. 예를 들어, 엄격함은 일반적으로 혼성화 도중에 존재하는 염 함량을 증가시키고, 세척하고, 온도 또는 그의 조합을 저하시켜 줄일 수 있다. 참조, 예를 들어 삼부르크 등, 분자 크로닝,: 실험 매뉴얼, 콜드 스프링 하버 레보레토리 프레스, 콜드 스프링 하버, 뉴욕 (1989).

    I. 면역 글로부린 유전자

    본 발명의 한 태양에서, 작용 내생적 면역 글로부린의 표현이 부족한 작용 유전자 도입 유제동물이 제공된다. 하나의 실시태양에서 유제동물은 내생적 중쇄 및/또는 경쇄 면역 글로부린의 발현이 부족할 수 있다. 경쇄 면역 글로부린은 카파 및/또는 램다 면역 글로부린일 수 있다. 추가의 실시태양에서, 내생적 면역 글로부린 유제동물의 적어도 하나의 대립유전자의 표현이 부족한 유전자 도입 유제동물이 제공되며, 여기서 면역 글로부린은 중쇄, 캅파 경쇄 및 람다 경쇄 또는 그의 조합으로 이루어진 그룹으로부터 선택된다. 하나의 실시태양에서, 작용 내생적 면역 글로부린의 표현은 내생적 면역 글로부린의 표현을 방지하기 위해 내생적 면역 글로부린 유전자좌의 유전 표적화의 표현을 방지하기 위해 내생적 면역 글로부린 유전자 좌의 유전 표적화에 의해 달성할 수 있다. 하나의 실시태양에서, 유전 표적화는 상동성 재조합에 의해 달성할 수 있다. 또 하나의 실시태양에서 유전자 도임 유제동물은 핵 전이에 의해 생산할 수 있다.

    본 발명의 또 하나의 실시태양에서, (i) 유제동물 중쇄, 캅파 경쇄 또는 람다 경쇄 게놈 유전자 좌의 생식계열 윤곽을 분석함으로써, (ii) 유전자좌의 적어도 하나의 작용 영역의 5번 단부 및 3번 단부의 측면에 위치하는 뉴클레오타이드 서열의 발견을 결정하고, 및 (iii) 프랭킹 서열을 함유하는 표적화 구조물을 세포내에 트랜스팩트 함으로써 유제동물 면역 글로부린 유전자의 표현을 방해하는 방법이 제공되며, 여기서 성공적인 상동성 재조합 시, 유전자 좌의 적어도 하나의 작용 영역이 붕괴되어 면역글로불린의 감소시키거나 방지된다.

    일 구체예에서, 돼지의 중쇄 유전자 자리(locus)의 배자 계열 배열이 제공된다. 돼지 중쇄 유전자 자리는 예를 들어 도 1에 도시한 바, 적어도 네개의 가변 부위, 두개의 다양성 부위, 여섯개의 접합 부위 및 다섯개의 불변 부위를 포함한다. 특정 구체예에서, 여섯개의 접합 부위 중 오직 하나, J6가 기능적이다.

    다른 구체예에서, 돼지 카파 경쇄 유전자 자리의 배자 계열 배열이 제공된다. 돼지 카파 경쇄 유전자 자리는 예를 들어, 도 2에서 제시된 바, 적어도 여섯개의 가변 부위, 여섯개의 접합 부위, 하나의 불변 부위 및 하나의 인핸서(enhancer) 부위를 포함한다.

    다른 구체예에서, 돼지 람다(lambda) 경쇄 유전자 부위의 배자 계열 배열이 제공된다.

    서열 번호 : 1-39에 나타낸 바, 분리된 뉴클레오티드 서열이 제공된다. 서열 번호 : 1-39 중 임의의 하나에 적어도 80, 85, 90, 95, 98 또는 99%의 상동성있는 핵산 서열 또한 제공된다. 덧붙여, 서열 번호 : 1-39 중 임의의 하나에서 10, 15, 17, 20, 25 또는 30개의 연속된 뉴클레오티드를 포함하는 뉴클레오티드 서열이 제공된다. 더욱이, 임의의 엄격한 환경(stringent condition) 하에서, 서열 번호 : 1-39, 뿐만 아니라, 여기에 상동성을 갖는 뉴클레오티드에 하이브리드(hybridize)하는 뉴클레오티드 서열을 제공한다.

    뉴클레오티드 또는 아미노산 서열 레벨에서 상동성 또는 동일성은 서열 유사성 검색을 위하여 만들어진 blastp, blastn, blastx, tblastn 및 tblastx (예를 들어, Altschul, SF et al (1 997) Nucleic Acids Res 25:3389-3402 and Karlin et al , (1 900) Proc. Natl. Acad. Sci. USA 87, 2264- 2268 참고) 프로그램에 사용된 알고리즘을 이용한 BLAST (Basic Local Alignment Search Tool)에 의하여 측정될 수 있다. BLAST 프로그램에 이용된 접근은 첫번째, a-의문 서열 및 데이터베이스 서열 사이의 갭의 유무와 함께 유사-단편을 고려하는 것이며, 그 다음, 확인된 모든 매치(match)의 통계적 유의를 평가하는 것이고, 마지막으로 기선택된 유의의 역치를 만족시키는 매치만을 요약하는 것이다. 예를 들어, Altschul et aL, (1994) (Nature Genetics 6, 119-129)를 참조한다.

    히스토그램(histogram), 설명(descriptions), 정렬(alignments), 기대(expect)(예를 들어, 데이터베이서 서열에 대한 매치를 기록하기 위한 통계적 유의 역치), 컷오프(cutoff), 매트릭스(matrix) 및 필터(filter (low coM'plexity))를 위한 검색 파라미터는 디폴팅 세팅에 있다. blastp, blastx, tblastn, 및 tblastx에 이용되는 디폴트 기록 매트릭스(default scoring matrix)는 BLOSUM62 매트릭스(Henikoff et aL, (1 992) Proc. Natl. Acad. Sci. USA 89, 10915-10919)이며, 이는 길이가 85(뉴클레오티드 염기 또는 핵산)를 넘는 의문 서열을 위하여 추천된다.

    돼지 중쇄(Porcine Heavy Chain)

    본 발명의 또다른 국면에서, 유제의(ungulate) 면역글로블린의 중쇄 유전자 자리를 암호화하는 새로운 유전자 서열이 제공된다. 일 구체예에서, 돼지 중쇄를 암호화하는 분리된 뉴클레오티드 서열이 제공되는데, 이는 예를 들어 서열 번호 : 29에 나타낸 바, 적어도 하나의 가변 부위, 두개의 다양성 부위, 적어도 네개의 접합 부위 및 mu 불변 부위와 같은 적어도 하나의 불변 부위를 함유한다. 다른 구체예에서, 예를 들어 서열 번호 : 4에 나타낸 대로, 돼지의 중쇄 유전자 서열에서 적어도 네개의 접합 부위 및 mu 불변 부위와 같은 적어도 하나의 불변 부위를 함유하는 분리된 뉴클레오티드 서열이 제공된다. 다른 구체예에서, 예를 들면 서열 번호 : 1에 나타낸 대로, 돼지 중쇄 유전자 서열의 첫번째 접합 부위에 5' 프랭킹 서열(5' flanking sequence)을 함유하는 뉴클레오티드 서열은 제공된다. 게다가, 예를 들면 서열 번호 : 4의 3' 부위에 나타낸 대로, 돼지 중쇄 유전자 서열의 첫번째 접합 부위에 3' 프랭킹 서열(5' flanking sequence)을 함유하는 뉴클레오티드 서열이 제공된다. 다른 구체예에서, 서열 번호 : 1, 4, 29에 나타낸 대로, 분리된 뉴클레오티드 서열이 제공된다. 서열 번호 : 1, 4, 29에 적어도 80, 85, 90, 95, 98 또는 99%의 상동성을 갖는 핵산 서열 또한 제공된다. 또한, 임의의 엄격한 환경(stringent condition) 하에서, 서열 번호 : 1, 4, 29, 뿐만 아니라, 이에 상동성을 갖는 뉴클레오티드에 하이브리드(hybridize)하는 뉴클레오티드 서열이 제공된다.

    덧붙여, 서열 번호 1, 4, 29에서 적어도 10, 15, 17, 20, 25 또는 30의 연속된 뉴클레오티드를 함유하는 핵산 서열이 제공된다. 일구체예에서, 뉴클레오티드 서열은 서열 번호 4에 적어도 17, 20, 25 또는 30의 연속된 뉴클레오티드를 함유하거나 서열 번호 29의 1-9,070 잔기를 함유한다. 다른 구체예에서, 서열 번호 29에 적어도 50, 100, 1,000, 2,500, 4,000, 4,500, 5,000, 7,000, 8,000, 8,500, 9,000, 10,000 또는 15,000의 연속된 뉴클레오티드를 함유하는 뉴클레오티드 서열이 제공된다. 또다른 구체예에서, 뉴클레오티드 서열은 서열 번호 29의 9,070-11039 잔기를 함유한다.

    다른 구체예에서, 서열 번호 1, 4, 29에 나타낸 바, 분리된 뉴클레오티드 서열이 제공된다. 서열 번호 1, 4, 29에 적어도 80, 85, 90, 95, 98 또는 99% 상동성이 있는 핵산 서열 또한 제공된다. 덧붙여, 서열 번호 1, 4, 29에서 적어도 10, 15, 17, 20, 25 또는 30의 연속된 뉴클레오티드를 함유하는 뉴클레오티드 서열이 제공된다. 또한, 임의의 엄격한 환경(stringent condition) 하에서 서열 번호 1, 4 또는 29, 뿐만 아니라, 이에 상동성있는 뉴클레오티드에 하이브리드하는 뉴클레오티드 서열이 제공된다.

    일 구체예에서, 돼지 중쇄를 암호화하는 분리된 뉴클레오티드 서열이 제공되며, 이는 예를 들어 서열 번호 29에 나타낸 바, 적어도 하나의 가변 부위, 두개의 다양성 부위, 적어도 네개의 접합 부위 및 mu 불변 부위와 같은 적어도 하나의 불변 부위를 함유한다. 서열 번호 29에서 중쇄의 다양성 부위는 예를 들어, 잔기 1089-1099 (D(pseudo))에 의해 나타냈으며, 중쇄의 접합 부위는 예를 들어, 잔기 1887-3352 (예를 들면, J(psuedo): 1887-1931, J(psuedo): 2364-2411, J(psuedo): 2756-2804, J (functional J): 3296-3352)에 의해 나타냈으며, 재조합 신호는 예를 들어 잔기 3001-3261 (노나머 (Nonamer)), 3292-3298 (헵타머 (Heptamer))에 의해 나타냈으며, 불변 부위는 다음 잔기들: 3353-9070 (J to C mu 인트론), 5522-8700 (Switch region), 9071-9388 (Mu 엑손 1), 9389-9469 (Mu 인트론 A), 9470-9802 (Mu 엑손 2), 9830- 10069 (Mu 인트론 B), 10070-10387 (Mu 엑손 3), 10388-10517 (Mu 인트론 C), 10815-11052 (Mu 엑손 4), 11034-11039 (폴리(A) 신호)에 의해 나타냈다.

    돼지 카파 경쇄

    다른 구체예로, 유제류 면역글로불린의 카파 경쇄 부위를 코딩하는 새로운 게놈 서열이 제공된다. 본 발명은 유제류 카파 경쇄 영역의 최초 보고된 게놈 서열을 제공한다. 일 구체예로, 돼지 카파 경쇄 부위를 코딩하는 핵산 서열이 제공된다. 다른 구체예로, 핵산 서열은 카파 경쇄의 적어도 하나의 연결 영역, 하나의 불변 영역 및/또는 하나의 인핸서 영역을 함유할 수 있다. 또 다른 구체예로, 뉴클레오티드 서열은 예를 들어 Seq ID No. 30에 나타낸 바와 같이 적어도 다섯 개의 연결 영역, 하나의 불변 영역 및 하나의 인핸서 영역을 포함할 수도 있다. 또 다른 구체예로, 예를 들어 Seq ID No. 12에 나타낸 바와 같이, 적어도 하나의, 적어도 두 개, 적어도 세 개, 적어도 네 개 또는 다섯 개의 연결 영역 및 돼지 게놈 카파 경쇄의 연결 영역에 3' 인접 서열을 함유하는 단리된 뉴클레오티드 서열이 제공된다. 다른 구체예로, 예를 들어 Seq ID No. 25에 나타낸 바와 같이, 제 1 연결 영역에 5' 인접 서열을 함유하는 돼지 게놈 카파 경쇄의 단리된 뉴클레오티드 서열이 제공된다. 다른 구체예로, 예를 들어 Seq ID No. 15, 16 및/또는 19에 나타낸 바와 같이, 돼지 게놈 카파 경쇄의 불변 영역에 3' 인접 서열 및 임의로 인핸서 영역의 5' 부분을 함유하는 단리된 뉴클레오티드 서열이 제공된다.

    또 다른 구체예로, Seq ID No. 30, 12, 25, 15, 16 또는 19로 나타내어지는 단리된 뉴클레오티드 서열이 제공된다. Seq ID No. 30, 12, 25, 15, 16 또는 19과 적어도 80, 85, 90, 95, 98 또는 99% 상동성인 핵산 서열이 제공된다. 또한, Seq ID No. 30, 12, 25, 15, 16 또는 19의 적어도 10, 15, 17, 20, 25 또는 30개의 근접 뉴클레오티드를 함유하는 뉴클레오티드 서열이 제공된다. 또한, Seq ID No. 1, 4 또는 29의 적어도 10, 15, 17, 20, 25 또는 30개의 근접 뉴클레오티드를 함유하는 뉴클레오티드 서열이 제공된다. 다른 구체예로, Seq ID No. 30의 적어도 50, 100, 1,000, 2,500, 5,000, 7,000, 8,000, 8,500, 9,000, 10,000 또는 15,000개의 근접 뉴클레오티드를 함유하는 뉴클레오티드 서열이 제공된다. 임의로 엄격한 조건하에서 Seq ED Nos 30, 12, 25, 15, 16 또는 19에 하이브리드화하는 뉴클레오티드 서열 및 그의 동종 뉴클레오티드 동종도 제공된다.

    일 구체예로, 예를 들어, Seq ID No. 30로 나타낸 바와 같이 적어도 다섯 개 의 연결 영역, 하나의 불변 영역 및 하나의 인핸서 영역을 함유하는 카파 경쇄를 코딩하는 단리된 뉴클레오티드 서열이 제공된다. Seq ID No. 30에 카파 경쇄의 코딩 영역이, 예를 들어 잔기 1-549 및 10026-10549로 나타내진 반면, 인트론 서열은, 예를 들어 잔기 550-10025으로 나타내어지고, 카파 경쇄의 연결 영역은, 예를 들어 잔기 5822-7207로 나타내어지며(예: J1:5822-5859, J2:6180-6218, J3:6486-6523, J4:6826-6863, J5:7170-7207), 불변 영역은 하기 잔기로 나타내어진다: 10026-10549(C 엑손) 및 10026-10354(C 코딩), 10524-10529(폴리(A) 시그널) 및 11160-11264(SINE 요소).

    돼지 람다 경쇄

    다른 구체예에서, 유제 동물 면역글로불린의 람다 경쇄 좌(locus)를 코딩하는 신규 게놈 서열이 제공된다. 본 발명은 유제 동물 람다 겸쇄 부위의 처음 기록된 게놈 서열을 제공한다. 일 구체예에서, 돼지 람다 경쇄 뉴클레오티드는 J 내지 C 유니트의 콘카타머(concatamer)를 포함한다. 특정 구체예에서, 서열 28번으로 제시된, 분리된 돼지 람다 뉴클레오티드 서열이 제공된다.

    일 구체예에서, 예를 들어, 서열 32번으로 표시된, 돼지 람다 경쇄 게놈 서열의 제 1 람다 J/C 부위에 대한 5' 플랭킹(flanking) 서열을 포함하는 뉴클레오티드 서열이 제공된다. 추가로, 돼지 람다 경쇄 게놈 서열의 J/C 클러스터 부위에 대한 3' 플랭킹 서열을 포함하는 뉴클레오티드 서열, 예를 들어 람다 J/C의 하류에서 약 200개 염기쌍, 이를테면 서열 33번으로 표시된 것이 제공된다. 별도로, 돼지 람다 경쇄 게놈 서열의 J/C 클러스터 부위에 대한 3' 플랭킹 서열을 포함하는 뉴클레오티드 서열, 예를 들어 인핸서 부위(이를테면 서열 35번으로 표시된 것), 람다 하류에서 약 17.6 Kb(서열 36번으로 표시된 것), 람다 하류에서 약 19.1 Kb(서열 37번으로 표시된 것), 람다 하류에서 약 21.3 Kb(서열 38번으로 표시된 것), 및/또는 람다 하류에서 약 27 Kb(서열 39번으로 표시된 것)를 비롯하여, 람다 하류에서 약 12 Kb, 인핸서(서열 34번으로 표시된 것) 근처의, J/C 클러스터의 하류에서 약 11.8 Kb가 제공된다.

    추가 구체예에서, 서열 28, 31, 32, 33, 34, 35, 36, 37, 38, 또는 39번으로 표시된 분리된 뉴클레오티드 서열이 제공된다. 서열 28, 31, 32, 33, 34, 35, 36, 37, 38, 또는 39번에 적어도 80, 85, 90, 95, 98 또는 99% 상동인 핵산 서열이 또한 제공된다. 또한, 서열 28, 31, 32, 33, 34, 35, 36, 37, 38, 또는 39번의 적어도 10, 15, 17, 20, 25, 30, 40, 50, 75, 100, 150, 200, 250, 500 또는 1,000개 연속 뉴클레오티드가 제공된다. 서열 28, 31, 32, 33, 34, 35, 36, 37, 38, 또는 39번의 상동 뉴클레오티드뿐 아니라, 임의로 가혹한 조건하에, 이들에 혼성화하는 뉴클레오티드 서열이 추가로 제공된다.

    소 람다 경쇄

    추가 구체예에서, 소 람다 경쇄 좌를 코딩하는 핵산 서열이 제공되며, 이들 은 적어도 하나의 연결 부위-불변 부위 쌍 및/또는 적어도 하나의 가변 부위, 예를 들어 서열 31번으로 표시된 것을 포함할 수 있다. 서열 31번에서, 소 람다 C는 잔기 999-1333에서 발견될 수 있으며, J 내지 C 쌍은 C가 33848-34328의 보체이고 J가 35599-35628의 보체인 잔기 33848-35628의 보체에서 발견될 수 있고, V 부위는 잔기 10676-10728, 11092-11446, 15088-15381. 25239-25528, 29784-30228, 및 51718-52357에서(또는 이들의 보체에서) 발견될 수 있다. 서열 31번은 Genbank ACCESSION No. ACl 17274에서 발견될 수 있다. 분쇄된 소 람다 유전자를 함유하는 세포 및 동물뿐 아니라 서열 31번의 전부 또는 일부, 예를 들어 적어도 100, 250, 500, 1000, 2000, 5000, 10000, 20000, 500000, 75000 또는 100000개 연속 뉴클레오티드를 함유하는 벡터 및/또는 표적화 구성체가 추가로 제공된다.

    프라이머

    또 다른 구체예에서, 표적화 벡터의 3' 및 5' 서열을 생성하는 프라이머가 제공된다. 올리고뉴클레오티드 프라이머는 돼지 면역글로불린 게놈 서열, 이를테면 상기에 기재된, 서열 1, 4, 29, 30, 12, 25, 15, 16, 19, 28 또는 31번에 혼성화될 수 있다. 특정 구체예에서, 프라이머는 가혹한 조건하에 상기에 기재된, 서열 1, 4, 29, 30, 12, 25, 15, 16, 19, 28 또는 31번에 혼성화된다. 또 다른 구체예는 돼지 중쇄, 카파 경쇄 또는 람다 경쇄 핵산 서열, 이를테면 상기에 기재한, 서열 1, 4, 29, 30, 12, 25, 15, 16, 19, 28 또는 31번에 혼성화될 수 있는 올리고뉴클레오티드 프로브를 제공한다. 폴리뉴클레오티드 프라이머 또는 프로브는 본 발명의 폴리뉴클레오티드에 혼성화되는 적어도 14 염기, 20 염기, 30 염기, 또는 50 염기를 가질 수 있다. 프로브 또는 프라이머는 길이가 적어도 14개인 뉴클레오티드일 수 있으며, 특정 구체예에서, 길이가 적어도 14, 20, 25, 28, 또는 30 개의 뉴클레오티드이다.

    일 구체예에서, 작용성 연결 부위(J6 부위)을 포함하는 돼지 Ig 중쇄의 단편을 확대하는 프라이머가 제공된다. 비제한적인 일 구체예에서, 확대된 중쇄 단편은 서열 4번으로 표시될 수 있으며 이 단편을 확대하는데 사용된 프라이머는 5' 재조합 암(arm)을 생성하도록, 서열 2번과 같으나, 이에 한정되지 않는, J-부위의 일부에 상보적일 수 있으며 3' 재조합 암을 생성하도록, 서열 3번과 같으나, 이에 한정되지 않는 Ig 중쇄 mu 불변 부위의 일부에 상보적일 수 있다. 또 다른 구체예에서, 돼지 Ig 중쇄 부위(서열 4번과 같으나, 이에 한정되지 않음)은 표적화 벡터로 서브클로닝되고 조합될 수 있다.

    다른 구체예에서, 불변 부위를 포함하는 돼지 Ig 카파 경쇄의 단편을 확대하는 프라이머가 제공된다. 또 다른 구체예에서, J 부위를 포함하는 돼지 Ig 카파 경쇄의 단편을 확대하는 프라이머가 제공된다. 비제한적인 일 구체예에서, 이 단편을 확대하는데 사용된 프라이머는 5' 재조합 암을 생성하도록, 서열 21 또는 10번과 같으나, 이들에 한정되지 않는, J-부위의 일부에 상보적일 수 있고 3' 재조합 암을 생성하도록, 서열 14, 24 또는 18과 같으나 이들에 한정되지 않는, 불변 부위의 게놈 서열 3'에 상보적일 수 있다. 또 다른 구체예에서, 돼지 Ig 중쇄의 부위(서열 20과 같으나, 이에 한정되지 않음)은 표적화 벡터에 서브클로닝되고 결합될 수 있다.

    II. 면역글로불린 유전자의 유전학적 표적화

    본 발명은 면역글로불린 유전자, 예를 들어 상기에 기재된 면역글로불린 유전자를 유전학적으로 변형시켜 비활성화시킨 세포를 제공한다. 유전학적으로 변형될 수 있는 동물 세포는 피부, 중간엽, 폐, 췌장, 심장, 장, 위, 방광, 혈관, 신장, 요도, 재생 기관, 및 배아, 태아, 또는 성체 동물의 전체 또는 일부의 분리된 제제와 같으나, 이들에 한정되지 않는, 다양한 서로 다른 기관과 조직으로부터 얻어질 수 있다. 본 발명의 일 구체예에서, 세포는 상피 세포, 섬유아세포, 신경 세포, 케라티노사이트, 조혈 세포, 멜라니사이트, 콘드로사이트, 림프구(B 및 T), 매크로파지, 모노사이트, 단핵 세포, 심근 세포, 다른 근 세포, 과립층 세포, 난포 세포, 표피 세포, 내피 세포, 랑게르한스섬 세포, 혈액 세포, 혈액 전구체 세포, 골 세포, 골 전구체 세포, 신경 줄기 세포, 원시 줄기 세포, 간세포, 케라티노사이트, 배꼽정맥 내피 세포, 대동맥 내피 세포, 미세혈관 내피 세포, 섬유아세포, 간 별세포, 대동맥 평활근 세포, 심근 세포, 뉴런, 쿠퍼 세포, 평활근 세포, 쉬완 세포, 및 상피 세포, 적혈구, 혈소판, 뉴로필, 림프구, 모노사이트, 에오시노필, 바소필, 아디포사이트, 콘드로사이트, 췌장 섬 세포, 갑상선 세포, 부갑상선 세포, 이하선 세포, 종양 세포, 아교 세포, 별아교 세포, � ��혈구 세포, 백혈구 세포, 매크로파지, 상피 세포, 체세포, 뇌하수체 세포, 부신 세포, 모세포, 방광 세포, 신장 세포, 망막 세포, 간상 세포, 원추 세포, 심장 세포, 박동조절 세포, 지라 세포, 항원 표시 세포, 기억 세포, T 세포, B 세포, 플라즈마 세포, 근육 세포, 난소 세포, 자궁 세포, 전립선 세포, 질 상피 세포, 정자 세포, 고환 세포, 생식 세포, 난 세포, 레이디히 세포, 관주위 세포, 써토리 세포, 루테인 세포, 경부 세포, 자궁내막 세포, 유방 세포, 소포 세포, 점막 세포, 섬모 세포, 비각질 상피 세포, 각질 상피 세포, 폐 세포, 배상 세포, 원주 상피 세포, 편평 상피 세포, 골세포, 골아세포, 및 파골세포로 구성되나, 이들에 한정되지 않는 그룹 중에서 선택될 수 있다. 별도의 일 구체예에서, 배아 줄기 세포가 사용될 수 있다. 배아 줄기 세포주가 이용될 수 있거나 배아 중기 세포가 숙주, 이를테면 돼지로부터 새로 얻을 수 있다. 세포를 적합한 섬유아세포-영양 세포층 상에 성장시키거나 백혈병 억제 인자(LIF)의 존재하에 성장시킬 수 있다.

    특정 구체예에서, 세포는 섬유아세포일 수 있으며; 특정 일 구체예에서, 세포는 태아 섬유아세포일 수 있다. 섬유아세포는 적합한 체세포형이다. 왜냐하면 이들은 발생 태아 및 성체 동물로부터 많은 양으로 얻을 수 있기 때문이다. 이들 세포는 급속 배가 시간으로 시험관에 쉽게 전달될 수 있으며 유전자 표적화 방법에 사용하는데 클론으로 전달될 수 있다.

    표적화 구성체

    상동적 재조합

    일 구체예에서, 면역글로불린 유전자는 상동적 조환을 통해 세포에 유전학적으로 표적화될 수 있다. 상동적 재조합은 내인성 유전자에서 부위-특이 변형을 허용하며 따라서 새로운 변형이 게놈으로 설계될 수 있다. 상동적 재조합에서, 들어오는 DNA는 실질적으로 상동적인 DNA 서열을 함유하는 게놈에서 한 부위와 상호작용하고 일체화된다. 비-상동적("랜덤" 또는 "부정") 일체화에서, 들어오는 DNA는 게놈 내 상동적 서열에서 발견되지 않으며 많은 수의 포텐셜 위치 중 하나에서, 어느 곳에 일체화된다. 일반적으로, 더 많은 진핵 세포에 의한 연구에서 상동적 재조합의 빈도가 랜덤 합체의 빈도보다 훨씬 적다는 것이 나타났다. 이들 빈도의 비율은 상동적 재조합(즉, 게놈에서 외인성 "표적화 DNA"와 상응하는 "표적 DNA" 사이의 재조합)을 통한 일체화에 좌우되는 "유전자 표적화"에 대한 직접적 해석이다.

    많은 논문에서 포유류 세포에서 상동적 재조합의 이용을 기재하고 있다. 이들 논문의 예는 Kucherlapati et al., Proc. Natl. Acad. Sci. USA 81:3153-3157, 1984; Kucherlapati et al., MoI. Cell. Bio. 5:714-720, 1985; Smithies et al, Nature 317:230-234, 1985; Wake et al., MoI. Cell. Bio. 8:2080-2089, 1985; Ayares et al., Genetics 111:375-388, 1985; Ayares et al., MoI. Cell. Bio. 7:1656-1662, 1986; Song et al., Proc. Natl. Acad. Sci. USA 84:6820-6824, 1987; Thomas et al. Cell 44:419-428, 1986; Thomas and Capecchi, Cell 51: 503- 512, 1987; Nandi et al., Proc. Natl. Acad. Sci. USA 85:3845-3849, 1988; and Mansour et al., Nature 336:348-352, 1988. Evans and Kaufinan, Nature 294:146-154, 1981; Doetschman et al., Nature 330:576-578, 1987; Thoma and Capecchi, Cell 51:503-512,4987; Thompson et al., Cell 56:316-321, 1989이다.

    본 발명은 상기에 기재한 세포들과 같은, 세포에서 면역글로불린 유전자를 비활성화하는데 상동적 재조합을 이용할 수 있다. DNA는 작용성 면역글로불린의 발현을 방지하도록, 선천 유전자의 적어도 하나, 임의로 양쪽 카피로 변경의 도입과 함께, 특정 위치에 유전자의 적어도 일부를 포함할 수 있다. 변경은 삽입, 결실, 치환 또는 이들의 조합일 수 있다. 변경이 비활성화되는 단 하나의 카피로 도입될 때, 표적 유전자의 단일 비돌연변이 카피를 가진 세포가 증폭되고 제 2 표적화 단계로 처리될 수 있으며, 여기서 변경은 제 1 변경과 동일하거나 다를 수 있으며, 통상 다르고, 결실, 또는 치환이 관련될 때, 최초 도입된 변경의 적어도 일부가 겹칠 수 있다. 이러한 제 2 표적화 단계에서, 동일한 암의 상동성을 가지나, 서로 다른 포유류 선택성 마커를 함유한 표적화 벡터가 사용될 수 있다. 생성된 형질전환주를 작용성 표적 항원의 부존재에 대해 스크리닝하고 세포의 DNA를 추가로 스크리닝하여 야생형 표적 유전자의 부존재를 확인할 수 있다. 별도로, 표현형에 관해 동종접합성은 돌연변이에 대한 이종접합체 숙주를 번식시켜 얻을 수 있다.

    표적화 벡터

    다른 구체예에서, 핵산 표적화 벡터 구성체가 또한 제공된다. 표적화 벡터는 세포에서 상동적 재조합을 완성하도록 설계될 수 있다. 이들 표적화 벡터를 포유류 세포로 형질전환하여 상동적 재조합을 통해 유제 동물 중쇄, 카파 경쇄 또는 람다 경쇄 유전자를 표적화할 수 있다. 일 구체예에서, 표적화 벡터는 유제 동물 중쇄, 카파 경쇄 또는 람다 경쇄 게놈 서열의 게놈 서열에 상동인 3' 재조합 암 및 5' 재조합 암(즉, 플랭킹 서열), 예를 들어, 상기에 기재한, 서열 1, 4, 29, 30, 12, 25, 15, 16, 19, 28 또는 31번으로 표시된 서열을 함유할 수 있다. 상동 DNA 서열은 적어도 15 bp, 20 bp, 25 bp, 50 bp, 100 bp, 500 bp, l kbp, 2 kbp, 4 kbp, 5 kbp, 10 kbp, 15 kbp, 20 kbp, 또는 50 kbp의 서열, 특히 게놈 서열에 상동인, 연속 서열을 포함할 수 있다. 3' 및 5' 재조합 암은 이들이 게놈 서열의 적어도 하나의 작용성 가변체, 연결, 다양성, 및/또는 불변 부위의 3' 및 5' 말단을 플랭킹하도록 설계될 수 있다. 작용성 부위의 표적화는 작용성 부위에 비활성화를 부여할 수 있으며, 이것은 세포의 비활성화를 초래하여 작용성 면역글로불린 분자를 생성한다. 다른 구체예에서, 상동 DNA 서열은 하나 이상의 인트론 및/또는 엑손 서열을 포함할 수 있다. 핵산 서열에 더해, 발현 벡터는 선택성 마커 서열,이를테면 향상된 그린 플루오레슨트 프로테인(eGFP) 유전자 서열, 개시 및/또는 인핸서 서열, 폴리 A-테일 서열, 및/또는 원핵 및/또는 진핵 숙주 세포에서 구성체의 발현을 제공하는 핵산 서열을 함유할 수 있다. 선택성 마커는 5' 및 3' 재조합 암 서열 사이에 위치할 수 있다.

    세포의 표적 좌는 DNA를 세포로 도입함으로써 변형될 수 있으며, 여기서 DNA는 표적 좌에 상동성이 있고 마커 유전자를 포함하여, 합체된 구성체를 포함하는 세포의 선택을 가능하게 한다. 표적 벡터에서 상동 DNA는 표적 좌에서 염색체 DNA와 재조합할 것이다. 마커 유전자는 상동 DNA 서열, 3' 재조합 암 및 5' 재조합 암에 의해 양측 상에 플랭킹될 수 있다. 표적화 벡터의 구성방법은 본 기술에 기재된 바 있다(참조예, Dai et al., Nature Biotechnology 20: 251-255, 2002; WO 00/51424).

    다양한 구성체가 표적 좌에서 상동 재조합을 위해 제조될 수 있다. 구성체는 표적 좌와 상동인 적어도 50 bp, 100 bp, 500 bp, l kbp, 2 kbp, 4 kbp, 5 kbp, 10 kbp, 15 kbp, 20 kbp, 또는 50 kbp의 서열을 포함할 수 있다. 서열은 면역글로불린 유전자의 연속 서열을 포함할 수 있다.

    표적 DNA 서열의 상동성 정도를 측정하는데 다양한 고려사항, 이를테면 표적 좌의 크기, 서열의 이용성, 표적 좌에서 이중 교차 이벤트의 상대 효능 및 다른 서열과 표적 서열의 유사성이 관련될 수 있다.

    표적화 DNA는 DNA가 변형될 게놈에서 상응하는 표적 서열과 원하는 서열 변형을 실질적으로 동종으로 플랭킹하는 서열을 포함할 수 있다. 실질적으로 동종 서열은 상응하는 표적 서열(원하는 서열 변형 제외)에 적어도 약 95%, 97-98%, 99.0-99.5%, 99.6-99.9%, 또는 100% 동일할 수 있다. 특정 구체예에서, 표적화 DNA와 표적 DNA는 DNA 스트레치(stretch)를 100% 동일한 적어도 약 75, 150 또는 500 염기쌍으로 공유할 수 있다. 따라서, 표적화 DNA는 표적화되는 세포주에 밀접한 세포로부터 유래될 수 있거나; 표적화 DNA는 표적화되는 세포와 동일한 세포주 또는 동물의 세포로부터 유래될 수 있다.

    돼지 중쇄 표적화

    본 발명의 특정 구체예에서, 돼지 중쇄 좌를 표적화하는 표적화 벡터가 제공된다. 특정 일 구체예에서, 표적화 벡터는 돼지 면역글로불린 중쇄 좌의 J6 부위의 3' 및 5' 플랭킹 서열에 상동인 서열을 함유하는 5' 및 3' 재조합 암을 함유할 수 있다. J6 부위가 돼지 면역글로불린 중쇄 좌의 유일한 작용성 연결 부위가므로, 이 부위는 작용성 돼지 중쇄 면역글로불린의 발현을 방지할 것이다. 특정 구체예에서, 표적화 벡터는 임의로 J1-4를 포함하여, J6 부위의 게놈 서열 5'에 상동인 서열을 함유하는 5' 재조합 암 및 mu 불변 부위("J6 표적화 구성체")을 포함하여, J6 부위의 게놈 서열 3'에 상동인 서열을 함유하는 3' 재조합 암을 함유할 수 있다(참조예, 서열 5번 및 도 1). 다른 특정 구체예에서, 5' 표적화 암은 J1의 서열 5', 이를테면 서열 1번 및/또는 서열 4번에 제시된 것을 함유할 수 있다. 다른 구체예에서, 5' 표적화 암은 J1, J2 및/또는 J3의 서열 5', 예를 들어 대략 잔기 1-300, 1-500, 1-750, 1-1000 및/또는 1-1500 서열 4번에 제시된 것을 함유할 수 있다. 추가 구체예에서, 5' 표적화 암은 불변 부위의 서열 5', 예를 들어 서열 4번의 대략 잔기 1-300, 1-500, 1- 750, 1-1000, 1-1500 및/또는 1-2000 또는 그의 단편 및/또는 서열 5의 연속 서열 또는 그의 단편을 함유할 수 있다. 다른 구체예 에서, 3' 표적화 암은 불변 부위의 서열 3'을 함유할 수 있고/있거나 불변 부위, 예를 들어 서열 4번의 잔기 7000-8000 및/또는 8000-9000 또는 그의 단편을 포함할 수 있다. 다른 구체예에서, 표적화 벡터는 서열 4번의 연속 서열 또는 그의 단편을 함유할 수 있다. 다른 구체예에서, 표적화 벡터는 다양성 부위의 게놈 서열 5'에 상동인 서열을 함유하는 5' 재조합 암, 및 돼지 중쇄 좌의 다양성 부위의 게놈 서열 3'에 상동인 서열을 함유하는 3' 재조합 암을 함유할 수 있다. 추가 구체예에서, 표적화 벡터는 mu 불변 부위의 게놈 서열 5'에 상동인 서열을 함유하는 5' 재조합 암 및 돼지 중쇄 좌의 mu 불변 부위의 게놈 서열 3'에 상동인 서열을 함유하는 3' 재조합 암을 함유할 수 있다.

    추가 구체예에서, 표적화 벡터는 다음 서열의 어느 하나를 포함할 수 있으나, 이에 한정되지 않는다: 예를 들어 서열 29번의 잔기 1089-1099(D(슈도))으로 표시되는 중쇄의 다양성 부위, 예를 들어 서열 29번의 잔기 1887-3352(예를 들어: J(슈도): 서열 29번의 1887-1931, J(슈도): 서열 29번의 2364-2411, J(슈도: 서열 29번의 2756-2804, J(작용성 J): 서열 29번의 3296-3352)로 표시되는 중쇄의 연결 부위, 예를 들어 서열 29번의 잔기 3001-3261(노나머), 서열 29번의 3292-3298(헵타머)로 표시되는 재조합 시그널, 다음 잔기로 표시되는 불변 부위: 서열 29번의 3353-9070(J 내지 C mu 인트론), 서열 29번의 5522-8700(스위치 부위), 서열 29번의 9071-9388(Mu 엑손 1), 서열 29번의 9389-9469(Mu 인트론 A), 서열 29번의 9470-9802(Mu 엑손 2), 서열 29번의 9830-10069(Mu 인트론 B), 서열 29번의 10070-10387(Mu 엑손 3), 서열 29번의 10 388-10517(Mu 인트론 C), 서열 29번의 10815- 11052(Mu 엑손 4), 서열 29번의 11034-11039(PoIy(A) 시그널) 또는 그의 단편 또는 조합물. 추가로, 서열 29번의 적어도 약 17, 20, 30, 40, 50, 100, 150, 200 또는 300 뉴클로티드의 연속 서열 또는 그의 단편 및/또는 조합물이 중쇄 표적화 벡터에 대한 표적화 서열로서 사용될 수 있다. 일반적으로 표적화 구성체를 설계할 때 하나의 표적화 암은 다른 표적화 암의 5'일 것으로 이해된다.

    다른 구체예에서, 돼지 중쇄 유전자의 발현을 중단하도록 설계된 표적화 벡터는 중쇄의 불변 부위를 표적화하는 재조합 암, 예를 들어 3' 또는 5' 재조합 암을 함유할 수 있다. 일 구체예에서, 재조합 암은 mu 불변 부위, 예를 들어 상기에 기재되거나 문헌[Sun & Butler Immunogenetics (1997) 46: 452-460]에 개시된 C mu 서열을 표적화할 수 있다. 다른 구체예에서, 재조합 암은 델타 불변 부위, 이를테면 문헌[Zhao et al. (2003) J imunol 171: 1312-1318]에 roto된 서열, 또는 알파 불변 부위, 이를테면 문헌[Brown & Butler (1994) Molec Immunol 31: 633-642]에 기재된 서열을 표적화할 수 있다.

    돼지 카파쇄 표적화

    본 발명의 특정 구체예에서, 돼지 카파쇄 부위를 표적으로 하는 표적 벡터가 제공된다. 일 특정 구체예로, 표적 벡터는 돼지 면역글로불린 카파쇄 부위 불변 영역의 3' 및 5' 인접 서열에 상동 서열을 함유하는 5' 및 3' 재조합 팔을 함유할 수 있다. 본 발명은 돼지 면역글로불린 카파 경쇄 부위에 하나의 불변 영역만이 있음을 알아냈기 때문에, 기능성 돼지 카파 경쇄 면역글로불린의 발현을 저지할 것이다. 특정 구체예로, 표적 벡터는 임의로 연결 영역을 포함하는, 불변 영역의 게놈 서열 5'에 상동 서열을 함유하는 5' 재조합 팔, 및 불변 영역의 게놈 서열 3'에 상동 서열을 함유하는 3' 재조합 팔을 포함한다[도 2 참조]. 또한, 이러한 카파 불변 표적 작제물은 5' 및 3' 재조합 팔 사이에 위치한 선택 마커 유전자를 함유할 수도 있다[예를 들어, Seq ID No 20 및 도 2 참조]. 다른 구체예로, 표적 벡터는 돼지 카파 경쇄 부위에 있는 연결 영역의 게놈 서열 5'에 상동 서열을 함유하는 5' 재조합 팔, 및 연결 영역의 게놈 서열 3'에 상동 서열을 함유하는 3' 재조합 팔을 함유할 수도 있다. 다른 구체예로, 표적 벡터의 5' 팔은 Seq ID No 12 및/또는 Seq DD No 25 또는 임의의 근접 서열 또는 이들의 단편을 포함할 수 있다. 다른 구체예로, 표적 벡터의 3' 팔은 Seq ID No 15, 16 및/또는 19 또는 임의의 근접 서열 또는이들의 단편을 포함할 수 있다.

    또 다른 구체예로, 표적 벡터는 하기 서열이 예시되나 이들에 한정되지 않는 서열들을 포함할 수도 있다: 카파 경쇄의 코딩 영역은 예를 들어 Seq ID No 30의 잔기 1-549 및 Seq ID No 30의 10026-10549로 나타내어지는 반면, 인트론 서열은, 예를 들어, Seq ID No 30의 잔기 550-10025로 나타내어지고, 카파 경쇄의 연결 영역은, 예를 들어 Seq ID No 30의 잔기 5822- 7207로 나타내어지며(예를 들어, Seq ID No 30의 J1:5822-5859, Seq ID No 30의 J2:6180-6218, Seq ID No 30의 J3:6486-6523, Seq ID No 30의 J4:6826-6863, Seq ID No 30의 J5:7170-7207), 불변 영역은 하기 잔기로 나타내어진다: Seq ID No 30의 10026-10549(C 엑손) 및 Seq ID No 30의 10026-10354(C 코딩), Seq ID No 30의 10524-10529(폴리(A) 시그널) 및 Seq ID No 30의 11160-11264(SINE 요소) 또는 이들의 임의 단편 또는 조합. 또한, Seq ID No 30의 임의의 근접 서열 적어도 약 17, 20, 30, 40, 50, 100, 150, 200 또는 300개의 뉴클레오티드 또는 이들의 단편 및/또는 조합이 중쇄 표적 벡터에 대한 표적 서열로 사용될 수도 있다. 일반적으로, 표적 작제물을 설계하는 경우, 하나의 표적 팔은 다른 표적 팔의 5'일 것으로 이해하여야 한다.

    돼지 람다 사슬 표적화(Porcine Lambda Chain Targeting)

    본 발명의 특정 구체예에서, 돼지 중쇄 유전자 부위를 표적화하기 위한 표적화 벡터가 제공된다. 일 구체예에서, 5' 암(5' arm)을 함유하는 첫번째 JC 클러스터(cluster) 5'에 위치한 서열 및 3' 암(3' arm)을 함유하는 마지막 JC 클러스터(cluster) 3' 서열을 함유하고, 이에 따라, 람다 유전자 부위의 기능적 발현을 방지하는 표적화 컨스트럭트(construct)를 설계함으로써 람다는 표적화될 수 있다(도 3-4 참조). 일구체예에서, 표적화 벡터는 임의의 연속된 서열(연속된 서열의 대략 17, 20, 30, 40, 50, 75, 100, 200, 300 또는 5000와 같이) 또는 서열 번호 28의 단편을 함유할 수 있다. 일구체예에서, 5' 표적화 암은 서열 번호 32를 함유할 수 있으며, 이는 돼지 람다 경쇄 유전자 서열의 첫번째 람다 J/C 부위에 5' 프랭킹 서열 또는 임의의 연속된 서열(연속된 서열의 대략 17, 20, 30, 40, 50, 75, 100, 200, 300 또는 5000 뉴클레오티드와 같이) 또는 이들의 단편을 함유한다(예를 들어 도 5 참조). 다른 구체예에서, 3' 표적화 암은: 람다 J/C의 거의 200 염기쌍 다운스트림(downstream)으로부터, 돼지 경쇄 유전자 서열의 J/C 클러스터 영역에 3' 프랭킹 서열을 함유하는 서열 번호. 33; 인핸서 근처, J/C 클러스터의 거의 11.8Kb 다운스트림에서, 돼지 경쇄 유전자 서열의 J/C 클러스터 부분에 3' 프랭킹 서열을 함유하는 서열 번호. 34; 람다의 거의 12Kb 다운스트림을 함유하고, 인핸서 부분을 함유하는 서열 번호. 35; 람다의 거의 17.6Kb 다운스트림을 함유하는 서열 번호. 36;람다의 거의 19.1Kb 다운스트림을 함유하는 서열 번호. 37; 람다의 거의 21.3Kb 다운스트림을 함유하는 서열 번호. 38; 람다의 거의 27Kb 다운스트림을 함유하는 서열 번호. 39; 또는 임의의 연속된 서열(연속된 서열의 대략 17, 20, 30, 40, 50, 75, 100, 200, 300 또는 5000 뉴클레오티드와 같은) 또는 서열 번호. 32-39의 단편(예를 들어, 도 6 참조)을 함유할 수 있으나, 이 중 하나 또는 그 이상에 한정되지 않는다. 일반적으로 표적화 컨스트럭트를 설계할 때, 하나의 표적화 암(arm)은 다른 표적화 암(arm)의 5'일 것으로 이해된다.

    추가적인 구체예에서, 람다 유전자 부위를 위한 표적화 컨스트럭트는 예를 들면, lox와 같은 부위 특이적 재조합효소(recombinase) 부위를 함유할 수 있다. 일 구체예에서, 표적화 암은 표적화 영역에 부위 특이적 재조합효소 부위를 삽입할 수 있다. 그 다음, 부위 특이적 재조합효소는 두개의 부위 특이적 재조합효소 부위 사이에 끼여있는 뉴클레오티드가 제거되도록 활성화되고/거나, 세포에 적용된다.(예를 들어, 도 6 참조).

    선택가능한 마커 유전자(Selectable Marker Genes)

    DNA 컨스트럭트는 내인성(endogenous) 표적 면역글로블린 유전자를 변형하도록 설계될 수 있다. 컨스트럭트를 표적화하기 위한 상동성 서열은 하나 또는 그 이상의 결실, 삽입, 치환 또는 이의 조합들을 가질 수 있다. 변형은 표적 유전자의 업스트림 서열을 갖는 리딩 프레임(reading frame)에 융합된 선택가능한 마커 유전자의 삽입일 수 있다.

    적합한 선택가능한 마커 유전자는: HAT 배지(하이포잔틴, 아미노프테린 및 티미딘(hypoxanthine, aminopterin 및 thymidine))에서 자랄 수 있는 능력을 부여하는 tk 유전자(티미딘 키나아제(thymidine kinase)) 또는 hprt 유전자(하이포잔틴 포스포리보실트랜스퍼라제(hypoxanthine phosphoribosyltransferase))와 같이, 특정 배지 기질에서 자랄 수 있는 능력을 부여하는 유전자; MAX 배지(마이코페놀릭산, 아데닌 및 잔틴(mycophenolic acid, adenine, 및 xanthine))에서의 성장을 허용하는 박테리아 gpt 유전자(구아닌/잔틴 포스포리보실트랜스퍼라제(guanine/xanthine phosphoribosyltransferase))를 포함하나, 이에 한정되지 않는다. 예를 들어, Song, KY., et al. Proc. Nat'l Acad. Sci. USA 84:6820-6824 (1987); Sambrook, J., et al., Molecular Cloning A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1989), Chapter 16을 참고한다. 선택가능한 마커의 다른 예들은: 항생제와 같은 화합물에 저항성을 부여하는 유전자, 선택된 기질에서 자랄 수 있는 능력을 부여하는 유전자, 녹색 형광 단백질(green fluorescent protein), 증강된 녹색 형광 단백질(enhanced green fluorescent protein, eGFP)과 같이 형광성을 감지할 수 있는 신호를 생산하는 단백질을 암호화하는 유전자를 함유한다. 상기의 마커의 넓은 다양성은 알려져 있으고, 유용하며, 이는 예를 들어, 네오마이신(neomycin) 저항성 유전자(neo)(Southern, P., and P. Berg, J. MoI. Appl. Genet. 1:327-341 (1982)); 및 히그로마이신(hygromycin) 저항성 유전자(hyg)(Nucleic Acids Research 11:6895-6911 (1983), and Te Riele, H., et al., Nature 348:649-651 (1990))와 같은 항생제 저항성 유전자를 함유한다. 다른 선택가능한 마커 유전자는: 아세토히드록시산 신타아제(acetohydroxyacid synthase(AHAS)), 알카라인 포스파타제(alkaline phosphatase (AP)), 베타 갈락토시다제(beta galactosidase (LacZ)), 베타 글루코로니다제(beta glucoronidase (GUS)), 클로람페니콜 아세틸트랜스퍼라제(chloramphenicol acetyltransferase (CAT)), 녹색 형광 단백질(green fluorescent protein (GFP)), 적색 형광 단백질(red fluorescent protein (RFP)), 노란색 형광 단백질(yellow fluorescent protein (YFP)), 청록 형광 단백질(cyan fluorescent protein (CFP)), 당근과산화수소(horseradish peroxidase (HRP)), 루시퍼라제(luciferase (Luc)), 노팔린 신타아제(nopaline synthase (NOS), 옥토파인 신타아제(octopine synthase (OCS)), 및 이의 유도체를 함유한다. 앰피실 린(ampicillin), 블레오마이신(bleomycin), 클로람페니콜(chloramphenicol), 젠타마이신(gentamycin), 히그로마이신(hygromycin), 카나마이� ��(kanamycin), 리노마이신(lincomycin), 메쏘트렉세이트(methotrexate), 포스포이노트리신(phosphinothricin), 푸로마이신(puromycin) 및 테트라사이클린(tetracycline)에 저항성을 부여하는 다양한 선택가능한 마커가 유용하다.

    항생제 저항성 유전자와 음성 선택 요소(negative selection factor)를 병합시키는 방법은 종래의 보통 기술의 그것과 유사할 것이다(see, eg, WO 99/15650; US Patent No. 6,080,576; US Patent No. 6,136,566; Niwa et al., J. Biochem. 113:343-349 (1993); and Yoshida et al., Transgenic Research 4:277-287 (1995)).

    선택가능한 마커의 조합 또한 이용될 수 있다. 예를 들어, 면역글로블린 유전자를 표적화하기 위하여, neo 유전자(상기에서 언급된 바, 그것 자신의 프로모터와 함께, 또는, 그것 자신의 프로모터 없이)를 면역글로블린 유전자에 상동성을 갖는 DNA 서열에 클로닝할 수 있다. 마커의 조합체를 이용하기 위하여, HSV-tk 유전자는 표적화 DNA의 바깥쪽에 있도록 클론될 수 있다(필요하다면, 다른 선택가능한 마커는 반대 프랭크(flank)에 위치할 수 있다). DNA 컨스트럭트를 타겟된 세포에 도입시킨 후, 세포를 적합한 항생제에서 선택할 수 있다. 이러한 특정 실시예에서, G418 및 간시클로버(gancyclovir)에 저항성이 있는 세포들은 대부분 neo 유전자가 면역글로블린 유전자에 재결합되는 동종의 재조합에 의하여 발생할 것이며, tk 유전자는 그것이 이중 크로스오버(double crossover) 부분의 바깥쪽에 위치하기 때문 에 결실된다. 결실은 적어도 약 50bp, 더욱 일반적으로 적어도 약 100bp, 일반적으로 약 20kbp를 넘지 않을 수 있으며, 여기서, 결실은 적어도 하나 또는 그 이상의 엑손의 일부분, 하나 또는 그 이상의 인트론의 일부분을 함유하는 코딩 영역(coding region)의 적어도 한 부분을 일반적으로 함유할 수 있으며, 프랭킹 비-코딩 영역의 일부분(flanking non-coding region), 특히 5'-비-코딩 영역(전사적 조절 부분)을 함유할 수 있거나, 함유하지 않을 수 있다. 이에 따라, 동종 부분은 코딩 영역 하에서, 5'-비-코딩 부분으로 또는 대체적으로 3'-비-코딩 부분으로 확대될 수 있다. 삽입은 일반적으로 10kbp를 넘지 않으며, 보통은 5kbp를 넘지 않으며, 일반적으로 적어도 50bp이며, 더욱 일반적으로 적어도 200bp이다.

    동종의 부분은 프레임 이동(frame shift) 또는 주요 아미노산 변화 또는 기능 장애가 있는 대립형질(allele)을 수정할 수 있는 돌연변이를 위해 제공된 것에서, 표적 유전자를 비활성화할 수 있는 돌연변이를 포함할 수 있다. 돌연변이는 동종 프랭킹 서열의 약 5%를 넘지 않는 포착하기 어려운 변화일 수 있다. 마커 유전자는 유전자의 돌연변이를 원하는 곳의 인트론 또는 액손으로 삽입될 수 있다.

    컨스트럭트는 종래에 알려진 방법들에 따라 준비될 수 있으며, 다양한 단편들을 접촉시킬 수 있으며, 적합한 벡터에로 도입, 클론, 분석되며, 그 다음, 원하는 컨스트럭트를 얻을 때까지 조작된다. 제한 분석(restriction analysis), 절제(excision), 프로브의 확인(identification of probe) 등을 허용하기 위한, 다양한 변형이 서열에 만들어질 수 있다. 침묵 돌연변이는 바람직하게 도입될 수 있다. 양한 단계에서, 제한 분석(restriction analysis), 시퀀싱(sequencing), 중합효소 연쇄 반응(polymerase chain reaction)으로 증폭, 프라이머 수선(primer repair), 실험상 돌연변이유발(mutagenesis) 등이 채용될 수 있다.

    컨스트럭트는 컨스트럭트가 클론되고 분석될 수 있는 각 단계에서, 예를 들어, E.coli 에 의하여 인지될 수 있는 기점(origin)을 포함하는 원핵생물 복제 시스템을 포함하는 박테리아 벡터를 이용하여 준비될 수 있다. 삽입에 이용되는 마커와 동일하거나 다른 마커가 이용될 수 있으며, 이는 표적 세포에 도입되기 전에 제거될 수 있다. 벡터를 함유하는 컨스트럭트가 한번 완전하게 되면, 박테리아 서열의 제거, 선형화(linearization), 동종 서열에서 짧은 결실의 도입과 같은 것에 의하여, 조작될 수 있다. 마지막 조작 후에, 컨스트럭트는 세포에 도입될 수 있다.

    본 발명은 또한, 면역글로블린 유전자의 서열을 함유하는 재조합 컨스트럭트를 함유한다. 컨스트럭트는 본 발명의 서열에 정방향 또는 역방향으로 삽입된, 플라스미드 또는 바이러스 벡터와 같은 벡터를 포함한다. 컨스트럭트는 또한, 예를 들어, 서열에 사용가능하게 링크된 프로모터를 함포함하는 조절 서열을 함유할 수 있다. 많은 수의 적합한 벡터 및 프로모터는 본 분야의 기술자에게 알려져 있으며, 상업적으로 입수가능하다. 다음 벡터들은 예로써 제공된다. 박테리아의: pBs, pQE-9 (Qiagen), phagescript, PsiX174, pBluescript SK, pBsKS, pNH8a, pNH16a, pNH18a, pNH46a (Stratagene); pTrc99A, pKK223-3, pKK233-3, pDR540, pRⅠT5 (Pharmacia). 진핵생물의: pWLneo, pSv2cat, pOG44, pXTl, pSG (Stratagene) pSVK3, pBPv, pMSG, pSVL (Pharmiacia), 바이러스 오리진 벡터(viral origin vectors)(M13 벡터, 박테리아 파지 1 벡터, 아데노바이러스 벡터 및 레트로바이러 스 벡터), 높은, 낮은 그리고 조절가능한 카피 수(copy number) 벡터, 단일 호스트에서 조합의 이용을 위해 적합한 레플리콘(replicon)을 갖는 벡터(pACYC184 및 pBR322) 및 진핵생물 에피솜 복제 벡터(eukaryotic episomal replication vectors (pCDM8))를 함유한다. 다른 벡터들은 pcDNA II, pSL301, pSE280, pSE380, pSE420, pTrcHisA, B, 및 C, pRSET A, B, 및 C (Invitrogen, Corp.), pGEMEX-1, 및 pGEMEX-2 (Promega, Inc.), pET 벡터 (Novagen, Inc.), pTrc99A, pKK223-3, pGEX 벡터, pEZZ18, pRIT2T, 및 pMC1871 (Pharmacia, Inc.), pKK233-2 및 pKK388-l (Clontech, Inc.), 및 pProEx-HT (Invitrogen, Corp.) 및 변형체 및 이의 유도체와 같은 원핵생물 발현 벡터를 함유한다. 다른 벡터들은 pFastBac, pFastBacHT, pFastBacDUAL, pSFV, 및 pTet- Splice (Invitrogen), pEUK-Cl, pPUR, pMAM, pMAMneo, pBIlOl, pBI121, pDR2, pCMVEBNA, 및 pYACneo (Clontech), pSVK3, pSVL, pMSG, pCHllO, 및 pKK232-8 (Pharmacia, Inc.), p3'SS, pXTl, pSG5, pPbac, pMbac, pMClneo, 및 pOG44 (Stratagene, Inc.), 및 pYES2, pAC360, pBlueBacHis A, B, 및 C, pVL1392, pBlueBacⅢ, pCDM8, pcDNAl, pZeoSV, pcDNA3 pREP4, pCEP4, 및 pEBVHis (Invitrogen, Corp.) 및 변형체 및 이의 유도체와 같은 진핵생물 발현 벡터를 함유한다. 이용될 수 있는 추가적인 벡터는 pUC18, pUC19, pBlueScript, pSPORT, 코스미드(cosmid), 파지미드(phagemid), YACs (이스트 인공 염색체), BACs (박테리아 인공 염색체), Pl (Escherichia coli phage), pQE70, pQE60, pQE9 (quagan), pBS 벡터, PhageScript 벡터, BlueScript 벡터, pNH8A, pNH16A, pNH18A, pNH46A (Stratagene), pcDNA3 (Invitrogen), pGEX, pTrsfus, pTrc99A, pET-5, pET-9, pKK223-3, pKK233-3, pDR540, pRIT5 (Pharmacia), pSPORTl, pSPORT2, pCMVSPORT2.0 및 pSV-SPORTl (Invitrogen), Invitrogen으로 부터의 pTrxFus, pThioHis, pLEX, pTrcHis, pTrcHis2, pRSET, pBlueBacHis2, pcDNA3.1/His, pcDNA3.1(-)/Myc-His, pSecTag, pEBVHis, pPIC9K, pPIC3.5K, pAO815, pPICZ, pPICZD, pGAPZ, pGAPZD, pBlueBac4.5, pBlueBacHis2, pMelBac, pSinRep5, pSinHis, pIND, pIND(SPl), pVgRXR, pcDNA2.1, pYES2, pZErOl.l, pZErO-2.1, pCR-Blunt, pSE280, pSE380, pSE420, pVL1392, pVL1393, pCDM8, pcDNAl.l, pcDNAl.I/Amp, pcDNA3.1, pcDNA3.1/Zeo, pSe, SV2, pRc/CMV2, pRc/RSV, pREP4, pREP7, pREP8, pREP9, pREP 10, pCEP4, pEBVHis, ρCR3.1, pCR2.1, pCR3.1-Uni, 및 pCRBac; Pharmacia로 부터의 D ExCeIl, D gtl1, pTrc99A, pKK223-3, pGEX-1 DT, pGEX-2T, pGEX-2TK, pGEX-4T-l, pGEX- 4T-2, pGEX-4T-3, pGEX-3X, pGEX-5X-l, pGEX-5X-2, pGEX-5X-3, pEZZ18, pRIT2T, pMC1871, pSVK3, pSVL, pMSG, pCH11O, pKK232-8, pSL1180, pNEO, 및 pUC4K; Novagen으로 부터의 pSCREEN-lb(+), pT7Blue(R), pT7Blue-2, pCITE-4abc(+), pOCUS-2, pTAg, pET- 32LIC, pET-30LIC, pBAC-2cp LIC, pBACgus-2cp LIC, pT7Blue-2 LIC, pT7Blue-2, DSCREEN-I, DBlueSTAR, pET-3abcd, pET-7abc, pET9abcd, pETllabcd, pET12abc, pET- 14b, pET-15b, pET-16b, pET-17b-pET-17xb, pET-19b, pET-20b(+), pET-21abcd(+), pET-22b(+), pET-23abcd(+), pET-24abcd(+),pET-25b(+), pET-26b(+), pET-27b(+), pET-28abc(+), pET-29abc(+), pET-30abc(+), pET-31b(+), pET-32abc(+), pET-33b(+), pBAC-1, pBACgus-1, pBAC4x-l, pBACgus4x-l, pBAC-3cp, pBACgus-2cp, pBACsurf-1, plg, Signal plg, pYX, Selecta Vecta-Neo, Selecta Vecta-Hyg, 및 Selecta Vecta-Gpt; Clontech로 부터의 pLexA, pB42AD, pGBT9, pAS2-l, pGAD424, pACT2, pGAD GL, pGAD GH, pGAD1O, pGilda, pEZM3, pEGFP, pEGFP-1, pEGFP-N, pEGFP-C, pEBFP, pGFPuv, pGFP, p6xHis-GFP, pSEAP2-Basic, pSEAP2-Contral, pSEAP2-프로모터, pSEAP2-인핸서, pD gal-Basic, pDgal-Control, pDgal-프로모터, pDgal-인핸서, pCMVD, pTet-Off, pTet-On, pTK-Hyg, pRetro-Off, pRetro-On, pIRESlneo, pIRESlhyg, pLXSN, pLNCX, pLAPSN, pMAMneo, pMAMneo-CAT, pMAMneo- LUC, pPUR, pSV2neo, pYEX4T-l/2/3, pYEX-Sl, pBacPAK-His, pBacPAK8/9, pAcUW31, BacPAK6, pTriplEx, DgtlO, Dgtll, pWE15, 및 DTriplEx; Stratagene으로 부터의 람다 ZAP Ⅱ, pBK-CMV, pBK-RSV, pBluescript II KS +/-, pBluescript II SK +/-, pAD-GAL4, pBD-GAL4 Cam, pSurfscript, 람다 FIX II, 람다 DASH, 람다 EMBL3, 람다 EMBL4, SuperCos, pCR-Scrigt Amp, pCR-Script Cam, pCR-Script Direct, pBS +/-, pBC KS +/-, pBC SK +/-, Phagescript, pCAL-n-EK, pCAL-n, pCAL-c, pCAL-kc, pET-3abcd, pET-llabcd, pSPUTK, pESP-1, pCMVLacI, pOPRSVI/MCS, pOPI3 CAT,pXTl, pSG5, pPbac, pMbac, pMClneo, pMClneo Poly A, pOG44, pOG45, pFRTDGAL, pNEODGAL, pRS403, pRS404, pRS405, pRS406, pRS413, pRS414, ρRS415, 및 pRS416 및 변형체 또는 이의 유도체를 함유한다. 예를 들어, pPC86, pDBLeu, pDBTrp, pPC97, p2.5, pGADl-3, pGADIO, pACt, pACT2, pGADGL, pGADGH, pAS2-l, pGAD424, pGBT8, pGBT9, pGAD-GAL4, pLexA, pBD-GAL4, pHISi, pHISi-1, placZi, pB42AD, pDG202, pJK202, pJG4-5, pNLexA, pYESTrp 및 변형체 또는 이의 유도체와 같은 투-하이브리드(two-hybrid) 및 반전 투-하이브리드(reverse two-hybrid vector) 벡터 또한 이용될 수 있다. 임의의 다른 플라스미드 및 벡터는 그들이 숙주 내에서 복제가능하고 생존가능한 한, 이용될 수 있다.

    DNA 컨스트럭트가 숙주 세포에 들어가도록 허용하는 것에 이용가능한 기술은 예를 들어, 인산 칼슘/DNA 동시 침전, 핵으로 DNA의 마이크로인젝션, 일렉트로포레이션(electroporation), 완전한 세포와 박테리아 원형질체의 융합, 형질 감염 또는 본 분야의 숙련자에게 알려진 임의의 다른 기술을 포함한다. DNA는 단일 또는 이중 사슬, 선형 또는 원형, 느슨한 또는 슈퍼코일(supercoil)된 DNA일 수 있다. 포유 동물 세포를 형질 감염시키기 위한 다양한 기술은, 예를 들어, Keown et al., Methods in Enzymology Vol. 185, pp. 527-537 (1990)를 참고한다.

    일 특정 구체예에서, 이형접합(heterozygous) 또는 동형접합 낙아웃(knockout) 세포는, 유사유전자형(isogenic)DNA로 부터 분리된 면역글로블린 유전자 서열을 함유하는 낙아웃 벡터와 함께 1차 태아 섬유모세포(primary fetal fibroblast)의 형질 감염에 의하여 제조될 수 있다. 다른 구체예에서, 벡터는 예를 들어, Neor 유전자의 번역을 개시하기 위한, IRES (내부 리보좀 개시 부위)를 이용하는 프로모터 트랩 전략(promoter trap strategy)을 병합할 수 있다.

    부위 특이적 재조합효소(Site Specific Recombinases)

    추가적인 구체예에서, 표적 컨스트럭트는 예를 들어, lox와 같은 부위 특이적 재조합효소 부위를 함유할 수 있다. 일 구체예에서, 표적화 영역에 하나의 부위 특이적 재조합효소 표적 부위가 두번째 부위 특이적 재조합효소 부위의 5'에 위치하도록 표적 암(arm)은 부위 특이적 재조합효소 표적 부위를 삽입할 수 있다. 그 다음, 두개의 부위 특이적 재조합효소 부위 사이에 끼여있는 뉴클레오티드 서열이 제거되도록, 부위 특이적 재조합효소는 활성화되고/거나 세포에 적용될 수 있다.

    부위-특이적 재조합효소는 짧은 핵산 부위 또는 서열-특이 재조합효소 표적 부위, 예를 들면, 재조합효소 인지 부위를 인지하고 결합하는 효소 또는 재조합효소를 포함하며, 이러한 부위에 관련된 핵산의 재조합을 촉매화한다. 이러한 효소는 재조합효소, 전이효소 및 인테그라제(integrase)를 함유한다. 부위-특이적 재조합효소 표적 부위의 예는 lox 부위, art 부위, dif 부위 및 fit 부위를 함유하나, 이에 한정되지 않는다. 부위-특이적 재조합효소의 비-제한적 예는 박테리오파지 P1 Cre 재조합효소, 이스트 FLP 재조합효소, nti 인테그라제, 박테리오파지 λ, 파이(phi) 80, P22, P2, 186, 및 P4 재조합효소, Tn3 리졸바제(resolvase), Hin 재조합효소(recombinase), 및 Cin 재조합효소, E. coli xerC 및 xerD 재조합효소, Bacillus thuringiensis 재조합효소, Tpnl 및 β-락타마제 전이효소(β-lactamase transposons), 및 면역글로블린 재조합효소를 함유하나 이에 한정되지 않는다.

    일 구체예에서, 재조합 부위는 박테리오파지 Pl의 Cre 재조합효소에 의하여 인지되는 lox 부위일 수 있다. 박테리오파지 P!의 cre 유전자의 산물 및 Cre 재조합효소인 lox 부위는 부위 특이적 재조합 사건을 촉매할 수 있는 뉴클레오티드 서열을 언급한다. lox 부위의 다양성은 종래에 알려져 있으며, 자연적으로 발생하는 loxP, loxB, loxL 및 loxR, 뿐만 아니라, 다수의 돌연변이 또는 변형체, loxP511, loxP514, lox.DELTA.86, lox.DELTA.117, loxC2, loxP2, loxP3 및 lox P23와 같은 lox 부위를 함유한다. 추가적인 lox의 예는 loxB, loxL, loxR, loxP, loxP3, loxP23, loxΔ86, loxΔl17, loxP511, 및 loxC2를 포함하나 이에 한정되지 않는다.

    다른 구체예에서, 재조합 부위는 Cre를 제외한 재조합효소에 의하여 인지되는 재조합 부위이다. 일 구체예에서, 재조합효소 부위는 S accharomyces cerevisiae 의 2 pi 플라스미드의 FLP 재조합효소에 의하여 인지되는 FRT 부위일 수 있다. FRT 부위는 이스트 2 마이크론 플라스미드의 FLP 유전자의 산물, FLP 재조합효소가 부위-특이적 재조합을 촉매할 수 있는 뉴클레오티드 서열을 언급한다. 추가적으로 비-Cre 재조합효소의 예는: 박테리오 파지 λ의 Int 재조합효소에 의하여 인지되는 att 부위(예를 들어, attl, att2, att3, attP, attB, attL, 및 attR), 레솔바제(resolvase) 과(family)에 의하여 인지되는 재조합 부위, 및 Bacillus thruingiensis 의 전이 효소(transposase)에 의하여 인지되는 재조합 부위를 포함하는 부위-특이적 재조합효소를 함유하나, 이에 한정되는 것은 아니다.

    본 발명의 특정 구체예에서, 표적 컨스트럭트는: 본 발명에서 개시된 바, 돼지의 면역글로블린 유전자에 상동성있는 서열, 선택가능한 마커 유전자 및/또는 부위 특이적 재조합 표적 부위를 함유할 수 있다.

    동종적으로 재결합된 세포의 선택

    그 다음, 적합한 통합을 제공하는 세포를 확인하기 위하여, 세포는 적합하게-선택된 배지에서 자라도록 할 수 있다. 면역글로블린 유전자에 삽입된 선택가능한 마커 유전자의 존재는 숙주 유전자에 표적 컨스트럭트의 도입을 확실하게 한다. 그 다음, 원하는 표현형(phenotype)을 나타내는 이러한 세포는 동종의 또는 비-동종의 재조합이 발생하였는지 여부를 확실히 하기 위한 DNA를 분석하기 위하여, 제한 분석(restriction analysis), 일렉트로포리시스(electrophoresis), 서던 분석(Southern analysis), 중합효소 연쇄 반응(polymerase chain reaction) 등에 의하여 분석될 수 있다. 이는 삽입을 위해 프로브를 사용하고, 그 후, 삽입에 인접한 5' 및 3' 영역을 서열 분석하고, 면역글로불린 유전자의 존재에 대하여, 구성의 인접 영역을 넘어 확장하거나, 또는 결손의 존재를 확인하여, 이러한 결손이 도입될 때, 결정할 수 있다. 시동 물질은 또한, 구성내에서 서열에 보완적이고, 구성외에서 서열에 보완적이며, 표적 유전자자리에서 사용될 수 있다. 이러한 방법으로, 실험자는 상동 재조합이 발생한다면, 상보적 사슬에 존재하는 시동 물질 모두를 가지는 DNA 두가닥을 얻을 수 있다. 시동 물질 서열, 또는 기대되는 크기의 서열의 존재를 나타냄으로서, 상동 재조합의 발생이 지지된다.

    상동 재조합 이벤트를 스크리닝하도록 사용하는 중합 연쇄 반응은 예를 들어, Kim and Smithies, Nucleic Acids Res. 16:8887-8903, 1988; 및 Joyner et al., Nature 338:153-156, 1989에 알려져 있다. 네오마이신 유전자를 유도하기 위한돌연변이 폴리오마 증강인자 및 티미딘 키나제 촉진인자의 특정한 조합은 배아 줄기 세포 및 EC 세포 모두에서 활성인 것으로, Thomas and Capecchi, supra, 1987; Nicholas and Berg (1983) in Teratocarcinoma Stem Cell, eds. Siver, Martin and Strikland (Cold Spring Harbor Lab., Cold Spring Harbor, NY (pp. 469-497); and Linney and Donerly, Cell 35:693-699, 1983에서 나타내었다. .

    표적화의 제 1 라운드에서 수득한 세포주는 표적화한 대립 유전자에 이종접합성일 수 있다. 두개의 대립 유전자가 변형된 동종접합성은 많은 방법으로 달성될 수 있다. 하나의 접근은 하나의 카피가 변형된 후, 이들 세포를 다른 선택가능 마커를 사용하는 다른 라운드의 표적화를 겪게 되는 세포 수를 증대시키는 것이다. 택일적으로, 동종접합체는 동물을 변형된 대립 유전자에 대하여, 전통적인 멘델의 유전학에 따라 이종접합적으로 번식시켜 수득할 수 있다. 어떤 경우, 두개의 다른 변형된 대립 유전자를 갖는 것이 바람직할 수 있다. 이는 유전자 표적화의 연속적인 라운드 또는 이형접합체 번식으로 달성될 수 있고, 이들 각각은 원하는 변형된 대립 유전자의 하나를 운반한다.

    상동 재조합을 겪은 세포의 확인

    일 구체예에서, 선택 방법은 상동 재조합에 의해 면역글로불린 유전자의 표적화된 녹아웃으로, 또는 비기능 또는 비발현 면역글로불린을 야기하는 유전자중 돌연변이에 의해 면역글로불린 유전자의 결핍을 직접적으로 검출할 수 있다. 항생제 내성을 통한 선택은 스크리닝에서 가장 흔히 사용되어 왔다 (상기 참조). 이 방법은 표적화 벡터에 대한 내성 유전자의 존재를 검출할 수 있으나, 통합이 표적화된 재조합 이벤트인지 또는 임의의 통합인지를 직접적으로 나타내지는 않는다. 특정 기술, 예를 들어 폴리 A 및 촉진제 트랩 기술은 표적화 이벤트의 확률을 증가시키지만, 다시, 원하는 표현형, 면역글로불린 유전자 발현중 세포 결핍이 달성되었다는 직접적인 증거를 나타내지는 않는다. 게다가, 선택의 네거티브 형태는 표적화 통합에 대한 선택에 사용될 수 있다; 이 경우, 세포에 치명적인 인자를 위한 유전자는 사멸을 피하기 위해 세포를 오직 표적화된 이벤트에만 허용하는 방법으로 삽입한다. 이들 방법으로 선택한 세포를, 그 후, 유전자 파열, 벡터 통합 및, 최종적으로, 면역글로불린 유전자 소모에 대하여 분석할 수 있다. 이들 경우에, 선택은 표적화한 벡터 통합의 검출에 기초하기 때문에, 변형된 표현형에서가 아니라, 오직 표적화된 녹아웃, 점 돌연변이가 아닌, 유전자 재배열 또는 절단 또는 다른 이러한 변형을 검출할 수 있다.

    기능성 면역글로불린 유전자의 발현이 부족한 것으로 생각되는 동물 세포를 추가로 분석할 수 있다. 이러한 분석은 하기를 포함하는 기술로 달성될 수 있으나, 제한하는 것은 아니다: PCR 분석, 서던 블롯 분석, 노던 블롯 분석, 특정 렉틴 결합 분석, 및/또는 서열 분석.

    해당 분야에서 기술된 PCR 분석은 표적화 벡터의 통합을 결정하는데 사용될 수 있다. 일구체예에서, 앰플리머 (amplimer)는 항생제 내성 유전자에서 기원하여 벡터 서열 외부 영역으로 확장할 수 있다. 서던 분석을 또한 유전자자리에서 큰 변형, 예를 들어 면역글로불린 유전자자리로의 표적화 벡터의 통합을 분석하는데 사용할 수 있다. 한편, 노던 분석을 각각의 대립 유전자로부터 제조되는 전사물을 분석하는데 사용할 수 있다.

    추가로, RNA 전사물로부터 제조되는 cDNA의 서열 분석을 또한, 면역글로불린 대립 유전자중 임의의 돌연변이의 정확한 위치를 결정하는데 사용할 수 있다.

    본 발명의 다른 측면에서, 본 발명에 기술된 방법, 순서 및/또는 구성에 따 라 제조된 유제류 중쇄, 카파 경쇄 및/또는 람다 경쇄 유전자자리의 기능 영역의 적어도 하나의 대립 유전자가 없는 유제류 세포를 제공하였다. 이들 세포는 상동 재조합의 결과로 수득할 수 있다. 특히, 유제류 중쇄, 카파 경쇄 또는 람다 경쇄 유전자의 적어도 하나의 대립 유전자를 불활성화시킴으로서, 돼지 항체의 발현에 대하여 감소한 능력을 갖는 세포를 제조할 수 있다. 다른 구체예에서, 유제류 중쇄, 카파 경쇄 및/또는 람다 경쇄 유전자의 두 대립 유전자가 모두 없는 포유류 세포를 본원에 기술된 방법, 순서 및/또는 구성에 따라 제조할 수 있다. 추가 구체예에서, 유제류 중쇄, 카파 경쇄 및/또는 람다 경쇄 유전자의 적어도 하나의 대립 유전자가 본 발명에 기술된 방법, 순서 및/또는 구성에 따라 제조된 본 발명의 유전자 표적화 이벤트를 통해 비활성화된 돼지류 동물을 제공한다. 본 발명의 다른 측면에서, 유제류 중쇄, 카파 경쇄 및/또는 람다 경쇄 유전자가 유전자 표적화 이벤트를 통해 불활성화된 돼지류 동물을 제공한다. 유전자는 상동 재조합을 통해 표적화할 수 있다. 다른 구체예에서, 유전자는 파열될 수 있고, 즉, 일부의 유전자 코드는 변형될 수 있고, 따라서 유전자의 분절의 전사 및/또는 유전암호해독에 영향을 줄 수 있다. 예를 들어, 유전자 파열은 치환, 결손 ("녹아웃, knock-out") 또는 삽입("녹인, knock-in") 기술을 통해 발생할 수 있다. 존재하는 서열의 전사를 조정하는, 원하는 단백질 또는 조절 서열에 대한 부가적인 유전자를 삽입할 수 있다.

    본 발명의 일구체예에서, 유제류 중쇄, 카파 경쇄 또는 람다 경쇄 유전자의 대립 유전자는 본 발명에 기술된 방법, 순서 및/또는 구성에 따라 불활성이 되고, 기능성 유제류 면역글로불린을 더이상 제조할 수 없다. 일구체예에서, 표적화된 면 역글로불린 유전자는 RNA로 전사될 수 없지만, 단백질로 번역되지는 않는다. 다른 구체예에서, 표적화된 면역글로불린 유전자는 불활성 절단 형태로 전사될 수 있다. 이러한 절단된 RNA는 번역되지 않거나, 또는 비기능성 단백질로 번역될 수 있다. 택일적인 구체예에서, 표적화된 면역글로불린 유전자는 유전자의 전사가 발생하지 않는 방식으로 불활성화될 수 있다. 추가 구체예에서, 표적화된 면역글로불린 유전자는 전사될 수 있고, 그 후, 비기능성 단백질로 번역될 수 있다.

    III. 인간 면역글로불린 유전자 함유 인공 염색체의 삽입

    인공 염색체

    본 발명의 일면은 본원에 기술된 방법, 순서 및/또는 구성에 따라 제조되는 유제류 중쇄, 카파 경쇄 및/또는 람다 경쇄 유전자자리의 적어도 하나의 대립 유전자가 없는 유제류 및 유제류 세포를 제공하고, 이는 적어도 일부의 인간 항체 (즉, 면역글로불린 (Ig)) 유전자자리를 발현하도록 추가로 변형하였다. 이 인간 유전자자리는 재배열을 겪을 수 있고, 유제류중 다양한 집단(population)의 인간 항체 분자를 발현할 수 있다. 이들 복제된, 트랜스제닉 (트랜스제닉) 유제류는 공급될 수 있는, 이론적으로는 인간 항체(예를 들어, 다클론 항체)의 무한한 공급을 제공하고, 이는 치료, 진단, 정제, 및 다른 임상적으로 연관된 목적을 위해 사용될 수 있다.

    특정한 일구체예에서, 인공 염색체 (ACs)는 인간 면역글로불린 유전자의 유제류 세포 및 동물로의 전이를 달성할 수 있다. ACs는 단일 또는 복수의 유전자를 함유한 메가베이스 크기 DNA 조각의 표적화된 통합을 허용한다. 따라서, ACs는 이 종유래 DNA에 의해 코딩된 유전자 산물의 제조를 위해 이종유래 DNA를 선택된 세포내로 도입할 수 있다. 일구체예에서, 통합 인간 면역글로불린 DNA를 가진 하나 이상의 ACs는 인간 Ig 유전자를 유제류(예를 들어 돼지)에 도입하기 위한 벡터로서 사용될 수 있다.

    1983년에 효모중 최초로 구성된, ACs는 천연 염색체의 적절한 복제 및 분배에 대하여 책임이 있는 필수적인 시스-작용 DNA 서열 원소로부터 구성되는 인공 선형 DNA 분자이다 (Murray et al. (1983), Nature 301:189-193). 염색체는 기능하기 위해 적어도 3개의 원소가 필요하다. 구체적으로, 인공 염색체의 원소는 적어도: (1) 자율 복제 서열 (ARS) (DNA 복제가 시작되는 부위인 복제 기원의 특성을 가짐), (2) 동원체 (유사분열 및 감수분열에서 복제된 염색체의 적절한 분포에 책임이 있는 동원체 어셈블리(kinetochore assembly)의 부위), 및 (3) 종말체 (종단을 안정화시키고, DNA 분자의 최종단의 완전한 복제를 쉽게하는 기능을 하는 선형 염색체의 종단에서 특수화된 구조).

    일구체예에서, 인간 Ig는 유제류 염색체 DNA와는 별개로 독립적 단위 (에피솜)로 유지될 수 있다. 예를 들어, 에피솜 벡터는 세포내에서 DNA 복제 및 벡터의 유지에 필요한 DNA 서열 원소를 함유한다. 에피솜 벡터는 상업적으로 입수할 수 있다 (참고, 예를 들어, Maniatis, T. et al., Molecular 클로닝, A Laboratory Manual (1982) pp. 368-369). ACs는 내부 염색체에 따라 안정적으로 복제 및 분리가 가능하다. 택일적인 구체예에서, 인간 IgG DNA 서열은 유제류 세포의 염색체로 통합될 수 있고, 그리하여 새로운 정보를 복제하고, 천연 염색체의 일부로서 세포 의 자손에게 분할하는 것을 허용한다 (참고, 예를 들어, Wigler et al. (1977), Cell 11:223). ACs를 유제류 세포의 내부 염색체로 전위시키거나, 또는 삽입시킬 수 있다. 둘 이상의 ACs는 숙주 세포로 동시에 또는 연속적으로 도입될 수 있다.

    추가로, ACs는 단일 또는 복수 유전자를 함유한 메가베이스 크기 DNA 조각의 표적화된 통합을 위해, 엑스트라-게노믹 (extra-genomic) 유전자자리를 제공할 수 있고, 하나의 촉진제 또는 각각의 카피 또는 분리된 촉진제와 연관된 몇개의 카피에 영향을 미치는 단일 유전자의 복수 카피를 포함한다. ACs는 단일 또는 복수 인간 면역글로불린 유전자를 함유한 메가베이스 크기 DNA 조각의 표적화 통합을 허용할 수 있다. ACs는 이동원체성 염색체 (즉, 두개의 동원체를 가진 염색체)를 해당분야의 기술자에게 알려져 있는 조건하에서 배양함으로서 생성할 수 있고, 이렇게 하여 염색체는 찢어져서 이전에는 이동원체성 염색체였던, 미니염색체를 형성할 수 있다.

    ACs는 인간 (인간 인공 염색체: "HACs"), 효모 (효모 인공 염색체: 'YACs"), 박테리아 (박테리아 인공 염색체: "BACs"), 박테리오파지 Pl-유발 인공 염색체: "PACs") 및 다른 포유류 (포유류 인공 염색체: "MACs")로부터 구성될 수 있다. ACs는 이들의 이름(예를 들어, YAC, BAC, PAC, MAC, HAC)을 동원체의 기원에 기초하여 유발하였다. 예를 들어, YAC는, S. 세레비시아에 ( S. cerevisiae )로부터 그의 동원체를 유발하였다. MACs는 활성 포유류 동원체를 포함하는 한편, HACs는 인간 동원체를 포함하는 염색체를 의미한다. 게다가, 식물 인공 염색체 ("PLACs") 및 곤충 인공 염색체도 또한 구성될 수 있다. ACs는 복제 및 유지 모두에 책임이 있는 염색 체로부터 유래한 원소를 포함할 수 있다. 따라서, ACs는 큰 게노믹 DNA 조각, 예를 들어 인간 Ig DNA를 안정적으로 유지할 수 있다.

    일 구체예에서, YACs를 함유한 유제류를 제공하였다. YACs는 효모 염색체로부터의 원소, 예를 들어 S. 세레비시아에를 함유하고, 통상적인 클로닝 벡터(예: 플라스미드, 코스미드)에 의해 수용되는 것보다 훨씬 클 수 있는 외부 DNA(외부 DNA)의 분절을 함유하는 유전공학적 고리 염색체이다. YACs는 매우 큰 외인 DNA의 분절(Schlessinger, D. (1990), Trends in Genetics 6:248-253)의 포유류 세포 및 동물(Choi et al. (1993), Nature Gen 4:117-123)로의 전파를 허용한다. YAC 트랜스제닉 접근은 매우 강력하며, 클론화된 DNA를 효과적으로 조작하는 능력에 의해 매우 증진된다. 효모의 주요 기술적 장점은 이와 함께 DNA-중재 전환 and 상동 재조합을 통해 만들어지는 특정한 게놈 변형이 쉽다는 것이다 (Ramsay, M. (1994), MoI Biotech 1:181-201). 일구체예에서, 통합 인간 Ig DNA를 가진 하나 이상의 YACs는 인간 Ig 유전자를 유제류(예를 들어, 돼지)로 도입하는 벡터로서 사용될 수 있다.

    효모에서, 복제에 대한 특정한 구조적 성분을 함유한 YAC 벡터는 다음을 포함한다: 동원체, 종말체, 자율 복제 서열 (ARS), 효모 선택가능 마커 (예를 들어, TRPl , URA3 , 및 SUP4 ), 및 외인 DNA의 50 kb 보다 더 큰 분절의 삽입을 위한 클로닝 부위. 마커 유전자는 YAC를 운반하는 세포의 선택을 허용하며, 특정 제한 엔도누클레아제의 합성에 대한 부위로서 수행할 수 있다. 예를 들어, TRPlURA3 유전자는 이중 선택가능 마커로 사용되어, 완전한 인공 염색체가 유지되는지를 보장 할 수 있다. 효모 선택가능 마커는 동원체의 양면에서 및, 생체내 시드 종말체 형성을 분리하는 두개의 서열에서 수행될 수 있다. 효모 세포의 전체 DAN의 1%의 일분획만 복제에 필요하지만, 염색체 중심 (동원체, 이는 유사분열중 자매 염색분체간의 부착 부위로, 및 방추섬유 부착 부위로 수행됨), 염색체의 종단 (종말체, 이는 진핵 염색체의 종단을 유지하기 위해 필요한 서열로 수행됨), 및 이중나선이 풀리고, 스스로 카피하기 시작하는 DNA분절로 수행하는 ARS로 불리우는 DNA의 다른 짧은 신장을 포함한다.

    일구체예에서, YACs는 면역글로불린 DNA의 약 1, 2, 또는 3 Mb으로 복제되는데 사용될 수 있다. 다른 구체예에서, 적어도 25, 30, 40, 50, 60, 70, 75, 80, 85, 90, 또는 95 킬로베이스(kilobases)이다.

    효모 통합 플라스미드, 복제 벡터 (이는 YACs의 조각)는 또한, 인간 Ig 발현에 사용될 수 있다. 효모 통합 플라스미드는 박테리아 (예를 들어, E. coli )에서 성장을 위한 복제 기원 및 약물-내성 유전자, 효모중 형질전환주의 선택을 위한 효모 마커 유전자, 및 Ig 서열을 삽입하기 위한 제한 부위를 제공하는 박테리아 플라스미드 서열을 함유할 수 있다. 숙주 세포는 염색체내로 직접적으로 통합됨으로서 이 플라스미드를 안정적으로 획득할 수 있다. 효모 복제 벡터를 또한, 효모중 유리 플라스미드 환으로 인간 Ig를 발현하는데 사용할 수 있다. 효모 또는 ARS-함유 벡터는 동원체 서열의 첨가로 안정화시킬 수 있다. YACs는 동원체성 및 종단 (telomeric) 영역 모두를 가질 수 있으며, 재조합체가 효모 염색체로서 필수적으로 유지되기 때문에, 매우 큰 조각의 DNA를 클로닝하는데 사용될 수 있다.

    YACs는 예를 들어, 미국 특허 6,692,954, 6,495,318, 6,391,642, 6,287,853, 6,221,588, 6,166,288, 6,096,878, 6,015,708, 5,981,175, 5,939,255, 5,843,671, 5,783,385, 5,776,745, 5,578,461, 및 4,889,806; 유럽 특허 1 356 062 및 0 648 265; PCT 공개번호 WO 03/025222, WO 02/057437, WO 02/101044, WO 02/057437, WO 98/36082, WO 98/12335, WO 98/01573, WO 96/01276, WO 95/14769, WO 95/05847, WO 94/23049, 및 WO 94/00569에 기술되었듯이 제공된다.

    다른 구체예에서, BACs를 함유한 유제류를 제공하였다. BACs는 박테리아, 예를 들어 E. Coli 에서 발견되는 F-베이스(F-based) 플라스미드이고, 이는 약 300 kb의 외부 DNA에서 숙주 세포로 전이할 수 있다. Ig DNA가 숙주 세포내로 클론화되면, 새롭게 삽입되는 분절은 나머지 플라스미드를 따라 복제할 수 있다. 결과적으로, 외부 DNA의 수십억개의 카피가 매우 짧은 시간에 만들어질 수 있다. 특정한 구체예에서, 인간 Ig DNA와 통합된 인간 Ig DNA는 인간 Ig 유전자를 유제류 (예를 들어 돼지)로 도입하는 벡터로서 사용된다.

    BAC 클로닝 시스템은 E. coli F-인자에 기초하고, 이의 복제는 엄격하게 규제되며, 따라서 큰 구조의 안정적인 유지를 보장한다 (Willets, N., and R. Skurray (1987), Structure and function of the F-factor and mechanism of conjugation. In Escherichia coli and Salmonella Typhimurium: Cellular and Molecular Biology (FC Neidhardt, Ed) Vol.2 pp 1110-1133, Am. Soc. Microbiol., Washington, DC). BACs는 다양한 진핵 종으로부터의 DNA 클로닝에 폭넓게 사용되었다 (Cai et al. (1995), Genomics 29:413-425; Kim et al. (1996), Genomics 34:213-218; Misumi et al. (1997), Genomics 40:147-150; Woo et al. (1994), Nucleic Acids Res 22:4922-4931; Zimmer, R. and Gibbins, AMV (1997), Genomics 42:217- 226). F-플라스미드의 낮은 발생은 DNA 조각간의 재조합 가능성을 감소시키고, 클론화된 박테리아 유전자의 치명적인 과도한 발현을 피할 수 있게 한다. BACs는 숙주 세포에서, 단일 카피 벡터중 인간 면역글로불린 유전자를 100회 또는 그 이상의 연속적인 성장의 발생 이후라도, 안정적으로 유지한다. BAC (또는 pBAC) 벡터는 약 30 - 300 kb 쌍의 범위내에서 삽입물을 수용할 수 있다. BAC 벡터의 하나의 특정 유형인, pBeloBacl1은 lacZ 유전자의 상보성을 이용하여, BAC 벡터를 운반하는 집락으로부터 삽입물-함유 재조합체 분자를 구분할 수 있다. DNA 조각이 pBeloBacl1의 lacZ 유전자로 클론화될 때, 삽입 활성은 전환 후 X-Gal/IPTG 플레이트에 대한 백색 집락 (white colony)를 야기하여(Kim et al. (1996), Genomics 34:213-218) 양성 클론의 확인을 쉽게 한다.

    예를 들어, BACs는 예를 들어 미국 특허 6,713,281, 6,703,198, 6,649,347, 6,638,722, 6,586,184, 6,573,090, 6,548,256, 6,534,262, 6,492,577, 6,492,506, 6,485,912, 6,472,177, 6,455,254, 6,383,756, 6,277,621, 6,183,957, 6,156,574, 6,127,171, 5,874,259, 5,707,811, 및 5,597,694; 유럽 특허 0 805 851; PCT 공개번호 WO 03/087330, WO 02/00916, WO 01/39797, WO 01/04302, WO 00/79001, WO 99/54487, WO 99/27118, 및 WO 96/21725에서 개시되었듯이 제공될 수 있다.

    다른 구체예에서, 박테리오파지 PAC를 함유한 유제류가 제공되었다. 특별한 구체예에서, 인간 Ig DNA와 통합된 하나 이상의 박테리오파지 PACs는 인간 Ig 유전 자를 유제류 (예를 들어, 돼지)내로 도입하기 위한 벡터로 사용된다. 예를 들어, PACs는 예를 들어 미국 특허 6,743,906, 6,730,500, 6,689,606, 6,673,909, 6,642,207, 6,632,934, 6,573,090, 6,544,768, 6,489,458, 6,485,912, 6,469,144, 6,462,176, 6,413,776, 6,399,312, 6,340,595, 6,287,854, 6,284,882, 6,277,621, 6,271,008, 6,187,533, 6,156,574, 6,153,740, 6,143,949, 6,017,755, alc 5,973,133; 유럽 특허 0 814 156; PCT 공개번호 WO 03/091426, WO 03/076573, WO 03/020898, WO 02/101022, WO 02/070696, WO 02/061073, WO 02/31202, WO 01/44486, WO 01/07478, WO 01/05962, 및 WO 99/63103에서 개시되었듯이 제공될 수 있다.

    추가 구체예에서, MACs를 함유한 유제류를 제공하였다. MACs는 높은 유사분열 안정성, 일관되고 조정되는 유전자 발현, 높은 클로닝 능력, 및 비-면역원성을 가진다. 포유류 염색체는 약 50 - 250 Mb 범위의 크기인 DNA의 연속적인 선형 가닥으로 구성될 수 있다. DNA 구성은 추가로, DNA 구성이 효모 세포중 증식하는데 필요한 하나 이상의 서열을 함유할 수 있다. DNA 구성은 또한, 선택가능 마커 유전자를 코딩한 서열을 함유할 수 있다. DNA 구성은 DNA 구성과 전환된 세포에서 염색체로 유지될 수 있다. MACs는 예를 들어, 전체 대사 경로를 코딩한 유전자, 매우 큰 유전자 [예를 들어, 낭성섬유증 (CF) 유전자 (~ 600 kb)], 또는 몇몇 유전자 [예를 들어, 다가백신의 제조를 위한 일련의 항원]가 세포내로 안정적으로 도입될 수 있도록 중요한 단백질을 인코딩한 유전자의 도입을 위한 엑스트라-게노믹 특정 통합 부위를 제공한다.

    포유류 인공 염색체 [MACs]를 제공한다. 또한 제공하는 것은, 본원에서 제공한 MACS를 사용하여 제조한, 다른 고등의 진핵 종, 예를 들어 곤충 및 어류에 대한 인공 염색체이다. 이러한 염색체의 제조 및 분리 방법. MACs를 사용하여 다른 종, 예를 들어 곤충 및 어류 종으로부터 인공 염색체를 구성하는 방법을 또한 제공하였다. 인공 염색체는 전적으로 기능적으로 안정한 염색체이다. 두가지 유형의 인공 염색체를 제공하였다. 하나의 유형은, 본원에서 SATACs [위성 인공 염색체]로 나타낸 안정한 이염색질 염색체이고, 다른 유형은 진염색질의 증폭에 기초한 미니염색체이다. 여기에서, 이전의 이동원체성 염색체는 이동원체성 염색체 조각이 새 종말체를 얻을 때 제조되는 염색체이고, 각각 하나의 동원체를 가진 두 염색체가 제조된다. 각각의 조각은 복제할 수 있는 염색체이다.

    또한 제공하는 것은 본원에서 제공한 MACS를 사용하는, 다른 고등한 진핵종, 예를 들어 곤충 및 어류에 대한 인공 염색체이다. 일구체예에서, SATACs [위성 인공 염색체]를 제공하였다. SATACs는 안정한 이염색질 염색체이다. 다른 구체예에서, 미니염색체는 진염색질의 증폭에 기초하는 미니염색체를 제공한다.

    일구체예에서, 인공 염색체는 이동원체성 염색체로 세포를 배양함으로서 생성할 수 있고, 그에 따라 염색체는 분리되어 미니염색체 및 이전의 이동원체성 염색체를 형성한다. 일구체예에서, SATACs는 미니염색체 조각으로부터 제조될 수 있고, 예를 들어 미국 특허 5,288,625를 참조한다. 다른 구체예에서, SATACs는 이전의 이동원체성 염색체의 조각으로부터 제조될 수 있다. SATACs는 짧은 위성 DNA의 반복 단위로 구성될 수 있고, 완전히 이염색질일 수 있다. 일구체예에서, 이종유래 또는 외부 DNA의 결여 삽입 (absent insertion)은 SATACs가 유전적 정보를 함유하지 않은 것이다. 다른 구체예에서, 다양한 크기의 SATACs를 제공하고, 이는 선택적인 조건하에서 반복적으로 배양되고, 이전의 이동원체성 염색체로부터 제조된 염색체를 함유한 세포의 서브클로닝으로 형성된다. 이들 염색체는 크기가 7.5 - 10 Mb인 반복 단위, 또는 메가레플리콘(megareplicon)에 기초할 수 있다. 이들 메가레플리카온스칸 (megareplicaonscan)은 이종유래 비-위성 DNA가 인접한 위성 DNA의 직렬 블록 (tandem block)일 수 있다. 증폭은 이종유래 ["외부(foreign)"] DNA로 인접한 두개의 역 메가레플리콘을 함유하는, 동일한 염색체 분절 [각각은 앰플리콘이라 함]의 직렬 배열을 제조할 수 있다. 반복되는 세포 융합, 선택적인 배지상에서의 성장 및/또는 BrdU [5-브로모데옥시유리딘] 치료 또는 다른 게놈 불안정화 시약 또는 약제, 예를 들어 X-선을 포함하는 이온화 방사선, 및 서브클로닝은 150-200 Mb "소세지(sausage)" 염색체, 500-1000 Mb 기가염색체, 안정한 250-400 Mb 메가염색체 및 이로부터 유래하는 다양한 더 작고 안정한 염색체를 포함하는, 안정한 이염색질 또는 부분 이염색질 염색체를 운반하는 세포주를 야기할 수 있다. 이들 염색체는 이러한 반복 단위에 기초하고, 발현하는 인간 면역글로불린 DNA을 포함할 수 있다 (미국 특허 6,743,967 참조).

    다른 구체예에서, MACs를 예를 들어, 미국 특허 6,743,967, 6,682,729, 6,569,643, 6,558,902, 6,548,287, 6,410,722, 6,348,353, 6,297,029, 6,265,211, 6,207,648, 6,150,170, 6,150,160, 6,133,503, 6,077,697, 6,025,155, 5,997,881, 5,985,846, 5,981,225, 5,877,159, 5,851,760, 및 5,721,118; PCT 공개번호 WO 04/066945, WO 04/044129, WO 04/035729, WO 04/033668, WO 04/027075, WO 04/016791, WO 04/009788, WO 04/007750, WO 03/083054, WO 03/068910, WO 03/068909, WO 03/064613, WO 03/052050, WO 03/027315, WO 03/023029, WO 03/012126, WO 03/006610, WO 03/000921, WO 02/103032, WO 02/097059, WO 02/096923, WO 02/095003, WO 02/092615, WO 02/081710, WO 02/059330, WO 02/059296, WO 00/18941, WO 97/16533, 및 WO 96/40965에 개시되었듯이, 제공할 수 있다.

    본 발명의 다른 측면에서, HACs를 함유한 유제류 및 유제류 세포를 제공한다. 특정한 구체예에서, 인간 Ig DNA와 통합한 하나 이상의 HACs를 인간 Ig 유전자를 유제류 (예를 들어 돼지)에 도입하기 위한 벡터로 사용하였다. 특정한 구체예에서, 인간 Ig DNA와 통합한 하나 이상의 HACs를 면역에 반응하여 인간 Igs를 발현하고, 친화성 성숙을 겪는 핵전이로 유제류를 제조하도록 사용하였다.

    인간 항체 ("인간 Ig")를 발현하는 유제류를 제조하는데 다양한 접근법을 사용할 수 있다. 이러한 접근법은, 예를 들어, 태아 단계 또는 출생 후, 중쇄 및 경쇄 Ig 유전자 모두를 함유하는 HAC를 유제류에 삽입하거나, 또는 인간 B-세포 또는 B-세포 전구체를 유제류에 삽입하는 것을 포함한다 (예를 들어, 면역 결핍 또는 면역 억제 유제류)(예를 들어, 2000년 11월 17일자 출원된 WO 01/35735 및 2002년 3월 20일자 출원된 US Ser. No. 02/08645 참조). 또 다른 경우에, 인간 항체 생성 세포 및 유제 동물 항체-생성 B-세포 둘다 유제 동물에 존재할 수 있다. HAC를 포함하는 유제 동물에서 단일 B-세포는 유제 동물과 인간의 중쇄 및 경쇄 단백질의 조합을 포함하는 항체를 생성할 수 있다. 또 다른 구체예에서, HAC의 총 길이는 적어도 대략 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10 Mb이다.

    예를 들어, HACs 는 US Pat. Nos. 6,642,207, 6,590,089, 6,566,066, 6,524,799, 6,500,642, 6,485,910, 6,475,752, 6,458,561, 6,455,026, 6,448,041, 6,410,722, 6,358,523, 6,277,621, 6,265,211, 6,146,827, 6,143,566, 6,077,697,. 6,025,155, 6,020,142, and 5,972,649; US Pat. Application No. 2003/0037347; PCT Publication Nos. WO 04/050704, WO 04/044156, WO 04/031385, WO 04/016791, WO 03/101396, WO 03/097812, WO 03/093469, WO 03/091426, WO 03/057923, WO 03/057849, WO 03/027638, WO 03/020898, WO 02/092812, 및 WO 98/27200에 개시된 바와 같이 제공될 수 있다.

    본 발명에서의 사용을 위하여 인간 면역글로불린 서열이 삽입될 수 있는 ACs의 추가 예는 예를 들어, BACs (pBeloBAC11 또는 pBAC108L; Shizuya et al. (1992), Proc Natl Acad Sci USA 89(18):8794-8797; Wang et al. (1997), Biotechniques 23(6):992-994 참조), 박테리오파지 PACs, YACs (Burke (1990), Genet Anal Tech Appl 7(5):94-99 참조), 및 MACs (Vos (1997), Nat. Biotechnol. 15(12):1257-1259; Ascenzioni et al. (1997), Cancer Lett 118(2):135-142 참조), 예를 들어 HACs, US Pat. Nos. 6,743,967, 6,716,608, 6,692,954, 6,670,154, 6,642,207, 6,638,722, 6,573,090, 6,492,506, 6,348,353, 6,287,853, 6,277,621, 6,183,957, 6,156,953, 6,133,503, 6,090,584, 6,077,697, 6,025,155, 6,015,708, 5,981,175, 5,874,259, 5,721,118, 및 5,270,201; European Patent Nos. 1 437 400, 1 234 024, 1 356 062, 0 959 134, 1 056 878, 0 986 648, 0 648 265, 및 0 338 266; PCT Publication Nos. WO 04/013299, WO 01/07478, WO 00/06715, WO 99/43842, WO 99/27118, WO 98/55637, WO 94/00569, 및 WO 89/09219 참조. 추가 실시예는 예를 들어, PCT Publication No. WO 02/076508, WO 03/093469, WO 02/097059; WO 02/096923; US Publication Nos US 2003/0113917 및 US 2003/003435; 및 US Pat. No. 6,025,155에서 제공된 AC를 포함한다.

    본 발명의 다른 구체예에서, ACs는 각 세대에서 수컷 배우자 형성(gametogeneis)을 통해 전달된다. AC는 통합(integrating) 비통합될 수 있다. 한 구체예에서, AC는 실질적으로 모든 분할 세포에서 유사분열(mitosis)을 통하여 전달될 수 있다. 또 다른 구체예에서, AC는 인간 면역글로불린 핵산 서열의 위치 독립적인 발현을 제공할 수 있다. 특정 구체예에서, AC는 수컷 및 암컷 각각의 배우자 형성을 통하여 적어도 10%의 전달 효율을 가질 수 있다. 하나의 특정 구체예에서 AC는 환형일 수 있다. 또 다른 특정 구체예에서, 비통합된 AC는 기탁번호 LMBP 5473 CB로 2000년 3월 27일자로 the Belgian Coordinated Collections of Microorganisms--BCCM에 기탁된 것일 수 있다. 추가의 구체예에서, 수컷 배우자 형성을 통해 전달된 외인성 핵산을 포함하는 유사분열적으로 안정한 유닛을 동정하고, 유사분열적으로 안정한 유닛에서의 입구 부위를 이용하여 인간 면역글로불린 유전자를 유닛 안으로 통합시키는 AC 생성 방법이 제공된다.

    다른 구체예에서, 기능적 동원체(centromere), 선택적인 마커 및/또는 단일의 클로닝 부위를 포함하는 ACs가 제공된다. 다른 구체예에서, AC는 하나 이상의 하기 성질을 나타낼 수 있다: 독립적인 염색체로서 안정하게 분리할 수 있다, 면역글로불린 서열을 조절된 방식으로 삽입하고 AC로부터 발현할 수 있다, 수컷 및 암컷 생식 계열을 통해 효율적으로 전달될 수 있다, 및/또는 트랜스제닉 동물은 염색체를 세포의 약 30, 40, 50, 60, 70, 80 또는 90% 이상으로 가질 수 있다.

    특정 구체예에서, AC는 유사분열적으로 안정한 섬유아세포 (예를 들어 포유동물 또는 인간의 섬유아세포)로부터 분리될 수 있다. AC를 햄스터 세포로 전달한 후에, lox (예를 들어 loxP) 부위 및 선택적인 마커 부위를 삽입할 수 있다. 다른 구체예에서 AC는, 예를 들어, 선택의 부재하에 유사분열당 약 5, 2, 1, 0.5 또는 0.25 퍼센트 미만의 손실을 나타내는 유사분열적 안정성을 유지할 수 있다 (US 2003/0064509 및 WO 01/77357 참조).

    이종 면역글로불린 유전자(Xenogenous 면역글로불린 유전자)

    본 발명의 또 다른 측면에서, 이종 면역글로불린 유전자 좌(locus) 또는 그의 단편을 발현하며, 여기서 면역글로불린이 내인성 유제 동물 염색체 안에 통합된 면역글로불린 유전자 좌로부터 발현될 수 있는 트랜스제닉 유제 동물이 제공된다. 한 구체예에서, 트랜스제닉 동물 유래의 유제 동물 세포가 제공된다. 한 구체예에서, 이종 면역글로불린 유전자 좌가 자손에 의해 유전될 수 있다. 또 다른 구체예에서, 이종 면역글로불린 유전자 좌가 자손에 의해 수컷 생식계를 통해 유전될 수 있다. 또 다른 추가의 구체예에서, 인공 염색체(AC)는 이종 면역글로불린을 포함할 수 있다. 한 구체예에서, AC는 이스트 AC 또는 포유동물 AC일 수 있다. 추가의 구체예에서, 이종 유전자 좌는 인간 면역글로불린 유전자 좌 또는 그의 단편일 수 있다. 한 구체예에서, 인간 면역글로불린 유전자 좌는 인간 염색체 14, 인간 염색체 2, 및 인간 염색체 22 또는 그의 단편일 수 있다. 또 다른 구체예에서, 인간 면역글로불린 유전자 좌는 전위될 수 있는 인간 면역글로불린의 어느 단편을 포함할 수 있다. 추가의 구체예에서, 인간 면역글로불린 유전자 좌는 전위될 수 있는 인간 면역글로불린 중쇄 및 인간 면역글로불린 경쇄의 어느 단편을 포함할 수 있다. 추가의 구체예에서, 인간 면역글로불린 유전자 좌는 항원에 노출되었을 때 항체를 생성할 수 있는 인간 면역글로불린 유전자 좌 또는 그의 단편을 포함할 수 있다. 특정 구체예에서, 외인성 인간 면역글로불린은 하나 이상의 항원에 노출되는 것에 반응하여 이종 면역글로불린을 생성하기 위하여 B 세포에서 발현될 수 있다.

    다른 구체예에서, 기능적 내인성 면역글로불린의 발현이 결여된 트랜스제닉 유제 동물은 이종 면역글로불린 유전자 좌를 발현시키기 위하여 유전적으로 추가 변형될 수 있다. 대체적인(alternative) 구체예에서, 이종 면역글로불린 유전자 좌를 포함하는 돼지가 제공된다. 한 구체예에서, 이종 면역글로불린 유전자 좌는 중쇄 및/또는 경쇄 면역글로불린 또는 그의 단편일 수 있다. 또 다른 구체예에서, 이종 면역글로불린 유전자 좌는 카파 체인 유전자 좌 또는 그의 단편 및/또는 람다 체인 유전자 좌 또는 그의 단편일 수 있다. 추가의 구체예에서, 인공 염색체(AC)는 이종 면역글로불린을 포함할 수 있다. 한 구체예에서, AC는 이스트 AC 또는 포유동물 AC일 수 있다. 추가의 구체예에서, 이종 유전자 좌는 인간 면역글로불린 유전자 좌 또는 그의 단편일 수 있다. 한 구체예에서, 인간 면역글로불린 유전자 좌는 인간 염색체 14, 인간 염색체 2, 및 인간 염색체 22 또는 그의 단편일 수 있다. 또 다른 구체예에서, 인간 면역글로불린 유전자 좌는 전위될 수 있는 인간 면역글로불린의 어느 단편을 포함할 수 있다. 추가의 구체예에서, 인간 면역글로불린 유전자 좌는 전위될 수 있는 인간 면역글로불린 중쇄 및 인간 면역글로불린 경쇄의 어느 단편을 포함할 수 있다. 추가의 구체예에서, 인간 면역글로불린 유전자 좌는 항원에 노출되었을 때 항체를 생성할 수 있는 인간 면역글로불린 유전자 좌 또는 그의 단편을 포함할 수 있다. 특정 구체예에서, 외인성 인간 면역글로불린은 하나 이상의 항원에 노출되는 것에 반응하여 이종 면역글로불린을 생성하기 위하여 B 세포에서 발현될 수 있다.

    다른 구체예에서, 기능적 내인성 면역글로불린의 발현이 결여된 트랜스제닉 유제 동물은 이종 면역글로불린 유전자 좌를 발현시키기 위하여 유전적으로 추가 변형될 수 있다. 대체적인(alternative) 구체예에서, 이종 면역글로불린 유전자 좌를 포함하는 돼지가 제공된다. 한 구체예에서, 이종 면역글로불린 유전자 좌는 중쇄 및/또는 경쇄 면역글로불린 또는 그의 단편일 수 있다. 또 다른 구체예에서, 이종 면역글로불린 유전자 좌는 카파 체인 유전자 좌 또는 그의 단편 및/또는 람다 체인 유전자 좌 또는 그의 단편일 수 있다. 추가의 구체예에서, 인공 염색체(AC)는 이종 면역글로불린을 포함할 수 있다. 한 구체예에서, AC는 이스트 AC 또는 포유동물 AC일 수 있다. 추가의 구체예에서, 이종 유전자 좌는 인간 면역글로불린 유전자 좌 또는 그의 단편일 수 있다. 한 구체예에서, 인간 면역글로불린 유전자 좌는 인간 염색체 14, 인간 염색체 2, 및 인간 염색체 22 또는 그의 단편일 수 있 다. 또 다른 구체예에서, 인간 면역글로불린 유전자 좌는 전위될 수 있는 인간 면역글로불린의 어느 단편을 포함할 수 있다. 추가의 구체예에서, 인간 면역글로불린 유전자 좌는 전위될 수 있는 인간 면역글로불린 중쇄 및 인간 면역글로불린 경쇄의 어느 단편을 포함할 수 있다. 추가의 구체예에서, 인간 면역글로불린 유전자 좌는 항원에 노출되었을 때 항체를 생성할 수 있는 인간 면역글로불린 유전자 좌 또는 그의 단편을 포함할 수 있다. 특정 구체예에서, 외인성 인간 면역글로불린은 하나 이상의 항원에 노출되는 것에 반응하여 이종 면역글로불린을 생성하기 위하여 B 세포에서 발현될 수 있다.

    또 다른 구체예에서, 이종 면역글로불린 유전자 좌를 포함하는 돼지가 제공된다. 한 구체예에서, 이종 면역글로불린 유전자 좌는 중쇄 및/또는 경쇄 면역글로불린 또는 그의 단편일 수 있다. 또 다른 구체예에서, 이종 면역글로불린 유전자 좌는 카파 체인 유전자 좌 또는 그의 단편 및/또는 람다 체인 유전자 좌 또는 그의 단편일 수 있다. 추가의 구체예에서, 인공 염색체(AC)는 이종 면역글로불린을 포함할 수 있다. 한 구체예에서, AC는 이스트 AC 또는 포유동물 AC일 수 있다. 추가의 구체예에서, 이종 유전자 좌는 인간 면역글로불린 유전자 좌 또는 그의 단편일 수 있다. 한 구체예에서, 인간 면역글로불린 유전자 좌는 인간 염색체 14, 인간 염색체 2, 및 인간 염색체 22 또는 그의 단편일 수 있다. 또 다른 구체예에서, 인간 면역글로불린 유전자 좌는 전위될 수 있는 인간 면역글로불린의 어느 단편을 포함할 수 있다. 추가의 구체예에서, 인간 면역글로불린 유전자 좌는 전위될 수 있는 인간 면역글로불린 중쇄 및 인간 면역글로불린 경쇄의 어느 단편을 포함할 수 있다. 추가의 구체예에서, 인간 면역글로불린 유전자 좌는 항원에 노출되었을 때 항체를 생성할 수 있는 인간 면역글로불린 유전자 좌 또는 그의 단편을 포함할 수 있다. 특정 구체예에서, 외인성 인간 면역글로불린은 하나 이상의 항원에 노출되는 것에 반응하여 이종 면역글로불린을 생성하기 위하여 B 세포에서 발현될 수 있다.

    인간 면역글로불린 유전자, 예를 들어 Ig 중쇄 유전자(인간 염색체 414), Ig 카파 체인 유전자(인간 염색체 #2) 및/또는 Ig 람다 체인 유전자(염색체 #22)가 상기 언급된 Acs 내로 삽입될 수 있다. 특정 구체예에서, 인간 중쇄, 카파 체인 및/또는 람다 체인 Ig 유전자의 어느 부위가 ACs 내로 삽입될 수 있다. 한 구체예에서, 핵산은 인간의 자연-발생적 핵산의 상응하는 영역과 적어도 70, 80, 90, 95, 또는 99% 동일할 수 있다. 다른 구체예에서, 인간 항체의 1 클래스 초과가 유제 동물에 의해 생성된다. 다양한 구체예에서 하나 초과의 상이한 인간 Ig 또는 항체가 유제 동물에 의해 생성된다. 한 구체예에서, 인간 Ig 중쇄 유전자 및 Ig 경쇄 유전자를 둘다 포함하는 AC, 예를 들어 자동 인간 인공 염색체((“AHAC,” a circular recombinant nucleic acid molecule that is converted to a linear 인간 chromosome in vivo by an endogenously expressed restriction endonuclease: 내부적으로 발현된 제한 엔도뉴클레아제에 의해 생체내에서 선형 인간 염색체로 전환되는 환형 재조합 핵산 분자)가 도입될 수 있다. 한 구체예에서, 인간 중쇄 유전자 좌 및 경쇄 유전자 좌가 상이한 염색체 팔(즉, 동원체의 다른 쪽) 위에 위치한다. 한 구체예에서, 중쇄는 mu 중쇄를 포함할 수 있고, 경쇄는 람다 또는 카파 경 쇄일 수 있다. Ig 유전자는 하나 이상의 ACs에서 동시에 또는 순차적으로 도입될 수 있다.

    특정 구체예에서, 유제 동물 또는 유제 동물 세포는, 전위되며 하나 초과의 인간 Ig 분자, 예를 들어 인간 항체 단백질을 발현하는 인간 Ig 유전자의 전부 또는 일부를 암호화하는 하나 이상의 핵산을 발현한다. 따라서 인간 Ig 체인 또는 항체를 암호화하는 핵산이 전위되지 않은 형태로 존재한다(즉, 핵산은 V(D)J 재조합되지 않았다). 특정 구체예에서, 항체 경쇄의 V 유전자 세그먼트를 암호화하는 핵산 세그먼트의 전부가 하나 이상의 뉴클레오타이드에 의해 J 유전자 세그먼트를 암호화하는 핵산 세그먼트의 전부로부터 분리될 수 있다. 특정 구체예에서, 항체 중쇄의 V 유전자 세그먼트를 암호화하는 핵산 세그먼트의 전부가 하나 이상의 뉴클레오타이드에 의해 D 유전자 세그먼트를 암호화하는 핵산 세그먼트의 전부로부터 분리될 수 있고/있거나, 항체 중쇄의 D 유전자 세그먼트를 암호화하는 핵산 세그먼트의 전부가 하나 이상의 뉴클레오타이드에 의해 J 유전자 세그먼트를 암호화하는 핵산 세그먼트의 전부로부터 분리될 수 있다. 전위되지 않은 인간 Ig 유전자를 포함하는 트랜스제닉 유제 동물에 항원을 투여하면 인간 Ig 유전자 좌에서 핵산 세그먼트의 전위가 이루어지고 항원에 반응성인 인간 항체가 생성된다.

    한 구체예에서, AC는 면역글로불린 유전자를 포함하는 인간 염색체의 일부 또는 단편을 발현할 수 있다. 한 구체예에서, AC는 문헌(Davies et al. 1993 Biotechnology 11: 911-914)에 기재된 바와 같이 인간 경쇄 유전자 좌의 적어도 300 또는 1300 kb를 발현할 수 있다.

    또 다른 구체예에서, AC는 V λ 유전자 세그먼트, J λ 유전자 세그먼트 및 단일 C λ 유전자를 포함하는 λ 경쇄 유전자 좌를 적어도 포함하는 인간 염색체 22의 일부를 발현할 수 있다. 또 다른 구체예에서, AC는 적어도 하나의 V λ 유전자 세그먼트, 적어도 하나의 J λ 유전자 세그먼트 및 C λ 유전자를 발현할 수 있다. 다른 구체예에서, ACs는 문헌(Popov et al. J Exp Med. 1999 May 17;189(10):1611-20)에 기재된 바와 같이 람다 유전자 좌의 일부를 포함할 수 있다.

    또 다른 구체예에서, AC는 V κ 유전자 세그먼트, J κ 유전자 세그먼트 및 단일 C κ 유전자를 포함하는 κ 경쇄 유전자 좌를 적어도 포함하는 인간 염색체 2의 일부를 발현할 수 있다. 또 다른 구체예에서, AC는 적어도 하나의 V κ 유전자 세그먼트, 적어도 하나의 J κ 유전자 세그먼트 및 C κ 유전자를 발현할 수 있다. 다른 구체예에서, 카파 경쇄 유전자 좌의 일부를 포함하는 AC는 예를 들어 문헌(Li et al. 2000 J Immunol 164: 812-824 and Li S Proc Natl Acad Sci USA. June 1987;84(12):4229-33)에 기재된 것일 수 있다. 또 다른 구체예에서, 대략 1.3 Mb의 인간 카파 유전자 좌를 포함하는 AC가 문헌(Zou et al FASEB J. August 1996;10(10):1227-32)에 기재된 바와 같이 제공된다. .

    추가의 구체예에서, AC는 V H , D H , J H 및 C H 유전자 세그먼트를 포함하는 인간 중쇄 유전자 좌를 적어도 포함하는 인간 염색체 14의 일부를 발현할 수 있다. 또 다른 구체예에서, AC는 적어도 하나의 V H 유전자 세그먼트, 적어도 하나의 D H 유전자 세그먼트, 적어도 하나의 J H 유전자 세그먼트 및 적어도 하나의 C H 유전자 세그먼트를 발현할 수 있다. 다른 구체예에서, AC는 예를 들어 문헌(Choi et al. 1993 Nat Gen 4:117-123 and/or Zou et al. 1996 PNAS 96: 14100-14105)에 기재된 적어도 85 kb의 인간 중쇄 유전자 좌를 발현할 수 있다.

    다른 구체예에서, AC는 예를 들어 문헌(Green et al. 1994 Nat Gen 7:13-22; Mendez et al 1995 Genomics 26: 294-307; Mendez et al. 1997 Nat Gen 15: 146-156; Green et al. 1998 J Exp Med 188: 483-495 and/or Fishwild et al. 1996 Nat Biotech 14: 845-851)에 개시된 바와 같은, 적어도 220, 170, 800 또는 1020 kb의 중쇄 및 경쇄 유전자 좌 둘다의 일부를 발현할 수 있다. 또 다른 구체예에서, AC는 문헌(Nicholson J Immunol. Dec. 15, 1999;163(12):6898-906 and Popov Gene. Oct. 24, 1996;177(1-2):195-201)에 기재된 바와 같은 인간 면역글로불린의 메가베이스(megabase) 양을 발현할 수 있다. 추가로, 한 특정 구체예에서, 인간 염색체 #14 (Ig 중쇄 유전자 함유), 인간 염색체 #2 (Ig 카파 체인 유전자 함유) 및 인간 염색체 #22 (Ig 람다 체인 유전자 함유) 유래의 MACs가 문헌(US Patent Publication No. 2004/0068760 to Robl et al.)에 기재된 바와 같이 동시에 또는 연속적으로 도입될 수 있다. 또 다른 구체예에서, MAC의 총 길이는 대략 10, 9, 8, 또는 7 메가베이스 보다 작거나 같다.

    특정 구체예에서, 생식계 구성(configuration)에서 인간 면역글로불린의 인 간 Vh, 인간 Dh, 인간 Jh 세그먼트 및 인간 mu 세그먼트는 AC, 예를 들어, YAC 내로 Vh, Dh, Jh 및 mu DNA 세그먼트가 인간 DNA 세그먼트에 상응하는 부분들을 포함하는 면역글로불린 레퍼토리를 형성하는 방식으로 삽입될 수 있다(US Pat. No. 5,545,807 to the Babraham Insttitute 참조). 유제 동물 세포 내로의 삽입 및 유제 동물의 세대교번(generation) 후에 이러한 ACs는 중쇄 면역글로불린을 생성할 수 있다. 한 구체예에서, 이들 면역글로불린은 기능적 중쇄-경쇄 면역글로불린을 형성할 수 있다. 또 다른 구체예에서, 이들 면역글로불린은 유제 동물의 적당한 세포 또는 체액으로부터 회수될 수 있는 양으로 발현될 수 있다. 이러한 면역글로불린은 문헌(Burke, DT, Carle, GF and Olson, MV (1987) “Cloning of large segments of exogenous DNA into yeast by means of artifical chromosome vectors” Science, 236, 806-812)에 기재된 바와 같이 이스트 인공 염색체 벡터에 삽입되거나, 염색체 단편의 도입에 의해 삽입될 수 있다(Richer, J and Lo, CW (1989) “Introduction of 인간 DNA into mouse eggs by injection of dissected 인간 chromosome fragments” Science 245, 175-177 참조).

    인간 면역글로불린 유전자를 포함하는 특이적 ACs에 대한 추가의 정보는 문헌(recent reviews by Giraldo & Montoliu (2001) Transgenic Research 10: 83-103 and Peterson (2003) Expert Reviews in Molecular Medicine 5: 1-25)을 참조할 수 있다.

    AC 전달 방법

    인간 면역글로불린 유전자가 먼저 ACs로 삽입된 다음 인간 면역글로불린-함 유 ACs가 유제 동물 세포 내로 삽입될 수 있다. 또는, ACs가 유제 동물 세포 내로 삽입되기 전에 예를 들어 CHO 세포와 같은 매개적 포유동물 세포내로 전달될 수 있다. 한 구체예에서, 매개적 포유동물 세포도 AC를 포함할 수 있으며, 첫번째 AC는 포유동물 세포의 AC 내로 삽입될 수 있다. 특히, 이스트 세포 내의 인간 면역글로불린 유전자 또는 그의 단편을 포함하는 YAC가 MAC를 가지는 포유동물 세포내로 전달될 수 있다. YAC는 MAC 내로 삽입될 수 있다. MAC는 그 후 유제 동물 세포로 전달될 수 있다. 인간 Ig 유전자는 동종(homologous) 재조합에 의해 ACs로 삽입될 수 있다. 생성된 인간 Ig 유전자 함유 AC는 유제 동물 세포 내로 도입될 수 있다. 본 명세서에 기재되거나 당업계에 공지된 방법에 의해 인간 Ig 함유 AC를 포함하는 하나 이상의 유제 동물 세포를 선택할 수 있다.

    ACs의 도입에 적당한 숙주가 본 명세서에 의해 제공되나, 어떤 동물 또는 식물, 세포 또는 그의 조직으로 한정되지 않으며, 포유동물, 조류, 파충류, 양서류, 곤충, 어류, 거미류, 담배, 토마토, 밀, 외떡잎 식물, 쌍떡잎 식물 및 해조류를 포함하나 이에 한정되지는 않는다. 한 구체예에서, ACs는 스퍼민, 스퍼미딘, 폴리에틸렌이민 및/또는 폴리리신을 포함하나 이에 제한되지는 않는 공지 시약을 사용하여 세포 내로 도입되기 전에 축합시킬 수 있다. ACs는 다이렉트 DNA 전달, 일렉트로포레이션, 핵 전달, 마이크로세포 융합, 세포 융합, 스페로플라스트 융합, 지질-매개된 전달, 리포펙션, 리포솜, 마이크로프로젝타일 폭격, 마이크로인젝션, 칼슘 포스페이트 침전 및/또는 다른 적당한 방법을 포함하지만 이에 제한되지는 않는 당업계의 공지 방법에 의해 분리된 후 세포 융합 또는 마이크로세포 융합에 의해 도입될 수 있다. DNA를 세포 내로 도입하기 위한 다른 방법으로는 핵 마이크로인젝션, 일렉트로포레이션, 온전한 세포와의 박테리아 원형질체 융합을 들 수 있다. 폴리브렌 및 폴리오르니틴과 같은 폴리양이온이 또한 사용될 수 있다. 포유동물 세포를 전달하기 위한 다양한 기술에 대하여 문헌(Keown et al. Methods in Enzymology (1990) Vol.185, pp. 527-537; and Mansour et al. (1988) Nature 336:348-352)을 참조할 수 있다.

    다이렉트 DNA 전달; 세포 또는 태아 내로의 마이크로인젝션, 식물을 위한 원형질체 재생, 일렉트로포레이션, 마이크로프로젝타일 총 및 당업계에 공지된 다른 방법을 사용하여 ACs를 도입할 수 있다(참조: Weissbach et al. (1988) Methods for Plant Molecular Biology, Academic Press, NY, Section VIII, pp. 421-463; Grierson et al. (1988) Plant Molecular Biology, 2d Ed., Blackie, London, Ch. 7-9; see, also US Pat. Nos. 5,491,075; 5,482,928; and 5,424,409; see, also, eg, US Pat. No. 5,470,708,).

    특정 구체예에서, 인간 Ig 유전자를 포함하는 하나 이상의 분리된 YACs를 사용할 수 있다. 분리된 YACs는 스퍼민, 스퍼미딘, 폴리에틸렌이민 및/또는 폴리리신을 포함하나 이에 제한되지는 않는 공지 시약을 사용하여 축합시킬 수 있다 (Marschall et al Gene Ther. September 1999;6(9):1634-7 참조). 축합된 YACs는 당업계에 공지된 방법(예를 들어, 마이크로인젝션, 일렉트로포레이션, 지질 매개된 트랜스펙션 등)에 의해 돼지 세포로 전달될 수 있다. 또는, 축합된 YAC는 정자-매개된 유전자 전달 또는 세포질내 정자 인젝션(ICSI) 매개된 유전자 전달을 통해 난 모 세포로 전달될 수 있다. 한 구체예에서, 스페로플라스트 융합을 사용하여 인간 Ig 유전자를 포함하는 YACs를 돼지 세포로 전달할 수 있다.

    본 발명의 다른 구체예에서, 인간 Ig를 포함하는 AC를 성인, 태아(fetal), 또는 엠브리오닉(embryonic) 유제 동물 세포 내로 삽입할 수 있다. 유제 동물 세포의 추가 실시예는 미분화된 세포, 예를 들어 엠브리오닉 세포 (즉, 엠브리오닉 줄기 세포), 분화세포 또는 체세포, 예를 들어 상피 세포, 신경 세포 표피 세포, 각질세포, 조혈세포, 멜라닌세포, 연골세포, B-림프구, T-림프구, 적혈구, 마크로파지, 단핵세포, 섬유아세포, 근육세포, 암컷 생식 시스템, 예를 들어, 젖샘, 난소 더미(ovarian cumulus), 과립층의 세포, 또는 난관 세포, 생식 세포, 태반 세포, 또는 조직, 예를 들어, 방광, 뇌, 식도, 나팔관, 심장, 소장, 쓸개, 신장, 간, 폐, 난소, 이자, 전립선, 척수, 비장, 위, 고환, 흉선, 갑상선, 도관, 수뇨관, 요도, 및 자궁 유래의 세포, 또는 본 명세서에 언급된 다른 세포 타입을 포함한다.

    부위 특이적 재조합효소 매개된 전달

    본 발명의 특정 구체예에서, 인간 면역글로불린 유전자를 포함하는 ACs를 본 명세서에 언급되거나 당업계에 공지된 세포, 예를 들어, 돼지 세포로 전달하는 것은 부위 특이적 재조합효소 매개된 전달을 통해 달성될 수 있다. 하나의 특정 구체예에서, ACs는 돼지 섬유아세포 내로 전달될 수 있다. 또 다른 특정 구체예에서, ACs는 YACs일 수 있다.

    본 발명의 다른 구체예에서, 부위 특이적 재조합 효소 표적 부위를 포함하는 고리화된 DNA, 예를 들어 AC는 게놈 내에 부위 특이적 재조합 효소 표적 부위를 갖 는 세포주 내로 전달될 수 있다. 한 구체예에서, 세포의 부위 특이적 재조합 효소 표적 부위는 외인성 염색체 내에 위치할 수 있다. 외인성 염색체는 숙주의 내인성 염색체 내로 통합되지 않는 인공 염색체일 수 있다. 한 구체예에서, AC는 자손으로의 생식계 유전을 통해 전달될 수 있다. 하나의 특정 구체예에서, 인간 면역글로불린 유전자 또는 그의 단편을 포함하는 YAC는 부위 특이적 재조합 효소를 통해 환형으로 된 다음 부위 특이적 재조합 효소 부위를 포함하는 MAC를 함유 숙주 세포 내로 전달될 수 있다. 이제 인간 면역글로불린 유전자 좌 또는 그의 단편을 포함하는 MAC는 섬유아세포로 예시되지만 이에 제한되지는 않는 돼지 세포와 융합될 수 있다. 그 후, 돼지 세포는 핵 전달을 목적으로 사용될 수 있다.

    본 발명의 특정 구체예에서, 인간 면역글로불린 유전자 또는 그의 단편을 포함하는 AC가 유제류 세포 삽입전에 포유동물 세포, 예컨대 CHO 세포에 이입될 수 있다. 일례로, 중간 포유동물 세포는 또한 AC를 포함할 수 있으며, 제 1 AC가 포유동물 세포의 AC에 삽입될 수 있다. 특히, 효모 세포내 인간 면역글로불린 유전자 또는 그의 단편을 함유하는 YAC가 MAC를 보유한 포유동물 세포로 전달될 수 있다. YAC는 MAC에 삽입될 수 있다. 이어서, MAC는 유제류 세포에 이입될 수 있다. 특정 구체예로, 인간 Ig 유전자 또는 그의 단편을 보유한 YAC는 부위 특이적 재조합효소 표적 부위를 함유할 수 있다. YAC를 먼저 적절한 부위 특이적 재조합효소를 통해 적용하여 환화시킨 후, 자체에 부위 특이적 재조합효소 표적 부위를 가지는 포유동물 세포에 삽입시킬 수 있다. 이어서, 부위 특이적 재조합효소를 YAC를 중간 포유동물 세포내 MAC에 통합하는 과정에 적용할 수 있다. 특이적 재조합효 소를 시스 또는 트랜스로 적용할 수 있다. 특히, 부위 특이적 재조합효소는 트랜스로 적용될 수 있다. 일례로, 부위 특이적 재조합효소는 특이적 재조합효소 발현 플라스미드, 예컨대 Cre 발현 플라스미드 형질감염으로 발현될 수 있다. 또한, YAC의 한 텔로미어 영역을 선택성 표지, 예컨대 본 원에 개시되었거나 당업계에 공지된 선택성 표지로 레트로피팅(retrofitted)할 수 있다. 그 다음에, 중간 포유동물 세포의 MAC내 인간 Ig 유전자 또는 그의 단편을 유제류 세포, 예를 들어 섬유모세포에 전달할 수 있다.

    또한, 인간 Ig 유전자 또는 그의 단편을 보유하는 AC, 예컨대 YAC는 임의로 각 텔로미어 근처에 위치한 부위 특이적 재조합효소 표적 효소를 함유할 수 있다. YAC를 먼저 부위 특이적 재조합효소에 적용하여 환화시킨 후, 자체로 게놈내에 부위 특이적 재조합효소 표적 효소를 직접 함유하는 유제류 세포로 도입할 수 있다. 또한, 유제류 세포는 그 자체로 특이적 재조합효소 표적 효소를 가지는 MAC를 함유할 수도 있다. 이 구체예에서, YAC는 유제류 세포의 내인성 게놈에 직접 삽입될 수 있다. 특정 구체예로, 유제류 세포는 섬유모세포 또는 핵이입을 위해 사용될 수 있는 임의의 다른 적합한 세포일 수 있다. 참조예: 도 7; Call et al., Hum Mol Genet. Jul. 22, 2000;9(12):1745-51.

    다른 예에서, 적어도 100 kb의 DNA를 원형화하여 위치 특이적 리컴비나아제에 의해 숙주 게놈 내로 통합시키는 방법이 제공된다. 일 예에서, 적어도 100, 200, 300, 400, 500, 1000, 2000, 5000, 10,000 kb의 DNA를 원형화할 수 있다. 다른 예에서, 적어도 1000, 2000, 5000, 10,000, 또는 20,000 메가베이스의 DNA를 원 형화할 수 있다. 일 예에서, DNA의 원형화는 위치 특이적 리컴비나아제 표적 위치를 DNA 서열의 각 말단에 부착시킴으로써 이루어질 수 있으며, 이후 위치 특이적 리컴비나아제를 적용시켜 DNA의 원형화를 가져온다. 일 예에서, 위치 특이적 리컴비나아제 표적 위치는 lox일 수 있다. 다른 예에서, 위치 특이적 리컴비나아제 표적 위치는 Flt일 수 있다. 구체예에서, DNA는 YAC 또는 본원에 기재되거나 당업계에 공지된 AC와 같은 인공 염색체일 수 있다. 다른 예에서, AC는 인간 면역글로불린 loci 또는 그의 단편을 포함할 수 있다.

    다른 바람직한 예에서, YAC는 인공 포유류 염색체로 전환되거나 그것에 통합될 수 있다. 포유류 인공 염색체는 돼지 세포 내로 전달되거나 삽입(harbor)될 수 있다. 인공 염색체는 중기(metaphase) 염색체의 직접 주사, 지질 매개된 유전자 전달, 또는 마이크로셀 융합을 포함하나 이에 제한되지는 않는 당업계에 공지된 방법을 통해 돼지 게놈 내로 도입될 수 있다.

    위치-특이적 리컴비나아제는 짧은 핵산 위치 또는 서열-특이적 리컴비나아제 표적 위치, 즉 리컴비나아제 인식 위치를 인식하여 결합하고, 상기 위치들에 관련된 핵산의 리컴비네이션을 촉매하는 효소 또는 리컴비나아제를 포함한다. 이러한 효소는 리컴비나아제, 트랜스포자아제(transposases) 및 인테그라아제를 포함한다. 서열-특이적 리컴비나아제 표적 위치의 예로서 lox 위치, att 위치, dif 위치 및 frt 위치를 포함하나 이에 제한되지는 않는다. 서열-특이적 리컴비나아제의 비제한적인 예로서 박테리오파지 P1 Cre 리컴비나아제, 효모 FLP 리컴비나아제, Inti 인테그라아제, 박테리오파지 λ, phi 80, P22, P2, 186, 및 P4 리컴비나아제, Tn3 리졸바아제(resolvase), Hin 리컴비나아제, 및 Cin 리컴비나아제, E. coli xerC 및 xerD 리컴비나아제, Bacillus thuringiensis 리컴비나아제, TpnI 및 β-락탐아제 트랜스포존, 및 면역글로불린 리컴비나아제를 포함하나 이에 제한되지는 않는다.

    일 예에서, 리컴비네이션 위치는 박테리오파지 P1의 Cre 리컴비나아제에 의해 인식되는 lox 위치일 수 있다. Lox 위치는 박테리오파지 P1의 cre 유전자의 산물인, Cre 리컴비나아제가 위치-특이적 리컴비네이션 반응을 촉매할 수 있는 뉴클레오티드 서열을 지칭한다. loxP514, lox.DELTA.86, lox.DELTA.117, loxC2, loxP2, loxP3 및 lox P23과 같은 다수의 돌연변이 또는 변형 lox 위치뿐만 아니라 자연적으로 발생하는 loxP, loxB, loxL 및 loxR를 포함하는 다양한 lox 위치가 당업계에 공지되어 있다. lox 위치의 추가적인 예로는 loxB, loxL, loxR, loxP, loxP3, loxP23, loxΔ86, loxΔ117, loxP511, 및 loxC2를 포함하며, 이에 제한되지는 않는다.

    다른 예에서, 리컴비네이션 위치는 Cre 이외의 다른 리컴비나아제에 의해 인식되는 리컴비네이션 위치이다. 일 예에서, 리컴비나아제 위치는 Saccharomyces cerevisiae 의 2 pi 플라스미드의 FLP 리컴비나아제에 의해 인식되는 FRT 위치일 수 있다. FRT 위치는 효모 2 미크론 플라스미드의 FLP 유전자 산물인, FLP 리컴비나아제가 위치-특이적 리컴비네이션을 촉매할 수 있는 뉴클레오티드 서열을 지칭한다. 비-Cre 리컴비나아제의 추가적인 예로는, 박테리오파지 λ의 Int 리컴비나아제에 의해 인식되는 att 위치(예를 들어, att1, att2, att3, attP, attB, attL, 및 attR), 리졸바아제 패밀리에 의해 인식되는 리컴비네이션 위치, 및 Bacillus thruingiensis 의 트랜스포자아제에 의해 인식되는 리컴비네이션 위치를 포함하는 위치-특이적 리컴비나아제를 포함하며, 이에 제한되지는 않는다.

    IV. 유전적 변형 동물의 생산

    본 발명의 추가적 측면에서, 본원에 기재된 유전적 변형을 포함하는 유제동물은 당업자에게 공지된 어떠한 방법에 의해서도 생산될 수 있다. 그러한 방법으로는 핵 전달, 세포질간 정액 주사, 접합자의 직접적인 변형 및 정액 매개된 유전자 전달을 포함하며, 이에 제한되지는 않는다.

    다른 예에서, 그러한 동물, 예를 들어, 돼지를 복제하는 방법은, 난모세포의 핵을 적출하고, 상기 난모세포를 적어도 하나의 면역글로불린 유전자의 적어도 하나의 대립 유전자가 불활성화된 세포로부터의 공여 핵과 융합한 후, 상기 핵 전달-유도된 배아를 대리모에게 이식하는 것을 포함한다.

    다르게는, 배아줄기세포 내 면역글로불린 유전자의 대립 유전자 모두를 불활성화시킴으로써 기능적 면역글로불린의 발현이 없는 생육가능한 동물을 생산하는 방법이 제공되며, 이 방법은 이후에 자손을 생산하는데 이용될 수 있다.

    다른 측면에서, 본 발명은 면역글로불린 유전자의 대립 유전자 모두가 불활성화된, 돼지와 같은 생육가능한 동물을 생산하는 방법을 제공한다. 일 예에서, 면역글로불린 유전자의 대립 유전자 모두가 불활성화된 세포로부터의 공여 핵을 이용하여 복제함으로써 동물을 생산한다. 일 예에서, 면역글로불린 유전자의 대립 유전자 모두가 유전적 표적화 반응에 의해 불활성화된다.

    접합자를 직접적으로 변형시킴으로써 유전적으로 변형된 동물을 만들어낼 수 있다. 포유동물에서는, 상기 변형된 접합자를 출산시까지 동물을 보유할 수 있는 상상임신된 암컷의 자궁에 도입할 수 있다. 예를 들어, 면역글로불린 유전자를 전혀 포함하고 있지 않는 동물을 목적으로 하는 경우, 상기 동물로부터 유래된 배아줄기세포을 타겟으로 하여, 변형된 세포를 키메릭 동물로 성장시키기 위하여 낭포세로내로 도입한다. 배아줄기세포로는, 배아줄기세포주 또는 새로 수득한 줄기세포가 이용될 수 있다.

    본 발명의 적절한 예에서, 분화 전능성(totipotent) 세포는 배아줄기(ES) 세포이다. 낭포세포로부터 ES 세포의 분리, ES 세포주의 수립 및 그들의 연속적 배양은, 예를 들어, Doetchmann et al., J. Embryol. Exp. Morph. 87:27-45 (1985); Li et al., Cell 69:915-926 (1992); Robertson, EJ "Tetracarcinomas and Embryonic Stem Cells: A Practical Approach," ed. EJ Robertson, IRL Press, Oxford, England (1987); Wurst and Joyner, "Gene Targeting: A Practical Approach," ed. AL Joyner, IRL Press, Oxford, England (1993); Hogen et al., "Manipulating the Mouse Embryo: A Laboratory Manual," eds. Hogan, Beddington, Costantini and Lacy, Cold Spring Harbor Laboratory Press, New York (1994); 및 Wang et al., Nature 336:741-744 (1992)에 기재된 공지된 방법에 따라 수행된다. 본 발명의 다른 적절한 예에서, 분화 전능성 세포는 배아생식(EG) 세포이다. 배아생식세포는 ES 세포와 기능적으로 균등한 비분화된 세포로서, 이들은 시험관내에서 배양되고 형질전환되어, 키메라의 체세포 및 생식세포주로 수립될 수 있 다(Stewart et al., Dev. Biol. 161:626-628 (1994)). EG 세포는 원시 생식세포, 생식체의 자손을 성장 인자, 즉 백혈병 저해 인자, 스틸 인자 및 기본 섬유아세포 성장 인자((Matsui et al., Cell 70:841-847 (1992); Resnick et al., Nature 359:550-551 (1992))와 조합하여 배양함으로써 유도된다. EG 세포의 배양은 Donovan et al., "Transgenic Animals, Generation and Use," Ed. LM Houdebine, Harwood Academic Publishers (1997), 및 거기에 인용된 원본 문서에 기재된 방법을 이용하여 수행될 수 있다.

    본 발명에 사용하기 위한 4배체 낭포는 천연의 접합자 생산 및 발생에 의해, 또는 2-세포 배아의 전기융합 및 예를 들어, James et al., Genet. Res. Camb. 60:185-194 (1992); Nagy and Rossant, "Gene Targeting: A Practical Approach," ed. AL Joyner, IRL Press, Oxford, England (1993); 또는 Kubiak and Tarkowski, Exp. Cell Res. 157:561-566 (1985)에 기재된 방법에 따라 연속적으로 배양되는 공지된 방법에 의해 수득될 수 있다.

    ES 세포 또는 EG 세포의 낭포로의 도입은 당업계에 공지된 어떠한 방법에 의해서도 수행될 수 있다. 본 발명의 목적을 위해 적절한 방법은 Wang et al., EMBO J. 10:2437-2450 (1991)에 기재된 마이크로주사 방법이다.

    다르게는, 변형된 배아줄기세포에 의해 형질전환 동물이 생산될 수 있다. 유전적으로 변형된 배아줄기세포를 낭포에 주사하고 통상적인 기술에 따라 암컷 숙주 포유동물에서 출산시까지 보유한다. 이후, PCR 또는 서던 블랏팅과 같은 기술을 이용하여 헤테로접합자 자손을 스크리닝함으로써 타겟 locus 위치에서의 변형의 존재여부를 알아낸다. 동종의 야생형 숙주와 교배한 후, 얻어지는 키메릭 자손을 교차 교배함으로써 호모접합자 숙주를 얻는다.

    배아줄기세포를 표적화 벡터로 형질전환하여 면역글로불린 유전자를 변형시킨 후, 세포를 적절한 배지, 예를 들어, 우태아혈청이 증진된 DMEM 내의 피더 층에 평판 배양할 수 있다. 선택적 배지를 사용하여, 콜로니가 생성될 수 있는 충분한 시간 후에, 콜로니를 골라 상동 리컴비네이션의 발생여부를 분석함으로써, 작제물을 포함하는 세포를 검출할 수 있다. 작제물 서열없이 표적 locus에서 프라이머를 사용하여 중합효소 연쇄 반응을 이용할 수 있다. 상동 리컴비네이션을 나타내는 이러한 콜로니들은 배아 작업 및 낭포 주사에 이용될 수 있다. 낭포는 과잉 배란된 암컷으로부터 얻을 수 있다. 이후, 배아줄기세포를 트립신화하고, 변형된 세포를 낭포를 포함하는 드롭플렛에 첨가한다. 적어도 하나의 변형된 배아줄기세포를 낭포의 난할에 주사할 수 있다. 주사 후, 적어도 하나의 낭포가 상상임신한 암컷의 각 자궁 돌기로 되돌아갈 수 있다. 이후, 암컷은 출산을 하고, 얻어진 한배의 새끼들은 작제물을 가진 돌연변이 세포를 위해 스크리닝된다. 형질전환된 ES 세포와 다른 혈통을 가지는 낭포가 선택된다. 낭포 및 ES 세포의 상이한 표현형을 제공함으로써, 키메릭 자손을 용이하게 검출할 수 있고, 변형된 면역글로불린 유전자의 존재를 탐침하기 위해 유전자형이 수행될 수 있다.

    다른 예에서, 정자 매개된 유전자 전달을 사용함으로써 본원에 기재된 유전적으로 변형된 유제동물을 생산할 수 있다. 내생적 면역글로불린 유전자의 발현을 제거하거나 외생적 면역글로불린 유전자를 삽입하는 본원에 기재된 방법 및 조성물 을 이용함으로써 본원에 기재되거나 당업계에 공지된 기술을 통해 정자 세포를 유전적으로 변형시킬 수 있다. 유전적으로 변형된 정자는 인공 수정, 세포질간 정액 주사 또는 공지된 다른 기술을 통해 암컷 수령자를 임신시키는데 이용될 수 있다. 한 예에서, 정자 및/또는 정자 두부는 충분한 시간 동안 외생적 핵산과 함께 인큐베이션될 수 있다. 충분한 시간은 예를 들어, 약 30초 내지 약 5분, 전형적으로 약 45초 내지 약 3분, 보다 전형적으로 약 1분 내지 약 2분을 포함한다. 일 구체 예에서, 본원에 기재된 유제동물내 외생적, 예를 들어, 인간 면역글로불린 유전자의 발현은 세포질간 정자 주사에 의해 이루어질 수 있다.

    유전자 전달용 벡터로서의 정자 세포의 사용 가능성은 Brackett et al., ProcL, Natl. Acad. Sci. USA 68:353-357 (1971)에 의해 최초로 제안되었다. 이후에, 네이키드 DNA에 의해 인큐베이션된 난모세포와 정자의 시험관내 수정후 형질전환된 쥐 및 돼지의 생산에 관한 보고서들이 발표되었다(예를 들어, Lavitrano et al., Cell 57:717-723 (1989) 및 Gandolfi et al. Journal of Reproduction and Fertility Abstract Series 4, 10 (1989)를 참고하라). 다만, 다른 실험실에서는 이들 시험을 반복하는데 실패하였다(예를 들어, Brinster et al. Cell 59:239-241 (1989) 및 Gavora et al., Canadian Journal of Animal Science 71:287-291 (1991)를 참조하라). 이후에, 성공적인 정자 매개된 유전자 전달에 관한 몇몇 보고서들이 발표되었으며, 이에는 닭(예를 들어, Nakanishi and Iritani, Mol. Reprod. Dev. 36:258-261 (1993)를 참조하라); 쥐(예를 들어, Maione, Mol. Reprod. Dev. 59:406 (1998)를 참조하라); 및 돼지(예를 들어, Lavitrano et al. Transplant. Proc. 29:3508-3509 (1997); Lavitrano et al., Proc. Natl. Acad. Sci. USA 99:14230-5 (2002); Lavitrano et al., Mol. Reprod. Dev. 64-284-91 (2003)를 참조하라). 유사한 기술이 또한 2002. 4. 23. 특허된 미국특허 제6,376,743호; 2001. 11. 22. 공개된 미국특허공개 제20010044937호 및 2002. 8. 8. 공개된 제20020108132호에 기재되어 있다.

    다른 예에서, 세포질간 정자 주사를 이용함으로써 본원에 기재된 유전적으로 변형된 유제동물을 생산할 수 있다. 이 방법은 외생적 핵산 및 정자를 수정되지 않은 난모세포의 세포질내로 공삽입함으로써 달성될 수 있으며, 형질전환 배아 및, 원한다면, 살아있는 자손으로 발생시킬 수 있다. 정자는 세포막-파열된 정자 두부 또는 세포막이 없는 정자 두부일 수 있다. 공삽입 단계는 정자를 외생적 핵산과 함께 충분한 시간 동안, 예를 들어, 약 30초 내지 약 5분, 전형적으로 약 45초 내지 약 3분, 보다 전형적으로 약 1분 내지 약 2분간, 전인큐베이션하는 서브단계를 포함할 수 있다. 정자 및 외생적 핵산의 난모세포로의 공삽입은 마이크로주사를 통해 이루어질 수 있다. 정자와 혼합된 외생적 핵산은 하나 이상의 트랜스진을 포함하여, 본원에 기재된 하나 이상의 트랜스진에 대해 형질전환된 배아를 생산할 수 있다. 세포질간 정자 주사는 당업계에 공지된 기술, 예를 들어, 미국특허 제6,376,743호에 의해 달성될 수 있다. 구체예에서, 본원에 기재된 유제동물 내 외생적, 예를 들어, 인간 면역글로불린 유전자는 세포질간 정자 주사에 의해 달성될 수 있다.

    당업계에 공지된 추가적 기술을 이용하여 동물내로 트랜스진을 도입할 수 있 다. 그러한 기술은 전핵(pronuclear) 마이크로주사(예를 들어, Hoppe, PC and Wagner, TE, 1989, US Pat. No. 4,873,191를 참고하라); 레트로바이러스 매개된 생식 세포주로의 유전자 전달(예를 들어, Van der Putten et al., 1985, Proc. Natl. Acad. Sci., USA 82:6148-6152를 참고하라); 배아줄기세포에서의 유전자 표적화(예를 들어, Thompson et al., 1989, Cell 56:313-321; Wheeler, MB, 1994, WO 94/26884를 참조하라); 배아의 전기천공법(예를 들어, Lo, 1983, MoI Cell. Biol. 3:1803-1814를 참조하라); 셀 건; 트랜스펙션; 트랜스덕션; 레트로바이러스 감염; 아데노바이러스 감염; 아데노-수반 바이러스 감염; 리포좀-매개된 유전자 ㅈ전달; 네이키드 DNA 전달; 및 정자-매개된 유전자 전달(예를 들어, Lavitrano et al., 1989, Cell 57:717-723를 참고하라); 등을 포함하나 이에 제한되지는 않는다. 그러한 기술의 검토를 위해, 예를 들어, Gordon, 1989, Transgenic Animals, Intl. Rev. Cytol. 115:171-229를 참고하라. 구체예에서, 본원에 기재된 유제동물 내 외생적, 예를 들어, 인간 면역글로불린 유전자는 이러한 기술에 의해 달성될 수 있다.

    복제된, 형질전환 자손을 생산하기 위한 체세포 핵 전달

    본 발명의 또 다른 측면에서, 돼지 또는 소와 같은 유제동물에서, 유제동물 중쇄, 카파 경쇄 및/또는 람다 경쇄 유전자의 대립 유전자의 하나, 임의로 양자 모두가 없는 세포를 수령 세포로의 핵 전달을 위한 공여 세포로 이용함으로써 복제된, 형질전환 동물을 생산할 수 있다. 다르게는, 유제동물 중쇄, 카파 경쇄 및/또 는 람다 경쇄 유전자 넉아웃을 배아줄기세포내에서 만들어낼 수 있으며, 이는 자손을 생산하는데 이용될 수 있다. 본원에 기재된 방법, 서열 및/또는 작제물에 따라 생산된 유제동물 중쇄, 카파 경쇄 및/또는 람다 경쇄 유전자의 단일 대립 유전자가 없는 자손을 사육시킴으로써 멘델형 유전을 통해 대립 유전자 양자가 기능적으로 상실된 자손을 추가로 생산할 수 있다.

    다른 예에서, 본 발명은 알파-1,3-GT 유전자로서 수컷 돼지 헤테로접합자를 알파-1,3-GT 유전자로서 암컷 돼지 헤테로접합자와 함께 사육함으로써 기능적 알파-1,3-GT의 발현이 없는 생육가능한 돼지를 생산하는 방법을 제공한다. 일 예에서, 돼지는 알파-1,3-GT 유전자의 하나의 대립 유전자의 유전적 변형으로 인한 헤테로접합자이며, 이는 상기 대립 유전자의 발현을 막기 위함이다. 다른 예에서, 돼지는 알파-1,3-GT 유전자의 하나의 대립 유전자의 점 돌연변이의 존재로 인한 헤테로접합자이다. 다른 예에서, 점 돌연변이는 알파-1,3-GT 유전자의 엑손 9의 두번째 염기에서 T-에서-G로의 점 돌연변이일 수 있다. 일 구체예에서, 기능적 알파-1,3-GT 발현이 전혀 없는 돼지 동물을 생산하는 방법이 제공되며, 여기서는 알파-1,3-GT 유전자의 엑손 9의 두번째 염기에서 T-에서-G로의 점 돌연변이를 포함하는 수컷 돼지가 알파-1,3-GT 유전자의 엑손 9의 두번째 염기에서 T-에서-G로의 점 돌연변이를 포함하는 암컷 돼지와 사육되며, 그 반대일수도 있다.

    본 발명은 체세포 핵 전달을 통하여 기능성 면역글로불린 유전자가 없는 돼지와 같은 동물을 복제하는 방법을 제공한다. 일반적으로, 공여 핵의 소스로 이용될 목적하는 분화된 세포를 수득하고; 동물로부터 난모세포를 수득하고; 상기 난모 세포로부터 핵을 적출하고; 목적하는 분화된 세포 또는 세포 핵을 상기 핵이 적출된 난모세포에, 예를 들어, 융합 또는 주사에 의해 전달함으로써 NT 유닛을 형성하고; 얻어진 NT 유닛을 활성화하고; 배양된 NT 유닛을 숙주 동물로 전달하여 NT 유닛이 태아로 발생하도록 하는 단계를 포함하는 핵 전달 과정에 의해 동물을 생산할 수 있다.

    핵 전달 기술 또는 핵 이식 기술은 당업계에 공지되어 있다(Dai et al. Nature Biotechnology 20:251-255; Polejaeva et al Nature 407:86-90 (2000); Campbell et al, Theriogenology, 43:181 (1995); Collas et al, MoI. Report Dev., 38:264-267 (1994); Keefer et al, Biol. Reprod., 50:935-939 (1994); Sims et al, Proc. Natl. Acad. Sci., USA, 90:6143-6147 (1993); WO 94/26884; WO 94/24274, 및 WO 90/03432, US Pat. Nos. 4,944,384 및 5,057,420).

    면역글로불린 유전자를 변경하도록 변형된 공여 세포 핵은 수령 난모세포로 전달된다. 이 방법의 사용은 특정 공여 세포 형에만 제한되는 것은 아니다. 공여 세포는 본원에 기재된 것이며, 또한 예를 들어 Wilmut et al Nature 385 810 (1997); Campbell et al Nature 380 64-66 (1996); Dai et al., Nature Biotechnology 20:251-255, 2002 또는 Cibelli et al Science 280 1256-1258 (1998)를 참조하라. 핵 전달에 성공적으로 이용될 수 있는 배아, 태아 및 성인 체세포를 포함하는 정상 핵형의 모든 세포가 채택될 수 있다. 태아 섬유아세포는 공여 세포로서 특히 유용한 부류이다. 핵 전달의 일반적으로 적절한 방법이 Campbell et al Theriogenology 43 181 (1995), Dai et al. Nature Biotechnology 20:251-255, Polejaeva et al Nature 407:86-90 (2000), Collas et al Mol. Reprod. Dev. 38 264-267 (1994), Keefer et al Biol. Reprod. 50 935-939 (1994), Sims et al Proc. Nat'l. Acad. Sci. USA 90 6143-6147 (1993), WO-A-9426884, WO-A- 9424274, WO-A-9807841, WO-A-9003432, US Pat. No. 4,994,384 및 US Pat. No. 5,057,420에 기재되어 있다. 분화되거나 적어도 부분적으로 분화된 공여 세포 또한 이용될 수 있다. 공여 세포는 또한 배양될 수 있으며, 다만 반드시 배양될 필요는 없으며, 휴지(quiescent)일 수도 있다. 휴지인 핵 공여 세포는 생체내에서 휴지기에 진입하거나 휴지 상태로 존재하도록 유도될 수 있는 세포이다. 선행 기술의 방법 또한 복제 과정에서 배아세포형을 이용하였다(Campbell et al (Nature, 380:64-68, 1996) and Stice et al (Biol. Reprod., 20 54:100-110, 1996)).

    핵 공여 체세포는 다양한 상이한 기관 및 조직으로부터 얻을 수 있으며, 이에는 피부, 중간엽, 폐, 췌장, 심장, 장, 위, 방광, 혈관, 신장, 요도, 생식기관, 및 배아, 태아, 또는 성인 동물의 전체 또는 부분적 분해된 제제가 포함되며, 이에 제한되는 것은 아니다. 본 발명의 적절한 예에서, 핵 공여 세포는 상피세포, 섬유아세포, 신경세포, 케라티노사이트, 조혈세포, 멜라노사이트, 연골세포, 림프구(B 및 T), 마크로파지, 모노사이트, 단핵세포, 심근세포, 다른 근세포, 퇴적세포(cumulus cells), 표피세포 또는 내피세포로 구성된 그룹 중에서 선택된다. 다른 예에서, 핵 공여 세포는 배아줄기세포이다. 구체예에서, 섬유아세포가 공여 세포로 이용될 수 있다.

    본 발명의 다른 예에서, 본 발명의 핵 공여 세포는 동물의 생식세포이다. 배아, 태아, 또는 성인 단계의 동물 종의 모든 생식세포가 핵 공여 세포로 이용될 수 있다. 적절한 예에서, 핵 공여 세포는 배아줄기세포이다.

    핵 공여 세포는 수령 세포와의 정합을 보장할 수 있도록, 세포 주기(GO, G1, G2, S, M)의 어느 단계에서도 취할 수 있다. 이 기술분야에 공지된 임의의 방법이 세포 주기 상을 조절하기 위하여 사용될 수 있다. 세포 주기상을 조절하기 위한 방법의 비한정적 예로, 배양 세포의 접촉성 저해에 의해 유도되는 G0 정지, 혈청 또는 다른 필수 영양분을 제거함에 의해 유도되는 G0 정지, 노화(senescence)에 의해 유도되는 G0 정지, 특정 성장요소를 첨가하여 유도되는 G0 정지; 물리적 또는 화학적 수단, 예컨대 열충격, 고압의 압력 또는 다른 화학적, 호르몬, 성장요소 또는 다른 물질로의 처치에 의해 유도되는 G0 또는 G1 정지; 복제 과정의 임의의 지점을 방해하는 화학제제로의 처치를 통한 S-상의 조절; 형광 활성된 세포 소팅을 사용한 선택, 유사분열의 쉐이크 오프, 마이크로튜불 방해 제제 또는 유사분열의 과정을 방해하는 임의의 화학물질을 경유한 M-상의 조절 (Freshney, R. I,. "Culture of Animal Cells: A Manual of Basic Technique," Alan R. Liss, Inc, New York (1983)참조)을 포함한다.

    난모세포를 분리하는 방법은 이 기술분야에 잘 알려져 있다. 본질적으로, 동물의 단소 또는 생식성 트랙으로부터 난모세포를 분리하는 것이 포함될 수 있다. 난모세포를 쉽게 얻을 수 있는 소스는 도살장 물질로부터 이다. 예컨대 유전적 엔지니어링, 핵 트랜스퍼 및 복제와 같은 기술을 혼합하는데 있어, 이러한 세포들을 핵 트랜스퍼를 위한 수령하는 세포로서 사용할 수 있기 전에 및 그들이 정자 세포 에 의해 수정되어 엠브리오가 되기 전에 난모세포는 시험관내에서 성숙시켜야 한다. 이러한 과정에는 보통 미성숙(전기 I) 난모세포를 포유류 난소, 예컨대 도살장에서 얻어진 소의 난소에서 수집하는 것이 필요하며, 수정 또는 핵의 제거에 우선하여 난모세포가 중기 II 상태가 되기까지 성숙 배지중에서 난모세포를 성숙시키는 것이 필요하며, 소의 난모세포의 경우 보통 약 18-24 시간의 포스트-아스퍼레이션이 수행된다. 이러한 기간은 "성숙기간"으로 알려져 있다. 구체예에서, 난모세포는 암퇘지(gilt)에서 얻어진다. "암퇘지"는 출산한 적이 없는 암 돼지를 말한다. 다른 구체예에서, 난모세포는 성숙한 암퇘지에서 얻어진다. "성숙한 암퇘지"는 출산경력이 있는 암 돼지를 말한다.

    중기 II 단계의 난모세포는 수령 난모세포가 될 수 있고, 이 상태에서는 정자가 수정됨에 따라 도입된 난모세포의 핵을 처리하기 위해 충분히 "활성화"되거나 활성화될 수 있다고 여겨진다. 생체내에서 성숙된 중기 II 단계의 난모세포는 핵 프랜스퍼 기술에 있어 성공적으로 사용되어 왔다. 본질적으로, 성숙한 중기 II 난모세포는 발정기의 발현이 지난 시간 또는 인간 코리오닉 고나도트로핀(hCG) 또는 유사 호르몬을 주사후 35 내지 48, 또는 39-41시간 후의 비-과배란성 또는 과배란된 동물 외과적으로 수집될 수 있다. 난모세포는 히알유로다제 용액과 같은 적절한 배지에 위치할 수 있다.

    약 10 내지 40 시간, 약 16-18, 약 40-42, 약 39-41 시간의 범위인 고정된 시간의 성숙기 후, 난모세포의 핵을 제거할 수 있다. 핵제거에 앞서, 난모세포가 제거될 수 있고, 적절한 배지 예컨대 누적된 세포의 제거에 앞서 히알유로니다제를 밀리리터당 1 밀리그람 함유하는 HECM에 위치할 수 있다. 제거된 난모세포는 그 후 극성체가 스크리닝 될 수 있고, 극성 체의 존재에 의해 결정되는 선택된 중기 II 난모세포가 핵 트랜스퍼에 이용된다. 그 후 핵이 제거된다.

    핵제거는 공지의 방법, 예컨대, US Pat. No. 4,994,384의 방법으로 수행될 수 있다. 예를 들면, 중기 II 난모세포는 즉각적인 핵제거를 위해 HECM, 임의로 시토찰라신 B (cytochalasin B)을 밀리리터당 7.5 마이크로그람 함유하는 HECM에 위치할 수 있거나, 또는 적절한 배지, 예를 들면 엠브리오 컬쳐 배지, 예컨대 CRl aa, 플러스 10% 발정기 소 혈청에 위치할 수 있고, 그 후 핵이 제거되며, 24시간 후 또는 16-18시간 후를 넘지않는 시간 후에 제거된다.

    핵제거는 극성체 및 인접 사이토플라즘을 제거하기 위하여 마이크로피펫을 사용한 마이크로외과적 방법으로 수행될 수 있다. 난모세포는 성공적으로 핵이 제거된 것들을 선별하기 위하여 스크리닝될 수 있다. 난모세포를 스크린하기 위한 한 방법은 난모세포를 HECM 중에서 33342 Hoechst 염색제 밀리리터당 1 마이크로그람으로 난모세포를 염색한 후, 난모세포를 10초 내로 UV 이레디에이션하에서 관찰하는 것이다. 성공적으로 핵이 제거된 난모세포는 적절한 컬쳐 배지중에 위치할 수 있고, 예를 들면 CRl aa 플러스 10% 혈청이다.

    같은 종의 단일 표유류의 세포는 핵이 제거된 난모세포로서 NT 단위를 생산하기 위하여 사용되는 핵이 제거된 난모세포의 난황주(perivitelline)내로 트랜스퍼된다. 포유류의 세포 및 핵이 제거된 난모세포는 이 기술분야에 공지된 방법에 따라 NT 단위를 생산하기 위하여 사용될 수 있다. 예를 들면, 세포는 일렉트로퓨 전에 의해 퓨전될 수 있다. 일렉트로퓨전은 플라스마 멤브레인의 일시적 브레이크다운을 야기하기에 충분한 전기의 펄스를 제공함에 의해 수행된다. 이 플람스마 멤브레인의 브레이크다운은 매우 짧고, 왜냐하면, 멤브레인이 급속히 재형성되기 때문이다. 그러므로, 만약 브레이크다운을 위해 두 인접 멤브레인이 유도되고, 재형성될 때 지방 이중층이 혼합되면 작은 채널이 두 세포 사이에서 열릴 수 있다. 상기 작은 오프닝의 열역학적 불안정성에 기인하여, 두 세포가 하나가 되기까지 커지게 된다. 예를 들면, US Pat. No. 4,997,384 by Prather et al을 참조하면 된다. 다양한 일렉트로퓨전 배지는 예를 들면 수크로즈, 만니톨, 소비톨 및 인산완충액을 포함한 것이 사용될 수 있다. 퓨전은 푸소제닉 제제로서 센다이 바이러스를 사용하여 수행될 수도 있다 (Graham, Wister Inot. Symp. Monogr., 9, 19, 1969). 또한, 일렉트로포레이션 퓨전을 사용하기보다는 핵을 직접 난소내로 주사할 수 있다. 예를 들면 Collas and Barnes, MoI. Reprod. Dev., 38:264-267 (1994)을 참조하면 된다. 퓨전 후, 그 결과 생기는 퓨전된 NT 단위는 활성화될 때 까지 적절한 배지, 예컨대 CRl aa 배지중에 위치한다. 전형적으로 활성화는 그 후 짧게 영향을 줄 수 있고, 예를 들면 퓨전 24시간 이하 후, 또는 약 4-9시간이하 후 이하, 또는 최적으로는 1-2시간 이하 후에 영향을 줄 수 있다. 특정 구체예에서, 활성화는 퓨전 후 적어도 한 시간 및 성숙후 40-41시간에 일어날 수 있다.

    NT 단위는 공지된 방법으로 활성화될 수 있다. 상기 방법은 예를 들면, 서브-생리학적 온도, 본질적으로 저온 또는 실제로 저온의 온도 쇼크를 NT 단위에 적용하여 NT 단위를 배양하는 것을 포함한다. 이는 NT 단위를 엠브리오가 보통 노 출되는 생리학적 온도 조건과 비교하여 저온인 실온에서 배양함으로써 가장 편리하게 수행할 수 있게 한다. 선택적으로, 공지된 활성화제를 적용하여 활성화를 수행할 수 있다. 예를 들면, 수정되는 동안 난모세포에 정자가 침투하면, 전퓨전 난모세포가 활성화되는 것이 나타나고, 더 많은 수의 생존 가능한 임신 및 다중의 유전적으로 동일한 송아지들이 핵 트랜스퍼후에 생성된다. 또한, 예컨대 전기적 및 화학적 쇼크와 같은 처리가 퓨전 후 NT 엠브리오를 활성화시키기 위해 사용될 수 있다. 예를 들면, US Pat. No. 5,496,720, to Susko-Parrish et al를 참고하면 된다. 퓨전 및 활성화는 ECM2001 Electrocell Manipulator (BTX Inc., San Diego, CA)로 5V의 AC 펄스를 5초간 준 후, 1.5 kV/cm의 DC 펄스를 60 μs동안 각각 두번 줌으로써 유도될 수 있다. 또한, 난모세포의 2가 양이온의 레벨이 증가하고, 난모세포의 세포성 단백질의 인산화가 감소하면서 동시에 또는 순차적으로 활성화에 영향을 줄 수 있다. 이는 보통 난모세포 세포질내로 들어오는 2가 양이온, 예컨대, 마그네슘, 스트론티움, 바륨 또는 칼슘이 도입되면서 영향을 받을 수 있으며, 예를 들면 이온포어를 형성하여 들어올 수 있다. 2가 양이온의 레벨을 증가시키는 다른 방법으로는 전기 쇼크를 사용하는 법, 에탄올 처리 및 케이쥐드 킬레이터(caged chelator) 처리를 포함한다. 인산화는 공지의 방법, 예를 들면 키나제 저해제, 예컨대 세린-트레오닌 키나제 저해제, 예컨대 6-디메틸-아미노퓨린, 스타우로스포린, 2-아미노퓨린, 및 스핀고신을 첨가하여 감소시킬 수 있다. 또한, 세포성 단백질의 인산화는 난모세포내로 예컨대 포스파타제 2A 및 포스파타제 2B와 같은 포스파타제를 도입하여 저해될 수 있다.

    그 다음에, 활성화된 NT 유닛, 또는 "융합 엠브리오"는 세포 콜로니가 발생될 때까지 적절한 시험관내 배지에서 배양될 수 있다. 엠브리오의 배양 및 성숙에 적합한 배지는 당업계에 공지되어 있다. 엠브리오 배양 및 유지에 사용될 수 있는 공지된 배지의 예로는 Ham's F-10+10% 소 태아 혈청 (FCS), 조직 배지-199 (TCM- 199)+ 10% 소 태아 혈청, 디로데스-알부민-락테이트-피루베니트 (Tyrodes-Albumin-Lactate-Pyruvate) (TALP), 둘베코 인산 완충생리식염수 (PBS), 이글 및 화이튼 (Whitten) 배지를 들 수 있고, 하나의 구체예에서, 활성화된 NT 유닛은 5% CO 2 습윤 분위기 중에서 약 38.6℃에서 약 1 내지 4 시간 동안 NCSU-23 배지에서 배양될 수 있다.

    그 후에, 배양된 NT 유닛 또는 유닛들은 세정된 다음, 적절한 융합성 피더 층을 함유할 수 있는 적절한 배지 중에 배치될 수 있다. 적절한 피더 층은 일례로서 섬유아세포 및 상피세포를 포함한다. NT 유닛은 NT 유닛이 수용 암컷으로 이송하거나, 세포 콜로니를 생성하는데 사용될 수 있는 세포를 얻기에 적합한 사이즈에 이를 때까지 피더 층에 배양된다. 이들 NT 유닛은 적어도 약 2 내지 400개의 세포, 약 4 내지 128개의 세포, 적어도 약 50 세포에 이를 때까지 배양될 수 있다.

    그 다음에, 활성화된 NT 유닛은 피그 암컷의 난관에 이송될 수 있다 (엠브리오 트랜스퍼). 일실시형태에 있어서, 피그 암컷은 발정 동기화된 수용 길트 (gilt)일 수 있다. 교배종 길트 (large white/Duroc/Landrace) (280-400 lbs)가 사용될 수 있다. 길트는 피드에 혼합된 18 내지 20 mg 레구-메이트 (Regu-Mate) (Altrenogest, Hoechst, Warren, NJ)를 경구 투여하여 수용 동물로서 동조될 수 있다. 레구-메이트는 14일간 연속해서 공급될 수 있다. 그 다음에, 인간 융모성 고나도트로핀 (hCG, Intervet America, Millsboro, DE)의 1천개의 유닛은 최종 레구-메이트 처리 후에 약 105 시간 근육내 투여될 수 있다. 엠브리오 트랜스퍼는 hCG 주사 후에 약 22 내지 26 시간 행해질 수 있다. 일실시형태에 있어서, 수태 기간이 끝나서, 새끼가 태어날 수 있다. 또 하나의 실시형태에 있어서는, 수태는 초기에 종료되어, 엠브리오 세포가 수확될 수 있다.

    원하는 호모접합형 녹아웃 동물의 브리딩:

    또 하나의 측면에 있어서, 본 발명은 면역 글로불린 유전자의 발현 부족이 면역 글로불린 유전자에 대하여 헤테로접합성을 나타내는 피메일로 기능성 면역 글로불린 유전자에 대하여 헤테로접합성을 나타내는 메일을 브리딩함으로써 제공되는 생존 동물을 생산하는 방법을 제공한다. 일실시형태에 있어서, 동물은 대립 유전자의 발현을 방지하도록 면역 글로불린 유전자의 한 대립 유전자의 유전자 변형으로 인해 헤테로접합성을 나타낸다. 다른 실시형태에 있어서, 동물은 알파-면역 글로불린 유전자의 대립 유전자의 점 돌연변이의 존재로 인해 헤테로접합성을 나타낸다. 또 다른 실시형태에 있어서, 이러한 헤테로접합형 녹아웃은 인간 등의 이종 면역글로불린을 발현하는 유제동물로 브리드될 수 있다. 일실시형태에 있어서, 동물은 내인성 면역글로불린의 적어도 하나의 대립 유전자의 발현을 필요로 하는 트랜스제닉 유제동물을 브리딩함으로써 얻어질 수 있고, 면역글로불린은 이종 면역글로불린을 발현하는 유제동물과 함께, 중쇄, 카파 경쇄 및 람다 경쇄 또는 이들의 조합물 중에서 선택된다. 또 하나의 실시형태에 있어서, 동물은 인간 등의 이종 면역글로불린을 발현하는 또 하나의 유제동물과 함께, 중쇄, 카파 경쇄 및 람다 경쇄 중 하나의 대립 유전자의 발현을 필요로 하는 트랜스제닉 유제동물을 브리딩함으로써 얻어질 수 있다. 또 다른 실시형태에 있어서, 동물은 중쇄, 카파 경쇄 및 람다 경쇄의 대립 유전자의 발현 및 인간 등의 이종 면역글로불린을 발현하는 또 하나의 유제동물과 함께, 중쇄, 카파 경쇄 및 람다 경쇄 중 하나의 대립 유전자의 발현을 필요로 하는 호모접합형 트랜스제닉 유제동물을 생산하도록 유제동물과 함께 중쇄, 카파 경쇄 및 람다 경쇄의 하나의 대립 유전자의 발현 및 인간 등의 이종 면역글로불린의 발현을 필요로 하는 또 하나의 트랜스제닉 유제동물과 함께, 중쇄, 카파 경쇄 및 람다 경쇄의 하나의 대립 유전자의 발현을 필요로하고 인간 등의 이종 면역글로불린을 발현하는 트랜스제닉 유제동물을 브리딩함으로써 얻어질 수 있다. 이러한 동물을 생산하는 방법도 제공된다.

    일실시형태에 있어서, 면역 글로불린 유전자의 이중 녹아웃을 지니는 도너 세포로부터 생상된 성적으로 성숙한 동물은 브리딩되어, 이들의 새끼는 호모접합형 녹아웃에 대하여 테스트한다. 그 다음에, 이들 호모접합형 녹아웃 동물은 브리딩되어 더 많은 동물을 생산할 수 있다.

    또 하나의 실시형태에 있어서, 성적으로 성숙한 이중 녹아웃으로부터의 난모세포는 2개의 유전자적으로 상이한 피그 라인 및 적당한 대리모로 이식된 엠브리오로부터 와일드형 정자를 이용하여 시험관내에서 수정될 수 있다. 이러한 교배로부터의 새끼는 녹아웃의 존재하에 테스트될 수 있는데, 예를 들면, 이들은 cDNA 시퀀 싱 및/또는 PCR에 의해 테스트될 수 있다. 그 다음에, 성적 성숙기에서, 이들 산란기의 각 동물은 교배될 수 있다. 본 발명의 상기 측면에 따른 특정 방법에 있어서, 수태는 태아 섬유아세포가 분리되어, 표현형으로 및/또는 유전자형으로 특징을 나타낼 수 있다. 그 다음에, 면역 글로불린 유전자의 발현을 필요로 하는 섬유아세포는 본 명세서에 기재된 방법에 따라 핵 이식에 사용되어, 다태임신 및 원하는 이중 녹아웃을 지니는 새끼를 생산할 수 있다.

    부가적인 유전자 변형:

    다른 실시형태에 있어서, 본 명세서에 기재된 프로세스, 시퀀스 또는 콘스트럭트에 따라 생산된 기능성 면역글로불린의 발현을 필요로 하는 동물 또는 세포는부가적인 유전자 변형을 포함하여, 이종 항원의 발현을 제거시킬 수 있다. 부가적인 유전자 변형은 본 명세서에 기재된 트랜스제닉 세포 및 동물로부터 얻어진 세포를 유전자적으로 변형하거나, 본 명세서에 기재된 동물을 추가로 유전자적으로 변형된 동물로 브리딩함으로써 이뤄질 수 있다. 이러한 동물은 알파-1,3-갈락토실트란스페라제 유전자, CMP-Neu5Ac 하이드록실라제 유전자 (예를 들면, USSN 10/863,116 참조), iGb3 신타제 유전자 (예를 들면, 미국 특허출원 제60/517,524호), 및/또는 포스만 (Forssman) 신타제 유전자 (예를 들면, 미국 특허출원 제60/568,922호)의 적어도 하나의 대립 유전자의 발현을 제거하도록 변형될 수 있다. 추가의 실시형태에 있어서, 동물은 또한 푸코실트란스페라제, 시알리트란스페라제 및/또는 글루코실트란스페라제 패밀리의 멤버를 발현하도록 유전자 변형을 포함할 수 있다. 이들 부가적인 유전자 변형을 달성하기 위해, 일실시형태에 있어서, 세 포는 다중 유전자 변형을 포함하도록 변형될 수 있다. 다른 실시형태에 있어서, 동물은 다중 유전자 변형을 이루도록 함께 브리딩될 수 있다. 하나의 구체적인 실시형태에 있어서, 본 명세서에 기재된 프로세스, 시퀀스 또는 콘스트럭트에 따라 생산된 기능성 면역글로불린의 발현을 필요로 하는 피그 등의 동물은 알파-1,3-갈락토실트란스페라제의 발현을 필요로 하는 피그 드의 동물로 브리딩될 수 있다 (예를 들면, WO 04/028243).

    또 하나의 실시형태에 있어서, 이종 이식 거절반응의 원인이 되는 부가적인 유전자의 발현은 제거되거나 감소될 수 있다. 이러한 유전자는 CMP-NEUAc 하이드록실라제 유전자, 이소글로보시드 3 신타제 유전자 및 포스만 신타제 유전자를 들 수 있지만, 이들에 한정되지 않는다. 또한, 보체 매개 용해의 억제의 원인이 되는 유전자 또는 cDNA 인코딩 보체 관련 단백질은 또한 본 발명의 동물 및 조직에서 발현될 수 있다. 이러한 유전자는 CD59, DAF, MCP 및 CD46을 들 수 있지만, 이들에 한정되지 않는다 (예를 들면, WO 99/53042; Chen et al. Xenotransplantation, Volume 6 Issue 3 Page 194 - August 1999, which describes pigs that express CD59/DAF transgenes; Costa C et al, Xenotransplantation. 2002 Jan;9(1):45-57, which describes transgenic pigs that express human CD59 and H-transferase; Zhao L et al.; Diamond LE et al. Transplantation. 2001 Jan 15;71(1):132-42, which describes a human CD46 transgenic pigs 참조).

    부가적인 변형은 문헌 [참조: WO 98/42850 and US Patent No. 6,423,316, entitled "Anticoagulant fusion protein anchored to cell membrane"]에 기재된 바와 같은 조직 인자 경로 저해제 (TFPI), 헤파린, 안티트롬빈, 히루딘, TFPI, 틱 (tick) 항응고 펩티드, 또는 문헌 [참조: WO 00/31126, entitled "Suppression of 이종 이식 거절반응 by down regulation of a cell adhesion molecules"]에 기재된 바와 같은 세포에 의해 세포 접착 분자의 발현을 하방 제어하는 항체 등의 화합물 및 예를 들면, 문헌 [참조: WO 99/57266, entitled "Immunosuppression by blocking T cell 부자극 signal 2 (B7/CD28 interaction)"]에 기재된 바와 같은 이종 유전자 도너 유기체로부터의 CTLA-4 의 가용성 형태의 기관 수용체에 투여함으로써 시그널 2에 의한 부자극을 방지하는 화합물 등의 뱀 독인자의 발현을 포함할 수 있다.

    본 발명의 특정 측면은 하기의 비한정적인 실시예에서 더욱더 상세히 설명된다.

    실시예 1: 중쇄의 발현을 필요로 하는 포사인 (포사인) 동물의 포사인 중쇄 타겟팅 및 발생

    일부의 포사인 Ig 중쇄 로커스를 3X 리던던드 (리던던트) 포사인 BAC 라이브러리로부터 분리하였다. 일반적으로, BAC 라이브러는 피그 전체 게놈 DNA를 프래그먼트함으로써 발생된 다음에, 전체 동물의 게놈의 적어도 3배를 나타내는 BAC 라이브러리를 유도할 수 있다. 그 후에, 포사인 중쇄 면역글로불린을 포함하는 BAC는 본 명세서에 기재된 바와 같이 포사인 중쇄 면역글로불린에 선택적인 프로브의 하이브리다이제이션을 통해 선택될 수 있다.

    클론 (Seq ID 1)의 시퀀스를 사용하여, J-영역 (프라이머는 Seq ID No. 2로 나타냄)의 일부를 발생시켰다. 별도로, Ig 중쇄 mu 불변 영역 (프라이머는 Seq ID No. 3로 나타냄)의 일부에 상보적이도록 프라이머를 디자인하였다. 이들 프라이머를 사용하여, 기능성 결합 영역 (J-영역) 및 충분한 플래킹 (flanking) 영역이 타겟팅 벡터를 디자인하고 형성하는 포사인 Ig 중쇄 (Seq ID No. 4로 나타냄)의 단편을 증폭시켰다. 이 단편 및 이 단편의 서브클론을 그대로 유지하기 위해서는, 이들 단편을 하버하는 대장균 (Stable 2, Invitrogen cat #1026-019)을 3O℃로 유지시켰다. Seq. ID No. 4의 영역을 서브클론하여, Seq. ID No. 5에 나타낸 바와 같은 타겟팅 벡터를 어셈블하는데 사용하였다. 이 벡터를 포사인 태아 섬유아세포에 트랜스펙션하고, 이어서 G418로 선택하였다. 얻어진 콜로니를 PCR로 스크린하여, 가능한 타겟팅 이벤트를 검출하였다 (Seq ID No. 6 및 Seq ID No.7, 5' 스크린 프라이머; 및 Seq ID No. 8 및 Seq ID No. 9, 3' 스크린 프라이머). 타겟팅을 개략적으로 예시하는 도 1을 참조한다. 타겟팅은 서던 블로팅으로 확인하였다. 핵 도너로서 타겟된 태아 섬유아세포를 사용하여, 핵 이식에 의해 새끼 돼지를 생산하였다.

    핵 이식:

    타겟된 태아 섬유아세포를 핵 도너 세포로서 사용하였다. 핵 이식을 당업계에 공지된 방법으로 행하였다 (예를 들면, Dai et al., Nature Biotechnology 20: 251-255, 2002; and Polejaeva et al., Nature 407:86-90, 2000 참조).

    난모 세포를, 소 혈청 알부민 (BSA; 4 gl -1 )을 함유하는 예열된 둘베코 인산 완충생리식염수 (PBS)를 사용하여 난관의 역분류에 의해 hCG 주사 후에 46 내지 54 시간 수집하였다 (Polejaeva, IA, et al (Nature 407, 86-90 (2000)에 기재). 시험관내에서 성숙된 난모세포 (BioMed, Madison, WI)의 적출을 성숙 후 40 내지 42 시간에 개시하였다 (Polejaeva, IA, et al. (Nature 407, 86-90 (2000)에 기재). 회수된 난모세포를 38℃에서 4 gl -1 BSA를 함유하는 PBS로 세정하고, 38℃에서 실험실로의 운반을 위해 칼슘 비함유 인산 완충액 NCSU-23 배지에 이송하였다. 적출을 위해, 본 발명자들은 난모세포를 38℃에서 5 ㎍ ml -1 사이토칼라신 (cytochalasin) B (Sigma) 및 7.5 ㎍ ml -1 훽스트 (Hoehst) 33342 (Sigma)를 함유하는 칼슘 비함유 인산 완충액 NCSU-23 배지에서 20 분간 배양하였다. 18 μM 글래스 피펫 (Humagen, Charlottesville, Vir ginia)을 사용하여, 제 1 극체 바로 밑의 소량의 세포질을 흡인하였다. 본 발명자들은 흡인된 핵질을 자외선에 노출시켜, 중기판의 존재를 확인하였다.

    핵 이식을 위해, 단일 섬유아세포를 각각 적출된 난모 세포와 접촉하여 투명대 아래에 두었다. 융합 및 활성화를 5 V의 AV 펄스를 5 초 동안 가하고, 각각 ECM2001 일렉트로셀 매니풀레이터 (BTX Inc., San Diego, CA)를 사용하는 1.5 kV/cm의 2개의 DC 펄스를 60 ㎲간 가함으로써 유도하였다. 융합된 엠브리오를 38.6℃에서 5% CO 2 습윤 분위기 중에서 1 내지 4 시간 배양한 다음, 발정 동기화된 수용 길트의 난관에 이송하였다. 교배종 길트 (large white/Duroc/landrace) (280-400 lbs)를 피드에 혼합된 18 내지 20 mg 레구-메이트 (Altrenogest, Hoechst, Warren, NJ)를 경구 투여하여 수용 동물로서 동조될 수 있다. 레구-메이트는 14일간 연속해서 공급될 수 있다. 인간 융모성 고나도트로핀 (hCG, 1,000 유닛; Intervet America, Millsboro, DE)을 최종 레구-메이트 처리 후에 약 105 시간 근육내 투여될 수 있다. 엠브리오 트랜스퍼는 hCG 주사 후에 약 22 내지 26 시간 행해질 수 있다. 핵 이식에 의해, 4개의 리터로부터 18개의 건강한 돼지 새끼를 생산하였다. 이들 동물은 하나의 기능성 와일드형 Ig 중쇄 로커스 및 하나의 디스럽스트된 Ig 중쇄 로커스를 갖는다.

    세포 및 피그 조직 샘플의 서던 블롯 분석. 세포 또는 조직 샘플을 6O℃에서 용해 완충액 (1O mM Tris, pH 7.5, 1O mM EDTA, 1OmM NaCl, 0.5% (w/v) 사르코실, 1 mg/ml 프로테이나제 K)에서 용해하여, DNA를 에탄올로 침전시켰다. 그 다음에, DNA를 사용되는 프로브에 따라 Ncol 또는 Xbal로 소화시켜, 1% 아가로스 겔 상에서 분리하였다. 전기영동 후에, DNA를 나일론막에 이송하여, 디곡시게닌 표지된 프로브로 프로브하였다 (Ncol 소화에 관해서는 SEQ ID No 41, Xbal 소화에 관해서는 SEQ ID No 40). 밴드를 화학 발광 기질계 (Roche Molecular Biochemicals)를이용하여 검출하였다.

    중쇄 서던에 대한 프로브:

    HC J 프로브 (Xba I 소화 이용)

    HC Mu 프로브 (Ncol 소화 이용)

    실시예 2: 포사인 카파 경쇄 타겟팅 및 카파 경쇄의 발현을 필요로 하는 포 사인의 생산

    일부의 포사인 Ig 카파-쇄 로커스를 3X 리던던드 (리던던트) 포사인 BAC 라이브러리로부터 분리하였다. 일반적으로, BAC 라이브러는 피그 전체 게놈 DNA를 프래그먼트함으로써 발생된 다음에, 전체 동물의 게놈의 적어도 3배를 나타내는 BAC 라이브러리를 유도할 수 있다. 그 후에, 포사인 카파 쇄 면역글로불린을 포함하는 BAC는 본 명세서에 기재된 바와 같이 포사인 카파 쇄 면역글로불린에 선택적인 프로브의 하이브리다이제이션을 통해 선택될 수 있다.

    포사인 Ig 경쇄 카파의 프래그먼트를 일부의 J-영역 (프라이머는 Seq ID No. 10로 나타냄)에 상보적인 프라이머 및 카파 C-영역 (Seq ID No. 11로 나타냄)에 상보적인 프라이머를 사용하여 증폭하였다. 얻어진 앰플라이머를 프라스미드 벡터로 클론하여, 30℃에서 스테이블 2 세포에서 유지하였다 (Seq ID No. 12). 개략적인 예시를 위해 도 2를 참조한다.

    별도로, 포사인 Ig 경쇄 카파의 단편을 일부의 C-영역 (Seq ID No. 13)에 상보적인 프라이머 및 카파 인핸서 영역 (Seq ID No. 14)에 상보적인 프라이머를 이용하여, 증폭하였다. 얻어진 앰플라이머를 제한효소 및 DNA 단편에 의해 프래그먼트하고, 생산, 클론하여, 30℃에서 스테이블 2 세포에서 유지하였다. 이러한 시퀀싱의 결과로서, 2개의 비오버래핑 코티그를 어셈블하였다 (Seq ID No. 15, 앰플라이머의 5' 부분; 및 Seq ID No. 16, 앰플라이머의 3' 부분). 다운스트림 코티그의 시퀀스 (Seq ID No. 16)를 이용하여, 프라이머 세트 (Seq ID No. 17 및 Seq ID No. 18)를 디자인하여, 인핸서 (Seq ID No. 19) 주변의 인접 단편을 증폭하였다. Seq ID No. 12 및 Seq ID No. 19 각각의 서브클론을 사용하여, 타겟팅 벡터 (Seq ID No. 20)를 형성하였다. 이 벡터를 포사인 태아 섬유아세포로 트랜스펙션하고, 이어서 G418로 선택하였다. 얻어진 콜로니를 PCR로 스크린하여, 가능한 타겟팅 이벤트를 검출하였다 (Seq ID No. 21 및 Seq ID No. 22, 5' 스크린 프라이머; 및 Seq ID No. 23 및 Seq Id No 43, 3' 스크린 프라이머, 및 Seq ID No. 24 및 Seq Id No 24, 내인성 스크린 프라이머). 서던 블로팅에 의해 타겟팅을 확인하였다. 부가적인 카파 시퀀스를 클로닝함으로써 서던 블롯 전략 설계를 용이하게 하는데, 이는 생식 계열 카파 전사용 주형 (Seq ID No. 25)과 일치한다. 태아 피그를 핵 이식에 의해 생산하였다.

    핵 이식:

    타겟된 태아 섬유아세포를 핵 도너 세포로서 사용하였다. 핵 이식을 당업계에 공지된 방법으로 행하였다 (예를 들면, Dai et al., Nature Biotechnology 20: 251-255, 2002; and Polejaeva et al., Nature 407:86-90, 2000 참조).

    난모 세포를, 소 혈청 알부민 (BSA; 4 gl -1 )을 함유하는 예열된 둘베코 인산 완충생리식염수 (PBS)를 사용하여 난관의 역분류에 의해 hCG 주사 후에 46 내지 54 시간 수집하였다 (Polejaeva, IA, et al (Nature 407, 86-90 (2000)에 기재). 시험관내에서 성숙된 난모세포 (BioMed, Madison, WI)의 적출을 성숙 후 40 내지 42 시간에 개시하였다 (Polejaeva, IA, et al. (Nature 407, 86-90 (2000)에 기재). 회수된 난모세포를 38℃에서 4 gl -1 BSA를 함유하는 PBS로 세정하고, 38℃에 서 실험실로의 운반을 위해 칼슘 비함유 인산 완충액 NCSU-23 배지에 이송하였다. 적출을 위해, 본 발명자들은 난모세포를 38℃에서 5 ㎍ ml -1 사이토칼라신 (cytochalasin) B (Sigma) 및 7.5 ㎍ ml -1 훽스트 (Hoehst) 33342 (Sigma)를 함유하는 칼슘 비함유 인산 완충액 NCSU-23 배지에서 20 분간 배양하였다. 18 μM 글래스 피펫 (Humagen, Charlottesville, Vi rginia)을 사용하여, 제 1 극체 바로 밑의 소량의 세포질을 흡인하였다. 본 발명자들은 흡인된 핵질을 자외선에 노출시켜, 중기판의 존재를 확인하였다.

    핵 이식을 위해, 단일 섬유아세포를 각각 적출된 난모 세포와 접촉하여 투명대 아래에 두었다. 융합 및 활성화를 5 V의 AV 펄스를 5 초 동안 가하고, 각각 ECM2001 일렉트로셀 매니풀레이터 (BTX Inc., San Diego, CA)를 사용하는 1.5 kV/cm의 2개의 DC 펄스를 60 ㎲간 가함으로써 유도하였다. 융합된 엠브리오를 38.6℃에서 5% CO 2 습윤 분위기 중에서 1 내지 4 시간 배양한 다음, 발정 동기화된 수용 길트의 난관에 이송하였다. 교배종 길트 (large white/Duroc/landrace) (280-400 lbs)를 피드에 혼합된 18 내지 20 mg 레구-메이트 (Altrenogest, Hoechst, Warren, NJ)를 경구 투여하여 수용 동물로서 동조될 수 있다. 레구-메이트는 14일간 연속해서 공급될 수 있다. 인간 융모성 고나도트로핀 (hCG, 1,000 유닛; Intervet America, Millsboro, DE)을 최종 레구-메이트 처리 후에 약 105 시간 근육내 투여될 수 있다. 엠브리오 트랜스퍼는 hCG 주사 후에 약 22 내지 26 시간 행해질 수 있다.

    카파 타겟된 세포를 이용하는 핵 이식에 의해, 5개의 리터로부터 33개의 건강한 피그를 생산하였다. 이들 피그는 포사인 Ig 경쇄카파의 하나의 기능성 와일드형 대립 유전자 및 하나의 디스럽스트된 Ig 경쇄 카파 대립 유전자를 갖는다.

    세포 및 피그 조직 샘플의 서던 블롯 분석. 세포 또는 조직 샘플을 6O℃에서 용해 완충액 (1O mM Tris, pH 7.5, 1O mM EDTA, 1O mM NaCl, 0.5% (w/v) 사르코실, 1 mg/ml 프로테이나제 K)에서 용해하여, DNA를 에탄올로 침전시켰다. 그 다음에, DNA를 SacI로 소화시켜, 1% 아가로스 겔 상에서 분리하였다. 전기영동 후에, DNA를 나일론막에 이송하여, 디곡시게닌 표지된 프로브로 프로브하였다 (SEQ ID No 42). 밴드를 화학 발광 기질계 (Roche Molecular Biochemicals)를이용하여 검출하였다.

    카파 서던용 프로브:

    실시예 3:

    포사인 람다 유전자 로커스의 특성화

    포사인 람다를 디스랍트 또는 무능하게 하기 위해, 타겟팅 전략을 고안하여, J 내지 C 발현 카세트의 콘카타머 (concatamer)를 포함하는 람다 로커스의 영역의 제거 또는 디스럽션하였다. 일부의 포사인 게놈을 포함하는 BAC 클론을 생성할 수 있다. 일부의 포사인 Ig 람다-쇄 로커스를 3X 리던던트 포사인 BAC 라이브러리로부터 분리하였다. 일반적으로, BAC 라이브러는 피그 전체 게놈 DNA를 프래그먼트함으로써 발생된 다음에, 전체 동물의 게놈의 적어도 3배를 나타내는 BAC 라이브러리를 유도할 수 있다. 그 후에, 포사인 람다 쇄 면역글로불린을 포함하는 BAC는 본 명세서에 기재된 바와 같이 포사인 람다 쇄 면역글로불린에 선택적인 프로브의 하이브리다이제이션을 통해 선택될 수 있다.

    람다 JC 플래킹 영역 (도 3 참조)을 포함하는 BAC 클론은 독립적으로 프래 그먼트되어, 플라스미드 벡터로 서브클론될 수 있다. J 내지 C 인트론의 존재를 위해 개개의 서브클론을 PCR로 스크린하였다. 본 발명자들은 하나의 C 영역 내지 다음 C 영역으로 증폭함으로써 다수의 카세트를 클론하였다. 이러한 증폭은 임의의 C 영역 (Seq ID 26 및 Seq ID 27) 내에서 발산 익스텐션을 허용하도록 배향되는 프라이머를 사용하여 달성되었다. 성공적인 증폭을 얻기 위해, 익스텐드된 생성물을 인접 C 영역 (동일한 C 영역과 반대측)으로부터 생성되는 익스텐드된 생성물에 수속한다. 이러한 전략은 주로 한 C 영역으로부터 인접 C 영역으로 연장되는 주로 앰플라이머를 생산한다. 그러나, 일부의 앰플라이머는 인접 C를 가로질러 다음 C로의 증폭의 결과로, 인접 C를 넘어서 위치한다. 이들 멀티 유전자 앰플라이머는 일부의 C, 다음의 JC 유닛의 J 및 C 영역, 제 3 JC 유닛의 J 영역, 및 제 3 JC 유닛의 C 영역 일부를 포함한다. Seq ID 28은 이러한 하나의 앰플라이머이고, 제거되거나 디스럽트되어야 하는 시퀀스를 나타낸다.

    클론된 다른 포사인 람다 시퀀스는 포사인 람다 경쇄 게놈 시퀀스의 제 1 람다 J/C 영역에 대한 5' 플래킹 시퀀스를 포함하는 Seq ID No. 32; 람다 J/C의 약 200개의 염기쌍 다운스트림으로부터, 포사인 람다 경쇄 게놈 시퀀스의 /C 클러스터 영역에 대한 3' 플래킹 시퀀스를 포함하는 Seq ID No. 33; 인핸서에 인접하는 J/C 클러스터의 약 11.8 Kb 다운스트림인 포사인 람다 경쇄 게놈 시퀀스의 J/C 클러스터 영역에 대한 3' 플래킹 시퀀스를 포함하는 Seq ID No. 34; 인핸서 영역을 포함하는 람다의 약 12 Kb 다운스트림을 포함하는 Seq ID No. 35; 람다의 약 17.6 Kb 다운스트림을 포함하는 Seq ID No. 36; 람다의 약 19.1 Kb 다운스트림을 포함하는 Seq ID No. 37; 람다의 약 21.3 Kb 다운스트림을 포함하는 Seq ID No. 38; 및 람다의 약 27 Kb 다운스트림을 포함하는 Seq ID No. 39를 포함한다.

    실시예 4: 람다 유전자용 타겟팅 벡터의 생산

    일례에서, J1의 영역 업스트림에 일치하는 하나의 타겟팅 암 및 최종 C의 다운스트림인 영역에 일치하는 다른 암으로 벡터를 디자인하여 형성하였다 (도 4 참조). 하나의 타겟팅 벡터를 J1의 업스트림을 타겟하도록 디자인한다. 이러한 타겟팅 벡터는 선택될 수 있는 선택가능한 마커를 이용한다. 본 명세서에 기재되거나 당업계에 공지된 포지티브 및 네가티브 선택가능한 마커를 사용할 수 있다. 헤르페스 심플렉스 티미딘 키나제 (TK) 및 Tn5 아미노글리코시드 포스포토트란스페라제 (Neo 내성) 유전자의 코딩 영역으로 구성되는 융합 유전자를 사용한다. 이러한 융합 유전자를 록스 부위 등의 본 명세서에 기재되거나 당업계에 공지된 부위 특이성 리콤비나제 (SSRRS)의 인지 부위에 의해 플랭크한다. G418 선택의 사용을 통해 타겟된 세포의 분리시에, Cre를 트란스로 공급되어, 마커 유전자를 검출한다 (도 5 참조). 마커 유전자를, TK에 의해 검출한 세포를 간시클로비르 등의 독성물로 대 사될 수 있는 당업계엥 공지된 약물의 첨가에 의해 선택한다. 그 다음에, 얻어진 유전자형은 제 2 벡터로 타겟된다. 제 2 타겟팅 벡터 (도 6)를 디자인하여, 최종 C의 다운스트림을 타겟하고, 특이성 재조합 부위 (lox)에 의해 한 부위에만 플랭크되는 포지티브/네가티브 선택계를 이용한다. 재조합 부위를 제 1 타겟팅 이벤트에 관하여 말단에 위치시킨다. 타겟된 유전자형의 분리시에, Cre를 다시 트란스로 공급하여, 제 2 타겟팅 이벤트에 운반된 재조합 부위에 대한 제 1 타겟팅 이벤트에 제공된 재조합 부위로부의 제거를 조절한다. 전체의 J 내지 C 클러스터가 제거될 것이다. 적절한 유전자형을 간시클로비르의 투여에 의해 다시 선택한다.

    다른 예에서, 삽입 타겟팅 벡터를 사용하여, 각각 C 영역을 독립적으로 디스럽트한다. 삽입 타겟팅 벡터는 각각의 C 영역 유전자를 디스랍트하도록 디자인되어 어셈블될 것이다. JC 클러스터에는 적어도 3 J 내지 C 영역이 존재한다. 본 발명자들은 제 1 및 최종 C 영역을 타겟하도록 벡터를 디자인함으로써 프로세스를 시작하고, 타겟팅 벡터 부위 특이성 재조합 부위에 포함할 것이다. 일단 삽입이 이뤄지면, 개재 영역은 부위 특이성 리콤비나제로 제거될 것이다.

    실시예 5: 이종 교배 of 중쇄 단일 녹아웃과 카파 단일 녹아웃 피그의 이중 교배

    하나의 디스럽트된 Ig 중쇄 로커스 및 하나의 디스럽트된 Ig 경쇄 카파 대립 유전자를 갖는 피그를 생산하도록, 단일 녹아웃 동물을 이종 교배하였다. 제 1 수태로 4개의 태아를 얻었는데, 2개는 중쇄 및 카파 타겟팅 이벤트에 대한 PCR 및 서던에 의해 포지티브하게 스크린되었다 (프라이머에 대해서는 실시예 1 및 2 참조 ). 태아 섬유아세포를 분리하여, 확대하고 냉동시켰다. 카파 단일 녹아웃과 중쇄 단일 녹아웃의 교배에 의한 제 2 수태로, 건강한 돼지 새끼를 생산하였다.

    중쇄 단일 녹아웃 및 카파 쇄 단일 녹아웃을 포함하는 태아 섬유아세포는 추가의 타겟팅을 위해 사용될 것이다. 이러한 세포는 본 명세서에 기재된 방법 및 조성물을 통해 람다 로커스를 타겟하는데 사용될 것이다. 얻어진 새끼는 중쇄, 카파 쇄 및 람다 쇄용 헤테로접합형 녹아웃일 것이다. 이들 동물은 본 명세서에 기재된 인간 Ig 유전자를 함유하는 동물과 크로스된 다음에, 다른 단일 Ig 녹아웃 동물과 교배하여, 인간 Ig 치환 유전자를 갖는 포사인 Ig 이중 녹아웃 동물을 생산할 것이다.

    본 발명은 이의 바람직한 실시예에 관해 기술되었지만, 본 발명의 변형 및 변경은 당업자에 의해 본 발명의 상술한 상세한 설명으로부터 명백할 것이다.

    SEQUENCE LISTING <110> Revivicor, Inc. Ayares, David Wells, Kevin <120> Ungulates with Genetically Modified Immune Systems <130> 10758.105020 REV 1012 US <140> PCT/US2005/038582 <141> 2005-10-24 <150> US 60/621,433 <151> 2004-10-22 <160> 43 <170> PatentIn version 3.3 <210> 1 <211> 666 <212> DNA <213> Sus scrofa <400> 1 tctagaagac gctggagaga ggccagactt cctcggaaca gctcaaagag ctctgtcaaa 60 gccagatccc atcacacgtg ggcaccaata ggccatgcca gcctccaagg gccgaactgg 120 gttctccacg gcgcacatga agcctgcagc ctggcttatc ctcttccgtg gtgaagaggc 180 aggcccggga ctggacgagg ggctagcagg gtgtggtagg caccttgcgc cccccacccc 240 ggcaggaacc agagaccctg gggctgagag tgagcctcca aacaggatgc cccacccttc 300 aggccacctt tcaatccagc tacactccac ctgccattct cctctgggca cagggcccag 360 cccctggatc ttggccttgg ctcgacttgc acccacgcgc acacacacac ttcctaacgt 420 gctgtccgct cacccctccc cagcgtggtc catgggcagc acggcagtgc gcgtccggcg 480 gtagtgagtg cagaggtccc ttcccctccc ccaggagccc caggggtgtg tgcagatctg 540 ggggctcctg tcccttacac cttcatgccc ctcccctcat acccaccctc caggcgggag 600 gcagcgagac ctttgccc ag ggactcagcc aacgggcaca cgggaggcca gccctcagca 660 gctggg 666 <210> 2 <211> 25 <212> DNA <213> Sus scrofa <400> 2 ggccagactt cctcggaaca gctca 25 <210> 3 <211> 23 <212> DNA <213> Sus scrofa <400> 3 ttccaggaga aggtgacgga gct 23 <210> 4 <211> 9175 <212> DNA <213> Sus scrofa <400> 4 ggccagactt cctcggaaca gctcaaagag ctctgtcaaa gccagatccc atcacacgtg 60 ggcaccaata ggccatgcca gcctccaagg gccgaactgg gttctccacg gcgcacatga 120 agcctgcagc ctggcttatc ctcttccgtg gtgaagaggc aggcccggga ctggacgagg 180 ggctagcagg gtgtggtagg caccttgcgc cccccacccc ggcaggaacc agagaccctg 240 gggctgagag tgagcctcca aacaggatgc cccacccttc aggccacctt tcaatccagc 300 tacactccac ctgccattct cctctgggca cagggcccag cccctggatc ttggccttgg 360 ctcgacttgc acccacgcgc acacacacac ttcctaacgt gctgtccgct cacccctccc 420 cagcgtggtc catgggcagc acggcagtgc gcgtccggcg gtagtgagtg cagaggtccc 480 ttcccctccc ccaggagccc caggggtgtg tgcagatctg ggggctcctg tcccttacac 540 cttcatgccc ctcccctcat acccaccctc caggcgggag gcagcgagac ctttgcccag 600 ggactcagcc aacgggcaca cgggaggcca gccctcagca gctggctccc aaagaggagg 660 tgggaggtag gtccacagct gccacagaga gaaaccctga cggaccccac aggggccacg 720 ccagccggaa ccagctccct cgtgggtgag caatggccag ggccccgccg gccaccacgg 780 ctggccttgc gccagctgag aactcacgtc cagtgcaggg agactcaaga cagcctgtgc 840 acacagcctc ggatctgctc ccatttcaag cagaaaaagg aaaccgtgca ggcagccctc 900 agcatttcaa ggattgtagc agcggccaac tattcgtcgg cagtggccga ttagaatgac 960 cgtggagaag ggcggaaggg tctctcgtgg gctctgcggc caacaggccc tggctccacc 1020 tgcccgctgc cagcccgagg ggcttgggcc gagccaggaa ccacagtgct caccgggacc 1080 acagtgactg accaaactcc cggccagagc agccccaggc cagccgggct ctcgccctgg 1140 aggactcacc atcagatgca caagggggcg agtgtggaag agacgtgtcg cccgggccat 1200 ttgggaaggc gaagggacct tccaggtgga caggaggtgg gacgcactcc aggcaaggga 1260 ctgggtcccc aaggcctggg gaaggggtac tggcttgggg gttagcctgg ccagggaacg 1320 gggagcgggg cggggggctg agcagggagg acctgacctc gtgggagcga ggcaagtcag 1380 gcttcaggca gcagccgcac atcccagacc aggaggctga ggcaggaggg gcttgcagcg 1440 gggcgggggc ctgcctggct ccgggggctc ctgggggacg ctggctcttg tttccgtgtc 1500 ccgcagcaca gggccagctc gctgggccta tgcttacctt gatgtctggg gccggggcgt 1560 cagggtcgtc gtctcctcag gggagagtcc cctgaggcta cgctgggggg ggactatggc 1620 agctccacca ggggcctggg gaccaggggc ctggaccagg ctgcagcccg gaggacgggc 1680 agggctctgg ctctccagca tctggccctc ggaaatggca gaacccctgg cgggtgagcg 1740 agctgagagc gggtcagaca gacaggggcc ggccggaaag gagaagttgg gggcagagcc 1800 cgccaggggc caggcccaag gttctgtgtg ccagggcctg ggtgggcaca ttggtgtggc 1860 catggctact tagattcgtg gggccagggc atcctggtca ccgtctcctc aggtgagcct 1920 ggtgtctgat gtccagctag gcgctggtgg gccgcgggtg ggcctgtctc aggctagggc 1980 aggggctggg atgtgtattt gtcaaggagg ggcaacaggg tgcagactgt gcccctggaa 2040 acttgaccac tggggcaggg gcgtcctggt cacgtctcct caggtaagac ggccctgtgc 2100 ccctctctcg cgggactgga aaaggaattt tccaagattc cttggtctgt gtggggccct 2160 ctggggcccc cgggggtggc tcccctcctg cccagatggg gcctcggcct gtggagcacg 2220 ggctgggcac acagctcgag tctagggcca cagaggcccg ggctcagggc tctgtgtggc 2280 ccggcgactg gcagggggct cgggtttttg gacacc ccct aatgggggcc acagcactgt 2340 gaccatcttc acagctgggg ccgaggagtc gaggtcaccg tctcctcagg tgagtcctcg 2400 tcagccctct ctcactctct ggggggtttt gctgcatttt gtgggggaaa gaggatgcct 2460 gggtctcagg tctaaaggtc tagggccagc gccggggccc aggaaggggc cgaggggcca 2520 ggctcggctc ggccaggagc agagcttcca gacatctcgc ctcctggcgg ctgcagtcag 2580 gcctttggcc gggggggtct cagcaccacc aggcctcttg gctcccgagg tccccggccc 2640 cggctgcctc accaggcacc gtgcgcggtg ggcccgggct cttggtcggc caccctttct 2700 taactgggat ccgggcttag ttgtcgcaat gtgacaacgg gctcgaaagc tggggccagg 2760 ggaccctagt tacgacgcct cgggtgggtg tcccgcaccc ctccccactt tcacggcact 2820 cggcgagacc tggggagtca ggtgttgggg acactttgga ggtcaggaac gggagctggg 2880 gagagggctc tgtcagcggg gtccagagat gggccgccct ccaaggacgc cctgcgcggg 2940 gacaagggct tcttggcctg gcctggccgc ttcacttggg cgtcaggggg ggcttcccgg 3000 ggcaggcggt cagtcgaggc gggttggaat tctgagtctg ggttcggggt tcggggttcg 3060 gccttcatga acagacagcc caggcgggcc gttgtttggc ccctgggggc ctggttggaa 3120 tgcgaggtct cgggaagtca ggagggagcc tggccagcag a gggttccca gccctgcggc 3180 cgagggacct ggagacgggc agggcattgg ccgtcgcagg gccaggccac accccccagg 3240 tttttgtggg gcgagcctgg agattgcacc actgtgatta ctatgctatg gatctctggg 3300 gcccaggcgt tgaagtcgtc gtgtcctcag gtaagaacgg ccctccaggg cctttaattt 3360 ctgctctcgt ctgtgggctt ttctgactct gatcctcggg aggcgtctgt gccccccccg 3420 gggatgaggc cggcttgcca ggaggggtca gggaccagga gcctgtggga agttctgacg 3480 ggggctgcag gcgggaaggg ccccaccggg gggcgagccc caggccgctg ggcggcagga 3540 gacccgtgag agtgcgcctt gaggagggtg tctgcggaac cacgaacgcc cgccgggaag 3600 ggcttgctgc aatgcggtct tcagacggga ggcgtcttct gccctcaccg tctttcaagc 3660 ccttgtgggt ctgaaagagc catgtcggag agagaaggga caggcctgtc ccgacctggc 3720 cgagagcggg cagccccggg ggagagcggg gcgatcggcc tgggctctgt gaggccaggt 3780 ccaagggagg acgtgtggtc ctcgtgacag gtgcacttgc gaaaccttag aagacggggt 3840 atgttggaag cggctcctga tgtttaagaa aagggagact gtaaagtgag cagagtcctc 3900 aagtgtgtta aggttttaaa ggtcaaagtg ttttaaacct ttgtgactgc agttagcaag 3960 cgtgcgggga gtgaatgggg tgccagggtg gccgagaggc agtacga ggg ccgtgccgtc 4020 ctctaattca gggcttagtt ttgcagaata aagtcggcct gttttctaaa agcattggtg 4080 gtgctgagct ggtggaggag gccgcgggca gccctggcca cctgcagcag gtggcaggaa 4140 gcaggtcggc caagaggcta ttttaggaag ccagaaaaca cggtcgatga atttatagct 4200 tctggtttcc aggaggtggt tgggcatggc tttgcgcagc gccacagaac cgaaagtgcc 4260 cactgagaaa aaacaactcc tgcttaattt gcatttttct aaaagaagaa acagaggctg 4320 acggaaactg gaaagttcct gttttaacta ctcgaattga gttttcggtc ttagcttatc 4380 aactgctcac ttagattcat tttcaaagta aacgtttaag agccgaggca ttcctatcct 4440 cttctaaggc gttattcctg gaggctcatt caccgccagc acctccgctg cctgcaggca 4500 ttgctgtcac cgtcaccgtg acggcgcgca cgattttcag ttggcccgct tcccctcgtg 4560 attaggacag acgcgggcac tctggcccag ccgtcttggc tcagtatctg caggcgtccg 4620 tctcgggacg gagctcaggg gaagagcgtg actccagttg aacgtgatag tcggtgcgtt 4680 gagaggagac ccagtcgggt gtcgagtcag aaggggcccg gggcccgagg ccctgggcag 4740 gacggcccgt gccctgcatc acgggcccag cgtcctagag gcaggactct ggtggagagt 4800 gtgagggtgc ctggggcccc tccggagctg gggccgtgcg gtgcaggttg gg ctctcggc 4860 gcggtgttgg ctgtttctgc gggatttgga ggaattcttc cagtgatggg agtcgccagt 4920 gaccgggcac caggctggta agagggaggc cgccgtcgtg gccagagcag ctgggagggt 4980 tcggtaaaag gctcgcccgt ttcctttaat gaggactttt cctggagggc atttagtcta 5040 gtcgggaccg ttttcgactc gggaagaggg atgcggagga gggcatgtgc ccaggagccg 5100 aaggcgccgc ggggagaagc ccagggctct cctgtcccca cagaggcgac gccactgccg 5160 cagacagaca gggcctttcc ctctgatgac ggcaaaggcg cctcggctct tgcggggtgc 5220 tgggggggag tcgccccgaa gccgctcacc cagaggcctg aggggtgaga ctgaccgatg 5280 cctcttggcc gggcctgggg ccggaccgag ggggactccg tggaggcagg gcgatggtgg 5340 ctgcgggagg gaaccgaccc tgggccgagc ccggcttggc gattcccggg cgagggccct 5400 cagccgaggc gagtgggtcc ggcggaacca ccctttctgg ccagcgccac agggctctcg 5460 ggactgtccg gggcgacgct gggctgcccg tggcaggcct gggctgacct ggacttcacc 5520 agacagaaca gggctttcag ggctgagctg agccaggttt agcgaggcca agtggggctg 5580 aaccaggctc aactggcctg agctgggttg agctgggctg acctgggctg agctgagctg 5640 ggctgggctg ggctgggctg ggctgggctg ggctggactg gctgagctga gctgggtt ga 5700 gctgagctga gctggcctgg gttgagctgg gctgggttga gctgagctgg gttgagctgg 5760 gttgagctgg gttgatctga gctgagctgg gctgagctga gctaggctgg ggtgagctgg 5820 gctgagctgg tttgagttgg gttgagctga gctgagctgg gctgtgctgg ctgagctagg 5880 ctgagctagg ctaggttgag ctgggctggg ctgagctgag ctaggctggg ctgatttggg 5940 ctgagctgag ctgagctagg ctgcgttgag ctggctgggc tggattgagc tggctgagct 6000 ggctgagctg ggctgagctg gcctgggttg agctgagctg gactggtttg agctgggtcg 6060 atctgggttg agctgtcctg ggttgagctg ggctgggttg agctgagctg ggttgagctg 6120 ggctcagcag agctgggttg ggctgagctg ggttgagctg agctgggctg agctggcctg 6180 ggttgagctg ggctgagctg agctgggctg agctggcctg tgttgagctg ggctgggttg 6240 agctgggctg agctggattg agctgggttg agctgagctg ggctgggctg tgctgactga 6300 gctgggctga gctaggctgg ggtgagctgg gctgagctga tccgagctag gctgggctgg 6360 tttgggctga gctgagctga gctaggctgg attgatctgg ctgagctggg ttgagctgag 6420 ctgggctgag ctggtctgag ctggcctggg tcgagctgag ctggactggt ttgagctggg 6480 tcgatctggg ctgagctggc ctgggttgag ctgggctggg ttgagctgag ctgggttgag 654 0 ctgggctgag ctgagggctg gggtgagctg ggctgaacta gcctagctag gttgggctga 6600 gctgggctgg tttgggctga gctgagctga gctaggctgc attgagcagg ctgagctggg 6660 ctgagcaggc ctggggtgag ctgggctagg tggagctgag ctgggtcgag ctgagttggg 6720 ctgagctggc ctgggttgag gtaggctgag ctgagctgag ctaggctggg ttgagctggc 6780 tgggctggtt tgcgctgggt caagctgggc cgagctggcc tgggttgagc tgggctcggt 6840 tgagctgggc tgagctgagc cgacctaggc tgggatgagc tgggctgatt tgggctgagc 6900 tgagctgagc taggctgcat tgagcaggct gagctgggcc tggagcctgg cctggggtga 6960 gctgggctga gctgcgctga gctaggctgg gttgagctgg ctgggctggt ttgcgctggg 7020 tcaagctggg ccgagctggc ctgggatgag ctgggccggt ttgggctgag ctgagctgag 7080 ctaggctgca ttgagcaggc tgagctgggc tgagctggcc tggggtgagc tgggctgagc 7140 taagctgagc tgggctggtt tgggctgagc tggctgagct gggtcctgct gagctgggct 7200 gagctgacca ggggtgagct gggctgagtt aggctgggct cagctaggct gggttgatct 7260 ggcagggctg gtttgcgctg ggtcaagctc ccgggagatg gcctgggatg agctgggctg 7320 gtttgggctg agctgagctg agctgagcta ggctgcattg agcaggctga gctgggctga 7380 gctg gcctgg ggtgagctgg gctgggtgga gctgagctgg gctgaactgg gctaagctgg 7440 ctgagctgga tcgagctgag ctgggctgag ctggcctggg gttagctggg ctgagctgag 7500 ctgagctagg ctgggttgag ctggctgggc tggtttgcgc tgggtcaagc tgggccgagc 7560 tggcctgggt tgagctgggc tgggctgagc tgagctaggc tgggttgagc tgggctgggc 7620 tgagctgagc taggctgcat tgagctggct gggatggatt gagctggctg agctggctga 7680 gctggctgag ctgggctgag ctggcctggg ttgagctggg ctgggttgag ctgagctggg 7740 ctgagctggg ctcagcagag ctgggttgag ctgagctggg ttgagctggg gtgagctggg 7800 ctgagcagag ctgggttgag ctgagctggg ttgagctggg ctcgagcaga gctgggttga 7860 gctgagctgg gttgagctgg gctcagcaga gctgggttga gctgagctgg gttgagctgg 7920 gctgagctag ctgggctcag ctaggctggg ttgagctgag ctgggctgaa ctgggctgag 7980 ctgggctgaa ctgggctgag ctgggctgag ctgggctgag cagagctggg ctgagcagag 8040 ctgggttggt ctgagctggg ttgagctggg ctgagctggg ctgagcagag ttgggttgag 8100 ctgagctggg ttcagctggg ctgagctagg ctgggttgag ctgggttgag ttgggctgag 8160 ctgggctggg ttgagcggag ctgggctgaa ctgggctgag ctgggctgag cggaactggg 8220 ttgatctgaa ttgagctggg ctgagccggg ctgagccggg ctgagctggg ctaggttgag 8280 cttgggtgag cttgcctcag ctggtctgag ctaggttggg tggagctagg ctggattgag 8340 ctgggctgag ctgagctgat ctggcctcag ctgggctgag gtaggctgaa ctgggctgtg 8400 ctgggctgag ctgagctgag ccagtttgag ctgggttgag ctgggctgag ctgggctgtg 8460 ttgatctttc ctgaactggg ctgagctggg ctgagctggc ctagctggat tgaacggggg 8520 taagctgggc caggctggac tgggctgagc tgagctaggc tgagctgagt tgaattgggt 8580 taagctgggc tgagatgggc tgagctgggc tgagctgggt tgagccaggt cggactgggt 8640 taccctgggc cacactgggc tgagctgggc ggagctcgat taacctggtc aggctgagtc 8700 gggtccagca gacatgcgct ggccaggctg gcttgacctg gacacgttcg atgagctgcc 8760 ttgggatggt tcacctcagc tgagccaggt ggctccagct gggctgagct ggtgaccctg 8820 ggtgacctcg gtgaccaggt tgtcctgagt ccgggccaag ccgaggctgc atcagactcg 8880 ccagacccaa ggcctgggcc ccggctggca agccaggggc ggtgaaggct gggctggcag 8940 gactgtcccg gaaggaggtg cacgtggagc cgcccggacc ccgaccggca ggacctggaa 9000 agacgcctct cactcccctt tctcttctgt cccctctcgg gtcctcagag agccagtctg 9060 ccccgaatct ctacc ccctc gtctcctgcg tcagcccccc gtccgatgag agcctggtgg 9120 ccctgggctg cctggcccgg gacttcctgc ccagctccgt caccttctcc tggaa 9175 <210> 5 <211> 9200 <212> DNA <213> Sus scrofa <400> 5 ggccagactt cctcggaaca gctcaaagag ctctgtcaaa gccagatccc atcacacgtg 60 ggcaccaata ggccatgcca gcctccaagg gccgaactgg gttctccacg gcgcacatga 120 agcctgcagc ctggcttatc ctcttccgtg gtgaagaggc aggcccggga ctggacgagg 180 ggctagcagg gtgtggtagg caccttgcgc cccccacccc ggcaggaacc agagaccctg 240 gggctgagag tgagcctcca aacaggatgc cccacccttc aggccacctt tcaatccagc 300 tacactccac ctgccattct cctctgggca cagggcccag cccctggatc ttggccttgg 360 ctcgacttgc acccacgcgc acacacacac ttcctaacgt gctgtccgct cacccctccc 420 cagcgtggtc catgggcagc acggcagtgc gcgtccggcg gtagtgagtg cagaggtccc 480 ttcccctccc ccaggagccc caggggtgtg tgcagatctg ggggctcctg tcccttacac 540 cttcatgccc ctcccctcat acccaccctc caggcgggag gcagcgagac ctttgcccag 600 ggactcagcc aacgggcaca cgggaggcca gccctcagca gctggctccc aaagaggagg 660 tgggaggtag gtccacagct gccacagaga gaaaccctga cggaccccac a ggggccacg 720 ccagccggaa ccagctccct cgtgggtgag caatggccag ggccccgccg gccaccacgg 780 ctggccttgc gccagctgag aactcacgtc cagtgcaggg agactcaaga cagcctgtgc 840 acacagcctc ggatctgctc ccatttcaag cagaaaaagg aaaccgtgca ggcagccctc 900 agcatttcaa ggattgtagc agcggccaac tattcgtcgg cagtggccga ttagaatgac 960 cgtggagaag ggcggaaggg tctctcgtgg gctctgcggc caacaggccc tggctccacc 1020 tgcccgctgc cagcccgagg ggcttgggcc gagccaggaa ccacagtgct caccgggacc 1080 acagtgactg accaaactcc cggccagagc agccccaggc cagccgggct ctcgccctgg 1140 aggactcacc atcagatgca caagggggcg agtgtggaag agacgtgtcg cccgggccat 1200 ttgggaaggc gaagggacct tccaggtgga caggaggtgg gacgcactcc aggcaaggga 1260 ctgggtcccc aaggcctggg gaaggggtac tggcttgggg gttagcctgg ccagggaacg 1320 gggagcgggg cggggggctg agcagggagg acctgacctc gtgggagcga ggcaagtcag 1380 gcttcaggca gcagccgcac atcccagacc aggaggctga ggcaggaggg gcttgcagcg 1440 gggcgggggc ctgcctggct ccgggggctc ctgggggacg ctggctcttg tttccgtgtc 1500 ccgcagcaca gggccagctc gctgggccta tgcttacctt gatgtctggg gccggggcgt 1 560 cagggtcgtc gtctcctcag gggagagtcc cctgaggcta cgctgggggg ggactatggc 1620 agctccacca ggggcctggg gaccaggggc ctggaccagg ctgcagcccg gaggacgggc 1680 agggctctgg ctctccagca tctggccctc ggaaatggca gaacccctgg cgggtgagcg 1740 agctgagagc gggtcagaca gacaggggcc ggccggaaag gagaagttgg gggcagagcc 1800 cgccaggggc caggcccaag gttctgtgtg ccagggcctg ggtgggcaca ttggtgtggc 1860 catggctact tagacgcgtg atcaagggcg aattccagca cactggcggc cgttactagt 1920 ggatcccggc gcgccctacc gggtagggga ggcgcttttc ccaaggcagt ctggagcatg 1980 cgctttagca gccccgctgg gcacttggcg ctacacaagt ggcctctggc ctcgcacaca 2040 ttccacatcc accggtaggc gccaaccggc tccgttcttt ggtggcccct tcgcgccacc 2100 ttctactcct cccctagtca ggaagttccc ccccgccccg cagctcgcgt cgtgcaggac 2160 gtgacaaatg gaagtagcac gtctcactag tctcgtgcag atggacagca ccgctgagca 2220 atggaagcgg gtaggccttt ggggcagcgg ccaatagcag ctttggctcc ttcgctttct 2280 gggctcagag gctgggaagg ggtgggtccg ggggcgggct caggggcggg ctcaggggcg 2340 gggcgggcgc ccgaaggtcc tccggaagcc cggcattctg cacgcttcaa aagcgcacgt 2400 ct gccgcgct gttctcctct tcctcatctc cgggcctttc gacctgcagc caatatggga 2460 tcggccattg aacaagatgg attgcacgca ggttctccgg ccgcttgggt ggagaggcta 2520 ttcggctatg actgggcaca acagacaatc ggctgctctg atgccgccgt gttccggctg 2580 tcagcgcagg ggcgcccggt tctttttgtc aagaccgacc tgtccggtgc cctgaatgaa 2640 ctgcaggacg aggcagcgcg gctatcgtgg ctggccacga cgggcgttcc ttgcgcagct 2700 gtgctcgacg ttgtcactga agcgggaagg gactggctgc tattgggcga agtgccgggg 2760 caggatctcc tgtcatctca ccttgctcct gccgagaaag tatccatcat ggctgatgca 2820 atgcggcggc tgcatacgct tgatccggct acctgcccat tcgaccacca agcgaaacat 2880 cgcatcgagc gagcacgtac tcggatggaa gccggtcttg tcaatcagga tgatctggac 2940 gaagagcatc aggggctcgc gccagccgaa ctgttcgcca ggctcaaggc gcgcatgccc 3000 gacggcgagg atctcgtcgt gacccatggc gatgcctgct tgccgaatat catggtggaa 3060 aatggccgct tttctggatt catcgactgt ggccggctgg gtgtggcgga tcgctatcag 3120 gacatagcgt tggctacccg tgatattgct gaagagcttg gcggcgaatg ggctgaccgc 3180 ttcctcgtgc tttacggtat cgccgctccc gattcgcagc gcatcgcctt ctatcgcctt 3240 cttgacga gt tcttctgagg ggatcaattc tctagatgca tgctcgagcg gccgccagtg 3300 tgatggatat ctgcagaatt cgcccttcca ggcgttgaag tcgtcgtgtc ctcaggtaag 3360 aacggccctc cagggccttt aatttctgct ctcgtctgtg ggcttttctg actctgatcc 3420 tcgggaggcg tctgtgcccc ccccggggat gaggccggct tgccaggagg ggtcagggac 3480 caggagcctg tgggaagttc tgacgggggc tgcaggcggg aagggcccca ccggggggcg 3540 agccccaggc cgctgggcgg caggagaccc gtgagagtgc gccttgagga gggtgtctgc 3600 ggaaccacga acgcccgccg ggaagggctt gctgcaatgc ggtcttcaga cgggaggcgt 3660 cttctgccct caccgtcttt caagcccttg tgggtctgaa agagccatgt cggagagaga 3720 agggacaggc ctgtcccgac ctggccgaga gcgggcagcc ccgggggaga gcggggcgat 3780 cggcctgggc tctgtgaggc caggtccaag ggaggacgtg tggtcctcgt gacaggtgca 3840 cttgcgaaac cttagaagac ggggtatgtt ggaagcggct cctgatgttt aagaaaaggg 3900 agactgtaaa gtgagcagag tcctcaagtg tgttaaggtt ttaaaggtca aagtgtttta 3960 aacctttgtg actgcagtta gcaagcgtgc ggggagtgaa tggggtgcca gggtggccga 4020 gaggcagtac gagggccgtg ccgtcctcta attcagggct tagttttgca gaataaagtc 4080 ggcctgtttt cta aaagcat tggtggtgct gagctggtgg aggaggccgc gggcagccct 4140 ggccacctgc agcaggtggc aggaagcagg tcggccaaga ggctatttta ggaagccaga 4200 aaacacggtc gatgaattta tagcttctgg tttccaggag gtggttgggc atggctttgc 4260 gcagcgccac agaaccgaaa gtgcccactg agaaaaaaca actcctgctt aatttgcatt 4320 tttctaaaag aagaaacaga ggctgacgga aactggaaag ttcctgtttt aactactcga 4380 attgagtttt cggtcttagc ttatcaactg ctcacttaga ttcattttca aagtaaacgt 4440 ttaagagccg aggcattcct atcctcttct aaggcgttat tcctggaggc tcattcaccg 4500 ccagcacctc cgctgcctgc aggcattgct gtcaccgtca ccgtgacggc gcgcacgatt 4560 ttcagttggc ccgcttcccc tcgtgattag gacagacgcg ggcactctgg cccagccgtc 4620 ttggctcagt atctgcaggc gtccgtctcg ggacggagct caggggaaga gcgtgactcc 4680 agttgaacgt gatagtcggt gcgttgagag gagacccagt cgggtgtcga gtcagaaggg 4740 gcccggggcc cgaggccctg ggcaggacgg cccgtgccct gcatcacggg cccagcgtcc 4800 tagaggcagg actctggtgg agagtgtgag ggtgcctggg gcccctccgg agctggggcc 4860 gtgcggtgca ggttgggctc tcggcgcggt gttggctgtt tctgcgggat ttggaggaat 4920 tcttccagtg atgggagtc g ccagtgaccg ggcaccaggc tggtaagagg gaggccgccg 4980 tcgtggccag agcagctggg agggttcggt aaaaggctcg cccgtttcct ttaatgagga 5040 cttttcctgg agggcattta gtctagtcgg gaccgttttc gactcgggaa gagggatgcg 5100 gaggagggca tgtgcccagg agccgaaggc gccgcgggga gaagcccagg gctctcctgt 5160 ccccacagag gcgacgccac tgccgcagac agacagggcc tttccctctg atgacggcaa 5220 aggcgcctcg gctcttgcgg ggtgctgggg gggagtcgcc ccgaagccgc tcacccagag 5280 gcctgagggg tgagactgac cgatgcctct tggccgggcc tggggccgga ccgaggggga 5340 ctccgtggag gcagggcgat ggtggctgcg ggagggaacc gaccctgggc cgagcccggc 5400 ttggcgattc ccgggcgagg gccctcagcc gaggcgagtg ggtccggcgg aaccaccctt 5460 tctggccagc gccacagggc tctcgggact gtccggggcg acgctgggct gcccgtggca 5520 ggcctgggct gacctggact tcaccagaca gaacagggct ttcagggctg agctgagcca 5580 ggtttagcga ggccaagtgg ggctgaacca ggctcaactg gcctgagctg ggttgagctg 5640 ggctgacctg ggctgagctg agctgggctg ggctgggctg ggctgggctg ggctgggctg 5700 gactggctga gctgagctgg gttgagctga gctgagctgg cctgggttga gctgggctgg 5760 gttgagctga gctgggttga gctg ggttga gctgggttga tctgagctga gctgggctga 5820 gctgagctag gctggggtga gctgggctga gctggtttga gttgggttga gctgagctga 5880 gctgggctgt gctggctgag ctaggctgag ctaggctagg ttgagctggg ctgggctgag 5940 ctgagctagg ctgggctgat ttgggctgag ctgagctgag ctaggctgcg ttgagctggc 6000 tgggctggat tgagctggct gagctggctg agctgggctg agctggcctg ggttgagctg 6060 agctggactg gtttgagctg ggtcgatctg ggttgagctg tcctgggttg agctgggctg 6120 ggttgagctg agctgggttg agctgggctc agcagagctg ggttgggctg agctgggttg 6180 agctgagctg ggctgagctg gcctgggttg agctgggctg agctgagctg ggctgagctg 6240 gcctgtgttg agctgggctg ggttgagctg ggctgagctg gattgagctg ggttgagctg 6300 agctgggctg ggctgtgctg actgagctgg gctgagctag gctggggtga gctgggctga 6360 gctgatccga gctaggctgg gctggtttgg gctgagctga gctgagctag gctggattga 6420 tctggctgag ctgggttgag ctgagctggg ctgagctggt ctgagctggc ctgggtcgag 6480 ctgagctgga ctggtttgag ctgggtcgat ctgggctgag ctggcctggg ttgagctggg 6540 ctgggttgag ctgagctggg ttgagctggg ctgagctgag ggctggggtg agctgggctg 6600 aactagccta gctaggttgg gctgagctgg gctggtttgg gctgagctga gctgagctag 6660 gctgcattga gcaggctgag ctgggctgag caggcctggg gtgagctggg ctaggtggag 6720 ctgagctggg tcgagctgag ttgggctgag ctggcctggg ttgaggtagg ctgagctgag 6780 ctgagctagg ctgggttgag ctggctgggc tggtttgcgc tgggtcaagc tgggccgagc 6840 tggcctgggt tgagctgggc tcggttgagc tgggctgagc tgagccgacc taggctggga 6900 tgagctgggc tgatttgggc tgagctgagc tgagctaggc tgcattgagc aggctgagct 6960 gggcctggag cctggcctgg ggtgagctgg gctgagctgc gctgagctag gctgggttga 7020 gctggctggg ctggtttgcg ctgggtcaag ctgggccgag ctggcctggg atgagctggg 7080 ccggtttggg ctgagctgag ctgagctagg ctgcattgag caggctgagc tgggctgagc 7140 tggcctgggg tgagctgggc tgagctaagc tgagctgggc tggtttgggc tgagctggct 7200 gagctgggtc ctgctgagct gggctgagct gaccaggggt gagctgggct gagttaggct 7260 gggctcagct aggctgggtt gatctggcag ggctggtttg cgctgggtca agctcccggg 7320 agatggcctg ggatgagctg ggctggtttg ggctgagctg agctgagctg agctaggctg 7380 cattgagcag gctgagctgg gctgagctgg cctggggtga gctgggctgg gtggagctga 7440 gctgggctga actgggctaa gctggctgag ctgga tcgag ctgagctggg ctgagctggc 7500 ctggggttag ctgggctgag ctgagctgag ctaggctggg ttgagctggc tgggctggtt 7560 tgcgctgggt caagctgggc cgagctggcc tgggttgagc tgggctgggc tgagctgagc 7620 taggctgggt tgagctgggc tgggctgagc tgagctaggc tgcattgagc tggctgggat 7680 ggattgagct ggctgagctg gctgagctgg ctgagctggg ctgagctggc ctgggttgag 7740 ctgggctggg ttgagctgag ctgggctgag ctgggctcag cagagctggg ttgagctgag 7800 ctgggttgag ctggggtgag ctgggctgag cagagctggg ttgagctgag ctgggttgag 7860 ctgggctcga gcagagctgg gttgagctga gctgggttga gctgggctca gcagagctgg 7920 gttgagctga gctgggttga gctgggctga gctagctggg ctcagctagg ctgggttgag 7980 ctgagctggg ctgaactggg ctgagctggg ctgaactggg ctgagctggg ctgagctggg 8040 ctgagcagag ctgggctgag cagagctggg ttggtctgag ctgggttgag ctgggctgag 8100 ctgggctgag cagagttggg ttgagctgag ctgggttcag ctgggctgag ctaggctggg 8160 ttgagctggg ttgagttggg ctgagctggg ctgggttgag cggagctggg ctgaactggg 8220 ctgagctggg ctgagcggaa ctgggttgat ctgaattgag ctgggctgag ccgggctgag 8280 ccgggctgag ctgggctagg ttgagcttgg gtgagcttgc ctcagctggt ctgagctagg 8340 ttgggtggag ctaggctgga ttgagctggg ctgagctgag ctgatctggc ctcagctggg 8400 ctgaggtagg ctgaactggg ctgtgctggg ctgagctgag ctgagccagt ttgagctggg 8460 ttgagctggg ctgagctggg ctgtgttgat ctttcctgaa ctgggctgag ctgggctgag 8520 ctggcctagc tggattgaac gggggtaagc tgggccaggc tggactgggc tgagctgagc 8580 taggctgagc tgagttgaat tgggttaagc tgggctgaga tgggctgagc tgggctgagc 8640 tgggttgagc caggtcggac tgggttaccc tgggccacac tgggctgagc tgggcggagc 8700 tcgattaacc tggtcaggct gagtcgggtc cagcagacat gcgctggcca ggctggcttg 8760 acctggacac gttcgatgag ctgccttggg atggttcacc tcagctgagc caggtggctc 8820 cagctgggct gagctggtga ccctgggtga cctcggtgac caggttgtcc tgagtccggg 8880 ccaagccgag gctgcatcag actcgccaga cccaaggcct gggccccggc tggcaagcca 8940 ggggcggtga aggctgggct ggcaggactg tcccggaagg aggtgcacgt ggagccgccc 9000 ggaccccgac cggcaggacc tggaaagacg cctctcactc ccctttctct tctgtcccct 9060 ctcgggtcct cagagagcca gtctgccccg aatctctacc ccctcgtctc ctgcgtcagc 9120 cccccgtccg atgagagcct ggtggccctg ggctgcctgg cccggg actt cctgcccagc 9180 tccgtcacct tctcctggaa 9200 <210> 6 <211> 26 <212> DNA <213> Sus scrofa <400> 6 tctagaagac gctggagaga ggccag 26 <210> 7 <211> 25 <212> DNA <213> Sus scrofa <400> 7 taaagcgcat gctccagact gcctt 25 <210> 8 <211> 22 <212> DNA <213> Sus scrofa <400> 8 catcgccttc tatcgccttc tt 22 <210> 9 <211> 22 <212> DNA <213> Sus scrofa <400> 9 aagtacttgc cgcctctcag ga 22 <210> 10 <211> 22 <212> DNA <213> Sus scrofa <400> 10 caaggagacc aagctggaac tc 22 <210> 11 <211> 24 <212> DNA <213> Sus scrofa <400> 11 tgatcaagca caccacagag acag 24 <210> 12 <211> 4277 <212> DNA <213> Sus scrofa <400> 12 caaggaacca agctggaact caaacgtaag tcaatccaaa cgttccttcc ttggctgtct 60 gtgtcttacg gtctctgtgg ctctgaaatg attcatgtgc tgactctctg aaaccagact 120 gacattctcc agggcaaaac taaagcctgt catcaaactg gaaaactgag ggcacatttt 180 ctgggcagaa ctaagagtca ggcactgggt gaggaaaaac ttgttagaat gatagtttca 240 gaaacttact gggaagcaaa gcccatgttc tgaacagagc tctgctcaag ggtcaggagg 300 ggaaccagtt tttgtacagg agggaagttg agacgaaccc ctgtgtatat ggtttcggcg 360 cggggaccaa gctggagctc aaacgtaagt ggctttttcc gactgattct ttgctgtttc 420 taattgttgg ttggcttttt gtccattttt cagtgttttc atcgaattag ttgtcaggga 480 ccaaacaaat tgccttccca gattaggtac cagggagggg acattgctgc atgggagacc 540 agagggtggc taatttttaa cgtttccaag ccaaaataac tggggaaggg ggcttgctgt 600 cctgtgaggg taggttttta tagaagtgga agttaagggg aaatcgctat ggttcacttt 660 tggctcgggg accaaagtgg agcccaaaat tgagtacatt ttccatcaat tatttgtgag 720 atttttgtcc tgttgtgtca tttgtgcaag tttttgacat tttggttgaa tgagccattc 780 ccagggaccc aaaaggatga gaccgaaaag tagaaaagag ccaactttta agctgagcag 840 acagaccgaa ttgttgagtt tgtgaggaga gtagggtttg tagggagaaa ggggaacaga 900 tcgctggctt tttctctgaa ttagcctttc tcatgggact ggcttcagag ggggtttttg 960 atgagggaag tgttctagag ccttaactgt gggttgtgtt cggtagcggg accaagctgg 1020 aaatcaaacg taagtgcact tttctactcc tttttctttc ttatacgggt gtgaaattgg 1080 ggacttttca tgtttggagt atgagttgag gtcagttctg aagagagtgg gactcatcca 1140 aaaatctgag gagtaagggt cagaacagag ttgtctcatg gaagaacaaa gacctagtta 1200 gttgatgagg cagctaaatg agtcagttga cttgggatcc aaatggccag acttcgtctg 1260 taaccaacaa tctaatgaga tgtagcagca aaaagagatt tccattgagg ggaaagtaaa 1320 attgttaata ttgtggatca cctttggtga agggacatcc gtggagattg aacgtaagta 1380 ttttttctct actaccttct gaaatttgtc taaatgccag tgttgacttt tagaggctta 1440 agtgtcagtt ttgtgaaaaa tgggtaaaca agagcatttc atatttatta tcagtttcaa 1500 aagttaaact cagctccaaa aatgaatttg tagacaaaaa gattaattta agccaaattg 1560 aatgattcaa aggaaaaaaa aattagtgta gatgaaaaag gaattcttac agctccaaag 1620 agcaaaagcg aattaatttt ctttgaactt tgccaaatct tgtaaatgat ttttgttctt 1680 tacaatttaa aaaggttaga gaaatgtatt tcttagtctg ttttctctct tctgtctgat 1740 aaattattat atgagataaa aatgaaaatt aataggatgt gctaaaaaat cagtaagaag 1800 ttagaaaaat atatgtttat gttaaagttg ccacttaatt gagaatcaga agcaatgtta 1860 tttttaaagt ctaaaatgag agataaactg tcaatactta aattctgcag agattctata 1920 tcttgacaga tatctccttt ttcaaaaatc caatttctat ggtagactaa atttgaaatg 1980 atcttcctca taatggaggg aaaagatgga ctgaccccaa aagctcagat ttaagaaaac 2040 ctgttt aagg aaagaaaata aaagaactgc attttttaaa ggcccatgaa tttgtagaaa 2100 aataggaaat attttaataa gtgtattctt ttattttcct gttattactt gatggtgttt 2160 ttataccgcc aaggaggccg tggcaccgtc agtgtgatct gtagacccca tggcggcctt 2220 ttttcgcgat tgaatgacct tggcggtggg tccccagggc tctggtggca gcgcaccagc 2280 cgctaaaagc cgctaaaaac tgccgctaaa ggccacagca accccgcgac cgcccgttca 2340 actgtgctga cacagtgata cagataatgt cgctaacaga ggagaataga aatatgacgg 2400 gcacacgcta atgtggggaa aagagggaga agcctgattt ttatttttta gagattctag 2460 agataaaatt cccagtatta tatcctttta ataaaaaatt tctattagga gattataaag 2520 aatttaaagc tattttttta agtggggtgt aattctttca gtagtctctt gtcaaatgga 2580 tttaagtaat agaggcttaa tccaaatgag agaaatagac gcataaccct ttcaaggcaa 2640 aagctacaag agcaaaaatt gaacacagca gccagccatc tagccactca gattttgatc 2700 agttttactg agtttgaagt aaatatcatg aaggtataat tgctgataaa aaaataagat 2760 acaggtgtga cacatcttta agtttcagaa atttaatggc ttcagtagga ttatatttca 2820 cgtatacaaa gtatctaagc agataaaaat gccattaatg gaaacttaat agaaatatat 2880 ttttaaattc c ttcattctg tgacagaaat tttctaatct gggtctttta atcacctacc 2940 ctttgaaaga gtttagtaat ttgctatttg ccatcgctgt ttactccagc taatttcaaa 3000 agtgatactt gagaaagatt atttttggtt tgcaaccacc tggcaggact attttagggc 3060 cattttaaaa ctcttttcaa actaagtatt ttaaactgtt ctaaaccatt tagggccttt 3120 taaaaatctt ttcatgaatt tcaaacttcg ttaaaagtta ttaaggtgtc tggcaagaac 3180 ttccttatca aatatgctaa tagtttaatc tgttaatgca ggatataaaa ttaaagtgat 3240 caaggcttga cccaaacagg agtatcttca tagcatattt cccctccttt ttttctagaa 3300 ttcatatgat tttgctgcca aggctatttt atataatctc tggaaaaaaa atagtaatga 3360 aggttaaaag agaagaaaat atcagaacat taagaattcg gtattttact aactgcttgg 3420 ttaacatgaa ggtttttatt ttattaaggt ttctatcttt ataaaaatct gttccctttt 3480 ctgctgattt ctccaagcaa aagattcttg atttgttttt taactcttac tctcccaccc 3540 aagggcctga atgcccacaa aggggacttc caggaggcca tctggcagct gctcaccgtc 3600 agaagtgaag ccagccagtt cctcctgggc aggtggccaa aattacagtt gacccctcct 3660 ggtctggctg aaccttgccc catatggtga cagccatctg gccagggccc aggtctccct 3720 ctgaagcctt tgggagg aga gggagagtgg ctggcccgat cacagatgcg gaaggggctg 3780 actcctcaac cggggtgcag actctgcagg gtgggtctgg gcccaacaca cccaaagcac 3840 gcccaggaag gaaaggcagc ttggtatcac tgcccagagc taggagaggc accgggaaaa 3900 tgatctgtcc aagacccgtt cttgcttcta aactccgagg gggtcagatg aagtggtttt 3960 gtttcttggc ctgaagcatc gtgttccctg caagaagcgg ggaacacaga ggaaggagag 4020 aaaagatgaa ctgaacaaag catgcaaggc aaaaaaggcc ttaggatggc tgcaggaagt 4080 tagttcttct gcattggctc cttactggct cgtcgatcgc ccacaaacaa cgcacccagt 4140 ggagaacttc cctgttactt aaacaccatt ctctgtgctt gcttcctcag gggctgatgc 4200 caagccatcc gtcttcatct tcccgccatc gaaggagcag ttagcgaccc caactgtctc 4260 tgtggtgtgc ttgatca 4277 <210> 13 <211> 24 <212> DNA <213> Sus scrofa <400> 13 gatgccaagc catccgtctt catc 24 <210> 14 <211> 24 <212> DNA <213> Sus scrofa <400> 14 tgaccaaagc agtgtgacgg ttgc 24 <210> 15 <211> 2027 <212> DNA <213> Sus scrofa <400> 15 gatgccaagc catccgtctt catcttcccg ccatcgaagg agcagttagc gaccccaact 60 gtctctgtgg tgtgcttgat caataacttc ttccccagag aaatcagtgt caagtgg aaa 120 gtggatgggg tggtccaaag cagtggtcat ccggatagtg tcacagagca ggacagcaag 180 gacagcacct acagcctcag cagcaccctc tcgctgccca cgtcacagta cctaagtcat 240 aatttatatt cctgtgaggt cacccacaag accctggcct cccctctggt cacaagcttc 300 aacaggaacg agtgtgaggc ttagaggccc acaggcccct ggcctgcccc cagccccagc 360 ccccctcccc acctcaagcc tcaggccctt gccccagagg atccttggca atcccccagc 420 ccctcttccc tcctcatccc ctccccctct ttggctttaa ccgtgttaat actggggggt 480 gggggaatga ataaataaag tgaacctttg cacctgtgat ttctctctcc tgtctgattt 540 taaggttgtt aaatgttgtt ttccccatta tagttaatct tttaaggaac tacatactga 600 gttgctaaaa actacaccat cacttataaa attcacgcct tctcagttct cccctcccct 660 cctgtcctcc gtaagacagg cctccgtgaa acccataagc acttctcttt acaccctctc 720 ctgggccggg gtaggagact ttttgatgtc ccctcttcag caagcctcag aaccattttg 780 agggggacag ttcttacagt cacattcctg tgatctaatg actttagtta ccgaaaagcc 840 agtctctcaa aaagaaggga acggctagaa accaagtcat agaaatatat atgtataaaa 900 tatatatata tccatatatg taaaataaca aaataatgat aacagcatag gtcaacaggc 960 aacagggaat g ttgaagtcc attctggcac ttcaatttaa gggaatagga tgccttcatt 1020 acattttaaa tacaatacac atggagagct tcctatctgc caaagaccat cctgaatgcc 1080 ttccacactc actacaaggt taaaagcatt cattacaatg ttgatcgagg agttcccgtt 1140 gtggctcagc aggttaagaa cgtgactggt atccaggagg atgcgggttt ggtccccagc 1200 ctcgctcagt ggattaagga tccagtgttg ctgcaagatc acgggctcag atcccgtgtt 1260 ctatggctat ggtgtaggct ggtagctgca tgcagcccta atttgacccc tagcctggga 1320 actgccatat gccacatgtg aggcccttaa aacctaaaag aaaaaaaaag aaaagaaata 1380 tcttacaccc aatttataga taagagagaa gctaaggtgg caggcccagg atcaaagccc 1440 tacctgccta tcttgacacc tgatacaaat tctgtcttct agggtttcca acactgcata 1500 gaacagaggg tcaaacatgc taccctccca gggactcctc ccttcaaatg acataaattt 1560 tgttgcccat ctctgggggc aaaactcaac aatcaatggc atctctagta ccaagcaagg 1620 ctcttctcat gaagcaaaac tctgaagcca gatccatcat gacccaagga agtaaagaca 1680 ggtgttactg gttgaactgt atccttcaat tcaatatgct caatttccaa ctcccagtcc 1740 ccgtaaatac aacccccttt gggaagagag tccttgcaga tgtagccacg ttaaaaagag 1800 attatacaga aaggcta gtg aggatgcagt gaaacgggat ctttcataca ttgctggtgg 1860 aaatgtaaaa tgctgcaggc actctagaaa ataatttgcc agttttttga aaagctaaac 1920 aaaatagttt agttgcattc tgggttattt atcccccaga aattaaaaat tatgtccgca 1980 caaaaacgtg tacataatca ttcataacag ccttgtacga aaagctt 2027 <210> 16 <211> 3918 <212> DNA <213> Sus scrofa <400> 16 ggatccttaa cccactaatc gaggatcaaa cacgcatcct catggacaat atgttgggtt 60 cttagcctgc tgagacacaa caggaactcc cctggcacca ctttagaggc cagagaaaca 120 gcacagataa aattccctgc cctcatgaag cttatagtct agctggggag atatcatagg 180 caagataaac acatacaaat acatcatctt aggtaataat atatactaag gagaaaatta 240 caggggagaa agaggacagg aattgctagg gtaggattat aagttcagat agttcatcag 300 gaacactgtt gctgagaaga taacatttag gtaaagaccg aagtagtaag gaaatggacc 360 gtgtgcctaa gtgggtaaga ccattctagg cagcaggaac agcgatgaaa gcactgaggt 420 gggtgttcac tgcacagagt tgttcactgc acagagttgt gtggggaggg gtaggtcttg 480 caggctctta tggtcacagg aagaattgtt ttactcccac cgagatgaag gttggtggat 540 tttgagcaga agaataattc tgcctggttt atatataaca ggatttccct gggtgctc tg 600 atgagaataa tctgtcaggg gtgggatagg gagagatatg gcaataggag ccttggctag 660 gagcccacga caataattcc aagtgagagg tggtgctgca ttgaaagcag gactaacaag 720 acctgctgac agtgtggatg tagaaaaaga tagaggagac gaaggtgcat ctagggtttt 780 ctgcctgagg aattagaaag ataaagctaa agcttataga agatgcagcg ctctggggag 840 aaagaccagc agctcagttt tgatccatct ggaattaatt ttggcataaa gtatgaggta 900 tgtgggttaa cattatttgt tttttttttt tccatgtagc tatccaactg tcccagcatc 960 atttatttta aaagactttc ctttccccta ttggattgtt ttggcacctt cactgaagat 1020 caactgagca taaaattggg tctatttcta agctcttgat tccattccat gacctatttg 1080 ttcatcttta ccccagtaga cactgccttg atgattaaag cccctgttac catgtctgtt 1140 ttggacatgg taaatctgag atgcctatta gccaaccaag caagcacggc ccttagagag 1200 ctagatatga gagcctggaa ttcagacgag aaaggtcagt cctagagaca tacatgtagt 1260 gccatcacca tgcggatggt gttaaaagcc atcagactgc aacagactgt gagagggtac 1320 caagctagag agcatggata gagaaaccca agcactgagc tgggaggtgc tcctacatta 1380 agagattagt gagatgaagg actgagaaga ttgatcagag aagaaggaaa atcaggaaaa 1440 tggtg ctgtc ctgaaaatcc aagggaagag atgttccaaa gaggagaaaa ctgatcagtt 1500 gtcagctagc gtcaattggg atgaaaatgg accattggac agagggatgt agtgggtcat 1560 gggtgaatag ataagagcag cttctataga atggcagggg caaaattctc atctgatcgg 1620 catgggttct aaagaaaacg ggaagaaaaa attgagtgca tgaccagtcc cttcaagtag 1680 agaggtggaa aagggaagga ggaaaatgag gccacgacaa catgagagaa atgacagcat 1740 ttttaaaaat tttttatttt attttattta tttatttttg ctttttaggg ctgcccctgc 1800 aacatatgga ggttcccagg ttaggggtct aatcagagct atagctgcca gcctacacca 1860 cagccatagc aatgccagat ctacatgacc tacaccacag ctcacagcaa cgccggatcc 1920 ttaacccact gagtgaggcc agagatcaaa cccatatcct tatggatact agtcaggttc 1980 attaccactg agccaaaatg ggaaatcctg agtaatgaca gcatttttta atgtgccagg 2040 aagcaaaact tgccaccccg aaatgtctct caggcatgtg gattattttg agctgaaaac 2100 gattaaggcc caaaaaacac aagaagaaat gtggaccttc ccccaacagc ctaaaaaatt 2160 tagattgagg gcctgttccc agaatagagc tattgccaga cttgtctaca gaggctaagg 2220 gctaggtgtg gtggggaaac cctcagagat cagagggacg tttatgtacc aagcattgac 2280 atttccatct ccatgcgaat ggccttcttc ccctctgtag ccccaaacca ccacccccaa 2340 aatcttcttc tgtctttagc tgaagatggt gttgaaggtg atagtttcag ccactttggc 2400 gagttcctca gttgttctgg gtctttcctc cggatccaca ttattcgact gtgtttgatt 2460 ttctcctgtt tatctgtctc attggcaccc atttcattct tagaccagcc caaagaacct 2520 agaagagtga aggaaaattt cttccaccct gacaaatgct aaatgagaat caccgcagta 2580 gaggaaaatg atctggtgct gcgggagata gaagagaaaa tcgctggaga gatgtcactg 2640 agtaggtgag atgggaaagg gggggcacag gtggaggtgt tgccctcagc taggaagaca 2700 gacagttcac agaagagaag cgggtgtccg tggacatctt gcctcatgga tgaggaaacc 2760 gaggctaaga aagactgcaa aagaaaggta aggattgcag agaggtcgat ccatgactaa 2820 aatcacagta accaacccca aaccaccatg ttttctccta gtctggcacg tggcaggtac 2880 tgtgtaggtt ttcaatatta ttggtttgta acagtaccta ttaggcctcc atcccctcct 2940 ctaatactaa caaaagtgtg agactggtca gtgaaaaatg gtcttctttc tctatgcaat 3000 ctttctcaag aagatacata actttttatt ttatcatagg cttgaagagc aaatgagaaa 3060 cagcctccaa cctatgacac cgtaacaaag tgtttatgat cagtgaaggg caagaaacaa 3120 aacatacaca gtaaag accc tccataatat tgtgggctgg cccaacacag gccaggttgt 3180 aaaagctttt tattctttga tagaggaatg gatagtaatg tttcaacctg gacagagatc 3240 atgttcactg aatccttcca aaaattcatg ggtagtttga attataagga aaataagact 3300 taggataaat actttgtcca gatcccagag ttaatgccaa aatcagtttt cagactccag 3360 gcagcctgat caagagccta aactttaaag acacagtccc ttaataacta ctattcacag 3420 ttgcactttc agggcgcaaa gactcattga atcctacaat agaatgagtt tagatatcaa 3480 atctctcagt aatagatgag gagactaaat agcgggcatg acctggtcac ttaaagacag 3540 aattgagatt caaggctagt gttctttcta cctgttttgt ttctacaaga tgtagcaatg 3600 cgctaattac agacctctca gggaaggaat tcacaaccct cagcaaaaac caaagacaaa 3660 tctaagacaa ctaagagtgt tggtttaatt tggaaaaata actcactaac caaacgcccc 3720 tcttagcacc ccaatgtctt ccaccatcac agtgctcagg cctcaaccat gccccaatca 3780 ccccagcccc agactggtta ttaccaagtt tcatgatgac tggcctgaga agatcaaaaa 3840 agcaatgaca tcttacaggg gactaccccg aggaccaaga tagcaactgt catagcaacc 3900 gtcacactgc tttggtca 3918 <210> 17 <211> 25 <212> DNA <213> Sus scrofa <400> 17 ggatcaaaca cgca tcctca tggac 25 <210> 18 <211> 22 <212> DNA <213> Sus scrofa <400> 18 ggtgattggg gcatggttga gg 22 <210> 19 <211> 3759 <212> DNA <213> Sus scrofa <400> 19 ggatcaaaca cgcatcctca tggacaatat gttgggttct tagcctgctg agacacaaca 60 ggaactcccc tggcaccact ttagaggcca gagaaacagc acagataaaa ttccctgccc 120 tcatgaagct tatagtctag ctggggagat atcataggca agataaacac atacaaatac 180 atcatcttag gtaataatat atactaagga gaaaattaca ggggagaaag aggacaggaa 240 ttgctagggt aggattataa gttcagatag ttcatcagga acactgttgc tgagaagata 300 acatttaggt aaagaccgaa gtagtaagga aatggaccgt gtgcctaagt gggtaagacc 360 attctaggca gcaggaacag cgatgaaagc actgaggtgg gtgttcactg cacagagttg 420 ttcactgcac agagttgtgt ggggaggggt aggtcttgca ggctcttatg gtcacaggaa 480 gaattgtttt actcccaccg agatgaaggt tggtggattt tgagcagaag aataattctg 540 cctggtttat atataacagg atttccctgg gtgctctgat gagaataatc tgtcaggggt 600 gggataggga gagatatggc aataggagcc ttggctagga gcccacgaca ataattccaa 660 gtgagaggtg gtgctgcatt gaaagcagga ctaacaagac ctgctgacag tgtggatgta 720 gaaaaag ata gaggagacga aggtgcatct agggttttct gcctgaggaa ttagaaagat 780 aaagctaaag cttatagaag atgcagcgct ctggggagaa agaccagcag ctcagttttg 840 atccatctgg aattaatttt ggcataaagt atgaggtatg tgggttaaca ttatttgttt 900 tttttttttc catgtagcta tccaactgtc ccagcatcat ttattttaaa agactttcct 960 ttcccctatt ggattgtttt ggcaccttca ctgaagatca actgagcata aaattgggtc 1020 tatttctaag ctcttgattc cattccatga cctatttgtt catctttacc ccagtagaca 1080 ctgccttgat gattaaagcc cctgttacca tgtctgtttt ggacatggta aatctgagat 1140 gcctattagc caaccaagca agcacggccc ttagagagct agatatgaga gcctggaatt 1200 cagacgagaa aggtcagtcc tagagacata catgtagtgc catcaccatg cggatggtgt 1260 taaaagccat cagactgcaa cagactgtga gagggtacca agctagagag catggataga 1320 gaaacccaag cactgagctg ggaggtgctc ctacattaag agattagtga gatgaaggac 1380 tgagaagatt gatcagagaa gaaggaaaat caggaaaatg gtgctgtcct gaaaatccaa 1440 gggaagagat gttccaaaga ggagaaaact gatcagttgt cagctagcgt caattgggat 1500 gaaaatggac cattggacag agggatgtag tgggtcatgg gtgaatagat aagagcagct 1560 tctatagaat ggcagg ggca aaattctcat ctgatcggca tgggttctaa agaaaacggg 1620 aagaaaaaat tgagtgcatg accagtccct tcaagtagag aggtggaaaa gggaaggagg 1680 aaaatgaggc cacgacaaca tgagagaaat gacagcattt ttaaaaattt tttattttat 1740 tttatttatt tatttttgct ttttagggct gcccctgcaa catatggagg ttcccaggtt 1800 aggggtctaa tcagagctat agctgccagc ctacaccaca gccatagcaa tgccagatct 1860 acatgaccta caccacagct cacagcaacg ccggatcctt aacccactga gtgaggccag 1920 agatcaaacc catatcctta tggatactag tcaggttcat taccactgag ccaaaatggg 1980 aaatcctgag taatgacagc attttttaat gtgccaggaa gcaaaacttg ccaccccgaa 2040 atgtctctca ggcatgtgga ttattttgag ctgaaaacga ttaaggccca aaaaacacaa 2100 gaagaaatgt ggaccttccc ccaacagcct aaaaaattta gattgagggc ctgttcccag 2160 aatagagcta ttgccagact tgtctacaga ggctaagggc taggtgtggt ggggaaaccc 2220 tcagagatca gagggacgtt tatgtaccaa gcattgacat ttccatctcc atgcgaatgg 2280 ccttcttccc ctctgtagcc ccaaaccacc acccccaaaa tcttcttctg tctttagctg 2340 aagatggtgt tgaaggtgat agtttcagcc actttggcga gttcctcagt tgttctgggt 2400 ctttcctcct gatccacatt a ttcgactgt gtttgatttt ctcctgttta tctgtctcat 2460 tggcacccat ttcattctta gaccagccca aagaacctag aagagtgaag gaaaatttct 2520 tccaccctga caaatgctaa atgagaatca ccgcagtaga ggaaaatgat ctggtgctgc 2580 gggagataga agagaaaatc gctggagaga tgtcactgag taggtgagat gggaaagggg 2640 tgacacaggt ggaggtgttg ccctcagcta ggaagacaga cagttcacag aagagaagcg 2700 ggtgtccgtg gacatcttgc ctcatggatg aggaaaccga ggctaagaaa gactgcaaaa 2760 gaaaggtaag gattgcagag aggtcgatcc atgactaaaa tcacagtaac caaccccaaa 2820 ccaccatgtt ttctcctagt ctggcacgtg gcaggtactg tgtaggtttt caatattatt 2880 ggtttgtaac agtacctatt aggcctccat cccctcctct aatactaaca aaagtgtgag 2940 actggtcagt gaaaaatggt cttctttctc tatgaatctt tctcaagaag atacataact 3000 ttttatttta tcataggctt gaagagcaaa tgagaaacag cctccaacct atgacaccgt 3060 aacaaaatgt ttatgatcag tgaagggcaa gaaacaaaac atacacagta aagaccctcc 3120 ataatattgt gggtggccca acacaggcca ggttgtaaaa gctttttatt ctttgataga 3180 ggaatggata gtaatgtttc aacctggaca gagatcatgt tcactgaatc cttccaaaaa 3240 ttcatgggta gtttgaatta taaggaa aat aagacttagg ataaatactt tgtccaagat 3300 cccagagtta atgccaaaat cagttttcag actccaggca gcctgatcaa gagcctaaac 3360 tttaaagaca cagtccctta ataactacta ttcacagttg cactttcagg gcgcaaagac 3420 tcattgaatc ctacaataga atgagtttag atatcaaatc tctcagtaat agatgaggag 3480 actaaatagc gggcatgacc tggtcactta aagacagaat tgagattcaa ggctagtgtt 3540 ctttctacct gttttgtttc tacaagatgt agcaatgcgc taattacaga cctctcaggg 3600 aaggaattca caaccctcag caaaaaccaa agacaaatct aagacaacta agagtgttgg 3660 tttaatttgg aaaaataact cactaaccaa acgcccctct tagcacccca atgtcttcca 3720 ccatcacagt gctcaggcct caaccatgcc ccaatcacc 3759 <210> 20 <211> 9010 <212> DNA <213> Sus scrofa <400> 20 ctcaaacgta agtggctttt tccgactgat tctttgctgt ttctaattgt tggttggctt 60 tttgtccatt tttcagtgtt ttcatcgaat tagttgtcag ggaccaaaca aattgccttc 120 ccagattagg taccagggag gggacattgc tgcatgggag accagagggt ggctaatttt 180 taacgtttcc aagccaaaat aactggggaa gggggcttgc tgtcctgtga gggtaggttt 240 ttatagaagt ggaagttaag gggaaatcgc tatggttcac ttttggctcg gggaccaaag 300 tggagccc aa aattgagtac attttccatc aattatttgt gagatttttg tcctgttgtg 360 tcatttgtgc aagtttttga cattttggtt gaatgagcca ttcccaggga cccaaaagga 420 tgagaccgaa aagtagaaaa gagccaactt ttaagctgag cagacagacc gaattgttga 480 gtttgtgagg agagtagggt ttgtagggag aaaggggaac agatcgctgg ctttttctct 540 gaattagcct ttctcatggg actggcttca gagggggttt ttgatgaggg aagtgttcta 600 gagccttaac tgtgggttgt gttcggtagc gggaccaagc tggaaatcaa acgtaagtgc 660 acttttctac tcctttttct ttcttatacg ggtgtgaaat tggggacttt tcatgtttgg 720 agtatgagtt gaggtcagtt ctgaagagag tgggactcat ccaaaaatct gaggagtaag 780 ggtcagaaca gagttgtctc atggaagaac aaagacctag ttagttgatg aggcagctaa 840 atgagtcagt tgacttggga tccaaatggc cagacttcgt ctgtaaccaa caatctaatg 900 agatgtagca gcaaaaagag atttccattg aggggaaagt aaaattgtta atattgtgga 960 tcacctttgg tgaagggaca tccgtggaga ttgaacgtaa gtattttttc tctactacct 1020 tctgaaattt gtctaaatgc cagtgttgac ttttagaggc ttaagtgtca gttttgtgaa 1080 aaatgggtaa acaagagcat ttcatattta ttatcagttt caaaagttaa actcagctcc 1140 aaaaatgaat ttgtagacaa aaa gattaat ttaagccaaa ttgaatgatt caaaggaaaa 1200 aaaaattagt gtagatgaaa aaggaattct tacagctcca aagagcaaaa gcgaattaat 1260 tttctttgaa ctttgccaaa tcttgtaaat gatttttgtt ctttacaatt taaaaaggtt 1320 agagaaatgt atttcttagt ctgttttctc tcttctgtct gataaattat tatatgagat 1380 aaaaatgaaa attaatagga tgtgctaaaa aatcagtaag aagttagaaa aatatatgtt 1440 tatgttaaag ttgccactta attgagaatc agaagcaatg ttatttttaa agtctaaaat 1500 gagagataaa ctgtcaatac ttaaattctg cagagattct atatcttgac agatatctcc 1560 tttttcaaaa atccaatttc tatggtagac taaatttgaa atgatcttcc tcataatgga 1620 gggaaaagat ggactgaccc caaaagctca gatttaagaa aacctgttta aggaaagaaa 1680 ataaaagaac tgcatttttt aaaggcccat gaatttgtag aaaaatagga aatattttaa 1740 taagtgtatt cttttatttt cctgttatta cttgatggtg tttttatacc gccaaggagg 1800 ccgtggcacc gtcagtgtga tctgtagacc ccatggcggc cttttttcgc gattgaatga 1860 ccttggcggt gggtccccag ggctctggtg gcagcgcacc agccgctaaa agccgctaaa 1920 aactgccgct aaaggccaca gcaaccccgc gaccgcccgt tcaactgtgc tgacacagtg 1980 atacagataa tgtcgctaac agaggagaa t agaaatatga cgggcacacg ctaatgtggg 2040 gaaaagaggg agaagcctga tttttatttt ttagagattc tagagataaa attcccagta 2100 ttatatcctt ttaataaaaa atttctatta ggagattata aagaatttaa agctattttt 2160 ttaagtgggg tgtaattctt tcagtagtct cttgtcaaat ggatttaagt aatagaggct 2220 taatccaaat gagagaaata gacgcataac cctttcaagg caaaagctac aagagcaaaa 2280 attgaacaca gcagccagcc atctagccac tcagattttg atcagtttta ctgagtttga 2340 agtaaatatc atgaaggtat aattgctgat aaaaaaataa gatacaggtg tgacacatct 2400 ttaagtttca gaaatttaat ggcttcagta ggattatatt tcacgtatac aaagtatcta 2460 agcagataaa aatgccatta atggaaactt aatagaaata tatttttaaa ttccttcatt 2520 ctgtgacaga aattttctaa tctgggtctt ttaatcacct accctttgaa agagtttagt 2580 aatttgctat ttgccatcgc tgtttactcc agctaatttc aaaagtgata cttgagaaag 2640 attatttttg gtttgcaacc acctggcagg actattttag ggccatttta aaactctttt 2700 caaactaagt attttaaact gttctaaacc atttagggcc ttttaaaaat cttttcatga 2760 atttcaaact tcgttaaaag ttattaaggt gtctggcaag aacttcctta tcaaatatgc 2820 taatagttta atctgttaat gcaggatata aaat taaagt gatcaaggct tgacccaaac 2880 aggagtatct tcatagcata tttcccctcc tttttttcta gaattcatat gattttgctg 2940 ccaaggctat tttatataat ctctggaaaa aaaatagtaa tgaaggttaa aagagaagaa 3000 aatatcagaa cattaagaat tcggtatttt actaactgct tggttaacat gaaggttttt 3060 attttattaa ggtttctatc tttataaaaa tctgttccct tttctgctga tttctccaag 3120 caaaagattc ttgatttgtt ttttaactct tactctccca cccaagggcc tgaatgccca 3180 caaaggggac ttccaggagg ccatctggca gctgctcacc gtcagaagtg aagccagcca 3240 gttcctcctg ggcaggtggc caaaattaca gttgacccct cctggtctgg ctgaaccttg 3300 ccccatatgg tgacagccat ctggccaggg cccaggtctc cctctgaagc ctttgggagg 3360 agagggagag tggctggccc gatcacagat gcggaagggg ctgactcctc aaccggggtg 3420 cagactctgc agggtgggtc tgggcccaac acacccaaag cacgcccagg aaggaaaggc 3480 agcttggtat cactgcccag agctaggaga ggcaccggga aaatgatctg tccaagaccc 3540 gttcttgctt ctaaactccg agggggtcag atgaagtggt tttgtttctt ggcctgaagc 3600 atcgtgttcc ctgcaagaag cggggaacac agaggaagga gagaaaagat gaactgaaca 3660 aagcatgcaa ggcaaaaaag ggggtctagc cgcggtctag gaagctttct agggtacctc 3720 tagggatccc ggcgcgccct accgggtagg ggaggcgctt ttcccaaggc agtctggagc 3780 atgcgcttta gcagccccgc tgggcacttg gcgctacaca agtggcctct ggcctcgcac 3840 acattccaca tccaccggta ggcgccaacc ggctccgttc tttggtggcc ccttcgcgcc 3900 accttctact cctcccctag tcaggaagtt cccccccgcc ccgcagctcg cgtcgtgcag 3960 gacgtgacaa atggaagtag cacgtctcac tagtctcgtg cagatggaca gcaccgctga 4020 gcaatggaag cgggtaggcc tttggggcag cggccaatag cagctttggc tccttcgctt 4080 tctgggctca gaggctggga aggggtgggt ccgggggcgg gctcaggggc gggctcaggg 4140 gcggggcggg cgcccgaagg tcctccggaa gcccggcatt ctgcacgctt caaaagcgca 4200 cgtctgccgc gctgttctcc tcttcctcat ctccgggcct ttcgacctgc agccaatatg 4260 ggatcggcca ttgaacaaga tggattgcac gcaggttctc cggccgcttg ggtggagagg 4320 ctattcggct atgactgggc acaacagaca atcggctgct ctgatgccgc cgtgttccgg 4380 ctgtcagcgc aggggcgccc ggttcttttt gtcaagaccg acctgtccgg tgccctgaat 4440 gaactgcagg acgaggcagc gcggctatcg tggctggcca cgacgggcgt tccttgcgca 4500 gctgtgctcg acgttgtcac tgaagcggga agggactggc tgcta ttggg cgaagtgccg 4560 gggcaggatc tcctgtcatc tcaccttgct cctgccgaga aagtatccat catggctgat 4620 gcaatgcggc ggctgcatac gcttgatccg gctacctgcc cattcgacca ccaagcgaaa 4680 catcgcatcg agcgagcacg tactcggatg gaagccggtc ttgtcaatca ggatgatctg 4740 gacgaagagc atcaggggct cgcgccagcc gaactgttcg ccaggctcaa ggcgcgcatg 4800 cccgacggcg aggatctcgt cgtgacccat ggcgatgcct gcttgccgaa tatcatggtg 4860 gaaaatggcc gcttttctgg attcatcgac tgtggccggc tgggtgtggc ggatcgctat 4920 caggacatag cgttggctac ccgtgatatt gctgaagagc ttggcggcga atgggctgac 4980 cgcttcctcg tgctttacgg tatcgccgct cccgattcgc agcgcatcgc cttctatcgc 5040 cttcttgacg agttcttctg aggggatcaa ttctctagag ctcgctgatc agcctcgact 5100 gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg 5160 gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg 5220 agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg 5280 gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggcttctga ggcggaaaga 5340 accagctggg ggcgcgcccc tcgagcggcc gccagtgtga tggatatctg cagaattcgc 5400 ccttggatca aacacgcatc ctcatggaca atatgttggg ttcttagcct gctgagacac 5460 aacaggaact cccctggcac cactttagag gccagagaaa cagcacagat aaaattccct 5520 gccctcatga agcttatagt ctagctgggg agatatcata ggcaagataa acacatacaa 5580 atacatcatc ttaggtaata atatatacta aggagaaaat tacaggggag aaagaggaca 5640 ggaattgcta gggtaggatt ataagttcag atagttcatc aggaacactg ttgctgagaa 5700 gataacattt aggtaaagac cgaagtagta aggaaatgga ccgtgtgcct aagtgggtaa 5760 gaccattcta ggcagcagga acagcgatga aagcactgag gtgggtgttc actgcacaga 5820 gttgttcact gcacagagtt gtgtggggag gggtaggtct tgcaggctct tatggtcaca 5880 ggaagaattg ttttactccc accgagatga aggttggtgg attttgagca gaagaataat 5940 tctgcctggt ttatatataa caggatttcc ctgggtgctc tgatgagaat aatctgtcag 6000 gggtgggata gggagagata tggcaatagg agccttggct aggagcccac gacaataatt 6060 ccaagtgaga ggtggtgctg cattgaaagc aggactaaca agacctgctg acagtgtgga 6120 tgtagaaaaa gatagaggag acgaaggtgc atctagggtt ttctgcctga ggaattagaa 6180 agataaagct aaagcttata gaagatgcag cgctctgggg agaaagacca gcagct cagt 6240 tttgatccat ctggaattaa ttttggcata aagtatgagg tatgtgggtt aacattattt 6300 gttttttttt tttccatgta gctatccaac tgtcccagca tcatttattt taaaagactt 6360 tcctttcccc tattggattg ttttggcacc ttcactgaag atcaactgag cataaaattg 6420 ggtctatttc taagctcttg attccattcc atgacctatt tgttcatctt taccccagta 6480 gacactgcct tgatgattaa agcccctgtt accatgtctg ttttggacat ggtaaatctg 6540 agatgcctat tagccaacca agcaagcacg gcccttagag agctagatat gagagcctgg 6600 aattcagacg agaaaggtca gtcctagaga catacatgta gtgccatcac catgcggatg 6660 gtgttaaaag ccatcagact gcaacagact gtgagagggt accaagctag agagcatgga 6720 tagagaaacc caagcactga gctgggaggt gctcctacat taagagatta gtgagatgaa 6780 ggactgagaa gattgatcag agaagaagga aaatcaggaa aatggtgctg tcctgaaaat 6840 ccaagggaag agatgttcca aagaggagaa aactgatcag ttgtcagcta gcgtcaattg 6900 ggatgaaaat ggaccattgg acagagggat gtagtgggtc atgggtgaat agataagagc 6960 agcttctata gaatggcagg ggcaaaattc tcatctgatc ggcatgggtt ctaaagaaaa 7020 cgggaagaaa aaattgagtg catgaccagt cccttcaagt agagaggtgg aaaagggaag 7 080 gaggaaaatg aggccacgac aacatgagag aaatgacagc atttttaaaa attttttatt 7140 ttattttatt tatttatttt tgctttttag ggctgcccct gcaacatatg gaggttccca 7200 ggttaggggt ctaatcagag ctatagctgc cagcctacac cacagccata gcaatgccag 7260 atctacatga cctacaccac agctcacagc aacgccggat ccttaaccca ctgagtgagg 7320 ccagagatca aacccatatc cttatggata ctagtcaggt tcattaccac tgagccaaaa 7380 tgggaaatcc tgagtaatga cagcattttt taatgtgcca ggaagcaaaa cttgccaccc 7440 cgaaatgtct ctcaggcatg tggattattt tgagctgaaa acgattaagg cccaaaaaac 7500 acaagaagaa atgtggacct tcccccaaca gcctaaaaaa tttagattga gggcctgttc 7560 ccagaataga gctattgcca gacttgtcta cagaggctaa gggctaggtg tggtggggaa 7620 accctcagag atcagaggga cgtttatgta ccaagcattg acatttccat ctccatgcga 7680 atggccttct tcccctctgt agccccaaac caccaccccc aaaatcttct tctgtcttta 7740 gctgaagatg gtgttgaagg tgatagtttc agccactttg gcgagttcct cagttgttct 7800 gggtctttcc tcctgatcca cattattcga ctgtgtttga ttttctcctg tttatctgtc 7860 tcattggcac ccatttcatt cttagaccag cccaaagaac ctagaagagt gaaggaaaat 7920 tt cttccacc ctgacaaatg ctaaatgaga atcaccgcag tagaggaaaa tgatctggtg 7980 ctgcgggaga tagaagagaa aatcgctgga gagatgtcac tgagtaggtg agatgggaaa 8040 ggggtgacac aggtggaggt gttgccctca gctaggaaga cagacagttc acagaagaga 8100 agcgggtgtc cgtggacatc ttgcctcatg gatgaggaaa ccgaggctaa gaaagactgc 8160 aaaagaaagg taaggattgc agagaggtcg atccatgact aaaatcacag taaccaaccc 8220 caaaccacca tgttttctcc tagtctggca cgtggcaggt actgtgtagg ttttcaatat 8280 tattggtttg taacagtacc tattaggcct ccatcccctc ctctaatact aacaaaagtg 8340 tgagactggt cagtgaaaaa tggtcttctt tctctatgaa tctttctcaa gaagatacat 8400 aactttttat tttatcatag gcttgaagag caaatgagaa acagcctcca acctatgaca 8460 ccgtaacaaa atgtttatga tcagtgaagg gcaagaaaca aaacatacac agtaaagacc 8520 ctccataata ttgtgggtgg cccaacacag gccaggttgt aaaagctttt tattctttga 8580 tagaggaatg gatagtaatg tttcaacctg gacagagatc atgttcactg aatccttcca 8640 aaaattcatg ggtagtttga attataagga aaataagact taggataaat actttgtcca 8700 agatcccaga gttaatgcca aaatcagttt tcagactcca ggcagcctga tcaagagcct 8760 aaacttta aa gacacagtcc cttaataact actattcaca gttgcacttt cagggcgcaa 8820 agactcattg aatcctacaa tagaatgagt ttagatatca aatctctcag taatagatga 8880 ggagactaaa tagcgggcat gacctggtca cttaaagaca gaattgagat tcaaggctag 8940 tgttctttct acctgttttg tttctacaag atgtagcaat gcgctaatta cagacctctc 9000 agggaaggaa 9010 <210> 21 <211> 21 <212> DNA <213> Sus scrofa <400> 21 cgaacccctg tgtatatagt t 21 <210> 22 <211> 21 <212> DNA <213> Sus scrofa <400> 22 gagatgagga agaggagaac a 21 <210> 23 <211> 23 <212> DNA <213> Sus scrofa <400> 23 gcattgtctg agtaggtgtc att 23 <210> 24 <211> 22 <212> DNA <213> Sus scrofa <400> 24 cgcttcttgc agggaacacg at 22 <210> 25 <211> 6772 <212> DNA <213> Sus scrofa <400> 25 gcacatggta ggcaaaggac tttgcttctc ccagcacatc tttctgcaga gatccatgga 60 aacaagactc aactccaaag cagcaaagaa gcagcaagtt ctcaagtgat ctcctctgac 120 tccctcctcc caggctaatg aagccatgtt gcccctgggg gattaagggc aggtgtccat 180 tgtggcaccc agcccgaaga caagcaattt gatcaggttc tgagcactcc tgaatgtgga 240 ctctggaatt ttctcctcac cttgtggcat atcagcttaa gt caagtaca agtgacaaac 300 aacataatcc taagaagaga ggaatcaagc tgaagtcaaa ggatcactgc cttggattct 360 actgtgaatg atgacctgga aaatatcctg aacaacagct tcagggtgat catcagagac 420 aaaagttcca gagccaggta gggaaaccct caagccttgc aaagagcaaa atcatgccat 480 tgggttctta acctgctgag tgatttacta tatgttactg tgggaggcaa agcgctcaaa 540 tagcctgggt aagtatgtca aataaaaagc aaaagtggtg tttcttgaaa tgttagacct 600 gaggaaggaa tattgataac ttaccaataa ttttcagaat gatttataga tgtgcactta 660 gtcagtgtct ctccaccccg cacctgacaa gcagtttaga atttattcta agaatctagg 720 tttgctgggg gctacatggg aatcagcttc agtgaagagt ttgttggaat gattcactaa 780 attttctatt tccagcataa atccaagaac ctctcagact agtttattga cactgctttt 840 cctccataat ccatctcatc tccgtccatc atggacactt tgtagaatga caggtcctgg 900 cagagactca cagatgcttc tgaaacatcc tttgccttca aagaatgaac agcacacata 960 ctaaggatct cagtgatcca caaattagtt tttgccacaa tggttcttat gataaaagtc 1020 tttcattaac agcaaattgt tttataatag ttgttctgct ttataataat tgcatgcttc 1080 actttctttt cttttctttt tttttctttt tttgcttttt agtgccgcag gtgcagcat a 1140 tgaaatttcc caggctaggg gtcaaatcag aactacacct actggcctac gccacagcca 1200 cagcaactca ggatctaagc catgtcggtg acctacacta cagctcatgg caatgccaga 1260 tccttaaccc aatgagcgag gccagggatc gaacccatgt cctcatggat actagtcagg 1320 ctcattatcc gctgagccat aacaggaact cccgagtttg ctttttatca aaattggtac 1380 agccttattg tttctgaaaa ccacaaaatg aatgtattca cataatttta aaaggttaaa 1440 taatttatga tatacaagac aatagaaaga gaaaacgtca ttgcctcttt cttccacgac 1500 aacacgcctc cttaattgat ttgaagaaat aactactgag catggtttag tgtacttctt 1560 tcagcaatta gcctgtattc atagccatac atattcaatt aaaatgagat catgatatca 1620 cacaatacat accatacagc ctatagggat ttttacaatc atcttccaca tgactacata 1680 aaaacctacc taaaaaaaaa aaaaacccta cttcatcctc ctattggctg ctttgtgctc 1740 cattaaaaag ctctatcata attaggttat gatgaggatt tccattttct acctttcaag 1800 caacatttca atgcacagtc ttatatacac atttgagcct acttttcttt ttctttcttt 1860 ttttggtttt tttttttttt ttttttttgg tctttttgtc ttttctaagg ctgcatatgg 1920 aggttcccag gctagctgtc taatcagaac tatagctgct ggcctacgcc acatccacag 1980 caatacaaga tctgagccat gtctgcaact tacaccacag ctcacagcaa cggtggatcc 2040 ttaaaccact gagcaaggcc agggatcaaa cccataactt catggctcct agttggattt 2100 gttaaccact gagccatgat ggcaactcct gagcctactt ttctaatcat ttccaaccct 2160 aggacacttt tttaagtttc atttttctcc ccccaccccc tgttttctga agtgtgtttg 2220 cttccactgg gtgacttcac tcccaggatc tcatctgcag gatactgcag ctaagtgtat 2280 gagctctgaa tttgaatccc aactctgcca ctcaaaggga taggagtttc cgatgtggcc 2340 caatgggatc agtggcatct ctgcagtgcc aggacgcagg ttccatccct ggcccagcac 2400 agtgggttaa gaatctggca ttgctgcagc tgaggcatag atttcaattg tgcctcagat 2460 ctgatccttg gcccaaggac tgcatatgcc tcagggcaac caaaaaagag aaaagggggg 2520 tgatagcatt agtttctaga tttgggggat aattaaataa agtgatccat gtacaatgta 2580 tggcattttg taaatgctca acaaatttca actattatgg agttcccatc atggctcagt 2640 ggaagggaat ctgattagca tccatgagga cacaggtcca accccgacct tgctcagtgg 2700 gcattgctgt gagctgtggc atgggttaca gacgaagctc ggatctggca ttgctgtggc 2760 tgtggtgtaa gccagcaact acagctctca ttcagcccct agcctgggaa cctccatatg 2820 cctaa aagac aaaaaataaa atttaaatta aaaataaaga aatgttaact attatgattg 2880 gtactgcttg cattactgca aagaaagtca ctttctatac tctttaatat cttagttgac 2940 tgtgtgctca gtgaactatt ttggacactt aatttccact ctcttctatc tccaacttga 3000 caactctctt tcctctcttc tggtgagatc cactgctgac tttgctcttt aaggcaacta 3060 gaaaagtgct cagtgacaaa atcaaagaaa gttaccttaa tcttcagaat tacaatctta 3120 agttctcttg taaagcttac tatttcagtg gttagtatta ttccttggtc ccttacaact 3180 tatcagctct gatctattgc tgattttcaa ctatttattg ttggagtttt ttcctttttt 3240 ccctgttcat tctgcaaatg tttgctgagc atttgtcaag tgaagatact ggactgggcc 3300 ttccaaatat aagacaatga aacatcggga gttctcatta tggtgcagca gaaacgaatc 3360 caactaggaa atgtgaggtt gcaggttcga tccctgccct tgctcagtgg gttaaggatc 3420 cagcattacc gtgagctgtg gtgtaggttg cagacgtggc tcagatcctg cgttgctgtg 3480 gctgtggcat aggctggcag ctctagctct gattcgaccg ctagcctggg aacctccatg 3540 cgccccgagt gcagccctta aaaagcaaaa aaaaaagaaa gaaagaaaaa gacaatgaaa 3600 catcaaacag ctaacaatcc agtagggtag aaagaatctg gcaacagata agagcgatta 3660 aatgttctag gtccagtgac cttgcctctg tgctctacac agtcgtgcca cttgctgagg 3720 gagaaggtct ctcttgagtt gagtcctgaa agacattagt tgttcacaaa ctaatgccag 3780 tgagtgaagg tgtttccaag cagagggaga gtttggtaaa aagctggaag tcacagaaag 3840 actctaaaga gtttaggatg gtgggagcaa catacgctga gatggggctg gaaggttaag 3900 agggaaacaa ctatagtaag tgaagctgga ctcacagcaa agtgaggacc tcagcatcct 3960 tgatggggtt accatggaaa caccaaggca caccttgatt tccaaaacag caggcacctg 4020 attcagccca atgtgacatg gtgggtaccc ctctagctct acctgttctg tgacaactga 4080 caaccaacga agttaagtct ggattttcta ctctgctgat ccttgttttt gtttcacacg 4140 tcatctatag cttcatgcca aaatagagtt caaggtaaga cgcgggcctt ggtttgatat 4200 acatgtagtc tatcttgttt gagacaatat ggtggcaagg aagaggttca aacaggaaaa 4260 tactctctaa ttatgattaa ctgagaaaag ctaaagagtc ccataatgac actgaatgaa 4320 gttcatcatt tgcaaaagcc ttcccccccc cccaggagac tataaaaaag tgcaattttt 4380 taaatgaact tatttacaaa acagaaatag actcacagac ataggaaacg aacagatggt 4440 taccaagggt gaaagggagt aggagggata aataaggagt ctggggttag cagatacacc 4500 ccagtgtaca caaaat aaac aacagggacc tactatatag cacagggaac tatatgcagt 4560 agcttacaat aacctataat ggaaaagaat gtgaaaaaga atatatgtat gcgtgtgtgt 4620 gtaactgaat cactttgctg taacctgaat ctaacataac attgtaaatc aactacagtt 4680 tttttttttt ttaagtgcag ggttttggtg tttttttttt ttcatttttg tttttgtttt 4740 tgttttttgc tttttagggc cacacccaga catatggggg ttcccaggct aggggtctaa 4800 ttagagctac agttgccggc ttgcaccaca gccacagcaa catcagatcc gagccgcact 4860 tgcgacttac accacagctc atggcaatac cagatcctta acccactgag caaggcccag 4920 ggatcgtacc cgcaacctca tggttcctag tcagattcat ttctgctgcg ctacaatggg 4980 aactccaagt gcagtttttt gtaatgtgct tgtctttctt tgtaattcat attcatccta 5040 cttcccaata aataaataaa tacataaata ataaacatac cattgtaaat caactacaat 5100 tttttttaaa tgcagggttt ttgttttttg ttttttgttt tgtctttttg ccttttctag 5160 ggccgctccc atggcatatg gaggttccca ggctaggggt cgaatcggag ctgtagccac 5220 cggcctacgc cagagccaca gcaacgcggg atccgagccg cgtctgcaac ctacaccaca 5280 gctcacggca acgccggatc gttaacccac tgagcaaggg cagggatcga acctgcaacc 5340 tcatggttcc tagtcagatt c gttaactac tgagccacaa cggaaactcc taaagtgcag 5400 tttttaaatg tgcttgtctt tctttgtaat ttacactcaa cctacttccc aataaataaa 5460 taaataaaca aataaatcat agacatggtt gaattctaaa ggaagggacc atcaggcctt 5520 agacagaaat acgtcatctt ctagtatttt aaaacacact aaagaagaca aacatgctct 5580 gccagagaag cccagggcct ccacagctgc ttgcaaaggg agttaggctt cagtagctga 5640 cccaaggctc tgttcctctt cagggaaaag ggtttttgtt cagtgagaca gcagacagct 5700 gtcactgtgg tggacgttcg gccaaggaac caagctggaa ctcaaacgta agtcaatcca 5760 aacgttcctt ccttggctgt ctgtgtctta cggtctctgt ggctctgaaa tgattcatgt 5820 gctgactctc tgaaaccaga ctgacattct ccagggcaaa actaaagcct gtcatcaaac 5880 cggaaaactg agggcacatt ttctgggcag aactaagagt caggcactgg gtgaggaaaa 5940 acttgttaga atgatagttt cagaaactta ctgggaagca aagcccatgt tctgaacaga 6000 gctctgctca agggtcagga ggggaaccag tttttgtaca ggagggaagt tgagacgaac 6060 ccctgtgtat atggtttcgg cgcggggacc aagctggagc tcaaacgtaa gtggcttttt 6120 ccgactgatt ctttgctgtt tctaattgtt ggttggcttt ttgtccattt ttcagtgttt 6180 tcatcgaatt agttgtcagg gaccaaa caa attgccttcc cagattaggt accagggagg 6240 ggacattgct gcatgggaga ccagagggtg gctaattttt aacgtttcca agccaaaata 6300 actggggaag ggggcttgct gtcctgtgag ggtaggtttt tatagaagtg gaagttaagg 6360 ggaaatcgct atggttcact tttggctcgg ggaccaaagt ggagcccaaa attgagtaca 6420 ttttccatca attatttgtg agatttttgt cctgttgtgt catttgtgca agtttttgac 6480 attttggttg aatgagccat tcccagggac ccaaaaggat gagaccgaaa agtagaaaag 6540 agccaacttt taagctgagc agacagaccg aattgttgag tttgtgagga gagtagggtt 6600 tgtagggaga aaggggaaca gatcgctggc tttttctctg aattagcctt tctcatggga 6660 ctggcttcag agggggtttt tgatgaggga agtgttctag agccttaact gtgggttgtg 6720 ttcggtagcg ggaccaagct ggaaatcaaa cgtaagtgca cttttctact cc 6772 <210> 26 <211> 22 <212> DNA <213> Sus scrofa <400> 26 ccttcctcct gcacctgtca ac 22 <210> 27 <211> 22 <212> DNA <213> Sus scrofa <400> 27 tagacacacc agggtggcct tg 22 <210> 28 <211> 5918 <212> DNA <213> Sus scrofa <400> 28 ccttcctcct gcacctgtca actcccaata aaccgtcctc cttgtcattc agaaatcatg 60 ctctccgctc acttgtgtct acccattttc gggct tgcat ggggtcatcc tcgaaggtgg 120 agagagtccc ccttggcctt ggggaagtcg aggggggcgg ggggaggcct gaggcatgtg 180 ccagcgaggg gggtcacctc cacgcccctg aggaccttct agaaccaggg gcgtggggcc 240 accgcctgag tggaaggctg tccacttttc ccccgggccc ccaggctccc tcctccgtgt 300 ggaccttgtc cacctctgac tggcccagcc actcatgcat tgtttccccg aaaccccagg 360 acgatagctc agcacgcgac agtgtccccc tctgagggcc tctgtccatt tcaggacgac 420 ccgcatgtac agcgtgacca ctctgctcac gcccactcac cacgtcctag agccccaccc 480 ccagccccat ccttaggggc acagccagct ccgaccgccc cggggacacc accctctgcc 540 ccttccccag gccctccctg tcacacgcac cacagggccc tccgtcccga gaccctgctc 600 cctcatccct cggtcccctc aggtagcctt ccacccgcgt gtgtcccgag gtcccagatg 660 cagcaaggcc cctgggacaa cgccagatct ctgctctccc cgacccctca gaagccagcc 720 cacgcctggc cccaccacca ctgcctaacg tccaagtgtc cataggcctc gggacctcca 780 agtccaggtt ctgcctctgg gattccgcca tgggtctgcc tgggaaatga tgcacttgga 840 ggagctcagc atgggatgcg ggaccttgtc tctaggcgct ccctcaggat cccacagctg 900 ccctgtgaga cacacacaca cacacacaca cacacacaca cacacacaca cac acaaaca 960 cgcatgcacg cacgccggca cacacgctat tgcagagatg gccacggtag ctgtgcctcg 1020 aggccgagtg gagtgtctag aactctcggg ggtcccctct gcagacgaca ctgctccatc 1080 ccccccgtgc cctgaagggc tcctcactct cccatcagga tctctccaag ctgctgacct 1140 ggagaggaag gggcctggga caggcgggga cactcagacc tccctgctgc ccctcctctg 1200 cctgggcttg gacggctccc cccttcccac gggtgaaggt gcaggtgggg agagggcacc 1260 cccctcagcc tcccagaccc agaccagccc ccgtggcagg ggcagcctgt gagcctccag 1320 ccagatgcag gtggcctggg gtggggggtg gagggggcgg gaggtttatg tttgaggctg 1380 tatcactgtg taatattttc ggcggtggga cccatctgac cgtcctcggt gagtctcccc 1440 ttttctctcc tccttgggga tccgagtgaa atctgggtcg atcttctctc cgttctcctc 1500 cgactggggc tgaggtctga acctcggtgg ggtccgaaga ggaggcccct aggccaggct 1560 cctcagcccc tccagcccga ccggccctct tgacacaggg tccagctaag ggcagacatg 1620 gaggctgcta gtccagggcc aggctctgag acccaagggc gctgcccaag gaacccttgc 1680 cccagggacc ctgggagcaa agctcctcac tcagagcctg cagccctggg gtctgaggac 1740 aaggagggac tgaggactgg gcgtggggag ttcaggcggg gacaccaggt ccagggaggt 1800 gacaaaggcg ctgggagggg gcggacggtg ccggggactc ctcctgggcc ctgtgggctc 1860 ggggtccttg tgaggaccct gagggactga ggggcccctg ggcctaggga cttgcagtga 1920 gggaggcagg gagtgtccct tgagaacgtg gcctccgcgg gctgggtccc cctcgtgctc 1980 ccagccggga ggacacccca gagcaagcgc cccaggtggg cggggagggt ctcctcacag 2040 gggcagctga cagatagagg cccccgccag gcagatgctt gatcctggca gttatactgg 2100 gttcgcacaa ctttccctga acaaggggcc ctccgaacag acacagacgc aacccagtcg 2160 acccaggctc agcacagaaa atgcactgac acccaaaacc ctcatctggg ggcctggccg 2220 gcatcccgcc ccaggaccca aggcccctgc cccctggcag ccctggacac ggtcctctgt 2280 gggcggtggg gtcggggctg tggtgacggt ggcatcgggg agcctgtgcc ccctccctga 2340 aagggcggag aggctcaaga ggggacagaa atgtcctccc ctaggaagac ctcggacggg 2400 ggcggggggg tggtctccga cagacagatg cccgggaccg acagacctgc cgagggaaga 2460 gggcacctcg gtcgggttag gctccaggca gcacgaggga gcgaggctgg gagggtgagg 2520 acatgggagc ctgaggagga gctggagact tcagcaggcc cccagctccg ggcttcgggc 2580 tctgagatgc tcggacgcaa ggtgagtgac cccacctgtg gctgacctga cctcaggggg 2640 acaaggctca gcctgggact ctgtgtcccc atcgcctgca caggggattc ccctgatgga 2700 cactgagcca acgacctccc gtctctcccc gacccccagg tcagcccaag gccactccca 2760 cggtcaacct cttcccgccc tcctctgagg agctcggcac caacaaggcc accctggtgt 2820 gtctaataag tgacttctac ccgggcgccg tgacggtgac ctggaaggca ggcggcacca 2880 ccgtcaccca gggcgtggag accaccaagc cctcgaaaca gagcaacaac aagtacgcgg 2940 ccagcagcta cctggccctg tccgccagtg actggaaatc ttccagcggc ttcacctgcc 3000 aggtcaccca cgaggggacc attgtggaga agacagtgac gccctccgag tgcgcctagg 3060 tccctgggcc cccaccctca ggggcctgga gccacaggac ccccgcgagg gtctccccgc 3120 gaccctggtc cagcccagcc cttcctcctg cacctgtcaa ctcccaataa accgtcctcc 3180 ttgtcattca gaaatcatgc tctccgctca cttgtgtcta cccattttcg ggcttgcatg 3240 gggtcatcct cgaaggtgga gagagtcccc cttggccttg gggaaatcga ggggggcggg 3300 gggaggcctg aggcatgtgc cagcgagggg ggtcacctcc acgcccctga ggaccttcta 3360 gaaccagggg cgtggggcca ccgccagagt ggaaggctgt ccacttttcc cccgggcccc 3420 caggctccct cctccgtgtg gaccttgtcc acctctgact ggcccagcca ctcatgcatt 3480 gtttcc ccga aaccccagga cgatagctca gcacgcgaca gtgtccccct ctgagggcct 3540 ctgtccattt caggacgacc cgcatgtaca gcgtgaccac tctgctcacg cccactcacc 3600 acgtcctaga gccccacccc cagccccatc cttaggggca cagccagctc cgaccgcccc 3660 ggggacacca ccctctgccc cttccccagg ccctccctgt cacacgcacc acagggccct 3720 ccgtcccgag accctgctcc ctcatccctc ggtcccctca ggtagccttc cacccgcgtg 3780 tgtcccgagg tcccagatgc agcaaggccc ctgggacaac gccagatctc tgctctcccc 3840 gaccctcaga agccagccca cgcctggccc accaccactg cctaacgtcc aagtgtccat 3900 aggctcggga cctccaagtc caggttctgc ctctgggatt ccgccatggg tctgcctgga 3960 atgatgcact tggaggagct cagcatggga tgcggaactt gtctagcgct cctcagatcc 4020 acagctgcct gtgagacaca cacacacaca cacacacacc aaacacgcat gcacgcacgc 4080 cggcacacac gctattacag agatggccac ggtagctgtg cctcgaggcc gagtggagtg 4140 tctagaactc tcgggggtcc cctctgcaga cgacactgct ccatcccccc cgtgccctga 4200 agggctcctc actctcccat caggatctct ccaagctgct gacctggaga ggaaggggcc 4260 tgggacaggc ggggacactc agacctccct gctgcccctc ctctgcctgg gcttggacgg 4320 ctcccccctt c ccacgggtg aaggtgcagg tggggagagg gcacccccct caccctccca 4380 gacccagacc agcccccgtg gcaggggcag cctgtgagcc tccagccaga tgcaggtggc 4440 ctggggtggg gggtggaggg ggcgggaggt ttatgtttga ggctgtattc atctgtgtaa 4500 tattttcggc ggtgggaccc atctgaccgt cctcggtgag tctccccttt tctttcctcc 4560 ttggggatcc gagtgaaatc tgggtcgatc ttctctccgt tctcctccga ctggggctga 4620 ggtctgaacc tcggtggggt ccgaagagga ggcccctagg ccggctcctc agcccctcca 4680 gcccgacccg ccctcttgac acagggtcca gctaagggca gacatggctg ctagtccagg 4740 gccaggctct gagacccaag ggcgctgccc aaggaaccct tgccccaggg accctgggag 4800 caaagctcct cactcagagc ctgcagccct ggggtctgag gacaaggagg gactgaggac 4860 tgggcgtggg gagttcaggc ggggacaccg ggtccaggga ggtgacaaag gcgctgggag 4920 ggggcggacg gtgccggaga ctcctcctgg gccctgtggg ctcgtggtcc ttgtgaggac 4980 cctgagggct gaggggcccc tgggcctagg gacttgcagt gagggaggca gggagtgtcc 5040 cttgagaacg tggcctccgc gggctgggtc cccctcgtgc tcccagcagg gaggacaccc 5100 cagagcaagc gccccaggtg ggcggggagg gtctcctcac aggggcagct gacagataga 5160 cggcccccgc cagacag atg cttgatcctg gtcagtactg ggttcgccac ttccctgaac 5220 aggggccctc cgaacagaca cagacgcaga ccaggctcag cacagaaaat gcactgacac 5280 ccaaaaccct catctggggg cctggccggc atcccgcccc aggacccaag gcccctgccc 5340 cctggcagcc ctggacacgg tcctctgtgg gcggtggggt cggggctgtg gtgacggtgg 5400 catcggggag cctgtgcccc ctccctgaaa gggcggagag gctcaagagg ggacagaaat 5460 gtcctcccct aggaagacct cggacggggg cgggggggtg gtctccgaca gacagatgcc 5520 cgggaccgac agacctgccg agggaagagg gcacctcggt cgggttaggc tccaggcagc 5580 acgagggagc gaggctggga gggtgaggac atgggagcct gaggaggagc tggagacttc 5640 agcaggcccc cagctccggg cttcgggctc tgagatgctc ggacgcaagg tgagtgaccc 5700 cacctgtggc tgacctgacc tgacctcagg gggacaaggc tcagcctggg actctgtgtc 5760 cccatcgcct gcacagggga ttcccctgat ggacactgag ccaacgacct cccgtctctc 5820 cccgaccccc aggtcagccc aaggccactc ccacggtcaa cctcttcccg ccctcctctg 5880 aggagctcgg caccaacaag gccaccctgg tgtgtcta 5918 <210> 29 <211> 11051 <212> DNA <213> Sus scrofa <400> 29 tctagaagac gctggagaga ggccagactt cctcggaaca gctcaaagag ctctgtc aaa 60 gccagatccc atcacacgtg ggcaccaata ggccatgcca gcctccaagg gccgaactgg 120 gttctccacg gcgcacatga agcctgcagc ctggcttatc ctcttccgtg gtgaagaggc 180 aggcccggga ctggacgagg ggctagcagg gtgtggtagg caccttgcgc cccccacccc 240 ggcaggaacc agagaccctg gggctgagag tgagcctcca aacaggatgc cccacccttc 300 aggccacctt tcaatccagc tacactccac ctgccattct cctctgggca cagggcccag 360 cccctggatc ttggccttgg ctcgacttgc acccacgcgc acacacacac ttcctaacgt 420 gctgtccgct cacccctccc cagcgtggtc catgggcagc acggcagtgc gcgtccggcg 480 gtagtgagtg cagaggtccc ttcccctccc ccaggagccc caggggtgtg tgcagatctg 540 ggggctcctg tcccttacac cttcatgccc ctcccctcat acccaccctc caggcgggag 600 gcagcgagac ctttgcccag ggactcagcc aacgggcaca cgggaggcca gccctcagca 660 gctggctccc aaagaggagg tgggaggtag gtccacagct gccacagaga gaaaccctga 720 cggaccccac aggggccacg ccagccggaa ccagctccct cgtgggtgag caatggccag 780 ggccccgccg gccaccacgg ctggccttgc gccagctgag aactcacgtc cagtgcaggg 840 agactcaaga cagcctgtgc acacagcctc ggatctgctc ccatttcaag cagaaaaagg 900 aaaccgtgca gg cagccctc agcatttcaa ggattgtagc agcggccaac tattcgtcgg 960 cagtggccga ttagaatgac cgtggagaag ggcggaaggg tctctcgtgg gctctgcggc 1020 caacaggccc tggctccacc tgcccgctgc cagcccgagg ggcttgggcc gagccaggaa 1080 ccacagtgct caccgggacc acagtgactg accaaactcc cggccagagc agccccaggc 1140 cagccgggct ctcgccctgg aggactcacc atcagatgca caagggggcg agtgtggaag 1200 agacgtgtcg cccgggccat ttgggaaggc gaagggacct tccaggtgga caggaggtgg 1260 gacgcactcc aggcaaggga ctgggtcccc aaggcctggg gaaggggtac tggcttgggg 1320 gttagcctgg ccagggaacg gggagcgggg cggggggctg agcagggagg acctgacctc 1380 gtgggagcga ggcaagtcag gcttcaggca gcagccgcac atcccagacc aggaggctga 1440 ggcaggaggg gcttgcagcg gggcgggggc ctgcctggct ccgggggctc ctgggggacg 1500 ctggctcttg tttccgtgtc ccgcagcaca gggccagctc gctgggccta tgcttacctt 1560 gatgtctggg gccggggcgt cagggtcgtc gtctcctcag gggagagtcc cctgaggcta 1620 cgctgggggg ggactatggc agctccacca ggggcctggg gaccaggggc ctggaccagg 1680 ctgcagcccg gaggacgggc agggctctgg ctctccagca tctggccctc ggaaatggca 1740 gaacccctgg cgggtgagc g agctgagagc gggtcagaca gacaggggcc ggccggaaag 1800 gagaagttgg gggcagagcc cgccaggggc caggcccaag gttctgtgtg ccagggcctg 1860 ggtgggcaca ttggtgtggc catggctact tagattcgtg gggccagggc atcctggtca 1920 ccgtctcctc aggtgagcct ggtgtctgat gtccagctag gcgctggtgg gccgcgggtg 1980 ggcctgtctc aggctagggc aggggctggg atgtgtattt gtcaaggagg ggcaacaggg 2040 tgcagactgt gcccctggaa acttgaccac tggggcaggg gcgtcctggt cacgtctcct 2100 caggtaagac ggccctgtgc ccctctctcg cgggactgga aaaggaattt tccaagattc 2160 cttggtctgt gtggggccct ctggggcccc cgggggtggc tcccctcctg cccagatggg 2220 gcctcggcct gtggagcacg ggctgggcac acagctcgag tctagggcca cagaggcccg 2280 ggctcagggc tctgtgtggc ccggcgactg gcagggggct cgggtttttg gacaccccct 2340 aatgggggcc acagcactgt gaccatcttc acagctgggg ccgaggagtc gaggtcaccg 2400 tctcctcagg tgagtcctcg tcagccctct ctcactctct ggggggtttt gctgcatttt 2460 gtgggggaaa gaggatgcct gggtctcagg tctaaaggtc tagggccagc gccggggccc 2520 aggaaggggc cgaggggcca ggctcggctc ggccaggagc agagcttcca gacatctcgc 2580 ctcctggcgg ctgcagtcag gcct ttggcc gggggggtct cagcaccacc aggcctcttg 2640 gctcccgagg tccccggccc cggctgcctc accaggcacc gtgcgcggtg ggcccgggct 2700 cttggtcggc caccctttct taactgggat ccgggcttag ttgtcgcaat gtgacaacgg 2760 gctcgaaagc tggggccagg ggaccctagt ctacgacgcc tcgggtgggt gtcccgcacc 2820 cctccccact ttcacggcac tcggcgagac ctggggagtc aggtgttggg gacactttgg 2880 aggtcaggaa cgggagctgg ggagagggct ctgtcagcgg ggtccagaga tgggccgccc 2940 tccaaggacg ccctgcgcgg ggacaagggc ttcttggcct ggcctggccg cttcacttgg 3000 gcgtcagggg gggcttcccg gggcaggcgg tcagtcgagg cgggttggaa ttctgagtct 3060 gggttcgggg ttcggggttc ggccttcatg aacagacagc ccaggcgggc cgttgtttgg 3120 cccctggggg cctggttgga atgcgaggtc tcgggaagtc aggagggagc ctggccagca 3180 gagggttccc agccctgcgg ccgagggacc tggagacggg cagggcattg gccgtcgcag 3240 ggccaggcca caccccccag gtttttgtgg ggcgagcctg gagattgcac cactgtgatt 3300 actatgctat ggatctctgg ggcccaggcg ttgaagtcgt cgtgtcctca ggtaagaacg 3360 gccctccagg gcctttaatt tctgctctcg tctgtgggct tttctgactc tgatcctcgg 3420 gaggcgtctg tgcccccccc ggggatgagg ccggcttgcc aggaggggtc agggaccagg 3480 agcctgtggg aagttctgac gggggctgca ggcgggaagg gccccaccgg ggggcgagcc 3540 ccaggccgct gggcggcagg agacccgtga gagtgcgcct tgaggagggt gtctgcggaa 3600 ccacgaacgc ccgccgggaa gggcttgctg caatgcggtc ttcagacggg aggcgtcttc 3660 tgccctcacc gtctttcaag cccttgtggg tctgaaagag ccatgtcgga gagagaaggg 3720 acaggcctgt cccgacctgg ccgagagcgg gcagccccgg gggagagcgg ggcgatcggc 3780 ctgggctctg tgaggccagg tccaagggag gacgtgtggt cctcgtgaca ggtgcacttg 3840 cgaaacctta gaagacgggg tatgttggaa gcggctcctg atgtttaaga aaagggagac 3900 tgtaaagtga gcagagtcct caagtgtgtt aaggttttaa aggtcaaagt gttttaaacc 3960 tttgtgactg cagttagcaa gcgtgcgggg agtgaatggg gtgccagggt ggccgagagg 4020 cagtacgagg gccgtgccgt cctctaattc agggcttagt tttgcagaat aaagtcggcc 4080 tgttttctaa aagcattggt ggtgctgagc tggtggagga ggccgcgggc agccctggcc 4140 acctgcagca ggtggcagga agcaggtcgg ccaagaggct attttaggaa gccagaaaac 4200 acggtcgatg aatttatagc ttctggtttc caggaggtgg ttgggcatgg ctttgcgcag 4260 cgccacagaa ccgaaagtgc ccactgagaa aaaac aactc ctgcttaatt tgcatttttc 4320 taaaagaaga aacagaggct gacggaaact ggaaagttcc tgttttaact actcgaattg 4380 agttttcggt cttagcttat caactgctca cttagattca ttttcaaagt aaacgtttaa 4440 gagccgaggc attcctatcc tcttctaagg cgttattcct ggaggctcat tcaccgccag 4500 cacctccgct gcctgcaggc attgctgtca ccgtcaccgt gacggcgcgc acgattttca 4560 gttggcccgc ttcccctcgt gattaggaca gacgcgggca ctctggccca gccgtcttgg 4620 ctcagtatct gcaggcgtcc gtctcgggac ggagctcagg ggaagagcgt gactccagtt 4680 gaacgtgata gtcggtgcgt tgagaggaga cccagtcggg tgtcgagtca gaaggggccc 4740 ggggcccgag gccctgggca ggacggcccg tgccctgcat cacgggccca gcgtcctaga 4800 ggcaggactc tggtggagag tgtgagggtg cctggggccc ctccggagct ggggccgtgc 4860 ggtgcaggtt gggctctcgg cgcggtgttg gctgtttctg cgggatttgg aggaattctt 4920 ccagtgatgg gagtcgccag tgaccgggca ccaggctggt aagagggagg ccgccgtcgt 4980 ggccagagca gctgggaggg ttcggtaaaa ggctcgcccg tttcctttaa tgaggacttt 5040 tcctggaggg catttagtct agtcgggacc gttttcgact cgggaagagg gatgcggagg 5100 agggcatgtg cccaggagcc gaaggcgccg cggggagaag cccagggctc tcctgtcccc 5160 acagaggcga cgccactgcc gcagacagac agggcctttc cctctgatga cggcaaaggc 5220 gcctcggctc ttgcggggtg ctggggggga gtcgccccga agccgctcac ccagaggcct 5280 gaggggtgag actgaccgat gcctcttggc cgggcctggg gccggaccga gggggactcc 5340 gtggaggcag ggcgatggtg gctgcgggag ggaaccgacc ctgggccgag cccggcttgg 5400 cgattcccgg gcgagggccc tcagccgagg cgagtgggtc cggcggaacc accctttctg 5460 gccagcgcca cagggctctc gggactgtcc ggggcgacgc tgggctgccc gtggcaggcc 5520 tgggctgacc tggacttcac cagacagaac agggctttca gggctgagct gagccaggtt 5580 tagcgaggcc aagtggggct gaaccaggct caactggcct gagctgggtt gagctgggct 5640 gacctgggct gagctgagct gggctgggct gggctgggct gggctgggct gggctggact 5700 ggctgagctg agctgggttg agctgagctg agctggcctg ggttgagctg ggctgggttg 5760 agctgagctg ggttgagctg ggttgagctg ggttgatctg agctgagctg ggctgagctg 5820 agctaggctg gggtgagctg ggctgagctg gtttgagttg ggttgagctg agctgagctg 5880 ggctgtgctg gctgagctag gctgagctag gctaggttga gctgggctgg gctgagctga 5940 gctaggctgg gctgatttgg gctgagctga gctgagctag gctgcg ttga gctggctggg 6000 ctggattgag ctggctgagc tggctgagct gggctgagct ggcctgggtt gagctgagct 6060 ggactggttt gagctgggtc gatctgggtt gagctgtcct gggttgagct gggctgggtt 6120 gagctgagct gggttgagct gggctcagca gagctgggtt gggctgagct gggttgagct 6180 gagctgggct gagctggcct gggttgagct gggctgagct gagctgggct gagctggcct 6240 gtgttgagct gggctgggtt gagctgggct gagctggatt gagctgggtt gagctgagct 6300 gggctgggct gtgctgactg agctgggctg agctaggctg gggtgagctg ggctgagctg 6360 atccgagcta ggctgggctg gtttgggctg agctgagctg agctaggctg gattgatctg 6420 gctgagctgg gttgagctga gctgggctga gctggtctga gctggcctgg gtcgagctga 6480 gctggactgg tttgagctgg gtcgatctgg gctgagctgg cctgggttga gctgggctgg 6540 gttgagctga gctgggttga gctgggctga gctgagggct ggggtgagct gggctgaact 6600 agcctagcta ggttgggctg agctgggctg gtttgggctg agctgagctg agctaggctg 6660 cattgagcag gctgagctgg gctgagcagg cctggggtga gctgggctag gtggagctga 6720 gctgggtcga gctgagttgg gctgagctgg cctgggttga ggtaggctga gctgagctga 6780 gctaggctgg gttgagctgg ctgggctggt ttgcgctggg tcaagctggg c cgagctggc 6840 ctgggttgag ctgggctcgg ttgagctggg ctgagctgag ccgacctagg ctgggatgag 6900 ctgggctgat ttgggctgag ctgagctgag ctaggctgca ttgagcaggc tgagctgggc 6960 ctggagcctg gcctggggtg agctgggctg agctgcgctg agctaggctg ggttgagctg 7020 gctgggctgg tttgcgctgg gtcaagctgg gccgagctgg cctgggatga gctgggccgg 7080 tttgggctga gctgagctga gctaggctgc attgagcagg ctgagctggg ctgagctggc 7140 ctggggtgag ctgggctgag ctaagctgag ctgggctggt ttgggctgag ctggctgagc 7200 tgggtcctgc tgagctgggc tgagctgacc aggggtgagc tgggctgagt taggctgggc 7260 tcagctaggc tgggttgatc tggcagggct ggtttgcgct gggtcaagct cccgggagat 7320 ggcctgggat gagctgggct ggtttgggct gagctgagct gagctgagct aggctgcatt 7380 gagcaggctg agctgggctg agctggcctg gggtgagctg ggctgggtgg agctgagctg 7440 ggctgaactg ggctaagctg gctgagctgg atcgagctga gctgggctga gctggcctgg 7500 ggttagctgg gctgagctga gctgagctag gctgggttga gctggctggg ctggtttgcg 7560 ctgggtcaag ctgggccgag ctggcctggg ttgagctggg ctgggctgag ctgagctagg 7620 ctgggttgag ctgggctggg ctgagctgag ctaggctgca ttgagctggc tgggatg gat 7680 tgagctggct gagctggctg agctggctga gctgggctga gctggcctgg gttgagctgg 7740 gctgggttga gctgagctgg gctgagctgg gctcagcaga gctgggttga gctgagctgg 7800 gttgagctgg ggtgagctgg gctgagcaga gctgggttga gctgagctgg gttgagctgg 7860 gctcgagcag agctgggttg agctgagctg ggttgagctg ggctcagcag agctgggttg 7920 agctgagctg ggttgagctg ggctgagcta gctgggctca gctaggctgg gttgagctga 7980 gctgggctga actgggctga gctgggctga actgggctga gctgggctga gctgggctga 8040 gcagagctgg gctgagcaga gctgggttgg tctgagctgg gttgagctgg gctgagctgg 8100 gctgagcaga gttgggttga gctgagctgg gttcagctgg gctgagctag gctgggttga 8160 gctgggttga gttgggctga gctgggctgg gttgagcgga gctgggctga actgggctga 8220 gctgggctga gcggaactgg gttgatctga attgagctgg gctgagccgg gctgagccgg 8280 gctgagctgg gctaggttga gcttgggtga gcttgcctca gctggtctga gctaggttgg 8340 gtggagctag gctggattga gctgggctga gctgagctga tctggcctca gctgggctga 8400 ggtaggctga actgggctgt gctgggctga gctgagctga gccagtttga gctgggttga 8460 gctgggctga gctgggctgt gttgatcttt cctgaactgg gctgagctgg gctgagctgg 85 20 cctagctgga ttgaacgggg gtaagctggg ccaggctgga ctgggctgag ctgagctagg 8580 ctgagctgag ttgaattggg ttaagctggg ctgagatggg ctgagctggg ctgagctggg 8640 ttgagccagg tcggactggg ttaccctggg ccacactggg ctgagctggg cggagctcga 8700 ttaacctggt caggctgagt cgggtccagc agacatgcgc tggccaggct ggcttgacct 8760 ggacacgttc gatgagctgc cttgggatgg ttcacctcag ctgagccagg tggctccagc 8820 tgggctgagc tggtgaccct gggtgacctc ggtgaccagg ttgtcctgag tccgggccaa 8880 gccgaggctg catcagactc gccagaccca aggcctgggc cccggctggc aagccagggg 8940 cggtgaaggc tgggctggca ggactgtccc ggaaggaggt gcacgtggag ccgcccggac 9000 cccgaccggc aggacctgga aagacgcctc tcactcccct ttctcttctg tcccctctcg 9060 ggtcctcaga gagccagtct gccccgaatc tctaccccct cgtctcctgc gtcagccccc 9120 cgtccgatga gagcctggtg gccctgggct gcctggcccg ggacttcctg cccagctccg 9180 tcaccttctc ctggaactac aagaacagca gcaaggtcag cagccagaac atccaggact 9240 tcccgtccgt cctgagaggc ggcaagtact tggcctcctc ccgggtgctc ctaccctctg 9300 tgagcatccc ccaggaccca gaggccttcc tggtgtgcga ggtccagcac cccagtggca 9360 cca agtccgt gtccatctct gggccaggtg agctgggctc cccctgtggc tgtggcgggg 9420 gcggggccgg gtgccgccgg cacagtgacg ccccgttcct gcctgcagtc gtagaggagc 9480 agccccccgt cttgaacatc ttcgtcccca cccgggagtc cttctccagt actccccagc 9540 gcacgtccaa gctcatctgc caggcctcag acttcagccc caagcagatc tccatggcct 9600 ggttccgtga tgggaaacgg gtggtgtctg gcgtcagcac aggccccgtg gagaccctac 9660 agtccagtcc ggtgacctac aggctccaca gcatgctgac cgtcacggag tccgagtggc 9720 tcagccagag cgtcttcacc tgccaggtgg agcacaaagg gctgaactac gagaagaacg 9780 cgtcctctct gtgcacctcc agtgagtgca gcccctcggg ccgggcggcg gggcggcggg 9840 agccacacac acaccagctg ctccctgagc cttggcttcc gggagtggcc aaggcgggga 9900 ggggctgtgc agggcagctg gagggcactg tcagctgggg cccagcaccc cctcaccccg 9960 gcagggcccg ggctccgagg ggccccgcag tcgcaggccc tgctcttggg ggaagcccta 10020 cttggcccct tcagggcgct gacgctcccc ccacccaccc ccgcctagat cccaactctc 10080 ccatcaccgt cttcgccatc gccccctcct tcgctggcat cttcctcacc aagtcggcca 10140 agctttcctg cctggtcacg ggcctcgtca ccagggagag cctcaacatc tcctggaccc 10200 gccag gacgg cgaggttctg aagaccagta tcgtcttctc tgagatctac gccaacggca 10260 ccttcggcgc caggggcgaa gcctccgtct gcgtggagga ctgggagtcg ggcgacaggt 10320 tcacgtgcac ggtgacccac acggacctgc cctcgccgct gaagcagagc gtctccaagc 10380 ccagaggtag gccctgccct gcccctgcct ccgcccggcc tgtgccttgg ccgccggggc 10440 gggagccgag cctggccgag gagcgccctc ggccccccgc ggtcccgacc cacacccctc 10500 ctgctctcct ccccagggat cgccaggcac atgccgtccg tgtacgtgct gccgccggcc 10560 ccggaggagc tgagcctgca ggagtgggcc tcggtcacct gcctggtgaa gggcttctcc 10620 ccggcggacg tgttcgtgca gtggctgcag aagggggagc ccgtgtccgc cgacaagtac 10680 gtgaccagcg cgccggtgcc cgagcccgag cccaaggccc ccgcctccta cttcgtgcag 10740 agcgtcctga cggtgagcgc caaggactgg agcgacgggg agacctacac ctgcgtcgtg 10800 ggccacgagg ccctgcccca cacggtgacc gagaggaccg tggacaagtc caccggtaaa 10860 cccaccctgt acaacgtctc cctggtcctg tccgacacgg ccagcacctg ctactgaccc 10920 cctggctgcc cgccgcggcc ggggccagag cccccgggcg accatcgctc tgtgtgggcc 10980 tgtgtgcaac ccgaccctgt cggggtgagc ggtcgcattt ctgaaaatta gaaataaaag 110 40 atctcgtgcc g 11051 <210> 30 <211> 12048 <212> DNA <213> Sus scrofa <400> 30 gcgtccgaag tcaaaaatat ctgcagcctt catgtattca tagaaacaag gaatgtctac 60 attttccaaa gtgggaccag aatcttgggt catgtctaag gcatgtgcat ttgcacatgg 120 taggcaaagg actttgcttc tcccagcaca tctttctgca gagatccatg gaaacaagac 180 tcaactccaa agcagcaaag aagcagcaag ttctcaagtg atctcctctg actccctcct 240 cccaggctaa tgaagccatg ttgcccctgg gggattaagg gcaggtgtcc attgtggcac 300 ccagcccgaa gacaagcaat ttgatcaggt tctgagcact cctgaatgtg gactctggaa 360 ttttctcctc accttgtggc atatcagctt aagtcaagta caagtgacaa acaacataat 420 cctaagaaga gaggaatcaa gctgaagtca aaggatcact gccttggatt ctactgtgaa 480 tgatgacctg gaaaatatcc tgaacaacag cttcagggtg atcatcagag acaaaagttc 540 cagagccagg tagggaaacc ctcaagcctt gcaaagagca aaatcatgcc attgggttct 600 taacctgctg agtgatttac tatatgttac tgtgggaggc aaagcgctca aatagcctgg 660 gtaagtatgt caaataaaaa gcaaaagtgg tgtttcttga aatgttagac ctgaggaagg 720 aatattgata acttaccaat aattttcaga atgatttata gatgtgcact tagtcagtgt 780 ctctccaccc c gcacctgac aagcagttta gaatttattc taagaatcta ggtttgctgg 840 gggctacatg ggaatcagct tcagtgaaga gtttgttgga atgattcact aaattttcta 900 tttccagcat aaatccaaga acctctcaga ctagtttatt gacactgctt ttcctccata 960 atccatctca tctccgtcca tcatggacac tttgtagaat gacaggtcct ggcagagact 1020 cacagatgct tctgaaacat cctttgcctt caaagaatga acagcacaca tactaaggat 1080 ctcagtgatc cacaaattag tttttgccac aatggttctt atgataaaag tctttcatta 1140 acagcaaatt gttttataat agttgttctg ctttataata attgcatgct tcactttctt 1200 ttcttttctt tttttttctt tttttgcttt ttagtgccgc aggtgcagca tatgaaattt 1260 cccaggctag gggtcaaatc agaactacac ctactggcct acgccacagc cacagcaact 1320 caggatctaa gccatgtcgg tgacctacac tacagctcat ggcaatgcca gatccttaac 1380 ccaatgagcg aggccaggga tcgaacccat gtcctcatgg atactagtca ggctcattat 1440 ccgctgagcc ataacaggaa ctcccgagtt tgctttttat caaaattggt acagccttat 1500 tgtttctgaa aaccacaaaa tgaatgtatt cacataattt taaaaggtta aataatttat 1560 gatatacaag acaatagaaa gagaaaacgt cattgcctct ttcttccacg acaacacgcc 1620 tccttaattg atttgaagaa ataactactg agcatggttt agtgtacttc tttcagcaat 1680 tagcctgtat tcatagccat acatattcaa ttaaaatgag atcatgatat cacacaatac 1740 ataccataca gcctataggg atttttacaa tcatcttcca catgactaca taaaaaccta 1800 cctaaaaaaa aaaaaaaccc tacttcatcc tcctattggc tgctttgtgc tccattaaaa 1860 agctctatca taattaggtt atgatgagga tttccatttt ctacctttca agcaacattt 1920 caatgcacag tcttatatac acatttgagc ctacttttct ttttctttct ttttttggtt 1980 tttttttttt tttttttttt ggtctttttg tcttttctaa ggctgcatat ggaggttccc 2040 aggctagctg tctaatcaga actatagctg ctggcctacg ccacatccac agcaatacaa 2100 gatctgagcc atgtctgcaa cttacaccac agctcacagc aacggtggat ccttaaacca 2160 ctgagcaagg ccagggatca aacccataac ttcatggctc ctagttggat ttgttaacca 2220 ctgagccatg atggcaactc ctgagcctac ttttctaatc atttccaacc ctaggacact 2280 tttttaagtt tcatttttct ccccccaccc cctgttttct gaagtgtgtt tgcttccact 2340 gggtgacttc actcccagga tctcatctgc aggatactgc agctaagtgt atgagctctg 2400 aatttgaatc ccaactctgc cactcaaagg gataggagtt tccgatgtgg cccaatggga 2460 tcagtggcat ctctgcagtg ccagg acgca ggttccatcc ctggcccagc acagtgggtt 2520 aagaatctgg cattgctgca gctgaggcat agatttcaat tgtgcctcag atctgatcct 2580 tggcccaagg actgcatatg cctcagggca accaaaaaag agaaaagggg ggtgatagca 2640 ttagtttcta gatttggggg ataattaaat aaagtgatcc atgtacaatg tatggcattt 2700 tgtaaatgct caacaaattt caactattat ggagttccca tcatggctca gtggaaggga 2760 atctgattag catccatgag gacacaggtc caaccccgac cttgctcagt gggcattgct 2820 gtgagctgtg gcatgggtta cagacgaagc tcggatctgg cattgctgtg gctgtggtgt 2880 aagccagcaa ctacagctct cattcagccc ctagcctggg aacctccata tgcctaaaag 2940 acaaaaaata aaatttaaat taaaaataaa gaaatgttaa ctattatgat tggtactgct 3000 tgcattactg caaagaaagt cactttctat actctttaat atcttagttg actgtgtgct 3060 cagtgaacta ttttggacac ttaatttcca ctctcttcta tctccaactt gacaactctc 3120 tttcctctct tctggtgaga tccactgctg actttgctct ttaaggcaac tagaaaagtg 3180 ctcagtgaca aaatcaaaga aagttacctt aatcttcaga attacaatct taagttctct 3240 tgtaaagctt actatttcag tggttagtat tattccttgg tcccttacaa cttatcagct 3300 ctgatctatt gctgattttc aactatttat tgttggagtt ttttcctttt ttccctgttc 3360 attctgcaaa tgtttgctga gcatttgtca agtgaagata ctggactggg ccttccaaat 3420 ataagacaat gaaacatcgg gagttctcat tatggtgcag cagaaacgaa tccaactagg 3480 aaatgtgagg ttgcaggttc gatccctgcc cttgctcagt gggttaagga tccagcatta 3540 ccgtgagctg tggtgtaggt tgcagacgtg gctcagatcc tgcgttgctg tggctgtggc 3600 ataggctggc agctctagct ctgattcgac cgctagcctg ggaacctcca tgcgccccga 3660 gtgcagccct taaaaagcaa aaaaaaaaga aagaaagaaa aagacaatga aacatcaaac 3720 agctaacaat ccagtagggt agaaagaatc tggcaacaga taagagcgat taaatgttct 3780 aggtccagtg accttgcctc tgtgctctac acagtcgtgc cacttgctga gggagaaggt 3840 ctctcttgag ttgagtcctg aaagacatta gttgttcaca aactaatgcc agtgagtgaa 3900 ggtgtttcca agcagaggga gagtttggta aaaagctgga agtcacagaa agactctaaa 3960 gagtttagga tggtgggagc aacatacgct gagatggggc tggaaggtta agagggaaac 4020 aactatagta agtgaagctg gactcacagc aaagtgagga cctcagcatc cttgatgggg 4080 ttaccatgga aacaccaagg cacaccttga tttccaaaac agcaggcacc tgattcagcc 4140 caatgtgaca tggtgggtac ccctctagct ctacct gttc tgtgacaact gacaaccaac 4200 gaagttaagt ctggattttc tactctgctg atccttgttt ttgtttcaca cgtcatctat 4260 agcttcatgc caaaatagag ttcaaggtaa gacgcgggcc ttggtttgat atacatgtag 4320 tctatcttgt ttgagacaat atggtggcaa ggaagaggtt caaacaggaa aatactctct 4380 aattatgatt aactgagaaa agctaaagag tcccataatg acactgaatg aagttcatca 4440 tttgcaaaag ccttcccccc cccccaggag actataaaaa agtgcaattt tttaaatgaa 4500 cttatttaca aaacagaaat agactcacag acataggaaa cgaacagatg gttaccaagg 4560 gtgaaaggga gtaggaggga taaataagga gtctggggtt agcagataca ccccagtgta 4620 cacaaaataa acaacaggga cctactatat agcacaggga actatatgca gtagcttaca 4680 ataacctata atggaaaaga atgtgaaaaa gaatatatgt atgcgtgtgt gtgtaactga 4740 atcactttgc tgtaacctga atctaacata acattgtaaa tcaactacag tttttttttt 4800 ttttaagtgc agggttttgg tgtttttttt ttttcatttt tgtttttgtt tttgtttttt 4860 gctttttagg gccacaccca gacatatggg ggttcccagg ctaggggtct aattagagct 4920 acagttgccg gcttgcacca cagccacagc aacatcagat ccgagccgca cttgcgactt 4980 acaccacagc tcatggcaat accagatcct taacccactg a gcaaggccc agggatcgta 5040 cccgcaacct catggttcct agtcagattc atttctgctg cgctacaatg ggaactccaa 5100 gtgcagtttt ttgtaatgtg cttgtctttc tttgtaattc atattcatcc tacttcccaa 5160 taaataaata aatacataaa taataaacat accattgtaa atcaactaca atttttttta 5220 aatgcagggt ttttgttttt tgttttttgt tttgtctttt tgccttttct agggccgctc 5280 ccatggcata tggaggttcc caggctaggg gtcgaatcgg agctgtagcc accggcctac 5340 gccagagcca cagcaacgcg ggatccgagc cgcgtctgca acctacacca cagctcacgg 5400 caacgccgga tcgttaaccc actgagcaag ggcagggatc gaacctgcaa cctcatggtt 5460 cctagtcaga ttcgttaact actgagccac aacggaaact cctaaagtgc agtttttaaa 5520 tgtgcttgtc tttctttgta atttacactc aacctacttc ccaataaata aataaataaa 5580 caaataaatc atagacatgg ttgaattcta aaggaaggga ccatcaggcc ttagacagaa 5640 atacgtcatc ttctagtatt ttaaaacaca ctaaagaaga caaacatgct ctgccagaga 5700 agcccagggc ctccacagct gcttgcaaag ggagttaggc ttcagtagct gacccaaggc 5760 tctgttcctc ttcagggaaa agggtttttg ttcagtgaga cagcagacag ctgtcactgt 5820 ggtggacgtt cggccaagga accaagctgg aactcaaacg taagtca atc caaacgttcc 5880 ttccttggct gtctgtgtct tacggtctct gtggctctga aatgattcat gtgctgactc 5940 tctgaaacca gactgacatt ctccagggca aaactaaagc ctgtcatcaa actggaaaac 6000 tgagggcaca ttttctgggc agaactaaga gtcaggcact gggtgaggaa aaacttgtta 6060 gaatgatagt ttcagaaact tactgggaag caaagcccat gttctgaaca gagctctgct 6120 caagggtcag gaggggaacc agtttttgta caggagggaa gttgagacga acccctgtgt 6180 atatggtttc ggcgcgggga ccaagctgga gctcaaacgt aagtggcttt ttccgactga 6240 ttctttgctg tttctaattg ttggttggct ttttgtccat ttttcagtgt tttcatcgaa 6300 ttagttgtca gggaccaaac aaattgcctt cccagattag gtaccaggga ggggacattg 6360 ctgcatggga gaccagaggg tggctaattt ttaacgtttc caagccaaaa taactgggga 6420 agggggcttg ctgtcctgtg agggtaggtt tttatagaag tggaagttaa ggggaaatcg 6480 ctatggttca cttttggctc ggggaccaaa gtggagccca aaattgagta cattttccat 6540 caattatttg tgagattttt gtcctgttgt gtcatttgtg caagtttttg acattttggt 6600 tgaatgagcc attcccaggg acccaaaagg atgagaccga aaagtagaaa agagccaact 6660 tttaagctga gcagacagac cgaattgttg agtttgtgag gagagtaggg tt tgtaggga 6720 gaaaggggaa cagatcgctg gctttttctc tgaattagcc tttctcatgg gactggcttc 6780 agagggggtt tttgatgagg gaagtgttct agagccttaa ctgtgggttg tgttcggtag 6840 cgggaccaag ctggaaatca aacgtaagtg cacttttcta ctcctttttc tttcttatac 6900 gggtgtgaaa ttggggactt ttcatgtttg gagtatgagt tgaggtcagt tctgaagaga 6960 gtgggactca tccaaaaatc tgaggagtaa gggtcagaac agagttgtct catggaagaa 7020 caaagaccta gttagttgat gaggcagcta aatgagtcag ttgacttggg atccaaatgg 7080 ccagacttcg tctgtaacca acaatctaat gagatgtagc agcaaaaaga gatttccatt 7140 gaggggaaag taaaattgtt aatattgtgg atcacctttg gtgaagggac atccgtggag 7200 attgaacgta agtatttttt ctctactacc ttctgaaatt tgtctaaatg ccagtgttga 7260 cttttagagg cttaagtgtc agttttgtga aaaatgggta aacaagagca tttcatattt 7320 attatcagtt tcaaaagtta aactcagctc caaaaatgaa tttgtagaca aaaagattaa 7380 tttaagccaa attgaatgat tcaaaggaaa aaaaaattag tgtagatgaa aaaggaattc 7440 ttacagctcc aaagagcaaa agcgaattaa ttttctttga actttgccaa atcttgtaaa 7500 tgatttttgt tctttacaat ttaaaaaggt tagagaaatg tatttcttag tctgtttt ct 7560 ctcttctgtc tgataaatta ttatatgaga taaaaatgaa aattaatagg atgtgctaaa 7620 aaatcagtaa gaagttagaa aaatatatgt ttatgttaaa gttgccactt aattgagaat 7680 cagaagcaat gttattttta aagtctaaaa tgagagataa actgtcaata cttaaattct 7740 gcagagattc tatatcttga cagatatctc ctttttcaaa aatccaattt ctatggtaga 7800 ctaaatttga aatgatcttc ctcataatgg agggaaaaga tggactgacc ccaaaagctc 7860 agatttaaag aaatctgttt aagtgaaaga aaataaaaga actgcatttt ttaaaggccc 7920 atgaatttgt agaaaaatag gaaatatttt aataagtgta ttcttttatt ttcctgttat 7980 tacttgatgg tgtttttata ccgccaagga ggccgtggca ccgtcagtgt gatctgtaga 8040 ccccatggcg gccttttttc gcgattgaat gaccttggcg gtgggtcccc agggctctgg 8100 tggcagcgca ccagccgcta aaagccgcta aaaactgccg ctaaaggcca cagcaacccc 8160 gcgaccgccc gttcaactgt gctgacacag tgatacagat aatgtcgcta acagaggaga 8220 atagaaatat gacgggcaca cgctaatgtg gggaaaagag ggagaagcct gatttttatt 8280 ttttagagat tctagagata aaattcccag tattatatcc ttttaataaa aaatttctat 8340 taggagatta taaagaattt aaagctattt ttttaagtgg ggtgtaattc tttcagtagt 840 0 ctcttgtcaa atggatttaa gtaatagagg cttaatccaa atgagagaaa tagacgcata 8460 accctttcaa ggcaaaagct acaagagcaa aaattgaaca cagcagccag ccatctagcc 8520 actcagattt tgatcagttt tactgagttt gaagtaaata tcatgaaggt ataattgctg 8580 ataaaaaaat aagatacagg tgtgacacat ctttaagttt cagaaattta atggcttcag 8640 taggattata tttcacgtat acaaagtatc taagcagata aaaatgccat taatggaaac 8700 ttaatagaaa tatattttta aattccttca ttctgtgaca gaaattttct aatctgggtc 8760 ttttaatcac ctaccctttg aaagagttta gtaatttgct atttgccatc gctgtttact 8820 ccagctaatt tcaaaagtga tacttgagaa agattatttt tggtttgcaa ccacctggca 8880 ggactatttt agggccattt taaaactctt ttcaaactaa gtattttaaa ctgttctaaa 8940 ccatttaggg ccttttaaaa atcttttcat gaatttcaaa cttcgttaaa agttattaag 9000 gtgtctggca agaacttcct tatcaaatat gctaatagtt taatctgtta atgcaggata 9060 taaaattaaa gtgatcaagg cttgacccaa acaggagtat cttcatagca tatttcccct 9120 cctttttttc tagaattcat atgattttgc tgccaaggct attttatata atctctggaa 9180 aaaaaatagt aatgaaggtt aaaagagaag aaaatatcag aacattaaga attcggtatt 9240 ttac taactg cttggttaac atgaaggttt ttattttatt aaggtttcta tctttataaa 9300 aatctgttcc cttttctgct gatttctcca agcaaaagat tcttgatttg ttttttaact 9360 cttactctcc cacccaaggg cctgaatgcc cacaaagggg acttccagga ggccatctgg 9420 cagctgctca ccgtcagaag tgaagccagc cagttcctcc tgggcaggtg gccaaaatta 9480 cagttgaccc ctcctggtct ggctgaacct tgccccatat ggtgacagcc atctggccag 9540 ggcccaggtc tccctctgaa gcctttggga ggagagggag agtggctggc ccgatcacag 9600 atgcggaagg ggctgactcc tcaaccgggg tgcagactct gcagggtggg tctgggccca 9660 acacacccaa agcacgccca ggaaggaaag gcagcttggt atcactgccc agagctagga 9720 gaggcaccgg gaaaatgatc tgtccaagac ccgttcttgc ttctaaactc cgagggggtc 9780 agatgaagtg gttttgtttc ttggcctgaa gcatcgtgtt ccctgcaaga agcggggaac 9840 acagaggaag gagagaaaag atgaactgaa caaagcatgc aaggcaaaaa aggccttagg 9900 atggctgcag gaagttagtt cttctgcatt ggctccttac tggctcgtcg atcgcccaca 9960 aacaacgcac ccagtggaga acttccctgt tacttaaaca ccattctctg tgcttgcttc 10020 ctcaggggct gatgccaagc catccgtctt catcttcccg ccatcgaagg agcagttagc 10080 gaccccaa ct gtctctgtgg tgtgcttgat caataacttc ttccccagag aaatcagtgt 10140 caagtggaaa gtggatgggg tggtccaaag cagtggtcat ccggatagtg tcacagagca 10200 ggacagcaag gacagcacct acagcctcag cagcaccctc tcgctgccca cgtcacagta 10260 cctaagtcat aatttatatt cctgtgaggt cacccacaag accctggcct cccctctggt 10320 cacaagcttc aacaggaacg agtgtgaggc ttagaggccc acaggcccct ggcctgcccc 10380 cagccccagc ccccctcccc acctcaagcc tcaggccctt gccccagagg atccttggca 10440 atcccccagc ccctcttccc tcctcatccc ctccccctct ttggctttaa ccgtgttaat 10500 actggggggt gggggaatga ataaataaag tgaacctttg cacctgtgat ttctctctcc 10560 tgtctgattt taaggttgtt aaatgttgtt ttccccatta tagttaatct tttaaggaac 10620 tacatactga gttgctaaaa actacaccat cacttataaa attcacgcct tctcagttct 10680 cccctcccct cctgtcctcc gtaagacagg cctccgtgaa acccataagc acttctcttt 10740 acaccctctc ctgggccggg gtaggagact ttttgatgtc ccctcttcag caagcctcag 10800 aaccattttg agggggacag ttcttacagt cacattcctg tgatctaatg actttagtta 10860 ccgaaaagcc agtctctcaa aaagaaggga acggctagaa accaagtcat agaaatatat 10920 atgtataaaa tatatatata tccatatatg taaaataaca aaataatgat aacagcatag 10980 gtcaacaggc aacagggaat gttgaagtcc attctggcac ttcaatttaa gggaatagga 11040 tgccttcatt acattttaaa tacaatacac atggagagct tcctatctgc caaagaccat 11100 cctgaatgcc ttccacactc actacaaggt taaaagcatt cattacaatg ttgatcgagg 11160 agttcccgtt gtggctcagc aggttaagaa cgtgactggt atccaggagg atgcgggttt 11220 ggtccccagc ctcgctcagt ggattaagga tccagtgttg ctgcaagatc acgggctcag 11280 atcccgtgtt ctatggctat ggtgtaggct ggtagctgca tgcagcccta atttgacccc 11340 tagcctggga actgccatat gccacatgtg aggcccttaa aacctaaaag aaaaaaaaag 11400 aaaagaaata tcttacaccc aatttataga taagagagaa gctaaggtgg caggcccagg 11460 atcaaagccc tacctgccta tcttgacacc tgatacaaat tctgtcttct agggtttcca 11520 acactgcata gaacagaggg tcaaacatgc taccctccca gggactcctc ccttcaaatg 11580 acataaattt tgttgcccat ctctgggggc aaaactcaac aatcaatggc atctctagta 11640 ccaagcaagg ctcttctcat gaagcaaaac tctgaagcca gatccatcat gacccaagga 11700 agtaaagaca ggtgttactg gttgaactgt atccttcaat tcaatatgct caatttcca a 11760 ctcccagtcc ccgtaaatac aacccccttt gggaagagag tccttgcaga tgtagccacg 11820 ttaaaaagag attatacaga aaggctagtg aggatgcagt gaaacgggat ctttcataca 11880 ttgctggtgg aaatgtaaaa tgctgcaggc actctagaaa ataatttgcc agttttttga 11940 aaagctaaac aaaatagttt agttgcattc tgggttattt atcccccaga aattaaaaat 12000 tatgtccgca caaaaacgtg tacataatca ttcataacag ccttgtac 12048 <210> 31 <211> 126068 <212> DNA <213> Bos sp. <220> <221> misc_feature <222> (3591)..(3690) <223> n is a, c, g, or t <220> <221> misc_feature <222> (6955)..(6955) <223> n is a, c, g, or t <220> <221> misc_feature <222> (6967)..(6967) <223> n is a, c, g, or t <220> <221> misc_feature <222> (6974)..(6974) <223> n is a, c, g, or t <220> <221> misc_feature <222> (6976)..(6978) <223> n is a, c, g, or t <220> <221> misc_feature <222> (6980)..(6980) <223> n is a, c, g, or t <220> <221> misc_feature <222> (6985)..(6985) <223> n is a, c, g, or t <220> <221> misc_feature <222> (6987)..(6988) <223> n is a, c, g, or t <220> <221> misc_feature <222> (7000)..(7000) <223> n is a, c, g, or t <220> <221> misc_feature <222> (7534)..(7633) <223> n is a, c, g, or t <220> <221> misc_feature <222> (7842)..(7842) <223> n is a, c, g, or t <220> <221> misc_feature <222> (11197)..(11197) <223> n is a, c, g, or t <220> <221> misc_feature <222> (12793)..(12892) <223> n is a, c, g, or t <220> <221> misc_feature <222> (18660)..(18759) <223> n is a, c, g, or t <220> <221> misc_feature <222> (23231)..(23330) <223> n is a, c, g, or t <220> <221> misc_feature <222> (27257)..(27356) <223> n is a, c, g, or t <220> <221> misc_feature <222> (27727)..(27727) <223> n is a, c, g, or t <220> <221> misc_feature <222> (32250)..(32349) <223> n is a, c, g, or t <220> <221> misc_feature <222> (39216)..(39315) <223> n is a, c, g, or t <220> <221> misc_feature <222> (41326)..(41425) <223> n is a, c, g, or t <220> <221> misc_feature <222> (48650)..(48749) <223> n is a, c, g, or t <220> <221> misc_feature <222> (55204)..(55204) <223> n is a, c, g, or t <220> <221> misc_feature <222> (56436)..(56535) <223> n is a, c, g, or t <220> <221> misc_feature <222> (61281)..(61281) <223> n is a, c, g, or t <220> <221> misc_feature <222> (61394)..(61493) <223> n is a, c, g, or t <220> <221> misc_feature <222> (68709)..(68808) <223> n is a, c, g, or t <220> <221> misc_feature <222> (73149)..(73248) <223> n is a, c, g, or t <220> <221> misc_feature <222> (80571)..(80670) <22 3> n is a, c, g, or t <220> <221> misc_feature <222> (91799)..(91898) <223> n is a, c, g, or t <220> <221> misc_feature <222> (106600)..(106699) <223> n is a, c, g, or t <220> <221> misc_feature <222> (121987)..(121987) <223> n is a, c, g, or t <220> <221> misc_feature <222> (121993)..(121993) <223> n is a, c, g, or t <400> 31 tgggttctat gccacccagc ttggtctctg atggtcactt gaggccccca tctcatggca 60 aagagggaac tggattgcag atgagggacc gtgggcagac atcagaggga cacagaaccc 120 tcaaggctgg ggaccagagt cagagggcca ggaagggctg gggaccttgg gtctagggat 180 ccgggtcagg gactcggcaa aggtggaggg ctccccaagg cctccatggg gcggacctgc 240 agatcctggg ccggccaggg acccagggaa agtgcaaggg gaagacgggg gaggagaagg 300 tgctgaactc agaactgggg aaagagatag gaggtcagga tgcaggggac acggactcct 360 gagtctgcag gacacactcc tcagaagcag gagtccctga agaagcagag agacaggtac 420 cagggcagga aacctccaga cccaagaaga ctcagagagg aacctgagct cagatctgcg 480 gatgggggga ccgaggacag gcagacaggc tccccctcga ccagcacaga ggctccaagg 540 gacacagact tggagaccaa cggacgcctt cgggcaaag g ctcgaacaca catgtcagct 600 caaaatatac ctggactgac tcacaggagg ccagggaggc cacatcatcc actcagggga 660 cagactgcca gccccaggca gaccccatca accgtcagac gggcaggcaa ggagagtgag 720 ggtcagatgt ctgtgtggga aaccaagaac cagggagtct caggacagcg ctggcagggg 780 tccaggctca ggctttccca ggaagatggg gaggtgcctg agaaaacccc acccaccttc 840 cctggcacag gccctctggc tcacagtggt gcctggactc ggggtcctgc tgggctctca 900 aaggatcctg tgtccccctg tgacacagac tcaggggctc ccatgacggg caccagacct 960 ctgattgtgg tcttcttccc ctcgcccact ttgcaggtca gcccaagtcc acaccctcgg 1020 tcaccctgtt cccgccctcc aaggaggagc tcagcaccaa caaggccacc ctggtgtgtc 1080 tcatcagcga cttctacccg ggtagcgtga ccgtggtcta gaaggcagac ggcagcacca 1140 tcacccgcaa cgtggagacc acccgggcct ccaaacagag caacagcaag tacgcggcca 1200 gcagctacct gagcctgatg ggcagcgact ggaaatcgaa aggcagttac agctgcgagg 1260 tcacgcacga ggggagcacc gtgacgaaga cagtgaagcc tcagagtgtt cttagggccc 1320 tgggccccca ccccggaaag ttctaccctc ccaccctggt tccccctagc ccttcctcct 1380 gcacacaatc agctcttaat aaaatgtcct cattgtcatt cagaaatgaa tgctctctgc 1440 tcatttttgt tgatacattt ggtgccctga gctcagttat cttcaaagga aacaaatcct 1500 cttagccttt gggaatcagg agagagggtg gaagcttggg ggtttgggga gggatgattt 1560 cactgtcatc cagaatcccc cagagaacat tctggaacag gggatggggc cactgcagga 1620 gtggaagtct gtccaccctc cccatcagcc gccatgcttc ctcctctgtg tggaccgtgt 1680 ccagctctga tggtcacggc aacacactct ggttgccacg ggcccagggc agtatctcgg 1740 ctccctccac tgggtgctca gcaatcacat ctggaagctg ctcctgctca agcggccctc 1800 tgtccactta gatgatgacc cccctgaagt catgcgtgtt ttggctgaaa ccccaccctg 1860 gtgattccca gtcgtcacag ccaagactcc ccccgactcg acctttccaa gggcactacc 1920 ctctgcccct cccccagggc tccccctcac agtcttcagg ggaccggcaa gcccccaacc 1980 ctggtcactc atctcacagt tcccccaggt cgccctcctc ccacttgcat ggcaggaggg 2040 tcccagctga cttcgaggtc tctgaccagc ccagctctgc tctgcgaccc cttaaaactc 2100 agcccaccac ggagcccagc accatctcag gtccaagtgg ccgttttggt tgatgggttc 2160 cgtgagctca agcccagaat caggttaggg aggtcgtggc gtggtcatct ctgaccttgg 2220 gtggtttctt aggagctcag aatgggagct gatacacgga taggctgtgc taggca ctcc 2280 cacgggacca cacgtgagca ccgttagaca cacacacaca cacacacaca cacacacaca 2340 cacacacgag tcactacaaa cacggccatg ttggttggac gcatctctag gaccagaggc 2400 gcttccagaa tccgccatgg cctcactctg cggagaccac agctccatcc cctccgggct 2460 gaaaaccgtc tcctcaccct cccaccgggg tgacccccaa agctgctcac gaggagcccc 2520 cacctcctcc aggagaagtt ccctgggacc cggtgtgaca cccagccgtc cctcctgccc 2580 ctcccccgcc tggagatggc cggcgcccca tttcccaggg gtgaactcac aggacgggag 2640 gggtcgctcc cctcacccgc ccggagggtc aaccagcccc tttgaccagg aggggggcgg 2700 acctggggct ccgagtgcag ctgcaggcgg gcccccgggg gtggcggggc tggcggcagg 2760 gtttatgctg gaggctgtgt cactgtgcgt gtttgctcgg tggagggacc cagctggcca 2820 tccggggtga gtctcccctt tccagctttc cggagtcagg agtgacaaat gggtagattc 2880 ttgtgttttt cttacccatc tggggctgag gtctccgtca ccctaggcct gtaaccctcc 2940 cccttttagc ctgttccctc tgggcttctt cacgtttcct tgagggacag tttcactgtc 3000 acccagcaaa gcccagagaa tatccagatg gggcaggcaa tatgggacgg caagctagtc 3060 caccctctta ccttgggctc cccgcggcct ccggataatg tctgagctgc ctccctggat 3 120 gcttcacctt ctgagactgt gaggcaagaa accccctccc caaaagggag gagacccgac 3180 cccagtgcag atgaacgtgc tgtgagggga ccctgggagt aagtggggtc tggcggggac 3240 cgtgatcatt gcagactgat gccccaggca gggtgagagg tcatggccgc cgacaccagc 3300 agctgcaggg agcacaggcc gggggcaagt catgcagaca ggacaggacg tgtgaccctg 3360 aagagtcaga gtgacacgcg gggggggggc ccggagctcc cgagattagg gcttgggtcc 3420 taacgggatc caggagggtc cacgggccca ccccagccct ctccctgcac ccaatcaact 3480 tgcaataaaa cgtcctctat tgtcttacaa aaaccctgct ctctgctcat gtttttcctt 3540 gccccgcatt taatcgtcaa cctctccagg attctggaac tggggtgggg nnnnnnnnnn 3600 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3660 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn agcttatgtg gtgggcaggg gggtagtaag 3720 atcaaaagtg cttaaattaa taaagccggc atgatatacg agtttggata aaaaatagat 3780 ggaaaagtaa gaaaggacag gaggggggtg aggcggaaga aagggggaag aaggaaaaaa 3840 aaataagaga gaggaacaaa gaaagggagg ggggccggtg atgggggtgg gatagaatat 3900 aataattgga gtaaagagta gcgggtggct gttaattccg ggggggaata gagaaaaaaa 3960 aa aaaaaatg tgcgggtggg cggtaagtat ggagatttta taaatattat gtgtggaata 4020 atgagcgggg gtggacgggc aaggcgagag taaaaagggg cgagagaaaa aaattaggat 4080 ggaatatatg gggtaaattt taaatagagg gtgatatatg ttagattgag caagatataa 4140 atatagatgg tgggggaaaa gagacaaggg tgagcgccaa aacgccctcc cgtatcattt 4200 gccttccttc ctttaccacc tcgttcaaac tctttttcga gaaccctgaa gcggtcaggc 4260 ccggggctgg gggtgggata cccggggagg ggctgcgcct cctcctttgc agagggggtc 4320 gaggagtggg agctgaggca ggagactggc aggctggaga gatggctgtt gacttcctgc 4380 ctgtttgaac tcacagtcac agtgccagac ccactgaatt gggctaaata ccatattttt 4440 ctggggagag agtgtagagc gagcgactga ggcgagctca tgtcatctac agggccgcca 4500 gctgcaggga ctttgtgtgt gtcgtgctcg ttgctcagtt gtgtccgact ctttatgact 4560 tcatggactg taacctgcca ggctcctctg tccgtggaat tctccaggca agaatactgg 4620 agtgggtagc cattctcatc tccgggggat cttcctgacc caagaatcaa acctgagtct 4680 cccgcattgc aggcagcttc tttcttgtct gagccaccag ggaagcccct taagtggagg 4740 atctaaatag agtgtttagg agtataagag aaaggaagga cgtctataca agatccttcg 4800 gttcctgt aa ctacgactcg agttaacaag ccctgtgtga gtgagttgcc agtaattatt 4860 gctaacctgt ttctttcact cactgagcca ggtatcctgt gagacggcat acttacctcc 4920 tcttctgcat tcctcgggat ggagctgtgc ggtggcctct aggactacca catcgaccag 4980 gtcagaccca gggacagagg attgctgaga tgcactgaga agtttgtcag cctaggtctt 5040 cacccacaca gactgtgctg tcgtctacca cgtaattctt cctgtccaaa gaactggtta 5100 aacgctcctg aagcgtattc tggtctgctt caaaaagtgc ctctttcctt tataagttcc 5160 gccaatcctg gactttgtcc caggccagtc tactttattt gtgggaaagg tttttttggt 5220 cttttttgtt ttaaactctg cagaaattgc ttacactttt ggtgtgcaat ggctcactct 5280 tacggttcta gctgtattca aaggggttgc ttttctttgt ttttaaagct ttttgaacgt 5340 ggaccatttt taaagtcttt attaaacgtc taacatcgtt tctggtttat tttctggtgg 5400 tctggccatg aggcctacgg gtcttagctc ccctaccagg gtccaaccca catcccttgc 5460 actggacggc aaggtcttaa cctttgaacc accagagagc ttctgaaagg ggctgctttt 5520 ctccaatcct ctttgctccc tgcctgctgg tagggattca gcacccctgc aatagccctg 5580 tctgttctta ggggctcagt agcctttctg cctgggtgtg gagctggggt tgtaagagag 5640 cttcatggat ttg gacacga cctacgactc agaggtaaga ctccatctta gcgctgtaat 5700 gacctctttc caacaaccac ccccaccacc ctggaccact gatcaggaga gatgattctc 5760 tctcttatca tcaacgtggt cagtcccaaa cttgcacccg gcctgtcata gatgtagcag 5820 gtaagcaata aatatttgtt gaatgttaag tgaattgaaa taacataagt gaaaaagaaa 5880 acacttaaaa acatgtgttt ttataattac acagtaaaca tataatcatt gtagaaaaaa 5940 atcgaaagag tggcgggggc caagtgaaaa ccaccatccc tggtatgtcc acccgcccgg 6000 gtagccccag gtaagaggtg cggacacgga tggccctgta gacacagaga cacacgctca 6060 tatgctgggt cttgtcttgt gacctcttgg ggatgatgtt attttcacga tgccattcaa 6120 accttctacc acaccatttt tagagggtcg ttcatcgtaa atcagttcac tgctttgttt 6180 tctgattttg aaagtgtcac attcttcgag aaatgagaag gaacaggcgc gcataaggaa 6240 gaaagtaaac acgtggcctt gcttccaggg ggcactcagc gtgttggtgt gcacgctggc 6300 agtcttttct ctgtgacagt catggccttt tcccaaaggt gggctcagat aagaccgcct 6360 cccatcccct gtccctgtcc ccgtccccta cggtggaacc cacccacggc acgtctccga 6420 ggccctttgg ggctgtggac gttaggctgt gtggacatgc tgctggtggg gacccagggc 6480 tgggcagcac gttgtccct g ggtcccgggc cagtgaggag ctcccaagga gcagggctgc 6540 tgggccaaag ggcagtgcgt cccgaggcca tggacaaggg gatacatttc ctgctgaagg 6600 gctggactgc gtctccctgg ggccccttgg agtcatgggc agtggggagg cctctgctca 6660 ccccgttgcc cacccatggc tcagtctgca gccaggagcg cctggggctg ggacgccgag 6720 gccggagccc ctccctgctg tgctgacggg ctcggtgacc ctgccgcccc ctccctgggg 6780 ccctgctgac cgcgggggcc accccggcca gttctgagat tcccctgggg tccagccctc 6840 caggatccca ggacccagga tggcaaggat gttgaggagg cagctagggg gcagcatcag 6900 gcccagaccg gggctgggca ggggctgggc gcaggcgggt gggggggtct gcacnccccc 6960 acctgcnagc tgcncnnncn tttgntnncg tcctccctgn tcctggtctg tcccgcccgg 7020 ggggcccccc ctggtcttgt ttgttccccc tccccgtccc ttcccccctt tttccgtcct 7080 cctcccttct tttattcgcc ccttgtggtc gttttttttc cgtccctctt ttgttttttt 7140 gtctttttct ttttccccct cttctccctt gctctctttt tcattcgtcg gtttttctgc 7200 tcccttccct ctcccccccg ctttttttcc ctgtctgctt tttgtgttct ccctctctac 7260 cccccctgca gcctattttt tttatatatc catttccccc tagtatttgg cccccgctta 7320 cttctcccta atttttattt tcct ttcttt aactaaaatc accgtgtggt tataagtttt 7380 aacctttttt gcaccgccca caatgcaatc ttcacgcacg ccccccccgt cagcctcctt 7440 aaataccttt gcctactgcc cccctccttg tataataacg cgtcacgtgg tcaaccatta 7500 tcacctctcc accaccttac cacattttcc ttcnnnnnnn nnnnnnnnnn nnnnnnnnnn 7560 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 7620 nnnnnnnnnn nnntgaaaaa agaaaaggct gggcaggttt taatatgggg gggttggagt 7680 ggaatgaaaa tgcattggag tggttgcaac aaatggaaag gtctcaggag cgctcctccc 7740 ccatcaggag ctggaaagaa gtggaagcaa agcaaggaat tcgtgtgatg gccagaggtc 7800 aggggcaggg agctgcaaag actgccggct gtttgtgact gnccgtctcc gggtgcattt 7860 gttagcaggg aggcattaca ctcatgtctt ggtttgctaa ctaattctta ctattgttta 7920 gttgcaaggt catgtctgac tctttgcaac ccagggactg cagcccgcca ggctcctctg 7980 tccatgggat ttcgcaggca agaatactgg aggtggtagc cattttcttc accatgggat 8040 cttcccgagc cagaaatgga acccgagtcg cctcctgtgc atggggtctg ctgcctaaca 8100 ggcagatatt tgacgtctga gccaacaggg aggacagacg gtaattatac caaccattga 8160 aagaggaatt acacactaat ctttatcaaa atctttcaaa cagtagagga gaaaggatac 8220 tctctagttt attccataaa gttggaatta cgcttatcaa taaagacatt acaagaaaag 8280 aaagtgaagc cccaaatgcc ttataaatat acaagaaaaa atcttttaag atattagcca 8340 acttaatcaa caaaaaatgt atcaaaagtc caagtaacat tcaccccagg aatgcaagtg 8400 tggttcagcc taagacaatc agtcatgagt ataccacgga aacaaattaa agagaaaaga 8460 cattaaatct cacaaatggt gcagaaaaag atttggcaat atcgaacatc ttttcatgac 8520 caaaggaaaa aaaagaaaca aaacaccaga aaattctgtg tagaaagaat atatctcaac 8580 ccaatgaagg gcatttatga aaaacccaca gcatacatca cactccatga gaaagactga 8640 aagctttccc cactgccatt gaactctgtc ctggaaattc tagtcacagc gacagaacaa 8700 gagaaagaaa taacggccgt ctaaactggt aggaagaaat caaagcgtct ctattctctg 8760 ggcgcataat acaatataga caaatttcta aagtccacaa aaattcctag agctcataat 8820 gaatccagaa atgcgtcagg gctcaagatt cagatgcaaa aatcgtctgg gttttgatgc 8880 accaacaaac aattccatta acaataatac caaggaatta atttaactta gaagagaaaa 8940 gacctgttta cagagagtta taaaacattt ggtgatgaaa ttaaataaga gtaaatcata 9000 tagaaacacc gttcgtgttt tggagaccta atgtc ataaa cgtggcaaca cagagacgcc 9060 tcacggggaa ccctgagcct ccttctccaa acaggcctgc tcatcatttc acaggtaacc 9120 tgagacccta aagcttgact ctgaggcact ttgagggcat gaagagagca gtagctcctc 9180 ccatgggacc gacagtcaag gcccagggaa tgaccacctg gacagatgac ttcccggcct 9240 catcagcagt cggtgcagag tggccaccag ggggcagcag agagtcgctc aacactgcac 9300 ctggagatga ggcaacctgg gcatcaggtg cccatgcagg ggctggatac ccacacctca 9360 cacctgagga caggggccgg ctttctgtgg tgtcgccctc tcaggatgca cagactccac 9420 cctcttcgct tgcattgaca gcctctgtcc ttcctggagg acaagctcca ccttccccat 9480 ctctccccag ggggctgggg ccaacagtgt tctctcttgt ccactccagg aacacagagc 9540 caagagattt atttgtctta attagaaaaa ctatttgtat tcctgcattt ccccagtaac 9600 tgaaggcaac tttaaaaaat gtatttcctg gacttccctg gtgggccagt ggctagactc 9660 tgagctccca gtgcatgggg cctgggttca atccctgctc aggaaactac atcccacagg 9720 ctgcaaataa gatcctgcat gccacccgat gcaggcaaag aaacaagtgt tcggtatgca 9780 tgtatttcac gtgaggtgtt tctataattt acagccagta ttctgtctta cacttagtca 9840 ttcctttgag cacatgatcg gtcgatggcc cagaccacac acaggaatac tgaggcccag 9900 cacccaccgg ctgcccagaa cctcatggcc aagggtggac acttacagga cctcagggga 9960 cctttaagaa cgccccgtgc tcttggcagc ggagcagtgt taagcatggc tctgtccctc 10020 gggagctgtg tctgggctgc gtgcatcacc tgtggtgtgg gcctggtgag ggtcaccgtc 10080 caggggccct cgagggtcag aagaaccttc ccttaaaagt tctagaggtg gagctagaac 10140 cagacccaca tgtgaactgc acccaaaaac agtgaaggat gagacacttc aaagtcctgg 10200 gtgaaattaa gggccttccc ctgaaccagg atggagcaga ggaaggactt ggcttccagg 10260 aaaccctgac gtctccaccg tgactctggc cggggtcatg gcagggccca ggatcctttg 10320 gtgcaaagga ctcagggttc ctggaaaata cagtctccac ctctgagccc tcagtgagaa 10380 gggcttctct cccaggagtg gggcaaggac ccagattggg gtggagctgt ccccccagac 10440 cctgagacca gcaggtgcag gagcagcccc gggctgaggg gagtgtgagg gacgttcccc 10500 ccgctctcaa ccgctgtagc cctgggctga gcctctccga ccacggctgc aggcagcccc 10560 caccccaccc cccgaccctg gctcggactg atttgtatcc ccagcagcaa ggggataaga 10620 caggcctggg aggagccctg cccagcctgg gtttggcgag cagactcagg gcgcctccac 10680 catggcctgg accccctcct cctcggcctc ctggc tcact gcacaggtga gccccagggt 10740 ccacccaccc cagcccagaa ctcggggaca ggcctggccc tgactctgag ctcagtggga 10800 tctgcccgtg agggcaggag gctcctgggg ctgctgcagg gtgggcagct ggaggggctg 10860 aaatccccct ctgtgctcac tgctaggtca gccctgaggg ctgtgcctgc cagggaaagg 10920 ggggtctcct ttactcagag actccatcca ccaggcacat gagccggggg tgctgagact 10980 gacggggagg gtgtccctgg gggccagaga atctttggca cttaatctgc atcaggcagg 11040 gggcttctgt tcctaggttc ttcacgtcca gctacctctc ctttcctctc ctgcaggcgc 11100 tgtgtcctcc tacgagctga ctcagtcacc cccggcatcg atgtccccag gacagacggc 11160 caggatcacg tgttgggggc ccagcgttgg aggtganaat gttgagtggc accagcagaa 11220 gccaggccag gcctgtgcgc tggtctccta tggtgacgat aaccgaccca cgggggtccc 11280 tgaccagttc tctggcgcca actcagggaa catggccacc ctgcccatca gcggggcccg 11340 ggccaaggat gaggccgact attactgtca gctgtgggac agcagcagta acaatcctca 11400 cagtgacaca ggcagacggg aagggagatg caaaccccct gcctggcccg cgcggcccag 11460 cctcctcgga gcagctgcag gtcccgctga ggcccggtgc cctctgtgct cagggcctct 11520 gttcatcttg ctgagcagcg gcaagtgg gc attggttcca agtcctgggg gcatatcagc 11580 acccttgagc cagagggtta ggggttaggg ttagggttag gctgtcctga gtcctaggac 11640 agccgtgtcc cctgtccatg ctcagcttct ctcaggactg gtgggaagat tccagaacca 11700 ggcaggaaac cgtcagtcgc ttgtggccgc tgagtcaggc agccattctg gtcagcctac 11760 cggatcgtcc agcactgaga cccggggcct ccctggaggg caggaggtgg gactgcagcc 11820 cggcccccac accgtcaccc caaaccctcg gagaaccgcg ctccccagga cgcctgcccc 11880 tttgcaacct gacatccgaa cattttcatc agaacttctg caaaatattc acaccgctcc 11940 tttatgcaca ttcctcagaa gctaaaagtt atcatggctt gctaaccact ctccttaaat 12000 attcttctct aacgtccatc ttccctgctc cttagacgcg ttttcattcc acatgtctta 12060 ctgcctttgg tctgctcgtg tattttcttt tttttttttt ttttattgga atatatttgc 12120 gttacaatgt tgaatttgaa ttggtttctg ttgtacaaca atgtgaatta gttatacatg 12180 tcctgaggag gggcggctgc gtgggtgcag gagggccgag aggagctact ccacgttcaa 12240 ggtcaggagg ggcggccgtg aggagatacc cctcgtccaa ggtaagagaa acccaagtaa 12300 gacggtaggt gttgcgagag ggcatcagag ggcagacaca ctgaaaccat aatcacagaa 12360 actagccaat gtgatcacac ggaccacagc ctggtctaac tcagtgaaac taagccatgc 12420 ccatggggcc aaccaagatg ggcgggtcat gtgcccatgg ggccaaccaa gatgggcggg 12480 tcatggtgaa gaggtctgat ggaatgtggt ccactggaga agggaaaggc aaaccacttc 12540 agtattcttg ccttgagagc cccatgaaca gtatgaaaag gcaaaatgat aggatactga 12600 aagaggaact ccccaggtca gtaggtgccc aatatgctac tggagatcag tggagaaata 12660 actccagaaa gaatgaaggg atggagccaa agcaaaaaca atacccagtt gtggatgtga 12720 ctggtgatag aagcaagggc caatgatgta aagagcaata ttgcatagga acctggaatg 12780 ttaagtccaa gannnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12840 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnagaatttt 12900 gagcattact ttactagcgt gtgagacgag tgcaattgtg cggtagtttg agcattcttt 12960 ggcattgcct ttctttggga ttggaatgaa aactgacctg ttccaggcct gtggccactg 13020 ctgagttttc caaatttgct ggcgtattga gtgcatcact ttaacagcat catcttttag 13080 gatttgaaat agctcaactg gaattctatc actttagcta attccattca ttagctttgt 13140 ttgtagtgat gcttcctaag gcccccctgg ctttatcttc ctggatgtct ggctctggtg 13200 agtgatcaca ccg ctgtgat tatctgggtc atgaaggtct ttttgtatag ttcttcttag 13260 gaacagatat tatgatctcc atccttgcat ctcgttatat ctagagaagc actgactccc 13320 ttcatggtga cgtcagatcc tcatgactaa caaatggcct tttgtaagat gagtgcctca 13380 tggtattgag ctcccccgtc accaagacct tatgactgac ctcccccact gccccaggtg 13440 cctctcgaag cgtctgagat gccgcctccc aggctgcact cctcattttg cccccaataa 13500 aacttaactt gcagctctcc agctgtgcat ctgtgtttag ttgacagtac aaatataatg 13560 gaaaatttaa attaaatata atctatgggg agaaatccaa acatcttatg agggagagag 13620 agggagagaa aggaaagaag aagaagcagg aggaggagga gagtagagaa acagggggag 13680 ggcggcaggg agacagaggg gaggacaccg aggggaaagg gaggaaggcg agtgcagtga 13740 gagagaggcc agagttcatc agagtctgga ctcgcagccc aatcccacgg gtgtgtcccg 13800 aagcagggga gagcctgagc caggcggaga cagagctgtg tctccagtcc tcgtggccgt 13860 gacctggagc tgtgtggtca gcccccctga ccccagcctg gccctgctgg tggtcggagg 13920 cagtgatcct ggacacagtg tctgagcgtc tgtctgaaat ccctgtggag gcgccactca 13980 ggacggacct cgcctggccc cacctggatc tgcaggtcca ggcccgagtg gggcttcctg 14040 cctgga actg agcagctgga ggggcgtctg caccccagca gtggagcggc cccaggggcg 14100 ctcagagctg ccggggggac acagagcttg tctgagaccc agggctcgtc tccgaggggt 14160 cccctaaggt gtcttctggc cagggtcaga gccgggatga gcacaggtct gagtcagact 14220 ttcagagctg gtggctgcat ccctggggac agagggctgg gtcctaacct gggggtcaga 14280 gggcaggacg ggagcccagc tgacccctgg ggactggcct cctctgtggt ctcccctggg 14340 cagtcacagc ttccccggac gtggactctg aggaggacag ctggggcctg gctgtcagga 14400 gggggttcga gaggccacac tcagaggagg agaccctggc ctgcttgggt tgtgactgag 14460 tttttggggt cctctaggag actctggccc tgcaggccct gcaaggtcat ctctagtgga 14520 gcaggactcc acaagattga tgaactgaat cctctaggag aggtgtggtt gtgagggggc 14580 agcattctag aaccaacagc gtgtgcaggt agctggcacc gggtctagtg gcggcgggca 14640 gggcactcag ggccgactag gggtctgggg gattcaatgg tgcccacagc actgggtctt 14700 ccatcagaat cccagacttc acaaggcagt ttcggggatt aggtcaggac gtgagggcca 14760 cagagaggtg gtgatggcct agacaagtcc ttcacagaga gagctccagg ggccatgata 14820 agatggatgg gtctgtattg tcagtttccc cacatcaaca ccgtggtccc gccagcccat 1488 0 aatgctctgt ggatgcccct gtgcagagcc tacctggagg cccgggaggc ggggccgcct 14940 gggggctcag ctccggggta accgggccag gcctgtccct gctgtgtcca cagtcctccc 15000 ggggttggag gagagtgtga gcaggacagg agggtttgtg tctcacttcc ctggctgtct 15060 gtgtcactgg gaacattgta actgccactg gcccacgaca gacagtaata gtcggcttca 15120 tcctcggcac ggaccccact gatggtcaag atggctgttt tgccggagct ggagccagag 15180 aactggtcag ggatccctga gcgccgctta ctgtctttat aaatgaccag cttaggggcc 15240 tggcccggct tctgctggta ccactgagta tattgttcat ccagcagctc ccccgagcag 15300 gtgatcttgg ccgtctgtcc caaggccact gacactgaag tcaactgtgt cagttcatag 15360 gagaccacgg agcctggaag agaggaggga gaggggatga gaaggaagga ctccttcccc 15420 aagtgagaag ggcgcctccc ctgaggttgt gtctgggctg agctctgggt ttgaggcagg 15480 ctcagtcctg agtgctgggg gaccagggcc ggggtgcagt gctggggggc cgcacctgtg 15540 cagagagtga ggaggggcag caggagaggg gtccaggcca tggtggacgt gccccgagct 15600 ctgcctctga gcccccagca gtgctgggct ctctgagacc ctttattccc tctcagagct 15660 ttgcaggggc cagtgagggt ttgggtttat gcaaattcac cccccggggg cccctca ctc 15720 agaggcgggg tcaccacacc atcagccctg tctgtcccca gcttcctcct cggcttctca 15780 cgtctgcaca tcagacttgt cctcagggac tgaggtcact gtcaccttcc ctgtgtctga 15840 ccacatgacc actgtcccaa gcccccctgc ctgtggtcct gggctcccca gtggggcggt 15900 cagcttggca gcgtcctggc cgtggactgc ggcatggtgt cctggggttc actgtgtatg 15960 tgaccctcag aggtggtcac tagttctgag gggatggcct gtccagtcct gacttcctgc 16020 caagcgctgc tccctggaca cctgtggacg cacagggctg gttcccctga agccccgctt 16080 gggcagccca gcctctgacc tgctgctcct ggccgcgctc tgctgccccc tgctggctac 16140 cccatgtgct gcctctagca gagctgtgat ttctcagcat aactgattac tgtctccagt 16200 actttcatgt ccctgtgacg ggctgagtta gcatttctca cactagagaa ccacagtcct 16260 cctgtgtaaa gtgatcacac tcctctctgt gggacttttg taaaagattc tgcagccagg 16320 agtcatgggt ggtcttagct gagaaatgct ggatcagaga gacctgataa ccgatgtgaa 16380 gaggggaacc tggaagatct tcagttcagt tcatttcagt cattcagttg tgtccgactg 16440 tttgggatcc catggactgc cacacgccag tcctccctgt ccatcaccaa cttctgaagc 16500 ttgttcaaac tcatgtccat caagttggag atgcctttca accatctcat cctctgtcat 16560 ccccttctcc tcccgccttc aatcttccct agcattaggg tcttttccgt gagtcagttc 16620 ttcgcatcag gtggccaagt tttggagttt cagtttcagc atcagtcctt tcaatgaata 16680 gtaaggactg atttccttta ggatggactg gtttgatatc cttgcagttc aagggactct 16740 caagagtctt ctccaacact gcagttaaaa gccatcaatt cttcggtgct cagctttctt 16800 tttggtacaa ctctcacatt catacatgac taccgaaaat acattagtcg tgtagaacca 16860 gtttggggct tcccacgtgg ctctagtggt aaagaatatg cctgccaact cagaagatgt 16920 aagagatgcg gttcaatctc tgggtcggga agatcccctg gagaagggca tgacaaccca 16980 ctccagtatt tttgcctgga gaatcccatg gacagagaag cctggtggac tgcagtccat 17040 ggagtctcac agagtcagac acgactgaag caacttagct acttggaaaa gagcatgcac 17100 gaagctgtct aaaaaacagg tcaagaagtc ttgtgttttg aaggtttact gagaaagttg 17160 atgcactgct ccaacacttc ctctcagttg aaaagatcag aagcgttaga tcaaatggtg 17220 gtcaatacct tggatgcgct ccaacaggtt atatctgcag atggaaatga aggcagttta 17280 tggggtaact ggaggacaag atgagatcat acacttggaa cactgtctgg catcaaaggc 17340 gtgtacagta aacattagct gttattagca aaataaattc ag cttgaatc acccaaatca 17400 gatggcattc ttaaagccac tgagtggtaa aatcaggggt gtgcagccaa aacgtccatt 17460 ttgactcatt atgatttcca tgtcacaaga ctagaaagtc actttctcct cagcagaaga 17520 gaaggtagaa cattttaacc tttttttgga gtgtcaaggg aattttgttt acactgtaaa 17580 gtcagtgaaa atattgaagc ttttcatttg tggaaaatat taaatatgta aaattgaaat 17640 tttaaaattt attcctgggt agttttgttt ttccagtagt catgcatgga tgtgagagtt 17700 ggactataaa gaaagctgag cgctgaagaa ttaatgcttt tgaactgtgg cactggagaa 17760 gactcttgag agtcccttgg tctgcaagga gatcaaacca gtccatccta aaggaaatca 17820 gtcctgaata ttcactggaa ggactgatgc tgaagctgaa actccaatac tttggccacc 17880 tgatgtgaag aactgactca tatgaaaaga ctcagatgct gggaaagatt gaaggtggga 17940 ggagaagggg acgacagagg atgagatggc tgaatggcat caccgactcg atggacatga 18000 gtctgaataa gctctgggag ttgttgatgg acagggaggc cctggagtgc tgcagtccat 18060 gggattgcaa agagttggac atgactgagt gactgaactg aactgagttt ggtaacagat 18120 atgagaatta tataatttaa atctaaactc ttggtatttc tttctttggc ggttccaaaa 18180 gagctgtccc ttctgttaac tatataaatc ctttt tgaga attactaaat tgataatgtt 18240 cacaagttat ccaatttctc attactctta gttgtcagta taagaaatcc catttgattt 18300 atcatgttat agtatctgca actctaatag ttcagttctg acaaattttt attttattta 18360 aaaatattgg catacagtaa aatttcaaac aatatacaat tctccctttc agtttaaaaa 18420 acaaaacaaa acaaaagtaa tattagttaa aaaaatccgg gaagaatcca agcatttaaa 18480 attgcatcac atttctatgc tagacaagct gatataaagt tataattaat aaaggattgg 18540 actattaaac tctttacata tgaggtaaca tggctctcta gcaaaacatt taaaaatatg 18600 ttgtgggtaa attattgttg tccttaaaga aataaaaaga cataagcgta agcaattggn 18660 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 18720 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnna aaatggataa ggggggagga 18780 catgggtagg ggagcgcgat ggaggaagta aggtggtcga gggagttggg gggggaataa 18840 gtgggtaaaa gggaagcggg cggaaggagg gggaagcagg agagaggggt gggcgtcaga 18900 tcggggggag gggtatgagg gagagggaat ggtagacggg gggtgggaag cataaaggaa 18960 aagatagggg ggggaaaagt tagaagaaga atgaggggat aggcggaaag ggaagagaaa 19020 tgggagaaga acagaaaaat agggggag gg ggggcgtaaa gagggggggg gagggcaggt 19080 gtggagatga cagatacggg gaatgccccg gtataaaaga gtatatggcg tggggcgaga 19140 aggctgtcat cctgtgggag gggggacgcg gagaaccctt cgggctatag ggaggattcg 19200 gggggatcgt tcgggaaggc agtcagcaca gcacccacca agggtgcagg gatggatctg 19260 gggtcccaaa gaagaggccc aatcccgcgt cttggcagca aggagccctg gagactggga 19320 agtgtccagg acactgaccc aggggttcga ggaacccaga agtgtgtctg tgaagatgtg 19380 ttttgtgggg ggacaggtcc agagctttga gcagaaaagc ggccatggcc tgtggagggc 19440 caaccacgct gatctttttt aaaaggtttt tgttttgatg tggaccattt ttaaagtctt 19500 cattgaattt gctacaatat tgtttctggt ttatgctctg gtttcttcgg ctgcaaggtt 19560 tgtgtgatcg tatctcctca accaggactg aacccacagc ccctgcactg gaaggcgaag 19620 tcttaaccca gatcgccagg aacgtccctc ccctcactga tctaatccaa gaccctcatt 19680 aaggaaaaac cgagattcaa agctccccca ggaggactcg gtggggagga gagagccaag 19740 cactcagcac tcagtccagc acggcgccct ccctgtccag ggcgagggct cggccgaagg 19800 accaccggag accctgtcgg attcaccagt aggattgtga ggaatttcaa cttacttttt 19860 aaatctgtct ctcaaggctg ttacaagcgg actttaccag taacttaaaa gttgaaaggg 19920 acttcccagg cggcacttgc ggtgaagaac ccgccggctg gttttaggag acataagaga 19980 tgtgggttag atccctggtt caggaggatt cccctggaga aggaaatggc aacccactcc 20040 agtattcttg cctggaaagc ctcacggaca gaggaggctg gcgggctaca gtccacgggg 20100 tcgcacacga ctgaatcgac ttagcttcaa gttgagacag gaagaggcag tgactggtgg 20160 caaaacaccg cacccatgct cccaggggac ctgcagcgct ctggttcatg agctgtgcta 20220 acaaaaatca acccaacgag aggcccagac agagggaagc tgagttcatc aaacacgggc 20280 atgatgtgga ggagataatc caggaaggga cctgccaagc ccatgacaga ccggtgtcct 20340 gtctgagggc cgtcctggca gagcagtgca gggccctccg agaccgcccg agctccagac 20400 ccggctgggg gctacagggt ggggctgagc tgcaaggact ctgctgtgag ccccacgtca 20460 gggaggatca ccttgtttgt tttctgagtt tctcttaaaa tagcctttat gggtcctggt 20520 ctttggtttt aaaataacaa ctgttctccg taaacaacgt gaaaaaaaac aaacaggagg 20580 aaaacaacgc agcccgggca tttcacccgg aagagccgcc tctaacactt tgacgggttg 20640 ccttctattt taaccctgtt ttcattgtaa actgtaaaaa ccacatcata aataaattaa 20700 aggtctctgt gaa gtttaaa aagtaagcat ggcggtggcg atggctgtgc cacaccgtga 20760 acgctcgttt caaaacggta aattctaggg accccctggt ggtccagtgg gtgagatttt 20820 gcttccattg caggagccgt gggtttgatc cctggttggg gaactaagat cccacatgct 20880 gtatggagtg gccaaaaaga attttttgta aatggtgagt tttaggtgac gtgaatttcc 20940 cattgatgca cttcacaggc tcagatgcag ccaggccctc aggaagcccg agtccaccgg 21000 tcctttactt ttccttagag ttttatggct tctgtttctg cccttaaacc caccatgttt 21060 caacctcatc tgattttgga ctttataata aagttaggct gtgtttcagg aaactttgct 21120 cagtattctg taataatcta aatggaaaga atttgaaaaa agagcagaca cttgtacatg 21180 cataactgaa tcactttggt gtacacctga aactcgagtg cagccgctca gtcgtgtccg 21240 accctgcgac cccacggact gcagcacgcg ggcttccctg cccatcacca actcccggag 21300 ttcactcaaa cacatgtccg tcgactcggt gatgccgtcc aaccgtctca tcctctgtcg 21360 tccccttctc ctcccgcctt caatcttttc cagcatcagg gtcttttcaa atgagtcagt 21420 tcttcacacc aggtggccag agtattggag tttcagcttc agcatcagcc cttccaacga 21480 ccccccatac ctgaagctaa cacagtgcta atccactgtg ctgcaacatg aaagaaaaac 21540 acattt ttta agtttaggct gtgtgtgtct tccttctctc aacactgcgt ctgaccccac 21600 ccacactgcc cagcactgca ttccccgtgg acaggaggcc ccctgcccca cagctgcgtg 21660 ccggccggtc actgccgagc agacctgccc gcccagagtg gggcccctgg cactggggac 21720 aaggcagggg cctctccagg gccggtcact gtccactgtt cctactggtt ttgttttcaa 21780 aagtggaggc agcgtaatat ttccctgatt ataaaaagaa gtacacaggt tctccacaaa 21840 taaaacaggg gaaaagtata aagaatggaa gttcccagca cagcctggag atcacgccgg 21900 gtgcacctgg ggtgtccttc caggctggac ctcacatttc acgcagacat cagaaggctg 21960 cgagatctac ccagaaggct gggtagatgg gggataggtc agtgacaaac agtagacaga 22020 gagatataca gacagatgat ggatagacag acgctaagac accgagcgag gggacagacg 22080 gatggaagac accatccttt gtcactgacc acacacccac atgggtgtgg tgagccggct 22140 gtcatacttg tgaacctgct gctctcacaa caccagctgg gtccctccag ccccagcgtc 22200 ccacacagca gactcccggc tccatcccca ggcaggaatc ccaccaccaa ctggggtgga 22260 ccctccccgc aggaaggtcg tgctgtctaa ggccttgaga gcaagttaca gacctacttc 22320 tgggaagaca gcgcacaacc gcctaccccg cagagcccag gaggacccct gagtcctagg 2238 0 gaagggacca cgcggcctgg acggggagcg gccccaggac gctgccccca acctgtccca 22440 cctcactcct gctctgctct gaggcggggc gcagagaggg gccctgaggc ctcttcccag 22500 ttcttgggag cacccactgg gcctgaacca ggccagaagc cccctcctca aggtgtcccc 22560 agaccactcc cctccacctc cggttgctct gtctcctggc agcagggagc cccagtgaga 22620 agagacagct ccaggctgtg atcttggccc ctggctgctc tggcagtgtg gggggtgggg 22680 gtcgctggga ggccatgagt gctgggggtc ggggctgtga aagcacctcg aggtcagtgg 22740 gctgttggtc gggctctgcg aggtccgcac gggtagagct gtgccaggac acaggaggcc 22800 tggtcagtgg tcccaagagt cagggccaaa ggaaggggtt cgggcccctc tggttcctca 22860 gcttctgagg ccggggaccc cagtctggcc ttggtagggg ggcgattgga gggtacaacg 22920 atccaaaaga aaacacacat ctacgaggga agagtcctga ggaggagaga gctacacaga 22980 gggtctgcac actgcggaca ctgcttggag tctgagagct cgagtgcggg gcacagtgag 23040 cgaagggagg acggaacctc caaggacacc ggacgccgat ggccagagac acacgcacgt 23100 cccatgaggg ccggctgctc agacgcaggg gagctcctca ttaaggcctc tcgctgaata 23160 gtgaggagaa ctggccccgt gtgtggggaa acttagccca gaagaaacgc tgccctg gcc 23220 ccaaggatca nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 23280 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn tgccctttgc 23340 ctccagggag ggaggaagcg tggatcttgg gtttgccttg ggtttaaagg atccacccac 23400 tcccttttta gccactccct gtgctggcaa tttcttaaga ctggaggtcg caaagagttg 23460 gacacactga gcgagtgaac tgcactgagc ctaagaaaag tctttgaatt cctccaaaca 23520 aaacacactt gtcttgggta ctttccttgg ttttgttaca aatgtctggt ccctctgttc 23580 tcctggccag ctcctgggtg tcattttgac ctgacgaagt caaagggagc ctggaccctc 23640 aaaatctgta ggacccagca cccctccatt acacctctgt tcccccgcga acgggcacgt 23700 gtttcgccgt ctggcgtaat gtgtaagcga cggtgtgata ctcgggagtc ttactctgtt 23760 tctttttctt ctggggtgac accaccatcc gcacgactct gtctgaatgt gaacatttgg 23820 gtgatttgat gtggcccaga ctcccccaac gaatgtacct tcaggttggt tttcttcttt 23880 tatattttgc ttttgtgaat agacacagga tcccatcagt tgtatgtagt gagaaagtaa 23940 aaacccactc agccttagct ggatggagat ctagtagtaa gatagcacgt tagccggaaa 24000 tggaaatttc agccagaatc tgaaaagcgt gtcctggaag gagaagaggg actcaggccc 24060 gagcacactg ctccacgctg gagcctcagg ctctgacagc tgtacctgcc ggggtcttca 24120 tgggacaggc catgcaggcc acgatcccgt tgagaagttt cttgcctttc catcacattg 24180 gcaattgcac gctttgctct tgcttctaca tggagtttta cttttatccc agacagtttg 24240 gtttcttctc tgattttcgc caattgtaca gatcgttaca gtatttctta accacataga 24300 attcggcagg gggggtgggg ggacagggta gggtggggtg agagtgaggg gagggggctg 24360 caccgagcag catctggggt cgtagctccc tgacggggat agacctcgtg cccctgcagt 24420 gacagcacag agtcctcctc tctgaactgc cagggacgct cctgcaattg acttaatgaa 24480 aggcatctaa ttaggaattt tggggtgaca ttttacattt aagtgtgtga gcagtgatta 24540 tagttcatat cattttatag tttcgtgatt ttactagctt aaagggtttt tggggtttct 24600 ttttgtttta aaagctaaaa tctgtttttt aattccatgg aatacaaaaa aaaaaagtct 24660 gtagaatatt ttaaagagtg aaggctttgt tcggaatgtg agcgctttgc tccactgaac 24720 cgaacggtaa taacatttgt agaagagacg cagagtgaaa ggtacctctt tttattgagt 24780 gacatgacag cacccatcgc gtgagttatt ggctggagtt tagagacagg ccatgttggg 24840 ctaaactcct tattgctgtt ctcagccttt gagtaataat ca gaagcttt ctctgaagag 24900 agtggggtca gctgtcagac tcctaggtgt ctacctgcag cagggctggg attaaatgca 24960 gcagccagta gatacgggat ggggcaagag gtcaccttgt ccctttgttg ctgctgggag 25020 agaggcttgt cctggtgcca gtggggccaa agctgtgact ttgtgaccac aggatgtctc 25080 tgaccctgcc ttgggttccc tgagggtgga gggacagcag ggtctccccg gttccttggc 25140 cggagaagga ccccccaccc cttgctctct gacatccccc caggacttgc cccggagtag 25200 gttcttcagg atgggcatcc gggccccacc ctgactcctg gagctggccg gctagagctt 25260 gctgcagaat gaggccttgg ccattgcggc cctgaaggag ctgcccgtca agctcttccc 25320 gaggctgttt acggcggcct ttgccaggag gcacacccat gccgtgaagg cgatggtgca 25380 ggcctggccc ttcccctacc tcccgatggg ggccctgatg aaggactacc agcctcatct 25440 ggagaccttc caggctgtac ttgatggcct ggacctcctg cttgctgagg aggtccgccg 25500 taggtaaggt cgacctggca gactggtggg gcctggggtg tgagcaagat gcagccaggc 25560 caggaagatg aggggtcacc tgggaacagg cgttgggtgt acaggactgg ttgaggctca 25620 gaggggacaa aaggcacgtg ggcctccccc ccagtgtccc ttaaagtggg aaccaagggg 25680 gccccggaag ccggaggagc tgtggtgtgt ggagt gcaga gccctcgcgg ggtcctgatg 25740 cccgtcggac tctgcacagc tcagcgtgtg ccccgcggcc cggtaggcgg tggaagctgc 25800 aggtgctgga cttgcgccgg aacgcccacc agggacttct ggaccttgtg gtccggcatc 25860 aaggccagcg tgtgctcact gctggagccc gagtcagccc agcccatgca gaagaggagc 25920 agggtagagg gttccagggg tgggggctga agcctgtgcc gggccctttg gaggtgctgg 25980 tcgacctgtg cctcaaggag gacacgctgg acgagaccct ctgctacctg ctgaagaagg 26040 ccaagcagag gaggagcctg ctgcacctgc gctgccagaa gctgaggatc ttcgccatgc 26100 ccatgcagag catcaggagg atcctgaggc tggtgcagct ggactccatc caggacctgg 26160 aggtgaactg cacctggaag ctggctgggc cggatgggca acctgcgcgg ctgctgctgt 26220 cgtgcatgcg cctgttgccg cgcaccgccc ccgaccggga ggagcactgc gttggccagc 26280 tcaccgccca gttcctgagc ctgccccacc tgcaggagct ctacctggac tccatctcct 26340 tcctcaaggg cccgctgcac caggtgctca ggtgaggcgt ggcgccagct ccaaagacca 26400 gagcaggcct ctcttgtttc gtgcccgctg gggacattgc cagggtgccc ggccactcgg 26460 aagtcctcac gatgccaccg ctctgaccct gggcatcttg tcaggtcact tccctggtta 26520 gggtcagagg cgtggcctag gttaaatg ct gtcaaagggg actcctttct gggagtccgc 26580 atagtggggg cttggtgtga tgcccttggg aattctttcc gagagagtga tgtcttagct 26640 gagataatga cagataacta agcgagaagg acggtccatc aggtgtgagg tttgaagtcc 26700 aaagctctgt ctctccctcc cacctgcccc ttctgtcctg agctgtttta ggctccaggt 26760 gagctgtggg aagtgggtga ttctggagat gacaagaagg gatcaggagg ggaaaattgt 26820 ggctcctaag cagtccagag aagagaaaaa gtcaaataag cattattgtt aaagtggctc 26880 cagtctcttt aagtccaaat tataattata attttcctct aagacttctg aatacatagg 26940 aaatcctcag taacaggtta ttgctctgcc ttgaacacag tgataaaagc tgggaggatg 27000 cagcctaatc tgtctgtgtg aatgagttgt attgattccc tttttggcag ctgcaaactc 27060 caagcattag gaataaatat gttcactgag aaccccgaag aaagaaagaa agaaaaaaaa 27120 aaagaattgt aggtgttgat ggacggtttg tggcccctga atatctgggg gatgttcacc 27180 cagggatcac gtgtaactgc tgggaccccc agccccatgt ccactgcatc cagcctgctg 27240 ttgaattccg cggatcnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27300 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnncaat 27360 tcgagctcgg taccccaaag gtccgtctag tcaaggctat ggtttttcca gtggtcatgt 27420 atggatgtga gagttggact gtgaagaaag ctgagtgcca aagaattatt cttttgtact 27480 gggtgttgga gaagactctt gagagtccct tgaactgcaa ggagatccaa ccagtccgtt 27540 ctaaaggaga tcagtcctga atgttcattg gaaggactga tgctgaagct gaaactccaa 27600 tactttggcc acctgacgtg aagagttgac tcattggaaa agaccatgat gctgagagga 27660 attgggggca ggaggagaag gggacgacag aggatgagat ggctggatgg catcaccaac 27720 tcgatgngac atgagtttgg ttaaactcca ggagttggtg atggacttgg aggcctggtg 27780 tgctgggatt catggggtcg cagagtcgga catgactgag cgactgaact gaactgaact 27840 gagctgaaga gctcacctgt accagagctc ctcaggtcct cctgcaggcc tggctgtaat 27900 ggcccccagg tcaccgtcct gcctccttca tcccatcctt tcacgacagg ctgggagtgg 27960 ggtgaggtga gttgtcttgt atctagaatt tctgcatgcg accctcagag tgcaatttag 28020 ctccagagaa ctgagctcca agagttcatt ttttcctttt cttctttatg atactaccct 28080 cttctgagca gagacctcat gtcagggaga aggggactct gccttcctca gccttttgtt 28140 cctccaagac ccacacgggg agggtcgcct gcttcactga gccggaaggt tcaattgctc 28200 atgtcctcca gaa acacccc cccccccaga gacccccaga aataagtgga acagcacctt 28260 gtttcccaga caagtgggac acacgttatg aaccacctca gtgattaaaa tagtaacctc 28320 tgtgtatgtg tatttactgg agaaggaaac ggcaacctac tccactattc ctgcctagaa 28380 aattccatgg gagagaagcc aggcaggcta cagtccacgg ggtcacagag actgaacata 28440 cacaagcaca tggaagtgta ttttgcagta tttttaaatt tgttcagttc aacatggagt 28500 acaagaattc aaatcgtgaa gtcaattgac caagaaacca gaagaaatca ctgtgttgtg 28560 atctctgtgg aggtaacatg ggtacctgtg ctctgaccct cacagcctct ggctctctct 28620 ctacatgtac atacacatat atttccatgt atgtatgtat tcggaagatt tcacatacgt 28680 ctcaccagtc cacagccccc gcgttccctg atgcccagaa catctgtgat agctgtgagt 28740 attgtcacca gataagatct tccaggttcc tgcactcaca ttggttatca ggtctctctg 28800 atccagcatt tctcagctaa gattccttgt gactcctggc tgcagaatct tctgcaaaag 28860 tcccacagag aggagtgtga tcactgtaca caggagggcc gtggttctct agtgtgagaa 28920 aagctaactc agcccgtcac agggacgtga atgtacctga gacagtaatc agttatgctg 28980 agaaatcaca gctctgctag aggcagcaca tggggtagcc agcagggggc agcagagcac 29040 ggccag gagc cgcaggtcag aggctgggct gcccaagcgg ggcttcaggg gaaccagccc 29100 tgcgggtcca caggtgtcca gggagcagcg cttggcagga agtcaggacc ggacaggcca 29160 tcccctcagg actagtgacc acctctgagg gtcacatcca cagtgaaccc cagagcacca 29220 tgcctcagtc cacggccagg acgctgccag gctgaccgcc ccactgggga gtccagggga 29280 gaccacaggc cggggggctt gggacagtga tcatgtggtc agacacagag aaggtgacag 29340 tgacctcagt ccctgaggac aagtctgatg tgcagacgtg agaagccgag gaggaagctg 29400 gggacagaca gggctgatgg tgtggtgacc ccgcctctca gtgaggggcc cccgggggtg 29460 aatttgcata aacccaagcc ctcactgccc ccacaaagct ctgagaggga ataaaggggc 29520 tcggagagcc cagcactgct gcgggctcag aggcagagct cggggcgcgt ccaccatggc 29580 ctgggcccct ctcgtactgc ccctcctcac tctctgcgca ggtgcggccc cccagcctcg 29640 gtccccaagt gaccaggcct caggctggcc tgtcagctca gcacaggggc tgctgcaggg 29700 aatcggggcc gctgggagga gacgctcttc ccacactccc cttcctctcc tctcttctag 29760 gtcacctggc ttcttctcag ctgactcagc cgcctgcggt gtccgtgtcc ttgggacaga 29820 cggccagcat cacctgccag ggagacgact tagaaagcta ttatgctcac tggtaccagc 2988 0 agaagccaag ccaggccccc tgtgctggtc atttatgagt ctagtgagag accctcaggg 29940 atccctgacc ggttctctgg ctccagctca gggaacacgg ccaccctgac catcagcggg 30000 gcccagactg aggacgaggc cgactattac tgtcagtcat atgacagcag cggtgatcct 30060 cacagtgaca cagacagacg gggaagtgag acacaaacct tccagtcctg ctcacgctct 30120 cctccagccc cgggaggact gtgggcacag cagggacagg cctggcccgg ttcccccgga 30180 gctgagcccc caggcggccc cgcctcccgg ccctccaggc aggctctgca caggggcgtt 30240 agcagtggac gatgggctgg caggccctgc tgtgtcgggg tctgggctgt ggagtgacct 30300 ggagaacgga ggcctggatg aggactaaca gagggacaga gactcagtgc taatggcccc 30360 tgggtgtcca tgtgatgctg gctggaccct cagcagccaa aatctcctgg attgacccca 30420 gaacttccca gatccagatc cacgtggctt tagaaaggct taggaggtga acaagtgggg 30480 tgagggctac catggtgacc tggaccagaa ctcctgagac ccatggcacc ccactccagt 30540 actcttccct ggaaaatccc atggacggag gagcctggaa ggcttcagcc catggggtcg 30600 ctaagagtca gacacgactg agcgacgtca ctttcccttt tcactttcat gcattggaga 30660 aggaaatggc aacccagtcc agtgttcctg cctggaaaat cccagggaca ggggagc ctg 30720 gtgggctgcc atccatgggg ccacacagag tcagacacga ctgaagcaac ttagcagcag 30780 cagcagcagc ccaataaaac tcagcttaag taatggcatc taaatggacc ctattgccaa 30840 ataaggtcca ctcgcgtgca ctctgtttag gacttcagtt cctgattgtg gagggttccc 30900 acaagacgtg tgtgtatatt ggtgttgccg gaaaacagtg tcaatgtgag catcccagac 30960 tcatcaccct cctactccca ctattccatt gtctctgcag gtattaagca taaaggttaa 31020 gggtcttatt agatggaaga ggagtgaata ctcgtctgtg cttaacacat accaagtacc 31080 atcaaggtcc ttcctattta ttaacgtgtg ttttaatcag aaatatgcta tgtagaagca 31140 tccggacgat agcccatgtt acagacgggg aagctgaggc atgaagttct cagcaccttg 31200 tttcacgtca gacctgaaac ggggcagagc cggcagcaaa caaggttcct cttcccaagc 31260 gcccgctctt cacccgcttc ctatggcttc tcactgtgct tcctaaacta agctctcccc 31320 aaccctgtgg agacaggatt agagacttta ggagaaaaga ccaggaacat cccacacccg 31380 acccgagtga gccactaaga caaggctttg taaggacaga accagcaggt gtcctcagcg 31440 agccagggag agacctcgca ccaaaaacaa tattgtagca tcctgaccct ggacttctga 31500 cctccagaaa tgtgaaaaag aaacgtgtgg ggtttaatca actcaccggt gttatttggt 31560 tatgactgcc tgagttaaga aggagttggg aacacttgag tgtaggtgtt tatggaacat 31620 aagtcttgtt tctctgaaat aaattcccaa gggtataatt cctaggttgt agggtaactg 31680 ccacaaatct aggcagctta ttaaaaaaca aagatatcac tttgccagca aaggttcata 31740 tagtcaaatt atggttttta tagtagtcat gtatggatgt aaaagttgga tcataaagaa 31800 ggctgagcac cagagaattg atcccttcaa atcgtggtgc tggagaagac tcttgagagt 31860 cccttggaca gcaaggagat ccaaccagtc aatcctaaag gaaatgaact gtgaatattc 31920 actggaagga ctgatgctga agctgaagat ccaatacttt ggccacctga tgcgaagagt 31980 tgactcattg gaaaagaccc tgatgctgga aagcttgagg gcaggaggag aagagggcgg 32040 cagaggatga gacggttgga tggcatcact gactcaatgg acatgagttt gagccaactc 32100 tgggagacag tgaaggatag ggaaggctgg cgtggtacag tgcatgcggt cacaaagagt 32160 ctgacacatc ttagtgactc aacaacgaca gcaacacagg catcacacgc ttagtgtgat 32220 aagcggcaga actgttttcc aggggtccgn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 32280 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 32340 nnnnnnnnng tacgattcga gctcggaccc tgacattgtg ag tcacgtca tgagcagctg 32400 ttttccggtc ttcagggatt gtggacgatt tctgtttggg tttgctcatg ataatttagt 32460 tacagcttag gttctttctt tccaggccac gagcgacatg ttttcaggtg agatgacgtg 32520 gtgggggatg ggcggccaag cccccactgg ggggggaggg attctgttgt gggcaggagt 32580 tggcagcatc cctgaactga tgacctgcga tccaggtgac aagaaccggg ggatattatt 32640 cctctgcctt ctcatgtcat gtcctcggtt cttcatgatg aaaacatatg acaatacagg 32700 ggagttagat ttgggcgggc acaactctgg gtgggggacc cggtggcatt gtgcccagca 32760 gggccatcaa gatgagggcg acctgggtgg tccccttctc ccctggggtc ttagttttcc 32820 cctcatggaa atgggatcag gcagcagcca tggaacaccg cgaccgtggc ttctctcacc 32880 tcctcgtctg tgattttggg tcgggatacc aggcatgaag acctggggcg gggggacatc 32940 actcctctgc agcagggagg ccgcagagtc ctccgtccat gaggacttcg tccctgggct 33000 gaccctgcgg actgctggag gctgaagctg gaggcacagg cgggctgcga ggccagggtc 33060 ctgaggacga cagagccagt ggggctgcag ctctgagcag atggcccctc gccccgggcc 33120 ctgagcttgt gtgtccagct gcaggttcgc tcaggtgagc cactacgtta tgggggaggc 33180 gccctgggca gggatcgggg gtgctgactc ctccg agatt ccgaccttct gggagcactc 33240 tggccacact ctaagcctgg caagagctgg gttcatcagt ctaactctcc tcctgaagtc 33300 caatggactc tctccatgcg gcagtcactg gatggcctct ttatccccga tggtgtcctt 33360 ttccgctgac ctggctctcc tgaccacctc ccagcccccc accatacagg aagatggcac 33420 ctggtccctg cagagctaag tccacccctg gcctggcttc agatgcctac agtcctcctg 33480 cgggaggccc cgctccccac taggccccaa gcctgccgtg tgagtctcag tctcacctgg 33540 aaccctcctc atttctcccc agtcctcagc tcccaacccc agaggtatcc cctgcccctt 33600 tcaaggccct tgtcccttcc tggggggatg gggtgtatgg gagggcaagc ctgatccccc 33660 gagcctgtgc cgctgacaat gtccgtctct ggatcatcgc tcccctggct ctcagagctc 33720 cctggtccct ggggatgggt tgcggtgatg acaagtggat ggactctcag gtcacacctg 33780 tcccttccct aaggaactga cccttaaccc cgacactcgg ccagacccag aaagcacttc 33840 agacatgtcg gctgataaat gagaaggtct ttattcagga gaaacaggaa cagggaggga 33900 ggagaggccc ctggtgtgag gcgacctggg taggggctca ggggtccatg gagaggtggg 33960 ggagggggtg tgggccagag ggcccccgag ggtgggggtc cagggcccta agaacacgct 34020 gaggtcttca ctgtcttcgt cacggtgc tc ccctcgtgcg tgacctcgca gctgtaactg 34080 cctttcgatt tccagtcgct gcccgtcagg ctcagtagct gctggccgcg tatttgctgt 34140 tgctctgttt ggaggcccgg gtggtctcca cgttgcgggt gatggtgctg ccgtctgcct 34200 tccaggccac ggtcacgcta cccgggtaga agtcgctgat gagacacacc agggtggcct 34260 tgttggcgct gagctcctcg gtggggggcg ggaacagggt gaccgagggt gcggacttgg 34320 gctgacccgt gtggacagag gagagggtgt aagacgccgg ggaggttctg accttgtccc 34380 cacggtagcc ctgtttgcct tctctgtgcc ctccgaccct tgccctcagc ccctgggcgg 34440 cagacagccc ctcagaagcc attgcaatcc actctccaag tgaccagcca aacgtggcct 34500 cagagtcccc ggctgcgacc agggctgctc tcctccgtcc tcctggcccc gggagtctgt 34560 gtctgctctt ggcactgacc ccttgagccc tcagcccctg ccagacccct ccgtgacctt 34620 ccgctcatgc agcccaggtg cctcctccgt gaacccgggt ccccccgccc acctgccagg 34680 acggtcctga tgggagatgt ggggacaagc gtgctagggt catgtgcgga gccgggcccg 34740 ggcctccctc tcctcgccca gcccagcctc agctctcctg gccaaagccc ggggctcctc 34800 tgaggtcctg cctgtctacc gtccgccctg cctgagtgca gggcccctcg cctcacctgc 34860 cttcagggga cggtgccccc acacagcacc tccaaagacc ccgattctgt gggagtcaga 34920 gccctgttca tatctcctaa gtccaatgct cgcttcgagg ccagcggagg ccgaccctcg 34980 gacaggtgtg acccctgggt cccaggggat caggtctccc agactgacga gtttctgccc 35040 catgggaccc gctcctttct gaccgctgtc ctgagatcct ctggtcagct tgccccgtct 35100 cagctgtgtc cacccggccc ctcagcccag agcgggcgag acccctctct ctctgccctc 35160 cagggccttc cctcaggctg ccctctgtgt tcctggggcc tggtcatagc ccccgccgag 35220 cccccaagct cctgtctggc ctcccggctg gggcatggag ctcacagcac agagcccggg 35280 gcttggagat gcccctagtc agcaccagcc tctggcccgc accccagcgt ctgccctgca 35340 agaggggaac aagtccctgc attcctggac caaacaccag ccccggcgcc ccgactggcc 35400 ccattggacg gtcggccact ggatgctcct gctggttacc ccaagaccaa cccgcctccc 35460 ctcccggccc cacggagaaa ggtggggatc ggcccttaag gccgggggga cagagaggaa 35520 gctgccccca gagcaagaga agtgactttc ccgagagagc agagggtgag agaggctggg 35580 gtagggtgag agccacttac ccaggacggt gacccaggtc ccgccgccta agacaaaata 35640 cagagactaa gtctcggacc aaaacccgcc gggacagcgc ctggggcctg tcccccgggg 35700 gggctgggcc gag cgggaac ctgctgggcg tgacgggcgc agggctgcag ccggtggggc 35760 tgtgtcctcc gctgaggggt gttgtggagc cagccttcca gaggccaggg gaccttgtgt 35820 cctggaggtg ccctgtgccc agccccctgg ccgaggcagc agccacacac gcccttgggg 35880 tcacccagtg ccccctcact cggaggctgt cctggccacc actgacgcct tagcgctgag 35940 ggagacgtgg agcgccgcgt ctgtgcgggg cggcagagga gtaccggcct ggcttggacc 36000 tgcccagccg ctcctggcct cactgtaagg cctctgggtg ttccttcccc acagtcctca 36060 cagtccagcc aggcagcttc cttcctgggg ctgtggacac cgggctattc ctcaggcccc 36120 aagtggggaa ccctgccctt tttctccacc cacggagatg cagttcagtt tgttctcttc 36180 aatgaacatt ctctgctgtc agatcactgt ctttctgtac atctgtttgt ccatccatcg 36240 atccaacatc catccatcca tccatcaccc agccatccat ctgtcatcca acatccatcc 36300 ttccatccat tgtccatcca tctgtccatc ttgcatctgt ctgtccaaca gtggccatca 36360 agcacccgtc tgccaagccc tgtgtcacac gctgggactt ggtgggggga gccctcgccc 36420 tcccaccctc ccatctctcc tgaaacttct ggggtcaagt ctaacaaggt cccatcccgt 36480 ctagtctgag gtccccccgc agcctcctct tccactctct ctgcttctga cccacactgt 36540 gcactc ggac gaccacccag ggcccttgca tccctgtttc cttcctgacc tctttttttt 36600 ggctctggat ttatacacat tctgcctcct ggaggcgtct cagcttgagt gtcccacaga 36660 cgcctcagac tcagcatctt ccatcgaaac tgctcccagg tccttgcaga cctggtcccc 36720 cacattgttc tcaattcggt agatttctcc acaagccaga ggcctggact catcccataa 36780 tgcctgcccc tcattgagtc agcctctgtg tcctaccata accaaacatc cccttaaaaa 36840 tctcagaaga acaaaaaaag cacccagatg gcactgtcag agtttatgat gacaagaatc 36900 ctcagttcag ttcagtcact cagtcgtgtc cgactctttg cgaccccatg aatcgcagca 36960 cgccaggcct ccctgtccat caccaactcc cggagttcac tcagactcac gtccattgag 37020 tcagtgatgc catccagcca tctcatcctc tctcgtcccc ttctcctcct gcccccaatc 37080 cctcccagca tcagagtttt ttccaatgag tcaactcttc gcgtgaggtg accaaagtac 37140 tggagtttca gcttcagcat cattccttcc aaagaaatcc cagggctgat ctccttcaga 37200 atggactggt tggatctcct tacagtccaa gggactctca agagtcttct ccaacaccac 37260 agttcaaaag cctcaattct ttggcgctca gccttcttca cagtccaact ctcacatcca 37320 tacatgacca caggaaaaac cataaccttg actagatgga cctttgttgg caaagtaatg 3738 0 tctctgcttt ttaatatgct atctaggttg ctcataactt tccttccaag aagtaagtgt 37440 cttttaattt catggctgca atcaacatct gcagtgattt tggagcccca aaaaataaag 37500 tctgccactg tttccactgt ttccccatct atttcccatg aagtgatggg accagatgcc 37560 atgatctttg ttttctgaat gttgagcttt aagccaactt ttcactctcc actttcactt 37620 tcatcaagag gctttttagt tcctcttcac tttctgccat aagggtggtg tcatctgcat 37680 atctgaggtt attgatattt ctcctggcaa tcttgattcc agtttgtgtt tcttccagtc 37740 cagtgtttct catgatgtac tctgcatata agttaaataa gcagggtgat aatatacagc 37800 cttgacgtac tccttttcct atttggaacc agtctgttgt tccatgtcca gttctaactg 37860 ttgcttcctg acctgcatac agatttctca agaggcaggt caggtggtct ggtattccca 37920 tctctttcag aattttccac agttgattgt gatccacaca gtcaaaggct ttggcatagt 37980 caataaagca gaaatagatg tttttctgaa actctcttgc tttttccatg atccagcaga 38040 tgttggcaat ttgatctctg gttcctctgc cttttctaaa accagcttga acatcaggaa 38100 gttcacggtt catgtattgc tgaagcctgg cttggagaat tttgagcatt cctttgctag 38160 cgtgtgagat gagtgcaatt gtgcggcagt ttgagcattc tttggcattg cctttct ttg 38220 ggattggaat gaaaactgac ctgttccagg cctgtggcca ctgttgagtt ttcccaattt 38280 gctggcatat tgagtgcagc actttcacag catcatcttt caggatttga aatcgctcca 38340 ctggaattcc atcacctcca ctagctttgt ttgtagtgat gctctctaag gcccacttga 38400 cttcacattc caggatgtct ggctctagat gagtgatcac accatcgtga ttatctgggt 38460 cgtgaagatc ttttttgtac agttcttctg tgtattcttg ccacctcttc ttaatatctt 38520 ctgcttctgt taggcccata ccgtttctgt cctcgcctat cgagccctcg cctccctacg 38580 tagagactct aagcaggaag gtgacccgtg ctgcactggg tccagcatgc ttttaattca 38640 gcagtggaac ttctgggtca tgattgtgtt taagggatgc gcatacgatt tttgaagcaa 38700 aatttaacag gacagcagtg taaagtcagt acttatttct gattaaagaa agcaaatatc 38760 cagcctgtta ctaagttaat taactaaaga aacatcttca acttaataaa cagtatctcc 38820 tgaaacttac agcatgcttc acatttaaag gcaaaaccat tttagaggcc agggttccca 38880 cgcttacgtt tattatttaa tatatgctac agattcaagc ccatgacaca aaatgggggg 38940 aagagtgtga gtgttaggaa aaatgagata aaattggttt ttgcaggtga tgggctagtt 39000 tactttaaaa aaaaaaacaa aacaagctca agatgaactg aaggactatt agaactggta 39060 caagagttaa cctgtgatcg aatacaagca ggctgggcaa aactcagcag gttttcttct 39120 atacaggcag taatgattga gaatacgaaa cggcggaagc gcttacaacc tcgataacag 39180 ttctattaaa agccctagga atgaacttaa cacggnnnnn nnnnnnnnnn nnnnnnnnnn 39240 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 39300 nnnnnnnnnn nnnnngctcc ccccaccctc ccctcctccc cccccaccac cagtgcccca 39360 ggtctcgtgc ccagagagct gaagatgcca gcaggcccgc tgcctgcctc gctcgcgtgg 39420 cccgggctcg ctgccggtct gcctgcccag cacacagatg cagccccagc tctcgctgcc 39480 acccgcctcc cccaggcagg actctcccac aacaccaagg gcgtctctgg gttcaggatg 39540 gccctcgttg aggtgtaaag tgcttcccgg ggctgagacg aatgggccgg agatccaaac 39600 gaggccaagg ccgccacggc gcctggcgca gggcacccat ggtgcagagc ggcccagctc 39660 cctccctccc tccctccctc cctgcttctt tatgctcccg gctatgtcta tttttactct 39720 gcaatttaga aatgataccg aaggacaaac accgttcccc ctgtgtgtct gctctaaacc 39780 ctttatctac ttatctatta gcgtgtccaa gttttgctgc taagtgaatg aaggaacact 39840 acccacaagc agcaacgtcc ccacgaccct cgcctgttca ac tgggaatg taaatgtgct 39900 ttcaaaggac ctaagtttct atgttcaaaa ccgttgtgtg tttcttttgg gagtgaacct 39960 aggccactcg ttgttctgcc tttcaaagca ttcttaacaa ctctccagaa cccagggctt 40020 ggcttacgtt tccagaaatt ccaaagacag acacttggaa acctgatgaa gaaggcctgt 40080 gagcacagca ggggccgggg tacctgaggt aggtgggggg ctcggtgctg atggacacgg 40140 ccttgtactt ctcatcgttg ccgtccagga tctcctccac ctcggaggct ttcagcaggg 40200 tcacgctggt ggccagggtc gtgtatccat gatctgcaac cagagacggg gctgcggtca 40260 gcccgcgggc gggcagcagg caggagcagc caggagacgc agcacaccga ggtcctcaca 40320 tgcaggaggt gggggaagcg gctgtggacc tcacgactgc ccgatgtggg cctcttccaa 40380 agggccggcc tggaccctgg ctttctccag aggccctgct gggccgtccg cacaggctcc 40440 agccacaggg cctcttggga caggagggct ccagagtgag ccggccggcg ggaagaggtc 40500 tgacaccgct gcagtccaca acacgaagcg aggtggagat gggatgaggg atgagaaaca 40560 cttttctttt aaaacaagag cccagagagt tggaaagagc tgctgcacac gcaacatgaa 40620 ctcctggccc cggtgccagc ggcgctggga gcccgagttc tcggcaatcc gaccacagct 40680 tgcctaggga gccgggtgga gacggagggt taggg gaagg cggctcccca gggagcgcga 40740 ggcccggggt cgccaaggct cgccaggggc aagcgcagct aggggcgcag ggttagtgac 40800 cggcactgca cccggcgcag gagggccagg gaggggctga aaggtcacag cagtgtgtgg 40860 acaagaggct ccggctcctg cgttaaaaga acgcggtgga cagaccacga cagcgccacg 40920 gacacactca taccggacgg actgcggagt gcacgcgcgc gcacacacac acacacacca 40980 cacacacaca cacacggccc gggacacact cataccggac ggactgcgga gtgcacgcgc 41040 acacacacac ccaccacaca cacacccacc acacacacac ccaccacaca cacacacaca 41100 cacacacacc cccacacaca cccacacaca cccacacaca cccacacaca cacacccaca 41160 cacacacaca cacacacaca cacacacacg gcccggtggc cccaggcgca cacagcacgg 41220 agcaaacatg cacagagcac agagcgagcg ctagcggacc ggctgccaga ccaggcgcca 41280 cgcgatggat tgggggcggg gacggggagg ggcgggagca aacggnnnnn nnnnnnnnnn 41340 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 41400 nnnnnnnnnn nnnnnnnnnn nnnnngtatt aaagaagccg ggagcgagaa tatgacggca 41460 agaggatgta ggtgggggcg gggcaagagt aaagagagcg gacggtagag gggatgcgat 41520 tgtgatgcgg aagcgagacg aggagtga tg ccgtattaga ttgatagcaa gaggaacagt 41580 aggagggggg ggggagagga gggggaggtg gggggtggtg ggtgggaagg gaactttaaa 41640 aaaaagaggg gagagttgga ggggggaata aacgggcggt aaaaaagaac aatttgaaat 41700 taccagggtg gggcggccag gggggtgatt cattcttgga gggggcaaca tatggggggt 41760 ggctgtcgcg gattaggaga aaataaatat caggggtgat taagtgtttg gcgttgggga 41820 ataatgaagt aagaatcaaa tatgaatcgc gttggcatcg ttagccatcg ggggaaacat 41880 ttcccatgca aggaacaagg atgtgagaat gcgtccgtct gaaccaccgt cccggggtcc 41940 cagtaggact cgccgagctg atagttgccg gagcaacagt taagggagca gaagctgcta 42000 caaaaccacc acctgccaaa gtagggtctc caattacgga gtgcgcctcc tgggtgtcgg 42060 tccaaacctt tggaaaggac ctggaaataa gtgctaccca ccagatatta atataaaccc 42120 acctggccag gagaggcagg cgctgctggc acaggaagtg tccccagact cagtcatcaa 42180 ggtaaataat attttgggac ctccctggaa atccagtggt taggactctg cggttcaatc 42240 cctggtcggg gaactaagat cccacaagtc acaagacatg gccaaattta aaaaagaaaa 42300 aaagagagag aaatatttag tgcaataggt tttagaattg aaattaagct cctgcccacc 42360 cccacccccc aatctggatg aataaagcat tgaaatagta agtgaagtca ggctctgaca 42420 tgcactgatg tgactcacct taagcaaccc ccaccctagg actggtcggg gttccaggag 42480 tttcaggggt gccaggaaga tggagtccag cccctgccct ctccccccac cacgtcctcc 42540 actggagccg cctaccccac ctcccacccc tccgcaccct gctacccccc acccctgccc 42600 ccaggtctcc cctgtcctgt gtctgagctc cacactttct gggcagtgtc tccctctaca 42660 gctggtttct gctgcccgct accgggcccg tcccctctgt tcagttcagt tcagtcgctc 42720 agtcatgtct gactctttgt gaccccatgg actgcagcac accaggcctc cctggccatc 42780 accaaccccc agaacttact caaactcatg tccatcgagc cagtgatgcc atccaaccat 42840 ctcatcctct gtcgacccct tctcctggcc tcaatctttc ccagcatcag ggtcttttcc 42900 aatgagtcag ttctttgcat caggtagcca aagtattgga gtttcagctt cagcatcatt 42960 tcttccaatg aatattcagg actcatttcc tttgggatga actggttgga tctccttgca 43020 gtccaaggga ctctcaagag tcttctccaa caccacagtt caaaagcatc aattcttcag 43080 tgctcagctc tctttatagt ccaactctca catccatacg tgaccactgg aaaaaccata 43140 gcctcgacta gatggaactt tgtgggcaaa gtaatgtctc tgcttttgaa tatgctgtct 43200 aggttggtca taa cttttct tccaaggagc aagcgtcttt taatttcatg gctgcagtca 43260 ccatctgcag tgatttttgg agcccaagaa aataaagtct gtcactgttt ccactgtttc 43320 cccgtctatt taacggaggg aaatttccca gagcccccag gttccaggct gggccccacc 43380 ccactcccat gtcccagaga gcctggtcct cccaggctcc cggctggcgc tggtaagtcc 43440 caggatatag tctttacatc aagttgctgt gtgtcttagg aaagaaactc tccctctctg 43500 tgcctctgtt ccctcatccg cagaagtgac tgccaggtcg gggagtctgt gacgtctcca 43560 gaagccggag gattttctcc ccatttgctg aaagagagct cggggtgggg gaagcttctg 43620 cacccctagg atcaccagag gagccagggt cttcagggtt cccggggacc cctcagtggg 43680 ggctcaggaa ccacagagcc agaccctgat tccaaaaacc tggtcacacc tccagatgac 43740 cctttgtccc ttggctccgc ctcaaatgct ccaagcccca acagtgaagc gcttaagaga 43800 aggatccacc aggcttgagt ttggggagga gggaagtggg gagctggggg agggcctggg 43860 cctgggagac aggaatccac catggcttca ggcagggtct ctggggcctg cggggtggag 43920 agcgggcagg agcagacaga ggtgactgga cacgacacac ccctccactc caagggaggt 43980 gggcaggggc ggggcacaga ggaacaagag accctgagaa ggggtccacc gagcagactg 44040 ctggac ccag acatctctga gccagctgga atccagctct aagccatgct cagcccaggc 44100 agggtatagg gcaggactga gtggagtggc cagagctgca gctgcatggg ctgggaaggc 44160 cctgcccgtc ccctgagggt cccccagggt ctagccagac tccaatttcc gaccgcagca 44220 cacacaggag gaagtggtcg gggtggagtt ggcccagagg tctgggcagg tgcagggtgg 44280 gggaaggggg gcagctggag tcacccgctg aattcaggga cagtcccttt ttctccctga 44340 aacctggggc tgtcccgggg gccaccgcag cctccaggca gcggggggac ccagccccca 44400 atatgtgaga agagcaggtc ccaggctgga gagagcgaag caccatggtg gggagaagtt 44460 agactggatc ggggccccta ggggctcccc cggacctgca cggcagccgt cagggcaccc 44520 gcaccccatt gctgttcagt gctggccagt gtccaaggcc agggatgtgt gtgtgtgtgt 44580 gtgcgtgcgt gcgtgcgtgt gtgtgtgcgt gtgtgcgcgt gcgtgcgtgt gtgtgtgtgt 44640 gcgtgcgtgt gcgtgcgtag acgtgtgcgt gcgtgcgtgc gtgcgtgcgt gtgtgtgcgc 44700 acgcgcgcag cccagcctca gcactggacc aggcagcctg ggattcctcc aaaactgcct 44760 tgtgagtttg gtcaaaccgt gaggctctga tcaccgccat ccattcgccc cctcctgccc 44820 ccctcatcac cgtggttgtt gtcattatcg agagctgtgg agggtctggg aggtcatccc 4488 0 acctgccagc taaaccgtga ggctgccgca atcgcactga tgcgggcaga cccgagacgc 44940 tgtgccggag acgaaggcca gcttgtcacc ccgccagagc ggcagtcggg ccacaagcat 45000 catccaagca gtggttctct gagcccgacg gggtgatgca aaggagccag gagacacctg 45060 cgcgtccaag ctgggggacc ccaggtctgt tatgccggac agtaaacacg ttcagctccg 45120 gagggagagg gttcccctac cttccagggt ttctcattcc acaaacatcc aaagacaatc 45180 cataccgaag gcgatccgtg cctttgctcc tgagacgtgc ggaagcacag agatccacag 45240 acactgtctc ccaggatcct atgtatgtaa aggaaccgaa gtcccaggct gtgtgtctgg 45300 taccacatcc cacggaacag gctggactga ttttcaccaa atgtagcaga aacgttaagg 45360 agtatcagct tcaaaatatg agggccagac atgtctgaga agtcccttcc agaaaagtcc 45420 ctttggggtc cttccccaga gttgctgaaa cagagaaccg gaagggctgc agagctgaac 45480 ttaaacaact ggatcgcaaa ggtccgtctc atcagagcga tggtttttcc agtggtcatg 45540 tatggatgag agagttggac cataaagaaa gctgagcgcc gaagaatcga tgcttttgaa 45600 ctctggtgtt ggagaagact cttgagagtc ccttggactg caaggagatc caaccagtca 45660 atcctaaagg aaatcaatcc tgaatattca tgggaaggac tgatgctgaa gctgaaa ctc 45720 caatactttg gccacttgat gcaaagaact gactcactgg aaaaaccctg atgctgggaa 45780 aggttgaagg caggaggaga aggggtcgac agaggatgag atggttgggt ggcatcaccc 45840 acccatggac tcaatggaca tgggtttgag taaactctgg gagttggtga tggacagaga 45900 atcctggcat gctgcggtcc atggggtcat agagagtcag acacaactga gcgactgaca 45960 gaactgaagc aactggcaag ccggagggta ggtgccggct gcgatgagcg ggaacgtgca 46020 acctgccacg tggagctctt cctacaccca gagtcctgac ggcactggga ccctagccct 46080 ccacggcctc tccagggcca cgagacaccc tcacagagca gagaagcgga acagagctgg 46140 tgtgcagaac caggccccgg gggtggggcg gggctggtgg gcaggcttta gtgagaagcc 46200 cttgagccct ggaaccagag cagagcagaa cagttggcag aggcccccct gggagaggcc 46260 ccccgcccag agtaccggcc ctgggccctg ggggagaggg cggtgctggg ggcagggaca 46320 gaaggcccag gcagaggatg ggccccgtgg gacggggcgc accaaaacag cccctgccag 46380 caaggggaag ctggggcact ttcgaccccc tccaaggagg agcccacacc agcgcatctg 46440 cccaaggtgc ccttggccct gggggcacat gaggcccagg ccaggccagg gggcccatga 46500 ggcccccagg ggtcagtgca gtgtccccag gcagccctgg cctctcatcc tgctgggcct 46560 ggcctcttat cccgtgggcg cccacggcct gctgcccccg acagcggcgc ctcagagcac 46620 agccccccgc atggaagccc cgtcaggaaa gagcccttgg agcctgcagg acaggtaagg 46680 gccgagggag tcatggtgca gggaagtggg gcttcccttc gatgggaccc aggggtgaat 46740 gaccgcaggg gcggggaacg agaagggaaa ccagctggag agaaggagcc tgggcagacg 46800 tggctgcacg cacagcgctg accctgggcc cagtgtgcct ttgtgttggg ttttattttt 46860 aattttgtat tgagatgcta tttatctcgt ggagcttttg ccgccctgag attttgtacc 46920 cgtggctggt gtccctcttg cctcaccccg gcctctgtag cagggcagac acggcgcaac 46980 ggggcagggc gtgcccagga ggcactgtca ttttgggggc agcggcccca caaggcaggt 47040 ctgccttcct cccctcttac aggcagcgac agaggtccag agaggtgagg caagctgccc 47100 aatgtcacac agcacacggg cgcagtccca ggactgtaga aatcccggga ctagacaggc 47160 accagagtgt cctgtgtttt taaaaaaacg gcccaagaga agaggcaagt ctgcaaggcg 47220 tcccgggaag gcagcagggg cttggctcgg tctcccccaa ggaggccagc tcctcagcga 47280 ggttcctaag tgtctaacgg agccaagcct gaaccaaggg ggtcacgtgc agctatggga 47340 cactgacctg ggatggggga gctccaggca aagggagtag gg aggccaag gaggagagag 47400 gggtgcacag gcctgcaggg agcttccaga gctggggaaa acggggttca gaccacgggg 47460 tcatgtccac ccctccttta tcctgggatc cggggcaggt attgagggat ttatgtgcgg 47520 ggctgtcagg gtccagttcg tgctgtggaa aaattgtttc agatcagaga ccagcgtgag 47580 gtcaggttag aggatggaga agaagctgtg aaaaggtgat ggagagcggg gggacggtcc 47640 tcggtgatca ggcaccgaga tcgcccatgg aatccgcagg cgaatttaca gtgacgtcgt 47700 cagagggctg tcggggagga acaggcactg tcatgaactg gctacaaaaa tctaaaatgt 47760 gcaccctttt cggcaatatg cagcaagtca taaaagaaaa cgcatttctt taaaattgcg 47820 taattccgct tttaggaatt catctggggg cgggggaaca atcaaaaaga tgtgaccaaa 47880 ggtttacaag ccaggaagtc aactcgttaa tgatgggaga aaaccggaaa taacctgaat 47940 atccaacaga aagggtgtga tgaagcgcag catggcacat ccaccgcaag gaatcctaac 48000 acaaacttcc aaaacaatat ttctgacgtt gggtttttaa agcatgcgtg cactttcaaa 48060 agcttgtcag aaaacataga aatatgccaa taatgtgtct ctagccaaat tttttaattt 48120 ttgctttata attttataaa gttataattg tatgaaatat aatgataaaa ttataaacta 48180 taaaaaagtt atgaaaatgt tcacaagaag atata catgt aattttatct tctacaatac 48240 tttttaatac cagaataacg tgcttttaaa aaagattgag cacagaagcg tataaagtaa 48300 aaattgagag tttctgctca ccaaccacac gtcttacctt aaaacccatt ctccagcgag 48360 agacagtgtc atgtgggtct gtacacttct ggcctttctc ctaggcatgt atgtccctga 48420 aaactcacac acacggctaa tggtgctggg attttagttt tcaaaacgga ctcatactct 48480 gcctatgagc ctgcaactat ttattcagtc tgttgagatt ttctatatca gcccacatgg 48540 atcccgcatg ttctctgaat ggctctgtat gaattcaaag tttggaagaa gcagcgtgtc 48600 tttaatcatt cgcctattaa tggacgtttg gggtgtttcc actacaaaan nnnnnnnnnn 48660 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 48720 nnnnnnnnnn nnnnnnnnnn nnnnnnnnng atacaattcg agctcggtac cctggcttga 48780 actatatgaa cagagaacga tgagaacagt ttctcaaact tggaacagtt aacattttgg 48840 gctaaatgat tcttttttgt gtggagttgg cctatgaata gaggatatta gcagcatcat 48900 ttaaccttta ctcactacat acctgtagca actacatcct ctccatttgt gtcaatcaaa 48960 actgtctccg gacatggaca agtgtgcccc tgggatgggt ggaatgacct tttgttaaga 49020 accactgggt cagagattca tagatttt tg tcttgttgac tttttaaaaa tacatcttgg 49080 tttttatttt attggtttct gctcttatct ttatgattac cttcctttta cttggggctt 49140 ccctgataga ttttcccttc tggctcagct ggtaaagaat ctgcctgcaa tgcaggagac 49200 ctgggttcag tccctgggtt gggaggatcc cctggagagg agaagggcta cccaccccag 49260 tattctggcc tggaggattc catggagtgt atagtccatg gggtcgcaga gtcggacatg 49320 actgagtgac tttcacacac acatatgtcc ctggtagctc agctagtaaa gaatcccacc 49380 cgcaatgcag gagaccccgg tccaattcct gggtccggaa gattcccttt tgtttactcc 49440 ataagatctt atctggggac aaaactaaca gctatgccag accttctgga catcagggaa 49500 cgtgaggggt gtggactgga cagatgtgtg tgttctccca aacacaaaca tacatctgta 49560 tacatgtaca tggagagagg gggagggagg ctgtgagtct ccaggggacc gtgcaaccat 49620 gtgacattca tggaggcgtt tgcgggtgat cactacacag tttcttcttc tggtttcttg 49680 gtcaattgac ttcacaattc caattcctat acttcatttt agactgaggg aattttacac 49740 tattgtaaga catatgtata catgagttat gttcagcgcc atgagggctc attttgtgtg 49800 tccactttgc ctggaaacaa agttggactg atttacttct aggggtgcct gggggtgttt 49860 ctggaggaca ggagcatttg aacccaaggg ctcggtgaag catgagcctc tctgcaggtg 49920 gacccaggag gaacgcaagg ccgaggaagg cagactctcc tcctccctaa cccgaggtct 49980 ctgctcagaa aagggacaat ataatgacta gaagaaaaga aagaacatca gctgtgggag 50040 gtttgttctc tggagcagat tcacacgttg aggctcatgt gcaggaattc taggtgaaac 50100 agagcagtca cccatgtgtg ttggaaaatt ttaaattaca tttgcagtta cgactttgtt 50160 taagccagac agggtagcac agcaaagtca ccatgtggtc acctgtgttt tgtaaaggag 50220 agagaacttg ctggcacatt caggaaaggc cgtgtctcag ctttggaggc acactgagag 50280 gccacaagca gatggtgagg accagggtct cgggcagagg gatcaattca ctgctcttca 50340 cttttgccac atctgtgtgc tgtccatcct ggccagagta gttcagtctt cagatgctgg 50400 agttcccatt ggtagaaatc caatctgggt catttttaaa cctctcttgg ttctacttaa 50460 tggttttaaa atctctttgg ctcaagaaaa aaaataaaca taattttaaa gggtggtttg 50520 gggccttgac tataaagtac attatctggg ccatttcaga gcatggttga attaatacat 50580 ttcgtgctta ctatagctcc tattttcttg attctttaca ggtaattttt gttaggaatc 50640 gggtactgtg aatattttct tgttgaatac gggatctttg tattttttcc taattttttt 50700 ttttttttca ttt ttggttt taccttcagg aaagtcacta ggactcagga aagtcctttg 50760 tccgcctgtt atttcagtct cttacctggg gccagggcag cgtttcctct gggctaagtt 50820 tccccacaac cggggccagt tctcctcact cttcaccctg aggccttaat gaggagctcc 50880 cctgcgtctg agcagccggc cctcctgtga cgtgcgtgtg tctctggcca tcggcgtccg 50940 gtgtccttgg aggttccgtc ctcccttcgc tcactgtgcc ccgcactcga gctctcaggc 51000 tccaagcagt gtccgcagtg tgcagaccct ctgtgtagct ctctcctcct caggactctt 51060 ccctctagat gtgtgttttc ttttggctcc ttggacctcc gctctgaacg caggcctggt 51120 gctgagtgtg atctctggag ggaagcctgg gaggctggac gggtccgccc tgcggtgtgg 51180 tgacaggtgt gggctcgggg cggggcctgc acgtcgtcct gacccgagcc gggactgggc 51240 tccgggcctc aggcatcact gactgaatct ccctcacaga ggggtcaggg cctgggcggg 51300 ggaaccgtct ctgcaatgac agcccctccc agggagggca cagcggggag ctgccgaggc 51360 tccagcccta gtgggaggtc ggggagccca ggggagcggc ctgacggccc cacaccggcc 51420 cagggctggt tcgttctgtt tctcgagctc aacagaagct ccgaggagct gggcagttct 51480 ctgaattcgt cccggagttt tggctgctga gtgtcctgtc agcaccgtat ggacatccag 51540 agtcca ttag cagtggtctc tgtccctctg tctgtccttc atcaggctct ttgtccaggt 51600 caccacacgg ccaacaccag gacagtctgg tcccgccagc ccatcgtccc tgcggacgcc 51660 cctgtgcagc ctgccgaagg gccgggaggc cgggggaacc gggccaggcc tgtccctgct 51720 gtgtccacag tcctcccggg gctggaggag agcgtgagca ggacgggagg gtttgtgtct 51780 cacttccccg tctgtctgtg tcactgtgag gattatcact gctgtcagct gactgacagt 51840 aatagtcggc ctcgtcctcg gtctgggccc cgctgatggt cagcgtggct gttttgcctg 51900 agctggagcc agagaaccgg tcagagatcc ctgagggccg ctcactatct ttataaatga 51960 ccctcacagg gccctggccc ggcttctgct ggtaccactg agtatattgt tcatccagca 52020 ggtcccccga gcaggtgatc ttggccgtct gtcccaaggc cactgacact gaagtcggct 52080 gggtcagttc ataggagacc acggagccgg aagagaggag ggagagggga tgagaaagaa 52140 ggaccccttc cccgggcatc ccaccctgag gcggtgcctg gagtgcactc tgggttcggg 52200 gcaggcccca gcccagggtc ctgtgtggcc ggagcctgcg ggcagggccg gggggccgca 52260 cctgtgcaga gagtgaggag gggcagcagg agaggggtcc aggccatggt ggatgcgccc 52320 cgagctctgc ctctgagccc gcagcagcac tgggctctct gagacccttt attccctctc 5238 0 agagctttgc aggggccagt gagggtttgg gtttatgcaa attcaccccc gggggcccct 52440 cactgagagg cggggtcacc acaccatcag ccctgtctgt ccccagcttc ctcctcggct 52500 tctcacgtct gcacatcaga cttgtcctca gggactgagg tcactgtcac cttccccgtc 52560 tctgaccaca tgaccactgt cccaagcccc ccggcctgtg gtctcccctg gactccccag 52620 tggggcggtc agcctggcag catcctggcc gtggactgag gcatggtgct ctggggttca 52680 ctgtggatgt gaccctcaga ggtggtcact agtcctgagg ggatggcctg tccagtcctg 52740 acttcctgcc aagcgctgct ccttggacag ctgtggaccc gcagggctgc ttcccctgaa 52800 gctccccttg ggcagcccag cctctgacct gctgctcctg gccacgctct gctgccccct 52860 gctggtggag gacgatcagg gcagcggctc ccctcccgca ggtcacccca aggcccctgt 52920 cagcagagag ggtgtggacc tgggagtcca gccctgcctg gcccagcact agaggccgcc 52980 tgcaccggga agttgctgtg ctgtgaccct gtctcagggc ggagatgacc gcgccgtccc 53040 tttggtttgt tagtggagtg gagggtccgg gatgactcta gccgtaaact gccaggctcc 53100 gtagcaacct gtgcgatgcc cccggggacc cagggctcct tgtgctggtg taccaaggtt 53160 ggcactagtc ccaccccagg agggcacttc gctgatggtg ttcctggcag ttgagtg cat 53220 ttgagaactt acatcatttt catcatcaca tcttcatcac cagtatcatc accaccatca 53280 ccattccatc atctcttctc tctttttctt ttatgtcatc tcacaatctc acacccctca 53340 agagtttgca ttggtagcat atttacttta gcacagtgtg cctcttttta ggaaactggg 53400 ggtctcctgc tgatacccct gggaacccat ccagaaattg tactgatggc tgaacccctg 53460 cgtttggatt cttgccgagg agaccctagg gcctcaaagt tctctgaatc actcccatag 53520 ttaacaacac tcattgggcc tttttatact ttaatttgga aaaatatcct tgaagttagt 53580 acctacctcc acattttaca gcaggtaaag ctgcttcgca tttgagagca agtccccaga 53640 tcaataaaga gaatgggatg aacccaggat ggggcccagg ggtcctggat tcagactcca 53700 gccgtttagg acagaacttg actaggtacg aagtgagcgg ggtggggggg caatctgggg 53760 ggaactgtgg cacccccagg gctcggggcc atccccacca catcctggct ttcatcagta 53820 gccccctcag cctgcgtgtg gaggaggcca gggaagctat ggtccaggtc atgctggaga 53880 atatgtgggg ctggggtgct gctgggtcct aggggtctgg ccaggtcctg ctgcctctgc 53940 tgggcagtga taattggtcc tcatcctcct gagaagtcac gagtgacagg tgtctcatgg 54000 ccaagctatt ggaggaggca gtgagcactc ccacccctgc agacatctct ggaggcatca 54060 gtggtcctgt aggtggtcct ggggcttggg ccgggggacc tgagattcag ccattgactc 54120 tcagaggggc cagctgtggg tgcagcggca gggctgggcg gtggaggata cctcaccaga 54180 gccaaaataa gagatcaccc aacggataga aattgactca caccctttgg tctggcacat 54240 tctgtcttga aatttcttgt ggacaggaca cagtccctgg ataaagggat ttctatcttg 54300 cgtgtgcaat agagctgtcg acacgcttgg ctgggacatg taatcctttg aacatggtat 54360 taaattctgt tcactaacat ctgaaaggat ttttgcatca ataaacctaa ggtatattgc 54420 cctgtcattt ccttgtcttg tagtgtctct gagtaggctg gaaggggtaa ccagcttcac 54480 aaatcgagtt aggaaattcc cttattcttc cactgtctaa tagactttca taagattagt 54540 gttaattcct ctttaaatcg ctgctataat catcactgtg gccaccggta ctgaattttt 54600 tgttaggatg atttttaaac aagcatttta atgatttttc cttttatttt cggctgtgct 54660 gggtctcgtt gctgtgtgcc ggcgttctct cgctgtggcc agtgggggcg ctgctctcgc 54720 gttgcgaagc tcgggcttct gactgcagtg gcttctctcg ttgcagagcg cgggctccag 54780 ggcgctcagg ctcgcgtggc tgcggcacgt gggctcagta gtcctggggc acaggtgcag 54840 cagcctctca ggacgttttg ttcccagatg gtgggtcggt cg aaccggtg tcccctgcgt 54900 tgcaaggtgg attcttcacc gctggaccac cagcgacgtt ccctggaggt ttttaattat 54960 ggatttaagc tctcattaga tgtctcctca catttcctat ttctttttga gtcagtttga 55020 tactttgttt gtgtctgtaa gtttgtccat tttatccaag tcatctaatg tgttgataga 55080 caattattgg ttagtcatct aattgttggt ttacaatttt gagagcattg tcctgcaatt 55140 ccttctatct gcaagattgg taataatatc tcccaagagg agtcacaaac tgaaatgaga 55200 ttanatacag gctttttttt taaaagaatg aacttatgtt gttgcctttc tcatagatct 55260 tacttcttag catgactgta cttactgact ggggcgtttt catgtctgtg tggagagcta 55320 ccattagtac ttcttatcgc ccaaagacat cgggctcctg ggcacagtga aaacactcct 55380 ttctgtggct attttgcaaa atatggccta gcctagcgtc ataagggatc acagctgaca 55440 actgctggaa cagagggaca tgcgaagcaa cgtgagggct ggaacctgga gggtcctctc 55500 tggggacagt ttaaccagct ataatggaca ttccagcatc tgggacatgg agctgtgaac 55560 tggaccaatg actgtcattt ttggaagaga aatcccagga gagaagggtc caggggaatc 55620 tgaggccgca tgcagtgcct caggacaggg gacaccttct ccagcagagc aggggggccc 55680 gcccaggccg cctgcagtga ttccaccagg aggag atgca tccctgcaga cctctgacag 55740 cacggccctc tcctgagaca cagggtcaca cccggggccc tggaaccctt tgagacccta 55800 aacctttcct ttcctgacca ccctgacagc agtctagctc agaacagaca tcttcatttt 55860 cagcaggaaa atccttttcc tcgtttgagg gagcgactgg caccggagga gctgagtctt 55920 ttaaacacag gctgcctgaa cctcagggat gacctgcagc tgctcagagg aggctggagt 55980 gtgatagctc actctaatgt tactaaaagg aacatattgg acaccccctc tctgaaaaat 56040 ttccctcctg cctctcatct cttagtccac tttatcgccg ttttactgct tttctattta 56100 ctactcttaa cgccaaccta tcttatttcc cctcccagtt taacacggtt ttccctccac 56160 ccgctctctt taatctcaga agattctgcc tattcctcta ttatcacacg cccctacttt 56220 ttattttttt tcttacccgc cttttattcc ctcccctcct cactctctat ttaattacat 56280 cttaactaca ccgcctgcgc tatcttcgaa tgtatccaaa tatttttccc ttatataaca 56340 ctccaggccg agcggctaac ttattataat ttctttatag cgcctaccta atttcccttt 56400 atttctaatt atctatatat acccatgcaa tttcgnnnnn nnnnnnnnnn nnnnnnnnnn 56460 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56520 nnnnnnnnnn nnnnntgggt gtacgtta ta gagtaaacgc gcatgaagaa gtgggtcaat 56580 ctatggctgt gagaggcaga aaataatatt atcatatata atttatgtta taacacactg 56640 aggtggtggg ctcgtagaat agtgcggacg gggagaaagg tgggaaggag aagacacaag 56700 agagagatgt tcgcctcgcg ggatggatgg gcggagggat agaagaataa aaagaggaga 56760 ggtatagagg ggggcggggg gcataacgtg tggtggggta aatagtaggc ggtaattatg 56820 aaaaaaagaa agacgggggg ggcggtaaca tagaatacgc aaaaaagtca tatactgaac 56880 ggggattagg gagaagaggt ggggggcgtg gggtgcgggg gaaagaggtg tgtgtataat 56940 tggtatggag tgttatttga atatatatta atgtaatagg gagtgtaatt agtgaaattg 57000 tgggagtatt atattggggt gtgggggaca tggcaaagtg atgatcggga taaaaaaagt 57060 aaagcaagag gggaggggaa aataaggggg gggagaaggt cgaagaaaat aagaggaaga 57120 agaaagaacg ggggtggcgg gcgggggggg cgccgctctt gtatctggct tttttgttgt 57180 gtcggtggtt gttcgcgtct tgttgggtcc ggggcgggtg tgcggaaaaa aaaaaaggcg 57240 ggaggcccgg ggcccggtca cgcggcaccc ccgcgggtcc ctggcttctc cttcggcagc 57300 tccgggggtc ggtgagcctg cgccctccgg gccgccggcc cgagctgtgt gcgccctgga 57360 gaatcggagc cgctgtggca gcacgcggag ggcgcgcgca agggccacgg gacggacctt 57420 caaaggccgc ggcggagcgc ggcaagccga accgagggcg gtctggcgat cggccgagcc 57480 ctgctccccc ctcccgcgtg gccccagggt cgcgggtgga ctggggcggg tacaaagcac 57540 tcacccccgt cccgccccca gaaagcctcc caggactctc acagagcacc cgccaggagg 57600 catccggttc ccccctcggc tcagttcagt tgctcagtcg tgtccaactc tttgcgaccc 57660 catggactgc agcaccccaa gcttccctgt ccatcaccaa ctcccggagt ttactcaaac 57720 tcatctattg agtcagtgat gccatccaac cgtctcatcc tctgttgtcc ccttctcctc 57780 ccactttcaa tctttcccag catcagggtc ttttcttatg agccagttct tcacatcagg 57840 tggtcagagt attggagttt cagcttcagc atcagtcctt ccaatgaaca ctcaggactg 57900 atttccttta ggatggactg gctggatgca gcgccagaca ccgaccgcgt ttaccccgtg 57960 tgtcctttcc aatggctgtc ccctgcgggc ctaggggcat tggtgcgggt ttgaatcctg 58020 tggccttgaa ttttacgcct tagttccagg tccagggcag ggccatccgg attcaggatg 58080 cttcccagcc cttcaggaat ggcaggtttt catggtcctt tctgagtgag ttctgagtgg 58140 tcatattggt gcccttggca gggagggctc ctgactttcc tatcttcaca tcactgtccc 58200 caacccccaa gag aggcctc ttggcccagg gactgcaggg aggatgaagt caggagcaga 58260 agcatggggt agggggctca ggtgggcaga ggaggcccct ctgtgaggag gaacggcaag 58320 cgaggaggga acaggggcac cggcagtgcc tggcaagctg ggtgatgtca cgactacgtc 58380 ccgaccacac agtcctctca gccagcccga gaagcagggc cctcccctga cccccatctg 58440 ggcctgggct tcagttttct cctccctgca atggggtgac tgtttgcctc caggagaggg 58500 gagcatgtaa aggtggccac tctcttctgg cagacatgcc aggcctgggc cagcctccac 58560 ccctttgctc ctgcagcccc tgctgacctg ctcctgtttg ccacaccggc ccctcctggg 58620 ctgatcaggg cccccctcct gcaggaagcc ctctgggaca agcccagctt gctgtaactg 58680 tggctttcca ctgtgacctg caacgtggga ggctgttact taaaactccc atgactggtg 58740 gattgccggt ccccagaaca aggccacgca tccctggagg ccctcgagac catttaaggt 58800 agttaaacat ttttacttta tgcattttca tgtgtatcag aaagaaaaaa aatgtatcat 58860 cagttcatca aatccatgat ttcttgacca atattgctaa gatgaggctg aaataggcat 58920 ttccattttt aaaaaactga atcactctga agaaacagat ggcaggcttc cctggtggtc 58980 cggtggttaa cagtccatgc ttccagtgct gggggcatgg gttcgatccc tgaaaatttt 59040 aaaaag gaag aaaaagatgg ctcccccgtc cctgggattc tccaggcaag aacactggag 59100 tgggttgcca tttccttctc cagtgcatga aagggaaaag ggaaagtgaa gtcgctcagt 59160 cgtgtgcgac tcttagcaac cccatggact gcagcctacc agactcctcc gtccatggga 59220 ttttccaggc aagagtactg gagtggggtg ccattgcctt ctccaggcaa acggcctgct 59280 actgctactg ctgctaaatc gcttcagtcg tgtccaactc tgtgcgaccc catagacggc 59340 agcccaccag gctcccccgt ccctgggatt ctccaggcaa gaacactgga gtggggtgcc 59400 attgccttca gcctgctgct gctgctgcta agtcgcttca gtcgtgtccg actctgtgtg 59460 accgcataga cggcagccca ccaggctccc ccgtccctgg gattctccag gcaagaacac 59520 tggagtgggt tgccatttcc ttctccaatg catgaaagtg aaaagttaaa gtgaaattgc 59580 tcagtcgtgt ccgactctta gtgacccaat ggactgcagc ctaccagggt cctccatcca 59640 tgggattttc caggcaagag tactggagtg gggtgccatt cggcctaggg agtgagaaat 59700 cacggctgtc ttccctcttc tcgccctcta ggggtctctg tggagcctcc ctggagaggc 59760 cgcggcggct ccggggactg gagggggagg gggggttgag tcagccggtg gccctcccct 59820 cgctgcccgt ctcctccctt tttaggcaca agctgggcgc cctttttagg cgcagcctca 5988 0 ccctgcgggc cactgcccgt gtttcggctc cccggagata aaacagattg cctgcacccc 59940 gggtcatcac aaggattgta tgaccgtttc ccagtgtgct caccaccctc cctctgattc 60000 tcagagacgc gccctcgcct caggaggctg ctcatcccag gccaaggggc ggcgtggggt 60060 ccccagcgcc ccgcacagac actgccttct gaccacctcc tcccaacagc ttacctgcca 60120 agaaggcctc ctgacccctc atcctgcccg gtggtttgga gaaagcctca tctggcccct 60180 ccttctcggg gcctcagttt ccccctctgt gaactggcgg attctgccaa gctgacgtcc 60240 tggccagccg cctccccgtg gccagtgtcc cccgggacac agctgaatgt ccctgctcgg 60300 gatgcacctt cccaagttgg cctgtcagga ggcgggggcg agcagggaaa cccgactcct 60360 ctcagacggc ccatcgcatt ggggacgctg aggcccggag cagcggcacc ctcctggcca 60420 gggtcattct cccgccccgc cccgtccctc cgggcctccg agaccgcagc ccggcccgcc 60480 ccgggaagga ccggatccgc gggccgggcc accccccttc cctggccgcg ggcgcggggc 60540 gagtgcagaa caaaagcggg gggcggggcc ggggcggggg cggggcggag gatataaggg 60600 gcggcggccg gcggcacccc agcaggccct gcacccccgg gggggatggc tcgggccgcc 60660 ggcctccgcg gggcggcctc gcgcgccttt ttgtttttgg tgagggtgat gggggcg gtc 60720 gcggggtact attttttcat ttataattgg gtattagcta gcgagtggaa ccacaccctt 60780 attccactat agccaatttt tgcgggggca tcttacatta cagactcgcc cgcctcttat 60840 ttcggtacag catatcagat cgtctcttta ctcagacact agtgattatt gtctatagta 60900 cacaaaaaga acggttgtgt cggcgtaatg gttgcatttt ccctcctcgt ttctcctgac 60960 cacctcaatt acaccaacac tctactattt aaatcacgta ttgtacgcca ccctccgccc 61020 gcgaactaaa agaatgtgca gatattctga agataaaatc gttcattgtt acgccccgcg 61080 cgcttcgcgt atattactct tagaacttct tattcgcccg agcagttatt caccccccgc 61140 aactagatgt cgccttaata tttgttctaa ccgttttgga ttctaacgat aggcgggaaa 61200 ggtagacatt cgaccgctac gacaactaaa atcgacgagc acaggctatt tatatcgcga 61260 ccacacgcgc gcggtataca naccgtaaaa ttatctaaca tcgagagtaa gggcacagag 61320 cgaaatacaa gcggcgtggt gggaggtgtg tctgtagtga attcgcacct cgcgccgccg 61380 cctctgtgcg tcgnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 61440 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnngatataa 61500 tattaataaa cagcggatag atgtgtgtaa gggaggaggt gcataagaga ttaaagagag 61560 gcgggcggag agaaatagag tagaggagga tgagagaaaa aagaaagcaa gcgtaggtac 61620 aacggcgggt gggtagtatg ataaagtgag tgtatatatt tgagtaaagg aagggtagat 61680 ggagtataaa gaagtaagga gaggagaggg cggcggagag agagagtgca aagaaaataa 61740 gtgggcaaag gcggggtggg tgagaagcag tagaagagaa gatagagaag ggggaaaaag 61800 aggaaaatga ggattagaac aagtaggaca ggatagatgt gaaaaatgag atcaggtcaa 61860 ggtggagaaa aagtagaaac tggggcgtga ttgtaaaaaa gggaggccgc gatggggcag 61920 caccataagc gaagagatga attaatgaaa gcaaggcagg gagaatcaaa tgagttgggt 61980 ggaggaagga ggctgtgact tccttcgctg ccggaaagag aactagaata gcctcgggct 62040 gtggggggag gtaaagataa agtgacttct gggccctggg ggaggcccag gagtttctac 62100 cgagctgagc tgggtgcctc tcccaaatgc ccaaccccct gagagtcgac gggagagcac 62160 agcctggcca aacctgggca gggcacacgt gtccttcacc ccacagtggt cacgagccca 62220 gcgtggtccc tgcgtctggc gggaaacaca gaccctcaca ccccacacaa gggtccggcc 62280 gctttcaaat aacagcagcc gtgccctctg ggccggtgac ccggacacag agagatgaag 62340 tccgcatctc tcagagtgcg ctgtcctccg cccggtcagg cc cgggtccc ctgcttctct 62400 gaggtcacca ggagggattg catgtgggtc tcagggacac aggttcagtg atgtgacaga 62460 gggtagtggg tcccagcagg gccggtcttt ggacccgttt ttctgaaaag ccagttggcg 62520 acctggggtc acagcaaagc tgatcctgtt tggccaggag tctcccagtg acggcctccc 62580 ccagaacatc gggcccagtg ggggctccag ggggtagact tgcctcccag ctcacgcccg 62640 tgtcttgaca agtccatgat ttggtaaaat taatttgtgt tggatggagt tgatttagtg 62700 gtgtgtgagt ttctgtggcg cagcaaagtc aatcagttac gcatacacat gtatccagct 62760 cttcctacga ttctgttccc atataggtca ttatggggtg tcaggtagag cttcctgtgc 62820 tacgcagtac ggccttattc agttcagctc agtcgtgtcc gactccttgt gaccccatgg 62880 actgcagcac gccaggctcc cctgtccatc accaactcct ggagcttatt caaactcatg 62940 tccatcgagc cggtgatgcc atccaaccat ctcatcctct gtcgttccct ctcctcctgc 63000 cttcagtctt tcccagcacc ccctagagaa gggaatggca aaccacttcg gtattcttgc 63060 cctgagaacc ccatgaacag tacggaaagt ccttattagt tttctatttt atatatagca 63120 gtgcacacgt gtcagcccca atctcgcaat ttatcacccc cctccgccgc cgattggtag 63180 tcatgtttgt tttctacatc tgcgactcta tttct gtttt gtaaacaagt tcatttacac 63240 cactttttta gattctgcac atacgtggca agcccacagc aaacatgctc aatggtgaaa 63300 gactgaaagc atttcctcta agatcaaaaa caagacgagg atgtccactc actccgtttt 63360 tactcaacac agccctgaac gtcctagcca tggcaatcag agaagagaaa gaaattaagg 63420 aatccaaatt ggaaaagaag aagtaaaact cactctttgc aaatgacatg acacttatac 63480 ccagaaaatc ctagagatgc taccagataa ctattagagc tcatcagtga atttgttgca 63540 ggatacaaaa ttaatacaca gaaatctcct gcattcctat agactgacaa caaaagatct 63600 gagagagaaa ttaaggaaac catcccacgg catgaaaaag agtaaaatac ctaggaataa 63660 agctacctaa agaggcaaaa gacctgtact cagaaaacta taaaatactg acaaaggaaa 63720 tcagacgaca cagagagaga gagataccac gctcttggat gagaagaatc gatagtgtga 63780 caatgactat actacccaga gaaacataca gattcagtac aacccctatc aaattcccaa 63840 tggcattttt cacagaatca gaattagaac aaaaagtttt acaagtttca gggaaacaag 63900 aaagatccta aagagccaga gcaatcttga gaaagaaaaa tggagctgga agagtcaggc 63960 tccctgagtt ctgactgtgt atacaaagct ggcatgattt ttaacagcag gggtgtaaat 64020 gaacttgttc acaaaacaga tggtgggg tg ggcttccctg gtggctcagc tggtaaagaa 64080 tcctcctgca acgcaggaga cctgggttcg atccctaggc tgggaagatc ccctggagaa 64140 gggaaaggct acccactcca gtattctggc ctggaaaatt ccaaggacca tatagtccat 64200 gggtttgcaa agagtcggac acgactgagc gacttccaat cctggaaacg tcccattgtg 64260 gacggtgaac tggggttgtc caagctcagg gtaaccgttt gctgagtgac tgacactcct 64320 tctcatgggt taaaatgtgg ggcccaaggc caggaccaga ccccgcagtc agccaggcag 64380 accctgtgca gccccagcga gtgtgtggcc gccgtggagt tcctggcccc catgggcctc 64440 gactggagcc cctggagtga gcccattccc tcccagcccg tgagaggctg ggtgcagccc 64500 taaccatttc ccacccagtg acagatccgc ctgtgtggaa acctgctctt gtccccaggg 64560 aacctggcag gactcaggga gaatgtctca gggcggccac agatcagggg ctgggggggc 64620 agggctgggt ccagcagagg ccctgtgccc actccccgga aagagcagct gatggtcagc 64680 atgacccacc agggcaccga cgcgtgcttg cacacaggcc gccccctcat ggtgacactc 64740 ttttcctgtg gccacatctc gccccctcag gtccctcctg ctccccagct cctggcctgg 64800 gaacctcttc cccgccccgg ggacgtcagg gctggtgtcc actgagcatc ccatgcccgg 64860 gactgtgctg atcaccagca cctgcacccc ctctcgggtc tcaccaggat gggcaactcc 64920 tgcccatcca gcacccagcc tcctgggtac acatcggggg aggagggaga agcctgggcc 64980 agacccccag tgggctccct aaggaggaca gaaaggctgc cgtgggccag ccgagagcag 65040 ctctctgaga gacgtgggac cccagaccac ctgtgagcca cccgcagtgt ctctgctcac 65100 acgggccacc agcccagcac tagtgtggac gagggtgagt gggtgaggcc caggtgcacc 65160 agggcaagtg ggtgaggccc gagtggacag ggtgagtggg tgaggcccag gtagaccagg 65220 gcccatgtgg gtgaggcccg ggtggaccag agtgagcggg tgaggcccag gtggacaggg 65280 cgagcgggtg aggcccaggt ggacagggcg agcgggtgag gcccgggtgg acagggcgag 65340 cgggtgaggc ccgggtggac agggcgagcg ggtgaggccc gggtggacag ggcgagtggg 65400 tgaggcccgg gtggaccagg gcgagtgggt gaggcccggg tggacagggc gagtgggtga 65460 ggcccgggtg gaccagggcg agtgggtgag gcccaggtgg acagggtgag tgggtgaggc 65520 ccaggtagac cagggcccag agcaaagccc cggctcagca gtgatttcct gagcgcccac 65580 tgcttgcagg gacctcagcg atggtaaggc agccctgttg ggggctcccg actggggaca 65640 gcatgcagag agcgagtggt cccctggaga aacagccagg gcatggccgg gcgccctgcc 65700 aggctgcccc agg ggccaca gctgagcccc gaggcggcca ggggccggga cagccctgat 65760 tctgggttgg gggctggggg ccagagtgcc ctctgtgcag ctgggccggt gacagtggcg 65820 cctcgctccc tgggggcccg ggagggacgg tcaggtggaa aatggacgtt tgcgggtctc 65880 tggggttgac agttgtcgcc attggcactg ggctgttggg gcccagcagc ctcaggccag 65940 cacccccggg gctccccacg ggccccgcac cctcacccca cgcagctggc ctggcgaaac 66000 caagaggccc tgacgcccga aatagccagg aaaccccgac cgaccgccca gccctggcag 66060 caggtgcctc cctctccccg gggtgggggg aggggttgct ccagttctgg aagcttccac 66120 cagcccagct ggagaaaggc ccacatccca gcacccaggc cgcccaggcc cctgtgtcca 66180 ggcctggccg cctgagacca cgtccgtcag aagcggcatc tcttatccca cgatcctgtg 66240 tctgggatcc tggaggtcat ggcccctctc ggggccccag gagcccatct aagtgccagg 66300 ctcagagctg aggctgccgc gggacacaga ggagctgggg ctggcctagg gcaccgcggt 66360 cacacttccc ctgccgcccc tcacttggga ctctttgcgg ggagggactg agccaagtat 66420 ggggatgggg agaaaaatgg ggaccctcac gatcactgcc ctgggagccc tggtgcgtct 66480 ggagtaacaa tgcggtgact cgaagcacag ctgttcccca cgaggcctca cagggtcctt 66540 ctccag ggga cgggacctca gatggccagt cactcatcca ttccccacga ggcctcacag 66600 ggtccttctc caggggacgg gacctcagat ggccagtcac tcatccattc cccatgaggt 66660 ctcacagggt ccttctccag gggacgggac ctcagatggc cagtcactca tccattcccc 66720 acgaggcctc acagggtcct tctccagggg acgggacccc agatgggcca gtcactcatc 66780 catccgtctg tgcacccatc cgtccaacca tcacccttcc ctccatccat ctgaaagctt 66840 ccctgaggcc tccccgggga cccagcctgc atgcggccct cagctgctca tcccaggcca 66900 gtcaggcccg gcacagtcaa ggccaaagtc agacctggaa ggtgcctgct tcaccacggg 66960 aggagggggg ctgtggacac agggcgcccc atgccctgcc cagcctgccc cccgtgctcg 67020 gccgagatgc tgagggcaac gggggggcag gaggtgggac agacaggcca gcgtgggggg 67080 ccagctgccg cctggctgcg ggtgagcaga ctgcccccct caccccaggt acaggtctcc 67140 ctgatgtccc ctgccctccc tgcctccctg tccggctcca atcagagagg tcccggcatt 67200 ccagggctcc gtggtcctca tgggaataaa aggtggggaa caagtacccg gcacgctctc 67260 ctgagcccac ccccaaacac acacaaaaaa atccctccac cggtgggact tcaccagctc 67320 gttctcaggg gagctgccag ggggtccccc agccccagga agccaggggc caggcctgca 6738 0 agtccacagc cataacacca tgtcagctga cacagagaga cagtgtctgg tggacaggtg 67440 cccccacctg cgagcctgga gagtgtggcc ctcgcctgcc ccagccgcgg tcagtcggct 67500 cagcaaccgc tgtccactcc cagcgccctg gcctcccctg tgggcccagg tcaagtcctg 67560 ggggtgaagc taagtcaggg agcctcatcc atgcccagcc cggagcccac agcgccatca 67620 agaaatgctt cttccctcca tcaggaaaca ttagtgggaa agacaagagc tggggggttc 67680 tggggtcctg ggggatcaga tgaaggggtc tgggagcagc agcagcctca ggcaccccaa 67740 aacaaggccc aggagctgga ctcccagggc tgaggggcag agggaaggaa ggcctcctgg 67800 ggggttggca tgagcaaagg cacccaggtg ggggctgagc acccctcggc tggcacacac 67860 aggcccccac tgcagtacct tccccctcgg agaccctggg ctcccgtctc ccgcctggcc 67920 tgccatcctg ctcaccaccc agaaatccct gagtgcggtg ccatgtgact gggccctgcc 67980 ctggggagga aggagattca gacagacagg atgccagggc agagaggggc gagcagagga 68040 tgctgggagg gggcccgggg aggcctgggg ggcagggggg caggagttct ccagggtgga 68100 cggcgctgtg ctatgctcgg tgagcacaga ggccccgggt gtcccaggcc tgggaaccca 68160 gcagaggggc agggacgggg ctcaaaggac ccaaaggccg agccctgacc agacctg tgg 68220 gtccagaagg cagctgcgcc ctgaggccac tgagtggccc cgtgtcccga accaccgctg 68280 aaacatggga cacacgttcc caggcggagc cactcctgcc ttccgggagg ctcccagcgg 68340 gctcatcgct ccatcccaca gggagggaaa ccgaggccca gatgacgaac atcccggcga 68400 gcaggtcaaa gccagcccct ggggtcccct ctcccggcct ggggcctccc ctctgcaggg 68460 tgggaaaccg aggccacaca ggggctccat ggggctgccc tctgccaggc cctggacacc 68520 ccgcgggtga cccccgcctc tatcatccca gccctgccag gccctggaca ccccgtggat 68580 gacccccgcc tctatcatcc cagccctggg ggacagatgg gaggcccaag cgtggacccc 68640 ctggccaccc cctaccccac agccgggagg agccgggagc tggtggccaa gggcctagag 68700 gagccagann nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 68760 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnca atatagaggg 68820 ggtgggataa agggtaatat gatgtttagg tagttagagt taaattagaa gggtttggat 68880 aaagattaat aaaattacaa gcgtacatat cgtgtgagtg tgggtgataa tatttgtgta 68940 tgtggggaat agaagtgagt gtgagtagta ttcaagatgt aagtgtgcga atacaggtct 69000 gagcgatttg aatggaagtg aaaaaaagcg tgtgtgtgga ggaggcggga gaggaagata 69060 gtgtggggga agaaaagaag gctagtgggt aaagaaatat cagtaggcgg ttgacgaaag 69120 aagaactagg aagaattaat ataaaaataa agggaggatt aaaaaataaa gagggaggag 69180 gtaacggaaa tagttagtta agaaaagaat ggagagtgga ggtaagataa ataagggagt 69240 aatgggagtg aggaggaata aataaaaaaa tggtgaggga aaatagagta gaatgagaac 69300 aagaatgaaa aagggagtga agggggtgaa aaaaagtgaa gttgaaaaaa gaggaaaaaa 69360 aaggagaaga taaaaaaata aaataaaaaa aggaaaaaaa agaaaaaaag aaagaagggt 69420 taaaggacga aaagaaggga agagaaaaaa aatagtttaa gtgggggagg gtaaaaaaga 69480 attaataaag taaatatggt tgtggtcgaa aaaaaaaaaa aaattgttgt gttgatgaga 69540 agaaaagaaa aaagaagaaa gggaaaagca aaaagaaagg agagaaaaag acaaccccac 69600 cgcccgggcg catggagggt gaggatggcg cacgcccgcg gatggcacag catcacagca 69660 atcctaaaac gttttcagac cggtgcatct tcaccgcgcg cgcgccccgc ccggccctcc 69720 tcccgccctg accgcggacc cccacccgca ccggggagcc tacccccacc ccggggacgc 69780 tccgccacgc taaggtcagg actgccgtga agacgcgccg gggtgaaaac gttttatctt 69840 catgacataa gcgagtggtt ttgaaacagg tttacaaacc ct cgtgaaga cgcaccctta 69900 gcgttaggtt ttgttttttt accatgtgac gatgcaacta ttttcttcct ctcttccaca 69960 gtggctagtc gcctccagag cgaggggtat ctcttgtaca gagaccctcg gaacatccgg 70020 aggtagtttc ccacctaggg gtaaagcgag aaggctcatt acgagggccg gggctcctcg 70080 gggaagggca gggccctggc gcagaggctc tgccacctca gtgacacgca gaccacgcgc 70140 ggcctgcagg cgccgggctc tgaaagcagg caaagcccga tctgctgaca tcaggggttc 70200 cgcagcagcg aaggtctggc ccgcacctgg cccactggca gggggtaagc tctgcctccc 70260 gacgacagca ccaagttcag gaagggccac gcagacactg gtgagacacg gcccccccgg 70320 agctgcccga gaagctctga ctttgcacta aagatctctg gcgcggtcca aaaatgtaag 70380 gcctctcttc cttttatctt aagactttga tatttttacg atgtaataaa taccaagaag 70440 ggcttttaat ttcagacaga tgtaggataa tttcccccgt agcccttgct gctttgttta 70500 gtaacgaaac tcaaaccaga aataccaaag gaattttcca aagagtttca aaagcgctta 70560 tcagcaatca ctagactgct gcatacatca tcactgcccc aaacaatagc ctgcctgtgc 70620 cagttactca aagtactact tacttgacga aaacaaatct agtcctaacg tttttacaaa 70680 gaaactccac tcttccgcca acttttcaga aacaa ccact cgatcacgtg gcaggggacc 70740 gtggctggac tgggtgctgg ctccttctgt gaccaggcaa cactgccccc ttctcggcct 70800 ccctacgcct cttgacaaat gttcatcagc tgtaaagttc accccacgag ggacccactt 70860 ctgctatttc ccacgtacct accccattat aggagttttc tttgtgacag tttctgcatt 70920 tttcatggat ttagaggttt acataatcag ggctgctgaa cagcatgaga gacgtggcca 70980 caaggtccct cctgcacctt gccgcagggg cagggcgagt tatctggctt gagcgtggtt 71040 accatcaggg ggtaaacaca gtttccagga cgtttttgac aagacactga cccggatgcc 71100 cccactacca ccgtgcaggt cctgcaggcc tcccagcctc ccaggccctt cccgaggtcc 71160 cttcggaact taggggactc ggtctgcccc cctgggtttt ccctgcacca gcttttgccc 71220 cctctggacc caggtttccc aaatggaaaa cgaaggtgtg ggtatggaag ctccctgggc 71280 tcctctcagc tgtgcctctg catggtgatg acggctgccc atcggggggg gcaggactgg 71340 ggcagctgcg gacaccctcc caaggctgct acccccgagt ggtgtggggc gctgtgggca 71400 cgctctgctc agcgcacctc ctggaaacca gcgcctgccg tctgcccggg gcaaccggcc 71460 cgggagccaa gcaccactgc cgtcagagga gctgctggct gtgagtggac gccagtctag 71520 ctctgaaccc tgcccaggcc tcctgagg tc tgaacattgt aaaatcaggc cccggacggc 71580 aactgcctct ccctcctgcc gtctggtctc cataaactgc atctcaggac aaatcttctc 71640 actcaccagg gctgaaacag aagactgcag ctatctttct caaatctaag gtgtgctaca 71700 gggcaagtcg cagaaactgt ctggcctaag catctcatca gatgcctgag acaagagctg 71760 tggacgccaa gctggagcca gagctcctcg cgttctgccc acctggcacc gcgttccacc 71820 cagtaaacgc aggcttgatt ttcaaaagta ccaccgactc agagccaatg ctaaaccgac 71880 cacttttcct gcccattaga ttgggtgaag gtttctttaa tcaatctgcc agtcaccaca 71940 tgccgcctct gtgcccacag gctggcgaag acctttctga gctacggcat gtggcaggca 72000 gcggcacctc tcttcagtac ggccagctgt caaggggagc gtttctgtga tgatgtgaaa 72060 atacattgca tccggccccg tgtttcatga acacgggtga ggaaaggaaa cacacaaagt 72120 tctgatgcga ctgacagcac gggtctcata actcaataca agtcagacaa accacaggga 72180 gtcacaggga atcccaatag cctcatctag tgtgaccatc atgaggctta atttattcag 72240 tgtattcaat cataaagagg gggaaaaatt gtaaaaaaaa aaaaaaagaa agagtgaaat 72300 gtgtaatact gaaaactgtt gctaggagaa gcaagcattg gcgtttgtaa ctgctttgac 72360 tccccaagac ccacactcgc ctcgctacaa aagggaggca ctgctgctca gtacttgcac 72420 acccgaactg cggatttgta atttaaaaat gtgtgtgtgg acacagcaca agccagagac 72480 tgccaaaggt tgagggacac tggaagaact taatatactt ggtgcatgct gccagtgaca 72540 gtcagtcacc agctgattca atagagtgcc gaaaggtcac cttttaggta aggatgaagg 72600 ggttctgggc tcgtttactt gcactaactc agagttagtc cgagatatcc gaagtgccag 72660 gtgcctccca tttgctgatg gatctagctc agggacggct gggccctagc catccaaaaa 72720 tcaagcattg ttctcccaac ctgtcttctc gctgataatg gaaggtcaga acgcccaccc 72780 gcccacctca aagtcaaaga acaccaagcg ggtgagtccc cactaagctc ggtgtttcca 72840 atcagcggtt tcaggattcc agctggggca atgagggagg gagcgtgcga gggatccaac 72900 acctcgcccc gtgcgcagca agggataacc caacaccccg tttctgtacg tccggctgga 72960 gttgtggaac tcagcgcgga cccggggcca ccgcgacccc cgggaccctg gccgcgcggc 73020 gcatccccgc tgccgggaca cgggtaagcg tccccaaact gccggacgcg gggcggggcc 73080 ttctccgcca cgccccgata ggccacgccc aaggacaagg atggtcgtgc ccagacggcc 73140 ggggcgggnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 73200 nnnnnnnnnn nnn nnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnncg gagggggggg 73260 ggcggggcgg gggctgccgc cgcgcgtata ggacggtggt cgcccggcct ggggtccggc 73320 cgggaatgac cccgcctctc cccgcatccc gcagccgccc cgccgcgccc tctgccgcgc 73380 acccgcctgc gcacccgccg ccctcggccg cggccccggc ccccgccccg tcgggccagc 73440 ccggcctgat ggcgcagatg gcgaccaccg ccgccggagt ggccgtgggc tcggctgtgg 73500 gccacgtcgt gggcagcgct ctgaccggag ccttcagtgg ggggagctca gagcccgccc 73560 agcctgcggc ccagcaggtg agcaagggct caggggaaac tgaggcccga cacagagccg 73620 cagcaagaag gatcctactg gtcactcggc tgttggcctg gggtcatcac aggcgggctc 73680 tcccaaccca tcccctgagg ccaaggtccc tagaaccccg tgggcagaca ccaaccagcc 73740 ctttaaatat ggggaaacca aggtgcttag gggtcagaga tagccctagg tcgcccaacc 73800 ctagtagaag ggagggctgt tggagttcct gagtgcccgc tctcccaccc cccgggaggc 73860 cccttcctga gcccaagggt gactggtagt cagtgacttt gggcctgccg acctgtaccc 73920 cactgggcac cccaccagtc ctgagccaca tttgggctta gtgacggggt cagggatcat 73980 gaggatcaat gtggctgagc caggaaggtg ttagaacctg tcggcctgga gttcatacca 74040 gcactg ccct gggcttttct agacccatgt cccgcctcct gccccacctg cccctgttcc 74100 cgcaccccac cagcagcggc aggggcttcg agagggctgt gggctcaccc tatttcaggg 74160 atggagccgc taagacctgg ggcacactgc ccgctaggga cccctgaggc accagggccg 74220 ggggctctgc ggaggggcag ccgccacccc cagctttgga gtcctctccc gggtgcccag 74280 cccgagctga tccggctgcc tcccacgctg tgccccaggg cccggagcgc gccgccccgc 74340 agcccctgca gatggggccc tgtgcctatg agatcaggca gttcctggac tgctccacca 74400 cccagagcga cctgaccctg tgtgagggct tcagcgaggc cctgaagcag tgcaagtaca 74460 accacggtga gcggctgctg cccgactggc gccagggtgg gaagggcggt ccacggctcc 74520 cactccttcg gggtgctccc gctattccca ggtgctcctg cacttcccat gtgctcccga 74580 ttctccctgg tgctccctct cctcctggct gctcctttgc ctcccaggtg ctcccacttc 74640 tccctggtgc tcctgctcct cccggcggct cctgtacctt cggcctgacc tcctccctct 74700 acaggtctga gctccctgcc ctaagagacc agagcagatt gggtggccag ccctgcaccc 74760 acctgcaccc ccctcccacc gacagccgga ccatgacgtc agattgtacc caccgagctg 74820 ggacccagag tgaggagggg gtccctcacc ccacagatga cctgagatga aaacgtgcaa 7488 0 ttaaaagcct ttattttagc cgaacctgct gtgtctcctc ttgttggact gtctgcgggg 74940 ggcggggggg agggagatgg aagtcccact gcggggtggg gtgccacccc ttcagctgct 75000 gccccctgtg gggagggtga ccttgtcatc ctgcgtaatc cgacgggcag cgcagaccgg 75060 atggtgaggc actaactgct gacctcaagc ctcaagggcg tccgactccg gccagctgga 75120 gaccctggag gagcgtgccg cctccttctc gtctctgggg gcccctcggt ggcctcacgc 75180 tctgtcggtc accttgcccc tcttgctgat gcaatttccc cgtaattgca gattcagcag 75240 gaggaatgct tcgggccttt gcacctgacc gcatgagcag aggtcacggc cagccccctt 75300 ggatctcagt ccagctcggc cgcttggccg tgacgttcca ggtcacaggg cctgccggca 75360 cagaggagca ggcccttcag tgccgtcgag cactcggagc tgctgcctcc gctgagttca 75420 ctcagtgtct acgcacagag cgcccactgt gtaccaggcc ctattccacg ttccccagtc 75480 accgagcccc cagggctggt ggggacctgc cctcgggtac actgtgtccc gtcacgtggc 75540 tttacgtgtg tctctgaggg aggctggcat tgcggtccac ctctcagcac aaacatctgt 75600 cccctgggaa gggggtccca tttctgggtg cgagcagccc cctggggtcc gtgtctcctc 75660 cttacctggc tcaaggcccc ggctcctggg tcctggacag cagggagccc acccctc ggg 75720 gctgtggagg gggaccttgc ttctggaggc cacgccgagg gcccaggcgc cgcctccggc 75780 cgtcgccctg agggagcagg cccgacgcca gcgcggctcc tctgtgaggc ccgggaaacc 75840 ctgcctgagg gtgcgggtgg gcaggtgccc ctgcccccag gctctcctgt gtgagtgaca 75900 ctcaccagcc agctctggat gccacccatc cgggttctcc aggaggcact catagcgggt 75960 ggggtcccct ccctcccccc tctgtggagg gagggagtct gatcactggg aggctggtgg 76020 tccgtacccg cccccccgac tctggacgtg tttactaccc ccgcctgggc tcaggacagg 76080 gcattggatg ggaaggacag ggctgggtcc tggccaggct gggggctctg cagggcatgg 76140 gtgcccctgt ctcttcttat attccaacgt cactgcaggg gggcgcaaat cttggacccc 76200 acttactgat gatctgcatc aggacatagg tcccccctcc tgcagcgggg ggctggccac 76260 ggagggcgct ggggaaggcc cctcctccag cccctcggcg aggctcacca ggtgcccatc 76320 ctcagccagc agggcgacgc tcgctgggag ggcggagagg gaggcagggc agggctggta 76380 cgacccccgc tggggcgggg gggccctcag ccggtcctcc agcacccttg ctgccccccc 76440 tcaccgtcag ggggcacctg gccgctctgc ctcaggtggg cggtgagggt cccaaggcca 76500 caccaggtgt tcaccagctc ccagcagctg gctgtgggag aggggcagag gtgggcgcat 76560 ggcacccgcc ttccccccag accaggatgc tctgccttcc tcccgcccat ctccccagac 76620 atctgaagga ctcttgcctc caccatgcag ccccgcctcc accagaagct caggttcccc 76680 gccccccctc cccgaagctg caggacccct gaccagcgaa gagatgggac agttggaaca 76740 cacgctcccc cagcagcggc acagcagctg tgtggcccag aagagcccgc ctgtttccct 76800 caagcaactc cccatggatg tcatcccatg gacaccccct tccccacacc gcctcctcgt 76860 tctccccctc caaggcagag ggaacgcacc cccacctgtc tgctaggaca ggggacccca 76920 cttacctccg aacatcacct tgataaacat ggccgtggtg gggacagatc cctccgaccc 76980 ccaacttccg acctggggaa ggagctgggg tggagctcga ctgcagggtg gggccctgtg 77040 ggaggtgtac gggtggagag ggtgatgggt gggtgggctc aagcggagct ccttgctcag 77100 tccaggcggt ccctgcagct agtccaggat cctcagcctt ctccccctca ctggatcagg 77160 gaagactgag gttccctccc ctgccccccc acccagcttc caagctggtc tctgtggcag 77220 tgggagctgc caagaggtct gagcggccag tatccgggta acggggtttg tggagggtcc 77280 gggcattccc ggtgcagggc tctagtgggg gctggagcct cgggcccaga gctgtccaga 77340 gaccagtgcc ctcccaccgc cgccgcccgc aaggagagac ag agctccca ggcggggagt 77400 cggaggttcc tggaggggga gcatcctcaa ctctgcaggc ccccttccca ggcgcactcc 77460 cggcctcccc gtcttctgtc ccctgctctt gttgaagtat gattggcata cagttcacag 77520 ccactcttcg gagtgttctc cacactaagg atacagaaca tgtccctcgt ccccccaaac 77580 tcccagccag gctgtcacga agagggaggc ggccgacggg gcagggcctt gcactcctgc 77640 gtgtggggtc cacaggggtc gtccccgtgt cggtggcccc ttcctctcac gccaggaggg 77700 tccccttgcc tggaggtgcc gtggatccgc tcgctgcctg ctctttgggt tgtttcccgc 77760 atggggtgat gatgaagagg ccagtacaga cactcgccag caggtctctg ggtgaacagg 77820 catttatttc tctttcctga gggcagatcc tgggagtggg gtgccggacc gtccggggag 77880 agtatgcttc tgtttctaag aagctgccgt gttctccagt gtgctgcacc atgtcacggc 77940 ccctctgtgc gtctggactc aggagacctc cttctcagcg gccctccccc ccaggtggtc 78000 aggccatctg tgcccttctg ggggcagagc tcagcgccgg aggcgggagg aggcccagat 78060 cccagcgcag cccaccagcg ttgctctgct tccctcggca ttcatagctg gagaaagggc 78120 aaggagcacc ggctgaagcc ccacctggag gacgcacttc gatggcagca ggtgctcaga 78180 ggtggccccg ggcagcattc cccagacgca caggc cagtg ctttcttccc aggacaccac 78240 tgtgtctggg gacccgagtc ctgcagcacg gtcgggagcg gctgtgccca gattccggcc 78300 tgcacccttg gctccagcca ccacccctgt ttgtcaaggg gtttttgtct ttcgagccgc 78360 cgaggaggga gtcttttgtc tgcagtgtca cagaagtgcc ataaagaggg gcccacagtg 78420 ggagctttat aacattggtg cggagggctg taacaggtca gggaggcact tgagggagcc 78480 ttctagggcg atggagatgt tctaaaattt ggtctgggta caggctacag agatgtgtgg 78540 gtgtgtgtgt gtgtgtgtgt aaaaccctcg agccacacgt gtgaggtctg tgcatgtgac 78600 cgtacacagg agacctcggt ggaaagcagc cacctgctct gactgcacct gtggatttcc 78660 agctcctgcc ctcaggcggc cctgcggggc ccactggctg acggggagac ggcaccgccc 78720 tcccccgctg tcagggtggg ggggctgacg atttgcatgt cgtgtcaggg tccagcggcc 78780 tcccttgcgt ggaggtcccg aagcacctgg agcgccgccc gcagaacagc ggactcctgc 78840 ctgcctccct gcctctggcc atggcctgcc cgcctctggc cctctttctg ctcggggccc 78900 tcctggcagg tgagccctcc caaggcctgg ctcacctagg ggtgtgtaag acagcacggg 78960 gctctagaag taaatcgcgg ggaagtaaat cgtagtgggc aggggggatg gtttccgaag 79020 gggccctgag ggggacagga gacctggc ct cagtttcccc actggtgagt gaccagatag 79080 ccagggtacc tttggactct gactctgggg ggctctcaga gactggtctc ctactcagtt 79140 tttcagaggg gaagctggtg tggccttgtc actgccctgc agggcctcag ggacaagcta 79200 tccctgagga ggtctccagc agtcagtggc cggaggctga gccgatggat atagtaacag 79260 cccaggcggc ctcttggggg tggtcagcct gtagccaggt tttggacgag ccgaagtgac 79320 ctaagtgatg ggggtctgca gagcaaggga tgagggtggg cagcaggagg acccagagcc 79380 caccagccca ccctctgaat tctggaccct tagctgcatg tggctccttg ggaagacggg 79440 gcttaagggt tgcccgctct gtggcccaca cagtgctgat tccacagcac tggctgtgag 79500 cttttgggag cagattctcc cggggagtct gacccaggct ttgtggggca ggggctggag 79560 ggaaggggcc caggccagac ctgagtgtgt gtctctcagc ctcccagcca gccctgacca 79620 agccagaagc actgctggtc ttcccaggac aagtggccca actgtcctgc acgatcagcc 79680 cccattacgc catcgtcggg gacctcggcg tgtcctggta tcagcagcga gcaggcagcg 79740 ccccccgcct gctcctctac taccgctcag aggagcacca acaccgggcc cccggcattc 79800 cggaccgctt ctctgcagct gcggatgcag cccacaacac ctgcatcctg accatcagcc 79860 ccgtgcagcc cgaagatgac gccgattatt actgctttgt gggtgactta ttctaggggt 79920 gtgggatgag tgtcttccgt ctgcctgcca cttctactcc tgaccttggg accctctctc 79980 tgagcctcag ttttcctcct ctgtgaaatg ggttaataac actcaccatg tcaacaataa 80040 ctgctctgag ggttatgaga tccctgtggc tcggggtgtg ggggtaggga tggtcctggg 80100 gattactgca gaagaggaag cacctgagac ccttggcgtg gggcccagcc tccccaccag 80160 cccccagggg cccagactgg tggctcttgc cttcctgtga cgggaggagc tggagtgaga 80220 gaaaaaggaa ccagcctttg ctggtcccgg ctctgcatgg ctggttgggt tccaacactc 80280 aacgagggga ctggaccggg tcttcgggag cccctgccta ctcctgggtg gggcaagggg 80340 gcaggtgtga gtgtgtgtgt ggggtgcaga cactcagagg cacctgaagg caggtgggca 80400 gagggcaggg gaggcatggg cagcagccct cctggggtag agaggcaggc ttgccaccag 80460 aagcagaact tagccctggg aggggggtgg gggggttgaa gaacacagct ctcttctctc 80520 ccggttcctc taagaggcgc cacatgaaca gggggactac ccatcagatg nnnnnnnnnn 80580 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 80640 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn agagggtggg tgggtggaat ttaatatagt 80700 ggtgcgcgtg gag cgtgggc ggcgcattta aggcggtcat ctaaaatagt ggataggggg 80760 tggtgtgaca ataacgggtg gtggatgtgg tttacggggg gtgcaatagt tctgagtttg 80820 ttagtgtctt cttgatgggg ttgcggcgtg tggacctacg ccttgagtat gtgggggggg 80880 aaaagcagtg agggtagtag ggatgggaaa tattggtgga ggttctttgt tggtgtattt 80940 tttggtatta tgttgggtgg tggagtggtg ggttgggtgt aatttcgctt gcgttatgtg 81000 ttttttttct ttttcgtgtc gtgggttggg ttggttggtg ctttgtggtg gtggtgggtt 81060 gtggtataaa aaaaaatgtg tggttgtgct cagcttagcc ctataacggt cggctttgtt 81120 tcttgtttgt tctgtgggcg tgagcggatg gctcgggcct ccgtgctccg cggcgcggcc 81180 tcgcgcgccc tcctgctccc gctgctgctg ctgctgctgc tcccgccgcc gccgctgctg 81240 ctggcccggg ccccgcggcc gccggtgagt gcccgccgtc ctccagcccc cccgccccgc 81300 cccgccctcc acgccgaggg gcgccggctc gcagagctgg atccaagggg gtgcccggga 81360 gtggcccggc gcggcccgtt accccgaaac gctgtctggg tgccccgggg gtgtggtgga 81420 tagtgagctt cccgtccctg gaagtatgca agtgaagccg gcgccgggat cgctcgggct 81480 ggctggtgag cgggcgggac tcggtcgggc gctagacgca cgccgccagc cccccagctc 81540 ccagac ctgc ccactccgcg cccgcccggc cgcgatcccg ggtgtgtgtg tgtgttgcag 81600 gggagggaca gcgggagtgg ctacagggct cccgactcac cgcagggaca aagacccgcg 81660 ggtccccagc tggcgtcagc cgccaggtgt gtggcctcgg tgagcacacc tccaggcggg 81720 agggttgagg gaagcgctgt ggggagggca tgcggggtct gagcctggaa gagacggatg 81780 ctaccgcctg ggacctgtga gtggcgggat tgggaggcta tggaatcagg aggcagccta 81840 agcgtgagag ctccggtgtg gcctggcggg ggtggtaggg gggggacgcc cctgtgtgtg 81900 ccagcctgcg tgtgccctaa aggctgcgcc ctcccccact gctggggctt cgggggacca 81960 gtcacagcct aggctactgc aggcgcacag ctccccggga gcccggccca cgcgggtgtg 82020 ccgctgagcc tccagcctgt cggggcaggg gtggggggca gggatggggt cgttagcggg 82080 gttgggggca gacgcccagg cagactctct gggcacagct ccggtgacaa gggaggtctg 82140 gcaagcctgg gccccttctg tccagccacg ccagctctgc cctggccagt cttgccccct 82200 ggcagtgctg gggatggaag ggggagcggg tacctcagtc tgggggccct gcctcctccc 82260 cagccccgcc cggcccccta ggcctagggg cagagtctag gggtcaccct ggggagctgc 82320 tgaatccgcg ggtttaggaa ccggagggac ctgggctttt gaaccacgtg gccctaggtg 8238 0 agccctccgg cgcctcggta gccctcaccc ccagccttgt ccaggtgggc gggtgggagg 82440 cgacagtgcc cactgctggg ctgaacagcg tctgcaggga ggccaggaga gctgggcaca 82500 cggacacgtt ccatcacctg gagctgccac tgtgccactt gtgcggggtc aggcggggtc 82560 tgagccgggc tgtcatctgt cacgccacag atatgcaggg ggcactcggg gtcgcctcgg 82620 acatgcttat ccctggacgg ctgttggcag ggccgggaag gctctgtaaa tatttatcca 82680 tcccagctca cagctttcag ggttgatgaa agccccgccg cccgcccact gtgggggacc 82740 ccgccttccc ttctggagcc agcggggtga gggggtgggg gagatggacc tgcctgccca 82800 ggagcaggcg gtgtgactct ggcaggtcac ttgacctctc tgagcctcag ggagggcccg 82860 ggatggtgtg cggatgctct ctgccttcct cccagcctga ccagtgtcct cccctcgggg 82920 tcgcctcctg cccaccgcag agggggtggc tatggggacc tgggccgatg gcaggcaggc 82980 cggagagggc atgcccggct cagccgtgcc cagcacttcc cagtccaggg gcccccgcca 83040 ctcccagccg ctggctgcct cccattttcc cgattgcagg ttggccccga ggctgaccgg 83100 agcctctggc tcagctggga gactgaattc cccaagcaat tcctcaagga tgtgtgaggc 83160 tgtggtgtgg tgcctatccg ggagaggtgg ggtgagcgga ctgggcacct ccgccca ggg 83220 caggcccagg gagacgctgg ctgacgagca ggcaggcctg caaggaggac gagcagccat 83280 ctcaggaatg tgggttttgg agacaagcca cagctggggg ggtggggggg ccatgggtgg 83340 ggaggcctga tccccaggtc taggtccagc tctgggctcc ctcgccgtgt gaccctgggc 83400 caagacctgg acctctctgg gccccgtctc ttcccctggg aggtggggcg atgcctgctc 83460 cccaatcccc cagggctgtg gatgaggcag acgaggtgtg tgctcatccc cacctcactg 83520 ccttccagca gccccgggcg gggggggtgg tggggactgg cgcacccagg tgaggatcag 83580 gccttggagc tagggagggc cccccagccc caggccagaa aggacacggg gagacagaat 83640 gcaggagggc ggcagagcag gggccagcgg tggggaaact gaggccaaga gcctgtggac 83700 gatgtgctcc aggaaaggac ctcgctgcct ggggcctgga tcctagagcc tccaggagcg 83760 gtgaccatga cgtgggcagg gaaccggagg ccccggcttg caggtggacc cggcgcgagt 83820 cactcttcct ctctggccct gagagcttcc ttccagctgc cgctcctgtg ttctaatgtc 83880 aagtctggag gcctgggggg caggtggggg ctgactgcca ggtgggggag ggcaggaatt 83940 tggcagagca gcgtcccaga gtgggagaag ccagcccatg gaggggactc tctccatgcc 84000 tgctgcccca aagggcgtta tagagagagg tcggttaccc cttcgccatg gccccgttcc 84060 cattgaacag atgggaaagt ggaggctgag agaaggctgt gacttgccca gggtctccgt 84120 ggcatggaac tgggcctgct gagtctcagg ccggggatct cgctgctgca ctgagcacgc 84180 caggatgcag gggtctgggc ctggacctag cgcctcgtgg gggcaagaga ggaaggcacg 84240 ctgggcctgc ctgtcaccct ccaccccacc gtggcttgtt gctcaggcct tcctgggggc 84300 agaggagagg ggagatttca ctcgctggca ggctaggccc tgggctctct ggggctccgg 84360 gggaacaatg cagccctggt ctttctgagg agggtccttg gacctccacc agggttgagg 84420 aaaggatttc tgttcctcct ggaggtcacg gagccgacat ggggaggagc aggggcaggc 84480 ccggggccca catcctcagt gtgagacctg gacgtgtgtc ctcccacctg acgctggggg 84540 tggggggtgg gggccggggg ggatccagtg aaccctgccc ccaaattgtc tggaagacag 84600 cgggtacttg gtcatttccc cttcctcctc ttcgtttgcc ctggtgggga cagtccctcc 84660 cctggggaag ggggacccca gcctgaagaa cagagcagag ctggggtcag gggtgtgctg 84720 ggagcgcaga gagcctcctg ctctgcctgc tggtcattcc tggtggctct ggagtcggca 84780 gctggtgggg agcggctggg gtgctcgtct gagctctggg gtgcccaggg cctgggagag 84840 ttgccagagg ctgaggccga gggtggggcc ctggcggccc gg ctcctgcc ccaaatatgg 84900 ctcgggaagg ccacagcggc actgagcaga caggccgggc cagacgggcg ctgaggctcc 84960 cggcctctcc cccagctccg ctgtgaccct cacctgcggc ccggggtgcc agggcccccg 85020 cttggttctg ccgtgtcttt gcaggctgat cccacgggct ctccctgcct ctctgagctt 85080 ccgccttttc caggcagggg aaccgcgacc tccaggctgg gacgcgggga gggtgtatgc 85140 gccaggtcag aatcacccct ccaccgggag agcgtggtcc aggggccctg gcagggtggg 85200 gaccgagcat ctgggaactg ccagccaccc ccacccatgc agaggggaca tacagaccac 85260 acggaggctg tgcctccgct gcagcaactg gagaacaccc agccgcggcc aaacataaat 85320 aactaaataa taaaagtttt aaagatcgtt acttaaaaaa acaagtgtgc cccagtgatc 85380 ggaccccagt tcccggtgcc ctgagtggtg ccggccctgt gctgagcatg gcctggttgg 85440 ttcaccccca gatccacact aaagggtggg atcaccccta ctagtcaggt gagcagatgc 85500 agggggggag ggcggcagcc cctccatgct ggtgggtggc cgtggtgggt gtcctgggca 85560 ggagccagct cacggagctg gagaggacag acctgggggg ttgggggcgc ccaggaagaa 85620 acgcaggggg agaggtgtct gccgggggtg ggggtccctt cgaggctgtg cgtgaagagg 85680 gcaggcgggc ctgcagcccc acctacccgt ccccg gccca aacggcggga gtaagtgacc 85740 ctgggcacct ggggccctcc aggagggggc gggaggcctt gggatcagca tctggacgcc 85800 agtcagcccg cgccagagcg ccatgctccc cgacggcctc cgctggagtg aggctgcgct 85860 gacacccaca ccgctgaccc gggcctctct cccgctcagg atgccccccg ccgccacccc 85920 gtgagcagag ggccacagcc ctggcccgac gcccctcccg acagtgacgc ccccgccctg 85980 gccacccagg aggccctccc gcttgctggc cgccccagac ctccccgctg cggcgtgcct 86040 gacctgcccg atgggccgag tgcccgcaac cgacagaagc ggttcgtgct gtcgggcggg 86100 cgctgggaga agacggacct cacctacagg tagggccagt ggccacgagc tggcctttga 86160 tctccacctg ctgtctgaga cacgctggag ctggggggag ggcagatccc tatggccaac 86220 aggctggagt gtcccccaac tcccgtgccc actgctcaac accccaaacc cacacttaga 86280 tgcactccca tgccctccct tgggagcacg gtctccacac ccacctggcc accccacaca 86340 cccgtggggc acggccgtta gtcacccacg caacctctgc gggcaccgtg ctgcgggcca 86400 ggccctggga ctctcagtga gggaggcaga cacggcccct cctccggggg agcgaggtgc 86460 tccccacgcc cggttcagct ctagcaccgc actcgggacc ctcacaggga gggacccact 86520 ggggcaggcc aggtgacggc tcgggtga cc tcggcccctg gcgctgagac tacacttcct 86580 gcagtgggcg gcgaagatgg gtgtggtgtc ccacgtcgtt gcagcgggga ctcctggggc 86640 ctcggaagtg tcctgggcgg ggagcctggg gagcaggaag ggcaggtctt ggggtccaag 86700 gcctccccac ggtcaggtct gggagggggc ctcggggctc ttgggtcctt tccgcccagt 86760 gcagaccctc gcggccacct aagggcacac agaccacaca aagctgtgcc catgcagtgt 86820 ggggagtggt gcgcaccctc agagcacact gggcccacat cacgcacgcc tgccccctca 86880 ctgtgcatcc ggggaaactc ctggccccga cagccagcgg ggctgacgct accccgtgag 86940 ccagacccag gcccccctca ccgcccctgt cctccccagg atcctccggt tcccatggca 87000 gctgctgcgg gaacaggtgc ggcagacggt ggcggaggcc ctccaggtgt ggagcgatgt 87060 cacaccgctc accttcaccg aggtgcacga gggccgcgcc gacatcgtga tcgacttcac 87120 caggtgagcg ggggcctgag ggcaccccca ccctgggaag gaaacccatc tgccggcagc 87180 cactgactct gcccctaccc accccccgac aggtactggc acggggacaa tctgcccttt 87240 gatggacctg ggggcatcct ggcccacgcc ttcttcccca agacccaccg agaaggggat 87300 gtccacttcg actatgatga gacctggacc atcggggaca accagggtag gggctggggc 87360 cccactttcc ggaggggccc tgtcgaggcc ccggagccgg gcccgggctc tgcgtccgct 87420 ggggagctcg cgcattgccg ggctgtctcc ctcttccagg cacggatctc ctgcaggtgg 87480 cggcacacga gtttggccac gtgctcgggc tgcagcacac gacagctgcg aaggccctga 87540 tgtccccctt ctacaccttc cgctacccac tgagcctcag cccagacgac cgcaggggca 87600 tccagcagct gtacggccgg cctcagctag ctcccacgtc caggcctccg gacctgggcc 87660 ctggcaccgg ggcggacacc aacgagatcg cgccgctgga ggtgaggccc tgctccccct 87720 gcccacggct gcctctgcag ctccaacatg ggctcctcct aacccttcgc tctcacccca 87780 gccggacgcc ccaccggatg cctgccaggt ctcctttgac gcagccgcca ccatccgtgg 87840 cgagctcttc ttcttcaagg caggctttgt gtggcggctg cgcgggggcc ggctgcagcc 87900 tggctaccct gcgctggcct ctcgccactg gcaggggctg cccagccctg tggatgcagc 87960 cttcgaggac gcccagggcc acatctggtt cttccaaggt gagtgggagc cgggtcacac 88020 tcaggagact gcagggagcc aggaacgtca tggccaaggg tagggacaga cagacgtgat 88080 gagcagatgg acagacggag ggggtcccgg agttttgggg cccaggaaga gcgtgactca 88140 ctcctctggg cacagctggg aggcttcctg gaggaggcgg ttctcgaagc gggagtagga 88200 taaaaggtat tgc accccat gaagcacgtg tgatccttgc ccctagagac aaggctctgg 88260 ggctcagagg tggtgaagtg acccacatga gggcacagct tggagaatgt cgggagggat 88320 gtgagctcag tgtgccagag atgggagcct ggagcatgcc aaggggcagg gcctgctgcc 88380 tgagagctgg cactggggtg ggcagccaag tgcagggatg gagcgggcgc ccaggtggcc 88440 tctttgctgc tcagaacgac ctttcccatg tatacctccc agcgccgctg gcattgccca 88500 gtgtccttct tgggggcagg agtaccaagc aggcattatt actggccttt tgtgttttat 88560 ggacaacgaa actgaggctg ggaaggtccg aggtggtgtt ggtggcggaa ggtggccgct 88620 gggcagccct gttgcagcac acacccccca cccaccgttt ctccaacagg agctcagtac 88680 tgggtgtatg acggtgagaa gccggtcctg ggccccgcgc ccctctccga gctgggcctg 88740 caggggtccc cgatccatgc cgccctggtg tggggctccg agaagaacaa gatctacttc 88800 ttccgaagtg gggactactg gcgcttccag cccagcgccc gccgcgtgga cagccctgtg 88860 ccgcgccggg tcaccgactg gcgaggggtg ccctcggaga tcgacgcggc cttccaggat 88920 gctgaaggtg tgcagggggc aggccctctg cccagccccc tcccattccg cccctcctcc 88980 tgccaaggac tgtgctaact ccctgtgctc catctttgtg gctgtgggca ccaggcacgg 89040 catgga gact gaggcccgtg cccaggtccc ttggatgtgg ctagtgaaat cagtccgagg 89100 ctccagcctc tgtcaggctg ggtggcagct cagaccagac cctgagggca ggcagaaggg 89160 ctcgcccaag ggtagaaaga ccctggggct tccttggtgg ctcagacagt aaagcgtctg 89220 cctgcaatgc gggagacctg gattcgatcc ctgggtcagg gagatcccct ggagaaggaa 89280 atggcaatgc cctccggtac tgttgcctgg aaaattccat ggacagagca gcctggaagc 89340 tccatggggt cgcgaagagt cagacacaat ggagcgactt cactgtctta agggccacct 89400 gaggtcctca ggtttcaagg aacccagcag tggccaaggc ctgtgcccat ccctctgtcc 89460 acttaccagg ccctgaccct cctgtctcct caggcttcgc ctacttcctg cgtggccgcc 89520 tctactggaa gtttgacccc gtgaaggtga aagccctgga gggcttcccc cggctcgtgg 89580 gccccgactt cttcagctgt actgaggctg ccaacacttt ccgctgatca ccgcctggct 89640 gtcctcaggc cctgacacct ccacacagga gaccgtggcc gtgcctgtgg ctgtaggtac 89700 caggcagggc acggagtcgc ggctgctatg ggggcaaggc agggcgctgc caccaggact 89760 gcagggaggg ccacgcgggt cgtggccact gccagcgact gtctgagact gggcaggggg 89820 gctctggcat ggaggctgag ggtggtcttg ggctggctcc acgcagcctg tgcaggtcac 8988 0 atggaaccca gctgcccatg gtctccatcc acacccctca gggtcgggcc tcagcagggc 89940 tgggggagct ggagccctca ccgtcctcgc tgtggggtcc catagggggc tggcacgtgg 90000 gtgtcagggt cctgcgcctc ctgcctccca caggggttgg ctctgcgtag gtgctgcctt 90060 ccagtttggt ggttctggag acctattccc caagatcctg gccaaaaggc caggtcagct 90120 ggtgggggtg cttcctgcca gagaccctgc accctggggg ccccagcata cctcagtcct 90180 atcacgggtc agatcctcca aagccatgta aatgtgtaca gtgtgtataa agctgttttg 90240 tttttcattt tttaaccgac tgtcattaaa cacggtcgtt ttctacctgc ctgctggggt 90300 gtctctgtga gtgcaaggcc agtatagggt ggaactggac cagggagttg ggaggcttgg 90360 ctggggaccc gctcagtccc ctggtcctca gggctgggtg ttggttcagg gctccccctg 90420 ctccatctca tcctgcttga atgcctacag tggcttcaca gtctgctccc catctcccca 90480 gcggcctctc agaccgtcgt ccaccaagtg ctgctcacgt tttccgatcc agccactgtc 90540 aggacacaga accgaactca aggttactgt ggctgactcc tcactctctg gggtctactt 90600 gcctgccacc ctcagagagc caaggatccg cctgtgatgc aggagtgagt gaagtcgctc 90660 agccgagtcc gactctttgc aaccccatag gactgtagcc taccaggctc ctctgtc tat 90720 gggatttttc aggcaagagt gctggagtgg gttgccattt ccttctccag gggatcttcc 90780 caaccctggt ctcccgcata gcaggcagac tctttactgt ctgagccacc aggcaatgca 90840 ggagacctag gttcagtctc tgggtgggga agatcccctg gagaagggaa tgacaacctg 90900 cttcagtatt cttgattggg gaatcccatg gacaaaggag cctggaggcc tacagcccat 90960 agggtgcaaa gagacacgac tgagcaagtc acacacacag agccctacgt ggatgctcat 91020 agcggcacct catagctgcc atgtatcagg tgttggcatg ggcagccatc agcagggggc 91080 catttctgac ccactgcctt gttccaccgg atacacgggt gccttcctgt gtgtcgggcc 91140 cactcggctg tcagcgccca agggcagggc tgtcgggagg cacagggcac agagttaagg 91200 aggggatggg gacgttagct cctccccagc tctcagcgga tgcagcaggc aaaacaaacg 91260 ctaggaatcc tgccaaaccc ggtagtctct gcccatgctc gccccatccc cagagccaca 91320 agaacgggag ctggggggtg gcccggagct gggatactgg tccctgggcc cgcccatgtg 91380 ctcggccgca cagcgtcctc cgggcgggga aactgaggca cgggcgcctc cggcttcctc 91440 cccgccttcc gggcctcgcc tcgttcctcc tcaccagggc agtattccag ccccggctgt 91500 gagacggaga agggcgccgt tcgagtcagg gccgcggctg ttatttctgc cggtgagcgg 91560 ccttccctgg tacctccact tgagaggcgg ccgggaaggc cgagaaacgg gccgaggctc 91620 ctttaagggg cccgtggggg cgcgcccggc ccttttgtcc gggtggcggc ggcggcgacg 91680 cgcgcgtcag cgtcaacgcc cgcgcctgcg cactgagggc ggcctgcttg tcgtctgcgg 91740 cggcggcggc ggcggcggcg gaggaggcga accccatctg gcttggcaag agactgagnn 91800 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 91860 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnct gcaggtgccg gcggtgacgc 91920 ggacgtacac cgcggcctgc gtcctcacca ccgccgccgt ggtaaccgcc cccgggggtt 91980 gccaaggtta cgattggacc ctccccgccc cgaccctgct cccctagggt gggtgggtcg 92040 gggggcagtt tctaagatct cctggttccg cagcagctgg aactcctcag tcccttccag 92100 ctctacttca acccgcacct cgtgttccgg aagttccagg tgaggccgcc ccgccccttg 92160 cacttgctgg cccaacccct cccgcccagc gctggcctga ccgcccccca ccccgcccac 92220 cccacgcagg tttggaggct catcaccaac ttcctcttct tcgggcccct gggattcagc 92280 ttcttcttca acatgctctt cgtgtatcct gcgccgtggt ggaagcggga ggagggcggg 92340 gcgggggacc gggcgggagg cagcgggccc cgggaagctg ag accctcca aggggcacgc 92400 ttcctatacc aaagccgcag gttccgctac tgccgcatgc tggaggaggg ctccttccgc 92460 ggccgcacgg ccgacttcgt cttcatgttt ctcttcgggg gcgtcctgat gactgtatcc 92520 ttcccgggct cggggaccta tgggtccggg cctctgctgg ccctgaggcc ctgcttgagc 92580 gcatgccaca gagggagagt tgcgaccccg agctgagggt gtttttgagc gtacatcacg 92640 tgctcagctg caggtgcccc tgtcgaactc cagggctaca cccaaaatac cacagggcag 92700 ggtgcccagg ggctgagtcc tgaatgcagg tagccaggag gatctagggc tgggcccggg 92760 ggctggggtg aagtggagag gcagggccga tcagggggcc cctggaggcc accgtttggt 92820 cttagagtgg gaagcgaaac caacctgctt gagggtttca ggggtttagg aagtcagagg 92880 ggccctgggc agggcacaag accttgactc tggcccagct actggggctc ctgggtagcc 92940 tcttcttcct gggccaggcc ctcacggcca tgctggtgta cgtgtggagc cgccgcagcc 93000 ctggggtgag ggtcaacttc tttggcctcc tcaccttcca ggcgccgttc ctgccctggg 93060 cgctcatggg cttttcaatg ctgctgggca actccatcct ggtggacctg ctgggtgagc 93120 ctgctgtcca gggagcctgc cccaagctgg gtgtgctggg ccagagccct ggtcctctcc 93180 ccgcccccac ccctcttccc cactcctggc gcccc catcc ttccagcccc tccaacaagt 93240 cagcctatag gttttactta ttcgagcctg acccatttgc tgacgcttgt gtggggcccg 93300 acccggtagg gatgggtggc tcagggtgcc tgctcacagc tccacttctt ctgacgtcct 93360 caggcctgac ctcctcccag gttctgccta ctctgggcca agcctggccc cacgctgggc 93420 tggctggccg tgcagggcat cagaccccca tgctttgggg gcttcagggc tgtggagggt 93480 ggcctcggca ttggcgcctc tcccacaggg attgcggtgg gccacgtcta ctacttcctg 93540 gaggacgtct tccccaacca gcctggaggc aagaggctgc tgctgacccc cagcttcctg 93600 tgagtgctga cagccttccc cacccccttc cccagatggc tctctacccc atgagggggg 93660 gggaccctgc cagctgccgc tcagcgtggg ctcctcccca caggaaactg ctactggatg 93720 ccccagagga ggaccccaat tacctgcccc tccccgagga gcagccagga cccctgcagc 93780 agtgaggacg acctcaccca gagccgggtc ccccaccccc acccctggcc tgcaacgcag 93840 ctccctgtcc tggaggccgg gcctgggccc agggcccccg ccctgaataa acaagtgacc 93900 tgcagcctgt tcgccacagc actggctctc ctgccgcggc cagcctctcc acgcggggca 93960 ggtgctgctg gccgagagcc agggccacca agcctgacgt gctctccgac ccagaacatt 94020 ggcacagctg gaggcccaga gagggtcc ag aacctgccca ctcgccagca gaactctgag 94080 cacagagggc agccctgctg gggttctcat ccctgccctg cctgtgccgt aattcagctt 94140 ccactgatgg ggctcacatc tcaggggcgg ggctgggact gggatgctgg gttgtgctga 94200 gctttggccg tgggggccct cctgtcccga actagcaacc cccaagggga cctctgcttc 94260 atttcccagc caggccactg aaggacgggc caggtgcaga agagggccag gccctttctg 94320 tgactccgaa gcctcaagtg tcagtgtttg cagagtccag tggctgaggc agaggcctct 94380 gggaagctct gcccctgccg tttgcagctg aggccggcag gagcctcacc tggtccccag 94440 ctcacgggca ttggaggacc agtccgcacg gtggtttact cctgggtcgg caccagccgc 94500 cgccggctgt ccctttcaca gaggataaaa gtactcgctc tggagttgga ctttaatgtt 94560 gtcatgaaac ctctggccca gcagcgggct ccgcagtggg tggcaggtga aggcccctcc 94620 ccgggcctct ccaggcaggt gccgcctggc cagcagggaa ggcaggcagt gtcatccccc 94680 actggctctg gggctcaggc tacctcctgc tgtggccgga acatctcccc cagtggtgga 94740 gcccagtgtc cgtgaggcca gctgggcctg aaaccttcct ctctgaagcc ccgctgtccc 94800 cttgccctgt atggagggca gaggctggag cgcaagttcc taggatgtgc ttgcgagacc 94860 cccgagccca ggggcgaggc ccatctcagc ccacccccga actggaaacc cttggagctc 94920 tgcccctcgt ggtgtgaggc ccctgctatg cgaccctcag ccctgccagc aacggaaggt 94980 gcagggcccg ggcccacggg cttaacgcaa ctgggcctgg gtcacctgcg gggcctggtc 95040 ccaggaggaa gacccaggtg ccaccctcct gggtgccacg tccaggtcac gtggggaccc 95100 gtccatgtca cagaagatgc agggtcaccc ggtgagctgg cgccgggccc tgccagagca 95160 ccagccgcgg gtggaggtgg gccccagctc tcctgtcagg cacgtggtgc tgggaggtgc 95220 ggccggagca gtgcccacca gctgcagcag gacaggtggg cacaggccca ccagcagtgc 95280 ccgcacggga tgggcccctg caagggccag agaagccacg ctcctggctg ggggctgggc 95340 tgggactgac aggtggccct gccctctgcg ccccactact tcccagccac ccgggactcc 95400 aaggacttgc tgagctgggc aggtgggacg ccgaggggag tcaaactgct cgtgggggca 95460 ggaggggcgg tccacagggc tgagccctga gctgaaccct ggccctgctc gtggttgtgg 95520 gggtgggggg gtccagtggc gccctagccc tgctgaggcc cagctgggac gtgcgcgccg 95580 gagggcgagg ggccagccca tgccatgctg tcccccgttc tcagctccat gctaccactt 95640 tgaagaaaca gaacctgttg cctttttatt tagaaagtgt tgcttgccct gcctggggct 95700 tctatacaaa aaa caaacac agctcaacgt ggcctctcct gaccagagac gggcggtggg 95760 gactggggct cagcagacgg aatgtgtccc cggcggcggg agaccaggag gcccctggcc 95820 cgctcctcag gacggctggg ctgtccccac ctggtcccct ccgagccaga agatggagga 95880 gaggtgggct gatctccaga tgctccctgg gagccaagcg ccacggggtg gtcaccaggc 95940 cggggccgtg ttggccagac gcctcatccg cctgtgggag ggggagggca gcaacccccg 96000 gatctctcag gcaaccgagt gaggaggcag gagcccccag cccctccctc ggccgctctg 96060 ctgcgtgggg ccctgaagtc gtcctctgtc tcgcccccct ccccagggag agtgagcctg 96120 ttctgggctg tggtcagacc tgcccgaggg ccagcctcgc ccggggccct gtcctgcctg 96180 gaaggggctg gggcagcacc ttgtgttccg gtcctggtcc cggatcttct tctccatctc 96240 tgcatccgtc agggtctcca gcagcgggca ccactggtca gcgtcgcctg tgttccggat 96300 ggcaatctcc accgtgggca gggggttctc actgtggagg acgagagagg tagacggctc 96360 acagagcagc tgcaggagag gcccctagaa agcagtgtcc accccgctgc gggcagacag 96420 gacatggagc ctggtttctg cacccggctc ccgacacagg gcggccgggc acgctgccaa 96480 catggcatct ccgggtctgc atgtggggag gggtccacag gacagtgctg caggtccagc 96540 cattcc cagt ggacttgctg ggaggaggag ggccgtccgc cccgctcagt gtccaggaga 96600 aaggagagca aaggagtcca tccacccagg agtggagtcc cagggcccct gccctgacca 96660 gcctgcaggg ggcccctcgg cccacatcac aggggcccag aatccataag ccctgactgc 96720 tccaccccgg ggcccctcaa agacgcgcct agactccgtc cgagggccac ctgcacaccc 96780 tctggcgaag tggactcagg gctgggggtc agcctcggtg aggccgcaaa ggctggggac 96840 tcctggccga gctgctgcct ctgccaggag ccaggcccag cctgccggcg agcctcagcc 96900 acgccctcac ccaccctgcc cgcggcgcca cgctggcctc cgggtcctct cctctggcct 96960 cctgctgggc cactggtgct cagccccagc agtcggcctg ccaggagccc tgcagagtca 97020 gcccccagag ggaggagggg gcccggggga acagcacagg aacaaacaga cccctggcct 97080 tagttttagc tcctcatctg gaaaatgggg acagtgtcct tgctgcgagg ggtttcagag 97140 gaccactgcc atgcaacacc cagcacacac ccactgcgtg ggggctcggg cccgagccgg 97200 tgcccccgag tcccaggctg gtggctgggc cgccccagcc accctgccga cagctgcttc 97260 ccagccgggc ggtgctgcgg cagtccagaa gccagcactg cagacccaaa tgtcactcct 97320 cacgttgcgg gctcccagct gccttccttg ggggcagcag acacgaaagt caccaagccc 9738 0 acgccgacgg gagcaaacac gtcttcctct taaacaagtg cgggtcccgg aggccctgtg 97440 tttacctccc tgtggctccg ggaagattgc atcccagggg gttgttctaa accaagggct 97500 gctcgggcca ggcctggaag gaggggcctg gagccaggag cccaccctta cgggcattcg 97560 gcttcctggg tctcaaggcc ggctgggacc ctgcattccc accacccgcc aggtgcaagc 97620 agggaggccg tgtcggagga ggcagagggc ctggagggtc gtcttcgacg tgacctcact 97680 tttacaacct cacaggtgcg gcaggccagc tgggaggcat ggctgtgccc tcctggtaga 97740 tgagaacaag actgcaggga gtgatccccc tgaacttccc caaccaggag gagacaaaac 97800 tcggtgtcgc cctcctgctt aagatcaact gactctggac aaggggccca gcccacccga 97860 tggggaaagg gcagtccttc caacaagcgg tgctgggacg ggacccggca ggccatggtt 97920 tctcagctat gacaccagca gcacaagcac cccgagaaaa acagctaagc tgggcactgt 97980 cacacaagtg aactccaaac ccaagaaaac cacaaaaagc ctgcggatct tcagatatgt 98040 gggaagggac ctgtatctgg aatgtataac gaactcctga aaagtgaaag tgttagtcac 98100 tcagtctgtt cagctctttg caaccccatg gacggtagcc tgccaggctc ctctgcccat 98160 gggattctct aggcaagaat actggagtgg gttgccatgc cttcctccag gggatct tcc 98220 caacccaggg attgaacctg tgtctctctt gcactggcag gcgggttctt taccagtagc 98280 gccacctgag tagaaacact ccaggtgccc tgagtgtcag agcaggaggg actcggccca 98340 ggcctgtgag gggaccctct ccgagtcccc tgctgcacag cagtgagagg tgcgttctga 98400 gtcagcctcc agggatgagg gacttggtgt cgacatcact cccaggacct caggatctgc 98460 tctgggaagc gaggctcccc aggctggccc caggcccgct ggcctcagct cgtgagccgt 98520 gcgtggacag gtgccatgag caggcctccc acgggactcg gggcgcggcc tggaccccgg 98580 ggctgccagt ggtcgcgggg ggccccgtgt ggcggctgtt ccctctcttg ctccgagtcc 98640 taggaacatg gtgggcgctg cctcctgggg tttctggaga agcagctgag atgcaaacag 98700 ccccacgcgc tccctcagct gttccctgtc acgggtggcc ccttggtgac ggcctccatg 98760 cagggacggt gacagctcga gcagccgcgt aaaaccacac ggggacggtg gcagctcgag 98820 cagccgcgta aagcctgaca tccaatttgg aagcctcccg cagtggaaga ggggcccggg 98880 gacggggctg cccggggcga gctccaccgg gtcgggggtc acgaggagcc cacccgcgtc 98940 cccgccacca gcacctggga ccagataccc tccccgctct gagggcggcc tgaacgccgc 99000 cccctcccac gggggcgccc accgcctgct cgtggactga acaagaggcg gcagtggcct 99060 ccagaccccc tcgggggagg gcagacctgt ccgagactga gcacaagtcc agggaatgag 99120 caagggtctc agtaatgtcc ccaccgggac gggacgggag gaggcgacag aggccgctga 99180 ggtgcggggc agccctcagt agctggcatc aaggccccag gcagtcccgg ggcatccccg 99240 cagggggcgg gggcgaccac cggcccgagc ccaggcagtc ccggggcatc cctgcagcgg 99300 gcgggggcga ccaccggccc gagccctacc tgaaggcgta ggtcttctga tgccagctca 99360 gctgtccccg gatgctgtag gcgatggtgg tgacgaactc cccgcccagc cccagctcgg 99420 agcacagctt cagagcgaac ttctcgggcg agttctcctt ctccgacatg tcccactcga 99480 actggtccac caaggagatg ttccccacgt ggatgttcag ctggcccggg agcacagaca 99540 tgagccagag cggccccctc tggggccagg ccgcaccctc accacccctt ctccccggaa 99600 catccccgcc tcgttcttgg ccgcgcccct gtgctgctac ttggggtaag gaaaacaacc 99660 cccatctctc tgaaaagggt taactagcga ggaagatgcg ctggtaactg gaaaactccc 99720 tacaaagaaa gcttggatct gatggcttca ctggtgaatt ccaccaaaca tttcaagcac 99780 taacaccaat ccttatcaaa tcctgccaaa aaactgaaaa ggaaggaaca catcataact 99840 ccctgccttg ataccaaagc cagacaaaga tactacgaga aa ggaaaggt gcagaccggc 99900 acttactgtg gacattgatg tgaaacctca gcagacacga gcaaaactac attcaccagc 99960 acgtcagaag aatcacacac cgttataaat gatgggatga tgacacaacc acattataaa 100020 cggtggggct tactctggtg atgtaaggac ggctcagtaa gaaaaccggt caatgccatg 100080 aaccacttga acagagtgaa ggacaaaaac cacacagtca tcttgataat tggaggaaaa 100140 tcattagaca aacttcaacg tgctttcacg ataaaagcac tcagtaaact aagatcagat 100200 ggaaaccaca tcaacaagat taattcagtc aaaaaattca ctgcaagtat cacccacaat 100260 ggcagaagac tggtaacttt tcctctaaga tcaggaacga gccaaagata cccagtcttg 100320 ccacttttgt tcaatatagc gttggaattt ctactcagtg cagtgcagtc gctcagtcgt 100380 gtccgactct tttcgacccc atggatcaca gcacgccagg cctccctgtc catcaccaac 100440 tcccggagtt cacccaaact catgtgcact gagtcagtga tgccatccag ccatctcatc 100500 ctctgtcgtc cccttctcct cctgcctcca atcccttcca gcagttaggc aagaaaaata 100560 aatcaaaggt atccacctgg aatggaagaa gtaaaactat ctctggtccg agatgttaca 100620 atcttatatg cagagtttaa gatgctaaca aaatactatt agaactaatg aatgaattca 100680 gcaaggtacc aggatacaaa gtca acgtgc aaaaatcagc cgcatttcta catgctaaca 100740 ctgcacaatc tgaagaagaa aggatgaaca aattacaata acataaaaaa gaataaaatc 100800 cttagaaatt aacttgatca aagagatgta caatgaacaa tataaaacat actgaaagaa 100860 attgaagata taaataaatg gaaaaacatc ctatgtccat ggattggaag acttaaaatt 100920 attaagctgt caaggctatg gtttttccag tggtcatgta tggatgtgag agttggacta 100980 taaagaaagc tgagcaccga agaagtgatg cttttgaact gtggtgttgg agaagactct 101040 tgagaggtcc ttggactgca aggagatcca accagtccat cctaaaggag atcagtcctg 101100 ggtgttcatt ggaaggactg atgttaaagc tgaaactcca atactttggc cacctgatgc 101160 gaagagctga ctcatttgaa aagaccctga tgctgggtaa gattgagggc gggaggggaa 101220 ggggacaaca gaggatgaga tggttggatg gcatcaccga ctcaatggac atgggtttgg 101280 gtggactctg gaagttggtg atggacaggg aggcctggcg tgctgcggtt catggggttg 101340 tgaggagtcg gacacgactg agcgactgaa ctgaactgaa catgaatacc caaagcaatc 101400 tacaaagcca aatgtaatcc ctatcaaaat cccaatagca tttctgcaga aacaggaaaa 101460 aaaatcttaa aattcatatg gaatctaagg aaaagcaaag gatgtctggt caaaacaatg 101520 acga aaagaa caacaaagct ggaagactca cacttcctga tttcagaact tactgcaaag 101580 atacaataat gaaaacactg tgggactaac gtaaaagcag acacgtgggc caacgggaca 101640 gcccagaaat aaactctcaa ataagcagtc aaatgatttt caacagagat gccaagacca 101700 ctcagtgaag gaaagtgttt gcaaccaacg gttttgggaa aaaagaaccc acatgcgaaa 101760 gaatgaagtg ggacccttac ccagccccat ctacagaaat caactcaaaa cagacagaac 101820 atatggctca agccataaaa cgctcagaaa aacagagcaa agctttatga tgttggattt 101880 ggcggtgatt tctcagatat gacgtcaaag gcataggtga taagcgaaaa aataaactgg 101940 acttcaccaa aatacaacac ttctatgcat ccaaggacac taccgacagc ataacaaggc 102000 agcccaggga aaggaggaaa catccgcaaa tcacagcatc tgggaacaga ccgctgcctg 102060 tgagatacag ggaaccgata aaaacaagaa aacagcaaaa cccggactca aaaatgggaa 102120 ggactccagc agacacagga gacagacaag ccgccagcag gtcactaatc agcaagcaag 102180 gcccgcaaag gcccgtatcc aaggctgtgg tttttccagt ggtcatgtag gaaagagagc 102240 tggatcgtaa gaaagctgag cgctgaagaa ttgattgaac tgtggtgttg gagaagactc 102300 ttgagagtcc cttggactgc aagatcaaac cagtccattc tgaaggagat cagtcccgaa 102360 tagtcactga aggactgatg ctgtagctcc aatactttgg ccacctgatt cgaagaactg 102420 actcattggc aaagaccctg atgctgggaa agattgaagg caggaggaga aggggacgac 102480 agaggatgag atggttggat ggcatcactg actccatgga catgagcttg ggcaagctcc 102540 gggagagagt gaaggacagg gaagcctggc gtgctgcagc ccgtgggtcc caaatctttg 102600 gaccaagcga ctgaacaata acaaatcaac agggaaatgc aaatcaaaac cacagtgaga 102660 tactgtccac caccaggcag gcgttcttca gcggggttcg gggcaggtgg tgccctcttc 102720 tctcgtaacg cccccaggac cgcgggggct gctgagacag catggggtgt gcttggccta 102780 gcctgcccat gacaagagtg gcagtgtgct cgcctcactg cgcccttccc tgctctgccc 102840 accagctggg ccacccctgg gaccacccag cttccgctcc gtggacggca aggccgcagc 102900 agcgcccgga cacgcccaga acgtggtgcc ctcctcagaa gtcggcctgt gcccttcctg 102960 ggacaagccg cccaagagac agtcttccag agccctgccc cacaacacgg accccagaca 103020 ggctcctgtg gaggcctcca cgcacctccg cacctcgcaa gccccgagga caaggcaggc 103080 ccgctgcggg tgaggagccg cctaccttga taatgacgcg ctggtctgac tggtcttcca 103140 ggatgctgtc cgtggggtag gactcgatct gctgtctgat ggcagaggca atggctggca 103200 cgaatgtcag tgggttcaga tccaggtcgt cacagagaat ctctgagaac atctccgggg 103260 tcatcagctt ctctgaaacg atgacggagc gggggaaccc ccagtggacc acagggccta 103320 cggtcagcgt gctcagcccc ggcctccccc agccttgcct cctctgccac cgcccccccg 103380 ggtgacgaca ggaccccctg gcagcacgca gacagagctg agtgcacgcc agccagggcg 103440 gcggacggac cattcatgtt ccaggtaaag gcatcccgca gcttctgccc gtcaatctcc 103500 atgtccagtc ggatggggac cagcacctcg ggctgggacg cgttctcgtg gatcacggct 103560 gggtcgtggt cgtcgaagct ggaaggggag cggccgcgtg ctcagcaaag cgggctgggc 103620 ccctgtgccc agggcctccc tctctgcacc actggtcgct gagacctgcc cagagaggac 103680 ctgtccacta cgggccgggc cggcagaaac agggctggcg ggggtccacg cggggcggga 103740 ggggagctgc cgactcggca gcgggacaag ctcagaggtt ccctgcagga agagaggttt 103800 aagccccaga gcaggcagga ttctcccagc agctgtgggg aagaaagggt atgtccagaa 103860 gaagaaaccc tggaacaaag gccgaggggc aggagggttg aggagctgct tggagagcag 103920 tgaagggggg ctgggcggct ggggggtgct ggggagcctc ggtggccaag cacccagggc 103980 tccccacctg cagcctggac cccgagggag ccccagagga cggagagcaa ggcagctccg 104040 cactcacacc tgccctttag gatggggaag agggaagaga cgggggctgc ggggggcaag 104100 gaaaccaggc acgccccgct tagacccggg ggcgagaacc actttccaag aacgcagggg 104160 cgccaatgat gaacaatggg tagcagcccg caggcgggag gcccggtggc cgaggcccct 104220 caccagagcg ggaaggtccg cttcttgtcg cggcccatgc ggttcctgtt gatggtggtg 104280 gagcagggca cggcgtccag gtggtgcgag ctgttgggca gggtgggcac ccactggctg 104340 ttcctcttgg ccttctgttc cctgggagac acagacgccc gtccgctcag cctatgggcc 104400 aaaagccgcc ccccagccgc caggttgtgg ccagtggacg cccgccatgc ccctctgggc 104460 ccaggccccc atggggacct ctgtgcgccc agctccgcgg tggttattcc ccaggctcca 104520 agcggcacct gctcggggtc accagtttta ggggaggagg agagggcagg ggccccagcc 104580 cagtctgtga gctgtcaccc ccaggctcca agcggcacct gctcggggtc accagtttta 104640 ggggaggagg agagggcagg ggccccagcc cagtctgtga gctgtcaccc ccaggctcca 104700 agcggcacct gctcggggtc accagtttta ggggaggagg agagggcagg ggccccagcc 104760 cagtctgtga gctgtcaccc ccaggctcca agcggcacct gctcggggtc accagtt tta 104820 ggggaggagg agagggcagg ggccccagcc cagtctgtga gctgtcaccc gtgctatgtg 104880 ctgggctggg cactcaggaa agagggtcag ggttcacggg ggggtggcgc gcagatttcc 104940 aggagagccc cgagggcagc agagaggagg ctcaggtcaa tggttgggca gggggccagg 105000 gctggagaca cagagagggt cccgattcgg gggggtgccc tcagcaggtg gctgggagtc 105060 cctgggggtt tgcacacttt cgatcaggct gttatttcag acgcttggtc cagcctgaga 105120 caggtaatgc ctctggcctc cgggccttca gggatggaaa gatactctag aaagcgggac 105180 tcaaagtaac tcaaggaact cgcgtcccac agtggggagc ccttctctcc aatttacatg 105240 gggcgtttac tacgaggaaa ataccgaagg ccgttttgag ctgaggctcc cgggccgggc 105300 tgtccgtttg tgagactgct cgtcacccct gggccacatc cctggtggcc aagggggcaa 105360 tcagtgcggt gactgcacga cacacctctg cagccctgcc ccacagctgt caccatcggt 105420 gacgtccacc ccctggagaa cctgaccact gcccggtttc ccgctaaaac agcgcccttc 105480 caggatgggg ggcagaggga gaggccttgg ccttttcact cctcttctgc agcgggggcc 105540 cctcgcaccc cagtgcccgg gcccaggagc gccccttggg gtggggcagg gagggatcca 105600 cacaccaagg ggagccagga cccccccaaa tctgctg ccc tgccctgata cccgagacct 105660 ggggaaacgg gggactgggg ctgatgcggg caggaccaag aactgaggcg gtgagacggg 105720 gtccccacca caggccatct ggctggcagt ttctactccg ggcctgcagg ccaagaggga 105780 aaaggtgccc cactcagatc aggcgcctcc cgtccccagg gagggcctac aaggtcagat 105840 cctttgtaac ttccacgggc aaaactggct tgctgggcct gtgcgggccg catgggcgtg 105900 gaccaccaca cctttcccca ctgagtctcc agccggagct gtcacccagg tccccccagg 105960 ccagccccac cccgccacct tgcagtagcc tctcgtatcc aggccgaggc tgcccggtcg 106020 acccctcctg cctgatggcc tcaagtggac aatgcgagtc acgttgcagc acgtgagtgg 106080 gacgggcagc gccacgcggg gtccgggcat ccgagtccca ccactcagcc tcccttccgc 106140 tgcagagagg tctgtccaag agccctgggg gccatccagc ccctgtccga cctggccggt 106200 gtggaagagg gggtgtgcca cccctcctgg ggggctggct gggcgctggg caggcccctc 106260 ctaagagtgg agcccactgg tggttttcct gcagccccac ctccacacag cagttctcac 106320 tgcccagtaa caggaggcta ctggcctagc tctctccctc gtgtgatgga ctcaaccagg 106380 agcgttcacg gccccacaca gggttctcgg ctgctgcatg aggatctcaa agccccatcc 106440 acgtgcatgt aatctcc tcc ggtaacttct ctagggaagc ccggctatcc tgccatcctc 106500 accgcaccac cagggcgaga aaagccatct ccagcgctca catccacaat gggccaggcc 106560 gtgagcacac caccttcttc gggaggttgt gggggcgggn nnnnnnnnnn nnnnnnnnnn 106620 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 106680 nnnnnnnnnn nnnnnnnnng cgcgcccccc ccccccgcgg cgccggcacc ccgggcggcg 106740 gcccccggcg ctgggagcag gtgcggggcc gcggccgctc gtgagcctcc agcccggagg 106800 acgggccccg ggggccggcc cggtgcccag gccctgggag ccccggaggc cagagtgcca 106860 gagggccgga ggacccggga aggcccgaga gaggtgggaa gcacggggtt ccagccctag 106920 gccatttcag ccccaaagcc atcggtgaaa ccattgctgg ccccagataa aagcgtcgcc 106980 aactttttca ccccggcgga gactttagcg ggtagctgcc ccctaggggg aatggaaaaa 107040 ccaggattta ccaggtgggt ggaggtcaca actgcccaga tcctgagaaa gaggggtcag 107100 tggggcggga agattagtgg ggagaggagc tttcagaacc caagggaatg aaacgaggct 107160 tgaggttggt tatccagcag ccgccccctg ccccgtgagt gagcgaaggc tgggcccctt 107220 attgtcacat cttccagctc ttcgctagaa aacctagagt tttaaatact gtggcagctg 107 280 agtcaaacaa taaggaaaag cccgactctt tgagagccag gcacaaggcg tctgtgacag 107340 ggtctccagg ctgcccattt gcagtctctg aaacggaggg tttttcgaga aggaggtctt 107400 ggggtgcctg ccagaattgg aggggggggc gcgggaagtg aggacccaga agagagggct 107460 tggcccgctg caaggaggtc actggacact ggagctgaag cgccagccga aactggaaac 107520 tcgaaatctg tctccgtgcc agccacaagg cctatgattt tccttggcga cgttcagcat 107580 cttaggagga gctggcgggg gaggcgggta gttcgtgggc ggttgcagca gggcaggaag 107640 gtgaggaacc tgaggctggt cagagagctg gttggagtga tgcccatcgg tggacccgct 107700 ggagaaggcc tgagtagaga aggtctaagc ttaacgggga aggggtgggc cagggtggaa 107760 atggggtggg aagtttgagg agggggagca gtggagatgg gggttgtgag gaatgggagt 107820 gagcttagac gtcttgagga tactgcagtt ctgtgctttt tttcacacct ggctgaaaat 107880 tcactgaaaa caaaacaacc cttgctctgt gacagcctag aggggtggga gggaggctta 107940 agagggaggg gacgtgcgtg tgcctatggg cgattcatgt gggtgtacgg cagaaagcaa 108000 cacagtatgt aattaccctc caattaaaga tcaagtacaa cttaaaaacc ccaaacacaa 108060 cattgtaagt cagctagact ccagtaaaca tttcagtaag aag attcaac tgggaatgag 108120 ttccgccgtg actatcctga tgaatttccc gtgtcttctt gaggccattc ctctttgaac 108180 ttccgtgttt ggggaagcgt gcctttgtat ggagtcctga ggagtaaatg agacgggctt 108240 gtagaaggcc tagtagtgcc ttgcacgcgg cagatgctca ataacctcga gttgtcacca 108300 ttatggtacc tcaagagtct ccttggagct tgcacggttt ctgaatgggg tcctgcgggg 108360 ctcccttggg gctcccacat ggggttgggg ggctgagtgg ggtgtccccg ctccttgctt 108420 gtcccctgtg gaacaccccc ttccacccga gcagctctgc ttttgtctct tgtgtttgtt 108480 tatatctcct agattgttgt tcagtcgctc agtcgtgtcc aactctccga ccccatggac 108540 tgcagcacac caggccttct gccttcacca tctcccggag cttgctcaaa ctcctgtcca 108600 ttgagttgct gatgccgtcc aaccatctcg tcctctgtcg tccccttctc cttttgacct 108660 cagtctttcc cagcatcagg gtcttttcca atgagtcagc tctttgactc aggtggccaa 108720 gtattggagc ttcagcttca ttatcagtcc ttccaatgaa tattcagggt tgatttcttt 108780 taggattgag tgacttgatc tccttgcagt ccaagggact ctcaagagtc ttcaacacca 108840 cagttcaaaa gcatcagttc ttcggcactc agccttcttt atgatccaac gcccacatcg 108900 gtacatgact actggaaaaa ctt tggctca gagataattg acttgattga atacaaagtt 108960 ctttggcaaa aaataaaagt gtggcaagca gtactgacac aaaagcaagt ggcttttcct 109020 ccgttgagtc atttatttat tcagtgggtg tgtgcgtgta gagacggagc ggctgtgctg 109080 ggagctgggg cttccacttc agaggagccc cggacctgcc ctcggggagt tcacaggcag 109140 tgctgcgggg ggtcctgcca ggacgcctgc cctgcgagtg cccagtgctg tgatggatgc 109200 gtgtcccgca tctgcggcca ctggggccac gtgcccgaga ttgtccgggt ctgagggtgc 109260 agagaagagg aggcatttgg actgagtctg gaaaaatgag catgtggcca cgtgagaagc 109320 cagtggtgag gggaccagtc aggcggagga aagagcggct catacgagtt gtggagctgg 109380 aagcatgagg gtgtgtggaa gcagaggccg gggacagggc cgcagggccg gccatggagg 109440 gcgtgggctg ctgcaggctc ctgagaaggg ggacgctgcc atcatgaccg ggtttaggtg 109500 tttgaccctg gtgtccacgt agaggacaga tgtgtggggg gggagctgga gatgggcatc 109560 catcgggagt cagcctggag agaggcagag accccgtcag tgggccctca ggacgtggat 109620 ggggcggatg ttgggaagat ctgactcctg ggttccggct ggggctccgg gctggagggg 109680 tgccgcccac cgagcacagg aggcaaacag atgccctctc ccagcaagac cccagcccca 109740 gca ccctccg gggccggact ccgcccctct tccagaatgg ctcccttgct gtcctcgccc 109800 atctttccgg tgccctgagc ctctagagtc tggacaccag cgtccgcctt gcgcttgttt 109860 ctgggaagtc tctggcttgt ctctgactca cccaggaccg tcttcgaggg caaggttgtg 109920 tccttggttc catctgcttt ggggtccggc tcctcgctgc ttgacctgct gatgtgacag 109980 tgtctcttgt tttcttttca gaatccgaga gcagctgtgt gtgtcccaga cagacccagc 110040 cgctgggatg acgggcccct ctgtggagat ccccccggcc gccaagctgg gtgaggcttt 110100 cgtgtttgcc ggcgggctgg acatgcaggc agacctgttc gcggaggagg acctgggggc 110160 cccctttctt caggggaggg ctctggagca gatggccgtc atctacaagg agatccctct 110220 cggggagcaa ggcagggagc aggacgatta ccggggggac ttcgatctgt gctccagccc 110280 tgttccgcct cagagcgtcc ccccgggaga cagggcccag gacgatgagc tgttcggccc 110340 gaccttcctc cagaaaccag acccgactgc gtaccggatc acgggcagcg gggaagccgc 110400 cgatccgcct gccagggagg cggtgggcag gggtgacttg gggctgcagg ggccgcccag 110460 gaccgcgcag cccgccaagc cctacgcgtg tcgggagtgc ggcaaggcct tcagccagag 110520 ctcgcacctg ctccggcacc tggtgattca caccggggag aagccgtatg agtgcggcga 110580 gtgcggcaag gccttcagcc agagctcgca cctgctccgg caccaggcca tccacaccgg 110640 ggagaagccg tacgagtgcg gcgagtgcgg caaggccttc cggcagagct cggccctggc 110700 gcagcacgcg aagacgcaca gcgggaggcg gccgtacgtc tgccgcgagt gcggcaagga 110760 cttcagccgc agctccagcc tgcgcaagca cgagcgcatc cacaccgggg agaagcccta 110820 cgcgtgccag gagtgcggca aggccttcaa ccagagctcg ggcctgagcc agcaccgcaa 110880 gatccactcg ctgcagaggc cgcacgcctg cgagctgtgc gggaaggcct tctgccaccg 110940 ctcgcacctg ctgcggcacc agcgcgtcca cacgggcaag aagccgtacg cctgcgcgga 111000 ctgcggcaag gccttcagcc agagctccaa cctcatcgag caccgcaaga cgcacacggg 111060 cgagaggccc taccggtgcc acaagtgcgg caaggccttc agccagagct cggcgctcat 111120 cgagcaccag cgcacccaca cgggcgagag gccttacgag tgcggccagt gcggcaaggc 111180 cttccgccac agctcggcgc tcatccagca ccagcgcacg cacacgggcc gcaagcccta 111240 cgtgtgcaac gagtgcggca aggccttccg ccaccgctcg gcgctcatcg agcactacaa 111300 gacgcacacg cgcgagcggc cctacgagtg caaccgctgc ggcaaggcct tccggggcag 111360 ctcgcacctc ctccgccacc agaaggtcca cgcggcggac aagctctagg gtccgcccgg 111420 ggcgagggca cgccggccct ggcgcccccg gcccagcggg tggacctggg gggccagccg 111480 gacggcggaa tcccggccgg ctcttctctg ccgtgacccc ggggggttgg ttttgccctc 111540 cattcgcttt ttctaaagtg cagacgaata cacgtcagag ggacgaagtg gggttaagcc 111600 cccgggagac gtccggcgag ctctaacgtc agacacttga agaagtgaag cggactcgca 111660 gcccgtacag cccggggaag atgagtccaa agtcgagggt caccttggcc actgcagggt 111720 cgctcggcgg tggggcggag cgggtgcagg agggctcctc ctgggcttgg ggtggcaggc 111780 gaggaccccg cgcctctcag ccctcggcct gggttggctg agggcgggcc tggctgtagg 111840 ccctccagcg gaggtggagg cgctgcccgg ctcagccagg cacaggaccc tgccacgagg 111900 agtagccctc cgccagaccc ggcgtccagg ctggggcgcc tgcggggcct ccgttctgtg 111960 gctgggcagc ctgcgccctg tccagggatg aaggggttcc ggtctgaagg gctgggttca 112020 gggtccagct ctggcccctc ctgccttggt gtcctggagg aagccccaag gctccgtttc 112080 cctctccagg aggtggggac gttgggaatg ccacattccc ctggggggtg tgtgtgtgtg 112140 ttcaaggctc ccattcagac tgggactggg cactcacgag ctttggcaac tggcaactga 112200 ggacggagac ccagggtgac accccacctc ctgctgcggc ccccccggca ggggagacac 112260 aggcccgtct ggttcccaag atggcagggc ccctccccct ccagcttgtg ccctgggtgt 112320 ggtgcctggg gctacagcga ccctttccgg ttccccgggc cagttcagct gggcatcctc 112380 agggcggggc tctgagggtg ccatgtttcc agagctcctc ctcctcccac cagtagcagg 112440 cgggcggcca gctcccaggc agccccctgg catcgcctag gtgcacacct gcccgctgtg 112500 acccagcaag gcttgaaggt ggccatccca gttaagtccc ctgcccctgg cccaggaatg 112560 ggctcgggca gggccgcatc tggctgcccc agaagcgtct gtccctggcc tctgggagtt 112620 ggcggtggtc tctggtactg tccctcgcag ggccccttag cactgctcgg ggaggaggtg 112680 ggctgaactg attttgaagt tttacatgtc tgcggccgca gtcctacgag cccgtcaggg 112740 tcatgctggt tatttcagca gatggggctt ggctcggcag ctaggatggt cctgaataaa 112800 aatgggaagg ccagagctgt tcctccatca gcaggcttgg cagctgggga cgttgaaagg 112860 acaggtctgc tggtctgggg agaccagctc tgtgcagccc ctgctgtccg tgggggtact 112920 aaaccagccc ctgtgtgcgc ccatctgagt ggcagcccgc ctggaggatc gcccatcact 112980 tgtgagaatt gagagaatgc tgacaccccc gcttggtgca gggggacagg gccccc taag 113040 atctacctcc ttgccccacc cccgggaccc cctcagcctt ggccaggact gtccttactg 113100 ggcagggcag tcatccactt ccaacctttg ccgtctcctc cgcgcgctgt gctcccagcc 113160 aaattgtttt atttttttcc aagcatcact ttgcacacgt caccactctc cttaaaacca 113220 cccttccgga gtctcctgct cgtaaatcgc cggtttcagc caacctgggt cgccccccaa 113280 gcccagcaag cctgctgagc cccgcgcctc ccagctactt cacgctcgcc tcaagcttct 113340 aaacgcggac cttctccccc ccacccccat ccctttcttt tctgatttat gtaacacggc 113400 aggtaagact cctctcctga agggttgaca gactcacaca aaaccgtggt cagaccaggc 113460 aagtgctttt tttcagaagt gtgagcggaa cctagtcttc agctcatgct ctttccttgt 113520 tttcttatgt gttctaagtc ctttgacttg ggctcccaga cagcgacgtt gtaagaggcc 113580 gtcctggtag catttgaatt gtcctcgagt ttcgttgtcg gattttgttt tattgtctta 113640 gttttccctt cttttagcag acgttgttga ctgtcgtaaa gctccagttc ttggttctgt 113700 ttactaatca aattgttttg tcaaagtaca tgtattctgc tcttttcttt atcttttttg 113760 ttgcttaata ttaacacttt acatttctaa gattaattat ttaggtaatt aataattttt 113820 aacatttcta gtaaacgtgg gtacttgggt ctgtgt ttgt tttcttgtag ttacagcttt 113880 ttctgctcta tactgttgac gtctgggttt ttttttgctc ttaggaattt ccctttgacc 113940 ccattattat tattttaatt agtatttttt aataattaaa aattagtgtt tttaaattaa 114000 ccctaatcct aaccccagtg atgactgctt cagtcattgc tgttacttat tatgtgctgg 114060 tgtcaggatt tttaagtgtc catagacatt ctctgagcct gaatatatta tcagttttat 114120 acagcatttg tgtactctca agaaacgtgt tttcactctg tcagttcggt ttgttacctc 114180 agtctttatg ttattttgct ccagtccgca cttgctctaa cttgtcttcc cttcgaggtg 114240 tgaggacgcc tggcagccgg tgagcatgcc ggggtccggg gtcgtgggcc caggcgccca 114300 gcaaagccct gtgggtgtgt gcacggctgg gctgctccgg gaggaagcct gtggccccac 114360 ggtagttagg agcgctggtt tacctggtca caccacggtc tggttttgtg tgcttttccc 114420 tgacgtgttt ctgttttgcc ttggtttcta ttctgtttta tgagtgccgt ttacgctttg 114480 ttagtcatgc cgttatctcg atagacaggg tgtacgtgat caagtgatta ccgtatttgg 114540 agcagatgtc tatttaacag agatgaactg agaacctgtg cctttgcatg ccctctttgc 114600 ctcttttaat gcttctagct tcaacttctc ttttccaaac attataatgg aaaccccttg 114660 cttttttttt tttaat ttgc atttgcatga gagtttattt agctcggcat tttattttta 114720 aaatttgtgt atatattttt gctatatatc tgtaacttat aaacagcaaa ttattggatt 114780 ttgctttctg attctttctg taattcttct tacataagaa gttctcctat gagtaacatt 114840 gctgtttaga gtgaggcatg atttatttcc agcttagtat gtattgggtc ggttaacccc 114900 caaaggtcat gctcatcccc gccccatctc tgtgagttat tgtccgagtg tggagcgccc 114960 tgtctaggcc gacgagagac ccaccatcgg gcacacctgc ccctcctggt ctggtcagtg 115020 ccgggctctg tcctgagtcc actcctgatg tcacaggctg gtgcttcagc gacctcggct 115080 gtgacacgga gggtgtgatg gcactgccca gccccatggg gcttggagga ctaaaggatg 115140 cacacctgcc tggcagactg agggcacagg tgtttctcac actgtcagcg ttttgaaata 115200 ttcctttgat tttctaccct aactcccaaa ggccgttcaa cataagctag aatgctacgt 115260 ggtgcttgat tacattttag aaaagtttca gcaaatacca cgagatgcag caaagaacta 115320 gacctcacag atcaggccgc ctgcataagg gagcccacac agtcgtggga gacggggacc 115380 ctctcccacg tcctgtctgt cccaggatgg tcccctcacc cgccccctct ctcccctcgc 115440 cctcctgtgg tgggggccgg ccaccatcac agctgcagag cctcaagaag ggggtcgccc 11 5500 tggccactcc cgtggcagga gggacacgag ggcaggagct taccgcgggt gcagtggtct 115560 cggatcagct cagctggccg ctgcggggtc ggggggacag ttcagtggga ggcaggagcc 115620 cccactacag ctgccaggac ttctcagagg tgacaagggg gttcagtcac ctcagcccag 115680 gtggaaacca aatggcctct tgcgcggctc ctggggccac gcggaggttc gctgggatca 115740 caggtatctg gatgtgtgcg ccatggacat gcaccacctt cggggggtaa ggggtgggga 115800 aaggcagccc ctttcttttg ggggaccccc tcttcagtgt ctgataacca ggaaaccaaa 115860 tcagaaggtg gtctgggggt gctgagcagg gtgtctccta caccacaggc cacacactca 115920 cacagcctcc aggactccag tggggctgag cgctggagac tcacccacgt ttgctacccc 115980 cccacccaag gccatcccag aacagctgcc tgcgtcctca cggctggccc ctcccctctg 116040 gtctaaccca gtgtgggtgg gccggcctgg ggtctccacc tgcctcctgc tgttccctgg 116100 gctgctggct gtctgcagat gcggggccct ggcccggaga agccccatca gagcccagag 116160 gacgggagtg gagcggggag gtgagccccg gagtctcgag gggccagagg caaaatactg 116220 ggctgtgtcc ctggaaggca gtttcccatg aaaccttcaa tataggccgc cccagacgat 116280 cagcctcatc tgctacgtgg attcctcccc gtagcgaatg gt gattgggt tctacatgga 116340 cccgggactt ctgtttgaat tataatcttt cccccactgc ccctccaggg atctggaaaa 116400 tggaggcctg ggctagacgg aagcttcctc caagattctt tattgaaggg attcgaagag 116460 aaacaggtgg tcagtaatct gtgggggatg gaggggtgag cgctacgtgt aacggtttta 116520 ctgttgctac gggaccagtt ttgatgtctt tccccttcaa gaagcagacc caaacaccga 116580 gatgctgagg ttagcagcac agagcgggtt catccacaag gcaaccaggc agggagacca 116640 gagacgctct ggaatctgcc tccctatggg cacgggctgg gtgctcacgg atgaagacca 116700 agcagcaggt ggcgtggggc gtggggagcc tgcggaaagc gatggacaag gtgcgggacc 116760 gcggtccgcg cggtggaccc aagctccgcc tctgcgctgc agcgcgagct gggggcggag 116820 cttccaggga cccgcgaccg cgcccagtgg gagggtccgc ggtccaccca gtcctaacag 116880 ctcagctcca gctagacgcc gctgagtccg gctttctaga gagcaacccc ggcgggtatt 116940 ttatggttct ggcttcctga ttggaggaca cgcgagtctt agaacaccct tgattagtgc 117000 gggcaggcgg aatggatttg actgatcacg atctgcagtt tcaccatctc aggggccgcc 117060 ctcaccccca cctatcctgc caaagggggg gcctcggtgc tgagatcggg gccacacgtg 117120 cactagacgg tcggtcagcg ct gctgctga gcggacccgg ggccatcctc acaccgccac 117180 tggcccctgt gctcaataaa aggaaggaaa gcgggaaaag cgctttctgg ccgcggtggc 117240 ctcgcgcgtt cctccatcgc catctgctgg cagagcccgg catggcaccc gctgcacaga 117300 aacctcggtg tccgtttggg tgccccatcc ttgaccccga gagagcaccc tccgtccaaa 117360 atgaaaaaca gctgctccca agagtcatta taatcacagc caattgtgtt aattcgtcct 117420 cggatccact cacagttcca cggaacattc tgctaacctc tgacaactcc tacataaagc 117480 aatactgaga agaaaagaac gtggttgata aatacaaagg catacaacaa taaggagcaa 117540 agaaaaaaga cagtcctcgc agttctgttt tgttcatctc tcatgagtag gatggcagat 117600 aaaacacaga atgcccagtg aataatttta gtctaagtat gtccccaata ctgcctaatc 117660 ttcaaatcta accttatttt taaaatatat attttttgct ggtcactcat cagttcatgc 117720 accaaagcct ttgtttcttg actcctaact ttttgacccc tctggggtga ggagcacccc 117780 taacctcgag agcccatcac acagtcccct tgggactaga cccttctttg cccatcacag 117840 ctgaccggaa gggccagccc atggccagcg ctcgcgcccc ctggcggaca gactctgcgc 117900 ggcagccccg ggagcccagg tgcgaccccg cggtctctgg cgccctctag tgtggaaaga 117960 tc tcctcctg gtgttcccag tcattgggct gtattttatt agagaagatg ctcgcgtgac 118020 gatgatgatg gtcctttacc gggaggcacg tttggggcgc gtcggctcag gggccgagct 118080 attagcctgc atcgcgccca caggcatcgc gtccccctga gccgggtcag ctgtgggctg 118140 tcctgacacg ggtttccccc agtctctggc ccgctgtccc tcccaggtca gtgtccagcg 118200 ttgcccttct ggttgtggac ttgtgcagcg gtctcagcag atggaggggc gaccctaaag 118260 gatgtattga ggcatctcag cactgtcctc cgcccaggtt tgctggtcag cagtgaagtg 118320 accgggaaaa ggggctgtct tggggtcctt tcagaggcct gggttagacc aaagttttct 118380 agaagattca ccattgcagg gagtcaaaga caaaactagg gtggtcagca atctgtgggg 118440 gattcggcgg tgagggaatt ctgaatgcta catgtaatgg ttttactatt gttagggaac 118500 atttttcccc cctacaaaca gcaggccaaa atactgagat gtcaggtttg catcaaagag 118560 cgggttcatc cacaaggcaa ccagagaacg ctctggaatc tgcctccctg cgggcacagg 118620 ctgggtgctc acggatgaag accaagcagc aggtggcgtg gggagtgggg agcctgggga 118680 aagcgatgga caaggtgcga ggacctccgg cgcgagctgg aggcggagct tccagggaca 118740 cgcggccacg cccagtggga gggtcagcgg tccatccagt cctaacagc t cagctccaac 118800 tagacgctgc tgagtctggc tttctagaga acactccggg cgggtatttt attgttttgg 118860 cttcgtgact ggaggacgtt caagtcttaa aacacccttg attagtgcgg ggaggcggaa 118920 tggatttgac tgatcacgac ccgcagtttc accatctcag gggccgccct caccccctcc 118980 taccctacca aaggtggggg catcggtgct gagatctggg gtgacacata aaatcaggtg 119040 aagtcttagg acagggggcc gattccaggt cctagggtgc agaaaaaacc tacctggccc 119100 cgggctagac agcgtggagg gcgtggcccg ggctggtgca cagaagtggc ccccaactgg 119160 tcagaaggtg tgggagccca gggctggtct actgcagaag gggtcgcctg gtggacagag 119220 tggggcctga gtgcctgctg aactggtccg tcagggctgc tgagcagaca cgggccatca 119280 tcactggctc ctgtgctcga tagaagggag ggaaaccagg aaagcaaagg cgctttatgg 119340 ccgcttttgt gtttcgcgtt cctctagcac cgtctgccgg cagaacgcgg cattacatcc 119400 gctggccaaa cctcggggtc cggcttggat gtccccatcc ttgtctcgga gatctcacct 119460 ctcagcagtt cccctgggga caatgtcgag aagatgcgac cttgacccgg agctcggtgg 119520 agagggtgcc ctgggttctt tccgcagttg cttggagtgg aggtgcctca tgttgggctg 119580 ggaacgggag gaaggaaaca ggtcatgat t gagatgctct agacagactg tccctgctct 119640 tgccaaattt cagaagattg tctttaataa atattccatt ttttgtatgc ccttaggtct 119700 atttccagac actttaaata tattgaaaga ctttaaatat ttatataaaa atattattta 119760 tagactgtat aaaaggaaca gttagaactg gacttggaac aacagactgg ttccaaatag 119820 gaaaaggagt acgtcaaggc tgtatattgt caccctgctt atttaactta tatgcagagt 119880 acatcatgag aaacgctggg ctggaagaaa cacaagctgg aatcaagatt gccgggagaa 119940 atatcaataa cctcagatat gcagatgaca ccacccttat ggcagaaagt gaagaggaac 120000 tcaaaagcct cttgatgaag gtgaaagagg agagcgaaaa agttggctta aagctcaaca 120060 tttagaaaac gaagatcatg gcatctggtc ccatcacttc atggaaatag atggggaaac 120120 agttgagaca gtgtcagact ttatttttgg gggctccaat gaaattaaaa gacgcttact 120180 tcttggaagg aaagttatga ccaacctaga cagcatatta aaaagcagag acactacttt 120240 gccagcaaag gtccgtctag tcaaggctat ggtttttcca gtggtcatgt atggatgtga 120300 gagttggact gtgaagaagg ctgagcaccg aagaagtgat gcttttgaac tgtggtgttg 120360 gagaagactc ttgagaggcc cttggactgc aaggagatcc aaccagtcca tcgtaaagga 120420 gatcacccc c tgggtggtca ttggaaggac tgatgttgaa gctgaaactc cagtactttg 120480 gctacctaat gcgaagagct gactcattgg aaaagaccct gatgctggga aagattgaag 120540 gtgggaggag aaggggacaa cagaggatga gatggttgga ttgcatcact gactcgatgg 120600 acgtgagtct gagtgaagtc tgggagttgg tgatggccag ggaggccctg gcgtgctggc 120660 ggttcatggg gtcgcaaaga gtcggccatg actgagtgac tgaactgaac tgatccagaa 120720 atttaaaatt aatatataaa ccaaatccat gcagacaatt ataagcatat attataaatg 120780 cataattata agcaagtata tgttatattt ataatagttt ataatgtatt tataagcaag 120840 tatatattat tataagcata attgtaagta gaagtaactt tgggctttcc tggtggctca 120900 gacagtaaag aatctgcctg cagtacagga gaccgggttc gatccctggt ttggggaaat 120960 tccctggaga agggaatggc aaccaactcc aacatgtttg cctggagaat tccatggaca 121020 gaggagcccg gaaggttgca gtccatgggg ttgcaaagag ctggatacaa cagagtgact 121080 aacacatgta tataaataaa tttacctata tattgtatat atatttataa acatattcag 121140 atattataaa taattagaaa catattatac atgtatttaa atactgttat aaacataaat 121200 ttaaaaaata attttcagcc ctttggcttg ggggtgtgtt tgtggacgtc tttgt gctac 121260 tgttcctgaa gtggagctct cccctcccaa accagctttt gaaatgactg ggaaagcaat 121320 ggaatacata agcatcagga agatagcaac agagctgtca ttcttcacag agggtgtgct 121380 tgagtgtgta gcaagtcccg cagaatgtag acagattaat atagtctatt aaaaatagtg 121440 tagcaaattt acgaggtgcg atttcaagta taaagactta ctgggtctct cagttcagtt 121500 cagtcgcttg gttgtgtccg actctttttg accccatgga ccgcagcacg ccaggcctcc 121560 ctgtccatca ccaactcctg gagttcactc aaactcatgt ccatcgagtc ggtgatgcca 121620 tccaaccatc tcatcctctg gcgtcccctt ctcctcccac cttcaatctt tcccagcatc 121680 agggtctttc ccagtgagtc agttctttgc atcaggtggc cagagtagtg gagtttcagc 121740 ttcagcatcg gtccttccaa tgaatattct ggactgattt cctttaggat tgactggttg 121800 gatctccttg cagttcaagg gactctcaag agtcttctcc aacagcacag tctatgaata 121860 gaatagcaaa tgaatagaga ataacattta cgaggatata ttttaccatt gcataaaata 121920 tatcagcttg tagagaacag acttgttccc aggggagagg gtgggtaggg atggagtggg 121980 agtttgngat cancagaagc gagctgttat atagaagatg gataaaaagg atacacaaca 122040 atgtcctact gtgtggcacc gggacctata ttcag tagct tgtgagaaac cataatcgac 122100 aagactgagg aaaagtatat atatatgtat gtacttgagt tgctttgctg tacagaagaa 122160 attaacacaa cattgtaaat cgatatttca atagaatcca cccccccaaa tatataagtt 122220 tcctggagat ggagacggca acccactcca tttcttgcac ccaatattct tgcctggagg 122280 atcccatgga tagaggatcg caaagactcg gacataaccc agcgactaac actttccctt 122340 tcaaatgtgt aggtttacta gcgtgaatct acagagatgc ccaagacatt cgtttatgag 122400 gaaaactcca cacgcagctt cactgagaat tattaaacct attaaaggga gagagcgcca 122460 ggatattcat ggattgaaag attcgatgtg gtcaagttgc cagttttccc caaactgatt 122520 ggtaaattcc ccaggagctg gctcaaggcg caaaattccc tttacctttt tttaagagac 122580 gaagccaagg agccgattct ggttgagaga cgctcaggtc ctcctgcggg agagcagccc 122640 tcttcctccc ggtcgcctgg gcagtttcga ggccacgacc agaaggactt ggctccctgt 122700 gtcgcgcact cagaagtctc cctctccgtc ccaaggactc agaagctggg cgtcctgccc 122760 gcagcagagg aggcagcctg gaggggcccc gcgggcacag cggtccgggt ttcagccgag 122820 ttgcccgccc cgcccctcta cctgggcgct gccgcccggc tccggggccg gccgtgccct 122880 ccgtggccgc aaggc gtcgc tgtccccccg ctggaagtgc tgacccggag gaaggggccc 122940 agacggaggg actcggagcc tccgagtgac accctgggac tccgagcgct ggagcctggc 123000 gtcaccccag gcaggggcag tgggggcccg gggcggggtc aggggcctcc cccggttctc 123060 atttgacacc gcgggggtgc gctgggcaca gtgtccaggg gccacgttcc gagcaggggc 123120 gcgatgcagg cccgggcgcg gcctgtcccg ggcgcgagtc cagctgcttt gcagaggtgg 123180 cggcaggtcg cagtgaccct cacagagacg ccccactctg cggctccagg tgggcctgtg 123240 ccccccagaa gtgctgacct gtgcaccggg aaggcacagg gccccccagc catgtctgcg 123300 atggaagagc cggaaccgcg ccatgcccgt cctcgctgac cggcaggcac ccgccgtgtg 123360 tccacacgct gagccatctg gctccccttg cttgacatac acccaggacc tgagtgtgca 123420 ggaagttaga aggggcaggt gtggtgacac gatgccatcc agcatcacct gagaacctgg 123480 acaaacctca ggggcccagc ctgctctgtg aggccccgag ggccggcccc tccccggacc 123540 cctgccttga atccggccac actgcccgcc ttcctgctcc tgcggcttgt cagacacgcc 123600 tgagcccagg gcctgtgcac tcgctgtccc ttctgccagg actgctcctc cccaggctct 123660 tgctggggct ccccttcttc attcgggggt ggcctctctt gttcagtggc tcagctgtgc 1 23720 ccagtctttg caaccccatg gactgcagca cgccaggctt ccctgtcctt cactagctcc 123780 tggagtttgc tcaaactcat gtccattgag tcagtgatgc tatccaacca tctcatcctt 123840 tgctgcccac ttcttctcct gctctcaatc tttcccagca tcagggtctt ttccaatgag 123900 ttagctctct gcatcaggag gccaaagtat tggagcttca gcatcagtcc ttccagtgaa 123960 tatgcgaggt tgatttccct tagaattgac tggttggatc tccttcctgt ccagagaact 124020 ctcaagagtc ttctccagca ccacagtcgg agagcatcag ttcttcagtg atcaggtttc 124080 tttatagccc agctctcaca tcggtacatg actattggaa aacccatagc tttgattaga 124140 tggaccttca ttggcaaagt gatgggcctt cattggccct gctttttaat acaccatcta 124200 ggtttgtcgt agctttcctt ccaaagagca aacatctttt aatttcctgg ctgcagtaac 124260 catccatagt gattttggag cccaagaaaa taaaatctgc cactgtttcc actttttccc 124320 cttctatttg ctatgaagtg aggggactgg atgccatgat cttagtttaa accagcagtt 124380 gtcaccccga ccgcttcctt tcctaaagag ctcatcacac ctcccactgg aatgcaatgt 124440 gttgcctgtc cgcctgcttc acctcctggg actttgctgc aggtcttggt ctctgaggcc 124500 cctgccgtat ccccagggcc cagagcagtg ctgggcttcg a gtccgatca gggactatgt 124560 gtgtggactg gatggtgctt gcttcttctg gggaacgaga gacctgggcc tggggaacga 124620 ggggacctgg tgtgaccgga tctcctccct cgggagagga gccaagcgag tggacacagg 124680 tcagtgtgtc ttgctcctgt gtggcaggtg tcccgtctgt gtctgtcatc ttggcatttc 124740 ggtgtttctg tgaacccagc ccctcccctc ctgatacccc atcccatcag cacagaggag 124800 actgggcttg gggactctct ggtcctgaga ttcctctccg catgtgactc ccccctcctg 124860 gggggagcag gcaccgtgtg tgaggagggt ggaagctttt caagaccccc agcttttctg 124920 tcccaggggg ctctggcagg gccttgggag ctggaatgag ctggaatctg ggccagtggg 124980 ggtttccctg gtggtaaaga acccgcctgc ccatgcacga ggcataagag acgcgggttc 125040 gatcactggg tcgggaagat cccctacagg agggcatggc aacccactcc agtattcttt 125100 cctgaagaat cccttggaca gaggagcctg gtgggctaca gtctctgggg tggcaaggag 125160 tcggacacga ctgaagcgac ttaccatgca cgcacgcggg gtcaggggtc agggccgcgc 125220 tgcttacctg ctgtgtgacc ttagccaggt cacacccccc aggctgtgaa agagaacagt 125280 cttcccagac tcgggcatcc aggtctttac agacgtgcct gtgagctttg tgactctggc 125340 tctgtggccg ctagagggcg c tgtccgccg ggccctatgt gcgtgcacgc atgtgagcat 125400 gttcgcatac gtgtgtgcat ctgtcggggg cgcacggtgc ggggacacgg gcacgcggtc 125460 aggaacgcag cccggacacc tccacgtggc ccgcgagtac cgtcaggtgg gggctgtggc 125520 tccgctgtgt gggtgacccg ccctcccccc gcgaacgtgg tgcatagtga ccgcctggct 125580 gggctcctga gctcagccat cctgcccccc gggtcagctc ccgacaggcc cagctctagg 125640 ccccaggcgt ggaccgaggc ccccaggccc cggcctgtga gatgggacct ccgtctgggg 125700 ggctcattct gctcccggag gcctggcagg cccctcctct ttggcattgc ataccctcgc 125760 attggggtgg gtaagcacag taccccatgc ctgtggcccc gtgggagcgg cctgctcagg 125820 gaggccggag cctcagctac agggctgtca caccgggctg cagaggaaga agacgggagc 125880 gaggcctaca ggaacctagc caggccctgg cccactgagc cgacaggagc ctggccagag 125940 gcctgcacag gacggggtgg cggggggggt ggggtggggt gctgggcccc gtggccttga 126000 ctgcagaccc cgagggctcc tcagcttaga acggccaagc ctgagtcttg ggggtgcagg 126060 tcaggggg 126068 <210> 32 <211> 10012 <212> DNA <213> Sus scrofa <400> 32 gccacgccca ctccatcatg cggggagggg atgggcagac cctccagaaa gaagctccct 60 ggggt gcagg ttaacagctt tcccagacac agccagtact agagtgaggt gaataagaca 120 tcctccttgc ttgtgaaatt taggaagtgc ccccaaacat cagtcattaa gataaataat 180 attgaatgca cttttttttt tttatttttt ttttttgctt tttagggcct aatctgcagc 240 atatggaagt tcccaggcta caagtcgaac cagagctgca gctgccagcc tacatcacag 300 ccacagcaac accagatccg agccacatct gtgactaaca ctgcagttca cagcaacgcc 360 agatccttaa cccattgagt gaggccaggg atcaaaccca catcctcatg gatactagtc 420 tggttcgtaa accactgagc cacaagggga actcctgaat gcaatatttt tgaaaattga 480 aattaaatct gtcactcttt cacttaagag tccccttaga ttggggaaaa tttaaatatc 540 tgtcatctta gtgcatcttt gctcatatga tgtgaataaa atcccaaaat ccatatgaat 600 gaagcatcaa aatgtacatg aagtcagcct gaccctgcac tgccctcact tgcctcatgt 660 accccccacc tcaaaggaag atgcagaaag gagtccagcc cctacaccgc cacctgcccc 720 caccactgga gcccctcagg tctcccacct ccttttctga gcttcagtct tcctgtggca 780 ttgcctacct ctacagctgc cccctactag gccctccccc tggggctgag ctccaggcac 840 tggactggga aagttagagg ttaaagcatg gaaaattccc aaagccacca gttccaggct 900 gccccccacc ccaccgccac gtc caaaaag gggcatcttc ccagatctct ggctggtatt 960 ggtaggaccc aggacatagt ctttatacca attctgctgt gtgtcttagg aaagaaactc 1020 tccctctctg tgcttcagtt tcctcatcaa taaaaggagc aggccaggtt ggagggtctg 1080 tgacgtctgc tgaagcagca ggattctctc tccttttgct ggaggagaac tgatccttca 1140 cccccaggat caacagagaa gccaaggtct tcagccttcc tggggacccc tcagagggaa 1200 ctcagggcca cagagccaga ccctgatgcc agaacctttg tcatatgccc agacggagac 1260 ttcatccccc tcctcctcag accctccagg ccccaacagt gagatgctga agatattaag 1320 agaagggcaa gtcagcttaa gtttgggggt agaggggaac agggagtgag gagatctggc 1380 ctgagagata ggagccctgg tggccacagg aggactcttt gggtcctgtc ggatggacac 1440 agggcggccc gggggcatgt tggagcccgg ctggttctta ccagaggcag ggggcaccct 1500 ctgacacggg agcagggcat gttccataca tgacacaccc ctctgctcca gggcaggtgg 1560 gtggcggcac agaggagcca gggactctga gcaaggggtc caccagtggg gcagttggat 1620 ccagacttct ctgggccagc gagagtctag ccctcagccg ttctctgtcc aggagggggg 1680 tggggcaggc ctgggcggcc agagctcatc cctcaagggt tcccagggtc ctgccagacc 1740 cagatttccg accgcagcca ccacaagagg atgtggtctg ctgtggcagc tgccaagacc 1800 ttgcagcagg tgcagggtgg gggggtgggg gcacctgggg gcagctgggg tcactgagtt 1860 cagggaaaac cccttttttc ccctaaacct ggggccatcc ctaggggaaa ccacaacttc 1920 tgagccctgg gcagtggctg ctgggaggga agagcttcat cctggaccct gggggggaac 1980 ccagctccaa aggtgcaagg ggcccaggtc caaggctaga gtgggccaag caccgcaatg 2040 gccagggagt gggggaggtg gagctggact ggatcagggc ctccttggga ctccctacac 2100 cctgtgtgac atgttagggt acccacaccc catcaccagt cagggcctgg cccatctcca 2160 gggccaggga tgtgcatgta agtgtgtgtg agtgtgtgtg tgtggtgtag tacacccctt 2220 ggcatccggt tccgaggcct tgggttcctc caaagttgct ctctgaatta ggtcaaactg 2280 tgaggtcctg atcgccatca tcaacttcgt tctccccacc tcccatcatt atcaagagct 2340 ggggagggtc tgggatttct tcccacccac aagccaaaag ataagcctgc tggtgatggc 2400 agaagacaca ggatcctggg tcagagacaa aggccagtgt gtcacagcga gagaggcagc 2460 cggactatca gctgtcacag agaggcctta gtccgctgaa ctcaggcccc agtgactcct 2520 gttccactgg gcactggccc ccctccacag cgcccccagg ccccagggag aggcgtcaca 2580 gcttagagat ggccctgctg aacagggaac aagaa caggt gtgccccatc cagcgcccca 2640 ggggtgggac aggtgggctg gatttggtgt gaagcccttg agccctggaa cccaaccaca 2700 gcagggcagt tggtagatgc catttgggga gaggccccag gagtaagggc catgggccct 2760 tgagggggcc aggagctgag gacagggaca gagacggccc aggcagagga cagggccatg 2820 aggggtgcac tgagatggcc actgccagca ggggcagctg ccaacccgtc cagggaactt 2880 attcagcagt cagctggagg tgccattgac cctgagggca gatgaagccc aggccaggct 2940 aggtgggctg tgaagacccc aggggacaga gctctgtccc tgggcagcac tggcctctca 3000 ttctgcaggg cttgacggga tcccaaggcc tgctgcccct gatggtagtg gcagtaccgc 3060 ccagagcagg accccagcat ggaaacccca acgggacgca gcctgcggag cccacaaaac 3120 cagtaaggag ccgaagcagt catggcacgg ggagtgtgga cttccctttg atggggccca 3180 ggcatgaagg acagaatggg acagcggcca tgagcagaaa atcagccgga ggggatgggc 3240 ctaggcagac gctggcttta tttgaagtgt tggcattttg tctggtgtgt attgttggta 3300 ttgattttat tttagtatgt cagtgacata ctgacatatt atgtaacgac atattattat 3360 gtgttttaag aagcactcca agggaacagg ctgtctgtaa tgtgtccaga gaagagagca 3420 agagcttggc tcagtctccc ccaaggaggt cagttcctca acaggggtcc taaatgtttc 3480 ctggagccag gcctgaatca agggggtcat atctacacgt ggggcagacc catggaccat 3540 tttcggagca ataagatggc agggaggata ccaagctggt cttacagatc cagggctttg 3600 acctgtgacg cgggcgctcc tccaggcaaa gggagaagcc agcaggaagc tttcagaact 3660 ggggagaaca gggtgcagac ctccagggtc ttgtacaacg caccctttat cctggggtcc 3720 aggaggggtc actgagggat ttaagtgggg gaccatcaga accaggtttg tgttttggaa 3780 aaatggctcc aaagcagaga ccagtgtgag gccagattag atgatgaaga agaggcagtg 3840 gaaagtcgat gggtggccag gtagcaagag ggcctatgga gttggcaagt gaatttaaag 3900 tggtggcacc agagggcaga tggggaggag caggcactgt catggactgt ctatagaaat 3960 ctaaaatgta tacccttttt agcaatatgc agtgagtcat aaaagaacac atatatattt 4020 aaattgtgta attccacttc taaggattca tcccaagggg ggaaaataat caaagatgta 4080 accaaaggtt tacaaacaag aactcatcat taatcttcct tgttgttatt tcaacgatat 4140 tattattatt actattatta ttattattat tttgtctttt tgcattttct agggccactc 4200 ccacggcata gagaggttcc caggctaggg gtcaaatcgg agctacagct gccggcctac 4260 gccagagcca cagcaacgca ggatctgagc cacagcaatg caggat ctac accacagctc 4320 atggtaacgc tggatcctta acccaatgag tgaggccagg gatcgaacct gtaacttcat 4380 ggttcctagt cggattcatt aaccactgag ccacgacagg aactccaaca ttattaatga 4440 tgggagaaaa ctggaagtaa cctaaatatc cagcagaaag ggtgtggcca aatacagcat 4500 ggagtagcca tcataaggaa tcttacacaa gcctccaaaa ttgtgtttct gaaattgggt 4560 ttaaagtacg tttgcatttt aaaaagcctg ccagaaaata cagaaaaatg tctgtgatat 4620 gtctctggct gataggattt tgcttagttt taattttggc tttataattt tctatagtta 4680 tgaaaatgtt cacaagaaga tatatttcat tttagcttct aaaataatta taacacagaa 4740 gtaatttgtg ctttaaaaaa atattcaaca cagaagtata taaagtaaaa attgaggagt 4800 tcccatcgtg gctcagtgat taacaaaccc aactagtatc catgaggata tggatttgat 4860 ccctggcctt gctcagtggg ttgaggatcc agtgttgctg tgagctgtgg tgtaggttgc 4920 agacacagca ctctggcgtt gctgtgactc tggcgtaggc cggcagctac agctccattt 4980 ggacccttag cctgggaacc tccatatgcc tgagatacgg ccctaaaaag tcaaaagcca 5040 aaaaaatagt aaaaattgag tgtttctact taccacccct gcccacatct tatgctaaaa 5100 cccgttctcc agagacaaac atcgtcaggt gggtctatat atttccagcc c tcctcctgt 5160 gtgtgtatgt ccgtaaaaca cacacacaca cacacacacg cacacacaca cacacgtatc 5220 taattagcat tggtattagt ttttcaaaag ggaggtcatg ctctaccttt taggcggcaa 5280 atagattatt taaacaaatc tgttgacatt ttctatatca acccataaga tctcccatgt 5340 tcttggaaag gctttgtaag acatcaacat ctgggtaaac cagcatggtt tttagggggt 5400 tgtgtggatt tttttcatat tttttagggc acacctgcag catatggagg ttcccaggct 5460 aggggttgaa tcagagctgt agctgccggc ctacaccaca gccacagcaa cgccagatcc 5520 ttaacccact gagaaaggcc agggattgaa cctgcatcct catggatgct ggtcagattt 5580 atttctgctg agccacaaca ggaactccct gaaccagaat gcttttaacc attccacttt 5640 gcatggacat ttagattgtt tccatttaaa aatacaaatt acaaggagtt cccgtcgtgg 5700 ctcagtggta acgaattgga ctaggaacca tgaggtttcg ggttcgatcc ctggccttgc 5760 tcggtgggtt aaggatccag cattgatgtg agatatggtg taggtcgcag acgtggctcg 5820 gatcccacgt tgctgtggct ctggcgtagg ccggcaacaa cagctccgat tcgaccccta 5880 gcctgggaac ctccatgtgc cacaggagca gccctagaaa aggcaaaaag acaaaaaaat 5940 aaaaaattaa aatgaaaaaa taaaataaaa atacaaatta caagagacgg ctacaag gaa 6000 atccccaagt gtgtgcaaat gccatatatg tataaaatgt actagtgtct cctcgcggga 6060 aagttgccta aaagtgggtt ggctggacag agaggacagg ctttgacatt ctcataggta 6120 gtagcaatgg gcttctcaaa atgctgttcc agtttacact caccatagca aatgacagtg 6180 cctcttcctc tccacccttg ccaataatgt gacaggtgga tctttttcta ttttgtgtat 6240 ctgacaagca aaaaatgaga acaggagttc ctgtcgtggt gcagtggaga caaatctgac 6300 taggaaccat gaaatttcgg gttcaatccc tggcctcact cagtaggtaa aggatccagg 6360 gttgcagtga gctgtggggt aggtcgcaga cacagtgcaa atttggccct gttgtggctg 6420 tggtgtaggc cggcagctat agctccaatt ggacccctag cctgggaacc tccttatgcc 6480 gtgggtgagg ccctaaaaaa aagagtgcaa aaaaaaaaaa taagaacaaa aatgatcatc 6540 gtttaattct ttatttgatc attggtgaaa cttattttcc ttttatattt ttattgactg 6600 attttatttc tcctatgaat ttaccggtca tagttttgcc tgggtgtttt tactccggtt 6660 ttagttttgg ttggttgtat tttcttagag agctatagaa actcttcatc tatttggaat 6720 agtaattcct cattaagtat ttgtgctgca aaaaattttc cctgatctgt tttatgcttt 6780 tgtttgtggg gtctttcacg agaaagcctt tttagttttt acacctcagc ttggttgttt 68 40 ttcttgattg tgtctgtaat ctgcggccaa cataggaaac acatttttac tttagtgttt 6900 ttttcctatt ttcttcaagt acgtccattg ttttggtgtc tgattttact ttgcctgggg 6960 tttgtttttg tgtggcagga atataaactt atgtattttc caaatggaga gccaatggtt 7020 gtatatttgt tgaattcaaa tgcaacttta tcaaacacca aatcatcgat ttatcacaac 7080 tcttctctgg tttattgatc taatgatcaa ttcctgttcc acgctgtttt aattatttta 7140 gctttgtgga ttttggtgcc tggtagagaa caaagcctcc attattttca ttcaaaatag 7200 tcccgtctat tatctgccat tgttgtagta ttagacttta aaatcaattt actgattttc 7260 aaaagttatt cctttggtga tgtggaatac tttatacttc ataaggtaca tggattcatt 7320 tgtggggaat tgatgtcttt gctattgtgg ccatttgtca agttgtgtaa tattttaccc 7380 atgccaactt tgcatattgt atgtgagttt attcccaggg tttttaatag gatgtttatt 7440 gaagttgtca gtgtttccac aatttcatcg cctcagtgct tactgtttgc ataaaaggaa 7500 acctactcac ttttgcctat tgctcttgta ttcaatcatt ttagttaact cttgtgttaa 7560 ttttgagagt ttttcagctg actgtctggg gttttcttta atagactagc cctttgtctg 7620 taaagaataa ttttatcgaa tttttcttaa cactcacact ctccccaccc ccacccccgc 7680 tca tctcctt tcattgggtc aaatctgtag aatacaataa aagtaagagt gggaacctta 7740 gcctttaagt cgattttgcc tttaaatgtg aatgttgcta tgtttcggga cattctcttt 7800 atcaagttgc ggatgtttcc ttagataatt aacttaataa aagactggat gtttgctttc 7860 ttcaaatcag aattgtgttg aatttatatt gctattctgt ttaattttgt ttcaaaaaat 7920 ttacatgcac accttaaaga taaccatgac caaatagtcc tcctgctgag agaaaatgtt 7980 ggccccaatg ccacaggtta cctcccgact cagataaact acaatgggag ataaaatcag 8040 atttggcaaa gcctgtggat tcttgccata actctcagag catgacttgg gtgttttttc 8100 cttttctaag tattttaatg gtatttttgt gttacaatag gaaatctagg acacagagag 8160 tgattcaatg aggggaacgc attctgggat gactctaggc ctctggtttg gggagagctc 8220 tattgaagta aagacaatga gaggaagcaa gtttgcaggg aactgtgagg aatttagatg 8280 gggaatgttg ggtttgaggt ttctataggg cacgcaagca gagatgcact caggaggaag 8340 aaggagcata aatctagagg caaaaagaga ggtcaggact ggaaatagag atgcgagaca 8400 ccagggtggc agtcagagag cacagtgtgg gtcagaagac agtggaagaa cacaagggac 8460 agagagggat ctccaacttc actgggatga gggccttgtt ggccttgacc tgagagattt 8520 ccaggagtt g agggtgggaa ggagagggct cctgcacatg tcctgacatg aaacggtgcc 8580 cagcatatgg gtgcttggaa gacattgttg gacagatgga tggatgatgg atgatggatg 8640 aatggatgga tggaagatga tggataaatg gatgatggat ggatggacag aaggacaaag 8700 agatggacag aaagacagtg atctgagaga gcagagaagg cttcatgaaa ggacaggaac 8760 tgaactgtct cagtgggtgg agacaatggt gtagggggtt tccacatgga ggcaccaggg 8820 gtcaggaata atctagtgtc cacaggccca ggaaggaagc tgtctgcagg aaattgtggg 8880 gaagaacctc agagtcctta aatgaggtca ggagtggtca ggagggtctg atcaggtaag 8940 gactcatgtc catcatcaca tggtcaccta agggcatgta gctctcagca tctccatcag 9000 gacagtctca gaatgggggc ggggtcacac actgggtgac tcaaggcgtg ggtcatgcct 9060 gcctcggacg tgggcctggg catggggaca cctccagacc atgggcccgc ccagggctgc 9120 actggcctct ggtgggctag ctacccgtcc aagcaacaca ggacacagcc ctacctgctg 9180 caaccctgtg cccgaaacgc ccatctggtt cctgctccag cccggcccca gggaacagga 9240 ctcaggtgct agcccaatgg ggttttgttc gagcctcagt cagcgtggta tttctccggc 9300 agcgagactc agttcaccgc cttaggttaa gtggttctca tgaatttcct agcagtcctg 9360 cactctgcta tgcc gggaaa gtcacttttg tcgctggggg ctgtttcccc gtgcccttgg 9420 agaatcaagg attgcccaac tttctctgtg ggggaggtgg ctggtcttgg ggtgaccagc 9480 aggaagggcc ccaaaagcag gagcagctgc ctccagaata caactgtcgg ctacagctca 9540 aacaggaggc ctggactggg gtttaaccac cagggcggca cgaaggagcg aggctgggag 9600 ggtgaggaca tgggagcctg aggaggagct ggagacttca gcaggccccc agctccgggc 9660 ttcgggctct gagatgctcg gacgcaaggt gagtgacccc acctgtggct gacctgacct 9720 cagggggaca aggctcagcc tgagactctg tgtccccatc gcctgcacag gggattcccc 9780 tgatggacac tgagccaacg acctcccgtc tctccccgac ccccaggtca gcccaaggcc 9840 gcccccacgg tcaacctctt cccgccctcc tctgaggagc tcggcaccaa caaggccacc 9900 ctggtgtgtc taataagtga cttctacccg aagggcgaat tccagcacac tggcggccgt 9960 tactagtgga tccgagctcg gtaccaagct tgatgcatag cttgagtatc ta 10012 <210> 33 <211> 4614 <212> DNA <213> Sus scrofa <400> 33 agatctttaa accaccgagc aaggccaggg atcgaacccg catcctcatg aatcctagtt 60 gggttcgtta accgctgaac cacaatggga actcctgtct ttcacattta attcacaacc 120 tctccaggat tctgggggtg ggtggggaat cctaggtacc ca ctgggaaa gtaatccaag 180 gggagaggct cacggactct agggatcggc ggaggaggga aggtatctcc caggaaactg 240 gccaggacac attggtcctc cgccctcccc ttcctcccac tcctcctcca gacaggactg 300 tgcccacccc ctgccacctt tctggccaga actgtccatg gcaggtgacc ttcacatgag 360 cccttcctcc ctgcctgccc tagtgggacc ctccatacct ccccctggac cccgttgtcc 420 tttctttcca gtgtggccct gagcataact gatgccatca tgggctgctg acccacccgg 480 gactgtgttg tgcagtgagt cacttctctg tcatcagggc tttgtaattg atagatagtg 540 tttcatcatc attaggaccg ggtggcctct atgctctgtt agtctccaaa cactgatgaa 600 aaccttcgtt ggcatagtcc cagcttcctg ttgcccatcc ataaatcttg acttagggat 660 gcacatcctg tctccaagca accacccctc ccctaggcta actataaaac tgtcccaatg 720 gcccttgtgt ggtgcagagt tcatgcttcc agatcatttc tctgctagat ccatatctca 780 ccttgtaagt catcctataa taaactgatc cattgattat ttgcttctgt tttttccatc 840 tcaaaacagc ttctcagttc agttcgaatt ttttattccc tccatccacc catactttcc 900 tcagcctggg gaacccttgc ccccagtccc atgcccttcc tccctctctg cccagctcag 960 cacctgccca ccctcaccct tcctgtcact ccctaggact ggaccatcca ctggggccag 1020 gacactccag cagccttggc ttcatgggct ctgaaatcca tggcccatct ctattcctca 1080 ctggatggca ggttcagaga tgtgaaaggt ctaggaggaa gccaggaagg aaactgttgc 1140 atgaaaggcc ggcctgatgg ttcagtactt aaataatatg agctctgagc tccccaggaa 1200 ccaaagcatg gagggagtat gtgcctcaga atctctctga gattcagcaa agcctttgct 1260 agagggaaaa tagtggctca accttgaggg ccagcatctt gcaccacagt taaaagtggg 1320 tatttgtttt acctgaggcc tcagcattat gggaaccggg ctctgacaca aacacaggtg 1380 cagcccggca gcctcagaac acagcaacga ccacaagctg ggacagctgc ccctgaacgg 1440 ggagtccacc atgcttctgt ctcgggtacc accaggtcac catccctggg ggaggtagtt 1500 ccatagcagt agtcccctga tttcgcccct cgggcgtgta gccaggcaag ctcctgcctc 1560 tggacccagg gtggaccctt gctccccact accctgcaca tgccagacag tcaagaccac 1620 tcccacctct gtctgaggcc cccttgggtg tcccagggcc cccgagctgt cctctactca 1680 tggttcttcc acctgggtac aaaagaggcg agggacactt ttctcaggtt tgcggctcag 1740 aaaggtacct tcctagggtt tgtccactgg gagtcacctc ccttgcatct caatgtcagt 1800 ggggaaaact gggtcccatg gggggattag tgccactgtg aggcccctga agtctggggc 1860 c tctagacac tatgatgatg agggatgtgg tgaaaaaccc caccccagcc cttcttgccg 1920 ggaccctggg ctgtggctcc cccattgcac ttggggtcag aggggtggat ggtggctatg 1980 gtcaggcatg tttcccatga gctgggggca ccctgggtga ctttctcctg tgaatcctga 2040 attagcagct ataacaaatt gcccaaactc ttaggcttaa aacaacacac atttattcct 2100 ctgggtccca gggtcagaag tccaaaatga gtcctatagg ctaaatttga ggtgtctctg 2160 ggttgagctc ctcctggaag ccttttccag cctctagagt cccaagtcct tggctctggg 2220 cccctccctc aagcttcaaa gccacagaag cttctaatct ctctcccttc ccctctgacc 2280 tctgctccca tcctcatacc ctgtcccctc actctgaccc tcctgcctcc ctctttccct 2340 tataaagacc ctgcatgggg ccacggagat aatccagggt aatcgcccct cttccagccc 2400 ttaactccat cccatctgca aaatccctgt caccccataa tggacctact gatggtctgg 2460 gggttaggac gtggacaact tggggcctta ttcatctgat cacaactcca gttcccagac 2520 ccccagaccc ccgggcatta gggaaacttc tcccagttcc tctccctctg tgtcctgccc 2580 agtctccagg atgggccact cccgagggcc cttcagctca ggctccccct cctttctccc 2640 tggcctcttg tggccccatc tcctcctccg ctcacaggga gagaactttg atttcagctt 2700 tggctct ggg gctttgcttc cttctggcca ttggctgaag ggcgggtttc tccaggtctt 2760 acctgtcagt catcaaaccg cccttggagg aagaccctaa tatgatcctt accctacaga 2820 tggagactcg aggcccagag atcctgagtg acctgctcac attcacagca gggactgaac 2880 cccagtcacc tacccaactc cagggctcag cgcttttttt tttttttttc tttttgcctt 2940 ttcgagggcc gctcccgcaa catatggaga tttccaggct aggggtctaa ttggagcagt 3000 cgacactggc ctaagccaaa gccacagcaa caagggcaag ccgcttctgc agcctatacc 3060 acagctcacg gcaatgccgg atccttaacc cactgagcaa agccagggat tgaacctgca 3120 acctcatgtt tcctagtcaa atttgttaac cactgaccca tgacgggaac tcccagggct 3180 cagctcttga ctccaggttc gcagctgccc tcaaagcaat gcaaccctgg ctggccccgc 3240 ctcatgcatc cggcctcctc cccaaagagc tctgagccca cctgggccta ggtcctcctc 3300 cctgggactc atggcctaag ggtacagagt tactggggct gatgaaggga ccaatgggga 3360 caggggcctc aaatcaaagt ggctgtctct ctcatgtccc ttcctctcct cagggtccaa 3420 aatcagggtc agggccccag ggcaggggct gagagggcct ctttctgaag gccctgtctc 3480 agtgcaggtt atgggggtct gggggagggt caatgcaggg ctcacccttc agtgccccaa 3540 agcctagaga gt gagtgcct gccagtggct tcccaggccc aatcccttga ctgcctggga 3600 atgctcaaat gcaggaactg tcacaacacc ttcagtcagg ggctgctctg ggaggaaaaa 3660 cactcagaat tgggggttca gggaaggccc agtgccaagc atagcaggag ctcaggtggc 3720 tgcagatggt gtgaacccca ggagcaggat ggccggcact ccccccagac cctccagagc 3780 cccaggttgg ctgccctctt cactgccgac acccctgggt ccacttctgc cctttcccac 3840 ctaaaacctt tagggctccc actttctccc aaatgtgaga catcaccacg gctcccaggg 3900 agtgtccaga agggcatctg gctgagaggt cctgacatct gggagcctca ggccccacaa 3960 tggacagacg ccctgccagg atgctgctgc agggctgtta gctaggcggg gtggagatgg 4020 ggtactttgc ctctcagagg ccccggcccc accatgaaac ctcagtgaca ccccatttcc 4080 ctgagttcac atacctgtat cctactccag tcaccttccc cacgaacccc tgggagccca 4140 ggatgatgct ggggctggag ccacgaccag cccacgagtg atccagctct gccaatcagc 4200 agtcatttcc caagtgttcc agccctgcca ggtcccacta cagcagtaat ggaggcccca 4260 gacaccagtc cagcagttag agggctggac tagcaccagc tttcaagcct cagcatctca 4320 aggtgaatgg ccagtgcccc tccccgtggc catcacagga tcgcagatat gaccctaggg 4380 gaagaaatat cctgggag ta aggaagtgcc catactcaag gatggcccct ctgtgaccta 4440 acctgtccct gaggattgta cttccaggcg ttaaaacagt agaacgcctg cctgtgaacc 4500 cccgccaagg gactgcttgg ggaggccccc taaaccagaa cacaggcact ccagcaggac 4560 ctctgaactc tgaccaccct cagcaagtgg caccccccgc agcttccaag gcac 4614 <210> 34 <211> 1151 <212> DNA <213> Sus scrofa <400> 34 aacaagatgc taccccacca acaaaattca ccggagaaga caaggacagg gggttcctgg 60 ggtcctgaca gggtcaccaa agagggttct ggggcagcag caactccagc cgcctcagaa 120 cagagcctgg aagctgtacc ctcagagcag aggcggagag agaaagggcc tcttggtggg 180 tcagcaggag cagaggctca gaggtggggg ttgcagcccc cccttcaaca ggccaacaca 240 gtgaagcagc tgacccctcc accttggaga ccccagactc ctgtctccca cgccaccttg 300 gtttttaagg taatttttat tttatatcag agtatggttg acttacaatg ttgtgttggt 360 ttcaggtgta cagcagagtg attcacttct acatagactc atatctattc tttctcagat 420 tcttttccca tataggttat tacagaatat tgagtagatc cctgctgatt acccattttt 480 ataattgtat atgttaatcc caaactccta atttatccct ccccagacta tgattcttta 540 tatctctatc tgtttcctaa tctgtctcct ctaagtcacc ctaggagagc a gaggggtca 600 cgtctgtcct gtcctggccc agccacctct ctccacccag gaatcccttg catttggtgc 660 caagggcccg gccccgccct aaagagaaag gagaacggga tgtggacagg acaccgggca 720 gagagggaca agcagaggat gccagggtag ggaggtctcc agggtggatg gtggtctgtc 780 cgcaggcagg atgaggcagg aagggtgtgg atgtactcgg tgaggctggc gcatggcctg 840 gagtgtcctg agccctggga ggcctcagcc ctggatcaga tctgtgattc caaagggcca 900 ctgcatccag agaccgttga gtggcccatt gtcctgaacc atttatagaa cacaggacaa 960 gcggtacctg actaagctgc tcacagattc catgaggctg atgccagggt tgtcacccca 1020 tctcacaggc agggaaactg atgcatatac tgcagagcca ggcagaggcc ctcccagtgc 1080 cccctcccag cctgtggccc ccctccagtg gctggacact gaggccacac tggggcaccc 1140 tgtggagatc t 1151 <210> 35 <211> 630 <212> DNA <213> Sus scrofa <400> 35 agatctggcc aggccagaga agcccatgtg gtgacctccc tccatcactc cacgccctga 60 cctgccaggg agcagaaagt aggcccaggg tggacccggt ggccacctgc caccccatgg 120 ctgggagaag ggagggcctg ggcaaagggc ctgggaagcc tgtggtggga ccccagaccc 180 cagggtggac agggagggtc ccacacccac agccatttgc ttccctctgt gggttcagtg 240 t cctcatctc atctgtgggg agggggctga taatgaatct cccccattgg ggtgggcttg 300 gggattaaag ggccagtgtc tgtgatatgc ctggaccata gtgaccctca ccctccccag 360 ccattgctgt caccttccgg gctcttgccc aggcctgcct gacatgctgt gtgaccctgg 420 gcaagatgat ccccctttct gggccccagc cttcctctct gctccggaag tgcttcctgg 480 ggaaacctgt gggctggatc ctataggaaa cctgtccaat tcctggatgc acagaggggc 540 agggaggccc tgggcctgga ggggcaggga ggctcgaggt gggagcaggg taggggccag 600 tccagggcaa ggaggtgggt gggtagggtg 630 <210> 36 <211> 947 <212> DNA <213> Sus scrofa <400> 36 gatctgtgtt ccatctcaga gctatcttag cagagaggtg caggggcctc cagggccacc 60 aaagtccagg ctcagccaga ggcaatgggg tatcgatgag ctacaggaca caggcgtcag 120 cccagtgtca gggagaatca ccttgtttgt tttctgagtt cctcttaaaa tagagttaat 180 tggtcttggc cttacggttt acaataacaa ctgcaccctg taaacaacgt gaagagtaca 240 gaacaacaaa tgggggaaaa catatttcac ctgaaagagc caccgctcat attttgatgg 300 atttccttct agtttaatcc tgttttaatt gtaaactgtt aaaacaaaca taaataaaga 360 aaatgcatct gtaaagttta aaagtcatat ctatggtgat ggttgcaaaa cactgtgaat 420 gttcactttg aaatcgtgaa ctctacgtga tatgcatgtc ccgttaatta acctcacagg 480 ctcagaatgt ggttcattat ttctttaatt ttcctttaat tttatgtcct ctgtgtgtgc 540 ccttaaacca actacttttc agctctgcct gtttttgacc ttcacataga tgacatttgt 600 gagtgttttc tttctcaaca ctgggtctga tacccaccca cgctgtctgc tgtcactgcg 660 gacgtggagg gccaccaccc agctatggcc ccagccaggc caacactgga tgaatctgcc 720 cccagagcag ggccaccaac actggaggtg cagagagggt ttcttcaggg ccatcattat 780 ccaaggcatt gtttctactg taagctttca aaatgcttcc cctgattatt aaaagaaata 840 ataagatggg gggaaagtac aagaagggaa gtttccagcc cagcctgaag atcgtgctgg 900 ttgtatctgg agcctgtctt cctgacaggc ctctattccc agagtta 947 <210> 37 <211> 2067 <212> DNA <213> Sus scrofa <400> 37 ggatcctagg gaagggaggg cgggggcctg gacaaagggg gcctaaagga cattctcacc 60 tatcccactg gacccctgct gtgctctgag ggagggagca gagagggggt ctgaggcctt 120 ttcccagctc ctctgagtcc ctcctccgag cacctggacg gaagcccctc ctcagggagt 180 cctcagaccc ctcccctcca gccaggttgg cctgtgtgga gtccccagta agaatagaat 240 gctcagggct tcgagctgag ccctggctac ttgggggggt gctgg ggatt gggggtgctg 300 ggcggggagc tggggtgtca ctagatgcca gtaggctgtg ggctcgggtc tggggggtct 360 gcacatgtgc agctgtggga aggccctatt ggtggtaccc tcagacacat atggcccctc 420 aatttctgag accagagacc ccagtctggc cttcccagaa cagctgcccc tggtggggga 480 gatgtagggg ggccttcagc ccaggacccc caacggcagg gcctgaggcc cccatcccct 540 tgtcctgggc ccagagcctc agctatcagg cctatcagag atcctggctg cccagctcag 600 gttccccagg agccagaggg aggccagggg ttactaggaa atccggaaag ggtctttgag 660 gctgggcccc accctctcag ctttcacagg agaaacagag gcccacaggg ggcaaaggac 720 ttgccagact cacaatgagc ccagcagctg gactcaaggc ccagtgttcg gccccacaac 780 agcactcacg tgcccttgat cgtgaggggc cccctctcag ccaggcattc agacctgtga 840 cctgcatcta agattcagca tcagccattc tgagctgaag agccctcagg gtctgcagtc 900 aaggccacag ggccagacct ccaacggcca gacatcccag ccagattcct ttctggtcaa 960 tgggccccag tctggcttgg ctcctgcagg cccagtgccg ccttcttccc ctgggcctgt 1020 ggagtccagc ctttcagttt cccacccaca tcctcagcca caatccaggc tcagaggcaa 1080 tgtccgtggg cagcccctgt gtgacccctc tgtgggtgat cctcagtcct acccttagca 1 140 gacagcgcat gaggggccct cttgaacctg agggatactc catgtcggag gggagaagct 1200 ggccttcccc acccccactt ccaggccttg gggagcagag aaagacccca gacctgggtc 1260 ccttctaaca ggccaggccc cagcccagct ctccaccagc cccaggggcc tcgggtccac 1320 gcctggggac tggagggtgg gcctgtcagg cgctgaccca gaggcaggac agccaagttc 1380 aggatcccag ccaggtggtc cccgtgcacc atgcaggggt gtcacccaca caggggtgtt 1440 gccaccctca cctgactgtc ctcatgggcc acatggaggt atcctgggtt cattactggt 1500 caacataccc gtgtccctgc agtgccccct ctggcgcacg cgtgcacgcg cacacgcaca 1560 cactcataca gaggctccag ccaacagtgc cctctagtag gcactgctgt cacttctcta 1620 aaaggtcgca atcatacttg taaagaccca agattgttca gaaatcccag atggagaagt 1680 ctggaaagat ctttttctcc tttcacgggc tggggaaatg tgacctggcc aaggtcacac 1740 agcaagtggt ggaaccctgg cccctgattc cagctcattc cagttcccaa ggccctgcca 1800 gagcccagag gctgggccct ctggggcaga ggagctgggg tcctcccccc tacacagagc 1860 acacagcccc gcaagagaga agagacacct tggggagagg aatctccaga ccagagatcc 1920 cagtatgggt ctcctctatg ctgacgggat gggatgtcaa gaggggaggg ggctgggctt 1980 ta gggaaaca cacaaaaatc gctgagaaca ctgacaggtg cgacacaccc acccctaatg 2040 ctaacctgtg gcccattact cagatct 2067 <210> 38 <211> 4898 <212> DNA <213> Sus scrofa <400> 38 gatcttctcc taagaccaag gaaaactggt cataccaggt ccacttgtcc cctgtggcca 60 ttgtccctcc ttccccagaa gaaacaagca ctttccactc cacaagtagc tcctgatcag 120 cttggaagcc cggtgctgct ctgggccctg gggacacggc aggggcatca gagaccaaat 180 cctggaacaa agttccagtg ggtgaggcag gccggacaag caacacgtta taccataata 240 tgaggcaaaa tataatgtga gttctttatg aaaggaaggg gttgcaggtg caactgttgg 300 cttaggtgga tggtcacccc tgaatggagg agggggttcc cagggcatgt gcctggggag 360 aagggctcct ggcaggaggg acagcaagtg caagggccct gtgatcaaat gtgcctggca 420 agttgcagga acagctagaa ggccagcaag gttggaacca aggaaggggt caggggaggg 480 gcagggccct cagggccttg cccagcagcc tgagcatctg gagatttgtc caaagtttca 540 aatgtacctg ggcaacctca tgcccatata ccattcctaa cttctgcact taacatctct 600 aggactggga cccagccagt caagcggggg gacccagaga gctccggtgt gaacaccgag 660 gtgctggtgg gtctgcgtgt gtggacatag ggcagtcccg gtccttcctt cactaacacg 720 g cccgggaag ccctgtgcct ccctggtgcg cgggtcggcg cttccggagg gtacaggccc 780 acctggagcc cgggcacagt gcatgcaagt cgggttcacg gcaacctgag ctggctctgc 840 agggcagtgg gactcacagc caggggtaca gggcagaccg gtcctgcctc tgcgcccctc 900 cctggcctgt ggcccctgga cgtgatcccc aacagttagc atgccccgcc ggtgctgaga 960 acctggacga ggtccgcagg cgtcactggg cggtcactga gcccgcccca ggccccctct 1020 gccccttcct ggggtgaccg tggactcctg gatgaccctg gaccctagac ttcccagggt 1080 gtctcgcgga ggttcctcag ccaggatctc tgcgtctcct ccttccatag aggggacggc 1140 gcccccttgt ggccaaggag gggacggtgg gtcccggagc tggggcggag aacacaggga 1200 gcccctccca gaccccgctc tgggcagaac ctgggaaggg atgtggccat cgggggatcc 1260 ctccaggcca tctcctcaga tgggggctgg tcgactagct tctgagtcct ccaaggaacc 1320 gggtccttct agtcatgact ctgcccagat gaagaaggag agcacttctc tccatcagga 1380 ggatctgagc ttctcttaat tagaatcagc tccttggctt ctacccctta aaaaaaggta 1440 cagaaacttt gcaccttgat ccagtatcag gggaatttat caatcaatgt gggagaaatt 1500 ggcatcttta ccacactgaa tctttcaatc catgaatatc ctctctctct tccatgcata 1560 ggttttaata attctcaatg gagtttaatg taagttttcc tcatagacaa ttgcctttgg 1620 acatctcttt agactcatct ctagtaaact gatattctta atgcaattat aaaatgtatc 1680 ctgcttaatg ttattttcta ttcatttgct gttatataga gatacaatga gtttccacat 1740 ttgaaactgg atctggtaaa ttggctaccc tttttttata gattctatta atttttatac 1800 attctgtggg acttgctaca tacttaatca tgtcacctgt gaagaatgac aatttggttg 1860 ctaccctccc aattcttata tgtctcattt ctttccctct gctggtactc tggcagcagc 1920 agggaagata atgggcctcc ttatcttgtc acaaaaggat gtttttaaag atttcgttat 1980 aaaacataac gctttctggt tttctttaaa gattctctca ccagcttaag aaaattttct 2040 tatactctgt atgataaatg ggtttttgac aatcatttgt tgcattttac ctagtgtttt 2100 ctctgcatct ttatatgctt tttctccttt aatcctgaaa attgtttcga tttttctaac 2160 attgaaccaa tcttacattc ctggaatgga tggaccagac tagtccacat gtttattctg 2220 cccaatggct agattttgtg ttcaatattt tgttcagaat gtttgcatct atattcttga 2280 gtgagacaga gctgcccttg ttaggtttca caaccgaggt tgtgttagct tcataaaatg 2340 agacgtttat tctctaaaag aattgtttcg cttctctgga tgaatttgtg taaggttaga 2400 attgcttacc agtgaa gatc tcggggccag ttcttcttta ggggaagatt ttcaacaatt 2460 aagctcaatg cctttagaag aactgagagt ttctattatt tcttgagtta aatatatgta 2520 tttaattaga ctttctagga atagtctcat ttcatctcaa ataattgaca tatgctatta 2580 aagcagattc tcatgaacca ttgtaggtat tccaggtcta gaaaaatgtt cccctttgca 2640 tccctaatgt gtttaatttt caccttcttt cttttgttct tgagaaattc accaaatcat 2700 tttcaatttc agtcatatcc caaagcaacc aactctctac cttcttgttt tatcatccct 2760 gctggatttt tgttatctac ttcttcagta tttgttcttc cctttcttct attcctcatt 2820 ccatttttcc cttgttttct aactttctga gatatatgct tagttccttc atttgaagcc 2880 tttttatttt cttttttttt ttttggtctt tttgtctttt gttgttgttg ttgtgctatt 2940 tcttgggccg ctcccgcggc atatggaggt tcccaggcta ggagtcgaat cggagctgta 3000 gccaccggcc tacgccagag ccacagcaat gcgggatccg agccgcgtct gcaacctaca 3060 ccacagctca tggcaacgcc ggatcgttaa cccactgagc aagggcagga accgaacccg 3120 caacctcatg gttcctagtc ggattcgtaa ccactgtgcc acaacaggaa ctccgccttt 3180 ttattttcta taaaaatttc tatgtacatt ttaaggttat aggtttcctt ctatgtaccc 3240 cattggctgt atcctcaggg t tctgtggag tgatttcatt attgttcaag ttcaatatgt 3300 cttctgattt tccaatttga atacctctct aaatcagtag gtgaatattt ctttttcttt 3360 ttcttttctt ttcttctttt tttttttctt tcagccaggt ccatggcatg cagaaattcc 3420 caggccagga atcaaactct caccatggca gtgacaatgt cggatccttt acccactagg 3480 ccaccaggga actctgggag catatgtttt tatttcccga catctgagga tgcctagtat 3540 gtcttcatta ttgatttcta gtttgccact gatttctagt attttgctca tagagtgtat 3600 gctcaatggt tttggtcatt tgaaatgtat ttagtcctgc tttatgaccc agtatgtggt 3660 cagttttgtc aatgttcctt ttctgcttga agagaaccta catgctgtaa ctctgggtgc 3720 atgttctgta tataagtcta taggctgagc cgggggagcc ttctaatctg ccgttatctt 3780 cttcgagtta ttctaggtac tatttcttag ccataaacct ttaaattctg atatcaatat 3840 aatgacccca gcccgcttag ggtcggcact tcatgttatc tttttccatc catttaatcc 3900 ctccccactg ttttggccac acccgtggga tatgggagtt cctgggccaa ggatcagatc 3960 tgagccgcag ctgccaccta tgccacagca gcagcaatga tggatcttta acccactgca 4020 ccacactggg gattgaaccc aagcctcagc agcaacccaa gctactgcag agacaacacc 4080 agatccttaa cctgctgtgc catagcg gga atttccatcc atttactttc aagccagctg 4140 aataacctag cccaccatgc ctggacatgg gtgctctgct tcaaatgatt ttgttcagtc 4200 agcatccatc tctgaaatgt gtgccaagca tttatatgca tgcaagagtc atgttggcac 4260 ttctatcatt tccaacagtt cagtagcctt tgtatcatga catttcttgg ccttttctct 4320 acaatatttg aggctgagca gactggccgt gcccctgtcc atgcttccag agcctgtgtg 4380 cagacttctg ctctagacag agacagctaa ccatcctgca gtgcccagaa aacccaactc 4440 aaagaccctc aagtaaggaa ggatttattg gctcacgtaa tctggaatcc aggcatgggg 4500 tattcagggc cacctgaacc agaggccctg gccctgttct ctaagcttct tcctgccctg 4560 ccctcgttct ggaagtgacc ctgaaggaca gcaatgaagg gcagctcccc cagggacaga 4620 tgactgagag gtccatttca agtccaactt ggcctagatt gagaggcagc aagaaatatg 4680 gacctacagt gagtcacagg atttaccagt ggtttggctg ggttgtcagt gttacaggct 4740 aaacatttgg gtccctccaa aattaacatg ttgccactct aaccaccaaa atcatggtat 4800 ttgggggtgg ggcccttgga ggtaattagg tttagaaaga atgaagaggg ggcccttgtg 4860 atgggactag tgcctttata gagagagaag agagaggg 4898 <210> 39 <211> 1913 <212> DNA <213> Sus scrofa <400> 39 cac ctcatcc ccaaccacct ggatggtggc aagtggcagg ctgagaggct gcatatgagc 60 tcatcaagag ggtccccacc ccacagaggc tgacccagct gccactgcca cctagtggct 120 gatcggccaa gagcaggagc cccaggggca gctccattcc ctggggcggc cagggaacca 180 cctggtggta ggacaattcc attgcacctc atccatcagg aaaaggtttg ccttccctgg 240 cagtaatgca tcttcccata acatggtccc tggcctcttg gaatggcttg gccaccgtca 300 tggcctcacc cacaaagcct tgtgtctcag caaggaactt attccacagc aaaggacttg 360 cagcctggaa tgaactggtc tgactacata ccccattgcc cagaagtagg tggtctattg 420 caaagtggag tggcttaccc aagactcagt tgtgcccaag ttgagagata gcatcctaaa 480 atatgggctt atgtctcact ggctgaggtt tattctttga atcaaagaca attatatggt 540 gtggtccccc cagagataga atacatgagt ctgggaatca agggatagaa gtaagaagag 600 attttgtcac cattaatccc aataactcgc ccaaagaata tttgctttct gtcctggcag 660 ctctgctgct ttggcaataa cttcctagaa tataatgtct ccaccagggg actccacaac 720 ggttccattg atttgaagcc aatgggcaga ggaggggctg ccttactggt cggactggtc 780 agccctgatt actaaggaga aatcaggcaa cttcaacaaa actaaggcag gggggacttt 840 gtctagaacc caaagcacta ag catcttag tactttttag ttctcagagc ctccaagaac 900 aaagatttag cccctcagca ccaccaggta aagaacaggt aaatccagct gaggacaaga 960 gaaatattga atggatagag gaagaaagaa attatagata tcaactatgg cctcatgact 1020 agagtctcca gattaagcgg aataaaaata cagatgatta gatctgaaca tcaggccaaa 1080 caacgaacaa cagtttaagt gcgacctagg caatatttgg gacatactta tactaaaatt 1140 ttttcgctat ttgagcatcc tgtattttat ctggcaactt tattcatccc tagcgaaaaa 1200 ggaactgtgg taacttagtg tatttttact ttgctcatta ttgtgtatat acctacttgt 1260 atttatcaat catatttact ctgttctcag tattacttta tatagcagtt ggtggtgatg 1320 gttagcaaca tattcagtgg aactgtgact gaatttgagg agaaattaac agagttggct 1380 gtggctacaa taacccttcg ggacatgtgt cccctcattt tggggagatg gttagatctc 1440 tgggtaaatg ttagggcatc tgagccagaa accaagattt tgccagctgg tgcaatgtca 1500 gattttacca gcagagggtg ccagaggaat gcggcaaaac ccgagtgcca gaaagcacct 1560 ccctgttttc cagcttttct tcctttttat ttattttatt tacggcccag gagtccgtaa 1620 tagcgctgag gatggcccag gctcttctca gcagccctga ctgactagtt cagcaatgcg 1680 ctcaggcccc atctggccac cgggcagcct cttctgtggt agctccagcc tcagccagtg 1740 caaaaggcta ccctacactg gcgccacttc tacaatcagc actggccaca ccctccacgc 1800 catccggcac ggagccaggt gatctgccgg ccagattgca gttcgtgctg cctgagtcca 1860 ggtgattaca ctggctgcat cttttctttc tggaccattc attccatttt ttt 1913 <210> 40 <211> 394 <212> DNA <213> Sus scrofa <400> 40 ctctgcactc actaccgccg gacgcgcact gccgtgctgc ccatggacca cgctggggag 60 gggtgagcgg acagcacgtt aggaagtgtg tgtgtgcgcg tgggtgcaag tcgagccaag 120 gccaagatcc aggggctggg ccctgtgccc agaggagaat ggcaggtgga gtgtagctgg 180 attgaaaggt ggcctgaagg gtggggcatc ctgtttggag gctcactctc agccccaggg 240 tctctggttc ctgccggggt ggggggcgca aggtgcctac cacaccctgc tagcccctcg 300 tccagtcccg ggcctgcctc ttcaccacgg aagaggataa gccaggctgc aggcttcatg 360 tgcgccgtgg agaacccagt tcggcccttg gagg 394 <210> 41 <211> 333 <212> DNA <213> Sus scrofa <400> 41 ggctgaagtc tgaggcctgg cagatgagct tggacgtgcg ctggggagta ctggagaagg 60 actcccgggt ggggacgaag atgttcaaga cggggggctg ctcctctacg actgcaggca 120 ggaacggggc gtcactgtgc cggcggcacc cggccccgcc c ccgccacag ccacaggggg 180 agcccagctc acctggccca gagatggaca cggacttggt gccactgggg tgctggacct 240 cgcacaccag gaaggcctct gggtcctggg ggatgctcac agagggtagg agcacccggg 300 aggaggccaa gtacttgccg cctctcagga cgg 333 <210> 42 <211> 399 <212> DNA <213> Sus scrofa <400> 42 gaagtgaagc cagccagttc ctcctgggca ggtggccaaa attacagttg acccctcctg 60 gtctggctga accttgcccc atatggtgac agccatctgg ccagggccca ggtctccctc 120 tgaagccttt gggaggagag ggagagtggc tggcccgatc acagatgcgg aaggggctga 180 ctcctcaacc ggggtgcaga ctctgcaggg tgggtctggg cccaacacac ccaaagcacg 240 cccaggaagg aaaggcagct tggtatcact gcccagagct aggagaggca ccgggaaaat 300 gatctgtcca agacccgttc ttgcttctaa actccgaggg ggtcagatga agtggttttg 360 tttcttggcc tgaagcatcg tgttccctgc aagaagcgg 399 <210> 43 <211> 23 <212> DNA <213> Sus scrofa <400> 43 gtctttggtt tttgctgagg gtt 23