개 Genome Project에 대한 소개
From Biospecies
사람의 가장 친한 친구인 Canis familiaris는 genomics에서 특별한 영역을 차지한다. 가정에서 기르는개의 유일한 양육 역사는 질병 민감성의 유전적 기초, 형태학적 다양성과 행동 특징을 탐구 하기 위한 어디에도 비할 수 없는 기회를 제공한다. mammalian evolutionary tree (포유동물의 진화적 나무)에서 개의 위치는 또한 human genome의 comparative analysis를 위한 중요한 guide (안내자)가 된다.
가정에서 기르는 개의 역사는 최소 15,000년을 거슬러 올라가거나 어쩌면 100,000년을 거슬러 올라갈수도 있는데, 동아시아에 있는 grey wolf (회색늑대)를 최초로 숙련시킨 것이다. 개는 인간들과 생활 공간과 음식 원료를 나누는 서로간의 유익한 관계를 통해 발전했다. 최근의 세기에, 인간은 우리가 필요한 것을 지원하고 인간 행동을 모방하는 행동등과 같이 재능이 많아 사육하게 만들수밖에 없고 사냥과 복종, 가축을 능가하는 것에 의해 개를 사육하도록 선택하게 만든다. 개는 크기, 두부 모양, 외지 색갈과 질감과 같은 사람들에 의해 요구된 신체적 특징에 따라 또한 사육되었고, 딱 형태학적으로 묘사된 것을 번식하여 만들어내었다. 이 진화적인 실험은 다른 종류의 집에서 기르는 종을 만들었고 Canidae family의 남아 있는 것 내에서 존재하는 것 보다 더욱 더 형태학적으로 다양한 것을 은닉하고 있다.
이들 엄격한 번식 프로그램의 중요성과 주기적인 개체 병목현상 (예를 들면, 세계 대전 중)들에서, 현대의 ~400개 보다 많은 개가 번식하였고 또한 cancer, 실명, 심장 질환, 백내장, 간질, 엉덩이 형성장애, 난청을 포함하는 특이적 질병의 유행을 보여주었다. 대부분의 이들 질병은 인간 집단에서 또한 일반적으로 보여지며 두 종에서 임상적 징후가 대개 유사하다. 어떤 품종 내에서 특이적 질병의 높은 유행은 각각의 질병이 제한된 수의 유전좌 좌에 있다는 것을 제시하고, 인간에서 보다 개에서 더욱더 다루기 쉬운 가능성과 그들의 유전적 정밀분석을 가능하게 만들어 준다.
개에서 유전적 분석의 특징은 근대 사회에서 송곳이를 가진 과와 인간 사이의 친밀한 관계에 의해 높아진다. 사람을 제외하고, 개는 상세한 가족사와 병리학 데이터를 많이 이용할 수 있는 의학적 실습에서 가장 많이 연구된 동물이다. 지난 15년 동안 개발된 유전적 자원을 이용하여, 연구자들은 ~25개의 멘델 법칙의 질병들을 기초를 이루는 유전자의 돌연변이를 이미 확인 하였다. 골격의 형태학과 같은 표현형적 변이의 유전적 기초를 이해하기 위한 노력이 또한 성장하고 있다.
개는 포유류의 genome의 생물학과 진화의 comparative analysis를 위해서 유사하게 중요하다. 네개의 포유류 genome들은 오직 하나의 계통분기 (Euarchontoglires)에서 네 개의 placental mammals (태반 포유동물)의 계통분기로 되었다는 것을 나타내는 데이터 (human, chimpanzee, mouse, 그리고 rat)를 강력하게 분석되었다. 개는 이웃의 계통분기 Laurasiatheria를 대표한다. 그것은 따라서 Euarchontoglires에 대한 outgroup으로써 적당하고 fully sequenced mammalian genome들의 현재 tree의 전체 가지 길이를 증가시킨다. 그 때문에 human genome에서 기능적으로 conserve 된 element들을 찾기 위한 통계적인 힘을 추가적으로 제공한다. 그것은 boreoeutherian ancestor이라 불리는 공통 조상의 두 계통분기에 대한 추론을 얻는데 또한 우리에게 도움을 주고 두개의 남아 있는 계통분기들 (Afrotheria와 Xenarthra)의 다리를 제공하고 코끼리와 armadillo (남미산의 야행성 포유동물인 아르마딜로)와 같은 종들로부터 일반적으로 만들어진 low-coverage genome sequence를 고정하기 위해 도움을 줄 수 있다.
~99%의 euchromatic genome을 커버하는 개 genome의 high-quality draft sequence를 이 논문에 보고했다. 완전함, nucleotide 정확도, sequence 연속성, 그리고 long-range connectivity (긴 범위의 접속성)은 매우 높고, 엄청난 가치는 최근 draft sequence인 mouse genome에 알맞으며 개선된 algorithm들, higher-quality data, deeper coveage와 본질적인 genome 특성을 반영하였다. 우리는 assembly 정확도의 공식적인 평가를 위한 tool을 만들었고 draft sequence의 >99%로 추정되는 정확도로 assembly 되었다.
우리는 또한 개 집단에 대한 초기 SNPs의 요약본을 보고했고, reference sequence 에 대한 11개의 개 품종의 일부 sequence 비교로부터 처음으로 유래된 >2.5 million(2백5십만) SNPs를 포함하고 있다. 우리는 교차 품종 SNPs의 polymorphism 비율을 특징지었고 내부와 교차 품종 SNPs의 long-range linkage disequilibrium (LD)를 특징지었다.
우리는 이들 데이터를 개의 genome strucure (게놈 구조), gene evolution (유전자 진화), haplotype structure (haplotype 구조)와 phylogenetics(계통 분류)를 위해 분석하였다. 찾은 중요한 것은 다음을 포함한다.
+ 다른 계통 사이에서 mammalian genoem (포유류 게놈)의 진화적 영향력은 transposon insertion 평균 비율은 개가 가장 적었고, deletion 비율은 mouse가 가장 높았으며 nucleotide substitution 비율은 human이 가장 낮았다.
+ human과 개 사이의 비교는 human genome의 ~5.3%가 functional elements (기능 요소)를 포함하고 두 품종 모두 purifying slection 아래에 있다는 것을 보여준다.
+ genome에서 50%의 대부분의 highly conserve된 non-coding sequence는 ~200 gene-poor regions,dptj enemfjwls clustering을 보여주고, 대부분의 clustering은 transcription factor들 또는 axon guidance receptor (축색돌기 안내 receptor)와 같은 cellular identity를 establishing 하거나 또는 maintaining 하는 중요한 역할을 가지는 gene들을 포함하고 있다.
+ 기능적으로 관련된 gene들의 set들은 human과 개 혈통에서 진화의 highly similar patterns (아주 높은 유사 패턴)를 보여준다. 이것은 human-specific innovation (예를 들면, brain development와 관련된 gene)에서와 같이 mouse에 관련된 human에서 가속화된 진화를 해석하는 것에 대해 신중할 필요성을 제기한다. 왜냐하면 유사한 가속화가 개 품종에서도 종종 보이기 때문이다.
+ sequence된 boxer의 전체 genome을 가로지른 분석과 10개의 추가적인 품종에서 6%의 genome을 가로지르는 분석은 몇 megabases의 길이를 넘어선 연장된 품종내에서 linkage disequilibrium (LD)를 보여주지만, LD 교차 품종은 오직 10 kilobases를 넘어서만 연장된다. 이들 LD 패턴은 개 역사에서 두 개의 주요한 병목현상을 반영한다. : 초기 집으로 숙련될 때와 최근의 품종 창조
+ 품종내의 haplotype들은 각각 locus에서 ~3-5 alleles를 가지도록 긴 시간동안 확장되었다. 100 kilobases (kb)만큼 큰 이들 haplotypes의 일부는 비록 그들이 넓게 변하는 빈도를 나타내지만 다양한 품종에 걸쳐서 공유하고 있다. haplotype structure는 품종에 걸쳐 공유하는 유전적 위험 요소를 제시한다.
+ 최근 SNP map은 충분한 밀도를 가지고 흥미로운 특징에 영향을 미치는 gene들의 map에 대해 systematic association study (조직적인 연관 연구)들을 할수 있기 위한 적당한 품종내 polymorphism 비율 (품종 사이에서 ~1.900 base pairs(bp)와 품종 내에서 ~1/1,500 bp)을 가지고 있다. ~10,000 SNPs의 genotyping은 대부분의 목적을 만족시켰다.
+ genome sequence는 빠른 진화 sequence의 작은 수집을 선택하기 위해 사용 할 수 있다.



