5.Genetic Map

From Biospecies

Jump to: navigation, search

1. GENETIC MAPS

The genetic likage map genome의 유전적 특성의 기본적인 통찰을 갖는 것이 기본 개념이다. Genetic likage map은 단지 marker의 정렬보다 더 많은 정보를 제공하고 또한 특유의 chromosomal 부위에서 발생하는 기초적 유전적 재조합의 측정도 제공하고, 개별적으로 연관된 chromosomes사이에 특별한 DNA markers와 연관된 위치도 보여준다. 선천적인 물리적 또는 분자적 특성인 개인 간의 차이점은 측정하기가 쉽고 잠재적인 genetic marker SNPs STRs은 특성의 정확성을 쉽게 그리고 실험실의 자동화로 분석하기에 충분하여 특별하게 genetic map 구성에 적합한 polymorphic marker이다. Genetic map은 개별적으로 연관된 markers 그룹의 유전자 표현형의 평가에 의해 구성된다.

다듬어지지 않은 mapping data MapMaker software packages에 의해 분석되고 이것은 어떤 두 개의 markers의 대립 유전자가 빈번하게 합쳐져서 유전되는지를 주의 깊게 파악한 genetic map으로 구성된다. Marker closer는 보다 적은 재조합의 결과로 대립 유전자의 분리될 것이고 보다 많이 대립 유전자가 합쳐서 유전될 것이다. 따라서 genetic map상의 marker사이의 간격인 physical maps은 달라서 두 종류의 markers 사이에 재조합 빈도인 physical unit의 종류를 측정할 수 없다. Genetic map unit centimorgans(cM)으로 측정된다. 1cM은 두 marker가 재조합의 의해 1% 분리되는 경우의 두 marker간의 간격이다. Genetic 간격은 markers 사이의 actual physical 간격과 대비한 평균치이다. 사람에게 있어서 1cM의 평균치는 1Mb와 비슷하다. 1 cM : 1Mb의 비율은 자주 경험적인 비율로 사용된다. 그러나 이것은 genome-wide 평균치이고 자주 중요하게 human genome의 다른 부위 사이의 비율과는 다를 수 있다는 것은 중요하게 인정된다.

Genetic/physical 비율은 또한 남녀간의 재조합 빈도가 다양하기에 성별 간에는 상당히 다르다. genetic map의 각 성별간 간격을 대표적인 보고와 남성과 여성의 재조합 빈도를 통합하는 sex-averaged 간격을 구하여 이와 같은 차이점을 극복하는 것이다.

2. Human Genetic Maps

human genetic maps genome-wide의 범위는 지금까지 다양하게 분석으로 발표되었다. 대부분의 genetic map STR marker를 기반으로 한다. 대부분의 genome-wide likage maps 2.5~10 cM의 공간의 marker의 구조로 구성되어 있다. Demser marker maps likage analysis로는 광범위하게 사용되지는 않지만 가족간의 적은 수의 감수 분열에 초점을 맞춘 분석이다. 감수분열은 대립유전자 marker 위치를 포함한 질병과 연관된 gene의 상동 분리 가능성의 증거를 찾기 위한 매우 조밀한 map marker가 요구되진 않는다. 수준 높은 해석의 genetic map chromosome 21 long arm과 같은 특별한 chromosomal 부위로 일반적으로 제한되어 설명하고 있다. 이것은 초기의 linkage analysis에 의해 다듬어 진다. 이상적으로 최대 정보량은 genetic marker가 비교적 높은 수준의 heterozygosity 0.6 이상이 필요하다. 이것은 marker(or cluster of SNPs) chromosome의 두 개의 copy사이의 차이점에 높은 가능성을 나타낸다. 낮은 수준 Heterozygosity marker는 예를 들면 0.1-0.3 heterozygosity의 범위를 갖는 SNPs는 유사한 수준의 정보를 주기 위해 높은 밀도가 필요하게 된다.3가지 중요 genetic mapGenetic, the Marshfield Institute the SNP consortium(TSC)에 의해 개발되었다. Genetic Marshfield map MapViewer GDB와 같은 mapping tool에 의해 광범위하게 색인되고 있다.

3.  The Genetic Genetic Linkage Map

human linkage map STR marker만을 사용하여 첫 번째로 whole genome genetic map을 분석하였다. 이전의 map은 더 적은 정보의 RFLPs를 기반으로 분석하였다. Genetic map안의 5264 marker는 보통 heterozygosity 0.7을 가진다. 이것은 예전의 map보다 더 많은 정보를 가진다. map 8개의 CEPH families data로 구성된다. 그래서 오히려 특별한 chromosomal 부위 안의 국한된 것 보다 훌륭한 marker의 정렬을 잘 분석하지 못한다. map의 성별의 평균 genetic 간격은 3699 cM이다. 평균 간격의 크기는 1.6cM이고 map 59%는 대략 2cM의 간격이고 나머지 1%의 간격은 10cM 이상이다. 2335 위치로 구성되어 있고 이중 2032은 선택적인 순서로 대비해서 적어도 1000:1의 비율로 정렬 되어 있다. Marker 정렬에서 통계적인 신뢰가 높은 수준인 DeWan 로 계속해서 사용되고, human genome 초안에서 Clone의 정렬과 방위에서 불일치는 중요한 부분이다. Genetic map dataGenetic website(www.Genetic.fr) Washington University, St Louis website 에 접근할 수 있다.(<html>www.genlink.wustl.edu/Genetic_frame</html>)

4.  The <city w:st="on"></city> Marshfield Genetic Linlkage Map

Marshfield genetic linkage map은 더 많은 수의 marker 와 약간 높은 수준의 분석을 제공하여 Genetic map을 향상시켰다. Genetic map와 비슷하고 Marshfield map 8개의 CEPH families data로 구성되어있고 그런 까닭에 수준 높은 서열은 불충분하게 분석되었다. 특별한 경우에, marker 거의 분리되지 않거나 genetic 간격이 대체로 없는 경우에 재조합의 결과로 marker가 분리되지 않는다. 그래서 marker는 순서가 일정하지 않게 존재한다. Marker의 정확한 정렬 정보는 RH map 또는 human genome sequence와 같은 human physical map의 잡종을 참고한 STS marker 위치를 확인할 수 있다. Marshfielded database(<html>http://research.marshfieldclinic.org/genetics</html>) 잘 정리된 5개의 genome scan marker panels로 제공하고, Marshfield map에서 선택할 수 있다. 이런 marker panels first human linkage mapping screening 을 설치한 Cooperative Human Linkage Centre(CHLC) 에서 최초로 개발되었다. 각각의 Marshfield marker panel은 진행적인 높은 밀도의 marker를 제공하고 평균적으로 9cM안에 di, tri, tetra-necleotide repeat marker 405로 구성된 10set로 완결되어 있다. 각각의 marker set은 각 panel은 같은 통로 또는 모세관으로 실을 수 있는 allele size로 집단화되었다. Marker set 10 primers는 유전적 연구에서 상업용으로 이용되고 있고 라벨을 붙어 있지 않고 형광염색 형태이다.(<html>http://www.resgen.com</html>)

5. TSC SNP Linkage Map

기술적 발달은 STR genotyping의 비용보다 훨씬 작게 SNP genotyping 비용이 든다. 이러한 이유로 SNP-based linkage map의 개발을 이끌게 되었다. 이와같은 map의 실행에 반대된 논의는 single SNP polymprphic STR heterozygosity를 내리게 된다. 비슷한 밀도의 STRs에서 single SNPs의 사용은 본질적으로 원본보다 적은 정보를 제공하는 RFLP maps과 동등한 가치를 지닌다. 두개의 연관된 solution은 이런 문제의 결과를 제시하게 된다. 첫 번째 solution은 일반적인 spaced map에서는 SNP marker 밀도안에 3-8 fold 이상 사용되는 것이다. 두 번째 solution은 유사한 밀도의 STRs에서 2-3 SNPs의 복잡한 크러스트를 이용하여 linkage analusis를 이용한다. 이와같은 SNP 크러스터는 heterozygosity의 조건안에 STR과 같이 대략적으로 같은 양의 정보를 제공한다. Matise SNP cluster whole genome SNP linkage map 구성에 접근하는데 사용하였다. 이런 일들을 통해 666 물리적으로나 유전적으로 human genome 5-cM 간격에 polymorphic STS 고정된 위치가 정해진 것이 가려졌다. 10개 이상의 SNPS는 기본적으로 각 STS 위치가 정해진 다음에 특성이 나타낸다.

SNPs genotyping의 성공비율, 분석의 품질, 대립유전자의 빈도(대략 20%이상), multi-SNP haplotype heterozygosities(대략 0.6이상)과 연결의 불안정 수준 등으로 평가된다.(SNPs in LD with each other were avoided). STS locus에 대해서 3가지 중요한 정보의 marker multi-SNP haplotype heterozygosities가 최대화 되었을 때, map의 위치에서 정보의 SNP cluster가 창출되었을 때 선택된다. 48 CEPH 참고용 가계에서 661개안에서 2천개의 SNPs가 선택되어 genotype된다. (<html>http://www.cephb.fr</html>). Linkage map은 다른 mapping 또는 sequence 위치 정보 없이 구성된다. 여기서 산출된 map은 평균적으로 5cM의 분석내용을 갖고 있다. 이것 이상으로는 SNPs set SNP Cluster 위치사이에 half-way point를 확인하는것과 유사하게 평가한다. 대부분 정보의 single SNPs는 확인되었고(N=679) CEPH 가계안에서 genotype되었다. "single" SNPs cluster linkage map에 더해져서 2.5-cM 분석의 최종적인 SNP map이 도출되었다. map의 구성은 SNP Consortium(TSC)에 의해 지원된다. 모든 data와 결과를 TSC website를 이용할 수 있다. (http://snp.cshl.org).

6. SNP-based Haplotype and Likage Disequilibrium(LD) Maps
인접한 SNPs의 그룹에서 같은 시간안에서 다른 loci나 다른 point에서 새로운 SNPs 나타났을 때 동등한 유전형질 또는 LD의 특유한 패턴을 보여준다. 이것은 개별적인 사이에 독특한 haplotype이 배열되어 있다. genome의 다량의 SNP는 대다수의 일반적인 human haplotype에 포착되거나"tag"로 확인된 SNP에 의해 haplotype의 다양성에 관련한 연구를 촉진하는 기회를 창출하게된다. 이것은 최소한의 SNP 수를 가지고 최대한의 다양성을 나타낼 수 있는 다양하고 유용한 map을 구성할 수 있게되었다. 이와같은 haplotype tag은 이미 후보군 gene의 선별에 사용되고 있었다. 일찍이 haplotype은 단지 34 SNPs 또는 gene에서의 모든 haplotype으로 확인된 "haplotype tags"로 정의할 수 있었다. genome에서 원리의 확장은 적은 수의 SNP marker를 지닌 중요하고 일반적인 haplotype 다양성을 찾을 수 있는 힘있는 haplotype-based maps을 구성할 수 있었다. 적어도 이런 data를 가진 한개의 회사가 있더라도 공개된 도메인 map은 존재하지 않는다. 어떤 data는 이미 공개적으로 이용하고 있다. 공개된 도메인 LD 또는 haplotype map 3개의 chromosome을 이용 할 수 있고 두개의 별개의 방법으로 산출되고 그 결과로 정확하고 자연스러운 data map사이에 다른게 제공한다. Orchard Biociences Inc TSC와 협력하여 SNP-based map chromosome 19을 공개하였다. 책으로 출판하기전에 TSC website에서 이용할 수 있다. Dawson chromosome 22 SNP-based LD map 공개하였고 Perlegen Inc chromosome 21 SNP-based haplotype map을 공개하였다.

7.PHYSICAL MAPS

Genetic maps(염색체 지도) map상에 유전자 또는 마커(markers)와 재조합을 정렬하여 선형으로 표시하지만, 마커와 유전자 사이의 물리적 거리로의 정확한 정보를 제공하지 못한다. 이와 대조적으로 physical maps(물리적 지도)은 마커 사이의 물리적 거리를 규정할 수 있는 완전하고 불변한 염기 쌍의 규모를 가지고 있다. 두 마커는 유전적으로 아마 매우 가깝다, 다시 말하면 두 마커 사이에 매우 작은 재조합이 일어나지만 그것은 물리적으로 매우 멀고 산개적이다. 유전적 지도와 물리적 지도의 차이는 비실용적이라고 보여진다, 하지만 만일 특성이나 질병이 2개의 분자 마커들 사이의 물리적 지도상에 위치한다면, 다수의 재조합 교차 region(영역)을 확인하고, 유전적 군집을 탐색하기 위해 고유하게 밀집한 마커의 panel을 선택하는데 중요하다. 거꾸로 만일 2개의 분자적 마커들 사이에 특성 또는 질병이 위치한다면, 거리를 1kb, 1Mb 또는 여전히 더 멀리 나타낸다면, 로커스 상의 조절 regions 이나 유전자의 적절한 수를 아는데 유용하다.

8. Cytogenetic Maps

물리적 지도는 매우 다양한 유형이 있다. 인간 유전체상 최초이며 최저 분석의 물리적 지도가 세포유전학 지도이다. 이지도의 유형은 염색된 염색체의 특이한 결합 패턴을 기초로 한다. 이러한 유형은 측정기록은 원래 인간 염색체 전체의 물리적 크기를 확인하고 가장 큰 염색체인, 1번 염색체부터 가장 작은, 22번 염색체까지의 상염색체의 크기별 분류를 얻기 위해서 사용되었다. 놀랍지도 않게 물리적 지도의 초기 노력은 20번 염색체보다 실제로 약간 작은 19번 염색체의 잘못된 지시로 이끌리는 차별적인 제한으로 다소 부정확하고 뒤틀림 하기 쉬었다. 세포유전학 지도 위치선정의 사용은 아마도 예를 들어 1q32, 22q11, 등등을 표현하기 위한 cytobands 용어 사용의 편리함과 로커스와 유전자의 클러스터(cluster) 그룹 때문에 아직까지도 두드러지게 널리 퍼져있다. 흥미 있게 초기 생물학자들은 cytobanding은 오직 외부적인 표식이 안 된다고 인정했으나, 사실 cytoband의 밝은 부분은 가장 낮은 GC조성 영역의 평균을 나타내는 동시에 cytoband의 어두운 부분은 가장 높은 GC조성 영역의 평균 을 나타낸다. 어둡고 밝은 cytoband사이에서 발생된 변이 영역은 isochore로 알려져 있다, 이러한 영역들은 종종 재조합 비율의 특별히 증가하는 것을 보여준다. 이것은 유전자에 대한 특별한 배려를 위해서 중요하고 이러한 영역 내에 조절 가능한 원자들을 만든다.

9. PHYSICAL CONTIG MAPS

유전자 지도(Genetic maps)와 세포 유전 지도(Cytogenetic maps) 은 게놈의 유전자와 물리적 지도 중간해상도를 낮게 발전시키는 인간게놈 프로젝트의 단기 목표의 많은 것을 이행하였다. 그들은 시스템적인 정렬 노력을 구성하는데 필요한 더 좋은 해상도를 증가시키는 더 정밀한 고해상도를 구성하는데 도움을 주는 장기 목표를 촉진하고 있다. FISH RH v핑은 해상도의 영역에서 물리적 YAC BAC 클론 contigs의 완벽한 계통의 발전을 가능하게 하고 있다. 이러한 물리적 지도는 인간 게놈 초안의 위치적 클로링 노력을 위한 중요한 골격이 되고 있다.  YAC BAC 클론(그리고 다음 샷견 읽기)의 정밀한 순서는 인간 게놈 서열 조립을 조정하고 정렬하고 세우는데 골격을 제공하는 유전적 물리적 지도가 없었으면 가능하지 않았다.

10. Yeast Artificial Chromosome (YAC) Maps

YACs 300kb-2Mb 크기의 중복된 YAC 클론으로 구성된 가장 낮은 해상도 물리적 클론 contig 지도이다. YACs 이 개발되기 전에는 가장 큰 클로닝 벡터(cosmids) 는 단지 20-40kb의 삽입을 운반하였다.  YAC 방법은 과감하게 정렬되는 클론의 수를 감소시켰다.

많은 YACs은 전체 인간 유전자를 포괄하고 앞으로의 게놈 연구를 위한 유용한 자료를 만든다. YAC의 크기는 클론내에서 로컬 재정렬되는 클론 불안정을 종종 유발할 수 있다. 이것은 물리적 contigs의 구축을 위한 YACs의 이용에 주 결점으로 작용한다. 그리고 유전자 지도와 물리적 지도에 유용한 QC YAC contigs에 대한 필요성을 강조하고 있다.

Chumakov에 의해 출간된 33,000 YAC 클론들의 라이버러리를 포함한 몇몇의 전체 게놈 YAC 지도는 유용하다. 이 라이버러리와 다른 YAC 클론은 CEPH YAC 라이버러리 페이지내에 리스트되어진 전체의 범위에 포함될 수 있다.

11. Bacterial Artificial Chromosome (BAC) Maps

BACs 100-300kb 크기내의 지도해상도를 제공한다. BAC 클론은 공공의 인간게놈서열 프로젝트의 주 축이다. 인간 게놈의 10-폴더보다 많은 중복을 추정된 인간 BACs의 수집은 포괄적인 인간게놈의 BAC 지도를 산출하는데 이용되고 있다. 이러한 BACs의 최소 중복셋은 물리적으로 분리된 contigs로 모이고, 인간게놈의 대다수를 표현한다. 이러한 BACs의 서열은 샷건 시퀸싱에 의해 결정되고, 각각의 BAC은 제한효소에 의해 소비되고 0.5-5kb 클론의 라이버러리를 양산한다. 이 클론들은 서열화되어지고 완벽한 BAC 서열로 조합된다. BAC 클론 데이터는 시퀸싱 센터나 또는 Human BAC 리소스 페이지로 구축된 NCBI에서 많은 다른 방식으로 접근될 수 있다. 이러한 페이지는 BAC 클론의 공급자와 BAC 지도에 유용한 정보를 집중시키는 유용한 리소스이다. 다른 유용한 데이터베이스는 게놈을 포괄하는 맵핑된 BAC 클론을 3000개 이상을 포함하는 GenMapDB이다. 데이터베이스는 지도위치와 접근 번호에 의해 검색될 수 있다. 또한 GenBank  Genome 분할과 HTGS를 검색하기 위한 BLAST를 이용해서 BAC 클론을 검색할 수 있다. BAC 서열은 Ensembl, Mao Viewer 또는 UCSC human genome browser 같은 인간 게놈 서열에 contig 정보를 보여주는 툴을 이용해서 접근할 수 있다.

Personal tools
KoBIC service