대략적인 인간 게놈의 구성을 쉽게 알아보기 위한 것입니다. 여기에 따르면 실제 유전자를 암호화하고 있는 부분이거나 그와 관련된 부분은 겨우 10% 정도이며, 그 중에서도 겨우 1-3%만이 실제 단백질을 만들어 내는 유전자임을 알 수 있습니다. 먼저 전체 유전자는 약 30억개(3200 Mb(mega base))의 DNA로 이루어져 있습니다.
전체 DNA sequence 3200Mbp입니다.
이중 10%는 유전자과 관련된 유전자의 염기서열(sequence)입니다.
나머지 90%는 유전자가 아닌 DNA 입니다.
10%의 유전자와 관련된 DNA 염기서열의 형태는 단일한 염기 서열 또는 적당히 반복된 염기 서열을 가지고 있습니다.
유전자와 관련된 DNA 중 10% 이하는 발현되는 유전자이고(전체 DNA 중 약 3%), 나머지 90% 이상은 발현되지 안는 DNA로 인트론(intron), 비 번역 부분, 유전자 발현을 조절 부분(프로모터, enhancer 등)으로 이루어져있습니다.
그리고 유전자가 아닌 DNA 전체 90% 중 70-80%는 단일하고, 작은 반복 수를 갖는 염기서열을 가지고 있으며, 나머지 20-30%는 적당하거나 많이 반복된 염기서열로 이루어져 있습니다. 이들 중 60%는 연결되어 반복되거나, 집단으로 반복된 염기서열이고, 나머지 40%는 분산되어 반복된 염기서열입니다.
용어설명
용어 |
설명 |
Nuclear genome |
핵에 있는 모든 DNA, 즉 전체 DNA |
Genes and gene-related sequecnes |
유전자를 암호화하거나 유전자 발현에 관여하는 DNA |
Extragenic DNA |
유전자와 전혀 연관이 없는 DNA -이들의 역할이 무엇인지는 아직 모른다. |
Coding DNA |
유전자를 암호화하고 있는 DNA |
Non-coding DNA |
유전자를 암호화하고 있지 않으나 유전자 발현과 관련된 DNA |
Unique or low copy number
|
유전자와 관련 없으며, 독특한 서열을 가지고 있는 DNA |
Moderate to highly repetitive |
유전자와 관련 없으며, 반복적 서열(1-6개의 염기가 반복됨)을 가지는 DNA |
Pseudogenes |
유전자를 암호화하고 있는 DNA와 서열이 유사하나 유전자를 만들지 못하는 가자 유전자 |
Gene fragment |
유전자 발현에 직접적으로 조절하는 DNA 서열, 여기에 유전자를 발현, 억제를 유도하는 단백질이 결합하여 유전자 발현, 억제가 일어난다. |
Intron, Untranslated sequence |
유전자 사이, 맨 앞, 맨 끝에 있으며 DNA가 mRNA형태로 바뀔 때, mRNA 형태로 바뀌지 못하는 유전자 |
Tamdemly repeated/
clustered repeated |
반복서열을 가지는 DNA로 무수히 많은 copy수가 존재하는 것, 대체적으로 길이가 짧은 것이 특징 |
Interspered repeated |
반복서열을 가지는 DNA로 copy수가 적으며, 길이는 긴 것이 특징 |
|