Quantos
Genes Partilhamos?
Por: Jocax, GLIV: Apêndice B
Fiz um cálculo *estimado* de quantos genes
funcionalmente idênticos, em média, compartilham 2 seres
humanos quaisquer.
Consideremos alguns dados do projeto Genoma-Humano
:
[1]- Tamanho do genoma em pares de base = TGH = 3,2E9
= 3.200.000.000 ( 3 bilhões e duzentos milhões )
Esta informação inclui todo o material
genético inclusive seqüências de DNA que não
codificam proteínas ( isto é, não fazem parte de
nenhum gene e que são conhecidas como Junk-DNA ou DNA-Lixo )
e refere-se apenas ao
segmento haplóide do nosso material genético ( fornecido
por apenas um de nossos pais ).
[2]- Número de SNPs = SNP = 3E6 = 3.000.000
( 3 milhões )
Um SNP ( pronuncia-se "isnipi" ) ou mutação
puntiforme é igual a uma troca de par de base em relação
a um genoma fixo de comparação. A quantidade de SNPs no
genoma fornece o grau da variabilidade da espécie humana. Assim,
se a quantidade de SNPs fosse Zero não teríamos variabilidade
e todos seríamos clones. Podemos dizer que os SNIPs são
mutações que se apresentam na população
em taxas maiores ou iguais a 1%.
[3]- Número de Genes = NG = 3,5E4 = ( 35 mil
)
Os Genes, aqui considerados, são formados por
uma seqüência contínua de material genético.
Sabemos hoje que algumas proteínas, material produzido pelos
genes, são geradas utilizando-se de partes não contínuas
do DNA de modo que o número de genes pode ser, na verdade, muito
maior que os relatados 40 mil.
[4]- Junk-DNA ( Dna lixo ) = Jdna = 95% do Genoma
O DNA-Lixo é a parte do DNA que não
participa da formação de proteínas e tem uma função
desconhecida. Acredita-se que o DNA-Lixo relaciona-se a mutações
inócuas ou partes de vírus que tenham se incorporado ao
genoma.
[5]- Número de aminoácidos = 20
Os aminoácidos são compostos orgânicos
que formam as proteínas. Existem 20 tipos diferentes de aminoácidos.
A cada seqüência de três pares de base do gene um aminoácido
é gerado. Assim, se um gene contém 1 mil pares de base
este gene irá gerar uma proteína formada por 333 aminoácidos
( 1mil / 3 ). Devemos lembrar que três pares de base podem formar
64 ( 4*4*4 ) combinações diferentes, mas como só
existem 20 tipos diferentes de aminoácidos isso implica que algumas
combinações de letras formaram o mesmo aminoácido
ou seja, existe uma redundância na seqüência formadora
do aminoácido e isto, de certo modo, pode ser considerado uma
proteção natural contra mutações já
que uma a cada 3,2 ( 64/20 ) mutações irão gerar
o mesmo aminoácido.
De posse destes dados podemos fazer o cálculo
estimado:
De (1) e (4) achamos uma estimativa para o número
de pares de base (pb) da parte do genoma que contém genes ( o
genoma não lixo) :
Parte do genoma contendo genes = TGU = 3,2E9*(1-95%)
= 1,6E8 [6]
de (3) e (6) calculamos o número médio
de pares de base por gene :
Tamanho médio do gene = LG = 1,6E8/3,5E4 = 4,5E3
= 4500 pb por gene [7]
Considerando que a cada trinca de pb um dos 20 aminoácidos
são possíveis e considerando que uma trinca permite 64
combinações, teremos uma redundância ou "barreira
anti-mutação" com uma taxa de 20/64. Podemos
então corrigir a freqüência efetiva de SNPs:SNPs corrigidos
= SNPc = 3E6 / ( 64/20 ) = 9,3E5 [8]
Podemos agora corrigir a freqüência média
de pb que efetivamente mudam o aminoácido. De (1) e (8) Podemos
calcular a "freqüência" média de SNPs :
Freqüência = SNPf = 3,2E9 / 9,3E5 = 3,4E3
[9]
Uma alteração a cada 3,4 mil pb. Isso
significa que, em média, a cada 3,4 mil pb teremos uma mudança
efetiva no genoma, que gerará um aminoácido distinto.
De (7) e (9) poderemos estimar o número médio
de mutações por gene :
Número de mutações por gene =
MG = 4,5E3 / 3,4E3 = 1,3 [10]
Devemos notar que uma mutação é
uma alteração relativo a um genoma de comparação,
assim, se ainda supusermos que cada SNP está em um alelo diferente,
poderemos de (10) calcular o número médio de alelos por
gene. Para isto, basta considerar o gene padrão como sendo um
dos alelos :
Número médio de alelos = NA = 1,3 + 1
= 2,3 [ 11 ]
Podemos agora, simplificando os cálculos, montar
uma fórmula para o número médio de alelos ( NA
) em função da fração de DNA-Lixo ( Jdna
) do número de SNPs ( SNP ) e do número médio de
genes ( NG ) :
NA = 1 + ( 1- Jdna ) * SNP / ( 3,2 * NG )
Teremos, em média, 2,3 alelos por gene e com
isto poderemos estimar o número de alelos que compartilhamos.
A rigor, para determinar o número médio de alelos que
dois seres humanos quaisquer compartilham, deveríamos ter a freqüência
de cada alelo na população, para cada um dos nossos 35
mil genes o que não é tarefa fácil. Mas apenas
para fazermos uma estimativa, consideraremos que cada alelo tenha igual
freqüência, implicando que a probabilidade de 2 alelos serem
iguais será :
PA = 1/ 2,3 = 43% [ 12 ]
Vale notar que ao assumirmos que os alelos tem a mesma
freqüência estaremos minimizando a probabilidade de dois
alelos quaisquer serem iguais em pessoas diferentes, isto quer dizer
que, na verdade, estaremos calculando uma estimativa mínima para
o compartilhamento genético humano.
Com esta assunção em mente, teremos
então 43% de chances, em média, de compartilharmos um
dado alelo de nossa linhagem paterna ( ou materna ) com a linhagem paterna
( ou materna ) de uma outra pessoa qualquer (que
não seja nosso parente), pois nossos cálculos foram baseados
no material genético haplóide que é fornecido pelo
projeto Genoma Humano.
Nosso material genético, a menos de nossos
gametas, é diplóide, isto é, herdamos 23 cromossomos
de nosso pai e 23 cromossomos de nossa mãe. Como vimos, cada
um destes 23 cromossomos, de cada linhagem, possuem uma identidade de
43% tanto com o cromossomo paterno como o materno de uma outra pessoa.
Podemos agora calcular quantos alelos de nossa linhagem
materna é compartilhada com uma outra pessoa ( o cálculo
da nossa linhagem paterna é análogo):
Se 43% de nossos alelos maternos são iguais
a 43% da linhagem materna da outra pessoa então teremos cerca
de 15 mil alelos idênticos. Chamemos este conjunto de 15mil alelos
de MM. Também teremos 15 mil alelos de semelhança entre
nossa linhagem materna e a linhagem paterna do outro, o que nos forneceria
mais cerca de 15 mil alelos. Chamemos estes 15 mil alelos de MP.
Se todos estes alelos fossem diferentes teríamos
MM+ MP = 30mil alelos de semelhança apenas da nossa linhagem
materna, compartilhadas com esta outra pessoa. Mas devemos lembrar que
a linhagem materna e paterna da outra pessoa também compartilham
43% de alelos em comum. Isto implica que, em média, teremos 43%
de alelos repetidos entre MM e MP que representa a intersecção
de MM e MP. Assim, retirando-se estas repetições teremos
:
Fração correspondente à linhagem
materna = FM = 43% + 43% - 43%*43% = 68%
O cálculo do compartilhamento de nossa linhagem
paterna é idêntico e teremos também 68% de compartilhamento.
Então podemos concluir que a fração total de compartilhamento
de alelos entre dois seres humanos será de pelo menos 68%.
Compartilhamento de alelos entre dois seres humanos
CA = 68%