Quantos Genes Partilhamos?
Por: Jocax, GLIV: Apêndice B

Fiz um cálculo *estimado* de quantos genes funcionalmente idênticos, em média, compartilham 2 seres humanos quaisquer.

Consideremos alguns dados do projeto Genoma-Humano :

[1]- Tamanho do genoma em pares de base = TGH = 3,2E9 = 3.200.000.000 ( 3 bilhões e duzentos milhões )

Esta informação inclui todo o material genético inclusive seqüências de DNA que não codificam proteínas ( isto é, não fazem parte de nenhum gene e que são conhecidas como Junk-DNA ou DNA-Lixo ) e refere-se apenas ao
segmento haplóide do nosso material genético ( fornecido por apenas um de nossos pais ).

[2]- Número de SNPs = SNP = 3E6 = 3.000.000 ( 3 milhões )

Um SNP ( pronuncia-se "isnipi" ) ou mutação puntiforme é igual a uma troca de par de base em relação a um genoma fixo de comparação. A quantidade de SNPs no genoma fornece o grau da variabilidade da espécie humana. Assim, se a quantidade de SNPs fosse Zero não teríamos variabilidade e todos seríamos clones. Podemos dizer que os SNIPs são mutações que se apresentam na população em taxas maiores ou iguais a 1%.

[3]- Número de Genes = NG = 3,5E4 = ( 35 mil )

Os Genes, aqui considerados, são formados por uma seqüência contínua de material genético. Sabemos hoje que algumas proteínas, material produzido pelos genes, são geradas utilizando-se de partes não contínuas do DNA de modo que o número de genes pode ser, na verdade, muito maior que os relatados 40 mil.

[4]- Junk-DNA ( Dna lixo ) = Jdna = 95% do Genoma

O DNA-Lixo é a parte do DNA que não participa da formação de proteínas e tem uma função desconhecida. Acredita-se que o DNA-Lixo relaciona-se a mutações inócuas ou partes de vírus que tenham se incorporado ao genoma.

[5]- Número de aminoácidos = 20

Os aminoácidos são compostos orgânicos que formam as proteínas. Existem 20 tipos diferentes de aminoácidos. A cada seqüência de três pares de base do gene um aminoácido é gerado. Assim, se um gene contém 1 mil pares de base este gene irá gerar uma proteína formada por 333 aminoácidos ( 1mil / 3 ). Devemos lembrar que três pares de base podem formar 64 ( 4*4*4 ) combinações diferentes, mas como só existem 20 tipos diferentes de aminoácidos isso implica que algumas combinações de letras formaram o mesmo aminoácido ou seja, existe uma redundância na seqüência formadora do aminoácido e isto, de certo modo, pode ser considerado uma proteção natural contra mutações já que uma a cada 3,2 ( 64/20 ) mutações irão gerar o mesmo aminoácido.

De posse destes dados podemos fazer o cálculo estimado:

De (1) e (4) achamos uma estimativa para o número de pares de base (pb) da parte do genoma que contém genes ( o genoma não lixo) :

Parte do genoma contendo genes = TGU = 3,2E9*(1-95%) = 1,6E8 [6]

de (3) e (6) calculamos o número médio de pares de base por gene :

Tamanho médio do gene = LG = 1,6E8/3,5E4 = 4,5E3 = 4500 pb por gene [7]

Considerando que a cada trinca de pb um dos 20 aminoácidos são possíveis e considerando que uma trinca permite 64 combinações, teremos uma redundância ou "barreira anti-mutação" com uma taxa de 20/64. Podemos
então corrigir a freqüência efetiva de SNPs:SNPs corrigidos = SNPc = 3E6 / ( 64/20 ) = 9,3E5 [8]

Podemos agora corrigir a freqüência média de pb que efetivamente mudam o aminoácido. De (1) e (8) Podemos calcular a "freqüência" média de SNPs :

Freqüência = SNPf = 3,2E9 / 9,3E5 = 3,4E3 [9]

Uma alteração a cada 3,4 mil pb. Isso significa que, em média, a cada 3,4 mil pb teremos uma mudança efetiva no genoma, que gerará um aminoácido distinto.

De (7) e (9) poderemos estimar o número médio de mutações por gene :

Número de mutações por gene = MG = 4,5E3 / 3,4E3 = 1,3 [10]

Devemos notar que uma mutação é uma alteração relativo a um genoma de comparação, assim, se ainda supusermos que cada SNP está em um alelo diferente, poderemos de (10) calcular o número médio de alelos por gene. Para isto, basta considerar o gene padrão como sendo um dos alelos :

Número médio de alelos = NA = 1,3 + 1 = 2,3 [ 11 ]

Podemos agora, simplificando os cálculos, montar uma fórmula para o número médio de alelos ( NA ) em função da fração de DNA-Lixo ( Jdna ) do número de SNPs ( SNP ) e do número médio de genes ( NG ) :

NA = 1 + ( 1- Jdna ) * SNP / ( 3,2 * NG )

Teremos, em média, 2,3 alelos por gene e com isto poderemos estimar o número de alelos que compartilhamos. A rigor, para determinar o número médio de alelos que dois seres humanos quaisquer compartilham, deveríamos ter a freqüência de cada alelo na população, para cada um dos nossos 35 mil genes o que não é tarefa fácil. Mas apenas para fazermos uma estimativa, consideraremos que cada alelo tenha igual freqüência, implicando que a probabilidade de 2 alelos serem iguais será :

PA = 1/ 2,3 = 43% [ 12 ]

Vale notar que ao assumirmos que os alelos tem a mesma freqüência estaremos minimizando a probabilidade de dois alelos quaisquer serem iguais em pessoas diferentes, isto quer dizer que, na verdade, estaremos calculando uma estimativa mínima para o compartilhamento genético humano.

Com esta assunção em mente, teremos então 43% de chances, em média, de compartilharmos um dado alelo de nossa linhagem paterna ( ou materna ) com a linhagem paterna ( ou materna ) de uma outra pessoa qualquer (que
não seja nosso parente), pois nossos cálculos foram baseados no material genético haplóide que é fornecido pelo projeto Genoma Humano.

Nosso material genético, a menos de nossos gametas, é diplóide, isto é, herdamos 23 cromossomos de nosso pai e 23 cromossomos de nossa mãe. Como vimos, cada um destes 23 cromossomos, de cada linhagem, possuem uma identidade de 43% tanto com o cromossomo paterno como o materno de uma outra pessoa.

Podemos agora calcular quantos alelos de nossa linhagem materna é compartilhada com uma outra pessoa ( o cálculo da nossa linhagem paterna é análogo):

Se 43% de nossos alelos maternos são iguais a 43% da linhagem materna da outra pessoa então teremos cerca de 15 mil alelos idênticos. Chamemos este conjunto de 15mil alelos de MM. Também teremos 15 mil alelos de semelhança entre nossa linhagem materna e a linhagem paterna do outro, o que nos forneceria mais cerca de 15 mil alelos. Chamemos estes 15 mil alelos de MP.

Se todos estes alelos fossem diferentes teríamos MM+ MP = 30mil alelos de semelhança apenas da nossa linhagem materna, compartilhadas com esta outra pessoa. Mas devemos lembrar que a linhagem materna e paterna da outra pessoa também compartilham 43% de alelos em comum. Isto implica que, em média, teremos 43% de alelos repetidos entre MM e MP que representa a intersecção de MM e MP. Assim, retirando-se estas repetições teremos :

Fração correspondente à linhagem materna = FM = 43% + 43% - 43%*43% = 68%

O cálculo do compartilhamento de nossa linhagem paterna é idêntico e teremos também 68% de compartilhamento. Então podemos concluir que a fração total de compartilhamento de alelos entre dois seres humanos será de pelo menos 68%.

Compartilhamento de alelos entre dois seres humanos CA = 68%

home : : voltar