Razões e Metodologias para o Sequenciamento do Genoma

O sequenciamento de genomas é sofisticado, complexo e requer tecnologia especializada. Um segmento de 500 a 800 pb pode ser sequenciado. No entanto, os genomas são muito grandes, por exemplo, E. coli com 4, 2 x IO6 pb e 3, 2 x IO9 pb para humanos.

Assim, para o sequenciamento, pequenos segmentos são necessários. Esses segmentos são produzidos pela quebra aleatória do DNA genômico em pequenos fragmentos. Tais fragmentos geralmente se sobrepõem a outros fragmentos em suas extremidades. Fragmentos são clonados em um vetor para gerar uma biblioteca genômica do organismo.

Razões para o seqüenciamento completo de um genoma:

(i) Fornece informações para a base para a descoberta de genes e fornece inventário de genes.

(ii) representa as relações possíveis entre os genes.

(iii) O sequenciamento de genomas fornece um conjunto de ferramentas para posterior experimentação.

(iv) A informação genética de um organismo é disponibilizada a partir da sequência genética.

(v) O sequenciamento genético completo de um organismo fornece toda a informação genética necessária para formar um organismo.

Metodologias utilizadas para sequenciamento do genoma:

(i) Sequenciamento Dirigido do contigs do cromossoma artificial bacteriano (BAC):

Os cromossomos artificiais bacterianos são simplesmente plasmídeos projetados para a clonagem de segmentos muito longos (isto é, 100.000 a 300.000 pb) de DNA. Esses vetores são usados ​​para fazer bibliotecas genômicas nas quais o tamanho da inserção é de 80 a 100 kb. Fragmentos de DNA de milhares de pares de bases são clonados no vetor BAC.

A biblioteca genômica é rastreada localizando clones de restrição comuns chamados contigs. Os membros do contig contêm algumas regiões sobrepostas para permitir a determinação precisa de sua localização no contig.

O objetivo final dos métodos de mapeamento físico é receber um contig completo para cada cromossomo do genoma. Os contigs mapeados são sequenciados, quebrando grandes fragmentos de DNA em pequenos segmentos. Cada clone do contig é sequenciado. A sequência nucleotídica é identificada sozinha por clones até que o genoma completo seja sequenciado.

(ii) sequenciamento aleatório de shotgun ou abordagem bottom up:

É possível clonar em um organismo qualquer gene desejado de outro organismo por injeção de tiro. Para este genoma inteiro do primeiro organismo é digerido com endonuclease de restrição para produzir uma mistura aleatória de fragmentos.

Bibliotecas aleatórias (shotgim) de ADN genómico são construídas em pequenos vectores plasmídicos de inserção, isto é, 2, 0 kb e meio, isto é, 10 kb, juntamente com uma biblioteca BAC de inserção grande genómica shotgun (80-100 kb). Os fragmentos s� inseridos no vector plasm�ico e os plasm�eos recombinantes transformados na c�ula hospedeira desejada.

No sequenciamento de tiro, os clones selecionados aleatoriamente são sequenciados até que os clones da biblioteca genômica sejam analisados. Em outras palavras, podemos dizer que no seqüenciamento aleatório de armas de fogo os cromossomos são divididos em seções e, em seguida, a seção do DNA genômico é dividida em milhões de pequenos segmentos e todos os segmentos são seqüenciados de forma imparcial.

Áreas de DNA sobreposto são combinadas, formando segmentos maiores e maiores de DNA genômico. A sequenciação de DNA é realizada em ambas as extremidades das inserções de clones seleccionados aleatoriamente de ambas as bibliotecas de plasmídeos de inserção pequenas e médias para proporcionar pelo menos três vezes a cobertura do genoma.

Pequenos fragmentos de DNA são inseridos em diferentes moléculas plasmídicas aleatoriamente. No caso de inserções sobrepostas, todas elas provêm da mesma localização genômica, mas de diferentes regiões deslocadas para a esquerda ou para a direita em relação uma à outra.

Os fragmentos sobrepostos são alinhados ou em cotas ou em uma sequência para a região em questão (método shot gun). Genomas procariotas têm pouco DNA e sequenciamento de tiro, dando bons resultados. Os eucariotos suportam muitas sequências repetidas.

Isso tudo leva a confusão. No entanto, a sobreposição de fragmentos é explorada na fase de montagem pelo exercício computacional. O programa de computador identifica as seqüências sobrepostas e as une em um trecho contínuo. Este processo foi aplicado com sucesso para sequenciação de todas as sequências do genoma microbiano publicadas pela Celera Genomics.