Genômica: Estudos Estruturais e Funcionais da Genômica

Genômica: Estudos Estruturais e Funcionais da Genômica!

O termo genoma foi introduzido por H. Winkler (1920) para denotar o conjunto completo de genes cromossômicos e cromossômicos extras presentes em um organismo, incluindo um vírus.

O termo genômica cunhado por TH Roderick (1987) significa mapeamento e sequenciamento para analisar a estrutura e organização dos genomas. Mas atualmente a genômica inclui o seqüenciamento de genomas, a determinação do conjunto completo de proteínas codificadas por um organismo e o funcionamento de genes e vias metabólicas em um organismo.

O estudo da genômica é dividido nos dois seguintes domínios:

1. A genômica estrutural lida com a determinação da seqüência completa de genomas ou do conjunto completo de proteínas produzidas por um organismo. As várias etapas envolvidas são: (i) construção de mapas genéticos e físicos de alta resolução, (ii) Sequenciamento do genoma e (iii) determinação do conjunto completo de proteínas em um organismo. Inclui também a determinação das estruturas tridimensionais das proteínas em questão.

2. A genômica funcional estuda o funcionamento de genes e vias metabólicas, ou seja, os padrões de expressão gênica em organismos.

Sequenciamento de genomas:

O sequenciamento de genomas é um processo altamente sofisticado e tecnicamente exigente. De uma só vez, um fragmento de 500-600 pb pode ser seqüenciado. Em contraste, os genomas são extremamente grandes, por exemplo, 4, 2 x 10 6 para E. coli e 3, 2 x 10 9 pb para humanos. Portanto, a seqüência de genoxina tem que ser obtida em um número extremamente grande de pequenos pedaços, essas peças são então montadas em uma seqüência para o genoma.

As peças usadas para sequenciamento são geradas pela quebra do DNA genômico em fragmentos em pontos aleatórios. Como resultado, a localização do fragmento no genoma deve ser determinada experimentalmente. Todos os fragmentos obtidos do DNA genômico de um organismo são clonados em um vetor adequado, gerando uma biblioteca genômica do organismo. As duas abordagens para o sequenciamento de genomas são: (a) sequenciamento clone-por-clone e (b) sequenciamento shot-gun.

(a) Clone-by Clone Sequencing:

Neste método, os fragmentos são primeiramente alinhados em contigs, também chamados sequenciamento direcionado de contigs de BAC. Um contig consiste em uma série de clones que contêm partes sobrepostas de DNA, convertendo uma região específica de um cromossomo ou até mesmo o cromossomo inteiro. Eles são geralmente construídos usando clones BAC (cromossomo artificial bacteriano) e cosmídeo.

A abordagem geral na criação de contigs é identificar os clones que possuem segmentos de DNA adjacentes do cromossomo, por exemplo, andar de cromossomos, saltar de cromossomos, etc. Assim, os membros de um contig devem conter a mesma região de sobreposição para permitir a determinação precisa de sua localização. na contingência. O objetivo final dos procedimentos de mapeamento físico é obter um contig completo para cada cromossomo do genoma.

Os fragmentos de DNA clonados de um contig podem ser correlacionados com localizações ao longo de um cromossomo obtido a partir de um mapeamento de ligação ou citogenética. Isto pode ser conseguido identificando membros do contig que contenham inserções que possuam genes que já tenham sido mapeados por métodos de ligação ou citológicos. Isso permitiria o alinhamento dos outros membros do contig ao longo do cromossomo. Alternativamente, RFLP (polimorfismo de comprimento de fragmento de restrição) e outros marcadores de DNA podem ser usados ​​para correlacionar os locais em um mapa de ligação com os membros de um contig.

(b) Sequenciamento de Arma de Tiro:

Nesta abordagem, os clones selecionados aleatoriamente são sequenciados até que todos os clones na biblioteca genômica sejam analisados. O software Assembler organiza a informação da sequência nucleotídica assim obtida numa sequência genómica. Essa estratégia funciona muito bem com genomas procarióticos que possuem pouco DNA repetitivo. Mas os genomas eucarióticos têm muitas sequências repetidas que criam confusão no alinhamento da sequência. Esses problemas são resolvidos usando enormes poderes de computação, software especializado e evitando regiões ricas em DNA repetitivo (por exemplo, regiões centroméricas e teloméricas).

Compilação de Sequência do Genoma:

Os projetos de seqüenciamento de genoma exigiram o desenvolvimento de tecnologias de alto rendimento que geram dados a uma velocidade muito alta. Isso exigiu o uso de computadores para gerenciar esse fluxo de informações e deu origem a uma nova disciplina chamada bioinformática. A bioinformática trata do armazenamento, análise, interpretação e utilização da informação sobre sistemas biológicos (atividades como compilação de sequências do genoma, identificação de genes, atribuição de funções aos genes identificados, preparação de bases de dados, etc.).

Para assegurar que a sequência nucleotídica de um genoma esteja completa e livre de erros, o genoma é sequenciado mais de uma vez. Uma vez que o genoma de um organismo é sequenciado, compilado e revisado (corrigindo os erros), o próximo estágio da genômica, a saber, a anotação, começa.

Previsão Genética e Contagem:

Depois que uma sequência do genoma foi obtida e verificada quanto à precisão, a próxima tarefa é encontrar todos os genes que codificam as proteínas. Este é o primeiro passo na anotação. Anotação é um processo que identifica genes, suas seqüências regulatórias e suas funções. Também identifica genes codificadores não proteicos, incluindo aqueles que codificam para r-RNA, t-RNA e RNAs nucleares pequenos. Além disso, elementos genéticos móveis e famílias de seqüências repetitivas são identificados e caracterizados.

A localização de genes codificadores de proteínas é feita inspecionando a sequência, usando um software de computador ou a olho nu. Genes codificadores de proteínas são identificados por quadros de leitura aberta (ORFs). Um ORF tem uma série de codões que especificam uma sequência de aminoácidos, começa com um codão de iniciação (geralmente ATG) e termina com um codão de terminação (TAA) TAG ou TGA). ORFs são geralmente identificados por um computador e é um método eficaz para genomas bacterianos.

Genes em genomas eucarióticos (incluindo o genoma humano) têm várias características que tornam a pesquisa direta menos útil. Em primeiro lugar, a maioria dos genes eucarióticos possui um padrão de exons (regiões codificantes) alternados com introns (regiões não codificantes). Como resultado, esses genes não são organizados como ORFs contínuos. Em segundo lugar, os genes em humanos e outros eucariotos são geralmente muito espaçados, aumentando assim as chances de encontrar genes falsos. Mas as versões mais recentes do software de digitalização ORF para genomas eucarióticos tornam a digitalização mais eficiente.

Depois de uma sequência genómica ser analisada e os genes serem previstos, cada gene é examinado um de cada vez para identificar a função do produto génico codificado e classificado em grupos funcionais. Esta análise envolve vários programas. Por exemplo, pode-se pesquisar bancos de dados como o Gene Bank para encontrar genes similares isolados de outros organismos. As ORFs previstas podem ser comparadas com aquelas de genes bacterianos conhecidos e bem caracterizados. Finalmente, pode-se procurar por tais sequcias nucleoticas para motivos de funo que codificam domios proteicos envolvidos com funes especicas.

Assim, o objetivo da análise genômica é determinar as funções de todos os genes e entender como esses genes interagem no desenvolvimento e função do organismo.

Genômica Funcional:

Pode ser definido como a determinação da função de todos os produtos gênicos codificados pelo genoma de um organismo. Ele inclui os seguintes parâmetros: (1) quando e onde determinados genes são expressos (perfil de expressão), (ii) as funções de genes específicos pela mutação seletiva dos genes desejados, e (iii) as interações que ocorrem entre proteínas e entre proteínas e outras moléculas. A genômica funcional tenta examinar todos os genes presentes no genoma de uma só vez. Portanto, as técnicas usadas na genômica funcional permitem análises de alto rendimento que permitem um acúmulo de dados muito rápido.

(i) Perfil de Expressão:

A determinação dos tipos de células / tecidos nos quais um gene é expresso, bem como quando o gene é expresso, é chamada de perfil de expressão. O objetivo da genômica funcional é estudar o padrão de expressão de todos os genes presentes no genoma ao mesmo tempo; isso é chamado de perfil de expressão global. Isso pode ser feito no nível de RNA ou no nível de proteína. No nível de RNA, pode-se usar amostragem de seqüência direta ou matrizes de DNA.

No nível da proteína, pode-se usar eletroforese bidimensional, seguida por espectrometria de massa ou matriz de proteínas. O perfil de expressão global fornece insights sobre fenômenos biológicos complexos, incluindo diferenciação, resposta ao estresse, início de uma doença, etc. Também fornece uma nova maneira de definir os fenótipos celulares.

(ii) Determinação da Função Genética:

Um aspecto importante da genômica funcional é determinar a função de genes específicos / seqüências anônimas. Uma forma potente de conseguir isso é clonar o gene, mutá-lo in vitro e reintroduzir o gene mutado no organismo hospedeiro e analisar seu efeito. O genoma sob bibliotecas mutantes foi desenvolvido em vários organismos modelo como bactérias, leveduras, plantas e mamíferos. Isso às vezes é chamado de genômica mutacional. Essa biblioteca pode ser gerada de uma das três maneiras a seguir:

(a) Mutação sistemática de cada gene no momento em que irá gerar um banco de cepas mutantes específicas.

(b) Na abordagem aleatória, os genes são mutados indiscriminadamente mutações individuais são então caracterizadas e catalogadas.

(c) Nesta abordagem, um grupo de técnicas é usado para prevenir a expressão de grupos específicos de genes.

(iii) interações de proteína:

A função do gene reflete o comportamento das proteínas codificadas por eles. Esse comportamento pode ser visto como uma série de interações entre várias proteínas e entre proteínas e outras moléculas. As interações de proteína são estudadas usando técnicas de alta produtividade. Vários métodos de mapeamento de interação de proteínas baseados em biblioteca permitem que centenas ou milhares de proteínas sejam rastreadas por vez. Estas interacções podem ser avaliadas in vitro ou in vivo. Dados de interação de proteínas de várias fontes são assimilados em bancos de dados.