46
HECHO POR LUCIA SENCIA 1

Lucia genomica y proteomica

Embed Size (px)

Citation preview

Page 1: Lucia genomica y proteomica

HECHO POR LUCIA SENCIA 1

Page 2: Lucia genomica y proteomica

HECHO POR LUCIA SENCIA 2

Page 3: Lucia genomica y proteomica

HECHO POR LUCIA SENCIA 3

Page 4: Lucia genomica y proteomica

Splicing.

O Splicing é um processo que remove os introns e junta os exons depois da transcrição do RNA.

Ele consiste na retirada dos íntrons de um mRNA precursor, sendo um dos processos necessários para formar um mRNA maduro funcional.

O splicing ocorre predominantemente em células eucarióticas, já que o DNA das células procarióticas não possui introns.

HECHO POR LUCIA SENCIA 4

Page 5: Lucia genomica y proteomica

Splicing.

Essa excisão dos introns do mRNA é um evento muito importante e requer uma extrema precisão das moléculas envolvidas no processo. A exclusão ou o acréscimo de um único nucleotídeo em um exon pode levar a uma alteração da fase de leitura e à produção de uma proteína completamente diferente da original ou defeituosa.

HECHO POR LUCIA SENCIA 5

Page 6: Lucia genomica y proteomica

Splicing.

HECHO POR LUCIA SENCIA 6

Page 7: Lucia genomica y proteomica

Splicing.

Gene - um segmento de DNA ou RNA que carrega a informação genética.

Exon - a região de um gene que é traduzido em proteína.

Intron - uma região de um gene que não é traduzido em proteína

Splicing – o processo no qual os introns são removidos e exons são unidos para ser traduzido em uma única proteína

HECHO POR LUCIA SENCIA 7

Page 8: Lucia genomica y proteomica

Um gene, uma proteína?

O nosso proteoma (o acervo protéico) apresenta ~100.000 proteínas!

Como o número de genes é inferior ~30.000, a resposta parece estar no "splicing".

Em 1977 foi observado por Richard Roberts e Phillip Sharp que um dado genes foi transcrito da mesma forma, mas resultou em duas moléculas de RNA maduros diferentes. Cada uma delas resultando em dois polipeptídios distintos que poderiam ter funções distintas em momentos diferentes, ou em células diferentes.

HECHO POR LUCIA SENCIA 8

Page 9: Lucia genomica y proteomica

Splicing Alternativo.

HECHO POR LUCIA SENCIA 9

Page 10: Lucia genomica y proteomica

Splicing Alternativo.

O processo pelo qual os exons de um pré-mRNA se ligam de maneiras diferentes durante o splicing de RNA.

Splicing alternativo é um modo comum de regulação dos genes dentro das células, sendo usado por 90-95% dos genes humanos.

Ele pode alterar drasticamente a função de um gene em diferentes tipos de tecidos ou mesmo inativar o gene completamente .

Splicing alternativo está correlacionado com muitas doenças. HECHO POR LUCIA SENCIA 10

Page 11: Lucia genomica y proteomica

Splicing Alternativo.

HECHO POR LUCIA SENCIA 11

Page 12: Lucia genomica y proteomica

Elementos reguladores.

HECHO POR LUCIA SENCIA 12

Page 13: Lucia genomica y proteomica

Elementos reguladores.

HECHO POR LUCIA SENCIA 13

Page 14: Lucia genomica y proteomica

1- Splicing Alternativo.-- Splicing.-- Tipos de Splicing Alternativos.-- Elementos Reguladores de Splicing.

2- Identificação e Anotação de Splicing Alternativo.-- Por Full-lengths e ESTs.-- Por RNA-seq.

3- Splicing alternativo e diversidade genética.

HECHO POR LUCIA SENCIA 14

Page 15: Lucia genomica y proteomica

Identificação de Splicing Alternativo por Full-lengths e ESTs.

HECHO POR LUCIA SENCIA 15

Page 16: Lucia genomica y proteomica

Identificação de Splicing Alternativo por Full-lengths e ESTs.

HECHO POR LUCIA SENCIA 16

Page 17: Lucia genomica y proteomica

Identificação de Splicing Alternativo por Full-lengths e ESTs.

HECHO POR LUCIA SENCIA 17

Page 18: Lucia genomica y proteomica

Full-lengths e ESTs.

HECHO POR LUCIA SENCIA 18

Page 19: Lucia genomica y proteomica

2005 56,037,734,462 52,016,762

2006 69,019,290,705 64,893,747

2007 83,874,179,730 80,388,382

2008 99,116,431,942 98,868,465

GenBank DataYear Base Pairs Sequences

Full-lengths e ESTs.

HECHO POR LUCIA SENCIA 19

Page 20: Lucia genomica y proteomica

Next Generation Sequencing.

HECHO POR LUCIA SENCIA 20

Page 21: Lucia genomica y proteomica

-Existem hoje no mercado 4 novos equipamentos de seqüenciamento, os quais usam tecnologias diferentes caracterizadas pela grande quantidade de dados produzidos.

Next Generation Sequencing.

-Então sem o poder computacional adequado não se tem processamento de dados e muito menos analise.

-Duas dessas tecnologias (Illumina-GLX e SOLiD) geram dezenas ou centena de gigabases de DNA por corrida.

-O processamento das seqüências geradas requerem demandas computacionais cada vez mais significativas.

HECHO POR LUCIA SENCIA 21

Page 22: Lucia genomica y proteomica

Identificação de Splicing Alternativo por RNA-seq.

Não há uma maneira "correta" de analisar dados RNA-seq .

Mas há dois métodos principais:

- Alinhamento direto de reads (spliced ou unspliced) a um genoma ou transcriptoma.

- Assembly dos reads seguido por alinhamento.

HECHO POR LUCIA SENCIA 22

Page 23: Lucia genomica y proteomica

Background.

• A primeira tarefa após obter o seus reads (de qualquer plataforma) é determinar o local correspondente no genoma de referência a partir do qual cada um deles derivam.

Denominado alinhamento genômico ou "mapeamento“.

HECHO POR LUCIA SENCIA 23

Page 24: Lucia genomica y proteomica

Background.

Muitos dos alinhadores “next-gen” disponíveis, se valem de duas principais abordagens :

• Genoma "indexado" na memória: memória proporcional ao tamanho do genoma.

• Reads indexados na memória: memória proporcional ao número reads.

• Informações de pareamento é usado para selecionar a colocação ideal de reads como um par.

•Alguns podem permitir mais mismatches, alinhamento com gap. HECHO POR LUCIA SENCIA 24

Page 25: Lucia genomica y proteomica

Background: Comuns convenções de alinhamento para next-gen.

• Multi-map reads (reads que podem ser alinhados em vários locais, com pontuação igual) têm apenas um local relatado.

• Alguns alinhadores permite que todos os alinhamentos sejam relatados (ou até um número máximo).

• Formato / detalhes do output de alinhamento variam

• Muitos grupos estão começando a padronizar para formato SAM

Representação eficiente de alinhamento

Recuperação rápida, compatível com os viewers next-gen (por exemplo, IGV)

• Aquivo BAM é o ponto de partida para a maioria das análises .HECHO POR LUCIA SENCIA 25

Page 26: Lucia genomica y proteomica

Background: Desvantagens para cada estratégia.

• Alinhamento no genoma. computacionalmente caro.Nunca é uma boa idéia simplesmente alinhar dados de RNA-seq no genoma, precisa de alinhadores capazes de considera seqüências de junções exon-exon no 'genoma').

• Alinhamento no transcriptoma.Reads decorrentes de estruturas não-gênica podem ser "à força" (e erroneamente) alinhado nos genes.

Valores incorretos expressão do gene. Falsos positivos SNVS. Muitos outros problemas potenciais.

3. Assembly. Baixa expressão = difícil / impossível montar.

Contigs fragmentados devido à repeats requer grandes quantidades de memória.

HECHO POR LUCIA SENCIA 26

Page 27: Lucia genomica y proteomica

Background:

HECHO POR LUCIA SENCIA 27

Page 28: Lucia genomica y proteomica

Background: Benefícios para cada estratégia.

• Alinhamento no genoma. Permite o mapeamento de reads em locis não anotados. Uma melhor definição dos introns. Potencial para novas descobertas biológicas.

• Alinhamento no transcriptoma. computacionalmente barato. Spliced (exon junção) reads mapeado corretamente. Reads pareados, distância e junção pode ajudar a distinguir isoformas.

9. Assembly. Pode fornecer uma visão mais longa do transcrito. Permite a detecção de transcritos quiméricos. Não precisa necessariamente de um genoma.

HECHO POR LUCIA SENCIA 28

Page 29: Lucia genomica y proteomica

Por que não tratar RNA-seq reads como seqüências de DNA genômico?

Reads que atravessam um ou mais junções exon-exon não vão alinhar corretamente ao genoma.

Pares de reads terão distância de pareamento maior que o esperado.

HECHO POR LUCIA SENCIA 29

Page 30: Lucia genomica y proteomica

Construção das bases de dados usando informações genéticas publicamente disponíveis.

Integração

ESTs

mRNAs

SAGE

Dados genômicos

SNPs Ontologias

OMINMPSS

Mutações Array

Dados de Illumina-GLX, SOLiD, 454-Roche.

Novas Tecnologias e novos desafios.

HECHO POR LUCIA SENCIA 30

Page 31: Lucia genomica y proteomica

BWA, BWA*Novoalign, MOSAIKBowtie, TopHatSpliceMap,RNA-Mate,QPALMA

ABySS,Velvet

Trans-ABySS(uses BLAT)

ScriptureCufflinksALEXA-Seq

Image from Haas & Zody, 2010HECHO POR LUCIA SENCIA 31

Page 32: Lucia genomica y proteomica

1- Splicing Alternativo.-- Splicing.-- Tipos de Splicing Alternativos.-- Elementos Reguladores de Splicing.

2- Identificação e Anotação de Splicing Alternativo.-- Por Full-lengths e ESTs.-- Por RNA-seq.

3- Splicing alternativo e diversidade genética.

HECHO POR LUCIA SENCIA 32

Page 33: Lucia genomica y proteomica

Neste estudo nós usamos variações de nucleotídeo único (SNV) e dados de cDNAs para comparar a diversidade genética de ESRs localizados em exons constitutivos e alternativos.

Nossos resultados mostram que variações no ESSs, e não em ESEs, são mais comumente associados com splicing alternativo.

HECHO POR LUCIA SENCIA 33

Page 34: Lucia genomica y proteomica

Para esse estudo oito conjuntos de elementos reguladores (seis ESEs e dois ESSs) foram obtidos. Quatro (SF2_IgM, SRP40, SRP55 e SC35) dos seis conjuntos de dados foram descobertos in vitro, utilizando a metodologia SELEX enquanto os outros dois foram descobertas in silico.

HECHO POR LUCIA SENCIA 34

Page 35: Lucia genomica y proteomica

HECHO POR LUCIA SENCIA 35

Page 36: Lucia genomica y proteomica

1- Classificação dos exons.

2- Identificar os eventos de splicing.

3- Mapear os ESRs nos exons

4- Mapear os SNVs nos exons

5- Mapear SNVs exonicos em ESRs motifs publicos

6- Encontrar SNVs isoforma associada e definir ESR putativos

HECHO POR LUCIA SENCIA 36

Page 37: Lucia genomica y proteomica

6- Encontrar SNVs isoforma associada e definir ESR putativos

HECHO POR LUCIA SENCIA 37

Page 38: Lucia genomica y proteomica

Primeiro achado:

A densidade de SNVs em exons alternativos é 10% superior quando comparada com exos constitutivos (P-valor = 2,53-102 ).

Skipping = 5,01, Criptico = 5,19 e Retenção = 5,17 SNVS por 1000 nt.

Esta diversidade genética reduzida de exons skipping em relação a outras formas de exons alternativos podem refletir uma forte restrição seletiva.

Este resultado está de acordo com os achados de Wang, E. et al., que mostrou que exons skipping são mais conservados entre quatro genomas de mamíferos.

HECHO POR LUCIA SENCIA 38

Page 39: Lucia genomica y proteomica

Exons alternativos são enriquecidos em ESRs quando comparado com exons constitutivos.

Segundo achado:

HECHO POR LUCIA SENCIA 39

Page 40: Lucia genomica y proteomica

Exons alternativos mostram maior proporção de ESRs modificados por SNVs que exons constitutivos.

Terceiro achado:

HECHO POR LUCIA SENCIA 40

Page 41: Lucia genomica y proteomica

As observações que o exons alternativos mostram uma maior densidade de SNVS, ESRs e também uma maior proporção de ESRs modificados pela SNVS, sugerem que esta variação genética pode até certo ponto, ser um dos fatores causais que distingui splicing alternativo e constitutivo.

De fato vários estudos analisaram o impacto do polimorfismo de nucleotídeo único na regulação da expressão de isoformas de maneira tecido-específicos e não específicos e validaram alguns SNPs causais ocorrendo em reguladores de splicing.

HECHO POR LUCIA SENCIA 41

Page 42: Lucia genomica y proteomica

Entre o conjunto de seqüências derivadas do SNVs isoforma-associada descobrimos que aproximadamente 86% continham pelo menos um ESR já descritos.

Um passo a mais:

HECHO POR LUCIA SENCIA 42

Page 43: Lucia genomica y proteomica

Estes resultados sugerem que a influência do SNVS em alguns tipos de splicing alternativo ocorrem predominantemente através de seus efeitos sobre a ESSs.

ESS associados com splicing alternativo são mais modificado por SNVs.

HECHO POR LUCIA SENCIA 43

Page 44: Lucia genomica y proteomica

Analisando a polaridade das mudanças impostas pelo SNVs podemos discriminar ainda mais o efeito do SNVS em ESSs?

T->G T

Se assumirmos que o alelo derivados aumenta a variabilidade, permitindo a utilização de alternativos exon / intron, podemos tentar entender melhor o efeito da SNVs nos ESS através da definição de um padrão de ganho ou perda ESSs com o surgimento de um alelo derivado.

HECHO POR LUCIA SENCIA 44

Page 45: Lucia genomica y proteomica

T->G T

Analisando a polaridade das mudanças impostas pelo SNVs podemos discriminar ainda mais o efeito do SNVS em ESSs?

HECHO POR LUCIA SENCIA 45

Page 46: Lucia genomica y proteomica

Os resultados aqui apresentados apóiam a visão de que ESRs têm uma maior diversidade genética nos exons alternativos quando comparado com exons constitutivos.

Acreditamos que esta variação genética pode ser até certo ponto uma das principais características distintivas de splicing alternativo e constitutivo.

Além disso, fornecemos evidências que esse efeito deve-se principalmente através SNVs agindo em ESSs.

Considerações Finais.

HECHO POR LUCIA SENCIA 46