25
Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1 , Valeria Tekiel 1 , Karim Ben Abdellah 2 , Antonio González 2 y Daniel O. Sánchez 1 1 Instituto de Investigaciones Biotecnológicas, Universidad Nacional de General San Martín, San Martín, Argentina 2 Instituto de Parasitología y Biomedicina, Granada, España {fernan,valet,dsanchez}@iib.unsam.edu.ar aga@ipb.csic.es

Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

Embed Size (px)

Citation preview

Page 1: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

Identificación y análisis de genes estadío específicos en Trypanosoma cruzi

Fernán Agüero1, Valeria Tekiel1, Karim Ben Abdellah2, Antonio González2 y Daniel O. Sánchez1

1 Instituto de Investigaciones Biotecnológicas, Universidad Nacional de General San Martín, San Martín, Argentina2 Instituto de Parasitología y Biomedicina, Granada, España

{fernan,valet,dsanchez}@iib.unsam.edu.ar [email protected]

Page 2: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

Genomics :: historia

● En 1994 la OMS decidió impulsar la secuenciación de genomas de parásitos importantes desde el punto de vista sanitario.

● Uno de los primeros objetivos, aun antes de comenzar a secuenciar el genoma, fue el descubrimiento de genes. Distintos proyectos fueron comenzados a ese fin y varias redes de laboratorios se organizaron para llevar a cabo el proyecto.

● En Trypanosomas:

● secuenciación de ESTs

● secuenciación de GSSs

● mapeo

Page 3: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

Expressed sequence tags (ESTs)

● Qué es un EST?● Es una secuencia proveniente de un transcripto (mRNA) obtenida al azar.

● Es una secuencia corta, no editada ni corregida, obtenida mediante una única reacción de secuenciación.

● Cómo se produce un EST?● A partir de una biblioteca de cDNA, por secuenciación de extremos de clones seleccionados al azar.

Page 4: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

Biblioteca de cDNA

● Biblioteca de cDNA.

● Distintos clones obtenidos a partir del mismo transcripto pueden diferir en el extremo 5'

● Si la biblioteca está orientada, se puede elegir el extremo del clon a secuenciar.

● Se pueden producir ESTs 5' o 3'

AAAAAAAACopias de parciales del mRNA

cDNA clonado

5' EST 3' EST

Fwd sequencing primer

Rev sequencing primer

Page 5: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

ESTs :: calidad de secuencia

Vector Repeat

Un EST contiene información de secuencia decalidad variable, con contaminantes

Page 6: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

Información presente en un EST

Qué información provee un EST?● En primer lugar:

● Secuencia de un producto de expresión (gen)

● En forma adicional:● información de expresión:

● sitio de expresión (estadio del ciclo de vida / órgano / tejido)● condiciones de expresión (condiciones experimentales)

Page 7: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

Redundancia

La secuenciación de ESTs genera redundancia● Una única library de cDNA:

●La redundancia proviene de la selección al azar de los clones a secuenciar (estadística, se puede estimar)

● Distintas libraries de cDNA de distintos estadios/tejidos:

● Redundancia adicional (varios ESTs correspondientes a un mismo transcripto que se expresa en distintos estadios/tejidos)

Dos tipos de redundancia:

●secuencia●información de expresión

Page 8: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

Manejo de la redundancia

in vitro

● construcción de libraries normalizadas o sustractivas

in silico

● agrupar ESTs en 'clusters' (por similitud)

● generar un set de datos no-redundante en el cual cada 'cluster' es representado por una única secuencia

Page 9: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

ESTs en T. cruzi

cDNA libraries

● epimastigotes, no normalizada, 252 ESTs

● epimastigotes, normalizada, 9630 ESTs

● trypomastigotes metacíclicos (differential display), 175 ESTs

● trypomastigotes, no normalizada, 1507 ESTs [*]

● trypomastigotes, sustractiva (-epimastigotes), 403 ESTs [*]

● amastigotes, no normalizada, 1328 ESTs [*]

Laboratorios

● Instituto Fiocruz, Rio de Janeiro, Brasil.

● Department of Genetics and Pathology, Uppsala Universitet, Sweden.

● Instituto de Biologia Molecular do Parana, Parana, Brasil

● Instituto de Investigaciones Biotecnológicas, UNSAM, Argentina.

● Instituto de Parasitología y Biomedicina, CSIC, España.

Page 10: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

T. cruzi ESTs :: gene discovery

● Comparación de las secuencias (ESTs) contra bases de datos de proteínas e identificación de similitud/homología para intentar predecir función

● Uppsala Universitet: Genome Research 10 (2000): 1103-1107

● IIB-UNSAM: Infection & Immunity 66 (1998): 5393-5390

● Inst. Fiocruz, Brasil & Inst Parsitología, España: Mem Inst Oswaldo Cruz 92 (1998): 863-866

● Estudio de un proceso (metaciclogenésis) mediante differential display:

● Inst Biologia Molecular, Parana, Brasil: Mem Inst Oswaldo Cruz. 94 (1999) Suppl 1:165-8

Page 11: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

ESTs de trypomastigotes y amastigotes

Proyecto TRAM http://genoma.unsam.edu.ar/projects/tram

Dos bibliotecas de cDNA TcTR (trypomastigotes) TcAM (amastigotes)

Proyecto TcT-E Una biblioteca sustractiva de cDNA

Trypomastigotes - Epimastigotes

Library Número PorcentajeTcTR 1502 47.03TcAM 1289 40.36TcT-E 403 12.62Total 3194 100

Page 12: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

TRAM: Construcción de las bibliotecas

Síntesis de la primera hebra de cDNA a partir de oligo-dT

Síntesis de la segunda hebra de cDNA a partir del miniexón

Análisis de las primeras 23-25 bases de todos los ESTs:•Usando fuzznuc (European Molecular Biology Open Software Suite, EMBOSS)•Permitiendo 2 errores de secuencia

1551 clones (55.4%) tienen extremos 5' completos

Page 13: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

Reconstrucción de transcriptos

Raw ESTs

Clusters

Alignments

Consensi

Joined Consensi

predict CDS

Protein Fragments

NNN

● 2771 ESTs totales fueron agrupados en un set no-redundante de 1619 secuencias

437 consensos 1182 singletons

Page 14: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

Analisis de similitud de secuencia contra bases de datos públicas

BLASTX: GenBank, Swissprot, KOG (genomas eucarióticos completos)

BLASTN: dbEST, Borrador del genoma de T. cruzi

Protein Dbs Nucleotide DbsGrupo GenBank KOG Tc ESTs Tc WGS Number

1 + + + + 1842 + - + + 1133 + + - + 644 - + - + 2535 + - - + 606 - - - + 5497 - - - - 372

Description Number PercentTotal ESTs generated 2771 100TcTR library 1502 54.2TcAM library 1269 45.8Non-redundant dataset 1619 100

1490 92505 31.1

Matches vs protein databases 439 27.1Detail of matches vs protein databases 439 100Ribosomal proteins 107 24.5Hypothetical proteins /Unknown function 100 22.7

ESTs aligned to T. cruzi shotgun readsESTs similar to other T. cruzi ESTs

Page 15: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

TRAM: comparación con otros sets de ESTs

Usando BLASTN Alineamientos significativos son aquellos con un E

≤ 1-40

505 ESTs (31.1%) fueron significativamente similares a otros ESTs ya disponibles en bases de datos públicas

1116 ESTs (68.8%) representan nuevos ESTs

Page 16: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

Información accesible en sitio web

Una página web mostrando un grupo de ESTs que comparten un patrón de aciertos (matches) contra distintas bases de datos.

http://genoma.unsam.edu.ar/projects/tram

Page 17: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

Información accesible en sitio web

Testcode evaluation Presencia de miniexon

Page 18: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

Composición de los clusters

Hay clusters enriquecidos en ESTs de una de las dos biblitecas en particular?

Análisis estadístico: Stekel DJ, Git Y, Falciani F. The comparison of gene expression from multiple cDNA libraries. Genome Res (2000) 10:2055.

Calcula un valor R (log likelihood) que está relacionado con la verosimilitud de la hipótesis de que la diferencia en la composición se debe a una diferencia de expresión y no a un desvío en el muestreo

R No. ESTs Mean No. from randomized data Confidencia0 136 350.26 --1 214 69.41 67.572 52 13.35 74.323 29 5.31 81.684 3 0.53 82.55 2 0.11 94.76 1 0.04 96.47 0 0 --8 0 0 --9 0 0 --

10 0 0 --11 0 0 --12 0 0 --13 1 0 10014 0 0 --

Page 19: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

Composición de los clusters

Ribosomal proteins with extraribosomal functions (Wool IG, TiBS 1996 21: 164)

S12 is a RNA chaperone. Enhances phage T4 intron splicing in vitro.

SA is also located at the cell surface. Functions as a high-affinity laminin receptor

Cluster TcAM ESTs TcTR ESTs Annotation R FactorCl136 17 0 Ribosomal protein S12 13.15Cl34 8 0 Clathrin assembly protein AP19 6.19Cl237 7 0 - 5.42Cl244 7 0 - 5.42Cl89 6 0 TcSMUG mucin (L) 4.65Cl70 9 1 Ribosomal protein L5 4.34Cl425 0 7 Ribosomal protein SA (P40) 4.33

Page 20: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

Construcción de la biblioteca substractivacDNA trip cDNA tripcDNA episTripos

RNATotal

mRNA

1era hebra cDNA

cDNA doble cadena

DigestiónRsaI

Epis

Page 21: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

Control final construcción library TcT-E

18 23 28 33 18 23 28 33 -

H2A

Subs T-E Sin subst

Análisis de eficiencia de substracción

Page 22: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

47(11.6%)

14(3.4%)

102(25.3%)

31

4

17

ESTs T. cruzitrypomastigotes

ESTs T. cruzi epimastigotes

Protein Databases

TcT-E: Distribución de los ESTs

Page 23: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

Reverse Northern

Trypomastigote cDNA Epimastigote cDNA

Northern reverso86 clones testeados en 2 ensayos similares independientes

Page 24: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

TcT-E: confirmación de expresión diferencial de clones seleccionados

Northern blots

Control: gp63(T.cruzi)

E T

E T 02g6

E+K+TcTr

02j12

E T

Pre-RNA proc(L. major)

01i24

Todo neg

01b11

Bop(SP/NR)

E T01a18

Rib

E T

E+K, no codif

01p24

E T

Todo neg

Page 25: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2

Reconocimientos

Laboratorio de Genómica y Bioinformática, IIB-UNSAM

Daniel O. Sánchez

●Secuenciación de ESTs

Valeria Tekiel

Ramiro Verdún

Nelson Di Paolo

Fernanda Peri

Rodrigo Pavón

Diego Rey Serantes

●Bioinformática

Fernán Agüero

Colaboradores

● Antonio Gonzalez, Instituto de Parasitologia y Biomedicina, CSIC, Espa?a

● Carlos Frasch, Instituto de Investigaciones Biotecnologicas, UNSAM, Argentina.