Upload
andres-gomez-maidana
View
213
Download
0
Embed Size (px)
Citation preview
Identificación y análisis de genes estadío específicos en Trypanosoma cruzi
Fernán Agüero1, Valeria Tekiel1, Karim Ben Abdellah2, Antonio González2 y Daniel O. Sánchez1
1 Instituto de Investigaciones Biotecnológicas, Universidad Nacional de General San Martín, San Martín, Argentina2 Instituto de Parasitología y Biomedicina, Granada, España
{fernan,valet,dsanchez}@iib.unsam.edu.ar [email protected]
Genomics :: historia
● En 1994 la OMS decidió impulsar la secuenciación de genomas de parásitos importantes desde el punto de vista sanitario.
● Uno de los primeros objetivos, aun antes de comenzar a secuenciar el genoma, fue el descubrimiento de genes. Distintos proyectos fueron comenzados a ese fin y varias redes de laboratorios se organizaron para llevar a cabo el proyecto.
● En Trypanosomas:
● secuenciación de ESTs
● secuenciación de GSSs
● mapeo
Expressed sequence tags (ESTs)
● Qué es un EST?● Es una secuencia proveniente de un transcripto (mRNA) obtenida al azar.
● Es una secuencia corta, no editada ni corregida, obtenida mediante una única reacción de secuenciación.
● Cómo se produce un EST?● A partir de una biblioteca de cDNA, por secuenciación de extremos de clones seleccionados al azar.
Biblioteca de cDNA
● Biblioteca de cDNA.
● Distintos clones obtenidos a partir del mismo transcripto pueden diferir en el extremo 5'
● Si la biblioteca está orientada, se puede elegir el extremo del clon a secuenciar.
● Se pueden producir ESTs 5' o 3'
AAAAAAAACopias de parciales del mRNA
cDNA clonado
5' EST 3' EST
Fwd sequencing primer
Rev sequencing primer
ESTs :: calidad de secuencia
Vector Repeat
Un EST contiene información de secuencia decalidad variable, con contaminantes
Información presente en un EST
Qué información provee un EST?● En primer lugar:
● Secuencia de un producto de expresión (gen)
● En forma adicional:● información de expresión:
● sitio de expresión (estadio del ciclo de vida / órgano / tejido)● condiciones de expresión (condiciones experimentales)
Redundancia
La secuenciación de ESTs genera redundancia● Una única library de cDNA:
●La redundancia proviene de la selección al azar de los clones a secuenciar (estadística, se puede estimar)
● Distintas libraries de cDNA de distintos estadios/tejidos:
● Redundancia adicional (varios ESTs correspondientes a un mismo transcripto que se expresa en distintos estadios/tejidos)
Dos tipos de redundancia:
●secuencia●información de expresión
Manejo de la redundancia
in vitro
● construcción de libraries normalizadas o sustractivas
in silico
● agrupar ESTs en 'clusters' (por similitud)
● generar un set de datos no-redundante en el cual cada 'cluster' es representado por una única secuencia
ESTs en T. cruzi
cDNA libraries
● epimastigotes, no normalizada, 252 ESTs
● epimastigotes, normalizada, 9630 ESTs
● trypomastigotes metacíclicos (differential display), 175 ESTs
● trypomastigotes, no normalizada, 1507 ESTs [*]
● trypomastigotes, sustractiva (-epimastigotes), 403 ESTs [*]
● amastigotes, no normalizada, 1328 ESTs [*]
Laboratorios
● Instituto Fiocruz, Rio de Janeiro, Brasil.
● Department of Genetics and Pathology, Uppsala Universitet, Sweden.
● Instituto de Biologia Molecular do Parana, Parana, Brasil
● Instituto de Investigaciones Biotecnológicas, UNSAM, Argentina.
● Instituto de Parasitología y Biomedicina, CSIC, España.
T. cruzi ESTs :: gene discovery
● Comparación de las secuencias (ESTs) contra bases de datos de proteínas e identificación de similitud/homología para intentar predecir función
● Uppsala Universitet: Genome Research 10 (2000): 1103-1107
● IIB-UNSAM: Infection & Immunity 66 (1998): 5393-5390
● Inst. Fiocruz, Brasil & Inst Parsitología, España: Mem Inst Oswaldo Cruz 92 (1998): 863-866
● Estudio de un proceso (metaciclogenésis) mediante differential display:
● Inst Biologia Molecular, Parana, Brasil: Mem Inst Oswaldo Cruz. 94 (1999) Suppl 1:165-8
ESTs de trypomastigotes y amastigotes
Proyecto TRAM http://genoma.unsam.edu.ar/projects/tram
Dos bibliotecas de cDNA TcTR (trypomastigotes) TcAM (amastigotes)
Proyecto TcT-E Una biblioteca sustractiva de cDNA
Trypomastigotes - Epimastigotes
Library Número PorcentajeTcTR 1502 47.03TcAM 1289 40.36TcT-E 403 12.62Total 3194 100
TRAM: Construcción de las bibliotecas
Síntesis de la primera hebra de cDNA a partir de oligo-dT
Síntesis de la segunda hebra de cDNA a partir del miniexón
Análisis de las primeras 23-25 bases de todos los ESTs:•Usando fuzznuc (European Molecular Biology Open Software Suite, EMBOSS)•Permitiendo 2 errores de secuencia
1551 clones (55.4%) tienen extremos 5' completos
Reconstrucción de transcriptos
Raw ESTs
Clusters
Alignments
Consensi
Joined Consensi
predict CDS
Protein Fragments
NNN
● 2771 ESTs totales fueron agrupados en un set no-redundante de 1619 secuencias
437 consensos 1182 singletons
Analisis de similitud de secuencia contra bases de datos públicas
BLASTX: GenBank, Swissprot, KOG (genomas eucarióticos completos)
BLASTN: dbEST, Borrador del genoma de T. cruzi
Protein Dbs Nucleotide DbsGrupo GenBank KOG Tc ESTs Tc WGS Number
1 + + + + 1842 + - + + 1133 + + - + 644 - + - + 2535 + - - + 606 - - - + 5497 - - - - 372
Description Number PercentTotal ESTs generated 2771 100TcTR library 1502 54.2TcAM library 1269 45.8Non-redundant dataset 1619 100
1490 92505 31.1
Matches vs protein databases 439 27.1Detail of matches vs protein databases 439 100Ribosomal proteins 107 24.5Hypothetical proteins /Unknown function 100 22.7
ESTs aligned to T. cruzi shotgun readsESTs similar to other T. cruzi ESTs
TRAM: comparación con otros sets de ESTs
Usando BLASTN Alineamientos significativos son aquellos con un E
≤ 1-40
505 ESTs (31.1%) fueron significativamente similares a otros ESTs ya disponibles en bases de datos públicas
1116 ESTs (68.8%) representan nuevos ESTs
Información accesible en sitio web
Una página web mostrando un grupo de ESTs que comparten un patrón de aciertos (matches) contra distintas bases de datos.
http://genoma.unsam.edu.ar/projects/tram
Información accesible en sitio web
Testcode evaluation Presencia de miniexon
Composición de los clusters
Hay clusters enriquecidos en ESTs de una de las dos biblitecas en particular?
Análisis estadístico: Stekel DJ, Git Y, Falciani F. The comparison of gene expression from multiple cDNA libraries. Genome Res (2000) 10:2055.
Calcula un valor R (log likelihood) que está relacionado con la verosimilitud de la hipótesis de que la diferencia en la composición se debe a una diferencia de expresión y no a un desvío en el muestreo
R No. ESTs Mean No. from randomized data Confidencia0 136 350.26 --1 214 69.41 67.572 52 13.35 74.323 29 5.31 81.684 3 0.53 82.55 2 0.11 94.76 1 0.04 96.47 0 0 --8 0 0 --9 0 0 --
10 0 0 --11 0 0 --12 0 0 --13 1 0 10014 0 0 --
Composición de los clusters
Ribosomal proteins with extraribosomal functions (Wool IG, TiBS 1996 21: 164)
S12 is a RNA chaperone. Enhances phage T4 intron splicing in vitro.
SA is also located at the cell surface. Functions as a high-affinity laminin receptor
Cluster TcAM ESTs TcTR ESTs Annotation R FactorCl136 17 0 Ribosomal protein S12 13.15Cl34 8 0 Clathrin assembly protein AP19 6.19Cl237 7 0 - 5.42Cl244 7 0 - 5.42Cl89 6 0 TcSMUG mucin (L) 4.65Cl70 9 1 Ribosomal protein L5 4.34Cl425 0 7 Ribosomal protein SA (P40) 4.33
Construcción de la biblioteca substractivacDNA trip cDNA tripcDNA episTripos
RNATotal
mRNA
1era hebra cDNA
cDNA doble cadena
DigestiónRsaI
Epis
Control final construcción library TcT-E
18 23 28 33 18 23 28 33 -
H2A
Subs T-E Sin subst
Análisis de eficiencia de substracción
47(11.6%)
14(3.4%)
102(25.3%)
31
4
17
ESTs T. cruzitrypomastigotes
ESTs T. cruzi epimastigotes
Protein Databases
TcT-E: Distribución de los ESTs
Reverse Northern
Trypomastigote cDNA Epimastigote cDNA
Northern reverso86 clones testeados en 2 ensayos similares independientes
TcT-E: confirmación de expresión diferencial de clones seleccionados
Northern blots
Control: gp63(T.cruzi)
E T
E T 02g6
E+K+TcTr
02j12
E T
Pre-RNA proc(L. major)
01i24
Todo neg
01b11
Bop(SP/NR)
E T01a18
Rib
E T
E+K, no codif
01p24
E T
Todo neg
Reconocimientos
Laboratorio de Genómica y Bioinformática, IIB-UNSAM
Daniel O. Sánchez
●Secuenciación de ESTs
Valeria Tekiel
Ramiro Verdún
Nelson Di Paolo
Fernanda Peri
Rodrigo Pavón
Diego Rey Serantes
●Bioinformática
Fernán Agüero
Colaboradores
● Antonio Gonzalez, Instituto de Parasitologia y Biomedicina, CSIC, Espa?a
● Carlos Frasch, Instituto de Investigaciones Biotecnologicas, UNSAM, Argentina.