50
Dra. Silvina E. Wilkowsky Lab. de Hemoparásitos Inst. de Biotecnología INTA Castelar

Clase Genomica Hemoparasitos 2011

Embed Size (px)

Citation preview

  • Dra. Silvina E. Wilkowsky Lab. de Hemoparsitos Inst. de Biotecnologa

    INTA Castelar

  • La genmica de parsitos comenz en el ao 2002

  • QUE PARTICULARIDADES TIENEN LOS DATOS GENOMICOS?

    Acceso a informacin comparativa (patgeno vs. no-patgeno, rango de hospedadores): blanco en genes involucrados en patognesis o

    resistencia a frmacos

  • GENOMICA COMPARATIVA

    Qu genes estn compartidos entre genomas?

    Qu familias gnicas son compartidas o fueron amplificadas o reducidas?

    Qu fuerzas evolutivas estn actuando sobre los genes?

    Qu otras secuencias no gnicas estn conservadas?

    Como fue cambiando la estructura genmica?

  • MALARIA Causada por Plasmodium spp.

    4 especies de Plasmodium infectivas para el ser humano: P.vivax, P.falciparum,

    P.ovale, P. malariae

    300-500 millones de casos,1.5-2.7 millones de muertes/ao

    Cada 40 segundos muere un nio por causa de malaria Existe resistencia a la droga cloroquina, la ms barata existente y est presente

    en casi todos los pases endmicos

    Ha aparecido resistencia a la mayora de las nuevas drogas antimalricas

    No existe vacuna disponible

    NECESIDAD DE NUEVOS METODOS PARA PREVENCION Y TRATAMIENTO

  • DISTRIBUCION MUNDIAL DE LA MALARIA

    Sachs and Malaney, Nature 415: 680-685 (2002)

  • El parsito causante de la malaria es intracelular. Permanece la mayor parte de su ciclo de vida residiendo y dividindose en la clula hospedadora. Presenta mecanismos de evasin de la respuesta inmune y su localizacin le permite el acceso a una variada provisin de nutrientes.

    Las vacunas contra la malaria deben estar dirigidas contra los estados hepticos, sexuales o las formas invasivas.

    Los frmacos de uso humano deben alcanzar los estados parasitarios hepticos o eritrocitarios.

  • 22.853.764 bp

    19.4% GC

    1 gen cada 4.3kb (52% codificantes)

    Set mnimo de tRNAs

    7 operones de RNA ribosomales (no repetidos en tandem)

    ~90% de los genes no haban sido previamente descriptos in Plasmodium.

    ~50% no tienen homlogos conocidos

    Gardner, Hall and Fung et al (2002) Nature, 419:498

    GENOMA DE

    PLASMODIUM FALCIPARUM

    QUE UTILIDAD TIENEN ESTOS DATOS.?

  • Factores de virulencia en Plasmodium falciparum

    La virulencia particular de P.falciparum estara dada por la forma en la cual el parsito altera la superficie del glbulo rojo

    Aproximadamente 16 hs despus de entrar al eritrocito, las protenas Pfemp1 (Plasmodium falciparum erythrocyte membrane protein 1) aparecen en la superficie del glbulo rojo.

    Promueven la unin a una gran variedad de tipos celulares, llevando a una enfermedad severa Inducen una respuesta inmune protectora que el parsito evade cambiando continuamente estas protenas Pfemp1

    EFECTOS?

  • Estructura de PfEMP-1

    59 genes var en total.

    Un tipo predominante (tipo 1)

  • Estructura cromosmica de P. falciparum

    El principal antgeno y factor de virulencia de P. falciparum (Pfemp1) es predominantemente subtelomrico.

    Solo uno de los tipos mayoritarios es adyacente al telmero Muchas otras familias antignicas tambin estn localizadas en ubicaciones subtelomricas.

  • Mapas de sintenia de los cromosomas del gnero Plasmodium

    Comparacin de ortlogos putativos de los proteomas de P. falciparum (Pf), P. vivax (Pv), P. knowlesi (Pk), P. y. yoelii (Py) De los 3,336 ortlogos encontrados entre las 6 especies (P.berghei y P.chabaudi son completamente sintnicos a P.y.yoelii), 3,305 (99%) estn conservados posicionalmente. La sintenia se corta en los genes especie-especficos.

    Nature. 2008 October 9; 455(7214): 757763.

  • QUE UTILIDAD TIENE LOS DATOS GENMICOS? PARTE I Existe resistencia a los antimalricos tradicionales (cloroquina)Qu

    pasa con las drogas de nueva generacin como la artemisinina?

    Artemisinina ATPasa 6

    P.vivax

    A263

    S1008

    P.falciparum

    L263

    N1039

    El cambio en el residuo 263 de Leucina a Alanina resulta en una disminucin de 3 veces de la susceptibilidad de P. falciparum a la artemisinina. La IC50

    (concentracin inhibitoria por la cual el 50% de los parsitos mueren) para

    algunas cepas de P. vivax podra ser mas alta que la IC50 para P. falciparum

    Se estudiaron las interacciones entre las drogas antimalricas y las protenas parasitarias involucradas en unin al frmaco y resistencia analizando las estructuras cristalinas y desarrollando modelos de homologa entre las protenas de P.vivax y los ortlogos de P. falciparum en donde se hayan reportado mutaciones que otorgan resistencia.

  • APLICACIN DE LOS DATOS GENMICOS I

  • CMO LOS PARSITOS DESARROLLAN VARIABILIDAD GENTICA LIGADA A SU RESPUESTA A CAMBIOS AMBIENTALES U OTROS FENOTIPOS ADAPTATIVOS

    APLICACIN DE LOS DATOS GENMICOS II

    Core genome: set de genes ortlogos derivados de un ancestro comn y compartidos por todas las cepas de una especie Son combinaciones hipotticas de genes, no existen en la naturaleza

  • CORE GENOME DE 6 ESPECIES DE PLASMODIOS

    2 especies de Plasmodium infectivas para el ser humano: P.vivax, P.falciparum

    1 especie: P. knowlesi, infectiva para los monos Macacos

    3 especies: P. yoelii yoelii, P. berghei y P. chabaudi infectivas para los roedores

    Anlisis de los genomas completos: http://www.plasmodb.org

    Identificacin de genes ortlogos y parlogos: BLASTP all-against-all

    CRITERIOS E-value < e-10 Similitud (I) >30% si L>150 aa. Si L50% de la protena ms larga Se filtran las regiones de baja complejidad

    Agrupacin de genes en gene clusters usando OrthoMCL (algoritmo de Markov)

    Alineamientos con Clustal W y T-Coffee, anlisis filogentico por Neighbour-Joining y clasificacin funcional en la base de datos de Gene Ontology

  • LSE: lineage specific expansion: surgimiento de copias gnicas mltiples por duplicacin o transferencia lateral de genes en

    un linaje especfico

    *: ORF predichos, anotacin incompleta de los 2 genomas

    *

    Genes duplicados en slo un genoma sin ortlogos en los otros 5 genomas. Estos genes tienen probablemente mayor impacto

    en el genoma porque llevan una marca especie-especfica

  • REPLICATION: DNA replication factors TRANSCRIPTION: RNA polymerase II transcription factors and cofactors TRASLATION: initiatior, elongation and termination regulators REPAIR CELL MOTION: microtubule and actin-based movement

    PROCESAMIENTO DE LA

    INFORMACION GENETICA

    CELL CYCLE: meiosis, mitosis, cyclin-dependent protein kinase activity SIGNAL TRANSDUCTION: Rho, G-protein, PKC RESPONSE TO ENVIRONMENTAL CHALLENGES: oxidative stress, heat PATHOGENESIS: entry, response to drugs, cytoadherence

  • APLICACIN DE DATOS GENOMICOS: PARTE III

    SE PUEDE SECUENCIAR UN GENOMA DIRECTAMENTE DE UNA MUESTRA CLINICA?

  • Eritrocitos infectados de 5-mL de sangre provenientes de un paciente febril, positivo al frotis para malaria por P. vivax con parasitemia de 1.9% (IQ07)

    La muestra se pas por un filtro de leucocitos CF11 y se aisl el DNA genomico

    Se descart coinfeccin con P. falciparum y se confirm por RFLP para el antgeno merozoite surface protein 3 (msp3)- que la infeccin fuese monoallica

    El DNA genmico total se someti a Whole-Genome Amplification (WGA) y se secuenci utilizando la plataforma Illumina

    WGA =>Lisis-Desnaturalizacin alcalina-Neutralizacin-PCR isotrmica a 300C overnight con DNA Pol

    Validacin de datos de SNPs utilizando whole-genome tiling microarray Comparacin de datos IQ07 vs. Sal I (cepa referencia genoma, El Salvador 1972)

  • 58 millones de lecturas

    40pb promedio

    Cobertura promedio 30X

  • El aislamiento peruano IQ07 estuvo sometido a 35 aos de presin selectiva con drogas modernas en comparacin con la cepa SalI de 1972

    TILING MICROARRAY

    Ambos mtodos encontraron mutaciones en los genes pvhdfr (dihidrofolato reductasa), pvdhps

    (dihidropteroato sintetasa) y pvmdr1 (gen de resistencia multidroga). Este ltimo gen present un cociente dN/dS infinito

    P-valorproblemas de alineamiento en regiones de baja complejidad

    PRESION POSITIVA

  • HEMOPARSITOS BOVINOS

    Babesia bovis

    Babesia bigemina

    Anaplasma marginale

    Theileria parva

    Theileria annulata

    Ausentes en el continente americano

  • Babesia spp.

    Protozoo perteneciente al phylum Apicomplexa, junto con Plasmodium sp, Toxoplasma sp, Theileria sp y Eimeria sp. Transmitido por la garrapata Boophilus microplus.

    Las especies de mayor importancia econmica en Argentina afectan al ganado bovino y son Babesia bovis y B. bigemina

    2 hospedadores: invertebrado (garrapata) y vertebrado (bovino) donde se desarrolla como parasito intraeritroctico

  • CICLO DE VIDA DE B. BOVIS

    Hembra adulta de B. microplus

    kinetos

    Gland. salival

    esporonte

    esporozotos

    gametas

    merozotos

    cigota

    Clula intestinal

    Eritrocitos

  • Sintomas: anemia hemoltica, daos neurolgicos, renales, shock respiratorio, alta mortalidad en adultos. Importantes perdidas econmicas a la ganadera de Argentina: 9.900.000 bovinos expuestos (19% de la poblacin total del pas) Mtodos de control:

    - Tratamiento farmacolgico: imidocarb y derivados - Control de garrapatas: acaricidas (resistencia) - Vacunas vivas

    Laboriosas Inestables, necesidad de cadena de fro Morbilidad elevada Posible infeccin con otros patgenos Permanencia del parsito en el rea

    Babesiosis bovina

  • Anaplasma marginale

  • Estrategia de secuenciacin: ADNg digerido con Hind III Separacin por Pulse Field Gel Electrophoresis Clonado en BACs y screening con sondas bovinas y especficas Ruptura del DNA de los clones positivos con Hydroshear y clonado en pCRScript Secuenciacin Big Dye Chemistry (ABI) Long distance PCR y genome walking para completar gaps

    Cepa: St. Maries aislada de caso agudo. Transmisible por garrapatas.

    Purificar o no? Shotgun?

    1 leucocito bovino=3000 genomas de A. marginale!

    Library de BACs de DNA bovino y del

    patgeno

    GENOMA ANAPLASMA MARGINALE

  • ANOTACION

    Prediccin de ORFs y CDSs por Glimmer y Orpheus

    BLAST y RBSFINDER para determinar inicio de CDSs

    Pptido seal por SignalP

    Determinacin de familias y superfamilias por Pfam

    Asignacin de CDSs a categoras en la base de datos de COGs (Cluster of Orthologous Groups) y a rutas metablicas utilizando KEGG y ECOCYC

    La base 1 se asign arbitrariamente por anlisis del sesgo de GCs (G-C/G+C). Los genes dnaA, gyrA, gyrB y otros tpicos del origen de replicacin se encuentran dispersos en el genoma.

    Sesgo GC

    rRNA

    tRNA

    CDS reverse

    CDS forward

    BACs

    msp2

    msp1

  • CARACTERISTICAS GENERALES DEL GENOMA DE ANAPLASMA MARGINALE

    Tamao genoma, bp 1,197,687

    G C, % 49 Densidad de genes codif. % 86 Genes codif. protenas 949 Asignacin funcional 567 Asignacin funcional conservada 107 Hipotticas conservadas 126 Hypotticas 151 Pseudogenes funcionales 14 ORFs con dominios partidos 8 Densidad de genes 0.79

    Long. promedio de genes 1,077 Ribosomal RNAs 3 Transfer RNAs 37

    Alto (Rickettsiales: 31%) Alta: tpica de bact. intr. obligadas

    Pseudogenes?

    Copias truncadas de genes que solo se expresan como parte de una proteina full length luego de recombinar en un sitio nico de expresin

  • Superfamilia msp2

    Comprende los genes msp2,msp3 y msp4

    Son protenas inmunodominantes, antignicamente variables: evasin del SI

    msp2 se transcribe como parte de un opern de 4 genes: a los 3 restantes se los denomina operon associated genes (opags) 1-3

    Este opern muestra una expresin diferencial: opag1 no se traduce, opag2 y msp2 se expresan en el eritrocito y en el intestino y glnd.salivales de la garrapata y opag 3 solo se expresa en el eritrocito.

    Se encontraron adems 15 genes no identificados previamente con identidad de secuencia a la superfamilia msp2-4. Se los denomin OMP1-15

    Existen ortlogos de msp2 en miembros del gnero Erlichia (E. ruminantium, E.canis y E. chaffensis). Anaplasma y Erlichia pertenecen al orden Rickettsiales

    Aunque existe sintenia entre estos genes de Erlichia y msp2, el mecanismo para generar variacin antignica es muy distinto: las especies de Erlichia usan varios genes de un arreglo en tndem de OMPs mientras que Anaplasma utiliza el mecanismo de recombinacin.

    Una explicacin a esto es que la enzima mutL (reparacin de mismatches) en A. marginale contiene un segmento variable de residuos G que muchas veces resulta en un frameshift y por ende en una molcula inactiva. Por ende, la tasa de mutacin y recombinacin en este organismo es alta.

  • METABOLISMO La mayora de las enzimas glucolticas estn presentes Ni la glucokinasa ni transportadores de azcares estn presentes: utilizacin de gluconeognesis No se detectaron pathways completos de sntesis de aminocidos A.marginale realiza respiracin aerbica a travs del ciclo TCA Se hallaron todas las enzimas necesarias para la sntesis de cidos grasos y sntesis de novo de purinas

    y pirimidinas

    TRANSPORTADORES A pesar de que A.m. sintetiza muy pocos aminocidos, se hallaron pocos transportadores de los

    mismos (solo se pudo asignar 1 para Prolina y un putativo para Alanina) Sin embargo se hallaron muchos transportadores de tipo ATP binding-cassettes que podran realizar

    esta funcin. Se identificaron tambin sistemas transportadores de cationes, aniones, oligopptidos, dos bombas

    de resistencia a multidrogas, ribonucletidos y fosfatos. La va sec de secrecin de polipptidos y el sistema de secrecin IV estn presentes y el sistema tat

    contiene solamente tatC

    COMPONENTES DE LA PARED CELULAR Varios genes de sntesis de LPS estn ausentes y tambin todos los genes de la biosntesis del lpido A No se encontr la va completa de sntesis de pptidoglicano La falta de una pared celular tradicional parece ser una caracterstica comn de la familia

    Anaplasmataceae, pero no del orden Rickettsiales, en donde algunos miembros pueden sintetizar LPS y peptidoglicano.

    A.marginale sera capaz de reforzar su pared de modo alternativo: muchas de las MSPs estan ligadas covalente y no covalentemente en complejos homomricos y heteromricos en la superficie celular.

  • Hemoparsitos protozoarios transmitidos por vectores

    Vector Clula Huesped Sndrome clnico

    Babesia bovis

    Garrapatas Eritrocitos

    bovinos

    (citoplasma)

    Anemia,

    secuestro de

    eritrocitos en

    capilares,

    alteraciones

    neurolgicas,

    aborto

    Theileria

    spp.

    Garrapatas Eritrocitos

    bovinos

    (citoplasma) y

    linfocitos

    Fiebre,

    linfoadenopatas,

    distrs

    respiratorio,

    signos

    neurolgicos

    Plasmodium spp. Mosquito Hepatocitos y

    eritrocitos

    humanos

    (vacuola

    parasitfora)

    Anemia,

    secuestro de

    eritrocitos en

    capilares,

    alteraciones

    neurolgicas,

    aborto

  • Genoma de Babesia bovis

    Features Species

    P. falciparum T. parva B. bovis

    Size (Mbp) 22.8 8.3 8.2 Number of chromosomes 14 4 4 Total GC composition (%) 19.4 34.1 41.8 Size of apicoplast genome (kbp) 35 39.5 33 Size of mitochondrial genome (kbp) ; 6 linear 6 linear 6 linear Number of nuclear protein coding genes 5,268 4,035 3,670 Average protein coding gene length (bp)a 2,283 1,407 1,514 Percent genes with introns 53.9 73.6 61.5 Mean length of intergenic region (bp) 1,694 405 589 G+C composition of intergenic region 13.8 26.2 37 G+C composition of exons (%) 23.7 37.6 44 G+C composition of introns (%) 13.6 25.4 35.9 Percent coding 52.6 68.4 70.2 Gene densityb 4,338 2,057 2,228 a Not including introns. b Genome size/number of protein coding genes.

    Cepa utilizada: T2bo

    Virulenta, transmisible por garrapatas

  • CROMOSOMAS DE BABESIA BOVIS

    Cromosoma 1: 2,623,761 pb

    Cromosoma 2: 2,593,321 pb

    Cromosoma 3: 1,729,419 pb

    Cromosoma 4: 1,107,195 pb

    Mitocondria: 6005 pb

    Plstido:35107 pb

    3.13

    2.70

    2.35 1.81 1.66 1.37 1.05

    MW MW Mpb

    Figure 1. Representation of B. bovis Centromeres, ves1,

    and smorf Genes

    Each chromosome is represented by a black line, with the

    chromosome number shown on the left. Centromeres are

    depicted as black dots. Ves1 loci are depicted as colored boxes,

    and the number of ves1 and smorf genes in each locus is shown

    above or below the colored boxes, respectively. Red and blue

    boxes indicate the presence of at least one ves1a/ves1b or

    ves1a/ves1a pair, respectively, within the cluster.

  • El perfil metablico predicho de Babesia bovis es similar al de Theileria parva

  • APICOPLASTO Organela semiautnoma similar a un plstido presente en muchos miembros del phylum

    Apicomplexa

    Derivado de un evento endosimbintico secundario

    El genoma del apicoplasto de B. bovis es similar

    en tamao, contenido gnico y orden a los de

    Eimeria tenella, P. falciparum, T. parva, y

    Toxoplasma gondii

    Es extremadamente rico en AT (78.2%), en contraste

    al genoma nuclear (58.2%).

    El apicoplasto sera un blanco deseable

    para el desarrollo de nuevas drogas antiparasitarias

    dado que las vas biosintticas all representadas

    son de origen cianobacteriano y muy distintas de

    las del husped mamfero.

    En T. gondii se ha demostrado que la sntesis de

    cidos grasos en el apicoplasto es necesaria para

    la biognesis y mantenimiento del mismo.

    Qu pasa en B. bovis? Coding sequences (CDSs) with functional annotation are depicted in

    red, while hypothetical CDSs are shown in lack. Genes encoding

    tRNA genes are shown as blue bars, while rRNA genes are shown as

    yellow arrows. All genes are unidirectionally encoded

  • MITOCONDRIA

    Diagram of B. bovis mitochondrial genome. CDSs are depicted in red, large subunit

    rRNA genes in blue, and inverted terminal repeats as black arrows.

    La organizacin gnica es idntica a la de Theileria spp. pero diferente a la de

    P. falciparum.

    Cada una de las protenas codificadas emplea el codn ATG como inicio de la

    traduccin, a diferencia del gen de la subunidad I del citocromo C de T. parva

    que utiliza AGT como codn inicial.

  • PRINCIPALES FAMILIAS DE PROTEINAS EN BABESIA BOVIS

    El proteoma predicho por Tribe-MCL mostr que adems de los genes housekeeping

    comunes a otros eucariotas, B. bovis posee 2 grandes familias de protenas: ves y

    smORFs (small open reading frames)

    Otras familias minoritarias son sbp2 (spherical body protein 2) y vmsa (variable surface

    merozoite antigen)

    Los genes ves codifican para la protena VESA1, un heterodmero que se expresa en la superficie del

    eritrocito. Son la familia de genes ms abundantes del genoma

    A diferencia de lo que se encuentra en P.falciparum para los genes var de localizacin exclusivamente

    telomrica, en B. bovis estos genes se encuentran dispersos por todo el cromosoma

    VESA1 es un antgeno de variacin rpida implicado en evasin de la respuesta inmune y

    citoadhesin PATOGENIA

    El anlisis genmico predice aproximadamente 150 genes ves distribudos en los 4 cromosomas

  • smORFs

    Asociados a los genes ves y tambin distribudos en los 4 cromosomas

    Son 44 genes de entre 381 a 1,377 nucletidos sin identidad a ningn gen o protena depositada en las bases de datos disponibles

    Alto grado de homologa con las protenas VESA (28-95%)

    La prediccin bioinformtica indica que estaran localizadas extracelularmente

    La existencia de pptidos seales cannicos en las SmORFs y su asociacin uniforme con los clusters de genes ves1 sugiere que estas protenas tendran un rol funcional en la biologa de las VESA o que por s mismas contribuiran a la variacin antignica, la evasin inmune o ambas.

  • ANALISIS COMPARATIVO DE LOS PROTEOMAS DE LOS HEMOPROTOZOARIOS

    Agrupamiento por similitud de los proteomas predichos en COGs

    Genes especficos de los

    estados en mosquito o de

    los esporozotos que se

    expresan en el vector, no

    comparten COGs con B.

    bovis y T. parva

    TRAP, p36, Pf12, Sir2,

    PfATP6, y P0.

    p36 result ser

    inmunoprotectivo en

    experimentos con knockout

    en P.falciparum

    Dado que P. falciparum, T. parva, y B. bovis tienen ciclos de vida complejos que involucran un vector

    artrpodo y un husped mamfero, se utilizaron los datos de los COGs pesados por el ndice de Jaccard para buscar ortlogos de B. bovis que hayan sido caracterizados como blancos de inmunidad protectiva o

    que jueguen un papel en la biologa del parsito.

    Indice de Jaccard

    J (A,B)=AB AUB

  • ANALISIS DE SINTENIA

    Se realiz este anlisis debido a que por

    presin evolutiva, los homlogos funcionales

    de protenas de B. bovis, T. parva y P.

    falciparum hayan divergido en su secuencia

    de aminocidos

    Los bloques sintnicos se definieron como el

    par de genes que pertenecen al mismo Jf-

    COG

    No se pudieron identificar homlogos evidentes para la mayora de las protenas de

    P. falciparum estado especficas o involucradas en la inmunidad del hospedador

    Genes ortlogos a T. parva. Cada color indica uno de los 4 cromosomas de este parsito.

    1: rojo, 2:verde, 3: azul, 4: naranja

    Genes ves

    Otros genes

    Se observaron grandes bloques de sintenia entre B. bovis y T. parva.

    La sintenia disminuye a medida que nos acercamos a los telmeros

  • Babesia bigemina: genoma en secuenciacin

    Es posible realizar bsquedas

    por BLAST en los contigs

    disponibles.