28
GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università di Pisa

GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

Embed Size (px)

Citation preview

Page 1: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

GENOMICA DEL BACILLO TUBERCOLARE

Laura Rindi

Dipartimento di Patologia Sperimentale, Biotecnologie Mediche

Infettivologia ed Epidemiologia - Università di Pisa

Page 2: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

branca della biologia molecolare che si occupa dello studio del genoma degli organismi

studio della struttura, contenuto, funzione ed evoluzione del genoma

Genomica comparativa → approccio che consente l’identificazione di variazioni genetiche tra gli organismi che possono spiegare differenze nella fisiologia, biochimica e virulenza

GENOMICA

Page 3: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

…….The genome comprises 4,411,529 base pairs, contains around 4,000 genes, and has a very high guanine + cytosine content that is reflected in the biased amino-acid content of the proteins. M. tuberculosis differs radically from other bacteria in that a very large portion of its coding capacity is devoted to the production of enzymes involved in lipogenesis and lipolysis, and to two new families of glycine-rich proteins with a repetitive structure that may represent a source of antigenic variation.

Nature 393, 537-544, 1998

Deciphering the biology of Mycobacterium tuberculosis from the complete genome sequence

S. T. Cole, et al.

Page 4: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

Circular map of the chromosome of M. tuberculosis H37Rv

G + C content, with <65% G + C in yellow, and >65% G + C in red.

Scale in Mb, with 0 representing the origin of replication.Positions of stable RNA genes (tRNAs are

blue, others are pink) and the direct repeat region (pink cube);

coding sequence by strand (clockwise, dark green; anti-clockwise, light green);

repetitive DNA (insertion sequences, orange; 13E12 REP family, dark pink; prophage, blue);

PPE family members (green);

PE family members (purple, excluding PGRS);

PGRS sequences (dark red)

Page 5: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

+ 82 geni

... Here the complete re-annotation of the genome sequence of Mycobacterium

tuberculosis strain H37Rv is presented almost 4 years after the first submission. Eighty-two new protein-coding sequences (CDS) have been included and 22 of these have a predicted function. .. The functional classification of 643 CDS has been changed based principally on recent sequence comparisons and new experimental data from the literature. More than 300 gene names and over 1000 targeted citations have been added and the lengths of 60 genes have been modified. Presently, it is possible to assign a function to 2058 proteins (52% of the 3995 proteins predicted) and only 376 putative proteins share no homology with known proteins and thus could be unique to M. tuberculosis.

Microbiology 148, 2967-2973, 2002

Re-annotation of the genome sequence of Mycobacterium tuberculosis H37Rv

J. C. Camus, et al.

Nature 393, 537-544, 1998

Deciphering the biology of Mycobacterium tuberculosis from the complete genome sequence

S. T. Cole, et al.

Page 6: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

CARATTERISTICHE DEL GENOMA DI M. TUBERCULOSIS H37Rv

4.411.532 bp

G+C 65.6%

4.000 geni codificanti proteine

50 geni codificanti RNA stabile

Oltre il 51% dei geni è derivato dalla duplicazione genica

Il 3.4% del genoma è composto da sequenze di inserzione e profagi

52% funzione definita

48% funzione ipotetica o sconosciuta

Page 7: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

CLASSIFICAZIONE FUNZIONALE DEI GENI DI M. TUBERCULOSIS H37Rv

CLASSE FUNZIONENUMERO DI GENI

0 Virulence, detoxification, adaptation 99

1 Lipid metabolism 233

2 Information pathways 229

3 Cell wall and cell processes 708

4 Stable RNAs 50

5 Insertion sequences and phages 149

6 PE and PPE proteins 170

7 Intermediary metabolism and respiration

894

8 Proteins of unknown function 272

9 Regulatory proteins 189

10 Conserved hypothetical proteins 1051

Page 8: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

METABOLISMO LIPIDICO

8% del genoma è dedicato al metabolismo lipidico(oltre 200 enzimi rispetto ai 50 di E.coli)

Lipid metabolism.Degradation of host-cell lipids is vital in the intracellular life of M. tuberculosis. Host-cell membranes provide precursors for many metabolic processes, as well as potential precursors of mycobacterial cell-wall constituents, through the actions of a broad family of b-oxidative enzymes encoded by multiple copies in the genome. These enzymes produce acetyl CoA, which can be converted into many different metabolites and fuel for the bacteria through the actions of the enzymes of the citric acid cycle and the glyoxylate shunt of this cycle.

Page 9: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

PROTEINE PE E PPE

7% dei geni codifica per due nuove famiglie di proteine ricche in glicina

Ruolo immunologico

Page 10: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

SEQUENZE DI DNA RIPETUTE

Duplicazioni di geni/famiglie di geni

Sequenze di inserzione

Sequenze non codificanti disperse

Page 11: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

Sequenze di DNA ripetute: SEQUENZE DI INSERZIONE

Le sequenze di inserzione (IS) sono piccoli segmenti di DNA (<2.5kb) in grado di inserirsi in siti multipli del genoma.

Il genoma di M. tuberculosis H37Rv contiene 56 copie di elementi IS appartenenti ad almeno 9 famiglie.

transposasi

FAMIGLIA IS MEMBRI IN M. TUBERCULOSIS

IS3 IS6110 (16), IS1540, IS1604

IS5 IS1560, IS1560’, IS-like (2)

IS21 IS1532, IS1533, IS1534

IS30 IS1603

IS110 IS1547 (2), IS1558, IS1558’, IS1607, IS1608’ (2)

IS256 IS1081 (6), IS1552’, IS1553, IS1554

IS1535 IS1535, IS1536, IS1537, IS1538, IS1539, IS1602, IS1605’’

ISL3 IS1555, IS1557 (2), IS1557’, IS1561’, IS1606’’

ignota IS1556

Ad eccezione di IS6110, che traspone “frequentemente”, gli elementi IS sono stabili in H37Rv e in altri isolati.

Page 12: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

Sequenze di DNA ripetute: SEQUENZE NON CODIFICANTI DISPERSE

MIRU : mycobacterial interspersed repetitive unit.41 locidimensioni 40-100 bp

Locus DR : direct repeat.

Sequenze ripetute di 36 bp separate da sequenze non ripetute (spacers) di 36-41 bp

Page 13: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

http://genolist.pasteur.fr/TubercuList

Page 14: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

ORGANISM SIZE GC CONTENT PUBLICATION

Mycobacterium tuberculosis H37Rv (lab strain)

4411 Kb4060 orfs

65.6Nature 393,537-544

1998-06-11

Mycobacterium leprae TN3268 Kb

2749 orfs57.8

Nature 409, 1007-10112001-02-22

Mycobacterium tuberculosis CDC1551 (Oshkosh)

4403 Kb4346 orfs

65.6J Bacteriol 184, 5479-90

2001-10-02

Mycobacterium bovis AF2122/97(spoligotype 9)

4345 Kb4012 orfs

65.6PNAS 100, 7877-7882

2003-06-24

Mycobacterium avium paratuberculosis K-10

4829 Kb4415 orfs

69.3PNAS 102, 12344-9

2004-01-30

Mycobacterium sp MCS5705 Kb

5752 orfs68

Unpublished2006-06-09

Mycobacterium smegmatis MC2 1556988 Kb

6978 orfs67.4

Unpublished2006-11-20

Mycobacterium avium 1045475 Kb

5339 orfs69

Unpublished2006-11-20

Mycobacterium ulcerans Agy995631 Kb

4291 orfs65.5

Genome Res 17, 192-2002006-12-01

Mycobacterium sp KMS5737 Kb

6133 orfs68.4

Unpublished2006-12-20

Mycobacterium vanbaalenii PYR-16491 Kb

6092 orfs67.8

Unpublished2006-12-27

Mycobacterium bovis BCG Pasteur 1173P24374 Kb

4033 orfs65.6

Unpublished2007-01-08

Mycobacterium sp JLS6048 Kb

5899 orfs68

Unpublished2007-02-27

Mycobacterium flavenscens (gilvum) PYR-GCK

5619 Kb5723 orfs

67Unpublished2007-04-12

Mycobacterium tuberculosis H37Ra4419 Kb

4132 orfs65.6

PLoS ONE 3, e23752007-06-01

Mycobacterium tuberculosis F11 (ExPEC)4424 Kb

4050 orfs65.6

Unpublished2007-06-07

Mycobacterium abscessus CIP 1045365067 Kb

5041 orfs64

Unpublished2008-03-01

Mycobacterium marinum M, ATCC BAA-5356636 Kb

5550 orfs65

Genome Res. Epub2008-04-15

34 ceppi micobatterici completamente sequenziati

47 ceppi del complesso tubercolare in corso di sequenziamento

http://www.genomesonline.org/gold.cgi

Page 15: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

M. tuberculosis complex

AF2122/97H37RvCDC1551

H37Ra

M. tuberculosis M. africanum

M. canettii

M. microti M. bovis M. bovis BCG BCG-Pasteur

4.41 Mb

4.32 Mb

4.31Mb

in corso in corso in corso

Tutti i micobatteri appartenenti al complesso tubercolare condividono il 99.9% di identità a

livello nucleotidico, ma differiscono ampiamente in termini di spettro d’ospite e di

patogenicità

PLASTICITA’ DEL

GENOMA

polimorfismi di singoli

nucleotidi

eventi di inserzione e

delezione

Page 16: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

J. Bacteriol, 184, 5479-90, 2002

Whole-Genome Comparison of Mycobacterium tuberculosis Clinical and Laboratory Strains R. D. Fleischmann et al.

PNAS, 100, 7877-82, 2003

The complete genome sequence of Mycobacterium bovis T. Garnier et al.

Caratteristiche M. tuberculosis H37Rv

M. tuberculosis CDC1551

M. bovis AF2122/97

Dimensioni del genoma, bp 4.411.532 4.403.836 4.345.492

G+C, % 65.6 65.6 65.6

Geni codificanti per proteine

3.995 4.249 3.951

Rispetto a Mtb H37Rv:

polimorfismi singoli - 1135 2348

delezioni - 72 117

inserzioni - 63 108

Il genoma di M. bovis AF2122/97 (identico per oltre il 99.5% a quello di M tuberculosis H37Rv) rispetto a quelli dei due ceppi tubercolari è più piccolo di 70 kb e contiene circa 60 geni in meno.

Il 55% delle inserzioni e delezioni tra i due ceppi tubercolari riguardano geni, soprattutto quelli codificanti per le proteine PE e PPE.

La variabilità tra M. bovis e Mtb riguarda prevalentemente componenti della parete cellulare e proteine di secrezione.

Page 17: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

Regioni genomiche che differiscono tra M. tuberculosis H37Rv e M. bovis BCG Pasteur

(phiRv2)

(phiRv1)

(fosfolipasi C)

(invasina)

(Esat-6, CFP-10)

Page 18: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

Scheme of the proposed evolutionary pathway of the tubercle bacilli illustrating successive loss of DNA in certain lineages (gray boxes). The scheme is based on the presence or absence of conserved deleted regions and on sequence polymorphisms in five selected genes. Note that the distances between certain branches may not correspond to actual phylogenetic differences calculated by other methods. Blue arrows indicate that strains are characterized by katG463. CTG (Leu), gyrA95 ACC (Thr), typical for group 1 organisms. Green arrows indicate that strains belong to group 2 characterized by katG463 CGG (Arg), gyrA95 ACC (Thr). The red arrow indicates that strains belong to group 3, characterized by katG463 CGG (Arg), gyrA95 AGC (Ser), as defined by Sreevatsan et al.

Brosch et al. 2002 PNAS 99:3684-9.

Page 19: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

Evoluzione del complesso tubercolareEvoluzione del complesso tubercolare

M. bovis

M. tuberculosis

X

Page 20: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

bacillo progenitore

M. bovis M. tuberculosis

Evoluzione del complesso tubercolareEvoluzione del complesso tubercolare

Page 21: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

oxyR n285 GA

M. africanum

RD 7RD 8

RD 10

RD 12

RD 13

M. canettii

RD 9

M. tub.katG 463 CTGCGG

M. microti

M. bovis

RDcan

RDmic

RDseal

seal

oryx

goat

“classical”RD 1

BCG Tokyo

gyrA 95AGCACC

pncAc57CACGAC

RD 4

RD 2

BCG Pasteur

RD 14

TbD 1

“modern”

“ancestral”

RD9 +

TbD1 -mmpL6 551AACAAG

eg. Beijing cluster

eg. Haarlem cluster

eg. H37Rv

Identificazione rapida del bacillo tubercolareIdentificazione rapida del bacillo tubercolare

Page 22: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

oxyR n285 GA

M. africanum

RD 7RD 8

RD 10

RD 12

RD 13

M. canettii

RD 9M. tub.katG 463 CTGCGG

M. microti

M. bovis

RDcan

RDmic

RDseal

seal-isolates

oryx-isolates

goat-isolates

“classical”RD 1

BCG Tokyo

gyrA 95AGCACC

pncAc57CACGAC

RD 4

RD 2

BCG Pasteur

RD 14

TbD 1

“mo

de

rn”

“ancestral”

RD9 -

mmpL6 551AACAAG

Identificazione rapida del bacillo tubercolareIdentificazione rapida del bacillo tubercolare

Page 23: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

oxyR n285 GA

M. africanum

RD 7RD 8

RD 10

RD 12

RD 13

M. canettii

RD 9M. tub.katG 463 CTGCGG

M. microti

M. bovis

RDcan

RDmic

RDseal

“classical”RD 1

BCG Tokyo

gyrA 95AGCACC

pncA 57CACGAC

RD 4

RD 2

BCG Pasteur

RD 14

TbD 1

“mo

de

rn”

“ancestral”

RD9 -

mmpL6 551AACAAG

mmpL6 551 AAG

seal-isolates

oryx-isolates

goat-isolates

Identificazione rapida del bacillo tubercolareIdentificazione rapida del bacillo tubercolare

Page 24: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

oxyR n285 GA

M. africanum

RD 7RD 8

RD 10

RD 12

RD 13

M. canettii

RD 9M. tub.katG 463 CTGCGG

M. microti

M. bovis

RDcan

RDmic

RDseal

seal

oryx

goat

“classical”RD 1

BCG Tokyo

gyrA 95AGCACC

pncA 57CACGAC

RD 4

RD 2

BCG Pasteur

RD 14

TbD 1

“mo

de

rn”

“ancestral”

RD9 -

mmpL6 551AACAAG

RD4 -

Identificazione rapida del bacillo tubercolareIdentificazione rapida del bacillo tubercolare

Page 25: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

oxyR n285 GA

M. africanum

RD 7RD 8

RD 10

RD 12

RD 13

M. canettii

RD 9M. tub.katG 463 CTGCGG

M. microti

M. bovis

RDcan

RDmic

RDseal

seal

oryx

goat

“classical”RD 1

BCG

gyrA 95AGCACC

pncA 57CACGAC

RD 4

RD 2

RD 14

TbD 1

“mo

de

rn”

“ancestral”

RD9 -

mmpL6 551AACAAG

RD1 -

Identificazione rapida del bacillo tubercolareIdentificazione rapida del bacillo tubercolare

Page 26: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

The composite MtbC PCR typing panel. Illustrated are the typical MtbC PCR panel typing results for a single representative of each MtbC subspecies as well as MOTT (M. avium subsp. avium is shown). Lanes: 1, 16S rRNA; 2, Rv0577; 3, IS1561'; 4, Rv1510 (RD4); 5, Rv1970 (RD7); 6, Rv3877/8 (RD1); 7, Rv3120 (RD12).

J. Clin. Microbiol. 41, 1637-1650, 2003

PCR-Based Method To Differentiate the Subspecies of the Mycobacterium tuberculosis Complex on the Basis of Genomic Deletions

R. C. Huard, et al.

Page 27: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

EVOLUZIONE DI MYCOBACTERIUM TUBERCULOSIS

Gagneux S. et.al. PNAS 2006;103:2869-2873

Page 28: GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università

ERA POST-ERA POST-GENOMICAGENOMICA

CARATTERIZZAZIONE GENOMICA

GENOMICA COMPARATIVA

Identificazione di fattori di virulenza (confronto genoma Mtb/BCG) e di antigeni (proteine PE/PPE) →comprensione dei meccanismi di patogenicità e sviluppo di nuovi vaccini

Allestimento di test diagnostici rapidi (identificazione delle specie del complesso tubercolare; diagnosi immunologica di infezione latente)

Identificazione di molecole essenziali, potenziali bersagli per nuovi farmaci

Studi evoluzionistici e di epidemiologia molecolareSviluppo di migliori strategie di controllo dell’infezione tubercolare