Upload
jolanda-forti
View
217
Download
0
Embed Size (px)
Citation preview
GENOMICA DEL BACILLO TUBERCOLARE
Laura Rindi
Dipartimento di Patologia Sperimentale, Biotecnologie Mediche
Infettivologia ed Epidemiologia - Università di Pisa
branca della biologia molecolare che si occupa dello studio del genoma degli organismi
studio della struttura, contenuto, funzione ed evoluzione del genoma
Genomica comparativa → approccio che consente l’identificazione di variazioni genetiche tra gli organismi che possono spiegare differenze nella fisiologia, biochimica e virulenza
GENOMICA
…….The genome comprises 4,411,529 base pairs, contains around 4,000 genes, and has a very high guanine + cytosine content that is reflected in the biased amino-acid content of the proteins. M. tuberculosis differs radically from other bacteria in that a very large portion of its coding capacity is devoted to the production of enzymes involved in lipogenesis and lipolysis, and to two new families of glycine-rich proteins with a repetitive structure that may represent a source of antigenic variation.
Nature 393, 537-544, 1998
Deciphering the biology of Mycobacterium tuberculosis from the complete genome sequence
S. T. Cole, et al.
Circular map of the chromosome of M. tuberculosis H37Rv
G + C content, with <65% G + C in yellow, and >65% G + C in red.
Scale in Mb, with 0 representing the origin of replication.Positions of stable RNA genes (tRNAs are
blue, others are pink) and the direct repeat region (pink cube);
coding sequence by strand (clockwise, dark green; anti-clockwise, light green);
repetitive DNA (insertion sequences, orange; 13E12 REP family, dark pink; prophage, blue);
PPE family members (green);
PE family members (purple, excluding PGRS);
PGRS sequences (dark red)
+ 82 geni
... Here the complete re-annotation of the genome sequence of Mycobacterium
tuberculosis strain H37Rv is presented almost 4 years after the first submission. Eighty-two new protein-coding sequences (CDS) have been included and 22 of these have a predicted function. .. The functional classification of 643 CDS has been changed based principally on recent sequence comparisons and new experimental data from the literature. More than 300 gene names and over 1000 targeted citations have been added and the lengths of 60 genes have been modified. Presently, it is possible to assign a function to 2058 proteins (52% of the 3995 proteins predicted) and only 376 putative proteins share no homology with known proteins and thus could be unique to M. tuberculosis.
Microbiology 148, 2967-2973, 2002
Re-annotation of the genome sequence of Mycobacterium tuberculosis H37Rv
J. C. Camus, et al.
Nature 393, 537-544, 1998
Deciphering the biology of Mycobacterium tuberculosis from the complete genome sequence
S. T. Cole, et al.
CARATTERISTICHE DEL GENOMA DI M. TUBERCULOSIS H37Rv
4.411.532 bp
G+C 65.6%
4.000 geni codificanti proteine
50 geni codificanti RNA stabile
Oltre il 51% dei geni è derivato dalla duplicazione genica
Il 3.4% del genoma è composto da sequenze di inserzione e profagi
52% funzione definita
48% funzione ipotetica o sconosciuta
CLASSIFICAZIONE FUNZIONALE DEI GENI DI M. TUBERCULOSIS H37Rv
CLASSE FUNZIONENUMERO DI GENI
0 Virulence, detoxification, adaptation 99
1 Lipid metabolism 233
2 Information pathways 229
3 Cell wall and cell processes 708
4 Stable RNAs 50
5 Insertion sequences and phages 149
6 PE and PPE proteins 170
7 Intermediary metabolism and respiration
894
8 Proteins of unknown function 272
9 Regulatory proteins 189
10 Conserved hypothetical proteins 1051
METABOLISMO LIPIDICO
8% del genoma è dedicato al metabolismo lipidico(oltre 200 enzimi rispetto ai 50 di E.coli)
Lipid metabolism.Degradation of host-cell lipids is vital in the intracellular life of M. tuberculosis. Host-cell membranes provide precursors for many metabolic processes, as well as potential precursors of mycobacterial cell-wall constituents, through the actions of a broad family of b-oxidative enzymes encoded by multiple copies in the genome. These enzymes produce acetyl CoA, which can be converted into many different metabolites and fuel for the bacteria through the actions of the enzymes of the citric acid cycle and the glyoxylate shunt of this cycle.
PROTEINE PE E PPE
7% dei geni codifica per due nuove famiglie di proteine ricche in glicina
Ruolo immunologico
SEQUENZE DI DNA RIPETUTE
Duplicazioni di geni/famiglie di geni
Sequenze di inserzione
Sequenze non codificanti disperse
Sequenze di DNA ripetute: SEQUENZE DI INSERZIONE
Le sequenze di inserzione (IS) sono piccoli segmenti di DNA (<2.5kb) in grado di inserirsi in siti multipli del genoma.
Il genoma di M. tuberculosis H37Rv contiene 56 copie di elementi IS appartenenti ad almeno 9 famiglie.
transposasi
FAMIGLIA IS MEMBRI IN M. TUBERCULOSIS
IS3 IS6110 (16), IS1540, IS1604
IS5 IS1560, IS1560’, IS-like (2)
IS21 IS1532, IS1533, IS1534
IS30 IS1603
IS110 IS1547 (2), IS1558, IS1558’, IS1607, IS1608’ (2)
IS256 IS1081 (6), IS1552’, IS1553, IS1554
IS1535 IS1535, IS1536, IS1537, IS1538, IS1539, IS1602, IS1605’’
ISL3 IS1555, IS1557 (2), IS1557’, IS1561’, IS1606’’
ignota IS1556
Ad eccezione di IS6110, che traspone “frequentemente”, gli elementi IS sono stabili in H37Rv e in altri isolati.
Sequenze di DNA ripetute: SEQUENZE NON CODIFICANTI DISPERSE
MIRU : mycobacterial interspersed repetitive unit.41 locidimensioni 40-100 bp
Locus DR : direct repeat.
Sequenze ripetute di 36 bp separate da sequenze non ripetute (spacers) di 36-41 bp
http://genolist.pasteur.fr/TubercuList
ORGANISM SIZE GC CONTENT PUBLICATION
Mycobacterium tuberculosis H37Rv (lab strain)
4411 Kb4060 orfs
65.6Nature 393,537-544
1998-06-11
Mycobacterium leprae TN3268 Kb
2749 orfs57.8
Nature 409, 1007-10112001-02-22
Mycobacterium tuberculosis CDC1551 (Oshkosh)
4403 Kb4346 orfs
65.6J Bacteriol 184, 5479-90
2001-10-02
Mycobacterium bovis AF2122/97(spoligotype 9)
4345 Kb4012 orfs
65.6PNAS 100, 7877-7882
2003-06-24
Mycobacterium avium paratuberculosis K-10
4829 Kb4415 orfs
69.3PNAS 102, 12344-9
2004-01-30
Mycobacterium sp MCS5705 Kb
5752 orfs68
Unpublished2006-06-09
Mycobacterium smegmatis MC2 1556988 Kb
6978 orfs67.4
Unpublished2006-11-20
Mycobacterium avium 1045475 Kb
5339 orfs69
Unpublished2006-11-20
Mycobacterium ulcerans Agy995631 Kb
4291 orfs65.5
Genome Res 17, 192-2002006-12-01
Mycobacterium sp KMS5737 Kb
6133 orfs68.4
Unpublished2006-12-20
Mycobacterium vanbaalenii PYR-16491 Kb
6092 orfs67.8
Unpublished2006-12-27
Mycobacterium bovis BCG Pasteur 1173P24374 Kb
4033 orfs65.6
Unpublished2007-01-08
Mycobacterium sp JLS6048 Kb
5899 orfs68
Unpublished2007-02-27
Mycobacterium flavenscens (gilvum) PYR-GCK
5619 Kb5723 orfs
67Unpublished2007-04-12
Mycobacterium tuberculosis H37Ra4419 Kb
4132 orfs65.6
PLoS ONE 3, e23752007-06-01
Mycobacterium tuberculosis F11 (ExPEC)4424 Kb
4050 orfs65.6
Unpublished2007-06-07
Mycobacterium abscessus CIP 1045365067 Kb
5041 orfs64
Unpublished2008-03-01
Mycobacterium marinum M, ATCC BAA-5356636 Kb
5550 orfs65
Genome Res. Epub2008-04-15
34 ceppi micobatterici completamente sequenziati
47 ceppi del complesso tubercolare in corso di sequenziamento
http://www.genomesonline.org/gold.cgi
M. tuberculosis complex
AF2122/97H37RvCDC1551
H37Ra
M. tuberculosis M. africanum
M. canettii
M. microti M. bovis M. bovis BCG BCG-Pasteur
4.41 Mb
4.32 Mb
4.31Mb
in corso in corso in corso
Tutti i micobatteri appartenenti al complesso tubercolare condividono il 99.9% di identità a
livello nucleotidico, ma differiscono ampiamente in termini di spettro d’ospite e di
patogenicità
PLASTICITA’ DEL
GENOMA
polimorfismi di singoli
nucleotidi
eventi di inserzione e
delezione
J. Bacteriol, 184, 5479-90, 2002
Whole-Genome Comparison of Mycobacterium tuberculosis Clinical and Laboratory Strains R. D. Fleischmann et al.
PNAS, 100, 7877-82, 2003
The complete genome sequence of Mycobacterium bovis T. Garnier et al.
Caratteristiche M. tuberculosis H37Rv
M. tuberculosis CDC1551
M. bovis AF2122/97
Dimensioni del genoma, bp 4.411.532 4.403.836 4.345.492
G+C, % 65.6 65.6 65.6
Geni codificanti per proteine
3.995 4.249 3.951
Rispetto a Mtb H37Rv:
polimorfismi singoli - 1135 2348
delezioni - 72 117
inserzioni - 63 108
Il genoma di M. bovis AF2122/97 (identico per oltre il 99.5% a quello di M tuberculosis H37Rv) rispetto a quelli dei due ceppi tubercolari è più piccolo di 70 kb e contiene circa 60 geni in meno.
Il 55% delle inserzioni e delezioni tra i due ceppi tubercolari riguardano geni, soprattutto quelli codificanti per le proteine PE e PPE.
La variabilità tra M. bovis e Mtb riguarda prevalentemente componenti della parete cellulare e proteine di secrezione.
Regioni genomiche che differiscono tra M. tuberculosis H37Rv e M. bovis BCG Pasteur
(phiRv2)
(phiRv1)
(fosfolipasi C)
(invasina)
(Esat-6, CFP-10)
Scheme of the proposed evolutionary pathway of the tubercle bacilli illustrating successive loss of DNA in certain lineages (gray boxes). The scheme is based on the presence or absence of conserved deleted regions and on sequence polymorphisms in five selected genes. Note that the distances between certain branches may not correspond to actual phylogenetic differences calculated by other methods. Blue arrows indicate that strains are characterized by katG463. CTG (Leu), gyrA95 ACC (Thr), typical for group 1 organisms. Green arrows indicate that strains belong to group 2 characterized by katG463 CGG (Arg), gyrA95 ACC (Thr). The red arrow indicates that strains belong to group 3, characterized by katG463 CGG (Arg), gyrA95 AGC (Ser), as defined by Sreevatsan et al.
Brosch et al. 2002 PNAS 99:3684-9.
Evoluzione del complesso tubercolareEvoluzione del complesso tubercolare
M. bovis
M. tuberculosis
X
bacillo progenitore
M. bovis M. tuberculosis
Evoluzione del complesso tubercolareEvoluzione del complesso tubercolare
oxyR n285 GA
M. africanum
RD 7RD 8
RD 10
RD 12
RD 13
M. canettii
RD 9
M. tub.katG 463 CTGCGG
M. microti
M. bovis
RDcan
RDmic
RDseal
seal
oryx
goat
“classical”RD 1
BCG Tokyo
gyrA 95AGCACC
pncAc57CACGAC
RD 4
RD 2
BCG Pasteur
RD 14
TbD 1
“modern”
“ancestral”
RD9 +
TbD1 -mmpL6 551AACAAG
eg. Beijing cluster
eg. Haarlem cluster
eg. H37Rv
Identificazione rapida del bacillo tubercolareIdentificazione rapida del bacillo tubercolare
oxyR n285 GA
M. africanum
RD 7RD 8
RD 10
RD 12
RD 13
M. canettii
RD 9M. tub.katG 463 CTGCGG
M. microti
M. bovis
RDcan
RDmic
RDseal
seal-isolates
oryx-isolates
goat-isolates
“classical”RD 1
BCG Tokyo
gyrA 95AGCACC
pncAc57CACGAC
RD 4
RD 2
BCG Pasteur
RD 14
TbD 1
“mo
de
rn”
“ancestral”
RD9 -
mmpL6 551AACAAG
Identificazione rapida del bacillo tubercolareIdentificazione rapida del bacillo tubercolare
oxyR n285 GA
M. africanum
RD 7RD 8
RD 10
RD 12
RD 13
M. canettii
RD 9M. tub.katG 463 CTGCGG
M. microti
M. bovis
RDcan
RDmic
RDseal
“classical”RD 1
BCG Tokyo
gyrA 95AGCACC
pncA 57CACGAC
RD 4
RD 2
BCG Pasteur
RD 14
TbD 1
“mo
de
rn”
“ancestral”
RD9 -
mmpL6 551AACAAG
mmpL6 551 AAG
seal-isolates
oryx-isolates
goat-isolates
Identificazione rapida del bacillo tubercolareIdentificazione rapida del bacillo tubercolare
oxyR n285 GA
M. africanum
RD 7RD 8
RD 10
RD 12
RD 13
M. canettii
RD 9M. tub.katG 463 CTGCGG
M. microti
M. bovis
RDcan
RDmic
RDseal
seal
oryx
goat
“classical”RD 1
BCG Tokyo
gyrA 95AGCACC
pncA 57CACGAC
RD 4
RD 2
BCG Pasteur
RD 14
TbD 1
“mo
de
rn”
“ancestral”
RD9 -
mmpL6 551AACAAG
RD4 -
Identificazione rapida del bacillo tubercolareIdentificazione rapida del bacillo tubercolare
oxyR n285 GA
M. africanum
RD 7RD 8
RD 10
RD 12
RD 13
M. canettii
RD 9M. tub.katG 463 CTGCGG
M. microti
M. bovis
RDcan
RDmic
RDseal
seal
oryx
goat
“classical”RD 1
BCG
gyrA 95AGCACC
pncA 57CACGAC
RD 4
RD 2
RD 14
TbD 1
“mo
de
rn”
“ancestral”
RD9 -
mmpL6 551AACAAG
RD1 -
Identificazione rapida del bacillo tubercolareIdentificazione rapida del bacillo tubercolare
The composite MtbC PCR typing panel. Illustrated are the typical MtbC PCR panel typing results for a single representative of each MtbC subspecies as well as MOTT (M. avium subsp. avium is shown). Lanes: 1, 16S rRNA; 2, Rv0577; 3, IS1561'; 4, Rv1510 (RD4); 5, Rv1970 (RD7); 6, Rv3877/8 (RD1); 7, Rv3120 (RD12).
J. Clin. Microbiol. 41, 1637-1650, 2003
PCR-Based Method To Differentiate the Subspecies of the Mycobacterium tuberculosis Complex on the Basis of Genomic Deletions
R. C. Huard, et al.
EVOLUZIONE DI MYCOBACTERIUM TUBERCULOSIS
Gagneux S. et.al. PNAS 2006;103:2869-2873
ERA POST-ERA POST-GENOMICAGENOMICA
CARATTERIZZAZIONE GENOMICA
GENOMICA COMPARATIVA
Identificazione di fattori di virulenza (confronto genoma Mtb/BCG) e di antigeni (proteine PE/PPE) →comprensione dei meccanismi di patogenicità e sviluppo di nuovi vaccini
Allestimento di test diagnostici rapidi (identificazione delle specie del complesso tubercolare; diagnosi immunologica di infezione latente)
Identificazione di molecole essenziali, potenziali bersagli per nuovi farmaci
Studi evoluzionistici e di epidemiologia molecolareSviluppo di migliori strategie di controllo dell’infezione tubercolare