Upload
others
View
8
Download
0
Embed Size (px)
Citation preview
1
Structure et Analyse des Génomes
O. Lecompte : 10h CM + 6h TDR. Ripp : 4h CM + 6h TD + 3h TPMini-projet : travail personnel+ 3h TP R. Ripp
O. LecompteLaboratoire de Bioinformatique et Génomique Intégratives – IGBMC
http://www-bio3d-igbmc.u-strasbg.fr/~lecompte/enseignement.html
Plan
1 Génomes complets1. Génomes complets
2. Architecture des génomes Procaryotes et eucaryotes Organelles - Endosymbiose
3. Annotation des génomes Localisation des éléments génétiques Annotation fonctionnelle Intégration
2
Définitions
Génome :l’ensemble du contenu en ADN d’une cellule (haploïde)=> l’ensemble des gènes et des régions intergéniques
Génomique :étude multidisciplinaire de la structure et de la fonction des génomesp g
- Cartographie et séquençage des génomes- Localisation des éléments génétiques- Caractérisation fonctionnelle- Comparaison des génomes- Modélisation des systèmes biologiques
Le séquençage des génomes
1995 Haemophilus influenzae1996 Saccharomyces cerevisiae1998 Caenorhabditis elegans2001 Version préliminaire du génome humain2011 > 1500 génomes procaryotes et eucaryotes disponibles…
~ 2350 virus 2350 virushttp://www.ebi.ac.uk/genomes/virus.html
~ 650 phageshttp://www.ebi.ac.uk/genomes/phage.html
~ 2650 organelleshttp://www.ebi.ac.uk/genomes/organelle.html
3
GOLD (http://www.genomesonline.org)
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genomeprj
4
http://www.ebi.ac.uk/genomes/
5
Projets génomesArchaea Bacteria Eukarya
310 projets 6600 projets 1850 projets
84%60%
Total : 5 phyla
Total : 30 phyla
Total : 54 phyla
Les génomes procaryotesFunding relevance of Bacterial Genome Projects
6
Les génomes bactériens
Les bactéries pathogènes
Bactéries utilisées en biotechnologie et/ou industrie:- enzymes et d’antibiotiques : Bacillus subtilis, Streptomyces coelicolor- acides aminés : Corynebacterium glutamicum- solvants : Clostridium acetobutylicum- produits laitiers : Lactococcus lactis- création de plantes transgéniques : Agrobacterium tumefasciens
p g- de mammifères : Mycobacterium, Mycoplasma, Salmonella…- de plantes : Ralstonia, Xanthomonas…
p g q g f- traitement des eaux usées : Caulobacter crescentus
Espèces présentant un intérêt évolutif :- bactéries photosynthétiques : Synechocystis- bactéries endosymbiotiques : Buchnera aphidicola- espèces situées à la base de la lignée bactérienne : Aquifex aeolicus
Recherche de cibles à partir du génome
D’après Fraser, 2000
test de l’activitéimmunogène
7
Séquençage de multiples souchesexemple : Staphylococcus aureus
N315 (MRSA) 2 813 Kb 2 594 ORFs 2001 Mu50 (VRSA) 2 878 Kb 2 697 ORFs 2001 aureus MW2 2 820 Kb 2 632 ORFs 2002 MRSA252 2 902 Kb 2 634 ORFs 2004 MSSA476 2 820 Kb 2 597 ORFs 2004 aureus COL 2 809 Kb 2 618 ORFs 2005 RF122 bovine 2 515 Kb 2 665 ORFs 2005
aureus USA300 2 872 Kb 2 560 ORFs 2006 14 souches aureus USA300 2 872 Kb 2 560 ORFs 2006 NCTC 8325 2 969 Kb 2 892 ORFs 2006 aureus Newman 2 878 Kb 2 615 ORFs 2007 JHI VISA 2 906 Kb 2 747 ORFs 2007 JH9 VISA 2 906 Kb 2 697 ORFs 2007 aureus Mu3 2 880 Kb 2 698 ORFs 2007 aureus MRSA USA300_TCH1516 2 872 Kb 2 657 ORFs 2007
Diversité génétique intraspécifiqueBacillus Streptococcus
Branches proportionnelles à la fraction de gènes non partagés par les différentes souches
B. anthracis, une espèce ? un clone de B. cereus ?
Medini et al., Curr. Opin. Gen Dev, 2005
8
Diversité génétique intraspécifiquesouvent spécifiques à une souche
adaptation à une niche environnementale
beaucoup de fonctions inconnues
translation, réplication, homéostasie énergétique
Bentley, Nature, 2009
Le pan-génome
Pan-génome : le répertoire global de gènes d’une espèce (somme de Pan génome : le répertoire global de gènes d une espèce (somme de tous les gènes présents dans les souches d’une espèce) core genome dispensable genome
Open pan-genomes:multiple environments, multiple ways ofp , p yexchanging genetic material
Closed pan-genomes:isolated niches with limitedaccess to the global microbial gene pool
Medini et al., Curr. Opin. Gen Dev, 2005
9
Les génomes d’archées
A la découverte du domaine inconnu !
Le domaine des Archées- découvertes récemment (milieux extrêmes)- longtemps considérées comme des bactéries atypiques- proposition des 3 domaines en 1990 (Woese)
Particularités physiologiques
A la découverte du domaine inconnu !
Cliché IFREMER
Particularités physiologiques- hyperthermophiles : Pyrococcus- halophiles : Halobacterium- acidophiles : Sulfolobus
compréhension des mécanismes biologiques applications biotechnologiques et industrielles
Les génomes d’archées
Et nos origines dans tout ça ?
Bac EucArc Bac EucArc Bac EucArc Bac Euc ArcBac Euc Arc
A B C D E
Bac EucArc Bac EucArc Bac EucArc Bac Euc ArcBac Euc Arc
A B C D E
Et nos origines dans tout ça ?
Intérêt évolutif : relation entre les 3 domaines du Vivant
10
Les génomes eucaryotes
Des organismes modèles :g
Le génome humain...
Drosophila melanogaster
Arabidopsis thaliana
Caenorhabditis elegans
S. cerevisiae
Caenorhabditis elegans
Mus musculusRattus norvegicus
Tetraodon nigroviridis
Les génomes eucaryotes
Importance agro-alimentaire Evolution au sein d’un groupegroupe des hémiascomycètes (génome compact)
Oryza sativa
Kluyveromyces lactis
Candida glabrata
Espèces pathogènes :E. cuniculi, P. falciparum, P. yoelii, A. gambiae (vecteur),Leishmania, Giardia, Trypanosoma, Entamoeba…
Anopheles gambiaeMagnaporthe grisea (maladie du riz)
11
Génomes eucaryotes
Chordata
Homo sapiens
Mus musculus
Rattus norvegicus
Gallus gallus
Xenopus laevis
Xenopus tropicalis
Xenopus tropicalisCiona intestinalis
Metazoa
Tetraodon nigroviridis
Danio rerio
Fugu (Takifugu) rubripes
Ciona intestinalis
Echinodermata Strongylocentrotus purpuratus
ArthropodaDrosophila melanogaster
Anopheles gambiae
Caenorhabditis elegans
Strongylocentrotus purpuratus
Nematoda
Caenorhabditis elegans
Caenorhabditis briggsae
Brugia malayi
Cnidaria Nematostella vectensis
Placozoa Trichoplax adherens
Choano-flagellates
Monosiga brevicollisNematostella vectensis
Génomes eucaryotes
Trichoplax adherens (Placozoa)
Monosiga brevicollis(Choanoflagellés)
Trichoplax adherens (Placozoa)=> parmi les plus simples des animaux
(Choanoflagellés)=> parmi les unicellulaires les plus proches des animaux
12
Fungi Ascomycetes Schizosaccharomyces pombe
Pichia stipitis
Pichia guilliermondii
Aspergillus clavatus
Aspergillus oryzae
Aspergillus fumigatus
Aspergillus terreus
Coccidioides immitis
Phaeosphaeria nodorum
Fungi
Phaeosphaeria nodorum
Chaetomium globosum
Magnaporthe grisea
Sclerotinia sclerotiorum
Neosartorya fischeri
Botryotinia fuckeliana
Saccharomyces cerevisiae
Lodderomyces elongisporus
Vanderwaltozyma polyspora
Candida glabrata
Kluyveromyces lactis
Ashbya gossypii
Debaryomyces hansenii
Yarrowia lipolytica
Neurospora crassa
Basidiomycetes Cryptococcus neoformans
Ustilago maydis
Microsporidies Encephalitozoon cuniculi
Génomes eucaryotes
Viridiplantae Tracheophyte Arabidopsis thaliana
Oryza sativa
Vitis vinifera
Bryophyte Physcomitrella patens
Chlorophyte Chlamydomonas reinhardtii
Ostreococcus lucimarinus
Ostreococcus tauri
Entamoeba histolytica
Cryptosporidium parvum Rhodophytes Cyanidioschyzon merolae
Stramenopiles Thalassiosira pseudonana
Mycetozoa Dictyostelium discoideum
Entamoebidae Entamoeba histolytica
Parabasalidea Trichomonas vaginalis
Euglenozoa Trypanosoma brucei
Trypanosoma cruzi
Leishmania major
Alveolata Tetrahymena thermophila
Trypanosoma cruzi
Alveolata Tetrahymena thermophila
Plasmodium falciparum
Plasmodium yoelii
Theileria parva
Theileria annulata
Cryptosporidium parvum
Cryptosporidium hominis
Diplomonades Giardia lamblia
13
Génomes eucaryotes : vraiment complets ?
Publication des génomes :
• des “drafts” (séquences préliminaires)...Ex: Oryza sativa, Plasmodium yoelli,…
• des séquences “presque complètes”(régions centromériques et télomériques partielles et gaps)
• des génomes complets Ex: Saccharomyces cerevisiae !
Métagénomes
métagénomique : analyse génomique d’une population
extraction directe d’ADN et clonage => accès aux espèces non cultivables symbiosey espèces pathogènes prélèvements environnementaux ADN ancien
Tringe et Rubin, Nature review genetics, 2005
14
Métagénomes
Analyses réalisées : recherche de marqueur phylogénétique (16S rRNA, gène RecA,…)
=> caractériser les espèces présentes recherche de gène d’intérêt : séquençage aléatoire, recherche de gènes cibles puis ancrage phylogénétique (recherche de marqueurs phylogénétiques à proximité) assemblage de génomes (pour des milieux pauvres) …
Métagénomespaléogénomique : séquençage d’ADN ancien
Tringe et Rubin, Nature review genetics, 2005
15
Projets métagénomes
Plan
1 Génomes complets1. Génomes complets
2. Architecture des génomes Procaryotes et eucaryotes Organelles - Endosymbiose
3. Annotation des génomes Localisation des éléments génétiques Annotation fonctionnelle Intégration
16
Organisation du génome des ProcaryotesOrganisation typique:
• un chromosome circulaire unique• parfois un ou plusieurs plasmides
Kleerebezem et al. PNAS 2003
Organisation du génome chez les Procaryotes
Plasmide :Plasmide : molécule d’ADN, généralement circulaire, douée de réplication autonome et transmise au cours des générations certains plasmides peuvent s’intégrer au chromosome, d’autres restent indépendants portent souvent des gènes non essentiels dans des conditions « normales » certains ont la possibilité de passer d’une cellule à l’autre (y compris entre espèces)
17
Organisation du génome chez les Procaryotes
Organisation du génome chez les Procaryotes
5’ -GATCTNTTNTTTT- 3’ 5’ –TT(A,T)T(A,C)CA(A,C)A- 3’
Une seule origine de réplication (OriC) chez E. coli (~250 pb)
Reconnaissance de origine de réplication par la protéine DnaA > ouverture de la double héliceReconnaissance de origine de réplication par la protéine DnaA => ouverture de la double hélice…
18
Organisation du génome chez les Procaryotes
Une situation plus complexe chez les Archaea…
Kelman & Kelman, Trends in Microbiology 2004
Organisation du génome chez les Eucaryotes
L é lé iLe génome nucléaire• des chromosomes linéaires en nombre variable• le nombre de chromosomes n’est pas relié à :
• la complexité de l’organisme• la taille du génome
exemple : 16 chromosomes chez la levure, 6 chez la drosophile
Le génome des organellesmitochondries chloroplastes
19
Génome des mitochondriesADN généralement circulaire (linéaire chez Chlamydomonas, Paramecium, certaines levures…)
taille du génome et nb de gènes très variables :5 gènes chez Plasmodium falciparum 92 gènes chez Reclinomonas americana
beaucoup de protéines mitochondriales sont codées par le génome nucléaire
Génome mitochondrial humain
Taille du génome des mitochondries
20
Origine endosymbiotique des mitochondries
Molecular Biology of the cell Alberts et al.2002
Origine endosymbiotique des mitochondries
Groupe des Rickettsia
Gray, Nature 1998small SU ribosomal RNA tree
Mitochondries
21
Génome des mitochondries
Gènes impliq és dans la s nthèse d’ATP che Ri k tt i kiiGènes impliqués dans la synthèse d’ATP chez Rickettsia prowazekiiet chez la mitochondrie de Reclinomonas americana
Andersson et al. Nature 1998
conservation de certains clusters de gènes proximité phylogénétique
Origine des mitochondriesAbsence de mitochondries chez certains eucaryotes
Entamoeba, Giardia, Trichomonas, Microsporidies…
2 hypothèses :• acquisition de la mitochondrie après la divergence de certaines lignées primitives ?• acquisition de mitochondrie participerait à l’émergence des Eucaryotes
et perte secondaire de la mitochondrie dans certaines lignées ?
Molecular Biology of the cell Alberts et al.2002
22
Génome des chloroplastes
une cyanobactérie (bactérie photosynthétique) serait à l’origine
des chloroplastes actuels
Hypothèse de l’endosymbiose
Génome des chloroplastes
Génome du chloroplaste du riz
23
Gé d l h red alga
non photosynthetic host
Génome du nucleomorphe de Guillardia theta
6 chromosomes, 551264 pb, 464 gènes
red alga
Douglas et al. Nature 2001
Taille
C-value:contenu en ADN d’une cellule haploïde
1 pg=10-12 g => 978 Mb
Gregory, Nature Reviews Genetics 2005
http://www.genomesize.com/
24
Taille des génomes
Annals of Botany 95: 133–146, 2005(x) : nb d’espèces utilisées
Taille du génome chez les animaux:-0,03 pg (30 MB) chez Meloidogyne graminicola (Nématode)-132,83 pg (130GB) chez Protopterus aethiopicus (Poisson)