24
1 Structure et Analyse des Génomes O. Lecompte : 10h CM + 6h TD R. Ripp : 4h CM + 6h TD + 3h TP Mini-projet : travail personnel+ 3h TP R. Ripp O. Lecompte Laboratoire de Bioinformatique et Génomique Intégratives – IGBMC http://www-bio3d-igbmc.u-strasbg.fr/~lecompte/enseignement.html Plan 1 Génomes complets 1. Génomes complets 2. Architecture des génomes Procaryotes et eucaryotes Organelles - Endosymbiose 3. Annotation des génomes Localisation des éléments génétiques Annotation fonctionnelle Intégration

Structure et Analyse des Génomes - LBGI

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Structure et Analyse des Génomes - LBGI

1

Structure et Analyse des Génomes

O. Lecompte : 10h CM + 6h TDR. Ripp : 4h CM + 6h TD + 3h TPMini-projet : travail personnel+ 3h TP R. Ripp

O. LecompteLaboratoire de Bioinformatique et Génomique Intégratives – IGBMC

http://www-bio3d-igbmc.u-strasbg.fr/~lecompte/enseignement.html

Plan

1 Génomes complets1. Génomes complets

2. Architecture des génomes Procaryotes et eucaryotes Organelles - Endosymbiose

3. Annotation des génomes Localisation des éléments génétiques Annotation fonctionnelle Intégration

Page 2: Structure et Analyse des Génomes - LBGI

2

Définitions

Génome :l’ensemble du contenu en ADN d’une cellule (haploïde)=> l’ensemble des gènes et des régions intergéniques

Génomique :étude multidisciplinaire de la structure et de la fonction des génomesp g

- Cartographie et séquençage des génomes- Localisation des éléments génétiques- Caractérisation fonctionnelle- Comparaison des génomes- Modélisation des systèmes biologiques

Le séquençage des génomes

1995 Haemophilus influenzae1996 Saccharomyces cerevisiae1998 Caenorhabditis elegans2001 Version préliminaire du génome humain2011 > 1500 génomes procaryotes et eucaryotes disponibles…

~ 2350 virus 2350 virushttp://www.ebi.ac.uk/genomes/virus.html

~ 650 phageshttp://www.ebi.ac.uk/genomes/phage.html

~ 2650 organelleshttp://www.ebi.ac.uk/genomes/organelle.html

Page 3: Structure et Analyse des Génomes - LBGI

3

GOLD (http://www.genomesonline.org)

http://www.ncbi.nlm.nih.gov/sites/entrez?db=genomeprj

Page 4: Structure et Analyse des Génomes - LBGI

4

http://www.ebi.ac.uk/genomes/

Page 5: Structure et Analyse des Génomes - LBGI

5

Projets génomesArchaea Bacteria Eukarya

310 projets 6600 projets 1850 projets

84%60%

Total : 5 phyla

Total : 30 phyla

Total : 54 phyla

Les génomes procaryotesFunding relevance of Bacterial Genome Projects

Page 6: Structure et Analyse des Génomes - LBGI

6

Les génomes bactériens

Les bactéries pathogènes

Bactéries utilisées en biotechnologie et/ou industrie:- enzymes et d’antibiotiques : Bacillus subtilis, Streptomyces coelicolor- acides aminés : Corynebacterium glutamicum- solvants : Clostridium acetobutylicum- produits laitiers : Lactococcus lactis- création de plantes transgéniques : Agrobacterium tumefasciens

p g- de mammifères : Mycobacterium, Mycoplasma, Salmonella…- de plantes : Ralstonia, Xanthomonas…

p g q g f- traitement des eaux usées : Caulobacter crescentus

Espèces présentant un intérêt évolutif :- bactéries photosynthétiques : Synechocystis- bactéries endosymbiotiques : Buchnera aphidicola- espèces situées à la base de la lignée bactérienne : Aquifex aeolicus

Recherche de cibles à partir du génome

D’après Fraser, 2000

test de l’activitéimmunogène

Page 7: Structure et Analyse des Génomes - LBGI

7

Séquençage de multiples souchesexemple : Staphylococcus aureus

N315 (MRSA) 2 813 Kb 2 594 ORFs 2001 Mu50 (VRSA) 2 878 Kb 2 697 ORFs 2001 aureus MW2 2 820 Kb 2 632 ORFs 2002 MRSA252 2 902 Kb 2 634 ORFs 2004 MSSA476 2 820 Kb 2 597 ORFs 2004 aureus COL 2 809 Kb 2 618 ORFs 2005 RF122 bovine 2 515 Kb 2 665 ORFs 2005

aureus USA300 2 872 Kb 2 560 ORFs 2006 14 souches aureus USA300 2 872 Kb 2 560 ORFs 2006 NCTC 8325 2 969 Kb 2 892 ORFs 2006 aureus Newman 2 878 Kb 2 615 ORFs 2007 JHI VISA 2 906 Kb 2 747 ORFs 2007 JH9 VISA 2 906 Kb 2 697 ORFs 2007 aureus Mu3 2 880 Kb 2 698 ORFs 2007 aureus MRSA USA300_TCH1516 2 872 Kb 2 657 ORFs 2007

Diversité génétique intraspécifiqueBacillus Streptococcus

Branches proportionnelles à la fraction de gènes non partagés par les différentes souches

B. anthracis, une espèce ? un clone de B. cereus ?

Medini et al., Curr. Opin. Gen Dev, 2005

Page 8: Structure et Analyse des Génomes - LBGI

8

Diversité génétique intraspécifiquesouvent spécifiques à une souche

adaptation à une niche environnementale

beaucoup de fonctions inconnues

translation, réplication, homéostasie énergétique

Bentley, Nature, 2009

Le pan-génome

Pan-génome : le répertoire global de gènes d’une espèce (somme de Pan génome : le répertoire global de gènes d une espèce (somme de tous les gènes présents dans les souches d’une espèce) core genome dispensable genome

Open pan-genomes:multiple environments, multiple ways ofp , p yexchanging genetic material

Closed pan-genomes:isolated niches with limitedaccess to the global microbial gene pool

Medini et al., Curr. Opin. Gen Dev, 2005

Page 9: Structure et Analyse des Génomes - LBGI

9

Les génomes d’archées

A la découverte du domaine inconnu !

Le domaine des Archées- découvertes récemment (milieux extrêmes)- longtemps considérées comme des bactéries atypiques- proposition des 3 domaines en 1990 (Woese)

Particularités physiologiques

A la découverte du domaine inconnu !

Cliché IFREMER

Particularités physiologiques- hyperthermophiles : Pyrococcus- halophiles : Halobacterium- acidophiles : Sulfolobus

compréhension des mécanismes biologiques applications biotechnologiques et industrielles

Les génomes d’archées

Et nos origines dans tout ça ?

Bac EucArc Bac EucArc Bac EucArc Bac Euc ArcBac Euc Arc

A B C D E

Bac EucArc Bac EucArc Bac EucArc Bac Euc ArcBac Euc Arc

A B C D E

Et nos origines dans tout ça ?

Intérêt évolutif : relation entre les 3 domaines du Vivant

Page 10: Structure et Analyse des Génomes - LBGI

10

Les génomes eucaryotes

Des organismes modèles :g

Le génome humain...

Drosophila melanogaster

Arabidopsis thaliana

Caenorhabditis elegans

S. cerevisiae

Caenorhabditis elegans

Mus musculusRattus norvegicus

Tetraodon nigroviridis

Les génomes eucaryotes

Importance agro-alimentaire Evolution au sein d’un groupegroupe des hémiascomycètes (génome compact)

Oryza sativa

Kluyveromyces lactis

Candida glabrata

Espèces pathogènes :E. cuniculi, P. falciparum, P. yoelii, A. gambiae (vecteur),Leishmania, Giardia, Trypanosoma, Entamoeba…

Anopheles gambiaeMagnaporthe grisea (maladie du riz)

Page 11: Structure et Analyse des Génomes - LBGI

11

Génomes eucaryotes

Chordata

Homo sapiens

Mus musculus

Rattus norvegicus

Gallus gallus

Xenopus laevis

Xenopus tropicalis

Xenopus tropicalisCiona intestinalis

Metazoa

Tetraodon nigroviridis

Danio rerio

Fugu (Takifugu) rubripes

Ciona intestinalis

Echinodermata Strongylocentrotus purpuratus

ArthropodaDrosophila melanogaster

Anopheles gambiae

Caenorhabditis elegans

Strongylocentrotus purpuratus

Nematoda

Caenorhabditis elegans

Caenorhabditis briggsae

Brugia malayi

Cnidaria Nematostella vectensis

Placozoa Trichoplax adherens

Choano-flagellates

Monosiga brevicollisNematostella vectensis

Génomes eucaryotes

Trichoplax adherens (Placozoa)

Monosiga brevicollis(Choanoflagellés)

Trichoplax adherens (Placozoa)=> parmi les plus simples des animaux

(Choanoflagellés)=> parmi les unicellulaires les plus proches des animaux

Page 12: Structure et Analyse des Génomes - LBGI

12

Fungi Ascomycetes Schizosaccharomyces pombe

Pichia stipitis

Pichia guilliermondii

Aspergillus clavatus

Aspergillus oryzae

Aspergillus fumigatus

Aspergillus terreus

Coccidioides immitis

Phaeosphaeria nodorum

Fungi

Phaeosphaeria nodorum

Chaetomium globosum

Magnaporthe grisea

Sclerotinia sclerotiorum

Neosartorya fischeri

Botryotinia fuckeliana

Saccharomyces cerevisiae

Lodderomyces elongisporus

Vanderwaltozyma polyspora

Candida glabrata

Kluyveromyces lactis

Ashbya gossypii

Debaryomyces hansenii

Yarrowia lipolytica

Neurospora crassa

Basidiomycetes Cryptococcus neoformans

Ustilago maydis

Microsporidies Encephalitozoon cuniculi

Génomes eucaryotes

Viridiplantae Tracheophyte Arabidopsis thaliana

Oryza sativa

Vitis vinifera

Bryophyte Physcomitrella patens

Chlorophyte Chlamydomonas reinhardtii

Ostreococcus lucimarinus

Ostreococcus tauri

Entamoeba histolytica

Cryptosporidium parvum Rhodophytes Cyanidioschyzon merolae

Stramenopiles Thalassiosira pseudonana

Mycetozoa Dictyostelium discoideum

Entamoebidae Entamoeba histolytica

Parabasalidea Trichomonas vaginalis

Euglenozoa Trypanosoma brucei

Trypanosoma cruzi

Leishmania major

Alveolata Tetrahymena thermophila

Trypanosoma cruzi

Alveolata Tetrahymena thermophila

Plasmodium falciparum

Plasmodium yoelii

Theileria parva

Theileria annulata

Cryptosporidium parvum

Cryptosporidium hominis

Diplomonades Giardia lamblia

Page 13: Structure et Analyse des Génomes - LBGI

13

Génomes eucaryotes : vraiment complets ?

Publication des génomes :

• des “drafts” (séquences préliminaires)...Ex: Oryza sativa, Plasmodium yoelli,…

• des séquences “presque complètes”(régions centromériques et télomériques partielles et gaps)

• des génomes complets Ex: Saccharomyces cerevisiae !

Métagénomes

métagénomique : analyse génomique d’une population

extraction directe d’ADN et clonage => accès aux espèces non cultivables symbiosey espèces pathogènes prélèvements environnementaux ADN ancien

Tringe et Rubin, Nature review genetics, 2005

Page 14: Structure et Analyse des Génomes - LBGI

14

Métagénomes

Analyses réalisées : recherche de marqueur phylogénétique (16S rRNA, gène RecA,…)

=> caractériser les espèces présentes recherche de gène d’intérêt : séquençage aléatoire, recherche de gènes cibles puis ancrage phylogénétique (recherche de marqueurs phylogénétiques à proximité) assemblage de génomes (pour des milieux pauvres) …

Métagénomespaléogénomique : séquençage d’ADN ancien

Tringe et Rubin, Nature review genetics, 2005

Page 15: Structure et Analyse des Génomes - LBGI

15

Projets métagénomes

Plan

1 Génomes complets1. Génomes complets

2. Architecture des génomes Procaryotes et eucaryotes Organelles - Endosymbiose

3. Annotation des génomes Localisation des éléments génétiques Annotation fonctionnelle Intégration

Page 16: Structure et Analyse des Génomes - LBGI

16

Organisation du génome des ProcaryotesOrganisation typique:

• un chromosome circulaire unique• parfois un ou plusieurs plasmides

Kleerebezem et al. PNAS 2003

Organisation du génome chez les Procaryotes

Plasmide :Plasmide : molécule d’ADN, généralement circulaire, douée de réplication autonome et transmise au cours des générations certains plasmides peuvent s’intégrer au chromosome, d’autres restent indépendants portent souvent des gènes non essentiels dans des conditions « normales » certains ont la possibilité de passer d’une cellule à l’autre (y compris entre espèces)

Page 17: Structure et Analyse des Génomes - LBGI

17

Organisation du génome chez les Procaryotes

Organisation du génome chez les Procaryotes

5’ -GATCTNTTNTTTT- 3’ 5’ –TT(A,T)T(A,C)CA(A,C)A- 3’

Une seule origine de réplication (OriC) chez E. coli (~250 pb)

Reconnaissance de origine de réplication par la protéine DnaA > ouverture de la double héliceReconnaissance de origine de réplication par la protéine DnaA => ouverture de la double hélice…

Page 18: Structure et Analyse des Génomes - LBGI

18

Organisation du génome chez les Procaryotes

Une situation plus complexe chez les Archaea…

Kelman & Kelman, Trends in Microbiology 2004

Organisation du génome chez les Eucaryotes

L é lé iLe génome nucléaire• des chromosomes linéaires en nombre variable• le nombre de chromosomes n’est pas relié à :

• la complexité de l’organisme• la taille du génome

exemple : 16 chromosomes chez la levure, 6 chez la drosophile

Le génome des organellesmitochondries chloroplastes

Page 19: Structure et Analyse des Génomes - LBGI

19

Génome des mitochondriesADN généralement circulaire (linéaire chez Chlamydomonas, Paramecium, certaines levures…)

taille du génome et nb de gènes très variables :5 gènes chez Plasmodium falciparum 92 gènes chez Reclinomonas americana

beaucoup de protéines mitochondriales sont codées par le génome nucléaire

Génome mitochondrial humain

Taille du génome des mitochondries

Page 20: Structure et Analyse des Génomes - LBGI

20

Origine endosymbiotique des mitochondries

Molecular Biology of the cell Alberts et al.2002

Origine endosymbiotique des mitochondries

Groupe des Rickettsia

Gray, Nature 1998small SU ribosomal RNA tree

Mitochondries

Page 21: Structure et Analyse des Génomes - LBGI

21

Génome des mitochondries

Gènes impliq és dans la s nthèse d’ATP che Ri k tt i kiiGènes impliqués dans la synthèse d’ATP chez Rickettsia prowazekiiet chez la mitochondrie de Reclinomonas americana

Andersson et al. Nature 1998

conservation de certains clusters de gènes proximité phylogénétique

Origine des mitochondriesAbsence de mitochondries chez certains eucaryotes

Entamoeba, Giardia, Trichomonas, Microsporidies…

2 hypothèses :• acquisition de la mitochondrie après la divergence de certaines lignées primitives ?• acquisition de mitochondrie participerait à l’émergence des Eucaryotes

et perte secondaire de la mitochondrie dans certaines lignées ?

Molecular Biology of the cell Alberts et al.2002

Page 22: Structure et Analyse des Génomes - LBGI

22

Génome des chloroplastes

une cyanobactérie (bactérie photosynthétique) serait à l’origine

des chloroplastes actuels

Hypothèse de l’endosymbiose

Génome des chloroplastes

Génome du chloroplaste du riz

Page 23: Structure et Analyse des Génomes - LBGI

23

Gé d l h red alga

non photosynthetic host

Génome du nucleomorphe de Guillardia theta

6 chromosomes, 551264 pb, 464 gènes

red alga

Douglas et al. Nature 2001

Taille

C-value:contenu en ADN d’une cellule haploïde

1 pg=10-12 g => 978 Mb

Gregory, Nature Reviews Genetics 2005

http://www.genomesize.com/

Page 24: Structure et Analyse des Génomes - LBGI

24

Taille des génomes

Annals of Botany 95: 133–146, 2005(x) : nb d’espèces utilisées

Taille du génome chez les animaux:-0,03 pg (30 MB) chez Meloidogyne graminicola (Nématode)-132,83 pg (130GB) chez Protopterus aethiopicus (Poisson)