Enseignements de LBOP Gen3
Cours
• Analyse génétique des caractères à variation continue: la génétique
quantitative, 8 heures, Joël Cuguen
• Génétique des populations approfondie (Xavier Vekemans)
• Evolution moléculaire (Xavier Vekemans)
TD/TP
• Séances de TD/TP de génétique quantitative et de génétique des
populations: exercices d'application
• Support pédagogique disponible sur plateforme Moodle
Licence ST S4-S6 Mention « Sciences de la vie »
• Evaluation: Examen 2 sujets (Cours + TP/TD) Note 50:50
• Responsable UE: Xavier Vekemans, bureau 203, SN2,
• Responsable TD/TP: J-F Arnaud
Thèmes de recherche du laboratoire:
Biologie évolutive et génétique des populations
• Evolution des systèmes de reproduction
– Stérilité mâle cytoplasmique et gynodioecie.
– Evolution des systèmes d'auto incompatibilité
• Génétique de l’adaptation
– Evolution des traits d'histoire de vie (floraison, durée de vie)
– Tolérance aux métaux lourds
• Ecologie et biologie de la conservation d'espèces menacées,
changements climatiques
Ouvrages de référence
• Griffiths, AJF, Gelbart, WM, Miller, JH & Lewontin, RC 2001. Analyse Génétique Moderne. De Boeck Université
• Ridley, M 1997 Evolution Biologique, De Boeck
• Ressources pédagogiques sur le site du laboratoire: http://gepv.univ-lille1.fr
• Réseau d’enseignement en Génétique (GENET) http://www.univ-tours.fr/genet/
Ouvrages de référence (spécialisés)
• Falconer, D. S. and T. F. C. Mackay (1996). Introduction to Quantitative Genetics. London, Prentice Hall.
• Kearsey, M. J. and H. S. Pooni (1996). The Genetical Analysis of Quantitative Traits, Chapman & Hall.
• Lynch, M. and B. Walsh (1998). Genetics and Analysis of Quantitative Traits, Sinauer Associates Inc.
• Verrier E., Brabant P., Gallais A. (2001). Faits et concepts de base en génétique quantitative. Polycopié INA Paris-Grignon, 134 p. http://www.inapg.inra.fr/dsa/uvf/GQ/GQintro.htm
• Crédits: P. Touzet; C. Dillmann & F. Hospital; E. Verrier, Ph. Brabant & A. Gallais…
Génétique des caractères à variation continue:
Introduction
• Essor de la Génétique: dissection du phénotype en caractères unitaires simples (Mendel 1865, Bateson 1902,…)
• Phénotype à variation discontinue ("discrète"), binaire, qualitative; ex. type sauvage / mutant
– Couleur des yeux, groupes sanguins, etc…
• Mais il existe aussi des caractères "complexes", à variation phénotypique continue, quantitative
– Ex: caractères agronomiques, masse, taille, production, maladies, traits adaptatifs Génétique quantitative: génétique des caractères issus d’une mesure
Génétique des caractères à variation continue
Domaines d'applications multiples
• Génétique et amélioration des plantes et des productions animales:
sélection artificielle (dirigée par l'homme)
• Médecine: génétique des maladies multifactorielles
• Ecologie évolutive: génétique des caractères adaptatifs, étude de
l'évolution et de la sélection naturelle
Plan du cours de
génétique des caractères à variation continue
• Introduction
• Exemples de caractères à variation continue
• Les questions spécifiques
• Le modèle multifactoriel infinitésimal de Fisher
• La décomposition de la variation phénotypique
• L'héritabilité
• La sélection
• Les outils statistiques
• L'estimation des paramètres génétiques
• La dissection des caractères quantitatifs
• Les QTL: gènes impliqués dans la variation
• La « génétique d’association »
Les caractères à variation continue
Quelques exemples de caractères à variation
continue
• Caractères biométriques
– Taille des individus, poids, croissance
– Pression artérielle, taux de cholestérol, glycémie
– Nombre de soies de l'abdomen de la drosophile
– Nombre de facettes oculaires
• Caractères agronomiques
– Taille de portée chez les animaux
– Teneur en huile chez le Maïs
– Nombre de grains par épi de Blé
– Date de floraison chez le Blé
• Maladies multifactorielles / maladies "monogéniques"
– Diabète de type II,
– Prédisposition à l'obésité
• Caractères impliqués dans l’adaptation
– Précocité floraison, fertilité, tolérance facteurs du milieu
• …
Exemples de caractères quantitatifs
La distribution de la variation suit une loi normale
tiré de Dillmann et Hospital, 2002
Distribution de la taille d'étudiants de l'université
du Connecticut
Soies abdominales de la Drosophile
Le nombre de soies abdominales est un caractère très étudié car variable, facile
à phénotyper et répondant bien à la sélection
tiré de Hartl, 1994
Génétique des caractères à variation continue:
caractéristiques principales
• Caractères très communs quand on
considère le phénotype d’un organisme
• Variation continue / variation discontinue:
phénotype peu informatif pour comprendre le
contrôle génétique de la variation
• Distribution normale / variation binaire
• Phénotype sensible à l'environnement
• Variation "héritable": ressemblance familiale
transmissible tiré de Kearsey & Pooni, 1998
Génétique des caractères à variation continue:
les questions spécifiques
• Description de la variation quantitative: outils statistiques adaptés
• Modèle statistique de prédiction de l’évolution des caractères quantitatifs sous l'influence de la sélection naturelle ou dirigée par l'homme
– La ressemblance entre individus apparentés
– L'origine génétique de la variation quantitative: le modèle multifactoriel infinitésimal
• Décomposer la variation phénotypique: la notion d'héritabilité
• L'utilisation de l'héritabilité pour la sélection
• L'identification des facteurs génétiques: analyse du déterminisme génétique de la variation des caractères: la recherche des QTL
– Nombre de gènes impliqués
– Répartition dans le génome
– Effets des gènes et caractérisation
Le modèle multifactoriel infinitésimal de Fisher
Questions originelles de la génétique quantitative
• Expliquer la ressemblance entre apparentés pour les caractères à
variation continue (parents / descendants; fratries)
• Comprendre et prédire la réponse à la sélection menée par l’homme
dans le cadre de l’amélioration génétique
Controverse mutationnistes / biométriciens
• William Bateson (1861-1926), généticien éminent, jugeait incompatibles les lois de Mendel et la variation héréditaire des caractères à variation continue, s'opposant en cela vigoureusement à la théorie darwinienne de l'évolution graduelle
• Karl Pearson (1857-1936), statisticien non moins éminent et darwinien convaincu, pensait que les applications des lois de Mendel étaient limitées et n'expliquaient pas la variation des caractères à variation continue
Le modèle infinitésimal de Fisher (1918)
• Annoncé par Yule (1906), East (1910)
• Fisher, R. A. (1918). "The Correlation Between Relatives on the Supposition of Mendelian Inheritance." Philosophical Transactions of the Royal Society of Edinburgh 52: 399-433.
• La ressemblance entre individus apparentés résulte du partage d'allèles en commun
• La variation observée pour les caractères quantitatifs résulte:
– de l'action combinée d'un grand nombre de gènes (infini) à hérédité "mendélienne" individuelle
– de l'influence de "l'environnement"
Sir Ronald Aylmer Fisher (1890-1962)
Généticien et statisticien
• 1890: Born in East Finchley, London.
• 1909: Student at Gonville and Caius College, Cambridge.
• 1917: Married Ruth E. Guiness.
• 1919: Started work as a statistician at Rothamsted Experimental Station.
• 1933: Chair of Eugenics at University College, London.
• 1943: Balfour Professor of Genetics, Cambridge University.
• 1957: President of Gonville and Caius College.
• 1962: Died Adelaide, South Australia.
Bases génétiques de la variation quantitative
tiré
de
Str
ickb
erg
er, 1
98
8
La dominance des allèles ne modifie pas le
principe de convergence vers une
distribution gaussienne de la variation
quantitative
Normalité des caractères quantitatifs
Normalité des caractères quantitatifs
Normalité des caractères quantitatifs
Normalité des caractères quantitatifs
Normalité des caractères quantitatifs
Normalité des caractères quantitatifs
Normalité des caractères quantitatifs
Normalité des caractères quantitatifs
Normalité des caractères quantitatifs
Normalité des caractères quantitatifs
Origine génétique de la variation quantitative
Théorème central limite
Soient X1, X2, …, Xn des variables aléatoires
indépendantes, pas forcément de même loi,
d'espérance µ et de variance
Soit Y la variable aléatoire définie comme la somme
des n variables Xn
Si n ∞, alors Y tend vers une loi normale
Autrement dit, si une variable Y est la résultante
d'un grand nombre de causes, petites, à effet
additif, cette variable suit une loi normale. C'est à
cause de cette interprétation que la loi normale est
très souvent employée comme référence dans
beaucoup de domaines, en particulier en
génétique quantitative
2
i
Bases environnementales de la variation
quantitative
• L’environnement module l’expression
génétique
• Plus cette action est présente et plus
l’expression phénotypique varie
• L’action de l’environnement conduit à
une « normalisation » de la distribution
de la variation phénotypique
tiré
de
Str
ickb
erg
er, 1
98
8
Bases génétiques et environnementales de la
variation quantitative
La normalité de la
distribution de la variation
quantitative des caractères
résulte de l’action combinée
de nombreux gènes et de
l’impact de l’environnement
sur l’expression
phénotypique
Relation phénotype - génotype
• Soient 3 gènes présentant 2 allèles chacun, R1, R2 et R3 codominants impliqués dans la coloration de l'enveloppe du grain de blé. Les allèles R1, R2 et R3 confèrent une production de pigments accrue.
• R1=R2=R3=1,
• b1=b2=b3=0
• On peut donc distinguer 7 phénotypes selon la dose d'allèle R en proportion variables dans une F2 :
Nombre
d'allèles R 0/6 1/6 2/6 3/6 4/6 5/6 6/6
Proportion en
F2 1/64 6/64 15/64 20/64 15/64 6/64 1/64
Contrôle de la coloration des grains de blé
tiré de Bernard et al, 1993
Relations nombre de gènes – nombre de
génotypes
Le nombre de génotypes est une fonction exponentielle du nombre de locus
Essor et limites de la génétique quantitative
statistique « classique »
• Le modèle infinitésimal de Fisher fournit une excellente explication de la base génétique de la variation quantitative et de la relation génotype - phénotype
• Une conséquence négative du modèle est cependant de prédire l'impossibilité d'identifier les gènes et leurs allèles puisqu'il sont en nombre infini et donc qu'ils n'ont chacun qu'un effet infinitésimal
• Suivant Kempthorne (1957), cité dans Verrier, Brabant et Gallais 2001), on peut dire que « l'objectif de la génétique quantitative est de développer des modèles statistiques pour l'expression phénotypique, en face d'une impossibilité partielle d'identification des génotypes et des facteurs de l'environnement »
• Vrai jusqu’à l’avènement de la génétique moléculaire et de la génomique car il est maintenant possible d’identifier les gènes concernés
La décomposition de la variation phénotypique
Principe fondamental de la génétique quantitative:
décomposition du phénotype
• La valeur phénotypique d'un individu dépend de sa valeur génotypique et d'un effet dû à l'environnement
Phénotype = génotype + environnement
P = G + E
• G: valeur génotypique
• E: non transmis à la descendance (encore que)
Décomposition de la valeur génotypique
Signification de A, D, I
• Dans une espèce diploïde à reproduction sexuée, la valeur génotypique d'un individu dépend d'une composante additive, d'un résidu de dominance et d'un résidu d'interaction entre les gènes (épistasie)
G = A + D + I
• Lors de la reproduction sexuée, la contribution d'un parent se limite à la transmission d'un gamète haploïde issu de méiose et résultant d'une recombinaison. Les interactions génotypiques sont rompues et chaque allèle est transmis indépendamment En conséquence:
– A: La valeur génétique additive est transmise à la descendance
– D: Le résidu de dominance n'est pas transmis à la descendance dans un gamète haploïde
– I: Le résidu d'interaction épistatique n'est pas transmise à la descendance dans un gamète haploïde
La décomposition de la variation d'un caractère
quantitatif
• Dans une population
Var(P) = Var(G) + Var(E)
• Var(P) : variance phénotypique Var(G) : variance génotypique Var(E) : variance environnementale
Var(G) = Var(A) + Var(D) + Var(I)
• Var(A) : variance additive Var(D) : variance de dominance Var(I) : variance d'interaction entre loci (épistasie)
Partition de la variance du poids des nouveau-nés
chez l'Homme
Cause de la variation % du total
Génétique
Additive 15
Non additive 1
Sex 2
Total génotypique 18
Environnement
Génotype maternel 20
Environnement maternel général 18
Environnement maternel immédiat 6
Age de la mère 1
Rang de naissance 7
Cause non identifiée 30
Total environnement 82
tiré de Falconer & Mackay, 1996
Le paramètre fondamental de la génétique
quantitative: l’héritabilité
La notion d'héritabilité
•Définition de l'héritabilité: définition populationnelle et non
individuelle!
Proportion de la variation phénotypique d'une population qui est
d'origine génétique: Elle mesure les contributions relatives des
différences génétiques et des différences dues à l'environnement
dans la variation phénotypique totale des individus
•Au sens large:
•Au sens strict:
EG
G
P
G
VV
V
V
VH
2
EIDA
A
EG
A
P
A
VVVV
V
VV
V
V
Vh
2
Partition de la variance et héritabilité
chez Drosophila melanogaster
Nb. de soies
abdominales
Longueur
du thorax
Taille
des
ovaires
Nb. d'œufs
pondus /
4 jours
Phénotypique
(totale)
Var(P) 100 100 100 100
Additive Var(A) 52 43 30 18
Non additive Var(D) + Var(I) 9 6 35 44
Environnementale Var(E) 39 51 35 38
H2 0.61 0.49 0.65 0.62
h2 0.52 0.43 0.30 0.18
tiré de Falconer & Mackay, 1996
Remarques importantes sur la notion d'héritabilité
• L'héritabilité est utilisée pour séparer les composantes génétiques et environnementales de la variation phénotypique
• La variance génétique est due à des différences entre génotypes: Il n'y a pas de variance génétique dans une population génétiquement homogène
• La variance environnementale est due à des différences dans l'environnement de vie, de croissance et de développement des individus
• L'héritabilité au sens large est une évaluation relative de la variation génétique présente, incluant les effets de dominance et d'épistasie
• L'héritabilité au sens strict est une évaluation relative de la variation génétique dite additive, transmissible, accessible à la sélection naturelle ou artificielle (dirigée par l'homme)
• L'héritabilité d'un caractère est une notion relative à une population étudiée dans un milieu donné: ce n'est pas une mesure absolue pour un caractère et une espèce.
• Pour une population donnée, l'héritabilité évolue au cours du temps en fonction des changements de l'environnement, de l'effet de la sélection, de la perte ou du gain de diversité génétique (mutation, migration)…
Exemples de valeurs d'héritabilité pour des espèces
animales et végétales domestiquées
tiré de Hartl, 1994
Héritabilité de divers traits chez l'Homme
tiré de Hartl, 1994
L'estimation de l'héritabilité chez l'homme est rendue plus
difficile du fait de la présence d'environnement commun
entre les individus apparentés
Classification des caractères en fonction de leur
héritabilité
En amélioration génétique, on distingue trois principales catégories de caractères selon la valeur de l'héritabilité:
• Caractères à variation peu héritable (h2 <0.2): essentiellement des caractères liés aux aptitudes de reproduction et de viabilité des jeunes. D'une part, ces caractères sont très sensibles aux conditions de milieu (Var(E) très élevée) et, d'autre part, des phénomènes génétiques non additifs (notamment des interactions de dominance) induisent probablement d'importantes variations sur ces caractères (Var(D) élevée).
• Caractères à variation moyennement héritable (0,2 < h2 < 0,4): essentiellement des caractères liés à l'intensité d'une production.
• Caractères à variation fortement héritable (h2 > 0,4): essentiellement des caractères liés aux caractéristiques qualitatives des produits, notamment leur composition, qui sont beaucoup moins sensibles aux variations liées au milieu que les précédents ou bien des caractères qui n'ont pas fait l'objet d'une sélection intense.
La réponse à la sélection naturelle ou dirigée
par l’homme
Différents modes de sélection
tiré de Kearsey & Pooni, 1998
Sélection directionnelle par troncature
tiré de Hartl, 1994
Héritabilité et réponse à la sélection
tiré de Hartl et Clark, 1997
Héritabilité et réponse à la sélection
• "Breeder’s equation" ou équation de prédiction de la réponse à la
sélection
R=h2S
• S = différentiel de sélection = µs – µ où µs est la moyenne de la
sous-population sélectionnée et u est la moyenne de la population
totale
• R = réponse à la sélection = µ' – µ où et µ' la moyenne dans la
génération fille
• Sans héritabilité, pas de réponse à la sélection et par conséquent
aucune possibilité de changement génétique ni d'évolution!
Validation expérimentale
Sélection du poids des graines chez le Haricot
tiré de Hartl, 1994
Validation expérimentale
Réponse à la sélection chez la Drosophile
« Illinois Long Term Selection Corn Experiment »
Dudley & Lambert, 1992.
Validation expérimentale
Les réponses à long terme à la sélection artificielle
Le cas du maïs
Evolution de l'héritabilité au cours d'un processus
de sélection
Heritability of oil content
Génération High line Low line
1 – 9 0.32 0.50
10 – 25 0.34 0.23
26 – 52 0.11 0.10
53 – 76 0.12 0.15
D'après Dudley 1977, tiré de Ridley 1997
L'héritabilité a tendance à décroitre au cours du processus de sélection
• Effets d'échelle (lignée à basse teneur)
• Érosion de la diversité génétique par fixation des allèles
Réponse à la sélection:
effet de la pêche sur la taille des saumons
Tiré de USHERB
Réponse à la sélection:
effet de la pêche sur la taille des saumons
Tiré de USHERB
Estimation des paramètres génétiques et de
l'héritabilité
Les outils statistiques
• Description des distributions
• La moyenne
• la variance
• la corrélation
• la régression
• L'analyse de la variance: ANOVA
• La régression linéaire multiple
La variance: mesure de la variation
• Variance: mesure standard de la variation, c'est-à-dire de la
dispersion autour de la valeur moyenne
Var(x) = Moy[(xi - µx)2]
• Propriété: additivité des variances
Var(x + y) = Var (x) + Var(y) si les variables x et y sont
indépendantes
Donc
Var(P) = Var (G) + Var(E)
Var(G) = Var (A) + Var(D) + Var(I)
La covariance: mesure de la covariation
et de la ressemblance entre apparentés
• Covariance: mesure de l'association entre deux variables, c'est-à-dire de leur covariation
Cov(x,y) = Moy[(xi - µx)(yi - µy)]
• Propriété: La covariance et la variance sont étroitement liées. En particulier
Cov(x,x) = Var(x)
• Les valeurs phénotypiques P1 et P2 de deux individus apparentés (parent/descendant, frères, jumeaux) sont généralement proches car ils partagent à la fois des gènes et un environnement en commun
• En conséquence
Cov(P1,P2) = Cov(G1,G2) + Cov(E1,E2)
Sous réserve d'indépendance entre génotype et environnement
Ressemblances dues à un environnement
commun
Cov(E1,E2)
• Effets maternels
• Environnement familial
• …
• La randomisation permet de contrôler en partie ces effets
• En génétique humaine, on utilise dans la mesure du possible des
jumeaux ou des enfants séparés à la naissance afin d'éliminer la
covariance phénotypique due à un environnement commun
Ressemblances dues à l'apparentement
• G = effet moyen des gènes paternels + effet moyen des gènes maternels + effets d'interactions entre les gènes
• Sachant que G = A + D + I, et sous réserve d'indépendance entre A, D et I
Cov(G1,G2) = Cov(A1,A2) + Cov(D1,D2) + Cov(I1,I2)
= Var(A) + Var(D) + Var(I)
• Pour un locus donné, deux individus apparentés peuvent partager 0, 1 ou 2 allèles avec une probabilité πi (i = 0, 1 ou 2)
• P. ex. dans une population non consanguine, un parent et son descendant partagent systématiquement 1 allèle pour chaque gène, deux vrais jumeaux ont leurs deux allèles en commun et deux frères peuvent avoir 0, 1 ou 2 allèles en commun en probabilité respectivement de ¼, ½, ¼
Composantes de la variance génétique parmi
divers types d'individus apparentés
• Quand des individus apparentés partagent un même allèle leur variance génétique contient seulement la moitié de la variance additive soit Var(A)/2 (car ils ne partagent pas l’autre allèle quand ils sont diploïdes)
• Lorsqu'ils partagent deux allèles, leur variance génétique contient Var(A) et Var(D)
• La valeur de la covariance génétique est donc donnée par la relation:
Cov(G1,G2) = π1Var(A)/2 + π2[Var(A) + Var(D)]
= Var(A)[π1/2 + π2] + Var(D) π2
Type d'apparentement π0 π1 π2 Var(A) Var(D)
Non apparentés 1 0 0 0 0
Un parent - descendant 0 1 0 ½ 0
Pleins-frères ¼ ½ ¼ ½ ¼
Demi-frères ½ ½ 0 ¼ 0
Jumeaux 0 0 1 1 1
Un grand parent - descendant ½ ½ 0 ¼ 0
Ressemblances dues à l'apparentement et
estimation des paramètres génétiques
• L'estimation des paramètres génétiques se base sur la comparaison entre la ressemblance théorique entre apparentés et la ressemblance mesurée expérimentalement pour le caractère considéré: la différence relève de la l’effet de l’environnement sur la valeur du caractère
Apparentement Covariance Régression (b) ou corrélation (t)
Descendant et un seul parent ½ Var(A) b = ½ Var(A) / Var(P)
Descendant et la moyenne des parents ½ Var(A) b = ½ Var(A) / ½ Var(P)=Var(A) / Var(P)
Demi-frères ¼ Var(A) t = ¼ Var(A ) / Var(P)
Pleins frères ½ Var(A) + ½ Var(D) t = [½ Var(A) + ½ Var(D)]/Var(P)
Estimation de l'héritabilité:
distribution de la longueur de la fleur de tabac (East 1916)
tiré de Verrier et al, 2001
Le modèle à un gène
• Valeurs des génotypes incluant les effets additifs (a) et de
dominance (d)
Parent 1
A1A1
Parent 2
A2A2
Moyenne des parents
m = 1/2(A1A1 + A2A2)
-a +a
d
F1 (A1A2)
Le modèle à un gène: les moyennes
Après centrage sur la moyenne des parents:
• Moyenne du caractère chez les parents P1 et P2:
-a et +a respectivement
• Moyenne du caractère dans la F1: d
• Moyenne du caractère dans une F2:
1/4(-a) + 1/2(d) + 1/4(+a) = 1/2d
• dans une F3: 1/4(-a) + 1/2(1/2d) + 1/4(+a) = 1/4d dans une Fn: (1/2)n-1d
• Moyenne du caractère dans un BC1.1: 1/2(-a) + 1/2(d)
• Moyenne du caractère dans un BC1.2: 1/2(+a) + 1/2(d)
Valeur moyenne d'un caractère pour différentes
générations d'un schéma de croisement
Génération [a] [d]
P1 -1 0
P2 +1 0
F1 0 1
F2 0 0.5
F3 0 0.25
F4 0 0.125
F 0 (1/2)g-1 soit 0
BC1.1 -0.5 0.5
BC1.2 +0.5 0.5
La moyenne d'un caractère tend vers la moyenne des parents au cours des
générations d'autofécondation F1 F
L'hétérosis pour la
taille chez le tabac
tiré de Kearsey & Pooni, 1998
L'évolution de la moyenne
au cours des générations
L'hétérosis chez le Maïs
L’hétérosis chez le porc
L’hétérosis ou vigueur hybride résulte généralement de la
complémentation entre lignées
Le modèle à un gène: variance génétique d'un
caractère dans une F2
• La variance est calculée selon la formule:
• Var(G) dans une F2 Var(G) = 1/4(-a - 1/2d)2 + 1/2(d - 1/2d)2 + 1/4(a - 1/2d)2 = 1/4(a2 + ad +1/4d2) + 1/2(1/4d2) + 1/4(a2 - ad +1/4d2) = 1/2a2 + 1/4d2
• a2 + d2 représentent respectivement les composantes de la variance dues à l'additivité des effets alléliques et aux effets de dominance entre allèles.
• La démonstration pour un seul gène se généralise aisément à plusieurs gènes en supposant l'indépendance des effets des différents gènes (pas d'épistasie).
i
ii xxVar2
Exemple :
Héritabilité de la longueur de la fleur chez le tabac
Composantes de la variance a2 d2 ad E Variance estimée
P1 0 0 0 1 48
P2 0 0 0 1 32
F1 0 0 0 1 46
F2 1/2 1/4 0 1 130.5
BC1.1 1/4 1/4 -1/2 1 85.5
BC1.2 1/4 1/4 +1/2 1 98.5
BC1.1 + BC1.2 1/2 1/2 2 184
1. E = 1/3(48 + 32 + 46) = 42
2. F2 – E = 1/2a2 + 1/4d2 = 130.5 – 42 = 88.5
BC1.1+ BC1.2 – 2E = 1/2a2 + 1/2d2 = 184 – 84 = 100
3. 1/2a2 + 1/4d2 = 88.5
1/2a2 + 1/2d2 = 100
4. 1/2a2 = 77, donc a2 = 154, et d2 = 46
Héritabilité de la longueur de la fleur chez le tabac
• En conséquence,
• Les composantes de la variance calculées à partir de la F2 sont:
Var(A) = 1/2a2 = 77.0
Var(D) = 1/4d2 = 11.5
Var(E) = E = 42
Var(P) = 130.5
55.0154
46soit
2
2
a
d
a
d
Héritabilité de la longueur de la fleur chez le tabac
• L'héritabilité au sens strict h2 estimée dans la F2 est égale à 0.59, alors que l'héritabilité au sens large H2 est de 0.68.
• En revanche, les héritabilités estimées dans les BC sont de 0.42 et 0.54 respectivement! Ce point illustre l'importance de la diversité génétique dans la notion d'héritabilité (à la limite, l'héritabilité calculée dans une F1 est nulle car la variance génotypique est nulle!).
• L'héritabilité est donc une notion très relative: Elle dépend complètement du polymorphisme de la population concernée, des interactions d'expression entre allèles, et bien sûr de l'importance de l'impact des facteurs environnementaux sur l'expression du caractère.
La variation quantitative dans les populations
La variation quantitative dans les populations
• Plus de deux allèles en ségrégation pour chaque locus?
• Des fréquences alléliques quelconques
• Régime de reproduction plus ou moins panmictique?
• Déséquilibre de liaison entre allèles dus à des facteurs historiques
Le modèle à un gène:
cas d'une population panmictique
Moyenne et variance d'un caractère dans une population panmictique
Soit p la fréquence de A2 (a+) et q la fréquence de A1 (a
-)
Moyenne = p2(a) + 2pq(d) + q2(-a)
= (p2 – q2)a + 2pq(d)
sachant que (p2 – q2) = (p – q) (p + q)
Moyenne = (p – q)a + 2pqd
Var(G) = moyenne des carrés – carré de la moyenne
Var(G) = [p2a2 + 2pqd2 + q2(-a)2] – [(p – q)a + 2pqd]2
= 2pq[a +d(q-p)]2 + [2pqd]2
= Var(A) + Var(D)
Dans le cas d'une F2 où p = q = ½
la moyenne vaut ½ d et
la variance vaut ½ a2 + ¼ d2
Variances génétiques et fréquences alléliques
(a) stricte additivité, Var(G) et Var(A)
sont strictement confondues
(b) dominance totale de l'allèle A1 (p1)
chez l'hétérozygote
(c) superdominance de l'hétérozygote
La pente de la droite de régression parent-enfant est une estimation de l’héritabilité du
caractère
h2=VA/VP
Estimation de l'héritabilité:
La régression parent-enfant
tiré de Dillmann et Hospital, 2002
S
R
h2 = VA/VP
= R/S
R=h2.S
Parents Parents
sélectionnés
Descendants
La régression parent-enfant et la réponse à une
génération de sélection
tiré de Dillmann et Hospital, 2002
Estimation de l'héritabilité:
régression parents / enfants
Galton’s 1889 plot of average
parental height versus average
height of offspring
Tiré de Walsh, 2001
Tiré de Ridley, 1997 Tiré de Ridley, 1997
Héritabilité de la date de ponte chez les Mésanges
bleues
Nuage de Points (Feuille de données1 10v*15c)
Descendants = 14.9142+0.8746*x
110 112 114 116 118 120 122 124 126
Parents
106
108
110
112
114
116
118
120
122
124
126
128
Descendants
Parents:Descendants: r² = 0.8619
h2=0.875: forte héritabilité et donc potentiel de réponse à la sélection élevé
Remarque: Attention aux biais possibles dus à des valeurs aberrantes!
Question: les oiseaux peuvent-ils ajuster génétiquement leur date de ponte en fonction
des changements climatiques attendus? Le cas des mésanges bleues
Tiré de USHERB
L'architecture génétique des caractères complexes
• Combien de gènes impliqués?
• Où sont-ils localisés?
• Quels sont leurs effets
L'architecture génétique des caractères
complexes
L'approche biométrique
La précocité de floraison est sous le contrôle de nombreux gènes, localisés sur
différents chromosomes, avec des interactions épistatiques
Déterminisme génétique de la date d’épiaison
chez le blé
tiré de Dillmann et Hospital, 2002
L'architecture génétique des caractères
complexes
La recherche de QTL
La notion de QTL (Quantitative Trait Locus)
• On appelle QTL: Quantitative Trait Locus, un gène polymorphe
dont la variation allélique influe sur la variation phénotypique d'un
caractère quantitatif
• Les avancées de la génomique structurale et fonctionnelle
permettent de les:
– détecter
– cartographier
– caractériser
• On utilise le polymorphisme de marqueurs du génome afin de
détecter et localiser les QTL
• Il faut disposer d’une carte génétique pour l’espèce étudiée
• On effectue le génotypage pour des marqueurs bien répartis sur la
carte
• On réalise le phénotypage pour le caractère au sein de familles
recombinantes
• On recherche la liaison génotype au marqueur / phénotype au
caractère quantitatif pour localiser la région qui contient le QTL: il
faut donc plutôt parler de QTR (Quantitative Trait Region)
Principe de la recherche de QTL
Principe de la recherche de QTL:
lignées recombinantes
• On choisit des parents qui diffèrent pour le caractère et on fabrique des lignées recombinantes qui ségrégent à la fois pour le phénotype quantitatif et pour des marqueurs moléculaires répartis dans le génome
• On recherche les associations entre phénotype quantitatif et marqueurs moléculaires
• Quand on détecte une association phénotype quantitatif / génotype pour un marqueur, on a détecté la présence d'un QTL au voisinage du marqueur
Principe de la recherche de QTL
association marqueur / QTL
On utilise la
liaison génétique
entre marqueur et
QTL pour
localiser le QTL
Méthodes de détection de la variation génétique
On utilise de plus en plus des marqueurs génétiques très polymorphes:
• Microsatellites: VNTR (Variable Number of Tandem Repeats)
Méthodes de détection de la variation génétique
• SNPs (Single Nucleotide Polymorphisms): très nombreux dans le
génome (1 site / 100bp), bien répartis dans le génome
M1M1 M1M2 M2M2
Relier le polymorphisme des marqueurs
aux variations d’un caractère quantitatif, chez
les descendants de parents de génotype
connu (DL)
Une corrélation entre la dose d’allèles M2 et la valeur du caractère indique
l’existence d’un QTL du caractère au voisinage du marqueur
Le principe de la détection de QTL
(D. de Vienne « Les marqueurs moléculaires en génétique », 1995)
Pas de QTL
Comparaison des moyennes des génotypes
un QTL un QTL
Tiré de Dillmann et Hospital, 2002
Principe de la recherche de QTL:
association phénotype - marqueur
Exemples de détection de QTL
QTL de prédisposition à l'obésité chez l'homme
QTL de prédisposition à l'obésité chez l'homme
QTL de prédisposition à la schizophrénie
Des QTL aux gènes: un long chemin semé
d'embûches
• QTL / QTR: Quantitative Trait Loci / Quantitative Trait Régions : on localise des régions chromosomiques plutôt que des gènes
• Ex A. thaliana, 585 cM, 125 Mb, soit 213 kb et ~ 50 gènes par cM
• Clonage positionnel est très fastidieux, et hasardeux
• Approche gène candidat, basée sur la localisation et la fonction supposée de gènes
• Génétique d'association entre polymorphisme nucléotidique et phénotype: SNPs
• Validation expérimentale par transgénèse (RNAi)
Des QTL/QTR aux gènes
Exemple: Recherche et caractérisation de QTL
chez la Tomate
Recherche et caractérisation de QTL de la teneur
en sucre chez la Tomate
• La teneur en composés solubles est la cible principale de
l'amélioration (sucres et différents acides)
• La diversité génétique au sein des lignées cultivées de Tomate est
faible
• Les espèces sauvages présentent parfois de très fortes teneurs en
sucre (15% / 5%)
• Croisement Lycopersicon pennellii x Lycopersicon esculentum
• Lignées recombinantes : Near Isogenic Lines (NILs)
• 23 QTL recensés en avril 2000
• Un QTL est localisé sur le chromosome 9: Brix9-2-5
• Fridman E. Pleban T., Zamir D. 2000 A recombination hotspot
delimits a wild-species quantitative trait locus for tomato sugar
content to 484 bp within an invertase gene, PNAS, 4718-4723.
Recherche et caractérisation de QTL de la teneur
en sucre chez la Tomate
• Cartographie fine utilisant 7000 individus F2!
• Une région candidate de 484 bp est identifiée
• Présence d'une Invertase (Lin5) exprimée uniquement dans la fleur
et le fruit: enzyme extracellulaire qui hydrolyse le saccharose en
fructose et glucose
• Enzyme clé dans l'approvisionnement des tissus en croissance
(système source – puits)
Recherche et caractérisation de QTL de la teneur
en sucre chez la Tomate
• Comparaison entre allèles des formes cultivées – sauvages:
– trois substitutions d'acides aminés mais sans effets sur la
conformation de la protéine
– des différences dans l'intron 3 vraisemblablement associées à
des différences de régulation
• Validation par trangénèse
Genome Wide Association mapping (GWA)
Le projet HapMap (2005)
• Phase I: 1 million de SNP de 90
individus d’Europe, d’Afrique et
d’Asie
• Phase II: 3 millions de SNP
Sélection des SNP les plus
pertinents
chips disponibles pour 250K et
500K disponibles
commercialement
• Le criblage génomique est
maintenant une réalité !
Diapo Th. Mailund, BirC, Aarhus DK
Dispositif expérimental
Diapo Th. Mailund, BirC, Aarhus DK
Objectif:
Identifier une association statistique entre un variant
nucléotidique et la maladie
Diapo Th. Mailund, BirC, Aarhus DK
Une approche indirecte
Le marqueur causal peut ne pas faire partie
des SNP analysés (c’est même probable…)
Diapo Th. Mailund, BirC, Aarhus DK
Une approche indirecte
Les marqueurs ne sont pas indépendants:
« connaître l’état d’un marqueur nous renseigne partiellement sur l’état
probable de ses voisins »
Cette non-indépendance est appelée :
« déséquilibre de liaison » ou « LD: Linkage Disequilibrium »
Diapo Th. Mailund, BirC, Aarhus DK
Une approche indirecte
Les marqueurs ne sont pas indépendants:
Cette non-indépendance décroit avec la distance physique sous l’effet de la
recombinaison
Diapo Th. Mailund, BirC, Aarhus DK
Identification de gènes candidats par GWA
mapping
Published Genome-Wide Associations through 6/2009, 439
published GWA at p < 5 x 10-8
NHGRI GWA Catalog
www.genome.gov/GWAStudies
La sélection assistée par marqueurs
Utilisation de marqueurs du génome pour augmenter
l'efficacité et la vitesse de construction de génotypes
La sélection assistée par marqueurs via les QTL
(SAM)
• Principe
– Utiliser les associations marqueurs-QTL (DL)
– Sélectionner sur le génotype aux marqueurs pour augmenter la
valeur génétique
• Méthodes
– Sélection sur marqueurs seuls (M)
– Sélection sur marqueurs+phénotype (M+P)
(index ou tandem)
SAM expérimentale: un exemple à la Station de
Génétique Végétale du Moulon
• 2 lignées élite de maïs
• 96 lignées recombinantes
• 3 QTL détectés rendement-précocité
• Introgression assistée par marqueurs
• 2 backcross + 1 autofécondation
• ~ 200 indiv. et 30 marqueurs / génération
• Evaluation des effets des introgressions
• Phénotype et QTL
• 2 années, 3 lieux
Bouchez, Hospital, Causse, Gallais & Charcosset, Genetics, 2002.
Génotype graphique de l’individu sélectionné: RIL
Segments QTL
introgressés
* Marqueurs
sélectionnés
Génotype graphique de l’individu sélectionné: BC2
Génotype graphique de l’individu sélectionné: BC3
Génotype graphique de l’individu sélectionné: BC3-S1
Sélection assistée par marqueurs, première
génération (SAM 1)
Méthode séduisante car elle permet de contrôler
l'introgression de segments de chromosomes lors des
retro-croisements, mais son efficacité est relative
Sélection Génomique (genome wide selection)
• La SAM capture la variance des « gros » QTL
• La GWS est censée capturer toute la variance génétique
• Ex Génotypage de plusieurs dizaines de milliers de SNP: puces 54K
chez les bovins
• Phénotypage d’une population de référence
• Élaboration d’une équation de prédiction des phénotypes à partir des
données génomiques (SNPs, CNVs,…)
• Méthode potentiellement puissante et économique car elle permet
de se dispenser du phénotypage exhaustif pendant quelques
générations de sélection
Sélection Génomique (genome wide selection)
• Figure 2. Flow diagram of a genomic selection breeding program. Breeding cycle time is shortened by removing
phenotypic evaluation of lines before selection as parents for the next cycle. Model training and line development
cycle length will be crop and breeding program specific. (GEBV = genomic estimated breeding value.)
Sélection Génomique (genome wide selection)
Phenotypic and genomic selection breeding schemes. Under phenotypic selection, one season is used for crossing and inbreeding and the next for evaluation
and selection; under GS, selection can be performed prior to evaluation so that selection occurs every season rather than every other season; for "every season
phenotyping," the evaluation is assumed to represent the target environment in any season; for "every other season phenotyping," only odd-numbered seasons
represent the target environment and even-numbered seasons are greenhouse or off-season nurseries; for all methods, the black cycle (C0) is phenotyped; for
GS, this cycle contributes to the training population (TP), as indicated by the colored line under the word "Select" in Season 1; in Season 2, candidates of the blue
cycle (C1) are produced, and selection is possible under GS, but using the same TP as for Season 1 (insufficient time for new phenotyping has elapsed); in
Season 3, candidates of the green cycle (C2) are produced, evaluation of C1 candidates occurs and can contribute to the TP used to select C2 candidates; similar
events occur in Season 4 except that for every other season phenotyping, evaluations are not performed because they would not be representative of the target
environment
Jannink Genetics Selection Evolution 2010 42:35 doi:10.1186/1297-9686-42-35
The end
Annexes:
Recherche de QTL de l’isolement
reproducteur chez Mimulus
Recherche de QTL de caractères floraux supposés affecter le comportement des pollinisateurs
Bradshaw et al Genetics 1998
Deux espèces de Mimulus
Mimulus lewisii Mimulus cardinalis
Pollinisateur : bourdon Pollinisateur : colibri
Méthodologie
• 12 caractères mesurés sur les individus de la F2 affectant
– l’attraction du pollinisateur:
• Couleur de la fleur
– Conc. en caroténoïdes (pigment jaunes)
– Conc. en anthocyanes (pigment violet)
• Forme de la corolle
– Largeur et longueur des pétales
– Courbe des pétales
– Surface projetée
– la récompense du pollinisateur
• Volume du nectar
– l’efficacité du transfert de pollen (rôle supposé dans le retrait du pollen et son dépôt par le pollinisateur)
• Longueur de l’étamine
• Longueur du pistil
• Largeur et longueur de l’ouverture de la corolle
Moyennes
phénotypiques
des parents M. lewisii
(L), M.cardinalis (C),
de la F1 (F1) et de la
F2
Carte génétique
de M. lewisii (L) et de M. cardinalis (C)
Recherche de QTL de l'attractivité vis-à-vis du
pollinisateur
Recherche de QTL de la récompense du
pollinisateur
Recherche de QTL de l'efficacité du transfert de
pollen
Recherche de QTL de la couleur des fleurs
Yup: yellow upper, un locus qui contrôle la teneur
en caroténoïdes dans les pétales
Distribution de l'effet des QTL
Effets sur les pollinisateurs ? Schemske et Bradshaw PNAS 1999
Effets des traits
floraux sur le taux
de visite des
pollinisateurs
Effet allélique
au locus yup
sur le taux de
visite des
pollinisateurs
Effet du génotype
marqueur du QTL majeur
du volume de nectar
Effet de la substitution allélique au locus yup
sur le comportement des pollinisateurs
Bradshaw et Schemske Nature 2003
Lignées isogéniques
A. M l sauvage
B. M l avec allele yup de M c
C. M c sauvage
D. M c avec allèle yup de M l