Upload
gregor-gorjanc
View
665
Download
0
Embed Size (px)
DESCRIPTION
Predstavitev genomske selekcije in kako se le ta uveljavlja pri selekciji goveda po svetu
Citation preview
Rodica, 2009
GENOMSKA SELEKCIJA
(ang. genomic/genom-wide selection)
Gregor Gorjanc
Vir informacij
� Literatura – članki
� Enotedenski tečaj + delavnica v Salzburgu
(Ben Hayes)http://www.nas.boku.ac.at/12100.html
� Interbull Genomic Workshophttp://www.interbull.org/bulletins/bulletin39/paermen.html
Kazalo
1. Pregled “klasične” in genomske selekcije
2. Pregled po vrstah� pes
� konj
� kokoš
� prašič
3. Stanje pri govedu
Rodica, 2009
Pregled “klasične” in genomske selekcije
R koda za porazdelitevmu <- 100; sigma <- 12; k <- 0.05
x <- (seq(-3.5, 3.5, 0.01) * sigma) + mu
y <- dnorm(x=x, mean=mu, sd=sigma)
t <- qnorm(p=1-k, mean=mu, sd=sigma)
plot(y ~ x, type="l", axes=FALSE, xlab="", ylab="", lwd=8)
abline(h=0, lwd=6)
abline(v=mu, lwd=6, lty=2)
testK <- x >= t
yK <- y[testK]
xK <- x[testK]
polygon(x=c(xK, rev(xK)), y=c(yK, rep(0, times=length(xK))),
col="black", border=NA)
Selekcija
� “Izbor (odbira) najboljših posameznikov z namenom, da spremenimo populacijo”
� Merimo fenotip – fenotipska vrednost
Napredek
Fenotip = ???
Fenotip
Genotip Okolje
OkoljeOkolje
Fenotip
Genotip
Fenotipska vrednost
Genotipska vr. Odstopanjezaradi okolja
V praksi poznamo le …
Identični po izvoru ali funkciji?
� različna barva ali nadpisane črke označujejo izvor
� podpisane črke označujejo vrsto/funkcijo alela
A11A
21 A3
1A41
Rodovniki nam nudijo del informacije o genotipu –pričakovan delež genov (alelov), ki so identični
po izvoru � koeficienti sorodstva
Rodovniki
Koeficienti sorodstva - RXY
Mama Oče
Hči BHči A
Koeficienti sorodstva
• RMO = 0 (predpostavka)
• RMA = RMB = ½ (točno)
• ROA = ROB = ½ (točno)
• RAB = ½ (v povprečju!)
Koeficienti sorodstva II
� Genotip mame: A1A2
� Genotip očeta: A3A4
� Genotipi potomcev
A2A4A1A4A4
A2A3A1A3A3
A2A1
Aleli od mameA
leli
od o
četa
Koeficienti sorodstva III
� Primer: starš in potomci
� Genotip mame: A1A2
� Genotip hčera/sinov: A1A3, A1A4, A2A3, A2A4
Pričakovan koef. sorodstva
ROA = (½ + ½ + ½ + ½ ) / 4 = = ½ (točno!)
½½½½A1A2
A2A4A2A3A1A4A1A3
Koeficienti sorodstva IV
Pričakovan koef. sorodstvaRAB = (1 + ½ + … + 1) / 16 = ½ (v povprečju!)
1½½0A2A4
½10½A2A3
½01½A1A4
0½½1A1A3
A2A4A2A3A1A4A1A3
� Primer: pravi bratje in prave sestre
Fenotip. vrednosti + rodovniki
� Osnova za biometrično/kvantitativno genetikoFisher 1918, Wright …
Fenotipska vrednost
Genotipska vrednost
Plemenska vrednost (PV)
Odstopanje zaradi
dominance
Odstopanje zaradi epistaze
Biometrični (kvantitativni)
genetiki se ukvarjajo z genetiko brez da bi se direktno ukvarjali
z geni!
R koda za potice## Določim nekaj barv
cols <- c(rgb(red=204, blue=0, green=0, max=255),
rgb(red=0, blue=153, green=0, max=255),
rgb(red=0, blue=0, green=204, max=255),
rgb(red=204, blue=0, green=153, max=255))
## Samo fenotip
x <- 100
pie(x, col="gray", labels="", init.angle=90, lty=0, border=0, clockwise=TRUE)
## e + g
x <- c(3/5, 2/5) * 100
pie(x, col=c("gray", cols[1]), labels="", init.angle=90, lty=0, border=0, clockwise=TRUE)
## e + i + d + a
x <- c(3/5, c(0.1, 0.3, 0.6) * 2/5) * 100
pie(x, col=c("gray", cols[4:2]), labels="", init.angle=90, lty=0, border=0, clockwise=TRUE)
Kako poteka izračun?
Statistični model(metoda BLUP)
Plemenske vrednosti + točnosti
Fenotipske vrednosti
Rodovniki
1900 1920 1940 1960 1980 2000
05
1015
2025
30
Leto
Vse
bnos
t (%
)
BeljakovineMaščoba
Dosežki v kmetijstvu – koruza (Illinois)http://www.ideals.uiuc.edu/handle/2142/3526
R koda za graf za koruzopodatki <- read.table(file="koruza.txt", na.strings=".", header=TRUE)
cols <- c(rgb(red=204, blue=0, green=0, max=255),
rgb(red=0, blue=153, green=0, max=255),
rgb(red=0, blue=0, green=204, max=255),
rgb(red=204, blue=0, green=153, max=255))
par(bty="l", pty="m", mar=c(2.5, 2.5, 1, 1), mgp=c(1.5, 0.5, 0))
matplot(x=podatki$YR, y=podatki[, c("IHP", "ILP", "IHO", "ILO")], type="l", lty=1,
xlab="Leto", ylab="Vsebnost (%)", col=cols[c(1, 1, 2, 2)], lwd=6)
legend("topleft", c("Beljakovine", "Maščoba"), lty=1,
lwd=6, col=cols[c(1, 2)], bty="n")
1990 1995 2000 2005
9510
010
511
0
Leto
Sta
ndar
dizi
rana
PV
Laktacija 305 dni
Mleko, kgBeljakovine, kgMaščoba, kgBeljakovine, %Maščoba, %
Dosežki v kmetijstvu – LI govedo (SLO)
R koda za graf za govedopodatki <- read.table(file="govedo_pv.txt", header=TRUE)
podatki <- podatki[podatki$leto != "2006", ]
cols <- c(rgb(red=0, blue=153, green=0, max=255),
rgb(red=204, blue=0, green=0, max=255),
rgb(red=0, blue=0, green=204, max=255),
rgb(red=204, blue=0, green=0, max=255),
rgb(red=0, blue=0, green=204, max=255))
par(bty="l", pty="m", cex=2.2, mar=c(2.5, 2.5, 1, 1), mgp=c(1.5, 0.5, 0))
matplot(x=podatki$leto, y= podatki[, c("ml", "pr", "ma", "prp", "map")], type="l",
lty=c(1, 1, 1, 2, 2), lwd=c(6, 6, 6, 3, 3),
xlab="Leto", ylab="Standardizirana PV", col=cols)
legend("topleft", c("Mleko, kg", "Beljakovine, kg", "Maščoba, kg", "Beljakovine, %",
"Maščoba, %"), title="Laktacija 305 dni",
lty=c(1, 1, 1, 2, 2), lwd=c(6, 6, 6, 3, 3), col=cols, bty="n")
Genetski napredek
∆G = (i × r × σa) / g
� i – intenzivnost selekcije� 50 % odbranih � i ~ 0,8
� 5 % odbranih � i ~ 2,0
� r – točnost plemenskih vrednosti (h2 ~ 0,25???)� na podlagi staršev � r ~ 35 %
� test na potomcih � r ~ 80 % in več
� σa – varianca plemenskih vrednosti
� g – generacijski interval
Shema selekcije pri govedu
Genetski napredek - govedo
� Večja intenzivnost selekcije po moški strani
∆G = (i♂ × r♂ + i♀ × r♀) / (g♂ + g♀)
� Test na potomcih – progeni test
∆G = (2 × 0,8 + ~ 0) / (6 + 2) = 0,20
� Mladi biki
∆G = (2 × 0,35 + ~ 0) / (2 + 2) = 0,18
“QTL obdobje”� Odkrivanje genov z velikim učinkom ali vsaj
približnih lokacij/regij genov v genomu� Molekularna genetika je vnesla veliko napredka,
še več pa navdušenja in pričakovanj
� V živinoreji smo v praksi doživeli manj rešitev od pričakovanj; bolje v humani genetiki in …???
� Razlogi� drago (vrednost posamezne živali ni velika)� zamudno� nekaj QTL-ov pojasni le del variabilnosti
Genotipska vr.
Fenotip
Genotip OkoljeOkolje
QTL
Fenotipska vrednost
V praksi poznamo le …
Odstopanjezaradi okolja
“MAS”
Statistični model(metoda BLUP)
Plemenske vrednosti+ točnosti
Fenotipske vrednosti
Rodovniki Označevalci
Francija – Guillaume in sod. (2008)http://jds.fass.org/cgi/content/abstract/91/6/2520
� MAS od leta 2001
� Za pred izbor bikov za progeni test
� Podatki� ~17,000 genotipiziranih živali
� 14 QTL regij z 2-5 mikrosatelitov
� ~10,000 na novo genotipiziranih živali vsako leto
� Točnost PV se je v povprečju povečala za 0,043 (od 0,001 za kg belj. do 0,103 za % mašč.)
� Precejšni stroški!
“Galton” – Aulchenko in sod. (2009)http://dx.doi.org/10.1038/ejhg.2009.5
� Galton (1886) “za napoved telesne višine otrok rabimo le povprečno telesno višino staršev”
� Heritabiliteta za telesno višino ~0,80� Primerjava metod:
� 5748 posameznikov, 54 lokusov (povezanih s telesno višino) je pojasnilo 4-6 % variance in imelo slabo napovedno moč (65 %) za ločitev 5 % najvišjih posameznikov
� 550 družin, povprečje staršev je pojasnilo 40 % variance in imelo boljšo napovedno moč (84 %) za ločitev 5 % najvišjih posameznikov
� 270 družin, povprečje staršev + 54 lokusov � ~41 % variancein napovedna moč ~ 84%
� � za napovedno moč ~80 % moramo z lokusi pojasniti vsaj 25 % variance
� � pri heritabiliteti ~0,3 je napovedna moč dokaj podobna
Genomski projektihttp://www.ncbi.nlm.nih.gov/genome/guide/
� 2000 človek
� 2004 govedo http://www.ncbi.nlm.nih.gov/genome/guide/cow/
� 2004 kokoš http://www.ncbi.../chicken
� 2005 pes http://www.ncbi.../dog
� 2006 čebela http://www.ncbi.../bee
� 2007 konj http://www.ncbi.../horse
� 2009 prašič http://www.ncbi.../pig
� 20?? ovca http://www.ncbi.../sheep
� 20?? kunec http://www.ncbi.../rabbit
Kromosom od očeta
Kromosom od mame
Genom
SNP – “snip”
Meuwissen in sod. 2001http://www.genetics.org/cgi/content/abstract/157/4/1819
� Ideja� število poznanih označevalcev raste� cena genotipizacije pada� uporabiti veliko ozn. za oceno plemenske vrednosti
� Simulacija� poznali so alele/genotipe posameznikov in njihove učinke� genom: 1000 genov, 1010 označevalcev (po dva v haplotip)
� tekom simulacije se je v populaciji “nabralo” ~ 50.000 različnih haplotipov
QTLM1 M2
1 cM
……
Meuwissen in sod. 2001
� Simulacija 1000 generacij N = 100:� 1001. generacija 1002. generacija
� N = 200 (100 ♀, 100 ♂) N = 2000 (20 x hsib100 )
� meritve meritve
� genotipizacija genotipizacija
� 1003. generacija� N = 2000 (20 x hsib100 )
� meritve
� genotipizacija
� Ocena parametrov z različnimi metodami
R koda za porazdelitvemu <- 100; sigma <- 12; k <- 0.05
x <- (seq(-3.5, 3.5, 0.01) * sigma) + mu
y <- dnorm(x=x, mean=mu, sd=sigma)
par(bty="l", pty="m", mar=c(1, 1, 0, 0))
plot(y ~ x, type="l", axes=FALSE, xlab="", ylab="", lwd=10)
axis(1, labels=NA, lwd=4)
box(lwd=4)
par(bty="l", pty="m", mar=c(1, 1, 0, 0))
plot(dnorm(x=x, mean=mu, sd=sigma/4) ~ x, type="l", axes=FALSE, xlab="", ylab="", lwd=10)
lines(dnorm(x=x, mean=mu, sd=sigma/2) ~ x, lwd=10, col="red")
lines(dnorm(x=x, mean=mu, sd=sigma) ~ x, lwd=10, col="blue")
axis(1, labels=NA, lwd=4)
box(lwd=4)
par(bty="l", pty="m", mar=c(1, 1, 0, 0))
plot(dnorm(x=x, mean=mu, sd=sigma/4) ~ x, type="l", axes=FALSE, xlab="", ylab="", lwd=10)
lines(dnorm(x=x, mean=mu, sd=sigma/2) ~ x, lwd=10, col="red")
lines(dnorm(x=x, mean=mu, sd=sigma) ~ x, lwd=10, col="blue")
abline(v=mu, lwd=10, col="green")
axis(1, labels=NA, lwd=4)
box(lwd=4)
Pregled metod
� LS� ločena ocena vsakega haplotipa
� BLUP� ocena vseh haplotipov hkrati� porazdelitev učinkov
� BayesA� ocena vseh haplotipov hkrati� porazdelitev učinkov
� BayesB� ocena vseh haplotipov hkrati� porazdelitev učinkov
Meuwissen in sod. 2001
Gen Gen
Meuwissen in sod. 2001
Meuwissen in sod. 2001
� Korelacija med pravimi in ocenjenimi PV (točnost) v 1003. generaciji (znani genotipi a neznani fenotipi)
0,80 ± 0./ 1BayesA
0,85 ± 0,01BayesB
0,73 ± 0,03BLUP
0,32 ± 0,02LS
KorelacijaMetoda
Čipi
� leta 2001 se je ideja Meuwissen in sod. zdela nora, saj je bil takrat cilj čim manj stroškov z genotipizacijo za nekaj označevalcev
� vpeljava čipov in padec cene (~200 $) danes omogočata uporabo velikega števila (50 k in več) označevalcev tudi v živinoreji
Čipi� Konj
� http://www.illumina.com/pages.ilmn?ID=285
� Pes� http://www.illumina.com/pages.ilmn?ID=249� http://www.affymetrix.com/products_services/arrays/specific/canine_2.affx
� Govedo� http://www.illumina.com/pages.ilmn?ID=256� http://www.affymetrix.com/products_services/arrays/specific/bovine.affx
� Prašič� http://www.illumina.com/pages.ilmn?ID=320� http://www.affymetrix.com/products_services/arrays/specific/porcine.affx
� Ovce� http://www.illumina.com/pages.ilmn?ID=319
� Razvoj teče dalje� 1000 k za človeka� celotni genomi
Fenotip
Genotip OkoljeOkolje
Fenotipska vrednost
Odstopanjezaradi okolja
Genotipska vr.QTL
V praksi poznamo le …
SNP
Kako poteka izračun?
Statistične metode se intenzivno razvijajo� “standarda” še ni
Kako poteka izračun?
Statistični model(metoda BLUP ali …)
Enačba
Fenotipske vrednosti
SNP
EnačbaSNP
Plemenske vrednosti+ točnosti
Kako poteka izračun?
� Združevanje/spajanje (ang. blended) plemenskih vrednosti iz različnih virov
� genomska plemenska vrednost (ocenjena na podlagi SNP-jev)
� “klasična” plemenska vrednost(ocenjena na podlagi fen. vrednosti in rodovnikov)
Kako poteka izračun?
Statistični model(metoda BLUP ali …)
Fenotipske vrednosti
SNP
Plemenske vrednosti + točnosti
Rodovniki
“Potrebni” pogoji!
� Zanesljiv fenotip � “povprečje” potomcev
� Za oceno vpliva velikega števila SNP-jev in zadostno točnost potrebujemo veliko živali� Avstralija
� 640 bikov (beljakovine, kg) � točnost 0,67 (klasika 0,53)
� 332 bikov (“plodnost”) � točnost 0,42 (klasika 0,40)
� Nova Zelandija� 4.500 bikov � točnost od 0,71 do 0,82
� ZDA� 3.576 bikov � povprečna točnost 0,71
Prednosti genomske selekcije I
� Večji genetski napredek ~ 1-2x� Test na potomcih – progeni test
∆G = (2 × 0,8 + ~ 0) / (6 + 2) = 0,20� Mladi biki
∆G = (2 × 0,35 + ~ 0) / (2 + 2) = 0,18� GS mladi biki
∆G = (2 × 0,60 + ~ 0) / (2 + 2) = 0,30� GS mladi biki + “bikovske” matere
∆G = (2 × 0,60 + 0,8 × 0,6) / (2 + 2) = 0,42
� Podrobnejšo analizo je opravil Schaeffer (2006)
Prednosti genomske selekcije I
× 29 somatski + × 1 spolni
� Še vedno veliko možnosti za selekcijo � težko bo “sestaviti” genom idealne živali!
� Primer kromosomskega para
Prednosti genomske selekcije II� Večja kontrola nad inbridingom, saj poznamo
dejanski genotip – identičnost po funkciji!
Identičnost po izvoru vs. funkciji
Hayes in Goddard (2008)http://jas.fass.org/cgi/content/full/86/9/2089