Upload
gregor-gorjanc
View
266
Download
4
Embed Size (px)
DESCRIPTION
Presentation "Analiza preživetja v kvantitativni genetiki = Survival analysis in quantitative genetics (animal breeding)".
Citation preview
Analiza prezivetja vkvantitativni genetiki
Gregor Gorjanc
Oddelek za zootehniko, Biotehniska fakultetaUniverza v Ljubljani
2009-01-08
Kazalo
1 Literatura
2 Klasicni model kvantitativne genetike
3 Analiza prezivetja (ang. Survival Analysis)
Literatura - kvantitativna genetika
Falconer & Mackay (1996) Introduction toQuantitative GeneticsLynch & Walsh (1998) Genetics and Analysisof Quantitative TraitsMrode (2005) Linear Models for the Predictionof Animal Breeding ValuesSorensen & Gianola, D. (2007) Likelihood,Bayesian and MCMC Methods in QuantitativeGenetics
Literatura - analiza prezivetja
splosno - veliko knjigza podrocje kvantitativne genetike
Ducrocq - skripta + predstavitveclanki
Klasicni (”infinitezimalni”) model
Fisher (1918) ”dekompozicija” fenotipske vrednosti
Genetski model
fenotip = µ + genotip + okolje
y = µ + g + e = µ + a + d + i + e
y - fenotipska vrednostµ - srednja vrednostg - genotipska vrednost
a - aditivna genotipska = plemenska vrednostd - deviacija zaradi dominancei - deviacija zaradi epistaze
e - deviacija zaradi okolja
Statisticni model
zapis modela v skalarni obliki
yij(k) = µ + hi + aij + eij(k)
zapis modela v matricni obliki
y = Xb + Zhh + Zaa + e
kompletni zapis modela
y|b,h, a,R ∼ Normal (Xb + Zhh + Zaa,R)
h|H ∼ Normal (0,H)
a|G ∼ Normal (0,G)
R = Iσ2e
H = Iσ2h
G = Aσ2a
A - matrika sorodstva (na podlagi rodovnikov)
Normalna (Gaussova) porazdelitev
yi ∼ Normal(µ, σ2
)f
(yi |µ, σ2
)=
1√2πσ2
exp
{−(yi − µ)2
2σ2
}parametri: µ, σ2 > 0
povprecje: E (y) = µ
varianca: E (y − E (y))2 = σ2
Gostota verjetnosti
−4 −2 0 2 4
0.0
0.1
0.2
0.3
0.4
y
f(y| µµ=
0, σσ
2 =1)
Vpliv spremembe µ, σ2 = 1
−4 −2 0 2 4 6 8
0.0
0.1
0.2
0.3
0.4
y
f(y|µµ =
(0, 2
, 4),σσ
2 )
Vpliv spremembe σ2, µ = 0
−10 −5 0 5 10
0.0
0.1
0.2
0.3
0.4
y
f(y|µµ ,
σσ2 =(1,
2, 3
))
Razlicne funkcije
−4 −2 0 2 4
0.0
0.1
0.2
0.3
0.4
y
f(y|µµ=
0, σσ
2 =1)
Gostota verjetnosti − f(y)
−4 −2 0 2 4
0.0
0.2
0.4
0.6
0.8
1.0
y
F(y|µµ
=0, σσ
2 =1)
Porazdelitvena (kumulativna) f. − F(y)
−4 −2 0 2 4
0.0
0.2
0.4
0.6
0.8
1.0
y
S(y|µµ
=0, σσ
2 =1)
Prezivitvena f. − S(y)
−4 −2 0 2 4
01
23
4
y
h(y|µµ
=0, σσ
2 =1)
Hazardna f. h(y) = f(y) / S(y)
Ocena parametrovStandardni (najpogostejsi) pristop - v dveh korakih
1 ocena parametrov disperzije(σ2
h, σ2a , σ
2e
)z
metodo REML (Thompson in Patterson)
σ2h, σ
2a , σ
2e |y
2 ocena lokacijskih parametrov (b,h, a) zresitvijo sistema normalnih enacb mesanegamodela (BLUE&BLUP) ob predpostavki, da sovariance znane (Henderson)
b, h, a|y, σ2h, σ
2a , σ
2e
Ocena parametrovDrugi pristopi - ocena vseh parametrov hkrati
”maximum a posteriori” (MAP)glej Gianola in sod. Genet. Sel. Evol. 198618(4): 485-498
Bayesovski pristop z MCMC metodamiglej knjigo od Sorensen in Gianola- rezultat so mejne porazdelitve iz katerih lahkoizracunamo povprecje, standardni odklon =standardna napaka ocene, . . .
f (b|y) , f (h|y) , f (a|y)
f(σ2
h|y), f
(σ2
a |y), f
(σ2
e |y), f
(h2|y
)
Razno, a zelo pomembno!
normalna (Gaussova) porazdelitev je zelorobustna predpostavka za ogromen naborlastnostina voljo je cela vrsta programov, ki omogocajooceno parametrov za taksne modele
ASREMLDMUMatvecMisztal-ovi programiMix99 - le za lokacijske parametreVCE/PESTWOMBAT. . .
Analiza prezivetjaKaj je drugace?
1 podatek je pozitivna vrednost, ki meri ”dolzino”med dvema tockama v casu, prostoru, . . . npr.cas od nekega dogodka do smrti ali drugegadogodka
2 porazdelitev je praviloma asimetricna3 vcasih (se) ne poznamo dejanske vrednosti -
krnjenje (ang. censoring)4 vplivi se skozi cas (prostor) spreminjajo -
casovno odvisni vplivi
Primer dolgozivosti krav
●
●
●
●
●
●
●
1990 1992 1994 1996 1998 2000
12
34
5
Leto
Krav
a
x xCeloten podatek
x ?Krnjen podatek
x ?Krnjen podatek
xOdsekan podatek
?Odsekan in krnjen podatekOdsekan in krnjen podatek
Razlicne porazdelitve
eksponetna - parametricni model
Weibull - parametricni model
. . .
Cox-ov semiparametricni model
Eksponentna porazdelitev
yi ∼ Exponential (λ)
f (yi |λ) = λ exp {−λyi}
parametri: λ > 0
povprecje: E (y) = 1/λ
mediana: ln (2) /λ
varianca: E (y − E (y))2 = 1/λ2
Gostota verjetnosti
0 1 2 3 4 5 6
0.0
0.2
0.4
0.6
0.8
1.0
y
f(y|λλ=
1)
Vpliv spremembe λ
0 1 2 3 4 5 6
0.0
0.5
1.0
1.5
y
f(y|λλ =
(0.5
, 1, 1
.5))
Razlicne funkcije
0 1 2 3 4 5 6
0.0
0.2
0.4
0.6
0.8
1.0
y
f(y|λλ=
1)
Gostota verjetnosti − f(y)
0 1 2 3 4 5 6
0.0
0.2
0.4
0.6
0.8
1.0
y
F(y|λλ
=1)
Porazdelitvena (kumulativna) f. − F(y)
0 1 2 3 4 5 6
0.0
0.2
0.4
0.6
0.8
1.0
y
S(y|λλ
=1)
Prezivitvena f. − S(y)
0 1 2 3 4 5 6
0.6
0.8
1.0
1.2
1.4
y
h(y|λλ
=1)
Hazardna f.h(y) = f(y) / S(y) = λλ
Weibull-ova porazdelitev
yi ∼ Exponential (λ)
f (yi |λ) = λ exp {−λyi} , h (yi |λ) = λ
yi ∼ Weibull (λ, ρ)
f (yi |λ, ρ) = λρ (λyi)ρ−1 exp {− (λyi)
ρ}
h (yi |λ, ρ) = λρ (λyi)ρ−1
parametri: λ > 0, ρ > 0
Weibull-ova porazdelitev
povprecje: E (y) = Γ(1+1/ρ)λ
mediana: 1/λ (ln (2))1/ρ
varianca: E (y − E (y))2 = Γ(1+2/ρ)−Γ(1+1/ρ)2
λ2
Gostota verjetnosti
0 1 2 3 4 5 6
0.0
0.2
0.4
0.6
0.8
1.0
y
f(y|λλ=
1.5,
ρρ=1.
5)
Razlicne funkcije
0 1 2 3 4 5 6
0.0
0.1
0.2
0.3
0.4
0.5
y
f(y|λλ=
1.5,
ρρ=1.
5)
Gostota verjetnosti − f(y)
0 1 2 3 4 5 6
0.0
0.2
0.4
0.6
0.8
1.0
y
F(y|λλ
=1.5
, ρρ=1
.5)
Porazdelitvena (kumulativna) f. − F(y)
0 1 2 3 4 5 6
0.0
0.2
0.4
0.6
0.8
1.0
y
S(y|λλ
=1.5
, ρρ=1
.5)
Prezivitvena f. − S(y)
0 1 2 3 4 5 6
0.0
0.5
1.0
1.5
2.0
y
h(y|λλ
=1.5
, ρρ=1
.5) Hazardna f.
h(y) = f(y) / S(y) = λλ
Vpliv spremembe λ in ρ na S(y)
0 1 2 3 4 5 6
0.0
0.2
0.4
0.6
0.8
1.0
y
S(y|λλ
=(0.
5, 1
, 1.5
), ρρ=
1.5)
0 1 2 3 4 5 6
0.0
0.2
0.4
0.6
0.8
1.0
y
S(y|λλ
=1.5
, ρρ=(
0.5,
1, 1
.5)
Vpliv spremembe ρ in λ na h(y)
0 1 2 3 4 5 6
01
23
45
67
y
h(y|λλ
=(0.
5, 1
, 1.5
), ρρ=
1.5)
0 1 2 3 4 5 6
01
23
45
67
y
h(y|λλ
=1.5
, ρρ=(
0.5,
1, 1
.5)
Statisticni model
hazardna funkcija za Weibull
h (y|λ,b,h, a, ρ) = λρ (λy)ρ−1 exp {Xb + Zhh + Zaa}= ρyρ−1 exp {Xb∗ + Zhh + Zaa}
b∗ = (ρ ln (λ) ,b)T
kompletni zapis modela
y|λ,b,h, a, ρ ∼ Weibull (Xb∗ + Zhh + Zaa, ρ)
h|γ ∼ Log − Gamma (γ, γ)
a|G ∼ Normal (0,G)
G = Aσ2a
A - matrika sorodstva (na podlagi rodovnikov)
Ocena parametrov
Survival Kit”maximum a posteriori” (MAP) - iterativno (glejDucrocq skripto - poglavje 6)
b∗, h, a, ρ|y, γ, σ2a
γ, σ2a |y
podobno kot REML + BLUE&BLUP
Matvec ???, DMU ???
Ocene ”lokacijskih” parametrov
b∗, h in a spreminjajo osnovno (bazicno, skupno)hazardno funkcijo
h (y|λ,b,h, a, ρ) = h0 (y|λ, ρ) exp {Xb + Zhh + Zaa}= h∗0 (y|λ, ρ) exp {Xb∗ + Zhh + Zaa}
b∗ = (ρ ln (λ) ,b)T
n = Xb∗ + Zhh + Zaa
n < 1 hazard se zmanjsa (prezivetje se poveca)n = 1 hazard se ne spremenin > 1 hazard se poveca (prezivetje se zmanjsa)
Heritabiliteta za ”sire” model
glej Yazdi in sod. (2002) JDS 85:1563-1577
h2 =4σ2
s
σ2s + Ψ(1) (γ) + 1