Analiza preživetja v kvantitativni genetiki

Analiza prezivetja vkvantitativni genetiki

Gregor Gorjanc

Oddelek za zootehniko, Biotehniska fakultetaUniverza v Ljubljani

2009-01-08

Kazalo

1 Literatura

2 Klasicni model kvantitativne genetike

3 Analiza prezivetja (ang. Survival Analysis)

Literatura - kvantitativna genetika

Falconer & Mackay (1996) Introduction toQuantitative GeneticsLynch & Walsh (1998) Genetics and Analysisof Quantitative TraitsMrode (2005) Linear Models for the Predictionof Animal Breeding ValuesSorensen & Gianola, D. (2007) Likelihood,Bayesian and MCMC Methods in QuantitativeGenetics

Literatura - analiza prezivetja

splosno - veliko knjigza podrocje kvantitativne genetike

Ducrocq - skripta + predstavitveclanki

Klasicni (”infinitezimalni”) model

Fisher (1918) ”dekompozicija” fenotipske vrednosti

Genetski model

fenotip = µ + genotip + okolje

y = µ + g + e = µ + a + d + i + e

y - fenotipska vrednostµ - srednja vrednostg - genotipska vrednost

a - aditivna genotipska = plemenska vrednostd - deviacija zaradi dominancei - deviacija zaradi epistaze

e - deviacija zaradi okolja

Statisticni model

zapis modela v skalarni obliki

yij(k) = µ + hi + aij + eij(k)

zapis modela v matricni obliki

y = Xb + Zhh + Zaa + e

kompletni zapis modela

y|b,h, a,R ∼ Normal (Xb + Zhh + Zaa,R)

h|H ∼ Normal (0,H)

a|G ∼ Normal (0,G)

R = Iσ2e

H = Iσ2h

G = Aσ2a

A - matrika sorodstva (na podlagi rodovnikov)

Normalna (Gaussova) porazdelitev

yi ∼ Normal(µ, σ2

)f

(yi |µ, σ2

)=

1√2πσ2

exp

{−(yi − µ)2

2σ2

}parametri: µ, σ2 > 0

povprecje: E (y) = µ

varianca: E (y − E (y))2 = σ2

Gostota verjetnosti

−4 −2 0 2 4

0.0

0.1

0.2

0.3

0.4

y

f(y| µµ=

0, σσ

2 =1)

Vpliv spremembe µ, σ2 = 1

−4 −2 0 2 4 6 8

0.0

0.1

0.2

0.3

0.4

y

f(y|µµ =

(0, 2

, 4),σσ

2 )

Vpliv spremembe σ2, µ = 0

−10 −5 0 5 10

0.0

0.1

0.2

0.3

0.4

y

f(y|µµ ,

σσ2 =(1,

2, 3

))

Razlicne funkcije

−4 −2 0 2 4

0.0

0.1

0.2

0.3

0.4

y

f(y|µµ=

0, σσ

2 =1)

Gostota verjetnosti − f(y)

−4 −2 0 2 4

0.0

0.2

0.4

0.6

0.8

1.0

y

F(y|µµ

=0, σσ

2 =1)

Porazdelitvena (kumulativna) f. − F(y)

−4 −2 0 2 4

0.0

0.2

0.4

0.6

0.8

1.0

y

S(y|µµ

=0, σσ

2 =1)

Prezivitvena f. − S(y)

−4 −2 0 2 4

01

23

4

y

h(y|µµ

=0, σσ

2 =1)

Hazardna f. h(y) = f(y) / S(y)

Ocena parametrovStandardni (najpogostejsi) pristop - v dveh korakih

1 ocena parametrov disperzije(σ2

h, σ2a , σ

2e

)z

metodo REML (Thompson in Patterson)

σ2h, σ

2a , σ

2e |y

2 ocena lokacijskih parametrov (b,h, a) zresitvijo sistema normalnih enacb mesanegamodela (BLUE&BLUP) ob predpostavki, da sovariance znane (Henderson)

b, h, a|y, σ2h, σ

2a , σ

2e

Ocena parametrovDrugi pristopi - ocena vseh parametrov hkrati

”maximum a posteriori” (MAP)glej Gianola in sod. Genet. Sel. Evol. 198618(4): 485-498

Bayesovski pristop z MCMC metodamiglej knjigo od Sorensen in Gianola- rezultat so mejne porazdelitve iz katerih lahkoizracunamo povprecje, standardni odklon =standardna napaka ocene, . . .

f (b|y) , f (h|y) , f (a|y)

f(σ2

h|y), f

(σ2

a |y), f

(σ2

e |y), f

(h2|y

)

Razno, a zelo pomembno!

normalna (Gaussova) porazdelitev je zelorobustna predpostavka za ogromen naborlastnostina voljo je cela vrsta programov, ki omogocajooceno parametrov za taksne modele

ASREMLDMUMatvecMisztal-ovi programiMix99 - le za lokacijske parametreVCE/PESTWOMBAT. . .

Analiza prezivetjaKaj je drugace?

1 podatek je pozitivna vrednost, ki meri ”dolzino”med dvema tockama v casu, prostoru, . . . npr.cas od nekega dogodka do smrti ali drugegadogodka

2 porazdelitev je praviloma asimetricna3 vcasih (se) ne poznamo dejanske vrednosti -

krnjenje (ang. censoring)4 vplivi se skozi cas (prostor) spreminjajo -

casovno odvisni vplivi

Primer dolgozivosti krav

●

●

●

●

●

●

●

1990 1992 1994 1996 1998 2000

12

34

5

Leto

Krav

a

x xCeloten podatek

x ?Krnjen podatek

x ?Krnjen podatek

xOdsekan podatek

?Odsekan in krnjen podatekOdsekan in krnjen podatek

Razlicne porazdelitve

eksponetna - parametricni model

Weibull - parametricni model

. . .

Cox-ov semiparametricni model

Eksponentna porazdelitev

yi ∼ Exponential (λ)

f (yi |λ) = λ exp {−λyi}

parametri: λ > 0

povprecje: E (y) = 1/λ

mediana: ln (2) /λ

varianca: E (y − E (y))2 = 1/λ2

Gostota verjetnosti

0 1 2 3 4 5 6

0.0

0.2

0.4

0.6

0.8

1.0

y

f(y|λλ=

1)

Vpliv spremembe λ

0 1 2 3 4 5 6

0.0

0.5

1.0

1.5

y

f(y|λλ =

(0.5

, 1, 1

.5))

Razlicne funkcije

0 1 2 3 4 5 6

0.0

0.2

0.4

0.6

0.8

1.0

y

f(y|λλ=

1)


0 1 2 3 4 5 6

0.0

0.2

0.4

0.6

0.8

1.0

y

F(y|λλ

=1)


0 1 2 3 4 5 6

0.0

0.2

0.4

0.6

0.8

1.0

y

S(y|λλ

=1)


0 1 2 3 4 5 6

0.6

0.8

1.0

1.2

1.4

y

h(y|λλ

=1)

Hazardna f.h(y) = f(y) / S(y) = λλ

Weibull-ova porazdelitev

yi ∼ Exponential (λ)

f (yi |λ) = λ exp {−λyi} , h (yi |λ) = λ

yi ∼ Weibull (λ, ρ)

f (yi |λ, ρ) = λρ (λyi)ρ−1 exp {− (λyi)

ρ}

h (yi |λ, ρ) = λρ (λyi)ρ−1

parametri: λ > 0, ρ > 0

Weibull-ova porazdelitev

povprecje: E (y) = Γ(1+1/ρ)λ

mediana: 1/λ (ln (2))1/ρ

varianca: E (y − E (y))2 = Γ(1+2/ρ)−Γ(1+1/ρ)2

λ2

Gostota verjetnosti

0 1 2 3 4 5 6

0.0

0.2

0.4

0.6

0.8

1.0

y

f(y|λλ=

1.5,

ρρ=1.

5)

Razlicne funkcije

0 1 2 3 4 5 6

0.0

0.1

0.2

0.3

0.4

0.5

y

f(y|λλ=

1.5,

ρρ=1.

5)


0 1 2 3 4 5 6

0.0

0.2

0.4

0.6

0.8

1.0

y

F(y|λλ

=1.5

, ρρ=1

.5)


0 1 2 3 4 5 6

0.0

0.2

0.4

0.6

0.8

1.0

y

S(y|λλ

=1.5

, ρρ=1

.5)


0 1 2 3 4 5 6

0.0

0.5

1.0

1.5

2.0

y

h(y|λλ

=1.5

, ρρ=1

.5) Hazardna f.

h(y) = f(y) / S(y) = λλ

Vpliv spremembe λ in ρ na S(y)

0 1 2 3 4 5 6

0.0

0.2

0.4

0.6

0.8

1.0

y

S(y|λλ

=(0.

5, 1

, 1.5

), ρρ=

1.5)

0 1 2 3 4 5 6

0.0

0.2

0.4

0.6

0.8

1.0

y

S(y|λλ

=1.5

, ρρ=(

0.5,

1, 1

.5)

Vpliv spremembe ρ in λ na h(y)

0 1 2 3 4 5 6

01

23

45

67

y

h(y|λλ

=(0.

5, 1

, 1.5

), ρρ=

1.5)

0 1 2 3 4 5 6

01

23

45

67

y

h(y|λλ

=1.5

, ρρ=(

0.5,

1, 1

.5)

Statisticni model

hazardna funkcija za Weibull

h (y|λ,b,h, a, ρ) = λρ (λy)ρ−1 exp {Xb + Zhh + Zaa}= ρyρ−1 exp {Xb∗ + Zhh + Zaa}

b∗ = (ρ ln (λ) ,b)T

kompletni zapis modela

y|λ,b,h, a, ρ ∼ Weibull (Xb∗ + Zhh + Zaa, ρ)

h|γ ∼ Log − Gamma (γ, γ)

a|G ∼ Normal (0,G)

G = Aσ2a

A - matrika sorodstva (na podlagi rodovnikov)

Ocena parametrov

Survival Kit”maximum a posteriori” (MAP) - iterativno (glejDucrocq skripto - poglavje 6)

b∗, h, a, ρ|y, γ, σ2a

γ, σ2a |y

podobno kot REML + BLUE&BLUP

Matvec ???, DMU ???

Ocene ”lokacijskih” parametrov

b∗, h in a spreminjajo osnovno (bazicno, skupno)hazardno funkcijo

h (y|λ,b,h, a, ρ) = h0 (y|λ, ρ) exp {Xb + Zhh + Zaa}= h∗0 (y|λ, ρ) exp {Xb∗ + Zhh + Zaa}

b∗ = (ρ ln (λ) ,b)T

n = Xb∗ + Zhh + Zaa

n < 1 hazard se zmanjsa (prezivetje se poveca)n = 1 hazard se ne spremenin > 1 hazard se poveca (prezivetje se zmanjsa)

Heritabiliteta za ”sire” model

glej Yazdi in sod. (2002) JDS 85:1563-1577

h2 =4σ2

s

σ2s + Ψ(1) (γ) + 1

Documents

Analiza preživetja v kvantitativni genetiki