156
Statisti ˇ cni modeli - regresija - Milena Kovaˇ c 12. januar 2009

Statisticni modeliˇ - regresija -agri.bf.uni-lj.si/Pedag/html/OIS/V3a.Regresija.pdf ·  · 2013-04-10Linearna regresija. Biometrija 2008/09 2 Vzporedno z x-osjo? Biometrija 2008/09

Embed Size (px)

Citation preview

Statisticni modeli- regresija -

Milena Kovac

12. januar 2009

Biometrija 2008/09 1

Linearna regresija

Biometrija 2008/09 2

Vzporedno z x-osjo?

Biometrija 2008/09 3

Sestavimo model!

Neodvisna spremenljivka:

Biometrija 2008/09 3

Sestavimo model!

Neodvisna spremenljivka: leto preizkušnje(x, kvantitativna in diskretna spremenljivka,regresija)

Biometrija 2008/09 3

Sestavimo model!

Neodvisna spremenljivka: leto preizkušnje(x, kvantitativna in diskretna spremenljivka,regresija)

Odvisna spremenljivka:

Biometrija 2008/09 3

Sestavimo model!

Neodvisna spremenljivka: leto preizkušnje(x, kvantitativna in diskretna spremenljivka,regresija)

Odvisna spremenljivka: indeks plemenske vrednosti(y, kvantitativna in zvezna spremenljivka,N-porazdelitev)

Model:

Biometrija 2008/09 3

Sestavimo model!

Neodvisna spremenljivka: leto preizkušnje(x, kvantitativna in diskretna spremenljivka,regresija)

Odvisna spremenljivka: indeks plemenske vrednosti(y, kvantitativna in zvezna spremenljivka,N-porazdelitev)

Model: yi = µ + b (xi − 80) + ei

Regresijski koeficient:

Biometrija 2008/09 3

Sestavimo model!

Neodvisna spremenljivka: leto preizkušnje(x, kvantitativna in diskretna spremenljivka,regresija)

Odvisna spremenljivka: indeks plemenske vrednosti(y, kvantitativna in zvezna spremenljivka,N-porazdelitev)

Model: yi = µ + b (xi − 80) + ei

Regresijski koeficient: b = 0 tock / leto

Ekvivalentni model:

Biometrija 2008/09 3

Sestavimo model!

Neodvisna spremenljivka: leto preizkušnje(x, kvantitativna in diskretna spremenljivka,regresija)

Odvisna spremenljivka: indeks plemenske vrednosti(y, kvantitativna in zvezna spremenljivka,N-porazdelitev)

Model: yi = µ + b (xi − 80) + ei

Regresijski koeficient: b = 0 tock / leto

Ekvivalentni model: yi = µ + ei

Biometrija 2008/09 4

Linearna regresija

Biometrija 2008/09 5

Linearna regresija

Biometrija 2008/09 6

Odgovorite

Regresijski koeficient:

Biometrija 2008/09 6

Odgovorite

Regresijski koeficient: (142−105)(94−84)

.= 3.7tocke / leto

Biometrija 2008/09 6

Odgovorite

Regresijski koeficient: (142−105)(94−84)

.= 3.7tocke / leto

Model:

Biometrija 2008/09 6

Odgovorite

Regresijski koeficient: (142−105)(94−84)

.= 3.7tocke / leto

Model: yi = µ + b (xi − 80) + ei

Biometrija 2008/09 6

Odgovorite

Regresijski koeficient: (142−105)(94−84)

.= 3.7tocke / leto

Model: yi = µ + b (xi − 80) + ei

Obrazložitev povezave:

Biometrija 2008/09 6

Odgovorite

Regresijski koeficient: (142−105)(94−84)

.= 3.7tocke / leto

Model: yi = µ + b (xi − 80) + ei

Obrazložitev povezave:Indeks PV narašca za 3.7 tock na leto. V 10 letih se jetako indeks PV povecal za 37 tock.

Biometrija 2008/09 6

Odgovorite

Regresijski koeficient: (142−105)(94−84)

.= 3.7tocke / leto

Model: yi = µ + b (xi − 80) + ei

Obrazložitev povezave:Indeks PV narašca za 3.7 tock na leto. V 10 letih se jetako indeks PV povecal za 37 tock.

Popravek? Ali smo povezavo dovolj dobro opisali?

Biometrija 2008/09 6

Odgovorite

Regresijski koeficient: (142−105)(94−84)

.= 3.7tocke / leto

Model: yi = µ + b (xi − 80) + ei

Obrazložitev povezave:Indeks PV narašca za 3.7 tock na leto. V 10 letih se jetako indeks PV povecal za 37 tock.

Popravek? Ali smo povezavo dovolj dobro opisali?Povezava je dokaj dobro opisana, a lahko bi bilobolje ...

Biometrija 2008/09 7

Polinom druge stopnje

Biometrija 2008/09 7

Polinom druge stopnje

yi = µ + bI (xi − 80) + bII (xi − 80)2 + ei

Biometrija 2008/09 8

Polinom tretje stopnje

Napišimo enacbo modela!

Biometrija 2008/09 9

Polinom tretje stopnje

yi =µ+bI (xi − 80)+bII (xi − 80)2+bIII (xi − 80)3+ei

Linearni clen · · · + bI (xi − 80)1 +

Biometrija 2008/09 9

Polinom tretje stopnje

yi =µ+bI (xi − 80)+bII (xi − 80)2+bIII (xi − 80)3+ei

Linearni clen · · · + bI (xi − 80)1 +

Kvadratni clen + bII (xi − 80)2 +

Biometrija 2008/09 9

Polinom tretje stopnje

yi =µ+bI (xi − 80)+bII (xi − 80)2+bIII (xi − 80)3+ei

Linearni clen · · · + bI (xi − 80)1 +

Kvadratni clen + bII (xi − 80)2 +

Kubni clen + bIII (xi − 80)3 + · · ·

Biometrija 2008/09 10

Zamolcana resnica o podatkihNa grafu prikazujemo indeks PV pri treh pasmah!

Biometrija 2008/09 11

Vgnezdene regresijske enacbe

Biometrija 2008/09 12

Sestavimo model!

Neodvisne spremenljivke:

Biometrija 2008/09 12

Sestavimo model!

Neodvisne spremenljivke: pasma ( kvalitativna s.)leto preizkušnje (x, kvantitativna in diskretna s.,regresija)

Biometrija 2008/09 12

Sestavimo model!

Neodvisne spremenljivke: pasma ( kvalitativna s.)leto preizkušnje (x, kvantitativna in diskretna s.,regresija)

Odvisna spremenljivka:

Biometrija 2008/09 12

Sestavimo model!

Neodvisne spremenljivke: pasma ( kvalitativna s.)leto preizkušnje (x, kvantitativna in diskretna s.,regresija)

Odvisna spremenljivka: indeks plemenske vrednosti(y, kvantitativna in zvezna s., normalna porazdelitev)

Biometrija 2008/09 12

Sestavimo model!

Neodvisne spremenljivke: pasma ( kvalitativna s.)leto preizkušnje (x, kvantitativna in diskretna s.,regresija)

Odvisna spremenljivka: indeks plemenske vrednosti(y, kvantitativna in zvezna s., normalna porazdelitev)

Model:

Biometrija 2008/09 12

Sestavimo model!

Neodvisne spremenljivke: pasma ( kvalitativna s.)leto preizkušnje (x, kvantitativna in diskretna s.,regresija)

Odvisna spremenljivka: indeks plemenske vrednosti(y, kvantitativna in zvezna s., normalna porazdelitev)

Model: yij = µ + Pi + bi (xij − 80) + eij

Biometrija 2008/09 12

Sestavimo model!

Neodvisne spremenljivke: pasma ( kvalitativna s.)leto preizkušnje (x, kvantitativna in diskretna s.,regresija)

Odvisna spremenljivka: indeks plemenske vrednosti(y, kvantitativna in zvezna s., normalna porazdelitev)

Model: yij = µ + Pi + bi (xij − 80) + eij

Ekvivalentni model:

Biometrija 2008/09 12

Sestavimo model!

Neodvisne spremenljivke: pasma ( kvalitativna s.)leto preizkušnje (x, kvantitativna in diskretna s.,regresija)

Odvisna spremenljivka: indeks plemenske vrednosti(y, kvantitativna in zvezna s., normalna porazdelitev)

Model: yij = µ + Pi + bi (xij − 80) + eij

Ekvivalentni model: yij = µi + bi (xij − 80) + eij

Pomnimo: regresija je vgnezdena znotraj vpliva pasmevsaka pasma ima svojo regresijsko premico

Biometrija 2008/09 13

Vgnezdene premice: ocene

µ1 = 78.5 tock b1 = 4.6 tock / leto

µ2 = 94.4 tock b2 = 3.1 tock / leto

µ3 = 109.5 tock b3 = 2.5 tock / leto

Presecišca z y-osjo so izvrednotena za leto 1980!

Ekstrapolacija ni dovoljena!

Biometrija 2008/09 14

... še nekaj ocen ...

yij = µi + bi (xij − 80) + eij

A B CP xij yij P xij yij P xij yij

1 80 2 80 3 801 85 2 85 3 851 90 2 90 3 901 100 2 100 3 100

(Letom bi morali prišteti 1900, vendar pa smo rajeostali pri manjših vrednostih!)

Biometrija 2008/09 15

... še nekaj ocen ...

yij = µi + bi (xij − 80)

Biometrija 2008/09 15

... še nekaj ocen ...

yij = µi + bi (xij − 80)

A B CP xij yij P xij yij P xij yij

1 80 78.5 2 80 94.4 3 80 109.51 85 101.5 2 85 109.9 3 85 122.01 90 124.5 2 90 125.4 3 90 134.51 100 170.5 2 100 156.4 3 100 159.5

Biometrija 2008/09 15

... še nekaj ocen ...

yij = µi + bi (xij − 80)

A B CP xij yij P xij yij P xij yij

1 80 78.5 2 80 94.4 3 80 109.51 85 101.5 2 85 109.9 3 85 122.01 90 124.5 2 90 125.4 3 90 134.51 100 170.5 2 100 156.4 3 100 159.5

Ekstrapolacija ni dovoljena!

Biometrija 2008/09 16

Vgnezdeni polinomi

Krivulje rišemo samo na intervalu, na katerem imamopodatke.

Biometrija 2008/09 17

Vgnezdeni polinomi: ocene

yij = µ + Pi + bIi (xij − 80) + bIIi (xij − 80)2 +bIIIi (xij − 80)3 + eij

Enote tock / leto tock / leto2 tock / leto3

bI1 = 1357.4 bII1 = −15.41 bIII1 = 0.0584

bI2 = 1022.1 bII2 = −11.74 bIII2 = 0.0450

bI3 = 888.0 bII3 = −10.22 bIII3 = 0.0392

Biometrija 2008/09 18

Dogovor pri polinomih!

• regresijske koeficiente oznacujemo z malo crko b

• neodvisno spremenljivko oznacimo z x

• pri polin. višje stopnje dodamo indeks za stopnjopolin.

• praviloma rimsko, izjemoma arabsko številko

• potenca pri neodvisni spremenljivki je enakaindeksu pri regresijskem koeficientu

• pri dolocanju stopnje polinoma pomagamo si lahkotudi z grafom

Biometrija 2008/09 19

Dnevni poraba krme in subjektivna ocena

(podatki so simulirani in ne prikazujejo dejanske povezave!)

Biometrija 2008/09 20

Sestavimo model!

Vplivi:

Biometrija 2008/09 20

Sestavimo model!

Vplivi: skupina

Biometrija 2008/09 20

Sestavimo model!

Vplivi: skupina ( kvalitativni v., z nivoji, Si),

Biometrija 2008/09 20

Sestavimo model!

Vplivi: skupina ( kvalitativni v., z nivoji, Si),dnevna poraba krme

Biometrija 2008/09 20

Sestavimo model!

Vplivi: skupina ( kvalitativni v., z nivoji, Si),dnevna poraba krme (x, kvantit. vpliv, 3 premice)

Neodvisna sprem.:

Biometrija 2008/09 20

Sestavimo model!

Vplivi: skupina ( kvalitativni v., z nivoji, Si),dnevna poraba krme (x, kvantit. vpliv, 3 premice)

Neodvisna sprem.: dnevna poraba krme ( regresija)

Odvisna sprem.:

Biometrija 2008/09 20

Sestavimo model!

Vplivi: skupina ( kvalitativni v., z nivoji, Si),dnevna poraba krme (x, kvantit. vpliv, 3 premice)

Neodvisna sprem.: dnevna poraba krme ( regresija)

Odvisna sprem.: subjektivna ocena

Biometrija 2008/09 20

Sestavimo model!

Vplivi: skupina ( kvalitativni v., z nivoji, Si),dnevna poraba krme (x, kvantit. vpliv, 3 premice)

Neodvisna sprem.: dnevna poraba krme ( regresija)

Odvisna sprem.: subjektivna ocena (y, N-porazd.)

Model:

Biometrija 2008/09 20

Sestavimo model!

Vplivi: skupina ( kvalitativni v., z nivoji, Si),dnevna poraba krme (x, kvantit. vpliv, 3 premice)

Neodvisna sprem.: dnevna poraba krme ( regresija)

Odvisna sprem.: subjektivna ocena (y, N-porazd.)

Model: yij = µ + Si + bixij + eij

Ekvivalentni model:

Biometrija 2008/09 20

Sestavimo model!

Vplivi: skupina ( kvalitativni v., z nivoji, Si),dnevna poraba krme (x, kvantit. vpliv, 3 premice)

Neodvisna sprem.: dnevna poraba krme ( regresija)

Odvisna sprem.: subjektivna ocena (y, N-porazd.)

Model: yij = µ + Si + bixij + eij

Ekvivalentni model: yij = µi + bixij + eij

Biometrija 2008/09 21

Parametri

Regresijski koeficienti:

Biometrija 2008/09 21

Parametri

Regresijski koeficienti: b1, b2, b3

Presecišca z y-osjo:

Biometrija 2008/09 21

Parametri

Regresijski koeficienti: b1, b2, b3

Presecišca z y-osjo: S1, S2, S3 ali µ1, µ2, µ3

Parametri:

Biometrija 2008/09 21

Parametri

Regresijski koeficienti: b1, b2, b3

Presecišca z y-osjo: S1, S2, S3 ali µ1, µ2, µ3

Parametri: µ, S1, S2, S3, b1, b2, b3

Število parametrov:

Biometrija 2008/09 21

Parametri

Regresijski koeficienti: b1, b2, b3

Presecišca z y-osjo: S1, S2, S3 ali µ1, µ2, µ3

Parametri: µ, S1, S2, S3, b1, b2, b3

Število parametrov: 1 + 3 + 3 = 7

Število stopinj prostosti:

Biometrija 2008/09 21

Parametri

Regresijski koeficienti: b1, b2, b3

Presecišca z y-osjo: S1, S2, S3 ali µ1, µ2, µ3

Parametri: µ, S1, S2, S3, b1, b2, b3

Število parametrov: 1 + 3 + 3 = 7

Število stopinj prostosti: 1 + (3− 1) + 3 = 6

Komentar:

Biometrija 2008/09 22

Dnevni poraba krme in subjektivna ocena

Biometrija 2008/09 23

Komentar

Subjektivne ocene (SO) so odvisne od dnevne porabekrme (DPK). Ko DPK narašca, se v modri in crniskupini tudi SO povecujejo. V crni skupini sovrednosti na opazovanem intervalu nižje kot v modriskupini, se pa povecujejo hitreje. SO v rdeci skupinipa z narašcanjem DPK padajo. ... dodamo diskusijo,primerjavo z literaturo, zakaj odstopanja ...

Ali smo povezavo dovolj dobro opisali?

Biometrija 2008/09 23

Komentar

Subjektivne ocene (SO) so odvisne od dnevne porabekrme (DPK). Ko DPK narašca, se v modri in crniskupini tudi SO povecujejo. V crni skupini sovrednosti na opazovanem intervalu nižje kot v modriskupini, se pa povecujejo hitreje. SO v rdeci skupinipa z narašcanjem DPK padajo. ... dodamo diskusijo,primerjavo z literaturo, zakaj odstopanja ...

Ali smo povezavo dovolj dobro opisali? Da.

Biometrija 2008/09 24

Subjektivne ocene

• subjektivne ocene imajo praviloma le nekaj ocen

• skala 1 - 3, samo celo vrednosti• skala 1 - 10, samo cele vrednosti• skala 1 - 5, dovoljene tudi vmesne ocene (korak 0.5)• porazdelitev ni zvezna, zato ni normalna• ce je razporeditev ocen simetricna in v skladu z

normalno porazdelitvijo, lahko pri obdelavipredostavimo normalno porazdelitev

• kondicijo smo ocenjevali zvezno (izjema), podatkesmo simulirali s pomocjo normalne porazdelitve,zato lahko privzamemo, da je porazdelitev normalna

Biometrija 2008/09 25

Stopinje prostosti

• število ocenljivih parametrov

• koliko parametrov moram oceniti, da vem vse ovplivu?

• parameter µ:

Biometrija 2008/09 25

Stopinje prostosti

• število ocenljivih parametrov

• koliko parametrov moram oceniti, da vem vse ovplivu?

• parameter µ: ocenimo iz podatkov, 1 s.p.• parameter S1:

Biometrija 2008/09 25

Stopinje prostosti

• število ocenljivih parametrov

• koliko parametrov moram oceniti, da vem vse ovplivu?

• parameter µ: ocenimo iz podatkov, 1 s.p.• parameter S1: ocenimo iz podatkov, 1 s.p.• parameter S2:

Biometrija 2008/09 25

Stopinje prostosti

• število ocenljivih parametrov

• koliko parametrov moram oceniti, da vem vse ovplivu?

• parameter µ: ocenimo iz podatkov, 1 s.p.• parameter S1: ocenimo iz podatkov, 1 s.p.• parameter S2: ocenimo iz podatkov, 1 s.p.• parameter S3:

Biometrija 2008/09 25

Stopinje prostosti

• število ocenljivih parametrov

• koliko parametrov moram oceniti, da vem vse ovplivu?

• parameter µ: ocenimo iz podatkov, 1 s.p.• parameter S1: ocenimo iz podatkov, 1 s.p.• parameter S2: ocenimo iz podatkov, 1 s.p.• parameter S3: izracunamo, ne ocenjujemo iz

podatkov, 0 s.p.

µ = 13 (S1 + S2 + S3) ⇒ S3 = 3µ− (S1 + S2)

Biometrija 2008/09 26

Stopinje prostosti

• regresija

• parameter b1:

Biometrija 2008/09 26

Stopinje prostosti

• regresija

• parameter b1: ocenimo iz podatkov, 1 s.p.• parameter b2:

Biometrija 2008/09 26

Stopinje prostosti

• regresija

• parameter b1: ocenimo iz podatkov, 1 s.p.• parameter b2: ocenimo iz podatkov, 1 s.p.• parameter b3:

Biometrija 2008/09 26

Stopinje prostosti

• regresija

• parameter b1: ocenimo iz podatkov, 1 s.p.• parameter b2: ocenimo iz podatkov, 1 s.p.• parameter b3: ocenimo iz podatkov, 1 s.p.

• oceniti moramo vsak regresijski koeficient, skupaj 3

• tako imamo 3 stopinje prostosti

Biometrija 2008/09 27

Stopinje prostosti - povzetek

Parameter Številopa-ram.

Število sto-pinj prosto-sti

Pojasnilo

µ 1 1Glavni vpliviz nivoji p p− 1 µ = 1

p

∑Si

Regresije p p

Vgnezdenivplivi

∑pi qi

∑(qi − 1) Ai =

∑qij Bij

Interakcije∑

pq∑

(p− 1) (q − 1)Ai =

∑qj ABij

Biometrija 2008/09 28

Rojstna masa in prirast

(podatki so simulirani in ne prikazujejo dejanske povezave!)

Biometrija 2008/09 29

Sestavimo model!

Vplivi:

Biometrija 2008/09 29

Sestavimo model!

Vplivi: skupina

Biometrija 2008/09 29

Sestavimo model!

Vplivi: skupina ( kvalitativni v., z nivoji, Si),

Biometrija 2008/09 29

Sestavimo model!

Vplivi: skupina ( kvalitativni v., z nivoji, Si),rojstna masa

Biometrija 2008/09 29

Sestavimo model!

Vplivi: skupina ( kvalitativni v., z nivoji, Si),rojstna masa (x, kvantitativni vpliv)

Neodvisna spremenljivka:

Biometrija 2008/09 29

Sestavimo model!

Vplivi: skupina ( kvalitativni v., z nivoji, Si),rojstna masa (x, kvantitativni vpliv)

Neodvisna spremenljivka: rojstna masa (3 premice)

Odvisna spremenljivka:

Biometrija 2008/09 29

Sestavimo model!

Vplivi: skupina ( kvalitativni v., z nivoji, Si),rojstna masa (x, kvantitativni vpliv)

Neodvisna spremenljivka: rojstna masa (3 premice)

Odvisna spremenljivka: prirast

Biometrija 2008/09 29

Sestavimo model!

Vplivi: skupina ( kvalitativni v., z nivoji, Si),rojstna masa (x, kvantitativni vpliv)

Neodvisna spremenljivka: rojstna masa (3 premice)

Odvisna spremenljivka: prirast (y, N-porazdelitev)

Model:

Biometrija 2008/09 29

Sestavimo model!

Vplivi: skupina ( kvalitativni v., z nivoji, Si),rojstna masa (x, kvantitativni vpliv)

Neodvisna spremenljivka: rojstna masa (3 premice)

Odvisna spremenljivka: prirast (y, N-porazdelitev)

Model: yij = µ + Si + bixij + eij

Ekvivalentni model:

Biometrija 2008/09 29

Sestavimo model!

Vplivi: skupina ( kvalitativni v., z nivoji, Si),rojstna masa (x, kvantitativni vpliv)

Neodvisna spremenljivka: rojstna masa (3 premice)

Odvisna spremenljivka: prirast (y, N-porazdelitev)

Model: yij = µ + Si + bixij + eij

Ekvivalentni model: yij = µi + bixij + eij

Biometrija 2008/09 30

Parametri

Regresijski koeficienti:

Biometrija 2008/09 30

Parametri

Regresijski koeficienti: b1, b2, b3

Presecišca z y-osjo:

Biometrija 2008/09 30

Parametri

Regresijski koeficienti: b1, b2, b3

Presecišca z y-osjo: S1= S2= S3 ali µ1= µ2= µ3vse tri premice imajo isto presecišce z y-osjo

Biometrija 2008/09 31

Sestavimo model! (nadalj.)

Primeren model:

Biometrija 2008/09 31

Sestavimo model! (nadalj.)

Primeren model: yij = µ + bixij + eij

Komentar: ... poskusimo, ceprav so zakljuckineuporabni ...

Biometrija 2008/09 31

Sestavimo model! (nadalj.)

Primeren model: yij = µ + bixij + eij

Komentar: ... poskusimo, ceprav so zakljuckineuporabni ... Primer prikazuje izjemo, ko smemoizpustiti vpliv, ki ima vgnezdeno regresijo ...

Ali smo povezavo dobro opisali?

Biometrija 2008/09 31

Sestavimo model! (nadalj.)

Primeren model: yij = µ + bixij + eij

Komentar: ... poskusimo, ceprav so zakljuckineuporabni ... Primer prikazuje izjemo, ko smemoizpustiti vpliv, ki ima vgnezdeno regresijo ...

Ali smo povezavo dobro opisali? Da.

Dolocite število parametrov v vseh treh modelih!

Dolocite število stopinj prostosti!

Dolocite število opazovanj v vseh treh modelih!(Število živali v skupinah je razlicno.)

Biometrija 2008/09 32

Primerjava modelov

Število opazovanj v poskusu: n = n1 + n2 + n3

yij = µ + Si + bixij + eij µ Si bi model ostanekŠtevilo parametrov 1 3 3 7 —Število stopinj prostosti 1 2 3 6 n− 6yij = µi + bixij + eij µi bi model ostanekŠtevilo parametrov 3 3 6 —Število stopinj prostosti 3 3 6 n− 6yij = µ + bixij + eij µ bi model ostanekŠtevilo parametrov 1 3 4 —Število stopinj prostosti 1 3 4 n− 4

Biometrija 2008/09 33

Ekvivalentni modeliModeli so ekvivalentni:

• ce imajo isto število ocenljivih parametrov

• ce ocenljivi parametri zagotavljajo iste zakljucke

• opisujejo podatke precej podobno (isti vplivi, samodruga oblika)

Prva dva modela na zadnji tabeli sta ekvivalentna:

• v prvem modelu parameterS3 ni ocenljiv,

• v drugem nismo vkljucili skupne srednje vrednosti(µ), ampak srednje vrednosti za posamezne skupine(µi)

Biometrija 2008/09 34

Debelina hrbtne slanine

4 DHS se pri prašicih z maso med 90 in 110 kgpovecuje za nekako 0.10 mm/kg. Ce vemo, da se jemasa spremenila za 10 kg, pricakujemo lahko za1 mm debelejšo DHS. Pri 100 kg je npr. povprecnaDHS 13 mm.

1. Odvisna spremenljivka:

2. Neodvisna spremenljivka:

3. Regresijski koeficient:

4. Narišimo graf!

Biometrija 2008/09 35

Debelina hrbtne slanine

4 DHS se pri prašicih z maso med 90 in 110 kgpovecuje za nekako 0.10 mm/kg. Ce vemo, da se jemasa spremenila za 10 kg, pricakujemo lahko za1 mm debelejšo DHS. Pri 100 kg je npr. povprecnaDHS 13 mm.

1. Odvisna spremenljivka: Debelina hrbtne slanine

2. Neodvisna spremenljivka: maso

3. Regresijski koeficient: 0.10 mm/kg

4. Narišimo graf!

Biometrija 2008/09 36

Ocene debeline hrbtne slanine

• Napišimo enacbo za oceno DHS od 90 do 100 kg!

yi = b0 + b1(xi − 100) =

Biometrija 2008/09 36

Ocene debeline hrbtne slanine

• Napišimo enacbo za oceno DHS od 90 do 100 kg!

yi = b0 + b1(xi − 100) = 13.0 + 0.10 ∗ (xi − 100)

• Parametra b0 in b1 sta ocenjeni z ocenama b0 in b1

• Izracunajmo nekaj tock (za premico najmanj dve!)

Masa (kg) 90 94 98 100 102 106 110DHS (mm) 12.0 12.4 12.8 13.0 13.2 13.6 14.0

Biometrija 2008/09 36

Ocene debeline hrbtne slanine

• Napišimo enacbo za oceno DHS od 90 do 100 kg!

yi = b0 + b1(xi − 100) = 13.0 + 0.10 ∗ (xi − 100)

• Parametra b0 in b1 sta ocenjeni z ocenama b0 in b1

• Izracunajmo nekaj tock (za premico najmanj dve!)

Masa (kg) 90 94 98 100 102 106 110DHS (mm) 12.0 12.4 12.8 13.0 13.2 13.6 14.0

Kadar se mudi, zadostujeta za premico samo dve tocki!

• Sedaj pa še narišimo graf!

Biometrija 2008/09 37

Graf za debelino hrbtne slanine

Biometrija 2008/09 38

Pomni!

1. Regresijski koeficient ima vedno sestavljeno enoto:v števcu od odvisne spremenljivke, v imenovalcu paod neodvisne spremenljivke (npr. mm/kg, tock/leto)

2. Za ponazoritev uporabimo GRAF S CRTAMI.Neodvisno spremenljivko nanesemo na os X,odvisno na os Y.

3. Kvantitativne vplive praviloma opišemo z regresijo.Izjeme so izredno redke.

4. Porazdelitev neodvisne sprem. prilagodimoposkusu!

Biometrija 2008/09 39

5. Pri regresiji s pomocjo neodvisne (pojasnjevalne)spremenljivke ocenimo, pojasnimo odvisnospremenljivko

Biometrija 2008/09 40

Nacrt poskusa pri kvantitativnih vplivih

1. Neodvisna spremenljivka - dolocimo interval

2. Opazovanja enakomerno pozazdelimo na intervalu

3. Vec opazovanj naredimo lahko

(a) pri ekstremnih vrednosti neodvisne spremenljivke(b) kjer pricakujemo zavoje

4. Neodvisna spremenljivka ima lahko

(a) samo nekatere vrednosti (npr. 90, 94, 98, 100 kg...)(b) vse vrednosti na intervalu(c) porazdelitev NI POMEMBNA!

Biometrija 2008/09 41

Število živorojenih pujskov

Biometrija 2008/09 42

Sestavimo model!

• Vplivi:

Biometrija 2008/09 42

Sestavimo model!

• Vplivi: leto, farma

• Odvisna spremenljivka:

Biometrija 2008/09 42

Sestavimo model!

• Vplivi: leto, farma

• Odvisna spremenljivka: število živorojenih pujskov

• Neodvisna spremenljivka:

Biometrija 2008/09 42

Sestavimo model!

• Vplivi: leto, farma

• Odvisna spremenljivka: število živorojenih pujskov

• Neodvisna spremenljivka: leto, a ni primernefunkcije

• Oznacimo vplive:

Biometrija 2008/09 42

Sestavimo model!

• Vplivi: leto, farma

• Odvisna spremenljivka: število živorojenih pujskov

• Neodvisna spremenljivka: leto, a ni primernefunkcije

• Oznacimo vplive: leto (L), farma (F)

Biometrija 2008/09 43

• Obrazložitev povezave:

Biometrija 2008/09 43

• Obrazložitev povezave:Število živorojenih pujskov se z leti povecuje, apovecevanje ne moremo opisati s funkcijo zaradinepricakovanih sprememb. Ceprav je ugodno, da sevelikost gnezda povecuje, pa nas graf preprica, da zregresijo ne bomo uspešni. Uporabili bomo kar vplivz nivoji - za vsako leto poseben nivo. Med farmamiobstajajo razlike, ki se z leti spreminjajo. Vzroki sorazlicni. Trud, da bi bilo gnezdo povecano, jerazlicno (ne)uspešen.

Biometrija 2008/09 44

Vpliv farme

yij = µ + Fi + eij

Biometrija 2008/09 45

Vpliv leta

yij = µ + Li + eij

Biometrija 2008/09 46

Vpliv farme in leta

yijk = µ +

Biometrija 2008/09 46

Vpliv farme in leta

yijk = µ + Fi +

Biometrija 2008/09 46

Vpliv farme in leta

yijk = µ + Fi + Lj +

Biometrija 2008/09 46

Vpliv farme in leta

yijk = µ + Fi + Lj + eijk

Biometrija 2008/09 47

Primerjava model (modro) : podatki (rdece)

Biometrija 2008/09 47

Primerjava model (modro) : podatki (rdece)

(V tem primeru regresija za vpliv leta ni primerna!)

Biometrija 2008/09 48

Dopolnimo model!

• Ponovno napišimo enacbo modela:yijk = µ +

Biometrija 2008/09 48

Dopolnimo model!

• Ponovno napišimo enacbo modela:yijk = µ + Fi +

Biometrija 2008/09 48

Dopolnimo model!

• Ponovno napišimo enacbo modela:yijk = µ + Fi + Lj +

Biometrija 2008/09 48

Dopolnimo model!

• Ponovno napišimo enacbo modela:yijk = µ + Fi + Lj + eijk

• Ali smo povezavo dovolj dobro opisali?

Biometrija 2008/09 48

Dopolnimo model!

• Ponovno napišimo enacbo modela:yijk = µ + Fi + Lj + eijk

• Ali smo povezavo dovolj dobro opisali?Število ŽP se tudi poslabša ali izboljša za nekaj let.Spremembe so neodvisne od preteklih let. Lahko jeizbruhnila bolezen ... Na farmi 8 so letna povprecjaprecej odstopala od splošnega trenda, ki smo gadolocili z vplivoma farma in leto.

• Dodatni vpliv:

Biometrija 2008/09 48

Dopolnimo model!

• Ponovno napišimo enacbo modela:yijk = µ + Fi + Lj + eijk

• Ali smo povezavo dovolj dobro opisali?Število ŽP se tudi poslabša ali izboljša za nekaj let.Spremembe so neodvisne od preteklih let. Lahko jeizbruhnila bolezen ... Na farmi 8 so letna povprecjaprecej odstopala od splošnega trenda, ki smo gadolocili z vplivoma farma in leto.

• Dodatni vpliv: omogoca, da ima leto na vsaki farmidrugacen vpliv (FL)

Biometrija 2008/09 49

Vpliv farme, leta in interakcija - farma 8

yijk = µ + Fi +

Biometrija 2008/09 49

Vpliv farme, leta in interakcija - farma 8

yijk = µ + Fi + Lj +

Biometrija 2008/09 49

Vpliv farme, leta in interakcija - farma 8

yijk = µ + Fi + Lj + FLij +

Biometrija 2008/09 49

Vpliv farme, leta in interakcija - farma 8

yijk = µ + Fi + Lj + FLij + eijk

Biometrija 2008/09 50

Kvalitativni vplivi

1. Farme bi lahko razvrstli na vec nacinov:

(a) po abecedi,(b) po šifrah,(c) na prvo mesto bi dali farmo, ki nas najbolj zanima.

2. Nivoji so loceni in nepovezani, nimajo vrednosti

3. Za ponazoritev praviloma uporabljamo HISTOGRAME

4. Prirejeni kvalitativni vplivi (leto) - izjema

Biometrija 2008/09 51

Model s kvalitativnimi vplivi

yijk = µ + Fi + Lj + FLij + eijk

kjer pomeni:

• yijk- število živorojenih pujskov

• µ- srednja vrednost * eijk- ostanek

• Fi- vpliv farme; i = 1, 2, ... 9

• Lj- vpliv leta; j = 1980, 1981, ... 2003

• FLij- interakcija med farmo in letom

Biometrija 2008/09 52

Interakcija med farmo in letom

Biometrija 2008/09 53

Interakcija1

Z vplivom leta dobimo splošni (skupaj za vse farme,crna crta na grafu), z interakcijo med farmo in letompa specificni (na farmi, odstopanja posameznih crt odcrne crte) vpliv leta

• bolezen izbruhne samo na eni farmi

• delavec je zaposlen samo na eni farmi

• klima se spreminja po letih in farmah

• hlevi so razlicni in jih adaptirajo ...

• spreminjajo postopke dela1v interakcijo se bomo še poglobili

Biometrija 2008/09 54

Oznacitev interakcije

yijk = µ + Fi + Lj + FLij + eijk

• oznaki vplivov F in L sestavimo v FL

• crke sestavimo po abecednem redu indeksov priglavnih vplivih

• dodamo indekse na koncu oznake

• interakcijo med farmo in letom oznacimo FLij

Biometrija 2008/09 55

Nacrt poskusa pri kvalitativnih vplivih

Poskus poteka med 1980 do 2003 na vec farmahprašicev.

Farma 1980 1981 1982 · · · 2003∑

leta

A n11 n12 n13 · · · n1q n1.

B n21 n22 n23 · · · n2q n2.... ... ... ... . . . ... ...E np1 np2 np3 · · · npq np.∑

farme n.1 n.2 n.3 · · · n.q n

Biometrija 2008/09 56

Nacrt poskusa pri kvalitativnih vplivih

• vse celice naj bodo zapolnjene

• nacrtujte dovolj opazovanj po celicah

• izenacena velikost skupin (celic)

• najmanj eno opazovanje na celico (premalo za resnerezultate!)

• delajmo skromne, enostavne poskuse ...

• podatki iz prakse (proizvodnje) - komplicirani modeli

Biometrija 2008/09 57

Poskus z mladicami

Biometrija 2008/09 58

Farma Žival Pasma Mesec Masa DP DHS (mm)1 1 ŠL Jan 102 540 13 131 2 ŠL Jan 98 550 16 141 3 ŠL Feb 105 550 16 161 4 ŠL Feb 102 580 15 121 5 LW Jan 95 520 20 171 6 LW Feb 101 500 24 241 7 LW Feb 101 490 27 251 8 NL Jan 97 560 26 271 9 NL Jan 100 550 22 191 10 NL Feb 97 600 23 251 11 NL Feb 102 610 24 22

Biometrija 2008/09 59

Dolocimo vplive (mladice)

4 Z mladicami smo opravili poskus na izbrani farmi stremi pasmi v dveh mesecih. Živalim smo ugotovilistarost in jim stehtali maso. Izracunati želimoplemensko vrednost (vpliv živali) za dnevni prirast(DP) in debelino hrbtne slanine (DHS).

Vplivi:

Biometrija 2008/09 59

Dolocimo vplive (mladice)

4 Z mladicami smo opravili poskus na izbrani farmi stremi pasmi v dveh mesecih. Živalim smo ugotovilistarost in jim stehtali maso. Izracunati želimoplemensko vrednost (vpliv živali) za dnevni prirast(DP) in debelino hrbtne slanine (DHS).

Vplivi: pasma (P ), mesec (M ), masa, žival (a)

Neodvisna spremenljivka:

Biometrija 2008/09 59

Dolocimo vplive (mladice)

4 Z mladicami smo opravili poskus na izbrani farmi stremi pasmi v dveh mesecih. Živalim smo ugotovilistarost in jim stehtali maso. Izracunati želimoplemensko vrednost (vpliv živali) za dnevni prirast(DP) in debelino hrbtne slanine (DHS).

Vplivi: pasma (P ), mesec (M ), masa, žival (a)

Neodvisna spremenljivka: masa (x)

Lastnosti:

Biometrija 2008/09 59

Dolocimo vplive (mladice)

4 Z mladicami smo opravili poskus na izbrani farmi stremi pasmi v dveh mesecih. Živalim smo ugotovilistarost in jim stehtali maso. Izracunati želimoplemensko vrednost (vpliv živali) za dnevni prirast(DP) in debelino hrbtne slanine (DHS).

Vplivi: pasma (P ), mesec (M ), masa, žival (a)

Neodvisna spremenljivka: masa (x)

Lastnosti: dnevni prirast, debelina hrbtne slanine

Biometrija 2008/09 60

Sestavimo modela

• za dnevni prirast

yijk = µ + Pi + Mj + aijk + eijk

• za debelino hrbtne slanine

yijkl = µ + Pi + Mj + b(xijk − 100) + aijk + eijkl

• vpliv živali smo oznacili z malo crko (nakljucni vpliv)

• za DHS smo vkljucili regresijo za maso

• pri DHS imamo dve meritvi na žival: vec meritev kotživali

Biometrija 2008/09 61

Stopinje prostosti

DP-o. µ Pi Mj aijk model ostanekparam. 1 3 2 — 6 —s.p. 1 2 1 — 4 11-4=7DP-m. µ Pi Mj PMij aijk model ostanekparam. 1 3 2 — 6 —s.p. 1 2 1 — 4 11-4=7DHS-o. µ Pi Mj b aijk model ostanekparam. 1 3 2 1 — 7 —s.p. 1 2 1 1 — 5 11-5=6DHS-m. µ Pi Mj PMij bij aijk model ostanekparam. 1 3 2 6 6 — 18s.p. 1 2 1 2 6 — 12 11-12 = ???

Biometrija 2008/09 62

Sistematski vplivi

1. imajo malo nivojev (osebkov, enot, razrede)

2. sorazmeroma veliko opazovanj po nivoju

3. proucujemo samo nivoje v poskusu

4. nivoji med seboj niso sorodni ali pa sorodstvozanemarimo

5. ne posplošujemo rezultatov na druge nivoje

Biometrija 2008/09 63

Nakljucni vplivi

1. nivoji vzorceni iz znane porazdelitve

2. imajo vec nivojev (osebkov, enot, razrede)

3. nivoji so med seboj lahko sorodni, zato lahko

4. posplošimo rezultate na druge, sorodne nivoje

Biometrija 2008/09 64

Izjeme?

1. Vpliv živali

(a) ocetje so izbrani in imajo veliko potomcev,(b) matere imajo malo potomcev in so lahko celo

nakljucno izbrane(c) potomci imajo lahko tudi samo eno meritev

2. Rejci

(a) reje so zelo razlicnih velikosti (farme s 15 do 5000plemenskih svinj)

Dilema? Ce imamo veliko nivojev, vzamemo nakljucnivpliv.

Biometrija 2008/09 65

Indeksi pri neodvisni spremenljivki (pojasnilo)

• x ima vec indeksov kot b, kateremu pripada

• nosi indekse vseh ”nadrejenih” vplivov

• mora biti jasno, pri kateremu b -ju pripada (imaindeks pri b -ju )

• mora biti jasno, s katerimi opazovanji (y) je v parih

• indeks za stopnjo polinoma ni dodan neodvisnispremenljivki

• vec neodvisnih spremenljivk ⇒• dodatni indeks na zacetku (npr. x1... in x2... ).

Biometrija 2008/09 66

• dodatne indekse dobijo tudi b -ji.

• z indeksi ne pretiravamo

Biometrija 2008/09 67

Primer 1

Biometrija 2008/09 67

Primer 1

yi = µ + b (xi − 80) + ei

Biometrija 2008/09 68

Primer 2

Biometrija 2008/09 68

Primer 2

yij = µ + Pi + bIi (xij − 80) + bIIi (xij − 80)2 +

+bIIIi (xij − 80)3 + eij

Biometrija 2008/09 69

Primer 3

Biometrija 2008/09 69

Primer 3

yij = µ + bi (xij − 80) + eij