25
1 Binomna Binomna , Poissonova i , Poissonova i normalna raspodela normalna raspodela Goran Trajković februar, 2009. godine Binomna Binomna raspodela spodela Bernoullijev ogled – ogled sa binomnim (dihotomnim) međusobno isključivim ishodima: 1. ishod od interesa, povoljan ishod, “uspeh” (sa verovatnoćom p) 2. nepovoljan ishod, “neuspeh” (sa verovatnoćom q=1- p) Bernoullijev proces: 1. Ponavljanje jednog ogleda sa dva ishoda 2. Ogledi su nezavisni 3. Verovatnoća ishoda u pojedinačnim ogledima je jednaka Raspodela verovatnoća diskretne slučajne promenljive za broj ostvarenih događaja od interesa u ogledu koji se sastoji od fiksnog broja Bernoullijevih ogleda. Slučajna promenljiva može imati celobrojne nenegativne vrednosti x=0, 1, 2, ..., n koje predstavljaju: (1) broja “povoljnih” ishoda posle n pokušaja, ili (2) broja jedinica sa datom karakteristikom u uzorku veličine n. Binomna Binomna raspodela spodela Binomni keoficijent – broj kombinacija x povoljnih ishoda u n ogleda: Npr. broj kombinacija za dva ostvarena povoljna ishoda (x=2) u sekvenci od 4 nezavisnih ogleda (n=4) iznosi 6: ( ) ! ! ! x n x n ( ) 6 ! 2 4 ! 2 ! 4 = Ako je A povoljan, a B nepovoljan ishod, specifične kombinacije za dva “povoljna” ishoda u 4 ogleda imaće izgled: AABB ABAB ABBA BAAB BABA BBAA Binomna verovatnoća – verovatnoća da će se ostvariti x povoljnih ishoda u sekvenci od n nezavisnih ogleda x – broj “uspeha” n – broj dihotomnih ogleda (veličina uzorka) p – verovatnoća “uspeha” q – verovatnoća “neuspeha” n i p – parametri binomne raspodele () ( ) x n x q p x n x n x P = ! ! ! Očekivanje Standardna devijacija p n = μ q p n = σ Primer: Ako je učestalost krvne grupe A u datoj populaciji 42% (p=0.42), verovatnoća da će slučajan uzorak veličine 7 osoba (n=7), izabran iz te iste populacije, sadržati 2 osobe sa krvnom grupom A (x=2) iznosi: () ( ) ( ) 243 . 0 58 . 0 42 . 0 ! 2 7 ! 2 ! 7 2 7 2 = = x P

Binomna, Poissonova i normalna raspodela

Embed Size (px)

Citation preview

Page 1: Binomna,      Poissonova i normalna raspodela

1

BinomnaBinomna, Poissonova i , Poissonova i normalna raspodelanormalna raspodela

Goran Trajković

februar, 2009. godine

BinomnaBinomna rraaspodelaspodela

Bernoullijev ogled – ogled sa binomnim (dihotomnim) međusobno isključivim ishodima:

1. ishod od interesa, povoljan ishod, “uspeh” (sa verovatnoćom p)

2. nepovoljan ishod, “neuspeh” (sa verovatnoćom q=1- p)

Bernoullijev proces:1. Ponavljanje jednog ogleda sa dva ishoda2. Ogledi su nezavisni3. Verovatnoća ishoda u pojedinačnim ogledima je jednaka

Raspodela verovatnoća diskretne slučajne promenljive za broj ostvarenih događaja od interesa u ogledu koji se sastoji od fiksnog broja Bernoullijevih ogleda. Slučajna promenljiva može imati celobrojne nenegativne vrednosti x=0, 1, 2, ..., n koje predstavljaju:(1) broja “povoljnih” ishoda posle n pokušaja, ili (2) broja

jedinica sa datom karakteristikom u uzorku veličine n.

BinomnaBinomna rraaspodelaspodela Binomni keoficijent – broj kombinacija x povoljnih ishoda u n ogleda:

Npr. broj kombinacija za dva ostvarena povoljna ishoda (x=2) u sekvenci od 4 nezavisnih ogleda (n=4) iznosi 6:

( )!!!

xnxn−

( ) 6!24!2

!4=

Ako je A povoljan, a B nepovoljan ishod, specifične kombinacije za dva “povoljna” ishoda u 4 ogleda imaće izgled:

AABB ABAB ABBA BAAB BABA BBAA

Binomna verovatnoća – verovatnoća da će se ostvariti xpovoljnih ishoda u sekvenci od n nezavisnih ogleda

x – broj “uspeha”n – broj dihotomnih ogleda (veličina uzorka)p – verovatnoća “uspeha”q – verovatnoća “neuspeha”

n i p – parametri binomne raspodele

( ) ( )xnxqp

xnxnxP −⋅−

=!!

!

Očekivanje

Standardna devijacija

pn ⋅=μ

qpn ⋅⋅=σ

Primer:Ako je učestalost krvne grupe A u datoj populaciji 42% (p=0.42), verovatnoća da će slučajan uzorak veličine 7 osoba (n=7), izabran iz te iste populacije, sadržati 2 osobe sa krvnom grupom A (x=2) iznosi:

( ) ( )( ) 243.058.042.0

!27!2!7 272 =⋅⋅−

= −xP

Page 2: Binomna,      Poissonova i normalna raspodela

2

U istom primeru, verovatnoće za svih 8 mogućih rezultata, da u uzorku neće biti nijedne, pa sve do toga će svih 7 osoba imati krvnu grupu A (x= 0, ... 7) iznose (tabelarno i grafički):

1.000Σ0.00270.02260.09250.21340.29430.24320.11210.0220

pBroj osoba sa krvnom grupom A

0

0.1

0.2

0.3

0.4

0 1 2 3 4 5 6 7

Broj osoba sa krvnom grupom A

Vero

vatn

oća

PPoissonovaoissonova raspodelaraspodela

Poissonova raspodela definiše verovatnoće brojaretkih slučajnih događaja u konstatnoj jednici prostora ili vremena.

Za ove događaje važi:1. Događaji su nezavisni. Pojava jednog događaja ne

utiče na verovatnoću drugog događaja (slučajnost događaja)

2. U teorijskom smilsu, moguć je beskonačan broj događaja u konstantnoj jedinici prostora ili vremena

3. U bilo kom malom intervalu ili prostoru verovatnoća pojave događaja proporcionalna je veličini intervala

PPoissonovaoissonova raspodelaraspodela

Primeri moguće primene u analizi:•Slučajne raspodele retkih bolesti u različitim delovima zemlje•Broja zahteva za hitnu medicinsku intervenciju•Broja mutacija u lancu DNA za dati nivo radijacije•Broj bakterijskih kolonija, ili broja bakterija u preparatu•Broja krvnih ćelija u komori za prebrojavanje•Broja nesreća

Funkcija verovatnoFunkcija verovatnoćća a PPoissonovoissonoveeraspodelraspodelee

Funkcija verovatnoća Poissonove raspodele definisana je formulom:

x - broj ostvarenih događaja u konstatnoj jednici prostora ili vremena,λ- parametar Puasonove raspodele i predstavlja prosečan broj događaja u jednici prostora ili vremena,e ≈ 2.72 (osnova prirodnih logaritama)Očekivana vrednost, varijansa i standardna devijacija:

λσμ == 2 λσ =

( )!x

exPxλλ−=

Verovatnoća za nula događaja (x=0) dobija se iz tablice ili pomoću formule:

Verovatnoće za jedan, dva ili više (x=1, 2, ...) događajamogu se dobiti rekurzivnim formulama:

( )!0

00λλ−= eP

( ) ( )

( ) ( )

( ) ( )3

23

212

01

λ

λλ

PP

PP

PP

=

=

=

Primer:Broj porođaja po danima u jednoj opštini u vremesnkom periodu od 110 dana iznosio je:

broj porođaja 0 1 2 3 4 5 6 7 8 9 10u jednom danu

broj dana 2 10 18 23 22 16 10 5 3 0 1

Kolika je verovatnoća da u jednom danu budu dva porođaja? Kolika je verovatnoća da u jednom danu bude manje od 3 porođaja? Kolika je verovatnoća da u jednom danu bude više od 2 porođaj?

Page 3: Binomna,      Poissonova i normalna raspodela

3

Prosečan broj porođaja po jednom danu iznosio je: λ=412/110=3.75

Verovatnoća da u jednom danu ne bude porođaja iznosi:P(0) = 0.024

Verovatnoća da u jednom danu budu dva porođaja oznosi: P(2) = 0.166

Verovatnoća da u jednom danu bude manje od 3 porođaja iznosi:P(X<3) = P(0) + P(1) + P(2) = 0.024 + 0.088 + 0.166 = 0.278

Verovatnoća da u jednom danu bude više od 2 porođaja iznosi: P(X>4) = 1 – (P(0) + P(1) + P(2)) == 1 – 0.024 + 0.088 + 0.166 = 0.722

Normalna raspodelaNormalna raspodelaKontinuirana raspodela verovatnoća. Definisana formulom:

2

2

2)(

21)( σ

μ

πσ

−−

=x

exf

μ – sredina, σ2 – varijansa, π – 3.14, e – 2.72

X

f(X)

μ

σ

•Kompletno opisana parametrima μ i σ.•Dobra aproksimacija za mnoge biološke varijable.•Osnova u procesu statističkog zaključivanja

OsobineOsobine nnormalnormalnee raspodelraspodelee

• U intervalu od μ-σ do μ+σ nalazi se 68% vrednosti

• U intervalu od μ-2σ do μ+2σ nalazi se 95% vrednosti

• U intervalu od μ-3σ do μ+3σ nalazi se 99.7% vrednosti

StandardStandardna na normalnormalnana raspodelaraspodela

-2 -1 0 1 2 3

0.1

0.2

0.3

0.4

Standardna normalna raspodela ima μ=0 i σ=1.

Sve normalne raspodele mogu biti konvertovane u standardnu normalnu raspodelu oduzimanjem aritmetičke sredine od svake vrednosti i deljenjem sa standardnom devijacijom čime se dobijaju standardni skorovi ili z-skorovi:

σμ−

=XZ

Tabele povrTabele površšine ispod ine ispod krivekrivesstandardtandardne ne normalnormalnene rraspodeleaspodele

Tabele pokazuje površine odnosno verovatnoće da neka vrednost bude veća ili manja od specifikovane standardne vrednosti. Ako tabela pokazuje površine od -∞ do z0 onda vrednosti u toj tabeli pokazuju verovatnoće: P(z≤z0).Uz pomoć tabela se može izračunati verovatnoća da se neka vrednost nađe između dve specifikovane standardne vrednosti.

Tabele povrTabele površšine ispod ine ispod krivekrivesstandardtandardne ne normalnormalnene rraspodeleaspodele

Primer:Telesna masa određene populacije dece je normalno raspoređena sa aritmetičkom sredinom 15kg i SD 3kg. Kolika je verovatnoća da će slučajno izabrano dete imati telesnu masu između 11kg i 17kg?

33.131511

1 −=−

=z 66.031517

2 =−

=z

P(11≤x ≤17)=P(-1.33≤z ≤0.66)= 0.4082+0.2454=0.6536

Page 4: Binomna,      Poissonova i normalna raspodela

4

Provera normalnosti raspodele1. CV>50% ukazuje na odstupanje od normalne

raspodele2. Vrednosti skjunisa i kurtosisa od -1 do 1 ukazuju na

normalnu raspodelu. Vrednosti skjunisa i kurtosisa veće od 3 i manje od -3 ukazuju na odstupanje od normalne raspodele. Kod pozitivno iskošene raspodele aritmetička sredina je veća od medijane. Kod negativno iskošene raspodele aritmetička sredina je manja od medijane

3. Statističko testiranje normalnosti: Kolmogorov-Smirnov test i Shapiro-Wilk test. Ako je p<0.05 u ovim testovima, empirijska raspodela statistički značajno odstupa od normalne.

Provera normalnosti raspodeleGrafičke metode:4. Histogram – vizuelna procena da li je empirijska

raspodela slična zvonastoj simetričnoj raspodeli5. Normalni Q–Q grafikon. Ako je raspodela normalna

tačke će biti na pravoj liniji. Odstupanje tačaka od prave linije ukazuje na odstupanje raspodele od normalne.

6. Detrendovani normalni Q–Q grafikon. Ako je raspodela normalna tačke će biti ravnomerno raspoređene iznad i ispod horizontalne linije. Ako raspodela nije normalna raspored tačaka će imati neki oblik kao npr. slovo J

Provera normalnosti raspodele8. Grafikon kutije (“boxplot”). Ako postoji nekoliko

ekstremnih vrednosti ili neobičnih vrednosti na bilo kom kraju raspodele to ukazuje na odstupanje od normalne raspodele. Ako medijana nije u centru grafikona kutije već je znatno bliža jednom od krajeva kutije, to ukazuje na odstupanje od normalne raspodele

Page 5: Binomna,      Poissonova i normalna raspodela

BinomnaBinomna, Poissonova i , Poissonova i normalna raspodelanormalna raspodela

Goran Trajković

februar, 2009. godine

Page 6: Binomna,      Poissonova i normalna raspodela

BinomnaBinomna rraaspodelaspodela

Bernoullijev ogled – ogled sa binomnim (dihotomnim) međusobno isključivim ishodima:

1. ishod od interesa, povoljan ishod, “uspeh” (sa verovatnoćom p)

2. nepovoljan ishod, “neuspeh” (sa verovatnoćom q=1- p)

Bernoullijev proces:1. Ponavljanje jednog ogleda sa dva ishoda2. Ogledi su nezavisni3. Verovatnoća ishoda u pojedinačnim ogledima je jednaka

Page 7: Binomna,      Poissonova i normalna raspodela

Raspodela verovatnoća diskretne slučajne promenljive za broj ostvarenih događaja od interesa u ogledu koji se sastoji od fiksnog broja Bernoullijevih ogleda. Slučajna promenljiva može imati celobrojne nenegativne vrednosti x=0, 1, 2, ..., n koje predstavljaju:(1) broja “povoljnih” ishoda posle n pokušaja, ili (2) broja

jedinica sa datom karakteristikom u uzorku veličine n.

BinomnaBinomna rraaspodelaspodela

Page 8: Binomna,      Poissonova i normalna raspodela

Binomni keoficijent – broj kombinacija x povoljnih ishoda u n ogleda:

Npr. broj kombinacija za dva ostvarena povoljna ishoda (x=2) u sekvenci od 4 nezavisnih ogleda (n=4) iznosi 6:

( )!!!

xnxn−

( ) 6!24!2

!4=

Ako je A povoljan, a B nepovoljan ishod, specifične kombinacije za dva “povoljna” ishoda u 4 ogleda imaće izgled:

AABB ABAB ABBA BAAB BABA BBAA

Page 9: Binomna,      Poissonova i normalna raspodela

Binomna verovatnoća – verovatnoća da će se ostvariti xpovoljnih ishoda u sekvenci od n nezavisnih ogleda

x – broj “uspeha”n – broj dihotomnih ogleda (veličina uzorka)p – verovatnoća “uspeha”q – verovatnoća “neuspeha”

n i p – parametri binomne raspodele

( ) ( )xnxqp

xnxnxP −⋅−

=!!

!

Očekivanje

Standardna devijacija

pn ⋅=μ

qpn ⋅⋅=σ

Page 10: Binomna,      Poissonova i normalna raspodela

Primer:Ako je učestalost krvne grupe A u datoj populaciji 42% (p=0.42), verovatnoća da će slučajan uzorak veličine 7 osoba (n=7), izabran iz te iste populacije, sadržati 2 osobe sa krvnom grupom A (x=2) iznosi:

( ) ( )( ) 243.058.042.0

!27!2!7 272 =⋅⋅−

= −xP

Page 11: Binomna,      Poissonova i normalna raspodela

U istom primeru, verovatnoće za svih 8 mogućih rezultata, da u uzorku neće biti nijedne, pa sve do toga će svih 7 osoba imati krvnu grupu A (x= 0, ... 7) iznose (tabelarno i grafički):

1.0001.000ΣΣ0.0020.002770.0220.022660.0920.092550.2130.213440.2940.294330.2430.243220.1120.112110.0220.02200

ppBroj osoba sa Broj osoba sa krvnom grupom Akrvnom grupom A

0

0.1

0.2

0.3

0.4

0 1 2 3 4 5 6 7Broj osoba sa krvnom grupom A

Vero

vatn

oća

Page 12: Binomna,      Poissonova i normalna raspodela

PPoissonovaoissonova raspodelaraspodela

Poissonova raspodela definiše verovatnoće brojaretkih slučajnih događaja u konstatnoj jednici prostora ili vremena.

Za ove događaje važi:1. Događaji su nezavisni. Pojava jednog događaja ne

utiče na verovatnoću drugog događaja (slučajnost događaja)

2. U teorijskom smilsu, moguć je beskonačan broj događaja u konstantnoj jedinici prostora ili vremena

3. U bilo kom malom intervalu ili prostoru verovatnoća pojave događaja proporcionalna je veličini intervala

Page 13: Binomna,      Poissonova i normalna raspodela

PPoissonovaoissonova raspodelaraspodela

Primeri moguće primene u analizi:•Slučajne raspodele retkih bolesti u različitim delovima zemlje•Broja zahteva za hitnu medicinsku intervenciju•Broja mutacija u lancu DNA za dati nivo radijacije•Broj bakterijskih kolonija, ili broja bakterija u preparatu•Broja krvnih ćelija u komori za prebrojavanje•Broja nesreća

Page 14: Binomna,      Poissonova i normalna raspodela

Funkcija verovatnoFunkcija verovatnoćća a PPoissonovoissonoveeraspodelraspodelee

Funkcija verovatnoća Poissonove raspodele definisana je formulom:

x - broj ostvarenih događaja u konstatnoj jednici prostora ili vremena,λ- parametar Puasonove raspodele i predstavlja prosečan broj događaja u jednici prostora ili vremena,e ≈ 2.72 (osnova prirodnih logaritama)Očekivana vrednost, varijansa i standardna devijacija:

λσμ == 2 λσ =

( )!x

exPxλλ−=

Page 15: Binomna,      Poissonova i normalna raspodela

Verovatnoća za nula događaja (x=0) dobija se iz tablice ili pomoću formule:

Verovatnoće za jedan, dva ili više (x=1, 2, ...) događajamogu se dobiti rekurzivnim formulama:

( )!0

00λλ−= eP

( ) ( )

( ) ( )

( ) ( )3

23

212

01

λ

λλ

PP

PP

PP

=

=

=

Page 16: Binomna,      Poissonova i normalna raspodela

Primer:Broj porođaja po danima u jednoj opštini u vremesnkom periodu od 110 dana iznosio je:

broj porođaja 0 1 2 3 4 5 6 7 8 9 10u jednom danu

broj dana 2 10 18 23 22 16 10 5 3 0 1

Kolika je verovatnoća da u jednom danu budu dva porođaja? Kolika je verovatnoća da u jednom danu bude manje od 3 porođaja? Kolika je verovatnoća da u jednom danu bude više od 2 porođaj?

Page 17: Binomna,      Poissonova i normalna raspodela

Prosečan broj porođaja po jednom danu iznosio je: λ=412/110=3.75

Verovatnoća da u jednom danu ne bude porođaja iznosi:P(0) = 0.024

Verovatnoća da u jednom danu budu dva porođaja oznosi: P(2) = 0.166

Verovatnoća da u jednom danu bude manje od 3 porođaja iznosi:P(X<3) = P(0) + P(1) + P(2) = 0.024 + 0.088 + 0.166 = 0.278

Verovatnoća da u jednom danu bude više od 2 porođaja iznosi: P(X>4) = 1 – (P(0) + P(1) + P(2)) == 1 – 0.024 + 0.088 + 0.166 = 0.722

Page 18: Binomna,      Poissonova i normalna raspodela

Normalna raspodelaNormalna raspodelaKontinuirana raspodela verovatnoća. Definisana formulom:

2

2

2)(

21)( σ

μ

πσ

−−

=x

exf

μ – sredina, σ2 – varijansa, π – 3.14, e – 2.72

X

f(X)

μ

σ

•Kompletno opisana parametrima μ i σ.•Dobra aproksimacija za mnoge biološke varijable.•Osnova u procesu statističkog zaključivanja

Page 19: Binomna,      Poissonova i normalna raspodela

OsobineOsobine nnormalnormalnee raspodelraspodelee

U intervalu od μ-σ do μ+σ nalazi se 68% vrednostiU intervalu od μ-2σ do μ+2σ nalazi se 95% vrednostiU intervalu od μ-3σ do μ+3σ nalazi se 99.7% vrednosti

Page 20: Binomna,      Poissonova i normalna raspodela

StandardStandardna na normalnormalnana raspodelaraspodela

-2 -1 0 1 2 3

0.1

0.2

0.3

0.4

Standardna normalna raspodela ima μ=0 i σ=1.

Sve normalne raspodele mogu biti konvertovane u standardnu normalnu raspodelu oduzimanjem aritmetičke sredine od svake vrednosti i deljenjem sa standardnom devijacijom čime se dobijaju standardni skorovi ili z-skorovi:

σμ−

=XZ

Page 21: Binomna,      Poissonova i normalna raspodela

Tabele povrTabele površšine ispod ine ispod krivekrivesstandardtandardne ne normalnormalnene rraspodeleaspodele

Tabele pokazuje površine odnosno verovatnoće da neka vrednost bude veća ili manja od specifikovane standardne vrednosti. Ako tabela pokazuje površine od -∞ do z0 onda vrednosti u toj tabeli pokazuju verovatnoće: P(z≤z0).Uz pomoć tabela se može izračunati verovatnoća da se neka vrednost nađe između dve specifikovane standardne vrednosti.

Page 22: Binomna,      Poissonova i normalna raspodela

Tabele povrTabele površšine ispod ine ispod krivekrivesstandardtandardne ne normalnormalnene rraspodeleaspodele

Primer:Telesna masa određene populacije dece je normalno raspoređena sa aritmetičkom sredinom 15kg i SD 3kg. Kolika je verovatnoća da će slučajno izabrano dete imati telesnu masu između 11kg i 17kg?

33.131511

1 −=−

=z 66.031517

2 =−

=z

P(11≤x ≤17)=P(-1.33≤z ≤0.66)= 0.4082+0.2454=0.6536

Page 23: Binomna,      Poissonova i normalna raspodela

Provera normalnosti raspodeleProvera normalnosti raspodele1. CV>50% ukazuje na odstupanje od normalne

raspodele2. Vrednosti skjunisa i kurtosisa od -1 do 1 ukazuju na

normalnu raspodelu. Vrednosti skjunisa i kurtosisa veće od 3 i manje od -3 ukazuju na odstupanje od normalne raspodele. Kod pozitivno iskošene raspodele aritmetička sredina je veća od medijane. Kod negativno iskošene raspodele aritmetička sredina je manja od medijane

3. Statističko testiranje normalnosti: Kolmogorov-Smirnov test i Shapiro-Wilk test. Ako je p<0.05 u ovim testovima, empirijska raspodela statistički značajno odstupa od normalne.

Page 24: Binomna,      Poissonova i normalna raspodela

Provera normalnosti raspodeleProvera normalnosti raspodeleGrafičke metode:4. Histogram – vizuelna procena da li je empirijska

raspodela slična zvonastoj simetričnoj raspodeli5. Normalni Q–Q grafikon. Ako je raspodela normalna

tačke će biti na pravoj liniji. Odstupanje tačaka od prave linije ukazuje na odstupanje raspodele od normalne.

6. Detrendovani normalni Q–Q grafikon. Ako je raspodela normalna tačke će biti ravnomerno raspoređene iznad i ispod horizontalne linije. Ako raspodela nije normalna raspored tačaka će imati neki oblik kao npr. slovo J

Page 25: Binomna,      Poissonova i normalna raspodela

Provera normalnosti raspodeleProvera normalnosti raspodele8. Grafikon kutije (“boxplot”). Ako postoji nekoliko

ekstremnih vrednosti ili neobičnih vrednosti na bilo kom kraju raspodele to ukazuje na odstupanje od normalne raspodele. Ako medijana nije u centru grafikona kutije već je znatno bliža jednom od krajeva kutije, to ukazuje na odstupanje od normalne raspodele