Upload
others
View
6
Download
0
Embed Size (px)
Citation preview
Statistika 2016/17
Testiranje statističkih hipoteza o parametrima osnovnog skupa
Testiranje statističkih hipoteza o parametrima osnovnog skupa
1.Formulacija statističkih hipoteza,
2. Izbor statistike testa i rasporeda verovatnoća,
3. Izbor nivoa značajnosti testa,
4.Formulisanje pravila odlučivanja,
5. Izvlačenje uzorka i izračunavanje statistike testa,
6.Donošenje odluke o statističkoj hipotezi.
Testiranje statističkih hipoteza o parametrima osnovnog skupa
Nulta hipoteza H0:ϴ = ϴ0
Alternativna hipoteza H1:ϴ < ϴ0 (Jednostrana) H1:ϴ ≠ ϴ0 (Dvostrana)
Prosta H:ϴ = ϴ0
Složena H:ϴ > ϴ0
Statistička hipoteza
Statistička hipoteza ili istraživačka hipoteza?
},,{ 2 P
Formulisati nultu i alternativnu hipotezu:
Prosečan vek trajanja sijalice iznosi 1000 h. H0:µ = 1000 H1:µ ≠ 1000 Prosečan broj škartova na proizvodnoj traci je manji od 100. H0:µ ≥ 1000 H1:µ < 1000 Verovatnoća za pobedu na glasanju je veća od 50%. H0:P ≤ 0,5 H1:P > 0,5 Procenat pozitivnih reakcija na uvođenje novog proizvoda nije manji od 75%. H0:P ≥ 0,75 H1:P < 0,75
Stvarna situacija Odluka nakon testiranja o H0
Prihvaćena Odbačena
Istinita H0 Ispravna odluka
(1-α)
Greška I vrste (α)
[nivo značajnosti]
Neistinita H0 Greška II vrste
(β)
Ispravna odluka (1-β)
[moć testa]
Testiranje aritmetičke sredine za poznatu varijansu
n
X2
H0:µ = 1000 H1:µ ≠ 1000
H0:µ ≥ 1000 H1:µ < 1000
H0:µ ≤ 1000 H1:µ > 1000
O d re đ i va n j e k r i t i č n e o b l a s t i :
ima standardizovan normalan raspored (CGT)
Primer
• U bankomatu treba ostaviti dovoljnu količinu novca tokom vikenda. Međutim, banka ne želi da ostavi prevelike zalihe novca i smatra da je prosečan iznos po transakciji normalno raspoređen sa sredinom 300 n.j. i standardnom devijacijom 100 n.j.
• Da li se uz nivo pouzdanosti 95% može smatrati da je procena banke o prosečnom iznosu ispravna, ako je na osnovu 36 slučajno izabranih transakcija prosečan iznos 340 n.j.?
[H0:µ ≤ 300; H1:µ > 300] [u0=2,4 > 1,645 → H0 se odbacuje]
p - vrednost
• Najmanji nivo značajnosti pri kojem se nulta hipoteza može odbaciti na osnovu uzorka.
(p < α → H0 se odbacuje) (p ≥ α → H0 se prihvata)
Ilustracija za H0:µ ≤ µ0 H1:µ > µ0
p - vrednost
Za prethodni primer:
0082,0
)4,2(
36
100
300340
)340(
UP
UP
XPp
Moć testa
Odrediti moć testa ako je stvarna prosečna transakcija 340 n.j.
Moć testa H0 se odbacuje ako je
36
100645,1300
645,10
x
u
225,0
)76,0(
36
100
34041,327
)340|41,327(
UP
UP
XP
Testiranje aritmetičke sredine osnovnog skupa za nepoznatu varijansu
Prosečan broj realizovanih kredita iznosi najmanje 50?
Prosečna novčana vrednost računara iznosi 50000 n.j.?
Prosečno vreme pripreme ispita je manje od 20 sati?
Testiranje aritmetičke sredine osnovnog skupa za nepoznatu varijansu
Veličina uzorka
Statistika testa
Normalan
raspored
Studentov
t-raspored
Xs
Xu 0
0
Xs
Xt 00
U praktičnim primenama za n ≥ 30 Studentov raspored aproksimira se normalnim. Uzorci sa n < 30 nazivaju se “mali uzorci”.
U 50 na slučajan način izabranih dana tokom godine, zabeležen je broj realizovanih kredita u jednoj banci. Prosečan broj realizovanih kredita iznosi 24,74 uz ocenu standardne greške 0,5755. a) Da li se uz nivo pouzdanosti od 95% može smatrati da je
prosečan broj reaizovanih kredita manji od 25? b) Da li se uz nivo pouzdanosti od 99% može smatrati da je
prosečan broj reaizovanih kredita veći od 23? c) Uz nivo pouzdanosti od 90% proveriti da li se može smatrati da
prosečan broj realizovanih kredita iznosi 24? Zadatak rešiti na dva načina: i. Poređenjem statistike testa i tablične vrednosti ii. Izračunavanjem p - vrednosti
Primer
Testiranje proporcije osnovnog skupa
Statistika testa
'
00
'
ps
Ppu
Proporcija pozitivno ocenjenih fakultativnih izleta u turističkoj agenciji je veća od 50%?
Udeo stanovnika koji vrši kupovinu u hipermarketima iznosi 30%?
Manje od 60% studenata redovno pohađa nastavu?
Sa verovatnoćom većom od 60% Google Chrome je omiljeni internet pretraživač?
Testiranje razlike aritmetičkih sredina dva skupa na osnovu uzorka
(nezavisni uzorci)
Da li postoje statistički značajne razlike u prosečnom broju sklopljenih proizvoda između dve smene radnika?
Da li se može smatrati da je prosečnan iznos računa u hipermarketu u dva dana podjednak?
Da li se može smatrati da je razlika prosečnog ostvarenog broja bodova između studenata grupe A za 5 veći od studenata grupe B?
Da li se može smatrati da je razlika prosečnog ostvarenog broja bodova između studenata grupe A najmanje za 5 veći od studenata grupe B?
Ocena standardne greške rasporeda razlike aritmetičkih sredina uzoraka
“pretpostavka o jednakim varijansama”
“pretpostavka o različitim varijansama”
F-test o jednakosti varijansi H0: σ1
2 = σ22
H0: σ12 ≠ σ2
2
Testiranje razlike aritmetičkih sredina dva skupa na osnovu uzorka
(nezavisni uzorci)
Ocena standardne greške rasporeda razlike aritmetičkih sredina uzoraka
“pretpostavka o jednakim varijansama”
2121
2
2
2
1
)(
11
2
)1()1(21
21 nnnn
nns
uu
XX
Broj stepeni slobode: 221 nn
Testiranje razlike aritmetičkih sredina dva skupa na osnovu uzorka
(nezavisni uzorci)
Ocena standardne greške rasporeda razlike aritmetičkih sredina uzoraka
“pretpostavka o različitim varijansama”
Broj stepeni slobode:
2
2
1
2
)(
21
21 nns
uu
XX
2
2
2
2
2
1
2
1
2
2
2
1
2
21
21
1
1
1
1
nnnn
nn
uu
uu
Testiranje razlike aritmetičkih sredina dva skupa na osnovu uzorka
(nezavisni uzorci)
Veličine uzoraka
Statistika testa
Normalan
raspored
Studentov
t-raspored
)(
021210
21
)(
XXs
XXu
)(
021210
21
)(
XXs
XXt
Testiranje razlike aritmetičkih sredina dva skupa na osnovu uzorka
(nezavisni uzorci)
Testiranje razlike aritmetičkih sredina dva skupa na osnovu uzorka
(zavisni uzorci)
Da li je došlo do promene u prosečnom radnom učinku pre i posle promene?
Da li je došlo do promene u prosečnom broju bodova na prvom i drugom kolokvijumu?
Testiranje razlike aritmetičkih sredina dva skupa na osnovu uzorka
(zavisni uzorci)
dyx
yxdyx
yxdyx
yxdyx
nnnnn
.........
22222
11111
Na vrednostima d1, d1,..., dn sprovodi se testiranje aritmetičke sredine
Analiza varijanse jednog faktora varijabiliteta
• Statistički metod za utvrđivanje statistički značajnih razlika u prosečnim vrednostima između 3 ili više grupa (modaliteti faktora).
Prodavac audio opreme zabeležio je prodaju 3 proizvođača opreme:
Da li uz verovatnoću 95% postoje statistički značajne razlike u prosečnoj prodaji audio uređaja između različitih proizvođača? Ako je potrebno, preporučiti prodavcu koji proizvod u budućnosti ne treba da poručuje.
Proizvođač Prodaja
A1 9 6 8 9 11 11
A2 10 9 7 6 8 8
A3 10 9 7 10 13 11
Proizvođač Prodaja
A1 9 6 8 9 11 11
A2 7 6 4 3 5 5
A3 10 9 7 10 13 11
Prodavac audio opreme zabeležio je prodaju 3 proizvođača opreme:
Da li uz verovatnoću 95% postoje statistički značajne razlike u prosečnoj prodaji audio uređaja između različitih proizvođača? Ako je potrebno, preporučiti prodavcu koji proizvod u budućnosti ne treba da poručuje.
tetvarijabili
Rezidualni
tetvarijabili
Faktorski
tetvarijabili
Ukupan
m
i
n
j
iij
m
i
n
j
i
m
i
n
j
ij
iii
xxxxxx1 1
2
1 1
2
1 1
2 )()()(
• Osnovne pretpostavke:
– Varijanse grupa su jednake
– Grupe imaju normalan raspored
• Hipoteze:
– H0: aritmetičke sredine grupa su jednake
– H1: neke dve aritmetičke sredine se razlikuju
Izvor varijacija
Suma kvadrata odstupanja
Broj stepeni slobode
Ocena varijanse
Statistika testa
Kritična vrednost
Između grupa
m – 1
Odnos ocena
varijansi
Unutar grupa
n – m – –
Total n – 1 – – –
mn
SV R
R
1
m
SV A
A ),,( 21 rrF
m
i
iiA xxnS1
2)(
m
i
n
j
iijR
i
xxS1 1
2)(
m
i
n
j
ijT
i
xxS1 1
2)(
O d re đ i va n j e k r i t i č n e o b l a s t i :
Analiza varijanse sa dva faktora varijabiliteta
• Statistički metod za utvrđivanje statistički značajnih razlika u prosečnim vrednostima između grupa (modaliteti faktora A) i blokova (modaliteti faktora B) podataka.
Proizvođač Prodavnica
B1 B2 B3 B4 B5 B6
A1 9 6 8 9 11 11
A2 7 6 4 3 5 5
A3 10 9 7 10 13 11
Prodavac audio opreme je zabeležio prodaju 3 proizvođača u 6 prodavnica:
Da li uz verovatnoću 95% postoje statistički značajne razlike u prosečnoj prodaji audio uređaja između različitih proizvođača i između različitih prodavnica?
• Hipoteze:
– H0: aritmetičke sredine grupa (faktor A) su jednake
– H1: neke dve aritmetičke sredine se razlikuju
• Hipoteze:
– H0: aritmetičke sredine blokova (faktor B) su jednake
– H1: neke dve aritmetičke sredine se razlikuju
Izvor varijacija
Suma kvadrata odstupanja
Broj stepeni slobode
Ocena varijanse
Statistika testa
Tablična vrednost
Između grupa
m – 1 Odnos ocena
varijansi
Između blokova
s – 1 Odnos ocena
varijansi
Rezidual (m–1)(s–1) – –
Total n – 1 – – –
)1)(1(
sm
SV R
R
1
m
SV A
A ),,( rrF
m
i
iA xxsS1
2)(
m
i
s
j
ijT xxS1 1
2)(
s
j
jB xxmS1
2)(1
s
SV B
B
BATR SSSS
),,( rrF
O d re đ i va n j e k r i t i č n e o b l a s t i :