Upload
lynhu
View
226
Download
4
Embed Size (px)
Citation preview
StatistikeStatistike
Statistike su slučajne promenljive Y =f (X1, X2, ..., Xn ) koje se formiraju na osnovu prostog slučajnog uzorka X X XX1, X2, ..., Xn .Na osnovu definicije prostog slučajnog uzorka, osobina funkcije f i raspodele obeležja, mogu se odrediti j f p j gkarakteristike sp Y.Polazeći od realizovanog uzorka (x1, x2, ..., xn ) računamo realizovanu vrednost =f ( ) sp Yrealizovanu vrednost y =f (x1, x2, ..., xn ) sp Y.
1
Uzoračka sredinaUzoračka sredina
• Defnicija. Neka je X1, X2, ..., Xn prost slučajan uzorak j j 1, 2, , n p jobima n za posmatrano obeležje X. Uzoračka sredina je statistika
1 )...(11 nn XX
nX ++=
• Na osnovu definicije prostog slučajanog uzorka i osobina matematičkog očekivanja
2σmXEXE n == )()(n
XD n )( σ=
2
Izračunavanje uzoračke sredineIzračunavanje uzoračke sredine
• Ako su podaci u uzorku dati kao niz vrednosti x1, ..., xnp 1, , nbez sređivanja, tada je realizovana vrednost uzoračke sredine
)(1
• Ako je uzorak dat u obliku tabele, tada je realizovana
)...(11 nn xx
nx ++=
j , jvrednost statistike
1
nX
)...(111 kkn xnxn
nx ++=
Vrednost obeležja
x1 x2 ... xk
Tabela 1.
obeležjafrekvencija n1 n2 ... nk 3
Izračunavanje uzoračke sredineIzračunavanje uzoračke sredine
• Ako je uzorak dat u obliku Tabele 2, prvo se odrede j , ppredstavnici intervala [aj, aj+1) – najčešće su to njihove sredine xj’. Tada je realizovana vrednost statistike nX
Vrednost obeležja
[a1, a2) [a2, a3) ... [aj, aj+1]
f k ijTabela 2.
frekvencija n1 n2 ... nk
1 )'...'(111 kkn xnxn
nx ++=
4
Uzoračka disperzijaUzoračka disperzija
• Uzoračka sredina je blisko povezana sa matematičkim j počekivanjem obeležja, daje nam podatak o prosečnoj vrednosti obeležja na uzorku.U čk di ij d j d t j d ti b l žj• Uzoračka disperzija daje odstupanje vrednosti obeležja od prosečne vrednosti.
• Neka je X1, X2, ..., Xn prost slučajan uzorak obima ne a je 1, 2, , n p ost s učaja u o a ob a nza posmatrano obeležje X. Ukoliko se smatra da je za obeležje X poznato matematičko očekivanje E(X)=m, tada je uzoračka disperzija statistikatada je uzoračka disperzija statistika
))(...)((1~ 221
2 mXmXS nn −++−=n
5
Uzoračka disperzija nastavakUzoračka disperzija, nastavak
• Ako matematičko očekivanje nije poznato, tada je j j p , juzoračka disperzija
))(...)((1 221
2nnnn XXXXS −++−= ))()(( 1 nnnn n
• Korigovana uzoračka disperzija je
1 ))(...)((1
1ˆ 221
2nnnn XXXX
nS −++−
−=
• Uzoračka disperzija se može računati i po formuli:• Uzoračka disperzija se može računati i po formuli:
( )221
2 )...(1nnn XXXS −++= ( )1 )( nnn n
6
Uzoračka disperzija i mat. očekivanjeUzoračka disperzija i mat. očekivanje
• Veza korigovane i uzoračke disperzije je:g p j j
22
1ˆ
nn Sn
nS−
=
• Na osnovu definicije uzoračke disperzije i osobina matematičkog očekivanja dobija se:
2221
2 )())(...)((1)~( σ==
−++−= XDmXmX
nESE nn
( ) )(1)...(1)( 221
2 XDn
nXXXn
ESE nnn−
=
−++=
n )(1
)ˆ( 22 XDSn
nESE nn =
−=
7
Uzorački moment drugog redaUzorački moment drugog reda
• Ako su podaci dati po intervalima, javlja se razlika p p , j jizmeđu vrednosti uzoračke disperzije dobijene na osnovu podataka i uzoračke disperzije koja se dobija na osnovu podataka sređenih intervalnoosnovu podataka sređenih intervalno.
• Neka je uzorački moment drugog reda računat na osnovu Tabele 1
2nx
∑=
=k
jjjn xn
nx
1
22 1
čki t d d č t i t d tka uzorački moment drugog reda računat za iste podatke predstavljene u Tabeli 2 je (intervali su dužine d). Tada
*2nx
2d Šepardova
12*22 dxx nn −=
Šepardovakorekcija
8
Uzorački modUzorački mod
• Mod uzorka je (u slučaju Tabele 1) svaka vrednost xjj ( j ) jobeležja za čiju odgovarajuću frekvenciju nj važi:
nj > nj-1 i nj > nj+1 .U l č j T b l 2 k d ži i t l j d k• U slučaju Tabele 2, ako su dužine intervala jednake c, a mod se nalazi u intervalu [aj, aj+1), tada je mod uzorka
δ∆+δ
δ+=
cam j0
δ ∆1−−=δ jj nn 1+−=∆ jj nn
• Ako postoji samo jedan mod, raspodela je unimodalna, ako ima dva moda bimodalna a ako ima više modovaako ima dva moda, bimodalna, a ako ima više modova, raspodela je polimodalna.
9
Medijana uzorkaMedijana uzorka
• Medijana uzorka se u slučaju Tabele 1 dobija tako što j j jse prvo napiše varijacioni niz
nyyy ≤≤≤ ...21
pa je medijana uzorka
+=+ knyk
112,1
=+
=+ knyym
kke 2),(
21
1
• Ako su podaci dati u obliku Tabele 2 a medijana se• Ako su podaci dati u obliku Tabele 2, a medijana se nalazi u intervalu [aj, aj+1), tada je uzoračka medijana:
j cn 1+
jkjje n
cnnam ]2
[1∑=
−+=10
Uzorački moment reda kUzorački moment reda k
• Neka je x1, ..., xn realizovani prost slučajan uzorak j 1, , n p jobima n za obeležje X. Obični uzorački moment reda kje
∑n
kx1∑=i
ixn 1
• Centralni uzorački moment reda k je
∑=
−n
i
kni xx
n 1)(1
• Uzoračka sredina je uzorački moment prvog reda, a uzoračka disperzija je uzorački moment drugog reda.
11
Uzorački koeficijentiUzorački koeficijenti
• Uzorački koeficijent varijacije jej j j j
n
nV x
sc = ∑=
−=k
jnjjn xxn
ns
1
2)(1
n
• Uzorački koeficijent asimetrije je
c k13
3
)( nsc
• Uzorački koeficijent spljoštenosti je
∑=
−=k
jnjj xxn
nc
1
33 )(1
Uzorački koeficijent spljoštenosti je
3)( 4
4 −sc
∑=
−=k
jnjj xxn
nc
1
44 )(1
)( ns j
12
Računanje realizovanih statistikaRačunanje realizovanih statistika• Za sledeći primer, odrediti uzoračku sredinu, disperziju, mod,
medijanu, koeficijent varijacije, koeficijent asimetrije i koeficijent j j j j j j jspljoštenosti.
Broj četvorki 0 1 2 3 4 5 6Broj godina 12 21 14 8 2 2 1j g
• Uzoračka sredina je 6167,1)16...120(601
60 =⋅++⋅=x
• Uzoračka disperzija je ( ) 8364,11)6(...12)0(601 2
602
60260 =⋅−++⋅−= xxs
• Uzorački mod je m0=1, uzoračka medijana je 3.j 0 j j
• Uzorački koeficijent varijacije je 8382,060
60 ==xscV
• Uzorački koeficijent asimetrije je ( ) ( ) 7839,11)6(...12)0(60
1 360
3603 =⋅−++⋅− xx
sj j j ( )60 60s
• Uzorački koeficijent spljoštenosti je ( ) ( ) 0048,131)6(...12)0(60
1 460
4604
60
=−⋅−++⋅− xxs 13
Statistike kao slučajne promenljiveStatistike kao slučajne promenljive
• Neka je dat prost slučajan uzorak X1, X2, ..., XN . Uz j p j 1, 2, , N standardnu oznaku ∑
=
=n
jjn X
nX
1
1
• Uzorački koeficijent varijacije je statistikan
nj XXn∑ − 2)(1
n
jj
V Xn
C∑== 1
• Uzorački koeficijent asimetrije je statistikaUzorački koeficijent asimetrije je statistika
31
3
1
)(1
−=π
∑=
n
jnj XX
n
1
2)(1
−∑
=
n
jnj XX
n 14
Statistike poretkaStatistike poretka
• Statistika poretka prvog ranga jep p g g j
jnjXY
≤≤=
11 min
St ti tik tk t j• Statistika poretka n-tog ranga je
jnjn XY≤≤
=1max
j
• Statistike poretka prvog, drugog, …, n-tog ranga su redom prvi, drugi, …, n-ti element varijacionog niza.
• Raspon uzorka je razlika statistike poretka n-tog i prvog ranga
1YYR n −=
15
Statistike kao slučajne promenljiveStatistike kao slučajne promenljive
• Uzorački koeficijent spljoštenosti je statistikaj p j j
3)(1
41
4
3 −
−=π
∑=
n
jnj XX
n
)(11
2
−∑
=
n
jnj XX
n
U čk dij j t ti tik• Uzoračka medijana je statistika
+=
=+ knY
mk
112,1
=+ + knYYm
kke 2),(
21
1
16
ZadatakZadatak
• Neka je X1, X2, ..., Xn prost slučajan uzorak za obeležje j 1, 2, , n p j jX koje ima normalnu raspodelu N (m, σ2). Dokazati da je raspodela uzoračke sredine raspodela N (m, σ2/n) a raspodela za
nXσ2/n), a raspodela za
2
2~
σnS
je 2nχ raspodela.σ
))(...)((1~ 221
2 mXmXn
S nn −++−=
17
Uzorački kvantiliUzorački kvantili
• Uzorački l-procentni kvantil je broj koji je veći od l% p j j j jvrednosti iz uzorka. Ako je u pitanju 25% elemenata iz uzorka, kvantil se zove prvi kvartil i označava se sa q1.Ak j it j 50% l t i k d j ći• Ako je u pitanju 50% elemenata iz uzorka odgovarajući kvantil se poklapa sa medijanom.
• Ako je u pitanju 75% elemenata – treći kvartil - q3.j p j q3
18
Box-plot dijagramBox plot dijagram• Pravougaoni dijagram je jedan način grafičkog
prikazivanja podataka Na izabranoj osi se odrede tačkeprikazivanja podataka. Na izabranoj osi se odrede tačke koje odgovaraju uzoračkoj medijani i kvantilima q1 i q3.
• Zatim se računaju unutrašnje f1 i f3 i spoljašnje F1 i F3granice dijagrama
)(5,1 1311 qqqf −−= )(5,1 1313 qqqf −+=
)(3 1311 qqqF −−= )(3 1313 qqqF −+=
• Zatime se određuju a1–najmanji među elementima j 1 j juzorka koji su veći od f1 i a3–najveći među elementima uzorka koji su manji od f3.
F1 F3f1 f3a1 a3q1 q3me 19
Box-plot dijagramBox plot dijagram
• Dijagram se sastoji od pravougaonika čija je jedna j g j p g j j jstrana paralelna izabranoj osi i jednaka odsečku (q1, q3).
• U pravougaonik se ucrta linija koja odgovara uzoračkoj medijani m .medijani me.
• Ako je linija blizu sredine pravougaonika, raspodela bi mogla biti simetrična.
F1 F3f1 f3a1 a3q1 q3me
**
• Kružićem o su označeni svi elementi uzorka koji su u jintervalima [F1, f1] i [f3, F3], a zvezdicom * svi elementi uzorka manji od F1 ili veći od F3 (extreme outliers). 20
Korelaciona tabelaKorelaciona tabela
• Imamo prost slučajan uzorak obima n i posmatramo dva p j pobeležja X i Y na elementima uzorka. Podaci iz uzorka mogu biti dati u obliku tabele koja se naziva korelaciona tabelatabela.
X \ Y y1 y2 … ys zbirx1 n11 n12 … n1s n(x1)x2 n21 n22 … n2s n(x2)… … … … …
( )xm nm1 nm2 … nms n(xm)zbir n(y1) n(y2) n(ys) n
• Broj n označava da se par (x y ) pojavio n puta u uzorku• Broj nij označava da se par (xi, yj) pojavio nij puta u uzorku.mi ,...,1= sj ,...,1= ∑∑ =
i jij nn obim
uzorka21
Uzorački koeficijent korelacijeUzorački koeficijent korelacije• Kada su podaci dati u obliku korelacione tabele,
uzoračke sredine obeležja X i Y su:uzoračke sredine obeležja X i Y su:
∑=m
jjn xxnn
x )(1 ∑=s
jjn yynn
y )(1=jn 1 =jn 1
• Uzoračke disperzije obeležja X i Y su:m1 s1∑=
−=m
jnjjX xxxn
nS
1
22 ))((1 ∑=
−=j
njjY yyynn
S1
22 ))((1
• Uzoračke koeficijent korelacije meri međusobnuUzoračke koeficijent korelacije meri međusobnu zavisnost obeležja X i Y:
1 m s
nnjiij yxyxnn∑∑ −
22
1 1
YX
i jjj
SS
nr
∑∑= ==
22
Uzorački koeficijent korelacijeUzorački koeficijent korelacije• Kada su podaci dati u obliku tabele
V d ti XVrednosti za X x1 x2 … xn
Vrednosti za Y y1 y2 … yn
• Uzoračke sredine su:
∑=
=n
jjn x
nx
1
1 ∑=
=n
jjn y
ny
1
1
• Uzoračke disperzije su:• Uzoračke disperzije su:
∑=
−=n
jnjnx xx
nS
1
22 )(1 ∑=
−=n
jnjny yy
nS
1
22 )(1=jn 1 =jn 1
• Uzorački koeficijent korelacije je:1
)(1 n
jnnjj yxyx
nr
∑=
−
22YX
j
SSr =
23
PrimerPrimer• Neka je obeležje X broj dobijenih šestica u jednom
bacanju, a obeležje Y broj dobijenih parnih brojeva.bacanju, a obeležje Y broj dobijenih parnih brojeva. X 2 1 0 2 0 1 1 1 1 2
Y 2 3 1 3 2 2 1 2 2 2
• Korelaciona tabela je U čk di
X/Y 1 2 30 1 1 0
• Uzoračke sredine su 1,110/11 ==nx .210/20 ==ny
• Uzoračke disperzije su2
1 1 3 12 0 2 1
• Uzoračke disperzije su 51,02 =nxS 4,02 =nyS
• Uzorački koeficijent korelacije je
53
2 6 2 10 Uzorački koeficijent korelacije je 4428,0=r
2 6 2 10
24