Efzgforum.net - Prof. Cizmic - Statistika-2009

Embed Size (px)

Citation preview

Doc.dr.sc. Draenka izmi predavanja 2009.g. STATISTIKADoc.dr.sc.Draenka izmi - predavanja 2009.g - 1Doc.dr.sc. Draenka izmi predavanja 2009.g. SADRAJ:1. UVOD Statistiki skup................................................................................... 4 Vrste i izvori statistikih podataka.................................................... 4 2. UREIVANJE PODATAKA Statistiki nizovi i tabele.............................................. 5 Numeriki nizovi........................................................... 73. OSNOVNA ANALIZA VREMENSKIH NIZOVA ................................................................ Grafiko prikazivanje vremenskih nizova..................... 10 Individualni indeksi....................................................... 104. SREDNJE VRIJEDNOSTI STATISTIKOG NIZA Mod.........................................................................................................................................................................................12 Medijan..................................................................................................................................................................................13 Aritmetika sredina................................................................................................................................................................15 Geometrijska sredina............................................................................................................................................................17 Skupni indeksi.......................................................................................................................................................................185. MJERE DISPERZIJE Raspon varijacije, Interkvartil, Koeficijent kvartilne devijacije....... 19 Srednje apsolutno odstupanje (MAD)........................................... 22 Varijanca, Standardna devijacija, Koeficijent varijacije.................. 23 Standardizirana varijabla.......................................................................................................................................................256. MJERE ASIMETRIJE Koeficijent asimetrije, Pearsonova mjera, Bowleyjeva mjera........ 267. MJERE ZAOBLJENOSTI Koeficijent zaobljenosti.........................................................................................................................................................298. MJERE KONCENTRACIJE Koncentracijski omjer, Ginijev koeficijent....................................... 319. OSNOVNI POJMOVI VJEROJATNOSTI2Doc.dr.sc. Draenka izmi predavanja 2009.g. Definicije i svojstva vjerojatnosti...........................................................................................................................................32 Modeli distribucija vjerojatnosti............................................................................................................................................3410................................................................OSNOVNI POJMOVI INFERENCIJALNE STATISTIKE Plan uzorka............................................................................................................................................................................37 Sampling distribucija.............................................................................................................................................................3811................................................................PROCJENE PARAMETRA Procjena aritmetike sredine................................................................................................................................................39 Procjena totala osnovnog skupa..................................................... 42 Procjena proporcije osnovnog skupa............................................. 4412................................................................TESTIRANJE HIPOTEZA O PARAMETRU Testiranje hipoteza o pretpostavljenoj vrijednosti aritmetike sredine osnovnog skupa................................................................ 44 Testiranje hipoteza o razlici aritmetikih sredina dvaju osnovnih skupova nezavisnim uzorcima.......................................... 4913................................................................REGRESIJSKA ANALIZA Model jednostavne linearne regresije............................................... 52- deskriptivno statistika analiza modela............................... 52- inferencijalno statistika analiza modela............................ 57- testiranje hipoteza o modelu................................................ 5814................................................................MODEL VIESTRUKE REGRESIJE Analiza modela viestruke regresije.....................................................................................................................................58 Testiranje hipoteza o modelu viestruke regresije......................... 5915................................................................MODELI VREMENSKIH SERIJA Komponente vremenskih serija............................................................................................................................................603Doc.dr.sc. Draenka izmi predavanja 2009.g. Modeli trenda.........................................................................................................................................................................614Doc.dr.sc. Draenka izmi predavanja 2009.g. PREDAVANJE #1STATISTIKA znanstvena metoda koja se bavi prikupljanjem, ureivanjem, analizom i tumaenjem podataka. DESKRIPTIVNA u okviru deskriptivne statistike zakljuci se donose na temeljusvih podataka. Ona obuhvaa postupke ureivanja, grupiranja, tabeliranja, grafikog prikazivanja te izraunavanja razliitih statistiko-analitikih veliina INFERENCIJALNAusklopuinferencijalnestatistikezakljuci sedodosena temelju dijela podataka (uzoraka). Temelji se na teoriji vjerojatnostiSTATISTIKI SKUP ine jedinice koje su predmetompromatranja statistikom metodom. Moemo promatrati osobe, poduzea, zemlje, proizvode itd.OPSEG SKUPA broj jedinica. S obzirom na opseg statistiki skupovi se dijele na: KONANI STATISTIKI SKUP studenti upisani na efzg BESKONANI STATISTIKI SKUP bacanje novia ili proizvodnjaStatistiki skupovi definiraju se pojmovno, prostorno i vremenski.OSNOVNI SKUP(POPULACIJA)skuppodatakaopromatranomsvojstvuzasvaku jedinicu statistikog skupa.UZORAK podskup, dio osnovnog skupa. Dio podataka izdvojen iz cjelovite evidencije.STATISTIKO OBILJEJE (VARIJABLA) svojstvo koje stupnjem ilioblikom varira od jedinice do jedinice statistikog skupa.VRSTE STATISTIKOG OBILJEJA:1. NUMERIKO (KVANTITATIVNO) izraava se brojevima DISKRETNO (diskontinuirano) poprima iskljuivo cjelobrojne vrijednosti. npr. broj uenika u razredu, broj djece u obitelji KONTINUIRANO moe poprimiti bilo koju vrijednost iz nekog intervala. npr. visina, teina, cijena...2. KVALITATIVNO NOMINALNO (atributivno i geografsko) izraava se opisno ili rijeima. npr. atributivno spol, zanimanje ; geografsko mjesto roenja REDOSLIJEDNO (obiljeje ranga) npr. ocijena, stupanj kvaliteteMJERENJE postupak pridruivanja numerikih i nenumerikih oznaka jedinicama statistikih skupova na temelju odreenog pravila. Temelji se na primjeni mjerih skala.MJERNE SKALE:1. NOMINALNA sastoji se od liste naziva2. ORDINALNAovomskalomjedinicamastatistikihskupovapridruujuseslovne oznake, simboli ili brojevi sukladno intenzitetu mjernog svojstva3. INTERVALNA - ovom skalom jedinicama statistikih skupova pridruuju se brojevi sukladnointenzitetumjernogsvojstva. Zaovuskalukarakteristinojedaima definiranu mjernu jedinicu i dogovorno utvrenu nulu. npr. temperaturna ljestvica.4. OMJERNA- ovomskalomjedinicamastatistikihskupovapridruujusebrojevi sukladnointenzitetumjernogsvojstva. Zaovuskalukarakteristinojedaima 5Doc.dr.sc. Draenka izmi predavanja 2009.g. definiranu mjernu jedinicu i nulu koja oznaava nepostojanje svojstva. npr. plaa, broj zastoja rada stroja.IZVORI PODATAKA: PRIMARNI prikupljaju se u skladu s ciljem istraivanja. SEKUNDARNI prikupljajuihrazneinstitucije(dravni zavodzastatistiku, banke, agencije za istraivanje trita, osiguravajui zavodi...)PREDAVANJE #2UREIVANJE PODATAKA ureivanjem podataka nastaju statistiki nizoviSTATISTIKI NIZOVI:1. NOMINALNI NIZ nastaje ureivanjem podataka o nominalnom obiljeju2. REDOSLIJEDNI NIZ nastaje ureivanjem podataka o rang varijabli3. NUMERIKI NIZ nastaje ureenjempodataka koji predstavljaju vrijednosti numerike varijable4. VREMENSKI NIZ nastaje kronolokim nizanjem podataka o nekoj pojavi (proizvodnja,uvoz,izvoz)STATISTIKE TABELE: JEDNOSTAVNA SKUPNA sadri barem dva niza koji su grupirani prema modalitetima istog obiljeja KOMBINIRANA(TABELAKONTIGENCE, TABELASDVAULAZA) podaci su grupirani prema modalitetima dvaju ili vie varijabliStanovnitvo prema spolu i starosti u tisuama u RH, popis Poljoprivredna povrina po kategorijama u tisuama hektara u RH, 2003.gKATEGORIJE POVRINAoranice i vrtovi 1460vonjaci 68vinogradi 57livade 396panjaci 1156izvor: SLJRH, 2004.g., str.250Izvoz i uvoz prema pretenoj ekonomskoj namjeni u milijunima am. $ u RH, 2003.g.EKONOMSKA NAMJENA IZVOZ UVOZproizvodi za reprodukciju 2959 6583proizvodi za investicije 1341 3316proizvodi za iroku potronju1886 4311izvor: SLJRH, 2004.g., str.3866Doc.dr.sc. Draenka izmi predavanja 2009.g. iz 2001.g.STAROST SPOLM 0 14 388 37015 64 1482 150165 - 266 430izvor: SLJRH, 2004.g., str.95RELATIVNI BROJEVI omoguavaju elementarnu analizu podataka u sklopu deskriptivne statistike proporcije (dio/cjelina), postoci (dio/cjelina*100) odnosno relativne frekvencije indeksi relativni brojevi koordinacije omjerni brojevi koji nastaju diobomdvaju koordinirajuihveliina(npr.gustoastanovnitva, dohodakpostanovniku, BDP per capita)NIZOVI KVALITATIVNIH PODATAKAKvalitativni podaci su oblici nominalne ili redoslijedne varijable. akoihjemali brojnavodesenekimredomodabranimpovolji ili prema intenzitetu mjernog obiljeja kod redoslijednih podataka (npr.ocjene od najmanje prema najveoj) ako se radi o veem brojupodataka pristupa se grupiranju. Grupiranjem se skup podataka ralanjuje na podskupove koji se meusobno ne preklapaju.FREKVENCIJA broj podataka istog ili slinog modaliteta varijableNOMINALNI ILI REDOSLIJEDNI NIZ ine parovi razliitog oblika kvalitativne varijable oi i pripadajuih frekvencija fi(oi, fi), i=1,2,....,kUenici i studenti koji su zavrili osnovnu ili srednju kolu odnosno diplomirai na visokim uilitima u RH, 2003.g.STUPANJ OBRAZOVANJABROJ OSOBAoifiosnovno 51211srednje 47092struni studij 6489sveu.studij 9243ukupno 114035izvor: SLJRH, 2004.g., str.487OPSEG SKUPA zbroj frekvencijaRELATIVNA FREKVENCIJA omjer frekvencije i opsega skupa kiiiiffp17Doc.dr.sc. Draenka izmi predavanja 2009.g. POSTOTNA RELATIVNA FREKVENCIJA relativna frekvencija pomonoena sa 100 1001 kiiiiffPnizovi sa relativnim frekvencijama (oi, pi) ili (oi, Pi)Kvalitativni nizovi grafiki se prikazuju povrinskim grafikonima: STUPCI (poloeni, uspravni) STRUKTURNI KRUGOVI I POLUKRUGOVI RAZDIJELNI STUPCI VIESTRUKI STUPCINUMERIKI NIZOVI nastaju ureenjemnumerikih podataka. Nain njihova ureivanja ovisio tome da li su podaci diskretni ili kontinuirani.NAINI UREIVANJA:1. mali broj podataka-ureujesenizanjempoveliini. Pojedinani numeriki podaci grafiki seprikazujudijagramomstokamai dijagramomstablo-list(S-L dijagram)Primjer 1.Podaci o prodaji proizvoda A za 15 dana jednog razdoblja:Xi: 8, 15, 9, 17, 20, 14, 34, 27, 30, 18, 10, 18, 24, 25, 29Podaci ureeni po veliini:Xi: 8, 9, 10, 14, 15, 17, 18, 18, 20, 24, 25, 27, 29, 30, 34dijagram s tokama:dijagram stablo-list:0 891 0457882 045793 04O|8 predstavlja 82. diskretno obiljeje -velik brojpodataka imanjibrojoblikapristupase grupiranju. Numeriki niz odnosno distribucija frekvencijase sastoji od parova (xi, fi), i=1,2,....,k xi modaliteti numerikog obiljeja fi pripadajue frekvencijePrimjer 2. Dnevna prodaja garnitura sobnog 8Doc.dr.sc. Draenka izmi predavanja 2009.g. namjetajaBROJ GARNITURABROJ DANAxi fi1 12 53 84 265 196 12ukupno 713. kontinuirano obiljeje/ diskretno obiljeje s veim brojem oblika grupiranje se provodi na temelju razreda. Svaki razred ima donju i gornju granicu.frekvencija razreda broj podataka omeen donjom i gornjom granicom razredaNumeriki nizodnosnodistribucijafrekvencijasastoji seodparovarazredai pripadajuih frekvencija (Li1 xi Li2, fi), i= 1,2,....,kLi1 donja granica i-tog razreda; Li2 gornja granica i-tog razreda; fi frekvencija i-tog razredaPrimjer 3.Radnici poduzea A prema starostiSTAROST BROJ RADNIKA18 26 526 34 634 42 1042 50 550 58 4ukupno 30Formiranjudistribucijefrekvencijaprethodi odreivanjebrojarazredai njihove veliine. Za odreivanje broja razreda koristi se Sturgesovo pravilo:k 1 + 3,3 logNk-broj razreda; N-zbroj frekvencijaAkosurazredi jednakihveliina, veliinaimseaproksimiratakodaseraspon varijacije podijeli sa brojem razreda: k x xiimin max

Razredi jednakih veliina primjenjuju se kada su podaci simetrino rasporeeni.Razredi razliitih veliina primjenjuju se kada su podaci asimetrino rasporeeni.Pri brojanoj analizi numerikog niza potrebno je utvrditi da li su granice prave, a nakon toga odrediti veliinu razreda i rezredne sredine.GRANICE RAZREDA:9Doc.dr.sc. Draenka izmi predavanja 2009.g. PRAVE donja granica tekuegrazreda je jednaka gornjoj granici prethodnog razreda NOMINALNEpretvarajuseupravetakodasesvakadonjagranica umanji za polovicu jedinice, a svaka gornja se uvea za polovicu jedinice. To vrijedi zasvesluajeveosimzanavrenegodine ivota. Kod navrenih godina ivota svaka se gornja granica povea za jedinicu.VELIINARAZREDA odreuje se kaorazlikagornje i donje prave granice razredaREZREDNASREDINAi-tograzredaodreujesekaopoluzbroj gornjei donje prave granice razredaDistribucija frekvencija grafiki se prikazuje histogramom i poligonom frekvencija.10Doc.dr.sc. Draenka izmi predavanja 2009.g. Primjer 4.Prvi i posljednji razred mogu biti otvoreni razredi. Njihove se veliine procjenjuju i procjena se stavlja u zagradu.Kada su razredi razliitih veliina potrebno je korigirati frekvencije:iiciiff - ova se formula koristi kada su svi razredi razliitih veliina, a moe se koristiti i generalnobiiciiiff - bazna veliina razreda (najee se pojavljuje)IZVEDENI NIZOVI: KUMULATIVNI NIZ nastaje postupnim zbrajanjem apsolutnih ili relativnih frekvencija. On se grafiki prikazuje kumulantom.Primjer 5.Nepismeno stanovnitvo staro 10.g. i vie prema starosti u RH prema popisu iz 2001.g.STAROST BROJ OSOBAPRAVE GRANICERAZREDNA SREDINAVELIINA REZREDAKORIGIRANE FREKVENCIJEfixiii1 2 3 4 5 610-19 1845 9.5-19.5 14.5 10 276820-34 3160 19.5-34.5 27 15 316035-49 4457 34.5-49.5 42 15 445750-64 11108 49.5-64.5 57 15 1110865-(99) 49207 64.5-(99.5) 82 35 21089UKUPNO 69777 - - - -11Doc.dr.sc. Draenka izmi predavanja 2009.g. PREDAVANJE #3VREMENSKI NIZ skup kronoloki ureenih vrijednosti koje predstavljaju neku pojavu (proizvodnja, uvoz, izvoz).LANOVI NIZA vrijednosti koje tvore nizVremenski niz noe biti: INTERVALNI nastaje trajanjem vrijednosti pojave po intervalima vremena (godina, kvartal, mjesec) npr. proizvodnja, uvoz, izvoz... TRENUTANI sastoji se od kronoloki ureenih vrijednosti koje predstavljaju stanja pojave u odabranim vremenskim tokama (poetak, sredina, kraj) npr. stanje na raunima, zakljune cijene dionica.. GRAFIKO PRIKAZIVANJE VREMENSKIH NIZOVA: INTERVALNI NIZOVI prikazuju se povrinskim i linijskim grafikonima. TRENUTNI NIZOVI prikazuju se samo linijskim grafikonimaRadi lakeg praenja u grafikon se ucrtava mrea. Prikaz je u pravokutnom koordinatnom sustavu s aritmetikim mjerilima na osima. Na osi apscisa je mjerilo za varijablu vrijeme, a na osi ordinata za lanove vremenskog niza.OKOMITI PREKID GRAFIKONA ako se ne raspolae podacima za dio razdoblja mogue je izostaviti dio mjerila na osi apscisa.VODORAVNI PREKID GRAFIKONA ako neka pojava varira na velikim razinama mogue je izostaviti dio mjerila osi ordinata.Prekidaju se samo linijski grafikoni.Stanovnitvo prema starosti u RH u tisuama prema popisu iz 2001.g.STAROST BROJ OSOBA PRAVE GRANICEKUMULATIVNI NIZ0-14 758 -0.5 14.5 75815-64 2983 14.5 64.5 374165-(99) 696 64.5 (99.5) 443712Doc.dr.sc. Draenka izmi predavanja 2009.g. POLULOGARITAMSKI GRAFIKON koristi se ako se na istom grafikonu usporeuju raznorodni podaci (nizovi izraeni u razliitim mjernim jedinicama). To je grafikon sa aritmetikim mjerilom na osi apscisa, a logaritamskim na osi ordinata.INDIVIDUALNI INDEKSI njima se prati razvoj jedne pojave u vremenu verini indeksi njima se prati razvoj pojave u uzastopnim vremenskim razdobljima. Verini indeks Vt razdoblja t dobije se tako da se vrijednost toga razdoblja podijeli s vrijednou prethodnog razdoblja te se pomnoi sa sto 1001 tttyyVVerini indeksi se grafiki prikazuju specifinim linijskim grafikonom igrafikonom jednostavnih stupaca.KOEFICIJENT DINAMIKE vrijednost tekueg razdoblja podijeljena sa vrijednou prethodnog razdoblja ne pomnoena sa sto 1 tttyyVSTOPA PROMJENE od verinog indeksa se odbije sto 100 t tV S Primjer 1.Izvoz RH u milijunima US$ u razdoblju od 1999. do 2003.g.GODINA IZVOZ VERINI INDEKSI STOPA PROMJENEytVtSt1999 4302 - -2000 4432 103,2 3,022001 4665 105,26 5,262002 4904 105,12 5,122003 6197 126,36 26,36izvor: SLJRH 2004., str.384Indeks se interpretira kao postotna promjena u odnosu na 100. Ako je vei od 100 predstavlja postotno poveanje, a ako je manji od 100 predstavlja postotno smanjenje.npr. Izvoz u RH u 2003.g. poveao se za 26.36% u odnosu na 2002.g. indeksi na stalnoj bazi njima se mjere promjene u odnosu na neko odabrano bazno razdoblje. Izraunavaju se tako da se svaki lan niza podijeli s vrijednou baznog razdoblja te pomnoi sa 100 100 bttyyIBAZNO RAZDOBLJE razdoblje u kojemu pojava nije bila izloena nekim neuobiajenim utjecajima (prirodne katastrofe, rat). Ponekad se uzima neka vrijednost izvan niza ili nekakav prosjek.STOPA PROMJENE kad od indeksa odbijemo sto 100* t tI S13Doc.dr.sc. Draenka izmi predavanja 2009.g. Bazni indeksi se grafiki prikazuju linijskim grafikonom jednostavnih stupaca.Primjer 2.GODINA IZVOZ BAZNI INDEKSI1999 = 100STOPA PROMJENE1999 4302 100,00 0,002000 4432 103,02 3,022001 4665 108,44 8,442002 4904 113,99 13,992003 6197 144,05 44,05U 2003.g. izvoz se poveao za 44.05% u odnosu na baznu 1999.g.SREDNJE VRIJEDNOSTI STATISTIKOG NIZA konstante kojima se predstavljaju nizovi varijabilnih podataka. POTPUNE raunaju se na temelju svih podataka. U njih se ubrajaju aritmetika, geometrijska i harmonijska sredina. POLOAJNE u pravilu su jednake jednom modalitetu statistike varijable. U njih se ubrajaju MOD i MEDIJAN.MOD najei modalitet varijable, odnosno to je modalitet varijable s najveom frekvencijom1. pojedinani podaci kod pojedinanih podataka MOD je vrijednost koja se najee pojavljujeP rimjer 3.Slijedei niz predstavlja cijene jednog proizvoda evidentirane na 10 prodajnih mjesta u kn:25242523252221252025 Najea prodajna cijena (MOD) je 25 kn.2. distribucija frekvencija formirana na temelju pojedinanih vrijednosti tu je MOD modalitet varijable s najveom frekvencijomP rimjer 4.MOD distribucije dnevne prodaje garnitura namjetaja iznosi 4, tj. najea dnevna prodaja iznosila je 4 garnitureDnevna prodaja garnitura sobnog namjetajaBROJ GARNITURABROJ DANAxifi1 12 53 84 265 196 12UKUPNO 7114Doc.dr.sc. Draenka izmi predavanja 2009.g. 3. distribucija frekvencija sa razredima MOD se aproksimira pomou izraza:ic b a ba bL Mo + + ) ( ) () (1b najvea korigirana frekvencijaa frekvencija ispred njec frekvencija iza njeL1 donja prava granica modalnoga razredai njegova veliinaMODALNI RAZRED razred s najveom korigiranom frekvencijomPrimjer 5.Mo = 24.5 + (460.8-216.0)/(460.8-216.0)+(460.8-246.7)* 25 = 37.84 godNajea starost aktivnog stanovnitva u RH u 2003.g. iznosi 37.84 godine.MEDIJAN srednja vrijednost koja numeriki niz ureen po veliini dijeli na dva jednakobrojna dijela1. pojedinani podaci (neparan broj) MEDIJAN je jednak vrijednosti varijable sredinjeg lana u nizuINTN2 r ex M 12+ ,_

NINT rPrimjer 6.Podaci moraju biti ureeni po veliini1358101214 7/2 = 3.5; r =4 ; Me = x4 = 82. pojedinani podaci (paran broj) MEDIJAN je jednak poluzbroju vrijednosti varijable sredinjih dvaju lanova niza ureenog po veliini N/2 = INT ; Me = (xr+Xr+1)/2 ; r = N/2Primjer 7.1124293740536572 N=8 ; r=4 ; Me = (37+40)/2 = 38.5Aktivno stanovnitvo u RH u 2003.g. (2.polugodite) u tisuamaSTAROST BROJ OSOBAPRAVE GRANICEVELIINE RAZREDAKORIGIRANE FREKVENCIJEfiiifci15-24 216 14,5-24,5 10 216,025-49 1152 24,5-49,5 25 460,850-64 370 49,5-64,5 15 246,765-(74) 55 64,5-(74.5) 10 55,015Doc.dr.sc. Draenka izmi predavanja 2009.g. 3. distribucija frekvencija formirana na temelju pojedinanih vrijednosti odreivanje MEDIJANA se pojednostavljuje uporabom kumulativnog niza manje od. MEDIJAN je jednak vrijednosti varijable ija kumulativna frekvencija prva ukljuuje N/2.Primjer 8.N/2 = 35.5Me = 44. distribucija frekvencija s razredima MEDIJAN se aproksimira pomou izraza: iffNL Mmedie+ 21L1 donja prava granica medijalnog razredaN zbroj apsolutnih ili relativnih frekvencijafi zbroj frekvencija do medijalnog razredafmed frekvencija medijalnog razredai veliina medijalnog razredaMEDIJALNI RAZRED onaj ija kumulativna frekvencija prvi put ukljuuje N/2.Primjer 9.STAROST BROJ OSOBA PRAVE GRANICEVELIINE RAZREDAKUMULATIVNE FREKVENCIJEfi ii S(xi)15-24 216 14,5-24,5 10 21625-49 1152 24,5-49,5 25 136850-64 370 49,5-64,5 15 173865-(74) 55 64,5-(74,5) 10 1793N/2 = 896.5Me = 24.5 + (896.5-216)/1152* 25 = 39.27 godPrvih 50% osoba imalo je 39 godina i manje, a preostalih 50% osoba bilo je starije od 39 godinaKVANTILI numeriki niz ureen po veliini dijele na jednakobrojne dijelove. Medijan spada meu kvantile KVARTILI niz ureen po veliini dijele na 4 jednakobrojna dijela DECILI niz ureen po veliini dijele na 10 jednakobrojnih dijelova PERCENTILI niz ureen po veliini dijele na 100 jednakobrojnih dijelovaBroj kvartila je za jedan manji od njihova reda, tj. 3 su kvartila, 9 decila i 99 percentilaDnevna prodajaBROJ GARNITURABROJ DANA KUMULATIVNI NIZ xi fi S(xi)1 1 12 5 63 8 144 26 405 19 596 12 71UKUPNO 71 -16Doc.dr.sc. Draenka izmi predavanja 2009.g. PREDAVANJE #4ARITMETIKA SREDINA dobije se tako da se zbroje vrijednosti numerike varijable i podijele sa njihovim brojem.TOTAL zbroj vrijednosti numerike varijable; aritmetika sredina je jednaki dio totala po jediniciSvojstva aritmetike sredine:1. zbroj vrijednosti odstupanja numerike varijable od njezine aritmetike sredine jednak je nuli2. zbroj kvadrata odstupanja vrijednosti numerike varijable od njezine aritmetike sredine minimalan je3. aritmetika sredina nalazi se izmeu najmanje i najvee vrijednosti niza za koji je izraunataJEDNOSTAVNA ARITMETIKA SREDINA rauna se kod pojedinanih kvantitavnih podataka NxxNii 1Primjer 1.Slijedei niz predstavlja cijene jednog proizvoda evidentirane na 10 prodajnih mjesta u kn:25242523252221252025 235/10=23.5prosjena prodaja iznosila je 23.5 knAritmetika sredina izraena je u istim mjernim jedinicama kao i obiljeje.VAGANA (PONDERIRANA) ARITMETIKA SREDINA primjenjuje se za grupirane podatke, tj. za distribuciju frekvencija1. ponderi: APSOLUTNE FREKVENCIJE (fi)fifixixki12. ponderi: RELATIVNE FREKVENCIJE U VIDU POSTOTAKA (Pi)1001kipixix3. ponderi: RELATIVNE FREKVENCIJE U VIDU PROPORCIJA (pi)kipixi x1Primjer 2.Distribucija frekvencija formirana na temelju pojedinanih vrijednosti17Doc.dr.sc. Draenka izmi predavanja 2009.g. PRAVI TOTAL ukupan broj prodanih garnitura4 31 , 471306 x garniture dnevnoPrimjer 3.Distribucija frekvencija formirana na temelju razredaPROCIJENJENI PODTOTALIPROCIJENJENI TOTAL-ukupna starost promatranih osoba godina x 02 , 401793 5 , 71748 Prosjena starost aktivnog stanovnitva iznosila je 40.02 godina.ARITMETIKA SREDINA ARITMETIKIH SREDINA odreuje se kao vagana sredina u kojoj se za pondere uzima broj podataka za koje su pojedine sredine raunate ili tom broju proporcionalne veliine.Dnevna prodaja garnitura sobnog namjetajaBROJ GARNITURABROJ DANA kol. 1*2xififixi1 1 12 5 103 8 244 26 1045 19 956 12 72UKUPNO 71 306Aktivno stanovnitvo u RH u 2003.g. (drugo polugodite) u tisuamaSTAROSTBROJ OSOBAPRAVE GRANICERAZREDNE SREDINEkol.2*4fixifixi15-24 216 14.5-24.5 19.5 4212.025-49 1152 24.5-49.5 37.0 42624.050-64 370 49.5-64.5 57.0 21090.065-(74) 55 64.5-(74.5) 69.5 3822.5UKUPNO1793 - - 71746.518Doc.dr.sc. Draenka izmi predavanja 2009.g. kikiNii x NiX11Primjer 4. Prosjena plaa za sve kompanije:39 , 331311203711000 XAko se svaka individualna vrijednost numerikog obiljeja zamijeni aritmetikom sredinom dobiva se polazna veliina tj. total ili zbroj vrijednosti numerikog obiljeja.ARITMETIKA SREDINA RELATIVNIH BROJEVA KOORDINACIJE odreuje se kao vagana sredina u kojoj su ponderi baze tih brojeva kikiBiBiRiR11RELATIVNI BROJEVI KOORDINACIJE omjerni su brojevi koji nastaju diobom dviju koordinirajuih veliinaBiViRi Grafiki se prikazuju na 2 naina:1. jednostavnim stupcima2. pravokutnicima ije su osnovice proporcionalne bazama tih brojeva, a visine samim relativnim brojevima koordinacijePrimjer 5.Prosjean broj stanovnika na km2 za sve navedene drave:Odabrane kompanije zaposlenih i prosjene mjesene plae u knKOMPANIJA BROJ ZAPOSLENIHPROSJENA PLAAUKUPNA PLAANixNiixALFA 550 3500 1925000GAMA 320 2300 736000TRADE 250 4200 1050000UKUPNO 1120 - 3711000Najvee drave svijeta, povrina u km2 i broj stanovnika na km2DRAVA POVRINA U km2STANOVNITVO/ km2UKUPAN BROJ STANOVNIKABi Ri Vi= Ri*BiRUSIJA 17075400 8 136603200KANADA 9970610 3 29911830SAD 9629091 30 288872730KINA 9596961 135 1295589735BRAZIL 8514215 21 178798515UKUPNO 54786277 - 192977601019Doc.dr.sc. Draenka izmi predavanja 2009.g. 2/ . 35 22 . 35547862771929776010km st R GEOMETRIJSKA SREDINA jednaka je N-tom korijenu produkta N pojedinanih vrijednosti

NN ix x x x G .... ....2 1Za grupirane podatke geometrijska sredina dana je izrazom: Nfkfif fk ix x x x G .... ....2 12 1Primjer 6.zadani su koeficijenti dinamikeGODINA2000 2001 2002 2003 2004Vt - 1,06 1,05 1,03 1,02prosjena stopa raunata pomou geometrijske sredine:Promatrana pojava prosjeno se godinje poveavala za 3.99%.Geometrijska i harmonijska sredina relativno se rijetko primjenjuju. Geometrijska sredina se primjenjuje u analizi vremenskih nizova. Pomou nje se rauna prosjena stopa promjene pojave. Geometrijska sredina poprima niu vrijednost od aritmetike sredine.HARMONIJSKA SREDINA reciprona vrijednost aritmetike sredine recipronih vrijednosti varijable x negrupirani pojedinani podaci Ni ixNH11 grupirani podaci ki iikiixffH1120% 99 . 3 100 ) 1 03988 . 1 (03988 . 1 02 . 1 03 . 1 05 . 1 06 . 1.....100 ) 1 (413 2 SGV V V GG SnnDoc.dr.sc. Draenka izmi predavanja 2009.g. Harmonijska sredina manja je od aritmetike i geometrijske sredinePrimjer 7. Ugostiteljska poduzea, ukupan promet (u tisuama kn) i promet po zaposlenom (u tisuama kn)UGOSTITELJSKA PODUZEAPROMET PROMET PO ZAPOSLENOMZAPOSLENIVi Ri Vi/Ri = BiHOTELI 6272146 199 31518KAMPOVI 272070 158 1722RESTORANI 814160 178 4574BAROVI 716065 131 5466KANTINE 331094 137 2417UKUPNO 8405535 - 45697Prosjean promet po zaposlenom za sva ugostiteljska poduzea:kn tis R . 184456978405535 Ako nazivnici relativnih brojeva koordinacije nisu poznati, a brojnici jesu ili se lake procjenjuju do sredine e se doi pomou izraza za vaganu ponderiranu harmonijsku sredinu: ki iikiiRVVR11Ako imamo zadano Bi koristimo formulu za aritmetiku, a ako su nam zadane Vi koristimo harmonijsku vaganu sredinu.SKUPNI INDEKSI njima se prati dinamika skupine pojava u vremenu npr.proizvodnja, uvoz, izvoz.... SKUPNI INDEKSI CIJENA SKUPNI INDEKSI KOLIINA SKUPNI INDEKS VRIJEDNOSTIU pravilu se raunaju kao vagana aritmetika sredina individualnih indeksa. Ponderi su obino vrijednosti. Uglavnom se izraunavaju: LASPEYRESOV INDEKS CIJENA I KOLIINA PAASCHEOV INDEKS CIJENA I KOLIINA FISHEROV INDEKS CIJENA I KOLIINA INDEKS VRIJEDNOSTISkupne indekse izraunavaju i objavljuju statistiki uredi. Obino su Laspeyresova tipa: INDEKS POTROAKIH CIJENA mjera inflacije; INDEKS INDUSTRIJSKE PROIZVODNJESkupni indeksi cijena koriste se u postupku deflacioniranja tj. uklanjanja utjecaja promjena cijena na vrijednosno izraene pojave.PREDAVANJE #521Doc.dr.sc. Draenka izmi predavanja 2009.g. MJERE DISPERZIJEReprezentativnost srednje vrijednosti ovisi o stupnju varijabilnosti podataka.Varijabilnost numerikog obiljeja predoava se i pomou grafikih prikaza: dijagram s tokama i dijagram s pravokutnikomMjere za varijabilnost podataka su:1. raspon varijacije2. interkvartil3. koeficijent kvartilne devijacije4. varijanca5. standardna devijacija6. koeficijent varijacije7. srednje apsolutno odstupanje (MAD)22Doc.dr.sc. Draenka izmi predavanja 2009.g. 1. RASPON VARIJACIJE pojedinani podaci odreuje se kao razlika izmeu najvee i najmanje vrijednostimin maxx x Rx distribucija frekvencija formirana na temelju pojedinanih podataka odreuje se kao razlika izmeu posljednje i prve vrijednosti1x x Rk x distribucija frekvencija s razredima aproksimira se kao razlika izmeu gornje granice posljednjeg i donje granice prvog razreda ili kao razlika razrednih sredina posljednjeg i prvog razreda.Raspon varijacije je apsolutna (izraena je u istim mjernim jedinicama kao i obiljeje) i nepotpuna (dobiva se iz samo dvije vrijednosti) mjera disperzije.2. INTERKVARTIL KVARTILI: PRVI ILI DONJI KVARTIL (Q1) vrijednost numerike varijable koja lanove niza dijeli u dvije skupine. U prvoj je skupini 25% elemenata s vrijednostima varijable koja je jednaka ili manja od donjeg kvartila, a u drugoj je skupini 75% elemenata s vrijednostima veim od donjeg kvartila. DRUGI ILI MEDIJAN (Q2) TREI ILI GORNJI KVARTIL (Q3) - vrijednost numerike varijable koja lanove niza dijeli u dvije skupine. U prvoj je skupini 75% elemenata s vrijednostima varijable koja je jednaka ili manja od gornjeg kvartila, a u drugoj je skupini 25% elemenata s vrijednostima veim od gornjeg kvartila. Interkvartil se odreuje kao razlika kvartila 1 3Q Q IQ 50% Interpretira se kao raspon varijacije sredinjih 50% podataka: Interkvartil je takoer apsolutna i nepotpuna mjera disperzije.3. KOEFICIJENT KVARTILNE DEVIJACIJE njime se usporeuje stupanj disperzije raznorodnih nizova. Odreuje se kao omjer interkvartila i zbroja kvartila:1 31 3Q QQ QVQ+ 0 VQ < 1Ovo je relativna i nepotpuna mjera disperzije.GRAFIKI PRIKAZ VARIJABILNOSTI PODATAKA dijagram s pravokutnikom box-plot (B-P) dijagramZa njegovu konstrukciju koristi se 5 pokazatelja numerikog niza 5's (five summary numbers) najmanja vrijednost najvea vrijednost medijan donji kvartil23Doc.dr.sc. Draenka izmi predavanja 2009.g. gornji kvartilNa ovom grafikom prikazu ouava se raspon varijacije i interkvartilni raspon te se prosuuje o moguoj asimetriji kao i o pojavi netipinih vrijednosti ( out lier)24Doc.dr.sc. Draenka izmi predavanja 2009.g. Primjer 1. Negrupirani tj. pojedinani podaciMjereno je vrijeme u minutama potrebno za rjeavanje jednog zadatka iz statistike za 10 studenata. Dobiveni su ovi rezultati :20222527282830303335Podaci moraju biti ureeni po veliini. raspon varijacije:3015 = 15 minVrijeme potrebno za rjeavanje zadatka bilo je izmeu 20 i 35 min. Odnosno u raponu od 15 min. interkvartil: donji kvartil: N/4 = 10/4 = 2.5 INTr = INT (N/4) + 1 = 2+1 = 3,Q1=x3=25Prva etvrtina studenata imala je vrijeme 25 min i manje, a preostale 3 etvrtine imale su vrijeme vee od 25 min.gornji kvartil: 3N/4 = 30/4 = 7.5 INT r = INT (3N/4) + 1 =7+1=8,Q3=xr=x8=30 Prve tri etvrtine studenata imale su vrijeme 30 min i manje, a preostala etvrtina imala je vrijeme vee od 30 min.IQ = Q3 Q1 = 30 - 25=5 minRaspon varijacije sredinjih 50% studenata iznosio je 5 min, tj. njihova vremena bila su izmeu 25 i 30 min. koeficijent kvartilne devijacijeVQ= (Q3-Q1)/(Q3+Q1) = (30-25)/(30+25) = 0.09Raspon varijacije sredinjih 50% studenata u relativnom iznosu je 0.09. B-P dijagram N/2 = 10/2 = 5 = INT ,r=5Me = (xr+Xr+1)/2 = (x5+x6)/2 = (28+28)/2 = 2825Doc.dr.sc. Draenka izmi predavanja 2009.g. Primjer 2. Distribucija frekvencija formirana na temelju pojedinanih vrijednostiPismeni ispit iz statistike sadri 5 zadataka. Distribucija frekvencija prema broju rjeenih zadataka dana je u tabeli:BROJ ZADATAKABROJ STUDENATAKUMULATIVNI NIZ manje odxifiS(xi)0 10 101 25 352 55 903 125 2154 50 2655 15 280UKUPNO 280 -raspon varijacije: Rx = xk x1 = 5-0 = 5 zadatakaBroj rjeenih zadataka bio je izmeu 0 i 5 odnosno u rasponu od 5 zadataka.interkvartil: donji kvartil: N/4 = 70 ; Za Q1 se uzima vrijednosti varijable s prvom kumulativnom frekvencijom koja sadri vrijednost N/4 Q1= 2gornji kvartil: 3N/4 = 210 Q3=3IQ = Q3 Q1= 3 2= 1Raspon varijacije sredinjih 50% studenata iznosio je 1 zadatak, tj. broj rjeenih zadataka bio je izmeu 2 i 3.koeficijent kvartilne devijacije VQ= (Q3-Q1)/(Q3+Q1) = (3-2)/(3+2) = 0.2Raspon varijacije sredinjih 50% studenata u relativnom iznosu je 0.2Primjer 3. Distribucija frekvencija s razredimaDistribucija studenata prema vremenu potrebnom za rjeavanje jednog zadatka iz statistike u min.

raspon varijacijeRx = 30 10= 20 minRx = 27.5 12.5 = 15 mininterkvartilN/4 = 75/4 = 18.75Kvartilni razred je razred ija kumulativna frekvencija prva ukljuuje vrijednost N/4UTROENO VRIJEMEBROJ STUDENATAKUMULATIVNI NIZ manje odVELIINA RAZREDAfiS(xi) ii10-15 15 15 515-20 20 35 520-25 30 65 525-30 10 75 5UKUPNO 75 - -26Doc.dr.sc. Draenka izmi predavanja 2009.g. iffNL Qk+ var11 14 min 9 . 15 52015 75 . 18151 + QiffNl Qk+ var11 343min 5 . 23 53035 25 . 56203 + QIQ = 23.5 15.9 = 7.6 minRaspon varijacije sredinjih 50% studenata iznosio je 7.6 min.VQ= (Q3-Q1)/(Q3+Q1) = (23.5 15.9)/(23.5 15.9) = 0.19Raspon varijacije sredinjih 50% studenata u relativnom iznosu je 0.19.4. SREDNJE APSOLUTNO ODSTUPANJE (MAD) za mjerenje disperzije moe se koristiti i prosjeno apsolutno odstupanje vrijednosti varijable od njezine aritmetike sredine ili medijana: pojedinani podaci: Nx xMADNii 1

NM xMADNie iMe1 za distiribuciju frekvencija apsolutne razlike ponderiraju se apsloutnim ili relativnim frekvencijamaPrimjer 4.Dnevna prodaja hladnjaka u 10 prodavaonica iznosila je: 2533734643 41040 NxxMAD = 12/10 = 1,22333344567N/2 = 5 = INT, r = 5Me = (x5+x6)/2 = (3+4)/2 = 3.5PREDAVANJE #6PRODAJAxix xi 2 25 13 13 17 33 14 06 24 03 140 12PRODAJAxie iM x2 1,55 1,53 0,53 0,57 3,53 0,54 0,56 2,54 0,53 0,540 12,027Doc.dr.sc. Draenka izmi predavanja 2009.g. 5. VARIJANCA aritmetika sredina kvadrata odstupanja vrijednosti numerike varijable od njezine aritmetike sredine. Varijanca je mjera disperzije u drugom stupnju koju je potrebno vratiti u prvi stupanj. negrupirani podaciNx xNii 122

grupirani podaci kiikii ifx x f1122) (6. STANDARDNA DEVIJACIJA pozitivni drugi korijen iz varijance. Potpuna i apsolutna mjera disperzije. negrupirani podaci Nx xNii 12) ( grupirani podaci kiikii ifx x f112) (7. KOEFICIJENT VARIJACIJE realtivna mjera disperzije. Odreuje se kao omjer srtandardne devijacije i aritmetike sredine pomnoen sa sto.100 xVStandardna devijacija se interpretira kao prosjeno odstupanje od prosjeka izraeno apsolutno, a koeficijent varijacije kao to isto odstupanje izraeno relativno i to u vidu postotka.Primjer 1. Negrupirani tj. pojedinani podaciMjereno je vrijeme (u minutama) potrebno za rjeavanje jednog zadatka iz statistike za 10 stuudenata. Dobiveni su ovi rezultati:28Doc.dr.sc. Draenka izmi predavanja 2009.g. % 76 . 15 1008 . 2738 . 4100min 38 . 4 16 . 1916 . 191060 . 191) (min 8 . 271027821221 xVNx xNxxNiiNii Interpretacija:Prosjeno vrijeme rjeavanja zadataka iznosilo je 27.8 minuta s prosjenim odstupanjem od 4.38 minute odnosno 15.76%.Primjer 2. Distribucija frekvencija formirana na temelju pojedinanih podatakaPismeni ispit iz statistike sadri 5 zadataka. Distribucija studenata prema broju rjeenih zadataka dana je u tabeli: % 64 . 39 10080 . 2 11 . 110011 . 1 23 . 123 . 12802 . 344) (80 . 22807852112211 xVzadatakafx x fzadatakafx fxkiikii ikiikii i Prosjeni broj rjeenih zadataka iznosio je 2.80 zadatka. S prosjenim odstupanjem od 1.11 zadataka odnosno 39.64%.Primjer 3. Distribucija frekvencija s razredimaStruktura aktivnog stanovnitva u drugom polugoditu 2003.g. u RHSTAROSTSTAROST%PRAVE GRANICERAZREDNE SREDINEkol. 2x4 VELIINA RAZREDAKORIGIRANE FREKVENCIJEPixiPixi2) ( x x Pi i Pci15-24 12 14.5-24.5 19.5 234.0 5043.00 10 1225-49 64 24.5-49.5 37.0 2368.0 . 25 25.650-64 21 49.5-64.5 57.0 1197.0 . 15 14.0VRIJEMExi2) ( x xi 20 60.8422 33.6425 .27 .28 .28 .30 .30 .33 .35 .UKUPNO 191.60BROJ ZADATAKABROJ STUDENATAkol. 1x2xififixi2) ( x x fi i0 10 0 78.41 25 25 81.02 55 110 .3 125 375 .4 50 200 .5 15 75 .UKUPNO 280 785 344.229Doc.dr.sc. Draenka izmi predavanja 2009.g. 65-(74) 3 64.5-(74.5)69.5 208.5 . 10 3.0UKUPNO100 - - 4007.5 14298.75 - -Interpretacija:Prosjena starost aktivnog stanovnitva iznosila je 40 godina. S prosjenim odstupanjem od 11.96 godina odnosno 30%.STANDARDIZIRANA VARIJABLA linearna transformacija numerike varijable x. Odreuje se tako da se odstupanja numerike varijable od njezine aritmetike sredine podijele sa standardnom devijacijom, tj. da se izraze u jedinicama standardnih devijacija. Aritmetika sredina standardizirane varijable jednaka je nuli, a standardna devijacija jednaka je jedan.x xz1 ; 0 zz PRAVILO EBIEVA govori da je najmanja proporcija lanova bilo kojeg niza obuhvaenih bilo kojim intervalom211 , 1 ,kjednaka k k x > t .U pojasu 2 t xnalazi se najmanje 0.75 tj. 75% svih podataka.U pojasu 3 t xnalazi se najmanje 0.889 tj. 88.89% svih podataka.Ako su podaci rasporeeni po normalnoj distribuciji onda: pojas 1 + xobuhvaa oko 68% podataka pojas 2 t xobuhvaa oko 95% podataka pojas 3 t xobuhvaa oko 99.73% podataka

3 2 1 1 2 3 x Primjer 4.Prosjean broj bodova na 1. kolokviju iz statistike iznosi 15, a prosjeno odstupanje od prosjeka iznosi 5. Na drugom kolokviju postignut je prosjean broj bodova 17 s 30% 30 10000 . 40 96 . 1110096 . 11 99 . 14299 . 142100 75 . 14298) (40100 5 . 4007100211221 xVgodinaPx x Pgodinax Pxkiikii ikii i Doc.dr.sc. Draenka izmi predavanja 2009.g. prosjenim odstupanjem od prosjeka 4. Student je na prvom kolokviju postigao 20, a na drugome 22 boda. to se moe zakljuiti o uspjehu studenta na kolokvijima?22 204 517 152 12 12 1 x xx x Vrijednost standardiziranog obiljeja na prvom kolokviju: 00 . 1515 20111x xzVrijednost standardiziranog obiljeja na drugom kolkviju: 25 . 1417 22222x xzStudent je na oba kolokvija postigao iznad prosjean rezultat. Bolji je na drugom kolokviju jer je odstupanje od prosjeka na vie 1.25 , a na prvome 1 .Primjer 5.Mjereno je vrijeme u minutama potrebno za rjeavanje jednog zadatka iz statistike za 10 studenata. Dobiveni su ovi rezultati: 20 22 25 27 28 28 30 30 33 35Je li vrijeme rjeavanja od 35 minuta netipino?Netipian je podatak koji se nalazi izvan pojasa 2 t xtj. ako od prosjeka odstupa za vie od 2.Ako se podaci rasporeuju po normalnoj distribuciji netipian je podatak koji se nalaziizvan pojasa 3 t xtj. ako od prosjeka odstupa za vie od 3. Budui da se vrijeme od 35 minuta nalazi u pojasu 2 t xne moe se

smatrati netipinim.PREDAVANJE #7MJERE ASIMETRIJE njima se mjeri nain rasporeda podataka prema aritmetikoj sredini ili nekoj drugoj vrijednosti.Najvanije su:1. Koeficijent asimetrije 3 - potpuna mjera2. Pearsonova mjera nepotpune3. Bowleyeva mjera mjere1. KOEFICIJENT ASIMETRIJE 3 MOMENTI OKO SREDINE aritmetike sredine odstupanja vrijednosti numerike varijable od njezine aritmetike sredine podignuti na neku potenciju pojedinani podaci Nx xNiir1) (3164 . 138 . 48 . 27 35min 38 . 4min 8 . 27x xzxDoc.dr.sc. Draenka izmi predavanja 2009.g. grupirani podaci kiikiri irfx x f11) (- s obzirom na veliinu r govori se o nultom, prvom, drugom, treem ili etvrtom momentu oko sredine- koeficijent asimetrije 3 je omjeru treeg momenta oko sredine i standardne devijacije podignute na treu potenciju 333Mobino se kree u intervalu z, a u odreenim sluajevima moe biti izvan toga intervala: 3 = 0 simetrina distribucija3< 0 negativno asimetrina distribucija3> 0 pozitivno asimetrina distribucija2. PEARSONOVA MJERA temelji se na odnosu srednjih vrijednosti u distribucijama frekvencija simetrina distribucija pozitivno asimetrinadistribucija negativno asimetrinadistibucija 32Doc.dr.sc. Draenka izmi predavanja 2009.g. - Pearsonova mjera definira se kao standardizirano odstupanje vrijednosti medijana ili moda od aritmetike sredine:

) ( 3 Me xSt ) ( Mo xStkree se u intervalu St = 0 simetrina distribucijaSt > 0 pozitivno asimetrina distribucijaSt < 0 negativno asimetrina distribucija3. BOWLEYJEVA MJERA temelji se na odnosu medijana i kvartila

simetrina distribucija 0 23 13 1 + Me Q QMe Q Q Me pozitivno asimetrinadistribucija 0 23 13 1> + < Me Q QMe Q Q Me negativno asimetrinadistibucija 0 23 13 1< + > Me Q QMe Q Q Me

1 33 12Q QMe Q QSka +kree se u intervalu 1Ska = 0 simetrina distribucijaSka > 0 pozitivno asimetrina distribucija33Doc.dr.sc. Draenka izmi predavanja 2009.g. Ska < 0 negativno asimetrina distribucijaPrimjer 1. pojedinani podaci Radi kontrole deklarirane teine izabran je uzorak od 10 proizvoda pakiranih u vreice. Mjerenjem su dobiveni ovi rezultati u gramima: 10 12 15 13 10 11 12 11 11 15

15 5 . 74311 5 . 245 . 11212 112521112101208 33 16 5 ++ x QNx QNgx xINTNMeg MogNxxi1.koeficijent asimetrije

- 3 je pozitivan, distibucija je umjerenopozitivno asimetrina2. Pearsonova mjera 3. Bowleyjeva mjera 5 . 011 135 . 11 2 13 11 21 33 1 + +Q QMe Q QSkaPrimjer 2. distribucija frekvencija s razredimaDistribucija studenata prema vremenu potrebnom za rjeavanje jednog zadatka iz statistikeUTROENO VRIJEMEBROJ STUDENATARAZREDNE SREDINEifixi ix f2) ( x x fi i3) ( x x fi i10-15 15 12.5 187.5 187.5 -5907.4915-20 20 17.5 350 - -20-25 30 2.5 675 - -25-30 10 17.5 275 - -UKUPNO 75 - 1487.5 1716.67 -1076.29ix ) ( x xi 2) ( x xi 3) ( x xi 10 -2 4 -812 0 0 015 . . .13 . . .10 . . .11 . . .12 . . .11 . . .11 . . .15 . . .120 0 30 363469 . 073 . 16 . 373 . 1 33 3332 Mg31030) (6 . 31036) (1222133 Nx xNx xNiiNii 53 . 017311 12Mo xSkDoc.dr.sc. Draenka izmi predavanja 2009.g. Distribucija je blago negativno asimetrina.Pearsonova mjera:38 . 078 . 467 . 21 83 . 19 Mo xSkBowleyjeva mjera: 18 . 094 . 15 54 . 2342 . 80 2 54 . 23 94 . 15 21 33 1 + +Q QMe Q QSkaMJERA ZAOBLJENOSTIKOEFICIJENT ZAOBLJENOSTI 4 njime se mjeri zaobljenost modalnog vrha distribucije. Izraunava se kao omjer etvrtog momenta oko sredine i standardne devijacije podignute na 4. potenciju 444M negrupirani podaci Nx xMNii 144) ( grupirani podaci kiikii ifx x fM1144) (- 4 = 3 NORMALNA DISTRIBUCIJA najvanija teorijska distribucija- 4 > 3 iljatija distribucija od normalne- 4 < 3 plosnatija distribucija od normalne- 4 1.8 pravokutnadistribucija- 4 < 1.8 U-distibucija EKSCES alternativna mjera zaobljenosti 31 K3513 . 078 . 435 . 14min 78 . 4 89 . 2287 . 227567 . 1716) (35 . 147529 . 1076) (min 83 . 19755 . 148753 333222233 Mfx x fMfx x fMfx fxii iii iii imin 54 . 23min 94 . 15min 42 . 20min 67 . 2131QQMeMoDoc.dr.sc. Draenka izmi predavanja 2009.g. K = 0 ---- normalna distribucijaK > 0 ---- iljatija distribucijaK < 0 ---- plosnatija distribucijaPrimjer 3 .pojedinani podaci Distribucija je plosnatija od normalne.Primjer 4 . distribucija frekvencija s razredima96 . 0 3 04 . 2 304 . 278 . 499 . 106699 . 10667541 . 80024) (min 78 . 4min 83 . 1944 44444 KMfx x fMxii iDistribucija je plosnatija od normalne.MJERE KONCENTRACIJE njima se mjeri nain rasporeda totala po jedinicama niza apsolutne najee se koriste koncentracijski omjeri relativne najee se koristi Ginijev koeficijent koncentracije1. KONCENTRACIJSKI OMJER reda r se odreuje tako da se zbroj r vrijednosti (od njih N) podijeli sa zbrojem N vrijednosti. Pri tome se pretpostavlja da su podaci poredani od najveeg prema najmanjem.ix4) ( x xi 10 1612 015 .13 .10 .11 .12 .11 .11 .15 .120 198UTROENO VRIJEMEBROJ STUDENATARAZREDNE SREDINEifix4) ( x x fi i10-15 15 12.5 13 301.9215-20 20 17.5 .20-25 30 22.5 .25-30 10 27.5 .UKUPNO 75 - 80 024.413679 . 0 3 21 . 2 321 . 273 . 18 . 198 . 1910198) (73 . 11234 44444 KMN x xMgg xiDoc.dr.sc. Draenka izmi predavanja 2009.g.

1111 rNiiriirCNxxCAko se radi o ravnomjernoj raspodjeli, koncentracijski omjer poprima vrijednost od 1 do N. A ako se radi o maksimalnoj raspodijeli, koncentracijski omjer poprima vrijednost 1. - u analizi koncentracije koristi se grafiki prikaz LORENZOVA KRIVULJA1) na osi apscisa nalazi se aritmetiko mjerilo za kumulativni niz relativnih frekvencija2) na osi ordinata nalazi se aritmetiko mjerilo za kumulativni niz proporcija podtotala3) prva toka ima koordinate (0,0); posljednja toka ima koordinate (1,1); koordinate ostalih toaka odreene su vrijednostima lanova kumulativnih nizova4) u grafiki prikaz ucrtava se pravac jednolike raspodjele, on prolazi tokama (0,0) i (1,1)2. GINIJEV KOEFICIJENT temelj za njegovo utvrivanje je povrina izmeu pravca jednolike raspodjele i Lorenzove krivulje. to je koncentacija vee to se Lorenzova krivulja vie udaljuje od toga pravca xi - pojedinane vrijednosti varijable negrupirani podaci i -redni broj podatka- podaci moraju biti ureeni od najmanjeg prema najveem- kree se u intervalu od 0 do 1 - G = 0 ravnomjerna raspodjela- G = 1 maksimalna koncentracija- NORMIRANI KOEFICIJENT GINIJA 1 NNG G37 + NiiNiNii ix Nx N ixG11 1) 1 ( 2Doc.dr.sc. Draenka izmi predavanja 2009.g. PREDAVANJE #8OSNOVNI POJMOVI VJEROJATNOSTIVJEROJATNOST brojana mjera nastanka neizvjesnih, tj. sluajnih dogaaja. Vjerojatnost nastanka dogaaja A jednaka je P(A) pri emu je 0 P(A) 1. Nekada se izraava i u obliku postotka.DEFINICIJE VJEROJATNOSTISLUAJNI POKUS pokus je sluajan ako se u definiranim uvjetima moe ponavljati, ako postoje barem 2 razliita ishoda te ako se ishodi ne mogu predvidjeti sa sigurnou. PROSTOR UZORKA S skup svih moguih ishoda sluajnog pokusaSLUAJNI DOGAAJ jednolani ili vielani podskup skupa S te su sa dogaajima doputene skupovne operacije.1. KLASINA DEFINICIJA (vjerojatnost a priori) pretpostavlja se da se pokus ponavlja konaan broj puta, pri emu se vjerojatnost odreuje kao omjer povoljnog broja ishoda m i ukupnog broja ishoda n nmA P ) (2. STATISTIKA VJEROJATNOST (vjerojatnost a posteriori) broj ponavljanja pokusa je beskonaan, a vjerojatnost se aproksimira relativnom frekvencijom, tj.omjerom apsolutne frekvencije opsega i opsega statistikog skupa.3. SUBJEKTIVNA VJEROJATNOST to je broj iz intervala [0,1] odreen na temelju prosudbe okolnosti relevantnih za nastup sluajnog dogaaja.SVOJSTVA VJEROJATNOSTI:1) vjerojatnost da dogaaj A nee nastupiti jednaka je P()=1-P(A)2) vjerojatnost istodobnog nastupa dogaaja A1 i A2 jednaka je P(A1A2)3) ako su dogaaji meusobno iskljuivi, vjerojatnost da e nastupiti dogaaj A1 ili A2 jednaka je P(A1UA2)=P(A1)+P(A2)4) ako dogaaji nisu meusobno iskljuivi, vjerojatnost nastupa barem jednog od njih jednaka je P(A1UA2)=P(A1)+P(A2)-P(A1A2)5) ponekad je potrebno odrediti vjerojatnost nastupa dogaaja A uz uvjet da se dogodio dogaaj B. Takva se vjerojatnost naziva uvjetnom vjerojatnou ) () () | (B PB A PB A P6) ako su dogaaji neovisni tada vrijedi da je P(AB)=P(A)P(B)SLUAJNA VARIJABLA X numerika funkcija koja svakom ishodu sluajnog pokusa pridruuje realan broj. diskretna- ako poprima konaan broj vrijednosti kontinuirana moe poprimiti bilo koju vrijednost iz nekog intervalaDISTRIBUCIJA VJEROJATNOSTI diskretne sluajne varijable skup ureenih parova razliitih vrijednosti sluajne varijable xi i pripadajuih vjerojatnosti p(xi). Ima slijedea svojstva:38Doc.dr.sc. Draenka izmi predavanja 2009.g. - p(xi) 0- p(xi) = 1Kumulativna funkcija ili funkcija distribucije F(xi) pokazuje kolika je vjerojatnost da sluajna varijabla x poprimi vrijednost xi ili manju. kontinuirane sluajne varijable opisuje razdiobu vjerojatnosti na intervalu vrijednosti varijable. Njena svojstva: - f(x) 0- 1 ) ( dx x fPrimjer 1.KVALITETA PROIZVODA(KLASA)BROJ PROIZVODA UKUPNODOB A DOB BI 20 10 30II 10 10 20III 30 20 50UKUPNO 60 40 100 marginalne vjerojatnostia) Kolika je vjerojatnost odabira proizvoda I. klase?P(A1)=0.3b) Kolika je vjerojatnost odabira proizvoda dobavljaa B? P(B2) = 0.4c) Kolika je vjerojatnost izbora proizvoda III. klase dobavljaa A?P(A3B1) = 0.3d) Kolika je vjerojatnost izbora proizvoda I. ili III. klase? P(A1UA3) = P(A1)+P(A3) = 0.3+0.5 = 0.8e) Kolika je vjerojatnost da se izabere proizvod III. klase ili proizvod dobavljaa B? P(A3UB2) = P(A3)+P(B2)-P(A3B2)= 0.5 + 0.4 0.2 =0.7f) Kolika je vjerojatnost izbora proizvoda dobavljaa A ako je poznato da je III. klase?

6 . 05 . 0 3 . 0) () () | (31 33 1 A PB A PA B Pg) Jesu li varijable kvaliteta i dobavlja neovisne?Ako bi varijable kvaliteta i dobavlja bile neovisne, vjerojatnosti bi u polju tabele bile jednake umnoku marginalnih vjerojatnosti 18 . 0 6 . 0 3 . 0 ) ( ) ( ) () ( ) ( ) (1 1 1 1 B P A P B A PB P A P B A Pj i j iBudui da je 0.20.18, izmeu kvalitete proizvoda i dobavljaa postoji zavisnost.Primjer 2.KVALITETA PROIZVODA(KLASA)BROJ PROIZVODA UKUPNODOB A (B1)DOB B (B2)I (A1) 0.2 0.1 0.3II (A2) 0.1 0.1 0.2III (A3) 0.3 0.2 0.5UKUPNO 0.6 0.4 139Doc.dr.sc. Draenka izmi predavanja 2009.g. a) Pokaite da je navedena distribucija, distribucija vjerojatnosti! 1 ) ( ) 20 ) ( ) 1iix px p DAb) Odredite oekivanu vrijednost! [ ] 00 . 2 ) (i ix p x x F c) Odredite vrijednosti funkcije distribucije! (tablica)d) Odredite vjerojatnost p(x2)! 7 . 0 4 . 0 2 . 0 1 . 0 ) 2 ( + + x pMODELI DISTRIBUCIJA VJEROJATNOSTI temelj inferencijalne statistikeDistribucije vjerojatnosti diskretne sluajne varijable:(najee se koriste binomna i poissonova)1. BINOMNA2. POISSONOVA3. HIPERGEOMETRIJSKA4. UNIFORMNA1. BINOMNA DISTRIBUCIJA njena je definicija povezana sa Bernaulijevim pokusom. Bernaulijev pokus je sluajni pokus slijedeih svojstava: - ima dva ishoda (uspjeh i neuspjeh) - vjerojatnost ishoda uspjeh je p, a neuspjeh q=1-p - pokusi su neovisni x n xq pxnx P

,_

) ( )! ( !!x n xnxn

,_

n-broj ponavljanja Bernaulijevih pokusa p-vjerojatnst ishoda uspjeh x-sluajni broj ishoda uspjeha

Oekivana vrijednost [] p n x E Varijanca q p n 22. POISSONOVA DISTRIBUCIJA granini sluaj binomne distribucije. Prikladna je za opis rijetkih dogaaja, tj. dogaaja koji se javljaju s malom vjerojatnou.!) (xex px nx-broj povoljnih ishoda Oekivana vrijednost [ ] x E Varijanca 2Primjer 3. Prema raspoloivim podaciima banke u prosjeku 5 stranaka po satu zahtijeva usluge oroavanja depozita. Pretpostavi li se da stranke prispjevaju u banku neovisno, po satima u random vremenu s itom vjerojatnosti, kolika je vjerojatnost da se pred elterom za oroavanje nau: (broj stranaka koje u jednom satu za radnog vremena dolaze neovisno i s istom vjerojatnosti diskretna je sluajna varijabla koja se ravna prema Poissonovoj distribuciji s parametrom= 5.)xip(xi)xi p(xi)F(xi)0 0.1 0 0.11 0.2 0.2 0.32 0.4 0.8 0.73 0.2 0.6 0.94 0.1 0.4 1.0UKUPNO1.0 2.0 -40Doc.dr.sc. Draenka izmi predavanja 2009.g. a) 3 stranke? 14037 . 0! 3) 3 (5 eP b) vie od 1 stranke? [ ]03369 . 0! 15) 1 (00674 . 0! 05) 0 (95957 . 0 ) 1 ( ) 0 ( 1 ) 1 (1 50 5 + >epepp p x PPREDAVANJE #9Distribucije vjerojatnosti kontinuirane sluajne varijable:1. NORMALNA (GAUSSOVA)2. STUDENTOVA (T-DISTRIBUCIJA)3.2 (HI-KVADRAT)4. F-DISTRIBUCIJA5. UNIFORMNA KONTINUIRANA6. EKSPONENCIJALNA1. NORMALNA (GAUSSOVA) DISTRIBUCIJA najvanija distribucija vjerojatnosti.- dvoparametarska funkcija (odreena s 2 parametra) : oekivana vrijednost i varijanca ) , (2 N- zvonolika je i simtrina- budui da aritmetika sredina i standardna devijacija ovise o mjernim jedinicama varijable uvodi se jedinina (standardizirana) normalna distribucija xz

22 2; 0 ); 1 , 0 ( NJedinina normalna distribucija je tabelirana. U poljima tabele nalaze se povrine koje predstavljaju vjerojatnosti. U pred-stupcu tabele su sve vrijednosti izraene kao brojevi s jednom decimalom. Druga decimala nalazi se u zaglavlju.Budui da je distribucija simetrina u tabeli su dane samo vrijednosti z. oznaena povrina oznaava vjerojatnost dasluajna varijabla poprimi vrijednost iz intervala od 0 do z.Primjer 1.Sluajna varijabla x distribuirana je po normalnoj distribuciji N ( ,2 ). Odredite vjerojatnost da varijabla poprimi vrijednost:41Doc.dr.sc. Draenka izmi predavanja 2009.g. a) - < x < +

6826 . 0 3413 . 0 2 ) 00 . 1 ( 2) 1 1 ( ) ( < < + < < z Pz p x p Kaemo da je 68.26% vjerojatno da e sluajna varijabla z zauzeti vrijednosti izmeu -1 i 1 ili da e sluajna varijabla x zauzeti vrijednost izmeu- i +.421) (1) (0 + zzzzxzDoc.dr.sc. Draenka izmi predavanja 2009.g. b) -2 < x < +2

Kaemo da je 95,44% vjerojatno da e sluajna varijabla z zauzeti vrijednost izmeu -2 i 2 ili da e sluajna varijabla x zauzeti vrijednost izmeu -2 i +2.2. STUDENTOVA DISTRIBUCIJA- njen oblik je odreen veliinom n- za n>30 (veliki uzorak) distribucija se po obliku pribliava normalnoj distribuciji- za n t p t p( ) ( ) 100 . 0 397 . 1 397 . 1 > t P t PDoc.dr.sc. Draenka izmi predavanja 2009.g. 44Doc.dr.sc. Draenka izmi predavanja 2009.g. OSNOVNI POJMOVI INFERENCIJALNE STATISTIKEINFERENCIJALNA STATISTIKA skup analitikih metoda koje polaze od uzorka.. Budui da se zakljuci donose na temelju dijela podataka oni sadre pogreku nastalu zbog primjene uzorka (Sampling error).Faktori koji uvjetuju primjenu uzorka su slijedei:1. pojedini konani skupovi sadre veliki broj lanova pa bi njihovo istraivanje zahtijevalo velika financijska sredstva2. do rezultata se dolazi u kraem vremenu3. uzorak se primjenjuje kada bi se istraivanjem unitio itav statistiki skup (npr.istraivanje trajnosti elektrinih arulja)4. beskonani skupovi istrauju se iskljuivo metodom uzorka (pr.beskonanog skupa:proizvodnja)Dvije su osnovne zadae metode uzorka:1. procjenjivanje parametra2. testiranje hipotezaPLAN UZORKA plan izbora jedinica u uzorak. Osnovna svrha plana je izbor reprezentativnog uzorka, tj. uzorak mora biti umanjena slika osnovnog skupa.S obzirom na nain izbora jedinica uzorka razlikuju se namjerni i sluajni uzorci.1. namjerni uzorci jedinice uzorka izabiru se prema odluci istraivaa prigodni uzorak ispituju se dostupne jedinice (npr.javno miljenje) uzorak izabran na temelju prosudbe istraivaa istraiva izabire reprezentativne jedinice pri emu je potrebno da dobro poznaje osnovni skup kvotni uzorak anketari se slobodno odluuju za jedinice u sklopu kvota Namjerni uzorci jednostavni su za primjenu te se esto koriste. Analiziraju se metodama deskriptivne statistike. Nedostatak: nije mogue izraunati greku nastalu zbog primjene uzorka.2. sluajni uzorci svaki elemnt ima vjerojatnost izbora veu od nule. Kod ovih uzoraka mogue je izraunati greku. Analiziraju se metodama inferencijalne statistike. jednostavni sluajni uzorak svaki element ima jednaku vjerojatnost izbora. primjenjuje se kod homogenih skupova. stratificirani uzorak prikladniji je kod skupova koji pokazuju vei stupanj varijabilnosti. Jedinice se izabiru iz homogenih dijelova osnovnog skupa koji se nazivaju STRATUMI. uzorak skupina u uzorak se ne izabiru pojedini elementi nego njihove skupine.Ponekad se primjenjuje sistematski izbor (npr.ako iz skupa od 10 000 lanova biramo uzorak veliine 1000 birat emo svaki 10. lan). Budui da se radi o sluajnom uzorku potrebno je odrediti sluajni poetak.45Doc.dr.sc. Draenka izmi predavanja 2009.g. OKVIR IZBORA popis lanova statistikog skupa (npr.biraki popis)46Doc.dr.sc. Draenka izmi predavanja 2009.g. PREDAVANJE #10SAMPLING DISTRIBUCIJA teorijska distribucija vjerojatnosti procjenitelja parametra. Zasniva se na konceptu ponovljenih izbora sluajnih uzoraka iz danog osnovnog skupa pri emu razliiti uzorci dovode do razliitih vrijednosti procjena.Primjer 1.Vrijednosti numerike varijable x koje tvore osnovni skup su 1, 3 i 5. Iz skupa se izabiru uzorci veliine n=2. Izbor je s jednakom vjerojatnou svakog elementa skupa odnosno svakog uzorka.aritmetika sredina osnovnog skupa ()3391 NxNii standardna devijacija osnovnog skupa 38) (2Nxivrijednosti varijabla elemenata u uzorku1 ; 1 1 ; 3 1 ; 5 3 ; 3 3 ; 1 3 ; 5 5 ; 1 5 ; 3 5 ; 5aritmetika sredina uzorka ix1 2 3 3 2 4 3 4 5Provest emo izbor s ponavljanjem izbor u kojem se svaki izabrani element za uzorak nakon izbora vraa u osnovni skup i tako sudjeluje u izboru sljedeeg elementa za uzorak.Budui da je vjerojatnost izbora svakog sluajnog uzorka veliine n=2 jednaka, iznosi 1/9, distribucija je sredina:[ ] 3 ) (i ix p x x Esampling distribucijaOekivana vrijednost sampling distribucije aritmetikih sredina uzoraka jednaka je aritmetikoj sredini osnovnog skupa. Standardna devijacija sampling distribucije sredina prosjeno je odstupanje aritmetikih sredina od aritmetike sredine osnovnog skupa. Ona izraava pogreku koja nastaje zbog primjene uzorka, stoga se naziva standardnom pogrekom aritmetike sredine.aritmetika sredina uzorkaix) (ix P ) (i ix P x 1 1/9 1/92 2/9 4/93 3/9 9/94 2/9 8/95 1/9 5/9ukupno 1 27/9=347Doc.dr.sc. Draenka izmi predavanja 2009.g. PROCJENE PARAMETARA parametar se procjenjuje brojem i intervalom. Intervalna procjena sastoji se od odreivanja granica u kojima e se nai nepoznati parametar.) ... .. .( procjene greka procjene greka + < < - karakteristika uzorka, a ujedno i procjena broja - karakteristika osnovnog skupa koja se procjenjuje (npr. aritmetika sredina, total i proporcija) Procjenitelj: nepristran ako je njegova oekivana vrijednost jednaka parametru koji se procjenjuje [ ] E konzistentan ako njegova standardna devijacija s porastom uzorka tei nuliPROCJENA ARITMETIKE SREDINE moe biti brojem i intervalom procjena brojem jednaka je aritmetikoj sredini uzorka intervalna procjena za veliki uzorak (n>30) koristi se normalna distribucija (Gaussova) x aritmetika sredina uzorka2z koeficijent pouzdanosti koji se odreuje na temelju povrina ispod normalne krivulje xstandardna pogreka procjene aritm.sredine aritmetka sredina osnovnog skupa,a ujedno iparametar koji se procjenjuje

( ) 1razina signifikantnosti intervalna promjena za mali uzorak (n30) koristi se Studentova T distribucija( ) ,_

+ < < 12 2x xt x t x P

2t-koeficijent pouzdanosti koji se odreuje na temelju studentove distribucijePrimjer 2.Odredite vrijednost standardne pogreke procjene aritmetike sredine osnovnog skupa za ove sluajeve:a) Procjenjuje se sredina konanog skupa od 125 768 lanova pomou sluajnog uzorka veliine 1250 lanova. Standardna devijacija osnovnog skupa iznosi 64.N-broj elemenata osnovnog skupa n-broj elemanata uzorkaFrakcija izbora (f) pokazuje da je u uzorak izabrano priblino 1% osnovnog skupa.48( )

,_

+ < < 12 2x xz x z x P05 0 0099 012576812501250125768. f ; .NnfnN< )' > n NnNn

38733 . 01 6000600 600060010105 . 0 , 1 . 06000600> Nn NnfNnfxc) Uzorak veliine 36 izabran je iz beskonanog osnovnog skupa N(, 52) beskonani skup f