180
1 EVROPSKI UNIVERZITET DISTRIKT BRČKO STUDIJE I STEPENA Akademska 2011/2012 P r e d m et: STATISTIČKE METODE Nastavnik Prof. Dr Dr Neđo Danilović

Tema Statisticke Metode

Embed Size (px)

DESCRIPTION

Prezentacija

Citation preview

  • 1EVROPSKI UNIVERZITETDISTRIKT BRKOSTUDIJE I STEPENA

    Akademska 2011/2012

    P r e d m et:

    STATISTIKE METODENastavnik

    Prof. Dr Dr Neo Danilovi

  • 2T-1: Uvod u predmet Statistike metode

  • 3Nastavna pitanja:

    1. Pojam, znaaj i mesto Statistikemetode u korpusu naunih metoda.

    2. Etape primene optenaunestatistike metode

    3. Mere centralne tendencije4. Mere varijabilnosti

  • 41. Pojam, znaaj i mesto Statistikemetode u korpusu naunih metoda

    U literaturi se najee susreusledee klasifikacije metoda:

    A. Osnovne metode naunogmiljenja i istraivanja

    B. Optenaune metodeC. Metode prikupljanja podataka

  • 5A. Osnovne metode naunog miljenja i istraivanja:

    a) analitike osnovne metode:

    1. metoda analize;

    2. metoda apstrakcije;3. metoda specijalizacije klasifikacija i dihotomija;4. metoda dedukcije;

    b) Sintetike osnovne metode1. sinteza;2. konkretizacija;3. generalizacija; i4. indukcija.

  • 6B. Opte naune metode

    1) Hipotetiko-deduktivna metoda;2) Statistika metoda;3) Metoda modelovanja;4) Aksiomatska metoda;5) Komparativna metoda.

  • 7C. METODE ZA PRIKUPLJANJE PODATAKA

    1) ispitivanje;2) posmatranje;3) eksperiment;4) operativne metode sakupljanja podataka:

    4.1) studija sluaja;4.2) analiza dokumenata;4.3) test metoda i4.4) biografska metoda

  • 8 Statistika metoda spada u grupu opte naunih metode

    Opte naunim metodama su one metode koje se, kao celine,koriste ili se mogu koristiti za sticanje naunog saznanja u svimnaukama i svim naunim disciplinama;

    Opte naune metode se konceptualno i metodoloki razlikujuod svih ostalih metoda saznanja;

    Osnovu opte naunih metoda ine tzv. osnovne metode (npr.osnovu statistike metode ine indukcija i generalizacija, aosnovu metode modelovanja ine analogija, analiza,apstrakcija, sinteza i generalizacija;

    U svakom naunom istraivanju jedna od opte naunih metodaje dominantna, primarna, dominirajua, druga moe da budeistovremena (paralelna), a ostale se podrazumevaju kaodelotvorne u skladu sa vrstom istraivanja i svojstvimapredmeta istraivanja;

  • 9STATISTIKA METODA

    Statistika je grana matematike primenjena u istraivakoj idrugoj praksi;

    Statistika omoguava otkrivanje inilaca stvarnosti kojiimaju i svoj kvantitativni izraz u obliku numarikih dataposredstvom kojih se mogu saznavati kvantitativna svojstva,odnosi i kretanja inilaca manifestovanih pojava, njihovihdelova i elemenata;

    Ovakva shvatanja zanemaruje injenicu da se iniocidrutvene stvarnosti odigravaju i egzistiraju u vremenu iprostoru;

    Pored toga, ovakva shvatanja zanemaruju i injenicu dasvaka numerika data iskazuje kvantitet sasvim odreenogkvaliteta;

  • 10

    Statistiki nain miljenja jednog e dana zasvakodnevni ivot graana postati jednakoneophodan kao znanje itanja i pisanja.

    H. G. Wells(1866-1946).

    Statistika je obrada brojanih podataka radi jasnijegprikazivanja.

    Statistika metoda postala je u savremenom ivotudonekle ak dio opteg obrazovanjai optekulture, jer je npr. teko zamisliti danas ovekabilo koje struke, ako posjeduje visoko obrazovanje,da mu ne bi bili poznati pojmovi aritmetikesredine, varijabilitetai tome slino.

  • 11

    ZATO IZIAVAMO STATISTIKU?

    Postoje etiri nivoa na kojima savremenom ovekupotrebna statistika:

    Poznavanje statistike potrebno je zbog praenja strune inaune literature;

    Poznavanje statistike potrebno je pri obradi rezultata,prikupljenih istraivanjem ili eksperimentom, radideskripcije i analize tih rezultata;

    Poznavanje statistike potrebno je u znanstvenom i stru-nom radu radi zakljuivanjaiz konkretnog sluaja naopti zakon;

    Poznavanje statistike potrebno je pri planiranju istraiva-nja i eksperimenata.

  • 12

    Glavna obeleja statistike statistikog metoda jesu:

    Statistika odnosno statistika metoda odnosi se naistraivanje masovnih pojava koje se sastoje iz mnotvajedinica mnotva pojedinanog u optem;

    Saznanja, zakljuci statistike statistike metode izraujuse kao induktivni zakljuci izvedeni iz vie premisa;

    Generalizacija do koje se dolazi statistikom statistikommetodom je induktivna, pa su radi toga steena saznanjaovom metodom uglavnom verovatna;

    U svim naukama i naunim disciplinama statistika statistika metoda je primenjiva, iako su razlike u primeniove metode evidentne;

  • 13

    Statistika metoda ima svoj epistemioloki sadraj kojiobuhvata:

    optesaznajne odredbe matematike, posebne saznajne osnove statistike kao grane matematike, odredbe nauke i predmeta nauke i odredbe teorije metodologije nauka (opte metodologije) i

    metodologije predmetne nauke (posebne metodologije);

    Postupci statistike ne javljaju se samostalno vepovezani sa metodama prikupljanja i obrade podataka iuslovljeni su svojstvima podataka.

    Otuda je metodoloki ispravnije govoriti ooptenaunoj statistikoj metodi kojom se optesaznaje preko pojedinanog i posebnog, nego prihvatitiodredbu o statistitici kao grani matematike.

  • 14

    POJMOVNO ODREENJE STATISTIKE

    Statistika je nauna metoda istraivanjamasovnih drutvenih pojava na dovoljnovelikom broju prikupljenih, sreenih,analiziranih i interpretiranih podataka kojiizraavaju varijabilnost i kovarijabilnost,preteno s kvantitatiovnog, ali i skvalitativnog aspekta, radi deskripcije,analize, otkrivanja zakonitosti koje u njimapostoje i generalizacije zakljuaka koji seizraavaju statistikim brojanim merama

  • 15

    Statistika prouava masovne pojave koje su:

    neka mnoina injenica; uslovljene mnoinom uzroka; izraene brojevnim znakovima; izmerene na standardan i precizan nain; prikupljene na sistematian nain, prikupljene uz potovanje unapred

    planiranog cilja prikupljanja injenica; i sve zajedno postavljene u neke

    meusobne odnose.

  • 16

    2. Etape primene optenaunestatistike metode

    Statistika metoda koristi se u istraivanju masovnihinilaca stvarnosti;

    Ona se koristi i u teorijskim istraivanjima;

    Sva nauna saznanja su iskazana u raznim oblicimaiskaza (stavova, sudova, zakljuaka) i svaki od njih jepojedinani akt specifine drutvene stvarnosti;

    Oni su sadrani u raznovrsnim dokumentima, koji su,svaki za sebe, pojedinani;

    Otuda i tzv. teorijska istraivanja ne mogu da izbegnustatistiku metodu.

  • 17

    Postoji vie etapa u primeni statistike metode;

    Prvi in primene statistike metode je identifikacijastatistike mase;

    Statistiku masu ini ma koja sloena celina ije sejedinice mase mogu utvrditi i koja sadri odreenosvojstvo, karakteristiku, obeleje koje omoguavada se ona shvati kao celina;

    Statistika masa predstavlja zbir posebnih javljanjamasovne pojave koja je predmet statistikogprouavanja;

  • 18

    A. IDENTIFIKACIJA STATISTIKE MASE

    Identifikacija statistike mase podrazumeva:

    jasno definisanje svojstava koja jednu jedinicusvrstavaju u statistiku masu;

    otkrivanje i utvrivanje izvora podataka ostatistikoj masi i procedura korienja ivrednovanja izvora i njihovog sadraja;

    otkrivanje broja i rasporeda statistike mase

  • 19

    Statistika masa se utvruje na tri naina:

    popisom tj. prebrojavanjem svih jedinica kojepo nekom svojstvu osobina ine celinu (npr.svi stanovnici na jednoj teritoriji ili svi studentiEUDB);

    ocenom i procenom statistike populacije poodreenim svojstvima;

    utvrivanjem relativno reprezentativnoguzorka na osnovu kojega se moe izraunativerovatna statistika masa.

  • 20

    Znaaj naunog saznanja o osnovnojstatistikoj masi proistie iz injenice:

    da je statistika masa socijalni okvir koji sadri sva svojstva iosobine, sve procese i dogaaje koji se mogu javiti kaopredmet istraivanja u drutvenim i prirodnim naukama;

    da je statistika masa stalni predmet istraivanja globalnog iparcijalnog karaktera zbog svoje promenljivosti i raznovrsnostikako strukturalnih, procesualnih, sistematskih, funkcionalnih,tako i kvalitativnih, kvantitativnih, prostornih i vremenskihodredaba;

    da je statistika masa osnov svim daljim statistikimpostupcima i procedurama, poev od kvantifikacija i merenjado utvrivanja odnosa (korelacije i regresije).

  • 21

    Opta pravila za utvrivanje statistike mase statistike populacije su:

    utvrivanje osnovnih odlika (obeleja) po kojimabilo koja statistika jedinica pripada jednojstatistikoj masi populaciji;

    konstatovanje da jedinice poseduju ili ne posedujuodreenu odliku obeleje;

    Prebrojavanje i sabiranje jedinica koje imajuodreenu odliku obeleje: 1+1+n = P

    Sabiraju se jedinice istog obeleja, a osnovnipostupci su selekcija po utvrenim kriterijumima.

  • 22

    B. ODREIVANJE I IZRADA UZORKA

    Drugi in primene statistike metode je odreivanje i izradauzorka;

    Uzorak je podskup osnovnog skupa, a uzima se u svrhuispitivanja obiljeja elemenata osnovnog skupa (ili populacije).

    U mnogim sluajevima obuhvatanje svih jedinica statistikemase je neekonomino, pa se pribegava uzorku koji dovoljnopouzdano reprezentuje tipina svojstva statistike mase;

    Statistiki uzorak je deo osnovne statistike mase populacije iz koje su izdvojene po odreenom kriterijumu nekejedinice skupa koje e se podvrgnuti istraivanju i na osnovukojih e se zakljuivati o celom skupu.

  • 23

    Da bi jedan uzorak bio valjan na osnovu kojegbi se zakljuivalo o skupu u celini, mora da

    zadovolji izvesne kriterijume:

    Da po obimu obuhvata dovoljan broj jedinicapojave;

    da po strukturi (svojstvima obuhvaenih jedinica,prostornom i vremenskom razmetaju) buderelativno saglasan sa obelejima i odlikamastrukture mase;

    ako ne ispunjava ova dva zahteva, uzorak nijereprezentativan.

  • 24

    Vrste uzoraka

    U teoriji i praksi prisutni su dva tipa uzorka:

    uzorak koji se konstruie metodom sluajnogizbora,

    namerni uzorak.

    Izmeu ova dva tipa uzorka postoji itav nizraznih uzoraka (prost sluajan uzorak,sistematski sluajni uzorak, viestepeniuzorak), ali je najee upotrebljivstratifikovani uzorak;

  • 25

    Kad god je mogue poeljno je izabrati sluajniuzorak. U takvom uzorku svaka jedinica populacije(osnovnog skupa) ima jednaku vjerojatnost dabude izabrana.

    Uzorak ne smije biti selekcioniran (npr.potrebno je obuhvatiti istraivanjem i gradsko iseosko stanovnitvo, zatim u nekom medicinskomistraivanju nije cilj samo analizirati i donositizakljuke za dobrovoljce).

    Ako neki lanovi populacije imaju veu ansu oddrugih da budu izabrani, takav uzorak se nazivapristrani uzorak (biased sample).

  • 26

    a) Sluajni uzorak

    Sluajan uzorak sastavlja se prema odreenimnaelima koji odgovaraju zakonu sluaja. Najboljinain je upotreba tablice sluajnih brojeva ilikoritenje raunanarskog siistema sluajnog izbora(generator sluajnih brojeva).

    Postupak formiranja sluajnog uzorka:

    prvo se utvrdi evidencija statistike mase;

    zatim se utvrdi Korak pri izdvajanju jedinica iz statistikemase i uvrtavauju jedinice u uzorak;

    potom se vri izbor broja od koga se zapoinjeprebrojavanje, odnosno izbor jedinica za uzorak

  • 27

    b) Sistematski uzorak

    Uzorak moe biti i sistematski ako sejedinice iz osnovnog skupa birajusistematski.

    Na primjer, ako se po redu u uzorak birasvaki 10. element iz osnovnog skupa.

  • 28

    c) Namerni i prigodni uzorak

    Kod namernog uzorka broj jedinica se unapredutvruje po odreenim kriterijumima (sadrajnosti,formi, verodostojnosti i dostupnosti) uzorka;

    zatim se utvruju kvote (broj jedinica odgovarajuihkarakteristika);

    same jedinice statistike mase unutar kvota mogubiti namerno izabrane;

    Prigodni uzorak je onaj koji se nae pri ruci jerje drugi nedostupan. Na primjer, dostupni bolesnicina odeljenju u bolnici, prisutni studenti neke godinestudija i slino.

  • 29

    ) Stratifikovani uzorak

    Stratificirani ili slojeviti uzorak je takav uzorak koji se dobije tako dase populacija podeli u slojeve ili stratume prema nekim karakteristikamate da se iz svake od grupa uzme sluajni uzorak. Na primjer, usociolokim istraivanjima stratumi se mogu birati prema starosnim -dobnim skupinama.

    Koristi se u sluajevima kada je u cilju pouzdanijereprezentativnosti, neophodno da svaki karakteristian deostatistike mase bude proporcionalno zastupljen u uzorku. Npr.ako jedinica X uestvuje sa 10% u statistikoj masi, ona e usastavu uzorka uestvovati sa 10%;

    Svaka od ovih strata moe da bude formirana posebnimpostupkom metode sluajnog izbora;

    kod ovog tipa uzorka, mogu je uzorak sa deformisanomproporcijom, tj. strate koje obuhvataju veoma malo statistikemase, poveavaju se na raun strata sa najvie jedinica;

  • 30

    ) Kvotni uzorci

    Kvotni uzorci su jo loiji jer predstavljajunesluajni stratificirani uzorak.

    Upotrebljavaju se kod ad hoc organiziranihistraivanja za trine potrebe, za prikupljanjemiljenja graana o nekom problemu i slino.

    Istraiva unaprijed izabere broj ljudi (kvotu)svakog pojedinog stratuma koje mora intervjuisati,stoga se ti uzorci nazivaju kvotni.

  • 31

    d) Klaster uzorci

    Klaster uzorci su loija varijanta sluajnog uzorka iupotrebljavaju se u velikim trinim, ekonomskim ilipolitikim istraivanjima.

    Na primjer, pri ispitivanju miljenja stanovnikanekoga grada o nekoj problematici, grad se moeprema planu podijeliti na 50-ak blokova, odnosnokvartova.

    Tada se na sluajan nain biraju neki blokovi ukojima anketari detaljno intervjuiu sve stanovnike.

    ak se vraaju na adrese dok ne dobiju intervju odsvakog stanovnika u odabranim blokovima.

  • 32

    Veliina uzorka

    Veliinu uzorka nije mogue uoptenodefinisati jer to zavisi o varijabilnosti pojavekoja se meri i o preciznosti kojom se pojavaeli izmeriti.

    Za uzorak je najvanije da budereprezentativan.

  • 33

    Frakcija odabiranja (f) je odnos jedinica u uzorku ibroja jedinica u osnovnom skupu:

    f = n/Ngdje je:

    n - broj jedinica u uzorkuN - broj jedinica u osnovnom skupu.

    Korak izbora je reciprona vrednost frakcijeodabiranja (f/1);

    Upotrebljava se kod sistematskog izbora jedinica uuzorak.

    To znai da ako je korak izbora jednak 20, tada se uuzorak iz osnovnog skupa odabire svaki 20. element.

  • 34

    Postoje brojne teorije o veliini uzorka, ali ni jedna ne dajepouzdani odgovor koja je veliina uzorkanajreprezentativnija;

    Mnogi misle da je 10% jedinica (populacije) od statistikemase dovoljno za jedan reprezentativan uzorak;

    Drugi smatraju da je u istraivanju masovnih pojavadovoljno 3000 jedinica, a esti su sluajevi u kojima jedovoljno 1000, a ponekada i samo 100 jedinica;

    vano je znati da svojstvo predmeta i tipaistraivanja opredeljuje zahtev za odreenimuzorkom;

    Postoje odreeni uzusi u istraivakoj praksi prema kojimaje za ispitivanje u kojima sa koristi est osnovnih obeleja,dovoljan obuhvat od 3000 jedinica - ispitanika.

  • 35

    U teoriji metodologije nauka razlikujemo:

    male uzorke, do 30 jedinica iz osnovnog skupa;

    velike uzorke, vie od 30 jedinica osnovnog skupa;

    U statistikoj praksi uzima se u obzir i stopaodabiranja uzorka;

    tako za uzorak ija je stopa odabiranja do 5%kaemo da su mali uzorci;

    za uzorke kod kojih je stopa odabiranja preko 5%kaemo da su veliki uzorci.

  • 36

    V. PRIKUPLJANJE PODATAKA

    Statistika metoda ne koristi iskljuivo svojeinstrumente za prikupljanje podataka, niti ihposebno razvija, ve se podaci prikupljajutehnikama, instrumentima i postupcima metoda zaprikupljanje podataka;

    Statistikom metodom se prikupljaju kvantitativni,kvalitativni, hronoloki i geografski podaci;

    Podaci koji se prikupljaju statistikom metodomiskazuju odreena svojstva (kvalitete), u odreenojkoliini (kvantitete), u odreenom vremenu(hronoloki) i na odreenom prostoru (geografski);

  • 37

    G. FORMIRANJE STATISTIKIH SERIJA

    Prikupljene podatke je neophodno obraditi i srediti;

    za tu svrhu formiraju se statistike serije, kojima sestatistiki opisuje istraivana pojava;

    Od prikupljenih podataka mogu se obrazovati dveosnovne vrste serija: Statike serije i Dinamike serije

  • 38

    statike serije opisuju stanja i za njih sekoriste kvalitativno-kvantitativni i geografskipodaci;

    dinamike serije statistiki opisuju kretanja niz stanja u raznim vremenima na jednomodreenom prostoru ili na vie njih;

    Mogue su i razne konbinacije ove dvestatistike serije, tj. formiranje vieparalelnih serija podesnih za kompariranjestanja na raznim prostorima u jednom ilivie vremenskih perioda;

  • Statistiku seriju ine dve kolone;

    U prvoj je dato obeleje po kojem jeizvreno grupisanje;

    druga kolona pokazuje broj jedinicapojedinih grupa u seriji

    U zavisnosti od broja obeleja postojeproste i sloene serije.

    39

  • U zavisnosti od toga ta pokazuju,statistike serije dele se na:

    serije strukture (raspored jedinica premamodalitetima i vrednostima obelejima);

    vremenske (hronoloke) serije (varijacijeposmatranih pojava tokom vremena);

    geografske serije (prostorni teritorijalniraspored pojave).

    40

  • ako je numeriko obeleje prekidno,vrednosti obeleja grupiu se po veliiniod nie vrednosti ka vioj;

    vrednosti neprekidnog obeleja grupiuse u intervalu (tzv. intervalne serijedistribucije frekvencije);

    Broj i irina intervala odreuju sestuges-ovim pravilom pomou formule:

    41

  • K=1+3,3 log Ni= X max-X min/k

    n broj intervalaN broj statistikih jedinicai irina (veliina) intervalaX max najvea vrednost obelejaX min najmanja vrednost obeleja

    42

  • donja granica prvog grupnog intervalaodreuje se pomou formule:

    Xo = X min i / 2Xo donja granica prvog grupnog intervala;

    X min minimalna vrednost obeleja iz skupastatistikih podataka;

    i irina grupnog intervala

    43

  • ZADATAK 1.Na pismenom ispitu iz statistike 30 studenata dobilo je sledece bodove:

    36 41 47 51 61 65 71 79 80 8165 70 70 77 84 87 91 95 100 9141 45 50 57 61 65 70 81 95 100

    a) Grupisati podatke u obliku numericke serijeb) Grupisati podatke u obliku intervalne numericke serijeReenje:a) Za grupisanje podataka u obliku numericke serije uoci se najmanja

    vrednost obeleija, a zatim se vrednosti reaju po rastucem nizu utabeli. Potom se prebrojavaju koliko se puta pojavljuju pojedinacnevrednosti obeleija pa se te brojke upisuju u tabelu.

    44

  • 45

    Broj bodova(X)

    Broj studenata(f)

    Broj bodova(X)

    Broj studenata(f)

    36 1 71 1

    41 2 77 1

    45 1 79 1

    47 1 80 1

    50 1 81 2

    51 1 84 1

    57 1 87 1

    61 2 91 2

    65 3 95 2

    70 3 100 2

    Ukupno: 30

  • b) Za grupisanje podataka u obliku intervalne numericke serijepotrebno je odrediti broj grupnih intervala (K) i irinu tih intervala (i).

    Broj grupnih intervala odreuje se Stuges-ovim pravilom pomocuformule: K = 1 + 3,3 log N, a irina intervala pomou izraza:i = X max -X min / K

    K = 1 + 3.3 . log 30

    K = 1+ 3.3 . 1.47712 i = 100 36/6 K = 1+ 4,8745 K = 5,8745 K = 6 (interval)

    46

  • 47

    D. STATISTIKA ANALIZA

    Statistiki podaci sreeni u statike i dinamike serijeanaliziraju se da bi se otkrila struktura, meusobniuticaj inilaca strukture i dinamike odigravanjaistraivanih pojava;

    Poznate su tri osnovne vrste analize: Statika analiza kojom se spoznaje odreena struktura, Dinamika analiza, kojom se otkriva kretanje odreene

    pojave, i Korelaciona analiza (statika i dinamika) kojom se otkriva

    postojanje veza izmeu podataka tl. grupa podataka,

  • 48

    Glavno nastojanje statistike analizeusmereno je na otkrivanje:

    distribucije frekvencije, tj. otkrivanje rasporedauestalosti pojava odreenih osobina numerikihiskaza, ali bez vremenske odredbe statikaanaliza;

    otkrivanje vremenskih varijacija, svojstava,odredaba, inilaca pojava - dinamika analiza;

    saznanja o tome stiu se izraunavanjem trendai periodinih oscilacija

  • 49

    Najei postupci statistike metode su:

    prebrojavanja,

    izraunavanje procenata i

    izraunavanje srednjih vrednosti, odnosnomera centralne tendencije

  • 50

    IZRAUNAVANJE SREDNJEVREDNOSTI

    Svi uesnici u nekom drutvenom procesu na nekojteritoriji i u nekom vremenu, imaju neka ista, nekazajednika i neka razliita obeleja;

    Svi oni ive na raznim delovima prostora, raznestarosti i spola, imaju razne ili iste uloge udrutvenom procesu itd;

    Saznanje pretenosti u koncentracijama i razlikamasaznajemo preko distribucije frekvencije, odnosnopreko podataka svrstanih u serije;

  • 51

    Distrbuciju frekvencije karakteriu etiriodredbe:

    Srednja vrednost (centralna tendencija);

    Rasprivanje (disperzija);

    Asimetrinost, odnosno simetrinost uraspodeli podataka;

    Kurtinost podataka

  • 52

    ta je srednja vrednost i koje vrstesrednjih vrednosti u statistici postoje?

    Prvi postupak u razmatranju statistikih podataka odistribuciji frekvencije nekog obeleja je izraunavanjesrednje vrednost, tj centralne tendencije;

    Srednja vrednost je statistika mera centralnetendencije;

    Njome se utvruje centar populacije osnovnog skupa,odnosno raspoloivih pribavljenih podataka oistraivanoj pojavi;

    Na taj nain nastaje prosjek, taka, linija oko koje sepodaci najvie grupiu

  • 53

    Srednja vrednost je individualna vrednostkoja reprezentuje jednu populaciju i imasvojstvo proseka (prosene vrednosti);

    U svim drutvenim istraivanjima obaveznose izraunavaju neke od sledeih vrstasrednjih vrednosti:

    a) Aritmetika sredinab) Medijana (medijan)c) Modus (mod), a mogu biti od koristi i) Geometrijska i harmonijska srednja vrednost

  • 54

    a) Izraunavanje aritmetike sredine

    Aritmetika sredina je najee inajreprezentativnija mera centralnetendencije;

    U njenom izraunavanju uzimaju se u obzirsve jedinice populacije, jer ona reprezentujeono to im je zajedniko;

    Aritmetika sredina je suma vrednostipodataka podeljenih brojem podataka;

  • Aritmetika sredina je dakle

    Najea i najpoznatija mjera prosjeka, kao inajee izvoen raun za statistike potrebe.

    Osnovna formula za izraunavanje aritmetikesredine glasi: ARITMETIKA SREDINA =SUMA SVIHREZULTATA KROZ BROJ REZULTATA

    XX = -------

    N55

  • 56

    Pozitivna svojstva aritmetike sredine

    ima niz prednosti u odnosu na sve druge merecentralne tendencije;

    moe se izraunavati za bilo koji niz intervalnihpodataka;

    ona je jedinstvena samo jedna za bilo koji nizpodataka;

    za njeno izraunavanje uzimaju se svi podaci,prema formuli: X=(X1+X2+...Xn)/

  • 57

    Aritmetika sredina se javlja u dve uloge:

    Kada se izraunava na osnovu uzorka ona jestatistika aritmetika sredina;

    Kada se izraunava po podacima za itavupopulaciju ona je parametar

    Aritmetika sredina moe da se izraunava izpodataka grupisanih po frekvenciji, podatakagrupisanih u razrede i pomou proizvoljnepolazne take;

  • 58

    b) Izraunavanje medijane

    Medijana je takoe postupak izraunavanja meracentralme tendencije;

    Medijana je centralna vrednost jer se nalazi usredini (centru) niza podataka (serije podataka) ukojoj su podaci poreani po redosledu vrednosti(veliini), poev od najvee ka najmanjoj iliobrnuto;

    Medijana je taka na skali iznad koje se i ispod kojese nalazi po 50% sluajeva (podataka, skorova);

    Izraunava se po formuli: M (S) =(N+1)/2

  • Prednost medijane (centralne vrednosti)pred aritmetikom sredinom sastoji se utome to na nju ne utie vrednost pojedinihrezultata, pa prema tome jedan vrloekstremni rezultat nee nita promijenitivrednost C, koja je uslovljena samo brojemrezultata.

    Praktina upotreba vrednosti C sastoji se ulociranju optimalnog poloaja.

    59

  • Primer: Ako u jednom merenju dobijemo ovih 11rezultata:

    7 9 4 7 8 7 10 6 6 9 8,pa ih poredamo po veliini:

    4 6 6 7 7 7 8 8 9 9 10. Budui da imamo 11 rezultata, srednji rezultat je esti

    rezultat (jer imamo 5 rezultata ispred i 5 rezultata izanjega) pa je C=7, poloaj rezultata koji zauzimacentralna vrijednost, moe se odrediti pomou formule:

    Poloaj C = (N+1)/2 Ako je broj rezultata paran, centralna se vrednost

    izraunava tako da se zbroje dva srednja rezultata, asuma podijeli sa 2:Primer: Kad bismo imali rezultate: 4 5 5 6 8 9,

    C= (5+6)/2 = 5,5.

    60

  • 61

    Na primer: Imamo seriju numeriki

    izraenih primnja stanovnika:

    Rednibroj

    Mesto Primanja stanovnika

    1. - 300002. - 250003. - 200004. Mesto M 150005. - 10000

    6. - 50007. - Noe od 5000

  • 62

    Na navedenom primeru, medijana seizraunava:

    M(S)=(N+1)/2=(7+1)/2=4

    Osim prikazanog sluaja, medijana semoe izraunavati i kod podataka kojisu grupisani u razrede:

  • 63

    c) Izraunavanje Moda (modusa) - Mo

    Mod je takoe oblik izraunavanja meracentralne tendencije;

    Mod je skor koji se najvie koristi u skalipodataka i moe biti sirov i pravi;

    Dakle, u nizu podataka raznih veliina kojipredstavlja distribuciju frekvencije, mod jevrednost (veliina) koja se najeepojavljuje;

  • Mod ili Dominantna vrednost (D) je ona vrednost koja jeu nizu merenja najee postignuta (dakle kojadominira).

    Primjer: Uzorak od 550 branih parova ima ukupno1660 dece. Prosjek za utvrivanje gradnje stanovaraunao bi na 3,02 deteta po branom paru i znatnopogrijeio u procjeni.

    Broj djece: 0 1 2 3 4 5 6 7 8 9 10 11 12 Broj branih parova s tim brojem djece: 70 90 108 86

    70 47 30 20 15 5 4 3 2. D vrijednost je dvoje djece (108 branih parova). Prednost D vrijednosti ispred aritmetike sredine je to

    na nju ne utjee ni broj ni vrijednost rezultata, ve samofrekvencija pojedinih rezultata.

    64

  • 65

    Sve tri mere centralne tendencije(aritmetika sredina, medijana i mod)iskazuju koncentraciju podataka okoneke bitne, najee, karakteristineodredbe;

    Zajedniko im je da su podaci rasutina raznim udaljenostima od odreenetake ili linije i da je njihova najveagustina u sreditu: Npr.:

    __________________

  • GEOMETRIJSKA SREDINA, preteno se koristi kaoprosjena mjera brzine nekih promjena (ako brojnije negativan ili nula).

    Primjer: Ako mjesto A ima 1960. 2000 stanovnika,1961. 9000, a 1962. 18 000 stanovnika, onda jepopulacija 1961. bila 4,5 puta vea od populacije u1960., a populacija 1962. dva puta vea od 1961.

    Postavimo li pitanje koliko je puta prosjenopopulacija svake godine porasla, izraunat emopomou geometrijske sredine:

    G = koren iz 4.5 x 2 = koren iz 9 = 3 puta

    66

  • Harmonina sredina (H) koristi se kadelimo dobiti prosjeke nekih odnosa (npr.prosjene km/h, prosjeni broj slova uminuti).

    H se ne moe izraunati ako je bilo koji brojnegativan ili nula.

    H se izraunava prema formuli:N

    H= -------------

    1x

    67

  • 68

    Izraunavanje mera centralne tendencijepodrazumeva i utvrivanje mera njihovevarijbilnosti kojima se saznaje kakvo jeodstupanje podataka od srednje vrednosti;

    Aritmetikoj sredini najvie odgovarajuizraunavanja standardne i prosenedevijacije;

    medijani najvie odgovara izraunavanjekvartalne devijacije, a

    Modu najvie odgovara izraunavanjetotalnog opsega;

  • Kako vidimo na slici, varijabilnost je najmanja uraspodeli A, neto je vea u raspodeli B, a daleko

    najvea u raspodeli C.

  • Slika 25: "J" distribucija (raspodjela)

  • "J" distribucija (raspodjela)

    je snano asimetrina, sa najvie vrednostina levoj strani, nije posebno matematikidefinisana,

    vrlo esto nastane zbog pogrenokomponovanog istraivakog instrumentapri istraivanjima na podruju drutvenihnauka (pa se vrednosti "zgusnu" na lijevojstrani ne zbog prirode ispitivane pojave,nego zbog metodoloke pogreke)

  • Slika 26: "U" raspodjela (distribucija)

  • "U" raspodjela (distribucija)

    najmanje je rezultata u sredini raspona, izmeu najniih i najviihvrijednosti

    na ovaj se nain esto raspodjeljuju stavovi, i to je vrlo est sluaj uistraivanjima na podruju socijalnog rada, jer se sudioniciistraivanja esto podijele na one koji o neemu imaju negativnostajalite i one koji o tome imaju pozitivno stajalite

    esto je ovakva raspodjela i rezultat pogreno komponiranoginstrumenta, koji ispitanicima ne daje dovoljno prostora za odgovor,pa se mogu odluivati u vrlo ogranienom broju kategorija

    ovako se distribuiraju na primjer darovitosti, ima naime ljudi kojiimaju dar za pevanje i drugi, koji ga nemaju, i slino. Teko je natom podruju ljudske aktivnosti pronai neke ire kontinuum

  • Slika 27: Bimodalna raspodjela

  • Bimodalna raspodjela

    u raspodjeli su dva rezultata koja sepojavljuju ee nego drugi, odnosno,raspodjela ima dva modusa

    raspodjela se najee pojavljuje kadauesnici ispitivanja nisu iz iste populacije,odnosno nisu u skladu s definiranomstatistikom jedinicom, i kada ispitivanjanisu obavljena pod istim uslovima (naprimjer pri drugom ispitivanju su ispitanicibili u bitno razliitom kontekstu)

  • Slika 28: Polimodalna, multimodalna ili viemodalnadistribucija (raspodjela)

  • Polimodalna, multimodalna ili viemodalnadistribucija (raspodjela)

    raspodela ima tri ili vie modusa, u njoj sudakle tri ili vie rezultata koji se pojavljujudaleko ee nego drugi rezultati;

    raspodjela e se najee pojaviti usluajevima pogreno konstruiranihinstrumenata, ili kada ispitanici ne dolaze iziste populacije, ili kada ispitivanje nijekonzistentno provoeno u istim uslovima

  • Slika 29: Distribucija asimetrina u levo

  • Distribucija asimetrina u levo

    naziv potie otuda to se "rep" krivulje vue premadesnoj strani raspodjele

    glavnina rezultata grupie se na levoj strani rasponarezultata,

    distribuciju emo nai kada na primjer neka vrlomala skupina u mnotvu pokae vie vrednostirezultata, a ostali niske, u socijalnim istraivanjimanalazimo ovakve raspodele posebno na podrujukriminologije

  • Slika 30: Distribucija asimetrina u desno

  • Distribucija asimetrina u desno

    glavna skupina rezultata grupie se nadesnoj strani raspona rezultata

    i ova se distribucija ee nalazi uistraivanjima na podruju socijalnograda, na primer u ispitivanjima napodruju nekih sociopatolokih pojava

  • Slika 31: Poissonova distribucija (raspodjela)

  • Poissonova distribucija (raspodjela)

    je raspodjela retkih, esto "sluajnih"dogaaja

    tako se, na primjer, raspodeljuju nesree,neka manja skupina ljudi izrazito je sklonanesreama

    model se u statistici upotrebljava za situacijekad se neka dogaanja analiziraju uprostornim ili vremenskim jedinicama

  • Mjera asimetrije - skevvness

    Mjera asimetrije (engleski skew =koso, nakrivo, nastranu, dakle:ukosenost) nam pokazuje stupanj dokojeg neka krivulja odstupa od(potpune) simetrinosti.

    Najpoznatiji je Pearsonov koeficijentasimetrije:

  • Pearsonov koeficijent asimetrijeizraunava se formulom:

  • Miljenja o merenju asimetrinostidistribucije frekvencije

  • 87

    STANDARDNA DEVIJACIJA

    Moe se izraunavati iz:

    Negrupisanih podataka;

    Iz grupisanih podataka po frekvenciji;

    Iz grupisanih podataka u razrede;

    Pomou proizvoljne take;

  • 88

    Standardna devijacija je apsolutna meravarijabilnosti pojedinanih rezultata okoaritmetike sredine;

    Standardna devijacija je najpouzdanija i najeekoriena mera varijabilnosti;

    Standardna devijacija pokazuje koliko jearitmetika sredina dobar ili lo reprezentrezultata;

    Izraunava se uz aritmetiku sredinu iz podatakakoji pripadaju bar intervalnoj i racio skali merenja,a za koje postoji pretpostavka o nominalnojdistribuciji mera u populaciji;

  • 89

    Izraava se u jedinicama mere u kojimasu izraeni podaci distribucije iz kojih jeizraunata;

    Standardna devijacija slui da se prikaevarijabilnost uzorka istraivanja, zaprocenu u postupku badarenjainstrumenata, izraunavanja korelacija iza procenu varijabilnosti osnoivnogskupa iz kojega se uzima uzorak.

    Osetljiva je na ekstremne rezultate;

  • Za negrupisane podatke izraunava sepomou formule

  • Za raunanje standardne devijacije neophodno je:

    1. Ureditu podatke, poloaj u nizu nije bitan, vano jeda budu zahvaene sve vrednosti;

    2. Izraunati aritmetiku sredinu vrednosti;3. Od svake vrednosti oduzeti vrednost aritmetike

    sredine (Xi ).4. Kvadrirati svaku pojedinanu razliku (Xi )2.5. Saberati sve kvadrate (Xi )2.6. Podeliti sa N-17. Izraunati koren iz rezultata (Xi )2 / N-18. Rezultat je: Vrednost standardne devijacije s ili

  • Vrijednost standardne devijacije iznosi896,58.

    U rasponu od 1088 896,58 nalazise 68,26% naih podataka.

    A u rasponu 1088 1793,16 (ili dvijestandardne devijacije) nalazi se95,44% naih podata.

  • Za grupisane podatke po frekvencijama standardnadevijavcija se izraunava pomou formule

  • Tabelarno prikazano izraunavanje standardnedevijacije za grupisane podatke po

    frekvencijama

  • Tabelarno prikazano izraunavanje standardnedevijacije za grupisane podatke u razrede

  • Tabelarno prikazano izraunavanje standardnedevijacije za grupisane podatke u razrede

  • Konano izraunata standardna vrednost izgrupisanih podataka u razrede

  • 101

    Korisnost saznanja steenih izraunavanjemsrednjih vrednosti i devijacija

    saznanja steena izraunavanjem srednjih vrednosti idevijacije su verovatna, orjentaciona i neprecizna;

    Na ovim saznanjima se mogu zasnivati samo uopteneocene i opte odluke;

    Ova saznanja su veoma korisna, ali nedovoljno pouzdana;

    Srednja vrednost moe se koristiti u raznim etapamaistraivanja;

    Srednja vrednost moe biti inicijalno saznanje i polazite uistraivanju, a moe biti segment zavrne etapezakljuivanja, a mogu posluiti i za izvoenje trendova,kada se od njih oformi niz serija

  • Nekoliko pravila povezanih sa standardnomdevijacijom (Petz,1997):

    Standardnu devijaciju uvijek raunamo obzirom na aritmetikusredinu,

    Ona nam kae u kojoj je mjeri aritmetika sredina dobarreprezentant vrijednosti nekog niza,

    to je vea standardna devijacija, vie su vrijednosti rasprenei razlikuju se jedna od druge,

    Kao to je aritmetika sredina, i standardna je devijacijaosjetljiva na ekstremne vrijednosti,

    Ako standardna devijacija iznosi 0 (nula), u podacima nemavarijabilnosti, njihove su vrijednosti identine. Meutim, to ese u praksi izuzetno retko dogaati,

  • Standardna devijacija nee obuhvatiti sve vrijednostirezultata, jer se normalna distribucija na objema stranamaasimptotski pribliava abscisi i nikad je ne dodirne,

    Standardna devijacija e izgubiti smisao ako raspodjela nijeniti priblino normalna. Ako je na primjer ekstremnosimetrina u jednom smjeru, teoretski se moe zamislitisituacija da do kraja distribucije doemo s 2 s, a do drugogsa 5 s.

    Smanjivanje ili poveavanje uzorka sistematski ne utjee navrijednost standardne devijacije.

    Praktinost standardne devijacije je u tome da s njommoemo uspjeno i relativno jednostavno predviati ukojem e se rasponu nai gotovo sve vrijednosti niza (~ M 3 s), u kojem emo rasponu nai 95% vrijednosti niza (~M 2 s), a u kojem oko 65% vrijednosti (~ M 1 s).

  • Varijansa

    Meu apsolutne mjere rasprenjaspada varijanca, koja je naprostokvadrirana standardna devijacija ilidrugim rijeima, proces raunanjastandardne devijacije prekinut prijekorjenovanja.

    Obrazac izgleda ovako:

  • Varijansa nam prua mogunostizbegavanja negativnih vrednosti, ali jerezultat vrlo velika vrednost i sam za sebene moe interpretirati odstupanja.

    Zato upotrebljavamo standardnu devijaciju,koja je izraena u jedinicama koje su istekao i jedinice populacije koju analiziramo.

    Varijansa nije posebno primerena zarazumijevanje varijabiliteta na ovom stupnjustatistikog znanja.

  • Koeficijent varijacije ilikoeficijent varijabilnosti

    Koeficijent varijacije ili koeficijent varijabilnosti je,za razliku od drugih mjera rasprenja koje smo dosada predstavili, relativna mjera rasprenja

    On nam pokazuje relativnu varijabilnost nekepojave i to uz pomo standardne devijacije kaopostotka aritmetike sredine.

    Koeficijent varijacije moemo upotrijebiti samo zarazmjerne nizove.

    Izraunamo ga po slijedeem izrazu:

  • Koeficijent varijabilnosti izraunavamopomou formule:

  • MJERE RASPRENJA

    Ako su nam poznati aritmetika sredina i standardna devijacijau nekom nizu, mogue ih je meusobno usporeivati.

    Meutim, to je mogue samo u sluaju kada su aritmetikesredine potpuno jednake i imaju zajedniko porijeklo umjernim jedinicama podataka.

    Kada su, meutim, razliite, nuno je upotrijebiti relativnumjeru varijabilnosti i to koeficijent varijacije.

    Njegovom upotrebom moemo analizirati:

    1. U kojoj osobini neka skupina varira vie, a u kojoj manje, i2. koja od skupina vie varira u istoj osobini.

  • Kako je vidljivo iz tabele 46, u oba grada bio je isti brojkrivinih prijava, jednak je prosjean broj prijava pomjesecima.

    Meutim, broj prijavljivanja kaznenih djela po mjesecimaznatno vie varira u gradu B.

    U gradovima ije smo podatke ovde "predstavili" bio je jednakukupan broj kaznenih djela, jednak je prosjean broj djela pomjesecima.

    Iz standardne devijacije je vidljivo da je varijabilnost vea ugradu B.

    Koeficijent varijacije, meutim, jo jasnije istie da je tajvarijabilitet u gradu B mnogo vei.

    Kakva je situacija kada imamo posla sa razliitimvrijednostima aritmetikih sredina?

    U narednoj tabeli dati su primaoci socijalne pomoi premaradnom statusu i spolu

  • Gledajui vrednost standardne devijacije,uinilo bi nam se da su ene netohomogenije, odnosno da variraju manjenego mukarci.

    Meutim, kako je vidljivo u stupcima B i C,mukarci variraju manje, i to znaajnijemanje nego ene, u sve tri profesionalnekategorije.

  • Vidljivo je da koeficijent varijabiliteta skupine ena koje suprimale novanu pomo iznosi 43,46% svoje aritmetikesredine, a kod mukaraca, koeficijent varijabiliteta iznosi znatnomanje, 34,59% svoje aritmetike sredine.

    Nakon to smo izraunali ukupan broj ena i ukupan brojmukaraca koji su primali novanu pomo [=SUM(B3:B5)odnosno =SUM(C3:C5) ] i prikazali u B6 odnosno C6, izraunalismo u slijedea dva reda i aritmetiku sredinu i standardnudevijaciju.

    Zatim smo u redovima B9 i C9 unijeli funkciju[=SUM(B8/B7)*100] koja je ustvari na obrazac za raunanjekoeficijenta varijabilnosti.

    Sve ove procedure i funkcije su ve prikazane i objanjene uranijim prikazima.

  • 116

    Statistiki postupci obuhvataju, poredmera centralne tendencije, iizraunavanje standardnih skorova istandardnih korelata kao meraporeenja;

    Obino se koriste ztv. Z i T skorovi;

    Z skorovi su sirovi, pretvoreni urelativno standardne jedinice (sigmerastojanja), znaajne zaizraunavanje korelacija;

  • Z vrednost oznaava poloaj rezultata u nizu ilistandardizacija;

    Z vrednosti su izraene u delovima standardnedevijacije nad aritmetikom sredinom;

    Ako su nam poznati aritmetika sredina istandardna devijacija, mogue je izraunati u kojemdelu standardne devijacije se nalazi neka vrednost,pa onda

    moemo izraunati koliko je vrednosti u nizu manjiha koliko veih od neke date vrednosti.

    Izraunava se formulom: Zi = Xi x / s- Zi = standardna vrednost- Xi = pojedinana vrednost- x = aritmetika sredina niza- s = standardna devijacija niza

  • T skorovi formiraju se na osnovu sirovih skorova, i

    najee su celi kontinuirani brojevi sa pozitivnimpredznakom.

  • Korelacija

    [latinski cum, con = sa, kao prefiks oznaava povezanost +relatio oznaava odnos meu predmetima, udaljenost,razmak, dakle korelacije = meuovisnost, meusobnaovisnost.

    Korelacija u statistici znai usklaenost pri variranju(Kolesari&Petz, 1999).

    Ta je usklaenost potpuna u sluajevima kada svakojvrijednosti nekog niza, pripada samo jedna vrijednost udrugom nizu i obratno.

    Povezanost takve vrste nazivamo funkcijskom povezanou.

  • Kada jednoj vrijednosti u jednom nizupripada ak nekoliko vrijednosti udrugom nizu, govorimo o korelacijskojili stohastikoj povezanosti.

  • Primjer nelinearne povezanosti varijabli

  • Takvu vrstu povezanosti pronai emo na primjerizmeu varijable dobi i varijable "pamenja".

    I dob i pamenje kao varijable zajedno "rastu" donekih vrijednosti (zrelog ivotnog razdoblja).

    U "srednjoj dobi" se kapaciteti pamenja nemijenjaju, ali zato u zrelijoj dobi (kad varijabla dobii dalje "raste") kapacitet pamenja neto opada (iponekad uzrokuje ozbiljne potekoe).

    Korelacija moe biti pozitivna i negativna; pozitivnaje kada porast vrijednosti u jednom nizu pratiporast vrijednosti u drugom nizu.

  • Ako je, meutim, porast vrijednosti ujednom nizu praen opadanjem vrijednosti udrugom, korelacija je negativna.

    Stupanj usklaenosti variranja izraava sebrojano. Izraz nazivamo koeficijentkorelacije.

    Numerika vrijednost koeficijenta moe bitiod -1 do +1.

    Maksimalno mogua negativna korelacija je-1, a maksimalno pozitivna +1.

  • Sto je vei koeficijent korelacije (blie -1 ili +1),vea je povezanost medu varijablama, odnosno,pribliava se potpunoj korelaciji. Samo korelacije -1i +1 su potpune korelacije, sve su drugenepotpune.

    Koeficijent korelacije koji iznosi O (nula) kae namda ne postoji povezanost medu varijablama,odnosno da postoji samo sluajna varijabilnost.

    Engleski matematiar Karl Pearson je oblikovaoraunski postupak za raunanje koeficijentakorelacije, i zbog toga je po njemu nazvan jedan odnajpopularnijih i najupotrebljavanijih koeficijenata:Pearsonov koeficijent korelacije r.

  • Za postupak moraju biti zadovoljeni slijedei uslovi:

    1. vrijednosti obaju nizova moraju biti numerike;2. Raspodjele moraju biti simetrine (ili, drugim

    rijeima, ne smiju bitno odstupati od normalneraspodjele),

    3. Povezanost izmeu nizova mora biti linearna (a ne,na primjer, kur-vilinearna)

    Pearsonov je koeficijent korelacije r jedini medukoeficijentima koje moemo upotrijebiti u daljnjimstatistikim operacijama.

  • Jo neke vrlo vane stvari, povezane supotrebom Pearsonovog r:

    1. Apsolutna vrijednost koeficijenta odraava snagu korelacije.Tako je korelacija -0,70 jaa od korelacije +0,50. [Uobiajenaje pogreka studenata koji tvrde da je pozitivna korelacijauvijek "jaa" (ili ak "bolja") od indirektne ili negativne, zbogoznake " - ".]

    2. Kao to pojam negativno ne znai "loe" tako niti pojam"pozitivno" ne znai opu dobrotu pri interpretaciji rezultatakoeficijenta korelacije.

    3. Korelacija znai tek koliinu varijabilnosti koju sadre dva niza,i kae nam koliki je dio te varijabilnosti zajedniki, odnosnopovezan meusobno. [Ako, na primjer, neki niz ne mijenjauope svoje vrijednosti, onda nema to dijeliti s nekim drugimnizom, pa e korelacija biti nulta, odnosno, nee je biti.]

  • Raunanje Pearsonovog koeficijenta korelacije r:Obrazac za raunanje Pearsonovog koeficijenta je slijedei:

  • Znaaenja vrednosti iz formule

    = koeficijent korelacije meduvarijablama X i Y,

    N = broj jedinica koje ispitujemo = jedinica niza X, Y = jedinica niza Y, XY = produkt jedinica nizova X i Y, X2 = kvadriran produkt jedinica niza X, 2 = kvadriran produkt jedinica niza Y.

  • 131

    Zakljuak o meramakorelacije

    Bitan inilac statistike metode i osnovsutinskih saznanja o statistikimpovezanostima i zakonitostimasupredstavljaju mere korelacije;

    Korelacija je po osnovnom znaenjupovezanost izmeu promenljivih vrednosti;

    Njome se izraava uslovljenost, pozitivne ilinegativne usmerenosti;

  • 132

    Vrednost korelacije utvruje semerenjem koeficijenta korelacije;

    Koeficijnat korelacije je numerikavrednost kojom se izraava stepenpovezanosti izmeu dve drutvenepojave;

    Vrednosti koeficijenta korelacije kreuse od +1 do -1;

  • 133

    Stepeni korelacije su razliiti:

    neznatna korelacija, do 0,20;

    Niska korelacija od 0,20 do 0,40;

    Umjerena korelacija od 0,40 do 0,70;

    Visoka korelacija od 0,70 do 0,90;

    Veoma visoka korelacija od 0,90 do 1,0

  • 134

    Korelacija se moe izraunavati primenomvie modela;

    najee se izraunava: Korelacija prema odnosu elemenata u

    varijablama (Pirsonov koeficijenat); Korelacija prema rangu elemenata u varijablama

    (Spirmanov koeficijenat korelacije); Korelacija po serijama elemenata u varijablama

    (Biserijski koeficijenat, Point-serijski koeficijenat iC-koeficijenat korelacije);

    Korelacija po vezama elemenata u varijablama(koeficijent parcijalne korelacije)

    Korelacija izmeu nekoliko prediktora i jednogkriterijuma (koeficuijent multiple korelacije);

  • Za postupak izraunavanja korelacije morajubiti zadovoljeni sledei uslovi:

    1. Vrednosti dva niza moraju biti numerike;

    2. Raspodele moraju biti sismetrine, odnosno ne smiju bitnoodstupati od normalne raspodele;

    3. Povezanost izmeu nizova mora biti linearna;

    4. Korelacija znai tek koliinu varijabilnosti koju sadre dvaniza i pokazuje nam koliki je deo te varijabilnosti zajedniki,odnosno povezan meusobno.

  • Za raunanje koeficijenta korelacije potrebno je:

    Urediti podatke obiju varijabli, najbolje u stupce; Izraunati sumu svih vrednosti jedne i druge varijable; Kvadrirati svaku pojedinanu vrednost jedinica u obadve

    varijable; Sabrati kvadratne vrednosti; Pomnoiti svaku jedinicu jedne varijable s pripadajuom

    jedinicom druge; Izraunati vrednost koeficijenata korelacije u dati obrazac; rezultat raunanja predstavlja Piarsonov koeficijent

    korelacije r

  • Vane napomene pri interpretacijikoeficijenata korelacije

    Sama injenica da izmeu dve varijable postoji nekakorelacija, ne znai istovremeno, da su te dve varijablemeusobno uzrono-posledino povezane;

    Smanjenje raspona smanjuje visinu korelacie (npr. akosmanjimo broj kategorija korisnika socijalne pomoi, onda ese smanjiti i korelacija izmeu broja korisnika i kategorijasocijalne pomoi);

    Kod rezultata grupisanih u skupine, mali broj razreda dovodido iskrivljivanja koeficijenata korelacije;

    Ako u nekom nizu postoje podgrupe koje imaju razliitearitmetike sredine, zajedniki koeficijent korelacije bie veinego koeficijenti za svaku skupinu posebno, pa je nunouvesti korektivne postupke za izraunavanje parcijalnekorelacije.

  • 138

    Ovim modelima izraunavanja korelacijatreba pridodati i Hi - kvatrat kojim sepokazuje verovatnost povezanosti tj.kvalitativnih podataka statistikom merom;

    Ova mera polazi od postavke stepenaslobode odnosno od postavke o nultojhipotezi;

    Ako je vrednost Hi-kvadrata vea, razlikaizmeu dva niza frekvencija je znaajnija;

  • 139

    U statistikoj metodi bitna je i ulogageneralizacija;

    U funkciji statistike generalizacije poznatoje vie postupaka testiranja znaajnostirazlika izmeu statistikih vrednosti, anajznaajniji su:

    konfrontiranje parova radi utvrivanjaznaajnosti razlika:a) meu aritmetikim sredinama,b) meu proporcijama,

    - analiza varijanse, kojom se testira znaajnostrazlike izmeu vie aritmetikih sredina iinterni i eksterni varijabilitet.

  • 140

    Vaan postupak statistike metode, naroito uprognostikim istraivanjima, jeste izraunavanje: standardme devijacije sredine uzorka i standardne devijacije sredine mase;

    Standardna devijacija sredine uzorka izraunava seiz frekvencije obeleja, iz odstupanja od pravesredine uzorka i na osnovu broja jedinica uzorka poobrascu: n=(fd2)/n

    Standardna devijacija uzorka nastje zboguproavanja koja nastaju formiranjem uzorka inemogunosti da bilo koji uzorak potpuno vernoodslikava situaciju statistike mase

  • 141

    Standardna devijacija mase ima neto veuvrednost i izraunava se pomou obrascan=(fd2)/(n-1);

    I kada se primene postupci izraunavanjastandardne devijacije u drutvenimistraivanjima, ne mogu se dobiti sasvimprecizna i sasvim sigurna saznanja osituaciji, ni o stavovima i ponaanjimauzorka, ni statistike mase;

    saznanja su samo verovatna i izraavaju uprvom redu globalne vrednosti i tendencije;

  • LINEARNA REGRESIJA

    statistika nam omoguava da korelacije izmeu davameusobno povezana niza koristimo i za prognozu od jednogna drugi niz;

    Npr. uz pomo prikupljenih saznanja o nizu podataka X,mogue je predvideti kako e se ponaati niz Y koji je sanizom X u nekoj korelaciji;

    Poznate su dve vrste povezanosti meu nizovima; funkcionalna povezanost i regresijska povezanost

    Pravac, koji neke vrednosti u varijabli X povezuje saaritmetikom sredinom svih rezultata varijable Y, a koje supovezane s nekim vrednostima u varijabli X, nazivamoPRAVCEM REGRESIJE

  • Za linearnu regresiju nepohodno je:

    Precizno utvrditi koja je od varijabli nezavisna akoja je zavisna varijabla;

    Urediti obadve varijable u stupce, po parovimavrednosti;

    Kvadrirati pojedine vrednosti varijable X; Kvadrirati pojedine vrednosti varijable Y; Sabrati kvadrate; Pomnoiti XY i sabrati rezultate; Uvrstiti u obrasce vrednosti za a i b; Uvrstiti u formulu: Y' = a +bX

  • MULTIPLE REGRESIJA

    Za regresijski model koriena je jedna prediktorskai jedna kriterijska varijabla;

    U modelu multiple korelacije na raspolaganju sunam vie nezavisnih (prediktorskih) varijabli uzpomou kojih ocenjujem mogue ishode nazavisnim (kriterijskim) varijablama;

    Umesto izraza: Y' = a +bX upotrebili smo izraz:

    Y' = a +b1 X1 + b2 X2

  • 145

    ISKAZIVANJE PODATAKA

    Iskazivanje i predstavljanje podataka je sastavni deostatistike netode;

    Iskazivanje i predstavljanje statistikih podataka teepo utvrenom planu prikupljanja i obrade podataka kojije sastavni deo projekta istraivanja;

    Iskazivanje i predstavljanje statistikih podataka serealizuje kao: pregled opte evidencije podataka; klasifikacija podataka po odreenim princiima; posebno formiranje i iskazivanje serija u skladu sa

    predmetom i ciljevima istraivanja;

    Iskazivanje statistikih podataka je osnov za provoenjestatistike analize.

  • 146

    Iskazivanje statistikih podataka vrise putem raznih tabela kojima seizraavaju veze i odnosi izmeukvalitativnih podataka;

    U naunim istraivanjima prisutne sutri osnovne funkcije tabela: obradne (radne) tabele; ilustrativne tabele; analitike tabele,

  • 147

    Osnovni elementi konfiguracije tabela jesu:

    naslov tabele, redni broj tabele, ukupan apsolutni iznos (sigma) od kojeg se

    izraunavaju razliiti brojevi; zaglavlje tabele dato na poetku tabele

    horizontalno; pretkolone vetikalno i polja tabele nastala u

    presecima redova i kolona tabele, i sume zbirova podataka u redovima i kolonama.

  • 148

    Promer jednostavne tabele

    Tabela 1: Pregled glasanja za predsednika RS na izborima 2002.

    Brpj glasalih/kandidati

    Glasalo Nije glasalo Pogrenoglasalo

    % glasalihod birakog

    tela

    broj % broj % broj % broj %

    1. N.N.

    2. N.N.

    3. N.N.4. Ukupno

  • VRSTE STATISTIKIH ANALIZAA.Frekvencijska analiza

    Frekvencijska analiza pokazuje raspodeluuestalosti neke pojave.

    Ova analiza bavi se onim pojvama koje nam seprikazuju u nominalnim podacima i koje, statistikiprikazane, predstavljaju kategorijske promenljive.

    Osnovna statistika mera u ovom sluaju jeuestalost pojavljivanja jedne kategorije u skupusvih kategorija.

    Ta mera se naziva i raspodela uestalosti, ili prostouestalost (engl. Frequency Distribution).

  • U programu za statistiku obradu podataka izdrutvenih istraivanja - SPSS-u, ova vrsta podatakadobija se zadavanjem sledeih komandi:

    Analyze\ Descriptive Statistics\ Frequencies, apotom se u prozor pod nazivom Variable(s)

    klikom miem u levom prozoru, u kome se nalaze svepromenljive iz baze podataka, ubacuje ona varijabla ijuraspodelu uestalosti elimo da izraunamo;

    mogue je i obeleiti vei broj promenljivih i pritiskomna strelicu izmeu dva prozora ubaciti ih u prozor zaobradu.

    Ukoliko elimo samo tabelu s podacima, pritisnemo OK.

  • Istraivanja kupovne moi seoskih domainstava

    Pogledajmo to na primeru istraivanjakupovne moi seoskih domainstava.

    Recimo da nam je jedan od pokazatelja naosnovu kojih opisujemo kupovnu mo -glavni izvor prihoda u domainstvu.

    Ukoliko elimo da vidimo uee svakog odest moguih izvora, onda u pomenutiprozor ubacimo promenljivu Izvor idobijamo tabelu:

  • Tabela 1: Koji je glavni izvor prihoda u vaem domainstvu?

    Frequency Percent Valid Percent CumulativePercent

    Valid 1. Poljoprivredna delatnost 404 37,7 40,2 40,22. Plate zaposlenih 192 17,9 19,1 59,4

    3. Penzije 221 20,6 22,0 81,4

    4. Pomo rodbine 14 1,3 1,4 82,8

    5. Privatni posao nevezan zapoljoprivredu

    73 6,8 7,3 90,0

    6. Neto drugo 100 9,3 10,0 100,0

    Total 1004 93,7 100,0

    Missing Svstem 68 6,3

    Total 1072 100,0

  • Kolona Frequency pokazuje broj ispitanika koji suse odluili za neki od ponuenih odgovora.

    Tako broj 404 znai da je 404 od ukupno 1072ispitanika odgovorilo da im je poljoprivrednadelatnost glavni izvor prihoda.

    Ovakav podatak sam po sebi nije neposrednoupotrebljiv za merenje kupovne moi, ali jeste zaukupnu sliku o toj pojavi.

    Posle ovog sledi pitanje o visini prihoda, o ueusvakog od pomenutih prihoda u ukupnimprihodima, i slino.

  • Kolona Percent pokazuje procenat onih koji su dalineki odgovor.

    Ovaj podatak, ukoliko je uzorak reprezentativan,tumai se kao procena nekog svojstva celepopulacije.

    Tako u ovom sluaju moemo da kaemo da 37,7odsto seoskih domainstava osnovni prihodostvaruje od poljoprivredne delatnosti.

    To je, dakle, udeo kategorije Prihod odpoljoprivredne delatnosti u promenljivoj Glavni izvorprihoda u domainstvu.

  • Kolona Validpercent pokazuje raspodeluuestalosti samo u onom delu uzorka koji jedao odgovor na pitanje Koji je glavni izvorprihoda u vaem domainstvu?

    Procenti u ovoj tabeli pokazuju proporcijepojedinih izvora prihoda samo kad se oneraunaju za poduzorak od 1004 ispitanikakoji su dali odgovor.

    Tako moemo da kaemo da od svihdomainstava koja mogu da odrede jedanizvor prihoda kao glavni, njih 40,2 odsto tajprihod ostvaruje od poljoprivrednedelatnosti.

  • Kolona Cumulative percent usvakom redu prikazuje zbir svihvrednosti koje prethode tom redu.

    Tako moemo da kaemo da 59,4odsto seoskih domainstava glavniizvor prihoda ostvaruje ili odpoljoprivredne delatnosti ili od platazaposlenih.

  • Prvi pokazatelj oznaen sa Total pokazujebroj ispitanika koji su mogli da izdvoje jedanizvor prihoda kao glavni, a njemu sledujuiprocenat govori da je takvih ispitanika bilo93,7 odsto u odnosu na ceo uzorak.

    Red Missing System pokazuje koliko jebilo ispitanika koji nisu mogli da izdvojejedan izvor prihoda kao glavni, 6,3 pokazujekoliki procenat oni ine u odnosu nacelokupnu seosku populaciju.

    Konano, Total u poslednjem redu pokazujeukupan broj ispitanika obuhvaenihuzorkom.

  • Ukoliko pored ovog pokazatelja elimo da dobijemoi sliku, po ubacivanju promenljive u desni prozormiem pritisnemo dugme Chart ispod tog prozora iu novom prozoru izaberemo jedan od ponuenih(Bar, Pie, Histogram), i program e podatke iskazatiu obliku stubia ili pite.

    Mogue je uraditi i samo sliku, odnosno grafikon - utom sluaju se u kutiju koja se pojavljuje po izborukomande Frequencies, u donjem levom uglu,klikom mia iskljui komanda Displav frequencytables".

  • 159

    GRAFIKO ISKAZIVANJE

    Sve to se numeriki iskae, moe se i grafiki iskazati; Meutim, za tim nema uvek potrebe; Sloene tabele se ne moraju grafiki iskazivati; Dok je trendove poeljno i grafiki prikazati, kao i serije

    podataka; Uobiajeni nain iskazivanja kvalitativnih podataka su:

    grafikoni pravougaonih slika, grafikoni krugova histogram frekvencija poligom frekvencija Gausova kriva Tehnika horizontalnih stubaca tehnika kartografskog prikazivanja tehnika piramide itd.

  • 160

    Primer grafikona pravougaonih slika

    01 02 03 04 05 06 07 08 09 0

    1 s t Q tr 2 n d Q tr 3 rd Q tr 4 th Q tr

    E a s tW e s tN o rth

  • 161

    Promer grafikona krugova

  • B. Analiza zasnovana na proceniaritmetike sredine, odnosno proseka

    Druga vrsta kvantitativnih analiza jeraunanje proseka, odnosno aritmetikesredine.

    Za takve analize se odluujemo kadaistraujemo pojave koje moemo meriti naosnovu racio, a esto i na osnovu intervalnihpodataka: njihov osnovni pokazatelj jeste prosek, a tu

    spada i ocena stepena rasprenosti, odnosno varijansa i standardna devijacija.

  • Pogledajmo i to na istom primeru istraivanjakupovne moi seoskih domainstava.

    Jedan od pokazatelja za merenje kupovne moisvakako je visina prihoda domainstva.

    Recimo da smo uzorku od 1072 domainstvapostavili pitanje koliki je njihov ukupan meseniprihod i da u bazi podataka imamo promenljivu podnazivom Prihod (Ukupan meseni prihoddomainstva u 000 dinara).

    Komanda kojom dobijamo pomenutu vrstupodataka glasi:Analyze\ Descriptive Statistics\ Desciptives, a

    potom se u prozor Variable(s) ubacuje promenljivaPrihod. Pritiskom na OK dobijamo tabelu 2:

  • Tabela 2: Descriptive Statistice

    N Minimum Maximum Mean Std.Deviation

    Prihod Ukupan meseni prihoddomainstva u 000 dinara ValidN (listvvise)

    10721072

    1 186 34,14 19,921

  • Njen ukupan broj ispitanika u uzorku,Minimum je najmanji zabeleeni meseniprihod seoskog domainstva (u naemuzorku to je 1000 dinara), Maksimum jenajvei zabeleeni prihod (u naem uzorku186.000 dinara).

    Mean oznaava aritmetiku sredinu, tj.prosean meseni prihod seoskogdomainstva u Srbiji, a

    Std. Deviation (standardna devijacija)pokazuje stepen rasprenosti tog svojstva,odnosno koliko je proseno odstupanje odaritmetike sredine.

  • 4 - , 3 - , 2 - 1 -

    %

    1 2 3 4 1 2 3 4 15.6 5.0 17.9 61.5 17.3 7.7 25.8 49.2 3.25 3.07 1.11 1.12 16.0 13.6 26.9 43.4 21.4 13.6 27.4 37.6 2.98 2.81 1.10 1.15 17.3 9.5 25.2 48.1 21.1 13.7 25.5 39.7 3.04 2.84 1.12 1.16 17.1 5.4 13.5 64.1 20.3 7.9 19.1 52.6 3.25 3.04 1.15 1.19 17.5 4.7 11.4 66.4 6.8 20.2 16.7 56.3 3.27 3.23 1.16 .99 16.2 7.4 23.5 52.9 10.0 20.5 26.5 43.0 3.13 3.02 1.11 1.02 18.4 6.3 20.1 55.2 12.3 23.1 27.4 37.2 3.12 2.90 1.16 1.04 17.2 4.7 13.8 64.3 21.4 7.1 17.4 54.1 3.25 3.04 1.15 1.21 15.4 6.0 27.7 50.9 7.2 16.1 17.9 58.8 3.14 3.28 1.08 .98

  • Ove analize su esto osnov za daljaistraivanja, naroito za ispitivanjeodnosa meu pojavama, pa i za onenajzahtevnije koji se bave uzrono-posledinim odnosima.

  • C. Analize o povezanosti meu pojavama

    Ove analize ispituju prostu, ne uzrono-posledinu povezanostmeu promenljivima;

    Razlikujemo dve vrste povezanosti:

    1) povezanost u kojoj je bar jedna promenljiva kategorijska i

    2) korelacionu povezanost, koja se ispituje na racio i esto naintervalnim podacima, odnosno promenljivima.

    U prvom sluaju sainjavamo tabele sa ukrtenim podacima, au drugom jednostavno raunamo stepen povezanosti,koristei se nekim od statistikih pokazatelja.

  • D. Multivarijaciona statistika analiza

    Pored poetnih matematiko-statistikih analiza podataka kojese vre uz korienje:

    statistike analize deskriptivnih nominalnih varijabli, analiza kontigencijskih tabela, zatim primene mere asocijacije za utvrivanje povezanosti izmeu

    varijabli, meu kojima se naee koriste Cramer-ov koeficijentasocijacije i Pearson-ov koeficijent kontigencije,

    kao i 2 test za testiranje hipoteza o distribuciji verovatnoakategorikih varijabli,

    u primeni statistike metode koriste se i multivarijacioneanalize kao to su: (1) faktorska analiza; (2) kanonikakorelaciona analiza; (3) kanonika diskriminaciona analiza; (4)analiza glavnih komponenti i (5) taksonomska analiza

  • a) Faktorska analiza

    To je statistiki postupak koji se koristi zautvrivanje latentne strukture faktoraistraivane pojave.

    Kao odgovarajua tehnika za ekstrakcijufaktora, u obradi podataka, najee seprimenjuje MAHPLAN tehnika po Gutman-Kajser kriterijumu po kome se zadravajukao znaajni samo oni faktori koji imajusvojstvene korene vee od 1.

  • b) Kanonika korelaciona analiza

    To je statistika metoda, odnosnotehnika koja se primenjuje uistraivanju za ispitivanje povezanostidva skupa kanonikih varijabli nastalihlinearnom kombinacijom izvornihvarijabli iz jednog i drugog skupa.

  • c) Kanonika diskriminaciona analiza

    To je statistika metoda koja se koristi zautvrivanje razlika nekih obeleja izmeu dvejusubpopulacija anketiranih u dva razliita vremenskaperioda i

    za utvrivanje razlika u nekom obeleju izmeujedne grupe subpopulacije koja se ponaa na jedannain i druge grupe subpopulacije koja se ponaana drugi nain u istim uslovima.

    Razlike se sagledavaju u pogledu kvantitativnihvarijabli merenog obeleja uzetih zajedno, odnosnolinearno kombinovanih u diskriminativnu funkciju.

  • Za testiranje postojanja razlika izmeu aritmetikihsredina razliitih subpopulacija na kvantitativnimvarijablama merenog obeleja ispitanika primenjujese multivarijantna jednofaktorska analizavarijanse.

    Testiranje razlika izmeu preseka aritmetikihsredina unutar multivarijantne jednofaktorskeanalize varijanse vri se F-testom, a intenzitetrazlika izmeu grupa na varijablama merenogobeleja najee se meri Wilks-ovimkoeficijentom .

    Za testiranje homogenosti matrica kovarijansivarijabli merenog obeleja za razliite subpopulacijeispitanika najee se primenjuje Box-ov testanalize homogenosti.

  • d) Analiza glavnih komponenti

    To je statistika metoda pomou koje se vritransformacija velikog broja izvornih, manifestnih imeusobno povezanih varijabli u manji brojortogonalnih, nekorelisanih glavnih komponenti.

    Za odreivanje broja znaajnih glavnih komponentiprimenjuje se Gutman-Kajser-ov kriterijum, pokojem su u analizi zadravaju sve glavnekomponente ija je pouzdanost vea od nule amanja od 1 (0

  • ) Taksonomska (klasterska) analiza ilianaliza grupisanja

    To je egzaktan statistiki metod pomou kojeg se, premaobelejima pojave koju merimo kod isptanika vrirazvrstavanje, tj. klasifikacija ispitanih u to srodnije grupe,taksone ili klastere, i to tako da:

    (1) grupe budu to vie meusobno udaljene uviedimenzionalnom prostoru i(2) ispitanici unutar istih grupa budu meusobno to sliniji.

    Pri tome se kao najadekvanija mera distance ili slinostiizmeu ispitanika koristi tzv. Kvadratno Euklidovorastojanje, a od raspoloivih metoda grupisanja primenjujese Ward-ova metoda (Ward's methods).

  • Ovo su najsloenije statistike metode, boljerei tehnike koje se praktino primenjuju uu sloenijim empirijskim istraivanjima.

    Sve ove metode lino sam kao istraivakoristio u empirijskim istraivanjima;

    Primena ovih metoda i tehnika dala jevisoke i pouzdane naune rezultate.

  • 177

    ZAKLJUAK

    Statistika i statistika metoda nisu svemoni;

    promiljanje i domiljanje, dokazivanje i opovrgavanje uzvaljanu procenu argumenata i njihovo kritiko i stvaralakokorienje ostaju bitan inilac naunog saznanja;

    nikako ne treba poistoveivati statistiko objanjenje sanaunim objanjenjem;

    Statistiko objanjenje se svodi na utvrivanje odnosaslaganja odreenih podataka, a nauno objanjenjepodrazumeva veoma sloenu proceduru odnosa mnogihfaktora, naunih i dovoljnih uslova za nastanak i razvojneke pojave;

  • 178

    statistiko objanjenje je samo neophodandeo naunog tj. istraivakog objanjenja;

    O objanjenju drutvenih pojava, statistikoobjanjenje je vaan segment naunog iistraivakog objanjenja;

    Istraivako objanjenje limitirano je napredmet projekta istraivanja i zahtevano jenaunim ciljem istraivanja;

  • 179

    Literatura:

    1. Devad Termiz, Statistike tehnike i postupci upolitikolokim istraivanjima, NIK Grafit, Lukavac, 2006.

    2. Srbobran Brankovi Metodi iskustvenog istraivanjadrutvenih pojava, Beograd, 1998.

    3. Slavomir Milosavljevi, Ivan Radosavljevi, Osnovimetodologije politikih nauka, Slubeni glasnik, Beograd,2000. i 2006.

    4. Stanislav Fajgelj: "Metode istraivanja ponaanja", objavioCentar za primenjenu psihologiju, usina 7, Beograd(delovi programa koji nisu obraeni u prethodnoj literaturi)

    5. Mladen Kneevi, Statistika za studente socijalnog rada,Pravni fakultet, Zagreb, 2005.

  • 180

    PITANJA?

    HVALA NA PANJI?