27
Prikupljanje, sređivanje i prikazivanje podataka 2.1. Prikupljanje podataka Osnovne faze statističkog istraživanja su: a) statističko posmatranje b) grupisanje (tabelarno i grafičko prikazivanje statističkih podataka) c) statistička analiza i interpretacija rezultata sprovedene analize. Statističko posmatranje je organizovano prikupljanje statističkih podataka. Nakon precizne definicije zadatka, cilja i predmeta istraživanja pristupa se organizovanom prikupljanju statističkih podataka. Uspešnost i objektivnost ovog prvog koraka uslovljava kvalitet rezultata ostalih faza statističkog istraživanja. Nepotpune i neistinite prikupljene informacije do kojih bi se došlo u ovoj fazi značile bi da konačan rezultat statističkog istraživanja sadrži grešku. Pri tome greška može biti sistematska i slučajna. Sistematsku grešku je lakše uočiti (npr. neispravnost određenog mernog instrumenta, neistinito izjašnjavanje ispitanika). Slučajnu grešku je teško precizno identifikovati jer se ona ne javlja kod svakog merenja i ne javlja se sa istim intenzitetom, ali se baš zbog toga za slučajnu grešku često veže pretpostavka o poništavanju njenog uticaja na globalnom nivou posmatranja, odnosno da neće imati velikog uticaja na konačne zaključke istraživanja jer se retko javlja. U zavisnosti od karaktera izvora podataka, statistički podaci se dele na: a) sekundarne podatke b) primarne podatke. Sekundarni podaci su oni koji se pribavljaju iz već postojećih baza podataka. Takve podatke prikupljaju različite državne ustanove, na primer Republički zavod za statistiku, Narodna banka, Republički hidrometeorološki zavod, specijalizovane agencije. U svjetskim okvirima poznat je Svetski statistički godišnjak (World Statistical Yearbook), a putem Interneta su danas dostupne mnoge baze sekundarnih podataka (na primer Eurostat). Na nivou ustanova, raznovrsne specifične evidencije i registri imaju sekundarni karakter. Sekundarni podaci su uglavnom brojčani. Predstavljeni su tabelama, a vrlo često i grafičkim prikazima.

Prikupljanje Sredjivanje i Prikazivanje Podataka

Embed Size (px)

DESCRIPTION

A

Citation preview

Prikupljanje, sređivanje i prikazivanje podataka

2.1. Prikupljanje podataka

Osnovne faze statističkog istraživanja su: a) statističko posmatranjeb) grupisanje (tabelarno i grafičko prikazivanje statističkih podataka) c) statistička analiza i interpretacija rezultata sprovedene analize.

Statističko posmatranje je organizovano prikupljanje statističkih podataka.Nakon precizne definicije zadatka, cilja i predmeta istraživanja pristupa se organizovanom

prikupljanju statističkih podataka. Uspešnost i objektivnost ovog prvog koraka uslovljava kvalitet rezultata ostalih faza statističkog istraživanja. Nepotpune i neistinite prikupljene informacije do kojih bi se došlo u ovoj fazi značile bi da konačan rezultat statističkog istraživanja sadrži grešku. Pri tome greška može biti sistematska i slučajna. Sistematsku grešku je lakše uočiti (npr. neispravnost određenog mernog instrumenta, neistinito izjašnjavanje ispitanika). Slučajnu grešku je teško precizno identifikovati jer se ona ne javlja kod svakog merenja i ne javlja se sa istim intenzitetom, ali se baš zbog toga za slučajnu grešku često veže pretpostavka o poništavanju njenog uticaja na globalnom nivou posmatranja, odnosno da neće imati velikog uticaja na konačne zaključke istraživanja jer se retko javlja.

U zavisnosti od karaktera izvora podataka, statistički podaci se dele na:a) sekundarne podatke b) primarne podatke. Sekundarni podaci su oni koji se pribavljaju iz već postojećih baza podataka. Takve podatke

prikupljaju različite državne ustanove, na primer Republički zavod za statistiku, Narodna banka, Republički hidrometeorološki zavod, specijalizovane agencije. U svjetskim okvirima poznat je Svetski statistički godišnjak (World Statistical Yearbook), a putem Interneta su danas dostupne mnoge baze sekundarnih podataka (na primer Eurostat). Na nivou ustanova, raznovrsne specifične evidencije i registri imaju sekundarni karakter.

Sekundarni podaci su uglavnom brojčani. Predstavljeni su tabelama, a vrlo često i grafičkim prikazima.

Primarni podaci prikupljaju se neposrednim posmatranjem. Prikupljanje ovih podataka zahteva definisanje statističkog skupa, izbor obeležja koja se žele istražiti, određivanje modaliteta posmatranog obiležja, pripremanje anketnih upitnika i/ili pratećih formulara, kao i organizovanje i sprovođenje samog prikupljanja podataka.

Vrlo često istraživanja koja se odnose na svakog člana statističkog skupa zahtevaju velike troškove i zbog toga se podaci prikupljaju za podskup osnovnog skupa, odnosno za uzorak.

Prema vremenu posmatranje se može podeliti na jednokratno, periodično i tekuće. Jednokratno posmatranje se sprovodi jednom i nema ponavljanja. Periodično posmatranje se ponavlja u jednakim vremenskim intervalima (na primer popisi stanovništva koji se sprovode na 10 godina). Kod tekućeg posmatranja prikupljanje podataka je kontinuirano (na primer razni registri).

Prikupljanje primarnih podataka može se vršiti i pomoću statističkih eksperimenata. Statističkim eksperimentom se vrši merenje vrednosti obeležja nastalih u kontrolisanim uslovima.

Pojedinačne metode statističkog posmatranja su:a) merenje b) brojanje c) ocenjivanjed) evidentiranje (registracija)e) anketiranje.Jedan od načina statističkog posmatranja i prikupljanja podataka je merenje. Meri se na primer

telesna masa i visina stanovništva nekog područja. Brojanjem se može doći do podataka o broju upisanih učenika u srednje škole i td. Ocenjivanjem kao metodom prikupljanja statističkih podataka određuje se

kvalitet sprovođenja određenih radnji. Ocenjuju se studenti na ispitima, ocenjuje se kvalitet nastave iz nekog predmeta i slično.

Evidentiranje podataka podrazumeva kontinuirano praćenje kretanja neke pojave u dužem ili kraćem vremenskom periodu. Za potrebe evidencije često se uređuju odgovarajući obrasci. Na primer pri posmatranju izostanaka i broja ostvarenih radnih sati zaposlenih u nekom preduzeću postoji obrazac za evidenciju gdje zaposleni upisuju: ime i prezime, vreme dolaska i odlaska s radnog mjesta, vreme izostanka, razlog izostanka. Evidentiranje se može vršiti i tehničkim uređajima. To su umreženi računari, optički čitači, uređaji za brojanje npr. putnika i slično.

Anketa ili intervju je metoda kojom se prikupljaju podaci uz pomoć unapred pripremljenih upitnika, na kojima ispitanici svojim odgovorima daju informacije o posmatranim obeležjima. Da bi anketa uspela potrebno je veliku pažnju obratiti sastavljanju upitnika. Pitanja moraju biti kratka, precizna i jasna. Moraju biti postavljena tako da ne sugerišu odgovor. Broj pitanja ne sme biti veliki da ne zamara one koji odgovaraju. Pri spovođenju ankete pristup ispitaniku, odnosno jedinici statističkog skupa može biti direktan i indirektan.

Direktan pristup ostvaruje se kada osoba ili tim koji provodi anketu izlaze na teren i u direktnom kontaktu s ispitanicima prikupljaju odgovore na pitanja iz upitnika. Indirektan pristup ostvaruje se putem pošte, telefonom i elektronskom poštom. Na ovaj način smanjuju se troškovi prikupljanja podataka (npr. putni troškovi osoba koje provode anketu tj. anketara). Iako se i na ovaj način ispitanicima prezentuje ko sprovodi i koja je svrha istraživanja, praksa je pokazala da je pri indirektnom pristupu anketiranja prisutan veliki postotak neodaziva, kao i često veliki procenat neispravno i nepotpuno popunjenih upitnika. Razloge treba tražiti u činjenici da ispitaniku nije na raspolaganju osoba koja će mu pojasniti nejasna pitanja.

U zavisnosti od obima istraživanja organizaciju prikupljanja podataka može sprovoditi jedna osoba, grupa istraživača ili svo osoblje neke specijalizovane ustanove kojoj je to osnovna delatnost. Ako se radi o manjem istraživanju u prikupljanju podataka će sudelovati manji broj istraživača, dok će veće istraživanje zahtevati rad većeg broja istraživača.

Pre početka obrade prikupljenih podataka potrebno je izvršiti kontrolu sirove statističke građe. Kontrola se može vršiti tokom ili na kraju postupka prikupljanja podataka, što zavisi i o različitim metodama prikupljanja.

Preventivna kontrola obavlja se već tokom samog postupka prikupljanja statističkih podataka. Pri sprovođenju ankete to podrazumeva kontrolu upitnika pri njegovom preuzimanju od ispitanika. Kontroliše se da li su dati odgovori na sva pitanja i da li su pravilno popunjena predviđena mesta za tražene odgovore.

Naknadna kontrola prikupljenih podataka obavlja se nakon postupka prikupljanja. Formalnom kontrolom se upoređuje realizovani broj prikupljenih podataka s onim planiranim obuhvatom statističkog skupa. Ako je anketa vršena indirektnim putem, na primer poštom, upoređuje se broj poslatih upitnika s brojem vraćenih upitnika. Materijalnom kontrolom ispituje se potpunost i tačnost sadržaja prikupljenih podataka. Na primeru ankete to podrazumijeva kontrolu potpunosti i logičnosti datih odgovora.

2.2. Raspored učestalosti – distribucija frekvencija

Kod prikupljanja vrednosti nekog obeležja za statističku analizu one se najčešće evidentiraju onim redom kojim su i izmerene. Na taj način nastaje empirijska serija originalnih sirovih podataka, odnosno nesređeni statistički niz vrednosti. Skup negrupisanih podataka sadrži informacije o svakoj jedinici uzorka ili osnovnog skupa.

Na primer, 20 studenata druge godine studija je ocenjivalo kvalitet nastave na predmetu statistika, koji su polagali na prvoj godini i evidentirane su sledeće ocene:

3 4 4 5 2 3 3 2 4 4 3 5 3 4 3 4 5 5 2 4

Ovakva serija ne kazuje gotovo ništa o kvalitetu nastave i s toga vršimo sortiranje vrednosti od najniže do najviše, odnosno vršimo hijerarhijsko sređivanje. Na taj način nastaje uređena serija podataka ili sređeni statistički niz:

2 2 2 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5

20202

Sada imamo bolji uvid u kvalitet nastave iz statistike, ali bi bilo još preglednije niz podataka prikazati u vidu rasporeda učestalosti (distribucije frekvencije) pojedinih ocena, kao u sledećoj tabeli:

Ocena(distribucija –

x)

Učestalost(frekvencija – f)

1 02 33 64 75 4

Ukupno 20

Ovakav prikaz rasporeda vrednosti naziva se osnovna distribucija frekvencije i daje nam uvid u učestalost svake pojedinačne vrednosti koja je evidentirana. U našem primeru studenti su kvalitet nastave vrednovali ocenama od 1 do 5, koje su diskontinuirane numeričke vrednosti i ima ih samo 5, pa se osnovnom distribucijom frekvencije može dati prikaz učestalosti svake od njih.

Međutim, u praksi se često srećemo sa situacijama kada evidentiranih vrednosti ima mnogo, a gotovo sve su međusobno različite.

Na primer, pri sistematskom pregledu 30 učenika jednog odeljenja srednje škole evidentirani su sledeći podaci o telesnoj masi učenika (u kg):

60,0 72,5 70,0 59,5 71,0 60,0 73,0 81,0 67,0 74,0 64,0 79,0 62,0 53,5 71,076,0 70,0 57,5 62,0 65,5 85,0 62,0 70,5 52,0 68,5 78,0 56,0 66,0 75,0 66,0

Kada ove vrednosti hijerarhijski sredimo (poređamo po rastućem redu), a zatim prikažemo u vidu osnovne distribucije frekvencije, dobijamo sledeću tabelu:

Telesna masa (x)

Učestalost (f)Telesna masa

(x)Učestalost (f)

52,0 1 70,0 253,5 1 70,5 156,0 1 71,0 257,5 1 72,5 159,5 1 73,0 160,0 2 74,0 162,0 3 75,0 164,0 1 76,0 165,5 1 78,0 166,0 2 79,0 167,0 1 81,0 168,5 1 85,0 1

Ukupno 30

Ovako prikazane vrednosti još uvek ne daju zadovoljavajući pregled učestalosti telesnih masa učenika jer je u tabeli sadržano 24 različitih vrednosti telesne mase od kojih se čak 19 od njih javlja samo po jednom. Zato se pristupa sažimanju podataka u grupne intervale (klase, razrede), odnosno formira se distribucija frekvencija sa grupnim intervalima. Kod nje se individualne vrednosti obeležja zamenjuju grupnim intervalima vrednosti, a frekvencije pojedinačnih vrednosti se zamenjuju kumulativnim (zbirnim) frekvencijama grupnih intervala.

Pri grupisanju podatak u vidu distribucije frekvencije sa grupnim intervalima, treba posebno voditi računa o broju, veličini (širini) i granicama intervala.

Broj grupnih intervala može da se odredi prema često korišćenoj formuli koju je predložio Herbert Stardžes (Herbert Sturges):

20203

gde je K broj grupnih intervala, a log10N predstavlja logaritam ukupnog broja jedinica posmatranja (N) za osnovu 10. Podsetimo, logaritam nekog broja (u ovom slučaju N) predstavlja vrednost kojom treba stepenovati osnovu (u ovom slučaju 10) da bi se dobio taj broj.

U našem primeru je za 30 učenika potrebno prikazati:grupnih intervala

Kada je izračunat broj intervala, širina intervala se dobija prema obrascu:

gde je xmax najveća izmerena vrednost niza, a xmin najmanja vrednost u nizu.

Kako je naša najveća izmerena vrednost iznosila 85kg, a najmanja 52kg, primenom navedene formule potrebna širina intervala iznosi:

kg

U sledećem koraku je potrebno odrediti granice prvog (najnižeg) intervala. U tu svrhu je moguće primeniti nekoliko metoda, a ovde će biti navedene najjednostavnije dve: a) Najniža izmerena vrednost se definiše kao donja granica prvog intervala. Ukoliko je najniža izmerena vrednost decimalni broj, može da se izvrši zaokruživanje, ali uvek na niži ceo broj. Na primer: 51,8 bi zaokružili na 51, a ne na 52. b) Najniža izmerena vrednost se definiše kao srednja vrednost prvog intervala. Od nje se zatim oduzme polovina izračunate širine intervala i na taj način se određuje donja granica prvog intervala. I ovde se može izvršiti zaokruživanje na niži ceo broj.

Primenom navedene dve metode na naš primer sa telesnim težinama 30 učenika, dobili bi dve moguće donje granice prvog intervala:

a) 52 kgb) 52 - 6/2 = 52 - 3 = 49 kgPrimena bilo koje od ovih vrednosti za donju granicu prvog intervala bi bila ispravna, a neka smo

se mi odlučili da to bude 52 kg.Sada imamo sve parametre potrebne da bi evidentirane vrednosti prikazali primenom distribucije

frekvencija sa grupnim intervalima:

Telesna masa (kg)x

Učestalostf

52,00 - 57,99 458,00 - 63,99 664,00 - 69,99 670,00 - 75,99 976,00 - 81,99 482,00 - 87,99 1

Ukupno 30

Kada grupne intervale prikazujemo celim brojevima moramo voditi računa da se granice pojedinih intervala međusobno ne preklapaju, jer bi to omogućilo da se jedna ista vrednost nađe u dva intervala.

Nepravilno Pravilno Stvarne granice intervala52-58 52-57 52,00-57,9958-64 58-63 58,00-63,9964-70 64-69 64,00-69,99

Kada želimo da učestalost nekog obeležja prikažemo po grupama koje su nam od posebnog interesa tada se broj, širina i granice intervala ne određuju matematičkom metodom koju smo prikazali, već svaka grupa od posebnog interesa predstavlja zaseban interval. U tim slučajevima širina intervala ne mora da bude podjednaka.

20204

Na primer, kada se neka pojava analizira po dobnim grupama veoma često se primenjuju sledeći intervali, odnosno dobne grupe koje su pojedinačno homogene, a međusobno veoma različite:

0 godina (novorođenčad i odojčad)1 – 6 godina (mala i predškolska deca)7 – 14 godina (mlađa školska deca – osnovci)15 – 18 godina (starija školska deca – srednjoškolci)19 – 64 godine (studenti i radno aktivno stanovništvo)65 i više godina (stare osobe)

Do sada su bili prikazivani slučajevi u kojima je distribucija izražena različitim vrednostima numeričkih obeležja i to, kako diskontinuiranim (ocene kvaliteta nastave), tako i kontinuiranim (telesna masa). Međutim, često je distribucija izražena različitim modalitetima atributivnih (opisnih) obeležja, kao što su: pol, zanimanje, bračno stanje i td. U sledećoj tabeli je dat primer rezultata popisa stanovnika jedne opštine, a prema mestu stanovanja:

Mesto stanovanjax

Učestalostf

Grad 80000Selo 19000

Ukupno 89000

2.3. Raspodela relativnih frekvencija i procentualna raspodela

Relativna frekvencija jednog modaliteta atributivnog obeležja ili jedne vrednosti numeričkog obeležja dobija se kada se njena frekvencija u osnovnom skupu ili uzorku podeli sa zbirom svih frekvencija. Prema tome, relativna frekvencija pokazuje koji deo zbira frekvencija (ukupnog broja jedinica posmatranja) pripada odgovarajućem modalitetu ili vrednosti. Raspodela relativnih frekvencija pokazuje relativnu učestalost svih modaliteta ili vrednosti.

Relativna frekvencija jednog modaliteta atributivnog obeležja se izračunava po formuli:

Relativna frekvencija jedne vrednosti numeričkog obeležja se izračunava po sličnoj formuli:

Procentualna zastupljenost (učešće) jednog modaliteta atributivnog obeležja ili jedne vrednosti numeričkog obeležja dobija se kada se njena relativna frekvencija pomnoži sa 100. Procentualna raspodela je raspodela učešća svih kategorija ili vrednosti.

Primer: Određivan je nivo stresa kod 30 zaposlenih u jednoj firmi i dobijeni su sledeći podaci:

Da li je posao stresan

Frekvencija (f)

Veoma 10Malo 14Nimalo 6

30

Na osnovu podataka u tabeli potrebno je formirati raspodelu relativnih frekvencija i procentualnu raspodelu.

20205

Rešenje:Da li je posao

stresanFrekvencija (f) Relativna frekvencija Procenat

Veoma 10 10/30=0,3330,333100=33,3

%

Malo 14 14/30=0,4670,467100=46,7

%

Nimalo 6 6/30=0,2000,200100=20,0

%30 1,000 100,0%

Rezultati pokazuju da je 0,333 ili 33,3% zaposlenih izjavilo da im je posao veoma stresan, njih 0,467 ili 46,7% da im je posao malo stresan, a 0,200 ili 20,0% da nemaju stres na poslu.

Primetimo da je zbir relativnih frekvencija svih kategorija uvek 1,000, a zbir procenata je uvek 100,0%.

2.4. Kumulativna frekvencija

Kumulativna frekvencija predstavlja učestalost svih vrednosti koje su manje ili jednake nekoj referentnoj vrednosti. Kod distribucije frekvencija sa grupnim intervalima kumulativna frekvencija predstavlja učestalost svih vrednosti koje su manje ili jednake gornjoj granici referentnog intervala.

I za kumulativnu frekvenciju se mogu odrediti relativna frekvencija i procentualno učešće.Ne postoje posebne formule za izračunavanje kumulativne frekvencije, ona se dobija

jednostavnim zbrajanjem učestalosti svih vrednosti koje su manje ili jednake referentnoj vrednosti.Kumulativna frekvencija najviše vrednosti niza je uvek jednaka zbiru svih frekvencija niza, njena

relativna frekvencija iznosi 1, a procentualna zastupljenost je 100%.

Primer za distribuciju frekvencija bez grupnih intervala: U našem primeru sa 20 studenata koji su ocenjivali kvalitet nastave na predmetu statistika, može

nas interesovati koliko je studenata dalo oceno 4 ili manju od nje i koja je zastupljenost ovakvih ocena.Formiramo sledeću tabelu:

Ocena(x)

Frekvencija(f)

Kumulativnafrekvencija

Kumulativnarelativna

frekvencija

Kumulativniprocenat

1 0 0 0/20=0,000 0,000100=0,0%2 3 0+3=3 3/20=0,150 0,150100=15,0%3 6 0+3+6=9 9/20=0,450 0,450100=45,0%4 7 0+3+6+7=16 16/20=0,800 0,800100=80,0%

5 40+3+6+7+4=20 20/20=1,000 1,000100=100,0

%

Na osnovu tabele možemo da utvrdimo da je broj studenata koji su kvalitet nastave iz statistike ocenili sa 4 ili manjom ocenom iznosio 16, njihova relativna frekvencija je bila 0,800, a takvi studenti su činili 80,0% svih ispitanika.

Primer za distribuciju frekvencija sa grupnim intervalima:Sto studenata je anketirano o iznosu dnevnog džeparca (u dinarima) i rezultati su dati u obliku

distribucije frekvencije sa grupnim intervalima. Potrebno je prikazati kumulativne frekvencije i odrediti njihove relativne frekvencije i procentualno učešće.

Iznos

džeparca(x)

Brojstudenata

(f)

Kumulativnafrekvencija

Kumulativnarelativna

frekvencija

Kumulativniprocenat

20206

0 – 99 15 15 15/100=0,150 0,150100=15,0%100 – 199 53 15+53=68 68/100=0,680 0,680100=68,0%200 – 299 28 15+53+28=96 96/100=0,960 0,960100=96,0%

300 – 399 415+53+28+4=100 100/100=1,000 1,000100=100,0

%

Na osnovu tabele možemo da utvrdimo da je 15 (15,0%) studenata imalo dnevni džeparac do 99 dinara, 68 (68,0%) do 199 dinara, a 96 (96,0%) studenata do 299 dinara. Samo je 4 (4,0%) studenta imalo dnevni džeparac veći od ovog iznosa.

20207

3. GRAFIČKO I TABELARNO PRIKAZIVANJE PODATAKA

Često kažemo da „slika govori više od reči“. Na osnovu grafičkog prikaza jasno možemo videti glavne karakteristike nekog skupa podataka.

Grafičke prikaze podataka nazivamo dijagramima ili grafikonima, a možemo ih podeliti na tačkaste, linijske i površinske.

3.1. Tačkasti dijagrami

Ovu vrstu dijagrama koristimo za prikazivanje parova vrednosti dva obeležja (X, Y) na pravouglom koordinatnom sistemu kako bi prikazali odnos između ovih obeležja kod svih jedinica posmatranja. Na x-osu (apscisu) možemo naneti kako različite modalitete (kategorije) nekog atributivnog obeležja, tako i različite vrednosti nekog numeričkog obeležja. Na y-osu (ordinatu) nanosimo numeričke vrednosti drugog obeležja.

Kao primer za prikazivanje odnosa između različitih modaliteta jednog atributivnog obeležja i numeričkih vrednosti drugog obeležja dat je grafikon koji prikazuje godine starosti rukovodećeg kadra i ostalih zaposlenih u jednoj firmi:

0

10

20

30

40

50

60

70

Rukovodioci Ostali zaposleni

Star

ost (

godi

ne)

3.1.1. Dijagram rasturanja (scater plot)

Veoma često korišćeni dijagram koji prikazuje međuzavisnost između vrednosti dva numerička obeležja kod svih ispitanika u uzorku naziva se dijagram rasturanja. Ovakvu vrstu dijagrama možemo učiniti još preglednijim ucrtavanjem linije trenda koja najbolje odslikava odnos između dva obeležja. Za linije trenda se najčešće koriste prave linije jer se najlakše tumače, ali se mogu koristiti i krive (polinomne, trigonometrijske i druge) ukoliko bolje objašnjavaju odnos između ispitivanih pojava.

Primer: Sledeći grafikon prikazuje međuzavisnost između telesne visine i telesne mase kod 20 ispitanika. Ucrtana je i pravolinijska linija trenda.

0

20

40

60

80

100

155 160 165 170 175 180 185 190 195

Telesna visina (cm)

Tel

esna

mas

a (k

g)

20208

Primer: Sledeći grafikon prikazuje međuzavisnost između prosečne dnevne temperature vazduha i broja umrlih osoba. Linija trenda koja najbolje odslikava međuzavisnost između ove dve pojave je polinomna kriva drugog stepena.

0

2

4

6

8

10

12

14

-35 -25 -15 -5 5 15 25 35

Temperatura vazduha

Bro

j um

rlih

oso

ba

.

3.2. Linijski dijagrami

U linijske dijagrame spadaju: poligon i kriva frekvencija, vremenski linijski dijagram, kumulanta i polarni dijagram.

3.2.1. Poligon frekvencija

Poligon frekvencija je vrsta dijagrama koja se može koristiti za grafičko prikazivanje serije kvantitativnih podataka. On predstavlja dijagram koji se dobija spajanjem tačaka čije su koordinate sredine grupnih intervala i frekvencije intervala.

Da bi se konstruisao poligon frekvencija, u dijagram najpre ucrtavamo tačku iznad sredine svakog grupnog intervala u visini koja odgovara frekvenciji tog intervala. Ovo je isto što i obeležavanje sredine pravougaonika u visini koja odgovara frekvenciji posmatranog grupnog intervala. Na kraju, pravim linijama spajamo ucrtane susedne tačke.

Poligon u kojem su na y-osi umesto frekvencija prikazane relativne frekvencije, naziva se poligon relativnih frekvencija. Slično tome, poligon na čijoj su y-osi prikazana procentualna učešća naziva se poligonom učešća.

0

10

20

30

40

50

60

0 - 99 100 - 199 200 - 299 300 - 399

Visina džeparca (dinara)

Fre

kven

cija

Grafikon: Poligon frekvencija za visinu džeparca kod 100 studenata

Kada raspolažemo velikom serijom podataka, s povećanjem broja grupnih intervala (i smanjenjem njihove širine), poligon frekvencija na kraju postaje glatka, kontinuirana kriva. Ovakva kriva naziva se krivom raspodele frekvencija ili jednostavno krivom frekvencija.

20209

Grafikon: Kriva raspodele frekvencija

3.2.2. Vremenski linijski dijagram

Ova vrsta dijagrama pokazuje vrednost (nivo) posmatrane pojave i njene promene u toku vremena. Na x-osu se nanose mere za vreme, a na y-osu vrednost posmatrane pojave u tim vremenskim razmacima.

Sledeći dijagram prikazuje kretanje prosečnih zarada zaposlenih u jednoj firmi u periodu od 2000. do 2010. godine.

05000

10000150002000025000300003500040000

2000. 2001. 2002. 2003. 2004. 2005. 2006. 2007. 2008. 2009. 2010.

Godina

Pro

sečn

a pl

ata

(din

ara)

.

3.2.3. Kumulanta

Grafički prikaz kumulativnih frekvencija se naziva kumulanta (ogiva). To je kriva dobijena kada se pravim linijama spoje tačke koje odgovaraju sredinama grupnih intervala i kumulativnim frekvencijama odgovarajućih grupnih intervala.

Primer: U tabeli je prikazana starost 50 zaposlenih u jednoj firmi:

Starost FrekvencijaKumulativnafrekvencija

20-24 2 225-29 3 530-34 5 1035-39 5 1540-44 7 2245-49 8 3050-54 7 3755-59 8 4560-64 5 50

202010

Na osnovu podataka iz tabele možemo prikazati kumulantu:

0

10

20

30

40

50

60

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

Starost (godine)K

umul

ativ

na fr

ekve

ncij

a .

Grafikon: Raspodela kumulativnih frekvencija starosti zaposlenih

Pomoću kumulante se može aproksimativno utvrditi kumulativna frekvencija za bilo koju vrednost iz grupnih intervala. Na primer, na osnovu grafikona možemo da utvrdimo broj zaposlenih koji imaju 51 ili manje godina. To ćemo učiniti tako što najpre povučemo vertikalnu liniju od broja 51 na x-osi do kumulante, a zatim i horizontalnu liniju od dobijene tačke preseka te vertikalne linije i kumulante do y-ose. Dobijena tačka na y-osi predstavlja traženu kumulativnu frekvenciju. U našem primeru ona iznosi 35 zaposlenih.

Možemo da nacrtamo i kumulantu za raspodelu kumulativnih relativnih frekvencija i za kumulativnu procentualnu raspodelu, isto kao što smo to učinili i za raspodelu kumulativnih frekvencija.

3.3. Površinski dijagrami

Površinski dijagrami su dvodimenzionalne geometrijske slike, najčešće u obliku pravougaonika i kruga.

3.3.1. Štapićasti dijagrami

Grafikon koji se sastoji od stubića čija visina predstavlja frekvenciju različitih modaliteta atributivnih obeležja ili različitih vrednosti numeričkih obeležja naziva se štapićastim dijagramom.

Da bismo nacrtali štapićasti dijagram, na x-osu (apscisu) nanosimo različite modalitete (kategorije) atributivnog obeležja ili različite vrednosti numeričkog obeležja predstavljene intervalima iste širine. Frekvencije nanosimo na y-osu (ordinatu). Za svaku kategoriju ucrtavamo po jedan stubić čija visina odgovara frekvenciji posmatrane kategorije. Između susednih stubića ostavlja se malo rastojanje.

Primer: Sledeći štapićasti dijagram predstavja frekvencije različitih modaliteta odgovora na pitanje u vezi stresa na poslu:

202011

0

10

20

30

40

50

60

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

Starost (godine)

Kum

ulat

ivna

frek

venc

ija

.

0

2

4

6

8

10

12

14

16

Veoma Malo Nimalo

Da li je Vaš posao stresan

Fre

kven

cija

Grafikon: Raspodela frekvencija pojedinih modalitetaodgovora na pitanje u vezi stresa na poslu

Štapićasti dijagram raspodele relativnih frekvencija i procentualne raspodele mogu se nacrtati jednostavno tako što ćemo na y-osu umesto frekvencija kategorija naneti relativne frekvencije ili procentualna učešća. Štapićasti dijagram se ponekad konstruiše tako što se kategorije nanose na y-osu, a frekvencije na x-osu.

3.3.2. Strukturni krug (pita dijagram)

Krug podeljen na delove, od kojih svaki deo predstavlja relativnu frekvenciju ili učešće odgovarajuće kategorije u osnovnom skupu ili uzorku, naziva se strukturnim krugom.

Strukturni krug (pita) najčešće se koristi za prikazivanje učešća (procenata), ali se može koristiti i za prikazivanje frekvencija ili relativnih frekvencija. Ceo strukturni krug predstavlja veličinu uzorka ili osnovnog skupa. Pita se deli na delove različite veličine, koji predstavljaju učešća različitih kategorija.

Kao što znamo, krug ima 360 stepeni. Da bismo nacrtali strukturni krug, 360 množimo relativnom frekvencijom svake kategorije, kako bismo dobili stepen ili veličinu ugla za odgovarajuću kategoriju. U sledećoj tabeli su dati rezultati izračunavanja veličine uglova za različite modalitete odgovora na pitanje u vezi stresa na poslu.

Da li je posao stresan

Učestalost Relativna učestalost Veličina ugla

Veoma 10 10/30=0,333 3600,333=119,88

Malo 14 14/30=0,467 3600,467=168,12

Nimalo 6 6/30=0,200 3600,200=72,0030 1,000 360,00

Sledeći grafikon predstavlja strukturni krug za procentualnu raspodelu podataka iz tabele, a na osnovu izračunate veličine uglova:

Nimalo20%

Veoma33%

Malo47%

Grafikon: Zastupljenost stresa na poslu

202012

3.3.3. Histogram

Histogram je dijagram koji se sastoji od niza spojenih pravougaonika, čije su osnovice jednake grupnim intervalima prikazanim na x-osi, a visine odgovaraju frekvencijama, relativnim frekvencijama ili učešćima prikazanim na y-osi.

Histogram se može koristiti za grafičko prikazivanje raspodele frekvencija, raspodele relativnih frekvencija, ili procentualne raspodele. Da bismo nacrtali histogram, najpre na x-osu nanosimo grupne intervale, a zatim za svaki grupni interval ucrtavamo pravougaonik čija visina na y-osi predstavlja frekvenciju ili relativnu frekvenciju ili učešće grupnog intervala. Pravougaonici na histogramu crtaju se jedan do drugog, bez razmaka. Dobijeni dijagram se naziva histogramom frekvencija, histogramom relativnih frekvencija ili histogramom učešća, u zavisnosti od toga da li smo na y-osu naneli frekvencije, relativne frekvencije ili učešća.

Sledeći grafikon predstavlja histogram frekvencija na osnovu podataka iz našeg primera za visinu džeparca.

0

10

20

30

40

50

60

0 - 99 100 - 199 200 - 299 300 - 399

Visina džeparca (dinara)

Fre

kven

cija

Grafikon: Histogram frekvencija za visinu džeparca kod 100 studenata

3.4. Statističke tabele

Tabeliranje je postupak svrstavanja prikupljenih statističkih podataka u tabele. Statističke tabele su kao jedan od oblika prikazivanja podataka prisutne u literaturi svuda oko nas. Tabela nastaje crtanjem vertikalnih i vodoravnih linija, čime se formiraju kolone (stubovi, stupci) i redovi. Svaka statistička tabela mora imati: naslov, broj tabele (ako ih ima više), tekstualni deo i numerički deo.

Prvi red tabele se naziva zaglavlje i sadrži nazive kolona. Prva kolona se naziva predkolona i sadrži nazive redova. Poslednji red obično sadrži zbir podataka u kolonama, dok poslednja kolona obično sadrži zbir podataka u redovima.

Ukoliko su prikazani sekundarni (tuđi) podaci, ispod tabele se ispisuje izvor podataka.Opšti oblik statističke tabele se može prikazati kao:

Tabela broj . Naslov tabele

PredkolonaZaglavlje Zbir podataka

u redovimaNaziv kolone Naziv koloneNaziv redaNaziv reda

Zbir podatakau kolonama

Naslov tabele mora biti jasan i kratak, a istovremeno u sebi mora sadržavati pojmovnu, prostornu i vremensku definiciju statističkog skupa, da bi onaj ko je čita mogao precizno odrediti njene elemente.

202013

Brojčani ili numerički deo tabele sastoji se od polja u koja se unose frekvencije, odnosno rezultati grupisanja statističkih podataka.

Statistička tabela mora poštovati 3 načela: preglednost, potpunost i jasnoću. U skladu s tim načelima pri sastavljanju tabele treba voditi računa o tome da ona sadrži što manje redova i kolona. U tabeli treba biti popunjeno svako polje, da onaj koji je čita ne bi bio u dilemi je li neki podatak možda zaboravljen. U statističkim publikacijama se za nedostajući podatak koriste tri tačke (...).

U zavisnosti od toga da li se prikazuju podaci za jedno ili više statističkih obeležja i prikazuje li se jedan ili više statističkih skupova razlikuju se:

1) jednostavne statističke tabele i2) složene statističke tabele, koje se opet mogu podeliti na:

- zbirne statističke tabele i- kombinovane statističke tabele.

Jednostavne statističke tabele prikazuju jedan statistički skup i jedno obeležje. Na primer:

Tabela broj 1. Stopa prirodnog priraštaja na 1000 stanovnikau Srbiji od 1961 do 1991. godine

Godina Stopa prirodnog priraštaja1961 8,81971 6,11981 3,61991 0,8

Izvor: Republički zavod za statistiku;Popis stanovništva u 2002. godini

Zbirne statističke tabele prikazuju vrednosti jednog obeležja u dva ili više statističkih skupova. Na primer:

Tabela broj 2. Stanovništvo prema popisima u opštinama Raškog okruga

GodinaVrnjačka

BanjaKraljevo

NoviPazar

Raška TutinOkrugukupno

1961 18820 91579 58777 29856 29959 2289911971 21940 106153 64326 29367 29444 2512301981 24768 121622 74000 29475 32779 2826441991 25875 125772 85249 28747 34631 3002742002 27592 126364 96260 27791 36160 314167

Izvor: Republički zavod za statistiku; Popis stanovništva u 2002. godini

Kombinovane statističke tabele prikazuju vrednosti dva ili više obeležja u jednom statističkom skupu. Na primer:

Tabela broj 3. Vitalni događaji u Srbiji bez pokrajina od 1961. do 1991. godine

Godina Stopanataliteta

Stopamortalitet

a

Stopa prirodnogpriraštaja

1961 17,2 8,4 8,81971 14,8 8,7 6,11981 13,2 9,6 3,61991 11,6 10,8 0,82002 10,6 13,39 -2,8

Izvor: Republički zavod za statistiku; Popis stanovništva u 2002. godini

202014

4. VRSTE ISTRAŽIVANJA

Tačni i odgovarajući podaci su najbitniji za dobijanje pouzdanih rezultata. Podaci se mogu dobiti iz internih i eksternih izvora ili na osnovu sopstvenih istraživanja. Podaci često potiču iz internih izvora, kao što su kadrovska dokumentacija firme ili računovodstvena evidencija. Na primer, ako želi da predvidi buduću prodaju svojih proizvoda, firma može da se posluži podacima iz prethodnih perioda koje ima u sopstvenoj evidenciji. Podatke možemo pribaviti i iz eksternih izvora. Kao spoljni izvori podataka mogu da se koriste brojne publikacije Republičkog zavoda za statistiku, Instituta za javno zdravlje Srbije, kao i svih ministarstava. Najvećem broju ovih publikacija može se pristupiti preko Interneta. Međutim, potrebni podaci ne moraju uvek da budu dostupni iz internih ili spoljnih izvora. U takvim slučajevima moraju se sprovesti istraživanja.

Sva istraživanja se prema nameni dele na:- fundamentalna i - primenjena. Fundamentalna istraživanja služe nauci, a njihova namena je ispitivanje i omogućavanje dubljeg

razumevanja ispitivanih pojava. Primenjena istraživanja služe rešavanju nekog praktičnog problema ili utvrđivanju nekog konkretnog stanja stvari.

Prema ulozi istraživača studije se dele na:- observacione i - eksperimentalne. U observacionim studijama istraživač samo pasivno posmatra i evidentira podatke. U

eksperimentalnim studijama istraživač uzima aktivno učešće i to uvodeći eksperimentalni faktor, za koji očekuje da će značajno izmeniti stanje koje je postojalo pre njegovog uvođenja.

Opservacione studije Eksperimentalne studijeA. Deskriptivne A. Kontrolisani ogledi:B. Analitičke: A1. Paralelne ili istovremene kontrole

B1. Anamnestičke A2. Sekvencijalne kontroleB2. Kohortne A3. Spoljne kontroleB3. Studije preseka B. Studije bez kontrole

U odnosu na to čije rezultate saopštavaju studije se dele na:- primarne i- sekundarne ili integrativne.Primarne studije saopštavaju rezultate sopstvenih pojedinačnih istraživanja. Sekundarne studije,

od kojih su najpouzdanije meta analize, sumiraju i donose zaključke na osnovu rezultata više originalnih tuđih istraživanja, kojima mogu biti pridodati i rezultati sopstvenih pojedinačnih istraživanja.

U daljem tekstu opisaćemo najčešće korišćene primarne studije.

4.1. Istraživanje sa jednim subjektom

U primenjenim istraživanjima često smo zainteresovani za karakteristike samo jednog ispitanika. Na primer, učestvujemo u timu za pripreme jedinog predstavnika naše zemlje u nekoj atletskoj disciplini na predstojećoj olimpijadi. Interesuju nas efekti relaksacione tehnike na srčanu frekvenciju tokom kompleksnih motoričkih vežbi. Naša hipoteza (predpostavka) glasi da će primena relaksacione tehnike dovesti do umanjenja srčane frekvencije. Potrebno je prvo evidentirati osnovnu (bazalnu) srčanu frekvenciju koju sportista normalno ima u toku vežbi. Merenje je ponekad potrebno ponoviti više puta, sve dok ne budemo uvereni da smo dobili stvarnu i reprezentativnu frekvenciju. U drugoj fazi vršimo merenja uz uvođenje intervencije (relaksacione tehnike). U trećoj fazi ponovo merimo bazalnu frekvenciju bez primene relaksacione tehnike, a u završnoj fazi još jednom uvodimo intervenciju. Rezultate možemo prikazati na sledeći način:

202015

80

90

100

110

120

130

140

150

160

I II III IV V VI VII

Vreme (minuti)

Fre

kven

cija

(ot

kuca

ji u

min

uti)

.

Bazalna frekvencija 1

Uz intervenciju 1

Bazalna frekvencija 2

Uz intervenciju 2

Na grafikonu uočavamo da je, nasuprot našoj predpostavci, srčana frekvencija bila brža kada je ispitanik motoričke vežbe izvodio uz primenu relaksacione tehnike.

Istraživanje sa jednim subjektom se mora sprovoditi primenom visoko pouzdanih tehnika merenja i uz njihovu sistematsku kontrolu. Kako je broj merenja veliki, važno je obezbediti standardizaciju svih protokola i procedura, odnosno vežbanje, uvođenje intervencije i merenje je potrebno sprovoditi na isti način svaki put.

U mnogim situacijama, ponovljena merenja jednog istog obeležja neće dati iste vrednosti, a te varijacije su veoma bitne. Ukoliko su one velike, efekte intervencije je vrlo teško dokazati. U takvim slučajevima možemo ili primeniti druge, osetljivije i preciznije načine merenja ili kreirati standarde kako bi odredili da li je bazalna vrednost stabilna (na primer: ne više od 2% varijacija od prosečne vrednosti srčane frekvencije u toku poslednjih 15 sekundi svakog minuta merenja).

Pravilo je da treba izvršiti isti broj merenja bazalnih vrednosti i vrednosti uz itervenciju, a vremena praćenja moraju biti ista. Preporučljivo je da istraživanje završimo fazom sa intervencijom.

Osnovni nedostatak istraživanja sa jednim subjektom je niska eksterna validnost. To znači da nismo sigurni da li bi se isti efekti postigli i kod drugih ljudi, odnosno nismo u mogućnosti da izvršimo generalizaciju na sve sportiste koji se bave istom ili sličnim disciplinama, odnosno na širu populaciju. Ukoliko pripremamo sportistu za olimpijadu, malo je verovatno da i mi sami želimo da delimo informacije sa širim auditorijumom izvan našeg tima. Takođe, teško da ćemo biti u mogućnosti da okupimo dovoljan broj sportista sa sličnim karakteristikama kako bi formirali eksperimentalnu i kontrolnu grupu. Jedini način da poboljšamo eksternu validnost je sprovođenje nekoliko istih studija sa sličnim subjektima, korišćenjem potpuno istih protokola i procedura.

4.2. Studije praćenja

Cilj ovih studija je praćenje promena vrednosti obeležja koje nastaju u nekom dužem vremenskom periodu. Najčešće se primenjuju kod mlađih osoba kada istraživači prate rast i razvoj, kao i promene snage, brzine i drugih obeležja koje nastaju pod uticajem različitih faktora.

Kako se merenja ponavljaju u dužem vremenskom periodu, snaga ovih studija je velika, a njihovi nalazi su pouzdani. Međutim, studije praćenja imaju i svoje nedostatke, a to su: visoka cena, osipanje ispitanika i izmena protokola usled smene ispitivača. Na primer, ukoliko sprovodima merenja na većem broju ispitanika svakih šest meseci u toku tri godine, verovatno moramo snositi troškove transporta, smeštaja i ishrane jednog dela učesnika. Osipanje ispitanika može nastati iz više razloga, a najčešće su to promena mesta življenja i odustajanje od učestvovanja u istraživanju. Konačno, ukoliko studija traje godinama onda se i sami istraživači mogu smeniti, a uvođenje novih istraživača može dovesti do promena u protokolima testiranja, delimično i zbog njihove neobučenosti.

Sledeći grafikon prikazuje rezultate tipične studije praćenja:

202016

0

10

20

30

40

50

60

70

80

90

I II III IV V VI VII

Godina testiranja

Vre

dnos

t obe

ležj

a .

4.3. Pravi eksperiment

Pravi eksperiment je vrsta studije sa najvećom snagom jer istraživač sa najvećim stepenom pouzdanosti može tvrditi da su promene vrednosti zavisnih obeležja, ako su evidentirane, uzrokovane promenama vrednosti nezavisnih obeležja. Ova vrsta istraživanja se često sprovodi. Na primer, želimo da ispitamo uticaj novog šestonedeljnog programa vežbi na povećanje fleksibilnosti kvadricepsa i zadnje butne lože kod igrača jednog tima. Program vežbi je u ovom slučaju nezavisno promenljiva (koristi se i termin eksperimentalni faktor), a zavisno promenljive su fleksibilnost kvadricepsa i zadnje butne lože. Učesnici su metodom slučajnog izbora podeljeni u eksperimentalnu i kontrolnu grupu. Svim učesnicima se izmeri fleksibilnost, a ovo merenje se naziva pre-testiranje. Zatim se ispitanici iz eksperimentalne grupe podvrgnu programu vežbi, a ispitanici iz kontrolne grupe nastavljaju sa uobičajenim aktivnostima. Posle 6 nedelja se svim učesnicima ponovo izmeri fleksibilnost (post-testiranje) i poredi se da li postoje razlike u vrednostima između grupa.

Sledeći grafikon prikazuje očekivane rezultate ove studije:

Prvo merenje Drugo merenje

Vre

dnos

t obe

ležj

a . Eksperimentalna grupa

Kontrolna grupa

Ozbiljna pretnja validnosti rezultata ovakvih studija dolazi od demoralisanosti učesnika iz kontrolne grupe, koja se može javiti usled saznanja da oni neće biti podvrgnuti novim metodama vežbanja. Predlog za razrešenje ovog problema je da i ispitanicima iz kontrolne grupe treba ponuditi isti tretman, ali koji će se sprovesti tek kada se eksperiment završi.

Pravi eksperiment može imati nekoliko pre-testiranja, zatim se uvodi eksperimentalni faktor, posle čega sledi serija post-testiranja. Ova podvrsta pravog eksperimenta se naziva analiza prekinute vremenske serije.

Da bi rezultati eksperimenta bili validni, eksperimentalna i kontrolna grupa moraju da budu što više podudarne pre početka ispitivanja. Ovo se obezbeđuje metodom slučajnog izbora. U našem primeru sa programom za povećanje fleksibilnosti najbolje bi bilo prvo izmeriti fleksibilnost svih učesnika. Zatim izvršimo rangiranje po vrednostima i formiramo parove, tako što će prvi par činiti ispitanici sa dve najveće vrednosti, drugi par učesnici sa trećom i četvrtom vrednosti po rangu i tako do najnižih vrednosti.

202017

Na kraju, metodom slučajnog izbora, na primer bacanjem novčića, iz svakog para izaberemo po jednog učesnika koji će ući u eksperimentalnu grupu.

4.4. Kvazi eksperiment

U slučajevima kada ne postoji mogućnost da se formiraju podudarne eksperimentalna i kontrolna grupa, može se sprovesti kvazi eksperiment. Na primer, želimo da ispitamo uticaj novog programa vežbi na povećanje fleksibilnosti, ali se ne usuđujemo da menjamo način treninga svog prvog tima u toku takmičarske sezone. Tada nam drugi, rezervni tim može poslužiti kao eksperimentalna grupa, a prvi tim kao kontrolna. Unapred smo spremni da prihvatimo činjenicu da igrači prvog i drugog tima nemaju iste vrednosti fleksibilnosti. Ispitivanje zatim sprovodimo kao i pravi eksperiment, odnosno vršimo pre-testiranje, uvodimo novi program vežbi u eksperimentalnu grupu, a zatim vršimo post-testiranje.

Kada bi na pre-testiranju ispitanici iz prvog tima imali bolju fleksibilnost, a program vežbi doprinosio povećanju vrednosti ovog obeležja, rezultati studije bi bili kao na sledećem grafikonu:

Prvo merenje Drugo merenje

Vre

dnos

t obe

ležj

a . Eksperimentalna grupa

Kontrolna grupa

Kada bi na pre-testiranju ispitanici iz drugog tima imali bolju fleksibilnost (više treniraju kako bi ušli u prvi tim), rezultati studije bi bili:

Prvo merenje Drugo merenje

Vre

dnos

t obe

ležj

a . Eksperimentalna grupa

Kontrolna grupa

I pored toga što nema istu snagu kao pravi eksperiment, ova vrsta studije može biti od koristi.

Međutim, kada je na pre-testiranju razlika u vrednostima velika, postavlja se pitanje da li je razlika koju evidentiramo pri post-testiranju rezultat delovanja eksperimentalnog faktora ili je posledica uticaja karakteristika samih ispitanika.

I pravi eksperiment i kvazi eksperiment mogu se sprovesti po protokolu sa ukrštanjem. Ovaj protokol podrazumeva da, nakon ispitivanja uticaja nezavisno promenljivih na zavisno promenljive, grupe međusobno zamene uloge, odnosno eksperimentalna grupa postaje kontrolna, a kontrolna grupa postaje eksperimentalna i sprovodi se još jedno ispitivanje. Na ovaj način rešava se problem demoralisanosti učesnika iz kontrolne grupe, a ukoliko eksperimentalni faktori ponovo iskažu iste efekte na zavisno promenljive tada je snaga zaključaka daleko veća.

202018

4.5. Opservacione studije

Zaključci opservacionih studija o veličini efekata nezavisno promenljivih na zavisno promenljive nemaju veliku snagu, ali njihovi rezultati mogu poslužiti kao smernica za dalja istraživanja. U ovim studijama istraživač ne preduzima i ne uvodi nikakve intervencije, odnosno ne postoji eksperimentalni faktor. On samo posmatra i meri prirodno stanje stvari i pokušava da uoči koji uzroci dovode do određene posledice ili da li različiti uzroci daju različite posledice. Na primer, želimo da uporedimo mišićnu snagu kod osoba koje samovoljno sprovode samo gimnastičke vežbe sa osobama koje samovoljno treniraju u teretani koristeći tegove i mašine za vežbanje. Pri tome moramo da uzmemo u razmatranje i uticaj što više drugih faktora o kojima možemo dobiti informacije (način ishrane, periodika treniranja, starost osoba i td). Osnovni nedostatak je što ne znamo početne vrednosti zavisno promenljivih.

4.6. Korelacione studije

Korelacione studije imaju najmanju snagu zaključivanja o uzrocima i posledicama. Kao i kod opservacionih studija, ne postoji eksperimentalni faktor kojim manipuliše istraživač. Cilj korelacionih studija je izračunavanje jačine međuzavisnosti između vrednosti dva obeležja.

U ispitivanje može biti uključeno više obeležja, a koeficijenti korelacije se izračunavaju za svaki par obeležja. Broj parova obeležja za koje se mogu izračunati koeficijenti korelacije iznosi

gde je n broj obeležja uključenih u studiju. Na primer, u studiji sa 5 ispitivanih obeležja može se izračunati:

koeficijenata korelacije.

Merenje i izračunavanje koeficijenata korelacije između vrednosti većeg broja obeležja može ukazati na postojanje značajne međuzavisnosti između nekih od njih i u daljim istraživanjima istraživač će se fokusirati na ispitivanje uzročno-posledičnih veza između tih obeležja. U protivnom, ukoliko nijedan od izračunatih koeficijenata korelacije nije značajan, to ukazuje da između vrednosti ispitivanih obeležja ne postoji međuzavisnost i da nema smisla sprovoditi dalja istraživanja u tom pravcu.

Rezultate studije sa ispitivanjem međuzavisnosti između vrednosti tri obeležja merenih kod 10 učesnika možemo prikazati kao na sledećem grafikonu:

Obeležje I

Obe

ležj

e II

.

Obeležje II

Obe

ležj

e II

I .

Obeležje I

Obe

ležj

e II

I .

Uočava se da između parova vrednosti prvog i drugog, kao i između drugog i trećeg obeležja ne postoji neka povezanost, dok se može zapaziti da uporedo sa porastom vrednosti prvog obeležja rastu i vrednosti trećeg obeležja. Prema tome, trebalo bi sprovesti eksperiment ili kvazi eksperiment koji bi detaljnije ispitao povezanost obeležja jedan i tri.

Pogrešno je pokušavati da tumačenjem rezultata korelacionih studija donesemo zaključke o uzročno-posledičnim vezama između vrednosti dva obeležja, jer postoji mogućnost da je značajna međuzavisnost između njih u potpunosti posledica uticaja nekog trećeg faktora. Na primer, merene su vrednosti mnogih obeležja kod učenika jedne srednje škole i izračunati su koeficijenti korelacije za svaki par obeležja. Najveća međuzavisnost potvrđena je između telesne visine i dužine kose, i to negativna, odnosno ispitanici sa dugačkom kosom su bili niži. Ni u kom slučaju ne bi smeli da zaključimo da veća

202019

dužina kose značajno utiče na smanjenje telesne visine ili obratno. Svima je jasno da je na ovakvu međuzavisnost u potpunosti uticao pol ispitanika, odnosno devojke su niže, a imaju dužu kosu, dok su mladići viši, a imaju kraću kosu. Prema tome, pol je kao treće obeležje bio presudan za vrednost koeficijenta korelacije između visine i dužine kose.

U predhodnom primeru je uticaj trećeg faktora bio očigledan i lako razumljiv, ali postoje situacije kada je on neprepoznat, a ipak je njegov uticaj presudan. Zbog toga, na osnovu vrednosti koeficijenta korelacije zaključujemo:

- Postoji značajna povezanost između vrednosti prvog i drugog obeležja.a ne:

- Vrednosti prvog obeležja značajno utiču na vrednosti drugog obeležja.

202020