296
Bojan Janičić Osnove anketnih istraživanja

Bojan Janičić - digitalna.ff.uns.ac.rs

  • Upload
    others

  • View
    28

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Bojan Janičić - digitalna.ff.uns.ac.rs

Bojan Janičić

Osnove anketnih istraživanja

Page 2: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE

ANKETNIH ISTRAŽIVANJA

Page 3: Bojan Janičić - digitalna.ff.uns.ac.rs
Page 4: Bojan Janičić - digitalna.ff.uns.ac.rs
Page 5: Bojan Janičić - digitalna.ff.uns.ac.rs

Izdavač UNIVERZITET U NOVOM SADU

FILOZOFSKI FAKULTET Dr Zorana Đinđića 2

21000 Novi Sad Tel: +381214853900

www.ff.uns.ac.rs

Za izdavača prof. dr Ivana Živančević Sekeruš, dekan

Bojan Janičić

OSNOVE ANKETNIH ISTRAŽIVANJA

Recenzenti prof. dr Petar Čolović, Filozofski fakultet , Novi Sad prof. dr Ljiljana Mihić, Filozofski fakultet, Novi Sad

Lektura

Aleksandra Janičić

ISBN 978-86-6065-533-4

URL

http://digitalna.ff.uns.ac.rs/sadrzaj/2019/978-86-6065-533-4

Novi Sad, 2019.

Page 6: Bojan Janičić - digitalna.ff.uns.ac.rs
Page 7: Bojan Janičić - digitalna.ff.uns.ac.rs
Page 8: Bojan Janičić - digitalna.ff.uns.ac.rs

SADRŽAJ

i

SADRŽAJ

1. Uvod .............................................................................................................................................. 1

1.1. Šta je anketno istraživanje ....................................................................................... 1 1.2. (Vrlo) kratak istorijat anketnih istraživanja .................................................... 3 1.3. Vrste anketnih istraživanja ...................................................................................... 8

1.3.1. Namena .................................................................................................................... 8 1.3.2. Vrsta podataka ...................................................................................................... 8 1.3.3. Cilj ............................................................................................................................... 9 1.3.4. Metode prikupljanja podataka ...................................................................... 9 1.3.5. Nacrt ....................................................................................................................... 10 1.3.6. Vremenski aspekt ............................................................................................. 11 1.3.7. Populacija ............................................................................................................. 14 1.3.8. Područje obuhvata ........................................................................................... 14 1.3.9. Organizacija koja sprovodi istraživanje ................................................. 15

1.4. Zašto anketno istraživanje? .................................................................................. 16 2. Faze anketnih istraživanja ............................................................................................... 18

2.1. Planiranje i nacrt ....................................................................................................... 20 2.2. Prikupljanje podataka ............................................................................................. 26 2.3. Unos podataka ............................................................................................................ 28 2.4. Uređivanje i ponderisanje podataka................................................................. 28 2.5. Analiza ............................................................................................................................ 29 2.6. Pisanje izveštaja o rezultatima ............................................................................ 30 2.7. Slanje izveštaja (diseminacija) ............................................................................ 30

3. Populacija i uzorak .............................................................................................................. 31 3.1. Populacija ..................................................................................................................... 31

3.1.1. Retke i skrivene populacije .......................................................................... 33 3.2. Uzorak ............................................................................................................................ 36

3.2.1. Jedinice uzorkovanja, jedinice posmatranja, jedinice analize ...... 36 3.2.2. Okvir uzorkovanja (spisak populacije) ................................................... 38 3.2.3. Planirani i realizovani uzorak ..................................................................... 50

4. Uzorkovanje ........................................................................................................................... 53 4.1. Nacrt uzorkovanja .................................................................................................... 55 4.2. Pouzdanost, validnost i preciznost uzorkovanja ........................................ 57 4.3. Probabilističko i neprobabilističko uzorkovanje ........................................ 57

4.3.1. Probabilističko uzorkovanje........................................................................ 59 4.3.2. Neprobabilističko uzorkovanje .................................................................. 71

4.4. Višefazno uzorkovanje ............................................................................................ 79 4.4.1. Kišove tablice ..................................................................................................... 80

4.5. Veličina uzorka ........................................................................................................... 81 4.5.1. Određivanje optimalne veličine uzorka ................................................. 83 4.5.2. Cena istraživanja u zavisnosti od nacrta uzorkovanja ..................... 86

4.6. Skala kredibiliteta za male uzorke .................................................................... 87 5. Ukupna greška ankete ....................................................................................................... 90

5.1. Greška uzorkovanja ................................................................................................. 92 5.2. Greška pokrivenosti ................................................................................................. 96

Page 9: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

ii

5.3. Greška neodgovora................................................................................................... 98 5.4. Greška merenja ....................................................................................................... 101 5.5. Primer upotrebe koncepta ukupne greške ankete na izbor nacrta . 105 5.6. Greška podešavanja i greška obrade ............................................................. 107 5.7. Zaključak o izvorima grešaka u anketnim istraživanjima .................... 109

6. Konstrukcija i evaluacija anketnog upitnika......................................................... 110 6.1. Konstrukcija instrumenta .................................................................................. 112 6.2. Pisanje stavki ........................................................................................................... 113

6.2.1. Kognitivni proces davanja odgovora .................................................... 114 6.3. Formati stavki .......................................................................................................... 123 6.4. Preporuke za pisanje stavki .............................................................................. 127 6.5. Formatiranje upitnika .......................................................................................... 139 6.6. Redosled pitanja ..................................................................................................... 144

6.6.1. Preporuke u vezi sa redosledom pitanja u anketi........................... 147 6.6.2. Redosled ponuđenih odgovora ............................................................... 149

6.7. Evaluacija upitnika ................................................................................................ 153 6.7.1. Ekspertske procene upitnika ................................................................... 154 6.7.2. Pretest (pilot istraživanje) ........................................................................ 154 6.7.3. Bihejvioralno kodiranje .............................................................................. 156 6.7.4. Kognitivni intervju ........................................................................................ 156 6.7.5. Randomizovani eksperimenti .................................................................. 157 6.7.6. Ostale metode evaluacije upitnika i pitanja ....................................... 157

7. Prikupljanje podataka ..................................................................................................... 161 7.1. Ankete licem u lice ................................................................................................. 161 7.2. Grupne ankete ......................................................................................................... 162 7.3. Telefonske ankete .................................................................................................. 162 7.4. Poštanske ankete ................................................................................................... 163 7.5. Ankete sa ličnom dostavom upitnika ............................................................ 164 7.6. Internet ankete ........................................................................................................ 164 7.7. Ankete sa mešovitim modalitetima ............................................................... 165 7.8. Upotreba računara u anketnim istraživanjima ......................................... 165

7.8.1. Različite varijante računarski podržanog prikupljanja podataka (CADAC) 168

7.9. Izbor modaliteta prikupljanja podataka, ..................................................... 172 7.9.1. Pitanja koja utiču na izbor metode prikupljanja podataka ......... 174

7.10. Dobre i loše strane različitih metoda prikupljanja podataka ............. 180 8. Neodgovori .......................................................................................................................... 182

8.1. Stopa odgovora, stopa neodgovora, stopa odbijanja i stopa konverzije 183

8.2. Uticaj neodgovora na anketne pokazatelje ................................................. 185 8.3. Izvori neodgovora .................................................................................................. 187

8.3.1. Neuspešno dostavljanje ankete............................................................... 187 8.3.2. Neodgovori zbog odbijanja ....................................................................... 191 8.3.3. Neodgovori zbog nemogućnosti davanja odgovora ....................... 198

8.4. Modalitet prikupljanja podataka i neodgovori ......................................... 199 8.5. Neodgovori na pojedine stavke ....................................................................... 202

9. Uloga anketara ................................................................................................................... 204 9.1. Izbor anketara ......................................................................................................... 205 9.2. Obuka anketara ....................................................................................................... 205 9.3. Nadzor anketara ..................................................................................................... 207

Page 10: Bojan Janičić - digitalna.ff.uns.ac.rs

SADRŽAJ

iii

9.3.1. Falsifikovanje i validacija podataka ...................................................... 208 9.4. Uticaj anketara na anketne pokazatelje (pristrasnost anketara) .... 210

9.4.1. Pristrasnost anketara .................................................................................. 212 10. Priprema podataka za analizu ..................................................................................... 215

10.1. Kodiranje (šifriranje) ........................................................................................... 216 10.2. Unos podataka ......................................................................................................... 221 10.3. Uređivanje podataka............................................................................................. 224 10.4. Ponderisanje i poststratifikacija ...................................................................... 229

10.4.1. Koraci u ponderisanju ................................................................................. 231 10.4.2. Ponderisanje i greška uzorkovanja ....................................................... 232

10.5. Imputacija nedostajućih podataka ................................................................. 233 10.5.1. Tretmani nedostajućih podataka ........................................................... 242

11. Pisanje i slanje izveštaja ................................................................................................. 252 11.1. Naslov .......................................................................................................................... 253 11.2. Sažetak ........................................................................................................................ 253 11.3. Uvod ............................................................................................................................. 254 11.4. Metod ........................................................................................................................... 254 11.5. Rezultati ..................................................................................................................... 255 11.6. Zaključci ..................................................................................................................... 257 11.7. Literatura ................................................................................................................... 258 11.8. Prilozi .......................................................................................................................... 259 11.9. Prezentacija .............................................................................................................. 259

12. Etička pitanja ...................................................................................................................... 260 12.1. Standardi u vezi sa istraživanjem ................................................................... 260 12.2. Standardi u vezi sa javnošću ............................................................................. 261 12.3. Standardi u vezi sa klijentima .......................................................................... 262 12.4. Standardi u vezi sa ispitanicima ...................................................................... 262

12.4.1. Informisani voljni pristanak ..................................................................... 262 12.4.2. Poštovanje dobrobiti ispitanika .............................................................. 264 12.4.3. Zaštita poverljivosti podataka ................................................................. 265 12.4.4. Izbegavati obmanjivanje ispitanika ...................................................... 270

13. Reference .............................................................................................................................. 272 14. Indeks pojmova.................................................................................................................. 281

Page 11: Bojan Janičić - digitalna.ff.uns.ac.rs
Page 12: Bojan Janičić - digitalna.ff.uns.ac.rs

UVOD

1

1. Uvod1

Metodologija anketnih istraživanja je obuhvatna multidisciplinarna oblast, koja svojim obimom daleko prevazilazi ciljeve i svrhu ovog udžbenika, a to su uvod i upoz-navanje čitaoca sa osnovnim pojmovima anketnih istraživanja. S obzirom na rastuću popularnost anketnih istraživanja i njihovu sve češću primenu u različitim oblastima i od strane istraživača koji nisu dovoljno upoznati sa problemima koji mogu nastati u njihovoj primeni, namera autora bila je da ukaže na moguće probleme koji mogu nastati u planiranju i sprovođenju, te da čitaoca uputi na neka od mogućih rešenja. Želja autora bila je da ovaj udžbenik posluži kao polazna tačka istraživačima i izvan oblasti nauka o ponašanju prilikom planiranja anketnih istraživanja. Cilj je bio da čitalac uvidi složenost ovog metoda istraživanja i da ne zanemari činioce koji ga mogu dovesti do pogrešnih zaključaka. Kako anketna istraživanja ne moraju imati čisto naučnu svrhu, već se rezul-tati dobijeni na ovaj način u velikoj meri koriste i za donošenje važnih informisanih odluka u različitim sferama života, želja autora bila je da čitaocu ukaže i na praktične strane njihovog organizovanja i sprovođenja.

U udžbeniku biće objašnjeni osnovni pojmovi, principi i faze anketnih istraži-vanja, i date korisne preporuke za njihovu organizaciju, pa i prevenciju i otklanjanje mogućih problema koji mogu nastati.

1.1. Šta je anketno istraživanje

Termin anketa koji se koristi u srpskom jeziku preuzet je iz francuskog, od reči enquête što znači istraživanje, istraga, a vodi poreklo iz latinskog jezika, od reči inquisita sa istim značenjem (Fajgelj, 2004). U engleskom jeziku za ovakav tip istraživanja koristi se termin survey, a može se prevesti i terminom pregled. Doduše, i engleski termin je nastao iz francuskog survee, što opet, ima koren u latinskom od super (iznad, preko) i videre (gledati) (Schuman, 1997; prema: Groves, 2009).

1 Udžbenik je nastao u okviru projekta „Nasledni, sredinski i psihološki činio-

ci mentalnog zdravlja“ koji finansira Ministarstvo prosvete, nauke i tehnološkog razvoja Republike Srbije (projekat broj 179006)

e-mail adresa autora: [email protected]

Page 13: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

2

Kada se u srpskom jeziku kaže „anketa“ obično se pomisli na istraživanje koje uključuje upotrebu (anketnih) upitnika, a vrlo često i samo na upitnik. Važno je znati da se anketna istraživanja ne ograničavaju samo na upotrebu podataka dobijenih tim putem već se mogu koristiti podaci dobijeni različitim načinima merenja, ali i sekun-darni podaci.

Sumirajući veći broj definicija de Leeuw i saradnici anketno istraživanje, odnosno anketu, definišu kao „istraživačku strategiju u kojoj se kvantitativne informacije sistematski prikupljaju na relativno velikom uzorku uzetom iz neke populacije“ (De Leeuw, Hox, Dillman, & European Association of Methodology, 2008, p. 2).

Ako ovu definiciju pažljivije pogledamo, možemo videti da se ne pominje anke-tni upitnik. Iako su upitnici trenutno dominantni način prikupljanja podataka, nisu i jedini. Ono što je bitno, bez obzira na metodu prikupljanja podataka koja se koristi, je da se to radi sistematski. Jedino na taj način moguća je smislena statistička obrada i analiza.

Informacije koje se prikupljaju u anketnim istraživanjima obično su kvantitati-vne. Čak i ako to nije slučaj, kvalitativni podaci se kvantifikuju pre statističke obrade.

Sledeća važna komponenta navedene definicije je uzorak. Iako se anketna istraživanja u izuzetnim slučajevima mogu sprovoditi na čitavoj populaciji (ako se radi o malim i lako dostupnim populacijama2), ona se po pravilu sprovode na uzorcima izvučenim iz populacija o kojima želimo da zaključujemo i saznamo više. Istraživanja sprovedena na uzorku, ukoliko su dobro planirana i sprovedena, mogu znatno brže i uz snižene troškove u odnosu na istraživanja na populaciji dati informacije dovoljne preci-znosti za praktične potrebe (Mahalanobis, 1965).

U definiciji anketnog istraživanja pominje se sintagma relativno veliki uzorak. Veličina uzorka jeste relativan pojam. Šta je dovoljno veliki uzorak zavisi od varijabil-nosti same pojave, načina uzorkovanja i planiranih analiza. Mogli bismo reći jednostav-no: „Što je uzorak veći – to bolje“. Međutim, prilikom sprovođenja anketnih istraživanja to ne mora uvek da bude tačno. Svaka anketa ima svoju cenu. Nekada jednostavno nema smisla prikupljati informacije od prevelikog broja jedinica istraživanja (ispitani-ka), jer sa njegovim povećanjem preciznost ankete neće bitno porasti, ali cena i vreme potrebno za njeno sprovođenje hoće. Možemo reći da je prilikom sprovođenja anketnih istraživanja bitno uskladiti sve ove elemente, a ne insistirati na što većem uzorku.

Pitanje uzorkovanja je vrlo važno i složeno i o njemu će biti više reči u poseb-nom poglavlju (4).

2 U ankete na celokupnoj populaciji bi se mogli ubrojati i popisi stanovništva.

Iako po načinu sprovođenja liče na anketna istraživanja, oni se obično ne tretiraju tako već se nazivaju onim što i jesu – popisi (engl. census)

Page 14: Bojan Janičić - digitalna.ff.uns.ac.rs

UVOD

3

Iako se kao jedna od osnovnih odrednica anketnih istraživanja često navodi da su ona neeksperimentalna (Fajgelj, 2004), videćemo da je u okviru njih moguća i upot-reba eksperimentalnih nacrta (videti odeljak 1.3.5.).

1.2. (Vrlo) kratak istorijat anketnih istraživanja

Korene anketnih istraživanja nalazimo u popisima stanovništva (ali i stoke i drugih dobara). Popisi su imali za cilj da obuhvate celokupnu populaciju neke države, a vlade su ih sprovodile u cilju oporezivanja i političkog predstavljanja (Groves, 2009). Imajući to u vidu, možemo reći da anketna istraživanja imaju začetke još u drevnom Vavilonu 3800 g.p.n.e, za kada se veruje da je obavljen prvi popis. Praksa popisa stano-vništva i imovine bila je prisutna i u starom Egiptu, Rimu i Kini. Forma popisa stanov-ništva postojala je XI–XVI veka u majanskom carstvu u Južnoj Americi. Na tlu Evrope možemo pomenuti „Knjigu sudnjeg dana“ (engl. „Doomsday Book“), koja predstavlja vrstu popisa stanovništva velikog dela Engleske i Velsa, dovršenog krajem XI veka po naredbi kralja Viljema Osvajača. „Knjiga sudnjega dana“ takođe je napravljena u cilju evidencije plaćanja poreza. Popisi su u XVII veku obavljani na teritoriji današnje Kana-de, a vek kasnije i na teritoriji današnje Finske i Švedske. Kada su u XIX veku krenula prva istraživanja koja se nisu ticala broja ljudi, domaćinstava, imovine, već mišljenja ljudi, bazirala su se na pristupu koji se primenjuje u popisima, odnosno predstavljala su pokušaj da bude ispitana celokupna populacija (Rossi, Wright, & Anderson, 1983).

Prvi pokušaj zaključivanja o populaciji na osnovu podataka koji se odnose na jedan njen manji deo (odnosno na osnovu uzorka), vezuje se za rad engleskog trgovca pozamanterijom Džona Graunta (John Graunt) iz XVII veka (Bethlehem, 2009). On je u svom delu iz 1662. godine „Natural and Political Observations Upon the Bills of Mortality“ na osnovu podataka iz crkvenih knjiga nekoliko parohija koje su imale dobro vođene arhive, došao do zakonitosti o odnosu broja porodica koje su živele u njima i godišnjeg broja sahrana. Pretpostavljajući da sličan odnos važi i u ostalim parohijama, on je na osnovu godišnjeg broja sahrana pokušao da proceni broj porodica koje su u njima živele. Graunt nije sproveo anketno istraživanje već je primenio statističko zak-ljučivanje na osnovu uzorka sekundarnih podataka. Sličan je bio rad Laplasa (Pierre Simon Laplace) u Francuskoj početkom XIX veka. Želeći da proceni broj stanovnika tadašnje Francuske uzeo je uzorak od 30 departmana3 birajući one sa boljim arhivama, istovremeno vodeći računa da budu zastupljeni departmani sa različitom klimom. Na taj način pokušao je da kontroliše uticaj klimatskog faktora. Koristeći centralnu granič-nu teoremu, dokazao je normalnu distribuciju statističke procene. Na žalost prevideo je činjenicu da je nacrt uzorkovanja bilo uzorkovanje klastera (ispitanika sa sličnim osobi-nama), a ne prosto slučajno (videti poglavlje 4). Šta više, departmani su birani namerno a ne slučajno (Bethlehem, 2009).

3 Upravne jedinice u Francuskoj koje se sastoje iz okruga.

Page 15: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

4

Drugi deo XIX veka doneo je značajan napredak u razvoju teorije verovatnoće i statistike. Značajna je uloga Ketlea (Lambert Adolphe Jacques Quetlet4) u razvoju anke-tnih istraživanja i primeni dostignuća iz teorije verovatnoće i statistike u njima. Ketlea možemo smatrati odgovornim za uvođenje pojma prave vrednosti. Naime, on je pret-postavio da statistici dobijeni na uzorcima variraju oko neke prave vrednosti koju bis-mo dobili kada bismo izmerili celu populaciju. Takođe, njemu možemo pripisati kon-cept prosečnog čoveka, odnosno čoveka čije bi sve osobine bile jednake pravim vrednos-tima (Bethlehem, 2009). Na konceptu prosečnog čoveka zasnivao se veliki broj istraži-vanja krajem XIX i početkom XX veka. Naime, shvatanje da je dovoljno prikupiti infor-macije samo od tipičnih (prosečnih) ljudi tada se smatralo prihvatljivim, dok se anketi-ranje ekstrema izbegavalo.

Tek u XX veku počinje upotreba istraživanja nalik anketnim za ispitivanje sta-vova i preferencija ispitanika. Čuvena su bila predizborna istraživanja časopisa „Liter-ary Digest“, koji je na osnovu njih od 1920. do 1932. godine (svake 4 godine) tačno pre-dviđao rezultate predsedničkih izbora u SAD. Istraživanja su imala formu glasanja pre glasanja, a obavljala su se na delu populacije. Ovaj deo populacije ne možemo nazvati uzorkom (bar ne pravim, a svakako ne reprezentativnim). Sačinjavali su ga pretplatnici časopisa, vlasnici telefona i registrovanih automobila, registrovani članovi klubova... Zanimljivo je da časopis nije ostao upamćen po uspešnim predviđanjima, već po neus-pehu iz 1936. godine kada je predvideo pobedu Alfreda Landena (Alfred Landon), a pobedio je Frenklin Delano Ruzvelt (Franklin Dellano Roosevelt). Časopis je svoje pred-viđanje obavio na osnovu 2,4 miliona glasova koje je dobio sa deset miliona adresa na koje je poslao pitanje. Broj ispitanika koji je odgovorio je impresivan, a još impresivniji je broj na koje je pitanje poslato. Iako se već sam spisak adresa na koje je pitanje posla-to čini problematičnim, jer su ga činili imućniji Amerikanci koji su u doba ekonomske krize sebi mogli da priušte pretplatu na časopis, telefon, automobil i članstvo u klubo-vima, postoje nalazi koji ukazuju da bez udruženog delovanja sa samoselekcijom ispita-nika (Squire, 1988), odnosno onoga što se naziva pristrasnošću neodgovora (videti odeljak 5.3), rezultati ne bi u toj meri bili pogrešni i časopis bi verovatno pogodio pobe-dničkog kandidata (ali ne i procente).

Sve u svemu, ni ogroman broj ispitanika nije doprineo tačnosti predviđanja. Istovremeno je Američki institut za ispitivanje javnog mnenja Džordža Galupa (Georg Gallup) na osnovu mnogo manjeg uzorka tačno predvideo rezultate izbora. Ovaj doga-đaj, pored toga što je doprineo propasti časopisa Literary Digest5, smatra se prekretni-

4 Inače, Ketle je bio uključen u pokušaj formiranja Centralnog biroa za statistiku

Holandije 1826. godine, a nakon odvajanja Belgije bio je nadzornik za statistiku u toj zemlji. Nije se bavio istraživanjima na uzorku već samo popisima.

5 Samo ime Literary Digest postalo je sinonim za grešku velikih razmera kao npr. u radovima Gayo-Avello, D. (2011). Don't turn social media into another 'Literary Digest' poll. Communications of the ACM, 54(10), 121–128. ili Cahalan, D. (1989). Com-

Page 16: Bojan Janičić - digitalna.ff.uns.ac.rs

UVOD

5

com u razvoju anketnih istraživanja nakon kojeg se mnogo više pažnje poklanjalo metodologiji istraživanja, a posebno uzorkovanja. U prvo vreme javljaju se kvotni uzor-ci, a kasnije probabilistički.

Posle Prvog svetskog rata na popularnosti su dobila i marketinška istraživanja, odnosno istraživanja preferencija kupaca. Ni ona nisu imala formu anketnih istraživa-nja u savremenom obliku, već su više ličila na laboratorijska istraživanja. Pozivane su manje grupe ispitanika i ispitivane su njihove preferencije u vezi sa određenim proiz-vodima pomoću standardizovanih upitnika.

Kombinacija ovakvih pristupa dala je ono što nazivamo modernim anketnim istraživanjima. Iz oblasti marketinških istraživanja preuzet je metod ispitivanja prefe-rencija pomoću standardizovanih upitnika, iz novinskih i socioloških anketa preuzeti su predmeti istraživanja, a bilo je potrebno dodati još samo koncept probabilističkog uzorkovanja (Rossi et al., 1983).

Uslovi za to su se stekli tridesetih godina XX veka. Ankete su počele da se upot-rebljavaju radi sticanja uvida u društvene probleme ili da bi se dobio sistematski uvid u stavove „običnih ljudi“ u anketama iz oblasti žurnalizma i marketinga (Groves, 2009). Počinje upotreba anketnih istraživanja u komercijalne svrhe za potrebe reklamiranja na radiju. U to doba počinje da se koristi pošta i telefon za svrhe anketiranja u današnjem smislu. Fokus se pomera sa obeležja ispitanika na ono šta oni znaju, misle i osećaju. Podaci dobijeni na ovaj način počeli su sve više da se koriste za upravljanje kompanija-ma i u politici (posebno u kampanjama).

Dakle, početak modernih anketnih istraživanja možemo smestiti u tridesete godine XX veka. Koncentracija na subjektivno kod ispitanika i sve rasprostranjenija upotreba anketiranja, rezultirala je i razvojem standardizovanih upitnika. Masovnost anketiranja i povećanje uzoraka uticala je da broj obučenih, stručnih anketara koji su mogli da kvalitetno obave intervjue postane premali. Pošto su za potrebe anketiranja morali biti angažovani i ljudi koji nisu imali potrebno iskustvo i znanja iz oblasti druš-tvenih istraživanja, bilo je potrebno pažljivo sročiti pitanja koja će oni postavljati ispi-tanicima kako bi istraživač dobio informacije koje su mu zaista i potrebne. Razvoju standardizovanih upitnika doprineli su radovi psihometričara i psihologa koji su počet-kom XX radili na razvoju testova koji će meriti različite psihološke konstrukte. Za razvoj anketnih istraživanja posebno su bitni radovi Terstona (Leon Louis Thurstone) i Liker-ta (Ransis Likert) na merenju stavova (Groves, 2009). Pojava takozvane Likertove skale je omogućila skraćivanje standardizovanih upitnika pošto je pokazano da se jednim jednostavnim pitanjem sa uređenom skalom odgovora može postići gotovo ista stvar u merenju stavova koja se ranije dobijala velikim brojem poređenja po parovima. Na ovaj način upitnici su postali kraći, odnosno, omogućeno je ispitivanje više stvari u jedinici vremena.

ment: The Digest Poll Rides Again!

Page 17: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

6

Razvoj standardizovanih upitnika bio je praćen i razvojem uzorkovanja. U poče-tku, anketna istraživanja pokušavala su da obuhvate sve jedinice populacije. Ovakav način anketiranja bio je zahtevan sa aspekta prikupljanja podataka, ali je takođe stvarao i poteškoće prilikom obrade velike količine informacija. Zato je često obrađivan samo deo prikupljenih podataka. Sa porastom upotrebe anketiranja u različite svrhe i od strane različitih istraživača, anketiranje celokupne populacije postaje neekonomično, a često i nemoguće. Prvi pokušaji uzorkovanja bili su neprobabilistički. Manji broj ispita-nika (recimo pola populacije) biran je namerno, tako da reprodukuje strukturu popula-cije po važnim obeležjima. Ovakvim uzorkovanjem je u početku bio biran deo podataka (od svih prikupljenih) koji će biti obrađen.

Prvi probabilistički uzorci bili su ono što sada zovemo sistematski slučajni uzorci (biran je svaki n-ti ispitanik) iz podataka dobijenih popisom. Ovakvi uzorci nazi-vaju se probabilističkim ili verovatnosnim zato što svaki član populacije ima neku, nenultu verovatnoću da bude izabran u uzorak. Ovakav vid uzorkovanja danas se smat-ra standardom sa kojim se porede ostali uzorci. Kada god se sprovode istraživanja koja za cilj imaju donošenje važnih odluka primenjuju se probabilistički uzorci (Groves, 2009).

Slučajni uzorci su značajni i zato što nam omogućuju statističko zaključivanje. Sprovođenje istraživanja neke pojave na populaciji (recimo visine stanovnika neke države) rezultiraće parametrom (prosečnom visinom). Ukoliko su svi ispitanici pravilno izmereni to će biti tačna, prava vrednost tog parametra u populaciji. Međutim, ako merenje vršimo na uzorku, rezultat koji dobijemo (aritmetička sredina) biće statistik, odnosno procena parametra populacije. Ovaj statistik obično neće biti jednak paramet-ru populacije, a na ponovljenim merenjima na različitim uzorcima, dobijeni statistici će se i međusobno razlikovati. Ove procene su, dakle, skopčane sa određenim nivoom greške. Kolika je ta greška takođe možemo statistički proceniti i na osnovu nje možemo izgraditi interval poverenja oko statistika. Nakon toga, možemo sa određenim nivoom sigurnosti (obično 95 ili 99%) reći da se parametar populacije, prava vrednost merene osobine u populaciji, nalazi u okviru datog intervala poverenja. Međutim, ovo važi samo za probabilističke uzorke, ne i za namerne.

Iako su probabilistički uzorci u većini slučajeva najbolji, vrlo često nisu ostvari-vi. Naime, za slučajno biranje tačno određenih jedinica populacije potrebno je posedo-vati „spisak“ njenih članova. Ovakve spiskove poseduju samo državni organi i po zako-nima smeju ih upotrebljavati samo za svrhe za koje su takvi spiskovi pravljeni. Zainte-resovani istraživači, bilo naučni ili komercijalni, ne mogu doći do ovakvih spiskova. Zato je značajan proboj u razvoju metoda uzorkovanja predstavljala pojava zonskih6 (oblas-nih) verovatnosnih uzoraka (engl. area probability sampling), koji su u anketna istraži-vanja ušli iz istraživanja u oblasti poljoprivrede (Groves, 2009). Ovakav vid uzorkova-

6 Za detalje o zonskom uzorkovanju videti odeljak 3.2.2.

Page 18: Bojan Janičić - digitalna.ff.uns.ac.rs

UVOD

7

nja omogućio je verovatnosno uzorkovanje i u slučaju kada ne postoji spisak populacije u obliku liste ispitanika.

Razvoj modernih anketnih istraživanja može se posmatrati i kroz razvoj meto-da prikupljanja podataka. U početku su ankete sprovođene primenom intervjua licem u lice. Šezdesetih godina XX veka dominantan način anketiranja postaju poštanske anke-te. Ove ankete su bile znatno jeftinije od anketa licem u lice, ali zbog prirode medija na podatke je trebalo duže čekati. Širenje telefonske mreže omogućilo je porast broja anketa sprovedenih ovim putem. Istraživači iz oblasti marketinga među prvima su uvi-deli prednosti ovakvog načina sprovođenja anketa. Podaci su pristizali znatno brže nego kod poštanskih anketa, a cena ankete je bila još uvek manja nego u anketama licem u lice. Do devedesetih godina XX veka većina marketinških istraživanja u SAD bila je obavljana na ovaj način.

Naravno, ni telefonske ankete nisu bile savršene. Glavna mana ovog metoda prikupljanja podataka bila je i jeste činjenica da određene grupe stanovništva nisu posedovale (i ne poseduju) telefone i nisu mogle biti deo uzorka. Pojava računara, odnosno njihova sve veća dostupnost dalje je unapredila oblast anketiranja. Pored una-pređenja u oblasti prečišćavanja i obrade prikupljenih podataka, napredak je ostvaren i u oblasti prikupljanja podataka. Postoje različiti oblici primene računara u prikupljanju podataka (engl. Computer Assisted Data Collection – CADAC) u anketama tipa licem u lice i telefonskim anketama, ali najveći proboj ostvaren je pojavom interneta i onlajn anke-tiranja. Ovakav način prikupljanja podataka postaje sve zastupljeniji. Jeftiniji je i od telefonskih anketa, a podaci su dostupni računarskoj obradi čim ispitanik završi odgo-varanje. Pošto ovaj vid anketiranja omogućava logičku kontrolu toka ankete i odgova-ranja ispitanika, mala je verovatnoća javljanja neodgovarajućih (nemogućih) odgovora. Podaci prikupljeni putem CADAC pristupa odmah se nalaze u bazi podataka i u najvećoj meri spremni su za obradu.

Kada govori o razvoju modernog anketiranja (posebno u SAD), Grouvs (Groves, 2011) govori o tri razdoblja anketnih istraživanja. U prvom razdoblju, od 1930. do 1960, dolazi do razvoja metodologije anketnih istraživanja. U ovom periodu dolazi i do osnivanja institucija koje se bave anketiranjem u akademskom, vladinom i privatnom sektoru. U drugom razdoblju, od 1960. do 1990, dolazi do povećane primene anketnih istraživanja za potrebe vladinih organizacija, društvenih istraživanja i u marketingu. Poslednji period, od 1990. godine na ovamo, karakteriše razvoj različitih načina prikup-ljanja podataka, opadanje stope odgovora u anketama, opadanje kvaliteta okvira uzor-kovanja te porast kontinuiranog prikupljanja procesnih podataka iz digitalnih sistema, posebno sa interneta.

Iako se, kako smo videli, različite vrste istraživanja mogu smatrati anketnim istraživanjima, ubuduće, kada budemo govorili o anketnim istraživanjima to će se odnositi na istraživanja: 1.) čiji je cilj dobijanje statistika, odnosno numeričkih pokaza-telja koji za svrhu imaju opis nekih osobina populacije na koju se odnose, 2.) koja do

Page 19: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

8

potrebnih informacija dolaze postavljanjem pitanja ispitanicima (jedinicama istraživa-nja) i 3.) koja se obavljaju na određenom delu populacije, odnosno na uzorku.

1.3. Vrste anketnih istraživanja

Klasifikacija anketnih istraživanja može se napraviti na osnovu različitih krite-rijuma. Možemo ih podeliti na osnovu: namene, vrste podataka koje prikupljaju, cilja, metode prikupljanja podataka, vremenskog aspekta, populacije, područja obuhvata, organizacije koja ih sprovodi...

1.3.1. Namena

U zavisnosti od namene istraživanja, možemo razlikovati sledeće grupe anket-nih istraživanja:

marketinška medijska politikološka socioekonomska sociopsihološka

Marketinška istraživanja bave se potrošačkim ponašanjem i preferencijama. Npr. koji od ponuđenih proizvoda je bolji, da li biste kupovali neki proizvod ako bi pro-menio cenu ili pakovanje, koliko često kupujete neki proizvod ili koristite neke usluge....

Medijska istraživanja bave se gledanošću, slušanošću, čitanošću pojedinih medija, poverenjem u njih...

Politikološka istraživanja bave se stavovima ispitanika prema važnim društve-nim pitanjima, poverenjem u određene političke ličnosti, stranke i organizacije. Takve su, na primer, predizborne ankete.

Socioekonomska istraživanja bave se materijalnim statusom ispitanika, njiho-vim obrazovanjem, zanimanjem i sl.

Sociopsihološka istraživanja bave se navikama ispitanika, verovanjima, vredno-stima, stilom života...

1.3.2. Vrsta podataka

S obzirom na vrstu podataka koji se prikupljaju, anketna istraživanja mogu se baviti:

sociološkim, ekonomskim i antropološkim svojstvima ispitanika njihovim ponašanjem njihovim stavovima i mišljenjima (Fajgelj, 2004).

Page 20: Bojan Janičić - digitalna.ff.uns.ac.rs

UVOD

9

U prvu grupu podataka spadaju obeležja ispitanika poput pola, obrazovanja, zanimanja, verske pripadnosti, seksualnog opredeljenja, težine, visine... U drugu grupu spadaju podaci o svim ponašanjima ispitanika, bilo da se dešavaju sada, desila su se u prošlosti, ili je to nešto što ispitanik tek namerava da uradi (koliko često putuje, da li je u poslednjih pet godina kupio auto, da li namerava da izađe na izbore i sl.). U treću gru-pu podataka spadaju oni o stavovima i mišljenjima ispitanika (da li su za ulazak ili izla-zak iz EU, za ili protiv prihvatanja izbeglica...). Treća grupa podataka predstavlja najti-pičniju primenu anketa i ono što se još zove ispitivanje javnog mnenja.

1.3.3. Cilj

S obzirom na cilj, anketna istraživanja se još mogu podeliti na eksplorativna i konfirmativna.

Prilikom eksplorativnih istraživanja, istraživač ne zna puno o ispitivanoj pojavi i cilj ovakvog istraživanja je da stekne osnovni uvid i neka početna znanja o predmetu istraživanja. Rezultati ovakvih istraživanja su obično u vidu prosečnih vrednosti, frek-vencija, procenata...

Kada su u pitanju konfirmativna istraživanja, istraživač ima neke polazne pret-postavke o predmetu istraživanja i želi da ih proveri, odnosno potvrdi ili opovrgne. U ovakvim istraživanjima rezultati su u obliku statističkih testova koji testiraju te hipote-ze.

Ova podela je bitna i zbog činjenice da testiranje hipoteza vrlo često zahteva drugačije pristupe procesu uzorkovanja i veće uzorke koji omogućavaju primenu adek-vatnih statističkih testova.

1.3.4. Metode prikupljanja podataka

Vrlo česta je i podela anketnih istraživanja s obzirom na primenjene metode prikupljanja podataka.

Na taj način razlikujemo sledeće vrste anketnih istraživanja:

licem u lice grupne ankete telefonske ankete poštanske ankete ankete sa ličnom dostavom upitnika internet ankete

O različitim metodama prikupljanja podataka biće više reči u posebnom pogla-vlju (7).

Page 21: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

10

1.3.5. Nacrt

Prednost anketnih istraživanja nad laboratorijskim eksperimentima je u tome što se posmatrana pojava ispituje u prirodnijem okruženju, dok veštački, laboratorijski uslovi, dovode u pitanje generalizabilnost nalaza istraživanja. S druge strane, upravo manji stepen kontrole koji postoji u prirodnim uslovima terenskog istraživanja dovodi u pitanje validnost zaključaka o kauzalnosti (Fajgelj, 2004; Visser, Krosnick, & Lavrakas, 2000). Upotreba eksperimenata u anketnim istraživanjima može nam ipak pružiti određen uvid u kauzalne odnose ispitivanih pojava.

Prema tome, anketna istraživanja prema nacrtu možemo podeliti na eksplora-tivna ili opisna (engl. observational, descriptive) i eksperimentalna (Fink, 2003).

U eksperimentalnim anketnim istraživanjima postoje najmanje dve grupe ispi-tanika od kojih je jedna kontrolna, dok druga (ili više njih) prolazi neki tretman i naziva se eksperimentalnom. Pod grupama se podrazumevaju skupine ispitanika koje dele neko iskustvo ili pripadnost nekoj prirodnoj grupi (poput razreda, firme u kojoj rade...) U zavisnosti od načina razvrstavanja ispitanika u grupe možemo razlikovati eksperi-mentalne i kvazi-eksperimentalne nacrte. Ukoliko su ispitanici u grupe razvrstavani slučajnim izborom govorimo o eksperimentalnom nacrtu, odnosno o nacrtu sa ekviva-lentnim grupama. Ekvivalentne grupe mogu biti rezultat slučajnog biranja ispitanika u grupe (randomizacija), ali i jednačenja grupa. Jednačenje grupa podrazumeva namerno razvrstavanje ispitanika u grupe na način koji bi trebalo da obezbedi ujednačenost gru-pa po relevantnim varijablama, odnosno po onim varijablama koje mogu uticati na ispi-tivanu (zavisnu varijablu) i/ili po samoj zavisnoj varijabli.

Randomizacija obično daje bolje rezultate pošto za ovaj postupak nije nužno poznavati i meriti varijable koje bi mogle uticati na zavisnu varijablu, niti je potrebno imati mere same zavisne varijable pre istraživanja. U ovom slučaju oslanjamo se na principe verovatnoće i slučajno biranje.

Kompletna randomizacija je trostepeni postupak (Fajgelj, 2004). Prvo se prostim slučajnim uzorkovanjem (odeljak 4.3.1.1) ispitanici biraju u uzorak. Zatim se, takođe slučajnim meto-dom, ispitanici izabrani u uzorak razvrstavaju u grupe. Na kraju se slučajnim biranjem određuje koja će grupa biti podvrgnuta eksperimentalnom tretmanu, a koja ne.

Kada je broj ispitanika koji je na raspolaganju istraživaču mali, jednačenje gru-pa će često dati bolje rezultate nego randomizacija. Što je broj varijabli po kojima je potrebno jednačiti grupe veći, potreban je veći uzorak pa se ova prednost jednačenja gubi. Ovo je primetno čim je broj varijabli po kojima je potrebno jednačiti grupe veći od 1 (Fajgelj, 2004).

Jedna od varijanti postupka jednačenja grupa je da se ispitanici sortiraju po varijabli po kojoj se jednače. Zatim se sa vrha (ili dna) liste odabere onoliko ispitanika koliko je ujednačenih grupa potrebno formirati, pa se ti ispitanici slučajnom metodom razvrstaju u grupe. Postupak se ponav-lja dok se ne iscrpi osnovni spisak ispitanika.

Page 22: Bojan Janičić - digitalna.ff.uns.ac.rs

UVOD

11

Jednačenje je relativno lako dok se vrši po jednoj varijabli. Čim ga je potrebno izvršiti po više vari-jabli teže je pronaći ispitanike koji će biti ujednačeni po njima. Situacija se komplikuje i sa pove-ćanjem broja nivoa varijabli po kojim se jednačenje vrši, ali i broja ekvivalentnih grupa koje je pot-rebno formirati. U svim ovim slučajevima potreban je veliki uzorak kao i kod randomizacije.

Ako članovi kontrolne grupe nisu slučajno birani niti su grupe jednačene, onda se radi o nacrtu sa neekvivalentnim grupama, odnosno o kvazi-eksperimentalnom nacr-tu (Fink, 2003).

Mogući su nacrti sa istorijskim kontrolnim grupama (engl. historical controls) u kojima se nalazi porede sa istorijskim podacima, odnosno podacima dobijenim na istraživanju nekih drugih ispitanika u prošlosti (tada su u pitanju ponovljena transver-zalna istraživanja odnosno istraživanja trenda – videti odeljak 1.3.6).

Eksperimenti u okviru anketnih istraživanja se često upotrebljavaju u cilju eva-luacije različitih postupaka i/ili instrumenata koji se koriste u samom procesu anketi-ranja, a sa ciljem njihovog unapređenja (Marsden & Wright, 2010). Eksperimenti u okviru anketnih istraživanja mogu se koristiti i za ispitivanje određenih društvenih pojava. Međutim, ovo nije tipična situacija. Anketna istraživanja su po pravilu neekspe-rimentalna.

Npr. možemo ispitivati kakav će biti stav ispitanika prema vakcinaciji u zavisnosti od (različitih) pamfleta koji su im podeljeni pre same ankete ili u zavisnosti od toga ko prenosi (istu) poruku.

Kada ispitanici sami sebi služe kao kontrolna grupa onda imamo nacrte sa ponovljenim merenjima, odnosno longitudinalne nacrte. Ovakvi su nacrti koji uključu-ju ponovljena ispitivanja kohorti7 i ispitivanja u kojima se od ispitanika traži retrospek-cija. Međutim ovakvi nacrti spadaju u opisne.

Opisni nacrti imaju za cilj da prikupe podatke o grupama koje već postoje. Ne kreiraju se nikakve nove grupe.

1.3.6. Vremenski aspekt

S obzirom na to da li su predmet anketnog istraživanja promene koje su nastale tokom vremena anketna istraživanja možemo podeliti na:

transverzalna (engl. cross-sectional) longitudinalna

Transverzalna istraživanja ili studije preseka, bave se određenom pojavom u jednoj vremenskoj tački i istraživača ne zanimaju promene u istraživanoj pojavi koje su mogle nastati tokom vremena.

7 Kohorte su subpopulacije ispitanika koji su prošli neko zajedničko iskustvo u

određenom vremenskom periodu: završili školu ili diplomirali iste godine, učestvovali u ratu, dobili decu...

Page 23: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

12

Kada su predmet istraživanja promene u posmatranoj pojavi ili pojavama koje nastaju tokom vremena, koriste se longitudinalna istraživanja.

Na primer, može nas zanimati: kako se menja stav stanovništva prema pristupanju Evropskoj uniji iz godine u godinu; da li će se stavovi stanovništva prema uslugama iz oblasti zdravstvene zaštite promeniti kao rezultat sprovođenja reformi u zdravstvu; da li je došlo do promena u zaposlenosti stanovništva; da li se potrošačke navike stanovništva menjaju sa uvođenjem mera štednje i sl.

Za proučavanje promena u stavovima, navikama i ponašanjima ispitanika moguća su dva pristupa. Kada koristimo isti ili sličan upitnik u više transverzalnih stu-dija na različitim uzorcima i u različitim vremenskim tačkama možemo pratiti trend promena posmatrane pojave. Istraživanja trenda ne moraju od početka biti zamišljena kao longitudinalna. Ako se istraživač naknadno doseti da bi bilo zanimljivo i korisno proveriti da li je došlo do promene u pojavi koja je ispitana u nekom ranijem istraživa-nju, on može istraživanje ponoviti na novom uzorku, upotrebom istog ili sličnog ins-trumenta. Ukoliko ima pristup podacima iz prethodnog istraživanja, rezultate može uporediti i doći do traženih zaključaka. Ovakva istraživanja se mogu temeljiti i na pret-hodnim istraživanjima drugih istraživača. U ovim slučajevima posebno su korisni repo-zitorijumi istraživačkih podataka kakvi se sve češće formiraju8. Međutim, ovakva istra-živanja ne nude nam uvek sve potrebne informacije. S obzirom da se radi o različitim uzorcima ispitanika, ona nam ne mogu odgovoriti na pitanja tipa: Da li je kod istih ispi-tanika došlo do promene u stavovima, ponašanju, statusu i sl?

Ponovljenom transverzalnom studijom može se pokazati da nije došlo do značajne promene sto-pe zaposlenosti. To može značiti da su oni koji su imali posao – posao zadržali, a oni koji ga nisu imali – nisu ga ni našli. S druge strane, moguć je i scenario da stopa zaposlenosti ostane približno ista, a da bez posla ostane veći broj ispitanika sa višim stepenom obrazovanja (recimo u oblasti prosvete), a da se zaposli približno jednak broj osoba sa niskim obrazovanjem (na nisko plaćenim radnim mestima u javnim preduzećima).

Takođe, promene u pojavi od interesa možemo ispitivati primenom transver-zalnog pristupa, jednostavno pitajući ispitanike da se prisete kako su se ponašali (kakvi su im bili stavovi, mišljenje, osećanja) pre određenog vremena i da li se to sada prome-nilo. Na taj način možemo dobiti sliku o menjanju posmatrane pojave. Međutim, ona će biti bazirana na prisećanju ispitanika koje može biti vrlo neprecizno i varljivo (Groves, 2009).

Ako istraživača zanimaju ovakva pitanja (i odgovori), a želi što preciznije i što validnije odgovore, onda bi on trebalo da se opredeli za formu panel istraživanja. Panel istraživanja su istraživanja koja koriste isti ili sličan merni instrument (anketu) u više vremenskih tačaka (talasa) na istom uzorku ispitanika. Ovakav način istraživanja je često i jeftiniji jer je jeftinije ispitivanje u više navrata ponavljati na istoj adresi. Nai-me, panel istraživanje omogućava da se samo u prvom talasu, kada je potrebno obezbe-

8 Na primer: videti CESSDA ERIC (Consortium of European Social Science data

Archives / European Research Infrastructure) vebsajt www.cessda.eu

Page 24: Bojan Janičić - digitalna.ff.uns.ac.rs

UVOD

13

diti saradnju ispitanika, koristi pristup licem u lice koji je finansijski zahtevan. U ostalim talasima može se koristiti telefonska, anketa elektronskom ili klasičnom poštom, što znatno smanjuje troškove istraživanja.

Pored dobrih strana, panel istraživanja imaju i specifične probleme. S obzirom da se istraživanje ponavlja više puta na istom uzorku, javlja se problem sa doživljajem anonimnosti kod ispitanika. Iako su prilikom sprovođenja anketnih istraživanja ispita-nici retko u potpunosti anonimni, u panel istraživanjima ovo postaje očigledno. Prili-kom sprovođenja panel istraživanja ispitanike je teže uveriti u suštinsku anonimnost pošto istraživač može (ili mora) saznati njihova imena i posedovati njihove kontakt podatke.

Drugi problem je problem osipanja uzorka. Panel istraživanje se obavlja u više talasa. Neće svi ispitanici koji su učestvovali u prvom talasu pristati da učestvuju u narednim. S druge strane, neki od njih će se preseliti, iseliti, neki neće biti dostupni anketaru, a neki možda neće biti ni živi. Zbog toga, nakon poslednjeg talasa istraživač može završiti sa mnogo manje ispitanika koji imaju podatke za sve talase nego što je planirao. Zato pri prvom kontaktu ispitanike treba pitati za saglasnost da učestvuju u više talasa istraživanja (Fajgelj, 2004). Uprkos dobijenim saglasnostima, do osipanja uzorka će neminovno doći. Razlozi osipanja su nepredvidivi, ali se osipanje uzorka sva-kako može predvideti. Iz tog razloga preporučuje se da se prilikom planiranja uzorka to uračuna i odabere nešto veći broj ispitanika nego što je zaista potrebno. Na ruku istra-živaču ovde ide činjenica da testovi bazirani na ponovljenim merenjima imaju manje standardne greške, odnosno veću snagu, pa je za isti nivo preciznosti potrebna manja veličina uzorka.

Međutim, osipanje ne mora da utiče samo na veličinu realizovanog uzorka. Kao što je rečeno, uzroci osipanja mogu biti različiti, ali najveći problem je kada je ono sis-tematsko, odnosno, povezano sa predmetom istraživanja. Tako, pored smanjenja reali-zovanog uzorka, osipanje može dovesti do značajnih poremećaja u njegovoj strukturi, pri čemu se realizovani uzorak može značajno razlikovati od planiranog i izgubiti želje-ne karakteristike (doduše, ova razlika se može javiti i kod transverzalnih istraživanja).

Panel istraživanja mogu trajati godinama (pa i decenijama)9. Protokom vreme-na ciljna populacija se menja i uzorak koji je u početku bio reprezentativan, protokom vremena više ne mora biti. Takođe, osipanje uzorka će uticati i na njegovu veličinu. Zato je korisno uzorak dopunjavati i delimično menjati.

Imajući to u vidu, zanimljiv je i koncept rotirajućih panel istraživanja. U ova-kvim istraživanjima anketiranje se kao kod svih panela periodično ponavlja, pri čemu se iz uzorka u svakom talasu izbacuje deo uzorka i uvodi novi (Pfeffermann & Rao, 2010).

9 Npr. Panel Study of Income Dynamics koja se sprovodi u SAD još od šezdese-

tih godina XX veka (Hofferth et al., 2016)

Page 25: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

14

Jedan primer mogućih šema rotacije uzoraka na godišnjem nivou je Tabela 1. U primeru iz tabele anketa se ponavlja na mesečnom nivou, a svakog meseca se menja jedna šestina uzorka (redovi). Uzorak je inače podeljen na 16 delova (u1–u16), a svakog meseca u anketi učestvuje 6/16. Svaka šesnaestina uzorka učestvuje u 7 uzastopnih talasa (kolone) a zatim pauzira 12 (meseci), nakon čega ponovo učestvuje u anketi.

Tabela 1 – Primer šeme rotiranja uzoraka

mesec 1 2 3 4 5 6 7 8 9 10 11 12 13 (1)

u1 u7 u7 u7 u7 u7 u7 u7 u13 u13 u13 u13 u13 u2 u2 u8 u8 u8 u8 u8 u8 u8 u14 u14 u14 u14 u3 u3 u3 u9 u9 u9 u9 u9 u9 u9 u15 u15 u15 u4 u4 u4 u4 u10 u10 u10 u10 u10 u10 u10 u16 u16 u5 u5 u5 u5 u5 u11 u11 u11 u11 u11 u11 u11 u1 u6 u6 u6 u6 u6 u6 u12 u12 u12 u12 u12 u12 u12

(adaptirano prema: Pfeffermann & Rao, 2010)

Kao i kod standardnih panel istraživanja, između talasa kod kojih postoji pre-klapanje uzoraka javlja se pozitivna korelacija, što dalje utiče na smanjenje varijanse uzorkovanja, odnosno standardne greške procene promene (razlike) između dva talasa. Na taj način dobija se na preciznosti procene, odnosno snazi statističkih testova.

1.3.7. Populacija

Populaciju od interesa za anketna istraživanja mogu predstavljati različiti enti-teti. Kada razmišljamo o populaciji prvo što nam padne na pamet su pojedinci, među-tim, elementi ciljne populacije mogu biti različiti. To mogu biti:

pojedinci domaćinstva preduzeća dani putovanja drugi događaji...

Jedna anketa može za cilj imati ispitivanje više različitih tipova entiteta.

Na primer, jedinice posmatranja (videti odeljak 3.2.1) jednog anketnog istraživanja mogu biti i domaćinstva i pojedinci...

1.3.8. Područje obuhvata

Prema području obuhvata anketna istraživanja mogu biti:

regionalna nacionalna internacionalna kros-nacionalna

Page 26: Bojan Janičić - digitalna.ff.uns.ac.rs

UVOD

15

Nacionalne ankete obuhvataju populaciju jedne zemlje, dok se regionalne odnose na neku zajednicu unutar te zemlje (recimo: Vojvodina, Šumadija, Novi Sad, Kraljevo...)

Internacionalna anketna istraživanja obuhvataju populacije više zemalja. Ovak-va istraživanja su retko izvodljiva zbog nedostatka nadnacionalnih okvira uzorkovanja. Češće se sprovode u formi kros-nacionalnih istraživanja. U ovom slučaju rade se odvo-jena nacionalna istraživanja koja koriste iste/slične instrumente, metodologiju i daju uporedive rezultate i izveštaje (Gideon, 2012).

1.3.9. Organizacija koja sprovodi istraživanje

Kada se govori o organizaciji koja sprovodi istraživanje nekada se misli na organizaciju koja je odgovorna za organizovanje i sprovođenje anketnog istraživanja, a nekada na organizaciju koja je sponzor, odnosno naručuje i plaća za istraživanje.

S obzirom na organizaciju koja je zadužena za sprovođenje istraživanja, razli-kujemo ankete koje organizuju:

nacionalna statistička služba/institut/zavod (u Republici Srbiji to je Republički zavod za statistiku Srbije – RZS)

akademske institucije (univerziteti, fakulteti...) marketinške agencije neprofitne organizacije

Naručioci anketnog istraživanja mogu biti razni, državni organi, nevladine organizacije, preduzeća, mediji, političke organizacije...

Moguće su i kombinacije različitih tipova naručilaca, ali i različitih organizacija koje sprovode anketna istraživanja, tako da ova podela nije čista.

Postoje mišljenja da su anketna istraživanja koje sprovode nacionalne statistič-ke službe, akademske institucije i marketinške agencije tri zasebna sveta. U zvaničnoj statistici ključna reč je uzorkovanje i istraživanja se obično zasnivaju na probabilistič-kim uzorcima, dok marketinške agencije uglavnom koriste neprobabilističke uzorke10. Razlika između akademskih i marketinških anketnih istraživanja je, prema nekim auto-rima (P. Smith, 2009), u različitim tipovima znanja koje poseduju stručnjaci iz ove dve oblasti. Dok stručnjaci iz oblasti marketinških istraživanja imaju praktična znanja, odnosno znaju kako da sprovedu anketno istraživanje, nedostaju im teorijska znanja. S druge strane, stručnjaci iz akademskih institucija imaju teorijska znanja, ali im nedosta-ju praktična.

10Državnim zavodima su dostupni okviri uzorkovanja koji omogućavaju ovakav

vid uzorkovanja, što nije slučaj sa marketinškim agencijama i akademskim ustanovama.

Page 27: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

16

Zanimljivo je da stopa odgovora (ili neodgovora11) na anketu zavisi i od naručioca ankete. Istraži-vanja pokazuju da ispitanici radije pristaju da učestvuju u anketama iza kojih stoje akademske institucije i država, nego u onim koje sponzorišu komercijalne organizacije (Gideon, 2012).

1.4. Zašto anketno istraživanje?

Bez obzira na tip anketnog istraživanja, za sva je zajedničko da pokušavaju da na osnovu malog dela populacije dođu do precizne procene parametara u okviru mogu-ćnosti koje su definisane društvenim, ekonomskim i socijalnim okruženjem (De Leeuw et al., 2008).

Ankete se sprovode u raznim oblastima i sa različitim ciljevima. U oblasti nauč-nog istraživanja obično je cilj da se stekne uvid i prošire znanja o nekoj pojavi, o njenoj rasprostranjenosti i odnosu sa drugim pojavama, i tako obogati korpus naučnih znanja. U primenjenim oblastima cilj je da se na osnovu stečenih znanja pripremi plan delovanja i konačno sprovede neka akcija u vezi sa predmetom istraživanja. Takav je na primer slučaj u marketinškim istraživanjima, istraživanjima iz oblasti socijalne politike, eko-nomije i nekim istraživanjima javnog mnenja (recimo, onim vezanim za izbore).

Kao što je već rečeno, svako anketno istraživanje košta, neko manje neko više. Najviše košta anketno istraživanje koje nije bilo potrebno ili ono koje nije sprovedeno kako treba.

Prilikom odlučivanja za anketno istraživanje prvo bi trebalo postaviti sledeća pitanja:

1. Koje su nam informacije neophodne (ili mislimo da jesu)?

Da li je anketno istraživanje neophodno ili već raspolažemo podacima koji su nam potrebni da bismo mogli da zaključujemo o pojavi koja nas zanima? Nekada se istraživanje može obaviti na sekundarnim podacima. Razlika između primarnih i sekundarnih podataka je u tome postoje li ti podaci od ranije ili ne. Primarni podaci su oni koje istraživač prikuplja za potrebe aktuelnog istra-živanja, a sekundarni oni koje je već prikupio neko drugi (ili sam istraživač) za neke druge potrebe. Sekundarni podaci se još nazivaju arhivski podaci. Prilikom opredeljivanja za istraživanje koje će koristiti sekundarne podatke, istraživač mora imati u vidu moguću pristrasnost ovih podataka, koja se može ispoljiti u vidu selektivnosti odlaganja i čuvanja ovih podataka, te reaktivnosti ispi-tanika u situaciji kada su podaci beleženi (Fajgelj, 2004). Takođe, sekundarni podaci ne moraju se u potpunosti poklapati sa varijablama (podacima) koje su nam potrebne. Tu je i pitanje tačnosti sekundarnih podataka. U zavisnosti od vrste sekundarnih podataka, odnosno od načina na koji su prikupljeni, i oni mogu patiti od istih grešaka kao i primarni podaci (poglavlje 5).

11 Termin „neodgovor“ koristimo za prevod engleskog termina „nonresponse“.

Više o neodgovorima i samom terminu u poglavlju 8.

Page 28: Bojan Janičić - digitalna.ff.uns.ac.rs

UVOD

17

2. Zašto su nam informacije potrebne? Koliko su nam bitni ti razlozi?

Već je rečeno da svako anketno istraživanje ima cenu koja zavisi od različitih činilaca kao što su metod prikupljanja podataka, obim i sadržaj ankete, veličina uzorka... Prilikom odlučivanja za sprovođenje anketnog istraživanja trebalo bi razmotriti da li potrebne informacije možemo priku-piti na neki drugi način i da li su nam za ostvarenje našeg cilja potrebne baš sve informacije koje smo planirali da prikupimo. Takođe, ako se opredelimo za anketno istraživanje, bitno je da priku-pimo sve neophodne informacije bez kojih ne možemo ostvariti ciljeve zbog kojih ga sprovodimo. Iako povećanje obima ankete povećava njenu cenu, dobijeni rezultati nam neće puno vredeti ako na osnovu njih ne ostvarimo cilj, odnosno ne dođemo do željenih saznanja. Razlog zbog kojeg planiramo sprovođenje ankete utiče na njenu opaženu cenu. Skupa anketa koja može dovesti do još veće dobiti, manje je skupa od jeftine na osnovu koje ne ostvarujemo nikakvu dobit.

3. Kako će različiti nalazi ankete uticati na eventualne odluke?

Ovo je bitno kako bismo znali koja preciznost podataka je bitna. Nedovoljna preciznost rezultata anketnog istraživanja može dovesti do pogrešnih odluka. Potrebno je imati u vidu kakva može biti cena takvih pogrešnih odluka. Željena preciznost rezultata i varijabilnost ispitivane pojave presu-dno utiču na veličinu potrebnog uzorka, od koga u velikoj meri zavisi dizajn anketnog istraživanja.

Dakle, pre nego što krenemo u planiranje ankete morali bismo znati (bar okvirno): 1. ciljnu populaciju, odnosno populaciju čije parametre želimo da procenimo i 2. koje su to informacije koje želimo da prikupimo (moraju biti jasno definisane). Na osnovu toga možemo zaključiti da li je anketno istraživanje primereno za problem koji želimo da ispitamo.

Rej i Parker (Rea & Parker, 2014) zaključuju da je anketno istraživanje prime-rena metoda istraživanja kada:

ne postoje adekvatni sekundarni podaci želimo da generalizujemo nalaze sa uzorka na populaciju ciljna populacija nam je dostupna podaci koje želimo da dobijemo su subjektivna mišljenja i stavovi pripadnika

populacije (bazirani na samoizveštaju)

Page 29: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

18

2. Faze anketnih istraživanja

Proces anketnog istraživanja možemo posmatrati iz dve perspektive. Prva je perspektiva merenja konstrukta, a druga perspektiva opisivanja populacije (Groves, 2009). Što se tiče merenja konstrukta, svaka anketa kreće definisanjem predmeta mere-nja (konstrukta), njegovom operacionalizacijom (definisanjem mera/pitanja), pa se preko odgovaranja ispitanika i uređivanja odgovora dolazi do željenih statistika.

Konstrukt je ono što istraživač želi da izmeri. Iako konstrukt na prvi pogled može delovati kao nešto jasno i očigledno, on je često samo ideja koja nije u potpunosti definisana. Primeri predmeta merenja su: učestalost rizičnog ponašanja mladih, učesta-lost migracija stanovništva, zaposlenost...

Istraživača može zanimati koliko ljudi u Republici Srbiji je zaposleno/nezaposleno. I konstrukt zaposlenosti može se različito definisati. Da li je zaposlen samo onaj koji radi na neodređeno vreme ili se kao zaposlenost računa i rad po ugovoru na određeno vreme? Ako se računa, da li se računaju ugovori kraći od 3 meseca ili ne? Da li je zaposlen neko ko radi samo honorarne poslo-ve? Ako jeste, da li je bitna učestalost takvih poslova? Da li je zaposlen neko ko radi bez ugovora ili u neregistrovanim firmama? Da li je zaposlen neko ko ne prima platu? Da li je zaposlen neko ko je u toku prošle nedelje radio bar jedan dan i za to primio naknadu u novcu ili naturi?

Različite definicije konstrukta daće različite rezultate. Da bismo rezultate istra-živanja mogli korektno preneti zainteresovanim stranama, konstrukt je potrebno jasno definisati i to navesti u izveštaju istraživanja. Na taj način korisnik rezultata će znati šta je tačno ispitivano.

Kako bi mogao biti izmeren konstrukt moramo operacionalizovati i, ukoliko je to moguće, definisati indikatore koji se mogu prevesti u konkretna pitanja. Cilj je nap-raviti mere koje će ga najbolje reprezentovati. Kada kažemo mere, obično se misli na pitanja koja vidi ispitanik, ali to mogu biti i drugi oblici prikupljanja podataka (poput opservacija anketara i raznih fizičkih merenja...)

U istraživanju rizičnih ponašanja mladih ne bi bilo dovoljno pitati: „Koliko često se ponašate rizič-no?“ ili „Da li se ponašate rizično?“, pošto neka od ponašanja koja istraživač možda podvodi pod taj konstrukt, mladi ne doživljavaju kao takva. Zbog toga bi bilo bolje postaviti niz konkretnih pitanja koja ispituju indikatore te pojave, poput konzumiranja alkohola, zloupotrebe narkotika, pušenja, kockanja, rane seksualne aktivnosti...

Naredna faza je odgovaranje ispitanika. Ispitanik to može činiti prisećajući se ili donoseći neki sud. Može tražiti pomoć od drugih osoba (ukoliko ne može da se priseti),

Page 30: Bojan Janičić - digitalna.ff.uns.ac.rs

FAZE ANKETNIH ISTRAŽIVANJA

19

a može i pogledati u dokumentaciju ukoliko je to potrebno. Ukoliko se anketa sastoji od pitanja sa ponuđenim odgovorima, ispitanik bira jedan od njih, a u pitanjima otvorenog tipa potrebno je da sam konstruiše odgovor (Groves, 2009). Nekada ispitanik neće ni dati odgovor, bilo zato što nema stav o predmetu pitanja ili ne može da se priseti, bilo zato što ne želi da odgovori na pitanje.

Nakon faze odgovaranja sledi faza pripreme podataka za analizu. U zavisnosti od načina prikupljanja odgovora nekada je odgovore potrebno korigovati i verifikovati. U ovoj fazi se kodiraju otvoreni odgovori (šifriranje) i koriguju nemoguće vrednosti. Takođe se proveravaju i malo verovatni odgovori. Analiza obično uključuje analizu autlejera i atipičnih sklopova odgovora. Ukoliko je potrebno (i moguće), ispitanici sa ovakvim sklopovima odgovora se ponovo kontaktiraju i traži se razjašnjenje. U ovoj fazi se proverava i procenat neodgovora ispitanika i donosi odluka da li će se nedostajući podaci nekako nadomestiti ili će se protokol ispitanika odbaciti i tretirati kao da nije popunio anketu. Ovo prevashodno zavisi i od broja pitanja na koje ispitanik nije odgo-vorio.

Ovu fazu je moguće olakšati u računarski podržanim modalitetima prikuplja-nja podataka pošto je u njima moguće ugraditi logičke kontrole (videti odeljak 7.8). Logička kontrola upitnika se sastoji u kontrolisanju opsega odgovora, selekciji narednih pitanja u zavisnosti od prethodnih odgovora i eventualnom kontrolom da li je ispitanik odgovorio na sva obavezna pitanja.

U računarski podržanom modalitetu prikupljanja podataka sa ugrađenim logičkim kontrolama nemoguće je, na primer, da ispitanik koji je rekao da nikada nije koristio usluge i proizvode neke banke odgovara na pitanja koja se tiču kvaliteta tih usluga i proizvoda. Takođe, moguće je podse-titi ispitanika da nije odgovorio na neko pitanja i zamoliti još jednom da to učini (tzv. meki podse-tnik / engl. soft reminder), ili čak sprečiti da pređe na naredno pitanje ako nije odgovorio na pret-hodno (tvrdi podsetnik / engl. hard reminder).

Tek na ovako uređenim podacima se rade statističke analize i računaju željeni statistici.

Kada je u pitanju opisivanje populacije, prvo je potrebno definisati ciljnu popu-laciju, a zatim definisati okvir uzorkovanja takav da omogući nacrt uzorkovanja koji će rezultirati reprezentativnim uzorkom. Dalje, u fazi terenskog rada potrebno je realizo-vati planirani uzorak. Zbog neodgovora nekada će biti potrebne naknadne korekcije u vidu ponderisanja i nadomeštanja nedostajućih podataka kako bi se popravio kvalitet anketnih pokazatelja.

U zavisnosti od aktivnosti koje se sprovode, anketna istraživanja možemo podeliti u faze. U literaturi se može sresti više različitih podela, manje ili više detaljnih. Bler i saradnici (Blair, Czaja, & Blair, 2014) navode sledećih 5 faza:

1. Preliminarni nacrt i planiranje 2. Kreiranje upitnika, pretest i pilot istraživanje

Page 31: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

20

3. Konačni dizajn 4. Izbor uzorka i prikupljanje podataka 5. Kodiranje podataka, konstrukcija datoteke sa podacima, analiza i konačni izve-

štaj

Rej i Parker (Rea & Parker, 2014), s druge strane, anketno istraživanje dele na 11 faza:

1. Identifikovanje problema i metoda istraživanja 2. Utvrđivanje plana i budžeta istraživanja 3. Uspostavljanje informacione baze 4. Utvrđivanje okvira uzorkovanja 5. Određivanje veličine uzorka i nacrta uzorkovanja 6. Kreiranje anketnog instrumenta (upitnika ili intervjua) 7. Pretest instrumenta i pilot istraživanje 8. Izbor i obuka anketara 9. Prikupljanje podataka (anketiranje) 10. Kodiranje i unošenje podataka u računar 11. Analiza podataka i priprema konačnog izveštaja

Faze anketnih istraživanja su ovde prikazane kao razdvojeni koraci, ali u stvar-nosti to nije zaista tako. One se u velikoj meri preklapaju, teku paralelno, a ponekad je potrebno vraćati se na prethodne korake i korigovati donete odluke. Ova preklapanja su najveća, a povratak na prethodne faze najčešći, pre nego što počne samo prikupljanje podataka, pa mislimo da je razumno sve korake koji prethode implementaciji ankete svrstati u jednu fazu, kako to u svojoj podeli čini Meir (Meir, 2006). Takođe, anketna istraživanja se sprovode sa ciljem koji može biti saznajni ili praktičan. U oba slučaja, anketno istraživanje će svoj konačni cilj ostvariti tek kada je izveštaj napisan i predočen onom ko na osnovu njega može da dela. Uzevši sve ovo u obzir, opredelili smo se da aktivnosti u sprovođenju anketnih istraživanja prikažemo prema Meirovoj podeli. Ova podela obuhvata 7 faza:

1. Planiranje i nacrt istraživanja 2. Prikupljanje podataka 3. Unos podataka 4. Priprema i prečišćavanje podataka 5. Analiza 6. Pisanje izveštaja 7. Slanje izveštaja

2.1. Planiranje i nacrt

Pre nego što krene primena ankete na terenu, odnosno prikupljanje podataka, potrebno je pažljivo sprovesti fazu planiranja i nacrta. Najveći troškovi ankete obično

Page 32: Bojan Janičić - digitalna.ff.uns.ac.rs

FAZE ANKETNIH ISTRAŽIVANJA

21

su vezani za fazu prikupljanja podataka. Ako prethodno nije sve dobro isplanirano pri-kupljeni podaci mogu biti u manjoj ili većoj meri neupotrebljivi, a na osnovu njih neće biti moguće ostvariti ciljeve istraživanja, a uložena sredstva i vreme biće protraćeni.

Samu fazu planiranja i nacrta možemo podeliti u više koraka koji se, kao što je već rečeno, ne moraju sprovoditi sukcesivno, već se mogu odvijati simultano, a nekada i iterativno.

Pre svega potrebno je definisati predmet i ciljeve, te kako će se informacije koris-titi, sve vreme imajući u vidu resurse koji istraživaču stoje na raspolaganju. Pod resur-sima o kojima treba voditi računa podrazumevaju se materijalni resursi, vreme kojim raspolažemo, ali i ljudski resursi.

Anketno istraživanje ne mora imati samo jedan predmet istraživanja. Postoje i tzv. omnibus ankete koje uopšte nemaju specifičnu temu (Gideon, 2012). U takvim anketama se za potrebe više naručilaca prikuplja širok spektar podataka.

Svrha istraživanja može biti da se: opiše populacija, dobije povratna informaci-ja od neke grupe (npr. od korisnika neke usluge, potrošača...), saznaju želje i potrebe ljudi, uporede različite grupe, testira neka hipoteza, ispitaju promene koje se dešavaju tokom vremena u stavovima pripadnika populacije, ispitaju promene u načinu poslova-nja kompanija i slično (Blair et al., 2014; Rea & Parker, 2014; Thayer-Hart, Dykema, Elver, Schaeffer, & Stevenson, 2010).

Ako predmet istraživanja nije dovoljno poznat samom istraživaču (npr. radi se o naručenom istraživanju), nekada je potrebno prikupiti relevantne informacije od zainteresovane strane (naručioca) i onih koji su u problem upućeni. Ovo se može učiniti u obliku neformalne diskusije ili upotrebom fokus grupa. Kada je u pitanju nova pojava, nekada može biti neophodno da se obavi prethodno polustrukturisano posmatranje populacije, u kojem obučeni posmatrači sistematski beleže važne podatke (Rea & Par-ker, 2014).

Predmet istraživanja može se definisati na razne načine, nekada uže – nekada šire. U anketnim istraživanjima (a i bilo kojim drugim) istraživač gotovo uvek mora da pravi kompromise. U zavisnosti od resursa i znanja kojima istraživač i njegov tim raspo-lažu, vrlo često će morati da odustane od idealnog cilja i nacrta istraživanja.

Na primer, istraživač može želeti da obavi istraživanje stavova prema abortusu na opštoj popula-ciji primenom ličnog intervjuisanja licem u lice na stratifikovanom slučajnom uzorku. U toj nameri ga može sprečiti kratak vremenski rok, pa se može opredeliti da promeni metod prikupljanja podataka i izabere telefonsku anketu kod koje faza prikupljanja podataka traje kraće. Međutim, ukoliko ne poseduje uređaje i softver potreban za telefonsku anketu i taj plan se može izjaloviti.

Ili, recimo da istraživač ima dovoljno vremena, ali da je ograničavajući faktor novac (što vrlo često jeste). Istraživač se može opredeliti za poštansku anketu koja je jeftinija, ali ukoliko ne poseduje odgovarajući spisak populacije (sa imenima i adresama ispitanika) ni stratifikovano slučajno bira-nje neće biti moguće ili će biti znatno otežano.

Page 33: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

22

Prilikom definisanja ciljeva istraživanja trebalo bi biti što specifičniji. Pri tome potrebno je imati u vidu kakve analize su potrebne, kakvi izveštaji će biti rezultat istra-živanja i za čega će nalazi biti korišćeni.

Ako se anketa sprovodi sa ciljem unapređenja prodaje nekog proizvoda ili usluge, onda bi cilj tre-balo da bude definisan na način koji omogućava što preciznije određivanje činilaca koji će do toga dovesti.

Ukoliko želite da saznate šta će uticati na to da korisnici jednog operatera mobilne telefonije (A) pređu kod drugog operatera (B), nije dovoljno definisati cilj samo tako. Mnogo je bolje definisati specifične ciljeve poput: „Da li će smanjenje cene pretplate uticati na to da korisnici pređu kod operatera B?“, „Da li će se korisnici češće odlučivati da pređu kod operatera B, ako im ovaj ponu-di neograničene minute za razgovor?“, „Da li će se korisnici češće odlučivati da pređu kod opera-tera B, ako im ponudi neograničen internet za određene servise?“, „Da li će se korisnici češće odlučiti da pređu kod operatera B ako im ponudi dva besplatna servisa?“ i tako dalje.

U principu, anketni upitnik ili intervju bi trebalo da budu što kraći, ali takav da prikupi sve potrebne podatke koji će omogućiti ostvarivanje ciljeva ankete.

Specifični ciljevi omogućavaju istraživaču da zna šta sve treba da pita ispitani-ke, odnosno koja pitanja je potrebno da im postavi. Način definisanja ciljeva anketnog istraživanja sličan je određivanju predmeta merenja i njegovoj operacionalizaciji prili-kom konstrukcije psiholoških testova. Razlika je u tome što psihološki test obično ima jedan predmet merenja, dok ih anketa može imati više.

Ako je naučno istraživanje u pitanju, u fazi planiranja bi trebalo definisati i određene hipoteze, odnosno očekivanja koja postoje u vezi sa rezultatima. Neočekivani rezultati, posebno oni koji su u suprotnosti sa hipotezama ili odudaraju od uobičajenih nalaza iz prethodnih sličnih istraživanja, nekada mogu biti signal da postoji greška u sprovođenju ankete.

Već je rečeno da bi prilikom planiranja anketnog istraživanja trebalo voditi računa i o tome kako će se rezultati koristiti. Ako je cilj ankete samo da se stekne neki početni uvid u ispitivanu pojavu ili opiše neka populacija, istraživaču neće biti potrebna ista preciznost kao za istraživanje na osnovu kojeg će biti donošene odluke koje mogu imati značajne finansijske ili posledice druge prirode. Od potrebne preciznosti može dalje zavisiti i veličina uzorka, ali i izbor metode uzorkovanja, a posredno i metode prikupljanja podatka i druge komponente ankete.

Ciljevi anketnog istraživanja mogu se menjati u toku procesa planiranja.

U fazi pripreme, istraživač se opredeljuje i za metod prikupljanja podataka (licem u lice, telefonska anketa, poštanska anketa, internet anketa...). Metod prikuplja-nja podataka zavisiće od ciljeva istraživanja, složenosti podataka koje je potrebno pri-kupiti, vremena raspoloživog za sprovođenje ankete, raspoloživih resursa, ciljne popu-lacije... Ovo je složeno pitanje i biće mu posvećeno posebno poglavlje (7).

Kada smo definisali ciljeve istraživanja, potrebno je utvrditi budžet istraživanja i da li nam on dozvoljava da prikupimo sve željene i potrebne podatke, te da to učinimo

Page 34: Bojan Janičić - digitalna.ff.uns.ac.rs

FAZE ANKETNIH ISTRAŽIVANJA

23

na način koji smo planirali. Dakle, potrebno je utvrditi koliko će istraživanje (kakvo smo planirali) koštati i da li imamo sredstava da ga sprovedemo na planirani način. U sluča-ju da nema dovoljno sredstava, istraživač može pokušati da ih nekako pribavi, ali češće će modifikovati (redukovati) ciljeve ili odabrati jeftiniji metod prikupljanja podataka12. Prilikom definisanja budžeta istraživanja dobro je uvek „predvideti nepredvidivo“, odnosno računati da će postojati nepredviđeni troškovi. Anketno istraživanje (i bilo koje drugo) često će biti skuplje nego što je istraživač planirao.

Slična situacija je i sa vremenskim planom istraživanja. Prilikom planiranja anketnog istraživanja potrebno je definisati koliko će istraživanje trajati i kada će rezul-tati biti dostupni. Dobro je odrediti vremenske okvire (raspored) za svaku od faza istra-živanja, kako bi bilo moguće da se prati napredak i reaguje ako postoji zaostajanje.

Prilikom planiranja vremenskog okvira važno je da istraživač ne vodi računa samo o vremenu pot-rebnom za sprovođenje pojedinih faza istraživanja, već i o datumima kada bi se te faze odigrale. Na primer, nije svejedno da li će faza terenskog rada, odnosno prikupljanja podataka pasti za vreme praznika i kolektivnih godišnjih odmora ili ne. Ukoliko se ovo poklopi odziv može biti uma-njen i zahtevati produženje vremenskog okvira anketnog istraživanja kako bi se taj nedostatak nadomestio.

Vreme potrebno za anketno istraživanje u najvećoj meri zavisi od metoda pri-kupljanja podataka. Neke metode imaju brži povrat podataka13 (licem u lice, telefonske ankete, grupne ankete...), a neke sporiji (poštanske i neke internet ankete). Nakon pri-kupljanja podataka, njih je potrebno učiniti dostupnim računarskoj obradi, prečistiti... Ova faza se značajno može skratiti primenom računarski podržanih metoda.

Vreme potrebno za sprovođenje anketnog istraživanja zavisiće i od toga da li postoji gotov upitnik ili ga je potrebno kreirati. Ako postoji gotov upitnik vreme potre-bno za istraživanje biće znatno kraće. Kreiranje upitnika može se skratiti preradom nekog postojeće sličnog upitnika ili recikliranjem proverenih pitanja iz ranijih upitnika. Kao i kod planiranja budžeta istraživanja, i u planiranju vremenskog okvira istraživanja treba računati na nepredviđena kašnjenja. Istraživanje će često trajati duže nego što je planirano.

Takođe, u fazi pripreme potrebno je definisati ciljnu populaciju. Ciljna populaci-ja je deo populacije o kojem želimo da donosimo zaključke, odnosno populacija na koju želimo da generalizujemo rezultate koje dobijemo istraživanjem na uzorku. Rekli smo da se anketno istraživanje po pravilu sprovodi na uzorku iz razloga ekonomičnosti ili zbog nemogućnosti ispitivanja cele populacije. Od odluke šta je ciljna populacija zavisi-će i druge faze i komponente anketnog istraživanja, poput uzorkovanja, osobina upitni-ka i izbora metode prikupljanja podataka.

12 Najveći troškovi anketnih istraživanja vezani su za prikupljanje i unos poda-

taka (Meir, 2006). 13 Misli se na vreme za koje je potrebno da se prikupe podaci od ispitanika.

Page 35: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

24

Ako istraživač planira da ispita mlađu decu onda mora prilagoditi dužinu upitnika (skratiti ga) poš-to deca teško mogu da održe koncentraciju duže vremena. Pored dužine upitnika mora se prila-goditi i složenost pitanja i rečnik koji se koristi. Od metoda prikupljanja podataka trebalo bi izbe-gavati one koji zahtevaju čitanje, a ni telefonska anketa nije primerena.

S druge strane, ako se radi o starijoj penzionerskoj populaciji, dužina ankete nije problem, ali bi recimo, trebalo izbegavati žargon. Od metoda prikupljanja podataka trebalo bi izbegavati internet ankete i štampane upitnike. Primerenija bi bila anketa licem u lice, kao i u slučaju istraživanja kod dece.

Kod istraživanja populacije zaposlenih u zanimanjima kod kojih se po prirodi posla često putuje i/ili radi po smenama, sam izgled upitnika ne bi trebalo da bude problem, ali od metoda prikup-ljanja podataka bi bile primerenije one koje ispitanicima dozvoljavaju da ih popune kada to oni žele i mogu. Pošto je takve ispitanike teže naći kod kuće, primerene metode bi mogle biti poštan-ska ili internet anketa.

Prilikom određivanja ciljne populacije potrebno je voditi računa i o tome kakvi spiskovi populacije su dostupni i da li se na osnovu njih može obaviti kvalitetno uzorko-vanje. Izbor spiska populacije zavisi i od izbora, odnosno željene metode prikupljanja podataka – i obrnuto. Dostupni spiskovi populacije ograničiće istraživača u izboru metode prikupljanja podataka.

Ako se istraživač odluči za onlajn anketu za koju će pozivi biti poslani elektronskom poštom, mora posedovati spisak koji sadrži ažurne elektronske adrese ispitanika. Ukoliko ne poseduje takav spi-sak populacije, najverovatnije će morati da se opredeli za drugu metodu prikupljanja podataka.

U fazi pripreme i planiranja potrebno je isplanirati i odabrati uzorak. Pre svega, u zavisnosti od ciljeva istraživanja, planirane primene rezultata, varijabilnosti ispitiva-ne pojave i odabranog načina uzorkovanja, potrebno je odrediti i potrebnu veličinu uzorka. Već smo rekli da se za anketna istraživanja ne može jednostavno reći „što veći uzorak – to bolje“. Premali uzorak neće omogućiti dovoljnu preciznost za generalizaciju na populaciju. S druge strane, preveliki uzorak je bacanje para i vremena (a vreme je opet novac).

U većini anketnih istraživanja bitna je cena njegovog sprovođenja. Povećanje veličine uzorka kod većine metoda prikupljanja podataka povećaće troškove ankete (najmanje u internet anketama), a uticaće i na produženje vremena potrebnog za spro-vođenje ankete. Zato je potrebno odrediti optimalnu veličinu uzorka. To je ona veličina uzorka koja je dovoljna da postignemo željenu preciznost odnosno marginu greške uz što manje troškova (videti poglavlje 4.2). Koliko će to zaista biti zavisi pre svega od željene preciznosti rezultata i varijabiliteta ispitivane pojave. Osim ovih činilaca na pot-rebnu veličinu uzorka može uticati i način uzorkovanja (posredno – preko uticaja na varijabilnost distribucije uzorkovanja, odnosno standardnu grešku).

Na primer, za istu veličinu uzorka rezultati će biti precizniji ako je uzorak nastao stratifikovanim slučajnim biranjem, a ne prostim slučajnim biranjem (Fajgelj, 2004). S druge strane, rezultati dobijeni na uzorku nastalom slučajnim klaster biranjem biće manje precizni upravo zbog uticaja ovog načina uzorkovanja na varijabilitet distribucije uzorkovanja.

Page 36: Bojan Janičić - digitalna.ff.uns.ac.rs

FAZE ANKETNIH ISTRAŽIVANJA

25

O određivanju potrebne veličine uzorka biće više reči u poglavlju o uzorkova-nju (poglavlje 4). Na kraju, u ovoj fazi može biti izabran uzorak ili definisana procedura njegovog biranja u fazi terenskog rada.

Bitna odluka koju istraživač mora da donese u pripremnoj fazi anketnog istra-živanja je i odluka o metodu prikupljanja podataka. Metod prikupljanja podataka mora biti prilagođen ciljnoj populaciji, osobinama uzorka, dostupnim okvirima uzorkovanja, karakteristikama upitnika, osetljivosti teme, ali naravno i raspoloživim sredstvima, novcu, vremenu. Ovoj temi je posvećeno posebno poglavlje (poglavlje 7).

Uporedo sa odlukama o načinu uzorkovanja, potrebnoj veličini uzorka i izbo-rom metoda prikupljanja podataka, konstruiše se i anketni upitnik/intervju. Preporuka u vezi sa konstrukcijom upitnika sa kojom se svi slažu je da pitanja moraju biti jasna i nedvosmislena. Ne smeju pitati više stvari odjednom, a moraju biti formulisana tako da ih svi ispitanici (ili bar velika većina) razume na isti način.

Ukoliko želite da ispitujete stavove prema mučenju životinja, ispitanike možete pitati „Da li volite da posećujete svinjokolje?“. Neki ispitanici mogu odgovoriti sa „da“ na ovo pitanje, zato što zaista vole da gledaju nasilje nad životinjama. Drugi mogu odgovoriti sa „da“ zato što vole socijalni aspekt ovih događaja, dok treći mogu odgovoriti na isti način jer cene njegove gastronomske aspekte. Tri grupe ispitanika su isto pitanje razumele na tri načina, a isti odgovori se odnose na tri različite stvari (jedni vole nasilje nad životinjama, drugi da se druže, a treći da jedu).

Ukoliko ispitanici ne razumeju isto pitanje na isti način postoji problem sa nje-govom validnošću. Ono ne meri ono što bi trebalo da meri.

Prilikom organizacije istraživanja, istraživači često osećaju potrebu da pitaju sve što ih zanima. Međutim, postoje mišljenja da dužina upitnika utiče na stopu neod-govora, ali ovakva mišljenja nisu u dovoljnoj meri empirijski potkrepljena (Bogen, 1996). Verovatnije je da dužina anketnog upitnika ima statistički značajan efekat na stopu nekompletnih upitnika i da to zavisi i od metode prikupljanja podataka. Ovaj efekat nije značajan kod onlajn anketa, marginalno je značajan u telefonskim anketama, a značajan je u poštanskim anketama (Bautista, Ghandour, & Croen, 2015; Sahlqvist et al., 2011). Dužina upitnika, osim na odbijanje učešća ili prekidanje popunjavanja anke-te, može uticati i na kvalitet odgovora. Kod dužih upitnika ispitanici pred kraj postaju nepažljivi i manje motivisani, a odgovori na pitanja iz grupa stavki koje imaju istu skalu odgovora imaju manju varijansu (Galesic & Bosnjak, 2009). Kvantitet može ići nauštrb kvaliteta odgovora. Odgovori na pitanja pred kraj predugog upitnika mogu biti manje validni i više govoriti o motivaciji i pažljivosti ispitanika, a manje o predmetu merenja. Ako je potrebno birati između većeg broja nevalidnih i manjeg broja validnih odgovora – izbor se sam nameće. Zaključci na osnovu nevalidnih odgovora biće svakako pogrešni, a njihov veći broj i grešku će činiti većom.

Upitnik nije gotov kada je popunjen pitanjima. Pre primene na uzorku potreb-no je sama pitanja proveriti i ukoliko postoje problemi, bilo na strani ispitanika ili na strani anketara, trebalo bi ih modifikovati. Prvi korak je pretest na manjoj grupi ispita-

Page 37: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

26

nika koji mogu biti i saradnici. Povratne informacije dobijene pretestom mogu ukazati na problematična pitanja (nerazumljiva, dvosmislena, nepotrebna, ona na koje je nemoguće odgovoriti). Nakon eventualnih korekcija potrebno je obaviti pilot istraživa-nje na manjem broju ispitanika (20–50) koji su slični populaciji koju nameravate da ispitujete. U pilot istraživanju se ne proveravaju samo pitanja i upitnik, već i anketari, metodologija prikupljanja podataka... Pilot istraživanje je nekad potrebno ponoviti, ukoliko su izmene na osnovu prvog pilot istraživanja bile značajne. U svakom slučaju, mnogo je bolje i jeftinije ponavljati pilot istraživanja, nego potrošiti sredstva namenjena prikupljanju podataka na upitnik koji neće dati podatke koji su nam potrebni.

Konstrukciji upitnika, kao vrlo značajnoj temi, će takođe biti posvećeno poseb-no poglavlje (poglavlje 6).

U pripremnoj fazi anketnog istraživanja potrebno je izabrati i obučiti anketare ukoliko ih metod prikupljanja podataka predviđa. Za anketare je neophodno da tečno čitaju, imaju odgovarajuće komunikacijske sposobnosti, da su spremni i mogu da rade u različitim smenama, a sve više je potrebno i da se snalaze u radu sa računarima. Veliki plus je ako imaju neka znanja i razumeju metodologiju istraživanja u društvenim nau-kama. U svakom slučaju, anketare je potrebno obučiti i upoznati sa ciljevima istraživa-nja, tehnikom postavljanja pitanja, razjašnjavanja neadekvatnih odgovora, načinom beleženja odgovora i administracijom ankete (videti poglavlje 8).

Čak i ako metod prikupljanja podataka ne predviđa anketare, potrebno je izab-rati i obučiti ljude koji su zaduženi za slanje poziva za anketu i podsetnika elektron-skom ili običnom poštom (ukoliko se radi o ovim modalitetima prikupljanja podataka).

Iz svega prethodno rečenog, lako je zaključiti da je pravilno sprovedena prip-remna faza ključna za uspešno sprovođenje anketnog istraživanja. Ona stvara predus-love za uspešno prikupljanje podataka i njihovu kasniju analizu (ali ih naravno ne garantuje).

2.2. Prikupljanje podataka

Za fazu prikupljanja podataka moglo bi se reći da je najbitnija faza anketnih istraživanja. Doduše, to bi se moglo reći za svaku fazu, ali kako je ova faza često vre-menski i finansijski najzahtevnija, greške napravljene u njoj teško se mogu korigovati. Čak i kada su korekcije moguće, one traju i koštaju.

Zato je bitno postarati se da ova faza protekne što je više moguće u skladu sa planom. Međutim, ako se istraživač može na nešto osloniti, to je činjenica da će u sva-kom anketnom istraživanju biti nepredviđenih i neplaniranih problema. Stoga je jedna od najbitnijih preporuka istraživačima: „Očekujte neočekivano“. U svakom slučaju, pri-likom planiranja faze prikupljanja podataka potrebno je (ili bar dobro) predvideti finansijske i vremenske rezerve za nepredviđene probleme.

Page 38: Bojan Janičić - digitalna.ff.uns.ac.rs

FAZE ANKETNIH ISTRAŽIVANJA

27

To nas vraća na fazu planiranja i nacrta istraživanja. Ukoliko su greške koje se tiču faze prikupljanja podataka napravljene u samoj fazi planiranja (ako su donete pogrešne odluke), korektno sprovođenje planiranog neće ispraviti greške.

Za uspešno obavljanje faze prikupljanja podataka potrebno je obezbediti sva potrebna sredstva i resurse. Ukoliko je planirano da anketa bude sprovedena licem u lice ili kao telefonska anketa sa učešćem anketara, pre započinjanja same faze teren-skog rada potrebno je obezbediti dovoljan broj obučenih anketara koji će omogućiti sprovođenje ankete po željenoj dinamici i u zadatom vremenskom okviru.

Kontrola rada anketara je takođe bitna komponenta koja će obezbediti da faza prikupljana podataka prođe kako treba. Za to je potrebno obezbediti obučene supervi-zore i potrebna tehnička sredstva (videti odeljak 9.3).

Takođe, potrebno je obezbediti sredstva koja će omogućiti anketarima da kon-taktiraju potencijalne ispitanike. To mogu biti finansijska sredstava namenjena putnim troškovima anketara ili oprema za telefonsko anketiranje. Ako je predviđeno računar-ski podržano prikupljanje podataka, potrebno je obezbediti sve hardverske i softverske uslove koji će omogućiti da anketa protekne u skladu sa planom.

Onlajn anketiranje je sve popularnije. Najčešće podrazumeva anketni upitnik postavljen na nekoj web adresi i slanje poziva ispitanicima putem imejla ili eventualno na neki drugi način. Prilikom ovakvih istraživanja potrebno je voditi računa o raznim stvarima. Npr. ukoliko se pozivi na anketu šalju elektronskom poštom valja voditi računa da oni od strane spam filtera ne budu prepoznati kao spam (neželjena pošta) i eliminisani.

Potrebno je imati ljude koji su obučeni za slanje ili nadziranje slanja poziva i podsetnika, proveru odbijenih (engl. bounced) i nepostojećih imejl adresa, proveru odgovora ispitanika...

Osim toga, anketu je potrebno postaviti na server koji će omogućiti da istovremeno veći broj ispi-tanika odgovara na nju, a da to ne izazove njegovo preopterećenje. Sam istraživač može na to uticati slanjem poziva u talasima, a ne odjednom svim ispitanicima.

Ako su obezbeđena potrebna sredstva za sprovođenje faze prikupljanja poda-taka, potrebno je obezbediti i konstantnu kontrolu sprovođenja ankete. Na ovaj način istraživač će znati da li se sve odvija po planu ili ne. Ova kontrola ne podrazumeva samo kontrolu rada anketara već i kontrolu funkcionisanja kompletne metodologije prikup-ljanja podataka, instrumenta, konstantno praćenje stope odgovora (kako na nivou instrumenta tako i na nivou pojedinačnih pitanja)... Na ovaj način istraživač će biti u mogućnosti da reaguje na vreme, pre nego što budu nepovratno utrošena sredstva i vreme koje je imao na raspolaganju. Svim navedenim činiocima biće posvećena pažnja u poglavljima koja se na njih odnose. Ovde ćemo samo reći da posebnu pažnju treba pokloniti neodgovorima (videti poglavlje 8 i odeljak 5.3). Ukoliko su oni sistematski povezani sa predmetom istraživanja mogu dovesti do pristrasnih pokazatelja i samim tim do pogrešnih zaključaka i predviđanja (kao u primeru istraživanja koje je sproveo Literary Digest).

Page 39: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

28

2.3. Unos podataka

U fazi unosa podataka, oni se čine dostupni računarskoj obradi, odnosno pret-varaju se u oblik pogodan za statističku analizu. Ovo se pre svega odnosi na podatke prikupljene klasičnom metodom papir-olovka.

Faza unosa se može učiniti nebitnom, ali na nju treba obratiti pažnju pošto i ona može biti izvor grešaka. Kako bi greške iz ovog izvora bile što manje, preporučuje se da unos rade profesionalci i da se vrši kontrola unosa upotrebom maski za unos i dvostrukim unosom (o tome će biti više reči u odeljku 10.2). Ukoliko se unos vrši bez kontrole, podatke je naknadno potrebno prečistiti.

U ovoj fazi se može obavljati i kodiranje odgovora i zatvaranje pitanja sa otvo-renim odgovorima.

Pre samog unosa, ali i nakon što su podaci uneti, upitnici (protokoli ispitanika) se pregledaju i eliminišu se nepotpuni (oni koje nije moguće ili nije isplativo kompleti-rati).

Unos se može obavljati i računarski podržanim putem, optičkim čitanjem speci-jalno pripremljenih formulara za odgovore.

Ukoliko se anketiranje sprovodi računarski podržanim modalitetom, faza uno-sa podataka, troškovi i greške koje mogu nastati tom prilikom mogu se skoro u potpu-nosti izbeći. U računarski podržanom prikupljanju podataka podaci se beleže u računar u trenutku dok ispitanik odgovara, bilo da odgovore upisuje sam, birajući ponuđene opcije, ili to za njega čini anketar koji je prisutan.

2.4. Uređivanje i ponderisanje podataka

Fazu unosa sledi faza uređivanja i prečišćavanja podataka. U ovoj fazi vrši se kontrola konzistentnosti odgovora, koriguju nemogući ili nedosledni (nekonzistentni) odgovori, a ukoliko ih nije moguće korigovati klasifikuju se kao nedostajući. Upotrebom računarski podržanog prikupljanja podataka konzistentnost odgovora može se kontro-lisati već tokom samog procesa anketiranja. Softver za anketiranje može kontrolisati tok ankete i ispitanicima postavljati samo ona pitanja na koja bi ispitanik trebalo da odgovara (npr. ispitanika koji nema motorno vozilo nećemo pitati koje benzinske stani-ce imaju najbolje gorivo). Takođe, softver može kontrolisati da li ispitanik daje odgovo-re u mogućem rasponu i da li su podaci koje daje odgovarajućeg tipa (brojevi, reči, web adrese...).

U ovoj fazi mogu se izračunavati i izvedeni pokazatelji koji nastaju kao kombi-nacije, kategorizacije, klasifikacije (...) podataka dobijenih od ispitanika. Mogu se raču-nati ukupni ili prosečni skorovi ukoliko u anketi postoje multiajtemske mere.

Takođe, u ovom koraku može se raditi i ujednačavanje skala na kojima su pro-cenjivani različiti objekti u anketi kako bismo postigli njihovu uporedivost (Meir, 2006).

Page 40: Bojan Janičić - digitalna.ff.uns.ac.rs

FAZE ANKETNIH ISTRAŽIVANJA

29

U ovoj fazi podaci se mogu transformisati i ukoliko je to potrebno – ponderisati. Takođe, u ovom koraku mogu se nadomeštati nedostajući podaci. Više o svim ovim postupcima u poglavlju 9.4.1.

2.5. Analiza

Moglo bi se reći da celokupno anketno istraživanje vodi ka ovoj fazi. Nakon što smo prikupili i prečistili podatke sledi njihova analiza. Ona nam omogućava da na osno-vu podataka izvedemo zaključke i donesemo informisane odluke.

Statističke analize uobičajeno obuhvataju deskriptivne pokazatelje koji se tiču distribucije, ukupnog broja, procenata, mera centralne tendencije, raspršenja i intervala poverenja14. Iako se deskriptivni pokazatelji često smatraju „manje vrednim“, mora im se ukazati dužna pažnja. Pokazatelji distribucije, osim što nam govore o osobinama posmatrane populacije, omogućavaju da se upoznamo sa podacima i da odlučimo koje još statističke modele možemo primeniti i da li je potrebno pre toga transformisati podatke.

Osim deskriptivnih mogu se koristiti metode inferencijalne statistike, odnosno analize koje omogućavaju utvrđivanje povezanosti među varijablama, razlika među grupama, predviđanja ishoda itd.

Sama analiza podataka, ako se obavlja temeljno, može biti vremenski zahtevna. Za njeno sprovođenje potrebno je odabrati softver koji je fleksibilan i omogućava bele-ženje sprovedenih analiza i njihovo ponavljanje. Poželjno je da statistički softver ima nešto što se, recimo, u R-u zove „istorija“ („history“) ili u IBM SPSS Statistics (SPSS) „dnevnik“ („journal“). U istoriji i dnevniku beleže se izvršene statističke analize sa svim zadatim parametrima. Obavljene analize beleže se u vidu tekstualnih komandi (sintak-se), pa ih je moguće ponoviti u svakom trenutku na istim, dopunjenim, ili izmenjenim podacima (npr. na uzorku iz pilot istraživanja i na konačnom uzorku). Takođe, moguće je analize korigovati i ponoviti u izmenjenom obliku. Čak i ako nemamo nameru da analizu ponavljamo, na ovaj način nam ostaje trag o izvršenim analizama i njihovim parametrima.

Statističko okruženje R (R Core Team, 2019) je upravo i namenjeno za rad iz komandne linije. Analitičar piše skript analize koji se naknadno izvršava. Iako se možda čini lakšim kliktati na menije i „dugmiće“, rad iz komandne linije je zapravo brži i fleksi-bilniji. Čak i u SPSS-u, koji je pre svega namenjen za rad kroz grafički korisnički interfejs (GUI), neke opcije analiza dostupne su samo kroz sintaksu. Ne postoji prepreka da u SPSS-u celu analizu obavite kroz pisanje sintakse.

14 Kasnije ćete saznati da širina polovine intervala poverenja predstavlja čuve-

nu marginu greške, koja se često pominje u izveštajima o istraživanjima, naročito onim politikološkim, i najčešće u jeku izbornih kampanja. Ovo je bio spojler. ;)

Page 41: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

30

2.6. Pisanje izveštaja o rezultatima

Pisanje izveštaja je faza koja se nastavlja na fazu analize podataka. Nalaze do kojih smo došli u prethodnoj fazi potrebno je na razumljiv i pristupačan način predočiti krajnjem korisniku informacija. Izveštaj treba prilagoditi onome kome je namenjen. Ako krajnji korisnik nalaza poseduje zavidno znanje iz statistike i metodologije, moguće je izveštaj napisati koristeći stručnu i tehničku terminologiju. Međutim, to najčešće nije slučaj i u izveštaju je obično potrebno krajnjem korisniku objasniti šta znače konkretni brojevi, procenti, proseci, variranja, intervali poverenja, razlike i sl. Objašnjenja moraju biti prilagođena onome koji treba da postupa na osnovu nalaza.

Izveštaj o istraživanju obično ima formu koja je u velikoj meri slična bilo kom drugom naučnom izveštaju. Potrebno je objasniti kontekst i razloge za sprovođenje istraživanja, detaljno opisati korišćenu metodologiju (ciljnu populaciju, uzorak, instru-mente, način prikupljanja i analize podataka), rezultate i zaključke koji se iz njih mogu izvesti. Takođe, potrebno je navesti eventualne manjkavosti i ograničenja istraživanja.

Izveštaji, odnosno rezultati anketnih istraživanja, mogu imati i format baza podataka. Baze podataka su pogodne jer koristeći njih svaki potencijalni korisnik može dobiti interaktivni izveštaj, odnosno izveštaj prilagođen njegovim potrebama.

Više o pisanju izveštaja u poglavlju 11.

2.7. Slanje izveštaja (diseminacija)

Kada je izveštaj gotov, potrebno ga je objaviti ili dostaviti krajnjem korisniku, odnosno onome ko je izveštaj naručio i/ili onome ko na osnovu njega može delovati. Ukoliko istraživač to ne uradi, onda samo istraživanje nema previše smisla i predstavlja gubitak novca i resursa15.

Nekada onaj ko je naručio izveštaj i onaj ko na osnovu njega može delovati ne moraju biti isti entiteti. Npr. naručilac izveštaja može biti neka nevladina organizacija, dok na osnovu izveštaja može delovati i vlada, ali i drugi činioci društva.

Izveštaje istraživanja potrebno je učiniti dostupnim i vidljivim svim potencijal-nim korisnicima (naravno ako se to ne kosi sa pravima naručioca – ukoliko on postoji).

15 Možda je ovo prejako rečeno pošto saznanja koja na osnovu istraživanja ste-

kne istraživač svakako nešto vrede.

Page 42: Bojan Janičić - digitalna.ff.uns.ac.rs

POPULACIJA I UZORAK

31

3. Populacija i uzorak

Već je nekoliko puta rečeno da se anketna istraživanja po pravilu obavljaju na uzorku, a ne na populaciji. Iako su istraživanja na populaciji moguća, ona su najčešće neekonomična i teško sprovodljiva.

Anketna istraživanja su namenjena istraživanju konačnih populacija i njihova metodologija je namenjena i prilagođena tom cilju. Zato istraživači koji se bave ovakvim tipom istraživanja insistiraju na eksplicitnoj definiciji populacije koja je predmet istra-živanja (Groves, 2009).

Kada čujemo termin „populacija“ obično pomislimo na celokupno stanovništvo planete Zemlje, na stanovništvo neke države, sve jedinke određene životinjske vrste na nekom području... Među-tim, populacija koja zanima istraživača može biti mnogo manja. Na primer, populacija zaposlenih u (nekoj imaginarnoj) oglednoj osnovnoj školi „Narodni heroj Bojan Janičić – Suri“ bila bi vrlo mala i lako dostupna. Ukoliko bi nekoga zanimalo samo mišljenje zaposlenih ove škole o rukovo-đenju baš tom školom lako bi mogao ispitati sve članove populacije i izračunati parametre. U ova-kvim i sličnim slučajevima nije potrebno raditi istraživanje na uzorku i na osnovu tako dobijenih statistika procenjivati parametre. Međutim, u velikom broju slučajeva populacije nisu tako male i istraživač je prinuđen da na osnovu merenja obavljenih na uzorku generalizuje zaključke na popu-laciju iz koje je taj uzorak izvučen.

3.1. Populacija

Populacija je skup svih entiteta o kojima želimo da zaključujemo. Naziva se još i osnovni skup ili statistička masa (Fajgelj, 2004). Osnovne jedinice populacije nazivaju se elementi populacije ili članovi populacije, a sama populacija predstavlja skup svih elemenata, odnosno članova (Fajgelj, 2004; Groves, 2009).

Kada se govori o populaciji najčešće se misli na osobe, odnosno pojedince, ali u anketnim istraživanjima postoje i populacije druge vrste. Kao što je već ranije napome-nuto, populacije se mogu sastojati od različitih članova: ljudi, domaćinstava, ustanova, preduzeća, organizacija, geografskih celina, ali i od odnosa, dâna, stvari ili događaja (poput kupovine automobila, poseta tržnom centru, putovanja i slično). U jednom anke-tnom istraživanju možemo imati i više različitih tipova elemenata. Na primer, u istraži-vanju zapošljivosti diplomiranih studenata osnovni elementi istraživanja (ili jedinice istraživanja) su diplomirani studenti, ali istovremeno to mogu biti i fakulteti i univerzi-

Page 43: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

32

teti na kojima su oni diplomirali.

Populacije u anketnim istraživanjima su grupe (skupovi) entiteta na koje želi-mo da generalizujemo zaključke istraživanja. Ovako definisana populacija naziva se ciljna populacija (Groves, 2011). Međutim, da bi generalizacija bila moguća, populaciju je potrebno ograničiti prostorno i/ili vremenski, odnosno, ona mora biti konačna (bar teorijski prebrojiva) i mora biti takva da joj se može pristupiti.

Kada bismo želeli da ispitamo stav punoletnih stanovnika Republike Srbije prema upotrebi pame-tnih telefona, ciljnu populaciju bi predstavljali svi punoletni stanovnici RS. Ovako definisana popu-lacija nije dovoljno specifikovana. Na primer, nije definisano da li se to odnosi na sve punoletne stanovnike RS ili samo one koji žive u domaćinstvima (za razliku od onih koji su u tom trenutku u institucijama poput zatvora, domova za stare, bolnica). U trenutku planiranja istraživanja, ciljnu populaciju bi činili oni koji su u toj vremenskoj tački punoletni. Sa protokom vremena, neki od starijih članova populacije će verovatno umreti, a neki koji su bili maloletni postaće punoletni i legitimni članovi ciljne populacije. S obzirom da je očekivano da mlađi ispitanici (oni koji su ranije došli u kontakt sa ovom tehnologijom) imaju pozitivnije stavove prema pametnim telefonima, nalazi istraživanja dobijeni u jednoj vremenskoj tački ne bi se adekvatno mogli generalizovati na ciljnu populaciju iz druge vremenske tačke. Protokom vremena bitne karakteristike ove populaci-je su se promenile i stoga je ovu populaciju potrebno i vremenski ograničiti kako bi generalizacije bile ispravne.

Analogno tome, ukoliko ne možemo pristupiti svim članovima neke populacije i ne postoji šansa da jedan deo te populacije bude ispitan, onda o tom delu populacije ne možemo ni zaključivati. Generalizacije na osnovu nalaza istraživanja mogu biti ispravne samo ako generalizujemo na populaciju bez onog dela kojem nismo mogli pristupiti. Ako je deo populacije kojem ne možemo pristupiti, recimo, prostorno homogen, onda ciljnu populaciju moramo prostorno ograničiti.

Vremenskim i/ili prostornim ograničavanjem populacije činimo je konačnom. Ovakva populacija ima konačan broj članova (Fajgelj, 2004). Ciljna populacija je konač-na populacija (Groves, 2009).

Punoletno stanovništvo neke države nije konačna populacija upravo zbog onoga što je navedeno u prethodnom primeru. Neki članovi populacije umiru, neki postaju punoletni, neki se iseljavaju iz države, neki se useljavaju, država gubi ili dobija teritorije... Ukoliko se vremenski ne ograniči, ova populacija je beskonačna.

Iz ciljne populacije se isključuju ispitanici koji ne mogu biti kontaktirani (na primer, u anketi domaćinstava unutar neke države to su osobe koje žive u inostranstvu ili se nalaze u nekim institucijama, poput bolnica, staračkih domova, kasarni...).

Na ovom mestu potrebno je napraviti i razliku između teorijske i dostupne populacije. Naime, istraživač neće uvek biti u stanju da pristupi svim članovima neke populacije. Iako istraživač može imati jasnu zamisao koji elementi čine ciljnu populaci-ju, neki od elemenata ciljne populacije neće se nalaziti na spisku populacije i neće moći biti izabrani u uzorak.

Recimo da želimo da ispitamo stavove kriminalaca prema upotrebi vatrenog oružja. U ovom slu-čaju kao spisak populacije mogli bismo koristiti neki spisak osuđivanih kriminalaca, ali teško bis-mo mogli doći do onih neosuđivanih čije bi nam mišljenje takođe bilo značajno. U ovom slučaju

Page 44: Bojan Janičić - digitalna.ff.uns.ac.rs

POPULACIJA I UZORAK

33

skup svih kriminalaca bi činio teorijsku populaciju, a dostupnu populaciju samo oni kriminalci koji se nalaze na spisku populacije.

Dostupna populacija16 predstavlja skup članova populacije koji mogu biti iza-brani u uzorak upotrebom određenog okvira uzorkovanja, odnosno spiska populacije. Ovakva populacija se naziva još i praktičnom ili operacionalizovanom populacijom (Fajgelj, 2004; Gideon, 2012).

Pre samog procesa uzorkovanja potrebno je prečistiti okvir uzorkovanja, kako bi iz njega bili izbačeni članovi koji ne pripadaju populaciji o kojoj želimo da zaključu-jemo. Ovakve jedinice nazivamo nelegitimnim jedinicama.

Na primer, ako koristimo telefonski imenik kao spisak populacije u cilju uzorkovanja domaćinsta-va, iz njega bi trebalo eliminisati telefonske brojeve koji pripadaju preduzećima, organizacijama i slično.

U ovoj fazi moguće je iz okvira uzorkovanja odstraniti i delove populacije do kojih neće biti moguće doći zbog objektivnih okolnosti poput elementarnih nepogoda, ratnih dešavanja i slično.

Moguće je da, i pored prečišćavanja spiska populacije, u njemu ostanu nelegi-timni članovi. Ukoliko je to slučaj i ukoliko ih je moguće uočiti nakon uzorkovanja, pot-rebno je odstraniti takve jedinice iz uzorka. Tek nakon toga se pristupa prikupljanju podataka. Oni članovi koji odgovore na anketu definišu anketnu populaciju.

3.1.1. Retke i skrivene populacije

Termin retka populacija ima više značenja. Pod retkim populacijama mogu se smatrati one populacije koje imaju mali apsolutan broj članova. Drugo značenje se odnosi na male subpopulacije, odnosno mali broj članova neke veće populacije koji ispoljava osobinu koja nas zanima. Primer za ovo značenje bi bila deca rođena sa albini-zmom. Treće značenje se odnosi na populacije čiji broj elemenata nije mali, ali je skri-ven, pa ove populacije samo izgledaju malobrojne jer možemo uočiti samo mali broj članova. Primer ovakve populacije je populacija kriminalaca. Četvrto značenje se odnosi na populacije koje ne moraju nužno biti male, niti (sub)populacija mora biti mala u odnosu na populaciju kojoj pripada. U ovom slučaju radi se o populacijama koje su pro-storno ili na neki drugi način koncentrisane, pa je broj jedinica uzorkovanja koje ih sadrže mali (Pfeffermann & Rao, 2010).

Retke (sub)populacije se mogu definisati i preko njihovog udela u opštoj popu-laciji. S obzirom na to, možemo govoriti o: većim populacijama (engl. major populati-ons) sa udelom većim od 10%, manjim populacijama (engl. minor) sa udelom 1–10%, mini populacijama sa udelom 0,1–1%, i retkim tipovima (engl. rare types) sa udelom

16 U engleskom jeziku koristi se i termin frame population (populacija okvira

uzorkovanja)

Page 45: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

34

manjim od 0,1%. Procene dobijene na većim populacijama su uglavnom pouzdane, a da bismo to ostvarili na manjim populacijama potrebni su posebni načini uzorkovanja. Za pouzdane procene na mini populacijama potrebno je koristiti statističko modelovanje, a kada su u pitanju retki tipovi, modeli uzorkovanja koji se koriste u anketnim istraživa-njima u najvećem broju slučajeva nisu adekvatni (Kalton, 2009).

Retke (sub)populacije se mogu definisati i preko odnosa njihove proporcije u opštoj populaciji i njihove pristupačnosti (engl. reachability). Ukoliko je proporcija neke (sub)populacije dovoljna, a populacija pristupačna, ovakva populacija se naziva dovoljnom populacijom (engl. sufficient population). U slučaju da (sub)populacija ima dovoljnu proporciju, ali nije pristupačna, radi se o skrivenoj populaciji (engl. hidden population). Kada govorimo o (sub)populacijama koje predstavljaju malu proporciju opšte populacije, nepristupačne populacije se nazivaju malim skrivenim populacijama (engl. small hidden population). One pristupačne nazivaju se retkim populacijama (engl. rare population) (Spreen, 1992). Bitna razlika između skrivenih i retkih populaci-ja je u osobini koja je predmet istraživanja (odnosno u osobini koja je definiše). Kod skrivenih populacija ta osobina (ukoliko bi bila javna) predstavlja pretnju za člana populacije, kod retkih ne. Dve su osnovne karakteristike skrivene populacije: 1) obično ne postoji spisak populacije (okvir uzorkovanja) pa nije poznata ni veličina populaci-je, i 2) pripadnici ove populacije su obično zabrinuti zbog privatnosti pošto bi ih otkri-vanje pripadnosti takvoj populaciji moglo stigmatizovati ili inkriminisati (Heckathorn, 1997).

Kada bismo se odlučili da sprovedemo istraživanje kriminalaca, vrlo je verovatno da bi se ova populacija pokazala skrivenom. Međutim, kada bismo hteli da sprovedemo istraživanje uspešnih niskoobrazovanih (kontraverznih) biznismena koji voze skupa kola i vole debeo zlatan nakit, ova populacija bi mogla biti retka, ali ne i nužno skrivena.

Osim toga, skrivene i retke populacije razlikuju se i po kooperativnosti. Članovi skrivenih populacija manje su kooperativni, češće odbijaju odgovaranje i manje su iskreni kako ne bi inkriminisali sebe.

U anketnim istraživanjima možemo se susresti sa dva tipa problema u vezi sa retkim populacijama. Prvi je situacija kada želimo da procenimo njihovu veličinu (N), gustinu (učestalost u okviru prostorne jedinice), ili proporciju javljanja u okviru opšte populacije. Upotrebom probabilističkog uzorkovanja ovakve populacije često umeju da budu podreprezentovane, odnosno da njihov udeo u uzorku bude manji nego u popula-ciji. Samim tim i procene parametara neće biti adekvatne. Druga vrsta problema se javlja kada želimo da procenimo karakteristike tih retkih populacija. Čak i kada retke populacije nisu podreprezentovane, broj jedinica iz ovakvih populacija izabranih u uzorak često nije dovoljan za pouzdane procene i ozbiljnije analize, pa ih je nužno ili nadreprezentovati ili se ukupan uzorak mora dovoljno uvećati kako bi i pripadnici ret-ke populacije bili zastupljeni u dovoljno velikom broju.

Oba problema mogu se rešiti uvećanjem ukupnog uzorka. Druga vrsta proble-

Page 46: Bojan Janičić - digitalna.ff.uns.ac.rs

POPULACIJA I UZORAK

35

ma ekonomičnije se može rešiti nadreprezentovanjem retke populacije ili eventualno primenom egzaktnih testova, odnosno reuzorkovanja (engl. resampling, bootstrapping) u fazi obrade podataka (Fajgelj, 2004; Pfeffermann & Rao, 2010).

Kao što je rečeno, da bismo u konačnom uzorku imali željeni broj pripadnika neke retke populacije, veličinu ukupnog uzorka bismo morali prilagoditi tome. Ukoliko kao način uzorkovanja koristimo prosto slučajno biranje17 (videti kasnije) uz skrining (engl. screening)18, a željeni broj pripadnika retke populacije označimo sa nr i njihovu proporciju u opštoj populaciji sa pr, potrebnu veličinu uzorka možemo izračunati na sledeći način (Pfeffermann & Rao, 2010):

𝑛𝑛𝑡𝑡𝑡𝑡𝑡𝑡 = 𝑛𝑛𝑟𝑟/𝑝𝑝𝑟𝑟 [ 1 ]

Na primer, ukoliko želimo da u uzorku imamo 100 pripadnika subpopulacije koja je u opštoj popu-laciji zastupljena sa 9% (pr=0,09), koristeći okvir uzorkovanja za opštu populaciju i prosto slučajno biranje bilo bi potrebno da ukupan uzorak bude ntot=nr/pr=100/0,09=1111.

Ukoliko bismo želeli prethodno da uračunamo stopu neodgovora od 30% (proporciju neodgovora označićemo sa pno=0,3), kako bismo pokušali da obezbedimo da dobijemo 100 odgovora od pri-padnika retke populacije, prethodno bismo mogli uračunati korekciju za neodgovore. Korekcija se računa na sličan način: nrkor=nr/(1-pno)=100/(1-0,3)=100/0,7=143. Dakle, da bi 100 pripadnika ret-ke populacije odgovorilo na anketu, sa stopom neodgovora od 0,3, potrebno je da u uzorku bude 143 ispitanika iz te populacije.

To znači da bismo u formuli [ 1 ] nr morali zameniti sa nrkor pa bi onda potrebna veličina ukupnog uzorka bila ntot=nrkor/pr=143/0,09=1589.

Više o strategijama uzorkovanja retkih populacija možete videti u Feferman i Rao (Pfeffermann & Rao, 2010).

Ukoliko želimo da nadreprezentujemo pripadnike retke populacije biće nam potreban poseban okvir uzorkovanja za populaciju od interesa. Ne treba ni naglašavati da bi i ovaj uzorak trebalo da bude reprezentativan (po načinu biranja i po veličini) za populaciju na koju se odnosi. Osim toga, ukoliko smo nadreprezentovali neku subpopu-laciju kako bismo za nju mogli izračunati pouzdane pokazatelje, prilikom računanja pokazatelja za ukupnu populaciju potrebno je ponderisati odgovore članova nadrepre-zentovane populacije tako da im umanjimo značaj. Na primer, ako je neka subpopulaci-ja nadreprezentovana tako da je njena proporcija u uzorku dva puta veća nego u popu-laciji, odgovore njenih članova bi trebalo ponderisati sa 0,5 (1/2=0,5). Ukoliko je sub-populacija nadreprezentovana 4 puta, onda bi ponder trebalo da iznosi 0,25 (1/4). Više o ponderisanju možete videti u poglavlju 9.4.1, a posebno u odeljku 10.4.

17 Prosto slučajno biranje nije pogodno za istraživanja koja imaju za cilj utvrđi-

vanje parametara retkih populacija zbog toga što će takvi uzorci imati nijednog ili mali broj članova ovakvih populacija (Pfeffermann & Rao, 2010).

18 Prilikom skrininga proveravamo da li su izabrane legitimne jedinice.

Page 47: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

36

3.2. Uzorak

Uzorak predstavlja skup članova ciljne populacije (tačnije – dostupne populaci-je) na kojima se obavlja istraživanje. S obzirom da obično želimo da na osnovu uzorka zaključujemo o populaciji iz koje je uzorak izvučen, bitno je da on bude reprezentativan za ciljnu populaciju. Reprezentativnost uzorka obezbeđuje se njegovom veličinom i načinom biranja (Fajgelj, 2004). Najbolji način biranja članova populacije u uzorak iz perspektive reprezentativnosti je slučajno, odnosno probabilističko biranje.

Da bi slučajno biranje bilo moguće potreban nam je odgovarajući spisak popu-lacije. Ako je taj spisak manjkav (kao u ranijem primeru sa anketom kriminalaca) onda ni uzorak neće valjati bez obzira što smo članove populacije birali slučajno.

Ako na osnovu spiska populacije iz primera o anketi kriminalaca (primer za teorijsku i dostupnu populaciju) u vezi sa upotrebom vatrenog oružja izaberemo slučajan uzorak kriminalaca, u tom uzorku se neće naći oni koji nisu osuđivani. Koliko god puta ponovili uzorkovanje na tom okviru uzorkovanja to se neće desiti jer neosuđivanih nema na spisku. Kriminalac neće biti osuđivan zato što nije uhvaćen u krivičnom delu (što znači da dobro radi svoj posao), ne ostavlja svedoke ili zato što je vrlo uspešan pa može da plati dobru odbranu. Ukoliko je predmet istraživanja ankete pove-zan sa uspešnošću kriminalaca, ovaj uzorak neće biti reprezentativan iako je biran metodom slu-čajnog biranja i ima dovoljnu veličinu.

Prilikom formiranja uzorka potrebno je voditi računa o potrebnoj veličini, pro-cedurama biranja članova, stratifikaciji, načinu izračunavanja standardnih grešaka (Fajgelj, 2004). Svi ovi činioci koji su deo plana uzorka međusobno su zavisni. Kada formiramo uzorak za neko anketno istraživanje obično polazimo od željene preciznosti rezultata (odnosno standardne greške, polovine intervala poverenja ili margine greš-ke) i od jedinica uzorkovanja. Od varijabilnosti posmatrane pojave i željene preciznosti zavisiće potrebna veličina uzorka. Međutim, preciznost će zavisiti i od toga da li je uzo-rak stratifikovan ili ne, da li se radi o klaster uzorkovanju ili ne... Drugim rečima, zavisi-će od jedinica uzorkovanja.

3.2.1. Jedinice uzorkovanja, jedinice posmatranja, jedinice analize

Jedinice uzorkovanja su članovi populacije koje biramo u procesu uzorkovanja i u zavisnosti od vrste populacije to mogu biti osobe, grupe, organizacije, preduzeća, stvari, događaji itd.

Jedinice posmatranja ili jedinice istraživanja su članovi populacije od kojih prikupljamo potrebne podatke.

Vrlo često se jedinice uzorkovanja i jedinice posmatranja poklapaju, ali ne mora-ju nužno biti iste. Takav je slučaj kada se koristi višefazno (višeetapno) uzorkovanje, ali ne samo tada. Detalje o višefaznom uzorkovanju možete naći u istoimenom odeljku (4.4).

Page 48: Bojan Janičić - digitalna.ff.uns.ac.rs

POPULACIJA I UZORAK

37

Jedinice uzorkovanja i jedinice posmatranja mogu se razlikovati i kada nemamo višefazno uzorko-vanje. Ukoliko ispitujemo potrošačke navike kupaca u nekom tržnom centru, jedinice uzorkovanja mogu biti događaji, recimo, svaka stota kupovina (ostvarena u tom tržnom centru u toku dve nedelje). U ovom slučaju jedinice uzorkovanja su kupovine, a jedinice istraživanja su kupci koji su učestvovali u tim događajima, pošto ćemo od njih prikupljati podatke.

Jedinice analize su entiteti za koje izračunavamo statističke pokazatelje. One se mogu razlikovati od jedinica uzorkovanja i jedinica posmatranja (Trochim, 2006). Bez obzira što smo podatke prikupili intervjuišući pojedince, ako je naš primarni interes neka grupa kojoj pojedinac pripada, onda će jedinica analize biti ta grupa, a ne pojedi-nac.

Ukoliko u ispitivanju domaćinstava pitamo koliko novca domaćinstvo godišnje potroši na letova-nje i kao rezultat prikažemo prosečnu potrošnju po domaćinstvu, onda je jedinica analize doma-ćinstvo. Međutim, ukoliko analiziramo koliko se seoska i gradska domaćinstva razlikuju po toj sumi, onda su nam jedinice analize tipovi naselja (selo – grad).

Pre samog uzorkovanja potrebno je definisati jedinicu uzorkovanja. Definicija jedinice uzorkovanja mora biti takva da jasno odredi koje su jedinice legitimne, a koje ne. Legitimne jedinice su one koje želimo da uključimo u istraživanje, odnosno predsta-vljaju deo ciljne populacije.

Jedinice uzorkovanja možemo definisati kao: „punoletne osobe koje žive u domaćinstvima u Republici Srbiji“. U tom slučaju nelegitimne jedinice bile bi sve osobe mlađe od 18 godina, ili one koje su navršile 18 godina ali se u vreme sprovođenja ankete nalaze u ustanovama (bolnica, zat-vor...) ili su van države. Ako se definiše na ovaj način, nije bitno da li je osoba državljanin RS ili ne.

Ako su jedinice uzorkovanja domaćinstva ili nam definicija jedinice uzorkovanja uključuje termin „domaćinstvo“, trebalo bi definisati šta je to. Domaćinstvo možemo definisati kao „sve osobe koje nastanjuju stambenu jedinicu i zajednički troše svoje prihode“.

U prethodnoj definiciji sve deluje potpuno jasno, međutim da li je baš potpuno jasno šta je to stambena jedinica? Ona bi se mogla definisati kao „kuća, stan, pokretna kuća, soba, grupa soba koje su nastanjene ili namenjene stanovanju kao odvojene stambene celine, odnosno čine jedins-tvenu upotrebnu celinu koja obezbeđuje uslove za življenje i boravak u njemu“.

Iako smo možda pri pomenu stambene jedinice imali u vidu kuću, stan ili sobu, na terenu bismo mogli naići i na druge pojavne oblike stambenih jedinica, ali bitne karakteristike stambenih jedini-ca su da su namenjene stanovanju (dakle nisu magacini, garaže i sl.), te da se radi o odvojenim stambenim celinama.

Pod odvojenim stambenim celinama podrazumevaju se one u kojima stanari žive i jedu odvojeno od drugih osoba koje nastanjuju građevinu i imaju pristup stambenoj celini bilo direktno ili kroz zajednički hodnik (dakle, tu ne spadaju kolektivni centri, poput izbegličkih, kasarne, bolnice...).

Kada kažemo da stanari žive, jedu, imaju pristup, postavlja se pitanje: Ko su stanari? Njih može-mo definisati kao jednu osobu ili porodicu, ili više porodica, ili grupu osoba koje su povezane ili ne rodbinskim odnosima, a koje žive zajedno. Ovde, međutim, nije definisano da li osobe imaju pri-javljeno prebivalište na adresi ili ne. Možemo razlikovati stanare de facto i de iure. De iure stanari su samo oni koji imaju prijavljeno prebivalište na određenoj adresi (stambenoj jedinici...). De fac-

Page 49: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

38

to stanari su one osobe koje zaista žive na određenoj adresi, bez obzira da li su na njoj prijavljeni ili ne. Za koju god od ove dve definicije se istraživač odluči, bitno je da bude dosledan.

Dakle, punoletne osobe koje su predmet ovog anketnog istraživanja, pored svog punoletstva moraju za vreme obavljanja istraživanja živeti u okviru domaćinstva u RS, bez obzira da li su državljani ili ne. Pri tome, domaćinstvo je definisano kao skup svih osoba koje nastanjuju stambe-nu jedinicu (odvojenu stambenu celinu namenjenu stanovanju) i zajedno troše svoje prihode.

Kao što je već rečeno, uzorkovanje se vrši prema planu uzorka koji obuhvata veličinu uzorka, procedure biranja, nacrt uzorkovanja i sl. Da bi uzorkovanje (pre svega probabilističko) uopšte bilo moguće, potrebno je da postoji neki spisak populacije ili okvir uzorkovanja.

3.2.2. Okvir uzorkovanja (spisak populacije)

Spisak populacije ili kako se još naziva okvir uzorkovanja (engl. sampling frame) predstavlja niz koraka koji od ciljne populacije dovode do uzorka. On nekada može biti spisak ili više spiskova elemenata ciljne populacije, koji nam služe za identifi-kovanje jedinica istraživanja, a nekada može biti procedura poput slučajnog biranja telefonskih brojeva (engl. Random Digit Dialing – RDD) ili zonskog slučajnog uzorkova-nja (De Leeuw et al., 2008).

Okvir uzorkovanja je skup materijala ili procedura koji služi za identifikovanje i kontaktiranje jedinica istraživanja. Upravo zbog činjenice da spisak populacije nekada uopšte ne mora imati formu pravog spiska, termin okvir uzorkovanja čini se boljim. Drugi razlog zbog kojeg se termin okvir uzorkovanja čini boljim je i taj što se jedinice uzorkovanja i jedinice istraživanja ne moraju nužno poklapati.

Na primer, prilikom istraživanja kupovine novih automobila jedinice uzorkovanja mogu biti saloni automobila (okvir uzorkovanja bi mogla biti lista svih prodajnih salona automobila), a jedinice istraživanja (događaji) kupovine.

Kada se radi o spiskovima u užem smislu, to mogu biti spiskovi članova odre-đenih organizacija i udruženja, spisak stanovnika grada, spisak preduzeća u nekoj drža-vi... Mogu biti manje ili više kompletni. Da bi se mogli koristiti za probabilističko uzor-kovanje, moraju obezbediti da svaki element populacije ima neku, nenultu verovatnoću da bude izabran u uzorak. Takođe, kada govorimo o spiskovima na kojima se nalaze pojedinci, ustanove, organizacije, preduzeća i slično, da bi se oni mogli koristiti kao okviri uzorkovanja potrebno je da pored identifikacije (ime/naziv) člana populacije postoji i njegova ažurna kontakt informacija. Ako takva informacija ne postoji (ili ju je nemoguće nabaviti), onda jedinice uzorkovanja za koje odgovarajuća informacija ne postoji neće moći da budu kontaktirane, što je u velikoj meri slično kao da se član i ne nalazi na spisku. Ako se u uzorku nađe jedinica za koju u okviru uzorkovanja nemamo kontakt informacije i ne možemo ih pribaviti, to će rezultirati smanjenjem veličine rea-lizovanog uzorka.

Dostupne kontakt informacije mogu uticati na izbor modaliteta prikupljanja

Page 50: Bojan Janičić - digitalna.ff.uns.ac.rs

POPULACIJA I UZORAK

39

podataka. Ukoliko u spisku populacije imamo adrese stanovanja, ali ne i brojeve telefo-na i imejl adrese članova populacije, onda u obzir ne dolazi telefonska anketa. Internet anketa bi bila izvodljiva tako što bi ispitanicima mogao klasičnom poštom biti poslat link na onlajn anketu, ali to bi znatno povećalo troškove ankete u odnosu na situaciju kada bi nam u spisku odmah bile dostupne ažurne imejl adrese. U ovom slučaju mogli bismo sprovesti anketu licem u lice, poštansku anketu ili anketu sa ličnim dostavlja-njem upitnika.

Ukoliko, s druge strane, u spisku (pored imena) imamo samo telefonske broje-ve članova populacije, najverovatnije bismo se odlučili za telefonsku anketu. Takođe, mogli bismo se opredeliti da telefonskim putem saznamo druge potrebne podatke pa da anketu realizujemo licem u lice ili onlajn. Naravno, drugu opciju je ekonomičnije spro-vesti u delo nakon što su članovi populacije već izabrani u uzorak (ažurirati podatke samo za uzorak, a ne za čitavu populaciju).

Nekada su istraživaču dostupni gotovi spiskovi, nekada ih mora konstruisati ispočetka, nekada može dobiti odgovarajući spisak kombinujući više postojećih, a nekada se mogu i kupiti od akademskih ili komercijalnih organizacija (Blair et al., 2014). Neki od najpoznatijih internet servisa namenjenih onlajn anketiranju, istraživa-čima pored ostalog nude ispitanike iz skupa svojih „profesionalnih“ ispitanika. Bez obzira koliko to može izgledati primamljivo, trebalo bi imati u vidu da su takvi uzorci bez obzira na korišćenu proceduru uzorkovanja ograničeni na korisnike interneta koji su se dobrovoljno prijavili da učestvuju u uzorku. Ako to posmatramo sa druge strane, možemo reći da članovi populacije koji nisu korisnici interneta i nisu se dobrovoljno prijavili za učešće u anketama, nemaju nikakve šanse da se nađu u ovakvim uzorcima (odnosno, njihova šansa je nulta).

Spiskovi osoba sa kontakt podacima su retko dostupni kada je u pitanju opšta populacija. Takve podatke poseduju državne službe, a prema zakonima o zaštiti poda-taka o ličnosti (koje mnoge države poseduju) vrlo je ograničeno za čega se ti podaci mogu koristiti.

Prvo na šta se obično pomisli kada je istraživaču potreban spisak osoba/ domaćinstava sa adresama i brojevima telefona je telefonski imenik (fiksne telefonije). U njemu možemo naći identifikacije članova populacije i njihove kontakt podatke (adresu i telefon). Još ako postoji u elektronskoj formi, deluje savršeno, bar za određene načine prikupljanja podataka. Međutim, telefonski imenik ni na koji način nije potpun i ažuran spisak populacije. Pre svega, ne poseduju svi članovi populacije telefonski prik-ljučak. Neki ne poseduju ni stan, pa ne mogu ni imati fiksni telefon na svoje ime. Razlozi zbog kojih neko ne poseduje stan mogu biti različiti, ali obično su materijalne prirode. Osim toga, ni svi oni koji poseduju stan ne moraju posedovati fiksni telefon. Procenat domaćinstava koja poseduju fiksni telefon varira od zemlje do zemlje i krajem XX veka se kretao između 16 i 99%. U SAD, broj domaćinstava bez telefona bio je veći u rural-nim područjima, a telefon češće nedostaje u jednočlanim domaćinstvima, domaćinstvi-

Page 51: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

40

ma u kojima ima nezaposlenih, „mlađim“ domaćinstvima, te u onim lošijeg materijalnog statusa (Dillman, Smyth, & Christian, 2014; Groves et al., 2001). Mada je poslednjih decenija XX veka rastao procenat domaćinstava koja poseduju telefon, razvojem i pojef-tinjenjem usluga mobilne i VoIP telefonije (engl. Voice Over Internet Protocol), fiksna telefonija postaje prevaziđena i veliki broj, posebno mlađih domaćinstava, jednostavno nema potrebe za ovakvim vidom komunikacije19. Sledeća stvar, ne manje bitna, je da čak i oni koji poseduju fiksne telefone ne moraju biti izlistani u telefonskom imeniku. Ljudi koji se opredele da im se broj ne nađe u telefonskom imeniku to čine iz određenih razloga. Često je to materijalni status (bolji) ili priroda posla kojim se bave. Bitno je uočiti da je svako od ovih izostajanja iz telefonskog imenika kao spiska populacije sis-tematsko.

Neki nedostaci telefonskog imenika kao okvira uzorkovanja mogu se za potre-be telefonskih anketa prevazići upotrebom RDD procedure (engl. Random Digit Dialing – slučajno biranje telefonskih brojeva). RDD je okvir uzorkovanja za slučajno biranje telefonskih brojeva. Ovaj okvir uzorkovanja je primer situacije kada spisak populacije nije zaista nikakav spisak, već se radi o proceduri. Da budemo precizni, postoji implicit-ni spisak svih mogućih brojeva koje bi operater fiksne telefonije mogao dodeliti korisni-cima (Lepkowski, 2008). Slučajno biranje telefonskih brojeva implementirano je raču-narski, a softver za RDD slučajno bira i poziva zadati broj slučajno generisanih telefon-skih brojeva u okviru određene mrežne grupe (pozivnog broja), a sa implicitnog spiska mogućih telefonskih brojeva. Uzorkovanjem na ovaj način u uzorak mogu biti birani i oni članovi populacije čiji se brojevi ne nalaze u telefonskom imeniku. S druge strane, procedurom u uzorak mogu ući i nelegitimne jedinice poput nepostojećih telefonskih brojeva ili telefonskih brojeva preduzeća u anketnom istraživanju domaćinstava. Još jedan problem u vezi sa ovom procedurom je to što korisnici mogu preneti svoj broj iz jedne mrežne grupe u drugu ne menjajući pozivni broj. Ako je istraživanje usmereno na populaciju jednog grada, na ovaj način u uzorak mogu biti birani i ispitanici iz drugog grada. To su takođe nelegitimne jedinice. Ova procedura ne menja činjenicu da članovi populacije koji nemaju telefone imaju nultu verovatnoću da budu izabrani u uzorak.

Ukoliko su ovi razlozi izostajanja iz spiska populacije povezani sa predmetom istraživanja, to će dovesti do pristrasnih procena parametra koji je predmet istraživa-nja, bez obzira koja procedura uzorkovanja se koristi.

Na ovom mestu valja se osvrnuti i na okvire uzorkovanja namenjene internet anketiranju, a koji sadrže elektronske adrese jedinica populacije. Ovakvi okviri su retki i teško se kreiraju. Najčešće su nepotpuni, mogu sadržavati jedinice kojima tu nije mesto, jedna jedinica često ima više imejl adresa, a čest je slučaj i da više jedinica dele jednu

19 2006. u SAD 7,2% odraslih osoba posedovalo je samo mobilne telefone

(Blumberg, Luke, & Cynamon, 2006). Prema nekim istraživanjima, 2017. u SAD taj pro-cenat iznosio je 50,8%, a u starosnoj grupi 25–34 godine 70% (Kastrenakes, 2017).

Page 52: Bojan Janičić - digitalna.ff.uns.ac.rs

POPULACIJA I UZORAK

41

adresu. Vrlo su česte i kombinacije poslednje dve slabosti. Za razliku od telefonskih brojeva koji se mogu slučajno generisati (RDD), elektronske adrese to ne dozvoljavaju (Groves, 2009).

Spiskove manjih populacija moguće je kreirati (npr. spisak zaposlenih, spisak studenata univerziteta, spisak članova udruženja...). Prilikom kreiranja ovakvih spisko-va preporučljivo je da konsultujete važeći zakon o zaštiti podataka o ličnosti države ili država za čije stanovnike kreirate spisak. Na primer, tekući Zakon RS propisuje da je onaj koji prikuplja podatke dužan da lice na koje se podaci odnose (čije podatke prikup-lja) prethodno obavesti o: svom identitetu (identitetu ustanove, firme...); svrsi prikup-ljanja podataka; načinu njihovog korišćenja; identitetu ili vrsti lica koje će koristiti podatke; obaveznosti i pravnom osnovu, odnosno dobrovoljnosti davanja podataka i obrade; pravu da pristanak za obradu opozove, kao i pravnim posledicama u slučaju opoziva; pravima koja joj pripadaju u slučaju nedozvoljene obrade... Ovako kreirani spiskovi smeju se koristiti samo u svrhe za koje su lica čiji se podaci nalaze u njemu dali informisani pristanak i ne smeju se prosleđivati trećim licima (D. Krivokapić et al., 2016; Zakon o zaštiti podataka o ličnosti, 2012). U tom smislu, prodaja i kupovina odre-đenih podataka o ličnosti, uključujući kontakt podatke, bi se mogla smatrati kršenjem zakona.

Populacije mogu biti raznovrsne, pa samim tim i spiskovi populacija mogu sadržavati različite članove. Neki od ovakvih spiskova postoje i javno su dostupni. Na primer, spisak okruga, opština i naselja u R. Srbiji javno je dostupan na sajtu Republič-kog zavoda za statistiku Srbije i on se može koristiti kao okvir uzorkovanja u nekoj od ranijih etapa višeetapnog uzorkovanja. Kada je u pitanju Republika Srbija, sajt Republi-čkog zavoda za statistiku20 nudi i baze podataka iz kojih se u obliku izveštaja mogu izvući korisni spiskovi koji mogu sadržavati i dodatne informacije koje se mogu iskoris-titi prilikom procesa uzorkovanja i evaluacije reprezentativnosti uzorka.

Ukoliko ne postoji valjan spisak članova populacije, jedno od mogućih rešenja je zonsko biranje. Zonski okviri su vrsta okvira uzorkovanja koji dele oblast od interesa za istraživanje na geografske oblasti (zone) veće ili manje po obimu, koje se zatim kori-ste kao jedinice uzorkovanja. Ove geografske oblasti su u hijerarhijskom odnosu i u zavisnosti od vrste istraživanja i zemlje na koju se odnose mogu biti različite: pokrajine, okruzi, opštine, naselja, mesne zajednice, ulice... Obično su ove oblasti definisane tako da obuhvataju približno jednak broj krajnjih jedinica istraživanja (Turner, 2003). Zon-ski okviri mogu biti u obliku liste, mape, satelitske ili fotografije iz vazduha (Lavrakas, 2008).

U principu, kada se koriste zonski okviri obično se radi o višeetapnom biranju. Dobra strana ovog načina uzorkovanja je da ne mora postojati eksplicitni spisak jedini-ca istraživanja već izbor može biti prepušten anketaru na terenu.

20 http://www.stat.gov.rs

Page 53: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

42

Ukoliko je to slučaj, anketar mora imati jasno definisanu proceduru (slučajnog) biranja jedinica istraživanja. Na primer, mora mu biti određeno odakle da krene, kako da se kreće (u smeru kazaljke na satu) i kako da bira objekte u koje će ulaziti (recimo, svaki deseti...). Ako se radi o anketnom istraživanju domaćinstava, mora mu biti defini-san i način biranja stambenih jedinica, ako ih objekat u koji je ušao ima više. Konačno, anketar mora imati i definisan postupak biranja izvestioca (jedinice istraživanja) u odabranom domaćinstvu ukoliko neće biti ispitani svi njegovi članovi. U tom slučaju se često kao kriterijum koristi biranje osobe čiji je rođendan najbliži (Fajgelj, 2004), mogu se koristiti i Kišove tablice slučajnih brojeva ili neki drugi pristup slučajnog izbora. I sama procedura koju anketar koristi je deo okvira uzorkovanja.

Generalno, kada ne postoje adekvatni spiskovi članova populacije može se koristiti višeetapno biranje. U tom slučaju, u početnim etapama uzorkovanja koriste se spiskovi koji su javno dostup-ni. Obično se radi o zonskim okvirima uzorkovanja. U krajnjim fazama se može ili kreirati spisak članova populacije u odabranim jedinicama višeg reda, ili se u okviru njih mogu slučajno birati jedinice na način koji ne zahteva pravljenje spiska.

Na primer, kada bismo želeli da anketiramo učenike srednjih škola, u prvoj etapi bismo prostim slučajnim biranjem mogli izabrati opštine sa postojećeg i dostupnog spiska opština u kojima pos-toje srednje škole. Zatim bismo u narednoj fazi mogli, sa spiska srednjih škola koje postoje u oda-branim opštinama, slučajnim izborom odabrati škole, a zatim u narednoj fazi, odeljenja u tim ško-lama. Svi potrebni spiskovi u dosadašnjim fazama su nam ili dostupni ili bi se lako mogli kreirati. Konačno biranje učenika bismo mogli izvršiti generisanjem slučajnih brojeva u rasponu od 1 do broja učenika u odeljenju. Ispitani bi bili učenici čiji redni brojevi u školskom dnevniku odgovaraju odabranim brojevima. Na taj način nam ne bi bio potreban spisak učenika koji pohađaju određe-no odeljenje, a koji verovatno ni ne bismo mogli dobiti.

Ukoliko se neko profesionalno bavi anketnim istraživanjima ili planira više istraživanja treba da ima u vidu da se okvir uzorkovanja ne upotrebljava jednokratno. Stoga ima smisla da se posveti njegovom uređenju i unapređenju, bilo da se radi o spis-ku, proceduri ili kombinaciji jednog i drugog.

3.2.2.1. Višestruki okviri uzorkovanja

Kada postoji spisak populacije ali je nepotpun ili neažuran, potrebno ga je dopuniti ukoliko je to moguće. Ukoliko to nije moguće, postoji mogućnost kombinova-nja više spiskova populacije za potrebe uzorkovanja.

Višestruki okviri koriste se kada jedan okvir ne pokriva celokupnu ciljnu popu-laciju, kada želimo da ispitujemo retke populacije ili koristimo različite metode prikup-ljanja podataka (Pfeffermann & Rao, 2010). Osim toga, upotreba višestrukih okvira uzorkovanja je često jeftinija.

Drugim rečima, višestruki okviri uzorkovanja koriste se da bi se umanjile sla-bosti okvira uzorkovanja (poput nepokrivenosti i nelegitimnih jedinica), povećala efi-kasnost istraživanja i umanjili njegovi troškovi.

Možemo zamisliti situaciju u kojoj bismo želeli da ispitamo zadovoljstvo koris-

Page 54: Bojan Janičić - digitalna.ff.uns.ac.rs

POPULACIJA I UZORAK

43

nika mobilne telefonije brzinom mobilnog interneta. Pošto postoji više operatera, mora-li bismo da kombinujemo više posebnih spiskova korisnika. To mogu biti telefonski imenici, ali moguća je i upotreba RDD procedure21. Ukoliko bismo koristili samo jedan spisak ne bismo pokrili celokupnu populaciju, a ta nepokrivenost bi bila sistematska

(npr. nepokriveni korisnici jednog operatera). U meri u kojoj se korisnici različitih ope-ratera razlikuju po zadovoljstvu brzinom mobilnog interneta, u toj meri bi i naša proce-na bila pristrasnija, odnosno u većoj meri pogrešna. Da bismo to izbegli prilikom uzor-kovanja bismo kombinovali okvire uzorkovanja. Situaciju bismo mogli predstaviti kao na gornjoj slici (Slika 1). O1 predstavlja okvir uzorkovanja korisnika operatera 1, O2 predstavlja okvir uzorkovanja korisnika operatera 2, a u preseku su korisnici koji se nalaze u oba okvira.

Međutim, moguća je i situacija kada je jedan okvir uzorkovanja podskup dru-gog okvira. Dve varijante te situacije prikazane su na narednoj slici (Slika 2).

U prvoj varijanti (Slika 2, varijanta A) cilj je željena pokrivenost retkih popula-cija. Naime, i kada postoji okvir uzorkovanja (Ou) koji pokriva celokupnu populaciju (recimo zonski), a značajno nam je i da u dovoljnoj meri pokrijemo neku retku populaci-ju (videti odeljak 3.1.1), koristićemo i specifični okvir uzorkovanja (Or) za retku popu-laciju.

Drugi slučaj (Slika 2, varijanta B) je kada za uzorkovanje koristimo jedan nepotpun okvir uzorkovanja (Ot) koji ipak pokriva veliki deo populacije, a da bismo ga dopunili koristimo okvir uzorkovanja koji pokriva celu populaciju (Oz). Iako bismo u startu mogli koristiti kompletniji okvir (Oz), zbog znatno viših troškova prikupljanja podataka na osnovu tog okvira uzorkovanja, opredeljujemo se da primarno koristimo nepotpun okvir, a kompletniji koristimo samo za dopunu.

21 RDD se ne mora koristiti samo za telefonske ankete. Moguće je na taj način

uzorkovati domaćinstva, a anketu sprovesti ličnim anketiranjem ili na neki drugi način.

Slika 1 – Višestruki okviri uzorkovanja

Page 55: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

44

Ne treba zaboraviti da će način prikupljanja podataka u anketnom istraživanju zavisiti od kontakt informacija koje imamo u okviru uzorkovanja. Ako u okviru uzorkovanja nemamo telefonske bro-jeve članova populacije već samo adrese, umesto jeftinije telefonske ankete moraćemo da se opredelimo za lično anketiranje. To je skopčano sa većim troškovima vezanim za anketare, njiho-vu obuku, putne troškove...

Takav slučaj bismo imali kada bi za uzorkovanje koristili RDD proceduru. Tim načinom bi ostao nepokriven deo populacije koji nema telefon. Dostupan zonski okvir pokriva i taj deo populacije i ako bismo se opredelili da koristimo njega, RDD procedura nam ne bi bila ni potrebna.

Međutim, zonski okvir podrazumeva znatno veće troškove prikupljanja podataka, pa nam je eko-nomičnije rešenje da uzorkovanje obavimo RDD procedurom (a anketiranje telefonskim putem). Kao dopunu uzorka za deo populacije koji ne poseduje telefon mogli bismo koristiti zonski okvir. Iz uzorka dobijenog zonskim uzorkovanjem bismo mogli isključiti one jedinice istraživanja koje su pokrivene RDD uzorkom, i na taj način smanjiti troškove.

Upravo smanjenje troškova sprovođenja anketnog istraživanja je dominantni razlog korišćenja višestrukih okvira uzorkovanja (Pfeffermann & Rao, 2010).

Podvrsta uzorkovanja pomoću više okvira uzorkovanja naziva se i uzorkovanje uz trijažu (engl. screening multiple-frame survey). Ovakav vid uzorkovanja koristi se u situaciji kada višestruke okvire uzorkovanja koristimo u svrhu dopune nepotpunih okvira (npr. Slika 1). U ovakvom vidu uzorkovanja, izbor jedinica uzorkovanja vrši se posebno za jedinice pokrivene samo jednim od okvira, a ne drugim, a posebno za jedi-nice pokrivene sa više okvira uzorkovanja. Drugim rečima, posebno bi bili uzorkovani korisnici operatera 1, posebno operatera 2, a posebno korisnici i jednog i drugog opera-tera. U situaciji sa pomenute slike to bi bilo isto kao da imamo tri zasebna okvira uzor-kovanja koji se ne preklapaju. Pošto se okviri ne preklapaju, ovakav način uzorkovanja omogućava izračunavanje ukupnih pokazatelja sumiranjem pokazatelja za svaku od subpopulacija (Pfeffermann & Rao, 2010). Ukoliko se uklanjanje jedinica uzorkovanja koje se nalaze u više okvira uzorkovanja ne učini pre samog procesa biranja, moguće je dobiti korektne pokazatelje za subpopulacije i ukupnu populaciju njihovim uklanjanjem

Slika 2 – Višestruki okviri uzorkovanja

Page 56: Bojan Janičić - digitalna.ff.uns.ac.rs

POPULACIJA I UZORAK

45

ili ponderisanjem tokom analize podataka (više o tome u: Pfeffermann & Rao, 2010).

Varijanta uzorkovanja uz trijažu može se koristiti i za drugu namenu. Naime, ako nas zanimaju isključivo oni članovi populacije koji su deo okvira uzorkovanja Oz (Slika 2 B), ali ne i okvira Ot (na primer samo oni koji nemaju telefone), okvir Ot može da se koristi za identifikaciju i eliminisanje nelegitimnih jedinica iz okvira Oz.

3.2.2.2. Ažuriranje okvira uzorkovanja

Kao što je već je napomenuto, da bi se neki spisak mogao koristiti kao okvir uzorkovanja on mora sadržavati odgovarajuće kontakt informacije članova populacije. No, ni to nije dovoljan uslov. Postojeće kontakt informacije moraju biti ažurne. Recimo, ako fakultet želi da obavi istraživanje svojih diplomiranih studenata kao okvir uzorko-vanja može koristiti bazu podataka studentske službe. U bazi se pored imena i prezime-na studenta i podataka vezanih za studiranje mogu naći razne kontakt informacije poput adrese stanovanja, adresa stanovanja tokom studiranja, broja fiksnog telefona, broja mobilnog telefona, imejl adrese... Ovo mnoštvo informacija čini ovakve spiskove pogodnim da budu upotrebljeni kao okviri uzorkovanja bez obzira na način prikuplja-nja podataka. Međutim, to su obično podaci koje studenti daju prilikom upisa. Od upisa do diplomiranja prođe najmanje tri godine (za osnovni nivo studija). Za te tri godine mnoge od ovih informacija mogu postati zastarele, a studenti na osnovu njih nedostup-ni. Takođe, nemaju svi studenti sve navedene podatke. Kada postoji više kontakt infor-macija, problem je manji jer se jedna kontakt informacija može iskoristiti da se ažurira druga. Na primer, ukoliko želimo da pozive na anketu studentima šaljemo elektron-skom poštom, možemo telefonom kontaktirati potencijalnog ispitanika i ažurirati poda-tak koji nije tačan ili eventualno nedostaje. Kada su elektronske adrese u pitanju, one se najlakše mogu proveriti slanjem poruke. Ukoliko poruka bude odbijena (engl. bounce), onda se najverovatnije radi o adresi koja nije validna i trebalo bi je korigovati. Postoje i internet servisi koji to mogu uraditi umesto istraživača.

I drugi okviri uzorkovanja mogu imati greške koje su u velikoj meri predvidive, a tiču se ažurnosti. Okviri koji sadrže klijente ili zaposlene neke firme često ne sadrže novije klijente firme koji još nisu upisani u spisak. Isto važi i za zaposlene. S druge stra-ne, vrlo često ovakvi spiskovi će sadržavati klijente i zaposlene koji to više nisu (prestali su da sarađuju sa firmom / dobili ili dali otkaz).

Kada su u pitanju okviri uzorkovanja za organizacije (poput preduzeća, crkvi, bolnica, zatvora...) problemi su slični, ali imaju i neke svoje specifičnosti. Na primer, okviri uzorkovanja koji se sastoje od spiska kompanija sadrže kompanije različitih veli-čina. Tu se mogu naći multinacionalne korporacije, ali i male kompanije sa malim pri-hodom i nekolicinom zaposlenih. Ovakvi okviri obično favorizuju velike kompanije, dok su male češće nepokrivene. Velike organizacije često osim sedišta imaju i ispostave, dok male vrlo često imaju samo jednu lokaciju. Velike organizacije će se stoga u okviru uzorkovanja javljati više puta. U svakom konkretnom istraživanju potrebno je doneti

Page 57: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

46

odluku šta je zaista jedinica istraživanja: pravno lice ili fizičke lokacije i u tom smislu ažurirati okvir uzorkovanja. Velika organizacija može predstavljati jedno pravno lice, a imati više fizičkih lokacija (kao što i jedna osoba može posedovati više stambenih jedi-nica). S druge strane, postoje pravna lica koja nemaju fizičku lokaciju, ali i situacije kada više pravnih lica dele jednu fizičku lokaciju (Groves, 2009).

Osim toga, okviri uzorkovanja ne moraju pratiti organizacionu dinamiku, nas-tanak novih i gašenje postojećih organizacija, podele i spajanje kompanija...

Nekada su predmet istraživanja događaji, odnosno ciljna populacija je popula-cija događaja (poseta bioskopu, venčanja, bolesti, putovanja, saobraćajnih nesreća...). Ovakva istraživanja često koriste okvire uzorkovanja čije su jedinice osobe. Međutim, u ovakvim okvirima neke osobe nisu doživele događaj koji nas zanima, dok su neke druge doživele više njih. Drugi način da se pristupi ovakvim istraživanjima su vremenski okvi-ri uzorkovanja. U ovakvom načinu uzorkovanja svakom događaju se pridružuje jedna vremenska tačka (npr. vreme napuštanja tržnog centra). Moguć je i pristup sa uzorkom vremenskih tačaka. U ovom pristupu određuju se blokovi od nekoliko minuta (5, 10...) i pokušava se ispitivanje onih koji u okviru tih vremenskih blokova iskuse događaj od interesa za istraživanje (npr. napuštaju železničku stanicu).

Ovakva istraživanja, osim populacije događaja može zanimati populacija osoba koja je događaj doživela. U tom slučaju javljaju se problemi poput „ko je zaista doživeo događaj“. Da li je novi automobil kupio onaj na koga će biti registrovan ili celo domaćin-stvo (svaki njegov član) koje će ga koristiti?

Okvire uzorkovanja bi trebalo ažurirati u skladu sa potrebama istraživanja, ali je preporuka da to bude što češće.

3.2.2.2.1. Postupak poluotvorenih intervala

Ukoliko je okvir uzorkovanja nepotpun, kao što to može biti slučaj kod okvira uzorkovanja nekih retkih populacija, on se može dopunjavati u toku samog istraživanja. Tada se koristi postupak poluotvorenih intervala (engl. half-open interval). U ovom načinu dopune okvira uzorkovanja istraživač od ispitivanog člana populacije dobija informacije o članovima populacije koji se ne nalaze u okviru, a koji takođe mogu biti ispitani. Ispitanik i članovi populacije čine mrežu. Problem sa ovakvim načinom dopune okvira uzorkovanja je u tome što se članovi jedne mreže mogu naći u uzorku više puta, odnosno dolazi do pojave dupliranja. Naime, element populacije se može naći u uzorku na osnovu inicijalnog okvira uzorkovanja, ali i kao deo mreže. Ovakve situacije rešavaju se ponderisanjem. Odgovori članova mreže ponderišu se recipročnom vrednošću veli-čine grupe (ako grupa broji 4 člana onda je ponder ¼, odnosno 0,25). Ovaj metod uzor-kovanja i ponderisanja naziva se još uzorkovanjem mnoštva (engl. multiplicity sampling) (Groves, 2009). Međutim, treba voditi računa da je i izveštavanje jedinica koje se nalaze u uzorku o jedinicama koje ne pokriva okvir uzorkovanja podložno različitim tipovima grešaka, kako nesistematskim tako i sistematskim, odnosno, da može uticati na preciz-

Page 58: Bojan Janičić - digitalna.ff.uns.ac.rs

POPULACIJA I UZORAK

47

nost i pristrasnost anketnih statistika.

3.2.2.3. Slabosti okvira uzorkovanja

Osim nevalidnih podataka okviri uzorkovanja mogu imati i drugih slabosti koje će ovde biti nabrojane. S druge strane, neki okviri mogu sadržavati i dodatne informaci-je (pol, starost...) koje se mogu iskoristiti za unapređenje ankete (Dillman et al., 2014).

Ukoliko planiramo anketno istraživanje bazirano na nekom načinu probabilis-tičkog uzorkovanja, jedno od centralnih pitanja koje treba da postavimo pre kreiranja uzorka je, koliko dobro dostupni spisak populacije reprezentuje populaciju od interesa. U idealnom okviru uzorkovanja elementi populacije su preslikani jedan-na-jedan. Na žalost, ovakvi okviri uzorkovanja ne postoje ili su izuzetno retki (Groves, 2009).

Najčešće slabosti spiskova populacije su: nepokrivenost, dupliranje, grupisanje i nelegitimne jedinice. Moguće je da u jednom okviru uzorkovanja postoji više vrsta nedo-stataka simultano (i grupisanje i dupliranje, i nepokrivene i nelegitimne jedinice) te da neke od njih budu vezane za iste elemente populacije.

Greške koje mogu nastati kao rezultat slabosti nekog okvira uzorkovanja nisu vezane za konkretno anketno istraživanje već su moguće u svim anketnim istraživanjima koja se baziraju na tom okviru uzorkovanja.

3.2.2.3.1. Nepokrivenost

Sa aspekta pokrivenosti, jedinice ciljne populacije mogu biti pokrivene ili nepo-krivene (Groves, 2009). Ukoliko se neki član populacije nalazi na spisku populacije (u okviru uzorkovanja) on je pokriven. Analogno tome, elemenat populacije koji se ne nalazi na spisku populacije je nepokriven. Pokriveni članovi populacije imaju neku nenultu verovatnoću da budu izabrani u uzorak, dok je za nepokrivene članove popula-cije ta verovatnoća nulta. Ukoliko je izostajanje elemenata iz okvira uzorkovanja slučaj-no, to ne bi trebalo da utiče na procene parametara koje su rezultat istraživanja zasno-vanog na tom okviru uzorkovanja. Međutim, ukoliko je mehanizam izostajanja članova populacije iz okvira uzorkovanja sistematski povezan sa predmetom istraživanja, to može dovesti do pristrasnih procena parametara (videti poglavlje 5.2).

3.2.2.3.2. Nelegitimne jedinice

U vezi sa ovim problemima je i problem nelegitimnih jedinica. Nelegitimne jedinice su elementi spiska populacije koji nisu članovi ciljne populacije. Dakle, ovde je pitanje da li bi neka jedinica trebalo da se nalazi na spisku populacije ili ne? Ukoliko se nalazi, a ne bi trebalo, govorimo o nelegitimnoj jedinici. To su na primer telefonski bro-jevi preduzeća, ako se u istraživanju domaćinstava kao okvir uzorkovanja koristi tele-fonski imenik ili procedura slučajnog biranja telefonskih brojeva. U istom istraživanju to bi mogli biti i telefonski brojevi koji su van funkcije. U istraživanjima koja koriste zonski okvir, nelegitimne jedinice su jedinice koje se nalaze izvan zone interesovanja

Page 59: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

48

anketnog istraživanja itd.

Postojanje nelegitimnih jedinica u okviru uzorkovanja može rezultirati realizo-vanim uzorkom koji će biti manji od planiranog pošto nelegitimne jedinice moraju biti odbačene. Ovaj problem se može izbeći prečišćavanjem okvira pre samog procesa uzorkovanja. Međutim, najčešće ovakve jedinice budu identifikovane tek kada započne prikupljanje podataka. Kada je unapred poznata bar približna proporcija nelegitimnih jedinica u okviru uzorkovanja, moguće je korigovati broj uzorkovanih jedinica kako bi se nadoknadile jedinice koje će biti odbačene.

𝑛𝑛𝑘𝑘𝑡𝑡𝑟𝑟 = 𝑛𝑛𝑝𝑝/(1 − 𝑝𝑝𝑛𝑛𝑛𝑛) [ 2 ]

gde je nkor broj jedinica koje je potrebno uzorkovati (korigovana veličina uzorka) da bi se realizovala planirana veličina uzorka np uzimajući u obzir proporciju nelegitimnih jedinica pnl u okviru uzorkovanja.

Ako smo planirali da obavimo anketno istraživanje na uzorku od 1500 domaćinstava koristeći proceduru slučajnog biranja telefonskih brojeva (RDD), a poznato nam je da ćemo na taj način uzorkovati i 20% (pnl=0,2) nelegitimnih jedinica (telefonski brojeva preduzeća, institucija... nepos-tojećih brojeva) račun bi bio sledeći:

nkor=1500/(1-0,2)=1500/0,8=1875

Znači, bilo bi potrebno da uzorkujemo i pozovemo 1875 telefonskih brojeva kako bismo posle odbacivanja nelegitimnih jedinica realizovali planirani uzorak od 1500 domaćinstava (1875-1500=375 što je 20% nelegitimnih jedinica od 1875).

Pored podatka da li se neka jedinica populacije nalazi u okviru uzorkovanja ili ne, bitno je i pitanje da li neka legitimna jedinica na osnovu datog okvira uzorkovanja ima šansu da bude izabrana u uzorak proporcionalno svojoj zastupljenosti u populaci-ji22. U vezi sa ovim pitanjem su problemi dupliranja i grupisanja.

3.2.2.3.3. Dupliranje

Dupliranje se javlja kada je neka jedinica u okviru uzorkovanja zastupljena više puta. Drugim rečima, dupliranje je situacija kada jednoj jedinici ciljne populacije odgovara više elemenata okvira uzorkovanja.

Primer bi bila domaćinstva sa više telefonskih linija u situaciji kada se kao okvir uzorkovanja u istraživanju domaćinstava koristi telefonski imenik ili procedura slučajnog biranja telefonskih bro-jeva.

Jedinice ciljne populacije koje se u okviru uzorkovanja javljaju više puta mogu biti nadreprezentovane, odnosno imaće veći značaj nego što bi trebalo da bude slučaj

22 I probleme pokrivenosti i nelegitimnih jedinica možemo posmatrati kao

posebne slučajeve ovog problema. Nepokrivene jedinice bi trebalo da imaju neku nenultu verovatnoću da budu izabrane u uzorak, a kod njih je ta verovatnoća 0. Nelegi-timne jedinice bi trebalo da imaju nultu verovatnoću, ali imaju veću.

Page 60: Bojan Janičić - digitalna.ff.uns.ac.rs

POPULACIJA I UZORAK

49

na osnovu njihove zastupljenosti u populaciji. Dupliranje ne mora biti veliki problem i ne mora uticati na procene parametara koje se dobijaju anketnim istraživanjem, ako nije povezano sa predmetom istraživanja. Dupliranje će uticati na pristrasnost parame-tara i statistika dobijenih anketnim istraživanjem u slučaju da postoji sistematska povezanost.

Sa pojavom dupliranja može se izboriti na više načina.

Pre uzorkovanja moguće je prečistiti spisak populacije. Ovo može biti lako izvodljivo ako je spisak u elektronskoj formi, dok u drugim slučajevima može biti dugo-trajno i neekonomično.

Ako je dupliranje uočeno u toku uzorkovanja, rešenje je da se samo jedno jav-ljanje elementa populacije u spisku tretira kao legitimno (obično prvo), a ostala se treti-raju kao nelegitimne jedinice i zanemaruju prilikom uzorkovanja. Sličan je postupak i kada se dupliranje uoči u fazi prikupljanja podataka, ali ovo može rezultirati smanje-njem realizovanog uzorka.

U fazi analize podataka efekat dupliranja se može korigovati ponderisanjem. U tom slučaju odgovori jedinice populacije koja ima duplirane elemente u spisku popula-cije ponderišu se recipročnom vrednošću broja elemenata spiska populacije koji su vezani za tu jedinicu.

Na primer, ako neko domaćinstvo ima dva broja telefona izlistana u telefonskom imeniku koji se koristi kao spisak populacije, odgovori prikupljeni u tom domaćinstvu će biti ponderisani sa 0,5 odnosno ½.

3.2.2.3.4. Grupisanje

Druga strana ovog problema je grupisanje (engl. clustering), odnosno situacija kada je više jedinica ciljne populacije vezano za jedan element okvira uzorkovanja.

U situaciji iz prethodnog primera to bi bio slučaj kada bi više domaćinstava koristilo jedan tele-fonski broj.

Kada se javi grupisanje moguća su dva načina postupanja: ispitati sve elemente klastera ili izabrati uzorak unutar klastera. Oba ova načina imaju svoje dobre i loše strane.

Ukoliko se opredelimo da ispitamo sve elemente klastera, broj jedinica nije pod našom kontrolom osim ako veličine klastera nisu poznate unapred (Groves, 2009). Osim toga, pokušaj da se ispita više jedinica unutar klastera može dovesti do veće stope neodgovora (posebno ako su u pitanju telefonske ankete). Ako to nije slučaj, u zavisnos-ti od veličine klastera nekada je anketiranje potrebno obaviti u više vremenskih tačaka (termina). To ostavlja prostor članovima klastera da razgovaraju o temi istraživanja i svesno ili nesvesno vrše uticaj jedni na druge. Ovo se dešava čak i kada se radi o pita-njima koja se tiču činjenica – ne samo stavova i uverenja.

Page 61: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

50

Drugi način postupanja u slučaju pojave grupisanja je da iz klastera izaberemo slučajni uzorak, odnosno jedinicu koju ćemo uključiti u istraživanje. U ovom slučaju spisak legitimnih jedinica, članova klastera, predstavlja okvir uzorkovanja za konkretni klaster. Jedinica koja će učestvovati u anketi bira se nekim načinom koji neće narušiti principe slučajnog biranja. Anketar mora unapred imati definisan način biranja u ovim slučajevima. Često se (u istraživanju domaćinstava) kao učesnik bira osoba čiji je rođendan najbliži, a moguća je i upotreba Kišovih (Kish) tablica slučajnih brojeva. Na taj način se eliminiše uticaj članova klastera jednih na druge, a broj ispitanika drži se pod kontrolom. Međutim, to rađa drugi problem. Naime, verovatnoća biranja koju elementi osnovnog okvira uzorkovanja imaju (a obično je jednaka za sve elemente) biće umanje-na za jedinice koje su elementi klastera. Ovo umanjenje verovatnoće biće veće kod jedi-nica koje su članovi većih klastera, odnosno, verovatnoća biranja jedinice koja je deo nekog klastera biće manja što je klaster veći. Članovi klastera biće podreprezentovani. Opet, ovo samo po sebi ne mora uticati na pristrasnost pokazatelja, ali može ako je gru-pisanje povezano sa predmetom istraživanja.

Npr. ako ispitujemo konstrukt koji je povezan sa materijalnim statusom, a grupisanje elemenata populacije je povezano sa lošijim materijalnim statusom (siromašnija domaćinstva dele telefon-sku liniju, bolje stojeća – ne), biće nam podreprezentovan sloj ispitanika sa lošijim materijalnim statusom.

Problem podreprezentacije se takođe može korigovati ponderisanjem tokom analize. Odgovori podreprezentovanih jedinica obično će biti ponderisani brojem legi-timnih jedinica u klasteru.

3.2.3. Planirani i realizovani uzorak

Retka je situacija kada se planirani uzorak zaista i realizuje. U tom smislu možemo napraviti razliku između planiranog i realizovanog uzorka. Kao što samo ime govori, planirani uzorak je onaj koji smo želeli da ostvarimo, a realizovani uzorak je onaj koji smo zaista i ostvarili.

Realizovani uzorak se od planiranog može razlikovati po veličini, po strukturi ili i po veličini i po strukturi. Razlozi zbog kojih istraživači ne uspevaju da ostvare plani-rani uzorak mogu biti razni. Uobičajeno i očekivano je da će se prilikom prikupljanja podataka istraživač susresti sa određenom stopom neodgovora23 (ispitanik nije kod kuće, odselio se, umro, ne želi da odgovara...). Svi ovi činioci mogu delovati slučajno, ali mogu biti i sistematski.

Zaposleni češće nisu kod kuće od nezaposlenih, mlađi se u potrazi za poslom i boljim životom češće sele od starijih, smrtnost je češća u određenim starosnim grupama, oni koji se osećaju

23 Ovakav nedostatak se može preduprediti uračunavanjem očekivane stope

neodgovora u planiranu veličinu uzorka. Za ove potrebe moguće je koristiti prikazanu formulu za korigovanu veličinu uzorka [ 2 ].

Page 62: Bojan Janičić - digitalna.ff.uns.ac.rs

POPULACIJA I UZORAK

51

ugroženim mogu odbiti da odgovaraju na ankete o osetljivim pitanjima, stari će češće prihvatati razgovor sa anketarom od mlađih, otvoreniji od rezervisanih...

Ova stopa će zavisiti i od metode prikupljanja podataka i manja je kod metoda koje uključuju veći stepen interakcije anketar-ispitanik. Metoda prikupljanja podataka može biti sistematski povezana sa neodgovorima. Na primer, veći broj neodgovora starijih može se javiti u internet anketama, a kod mlađih u telefonskim anketama.

Mogući razlozi mogu biti i više sile poput elementarnih nepogoda, ratova i sl. U ovom slučaju istraživač neće biti u mogućnosti da prikupi podatke od ispitanika iz obla-sti pogođenim ovim pojavama. Ako je oblast u kojoj ispitanici žive povezana sa predme-tom istraživanja, ovo može uticati na sistematske greške anketnih statistika.

Pogrešno planiranje ankete takođe može rezultirati odstupanjem realizovanog od planiranog uzorka.

Ako istraživač planira anketu u jeku poljoprivrednih radova, vrlo je verovatno da neće uspeti da prikupi podatke od ispitanika koji se bave ovom granom privrede. I u ovom slučaju imamo siste-matski činilac koji utiče i na poremećaj strukture realizovanog uzorka.

Slično, ako istraživač planira istraživanje u doba nekog verskog praznika (recimo Uskrsa) to može uticati da manji broj vernika odgovori na anketu. Ukoliko se istraživanje radi u multikonfesional-noj sredini, a datumi verskih praznika se razlikuju, to može uticati na izostajanje ispitanika jedne konfesije, a druge ne. Opet će biti poremećena i struktura uzorka.

Ako je realizovani uzorak manji od planiranog to će rezultirati većim standar-dnim greškama statistika koje ćemo dobiti na osnovu istraživanja, odnosno, njihovom manjom preciznošću. Ako tom prilikom nije došlo do poremećaja u strukturi uzorka, ovo smanjenje neće uticati na pristrasnost dobijenih statistika (ali hoće na preciznost).

Međutim, ako do poremećaja u strukturi ipak dođe, statistici će biti i pristrasni. O poremećaju strukture možemo govoriti kada grupe ispitanika nisu zastupljene u rea-lizovanom uzorku proporcionalno svojoj zastupljenosti u planiranom uzorku (koji bi trebalo da odražava njihovu zastupljenost u ciljnoj populaciji). Ovo je situacija prikaza-na u gornjim primerima sa anketama planiranim u jeku poljoprivrednih radova ili ver-skih praznika.

Naravno, moguće je i vrlo često da se realizovani uzorak razlikuje i po veličini i po strukturi, što rezultira nepreciznijim i pristrasnim anketnim statisticima.

Kada se ovo desi, može se delovati na različite načine. Moguće su statističke korekcije nedostajućih podataka (imputacije i/ili ponderisanja o kojima će biti reči kasnije) ili dopuna realizovanog uzorka uz prethodnu analizu njegovih manjkavosti. Cilj ovakve analize je da se utvrdi koje grupe ispitanika nedostaju, odnosno kojim ispitani-cima je potrebno dopuniti uzorak.

Ovakve korekcije zahtevaju dosta truda, znanja, kapaciteta i finansijskih sred-stava, a efekti su im ograničeni. Mogu pomoći u slučaju malih odstupanja, kod kojih su i

Page 63: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

52

efekti na anketne statistike mali. U ovom slučaju ne postoje velike razlike u anketnim statisticima između onih dobijenih na korigovanom i nekorigovanom uzorku, pa prakti-čno nisu ni potrebne. Ukoliko su razlike planiranog i realizovanog uzorka velike, domet korekcija je mali, pa su korekcije u praksi retke (Fajgelj, 2004). Zbog toga je najuputnije u toku samog terenskog rada pratiti realizaciju planiranog uzorka i korektivno reagova-ti na vreme. Najbolji način borbe protiv neodgovora je dodatno angažovanje na prikup-ljanju odgovora od ispitanika koji su prvobitno izabrani u uzorak. To uključuje ponovne pokušaje kontakta i uveravanje ispitanika da ipak pristanu da učestvuju u anketnom istraživanju. Više o tome u poglavlju 8.

Page 64: Bojan Janičić - digitalna.ff.uns.ac.rs

UZORKOVANJE

53

4. Uzorkovanje

Više puta smo ponovili da je jedna od osnovnih karakteristika anketnih istraži-vanja da se obavljaju na uzorku.

Ako zanemarimo greške koje mogu nastati u beleženju i obradi i tačnost poda-taka koje dobijamo od jedinica istraživanja, ukoliko bismo ispitali celu populaciju statis-tik koji bismo na taj način izračunali bio bi jednak pravoj vrednosti u populaciji. S druge strane, statistik dobijen na uzorku uvek je samo manje ili više tačna procena parametra populacije. Bez obzira kako se bira uzorak, vrednosti procena izračunatih na uzoračkim podacima razlikovaće se od pravih vrednosti parametara u populaciji.

Kada bismo iz neke populacije veličine N izvukli (prostim slučajnim biranjem) n uzoraka iste veličine i na njima izračunali procene nekog parametra X, svaki put bis-mo dobili različite vrednosti. Te vrednosti bi se u svim slučajevima razlikovale od prave vrednosti tog parametra u populaciji, odnosno, bile bi manje ili više dobre procene parametra. Nije nam svejedno da li su te procene dobre ili loše. Ukoliko na osnovu loše procene donesemo odluku, posledice pogrešne odluke mogu biti značajne (u svakom smislu). Zato je potrebno da znamo koliko je neka procena dobra, odnosno, zanima nas kolika je standardna greška parametra.

Standardna devijacija uzoračkih procena parametra oko njegove prave vredno-sti u populaciji naziva se standardnom greškom parametra, ili u terminima anketnih istraživanja – greškom uzorkovanja ili uzoračkom greškom (engl. sampling error). Analogno standardnoj devijaciji i varijansi, kvadrat standardne greške parametra je varijansa uzoračke distribucije parametra (engl. variance of the sampling distributi-on).

Standardna greška parametra se može iskoristiti za građenje intervala povere-nja, odnosno intervalne procene parametra (engl. interval estimate)24. Intervali povere-nja grade se dodavanjem i oduzimanjem određenih umnožaka procene standardne greške na procenjeni parametar (više o tome u odeljku 5.1). Što su ovi intervali uži, to je

24 Za razliku od samog statistika koji predstavlja procenu tačke (engl. point es-

timate).

Page 65: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

54

procena bolja. Naravno, ovo važi samo ako je uzorak reprezentativan za ciljnu populaci-ju i distribucija posmatrane varijable (približno) normalna.

Na primer, ako bismo želeli da procenimo prosečnu visinu svih odraslih stanovnika Srbije proce-njujući je na slučajnom uzorku posetilaca fudbalskog derbija, verovatno je da interval poverenja ne bi obuhvatao pravu vrednost u populaciji. S obzirom da su posetioci derbija u velikoj većini muškog pola, koji su po pravilu viši, verovatno je da bismo dobili nerealno visoku procenu.

Problem je, što je za izračunavanje standardne devijacije uzoračkih procena parametara oko njegove prave vrednosti, potrebno poznavati tu pravu vrednost. Da nam je ta vrednost već poznata ne bi ni bilo potrebe za sprovođenjem anketnog istraživanja. Standardnu grešku ipak možemo proceniti na osnovu varijabilnosti posmatrane pojave u uzorku i veličine uzorka. Naime, standardna greška parametra zavisiće od toga koliko posmatrana pojava varira i koliko smo tog varijabiliteta uspeli da zahvatimo uzorkom. Zbog toga, u jednom istom istraživanju (anketi), na uzorku iste veličine, različite varija-ble (pitanja) mogu imati različite standardne greške i potrebno ih je računati za svaku varijablu posebno. O tome je potrebno voditi računa i prilikom planiranja potrebne veličine uzorka, i ravnati se prema varijabli sa najvećim varijabilitetom.

Ukoliko neka pojava ne bi varirala, već na osnovu jednog ispitanika bismo mogli znati pravu vrednost parametra u populaciji. Bez obzira koji i koliki uzorak bio, uvek bismo dobili istu vrednost procene, a ona bi bila jednaka vrednosti parametra u populaciji. Greške ne bi bilo, bar ne one koja zavisi od uzorka. Tačnost procene ne bi zavisila od veličine uzorka.

Međutim, u anketnim istraživanjima pojave obično u manjoj ili većoj meri vari-raju (ili nisu interesantne). Što neka pojava više varira, potreban je veći uzorak da bi se zahvatili svi njeni različiti modaliteti (vrednosti) i došlo do tačnije procene. Ove zakoni-tosti se ogledaju i u izrazu za standardnu grešku procene parametra:

𝑠𝑠𝑠𝑠𝑀𝑀 = �𝑠𝑠

2

𝑛𝑛=

𝑠𝑠√𝑛𝑛

[ 3 ]

gde je s2 varijansa, a s standardna devijacija procenjivane varijable u uzorku veličine n. Kvadrat standardne greške procene parametra je varijansa uzoračke distribucije para-metra, odnosno varijansa25 uzoračkih procena oko prave vrednosti parametra. Formula [ 3 ] je namenjena za kontinuirane varijable, ali se može lako modifikovati za binarne varijable (proporcije). Potrebno je izraz za varijansu kontinuirane varijable s2 zameniti izrazom za varijansu binarne varijable pq, gde je p proporcija javljanja jedne alternati-ve, a q proporcija javljanja druge26. Izraz p(1-p) je ekvivalentan izrazu pq, pošto se pro-porcije alternativa binarne varijable sabiraju do 1. Izraz je tada moguće napisati i ovako

25 Prosečno kvadrirano odstupanje. 26 Ako je uzorak manji od 20, za računanje varijanse binarne varijable bolje je

koristi izraz 𝑠𝑠2 = 𝑛𝑛𝑝𝑝(1−𝑝𝑝)𝑛𝑛−1

(Levy & Lemeshow, 1999).

Page 66: Bojan Janičić - digitalna.ff.uns.ac.rs

UZORKOVANJE

55

(Fajgelj, 2004, 2013):

𝑠𝑠𝑠𝑠𝑃𝑃 = �𝑝𝑝(1 − 𝑝𝑝)

𝑛𝑛= �

1𝑝𝑝(1 − 𝑝𝑝)

[ 4 ]

Veličina koja je u ovim izrazima pod kontrolom istraživača je veličina uzorka. Varijabilnost pojave u populaciji je takva kakva je i na nju ne možemo uticati. Potrebno ju je prilikom planiranja uzorka samo dobro proceniti. To se može uraditi na osnovu rezultata prethodnih istraživanja na istoj ili sličnoj populaciji, pilot istraživanja ili ju je moguće postaviti na maksimum (nešto više o tome u odeljku 4.5).

Međutim, prethodni izrazi ne mogu se sa jednakim poverenjem primeniti na sve tipove uzoraka (videti poglavlje: 4.3 Probabilističko i neprobabilističko uzorkova-nje). Osim toga, varijabilnost pojave u uzorku zavisiće i od primenjenog nacrta uzorko-vanja (poglavlje 4.3.1). Ovo je svakako potrebno uzeti u obzir prilikom definisanja nacr-ta uzorkovanja.

4.1. Nacrt uzorkovanja

Nacrt uzorkovanja (engl. sample design) obuhvata plan uzorkovanja (engl. sampling plan) i procedure procene (engl. estimation procedures) (Levy & Lemeshow, 1999).

Plan uzorkovanja čini metodologija izbora uzorka iz populacije (odnosno spi-ska populacije).

Procedure procene su statistički modeli odnosno tehnike koje će biti korišćene za procenu parametara populacije i njihovih grešaka na osnovu podataka dobijenih na uzorku.

Željena preciznost procena parametara27 populacije zavisiće od tipa odluka koje će biti donošene na osnovu njih, i samim tim od potreba i želja krajnjeg korisnika rezul-tata, odnosno naručioca istraživanja.

Zbog toga je prilikom definisanja nacrta uzorkovanja potrebna saradnja i raz-mena informacija između statističara, osoba zaduženih za sprovođenje ankete i krajnjih korisnika rezultata. U tom smislu, korisnici rezultata moraju definisati koje podatke žele da dobiju, te kolika preciznost i validnost im je potrebna za donošenje odluka na osnovu njih. Takođe, korisnici bi trebalo da odrede vremenski okvir i finansijska sreds-tva koja su na raspolaganju za realizaciju ankete. Osobe koje se bave sprovođenjem ankete trebalo bi da pruže informacije o ceni sprovođenja različitih modaliteta istraži-vanja i predlože alternativne načine realizacije. Na osnovu tih podataka statističari predlažu nacrt uzorkovanja koji će omogućiti realizaciju postavljenih ciljeva (Levy & Lemeshow, 1999). Ovaj postupak se može odigravati u više iteracija.

27 Veličina recipročna grešci procene parametra.

Page 67: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

56

Preciznost anketnih statistika, odnosno procena parametara populacije, pre svega zavisi od veličine uzorka, ali i od metodologije uzorkovanja. Procene će biti pouz-danije što je uzorak veći i heterogeniji.

Međutim, i cena istraživanja zavisi od istih faktora. S obzirom da je cena vrlo bitan ograničavajući faktor, problem postaje očigledan. Nacrt istraživanja, pa i nacrt uzorkovanja, obično predstavlja kompromis željenih svojstava anketnog istraživanja i mogućnosti koje zavise od budžeta.

Pored preciznosti, bitna karakteristika anketnih statistika je i njihova nepris-trasnost. Da bi anketni statistici bili nepristrasni potrebno je da uzorak bude reprezen-tativan za populaciju na koju želimo da izvršimo generalizaciju. Ovo bi se moglo reći i na drugačiji način: anketni statistici će biti nepristrasne procene parametara za onu populaciju za koju je uzorak reprezentativan. Reprezentativnost uzorka se, opet, obez-beđuje njegovom dovoljnom veličinom i načinom biranja. Ne postoji kvantitativni poka-zatelj reprezentativnosti uzorka. Ona je pre svega kvalitativno svojstvo i može se pro-veravati poređenjem nekog obeležja čija je distribucija u populaciji poznata sa njego-vom distribucijom u uzorku (Fajgelj, 2004). Međutim, to rađa nove probleme i dileme. Sami istraživači ne mogu potvrditi reprezentativnost uzorka zato što oni i vrše istraži-vanje i uzorkuju kako bi nešto saznali o stvarnosti. Ova cirkularnost se još naziva para-doksom uzorkovanja (engl. sampling paradox). Istraživači često reprezentativnost uzor-ka pokušavaju da potvrde poredeći ga sa podacima popisa. Popisi uglavnom sadrže demografske varijable koje ne pokrivaju skup varijabli po kojima je nekada potrebno da uzorak bude reprezentativan. Osim toga, popisi se obavljaju periodično u intervalima od nekoliko godina28. Oni su najtačniji u trenutku kada je popis obavljen, a kako vreme prolazi sve slabije odražavaju pravo stanje u populaciji (Lavrakas, 2008).

Da bi uzorak što bolje reprezentovao ciljnu populaciju potrebno je: 1) da pose-dujemo adekvatan okvir uzorkovanja, 2) da jedinice populacije u uzorak biramo slučaj-no, i 3) da imamo neki način kontrole koji će obezbediti da ključne podgrupe populacije budu adekvatno reprezentovane (Groves, 2009).

Naime, nijedan način uzorkovanja neće obezbediti reprezentativnost uzorka ukoliko okvir na osnovu kojeg vršimo uzorkovanje ne pokriva adekvatno ciljnu popula-ciju. Ako postoje elementi populacije koji se ne nalaze u okviru uzorkovanja, oni nemaju šansu da budu izabrani u uzorak. Ako su takvi nedostaci okvira uzorkovanja sistemat-ski, može se desiti da čitave podgrupe populacije budu isključene. Ovi nedostaci javiće se u svakom istraživanju zasnovanom na takvim okvirima uzorkovanja i ne zavise od metode uzorkovanja.

Slučajno biranje je najbolji način da se eliminišu pristrasnosti prilikom uzorko-vanja, ali samo po sebi ne garantuje da će uzorak biti reprezentativan, odnosno ne obe-

28 U Republici Srbiji popisi stanovništva se vrše na svakih 10 godina (otprilike).

Page 68: Bojan Janičić - digitalna.ff.uns.ac.rs

UZORKOVANJE

57

zbeđuje da će sve ključne grupe biti adekvatno reprezentovane. Da bi se to obezbedilo, najčešće se koristi mehanizam stratifikacije (odeljak 4.3.1.3). Ovaj mehanizam se bazi-ra na podeli populacije na ključne stratume i uzorkovanje unutar njih.

Veličina uzorka je bitna iz više razloga. Pored činjenice da od nje zavisi preciz-nost anketnih statistika, od nje zavisi i šansa pojedinih grupa da uopšte budu reprezen-tovane u uzorku. Da pojednostavimo, ukoliko je zastupljenost neke grupe u populaciji 1 promil, u uzorku od 500 ispitanika bi trebalo da bude 0,5 takvih slučajeva, što je nemo-guće. Sasvim je moguće i da u duplo većem uzorku ostvarenom slučajnim biranjem nećemo naći nijednog ispitanika koji pripada toj grupi.

4.2. Pouzdanost, validnost i preciznost uzorkovanja

Uzorci bi trebalo da budu takvi da daju procene koje su pouzdane, precizne i validne.

Pouzdanost procena odnosi se na njihovu ponovljivost, odnosno reproducibil-nost. Uzorkovanje rezultira pouzdanim procenama parametara populacije ako u ponov-ljenim ispitivanjima dobijamo vrednosti koje se ne razlikuju previše. Ukoliko ne bi pos-tojala greška merenja (poglavlje 5.4), pouzdanost bi bila obrnuto proporcionalna vari-jansi uzorkovanja, odnosno standardnoj grešci.

Validnost procena se ogleda u tome koliko prosek ponovljenih procena na raz-ličitim uzorcima odstupa od prave vrednosti tog parametra u populaciji. Da nema greš-ke merenja validnost bi zavisila samo od pristrasnosti procene.

Preciznost ili tačnost procene se odnosi na to koliko je, u proseku, određena vrednost procene udaljena od prave vrednosti tog parametra u populaciji. Procenjuje se na osnovu srednjeg kvadriranog odstupanja, ili njegovog kvadratnog korena, pri čemu niže vrednosti znače veću preciznost (Levy & Lemeshow, 1999).

4.3. Probabilističko i neprobabilističko uzorkovanje

Možemo razlikovati dve šire grupe metoda uzorkovanja: probabilističke (verovatnosne) i neprobabilističke (neverovatnosne).

Za razliku od neprobabilističkih uzoraka, za probabilističke uzorke je karakte-ristično da svaki element u populaciji ima poznatu, nenultu verovatnoću da bude izab-ran u uzorak. Zbog ove osobine probabilističkih uzoraka moguće je na osnovu podataka dobiti nepristrasne procene parametara populacije koji su linearna transformacija opa-ženih podataka. Takođe, uz uslov da je poznata združena verovatnoća uključivanja u uzorak bilo koje dve jedinice populacije, moguće je izračunati i standardne greške ovih procena (Levy & Lemeshow, 1999). Kod neprobabilističkih uzoraka ovo nije moguće. Odnosno, iako je možda matematički moguće to uraditi, nemamo prava da na osnovu tih zaključaka donosimo zaključke sa određenim stepenom poverenja.

Page 69: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

58

Fajgelj (2004) na sledeći način rezimira razlike između probabilističkih i nep-robabilističkih uzorka:

1. Neprobabilistički uzorci ne podležu zakonima teorije verovatnoće poš-to ne koriste pravilo jednakih verovatnoća prilikom biranja elemenata uzorka.

2. Zbog toga se na njima ne mogu primeniti pravila inferencijalne statis-tike i izračunati pokazatelji kvaliteta poput preciznosti, validnosti.

3. Samim tim ne mogu se testirati ni hipoteze.

I pored toga, neprobabilistički uzorci se često koriste zato što su manje zahtev-ni, kako po pitanju vremena, tako i po pitanju cene.

Osim toga, nekada se realizovani uzorci nastali na osnovu probabilističkog i neprobabilističkog uzorkovanja po svojim osobinama mogu toliko približiti da razlike postanu neznatne (Fajgelj, 2004). Ovde pre svega mislimo na neprobabilističko kvotno uzorkovanje o kojem će biti reči kasnije. Naime, čak i ako je primenjena neka od metoda probabilističkog uzorkovanja, neodgovori (posebno ako su sistematski) mogu učiniti da realizovani uzorak ne bude reprezentativan za ciljnu populaciju, odnosno da ne odsli-kava njenu strukturu. Osim neodgovora, na reprezentativnost probabilističkih uzoraka utiču i druge greške koje nisu vezane za sam nacrt uzorkovanja (na primer, greška pokrivenosti kao rezultat nekompletnog spiska populacije)(Lavrakas, 2008). S druge strane, kvotni uzorak, ukoliko se anketa na terenu sprovede pravilno i nema sistemat-skih neodgovora, može istu tu ciljnu populaciju bolje reprezentovati. Ovo je tačnije u slučaju kada se ispituju stavovi ispitanika, a manje tačno kada su u pitanju tzv. tvrda obeležja (činjenični, objektivni podaci).

Kada se sve to ima u vidu, te da zbog nedostataka u toku sprovođenja istraživa-nja pravi probabilistički uzorci u realnosti praktično ne postoje, nije neobično što se ne poštuje strogo statističko pravilo da se na neprobabilističkim uzorcima ne mogu raču-nati standardne greške i testirati hipoteze. Sa aspekta statistike, sasvim je svejedno da li je uzorak izvorno neprobabilistički ili ne, ako ga realizacija čini takvim. U oba slučaja, procene parametara, grešaka i testiranje hipoteza biće samo aproksimacije i dovodiće do pogrešnih zaključaka.

Ako bi dosledno bila poštovana sva pravila statističkih modela ne bi ostalo pro-stora za bilo kakve relevantnije zaključke. To je razlog zbog kojeg se vrlo često susre-ćemo sa računanjem navedenih pokazatelja i testiranjem hipoteza na neprobabilistič-kim uzorcima. Ono što opravdava korišćenje statističkih pokazatelja i testova je repre-zentativnost, a ne način uzorkovanja. Ako se može dokazati da je uzorak reprezentati-van u zadovoljavajućem stepenu, onda je takva upotreba opravdana (Fajgelj, 2004).

Kao što je već na početku poglavlja rečeno, dobar (probabilistički) nacrt uzor-kovanja bi u obzir trebalo da uzme da li se njime ostvaruje potrebna preciznost procene parametara, budžet istraživanja i njegovu cenu, potrebno i raspoloživo vreme za spro-

Page 70: Bojan Janičić - digitalna.ff.uns.ac.rs

UZORKOVANJE

59

vođenje takvog nacrta i izvodljivost. Nijedan nacrt istraživanja, bez obzira na potencijal-nu cenu i preciznost, neće biti dobar ukoliko nije izvodljiv (Levy & Lemeshow, 1999).

U nastavku biće prikazani neki postupci probabilističkog i neprobabilističkog uzorkovanja.

4.3.1. Probabilističko uzorkovanje

4.3.1.1. Prosto slučajno uzorkovanje

Prost slučajni uzorak29 je onaj u kojem svaki od svih mogućih uzoraka veličine n iz neke populacije N ima jednaku verovatnoću biranja (Levy & Lemeshow, 1999).

Ovaj vid uzorkovanja predstavlja prototip slučajnog uzorkovanja. Postupak je jednostavan. Potrebno je na neki od načina generisati spisak slučajnih brojeva veličine n (odnosno željene veličine uzorka) u rasponu od 1 do N (veličine populacije). Ova pro-cedura mora obezbediti da se slučajno generisani brojevi ne ponavljaju. Ukoliko se ipak ponove, drugo javljanje istog broja potrebno je zanemariti. Nakon toga se sa spiska populacije u uzorak biraju jedinice čiji se redni brojevi nalaze u generisanom skupu slučajnih brojeva.

Generisanje skupa slučajnih brojeva se može uraditi pomoću tablica slučajnih brojeva, kalkulatora sa generatorom slučajnih brojeva, mobilnih aplikacija, ili računar-ski u okviru paketa za statistička i tabelarna izračunavanja (R, IBM SPSS, Statistica, Microsoft Excel i njegovi besplatni pandani iz paketa LibreOffice, OpenOffice...). U okvi-ru softvera za statistička izračunavanja moguće su dve varijante postupka. U prvoj vari-janti, potrebno je u okviru matrice podataka koja sadrži okvir uzorkovanja, kreirati varijablu koja će za svakog ispitanika sadržati slučajno generisan broj. Potom se podaci sortiraju po toj varijabli i izabere prvih ili poslednjih n ispitanika (može i srednjih). U drugoj varijanti softveru se može zadati da iz matrice podataka (okvira uzorkovanja) slučajnim izborom izdvoji poduzorak veličine n. Što se tiče paketa za tabelarna izraču-navanja poput Microsoft Excela, u njemu se koristi prva varijanta.

Prosečni pokazatelj za sistematske slučajne uzorke može se jednostavno izra-čunati kao:

�̅�𝑥𝑝𝑝𝑝𝑝𝑝𝑝 =

1𝑛𝑛�𝑥𝑥𝑖𝑖

𝑛𝑛

𝑖𝑖=1

[ 5 ]

gde indeks psu označava da je pokazatelj dobijen na prostom slučajnom uzorku, indeks 29 Ovde, a i u nastavku knjige, govorićemo o uzorkovanju bez povrata, pošto je

to dominantni način uzorkovanja. U ovakvom uzorkovanju svaki član populacije može samo jednom biti izabran u uzorak. U uzorkovanju uz povrat članovi populacije mogu biti izabrani u uzorak više puta. Kada su populacije velike, nema značajnih razlika između ova dva vida uzorkovanja.

Page 71: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

60

i označava pojedinačni rezultat, a n je veličina uzorka.

Varijansa distribucije dobijene na prostom slučajnom uzorku je:

𝑣𝑣𝑝𝑝𝑝𝑝𝑝𝑝 = �1 − 𝑓𝑓𝑛𝑛

� 𝑠𝑠2 [ 6 ]

gde je f proporcija uzorkovanja, odnosno odnos veličine uzorka n i populacije N (f=n/N), a s2 varijansa posmatrane varijable u uzorku, dobijena na standardni način:

𝑠𝑠2 = �

1𝑛𝑛 − 1

��(𝑥𝑥 − �̅�𝑥)𝑛𝑛

𝑖𝑖=1

[ 7 ]

U izrazu [ 6 ] deo �1−𝑓𝑓𝑛𝑛� je korekcija za veličinu populacije. Korekcija je značajna

ako je proporcija uzorkovanja velika, odnosno populacija mala. Ovom korekcijom uma-njuje se i vrednost procene varijanse distribucije uzorkovanja i samim tim vrednost greške uzorkovanja koja je njen kvadratni koren.

4.3.1.1. Slučajno sistematsko biranje sa jednakim verovatnoćama

Postupak sistematskog slučajnog biranja je donekle drugačiji. Kada utvrdimo potrebnu veličinu uzorka potrebno je izračunati interval uzorkovanja, odnosno korak. Interval uzorkovanja je odnos veličine populacije i željene veličine uzorka. Dobijamo ga kada veličinu populacije N podelimo potrebnom veličinom uzorka n:

𝑘𝑘 = 𝑁𝑁/𝑛𝑛 [ 8 ]

Ukoliko je k decimalan broj, uzima se ceo broj pre decimale.

Na primer, ako iz populacije N=40.000 želimo da izaberemo uzorak veličine n=800, korak će izno-siti k=40.000/800=50.

Ukoliko bismo želeli da izaberemo uzorak n=1.150 interval uzorkovanja će iznositi k=40.000/1.150=34,78. Pošto je to decimalan broj kao vrednost koraka uzećemo ceo broj pre decimale, odnosno 34. Postoje i mogućnost da se decimalni broj zaokruži na više (na najbliži ceo broj).

Nakon toga slučajno se generiše broj između 1 i k. Izbor elemenata vrši se počev od tog slučajno generisanog broja (ovo se čini kako bi se eliminisao mogući efe-kat redosleda elemenata na spisku), a zatim se bira svaki k-ti element sa spiska popula-cije. Metoda se još naziva biranjem po koraku, jer se jedinice biraju po koraku k od slučajno odabranog početka (Fajgelj, 2004).

Pretpostavka ovog načina biranja je da spisak populacije ne sme biti poređan po redosledu koji ima veze sa posmatranom pojavom. Uobičajeno je da bude sortiran azbučno ili abecedno po nazivima (imenima) jedinica. Ukoliko je princip sortiranja jedinica na spisku povezan sa posmatranom pojavom, to može biti uzrok pristrasnosti. Do pristrasnosti može doći i ukoliko je spisak populacije osim po nazivima jedinica poređan i po nekim drugim kriterijumima, pri čemu nazivi nisu prvi kriterijum sortira-nja. U tom slučaju se periodičnosti u spisku mogu poklopiti sa korakom, što može dove-

Page 72: Bojan Janičić - digitalna.ff.uns.ac.rs

UZORKOVANJE

61

sti do podreprezentovanja jednog dela populacije, a nadreprezentovanja drugog.

Kao rešenje za takve situacije može se koristiti ponovno sortiranje spiska po nazivima, što je prilično lako ako je spisak populacije dostupan u elektronskoj formi. Kada to nije moguće, ili ne možemo odbaciti sumnje da u spisku populacije postoje periodičnosti povezane sa ispitivanom pojavom, može se koristiti varijanta ovog uzor-kovanja koja se naziva sistematsko biranje sa višestrukim uzorcima (Fajgelj, 2004). U ovom postupku se umesto jednog bira m manjih uzoraka. Prvo se određuje m slučajnih početnih brojeva između 1 i m·k (po jedan za svaki od poduzoraka). Biranje svakog od poduzoraka kreće od odgovarajućeg slučajnog broja, a kao korak se uzima vrednost m·k, sve dok se ne dođe do kraja spiska. Zatim se uzima sledeći slučajni početni broj i po koraku m·k bira novi poduzorak.

Varijacija ovakvog načina uzorkovanja je da se generiše samo jedan slučajan početni broj, a dalje se biranje članova populacije u uzorak nastavlja po koraku m·k. Kada se dođe do kraja spiska, biranje se nastavlja od početka spiska. Svaki prolazak kroz spisak populacije tretira se kao posebni poduzorak.

Dodatna prednost ovakvog načina biranja je to što prosek parametara popula-cije procenjenih na većem broju manjih uzoraka predstavlja bolju procenu nego jedan parametar procenjen na većem uzorku (Fajgelj, 2004).

Važno je napomenuti da, ukoliko interval uzorkovanja k=N/n nije ceo broj, dobijene procene parametara mogu biti pristrasne. Razlog je možda najlakše objasniti preko ponovljenog uzorkovanja iz iste populacije. Naime, u zavisnosti od slučajnog početnog broja, sistematsko slučajno uzorkovanje na osnovu zaokruženog decimalnog intervala uzorkovanja, rezultiraće uzorcima različite veličine (ne one koja je planirana). U uzorcima različite veličine relativni doprinos pojedinačnog rezultata je različit i to je izvor pristrasnosti. Naravno, što je uzorak veći, ta pristrasnost će biti manja, ali će ipak postojati.

Kako bi se ovo izbeglo moguća je modifikacija sistematskog slučajnog uzorko-vanja ukoliko je veličina populacije poznata. U tom slučaju, posle određivanja intervala uzorkovanja (koraka) koji je decimalan broj, kao vrednost k uzima se ceo broj pre decimale. Slučajni početni broj se ne određuje u intervalu između 1 i k kao u osnovnoj varijanti, već u intervalu između 1 i N. Zatim se slučajni početni broj deli intervalom uzorkovanja, a kao početni broj koristi se ostatak. Pojasnićemo na primeru:

Ukoliko je veličina populacije N=400, a želimo da odaberemo 30 ispitanika, interval uzorkovanja će biti k=400/30=13,33. Vrednost k zaokružićemo na 13. Zatim ćemo izabrati slučajni broj između 1 i 400 kao početnu tačku uzorkovanja. Recimo da je to broj 363. Podelićemo ga sa k.

363/13=27,92

Pošto 363 nije deljiv bez ostatka sa 13, dobićemo ostatak 12 jer je:

363-(27∙13)=363-351=12

Page 73: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

62

Kao slučajnu početnu tačku uzorkovanja uzećemo broj 12.

Ukoliko bi slučajna početna tačka sistematskog slučajnog uzorkovanja bila u intervalu između 1 i k, prethodni račun ne bi bio potreban.

Drugi način da se pristupi ovom problemu je da se decimalna vrednost k zaokruži na veći broj. U tom slučaju, kako bismo ostvarili planiranu veličinu uzorka potrebno je spisak populacije tretirati kao cirkularan. Naime, kada se dođe do kraja spiska (a nije odabran potreban broj ispitanika), brojanje je potrebno nastaviti od početka.

U prethodnom primeru to bi značilo da k zaokružujemo na 14. Izaberemo slučajni početak izme-đu 1 i 14 i od njega biramo svakog 14 ispitanika. Recimo da je slučajni početak broj 6. Biraćemo ispitanike pod rednim brojem 6, 20, 34... Do rednog broja 398 biće odabrano 29 ispitanika. Nedo-stajaće nam 1 ispitanik do željenog broja. U tom slučaju nastavićemo brojanje dalje. Pošto nam je do broja 400 ostalo samo 2 ispitanika, počećemo brojanje od početka spiska i doći do broja 12 (jer je 14-2=12). Kao poslednjeg ispitanika odabraćemo 12. na spisku.

Na sistematsko slučajno uzorkovanje može se gledati i kao na lakši način da se sprovede stratifikovano slučajno uzorkovanje (Fajgelj, 2004; Groves, 2009). Za to je potrebno da spisak populacije sadrži dodatne podatke o obeležjima po kojima želimo da stratifikujemo uzorak. Ako takvi podaci postoje, potrebno je spisak sortirati po tom obeležju (ili više njih), a tek unutar njega po imenima (nazivima) elemenata populacije. Dalje postupak teče uobičajeno, a broj ispitanika iz pojedinih stratuma biće proporcio-nalan zastupljenosti stratuma na spisku populacije. O stratifikovanom slučajnom uzor-kovanju biće više reči u nastavku.

4.3.1.2. Klaster uzorkovanje

Klaster uzorkovanje je vid uzorkovanja u kojem se metodom slučajnog biranja uzorkuju klasteri. Klasteri su grupe ili celine jedinica iste vrste (razredi su klasteri učenika, preduzeća su klasteri zaposlenih...). Oni prirodno i prostorno objedinjuju jedi-nice iste vrste. Upravo zbog toga (manjeg prostornog raspršenja) ovaj način uzorkova-nja rezultira nižom cenom i vremenski kraćim prikupljanjem podataka i jedan je od najčešće korišćenih metoda uzorkovanja (Fajgelj, 2004). Osim toga, okviri uzorkovanja čije su jedinice klasteri, a ne npr. pojedinci, su mnogo dostupniji ili ih je lakše kreirati.

Čak i kada nam je cilj da uzorkujemo samo neke jedinice od kojih se klasteri sastoje, a ne same klastere, ovaj način uzorkovanja može umanjiti cenu i vreme potreb-no za kreiranje odgovarajućeg okvira uzorkovanja. Kao što je već rečeno, adekvatni okviri uzorkovanja koji se sastoje od pojedinaca ili domaćinstava najčešće nisu dostup-ni, a cena kreiranja jednog takvog okvira za neku veću populaciju bi bila velika. Ukoliko nam je takav okvir neophodan, moguće je taj posao pojeftiniti i skratiti tako što ćemo u prvoj fazi iskoristiti mnogo dostupnije i jeftinije okvire čije su jedinice klasteri. Slučaj-nim uzorkovanjem možemo izabrati uzorak klastera, a okvir sa manjim jedinicama uzorkovanja kreirati samo za uzorak klastera, a ne celu populaciju. Dalje se proces uzorkovanja nastavlja nekom metodom slučajnog biranja jedinica unutar odabranih klastera (nekim od ranije opisanih načina), na osnovu novokreiranog okvira uzorkova-

Page 74: Bojan Janičić - digitalna.ff.uns.ac.rs

UZORKOVANJE

63

nja. Iz svakog odabranog klastera bira se onoliko jedinica koliko je potrebno da bi se ostvarila željena proporcija uzorkovanja (f). Ovakav način uzorkovanja naziva se dvo-fazno jednostavno klaster uzorkovanje.

Prosečni pokazatelj za jednostavne klaster uzorke možemo izračunati na slede-ći način (Groves, 2009):

�̅�𝑥𝑘𝑘𝑛𝑛𝑝𝑝 =∑ ∑ 𝑥𝑥𝑖𝑖𝑘𝑘𝐵𝐵

𝑖𝑖=1𝐾𝐾𝑘𝑘=1

𝐾𝐾𝐾𝐾 [ 9 ]

gde je xik pojedinačni rezultat jedinice (ispitanika) i iz klastera k, B broj ispitanika u klasterima, a K broj klastera.

Dakle, potrebno je prvo sabrati skorove ispitanika unutar klastera, zatim sabra-ti sume dobijene na klasterima, i na kraju podeliti ih ukupnim brojem ispitanika (proiz-vod broja ispitanika po klasteru i broja klastera). Pretpostavka je da su svi klasteri jed-nake veličine. Ukoliko nisu jednaki, umesto veličine B moguće je koristiti prosečnu veli-činu klastera. Preporuka je da prilikom klaster uzorkovanja, klasteri budu približno jednake veličine.

Ukoliko klasteri nisu jednake veličine može se koristiti i sledeći izraz:

�̅�𝑥𝑘𝑘𝑛𝑛𝑝𝑝 = �

1𝐾𝐾���

𝐾𝐾𝑘𝑘𝑏𝑏𝑘𝑘��𝑥𝑥𝑖𝑖𝑘𝑘

𝑏𝑏𝑗𝑗

𝑖𝑖=1

𝐾𝐾

𝑘𝑘=1

[ 10 ]

gde je K broj klastera, indeks k označava određeni klaster, Bk je broj jedinica u klasteru k (veličina klastera), bk je broj jedinica u uzorku koje potiču iz klastera k, a xik je vred-nost posmatranog obeležja pojedinačnog ispitanika i iz klastera k.

Uzoračka varijansa klaster uzorka dalje se može izračunati kao:

𝑣𝑣𝑘𝑘𝑛𝑛𝑝𝑝 = �1 − 𝑓𝑓𝐾𝐾𝐾𝐾

� 𝑠𝑠𝐾𝐾2 [ 11 ]

gde je 𝑠𝑠𝐾𝐾2 varijansa prosečnih skorova svih klastera oko zajedničke aritmetičke sredine, a K broj klastera.

Varijansa prosečnih skorova svih klastera oko zajedničke aritmetičke sredine računa se na sledeći način:

𝑠𝑠𝐾𝐾2 = �

1𝐾𝐾 − 1

��(�̅�𝑥𝑘𝑘 − �̅�𝑥𝑘𝑘𝑛𝑛𝑝𝑝)2𝐾𝐾

𝑘𝑘=1

[ 12 ]

U prethodnom izrazu �̅�𝑥𝑘𝑘 je prosečna vrednost u klasteru k, a �̅�𝑥𝑘𝑘𝑛𝑛𝑝𝑝 je prosek dobijen izrazom [ 9 ]. Vrednost fK u izrazu [ 11 ] dobija se kao odnos veličine uzorka klastera i populacije klastera (fK=K/NK).

Standardna greška klaster uzoraka može se izračunati kao:

Page 75: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

64

𝑠𝑠𝑠𝑠𝑘𝑘𝑛𝑛𝑝𝑝 =𝜎𝜎𝑘𝑘𝑛𝑛𝑝𝑝√𝐾𝐾

[ 13 ]

gde je 𝜎𝜎𝑘𝑘𝑛𝑛𝑝𝑝standardna devijacija klaster uzorka, a k broj klastera u uzorku.

Standardna devijacija klaster uzorka se može izračunati na sledeći način:

𝜎𝜎𝑘𝑘𝑛𝑛𝑝𝑝 = �∑ (�̅�𝑥𝑘𝑘 − �̅�𝑥𝑘𝑘𝑛𝑛𝑝𝑝)2𝐾𝐾

𝑘𝑘=1

𝐾𝐾 − 1�

𝑁𝑁𝑘𝑘𝑁𝑁𝑘𝑘 − 1

[ 14 ]

Efekat nacrta (engl. design effect) uzorkovanja na uzoračku varijansu parame-tra, definiše se kao odnos varijanse distribucije uzorkovanja izračunate metodom za pri-menjeni nacrt uzorkovanja i metodom za proste slučajne uzorke (Groves, 2009). Označa-va se sa d2 i računa na sledeći način:

𝑑𝑑2 =𝑣𝑣𝑘𝑘𝑛𝑛𝑝𝑝𝑣𝑣𝑝𝑝𝑝𝑝𝑝𝑝

[ 15 ]

S obzirom da se radi o efektu na varijansu distribucije uzorkovanja, efekat na standardnu devijaciju uzorkovanja (standardnu grešku parametra) možemo dobiti ako izračunamo kvadratni koren iz d2.

d2 može biti jednak 1, ako su dve varijanse distribucije uzorkovanja jednake, odnosno – klasterizacija nema efekta. Efekat nacrta može biti veći od 1 kada postoji efekat klasterizacije i ona doprinosi povećanju uzoračke greške. Ukoliko je efekat manji od 1, onda klasterizacija smanjuje uzoračku grešku (vrlo retko).

Na primer, ukoliko su na uzorcima (jednom klaster i jednom prostom slučajnom) veličine nklu=npsu=500 dobijene sledeće varijanse uzoračke distribucije za neku varijablu vklu=6,25 i vpsu=1,83, onda je d2=6,25/1,83=3,42. U tom slučaju klaster uzorkovanje bi povećalo interval poverenja i standardnu grešku parametra za 85% jer je kvadratni koren iz d2 1,85.

Efekat nacrta možemo iskoristiti i da procenimo smanjenje preciznosti procena parametara u terminima veličine uzorka (Groves, 2009). Ako veličinu klaster uzorka podelimo efektom nacrta (d2), dobićemo veličinu prostog slučajnog uzorka koji bi imao istu preciznost, odnosno efektivnu veličinu uzorka (engl. effective sample size).

U prethodnom primeru to bi izgledalo ovako:

neu=nklu/d2=500/3,42=146,20

Dakle, veličina prostog slučajnog uzorka koja bi dala istu preciznost (istu standardnu grešku parametra) kao klaster uzorak nkl=500 je neu=146. To istovremeno znači da ukoliko želimo da pos-tignemo istu preciznost koju bismo dobili sa npsu=500, potreban nam je značajno veći klaster uzo-rak (3,42 puta veći).

Efekat nacrta je veći, odnosno klaster uzorkovanje povećava varijansu distribu-cije uzorkovanja u većoj meri, što su klasteri heterogeniji među sobom, a homogeniji unutar sebe. Osim toga, što su klasteri međusobno različitiji, to će biti relativno homo-

Page 76: Bojan Janičić - digitalna.ff.uns.ac.rs

UZORKOVANJE

65

geniji unutar sebe.

Postoje nalazi koji ukazuju da unutrašnja homogenost klastera zavisi i od nji-hove veličine. Klasteri su obično homogeniji što su manji (Valliant, Dever, & Kreuter, 2013).

Kao pokazatelj homogenosti klastera koristi se stopa homogenosti. Stopa homogenosti je vrsta intraklasnog koeficijenta korelacije koji meri povezanost mera na nekoj varijabli unutar klastera u odnosu na povezanost elemenata u ukupnoj populaciji. Za jednostavne klaster uzorke može se izračunati na sledeći način:

𝐼𝐼𝐼𝐼𝐼𝐼 = 𝜌𝜌 =

∑ ∑ ∑ (𝑥𝑥𝑘𝑘𝑖𝑖 − �̅�𝑥𝑘𝑘𝑃𝑃)�𝑥𝑥𝑘𝑘𝑘𝑘 − �̅�𝑥𝑘𝑘𝑃𝑃�𝑏𝑏𝑘𝑘𝑘𝑘≠𝑖𝑖

𝑏𝑏𝑘𝑘𝑖𝑖

𝑁𝑁𝐾𝐾𝑘𝑘=1

(𝑁𝑁𝐾𝐾𝑏𝑏𝑘𝑘 − 1)(𝑏𝑏𝑘𝑘 − 1)𝑆𝑆2 [ 16 ]

gde je NK broj klastera u populaciji, bk broj jedinica u k-tom klasteru, i i j su indeksi za različite jedinice (ispitanike), indeks k označava konkretni klaster, �̅�𝑥𝑘𝑘𝑃𝑃 je populacijski prosek za klaster k, a S2 je varijansa konačne populacije. Ona se računa na sledeći način:

𝑆𝑆2 = ��

(𝑥𝑥𝑘𝑘𝑖𝑖 − �̅�𝑥𝑃𝑃)2

𝑁𝑁𝐾𝐾𝑏𝑏𝑘𝑘 − 1

𝑏𝑏𝑘𝑘

𝑖𝑖=1

𝑁𝑁𝐾𝐾

𝑘𝑘=1

[ 17 ]

gde je �̅�𝑥𝑃𝑃 populacijski prosek parametra x. U praksi se tražene populacijske vrednosti (koje često nisu dostupne) zamenjuju procenama na osnovu podataka iz uzorka.

Stopa homogenosti, odnosno intraklasni koeficijent korelacije, može se izraču-nati i iz nacrta analize varijanse30, na sledeći način:

𝐼𝐼𝐼𝐼𝐼𝐼 = 𝜌𝜌 =𝑏𝑏𝑘𝑘

𝑏𝑏𝑘𝑘 − 1 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆

[ 18 ]

gde je SSW suma kvadrata unutar grupa (engl. sum of squares within groups), a SST ukupna suma kvadrata (engl. total sum of squares)(Lavrakas, 2008).

Stopa homogenosti može uzimati vrednosti od −1/(𝑏𝑏𝑘𝑘 − 1) do 1. Klaster uzor-kovanje će rezultirati većom preciznošću od prostog slučajnog uzorkovanja kada se stopa homogenosti kreće u rasponu od −1/(𝑏𝑏𝑘𝑘 − 1) do 0. Što je vrednost ρ bliža 1, homogenost po posmatranom obeležju će biti veća unutar klastera nego kada se pos-matra populacija u celini (Lavrakas, 2008). To će uzrokovati smanjenu preciznost pro-cene parametra populacije, odnosno njenu veću standardnu grešku.

Zašto je stopa homogenosti još bitna? Ona stoji u sledećem odnosu sa efektom nacrta uzorkovanja:

𝑑𝑑2 = 1 + (𝑏𝑏𝑘𝑘 − 1)𝜌𝜌 [ 19 ]

30 Jednosmerna ANOVA sa klasterima kao jedinom nezavisnom varijablom (fak-

torom).

Page 77: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

66

i

𝜌𝜌 =𝑑𝑑2 − 1𝑏𝑏𝑘𝑘 − 1

[ 20 ]

To znači da će efekat nacrta biti veći što je stopa homogenosti ρ veća, ali i što je veći broj elemenata klastera u uzorku (bk). Ako je stopa homogenosti 0, d2 će biti jednak 1, odnosno neće biti efekta nacrta. Ako je stopa homogenosti manja od 0, efekat nacrta će biti manji od 1 i klaster uzorkovanje će biti efikasnije od prostog slučajnog biranja. Međutim, najčešća situacija je da se stopa homogenosti nalazi u intervalu između 0 i 1. Što je bliža 1, efekat nacrta biće veći, a klaster uzorak manje efikasan od prostog slučaj-nog uzorka iste veličine (Groves, 2009).

Ako ne možemo uticati na stopu homogenosti, možemo na broj elemenata koje ćemo birati iz svakog klastera. Poduzorkovanjem u okviru klastera može se smanjiti efekat nacrta klaster uzorkovanja. Drugim rečima, u slučaju kada je 0<ρ≤1, bolje je ima-ti manji broj ispitanika po klasteru, a veći broj klastera. Ovo je tačnije što je ρ bliža 1.

Poduzorkovanje je procedura kojom se slučajnim izborom iz prethodno slu-čajno izabranih klastera bira poduzorak jedinica istraživanja. Na ovaj način ne ispitu-jemo sve jedinice u klasteru, nego neki manji deo. Ako imamo u vidu odnos efekta nacr-ta (d2) i broja jedinica po klasteru (bk) (izraz [ 19 ]), možemo zaključiti da umanjivanjem broja ispitanika iz jednog klastera (bk) umanjujemo i efekat nacrta. Ako želimo da zadr-žimo isti ukupan broj ispitanika, potrebno je da povećamo broj klastera. Pošto d2 nije osetljiv na broj klastera, to znači da ćemo poduzorkovanjem ostvariti veću preciznost klaster uzorka za jednaki broj ispitanika (ili istu na manjem klaster uzorku). Drugim rečima, efektivna veličina klaster uzorka biće veća (Groves, 2009).

Primenimo to na prethodni primer i zamislimo da je d2 u njemu izračunat na 20 klastera veličine Bk=25. Na osnovu izraza [ 24 ] mogli bismo izračunati stopu homogenosti:

ρ=(3,42-1)/(25-1)=0,1008

Sada kada smo procenili ρ možemo na osnovu izraza [ 22 ] proceniti koliki bi d2 bio kada bismo umesto 20 klastera sa po 25 ispitanika, imali 25 klastera iste veličine sa poduzorcima od 20 ispita-nika (bk=20).

d2=1+(20-1)∙0,1008=2,92

Vidimo da je na ovaj način negativan efekat nacrta manji (2,92<3,42). Efektivna veličina uzorka iznosiće:

neu=500/2,92=171,23

Setimo se da je u prethodnom slučaju ona iznosila 146,20.

Dok su klaster uzorci veličine 25 povećavali standardnu grešku parametra za 85%, poduzorci od 20 ispitanika to čine za 71%.

Page 78: Bojan Janičić - digitalna.ff.uns.ac.rs

UZORKOVANJE

67

Ovaj pozitivan efekat smanjenja broja ispitanika po klasteru na preciznost procena biće veći kad je stopa homogenosti veća. Naravno, nacrt uzorkovanja sa manjim brojem ispitanika po klasteru i većim brojem klastera poskupljuje istraživanje. Na istraživaču je da proceni da li raspolaže potre-bnim sredstvima i da li stepen povećanja preciznosti opravdava povećanje u ceni istraživanja.

Važno je napomenuti da stopa homogenosti, pa tako ni negativan efekat nacrta, neće biti jednaki za sve varijable u jednom anketnom istraživanju. Biće najveći za obele-žja po kojima su klasteri najhomogeniji, a najmanji za obeležja po kojima su klasteri najheterogeniji.

4.3.1.3. Stratifikovano slučajno biranje

Za razliku od prethodno opisanih metoda uzorkovanja, stratifikovano slučaj-no biranje zahteva podelu populacije na grupe – stratume, a samo biranje članova uzorka vrši se u okviru stratuma.

U ovom načinu uzorkovanja, populacija se deli na određen broj stratuma koji se ne preklapaju, a svi zajedno obuhvataju celokupnu populaciju. Za odluku o podeli uzor-ka na stratume važna je činjenica da je obeležje po kojem kreiramo stratume povezano sa pojavom koja se ispituje. To znači da se posmatrana pojava u razumnoj meri može predvideti na osnovu stratuma. Obeležje po kojem se vrši stratifikacija može biti, i obi-čno jeste, kvalitativno, ali može biti i kvantitativno. Ukoliko je kvantitativno ono se mora izdeliti u određen broj međusobno isključivih kategorija (Bethlehem, 2009). Pri-mer za takvo obeležje mogla bi biti starost u navršenim godinama.

Na primer, ukoliko je starost ispitanika povezana sa predmetom istraživanja, populaciju svih punoletnih stanovnika neke države mogli bismo podeliti po starosti na dva stratuma: na one do 40 godina i na starije od 40 godina. Prvom stratumu bi pripadali svi oni koji su punoletni, a još nisu navršili 40 godina. Drugom stratumu bi pripadali svi oni koji su navršili 40 godina ili su stariji. Nijedan ispitanik ne može istovremeno navršiti 40 godina i biti mlađi od 40 (isključivost), a mora pripadati jednoj od te dve kategorije (iscrpnost).

Nakon toga, biranje se vrši primenom slučajnog uzorkovanja (bilo kojim od ranije opisanih načina) u okviru svakog od stratuma. Iako je moguća varijanta u kojoj je broj ispitanika u uzorku koji potiču iz različitih stratuma jednak, on je obično proporci-onalan zastupljenosti tog stratuma u populaciji, i zato se naziva i proporcionalno bira-nje ili kvotno slučajno biranje (Fajgelj, 2004). Veličina uzorka iz nekog stratuma se određuje tako da odnos njegove veličine prema ukupnom uzorku (nh/n) bude jednak odnosu veličine stratuma prema ukupnoj populaciji (Nh/N).

Veličinu stratuma u odnosu na veličinu ukupne populacije možemo odrediti koristeći postojeće podatke najskorijeg popisa ili projekcija koje objavljuju nacionalni zavodi za statistiku.

Verovatnoća da element populacije bude izabran u uzorak jednaka je odnosu veličine uzorka iz stratuma kome pripada i veličine samog stratuma (fh=nh/Nh). Propor-cionalnost možemo obezbediti i tako što ćemo koristiti istu proporciju uzorkovanja (f=n/N) za sve stratume, a uzorkovanje obavljati odvojeno u okviru svakog stratuma.

Page 79: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

68

Postoji varijanta stratifikovanog slučajnog uzorkovanja u kojoj broj ispitanika po stratumima nije proporcionalan zastupljenosti stratuma u populaciji. Cilj ovakvog uzorkovanja je dalje smanjivanje standardne greške. Ovaj pristup uzima u obzir činjeni-cu da je standardna greška procene parametra veća kada je varijabilnost pojave veća. Zato se pored proporcije stratuma u populaciji (Wh) u obzir uzima i varijabilnost pojave unutar stratuma. Dakle, potrebno je poznavati i standardnu devijaciju pojave po stra-tumima u populaciji (sh – standardna devijacija varijable u posmatranom stratumu izra-čunata na uobičajeni način). Tada će veličina uzorka iz nekog stratuma h biti:

𝑛𝑛ℎ = 𝑛𝑛𝑆𝑆ℎ𝑠𝑠ℎ

∑ 𝑆𝑆ℎ𝑠𝑠ℎ𝐻𝐻ℎ=1

[ 21 ]

Prema tome, broj ispitanika u ukupnom uzorku koji će poticati iz nekog stra-tuma h neće zavisiti samo od njegove proporcije u populaciji već i od populacione vari-jabilnosti posmatrane pojave. Umesto populacione standardne devijacije mogu se koris-titi procene na osnovu prethodnih ili pilot istraživanja, a umesto proporcija stratuma u populaciji Wh, mogu se koristiti njihove procene na osnovu uzorka.

Ovaj način neproporcionalne alokacije stratuma naziva se Nejmanova alokaci-ja (Neyman) i može znatno smanjiti standardnu grešku procene parametra u odnosu na prosto slučajno uzorkovanje, ali i u odnosu na stratifikovano slučajno uzorkovanje. Ipak, nije previše efikasna kada se radi o proceni proporcija, a obično nije ista za sve varijable koje mogu biti predmet istog istraživanja (Groves, 2009).

Stratifikovano slučajno uzorkovanje se koristi iz više razloga. Može se koristiti kao mehanizam koji će obezbediti da sve bitne grupe populacije budu zastupljene pro-porcionalno svome udelu u populaciji. Prostim slučajnim biranjem (koje je nepristras-no) ćemo to verovatno ostvariti, ali ne i obezbediti.

Takođe, ako želimo da izračunavamo pokazatelje za svaku od bitnih podgrupa populacije, stratifikovano slučajno uzorkovanje je pogodan način kojim obezbeđujemo da veličine uzoraka za svaku od podgrupa budu adekvatne (Levy & Lemeshow, 1999).

Osim toga, greška uzorkovanja kod ovakvog tipa uzorka je manja nego kod pro-stog slučajnog uzorkovanja. Naime, slučajnim uzorkovanjem po stratumima kontroliše se mogući efekat stratuma i na taj način umanjuje varijansa distribucije uzorkovanja. Ovo je tačnije što su stratumi unutar sebe homogeniji, a heterogeniji između sebe (Faj-gelj, 2004). Naime, prostim slučajnim biranjem bismo ponavljajući uzorkovanje dobili veći varijabilitet dobijene strukture uzorka u odnosu na stratume. Stratifikovanim slu-čajnim biranjem bismo uvek dobili istu strukturu. Upravo ta razlika u strukturi uzorka kod prostog slučajnog biranja rezultira većom varijansom distribucije uzorkovanja, odnosno, većom uzoračkom greškom i širim intervalima poverenja za procene.

Procena parametra celokupne populacije na stratifikovanim uzorcima dobija se kao ponderisana suma procena dobijenih na stratumima (Groves, 2009).

Page 80: Bojan Janičić - digitalna.ff.uns.ac.rs

UZORKOVANJE

69

�̅�𝑥𝑝𝑝𝑝𝑝𝑝𝑝 = �𝑆𝑆ℎ�̅�𝑥ℎ

𝐻𝐻

ℎ=1

[ 22 ]

gde je �̅�𝑥 aritmetička sredina posmatrane varijable, indeks ssu označava da je ona dobi-jena na stratifikovanom slučajnom uzorku, indeks h označava pojedinačni stratum, a Wh je ponder koji označava proporciju stratuma u ukupnoj populaciji (Nh/N).

Na stratifikovanim uzorcima kod kojih je n po stratumima proporcionalan zas-tupljenosti stratuma u populaciji može se koristiti sledeći izraz (Marsden & Wright, 2010):

�̅�𝑥𝑝𝑝𝑝𝑝𝑝𝑝 =

1𝑛𝑛��𝑥𝑥ℎ𝑖𝑖

𝑛𝑛ℎ

𝑖𝑖=1

𝐻𝐻

[ 23 ]

gde je xhi vrednost posmatrane varijable za i-tog ispitanika iz h-tog stratuma.

Varijansa uzoračke distribucije za svaki pojedinačni stratum31 može se dobiti na sledeći način:

𝑣𝑣ℎ = �1 − 𝑓𝑓ℎ𝑛𝑛ℎ

� 𝑠𝑠ℎ2 [ 24 ]

gde je fh proporcija uzorkovanja, tj. odnos veličine uzorka iz konkretnog stratuma nh i ukupnog uzorka n (fh=nh/n), a 𝑠𝑠ℎ2 varijansa posmatranog stratuma.

Varijanse uzoračke distribucije za stratume možemo uvrstiti u jednačinu za varijansu uzoračke distribucije ukupnog uzorka:

𝑣𝑣𝑝𝑝𝑝𝑝𝑝𝑝 = �𝑆𝑆ℎ𝑣𝑣ℎ

𝐻𝐻

ℎ=1

= �𝑆𝑆ℎ �1 − 𝑓𝑓ℎ𝑛𝑛ℎ

� 𝑠𝑠ℎ2𝐻𝐻

ℎ=1

[ 25 ]

Kvadratni koren ove veličine je standardna greška parametra dobijenog na stratifikovanom uzorku, odnosno njegova uzoračka greška koja se može koristiti za gradnju intervala poverenja pokazatelja dobijenog na osnovu izraza [ 22 ]. Prethodni izrazi su namenjeni kontinuiranim varijablama, ali se lako mogu adaptirati za proporci-je.

Iz navedenih izraza vidimo da će ukupna uzoračka greška [ 25 ] biti manja što su manje varijanse distribucije uzorkovanja pojedinačnih stratuma [ 24 ], a one će biti manje što su varijanse unutar stratuma manje. To će biti slučaj ako su stratumi unutar sebe homogeni po posmatranom obeležju. Ukoliko su pri tome heterogeni između sebe, stratifikovano slučajno uzorkovanje daće preciznije procene parametra populacije od prostog slučajnog biranja. Ovaj efekat zavisiće i od veličine stratuma (veći stratumi –

31 Računa se onoliko pokazatelja koliko ima stratuma.

Page 81: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

70

veći efekat) i povezanosti stratuma sa posmatranom pojavom (Groves, 2009). Ukoliko ne postoji povezanost stratuma i posmatrane pojave ovaj efekat može biti mali ili ne mora ni postojati.

Efekat nacrta uzorkovanja može se izračunati na isti način kao kod klaster uzorkovanja. Ponovićemo, on je odnos varijanse distribucije uzorkovanja izračunate metodom za primenjeni nacrt uzorkovanja i metodom za proste slučajne uzorke (Groves, 2009). U ovom slučaju to je odnos varijanse distribucije uzorkovanja izračunate meto-dom za stratifikovano slučajno uzorkovanje i one izračunate metodom za prosto slučaj-no uzorkovanje.

𝑑𝑑2 =𝑣𝑣𝑝𝑝𝑝𝑝𝑝𝑝𝑣𝑣𝑝𝑝𝑝𝑝𝑝𝑝

[ 26 ]

d2 može biti jednak 1, ako varijansa distribucije uzorkovanja ne zavisi od strati-fikacije, odnosno ona nema efekta. Može biti manji od 1, kada postoji efekat stratifikaci-je i ona doprinosi smanjenju uzoračke greške. Ukoliko je veći od 1, onda stratifikacija povećava uzoračku grešku i nije opravdana.

Koliko stratifikacija doprinosi smanjenju greške možemo izračunati na sledeći način:

100 ∙ �1 − �𝑑𝑑2� [ 27 ]

Na taj način dobijamo procenat smanjenja (a ukoliko je vrednost negativna – povećanja) standardne greške kao rezultat stratifikacije.

Ako smo, na primer, dobili da je d2=0,76 onda je smanjenje greške:

100 ∙ �1 −�0,76� = 100 ∙ (1 − 0,87) = 100 ∙ 0,13 = 13%

Stratifikacija će gotovo uvek unaprediti preciznost procene parametra kada su stratumi smisleno određeni i kada su veličine poduzoraka iz određenih stratuma pro-porcionalne zastupljenosti tih stratuma u populaciji (Groves, 2009).

Smisleno određeni stratumi su oni koji su formirani po obeležju koje je pove-zano sa predmetom istraživanja.

Npr. ako znamo da se muškarci i žene razliku po stavovima prema abortusu, smisleno bi bilo oba-viti stratifikaciju po polu.

Vezu između različitih obeležja koja bi se mogla koristiti kao kriterijum strati-fikacije i predmeta istraživanja nije pametno pretpostavljati, već je dobro znati na osno-vu prethodnih istraživanja (svojih ili tuđih). Za razliku od klaster uzorkovanja kod kojeg na preciznost pozitivno utiče kada su klasteri heterogeni unutar sebe, kod stratifikova-nog slučajnog uzorkovanja situacija je obrnuta. Pošto je varijansa uzoračke distribucije stratifikovanog slučajnog uzorka ponderisana suma varijansi distribucije uzorkovanja za pojedinačne stratume (izraz [ 25 ]), logično je da će ona biti manja što su pojedinačne

Page 82: Bojan Janičić - digitalna.ff.uns.ac.rs

UZORKOVANJE

71

varijanse manje (Groves, 2009).

4.3.2. Neprobabilističko uzorkovanje

Neprobabilističko uzorkovanje se primenjuje kada ne postoji spisak populacije i kada sredstva kojima istraživač raspolaže ne dozvoljavaju njegovo kreiranje. Upotreb-ljavaju se u kvalitativnim istraživanjima, u pripremnim fazama kvantitativnih istraživa-nja (pilot istraživanja) i kada probabilističko uzorkovanje nije moguće (Fajgelj, 2004).

Neprobabilistički uzorci obično iza sebe imaju određen teorijski pristup. For-miraju se na takav način da po mišljenju istraživača imaju zadovoljavajuću tipološku reprezentativnost, odnosno da obuhvate dovoljan broj jedinica iz različitih grupa da bi se moglo zaključivati o njihovim sličnostima i razlikama (Lavrakas, 2008, str. 783)

Postoji veliki broj različitih strategija neprobabilističkog uzorkovanja, a može-mo ih podeliti u dve veće grupe: prigodne i namerne.

U engleskom jeziku postoji više termina za prigodne uzorke: accidental, hap-hazard, convenience, availability. Prva dva termina se u srpskom jeziku prevode na isti način: „slučajni“. Upotreba ovog termina bi stvorila zbrku pošto je sličan terminima koji se u našem jeziku koriste za razne vrste probabilističkih uzoraka. Iako su i ove varijante prigodnog uzorkovanja u izvesnoj meri slučajne, za razliku od probabilističkih nacrta uzorkovanja one ne pretpostavljaju da svaki član populacije ima nenultu verovatnoću da bude izabran u uzorak. Možda bi adekvatniji prevod ovih termina bio „nasumični“.

Primeri primene ovakvog načina uzorkovanja su anketiranje posetilaca neke manifestacije, posetilaca neke internet stranice, čitalaca određenih novina, ankete na internet portalima... Jasno je da u ovakav uzorak ne mogu ući oni koji se nisu našli na pomenutoj manifestaciji, internet stranici ili ne čitaju baš te novine. U suštini, ispitanici su izabrani zato što su u tom trenutku bili na raspolaganju (engl. available) istraživaču, odnosno istraživaču je to bilo pogodno (engl. convenient) .

Neprobabilistički uzorci su ipak najčešće namerni (Fajgelj, 2004). U engleskom jeziku za ovo se koriste dva termina: purposive i judgmental (Levy & Lemeshow, 1999). Kao što sam naziv govori, ovakav način biranja podrazumeva da istraživač namerno bira ispitanike za koje smatra da su mu potrebni kako bi najbolje ostvario svrhu istraži-vanja, odnosno ispitao pojavu koja ga zanima. To čini na osnovu procene kakav mu je sastav uzorka potreban da bi u tome uspeo. Ovakav način biranja karakteriše brzina i jednostavnost pristupa uzorku, što ga čini popularnim.

I ovde postoji veći broj različitih načina uzorkovanja, a najčešći su: kvotni, biranje lancem preporuka, biranje eksperata, biranje modalnih članova, heterogeno biranje.

Page 83: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

72

4.3.2.1. Kvotno uzorkovanje

Prilikom kvotnog uzorkovanja ne postoji okvir uzorkovanja, već se jedinice istraživanja biraju namerno kako bi realizovani uzorak imao odgovarajuću strukturu koju istraživač želi da ostvari. Obično se jedinice istraživanja biraju tako da reproduku-ju strukturu određenih grupa u populaciji.

Kvotno uzorkovanje počinje utvrđivanjem kvotnih kriterijuma. Kvotni krite-rijumi su obeležja članova populacije koja služe za određivanje strukture uzorka. Na osnovu ovih obeležja populacija se deli na međusobno isključive grupe (Gideon, 2012). Obično se radi o činjeničnim („tvrdim“) obeležjima čija je distribucija u populaciji poz-nata na osnovu popisa ili za to postoje odgovarajuće projekcije (Fajgelj, 2004). Najčešća obeležja koja se koriste su pol, starost, mesto stanovanja (selo/grad), nivo obrazovanja, socioekonomski status... Kao i kod stratifikovanog slučajnog uzorkovanja ova obeležja mogu biti kvalitativna, ali i kvantitativna. Ukoliko su kvantitativna moraju se pretvoriti u međusobno isključive i iscrpne kategorije (kao u donjem primeru sa starošću). Prili-kom kategorizacije (ili kako se nekada naziva intervalizacije), zbog uporedivosti nalaza potrebno je voditi računa da se koriste uobičajene podele. Nekada će istraživač na to biti primoran samim tim što će podaci o zastupljenosti određenih modaliteta kvotnog kriterijuma biti raspoloživi samo za uobičajene kategorizacije, odnosno istraživač će morati da prilagodi svoju kategorizaciju raspoloživim podacima (Fajgelj, 2004). „Meka“ obeležja poput stavova (pozitivni ili negativni), preferencija, osobina ličnosti... nisu pogodna kao kvotni kriterijumi jer obično nije poznata njihova distribucija u populaciji, niti su unapred poznate njihove vrednosti kod ispitanika kojima anketari prilaze.

Objasnimo to na primeru pozitivnih ili negativnih stavova o nekom važnom društvenom pitanju. Njihova distribucija u uzorku može biti prepuštena proceni istraživača, a stavove ispitanika možemo sondirati sa par pitanja na početku upitnika. Na osnovu tih pitanja moguće je kontrolisa-ti broj i proporciju ispitanika sa pozitivnim ili negativnim stavom prema predmetu istraživanja. Ovo je naročito lako izvesti u softveru za onlajn anketiranje kao što je LimeSurvey (Limesurvey GmbH, n.d.) koji ima ugrađenu podršku za kvote.

Neka od mekih obeležja mogu se posredno uzeti u obzir preko tvrdih obeležja sa kojima koreliraju (na primer preko geografskih područja za koja je poznato iz pret-hodnih istraživanja da imaju veću ili manju zastupljenost mekih obeležja).

Kao i kod određivanja obeležja za stratifikaciju, i kod kvotnih kriterijuma je bitno da se radi o obeležjima koja su relevantna za pojavu ili pojave koje su predmet istraživanja. Relevantna su ona obeležja koja su povezana sa posmatranom pojavom i na osnovu kojih se ona u izvesnoj meri može predviđati.

Prilikom definisanja kvotnih obeležja potrebno je voditi računa da ne budu preširoko definisana.

Ukoliko su starosne kvote definisane u preširokim intervalima, istraživač može završiti sa ispitani-cima samo sa jednog kraja intervala, a nedostatkom ispitanika sa drugog kraja tog intervala.

Page 84: Bojan Janičić - digitalna.ff.uns.ac.rs

UZORKOVANJE

73

Ako smo starosne kategorije koje koristimo kao kvotno obeležje definisali u intervalima od po 10 godina: 20–29, 30–39, 40–49... Moglo bi se desiti da iz prvog intervala dobijemo samo ispitanike 20–24 godina starosti, a iz drugog samo one 35–39 godina. Anketar je svoj zadatak obavio. Priku-pio je određen broj ispitanika iz zadatih intervala. Međutim, u tom slučaju nedostajali bi nam ispi-tanici stari 25–34 godine, što je interval koji obuhvata 10 godina. Kategorije kvotnih obeležja moraju biti definisane tako da nam obezbede ispitanike iz svih relevantnih grupa.

Nakon utvrđivanja kvotnih kriterijuma potrebno je utvrditi potreban broj ispi-tanika za svaki modalitet kvotnih kriterijuma. Zatim se bira prigodni uzorak iz svake od podgrupa dok se ne ostvari željeni broj ispitanika iz svake od njih (Gideon, 2012).

Vrlo često se proporcija zastupljenosti podgrupa u uzorku određuje tako da reprodukuje proporciju zastupljenosti tih grupa u populaciji. Može se koristiti isti pos-tupak koji se koristi za utvrđivanje broja ispitanika iz određenog stratuma kod stratifi-kovanog slučajnog uzorkovanja (4.3.1.3).

Na primer, ciljnu populaciju anketnog istraživanja predstavljaju svi radno sposobni državljani neke države, stariji od 19 i mlađi od 70 godina, oba pola. Kao kvotni kriterijum izabran je pol. Prema podacima sa popisa stanovništva u populaciji ima 49% muškaraca i 51% žena. Kao što je rečeno, muški i ženski ispitanici u uzorku moraju biti zastupljeni proporcionalno svojoj zastupljenosti u populaciji. Za kvotni uzorak veličine n=1.200 to znači da bi u njemu trebalo da bude 588 muških i 612 ženskih ispitanika. Odnosno:

nm=1.200∙49/100=588 i nž=1.200-588=612.

Ukoliko bi kao druga kvota (kvotni kriterijum) bila izabrana starost ispitanika, morali bismo izra-čunati proporcije zastupljenosti starosnih kategorija (recimo u intervalima od po 10 godina) i utvrditi potreban broj ispitanika iz svake kategorije u uzorku.

Polne i starosne kvote mogu biti odvojene ili vezane.

Ukoliko su odvojene, cilj je da u uzorku imamo određen procenat (ili proporciju, svejedno) muška-raca i određen procenat žena bez obzira kojoj starosnoj kategoriji pripadaju. Isto tako, cilj je da u uzorku imamo određen procenat ispitanika iz svake od starosnih kategorija, bez obzira na pol.

Ukoliko bi ove dve kvote bile vezane, cilj bi nam bio da u svakoj starosnoj kategoriji reprodukuje-mo polnu strukturu (i obrnuto) koja postoji u ciljnoj populaciji. Za svaku od kombinacija kategorija kvotnih kriterijuma potrebno je utvrditi proporciju zastupljenosti u populaciji koja mora biti rep-rodukovana u uzorku.

Na primer, ukoliko muškarci starosti 20–29 godina čine 10% ciljne populacije, onda moraju činiti i 10% uzorka. Dakle, ukoliko je to slučaj, postoji tačno određen broj ispitanika muškog pola starosti 20–29 godina i tačno određen broj ispitanika ženskog pola čije bi odgovore trebalo prikupiti (i tako za svaku od starosnih kategorija). Priču možemo i okrenuti i reći da, kada su u pitanju muški ispitanici, moramo prikupiti tačno određen broj ispitanika u svakoj od starosnih kategorija. Isto to važi i za žene. Primer vezanih kvota za pol i starost dat je u sledećoj tabeli (Tabela 2).

Page 85: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

74

Tabela 2 – Primer strukture kvotnog uzorka sa vezanim kvotama

muški ženski ukupno po starosti % n % n % n 20–29 10% 120 9% 108 19% 228 30–39 10% 120 10% 120 20% 240 40–49 10% 120 10% 120 20% 240 50–59 11% 132 12% 144 23% 276 60–69 8% 96 10% 120 18% 216 ukupno po polu 49% 588 51% 612 100% 1200

Kao što se vidi iz prethodnog primera, kvote mogu biti jednostavne, ali mogu predstavljati kombinaciju i dva ili više vezanih kvotnih kriterijuma. Kada postoje veza-ne kvote, mnogo je teže prikupiti sve tražene jedinice istraživanja (ispitanike) pošto one moraju zadovoljiti veći broj kriterijuma.

Preporuka je da se prvo traže one jedinice (ispitanici) koji su ređe u populaciji. Iz istog razloga preporučljivo je i da anketari budu sa područja na kojem se anketiranje sprovodi i poznaju „stanje na terenu“, odnosno imaju ideju gde bi takve ispitanike mogli pronaći.

Međutim, do vezivanja kvota dolazi neminovno, čak i ako to nije izričito zahtevano (Fajgelj, 2004). Zamislimo, na primer, kvotni uzorak n=1000 koji predviđa da je potrebno prikupiti odgovore 500 muškaraca i 500 žena, s tim da po 200 ispitanika bude iz svake od starosnih kategorija iz prethod-nog primera. Ne postoje zahtevi u vezi sa proporcijom muškaraca i žena iz svake od starosnih kategorija. Zamislimo, takođe, da smo na početku istraživanja prikupili odgovore od 500 žena i 400 muškaraca, a iz svake od prve četiri kategorije po 200 ispitanika i 100 iz pete kategorije. Samim tim, u nastavku istraživanja nećemo imati slobodu izbora i preostalih 100 ispitanika mora-ju biti muškarci između 60 i 69 godina.

S druge strane, ako kvote nisu vezane, uzorak neće reprodukovati zastupljenost određenih profila ispitanika koja postoji u populaciji (Fajgelj, 2004). Pod profilima se ovde podrazumevaju različiti sklopovi obeležja.

Iako ovakav način uzorkovanja podseća na stratifikovano slučajno uzorkova-nje, postoji suštinska razlika. U stratifikovanom slučajnom uzorkovanju jedinice popula-cije unutar stratuma biraju se slučajno, i anketar pri polasku na teren ima tačno određe-ne jedinice koje mora da ispita (ili bar tačno definisan način njihovog slučajnog izbora na licu mesta). Prilikom kvotnog uzorkovanja, anketar po svom nahođenju (prigodnim uzorkovanjem) bira one jedinice koje zadovoljavaju određene kvotne kriterijume (kvo-te). Problem nastaje u obeležjima jedinica istraživanja koja mogu biti značajno poveza-na sa predmetom istraživanja, a nisu definisana kroz kvote. Nekada anketari zbog ličnih sklonosti mogu birati ispitanike samo iz jedne podgrupe takvog obeležja. Zato istraži-vanja zasnovana na ovakvim uzorcima mogu dati vrlo pristrasne procene (Levy & Lemeshow, 1999).

Recimo da imamo kvotni uzorak kao u prethodnom primeru, a da je predmet istraživanja povere-nje u „alternativnu medicinu“ (nadrilekare). Očekivano bi bilo da veće poverenje imaju osobe

Page 86: Bojan Janičić - digitalna.ff.uns.ac.rs

UZORKOVANJE

75

nižeg obrazovanja. S obzirom da to nije definisano kroz kvote, anketara ništa ne sprečava da sve ispitanike prikupi među ispitanicima nižeg (ili višeg, svejedno) nivoa obrazovanja, sve dok je zado-voljio odgovarajuću starosnu i polnu strukturu.

Zašto bi to anketar uradio? Recimo da, pošto je i sam visokoobrazovan (ali nije našao posao u struci) anketar ima više prijatelja sličnog stepena obrazovanja i da mu je jednostavno bilo zgodni-je da ispita njih, nego da se malo više potrudi i nađe ispitanike različitih nivoa obrazovanja. Ovu grešku možemo pripisati anketaru, ali veća je odgovornost na samom istraživaču. Ako onome ko je planirao istraživanje nivo obrazovanja nije bio dovoljno značajan da postane kvotni kriterijum, zašto bi bio važan anketaru?

U stratifikovanim slučajnim uzorcima, taj problem se prevazilazi (ili bar zna-čajno umanjuje) slučajnim biranjem unutar stratuma (Hansen, Hurwitz, & Madow, 1953). Slučajno biranje je nepristrasno kada su u pitanju obeležja koja su značajno pove-zana sa predmetom merenja, a nisu definisana kao stratumi.

Obeležja koja služe kao kvotni kriterijumi za izbor ispitanika, ujedno su i krite-rijumi na osnovu kojih se na kraju procenjuje reprezentativnost realizovanog uzorka. Reprezentativnost uzorka se ocenjuje poređenjem proporcije zastupljenosti modaliteta kvotnih kriterijuma u populaciji i realizovanom uzorku.

U kvotnim uzorcima mogu učestvovati i geografska obeležja, pa se kvote poput onih predstavljenih u prethodnoj tabeli (Tabela 2) moraju dalje razdeliti po punktovi-ma. Ukoliko istraživač želi da reprodukuje zastupljenost podgrupa populacije u uzorku, mora voditi računa da u različitim geografskim regionima kvote ne moraju biti iste kao na celokupnoj populaciji (npr. u siromašnijoj regiji gde muškarci često idu u inostrans-tvo zbog posla, može biti veći procenat žena nego u ostalim krajevima države).

Problem kod kvotnog uzorkovanja je i to što kvote moraju biti celi brojevi. U narednoj tabeli (Tabela 3) prikazan je kvotni obrazac za neki anketni punkt na kome je potrebno prikupiti 22 ispitanika. U obrazac su samo radi ilustracije, u zagradama, navedeni i realni brojevi ispitanika koji bi trebalo da budu ispitani na tom anketnom punktu poštujući proporciju tog punkta u ukupnoj populaciji i uzorku (proporcije grupa su iste kao u prethodnoj tabeli – Tabela 2). Kao što se može primetiti brojevi su zaokru-ženi na najbliži ceo broj, i to nije veliki problem.

Međutim, postoje i veći problemi. Možemo zamisliti anketni punkt na kome treba prikupiti 50 ispitanika u istraživanju sa vezanim kvotama po polu, starosti i obra-zovanju. Na tom punktu potrebno je anketirati 1% visokoobrazovanih muškaraca stari-jih od 60 godina. To bi u apsolutnim brojevima značilo ½ ispitanika. Ukoliko bi anketar ispitao jednog ispitanika, to bi značilo da će visokoobrazovani muškarci stariji od 60 godina na tom punktu biti nadreprezentovani. To se mora kompenzovati na nekom drugom punktu sa sličnom strukturom uzorka.

Page 87: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

76

Tabela 3 – Kvotni obrazac za anketni punkt

kvote po polu ukupno kvote po starosti muški ženski 20–29 2 (2,20) 2 (1,98) 4 (4,18)

30–39 2 (2,20) 2 (2,20) 4 (4,40)

40–49 2 (2,20) 2 (2,20) 4 (4,40)

50–59 2 (2,42) 3 (2,64) 5 (5,06)

60–69 2 (1,76) 2 (2,20) 4 (3,96)

ukupno 11 (10,78) 11 (11,22) 22 (22,00)

4.3.2.2. Ostali načini biranja

Biranje lancem preporuka je jedan od češće korišćenih načina neprobabilistič-kog biranja. Najčešće se koristi za uzorkovanje retkih i skrivenih populacija. U ovom načinu biranja kreće se od spiska određenog broja elemenata populacije koji je istraži-vaču dostupan. Početne jedinice mogu biti birane slučajno, ali najčešće je izbor uslov-ljen dostupnošću (Heckathorn, 1997). Ukoliko jedinica pristane da učestvuje u istraži-vanju, od nje se osim učešća u anketi traži da navede određen (fiksni) broj članova populacije koji bi mogli biti potencijalni ispitanici. Postupak se ponavlja na jedinicama za koje je istraživač saznao od prethodnih ispitanika. Ova ponavljanja se obično naziva-ju talasima (engl. waves). Postoji niz postupaka koji se bazira na ovom principu. Najpo-znatiji je postupak biranja metodom grudve snega (engl. snow-ball sampling), nazvan po analogiji sa grudvom snega koja, valjajući se niz padinu, postaje sve veća i veća. Ova-kav i slični načini biranja se nazivaju još i biranjem putem lanca preporuka (engl. chain referral sampling).

Ovakav način uzorkovanja opterećen je brojnim problemima. Zaključivanje o pojedinačnim elementima istraživanja mora se zasnivati na inicijalnom uzorku, pošto se ostatak uzorka ne bira slučajno. Osobine realizovanog uzorka zavisiće od inicijalnog skupa od kojeg polazimo, a rečeno je da ni izbor inicijalnih jedinica najčešće nije sluča-jan. Dva različita inicijalna skupa ispitanika, mogu dati realizovane uzorke koji se zna-čajno razlikuju po bitnim karakteristikama. Pristrasnost inicijalnog skupa ispitanika reflektovaće se u konačnom uzorku bez obzira na broj talasa pa je ključno pitanje u ovakvom vidu uzorkovanja slučajni izbor inicijalnog skupa ispitanika (Heckathorn, 1997).

Uzorak će biti pristrasan pošto će učešće u istraživanju prihvatati kooperativni-ji ispitanici. Ovaj problem se pojačava ako inicijalni skup jedinica čine dobrovoljci (Hec-kathorn, 1997).

U slučaju skrivenih populacija, kod kojih je pitanje privatnosti potencirano, uzorak može biti pristrasan zbog toga što će ispitanici izbegavati da navedu svoje prija-telje kako bi ih zaštitili (ili da im se ne bi zamerili). Ova pojava se naziva maskiranje

Page 88: Bojan Janičić - digitalna.ff.uns.ac.rs

UZORKOVANJE

77

(engl. masking).

U ovakvom načinu uzorkovanja reflektuje se socijalno umrežavanje. Jedinice koje su delovi većih mreža mogu biti nadreprezentovane (više drugih jedinica će uputiti na njih), dok izolovanije jedinice mogu biti isključene.

Da bi prevazišli ove slabosti biranja lancem preporuka, istraživači koriste biranje ključnih izvestilaca (engl. key informant sampling) i ciljano uzorkovanje (engl. targeted sampling).

U metodi biranja ključnih izvestilaca, istraživač identifikuje ispitanike koji o predmetu istraživanja znaju puno i anketira ih o ponašanju drugih pripadnika ciljne populacije.

Za ciljano uzorkovanje bi se moglo reći da donekle koristi mehanizam stratifi-kacije. Prva faza ovakvog načina uzorkovanja je terenski rad na mapiranju ciljne popu-lacije i mreže povezivanja njenih članova. Cilj je da se izbegne pristrasnost pokretanja lanca uzorkovanja od jedne povezane grupe ispitanika. U drugoj fazi anketari pokušava-ju da regrutuju tačno određen broj ispitanika na svim relevantnim lokacijama i u svim relevantnim podgrupama (nešto poput stratifikacije). Kombinacija ciljanog uzorkovanja i biranja metodom grudve snega naziva se ciljanim uzorkovanjem ličnih mreža (engl. targeted personal network sampling). U ovom vidu uzorkovanja prva faza ciljanog uzor-kovanja koristi se za slučajni izbor inicijalnih ispitanika, a dalje se uzorkovanje nastav-lja metodom grudve snega.

Trebalo bi svakako pomenuti i uzorkovanje usmereno ispitanicima (engl. respondents driven sample – RDS), koje predlaže Hekatorn (Heckathorn, 1997; Kalton, 2009) i za koje kaže da rezul-tira uzorcima nezavisnim od inicijalnog skupa ispitanika, smanjuje pristrasnost usled maskiranja i dobrovoljnosti, a ima i mehanizme kontrole uticaja veličine ličnih mreža.

Ovaj metod biranja počinje takođe od nekog inicijalnog skupa ispitanika. Ovi ispitanici bivaju nagrađeni za učešće u anketnom istraživanju, ali i ako privole druge pripadnike ciljne populacije da se priključe istraživanju. Na taj način ispitanik je motivisan da učestvuje i da privoli druge da učestvuju. Ispitanici koji se priključuju u narednim talasima takođe mogu biti motivisani nagra-dom za učešće, ali trpe i socijalni pritisak pošto dodatna nagrada osobe koja im preporučuje učešće u istraživanju zavisi od njih. Na taj način se smanjuje uticaj dobrovoljnosti. Za razliku od drugih sličnih načina uzorkovanja, od ispitanika se ne traže podaci o drugim članovima ciljne populacije, već se od njega traži da on privoli potencijalne ispitanike da se sami prijave za istraži-vanje. Na ovaj način se eliminiše maskiranje, što je bitno kada su u pitanju skrivene populacije. Nadreprezentovanje koje zavisi od veličine ličnih mreža kontroliše se ponderisanjem recipročnom vrednošću subjektivno prijavljene veličine lične mreže, ciljanim uzorkovanjem mreža različitih veličina, i posebnim nagrađivanjem za regrutovanje pripadnika malih mreža.

Pored ovih načina uzorkovanja često se primenjuje biranje modalnih članova, biranje eksperata, heterogeno biranje i biranje kohorti.

Biranje modalnih članova (engl. modal instance sampling) je način uzorkova-

Page 89: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

78

nja u kojem se biraju tipični predstavnici ciljne populacije32. Ovakav način biranja vrlo je čest u marketinškim istraživanjima kada anketari prilaze i anketiraju osobe za koje smatraju (ili je to utvrđeno prethodnim istraživanjima) da su tipični predstavnici ciljne populacije. Tipičan predstavnik neke populacije može biti određen na osnovu tvrdih obeležja poput pola, starosti, obrazovanja, ali i mekih obeležja poput stavova. Kao i kod stratifikovanog i kvotnog uzorkovanja, bitno je da obeležja modalnih članova budu pažljivo odabrana. Nije dobro oslanjati se na „osećaj“. Mnogo bolje je osloniti se na prethodna istraživanja.

Jasno je da anketar ne može da oceni ko je tipični predstavnik ciljne populacije samo na osnovu izgleda ispitanika, već je potrebno da postavi i nekoliko pitanja za eli-minaciju nevalidnih jedinica istraživanja.

Koliko puta je samo autor ovog udžbenika eliminisan iz ankete samo zato što je anketar, nakon što ga je prevario autorov mladalački izgled, nakon prvog ili drugog pitanja shvatio da se prevario.

Biranje eksperata (engl. expert sampling) je metod uzorkovanja u kojem se biraju ispitanici koji su eksperti iz oblasti koji je predmet istraživanja. Potrebno je pret-hodno definisati šta su to eksperti. To mogu biti visokoobrazovani ljudi iz neke oblasti, ljudi koji se dugo bave tom oblašću i posebno su joj posvećeni (Fajgelj, 2004). Biranje eksperata se koristi za istraživanje pojava o kojima „obični ljudi“ nemaju dovoljno informacija.

Heterogeno biranje (engl. heterogeneous sampling) je metod uzorkovanja u kojem ispitanike biramo tako da uzorak bude što raznovrsniji po sastavu. Ovakav način uzorkovanja je pogodan kada želimo da spoznamo raznovrsnost neke pojave, odnosno da identifikujemo njen domen, a ne zanima nas stepen zastupljenosti njenih modaliteta u populaciji. Ovaj način uzorkovanja može posebno biti koristan u pripremnim fazama istraživanja kao pomoćno sredstvo prilikom konstrukcije mernog instrumenta.

Biranje kohorti (engl. cohort sampling) je način uzorkovanja kojim se biraju ispitanici (subpopulacije) koji dele neko zajedničko iskustvo (npr. rođeni su iste godine, završili školu ili diplomirali iste godine, doselili se ili odselili iste godine, zaposlili se...). Studije kohorti imaju više analitičku, a manje deskriptivnu svrhu (Levy & Lemeshow, 1999). Mogu se obavljati na populaciji ili na reprezentativnom uzorku.

Moguća je primena ovakvog uzorkovanja kako u transverzalnim nacrtima, tako i u longitudinalnim. U transverzalnim nacrtima možemo ispitivati razlike među genera-cijama po predmetu istraživanja. Na primer, kako se dvadesetogodišnjaci, četrdeseto-godišnjaci i šezdesetogodišnjaci razlikuju po upotrebi interneta. Međutim, u ovom nacr-tu može doći do efekta kohorti, odnosno do pojave da na razlike između kohorti ne utiče samo proteklo vreme, već i zajedničko delovanje drugih činilaca. U navedenom

32 Termin „modalni“ vodi poreklo od statističkog termina za dominantnu vred-

nost.

Page 90: Bojan Janičić - digitalna.ff.uns.ac.rs

UZORKOVANJE

79

primeru, tri kohorte razlikovaće se po materijalnom statusu, nivou obrazovanja, druš-tvenim vrednostima kojima su bile izložene u vremenu u kojem su odrastale. Ovaj efe-kat može se izbeći longitudinalnim nacrtom u kojem se kohorte prate tokom vremena, u formi panel istraživanja kohorti (engl. cohort panel study). Efekat kohorte se može eliminisati statistički ili jednačenjem grupa ukoliko su poznati faktori koji do njega dovode (Fajgelj, 2004).

4.4. Višefazno uzorkovanje

Nekada se uzorkovanje obavlja u više faza ili etapa. Tada govorimo o višefaz-nom uzorkovanju ili višeetapnom uzorkovanju (engl. multistage sampling). Razlozi za višefazno uzorkovanje mogu biti nepostojanje adekvatnih okvira uzorkovanja ili sma-njenje cene i vremena potrebnog za anketno istraživanje (Pfeffermann & Rao, 2010; Valliant et al., 2013).

Kao što je rečeno, ovakvo uzorkovanje se obavlja u više etapa. U svakoj od ovih faza koristi se drugi okvir uzorkovanja. Najčešća je situacija kada se populacija izdeli po teritorijalnom principu. Teritorija na kojoj je locirana populacija se deli hijerarhijski na geografske, administrativne, ekonomske, ili oblasti33 po nekom drugom kriterijumu, i u prvoj fazi se bira uzorak tih oblasti (Fajgelj, 2004). U ovoj fazi su jedinice uzorkovanja pomenute oblasti, a okvir uzorkovanja čini njihov spisak. Ove jedinice se često nazivaju klasterima, odnosno zonama (Fajgelj, 2004), pošto se radi o geografski definisanim klasterima.

Kada je izabran uzorak oblasti, unutar izabranih jedinica vrši se uzorkovanje novih jedinica, ovoga puta to mogu biti naselja. Sa spiska naselja bira se uzorak za svaku ranije odabranu oblast. U ovoj fazi jedinice uzorkovanja su naselja, a okvir uzorkovanja je spisak naselja u odabranim oblastima. Takođe, uzorkovanje može biti stratifikovano po tipu naselja ukoliko imamo indicije da je tip naselja povezan sa predmetom istraži-vanja.

Na kraju, u poslednjoj fazi biraju se jedinice posmatranja (npr. pojedinci). Dakle, u ovoj fazi jedinice uzorkovanja su pojedinci. Za njih obično nemamo okvire uzor-kovanja u formi liste, ali se mogu definisati kao procedure izbora stambene jedinice, domaćinstva i ispitanika unutar domaćinstva, koju anketar mora da sledi.

Jedinice uzorkovanja prve faze nazivaju se primarne jedinice uzorkovanja (engl. primary sampling units), druge faze sekundarne jedinice uzorkovanja (engl. secondary sampling units)... a poslednje faze jedinice posmatranja (engl. numeration units ili listing units) (Levy & Lemeshow, 1999).

Ovakvo uzorkovanje može imati dve ili više faza i najčešće se koristi neka for-ma probabilističkog uzorkovanja, ali nema prepreke da se obavlja i na neki drugi način.

33 Obično se koriste već postojeće podele.

Page 91: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

80

Za svaku fazu potrebno je utvrditi nacrt uzorkovanja vodeći računa o njegovim prednostima i manama (Bethlehem, 2009). Na primer, u dvofaznom nacrtu moguće je izabrati manji broj primarnih jedinica uzorkovanja i u okviru svake od njih veliki broj jedinica istraživanja, a moguće je izabrati i veliki broj primarnih jedinica i u okviru njih manji broj jedinica istraživanja. Posledice izbora prvog ili drugog nacrta uzorkovanja bile bi različite. Prvi nacrt bi smanjio potrebna sredstva i vreme potrebno za istraživa-nje smanjujući geografsko raspršenje jedinica istraživanja, ali bi verovatno doveo do povećanja standardne greške parametra usled snažnijeg efekta klasterizacije. Drugi nacrt bi bio skuplji i zahtevao više vremena za realizaciju ankete, ali bi dao veću preciz-nost, pa bi bio potreban manji uzorak. To bi, s druge strane, uticalo na smanjenje potre-bnih sredstava i vremena za realizaciju istraživanja.

Osim toga, potrebno je voditi računa i o činjenici da se u ovakvom načinu uzor-kovanja u svakoj fazi koriste različiti okviri uzorkovanja. Greške povezane sa slabosti-ma okvira uzorkovanja mogu nastati u svakoj od faza.

Primer višefaznog uzorkovanja na populaciji Republike Srbije mogao bi biti sledeći. Zamislimo istraživanje punoletnih građana Republike Srbije koji žive u domaćinstvima. Primarne jedinice uzorkovanja bi mogle biti okruzi, sekundarne naselja, a jedinice istraživanja pojedinci koji žive u domaćinstvima. Populaciju RS bi stoga trebalo izdeliti po okruzima, i naseljima.

Okruga u RS bez Kosova trenutno ima 24, a grad Beograd je posebna teritorijalna jedinica. Za spi-sak okruga i naselja u RS koristan je internet sajt Republičkog zavoda za statistiku. Tu je moguće naći šifarnik naselja sa podacima kojem okrugu i opštini pripadaju, kog su tipa (gradska ili osta-lo)... Moguća je stratifikacija okruga po tome da li se nalaze u Vojvodini ili centralnoj Srbiji (mada je moguća podela i na zapadni i istočni deo Srbije). Iz okvira uzorkovanja okruga je potrebno nekim načinom biranja (recimo stratifikovanim slučajnim biranjem) izabrati uzorak okruga.

U drugoj fazi je za svaki od okruga izabranih u prvoj fazi potrebno obezbediti spisak naselja (može se naći u pomenutom šifarniku). Sa spiska naselja se može prostim slučajnim uzorkovanjem ili, recimo, stratifikovanim slučajnim uzorkovanjem po tipu naselja odabrati uzorak sekundarnih jedinica uzorkovanja.

Na kraju, u poslednjoj fazi se biraju jedinice istraživanja. Ukoliko su to pojedinci najčešće nećemo imati spisak populacije. Ukoliko želimo da uzorkovanje bude slučajno potrebno je definisati pro-ceduru slučajnog biranja jedinica istraživanja koju anketari moraju slediti. Anketarima se mora odrediti polazna tačka, način kretanja po naselju („kreni levo, a kada dođeš do raskrsnice skreni desno“), način biranja stambenih objekata („uđi u svaku treću kuću ili zgradu“), način biranja stambenih jedinica u objektima u kojima ih ima više („svaka treća“), te način biranja jedinice istraživanja u višečlanim domaćinstvima („legitimna jedinica čiji je rođendan najbliži“ ili upotre-bom Kišovih tablica).

4.4.1. Kišove tablice

Kišove tablice su tablice slučajnih brojeva namenjene slučajnom biranju jedini-ca istraživanja na terenu. Ime su dobile po Lesliju Kišu (Leslie Kish) koji ih je predložio 1949. godine (Kish, 1949).

Page 92: Bojan Janičić - digitalna.ff.uns.ac.rs

UZORKOVANJE

81

redni broj domaćinstva

1 2 3 4 5 6 7 8

broj

legi

timni

h je

dini

ca u

do

mać

inst

vu

1 1 1 1 1 1 1 1 1 2 1 1 1 1 2 2 2 1 3 3 3 1 3 3 2 2 3 4 4 1 2 3 1 4 3 2 5 5 2 4 3 4 3 1 5 6 6 2 6 2 5 5 4 1 7 6 3 3 7 7 2 3 2 8 8 4 4 5 2 5 5 1 9 8 2 3 1 7 5 2 6

10 6 8 5 2 3 1 4 2

Na slici (Slika 3) prikazan je primer ovakve tablice za izbor jedinice istraživanja u istraživanju domaćinstava. U kolonama se nalaze redni brojevi domaćinstava (redos-led kojim ih anketar kontaktira), a u kolonama broj legitimnih jedinica po domaćinstvu. U preseku kolona i redova su slučajno generisani brojevi od 1 do broja legitimnih jedi-nica u domaćinstvu.

Upotreba ovih tablica je jednostavna. Na primer, ukoliko anketar dođe u domaćinstvo sa 4 legiti-mne jedinice (recimo, osobe starije od 18 godina), potrebno je da izabere osobu koja će odgova-rati na anketu. Redni broj osobe gledaće u četvrtom redu, u kom se nalaze slučajno generisani brojevi između 1 i 4. Drugi podatak koji je potreban anketaru je koje je to domaćinstvo po redu koje je (tog dana) kontaktirao. Recimo da je šesto. U tom slučaju potrebno je da pogleda presek šeste kolone i četvrtog reda. Na preseku se nalazi broj 4. Dakle, anketar će ispitati legitimnu jedi-nicu (osobu stariju od 18 godina) koja je četvrta po starosti u tom domaćinstvu.

Ovakve tablice je lako i generisati u Microsoft Excelu i njegovim OpenOffice i LibreOffice vari-jantama. Dovoljno je napraviti tabelu u čijim kolonama su redni brojevi domaćinstava, a u redo-vima različiti brojevi legitimnih jedinica. Zatim je po redovima potrebno uneti funkciju =RANDBETWEEN(1, X), gde je X broj legitimnih jedinica u domaćinstvu.

4.5. Veličina uzorka

Optimalni nacrt uzorkovanja podrazumeva takvo uzorkovanje koje će maksi-mizovati količinu dobijenih informacija u odnosu na raspoloživa finansijska sredstva i vreme, a istovremeno obezbediti željenu preciznost (Harkness, 2011).

Ponovićemo, osim dostupnosti adekvatnog okvira uzorkovanja, tri najvažnije komponente prilikom opredeljivanja za način uzorkovanja i optimalnu veličinu uzorka su: potencijalna cena istraživanja (i raspoloživa sredstva), vreme potrebno (i dostupno) za sprovođenje istraživanja, te potrebna i željena preciznost rezultata.

Slika 3 – Primer Kišove tablice

Page 93: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

82

Premali uzorak neće obezbediti željenu (potrebnu) preciznost rezultata, a pre-veliki uzorak može predstavljati nepotreban gubitak novca i vremena.

Kako veličina i način uzorkovanja utiču na cenu?

Što je uzorak veći, cena istraživanja je veća. U zavisnosti od primenjenog načina prikupljanja podataka potrebno je više anketara, više materijala (papiri), više telefon-skih poziva, putnih troškova... Ako se koristi slučajno uzorkovanje i anketiranje licem u lice, za isti broj ispitanika troškovi anketara i putni troškovi biće značajno veći nego ako koristimo klaster uzorkovanje. Klaster uzorkovanje u odnosu na prosto slučajno uzor-kovanje značajno smanjuje troškove vezane za anketare i putne troškove (ako se radi o anketama licem u lice), ali daje manje precizne rezultate, pa je za isti nivo preciznosti zaključaka potrebno prikupiti više ispitanika.

Za trenutak ćemo ostaviti po strani cenu i vreme potrebno za sprovođenje istraživanja pod određenim nacrtom uzorkovanja, i usredsredićemo se na željenu pre-ciznost.

Pod preciznošću se u anketnim istraživanjima najčešće podrazumeva širina intervala poverenja parametra populacije procenjenog na uzorku. Rekli smo da se interval poverenja gradi oduzimanjem i dodavanjem umnoška standardne greške parametra (uzoračke greške) na procenjeni parametar (detaljnije o intervalima pove-renja i nivoima poverenja u odeljku 5.1).

Pojam koji se u anketnim istraživanjima često spominje, a direktno je vezan za interval poverenja, je margina greške. Margina greške nije ništa drugo do polovina širine intervala poverenja. Drugim rečima margina greške je veličina za koju anketni statistik može promašiti pravi parametar populacije (za odabrani nivo poverenja).

Recimo da je jedno predizborno istraživanje pokazalo da će jedan od dva predsednička kandidata dobiti 52,3% glasova na predstojećim izborima. Ukoliko margina greške iznosi 3%, a nivo povere-nja 95%, to bi značilo da sa 95% sigurnosti možemo očekivati da će taj kandidat dobiti između 49,3 i 55,3% glasova. Dakle, može se desiti da taj kandidat izgubi (49,3%), ali i pobedi ubedljivije (55,3%).

Kada bi margina greške bila 1%, očekivani rezultat kandidata bi se kretao između 51,3 i 53,3% i sa 95% sigurnosti bismo mogli očekivati pobedu ovog kandidata.

Kolika će biti maksimalna margina greške za proporcije (pod pretpostavkom maksimalne varijanse), a u zavisnosti od veličine uzorka, može se proceniti vrlo lako:

𝑐𝑐 =0,5𝑧𝑧√𝑛𝑛

[ 28 ]

gde je z granična vrednost z statistika za određeni nivo poverenja (90% z=1,64; 95% z=1,96; 99% z=2,58), a n veličina uzorka. Sličnu procenu za intervalne varijable teško je dobiti pošto je za takve varijable teško proceniti maksimalnu varijansu ako nisu mere-ne.

Page 94: Bojan Janičić - digitalna.ff.uns.ac.rs

UZORKOVANJE

83

Prilikom planiranja istraživanja često unapred znamo kolika nam je preciznost potrebna, odnosno kolika je željena margina greške. Taj podatak se koristi za procenu potrebne veličine uzorka.

4.5.1. Određivanje optimalne veličine uzorka

U najvećem broju slučajeva potrebna veličina uzorka za prosto slučajno biranje može se izračunati na sledeći način (Lavrakas, 2008):

𝑛𝑛 =𝑧𝑧2𝑠𝑠2𝑁𝑁

𝑐𝑐2(𝑁𝑁 − 1) + 𝑧𝑧2𝑠𝑠2 [ 29 ]

gde je z granična vrednost z statistika za određeni nivo poverenja, s2 varijansa varijable koja nas zanima, N veličina populacije, a c željena margina greške posmatrane varijable u izvornim jedinicama merenja.

Ukoliko nam nije poznata veličina populacije ili je ona velika (preko 20.000), potrebna veličina uzorka može se aproksimirati na sledeći način:

𝑛𝑛 ≈𝑧𝑧2𝑠𝑠2

𝑐𝑐2 [ 30 ]

Prethodni izrazi namenjeni su kontinuiranim varijablama. Za proporcije mogu se koristiti sledeći izrazi:

𝑛𝑛 =𝑧𝑧2𝑝𝑝𝑝𝑝 + 𝑐𝑐2

𝑐𝑐2 + 𝑧𝑧2𝑝𝑝𝑝𝑝/𝑁𝑁 [ 31 ]

te za nepoznatu veličinu populacije ili velike populacije:

𝑛𝑛 ≈𝑧𝑧2𝑝𝑝𝑝𝑝 + 𝑐𝑐2

𝑐𝑐2 [ 32 ]

gde je pq varijansa binarne varijable (q=1–p), a c predstavlja željenu marginu greške (izraženu kao proporcija, a ne kao procenat).

U izrazima od [ 29 ] do [ 32 ] sve veličine su nam ili poznate (N) ili ih sami određujemo (z, c), osim s2 (ili pq). Na varijansu posmatrane varijable u populaciji ne možemo uticati. Problem je u tome što, da bismo izračunali potrebnu veličinu uzorka moramo poznavati varijansu varijable koja nas zanima pre nego što je uopšte ispitamo. Umesto populacione varijanse koja nam je najčešće nepoznata, u izraz možemo uvrstiti vrednost procene dobijene na prethodnim istraživanjima. Preporučuje se organizova-nje pilot istraživanja. Pilot istraživanje nam može obezbediti procenu populacione vari-janse varijable od interesa, a korisno je i za proveru pitanja i upitnika koji planiramo da koristimo, metodologije prikupljanja podataka, izbor varijabli koje želimo da prikupi-mo... To je razlog zbog kojeg je pilot istraživanje preporučena opcija. Ukoliko iz bilo kog razloga nismo u mogućnosti da ga organizujemo, možemo se poslužiti rezultatima pret-hodnih istraživanja, bilo da su ona naša ili drugih istraživača. Potrebno je da ta istraži-

Page 95: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

84

vanja budu što skorija i rađena na sličnim populacijama.

Ukoliko takvih istraživanja nema, kada su u pitanju binarne varijable možemo koristiti vrednost 0,25 što je maksimalna moguća varijansa binarne varijable (kada je proporcija svakog od ishoda jednaka i iznosi 0,5).

Kada je u pitanju kontinuirana varijabla, kao procena standardne devijacije može se koristiti vrednost jednaka četvrtini raspona. Naime, kod varijabli koje imaju normalnu distribuciju, raspon bi trebalo da obuhvata približno 4 standardne devijacije (Hozo, Djulbegovic, & Hozo, 2005). Pošto su nam u izrazima za računanje potrebne veličine uzorka potrebne varijanse, ovu vrednost potrebno je kvadrirati. Naravno, za ovaj račun su nam potrebne očekivane vrednosti maksimuma i minimuma varijable koja nas zanima, ali one su obično dostupnije.

Na primer, ako želimo da procenimo varijansu visine plate u nekoj državi i znamo da je minimalna plata 21.500 u nekoj valuti, a maksimalna 80.300, račun bi bio sledeći:

((8.030-2.150)/4)2=(5,880/4)2=1.4702=2.160.900

Sam postupak ove procene je ispravan, ali smo zarad primera zanemarili činjenicu da distribucija plata obično nema normalnu raspodelu.

Na ovaj način uzorak će biti dovoljno velik za željenu preciznost pokazatelja. U stvari, moguće je da će biti prevelik, ali će željena preciznost biti osigurana. Naravno, to će povećati troškove ankete – možda više nego što je zaista potrebno.

Važno je napomenuti da kada radimo proračun optimalne veličine uzorka moramo voditi računa da različite varijable (npr. odgovori na pitanja koja želimo da postavimo) imaju različite populacione varijanse. Ako veličinu uzorka određujemo da bismo postigli željenu preciznost procene parametra za neku varijablu čija je populaci-ona varijansa manja, procenjena optimalna veličina uzorka neće biti dovoljna da obez-bedi istu takvu preciznost za varijablu sa većom varijansom u sklopu iste ankete.

Zamislimo anketu sa samo dva pitanja. Prvo pitanje je „Da li ste za pristup naše zemlje EU?“, a drugo „Da li bi naša zemlja trebalo da pristupi NATO paktu?“. Željena margina greške je 3%, a nivo poverenja 95%. Planiramo da koristimo prosto slučajno uzorkovanje. Prethodna istraživanja (ili pilot) nam govore da je za pristup EU oko 75% populacije, a za pristup NATO oko 45%.

Ukoliko optimalnu veličinu uzorka planiramo u odnosu na prvo pitanje, ona će iznositi n=801 (optimalna veličina uzorka izračunata je na osnovu izraza [ 32 ]). Na uzorku ove veličine, margina greške za drugo pitanje iznosila bi c=0,0344 (3,44%), odnosno, preciznost bi bila manja od željene. Da bi opredeljenje ispitanika u vezi sa drugim pitanjem mogli da procenimo sa marginom greške 3% i nivoom poverenja od 95% potreban je uzorak veličine n=1057. U tom slučaju, margina greš-ke za prvo pitanje bi iznosila c=0,0261 (2,61%), što je preciznosti veća od željene.

Međutim, nisu nam sve varijable (sva pitanja) u anketi jednako važne, niti moraju imati jednaku željenu marginu greške. Prilikom određivanja optimalne veličine uzorka treba se voditi najvažnijim pitanjima. Potrebno je izračunati optimalne veličine uzorka za sva bitna pitanja. Ukoliko su one približno jednake, odluka o potrebnoj veliči-

Page 96: Bojan Janičić - digitalna.ff.uns.ac.rs

UZORKOVANJE

85

ni uzorka ne mora biti teška. Naravno, potrebno je imati u vidu i budžet istraživanja. Ukoliko budžet dozvoljava treba se opredeliti za najveću od dobijenih procena potreb-ne veličine uzorka (Cochran, 1977). Problem je ukoliko to nije moguće. U tom slučaju nekada je potrebno revidirati željenu marginu greške (ili eventualno nivo poverenja).

Takođe, ukoliko u populaciji postoje podgrupe za koje želimo da računamo posebne pokazatelje sa istim nivoom poverenja i željenom marginom greške, onda se proračun optimalne veličine uzorka odnosi na uzorak iz svake od podgrupa. Naime, iako će varijansa uzorkovanja obično biti manja u podgrupama nego u celokupnom uzorku, razlika će obično biti neznatna. Zato će u ovom slučaju potrebna veličina uzorka biti jednaka proizvodu izračunate potrebne veličine uzorka za celokupnu populaciju i broja podgrupa za koje želimo da izračunamo posebne pokazatelje (Cochran, 1977).

4.5.1.1. Potrebna veličina klaster uzorka

Potrebna veličina uzorka za jednostavno klaster uzorkovanje može se izraču-nati na sledeći način (Levy & Lemeshow, 1999):

𝑛𝑛𝑘𝑘𝑛𝑛𝑝𝑝 =𝑧𝑧2𝑁𝑁𝑘𝑘𝑣𝑣𝑘𝑘𝑛𝑛𝑝𝑝

𝑧𝑧2𝑣𝑣𝑘𝑘𝑛𝑛𝑝𝑝 + (𝑁𝑁𝑘𝑘 − 1)𝑐𝑐2 [ 33 ]

gde je z granična vrednost z statistika za određeni nivo poverenja, vklu varijansa uzor-kovanja varijable koja nas zanima (p prema izrazu [ 11 ]), Nk veličina populacije klaste-ra, a c željena margina greške.

Prethodni izraz namenjen je izračunavanju potrebnog broja klastera u uzorku za željenu marginu greške, kada nam je poznat broj klastera u populaciji. Podrazumeva se da su klasteri jednake veličine. Ukoliko nam nije poznat broj klastera u populaciji, veličina uzorka klastera može se aproksimirati na sledeći način:

𝑛𝑛𝑘𝑘𝑛𝑛𝑝𝑝 ≈𝑧𝑧2𝑣𝑣𝑘𝑘𝑛𝑛𝑝𝑝𝑐𝑐2

[ 34 ]

4.5.1.2. Potrebna veličina stratifikovanog slučajnog uzorka

Potrebna veličina uzorka za stratifikovano slučajno uzorkovanje može se izra-čunati na sledeći način:

𝑛𝑛𝑝𝑝𝑝𝑝𝑝𝑝 =𝑧𝑧2 ∑ 𝑆𝑆ℎ𝑠𝑠ℎ2/𝑐𝑐2𝐻𝐻

ℎ=1

1 + 𝑧𝑧2 ∑ 𝑆𝑆ℎ𝑠𝑠ℎ2/𝑐𝑐2𝐻𝐻ℎ=1 𝑁𝑁

[ 35 ]

gde je z granična vrednost z statistika za određeni nivo poverenja, 𝑠𝑠ℎ2 varijansa posmat-rane varijable u stratumu h (izračunata na uobičajen način), Wh – ponder, odnosno proporcija stratuma u populaciji, N veličina populacije, a c željena margina greške.

Page 97: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

86

Kada nije poznata veličina populacije, potrebna veličina uzorka se može aproksimirati na sledeći način:

𝑛𝑛𝑝𝑝𝑝𝑝𝑝𝑝 ≈ 𝑧𝑧2�𝑆𝑆ℎ𝑠𝑠ℎ2/𝑐𝑐2

𝐻𝐻

ℎ=1

[ 36 ]

Optimalna veličina uzorka za svaki stratum može se izračunati na osnovu sle-dećeg izraza:

𝑛𝑛ℎ = 𝑛𝑛𝑆𝑆ℎ𝑠𝑠ℎ/�𝑆𝑆ℎ𝑠𝑠ℎ

𝐻𝐻

ℎ=1

[ 37 ]

4.5.2. Cena istraživanja u zavisnosti od nacrta uzorkovanja

Cena istraživanja zavisiće, osim od metode prikupljanja podataka i veličine uzorka, i od primenjene metode uzorkovanja.

Cena anketnog istraživanja može se izračunati na sledeći način:

𝐼𝐼 = 𝐼𝐼𝑓𝑓 + 𝐼𝐼𝑖𝑖𝑛𝑛 [ 38 ]

gde je C ukupna cena anketnog istraživanja, Cf fiksni deo ukupne cene istraživanja koji ne zavisi od broja jedinica istraživanja, 𝐼𝐼𝑖𝑖 je cena po jedinici istraživanja, a n veličina uzorka.

Za stratifikovane uzorke, cena se može izračunati kao (Aczel & Sounderpandi-an, 2008):

𝐼𝐼 = 𝐼𝐼𝑓𝑓 + �𝐼𝐼ℎ𝑛𝑛ℎ

𝐻𝐻

ℎ=1

[ 39 ]

gde je Ch cena po jedinici istraživanja iz h-tog stratuma, a nh veličina uzorka ispitanika iz h-tog stratuma.

Ako to znamo, optimalnu veličinu stratifikovanog slučajnog uzorka u odnosu na raspoloživa sredstva možemo odrediti na sledeći način (Aczel & Sounderpandian, 2008):

𝑛𝑛 =�𝐼𝐼 − 𝐼𝐼𝑓𝑓�∑ 𝑆𝑆ℎ𝑠𝑠ℎ/�𝐼𝐼ℎ𝐻𝐻

ℎ=1

∑ 𝑆𝑆ℎ𝑠𝑠ℎ�𝐼𝐼ℎ𝐻𝐻ℎ=1

[ 40 ]

gde je sh je standardna devijacija h-tog stratuma, a Wh proporcija stratuma u populaciji.

Optimalna veličina uzorka po stratumima se dalje može izračunati koristeći izraz [ 21 ].

Kada su u pitanju klaster uzorci, cena se može izračunati na sledeći način (Mar-sden & Wright, 2010):

𝐼𝐼 = 𝐼𝐼𝑓𝑓 + 𝐼𝐼𝐾𝐾 · 𝐾𝐾 + 𝐼𝐼𝐵𝐵 · 𝐾𝐾 · 𝐾𝐾 [ 41 ]

Page 98: Bojan Janičić - digitalna.ff.uns.ac.rs

UZORKOVANJE

87

gde je K broj klastera, B broj jedinica istraživanja u klasteru, CK prosečna cena ankete u klasteru, CB prosečna cena anketiranja jedinice istraživanja.

Zatim se optimalna veličina uzorka (uzimajući budžet u obzir) pod pretpostav-kom jednakih veličina klastera može izračunati tako što prvo izračunamo optimalnu veličinu klastera:

𝐾𝐾𝑡𝑡𝑝𝑝𝑡𝑡 = �𝐼𝐼𝑎𝑎(1 − 𝜌𝜌)

𝐼𝐼𝐵𝐵𝜌𝜌 [ 42 ]

gde je Bopt – optimalna veličina klastera, ρ – stopa homogenosti izračunata prema izrazu [ 16 ].

Dalje je moguće izračunati optimalan broj klastera. Za to je potrebno da dobije-nu veličinu Bopt uvrstimo u izraz [ 41 ] za računanje ukupne cene klaster uzorka. Nakon toga potrebno je pronaći optimalan broj klastera:

𝐾𝐾𝑡𝑡𝑝𝑝𝑡𝑡 =𝐼𝐼 − 𝐼𝐼𝑓𝑓

𝐼𝐼𝐾𝐾 + 𝐼𝐼𝐵𝐵𝐾𝐾𝑡𝑡𝑝𝑝𝑡𝑡 [ 43 ]

Ukupan broj ispitanika može se izračunati kao proizvod optimalnog broja i optimalne veličine klastera (Kopt i Bopt).

4.6. Skala kredibiliteta za male uzorke

Kao što se može zaključiti, najznačajniji ometajući faktor pri uzorkovanju i biranju odgovarajućeg nacrta uzorkovanja je cena istraživanja. Istraživači su često pri-nuđeni da prave kompromise prilikom sprovođenja istraživanja. Alat koji bi mogao biti koristan istraživaču koji sa ograničenim sredstvima planira uzorak je Skala kredibiliteta za procenu kvaliteta malih uzoraka (Rossi et al., 1983).

Ova skala sadrži šest kriterijuma koji mogu poslužiti za procenu kvaliteta malih uzoraka i kredibilnosti zaključaka dobijenih na osnovu istraživanja koja su na njima zasnovana. Kriterijumi su svrstani u četiri veće kategorije: generalizabilnost, veličina uzorka, realizacija uzorka i korišćenje resursa. Svaki kriterijum nosi određenu količinu bodova, a skor kredibilnosti računa se kao proporcija ostvarenih bodova u odnosu na maksimum koji iznosi 35.

U okviru generalizabilnosti, koja predstavlja najznačajniju komponentu ove skale, razmatra se prostorno raspršenje uzorka, upotreba posebnih populacija i diskusi-ja ograničenja istraživanja.

Što je manje prostorno raspršenje veća je šansa da budu preskočene lokacije koje mogu značajno uticati na rezultate istraživanja. Kada je upotreba posebnih popula-cija u pitanju, ona može biti opravdana u nekim situacijama, posebno kada se testiraju neke teorije. Međutim, rezultati dobijeni na uzorcima iz takvih populacija ne mogu se generalizovati na opštu populaciju. Ukoliko se ovakvi uzorci ipak koriste za generaliza-ciju na opštu populaciju, uzorak mora biti temeljno ispitan i provereno postojanje pris-

Page 99: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

88

trasnosti bilo koje vrste (Rossi et al., 1983). Kada su u pitanju ograničenja istraživanja, potrebno ih je što bolje dokumentovati i prodiskutovati kako bi čitaoci i korisnici istra-živanja stekli ispravan utisak koliko i pod kojim uslovima mogu imati poverenja u rezultate istraživanja.

O veličini uzorka smo već detaljno govorili, ali važno je napomenuti da je potre-bno voditi računa da on mora imati potrebnu veličinu za sve planirane analize. Ukoliko je uzorak dovoljne veličine za analize koje se odnose na ukupnu ciljnu populaciju, to još uvek ne znači da je on dovoljan za analize koje se odnose na neke njene važnije podgru-pe. Npr. uzorak može biti dovoljne veličine da dobijemo procenu parametra zadovolja-vajuće preciznosti na ukupnom uzorku, ali ako parametre procenjujemo posebno za muškarce i žene, njihova preciznost biće manja od željene.

Tabela 4 – Skala kredibilnosti za male uzorke

Karakteristike skor A. Generalizabilnost 1. Prostorno raspršenje

jedna lokacija kombinovano više lokacija poređeno više lokacija

0

ograničeno prostorno raspršenje 4 veliko prostorno raspršenje 6 univerzum 10 2. Diskusija ograničenja nema je 0 kratka 3 detaljna 5 3. Upotreba posebnih populacija očigledne pristrasnosti koje mogu uticati na rezultate -5 prigodno, bez očigledne pristrasnosti 0 neophodno za testiranje teorije 5 opšta populacija 5 B. Veličina uzorka premali za smisaone analize ukupne populacije 0 adekvatan za neke, ali ne i za veće analize 3 adekvatan za svrhu istraživanja 5 C. Realizacija uzorka niska stopa odgovora, nasumičan uzorak 0 postoje dokazi lošeg terenskog rada 3 dobra stopa odgovora, postoji kontrola terenskog rada 5 D. Upotreba resursa loša 0 dobra 3 optimalna 5

(* adaptirano prema Rossi et al., 1983)

Page 100: Bojan Janičić - digitalna.ff.uns.ac.rs

UZORKOVANJE

89

Bitan kriterijum je i realizacija uzorka. Dobro isplaniran uzorak još uvek ne znači da će realizovani uzorak imati veličinu i strukturu potrebnu za ostvarivanje cilje-va istraživanja. Velika stopa neodgovora može ukazivati na loše sproveden terenski rad i može dovesti do pristrasnosti neodgovora (videti poglavlje 5.3).

Procena efikasne upotrebe resursa je nezavisna od apsolutnog kvaliteta uzorka, ali nekada je potrebno uzeti u obzir i činjenicu sa kakvim resursima je istraživač raspo-lagao (Rossi et al., 1983). To su situacije kada je potrebna brza reakcija istraživača kako bi se ispitalo neko aktuelno dešavanje i nema vremena za skupljanje sredstava za nacrt istraživanja koji bi možda bio bolji u nekoj drugoj situaciji.

Ne postoji kritična vrednost skora kredibilnosti. Kao što je rečeno, on predsta-vlja proporciju ostvarenih bodova u odnosu na maksimalno mogući broj bodova na skali koji iznosi 35. Skor kredibilnosti se kreće od 0 do 1 (mada teoretski može ići i ispod nule) i što je bliži 1 više poverenja možemo imati u rezultate istraživanja. Bez obzira na nedostatak kritičnog skora koji bi razlikovao dobro od lošeg istraživanja, navedeni kriterijumi mogu poslužiti istraživaču sa ograničenim sredstvima kao smerni-ce za planiranje kredibilnog istraživanja.

Page 101: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

90

5. Ukupna greška ankete

Ponovićemo da je cilj svakog anketnog istraživanja da na osnovu uzorka, koji bi trebalo da reprezentuje populaciju od interesa, izmeri tačnu vrednost nekog konstruk-ta. S obzirom da se ankete sprovode na uzorku, dobijene vrednosti neće biti parametri populacije već njihove procene. Te procene će u manjoj ili većoj meri odstupati od vred-nosti parametra u populaciji, odnosno sadržaće određeni nivo greške.

Neka je Y neki parametar populacije koji želimo da procenimo, y procena koju dobijamo na osnovu vrednosti dobijenih na uzorku. Ono što želimo da postignemo je:

𝐸𝐸(𝑦𝑦) = 𝑌𝑌 [ 44 ]

odnosno da je statističko očekivanje (E) ili prosek uzoračkih vrednosti y jednak vrednos-ti parametra Y u populaciji. To će se jako retko desiti. Češći slučaj je da se ove dve vred-nosti razlikuju, a ta razlika se naziva pristrasnost (engl. bias).

𝐾𝐾(𝑦𝑦) = 𝐸𝐸(𝑦𝑦) − 𝑌𝑌 [ 45 ]

Ako je B(y)=0 onda za procenu parametra populacije kažemo da je nepristras-na.

Za procenu parametra populacije poželjno je i da bude precizna, odnosno da ima što manju varijansu. Varijansu možemo izračunati na sledeći način:

𝑉𝑉(𝑦𝑦) = 𝐸𝐸(𝑦𝑦 − 𝐸𝐸(𝑦𝑦))2 [ 46 ]

Što je manja varijansa procene, ona je preciznija (Bethlehem, 2009).

Pristrasnost i varijansa procene su komponente greške procene parametra populacije.

U početku se podrazumevalo da greška anketnih pokazatelja ima samo jedan izvor – grešku uzorkovanja – odnosno ono što se u statistici naziva standardnom greš-kom parametra. Četrdesetih godina XX veka pogled na izvore greške u anketnim istra-živanjima počinje da se menja, a to će na kraju rezultirati pojmom ukupne greške ankete (engl. Total Survey Error). Ukupna greška ankete je konceptualni okvir koji pola-zi od pretpostavke da greška procene u anketnim istraživanjima nema jedan izvor. Stoga, prilikom planiranja i donošenja odluka u vezi sa načinom izvođenja anketnog istraživanja potrebno je uvažiti delovanje svih mogućih (relevantnih) izvora greške

Page 102: Bojan Janičić - digitalna.ff.uns.ac.rs

UKUPNA GREŠKA ANKETE

91

(Visser et al., 2000).

Različiti izvori greške anketnih pokazatelja mogu se podeliti na greške repre-zentovanja (engl. errors of representation) i greške povezane sa merenjem (engl. er-rors of measurement) (Whiteley, 2014).

Greške reprezentovanja nastaju pre svega zato što se procena parametra populacije bazira na uzorku. Ma koliko uzorak dobro reprezentovao populaciju od inte-resa, ipak se radi samo o uzorku i anketni statistik će se uvek razlikovati od parametra populacije. Greške reprezentovanja predstavljaju razliku anketnog statistika i prave vrednosti u populaciji nastalu pod uticajem veličine uzorka, proporcije uzorkovanja, nacrta uzorkovanja i varijabilnosti pojave u populaciji.

Greške u vezi sa merenjem nastaju kada podaci ne predstavljaju u potpunosti konstrukt koji se meri. Predstavljaju razliku između opažene i prave vrednosti merenog konstrukta na jedinici uzorkovanja.

U greške reprezentovanja spadaju: greška pokrivenosti, greška uzorkova-nja, greška neodgovora i greška podešavanja, a u greške u vezi sa merenjem spada-ju greška merenja i greška obrade. Greška podešavanja (engl. adjustment error) i greška obrade (engl. processing error) uzrok imaju u procedurama koje se odvijaju nakon što su podaci prikupljeni, u procesu pripreme podataka za analizu.

Iz perspektive koncepta ukupne greške ankete, greška procene (anketnog sta-tistika) nastaje kumulativnim delovanjem više izvora, i može se podeliti na:

grešku uzorkovanja grešku pokrivenosti grešku neodgovora grešku merenja ...

Kao što je već rečeno, sve ove vrste greške teorijski se mogu podeliti na kom-ponente koje se obično nazivaju pristrasnost i (nesistematska) varijansa34 (Groves, 2009, p. 60). Tako možemo govoriti o: pristrasnosti uzorkovanja i varijansi uzorkovanja, pristrasnosti pokrivenosti i varijansi pokrivenosti, pristrasnosti neodgovora i varijansi neodgovora, pristrasnosti greške merenja i varijansi greške merenja (Gideon, 2012).

U pristupu ukupne greške ankete za njeno matematičko predstavljanje koristi se koncept prosečne kvadrirane greške (engl. mean squared error – MSE), odnosno vari-janse greške. MSE je kompozitna mera i formalno se može predstaviti kao:

𝑀𝑀𝑆𝑆𝐸𝐸 = 𝑝𝑝𝑝𝑝𝑝𝑝𝑠𝑠𝑝𝑝𝑝𝑝𝑝𝑝𝑠𝑠𝑛𝑛𝑝𝑝𝑠𝑠𝑝𝑝2 + 𝑣𝑣𝑝𝑝𝑝𝑝𝑝𝑝𝑣𝑣𝑝𝑝𝑛𝑛𝑠𝑠𝑝𝑝 = 𝐾𝐾2 + 𝑉𝑉 [ 47 ]

34 U engleskom jeziku tačan termin je samo varijansa (variance), ali smisao

termina je nesistematska varijansa. S obzirom na efekat ovog vida greške, možda bi najadekvatniji termin bio „(ne)preciznost“, ili još „neodređenost“ (Fajgelj, 2013).

Page 103: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

92

Pristrasnost procene se manifestuje kao sistematsko potcenjivanje ili precenji-vanje parametra populacije, a varijansa kao nesigurnost procene. Drugim rečima, kada greška sistematski utiče da parametar populacije bude potcenjen ili precenjen, u pita-nju je pristrasnost.

Kada greška nije sistematska i rezultira nepreciznošću procene prave vrednosti parametra populacije, u pitanju je varijansa (Gideon, 2012).

Greška uzorkovanja ili uzoračka greška, kao što joj ime govori, vezana je za uzorkovanje (engl. sampling error) i postoji baš zato što se istraživanje radi na uzorku, a ne na populaciji. Ostale tri vrste grešaka nisu vezane za proces uzorkovanja (engl. non-sampling errors) i postoje nezavisno od njega. Iako je greška uzorkovanja najpoznatija i u literaturi je dobila najviše pažnje, ona čini samo mali deo ukupne greške ankete. Gide-on kaže da uzoračka greška čini samo 5% ukupne greške ankete, dok preostalih 95% čine greške iz drugih izvora (Gideon, 2012, p. 5). Ostatak greške se može podeliti i na izvore greške koji su vezani za neodgovore, i one koje su vezane za odgovore ispitanika. Greške vezane za neodgovore mogu poticati od odbijanja učešća u anketi ili odgovara-nja na pitanja (engl. refusals), nedostajućih odgovora (engl. missing), nemogućnosti ispitanika da odgovara, nerazumevanja... Greške vezane za odgovore ispitanika, s druge strane, mogu poticati od: socijalno poželjnih odgovora, osetljivosti teme, loše konstrui-sanih pitanja... Uticaj anketara može se ispoljiti u oba tipa greške.

Pored navedenih grešaka trebalo bi pomenuti i greške specifikacije i obrade (Gideon, 2012).

Greška specifikacije nastaje kada istraživač ne isplanira dobro istraživanje, odnosno, konstruiše upitnik u kojem pitanja i merene varijable ne reprezentuju dobro konstrukte koje bi trebalo da mere. Drugim rečima, kada je u pitanju ova greška radi se o nevalidnosti upitnika (Marsden & Wright, 2010). Greška se može izbeći ako se dovolj-no vremena posveti definiciji konstrukta koji se meri i tek onda konstruiše upit-nik/intervju.

De Lev i saradnici (De Leeuw et al., 2008) govore o četiri ugaona kamena anke-tnih istraživanja, a to su: greška uzorkovanja, greška neodgovora, greška pokrivenosti i greška merenja. Dobro konstruisano anketno istraživanje bi trebalo da minimizuje ova četiri izvora greške.

5.1. Greška uzorkovanja

Greška uzorkovanja ili uzoračka greška je razlika uzorka i populacije (Fajgelj, 2013). Preciznije, ona predstavlja razliku između procene nekog parametra populacije na uzorku i njegove stvarne vrednosti, nastalu kao rezultat uzorkovanja. Veličina ove greške zavisiće od metode uzorkovanja koja je primenjena. Kod probabilističkih uzora-ka greška je uglavnom nesistematska, dok neprobabilističko uzorkovanje nužno uvodi pristrasnost i čini generalizacije na populaciju nemogućim (Gideon, 2012).

Page 104: Bojan Janičić - digitalna.ff.uns.ac.rs

UKUPNA GREŠKA ANKETE

93

Kao što je ranije rečeno, svaka vrsta greški koje se mogu sresti u anketnim istraživanjima ima svoju sistematsku komponentu – pristrasnost, i nesistematsku – varijansu.

Varijansa uzorkovanja nastaje kao rezultat činjenice da ćemo na ponovljenim uzorcima iste veličine sa različitim jedinicama istraživanja iz ciljne populacije dobiti svaki put različite rezultate. Ovi rezultati neće sistematski biti viši ili niži od prave vre-dnosti procenjivanog parametra, već će slučajno varirati oko te vrednosti.

Ponovićemo... Svaki uzorak predstavlja samo jedan od mnogih mogućih uzora-ka iz ciljne populacije. Procena nekog parametra populacije na uzorku najčešće će se razlikovati od prave vrednosti parametra kada bi on bio izračunat na celoj populaciji (samo slučajno se te vrednosti mogu poklopiti). Šta više, procena parametra na svakom sledećem uzorku iste veličine iz ciljne populacije razlikovaće se od procene na prethod-nom uzorku i od vrednosti parametra u populaciji35. Prosek procena parametara na svim mogućim uzorcima iste veličine biće jednak parametru populacije. Variranje pro-cena parametra oko njegove prave vrednosti (u formi prosečnog kvadriranog odstupa-nja) naziva se varijansa distribucije uzoraka parametra. Kvadratni koren iz varijanse uzoraka parametara je standardna devijacija uzoraka parametara. U statistici se ovaj pokazatelj naziva standardnom greškom parametra.36

Zamislimo situaciju da istraživač želi da sazna prosečnu visinu punoletnih stanovnika Srbije. Da bi saznao vrednost tog parametra morao bi da izmeri visinu svih članova tako definisane populacije. Recimo da (nekim čudom) znamo da je to tačno 180 cm.

Pošto bi merenje visine svih punoletnih stanovnika Srbije bilo teško izvodljivo (ako ne i nemogu-će) i neekonomično, on se odlučio da to učini na uzorku veličine n=2.000. Na osnovu takvog uzor-ka dobio je procenu parametra (statistik) od M1=178 cm. Istraživanje je ponovio na drugom uzor-ku iste veličine i dobio vrednost M2=181 cm. Ponovio je merenje još jednom na trećem uzorku iste veličine i dobio je vrednost M3=179,5 cm. Istraživač bi na osnovu ovih nalaza mogao zaključiti da su punoletni stanovnici Srbije promenljive visine (što je u suštini tačno) ili se zainatiti da nasta-vi da meri dok ne dobije pravu vrednost. Recimo da se opredelio za drugu opciju i nastavio da meri sve dok nije merenje obavio na svim mogućim uzorcima iste veličine. Na svakom sledećem uzorku dobijao je različite vrednosti. U ovom trenutku, istraživač bi se mogao opredeliti da izra-čuna prosek svih procena parametra i bio bi u pravu. Dobio bi pravu vrednost parametra – M=180 cm. Kada bi izračunao standardnu devijaciju procena dobijenih na uzorcima oko te prave vredno-sti dobio bi standardnu grešku aritmetičke sredine. Problem je u tome što bi na taj način ipak izmerio celu populaciju...

Standardne greške u statistici služe za određivanje intervala poverenja proce-njenih parametara. Ako se prisetimo osobina normalne distribucije, znamo da se u intervalu M±1s (aritmetička sredina ± 1 standardna devijacija) nalazi 68,26% slučajeva, u intervalu M±1,96s – 95%, a u intervalu M±2,58s – 99% slučajeva. Već je rečeno da

35 Naravno, moguće je slučajno dobiti i iste vrednosti na više uzoraka. 36 Ako je parametar aritmetička sredina, onda je u pitanju standardna greška

aritmetičke sredine, a ako je u pitanju proporcija – standardna greška proporcije.

Page 105: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

94

standardna greška parametra predstavlja standardnu devijaciju uzoračkih statistika oko parametra populacije. Samim tim, ukoliko je njihova distribucija normalna, može-mo pretpostaviti da važe navedene pravilnosti. U tom slučaju, možemo oko dobijenog statistika (koji je samo procena vrednosti parametra populacije) izgraditi interval pove-renja, i sa određenim nivoom poverenja (sigurnosti) reći da se pravi parametar popula-cije nalazi u okviru tog intervala. Problem je što nam je za računanje standardne devija-cije uzoračkih parametara potrebna aritmetička sredina populacije koja nam je nepoz-nata.

Međutim, standardna greška parametra može se proceniti na osnovu standar-dne devijacije dobijene na uzorku i veličine uzorka. Varijansa distribucije uzoraka za aritmetičke sredine se može izračunati kao:

𝑆𝑆𝑀𝑀2 =𝑠𝑠2

𝑛𝑛 [ 48 ]

ili sa korekcijom za veličinu populacije:

𝑆𝑆𝑀𝑀2 =1 − 𝑓𝑓𝑛𝑛

𝑠𝑠2 [ 49 ]

gde je s2 varijansa merene varijable, n veličina uzorka, a f proporcija uzorkovanja (veli-čina uzorka/veličina populacije, odnosno n/N).

U izrazu [ 49 ], (1–f) predstavlja korekciju za veličinu populacije i umanjuje procenjenu vrednost standardne greške. Iz samog izraza se vidi da korekcija ima smisla kod manjih populacija (kada i f ima veću vrednost).

Već je rečeno da standardna greška parametra služi za formiranje intervala poverenja, a polovina širine intervala poverenja je margina greške. Kada procenimo neki parametar populacije i navedemo njegovu vrednost, sa određenim (odabranim) nivoom sigurnosti možemo reći da u njegovoj proceni nismo pogrešili više od vrednosti margine greške. Korekcija za veličinu populacije koriguje procenjenu varijansu uzorko-vanja i standardnu grešku parametra umanjujući ih. Na taj način sužava se interval poverenja, a margina greške postaje manja i naša predviđanja preciznija. Ako ovo pos-matramo iz drugog ugla, to bi značilo da za isti nivo preciznosti i poverenja u malim populacijama možemo koristiti manji uzorak. Uzorak manje veličine (ali ipak dovoljne) smanjiće cenu istraživanja i vreme potrebno za njegovo sprovođenje. Nije samo finan-sijski efekat bitan. Manje ispitanika znači manje posla u svakoj fazi istraživanja, manje opterećenje resursa i manje mogućnosti za nastanak greški iz svih pomenutih izvora.

Standardna devijacija distribucije uzoraka parametara odnosno standardna greška parametra za aritmetičke sredine je kvadratni koren iz njene varijanse:

𝑆𝑆𝑀𝑀 =𝑠𝑠√𝑛𝑛

[ 50 ]

ili sa korekcijom za veličinu populacije:

Page 106: Bojan Janičić - digitalna.ff.uns.ac.rs

UKUPNA GREŠKA ANKETE

95

𝑆𝑆𝑀𝑀 =𝑠𝑠(1 − 𝑓𝑓)

�𝑛𝑛(1 − 𝑓𝑓) [ 51 ]

Gore su prikazani izrazi ([ 50 ] i [ 51 ]) za izračunavanje standardnih grešaka aritmetičkih sredina. Račun za standardne greške proporcija binarnih varijabli razlikuje se samo u tome što se varijansa binarnih varijabli računa kao p·q, odnosno kao proizvod proporcija dvaju mogućih odgovora.

U formulama za varijansu uzorkovanja i standardnu grešku aritmetičke sredine potrebno je samo zameniti član s2 sa p(1–p) i s sa �𝑝𝑝(1 − 𝑝𝑝) da bi se dobile formule za varijansu uzorkovanja i standardnu grešku proporcije.

Varijansa uzorkovanja dihotomne varijable (proporcija) je tako:

𝑆𝑆𝑃𝑃2 =𝑝𝑝(1 − 𝑝𝑝)

𝑛𝑛

[ 52 ]

ili sa korekcijom za veličinu populacije:

𝑆𝑆𝑃𝑃2 =1 − 𝑓𝑓𝑛𝑛

𝑝𝑝(1 − 𝑝𝑝) [ 53 ]

Standardna greška proporcije se može izračunati kao:

𝑆𝑆𝑃𝑃 = �𝑝𝑝(1 − 𝑝𝑝)

𝑛𝑛

[ 54 ]

ili sa korekcijom za veličinu populacije:

𝑆𝑆𝑃𝑃 = �1 − 𝑓𝑓

𝑛𝑛𝑝𝑝(1 − 𝑝𝑝)

[ 55 ]

Npr. ako je na pitanje: „Da li ste za pristupanje naše zemlje Evropskoj Uniji?“, od 1.200 ispitanika njih 660 odgovorilo sa „Da“, a 540 sa „Ne“, p će biti p=660/1200=0,55. S druge strane, q će biti q=540/1200=0,45. q se može izraziti i kao q=1-p, odnosno u našem slučaju q=1-0,55=0,45. Shod-no tome, varijansa ove binarne varijable biće pq=p(1-p)=0,55∙0,45=0,2475. Standardna devijacija jednaka je kvadratnom korenu iz varijanse, pa će iznositi 0,4975. Napomena: ovaj primer se može primeniti i na pitanje „Za kog predsedničkog kandidata ćete glasati, kandidata P ili kandidata Q?“.

Iz izraza [ 50 ] i [ 51 ] vidimo da standardna greška procene parametra zavisi od varijabilnosti merene varijable i veličine uzorka. Standardna greška će biti veća što je varijabilnost posmatrane pojave veća, a uzorak manji. Pošto je varijabilnost pojave takva kakva je i na nju ne može da se utiče, na smanjenje standardne greške može se uticati samo povećanjem veličine uzorka.

Uzoračka pristrasnost je tendencija da se procena parametra populacije dobi-jena na osnovu analize na uzorku sistematski razlikuje od njegove prave vrednosti. Ispoljava se u vidu precenjivanja ili potcenjivanja prave vrednosti parametra. Nastaje

Page 107: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

96

kao rezultat nejednakih šansi elemenata populacije da budu birani u uzorak, kao što je slučaj u neprobabilističkom uzorkovanju. Uzoračka pristrasnost će biti tim veća što su razlike elemenata populacije u šansama da budu izabrani u uzorak više povezane sa predmetom merenja.

Ako su šanse elemenata populacije da budu izabrani u uzorak manje od pro-porcije njihove zastupljenosti u populaciji, prilikom slučajnog uzorkovanja to će verova-tno rezultirati i njihovom manjom zastupljenošću u uzorku. Za takve elemente kažemo da su podreprezentovani. Moguć je i obrnuti slučaj, da šanse elemenata populacije da budu izabrani u uzorak budu veće od proporcije njihove zastupljenosti u populaciji. To će prilikom slučajnog uzorkovanja najverovatnije rezultirati i njihovom uvećanom zas-tupljenošću u uzorku. Za takve elemente kažemo da su nadreprezentovani.

Ukoliko su u uzorku podreprezentovani oni sa nižim rezultatima, procena parametra populacije će biti precenjena. Ukoliko su podreprezentovani oni sa višim rezultatima, procena parametra će potcenjivati pravu vrednost. S druge strane, nadrep-rezentacija neke od grupa pomeriće procenu parametra u smeru rezultata nadrepre-zentovane grupe.

Problem sa pristrasnošću može se kompenzovati ponderisanjem. Ponderisa-nje je postupak u kojem se prilikom analize odgovorima pojedinačnih ispitanika iz gru-pa koje su u uzorku zastupljene neproporcionalno, pridaje manja ili veća važnost kako bi se kompenzovala manja ili veća zastupljenost ispitanika iz te grupe.

Ako ispitanika iz neke grupe u uzorku ima duplo manje nego što bi trebalo da bude na osnovu nji-hove zastupljenosti u populaciji, vrednosti njihovih odgovora možemo pomnožiti sa 2 i na taj način kompenzovati taj nedostatak. Ukoliko ih ima duplo više, njihove odgovore možemo pom-nožiti sa 0,5.

Međutim, pridavanjem veće (ili manje) važnosti njihovim odgovorima, menja-mo i uticaj njihovih odgovora na uzoračku varijansu koja može postati veća (Gideon, 2012).

Kao što je rečeno u poglavlju o uzorkovanju, na varijabilnost u uzorku (na osnovu koje se procenjuje standardna greška parametra) utiče i način uzorkovanja. Stratifikovano slučajno biranje utiče na smanjenje varijabilnosti u uzorku, dok je klaster uzorkovanje povećava. Ovo je sve izraženije što su klasteri ili stratumi homogeniji unu-tar sebe, a heterogeniji među sobom.

5.2. Greška pokrivenosti

Greška pokrivenosti nastaje kao rezultat slabosti okvira uzorkovanja koji se koristi za konstrukciju reprezentativnog uzorka. Ako okvir uzorkovanja ne omogućava da svaki od članova populacije bude izabran u uzorak, mogu se javiti pristrasnost pokrivenosti (engl. coverage bias) i varijansa greške pokrivenosti (engl. coverage variance). Kada je efekat slabosti okvira uzorkovanja sistematsko precenjivanje ili pot-

Page 108: Bojan Janičić - digitalna.ff.uns.ac.rs

UKUPNA GREŠKA ANKETE

97

cenjivanje prave vrednosti parametra u populaciji, radi se o pristrasnosti, a kada taj efekat nije sistematski radi se o varijansi greške pokrivenosti.

Varijansa nepokrivenosti nastaje kada deo populacije koji nije pokriven okvi-rom uzorkovanja nije sistematski povezan sa predmetom merenja, odnosno vrednosti parametra u tom delu populacije ne razlikuju se od vrednosti u pokrivenom delu.

Pristrasnost pokrivenosti nastaje kada su delovi populacije sistematski izos-tavljeni iz okvira uzorkovanja.

Na primer, ako ispitujemo prosečnu visinu primanja u nekom gradu i opredelimo se za telefonsku anketu koristeći telefonski imenik kao okvir uzorkovanja, može se desiti da u uzorku budu nedo-voljno zastupljeni ispitanici sa nižim primanjima koji nisu vlasnici stanova i nemaju telefone regis-trovane na svoje ime. U tom slučaju njihovi odgovori neće biti u dovoljnoj meri zastupljeni i obra-đeni, a kao rezultat toga procena prosečnih primanja na osnovu anketnog istraživanja biće viša od prave vrednosti.

Ova vrsta pristrasnosti postoji i može se uočiti i prepoznati i pre sprovođenja samog istraživanja (Gideon, 2012; Groves, 2011). Problem se može korigovati kombi-novanjem ili dopunom okvira uzorkovanja ukoliko je to moguće i isplativo (jer ova pro-cedura može biti skupa). Drugi način borbe protiv ove pristrasnosti je redefinisanje ciljne populacije tako da bude u skladu sa dostupnim okvirom uzorkovanja, ukoliko to zadovoljava ciljeve zbog kojih se sprovodi istraživanje. Nekada to može značiti i pro-menu metode prikupljanja podataka.

U slučaju da nam u odabranom okviru uzorkovanja nedostaju podaci o imejl adresi velikog broja članova populacije, ali zato imamo adrese stanovanja za većinu, možemo promeniti metodu pri-kupljanja podataka iz internet ankete u poštansku anketu (ili pokušati da pribavimo elektronske adrese).

Takođe, u istraživanju se može koristiti i dva ili više različitih okvira uzorkova-nja. U tom slučaju procena parametra populacije računa se kao ponderisani prosek više istraživanja. S obzirom da će u ovom slučaju pojedinci neproporcionalno doprinositi ovako izračunatom statistiku, doći će do veće (nesistematske) varijanse uzoračkih pro-cena, odnosno smanjene preciznosti rezultata, zahvaljujući grešci pokrivenosti (Gideon, 2012).

Veličina pristrasnosti pokrivenosti (𝑌𝑌�𝐶𝐶 − 𝑌𝑌�) može se proceniti na osnovu slede-ćeg izraza (Groves, 2011): 𝑌𝑌�𝐶𝐶 − 𝑌𝑌� =

𝑈𝑈𝑁𝑁

(𝑌𝑌�𝐶𝐶 − 𝑌𝑌�𝑈𝑈) [ 56 ]

gde je:

𝑌𝑌�𝐶𝐶 vrednost parametra kod pokrivenih ispitanika (onih u okviru uzorkovanja) 𝑌𝑌� vrednost parametra u ciljnoj populaciji 𝑌𝑌�𝑈𝑈 vrednost parametra kod nepokrivenih ispitanika (onih koji nisu u okviru uzor-kovanja)

Page 109: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

98

N veličina populacije U broj nepokrivenih, a legitimnih članova populacije (nisu u okviru uzorkovanja)

U ovoj formuli su nam obično nepoznati parametar populacije i parametar nepokrivenog dela populacije, pa vrednost pristrasnosti ne možemo izračunati, ali nam pruža uvid u činioce od kojih zavisi veličina pristrasnosti. Pristrasnost nepokrivenosti je proizvod stope nepokrivenosti (U/N) i razlike između parametara pokrivenog i nepokrivenog dela ciljne populacije. Pristrasnost pokrivenosti biće veća što je stopa nepokrivenosti veća (odnosno što je proporcija ispuštenog dela populacije veća) i što je veća razlika između parametara pokrivenog i nepokrivenog dela populacije. Važniji čini-lac je proporcija nepokrivenog dela populacije. Naime, čak i ako je razlika parametara u pokrivenom i nepokrivenom delu populacije velika, neće puno uticati na procenu parametra populacije ako je proporcija nepokrivenog dela mala (Biemer, 2010).

Greška pokrivenosti okvira uzorkovanja dovodi do toga da statistik koji smo dobili ne reprezentuje ciljnu već samo pokrivenu populaciju.

5.3. Greška neodgovora

Do pojave greške neodgovora (engl. nonresponse error) dolazi kada neke od jedinica istraživanja koje su izabrane u uzorak ne odgovore na pojedina pitanja ili na anketu u celini. Iako planirani uzorak može biti konstruisan tako da bude reprezentati-van za ciljnu populaciju, statistik koji je rezultat ankete može biti izračunat na realizo-vanom uzorku koji je usled neodgovora – nereprezentativan. Ukoliko je razlika između planiranog i realizovanog uzorka velika, neće biti moguće generalizovanje rezultata na

Slika 4 – Greška pokrivenosti

Page 110: Bojan Janičić - digitalna.ff.uns.ac.rs

UKUPNA GREŠKA ANKETE

99

ciljnu populaciju.

Odnos broja jedinica istraživanja koje su prihvatile učešće u anketi i planiranog broja jedinica u uzorku, naziva se stopa odgovora (engl. response rate). Suprotno tome, odnos broja jedinica koje ne odgovore na anketu (ili pitanje) i planiranog broja jedinica u uzorku, naziva se stopa neodgovora (engl. nonresponse rate).

Greška neodgovora nastaje kad postoji razlika između statistika dobijenog na osnovu odgovora jedinica koje su pristale da odgovaraju, i statistika koji bi bio dobijen na celokupnom uzorku37 (Groves, 2009).

Neodgovori mogu dvojako uticati na realizovan uzorak. Ukoliko su nesistemat-ski, uticaće samo na njegovu veličinu, a ne i na strukturu. Na ovaj način neodgovori će uticati na smanjenje preciznosti ankete pošto veličina standardne greške parametra raste sa smanjenjem uzorka na kojem je statistik izračunat. Drugim rečima, veći broj neodgovora će uticati na povećanje varijanse neodgovora.

S druge strane, ukoliko je odbijanje povezano sa predmetom merenja ili sa nekom drugom karakteristikom ciljne populacije, osim veličine biće narušena i struktu-ra uzorka. Na ovaj način možemo dobiti situaciju sličnu onoj koja postoji kada je u pita-nju greška pokrivenosti. Razlika je u izvoru greške. Kod greške pokrivenosti problem nastaje zbog nedostataka okvira uzorkovanja, a kod greške neodgovora zbog sistemat-skih neodgovora od strane ispitanika.

Na primer, ako učešće u anketi sistematski odbijaju pripadnici neke nacionalnosti jer ne postoji upitnik na njihovom maternjem jeziku, to će rezultirati da ta nacionalnost bude podreprezento-vana u realizovanom uzorku.

Što je odbijanje više povezano sa predmetom merenja, to će njegov uticaj na procene parametara biti veći. U slučaju da se parametri dela uzorka ispitanika koji su sistematski odbijali učešće u anketi i onih koji su učestvovali u anketi više razlikuju, veća će biti pristrasnost neodgovora. Pristrasnost neodgovora nastaje kada se odgo-vori onih ispitanika (jedinica) koji su pristali da učestvuju u anketi, sistematski razliku-ju od (potencijalnih) odgovora onih koji su odlučili da ne učestvuju (Gideon, 2012).

Zamislimo situaciju predizbornog istraživanja u situaciji kada u nekoj zemlji izbore organizuje autoritarna vlast koja želi da održi privid demokratije. Iako je uzorak planiran tako da bude repre-zentativan, može se desiti da u anketi odbiju učešće građani koji ne podržavaju tu vlast jer se boje da ih iskren odgovor može dovesti u „nezgodan položaj“. U zavisnosti od proporcije stanovništva koja podržava opoziciju, ovakvo odbijanje učešća može dovesti do manjeg ili većeg smanjenja veličine uzorka. Ukoliko je to problem, uzorak se može dopuniti tako da i dalje ima potrebnu veli-činu. Međutim, ukoliko je odbijanje učešća sistematsko, opet će učešće u anketi odbijati ispitanici koji se plaše reakcije vlasti. Dakle, čak i da dopunama uzorka ostvarimo njegovu planiranu veliči-nu, njegova struktura biće poremećena. To će rezultirati pristrasnošću anketnih procena popular-

37 Obratite pažnju da se govori o uzorku, a ne populaciji.

Page 111: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

100

nosti različitih političkih opcija tako što će precenjivati popularnost političke opcije na vlasti, a potcenjivati popularnost opozicije.

Koliki je uticaj pristrasnosti neodgovora može se proceniti na osnovu sledećeg izraza (Groves, 2009):

𝑦𝑦�𝑟𝑟 − 𝑦𝑦�𝑝𝑝 =𝑚𝑚𝑝𝑝

𝑛𝑛𝑝𝑝(𝑦𝑦�𝑟𝑟 − 𝑦𝑦�𝑚𝑚) [ 57 ]

gde je:

𝑦𝑦�𝑝𝑝 vrednost parametra u uzorku s 𝑦𝑦�𝑟𝑟 vrednost parametra kod ispitanika koji su odgovorili 𝑦𝑦�𝑚𝑚 vrednost parametra kod ispitanika koji nisu odgovorili ns veličina uzorka (suma broja odgovora i broja neodgovora) ms broj neodgovora

Možemo reći da veličina pristrasnosti neodgovora (𝑦𝑦�𝑟𝑟 − 𝑦𝑦�𝑝𝑝) zavisi od razlike u vrednosti parametara onih koji su odgovorili i onih koji nisu38 (𝑦𝑦�𝑟𝑟 − 𝑦𝑦�𝑚𝑚) i stope neodgo-vora (ms/ns). Pristrasnost neodgovora biće veća što je veća razlika između procenjivanih parametara kod onih jedinca koje su odgovorile i onih koje nisu. Takođe, pristrasnost će biti veća što je stopa neodgovora veća.

Iz ovog razloga, stopa neodgovora se ne može koristiti kao jedini pokazatelj kvaliteta anketnih statistika, odnosno kao pokazatelj pristrasnosti neodgovora. Pristra-snost neodgovora može biti velika iako je stopa neodgovora mala, ako je razlika u odgovorima jedinica koje su odgovorile i onih koji nisu – velika. S druge strane, ni viso-ka stopa neodgovora ne mora značiti da je pristrasnost velika, ako su razlike u odgovo-rima onih jedinica koje su odgovorile i onih koje nisu – male (Gideon, 2012). S obzirom da je pristrasnost neodgovora proizvod ove dve vrednosti (𝑦𝑦�𝑟𝑟 − 𝑦𝑦�𝑚𝑚 i ms/ns), ako zamis-limo situaciju u kojoj je 𝑦𝑦�𝑟𝑟 − 𝑦𝑦�𝑚𝑚 = 0, onda će i pristrasnost neodgovora biti jednaka 0, bez obzira na stopu neodgovora. Međutim, smanjenje stope neodgovora smanjuje rizik od pristrasnosti neodgovora (Groves, 2009).

Neodgovori se mogu manifestovati kao neodgovori na pitanja (engl. item non-response) i neodgovori na celokupnu anketu, odnosno neodgovori ispitanika ili jedini-ca (engl. unit nonresponse).

Kao što naziv govori, neodgovori na pitanja se odnose na situaciju kada jedinice koje prihvate učešće u anketi ne odgovore na pojedina pitanja. Neodgovori jedinica se

38 Ni u ovom izrazu obično ne možemo izračunati vrednost parametra za one

jedinice koje nisu odgovorile, ali na osnovu njega možemo shvatiti logiku uticaja neod-govora na pristrasnost uzorkovanja. Takođe, korisno je da se ponovo pokuša prikuplja-nje odgovora od jedinica koje su u prvom navratu odbile da odgovaraju u anketnom istraživanju. Na taj način se može doći do procene vrednosti parametra u delu populaci-je koji češće odbija da odgovora.

Page 112: Bojan Janičić - digitalna.ff.uns.ac.rs

UKUPNA GREŠKA ANKETE

101

odnose na situaciju kada jedinice istraživanja koje su izabrane u uzorak ne uzmu učešće u njoj, odnosno ne odgovore ni na jedno pitanje ili odgovore na vrlo mali broj pitanja, pa celokupni upitnik na kraju bude eliminisan iz obrade.

Problem sa neodgovorima na pojedina pitanja/stavke, nakon što su podaci pri-kupljeni, možemo pokušati da statistički rešimo zamenom nedostajućih odgovora upot-rebom neke od tehnika imputacije o kojima će biti reči kasnije (odeljak 10.5). Kada su u pitanju neodgovori jedinica, nakon što su podaci već prikupljeni, problem možemo pokušati da rešimo ponderisanjem, kao kod greške pokrivenosti. I imputacije nedosta-jućih podataka i ponderisanje uticaće na povećanje standardne greške parametra, odnosno na povećanje varijanse neodgovora (Gideon, 2012).

Zbog toga je bolje ovaj problem preduprediti i rešavati u ranijim fazama istra-živanja. Na primer, na smanjenje stope neodgovora može uticati i metod prikupljanja podataka. Metodi koji uključuju veći stepen interakcije sa ispitanikom (jedinicom istra-živanja) rezultiraju smanjenjem ove stope. Stopa neodgovora će biti najmanja kada se anketiranje obavlja licem u lice. Telefonske ankete imaju nešto višu stopu neodgovora od ličnog anketiranja, ali nižu od poštanskih ili internet anketa. Međutim, ovo ne važi u svim situacijama. Ako su pitanja osetljivije prirode, ispitanicima može smetati prisustvo anketara i povećati stopu neodgovora. Tehnikama za smanjenje stope neodgovora posvećeno je posebno poglavlje.

5.4. Greška merenja

Cilj svakog anketnog istraživanja je da proceni neki konstrukt što je preciznije moguće (Gideon, 2012). Postoji više razloga zašto nije moguće izmeriti „pravu vred-nost“. Varijabla čiju pravu vrednost istraživač želi da meri može biti manifestna (vidlji-va) varijabla koja je dostupna direktnom merenju (visina, težina, starost, zaposlenost, prihodi...), ali mnogo češće je u pitanju latentna varijabla čije direktno merenje nije moguće (zadovoljstvo poslom, životom u celini, stavovi prema važnim društvenim pita-njima, društvenim grupama, kvalitet života...).

Greška merenja u anketnim istraživanjima se može definisati i kao razlika koja se javlja između procenjene i prave vrednosti konstrukta (Gideon, 2012; Wolf, Joye, Smith, & Fu, 2016). Ona predstavlja odstupanje vrednosti konstrukta na jedinici uzor-kovanja od njegove prave vrednosti (Groves, 2009), ili odstupanje opažene/zabeležene vrednosti varijable od njene prave vrednosti (Fajgelj, 2013; Wolf et al., 2016). Naziva se još i greškom posmatranja (engl. error of observation) (De Leeuw et al., 2008).

I ovde možemo govoriti o dve komponente greške koje potiču iz ovog izvora: pristrasnosti i varijansi.

U meri u kojoj je ova razlika više sistematska, to će se statistik dobijen na uzor-ku više razlikovati od parametra populacije. Ako greška merenja ima usmerenje, odno-sno odgovori ispitanika sistematski potcenjuju ili precenjuju pravu vrednost, možemo

Page 113: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

102

govoriti o pristrasnosti merenja (engl. measurement bias). Ova pristrasnost se još naziva i pristrasnošću odgovora (engl. response bias).

Na primer, ako istraživač pita ispitanike: „Da li ste nekada u svom životu ukrali nešto?“, vrlo vero-vatno je da će dobar deo ispitanika koji to jesu učinili reći da nisu, ne želeći da drugi misle ružno o njima. Mnogo manji je broj onih koji u životu nikada nisu ništa ukrali, a koji će u anketi odgovoriti da su to učinili. U ovom slučaju odgovori ispitanika će se sistematski razlikovati od prave vrednos-ti. Procena procenta ljudi u ciljnoj populaciji koji su nekada nešto ukrali, a koja bi bila izračunata na osnovu odgovora na uzorku, bi potcenjivala pravu vrednost u ciljnoj populaciji.

Psihometrijski koncept najbliži (ne)pristrasnosti merenja je validnost (ili valja-nost). Ova metrijska osobina instrumenta govori da li on meri ono što bi trebalo da meri. Ako je to tako, stavka/pitanje je valjana. Ako meri nešto drugo, a ne ono čemu je namenjena, onda nije validna. Preciznije, stavka koja ne meri konstrukt kojem je name-njena već neki drugi, nije validna za merenje prvog konstrukta, ali može biti validna za merenje nekog drugog. Stavka je validna za merenje onog konstrukta koji zaista meri, a ne onog za koji ju je konstruktor namenio. U primeru sa pitanjem o krađi, pretpostavka je da ispitanici u velikom broju poriču krađu, želeći da očuvaju pozitivnu sliku o sebi. To čine birajući socijalno poželjniji odgovor. U ovom slučaju to pitanje osim konstrukta kojem je specifično namenjeno, meri i poznavanje društvenih normi, odnosno društve-nu prilagođenost. Drugi predmet merenja utiče na prosečan skor ispitanika na tom pitanju – snižavajući ga (manji broj ispitanika će priznati da je nešto ukrao).

Ako razlika između odgovora ispitanika i prave vrednosti konstrukta koji se meri nije sistematska već slučajna, govorimo o varijansi merenja (engl. measurement variance) ili varijansi odgovora (engl. response variance). Pošto je nesistematska, vari-jansa merenja neće uticati na statistik dobijen na uzorku (neće menjati aritmetičku sredinu, procenat...), ali će uticati na njegovu standardnu grešku, odnosno na preciznost merenja. Psihometrijski koncept povezan sa varijansom merenja u ovom smislu je pou-zdanost. Pouzdanost je metrijska karakteristika merenja koja nam govori koliko preciz-no instrument meri ono što meri. Nekada se pouzdanost definiše upravo kao odsustvo greške merenja (Fajgelj, 2013). U anketnim istraživanjima pouzdanost se obično proce-njuje primenom test-retest metode (Biemer, 2010).

Greška merenja je za veliki broj anketnih istraživanja najštetniji vid greške (Biemer & Lyberg, 2003) i zavisi od više elemenata njihovih nacrta. Najbitniji činioci koji utiču na grešku merenja su:

upitnik ispitanik metoda prikupljanja podataka (licem u lice, telefonska anketa, poštan-

ska anketa, internet...) anketar

Kada je govorimo o upitniku kao izvoru greške merenja, uzroci mogu biti razni. Kao prvo, može se desiti da konstrukt nije adekvatno reprezentovan pitanjima, odnos-

Page 114: Bojan Janičić - digitalna.ff.uns.ac.rs

UKUPNA GREŠKA ANKETE

103

no da pitanja, iako konstruisana da mere neki konstrukt, promašuju ga delimično ili u potpunosti. Osim toga, pitanja mogu biti loše formulisana, nedovoljno jasna i ostavljati prostor za pogrešna ili različita tumačenja od strane ispitanika. Na grešku merenja mogu uticati i nejasna ili loša uputstva za odgovaranje na pitanja.

Preduga pitanja takođe mogu biti izvor greške merenja jer ovakva pitanja nisu prilagođena svim populacijama. Nisko obrazovanim ispitanicima ona mogu biti preteš-ka za razumevanje. Kod takvih pitanja, u zavisnosti od populacije na kojoj se primenju-ju, skor ispitanika može zavisiti bar delimično od sposobnosti razumevanja dugačkog pisanog ili verbalno izgovorenog teksta, a ne samo od konstrukta koji se meri. To ne znači da pitanja moraju biti kratka, ali je dobro da budu što kraća, a pri tom da sadrže sve relevantne informacije i da budu jasna i nedvosmislena.

Takođe, kod pitanja sa višestrukim izborom, ako ponuđeni odgovori nisu adek-vatni i iscrpni, ispitanici mogu biti prinuđeni da zaokružuju odgovore koji ne odslikava-ju realno stanje, ili da ne odgovore na pitanje.

Ukoliko logika kretanja kroz upitnik nije jasna, ispitanici mogu odgovarati na pitanja koja im nisu ni namenjena i ne mogu dati adekvatne odgovore. Naime, u upitni-cima je čest slučaj da od odgovora na jedno pitanje zavisi na koje sledeće pitanje će ispitanik odgovarati.

Na primer, ukoliko u upitniku na pitanje: „Koliko dece imate?“, sa ponuđenim odgovorima: „Nemam dece“, „Jedno“, „Dvoje“, „Troje“, „Više od troje“, ispitanik odgovori da nema dece, on se upućuje da preskoči pitanje o uzrastu dece (ili celu grupu pitanja o deci) i nastavi sa odgovara-njem na prvom sledećem pitanju na koje može da dâ odgovor.

I neadekvatno vizuelno formatiranje može uticati da ispitanici ne odgovaraju na pitanja na koja bi trebalo da odgovaraju, ili da odgovaraju na neodgovarajući način.

Svi navedeni nedostaci upitnika mogu dovesti do toga da različiti ispitanici raz-ličito interpretiraju pitanja i praktično odgovaraju na „različita“ pitanja. Zbog toga je potrebno voditi računa da upitnik sadrži jasna, nedvosmislena pitanja, jasna uputstva za odgovaranje (uključujući i ona o tome koja pitanja je eventualno potrebno preskoči-ti), te da bude pregledan. Takođe, prilikom sastavljanja pitanja sa ponuđenim odgovo-rima potrebno je voditi računa da lista ponuđenih odgovora bude iscrpna, kako bi ispi-tanik imao mogućnost da se opredeli za tačan odgovor.

Ispitanici mogu biti izvor greške na više načina. Kao prvo, oni se svesno mogu odlučiti da daju pogrešnu informaciju. Razlozi za ovo mogu biti razni, od želje da se prikažu u boljem svetlu do izbegavanja davanja odgovora koji ih mogu inkriminisati. Iako je davanje netačnih odgovora nepoželjno u anketnom istraživanju, ispitanik ima pravo da to uradi (De Leeuw et al., 2008). Ispitanici mogu dati pogrešnu informaciju i slučajno. Ovo se dešava zato što različiti ispitanici različito interpretiraju značenje pita-nja, posebno ako ona nisu precizno sročena. U tom slučaju ispitanici značenje pitanja interpretiraju na osnovu konteksta koji uključuje okolna pitanja, samu situaciju anketi-

Page 115: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

104

ranja, interakciju sa anketarom... Ove interpretacije su često nasumične, razlikuju se od ispitanika do ispitanika i kod nekih dovode do potcenjivanja vrednosti merene varijab-le, a kod drugih do precenjivanja.

Do davanja pogrešnih informacija od strane ispitanika može doći kao reakcija ispitanika na temu upitnika ili na izgled anketara, zbog osećanja socijalnog pritiska u interakciji anketar-ispitanik, zbog pogrešnih sećanja...

Nekada, kada postoji bojazan da će ispitanici pogrešno interpretirati pitanja i da će biti potrebno davati im dodatna objašnjenja, istraživači se opredeljuju za ankete sa učešćem anketara39.

Uvođenje anketara može smanjiti grešku merenja koja potiče od ispitanika, ali i anketari sami mogu biti izvor greške. U stvari, postoje dva pristupa anketiranju sa učešćem anketara: potpuno standardizovani i fleksibilni pristup. U potpuno standar-dizovanom pristupu, anketarima nije dozvoljeno da menjaju tekst pitanja, odnosno moraju ga pročitati doslovce. U fleksibilnom pristupu anketar može menjati tekst pitanja sa ciljem da ispitaniku bude jasnije šta se od njega očekuje. Različiti pristupi imaju raz-ličite ciljeve kada je u pitanju greška merenja. U fleksibilnom pristupu cilj je smanjiti grešku merenja koja potiče od ispitanika, a u standardizovanom smanjiti grešku merenja koja potiče od anketara (Gideon, 2012).

Na grešku merenja mogu uticati osobine, a nekada i samo prisustvo anketara, ali o tome će više reči biti u posebnom poglavlju (poglavlje 9).

Metoda prikupljanja podataka na grešku merenja utiče preko načina na koji ispitanicima mogu biti prezentirane stavke. Kod metoda u kojima su stavke ispitanici-ma prezentirane u zvučnom obliku, odnosno u onima u kojima ne mogu da ih vide (poput telefonske ankete), ispitanici mogu imati problema sa pitanjima sa većim bro-jem ponuđenih odgovora (tzv. dugačkim listama). U takvim situacijama, ispitanici će najčešće zapamtiti nekoliko poslednjih ponuđenih odgovora i opredeliti se za neki od njih, bez obzira da li je to zaista najtačniji odgovor. Kod metoda prikupljanja podataka sa vizuelnom prezentacijom pitanja i kod istih ovakvih dugačkih listi, ispitanici nekada češće biraju prvu dovoljno dobru ponuđenu opciju, kako ne bi morali dalje da čitaju. Različite metode prikupljanja podataka trpe različite efekte položaja ponuđenih odgo-vora u pitanjima sa višestrukim izborom.

O ovome posebno treba voditi računa u slučaju da se u okviru jedne ankete koristi više različitih metoda prikupljanja podataka. Ovaj problem je, takođe, bitan kada se porede nalazi ponovljenih transverzalnih ili panel istraživanja ili u kroskulturalnim anketnim istraživanjima, kada se primenjuje isti upitnik, ali koristeći različite metode prikupljanja podataka (De Leeuw et al., 2008).

39 Ovakav nacrt se bira i kada postoji bojazan da će stopa odbijanja biti velika.

Page 116: Bojan Janičić - digitalna.ff.uns.ac.rs

UKUPNA GREŠKA ANKETE

105

Metode prikupljanja podataka razlikuju se i u prisutnosti/odsutnosti anketara i u stepenu interakcije ispitanik – anketar. Kao što je ranije rečeno, uvođenje anketara u proces prikupljanja podataka uvodi novi izvor greške. Ranije je pomenut nenamerni uticaj anketara na odgovore ispitanika, ali uticaj može biti i nameran. Neki anketari motivisani zaradom i skraćenjem vremena potrebnog za intervjuisanje, namerno varaju preskačući pitanja ili falsifikujući podatke (odgovarajući umesto ispitanika ili puštajući ih da sami popunjavaju upitnike).

5.5. Primer upotrebe koncepta ukupne greške ankete na izbor nacr-ta

Kao što je rečeno, koncept ukupne greške ankete koristi se prilikom izbora nacrta anketnog istraživanja. Možemo zamisliti primer u kojem istraživač želi da oda-bere između tri moguća nacrta anketnog istraživanja. Cilj anketnog istraživanja je u sva tri nacrta isti, ali se razlikuju metode prikupljanja podataka, okviri i procedure uzorko-vanja.

Prvi nacrt je anketa licem u lice sa zonskim okvirom uzorkovanja. Drugi nacrt je telefonska anketa u kojoj se kao okvir uzorkovanja koristi procedura slučajnog biranja telefonskih brojeva (RDD). Treći nacrt je internet anketa, a pozivi za anketu su upućiva-ni klasičnom poštom, a kao okvir uzorkovanja korišćen je telefonski imenik. S obzirom da je budžet za sva tri nacrta identičan, veličine uzorka su definisane u skladu sa budže-tom. Pošto je anketa licem u lice najskuplja, uzorak u nacrtu 1 biće najmanji. Nešto veći biće uzorak u nacrtu 2 koji je jeftiniji, a najveći će biti u najjeftinijem nacrtu 3.

S obzirom da uzoračka varijansa zavisi od veličine uzorka, ona će biti najmanja u nacrtu 3, zatim u nacrtu 2, a najveća u nacrtu 1, kod kojeg će uzorak biti najmanji.

U sva tri nacrta primenjeno je probabilističko uzorkovanje pa ne možemo govoriti o pristrasnosti uzorkovanja kao takvoj. Međutim, korišćeni su različiti okviri uzorkovanja koji u manjoj ili većoj meri pokrivaju ciljnu populaciju, pa možemo govoriti o različitim pristrasnostima pokrivenosti. Uzorkovanje u nacrtu 1 je zonsko slučajno uzorkovanje koje obezbeđuje pokrivenost svih domaćinstava, u nacrtu 2 je korišćeno slučajno biranje telefonskih brojeva (koje izostavlja domaćinstva bez telefona), a u nacrtu 3 je korišćeno prosto slučajno biranje, a kao okvir uzorkovanja korišćen je tele-fonski imenik. U nacrtu 3, u uzorak ne mogu biti izabrana domaćinstva koja se ne nalaze u imeniku, bez obzira da li poseduju telefon ili ne. Usled toga, varijansa nepokrivenosti biće najveća u nacrtu 3, zatim u nacrtu 2, a najmanja u nacrtu 1. Kako pristrasnost pokrivenosti zavisi od proporcije nepokrivenih jedinica u populaciji i razlike između pokrivenih i nepokrivenih jedinica po predmetu merenja, možemo pretpostaviti da će i pristrasnost pokrivenosti biti najveća u nacrtu 3, zatim u nacrtu 2, a najmanja u nacrtu 1.

Pristrasnost merenja izvor može imati u upitniku, proceduri merenja, ispitani-

Page 117: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

106

cima, anketarima, modalitetu prikupljanja podataka i interakciji svih ovih činilaca. Za očekivati je da će ova kombinacija sistematskih izvora greške biti najmanja prilikom anketiranja licem u lice, dok se u druga dva nacrta neće bitnije razlikovati (Biemer & Lyberg, 2003). Recimo da možemo očekivati da na varijansu merenja u ovom slučaju mogu najviše uticati postupci anketara, ona će stoga biti najveća u nacrtu 1 (licem u lice), nešto manja u nacrtu 2 (telefonska anketa), a najmanja u nacrtu 3 (internet anke-ta).

Pošto je stopa neodgovora manja što je interakcija anketar-ispitanik veća, možemo pretpostaviti da će ona biti najmanja u nacrtu 1 (licem u lice), zatim u nacrtu 2 (telefonska anketa), a najveća u nacrtu 3 (internet anketa). Samim tim, varijansa neod-govora biće najmanja u nacrtu 1, zatim u nacrtu 2, a najveća u nacrtu 3.

Pristrasnost neodgovora zavisi kako od stope neodgovora, tako i od sistemat-ske razlike između ispitanika koji su odgovarali i onih koji nisu. Pod uslovom da je taj sistematski efekat isti u sva tri nacrta, odnosno da nije povezan sa modalitetom prikup-ljanja podataka, pristrasnost će biti najveća u nacrtu u kom se očekuje najveća stopa neodgovora, a to je nacrt 3.

S obzirom da su troškovi za sva tri nacrta istraživanja identični, na osnovu procenjene ukupne greške ankete logično bi bilo izabrati nacrt sa najmanjom ukupnom greškom, a to je nacrt 1. Naravno, ovo važi ukoliko vreme za sprovođenje ankete nije ograničavajući faktor. Ukoliko je vreme za sprovođenje istraživanja kratko, nacrt 1 ne bi odgovarao zbog dugotrajnosti. U tom slučaju, najpogodniji bi bio nacrt 2 koji za značaj-no kraće vreme daje procene koje su nešto manje precizne nego one koje bismo dobili

Slika 5 – Poređenje ukupne greške ankete i njenih komponenti u zavisnosti od nacrta (adaptirano iz Biemer & Lyberg, 2003)

0,2 0,2 0,1

3,1

1,1 0,6

0,3

0,5 0,7

0,1

0,3 0,9

0,4

1,8 1,8

0,8 1,3

0,3

1,3

2,1

0,0

1,0

2,0

3,0

4,0

5,0

6,0

7,0

8,0

nacrt 1 nacrt 2 nacrt 3

ukup

na g

rešk

a an

kete

kv. pristrasnostineodgovora

kv. pristrasnostipokrivenosti

kv. pristrasnostimerenja

var.neodgovora

var.pokrivenosti

var.uzorkovanja

var. merenja

Page 118: Bojan Janičić - digitalna.ff.uns.ac.rs

UKUPNA GREŠKA ANKETE

107

primenom nacrta 1, a opet preciznije i brže nego one dobijene na osnovu nacrta 3.

Problem koji ste verovatno uočili je da su za izračunavanje ukupne greške ankete potrebne vrednosti parametara od interesa u pokrivenom delu populacije i nepokrivenom delu populacije, onih koji su odgovorili i onih koji nisu odgovorili, onih koji su ušli u uzorak i onih koji nisu... Takođe, potrebno je da znamo kolike će biti stope pokrivenosti i odgovora. Da znamo sve ove parametre i stope, anketa nam ne bi bila ni potrebna.

Jedan od mogućih načina da se ovaj problem prevaziđe je upotreba procena dobijenih u ranijim istraživanjima. Na osnovu ranijih istraživanja možemo znati koliku stopu odgovora možemo očekivati ako kao metod prikupljanja podataka upotrebimo intervjuisanje licem u lice, koliku ako upotrebimo telefonsku ili poštansku anketu, a koliku ako podatke budemo prikupljali onlajn anketom.

Takođe, vrlo je verovatno da niste prvi istraživač koji se bavi određenim kons-truktom. Vrednosti parametara koji su vam potrebni u jednačinama za procenu različi-tih vrsta grešaka možete zameniti nalazima dobijenim u prethodnim istraživanjima. Najbolje je da to bude iz novijih istraživanja na ciljnim populacijama koje su najsličnije vašoj ciljnoj populaciji. Naravno da ovako izračunata vrednost ukupne greške ankete neće biti njena prava vrednost, ali može poslužiti za poređenje moguće greške u različi-tim nacrtima istraživanja.

Šta više, pravu vrednost ukupne greške ankete ne biste mogli izračunati ni nakon obavljenog anketnog istraživanja jer su za njeno računanje potrebni parametri za nepokriveni deo populacije ili deo populacije koji je odbio da odgovori40. Kada bismo mogli da izmerimo i izračunamo parametre za ove delove populacije – oni ne bi postoja-li (jer bismo ih pokrili i izmerili).

U praksi se ukupna greška ankete retko izračunava i prijavljuje (Biemer et al., 2016), ali ovaj se koncept koristi prilikom izbora nacrta anketnog istraživanja.

5.6. Greška podešavanja i greška obrade

Greška podešavanja nastaje kao posledica procesa ponderisanja i poststratifi-kacije. Primenom pondera povećava se varijabilnost distribucije posmatrane varijable i samim tim smanjuje preciznost anketnih statistika (videti odeljak 10.4). Pokazatelj dobijen na ponderisanim podacima može se razlikovati od parametra populacije. Ukoli-ko ta razlika postoji, možemo govoriti o pristrasnosti podešavanja. Pristrasnost pode-šavanja će se razlikovati od uzorka do uzorka i u različitim primenama ankete (Groves, 2009).

40 Ove stvari možemo proceniti ako naknadno pristupimo delu ovih ispitanika

(nepokrivenih ili onih koji nisu odgovorili u prvom navratu) i od njih uspemo da dobi-jemo odgovore.

Page 119: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

108

Greška obrade nastaje u procesu uređivanja i kodiranja podataka, te zamene nedostajućih podataka (videti poglavlje 9.4.1, a posebno odeljke 10.1, 10.2, 10.3 i 10.5). Obuhvata pogrešno kodiranje otvorenih pitanja, greške u unosu podataka, prečišćava-nju podataka i zameni (imputaciji) nedostajućih podataka (Marsden & Wright, 2010).

Na primer, ovakve greške se mogu javiti prilikom kodiranja odgovora ispitanika na pitanja otvore-nog tipa. Ovakve odgovore pre obrade je potrebno kategorisati. Naime, prilikom odgovaranja na ovakva pitanja ispitanik je slobodan da odgovori kako želi, birajući način na koji će formulisati odgovor. Na pitanje: „Šta je po vašem mišljenju glavni nedostatak mobilnog operatera XY?“, ispi-tanici mogu reći: „Cena“, „Nizak kvalitet usluge“, „Loša pokrivenost“, „Malo dobijam za uloženi novac“, „Skup je“, „Ne radi kol centar“... Da bi bilo moguće ove podatke analizirati na način koji će nam omogućiti izračunavanje kvantitativnog pokazatelja, potrebno je svrstati sve odgovore u manji broj kategorija i nakon toga računati njihove frekvencije. Tako bismo mogli prvi, četvrti i peti odgovor svrstati u kategoriju „nezadovoljstvo cenom“, a drugi, treći i šesti u kategoriju „nezadovoljstvo kvalitetom“. Svrstavanje u neku od kategorija podrazumeva dodelu numeričkog koda odgovorima u zavisnosti od kategorije kojoj odgovor pripada. Drugim rečima – vršimo kodi-ranje (vidi poglavlje 10.1). Nakon toga mogu se izračunati i prikazati frekvencije pojedinih katego-rija. Greška obrade nastala u fazi kodiranja podrazumeva pogrešno kodiranje odgovora, odnosno svrstavanje u pogrešnu kategoriju i dodeljivanje pogrešnog koda. Ovakve greške se mogu desiti u pojedinačnim slučajevima i to nije veliki problem. S druge strane mogu se dešavati i dosledno kod samo jedne osobe koja vrši kodiranje ili kod svih članova tima zaduženih za kodiranje. Ukoliko je u pitanju samo jedna osoba, najverovatnije se radi o nerazumevanju, a ukoliko je to slučaj kod svih, verovatno je problem u lošoj obuci članova tima za kodiranje. Greška se može javiti i u obliku nedoslednog kodiranja, kada šifrant kodira iste odgovore različitih ispitanika u različite kodne kategorije.

Greška slična ovoj može nastati i tokom faze prečišćavanja podataka i eliminacije nemogućih (neverovatnih) vrednosti. Tada se može desiti da legitimni odgovor bude eliminisan zato što liči na nemoguću vrednost i da mu bude dodeljen kôd za nedostajuću vrednost, ili da bude zamenjen maksimalnom plauzibilnom vrednošću. Recimo da istraživač želi da ispita značaj poznavanja teh-nika reanimacije i postavi pitanje: „Koliko puta je vaše poznavanje tehnika reanimacije nekome spasilo život?“. Za očekivati je da će taj broj kod većine ispitanika biti nula ili vrlo mali. Ukoliko se kod nekog ispitanika javi odgovor „127“, može se desiti da taj odgovor bude tretiran kao nemo-guća vrednost i kodiran kao nedostajući podatak. Ukoliko znamo da je osoba koja je tako odgovo-rila lekar koji godinama radi u urgentnom centru, odgovor postaje sasvim moguć i iz tog razloga ga ne bi trebalo izbaciti iz obrade.

Ove greške se mogu izbeći pažljivom obradom podataka i poštovanjem plani-ranih protokola obrade (Gideon, 2012). Preporučljivo je voditi evidenciju o svim izme-nama koje se rade na podacima u smislu kodiranja, ponderisanja i statističke obrade podataka. Takođe, vrlo korisno je numerisanje (šifriranje) upitnika i intervjua u papir-noj formi i unos tog podatka u datoteku sa podacima.

To omogućava kasnije provere i korekcije eventualnih grešaka. Što se tiče samog unosa podataka sa upitnika u papirnoj formi, korisno je primenjivati neku formu kontrole unosa, poput upotrebe maski za unos ili dvostrukog unosa (a najbolje obe).

Osim toga, vrlo je korisna praksa čuvanja rezervnih kopija podataka nakon unosa, a nije loše i nakon eventualne korekcije i svake od naknadnih transformacija.

Page 120: Bojan Janičić - digitalna.ff.uns.ac.rs

UKUPNA GREŠKA ANKETE

109

5.7. Zaključak o izvorima grešaka u anketnim istraživanjima

Kao što je već rečeno, sve navedene izvore greške u anketnim istraživanjima možemo podeliti na sistematsku i nesistematsku komponentu, odnosno na pristrasnost i varijansu. Međutim, nemaju sve komponente svih navedenih grešaka jednaku verova-tnoću javljanja. Kod određenih tipova greške verovatnija je sistematska, a kod drugih nesistematska komponenta. Bimer i Liberg (Biemer & Lyberg, 2003) daju korisnu sis-tematizaciju verovatnoće rizika od javljanja različitih komponenti greške:

Tabela 5 – Rizik od javljanja sistematske i nesistematske komponente kod različitih tipova greša-ka (adaptirano prema Biemer i Lyberg, 2003)

greška nesistematska sistematska greška uzorkovanja visok nizak greška pokrivenosti nizak visok greška neodgovora nizak visok greška merenja visok visok greška specifikacije nizak visok greške obrade visok visok

Page 121: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

110

6. Konstrukcija i evaluacija anketnog upitnika

Dva osnovna instrumenta koja se koriste u anketnim istraživanjima su sta-ndardizovani intervju i upitnik.

Upitnik je sastavljen od niza pitanja (stavki, ajtema, čestica) koja su pažljivo konstruisana i njihov redosled je tačno određen. Ispitanik ga može dobiti u štampanoj formi ili mu može biti prikazan na ekranu. Upitnik liči na konativne psihološke testove, koji se često isto tako nazivaju. Anketni upitnik i psihološki test se, ipak, razlikuju po više bitnih karakteristika.

Psihološki test je merni instrument koji se konstruiše da bude trajan, ima poz-nata merna svojstva, ukupan skor i obično meri jednu osobinu ličnosti. Ako psihološki test i meri više različitih osobina, svaka od njih se meri multiajtemski, odnosno, svaka je merena posebnom supskalom sa više stavki i ima ukupan skor.

Za razliku od psihološkog testa, anketni upitnik nema čvrstu strukturu. Skup pitanja nije čvrsto povezan i po pravilu se ne računa ukupni skor. Konstruiše se ad hoc, za konkretno istraživanje (mada se može ponovo upotrebljavati ako zadovoljava potre-be nekih narednih istraživanja). Može meriti i obično meri više različitih stvari. Ono što ga značajno razlikuje od psihološkog testa je da je namenjen terenskim, a posebno anketnim istraživanjima (Fajgelj, 2004).

Ako standardizovani (strukturisani) intervju definišemo kao intervju u kojem su pitanja, njihova formulacija i redosled fiksni (Fajgelj, 2004), onda možemo reći da u slučaju anketnih istraživanja on jednostavno predstavlja primenu upitnika u ličnom intervjuisanju. U samom instrumentu razlike su male, ali razlike postoje u nači-nu primene. Dok upitnik ispitanici popunjavaju sami (samoadministracija), u standar-dizovanom intervjuu anketar postavlja pitanja ispitaniku i beleži odgovore.

Dakle, možemo reći da upitnike po načinu upotrebe možemo podeliti na: upit-nike sa samoadministracijom i one za lično intervjuisanje.

Upitnici sa samoadministracijom mogu biti: upitnici poslati poštom, lično dos-tavljeni upitnici i upitnici na internetu.

Page 122: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

111

Upitnici sa ličnim intervjuisanjem mogu biti: upitnici za neposredno intervjui-sanje i upitnici za telefonsko intervjuisanje.

Grupni upitnici se nalaze između dve prethodne grupe. Njih u suštini ispitanici popunjavaju samostalno, ali u prisustvu anketara, koji može davati dodatna uputstva i objašnjenja.

Upitnici sa ličnim intervjuisanjem i upitnici sa samoadministracijom se razliku-ju u nekoliko aspekata. Pošto upitnike sa ličnim intervjuisanjem ispitanik nikada ne vidi (već samo anketar), oni mogu sadržavati razna uputstva koja su namenjena isključivo anketaru. U situaciji sa ličnim intervjuisanjem postoji interakcija anketar-ispitanik u smislu da anketar može da ispitaniku dâ, ali i da od njega traži dodatna objašnjenja u slučaju da odgovor nije jasan ili da ispitaniku nije u potpunosti jasno pitanje. Anketar u nekim situacijama može menjati redosled pitanja ili preskakati nepotrebna. Takođe, može svrstati odgovor ispitanika u neku od ranije definisanih kategorija (engl. field-coded questions) (Houtkoop-Steenstra, 2000). Anketar, dakle, ima neku slobodu, ali je ta sloboda unapred definisana i planirana (Fajgelj, 2004).

Standardizovani intervju kao vrsta usmerenog razgovora ima dve komponen-te: pitanja i odgovore. Bitna karakteristika koja intervju razdvaja od običnog razgovora je da su uloge jasno definisane: anketar postavlja pitanja, a ispitanik odgovara (Fowler & Mangione, 1990). Iako anketar može nuditi objašnjenja i obrazloženja, njihov krajnji cilj je postavljanje pitanja. Isto tako, iako ispitanik takođe može postavljati pitanja anke-taru, njihov krajnji cilj je uspešno davanje odgovora.

Za razliku od kliničkih intervjua, intervjua za prijem na posao i sličnih, intervjui koji se sprovode u anketnim istraživanjima nemaju za cilj saznavanje podataka o ispita-niku već o populaciji kojoj ispitanik pripada i koja je predmet istraživanja. Interes anke-tnih istraživanja nikada nije opis individue već grupe. Posmatrajući iz tog ugla, čak i kada nam je poznat identitet ispitanika, tokom obrade, objavljivanja i primene rezultata on suštinski ostaje anoniman. Pojedinac istraživača zanima samo kao deo grupe i baš zato što njoj pripada. Rezultati ankete su numerički opis populacije – ne pojedinaca. Zasnovani su na distribuciji odgovora pojedinaca (Fowler & Mangione, 1990). Fokusira-nost na populaciju, a ne na pojedince jednako važi i za samodministrirane upitnike i za upitnike sa ličnim intervjuisanjem, odnosno standardizovane intervjue.

Osim standardizovanih intervjua, u anketama se koriste i polustandardizovani intervjui koji nemaju tako čvrsto definisanu strukturu. U ovakvim intervjuima, anketari imaju veću slobodu da intervenišu prilikom postavljanja pitanja (postavljanje dodatnih pitanja, menjanje redosleda, izostavljanje). Oni se najčešće primenjuju u pripremnim fazama anketnih istraživanja kao poluproizvod na putu kreiranja upitnika ili standardi-zovanog intervjua.

Page 123: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

112

U određenim fazama anketnih istraživanja moguća je primena i fokus grupa. Fokus grupe su grupe od 6 do 10 ljudi41 koji organizovano diskutuju o temi koja je od interesa za istraživača. O organizovanosti i usmerenosti diskusije računa vodi modera-tor ili facilitator, koji to čini na osnovu smernica koje su prethodno definisane. On vodi računa da sve unapred definisane teme budu pokrivene (više o fokus grupama možete naći u: Fajgelj, 2004).

Fokus grupe za razliku od anketnih istraživanja spadaju u širu grupu kvalitati-vnih istraživanja. U anketnim istraživanjima nemaju primenu u prikupljanju podataka već svoju svrhu nalaze u fazi pripreme, a mogu se upotrebljavati i u fazi interpretacije rezultata (engl. debriefing), posebno u slučajevima kada su rezultati anketnog istraživa-nja neočekivani (Rea & Parker, 2014).

Fokus grupe se mogu primenjivati i u procesu konstrukcije ankete. Tada kons-truktori u polustrukturisanom razgovoru sa manjim brojem članova populacije, poku-šavaju da utvrde koliko oni znaju o predmetu istraživanja ankete, kakvi su njihovi sta-vovi i koju terminologiju koriste kada pričaju o njemu. Na taj način može se uvideti primerenost pitanja ciljnoj populaciji i prilagoditi terminologija koja će biti korišćena u anketnom upitniku.

6.1. Konstrukcija instrumenta

Prilikom konstrukcije instrumenta za anketno istraživanje uvek treba imati u vidu cilj istraživanja, odnosno koje su nam informacije potrebne. Osim toga, potrebno je imati u vidu i karakteristike ciljne populacije kojoj je anketni upitnik namenjen.

Kao što će biti objašnjeno kasnije, ciljnu populaciju je potrebno imati u vidu kako bismo znali da li uopšte ima smisla pitati neka pitanja, i kako bismo znali da korišćeni vokabular, tip pitanja, dužinu upitnika i modalitet prikupljanja podataka pri-lagodimo njenim karakteristikama.

Posebnu pažnju u fazi konstrukcije upitnika potrebno je posvetiti definisanju ciljeva istraživanja, odnosno koncepata koje je potrebno izmeriti. U zavisnosti od toga kako je koncept definisan, tako će (u najboljem slučaju) biti i izmeren.

Ako socioekonomski status definišemo samo preko mesečnih primanja i obrazovanja, on će biti tako i izmeren. Ako u definiciju uključimo i zanimanje, status na poslu i posedovanje imovine, onda će za ovo merenje biti potrebna i pitanja koja se tiču zanimanja, statusa na poslu i imovine.

Anketni upitnici obično nisu namenjeni merenju samo jednog konstrukta. Pre konstrukcije pitanja potrebno je jasno definisati svaki konstrukt i indikatore preko kojih

41 Neki autori kažu da broj članova grupe može biti od 4 do 12, drugi opet od 8

do 12 (Rea & Parker, 2014). U svakom slučaju treba voditi računa o veličini grupe, jer ako je grupa premala može biti nestimulativna, a ako je prevelika, može biti neproduk-tivna i deliti se u klike (Fajgelj, 2004).

Page 124: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

113

će biti meren.

Svaki konstrukt je dobro sagledati iz više uglova kako bismo dobili što celoviti-ju sliku. Zbog toga je uvek dobro da konstrukcija upitnika i stavki bude timski podu-hvat, a da tim bude heterogen. S druge strane, heterogenost tima ume znatno da oteža saradnju njegovih članova i zato je potrebno da koordinator tima bude osoba koja će umeti da pomiri ove razlike (Fajgelj, 2013). Ako koordinator nije u stanju da to uradi, anketni upitnik koji nastaje kao rezultat složenog pregovaranja heterogenog tima može koncepte koji su predmet istraživanja definisati prilično nejasno (De Leeuw et al., 2008).

Nakon definisanja konstrukta potrebno je pažljivo pristupiti konstrukciji pita-nja. Mada konstrukcija pitanja može delovati prilično jednostavno i lako, mora se voditi računa o brojnim pojedinostima kako bi na kraju željeni konstrukt bio i izmeren. Mora se meriti svaka reč (njena konotativna i denotativna značenja, frekvencija, poznatost) i postaviti u kontekst pitanja, ali i u kontekst upitnika u celini i celokupne situacije anke-tiranja. Takođe, nužno je voditi računa o prilagođenosti pitanja ciljnoj populaciji i nje-govom funkcionisanju u zavisnosti od modaliteta prikupljanja podataka (štampana anketa, računarski podržana, telefonska anketa, lično intervjuisanje...)

Pre no što instrument bude korišćen za istraživanje potrebno ga je proveriti na manjem uzorku. Ovom prilikom proverava se funkcionisanje upitnika i stavki, metod prikupljanja podataka, rad anketara, distribucija odgovora... Nakon ove provere (tzv. pilot istraživanje) nekada je potrebno redefinisati proveravane komponente. O ovome će biti više reči u odeljku 6.7, a posebno 6.7.2.

S obzirom da pisanje stavki nije lak posao, proverene stavke, one za koje je utvrđeno da dobro funkcionišu, dobro je sačuvati i koristiti ponovo u narednim anke-tama. Ovo je moguće učiniti i sa čitavim sekcijama anketnih upitnika (odnosno grupama pitanja koje se odnose na neku oblast) i anketnim upitnicima u celini. Tu praksu neguju softveri i servisi za onlajn anketiranje42 koji korisnicima nude opcije za izvoz i uvoz pitanja ili čitavih sekcija, a ponekad i svoje baze gotovih i proverenih pitanja.

6.2. Pisanje stavki

Stavke su osnovni činioci svakog upitnika. One su sredstvo kojim se aktivno usmerava pažnja ispitanika na određeni problem i zahteva odgovor u određenoj formi. S obzirom da stavke nisu uvek date u formi pitanja (mogu na primer biti i u obliku tvr-dnji u kojima se traži od ispitanika da kaže koliko se slaže sa njima, ili u formi zadatka), za njih se koriste različiti termini. Pored pomenutog termina „tvrdnja“, koriste se i ter-mini „čestica“, „ajtem“ (engl. item) i njegova srpska varijanta „stavka“. U ovoj knjizi oni

42 Poput SurveyMonkey (https://www.surveymonkey.com), LimeSurvey

(https://www.limesurvey.org/), OneClickSurvey https://www.1ka.si/d/en)...

Page 125: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

114

su iz stilskih razloga korišćeni kao sinonimi. U engleskom jeziku se koristi i sintagma „request for an answer“ („zahtev za odgovorom“), koja pokriva i stavke poput „Pol: Muški Ženski“, a koju ne možemo svrstati ni u pitanja, ni u tvrdnje niti u zadatke (Saris & Gallhofer, 2007).

Da bi cilj istraživanja bio ostvaren, potrebno je da pitanja u instrumentu budu relevantna, precizna, i da je ispitanik voljan da na njih odgovara (Iarossi, 2006).

Pitanja će biti relevantna ako za rezultat imaju odgovore koji pružaju informa-cije potrebne za donošenje zaključaka i odluka. Osoba koja konstruiše upitnik mora biti upoznata sa ciljem istraživanja kako bi mogla da precizno formuliše pitanja i postavi ih u niz koji će rezultirati dobijanjem takvih informacija. Pre konstrukcije upitnika i sva-kog pojedinačnog pitanja mora biti poznato šta i zašto želimo da merimo.

Pitanja su precizna ako su dobijene informacije pouzdane i validne. Da bi to bilo tako, pitanja moraju biti jasna i primerena ispitanicima. Ako ispitanike pitamo stvari koje oni ne razumeju ili ne poseduju dovoljno znanja o njima, informacije koje dobijemo od njih biće netačne, odnosno neće se odnositi na konstrukt koji smo želeli da merimo, ili s druge strane, neće biti dovoljno precizne. Zato prilikom konstrukcije instrumenta i pitanja od kojih se sastoji moramo uvek u vidu imati i kome su pitanja namenjena.

Prilikom sastavljanja pitanja uvek bi trebalo krenuti od pretpostavke da poten-cijalni ispitanici nisu o problemu istraživanja razmišljali detaljno koliko bi istraživač želeo i koliko bi bilo optimalno za ciljeve istraživanja. Takođe, potrebno je pitanje pos-matrati iz pozicije tipičnog ispitanika kako bi se uočili potencijalni razlozi zbog kojih on ne bi umeo da odgovori na njega, to ne bi uradio dovoljno tačno ili bi, u krajnjem sluča-ju, pitanje pogrešno razumeo.

6.2.1. Kognitivni proces davanja odgovora

Prilikom konstrukcije anketnih stavki potrebno je imati u vidu i kognitivne procese koji su uključeni u davanje odgovora. Postoji više modela procesa odgovaranja na stavke (Cannell, Miller, & Oksenberg, 1981; Krosnick, 1991; Krosnick & Alwin, 1987). Najveći broj istraživača koji su se bavili ovim pitanjem slažu se da kognitivni proces odgovaranja na stavke ima sledeće faze (Groves et al., 2001):

1. razumevanje (engl. comprehension) 2. prisećanje (engl. retrieval) 3. suđenje i procena (engl. judgement and estimation) 4. davanje odgovora (engl. reporting the answer).

Razumevanje stavki je proces prilikom kog ispitanik pokušava da shvati tekst stavke, eventualna dodatna uputstva za odgovaranje i da shvati šta se stavkom od njega traži. Prilikom konstrukcije stavke cilj je da ona najvećem broju ispitanika bude laka za razumevanje (kako pojedinačne reči tako i formulacija u celini), da ih ne dovodi u nedoumicu i da bude jasno na čega se odnosi. Svi ispitanici bi trebalo da shvate stavku

Page 126: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

115

na isti način i to na onaj na koji je istraživač želeo da stavka bude shvaćena.

Pre i tokom procesa pisanja stavki potrebno je imati u vidu ciljnu populaciju i njene karakteristike od kojih zavisi razumevanje stavki. Takođe, potrebno je u vidu imati da je proces postavljanja pitanja i davanja odgovora u suštini konverzacija i da njegova uspešnost počiva na saradnji (De Leeuw et al., 2008; Grice, 1989; Groves, 2009; Valić Nedeljković, 2012). Učesnici u konverzaciji pretpostavljaju da su informacije koje dobijaju jedni od drugih tačne, dovoljne, relevantne, jasne i nedvosmislene. Samim tim, da bi neko pitanje bilo shvaćeno kako treba, potrebno je da informacije koje stavka sadrži budu takve.

Pre svega, informacije koje stavka sadrži bi trebalo da budu istinite. Količina informacija koju pitanje nudi o objektu pitanja bi trebalo da bude dovoljna, a suvišne bi trebalo izostaviti. Izbegavati davanje informacija koje nisu u direktnoj vezi sa objektom pitanja. Sve informacije bi trebale da budu predstavljene jasno i nedvosmisleno.

Dakle, najčešća preporuka za konstrukciju stavki je da moraju biti jasne i ned-vosmislene. Smeju pitati/tvrditi samo jednu stvar (bilo da se radi o objektu pitanja ili o odnosu prema njemu). Drugim rečima, smeju sadržati samo jedan objekt, jednu vrednost i jedan odnos među njima (Fajgelj, 2013).

Kao primer ajtema koji pita dve stvari možemo uzeti sledeći ajtem:

Da li volite da čitate knjige i idete na koncerte? DA NE

Ova stavka nije dobra zato što ima dva objekta (čitanje knjiga i odlazak na koncerte). Osoba koja voli da čita knjige, ali ne voli da ide na koncerte, bi na ovo pitanje mogla da odgovori sa DA (zbog knjiga) ili NE (zbog koncerata).

S druge strane, osoba koja ne voli da čita knjige, ali voli da ide na koncerte, bi mogla takođe odgovoriti sa DA (zbog koncerata) ili sa NE (zbog knjiga).

Na ovaj ajtem bi sa DA mogla odgovoriti i osoba koja zaista voli i da čita knjige i da posećuje kon-certe. Takođe, osoba koja ne voli ni knjige ni koncerte bi na ovo pitanje verovatno odgovorila sa NE. Tako bi mogle da odgovore i osobe koje ne vole jednu od tih stvari.

Ako sve ovo pogledamo iz perspektive datih odgovora, sa DA bi mogle odgovoriti osobe koje vole i knjige i koncerte, ali i one koje (ne) vole samo jednu od te dve stvari. Sa NE bi mogle odgovoriti osobe koje ne vole ni knjige ni koncerte, ali i one koje (ne) vole samo jednu od te dve stvari. Prak-tično, na osnovu odgovora ne bismo mogli razlikovati različite grupe ispitanika.

Ukoliko nas zanima da li osoba voli da čita knjige i posećuje koncerte bolje je to pitati kroz dve odvojene stavke:

Da li volite da čitate knjige? DA NE

Da li volite da idete na koncerte? DA NE

Ako baš želimo da saznamo koliko ljudi (ne) voli i jedno i drugo, a koliko samo nešto od ta dva, to kasnije lako možemo izračunati. Uvek je mnogo lakše grupisati kategorije, nego naknadno poku-šati da se razdele ispitanici koji su svrstani u jednu kategoriju.

Page 127: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

116

Predugačke stavke su teže za razumevanje, posebno ako ciljnu populaciju čine i nisko obrazovani, deca mlađeg uzrasta i slične grupe. Stoga bi stavke trebalo da budu što je moguće kraće. Naravno, to ne znači da će stavke uvek biti kratke. Stavke moraju biti onoliko dugačke koliko je potrebno da bi najvećem broju ispitanika bilo nedvosmis-leno jasno šta se od njih traži.

Pored toga što su teže za razumevanje, dugačke stavke zahtevaju više vremena za čitanje i izazivaju veći kognitivni napor. Ako u anketi ima veliki broj takvih stavki to će znatno produžiti vreme potrebno za odgovaranje na anketu u celini i posledično povećati cenu istraživanja. Osim toga, može i delovati demotivišuće na ispitanike. Pos-toje pretpostavke da duže ankete povećavaju broj odustajanja ili, s druge strane, provo-ciraju nepažljivo odgovaranje i davanje nevalidnih odgovora. Ovakve pretpostavke nisu empirijski potvrđene. Korelacije između dužine ankete i stope neodgovora najčešće su pozitivne, ali ne previše jake. Iako ispitanici obično kažu da im ne odgovara ukoliko je anketa duža, to ipak nema velikog uticaja na činjenicu da li će zaista odgovarati ili ne (Bogen, 1996; Sahlqvist et al., 2011). Ukoliko u prvom kontaktu ispitanici i odbiju da odgovaraju, obično pri ponovnom kontaktu pristanu. Imajući to u vidu, čini se bitnijim uticaj dužine ankete na cenu istraživanja.

Kada govorimo o dužini stavki, trebalo bi se osvrnuti i na modalitet prikuplja-nja podataka. Naime, dugačke stavke (uključujući i dugačke liste ponuđenih odgovora) predstavljaju veći problem u telefonskim anketama i drugim modalitetima prikupljanja podataka u kojima ispitanik pitanja ne čita sam već mu ih čita anketar. U tom slučaju pored razumevanja stavke, za ispitanike dodatno opterećenje predstavlja i potreba da se stavka zapamti.

Prilikom konstrukcije stavki potrebno je voditi računa i o jeziku koji se koristi. Preporuka je da se izbegavaju stručni, ali i žargonski izrazi i lokalizmi. Opet, opšta pre-poruka je da jezik bude prilagođen ciljnoj populaciji. Stručni izrazi su dozvoljeni ukoliko je anketa namenjena populaciji koja ih može razumeti.

Žargon bi u svakom slučaju trebalo izbegavati pošto takvi izrazi ne moraju nositi isto značenje za sve ispitanike. Razlike u značenju žargonskih izraza mogu biti generacijske, pa jedna reč može nositi jedno značenje kod mlađih ispitanika, a drugo kod starijih. Takođe, značenja žargonskih izraza mogu biti različita teritorijalno. Ista reč može imati jedno značenje u jednom gradu, a drugo u drugom. Osim toga, kada su žar-gonski termini u pitanju, njihovo značenje se mnogo brže menja sa protokom vremena. Tako, ukoliko sastavljač ankete želi da upotrebom žargona pridobije mlađu populaciju, efekat može biti i sasvim suprotan. Žargonski termini koji su „superiška“ u jednom tre-nutku nisu „ekstra“ u drugom i ispitanici ih mogu opažati kao staromodne i kao naivan i providan pokušaj podilaženja, što može izazvati podsmeh43.

43 Kao uostalom i ova rečenica kod čitalaca knjige... ;)

Page 128: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

117

Na ovom mestu bi trebalo napomenuti da je poštovanje pravopisa i gramatičkih pravila takođe vrlo bitno prilikom pisanja stavki. Gramatička pravila i pravopis su tu da bi standardizovala pisani govor i učinila ga razumljivim. Izostavljen ili nepravilno pos-tavljen znak interpunkcije, nepravilno upotrebljeno ili izostavljeno veliko slovo i slične greške mogu promeniti smisao pitanja.

Prilikom pisanja stavki mogu se koristiti različiti načini naglašavanja. Na primer, nije svejedno da li u tekstu štampanih ili računarski podržanih anketa stoji „vi“ ili „Vi“.

Uzmimo na primer pitanja iz ankete domaćinstava:

„Koliko ste zadovoljni vašim sadašnjim automobilom?“ i

„Koliko ste zadovoljni Vašim sadašnjim automobilom?“

U prvoj varijanti pitanja reč, „vašim“ je napisana malim slovom i u anketi domaćinstava može se shvatiti kao „Vi“ (obraćanje sa poštovanjem), ali i kao da se odnosi na celokupno domaćinstvo. U drugoj varijanti pitanja „Vi“ se može shvatiti samo tako da se pitanje odnosi isključivo na ispitani-ka i da se radi o obraćanju sa poštovanjem. Ukoliko domaćinstvo poseduje dva automobila, od kojih jedan koristi isključivo ispitanik, a drugi koristi celo domaćinstvo ova dva pitanja mogu rezul-tirati različitim odgovorima.

U obe varijante pitanja podvlačenjem i italik fontom naglašeno je da se pitanje odnosi na auto-mobil koji osoba trenutno poseduje i koristi.

Osim što mogu ugroziti razumevanje stavke, pravopisne i štamparske greške prisutne u štampanoj ili računarski podržanoj anketi ostavljaju utisak neprofesionalno-sti i nepoštovanja prema ispitanicima i mogu uticati na njihovu motivaciju i odustajanje.

Potrebno je voditi računa da na razumevanje stavki utiče i kontekst. Obično se govori o ajtemskom kontekstu kao uticaju odnosa ajtema sa drugim ajtemima na nje-govo razumevanje, pa samim tim i na odgovaranje. Međutim, na razumevanje stavke ne utiču samo ostale stavke već celokupna situacija anketiranja. Ovaj uticaj je obično nega-tivan i tim veći što su stavke nejasnije (Fajgelj, 2013).

Zamislimo gospođu P.P. (43) koja je učiteljica u jednoj osnovnoj školi. Kada je anketar u anketi domaćinstva pita „Koliko dece imate?“, ona odgovara „Dvoje“. Međutim, kada je anketar na rad-nom mestu u anketi koja se odnosi na zadovoljstvo usklađenošću porodičnog života i posla pita isto to pitanje, ona odgovara „25“ misleći na broj đaka kojima je učiteljica.

Ovde na razumevanje pitanja nije bilo uticaja prethodnih pitanja već je uticala celokupna situacija anketiranja.

Ako bi u situaciji ankete na radnom mestu, pitanju o broju dece prethodilo pitanje o bračnom sta-tusu, P.P. bi verovatno na pitanje o broju dece odgovorila „Dvoje“. Pitanje o bračnom statusu promenilo je kontekst i P.P. je shvatila da se oba pitanja odnose na privatni život, a ne na posao. U ovom slučaju bi ajtemski kontekst delovao pozitivno, ali najčešće njegov uticaj na odgovaranje je remetilački i vodi ugrožavanju validnosti.

Nakon što je ispitanik razumeo (interpretirao) stavku, sledi faza prisećanja. U ovoj fazi ispitanik „pretražuje“ sećanje i pokušava da nađe informaciju koja se od njega traži.

Page 129: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

118

Uspešnost prisećanja zavisi od prirode događaja kojeg je potrebno prisetiti se: njihove upečatljivosti, jedinstvenosti i vremena proteklog od događaja. Mnogo je lakše prisetiti se upečatljivih događaja, onih koji su jedinstveni i onih od kojih je proteklo manje vremena (Groves, 2009). Priznajući činjenicu da je sećanje prilično nepouzdano, česta je preporuka da ne treba postavljati pitanja koja se tiču događaja koji su se desili davno, a posebno pitanja koja se tiču stavova i uverenja koja su ispitanici imali u nekoj ranijoj vremenskoj tački (Visser et al., 2000). Ukoliko nas interesuje promena stavova i uverenja, bolje je istraživanje realizovati u vidu panel istraživanja ili istraživanja trenda.

I samo pitanje može uticati na prisećanje tako što ispitaniku nudi različite pod-setnike i znakove koji bi trebalo da pomognu ispitaniku da se podseti i da zna za kojim tačno informacijama bi trebalo da traga u dugotrajnoj memoriji.

Pod podsetnicima i znacima se podrazumevaju reči koje konkretizuju pitanje. Na primer:

Koliko puta mesečno (u proseku) koristite lekove protiv bolova za koje nisu potrebni recepti (Bru-fen, Aspirin, Febricet, Kafetin, Nimulid...)? ____________

U stavci su italikom označeni takvi znaci, odnosno nazivi lekova.

Nekada ovi znaci ne pobude baš onu informaciju iz memorije koja je ispitaniku potrebna već mogu pobuditi druge znakove koji direktno ili posrednim putem, preko drugih znakova, mogu dovesti do potrebne informacije.

„Lekove pijem samo kada sam bolestan. Ove godine nisam često bio bolestan. Kada sam bolestan pijem Brufen. Međutim, otkada imam problem sa želucem pijem drugi lek...“

Znaci imaju bolji efekat što su specifičniji i u skladu sa ciljevima ankete.

Prilikom procesa prisećanja ispitanik može imati pomoć od drugih članova domaćinstva i eventualno može koristiti dokumentaciju ukoliko ona postoji. Konsulto-vanje dokumentacije je čest slučaj ako su jedinice istraživanja organizacije koje takvu dokumentaciju po pravilu imaju.

Nakon prisećanja obično sledi proces suđenja i procena. Tokom ovog procesa, informacije kojih se ispitanik prisetio u prethodnoj fazi se dopunjavaju i kombinuju i nadomeštaju se eventualni nedostaci.

Kada, na primer, ispitanike pitamo o učestalosti ili trajanju nekog događaja (koliko puta su u toku protekle godine bili u kupovini u velikim tržnim centrima, koliko puta su bili na benzinskoj pumpi, koliko vremena dnevno provedu gledajući rijaliti pro-grame ili slušajući radio...), oni će retko znati tačan broj ili količinu, jer većina ljudi o tome na vodi tačnu evidenciju (mada možda ima i takvih). Odgovor koji budu dali obič-no će biti rekonstrukcija na osnovu informacija kojih su mogli da se sete, na osnovu nekih konkretnih slučajeva kojih su se setili ili na osnovu neke uobičajene učestalosti, a nekad će to biti samo nagađanje.

Page 130: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

119

Koliko vremena dnevno provodite gledajući rijaliti programe?

„Ako spavam od 22.00 do 7.00 časova, a na poslu sam od 9.00 do 17.00 časova... Treba mi sat vremena da stignem kući, još pola sata da obavim kupovinu. Onda večeram... Pre spavanja se sredim, još jedno pola sata... Dakle, ne može biti više od 3 sata... Poigram se sa decom pola sata, odgledam vesti još pola sata, sat vremena da pogledam Facebook/Instagram/#... Pa, oko sat i po.“

Ili...

„Prošlog četvrtka sam gledao 4 sata... U sredu oko 2 sata... u onu tamo sredu oko 3 sata... Pa... u proseku 3 sata.“

Ovi procesi suđenja su karakteristični za stavke u kojima se traži informacija tipa prisećanja. Međutim, kada ispitanike pitamo za stav o nekom problemu prisećanje nema veliku ulogu. Naime, malo je verovatno da će osoba formirati stav, uskladištiti ga negde u memoriji i, eventualno, ažurirati. Stav se formira u trenutku kada je to potreb-no, odnosno kada treba doneti neku odluku, uključujući i odluku kako odgovoriti na anketno pitanje (Groves, 2009). I ovde ispitanici svoj odgovor mogu bazirati na osnovu konkretnih događaja ili opštih informacija kojih mogu da se prisete. Takođe, moguće je da odgovor bude manje-više nasumičan.

Davanje odgovora je poslednja faza odgovaranja na stavke u kojoj ispitanik bira i saopštava svoj odgovor. U ovoj fazi ispitanik, kada se radi o stavkama sa ponuđe-nim odgovorima, bira onaj koji se po njegovom mišljenju najviša podudara sa odgovo-rom koji želi da dâ, a ako se radi o stavkama sa otvorenim odgovorom, ispitanik sam formuliše odgovor.

Iako kod stavki sa otvorenim odgovorom ispitanik ima mogućnost da odgovori na način koji želi, obično je samim pitanjem jasno definisano kakva vrsta i oblik odgo-vora se očekuje i ispitanik svoj odgovor prilagođava traženoj formi.

U stavci:

Koliko puta nedeljno (u proseku) kupujete u supermarketima koji se udaljeni od vašeg mesta sta-novanja ne više od 500 metara? __________________

Ispitanik ima mogućnost da odgovori kako god želi (npr: „retko“, „često“, „nemam supermarket toliko blizu“, pa i besmislenim odgovorom/pitanjem kao što bi bilo „Šta ako je udaljen 501 metar?“), ali iz pitanja je sasvim jasno da se traži informacija tipa broja.

Kako će ispitanik odgovoriti, između ostalog, zavisi od poklapanja podataka kojih se prisetio i ograničenja koja mu nameće način odgovaranja. Stoga je prilikom konstrukcije stavki sa ponuđenim odgovorima potrebno voditi računa da oni pokrivaju sve moguće odgovore ispitanika, odnosno, da najveći broj ispitanika među ponuđenim opcijama odgovora može da pronađe onu koja se poklapa sa odgovorom koji želi da dâ. U tome pomaže heterogen tim koji se bavi konstrukcijom stavki i pilot istraživanje koje može ukazati na nedostajuće opcije odgovora. Prilikom konstrukcije ovakvih pitanja, u prvoj fazi moguće je na manjem (ali što heterogenijem) uzorku postaviti pitanje u formi

Page 131: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

120

pitanja sa otvorenim odgovorom. Nakon toga se ponuđeni odgovori mogu kreirati na osnovu odgovora koje su ispitanici dali. Takođe, moguće je zadati stavku i u formi sa ponuđenim odgovorima i opcijom „drugo“, koja ima i liniju na koju ispitanici mogu da upišu odgovor ukoliko ne mogu da pronađu adekvatan među ponuđenim. Na osnovu tih dopisanih odgovora ponuđeni odgovori se mogu dopuniti.

Kada su u pitanju stavke sa otvorenim odgovorima, potrebno je stavku formuli-sati tako da je ispitaniku jasno kakav tip odgovora se od njega očekuje, kako po pitanju sadržaja, tako i po pitanju forme.

U prethodnom primeru sa supermarketom, stavka jasno definiše da se kao odgovor traži broj kupovina u supermarketima udaljenim najviše 500 metara od mesta stanovanja ispitanika, te da se taj broj odnosi na prosečan broj poseta nedeljno.

Pored toga što ispitanici svoje odgovore prilagođavaju tako da budu saglasni sa zahtevanim načinom odgovaranja, oni odgovore prilagođavaju i tako da budu usklađeni sa odgovorima koje su dali na prethodna pitanja. Osim toga, ispitanici mogu (i često to rade) svoje odgovore prilagođavati tako da budu socijalno poželjniji. Ukoliko želimo da dobijemo iskrene odgovore na pitanja koja provociraju socijalno poželjno odgovaranje, nekada je potrebno u tekstu pitanja ispitaniku dati do znanja da je u redu ponašati se i na način koji je manje socijalno poželjan.

U prethodnim danima mnogi ljudi su poslali pomoć krajevima pogođenim poplavama, ali mnogi iz raznih razloga nisu. Da li ste vi poslali pomoć? 1 Da 2 Ne

U ovom primeru deo pitanja u kojem se kaže da „mnogi iz raznih razloga“ nisu poslali pomoć daje „dozvolu“ ispitaniku da odgovori i sa „Ne“, odnosno stavlja do znanja da je i takav odgovor pri-hvatljiv.

Opisani kognitivni procesi odgovaranja na stavke odnose se na situaciju kada se ispitanici trude da odgovore što tačnije i adekvatnije. Čak i u tom slučaju, ovi procesi ne idu uvek opisanim redosledom. Dešava se da ispitanici neke od faza preskaču, pone-kad i ponavljaju, a nekim pristupaju nemarno (Groves, 2009). Ukoliko ispitanicima nije cilj da daju što tačniji odgovor već da što pre završe odgovaranje na anketu ili da se prikažu u socijalno poželjnijem svetlu, mogući su i drugi pristupi. Postoje modeli (Can-nell et al., 1981; Krosnick, 1991; Krosnick & Alwin, 1987) koji govore o dva načina odgovaranja. Jedan je pokušaj da se da što tačniji odgovor, a drugi je pokušaj da se što brže odradi anketa. Kod ispitanika koji žele da što brže završe anketu, nije cilj naći što tačniji odgovor već onaj koji je dovoljno dobar. Nekada se ovakav pristup odgovaranju naziva pristupom dovoljnosti (engl. satisficing), a suprotan je pristupu optimizacije (engl. optimization). Naime, ispitanici se ne trude da razumeju pitanje u potpunosti, već dovoljno dobro da mogu da daju smislen odgovor. Isto važi i za ostale faze procesa odgovaranja na stavku. Ne pokušavaju da se prisete svih potrebnih informacija, već samo onoliko koliko im je dovoljno da odgovor bude smislen...

Page 132: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

121

Da bi dali dovoljno dobar odgovor, koriste različite strategije poput prihvata-nja ili slaganja44 (engl. acquiescence) sa tvrdnjama, prihvatanja statusa quo ili srednje kategorije, ocenjivanje istom ocenom na skalama procene, odgovaranja sa „ne znam“, slučajnog biranja ponuđenih odgovora...

Potrebno je razumeti da ovakvi odgovori mogu nastati i kao rezultat optimiza-cije, odnosno odgovaranja koje za cilj ima davanje što boljeg i adekvatnijeg odgovora. Ispitanik se može slagati sa tvrdnjama zato što je to zaista njegovo mišljenje. Može iskreno biti protiv socijalnih promena ili neodlučan. Kada ocenjuje različite objekte na skalama procene može ih oceniti istom ocenom zato što su mu zaista jednaki, a kada nema mišljenje ili saznanja o objektu na koji se stavka odnosi, „ne znam“ jeste najadek-vatniji odgovor. Pre se može reći da ovakvi odgovori ponekad mogu biti znak da se ispitanik vodio pristupom dovoljnosti odgovora, a posebno kada postoje uslovi koji mu pogoduju (Krosnick, 1991). Ispitanici će češće pribegavati korišćenju ovog pristupa odgovaranju kada su im pitanja preteška, oni sami nisu motivisani, a sposobnosti su im ispod nivoa potrebnog za odgovaranje. Pitanja mogu biti teška za razumevanje, prise-ćanje, donošenje sudova i saopštavanje odgovora. Sposobnosti ispitanika takođe mogu biti ispod nivoa potrebnog za razumevanje pitanja, prisećanje, suđenje i saopštavanje odgovora.

Nekada se ova dva pristupa odgovaranju (optimizacija i pristup dovoljnosti) posmatraju kao dve jasno odvojene kategorije, ali je verovatnije da se radi o kontinuu-mu (Groves, 2009). Ispitanik prilikom odgovaranja na pitanja u anketi jednom pitanju može pristupiti ozbiljno i pokušati da dâ što adekvatniji odgovor, a već drugom pitanju pristupiti tako što će tražiti dovoljno dobar odgovor. Šta više, prilikom odgovaranja na jedno pitanje ispitanik različitim fazama odgovaranja (razumevanje, prisećanje, suđe-nje, saopštavanje odgovora) može pristupiti sa različitim stepenom ozbiljnosti i pažnje.

Kako anketa i pitanja u njoj ne bi provocirali primenu pristupa dovoljnost,i konstrukciji stavki potrebno je postupiti sa puno pažnje. Pre svega potrebno je voditi računa o ciljnoj populaciji (sposobnostima i motivaciji) i formulisati anketu i stavke tako da joj budu primerene (ne preteške).

6.2.1.1. Problemi tokom procesa odgovaranja na stavke

Tokom procesa odgovaranja na stavke mogu nastati razni problemi koji mogu dovesti do toga da odgovori koje istraživač dobije nisu oni koje je tražio.

Pogrešni odgovori mogu nastati jer ispitanik nije obratio pažnju na događaj na koji se odnosi pitanje pa ga nije u dovoljnoj meri zapamtio ili je vremenom zaboravio detalje.

44 Prihvatanje ili slaganje sa tvrdnjama je tendencija ispitanika da se slažu sa

tvrdnjama koje kao odgovor traže verifikaciju, odnosno da ispitanik kaže da li se slaže sa njom ili ne (tačno/netačno, slažem se/ne slažem se, da/ne...)

Page 133: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

122

Problemi u odgovaranju mogu nastati i zbog toga što ispitanik nije dobro razumeo pitanje, nije poštovao uputstva za odgovaranje, usled pogrešnog zaključivanja i procena, nemogućnosti ispitanika da formatira odgovor, i na kraju, zbog manje ili više namernog neiskrenog odgovaranja.

Prvi od problema je problem sa zapamćivanjem (termin koji se koristi u engleskom jeziku je encoding). Ovaj problem se javlja kada ispitanik, iako je iskusio događaj o kojem ga istraživač pita, nije zapamtio dovoljno informacija o njemu jer nije obratio pažnju. Da bi neki događaj bio (dobro) zapamćen, na njega mora biti usmerena pažnja. Ukoliko to izostane biće zapamćen samo opšti ton i istaknuti detalji. Kada se susretne sa pitanjem o nekom konkretnom detalju događaja, ispitanik neće moći da odgovori na njega ili će odgovoriti na osnovu sličnih događaja kojih se seća.

Sledeći problem je pogrešno razumevanje stavki. Ovaj problem može nastati usled gramatičke dvosmislenosti pitanja, njegove preterane složenosti, nejasnosti korišćenih pojmova, nejasnosti kvantifikatora (šta znači „retko“, „često“...), upotrebe nepoznatih termina, pogrešnih pretpostavki od kojih pitanje polazi („Da li se slažete da je bezbednost saobraćaja ugrožena zato što su plavuše loši vozači?“) i pogrešnih zaključaka ispitanika o tome na šta se pitanje odnosi.

Problemi u odgovaranju na stavke mogu nastati i zbog problema u prisećanju. Kao što je već rečeno, problemi u pamćenju mogu nastati već u fazi zapamćivanja. Uko-liko događaj nije zapamćen kako treba, ni prisećanje ne može biti bolje. Sećanje na događaj će biti rekonstrukcija na osnovu zapamćenih detalja i opšteg tona. Takva rekonstrukcija biće podložna racionalizaciji i asimilaciji.

Pod racionalizacijom se podrazumeva naknadno osmišljavanje i rekonstrukcija praznina u pamćenju. Ispitanik koji ne može da se seti nekih detalja pokušava da ih rekonstruiše na osnovu detalja kojih se seća (ili ih je rekonstruisao na sličan način). Asimilacija je proces u kojem ono što se opaža i pamti postaje slično starom iskustvu, a nastaje kao rezultat težnje za osmišljavanjem (Piaget, 2003).

S obzirom na ove procese, potrebno je imati u vidu da postavljanje sugestivnih pitanja (onih koja sugerišu da se nešto desilo i kako se desilo) može u značajnoj meri uticati na odgovor ispitanika i usmeriti ga u određenom pravcu.

Na primer, nije dobra stavka:

Vlada je efikasno delovala u situaciji poplava 2014. 1 uopšte se ne slažem 2 uglavnom se ne slažem 3 niti se ne slažem, niti slažem 4 uglavnom se slažem 5 u potpunosti se slažem

Page 134: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

123

Bolja je varijanta:

Kako je vlada delovala u situaciji poplava 2014? 1 potpuno neefikasno 2 uglavnom neefikasno 3 niti neefikasno, niti efikasno 4 uglavnom efikasno 5 u potpunosti efikasno

Prva verzija stavke sugeriše da je Vlada delovala efikasno i može uticati da se veći broj ispitanika složi sa ovakvom tvrdnjom, a posebno oni koji imaju sklonost da se slažu sa tvrdnjama. Druga varijanta stavke je u formi pitanja i ne sugeriše nijedan pravac odgovaranja niti način na koji je vlada delovala.

Isto tako, ukoliko se termini korišćeni u stavci razlikuju od termina koje je ispi-tanik koristio prilikom zapamćivanja, prisećanje će biti otežano.

Ako pitamo ispitanike da li su ikada dali mito nekom javnom službeniku, može se desiti da izosta-nu potvrdni odgovori ispitanika koji su dali „poklon“ zato što su ubačeni preko reda, ili onih koji su da bi dobili takav tretman učinili „protivuslugu“. Razlog je taj što ispitanici „poklon“ i „protivus-lugu“ ne doživljavaju kao mito, pa ih nisu tako ni zapamtili. Da bismo dobili potvrdne odgovore i takvih ispitanika, potrebno je u pitanju jasno definisati šta znači termin „mito“, ili čak izbaciti taj termin i pitati za sve situacije koje mi smatramo podmićivanjem. Naravno, sve to pod uslovom da su ispitanici spremni da priznaju davanje mita :).

6.3. Formati stavki

Već je rečeno da su stavke podsticaji, aktivno sredstvo kojim provociramo tač-no određeno ponašanje ispitanika – odgovaranje. Svaka stavka se sastoji od stabla koje može biti manje ili više eksplicitno i mesta za odgovore (Fajgelj, 2013).

Stablo stavke može biti u formi pitanja, tvrdnje ili zadatka. Obično je formulisa-no prirodnim jezikom, ali može uključivati predmete i multimedijalne elemente poput fotografija, video i audio snimaka...

Što se tiče mesta za odgovore, ono zavisi od formata prezentacije stavke. Pod formatom prezentacije podrazumeva se oblik, struktura i izgled stavke, kako je ispita-nik vidi (Fajgelj, 2013).

Formate prezentacije stavki možemo podeliti na dve velike grupe: stavke sa ponuđenim odgovorima i stavke otvorenog tipa, koje se još nazivaju stavke sa kons-truisanim odgovorima.

Stavke otvorenog tipa sastoje se od stabla stavke (u kojem se formuliše zahtev za odgovor ispitaniku) i prostora za davanje odgovora. Prostor za davanje odgovora je takođe bitan deo stavke jer sugeriše očekivanu dužinu odgovora koji se očekuje. Prema tome, ove stavke možemo razlikovati po dužini i vrsti odgovora koji se očekuje.

Stavke poput „Koji proizvođač automobila prema Vašem mišljenju proizvodi

Page 135: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

124

najkvalitetnije automobile?“ i „Molimo Vas da obrazložite zašto tako mislite.“ razlikuju se po stepenu „otvorenosti“ i po tipovima odgovora koji se očekuju.

U prvoj stavci od ispitanika se očekuje kratak odgovor, odnosno samo da nave-de naziv proizvođača. S te strane, ova stavka se ne razlikuje puno od stavke sa ponuđe-nim odgovorima. Međutim, odgovori ispitanika mogu se značajno razlikovati. Ispitanici koji nisu sigurni, nemaju izraženo interesovanje pa ni mišljenje o proizvođačima auto-mobila, neće moći da se sete svih mogućnosti pa možda neće umeti da odgovore. S dru-ge strane, ukoliko su im odgovori ponuđeni, moguće je da će se opredeliti za nekog od najpoznatijih proizvođača, bez stvarnog uvida u kvalitet vozila koje on proizvodi.

Druga stavka od ispitanika zahteva da obrazloži svoje mišljenje, očekuje se duži odgovor i u tom smislu je „otvorenija“ od prve. Na ovakvu stavku ispitanik može dati odgovor u skladu sa očekivanjima istraživača, navodeći karakteristike modela automo-bila određenog proizvođača koje ga čine kvalitetnijim od drugih, ali i potpuno promašiti temu, i dati odgovor koji se tiče cene.

Dobre strane otvorenih stavki su to što se lakše i brže konstruišu od pitanja sa ponuđenim odgovorima i mogu se koristiti za ispitivanje kompleksnijih pojava koje je teško pretočiti u stavke sa ponuđenim odgovorima. Brzina konstrukcije ovakvih pitanja čini ih pogodnim za upotrebu u ad hoc anketama kojima želimo da procenimo efekte aktuelnih događaja na javno mnjenje, i u sličnim situacijama kada je potrebno brzo reagovati.

Glavne mane ovakvih stavki su manja objektivnost ocenjivanja i to što su teže za obradu. Naime, stavke otvorenog tipa je pre obrade potrebno zatvoriti, odnosno kodira-ti (videti odeljak 10.1). U procesu kodiranja mogu do izražaja doći subjektivne odluke osoba koje taj proces obavljaju, pa suštinski isti odgovori mogu biti različito kodirani i ne moraju odražavati prave stavove ispitanika. S druge strane, postoje mišljenja da je razlika između otvorenih stavki i onih sa ponuđenim odgovorima u pogledu kodiranja samo u tome ko kodiranje vrši. Prema ovim shvatanjima (Visser et al., 2000), kod stavki sa ponuđenim odgovorima kodiranje vrše sami ispitanici. Naime, oni svoj odgovor kategorišu (kodiraju) u jednu od unapred ponuđenih kategorija. I oni mogu imati razli-čite kriterijume, a s obzirom da ih je više nego osoba zaduženih za kodiranje, varijansa odgovora koja potiče od različitog kodiranja45 može biti još veća.

Osim ovoga, kao manu stavki sa otvorenim odgovorima možemo navesti i činjenicu da u zavisnosti od obima i vrste očekivanog odgovora nisu pogodne za sve ispitanike. Da bismo iskoristili potencijale stavki sa otvorenim odgovorima potrebno je da ispitanici budu dovoljno obrazovani i motivisani.

Stavke sa ponuđenim odgovorima sastoje se od stabla stavke i liste ponuđe-nih odgovora. Ova vrsta stavki takođe ima različite varijetete. Prvo, možemo razlikovati

45 Odnosno, od različitog razumevanja značenja ponuđenih odgovora.

Page 136: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

125

stavke u kojima se od ispitanika zahteva da odabere samo jedan od ponuđenih odgovo-ra (pitanje sa višestrukim izborom – engl. multiple choice question), i stavke u kojima je ispitaniku dozvoljeno da odabere više ponuđenih opcija (pitanje sa višestrukim odgo-vorima – engl. multiple response question). Po svojoj formi, ove dve podvrste se ne razli-kuju pa je ispitanicima potrebno jasno napomenuti koliko odgovora smeju da biraju.

Za početak ćemo se osvrnuti na stavke sa višestrukim odgovorima. Ovakve sta-vke su specifične po postupku obrade. Pre bilo kakve statističke analize najbolje ih je razbiti u onoliko binarnih varijabli koliko ima ponuđenih odgovora. Svaka od tih varijab-li će sadržati podatak da li je ispitanik zaokružio (odabrao) odgovor na koji se varijabla odnosi, ili nije. Najčešće će kod ispitanika koji je odabrao konkretan odgovor biti uneta oznaka 1, a kod onih koji ga nisu odabrali 0. Ovakve stavke je moguće i prezentirati u tom formatu. Umesto jedne stavke u kojoj se omogućava biranje više odgovora, moguće je postaviti onoliko dihotomnih pitanja koliki je broj ponuđenih odgovora, pri čemu se od ispitanika na svakom od njih traži da se eksplicitno odredi prema objektu pitanja, a to može uticati da ispitanik pažljivije proceni svaki od ponuđenih odgovora.

Stavka sa mogućnošću biranja većeg broja odgovora:

Označite mobilne operatere čije ste usluge do sada koristili. Možete odabrati više odgovora. 1 TeleSrb 2 Fixtel 3 Rip

Isto pitanje kroz više dihotomnih stavki:

Da li ste do sada koristili usluge sledećih mobilnih operatera?

Da Ne TeleSrb Fixtel Rip

Pitanja u kojima se zahteva izbor jednog od ponuđenih odgovora mogu se raz-likovati prema broju ponuđenih odgovora. Ukoliko postoje samo dva ponuđena odgo-vora onda se nazivaju dihotomnim ili binarnim stavkama, a ukoliko je broj ponuđenih odgovora veći, onda se nazivaju pitanja sa višestrukim izborom.

Kada su dihotomne stavke u pitanju, možemo razlikovati i stavke tipa lista označavanja i stavke sa alternativnim izborom. Liste označavanja, doduše, nemaju ponuđena dva odgovora već kućicu koju ispitanik može da označi ili ne. Označena kući-ca se obično smatra potvrdnim odgovorom, a ukoliko je kućica prazna – odričnim. Ponuđeni odgovori kod dihotomnih stavki mogu se odnositi na slaganje sa tvrdnjom (da/ne, tačno/netačno), ali i na bilo koji drugi konstrukt (sviđa mi se/ne sviđa mi se, volim/ne volim). Osim toga, ponuđeni odgovori mogu biti i bilo koji objekti. U tom slu-čaju ove stavke se nazivaju stavkama sa alternativnim izborom.

Page 137: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

126

Stavka sa alternativnim izborom:

Koji od dva ponuđena mobilna operatera ima bolju pokrivenost? 1 TeleSrb 2 Fixtel

Kada stavka ima više od dva ponuđena odgovora naziva se pitanjem ili stavkom sa višestrukim izborom. U ovu grupu stavki spadaju i stavke sa spajanjem parova i sta-vke u kojima se od ispitanika traži da ponuđene objekte rangiraju po procenjivanom svojstvu.

U stavke sa višestrukim izborom možemo svrstati i one sa uređenim kategori-jama odgovora. Kod ovakvih stavki ponuđeni odgovori poređani su po nekom kriteri-jumu. Tako poređani odgovori čine kontinuum koji se može zasnivati na stavu, osećanju ili mišljenju ispitanika prema objektu koji se procenjuje (Fajgelj, 2013). Primer ovakvih stavki su skale procene (engl. rating scale), među kojima su najčešće korišćene skale Likertovog tipa.

Pitanja sa ordinalnom skalom odgovora su jedan od najčešće korišćenih forma-ta prezentacije stavki u anketama. Sastoje se iz stabla koje može biti u formi pitanja ili tvrdnje, i skale odgovora. Skale odgovora su politomne i mogu biti semantičke, numeri-čke, grafičke46 ili kombinovane.

Primeri različitih skala odgovora:

semantička vrlo retko povremeno često vrlo retko često dva puta jednom dva puta jednom jednom godišnje mesečno mesečno nedeljno dnevno

numerička

1 2 3 4 5

grafička vrlo|–––––––––––––––––––––––––––––––––––––––––––––––––––––|vrlo retko često

Za više informacija u vezi sa različitim formatima stavki i skala procene na srp-skom jeziku preporučujemo da konsultujete udžbenik iz psihometrije Stanislava Fajge-lja (2013).

Dobre strane pitanja sa ponuđenim odgovorima su to što ispitanici na njih rela-tivno lako i brzo odgovaraju, a takođe lako se objektivno ocenjuju i obrađuju. Ovo istra-živaču ostavlja mogućnost da u anketu stavi veći broj pitanja nego kada bi koristio pita-

46 Linija koju ograničavaju dva pola, a ispitanici odgovaraju označavanjem

lokacije koja odgovara intenzitetu njihovog stava.

Page 138: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

127

nja otvorenog tipa. Na taj način moguće je bolje pokriti domen istraživanja.

Mana ovakvih pitanja je što se znatno teže i sporije konstruišu nego pitanja otvorenog tipa, a nisu pogodna za kompleksnije konstrukte. Konstrukcija je spora jer ukoliko nameravamo da ispitanicima ponudimo odgovore, vrlo je bitno da lista odgovo-ra uključuje sve moguće relevantne odgovore koji se međusobno ne preklapaju, a to se u nekim slučajevima može jako zakomplikovati. Duže vreme potrebno za konstrukciju čini ih nepogodnim za upotrebu u ad hoc anketama koje je neophodno sprovesti u što kraćem roku. Naravno, ukoliko posedujemo proverene stavke iz prethodnih anketa koje se mogu ponovo iskoristiti, taj problem ne postoji.

6.4. Preporuke za pisanje stavki

Dilman i sar. (Dillman et al., 2014) daju sledeće preporuke za pisanje stavki:

1. Kada ispitanika pitamo da izabere između dve opcije potrebno je obe navesti u stablu stavke.

Kada u stavci nisu navedene obe opcije, ispitanici češće imaju tendenciju da se slože sa onom koja je navedena.

Pitanje:

Da li mislite da je obrazovni sistem u Republici Srbiji dobar ili loš? 1 Dobar 2 Loš

bolje je nego:

Da li mislite da je obrazovni sistem u Republici Srbiji loš? 1 Da 2 Ne

Kada bi u prethodnoj stavci umesto prideva „loš“ stajao pridev „dobar“, rezultati ne bi bili isti. Zamislimo da je na varijantu pitanja u kojoj su navedena oba prideva, sa „Dobar“ odgovorilo 53% ispitanika. To ne bi nužno značilo da bi u drugoj varijanti pitanja, gde je naveden samo pridev „loš“, sa „Ne“ odgovorilo 47%.

Slično važi i za pitanja sa ordinalnom skalom.

Pitanje:

Da li je zdravstveni sistem R. Srbije efikasan ili neefikasan?

neefikasan 1-----2-----3-----4-----5 efikasan

bolje je nego pitanje:

Koliko je efikasan zdravstveni sistem R. Srbije?

nimalo 1-----2-----3-----4-----5 izuzetno

Page 139: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

128

U ovoj varijanti pitanje implicira da je zdravstveni sistem efikasan i samo je pitanje u kojoj meri. U primeru gde su navedena oba prideva ispitanik može da se opredeli i za odgovor „efikasan“, ali i za neefikasan.

2. Lista ponuđenih odgovora u pitanjima sa višestrukim izborom mora biti iscrpna.

U stavkama sa višestrukim izborom gde su opcije odgovora nominalnog nivoa merenja, lista ponuđenih opcija mora biti iscrpna, odnosno mora sadržati sve moguće smislene odgovore.

Ukoliko ponuđene opcije nisu iscrpne, neki ispitanici neće moći da nađu opciju koja im odgovara, biće im teško da odgovore što može dovesti do neodgovora ili pada motivacije za učešće u anketi. Ovo se odnosi i na opcije poput „ne znam“ ili „ne želim da odgovorim“. Zagovornici stavljanja ovih opcija kažu da na taj način dajemo mogućnost ispitanicima da daju iskren i tačan odgovor. Naime, ispitanik koji ne zna ili ne želi da odgovori će, ukoliko je prisiljen, odabrati neku od opcija koje ne odražavaju njegovo pravo mišljenje ili stanje stvari. Ako nije prisiljen da odgovori na svako pitanje, može se desiti da jednostavno i ne odgovori, a istraživač će ostati uskraćen za podatak o razlogu neodgovora. Neće znati da li je ispitanik jednostavno prevideo pitanje, ne ume da odgo-vori ili ne želi. Ove informacije takođe mogu biti dragocene istraživaču. Protivnici sta-vljanja ovih opcija kažu da njihovo prisustvo omogućava nemotivisanim ispitanicima da lakše nađu dovoljno dobar odgovor (engl. satisfice). Stoga je odluku o uključivanju ovih opcija odgovora najbolje doneti za svaku stavku posebno. Opcije „ne znam“, „nisam siguran“, „ne želim da odgovorim“ i sl. ne koristiti kod pitanja za koja opravdano pret-postavljamo da većina ispitanika može da odgovori, a koristiti kod pitanja za koja možemo pretpostaviti da postoje ispitanici koji ne mogu i ne žele da daju odgovor na njih.

3. Kada se od ispitanika traži da odaberu samo jedan od ponuđenih odgo-vora, onda opcije odgovora moraju biti međusobno isključive.

Kada ponuđeni odgovori nisu međusobno isključivi, odnosno kada se kategori-je preklapaju, ispitaniku će biti teško da se opredeli za jedan odgovor što može biti frus-trirajuće i uticati na motivaciju.

Koliko imate godina? 20-30 30-40 40-50 50-60 60 i više

Ako izuzmemo činjenicu da je ovo pitanje bolje postaviti u otvorenoj formi, odnosno, tražiti od ispitanika da navedu tačan broj navršenih godina, pitanje ima problem zato što kategorije nisu međusobno isključive. Ispitanici koji imaju 30, 40, 50 i 60 godina ne mogu da se opredele u koju od kategorija spadaju.

Page 140: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

129

4. Kada se radi o pitanjima sa rangiranjem, tražiti od ispitanika da rangi-ra samo određen broj opcija, a ne kompletnu listu.

Postoji dilema da li koristiti stavke tipa rangiranja ili više stavki tipa skala pro-cene.

Stavke koje koriste skale procene zahtevaju od ispitanika da objekat stavke oceni na nekoj skali koja može biti semantička, numerička ili grafička. Na osnovu odgo-vora ispitanika na više takvih stavki istraživač može zaključiti o preferencijama ispita-nika, odnosno rangirati objekte koje je ispitanik nezavisno procenjivao u različitim stavkama.

Drugi pristup je da stavka eksplicitno traži od ispitanika da ponuđene objekte rangira na osnovu neke osobine. U ovakvim stavkama ispitanik direktno poredi objek-te.

Naravno da oba pristupa imaju i prednosti i mane.

Skale procene dozvoljavaju da osim poretka procenimo i za koliko se objekti razlikuju. Međutim, s druge strane, kod ovakvih skala dolazi do pojave nediferencijaci-je ili nerazlikovanja (engl. nondifferentiation), što je jedan od načina ispoljavanja stra-tegije biranja dovoljno dobrog odgovora (videti odeljak 6.2.1.1). Ova pojava se manifes-tuje tako što ispitanik veći broj objekata ocenjuje istom ocenom.

Kod rangiranja, s druge strane, nema problema sa nerazlikovanjem, ali se ispi-tanik prisiljava da pravi razliku između objekata koje možda zaista smatra jednakim. Takođe, sa aspekta razumevanja pitanja i kognitivnog opterećenja ispitanika, rangiranje većeg broja objekata može biti vrlo komplikovano.

Zato se prilikom primene ovakvog tipa pitanja preporučuje da se od ispitanika traži da rangira samo manji broj opcija sa liste ponuđenih (recimo 3 opcije), a to poseb-no važi ako su liste duže. Ukoliko ovakva pitanja zahtevaju od ispitanika da porede svaku opciju sa svim ostalim, broj poređenja se dramatično povećava sa svakim novim elementom liste.

Ukoliko imamo tri opcije (A, B, C) koje želimo da ispitanik uporedi, potrebna su tri poređenja (A-B, A-C i B-C). Ukoliko ubacimo samo još jedan element na listu (D), broj mogućih poređenja se dupli-ra (A-B, A-C, A-D, B-C, B-D i C-D).

Ukoliko je ipak potrebno rangiranje većeg broja opcija, vredi razmisliti o raču-narski podržanom modalitetu primene koji omogućava ispitaniku da prevlačenjem opcija (ili premeštanjem upotrebom strelica) vrši rangiranje. U klasičnom modalitetu moguće je svaku opciju staviti na posebnu karticu i od ispitanika zatražiti da kartice sortira prema posmatranom svojstvu. Oba ova načina su lakša za ispitanika nego rangi-ranje dodeljivanjem brojeva (Dillman et al., 2014). U verbalnom zadavanju ankete moguće je pitati ispitanika koja je od ponuđenih opcija najbitnija (najbolja, najpogodni-ja...), a zatim koja od preostalih itd. I ovde se preporučuje izbegavanje dugačkih lista.

Page 141: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

130

U svakom slučaju vredi razmisliti i o tome da li upotrebiti niz stavki tipa skale procene ili skale rangiranja. Ukoliko želimo samo da procenimo poredak, onda rangira-nje može biti efikasnije. Ako želimo da utvrdimo i kolike su razlike između objekata, skale procene mogu biti primerenije (Visser et al., 2000).

5. Izbegavati neujednačenost ponuđenih odgovora koja može dovesti do neravnopravnog poređenja.

Ako bi trebalo da izdvojite najlošiji aspekt usluge na našim benzinskim pumpama, šta bi to bilo? 1 neljubazni prodavci 2 kvalitet goriva 3 opremljenost prodavnice 4 sporost usluge 5 kvalitet usluge

U prethodnom pitanju opcije 1 i 4 sadrže termine koji imaju negativnu konotaciju. Termin „nelju-bazni“ sugeriše da su prodavci neljubazni, a termin „sporost“ da je usluga spora. Samim tim, ove opcije se u okviru ovog pitanja ističu kao mogući uzroci nezadovoljstva kupaca uslugom. Pitanje bi trebalo korigovati tako da se eliminiše bilo kakva konotacija iz ponuđenih opcija odgovora. Situa-cija ne bi bila bolja ni da umesto termina „neljubazni“ stoji termin „ljubazni“. I dalje bi opcija bila sugestivna, samo sada na drugu stranu. Iz istih razloga ne dolaze u obzir ni termini „ljubaznost (prodavaca)“ i „neljubaznost (prodavaca)“. Opciju 1 bi možda bilo najbolje promeniti u „ophođe-nje prodavaca (prema kupcima)“. Što se tiče opcije 4, tu je teže naći pravu formulaciju. „Brzina usluge“ takođe ne bi bila odgovarajuća korekcija. Vredelo bi razmisliti o varijanti „vreme potreb-no da budem uslužen/a“.

6. Koristiti format sa prisilnim izborom umesto pitanja sa višestrukim odgovorima.

Pitanja sa višestrukim odgovorima (engl. multiple response questions) su pita-nja u kojima se od ispitanika traži da označi sve opcije sa kojima se slaže.

Primer pitanja sa višestrukim odgovorima:

U koju od navedenih zemalja biste otišli na letovanje? (označite sve zemlje u kojima biste letovali) 1 Albanija 2 Bosna i Hercegovina 3 Bugarska 4 Crna Gora 5 Hrvatska 6 Rumunija 7 Mađarska 8 Makedonija

Stavke sa prisilnim izborom su stavke kod kojih je ispitanik prisiljen da bira između dve opcije.

Page 142: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

131

Primer pitanja sa prisilnim izborom:

Da li biste letovali u sledećim zemljama?

Da Ne Albanija Bosna i Hercegovina Bugarska Crna Gora Hrvatska Rumunija Mađarska Makedonija

Iako se ove dve forme pitanja često smatraju međusobno zamenljivim i tako koriste, one ipak ne funkcionišu isto. Istraživanja pokazuju da je u formi sa višestrukim odgovorima ispitanicima lakše da primenjuju strategiju biranja dovoljno dobrog odgo-vora. Ova istraživanja pokazuju da u toj formi ispitanici lakše prihvataju opcije pri poče-tku liste, dok u formi sa prisilnim odgovorima procesiraju sve ponuđene opcije. Dve forme pitanja se razlikuju i po zadatku koji se nalazi pred ispitanikom. Dok je u varijanti sa višestrukim odgovorima dovoljno da ispitanik označi sve opcije sa kojima se slaže, u varijanti sa prisilnim izborom on je prinuđen da donese eksplicitan sud o svakoj ponu-đenoj opciji (Dillman et al., 2014). Stoga se preporučuje format sa prisilnim izborom umesto formata sa višestrukim odgovorima. Format sa višestrukim odgovorima može se primenjivati kada se pitanja tiču činjenica na koje bi ispitanici znali odgovore i bez potrebe da čitaju listu ponuđenih odgovora (npr. „Koju od navedenih nekretnina pose-dujete?“ sa opcijama poput: stan, kuća, njiva...)

7. U pitanjima sa ordinalnom skalom odgovora koristiti prirodnu metri-ku.

Preporuka u vezi sa korišćenjem prirodne metrike odnosi se na podeoke skale odgovora u stavkama sa semantičkom ordinalnom skalom odgovora. Oni mogu biti dati u neodređenom obliku (vrlo retko, retko, često, vrlo često) ili u prirodnoj metrici (jed-nom godišnje, dva puta godišnje, jednom mesečno...). Neodređen oblik često nema isto značenje za sve ispitanike, niti za istog ispitanika u stavkama iz različitih oblasti. Jed-nom ispitaniku odlazak u pozorište jednom mesečno može značiti „retko“, a drugom ispitaniku „često“. Takođe, ispitanik koji posećuje zubara jednom u 6 meseci će to oka-rakterisati kao „često“, a odlazak u pozorište jednom u 6 meseci kao „retko“.

Stoga je preporuka da se zbog ujednačavanja značenja podeoka skale, kada god je to moguće, koristi prirodna metrika.

8. Uskladiti podeoke skale odgovora sa tekstom stabla stavke.

Stavka se može formulisati na razne načine. U njoj se od ispitanika može tražiti da proceni koliko se slaže sa tvrdnjom, koliko često radi neke stvari, da proceni koliko

Page 143: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

132

je verovatno da će nešto uraditi, koliko je zadovoljan proizvodom.... Dobro je da podeoci skale budu formulisani u skladu sa zahtevom za odgovor koji se postavlja u stavci. Uko-liko je pitanje formulisano kao tvrdnja i traži se procena slaganja sa njom, onda bi podeoci na skali trebalo da se kreću od „uopšte se ne slažem“ do „u potpunosti se sla-žem“. Ukoliko se traži procena tačnosti neke tvrdnje, onda bi podeoci trebalo da se kre-ću od „sasvim netačno“ do „sasvim tačno“ itd.

Skala odgovora koja se vrlo često koristi je skala slaganja. Ona je ispitanicima najpoznatija i omo-gućava uštedu prostora (pitanja se aranžiraju tabelarno, a skala odgovora je jednom data u uput-stvu za odgovaranje na grupu pitanja). Iako su ušteda prostora na ovaj način i poznatost skale ispitanicima dobre strane ove skale, ona ima i loših. Istraživanja pokazuju da skala slaganja pogo-duje ispitanicima koji su prilikom odgovaranja skloni povlađivanju.

Kada podeoci skale nisu usklađeni sa zahtevom iz stavke, od ispitanika to traži dodatni kognitivni napor kako bi svoj odgovor prilagodio skali odgovora. Ispitanik mora da „prevodi“ odgovor sa jednog koncepta na drugi.

Skala odgovora se ne slaže sa stablom stavke:

U kojoj meri ste zadovoljni Vašim sadašnjim automobilom? uopšte se uglavnom se niti se ne slažem uglavnom u potpunosti ne slažem ne slažem niti slažem se slažem se slažem

Bolje:

U kojoj meri ste zadovoljni Vašim sadašnjim automobilom? vrlo uglavnom niti nezadovoljan uglavnom vrlo nezadovoljan nezadovoljan niti zadovoljan zadovoljan zadovoljan

U prvom primeru skala nije usklađena i ispitanik mora da prvo proceni stepen zadovoljstva auto-mobilom, a zatim da odgovor prevede na skalu koja zahteva slaganje. U drugom primeru ispitanik može direktno da odgovori.

9. U stavci koristiti unipolarnu ili bipolarnu skalu odgovora (ne mešati ih).

U zavisnosti od konstrukta, u stavci je moguće koristiti unipolarnu ili bipolarnu skalu odgovora.

Unipolarne skale su sa jedne strane ograničene nultom tačkom.

Koliko je verovatno da ćete u toku narednih 6 meseci kupiti nov automobil? nimalo malo osrednje vrlo sigurno (neću ga kupiti) verovatno verovatno (kupiću ga)

Za razliku od njih, bipolarne skale odgovora protežu se između dva suprotna kraja iste dimenzije. Nulta tačka kod ovih skala odgovora nalazi se u sredini, odnosno na tački preloma iz jednog kraja dimenzije u drugu.

Koliko ste zadovoljni Vašim sadašnjim automobilom? vrlo uglavnom niti nezadovoljan uglavnom vrlo nezadovoljan nezadovoljan niti zadovoljan zadovoljan zadovoljan

Page 144: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

133

Oba tipa skale odgovora mere intenzitet nekog stava (mišljenja), dok bipolarne mere i njegov smer.

Bipolarne skale nisu primenljive u svakom slučaju. U primeru sa verovatnoćom kupovine novog automobila bipolarna skala ne bi imala previše smisla.

U anketnom istraživanju mogu se koristiti obe varijante, ali nije ih dobro meša-ti u jednom pitanju pošto su nejasne i remete ordinalni nivo skale jer mogu imati dve nulte tačke.

Kada se opredeljujete za kupovinu novog automobila, koliko vam je bitno da on što manje zaga-đuje prirodnu sredinu? potpuno donekle donekle vrlo nebitno nebitno bitno bitno

U ovom pitanju postoje dve nulte tačke („potpuno nebitno“ i prelaz između „donekle nebitno“ i „donekle bitno“). Osim toga nije u potpunosti jasna razlika između dve srednje kategorije. Kada je nešto „donekle bitno“, onda je to istovremeno i „donekle nebitno“.

10. Razmisliti o upotrebi grananja umesto korišćenja bipolarnih skala odgovora.

Kada se koriste bipolarne skale odgovora, od ispitanika se istovremeno traži da odgovori o smeru svog stava (zadovoljan – nezadovoljan, slažem se – ne slažem se, tačno – netačno), ali i o njegovom intenzitetu (u potpunosti, uglavnom...). Grananje služi da bi ispitanicima olakšalo ovaj zadatak. Ispitanik se prvo pita o smeru stava, a zatim o intenzitetu. Na primer, ukoliko ispitanika pitamo da li je zadovoljan ili nezadovoljan poslom i on odgovori da je zadovoljan, u narednom pitanju ga pitamo koliko je zadovo-ljan. Ukoliko odgovori da je nezadovoljan, onda ga pitamo koliko je nezadovoljan. Ako u pitanju postoji i srednja kategorija (niti zadovoljan, niti nezadovoljan), ispitanike koji su odabrali nju nema potrebe dalje pitati o intenzitetu.

11. Odabrati odgovarajuću dužinu skale odgovora.

Ordinalne skale odgovora mogu imati različit broj kategorija, od dve pa naviše. Prilikom konstrukcije stavki potrebno je odabrati optimalan broj. Premali broj katego-rija može frustrirati ispitanike, pošto neki od njih neće moći da nađu opciju koja im odgovara. To se može manifestovati u preskakanju takvih pitanja (neodgovor) ili zao-kruživanjem više opcija (ako ispitanik smatra da opcija koju bi zaokružio pada između te susedne dve). S druge strane, prevelik broj opcija može predstavljati dodatno kogni-tivno opterećenje za ispitanike, posebno ako su u pitanju modaliteti prikupljanja poda-taka u kojima anketar čita pitanja (npr. telefonske ankete).

Potrebno je da skala ima onoliko podeoka koliko je neophodno da se adekvatno pokrije kontinuum merenog konstrukta, a da ne postane opterećujući za ispitanike. Kod unipolarnih skala to je obično 4 ili 5, a kod bipolarnih 5 ili 7 (Dillman et al., 2014; Lyberg, 1997).

Page 145: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

134

Kada je u pitanju srednja kategorija (neodlučan), postoje rasprave da li je njeno prisustvo opravdano ili ne, te da li ona predstavlja samo lak izlaz za nemotivisane ispi-tanike koji žele da što pre završe anketu. Istraživanja pokazuju da se rezultati dobijeni na stavkama sa i bez ove kategorije ne razlikuju značajno (Dillman et al., 2014; Fajgelj, 2013). Pošto nema značajnih razlika, a ispitanici očekuju postojanje ove kategorije (koja za neke ispitanike može zaista predstavljati pravi odgovor), onda nema razloga da ona bude izostavljena.

12. Verbalizovati sve kategorije skale odgovora.

Skale odgovora se mogu predstaviti na razne načine. Mogu biti isključivo semantičke (samo verbalni opisi bez brojeva), isključivo numeričke (samo brojevi bez verbalnih opisa), kombinovane (i brojevi i verbalni opisi)... Kada su u pitanju kombino-vane skale, moguće je dati verbalne opise samo za krajnje kategorije. Ovo se često radi kada su u pitanju telefonske ankete i anketarima je lakše (i kraće) da pročitaju značenja samo dve krajnje kategorije. Međutim, ukoliko je to slučaj, interpretacija značenja sred-njih kategorija ostavljena je ispitanicima, a oni istim kategorijama mogu pridavati razli-čita značenja. Ukoliko istraživač želi da ima kontrolu nad značenjima tih kategorija (što svakako želi), poželjno je verbalizovati sve kategorije.

12. Izbegavati numeričke oznake u ordinalnim skalama sa neodređenim kategorijama.

Ranije je pomenuto da skale mogu biti date u izvornoj metrici ili u neodređe-nim kategorijama. Kada su u pitanju skale sa neodređenim kategorijama, Dilman (Dill-man et al., 2014) preporučuje uklanjanje numeričkih oznaka gde god je to moguće. Naime, on smatra da su numeričke oznake samo još jedna dodatna informacija koju ispitanik mora da obradi i dâ joj smisao. Osim toga, različite numeričke oznake mogu imati različita značenja za ispitanike. Nije svejedno da li su numeričke oznake petoste-pene skale unipolarne (recimo od 0 do 4 ili od 1 do 5) ili bipolarne (od -2 do +2).

Zamislimo situaciju da tražimo od ispitanika da procene svoje zadovoljstvo nekim objektom na petostepenoj skali od „nisam zadovoljan“ do „izuzetno zadovoljan“. Ukoliko je skala unipolarna (od 0 do 4) može se desiti da ispitanici 0 dožive kao oznaku za potpuno odsustvo zadovoljstva. Međutim, ukoliko je skala bipolarna (od -2 do 2) može se desiti da ispitanici odsustvo zadovoljstva smeste na srednji podeok (0), a da podeoci označeni negativnim brojevima dobiju konotaciju manje ili više izraženog nezadovoljstva. Samim tim većina ispitanika koja se na unipolarnoj skali pozicionirala na podeocima od 0 do 4, će na bipolarnoj skali biti grupisana u opsegu od 0 do +2.

13. Skala odgovora bi trebalo da približno odgovara distribuciji merenog svojstva u populaciji.

Ispitanici značenje stavke ne određuju isključivo na osnovu reči upotrebljenih u njenom stablu i ponuđenim odgovorima. Oni značenje stavke određuju i na osnovu ponuđenih kategorija. Ovo je posebno slučaj kod stavki koje pitaju za neke uobičajene stvari, na koje ispitanici ne obraćaju puno pažnje. Na ovakva pitanja oni obično ne znaju

Page 146: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

135

tačan podatak koji se traži, već je potrebno da na osnovu pojedinih situacija kojih se sećaju i njihove učestalosti formulišu odgovor. Ukoliko nisu sigurni u svoj odgovor, mogu pokušati da na osnovu ponuđene skale odgovora zaključe šta je uobičajeno i svoj odgovor prilagode tome.

Uzmimo na primer sledeće pitanje sa dve različite skale odgovora:

Prisetite se vaših poseta tržnim centrima. Koliko obično vremena provedete u tržnom centru (po jednoj poseti)?

skala odgovora 1 1 manje od sat vremena 2 između sat vremena i dva sata 3 između dva i tri sata 4 između tri i četiri sata 5 više od četiri sata

skala odgovora 2 1 manje od tri sata 2 između tri i četiri sata 3 između četiri i pet sati 4 između pet i šest sati 5 više od šest sati

Ispitanik koji nije siguran koliko zaista vremena provede u prosečnoj poseti tržnom centru, na osnovu prve skale odgovora može shvatiti da je uobičajeno vreme koje ljudi provode u takvim posetama do tri sata (pošto ova skala stavlja akcenat na taj opseg distribucije).

Do ovakvog zaključka bi mogao doći zato što je kategorija „između dva i tri sata“ srednja kategori-ja skale odgovora i doživeti je kao prosečno vreme koje većina ljudi provede u tržnom centru. Ako svoj odgovor formuliše na osnovu toga šta smatra da je prosek populacije i poredi se sa tim pro-sekom, jasno je da će odgovor ispitanika zavisiti od ponuđene skale.

Ukoliko bi mu bila prezentovana druga skala odgovora, isti ispitanik bi mogao shvatiti da je uobi-čajeno vreme koje ljudi provode u posetama tržnim centrima između četiri i pet sati (zato što je u ovoj skali to srednja kategorija).

Na primeru prve skale odgovora, proces zaključivanja ispitanika bi mogao teći ovako:

„Ne znam baš koliko to traje, ali zadržavam se kraće od većine ljudi. Koliko li se većina zadržava? Pa, prema ovoj skali izgleda da je to dva do tri sata. Pošto se ja zadržavam kraće od drugih onda ću odgovoriti između sat i dva sata. Odlično! Idemo dalje...“

Na primeru druge skale:

Ne znam baš koliko to traje, ali zadržavam se kraće od većine ljudi. Koliko li se većina zadržava? Pa, prema ovoj skali izgleda da je to četiri do pet sati. Pošto se ja zadržavam manje od drugih onda ću odgovoriti između tri i četiri sata. Odlično! Idemo dalje...“

Da bi se izbegli ovi problemi, potrebno je skalu definisati tako da približno pokriva distribuciju merene karakteristike u populaciji ili pitanje postaviti u otvorenoj formi.

Page 147: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

136

14. U stablu stavki sa otvorenim odgovorima navesti kakav se tip odgovo-ra očekuje.

Ova preporuka se odnosi na pitanja otvorenog tipa u kojima ispitanik ima slo-bodu da sam formuliše odgovor.

Problem je što odgovor koji formuliše ispitanik ne mora biti onog tipa koji istraživač očekuje. Da bi se to izbeglo, potrebno je u stablu stavke specifikovati tip odgovora koji očekujemo.

Na pitanje:

Kada ste diplomirali? ______________

možemo dobiti odgovore: „2010.“, „Oktobar. 2010“, ali i „davno“, „skoro“, „ne znam“, „o Aran-đelovdanu“.

Ukoliko želimo da nam ispitanik odgovori u formi koju želimo, najbolje je da mu to specifikujemo u stablu stavke.

Navedite mesec i godinu kada ste diplomirali: _________ _________

Ovo je posebno bitno u modalitetima prikupljanja podataka u kojima ispitanik ne može da vidi prostor koji je ostavljen za odgovore, a koji bi trebalo da sugeriše tip odgovora i njegovu dužinu.

Na ovom mestu osvrnućemo se na dilemu da li koristiti pitanja sa ponuđenim odgovorima ili pitanja sa otvorenim odgovorima.

Oba formata imaju svoje prednosti i mane.

Pitanja sa otvorenim odgovorima mogu se lakše i brže konstruisati, a ispitanici prilikom odgovaranja nisu ograničeni ponuđenim opcijama. To ispitanicima ostavlja mogućnost da daju pravi odgovor, za razliku od (loše konstruisanih) pitanja sa ponuđe-nim odgovorima. Ovakva pitanja su pogodnija za ispitivanje kompleksnijih koncepata47 od pitanja sa ponuđenim odgovorima.

Nedostatak ovakvog tipa pitanja je što nisu jednako pogodna za ispitanike svih uzrasta i različitih nivoa obrazovanja. Mogu biti suviše komplikovana za decu ili ispita-nike koji zbog starosti ili bolesti imaju problema sa verbalnim izražavanjem u usmenoj ili pismenoj formi. Takođe, zahtevaju veći kognitivni napor kod ispitanika i duže vreme odgovaranja pa posledično mogu umanjivati motivaciju ispitanika. Zbog svega toga, u prosečnu anketu moguće je staviti znatno manji broj ovih pitanja nego pitanja sa ponu-đenim odgovorima što može rezultirati slabijom pokrivenošću domena istraživanja.

Najveća mana otvorenih pitanja u kojima se zahteva deskriptivni odgovor je objektivno ocenjivanje odgovora. Pošto ispitanici imaju mogućnost da se izraze na način koji žele, dobijeni odgovori mogu biti prilično raznoliki. Da bi podaci mogli biti obrađe-

47 Npr. razloga zbog kojih ispitanik ima određeni stav i slično.

Page 148: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

137

ni, potrebno ih je kategorisati. Ova procedura naziva se kodiranje i opisana je u poglav-lju 10.1. Pored dodatnog vremena koje ova procedura iziskuje, i samim tim diže cenu istraživanja, najveći problem ipak je objektivnost ovog procesa. Kodiranje obavlja veći broj osoba, a njihova kategorizacija odgovora može se vrlo često razlikovati. Ukoliko se to desi, a razlike su veće magnitude, proces kodiranja je potrebno modifikovati i pono-viti, a to dodatno povećava utrošak vremena i troškove istraživanja.

S druge strane, stavke sa ponuđenim odgovorima teže se konstruišu, ali lakše ocenjuju (kodiraju). U stvari, odgovaranje na stavke sa ponuđenim odgovorima može se posmatrati kao situacija u kojoj ispitanici sami kodiraju svoje odgovore u neku od pre-definisanih kategorija (Visser et al., 2000). To praktično znači da imamo još veći broj osoba koje obavljaju kodiranje, a prostor za različito razumevanje ponuđenih kategorija je još veći.

Prednost stavki sa ponuđenim odgovorima je što manje opterećuju ispitanike. Ispitanici na njih brže odgovaraju i nije im potrebna prevelika sposobnost verbalnog izražavanja. S obzirom na sve to, ankete mogu sadržavati veći broj ovakvih nego pitanja otvorenog tipa i bolje pokrivati domen.

Mana stavki sa ponuđenim odgovorima je to što se teže konstruišu. Osim for-mulisanju stabla stavke, posebna pažnja mora se posvetiti i kreiranju iscrpne, međuso-bno isključive liste ponuđenih odgovora, a to nije nimalo lak zadatak. Konstruisanje ovakve liste često uključuje zadavanje pitanja istog sadržaja (u formi sa otvorenim odgovorima) na dovoljno velikom uzorku. Nakon toga odgovori se kategorišu i kodira-ju, a opažene kategorije koriste se za formiranje liste ponuđenih odgovora u pitanju sa ponuđenim odgovorima.

Najznačajnija mana pitanja sa ponuđenim odgovorima je to što odgovore ispi-tanika mogu ograničiti na neki iz skupa ponuđenih, iako to nije cilj istraživača. Čak i ako ispitaniku ponudimo opciju da dopiše odgovor koji nije ponuđen48 on to vrlo često neće učiniti (Visser et al., 2000).

Ako bi mogla da se formuliše neka preporuka da li bi pitanje trebalo da bude otvorenog tipa ili ne, onda bi to bilo da tip pitanja bude prilagođen konceptu koji se ispituje. Ako je moguće formulisati iscrpnu i međusobno isključivu listu ponuđenih odgovora, onda pitanja sa ponuđenim odgovorima imaju prednost. S druge strane, uko-liko to nije moguće ili nas zanima raznolikost pojave, onda bi prednost trebalo dati pitanjima sa otvorenim odgovorima.

15. Potrebno je dodatno motivisati ispitanike za odgovaranje na opširnija pitanja otvorenog tipa.

Kod pitanja sa otvorenim odgovorima, za potrebe anketnih istraživanja može-

48 Na primer opcija: „Drugo (napišite šta): ________________________“

Page 149: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

138

mo razlikovati ona sa kratkim odgovorom i ona sa dužim odgovorima, u kojima se od ispitanika traži da nešto opiše ili obrazloži.

U pitanjima sa kratkim odgovorima od ispitanika se traži da odgovori jednom rečju, sintagmom, kraćom rečenicom. To su pitanja poput: „Koji vam je omiljeni proiz-vođač automobila (navedite jednog): ____________________________“, „Starost u navršenim godinama: _______________“ i slična. Ovakva pitanja su prilično jasna i ne razlikuju se pre-više po kompleksnosti od pitanja sa ponuđenim odgovorima.

S druge strane, pitanja otvorenog tipa koja zahtevaju opisne odgovore, teža su za ispitanike. Ona pored operacija koje su potrebne i za odgovaranje na pitanja sa ponuđenim odgovorima, zahtevaju da ispitanik sam formuliše odgovore. Nemotivisani ispitanici mogu preskakati ova pitanja ili davati šture odgovore. Zbog toga je potrebno ispitanike motivisati na neki način. U situaciji istraživanja licem u lice to može biti deo odgovornosti anketara, ali kada su pitanja namenjena samoadministraciji onda je pot-rebno uz pitanje napisati i rečenicu ili dve koje ih mogu motivisati da odgovore. U tak-vim rečenicama može se objasniti značaj pitanja za istraživača i koliko je istraživaču važno mišljenje ispitanika. To bi mogle biti rečenice poput ove: „Ovo pitanje nam je vrlo bitno da bismo razumeli Vaš stav prema obrazovnom sistemu Republike Srbije. Stoga Vas molimo da date što potpuniji odgovor.“ Istraživanja pokazuju da ovakve motivacio-ne poruke poboljšavaju kvalitet odgovora, odnosno odgovori su duži i razrađeniji (Dil-lman et al., 2014) .

I sama česta upotreba opširnijih pitanja otvorenog tipa demotiviše ispitanike (Dillman et al., 2014). Preporuka je da se koriste samo kada je to zaista neophodno.

16. Koristiti neutralne podsticaje kada se koriste pitanja otvorenog tipa.

Kada ispitanik šturo odgovori na pitanje otvorenog tipa, potrebno ga je podsta-knuti da odgovor razradi. Bez obzira da li se koriste otvorena pitanja koja traže nabra-janje ili ona deskriptivnog tipa, korisna praksa je koristiti neutralne podsticaje (engl. probe) poput „Da li biste dodali još nešto“ i slične.

Postojanje dodatnih podsticaja poboljšava kvalitet odgovora, odnosno njihovu dužinu i razrađenost, ali je pre svega bitno da ti podsticaji budu neutralni. Ukoliko pod-sticaji ne bi bili neutralni, mogli bi uticati na odgovore ispitanika i odražavati stavove i mišljenja onoga ko podsticaj daje, a ne samog ispitanika.

Osim toga, bitno je prilagoditi podsticaj tipu traženog odgovora. Ako se traži nabrajanje onda je podsticaj „Da li biste dodali još nešto?“ sasvim odgovarajući. Isti podsticaj ne bi jednako dobro funkcionisao kada bismo od ispitanika tražili da obrazloži zašto je za ili protiv neke društvene pojave, i kod sličnih pitanja. Kod pitanja takvog tipa bolje funkcionišu podsticaji tipa „Možete li reći nešto više o tome?“, kojima se traži dodatna elaboracija (Dillman et al., 2014).

Naravno, ova preporuka se odnosi pre svega na ankete u kojima postoji nepos-

Page 150: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

139

redna interakcija ispitanika i anketara, ali moguće ju je primeniti i u računarski podrža-nim modalitetima prikupljanja podataka.

6.5. Formatiranje upitnika

Formatiranje upitnika utiče na to koliko će ispitanicima, anketarima i osobama zaduženim za pripremu podataka biti teško ili lako da pročitaju i razumeju pitanja i shvate kakvi se odgovori traže (ne u smislu sadržaja već u smislu forme). Ono uključuje istovremenu upotrebu različitih vizuelnih elemenata i obezbeđivanje njihovog efikas-nog sadejstva u cilju lakšeg uočavanja i obrade informacija od strane ispitanika, te lak-šeg davanja odgovora (Dillman et al., 2014).

Prilikom formatiranja upitnika najbitnije je da on bude prilagođen ispitanicima, zatim anketarima, i tek na kraju osobama zaduženim za obradu. To je nužno jer ispita-nici i anketari doživljavaju veći nivo stresa u situaciji anketiranja, za razliku od osoba koje obrađuju podatke i nisu deo te situacije (Bradburn, Sudman, & Wansink, 2004).

Kada je u pitanju formatiranje upitnika, načelo kojim se treba voditi je pregled-nost. Upitnik, pre svega, mora da bude pregledan i da omogućava lako snalaženje ispi-tanika i anketara.

Prva stvar o kojoj je potrebno voditi računa, a koja se možda ne čini bitnom, je veličina i formatiranje slova. Istraživači su često u iskušenju da zarad uštede na prosto-ru i kako bi upitnik bio naizgled kraći – smanje veličinu slova (fonta). Preporučuje se veličina 12 (pt), mada u zavisnosti od fonta i veličina 10 može biti dovoljno čitljiva (Bradburn et al., 2004).

Prilikom definisanja vizuelnog izgleda ankete dozvoljeno je i korisno upotreb-ljavati različita sredstva poput različitih vrsta i formatiranja slova, upotreba okvira i senčenja, upotreba različitih razmaka i simbola...

Kao što je već rečeno, vrsta slova, njihova veličina, bold i italik format, podvla-čenje i razne boje mogu se koristiti da naglase bitne delove pitanja i ponuđenih odgovo-ra. Prilikom izbora vrste slova potrebno je imati na umu da isti font ne mora biti jedna-ko čitljiv na papiru i na računarskom ekranu. Na bitne delove stavke može se ukazati i upotrebom simbola poput strelica, asteriska (*) ili inverzije boje (tamna pozadina / svetla slova)...

U računarski podržanim anketama to može biti rešeno i različitim bojama. Ovo je moguće i u štampanim anketama, ali znatno poskupljuje štampu.

Poželjno je numerisati pitanja. Kod računarski podržanih anketa ovo je neop-hodno, ali i kod klasičnih anketa na papiru je to dobro uraditi. Numerisanje pomaže ispitaniku i anketaru kretanje kroz upitnik i olakšava uočavanje preskočenih pitanja.

Pitanja se obično numerišu tako da sekcije upitnika budu označene velikim slo-vima (A, B, C...), redni brojevi pitanja arapskim brojevima (1, 2, 3...), a potpitanja malim

Page 151: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

140

slovima (a, b, c...) ili arapskim brojevima. Označavanje pitanja sledi ovaj redosled: sekci-ja, pitanje, i na kraju potpitanje, pri čemu su oznake potpitanja odvojene tačkama (npr. A1, B1.c, D3.a). Mogući su i drugi načini numeracije, sve dok su oznake jasne.

Nekada nije potrebno da svi ispitanici odgovaraju na sva pitanja. U zavisnosti od njihovog odgovora na jedno pitanje, dalji put kroz anketu može se granati. Numeri-sanje odgovora u tom slučaju pomaže da se ispitaniku daju instrukcije za preskakanje pitanja, odnosno instrukcije za kretanje kroz anketu (engl. skip instructions).

Primer grananja:

A1. Da li ste zaposleni?

1. Da A2 ukoliko je odgovor Da nastaviti sa pitanjem A2

2. Ne A3 ukoliko je odgovor Ne nastaviti sa pitanjem B1

A2. U kom sektoru ste zaposleni?

1. Privatnom

2. Javnom

C1

B1. Koliko dugo (u mesecima) ste nezaposleni? ____________ D1

C1. Koliko dugo (u mesecima) radite na sadašnjem radnom mestu? ____________

Prvih nekoliko uputstava za kretanje može biti dato tekstualno i strelicama, a zatim u nastavku mogu se koristiti samo strelice i brojevi pitanja

Numerisanje omogućava ispitaniku da lakše može da prati svoj napredak kroz anketu, što može delovati motivišuće.

U fazi analize, numeracija pitanja služi za komunikaciju između istraživača i osoba zaduženih za obradu podataka.

Kao što je već rečeno, prilikom formatiranja upitnika, pa i aranžiranja pitanja u anketi, osnovni zahtev je preglednost. Iako je list ili ekran moguće podeliti na više kolo-na, preporuka je da pitanja budu aranžirana u jednoj koloni, jedno ispod drugog. Nije preporučljivo jedno pitanje deliti na više strana jer se može desiti da ispitanik odgovori samo na osnovu dela pitanja koji se nalazi na jednoj strani. Ukoliko se pitanje ne može uklopiti do kraja strane, bolje ga je prebaciti na narednu stranu, a razmak između pret-hodnih pitanja povećati kako bi strana bila balansirano popunjena.

Nekada pitanja mogu biti dugačka toliko da jedno pitanje zauzima više od jedne cele strane. To je obično slučaj sa pitanjima koje imaju dugačku listu ponuđenih odgo-vora. Ona nisu pogodna za samoadministraciju kod većine ispitanika, već samo za one obrazovanije i vične odgovaranju na ankete. Takva pitanja bi trebalo da čita anketar, a njemu je potrebno posebno skrenuti pažnju na broj strana koje pitanje zauzima. Ako se ovakva pitanja i nađu u upitniku za samoadministraciju, onda se lista ponuđenih odgo-

Page 152: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

141

vora obično nalazi na posebnom listu papira, a od ispitanika zahteva da u kućicu unese odgovarajući kôd (Bradburn et al., 2004). U računarski podržanom anketiranju ovaj problem se lakše rešava pošto pitanja mogu biti prikazana jedno po jedno, a od ispita-nika se zahteva samo da označi neki od ponuđenih odgovora.

Kada govorimo o ponuđenim odgovorima, preporuka je da budu aranžirani jedan ispod drugog u nekom logičkom redosledu. Ukoliko se radi o odgovorima koji govore o količini ili intenzitetu, onda je logičan redosled ponuđenih odgovora upravo po tim svojstvima. Kada nije moguće uspostaviti logičan redosled, onda ponuđeni odgo-vori mogu biti sortirani azbučnim ili abecednim redosledom (u zavisnosti od korišće-nog pisma).

Od ovog načina sortiranja moguće je odustati prilikom računarskog anketiranja kada se redosled ponuđenih odgovora može randomizovati (učiniti slučajnim) kako bi se izbegao uticaj pozicije na biranje odgovora (videti odeljak 6.6.2). Randomizacija može biti korisna kada se stavka odnosi na preferencije ispitanika. Ne treba je prime-njivati kada je odgovore moguće poređati po nekom logičnom redosledu ili kada se pitanje odnosi na činjenice (npr. visina primanja, bračno stanje, nacionalnost...). Važno je napomenuti da je randomizacija u izvesnoj meri moguća i u štampanim anketama, ali se ograničava na manji broj verzija ankete u kojim ponuđeni odgovori imaju različit raspored.

Kada su u pitanju semantičke i numeričke skale odgovora (npr. „u potpunosti se ne slažem“ do „u potpunosti se slažem“ ili od 1 do 5 i sl.), ponuđeni odgovori se mogu aranžirati horizontalno u jednom redu. Ukoliko to nije moguće, mogu se aranžirati ver-tikalno, što je bolje nego da se skala prelama u dva reda.

Opšta preporuka je da se pitanja i ponuđeni odgovori u anketi (bila ona štam-pana ili računarski podržana) aranžiraju tako da budu u skladu sa smerom čitanja u jeziku ankete (u srpskom jeziku je to sa leva na desno i od gore ka dole). To praktično znači da, ukoliko smo se ipak opredelili da pitanja aranžiramo u dve kolone, redosled odgovaranja na njih bi trebalo da bude sa leva na desno, pa se zatim prelazi u sledeći red. Isto važi i za ponuđene odgovore aranžirane u više kolona. U slučaju da se istraži-vač ne drži ove preporuke, onda je potrebno da redosled odgovaranja bar bude dosle-dan, odnosno, ukoliko su pitanja poređana po redovima, to mora važiti za sva pitanja u anketi. Isto važi i ukoliko su pitanja poređana po kolonama, a pravilo se može primeniti i na ponuđene odgovore.

Istraživači često smanjivanjem veličine slova i sabijanjem pitanja pokušavaju da štampane ankete učine vizuelno kraćim iz više razloga. Jedan je ušteda materijala, a drugi je da se ispitanicima anketa učini kraćom i da lakše prihvate učešće. Međutim, sabijanjem i smanjenjem veličine slova, anketa postaje nekomforna, zbunjujuća za ispi-tanika (a nekad i za anketara), i to kao rezultat može imati previđanje pitanja, odgova-ranje na pogrešnim mestima i slične greške. Kod pitanja sa otvorenim odgovorima

Page 153: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

142

neophodno je ostaviti dovoljno mesta za odgovor ispitanika (u obimu koji se od njega očekuje). Sama veličina ostavljenog mesta sugeriše ispitaniku koliko opširan odgovor je očekivan. Ukoliko nije ostavljeno dovoljno mesta ili je ono zbijeno to može uticati na način i sadržaj odgovora ispitanika. Takođe, ispitanici, ukoliko im predviđeno mesto nije dovoljno, odgovore mogu pisati na drugim mestima što će napraviti probleme pri-likom unosa i obrade podataka i povećati troškove te faze.

Fizički, najbolje je da štampani upitnik koji zauzima više strana bude u formi knjižice, uvezan kao sveska, a ne zaheftan samo u jednom uglu. Ovakav upitnik je lakši za listanje, ređe će se desiti da se otkine neka strana ili da ispitanik/anketar previde neku od strana. Takođe, u ovakvim upitnicima moguće je dati i pitanje koje zauzima više od jedne strane (ako se takvo pitanje stavi na dve naspramne strane). Ovako uve-zan upitnik deluje znatno profesionalnije i ozbiljnije, a to je značajno kod anketa koje ispitanici popunjavaju samostalno (Bradburn et al., 2004).

Preporuka je da kod ovako uvezanih upitnika, naslovna strana sadržava naziv studije, naziv institucije koja sprovodi istraživanje i potrebna uputstva koja se odnose na celu anketu. Na naslovnu stranu je moguće staviti ilustraciju koja bi trebalo da bude neutralna (odnosno ne bi smela da utiče na odgovaranje ispitanika), a poslednja strana bi trebalo da bude prazna kako bi na nju ispitanik mogao da napiše svoj komentar uko-liko to želi (Dillman et al., 2014).

Na početku anketnog upitnika potrebno je ispitaniku predstaviti istraživanje. U ovom uvodu običaj je navesti naziv organizacije koja sprovodi istraživanje (osim ako to može uticati na rezultate istraživanja). Takođe, pod istim uslovima dobro je navesti ko finansira istraživanje. Ugled institucije koja sprovodi ili plaća istraživanje može u mno-gome doprineti uspehu same ankete.

Ovaj uvod bi trebalo da sadrži i glavne ciljeve istraživanja i njegov značaj za potencijalne učesnike u anketi (ako postoji). U njemu bi na neki način trebalo motivisati potencijalne ispitanike da uzmu učešće u anketi. Uobičajeno je da se na ovom mestu ukaže na značaj mišljenja ispitanika za samo istraživanje.

Ispitaniku je potrebno objasniti i kako se baš on našao u uzorku kako ne bi pomislio da postoje neki tajni razlozi zašto je izabran u uzorak.

Takođe, potrebno je ispitanicima objasniti da nema tačnih i netačnih odgovora, odnosno da su svi odgovori jednako vredni dok god su iskreni.

Na kraju, izuzetno bitno je da se ispitaniku objasni da će svi odgovori i podaci koje dâ, biti poverljivi. Anonimnost u anketnim istraživanjima ne mora da znači da istraživač ne zna ko je i kako odgovarao (mada je i to moguće). Anonimnost je obezbe-đena ukoliko niko ne može da objavljene rezultate poveže sa individualnim ispitanikom (Rea & Parker, 2014). O anonimnosti i poverljivosti biće više reči u poglavlju 12.

Page 154: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

143

Primer uputstva:

Istraživanje kvaliteta života stanovnika Republike Srbije sprovodi Državna agencija za unapređe-nje kvaliteta života RS (DAZUKŽRS) pod pokroviteljstvom i uz finansiranje Fonda za unapređenje kvaliteta života Ujedinjenih Nacija (UNQOLIF).

Cilj ovog istraživanja je procena trenutnog stanja kvaliteta života u RS i mišljenja stanovnika RS o potrebnim merama za njegovo unapređenje.

Ispitivanje se obavlja na uzorku od 1.200 od 5.800.000 punoletnih stanovnika Republike Srbije, koji su izabrani metodom slučajnog izbora. Prema tome, Vi ste jedan od relativno malog broja stanovnika R. Srbije koji će moći da izrazi svoje mišljenje o ovom važnom pitanju i na taj način uti-če na državnu politiku u oblasti unapređenja kvaliteta života.

Vaše mišljenje nam je izuzetno važno pa Vas molimo da uzmete učešće u ovom istraživanju. Učešće je dobrovoljno. Ukoliko odlučite da učestvujete, možete u svakom trenutku odustati bez ikakvih posledica po Vas, a Vaši odgovori neće biti zabeleženi ukoliko to ne želite.

Potrebno vreme za odgovaranje na anketu je između 15 i 25 minuta.

Ne postoje pogrešni odgovori dok god odgovarate iskreno, onako kako zaista mislite.

Istraživanje je anonimno, a to znači da će se prema Vašim odgovorima postupati prema svim načelima poverljivosti. Na osnovu objavljenih rezultata neće biti moguće povezati odgovor sa pojedinačnim ispitanikom koji ga je dao.

Hvala Vam unapred!

Kada se radi o samim pitanjima, poželjno je vizuelno odvojiti stablo stavke i ponuđene odgovore. To se obično čini tako što je stablo prikazano tamnijim slovima, a odgovori svetlijim. Naravno, mogući su i drugi načini.

Mesto za odgovore i ispis ponuđenih odgovora mora biti standardizovan, odno-sno, takav da se nijedan ne izdvaja po svojoj uočljivosti. Nije preporučljivo različito formatiranje ponuđenih odgovora samo zarad vizuelne privlačnosti i raznolikosti jer može uticati na njihovu uočljivost i učestalost biranja.

Ukoliko je potrebno grupisati neke delove pitanja, odnosno razdvojiti ih od drugih, to se može učiniti upotrebom praznog prostora.

Na primer, nije dobro da ponuđeni odgovori budu zbijeni jedan do drugog u istom redu:

1 uopšte se ne slažem 2 uglavnom se ne slažem 3 niti se ne slažem, niti slažem 4 uglavnom se slažem 5 u potpunosti se slažem

Ovakav raspored može zbuniti ispitanike tako da nisu sigurni koja kućica pripada kom odgovoru. Bolje je: 1 uopšte se ne slažem 2 uglavnom se ne slažem 3 niti se ne slažem, niti slažem 4 uglavnom se slažem 5 u potpunosti se slažem

Page 155: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

144

Slično važi i za grupe pitanja koje je potrebno vizuelno izdvojiti. Ovo se može učiniti upotrebom većeg proreda, okvira ili senčenja pozadine.

Uputstva ispitaniku ili anketaru moraju se nalaziti neposredno uz pitanje na koje se odnose. Poželjno je da budu ispred pitanja ukoliko se odnose na to na koji način bi trebalo administrirati pitanje, ko treba da odgovori na pitanje, te da li je moguće dati veći broj odgovora li ne. Uputstva koja se odnose na način beleženja odgovora i eventu-alna potpitanja (koja anketar može postaviti ispitaniku kako bi dobio jasniji odgovor) obično se smeštaju iza pitanja. Ukoliko postoji grupa pitanja na koju se odgovara na isti način, moguće je uputstva smestiti ispred cele grupe. Na taj način ostvaruje se ušteda u prostoru i materijalu bez narušavanja preglednosti upitnika. Uputstva moraju po svom izgledu biti jasno izdvojena od teksta stavke. Poželjno je da pitanja i uputstva budu različito formatirani. Npr. uputstva (za razliku od pitanja) mogu biti italicizirana (i obr-nuto).

Osim ovih uputstava koja se nalaze na samom upitniku, dobro je pripremiti i posebna uputstva koja se koriste za obuku anketara i kao podsetnik prilikom obrade i analize podataka.

Uobičajena je praksa da se na kraju ankete ispitaniku postavi pitanje, odnosno dâ mogućnost da napiše sve što ga u anketi nismo pitali, a on smatra da je važno. Ovak-va pitanja se ne moraju obrađivati i analizirati (mada može biti korisno), a njihova svr-ha je da budu „ventil“ za ispitanika. Pre ili posle ovog pitanja postavlja se neizostavni deo upitnika, zahvalnica ispitaniku što je učestvovao u anketi. Dobar običaj je da se zahvali ispitaniku na vremenu i uloženom trudu koji je uložio u odgovaranje na anketu. Na tom mestu moguće je ispitaniku dati više informacija o samom istraživanju ili ga uputiti na web sajt gde može naći potrebne informacije.

6.6. Redosled pitanja

Kao što je rečeno u odeljku o pisanju stavki (6.2), stavke nisu međusobno neza-visne i samim svojim postojanjem u upitniku utiču na to kako će ostale stavke biti shva-ćene, pa i kako će na njih ispitanik odgovoriti. Ukoliko prethodna pitanja utiču da neko pitanje bude pogrešno shvaćeno, odgovori na to pitanje neće se odnositi na konstrukt kojem je ono namenjeno i samim tim greška merenja biće veća. Stoga nije svejedno kojim će redosledom one biti postavljene u upitniku. Osim toga, redosled pitanja može uticati na odluku ispitanika da učestvuje u anketi ili da odustane. Ova odluka se može razlikovati u zavisnosti od toga da li su se ispitaniku svidela početna pitanja ili ne (Dill-man et al., 2014).

Uticaj jedne stavke na drugu stavku može se ispoljiti u vidu kontrasta ili asimi-lacije. Kada se ispoljava kao kontrast, odgovor na stavku postaje različitiji pod uticajem odgovaranja na prethodnu stavku. Kada se uticaj ispoljava kao asimilacija, odgovori postaju sličniji. Različiti su mehanizmi koji dovode do kontrasta i asimilacije, a mogu

Page 156: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

145

biti kognitivni i normativni (Dillman et al., 2014).

Kada su u pitanju kognitivni mehanizmi, prethodna pitanja utiču na kognitiv-nu obradu narednih.

Uticaj se ispoljava kroz primovanje (engl. priming), prenos (engl. carryover), sidrenje (engl. anchoring) i oduzimanje (engl. subtraction).

Primovanje se ispoljava na taj način što ranija pitanja pobuđuju određeni mate-rijal koji je ispitaniku onda dostupniji prilikom odgovaranja na naredna pitanja i češće ispitaniku „prvo padne na pamet“.

Uzmimo na primer dve stavke:

Da li ste zaposleni?

Koliko ste zadovoljni životom?

Primovanje bi se u ovom slučaju ispoljilo tako što bi ispitanik na drugo pitanje odgovarao imajući u vidu pre svega zadovoljstvo poslom, pošto je razmišljanje o tom aspektu njegovog života pobu-đeno prethodnim pitanjem.

Prenos se javlja kada ispitanici dožive dve stavke kao povezane i samim tim na obe odgovaraju koristeći isti materijal.

Koliko ste zadovoljni vašim zdravljem?

Koliko ste zadovoljni životom uopšte?

Kada se javi prenos, ispitanik na drugo pitanje odgovara kao da ono glasi „Koliko ste zadovoljni životom uopšte (pre svega zdravljem)?“, odnosno, povezuje pitanja i na njih gleda iz perspektive definisane prvim pitanjem (zadovoljstvo zdravljem). Ukoliko ispitanik ima zdravstvenih problema, na pitanje o zadovoljstvu životom bi dao nižu procenu ukoliko je redosled pitanja ovakav, nego kada bi redosled pitanja bio obrnut.

Kada bi pitanju o zadovoljstvu životom prethodilo pitanje o zadovoljstvu brakom (a recimo da ispitaniku u toj sferi „cvetaju ruže“), njegova procena bi verovatno bila pozitivnija.

U slučaju oduzimanja ispitanik smatra da ukoliko je na jednu temu odgovorio u prethodnom pitanju, nema potrebe da o njoj odgovara i u narednom i namerno je izos-tavlja iz odgovora na naredno pitanje.

Koliko ste zadovoljni vašim poslom?

Koliko ste zadovoljni životom uopšte?

Kada se javi oduzimanje, ispitanik na drugo pitanje odgovara kao da ono glasi „Koliko ste zadovo-ljni životom uopšte (ne računajući zadovoljstvo poslom)?“. Ukoliko je ispitanik nezadovoljan situ-acijom na poslu, odgovor na drugo pitanje će biti pozitivniji nego u slučaju kada bi redosled pita-nja bio obrnut, zato što ispitanik iz odgovora o zadovoljstvu životom izuzima lošu situaciju na pos-lu.

Sidrenje se javlja kada prethodna pitanja postavljaju standard na osnovu kojeg se procenjuju i naredna pitanja.

Page 157: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

146

Da li ste zadovoljni ili nezadovoljni radom tekuće vlade Republike Srbije?

Da li ste zadovoljni ili nezadovoljni radom prethodne vlade Republike Srbije?

Na oba pitanja se odgovara na skali odgovora od 1 do 5, pri čemu 1 znači „vrlo nezadovoljan“, a 5 „vrlo zadovoljan“.

Efekat sidrenja bi se ispoljio tako što bi odgovor na drugo pitanje (i eventualna naredna slična pitanja) zavisio od odgovora ispitanika na prvo i odnosa između ocena prema objektima pitanja. Ukoliko je ispitanik na prvo pitanje odgovorio sa 4, a misli da je prethodna vlada bila bolja, na drugo pitanje bi mogao odgovoriti samo sa 5.

Međutim, kada bi pitanja bila postavljena obrnutim redosledom i prošla vlada dobila ocenu 3, sadašnja (procenjena kao slabija) bi mogla dobiti samo ocenu 2 ili 1. Redosled pitanja je bitan jer prvo pitanje postavlja standard prema kojem se odgovara na ostala slična pitanja.

Primovanje, prenos i sidrenje dovode do asimilacije, odnosno, odgovori ispitani-ka postaju konzistentniji. Sidrenje uz oduzimanje može rezultirati i kontrastom, odnosno većim razlikovanjem odgovora na dva pitanja.

Normativni mehanizmi deluju tako što prethodna pitanja pobuđuju norme koje se koriste prilikom davanja odgovora u narednim pitanjima. Ispoljavaju se kroz pravičnost (engl. even-handedness), konzistentnost ili ujednačenost (engl. consistency) i umerenost (engl. moderation).

Pravičnost se manifestuje kao tendencija da se bude fer i pravičan, odnosno da se ujednači kriterijum.

Da li bi trebalo smanjiti, povećati ili zamrznuti javne rashode?

Da li bi trebalo smanjiti, povećati ili zamrznuti plate u javnom sektoru?

Kada bismo zaposlene u javnim službama pitali ova dva pitanja ponuđenim redosledom, verovat-nije je da bi se veći broj složio sa smanjenjem plata u javnom sektoru nego kada bismo pitanje o platama postavili kao prvo. Ukoliko se ispitanik složi da bi javni rashodi trebalo da budu smanjeni, onda je pravično da budu smanjene i plate.

Ujednačenost se manifestuje kao tendencija ispitanika da odgovori na naredna pitanja budu ujednačeni sa onim datim na prethodna pitanja.

Umerenost se manifestuje kao tendencija ispitanika da se prikažu kao umereni (odnosno da nemaju ekstremne stavove). Osim biranja umerenih opcija odgovora, ispi-tanici mogu to postići različitim odgovaranjem na slična pitanja.

Da li podržavate ili ste protiv gej brakova?

Da li podržavate ili ste protiv mogućnosti usvajanja dece od strane gej parova?

Na ova pitanja ispitanici mogu odgovoriti različito sa ciljem da se prikažu kao umereni („Gej bra-kovi su u redu, ali usvajanje dece ne dolazi u obzir“).

Pravičnost i ujednačenost dovode do asimilacije odgovora, dok umerenost može rezultirati kontrastom.

Page 158: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

147

6.6.1. Preporuke u vezi sa redosledom pitanja u anketi

Prva preporuka koju daje Dilman (Dillman et al., 2014), koja se tiče redosleda pitanja u anketi, je da bi pitanja trebalo grupisati po oblastima, a ne skakati sa teme na temu. Grupisanje pitanja po oblastima olakšava odgovaranje pošto informacije, kojih se prisetio odgovarajući na jedno pitanje, ispitaniku mogu pomoći i u odgovaranju na dru-ga pitanja iz iste oblasti. Grupisanje pitanja po oblastima olakšava i ostale kognitivne procese koji učestvuju u odgovaranju na stavke, a ne samo na prisećanje, odnosno, ispi-tanik će lakše razumeti pitanje, doneti sud, evaluirati i formulisati odgovor.

U okviru oblasti, ukoliko se postavljaju pitanja o većem broju događaja, dobro je da slede redosled njihovog dešavanja. Na primer, ako se pitanja tiču školovanja, dobro je prvo postavljati pitanja u vezi sa osnovnom školom, zatim srednjom i na kraju sa fakultetom i postdiplomskim studijama. Moguć je i obrnut redosled, ali nije dobro ska-kati sa perioda na period (npr. srednja škola, pa osnovna, zatim postdiplomske i fakul-tet). Ukoliko sledimo logičan redosled ispitaniku je lakše da se priseti i odgovori na pitanja.

Sledeće, poželjno je početi sa onom grupom pitanja koja će biti najinteresantni-ja najvećem broju ispitanika. Odgovaranjem na prva pitanja jedinica istraživanja postaje ispitanik. Kada neko prihvati da odgovori prvo pitanje, mnogo je verovatnije da će nas-taviti da odgovara i na sledeća, nego u slučaju kada odbije da na njega odgovori. Drugim rečima, odgovaranjem na prvo pitanje osoba se postavlja u ulogu ispitanika i dalje lakše nastavlja da se ponaša u skladu sa tom ulogom. Zato prvo pitanje ne bi smelo da bude predugačko, teško za razumevanje i odgovaranje, dosadno, niti da ispitaniku bude nep-rijatno da odgovori na njega. Nekada je čak moguće dodati pitanje (ili više njih) koje će biti interesantno ispitanicima, mada nije od interesa za istraživanje, samo da bi se ispi-tanik privoleo da učestvuje u anketi. S druge strane, protivnici ovakve prakse kažu da ovakva pitanja povećavaju dužinu ankete, a samim tim i njenu cenu.

Postoje dve opšte strategije koje se tiču redosleda pitanja u okviru upitnika u celini ili u okviru pojedinih njegovih sekcija. To su strategija levka i strategija obrnu-tog levka. Kada se primenjuje strategija levka, prvo se postavljaju uopštena pitanja koja služe da ispitanika uvedu u problem. Istovremeno se ispitaniku mogu davati i pot-rebne informacije za dalje odgovaranje. Nakon toga slede sve specifičnija i specifičnija pitanja. Prednost ovakvog poretka pitanja je ta što su opšta pitanja manje osetljiva na kontekst, odnosno odgovaranje na njih manje je pod uticajem pitanja na koja je ispita-nik ranije odgovarao (Fajgelj, 2004). Istovremeno, postavljajući takva opšta pitanja mi gradimo novi kontekst za naredna pitanja i na taj način ga donekle kontrolišemo.

S druge strane, u strategiji obrnutog levka pitanja se postavljaju od specifič-nih ka opštim. Ispitanika, na primer, možemo pitati da li je za ili protiv nečeg, a zatim tražiti od njega da obrazloži svoj stav. Ovakav raspored pitanja se primenjuje kako bi ispitanika zainteresovali i motivisali.

Page 159: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

148

Uobičajeno je da upitnik počinje grupom sociodemografskih pitanja. Razlog je taj što je to pogodno za istraživača koji odmah dobija podatke o pripadnosti ispitanika određenim stratumima, što je posebno bitno kada je potrebno zadovoljiti određene kvote. S druge strane, ispitanicima koji su često anketirani može biti dosadno da uvek prvo odgovaraju na ovakva pitanja (Fajgelj, 2004). Položaj ove grupe pitanja se pone-kad vezuje sa primenjenom strategijom (levka ili obrnutog levka). U strategiji levka je uobičajeno da ova grupa pitanja bude na početku, a u strategiji obrnutog levka na kraju. Nema prepreka ni da bude drugačije, ali postavljanjem ove sekcije na početak u strate-giji obrnutog levka umanjuje se efekat postavljanja specifičnih pitanja na početku.

Česta preporuka je da bi osetljiva pitanja, odnosno, ona na koja ispitanicima može biti neprijatno da odgovore, trebalo postaviti bliže kraju upitnika. Ispitanici će ređe odbijati da odgovore na ovakva pitanja, ako su već uložili trud i vreme da odgovo-re na preostala pitanja. Osim toga, pitanja se ispitanicima mogu činiti manje osetljivim u svetlu prethodnih pitanja. Kada govorimo o osetljivim pitanjima, obično se misli na pitanja koja se tiču seksualnog ponašanja i orijentacije, pitanja o zdravstvenim proble-mima, i ona koja mogu inkriminisati ispitanika, ali i ona koja se odnose na prihode (Dil-lman et al., 2014). Koja pitanja su osetljiva u konkretnom slučaju najbolje se može pro-veriti na osnovu pilot istraživanja. U vezi sa ovakvim pitanjima zanimljivo je istraživa-nje Petersona i Kerina (1980), koje ukazuje da i tip pitanja može uticati na stopu odgo-vora i njihov kvalitet. Naime, prema njihovim nalazima, ukoliko je osetljivo pitanje pos-tavljeno u formi sa otvorenim odgovorima veći je broj ispitanika koji neće odgovoriti ali je kvalitet odgovora bolji, odnosno odgovori bolje reflektuju stvarno stanje. Stopa i kvalitet odgovora mogu se popraviti njihovom pažljivom formulacijom. Korisno je da ovakva pitanja sadrže uvodni deo koji će, na primer, ispitanicima staviti do znanja da postoje situacije i slučajevi kada je u redu ponašati se na način koji je manje socijalno poželjan i da se dosta ljudi ponaša na takav način.

Verovatnije je da će ispitanici češće odbiti da odgovore ili će davati netačne odgovore na pitanje:

„Da li ste ikada upotrebili vatreno oružje kako biste povredili drugu osobu?“

nego na pitanje formulisano na sledeći način:

„U određenim okolnostima ljudi pribegavaju upotrebi vatrenog oružja protiv drugih osoba. Te okolnosti nekada mogu biti opravdane, a nekada ne. Da li ste ikada upotrebili vatreno oružje kako biste povredili drugu osobu?“

U ovako formulisanom pitanju ispitanicima se daje informacija da se ljudi nekada ponašaju na načine koji nisu socijalno prihvatljivi (ranjavaju druge iz vatrenog oružja). Ovo ponašanje se ne opravdava (odnosno kaže se da je nekada opravdano, a nekada ne). Na taj način se ispitanicima ostavlja prostor da kažu da li su nekada upotrebili vatreno oružje protiv drugih ljudi bez bojazni od osude, ostavljajući po strani činjenicu da li je to bilo opravdano ili ne.

U upitniku mogu postojati selekciona (filter) pitanja od kojih zavisi da li će ispi-tanik odgovarati na sva ili samo određena pitanja (grananje). Ukoliko postoji više ovak-vih pitanja, najbolje ih je sva postaviti pre no što ispitanik pređe na dalje odgovaranje.

Page 160: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

149

Selekciona pitanja su ona na osnovu kojih utvrđujemo da li je ispitanik legitiman za određenu grupu pitanja (npr. ukoliko želimo da saznamo mišljenje ljudi o kablovskom operateru XY, onda to možemo pitati samo ispitanike koji jesu ili su nekad bili korisnici tog operatera). Ukoliko se selekciona pitanja postavljaju jedno po jedno, a nakon svakog ispitanik odgovara na prateća pitanja, ispitanici ubrzo shvate vezu između odgovora na selekciono pitanje i odgovaranja na prateća pitanja. U tom slučaju, oni koji žele da izbe-gnu odgovaranje, mogu namerno netačno odgovarati na selekciona pitanja (engl. moti-vated misreporting). Nije nužno zadavati odjednom filter pitanja iz različitih sekcija ankete, pošto ispitanici izgleda ne prenose strategiju izbegavanja iz sekcije u sekciju (Dillman et al., 2014).

Vrlo je važno voditi računa o neželjenom uticaju redosleda pitanja (engl. question order effect) na odgovaranje (videti i deo o ajtemskom kontekstu na strani 117). Kao što je pomenuto, ispitanik značenje stavke određuje na osnovu samog njenog teksta, ali i na osnovu šireg konteksta, pri čemu značajan uticaj imaju druga pitanja u anketi.

6.6.2. Redosled ponuđenih odgovora

Činjenica da redosled ponuđenih odgovora u pitanjima višestrukog izbora utiče na verovatnoću njihovog biranja dobro je poznata (Bishop & Smith, 1997; Höhne & Lenzner, 2015; Krosnick & Alwin, 1987; Schwarz, Hippler, Noelle-Neumann, & Münkel, 1989). Ovaj efekat je izraženiji što su duže liste ponuđenih odgovora. Uticaj položaja odgovora na verovatnoću njihovog biranja moguć je i kod vrlo kratkih lista ponuđenih odgovora ukoliko su oni kompleksni i dugački, a format prezentacije auditivni49 (Bis-hop & Smith, 1997).

Efekat redosleda ponuđenih odgovora ne javlja se uvek i obično nije veliki. Prema rezultatima Galupovih istraživanja koje navode Bišop i Smit (Bishop & Smith, 1997), statistički značajan efekat se javio u oko 22,5% slučajeva, a veličina efekta bila je u najvećem broju slučajeva ispod 5% i zavisila je od teme istraživanja. Kada kažemo „veličina efekta“, u ovom slučaju mislimo na povećanje u učestalosti biranja ponuđenog odgovora u zavisnosti od lokacije na listi ponuđenih odgovora.

Obično se govori o efektima početnih pozicija (engl. primacy effect), posled-njih pozicija (engl. recency effect) i asimetričnog efekta kontrasta (engl. asymmetric contrast effect).

Efekat početnih pozicija se manifestuje kao povećana verovatnoća biranja odgovora ukoliko se on nalazi pri početku liste ponuđenih odgovora, ili je pomenut pri početku (Krosnick & Alwin, 1987).

49 Npr. efekat redosleda može se javiti i kada postoje samo dva dugačka i kom-

pleksna ponuđena odgovora, a posebno ako se između njih nalazi sveza „ili“.

Page 161: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

150

Efekat poslednjih pozicija se manifestuje kao povećana verovatnoća biranja odgovora ukoliko se on nalazi pri kraju liste ponuđenih odgovora, ili je pomenut pri kraju (Krosnick & Alwin, 1987).

Ova dva efekta međusobno se ne isključuju i mogu delovati simultano (kod raz-ličitih ispitanika). Ovo simultano delovanje može se prepoznati po tome što odgovori ponuđeni pri početku i pri kraju liste imaju veće frekvencije biranja nego oni u sredini (Slika 6).

Asimetrični efekti kontrasta manifestuju se kao uticaj pojedinih ponuđenih odgovora na biranje i procenu ostalih, pri čemu oni sami na trpe uticaj redosleda ponuđenih odgovora (Schwarz et al., 1989).

Asimetrični efekat kontrasta se javlja kada se na listi ponuđenih odgovora nalazi neki ekstreman odgovor na dimenziji koja je predmet procene50. Ponuđeni odgo-vori nakon njega, pod uticajem kontrasta postaju prihvatljiviji ili manje prihvatljivi, odnosno, menja se verovatnoća njihovog biranja. Ekstremne opcije koje pobuđuju asi-metrični efekat kontrastira mogu poništiti efekte redosleda. Švarc i saradnici (Schwarz et al., 1989) smatraju da komparativno suđenje, koje je u osnovi asimetričnog efekta kontrasta, pobuđuje povećanu pažnju i na taj način umanjuje efekte položaja ponuđenih odgovora.

50 Recimo, ako se procenjuje privlačnost, onda ekstremno privlačan ili odbojan.

Ako se procenjuje kvalitet – ekstremno kvalitetan ili nekvalitetan...

Slika 6 – Ilustracija simultanog delovanja efekta početnih i efekta krajnjih pozicija

Page 162: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

151

Primer dejstva asimetričnog efekta kontrasta bi moglo biti sledeće pitanje u hipotetičkoj anketi na uzorku nižih razreda osnovne škole:

Odaberi jednu od navedenih namirnica koju najviše voliš da jedeš: 1 jabuka 2 sladoled 3 keks 4 čips 5 kifla

Nije teško zamisliti da je sladoled ekstremno privlačna namirnica za decu ovog uzrasta. Pojavlji-vanje ove namirnice na listi ponuđenih odgovora učinilo bi da se svi ponuđeni odgovori nakon nje čine kao manje privlačni i samim tim budu ređe birani. Posmatrajući frekvencije biranih odgovora, ovaj slučaj bi izgledao kao delovanje efekta početnih pozicija.

Zamislimo isto pitanje, ali da lista ponuđenih odgovora izgleda ovako: 1 jabuka 2 keks 3 kelj 4 čips 5 kifla

Nije teško zamisliti da je za decu ovog uzrasta kelj ekstremno neprivlačna namirnica. Svi naredni odgovori bi u kontrastu sa keljom izgledali mnogo privlačniji nego kada kelja ne bi bilo na listi. Samim tim bila bi povećana verovatnoća njihovog biranja. Ako bismo posmatrali frekvencije bira-nih odgovora, ovaj slučaj bi izgledao kao efekat poslednjih pozicija.

Uticaj asimetričnog efekta kontrasta nije ograničen na konkretnu stavku u kojoj se javlja ekstre-mni ponuđeni odgovor. Njegovo delovanje se može proširiti i na naredne stavke koje sadrže isti predmet procene (Schwarz et al., 1989). Na primer, njegov uticaj bi se mogao javiti u stavci poput:

„Odaberi jednu od navedenih namirnica za koju misliš da je najomiljenija tvojim drugarima.“

ali ne i u stavci:

„Koja od navedenih namirnica je po tvom mišljenju najzdravija?“

U prvoj od prethodne dve stavke procenjuje se omiljenost kao i u primerima koji joj prethode, a u drugoj se procenjuje dimenzija korisnosti za organizam.

Uticaj ovih efekata, mada često vrlo mali, nije uvek zanemarljiv. Poseban prob-lem je što je taj uticaj sistematski i dovodi do pristrasnosti rezultata. Na primer, kada postoji efekat početnih pozicija, odgovor koji se nalazi na početku liste biće sistematski češće biran, ne (samo) zbog svojih osobina već i zbog položaja na listi. Toga su svesni čak i učesnici u političkom izbornom procesu, pa se političke partije i kandidati jako trude da obezbede prvo mesto na biračkim listićima. U ovom slučaju, već razlika od 2-3% može značiti osvajanje ili gubitak neke pozicije, ili prelazak izbornog cenzusa ili ne.

Postoje različiti teorijski pokušaji objašnjenja ovih efekata. Jedan od njih je Model kognitivne elaboracije. Prema ovom modelu, biraju se oni odgovori o kojima je

Page 163: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

152

ispitanik imao više prilike da razmisli. Koliko će ispitanik imati prilike da razmisli o nekom ponuđenom odgovoru zavisi od više činilaca i njihovih interakcija. To su: položaj ponuđenog odgovora na listi, modalitet prezentacije pitanja (vizuelna, auditivna ili kombinovana) i prihvatljivosti samog odgovora.

Prema ovom modelu, ukoliko kontrolišemo osobine ispitanika (sposobnosti i motivacija) i osobine stavki (složenost, ekstremnost ponuđenih odgovora), efekat poče-tnih pozicija javiće se ukoliko je pitanje prezentirano vizuelno, pošto ispitanik ima više prilike da razmišlja o odgovorima ponuđenim na početku. Međutim, ukoliko odgovori na početku liste ne deluju uverljivo, javiće se efekat poslednjih pozicija. Ukoliko je pita-nje prezentirano auditivno (pročitano ispitaniku), javiće se efekat poslednjih pozicija pošto u ovom slučaju ispitanici imaju više mogućnosti da razmisle o ponuđenim odgo-vorima koji su im prezentirani pri kraju. Ukoliko odgovori ponuđeni pri kraju ne deluju uverljivo, javiće se efekat početnih pozicija. Švarc i saradnici (Schwarz, Hippler, & Noel-le-Neumann, 1992), te Sudman sa svojim saradnicima (Sudman, Bradburn, & Schwarz, 1996), istraživali su pretpostavke ovog modela i došli do nalaza koji mu govore u prilog.

Drugi pokušaj da se objasne ovi efekti je Teorija dovoljnosti (engl. Satisficing theory). Prema pretpostavkama ove teorije ispitanik bira prvi dovoljno dobar, odnosno zadovoljavajući odgovor (Krosnick, 1991). Tendencija biranja prvog dovoljno dobrog odgovora zavisi od toga koliko je teško odgovaranje na pitanje (kompleksnost teme, poznatost), sposobnosti ispitanika da se priseti i obradi podatke iz sećanja, njegove motivacije i koliko mu je tema pitanja relevantna.

Predviđanja ovog modela su da će u vizuelnom formatu ispitanik birati prvi zadovoljavajući odgovor, odnosno, javiće se efekat početnih pozicija. Prema teoriji pos-toje dva glavna razloga za to. Prvo, ranije pročitane opcije postavljaju referentni okvir za razmišljanje i tumačenje narednih. Drugo, opcije prikazane na početku prolaze kroz dublju kognitivnu obradu. Naime, ispitanik odmah kreće da razmišlja o pročitanim opcijama, pa misli o onim na početku ometaju dublju kognitivnu obradu onih pri kraju (Krosnick & Alwin, 1987).

S druge strane, ukoliko je format prezentacije čisto auditivni, javiće se efekat poslednjih pozicija. Razlog je taj što u ovom modalitetu prezentacije ispitanik nema šanse da kognitivno obradi opcije pri početku jer mu anketar već čita naredne. Ispitanik ima najviše mogućnosti da kognitivno obradi opcije pročitane pri kraju.

Prema Teoriji dovoljnosti, nisu svi ispitanici jednako podložni efektima redosle-da ponuđenih odgovora. Ispitanici koji su dovoljno motivisani tražiće optimalan odgo-vor i kod njih će ovi efekti biti manji. Kod ispitanika koji žele da što pre završe, sa što manje napora, efekti će biti veći jer će birati prvi zadovoljavajući (ne i optimalan) odgo-vor.

Istraživanja Kroznika i Alvina (Krosnick & Alwin, 1987) potvrđuju pretpostav-ke ove teorije i pokazuju da su ovi efekti veći kod ispitanika sa nižim nivoom obrazova-

Page 164: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

153

nja i kognitivnih sposobnosti.

Empirijska istraživanja pretpostavki obe teorije došla su do nalaza koji potvr-đuju i jednu i drugu, ali otkrivene su i brojne anomalije koje nijedan model nije predvi-deo. Bez obzira na to, efekat postoji i poželjno ga je eliminisati. Najčešće korišćeni metod je randomizacija ponuđenih odgovora. Na ovaj način se na nivou uzorka elimini-še mogući efekat redosleda ponuđenih odgovora. On se iz pristrasnosti (sistematskog precenjivanja ili potcenjivanja neke od opcija), pretvara se u nepreciznost (odnosno, povećava se varijabilnost odgovora). Ukoliko smo eliminisali pristrasnost, nepreciznost možemo kontrolisati povećanjem uzorka (Krosnick & Alwin, 1987). Rečeno je da se na ovaj način efekat redosleda eliminiše na grupnom nivou, ali na nivou ispitanika on i dalje postoji. Randomizaciju ponuđenih odgovora je vrlo lako izvesti u računarski podr-žanim modalitetima prikupljanja podataka, bez obzira da li je upitnik namenjen samoa-dministraciji ili ne. Nešto je teža i skuplja, ali nije neizvodljiva i u drugim modalitetima. U štampanim upitnicima, ona se implementira kroz manji broj alternativnih formi upit-nika. U anketama licem u lice moguće je anketarima dati kartice sa različitim redosle-dima ponuđenih odgovora koje će on birati nekom metodom slučajnog izbora.

Osim randomizacije, ispitanici se mogu dodatno motivisati instrukcijom u kojoj im se kaže da će pitanje možda biti malo kompleksnije i da će zahtevati više truda i koncentracije. Dobro ih je zamoliti da taj trud i ulože i skrenuti pažnju da razmotre sve ponuđene odgovore. Ukoliko se podaci prikupljaju u auditivnom formatu ponuđene odgovore čitati tempom koji omogućava ispitanicima da ih kognitivno obrade.

6.7. Evaluacija upitnika

Pre no što se upitnik primeni na anketnom uzorku potrebno je proveriti da li sve stavke funkcionišu kako treba, da li upitnik u celini funkcioniše kako je planirano, da li je metodologija prikupljanja podataka odgovarajuća, kakve su raspodele odgovora, kako se snalaze anketari...

Anketni upitnik i pitanja u njemu moraju zadovoljiti tri standarda (Groves, 2009).

1. Moraju pitati ono čemu su namenjeni (standard sadržaja).

2. Ispitanici ih moraju razumeti na isti način, moraju imati dovoljno informacija i znanja da na njih odgovore i moraju biti u stanju i želeti da daju odgovore (kognitivni standard).

3. Ispitanici i anketari moraju biti u stanju da anketu završe i sprovedu onako kako je zamišljeno (upotrebljivost).

Metode koje se najčešće koriste prilikom evaluacije radne verzije upitnika i pitanja su: ekspertska procena, fokus grupe, pretest (pilot), bihejvioralno kodiranje, kognitivni intervju i randomizovani eksperimenti.

Page 165: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

154

6.7.1. Ekspertske procene upitnika

U metodi ekspertske procene stručnjaci iz oblasti koju bi anketa trebalo da pokriva procenjuju da li stavke mere ono što bi trebalo da mere, odnosno da li obezbe-đuju informacije potrebne da se ostvari cilj istraživanja. S druge strane, stručnjaci iz oblasti konstrukcije upitnika procenjuju da li pitanja pored standarda sadržaja, zadovo-ljavaju kognitivne i standard upotrebljivosti. Nije dovoljno samo da pitanja pitaju ono što bi trebalo, bitno je i da ispitanici znaju da odgovore na njih. Pod ovim se misli na to, da li oni imaju dovoljno informacija, ali i da li umeju da formulišu odgovor u formi koja je potrebna istraživaču.

Uspešnost ove metode zavisi od izbora stručnjaka (Groves, 2009)

6.7.2. Pretest (pilot istraživanje)

Pretest ili pilot istraživanje predstavlja primenu upitnika i metodologije pri-kupljanja podataka na manjem uzorku iz ciljne populacije i prikupljanje povratnih informacija o problemima koji su uočeni.

Kada se radi o pretestu upitnika namenjenog za anketu licem u lice (ili telefon-sku), postupak liči na sledeći. Anketari ispitaju manji broj ispitanika (15–20) i nakon toga sa istraživačem razgovaraju o problemima na koje su naišli (engl. debriefing)51. Tokom debrifinga obraća se pažnja na stavke za koje anketari smatraju da su teške za čitanje, odnosno da su bile nerazumljive ispitanicima, zbunjivale ih i pravile im poteš-koće u odgovaranju (Visser et al., 2000). Treba voditi računa da se ovde radi o subjekti-vnom doživljaju anketara, tako da kvalitet informacija dobijenih konvencionalnim pre-testom u velikoj meri zavisi od obučenosti i iskustva anketara. Kako bi uticaj subjektiv-nosti bio što manji, dobro je da u pretestu učestvuju iskusni i dobro obučeni anketari koji će znati na koje probleme treba da obrate pažnju. Takođe, njihove izveštaje moguće je učiniti uporedivim standardizacijom debrifinga, koji može dobiti formu standardi-zovanog ili polustandardizovanog intervjua.

Nedostatak ovog načina evaluacije je to što ne postoji tačna definicija šta je problem. Npr. da li je problem kada je anketaru neko pitanje čudno ili teško za čitanje, iako ispitanici na to pitanje daju odgovore koji su upotrebljivi za ostvarenje cilja istraži-vanja (Presser et al., 2004). Ovaj nedostatak klasični pretest deli sa metodom bihejvio-ralnog kodiranja (videti u nastavku).

Osim podataka dobijenih od anketara, pretest može pružiti još neke informaci-je. Pitanja kod kojih postoji veći broj neodgovora mogu se smatrati problematičnim. Ukoliko veći broj ispitanika ne odgovori na neko pitanje to može biti rezultat njegove loše formulacije (stabla ili odgovora), neprimerenosti ciljnoj populaciji, osetljivosti itd.

51 U nedostatku boljeg termina za ovakav razgovor preuzećemo englesku reč

debrifing.

Page 166: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

155

Ako istraživač primeti postojanje takvog pitanja potrebno je da od anketara sazna da li se i tokom intervjua to pitanje pokazalo kao problematično, i ako jeste – zašto.

Takođe, stavke sa niskom varijansom mogu predstavljati problem. Niska vari-jabilnost odgovora znači da je većina ispitanika odgovorila na isti ili vrlo sličan način. U tom slučaju istraživač može preispitati da li je nužno da pita pitanje na koje ogromna većina ispitanika daje isti ili sličan odgovor. Kod ovakvih pitanja nije svejedno ni koji je to najčešći odgovor. Ukoliko je to srednja kategorija na skali procene ili neka od katego-rija poput „neodlučan“, „ne znam“ i sličnih, i to može ukazivati na nejasnu formulaciju stavke ili njenu neprimerenost ciljnoj populaciji.

Prethodna dva pokazatelja kvaliteta stavki i ankete (neodgovori i niska varijan-sa) mogu se primeniti i na preteste samoadministrirajućih anketa. U pretestu samoad-ministrirajućih anketa pored sadržaja samih pitanja, jako bitno je proveriti i da li je formatiranje upitnika odgovarajuće. Pod ovim se misli na njegovu preglednost, uočlji-vost bitnih informacija, jednostavno i jasno kretanje kroz upitnik, jasne instrukcije za grananje (preskakanje pitanja) i slično.

Ovakvo pretestiranje samoadministrirajućih anketa je u neku ruku kompliko-vanije pošto ispitanici sami odgovaraju, a istraživač naknadno pokušava da rekonstrui-še zašto je ispitanik odgovarao na neki način (Visser et al., 2000). Koristi se metoda analogna bihejvioralnom kodiranju (videti odeljak 6.7.3), u kojoj istraživač na osnovu pisanih odgovora pokušava da identifikuje problematična ili neadekvatna pitanja.

Kod samoadministrirajućih anketa mogu biti korisne i neformalne informacije od strane ispitani-ka. Ukoliko je neko pitanje nejasno, neprimenljivo na veći broj ispitanika ciljne populacije, oni će to vrlo često istraživaču staviti do znanja u vidu komentara52 na marginama ankete. Takođe, ako vidimo da ispitanici ne pišu odgovore na predviđenim mestima potrebno je utvrditi razloge. To može biti nedovoljan ili nejasno označen prostor za upis odgovora. Ukoliko vidimo da na nekom pitanju ispitanici često koriguju i prepravljaju odgovore. To može ukazivati da je stavka nejasna (stablo, ponuđeni odgovori ili – i jedno i drugo).

Alternativni pristup je analogan kognitivnom intervjuu (videti odeljak 6.7.4). U ovom pristupu ispitanici sami popunjavaju anketu, a kasnije u razgovoru sa istraživa-čem objašnjavaju kako je taj proces tekao. Ispituje se koja su im pitanja bila problemati-čna, ali i na šta su mislili dok su odgovarali na konkretna pitanja. Zbog ujednačenosti procena korisno je standardizovati skup pitanja o anketi. Poželjno ih je pitati da li im je bila jasna terminologija pitanja, uputstvo, ponuđeni odgovori, te kako su shvatili na čega se odnosi. Takođe, moguće je od ispitanika tražiti da misli naglas dok odgovara na anketu i posmatranjem steći uvid o procesu odgovaranja.

Ukoliko je planirano da anketa bude administrirana u više modaliteta, potreb-no je pretest odraditi za svaki od njih.

52 Nekada šaljivih, nekada ljutitih... Svi smo pisali...

Page 167: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

156

Na osnovu pretesta, osim samih pitanja, možemo proceniti i metode prikuplja-nja podataka, vreme potrebno za odgovaranje na anketu, odziv ispitanika i efikasnost anketara.

6.7.3. Bihejvioralno kodiranje

Bihejvioralno kodiranje je pokušaj standardizacije pretesta. Sastoji se od posmatranja anketnih intervjua dok se oni odvijaju ili naknadno, na snimcima (Visser et al., 2000).

U ovom slučaju anketar i posmatrač nisu ista osoba. Posmatrač prati intervju i beleži pitanja kod kojih postoje problematične interakcije anketara i ispitanika.

Interakcije mogu biti: paradigmatične (bez problema), problematične (postojao problem, ali je rešen) i neadekvatne (postojao problem koji nije rešen).

Kod problematičnih i neadekvatnih interakcija beleži se i tip problema. Problem predstavlja sve što dovodi do odstupanja od scenarija anketiranja (anketar čita pitanje – ispitanik odgovara).

Oni mogu nastati na strani anketara ili na strani ispitanika. Na strani anketara nastaju problemi kao rezultat nepravilnog, nejasnog ili nepotpunog čitanja pitanja. Na strani ispitanika problemi se javljaju u vidu nerazumevanja, traženja dodatnih informa-cija i pojašnjenja, ili davanja neadekvatnih, nepotpunih ili nejasnih odgovora.

Pitanja kod kojih se javljaju problematične i neadekvatne interakcije su ona na koja je potrebno obratiti pažnju i eventualno ih modifikovati. Problematične i neadek-vatne interakcije mogu poticati od neadekvatne formulacije stavke ili njene neprimere-nosti ciljnoj populaciji.

Bihejvioralno kodiranje ne otkriva problematične stavke koje ne dovode do poremećaja skripta, odnosno do problema koji se mogu opaziti sa strane. To mogu biti razumljive stavke koje mere pogrešan koncept. Ovakve stavke se mogu otkriti na osno-vu kognitivnog intervjua.

6.7.4. Kognitivni intervju

Kognitivni intervju je procedura prilikom koje anketar postavlja pitanja ispi-taniku i traži od njega da glasno razmišlja dok pokušava da formuliše odgovor. Na ovaj način može se uočiti kako ispitanik shvata pitanje, o čemu razmišlja i utvrditi razlika između sadržaja koje bi pitanje trebalo da pobudi kod ispitanika i onih koje zaista pobuđuje. Istraživač može problemu pristupiti i direktno i pitati ispitanika za mišljenje šta konkretno pitanje meri. Na taj način moguće je identifikovati pitanja koja ne mere konstrukt kojem su namenjena, odnosno, psihometrijskim rečnikom rečeni – nisu vali-dna. Tokom kognitivnog intervjua, anketar može pitati ispitanika i za pojedine delove pitanja i ostvariti uvid o tome kako ispitanici shvataju pojedine reči ili sintagme.

Page 168: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

157

6.7.5. Randomizovani eksperimenti

Metoda randomizovanih eksperimenata (ili split-ballot) podrazumeva da se uzorak za pretest slučajnom metodom podeli u dve ili više grupa. Različite grupe dobi-jaju alternativne formulacije pojedinih pitanja. Na ovaj način ispituju se one stavke za koje se sumnja da mogu predstavljati problem, ili postoje alternativne formulacije oko kojih postoji neslaganje u timu konstruktora. Metoda randomizovanih eksperimenata često se koristi za evaluaciju efekata korekcija pitanja čiji je cilj eliminisanje problema u stavkama koji su uočeni drugim metodama evaluacije (Presser et al., 2004). Ovom metodom mogu se ispitivati i efekti različitih modaliteta prikupljanja podataka (licem u lice, samoadministracija, onlajn ankete...). Metodom randomizovanih eksperimenata može se utvrditi postojanje razlika u odgovorima ispitanika, ali, ukoliko nije meren i kriterijum na osnovu kojeg će se podaci validirati, ne može se reći koji od različitih rezultata su bolji. U nekim slučajevima ovakav zaključak se može doneti i bez eksterne validacije, ako postoje jaki teorijski razlozi u prilog neke od varijanti (Groves, 2009).

Na primer, takav teorijski razlog bi bilo povećano biranje socijalno nepoželjnih odgovora. Kako ispitanici imaju tendenciju da svoje socijalno nepoželjne stavove, osobine i ponašanja ne prijavlju-ju, povećano biranje odgovora koji ukazuju na njih vrlo verovatno predstavlja tačniji rezultat.

6.7.6. Ostale metode evaluacije upitnika i pitanja

Pored navedenih metoda evaluacije upitnika mogu se koristi i metode koje se baziraju na računarskoj tehnologiji.

Na primer, u računarski podržanim modalitetima prikupljanja podataka mogu-će je identifikovati problematična pitanja na osnovu vremena latencije. Vreme latenci-je je vreme koje protekne od izlaganja pitanja ispitaniku do davanja odgovora (Presser et al., 2004). Teoretski ovo je izvodljivo i u drugim modalitetima, ali računarski podrža-no anketiranje nudi najkomforniji način za kontrolu uslova izlaganja i merenje vremena potrebnog da ispitanik da odgovor. Logika ovakvog načina provere bazira se na pretpo-stavci koja je potvrđena nalazima nekih istraživanja (Saris, van der Weld, & Gallhofer, 2004) da je tačnost odgovora povezana sa kraćim vremenom latencije. Duže vreme latencije može ukazivati na to da je ispitanik imao problema da razume pitanje, priseti se potrebnih informacija, evaluira ih ili da formuliše odgovor. S druge strane, duže vre-me latencije može ukazivati na to da ispitanik pažljivo pristupa odgovaranju na pitanje. To može značiti da nastoji da dâ što bolji odgovor, ali može značiti i da prilagođava odgovor na način koji bi ga prikazao u boljem svetlu.

Osim vremena latencije, računar vrlo lako beleži i da li je ispitanik ispravljao odgovor na pitanje i koliko puta, što takođe može ukazivati na probleme prilikom odgovaranja, bilo da se radi o razumevanju, prisećanju, evaluaciji ili formulisanju odgo-vora.

Za evaluaciju anketnih pitanja može se koristiti i statističko modelovanje,

Page 169: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

158

odnosno psihometrijske metode koje se koriste za konstrukciju i evaluaciju psiholoških testova. Dve osnovne merne karakteristike koje se redovno procenjuju prilikom kons-trukcije i evaluacije psiholoških testova po modelu klasične teorije testova su pouzda-nost i validnost (valjanost). Najkraće rečeno, validnost nam govori da li neki test meri ono što treba da meri, a pouzdanost – koliko to precizno radi (videti i odeljak 5.4). Pou-zdanost testa može se procenjivati na razne načine. Razlikujemo metode zasnovane na međusobnom odnosu stavki u testu (metode interne konzistencije), na ponovljenoj upotrebi istog testa (test-retest), na saglasnosti između procenjivača i metode zasnova-ne na poređenju mera dobijenih alternativnim formama testova. Za utvrđivanje pouz-danosti metodama interne konzistencije dovoljna je jedna primena testa i nisu potreb-na dodatna merenja. Za ostale načine potrebno je da isti konstrukt bude meren bar dva puta istim ili alternativnim formama testova.

Kada je u pitanju konstrukt validnost, ona se najčešće utvrđuje primenom fak-torske analize. Predmet merenja se identifikuje kao latentna osobina (ili više njih) koja zasićuje ajteme, odnosno utiče da ispitanici odgovaraju na način na koji odgovaraju. Takođe, konstruktna valjanost može se utvrđivati i na osnovu razlika među grupama ispitanika i korelacija sa eksternim varijablama. Ukoliko su korelacije instrumenta sa eksternim varijablama u skladu sa teorijskim očekivanjima i njihovim empirijskim dokazima, ovaj podatak će govoriti u prilog konstruktne valjanosti. Slično se može reći i za metodu razlika među grupama. Razlike grupa u skorovima koje su u skladu sa teorij-skim očekivanjima i prethodnim empirijskim nalazima, takođe govore u prilog kons-truktne validnosti instrumenta. Važno je podvući da se jedna korelacija i jedna razlika među grupama ne mogu smatrati dovoljnim dokazima konstruktne valjanosti, ali sva-kako govore u prilog njenom postojanju.

Korelacijama sa eksternim varijablama utvrđuje se i kriterijumska validnost. U ovom slučaju eksterna varijabla je neko ponašanje ili osobina koju želimo da predvidi-mo (kriterijum).

Sadržinska validnost se utvrđuje ekspertskim procenama i govori koliko ins-trument pokriva određeni domen (predmet merenja je definisan kao domen). Ovo je jedina vrsta valjanosti koja se može utvrđivati pre primene instrumenta

Za utvrđivanje konstrukt valjanosti upotrebljavaju se i multiosobinske-multimetodske matrice (Campbell & Fiske, 1959), tzv. MOMM matrice (engl. multi-trait multi-method – MTMM). MOMM matrice su matrice korelacija aranžirane tako da olak-šavaju utvrđivanje konstrukt validnosti (Fajgelj, 2013). Ove matrice sadrže korelacije mera istih ili sličnih konstrukata merenih istim i/ili različitim metodama. U njima se nalaze i korelacije instrumenta sa merama konstrukata koje ne bi trebalo da koreliraju sa ispitivanim instrumentom. Na taj način omogućavaju ispitivanje dva aspekta kons-truktne validnosti – konvergentne i diskriminativne validnosti. Instrument će posedovati konvergentnu validnost ako visoko korelira sa merama istog konstrukta, bez obzira na metod merenja. Instrument će posedovati diskriminativnu validnost ako ne korelira

Page 170: Bojan Janičić - digitalna.ff.uns.ac.rs

KONSTRUKCIJA I EVALUACIJA ANKETNOG UPITNIKA

159

visoko sa merama teorijski različitih konstrukata, bez obzira na metod merenja. Obe ove tvrdnje bi se možda mogle sažeti u jednu, a to je da, ukoliko je instrument konstruk-tno validan onda sa drugim konstruktima mora korelirati u očekivanom iznosu, odnos-no onako kako to predviđa teorija i potvrđuju nalazi prethodnih istraživanja. MOMM matrice se mogu koristiti za otkrivanje prisustva faktora metoda, odnosno da li korela-cije između mera zavise od metoda merenja koji je primenjen. U ovom slučaju metod se shvata dosta široko. To može biti i primenjena skala odgovora. Npr. jedan metod može biti merenje konstrukta binarnim stavkama, a drugi stavkama Likertovog tipa. MOMM matrice se mogu, što je danas i najčešće, analizirati upotrebom konfirmatorne faktorske analize. Ovakav način analize omogućava nam da utvrdimo varijansu koja potiče od konstrukta koji želimo da merimo (validnost) i varijansu metoda (variranje rezultata u zavisnosti od primenjene metode merenja). Ukoliko je varijansa metoda značajna, pos-tavlja se pitanje razloga i pitanje koji od primenjenih metoda je bolji (Saris et al., 2004).

Osim klasične teorije testa, za validaciju upitnika i stavki koriste se i modeli bazirani na teoriji odgovora na stavke (engl. Item Response Theory – IRT). Prednosti IRT modela nad modelima baziranim na klasičnoj teoriji testa su u tome što nam daju više informacija o pojedinačnim stavkama. Posebno koristan podatak je informativnost sta-vki (Dinić & Janičić, 2012). Informativnost se može smatrati IRT pandanom pokazatelja pouzdanosti iz klasične teorije testova, ali se može izračunati za pojedinačne ajteme i u suštini predstavlja preciznost ajtema u zavisnosti od nivoa osobine ispitanika. Informa-tivnosti pojedinačnih stavki mogu se sabirati, kako bismo dobili informativnost celoku-pnog instrumenta. Na ovaj način instrument se može prilagođavati pretpostavljenom nivou osobine u uzorku ispitanika i tako ostvariti što veća preciznost upotrebom što manjeg broja pitanja. Druga prednost IRT modela je što su (ukoliko je model saglasan53 sa podacima) procenjeni parametri stavki nezavisni od uzorka ispitanika, što nije slučaj sa pokazateljima iz klasične teorije testova. Loša strana ovih pristupa je to što IRT modeliranje zahteva velike uzorke. Sa aspekta evaluacije anketnih upitnika, nedostatak je i što sadrže pretpostavku o dimenzionalnosti instrumenta. U početku su IRT modeli pretpostavljali jednodimenzionalnost instrumenta (Osteen, 2010; Reckase, 2009; Reise & Revicki, 2014). Sada, iako postoje višedimenzionalni modeli, ipak se pretpostavlja ograničen broj dimenzija koje mere sve stavke. Kao što je rečeno, anketni upitnici su retko multiajtemske mere manjeg broja konstrukata.

Statističko modelovanje se u anketnim istraživanjima ne primenjuje često kao u evaluaciji psiholoških testova. Preser i sar. (Presser et al., 2004) kažu da su statističari i konstruktori anketnih upitnika „dva odvojena sveta“. Dok konstruktori upitnika nema-ju previše statističkih znanja, statističari ne obraćaju previše pažnje na formulaciju stavki. Više je razloga za to. Iako su anketni upitnik i psihološki test pojavno vrlo slični, postoje i bitne razlike o kojima smo više rekli na početku ovog poglavlja.

53Često se koristi i termin „fituje“.

Page 171: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

160

Pošto ankete nisu multiajtemske mere, njihova pouzdanost i validnost ne može se ispitivati metodama koje se baziraju na međusobnim odnosima stavki na jednom merenju (metode interne konzistencije, faktorska analiza). Ukoliko se neki anketni upitnik u neizmenjenom obliku koristi u više navrata, cilj je da se utvrdi da li je došlo do neke (manje ili više očekivane) promene kod ispitanika. Upotrebom takvih podataka za procenu pouzdanosti tipa testa i retesta, istraživač ne bi mogao znati da li razlika izme-đu dva merenja (ako postoji) potiče od nepouzdanosti instrumenta ili zbog promena do kojih je došlo kod ispitanika. Namensko zadavanje ankete u dva navrata pilot uzorku sa ciljem utvrđivanja test-retest pouzdanosti je moguće, ali produžava vreme potrebno za sprovođenje ankete i troškove istraživanja. Slično važi i za zadavanje dodatnih mera istog konstrukta u svrhu validacije. To nije posebno ekonomično za najveći broj anketa, koje se vrlo često organizuju naprečac kako bi se ispitao uticaj nekog aktuelnog događa-ja i slično. S obzirom da su anketni upitnici vrlo često namenjeni za jednu upotrebu, dodatni troškovi i vreme koje bi iziskivala provera metrijskih karakteristika stavki jed-nostavno nisu isplativi.

Iz tog ugla gledano, zanimljiv je pokušaj Sarisa i saradnika (2004) da na osnovu meta-analiza većeg broja dostupnih MOMM matrica razviju regresione modele za pred-viđanje metrijskih osobina stavki na osnovu velikog skupa prediktora. Kao prediktore koristili su: domen na koji se stavka odnosi, koncept (osećanja, uverenja, očekivanja...), socijalnu poželjnost, centralnost, vremensku perspektivu (da li se odnosi na sadašnjost, prošlost, budućnost), osobine skale stavke (metrika, format prezentacije...), poziciju stavke u upitniku, postojanje i karakteristike uvoda, kompleksnost stavke (broj rečeni-ca i reči, broj reči po rečenici), postojanje i osobine instrukcija, osobine uzorka (polna i obrazovna struktura), modalitet prikupljanja podataka (uz učešće anketara, računarski podržano) i druge. Uvrštavanjem vrednosti koje stavka ima na navedenim prediktorima u regresione jednačine, razvijeni modeli predviđaju njenu pouzdanost i validnost. Na ovaj način, tvrde autori, moguće je predvideti kvalitet stavke unapred, pre primene. Ovi modeli za sada su zanimljiviji kao pristup nego što nalaze praktičnu upotrebu. Potrebno ih je validirati i obogaćivati na osnovu novih informacija dobijenih na drugim populaci-jama i jezicima. Inače, autori su model(e) gradili na osnovu meta-analize 87 MOMM matrica sa 1067 stavki na holandskom, nemačkom, flamanskom i engleskom jeziku. Ovde je zanimljivo napomenuti da autori nalaze da je efekat jezika aditivan, odnosno, da utiče samo na apsolutnu visinu pokazatelja pouzdanosti i validnosti. Odnosi između ostalih prediktora i kriterijuma ostaju nepromenjeni. To praktično znači da bez obzira na jezik, kvalitet stavke na isti način zavisi od izbora koje pravimo pri njenoj konstruk-ciji. Na primer, pitanje koje se odnosi na nacionalnu politiku biće pouzdanije od pitanja koje se odnosi na život uopšte, bez obzira na jezik koji koristimo (naravno, dok god ga ispitanik razume). Isto tako, bez obzira na jezik, pitanja koja se odnose na prošlost biće manje validna od pitanja koja se odnose na sadašnjost, ali validnija od pitanja koja se odnose na budućnost (Saris et al., 2004).

Page 172: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIKUPLJANJE PODATAKA

161

7. Prikupljanje podataka

Vrhunac svakog anketnog istraživanja je faza prikupljanja podataka i izuzetno je bitno da ona bude obavljena kako treba. Podaci koje istraživač „prikuplja“ ne postoje „tamo negde“ (osim ako se ne radi o sekundarnim podacima). Oni nastaju u procesu anketiranja (Groves, 2009; Presser, 1990) i zbog toga se ova faza često smatra najzna-čajnijim delom anketnog istraživanja. Kao što je ranije rečeno, to je vremenski zahtevna i vrlo često i najskuplja faza, a greške načinjene tokom prikupljanja podataka, kasnije se teško mogu ispraviti bez velikih dodatnih troškova.

Pripreme za prikupljanje podataka počinju mnogo pre samog terenskog rada. One uključuju brojne odluke i zavise od njih. Kako će se odvijati faza prikupljanja poda-taka zavisiće od predmeta istraživanja, potrebne preciznosti ankete, budžeta istraživa-nja, nacrta uzorkovanja, raspoloživih okvira uzorkovanja, vremena koje stoji na raspo-laganju istraživaču. Svi ovi činioci utiču na izbor metoda prikupljanja podataka, a samim tim i na njegovo sprovođenje.

Ukoliko smo se opredelili za anketu licem u lice (ili neki drugi metod sa ličnim kontaktom), to zna-či da su nam za prikupljanje podataka potrebni anketari. Njih moramo regrutovati i obučiti pre početka prikupljanja podataka na terenu, a za vreme rada potreban je i njihov nadzor.

Ako smo se odlučili za onlajn anketu, anketari nam neće biti potrebni, ali će nam biti potrebni lju-di koji su obučeni za kreiranje onlajn ankete i za njenu implementaciju i praćenje. Osim toga, biće nam potrebni i tehnički uslovi za njeno sprovođenje, poput računara, servera, internet domena...

Tradicionalni način prikupljanja podataka su štampani upitnici koji se pre sve-ga primenjuju u anketama sa ličnim intervjuisanjem (licem u lice), ali i u okviru poštan-skih, grupnih i anketa sa ličnim dostavljanjem.

7.1. Ankete licem u lice

Ankete licem u lice (engl. face-to-face), odnosno sa ličnim intervjuisanjem, su ankete u kojima anketar ostvaruje lični kontakt sa ispitanikom i koristeći standardizo-vani intervju ili upitnik prikuplja potrebne podatke. Ova vrsta ankete je finansijski i vremenski najzahtevnija, ali zato, ako se pravilno sprovede, daje najkvalitetnije podatke i ima najvišu stopu odgovora, što je povezano sa višim stepenom interakcije anketar-ispitanik nego u drugim modalitetima prikupljanja podataka (videti poglavlje 8).

Page 173: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

162

7.2. Grupne ankete

Grupne ankete predstavljaju pokušaj uštede prilikom anketiranja, a da se ipak zadrži viši nivo interakcije. U ovom načinu anketiranja, odabrani ispitanici se okupe istovremeno u prostoriju određenu za anketiranje i podeli im se upitnik. Oni ga samos-talno popunjavaju u prisustvu anketara. Ukoliko imaju nekih nedoumica u vezi sa popu-njavanjem upitnika, mogu se obratiti anketaru za razjašnjenje i pomoć. Prednost ovak-vog tipa ankete nad anketom licem u lice je to što ispitanici imaju veći osećaj privatnosti pošto odgovore ne saopštavaju anketaru već ih sami beleže.

7.3. Telefonske ankete

Telefonske ankete sprovode se tako što anketar preko telefona ispituje ispita-nika i beleži njegove odgovore. Ovakve ankete su po pravilu jeftinije i brže, ali upitnici koji se primenjuju moraju biti kraći. Odgovori ispitanika su često površniji i kurtoazniji, a i stopa neodgovora je veća (Fajgelj, 2004).

Mogućnost sprovođenja telefonskih anketa zavisi od razvijenosti telefonske mreže u određenoj oblasti. Što je veća pokrivenost telefonskom mrežom to ima više smisla koristiti ovaj modalitet prikupljanja podataka. Ukoliko je pokrivenost manja, potrebno je kombinovati metode prikupljanja podataka.

Telefonske ankete doživele su procvat razvojem telefonske mreže fiksne tele-fonije, osamdesetih godina dvadesetog veka. Međutim, u poslednje vreme fiksna telefo-nija gubi trku sa drugim vidovima telefonije (mobilna, VoIP...), pa su sve češća domaćin-stva bez fiksne telefonske linije. U Republici Srbiji je, na primer, u 2017. godini na 100 stanovnika bilo 35 pretplatnika fiksne i 121 pretplatnik mobilne telefonije (ITU, 2017a).

Osim toga, savremena telefonija omogućava servise poput identifikacije i bloki-ranja poziva, što je sve uticalo da ispitanici, koji su i inače sve manje voljni da učestvuju u anketnim istraživanjima, lakše izbegnu kontakt i učešće (De Leeuw et al., 2008). Upo-treba VoIP (Voice over IP) tehnologije omogućava da korisnik bira pozivni broj, što može praviti probleme prilikom uzorkovanja, posebno ako je anketa vezana za određe-nu geografsku oblast.

Naravno, telefonske ankete nisu nužno vezane za fiksne telefonske brojeve, ali upotreba mobilnih brojeva rađa nove probleme. U okviru fiksnih brojeva jedinica uzor-kovanja obično je domaćinstvo, pošto je retka pojava da u jednom domaćinstvu svaki član ima zasebnu fiksnu liniju. Nasuprot tome, u okviru uzorkovanja koji čine brojevi mobilnih telefona jedinice uzorkovanja su osobe i retka je situacija da više osoba deli istu mobilnu liniju.

U zavisnosti od tipova okvira uzorkovanja koji se koriste, možemo razlikovati telefonske ankete koje se baziraju na spiskovima telefonskih brojeva i one koje se bazi-

Page 174: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIKUPLJANJE PODATAKA

163

raju na okviru uzorkovanja kao proceduri biranja slučajnih brojeva (engl. Random Dig-its Dialing – RDD). Svaki od ova dva pristupa ima svojih prednosti i mana. Mana i jednog i drugog okvira uzorkovanja je što ne pokrivaju domaćinstva koja ne poseduju telefon-sku liniju. Okviri uzorkovanja u formi gotovih spiskova imaju dodatnu manu što u njima nisu prikazani brojevi čiji vlasnici nisu želeli da im brojevi budu izlistani u spisku. Obič-no se radi o osobama koje dele određene karakteristike (npr. socio-ekonomski status) koje mogu biti u vezi sa određenim predmetima istraživanja. Takva istraživanja na ova-kvim nepotpunim okvirima davaće pristrasne pokazatelje. S druge strane, prednost ovakvih okvira je ta što obično uz telefonske brojeve sadrže i dodatne informacije poput poštanskih adresa, imena (naziva), i omogućavaju kontakte i drugim kanalima. Ove informacije mogu se iskoristiti i za slanje prethodnih pisama kojima se najavljuje telefonski poziv za učešće u anketi. Na taj način smanjuje se neprijatnost situacije bira-nja izvestioca54 domaćinstva, koja je u telefonskom kontaktu prilično bezlična i može rezultirati odbijanjem. To je ujedno i mana okvira uzorkovanja u vidu procedure gene-risanja slučajnih brojeva. Kod ovakvih okvira uzorkovanja istraživač nema nikakav dodatni podatak o vlasniku slučajno izabranog telefonskog broja. U prvom kontaktu anketar postavlja određena pitanja kako bi dobio potrebne podatke, što može izazvati otpor potencijalnih ispitanika i u krajnjem slučaju – odbijanje učešća. S druge strane, prednost ovakvih okvira uzorkovanja je ta što nema skrivenih telefonskih brojeva. Bili izlistani u javnim spiskovima ili ne, oni su dostupni ovoj proceduri biranja. Problem sa RDD procedurom je i u tome što generiše izvestan broj nevalidnih telefonskih brojeva (npr. nepostojećih ili brojeva firmi u anketi domaćinstava i obrnuto) (De Leeuw et al., 2008).

Telefonske ankete možemo razlikovati po tome da li uključuju interakciju sa anketarom ili su samoadministrirajuće, a danas su obe varijante gotovo uvek računar-ski podržane.

7.4. Poštanske ankete

Poštanske ankete se sprovode tako što se ispitanicima anketni upitnik šalje poštom. Obično se uz upitnik šalje i adresirana koverta sa plaćenom poštarinom koja služi da ispitanik vrati popunjen upitnik. Iako je ova vrsta anketa vrlo jeftina (ako ne i najjeftinija), mana joj je i što je stopa neodgovora jako visoka (40–70%), a neodgovara-nje je selektivno (Fajgelj, 2004). Pored niske cene, dobra strana ovakvog vida anketira-nja je i to što ispitanik samostalno popunjava upitnik u privatnosti svoga doma i u vre-me kada mu odgovara.

54 Izvestilac – osoba koja odgovara na anketu.

Page 175: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

164

7.5. Ankete sa ličnom dostavom upitnika

Slične poštanskim anketama su ankete sa ličnom dostavom upitnika (engl. household drop-off survey). Kao što naziv govori, ispitanicima se lično, na adresu, dosta-vlja upitnik. Ispitanik upitnik popunjava samostalno, a anketar se nekada vraća po popunjen upitnik, a nekada zamoli ispitanika da upitnik vrati poštom. Ovaj način kom-binuje neke dobre strane ankete licem u lice i poštanske ankete. Kao u poštanskoj anke-ti, ispitanik anketu može da popunjava u privatnosti i u vreme kada mu to odgovara. S druge strane, anketar ostvaruje lični kontakt sa ispitanikom, što povećava socijalni pritisak na ispitanika da odgovori na anketu i povećava stopu odgovora.

7.6. Internet ankete

Sa sve većom dostupnošću interneta, internet ankete sve više dobijaju na zna-čaju i sve su češće u upotrebi. Na svetu je u 2017. godini prema projekcijama Međuna-rodne telekomunikacione unije (ITU, 2017b, 2017a) više od 50% domaćinstava imalo pristup internetu, a internet je koristilo više od 3,5 milijarde ljudi. Valja imati na umu da postoje velike razlike između razvijenih i zemalja u razvoju, pa tako, u razvijenim zem-ljama procenat domaćinstava koja imaju pristup internetu ide preko 80%, u zemljama u razvoju se kreće negde oko 40%, a u nerazvijenim zemljama iznosi oko 15%. U isto vreme, u Republici Srbiji procenat domaćinstava koja imaju pristup internetu iznosio je 64,7%, što je bolje od svetskog proseka, ali lošije od evropskog (82,5%). Procenat osoba koje koriste internet iznosio je 67,1%.

Internet ankete obuhvataju više različitih pristupa anketiranju. Nekada se taj termin odnosi na nešto što liči na poštansku anketu prebačenu na novi medijum, odno-sno na EMS (anketu putem elektronske pošte). U tom pristupu se upitnik u elektron-skom vidu (elektronski obrazac, dokument) šalje ispitaniku elektronskom poštom (umesto običnom), a od ispitanika se očekuje da popunjen upitnik vrati pošiljaocu. Danas je mnogo češći pristup u kojem se anketa postavlja na neku internet stranicu, odnosno računarski podržano web intervjuisanje (anketiranje) – CAWI (metoda opi-sana u odeljku 7.8.1.5.).

Problem koji imaju sve internet ankete je taj što je uzorak ograničen na koris-nike interneta, a ponekad i među njima na posetioce određenih internet stranica (u slučaju anketa sa otvorenim pristupom) i to na one koji požele da odgovaraju na anke-tu. Nedostatak je to što korisnici interneta ne predstavljaju slučajan uzorak opšte popu-lacije. Među korisnicima interneta manje je žena, starijih ljudi, onih nižeg socijalnog statusa, nižeg obrazovanja, onih koji žive u ruralnim područjima i sl. (Dumičić & Žmuk, 2009). Stoga, prilikom opredeljivanja za ovaj modalitet prikupljanja podataka potrebno je voditi računa da ovi činioci nisu povezani sa predmetom istraživanja, jer mogu uticati na pristrasnost statističkih pokazatelja. U protivnom, potrebno je kombinovati okvire uzorkovanja i modalitete prikupljanja podataka.

Page 176: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIKUPLJANJE PODATAKA

165

7.7. Ankete sa mešovitim modalitetima

U anketnim istraživanjima nije redak pristup da se koristi više različitih moda-liteta prikupljanja podataka. Ovakva anketna istraživanja nazivaju se ankete sa mešo-vitim modalitetima (engl. mixed-mode survey). Mešovitom modalitetu prikupljanja podataka pribegava se kako bi se uz što manje troškove, povećala stopa odgovora i pokrila celokupna populacija (Gideon, 2012; Groves, 2009).

Na primer, troškovi telefonske ankete manji su od troškova ankete licem u lice. Međutim, doma-ćinstva bez telefona neće biti pokrivena okvirom uzorkovanja baziranom na telefonskim brojevi-ma (bilo da se radi o telefonskom imeniku ili RDD proceduri). Zato se mogu kombinovati pristup licem u lice i telefonska anketa i zonski okvir uzorkovanja sa RDD procedurom.

Mešoviti modalitet ankete ne znači nužno da se različiti ispitanici ispituju razli-čitim modalitetima, a opet različiti modaliteti ispitivanja mogu biti prisutni kod istog ispitanika. Osim toga, sintagma „mešoviti modaliteti“ ne mora se odnositi samo na način odgovaranja, već i na druge faze prikupljanja podataka poput regrutacije ispitanika, slanje podsetnika i slično.

Na primer, anketa može početi pristupom licem u lice, a nastaviti se nekim pristupom sa samoa-dministracijom (recimo CASI) kada dođe do osetljivih pitanja kod kojih je bitan osećaj privatnosti kod ispitanika.

Takođe, moguće je da se način regrutacije ispitanika i sama administracija ankete sprovode razli-čitim modalitetom. Poziv na web anketu može biti upućen klasičnom ili elektronskom poštom. Dalje, podsetnici za istu tu anketu mogu biti upućeni telefonskim putem.

U longitudinalnim nacrtima prvi talas može biti licem u lice, kako bi se obezbedila veća stopa odgovora, a naredni talasi se zbog uštede mogu realizovati u vidu telefonske, poštanske ili web ankete.

7.8. Upotreba računara u anketnim istraživanjima

Kada se govori o upotrebi računara u anketnim istraživanjima, najčešće se misli na računarski podržano prikupljanje podataka (engl. Computer Assisted Data Collection – CADAC).

Iako troškovi nabavke sistema za CADAC (softverski i hardverski) u početku mogu biti veliki, vremenom se isplate pošto su prednosti i uštede brojne.

Prednosti koje računari donose u anketna istraživanja su brojne u svim fazama anketnog istraživanja. Znatno olakšavaju planiranje istraživanja, uzorkovanje, kontakti-ranje ispitanika, prikupljanje podataka, njihovu kontrolu, uređivanje i analizu, pisanje i predstavljanje izveštaja.

U ovom trenutku osvrnućemo se samo na prednosti koje računari pružaju u fazi terenskog rada, odnosno, u fazi prikupljanja podataka.

Pre svega, računari nam omogućavaju standardizaciju procesa anketiranja

Page 177: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

166

(administriranja). Uz pomoć računara anketni upitnik/intervju možemo svakom ispita-niku zadati na identičan način u pogledu prezentacije pitanja, ali i prilagođavati pojedi-nim ispitanicima ukoliko je to potrebno.

Pitanja mogu biti snimljena u vidu audio ili video zapisa (na jednom ili više jezika) i na taj način postavljena ispitaniku. Naravno, treba napomenuti da konstrukcija upitnika, odnosno njeno prevođenje u računarski podržanu formu, može trajati duže, ali su uštede u drugim fazama mnogo veće.

Multimedijalne mogućnosti računara, pored navedenog čitanja pitanja, olakša-vaju upotrebu njihovih različitih formata. U računarski podržanom anketiranju znatno je olakšana upotreba fotografija, audio i video zapisa, uključujući i interaktivne forme (Couper, Traugott, & Lamias, 2001).

Računarski podržane ankete imaju mogućnost da prikažu stavke sve odjednom, po sekcijama (grupama) ili jedno po jedno. Ova mogućnost je zanimljiva jer postoje nalazi koji ukazuju da prikazivanje pitanja pojedinačno smanjuje verovatnoću nemar-nog odnosa ispitanika prema odgovaranju (Janičić, 2009).

U zavisnosti od odgovora ispitanika, softver može kontrolisati dalji tok ankete, odnosno slediti predviđena grananja i preskakati nepotrebna pitanja.

Takođe, na ovaj način može se kontrolisati da li je ispitanik dao odgovore na sva pitanja na koja je trebalo da odgovori ili ne.

Ukoliko je ispitanik preskočio neko od pitanja mogu mu se dati meki ili tvrdi podsetnici (engl. soft ili hard reminder). Meki podsetnik ukazuje ispitaniku da nije odgovorio na pitanje, ali ga puš-ta da nastavi dalje sa radom. Tvrdi podsetnik ukazuje ispitaniku da nije odgovorio na neko pita-nje, ali ga ne pušta da nastavi dalje da radi dok na njega ne odgovori. Iako možda deluje da su tvrdi podsetnici bolji jer prisiljavaju ispitanika da odgovori na pitanje, oni mogu biti i kontrapro-duktivni jer ispitanici koji zaista ne mogu ili ne žele da odgovore na pitanje zbog toga mogu odus-tati od ankete u celini (Décieux, Mergener, Neufang, & Sischka, 2015)

Upotreba računara znatno olakšava prilagođavanje pojedinih pitanja ispitaniku, a na osnovu odgovora koje je ispitanik prethodno dao.

Na primer, ako ispitanik na pitanje o svojoj telesnoj visini odgovori da je visok 1,76m, a na pitanje o težini da je težak 96kg, softver može izračunati indeks telesne mase (Body Mass Index – BMI) kao težinu podeljenu kvadratom visine i to upotrebiti u narednom pitanju. Ukoliko se u algoritam za prilagođavanje pitanja uključi i kategorizacija BMI, pitanje bi moglo glasiti: „S obzirom da je vaš indeks telesne mase 30,99 što vas svrstava u grupu gojaznih, da li ste tražili savet nutricio-niste u vezi sa ishranom?“

Osim toga, tek primenom računarski podržanog anketiranja u potpunosti je moguće ostvariti randomizaciju redosleda pitanja i ponuđenih odgovora. Na ovaj način može se u izvesnoj meri eliminisati neželjeni sistematski efekat redosleda pitanja i ponuđenih odgovora na odgovaranje ispitanika (videti poglavlje 6.6).

Računar može direktno beležiti odgovore ispitanika. Ispitanik može odgovarati

Page 178: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIKUPLJANJE PODATAKA

167

upotrebom tastature, ekrana osetljivog na dodir ili nekog drugog ulaznog uređaja, a odgovore je moguće beležiti i upotrebom softvera za prepoznavanje govora. Odgovore može unositi sam ispitanik, a može ih beležiti anketar ukoliko je prisutan. Na ovaj način izbegava se faza unosa podataka (poglavlje 10.2), koja pored toga što ima svoju cenu, zahteva dodatno vreme, a može biti i izvor grešaka.

Prilikom direktnog unosa podataka tokom računarske administracije ankete oni se i kontrolišu. Proverava se da li su unete vrednosti u okviru dozvoljenih, te da li su u skladu sa ranije datim odgovorima. Drugim rečima, obavlja se i deo faze uređivanja podataka (odeljak 10.3). Ako tom prilikom budu uočene neke nelogičnosti, ispitanik ili anketar se na to upozoravaju i odgovor koriguje na licu mesta. Ovakav način korekcije je mnogo lakši i pouzdaniji nego kada se to radi naknadno. Prilikom naknadnih korekci-ja potrebno je ponovo kontaktirati ispitanika i tražiti od njega da se priseti šta je odgo-vorio anketaru ili koji odgovor je zaokružio ili želeo da zaokruži. Ovde problem može nastati i prilikom ponovnog kontaktiranja ispitanika i prilikom prisećanja. Nekada nećemo biti u stanju da ponovno kontaktiramo ispitanika, a nekada on neće biti u stanju da se priseti svoga odgovora.

Anketiranje preko interneta omogućava istraživaču da, uz relativno male troš-kove, vrlo brzo dopre do ispitanika bez obzira gde se oni nalazili.

Umrežavanje računara (a posebno bežično) omogućava da se svi prikupljeni podaci slivaju u centralnu bazu podataka. Ako pri tome uzmemo u obzir i činjenicu da računari mogu automatski beležiti mnoge procesne podatke55 i snimati same intervjue, to je dobra osnova za praćenje sprovođenja ankete u realnom vremenu i za kontrolu rada anketara.

Softveri za telefonsko i onlajn (web, internet) anketiranje su obično sveobuhva-tni sistemi koji pokrivaju celokupan proces prikupljanja podataka.

Čini se da je u računarski podržanom telefonskom anketiranju primena računa-ra najobuhvatnija. Sistemi sa telefonsko anketiranje uključuju procedure izbora ispita-nika, odnosno okvir uzorkovanja u formi liste brojeva ili u formi procedure biranja slučajno generisanih brojeva (RDD procedura). Naime, softver za telefonsko anketiranje može sadržavati podršku za slučajno biranje brojeva sa postojećeg spiska i/ili za gene-risanje i pozivanje slučajnih telefonskih brojeva. U potonjem slučaju, dovoljno je defini-sati pozivni broj i broj cifara koje validan telefonski broj može da ima i sistem za tele-fonsko anketiranje će generisati slučajan uzorak telefonskih brojeva tražene veličine. Dalje, softver može kontrolisati pozivanje odabranih brojeva, beležiti odgovore, voditi dnevnik poziva, beležiti vreme uspostavljanja kontakta, trajanje intervjua, uspešnost kontakta, broj pokušaja kontakta, vremena kada su pokušani ponovni kontakti, planira-

55 Kao što su oni o vremenu početka i trajanja intervjua, broju kontakata i vre-

menu u kojem su pokušani neuspešni kontakti i sl.

Page 179: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

168

ti nova vremena kontakta...

Slična je situacija sa softverom za onlajn anketiranje poput LimeSurveya, OneClickSurveya i JD Esurveya. Ovi paketi otvorenog koda (engl. open source) iako u potpunosti besplatni, uključuju alate za pravljenje i formatiranje upitnika koji će biti korišćeni za onlajn istraživanja. Neki od njih nude i gotove stavke ili grupe proverenih stavki. Većina omogućava da se pitanja ili grupe pitanja recikliraju iz ankete u anketu. Isto važi i za skale odgovora na pojedinačne stavke.

Takođe, sadrže opcije za kontaktiranje ispitanika, odnosno za slanje personali-zovanih poziva i podsetnika (o personalizaciji videti u poglavlju 8.4). Podatke čuvaju u formatima koje može pročitati najveći broj softverskih paketa. Imaju mogućnost krei-ranja tokena (pristupnih kôdova) za ankete zatvorenog tipa. Beleže procesne podatke o slanju poziva i podsetnika, o ispitanicima koji su odgovorili na ankete, o onima koji su počeli pa prekinuli... Beleže podatke o ispitanicima čije su imejl adrese neispravne. Ima-ju mogućnost planiranja rasporeda slanja poziva i sl.

S obzirom da internet ankete omogućavaju pristup ispitanicima širom sveta, ovi sistemi obično podržavaju multilingvalne ankete.

Takođe, omogućavaju i kontrolu kvota (za pojedine grupe ispitanika), anonimi-zaciju podataka, automatsku kontrolu početka i završetka perioda u kojem je anketa dostupna ispitanicima, a mogu da produkuju i osnovne statističke izveštaje i grafikone.

U zavisnosti od modaliteta u kojem se primenjuje, prisutnosti anketara, da li se primenjuju mobilni uređaji ili ne, da li se intervjui snimaju ili ne, postoje različiti nazivi za računarski podržane metode anketiranja.

7.8.1. Različite varijante računarski podržanog prikupljanja podataka (CADAC)

Navešćemo neke od računarskih podržanih modaliteta koji se često sreću u literaturi o anketnim istraživanjima. Oni su najčešće poznati preko svojih akronima na engleskom jeziku, pa će tako biti navedeni i na ovom mestu. Sa prvim takvim akroni-mom (CADAC) ste se već upoznali, a on se odnosi na sve računarski podržane modalite-te o kojima ćemo pričati.

7.8.1.1. CAPI

Računarski podržano lično intervjuisanje (engl. Computer Assisted Personal Interviewing) je vid primene računara u intervjuisanju licem u lice. U suštini, radi se o običnom intervjuu u kojem anketar stavke čita i odgovore upisuje na računaru. Ovaj vid prikupljanja podataka spaja dobre strane računarski podržanog i ličnog intervjuisa-nja/anketiranja.

Page 180: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIKUPLJANJE PODATAKA

169

7.8.1.2. CASI

Računarski podržano samointervjuisanje (engl. Computer Assisted Self-Interviewing – CASI) je modalitet anketiranja u kojem ispitanik sam odgovara na pitanja koja su mu prezentirana na računaru. Ispitanik odgovara direktno na računaru. Često je ova metoda kombinovana sa CAPI. U prvoj fazi anketar uvodi ispitanika u situaciju anketiranja i objašnjava mu kako se upotrebljava računar i softver za anketiranje, kako bi ispitanik u nastavku mogao da pređe na samointervjuisanje. Anketar zatim odlazi na mesto gde ne može da vidi ekran računara niti kako ispitanik odgovara, ali je dovoljno blizu da može da odgovori na pitanja ispitanika i da uoči ukoliko ispitanik ima proble-ma sa odgovaranjem i da mu pomogne. Ako anketar prisustvuje procesu anketiranja onda se metoda označava akronimom CASI-IP (engl. Computer Assisted Self-Interviewing – Interviewer Present) (Fajgelj, 2004).

Ovaj pristup ima brojne prednosti. Pored svih onih navedenih za računarski podržano anketiranje, ono po čemu se ističe ovaj modalitet je to što anketar nema uvid u odgovore ispitanika. Na taj način ispitanici se osećaju slobodnije da daju odgovore na osetljivija i/ili inkriminišuća pitanja, i postoje dokazi koji upućuju da se na taj način smanjuje socijalno poželjno odgovaranje (Lavrakas, 2008).

Postoje različite varijante CASI u zavisnosti od toga na koji način su prezento-vana pitanja.

Računarski podržano audio samointervjuisanje – ACASI (engl. Audio Com-puter Assisted Self-Interviewing) je modalitet u kojem su pitanja unapred snimljena i ispitaniku se postavljaju u audio formatu. Ispitanik sluša pitanja koristeći slušalice kako osobe u blizini ispitanika ne bi mogle da saznaju na koje pitanje on odgovara56.

Računarski podržano audio-vizuelno samointervjuisanje – AVCASI (engl. Audio-Visual Computer Assisted Self-Interviewing), ili kako se još naziva – Računarski podržano video samointervjuisanje – VCASI (engl. Video Computer Assisted Self-Interviewing), je modalitet u kome ispitanik gleda i sluša video snimak anketara koji postavlja pitanja. Cilj je da se poveća doživljaj socijalne interakcije i približi onome u ličnom intervjuisanju. Ostatak procedure je isti kao kod ACASI.

Prednosti audio i video prezentacije pitanja nad običnom varijantom CASI su te što omogućavaju da na anketu odgovaraju nepismeni ili polupismeni ispitanici, te ispi-tanici oštećenog vida ili sluha (u video modalitetu pitanja mogu biti postavljana i na znakovnom jeziku). Takođe, povećana je standardizacija načina na koji su pitanja pre-zentirana pošto se eliminišu eventualne razlike koje mogu poteći od različitih načina na koji anketari čitaju pitanja.

56 Ako ispitanik ima mogućnost da istovremeno sam čita pitanja onda se ovaj

modalitet označava sa ACASI+.

Page 181: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

170

Mobilno računarski podržano samointervjuisanje (engl. Mobile Computer Assisted Self-Interviewing – MCASI) je podvrsta CASI, a razlika je samo u tome da li se sprovodi na mobilnim uređajima ili ne.

7.8.1.3. CATI

Računarski podržano telefonsko intervjuisanje (engl. Computer Assisted Tel-ephone Interviewing – CATI) je vid telefonskog intervjuisanja, odnosno anketiranja. Već smo ranije rekli da su današnje telefonske ankete gotovo uvek računarski podržane. Možemo ih razlikovati po tome da li uključuju interakciju sa anketarom ili su samoad-ministrirajuće.

Ako anketa uključuje interakciju anketar-ispitanik, anketar je taj koji čita pita-nja sledeći skript na ekranu računara, i odgovore ispitanika, isto tako, upisuje direktno u računar.

U samoadministrirajućim telefonskim anketama pitanja postavlja mašina (sni-mljena pitanja). Postoje dva metoda odgovaranja: interaktivno glasovno odgovaranje (engl. interactive voice response – IVR) i telefonsko audio-računarski podržano samoin-tervjuisanje (engl. Telephone Audio Computer Assisted Self Interviewing – T-ACASI). U IVR metodu softver prepoznaje glasovne odgovore ispitanika i beleži ih. U T-ACASI ispitanik odgovara pritiskom na tastere. U oba metoda, anketar bira broj, odabira ispitanika među validnim u okviru domaćinstva, uspostavljanja kontakt, pridobija ga za učešće u anketi i objašnjava svrhu ankete. Kada ispitanik pristane na učešće, prebacuje ispitani-ka na automat koji dalje postavlja pitanja i beleži odgovore. Moguć je i pristup u kojem se potencijalni ispitanik upućuje na zvanje besplatnog broja telefona na kojem se anke-ta odvija u potpunosti automatizovano, a ispitanik odgovara pritiskom na tastere (engl. Touchtone Data Entry – TDE).

7.8.1.4. CARI

Varijanta CAPI ili CATI (sa učešćem anketara) u kojoj je moguće snimanje slu-čajnog uzorka intervjua radi sprovođenja kontrole rada anketara naziva se računarski zvučno-snimano intervjuisanje (engl. Computer Audio Recorded Interviewing – CARI) (Thissen, 2014).

7.8.1.5. CAWI

Računarski podržano web intervjuisanje57 (engl. Computer Assisted Web In-terviewing – CAWI) je modalitet računarski podržanog anketiranja koji se odvija preko interneta. Anketa se obično kreira u softveru specijalizovanom za to (npr. LimeSurvey) i

57 Bolji termin bi bio anketiranje (engl. survey) ili upitnik (engl. questionaire),

ali izgleda da akronimi poput CAWS ili CAWQ nisu jednako pogodni, pa se koristi ter-min intervjuisanje i akronim CAWI.

Page 182: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIKUPLJANJE PODATAKA

171

postavlja na server (zakupljen ili u vlasništvu organizacije koja sprovodi istraživanje)58.

Ispitanici pristupaju anketi sa svog računara (uređaja) koristeći svoj softver, internet provajdera i opremu. Ovo treba imati u vidu kada se kreira ovakva anketa i kada se upotrebljavaju multimedijalne mogućnosti koje nudi. Pre početka prikupljanja podataka ovakvom metodom, neophodno je proveriti kompatibilnost ankete sa različi-tim vrstama uređaja, softvera i brzina pristupa internetu.

Ispitanik joj može pristupiti na više načina, u zavisnosti od načina uzorkovanja za koji se istraživač opredelio. U varijanti sa slobodnim pristupom, na anketu može odgovarati ko želi. Link na anketu može biti postavljen na određenom web sajtu (ili više njih) i društvenim mrežama, a anketi će moći da pristupe svi oni koji se tu nađu (ali i samo oni). Drugi pristup je metodološki opravdaniji, a anketi mogu pristupiti samo oni koji su dobili link na kojem se anketa nalazi. Link na anketu šalje se tačno određenim ispitanicima putem imejla, klasične pošte, sms-a ili nekog drugog načina za slanje poru-ka. U tom slučaju potencijalni ispitanik dobija svoj pristupni kôd (token) koji mu omo-gućava da pristupi anketiranju. Jedan token se ne može iskoristiti dva puta. Treći način bi mogao kombinovati ova dva pristupa. U tom slučaju anketa se postavlja na nekoj internet adresi, a link sa pozivom na učešće šalje potencijalnim ispitanicima. Ukoliko ne postoje tokeni, na anketu mogu odgovarati svi koji dobiju link. Istraživač u pozivu može zamoliti osobe kojima je link inicijalno poslat da proslede link i poziv drugim osobama koje pripadaju ciljnoj populaciji. Na ovaj način imamo varijantu uzorkovanja putem lanca preporuka (videti odeljak 4.3.2.2), koja nam može biti posebno korisna kod uzor-kovanja retkih i skrivenih populacija (odeljak 3.1.1).

Ovaj vid anketiranja deli prednosti sa ostalim računarski podržanim modalite-tima anketiranja, a uz to omogućava lak i jeftin pristup ispitanicima u različitim kraje-vima sveta. CAWI je jeftin i brz način prikupljanja podataka, ali je stopa odgovora često vrlo niska.

Međutim, često se postavlja pitanje validnosti podataka dobijenih ovim modali-tetom. S jedne strane postoje tvrdnje da se ispitanici u kontaktu sa računarom osećaju zaštićenije i anonimnije nego u kontaktu sa anketarom, te iskrenije odgovaraju čak i na osetljiva pitanja (Burke & Normand, 1987; Janičić, 2015). S druge strane, istraživač nema kontrolu ko zaista odgovara na anketu. Nije uvek moguće proveriti tačnost informacija koje ispitanik daje, pa čak ni onih koje se odnose na osnovna obeležja kao što su starost, mesto stanovanja, pol... Razlozi za davanje netačnih podataka mogu biti različiti: neozbiljnost, zlonamernost, nepoverenje prema organizatoru ankete, želja da se utiče na ishod ankete, materijalna korist... Ovo se posebno odnosi na onlajn ankete otvorenog tipa, ali moguće je i u ostalim vidovima anketiranja. Pošto je ovaj problem posebno izražen u CAWI, ESOMAR (Svetska asocijacija za društvena istraživanja i istra-

58 Moguća je čak i varijanta CAWI-IP (Thissen, 2014). U ovoj varijanti anketar

može biti prisutan preko internet veze.

Page 183: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

172

živanja javnog mnjenja i tržišta / The World Association for Social, Opinion and Market Research) i GRBN (Global Research Business Network) izdali su Smernice za obezbeđi-vanje kvaliteta onlajn uzoraka (ESOMAR/GRBN, 2015), koje su deo Međunarodnog kodeksa za društvena i marketinška istraživanja (ICC/ESOMAR, 2008). U Smernicama se zahteva da identitet svakog ispitanika bude potvrđen uz poštovanje propisa o zaštiti podataka o ličnosti. Ovo se pre svega odnosi na provajdere onlajn uzoraka.

7.8.1.6. EMS

Anketa putem elektronske pošte (engl. Electronic Mail Survey – EMS) je vid anketiranja u kojem se ispitaniku upitnik šalje putem elektronske pošte, a od ispitanika se očekuje da popunjen upitnik vrati na isti način (Fajgelj, 2004). S obzirom da se upit-nik šalje putem imejla, odnosno da je potrebno da je ispitanik povezan na internet, i ovaj vid anketiranja možemo svrstati u internet anketiranje. Predstavlja elektronsku varijantu poštanske ankete, od koje je brža i jeftinija.

Ovakav način anketiranja podrazumeva slanje uputstva i formulara koje bi ispi-tanik trebalo da popuni. Samim tim je nešto ograničeniji u pogledu multimedijalnih mogućnosti i mogućnosti kontrole toka odgovaranja. Takođe, podaci se ne beleže direk-tno u bazu podataka već ih je na neki način potrebno uneti.

7.8.1.7. DBM

Slanje diska poštom (engl. Disk By Mail – DBM) je sada već zastareli pristup računarski podržanog anketiranja koji ne zahteva posedovanje internet veze. U ovom pristupu se ispitanicima anketa šalje klasičnom poštom na nekom elektronskom medi-ju. U početku su to bile diskete, a sada to eventualno mogu biti CD ili DVD diskovi ili USB fleš-diskovi. Postupak je isti kao kod EMS samo što se anketa ne šalje elektronskom poštom već običnom. Ispitanik odgovara na anketu, beleži na medij koji mu je poslat i vraća ga klasičnom poštom. Trenutno, jedini razlog zbog kojeg bi se istraživač mogao opredeliti za korišćenje DBM je da pokrije uzorak ispitanika koji poseduju računar, ali ne i internet vezu.

7.8.1.8. CSAQ

Računarski samoadministrirajući upitnici (engl. Computer Self-Administered Questionnaire – CSAQ) je grupni naziv za sve računarski podržane ankete koje se samo-administriraju (CASI, EMS, DBM, CAWI...), uključujući i varijacije sa audio i video pre-zentacijom pitanja (ACASI, AVCASI, TACASI).

U svojim audio formama nekada se nazivaju ASAQ (engl. Audio Self-Administered Questionnaires) (Thissen, 2014).

7.9. Izbor modaliteta prikupljanja podataka,

Sve navedene metode možemo podeliti po nekoliko dimenzija, od kojih zavise i

Page 184: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIKUPLJANJE PODATAKA

173

neke njihove karakteristike. Te dimenzije su stepen uključenosti anketara, stepen priva-tnosti, upotreba tehnologije i raspoloživi kanali komunikacije.

Uključenost anketara može imati svoje dobre i loše strane (više o tome u pogla-vlju 8). Dobre strane su što on može motivisati ispitanika za učešće u anketi i na taj način smanjiti grešku neodgovora. Takođe, može objasniti ispitaniku nejasna pitanja i podstaći ga da dâ potpuniji odgovor (smanjiti grešku merenja). S druge strane, ukoliko anketar ne poštuje uputstva za administraciju ankete i ponaša se sugestivno, on može uticati na pristrasnost anketnih pokazatelja. Takođe, uključenost većeg broja anketara i njihovo nekonzistentno ponašanje dovodi do varijanse odgovora koja se može pripisati efektu anketara i na taj način smanjiti preciznost anketnih pokazatelja.

Nekada samo prisustvo anketara utiče na ponašanje ispitanika koji prilagođa-vaju svoje odgovore percipiranim očekivanjima anketara, ili biraju socijalno poželjne odgovore kako bi se prikazali u boljem svetlu.

Uključenost anketara utiče i na cenu istraživanja. Ukoliko modalitet podataka uključuje anketare treba predvideti troškove njihovih zarada, ali i troškove obuke, pre-voza, nadzora...

Stepen privatnosti koji ispitanik doživljava razlikuje se u zavisnosti od modali-teta prikupljanja podataka. Povezan je sa poverljivošću podataka (videti poglavlje 12), ali se ne može izjednačiti sa njom. Kada govorimo o privatnosti, misli se i na to ko sve može čuti ili videti koje pitanje je postavljeno ispitaniku i kako je on na njega odgovorio. Kada su u pitanju ankete koje uključuju anketare, ispitanik je svestan da će, pored istra-živača koji će obrađivati podatke, njegove odgovore znati i anketar. Ako se anketa obav-lja u domaćinstvu, postoji mogućnost da odgovore ispitanika čuju drugi ukućani, a ako se anketa obavlja na javnom mestu to mogu saznati i slučajni prolaznici. Osećaj privat-nosti koji modalitet anketiranja pruža ispitaniku posebno je bitan kada ispitanik odgo-vara na osetljiva pitanja i ona koja ga mogu inkriminisati (Groves, 2009). Ukoliko ispi-tanik ne oseća da je njegova privatnost zaštićena on će prilagođavati svoje odgovore i biraće one socijalno poželjne. Ukoliko istraživač želi da dobije iskrenije odgovore na ovakva pitanja bolje je da koristi metode sa samoadministracijom.

Modaliteti prikupljanja podataka razlikuju se i po dostupnosti različitih kanala komunikacije, odnosno, po tome koliko su tokom odgovaranja učesnicima u interakciji dostupne različite čulne informacije.

U različitim kanalima komunikacije prisutni su i različiti problemi u razumeva-nju, prisećanju, zaključivanju i odgovaranju.

Kada su u pitanju ankete licem u lice, i anketaru i ispitaniku su dostupne infor-macije koje mogu dobiti preko svih čula. Anketar sadržaj pitanja prenosi, kako preko sadržaja pitanja koje čita, tako i mimikom, bojom glasa, dikcijom i sl. Isto tako, anketar na raspolaganju ima sve te kanale komunikacije prilikom tumačenja odgovora ispitani-

Page 185: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

174

ka. On na osnovu mimike može zaključiti da li je ispitanik razumeo pitanje i priskočiti mu u pomoć. U telefonskim anketama i anketar i anketirani uskraćeni su za vizuelne stimuluse. Upotreba računara u anketiranju omogućava upotrebu većeg broja kanala komunikacije (bar u jednom smeru) i bez prisustva anketara.

Modalitet prezentacije stimulusa utiče i na odgovaranje ispitanika. U isključivo auditivnom modalitetu prikupljanja podataka, poput telefonske ankete, prilikom odgo-varanja može se javiti efekat poslednjih pozicija, a u isključivo vizuelnim metodama baziranim na tekstualnoj prezentaciji pitanja – efekat početnih pozicija (videti odeljak 6.6.2).

Kada je u pitanju upotreba tehnologije, postoji više pitanja na koje bi trebalo obratiti pažnju. Postoje brojne prednosti upotrebe tehnologije, pre svega računarske, u anketnim istraživanjima i one su navedene u odeljku 7.8. Glavna mana je potreba da se poseduje ta tehnologija. U klasičnom modalitetu anketiranja dovoljni su papir, olovka i ispitanik voljan da odgovara. U samoadministrirajućim modalitetima potrebno je da ispitanik bude pismen, ali u onim sa učešćem anketara čak ni to. U računarski podrža-nim modalitetima pored računara i softvera potrebne su i izvesne veštine rada na raču-naru na strani ispitanika i/ili anketara.

U CAPI, CASI i CATI modalitetima, tehnička sredstva potrebna za anketiranje poseduje istraživač, dok se u CAWI modalitetu anketiranje obavlja računarima koji su u vlasništvu ili su dostupni ispitaniku. Raznolikost hardvera i softvera u tom slučaju u velikoj meri dovodi u pitanje standardizovanost uslova anketiranja, i kao što je rečeno, neophodna je temeljna provera funkcionisanja ankete na različitim uređajima sa različi-tim softverom.

Takođe smo već pomenuli, jedna od prednosti računarske podrške je moguć-nost veće kontrole procesa anketiranja i smanjivanje greške merenja koja može poticati iz tog izvora. Kontroliše se sam tok ankete, moguća su kompleksna grananja i prilago-đavanja. Osim toga, moguća je kontrola odgovaranja, odnosno ograničavanje izbora ispitanika na skup mogućih odgovora, kontrola kretanja kroz anketu, onemogućavanje prelaska na naredno pitanje ukoliko ispitanik nije odgovorio na prethodno. Sve ove kontrole mogu uticati na način na koji ispitanik odgovara. Na primer, prisiljavanje ispi-tanika na odgovaranje može imati negativan uticaj na kvalitet odgovora ispitanika i neodgovore (Décieux et al., 2015).

Zbog svih ovih razlika jako je bitno da, kada u izveštaju navodimo korišćene modalitete prikupljanja podataka, budemo što specifičniji (Groves, 2009).

7.9.1. Pitanja koja utiču na izbor metode prikupljanja podataka

Trokim (Trochim, 2006) daje korisnu listu pitanja koja bi istraživač trebalo da postavi prilikom opredeljivanja za metodu anketiranja. Ova pitanja možemo podeliti u odnosu na oblast na koju se odnose.

Page 186: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIKUPLJANJE PODATAKA

175

7.9.1.1. Populacija

Prva grupa pitanja odnosi se na osobine populacije.

1. Da li postoji odgovarajući spisak populacije i da li njeni članovi mogu biti kontak-tirani na neki od načina?

Ako, na primer, želite da anketirate ljude iz domaćinstava koja ne poseduju fiksne telefone u nameri da ispitate zašto ga ne poseduju, suočićete se sa više problema. Kao prvo, ne postoji spi-sak takvih ljudi (ili u najvećem broju slučajeva vam neće biti dostupan). U ovom slučaju ni poštan-ska ni telefonska anketa ne dolazi u obzir. Ovakve ispitanike ćete verovatno morati da uzorkujete zonski ili tražite na ulici i intervjuišete ih lično.

2. Da li su članovi populacije pismeni, kojim jezikom govore?

Nekada možemo pretpostaviti da većina članova neke populacije nije pismena (ili bar ne dovolj-no) da bismo mogli da primenimo metode koje se oslanjaju na štampane upitnike (poštanske, onlajn...). Takav je na primer slučaj sa decom. U tom slučaju najbolji pristup bi verovatno bio licem u lice.

S druge strane u multikulturalnim i multilingvalnim sredinama postoje ispitanici koji su pismeni na jednom jeziku, ali ne moraju biti na drugom. Ukoliko ne znamo na kom jeziku je ispitanik pismen ne možemo mu poslati odgovarajući upitnik. U tom slučaju bismo mogli primeniti ankete licem u lice, telefonsku anketu, onlajn anketu (sa mogućnošću izbora jezika upitnika) i eventualno grupni pristup. Poštanska anketa bi mogla doći u obzir ako je unapred poznat jezik na kojem bi ispitanik mogao da odgovara i ukoliko smo sigurni u ispravnost prevoda i kulturalnu prilagođenost ankete.

3. Da li će članovi populacije biti voljni da odgovaraju?

Članovi određenih populacija ne moraju uvek biti voljni da učestvuju u anketama pošto mogu sumnjati u namere anketara i procenjivati da bi ih učešće u anketi moglo inkriminisati ili ugroziti. Takav bi slučaj mogao biti sa ilegalnim imigrantima, pripadnicima kriminalnog miljea ili progonje-nih/diskriminisanih manjina. Za ovakve ispitanike vrlo često ne postoje odgovarajući spiskovi populacije (niti adrese, brojevi telefona i sl). Modaliteti prikupljanja podataka koji se oslanjaju na ovakve informacije u ovom slučaju ne dolaze u obzir.

4. Kakvo je (geografsko) raspršenje populacije?

Ukoliko je populacija geografski raštrkana nekada nije moguće, ali gotovo nikad nije ekonomično, obavljati ankete tipa licem u lice. U ovom slučaju moguće je i jeftinije koristiti poštanske, telefon-ske i onlajn ankete. U anketama koje se sprovode licem u lice, geografska raštrkanost predstavlja značajno opterećenje za budžet (troškovi rada anketara, dnevnice, putni troškovi...).

7.9.1.2. Uzorak

Prilikom izbora metoda prikupljanja podataka potrebno je obratiti pažnju i na sledeće stvari koje se tiču uzorka (Trochim, 2006):

1. Koje podatke posedujemo o uzorku?

Koje informacije imamo o potencijalnim ispitanicima? Da li posedujemo kontakt podatke i koje? Čak i ako posedujemo adresu stanovanja, broj fiksnog telefona, broj mobilnog telefona i imejl adresu, trebalo bi proveriti da li su podaci koje imamo ažurni. Što su podaci stariji, veća je verova-

Page 187: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

176

tnoća da nisu tačni. Osim toga, tačnost ovih podataka zavisi i od nekih osobina potencijalnih ispi-tanika. Na primer, mlađi ispitanici češće od starijih menjaju ove podatke. Razlog može biti to što se češće sele zbog studija ili posla (menja se adresa i broj fiksnog telefona), menjaju imejl adresu i sl. Od navedenih podataka, broj mobilnog telefona se ređe menja nego imejl adresa (kojih jedna osoba često ima veći broj pri čemu su neke neaktivne).

2. Da li su ispitanici dostupni?

Čak i ako posedujemo tačne kontakt podatke, nije uvek sigurno da možemo stupiti u kontakt sa ispitanicima. Ovo zavisi od specifičnosti populacije (neki mnogo rade ili putuju, neki rade po sme-nama). S druge strane, nekada delu populacije nije moguće pristupiti zbog objektivnih okolnosti (elementarne nepogode, rat, politička situacija...). Ponekad je potrebno revidirati ciljnu populaci-ju, ali neki od ovih problema mogu se prevazići alternativnim metodama prikupljanja podataka. Na primer, ispitanike koji mnogo putuju ili često nisu kod kuće lakše možemo ispitati poštanskom ili onlajn anketom za koju im link možemo poslati imejlom, poštom, SMS-om...

Takođe, ako se bavite zapošljivošću studenata nakon studija, vrlo je verovatna situacija da su se neki od njih odselili iz mesta studiranja (jer su tu bili samo privremeno), a neki su posao našli u inostranstvu. Isključivanjem ovih ispitanika ne bi bio pokriven značajan deo populacije i to siste-matski. CAWI ili telefonska anketa mogu biti rešenje i u drugim situacijama i kada anketar fizički ne može dopreti do ispitanika.

3. Ko je ispitanik (jedinica istraživanja)?

Potrebno je tačno unapred definisati ko je ispitanik. Celo domaćinstvo ili neki njegov član? Ako je jedan član, ko je to? Da li je to punoletni član koji prvi otvori vrata, onaj najstariji ili možda onaj čiji je rođendan najbliži? Da li je to bilo ko ili glava domaćinstva („domaćin“). Ako je u pitanju gla-va domaćinstva, kako znamo ko je to? Šta se dešava ako onaj koga istraživač odabere ne želi da odgovara? Da li neko može da ga zameni i ko?

Slično je i ako su jedinice istraživanja organizacije i ustanove. Da li odgovaraju svi ili u ime predu-zeća može da odgovora bilo koji zaposleni? Da li to mora biti neko iz uprave, ili to može biti samo direktor? Ovakve stvari bitno je unapred odrediti kako izbor ispitanika ne bi zavisio od subjektiv-nih kriterijuma anketara, koji sistematski može birati određeni tip ispitanika. Ukoliko ispitanik nije unapred određen, onda u obzir dolaze metode prikupljanja podataka kod kojih anketar na licu mesta bira osobu koja će odgovarati (ankete licem u lice, telefonske, sa ličnim dostavljanjem...).

4. Da li svaki član populacije može ući u uzorak?

Ako ne postoji potpun okvir uzorkovanja (spisak populacije nije potpun / procedure biranja ne dozvoljavaju biranje svakog člana populacije), onda probabilističko uzorkovanje nije moguće. Ovo će vrlo često biti slučaj. Spiskovi populacije, ako i postoje moraju biti ažurni, a ažuriranje je prob-lem za sebe. Prilikom uzorkovanja malobrojnih populacija za koje ne postoje ažurni spiskovi, čes-to se kao metod uzorkovanja koristi biranje lancem preporuka (snow-ball, network sampling, cha-in refferal) pa metodi prikupljanja podataka moraju biti prilagođeni, u zavisnosti od kontakt informacija ispitanika do kojih smo došli u posed. Na primer, ako smo dobili imejl, moguća je pri-mena onlajn ankete; ako smo dobili adresu – poštanska, licem u lice, CAWI sa pozivom poštom; ako smo dobili adresu udruženja – grupno anketiranje; broj telefona – telefonska anketa...

5. Da li se očekuje dovoljan odziv?

Odziv ispitanika zavisi od mnogih stvari. Neki ispitanici jednostavno ne žele da učestvuju, neki zaborave da su dobili upitnik ili poziv da anketu popune onlajn, neki opet žele da odgovore na

Page 188: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIKUPLJANJE PODATAKA

177

anketu, ali nemaju vremena (neki se tako samo izgovaraju), neki ne žele da odgovaraju kada saz-naju šta je predmet istraživanja... Sve ovo može dovesti do slabog odziva i uticati da istraživanje ne uspe, bez obzira na kvalitet prethodnog planiranja. Ako je očekivan nizak odziv, bolje je opre-deliti se za metodu prikupljanja podataka koja uključuje veću interakciju, jer je na taj način soci-jalni pritisak za učestvovanje u anketi viši, a stopa neodgovora niža. Redosled metoda anketiranja po stopi odziva je (od najviše ka najnižoj): ankete licem u lice, telefonske ankete, poštanske anke-te, internet ankete (Groves, 2009).

Treba imati u vidu da kod osoba koje su zaposlene i često borave van kuće, optimalna metoda prikupljanja podataka može biti ona koja ispitaniku ostavlja da bira kada će odgovarati (poštan-ske, upitnici sa ličnom dostavom, CAWI...)

7.9.1.3. Tip pitanja u anketi

Na izbor metoda prikupljanja podataka utiču i tip pitanja koja su planirana u anketi (Trochim, 2006):

1. Kakav je tip planiranih pitanja?

Ako su pitanja lične prirode, trebalo bi razmisliti o metodi anketiranja koja ne uključuje lični kon-takt anketara i ispitanika, odnosno obezbeđuje veću privatnost. S druge strane, ako su pitanja detaljnija, primerenije su ankete tipa licem u lice ili eventualno telefonske ankete (ako su kraće).

2. Da li su pitanja složena?

Ako jesu (a moraju biti ako je predmet istraživanja takav), takođe su pogodnije ankete sa ličnim kontaktom anketara i ispitanika. Ako je moguće, pitanja bi trebalo podeliti na potpitanja i predvi-deti grananje u zavisnosti od odgovora. Računarski podržane metode prikupljanja podataka pogodne su za ovakva pitanja, ali samo ako su račvanja dobro definisana. U slučaju da je istraži-vanje koje se sprovodi eksplorativno, u smislu da istraživač želi da stekne neki početni uvid o pojavi, nekada nije moguće definisati sva pitanja. U tom slučaju, pogodniji su metodi prikupljanja podataka u kojima anketar može da postavlja dodatna pitanja koja u trenutku konstrukcije anke-te nisu mogla biti predviđena. Pre svega se misli na ankete licem u lice, mada je moguće zamisliti i upotrebu telefonske ankete u ovom slučaju (uz sva njena ograničenja).

3. Da li su potrebna selekciona pitanja?

Nekada iz okvira uzorkovanja ne možete da odstranite nelegitimne jedinice. Na primer, želite da ispitate iskustva žena u porodilištima Republike Srbije. Legitimne jedinice vašeg istraživanja su sve žene koje su rađale. Podatak o polu ispitanika relativno je lako dobiti, ali podatak o tome da li su koristile usluge porodilišta – ne. U tom slučaju među ženama koje su odabrane u uzorak potrebno je odabrati one koje su se porodile u nekom od porodilišta Republike Srbije. Za to se mogu koris-titi selekciona pitanja – jednostavno ih pitati da li su imale to iskustvo. Ako jesu, one predstavljaju legitimne ispitanike, ako nisu – zahvaliti im se i prekinuti ispitivanje. U ovom slučaju pogodne su metode sa ličnim kontaktom (licem u lice, telefonska, grupna anketa) ili računarski podržane ankete koje na početku mogu postaviti selekciono pitanje (ili više njih). Poštanske ankete u ovom slučaju ne dolaze u obzir. Kada od ispitanice ne dobijete odgovor, ne možete znati da li je to zato što nije legitiman ispitanik, ne želi da odgovori ili je razlog nešto treće.

4. Da li će pitanja u anketi biti dugačka i da li će postojati dugačke liste ponuđenih odgovora?

Page 189: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

178

U slučaju da je na prethodna dva pitanja odgovor „da“, razumnije je primeniti pristup licem u lice ili poštanske, grupne i internet ankete, nego telefonsku anketu. Ispitanici teško mogu da se kon-centrišu na dugačka pitanja i dugačke liste odgovora u telefonskom razgovoru. Mnogo je bolje ako postoji mogućnost da takva pitanja vide na papiru ili nekom ekranu (računar, tablet...). Duži-na pitanja i dugačke liste ponuđenih odgovora čine anketni upitnik dužim i nepogodnim za pri-menu telefonskim putem.

7.9.1.4. Sadržaj ankete

Na izbor metoda prikupljanja podataka utiče i sam sadržaj ankete (Trochim, 2006).

1. Da li je predmet istraživanja poznat ispitanicima?

Ako predmet istraživanja nije dovoljno poznat ispitanicima, potrebno je upoznati ih sa osnovnim stvarima. Na primer, ukoliko ispitujete stavove ispitanika o predlogu novog Zakona o radu, potre-bno je prethodno ispitanika obavestiti o osnovnim promenama, kako biste mogli da ga pitate za stav o njima. U ovom slučaju pogodniji je pristup sa ličnim kontaktom, odnosno licem u lice ili upotreba telefonske ankete (ako dužina upitnika to dozvoljava).

2. Da li će ispitanik morati da proverava podatke?

U nekim istraživanjima ispitaniku je potrebno vreme da konsultuje i proveri podatke kako bi pre-cizno odgovorio na pitanje. U ovim slučajevima pogodnija je primena nekog metoda anketiranja koji dozvoljava ispitaniku da bez prisustva anketara to učini, te da to učini u vreme kada mu odgovara. Proveravanje dokumentacije u prisustvu anketara može biti neugodno ispitaniku, pa su u ovom slučaju pogodne poštanske, onlajn ankete ili ankete sa ličnom dostavom.

7.9.1.5. Pristrasnost ispitanika, netačno odgovaranje

Moguća pristrasnost ispitanika, odnosno netačno odgovaranje, takođe je pove-zano sa metodama prikupljanja podataka (Trochim, 2006).

1. Socijalna poželjnost

Socijalna poželjnost je odgovaračko usmerenje ispitanika koju karakteriše biranje odgovora koji su socijalno poželjniji, a izbegavanje odgovora koji će ga prikazati u nepovoljnom svetlu. U ovo odgovaračko usmerenje može se svrstati pokušaj ispitanika da dâ odgovor po svaku cenu (da dru-gi ne bi mislili da ga ne zna). Ovo odgovaračko usmerenje dovodi do ugrožavanja validnosti, odnosno do pojave da odgovori koje ispitanici daju na anketi nisu rezultat merene pojave (na primer stava) već nečeg drugog. Ovakvo ponašanje ispitanika može biti veći problem u metoda-ma anketiranja koje uključuju interakciju ispitanik-anketar (De Leeuw, 2001; Groves, 2009). O ovoj pojavi posebno treba voditi računa u istraživanjima koja ispituju osetljive teme.

2. Da li anketar može uticati na odgovore?

I anketar, naravno, može uticati na odgovore ispitanika. Može izbegavati da pita ispitanika pitanja za koja smatra da mu mogu biti neprijatna; može da ne obraća pažnju na odgovore ispitanika, ako sam ima čvrst stav po pitanju ispitivane pojave (i može ga pogrešno beležiti); može zaključivati o verovatnom odgovoru ispitanika na neko pitanje na osnovu njegovih odgovora na prethodna pitanja; može svojim stavom (podrškom ili osudom) uticati na odgovore ispitanika; može uticati na odgovore ispitanika samom svojom pojavom ako je ispitanik doživi kao relevantnu za istraži-

Page 190: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIKUPLJANJE PODATAKA

179

vanu temu (Groves, 2009)... Opasnost da anketar utiče na odgovore ispitanika je posebno prisut-na ako istraživač ne raspolaže pouzdanim, dobro obučenim anketarima, a tema istraživanja je takva da izaziva veliko interesovanje i kontroverze. Ako postoji ovakva bojazan trebalo bi birati metode anketiranja koje ne uključuju anketare.

3. Da li znamo ko odgovara na anketu?

Kod nekih metoda anketiranja istraživač nikada ne može biti u potpunosti siguran ko zaista odgo-vara na pitanja. U poštanskim, internet anketama i anketama sa ličnom dostavom, ne možemo znati da li je anketu popunio član domaćinstva kojem smo je i namenili ili neko drugi, direktor škole ili njegov sekretar (ili neko treći). Ovaj problem možemo najvećim delom izbeći primenom anketiranja sa ličnim kontaktom anketar-ispitanik, pre svega licem u lice, i u određenoj meri gru-pnim anketiranjem. Čak i u telefonskim anketama ne možemo u potpunosti biti sigurni ko odgo-vara na pitanja.

7.9.1.6. Ostali bitni faktori pri izboru metode prikupljanja podataka

Izbor metode anketiranja zavisi i od cene, dostupnosti prostorija i opreme, ras-položivog vremena, ljudstva i slično (Visser et al., 2000).

Uzevši u obzir prethodno navedene razloge za izbor nekog od metoda anketi-ranja, svakako bi trebalo na umu imati i cenu takvog istraživanja. Novac je u većini istraživanja limitirajući faktor. Ankete licem u lice su po pravilu najskuplje. Pored troš-kova koji postoje i u drugim tipovima anketa, ovde su prisutni i troškovi rada anketara, njihove obuke, putni troškovi... Grupne ankete smanjuju ove troškove, smanjivanjem broja potrebnih anketara i novca potrebnog za putne troškove. Telefonske ankete su jeftinije, ali zahtevaju početna ulaganja u uređaje i softver za telefonsko anketiranje, a tu su i troškovi telefonskih poziva, te i dalje – anketari i njihova obuka. Poštanska anke-ta je još jeftinija, ali ne mora biti jeftina. Na cenu ove ankete između ostalog utiču troš-kovi materijala (štampanih upitnika, koverti) i poštarine. Internet ankete su najjeftinije, a posebno ako se i pozivi za anketu šalju elektronskom poštom. Na troškove ove ankete najviše utiče nabavka ili zakup potrebne računarske opreme, ali ti troškovi ne zavise od broja ispitanika (kao što je slučaj u prethodno navedenim metodama anketiranja). Dob-ra strana je to što se ova oprema može koristiti i za naredna istraživanja. Međutim, nekada se pozivi za onlajn anketu mogu slati i klasičnom poštom (u nedostatku imejl adresa ispitanika). U tom slučaju, u zavisnosti od veličine uzorka troškovi mogu značaj-no skočiti (posebno ako je planirano slanje više podsetnika).

Na izbor metoda anketiranja utiče i dostupnost opreme i prostorija. Za potrebe telefonskog anketiranja potrebno je postojanje opreme za telefonsko anketiranje i odgovarajućeg softvera. Za potrebe onlajn internet anketiranja potrebna je računarska oprema, pristup internetu, server... Za potrebe CADAC potrebni su računari i odgovara-jući softver. Bez ovih uslova, istraživanje primenom ovih metoda nije moguće.

Nekada je vreme ograničavajući faktor koji nameće upotrebu određenih meto-da. Ako je potrebno dobiti odgovore ispitanika u kratkom roku metoda izbora je tele-fonsko anketiranje. Prikupljanje podataka je najsporije primenom poštanske ankete i

Page 191: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

180

licem u lice.

Ljudski resursi koji su potrebni za sprovođenje ankete zavisiće od njenog tipa, kako po broju tako i po strukturi. Ankete sa ličnim intervjuisanjem zahtevaće najveći broj ljudi, mahom anketara. Veštine koje bi ti anketari trebalo da poseduju razlikovaće se ako su u pitanju ankete licem u lice, telefonske ili grupne ankete. U grupnim anketa-ma su potrebni anketari koji umeju da rade sa grupama, u telefonskim oni koji imaju razvijenu veštinu komunikacije putem telefona... Ako su u pitanju onlajn ankete, broj ljudi koji je potreban je manji, ali su potrebni ljudi sa određenim znanjem iz oblasti informacionih tehnologija koji znaju da kreiraju onlajn anketu, postave je na server, održavaju, šalju imejl pozive i podsetnike i sl. Ukoliko istraživač nema potrebne resurse za sprovođenje nekog od ovih tipova anketa, ne može se opredeliti za njega ma koliko mu taj metod bio privlačan.

Kao zaključak, može se reći da izbor metode anketiranja zavisi od velikog broja činilaca i gotovo uvek predstavlja kompromis između želja istraživača i mogućnosti. Svaki od metoda anketiranja ima svoje prednosti i mane. Šta će prevagnuti, često zavisi od ličnih sklonosti i iskustva istraživača. Ukoliko ne postoje uslovi za kvalitetno spro-vođenje anketnog istraživanja, možda je najbolji izbor i ne sprovesti ga. Ako na osnovu rezultata ankete ne možemo doneti ispravne zaključke na osnovu kojih možemo delati, nema svrhe ni počinjati. Šta više, nekorektno sprovedena anketa može nas dovesti u zabludu i navesti na pogrešne akcije, čija će cena po pravilu biti mnogostruko veća od cene same ankete.

7.10. Dobre i loše strane različitih metoda prikupljanja podataka

Svaki od navedenih načina prikupljanja podataka ima svoje prednosti ali i mane. Trokim (Trochim, 2006) je pokušao da ih sistematizuje, a tabela koju navodimo u celini (uz male dopune) može biti korisna prilikom opredeljivanja za neki od metoda.

Originalnom tabelom nisu pokriveni računarski podržani načini prikupljanja podataka, pa ni web ankete (CAWI). Računarski podržane varijante dele prednosti i mane sa modalitetima iz kojih su potekle (CASI, CAPI sa ličnim intervjuisanjem, CATI sa telefonskom anketom, EMS sa poštanskom). U originalnu Trokimovu tabelu dodata je kolona za web ankete, koje kombinovanjem prednosti koje nude računarski modaliteti i pristupa ispitanicima preko interneta unose nov kvalitet u metode prikupljanja podata-ka.

Page 192: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIKUPLJANJE PODATAKA

181

Tabela 6 – Prednosti i mane različitih metoda prikupljanja podataka

pitanje standardizovani upitnik intervju

grupno poštom lična dostava web licem u

lice telefonski

Moguća vizuelna prezentacija ajtema? da da da da da ne

Moguće dugačke kategorije odgovora? da da da da ??? ne

Ispitanik ima privatnost? ne da ne da da ???

Metod je fleksibilan? ne ne ne da da da „Otvorena pitanja“ upot-rebljiva? ne ne ne ne da da

Potrebno znanje čitanja i pisanja? ??? da da ??? ne ne

Možemo li proceniti kva-litet odgovora? da ne ??? ne da ???

Verovatna visoka stopa odgovora? da ne da ne da ne

Možete li ispitaniku obja-sniti studiju lično? da ne da ne da ???

Jeftino? da da ne da ne ne Male potrebe za osobljem i prostorijama? da da ne da ne ne

Raštrkani uzorci lako dostupni? ne da ne da ne ne

Ispitanik odgovara ličnim tempom? ne da da da ne ne

Postoji lični kontakt? da ne da ne da ne Primenljiva dugačka anketa? ne ne ne da da ne

Faza prikupljanja podataka brza? ne da ne da ne da

Prilagođeno prema Trochim, 2006

Page 193: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

182

8. Neodgovori

Ukoliko želimo da na osnovu anketnog istraživanja procenimo prosek, propor-ciju ili ukupan broj neke pojave u populaciji, osim reprezentativnog uzorka potrebno je i da jedinice istraživanja koje su odabrane u uzorak zaista i uzmu učešće u istraživanju (Biemer et al., 2016). Kada planiramo veličinu i strukturu uzorka kako bismo ostvarili željenu preciznost rezultata, to činimo pod pretpostavkom da će sve odabrane jedinice populacije zaista i postati ispitanici, odnosno da će odgovarati u anketi. To se retko dešava, ali od te pretpostavke se mora poći. Realizovani uzorak će obično biti manji, a to će uticati na manju preciznost anketnih pokazatelja. Međutim, to nije jedini način na koji razlika između planiranog i realizovanog uzorka može uticati na anketne pokazate-lje. Ukoliko se razlikuje i struktura realizovanog uzorka, to može dovesti i do pristras-nosti pokazatelja i to je već rečeno u poglavlju 5.

Anketna istraživanja u kojima istraživač ne uspe da prikupi odgovore od jedini-ca odabranih u uzorak suočavaju se sa problemom neodgovora (engl. nonresponse).

Neodgovor se može definisati kao neuspeh istraživača da dobije odgovor od ispitanika (Groves, 2009). Ne odnosi se samo na situacije u kojima je istraživač uspeo da ostvari kontakt sa potencijalnim ispitanikom, već i na situacije u kojima taj kontakt iz raznih razloga nije ni ostvaren.

Kada su u pitanju neodgovori, možemo razlikovati neodgovore na pojedinačne stavke (engl. item nonresponse) i neodgovore na anketu u celini (engl. unit nonrespon-se)(Groves, 2009).

Termin „neodgovor“ će u ovoj knjizi biti korišćen za prevod engleskog termina „nonresponse“. Iako možda deluje rogobatno i da nije u duhu srpskog jezika, on se ne može zameniti terminom poput „odbijanje“, pošto nedostatak odgovora na anketu u celini ili na pojedina pitanja u njoj nije uvek rezultat odbijanja, već može nastati i iz drugih razloga (što će biti objašnjeno u nastavku ovog poglavlja, u odeljku 8.3). Inače, termin „neodgovor“ ponuđen je kao prevod engleskog termina „nonresponse“ u Rečniku statističkih termina Međunarodnog instituta za statistiku (“The ISI Glossary of Statistical Terms,” 2011), a već je korišćen i u metodološkoj literaturi na srpskom jeziku (npr. Fajgelj, 2004).

Page 194: Bojan Janičić - digitalna.ff.uns.ac.rs

NEODGOVORI

183

8.1. Stopa odgovora, stopa neodgovora, stopa odbijanja i stopa konverzije

Stopu neodgovora (engl. nonresponse rate) možemo definisati kao odnos broja jedinica koje nisu odgovorile i veličine uzorka, ili kao procenat ispitanika odabranih u uzorak koji nije odgovorio. Pojam komplementaran stopi neodgovora je stopa odgovora (engl. response rate), koja se kod nas nekada naziva i odziv. Nju možemo definisati kao odnos broja jedinica koje su odgovorile i veličine uzorka, ili kao procenat ispitanika odab-ranih u uzorak koji je zaista i odgovorio.

Ove dve stope su najznačajniji pokazatelji kvaliteta ankete. Mogu biti prikazane u obliku proporcija ili procenata. Najjednostavnija varijanta računanja stope odgovora može se predstaviti sledećim izrazom:

𝑆𝑆𝑆𝑆 =𝐼𝐼𝑛𝑛

[ 58 ]

gde je I broj ispitanika koji je odgovorio, a n veličina uzorka.

Na ovaj način dobijamo stopu odgovora u formi proporcije, a u procente je pre-tvaramo jednostavnim množenjem sa 100. Da bismo dobili stopu neodgovora možemo stopu odgovora u proporcijama oduzeti od 1, a u procentima od 100.

Međutim, ovakav način računanja se retko može primeniti. Razlozi za to leže u nesavršenim okvirima uzorkovanja i različitim verovatnoćama uzorkovanja. Naime, u okvirima uzorkovanja mogu se naći nelegitimne jedinice, a može doći i do njihovog grupisanja i dupliranja (videti odeljak 3.2.2.3). Sve slabosti okvira uzorkovanja dovode do toga da mi do kraja ne znamo kolika je zaista veličina uzorka. Nakon izbacivanja nelegitimnih i dupliranih jedinica, veličina uzorka može biti umanjena. Grupisanje, s druge strane, može dovesti do povećanja uzorka. Kako god bilo, rezultat je da nam veli-čina uzorka nije poznata. Slična je situacija i kada je klaster uzorkovanje u pitanju. Prili-kom biranja klastera oni ne moraju biti jednake veličine. Ukoliko smo se opredelili da ispitamo celokupne klastere, neće nam biti poznata veličina uzorka. Takođe, ukoliko ne uspemo da dobijemo odgovore od pojedinih klastera, ne mora nam biti poznat ni broj ispitanika u njemu, pa samim tim ni broj ispitanika koji nisu odgovorili. Stoga se pred-laže izračunavanje stope odgovora na sledeći način (adaptirano prema Groves, 2009):

𝑆𝑆𝑆𝑆 =𝐼𝐼

𝐼𝐼 + 𝑆𝑆 + 𝑁𝑁𝐾𝐾 + 𝐷𝐷 + 𝑠𝑠 · 𝑁𝑁𝑉𝑉 [ 59 ]

gde je I broj jedinica koje su odgovorile, O broj jedinica koje su odbile ili prekinule učešće u anketi (ili na jedno pitanje), NK broj jedinica sa kojima nije ostvaren kontakt, D druge validne jedinice, NV broj jedinica za koje nije poznato da li su validne, a e procena proporcije broja validnih jedinica među jedinicama sa nepoznatom validnošću.

Procena vrednosti e može se dobiti iz tekućeg istraživanja kao:

Page 195: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

184

𝑠𝑠 =𝐼𝐼 + 𝑆𝑆 + 𝑁𝑁𝐾𝐾 + 𝐷𝐷

𝐼𝐼 + 𝑆𝑆 + 𝑁𝑁𝐾𝐾 + 𝐷𝐷 + 𝐼𝐼𝑉𝑉 [ 60 ]

gde je IV broj nevalidnih jedinica izabranih u uzorak.

Preporučuje se da se prilikom izveštavanja o stopi odgovora prijavljuju dve varijante. Jedna koja sadrži izraz e·NV, a druga bez njega. Na taj način se dobija nešto poput intervala poverenja u kojem se nalazi prava stopa odgovora.

Kada je u pitanju uzorkovanje sa nejednakim verovatnoćama, računanje stope odgovora mora se prilagoditi nameni. Naime, u poglavlju o uzorkovanju (4) rečeno je da se određene, a obično male subpopulacije, nadreprezentuju kako bi uzorak bio dovoljne veličine i primenjene statističke analize imale dovoljnu snagu. Ukoliko imamo ovakav slučaj, a zanima nas uticaj neodgovora na pokazatelje za svaku od grupa posebno i poređenje stopa neodgovora između podgrupa – stope se moraju računati posebno. Ukoliko nas zanima zajednički pokazatelj za celokupni uzorak potrebno je u račun sto-pe odgovora uvrstiti i selekcione pondere, kako bi svakom slučaju i podgrupi bio prido-dat odgovarajući značaj koji oni imaju u populaciji (videti odeljak 10.4).

Pored stope odgovora, značajni mogu biti i pokazatelji poput stope odbijanja (engl. refusal rate), koja predstavlja odnos broja jedinica koje su (eksplicitno) odbile učešće u istraživanju i sume broja onih koje su odgovorile i broja jedinica koje su odbile učešće u anketi (O/(I+O)).

Stope odgovora razlikuju se u zavisnosti od načina uzorkovanja i modaliteta prikupljanja podataka i drugih karakteristika nacrta istraživanja. Stoga, ne postoje kri-tične vrednosti stope odgovora koje bi istraživač mogao uzeti kao cilj, iako naravno da je bolje kada su one što više (Hancock & Mueller, 2010). Mada od veličine realizovanog uzorka zavisi preciznost anketnih statistika, sam broj ispitanika ne garantuje i njihovu nepristrasnost. Zato stopa odgovora sama po sebi nije dovoljan uslov.

Kao ilustraciju zavisnosti stopa odgovora od elemenata nacrta istraživanja navešćemo samo neka istraživanja čiji se nalazi nikako ne mogu smatrati referentnim vrednostima. U istraživanju Broga-na i saradnika (2001) stopa odgovora u zonskom uzorkovanju kretala se oko 80%, dok je u slučaju uzorkovanja RDD (Random Digit Dial) metodom bila nešto niža i iznosila oko 74%. Ova razlika može se pripisati upotrebi telefonskih sekretarica, servisa identifikacije i blokiranje poziva, koje ljudi koriste kako bi izbegli javljanje na pozive od nepoznatih. Osim toga, mnogo lakše je odbiti poziv na učešće u anketi preko telefona nego u ličnom kontaktu sa anketarom (Brogan et al., 2001).

U istraživanju Solkvista i saradnika (Sahlqvist et al., 2011) stope odgovora u poštanskim anketama bile su nešto niže od 20%.

Stope odgovora na elektronske ankete su često i niže od toga i kreću se oko 15% (Porter & Whitcomb, 2003).

Osim od nacrta istraživanja, stope odgovora razlikuju se od zemlje do zemlje i menjaju se tokom vremena. Ono što je konstantno je trend njihovog smanjenja još od šezdesetih godina dvadese-tog veka (Dey, 1997).

Page 196: Bojan Janičić - digitalna.ff.uns.ac.rs

NEODGOVORI

185

Osim stopa odgovora i neodgovora, nekada se prijavljuje i stopa konverzije (engl. conversion rate). Konverzija je proces u kojem se jedinice koje su odbile učešće u istraživanju različitim metodama preobraćaju, odnosno pridobijaju za učešće. Stopa kon-verzije računa se kao odnos broja jedinica koje su na taj način pridobijene i broja jedini-ca koje su inicijalno odbile učešće. Radi se o proporciji ili procentu onih koji su prome-nili mišljenje i nakon inicijalnog odbijanja ipak pristali na učešće u anketi.

Ukoliko potencijalni ispitanik u inicijalnom kontaktu odbije učešće u istraživa-nju (manje ili više odlučno), takav slučaj se neko vreme ostavlja po strani i naknadno se pokušava ponovo. Ukoliko je to potrebno, ovakvom ispitaniku se može poslati posebno pismo u kojem organizacija koja sprovodi istraživanje apeluje na ispitanika da ipak prihvati učešće. Takođe, moguće je poslati iskusnijeg anketara ili supervizora.

Kada je u pitanju odbijanje učešća u anketi možemo napraviti razliku između tvrdog i mekog odbijanja. Tvrdo odbijanje (engl. hard refusal) je situacija kada ispitanik odlučno kaže da ne želi da učestvuje u istraživanju (pri tom može pretiti tužbom ili koristiti nešto manje pristojan reč-nik). Meko odbijanje (engl. soft refusal) imamo u situaciji kada potencijalni ispitanik odbije učešće manje odlučno (rekavši da nema vremena, trenutno nije u mogućnosti, da ga ne zanima anketa i slično). U situaciji mekog odbijanja kao metod smanjenja pristrasnosti neodgovora preporučuje se pokušaj konverzije.

8.2. Uticaj neodgovora na anketne pokazatelje

Kako i koliko će neodgovori uticati na anketne procene zavisi od izraženosti problema, odnosno od stope neodgovora i od povezanosti neodgovora sa predmetom istraživanja (videti poglavlje 5, a posebno odeljak 5.3).

Ukoliko su neodgovori slučajni i nisu povezani sa predmetom istraživanja, oni će preko smanjenja veličine uzorka uticati na preciznost anketnih statistika, odnosno na proširenje njihovih intervala poverenja i povećanje margine greške, ali neće uticati na pristrasnost. S druge strane, ukoliko se osobine jedinica istraživanja koje ne odgovore razlikuju od osobina ispitanika koji su odgovorili, anketni statistici će sistematski pre-cenjivati ili potcenjivati parametre populacije. Tada možemo govoriti o pristrasnosti neodgovora. Kod jednostavnijih anketnih statistika poput aritmetičke sredine i pro-porcije, pristrasnost neodgovora je funkcija korelacije neodgovora sa merenim konstru-ktom i verovatnoće učešća u anketi (Groves, 2009). Savremeno shvatanje neodgovora i greške neodgovora, prema kojem svaki član populacije može učestvovati ali i odbiti učešće u anketi (ili odgovoriti na pojedinačno pitanje ili ne), može se prikazati sledećim izrazom:

𝑦𝑦�𝑟𝑟 = 𝑦𝑦�𝑚𝑚 +𝜎𝜎𝑦𝑦𝑝𝑝�̅�𝑝

[ 61 ]

gde je y varijabla od interesa, 𝑦𝑦�𝑟𝑟 nekorigovani pokazatelj (aritmetička sredina) za jedi-nice koje su odgovorile, 𝑦𝑦�𝑚𝑚 je aritmetička sredina jedinica koje nisu odgovorile, �̅�𝑝 pro-sečna verovatnoća u populaciji da će jedinica uzeti učešće u anketi, a 𝜎𝜎𝑦𝑦𝑝𝑝 kovarijansa

Page 197: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

186

merene varijable i populacione verovatnoće učešća u anketi.

Iz formule proizilazi da će pristrasnost neodgovora pre svega zavisiti od pove-zanosti (kovarijanse) varijable od interesa i verovatnoće učešća u anketi. Pristrasnost neodgovora će biti veća što je verovatnoća odgovaranja na stavke u jačoj vezi sa vari-jablom od interesa (Groves et al., 2001). Važna implikacija izraza [ 61 ] je da pristras-nost anketnih pokazatelja ne mora zavisiti samo od ukupne stope neodgovora. Samim tim, povećanje ukupne stope odgovora ne mora biti praćeno smanjenjem pristrasnosti anketnih pokazatelja, ako ispitanici nisu odgovorili na sva pitanja u anketi. Pokazatelji bazirani na pitanjima na koja veći broj ispitanika nije odgovorio imaće manju preciz-nost, a ukoliko mehanizam nedostajanja odgovora nije slučajan, ovi pokazatelji mogu biti i pristrasni. Iako problem preciznosti možemo rešiti planiranjem većeg uzorka pre-dviđanjem stope neodgovora (izraz [ 2 ]), time ne rešavamo problem pristrasnosti nas-tao zbog poremećaja strukture uzorka. Zato, sa aspekta smanjenja pristrasnosti anket-nih pokazatelja, mnogo je bolje planirati manji uzorak i truditi se da pridobijemo sva-kog ispitanika odabranog u uzorak.

Prema tome, stope odgovora ili neodgovora ne moraju biti dobri pokazatelji kvaliteta svih anketnih statistika, kao što se ni protiv pristrasnosti anketnih statistika ne možemo boriti samo povećanjem stope odgovora. Kroznik (Krosnick, 1999) kaže da reprezentativnost uzorka ne raste nužno monotono sa porastom stope odgovora.

To takođe znači da je moguće dobiti nepristrasne pokazatelje i sa niskom sto-pom odgovora, ukoliko verovatnoća učešća u anketi nije povezana sa varijablom (vari-jablama) od interesa.

Da bi se procenio uticaj neodgovora na pristrasnost anketnih statistika, pre svega potrebno je proceniti povezanost verovatnoće odgovaranja i varijabli koje nas zanimaju.

Ukoliko je mehanizam neodgovora potpuno slučajan (MCAR – videti odeljak 10.5), verovatnoća odgovora na stavku nije povezana sa onim što ona ispituje niti imaju zajednički uzrok (Rubin, 1987; Waal, Pannekoek, & Scholtus, 2011). Njihova kovarijan-sa biće nulta i pristrasnost neće postojati.

Ako verovatnoća neodgovora i varijabla od interesa imaju zajednički uzrok, njihova kovarijansa biće nenulta (ali, nulta ako kontrolišemo zajednički uzrok). Meha-nizam nedostajanja biće slučajan (MAR), a pristrasnost anketnih statistika može biti prisutna (Rubin, 1987; Waal et al., 2011).

Pristrasnost anketnih statistika biće najveća kada varijabla od interesa uzroku-je neodgovore (njihova kovarijansa biće nenulta). Mehanizam nedostajanja će tada biti MNAR, odnosno nedostajanje nije slučajno.

Zadatak istraživača je da utvrdi postoji li veza između neodgovora i varijable od interesa i kakve je ona prirode (Groves, 2009). Posledice koje neodgovori mogu

Page 198: Bojan Janičić - digitalna.ff.uns.ac.rs

NEODGOVORI

187

imati po preciznost i pristrasnost podataka mogu se donekle korigovati primenom sta-tističkih postupaka. Korekcija za neodgovore na celu anketu radi se u vidu ponderisanja, a korekcija za neodgovore na pojedinačne stavke u vidu imputacije nedostajućih podata-ka (videti odeljke 10.4 i 10.5). Ipak, najbolji način da se eliminiše negativan uticaj neod-govora na kvalitet anketnih pokazatelja je njihovo sprečavanje, odnosno sve mere koje povećavaju stopu odgovora, kako na anketu u celini tako i na pojedinačne stavke.

8.3. Izvori neodgovora

Postoje tri glavna izvora neodgovora u anketnim istraživanjima:

1. Neuspešno dostavljanje ankete (ili poziva na učešće u anketi) jedinicama odab-ranim u uzorak.

2. Neuspeh u pridobijanju kontaktirane jedinice na saradnju. 3. Nemogućnost ispitanika da pruži potrebne informacije.

Ova tri izvora imaju različite uzroke.

8.3.1. Neuspešno dostavljanje ankete

Neuspeh u dostavljanju ankete može nastati kao rezultat nemogućnosti anketa-ra da pronađe ispitanika. Ovo je slučaj kada kontakt podaci u okviru uzorkovanja nisu ispravni ili potpuni (De Leeuw et al., 2008).

Ukoliko su ovi podaci tačni i ispitanik je lociran, sledeći korak u kome može doći do neuspeha je pokušaj ostvarivanja kontakta sa potencijalnim ispitanikom. Razlo-zi za neuspešno kontaktiranje ispitanika razlikuju se u zavisnosti od modaliteta prikup-ljanja podataka, tačnije od načina na koji istraživač to pokušava da ostvari.

U anketama licem u lice i telefonskim anketama bitan činilac uspeha je vreme u koje je pokušan kontakt. Najviše šanse za uspeh anketar ima ako potencijalnog ispitani-ka kontaktira van vremena u kojem većina zaposlenih radi. Tokom radnih dana to su obično večernji časovi, a vikendom preko dana. Međutim, to ne mora nužno važiti za sve ispitanike. Postoje ispitanici koji mogu biti dostupni preko celog dana. To su neza-posleni, oni koji rade od kuće, penzioneri...

Da li će anketar u anketama koje se sprovode licem u lice uspeti da ostvari kon-takt sa ispitanikom zavisi i od fizički osobina okruženja u kojima ispitanik živi. Postoje zgrade koje imaju vratare ili naselja sa službom obezbeđenja koja može odbiti da pusti anketare unutra ukoliko nisu najavljeni.

Zbog svega navedenog, anketari moraju pokušati da kontaktiraju ispitanike u više od jednog navrata, a broj pokušaja bi trebalo unapred definisati. Vreme ponovlje-nog pokušaja kontakta u odnosu na inicijalni bi trebalo menjati. Ukoliko je neuspešan kontakt pokušan radnim danom, sledeći put bi trebalo pokušati vikendom. Takođe, uputno je varirati i doba dana kada se pokušava ostvariti kontakt. Anketaru od koristi

Page 199: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

188

mogu biti informacije koje može dobiti od drugih članova domaćinstva ili od suseda, koji mu mogu reći kada se traženi ispitanik najlakše može naći kod kuće.

Ukoliko okvir uzorkovanja nudi različite kontakt podatke, nakon nekoliko neu-spešnih pokušaja kontakta na jedan način, dobro je pokušati da se ostvari kontakt na drugi način. Ako je kontakt dolaskom na adresu ispitanika bio neuspešan, anketar može pokušati da stupi u kontakt sa ispitanikom telefonskim putem i ugovori termin kada ispitanik može da odgovara na anketu.

Kada su telefonske ankete u pitanju, problem mogu biti pogrešni brojevi (bilo da su pogrešno evidentirani ili je osoba promenila broj). Najčešći razlog nemogućnosti uspostavljanja kontakta telefonskim putem je vreme u kojem se pokušava ostvariti kontakt, ali problem mogu biti i ispitanici koji odbijaju pozive sa nepoznatih brojeva.

I u poštanskim anketama neodgovori mogu poticati iz različitih izvora. Može se desiti da potencijalni ispitanik ne dobije anketu ili poziv za anketu zbog netačne adrese ili greške poštanske službe. Ako pošiljka stigne na adresu, može je uzeti neko drugi, a ne osoba kojoj je namenjena. S druge strane, neke osobe i ne otvaraju poštu od nepoznatih pošiljalaca smatrajući je reklamnim materijalom... Kada osoba ipak primi anketni upit-nik ona može odbiti da odgovora na njega (što najčešće nećemo ni znati), a može rešiti da odgovori – pa zaboraviti da to uradi. Ispitanik čak može i odgovoriti na upitnik, ali zaboraviti da ga vrati (pošalje istraživaču).

Kada su u pitanju ankete ili pozivi na anketu poslati elektronskom poštom, pored neispravnih i zastarelih adresa, problem mogu predstavljati i prepuni „sandučići“ elektronske pošte. Dobra strana elektronske pošte je ta što ćemo vrlo brzo znati da poruka nije dostavljena i razlog zbog kojeg nije. Ukoliko adresa nije tačna pošiljalac će ubrzo dobiti poruku poput: „Mail Delivery Subsistem (Failiure)“ sa opisom razloga. Naj-češće je to nepostojeća adresa („The email account that you tried to reach does not exist“), ali može biti i prepuno elektronsko sanduče („Mailbox is full“). Ukoliko je adresa ispravna, problem mogu predstavljati sistemi za kontrolu neželjene elektronske pošte (engl. spam, junk mail). Ako poruka i prođe kontrolu ovih sistema, često je sam primalac klasifikuje kao takvu. Kada potencijalni ispitanik ipak otvori poruku koja mu je name-njena, dalje sve liči na situaciju sa klasičnom poštom. Ispitanik može odlučiti da ne odgovori, odnosno imaćemo slučaj odbijanja. S druge strane, može rešiti da odgovori, ali na to zaboraviti. Zato je korisno slati podsetnike onim ispitanicima od kojih nismo dobili nikakav odgovor.

Pokušaj kontakta poštom ili elektronskom poštom nema problema sa vremen-skim ograničenjima. Poziv i anketa upućena na ovaj način dostupni su ispitaniku od trenutka kada su im dostavljeni. Problem nastaje ukoliko nema odgovora. Tada istraži-vač ne može uvek znati da li ispitanik nije video anketu ili ne želi da odgovara.

Neodgovori nastali zbog neuspeha da se ostvari kontakt sa ispitanikom naj-češće nisu povezani sa predmetom merenja i nisu izvor pristrasnosti. Ispitanici nisu

Page 200: Bojan Janičić - digitalna.ff.uns.ac.rs

NEODGOVORI

189

videli anketu i nisu odbili učešće zbog njenog sadržaja. Međutim, i ovakvi neodgovori mogu nekada biti povezani sa predmetom merenja. Radi se o istraživanjima koja se odnose na varijable povezane sa varijablama koje utiču na dostupnost ispitanika (npr. zaposlenost van kuće, veličina domaćinstva i slično).

Sve prethodno odnosilo se na anketiranje domaćinstava i pojedinaca u njima. Situacija je malo drugačija ako su jedinice istraživanja organizacije (recimo firme). Što se tiče dostavljanja ankete, ovde je ređe problem vreme u kojem se pokušava kontakt. Jednostavno i jedino smisleno je pokušati da se ostvari kontakt u toku radnog vremena. Tu mogu biti problem neočekivani praznici ili događaji koji su specifični za organizaciju. Na anketu u ime organizacije obično odgovaraju osobe koje poseduju potrebne infor-macije. Nekada se radi o jednoj osobi, ali nekada ih može biti više, a identitet tih osoba najčešće nije unapred poznat istraživaču. U tom slučaju potrebno je ostvariti kontakt sa svima njima ili kontaktirati odgovornu osobu koja će dalje preuzeti na sebe pronalaže-nje osoba koje će zaista odgovarati na anketu. Problemi koji se mogu javiti slični su kao i kod anketa domaćinstava i pojedinaca. Često se ovakve ankete sprovode kao samoad-ministrirajuće, a tada kontaktiranje relevantnih osoba i dostavljanje ankete osobama koje će odgovarati zavisi od mehanizama u samoj anketiranoj organizaciji (De Leeuw et al., 2008).

8.3.1.1. Kako smanjiti broj neodgovora zbog neuspešnog dostavljanja ankete

Broj (i stopa) neodgovora koji zavise od neuspešnog dostavljanja ankete mogu se smanjiti preventivnim koracima u svakoj od faza u kojoj oni mogu nastati.

Neodgovori zbog neuspeha da ispitanik bude lociran najčešće su rezultat gre-šaka u kontakt podacima u okviru uzorkovanja. Okviri uzorkovanja mogu se poboljšati, ako se okvir uzorkovanja dopuni podacima koji postoje u nekim drugim dostupnim bazama podataka, a koje je moguće po nekom ključnom podatku (ili njihovoj kombina-ciji) povezati sa postojećim okvirom uzorkovanja. Moguće je i pripremiti sistem prona-laženja dodatnih kontakt podataka u fazi terenskog rada za ispitanike koje anketar nije uspeo da locira. Na istraživaču je da proceni da li je će to biti neophodno i da planira unapred (De Leeuw et al., 2008).

Tačnost kontakt podataka zavisi od tipa okvira uzorkovanja, ali i od osobina ciljne populacije. Od ciljne populacije zavisi da li će biti sklona češćem menjanju prebi-vališta, te da li će koristiti dodatne kanale komunikacije pomoću kojih će ih biti moguće locirati.

Na primer, mlađa populacija je sklonija menjanju prebivališta (makar to bila samo promena adre-se u okviru istog mesta stanovanja). Ređe će koristiti fiksne telefone, ali će zato češće koristiti mobilne telefone, elektronsku poštu i biće aktivniji na društvenim mrežama. Ovi drugi kanali komunikacije omogućavaju njihovo pronalaženje.

Kada su u pitanju tipovi kontakt podataka, adrese elektronske pošte se češće

Page 201: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

190

menjaju od brojeva mobilnih i fiksnih telefona, i ako podaci u okviru uzorkovanja nisu skorašnji, vrlo često mogu biti neaktivne. Ukoliko okvir uzorkovanja poseduje sve ove podatke, moguće je pokušati kontakt i pribavljanje potrebnog podatka različitim kana-lima.

Ispitanika možemo pozvati na mobilni telefon i pitati za adresu elektronske pošte. Poziv na onlajn anketu, ukoliko nam nije poznata imejl adresa, možemo uputiti i klasičnom poštom.

Kada je u pitanju uspostavljanje kontakta, stopa neodgovora može se umanjiti većim brojem ponovljenih pokušaja. Ponovljeni pokušaji moraju uključivati variranje u vremenu kontaktiranja. Neuspešan kontakt ne može biti proglašen neodgovorom uko-liko kontakt nije pokušan i radnim danom i vikendom, preko dana i u večernjim časo-vima (u svim mogućim kombinacijama). U anketama licem u lice, uobičajeno je da anke-tar pokušava da ostvari kontakt bar 4–5 puta, bar jednom radnim danom i bar jednom vikendom. U telefonskim anketama broj pokušaja je znatno veći i kreće se 12–15, pre nego što se slučaj proglasi neodgovorom.

Ukoliko je ostvaren kontakt sa drugom osobom iz domaćinstva (ili sa susedi-ma), važno je dobiti informaciju kada će potencijalni ispitanik najverovatnije biti dos-tupan i pokušati kontakt u to vreme. Ovakve ponovne kontakte potrebno je planirati. U telefonskim anketama softver za anketiranje obično poseduje mogućnost „zakazivanja“ kontakta. Slične rasporede je moguće i korisno kreirati i prilikom anketa licem u lice. Rasporedi kontaktiranja su korisni i kada nemamo „zakazane“ termine. Njima možemo kontrolisati variranje ponovnih pokušaja po danima u nedelji i dobu dana.

Kada su u pitanju ankete u kojima se upitnici (ili pozivi na onlajn anketu) šalju klasičnom poštom, preporuka je da koverte budu neupadljive, kako ih potencijalni ispi-tanici ne bi pobrkali sa reklamnom poštom.

U slučaju slanja anketa ili poziva na anketu putem imejla posebno su bitni podaci koji se nalaze u poljima „od“ (engl: sender ili from) i „tema“ (engl. subject). Nedo-statak detaljnih informacija o pošiljaocu i temi poruke može uticati da poruka sa pozi-vom na anketu bude obrisana pre nego što je primalac i otvori. Poruke od pošiljalaca koji kriju identitet primaoci često obrišu smatrajući ih neželjenom poštom ili iz straha od virusa. Ukoliko polje „tema“ ne zainteresuje, ili pak odbije potencijalnog ispitanika, kontakt neće biti ostvaren.

Stopa neodgovora biće manja ukoliko faza terenskog rada (prikupljanja poda-taka) traje duže. U tom slučaju biće moguće ostvariti kontakt i sa ispitanicima koji iz raznih razloga mogu biti odsutni na duže vreme, bez obzira na modalitet prikupljanja podataka.

Kada modaliteti prikupljanja podataka uključuju anketare, njih je bitno motivi-sati da ulože dodatne napore da ostvare kontakt. To se može učiniti kroz obuku, ali je dobrodošla i materijalna nadoknada. Anketari se mogu motivisati tako što im se dode-ljuje nagrada za ostvarenu ciljnu stopu kontakta (broj ostvarenih kontakta / veličina

Page 202: Bojan Janičić - digitalna.ff.uns.ac.rs

NEODGOVORI

191

uzorka dodeljenog anketaru). Naravno, to povećava cenu istraživanja, što je često prob-lem.

8.3.2. Neodgovori zbog odbijanja

Odbijanje (engl. refusal) se odnosi na neodgovore koji su nastali nakon stupa-nja u kontakt sa ispitanikom.

Prilikom odlučivanja da li će prihvatiti učešće u anketi potencijalni ispitanik uzima u obzir razne činioce. Neki od bitnih činilaca su: zanimljivost teme, učestalost prilika da se učestvuje u anketi, autoritet organizacije koja sprovodi anketu, procena za čega će se podaci koristiti, poverenje u anketara, poverljivost podataka, postojanje pod-sticaja (nagrade), socijalna validacija...

Tako, na primer, osoba će pre prihvatiti učešće u anketi ukoliko je zaintereso-vana za temu istraživanja nego ako se radi o temi o kojoj nema nikakvo mišljenje. Isto tako, neko ko nema često priliku da iskaže svoje mišljenje, lakše će se opredeliti da učestvuje u anketi, nego neko ko često ima priliku da bude anketiran i kome to već može predstavljati opterećenje. Osim toga, bitno je i shvatanje potencijalnog ispitanika kako će dobijeni podaci biti iskorišćeni. Pored toga što osobi može biti bitno da neko čuje njeno mišljenje, ukoliko smatra da to neće uticati da se po tom mišljenju i dela, manje je verovatno da će pristati na učešće.

Autoritet organizacije koja sprovodi anketno istraživanje takođe može biti zna-čajan. Osoba će pre pozitivno odgovoriti na zahtev za učešće u anketi ako on dolazi od nekoga ko ima pravo da takav zahtev postavi. Ispitanik će pre prihvatiti učešće u anketi ukoliko ga sprovodi neka renomirana institucija (vladina agencija, univerzitet, poznata agencija za istraživanje javnog mnjenja), nego ako iza njega stoji neka lokalna firma (npr. picerija59) .

Nekada, iskreno odgovaranje na pitanja postavljena u anketi (posebno ako su osetljiva) može ugroziti samog ispitanika tako što će ga inkriminisati. Sličan je slučaj u istraživanjima koja se provode u državama u kojima su na vlasti autoritarni režimi. Iskrenim odgovaranjem ispitanik se možda ne bi inkriminisao u pravom značenju te reči, ali kod njega bi se mogla javiti bojazan da bi mogao doći u nemilost režima što bi ga moglo i egzistencijalno ugroziti, te će, ukoliko nema poverenja u anketara i organiza-ciju koja sprovodi anketu, radije izbeći učešće. U tom slučaju, da bi se ipak opredelio za učešće u anketi, potencijalni ispitanik mora imati potpuno poverenje u poverljivost informacija koje daje anketaru.

Ukoliko nema kontakta sa anketarom, kao u anketama poslatim poštom ili onlajn anketama, do izražaja dolazi tema istraživanja. Naime, ispitanik tada može da pregleda pitanja i da se odluči na osnovu sadržaja ankete. Ukoliko ispitanika ne zanima

59 Mada, ukoliko kao nagradu za učešće ponude neki od svojih proizvoda...

Page 203: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

192

tema ili smatra da mu odgovaranje može štetiti, on može odbiti učešće.

Ne postoji pravilnost u tome koji od ovih činilaca ima najveći značaj prilikom odluke ispitanika da učestvuje u anketi ili ne. Sve zavisi od ličnih uverenja potencijalnog ispitanika, ali i od toga koji od činilaca bude istaknut u inicijalnom kontaktu sa anketa-rom ili anketnim materijalom. S obzirom da svoju odluku potencijalni ispitanik donosi veoma brzo, jasno je da ne razmatra sve moguće razloge već samo one koji su mu u tom trenutku najbitniji (Groves, 2009).

U zavisnosti od modaliteta prikupljanja podataka, sa ili bez učešća anketara, različiti činioci mogu doći u prvi plan. Prilikom predstavljanja, anketari mogu istaći neke informacije poput značaja teme ili autoriteta organizacije koja sprovodi istraživa-nje. S druge strane, takve stvari mogu se postići u poštanskim i onlajn anketama istica-njem određenih sadržaja u odnosu na druge. Na primer, može se akcenat staviti na logo organizacije koja sprovodi istraživanje, prikazati potpis osobe koja je povezana sa istra-živanjem, a čiji autoritet može privoleti potencijalne ispitanike da učestvuju. Takođe, zanimljivija i manje osetljiva pitanja se mogu postaviti pri početku kako bi se potenci-jalni ispitanik zainteresovao, ili (u slučaju osetljivih pitanja) bar ne bi odvratio od učešća.

Međutim, postoje i neke pravilnosti koje se odnose na socio-demografske oso-bine ispitanika, ali i osobine anketara i nacrta istraživanja. Na primer, učešće u anketa-ma će češće odbijati muškarci, osobe koje žive same u domaćinstvu, osobe iz urbanih područja, a odbijanje će biti češće ako su anketari neiskusni i ako ispitanicima nisu ponuđeni podsticaji za učešće (Groves & Couper, 1998; T. W. Smith, 1983). Ukoliko je organizator ankete vlada, stopa odgovora će obično biti veća nego ako istraživanje organizuje neka akademska ili komercijalna institucija. U anketama sa samodministra-cijom, stopa odbijanja će biti veća što je anketa duža. Osim toga, stopa neodgovora biće veća što je manja interakcija anketara i ispitanika. Drugim rečima, u modalitetima koji ne zahtevaju učešće anketara (npr. poštanske i onlajn ankete) stopa neodgovora će biti veća nego u modalitetima u kojima su prisutni anketari (licem u lice, telefonske). Tako-đe, u anketama licem u lice odbijanje će biti manje nego u telefonskim anketama (De Leeuw et al., 2008).

Na neke od ovih činilaca istraživač nema uticaja, ali na neke ima. Sociodemo-grafske karakteristike potencijalnih ispitanika (pol i mesto stanovanja...) nisu pod kon-trolom istraživača, ali osobine anketara i nacrt istraživanja jesu.

Kada je glavni premet istraživanja ankete povezan (koreliran) sa nekim od gore navedenih činilaca, uvek možemo očekivati postojanje pristrasnosti anketnih statistika.

Na primer, ukoliko nas zanima prosečan prihod po članu domaćinstva, činjenica da muški, stano-vnici urbanih područja, te osobe koje žive same češće odbijaju učešće (uz činjenicu da je one koji žive sami teže i kontaktirati), može dovesti do pristrasnih procena.

Page 204: Bojan Janičić - digitalna.ff.uns.ac.rs

NEODGOVORI

193

Naime, u samačkim domaćinstvima prihod se ne deli i na članove koji sami ne ostvaruju nikakav prihod. Osim toga, ako pretpostavimo da su primanja obično viša u urbanim područjima, a muš-karci u proseku imaju viša primanja od žena, svi ovi činioci mogli bi dovesti do potcenjivanja pro-sečnog prihoda po članu domaćinstva.

Kada se odbijanje desi tek nakon što je ispitanik video ili čuo pitanja, odnosno saznao šta je predmet istraživanja, možemo biti prilično sigurni da nije slučajno. Ovakvo odbijanje je najštetnije i utiče na pristrasnost anketnih pokazatelja.

8.3.2.1. Kako smanjiti broj neodgovora zbog odbijanja

Potencijalni ispitanik odluku o učestvovanju (ili ne) u anketi donosi vrlo brzo nakon što mu je predočen zahtev za učešćem. Međutim, inicijalno odbijanje ne mora biti trajno. U ponovnom kontaktu dobar deo (25–40%) ispitanika koji su odbili učešće ipak prihvati (Groves, 2009), odnosno dolazi do konverzije odbijanja.

Prilikom odlučivanja da li će prihvatiti ili odbiti učešće u anketnom istraživa-nju, potencijalni ispitanik obično meri dobre i loše strane učešća u anketi i ukoliko pre-vagnu one loše, verovatno će odbiti da učestvuje. Zato je dobro da anketar prilikom pristupanja potencijalnom ispitaniku naglasi dobre strane, umanji loše i posveti pažnju činiocima koje izazivaju zabrinutost kod ispitanika (De Leeuw et al., 2008)60.

Ispitanike najčešće odbija vreme potrebno za popunjavanje ankete. Stoga, ankete ne bi smele da budu predugačke. Ukoliko je neku informaciju moguće dobiti pomoću pitanja sa ponuđenim odgovorima, onda nema razloga da se koriste pitanja otvorenog tipa. Ispitanici lakše i brže odgovaraju na pitanja zatvorenog tipa. Rezultat je da anketa sa pitanjima zatvorenog tipa traje kraće od ankete sa istim brojem pitanja otvorenog tipa. Gledano s druge strane, u jedinici vremena ispitanik će odgovoriti na više pitanja zatvorenog nego otvorenog tipa. Korišćenjem ovakvog tipa pitanja istraži-vač može bolje pokriti domen istraživanja za manje vremena uz manju stopu odbijanja.

Ukoliko ispitaniku ne odgovara da anketu radi u vreme kada je kontaktiran, anketar bi trebalo da bude spreman da dođe ponovo, najbolje u prethodno dogovore-nom terminu u kome ispitaniku to najviše odgovara.

Jedna od stvari koja može izazivati legitimnu zabrinutost kod ispitanika je pita-nje anonimnosti. Anonimnost ne podrazumeva da istraživaču nije poznat identitet ispi-tanika. Ona se pre odnosi na upotrebu i poverljivost podataka. Ispitanika je potrebno uveriti u to da niko van istraživačkog tima neće biti u mogućnosti da poveže odgovore koje je dao sa njegovim imenom (poglavlje 12, a posebno 12.4.3).

Kada su u pitanju ankete tipa licem u lice, nekada potencijalni ispitanici ne žele da puste nepoznatu osobu u kuću. Zato je potrebno da anketari nose dokumente kojima

60 Doduše, preporuka De Leva (De Leeuw) da se umanji značaj loših strana

istraživanja donekle se kosi sa etičkim načelima navedenim u poglavlju 12.

Page 205: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

194

se mogu identifikovati. Dobra je praksa da se (ukoliko je to moguće) ispitanicima poša-lje pismo kojim se najavljuje dolazak anketara. U takvom pismu potrebno je ukratko opisati svrhu istraživanja, reći da će dati odgovori biti poverljivi i ostaviti kontakt poda-tke osobe koju potencijalni ispitanici mogu kontaktirati i proveriti navedeno. Dobro je da takvo pismo ima zaglavlje sa zvaničnim znakom organizacije koja sprovodi istraživanje.

U zavisnosti od modaliteta prikupljanja podataka (uz učešće anketara ili samo-administracija), ove informacije moraju biti prenete ispitaniku na različite načine. Uko-liko modalitet uključuje anketare (licem u lice i telefonska), oni su ti koji će preneti ove informacije i stoga je potrebno da budu i obučeni za to. Ako modalitet ankete uključuje samoadministraciju, to mora biti učinjeno drugim putem. U poštanskim anketama ispi-tanicima se osim upitnika šalje propratno pismo koje sadrži bitne informacije o nameni i organizatoru istraživanja, poverljivosti podataka i slično. Uz propratno pismo i upit-nik, moguće je poslati i brošuru koja šire objašnjava značaj istraživanja i dobrobiti koje mogu biti ostvarene na osnovu njega. U onlajn anketama situacija je slična samo je medij drugačiji.

Psihološki konstrukti koji su povezani sa pristajanjem na učešće u anketi su udovoljavanje zahtevima, pomagačke tendencije i promena mišljenja (Cialdini, 2007).

Prilikom odlučivanja da li će udovoljiti nekom zahtevu ljudi obično razmatraju dobre i loše strane aktivnosti koja se od njih zahteva. Ukoliko prevagnu dobre strane osoba će udovoljiti zahtevu, u suprotnom neće. Postoje mišljenja (Cialdini, 2007) da osim svojstava zahtevane aktivnosti, na odluku utiču i drugi faktori. Ćaldini (Cialdini, 2007) navodi šest principa koji utiču na to da li će ljudi odlučiti da udovolje nekom zah-tevu, pa i zahtevu za učešće u istraživanju.

Tih šest principa su: recipročnost (engl. reciprocation), konzistencija ili dos-lednost (engl. consistency), socijalna validacija (engl. social validation), autoritet (engl. authority), retkost (engl. scarcity) i sviđanje (engl. liking).

Princip recipročnosti bazira se na društvenoj normi da se prema drugima ponašamo u skladu sa onim kako se ponašaju prema nama. U kontekstu pristanka na učešće u anketnom istraživanju to znači da će osoba radije pristati da učestvuje ukoliko to učešće vidi kao oduživanje za ranije primljen poklon, uslugu ili ustupak (Groves, Cialdini, & Couper, 1992). Pokloni, usluge ili ustupci kojima potencijalne ispitanike možemo privoleti na učešće mogu biti materijalne prirode, ali ne moraju. Česta je prak-sa da anketari ispitanicima za učešće u anketi nude male poklone (upaljače, priveske, kredit za razgovore mobilnim telefonom). Moguće je ispitanike i platiti za učešće u anketi. Iznosi koji se daju ispitanicima ne moraju uopšte biti veliki. Jedno istraživanje podsticaja za učešće u poštanskim anketama sprovedeno u Kanadi (Warriner, Goyder, Gjertsen, Hohner, & McSpurren, 1996) pokazalo je da povećanje iznosa koji se daje

Page 206: Bojan Janičić - digitalna.ff.uns.ac.rs

NEODGOVORI

195

ispitaniku ne doprinosi proporcionalno povećanju stope odgovora. Naime, u ovom eksperimentu potencijalni ispitanici su podeljeni u 4 grupe prema količini novca koji su dobili za učešće u poštanskoj anketi. Njima su unapred, zajedno sa upitnikom, u koverti slali iznose od 2, 5 i 10 kanadskih dolara. Kontrolnoj grupi nisu slali novac. U svakoj od ovih podgrupa postojale su i podgrupe kojima je obećano da će u njihovo ime u dobrot-vorne svrhe biti uplaćeni različiti iznosi. Radilo se o istim iznosima od 2, 5 i 10 dolara. Jednoj podgrupi nije obećano da će biti uplaćen bilo kakav iznos u dobrotvorne svrhe. Osim toga, postojala je i peta podgrupa kojoj je rečeno da će svi oni koji prihvate učešće u anketi učestvovati u lutriji na kojoj će petoro učesnika dobiti po 200 dolara. Na ovaj način kombinacijom eksperimentalnih uslova stvoreno je ukupno 20 (4x5) različitih grupa. Ukoliko se posmatra samo uticaj iznosa koji je unapred isplaćen ispitanicima (što nas ovde zanima jer predstavlja osnovu za princip recipročnosti), grupa kojoj je plaćeno 2 dolara imala je značajno veću stopu odgovora (71,8%) od grupe kojoj nije ništa plaćeno (63,1%). U grupi kojoj je uplaćen iznos od 5 dolara, stopa odgovora bila je za 5,1% viša nego u grupi kojoj je plaćeno 2 dolara (ukupno 76,9%). Međutim, grupa kojoj je plaćen duplo veći iznos (ukupno 10 dolara) nije se značajno razlikovala od gru-pe kojoj je plaćeno 5 dolara. Stopa odgovora u ovoj grupi bila je za samo 0,7% viša (ukupno 77,6%). Obećanja u vezi sa uplatama u dobrotvorne svrhe i mogućnost učes-tvovanja u lutriji za mnogostruko veći iznos nisu dala pozitivnog efekta na povećanje stope odgovora. Mogućnost dobitka većeg iznosa na lutriji takođe nije pozitivno delova-la na stopu odgovora, mada autori navode studije u kojima jeste. Iz toga izvode zaklju-čak da efekat lutrije zavisi od teme istraživanja.

Kao što je već rečeno, princip recipročnosti se može pobuditi i nematerijalnim putem. Na pojavu reciprociteta i povećane stope odgovora koja iz njega proizilazi mogu uticati i prethodna informativna pisma anketara, podela lifleta i brošura, upoznavanje ispitanika sa koristima koje od istraživanja može imati, a ponekad je dovoljan neki kompliment ili lepa reč od strane anketara pre samog zahteva za učešće u anketi. Ukoli-ko ispitanik odbije učešće u dugačkoj anketi, ponudu za učešće u skraćenoj verziji ispi-tanik može doživeti kao ustupak i pobuditi princip recipročnosti i privoleti ga za učešće.

Princip konzistentnosti bazira se na potrebi pojedinca da bude dosledan u svo-jim stavovima, uverenjima i ponašanju.

Iz perspektive učešća u anketnom istraživanju to bi značilo da ukoliko anketar osobi ukaže da je učešće u anketi konzistentno sa njenim stavovima, uverenjima, i ponašanjem, postoji veća šansa da ta osoba prihvati učešće u istraživanju. Pozivanje na stavove i uverenja osobe imaće jači uticaj ukoliko ih je ona ispoljila u razgovoru nepos-redno pre postavljanja zahteva za učešće u anketi.

Na primer, u slučaju da istraživanje organizuje neka državna agencija, a osoba kaže da ne želi da odgovara jer nije zadovoljna radom vlade, anketar bi mogao istaći da je dobro što se osoba inte-resuje za bolji rad vlade i napomenuti da bi svojim odgovorima mogla pomoći da se unapredi fun-kcionisanje države.

Page 207: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

196

Ukoliko osoba kaže da je već učestvovala u anketama, anketar može reći da je vrlo dobro što osoba prihvata učešće u anketama i na taj način pobuditi princip konzistentnosti.

Ako anketar uspe da privoli ispitanika da odgovori na neko pitanje, makar i naj-jednostavnije i ne preterano bitno, ta osoba se stavlja u ulogu ispitanika, odnosno poči-nje da sebe tako doživljava i postaje verovatnije da će prihvatiti da odgovara na ostatak ankete. Pristajanje osobe na male početne zahteve dovešće do lakšeg pristajanja i na naknadne veće zahteve (Groves & Couper, 1998).

Princip socijalne validacije bazira se na sklonosti ljudi da kada formiraju svoje stavove i uverenja ili odlučuju o tome kako da postupaju, porede sebe sa referentnom grupom, odnosno drugim sličnim ljudima i njihovim stavovima, uverenjima i postupci-ma. U kontekstu prihvatanja učešća u anketnom istraživanju to znači da će osoba vero-vatnije prihvatiti učešće u anketi ako misli da i drugi ljudi slični njoj obično prihvataju učešće.

Intervencija anketara koja bi mogla da pobudi ovaj princip bi se mogla predstaviti sledećom reče-nicom: „Dobar dan... Baš sam pričao/la sa vašim komšijom iz broja...“

Princip autoriteta zasniva se na činjenici da ljudi lakše pristaju na zahteve koji dolaze od nekoga za koga smatraju da ima pravo da im takav zahtev i postavi.

Princip autoriteta pretpostavlja da će osoba lakše pristati na učešće u istraži-vanju ako iza istraživanja stoji neka organizacija koja ima legitimitet da ga vrši. To su obično državne (vladine) organizacije, obrazovne i akademske institucije, komercijalne organizacije. Međutim, ukoliko osoba doživljava da organizator istraživanja nema legi-timitet, to će smanjiti verovatnoću da prihvati učešće.

Naravno, da bi se pobudio princip autoriteta nije dovoljno da taj autoritet stoji iza istraživanja, već je potrebno da potencijalni ispitanik bude o tome informisan. Uko-liko istraživanje uključuje anketare, potrebno je da pre postavljanja zahteva za učešće u anketi oni o tome obaveste potencijalnog ispitanika. Ukoliko anketa podrazumeva ins-trumente sa samoadministracijom, potrebno je da informacija o organizatoru istraživa-nja bude istaknuta u uvodnom delu u kojem se potencijalni ispitanik obaveštava o samom istraživanju.

Princip retkosti bazira se na pojavi da se retke prilike doživljavaju kao vredni-je. Osoba će verovatnije pristati da učestvuje u anketi ako joj se ta prilika prikaže kao retka šansa da iskaže svoje mišljenje i da se njen glas čuje i uvažava. Takođe je korisno potencijalnom ispitaniku reći da je on jedan od retkih koji će imati priliku da izrazi svo-je mišljenje61.

Sviđanje, kao poslednji od navedenih principa, bazira se na činjenici da su ljudi 61 To je u najvećem broju anketnih istraživanja i tačno. Ukoliko biramo uzorak

od 1.000 ispitanika iz neke populacije od 7.000.000, to znači da će biti izabran jedan ispitanik na svakih 7.000.

Page 208: Bojan Janičić - digitalna.ff.uns.ac.rs

NEODGOVORI

197

skloniji da pristaju na (bilo kakve) zahteve od osoba koje im se sviđaju, u odnosu na zahteve od osoba koje im se ne sviđaju. U kontekstu anketnih istraživanja sviđanje se može odnositi na anketara, ali i na organizaciju koja stoji iza istraživanja.

Kada su u pitanju anketari, činioci koji utiču na viši intenzitet sviđanja su: slič-nost ispoljenih stavova, poreklo, saradljivost i fizička privlačnost (Groves et al., 1992). Anketar koji poseduje više ovih kvaliteta će lakše pridobiti potencijalne ispitanike da učestvuju u istraživanju.

Kada su u pitanju pomagačke tendencije, uočeno je da kada neko apeluje za pomoć, pored gore navedenih opštih principa udovoljavanja zahtevima, u igru ulaze još neki činioci, pre svega društvena norma da je dobro pomoći drugima. Apelujući na pomoć potencijalnih ispitanika jednostavnom rečenicom „Vaše učešće bi nam bilo od velike pomoći!“, ili nekom sličnom, oni se mogu privoleti da učestvuju u anketi. U istra-živanju Movena i Ćaldinija (Mowen & Cialdini, 1980) dodavanjem ovakve rečenice na kraj zahteva za učešće u anketi ostvareno je povećanje stope odgovora u proseku za oko 6%, a kod kraćih anketa 18,7%.

Koliko će apel za pomoć imati efekta zavisi i od emotivnog stanja potencijalnih ispitanika. Kod ljutih on čak može imati negativan efekat, kod veselih će imati pozitivan, a ukoliko je potencijalni ispitanik tužan efekat će zavisiti od toga koliko anketa zahteva truda od strane ispitanika. Ukoliko je to opterećenje veliko, apel za pomoć će kod tužnih ispitanika imati negativan efekat, ukoliko je opterećenje malo – pozitivan (Groves et al., 1992).

To, na primer, implicira da ukoliko anketar vidi da je potencijalni ispitanik ljut, više šanse da ga privoli na učešće u anketi imaće ako dođe drugi put, nego da apeluje za pomoć...

Spremnost za promenu mišljenja (pa i mišljenja o anketi) takođe podleže pod uticaj šest principa koje navodi Ćaldini. Međutim, spremnost osobe da promeni mišlje-nje na osnovu argumenata zavisiće i od toga koliko joj je tema bitna. Kada je osoba zain-teresovana za temu, ona će biti spremna da mišljenje promeni na osnovu iznetih argu-menata i njihove logičnosti i istinitosti. Međutim, kada nije zainteresovana za temu, osoba će svoje mišljenje formirati na osnovu površnih i manje pouzdanih osobina komunikacije (odnosno, mišljenje će menjati više pod uticajem šest Ćaldinijevih princi-pa).

Iskusni anketari navedene principe često koriste u praksi u vidu tzv. krojenja ankete (engl. tailo-ring) i metode održavanja interakcije (engl. maintaining interaction).

Krojenje je pristup u kojem anketar na osnovu uvida u osobine potencijalnih ispitanika prilago-đava svoj pristup. Na primer, anketar može prilagoditi svoj izgled i nastup kako bi se prikazao slič-nim ispitanicima iz oblasti koja mu je dodeljena i na taj način pobudio princip sviđanja. Može manje ili više naglašavati značaj organizatora ankete ukoliko ima saznanja o tome da li je on među ispitanicima doživljen kao legitimni autoritet ili ne. Na osnovu informacija koje ima o ispi-tanicima može potencirati određene aspekte ankete kako bi pobudio princip konzistencije.

Page 209: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

198

Pristup održavanja interakcije bazira se na principu konzistencije. U ovom pristupu anketar se trudi da ispitanika ne navede na prerano odbijanje. Nastoji da u interakciji sa ispitanicima dobije što manje negativnih odgovora, a što više pozitivnih. Na taj način uvodi osobu, člana uzorka, u ulogu ispitanika koju će on teže napustiti što je više vremena bio u njoj. Osim toga, produžena interakcija omogućava anketaru da prikupi veći broj informacija koje mogu predstavljati osnovu za krojenje ankete.

8.3.3. Neodgovori zbog nemogućnosti davanja odgovora

Nekada neodgovori nastaju kao rezultat činjenice da ispitanik nije u mogućnos-ti da dâ odgovor. Razlozi za to mogu biti razni.

Ispitanici mogu imati zdravstvenih problema koji ih onemogućavaju da pruže odgovor. Ti problemi mogu biti fizičke, ali i psihičke prirode. Osim toga, u anketama sa samoadministracijom pismenost ispitanika može biti limitirajući faktor. U svim modali-tetima anketa nepoznavanje jezika na kojima je anketa dostupna može onemogućiti ispitanika da učestvuje. Kada su u pitanju ankete u kojima su jedinice istraživanja orga-nizacije, iako postoji želja da učestvuju u anketi, moguće je da ne poseduju potrebne informacije i ne mogu da ih pribave za vreme trajanja ankete.

Neodgovori koji proističu iz nemogućnosti ispitanika da odgovore mogu, ali ne moraju, biti povezane sa predmetom merenja i samim tim mogu, ali ne moraju, uticati na pristrasnost anketnih statistika.

Na primer, ukoliko je za istraživanje bitno mišljenje nacionalnih manjina i imi-granata, neodgovori koji potiču od nepoznavanja jezika mogu uticati da anketni statisti-ci budu pristrasni. Isto tako, ako je predmet istraživanja povezan sa nivoom obrazova-nja, neodgovori koji su uzrokovani nedovoljnom pismenošću potencijalnih ispitanika mogu uticati da anketni statistici budu pristrasni. Neodgovori zbog nedovoljne pisme-nosti mogu uticati i na pristrasnost pokazatelja koji se tiču materijalnog statusa. Neob-razovane osobe su po pravilu lošijeg materijalnog statusa pa će samim tim neodgovori osoba nižeg materijalnog statusa uticati na pristrasnost anketnih pokazatelja. Neodgo-vori zbog zdravstvenih problema su češći kod starije populacije. Ukoliko je predmet merenja ankete povezan sa starošću, trebalo bi obratiti pažnju na neodgovore iz ovog izvora.

8.3.3.1. Kako smanjiti broj neodgovora zbog nemogućnosti ispitanika da daju odgovore

Na zdravstveni status ispitanika nije moguće uticati i neki od ispitanika neće biti u mogućnosti da daju odgovor ma šta mi učinili. Ono što istraživač može da učini je da prilagodi anketu ispitaniku.

Kada su u pitanju nepismeni ispitanici koji ne mogu da odgovaraju na samoa-dministrirajućim anketama, promena modaliteta prikupljanja podataka može učiniti da oni ipak mogu da odgovaraju. Umesto u pismenom obliku, kod njih se anketa može

Page 210: Bojan Janičić - digitalna.ff.uns.ac.rs

NEODGOVORI

199

implementirati u formi licem u lice ili telefonskim putem, u kojima anketar čita pitanja i beleži odgovore. Isto važi i za slepe ispitanike.

Suprotan slučaj imamo kada su u pitanju gluvoneme osobe. Ukoliko je u pitanju anketa u kojoj anketar čita pitanja i beleži odgovore, moguće je anketu pripremiti u formi za samoadministraciju (štampana, računarski podržana) i/ili poslati anketara koji poznaje znakovni jezik.

Ukoliko zdravstveno stanje ispitanika ne dozvoljava ispitaniku da odgovara na dugačku anketu ili mu onemogućava dužu koncetraciju, moguće je ispitaniku ponuditi da na anketu odgovara u delovima ili da odgovara samo na deo pitanja.

Već prilikom planiranja ankete trebalo bi uzeti u obzir mogućnost da postoji veći broj ispitanika koji ne govori primarni jezik ankete. Za takve ispitanike anketu je potrebno prevesti na jezik koji razumeju (najbolje na njihov maternji). U multinacio-nalnim sredinama se anketa obično prevodi na jezike nacionalnih manjina i to najčešće nije problem. Problem su jezici koji na teritoriji na kojoj se vrši anketa nisu tako česti. Ukoliko je moguće potrebno je anketu prevesti na jezik ispitanika ili poslati anketara koji dobro poznaje taj jezik. Prilikom pisanja anketnih pitanja velika pažnja obraća se na formulaciju pitanja, pazeći na svaku reč. Stoga, prevod ankete na licu mesta nije naj-bolje rešenje. Ipak, u slučaju da je anketa dobro planirana, broj ovakvih ispitanika ne bi trebalo da bude prevelik.

8.4. Modalitet prikupljanja podataka i neodgovori

Stopa odgovora može zavisiti od modaliteta prikupljanja podataka. Grouvs (Groves, 2009) navodi veći broj istraživanja razlike u stopi odgovora u zavisnosti od modaliteta. Ono što se može izvući kao opšti zaključak je da stopa odgovora zavisi od stepena interakcija anketar–ispitanik. Stope odgovora su veće u modalitetima istraži-vanja u kojima je ta interakcija veća. Najveće stope odgovora su u istraživanjima licem u lice, pa zatim u telefonskim anketama. Sledeće po stopi odgovora su poštanske ankete, a za njima imejl i onlajn ankete.

Razlog za ovakvo stanje nalazi se u kanalima koji su istraživaču dostupni da smanji broj neodgovora. Ovi kanali su vrlo ograničeni kod samoadministrirajućih anke-ta.

Problemi u vezi sa lociranjem ispitanika mogu nastati u svim modalitetima, ali u modalitetima sa ličnim kontaktom oni su očigledniji. Ukoliko anketar poseti adresu na kojoj bi trebalo da se nalazi ispitanik on može videti da se on odselio i pokušati da nađe novu adresu. Sličan slučaj je i sa telefonskim pozivima. Kada su u pitanju poštanske ankete promena adrese ispitanika može proći i neopaženo. Tako je i sa imejl anketama. Ukoliko je imejl adresa nepostojeća, pošiljalac će obično dobiti poruku koja na to upo-zorava. Međutim, ukoliko je adresa ispravna, ali je korisnik više ne koristi, to nećemo znati i nećemo moći da korigujemo.

Page 211: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

200

Kada je kontakt uspostavljen, mnogo je širi repertoar tehnika koje anketar ima u ličnom kontaktu sa ispitanikom nego kada je anketu potrebno predstaviti samo pis-menim putem. U ličnom kontaktu anketar može svoj pristup da prilagođava u zavisnos-ti od karakteristika i reakcija potencijalnog ispitanika. U neposrednom kontaktu komu-nikacija nije ograničena samo na govornu pa su signali na koje može reagovati anketar brojniji i pružaju mu više informacija na osnovu kojih može prilagoditi pristup. To je u skladu sa nalazima da je stopa odgovora veća u anketama licem u lice nego u telefon-skim anketama (De Leeuw et al., 2008; Groves, 2009).

Kada se porede različiti modaliteti samoadministrirajućih anketa, klasične poš-tanske ankete imaju veće stope odgovora od elektronskih varijanti (onlajn i imejl). Prema jednoj metaanalizi (Cook, Heath, & Thompson, 2000) 68 anketnih istraživanja obavljenih upotrebom elektronskih modaliteta prikupljanja podataka (onlajn/web i imejl), činioci od kojih će najviše zavisiti stopa odgovora u ovakvim modalitetima su broj ponovljenih kontakata i njihova personalizacija.

Naime, kada potencijalnim ispitanicima šaljemo ankete imejlom ili im šaljemo poziv da pristupe anketi na nekoj web adresi, obično ih je neophodno nekoliko puta podsetiti da to urade. Određen broj ispitanika će odgovoriti na anketu posle prvog kon-takta, ali veliki deo njih neće. To još uvek ne znači da su odbili učešće u anketi. Moguće je samo da im to u tom trenutku nije bilo zgodno. Kako ljudi svaki dan primaju veće količine imejlova, vrlo je moguće da poruka (označena kao pročitana) bude potisnuta velikim brojem novopristiglih. Čak će i ispitanik koji je rešio da odgovori na anketu, poruku sa pozivom vrlo lako zanemariti. Zato je korisno onima koji nisu odgovorili pos-lati podsetnik. U istraživanju Kitlsona (Kittleson, 1997) podsetnici su duplirali stopu odgovora u imejl anketi (sa 30 na 60%). Naravno, ovaj efekat nije uvek toliki, ali svaka-ko nije zanemarljiv.

U softveru za onlajn anketiranje (poput LimeSurveya i OneClickSurveya) je to prepoznato i postoji mogućnost planiranja većeg broja podsetnika uz kontrolu da li je ispitanik odgovorio ili ne. Nakon slanja podsetnika primetan je porast broja novih odgovora koji se polako smanjuje kako vreme odmiče. Najviše efekta imaće prvi podse-tnik, a svaki sledeći sve manje. Potrebno je planirati 4–5 podsetnika, pravilno vremen-ski raspoređenih, za vreme trajanja ankete. Korisno je voditi računa da poziv na anketu i podsetnici ne padaju na praznike jer će im efekat tako biti manji. Dobro je obratiti pažnju i na povratne mejlove/poštu od strane ispitanika. Ako ispitanik pošalje izričitu poruku da ne želi da učestvuje u anketi, onda mu više ne bi trebalo slati podsetnike. Isto važi i za slučajeve kada od drugih osoba dobijemo povratnu informaciju da traženi ispi-tanik nije u stanju da odgovara na anketu zbog bolesti, smrti ili nekog drugog razloga.

Personalizacija poziva je takođe bitan činilac koji utiče na odziv ispitanika. Naravno, ona je moguća u slučajevima kada smo u uzorak birali tačno određene osobe, odnosno kada su nam poznata njihova imena. Verovatnije je da će ispitanik odgovoriti kada mu se obratite po imenu i/ili prezimenu. U istraživanju Solkvista i saradnika

Page 212: Bojan Janičić - digitalna.ff.uns.ac.rs

NEODGOVORI

201

(Sahlqvist et al., 2011) personalizovani podsetnik povećao je stopu odgovora za 44%.

Socijalni pritisak je veći kada pozovete imenom Bojana Janičića i kažete da je baš on odabran da učestvuje u anketi i da se baš njemu (a ne „nekom/oj“ „poštova-nom/oj“) ukazala prilika da kaže svoje mišljenje o važnom pitanju koje anketa obrađu-je. Ovo je takođe prepoznato i implementirano u softveru za onlajn anketiranje.

Personalizacija poziva ne podrazumeva da istraživač (odnosno istraživački tim) piše posebne poruke za svakog ispitanika. U krajnjem slučaju dovoljno je da u zaglavlju poruke stoji obraćanje konkretnom ispitaniku, poput „Poštovani Bojane“. Kao što je rečeno, softver za anketiranje (LimeSurvey, OneClickSurvey), ali i mejl klijenti (poput Thunderbirda, Microsoft Outlooka), pa čak i Gmail, omogućavaju jednostavno slanje personalizovanih poruka. Kada su u pitanju mejl klijenti, obično je potrebno instalirati neki dodatak (engl. add-in, extension), a njih je najlakše pronaći iz samog softvera pretragom dodataka preko ključne reči MailMerge.

Bilo da se radi o softveru za anketiranje ili o mejl klijentima, postupak personalizacije mahom se obavlja na isti način.

Kao prvo, potrebno je da postoji spisak osoba kojima želimo da pošaljemo poruku. Ovaj spisak je obično u vidu csv (comma separated values) datoteke. To je obična tekstualna datoteka koja sadrži posebna polja odvojena zarezima (mada u zavisnosti od regionalnih podešavanja sistema mogu biti i drugi znaci). Može se uređivati u Microsoft Excelu i sličnim programima za tabeliranje (npr. LibreOffice Calc) ili u programima za uređivanje teksta poput Notepada ili Notepad++. Dato-teka mora sadržavati bar polja sa imejl adresom i imenom ispitanika, mada su moguća i druga polja. Imejl poruka se personalizuje tako što se u polje „Za“ (engl „To:“) umesto imejl adrese uno-si naziv varijable, odnosno naziv polja u kojem je na spisku smeštena imejl adresa. Obično se to radi tako što se naziv varijable unosi u jednostruke ili dvostruke vitičaste zagrade (ovo zavisi od softvera). Na primer: {{imejl}}.

Kao temu (subject) poruke istraživač može uneti tekst koji želi, mada je i tu moguća personalizaci-ja.

U telu poruke istraživač takođe može uneti varijable. Npr, ako želi (a želi) da se obrati ispitaniku po imenu može staviti „Poštovani {{ime}}“ , a softver će varijable popuniti podacima sa spiska. Pre slanja softveru je obično potrebno specifikovati gde se nalazi datoteka koja sadrži spisak.

Naravno, rezultat može biti „Poštovani Bojan“ što izgleda kao traljav pokušaj personalizacije i može čak delovati odbojno. Uz malo truda moguće je spisak prilagoditi i staviti imena u odgovara-jući padež. Naime, srpski jezik nema beskonačan broj imena te će se ona na spisku često ponav-ljati. Sortiranjem imena po azbučnom ili abecednom redu ista imena će se naći jedna do drugih, pa možemo prvo ime staviti u vokativ i jednostavno kopirati na sva ista imena (sve se može raditi u programu za tabeliranje poput Microsoft Excela). Postupak je potrebno ponoviti za sva različita imena.

Dok to radi, istraživač može dodati i varijablu „obraćanje“ u kojoj će staviti „Poštovani gospodine“ za muške ispitanike ili „Poštovana gospođo“ za ženske ispitanike. Ovo je lako uraditi ukoliko u spi-sku već postoji varijabla „pol“. U tom slučaju dovoljno je ovo napisati samo jednom i kopirati na sve ispitanike istog pola (prethodno sortirati po polu), pa isto ponoviti za drugi pol. Ukoliko vari-jabla „pol“ ne postoji, ona se može rekonstruisati na osnovu imena. Na kraju, u telu poruke je

Page 213: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

202

potrebno uneti {{obraćanje}} {{ime}} i rezultat će biti „Poštovani Bojane“ ili „Poštovani gospodine Bojane“.

Možda je sve još jednostavnije ukoliko se umesto imena koristi prezime, koje nije nužno stavljati u vokativ. Ukoliko napišemo {{obraćanje}} {{prezime}} rezultat će biti „Poštovani gospodine Jani-čić“. Naravno, za to nam je potrebno da u spisku imamo posebnu varijablu „prezime“.

Varijable se mogu koristiti i za slanje pristupnih kôdova koji ispitaniku omogućavaju da pristupi anketi ukoliko ona nema otvoren pristup. Potrebno je generisati poseban pristupni kôd (često se u softveru za onlajn anketiranje naziva i „token“) za svakog ispitanika i u telo poruke umetnuti rečenicu poput „Anketi možete pristupiti koristeći sledeći pristupni kôd: {{pristupni_kod}}“.

Isti ili vrlo sličan postupak personalizacije može se primeniti i u poštanskim anketama. Tekst pro-cesori poput Microsoft Worda ili LibreOffice Writera imaju opciju „Mailings“ (ili „Mail Merge“) koja omogućava štampanje personalizovanih pisama.

Iako se ceo postupak može činiti naporan i dug, on ne mora uzeti puno vremena. Bez obzira na veličinu spiska može se obaviti u toku par sati, a uticaj na smanjenje stope neodgovora može biti veliki. Kao ilustraciju navešćemo iskustvo autora u realizaciji anketnog istraživanja u okviru TEM-PUS projekta Conducting Graduate Surveys And Improving Alumni Services For Enhanced Strate-gic Management And Quality Improvement (CONGRAD)62. U sklopu pilotiranja anketnog upitnika, poziv na učešće u anketi poslat je na 70 adresa studenata master studija i zaposlenih na Univerzi-tetu u Novom Sadu. Ovaj poziv nije bio personalizovan, a odziv je bio jako loš (odgovorilo je dese-tak ispitanika). Nakon nedelju dana onima koji nisu odgovorili poslat je personalizovan podsetnik, a odazvali su se svi. Naravno, ovde je pored uticaja personalizacije poziva bio prisutan i efekat podsećanja.

8.5. Neodgovori na pojedine stavke

Neodgovori na pojedinačne stavke događaju se kod ispitanika koji pristanu da učestvuju u anketi, ali iz raznovrsnih razloga ne daju odgovor na pojedina pitanja.

Za razliku od neodgovora na celu anketu gde ispitanik odlučuje da li će učes-tvovati ili ne na osnovu kratkog opisa ankete, neodgovori na pojedinačna pitanja nasta-ju kada ispitanik vidi pitanja.

Posledice neodgovora na pojedino pitanje su iste kao posledice neodgovora na celu anketu. Razlika je u tome da je njihov efekat ograničen na konkretno pitanje. Veći broj neodgovora će rezultirati smanjenom preciznošću anketnog statistika, a ukoliko su povezani sa onim što ajtem meri i njegovom pristrasnošću.

Ako izuzmemo slučajno preskočena pitanja, neodgovori u ovom slučaju mogu biti rezultat nerazumevanja pitanja i njegove svrhe, procenjene nemogućnosti da se pruži tražena informacija i nedostatka volje i motivacije da se pruži tražena informacija (Groves et al., 1992).

Ukoliko ispitanik ne razume pitanje ili ga razume na više načina, nekada neće biti u stanju da formuliše jedan odgovor što može rezultirati neodgovorom. Ispitanik će

62 Videti http://www.congrad.org/

Page 214: Bojan Janičić - digitalna.ff.uns.ac.rs

NEODGOVORI

203

jednostavno preskočiti pitanje ili odbiti da odgovori.

Do neodgovora može doći i ukoliko ispitanik proceni da ne može dati istinit odgovor, odnosno da ne može dati preciznu informaciju. Na primer, ukoliko pitamo ispitanika koliki su mu bili prihodi van radnog odnosa tokom protekle godine, čak i ako ispitanik pokaže volju da odgovori na ovo pitanje, bez konsultacije dokumentacije teško će znati dovoljno precizan odgovor. Posledica može biti da ne želi da odgovori. Ukoliko mu se omogući da odgovori u obliku procenjenog raspona u kojem se ti prihodi nalaze, ispitanik će možda dati odgovor.

Međutim, prethodno pitanje je bolji primer za treću situaciju, u kojoj ispitanik nije voljan i motivisan da pruži traženu informaciju. Pitanja o visina prihoda su često osetljiva i ispitanici ne žele da otkriju tražene podatke. Takođe, kada je u pitanju moti-vacija, primećeno je da su neodgovori češći na pitanja otvorenog tipa, odnosno da ova-kva pitanja zahtevaju motivisanije ispitanike.

Na smanjenje broja neodgovora na pojedina pitanja utiče sve što pitanja čini jasnijim, manje ugrožavajućim za ispitanika i što umanjuje opterećenje ispitanika prili-kom odgovaranja na pitanja.

Kao što je rečeno, pitanja zatvorenog tipa zahtevaju manje napora od ispitanika i verovatnije je da će na njih odgovoriti i slabije motivisani ispitanici. Smanjenje doživ-ljaja ugrožavanja privatnosti ispitanika može se postići izborom modaliteta prikuplja-nja podataka sa samoadministracijom, a razumljivost pitanja postiže se pažljivom for-mulacijom i pojašnjenjima od strane anketara. Prisustvo anketara i njegova potpitanja i objašnjenja može uticati na smanjenje neodgovora usled niže motivisanosti ispitanika.

Page 215: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

204

9. Uloga anketara

U anketnim istraživanjima u kojima je potrebno učešće anketara njihova uloga je višestruka. Osim što upravljaju procesom odgovaranja na anketu, oni su vrlo često deo procesa uzorkovanja, utiču na saradnju potencijalnih ispitanika, beleže, koriguju, kodira-ju i ponekad unose odgovore ispitanika u računar.

Uloga anketara u procesu uzorkovanja posebno dolazi do izražaja kada se kori-ste zonski okviri uzorkovanja63. Prilikom ovakvog uzorkovanja anketar na licu mesta, sledeći određena pravila, bira stambene jedinice, domaćinstva i osobe koje će biti uklju-čene u uzorak. Kada su u pitanju ankete licem u lice i telefonske ankete u kojima ne postoje okviri uzorkovanja u kojima su jedinice uzorkovanja pojedinci koji će odgovara-ti na anketu, već se radi o domaćinstvima ili telefonskim brojevima koji pripadaju domaćinstvu, anketar učestvuje u procesu biranja osobe koja će pružiti odgovore. Tada anketar koristeći Kišove tablice, metodu najbližeg rođendana ili najinformisanijeg pojedinca, bira osobu koja će odgovarati u anketi (odeljak 3.2.2). Na taj način anketar učestvuje u procesu uzorkovanja.

Motivisanost anketara i njegova sposobnost da poštuje pravila biranja uticaće na to kako će biti ostvaren plan uzorkovanja. Ukoliko anketar nije motivisan da pokuša da prevlada pojedine prepreke na koje može naići na terenu, to može rezultirati pove-ćanjem greške pokrivenosti (odeljak 5.2). Slično, ako anketar nije motivisan na ponov-ljene posete domaćinstvima u kojima u prvom navratu nije našao nikoga, rezultat može biti povećanje greške neodgovora (odeljak 5.3 i poglavlje 8).

Nakon određivanja osobe koja bi trebalo da odgovara u anketi, anketar poku-šava da pridobije njenu saradnju i privoli je na učešće u istraživanju. U ovom koraku dolazi do izražaja sposobnost anketara da ispitanicima koji se dvoume ili odbijaju sara-dnju istakne prednosti učešća u istraživanju i razveje strahovanja koja ispitanik može imati u vezi sa upotrebom podataka i anonimnošću odgovora. Na taj način anketar može uticati na povećanje stope odgovora, a samim tim na veću preciznost anketnih statistika i u izvesnoj meri na njihovu manju pristrasnost.

63 Nekada se ova etapa uzorkovanja naziva etapom anketara (Fajgelj, 2004).

Page 216: Bojan Janičić - digitalna.ff.uns.ac.rs

ULOGA ANKETARA

205

Kada izabrana osoba pristane na učešće anketi, anketar rukovodi procesom odgovaranja. Sledeći zadati scenario (engl. script) on postavlja pitanja i beleži odgovore. Ukoliko ispitanik ne razume pitanje, anketar daje dodatna objašnjenja (u skladu sa scenariom). Ukoliko odgovori nisu dovoljno jasni ili nisu u vezi sa ciljem pitanja, postav-lja potpitanja (engl. probe) i usmerava ispitanika. Na taj način anketar utiče na validnost podataka, ali i na smanjivanje stope neodgovora na pojedinačna pitanja.

Nakon što je ispitanik odgovorio na pitanje anketar beleži odgovor. Tom prili-kom može obavljati i kodiranje (odeljak 10.1) i deo uređivanja podataka (odeljak 10.3). Ponekad (posebno u računarski podržanim modalitetima) anketar može biti zadužen i za unos podataka (odeljak 10.2).

Zbog svih ovih činilaca potrebno je obratiti pažnju na izbor, obuku i nadzor anketara.

9.1. Izbor anketara

Kada je u pitanju izbor anketara, potrebno je imati u vidu da anketar nije profe-sija. Ljudi ovaj posao obično obavljaju honorarno. Ne postoje škole pa čak ni kursevi za anketare (osim ako ih istraživači ne organizuju ad-hoc).

Koje su to osobine i sposobnosti koje bi dobri anketari trebalo da poseduju?

Nesumnjivo je poželjno da anketar dobro čita i lepo artikuliše glasove. To su neophodni uslovi da bi ispitanik razumeo pitanja na onaj način na koji je to predvideo istraživač.

U poslednje vreme veliki broj anketa je računarski podržan, a tehnologija sta-lno napreduje i unosi novine u proces anketiranja. Pošto posao anketara uključuje izve-stan stepen interakcije sa računarima, poželjno je da on ima određen stepen znanja u radu sa računarima i da lako prihvata nove tehnologije.

Kako je primetan trend opadanja stopa odgovora potrebno je i da anketar ima razvijene sposobnosti komunikacije i uveravanja (Groves, 2009).

Pre svega, poželjno je da anketar ima izvesno iskustvo u obavljanju tog posla. Kao što je rečeno, posao anketara ljudi najčešće rade honorarno, s vremena na vreme. Zato je dobro čuvati kontakte onih anketara koji su se dobro pokazali u nekim ranijim istraživanjima. Međutim, vrlo često će istraživač biti prinuđen da regrutuje nove ljude, bez iskustva i da ih obučava za taj posao.

9.2. Obuka anketara

S obzirom da se većina sposobnosti i osobina potrebnih za kvalitetno obavlja-nje posla anketara ne stiče u školi, a osim toga, različita anketna istraživanja imaju i svoje specifičnosti, obuka anketara za svako istraživanje je izuzetno značajna. Tokom obuke budući anketari bi trebalo da usvoje norme koje su neophodne za obavljanje tog

Page 217: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

206

posla. Ukoliko polaznici obuke internalizuju ove norme, one postaju mehanizam „daljinske kontrole“ njihovog rada (Rossi et al., 1983).

Anketare je potrebno obučiti za sve zadatke koje će imati u istraživanju. Obu-kom oni ne usvajaju samo neke opšte norme i pravila za obavljanje posla anketara, već im je potrebno ukazati i na specifičnosti konkretnog istraživanja. Zbog toga je potrebno da obuku prođu i anketari sa prethodnim iskustvom.

Obuku ne bi trebalo shvatiti olako. Jednodnevna obuka jeste jeftinija i kraće traje od opsežnije višednevne obuke, ali neće puno unaprediti kvalitet dobijenih poda-taka (Groves, 2009). Kao i u mnogim drugim situacijama vezanim za anketna istraživa-nja, ono što istraživač „ne plati na mostu, platiće na ćupriji“. Jedan od „rezultata“ uštede na obuci anketara može biti loš kvalitet podataka koji onemogućava ostvarivanje ciljeva istraživanja ili ozbiljno narušava preciznost i nepristrasnost anketnih pokazatelja. Ova-kvi podaci kasnije mogu zahtevati duže vreme pripreme i komplikovanije metode obrade, te povećati troškove i vreme potrebno za te faze istraživanja.

Pre svega, anketarima je potrebno objasniti svrhu istraživanja. Na taj način će i sami bolje razumeti svrhu pojedinačnih pitanja, bolje će umeti da prepoznaju situacije u kojima ispitanik nije dobro razumeo pitanje, pa će na vreme reagovati i moći da mu pojasne. Takođe, lakše će prepoznati kada ispitanik dâ odgovore koji nisu dovoljno jasni ili potpuni, pa će biti u stanju da postavi potrebna potpitanja i motiviše ispitanika na potpuniji odgovor. Da bi uspešno obavio i ovaj deo posla, neophodno je da anketar pro-đe obuku i za postavljanje potpitanja. Potpitanja ne smeju biti direktivna, odnosno ne smeju povećavati verovatnoću biranja jednog odgovora na štetu drugog.

Anketare je potrebno obučiti za pravilno čitanje i beleženje odgovora. Ukoliko anketar razume svrhu istraživanja, to može uticati da ovaj deo posla obavlja korektnije. Da ne bude zabune, anketari na obuci ne bi trebalo da uče da čitaju, ali im mora biti skrenuta pažnja na značaj doslovnog čitanja pitanja i posledice koje može imati odstu-panje od tog pravila. Slično važi i za beleženje odgovora. Važno je da anketar zabeleži odgovor onako kako ga je formulisao ispitanik, bez parafraziranja (koje može promeniti smisao) i bez zaključivanja i unošenja sadržaja koji nisu postojali u odgovoru ispitanika.

Ukoliko će anketari obavljati i terensko kodiranje, potrebno je da prođu obuku i za to. Ovo je potrebno jer različito kategorisanje i kodiranje odgovora može dovesti do greške kodiranja, odnosno dela varijanse anketnog statistika koji ne potiče od odgovora ispitanika već je rezultat različitog tumačenja kodne šeme od strane različitih šifranata (videti odeljak 10.1.).

Takođe, anketare je potrebno obučiti i za obavljanje administrativnih dužnosti koje su deo posla, a uključuju dokumentovanje procesa intervjuisanja, odnosno beleže-nje pokušaja kontakta, neodgovora (vrste i razloga), vremena početka i trajanja inter-vjua i sl. Ukoliko se anketiranje obavlja računarski podržano, anketare je neophodno obučiti za rad u aplikaciji za anketiranje i eventualnim pomoćnim aplikacijama.

Page 218: Bojan Janičić - digitalna.ff.uns.ac.rs

ULOGA ANKETARA

207

Ako se od anketara očekuje da obavlja deo procesa uzorkovanja, neophodno ga je obučiti u primeni procedure, ali i skrenuti pažnju na značaj njenog poštovanja i mogućim posledicama po istraživanje u slučaju odstupanja od nje.

Takođe, korisno je anketare obučiti kako da efikasno organizuju i planiraju kontakte, ponovne kontakte i intervjue, kako bi u što kraćem vremenu postigli što veću stopu odgovora.

Obuka anketara bi trebalo da uključuje i praktičan rad, odnosno poželjno je da se anketari okušaju u procesu intervjuisanja uz prisustvo iskusnih supervizora koji im mogu ukazati na dobre strane, ali i one koje bi trebalo popraviti. Dobar početak obuke anketara mogao bi biti preslušavanje ili posmatranje nekoliko snimaka intervjua drugih anketara, kako bi budući anketari shvatili da je postavljanje pitanja i beleženje odgovo-ra samo mali deo procesa intervjua, te da on uključuje i rešavanje mnogih problema koji se mogu javiti (De Leeuw et al., 2008).

9.3. Nadzor anketara

Osim izbora i obuke anketara, važna komponenta koja utiče na kvalitet podata-ka dobijenih anketiranjem je njihov nadzor.

Nadzor anketara zavisi od načina organizovanja istraživanja. Ukoliko se istra-živanje obavlja licem u lice na terenu, obično se nadzor svodi na kontrolu popunjenih upitnika. Kontroliše se kompletnost upitnika i traže se eventualne nedoslednosti poda-taka i neobični obrasci nedostajućih podataka karakteristični za anketara. Oni mogu ukazivati na to da se anketar ne drži smernica sa obuke (Groves, 2009). Takođe, ukoliko se radi o anketi papir-olovka, supervizor može obratiti pažnju na rukopis. Na primer, ukoliko primeti da su odgovori u upitnicima koje je prikupio jedan anketar upisivani različitim rukopisom (a predviđeno je da ih anketar upisuje), to može značiti da anketar nije čitao pitanja već je upitnike podelio ispitanicima da ih sami popunjavaju. S druge strane, ukoliko je predviđeno da upitnike popunjavaju sami ispitanici, a supervizor utvrdi da su popunjavani istim rukopisom, to može značiti da je anketar to učinio umes-to njih, odnosno da je odstupio od uputstva za anketiranje. Supervizor može tražiti nedoslednosti i u vremenima kada su intervjui obavljeni, njihovom trajanju i sl., odnos-no podatke koji ukazuju da je došlo do falsifikovanja podataka.

Ako se anketiranje obavlja centralizovano, u prostorijama organizacije koja ga vrši, supervizor može prisustvovati samom procesu anketiranja i evaluirati ga prime-nom bihejvioralnog kodiranja (videti odeljak 6.7.3). Ovo je moguće i u telefonskim anke-tama sa centralizovanim prostorijama za anketare. Kada su u pitanju telefonsko anketi-ranje i neke forme računarski podržanog ličnog intervjuisanja, moguće je snimanje intervjua (ako ne svih – onda slučajnog uzorka) i njihova naknadna analiza upotrebom metode bihejvioralnog kodiranja (Groves, 2009).

Posao supervizora obično obavljaju iskusni anketari koji su dodatno obučeni za

Page 219: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

208

taj posao i upućeni u svrhu konkretnog istraživanja. Oni svoje izveštaje mogu davati u kvantitativnom obliku na bazi bihejvioralnog kodiranja ili obliku opšteg kvalitativnog izveštaja. U zavisnosti od zahteva organizacije koja sprovodi anketu oni mogu davati povratnu informaciju anketarima sa ciljem unapređenja rada ili slati izveštaje koji se kumuliraju i naknadno predočavaju anketarima. Supervizori ne moraju pregledati sve intervjue, i obično to i ne rade, već biraju određeni uzorak. Nekada je taj uzorak sluča-jan, a nekada se ostavlja na izbor supervizorima.

U računarski podržanim anketama, deo supervizorskog posla koji se odnosi na nedoslednost podataka i neobične obrasce neodgovora, može obavljati i sam softver za anketiranje.

Bez obzira na formu supervizije, dobro je da ona postoji i da su anketari upoz-nati sa tim da ona postoji. Grouvs (Groves, 2009) je mišljenja da će anketari koji misle da način na koji sprovode intervjue neće bit nadziran – lošije raditi. Ovo mišljenje je nešto sa čime se zdravorazumski moramo složiti, a postoje i istraživanja koja upućuju da bi to moglo biti tačno (Fowler & Mangione, 1990).

9.3.1. Falsifikovanje i validacija podataka

Imajući u vidu da su anketari obično honorarni učesnici u istraživanju i, za raz-liku od istraživača, nisu nužno motivisani da istraživanje bude sprovedeno dosledno po pravilima, možemo očekivati da se u izvesnoj meri pojavi falsifikovanje podataka od strane anketara. Ova pojava nije tako česta i javlja se u manje od 1% upitnika (Groves, 2009; Schraepler & Wagner, 2003). Falsifikovanje se javlja usled težnje anketara da posao koji im je dodeljen obave što lakše. Češće se javlja kod anketara sa manjim iskus-tvom. Uticaj falsifikata na anketne statistike poput procenata i aritmetičkih sredina obično je vrlo mali, srazmeran njihovom učešću u ukupnom broju intervjua. Razlog za mali uticaj nije samo u njihovoj maloj zastupljenosti već i zbog toga što su falsifikati obično vrlo dobrog „kvaliteta“. Naime, anketari koji falsifikuju često imaju dobru pred-stavu o distribuciji falsifikovanih varijabli u populaciji i ne falsifikuju na slepo. Međutim, uticaj falsifikovanja na pokazatelje korelacija je veći jer je teže reprodukovati kovari-janse između varijabli (Schraepler & Wagner, 2003).

Falsifikovanje podataka može se javiti u različitim formama.

Izmišljanje podataka u celini ili delimično dešava se kada anketar zabeleži poda-tke/odgovore kao da ih je dao ispitanik, a on to nije zaista učinio.

Falsifikovanje podataka o procesu anketiranja je situacija kada anketar namer-no pogrešno kodira ispitanika kao neodgovor, nevalidnog ili prijavljuje nepostojeći pokušaj kontakta.

Namerno pogrešno kodiranje odgovora je slučaj kada anketar pogrešno kodira odgovor sa ciljem izbegavanja dodatnih pitanja i skraćivanja intervjua.

Page 220: Bojan Janičić - digitalna.ff.uns.ac.rs

ULOGA ANKETARA

209

Namerno intervjuisanje osoba koje nisu izabrane u uzorak (npr. druge osobe iz istog domaćinstva) javlja se kada anketar ima za cilj da brže završi intervju.

Falsifikati se mogu identifikovati na osnovu metoda zasnovanih na posmatra-nju, ponovnim kontaktima i analizi podataka.

Metode posmatranja se zasnivaju na već pominjanim intervjuima uz supervi-ziju. Ove metode su primenljive u telefonskim anketama koje se sprovode iz centralizo-vanih prostorija i u nekim varijantama računarski podržanog ličnog intervjuisanja. Obično se snima ili supervizira slučajan uzorak (do 10%) intervjua (Groves, 2009).

Metode ponovnog kontakta, kao što im ime govori, zasnivaju se na ponovnom kontaktiranju poduzorka ispitanika od strane druge osobe iz istraživačkog tima (super-vizora). Poduzorak može biti slučajan, a može se raditi i o prvih nekoliko ispitanika koje je posetio anketar (Biemer et al., 2016). Supervizor proverava da li je i kada dolazio anketar, proceduru obavljanja intervjua, te koliko je intervju trajao (Biemer et al., 2016; Fajgelj, 2004; Groves, 2009). Može proveriti i odgovore na određen broj slučajno izab-ranih pitanja. Ponovni kontakt može se ostvariti licem u lice, telefonski ili poštanski (može i elektronski ukoliko postoje kontakt podaci).

Metode analize podataka podrazumevaju kako analize pristiglih intervjua tako i analize podataka o procesu intervjuisanja koje je anketar dužan da beleži. Signal da nešto nije u redu sa radom anketara mogu biti kraća trajanja intervjua, intervjui obavljene u neobično doba dana (npr. 5 sati ujutro), znatno veći broj intervjua ostvare-nih u prvom kontaktu64 u odnosu na druge anketare, a koje se ne mogu objasniti pose-bnostima dela uzorka koje je anketar dobio da pokrije. Npr. ukoliko deo uzorka koji je pripao anketaru uključuje stariju populaciju i nezaposlene, veći procenat anketiranih u prvom kontaktu ne bi bio toliko neočekivan.

Što se analize podataka sa intervjua tiče, pažnja se obraća na učestalost odgo-vora na pitanjima sa grananjem koji uslovljavaju preskakanje velikog dela upitnika. Ukoliko su takvi odgovori kod nekog anketara učestaliji nego kod ostalih (a ni to se ne može pripisati posebnostima uzorka), moguće je da se radi o falsifikaciji odgovora u cilju skraćenja trajanja ankete.

Analiza podataka o procesu intervjuisanja i podataka sa intervjua može ukazati na to na koje je anketare potrebno obratiti posebnu pažnju, ali svakako nije definitivan dokaz da je došlo do falsifikacije. U nadzoru se mogu kombinovati ovi pristupi. Na pri-mer, ukoliko se utvrde anomalije metodom analize podataka, ispitanici kod kojih su one uočene mogu biti izabrani u poduzorak koji će biti ponovno kontaktiran.

Takve anketare je potrebno kontaktirati, skrenuti im pažnju na uočene anoma-lije, pitati za moguće razloge i staviti im do znanja da će biti češće kontrolisani. To bi

64 I slične anomalije.

Page 221: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

210

trebalo da ih odvrati od daljeg falsifikovanja ukoliko je ono uopšte i postojalo.

9.4. Uticaj anketara na anketne pokazatelje (pristrasnost anketara)

Na odgovore ispitanika mogu uticati neke osobine i ponašanje anketara. Osobi-ne anketara mogu se razvrstati na dve dimenzije: da li su lične ili vezane za ulogu anke-tara, te da li su direktno opazive ili ne. Lične osobine anketara su trajne i ne zavise od konteksta. To su pol, etničko poreklo, rasa, starost, boja glasa.... Ove osobine ispitanici mogu direktno opaziti ili zaključivati o njima, mada ta opažanja i zaključci ne moraju uvek biti tačni. Ličnost je takođe „lično“ svojstvo, ali ne može se opaziti direktno već o njoj ispitanici zaključuju na osnovu ponašanja anketara. Što se tiče osobina vezanih za ulogu anketara koje ispitanici mogu direktno opaziti, možemo govoriti o verbalnom ili neverbalnom ponašanju anketara (odnosno o tome da li se on drži procedure ili impro-vizuje), te o njegovoj tehničkoj „potkovanosti“. Kada su u pitanju osobine vezane za ulogu anketara koje ispitanici ne mogu direktno opaziti, govorimo o njegovom iskustvu, znanjima, predrasudama, uverenjima i očekivanjima u vezi sa anketom i njenim pred-metom merenja. O ovim osobinama ispitanici takođe mogu samo posredno zaključivati. Bez obzira da li su opažanja i zaključci ispitanika tačni, oni mogu uticati na odgovaranje ispitanika u smeru prilagođavanja odgovora opaženim osobinama anketara (Marsden & Wright, 2010).

Prema tome, uticaj anketara na odgovore ispitanika i samim tim na anketne pokazatelje može postojati i nezavisno od njegovog ponašanja u situaciji anketiranja. Nekada su samo njegove lične opazive osobine, ili čak samo prisustvo, dovoljni da utiču na ponašanje i odgovaranje ispitanika.

Nesistematski uticaj anketara na varijansu anketnih pokazatelja naziva se vari-jansom anketara i o njemu je bilo reči u odeljku o grešci merenja (5.4). U istom poglav-lju mogu se naći izrazi za njenu procenu i kvantifikaciju ([ 62 ] i [ 63 ]).

Ako postoji sistematski uticaj anketara na odgovore ispitanika, on će dovesti do toga da anketni statistici precenjuju ili potcenjuju parametre populacije. Tada govorimo o pristrasnosti anketara (engl. interviewer bias). Sam termin je u izvesnoj meri neod-govarajući jer zvuči kao da se radi o pristrasnosti nastaloj usled aktivnosti anketara (svesne ili nesvesne). To nije slučaj, već se radi o pristrasnosti anketnih pokazatelja koja se može pripisati činjenici da je anketar prisutan i načinu na koji ispitanici opažaju i interpretiraju njegove osobine. Pristrasnost anketara je važna komponenta greške merenja.

Uticaj anketara na odgovaranje ispitanika ispoljava se na različite načine.

Uočen je uticaj prisustva anketara na povišenu tendenciju biranja socijalno poželjnih odgovora u odnosu na ankete sa samoadministracijom. Na ovu pojavu bi tre-balo obratiti posebnu pažnju ukoliko se u anketnom istraživanju koristi više različitih

Page 222: Bojan Janičić - digitalna.ff.uns.ac.rs

ULOGA ANKETARA

211

metoda prikupljanja podataka, od kojih neke uključuju prisustvo anketara, a neke ne.

Takođe, primećeno je drugačije odgovaranje ispitanika ukoliko se opazive oso-bine anketara mogu povezati sa predmetom merenja. Ispitanici obično svoje odgovore prilagođavaju svom shvatanju onoga šta bi anketar voleo da čuje.

Na kraju, uočeno je i drugačije odgovaranje ispitanika u zavisnosti od iskustva anketara. Suprotno očekivanju, česta je pojava da anketari sa više iskustva dobijaju i beleže manje precizne odgovore. Ovo se smatra rezultatom usmerenosti iskusnijih anketara na brzinu i efikasnost, koju ispitanici primećuju i shvataju kao poželjnu pa tome prilagođavaju stil odgovaranja. Takođe, uočeno je i da iskusniji anketari manje obraćaju pažnju na doslovno čitanje pitanja i da češće odstupaju od scenarija intervjua. Oni po pravilu dobijaju veća zaduženja (veći broj ispitanika) što kod njih stvara pome-nutu orijentaciju na brzinu i efikasnost. U prilog ovom zapažanju ide i više istraživanja koja pronalaze negativnu korelaciju između opterećenja anketara i detaljnosti odgovora njegovih ispitanika (Cannell et al., 1981; Matschinger, Bernert, & Angermeyer, 2005). Ovaj uticaj se može ispoljiti čak i u anketama sa samoadministracijom (Groves, 2009). S druge strane, iskusniji anketari ostvaruju više stope odgovora i kontakta (Groves & Couper, 1998).

Na ovom mestu bi se trebalo osvrnuti na samo iskustvo anketara. Marsden i Rajt (Marsden & Wright, 2010) iznose dilemu, da li je iskustvo anketara ključni faktor ili jednostavno oni manje sposobni napuštaju ovaj posao i ne stignu da steknu „iskustvo“.

Da bi se smanjio uticaj anketara na odgovaranje ispitanika, bilo u obliku vari-janse ili pristrasnosti, preporučuje se da pitanja budu sročena jasno i zahtevaju što manje intervencije od strane anketara. Dobra su pitanja ona koje ispitanik razume na prvo čitanje, a razume i kakva vrsta odgovora se od njega očekuje. Što anketar ima manje potrebe da interveniše, njegov uticaj na rezultate biće manji.

Osim toga, poželjno je da anketari motivišu ispitanike da odgovaraju što potpu-nije, da dobro razmisle o odgovorima i da ne žure. Takvo uputstvo je korisno ponavljati s vremena na vreme u toku ankete. Takođe, korisno je da anketar pohvali poželjna ponašanja ispitanika kao što su davanje potpunih odgovora, razmišljanje o odgovoru i traženje pojašnjenja.

Dalje, anketar bi trebalo da se ponaša neutralno, orijentisano na cilj, ostavljaju-ći što manje šanse ispitanicima da naslute ili pretpostave kakvi se odgovori od njih očekuju. Potrebno je da ispitanicima dobro objasne kako će se anketa odvijati i koja su očekivanja u pogledu samog procesa odgovaranja na anketu. Pitanja bi trebalo da čitaju doslovce. Potpitanja bi trebalo da postavljaju nedirektivno, tako da ne favorizuju bilo koji odgovor. Odgovore ispitanika bi trebalo da zapisuju doslovce, bez parafraziranja i dodavanja sadržaja koji se u odgovoru ne nalazi.

Page 223: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

212

9.4.1. Pristrasnost anketara

Kada su u pitanju ankete o osetljivim temama, ispitanici u prisustvu anketara češće biraju socijalno poželjne odgovore nego kada su upitanju metode prikupljanja podataka bez anketara (Groves, 2009). Opažene osobine anketara (ponašanje i spoljaš-nji izgled) takođe mogu uticati na odgovaranje ispitanika koje nije u skladu sa njegovim pravim mišljenjem. Ovo je posebno izraženo u slučaju ako ispitanici doživljavaju kon-kretnu osobinu anketara povezanom sa predmetom merenja. Na primer, pol anketara može uticati na način odgovaranja ispitanika u anketi koja se bavi ravnopravnošću polova, rasa u anketama o odnosima među rasama, starost u anketama koje se bave međugeneracijskim odnosima... Ako se radi o subjektivnim konstruktima poput stavo-va, mi i ne možemo znati šta je „prava vrednost“ konstrukta.

Zamislimo situaciju da su ispitanika muškog pola, dva anketara (jedan ženskog i jedan muškog pola) pitali: „Da li mislite da bi muškarci i žene za isti posao trebalo da primaju istu platu?“. Ispi-tanik je anketarki odgovorio sa „Da“, a anketaru sa „Ne“. Da li je pravi odgovor na pitanje onaj koji je ispitanik dao anketarki ili anketaru?

Anketarki je mogao odgovoriti sa „Da“ zato što zaista tako misli, ali i zato što je želeo da prilagodi odgovor onome za šta smatra da je anketarkin stav. S druge strane, anketaru je mogao da odgo-vori sa „Ne“ zato što zaista tako misli, ali i iz želje da prilagodi odgovor onome za šta smatra da je stav anketara (da ne ispadne „šonja“).

Primetićete da se podrazumeva da su žene manje plaćene.

Na ovom mestu valjalo bi napomenuti da je mnogo veći broj situacija kada izgled i osobine anketara nemaju uticaj na odgovaranje ispitanika.

Na odgovore ispitanika može uticati i ponašanje anketara. U situaciji anketira-nja, ispitanik se oslanja na anketara kako bi saznao šta se od njega očekuje. Anketar može eksplicitno definisati očekivanja, ali ispitanici svoje shvatanje grade i na osnovu ponašanja anketara (bez obzira da li su u suprotnosti sa onim što je eksplicitno defini-sano). Na osnovu stava anketara ispitanik može zaključiti da li mu je bitnija brzina ili tačnost odgovaranja. Ukoliko procene da se anketaru žuri, orijentisaće se na brzinu odgovaranja, a trpeće tačnost.

U ovakvim situacijama, kada očekujemo da odgovori ispitanika mogu zavisiti od osobina anketara, a pošto ne možemo znati šta je pravi, „kvalitetniji“ odgovor, dobra je praksa randomizovati dodeljivanje ispitanika anketarima. Na taj način bar je moguće proceniti grešku koja je povezana sa anketarima (Groves, 2009).

Pored uticaja anketara na pristrasnost merenja, moguć je i uticaj koji rezultira uvećanjem udela nesistematske varijanse koja od njih zavisi. Ukoliko varijansa odgovo-ra zavisi od anketara, odgovori koje je prikupio jedan anketar biće međusobno sličniji, a više će se razlikovati od odgovora koje je prikupio drugi anketar (koji će opet biti slični-ji međusobno). Situacija liči na onu kod homogenih klaster uzoraka (odeljak 4.3.1.2). Odgovori još jednog ispitanika iz istog klastera dodaju manje informacija nego kada

Page 224: Bojan Janičić - digitalna.ff.uns.ac.rs

ULOGA ANKETARA

213

dolaze od ispitanika koji nisu klasterizovani. Na sličan način će i podaci od ispitanika koje je prikupio isti anketar, pod uticajem varijanse anketara nositi manje informacija o predmetu merenja nego kada bi ih prikupili različiti anketari65 (Groves, 2009). Rezultat će biti uvećana varijansa koja ne dodaje novu informaciju o predmetu merenja.

Da bi uticaj anketara na grešku merenja mogao biti procenjen, prilikom dode-ljivanja pojedinačnih ispitanika anketarima potrebno je i to činiti slučajnim izborom. Ukoliko takva randomizacija ne postoji, nije moguće znati da li se rezultati ispitanika koji su dodeljeni različitim anketarima razlikuju kao efekat varijanse anketara ili zato što se te grupe i zaista razlikuju.

Na primer, moguće je da jednom anketaru budu dodeljeni ispitanici neke mesne zajednice u kojoj većinski žive pripadnici neke nacionalne manjine koji o pitanju obrazovanja na jezicima manjina imaju značajno različite stavove od pripadnika većinskog naroda. Ako posmatramo rezultate iz perspektive anketara koji je prikupljao podatke, prosečne vrednosti ili procenti za tog konkretnog anketara mogu odudarati od prosečnih vrednosti i procenata podataka koje su prikupili drugi anketari. Međutim, mi ne možemo znati da li je uzrok tome (i u kojoj meri) varijansa anketara ili drugačiji stavovi ispitanika.

Randomizovani nacrti dodele ispitanika anketarima nazivaju se prožetim (engl. interpenetrated). U suštini, ispitanici dodeljeni pojedinačnom anketaru su jednos-tavan slučajan (pod)uzorak iz već definisanog uzorka. Ovakvi poduzorci izvlače se u okviru primarnih jedinica uzorkovanja. Ukoliko se istraživanje obavlja na relativno maloj teritoriji, poduzorci se mogu izvlačiti iz ukupnog uzorka. Međutim, kada se radi o anketama većeg obima, na primer nacionalnim, obično se za pojedine oblasti anketari regrutuju među osobama nastanjenim u okviru te oblasti, obično – primarne jedinice uzorkovanja. Dakle, u ovom slučaju poduzorci ispitanika za svakog anketara izvlače se u okviru primarne jedinice uzorkovanja, u okviru kojih se procenjuje i varijansa anketara.

Kada bi u pitanju bila anketa nacionalnog nivoa u okviru Republike Srbije, a primarne jedinice uzorkovanja gradovi, anketari koji bi sprovodili istraživanje na teritoriji grada Beograda bi bili regrutovani među onima koji žive u Beogradu i okolini, za Novi Sad među onima koji žive u Novom Sadu i okolini, za Niš među onima iz Niša... Za anketare iz Beograda poduzorci ispitanika bili bi izvlačeni samo među ispitanicima sa teritorije Beograda, ali ne i Novog Sada ili nekog od drugih gradova, i tako dalje.

U telefonskim anketama, poduzorkovanje se obavlja po smenama (prepodne, popodne) u kojima rade anketari. Naime, ovde ne postoji ograničenje dostupnosti jedi-nica uzorkovanja, odnosno, podela ispitanika po teritorijalnom principu, ali postoji po smenama, pa se i varijansa anketara procenjuje u okviru smena (Groves, 2009).

Varijansa anketara može se proceniti upotrebom vrste intraklasnog koeficijen-ta korelacije. Ovaj koeficijent se zasniva na nacrtu jednosmerne analize varijanse (Gro-

65 Ukoliko postoji značajan efekat anketara koji homogenizuje odgovore različi-

tih ispitanika, ispitanike čije je odgovore prikupio jedan anketar mogli bismo posmatra-ti kao jedan klaster.

Page 225: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

214

ves, 2009; Kish, 1962; Kish & Slater, 1960). Zavisna varijabla je skor ispitanika na pita-nju koje je predmet analize, a nezavisna varijabla (faktor) je anketar. Može se izračunati na sledeći način:

𝜌𝜌𝑎𝑎𝑛𝑛𝑘𝑘 =

�𝑀𝑀𝑆𝑆𝑖𝑖 − 𝑀𝑀𝑆𝑆𝑝𝑝𝑚𝑚 �

�𝑀𝑀𝑆𝑆𝑖𝑖 − 𝑀𝑀𝑆𝑆𝑝𝑝𝑚𝑚 � + 𝑀𝑀𝑆𝑆𝑝𝑝

[ 62 ]

gde je:

𝑀𝑀𝑆𝑆𝑖𝑖 srednji kvadrat između grupa na osnovu jednosmerne ANOVE sa anketarima kao faktorom

𝑀𝑀𝑆𝑆𝑝𝑝 srednji kvadrat unutar grupa iz iste ANOVE m ukupan broj anketa po anketaru

ρank može imati vrednosti od -1/(m-1) do 1. Vrednosti oko 0 ukazuju da nema značajne varijanse anketara, odnosno da anketar(i) nisu značajno uticali na odgovara-nje ispitanika. Više vrednosti ukazuju na značajan uticaj anketara na odgovaranje. Iako veličina ρank ne zavisi od prosečnog broja ispitanika po anketaru, njegov značaj za učešće varijanse anketara u anketnom statistiku je veći što je prosečan broj ispitanika po anketaru veći (Groves, 2009). Uticaj ρank, odnosno efekat anketara (deffank), može se izračunati na sledeći način:

𝑑𝑑𝑠𝑠𝑓𝑓𝑓𝑓𝑎𝑎𝑛𝑛𝑘𝑘 = 1 + 𝜌𝜌𝑎𝑎𝑛𝑛𝑘𝑘(𝑚𝑚 − 1) [ 63 ]

gde je m prosečan broj ispitanika po anketaru.

Ova veličina zavisiće presudno od prosečnog broja ispitanika po anketaru. Uko-liko je vrednost ovog izraza za neko istraživanje recimo deffank=2, to znači da je raspo-dela ispitanika po anketarima, na način na koji je obavljena u njemu, 2 puta (200%) povećala varijansu uzoračkog parametra (recimo aritmetičke sredine). Standardna greška bi u ovom slučaju bila veća, a intervali poverenja širi za 41% (√2 = 1,41). Pod-setićemo, standardna greška jednaka je kvadratnom korenu iz uzoračke varijanse, a intervali poverenja se grade dodavanjem i oduzimanjem umnožaka standardne greške od statistika dobijenog na uzorku.

Čak i ako istraživač ne namerava da računa varijansu povezanu sa anketarima, izraz [ 63 ] je koristan za planiranje istraživanja jer ukazuje na činjenicu da će efekat anketara (ako postoji) biti manji što je manji prosečan broj ispitanika koji su dodeljeni jednom anketaru.

Page 226: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIPREMA PODATAKA ZA ANALIZU

215

10. Priprema podataka za analizu

Nakon što su podaci prikupljeni oni prolaze kroz fazu pripreme za obradu, odnosno, prevode se iz sirovog oblika u korigovani, verifikovani oblik koji je spreman za analizu (Pfeffermann & Rao, 2010). Podaci se nakon pretvaranja u elektronski oblik čiste tako što se koriguju ili izbacuju nemoguće i malo verovatne vrednosti, nadomešta-ju se nedostajući odgovori, izbacuju protokoli ispitanika sa velikim brojem nedostajućih podataka, ponderišu kako bi se korigovale disproporcije nastale usled nejednake vero-vatnoće uzorkovanja...

Tokom i nakon pripreme podataka potrebno je dokumentovati sve učinjene izmene.

Proces pripreme počinje sa preliminarnim uređivanjem, a nastavlja se sa uno-som podataka u računar, statističkim uređivanjem i nadomeštanjem nedostajućih poda-taka, kodiranjem otvorenih odgovora, ponderisanjem i obradom autlejera, proverom anonimnosti podataka, i završava kreiranjem dokumentacije za matricu podataka (Pfef-fermann & Rao, 2010). Tek nakon toga može uslediti obrada podataka.

Redosled faza nije lako jednoznačno definisati, tako da prethodno navedeni redosled možemo shvatiti samo kao okvirni.

Mogli bismo reći da je prvo potrebno podatke kodirati i uneti u računar, pa tek onda proveriti, urediti (korigovati greške) i ponderisati. Međutim, iako je za proveru i uređivanje podataka jako zgodno da oni već budu uneti u računar da bismo mogli koris-titi softver za proveru tačnosti podataka, ipak je dobro da podaci pre unosa prođu neku preliminarnu proveru. Mada se kodiranje otvorenih odgovora može raditi nakon unosa, kreiranje kodne šeme je moralo bar delimično biti urađeno još prilikom konstrukcije ankete. Osim toga, unos podataka je znatno olakšan ako se ne unose kompletni odgovo-ri ispitanika već samo kodovi koji su im dodeljeni. Sa te strane, bilo bi dobro da su otvo-reni odgovori već kodirani pre unosa. To se često i radi, i anketari često na licu mesta kodiraju otvorene odgovore. Glavni deo procesa uređivanja svakako sledi nakon što su podaci uneti u računar. U sklopu procesa uređivanja mogu biti uočeni i autlejeri i done-ta odluka kako će biti tretirani. Ukoliko kodiranje otvorenih odgovora sledi fazu uređi-vanja, njihova ispravnost pre toga nije mogla biti statistički proverena, pa bi fazu uređi-

Page 227: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

216

vanja (bar delimično) bilo potrebno ponoviti nakon toga. Nadomeštanje nedostajućih vrednosti i ponderisanje bi trebalo raditi nakon faze uređivanja podataka, jer u toj fazi neki odgovori mogu biti klasifikovani kao nedostajući, a nadomeštanje i ponderisanje zavisi od nedostajućih podataka. Provera anonimnosti podataka (videti odeljak 12.4.3.1), odnosno mogućnosti da se na osnovu kombinacije podataka identifikuju jedi-nice istraživanja, obično se radi na korigovanim i verifikovanim podacima, a posebno u slučaju kada se planira da podaci iz anketnog istraživanja budu smešteni u neki repozi-torijum otvorenih podataka. Ukoliko se utvrdi da je anonimnost jedinica istraživanja ugrožena to može rezultirati izmenom podataka i sažimanjem određenih kategorija pojedinih varijabli u cilju onemogućavanja identifikacije jedinica istraživanja. To, opet, može zahtevati promenu kodne šeme... Na osnovu svega rečenog možemo zaključiti da se u suštini radi o iterativnom postupku, te da se pojedine operacije ponavljaju na razli-čitim nivoima u zavisnosti od potrebe. Stoga, redosled opisa koji sledi u nastavku, nemojte shvatiti kao recept koji treba slepo slediti prilikom pripreme podataka za stati-stičku obradu.

10.1. Kodiranje (šifriranje)

Kodiranje (ili šifriranje) se obično definiše kao procedura kojom se odgovori-ma ispitanika dodeljuju numerički kodovi koji se koriste u daljoj statističkoj obradi. Pod-razumeva pretvaranje svih nenumeričkih podataka u numeričke. Ovom procedurom se ujedno i pravi rezime odgovora ispitanika, pošto se veći broj individualnih odgovora predstavlja jednom kodnom kategorijom (Groves, 2009). Osim numeričkih kodova mogući su i slovni kodovi, ali su numerički češće u upotrebi. Dobar razlog za to je što su takvi kodovi lakši za unos u računar i smanjuju verovatnoću greške u ovoj fazi procesi-ranja podataka.

Možemo reći da proces kodiranja počinje kada i kreiranje anketnog upitnika, odnosno u trenutku kada se osmišljavaju pitanja i ponuđeni odgovori, ali i očekivanja od odgovora na pitanja sa konstruisanim (otvorenim) odgovorima. Ovaj korak se neka-da naziva i prekodiranje (engl. precoding) (Lavrakas, 2008). Naravno, ovo je moguće uraditi samo za ona pitanja gde je istraživač u stanju da predvidi na koje će sve načine ispitanici odgovarati. Takav je slučaj sa pitanjima sa višestrukim izborom i kod nekih pitanja sa otvorenim odgovorom66.

Samo prekodiranje predstavlja početak razvoja šeme kodiranja (engl. coding scheme), koja je potrebna kako bi ceo proces bio obavljen tačno i dosledno.

Za neka pitanja sa konstruisanim odgovorom nije moguće unapred razviti

66 To su pitanja sa odgovorom u kojima su mogućnosti odgovora ograničene

samom prirodom tražene informacije, poput pitanja gde pitamo za starost u navršenim godinama, broj dece, učestalost poseta lekaru i sl. Ovakva pitanja se nekada nazivaju i samokodirajućim (engl. self-coding).

Page 228: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIPREMA PODATAKA ZA ANALIZU

217

šemu kodiranja jer nije poznato na koje sve načine ispitanici mogu odgovoriti. Takođe, nakon prikupljanja podataka (čak i nekog manjeg dela) može postati jasno da šema kodiranja razvijena pre primene ankete ne odgovara podacima. Za ovakva pitanja kod-ne šeme se razvijaju nakon ili u toku prikupljanja podataka. Ovo kodiranje naziva se postkodiranje (engl. postcoding). Započinjanje postkodiranja pre kraja prikupljanja podataka može skratiti vreme potrebno za završetak analize podataka (Lavrakas, 2008).

Proces kodiranja pitanja sa otvorenim odgovorima zahteva da ih veći broj oso-ba pročita i kodira. Rezultati njihovog kodiranja se porede, procenjuju razlike i ukoliko su suviše različiti, šema kodiranja se koriguje i proces ponavlja (Visser et al., 2000).

S obzirom na to ko i gde obavlja kodiranje, razlikujemo terensko i kancelarij-sko kodiranje.

Terensko kodiranje (engl. field coding) događa se u situaciji kada se anketa sprovodi licem u lice ili telefonskim putem, a pitanja su otvorenog tipa. Anketar postav-lja pitanje i nakon što je ispitanik dao odgovor pokušava da ga svrsta u neku od unap-red definisanih kategorija i dodeli mu odgovarajući kôd. Prednost ovakvog načina kodi-ranja (u odnosu na naknadno kodiranje) je ta što je anketar u kontaktu sa ispitanikom i osim formulacije odgovora na raspolaganju su mu i informacije poput tona glasa ispita-nika, facijalne ekspresije (ukoliko je anketa licem u lice), a može u slučaju nedoumice postaviti dodatna pitanja ispitaniku u svrhu razjašnjenja.

S druge strane, prednost naknadnog kancelarijskog kodiranja (engl. office coding) je ta što ga obavlja manji broj osoba pa je samim tim konzistentnije, odnosno ima manju varijansu (tzv. varijansu šifranata67 – engl. coder variance), te je uticaj kodiranja na rezultate manji. Varijansa šifranata je deo ukupne varijanse anketnog statistika koji ne potiče od odgovora ispitanika već je rezultat procesa kodiranja, odno-sno različitog tumačenja kodne šeme od strane različitih šifranata. Povećavajući ukup-nu varijansu ona utiče na smanjenje preciznosti anketnih statistika. Naime, terensko kodiranje obavljaju sami anketari kojih obično ima više nego šifranata. Iako anketari prolaze obuku za kodiranje, oni šeme kodiranja mogu tumačiti na različite načine. Ova činjenica, uz tipično veći broj anketara nego šifranata, može dovesti do veće varijanse šifranata u terenskom pristupu, što dalje utiče na manju preciznost anketnih statistika. Izbor između terenskog i kancelarijskog kodiranja je uvek balansiranje između cene i većih grešaka klasifikacije (Groves, 2009). Terensko kodiranje manje košta i rezultira većom varijansom šifranata, dok je s druge strane kancelarijsko kodiranje skuplje, ali je varijansa šifranata manja.

Uticaj šifranata na varijansu anketnog statistika može se proceniti tako što se šifrantima da zadatak da kodiraju određen broj istih slučajno izabranih slučajeva. Zatim

67 Termin „šifrant“ koristićemo za osobu zaduženu za kodiranje (šifriranje).

Page 229: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

218

se računa koeficijent intraklasne korelacije među šifrantima (ρc) i proceni pouzdanost kodova (r) na osnovu korelacije među odlukama različitih šifranata.

Zatim se efekat šifranata (deffc) na varijansu računa na sledeći način:

𝑑𝑑𝑠𝑠𝑓𝑓𝑓𝑓𝑐𝑐 = 1 + 𝜌𝜌𝑐𝑐(𝑚𝑚− 1)(1 − 𝑝𝑝) [ 64 ]

gde je m prosečan broj slučajeva po šifrantu.

Ukoliko je ova vrednost jednaka 1, ne postoji efekat šifranata na uvećanje vari-janse. Ako je veća od 1 – efekat postoji (npr. ukoliko je vrednost deffc=1,05 varijansa anketnog statistika uvećana je za 5%). Iz izraza se vidi da osim slaganja među procenji-vačima i pouzdanosti određenog kôda, ovaj efekat zavisi i od prosečnog broja slučajeva (m) dodeljenih pojedinačnom šifrantu. Što je ovaj broj veći, vrednost m-1 biće veća, pa samim tim i vrednost celokupnog izraza.

Kao što je ranije rečeno, kodovi su jedinstveni brojevi ili slovni znaci koji se koriste prilikom unosa i obrade podataka. Običaj je da dodeljeni kodovi odslikavaju prirodu i nivo skale merene varijable. Na primer, ako je skala merenja ordinalna, kate-gorije odgovora dobiće numeričke kodove u skladu sa logičkim redosledom odgovora (1 – nikada, 2 – jednom godišnje, 3 – dva puta godišnje, 4 – jednom mesečno...). Za intervalnu skalu kodovi mogu biti i slovni (recimo A, B, C, D...), ali iz ranije navedenih praktičnih razloga češće se upotrebljavaju numerički. Kodiranje intervalne skale slično je numeričkom kodiranju za ordinalnu skalu sa tom razlikom što bi jednake razlike u brojevima koji se koriste kao kodovi trebalo da reprezentuju jednake razlike u prisus-tvu merenog svojstva. Ako je skala racio nivoa, nulom se predstavlja odsustvo merenog svojstva, a numerički kodovi su kao kod intervalne skale u skladu sa stepenom prisus-tva. Za merenja na nominalnoj skali kodovi mogu biti dodeljeni arbitrarno.

Svakom kodu dodeljuje se i tekstualni opis (naziv, oznaka) koji će se u matrici podataka i na izlazima statističkih analiza pojavljivati kod svih odgovora koji spadaju u određenu kategoriju.

Kodovi moraju biti takvi da pokrivaju sve kategorije, ali i da budu međusobno isključivi. To znači da za sve odgovore postoje kodovi, a da ne sme biti moguće da neki odgovor bude svrstan u više kategorija.

Kodovi moraju biti određeni na način koji odgovara cilju analize. Moraju omo-gućavati dobijanje željenih podataka i testiranje hipoteza koje je istraživač postavio. Nema smisla da ih bude previše (odnosno da kategorije budu preuske), ali ni premalo (preširoke kategorije).

Kodiranje rezultira listom kodova ili šifarnikom (engl. codebook). Šifarnik pored spiska kodova (mogućih vrednosti) sadrži tekstualne vrednosti (labele) za svaki kôd, značenje svake od labela, tekst svakog pitanja uz naziv varijable (kolone) u kojoj je

Page 230: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIPREMA PODATAKA ZA ANALIZU

219

smešteno i položaj pitanja u strukturi matrice podataka. Šifarnik68 je koristan i prilikom komunikacije istraživača sa analitičarem zaduženim za obradu podataka, ali i kao dokument koji samom istraživaču omogućava da nakon proteklog vremena zna šta konkretna matrica podataka sadrži (Fajgelj, 2004).

Kada se radi o pitanjima višestrukog izbora, proces kodiranja je jednostavan. Svodi se na dodeljivanje jedinstvenog broja svakom od ponuđenih odgovora.

Na primer:

U kom tipu naselja ste proveli najveći deo svog života (označite samo jedan odgovor): selo varoš grad

U ovom slučaju „selo“ bi moglo dobiti numerički kôd 1, „varoš“ 2, a „grad“ 3, mada nema prepre-ke ni da bude obrnuto, niti da kategorije dobiju bilo koje druge numeričke kôdove dokle god su oni jedinstveni za svaku kategoriju. S druge strane, ovako definisani tipovi naselja razlikuju se po veličini i na taj način posmatrano tvore ordinalnu skalu. Stoga je logično da dodeljeni kodovi odslikavaju logički redosled tipova nasilja, od manjeg ka većem ili obrnuto.

Kodiranje pitanja sa otvorenim odgovorima je kompleksnije. U ovakvom načinu odgovaranja ispitanici imaju slobodu da odaberu bilo koji odgovor i da ga formulišu na bilo koji način. Šema kodiranja bi trebalo da omogući da se mnoštvo raznolikih odgovo-ra opiše manjim brojem kategorija i to na način koji će omogućiti analizu i ostvarivanje ciljeva istraživanja.

Na primer, šema kodiranja jednog pitanja sa otvorenim odgovorom bi mogla biti sledeća:

Pitanje 7: Kako ste saznali da je ubijen premijer Zoran Đinđić? (iz kog izvora ste prvo saznali) _____________________________________________________

Kolona 12* (1 mesto)**

Napomene: KODIRATI SAMO PRVI ODGOVOR!

0=nije odgovorio/la 1=TV (vesti ili saopštenja, usmena ili pismena objavljena na TV) 2=radio (vesti ili saopštenja objavljena na FM radio stanicama) 3=imejl (uključuje i Viber, WhatsUp, Messenger... bilo koji način slanja poruka za koji je potrebno postojanje internet konekcije) 4=telefonskim putem (razgovor ili poruka) 5=iz priče ljudi 6=drugo (u ovo spadaju i odgovori poput „internet“ ako nije specifikovan način ili „iz vesti“ kada nije definisano da li se radi o TV ili radijskim vestima)

Ispitanici mogu davati različite odgovore poput: „Na vestima“, „Iz novina“, „Javio mi je prija-telj/rođak“, „Prijatelj mi je poslao poruku“, „Čuo sam na radiju“, „Video sam na vestima“. Zadatak

68 Statistički softveri poput IBM SPSS-a omogućavaju automatsko kreiranje i

štampanje šifarnika.

Page 231: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

220

osobe koja kodira (a to može biti anketar ili osoba posebno zadužena za kodiranje) je da svakom od tih odgovora dodeli odgovarajuću numeričku vrednost.

Odgovor „Na vestima“ bio bi kodiran sa 6 („drugo“) jer nije specifikovan medij na kojem su vesti emitovane. Odgovor „Iz novina“ bi morao biti kodiran na isti način jer u kodnoj šemi ne postoji kategorija koja se odnosi na štampane medije. Na isti način bi bile kodirane i poruke „Javio mi je prijatelj/rođak“ i „Prijatelj mi je poslao poruku“, zbog toga što ne znamo da li je poruka bila imejl ili SMS, odnosno da li je korišćen telefon ili internet. Odgovor „Video sam na vestima“ mogli bis-mo kodirati sa 1, pošto se vesti mogu videti na TV-u, ne i na radiju. Situacija je najčistija kod odgovora „Čuo sam na radiju“, koji bi bio kodiran sa 2.

Kao što se može videti, kodiranje nije tako jednostavan proces kao što na prvi pogled može izgle-dati. Potrebno je da i sam anketar bude upoznat sa šemom kodiranja kako bi od ispitanika zatra-žio razjašnjenje ukoliko odgovor ostavlja nedoumice u vezi sa tim kojoj kategoriji pripada.

* označava kolonu (varijablu) u matrici podataka

** označava širinu podataka (1 mesto znači da su svi kodovi jednocifreni)

Broj kodova za neko pitanje obično je manji od broja ispitanika, inače nije moguće sažimanje rezultata (ako je u pitanju kategorijalna varijabla). Merne varijable se ne kodiraju, ali je potrebno definisati raspon validnih odgovora ukoliko je to moguće.

Jednu varijablu je moguće kodirati na više načina. Na primer, podatke o zanimanju ispitanika moguće je kodirati prema klasifikaciji zanimanja (u više kategorija) ali i prema tome da li se radi o rukovodećem položaju ili ne (dve kategorije). Drugi primer su podaci o starosti ispitanika. Oni mogu biti ostavljeni u izvornom obliku (broj navršenih godina) ili kodirani u starosne kategorije (1 – „18–29 god.“, 2 – „30–39 god.“, 3 – „40–49 god.“... ili samo 1 – „mlađi od 45 god.“ i 2 – „45 godina i više“). Da li će istraživač to raditi zavisi od toga koji su ciljevi istraživanja.

Nisu sve varijable lake za kodiranje i može se desiti da postoje odgovori koji se ne uklapaju u ponuđenu šemu kodiranja. Istraživač može preispitati kodiranje i u toku istraživanja (ranim fazama) i opredeliti se da ga promeni. To se radi na osnovu prvih pristiglih rezultata. Ranije smo ovu proceduru nazvali postkodiranje.

Na primer, može se desiti da veliki broj ispitanika želi da odgovori na način koji nije ponuđen u nekom pitanju (ako se radi o pitanju sa ponuđenim odgovorima), ili žele da zaokruže dva odgovo-ra za koje je istraživač smatrao da su međusobno isključiva.

Ukoliko dođe do promene kodova tokom istraživanja, istraživač je dužan da proveri i eventualno prilagodi kodove dodeljene prethodno anketiranim ispitanicima.

Jako je bitno da postoje kodovi i za odgovore koji nisu informativni za predmet istraživanja (Groves, 2009). To su npr. kodovi za odgovore tipa „nije relevantno“ ili „ne želim da odgovorim“. Takođe, potrebno je da postoje i kodovi za pitanja koja nisu pri-menljiva na ispitanika, čiji predmet nije dostupan ispitaniku ili ispitanik ne ume da odgovori. Na taj način ćemo u matrici podataka imati i informaciju zašto ispitanik nije odgovorio na neko pitanje, a ovo može biti korisno prilikom identifikacije mehanizma nedostajanja podataka i odluke da li je i na koji način potrebno vršiti imputaciju.

Potrebno je napraviti distinkciju između različitih razloga zašto neki odgovor

Page 232: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIPREMA PODATAKA ZA ANALIZU

221

nije prisutan. Prva situacija se javlja ako pitamo ispitanika o nekom događaju koji on nije iskusio. odnosno o događaju koji se nije desio. Npr. želeli smo da saznamo koliko su ispitanici u proseku potrošili novaca na letovanje u Crnoj Gori, a neki ispitanik je leto-vao u Grčkoj ili nije išao na letovanje uopšte69. U slučaju da je ispitanik iskusio događaj može se desiti da odbije da odgovori (odbijanje, engl. refusal – REF). Ukoliko ne odbije da odgovori, sledeći razlog zbog kojeg odgovor nedostaje može biti taj što ne zna da odgovori (engl. don't know – DK). Ukoliko i zna da odgovori može se desiti da odgovor jednostavno nije primenljiv (engl. not applicable – NA). Takvu situaciju bismo imali kada bi ispitanik, recimo, letovao kod prijatelja, a u zamenu će oni doći kod njega na zimovanje. I na kraju, moguće je da odgovor bude i 0.

Postoje različiti načini kodiranja ovih (ne)odgovora, ali se čini korisnom prepo-ruka da se oni kodiraju kao negativni dvocifreni ili trocifreni brojevi kako bi se izbeglo mešanje sa mogućim vrednostima odgovora (Iarossi, 2006).

Postoje preporuke (Iarossi, 2006) da pitanja koja zahtevaju isti način odgova-ranja i imaju isti raspon odgovora budu kodirana na isti način (npr. da kod svih pitanja na koja ispitanik može odgovoriti sa „da“ ili „ne“, odgovor „da“ bude kodiran kao 1, a „ne“ kao 0). Međutim, postoje i mišljenja (Bradburn et al., 2004) da takvo kodiranje otežava prepoznavanje grešaka u unosu podataka pa se preporučuje da se u ovakvim slučajevima dodeljuju različiti kodovi. Na primer, kada bismo imali grupu od tri uzasto-pna pitanja na koja se odgovara sa „da“ ili „ne“, odgovori „da“ bi mogli biti kodirani sa tri uzastopna neparna broja (1, 3, i 5), a odgovori „ne“ sa tri uzastopna parna broja (2, 4 i 6).

Za uspešnost kodiranja i smanjenje varijanse šifranata izuzetno je bitno da šema kodiranja bude dobro osmišljena i da se proces kodiranja obavlja jednoobrazno. To zahteva dobru obuku šifranata, ali i obuku anketara za kodiranje. Čak i u slučaju da se istraživač opredeli za kancelarijsko kodiranje, obučen anketar će umeti da prepozna odgovore koje će biti teško kodirati i da postavi dodatna pitanja koja će ih pojasniti i na taj način olakšati posao šifrantima. Na taj način smanjuje se varijansa šifranata i pove-ćava preciznost anketnih statistika.

10.2. Unos podataka

Iako se unos podataka (engl. data entry ili data capture) može činiti manje važ-nim, ovo je itekako bitna faza anketnog istraživanja i u toku ove faze mogu nastati greš-ke koje mogu uticati na rezultate statističkih analiza.

Pod unosom podataka obično se misli na ručni unos podataka prilikom kojeg osoba zadužena za to upotrebom računarske tastature odgovore ispitanika ubacuje u

69 U engleskom jeziku se za ovakve situacije koristi skraćenica NP od not pro-

vided.

Page 233: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

222

bazu podataka. Međutim, unosom podataka možemo smatrati sve načine na koje odgo-vori ispitanika postaju dostupni računarskoj obradi, odnosno bivaju smešteni u bazu podataka.

Ukoliko su korišćene računarski podržane metode prikupljanja podataka (CADAC) eliminiše se potreba za ručnim unosom podataka, a istovremeno omogućava i logička kontrola toka anketiranja (onemogućavaju se ispitanici da odgovaraju na pita-nja na koja ne bi trebalo da odgovaraju). Takođe, ispitanicima i anketarima je onemo-gućeno da kao odgovore upisuju pogrešne tipove podataka (npr. reč gde je potreban broj) ili da daju odgovore koji nisu mogući. Na taj način smanjuje se i količina nekonzis-tentnih i nevalidnih podataka i olakšava faza uređivanja podataka.

Podatke je moguće učiniti dostupnim računarskoj obradi i upotrebom softvera za optičko prepoznavanje karaktera (engl. Optical Character Recognition – OCR). Popu-njeni upitnici prvo se skeniraju i pretvaraju u računarske slike (bitmape), a zatim obra-đuju (iščitavaju). Da bi ovo bilo moguće, obično je potrebno da upitnik bude dizajniran na poseban način koji omogućava upotrebu OCR tehnologije. Osim toga, potrebno je pripremiti i obrazac prepoznavanja. Obrascima prepoznavanja se softveru za OCR defi-niše koje delove upitnika je potrebno pročitati i u koja polja baze podataka je potrebno zapisati pročitane podatke. Ispitanik ili anketar obično odgovore unose označavanjem kućica koje ili u potpunosti zacrne ili ucrtaju „x“ (nešto poput listića za „loto“). Nekada je moguće i upisivanje jednostavnijeg teksta ili brojeva, ali ovakav način odgovaranja povećava broj grešaka u prepoznavanju odgovora. U slučaju da upitnici nisu prilagođe-ni optičkom čitanju moguće je pre upotrebe optičkog prepoznavanja podatke sa upitni-ka preneti na posebno pripremljene formulare koji se potom skeniraju i prepoznaju.

Za ovakav način unosa podataka potrebna je i odgovarajuća oprema i softver. Iako se ankete mogu skenirati i na običnim, stonim skenerima, na ovakvim uređajima to traje predugo i može se primeniti na manjim uzorcima. Međutim, priprema obrasca za prepoznavanje nije isplativa za manje uzorke pošto može uzeti više vremena nego što bi bilo potrebno za ručni unos podataka.

Priprema za unos podataka kreće još u fazi planiranja same ankete. I prilikom dizajniranja samog upitnika vodi se računa o tome kako će podaci biti unošeni i obrađi-vani. Ukoliko kreiranje ankete, unos, prečišćavanje i obradu podataka ne rade iste oso-be, potrebna je njihova saradnja još od samog početka.

Osobe zadužene za unos podataka bi trebalo da budu upoznate sa ciljem anke-tnog istraživanja i načinom odgovaranja ispitanika. Stoga je korisno da prisustvuju obuci koju prolaze i sami anketari.

Kada je u pitanju ručni unos podataka brojni su faktori koji utiču na njegovu tačnost i brzinu.

Već sam fizički izgled upitnika može imati uticaj na fazu unosa.

Page 234: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIPREMA PODATAKA ZA ANALIZU

223

Prilikom konstrukcije i dizajniranja fizičkog izgleda upitnika potrebno je voditi računa da pitanja ne treba da budu zbijena. Preporuke koje su u odeljku 6.5 date u smis-lu preglednosti upitnika za ispitanike, ujedno olakšavaju i unos podataka. Sabijanje pitanja zbog štednje prostora i vizuelnog skraćivanja upitnika rezultiraće njegovom smanjenom čitljivošću i otežavaće unos podataka. Unos će duže trajati i biti podložan većem broju grešaka.

Kutijice za označavanje (engl. checkbox) i predefinisani odgovori (npr. uopšte se ne slažem, uglavnom se ne slažem, neodlučan/na sam, uglavnom se slažem, u potpu-nosti se slažem) bi trebalo da se nalaze uz pitanja na koja se odnose. U protivnom odgo-vori mogu biti uneti u pogrešnu kolonu matrice podataka. Pogodno je da uz odgovore stoje i odgovarajući kodovi, ukoliko je to moguće.

Na samom štampanom upitniku poželjno je da kodovi stoje upisani pored odgovarajućeg odgovora. Na taj način smanjiće se broj grešaka koje mogu nastati prili-kom unosa. Kao što je rečeno, podatke je mnogo lakše unositi i mnogo su ređe greške, ako je unos odgovora ispitanika numerički, a ne tekstualni. Na taj način, obično se unosi samo jedan broj, a ne čitava reč, sintagma ili rečenica. Pored toga što je brže, to smanju-je i prostor za grešku.

Pitanja otvorenog tipa moraju imati dovoljno mesta za upisivanje odgovora. U protivnom ispitanici mogu odgovore pisati na drugim mestima ili sabijati tekst i skraći-vati reči. To može dovesti do toga da podaci ne budu uneti, budu uneti u pogrešnu kolonu matrice, a ukoliko su nečitki i nerazumljivi može se desiti da budu pogrešno kodirani i tako uneti.

Slika 7 – Primer šifrantskog listića

Page 235: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

224

Ukoliko se podaci unose direktno sa upitnika, poželjno je da redosled odgova-ranja bude konzistentan. I za potrebe unosa najbolje je ako se pitanja nalaze jedno ispod drugog u jednoj koloni. Ako upitnik ima više kolona onda je poželjno da kretanje kroz upitnik bude dosledno kroz ceo upitnik. Nedoslednosti rezultiraju sporijim unosom i/ili češćim greškama.

Ukoliko anketni upitnik ima više strana unos može teći brže i imati manje gre-šaka ukoliko se podaci prethodno kodiraju i prepišu na jedan list, tzv. šifrantski listić (Slika 7).

U pitanju je listić na kojem su navedeni samo redni brojevi pitanja (varijabli) i kodirani odgovori ispitanika. Naravno, i to je procedura koja uzima vremena i može biti izvor greške.

Prilikom ručnog unosa podataka u računar potrebno je primeniti neki način kontrole poput maski za unos i dvostrukog unosa. Maske za unos predstavljaju sof-tverska ograničenja koja dozvoljavaju unos samo onih vrednosti koji su u okviru dozvo-ljenog raspona ili skupa mogućih vrednosti za određenu varijablu. Na ovaj način kon-troliše sa da greškom osobe koja unosi podatke ne bude uneta nemoguća vrednost, ali ne i pogrešna vrednost unutar skupa dozvoljenih vrednosti.

Na primer, ukoliko su na nekoj varijabli (pitanju) moguće vrednosti odgovora od 1 do 5, softver za unos će prilikom unosa vrednosti 7, zaustaviti unos i signalizirati grešku. Dalji unos će biti moguć tek kada osoba koja unosi ispravi grešku.

Dvostrukim unosom se može unaprediti tačnost unosa u okviru skupa dozvo-ljenih vrednosti. Kao što sam naziv govori, u ovom tipu kontrole podaci se unose dva puta i proverava slaganje između dva unosa. Ukoliko postoji neslaganje, prilikom dru-gog unosa proverava se koja vrednost je ispravna i kao konačna unosi ona koja je zabe-ležena na anketnom upitniku. Ovaj način unosa ne može detektovati greške u unosu prilikom kojih su oba unosioca (ili isti unosilac u dva navrata) pogrešila na isti način na istom mestu. Na sreću, broj takvih grešaka je vrlo mali.

Najbolje je kombinovati ova dva vida kontrole. Maske za unos mogu se prime-niti i u okviru modula za unos podataka komercijalnih statističkih paketa i paketa za tabelarna izračunavanja kroz opciju koja se najčešće zove „data validation“. Što se tiče dvostrukog unosa, iako ga je moguće odraditi i u softveru za tabelarna izračunavanja (Microsoft Excel, LibreOffice Calc...), za komforan rad potreban je specijalizovan softver.

10.3. Uređivanje podataka

Nakon prikupljanja podataka sledi faza uređivanja podataka. Faza uređivanja predstavlja izmenu podataka koje je zabeležio anketar ili ispitanik u cilju unapređenja njihovog kvaliteta (Groves, 2009). U fazi uređivanja proverava se kompletnost, tačnost i konzistentnost upitnika (Iarossi, 2006). Može se vršiti i pre unosa podataka, ali nakon unosa bi je svakako trebalo ponoviti

Page 236: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIPREMA PODATAKA ZA ANALIZU

225

Kada je u pitanju kompletnost, pregledaju se prikupljeni upitnici i proverava da li su anketari pitali i zabeležili odgovore na sva relevantna pitanja, odnosno da li su ispitanici odgovorili na sva relevantna pitanja. Ukoliko neki odgovor nedostaje to može biti zato što je ispitanik prevideo pitanje ili nije mogao, želeo ili umeo na njega da odgo-vori. S druge strane, razlog može biti i taj što anketar nije postavio pitanje ispitaniku ili nije zabeležio odgovor.

Kompletnost proveravaju anketari na terenu, ali i supervizori. Najbolje je pro-veru obaviti neposredno posle intervjua, a pre početka sledećeg, dok je sećanje anketa-ra na postavljena pitanja i date odgovore još sveže (Iarossi, 2006).

Prilikom proveravanja kompletnosti potrebno je voditi računa da ispitanici i ne moraju da odgovore na sva pitanja. Šta više, neka pitanja moraju preskočiti. Ukoliko ispitanik nije iskusio neki događaj, on ne bi trebalo da odgovara na pitanja koja se na njega odnose. Nema smisla pitati ispitanika o zadovoljstvu uslugama turskih hotela, ako ispitanik nikad nije letovao u Turskoj. To je kontraproduktivno iz više razloga. Kao prvo, ispitanici će biti nezadovoljni što ih pitate nešto što je očigledno da ne mogu znati i mogu odbiti dalje učešće u anketi. S druge strane, ako i pristanu da odgovaraju – odgo-vori će biti nevalidni baš zato što o onome što ih pitate ne znaju ništa.

Problem nekompletnosti anketa se u znatnoj meri može smanjiti računarski podržanim anketiranjem, pošto se odgovori automatski beleže, a ispitanici i anketari (ukoliko ih ima) mogu se upozoravati da je neko pitanje preskočeno. Takođe, računar-ski podržanim anketiranjem može se obezbediti logička kontrola anketiranja kojom se kontroliše koja će pitanja biti postavljena ispitaniku, a koja ne, sve u zavisnosti od nje-govih prethodnih odgovora.

Kada je u pitanju tačnost, proverava se da li su svi odgovori zabeleženi na jasan i nedvosmislen način, odnosno, da li je jasno šta je ispitanik odgovorio. Nekada se može desiti da se ispitanik ili anketar dvoume šta je konačan odgovor pa zaokruže više odgo-vora na pitanjima gde je potrebno zaokružiti jedan.

Neka pitanja mogu zahtevati izračunavanja. Kod takvih pitanja proverava se korektnost proračuna. Kod pitanja sa otvorenim odgovorima proverava se da li su ispi-tanici dali legitimne odgovore i da li su adekvatno i na dosledan način kodirani.

Prilikom provere konzistentnosti upitnika proverava se da li je poštovana logi-čka struktura upitnika, odnosno, da li su preskočena sva pitanja na koja ispitanik nije ni trebalo da odgovara. Na primer, ukoliko na pitanje „Da li ste ikada probali marihuanu?“ ispitanik odgovori sa „Ne“, nema smisla postavljati mu pitanje „Kakav uticaj ima kon-zumiranje marihuane na Vas?“, ili ukoliko je ispitanik muškarac, nema smisla pitati ga o broju porođaja koje je imao.

Ispravnost odgovora proverava se na više načina. Proverava se da li odgovor ispitanika zadovoljava određene uslove (pravila engl. edit rules ili samo edits). Uslovi

Page 237: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

226

se definišu kao odgovori ili kombinacije odgovora na više pitanja koje su moguće i pri-hvatljive, a ako odgovor ili kombinacija odgovora ne zadovoljava uslov(e) potrebno ga je izmeniti.

Evo nekih primera takvih uslova:

Odgovor mora biti unutar određenog raspona (npr. prijavljena starost ispitanika od 170 godina je verovatno greška).

Proveravaju se i odnosi (npr. ako je ispitanik rekao da ima platu 25.000 RSD mesečno, nemoguće je da na godišnjem nivou potroši 600.000 RSD za komunalije).

Prijavljeni podaci porede se sa istorijskim podacima ukoliko oni postoje (npr. ako je u prvom tala-su panel istraživanja neka žena rekla da je imala 2 porođaja, podatak iz naknadnog istraživanja u kojem kaže da je imala 1 porođaj je sumnjiv).

Proverava se i usklađenost podataka (npr. procenti novca koje neko domaćinstvo izdvaja za razli-čite potrebe moraju se sabirati do 100%).

Provera doslednosti odgovora podrazumeva dovođenje u vezu odgovora ispitanika na različitim pitanjima. Na primer, ukoliko je ispitanik izjavio da je nezaposlen, nemoguće je da ima platu od 30.000 RSD, ili bilo koju drugu platu. Jedan od ta dva podatka je netačan. Ovo se dalje može pro-veravati dovodeći u vezu ove odgovore sa odgovorima na druga pitanja. Na primer, ukoliko ispi-tanik kaže i da radi u javnom sektoru, onda je najverovatnije podatak o nezaposlenosti netačan i trebalo bi ga promeniti.

Felegi i Holt (Fellegi & Holt, 1976) u svom članku o automatskom uređivanju podataka definišu načela koja bi trebalo da ovaj proces drže pod kontrolom kako ne bi došlo do preteranog uređivanja i narušavanja kvaliteta podataka umesto njihovog poboljšavanja.

Tri osnovna načela su:

1. Podaci u svim poljima matrice podataka moraju se korigovati tako da zado-voljavaju sve uslove uz najmanji mogući broj izmena

2. Nakon uređivanja mora biti očuvana struktura frekvencija (marginalnih i združenih) izvornih podataka u najvećoj mogućoj meri

3. Mora biti moguća dedukcija pravila za imputaciju iz uslova (pravila) korišće-nih za uređenje podataka

Uslovi mogu biti eksplicitni ili implicitni. Eksplicitne uslove definiše istraživač, a implicitni se mogu dedukovati iz eksplicitnih uslova.

Na primer, eksplicitni uslov bi mogao biti: „da osoba mora imati 17 godina da bi imala vozačku dozvolu B kategorije“. Ukoliko osoba navede da ima 16 godina i dozvolu za B kategoriju, jedan od ta dva podatka nije tačan.

Drugi eksplicitni uslov je: „da bi nekome mogla biti privremeno oduzeta vozačka dozvola zbog saobraćajnog prekršaja, on je mora posedovati“.

Page 238: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIPREMA PODATAKA ZA ANALIZU

227

Implicitni uslov koji možemo dedukovati iz ova dva eksplicitna uslova je: „da bi nekom mogla biti privremeno oduzeta vozačka dozvola zbog saobraćajnog prekršaja on mora imati najmanje 17 godina“.

Prvo načelo Felegija i Holta (Fellegi & Holt, 1976) može se ilustrovati na sledeći način: ukoliko je u protokolu za jednog ispitanika zabeleženo da ima 16 godina, vozačku dozvolu B kategorije koja mu je oduzeta zbog saobraćajnog prekršaja, podaci bi zadovoljili sve uslove ukoliko bismo korigo-vali samo podatak o starosti. Sve druge korekcije zahtevale bi menjanje većeg broja podataka. Ukoliko bismo ostavili podatak da je starost ispitanika 16 godina, morali bismo da izmenimo i podatak o posedovanju i podatak o oduzimanju vozačke dozvole B kategorije.

Osim po eksplicitnosti, uslovi se mogu podeliti i po izvesnosti greške. Po tom kri-terijumu uslovi mogu biti tvrdi i meki (engl. hard edits i soft edits). Ako neki zapis (ispi-tanik) ne zadovoljava tvrdi uslov, takav zapis se smatra nekonzistentnim i može se zaključiti da je neki od podataka koji su obuhvaćeni uslovom pogrešan. Takvi podaci moraju se korigovati. Ako zapis ne zadovoljava meki uslov, to ne znači da je neki od podataka obuhvaćen njime sigurno pogrešan, već da je malo verovatan. Nezadovoljava-nje mekog uslova predstavlja razlog da se podaci dodatno ispitaju, potvrde ili pak izmene ukoliko se pokažu pogrešnim (Waal et al., 2011).

Tvrdi uslov: Visina plate ne sme biti negativan broj.

Meki uslov: Visina plate za puno radno vreme ne sme biti ispod 10.000 RSD.

U slučaju da nije zadovoljen meki uslov može se raditi o autlejeru. Autlejeri se mogu podeliti na nereprezentativne i reprezentativne. Nereprezentativni autlejeri nastaju kao rezultat greške u odgovaranju i/ili beleženju odgovora i potrebno ih je korigovati. Reprezentativni autlejeri nisu rezultat greške, ali reprezentuju vrlo mali deo populacije. Istraživač ima opciju da ih ukloni iz analize, zameni plauzibilnom vred-nošću ili zadrži. Njihovim uklanjanjem ili menjanjem statistički pokazatelji mogu posta-ti pristrasni, a zadržavanje dovodi do povećanja varijabilnosti anketnog statistika i smanjivanja njegove preciznosti (Pfeffermann & Rao, 2010).

Još jedna podela uslova je ona po složenosti pravila za njihovo izvođenje. Prema tom kriterijumu oni mogu biti univarijatni, bivarijatni ili multivarijatni (Waal et al., 2011).

Univarijatni uslovi su najčešće rasponi dozvoljenih vrednosti. Kada se radi o kategorijalnim varijablama definisani su skupovi dozvoljenih vrednosti. Rasponima se može definisati donja i gornja granica prihvatljivih vrednosti, ali često je i definisanje samo donje granice (npr. veći od 0). Ova pravila bi se mogla formalizovati na sledeće načine:

x nije negativan broj 𝑆𝑆𝑥𝑥 = {𝑥𝑥|𝑥𝑥 ≥ 0}

x je veće ili jednako d, a manje ili jednakog g 𝑆𝑆𝑥𝑥 = {𝑥𝑥| 𝑑𝑑 ≤ 𝑥𝑥 ≤ 𝑔𝑔}

x pripada skupu sa elementima muško i žensko 𝑆𝑆𝑥𝑥 = {𝑚𝑚𝑚𝑚š𝑘𝑘𝑝𝑝, ž𝑠𝑠𝑛𝑛𝑠𝑠𝑘𝑘𝑝𝑝}

Page 239: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

228

Bivarijatni uslovi su uslovi u kojima raspon ili skup dozvoljenih vrednosti na jednoj varijabli zavisi od vrednosti na drugoj varijabli. Npr. ako je starost ispitanika ispod 16 godina onda bračno stanje ne može biti ništa drugo osim neože-njen/neudata70.

Ako je varijabla starost označena sa x i izražena u punim godinama, a varijabla bračno stanje označena sa y i ima vrednosti 0 – nikad se nije ženio/udavala, 1 – oženjen/udata, 2 – razve-den/razvedena, 3 – udovac/udovica, onda bi se univarijatni uslovi mogli formalizovati na sledeći način:

𝑆𝑆𝑥𝑥 = {𝑥𝑥| 1 ≤ 𝑥𝑥 ≤ 120}, odnosno, ispitanik mora imati između 1 i 120 godina

𝑆𝑆𝑦𝑦 = {0, 1, 2, 3}, odnosno, bračno stanje ispitanika mora biti neko iz skupa: nikad se nije ženi-o/udavala, oženjen/udata, razveden/razvedena, udovac/udovica

Bivarijatni uslov da mlađi od 16 godina ne mogu biti oženjeni/udati bi se tada mogao formalizova-ti na sledeći način:

𝑆𝑆𝑥𝑥𝑦𝑦 = {(𝑥𝑥,𝑦𝑦)| 𝑥𝑥 < 16 ∧ 𝑦𝑦 = 0} ∪ {(𝑥𝑥,𝑦𝑦)| 𝑦𝑦 ≥ 16}

Drugim rečima, uređeni par (x, y) mora pripadati skupu koji je unija skupa u kojem ispitanici imaju manje od 16 godina i bračno stanje im je „nikad se nije ženio/udavala“ i skupa u kojem ispitanici imaju 16 godina ili više, a bračno stanje može imati bilo koju vrednost.

U bivarijatne uslove spadaju i uslovi koji se tiču odnosa (videti primer ranije u tekstu).

Multivarijatni uslovi su uslovi koji uključuju više od dve varijable ili povezuju više uslova. Primer takvih uslova mogu biti povezani uslovi usklađenosti. Na primer, ukupni prihodi domaćinstava moraju biti jednaki zbiru ukupnih prihoda njegovih čla-nova. S druge strane, ukupni prihod člana domaćinstva mora biti jednak zbiru njegovih ukupnih prihoda iz radnog odnosa i onih van radnog odnosa.

Savremeni softverski statistički paketi (poput paketa SPSS, Statistica i R) i apli-kacije za tabelarne proračune (Microsoft Excel, Libre i Open Office Calc...) obično imaju mogućnost validiranja podataka koja obuhvata kako univarijatne i bivarijatne, tako i multivarijatne uslove. Ove procedure služe pronalaženju slučajeva koji ne zadovoljavaju uslove da bi podaci bili ispravni, ne i automatskoj korekciji.

Uređivanje (izmena podataka) ne vrši se proizvoljno. Prvo je potrebno proveri-ti da nije eventualno došlo do greške u unosu podataka. Tom prilikom pregledaju se protokoli ispitanika, odnosno proverava se kako su odgovori zabeleženi na papiru. Ukoliko nema razlike između unetih podataka i podataka na papiru, konsultuje se anke-tar i proverava da li je eventualno došlo do greške u beleženju odgovora. Ako greška nije nastala prilikom beleženja odgovora (ili je ispitanik sam odgovarao) kontaktira se ispitanik i pokušava razrešiti problem. Ukoliko ni na taj način nije moguće razrešiti

70 Ovo je granica prema važećim zakonima Republike Srbije. Različita zakono-

davstva različito definišu starosnu granicu za stupanje u brak.

Page 240: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIPREMA PODATAKA ZA ANALIZU

229

nastali problem (npr. nije moguće kontaktirati ispitanika), podaci se označavaju kao nedostajući, a naknadno se može izvršiti imputacija podataka umetanjem vrednosti koje su najverovatnije i koje se najčešće javljaju kod ispitanika sa sličnim karakteristi-kama.

10.4. Ponderisanje i poststratifikacija

Ponderisanje (engl. weighting) je postupak kojim se određenim slučajevima (ispitanicima) i njihovim odgovorima pridaje veći ili manji značaj u odnosu na onaj koji bi imali u odnosu na druge ispitanike kada bi analize vršili na sirovim rezultatima.

Ponderisanje se obavlja da bi se struktura uzorka uskladila sa strukturom popu-lacije, korigovala pristrasnost neodgovora ili redukovala pristrasnost ključnih anketnih procena (Marsden & Wright, 2010).

Ukoliko posedujemo informacije o strukturi populacije i strukturi uzorka, moguće je ponderima korigovati eventualne razlike u distribucijama bitnih varijabli (npr. kada polna struktura uzorka nije jednaka onoj u populaciji).

Takođe, ako imamo potrebne informacije o planiranom uzorku, moguće je upo-rediti ga sa realizovanim. Na taj način može se utvrditi po čemu se razlikuju oni koji su odgovorili na anketu od onih koji nisu, a tako dobijene informacije iskoristiti za izraču-navanje pondera koji mogu umanjiti pristrasnost neodgovora (odeljak 5.3). Valja napo-menuti da se ponderisanje kao korekcija za neodgovore koristi prevashodno u slučaje-vima kada jedinica istraživanja (ispitanik) koja je odabrana u uzorak, iz bilo kog razlo-ga, nije odgovorila na celu anketu. Kada se radi o neodgovorima na pojedina pitanja može se koristiti postupak imputacije nedostajućih podataka. Moguće je i za neodgo-vore na pojedina pitanja koristiti ponderisanje, ali s obzirom da se pitanja mogu razli-kovati po stopi neodgovora, bilo bi potrebno računati posebne pondere za svako pita-nje, što u najvećem broju situacija nije ekonomično.

Kada se govori o ponderima koji su namenjeni za redukciju pristrasnosti ključ-nih anketnih statistika, misli se na pristup ponderisanju u kojem su u centru konkretne statističke procene, a ne uzorak ili populacija. Recimo da je ključni cilj nekog anketnog istraživanja da dođe do nepristrasnih procena jedne ili nekoliko varijabli. U pristupu ponderisanju o kojem trenutno govorimo, ponderi će biti kreirani tako da se prida odgovarajući značaj ispitanicima koji pripadaju različitim grupama po varijablama koje su značajno povezane sa procenjivanom varijablom (onom koja je glavni cilj anketnog istraživanja) i koje mogu imati različite stope neodgovora. U ovom slučaju ponderi se ne kreiraju tako da se reprodukuje struktura populacije, već je cilj nepristrasna procena ključne varijable (Marsden & Wright, 2010).

Ponderisanje se svodi na množenje rezultata pojedinačnog ispitanika određe-nim koeficijentom koji može biti manji ili veći od 1. Ukoliko je ponder koeficijent manji od 1, ispitaniku i njegovim odgovorima umanjujemo značaj, a ukoliko je veći od 1, onda

Page 241: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

230

mu značaj uvećavamo. Ukoliko ponder iznosi 1, to je jednako kao da slučaj nismo pon-derisali.

Sve pondere možemo podeliti u dve velike grupe. Razlikujemo ekspanzione i relativne pondere (Marsden & Wright, 2010).

Ekspanzionim ponderima ponderisani broj ispitanika u uzorku postaje jednak veličini populacije.

Praktično, to znači da ukoliko je proporcija uzorkovanja f=0,02, odnosno, uzorak čini 2% populacije, svaki slučaj ponderišemo sa 50 (100/2=50). Na ovaj način ćemo osim procene procen-ta ispitanika koji ispoljavaju neku osobinu dobiti i procenu ukupnog broja takvih ispitanika u populaciji.

Relativnim ponderima ponderisani broj ispitanika u uzorku se skalira do veli-čine uzorka. Ovakvi ponderi koriste se za korigovanje strukture uzorka ukoliko su neke od grupa podreprezentovane ili nadreprezentovane.

Nadreprezentacija se koristi kada želimo da obavimo posebne analize na grupama koje su u populaciji malo zastupljene. Kada bi ispitanici iz takvih grupa bili zastupljeni proporcionalno svom udelu u populaciji, njihov apsolutni broj mogao bi biti premali za sprovođenje planiranih analiza (npr. utvrđivanja korelacija).

Recimo, ukoliko je u nekoj populaciji određena grupa zastupljena sa 2%, to bi značilo da bi u pro-babilističkim uzorcima veličine n=1000 bilo oko 20 ispitanika iz te grupe. Da bismo na odgovorima te grupe ispitanika obavili neke statističke analize potrebno nam je, recimo 100 ispitanika. To je 5 puta više, odnosno za 80 ispitanika više nego što je bi se našlo u uzorku kada bi bili proporcional-no zastupljeni. Proporcija zastupljenosti nadreprezentovane grupe u uzorku bila bi 100/1000=0,10 (odnosno 10%). Po završetku posebnih analiza na toj grupi, za analize na celokup-nom uzorku zastupljenost ispitanika iz nadreprezentovane grupe bi bilo potrebno vratiti na onu koja je prisutna u populaciji. To ćemo postići tako što ćemo proporciju zastupljenosti te grupe u populaciji (ph1) pomnožiti veličinom uzorka (n) i proizvod podeliti brojem ispitanika iz te grupe u uzorku (nh1), odnosno:

wch1= ph1·n/nh1=0,02∙1000/100=0,2

Ako broj ispitanika iz te grupe nh1=100 pomnožimo ponderom wch1=0,2 dobićemo 20 ispitanika što nam je i bio cilj jer taj broj ispitanika u uzorku realno odslikava zastupljenost te grupe u popu-laciji. Međutim u analizama u kojima se koristi ovaj ponder, veličina uzorka biće 900+20=920. Naknadno bi trebalo tim preostalim jedinicama (koje su podreprezentovane jer ih ima 900 umes-to 980) dodeliti ponder koji će njihov udeo u uzorku svesti na proporciju koju imaju u populaciji. Taj ponder se može izračunati na isti način kao za prethodnu grupu, odnosno:

wch2= ph2·n/nh2= 0,98∙1000/900=1,089

Ako broj ispitanika iz te grupe pomnožimo ovim ponderom dobićemo: 900∙1,089=980. U ukup-nom zbiru imaćemo 1000 ispitanika koliko je i planirano.

Podreprezentovanima se povećava značaj (ponderi veći od 1), a nadreprezen-tovanim smanjuje (ponderi manji od 1). Za razliku od ekspanzionog ponderisanja, rela-tivnim ponderisanjem ukupna veličina uzorka se ne menja i ne postoji opasnost da se stekne utisak da je istraživanje rađeno na znatno većem uzorku (Marsden & Wright,

Page 242: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIPREMA PODATAKA ZA ANALIZU

231

2010).

10.4.1. Koraci u ponderisanju

Prvi korak u ponderisanju je korekcija za različite verovatnoće selekcije. U slučaju da smo ispitanike iz različitih grupa (stratuma) birali koristeći različite propor-cije uzorkovanja to će rezultirati neproporcionalnom zastupljenošću stratuma, i to je potrebno korigovati. Ponder za različite proporcije uzorkovanja jednak je recipročnim vrednostima tih proporcija.

𝑤𝑤𝑓𝑓ℎ = 1𝑓𝑓ℎ� [ 65 ]

gde je fh proporcija uzorkovanja u h-tom stratumu.

Npr, ako je proporcija uzorkovanja u nekom stratumu bila 1/50, onda bi ponder za ispitanike iz tog stratuma trebalo da bude wfh=50. U stratumu iz kojeg je biran svaki stoti ispitanik ponder bi trebalo da iznosi wfh=100.

Ukoliko vršimo istraživanje domaćinstava pri čemu biramo jednog od mogućeg većeg broja legitimnih ispitanika u okviru njega, potrebna je korekcija za veličinu domaćinstva. Naime, manja domaćinstva biće bolje reprezentovana tim jednim ispita-nikom nego veća. U jednočlanom domaćinstvu šansa ispitanika da bude izabran biće pi=1 (100%), u dvočlanom pi 0,5 (50%) i tako dalje. Što je veći broj članova domaćins-tva, šansa pojedinca da bude biran biće manja. S druge strane, ukoliko postoji dupliranje tog domaćinstva u okviru uzorkovanja (recimo dva telefonska broja u telefonskom ime-niku), šanse biranja domaćinstva pa i pojedinaca u njemu biće uvećane (u konkretnom primeru 2 puta). U takvom slučaju pi za jednočlano domaćinstvo biće 2/1, a za dvočlano 2/2. Ponder kojim se koriguju ove anomalije računa se slično (isto) prethodnom:

𝑤𝑤𝑝𝑝 = 1 𝑝𝑝𝑖𝑖� [ 66 ]

U oba slučaja korigujemo za različite verovatnoće biranja slučaja. U drugom slučaju, da postoje različite verovatnoće biranja saznaćemo tek nakon faze terenskog rada.

Sledeća faza ponderisanja je generisanje pondera koji bi trebalo da koriguju razlike između planiranog i realizovanog uzorka. Ovaj korak obuhvata korekciju za neodgovore. U ovom koraku ponderisanje se vrši po grupama ispitanika pa moramo unapred poznavati njihovu grupnu pripadnost i stopu odgovora po grupama. I ovaj ponder se računa na sličan način:

𝑤𝑤𝑛𝑛ℎ = 1𝑆𝑆𝑆𝑆ℎ� [ 67 ]

gde je SOh stopa odgovora za grupu (stratum) h.

Čak i ako sve grupe imaju sličnu stopu odgovora i približno iste pondere, oni će uticati na ponderisani broj slučajeva. Zato ga treba uzeti u obzir ako se kreiraju ekspan-

Page 243: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

232

zioni ponderi (Marsden & Wright, 2010). Takođe, s obzirom da ne moraju sve varijable (pitanja u anketi) imati jednaku stopu odgovora, ovaj ponder se mora računati posebno za svaku varijablu.

Na kraju je potrebno izračunati ukupan ponder koji uzima u obzir prethodne pondere za različite verovatnoće selekcije i neodgovore.

𝑤𝑤𝑝𝑝𝑢𝑢ℎ = 𝑤𝑤𝑓𝑓ℎ · 𝑤𝑤𝑝𝑝 · 𝑤𝑤𝑛𝑛ℎ [ 68 ]

Ovako izračunat ponder biće ekspanzioni. Ukoliko želimo da dobijemo relativni ponder, potrebno je wueh podeliti prosekom pondera:

𝑤𝑤𝑝𝑝𝑟𝑟ℎ = 𝑤𝑤𝑝𝑝𝑢𝑢ℎ/ ��(𝑤𝑤𝑝𝑝𝑢𝑢ℎ) /𝑛𝑛𝑝𝑝ℎ� [ 69 ]

gde je nsh veličina planiranog uzorka u grupi (stratumu).

Ukoliko ni nakon ponderisanja proporcije grupa ne odgovaraju onima u popu-laciji koristi se postupak koji se naziva poststratifikacija (engl. poststratification). U suštini i ovaj postupak se svodi na vid ponderisanja. Koristi se kada su poznate propor-cije stratuma u populaciji, ali procedura uzorkovanja nije mogla biti obavljena na strati-fikovan način (Marsden & Wright, 2010).

Za ovu korekciju potrebno je poznavanje procentualne zastupljenosti grupa od interesa u populaciji i u uzorku71. Za svaku od grupa (stratuma) poststrafikacijski pon-der računa se kao odnos procenta zastupljenosti grupe u populaciji i procenta zastup-ljenosti u uzorku:

𝑤𝑤ℎ𝑝𝑝𝑝𝑝 =% 𝑔𝑔𝑝𝑝𝑚𝑚𝑝𝑝𝑠𝑠 𝑚𝑚 𝑝𝑝𝑝𝑝𝑝𝑝𝑚𝑚𝑝𝑝𝑝𝑝𝑐𝑐𝑝𝑝𝑣𝑣𝑝𝑝

% 𝑔𝑔𝑝𝑝𝑚𝑚𝑝𝑝𝑠𝑠 𝑚𝑚 𝑚𝑚𝑧𝑧𝑝𝑝𝑝𝑝𝑘𝑘𝑚𝑚 [ 70 ]

Nakon toga se ukupni ponderi iz izraza [ 68 ] i [ 69 ] množe veličinom whps za svakog ispitanika i tako dobijaju konačni ponderi (Marsden & Wright, 2010).

10.4.2. Ponderisanje i greška uzorkovanja

Iako se može učiniti da je ponderisanje zgodan način da sa manjim brojem ispi-tanika ostvarimo preciznost za koju su nam potrebni veći uzorci, to nije tako. Ponderi-sanje utiče i na standardnu grešku parametra i to obično tako što je povećava i samim tim smanjuje preciznost. Međutim, još ozbiljniji problem je to što ponderisanje u različi-tim stratumima može različito uticati na varijabilnost uzoračke distribucije i samim tim na grešku uzorkovanja, pri čemu najčešće nismo u mogućnosti da procenimo kakav je taj uticaj (Fajgelj, 2004). Ovaj uticaj moguće je proceniti na nekim varijablama čija nam je populacijska distribucija već poznata, ali najčešće ne i za varijable kod kojih nam je ta distribucija nepoznata, a koje su glavni predmet istraživanja i interesovanja istraživača.

71 Ovi procenti moraju se sabirati do 100. Nema prepreke da se koriste i pro-

porcije (one se moraju sabirati do 1).

Page 244: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIPREMA PODATAKA ZA ANALIZU

233

Povećanje varijanse anketnog statistika nastalo kao rezultat ponderisanja nazi-va se i greškom podešavanja (engl. adjustment error), a ukoliko dovodi do razlike između anketnog statistika i parametra populacije naziva se pristrasnošću podešava-nja (engl. adjustment bias).

10.5. Imputacija nedostajućih podataka

Kao što je rečeno, ponderisanje se koristi kada izabrani ispitanici iz bilo kog razloga nisu odgovorili na celokupnu anketu. Nekada ispitanici koji su odgovorili na anketu ne odgovore na pojedina pitanja. U matricama podataka se ovakvi slučajevi nazivaju nedostajućim podacima. U nedostajuće podatke ne spadaju prazne ćelije matrice podataka za pitanja na koje ispitanik nije ni trebalo da odgovori i na to bi treba-lo obratiti pažnju.

Mehanizmi javljanja nedostajućih podataka mogu biti razni. Uobičajena podela je na podatke koji nedostaju potpuno slučajno (engl. missing completely at random – MCAR), slučajno (engl. missing at random – MAR) i one čija distribucija nije slučajna (engl. missing not at random – MNAR, a nekada i not missing at random – NMAR) (Rubin, 1987; Waal et al., 2011).

Kada je u pitanju mehanizam potpuno slučajno nedostajućih podataka (MCAR), neodgovori ispitanika na posmatrano pitanje nisu povezani sa vrednošću koju bi ispitanik imao na njemu kada bi odgovorio, niti sa vrednostima na drugim varijablama u matrici podataka.

To npr. znači da, da li će ispitanik na pitanje o visini primanja dati odgovor ili ne, ne zavisi od visi-ne njegovih primanja niti od drugih varijabli koje su ispitivane (radno mesto, sektor, dužina rad-nog staža, pol, starost...). Neodgovori na pitanje su potpuno slučajni, a razlozi zbog kojih odgovori nedostaju ne mogu se povezati sa bilo kojom ispitivanom varijablom.

Posmatrano iz drugog ugla, skup odgovora se može smatrati slučajnim podsku-pom skupa podataka koji bismo imali da su svi ispitanici odgovorili na pitanje.

Do pojave nedostajućih podataka ovog tipa dolazi kada ispitanik slučajno zabo-ravi da odgovori na pitanje ili se podaci slučajno izgube u kasnijoj obradi... Ono što je bitno je da se ispitanici koji su odgovorili na pitanje i oni koji to nisu – ne razlikuju po konstruktu koje to pitanje meri (Bennett, 2001). Procena parametra populacije samo na osnovu odgovora onih ispitanika koji su dali odgovor ne bi bila pristrasna (iako se zbog smanjenog uzorka povećava margina greške).

Slučajno nedostajući podaci (MAR) nastaju kada verovatnoća neodgovora ispitanika na neko pitanje nije povezana sa vrednošću koju bi ispitanik imao na toj vari-jabli, ali može se predvideti na osnovu nekih drugih varijabli u matrici podataka (Ben-nett, 2001).

Page 245: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

234

U primeru sa visinom primanja, to bi značilo da se po verovatnoći neodgovora razlikuju ispitanici iz privatnog i javnog sektora, ali unutar tih grupa mehanizam nedostajanja podataka na pitanju o visini primanja je MCAR, odnosno ne zavisi od visine primanja.

Ukoliko je moguće utvrditi varijable sa kojima je povezana verovatnoća nedos-tajanja podataka, moguće je izvršiti i korekciju. Mehanizam nedostajanja podataka MAR se od MCAR razlikuje u tome što kod MAR može postojati povezanost nedostajanja podataka na nekoj varijabli sa drugim izmerenim varijablama, a kod MCAR ta poveza-nost ne postoji. Sličnost je u tome što verovatnoća nedostajanja podataka ne nekoj vari-jabli ne zavisi od vrednosti koju bi ispitanici imali na njoj da je izmerena. Upravo po tome se MAR i MCAR mehanizmi razlikuju od MNAR mehanizma.

Podaci koji ne nedostaju slučajno (MNAR) javljaju se kada je verovatnoća neodgovora na neko pitanje povezana sa vrednošću koju bi ispitanik imao na tom pita-nju, a moguće je da bude povezana i sa drugim varijablama koje koreliraju sa onom na kojoj podaci nedostaju. S obzirom da se ispitanici koji su odgovorili i oni koji nisu razli-kuju po posmatranoj varijabli, analiza samo kompletnih slučajeva dala bi pristrasne pokazatelje (videti odeljak 5.3).

Opet, na primeru pitanja o visini primanja, MNAR mehanizam se javlja kada, recimo, osobe sa visokim primanjima odbijaju da daju odgovor u većoj meri nego one sa niskim. Pri tome verovat-noća neodgovora bi mogla biti veća u javnim nego u privatnim preduzećima (ali nije nužno).

Korekcija ovakvih nedostajućih podataka zahteva modelski pristup koji u obzir uzima sve povezane varijable.

Nedostajući podaci mogu se još podeliti na one koji se mogu ignorisati i one koji ne mogu. Termini koji se koriste u engleskom jeziku su ignorable nonresponse i no-nignorable nonresponse. Na srpski bi se oni mogli prevesti i kao zanemarljivi neodgo-vori i nezanemarljivi neodgovori, respektivno. Podela se zasniva na tome da li meha-nizam nedostajanja podataka utiče na pristrasnost procena. Zanemarljivi neodgovori ne rezultiraju pristrasnim procenama, dok nezanemarljivi rezultiraju pristrasnim proce-nama. Ovo se može reći i na drugi način. Kod zanemarljivih neodgovora parametri koji utiču na mehanizam nedostajanja nisu povezani sa parametrom koji se procenjuje. Kada su u pitanju nezanemarljivi neodgovori, parametri koji utiču na nedostajanje podataka moraju biti modelovani u sklopu procene parametara koji nas zanimaju. Problem je što podaci koje imamo ne daju odgovor na pitanje o tome koji bi model bio prikladan, te je potrebno značajno predznanje o ispitivanoj pojavi (Allison, 2001).

Podela na zanemarljive i nezanemarljive neodgovore se preklapa sa podelom na MCAR, MAR i MNAR. Nedostajući podaci po mehanizmima MCAR i MAR su zanemar-ljivi, dok su MNAR nezanemarljivi.

Prilikom nadomeštanja, odnosno imputacije nedostajućih podataka, potrebno je znati da li su nedostajući podaci zanemarljivi ili ne, odnosno da li je mehanizam nedos-tajanja MNAR ili MAR (i MCAR). Postupci za nadomeštanje nedostajućih podataka

Page 246: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIPREMA PODATAKA ZA ANALIZU

235

poput višestruke imputacije i metode maksimalne verodostojnosti baziraju se na pretpostavci da je mehanizam nedostajanja bar MAR, dok se izbacivanje nekompletnih slučajeva bazira na pretpostavci da je mehanizam nedostajanja MCAR.

Na žalost, ne postoji statistička procedura kojom možemo utvrditi da li su nedostajući podaci zanemarljivi ili ne, odnosno MAR ili MNAR. U proceni se moramo osloniti na logiku i poznavanje pojave i nacrta istraživanja (McKnight, McKnight, Sidani, & Figueredo, 2007).

Da podaci ne nedostaju po MCAR mehanizmu može se relativno lako proveriti. Potrebno je kreirati novu binarnu varijablu72 koja ima vrednost 1 ukoliko je ispitanik odgovorio na pitanje koje nas zanima, a vrednost 0 ukoliko nije. Zatim se ta novokrei-rana varijabla može koristiti kao grupišuća (nezavisna) u t-testu gde je zavisna neka varijabla intervalnog nivoa merenja čiju povezanost sa mehanizmom nedostajanja podataka želimo da proverimo. Ukoliko se grupa sa nedostajućim podacima i ona bez razlikuju po vrednostima na zavisnoj varijabli, možemo reći da mehanizam nedostaja-nja podataka nije MCAR. Ukoliko je ta druga varijabla nominalnog nivoa merenja može se koristiti χ2 test. Povezanost mehanizma nedostajanja podataka sa skupom prediktora može se ispitati upotrebom binarne logističke regresije itd.

Međutim, ukoliko neodgovori nisu povezani ni sa jednom drugom varijablom u skupu podataka, to još uvek ne znači da je mehanizam nedostajanja MCAR. Potrebno je ispitati da li su neodgovori povezani sa vrednostima koje bi ispitanik ostvario na pos-matranoj varijabli da je odgovorio. Inače, ovo je jedini uslov za mehanizam nedostajanja MAR i osnovna razlika od MNAR mehanizma. Pretpostavku da nedostajući podaci na nekoj varijabli nisu povezani sa potencijalnim vrednostima koje bi ispitanici imali na njoj ne možemo testirati upravo zbog toga što ispitanici nisu odgovorili, odnosno, ne možemo je testirati samo na osnovu prikupljenih podataka (Allison, 2001). Da bi istraži-vač isključio mogućnost postojanja MNAR mehanizma nedostajanja podataka potrebno je da prikupi određenu količinu nedostajućih podataka ponovnim kontaktiranjem (nas-tavkom anketiranja engl. follow-up) ispitanika koji nisu odgovorili. Ukoliko se odgovori ovih ispitanika, koji u prvom navratu nisu odgovorili, značajno razlikuju od ispitanika koji su dali odgovor, možemo zaključiti da mehanizam nedostajanja nije MAR već MNAR.

Praktično, analizom razlika između grupa ispitanika koji su odgovorili i onih koji nisu (bez prikupljanja dodatnih podataka), mi ne možemo potvrditi da je mehani-zam nedostajanja MCAR (ni MAR), ali ga možemo opovrći ukoliko utvrdimo da razlike postoje. Stoga, samo odsustvo MCAR mehanizma nedostajanja može biti pouzdano detektovano, ali ne i prisustvo (McKnight et al., 2007).

72 Ovakve varijable se još nazivaju „indikator varijablama“, a često se i u srp-

skom jeziku koristi termin pozajmljen iz engleskog jezika „dami varijabla“ (engl. dummy)

Page 247: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

236

Međutim, Šefer (Schafer, 1997) navodi četiri slučaja u kojima se sa velikom sigurnošću može pretpostaviti da je mehanizam nedostajanja MAR.

Prvi slučaj je situacija dvostrukog uzorkovanja (engl. double sampling). Naime, radi se o situaciji kada smo već prikupili podatke za sve ispitanike. Tada se slučajnim uzorkovanjem među ispitanicima koji imaju nedostajuće podatke može izabrati podu-zorak ispitanika koje ćemo ponovo kontaktirati i na kojem ćemo prikupiti nedostajuće podatke (tzv. follow-up), a možemo ih pitati i o razlozima zašto u prvobitnom merenju nisu dali odgovore73. Pošto smo iz skupa svih ispitanika kojima nedostaju podaci, slu-čajnim izborom izdvojili deo i na njemu prikupili nedostajuće podatke, ostatak kod kojih oni još uvek postoje, takođe postaje slučajan poduzorak. Mehanizam nedostajanja podataka biće tada MAR ukoliko izbor poduzorka vršimo samo na osnovu informacija prikupljenih na celokupnom uzorku.

Drugi slučaj su anketna istraživanja u kojima istraživači nemaju informacije o ispitanicima koji nisu dali odgovor. Ukoliko se radi o velikom uzorku, a istraživač je u mogućnosti da među ispitanicima koji nisu dali odgovor izabere slučajan uzorak na kojem će dobiti dodatne informacije (follow-up), mehanizam nedostajanja može se sma-trati MAR.

Treća situacija se odnosi na randomizovane studije u kojima su ispitanici svrs-tani u različite uslove. Ukoliko nastane disbalans u veličini grupa koji nije rezultat sis-tematskog činioca već kao rezultat slučaja, mehanizam nedostajanja opravdano je smat-rati MAR.

Četvrta situacija liči na situaciju sa dvostrukim uzorkovanjem. Merenje se obavi na kompletnom uzorku, a dodatna merenja se obavljaju na slučajno izabranom podu-zorku. Razlika u odnosu na prvu situaciju je u tome što ova dodatna merenja nisu ni planirana da budu vršena na celokupnom uzorku. To praktično znači da će oni ispitanici koji nisu ušli u poduzorak imati nedostajuće podatke na dodatnim merenjima, odnosno, za neke ispitanike podaci nedostaju jer nije ni bilo planirano da ih prikupimo. Ovakvi nedostajući podaci nazivaju se i planiranim nedostajanjem (engl. planned missingness) i mogu uticati na smanjenje cene i povećanje efikasnosti istraživanja (Schafer & Gra-ham, 2002). I u ovom slučaju mehanizam nedostajanja je opravdano smatrati MAR.

Takođe, prema Šeferu (Schafer, 1997) postoje tri slučaja u kojima je mehani-zam nedostajanja MAR malo verovatan ili nedokaziv.

Prvi slučaj su anketna istraživanja u kojima nema naknadnih intenzivnih poku-šaja da se pribave nedostajući podaci, i od ispitanika koji nisu odgovorili dobije bar naznaka zašto to nisu učinili. Drugi slučaj je u eksperimentalnim nacrtima gde su nedos-tajući podaci (njihov broj) različito zastupljeni u različitim eksperimentalnim uslovima.

73 To može ukazati na nerazumljivost pitanja, neprimenljivost ili druge razloge

koji mogu uticati na neodgovore.

Page 248: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIPREMA PODATAKA ZA ANALIZU

237

Na kraju, treća situacija odnosi se na posmatračke studije kada istraživač ne može da kontroliše da li će podaci nedostajati ili ne (deo populacije koji se sistematski razlikuje od ostatka nije dostupan istraživaču). Ovakvi nedostajući podaci se ne mogu zanemari-ti, odnosno ne možemo smatrati da su nastali po MAR mehanizmu.

U statističkom softveru kao što su IBM SPSS i R postoje procedure za imputaci-ju nedostajućih podataka i ujedno za analizu mehanizma nedostajanja. Vrlo često se upotrebljava grafički prikaz obrazaca nedostajućih podataka. Za ovu namenu vrlo su korisni R paketi „mice“ (Multivariate Imputation by Chained Equations) i „VIM“ (Visuali-zation and Imputation of Missing Values) čiji opis se može naći u članku Džonga (Zhang, 2015), ali i „Amelia“, „missForest“, „Hmisc“, „mi“, „MissMech“...

Dijagram agregacije (engl. aggregation plot) je čest način prikazivanja sklo-pova odgovora ispitanika. Ovaj dijagram ima oblik matrice (Slika 8 desno) u kojoj su u kolonama predstavljene varijable, a u redovima sklopovi odgovora. Varijable su obično sortirane po broju nedostajućih podataka, a sklopovi odgovora po učestalosti javljanja. U zavisnosti od softvera koji se koristi, smer sortiranja može se razlikovati (od varijabli sa najvećim brojem nedostajućih podataka ka onim sa najmanjim i od najčešćih sklopo-va ka najređim – ili obrnuto). Različitim bojama označeni su nedostajući i postojeći podaci (u ovom slučaju sivim su označeni nedostajući, a belim prisutni). Namenjen je vizualizaciji sklopova nedostajućih odgovora, a cilj je da uočimo učestale a neobične

Slika 8 –Dijagram agregacije sklopova odgovora i nedostajućih podataka

Page 249: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

238

sklopove odgovora/neodgovora.

Ako je mehanizam nedostajanja podataka MAR (i MCAR), u matrici ne bi smelo da bude pravilnosti, odnosno, nedostajući podaci bi morali biti nasumično razbacani.

Ovaj grafikon (Slika 8) odnosi se na simulirane podatke (n=1000) u kojima varijabla 1 nema nedostajućih podataka, varijabla 2 ima po 1% nedostajućih podataka po MCAR mehanizmu, dok varijable 3 i 4 imaju po 34,9% i 19,1% podataka koji nedos-taju po MAR mehanizmu. Broj nedostajućih podataka na ove dve varijable povezan je samo sa rezultatom na varijabli 1. Na grafikonu, sa desne strane, nalazi se matrica sklo-pova odgovora i prikazane su učestalosti (u obliku proporcija) pojedinih sklopova. Sklopovi su prikazani u redovima, pri čemu su varijable (kolone) na kojima nedostaju podaci osenčene sivom bojom. Varijable su poređane po proporciji nedostajućih poda-taka u opadajućem nizu sa leva na desno. Sklopovi odgovora (nedostajućih podataka) poređani su po učestalosti javljanja od dole ka gore. Sa leve strane grafikona prikazan je histogram sa proporcijama nedostajućih podataka po varijablama, a sa desne strane matrice, (uzani) histogram učestalosti sklopova.

Grafikon je izrađen u „VIM“ paketu R okruženja.

Vidimo da na varijabli 1 nema nedostajućih podataka. Proporcija ispitanika sa kompletnim podacima je 0,587 (odnosno 58,7%) i ovo je ujedno najčešći sklop. Zatim sledi sklop odgovora u kojima nedostaje samo podatak na varijabli 3 (21,5%) i onaj u kojem nedostaju odgovori i na varijabli 3 i na varijabli 4 (13,8%). Sledeći najučestaliji sklop odgovora je onaj u kojem nedostaju odgovori na varijabli 4 (5,8%). Da je mehani-zam nedostajanja varijabli 3 i 4 bio MCAR, očekivano bi bilo da najčešći sklopovi budu oni u kojima nedostaje podatak na varijabli 3, zatim onaj sa nedostajućim podatkom na varijabli 4, pa zatim njihova kombinacija. Zbog toga što je mehanizam nedostajanja na obe ove varijable MAR i povezan je sa vrednostima slučajeva na varijabli 1, sklop u kome nedostaju podaci na obe ove varijable je učestaliji nego što je očekivano. Može se primetiti i da je sklop sa tri nedostajuća podatka neočekivano češći od sklopa u kojem istovremeno nedostaju podaci na varijablama 4 i 2. To je takođe rezultat činjenice da varijable 3 i 4 imaju MAR mehanizam nedostajanja povezan sa vrednostima na varijabli 1.

Svi ostali sklopovi su znatno manje zastupljeni (manje od 0,5%). Kada bi mehanizam nedostajanja podataka bio MCAR mogli bismo očekivati da nedostajući podaci budu nasumice razbacani po varijablama (Slika 10).

Na grafikonu (Slika 10) su prikazani simulirani podaci (n=1000) kod kojih su učestalost nedostajućih podataka (10%) kao i mehanizam nedostajanja podataka MCAR jednaki za sve varijable (osim varijable 1). Vidimo da su različiti sklopovi sa samo jed-nim nedostajućim podatkom približno jednako zastupljeni. To važi i za različite sklopo-ve sa dva nedostajuća podatka s tim da su ovi sklopovi znatno ređi od onih sa jednim. Na grafikonu nema sklopova sa tri nedostajuća podatka, ali su i oni mogući.

Page 250: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIPREMA PODATAKA ZA ANALIZU

239

Uočite razliku u odnosu na prethodni grafikon (Slika 8) na kome vidimo da je sklop sa nedostajućim podacima na varijablama 3 i 4 znatno učestaliji od ostalih sklo-pova sa dva nedostajuća podatka. Ovo je rezultat činjenice da je kod obe verovatnoća nedostajanja podataka povezana sa vrednošću koje slučaj ima na varijabli 1. I sama činjenica da neke varijable imaju značajno više nedostajućih podataka od ostalih može ukazivati da nedostajanje podataka nije slučajno.

Slika 10 – Dijagram agregacije sklopova odgovora i nedostajućih podataka (MCAR)

Slika 9 – Dijagram agregacije sklopova odgovora i nedostajućih podataka u IBM SPSS Statistics

Page 251: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

240

U IBM SPSS-u se ovaj grafički prikaz donekle razlikuje (Slika 9 i Slika 11 ). Mat-rica sklopova i histogram njihove učestalosti dati su zasebno. Histogram ne pokazuje učestalost nedostajućih podataka po varijablama već učestalost sklopova. Matrica sklo-pova sortirana je obrnuto. Najučestaliji sklopovi su u gornjem delu matrice, a varijable sa najviše nedostajućih podataka su na desnoj strani matrice.

Sklopovi odgovora sa nedostajućim podacima mogu se prikazati i analizirati i tabelarno. U tabeli (Tabela 7) koja je dobijena paketom „‚mice“ u okruženju R, prikazani su isti podaci koji su ranije predstavljeni grafički (Slika 8). U prvoj koloni nalazi se učes-talost javljanja određenog sklopa izražena kao broj slučajeva kod kojih se takav sklop javio. U poslednjoj koloni nalazi se broj varijabli na kojima nedostaje podatak za svaki od opaženih sklopova. U kolonama u sredini (onim sa nazivima varijabli) sa 0 su ozna-čene one kod kojih u nekom od sklopova nedostaje podatak, a sa 1 one kod kojih nema nedostajućih podataka. U poslednjem redu date su učestalosti nedostajućih podataka za svaku varijablu, izražene kao broj slučajeva kod kojih nedostaje podatak na određenoj varijabli. Tabela 7 – Sklopovi odgovora sa nedostajućim podacima

br.skl. var1 (MCAR) var2 (MCAR) var4 (MAR) var3 (MAR) br.n.p. 587 1 1 1 1 0 215 1 1 1 0 1 58 1 1 0 1 1

130 1 1 0 0 2 5 1 0 1 1 1 2 1 0 1 0 2 1 1 0 0 1 2 3 1 0 0 0 3 10 10 347 338 705

Slika 11 – Histogram učestalosti sklopova nedostajućih podataka u IBM SPSS Statistics

Page 252: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIPREMA PODATAKA ZA ANALIZU

241

Sklopovi (u redovima) su sortirani po učestalosti, od najbrojnijeg ka najređim, a varijable (kolone) od onih sa najmanje nedostajućih podataka (levo) ka onim sa najvi-še (desno).

I ovde vidimo da je najčešći sklop onaj u kojem nema nedostajućih podataka, a zatim slede oni u kojima nedostaju odgovori na varijabli 4 i varijabli 3. Sledeći najčešći sklop je onaj u kojem nedostaju podaci i na varijabli 4 i na varijabli 3. Ostali sklopovi su znatno ređi.

Trebalo bi pomenuti još i matrične dijagrame (engl. matrix plot). Ovi dijagra-mi (Slika 12) su po izgledu slični dijagramima agregacije, koji takođe imaju oblik matri-ce. U matričnim dijagramima u redovima su prikazani svi (ili eventualno odabrani slu-čajevi). U kolonama su prikazane varijable po redosledu koje imaju u matrici podataka. Na ordinati je prikazan indeks, odnosno broj slučajeva.

Nedostajući podaci su prikazani jednom bojom (u našem primeru crvenom), a zabeleženi podaci nijansama druge boje (u primeru – crne, odnosno sive). Odgovori ili neodgovori ispitanika su u suštini prikazani pravougaonicima, ali u slučaju velikog bro-ja ispitanika liče na linije.

Svetle nijanse sive boje predstavljaju niske vrednosti neke varijable, a tamne visoke. Dijagram (Slika 12) je sortiran po varijabli 1, što se vidi po postepenom prelazu od svetlih do tamnih nijansi sive boje u koloni koja predstavlja tu varijablu. Iz ovog dijagrama jasno možemo videti da je mehanizam nedostajanja na varijablama 3 i 4

Slika 12 – Matrični dijagram nedostajućih podataka

Page 253: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

242

povezan sa rezultatima ispitanika na varijabli 1. Nedostajući podaci su znatno češći kod ispitanika sa niskim rezultatima na varijabli 1.

Ovaj grafikon je izrađen u paketu „VIM“ u R okruženju (Kowarik & Templ, 2016). Paket „VIM“ omogućava kreiranje interaktivnog dijagrama i njegovo sortiranje klikom na željenu kolonu, što znatno olakšava otkrivanje mehanizma nedostajanja pojedinih varijabli i drugih varijabli u skupu podataka.

10.5.1. Tretmani nedostajućih podataka

Postoje dve šire strategije „borbe“ sa nedostajućim podacima. Jedna je izbaci-vanje nedostajućih slučajeva iz analiza, a druga je nadomeštanje (imputacija) nedostaju-ćih podataka. Ipak, najbolje rešenje je postarati se da ne bude nedostajućih podataka. Statistički postupci koji se koriste da bi se nedostajući podaci nadomestili nikada ne mogu popraviti greške nastale zbog lošeg terenskog rada (Allison, 2001). Međutim, i pored sveg truda može doći do pojave nedostajućih podataka. U tom slučaju jako je bitno istražiti i zabeležiti zašto se oni javljaju kako bismo mogli utvrditi mehanizam nedostajanja i eventualno primeniti odgovarajući metod imputacije. Podsećamo, samo na osnovu prikupljenih podataka nemoguće je utvrditi da li su nedostajući podaci zanemarljivi ili ne, odnosno da li nedostaju po MCAR, MAR ili po MNAR mehanizmu.

Ukoliko nedostajućih podataka nema puno, pristup sa obradom samo komple-tnih slučajeva (engl. complete case analysis), odnosno izbacivanjem nekompletnih (engl. listwise deletion), može biti najekonomičniji. Međutim, kada kažemo „nema puno nedostajućih podataka“ to može značiti više stvari.

Prva od njih je proporcija ili procenat nedostajućih podataka. Procenat nedos-tajućih podataka koji se obično smatra prihvatljivim kreće se od 5% (Schafer, 1999) do 10% (Bennett, 2001), ali u suštini zavisi od istraživanja do istraživanja. Naime, kao što je već rečeno, veličina uzorka se planira u skladu sa budžetom istraživanja, ali se uvek ima u vidu namena i potrebna preciznost procena kako bi cilj istraživanja bio ostvaren. Ukoliko smanjenje uzorka za 1% (npr. 1% neodgovora) umanji preciznost procena toliko da one izađu iz zadovoljavajućeg opsega i ovoliki broj nedostajućih podataka može se smatrati prevelikim.

Osim toga, bitan je i mehanizam nedostajanja. Ukoliko procenat nedostajućih podataka nije veliki, ali mehanizam nedostajanja nije slučajan, procene mogu imati zadovoljavajuću preciznost, ali mogu biti pristrasne.

Osim proporcije i tipa nedostajućih podataka bitno je i kako su oni raspoređeni po ispitanicima i varijablama. Prvi je slučaj kada su nedostajući podaci koncentrisani kod malog broja ispitanika. U takvoj situaciji iz analiza na kompletnim podacima bio bi izbačen mali broj ispitanika što bi u manjoj meri uticalo na smanjenje uzorka i preciz-nosti procena.

Druga situacija je kada su nedostajući podaci grupisani na malom broj varijabli

Page 254: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIPREMA PODATAKA ZA ANALIZU

243

(anketnih pitanja). U tom slučaju, ukoliko te varijable nisu esencijalne za istraživanje mogu se izostaviti, odnosno, ne moraju se analizirati.

Ukoliko su, međutim, nedostajući podaci razbacani na većem broju ispitanika izbacivanje nekompletnih slučajeva može značajno smanjiti veličinu uzorka i povećati varijansu uzorkovanja, odnosno standardnu grešku parametra (Tabachnick & Fidell, 2007; Waal et al., 2011).

Prema nekim autorima (King, Honaker, Joseph, & Scheve, 2001) ako se analize vrše samo na kompletnim slučajevima iz analize se eliminiše u proseku oko trećine uzorka. Osim toga, izbacivanjem nekompletnih slučajeva gubi se deo realnih podataka koje ispitanici sa nekompletnim podacima jesu dali.

Ispitanici sa nekompletnim podacima ne moraju biti isključeni iz svih analiza (engl. listwise deletion), već samo iz onih za koje im podaci nedostaju (engl. pairwise deletion). Ovaj pristup se naziva analizom dostupnih slučajeva (engl. available case analysis). Iako i ovde postoji smanjenje veličine uzorka ono je manje nego kada ukla-njamo sve nekompletne slučajeve iz svih analiza. Međutim, ovakav pristup, osim sma-njenim uzorkom, može rezultirati time da analize na različitim varijablama budu rađe-ne na poduzorcima koji se u velikoj meri razlikuju, posebno ako mehanizam nedostaja-nja nije slučajan.

Sa aspekta statističkog zaključivanja, izbacivanje nekompletnih slučajeva ekvi-valentno je situaciji u kojoj bi nedostajuće podatke nadomestili aritmetičkom sredi-nom74 dobijenom samo na kompletnim slučajevima (Groves, 2009). Praktično, ovde se radi o implicitnoj imputaciji nedostajućih podataka, što je drugi pristup tretmanu nedo-stajućih podataka o kojem ćemo govoriti.

Ukoliko mehanizam nedostajanja nije MCAR, analize na kompletnim ili dostup-nim slučajevima mogu rezultirati pristrasnim procenama (Bennett, 2001).

Tabela 8 – Nedostajući podaci

varijabla 1 varijabla 2 varijabla 3 ispitanik 1 1 2 ispitanik 2 3 1 ispitanik 3 3 3 ispitanik 4 5 4 ispitanik 5 1 2 1

𝑋𝑋� 3,00 2,00 2,20

74 Naravno, ako je varijabla bar intervalnog nivoa i procenjujemo aritmetičku

sredinu.

Page 255: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

244

U prethodnoj tabeli (Tabela 8) prazne ćelije, osenčene sivim, predstavljaju nedostajuće podatke. Kada bismo iz analize izbacili sve ispitanike koji imaju nedostajuće podatke, za analizu bi nam preostao samo ispitanik 5. Ukoliko bismo izbacivali nekompletne slučajeve od analize do analize, aritmetičku sredinu bismo za varijable 1 i 2 izračunali na po tri ispitanika. Međutim, problem je to što bi u slučaju varijable 1 to bili ispitanici 2, 4 i 5, a u slučaju varijable 2, ispitanici 1, 3 i 5. Ova dva skupa (uzorka) preklapaju se samo jednim slučajem. Na ovaj način različiti pokazatelji mogu biti izračunati na uzorcima koji se u velikoj meri razlikuju, pri čemu bi korisnici istraživanja (ređe i sam istraživač) mogli biti u zabludi da se radi o istom uzorku.

Inače, na podacima iz tabele možemo videti i da je izbacivanje nekompletnih slučajeva ekvivalen-tno nadomeštanju nedostajućih podataka aritmetičkom sredinom dobijenom na kompletnim slu-čajevima. Za varijablu 1:

𝑋𝑋�𝑣𝑣1 =3 + 5 + 1

3 =3 + 3 + 3 + 5 + 1

5 = 3,00

i za varijablu 2:

𝑋𝑋�𝑣𝑣2 =1 + 3 + 2

3 =1 + 2 + 3 + 2 + 2

5 = 2,00

I pomenuti drugi pristup, imputacija nedostajućih podataka, ima određene pre-dnosti i mane. Prednosti su te što metod imputacije postaje poznat (za razliku od impli-citne imputacije), ne smanjuje se veličina uzorka, sve analize se obavljaju na uzorcima iste veličine i koriste se svi podaci koje su ispitanici zaista dali. Iako se, kao što smo videli, imputacija dešava i kada je ne koristimo, neki istraživači osećaju nelagodnost u radu sa imputiranim vrednostima jer ih doživljavaju kao „izmišljene“. Ozbiljniji prob-lem je taj što se u statističkom softveru one tretiraju kao i bilo koji drugi podaci, što dovodi do smanjenih procena standardnih grešaka sa svim posledicama koje to ima (Groves, 2009). O pokušaju rešavanja ovog problema biće reči nešto kasnije.

10.5.1.1. Metodi imputacije nedostajućih podataka

Čest način imputacije je onaj u kojem se nedostajući podaci nadomeštaju arit-metičkim sredinama i medijanom (centralnom vrednošću) ukoliko su intervalnog ili ordinalnog nivoa merenja, te modom (dominantnom vrednošću) ukoliko se radi o vari-jablama na nominalnom nivou merenja. Nedostatak ovakve imputacije je što se naruša-va distribucija varijable za koju se vrši imputacija (Groves, 2009). Naime, ukoliko posto-ji veći broj nedostajućih podataka koji bivaju zamenjeni nekom srednjom vrednošću, raspodela varijable postaje zašiljena sa izraženim šiljkom koji čini upravo srednja vre-dnost (realna i imputirana). Na taj način se potcenjuje varijansa posmatrane varijable, a posledično i standardna greška, odnosno intervali poverenja i margina greške. Problem se može korigovati dodavanjem slučajnog elementa u imputirane vrednosti. Ovaj ele-ment jednak je slučajnom broju iz normalne distribucije sa nultom aritmetičkom sredi-nom i varijansom jednakom poznatoj varijansi varijable za koju se vrši imputacija. Imputirana vrednost (za aritmetičke sredine) tada ima oblik 𝑋𝑋�𝑣𝑣𝑖𝑖 + 𝑠𝑠𝑣𝑣𝑖𝑖2 , gde je 𝑠𝑠𝑣𝑣𝑖𝑖2 upravo navedena slučajna vrednost koja može biti veća ili manja od 0. Samim tim imputirane

Page 256: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIPREMA PODATAKA ZA ANALIZU

245

vrednosti slučajno postaju manje ili veće od aritmetičke sredine varijable dobijene na kompletnim slučajevima, ali njihov prosek će joj i dalje biti jednak.

Kvalitet imputacije i preciznost anketnih pokazatelja može se poboljšati ako se prethodno opisani postupak imputacije vrši po grupama slučajeva. Grupe slučajeva formiraju se na osnovu varijabli koje su značajno povezane sa varijablom za koju se vrši imputacija. U ovakvom pristupu nedostajući podaci ispitanika u okviru pojedinačnih grupa (stratuma) zamenjuju se prosečnim vrednostima (sa dodatkom slučajnog ele-menta) izračunatim na kompletnim slučajevima grupa kojima pripadaju. Naravno, za ovo je potrebno poznavati pripadnost ispitanika stratumima.

Imputacija nedostajućih vrednosti može se vršiti i upotrebom regresione anali-ze. Ovakav način u velikoj meri se poklapa sa imputacijom po grupama. U regresionom pristupu kriterijumska varijabla je ona za koju vršimo imputaciju, a kao prediktori kori-ste se varijable za koje znamo da su značajno povezane sa njom. U prvom koraku izra-čunavaju se regresioni koeficijenti na osnovu kompletnih slučajeva, a zatim se dobijeni model primenjuje na predviđanje nedostajućih podataka. I u ovom slučaju imputiranim vrednostima dodaje se slučajni element.

Za potrebe imputacije može se koristiti jedan ili više prediktora. Neki od predi-ktora i sami mogu imati nedostajuće podatke za koje je neophodno prethodno izvršiti imputaciju. U zavisnosti od vrste kriterijuma i prediktora (njihovog broja, nivoa mere-nja, odnosa, broja nivoa imputirane varijable ukoliko je kategorijalna...) može se koristi-ti jednostavna ili višestruka linearna regresija, binarna i multinomialna logistička regresija...

Sledeći često primenjivani način imputacije je tzv. hot deck imputacija. U ovom postupku slučajevi se sortiraju po varijablama koje su značajno povezane sa varijablom za koju se vrši imputacija i značajno predviđaju neodgovore. Prilikom sortiranja trebalo bi voditi računa da slučajevi budu sortirani po varijabli za koju je poznato da ima najja-ču povezanost sa varijablom za koju se vrši imputacija, zatim po onoj koja je po snazi povezanosti sledeća i tako dalje. Ove varijable ne smeju imati nedostajućih vrednosti. Ukoliko one ipak postoje potrebno je prethodno izvršiti imputaciju na njima.

Nakon sortiranja prolazi se kroz matricu podataka i traži prva nedostajuća vre-dnost na varijabli za koju se vrši imputacija. Ako prvi slučaj u matrici poseduje traženi odgovor, on se beleži i naziva se hot deck vrednost. Međutim, ukoliko već u prvom slu-čaju imamo nedostajuću vrednost ona se zamenjuje prosekom dobijenim na komplet-nim slučajevima. Ovaj prosek može biti zasnovan na ukupnom uzorku ili na proseku specifične grupe kojoj slučaj sa nedostajućom vrednošću pripada. Upotrebljena vred-nost se beleži i naziva cold deck vrednošću. Postupak se ponavlja za svaki naredni slu-čaj. Ukoliko podatak nedostaje menja se hot deck vrednošću, a ukoliko je prisutan pos-taje nova hot deck vrednost. Na ovaj način nedostajuće vrednosti se menjaju odgovori-ma koji su dali slučajevi najsličniji po značajno povezanim varijablama. U terminologiji

Page 257: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

246

hot deck imputacije slučaj kojem se imputira vrednost naziva se primalac, a slučaj od kojeg se preuzima hot deck vrednost naziva se donor (Andridge & Little, 2010). Opisani metod imputacije, odnosno biranja donora, naziva se metodom najbližeg suseda (engl. nearest neighbor hot deck imputation).

I ovaj metod imputacije takođe se može smatrati vidom regresione imputacije (Groves, 2009). U hot deck imputaciji nedostajuću vrednost (kriterijum) predviđamo na osnovu postojećih vrednosti slučajeva koji su najsličniji na prediktorima. To je u velikoj meri slično zameni nedostajuće vrednosti prosekom postojećih vrednosti za slične slu-čajeve, pri čemu se slučajna komponenta (rezidual) preuzima od najsličnijeg slučaja.

Trebalo bi napomenuti da postoje i varijante ovog metoda imputacije u kojima se hot deck vrednost bira slučajno iz grupe potencijalnih donora odnosno iz skupa dono-ra (engl. donor pool). Ova varijanta se naziva slučajnom hot deck imputacijom (engl. random hot deck imputation). Potencijalni skup donora može se birati na različite nači-ne. Već je opisan metod najbližeg suseda, koji se naziva još i determinističkim metodom. Osim ovog metoda izbora skupa donora postoje i metodi koji se baziraju na pokazate-ljima bliskosti poput maksimalnih odstupanja, Euklidovih i Mahalanobisovih distanci i sl. U skup donora ulaze kompletni slučajevi čije mere distance od primaoca ne prelaze ranije definisanu kritičnu vrednost za koju se istraživač odlučio. Kada se skup donora određuje na ovaj način, onda se konkretni donor iz skupa bira metodom slučajnog izbo-ra. Treća varijanta je ona u kojoj su svi kompletni slučajevi potencijalni donori, ali od bliskosti sa primaocem zavisi verovatnoća njihovog slučajnog biranja. Verovatnoća biranja pojedinog donora obrnuto je proporcionalna njegovoj bliskosti sa primaocem (Andridge & Little, 2010).

Dobra strana hot deck imputacije i razlog za njenu popularnost je što nije modelski zasnovana i nije osetljiva na pogrešne specifikacije kao parametrijski modeli. Takođe, primenom ovog vida imputacije ne mogu biti imputirane vrednosti koje su nemoguće pošto se vrednosti preuzimaju od donora. Osim toga, hot deck imputacija može smanjiti pristrasnost nedogovora u onoj meri u kojoj su varijable na osnovu kojih se imputacija vrši povezane sa samom varijablom za koju se vrši imputacija i tendenci-jom neodgovora (Andridge & Little, 2010).

Postoji i cold deck imputacija, koja liči na pomenutu hot deck imputaciju sa tom razlikom što se vrednosti koje se imputiraju ne baziraju na skupu podataka za koji se vrši imputacija, već se koriste nalazi iz prethodnih sličnih istraživanja (Bennett, 2001). I u ovom metodu imputacija se može vršiti po grupama ispitanika koji dele neka bitna obeležja. Kvalitet imputacije će, naravno, zavisiti od kvaliteta prethodnih istraživanja na koja se oslanjamo.

Metode imputacije bazirane na regresionim modelima, hot deck i cold deck imputacija pretpostavljaju MCAR ili MAR mehanizme nedostajanja. U suprotnom, pro-cene dobijene na podacima kompletiranim na ovaj način mogu biti vrlo pristrasne

Page 258: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIPREMA PODATAKA ZA ANALIZU

247

(Bennett, 2001).

U longitudinalnim istraživanjima je čest metod imputacije prenošenje posled-nje vrednosti. Kada nekom od ispitanika na nekom od merenja nedostaje vrednost, imputira se vrednost koju je imao na prethodnom merenju. Iza ovog metoda imputacije stoje pretpostavke da je mehanizam nedostajanja MCAR i da se mereni konstrukt nije promenio (Bennett, 2001).

Još jedan metod imputacije koji je sve češće u upotrebi je metoda maksimalne verodostojnosti – ML (engl. maximal likelihood). Ovaj metod može se koristiti za esti-maciju različitih linearnih modela pod pretpostavkom multivarijatne normalne raspo-dele. Suština metode maksimalne verodostojnosti u svim primenama je da kao procene bira one vrednosti koje maksimizuju verovatnoću da budu opaženi oni podaci koji i jesu zaista opaženi (Allison, 2001). Drugim rečima, kao procene se biraju one vrednosti koje maksimizuju verovatnoću reprodukovanja opažene matrice podataka.

Prilikom imputacije nedostajućih vrednosti vrlo često se u metodi maksimalne verodostojnosti koristi EM algoritam (engl. expectation maximization). Tako se naziva jer se sastoji iz dva koraka: E koraka i M koraka. Najjednostavnije opisan on izgleda ovako:

Kreće se sa E korakom, koji se svodi na klasičnu regresionu imputaciju. Kao prediktori koriste se sve varijable u matrici podataka. Nedostajuće vrednosti parameta-ra menjaju se polaznim vrednostima matrice, odnosno aritmetičkim sredinama i kova-rijansama baziranim na kompletnim slučajevima (listwise ili pairwise). Na osnovu tako izračunatih regresionih modela vrši se imputacija nedostajućih vrednosti. Tako se zavr-šava E korak.

Kada su imputirane sve vrednosti, u M koraku se ponovo procenjuju polazni parametri. Prilikom računanja aritmetičkih sredina koriste se standardne formule, ali prilikom računanja varijansi i kovarijansi u svim formulama koje koriste nedostajuće vrednosti neophodna je modifikacija. Ona se sastoji u tome što se uračunava i rezidual-na varijansa (i kovarijansa) iz regresionog modela korišćenog za predikciju tih nedosta-jućih vrednosti. Na ovaj način se koriguje problem sa potcenjivanjem varijansi na osno-vu standardne imputacije.

Kada na ovaj način budu izračunate nove aritmetičke sredine, varijanse i kova-rijanse, kreće novi E korak koji ih koristi kao polazne vrednosti. Ovaj postupak je itera-tivan i ponavlja se dok se ne postigne konvergencija, odnosno dok promene između dve iteracije ne postanu zanemarljive (Allison, 2001; Graham, 2009).

Ovaj metod je pogodan zato što ne zahteva odluku o tome koje varijable treba uzeti kao prediktore nedostajućih podataka (pošto se koriste sve) i uvek kreće od kom-pletne matrice kovarijansi, pa je moguće dobiti procene nedostajućih vrednosti bez obzira na to koliko podataka nedostaje. Nedostaci ovog metoda su što pretpostavlja

Page 259: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

248

dovoljno veliki uzorak kako bi procene bile nepristrasne. Kada je u pitanju upotreba ML pristupa za nadomeštanje nedostajućih podataka u anketnim istraživanjima ovo može biti veliki problem pošto se prilikom planiranja uzorka istraživač obično vodi i budže-tom istraživanja i „pruža“ koliko može.

Pretpostavka ovog metoda imputacije je da je mehanizam nedostajanja MAR inače rezultira pristrasnim pokazateljima (Bennett, 2001).

Metodi višestrukih imputacija su primenljivi na bilo kom tipu podataka, mogu koristiti bilo koji model (pa i ML) i mogu se obaviti u konvencionalnom statističkom softveru (Allison, 2001). Za sve metode je zajedničko da se ne imputira samo jedna vrednost po nedostajućem podatku već se to čini više puta.

Ove metode prevazilaze nedostatke koje imaju metode koje možemo nazvati jednostrukim imputacijama. Problem koji je zajednički za metode jednostrukih impu-tacija je taj što se veštački umanjuje varijansa varijable za koju se vrši imputacija, a samim ti potcenjuje standardna greška, odnosno intervali poverenja i margina greške. Takođe, pošto se imputirane vrednosti statistički tretiraju isto kao i realno opažene, nije moguće proceniti komponentu varijanse koja je rezultat same imputacije.

Kao što je rečeno, u metodi višestrukih imputacija nedostajuće vrednosti se ne nadomeštaju jednom vrednošću već se to čini više puta. Broj imputacija (obično se označava sa M) ne mora biti veliki i najčešće je dovoljno 5 do 10 (Rubin, 1987). Na taj način kreira se M kompletnih matrica podataka na kojima se rade analize i za svaki pokazatelj dobija M neznatno različitih vrednosti. Ukupni pokazatelj se dobija kao pro-sek ovih M različitih vrednosti:

𝜃𝜃�𝑀𝑀𝑀𝑀 =

1𝑀𝑀� 𝜃𝜃�𝑚𝑚

𝑀𝑀

𝑚𝑚=1

[ 71 ]

gde je 𝜃𝜃�𝑀𝑀𝑀𝑀prosek procena parametra 𝜃𝜃 dobijen na osnovu M procena na osnovu istog broja matrica podataka, m je indeks matrice podataka.

S druge strane, varijansa parametra 𝜃𝜃�𝑀𝑀𝑀𝑀 zasnovanog na višestrukim imputaci-jama sastoji se od dve komponente: varijanse unutar (engl. within) imputacija i varijan-se između (engl. between) imputacija. Varijansa između imputacija nastaje kao rezultat neodgovora (nedostajućih vrednosti).

Varijansa unutar imputacija može se izračunati na sledeći način:

𝑠𝑠𝑤𝑤2 =

1𝑀𝑀� �̂�𝑠𝑚𝑚2𝑀𝑀

𝑚𝑚=1

[ 72 ]

Varijansa između imputacija (engl. between) se može izračunati na osnovu sle-dećeg izraza:

Page 260: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIPREMA PODATAKA ZA ANALIZU

249

𝑠𝑠𝑏𝑏2 =

1𝑀𝑀��𝜃𝜃�𝑚𝑚 − 𝜃𝜃�𝑀𝑀𝑀𝑀�

2𝑀𝑀

𝑚𝑚=1

[ 73 ]

Procena varijanse parametra 𝜃𝜃�𝑀𝑀𝑀𝑀 baziranog na višestrukim imputacijama, dalje se može dobiti kao suma varijanse unutar imputacija i varijanse između imputacija (pomnožene korekcijom za konačan broj imputacija) (Waal et al., 2011):

�̂�𝑠𝑀𝑀𝑀𝑀2 = 𝑠𝑠𝑤𝑤2 + �1 +1𝑀𝑀�𝑠𝑠𝑏𝑏2 [ 74 ]

Iz izraza [ 73 ] možemo zaključiti da, kada ne bi bilo nedostajućih vrednosti, varijansa između imputacija bi iznosila 0. Svih M matrica podataka bile bi jednake, pa bi i svi 𝜃𝜃�𝑚𝑚parametri bili jednaki parametru 𝜃𝜃�𝑀𝑀𝑀𝑀 . Takođe, sve varijanse unutar imputacija (𝑠𝑠𝑤𝑤2 ) bile bi jednake proceni varijanse baziranoj na višestrukim imputacijama �̂�𝑠𝑀𝑀𝑀𝑀2 . Na ovaj način, varijansa koja nastaje kao rezultat nedostajućih podataka postaje izračunlji-va i dostupna u obliku varijanse između imputacija (Waal et al., 2011).

Postupak višestruke imputacije ima tri osnovna koraka: 1) uvođenje slučajne varijacije u proces imputacije i generisanje nekoliko (M) matrica podataka sa donekle različitim imputiranim vrednostima, 2) analiza M matrica podataka sa imputiranim vrednostima i 3) kombinovanje rezultata u jedan skup procena parametara, standar-dnih grešaka i statistika (Marsden & Wright, 2010).

Rubin (1987) je opisao jedan od mogućih postupaka višestruke imputacije. Prvi korak je formiranje modela na osnovu kojeg će biti imputirane nedostajuće vrednosti. Za ovu svrhu moguće je koristiti regresioni model (prilagođen tipu podataka). Prilikom gradnje modela esencijalno je da budu izabrani odgovarajući prediktori. Na osnovu kompletnih podataka procenjuju se regresioni koeficijenti standardne regresione jed-načine (prikazan model za dva prediktora):

𝑦𝑦� = 𝑏𝑏0 + 𝑏𝑏1𝑋𝑋1 + 𝑏𝑏2𝑋𝑋2 [ 75 ]

gde je y varijabla nad kojom se vrši imputacija, b nestandardizovani regresioni koefici-jenti, a X prediktori.

Zatim se u regresionu jednačinu uvrštavaju tako procenjeni regresioni koefici-jenti i vrednosti na prediktorima i na osnovu toga predviđaju nedostajuće vrednosti. Međutim, kako bi bilo izbegnuto veštačko umanjenje varijanse varijable nad kojom se vrši imputacija, standardna regresiona jednačina modifikuje se dodavanjem slučajne komponente greške:

𝑦𝑦� = 𝑏𝑏0 + 𝑏𝑏1𝑋𝑋1 + 𝑏𝑏2𝑋𝑋2 + 𝑠𝑠𝐸𝐸 [ 76 ]

gde je E slučajno odabrana vrednost iz normalne distribucije sa aritmetičkom sredinom 0 i standardnom devijacijom 1, a s procenjena standardna devijacija komponente greš-

Page 261: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

250

ke regresionog modela (RMS greške)75.

Dodavanje ove komponente greške povećava varijansu varijable za koju se vrši imputacija na vrednost koja je bliska pravoj. Na ovaj način bio bi rešen problem pristra-snosti parametra, ali bi procena standardne greške i dalje bila preniska pošto ne bi uračunavala i varijansu koja je rezultat imputacije (Marsden & Wright, 2010). Zato se pribegava višestrukoj imputaciji, odnosno, opisani postupak se ponavlja M puta što rezultira sa isto toliko kompletiranih matrica podataka (kao što je ranije opisano).

Ovih M matrica se statistički obrađuju na standardne načine i za svaku od ana-liziranih varijabli dobija M obično neznatno različitih pokazatelja. Na osnovu ovakvih pokazatelja dalje se računa ukupna procena kao njihov prosek (recimo, koristeći izraze [ 71 ]–[ 74 ]).

Metode višestrukih imputacija daće nepristrasne procene ukoliko je mehani-zam nedostajanja MCAR ili MAR (Bennett, 2001).

Imputacija upotrebom MCMC (Markov Chain Monte Carlo) algoritma funkcio-niše slično ML imputaciji i takođe se može koristiti za višestruke imputacije (Allison, 2001). Markovljev lanac (engl. Markov Chain) je niz slučajnih varijabli u kojem distribu-cija jednog elementa zavisi samo od vrednosti prethodnog. U MCMC simulacijama lanac se konstruiše da bi se utvrdila distribucija od interesa. Iterativnim postupkom se izvla-če imputirane procene iz distribucije (Lin, 2010).

Ovaj proces ima nekoliko koraka. U prvom koraku izračunava se matrica arit-metičkih sredina i kovarijansi na osnovu postojećih podataka i koristi za procenu prior-ne distribucije (engl. prior distribution). Zatim sledi korak imputacije (I) u kom se slučaj-nom metodom simuliraju nedostajuće vrednosti iz nje. Korak se ponavlja sve dok razli-ka vektora aritmetičkih sredina i matrice kovarijansi između dve iteracije ne bude manja od unapred definisane kritične vrednosti. Ukoliko je ovaj cilj postignut, vrednosti iz poslednje iteracije se koriste za imputaciju nedostajućih vrednosti. Ukoliko nije, pre-lazi se u posterior korak (P) u kojem se ponovo računa vektor aritmetičkih sredina i matrica kovarijansi koristeći imputirane vrednosti (posteriorna distribucije – engl. pos-terior distribution) i na tim vrednostima ponavlja I korak (Lin, 2010). Ovaj metod ne pretpostavlja određeni mehanizam nedostajanja podataka i ne potcenjuje varijansu imputirane varijable (Bennett, 2001).

Dobar običaj je da se prilikom imputacije, za svaku varijablu napravi indikator varijabla koja uka-zuje koje su vrednosti originalne, a koje imputirane. Na taj način analitičar može, u zavisnosti od

75 Problem ovakvog pristupa je što procene regresionih parametara na uzorku

tretira kao prave populacione vrednosti koje nam ostaju nepoznate. Unapređenje ove metode zahteva da regresioni parametri budu slučajan uzorak iz Bejzove (Bayes) apos-teriori distribucije parametara (čiji opis prevazilazi domet ovog udžbenika) (Allison, 2001).

Page 262: Bojan Janičić - digitalna.ff.uns.ac.rs

PRIPREMA PODATAKA ZA ANALIZU

251

procene da li je smisleno koristiti imputirane vrednosti ili ne, da ih uvrsti ili ne uvrsti u analizu (Groves, 2009). To je praksa i u procedurama imputacije u statističkom softveru.

Takođe, trebalo bi voditi računa da, ukoliko se imputacija vrši, onda je to potrebno učiniti pre ponderisanja.

Page 263: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

252

11. Pisanje i slanje izveštaja

Pisanje izveštaja predstavlja „krunu“ anketnog istraživanja. Izveštaj je doku-ment u kojem su predstavljene sve prethodne faze istraživanja.

U njemu bi trebalo objasniti kontekst i razloge za sprovođenje istraživanja, opi-sati korišćenu metodologiju, rezultate i zaključke koji se iz njih mogu izvesti. Izveštaj mora sadržavati podatke koji će čitaocu omogućiti da shvati šta je cilj i predmet istraži-vanja i šta smo na osnovu njega saznali. Osim toga, izveštaj mora pružiti relevantne informacije na osnovu kojih bi kompetentan čitalac mogao da evaluira sam postupak istraživanja. Potrebno je navesti i eventualne manjkavosti i ograničenja istraživanja kako bi to bilo jasno i nešto manje upućenom čitaocu, a onima upućenijima stavilo do znanja da su istraživači vodili računa o tome.

Izveštaj je potrebno prilagoditi krajnjem korisniku. Ukoliko su korisnici izveš-taja i sami stručnjaci iz oblasti istraživanja, u izveštaju se mogu koristiti stručni termini karakteristični za tu oblast. Međutim, ako krajnji korisnici nisu samo stručnjaci, izveštaj mora biti prilagođen i ne sme se koristiti usko stručna terminologija.

Prilikom pisanja izveštaja moramo pretpostaviti da ne razumeju svi korisnici statističku notaciju i statistiku uopšte. Rezultate statističkih testova potrebno je inter-pretirati i objasniti rečima.

Umesto:

„Korelacija između visine primanja i pozitivnog stava prema izgradnji tržnih centara iznosi r=.37, p<.05“,

bolje je napisati:

„Pirsonov koeficijent korelacije između visine primanja i (pozitivnog) stava prema izgradnji tržnih centara je statistički značajan i iznosi r=.37“,

a još bolje:

„Osobe sa višim primanjima imaju pozitivnije stavove prema izgradnji tržnih centara od osoba sa nižim primanjima, a ta povezanost je umerena (r=.37, p<.05)“.

Page 264: Bojan Janičić - digitalna.ff.uns.ac.rs

PISANJE I SLANJE IZVEŠTAJA

253

Kada je izveštaj pisan sa puno stručnih i tehničkih detalja, stručnim jezikom i terminologijom, postoji mogućnost da ga korisnici koji ne poseduju dovoljno znanje iz te oblasti ne razumeju. S druge strane, ako je izveštaj pisan suviše pojednostavljeno uz detaljno objašnjenje nekih poznatijih pojmova, stručniji korisnici ovakav izveštaj mogu smatrati neprofesionalnim, a ponekad i potcenjivačkim i uvredljivim. Prema tome, pot-rebno je naći ravnotežu između dva ekstrema.

Izveštaji, odnosno rezultati anketnih istraživanja, mogu imati i format baza podataka. Baze podataka su pogodne jer koristeći njih svaki potencijalni korisnik može dobiti interaktivni izveštaj, odnosno izveštaj prilagođen njegovim potrebama76.

Već smo rekli da je izveštaj nekog anketnog istraživanja po formi sličan bilo kom drugom naučnom izveštaju.

Svaki izveštaj bi trebalo da ima: naslov, sažetak, uvod, deo o metodu, rezultati-ma, zaključke, bibliografiju i eventualne priloge.

11.1. Naslov

Naslov bi trebalo da bude jasan i koncizan. Ukoliko je potrebno dodatno pojaš-njenje ono se može naći u podnaslovu.

Na primer, naslov istraživanja bi mogao glasiti:

„Stavovi građana Republike Srbije prema rađanju“,

a podnaslov:

„Ispitivanje uticaja kampanje Ministarstva kulture i Saveta za populacionu politiku RS na stavove prema rađanju“

Naslov bi trebalo svakako da se nađe na koricama izveštaja, ali i na početku izveštaja, odnosno na njegovoj prvoj strani.

Naslovna strana bi osim samog naslova trebalo da sadrži imena i afilijacije autora izveštaja, datum njegovog kreiranja, te naziv organizacije koja je sprovela istra-živanje i organizacije koja ga je sponzorisala.

11.2. Sažetak

Svaki izveštaj bi trebalo da ima sažetak koji se obično nalazi na početku izveš-taja, nakon naslovne strane. U ovom sažetku bi trebalo da se nađu glavni rezultati i zaključci istraživanja. Namenjen je da zainteresuje potencijalnog korisnika, a može mu služiti i kao podsetnik za kasniju upotrebu izveštaja u celini. U sažetku je potrebno u kratkim crtama predstaviti ciljeve istraživanja i korišćenu metodologiju, a najveći nje-

76 Primer takvog izveštaja mogla bi biti baza podataka Republičkog zavoda za

statistiku, dostupna na adresi http://data.stat.gov.rs/?caller=SDDB.

Page 265: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

254

gov deo bi trebalo da se odnosi na rezultate. U sažetku nije potrebno ići u detalje pošto će oni biti objašnjeni u samom izveštaju. Valja imati na umu glavnu namenu sažetka, a to je da motiviše potencijalne korisnike da pročitaju izveštaj u celini. Dužina sažetka nije ograničena i zavisi od obima samog istraživanja i integralnog izveštaja, pa, prema tome, sažetak može zauzimati samo jednu stranu, a može imati i desetak strana.

11.3. Uvod

U uvodnom delu izveštaja potrebno je detaljnije objasniti pozadinu istraživa-nja. Navesti koji su njegovi ciljevi i zašto je odlučeno da se istraživanje sprovede baš u tom trenutku i na način na koji je sprovedeno. Na ovom mestu navode se i prethodna istraživanja i teorije na kojima se ono bazira, odnosno ono što je poslužilo kao inspiraci-ja za njegovo sprovođenje.

U uvodnom delu izveštaja potrebno je jasno definisati ciljeve istraživanja i nje-gov značaj. Takođe, potrebno je definisati probleme istraživanja i obrazložiti pristup koji je odabran za njihovo ispitivanje.

Ovde je potrebno pomenuti i opisati preliminarna istraživanja na osnovu kojih su autori definisali problem i razvili instrument/e za njegovo merenje. Tu se navode i izvori koje su autori koristili.

U uvodnom delu postavljaju se i eventualne hipoteze istraživanja, a autori bi trebalo da pokažu da bez informacija koje je donelo istraživanje one nisu bile, niti bi mogle biti proverene.

11.4. Metod

U poglavlju o metodu istraživači bi trebalo da daju sve potrebne informacije koje bi mogle da omoguće ponavljanje studije i proveru dobijenih nalaza. Takođe, ovi podaci omogućavaju kritičku evaluaciju istraživanja od strane kompetentnih stručnja-ka.

Ovaj deo izveštaja bi trebalo da pruži informacije o metodama koje su korišće-ne za prikupljanje i analizu podataka. Za anketna istraživanja sprovedena na uzorku bitne su tri grupe informacija: 1) uzorkovanje, 2) prikupljanje podataka i 3) analiza podataka.

Deo o uzorkovanju bi trebalo da opiše proceduru kojom je formiran uzorak, odnosno:

definiciju ciljne populacije da li je postojao okvir uzorkovanja i/ili kako je kreiran (uz osvrt na

potencijalne izvore pristrasnosti) koja je veličina uzorka i kako je određena (uz osvrt na margine greške i

intervale poverenja)

Page 266: Bojan Janičić - digitalna.ff.uns.ac.rs

PISANJE I SLANJE IZVEŠTAJA

255

koja metoda uzorkovanja je korišćena

Informacije koje se odnose na prikupljanje podataka bi trebalo da sadrže poda-tke o:

metodama prikupljanja podataka vremenskom okviru ankete načinu regrutovanja i izbora anketara (za ankete licem u lice i telefon-

ske) načinu slanja anketa (poštanske ankete) načinu prezentacije i slanja poziva (za onlajn ankete) procedurama ponovnog kontaktiranja (follow-up) ili slanja podsetnika stopi odgovora uočenim mogućim izvorima pristrasnosti (nepokrivenost, neodgovo-

ri...) i objašnjenje njihovog mogućeg uticaja na anketne statistike

U odeljku koji se odnosi na analizu podataka potrebno je ukratko navesti:

da li je korišćeno ponderisanje i poststratifikacija tretmane nedostajućih podataka koji su korišćeni korišćene statističke analize i testove, njihovo značenje i značaj

Takođe, u odeljku o metodu poželjno je još jednom se osvrnuti na intervale poverenja i sa njima direktno povezane margine greške. Podsećamo da intervali pove-renja zavise od veličine uzorka i varijabilnosti merene pojave. U jednom anketnom istraživanju veličina uzorka je približno ista za većinu varijabli (osim u slučajevima kada nije predviđeno da na neko pitanje odgovaraju svi ili se na pitanje javi veliki broj neodgovora). Međutim, varijable se razlikuju po svom varijabilitetu. Samim tim margi-na greške ne mora biti ista za sve varijable.

Osim ovih informacija u ovom odeljku mogu se naći informacije o korišćenom instrumentu: vrsti pitanja, načinu njihove konstrukcije i evaluacije i slično.

11.5. Rezultati

Poglavlje sa rezultatima bi trebalo da predstavlja najveći deo izveštaja. U nje-mu bi tabelarno ili grafički trebalo prikazati nalaze istraživanja, odnosno rezultate sta-tističkih analiza. Svaka tabela ili grafikon bi trebalo da budu propraćeni odgovarajućom deskriptivnom statistikom i verbalnim objašnjenjima prikazanih rezultata.

Tabele i grafikoni bi trebalo da se nalaze što bliže mestu gde se po prvi put spominju. Na taj način čitaoci će lako moći da provere interpretaciju rezultata koju im nudi istraživač ili eventualno da dođu do svoje interpretacije, koja ne mora nužno biti istovetna. Tabele i grafikoni moraju biti numerisani i imati odgovarajuće naslove. Na taj način moguće je pozivati se na njih iz različitih delova teksta. Neka istraživanja pokazu-ju da korisnici preferiraju grafikone u odnosu na tabele, a takođe više vole kada su gra-

Page 267: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

256

fikoni u boji (Rea & Parker, 2014).

Podatke koji su prikazani grafički nije nužno predstavljati i tabelarno. Ukoliko autor smatra da su tabele izuzetno značajne može i njih staviti u tekst, ali zbog čitljivos-ti izveštaja valja razmotriti ideju da se one stave u priloge.

Naravno, sami grafikoni nisu dovoljni. Njih bi trebalo da prati tekst koji objaš-njava šta je grafikonom prikazano. Tekst ne bi trebalo da objašnjava sve što se vidi na grafikonu. Dovoljno je istaći najbitnije nalaze.

Na primer...

Gornji grafikon možemo opisati na sledeći način:

Istraživanje je pokazalo da građani Kraljevine Stradije od institucija najviše poverenja imaju u Centralnog revizora koruptivnih vladinih agencija – CRKVA (53%), Vladu (nešto više od 25%), nje-govog brata (20%), a najmanje u Nevladine organizacije (1%).

Sami grafikoni i tabele bi trebalo da budu pregledni. Iako statistički i softver za uređivanje teksta omogućavaju razne načine „ulepšavanja“ grafikona i tabela, treba se voditi svrhom prikazivanja grafikona i tabela. Ono što želimo je da korisnicima na pre-gledan i jasan način prikažemo rezultate. Suviše boja i oblika mogu delovati kontrapro-duktivno, odvlačiti pažnju i zbunjivati čitaoce. Iako je rečeno da su istraživanja pokazala da čitaoci preferiraju grafikone u boji, njihovo bojenje i ukrašavanje ne bi trebalo da postanu sami sebi svrha.

Analize koje su dovoljno jasno predstavljene u tekstu nije potrebno prikazivati i grafički osim ako grafikon ne dodaje još neku novu informaciju.

Page 268: Bojan Janičić - digitalna.ff.uns.ac.rs

PISANJE I SLANJE IZVEŠTAJA

257

Na primer, ukoliko smo rekli da muškarci daju statistički značajno višu ocenu programu određene televizije (Mm=8.6 i Mž=6.4, t(998)=30.225, p<.05), nema prevelike potrebe da to korisnicima i crtamo (Slika 13 levo). Šta više, na ovaj način možete i uvrediti korisnika pošto mu crtate nešto što je očigledno i zbog toga se može doživeti kao potcenjivanje. Ovakav grafikon možda ima smis-la ukoliko na njega dodamo i intervale poverenja aritmetičkih sredina (Slika 13 desno) jer se na taj način vidi i kolika je zaista razlika (bez obzira kolika je apsolutna razlika između dva pokazatelja, ona nije značajna ukoliko se intervali poverena preklapaju).

11.6. Zaključci

Na kraju, u delu sa zaključcima istraživač bi trebalo da na osnovu prikazanih rezultata izvrši integraciju nalaza. U ovom delu bi trebalo ukazati na postojanje određe-nih trendova ukoliko se mogu uočiti (ili ukazati da oni ne postoje), na povezanosti između varijabli, razlike između grupa subjekata i slično.

U ovom odeljku potrebno je osvrnuti se i na sličnosti ili razlike nalaza sa nala-zima prethodnih studija ili očekivanjima u postojećoj literaturi iz oblasti na koju se odnosi istraživanje. Naravno, to sve zavisi od vrste i namene ankete. Ukoliko ste anketu sproveli sa ciljem da steknete prvi uvid o nekoj pojavi ili populaciji, možda neće biti moguće pozvati se na nalaze prethodnih studija, ali možete reći koliko se rezultati slažu sa očekivanjima od kojih ste krenuli.

Ukoliko je to moguće i umesno, u ovom delu mogu se predložiti određene akci-je. Takođe, mogu se izneti preporuke za naredna istraživanja. Naravno, potrebno je osvrnuti se i na eventualne nedostatke samog istraživanja i kako su ti nedostaci mogli uticati na tačnost i preciznost anketnih statistika i na osnovu njih donetih zaključaka.

Na ovom mestu valja se osvrnuti na pojavu takozvanih Barnumovskih izveštaja. Termin Barnum efekat skovao je i prvi pominje Mil (Meehl, 1956) u kontekstu opisa ličnosti na osnovu psiholoških testova, a problemom se ranije bavio i Forer (1949) pa

Slika 13 – Prikaz aritmetičkih sredina sa i bez intervala poverenja

Page 269: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

258

se nekada koristi i termin Forerov efekat.

„Barnumovski“ izveštaji su izveštaji koji se sastoje od trivijalnih tvrdnji koje su tačne samo zato što važe za sve slučajeve ili veliku većinu slučajeva. Ako i postoje tvrd-nje koje nisu trivijalne one su malobrojne i svoju eventualnu tačnost duguju velikoj baznoj stopi (učestalosti u populaciji). Sami ispitanici, odnosno oni na koje se ovakvi izveštaji odnose, skloni su da ih prihvate kao tačne, često ne obraćajući pažnju na činje-nicu da su oni tačni za sve ljude. Iako se Barnum efekat izvorno pominje u vezi sa izveš-tajima koji se odnose na opise ličnosti pojedinaca, nije ga teško generalizovati na izveš-taje o bilo čemu drugom, pa i na izveštaje koji bi se odnosili na probleme koji su pred-met različitih anketnih istraživanja. Bilo bi dovoljno pogledati izveštaje koje su brojne vladine komisije i agencije dužne da sastavljaju, javna preduzeća, obrazovne ustanove, projektni timovi... da bismo zaključili da je Barnum efekat prisutan i u tim oblastima.

U kontekstu interpretacije psiholoških testova Barnumovski izveštaj mogao bi se ilustrovati tvrd-njama poput „Ispitanik ima snažnu želju da bude prihvaćen od strane drugih“ (ko ne želi?) ili „Ponekad je ekstovertiran, društven, a ponekad introvertiran, povučen“ (ko nije?).

U kontekstu izveštaja anketnog istraživanja Barnum efekat bi se mogao ilustrovati rečenicama: „Ispitanici vide prostor za poboljšanje funkcionisanja sistema zdravstvene zaštite i stoga predla-žemo da Vlada Kraljevine Švedske sprovede adekvatne mere“.

Ovakva rečenica zvuči sasvim suvislo, ali šta ona zapravo kaže i kakve to veze ima sa nalazima istraživanja?

Kao prvo, uvek postoji prostor za poboljšanje sistema zdravstvene zaštite. Čini se realno nemogu-ćom situacija u kojoj bi ispitanici rekli: „Sistem zdravstvene zaštite je savršen – ne dirajte ništa“. Za to saznanje nam nije bilo potrebno anketno istraživanje. Recimo, da smo tako nešto ipak saz-nali iz podataka. Predlog mere koji je naveden je takođe prilično Barnumovski. O kojim se „adek-vatnim merama“ radi? Ako se već daju preporuke u tom smislu, one bi trebalo da budu konkret-ne. Inače, da bi trebalo unapređivati zdravstvo, znali smo i bez istraživanja pa novac uložen u nje-ga možemo smatrati bačenim.

U slučaju da podaci ne dozvoljavaju nikakve konkretne zaključke na osnovu kojih bi se mogla preporučiti neka konkretna akcija, onda je bolje to tako i reći.

11.7. Literatura

Kao svaki izveštaj nastao kao rezultat naučnog istraživanja, i izveštaj anketnog istraživanja bi trebalo da sadrži spisak literature koja je korišćena u svim fazama istra-živanja. Izvori bi trebalo da budu citirani u prethodnim odeljcima, a stil citiranja i navo-đenja literature u skladu sa nekim od prihvaćenih standarda u oblasti iz koje je istraži-vanje. Uobičajeno je da se u oblasti prirodnih nauka, psihologije, pedagogije, koristi APA stili ili standard (American Psychological Association), u oblasti humanističkih nauka standard MLA (Modern Language Association), Chicago/Turabian standard koristi se u oblasti istorije, umetnosti i ekonomiji, IEEE standard (Institute for Electrical and Elec-tronics Engineers) u oblasti elektronike. Postoje i drugi stilovi ali su navedeni najčešće u upotrebi.

Page 270: Bojan Janičić - digitalna.ff.uns.ac.rs

PISANJE I SLANJE IZVEŠTAJA

259

11.8. Prilozi

U priloge autor može staviti sve one podatke za koje smatra da mogu biti zna-čajni čitaocu izveštaja, ali da bi opteretili sam izveštaj i učinili ga manje preglednim i razumljivim. U priloge mogu biti smeštene velike tabele koje su u tekstu izveštaja saže-to opisane i interpretirane. Takođe, tu se mogu naći i dodatni grafikoni i korišćeni ins-trumenti ili njihovi delovi.

11.9. Prezentacija

Prezentacija istraživanja kreirana u nekom softveru za prezentacije, naravno, nije sastavni deo izveštaja, ali jeste nezaobilazni deo predstavljanja rezultata. Prezenta-cija bi trebalo da sledi formu izveštaja. Naslovni slajd bi trebalo da sadrži naslov istraži-vanja i datum prezentacije, nazive organizacija koje su sprovele i finansirale istraživa-nje, imena autora i afiliacije.

Na sledećem slajdu dobro je prikazati cilj istraživanja i osnovne podatke koji se tiču metodologije istraživanja poput: ciljne populacije, vremenskog perioda u kojem je istraživanje obavljeno, veličine uzorka, preciznosti (margina greške), nacrta uzorkova-nja, metoda prikupljanja podataka, eventualnih postupaka pripreme podataka za anali-zu (poststratifikacija, tretman nedostajućih podataka) i ispitivanih konstrukata.

U nastavku je potrebno predstaviti glavne nalaze istraživanja (voditi se sažet-kom 11.3) koristeći pre svega grafikone kako bi bile iskorišćene prednosti vizualizacije podataka.

Page 271: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

260

12. Etička pitanja

Etička pitanja u vezi sa anketnim istraživanjima su u različitim zemljama regu-lisana na različite načine. U pojedinim zemljama ona su regulisana kodeksima i statuti-ma profesionalnih udruženja organizacija koja se bave anketnim istraživanjima, dok su u drugim ona regulisana specifičnim ili opštim pravnim aktima.

Etička pitanja u vezi sa anketnim istraživanjima mogu se podeliti na pitanja koja se odnose na sâmo istraživanje i na pitanja koja se tiču odnosa prema drugima (kli-jentima, ispitanicima i javnosti) (Groves, 2009). Pravila kojih bi istraživači u oblasti anketnih istraživanja trebalo da se pridržavaju često se nazivaju standardima.

12.1. Standardi u vezi sa istraživanjem

S obzirom da su anketna istraživanja vid naučnih istraživanja, istraživači su dužni da se drže pravila ponašanja koja su primenljiva i na ostale vidove istraživanja. Neprihvatljivim se i u oblasti anketnih istraživanja smatra plagijarizam, falsifikacija i fabrikacija prilikom predlaganja, sprovođenja, pregleda i izveštavanja o rezultatima istraživanja.

Plagijarizam je preuzimanje i korišćenje tuđe intelektualne svojine bez duž-nog citiranja i priznavanja autorstva.

Falsifikacija podrazumeva manipulaciju podacima, istraživačkom opremom i instrumentima, menjanje ili izostavljanje podataka koji dovode do toga da rezultati istraživanja nisu tačno predstavljeni.

Fabrikacija je potpuno izmišljanje podataka ili rezultata i njihovo beleženje i izveštavanje o njima (Groves, 2009)

U anketnim istraživanjima to se ispoljava kao beleženje odgovora koje ispitani-ci koji su izabrani u uzorak nisu dali (odnosi se na pojedina pitanja ili anketu u celini). Takođe, ispoljava se i kao namerno pogrešno kodiranje odgovora kako bi se izbeglo postavljanje dodatnih potpitanja. U falsifikaciju spada i namerno ispitivanje osobe (jedinice) koja nije izabrana u uzorak sa ciljem da se izbegne dodatni napor da se ispita osoba koja je izabrana u uzorak. Beleženje netačnih procesnih podataka je takođe falsi-

Page 272: Bojan Janičić - digitalna.ff.uns.ac.rs

ETIČKA PITANJA

261

fikacija. Ponekad anketari beleže neodgovore kao nevalidne ispitanike kako bi smanjili stopu odbijanja. Takođe, ponekad beleže nepostojeće pokušaje kontakta sa ciljem ostva-rivanja većeg prihoda (ukoliko broj pokušanih kontakata utiče na visinu zarade) (Faj-gelj, 2004; Groves, 2009). Iako se na osnovu ovoga može zaključiti da su za falsifikaciju i fabrikaciju najčešće odgovorni anketari, one mogu nastati u svim fazama anketnog istraživanja i mogu biti rezultat delovanja svih učesnika u anketnom istraživanju (Stacey, 2016). Razlozi i ciljevi za ovakvo postupanje mogu biti razni: od želje da se potvrde polazne hipoteze ili dobiju željeni rezultati, do fabrikacije zbog nemogućnosti da se pribave realni podaci...

Takođe, neprihvatljivo je predstavljanje rezultata anketnih istraživanja na dob-rovoljcima kao pravog anketnog istraživanja. Ovakve ankete česte su na internet porta-lima časopisa i informativnih kuća. U njima je uzorak dvostruko ograničen. Učestvuju samo posetioci tih portala i to oni koji svojevoljno tako odluče, odnosno, posebno su motivisani da učestvuju. Ako imamo na umu da se ljudi za posećivanje određenih porta-la opredeljuju u skladu sa svojim interesovanjima i uverenjima, jasno je da će u najve-ćem broju slučajeva rezultati ovakvih anketa biti pristrasni i to u smeru stavova i vred-nosti koje zagovara portal koji organizuje anketu. Samim tim, predstavljanje rezultata ovakvih istraživanja kao regularnih anketnih istraživanja najverovatnije ima svrhu uticaja na javnost i propagande.

Neprihvatljivim se smatra i otkrivanje identiteta ispitanika koji su učestvovali u anketi, ali o ovom problemu biće reči nešto kasnije.

Standardi, osim preporuka šta je neprihvatljivo, sadrže i postupke koje bi tre-balo primenjivati. U te postupke spadaju probabilističko uzorkovanje i ulaganje napora da se ispitaju ispitanici koji su na taj način izabrani u uzorak (tzv. follow-up), pažljiva konstrukcija i evaluacija anketnog instrumenta, obuka i nadzor anketara itd.

12.2. Standardi u vezi sa javnošću

Dobra praksa u objavljivanju rezultata anketnih istraživanja je već opisana u poglavlju o pisanju izveštaja.

Kada se objavljuju izveštaji anketnih istraživanja potrebno je da javnost zna na koga se zaključci istraživanja odnose, odnosno koja je ciljna populacija (uključujući i vremenski okvir). Kako bi moglo biti procenjeno postojanje greške pokrivenosti i greške uzorkovanja, potrebno je navesti okvir uzorkovanja, metod uzorkovanja i veličinu uzor-ka. S obzirom da planirani uzorak obično ne znači i realizovani uzorak, potrebno je navesti stopu odgovora kako bi mogla biti procenjena greška neodgovora. Takođe, pot-rebno je navesti metod prikupljanja podataka, a i korišćeni instrument bi trebalo da bude dostupan kako bi moglo biti procenjeno postojanje greške merenja.

Naravno, da bi javnost mogla da stekne objektivnu sliku o istraživanju, potreb-no je navesti i organizaciju koja je sprovela istraživanje, a takođe i organizaciju koja ga

Page 273: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

262

je finansirala.

12.3. Standardi u vezi sa klijentima

Kada su u pitanju odnosi sa klijentima, odnosno naručiocima istraživanja, prvo pravilo je da ne treba obećavati rezultate koje objektivno nije moguće ostvariti. Ukoliko primenom anketnog istraživanja nije moguće doći do određenih informacija, bilo to zbog ograničenja same tehnike istraživanja ili ograničenja na strani klijenta ili istraži-vača, onda istraživač ne sme preuzeti takvu obavezu na sebe (Groves, 2009). Ovo pravi-lo deluje prilično zdravorazumski i nijedan odgovoran istraživač ga ne bi svesno prekr-šio. Ukoliko se nešto tako ipak desi, potrebno je na vreme reagovati i klijentu objasniti grešku. U protivnom, ovakva situacija može biti motiv za falsifikaciju, fabrikaciju, plagi-jarizam...

Druga obaveza koju istraživač ima prema klijentu je poverljivost podataka. Istraživač ne sme objaviti ništa od podataka i rezultata istraživanja osim onog dela za koje ima eksplicitnu dozvolu klijenta. Jedan izuzetak od ovog pravila je situacija kada istraživač uoči anomalije, odnosno iskrivljavanje rezultata. U tom slučaju dužan je da o njima izvesti klijenta i da ukaže da prikazivanje rezultata sa takvim anomalijama ne bi bilo u redu i da bi navodilo javnost na pogrešne zaključke. Ukoliko istraživač primeti da klijent svejedno objavljuje takve podatke bez upozorenja na anomalije u rezultatima, istraživač ima pravo (i moralnu obavezu) da o tome obavesti javnost.

12.4. Standardi u vezi sa ispitanicima

Tri osnovna načela kojima je potrebno rukovoditi se u istraživanjima koja uključuju ljude kao subjekte su poštovanje ličnosti ispitanika, njegove dobrobiti i načelo pravednosti (De Leeuw et al., 2008; Gideon, 2012; Groves, 2009).

Ova načela se, kada su u pitanju anketna istraživanja, mogu pretočiti u pravila koja ćemo opisati u sledećim odeljcima.

12.4.1. Informisani voljni pristanak

Ispitanici moraju dati informisan i voljan pristanak za učešće u istraživanju. Ispitanik ima pravo da bude obavešten o ciljevima istraživanja, procedurama koje će biti korišćene, kog tipa će biti tražene informacije, trajanju istraživanja, eventualnim rizici-ma, poverljivosti podataka i načinima za njeno obezbeđenje.

Informisani pristanak znači i da ispitanik mora biti obavešten da je istraživanje dobrovoljno i da ima pravo da u svakom trenutku odbije učešće (videti deo o uvodu u poglavlju o formatiranju upitnika 6.5), odnosno da mogu odbiti da odgovaraju na anke-tu u celini ili na neki njen deo. Takođe, moraju znati da odbijanje učešća u istraživanju ili povlačenje iz njega neće imati nikakve negativne posledice po njih.

Ispitanicima se mora realno predočiti da li će imati ikakvu korist od učestvova-

Page 274: Bojan Janičić - digitalna.ff.uns.ac.rs

ETIČKA PITANJA

263

nja u anketnom istraživanju, ali i da li će ih istraživanje nešto koštati. Ukoliko pripadaju grupama koje mogu imati problema sa razumevanjem svih posledica učestvovanja ili neučestvovanja (recimo deca), pored njihovog pristanka poželjno je pribaviti i prista-nak staratelja. Nije dovoljno samo da ispitaniku budu predočene informacije o istraži-vanju, već je potrebno da istraživač bude siguran da ih je potencijalni ispitanik i razu-meo (De Leeuw et al., 2008)

Nekada se traži da ispitanik ovakvu informaciju potpiše, odnosno da dâ infor-misani pristanak. U računarski podržanim anketama, ova informacija se prezentuje ispitanicima kao prva i ispitanik ima mogućnost da prihvati istraživanje ili da ga odbije (pritiskom na odgovarajuće dugme). Započinjanjem ankete smatra se da je ispitanik dao informisani pristanak i nema potrebe za potpisivanjem.

Za razumevanje pojma informisanog pristanka bitni su i pojmovi pritiska (pri-sile), manipulacije i uveravanja (Singer & Bossarte, 2006).

Pod pritiskom u kontekstu učešća u anketnim istraživanjima podrazumevaju se pretnje od strane drugih koji se percipiraju sposobnim da te pretnje i ostvare, a pret-nje su takve da osoba kojoj je prećeno nije u stanju da ih zanemari.

Manipulacija je bilo koji nameran i uspešan oblik uticaja kojim se menjaju opcije koje su na raspolaganju osobi kojom se manipuliše ili se bez uveravanja menja način na koji ih osoba doživljava raspoložive izbore. Može imati različite forme, a pored uskraćivanja i davanja pogrešnih informacija može se javiti i u formi nuđenja nagrada ili pogodnosti za učešće u anketi koja može biti neprijatna ili izazvati negativne posledi-ce po potencijalnog ispitanika.

Uveravanje je pokušaj da se ispitanik privoli na učešće u istraživanju upotre-bom argumenata. Pristanak na učešće u anketi u ovom slučaju je slobodna odluka ispi-tanika koji je prihvatio stavove onoga koji je uticaj vršio. Upotreba obmane, odnosno pružanja pogrešnih informacija ili njihovo uskraćivanje, ne spada u uveravanje već je vid manipulacije.

Ni pretnje, ni manipulativne ponude nisu u suprotnosti sa informisanim i volj-nim pristankom dok god se radi o pretnjama i ponudama koje potencijalni ispitanik može da odbije (Faden & Beauchamp, 1986). Međutim, procena da li se radi o pretnji ili ponudi koja se može odbiti subjektivna je i zavisi od ispitanika. Fejden i Bičam kao kri-terijum predlažu „prosečnu osobu“. Takođe, to što nešto nije u suprotnosti sa voljnim pristankom ne znači i da je moralno.

U vezi sa ovim načelom su pitanja konverzije i nagrađivanja učešća u anketi.

Konverzija je pokušaj da se ispitanik koji je inicijalno odbio učešće u istraživanju privoli da ipak učestvuje. Ranije je već rečeno da u slučaju tvrdog odbijanja ono nije preporučljivo niti produkti-vno. Međutim, meko odbijanje ne mora biti rezultat odnosa ispitanika prema učešću u anketnom istraživanju kao takvom, već može biti reakcija na vreme i situaciju kada je napravljen inicijalni

Page 275: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

264

kontakt. U tom slučaju konverzija se preporučuje kao metod borbe protiv pristrasnosti neodgovo-ra dok god se na ispitanika ne vrši pritisak koji on ne može da odbije.

Što se tiče nagrađivanja (plaćanja) ispitanika za učešće u istraživanju postoje dileme da li ono narušava princip dobrovoljnosti (Singer & Bossarte, 2006). Postoje mišljenja da ispitanici lošijeg materijalnog stanja (koji nemaju luksuz da odbiju materijalni podsticaj) zbog nagrađivanja mogu odlučiti suprotno od svojih uverenja i želja. S druge strane, postoje mišljenja da se ne radi o odstupanju od uverenja i želja već o ekonomskoj računici koja uzima u obzir rizike i dobiti. I ovde se kao kriterijum narušavanja principa dobrovoljnosti može uzeti činjenica da li ispitanik može da odbije ponudu ili ne, odnosno da li je smatra dobrodošlom ili ne (Singer & Bossarte, 2006).

Postoji dva shvatanja kada je potreban informisani pristanak ispitanika. Prema prvom, on je potreban samo kada postoji neki rizik po ispitanika koji proističe iz njego-vog učešća u istraživanju. Drugo je shvatanje da informisani pristanak ispitaniku pruža kontrolu nad informacijama o sebi. Iz tog razloga ispitanik biva obavešten da ne mora da učestvuje u anketi ili da može da odustane kad god želi, iako se na taj način gubi određen broj ispitanika (Groves, 2009). Pored prava da odbije učešće u anketi u celini ili njenim delovima, ispitanik ima pravo i da odbije primenu bilo koje od procedura koje su planirane (npr. snimanja intervjua).

12.4.2. Poštovanje dobrobiti ispitanika

Načelo poštovanja dobrobiti ispitanika znači pre svega da istraživanje ne sme naškoditi ispitaniku. Pri tome se misli na štetu koja može nastupiti na psihološkom, fizičkom, ekonomskom, socijalnom ili zakonskom planu. Istraživanje ne sme inkrimini-sati ispitanika, izložiti ga socijalnoj stigmi, podsmehu, napadima, gubitku posla ili imo-vine.

Pored toga što je istraživač dužan da vodi računa da ne naškodi ispitaniku, načelo dobrobiti kaže da je dužan i da se trudi da unapredi njegovo blagostanje (Gide-on, 2012). Kada se govori o unapređenju blagostanja misli se na lično blagostanje ispi-tanika, njegove porodice ili šire društvene zajednice. Dobrobiti po ispitanika koje proi-zilaze iz istraživanja moraju prevazilaziti potencijalne rizike.

Prema ovom načelu potrebno je, što je više moguće, smanjiti opterećenje ispi-tanika. Sam postupak odgovaranja bi trebalo da traje što je kraće moguće i da bude obavljen u vreme i na mestu koje najmanje remeti ispitanika. Takođe, trebalo bi izbega-vati pitanja koja bi mogla ispitaniku naneti psihički bol, a u objavljivanju rezultata i čuvanju podataka voditi računa o njihovoj poverljivosti kako bi bila izbegnuta posredna ekonomska, socijalna, zakonska ili fizička šteta po ispitanike.

Istraživanje ne bi smelo da dovodi do troškova na strani ispitanika, ne računa-jući utrošeno vreme. Kada je u pitanju vreme koje ispitanik mora da izdvoji za odgova-ranje na anketu, moralna načela nalažu da se i ono minimizuje i da ne bude duže nego što je neophodno.

Načelo pravednosti podrazumeva da rizici i dobrobiti budu pravično raspore-

Page 276: Bojan Janičić - digitalna.ff.uns.ac.rs

ETIČKA PITANJA

265

đeni. Možemo razlikovati socijalnu i individualnu pravednost. Pod socijalnom praved-nošću podrazumevamo da raspodela rizika i dobrobiti bude ravnomerna među različi-tim grupama učesnika u istraživanju. Nijedna grupa ne sme biti povlašćena, odnosno ne smeju joj se nuditi istraživanja od kojih mogu imati koristi, dok se drugoj grupi (ili gru-pama) nude istraživanja koja nose veći potencijalni rizik. Isto se može primeniti i na individualnom nivou.

12.4.3. Zaštita poverljivosti podataka

Jedno od najbitnijih načela je zaštita poverljivosti podataka i ono se nadovezu-je na načelo poštovanja dobrobiti ispitanika.

U anketnim istraživanjima šteta za ispitanika najčešće može nastati otkriva-njem poverljivih informacija, odnosno ukoliko odgovori ispitanika postanu javno dos-tupni. Ukoliko se to desi, ne znači da će nužno nastupiti šteta po ispitanika, ali se otvara mogućnost njenog nastanka koja je rezultat činjenja ili nečinjenja istraživača. Ovakva opasnost se posebno javlja kod ispitivanja osetljivih tema ili onih koje se odnose na ponašanja koja mogu inkriminisati ispitanike (oboljenja, ilegalne aktivnosti, politički stavovi – u nekim zemljama).

Iako se u uputstvima anketa gotovo uvek kaže „Ova anketa je anonimna“, retko kada ispitanik ostaje zaista nepoznat anketaru ili istraživaču. Ako je anketar nekome došao u stan ili ga pozvao telefonom, jasno je da on zna ili može saznati ko je ispitanik. Problem je još očigledniji u panel istraživanjima, gde istraživač, da bi mogao da ponovo kontaktira ispitanika, mora znati njegov identitet i kontakt informacije. Takođe, za pot-rebe kontrole rada anketara, supervizor mora biti u mogućnosti da sazna identitet ispi-tanika kako bi mogao da ga poseti ili pozove i proveri da li je anketar zaista dolazio. Stoga, evidentno je da anonimnost i poverljivost podataka u anketnim istraživanjima nemaju isto značenje.

Anonimnost istraživanja je situacija kada ni istraživač ne može da poveže odgovore ispitanika i identifikacione informacije, odnosno identitet ispitanika. Kao što je rečeno, to je izuzetno retka situacija i verovatno se najbolje može obezbediti u grup-nom anketiranju sa samoadministracijom upitnika, poštanskim anketama, anketama licem u lice kad ispitanik stavi upitnik u kovertu koja se potom zatvori (Bradburn et al., 2004), ali i u onlajn istraživanjima koja koriste poseban softver za anketiranje. Izuzetno je bitno uveriti ispitanika da je istraživanje zaista anonimno. Ukoliko on u to ne veruje (bez obzira na stvarnu anonimnost) to može uticati na njegove odgovore.

U onlajn istraživanjima moguće je ispitanicima poslati link na anketu putem imejla, SMS-a, pošte ili na neki drugi način. U pozivu ispitanik dobija internet adresu na kojoj se nalazi anketa i pristup-ni kôd pomoću kojeg joj samo on može pristupiti. Pristupni kôd služi i da se evidentira da li je ispi-tanik pristupio anketi i da li mu je eventualno potrebno poslati podsetnik da to uradi. Kada ispita-nik odgovori, kôd se ne beleži zajedno sa odgovorima pa nije moguće povezati identitet ispitanika sa odgovorima.

Page 277: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

266

Poverljivost podataka, s druge strane, znači da nakon objavljivanja rezultata i/ili matrice podataka niko neće biti u stanju da poveže odgovore sa konkretnim ispita-nikom. Poverljivost podataka između ostalog znači i da podaci neće biti korišćeni ni u jednu drugu svrhu osim istraživanja i da će biti objavljivani samo u formi agregata, odnosno statističkih pokazatelja na nivou grupe.

Prema tome, istraživač je dužan da prilikom objavljivanja rezultata podatke anonimizuje, odnosno da ukloni sve informacije koje mogu dovesti do jedinstvene iden-tifikacije ispitanika. I prilikom obrade podataka, kad identifikacija nije nužna, iz datote-ka je potrebno ukloniti varijable koje identifikuju ispitanike. One mogu biti zamenjene šiframa, koje se mogu zajedno sa izvornim identifikacionim varijablama čuvati u pose-bnoj datoteci koja je zaštićena lozinkom i dostupna samo osobama koje moraju imati te podatke i to samo u situacijama kada je to zaista potrebno. Takve datoteke je najbolje čuvati na medijima koji su takođe zaštićeni lozinkama i nisu na mreži, a ako jesu i te lokacije moraju biti zaštićene (De Leeuw et al., 2008).

Ako su u pitanju upitnici na papiru, i kod njih je potrebno ukloniti identifikaciju ispitanika, a ona se takođe može zameniti šiframa. Dokumentaciju je potrebno čuvati pod ključem.

Do narušavanja poverljivosti podataka i negativnih posledica po ispitanika može doći i u toku same procedure odgovaranja ukoliko nisu obezbeđeni adekvatni uslovi odgovaranja u skladu sa temom istraživanja. Konkretno, ukoliko se ispituju oset-ljiva pitanja potrebno je obezbediti takve uslove odgovaranja da ni osobe koje bi mogle da se slučajno nađu u blizini ne mogu da čuju odgovore ispitanika, jer na taj način mogu saznati o njemu informacije koje on ne bi želeo da znaju i mogu imati negativne posle-dice po njega.

Ukoliko dođe do narušavanja poverljivosti podataka, obično se radi o nemaru i propustu da se neka od prethodnih radnji izvrši (Groves, 2009)

Poverljivost podataka može biti ugrožena ukoliko se to zahteva sudskim nalo-zima. U Republici Srbiji ne postoji zakon koji reguliše poverljivost podataka isključivo u anketnim istraživanjima, ali je regulisana Zakonom o zaštiti podataka o ličnosti (Zakon o zaštiti podataka o ličnosti, 2012) i Zakonom o zvaničnoj statistici (“Zakon o zvaničnoj statistici,” 2009).

U Zakonu o zvaničnoj statistici stoji da se na ovaj način prikupljeni podaci sme-ju koristiti isključivo u statističke svrhe i ne mogu se koristiti kao osnov za ostvarivanje prava ili za stvaranje obaveza izveštajnoj jedinici, odnosno ispitaniku. Zakon o zvanič-noj statistici odnosi se na proizvođače zvanične statistike, a to su u ovom trenutku Republički zavod za statistiku, Narodna banka Srbije, Gradska uprava grada Beograda (za teritoriju Beograda) i ostali odgovorni proizvođači zvanične statistike (opet RZS).

Ovim zakonom nisu regulisane obaveze ostalih subjekata koji se bave anketnim

Page 278: Bojan Janičić - digitalna.ff.uns.ac.rs

ETIČKA PITANJA

267

istraživanjima, ali taj deo pokriva opštiji Zakon o zaštiti podataka o ličnosti. U članu 8 ovog zakona kaže se da obrada ličnih podataka nije dozvoljena ukoliko lice na koje se podaci odnose nije dalo pristanak za to, ili se vrši u svrhe različite od onih za koje je određena, ili svrha nije određena, izmenjena je, nedozvoljena ili ranije ostvarena, ako je lice na koju se podaci odnose nakon obrade odredivo, podaci koji se koriste u obradi su nepotrebni ili nepodesni za ostvarenje njene svrhe, broj i vrsta podataka su nesrazmerni predviđenoj svrsi i kada su podaci neistiniti, nepotpuni, neverodostojni i/ili zastareli.

12.4.3.1. Statističko otkrivanje

Problem u vezi sa poverljivošću podataka postaje veći sa sve češćim zahtevima da prikupljeni podaci naučnih anketa i anketa koje sprovode ustanove javne statistike budu dostupni u repozitorijumima otvorenih podataka. Istraživači osim izveštaja istra-živanja sve češće u ovakvim repozitorijumima objavljuju i matrice podataka.

Zbog toga, poverljivost podataka može u većoj meri biti narušena i usled pojave koju nazivamo statističko otkrivanje (engl. statistical disclosure). U slučaju statističkog otkrivanja istraživač je uklonio sve identifikacione podatke, ali jedinstvena kombinacija odgovora i nekih informacija dostupnih izvan samog istraživanja može dovesti do otkrivanja identiteta ispitanika.

Da bi bilo jasno šta ovo znači, daćemo pomalo karikaturalni primer.

Zamislimo da istraživač objavi da je na osnovu anketnog istraživanja došao do saznanja da bi 100% stanovnika Plapotnice kod Drpljana na sledećim izborima poklonilo poverenje Stranci naro-dnog suvereniteta. Ukoliko je poznato da je u planinskom mestu Plapotnica jedini stanovnik Dob-rosav Kupljen (a to je poznato, ako nikom drugom, onda komšijama iz Pištalnice, mada je i javni servis pravio prilog o Dobrosavu), znamo i ko je i kako odgovorio na anketno pitanje u vezi sa strankama, bez obzira što su iz izveštaja uklonjeni svi podaci koji bi mogli direktno da identifikuju Dobrosava. Ovde ovakvo obelodanjivanje informacija verovatno ne bi bilo problem pošto Dobro-sav svoj politički stav ionako jasno i javno iznosi, pa nije otkrivena osetljiva informacija koju on ne bi želeo da drugi saznaju.

Statističko otkrivanje ima dve komponente: 1.) jedinstvena identifikacija ispi-tanika, odnosno povezivanje odgovora ispitanika na anketi i konkretne osobe i 2.) otkrivanje osetljivih informacija, odnosno, informacija o ispitaniku koje do tada nisu bile poznate i koje on nije želeo da drugi saznaju.

Do pojave statističkog otkrivanja prilikom objavljivanja statističkih podataka dolazi kada je na osnovu objavljenih statističkih rezultata moguće odrediti karakteristi-ke određenih osoba tačnije nego bez tih informacija (Bethlehem, 2009).

Varijable u anketnom istraživanju, odnosno u matrici podataka, možemo pode-liti na identifikacione (ime, adresa...) i ostale (odgovore ispitanika). Osim navedenih identifikacionih varijabli, postoje i varijable koje mogu olakšati identifikaciju, a takve su pol, starost, zanimanje, nacionalnost/rasa...

Ostale varijable se mogu smatrati osetljivim ukoliko njihove vrednosti nisu

Page 279: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

268

poznate izvan kruga ljudi kojima ih je ispitanik saopštio i on ne želi da drugi za njih saznaju. Koji su to podaci koje osoba ne želi da drugi saznaju zavisi od osobe koja je u pitanju, ali postoje određene informacije koje se smatraju osetljivim u većini kultura ili su karakteristične za određene kulture. Seksualna orijentacija i kriminalna prošlost se u najvećem broju kultura smatraju osetljivim podacima, a čest je slučaj da se osetljivim podatkom smatraju i prihodi. Identifikacioni podaci koji su već poznati širem krugu ljudi ne smatraju se osetljivim podacima.

Osnovno pravilo zaštite podataka od statističkog otkrivanja je da oni budu takvi da „niko ne može ispravno da poveže podatke sa osobom kojoj pripadaju na osnovu objavljenih podataka i prethodnih znanja“ (Bethlehem, 2009, p. 345).

Pretpostavka postojanja prethodnih znanja je vrlo bitna. Onaj ko nema nikak-va prethodna znanja teško će povezati individuu i njene odgovore na osnovu objavlje-nih rezultata anketnog istraživanja ili čak na osnovu matrice podataka. S druge strane, institucije i organizacije (država, stranke, firme...) koje o toj osobi imaju veću količinu znanja/podataka (stečenih legalno ili ne) mogu to lako učiniti.

Ispitanici osim na osnovu identifikacionih varijabli mogu biti identifikovani na osnovu kombinacije objavljenih podataka. Identifikacija će biti lakša što je kombinacija podataka manje verovatna, odnosno ređe se javlja u populaciji.

Zamislimo izveštaj ankete obavljene 2018. godine na teritoriji Republike Srbije i uzmimo na pri-mer varijable pol i zanimanje. Ukoliko je uzorak reprezentativan u njemu bi trebalo da bude nešto više žena nego muškaraca. Znajući samo činjenicu da je ispitanik ženskog pola, nećemo je lako identifikovati. Ako za identifikaciju koristimo i varijablu zanimanje, to nam može poslužiti da bliže identifikujemo ispitanika. Koliko će nam podatak sa neke varijable u tome pomoći, zavisi od toga koliko je njena vrednost verovatna, odnosno učestala u populaciji i uzorku. Ako ispitanik kaže da je po zanimanju komercijalista, to će nam svakako suziti pretragu, ali i dalje nećemo biti u stanju da ispitanika ispravno identifikujemo. Kombinacija odgovora na varijabli pol i na varijabli zanima-nje će nam još više suziti pretragu (recimo samo na komercijalistkinje), a u kojoj meri, zavisiće od verovatnoće kombinacije vrednosti na dve varijable. Komercijalistkinje su svakako ređe i od žena i od komercijalista (oba pola). Međutim, ako ispitanica kaže da je zavarivačica, to će nam identifi-kaciju znatno olakšati i eventualno, uz poznavanje informacija van ankete, možda i omogućiti. Ovo je možda ekstreman primer77, ali trebalo bi voditi računa da u nekim malim sredinama odre-đena zanimanja umeju da budu vrlo retka i da uz kombinaciju sa podatkom o teritoriji, polom i slično, dovedu do pune identifikacije ispitanika.

Na primer, ukoliko bi ispitanik u anketi, obavljenoj početkom 2019. godine u Velikoj Britaniji, zao-kružio da je ženskog pola, po zanimanju premijer, to bi bilo dovoljno da je identifikujemo pošto je jedinstvena.

Verovatnoća da će ispitanika biti moguće identifikovati pomoću nekog seta varijabli zavisi od verovatnoće javljanja određene kombinacije vrednosti na varijablama koje koristimo za identifikaciju. Broj kombinacija tih vrednosti jednak je proizvodu

77 I referenca na film „Flashdance“.

Page 280: Bojan Janičić - digitalna.ff.uns.ac.rs

ETIČKA PITANJA

269

broja nivoa svake od varijabli koje se koriste za identifikaciju.

Na primer, pol sa dva nivoa i bračni status sa pet nivoa bi dali 10 mogućih kombinacija.

Verovatnoća svake od ovih kombinacija jednaka je proporciji ispitanika sa tak-vom kombinacijom varijabli u populaciji.

Mogućnost da na osnovu nekog skupa varijabli identifikujemo ispitanika može se proceniti na osnovu recipročne vrednosti sume kvadrata verovatnoća za sve kombi-nacije. Betlhem (Bethlehem, 2009) ovu vrednost naziva rezolucijom ključa, a kombi-naciju varijabli koje se koriste za identifikaciju – ključem.

𝑅𝑅 =1

∑ 𝜋𝜋𝑖𝑖2𝐾𝐾𝑖𝑖=1

[ 77 ]

gde je K broj mogućih kombinacija, a 𝜋𝜋𝑖𝑖verovatnoća kombinacije i.

Što je rezolucija ključa bliža veličini populacije to je na osnovu kombinacije varijabli (ključa) lakše identifikovati pojedinca, što ne znači da je nemoguće identifiko-vati ispitanike kada ključ ima nisku rezoluciju.

Ono što omogućava identifikaciju ispitanika je njegova jedinstvenost (engl. uniqueness). Ispitanik može biti jedinstven u populaciji (kao premijerka) ili jedinstven u uzorku. Ukoliko se osoba koja je jedinstvena u populaciji nađe u uzorku, ona će i u nje-mu biti jedinstvena i biće je lako identifikovati.

Osoba koja je jedinstvena u uzorku, ne mora biti jedinstvena u populaciji i iden-tifikacija ne mora biti moguća. Međutim, uz neke dodatne informacije identifikacija postaje moguća. Ukoliko neko zna ko je učestvovao u anketi78 a ko ne, moći će da poveže odgovore prethodnog ispitanika sa njegovim identitetom. Na taj način će jedinstvenost u populaciji biti svedena na jedinstvenost u uzorku.

Osobe koje nisu jedinstvene u populaciji, još uvek mogu biti jedinstvene u sub-populacijama (npr. lekari u malim mestima) i uz poznavanje dodatnih varijabli, ili informacija van ankete, moguće ih je identifikovati i može doći do statističkog otkriva-nja.

Do otkrivanja može doći i kada je rezolucija ključa mala, a tada se javlja tzv. spontano prepoznavanje retkih slučajeva (poput Dobrosava ili premijerke). Uvek je dobro proveriti postoje li takvi slučajevi i ukloniti ih iz podataka, odnosno ukloniti podatke koji ih jedinstveno identifikuju.

Osim toga, do otkrivanja identiteta ispitanika može doći poređenjem sa drugim bazama podataka (registrima koje obično poseduju državne institucije). Na ovaj način može se namerno otkriti identitet ispitanika, odnosno za ovakav način otkrivanja pot-rebno je postojanje namere i sprovođenje poređenja.

78 Nekada je dovoljno i znanje da li je neko mogao učestvovati u anketi.

Page 281: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

270

Protiv ovakvih načina otkrivanja podataka ispitanika postoje različiti načini borbe. Kada su u pitanju jedinstveni ispitanici u matricama podataka potrebno je prob-lem rešiti tako što će se ili određeni odgovori u varijablama koje mogu poslužiti za iden-tifikaciju zameniti nedostajućim vrednostima ili vrednošću „nepoznato“, kako ispitanik ne bi više bio jedinstven. Drugi način je sažimanje pojedinih kategorija varijabli koje se mogu iskoristiti za identifikaciju (Bethlehem, 2009; Pfeffermann & Rao, 2010).

Rizik od otkrivanja podataka zbog toga što drugi znaju ko je učestvovao u istra-živanju, može se otkloniti tako što se ispitanicima savetuje da ne govore drugima da su učestvovali, i/ili objavljivanjem rezultata sa određenom vremenskom zadrškom.

Rizik od otkrivanja podataka poređenjem sa drugim izvorima podataka teško se može eliminisati bez značajnog oštećenja strukture izvorne matrice podataka. Da bi se otklonio rizik od ovog načina otkrivanja potrebno je mnoge kategorije sažeti ili uklo-niti veći broj varijabli. Na taj način podaci postaju neupotrebljivi za dalju analizu i svrha postavljanja podataka u repozitorijume se gubi.

12.4.4. Izbegavati obmanjivanje ispitanika

Ispitanik ima pravo da zna šta je predmet istraživanja, ko ga sprovodi i plaća, i koliko će trajati. Međutim, nekada ostvarenje cilja istraživanja zahteva da ispitanici budu obmanuti u izvesnoj meri. Jedno od načela etičkog odnosa prema ispitanicima kaže da je obmanjivanje ispitanika potrebno smanjiti na najmanju moguću meru. Kada je u istraživanju potrebno prikriti ili drugačijim predstaviti određene informacije, onda je to potrebno svesti na meru koja je dovoljna za ostvarenje cilja istraživanja. Samo istraživanje mora proći detaljnu kontrolu etičke komisije (ukoliko takvo telo postoji). Nakon istraživanja ispitanicima moraju biti date prave informacije (engl. debriefing).

Obmane u smislu prikrivanja organizacije koja sprovodi ili finansira istraživa-nje ili one koje se odnose na vreme potrebno za odgovaranje na samu anketu, retko mogu biti opravdane.

Poseban vid obmane je upotreba anketnih istraživanja u druge svrhe. Ovakva upotreba anketnih istraživanja kao paravana za druge stvari, kao što su prikupljanje sredstava (engl. fund-raising), prodaju, propagandu i slično, smatra se neprihvatljivom.

Ponekad se pod paravanom anketnog istraživanja može sprovoditi propaganda. Za ovakva „istra-živanja“ u engleskom jeziku koristi se termin „push poll“. U ovakvim istraživanjima se ispitanicima pod firmom pitanja poturaju lažne informacije. Primer ovakve primene ankete bilo bi pitanje: „Da li biste na predsedničkim izborima glasali za Istinoljuba Poštenića kada biste saznali da ga plaća jedna strana obaveštajna služba?“.

Ispitanik se stavlja u hipotetičku situaciju u kojoj predsedničkog kandidata plaća strana obaveš-tajna služba. Nigde se ne kaže da to jeste zaista tako, ali se potencijalnim biračima (ispitanicima) usađuje crv sumnje.

Zloupotreba anketnih istraživanja ne mora biti samo u političke svrhe.

Page 282: Bojan Janičić - digitalna.ff.uns.ac.rs

ETIČKA PITANJA

271

Možemo zamisliti pitanje: „Da li biste koristili toalet papir napravljen od recikliranog papira kada biste znali da na taj način možete da se zarazite hlamidijom?“. Ovakvo pitanje namenjeno je povećanju prodaje toalet papira koji se reklamira kao papir koji nije napravljen od recikliranog materijala.

Page 283: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

272

13. Reference

1. Aczel, A., & Sounderpandian, J. (2008). Complete Business Statistics. The Mcgraw-Hill.

2. Allison, P. D. (2001). Missing Data. Sage Publications, Inc.

3. Andridge, R. R., & Little, R. J. A. (2010). A Review of Hot Deck Imputation for Survey Non-response. International Statistical Review, 78(1), 40–64. https://doi.org/10.1111/j.1751-5823.2010.00103.x

4. Bautista, R., Ghandour, R., & Croen, A. (2015). Questionnaire Length and Re-sponse Rates: A Nationwide Experiment Across Three Modes of Administration. Presented at the American Association for Public Opinion Research (AAPOR) 70th Annual Conference. May 14-17, Hollywood, Florida.

5. Bennett, D. A. (2001). How Can I Deal With Missing Data in My Study? Australi-an and New Zealand Journal of Public Health, 25(5), 464–469. https://doi.org/10.1111/j.1467-842X.2001.tb00294.x

6. Bethlehem, J. G. (2009). Applied Survey Methods: A Statistical Perspective. Ho-boken, N.J: Wiley.

7. Biemer, P. P. (2010). Total Survey Error: Design, Implementation, and Evalua-tion. Public Opinion Quarterly, 74(5), 817–848. https://doi.org/10.1093/poq/nfq058

8. Biemer, P. P., De Leeuw, E. D., Eckman, S., Edwards, B., Kreuter, F., Lyberg, L., … West, B. T. (Eds.). (2016). Total Survey Error in Practice. Hoboken, New Jersey: John Wiley & Sons.

9. Biemer, P. P., & Lyberg, L. (2003). Introduction to Survey Quality. Hoboken, NJ: Wiley.

10. Bishop, G. F., & Smith, A. E. (1997). Response-Order Effects in Public Opinion Surveys: The Plausibility of Rival Hypotheses. Annual Conference of the Ameri-can Association for Public Opinion Research, Norfolk, VA. Also Published in Amer-ican Statistical Association, The 1997 Proceedings of the Section on Survey Re-search Methods of the American Statistical Association. Alexandria, VA: American Statistical Association. Retrieved from http://ww2.amstat.org/sections/srms/Proceedings/papers/1997_179.pdf

11. Blair, J., Czaja, R. F., & Blair, E. A. (2014). Designing Surveys. SAGE.

12. Blumberg, S. J., Luke, J. V., & Cynamon, M. L. (2006). Telephone Coverage and Health Survey Estimates: Evaluating the Need for Concern About Wireless Sub-stitution. American Journal of Public Health, 96(5), 926–931.

Page 284: Bojan Janičić - digitalna.ff.uns.ac.rs

REFERENCE

273

13. Bogen, K. (1996). The Effect of Questionnaire Length on Response Rates: A Review of the Literature. Proceedings of the Section on Survey Research Meth-ods, 1020–1025. American Statistical Association, Alexandria, VA.

14. Bradburn, N. M., Sudman, S., & Wansink, B. (2004). Asking Questions: The Defini-tive Guide to Questionnaire Design-- for Market Research, Political Polls, and So-cial and Health Questionnaires (Revised edition). San Francisco, CA: Jossey-Bass.

15. Brogan, D. J., Denniston, M. M., Liff, J. M., Flagg, E. W., Coates, R. J., & Brinton, L. A. (2001). Comparison of Telephone Sampling and Area Sampling: Response Rates and Within-Household Coverage. Practice of Epidemiology, 153(11), 1119–1127.

16. Burke, M. J., & Normand, J. (1987). Computerized Psychological Testing: Over-view and Critique. Professional Psychology: Research and Practice, 18(1), 42–51. https://doi.org/10.1037/0735-7028.18.1.42

17. Campbell, D. T., & Fiske, D. W. (1959). Convergent and Discriminant Validation by the Multitrait-Multimethod Matrix. Psychological Bulletin, 56(2), 25.

18. Cannell, C. F., Miller, P. V., & Oksenberg, L. (1981). Research on Interviewing Techniques. Sociological Methodology, 12, 389. https://doi.org/10.2307/270748

19. Cialdini, R. B. (2007). Influence: The Psychology of Persuasion. HarperCollins Publishers (Australia) Pty. Ltd.

20. Cochran, W. G. (1977). Sampling Techniques. New York: Wiley.

21. Cook, C., Heath, F., & Thompson, R. L. (2000). A Meta-Analysis of Response Rates in Web- or Internet-Based Surveys. Educational and Psychological Meas-urement, 60(6), 821–836. https://doi.org/10.1177/00131640021970934

22. Couper, M. P., Traugott, M. W., & Lamias, M. J. (2001). Web Survey Design and Administration. Public Opinion Quarterly, 65(2), 230–253.

23. De Leeuw, E. D. (2001). Reducing Missing Data in Surveys: An Overview of Methods. Quality & Quantity, 35(2), 147–160.

24. De Leeuw, E. D., Hox, J. J., Dillman, D. A., & European Association of Methodolo-gy (Eds.). (2008). International Handbook of Survey Methodology. New York ; London: Lawrence Erlbaum Associates.

25. Décieux, J., Mergener, A., Neufang, K., & Sischka, P. (2015). Implementation of the Forced Answering Option Within Online Surveys: Do Higher Item Response Rates Come at the Expense of Participation and Answer Quality? Psihologija, 48(4), 311–326. https://doi.org/10.2298/PSI1504311D

26. Dey, E. L. (1997). Working With Low Survey Response Rates: The Efficacy of Weighting Adjustments. Research in Higher Education, 38(2), 215–227.

27. Dillman, D. A., Smyth, J. D., & Christian, L. M. (2014). Internet, Phone, Mail, and Mixed-Mode Surveys: The Tailored Design Method (4th edition). Hoboken: Wiley.

28. Dinić, B., & Janičić, B. (2012). Evaluacija Bas-Perijevog upitnika agresije po modelu TOS (IRT). Psihologija, 45(2), 189–207.

Page 285: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

274

https://doi.org/10.2298/PSI1202189D

29. Dumičić, K., & Žmuk, B. (2009). Karakteristike korisnika interneta u Hrvatskoj i reprezentativnost internetskih anketa. Zbornik Ekonomskog Fakulteta u Za-grebu, 7(2), 115–140.

30. ESOMAR/GRBN. (2015). Guidelines for Online Sample Quality.

31. Faden, R. R., & Beauchamp, T. L. (1986). A History and Theory of Informed Con-sent. New York: Oxford University Press.

32. Fajgelj, S. (2004). Metode istraživanja ponašanja. Beograd: Centar za primen-jenu psihologiju.

33. Fajgelj, S. (2013). Psihometrija—Metod i teorija psihološkog merenja. Beograd: Centar za primenjenu psihologiju.

34. Fellegi, I. P., & Holt, D. (1976). A Systematic Approach to Automatic Edit and Imputation. Journal of the American Statistical Association, 71(353), 17–35.

35. Fink, A. (Ed.). (2003). The Survey Kit (2nd ed). Thousand Oaks, Calif: Sage Pub-lications.

36. Forer, B. R. (1949). The Fallacy Of Personal Validation. Journal of Abnormal and Social Psychology, 44(1), 118–123.

37. Fowler, F. J., & Mangione, T. W. (1990). Standardized Survey Interviewing: Min-imizing Interviewer-Related Error. Newbury Park, Calif: Sage Publications.

38. Galesic, M., & Bosnjak, M. (2009). Effects of Questionnaire Length on Participa-tion and Indicators of Response Quality in a Web Survey. Public Opinion Quar-terly, 73(2), 349–360. https://doi.org/10.1093/poq/nfp031

39. Gideon, L. (Ed.). (2012). Handbook of Survey Methodology for the Social Scienc-es. https://doi.org/10.1007/978-1-4614-3876-2

40. Graham, J. W. (2009). Missing Data Analysis: Making It Work in the Real World. Annual Review of Psychology, 60(1), 549–576. https://doi.org/10.1146/annurev.psych.58.110405.085530

41. Grice, H. P. (1989). Studies in the Way of Words. Cambridge, Mass: Harvard University Press.

42. Groves, R. M. (2009). Survey Methodology (2nd ed). Hoboken, N.J: Wiley.

43. Groves, R. M. (2011). Three Eras of Survey Research. Public Opinion Quarterly, 75(5), 861–871. https://doi.org/10.1093/poq/nfr057

44. Groves, R. M., Biemer, P. P., Lyberg, L. E., Massey, J. T., II, W. L. N., & Waksberg, J. (2001). Telephone Survey Methodology. John Wiley & Sons.

45. Groves, R. M., Cialdini, R. B., & Couper, M. P. (1992). Understanding the Decision to Participate in a Survey. Public Opinion Quarterly, 56(4), 475–495.

46. Groves, R. M., & Couper, M. P. (1998). A Conceptual Framework for Survey Par-ticipation. In Nonresponse in Household Interview Surveys (pp. 25–46). John Wiley & Sons.

47. Hancock, G. R., & Mueller, R. O. (Eds.). (2010). The Reviewer’s Guide to Quantita-

Page 286: Bojan Janičić - digitalna.ff.uns.ac.rs

REFERENCE

275

tive Methods in the Social Sciences. https://doi.org/10.4324/9780203861554

48. Hansen, M. H., Hurwitz, W. N., & Madow, W. G. (1953). Sample Survey Methods And Theory Vol-1. Retrieved from http://krishikosh.egranth.ac.in/bitstream/1/2034503/1/CIFE-99.pdf

49. Harkness, J. A. (2011). Guidelines for Best Practice in Cross-Cultural Surveys. Survey Research Center, Institute for Social Research, University of Michigan.

50. Heckathorn, D. D. (1997). Respondent-Driven Sampling: A New Approach to the Study of Hidden Populations. Social Problems, 44(2), 174–199. https://doi.org/10.2307/3096941

51. Hofferth, S. L., Stafford, F. P., Yeung, W.-J. J., Duncan, G. J., Hill, M. S., Lepkowski, J., & Morgan, J. N. (2016). Panel Study of Income Dynamics, 1968-1999: Supple-mental Files. https://doi.org/10.3886/ICPSR03202.v3

52. Höhne, J., & Lenzner, T. (2015). Investigating Response Order Effects in Web Surveys Using Eye Tracking. Psihologija, 48(4), 361–377. https://doi.org/10.2298/PSI1504361H

53. Houtkoop-Steenstra, H. (2000). Interaction and the Standardized Survey Inter-view: The Living Questionaire. Cambridge, New York: Cambridge University Press.

54. Hozo, S. P., Djulbegovic, B., & Hozo, I. (2005). Estimating the Mean and Variance From the Median, Range, and the Size of a Sample. BMC Medical Research Meth-odology, 5(1). https://doi.org/10.1186/1471-2288-5-13

55. Iarossi, G. (2006). The Power of Survey Design: A User’s Guide for Managing Surveys, Interpreting Results, and Influencing Respondents. https://doi.org/10.1596/978-0-8213-6392-8

56. ICC/ESOMAR. (2008). International Code on Market and Social Research. ICC/ESOMAR.

57. ITU. (2017a). Measuring the Information Society Report 2017 (Vol. 2). Geneva: International Telecommunication Union.

58. ITU. (2017b). Measuring the Information Society Report 2017 (Vol. 1). Geneva: International Telecommunication Union.

59. Janičić, B. (2009). Da li se računarski podržano testiranje razlikuje od klasičnog? - Povezanost načina zadavanja psiholoških testova i odgovora ispitanika. Novi Sad, Novi Sad.

60. Janičić, B. (2015). Jednakost profila dobijenih računarski podržanim i klasičnim modalitetom MMPI-202. Primenjena psihologija, 8(3), 311. https://doi.org/10.19090/pp.2015.3.311-333

61. Kalton, G. (2009). Methods for Oversampling Rare Subpopulations in Social Surveys. Survey Methodology, 35(2), 125–141.

62. Kastrenakes, J. (2017, May 4). Most US Households Have Given up Landlines for Cellphones. Retrieved November 23, 2017, from The Verge website: https://www.theverge.com/2017/5/4/15544596/american-households-now-use-cellphones-more-than-landlines

Page 287: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

276

63. King, G., Honaker, J., Joseph, A., & Scheve, K. (2001). Analyzing Incomplete Polit-ical Science Data: An Alternative Algorithm for Multiple Imputation. The Ameri-can Political Science Review, 95(1), 49–69.

64. Kish, L. (1949). A Procedure for Objective Respondent Selection Within the Household. Journal of the American Statistical Association, 44(247), 380–387. https://doi.org/10.1080/01621459.1949.10483314

65. Kish, L. (1962). Studies of Interviewer Variance for Attitudinal Variables. Jour-nal of the American Statistical Association, 57(297), 92. https://doi.org/10.2307/2282442

66. Kish, L., & Slater, C. W. (1960). Two Studies Of Interviewer Variance Of Socio-Psychological Variables. Proceedings of the Social Statistics Section, American Statistical Association, 66–70.

67. Kittleson, M. J. (1997). Determining Effective Follow-up of E-Mail Surveys. American Journal of Health Behavior, 21(3), 193–196.

68. Kowarik, A., & Templ, M. (2016). Imputation with the R Package VIM. Journal of Statistical Software, 74(7). https://doi.org/10.18637/jss.v074.i07

69. Krivokapić, D., Krivokapić, Đ., Todorović, I., Komazec, S., Petrovski, A., & Erce-gović, K. (2016). Vodič za organe vlasti—Zaštita podataka o ličnosti (Đ. Krivokapić & D. Krivokapić, Eds.). Novi Sad: SHARE Fondacija.

70. Krosnick, J. A. (1991). Response Strategies for Coping with the Cognitive De-mands of Attitude Measures in Surveys. Applied Cognitive Psychology, 5(3), 213–236. https://doi.org/10.1002/acp.2350050305

71. Krosnick, J. A. (1999). Survey Research. Annual Review of Psychology, 50(1), 537–567.

72. Krosnick, J. A., & Alwin, D. F. (1987). An Evaluation of a Cognitive Theory of Response-Order Effects in Survey Measurement. Public Opinion Quarterly, 51(2), 201. https://doi.org/10.1086/269029

73. Lavrakas, P. J. (Ed.). (2008). Encyclopedia of Survey Research Methods. Thou-sand Oaks, Calif: SAGE Publications.

74. Lepkowski, J. M. (Ed.). (2008). Advances in Telephone Survey Methodology. Ho-boken, NJ: John Wiley & Sons.

75. Levy, P. S., & Lemeshow, S. (1999). Sampling of Populations: Methods and Appli-cations (3rd ed). New York: Wiley.

76. Limesurvey GmbH. (n.d.). LimeSurvey: An Open Source Survey Tool. Retrieved from http://www.limesurvey.org

77. Lin, T. H. (2010). A Comparison of Multiple Imputation with EM Algorithm and MCMC Method for Quality of Life Missing Data. Quality & Quantity, 44(2), 277–287. https://doi.org/10.1007/s11135-008-9196-5

78. Lyberg, L. (Ed.). (1997). Survey Measurement and Process Quality. New York: Wiley.

79. Mahalanobis, P. C. (1965). Statistics as a Key Technology. The American Statis-

Page 288: Bojan Janičić - digitalna.ff.uns.ac.rs

REFERENCE

277

tician, 19(2), 43. https://doi.org/10.2307/2682378

80. Marsden, P. V., & Wright, J. D. (Eds.). (2010). Handbook of Survey Research (Sec-ond edition). Bingley: Emerald.

81. Matschinger, H., Bernert, S., & Angermeyer, M. C. (2005). An Analysis of Inter-viewer Effects on Screening Questions in a Computer Assisted Personal Mental Health Interview. Journal of Official Statistics, 21(4), 657–674.

82. McKnight, P., E., McKnight, K., M., Sidani, S., & Figueredo, A. J. (2007). Missing Data: A Gentle Introduction. New York, London: The Guilford Press.

83. Meehl, P. E. (1956). Wanted—A Good Cookbook. The American Psychologist, 11(6), 263–272.

84. Meir, D. (2006). The Seven Stages of Effective Survey Research. American Mar-keting Association.

85. Mowen, J. C., & Cialdini, R. B. (1980). On Implementing the Door-in-the-Face Compliance Technique in a Business Context. Journal of Marketing Research, 17(2), 253. https://doi.org/10.2307/3150936

86. Osteen, P. (2010). An Introduction to Using Multidimensional Item Response Theory to Assess Latent Factor Structures. Journal of the Society for Social Work and Research, 1(2), 66–82. https://doi.org/10.5243/jsswr.2010.6

87. Peterson, R. A., & Kerin, R. A. (1980). Household Income Data Reports in Mail Surveys. Journal of Business Research, 8(3), 301–313. https://doi.org/10.1016/0148-2963(80)90038-7

88. Pfeffermann, D., & Rao, C. R. (Eds.). (2010). Handbook of Statistics. Vol. 29 A: Sample Surveys: Design, Methods and Applications (digital printing). Amster-dam: Elsevier.

89. Piaget, J. (2003). The Psychology of Intelligence. London; New York: Routledge.

90. Presser, S. (1990). Measurement Issues in the Study of Social Change. Social Forces, 68(3), 856-868.

91. Presser, S., Couper, M. P., Lessler, J. T., Martin, E., Martin, J., Rothgeb, J. M., & Singer, E. (2004). Methods for testing and evaluating survey questions. Public Opinion Quarterly, 68(1), 109–130. Retrieved from https://academic.oup.com/poq/article-abstract/68/1/109/1855073

92. R Core Team. (2019). R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing. Retrieved from https://www.R-project.org/

93. Rea, L. M., & Parker, R. A. (2014). Designing and Conducting Survey Research: A Comprehensive Guide (Fourth edition). San Francisco, CA: Jossey-Bass, a Wiley brand.

94. Reckase, M. D. (2009). Multidimensional Item Response Theory. https://doi.org/10.1007/978-0-387-89976-3

95. Reise, S. P., & Revicki, D. A. (2014). Handbook of Item Response Theory Model-ing: Applications to Typical Performance Assessment. Routledge.

Page 289: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

278

96. Rossi, P. H., Wright, J. D., & Anderson, A. B. (Eds.). (1983). Handbook of Survey Research. New York: Academic Press.

97. Rubin, D. B. (1987). Multiple Imputation for Nonresponse in Surveys. New York: Wiley.

98. Sahlqvist, S., Song, Y., Bull, F., Adams, E., Preston, J., & Ogilvie, D. (2011). Effect of Questionnaire Length, Personalisation and Reminder Type on Response Rate to a Complex Postal Survey: Randomised Controlled Trial. BMC Medical Re-search Methodology, 11, 62. https://doi.org/10.1186/1471-2288-11-62

99. Saris, W. E., & Gallhofer, I. N. (2007). Design, Evaluation, and Analysis of Ques-tionnaires for Survey Research. Hoboken, N.J: Wiley-Interscience.

100. Saris, W. E., van der Weld, W., & Gallhofer, I. N. (2004). Development and Im-provement of Questionnaires Using Predictions of Reliability and Validity. In S. Presser, J. M. Rothgeb, M. P. Couper, J. T. Lessler, J. Martin, & E. Singer (Eds.), Methods for Testing and Evaluating Survey Questionnaires (pp. 275–297). John Wiley & Sons, Inc.

101. Schafer, J. L. (1997). Analysis of Incomplete Multivariate Data. Chapman and Hall/CRC.

102. Schafer, J. L. (1999). Multiple Imputation: A Primer. Statistical Methods in Medi-cal Research, 8(1), 3–15. https://doi.org/10.1177/096228029900800102

103. Schafer, J. L., & Graham, J. W. (2002). Missing data: Our view of the state of the art. Psychological Methods, 7(2), 147–177. https://doi.org/10.1037//1082-989X.7.2.147

104. Schraepler, J.-P., & Wagner, G. G. (2003). Identification, Characteristics and Impact of Faked Interviews in Surveys An analysis by means of genuine fakes in the raw data of SOEP. IZA DP, (969), 34.

105. Schuman, H. (1997). Polls, Surveys, and the English Language. The Public Per-spective, 6–7.

106. Schwarz, N., Hippler, H.-J., & Noelle-Neumann, E. (1992). A Cognitive Model of Response-OrderEffects in Survey Measurement. In N. Schwarz & S. Sudman (Eds.), Context Effects in Social and Psychological Measurement. New York: Springer-Verlag.

107. Schwarz, N., Hippler, H.-J., Noelle-Neumann, E., & Münkel, T. (1989). Response Order Effects in Long Lists: Primacy, Recency, and Asymetric Contrast Effects. Re-trieved from http://www.ssoar.info/ssoar/handle/document/6701

108. Singer, E., & Bossarte, R. M. (2006). Incentives for Survey Participation. Ameri-can Journal of Preventive Medicine, 31(5), 411–418. https://doi.org/10.1016/j.amepre.2006.07.013

109. Smith, P. (2009). Survey Research: Two Types of Knowledge. International Journal of Market Research, 51(6), 719–721.

110. Smith, T. W. (1983). The Hidden 25 Percent: An Analysis of Nonresponse on the 1980 General Social Survey. Public Opinion Quarterly, 47(3), 386. https://doi.org/10.1086/268797

Page 290: Bojan Janičić - digitalna.ff.uns.ac.rs

REFERENCE

279

111. Spreen, M. (1992). Rare Populations, Hidden Populations, and Link-Tracing Designs: What and Why? Bulletin of Sociological Methodology/Bulletin de Meth-odologie Sociologique, 36(1), 34–58.

112. Squire, P. (1988). Why the 1936 Literary Digest Poll Failed. 52(1), 125–133.

113. Stacey, A. (2016). Militating Against Data Fabrication and Falsification: A Proto-col of Trias Politica for Business Research. 14(2), 11.

114. Sudman, S., Bradburn, N. M., & Schwarz, N. (1996). Answering a Survey Ques-tion. In S. Sudman, N. M. Bradburn, & N. Schwarz (Eds.), Thinking about An-swers: The Application of Cognitive Processes to Survey Methodology (pp. 55–79). San Francisco, CA: Jossey-Bass.

115. Tabachnick, B. G., & Fidell, L. S. (2007). Using Multivariate Statistics (5th ed). Boston: Pearson/Allyn & Bacon.

116. Thayer-Hart, N., Dykema, J., Elver, K., Schaeffer, N. C., & Stevenson, J. (2010). Survey Fundamentals: A Guide to Designing and Implementing Surveys. Universi-ty of Wisconsin-Madison.

117. The ISI Glossary of Statistical Terms. (2011). Retrieved October 4, 2017, from http://isi.cbs.nl/glossary/index.htm

118. Thissen, M. R. (2014). Computer Audio-Recorded Interviewing as a Tool for Survey Research. Social Science Computer Review, 32(1), 90–104. https://doi.org/10.1177/0894439313500128

119. Trochim, W. M. (2006). The Research Methods Knowledge Base. Retrieved September 12, 2017, from https://www.socialresearchmethods.net/kb

120. Valić Nedeljković, D. (2012). Internetska medijska prezentacija siromaštva sa stanovišta Grajsovog „principa kooperativnosti” i Ličovog „principa učtivosti”. Godišnjak Filozofskog fakulteta u Novom Sadu, 37, 251–267.

121. Valliant, R., Dever, J. A., & Kreuter, F. (2013). Practical Tools for Designing and Weighting Survey Samples. https://doi.org/10.1007/978-1-4614-6449-5

122. Visser, P., Krosnick, J., & Lavrakas, P. (2000). Survey Research. In H. T. Reis & C. M. Judd (Eds.), Handbook of Research Methods in Social and Personality Psychol-ogy (pp. 223–252). Cambridge University Press.

123. Waal, T. de, Pannekoek, J., & Scholtus, S. (2011). Handbook of Statistical Data Editing and Imputation. Hoboken, N.J: Wiley.

124. Warriner, K., Goyder, J., Gjertsen, H., Hohner, P., & McSpurren, K. (1996). Chari-ties, No; Lotteries, No; Cash, Yes: Main Effects and Interactions in a Canadian Incentives Experiment. Public Opinion Quarterly, 60(4), 542–562.

125. Whiteley, S. (2014). Total Survey Error & Institutional Research: A Case Study of the University Experience Survey. Online Submission. Retrieved from https://eric.ed.gov/?id=ED550751

126. Wolf, C., Joye, D., Smith, T. W., & Fu, Y. (2016). The SAGE Handbook of Survey Methodology. Sage.

127. Zakon o zaštiti podataka o ličnosti. (2012, 2009/2008).

Page 291: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

280

128. Zakon o zvaničnoj statistici. (2009). Službeni Glasnik Republike Srbije, (104).

129. Zhang, Z. (2015). Missing Data Exploration: Highlighting Graphical Presenta-tion of Missing Pattern. Annals of Translational Medicine, 3(22), 7.

Page 292: Bojan Janičić - digitalna.ff.uns.ac.rs

INDEKS POJMOVA

281

14. Indeks pojmova

ajtemski kontekst, 117, 149 analiza dostupnih slučajeva, 243 analiza podataka, 20, 209 anketa licem u lice, 7, 9, 13, 21, 22, 23,

24, 27, 39, 82, 101, 102, 105, 106, 107, 138, 153, 154, 157, 161, 162, 164, 165, 168, 173, 175, 176, 177, 178, 179, 180, 181, 187, 190, 193, 194, 199, 200, 204, 207, 209, 217, 255, 265

anketa putem elektronske pošte, 164, 172

anketa sa ličnom dostavom upitnika, 9, 164

ankete sa mešovitim modalitetima, 165 anketna populacija, 33 anketno istraživanje, 1, 2, 3, 15, 16, 17,

20, 23, 29, 36, 47, 48, 79, 92, 112, 191, 258

anonimnost, 13, 142, 193, 216, 265 asimetrični efekat kontrasta, 149, 150,

151 autlejer, nereprezentativni, 227 autlejer, reprezentativni, 227 autoritet, 191, 192, 194, 196, 197 Barnum efekat, 257, 258 bihejvioralno kodiranje, 153, 154, 156,

207, 208 biranje (uzorkovanje) eksperata, 78 biranje (uzorkovanje) ključnih

izvestilaca, 77 biranje (uzorkovanje) kohorti, 78 biranje (uzorkovanje) metodom grudve

snega, 76, 77 biranje (uzorkovanje) modalnih

članova, 77 biranje (uzorkovanje) po koraku, 60 biranje (uzorkovanje) putem lanca

preporuka, 76 bivarijatni uslovi, 227, 228

ciljano uzorkovanje ličnih mreža, 77 ciljna populacija, 13, 17, 23, 32, 46, 261 članovi populacije, 31, 32, 36, 45, 46,

47, 59, 175 dijagram agregacije, 237 doslednost, 194 dostupna populacija, 32, 36 dovoljna populacija, 34 dovoljnost, pristup dovoljnosti, 120,

121, 152 dupliranje, 48, 49 dvofazno jednostavno klaster

uzorkovanje, 63 dvostruki unos, 108, 224 efekat anketara, 173 efekat kohorti, 78 efekat nacrta, 64, 70 efekat početnih pozicija, 149, 151, 152,

174 efekat poslednjih pozicija, 149, 150,

151, 152, 174 eksperiment u anketnim

istraživanjima, 10, 236 ekspertska procena, 153, 154 eksplorativna istraživanja, 9, 10 elementi populacije, 31, 47, 56 fabrikacija, 260 falsifikacija, 260, 261 fleksibilni pristup, 104 fokus grupa, 21, 112, 153 Forerov efekat, 258 format prezentacije stavke, 123 greška merenja, 57, 91, 92, 101, 102,

103, 104, 109, 174, 210, 261 greška neodgovora, 91, 92, 109, 261 greška obrade, 91, 107, 108 greška podešavanja, 68, 91, 92, 107,

109, 232, 233, 261 greška pokrivenosti, 58, 91, 92, 99, 109 greška specifikacije, 92

Page 293: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

282

greška uzorkovanja, 53, 92 greške povezane sa merenjem, 91 greške reprezentovanja, 91 grupisanje, 47, 49, 50 grupne ankete, 9, 162, 179 heterogeno uzorkovanje (biranje), 78 identifikacione varijable, 265, 267 imputacije, 51, 101, 187, 229, 234, 242,

244, 245, 246, 247, 248, 249, 250 imputacije, jednostruke, 248 informisani pristanak, 41, 262, 263,

264 internet ankete, 9, 23, 24, 97, 164, 168,

177, 178 interval uzorkovanja, 60, 61 intervju, 22, 25, 92, 110, 111, 156, 166,

181, 209 istorijske kontrolne grupe, 11 istraživanja trenda, 11, 12, 118 izbacivanje nekompletnih slučajeva,

235, 243, 244 jedinica analize, 37 jedinica istraživanja, 31, 36, 37, 38, 42,

44, 72, 74, 80, 81, 87, 101, 118, 176, 182, 189, 198, 216

jedinica posmatranja, 14, 36, 37, 79 jedinica uzorkovanja, 33, 36, 37, 44, 79,

80, 162, 213 jedinstvenost, 269 klaster, 62, 63, 65, 79 kodiranje, 19, 20, 108, 137, 216, 217,

218, 219 kodiranje, kancelarijsko, 217, 221 kodiranje, šema, 216, 217 kodiranje, terensko, 217 kognitivni intervju, 153, 156 kognitivni mehanizmi (primovanje,

prenos, sidrenje, oduzimanje), 145 kompletnost, 207, 224, 225 konverzija, 183, 185, 193, 263 konzistentnost, 28, 194, 195, 196, 224,

225 korak, 25, 60, 61, 187, 216, 231, 247,

249, 250 korekcija za neodgovore, 35, 231 krojenje (tailoring), 197 kvotni kriterijum, 72, 73, 74, 75 kvotno slučajno biranje, 67 longitudinalna istraživanja, 12 longitudinalni nacrt, 11

male i/ili skrivene populacije, 33, 34 margina greške, 36, 82, 83, 84, 85, 94,

185, 233, 244, 248, 254, 255, 259 maska za unos, 28, 108, 224 maskiranje, 76, 77 matrični dijagram, 241 MCMC, 250 meki podsetnik, 19, 166 meki uslov, 227 metoda maksimalne verodostojnosti,

235, 247 metoda poluotvorenih intervala, 46 metoda ponovnog kontakta, 209 metoda posmatranja, 209 mini populacija, 33 multivarijatni uslov, 228 nacrt uzorkovanja, 55 nediferencijacija, 129 nedostajući odgovori, 92, 101, 237 nedostajući podaci, 19, 51, 101, 108,

187, 207, 215, 216, 229, 233, 234, 235, 237, 238, 239, 240, 241, 242, 243, 244, 245, 247, 249, 255, 259

nelegitimne jedinice, 33, 47, 48 neodgovori, 16, 19, 25, 27, 35, 51, 52,

58, 89, 91, 98, 99, 100, 101, 106, 128, 154, 162, 163, 173, 177, 182, 183, 184, 185, 186, 187, 189, 190, 192, 193, 198, 199, 202, 203, 204, 206, 208, 229, 233, 234, 238, 242, 246, 248, 255

neodgovori, nezanemarljivi, 234 neodgovori, zanemarljivi, 234 nepokrivenost, 44, 45, 47 neprobabilčističko uzorkovanje, 15, 57 Neymanova alokacija, 68 normativni mehanizmi, 146 obrada samo kompletnih slučajeva,

242 odbijanje (učešća u anketi), 92, 185,

191, 195, 262, 264 odbijanje, meko, 185 održavanje interakcije, 197, 198 odziv, 23, 156, 176, 177, 183, 200, 202 okvir uzorkovanja (spisak populacije),

7, 19, 21, 24, 32, 33, 34, 35, 36, 38, 39, 40, 41, 42, 43, 45, 46, 47, 48, 49, 50, 56, 59, 60, 61, 62, 71, 72, 79, 80, 96, 97, 105, 165, 167, 175, 176, 188, 189, 190, 254, 261

Page 294: Bojan Janičić - digitalna.ff.uns.ac.rs

INDEKS POJMOVA

283

operacionalizovana populacija, 33 opisni nacrti, 10, 11, 138 panel istraživanje, 12, 13, 14, 79, 104,

118, 226 panel istraživanje, rotirajuće, 13 personalizacija poziva, 200, 201 pilot istraživanje, 19, 20, 26, 83, 113,

119, 154 plagijarizam, 260, 262 plan uzorkovanja, 36, 55, 204 planirani uzorak, 19, 48, 50, 98, 261 planirano nedostajanje, 236 poduzorkovanje, 66 pokrivenost, 44, 47, 97, 112, 176 polustandardizovani intervju, 111 ponder, ekspanzioni, 230 ponder, relativni, 230 ponderisanje, 29, 35, 46, 69, 85, 96,

215, 229, 230, 231, 232 populacija, 14, 31, 175 posmatranje, 209 postkodiranje, 217, 220 poststratifikacija, 229, 232, 255, 259 poštanska anketa, 9, 163, 177 potpuno slučajno nedostajanje

podataka, 233 pouzdanost, 57, 102, 158, 160, 218 poverljivost podataka, 191, 193, 194,

262, 265, 266, 267 povlađivanje (odgovaračka tendencija),

132 prava vrednost, 4, 53, 54, 57, 91, 92, 93,

95, 97, 101, 102 prekodiranje, 216 prenošenje poslednje vrednosti, 247 pretest, 19, 20, 25, 153, 154, 155, 157 prigodni uzorak, 71 primarna jedinica uzorkovanja, 79, 213 prisećanje, 12, 114, 117, 118, 119, 121,

122, 123, 157, 167, 173 pristrasnost, 16, 47, 49, 50, 51, 56, 57,

60, 61, 76, 77, 88, 89, 90, 91, 92, 93, 95, 96, 97, 98, 99, 100, 101, 102, 105, 106, 107, 109, 151, 153, 164, 173, 178, 182, 185, 186, 187, 188, 192, 193, 198, 204, 210, 211, 212, 229, 234, 246, 250, 254, 255, 264

pristrasnost anketara, 210 pristrasnost merenja, 102 pristrasnost neodgovora, 4, 89, 91, 100,

102, 107, 185, 264 pristrasnost podešavanja, 233 pristrasnost pokrivenosti, 97, 98 pristup optimizacije, 120, 121 probabilističko uzorkovanje, 5, 6, 34,

47, 57, 58, 79 proporcija uzorkovanja, 60, 63, 69, 94,

230, 231 proporcionalno biranje, 67 prosto slučajno uzorkovanje, 10, 80 prožeti nacrt, 213 računarski podržano audio

samointervjuisanje, 169 računarski podržano audio-vizuelno

samointervjuisanje, 169 računarski podržano lično

intervjuisanje, 168 računarski podržano

samointervjuisanje, 169 računarski podržano telefonsko

intervjuisanje, 170 računarski podržano video

samointervjuisanje, 169 računarski podržano web

intervjuisanje, 164, 170 računarski samoadministrirajući

upitnici, 172 računarski zvučno-snimano

intervjuisanje, 170 randomizovani eksperimenti, 153, 157 različite verovatnoće selekcije, 231,

232 razumevanje, 103, 114, 115, 116, 117,

121, 122, 137, 147 realizovani uzorak, 13, 50, 51, 58, 72,

89, 231, 261 recipročnost, 194, 195 retka populacija, 33, 34 retki tipovi, 33 retkost, 194, 196 rezolucija ključa, 269 sekundarna jedinica uzorkovanja, 79 sekundarni podaci, 2, 16, 17 sistematsko biranje sa višestrukim

uzorcima, 61 sistematsko slučajno biranje, 60 skor kredibilnosti, 89 skrivene populacije, 34 slanje diska poštom (dsik-by-mail), 172 slučajno nedostajanje podataka, 233,

Page 295: Bojan Janičić - digitalna.ff.uns.ac.rs

OSNOVE ANKETNIH ISTRAŽIVANJA

284

234 socijalna validacija, 191, 194, 196 standardizovani intervju, 110, 111, 161 standardna greška parametra, 53, 54,

69, 90, 93, 94, 96 statističko modelovanje, 34, 157 statističko otkrivanje, 267 stavke otvorenog tipa, 123, 124 stavke sa konstruisanim odgovorima,

123 stavke sa ponuđenim odgovorima, 123,

124, 137 stopa homogenosti, 65, 66, 67, 87 stopa neodgovora, 35, 49, 50, 100, 101,

106, 116, 183, 185, 186, 202, 205, 229

stopa odbijanja, 184 stopa odgovora, 7, 16, 27, 88, 99, 165,

171, 181, 183, 184, 185, 186, 192, 195, 197, 199, 200, 204, 205, 211, 231, 255

strategija levka, 147 strategija obrnutog levka, 147, 148 stratifikacija, 57, 70, 77 stratifikovano slučajno biranje, 21, 67 stratum, 57, 67, 68, 69, 70 studija preseka, 11 suđenje i procena, 114 sviđanje, 194, 196 šifarnik, 218 šifrantski listić, 224 telefonska anketa, 9, 101, 162, 163, 179 teorija dovoljnosti, 152 transverzalna istraživanja, 11 trend, 12, 184, 205 tvrdi podsetnik, 19, 166 tvrdi uslov, 227

tvrdo odbijanje, 185 ujednačenost, 10 ukupna greška ankete, 90, 91, 92, 105,

106, 107 univarijatni uslov, 227 unos podataka, 215, 221, 222 upitnik, 2, 22, 23, 25, 27, 92, 99, 101,

102, 103, 104, 110, 112, 113, 114, 139, 142, 148, 153, 155, 159, 160, 161, 162, 163, 164, 166, 170, 172, 175, 176, 178, 181, 188, 194, 222, 224

uređivanje podataka, 167, 205, 216, 222, 224

uveravanje, 205 uzoračka greška, 53, 68, 69, 92 uzorak, reprezentativan, 36, 56, 75 uzorkovanje usmereno ispitanicima, 77 validnost (valjanost), 10, 25, 55, 57,

102, 158, 160, 205 varijansa anketara, 210 varijansa greške pokrivenosti, 97 varijansa merenja, 102 varijansa nepokrivenosti, 97 varijansa odgovora, 102 varijansa šifranta, 217 varijansa uzorkovanja (varijansa

uzoračke distribucije), 53, 54, 93, 95 višefazno (višetapno) uzorkovanje, 36,

79 višestruke imputacije, 235, 248, 249,

250 vreme latencije, 157 zapamćivanje, 122 zone, 79 zonsko biranje (uzorkovanje), 6, 41, 43

Page 296: Bojan Janičić - digitalna.ff.uns.ac.rs

UNIVERZITET U NOVOM SADU FILOZOFSKI FAKULTET NOVI SAD

21000 Novi Sad Dr Zorana Đinđića 2

www.ff.uns.ac.rs

Elektronsko izdanje http://digitalna.ff.uns.ac.rs/sadrzaj/2019/978-86-6065-533-4

CIP - Каталогизација у публикацији

Библиотеке Матице српске, Нови Сад

303.62

ЈАНИЧИЋ, Бојан, 1968- Osnove anketnih istraživanja [Elektronski izvor] / Bojan Janičić. - Novi Sad :

Filozofski fakultet, 2019. - 1 elektronski optički disk (CD-ROM) : tekst, slika ; 12 cm

Dostupno i na: http://digitalna.ff.uns.ac.rs/sadrzaj/2019/978-86-6065-533-4. -

Nasl. sa naslovnog ekrana.

ISBN 978-86-6065-533-4

а) Анкете -- Истраживања

COBISS.SR-ID 332014087