10
16/11/2018 1 UVOD U ANALIZU PODATAKA Novembar 2018 Novembar 2018 Istraživanje tržišta Ekonomski fakultet , Beograd 2 Oblasti izučavanja I. Priroda i obuhvat marketinških istraživanja II. Izvori podataka u marketinškim istraživanjima III. Faze istraživačkog procesa IV. Eksploratorna istraživanja V. Deskriptivna istraživanja VI. Merenje stavova i dizajniranje upitnika VII. Uzročna istraživanja: Izvođenje eksperimenata VIII. Izvlačenje uzoraka, vrste uzoraka IX. Analiza podataka (1) X. Analiza podataka (2)... Novembar 2018 Istraživanje tržišta Ekonomski fakultet , Beograd 3 IX . Analiza podataka (1) 1. Osnove analize podataka 2. Testiranje hipoteza 3. Regresiona i korelaciona analiza Novembar 2018 Istraživanje tržišta Ekonomski fakultet , Beograd 4 IX .1. Osnove analize podataka Priprema podataka za analizu Tabeliranje podataka Faktori koji utiču na izbor tehnike za analizu podataka Pregled statističkih tehnika za analizu podataka

IX.1. Osnove analize podataka...1. Osnove analize podataka 2. Testiranje hipoteza 3. Regresiona i korelaciona analiza Novembar2018 Istraživanje tržišta Ekonomski fakultet, Beograd

  • Upload
    others

  • View
    11

  • Download
    0

Embed Size (px)

Citation preview

16/11/2018

1

UVOD U ANALIZU PODATAKA

• Novembar 2018

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

2

Oblasti izučavanja

I. Priroda i obuhvat marketinških istraživanjaII. Izvori podataka u marketinškim istraživanjimaIII. Faze istraživačkog procesaIV. Eksploratorna istraživanjaV. Deskriptivna istraživanjaVI. Merenje stavova i dizajniranje upitnikaVII. Uzročna istraživanja: Izvođenje eksperimenataVIII. Izvlačenje uzoraka, vrste uzorakaIX. Analiza podataka (1)X. Analiza podataka (2)...

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

3

IX. Analiza podataka (1)

1. Osnove analize podataka2. Testiranje hipoteza3. Regresiona i korelaciona analiza

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

4

IX.1. Osnove analize podataka

• Priprema podataka za analizu• Tabeliranje podataka• Faktori koji utiču na izbor tehnike za analizu podataka• Pregled statističkih tehnika za analizu podataka

16/11/2018

2

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

5

Priprema podataka za analizu

• Editovanje podataka• Kodiranje podataka• Statističko prilagođavanje podataka

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

6

Editovanje podataka (1)• Sprovodi anketar ili supervizor na terenu ili

istraživač pre početka analize • Treba identifikovati sledeće probleme:

– Greške anketara (daje loša/pogrešna uputstva)– Nedostajući odgovori– Nejasni odgovori (nečitki ili nejasni)– Međusobna neusklađenost odgovora (npr.

kontradiktorni) – Nedovoljna kooperativnost (npr. bira isti odgovor)– Neodgovarajući ispitanik

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

7

Editovanje podataka (2)• Pošto se identifikuju, problemi se mogu rešiti

primenom sledećih postupaka:– Ponovno kontaktiranje ispitanika, ako se smatra

značajnim– Odbaciti ceo upitnik ako je neupotrebljiv, ako ispitanik

nije razumeo anketu ili je bio nekooperativan– Odbaciti pojedinačno problematično pitanje– Kodirati nejasne odgovore u kategoriju “ne znam” ili

“nemam mišljenje”

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

8

Kodiranje• Zatvorena pitanja

– Šta su zatvorena pitanja i kada se koriste? – Prednosti i nedostaci zatvorenih pitanja– Kodiranje zatvorenih pitanja

• Otvorena pitanja– Šta su otvorena pitanja i kada se koriste? – Prednosti i nedostaci otvorenih pitanja– Kodiranje otvorenih pitanja?

16/11/2018

3

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

9

Statističko prilagođavanje podataka

• Ponderisanje;

• Respecifikacija varijabli;

• Veštačke varijable; i

• Transformacija skale.

Ponderisanje• Procedura po kojoj se svakom odgovoru iz baze

podataka, dodeljuje određeni broj (ponder) u skladu sa prethodno utvrđenim pravilom

• Koristi se da se postigne reprezentativnost uzorka – reprezentativnost u odnosu na ono što se želi izmeriti

• Ili da se bolje izmeri određena karakteristika – npr. ponderisanje tržišnim učešćem

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

10

Respecifikacija varijabli

• Procedura po kojoj se postojeći podaci modifikuju kako bi se formirale nove varijable da bi se bolje realizovali ciljevi istraživanja, npr. – veliki broj varijabli se pregrupiše u manji broj– računanje odnosa dve varijable da bi se formulisala

nova varijabla,– izvlačenje kvadratnog korena i logaritamske

transformacije, – korišćenje veštačkih varijabli.

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

11

Veštačke varijable• Nazivaju se još i instrumentalnim i kvalitativnim

varijablama• Respecifikacija kategorijske varijable• Ako postoji m nivoa kvalitativne varijable, koristi

se (m – 1) veštačka varijabla da se oni specifikuju – M-ta varijabla je definisana sa prethodnih m-1– Najlakše objasniti na dihotomnim (binarnim)

varijablama koje imaju samo dva nivoa.

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

12

16/11/2018

4

Transformacija skale• Manipulacija sa vrednostima merne skale • Da se obezbedi uporedivost, npr.

– Standardizacija se može primeniti samo na podacima koji su dati na intervalnoj ili skali odnosa

– Od svake realizovane vrednosti se oduzme srednja vrednost i podeli sa standardnom devijacijom

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

13

( ) xii sXXz -=

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

14

Tabeliranje podataka

• Raspored frekvencija• Deskriptivni statistički pokazatelji• Unakrsno tabeliranje

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

15

Tabeliranje podataka

• Koristi se za:

– “Čišćenje” podataka

– Određivanje empirijske raspodele (raspodele

frekvencija)

– Izračunavanje deskriptivnih statističkih pokazatelja

(srednje vrednosti i procentualno učešće)

• Zatim se podaci unakrsno tabeliraju kako bi se

videlo da li postoji povezanost između dve

tipično nominalne varijable.

Primer: Koliko često kupujete Politiku

Pol:

Svaki dan Najmanje jednom

nedeljno

Najmanje jednom

mesečno

Ni jednom

mesečno

Muški 80 70 30 20

Ženski 40 60 50 50

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

16

16/11/2018

5

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

17

Raspored frekvencija• Na kojoj skali moraju biti varijable?• Predstavlja broj dobijenih odgovora za svako

postavljeno pitanje• Može biti organizovano po klasama ili grupama

odgovora• Može se prikazati štapićastim dijagramom• Mogu se prekombinovati grupe/kategorije

pitanja, kako u zavisnosti od cilja istraživanja/vrste odgovora tako i frekvencije odgovora u pojedinim kateogrijama

Primer: Koliko često kupujete Politiku

Pol:

Svaki dan

Najmanje jednom

nedeljno

Najmanje jednom

mesečno

Ni jednom

mesečno

Uk.

Muški 80 70 30 20 200

Ženski 40 60 50 50 200

Uk. 120 130 80 70

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

18

Koliko često kupujete Politiku?

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

190 50 100

Svaki dan

Najmanje jednomnedeljno

Najmanje jednommesečno

Ni jednom mesečno

ŽenaMuškarac

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

20

Deskriptivni statistički pokazatelji

• Predstavljaju sumarnu informaciju dobijenu na osnovnu rasporeda frekvencija. Mogu biti:– Mere centralne tendencije (srednja vrednost,

medijana, modus),– Mere disperzije (interval varijacije, standardna

devijacija, koeficijent varijacije),– Mere oblika rasporeda (simetričnost i spljoštenost);

• Naravno, kod upotrebe nominalnih mernih skala može se koristiti samo raspored frekvencija.

16/11/2018

6

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

21

Čebiševljeva teorema• Određuje gde se vrednosti raspodele frekvencija nekog

pokazatelja nalaze u odnosu na njegovu srednju vrednost;• Bez obzira na raspored:

– Najmanje 75% vrednosti će biti unutar intervala ± 2 stand. devijacije,– Najmanje 89% vrednosti će biti u okviru ± 3 stand. devijacije,

u odnosu na srednju vrednost posmatranog parametra;• Ako je raspored simetrična kriva u obliku zvona, onda:

– Oko 68% vrednosti u populaciji će biti u okviru ± 1 standardna devijacija,– Oko 95% vrednosti će biti u okviru ± 2 standardne devijacije,– Oko 99% vrednosti će se nalaziti u okviru ± 3 standardne devijacije

u odnosu na srednju vrednost posmatranog parametra.

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

22

Unakrsno tabeliranje• Tehnika koja služi za posmatranje odnosa između dve i

više nominalnih varijabli;• Kada se obračun vrši po redovima ili kolonama, tabele

sa unakrsnim tabeliranjem se nazivaju tabele kontingencije, budući da su procenti suštinski uslovljeni ukupnim sumama po redovima ili kolonama;

• Najveći broj marketinških istraživanja ne ide dalje od unakrsnog tabeliranja, a čak i ona istraživanja koja koriste sofisticiranije analitičke metode još uvek koriste unakrsno tabeliranje kao važnu komponentu.

Primer: Koliko često kupujete Politiku?

Pol:

Svaki dan Najmanje

jednom

nedeljno

Najmanje

jednom

mesečno

Ni

jednom

mesečno

Muškarac 80 70 30 20

Žena 40 60 50 50

Novembar 2018 Istraživanje tržišta

Ekonomski fakultet, Beograd

23

Primer: Koliko često kupujete Politiku?

Pol:

Svaki dan

Najmanje jednom

nedeljno

Najmanje jednom

mesečno

Ni jednom

mesečno

Uk.

Muškarac

80 70 30 20 200

Žena 40 60 50 50 200

Uk. 120 130 80 70

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

24

16/11/2018

7

Koliko često kupujete Politiku?- Štapićasti dijagram -

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

250 50 100

Svaki dan

Najmanje jednomnedeljno

Najmanje jednommesečno

Ni jednom mesečno

ŽenaMuškarac

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

26

Faktori koji utiču na izbor tehnike za analizu podataka

• Vrsta podataka• Dizajn istraživanja• Pretpostavke na kojima se bazira

testiranje statističkih pokazatelja

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

27

Vrsta podataka• Podaci na nominalnoj skali (nemetrički):

– Frekvencije, jedina mera centralne tendencije je modus, hi-kvadrat test

• Podaci dati na ordinalnoj skali (nemetrički): – Percentili, kao i najveći broj neparametarskih testova (neki

put pogrešna primena parametarskih metoda)• Podaci dati na intervalnoj i na skali odnosa (metrički):

– Srednja vrednost (aritmetička sredina), mere disperzije, mere oblika raspodele, i širok izbor parametarskih i neparametarskih testova

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

28

Dizajn istraživanja (1)• Nezavisnost uzoraka, npr.:

X O1 ako se ne mere na istom skupu, koristi se O2 t-test za razliku dve srednje vrednosti; ALI

O1 X O2 ako su oba merenja na istom skupu onda se koristi t-test uparenih razlika.

• Broj grupa, npr.:X1 O1 postoje tri grupe i tri srednje vrednosti zaX2 O2 poređenje, ne može t-test za razliku srednjih

O3 vrednosti, već analiza varijanse

16/11/2018

8

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

29

Dizajn istraživanja (2)• Broj varijabli, npr.:

X O1 gde su ovo dva merenja različitih varijabli i O2, više se ne mogu koristiti univarijacione tehn.

• Kontrola nad uticajem varijabli

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

30

Pretpostavke na kojima se bazira testiranje statističkih pokazatelja

• Neophodno odlično poznavanje pretpostavki na kojima se pojedini testovi baziraju. Npr.:– Pretpostavke t-testa, na osnovu dva uzorka sa

istom s, su:1. Uzorci su nezavisni;2. Karakteristike koje nas zanimaju za svaku populaciju

imaju normalan raspored;3. Dve populacije imaju jednake varijanse.

t-test nije osetljiv na povredu pretpostavke o normalnom rasporedu, ali jeste na pretpostavku o jednakim varijansama.

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

31

Pregled statističkih tehnika za analizu podataka

• Univarijacione i multivarijacione tehnike• Parametarske i neparametarske tehnike• Tehnike zavisnosti i međuzavisnosti

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

32

Tehnike za analizu podataka

Univarijacione tehnike

Multivarijacione tehnike

Posmatra se samo jedna promenljiva

Posmatra se više promenljivih istovremeno

16/11/2018

9

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

33

Univarijacione tehnike za analizu podataka

Neparametarske statističke tehnike

Parametarske statističke tehnike

Podaci su nemetrički (nominalna i ordinalna skala)

Podaci su metrički (intervalna i skala odnosa)

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

34

Neparametarske tehnike analize podataka

- Hi-kvadrat- Kolmogorov-

Smirnov- RUNS

Postoji samo jedan uzorak

Postoje dva ili više uzoraka

Nezavisni uzorci

Zavisni uzorci

- Hi-kvadrat- Suma rangova- Kolmogorov –

Smirnov- KW ANOVA

- Test znakova- Vilkoksov test- Meknimarov

test- Kokranov Q-

test

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

35

Parametarske statističke tehnike

- t-test- z-test

Postoji samo jedan uzorak

Postoje dva ili više uzoraka

Nezavisni uzorci

Zavisni uzorci

- t-test- z-test- ANOVA

- Upareni t-test

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

36

Tehnike za analizu podataka

Univarijacione tehnike

Multivarijacione tehnike

Posmatra se samo jedna promenljiva

Posmatra se više promenljivih istovremeno

16/11/2018

10

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

37

Multivarijacione tehnike

Tehnike zavisnosti

Fokus na vari-jablama

Fokus na predmetima posmatranja

- Faktorska analiza

- Analiza skupina

- Višedimen-zionalno skaliranje

Jedna zavisna varijabla

Više zavisnih varijabli

- ANOVA i ANCOVA- Višestruka regresija- Diskriminaciona anal.- Analiza združenih

efekata

- MANOVA i MANCOVA

- Kanonička korelacija

Tehnike međuzavisnosti