Prezentacija iz Statistike - Korelacija

Embed Size (px)

Citation preview

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    1/26

    Korelacija (smisao, smjer, veličina)

    Informacijske znanosti: Vjerojatnost i statistika

    03.11.2015.

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    2/26

    • Pearsonov koeficijent

    • Spearmanov koeficijent

    • Point-biserijalnikoeficijent

    • Parcijalna korelacija

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    3/26

    Svakodnevni život: međusobna zavisnost, povezanost,asocijacijanpr. između visine i težine; viši ljudi su u prosjeku teži od nižihljudi, između prosječne količine konzumirane hrane i težine i sl.En l. matematičar Karl Pearson ! razradio računski postupak zaizračunavanje stupnja povezanosti, i izrazio a brojkom "koeficijent korelacije (r)

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    4/26

    Pojam

    • Korelacija ustatistici označavasukladnost u variranju dviju (ili više) varijabli.

    • Stupanj sukladnosti u variranju se izražavakoeficijentom korelacije (r).

    • #rste korelacija:

    maksimalna pozitivna$r%&'(,pozitivna $)*&'(,nulta $r%)(,ne ativna $!'*r*)(,maksimalna ne ativna $r%!

    '(

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    5/26

    Vrijednost koeficijenta korelacije kreće se u granicama od -1, potpunonegativna povezanost (dok jedna varijabla raste, druga opada ), do+1, potpuno pozitivna povezanost (obje varijable su u porastu ).

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    6/26

    U opisivanju povezanostikoristimo grafi ke i numeri kemetode.

    !rafi ka metoda podrazumijevagrafi ki prikaz povezanostiizme"u dvije varija#le prekoscatter $ dijagrama.Vrijednosti jedne varija#le nanosese na % osu, a druge na & osu.'vaki ispitanik se prikazuje kaota ka u koordinatnom sustavu.

    Prediktorska varija#la nanosi sena apscisu, akriterijska naordinatu.

    'catter-dijagram omogućavada

    odredimosmjer povezanosti* procjenimo da li je povezanost

    visoka, umjerena ili niska * utvrdimo kakvog jeoblika

    povezanost (linearna, inverznaU, ili neka druga)*

    detektiramoekstremne rezultate.

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    7/26

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    8/26

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    9/26

    Primjeri nelinearne povezanosti (različiti oblici):Primjeri nelinearne povezanosti (različiti oblici):

    Obrnuto U Periodične promjene

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    10/26

    rimjeri nelinearne povezanosti $različiti oblici(:

    Pozitivna

    deceleraci ja (pad je upočetkumanji paveći)

    Negativna

    deceleraci ja (pad je upočetkuveći pamanji)

    negativnaakceleraci

    ja (rast je upočetkuveći pamanji)

    Pozitivnaakceleraci

    ja (rast je upočetkumanji paveći)

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    11/26

    Ako postoji povezanost između dvije varijable (npr, visina itežina) to ne zna i da postoji uzro no!posljedi ni odnos"

    -e mora značiti da jedna varijabla utječe na dru u, ako supovezane, ne o da je neka /tre0a1 $ili više varijabli(podjednako uzrokovala promjene na povezanim varijablama2oje varijable potencijalno utječu na podjednake promjene utežini i visini osobe3

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    12/26

    #kale mjerenja " za mno a mjerenja kod korelacije, od skala bi trebale bitikorištene intervalna ili omjerna skala. 4edini izuzetak je kada imamodihotomne nezavisne varijable $samo dvije vrijednosti( i jednu stalnuzavisnu varijablu $point!biserijalni koe+icijent(.$jere na obje varijable " svaki ispitanik mora imati rezultat na objevarijable: 5 i 6 $bez /missin cases1(.Normalnost " rezultati svake varijable trebaju biti normalno distribuirani.7o može biti provjereno, između ostalo , uvidom u rezultate svakevarijable na histo ramu.%inearnost " veza između dvije varijable treba biti linearna. 7o znači, kadapo ledate na rezultate u skater dija ramu trebali bi vidjeti ravnu liniju, nekrivulju.&omoscedascitet " varijabilitet rezultata za varijablu 5 treba biti sličanvarijabilitetu vrijednosti varijable 6.

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    13/26

    Normalnost distribucije

    %inearnost povezanosti

    &omoscedascitet

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    14/26

    orelacija je postupak kojim se odre"uje povezanost izme"u dvijevarija#le, #ez poznavanja uzro no-posljedi ne veze.

    orelacijom saznajemo da li su dvije varija#le me"uso#no povezane, aline znamo koja varija#la utje e na koju i u kojem stupnju.

    oeficijent korelacije mo e #iti od -1 do +1. Ukoliko je koeficijentkorelacije , korelacije nema. to je veći koeficijent korelacije, veća je povezanost i o#ratno./arametrijska korelacija (normalna distri#ucija varija#li) se odre"uje/earsonovimr koeficijentom korelacije, a neparametrijska korelacija(asimetri ne distri#ucije) se odre"uje 'pearmanovimrho koeficijentom.

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    15/26

    1. 0da#ratiAnalyze, nakon toga kliknuti naCorrelate, zatim oda#ratiBivariate.

    2. Umetnuti dvije varija#le u prostorVariables.3. 0visno od toga da li je distri#ucija rezultata normalna (parametrijskastatistika) ili nije (neparametrijska statistika), u prostoruCorrelationCoefficients oda#rati /earsonov ili 'pearmanov koeficijent.4. liknuti na ptions . anedostajuće vrijednosti (vrijednosti kojenedostaju) kliknuti na!"#lude #ases pair$ise. Unutar 0ptions mo ete,ako elite, oda#rati aritmeti ku sredinu i standardnu devijaciju.%. liknuti naContinue, a zatim na & .

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    16/26

    tvorite matricu podataka /#iS8v9! 2orelacija1a( ija ramom raspršenja utvrdite kakav je $otprilike(

    odnos između / adno iskustva1 i /2oe+icijenta pla0e1.4e li približno linearan3

    b(toto znači3

    d(2akva je korelacija po veličini3

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    17/26

    1. 'rovjera in(orma#ija o uzorku

    /rvo 2to tre#a provjeriti u ta#eli je vrijednost) koja ozna ava #roj ispitanika. 3ali je ta vrijednost odgovarajuća4 5ko puno podataka nedostaje, tre#a provjeriti

    za2to.2. *tvr+ivanje smjera povezanosti

    'ljedeće 2to tre#a provjeriti je smjer povezanosti varija#li, na 2to upućuje predznak 6+7 ili 6-7. 5ko je predznak koeficijenta korelacije negativan, to zna ida veći skor u jednoj varija#li odgovara manjem skoru u drugoj varija#li.Varija#le su, dakle, u negativnoj korelaciji. ada je predznak koeficijentakorelacije pozitivan, varija#le se mijenjaju u istom smjeru.

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    18/26

    ' tvrđivanje sna*e povezanosti/ojedini teoreti ari, poput 8o9ena, o#ja2njavaju da je korelacijamala ako je

    vrijednost koeficijenta korelacije izme"u .1 i .:;,srednja izme"u .< i .=; ivisoka izme"u .> i 1. ./ovezanost od .> i -.> je u potpunosti ista, odnosno velika, jer predznak odre"uje

    samo smjer povezanosti, a ne i snagu te povezanosti.

    4. zra-unavanje koe(i#ijenta determina#ije

    vadriranjem vrijednosti koeficijenta korelacije do#iva se koeficijentdeterminacije, i ako potom do#iveni koeficijent determinacije pomno imo sa 1do#it ćemo #roj koji nam govori koliki postotak varijance o#u9vaćaju odre"enevarija#le.%. 'ro#jena zna-ajnosti koe(i#ijenta korela#ije

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    19/26

    2oliki je koe+icijent determinacije između / adno iskustva1 i/2oe+icijenta pla0e132oliki je koe+icijent determinacije između /2oe+icijenta pla0e1 i/ pse a struka132oji od ove dvije kombinacije varijabli ima više zajedničkih+aktora3

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    20/26

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    21/26

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    22/26

    • Nekada se između dvije varijable može dobiti visokakorelacija zato što na obje

    varijable istovremeno, na istinačin djeluje na neka treća varijabla .

    • Npr., mjerenje duljine stopala isposobnosti pisanja kod djecekorelacija je velika, ali zbo! utjecajatrećeg faktora , a to je starost"dob .#ada bi isključili taj faktor starosti,povezanosti vjerovatno ne bi bilo.

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    23/26

    • ?ormulom za parcijalnu korelaciju računa se povezanost dvijevarijable, uz istovremeno isključivanje utjecaja tre0e varijablena prvu i dru u varijablu.

    @Aazirana na earsonovoj +ormuli za korelaciju, mo u0eračunanje koe+icijenta determinacije

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    24/26

    + 2liknite na Anal ze, te na -orrelate , pa zatim odaberitePartial

    . 2liknite na dvije varijable koje želite međusobno korelirati iprebacite ih u okvir /ariables' otom kliknite na varijablu čiji doprinos toj korelaciji želitekontrolirati i prebacite je u okvir -ontrollin* for0 Kliknite na 1ptions

    < sekciji $issin* /alues , odaberi 23clude -ases Pair4ise < sekciji #tatistics, odaberi 5ero 1rder -orrelations6 2liknite na -ontinue, zatim na 1K

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    25/26

  • 8/18/2019 Prezentacija iz Statistike - Korelacija

    26/26