Dvodimenziona regresiona i korelaciona analiza

Embed Size (px)

Citation preview

  • 8/18/2019 Dvodimenziona regresiona i korelaciona analiza

    1/20

    Visoka tehnološka škola strukovnih studija Šabac

    Odsek: Gastronomija

    SEMINAS!I A" I# $E"ME%A

    Statistika

    %ema rada:

    Dvodimenzionalna regresiona i korelaciona analiza

    $ro&esor:  Student:

    "r' Aleksa Macanovi( enata Mu)ik *+,-./01

    Šabac2 ./03

  • 8/18/2019 Dvodimenziona regresiona i korelaciona analiza

    2/20

    Sadržaj

    4vod…………………………………………………………………………………………………………………………3

    !orelaciona

    anali5a……………………………………………………………………………………………………4

    6inearnakorelacija…………………………………………………………………………………………………….5

    !orelacijaran7a………………………………………………………………………………………………………..5

    !orelacija vremenskihni5ova……………………………………………………………………………………6

    e7resionaanali5a…………………………………………………………………………………………………….6

    6inearna re7resija……………………………………………………………………………………………………

    8

    Multi8lare7resija……………………………………………………………………………………………………..10

    Odnos i5me9uvarijabli…………………………………………………………………………………………….11

    !oe&icijenti korelacijei $earsonov koe&icijent korelacije  ….

    ……………………………………..12

    S8earmanov koe&icijentkorelacije…………………………………………………………………………...14

  • 8/18/2019 Dvodimenziona regresiona i korelaciona analiza

    3/20

    Matricakorelacije…………………………………………………………………………………………………….15

    $rimenakorelacije…………………………………………………………………………………………………...16

    #akljuak;……………………………………………………………………………………………………………..18

    6iteratura………………………………………………………………………………………………………………….19

    .

    Uvod

    e7resiona anali5a je sku8 statistikih metoda kojima se otkriva da li 8ostoje ve5e i5me9u 8osmatranih 8ojava i kakve su 8o obliku i smeru'

    e7ressio

  • 8/18/2019 Dvodimenziona regresiona i korelaciona analiza

    4/20

    %ermin ? korelacija ? 8otie od latinske reci ? correlatio@ > me9uodnos' $od 8ojmomkorelacijska anali5a se 8odra5umeva merenje jacine stohastickih medu5avisnosti tj' merenjeste8ena sla7anja varijacija 8osmatranih 8ojava u relativnom smislu'

    #a merenje ste8ena korelacije < 5avisnosti= i5medu dva obilje)ja koristi se koe&icijent 8rostelinearne korelacije ili indeks korelacija 5a krivolinijske re7resione modele' #a merenje ste8enasla7anja varijacija koristi se koi&icijent višestruke linearne korelacije'

    I5me9u re7resione i korelacione anali5e 8ostoje uske ve5e' #ahvaljuju(i redovima en7leskihnaunika Galtona i $ersona termini korelacija i re7resija su 8ostali o8šte statisticki 8rihva(eni'4 8raksi se naješce srecemo sa 8ojavama koje su u me9usobnoj ve5i2 uticu jedna na dru7u kaon8r' 8otrošnja domacinstva 5avisi od 5arade 8rinos 8šenice od utroška 9ubriva2 kvalitet 8šenice2 kvalitet 5emljišta us8eh studenata od 8red5nanja2 uenja 8ro&esora'  Bilj re7resioneanali5e je da se odredi &unkcionalna ve5a i5medu 8osmatranih 8ojmova'

    #a odredivanje oblika re7resije najcešce se kao naj8rikladnije i najjednostavnije sredstvo

    koristi dija7ram rasi8anja'"ija7ram rasi8anja se konstruiše tako što se u kordinatima sistemunose 8arovi vrednosti varijabile C i D2 odnosno on se sastoji od tacaka

  • 8/18/2019 Dvodimenziona regresiona i korelaciona analiza

    5/20

    .= !ada je svejedno koja se relacija mo5e na8isati2 tj' Y = f(x) i X = f(y)   7ovori se okorelacijskom modelu'

    Ve5e me9u 8ojavama mo7u biti:

    a= 8o obliku: linearna i krivolinijska

     b= 8o smeru: 8o5itivna ili ne7ativna

    c= 8o inten5itetu: &unkcionalna ili stohastika'

    a= !ada 8romena jedne 8ojave 5a jedinicu mere 8ovlai 5a sobom 8romenu dru7e 8ojave 5aodre9eni jednaki i5nos2 radi se o linearnoj ve5i2 tj' linearnoj korelaciji' !ada 8romena jedne 8ojave nije 8ra(ena jednakim i5nosima dru7e 8ojave2 radi se o krivolinijskoj korelaciji'

     b= $o5itivni smer ve5e je kada rast

  • 8/18/2019 Dvodimenziona regresiona i korelaciona analiza

    6/20

    ve5a je linearna' Što je oblak taaka 5bijeniji s ob5irom na liniju re7resije2 ve5a me9u 8ojavama je jaa iobratno'

    !oe&icijent determinacije je mera jakosti ve5a me9u 8ojavama i5ra)ena u dru7om stu8nju' %o je odnosi5me9u 8rotumaeno7 dela varijanse i uku8ne varijanse (r"='

    $earsonov koe&icijent korelacije je mera jakosti linearne ve5e me9u 8ojavama i5ra)ena u 8rvom ste8enu<   r =√ r 

    2

    =' Mo)e imati vrednost od >0 do K0' Što je bli)i krajnjim 7ranicama2 ve5a je vrš(a' !ada je

    nula i5me9u 8romatranih 8ojava2 ne 8ostoji linearna 5avisnost'

    r=√ bb ' 

    Korelacija ranga

    "a bi se ustanovilo 8ostoji li ve5a i5me9u dve 8ojave istra)uje se 8ostojanje ve5e i5me9u

    ran7ova 8romatranih 8ojava' Lakost ve5e me9u ran7ovima C i D meri se S8earmanovimkoe&icijentom korelacije ran7a:

    %aj koe&icijent mo)e imati vrednost od >0 do K0 i što je vrednost bli)a svojim 7ranicama2 ve5ame9u ran7ovima C i D je jaa'

    5

    Korelacija vremenski# nizova

    !od is8itivanja ve5e i5me9u 8ojava 8romatranih u vremenu treba 8roveriti 8ostojanje trendakod tih 8ojava2 a to utie na veliinu koe&icijenta korelacije ukoliko trendovi nisu 8aralelni saa8scisom' 4koliko 8ostoji delovanje trenda na koe&icijent korelacije2 8re i5raunavanja koe&'

    korelacije treba eliminirati uticaj trendova i to se vrši i5raunavanjem 8arcijalno7 trendakorelacije'

    Regresiona analiza

  • 8/18/2019 Dvodimenziona regresiona i korelaciona analiza

    7/20

    Regresiona (regresijska) analiza je najvažnija analiza u statistii! a koristi se

    za utvr"ivanje #a li $ro%ena svojstva je#inie neke serije $o#ataka zavisi

    o# $ro%ene svojstva je#inie nekog #rugog sku$a. &ko $ostoji $aralelnost

    kretanja $ro%ena svojstava je#inia $ro%atrani' sku$ova! on#a se %ože

    rei #a $ostoji izvesna zavosnost iz%e"u ta #va sku$a. avisnost iz%e"u

    #va $os%atrana sku$a %ože *iti+

    1. ,unkionalna zavisnost - ako svakoj vre#nosti je#ne $ro%enjive ($ojave)

    o#govara je#na vre#nost neke #ruge $ro%enjive ($ojave)

    2. to'astika zavisnost / ako je#noj vre#nosti nezavisne $ro%enjive

    o#govara itav niz %ogui' vre#nosti zavisne $or%enjive .

    Regresiona analiza se *avi istraživanje% varija*iliteta i otkrivanje%

    ,unkionalnog o*lika! koje% se najvie $ri*ližava kvantitativno slaganje

    varijaija $os%atrani' $ojava.inearni %o#el regresije se koristi u situaiji

    ka#a e%$irijski $o#ai u nekoj seriji $okazuju ten#eniju linearnog$oveanja ili s%anjenja! o#nosno! koristi se ka#a se žele istražiti #ve $ojave

    i ustanoviti $ostoji li linearna veza iz%e"u nji' (linearna veza $ostoji ako

    $orast je#ne $ojave izaziva $orast #ruge $ojave).

    *

    inearna ,unkija regresije je+

      a *

    a i * $ara%etri su konstante i / o#nos iz%e"u nji' $re#stavljaju sve

    %ogue vre#nosti koje za#ovoljavaju je#nainu.

    ∑ y=na+b ∑ x

  • 8/18/2019 Dvodimenziona regresiona i korelaciona analiza

    8/20

       Σxy=aΣx+bΣ x2

    7ara%etar * u je#naini regresije oznaava intenzitet oekivani' $ro%ena $ojave

    ()! koje nastaju iz $ro%ene $ojave (). ntenzitet ti' $ro%ena a$solutno jeo#re"en $ara%etro% *! tako #a su %ogui sluajevi+

    1 * 0

    $oveanje% $ojave () #oi e #o $oveanja $ojave ()

    2 * : 0

    $oveanje% $ojave () #oi e #o s%anjenja $ojave ()

    3 * 0

    $ro%ena $ojave () nee utiati na $ro%enu $ojave ()

    Linearna regresija

    e7resijska anali5a jedna je od metoda multivarijatne anali5e koja 8ret8ostavlja 8ostojanjenajmanje dvaju sku8ova varijabli2 a koristi se 5a 8rouavanje i modeliranje 8ove5anosti ira5lika i5me9u tih sku8ova varijabli' e7resijskom metodom 8okušava se ustanoviti 8ostojanjei ra5ina 8ove5anosti i5me9u jedne ili više 5avisnih

  • 8/18/2019 Dvodimenziona regresiona i korelaciona analiza

    9/20

    Ako se odnos i5me9u 8arametara u re7resijskoj anali5i mo)e 8rika5ati nekom linearnom&unkcijom2 7ovorimo o linearnom re7resijskom modelu'

    $rvi oblik linearne re7resije 8ojavio se još 8oetkom 0' 8erioda kao metoda najmanjihkvadrata od strane &rancusko7 matematiara Adrien+Marie 6e7endrea

  • 8/18/2019 Dvodimenziona regresiona i korelaciona analiza

    10/20

    koja se sastoji od minimi5iranja sume kvadrata re5idualnih vrednosti

  • 8/18/2019 Dvodimenziona regresiona i korelaciona analiza

    11/20

    i5ra)ava se više odnosa

  • 8/18/2019 Dvodimenziona regresiona i korelaciona analiza

    12/20

    Što su toke ras8ršenije korelacija je manja' 4 8raksi je vi5ualno vrlo teško2 osim u sluajusavršen korelacije odrediti stu8anj 8ove5anosti i5me9u varijabli' Ovisno o me9usobnomodnosu dve varijabli me9u kojima 8ostoji korelacija2 ona mo)e biti linearna ili nelinearna' !odlinearne korelacije2 toke su 7ru8irane oko 8ravca' !od nelinearne korelacije2 take su7ru8irane oko neke dru7e krivulje'

    "ve varijable koje 8romatramo sa ciljem utvr9ivanja njihove korelacijske 8ove5anosti mo7u biti u 1 ra5liita odnosa:

    0' kada mala vrednost jedne varijable od7ovara maloj vrednosti dru7e varijable2 kao i kadavelika vrednost jedne varijable od7ovara velikoj vrednosti dru7e varijable2 radi se o 8o5itivnojkorelaciji'

    .' kada mala vrednost jedne varijable od7ovara velikoj vrednosti dru7e varijable i obratno2 radise o ne7ativnoj korelaciji'

    ,' kada vrednost jedne varijable u nekim intervalima od7ovara maloj vrednosti dru7e varijable2a u dru7im intervalima velikoj vrednosti2 radi se o nemonotonoj korelaciji' Ako se korelacijaviše ne7o jednom menja od 8o5itivne 8rema ne7ativnoj2 takva korelacija na5iva se ciklikakorelacija'

    1' kada se na osnovu vrednosti jedne varijable ne mo)e 5akljuiti ništa o vrednosti dru7evarijable2 tada korelacija ne 8ostoji' %oke u takvom 7ra&u su ras8ršene

    00

    Koeficijen&i korelacije

    !oe&icijenti korelacije i5ra)avaju meru 8ove5anosti i5me9u dve varijable u jedinicamaneovisnima o konkretnim jedinicama mere u kojima su iska5ane vrednosti varijabli' $ostojiviše koe&icijenata korelacije koji se koriste u ra5liitim sluajevima' 4 8raksi se 8rilikom rada slinearnim modelima naješ(e koristi $earsonov koe&icijent korelacije

  • 8/18/2019 Dvodimenziona regresiona i korelaciona analiza

    13/20

    koe&icijent korelacije=' $rilikom rada s modelima koji nisu linearni naješ(e se koristiS8earmanov koe&icijent korelacije

  • 8/18/2019 Dvodimenziona regresiona i korelaciona analiza

    14/20

    ;u%a u%nožaka varija*li < i je#naka je su%i u%nožaka o#stu$anja vre#nosti

    varija*li < i o# nji'ovi' $roseka+

    !oe&icijent korelacije jednak je omeru:

    4 sluaju da me9u varijablama ne 8ostoji linearna 8ove5anost2 mo)e se 8rovesti od7ovaraju(atrans&ormacija kojom se vrednosti varijabli modela svode na linearne'

    13

    'earmanov koeficijen& korelacije

    ;$ear%anov koe=ijent korelaije ($ro#ukt rang korelaije) koristi se za %erenje$ovezanosti iz%e"u varija*li u sluajevi%a ka#a nije %ogue $ri%eniti 7earsonov

    koe=ijent korelaije. >azira se na to%e #a se iz%eri #osle#nost $ovezanosti

    iz%e"u $ore#ani' varija*li! a o*lik $ovezanosti (n$r. linearni o*lik koji je $re#uvet

    za koritenje 7earsonovog koe=ijenta) nije *itan. ;luajevi u koji%a se koristi

    ;$ear%anov ko=ijent su n$r. ka#a %e"u varija*la%a ne $ostoji linearna

  • 8/18/2019 Dvodimenziona regresiona i korelaciona analiza

    15/20

    $ovezanost! a nije %ogue $ri%eniti o#govarajuu trans,or%aiju kojo% *i se

    $ovezanost $revela u linearnu (n$r. veza iz%e"u seiz%ikog atri*uta i *uotinskog

    $o#ataka u na,tnoj geologiji). ;$ear%anov koe=ijent korelaije kao rezultat #aje

    $ri*ližnu vre#nost koe=ijenta korelaije koji se tretira kao njegova #ovoljno #o*ra

    a$roksi%aija. 7riliko% koritenja ;$ear%anovog koe=ijenta! vre#nosti varija*li

    $otre*no je rangirati i na takav nain svesti na zaje#niku %eru. ?ajje#nostavniji

    nain rangiranja je #a se naj%anjoj vre#nosti svake varija*le $o#eli rang 1!

    sle#eoj $o veliini rang 2 i tako sve #o $osle#nje kojoj se $o#eljulje %aksi%alan

    rang. zraunavanje koe=enta ra#i se koritenje% vre#nosti $o#eljeni' rangova.

    ;$ear%anov koe=ijent oznaavati e%o sa r;.

    @or%ula za izraun ;$ear%anovog koe=ijenta korelaije je+

    g#e je # razlika vre#nosti rangova #ve $ro%atrane varija*le! a n je *roj razliiti'

    serija.

    01

    $a&rica korelacije

    7oneka# na% u istraživanju nije #ovoljna in,or%aija o korelaiji #ve $ro%atrane

    varija*le! ve nas zani%a na koji nain vie varija*li %eAuso*no utjeBe je#na na

    #rugu. ?akon to se $ro%atranje% %eAuso*nog o#nosa svi' $arova #ve varija*li

  • 8/18/2019 Dvodimenziona regresiona i korelaciona analiza

    16/20

    utvr#i nji'ova %eAuso*na korelaija! izraAuje se %atria korelaije. Reti i stu$i

    %atrie $re#stavljaju $ro%atrane varija*le! a $o#atak na $reseku o#reAenog retka

    i stu$a $re#stavlja koe=ijent korelaije iz%eAu varija*li u o#govarajue% retku i

    stu$u. Catria na #ijagonali i%a $o#atak 1 ($oto je svaka varija*la sa%a sa

    so*o% u $ot$unoj korelaiji). Do*ijena %atria je si%etrina - $o#ai izna# i is$o#

    #ijagonale za isti $ar varija*li su i#entini. *og ti' svojstava %atria je

    re#un#antna i #ovoljno je $ro%atrati je#an njen #io! izna# #ijagonale ili is$o#

    #ijagonale. Eizualno %ože%o utvr#iti u kojoj %eri su #ve $oje#inane varija*le u

    korelaiji! koje varija*le u %eAuso*no% o#nosu i%aju najvei ili naj%anji

    koe=ijent korelaije! te koji sku$ovi varija*li se istiu slini% koe=ijenti%a.

    Eizualno ne %ože%o utvr#iti na koji nain i u kolikoj %eri vie varija*li zaje#niki

    utie na #rugu $oje#inanu varija*lu.

    03

  • 8/18/2019 Dvodimenziona regresiona i korelaciona analiza

    17/20

    rimena korelacije

    e5ultati korelacije imaju brojne 8raktike 8rimene2 ali se ni u kojem sluaju ne bi smeli samona osnovu re5ultata utvrHene korelacije donositi 5akljuke o u5rono+8osledinoj ve5i'!orelacija se ne bi trebala koristiti 5a donošenje 5akljuaka o u5rono+8osledinoj ve5i i5meHu

    dve varijable 8ošto je velika vervatnost da (e 5akljuak biti kriv' Leste sluaj je da se 8romatraodnos i5meHu dve varijable koje su u korelaciji visoko7 stu8nja' MeHutim2 8ostoji i skrivenatre(a varijabla koju bi takoHe trebalo staviti u odnos sa 8romatrane dve2 kako bi se is8ravno 8rotumaio u5rono+8osledini odnos'

    Ledan od klasinih2 u literaturi esto s8ominjanih 8rimera2 je 8ojava uoena u !o8enha7enunekoliko 7odina 8osle 5avršetka "ru7o7 svetsko7 rata' #amecena je korelacija i5meHu 8ove(anja broja novoroHene dece i broja roda koje su se 7ne5dile u 7radu' Ako bi se korelacija be5 ra5mišljanja 8rotumaila kao u5rono+8osledni odnos2 mo7lo bi se 5akljuiti da rodedonose decu' $ravi u5rok le)i u tome što se 8o 5avršetku rata velik dio stanovništva sa sela

     8reselio u 7rad2 što je u5rokovalo 8ove(anje broja stanovnika u 7radu2 a samim tim i 8ove(anje broja novoroHene djece' Istovremeno2 5a nove stanovnike 7rada i57radile su se nove ku(e2 takoda su i rode dobile veQi broj dimnjaka 5a svoja 7ne5da' %u je dakle2 8ostojala skrivena varijabla+ broj stanovnika2 koju je 8rilikom donošenje 5akljuka o u5rono+8osledinoj ve5i trebalou5eti u ob5ir'

     Naravno2 ima i su8rotnih 8rimera kada ne 8ostoji skrivena varijabla' Vrlo rano je ustanovljenakorelacija i5meHu 8ušenja i verovatnosti da (e osoba oboleti od raka' "uvanska industrija branila je svoju te5u da se ne mo)e us8ostaviti u5rono+8osledina ve5a i5meHu 8ušenja iverovatnosti dobivanja raka' Oni su te5u obra5la7ali time da su 8ušai vrlo esto nervo5ne

    osobe2 koje 5bo7 to7a što su nervo5ne 8oinju 8ušiti' Istovremeno 8ostoji korelacija i5meHuto7a da je osoba nervo5na i verovatnosti da (e takva osoba dobiti rak' S dru7e strane2 lekari sutvrdili da 8ostoji i5ravna u5rono+8osledina ve5a i5meHu 8ušenja i verovatnosti da (e osobadobiti rak2 što je kasnije i 8otvr9eno'

    0*

  • 8/18/2019 Dvodimenziona regresiona i korelaciona analiza

    18/20

     Na osnovu utvr9ene korelacije ne mo)emo sa si7urnoš(u utvrditi u5rono+8osledinu ve5ui5me9u dvu varijable' 48rkos tome korelacija nam daje in&ormaciju o tome da su te dvevarijable na odre9eni nain 8ove5ane' Iako ne shva(amo u 8ot8unosti mehani5am te 8ove5anosti2 5namo da 8ove5anost 8ostoji i 8rilikom o8isa varijabli to mo)emo u5eti u ob5ir' N8r' 8o5nato nam je da je 8ove(ana telesna te)ina u korelaciji sa 8ove(anom smrtnoš(u i

    mo)emo re(i da su te dve varijable u me9usobnom odnosu' !orelacija se naješ(e koristi 5a 8redvi9anje vrednosti jedne varijable ovisno o 8romeni vrednosti dru7e varijable2 u sluaju akosu te dve varijable u korelaciji' Sa5nanje o korelaciji i5me9u dve varijable 8oma)e nam da sve(om si7urnoš(u 8redvidimo na koji nain (e se menjati vrednost dru7e varijable' N8r' 8o5nato nam je da su koliina unesene soli u or7ani5am i visina krvno7 8ritiska osobaodre9eno7 8ola i 7odina u korelacijskom odnosu i taj odnos nam je 8o5nat' Na osnovu tihin&ormacija mo)emo do5irati unos 8otrebne koliine soli u or7ani5am kako bi krvni 8ritisak ostao unutar 7ranica normale2 a or7ani5am bi 8rimio dovoljnu koliinu soli 5a normalno&unkcioniranje'

    4tvr9ivanjem korelacije i5me9u vrednosti dve varijable mo)e se dobiti 8rva in&ormacija onjihovoj me9usobnoj 8ove5anosti' Nakon to7a se utvr9ena 8ove5anost mo)e detaljnije istra)itidru7im statistikim metodama' N8r' korelacijom se utvrdi da 8ostoji ve5a i5me9u korištenjeneko7 hemijsko7 sredstva i 8ojave odre9ene bolesti' Nakon to7a se mo)e u eks8erimentalnimuslovima2 na laboratorijskim )ivotinjama utvrditi da li stvarno 8ostoji u5rono+8osledina ve5ai5me9u tih varijabli' !orelacija je tu odi7rala ulo7u da i5olira varijable koje me9usobno na nekinain utiu jedna na dru7u2 a nakon to7a dru7e metode2 koje to mo7u2 8otvr9uju ili odbacujuod7ovaraju(u u5rono+8osledinu hi8ote5u' !orelacija se esto koristi 5a 8roveru re5ultatatestiranja' Nakon 8rovedno7 testiranja utvr9uje se od7ovarajuQa korelacija i5me9u testiranja idobijenih re5ultata' Nakon što se testiranje 8onovi2 8onovno se utvrHuje korelacija i5meHu

    novih i 8rethodno dobijenih re5ultata' 4 sluaju da korelacija ne 8ostoji2 obino se 5akljuujeda je 8rovedeni eks8eriment vrlo nestabilan 8ošto 8onovljeni eks8eriment ne mo)e 8onoviti 8rethodne re5ultate'

    1F

  • 8/18/2019 Dvodimenziona regresiona i korelaciona analiza

    19/20

    *aklj%ak 

    !orelacija

  • 8/18/2019 Dvodimenziona regresiona i korelaciona analiza

    20/20

     

    Gnjiga+

    R0 Mundruc5T GFUr7F: Alkalma5ott re7ress5iTs5mWts