Click here to load reader

osnove statistike-regresija

  • View
    89

  • Download
    3

Embed Size (px)

DESCRIPTION

Osnove statistike - regresija

Text of osnove statistike-regresija

  • OSNOVE STATISTIKE

    Regresijska i korelacijska analiza

  • Regresijska i korelacijska analiza

    z Dio statistike koji prouava povezanost i uzajamni odnos meu pojavama, koristei pri tomu matematike relacije, naziva se korelacija.

    z Veze meu pojavama mogu biti funkcionalne (ili deterministike) i statistike ( ili stohastine).

    z Glavna zadaa korelacijske analize je otkrivanje zakonitosti i pravilnosti koje vladaju u odnosima meu masovnim statistikim pojavama, te kreiranje matematikih modela koji pomou simbola opisuju ponaanje pojava u stvarnim uvjetima funkcioniranja.

    z Korelacijska analiza ukljuuje konstrukciju grafikona za prikaz kovarijacije pojava (varijabli) i utvrivanje brojanih pokazatelja jakosti i smjera veze izmeu varijabli.

  • Regresijska i korelacijska analiza

    z Kada se u analizi meuzavisnosti definira koja je varijabla zavisna a koja nezavisna onda se koriste metode regresijske analize.

    z Zavisnost pojava se utvruje prema prethodnim teorijskim i empirijskim saznanjima o prirodi pojava i njihovim odnosima.

    z Matematiki izraz koji pokazuje kako na vrijednost zavisne varijable utjee vrijednost jedne ili vie nezavisnih varijabli naziva se regresijski model.

    z Regresijski model predstavlja matematiku funkciju kojom se opisuje zavisnost jedne (zavisne) varijable o jednoj ili vie nezavisnih varijabli.

  • Modeli regresijez Opi oblik modela regresije je:

    z Model se sastoji od deterministikog dijela, koji predstavlja matematiku funkciju kojom se izraava zavisnost zavisne varijable od odreenog broja nezavisnih varijabli, i stohastinog dijela koji predstavlja odstupanje od funkcionalne zavisnosti

    z Modele regresije moemo podijeliti s obzirom na broj nezavisnih varijabli ukljuenih u model i s obzirom na oblik matematike funkcije deterministikog dijela modela

    H ),...,,( 21 kXXXfY

  • Modeli regresije

    zS obzirom na broj nezavisnih varijabli u modelu, modeli regresije se dijele na modele jednostavne regresije i modele viestruke regresije.zModel jednostavne linearne regresije ima

    jednu zavisnu i jednu nezavisnu varijablu.zModel viestruke regresije ima jednu

    zavisnu i vie nezavisnih varijabli

  • Modeli regresije

    z Prema obliku matematike funkcije deterministikog modela, modele regresije dijelimo na linearne i nelinearne ili krivolinijske modele.z Veza meu varijablama kod linearnog modela

    predoena je linearnom funkcijom, iji je graf pravac.z Veza izmeu varijabli kod krivolinijske regresije

    ima oblik neke druge matematike funkcije, iji je graf neka kriva linija.

  • Modeli regresije

    z Cilj regresijske analize je utvrditi smjer, oblik i jainu veze izmeu analiziranih pojava.

    z Smjer veze moe biti pozitivan i negativan. z Oblik veze definiran je oblikom matematike funkcije koja

    predstavlja deterministiki dio modela regresije. Tako postoje linearni i krivolinijski modeli.

    z Jaina veze se odreuje analizom sluajne varijable regresijskog modela. Sluajnom varijablom se predouju nesistemski utjecaji, odnosno utjecaji pojava koje nisu ukljuene u model.

    z Kao prvi korak u analizi zavisnosti dviju sluajnih varijabli uobiajeno se empirijski podaci prikazuju grafiki. U koordinatni sustav se ucrtavaju toke odreene parovima vrijednosti . Tako dobiveni dijagram se naziva dijagram rasipanja (scatter diagram).

    ii yx ,

  • Karakteristini oblici dijagrama rasipanja

    Pozitivna, linearna funkcionalna veza

    y i

    x iNegativna, linearna funkcionalna veza

    x i

    y i

    Pozitivna,linearna jaka stohastina veza

    x i

    y i

    Negativna, linearna umjerena stohastina vezax i

    y i

  • Karakteristini oblici dijagrama rasipanja

    Pozitivna, linearna slaba statistika veza

    x i

    y i

    Negativna, linearna slaba stohastina vezax i

    y i

    Nepostojanje veze x i

    y i

    Krivolinijska stohastina veza

    x i

    yi

  • Modeli regresije jednostavna linearna regresijaz Model jednostavne linearne regresije, opi oblik

    modela je:

    z U modelu jednostavne linearne regresije vrijednost zavisne varijable Y je linearna kombinacija vrijednosti nezavisne varijable X, parametara modela i sluajne varijable.

    z Funkcionalni dio modela odreen je ako su poznate vrijednosti parametara

    z Vrijednost parametara se procjenjuje empirijski ili pomou izmjerenih n parova vrijednosti varijable X i Y

    iii exbby 10

    10 bib

  • Modeli regresije jednostavna linearna regresija

    z Analiza modela u domeni deskriptivne statistike vri se izraunavanjem vrijednosti parametara i pokazatelja reprezentativnosti modela, a to su varijanca, standardna devijacija, koeficijent varijacije i koeficijent determinacije.

    z Vrijednost procijenjenih parametara se izraunava iz n izmjerenih parova vrijednosti x i y.

    z Prema tome i vrijednosti pokazatelja se odnose samo na n izmjerenih parova podataka.

  • Modeli regresije jednostavna linearna regresijaz Parametri procijenjenog modela se odreuju tako da

    odstupanja izmjerenih vrijednosti od procijenjene vrijednosti zavisne varijable pomou modela budu to manja.

    z Postoji vie metoda procjene parametara, a najee se koristi metoda minimalnih kvadrata odstupanja. Parametri procijenjeni metodom minimalnih kvadrata odstupanja opisuju pravac za koji je zbroj rezidualnih kvadrata odstupanja minimalan.

    z Parametri se izraunavaju pomou izraza:

    2

    1

    2

    11

    xnx

    yxnyxb n

    ii

    n

    iii

    xbyb 0

  • Modeli regresije jednostavna linearna regresijaz Parametar predstavlja konstantni lan modela, a

    parametar je regresijski koeficijent.z Konstantan lan je vrijednost zavisne varijable kada

    je vrijednost nezavisne varijable jednaka nuli. Za veinu primjera nema konkretno znaenje.

    z Regresijski koeficijent predstavlja linearnu promjenu zavisne varijable za jedinino poveanje nezavisne varijable.

    z Regresijske vrijednosti se dobivaju uvrtavanjem odgovarajuih vrijednosti nezavisne varijable x u model regresije.

    z Rezidualna odstupanja su odstupanja izmjerenih vrijednosti zavisne varijable od regresijskih vrijednosti.

    0b

    0b1b

    1b

  • Modeli regresije jednostavna linearna regresija

    Podaci o cijeni i prodaji proizvoda A

    0

    5

    10

    15

    20

    0 2 4 6 8 10

    Cijena

    Prod

    aja

    Empirijski podaci Linearni model regresije

    (x, y )

    (0, b 0 )

  • Modeli regresije jednostavna linearna regresijaz Razlike vrijednosti izmjerenih vrijednosti zavisne varijable

    i regresijskih vrijednosti predstavljaju rezidualna odstupanja i oznaavaju se sa .

    z Ovako dobivena odstupanja su izraena u mjernim jedinicama zavisne varijable Y i nazivaju se apsolutna rezidualna odstupanja, .

    z Relativna rezidualna odstupanja su izraena u postotcima i dobiju se tako to se apsolutno odstupanje podijeli izmjerenom vrijednosti varijable, zatim omjer pomnoi sa 100,

    z Rezidualna odstupanja se mogu izraziti i u standardnim devijacijama, pa se nazivaju standardizirana rezidualna odstupanja. Dobivaju se tako da se apsolutna odstupanja podijele standardnom devijacijom modela regresije,

    ie

    iii yye

    y

    iii

    yye VV

    ,

    100

    ,

    i

    iireli y

    yye

  • Modeli regresije jednostavna linearna regresijaz Model regresije je reprezentativniji to su manja rezidualna

    odstupanja.z Kakvoa modela se mjeri odgovarajuim pokazateljima, a

    najznaajniji su:- Varijanca ili prosjeno kvadratno odstupanje, dobiva se tako

    da se zbroj kvadrata rezidualnih odstupanja podijeli brojem podataka.

    - Standardna greka modela ili prosjeno odstupanje podataka od regresijskih vrijednosti, dobiva se kao pozitivni drugi korijen iz varijance.

    - Koeficijent varijacije je omjer standardne devijacije i prosjene vrijednosti zavisne varijable, pomnoeno sa 100.

    n

    iiiy yyn 1

    22

    1V

    100 yVy

    y

    V

  • Modeli regresije jednostavna linearna regresijaz U analizi reprezentativnosti regresijskog pravca koristi se

    koeficijent determinacije.z Koeficijent determinacije je relativna mjera prilagoenosti

    regresijskog pravca empirijskim podacima.z Dobiva se kao omjer protumaenog dijela zbroja kvadrata

    odstupanja i ukupnog zbroja kvadrata odstupanja.z Ukupno odstupanje empirijskih podataka (varijabla y) od

    prosjene vrijednosti varijable y se rastavlja na dio odstupanja protumaen modelom regresije (razlika regresijske vrijednosti i prosjene vrijednosti) i dio ne protumaen modelom (razlika izmeu izmjerene i regresijske vrijednosti)

    z Koeficijent determinacije uzima vrijednosti iz intervala 0 i 1.

    n

    ii

    n

    ii

    yy

    yyr

    1

    2

    1

    2

    2

  • Nelinearni regresijski modeli

    z Povezanost dvije pojave ne moe se uvijek izraziti linearnim modelom. Zbog toga se u izgradnji modela regresije koriste razliiti oblici funkcija, pa se takvi modeli zovu nelinearni ili krivolinijski modeli regresije.

    z U praksi se najee koriste modeli koji se postupkom transformacije mogu prevesti u modele jednostavne linearne regresije i modeli polinomske regresije.

    z Od modela koji se mogu transformirati u modele jednostavne linearne regresije najee se koriste:

    - eksponencijalni modeli,- multiplikativni model,- logaritamski model i- reciproni model.

  • Nelinearni regresijski modeli

    z Kod svih modela regresije radi se o statistikoj meuzavisnosti pojava, pa modeli imaju funkcionalni dio i sluajnu promjenjivu. z Analiza funkcional

Search related