38
55 Klasifikacija prema JEL: C4, C5, D0 SAOPŠTENJA / COMMUNICATIONS Aleksandra Nojković DOI:10.2298/EKA0772055N MODELI DISKRETNE ZAVISNE PROMENLJIVE: PREGLED METODOLOGIJE I PRIMENJENIH ISTRAžIVANJA QUALITATIVE RESPONSE MODELS: A SURVEY OF METHODOLOGY AND ILLUSTRATIVE APPLICATIONS APSTRAKT: Predmet razmatranja ovog rada je ekonometrijsko modeliranje primenom modela diskretne (prekidne) zavisne promneljive. Ovi modeli se često nazivaju i modelima kvalitativnog odgov- ora i predstavljaju standardan metodološki okvir mikroekonometrijske analize. Reč je o oblasti ekonometrije koja analizira podatke o ekonomskom ponašanju poje- dinaca, domaćinstava ili preduzeća (mik- ropodaci). U praksi su ovi modeli najveću primenu našli u istraživanjima o tržištu rada, ponašanju potrošača i u ekonomiji saobraćaja. U novijim istaživanjima po- kazano je da se ova metodologija može uspešno preneti i u makroekonomski kon- tekst i opsežnije primenjivati u analizi vre- menskih serija i panela. KLJUČNE REČI: mikropodaci, binarni i višestruki izbor, nelinearni modeli, metod maksimalne verodostojnosti, modeli bro- jivih podataka ABSTRACT: is paper introduces econo- metric modelling with discrete (categorical) dependent variables. Such models, com- monly referred to as qualitative response (QR) models, have become a standard tool of microeconometric analysis. Microecono- metric research represents empirical analy- sis of microdata, i.e. economic information about individuals, households and firms. Microeconometrics has been most widely adopted in various fields, such as labour economics, consumer behaviour, or econo- my of transport. e latest research shows that this methodology can also be success- fully transferred to macroeconomic context and applied to time series and panel data analysis in a wider scope. KEY WORDS: microdata, binary and multinomial response, nonlinear models, maximum likelihood estimation, models for count data

MODElI DIsKrEtNE zAvIsNE prOMENljIvE: prEglED MEtODOlOgIjE I prIMENjENIh … · 2007. 6. 12. · Modeli binarnog izbora se primenjuju za istraživanje ... pretpostavlja da je u pitanju

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

  • 55

    Klasifikacija prema JEL: C4, C5, D0

    SAOPŠTENJA / COMMUNICATIONS

    Aleksandra Nojković DOI:10.2298/EKA0772055N

    MODElI DIsKrEtNE zAvIsNE prOMENljIvE: prEglED MEtODOlOgIjE I prIMENjENIh IstrAžIvANjA

    QUAlItAtIvE rEspONsE MODEls: A sUrvEY OF MEthODOlOgY AND IllUstrAtIvE ApplICAtIONs

    ApstrAKt: Predmet razmatranja ovog rada je ekonometrijsko modeliranje primenom modela diskretne (prekidne) zavisne promneljive. Ovi modeli se često nazivaju i modelima kvalitativnog odgov-ora i predstavljaju standardan metodološki okvir mikroekonometrijske analize. Reč je o oblasti ekonometrije koja analizira podatke o ekonomskom ponašanju poje-dinaca, domaćinstava ili preduzeća (mik-ropodaci). U praksi su ovi modeli najveću primenu našli u istraživanjima o tržištu rada, ponašanju potrošača i u ekonomiji saobraćaja. U novijim istaživanjima po-kazano je da se ova metodologija može uspešno preneti i u makroekonomski kon-tekst i opsežnije primenjivati u analizi vre-menskih serija i panela.

    KljUČNE rEČI: mikropodaci, binarni i višestruki izbor, nelinearni modeli, metod maksimalne verodostojnosti, modeli bro-jivih podataka

    ABstrACt: This paper introduces econo-metric modelling with discrete (categorical) dependent variables. Such models, com-monly referred to as qualitative response (QR) models, have become a standard tool of microeconometric analysis. Microecono-metric research represents empirical analy-sis of microdata, i.e. economic information about individuals, households and firms. Microeconometrics has been most widely adopted in various fields, such as labour economics, consumer behaviour, or econo-my of transport. The latest research shows that this methodology can also be success-fully transferred to macroeconomic context and applied to time series and panel data analysis in a wider scope.

    KEY WOrDs: microdata, binary and multinomial response, nonlinear models, maximum likelihood estimation, models for count data

  • 1. Uvod

    Na razvoj modela diskretne zavisne promenljive prevashodno je uticao sistem obrazovanja mikropodataka. Naime, sve do kraja šezdesetih godina prošlog veka empirijska analiza u kojoj su jedinice posmatranja pojedinci, domaćinstva ili preduzeća, bila je vrlo ograničena. Od tog perioda počinje prvo organizovano prikupljanje mikropodataka u SAD, a najpoznatije i najstarije studije su: Panel Study of Income Dynamics i National Longitudinal Surveys of Labor Market Experiences, koje su korišćene u analizi tražnje, kao i za ispitivanje efekata ekonomskih i socijalnih programa. Nešto kasnije i u evropskim zemljama započinje prikupljanje podataka o ekonomskom ponašanju pojedinaca i domaćinstava, koje je tek nešto kasnije dopunjeno odgovarajućim prikupljanjem podataka u preduzećima. Mikropodaci mogu biti uporedni (podaci strukture) ili podaci panela (podaci koji predstavljaju kombinaciju uporednih podataka i vremenskih serija).

    Kao rezultat potrebe za analizom podataka ovog tipa došlo je do intenzivnog interesovanja za unapređenje postojeće ekonometrijske metodologije u pravcu razvoja odgovarajućih metoda. Veliki broj novih modela, metoda ocenjivanja i testiranja, kao i empirijska istraživanja zasnovana na mikropodacima pokazatelj su rastuće popularnosti mikroekonometrijskih istraživanja u svetu. Fundamentalan doprinos razvoju metodološkog okvira analize mikropodataka i empirijskoj primeni modela specifične zavisne promenljive dali su J. Heckman i D. McFadden, koji su za svoje rezultate dobili Nobelovu nagradu za ekonomiju 2000. godine. U najnovijim ekonometrijskim istraživanjima otvorilo se pitanje da li je ekonometrijske metode modela specifične zavisne promenjive moguće primeniti u kvantitativnoj analizi strukturnih odnosa makroekonomskih vremenskih serija, odnosno podataka panela. Pokazano je da se tradicionalna metodologija razvijena za uporedne podatke, pod određenim pretpostavkama može preneti na makroekonomski okvir.

    Struktura rada je sledeća. Nakon uvodnog dela, sledi pregled metodologije koja se koristi u ekonometrijskoj analizi modela binarne zavisne promenljive. U okviru drugog dela biće dat pregled najznačajnijih specifikacija, metoda ocenjivanja i statističkog zaključivanja u modelima binarnog izbora. U trećem

    56

    Aleksandra Nojković

  • delu biće predstavljeni modeli u kojima kvalitativna zavisna promenljiva ima više od dva modaliteta, a ovo proširenje modela binarnog izbora vrši se dodavanjem novih jednačina u model. U četvrtom delu osvrnućemo se na modele brojivih podataka i na neke od najznačajnijih specifikacija modela ove grupe. U okviru svakog dela biće razmatrani ekonomski problemi čija analiza podrazumeva primenu predloženih specifikiacija modela.

    2. Modeli binarnog izbora

    Modeli binarnog izbora se primenjuju za istraživanje ponašanja prilikom izbora koji jedinica posmatranja čini između dve alternative. Donošenje odluke o kupovini automobila, traženju posla, izlasku na izbore ili rađanju dece, samo su neke od situacija sa kojima se često susrećemo u praksi. Za proučavanje uticaja faktora koji opredeljuju donošenje ovakvih odluka koristimo modele prilagođene kvalitativnim i binarnim zavisnim promenljivima. Naime, opisana situacija izbora između dve alternative formalno se predstavlja modelom u kome je zavisna promenljiva y binarna i uzima vrednost 1 kada je učinjen jedan izbor, a 0 kada je učinjen drugi izbor. Ako verovatnoću prvog izbora označimo sa P (pri čemu je verovatnoća drugog izbora 1-P), od značaja je da se odredi ova verovatnoća i opiše uticaj različitih faktora na tu verovatnoću. Takvo ponašanje u praksi najčesšće ispitujemo primenom linearnog modela verovatnoće i probit i logit modelima.

    Linearni model verovatnoće1 je specijalni slučaj linearnog regresionog modela u kome je zavisna promenljiva yi binarna i uzima vrednost 1 ili 0. Model možemo predstaviti u sledećem obliku:

    yi = β’xi + εi (2.1)

    gde je xi vektor K egzogenih promenljivi, β vektor nepoznatih regresionih parametara dimenzija K x 1, a εi je slučajna greška. Ovako definisan model predstavlja klasičan linearni regresioni model, pri čemu su slučajne greške heteroskedastične (jednostavno se pokazuje da važi sledeće: var (εi) = β’xi (1- β’xi) ). Prisustvo heteroskedastičnosti u modelu (2.1) ima za posledicu da metod običnih najmanjih kvadrata daje neefikasne ocene i netačne prognoze. Model je

    1 Linear probability model( LPM)

    Modeli diskretne zavisne promenljive: pregled metodologije i primenjenih istraživanja

    57

  • moguće oceniti metodom ponderisanih najmanjih kvadrata2 (weighted least sqears), ali navedena specifikacija pretpostavlja da x dovodi do linearnog rasta y i ne obezbeđuje da se izračunate verovatnoće nađu u granicama intervala (0, 1). Ograničenost linearnog modela verovatnoće u analizi binarnog izbora uticala je na razvoj nelinearne specifikacije modela. Bilo je neophodno da alternativna transformacija modela obezbedi da vrednosti zavisne promenljive leže unutar intervala (0, 1), odnosno da za dati vektor egzogenih promenljivih bude ispunjen uslov:

    lim Prob (Y = 1) = 1 i lim Prob (Y = 1) = 0 (2.2) β’x→+∞ β’x→-∞

    Ispunjenje navedenog uslova sugeriše upotrebu funkcije raspodele verovatnoće poput one predstavljene na slici 2.1, koja uz to obezbeđuje da porast x dovodi do promene y za sve vrednosti x.

    Slika 1. Model funkcije raspodele verovatnoće

    Ovaj alternativni pristup zasniva se na uopštavanju polaznog regresionog modela (2.1) uvođenjem latentne promenljive (latent variable) yi*, koja se ne opaža:

    2 Weighted least sqears, WLS

    -30 -20 -10 0 10 20 300.00

    0.25

    0.50

    0.75

    1.00F( x)β

    β x

    58

    Aleksandra Nojković

  • yi* = β’xi + εi (2.3)

    Ono što se u praksi opaža jeste veštačka promenljiva yi , koja se još naziva i indikator. Definisana je na sledeći način:

    yi = 1 ako yi* > 0

    = 0 ako yi* ≤ 0 (2.4)

    gde je izbor nule arbitraran. Ovo odgovara pretpostavci da se opaža samo znak, a ne i numerička vrednost yi*.

    U ovakvoj formulaciji modela β’xi je E (yi* / xi), a ne E (yi / xi) kao u slučaju linearnog modela verovatnoće. Dakle, iz jednakosti (2.3) i (2.4) sledi:

    Prob (Yi = 1) = Prob (εi > - β’xi)

    = 1 – F (-β’xi) (2.5)

    gde je F funkcija raspodele greške εi .

    U praksi se najčešće pretpostavlja da slučajna greška εi ima normalnu raspodelu sa sredinom μ i varijansom σ2 (εi ~ N (μ , σ2)). Razlog da se usvoji navedena funkcija raspodele leži u činjenici da je izbor između dve alternative rezultat delovanja velikog broja faktora. Tako centralna granična teorema opravdava pretpostavku da je β’x normalno raspodeljena slučajna promenljiva (najčešće se pretpostavlja da je u pitanju normalna standardizovana raspodela, odnosno εi ~ N (0, 1)). Model koji odgovara ovoj pretpostavci naziva se probit3 model i definiše se kao:

    ( ) ( )[ ] ( ) ( )xdttdttYobxx

    '2exp211Pr

    '2

    '

    βφπ

    ββ

    Φ==−==∞−∞−

    , (2.6)

    3 Naziv je prvi upotrebio Goldberger (1964), prema engleskom nazivu za normalnu funkciju raspodele (cumulative probability function).

    Modeli diskretne zavisne promenljive: pregled metodologije i primenjenih istraživanja

    59

  • gde je Φ (.) oznaka za normalnu standardizovanu raspodelu, a φ (.) za odgovarajuću funkciju gustine. Pored probit modela, veliku primenu u praksi ima i logit model:

    Prob (Y = 1) = eβ’x / (1+ eβ'x) = Λ (β’x), (2.7)

    koji pretpostavlja logističku funkciju raspodele slučajne greške ui (oznaka Λ (.)).4 Na slici 2.2. uočavamo da je reč o funkciji raspodele koja je veoma bliska normalnoj, osim na krajevima, gde logistička funkcija raspodele ima “teže” repove.

    Slika 2. Funkcije raspodele probit i logit modela

    0

    1

    p

    ProbitLogit

    Osim što je matematički jednostavniji za primenu, logit model rešavanjem po β’x daje sledeću relaciju:

    ( )xe

    PP '

    1β=

    −, (2.8)

    koja omogućava da se zavisna promenljiva predstavi kao prirodni logaritam količnika verovatnoće prvog i drugog izbora:

    4 Slučajna promenljiva u ima logističku raspodelu, ako je njena funkcija raspodele F (u) =Λ

    (u)=1/(1+e-u), odnosno gustina: [ ] .)(1)()( uuuf Λ−Λ= Sredina i varijansa logističke raspodele su nula i π2 / 3.

    60

    Aleksandra Nojković

  • ln [ P / (1-P)] = β’x . (2.9)

    Iz jednakosti (2.9) se uočava da će zavisna promenljiva uzeti pozitivnu vrednost u slučaju kada je verovatniji prvi izbor, odnosno negativnu vrednost ako je verovatniji drugi izbor. Na taj način se zavisna promenljiva može predstaviti kao linearna funkcija nezavisnih faktora i ocenjivati bez ikakvih ograničenja na vrednosti parametara.

    Ocene parametara logit i probit modela nisu direktno uporedive (varijansa logističke raspodele je π2/3, a normalne standardizovane raspodele je 1), ali se u najvećem broju slučajeva mogu veoma dobro aproksimirati sledećom relacijom koju je predložio Amemiya: 5

    ∧β probit =0.625

    ∧β logit (2.10)

    Važno je napomenuti da za razliku od linearnih modela, ocenjeni koeficijenti probit i logit modela ne predstavljaju marginalne efekte. Efekat jedinične promene x na verovatnoću pozitivnog ishoda (y =1) definisan je kao:

    [ ] ( )( ) ββ

    β=∂

    ∂xdxdF

    xxyE

    '' ( )ββ xf '= , (2.11)

    gde je f (.) funkcija gustine koja odgovara funkciji raspodele F (.). Izraz (2.11) za slučaj normalne funkcije raspodele postaje:

    [ ] ( )ββφ xxxyE

    '=∂

    ∂, (2.12)

    dok je odgovarajući izraz za logističku funkciju raspodele:

    [ ] [ ] .)'(1)'( βββ xxxxyE

    Λ−Λ=∂

    ∂ (2.13)

    5 Amemiya (1981) je pokazao da deljenje dobijenih ocena logit modela sa 1,6 daje bolji rezultat

    od deljenja sa π / 31/2 ≈ 1,8, kako se očekivalo.

    Modeli diskretne zavisne promenljive: pregled metodologije i primenjenih istraživanja

    61

  • Zapaža se da uticaj na verovatnoću događaja Pi zavisi od vrednosti objašnjavajuće promenljive x odnosno od stepena strmosti funkcije raspodele za date vrednosti x6, dok znak koeficijenta zaista odgovara smeru promene verovatnoće. Za interpretaciju ocenjenih modela korisno je izračunati efekat uticaja na verovatnoću za vrednosti aritmetičkih sredina vektora x ili pak za neku drugu vrednost x od interesa. Ovakvo izračunavanje marginalnih efekata se primenjuje kada nas interesuje efekat neprekidnih objašnjavajućih promenljivih na verovatnoću ostvarenja posmatranog događaja. Kako se u vektoru egzogenih promenljivih najčešće nalazi i bar jedna veštačka promenljiva, njen efekat se računa, za date vrednosti x, kao razlika verovatnoća pozitivnog odgovora (Prob(Y =1)) za vrednosti veštačke promenljive jedan, odnosno nula.

    Sa izuzetkom linearnog modela verovatnoće, modeli binarnog izbora se najčešće ocenjuju metodom maksimalne verodostojnosti. Ocena maksimalne

    verodostojnosti∧β dobija se maksimiziranjem logaritma funkcije

    verodostojnosti oblika:

    ( ) ( ) ( )[ ]{ }=

    −−+==n

    iiiiinn xFyxFyxLL

    1,'1log1'log);(loglog βββ (2.14)

    odnosno rešavanjem sledeće jednačine:

    0)1(

    )1()1(

    log11

    =−−−+=

    −−=

    ∂∂

    ==

    i

    i

    ii

    i

    iiii

    ii

    ii xFfy

    Ffyxf

    FFFyL n

    i

    n

    i

    n

    β, (2.15)

    gde je fi funkcija gustine (∂Fi / ∂ (β’xi)) koja odgovara odabranoj funkciji raspodele Fi. Izraz (2.15) se naziva jednačina verodostojnosti ili funkcija ostvarenih pogodaka7 (označava se kao ( )βS ).

    6 Verovatnoća se približava nuli po sve sporijoj stopi (kada vrednost objašnjavajuće

    promenljive opada), a takođe i jedinici po sve sporijoj stopi (kada vrednost objašnjavajuće promenljiva raste).

    7 Score function

    62

    Aleksandra Nojković

  • Osim za linearni model verovatnoće, uslov (2.15) predstavlja sistem od K nelinearnih jednačina i zahteva iterativni postupak rešavanja, koji je u slučaju oba razmatrana modela relativno jednostavan za operacionalizaciju. U praksi se najčešće primenjuje Newton-ov metod optimizacije, pri čemu mora biti ispunjen sledeći uslov globalne konkavnosti odgovarajuće funkcije verodostojnosti:

    H = ∂2log Ln (β) / ∂β ∂β’ < 0. (2.16)

    Relativno jednostavno se pokazuje da je Hesijan8 (matrica drugih izvoda, označava se i kao J (β)) predstavljen izrazom (2.16) negativno definitna matrica za svako β Є B (B parametarski prostor) i u probit i u logit specifikaciji modela.

    Pogodnost Newtonovog metoda je u tome što maksimizira vrednost logaritma funkcije verodostojnosti bez obzira na inicijalne vrednosti, i to obično u svega nekoliko koraka. Ocene koeficijenata modela dobijene ovom metodom poseduju poželjne asimptotske osobine (asimptotsku normalnost i konzistentnost)9, a matrica asimptotskih ocena varijansi i kovarijansi može se izračunati kao negativna vrednost inverznog Hesijana izračunata za vrednost

    ocene maksimalne verodostojnosti ∧β (ove ocene se često označavaju i kao

    MV

    ∧β ):

    ∧∧

    ∧∧∧

    =

    ∂∂

    ∂−= VLA

    1

    2

    '

    )(ln)(varββ

    ββ . (2.17)

    U najvećem broju slučajeva inverzna matrica postoji. Ukoliko matrica nije invertibilna, to najčešće ukazuje na perfektnu multikolinearnost među

    regresorima. Asimptotska standardna greška ocene j∧β predstavlja kvadratni

    koren j-tog dijagonalnog elementa matrice (2.17). Pored navedene, veoma često

    8 Hessian matrix 9 Videti dokaz: Amemiya (1985), str. 129-135.

    Modeli diskretne zavisne promenljive: pregled metodologije i primenjenih istraživanja

    63

  • koriste se i sledeće dve ocene asimptotske kovarijantne matrice ocena MV∧β .

    Prva ocena, koju su predložili Berndt, Hall, Hall i Hausman (BHHH ocena), zasniva se na rezultatu da očekivana vrednost matrice drugih izvoda predstavlja kovarijantnu matricu vektora prvih izvoda. Druga asimptotska ocena kovarijantne matrice dobija se metodom pogađanja10, a zasniva se na očekivanoj vrednosti Hesijana.

    Osnovni nedostatak Newtonog metoda optimizacije je to što matrica drugih izvoda izračunata za vrednost parametra β (obično udaljenog od optimalnog rešenja) ne mora biti negativno definitna, a to celu proceduru optimizacije odvodi u pogrešnom smeru. Drugi nedostatak je činjenica da metod u svakoj iteraciji zahteva izračunavanje drugog izvoda odnosne funkcije, što može biti veoma zahtevno. Alternativni metodi optimizacije nastali su kao pokušaj unapređenja Newtonovog metoda. Jednostavno rešenje prvog problema predložili su Goldfeld, Quandt i Trotter (1966), a poznato je kao kvadratni metod “penjanja ka vrhu“11. Drugi nedostatak se uspešno otklanja metodama iz grupe tzv. pseudonjutonovog metoda, čiji algoritmi ne podrazumevaju izračunavanje drugih izvoda i brže konvergiraju ka optimalnom rešenju.12

    Za potrebe testiranja hipoteza o vrednosti parametara ocenjenih metodom maksimalne verodostojnosti, na raspolaganju je veliki broj testova. Kako ocene

    maksimalne verodostojnosti ∧β imaju asimptotski normalnu raspodelu (sa

    sredinom nula), i koristeći neku od predloženih asimptotskih ocena kovarijantne matrice, može se sprovesti testiranje značajnosti i mogu se formirati aproksimativni intervali poverenja za nepoznate parametre. Hipoteze o značajnosti pojedinačnih parametara testiraju se poređenjem sa kritičnim vrednostima iz tablica normalne standardizovane raspodele (umesto tablica t-rspodela, koje se koriste u klasičnim linearnim modelima). Testiranje složenijih hipoteza, kojima se pretpostavlja da koeficijenti u ocenjenom modelu zadovoljavaju izvesna linearna ili nelinearna ograničenja, sprovodi se primenom sledećih, asimptotski međusobno ekvivalentnih testova: Waldovog, testa 10 Method of scoring 11 Quadratic hill-climbing method 12 Npr. Davidson – Fletcher – Powell (DFP) i Broyden – Fletcher – Golgfarb – Shanno (BFGS)

    metod. Navedeno prema: Greeen (1997), str. 191-193.

    64

    Aleksandra Nojković

  • količnika verodostojnosti i testa Lagrange-ovog multiplikatora. Pod pretpostavkom da je tačna nulta hipoteza, sve tri test-statistike su asimptotski ekvivalentne i imaju χ2 raspodelu, sa brojem stepeni slobode koji je jednak broju ograničenja. Neophodno je naglasiti da u malim uzorcima navedeni testovi mogu dati različite rezultate (nepoznate osobine u malim uzorcima), dok se u velikim uzorcima bira onaj test koji je jednostavniji za primenu.

    Analiza stabilnosti parametara odnosno hipoteza o njihovoj nepromenljivosti za sve opservacije u uzorku, sprovodi se primenom testa koji odgovara Chowom testu u klasičnom linearnom regresionom modelu. Postoji veliki broj različitih testova specifikacije modela kvalitativne zavisne promenljive. U praksi se istraživači najčešće susreću sa problemom izostavljanja relevantne objašnjavajuće promenljive i prisustvom heteroskedastičnosti u modelu, za čije otkrivanje su razvijeni odgovarajući testovi. Pored ovih testova u analizi modela kvalitativne zavisne promenljive moguće je testirati i sledeće greške specifikacije: neispunjenost pretpostavke o normalnom rasporedu slučajne greške, prisustvo autokorelacije, pristrasnost u izboru uzorka, egzogenost promenljivih, kao i opravdanost pretpostavke o nezavisnosti irelevantnih alternativa, koji ćemo razmatrati u okviru analize logit modela višestrukog izbora.

    Kvalitet modela binarnog izbora može se proceniti primenom većeg broja pokazatelja. Pored obaveznog navođenja maksimalne vrednosti logaritma funkcije verodostojnosti (lnL), navodi se i vrednost logaritma funkcija verodostojnosti izračunata pod ograničenjem nulte hipoteze da su svi parametri probit ili logit modela jednaki nuli (ln L0).

    Najćešće korišćeni skalarni pokazatelj kvaliteta modela, jeste McFaddenov indeks količnika verodostojnosti (LRI), koji se još naziva i pseudo R2:

    pseudo R2 = LRI = 1 – (lnL / lnL0), (2.18)

    predložen po ugledu na koeficijent determinacije R2 u klasičnom regresionom modelu. Intuitivno zaključujemo da se ovaj pokazatelj u nelinearnim modelima takođe kreće u intervalu (0, 1), ali da pri tome nema “direktnu” interpretaciju i da ne predstavlja udeo objašnjenih u ukupnim varijacijama zavisne promenljive. Dakle, predloženo je da se vrednost LRI jednaka jedinici tumači kao pokazatelj

    Modeli diskretne zavisne promenljive: pregled metodologije i primenjenih istraživanja

    65

  • “perfektne” prognoze modela13 , a u potpunosti je prihvaćeno tumačenje da se kvalitet modela povećava sa rastom vrednosti LRI.

    Takođe, predloženi su i drugi pokazatelji kvaliteta za ovu grupu modela. Ben–Akiva i Lerman (1985) predložili su meru koja se zasniva na sposobnosti predviđanja modela:

    R2BL = ∧

    =

    ∧−−+ ),1)(1(1

    1iii

    n

    ii FyFy

    n (2.19)

    i koja predstavlja prosečnu verovatnoću tačnih predviđanja modela, odnosno predviđanja koja su u skladu sa usvojenim pravilom predviđanja. Nedostak ovog pokazatelja je veoma loša moć predviđanja manje zastupljenog odgovora u “nebalansiranim” uzorcima (kada odgovori 1 i 0 nisu ravnopravno zastupljeni). Navedeni nedostatak otklonila je mera koju je predložio Cramer (1998):

    λ = (prosek ∧F | yi = 1) – (prosek

    ∧F | yi = 0)

    = (prosek (1- ∧F )| yi = 0) – (prosek (1-

    ∧F )| yi = 1). (2.20)

    U literaturi se još navode i pokazatelji kvaliteta koje su predložili: Efron (1978), Veall i Zimmermann (1992) i Zavoina i McKelvey (1975) 14.

    Pored vrednosti za pseudo R2 u istraživanjima se najčešće navodi i procenat tačnih predviđanja modela, koji se predstavlja tabelama tipa 2x2. Pri tome se pod tačnom prognozom podrazumeva:

    y = 1 ako je F > F* i y = 0 ako je F ≤ F*, (2.21)

    gde je F* verovatnoća koja se tretira kao prag tačnih predviđanja. Najčešće se koristi vrednost F* = 0.5, pri čemu je važno naglasiti da se navedeni kriterijum

    13 Ovo je samo donekle tačno, jer čak i u slučaju kada smo odabrali odgovarajuću funkciju

    raspodele i kada model sadrži veliki broj regresora, nećemo dobiti perfektnu prognozu osim kad se β’x kreće do +∞ ili -∞.

    14 Navedeno prema: Green (1997), str. 831-834.

    66

    Aleksandra Nojković

  • pokazao kao neadekvatan u “nebalansiranim” uzorcima. Iz tog razloga ne postoji jedinstvena kritična vrednost za F*, već se određuje u zavisnosti od konkretnog problema.

    Potrebno je naglasiti da se ocene maksimalne verodostojnosti na kojima se zasnivaju svi predloženi pokazatelji kvaliteta modela binarnog izbora ne biraju na osnovu kriterijuma dobijanja što većeg procenta tačnih predviđanja, već biramo onu vrednost β za koju se postiže maksimum združene funkcije verodostojnosti posmatranih zavisnih promenljivih. Dakle, pri ocenjivanju metodom maksimalne verodostojnosti, prioritet je na dobijanju ocena sa poželjnim asimptotskim osobinama, a kriterijum maksimiziranja tačnih predviđanja modela sadržan je u nekim od poluparametarskih metoda ocenjivanja, koje ćemo razmatrati u nastavku rada.

    Podsetimo se da se metodi parametarskog ocenjivanja probit i logit modela binarnog izbora zasnivaju na pretpostavci o poznatoj funkciji raspodele slučajne greške εi (normalna ili logistička). Ukoliko ova pretpostavka nije ispravna, onda su dobijene ocene nekonsistentne. Iz tog razloga predloženi su brojni metodi neparametarskog i poluparametarskog ocenjivanja, koji polaze od manje restriktivnih pretpostavki o osobinama slučajne greške. U prvoj grupi najveću primenu ima postupak za ocenjivanje neparametarske regresione funkcije metodom jezgra15, koji podrazumeva ocenjivanje veze između [ ]iyE i β΄xi putem sekundarne analize već dobijenih rezultata ocenjivanja. Važno je naglasiti da ovaj metod ne obezbeđuje asimptotsku ocenu kovarijantne matrice, kao i da neparametarska analiza još predstavlja predmet gotovo isključivo teorijskih razmatranja. U grupi poluparametrskih metoda ocenjivanja najveću primenu ima metod maksimalnog broja pogodaka16, koji obezbeđuje maksimiziranje tačnih predviđanja zavisne promenljive y pomoću znaka latentne promenljive y* (2.3). Osnovni nedostatak metode maksimalnog broja pogodaka jeste odsustvo informacije o standardnim greškama dobijenih ocena. Neku pretpostavku o varijabilitetu unutar uzorka moguće je obezbediti primenom metoda replikacije17. Pri tome, ocene dobijene metodom maksimiziranja rezultata i pored osobine konsistentnosti, znatno sporije konvergiraju ka pravoj vrednosti 15 Kernel method 16 Maximum score estimator; MSCORE ili MS estimator 17 Bootstraping method

    Modeli diskretne zavisne promenljive: pregled metodologije i primenjenih istraživanja

    67

  • parametara (stopa konvergencije je n1/ 3, dok je stopa konvergencije parametarskih ocena n1/2). Pri tome, njihova asimptotska raspodela nije normalna. Rešenje ovog problema ponudio je Horowitz (1992) predloživši postupak izravnanja ocena dobijenih metodom maksimalnog rezultata18. Ovim postupkom obezbeđuje se dobijanje ocena koje poseduju asimptotski normalnu raspodelu i stopu konvergencije koja je najmanje n2/ 5 (pod određenim polaznim pretpostavkama arbitrarno se može tretirati i kao n1/2).19

    Iz grupe poluparametarskih metoda navodimo i metod pseudomaksimalne verodostojnosti20, koji su predložili Klein i Spady (1993), i postupak uopštene maksimalne verodostojnosti21, koji je za ocenjivanje modela binarnog izbora predložio Cosslett (1983). Prednosti navedenih poluparametarskih metoda ocenjivanja je to što su njihovom primenom izbegnute greške specifikacije koje nastaju usled pogrešne polazne pretpostavke o funkciji raspodele slučajne greške. Najznačajniji nedostaci su složenost postupka ocenjivanja (moguće je oceniti model sa najviše 15 koeficijenata i to na bazi ne više od 1500 do 2000 opservacija) i nemogućnost istraživanja marginalnih efekata pojedinih promenljivih, što često predstavlja osnovnu svrhu istraživanja modela binarnog izbora.

    Modeli binarnog izbora imaju veoma veliku primenu osim u ekonomiji i u drugim društvenim naukama, kao što su istraživanja odluke o rađanju dece (demografija), izlasku na izbore (sociologija), vrednovanju efekata novih metoda učenja (pedagogija), te modeliranje verovatnoće da će pojedinac učiniti neko kriminalno delo (kriminologija). U ovom delu rada navešćemo neke od najznačajnijih primena modela binarnog izbora u empirijskom istraživanju ekonomskih problema. Domencich i McFadden (1975) modelirali su izbor pojedinaca da na posao putuju sopstvenim automobilom ili koriste javni prevoz. Ocenjena je logit specifikacija modela, na bazi ankete sprovedene na uzorku od 115 pojedinaca koji su svakodnevno putovali do posla. Izbor između dve alternative modeliran je na osnovu informacija o vremenu i troškovima načina putovanja za koje se pojedinac opredelio, vremenu i troškovima alternativnog

    18 Smoothed MSCORE 19 Videti dokaz: Horowitz (1998). 20 Quasi Maximum Likelihood Estimator; QMLE 21 Generalized Maximum Likelihood Method, GML method

    68

    Aleksandra Nojković

  • načina putovanja, kao i pomoću socioekonomskih karakteristika pojedinaca u uzorku. Drugi zanimljiv primer predstavlja rad Lee (1978)22 u kome je ocenjivana verovatnoća da će zaposleni radnik biti član sindikata. Objašnjavajuće promenljive u modelu su pored razlike u zaradi radnika koji je član sindikata, u odnosu na radnika koji to nije, još i individualne karakteristike anketiranih radnika, kao i karakteristike grane industrije u kojoj je zaposlen. Veoma često se navedena metodologija koristi za proučavnje migracija. Jedan od primera nalazimo u radu Nakosteen i Zimmer (1980).23 Odluka pojedinca o preseljenju zavisi od razlike u nivou zarade u sadašnjem i novom mestu stanovanja, stanju na tržištu rada dve lokacije, troškova preseljenja, kao i od individualnih karakteristika pojedinca. Kao ilustracija često se navodi i rad Spector i Mazzeo (1980) u kome je analiziran efekat primene nove metode učenja na uspeh grupe od 32 studenata. Zavisna promenljiva uzima vrednost 1 ako je rezultat studenta na ispitu iz ekonomije poboljšan nakon primene nove metode učenja, dok u suprotnom uzima vrednost 0. Objašnjavajuće promenljive su pored postignute prosečne ocene, rezultat ranijeg testiranja (kao mera predznanja studenta) i binarna promenljiva koja tretira učešće studenata u novom načinu učenja.

    Ne postoji veliki broj istraživanja domaćih autora u kojima je primenjivana metodologija prilagođena binarnom izboru. Izdvajamo istraživanje Jovičić (1995) u kome je modelom binarnog izbora testiran uticaj ekonomskih faktora na verovatnoću rađanja dece u Srbiji. Na uzorku od 1500 porodica ocenjena je logit specifikacija modela i ustanovljen je značajan uticaj nekoliko ekonomskih faktora, od kojih su redovni mesečni prihodi porodice najznačajniji za donošenje odluke o rađanju.

    Veoma važna je i primena modela binarnog izbora za opisivanje pristrasnosti nastale prilikom izbora podataka u uzorak24, a koja je prisutna u velikom broju ekonometrijskih modela.25 Prilikom ocenjivanja ove grupe modela, javlja se

    22 Navedeno prema: Amemiya (1981). 23 Navedeno prema: Greene (1997): 819-820. 24 Sample selection bias 25 Ovi modeli pripadaju široj grupi modela u kojima je zavisna promenljiva sa ograničenjem

    (funkcija raspodele zavisne promenljive je odsečena ili cenzurisana). Detaljan pregled ovih modela: Maddala (1983), Amemiya (1985) i Greene (1997).

    Modeli diskretne zavisne promenljive: pregled metodologije i primenjenih istraživanja

    69

  • problem pristrasnosti ocenjenih parametara, koji se tretira kao problem izostavljanja relevantne objašnjavajuće promenljive i rešava postupkom ocenjivanja u dva stepena. Jedna od najčešće citiranih primena opisanog postupka izvesno jeste Heckmanovo istraživanje ponude ženske radne snage u SAD.26 Prvi stepen ovog postupka, podrazumeva ocenjivanje modela binarnog izbora o učešću u radnoj snazi. Ovo istraživanje je pokazalo da uzorak veličine 1735 ispitanika, na osnovu koga se ocenjuju zarade žena starih od 30 do 44 godine, nije slučajan i da je značajno određen prethodnom odlukom žene (self-selection) o učešću u radnoj snazi.

    U ekonometrijskim istraživanjima poslednjih godina sve intenzivnije se razmatra mogućnost primene ekonometrijskih metoda modela diskretne zavisne promenljive u analizi makroekonomskih vremenskih serija, odnosno podataka panela. Kako je poznato da je u najvećem broju makroekonomskih vremenskih serija prisutan jedinični koren, otvorilo se pitanje pogodnosti primene modela diskretne zavisne promenljive u slučaju nestacionarne prirode objašnjavajuće promenljive. U radu Park i Phillips (2000) izvedena je asimptotska teorija definisana za potrebe analize binarnog izbora u slučaju nestacionarnih regresora. Najvažniji rezultat izvedene teorije jeste otkriće fenomena dvostruke brzine konvergencije ocena nepoznatih parametara (stope konvergencije su 4/3n i 4/1n ), kao i dokaz o mešovitoj normalnoj graničnoj raspodeli dobijenih ocena. Poput razvoja modela binarnog izbora u mikroekonometrijskom kontekstu, prva proširenja teorije nestacionarnih modela binarnog izbora podrazumevala su, sa jedne strane, uključivanje većeg broja mogućih ishoda u model i, sa druge strane, mogućnost primene u analizi podataka panela.

    Identifikovanje faktora koji dovode do pokretanja inflatornih epizoda, predviđanje recesije, valutnih ili finansijskih kriza, te proučavanje pojave da se de facto i de jure režimi deviznog kursa u pojedinim zemljama razlikuju, samo su neki od makroekonomskih fenomena koje je pogodno analizirati primenom metodologije modela diskretne zavisne promenljive. Kao zanimljivu ilustraciju navodimo istraživanje Valckx, de Ceuster i Annaert (2002) u kome je ispitivan značaj promenljivog varijabiliteta (volatilnosti) finansijskog tržišta za 26 Heckman (1979). Po ugledu na Heckmanov model, ocenjena je ponuda ženske radne snage u

    Srbiji i Crnoj Gori u radu Nojković (2004).

    70

    Aleksandra Nojković

  • predviđanje privredne recesije u posmatranoj zemlji. Na mesečnim podacima vremenskih serija SAD, Nemačke i Japana ocenjivana je probit specifikacija modela. Rezultat ocenjivanja pokazao je da povećana volatilnost u kretanju kamatne stope, kao i rast volatilnosti na trištu hartija od vrednosti doprinose predviđanju pojave recesije u Nemačkoj i Japanu. Od empirijskih istraživanja sprovedenih na makroekonomskim podacima panela izdvajmo rad Boschen i Weise (2003). U radu su ocenjivane determinante pojave inflacije u razvijenim zemljama, članicama OECD. Analiza je pokazala da postoje četiri ključna faktora pomoću kojih se može objasniti pokretanje inflacije u ovoj grupi zemalja: visoka stopa rasta realnog BDP, rast inflacije u SAD, održavanje opštih izbora i manja otvorenost privrede ka međunardnoj trgovini. Nasuprot ovim faktorima, istraživanje je pokazalo da cena nafte na svetskom tržištu, fiksna politika deviznog kursa, promenljive koje mere fiskalnu politiku i politička orijentacija vlade nisu statistički značajni. Slično istraživanje sproveli su Domac i Yucel (2005) na uzorku zemalja u razvoju.

    3. Modeli višestrukog i modeli poređanog izbora

    Modeli višestrukog izbora su modeli u kojima kvalitativna zavisna promenljiva ima više od dva modaliteta. Izbor zanimanja, mesta stanovanja ili prevoznog sredstva, samo su neki od primera istraživanja u kojima se primenjuju ovi modeli. Ponašanje (donošenje odluke) prilikom izbora kada postoje više od dve alternative formalno se predstavlja slučajnom promenljivom y koja uzima vrednosti {0, 1, …, J}, gde je J pozitivan, ceo broj. Pri tome su vrednosti koje uzima slučajna promenljiva y arbitrarno određene odnosno alternative nisu poređane. Ako verovatnoću j–tog izbora (j = 0, 1, …, J) označimo sa Prob (Y = j), od značaja je da se odredi ova verovatnoća, ali, kao i u slučaju modela binarnog izbora, bitno je da se odgovori i na pitanje kako različiti posmatrani faktori utiču na tu verovatnoću. Takvo se ponašanje u praksi ispituje modelima višestrukog izbora nepoređanih alternativa koji se objašnjavaju pomoću modela slučajne korisnosti27.

    Pretpostavimo da se korisnost j-te alternative, izabrane između (J+1) mogućnosti, za i-tog pojedinca (potrošača, domaćinstvo ili preduzeće) može predstaviti kao:

    27 Random utility model

    Modeli diskretne zavisne promenljive: pregled metodologije i primenjenih istraživanja

    71

  • Uij = β’zij + εij (2.22)

    Ukoliko se pojedinac opredelio za j-tu alternativu, pretpostavljamo da Uij predstavlja maksimalnu korisnost u skupu od (J+1) mogućih alternativa odnosno formulišemo statistički model zasnovan na verovatnoći ostvarenja j-tog izbora:

    Prob (Uij > Uik) za svako k ≠ j. (2.23)

    U zavisnosti od pretpostavke o funkciji raspodele slučajne greške (εij) u praksi ispitujemo logit i probit modele višestrukog izbora. Kako ocenjivanje probit modela višestrukog izbora28 podrazumeva izračunavanje integrala (J+1) reda, u praksi je mnogo češće u upotrebi logit model višestrukog izbora29, koji je znatno jednostavniji za operacionalizaciju. U zavisnosti od različitih polaznih pretpostavki, razmatraju se različite specifikacije logit modela višestrukog izbora (najčešće uslovni logit model, obuhvatni logit model i model uopštenih ekstremnih vrednosti), kao i logit i probit modeli poređanog višestrukog izbora.

    Ukoliko pođemo od modela (2.22), najjednostavnije je da pretpostavimo logističku funkciju raspodele slučajne greške (εij). Dakle, ako ostvareni izbor između alternativa predstavimo slučajnom promenljivom Yi , onda se verovatnoće (J+1) izbora koje čini i-ti donosilac odluke sa vektorom karakteristika xi predstavljaju sledećim jednačinama:

    Prob (Yi = j) =

    =

    +J

    k

    x

    x

    ik

    ij

    e

    e

    1

    '1

    '

    β

    β

    , j = 1, 2, …, J.

    Prob (Yi = 0) =

    =

    +J

    k

    x ike1

    '1

    , (2.24)

    gde je uslov da se navedene verovatnoće sabiraju do jedan.

    28 Multinomial probit model, MNP 29 Multinomial logit model, MNL

    72

    Aleksandra Nojković

  • Navedeni model predstavlja logit model višestrukog izbora. Takođe, uočavamo da logit model binarnog izbora (2.7) predstavlja specijalan slučaj navedenog modela (J =1). Logit model višestrukog izbora se ocenjuje metodom maksimalne verodostojnosti, a iterativnim postupkom se maksimizira sledeća funkcija verodostojnosti:

    log L = )(Prlog1 1

    jYobd in

    i

    J

    jij =

    = =

    , (2.25)

    gde je: dij = 1 za Yi = j, odnosno dij = 0, u ostalim slučajevima.

    Uočavamo da za svakog i-tog pojedinca postoji samo jedna vrednost dij koja je jednaka 1 (situacija da je i-ti pojedinac izabrao j-tu alternativu), a ocena parametra β dobija se rešavanjem sledeće jednačine:

    [ ] ii

    ijijj

    xPdL −=∂

    ∂βln

    , za j = 0,1, ..., J. (2.26)

    Kako je jednakost (2.26) nelinearna funkcija parametara βk (Pij je nelinearana funkcija vektora nepoznatih parametara β) funkcija se maksimizira poznatim iterativnim postupcima. Osim Newtonovog metoda optimizacije preporučuje se i primena BHHH algoritma. Matrica drugih izvoda funkcije verodostojnosti (2.25) ima (J2K x K) blokova i definisana je kao:

    [ ] ')('

    ln2iiil

    n

    iij

    lj

    xxPljPL −=−=∂∂

    ∂=

    1ββ, (2.27)

    gde je 1 (j = l) jednako 1 za j = l, a 0 u suprotnom slučaju. Hesijan ne sadrži dij, odnosno za logit model višestrukog izbora Newtonov metod je ekvivalentan metodu pogađanja. Jednostavno se pokazuje da je matrica drugih izvoda negativno definitna odnosno funkcija verodostojnosti je globalno konkavna (McFadden (1974)), a pogodno je i to što Newtonov postupak konvergira maksimumu u svega nekoliko koraka. Pri tome, važno je uočiti da se broj parametara logit modela višestrukog izbora značajno uvećava sa povećanjem broja alternativa.

    Modeli diskretne zavisne promenljive: pregled metodologije i primenjenih istraživanja

    73

  • Ocenjeni parametri nemaju direktnu interpretaciju, a tek se postupkom diferenciranja izraza (2.24) dolazi do odgovarajućeg izraza za marginalni efekat promene karakteristika posmatranog i-tog pojedinca na verovatnoću j-tog ishoda:

    )()(0

    _

    =

    −=−=∂∂=

    J

    kj

    jkkjji

    jj PPP

    xP ββββδ . (2.28)

    Pri tome, svaki podvektor vektora β utiče na veličinu marginalnog efekta svake od egzogenih promenljivih i to kako kroz vrednost verovatnoće Pj, tako i kroz vrednost ponderisanog proseka koji figuriše u navedenom izrazu. Dodatni problem u interpretaciji rezultata posledica je činjenice da se računanjem marginalnog efekta za određeno xk (∂Pj / ∂xk) ne mora dobiti znak koji odgovara znaku koeficijenta βjk.

    Znatno jednostavnija interpretacija za βj, dobija se rešavanjem modela (2.24) po βj’xi:

    ln ij xPPi

    ij '0

    β= , (2.29)

    gde je zavisna promenljiva predstavljena kao logaritam količnika verovatnoće j-tog izbora. Normalizacijom po verovatnoći k-tog izbora dolazimo do uopštenog izraza za logaritam količnika verovatnoća bilo koja dva izbora j i k:

    ).('ln kjiik

    ij xPP

    ββ −= (2.30)

    Naročito je važno napomenuti da odnos verovatnoća Pj / Pk ne zavisi od preostalih izbora (ishoda, alternativa), što je posledica pretpostavke o nezavisnosti slučajnih grešaka polaznog modela, o čemu će biti više reći u nastavku ovog poglavlja.

    Slično modelima binarnog izbora, ne postoji saglasnost oko jedinstvenog pokazatelja kvaliteta logit modela višestrukog izbora. Najčešće se navodi

    74

    Aleksandra Nojković

  • logaritam funkcije verodostojnosti modela, indeks količnika verodostojnosti (LRI), kao i procenat tačnih predviđanja modela (gde se pod tačnim predviđanjem podrazumevaju slučajevi za koje je Yi = j, ako je ocenjena

    verovatnoća ∧

    jP najveća).

    Logit model višestrukog izbora je odgovarajući u slučaju da specifičnosti različitih alternativa ne predstavljaju predmet interesovanja, ili da podaci o tome nisu raspoloživi. Na primer, ovim modelom se predstavlja izbor zanimanja kada ne znamo rezultate koje bi i-ti pojedinac ostvario pri izboru svakog od (J+1) potencijalnih zanimanja. Za razliku od logit modela višestrukog izbora, koji pretpostavlja da verovatnoća izbora zavisi samo od karakteristika pojedinaca koji donose odluku, McFadden (1974) predlaže model u kome na verovatnoću izbora delimično utiču i opaženi atributi različitih alternativa. Model koji je u literaturi poznat kao McFaddenov logit model ili uslovni logit model (conditional logit model) izvodi se iz modela slučajne korisnosti (2.22), uz pretpostavku o nezavisnosti (J+1) slučajnih grešaka, koje imaju Weibullovu funkciju raspodele:

    F (εij) = exp (-e- εij), (2.31)

    pa se verovatnoća j-tog izbora može predstaviti kao:

    Prob (Yi = j) =

    =

    J

    jij

    z

    ijz

    e

    e

    1

    '

    '

    β

    β

    . (2.32)

    Korisnost je funkcija vektora egzogenih promenljivih (zij) i zavisi kako od karakteristika pojedinaca, tako i od karakteristika samog izbora. Ukoliko ove različite komponente razdvojimo, odnosno pretpostavimo da je zij = (xij, wi), gde se wi odnosi na karakteristike pojedinca, koje ne variraju za različite alternative (na primer, godine starosti, pol ili mesto stanovanja), dok xij varira u zavisnosti od opaženih karakteristika različitih alternativa, koje su delimično različite i za svakog pojedinca (komponente vektora xij se nazivaju atributi alternative, odnosno atributi različitih izbora), zamenom u model (2.32) dobijamo sledeću funkciju verovatnoće j-tog izbora:

    Modeli diskretne zavisne promenljive: pregled metodologije i primenjenih istraživanja

    75

  • Prob (Yi = j) =

    ==

    +

    +

    = J

    j

    wijx

    wxij

    J

    j

    wxij

    wxij

    i

    i

    i

    i

    ee

    ee

    e

    e

    1

    ''

    ''

    1

    ''

    ''

    αβ

    αβ

    αβ

    αβ

    . (2.33)

    Članovi koji ne variraju za različite alternative, dakle oni koji se odnose na karakteristike specifične za pojedince, ne utiču na verovatnoću izbora. Uslovni logit model se najjednostavnije ocenjuje primenom Newtonovog iterativnog postupka, a funkcija verodostojnosti je ista kao u slučaju logit modela višestrukog izbora (2.25). Pri tome, prvi i drugi izvodi logaritma funkcije verodostojnosti su:

    ),(loglog _

    1 1iij

    n

    i

    J

    jij xxd

    L −=∂∂

    = =β

    i

    ,)')(('

    log __

    1 1

    2

    iijiij

    n

    i

    J

    jij xxxxP

    L −−=∂∂

    ∂= =ββ

    (2.34)

    gde je : .1

    _

    ij

    J

    jiji xPx

    =

    =

    Slično logit modelu višestrukog izbora, Newtonov metod je ekvivalentan metodu pogađanja, a postupak optimizacije obično konvergira u svega nekoliko koraka. Za uslovni logit model navode se uobičajeni pokazatelji kvaliteta: procenat tačnih predviđanja i indeks količnika verodostojnosti.

    Važno je napomenuti, da i pored činjenice da su logit modeli višestrukog izbora bili već neko vreme primenjivani u ekonometrijskim istraživanjima, pojava McFaddenovog modela predstavljala je značajan napredak. Veliku primenu ovaj model duguje kako zasnovanosti na ekonomskoj teoriji, tako i jednostavnosti izračunavanja. Pri tome, za McFaddenov uslovni logit model važi da odnos verovatnoća ma koje dve alternative j i k (Pj / Pk) zavisi samo od atributa tih

    76

    Aleksandra Nojković

  • alternativa odnosno ne zavisi od uvođenja novih alternativa u model, kao ni od promena karakteristika neke od postojećih alternativa. Ova osobina logit modela posledica je restriktivne pretpostavke o slučajnom članu funkcije korisnosti (pretpostavlja se da su greške modela nezavisne i homoskedastične) i naziva se nezavisnost od irelevantnih alternativa).30 Navedeno ograničenje modela definiše se sledećom jednakošću:

    ).('''

    )()(

    ln kjk

    j

    kk

    jj xxxx

    xPxP

    −== βββ

    (2.35)

    Kako je sam McFadden pokazao, ova pretpostavka ne važi u slučaju sličnih alternativa. Kako je uslov nezavisnosti od irelevantnih alternativa posledica polazne pretpostavke o nezavisnosti i homoskedastičnosti slučajnih grešaka, sam McFadden je definisao neke od testova za ispitivanje validnosti navedene pretpostavke. Najznačajnija je procedura koju je razvio sa Hausmanom31, a koja se zasniva na poređenju ocena dobijenih na osnovu podskupa posmatranih alternativa i ocena dobijenih na celom skupu alternativa.

    Dalje unapređenje uslovnog logit modela kretalo se u pravcu uvođenja manje restriktivnih polaznih pretpostavki o slučajnoj greški modela. Jedan od načina jeste ocenjivanje probit modela višestrukog izbora,32 koje se izvodi polazeći od modela slučajne korisnosti (2.22): Uj = β΄xj + εj (j =0, 1, …, J), gde se pretpostavlja da slučajne greške (εj) imaju višedimenzionu normalnu funkciju raspodele. Probit model višestrukog izbora je teorijski vrlo inspirativan, ali kako smo već napomenuli, postupak ocenjivanja podrazumeva izračunavanje integrala reda (J+1), dakle metod maksimalne verodostojnosti je praktično nemoguće primeniti u modelima sa više od pet mogućih alternativa.

    Drugi način da pretpostavka o homoskedastičnosti slučajne greške uslovnog logit modela postane manje restriktivna jeste da se u model uvede hijerarhijska struktura, odnosno podela alternativa u podskupove (grupe). Model koji dozvoljava prisustvo heteroskedastičnosti (nejednake varijanse) među različitim 30 Independence from irrelevant alternatives, IIA 31 Hausman i McFadden (1984) 32 U skladu sa prethodnim, ispravnije bi bilo ovaj model nazvati uslovni probit model

    (conditional probit model), kao što su to učinili Hausman i Wise (1978).

    Modeli diskretne zavisne promenljive: pregled metodologije i primenjenih istraživanja

    77

  • grupama, dok se zadržava pretpostavka o nezavisnosti od irelevantnih alternativa u okviru svake grupe, naziva se obuhvatni logit model33. Osnovni problem obuhvatnog logit modela jeste sama specifikacija hijerarhijske strukture modela odnosno svrstavanje postojećih alternativa u odgovarajuće grane (ili grupe). Ukoliko ova podela ne proističe iz same prirode problema, za to ne postoje precizni testovi, a različita specifikacija modela dovodi do različitih rezultata ocenjivanja. Iz tog razloga, McFadden (1978, 1981)34 formuliše model uopštenih ekstremnih vrednosti35, koji predstavlja uopštenje polaznog uslovnog logit modela, tako da se može primeniti i u slučaju postojanja sličnih alternativa.

    Neke od najčešćih primena logit modela višestrukog izbora jesu analiza izbora prevoznog sredstva ljudi koji u gradskim sredinama putuju na posao. Hensher (1986)36 je sproveo istraživanje na uzorku od 1455 stanovnika Sidneja koji svakodnevno putuju na posao. Modelom je obuhvaćen izbor između četiri alternative (putovanje na posao automobilom – kao vozač ili putnik, putovanje vozom ili autobusom). Objašnjavajuće promenljive su, između ostalog, vreme koje ispitanik provede u putu, troškovi putovanja, vreme čekanja gradskog prevoza, vreme potrebno za pešačenje do stanice autobusa ili voza, te troškovi parkinga. Iz ove grupe istraživanja često se navodi i rad McFadden-a (1974) u kome je prvo ocenjen model binarnog izbora (putovanje autobusom ili automobilom), zatim je u model uvedena i treća alternativa (naknadno je u rad pušten i javni železnički saobraćaj u zalivu San Franciska, gde je i obavljeno istraživanje). Na osnovu oba ocenjena modela predviđena je tražnja za prevoznim sredstvima po izboru anketiranih pojedinaca i poređeni su rezultati dobijeni pre i posle uvođenja nove alternative u model.

    Logit model višestrukog izbora nalazi veliku primenu i u analizi izbora zanimanja. Iz ove grupe istraživanja izdvajamo radove Schmidta i Straussa (1975a, 1975b).37 Analiza je sprovedena na bazi 1000 opservacija prikupljenih u tri referentne godine (1960, 1967, 1970). Svaki od anketiranih pojedinaca odgovarao je na pitanja o izboru zanimanja (ponuđeno je pet mogućih grupa

    33 Nested multinominal logit; NMNL 34 Navedeno prema: Maddala (1983), st. 70-73. 35 Generalized extreme value model-GEV 36 Navedeno prema: Greene (1997), st. 862-863. 37 Navedeno prema: Greene (1997), st. 859-861.

    78

    Aleksandra Nojković

  • zanimanja, u rasponu od nekvalifikovanog radnika do profesionalca), a objašnjavajuće promenljive u modelu su nivo obrazovanja, godine radnog iskustva, pol i pripadnost određenoj rasi. Interesantna je i primena logit modela višestrukog izbora u istraživanju izbora načina plaćanja (u citiranom istraživanju to su gotovina ili tri različite vrste čekova) sprovedena na uzorku od 1000 holandskih domaćinstava i ukupno 2161 izvršenih plaćanja, čiji su autori Mot and Cramer (1992).

    Za modeliranje ponašanja prilikom izbora između više poređanih alternativa primenjuju se logit i probit modeli poređanog izbora38. Ocena kreditne sposobnosti, izbor različitih nivoa osiguranja ili istraživanje zaposlenosti (pojedinac može biti nezaposlen, zaposlen sa nepunim, ili sa punim radnim vremenom) predstavlju samo neke od istraživanja u kojima se primenjuju ovi modeli.

    Izbor između većeg broja poređanih alternativa predstavljmo na poznat način, dakle slučajnom promenljivom y koja uzima vrednosti {0, 1, …, J}, gde je J pozitivan, ceo broj. Pri tome, vrednosti koje uzima slučajna promenljiva y nisu arbitrarno određene odnosno alternative su poređane prema redosledu. Važno je napomenuti da ukoliko rangiramo, na primer, kreditnu sposobnost na skali od 0 do 6, dodeljeni rang ima ordinalni karakter, odnosno razlika između ranga 2 i 3 ne mora biti istog značaja kao razlika između ranga 4 i 3.

    U specifikaciji modela poređanog višestrukog izbora polazimo od regresionog modela latentne zavisne promenljive yi*:

    yi* = β΄xi + εi. (2.36)

    Pri tome, latentna promenljiva yi* se ne opaža, ali ono što se u praksi opaža jeste promenljiva yi koja se definiše na sledeći način:

    yi = 0 ako ]( 1,µ∞−∈∗iy

    = 1 ako ]( 21, µµ∈∗iy

    38 Ordered logit i ordered probit models

    Modeli diskretne zavisne promenljive: pregled metodologije i primenjenih istraživanja

    79

  • = J-1 ako ]( JJiy µµ ,1−∗ ∈

    = J ako [ )∞+∈∗ ,Jiy µ (2.37) gde su μ1, μ2 ,… μJ nepoznati parametri, koji se nazivaju tačke odsecanja, ili parametri praga.39 Nepoznati parametri μj (j = 1, 2,…, J) se ocenjuju zajedno sa vektorom β. Pri tome, jednostavno se pokazuje da se verovatnoće mogućih ishoda sabiraju do jedinice, a uslov da je μ1 < … < μJ-1 < μJ obezbeđuje da je Prob (y = j ) > 0, za j =0, 1,…, J. Postupak ocenjivanja podrazumeva primenu poznatih metoda optimizacije, a u zavisnosti od pretpostavke o raspodeli slučajne greške εi, razlikujemo probit i logit model poređanih ishoda. Radi ilustracije do sada navedenog, na sledećoj slici predstavljamo izgled funkcije gustine probit modela poređanih alternativa za slučaj J = 4.

    Slika 3. Funkcija gustine probit modela poređanih alternativa

    Za ove modele takođe važi da koeficijenti ∧β nemaju direktnu interpretaciju.

    Specifičnost izračunatih marginalnih efekata ovih modela jeste poznati uticaj promene xk na verovatnoće krajnjih ishoda odnosno na Prob (y = 0) i Prob (y = J), ali i da to ne važi za verovatnoće ishoda j = 1, 2, …, J-1 (ishodi rangirani

    39 Cut points; threshold parametars.

    80

    Aleksandra Nojković

  • između dva krajnja ishoda). Pri tome, verovarnoća Prob(y=0) se menja u smeru

    suprotnom znaku koeficijenta k∧β , dok se verovatnoća Prob(y=J) menja u smeru

    koji odgovara znaku koeficijenta k∧β . U modelima poređanih izbora, kao

    pokazatelj kvaliteta modela najčešće se navodi ukupan procenat tačnih prognoza, ali i procenat tačnih prognoza za svaki od ishoda posebno. Slično logit modelu višestrukog izbora, predviđanje za y u ovim modelima je ishod sa najvećom ocenjenom verovatnoćom.

    Pored pomenutih primena koje se odnose na ekonomsko ponašanje pojedinaca ili preduzeća, modeli poređanog izbora nalaze primenu i u makroekonometrijskim istraživanjima novijeg datuma. U radovima Hua i Phillipsa (2004a, 2004b) modelirane su odluke centralnih banaka SAD i Kanade o promeni instrumenata monetarne politike donete na osnovu analize kretanja nekih od osnovnih makroekonomskih pokazatelja. Odluka o smanjenju, zadržavanju na istom nivou, ili povećanju posmatranog instrumenta monetarne politike (npr. kamatne stope ili uskih monetarnih agregata, kao što je M0), uvedena je u model kao zavisna promenljiva sa tri moguća ishoda (uzima vrednosti -1, 0 ili +1). Pri tome, postoje bar dva razloga koji modele nestacionarnog diskretnog izbora čine pogodnim za opisivanje ovako vođene monetarne politike. Prvo, instrumenti monetarne politike prilagođavju se na diskretan način, obično za celobrojni umnožak četvrtine procentnog poena (najčešće su promene za 0,25; 0,5; 0,75 ili 1 procentni poen), a odluka o eventualnoj promeni nivoa donosi se na unapred zakazanim sastancima odbora centralne banke. Pri tome, ne očekuje se da će centralna banka intervenisati uvek kada stvarni nivo targeta (za veliki broj centralnih banaka to je ciljana inflacija, ali to mogu biti i razvojni ciljevi ili devizni kurs) odstupi od optimalnog nivoa. Umesto toga, centralna banka interveniše samo kad odstupanje odnosno razlika između dve vrednosti premaši određeni prag. Model poređanog izbora omogućava da se istovremeno sa pronalaženjem osnovnih faktora koji determinišu odluku centralne banke, empirijski utvrde i parametri praga odnosno odstupanje preko koga centralna banka interveniše. Drugi razlog jeste činjenica da su mnogi od relevantnih makroekonomskih pokazatelja koji utiču na odluke monetarnih vlasti, poput stope inflaciji ili nezaposlenosti, nestacionarne vremenske serije.

    Modeli diskretne zavisne promenljive: pregled metodologije i primenjenih istraživanja

    81

  • Pored navedenog, modeli poređanog izbora primenjivani su i u analizi izbora politike deviznog kursa. Zavisna promenljiva u ovakvoj specifikaciji uzima više poređanih vrednosti. U zavisnosti od klasifikacije režima deviznih kurseva, broj kategorija je obično 3 ili 4, ali u detaljnijim podelama može biti i do 13, pri čemu su kategorije raspoređene u rasponu od politike zvaničnog prihvatanje valute druge zemlje do politike slobodno plivajućeg režima deviznog kursa. Iz ove grupe istraživanja navodimo analizu politike deviznih kurseva sprovedenu na kvartalnim podacima panela za 50 zemalja u razvoju u periodu od 1975. do 2000. godine, koja je sprovedena u radu Jina (2004). Slično istraživanje o izboru režima deviznog kursa sprovedeno na uzorku od 25 zemalja u tranziciji nalazimo u radu Markiewicza (2006). Navodimo i veoma interesantan primer istraživanja uspešnosti reformi za okončanje hiperinflatornih epizoda u dosadašnjoj ekonomskoj istoriji. Autori Bernholz i Kugler (2006) su metodologiju probit modela poređanog izbora primenili u analizi uspešnosti mera preduzetih sa ciljem zaustavljanja više od 30 hiperinflacija u svetu. U ovoj analizi uspeh reformi nije meren stopom inflacije u posthiperinflatornom periodu, jer bi se u tom slučaju vrednosti zavisne promenljive zadržale na veoma visokom nivou u onim zemljama gde reforme nisu imale uspeha, i te nestandardne opservacije bi značajno uticale na rezultat ocenjivanja. Iz tog razloga zavisna promenljiva nije neprekidna (numerička) promenljiva, već se u model uvodi kao kvalitativna promenljiva koja uzima tri modaliteta (reforma je u posmatranoj zemlji bila uspešna, delimično uspešna ili nije dala rezultate). Rezultat analize potvrdio je da na uspešnost sprovedenih reformi značajno utiče samo veštačka promenljiva koja meri efekat uvođenje nezavisnosti centralne banke.

    4. Modeli brojivih podataka

    Modeli brojivih podataka su modeli u kojima zavisna promenljiva ili promenljiva odgovora (y) uzima cele, nenegativne vrednosti. Ovi modeli se često koriste u praktičnim istraživanjima, a primeri brojivih podataka zavisne promenljive su: broj dece rođene u određenom intervalu godina starosti majke (promenljiva relevantna za studije fertiliteta), broj poseta lekaru, ili prijavljeni patenti od strane preduzeća u određenom intervalu vremena, i slično. Pri tome, slučajna promenljiva y najčešće uzima svega nekoliko vrednosti (na primer, 0, 1 i 2), ima raspodelu asimetričnu u levo, a u modelu je prisutna

    82

    Aleksandra Nojković

  • heteroskedastičnost (varijansa slučajne greške raste uporedo sa rastom aritmetičke sredine promenljive y).

    Modeliranje brojivih podataka se zasniva na specifičnoj metodologiji, koja se u osnovi svodi na dva osnovna pristupa. Prvi predstavlja parametarsko ocenjivanje, kada se pretpostavlja određena funkcija raspodele zavisne promenljive, uz ograničenje da y uzima cele, nenegativne vrednosti. U navedenom pristupu najveću praktičnu primenu ima Poissonov regresioni model, kao i altenative ovog modela koje dozvoljavaju manje restriktivne polazne pretpostavke. Drugi pristup je poluparametarsko ocenjivanje, gde se pretpostavlja nenegativnost uslovne očekivane vrednosti, kao i da je uslovna varijansa funkcija uslovne očekivane vrednosti.

    U proučavanju brojivih podataka najčešće se koristi Poissonov regresioni model, koji pretpostavlja da svako yi predstavlja jedno izvlačenje iz Poissonove raspodele sa parametrom λi :

    Prob (Yi = yi) = ,!i

    yi

    ye iiλλ−

    yi = 0, 1, 2, … (2.38)

    pri čemu su prva dva momenta ove raspodele:

    E (yi) = λi i var (yi) = λi (2.39)

    Najčećešće se koristi logaritamsko-linearni (log-lin) model za λi :

    ln λi = β΄xi , (2.40)

    gde je xi vektor egzogenih promenljivih. Očekivani broj pozitivnih odgovora (realizacija događaja) može se predstaviti kao:

    E [yi | xi] = var [yi |xi]= λi

    = eβ΄xi, (2.41)

    Modeli diskretne zavisne promenljive: pregled metodologije i primenjenih istraživanja

    83

  • na osnovu čega zaključujemo da je u Poissonovom regresionom modelu prisutna heteroskedastičnost. Kako je u pitanju nelinearna regresija, parametri se ocenjuju metodom maksimalne verodostojnosti. Funkcija verodostojnosti je globalno konkavna (odnosno Hesijan je negativno definitna matrica za svako β i x), a maksimiziranje se postiže u svega nekoliko koraka, primenom Newtonovog

    metoda. Ocene maksimalne verodostojnosti ∧β poseduju osobine

    konsistentnosti i asimptotske normalnosti40, a ocena asimptotske kovarijantne matrice se definiše sa:

    ∧V = A

    ∧var [

    ∧β ] = .

    1

    1'

    =

    ∧n

    iiii xxλ (2.42)

    Na osnovu ocenjenog modela moguće je predvideti ishod za svaku i-tu opservaciju kao:

    )'exp( xi∧∧

    = βλ , (2.43)

    pri čemu se ocena varijanse predviđanja izračunava kao: iii xVx∧∧'2λ , gde je

    ∧V ocena iz izraza (2.42). Marginalni efekat (efekat jedinične promene x) na očekivanu vrednost y se izračunava kao:

    ( ) βλiiii xxyE =∂∂ . (2.44)

    Dakle, veličina relativne promene u verovatnoći događaja zavisi od

    =∧∧

    ii x'exp βλ i nije ista za sve opservacije u uzorku. Na primer, ako je

    ocena parametra ∧

    Kβ = 0.25, a exp( )' ix∧β = 3, tada jedinična promena u

    vrednosti k-tog regresora povećava očekivanu vrednost zavisne promenljive y za

    40 Videti dokaz: Wooldridge (2002), str. 648-653.

    84

    Aleksandra Nojković

  • 0.75 jedinica. Iz tog razloga je od interesa oceniti „prosečan odgovor“,41 koji je definisan sa:

    [ ]=

    ∧∧

    =

    =∂

    ∂ n

    ii

    n

    i i

    ii

    nx

    xxyE

    n 111/1 λβ , (2.45)

    odnosno za Poissonov regresioni modela sa slobodnim članom izraz (2.45)

    postaje x∧β .

    Kako Poissonov regresioni model ima nelinearnu funkciju uslovnog očekivanja i heteroskedastične slučajne greške, izračunata vrednost koeficijenta determinacije nema “direktnu” interpretaciju i ne može se koristiti kao pokazatelj kvaliteta modela. U cilju vrednovanja kvaliteta ovog modela predloženi su brojni specifični pokazatelji poput sume pojedinačnih odstupanja i-te opservacije (jednake nuli za slučaj perfektnog predviđanja modela)42, ali i pokazatelji uobičajeni za model diskretnog izbora, kao što je indeks količnika verodostojnosti (LRI).

    Jedan od problema koji se javlja pri modeliranju brojivih podataka Poissonovom regresijom jeste to što je raspodela u potpunosti određena jednim parametrom (λi) odnosno odgovarajući momenti raspodele slučajne promenljive yi su funkcije od λi. Navedeno ograničenje se najčešće manifestuje u manjem broju nula koje model predviđa u odnosu na opservacije u uzorku, a ovaj problem je poznat kao „višak nula“43 u analiziranim podacima. Drugi problem je poznat kao problem „veće disperzije“44 i odnosi se na pojavu da je za brojive podatke vrednost varijanse zavisne promenljive obično veća od vrednosti aritmetičke sredine. Nasuprot tome, Poissonov model pretpostavlja jednakost varijanse i aritmetičke sredine (2.39) odnosno nameće „jednaku disperziju“45 podataka.

    41 Average response 42 Videti detaljnije u Greene (1997). 43 Excess zeros 44 Overdispersion 45 Equidispersion

    Modeli diskretne zavisne promenljive: pregled metodologije i primenjenih istraživanja

    85

  • Posledice „veće disperzije“ veoma su slične posledicama prisustva heteroskedastičnosti u linearnom regresionom modelu. Naime, u uslovima važenja jednakosti (2.41) ocene Poissonovog modela dobijene metodom maksimalne verodostojnosti zadržavaju osobinu konsistentnosti, ali je testiranje prisustva „prekomerne disperzije“ u modelu ipak neophodno iz dva razloga. Prvo, u složenijim modelima brojivih podataka, kada je opravdano primeniti odsečeni ili cenzurisani regresioni model, javlja se problem nekonsistentnosti dobijenih ocena. Drugo, standardne greške ocenjene metodom maksimalne verodostojnosti u prisustvu “veće disperzije” su znatno potcenjene, pa smo skloni da prihvatamo kao statistički značajne i parametre koji to, u stvari, nisu. Iz tih razloga predložen je veliki broj testova za otkrivanje problema „veće disperzije“ u Poissonovom regresionom modelu.

    U cilju otklanjanja restriktivne pretpostavke o jednakosti uslovne očekivane vrednosti i uslovne varijanse, kao alternativa Poissonovom modelu, predložen je veliki broj manje restriktivnih modela brojivih podataka. U praksi se najčešće primenjuje negativan binomni model, koji nastaje uključivanjem neopažene heterogenosti uporednih podataka u model. U izraz za uslovno očekivanje, na sledeći način se uvode neopaženi individualni efekti:

    log μi = β΄xi + εi

    = log λi + log ui, (2.46)

    gde slučajnom greškom εi mogu biti obuhvaćene promenljive koje nisu eksplicitno uključene u model (kao u slučaju klasičnog regresionog pristupa), ali i heterogenost koja je česta karakteristika mikroekonomskih podataka. Ukoliko pretpostavimo da ui=(exp(εi)) ima gama raspodelu sa parametrima E (exp(εi )) = 1 i var (ui) = θ, tada je marginalna funkcija gustine od yi definisana kao:

    f (yi | xi) = ,)1()()1(

    )( θθ

    θi

    yi

    i

    i rry

    y i −Γ+Γ

    +Γ (2.47)

    gde je ri = .θλ

    λ+ii

    .

    86

    Aleksandra Nojković

  • Navedeni izraz predstavlja jedan od oblika negativne binomne raspodele. Specijalne slučajeve negativne binomne raspodele predstavljaju Poissonova raspodela (za θ = 0) odnosno geometrijska raspodela (za θ = 1). Uslovna sredina i varijansa negativne binomne raspodele definisana izrazom (2.47) su:

    E (yi | xi) = λi i var (yi | xi) = λi (1 + (1/ θ)λi), (2.48)

    na osnovu čega zaključujemo da je varijansa veća od aritmetičke sredine (λi > 0 i θ> 0), pri čemu je uslovna varijansa kvadratna funkcija parametra λi. Navedeni model, koji su predložili Cameron i Triverdi (1998) 46, u literaturi je poznat kao negativni binomni model 2 (Negbin II). U praksi se koristi i varijanta negativnog binomnog modela u kome je varijansa linearna funkcija parametra λi [var (yi | xi) = λi (1 + δ)], što se postiže uvođenjem sledeće smene: θ = iλδ u izraz (2.47), a koja je poznata kao negativni binomni model 1 (Negbin I).

    Problem postojanja većeg broja nula u opservacijama u odnosu na predviđanje u Poissonovom modelu otklonjen je specifikacijom modela koju je predložio Mullahey (1986)47, a koja je poznata kao model prepona, ili dvodelni model.48 Navedenom modifikacijom omogućeno je da različiti procesi generišu ishod nulu i preostale (pozitivne) ishode u modelu. Na primer, prva poseta pacijenta lekaru može biti samoinicijativna, dok naredene mogu biti determinisane nešto dugačijim mehanizmom. Za objašnjenje takvih situacija predložen je sledeći model:

    Prob [yi = 0] = e-θ

    Prob [yi = j] = ,)1(!

    )1(i

    i

    ejee ji

    λ

    λθ λ−

    −−

    j = 1, 2, .... (2.49)

    gde binarni model verovatnoće determiniše pojavu ishoda nula ili jedan, dok su ostali pozitivni ishodi determinisani odsečenom Poissonovom raspodelom. Takođe, u praksi se često koristi i negativna binomna verzija modela prepona.

    46 Navedeno prema: Green (1997), str. 887. 47 Navedeno prema: Greern (1997), str. 889-891. 48 Hurdle model; two-part model

    Modeli diskretne zavisne promenljive: pregled metodologije i primenjenih istraživanja

    87

  • Na ovaj način povećana je verovatnoća pojavljivanja ishoda nula (postoje dva procesa koji mogu generisati ishod nula) i obezbeđeno je da zbir verovatnoća bude jednak jedinici. Model se ocenjuje metodom maksimalne verodostojnosti, pri čemu se odvojeno maksimiziraju funkcije verodostojnosti koje odgovaraju ishodu nula ili jedan i ostalim pozitivnim ishodima.

    Za potrebe analize modela brojivih podataka predložene su i različite varijante ocenjivanja ovih modela metodom pseudomaksimalne verodostojnosti49, koja podrazumeva ocenjivanje metodom maksimalne verodostojnosti, pod pretpostavkom nulte hipoteze koja ostavlja mogućnost da je pripadna funkcija gustine pogrešno specifikovana. Pokazano je da je u slučaju Poissonovog regresionog modela ovaj metod ekvivalentan standardnom metodu maksimalne verodostojnosti. Poluparametarsko ocenjivanje modela brojivih podataka podrazumeva maksimiziranje logaritma funkcije verodostojnosti, pod pretpostavkom da uslovno očekivanje ili uslovna varijansa nisu u potpunosti specifikovani. U novijoj literaturi razmatrani su i brojni modeli višedimenzionalnih brojivih podataka, kao i modeli vremenskih serija u kojima zavisna promenljiva uzima brojive vrednosti. U prvoj grupi modela najčešće je razmatran bivarijantni Poissonov model, dok za podatke vremenskih serija ne postoji saglasnost oko najbolje specifikacije. Za brojive podatke vremenskih serija predloženo je više specifikacija, kojima je zajedničko prethodno ispitivanje prisustva autokorelacije.

    Prostor za primenu modela brojivih podataka nađen je u velikom broju istraživanja. Navodimo rad Winkelmanna (2002), koji je razičite specifikacije modela brojivih podataka (od standardnog Poissonovog modela do specifičnog modela prepona) ocenio sa ciljem evalucije reforme zdravstvenog sistema, koja je u Nemačkoj sprovedena 1997. godine. Korišćeni su podaci panela (German Socio-Economic Panel) o ispitanicima od 10 do 60 godina starosti, u periodu 1995-1999. godine. Analiza je sprovedena na približno 33000 opservacija, a rezultat je potvrdio značajno smanjenje broja poseta lekarima nakon sprovedene reforme u zdravstvu. Kao interesantan primer primene ovih modela navodimo i istraživanje Greenea (1998) u kome je specifikacija modela brojivih podataka primenjena u ocenjivanju kreditne sposobnosti klijenata, koje sprovode banke pre odobravanja novih zajmova. Zavisna promenljiva je kašnjenje duže od 49 Quasi-maximum likelihood method; QML

    88

    Aleksandra Nojković

  • šezdeset dana u plaćanju duga na kreditnoj kartici u prvoj godini nakon aktiviranja. Kako je broj kašnjenja za najveći broj vlasnika kartice nula, a najčešće se kreće od 3 do 4 (u analiziranom uzorku najveći broj prekoračenja je 14), nameće se potreba za primenom modela brojivih podataka. Istraživanje je sprovedeno na poduzorku od 1319 ispitanika, a primenjujući alternativno različite varijante Poissonovog modela ocenjivana je verovatnoća da vlasnik kreditne kartice neće na vreme izmirivati svoje obaveze.

    5. Zaključci

    U radu je dat pregled ekonometrijskih metoda modela čije su zavisne promenljive diskretne. Reč je o modelima u kojima zavisna promenljiva opisuje izbor između dve ili više alternativa, odnosno o modelima u kojima zavisna promenljiva uzima cele, nenegativne vrednosti. Predstavljene su osnove od kojih polazi svako teorijsko istraživanje ovih modela, a za svaku od razmatranih grupa modela navedeni su ilustrativni primeri istraživanja zasnovanih na primeni predloženog metodološkog okvira. Izbor analiziranih ekonomskih problema učinjen je tako da obuhvati različite oblasti istraživanja ponašanja pojedinaca, domaćinstava ili preduzeća, ali i da ukaže na mogućnosti primene različitih modela diskretne zavisne promenljive u analizi makroekonomskih podataka.

    Modeli diskretne zavisne promenljive: pregled metodologije i primenjenih istraživanja

    89

  • 90

    Aleksandra Nojković

    lItErAtUrA

    Amemiya, T. (1981), “Qualitative Response Models: A Survey.” Journal of Economic Literature 19 , pp.1483-1536.

    Amemiya, T. (1985), Advanced Econometrics, Basil Blackwell, Oxford.

    Bernholz, P. and Kugler, P. (2006), “The Success of Currency Reforms to End Great Inflations: An Empirical Analysis of 34 High Inflations.”, WWZ Working Paper, University of Basel.

    Boschen, J. and Weise, C. (2003), “What starts inflation: Evidence from the OECD Countries.” Journal of Money, Credit and Banking, 35 (June), pp.323-349.

    Cosslett, S. R. (1983) “Distribution-free maximum likelihood estimator of binary choice model.” Econometrica 51, pp.765-782.

    Cramer, J.S. (2003), Logit models from economics and other fields, Cambridge University Press, Cambridge.

    Domac, I. and Yucel, E. M. (2005), “What Triggers Inflation in Emerging Market Economies?” Review of World Economies 2005, Vol. 141 (1), World Bank, Washington, D. C.

    Domencich, T. A. and McFadden, D. (1975), Urban Travel Demand: A Behavioral Analysis, North Holland, Amsterdam.

    Green, W. H. (1997), Econometric Analyses, Prentice-Hall International, New Jersey.

    Green, W. H. (1998), “Sample Selection in Credit-Scoring Models.” Japan and the World Economy 10 (3), pp.299-316.

    Hausman, J. and McFadden, D. (1984), “A Specification Test for the Multinomial Logit Model.” Econometrica 52, pp.1219-1240.

    Hausman, J. and Wise, D. (1978), “A Conditional Probit Model for Qualitative Choice: Discrete Decisions Recognizing Interdependence and Heterogeneous Preferences.” Econometica 46, pp.403-426.

    Heckman, J. J. (1979), “Sample Selection Bias as a Specification Error.” Econometrica 47, pp.153-161.

    Horowitz, J. (1992), “A Smoothed Maximum Score Estimator for the Binary Response Model.” Econometrica 60, pp.505-531.

  • Modeli diskretne zavisne promenljive: pregled metodologije i primenjenih istraživanja

    91

    Horowitz, J. (1998), Lecture Notes in Statistics Vol. 131: Semiparametric Methods in Econometrics, Springer-Verlag, New York.

    Hu, L. and Phillips, C. B. P. (2004a), “Dynamics of the Federal Funds Target Rate: A Nonstation-ary Discrete Choice Approach.” Journal of Applied Econometrics 19 (7), pp.851-867.

    Hu, L. and Phillips, C. B. P. (2004b), “Nonstationary discrete choice.” Journal of Econometrics 120, pp.103-138.

    Klein, W. R. and Spady, R. H. (1993), “An Efficient Semi-parametric Estimator for Binary Re-sponse Models.” Econometrica 61(2, March), pp.387-421.

    Jin, S. (2004), “Discrete choice Modeling with Nonstationary Panels and Robust Covariance Ma-trix Estimation.” Ph.D. Dissertation, Yale University.

    Jovičić, M. (1995), „Upotreba modela binarnog izbora u testiranju uticaja ekonomskih faktora na verovatnoću rađanja dece.“ Ekonomski anali , Ekonomski fakultet, Beograd.

    Maddala, G. S. (1983), Limited-Dependent and Qualitative Variables in Econometrics, Cambridge University Press, New York.

    Markiewicz, A. (2006), “Choice of Exchange Rate Regime in Transition Economiec: An Empirical Analysis.” forthcoming in Journal of Comparative Economics.

    McFadden, L. D. (1974), “The Measurement of Urban Travel Demand.” Journal of Public Econom-ics 3, pp.303-328.

    Mot, E. and Cramer, J. (1992), “Mode of payment in householde expenditures.” De Economist 140, pp.488-500.

    Nojković, A. (2004), „Modeli kvalitativnih i zavisnih promenljivuh sa ograničenjem.“ magistar-ska teza, Ekonomski fakultet, Beograd.

    Park, J. Y. and Phillips, P. C. B. (2000), “Nonstationary binary choice.” Econometrica 68, pp.1249-1280.

    Phillips, P. C. B., Jin, S. and Hu, L. (2005), “Nonstationary Discrete Choice: A Corrigendum and Addendum.” Cowles Foundation Discussion Paper No. 1516, Yale University, forthcoming in Journal of Econometrics.

    Spector, L. and Mazzeo, M. (1980), “Probit Analysis and Economic Education.” Journal of Eco-nomic Education 11, pp.37-44.

    Train, K. E. (2003), Discrete Choice Models with Simulation, Cambridge University Press, Cam-bridge.

  • 92

    Aleksandra Nojković

    Valckx, N., de Ceuster, M. J. K. and Annaert, J. (2002), “Is Financial Market Informative to Predict Recession?“ DNB Staff Reports No. 93, Netherlands Central Bank, Amsterdam.

    Winkelmann, R. (2003), Econometric Analysis of Count Data, Springer – Verlag, Germany.

    Winkelmann, R. (2004), “Health Care Reform and the Number of Doctor Visits– An Econometric Analysis.” Journal of Applied Econometrics 19, pp.455-472.

    Wooldridge, J. M. (2001), Econometric Analysis of Cross Section and Panel Data, The MIT Press, Cambridge, Mass.