150
UDK 311(075.8) Mo-71 AUKŠTOJI MOKYKLA VILNIAUS VERSLO KOLEGIJA Ona Gražytė-Molienė ST ATISTIKA(I) Mokomoj i knyga Recenzavo prof., hab.dr. S.Martišius ISBN 9955-497-42-4 © Ona Gražytė-Molienė, 2004 © Vilniaus verslo kolegija, 2004 © UAB CIKLONAS, 2004

Statistika I Ona Gražytė-Molienė

Embed Size (px)

DESCRIPTION

Anotacija Šios mokomosios knygos tikslas - supažindinti su statistika kaip taikomuoju metodologiniu mokslu, parodyti jos filosofinę prigimtį (kad suvoktume, jog tai nėra "sausas" mokslas); aptarti informacijos rinkimo, jos sisteminimo ir analizės metodus, siekiant išmokyti apibendrintai aprašyti masinius reiškinius, t. y. iš nesuderintų duomenų gauti įprasmintas išvadas. Ši mokomoji knyga suteiks teorinius pagrindus vieno semestro statistikos (I) studijoms. Ji skiriama Vilniaus verslo kolegijos studentams, tačiau ja galės naudotis ir kitų aukštųjų mokyklų visų mokymo formų studentai, klausantys statistikos (I) kurso.

Citation preview

Page 1: Statistika I Ona Gražytė-Molienė

UDK 311(075.8) Mo-71

AUKŠTOJI MOKYKLA VILNIAUS VERSLO KOLEGIJA Ona Gražytė-Molienė ST A T I S T I K A ( I ) M o k o m o j i k n y g a

Recenzavo prof., hab.dr. S.Martišius

ISBN 9955-497-42-4

© Ona Gražytė-Molienė, 2004 © Vilniaus verslo kolegija, 2004

© UAB CIKLONAS, 2004

Page 2: Statistika I Ona Gražytė-Molienė

TURINYS

TURINYS...................................................................................................... 3ĮVADAS......................................................................................................... 51. STATISTIKOS SAMPRATA IR JOS RAIDA.......................................62. STATISTIKOS ORGANIZAVIMAS, JOS VEIKLOS PRINCIPAI IR FUNKCIJOS................................................................................................133. STATISTINIS STEBĖJIMAS............................................................... 16

3.1. Statistinio stebėjimo formos ir rūšys................................................... 163.2. Statistinio stebėjimo planas ir programa............................................. 173.3. Imčių metodas.....................................................................................19

3.3.1.Imčių metodo esmė ir jo privalumai............................................... 193.3.2. Imčių sudarymo būdai................................................................... 20

3.4. Anketinė apklausa............................................................................... 234. STATISTINIŲ DUOMENŲ SISTEMINIMAS.....................................29

4.1. Grupavimo metodo vieta statistiniuose tyrimuose...............................294.2. Matavimų skalės..................................................................................304.3. Grupavimo uždaviniai, rūšys, etapai (grupavimo teorija)....................324.4. Pasiskirstymo eilutės...........................................................................364.5. Variacinių eilučių grafikai...................................................................374.6. Antrinis grupavimas............................................................................394.7. Statistinės lentelės...............................................................................40

5. STATISTIKOS RODIKLIAI. SANTYKINIAI DYDŽIAI..................436. PASISKIRSTYMO CENTRO CHARAKTERISTIKOS....................45

6.1. Vidurkio esmė. Vidurkių rūšys ir jiems keliami reikalavimai.............456.2. Aritmetinis vidurkis ir jo savybės........................................................476.3. Harmoninis vidurkis............................................................................486.4. Moda ir struktūriniai vidurkiai.............................................................496.5. Vidurkių pranašumai ir trūkumai; jų tenkinami kriterijai.................... 52

7. POŽYMIŲ SKLAIDOS TYRIMAS...................................................... 547.1. Sklaidos esmė ir jos matai..................................................................547.2. Skirstinio momentai ir jų priklausomybė............................................ 617.3. Pagrindiniai skirstinio tipai. Asimetrijos ir eksceso rodikliai..............647.4. Normaliojo skirstinio kreivė................................................................687.5. Požymių pasiskirstymo netolygumo tyrimas...................................... 70

8. REIŠKINIŲ DINAMIKOS TYRIMAS (DINAMIKOS EILUTĖS) ....748.1. Dinamikos eilutės, jų rūšys................................................................. 748.2. Dinamikos eilutės analitiniai rodikliai................................................ 758.3. Dinamikos eilutės apibendrinamieji rodikliai: tradiciniai ir netradiciniai jų apskaičiavimo būdai...............................................................................768.4. Dinamikos eilutės komponentai. Adityvusis ir multiplikatyvusis modeliai 82

3

Page 3: Statistika I Ona Gražytė-Molienė

8.5. Trendo nustatymo būdai......................................................................858.6. Sezoninių svyravimų tyrimas...............................................................898.7. Dinamikos eilutės ekstrapoliacija........................................................ 92

9. INDEKSAI_______________________________________________ 959.1. Indeksų esmė ir paskirtis.....................................................................959.2. Indeksų rūšys.......................................................................................979.3. Bendrųjų indeksų formos....................................................................989.4. Vidurkiniai indeksai..........................................................................1039.5. Vidutinio lygio indeksai....................................................................1069.6. Teritoriniai indeksai..........................................................................108

10. ĮVADAS Į KORELIACINĘ - REGRESINĘ ANALIZĘ.................11010.1. Koreliacijos ir regresijos samprata.................................................. 11010.2. Parametriniai sąsajos stiprumo rodikliai......................................... 11410.3. Dažnių lentelės. Neparametriniai sąsajos stiprumo rodiklai............117

1 PRIEDAS. FORMULĖS UŽDAVINIAMS SPRĘSTI.........................1251.1. Vidurkiai.............................................................................................1251.2. Sklaidos, asimetrijos ir eksceso rodikliai.......................................... 1271.3. Dinamikos eilutės rodikliai...............................................................1291.4. Indeksai..............................................................................................1311.5. Koreliacija ir regresija.......................................................................133

2 PRIEDAS. TIPINIAI UŽDAVINIAI................................................... 1342.1. Statistiniai grupavimai.......................................................................1342.2. Intervalinės variacinės eilutės analizė.............................................. 1362.3. Dinamikos eilučių analizė................................................................. 140

2.3.1. Intervalinės dinamikos eilutės analizė........................................1402.3.2. Dinamikos eilutės komponentės.................................................. 144

2.4. Koreliacija ir regresija.......................................................................152

4

Page 4: Statistika I Ona Gražytė-Molienė

ĮVADAS

Statistine informacija naudojasi daug kas: ekonomistai, verslininkai, įstatymų leidėjai ir pan. Vieniems pakanka duomenų iš publikuotų statistinių leidinių, kitiems reikalinga pirminė informacija, tačiau visiems privalu suprasti „skaičių ir matų“ kalbą.

Šios mokomosios knygos tikslas - supažindinti su statistika kaip taikomuoju metodologiniu mokslu, parodyti jos filosofinę prigimtį (kad suvoktume, jog tai nėra „sausas“ mokslas); aptarti informacijos rinkimo, jos sisteminimo ir analizės metodus, siekiant išmokyti apibendrintai aprašyti masinius reiškinius, t. y. iš nesuderintų duomenų gauti įprasmintas išvadas.

Pirmuosiuose skyriuose pateikiama statistikos mokslo ir praktikos samprata, nurodomos statistikos funkcijos ir vaidmuo demokratinėje visuomenėje. Kituose skyriuose aptariami statistinio tyrimo etapai ir metodai (statistinio stebėjimo, grupavimo, santykinių dydžių, vidurkių, indeksų bei koreliacinės regresinės analizės), kurie padės suvokti, kaip rinkti statistinę informaciją, kada ir kaip taikyti imčių metodą kokios galimos statistinės medžiagos sisteminimo procedūros, kaip gaunamos ir analizuojamos pasiskirstymo ir dinamikos eilutės, kokia indeksų bei koreliacijos metodų paskirtis ir jų praktinio naudojimo galimybės. Statistikos kursą geriau įsisavinti padės pateikiami kontroliniai klausimai ir kai kurių uždavinių tipiniai sprendimai bei siūlomos atlikti savarankiškų darbų užduotys.

Ši mokomoji knyga suteiks teorinius pagrindus vieno semestro statistikos (I) studijoms. Ji skiriama Vilniaus verslo kolegijos studentams, tačiau ja galės naudotis ir kitų aukštųjų mokyklų visų mokymo formų studentai, klausantys statistikos (I) kurso.

Autorė dėkoja visiems, padėjusiems išleisti šią mokomąją statistikos knygą.

5

Page 5: Statistika I Ona Gražytė-Molienė

1. STATISTIKOS SAMPRATA IR JOS RAIDA

S t a t i s t i k o s praktika savo amžių skaičiuoja tūkstančiais metų, o statistikos mokslo arba teorijos pradžią tegalima sieti su „politinės aritmetikos“ atsiradimu XVII a. Tačiau statistikos mokslo (teorijos) ir praktikos amžiaus skirtumaTnėrS vien statistikos ypatybė, pvz., medicinos mokslas taip pat daug jaunesnis už gydymo praktiką o pedagogika - tik kūdikis, palyginti su mokymo praktika.

Senovės Egipte, Romos imperijoje jau 2-3 tūkstančiai metų prieš Kristaus gimimą buvo vykdomos gyventojų apskaitos administraciniams bei kariniams reikalams, kad būtų žinoma, kiek gyventojų gali nešioti ginklą mokėti mokesčius ir pan. Suprantama, ankstyvųjų surašymų negalima lyginti su šiuolaikiniais statistiniais tyrimais, nes jie nebuvo pagrįsti statistikos mokslo teorija, pvz., Visuotinis žemininkų surašymas Lietuvoje - 1528 metais. * ~ ---- ------ _--------- --- -------

Statistikos mokslo pradininkais laikomi du anglų „politinės aritmetikos^* atstovai V. P e t i s (EF. Peny 1623-1687) ir Pž.G -r'aun - t &š~XJohnas Grauntas - 1620-1674)77ų d^būošFrandSria^Stišfikosj kaip mokslo, užuomazgų.

V, P e t i s iškėlė įdomių minčių apie stebėjimo organizavimą plačiai panaudojo vidurkių kategoriją mėgino įsigilinti į gyvenimo „vertę“, didelį dėmesį skyrė tarptautiniams palyginimams, buvo vienas iš labiausiai išsilavinusių to meto žmonių (išrado kopijavimo mašiną studijavo mediciną domėjosi anatomija, muzika, matematika). Dž. Graunto genialumą rodo idėja- statistiką^ panaudoti prognozavimui. Jam pasisekė išgarsėti įrodžius, kad gimimų ir mirimų duomenys leidžia nustatyti svarbius gyventojų natūralaus judėjimo dėsningumus, iš jų ir tą, kad didesnė tikimybė numirti pirmaisiais gyvenimo metais. Dž. Grauntas konkrečius demografijos klausimus pradėjo tirti savita „skaičių ir matų“ kalba. Jis pirmasis pabandė sudaryti mirtingumo lenteles, buvo ne kartą prie didžiųjų skaičių dėsnio atskleidimo ir suformulavimo ribos. Jis padėjo pagrindus demografijai kaip“ mokslui. Esminis Dž. Graunto įnašas - mokslinių analizės metodų pritaikymas gyventojų tyrimams.

V. Petis ir Dž. Grauntas, analizuodami ir apbūdindami faktus, siekė skaičiais atvaizduoti visuomeninių reiškinių būklę ir vystymąsi, remdamiesi masiniais duomenimis, atskleisti juose pasireiškiančius dėsningumus. Nuo aprašymo žodžiais palaipsniui buvo pereita prie aprašymo skaitmenimis, lentelėmis, o žodžio argumentai pasitelkiami tik skaičiams paaiškinti.

Dar vienas „politinės aritmetikos” atstovas - G. K i n g a s (1648-1712) plačiai panaudojo grupavimo metodą socialinių ekonominių reiškinių analizei (sudarė visų Anglijos gyventojų socialinių grupių pajamų ir išlaidų balansą). G. Kingas naudojo duomenis (Anglijos ir Velso) apie mokesčius „už širdį“, apskaičiavo būstų skaičių šalyje, vėliau - vidutinį asmenų skaičių būste ir

6

Page 6: Statistika I Ona Gražytė-Molienė

galiausiai - bendrąjį gyventojų skaičių. Jis, kaip ir kiti šios krypties atstovai, gyventojų skalčitrlvarnaiT'aspektais nagrinėjo aritmetikos metodais, savo stebėjimus atliko remdamasis empiriniais duomenimis.

Į mokslo apyvartą žodį s t a t j_s_t i k ajvedė_vokiečių moksjininka»- (filoso&TFTeteh^fas)^6fe'sonūFG o t f r i d a s A c h e n v a f i s (1719— 1773) ir ją suprato kai^JattetyBes^rnokslą. G. Achenvalis 1746 m. Marburgo universitete pradėjo dėstyti statistikos kursą - aprašomojo pobūdžio discipliną apie valstybės būklę ir įžymybes.

Statistikos mokslo raidai didelę įtaką darė tikimybių teorija. “Tikimybių” s ą v o k o s ^ turi labai senas tradicijas (italų ^tematikas L. Paciuolo - 1445-1514, prancūzų filosofas, fizikas B. Paskalis- 1623-1662, italų matematikas G. Kardanas, mechanikos mokslų kūrėjas D. Galilėjus - 1542-1642).

Vigai nauja tikimybių teorijos ir moderniosios statistinės metodologijos era prasidėjo 1713 m.,kai buyo_.pask£lbtas-X.iL2m«//o veikalas, kuriame jis apIbrėzĮT tikim ybę kaip matematinį dydį. Statistikos mokslo raidos požiūriu labai svarbi J. Bernulio suformuluota viena pradinių didžiųjų skaičių dėsnio teoremų.

Didieji XIX a. 1-osios pusės matematikai P. Laplasas ir K. Gausas padėjo pagrindus matematinės statistikos teorijai, ižplėtoio stebėjimo paklaidų

'Teqn$Z55ar6ai leido prancūzų matematikui I T THuuiomi (1781-1840) suformuluoti atitinkamą didžiųjų skaičių dėsnio teoremą. Tai, savo ruožtu, turėjo įtakos tolesnei statistinės metodologijos ratSuTkiHi ėmė formuotis 19a. viduryje ir yra siejama su belgų matematiko.A. d-o-L f o K-e 11 e (1796- 1874) darbais, A. Ketle didžiąją savo gyvenimo dalį paskyrė statistikos mokslo ir praktikos klausimams spręsti. Pagrindinė jo idėja - žmogus - tyrimo objektas. Jis nustatė socialinių dėsnių, tokių pat objektyvių ir griežtų Eaipgamtos*3esniai, egzistavimą.

Panaudodamas masinius duomenis, jis nustatė, kad tam tikri dėsningumai pastebimi ne tik fizinėse žmonių savybėse, bet ir jų socialiniuose santykiuose ir elgesyje. Jam vadovaujant, pirmąkart susijungė įvairių šalių statistikai, vyko tarptautiniai statistikos kongresai.

Statistikos fUndamentaliu pagrindui. Ketle iškėlė tikmybių teoriją:'H Tikimybių Moryd'^ine Teveik kartu su statistika, savo jaunesniąja

seserimi, kuriai j i turi tapti pačia ištikimiausia ir neišskiriama drauge. Sis ryšys visai neatsitiktinis: vienas iš šių mokslų savo skaičiavimais tiria ir koordinuoja tai, ką kitas įgyja savo stebėjimais. ’’ (A. Ketle. Socialnaja jizika. 1911, t. 1).

A. Ketle bandė naujai pagrįsti statistikos mokslą, statistinius skaičiavimus pagrįsti tikimybiniais skaičiavimais. Iš tikrųjų, be tikimybių teorijos statistiniai skaičiavimai nebūtų pakankamai pagrįsti, o be statistinės metodologijos negalima būtų tikimybių teorijos pritaikyti masinių

7

Page 7: Statistika I Ona Gražytė-Molienė

visuomeninių reiškinių ir procesų kiekybinei analizei, atskleidžiant statistinius dėsningumus.

XIX a. 2-oje pusėje ir XX a. pradžioje statistikos mokslo priešakyje buvo angiųmokslininkai F. G a 11 o n a s (1822-1911) ir K. P i r s o n a s (1857-1936), kurie pagarsėjo kaip biometrijos - mokslo apie kiekybinių metodų taikymą^BToTogijoje pradininkai, įnešę didžiausią įnašą į statistikos Teoffjąir metodologiją.

K. Pirsonas didelį dėmesį skyrė filosofiniam mokslinių tyrimų pagrindimui. Jis sukūrė reiškinių dinamikos, sklaidos, tarpusavio priklausomybės tyrimo metodus. Pirsono kriterijus chi kvadrat naudojamas tikrinant statistines hipotezes. Pagrindinis jo tyrimų tikslas - rengti masinių procesų tyrimo metodologiją, tinkantrą^rakteėmiTproblemoms tyrinėti, o ne matematinei teorijai tobulinti. Koreliacinės ir regresinės analizės sąvokas suformulavo i7. Galtonas, ojoms matematinį pagrindimą suteikė A". Pirsonas.

XX a. pabaigoje įvairių šalių mokslininkų ir statistikos žinybų darbuotojų bendromis pastangomis ėmė fpmtuotįs naujos taikomosiom statistikos kryptys:

1. Iffičių metodo teorija ir praktika;2. Tarptautinė statistinių lyginimų metodika;3. Statistikos indeksų teorij a ir praktika; -4. Empiriniais tyrimais pagrįsta ūkio ir socialinės statistikos teorija ir

metodai.XX a. visose Europos valstybėse buvo sukurtos atitinkamos

administracinės statistikos tarnybos. Svarbus XX a. mokslo ir praktikos laimėjimas - tarptautinės statistikos teorijos ir metodologijos susiformavimas. Naujos makroekonominės analizės elementais tapo:

1. Konkrečių regionų ūkio raidos modeliai;2. Nacionalinė sąskaitų sistema (NSS);3. Sąnaudų ir išeigos matricinės lentelės (tarpšakinis balansas).Kas yra..* t a t i s t i k jiZ Daugybę statistikos apibrėžimų galima

sugrupuoti į tokias grupes:1. Statistika, kaip praktika;.

> Informacijos rūšis. Daugeliui žmonių žodis statistika” siejasi su apibendrinimais apie ūkio socialinę ekonominę raidą. Tačiau skaitmeniniai duomenys reikalingi ne tik ekonomistui ar sociologui, jie reikalingi ir gamtininkui, medikui, meteorologui, biologui ir kt. Šie duomenys gaunami po daugkartinių eksperimentų, matavimų, masinių stebėjimų. Jie leidžia įsitikinti, jog tie ar kiti rezultatai - neatsitiktiniai. Būtent šiuos duomenis ir vadiname statistika',

> Žmonių veiklos rūšis, nukreipta rinkti, apibendrinti ir analizuoti masinius duomenis apie įvairius visuomenės reiškinius ir procesus.

2. Statistika, kaip mokslas.Buvusiose socialistinėse šalyse sovietmečiu dominavo vienpusiška

Page 8: Statistika I Ona Gražytė-Molienė

p nuomonė apie statistiką, kaip visuomeninį giliai partini mokslą, paremta lehinižmvirFIi^^ šlaBstikos moksliškumą. HeT~

marksizmas, nei lėnmizmas jokių statistikos metodologinių problemų nesprendė; statistika buvo perdaug politizuota, kai tuo tarpu statistikos mokslas visame laisvame pasaulyje padarė milžinišką pažangą. Nors ir sovietmečiu buvo pavienių mokslininkų, kurie statistiką laikė universaliu mokslu, pvz., profesorius N. Družininas ir kai kurie jo pasekėjai.

^Lietuvoje statistikos mokslo pradininkas prof. akademikas Alb.JRimka ( 1 8 8 6 - 1 944}jiarenge ir išleido tris orijĮinalias statistikos knygas:

1. Statistikos pagrindai, K., 1925. ~2. Socialekonominė statistika, K., 1933.3. Statistika: teorija ir metodai, K., 1939.Pagal Alb. Rimką, Statistika nėra paprastas skaičiavimas, o

sistemingas ir prasmingas žymėjimas skaičiais, atsižvelgiant tam tikrą žymimojo daikto ar dalyko ypatybių.”

Alb. Rimkos pasekėjo G. Galvanausko-Galvos (1905-1979) manymu, statistikos mokslo uždavinys - suvokti masinių reiškinių dėsningumus. Vadovėlio „Statistikos teorija” autorius (1937) aiškiai skyrė taikomąją statistikos teoriją nuo grynosios matematikos, aiškindamas, kad statistikos skaičiai atstovauja realiems objektams, o matematiškieji - abstraktiems, kad statistikoje skaičiai yra tik forma, kuri atstovauja tam tikram turiniui.

t Dabartinė statistika apibrėžiama taip: statistika - tai metodologinis tmkoiiiash. mgkslas, tiriantis TfcĘtmemnių duomenų rinkimo'^sisteminimo, analizės ir interpretacijos metodus ir jų taikymą.

Pirmoji šio apibrėžimo dalis siejasi su teorine statistika (aprašomąja ir indukcine), kurios objektas yra metodų nagrinėjimas ir jų taikymo teorija. Aprašomosios statistikos objektas yra visos populiacijos tyrimo statistiniai metodai ir procedūros, kuriais stebėjimo duomenys tik aprašomi. Indukcinė statistika nagrinėja tą matematinę statistinę metodologiją kuri leidžia gautas išvadas apie visumos dalį (imtį) išplėsti visai populiacijai.

Statistikos metodų taikymas gamtos, medicinos, biologijos, sociologiniuose ir ekonomikos tyrimuose padėjo atsirasti terminui „taikomoji statistika”. Taikomosios statistikos tikslas - pritaikyti statistikos metodus e^059.fflyiiams, socialiniams ir pan. reiškimams analizuoti, Įuos Įpažinti ir aprašyti.

™~Ką vadiname s t a t i s t i k o s m e t o d ui Statistikos metodas paprastai apibrėžiamas kaip idmWcrų~metodų ir principų kompleksas, kuriuo remiantis renkami statistiniai duomenys, grupuojami, analizuojami, lyginami lr interpretuojami, siekiant gauti mokslines ir praktines išvadas. Šio komplekso turinį sudaro matematinė statistika bei nematematinė jos pusė, kūnai priklauso: statistinio tyrimo organizavimo, jo vykdymo metodologijos11 logikos klausimai, statistinių duomenų apdorojimo šiuolaikine elektronine

9

Page 9: Statistika I Ona Gražytė-Molienė

skaičiavimo technika organizavimas, apskaičiuotų rodiklių pateikimo formos ir pan.

Statistikos metodas — viena iš objektyvios tikrovės pažinimo priemonių, leidžianti matematiškai išreikšti tyrime proceso metu surastus konkrečius santykius ir priklausomybes, o daugeliu atvejų - ir padedanti juos surasti. Taigi statistikos metodas pasireiškia kaip būdas aprašyti konkretaus mokslo tiriamus reiškinius' ir juos atitinkamai paaiškinti._ remiantis nagrinėjamos Srities sąvokų siifiįna (ją teikia konkreti mokslinė teorija - ekonomikos, medicinos, biologijos, sociologijos ir pan). Naudojant šią sąvokų sistemą ir atliekamas masinių statistinių duomenų sisteminimas, apibendrinimas ir analizė. Identifikavus atitinkamas teorinių mokslų kategorijas, formuojami statistiniai tos srities rodikliai; statistiniais metodais nustatomi tiriamų reiškinių lygio, struktūros, dinamikos ir jų priklausomybės (sąsajos) dėsningumai.

Statistinio tyrimo tikslas - gauti apibendrinamąją kiekybinę charakteristiką apie tam tikrą sudėtingą reiškinį, tam tikrą daugybę, siekiant pažinti ją. Iš statistinių duomenų, remiantis tam tikrais reiškinių kitimo dėsningumais, galima susidaryti vaizdą ne tik apie praeitį, dabartį, bet ir ateitį.

Kas yra d ė s n i n g u m a s ? Žmonės nuolat susiduria su pasikartojimais, tam tikra gamtos ir visuomenės reiškinių tvarka ir jų nuoseklumu. Toks reiškmiųjmsikartojimas._ nuoseklumas ir tvarka yądiripjĮias dėsningumu. Ta£iauT~šTe~ dėsningumai pasireiškia įvairiai. Po kiekvienos žiemos ateina pavasaris, po pavasario - vasara, tačiau ne kiekvienas jaunas žmogus gyvena ilgiau už pagyvenusį, ne kiekviena moteris gyvena ilgiau už vyrą. Vadinasi, vieni dėsningumai pasireiškia kiekviename pavieniame reiškinyje, kiti - tik jų masėje, dideliame stebėjimo vienetų skaičiuje. Pirmieji vadinami dinaminiais, antrieji -statistiniais dėsningumais.

Vienas, iš svarbiausių^ statistinių dėsningumų buvo santykis tarp berniukų ir mergaičių gmiinift', riŽ?te^'~KurĮ atskleidė Vokiečių politinis aritmetikas, pagal išsimokslinimą medikas, Jo h a n a s P ė t e r i s Z i u s - m i 1 c h a s (Sussmilch) XVIII a. viduryje. Jis pirmasis nustatė*. kaęfcifK) mergaičių gimsta 105-106 berniukai. Įdomus faktas, kfd^yrnus lenkų kilmės mokslininkas Vladislavas B o r t k e v i č i u s, daug metų dirbęs Rusijoje ir sudaręs pirmąsias mirtingumo bei gyvenimo trukmės lenteles šalyje, XIX a. per 3 dešimtmečius apskaičiavo šį santykį atitinkamai: 112,2, 110,1, 109, kas nepatvirtino minėto dėsningumo, lyg Rusija būtų išimtis. Tačiau vėliau paaiškėjo, jog tuo laikotarpiu čia buvo netiksli gimusių mergaičių apskaita, o kai ji tapo tikslesnė - dėsningumas, kad berniukų gimsta daugiau, negu mergaičių (būtent Ziusmilcho nurodytu santykiu) - pasitvirtino.

Dėsningumas numato kad egzistuoja priežasties ir pasekmės ryšys, tačiau šis ryšis dinaminiuose ir statistiniuose dėsningumuose pasireiškia skirtingai. Dinaminiuose dėsningumuose ryšys tarp priežasties ir pasekmės gali būti išreikštas tikslia matematine formule, lygčių sistema ir pan. Tai

10

Page 10: Statistika I Ona Gražytė-Molienė

leidžia, jei šie dėsningumai pažinti, iš anksto numatyti (vykių, procesų ateinamą- Pvz., remiantis visuotinės traukos dėsniu ypatingai tiksliai galima apskaičiuoti bet kurio dangaus kūno judėjimo trajektoriją ir jo padėtį daugeliui dešimtmečių į priekį, kadangi, esant dinaminiam dėsningumui, vienų veiksnių reikšmes atitinka griežtai apibrėžtos priklausomų dydžių reikšmės. Tuo tarpu statistinis dėsningumas susijęs su didžiųjų skaičių dėsnio sąvoka, t.y. jis išryškėja tik stebint daug to paties tipo reiškinių. Statistinis dėsningumas išreiškia būtinumo ir atsitiktinumo vienybę. Sudėtingiau suprasti statistinių dėsningumų esmę ir panaudoti juos, nes jie pasireiškia tik didelėse visumose ir juos apsprendžia daugelis priežasčių, įskaitant ir atsitiktines. Šie dėsningumai kiekybiškai išreiškiami absoliučių ir santykinių dydžių eilutėmis bei vidurkiais.

Kiekvieno konkretaus (taikomojo) ekonominio, sociologinio ar kitokio tyrimo, besiremiančio masiniais statistikos duomenimis, galutinis tikslas - nustatyti statistinį dėsningumą, o remiantis juo - numatyti reiškinio vyksmą ateityje.

Taigi-šiuolaikmės taikomosios statistikos esmę galima nusakyti tokiais

'T - taikomoji statistika - tai masinių reiškinių ir procesų kiekybinis aprašymas (charakteristika) konkrečiomis vietos ir laiko sąlygomis;

- statistikos pagrindą sudaro didžiųjų skaičių dėsnis (statistika nagrinėja dėsningumus, kurie pasireiškia masiniuose reiškiniuose);

- statistiniai dėsningumai leidžia atlikti tikimybinius sprendimus, prognozuoti.

Statistikai itin svarbus teiginys, kurį suformulavo prancūzų filosofas O. K o n t a s (XIX a. vid.): „Žinoti, kad numatytum, ir numatyti, kad valdytum ", TtlJS Į&įnhcimis statisti^oslllčslas- gcmffTjprasmintas išVadčš iš nesuderintų duomenų (t. y. iš masinių duomenų nustatyti statistinius dėsningumus), o pagrindinė statistikos (statistikos institucijų) funkcija - teikti informaciją (tam, kad būtų galima priimti sprendimus).

Statistikos mokslo samprata ir statistikos disciplinų pavadinimai įvairuoja, tačiau nekyla abejonių, kad tai svarbi taikomojo mokslo disciplina, tirianti statistinių duomenų rinkimo, sisteminimo ir analizės metodus ir jų praktinį taikymą. Tai savotiška „skaičių kalba“, kurią privalo išmokti ne tik busimasis ekonomistas ar verslininkas, bet ir sociologas bei kitos srities specialistas.

1. KONTROLINIAI KLAUSIMAI

1. Koks statistikos praktikos ir statistikos mokslo amžius? -j'J f}-2. Kas yra statistikos mokslo pradininkai? m 4 \ >3. Ką vadiname dabartiniu statistikos mokslu?4. Kokie Alb. Rimkos nuopelnai Lietuvos statistikai?

Page 11: Statistika I Ona Gražytė-Molienė

5. Kas sudaro statistikos metodą?6. Kas yra statistinis dėsningumas? Kuo skiriasi nuo dinaminio

dėsningumo?

12

Page 12: Statistika I Ona Gražytė-Molienė

2. STATISTIKOS ORGANIZAVIMAS, JOS VEIKLOS PRINCIPAI IR FUNKCIJOS

S taJ istiko^ praktinę veiklą valstybėje reglamentuoja Statistikos įstatymas (LietavosTCėspObHlEOS statistikos įstatymas priimtas 1993 m. ir vėlesniais metais patikslintas1). Jįs nustato statistikos organizavimą, tikslus, duomenų gavimo būdus, formas bei. prievolę, naudojimo sąlygas, taip pat - atsakomybę už duomenų pateikimo ir naudojimo tvarkos pažeidimus.

Pagal statistikos įstatymą, galima kelių lygių statistika: valstybinė, apskričių ir savivaldybių žinybinė, visuomeniniųjudėjimų ir privati.

Statistikos darbui šalyje vadovauja Statistikos departamentas prie Lietuvos Respublikos Vyriausybės bei administracinių vienetų statistikos skyriai. Statistikos organizacinius ir metodologinius klausimus nagrinėja Statistikos Taryba. Beje, Centrinės statistikos institucijos įvairiose šalyse vadinamos nevienodai, pvz., Cenzų biuras (JAV), Fedaralinės statistikos tarnyba (Vokietija), Nacionalinis statistikos institutas (Prancūzija), Centrinė statistikos valdyba (Lenkija), Valstybinės statistikos komitetas (Rusija) ir pan.

Statistikos sistema valstybėje dažniausiai yra centralizuota (tai garantuoja" metodologinį vientisumą, TEuns būtinas atliekant makroekonominius skaičiavimus). Be to, būtinas ir kitas principas - regioninis statistikos decentralizavimas (miestų statistikos skyriai ne tik teikia duomenis Statistikos departamentui, bet ir atlieka statistinės informacijos užsakymus, gautus iš savivaldybių).

Svarbūs ir kiti statistikos organizavimo ir veiklos principai:-T^Į^irdlūKas (statistikai turi atspindėti tokią tikrovę, kokia ji yra, o ne

tokią, kokią kas nors norėtų matyti);- Mokslinis savarankiškumas (niekas negali primesti statistikos rodiklių

skaičiavimo metodikų - jas pasirenka tik valstybės statistikos aprobuotos statistikos tarnybos);

-Legalizavimas ir informacijos pateikimo prievolė (teisinėmis priemonėmis reglamentuojama, kaip ir kokią informaciją gali rinkti atitinkamos statistikos tarnybos);

- Vardinių duomenų konfidencialumas (personifikuoti duomenys turi būti neprieinami, juos privalu naudoti tik suvestinei informacijai gauti).

• „ 1999 gruodžio 23 d. priimtas LR statistikos įstatymo pakeitimo įstatymas (žr. „Valstybės > Nr. 114, gruodžio 31 d.). Ruošiant naują įstatymo redakciją buvo atsižvelgta į ES

reikalavimus.

13

Page 13: Statistika I Ona Gražytė-Molienė

/ - Pažintiną (ji gali pasakyti, kas vyksta valstybėje, kokie yra susiklostę santykiai, proporcijos ir ryšiai visame ūkyje ir kaip jie kinta); f - Prognostinę;I - Valdymo;V - Viešumo (sudaro sąlygas periodiškai publikuoti statistinius duomenis

apie visas svarbiausias valstybės gyvenimo sritis - ekonominę, socialinę, demografinę, ekologinę).

EUROSTAT direktoriaus Ph. Nanopoulo žodžiais - „Nėra demokratijos be skaidrumo, ir skaidrumo be statistikos“.

Lietuvos statistikos departamento vadovų nuomone, pagrindinės demokratnėsi statistikos prielaidos yra šios:

- statistikos tarnybų neutralitetas;- vardinių duomenų konfidencialumas;- agreguotų duomenų prieinamumas;- statistikos profesinis integralumas ir skaidrumas;- reputacijos gerinimas;- vartotojų diskriminacijos nebuvimas;- statistikos efektyvumas ir jo tobulinimas.

1. Siekiant atskirti privalomą ir savanorišką duomenų teikimą, naujoje įstatymo redakcijoje oficialioji statistika atribota nuo neoficialiosios.

2. Išplėstos respondento teisės: jis turi teisę gauti informaciją apie teisinį statistinio tyrimo pagrindą, duomenų rinkimo tikslą, pateiktų duomenų apsaugą; jis gali susipažinti su informacijos sistema bei registruose saugomais savo duomenimis.

3. Teisėsaugos institucijos negali reikalauti, kad oficialios statistikos įstaigos teiktų konfidencialius duomenis apie asmenis, kuriems iškelta baudžiamoji byla.

4. Įstatyme numatyta oficialiąją statistiką tvarkančių tarnautojų atsakomybė už neteisėtą statistikos tvarkymą bei konfidencialios informacijos atskleidimą.

Informacija valdymo poreikiams ir viešumo funkcija statistikoje turi būti derinamos su asmens laisvės teisių ir komercinės veiklos paslapties saugojimu. Visa praktinė statistikų veikla turi remtis „Profesinės etikos deklaracija“, kurią 1985 m. priėmė Tarptautinis statistikos institutas.

Be kita ko, joje rašoma, kad „statistikai turi būti objektyvūs ir neslėpti priežasčių, trukdančių tiesai. Ypač statistikų profesinė pareiga reikalauja pasipriešinti tokiam požiūriui į duomenų rinkimą, analizę, interpretavimą ir publikavimą, kurio tikslas - klaidinti (tiesiogiai ar netiesiogiai), o ne gilinti pažinimą

Pagrindiniai statistikos tarnybų tikslai:- rinkti, apibendrinti, analizuoti ir skelbti duomenis apie ekonominius,

socialinius, demografinius ir aplinkos reiškinius;

14

Page 14: Statistika I Ona Gražytė-Molienė

f statistikos tarnybų duomenimis;- laiku teikti patikimą informaciją prognozėms sudaryti ir 1. 1.Rinkos sąlygomis didėja statistinės informacijos poreikis. Ji reikalinga

ne tik "Seimui " ir- Vyriausybei,..rengianT Įstatymus ir kontroliuojant jųvykdymą, bet ir ministerijoms, įmonėms (firmoms) priimant sprendimus. Socialinių ekonominių problemų sprendimas turi būti grindžiamas ne bendrais samprotavimais ar pavieniais faktais, o išsamia ir nuolat aktualizuojama statistine informacija. Norint sėkmingai naudotis tokia informacija, reikia turėti žinių apie jos rinkimo, sisteminimo ir analizės metodus bei jų praktinio taikymo galimybes. Pagal G. Galilėjų (1569-1642) „...matuoti viską kas yra matuojama ir daryti viską matuojamu, kas dar nėra matuojama

2. KONTROLINIAI KLAUSIMAI

1. Ką numato Lietuvos Respublikos statistikos įstatymas?2. Kokie yra praktinės statistikos veiklos principai? Kokios jos

funkcijos?3. Kokios pagrindinės demokratinės statistikos prielaidos?4. Kaip paaiškinti O. K o n t o teiginį: „Žinoti, kad numatytum, ir

numatyti, kad valdytum "?5. Kam reikalinga statistinė informacija rinkos sąlygomis?

Page 15: Statistika I Ona Gražytė-Molienė

3. STATISTINIS STEBĖJIMAS

3.1. STATISTINIO STEBĖJIMO FORMOS IR RŪŠYS

Pirmasis statistinio tyrimo etapas - statistinės informacijos rinkimas, t. y. statistinis stebėjimas. Tai planingas, moksliškai organizuotas sistemingas masinių diiomenų apie tiriamus reiškinius ir procesus rinkimas, registruojant jt(esminius požymius pagal iš anksto sudarytąprogramą.

Statistinio stebėjimo metu turi būti surenkama ir palyginama visapusiška, tiksli, patikima pirminė statistinė informacija, objektyviai atspindinti faktinę reiškinių būklę. Kiekvienoje šalyje teisinėmis priemonėmis reglamentuojama, kaip ir kokią informaciją statistikos tarnybos gali rinkti. Pvz., gyventojų surašymo metu negalima siekti sužinoti apie žmogų daugiau, negu patvirtina surašymo programa.

Netikusio duomenų „teisinio“ reguliavimo pavyzdys - 1913 m. Argentinos parlamento priimtas įstatymas dėl gyventojų pirštų antspaudų fiksavimo surašymo metu. Nors įstatymas kriminalistikos požiūriu buvo racionalus (tikėtasi pasiekti didelio efekto kovoje su nusikalstamu pasauliu), bet sukėlė didelį gyventojų nepasitikėjimą ir greitai buvo atšauktas.

Statistinio stebėjimo metu gautus duomenis statistika naudoja tik suvestinei (agreguotai) informacijai gauti (tuo ji skiriasi nuo tos, kurią naudoja žurnalistai, aprašydami atskirus įvykius, ar teisėsaugos darbuotojai, tiriantys atskirus įvykius ir faktus). Statistikos nedomina pavieniai faktai, o tik jų visuma, bendras lygis, dėsningumai laike ir erdvėje; jų kiekybinė išraiška.

Statistinis stebėjimas gali būti atliekamas tokiomis formomis:- Statistinės atskaitomybės; ~~- Specialių statistinių tyrimų;- Registrų.Statistinė atskaitomybė yra tokia statistinio stebėjimo organizacinė

forma, kai nustatytais terminais ir tam tikrais adresais pateikiamos ataskaitos, užpildytos remiantis pirminės apskaitos duomenimis, pasirašytos asmenų, atsakingų už duomenų apie įmonių ir įstaigų veiklą ataskaitiniu laikotarpiu patikimumą. Statistikos departamentas yra patvirtinęs per 200 įvairaus periodiškumo statistinių ataskaitų, kuriose yra iš viso apie 5000 statistikos rodiklių (ES reikalavimus atitinka apie 70 proc). Lietuvių ir anglų kalbomis išleistas Statistikos rodiklių sąrašas, kuriame statistikos rodikliai klasifikuojami pagal tarptautinius ir nacionalinius klasifikatorius.

Statistikos departamentas pagal galimybes mažina ataskaitų skaičių, nuolat peržiūri statistinius rodiklius bei metodikas, siekia, kad rodikliai visiškai atitiktų ES reikalavimus. 2001 metais Statistikos departamentas

16

Page 16: Statistika I Ona Gražytė-Molienė

e i d o Statistinių ataskaitų formuliarų rinkinį, kuriame pateikti 224 ataskaitų vyzdžiai (žr. internete adresu http://www.std.lt).

Lietuvos Respublikos Vyriausybė pavedė Statistikos departamentui iki002 metų pabaigos parengti ir patvirtini e l e k t r o n i n i ų ataskaitų formas

|r jų pateikimo būdus. Elektroninių ataskaitų tikslas - pereiti prie naujų, "šiuolaikinu statistinės informacijos rinkimo būdų, panaudojant interneto '’galimybes. Tai leis sumažinti duomenų rinkimo kainą, palengvinti duomenų 'leikėjų darbą, padidinti renkamų duomenų kokybę bei jų gavimo

^operatyvumą.V , Specialūs statistiniai tyrimai gali būti -atliekami dviem formom:

Surašymo (pvz., Visuotinis gyventojų ir būstų surašymas) ir vienkartinės -(pvz., Specialistų su aukštuoju ir viduriniu išsimolčšfflJimcr

djjskaita). Jei surašymai dažniausiai vykdomi periodiškai, tai vienkartinės apskaitos - pagal poreikį ir galimybes.

Statistiniai tyrimai yra pagrįsti Vyriausybės nutarimais bei ES Tarybos teisiniais dokumentais.

Registras (lot. registrum — sąrašas) - tai apskaitos dokumentas, turintis teisinę galią. Pvz., Valstybinis gyventojų registras reiškia personalią visų .valstybės gyventojų apskaitą duomenų banke pagal bendrą rodiklių sistemą.

Būtina kiekvieno registro funkcionavimo sąlyga - informacijos identifikacija ir jos aktualizacija.

. t '^'Statistinis stebėjimas skirstomas pagal: j. \1 a) stebimojo objekto vienetų apimtį (ištisinis ir dalinis)',

b) stebėjimo laiką (einamasis ir pertraukiamasis); į a c) stebėjimo būdą (tiesioginis, dokumentinis, apklausa).

Didesnį dėmesį reikia skirti pagrindinei dalino stebėjimo rūšiai - Atrankiniam stebėjimui, vadinamajam imčių metodui, ir stebėjimui apklausos būdu (žr. atitinkamas temas).i Įvairi statistinė informacija teikiama šalies valdymo ir mokslo

; institucijoms, siunčiama EUROSTAT, JT, Pasaulio bankui, TDO, OECD, UNESCO ir kt. tarptautinėms organizacijoms. Periodiškai pildomi šių

f organizacijų klausimynai.

3.2. STATISTINIO STEBĖJIMO PLANAS IR PROGRAMA

Statistinio stebėjimo planą sudaro dvi dalys:1- Programiniai ir metodiniai klausimai (tikslas ir uždaviniai,

. bėjimo objektas, stebėjimo vienetas, stebėjimo programa, statistinis "Strumentarijus) :

2- Organizaciniai klausimai (kas atliks stebėjimą, ataskaitinis vienetas, , ebėjimo vieta, stebėjimo laikas, jo atlikimo laikas, kritinis momentas,

cialūs paruošiamieji darbai iki stebėjimo pradžios).

Page 17: Statistika I Ona Gražytė-Molienė

Trumpas šių klausimų aptarimas:Stebėjimo tikslas — tai stebėjimo pažinimo uždavinys, kuris turi būti

konkretus ir aiškiai suformuluotas. Pvz., gyventojų surašymo tikslas - nustatyti šalies gyventojų skaičių, sudėtį įvairiais požymiais ir jų pasiskirstymą.

Stebėjimo objektas — tai tie procesai ir reiškiniai, kurie tiriami šiuo stebėjimu, tiksliai nurodant jų skiriamuosius bruožus, pvz., surašomi esamieji, ar tik nuolatiniai gyventojai.

Stebėjimo vienetas — tai tiriamojo objekto sudedamasis elementas, kuris yra skaičiavimo pagrindas ir turi esminius statistinio stebėjimo metu registruojamus požymius, pvz., surašant gyventojus, stebėjimo vienetu gali būti kiekvienas žmogus arba jo būstas.

Stebėjimo programa — tai statistinio stebėjimo metu registruojamų požymių sąrašas, t. y. klausimai, į kuriuo reikia atsakyti kiekybiniu ir kokybiniu atžvilgiu apibūdinant stebėjimo vienetą. Pagrindiniai reikalavimai:

- į stebėjimo programą turi būti įtraukti tik esminiai požymiai;- suformuluoti aiškūs ir nedviprasmiški klausimai;- įtraukti kontroliniai klausiniai;- pageidautinas duomenų palyginamumas su ankstesnių tyrimų

rezultatais ir 1.1.Statistinį instrumentarijų sudaro statistinis formuliarą^jįjustmkęMS.-Statistinis formuliaras - tai dokumeffis (ataskaita), apklausos lapas,

kuriame pateikti statistinio stebėjimo programos klausimai ir palikta vietos atsakymams įrašyti.

Instrukcija - tai statistinės stebėjimo programos paaiškinimų visuma (dažnai pateikiami ir tipiniai formuliarų užpildymo pavyzdžiai).

Atlikus statistinį stebėjimą, tikrinamas gautų rezultatų tikslumas. Galimos kontrolės formos - loginė ir aritmetinė.

Į klausimą, „Kam reikalingas stebėjimas?“ atsakome prancūzų rašytojo Romėno Rolano (1866-1944) žodžiais „Reikia stebėti, kad suprastum, ir stengtis suprasti, kad veiktum “.

3.2. KONTROLINIAI KLAUSIMAI

1. Ką vadiname statistiniu stebėjimu?2. Kokios yra statistinio stebėjimo formos?3. Kokios yra statistinio stebėjimo rūšys?4. Kokios yra statistinio stebėjimo plano dalys ir kas jose atsispindi?5. Kaip paaiškinti G. Galilėjaus žodžius „...matuoti viską, kas yra

matuojama, ir daryti viską matuojamu, kas dar nėra matuojama “?

Page 18: Statistika I Ona Gražytė-Molienė

3.3. IMČIŲ METODAS*

3.3.1. Imčių metodo esmė ir jo privalumai

Informaciją M feJiaaimtOHgtolilis galima gauti ištisinio arba dalinio ao būdu,, o pastarasis dažniausiai taikomas kaip atrankinis Rimčių)

-«metodas - kai tiriama tik tam tikrar'^^ėTairneš aibės (populiacijos) dalis, o gauti rezultatai išplečiami visai generalinei aibei (populiacijai). Tada analizės tikslas - gauti statistines išvadas, o ne tenkintis gautos informacijos aprašymu.

Generalinę aibę (populiaciją) nebūtinai turi sudaryti tik didelis elementų skaičius,' ne" visada ji gaTnūretTif 'geografines rib^TTvZTTirRtnt - ilgaamžių žmonių ypatumus - generalinė aibė (populiacija) bus nedidelė. Svarbu ne tai, kiek elementų sudaro populiaciją bet tai, kad tyrimui paimta imtis negali būti didesnė už populiaciją. Tą patį duomenų rinkinį galima nagrinėti kaip populiaciją, esant vienam tyrimo tikslui, ir kaip imtį, esant kitam tyrimo tikslui. Pvz., jei pagal vienos studentų pirmakursių grupės matematikos žinias daroma išvada apie visų pirmakursių matematinius sugebėjimus, tai tos grupės studentai sudaro imtį, o jei tos grupės studentų žinių iš matematikos pažymiai panaudojami tik rengiant tam tikrą mokymo programą nustatytai studentų grupei, kurios žinios patikrintos, tai šios grupės studentai sudaro generalinę aibę (populiaciją). Populicija - tai objektų-ar imįividųgrupė, imtis - tąi populicijos dalis, pasįrįnSaJyrimui.

Populiacijos tam tikros charakteristikos skaitinė reikšmė vadinama etru, o parametro įvertis, gautas iš imties, - statistika.Mąstymas, kurio metu nuo bendresnių dalykų pereinama prie dalinių,

vadinamas dedukcija, o mąstymas, kurio metu nuo dalinių dalykų pereinama priebendresnių- indukcija.

PagrindinianrntiSs'metodo privalumai:1. Mažesnės tyrimo sąnaudos (piniginės, laiko, darbo jėgos);2. Trumpesni tyrimo terminai ir didesnis operatyvumas;3. Detalesnės informacijos gavimas;4. Didesnis gaunamų duomenų tikslumas ir patikimumas.Beje, yra atvejų, kada ištisinis stebėjimas visiškai neįmanomas (pvz.,

tikrinant medžiagos stiprumą ją plėšiant arba įvertinant lempučių tarnavimo laiką jas uždegant, kol nudegs šviečiantis siūlas).

/ Taikant imčių metodą yra neišvengiamos didesnės ar mažesnės ( paklaidos, t. y. nuokrypis tarp atitinkamų parametrų ir jų įverčių - statistikų.V Paklaidos yra dvieju rūšių:

a) sisteminės', f b) atsitiktinės.

l_^Atsįtj.ktimų paklaidų atsiranda tada, kai renkama ir analizuojama daug medžiagos, tačiau šios paklaidos iš anksto gali būti įvertintos, jei tinkamai

19

Page 19: Statistika I Ona Gražytė-Molienė

naudojama imčių metodo teorija. Atsitiktinės paklaidos - tai įverčių, gautų iš skirtingų imčių, nuokrypis nuo tikrosios vertinamo parametro reikšmės. Nuokrypio matu paprastai pasirenkama absoliuti standartinė arba santykinė standartinė paklaida. Santykinė standartinė paklada nustatoma kaip absoliutinės standartinės paklaidos santykis su statistika (parametro įverčiu) ir išreiškiama procentais.

Labiau pavojingos sisteminės paklaidos, kurių gali atsirasti dėl įvairių priežasčių:

- respondento noro „padidinti” arba „sumažinti” atsakymo svarbą;- pažeidus atrankos atsitiktinumo principą (subjektyvus elementų

parinkimas);- pakeitus atrankos elementus (žinių gavimas iš „trečiojo” asmens);- negavus atsakymų iš atrinktų respondentų;- matavimo klaidų;- netinkamos įvertinimo formos (pvz., taikytas paprastas aritmetinis

vidurkis, esant labai skirtingiems dažniams).Pigiausias duomenų gavimo būdas - turimos naudojimas informacijos,

kuri gali būti vidinė k išorinė.Vidiniai duomenų šaltiniai yra įvairios ataskaitos (mėnesinės,

ketvirtinės, metinės), kompiuteriniai duomenų failai, kuriuos kaupia firmos ir organizacijos savo reikmėms. Išoriniai duomenų. šaltiniai - tai įvairūs statistiniai leidiniai, statistinės informacijos rinkimo organizacijos, leidžiančios tyrėjui pasinaudoti jų surinkta medžiaga. Kai kitų surinktos informacijos nagrinėjamu klausimu nėra, duomenis tenka gauti savarankiškai tyrinėjant arba atliekant eksperimentą (pastaruoju įprasta remtis nagrinėjant priežastinius ryšius, pvz., medicinoje).

3.3.2. Imčių sudarymo būdai

Imtis gali būti sudaroma pagal:A . N e a t s i t i k t i n ę (netikimybinę) schemą;B. A t s i t i k t i nę (tikimybinę) schemą.

Vykdant neatsitiktinę atranką, dominuoja subjektyvumas, todėl rezultatų reprezentatyvumas priklauso nuo tyrėjo - specialisto - sugebėjimo formuoti imtį (tokiu atveju joks teorinis tikslumo pagrindimas negalimas)

N e a t s i t i k t i n ę imtį galima sudaryti:a) sprendimo būdu (ekspertinė imtis)',b) kvotos būdu (kvotinė imtis)',c) imtis patogumo dėlei (proginė imtis).

Ekspertinės imties atveju elementai (stebėjimo vienetai) į imtį įtraukiami atsižvelgiant į ekspertų nuomonę (ypač didelis subjektyvumas), todėl jų rezultatai negali būti išplėsti visai populiacijai.

20

Page 20: Statistika I Ona Gražytė-Molienė

Kvotine imtimi vadinama tokia imtis, kurioje kvotos užpildomos nevisiškai atsitiktinai (kai kvotos užpildomos visiškai atsitiktinai, gaunama atsitiktinė sluoksninė imtis).

.Kai į imtį įtraukiami pirmi pasitaikę populiacijos elementai (stebėjimo vienetai), gaunama vadinamoji proginė imtis, kuri visiškai nereprezentatyvi ir iš jos rezultatų negalima daryti statistinių išvadų apie visą populiaciją (pvz., pagal krepšininkų komandos ūgį dar negalima teigti, jog visi vyrai yra aukštaūgiai).

A t s i t i k t i n ė s atrankos privalumas tas, jog kiekvienas tiriamos visumos vienetas turi apibrėžtą galimybę patekti į imtį ir, remiantis tikimybinėmis charakteristikomis, galima pagrįsti gaunamų parametrų įverčių tikslumą. Be to, didinant imtį, rezultatai gaunami tikslesni, o griežtas atsitiktinumo principo prisilaikymas visiškai eliminuoja sisteminą paklaidą.

Galimi įvairūs imties sudarymo būdai:1. Paprastoji atsitiktinė imtis’ ""tai vadinamasis urnos modelis,

garantuojantis visiems populiacijos elementams lygią tikimybę patekti į imtį. Tokiai imčiai sudaryti reikalingi visi populiacijos elementai, todėl toks imties ėmimo būdas efektyvus tada, kai tiriama visuma nėra labai didelė ir kiekvienam elementui nesunku priskirti numerį. Paprastoji atsitiktinė imtis galima dviejų rūšių - grąžintine ir negrąžintinė (nelygių tikimybių).

2. Sisteminsoji imtis ('mechaninė). Ji galima tik turint tam tikrą tiriamos visumos elementų (stebėjimo vienetų) pirminį sutvarkymą, pvz., sąrašą, iš kurio ir sudaroma imtis. Tai daroma tokiu nuoseklumu:

a) atsižvelgus į populiacijos didumą ir numatomą pačios imties didumą, parenkamas išrinkimo žingsnis, pvz. kas 10 - tas , 20 - tas ir 1.1.;

b) iš kelių sąrašo elementų atsitiktinai atrenkamas vienas;c) pasirinktu žingsniu atrenkami visi likę elementai.

Beje, sąrašai atrankai gali būti sudaromi:a) be jokio dėsningumo (pvz., kaimo gyventojai apylinkių sąrašuose

pagal abėcėlę arba įmonės pagal teritorinį išsidėstymą);b) pagal tam tikrą tvarką, greta išdėstant elementus, panašesnius

tiriamomis savybėmis. Dažniausiai sistemingoji atranka taikoma buhalterinės apskaitos įrašų teisingumui tikrinti bei kokybės kontrolės uždaviniams spręsti.

3. Sluoksninė №0016. stratifikuota). kai visa populiacija pirmiausia suskirstoma į sluoksnius (stratas), po to kiekvienam sluoksniui taikoma atsitiktinė paprastoji imtis, o gauti rezultatai apibendrinami visai populiacijai, atsižvelgiant į kiekvieno sluoksnio užimamą dalį visoje populiacijoje. Teigiama tai, kad be papildomų lėšų galima atlikti kelis tyrimus

ir atskirų sluoksnių, ir visos populiacijos. (Pvz., nuo 1994 m. kiekvienais metais spalio mėn tiriamas darbuotojų pasiskirstymas pagal bruto darbo užmokestį sluoksninė atsitiktine imtimi. Kiekvienai tiriamos ekonominės veiklos rūšiai įmonių visuma suskirstoma į 1-6 sluoksnius priklausomai nuo darbuotojų skaičiaus). Kai kuriais atvejais, kai kriterijų, pagal kuriuos

Page 21: Statistika I Ona Gražytė-Molienė

apibrėžiami sluoksniai, yra daug, pvz., gyventojų sudėtis pagal amžių, profesijas ir pan., visą populiaciją suskirstyti sluoksniais nėra lengva. Bendras reikalavimas sluoksninėms imtims - populiacija turi būti heterogeniška (nevienalytė) sluoksnių atžvilgiu ir homogeniška (vienalYtf) filnnlmini Yiitnjr

4. T.iždinė flclasterinė'). kai visa populiacija pagal tam tikrą požymį suskirstoma į panašias grupes - lizdus (klasterius), iš kurių aibės paprastosios atsitiktinės imties būdu atrenkama tam tikra dalis ir į imtį patenka visi atrinktųjų lizdų (klasterių) elementai. Lizdai (klasteriai) sudaromi naudojant žemėlapius, miestų, gyvenviečių schemas ir pan. Dėl kompaktiško išdėstymo, atrinktus teritoriniu principu objektus tirti yra paprasčiau ir pigiau, tačiau ši imtis yra mažiau tiksli. Bendras reikalavimas lizdinėms imtims - populiacija lizdų atžvilgiu turi būti homogeniška, o lizdų viduje heterogeniška. Pvz., iš visų EF pirmojo kurso studentų grupių visiškai atsitiktinai parenkama dalis grupių ir pažangumui įvertinti tyrime dalyvauja visi parinktųjų grupių studentai. Kadangi lizdinė (klasterinė) imtis taip pat yra tikimybinė, rezultatus tam tikrais metodais galima apibendrinti visai populiacijai.

Be abejo, yra ir kitokių imčių sudarymo būdų, pvz., daugiapakopės bei daugiaetapės imtys, kurios gaunamos įvairiai derinant jau minėtus imčių sudarymo metodus. Daugiapakopė imtis - kai atskirose pakopose imties vienetai yra skirtingi. Pvz., tiriant namų ūkių gyvenimo sąlygas, gali būti vykdoma trijų pakopų atranka. „Pirminiai“ imties vienetai, pvz., geografiniai rajonai, vėliau iš jų parenkami „antriniai“ imties vienetai, pvz., miestų mikrorajonai arba kaimai ir, pagaliau, iš jų - „galutiniai“ imties vienetai - namų ūkiai. Svarbi aplinkybė - grupių, atrenkamų įvairiose pakopose, dydis. Optimalus grupės dydis - tai tas dydis, kuris prie duotų išlaidų užtikrina maksimalų tikslumą.

Daugiaetapė imtis - kai kiekviename tyrimo etape tiems patiems atrankos vienetams taikoma skirtinga tyrimo programa (paprastai vis detalesnė). Atliekant daugiaetapį tyrimą, svarbi klausimų „branduolio“ sąvoka (dažniausiai demografinės charakteristikos - lytis, amžius, šeiminė padėtis, tautybė, išsimokslinimas ir kt.), t. y. klausimai, kurie įtraukiami į kiekvieną kito tyrimo etapą. Toks „branduolys“, kaip taisyklė, papildomas įvairiais „moduliais“ arba standartinėmis klausimų grupėmis pagal konkrečias problemas, kurios gali keistis atskiruose tyrimuose (pvz., gyvenimo sąlygų, sveikatos būklės ir kt. klausimai). Pagal galimybę, temos kombinuojamos taip, kad turėtų esminę analitinę reikšmę sudarant kombinuotas lenteles. Pvz., yra stipri sąsaja tarp profesijos ir išsimokslinimo, kvalifikacijos ir darbo užmokesčio, mitybos ir sveikatos būklės ir 1.1.

Tiriant reiškinių priklausomybę, pvz., skalbimo miltelių rūšies ir perkamumo ryšį (sąsają), susirgimų plaučių vėžiu ir rūkymo ryšį ir t. t., naudojamos eksperimentų imtys. Tokiais atvejais sudaromos kelios imtys, o tiriamasis požymis matuojamas eksperimento nulemtose situacijose. Organizuojant eksperimentą, imtys derinamos tarpusavyje. Galimos

22

Page 22: Statistika I Ona Gražytė-Molienė

lygiagrečiosios ir porinės imtys. Pirmuoju atveju atsitiktinai iš visos populiacijos ~šudaramdš~’Kelios’matuojamo požymio atžvilgiu vienodos imtys, iš jų viena (kontrolinė) dalyvauja viename eksperimente, o likusios - kituose. Po eksperimento tiriamasis požymis išmatuojamas visose imtyse. Pvz., taip galima tirti kelių mokomųjų programų efektyvumą (žinių testo priklausomybę nuo taikytos mokomosios programos). Porinės, imtys - tai tokios dvi imtys, kurių elementai nesusiję, bet kiekvienas pirmos imties elementas turi „porininką“ antrojoje imtyje. Pvz., priklausomybės tarp vyro ir žmonos išsimokslinimo tyrimas.

3.3. KONTROLINIAI KLAUSIMAI

1. Kas yra atrankinis stebėjimas (imčių metodas)?2. Ką vadiname parametru ir ką - statistikai3. Kokie pagrindiniai imčių metodo privalumai?4. Ką laikome atsitiktine paklaida?5. Kokios sisteminių paklaidų atsiradimo priežastys?6. Kokios neatsitiktinių (netikimybinių) imčių rūšys?7. Kokie atsitiktinių (tikimybinių) imčių sudarymo būdai?8. Kuo skiriasi daugiapakopė ir daugiaetapė atrinkimo schemos?9. Ką statistikai reiškia Romėno Rotano žodžiai: ,Jleikia,stebėti, kad

suprastum, ir stengtis suprasti, kad veiktum“? Gfobut ■<* f '' • ^(■ r * J

3.4. ANKETINĖ APKLAUSA

' A p k l a u s a - tai vienas lahiaiisiai paplitusių metodų konkrečiuose sociaUnmese-- tyrimuose:' Tai universalus metodas, kuriuo galima gauti infefrraeijrfapie individe elgesio motyvus, jo realius poelgius praeityje bei dabartiniu metu ir apie jo ketinimus ateityje. Ypač nepakeičiamas apklausos metodas yra tais atvejais, kai norima gauti informaciją apie subjektyvias individo nuomones, jausmus, elgesio motyvus. Apklausos būdų gaunamos informacijos patikimumo (atitikimo realią tikrovę) laipsnio dydį lemia respondento (apklausiamojo asmens) sąžiningumas ir tai, kaip gerai jis •išmano tiriamojo dalyko esmę, t. y. ar gali iš esmės atsakyti.

Priklausomai nuo informacijos pobūdžio ir jos gavimo būdų skiriama:J a) anketinė apklausa; f b) interviu;c) sociometrinė apklausa.

iierikiečių psichologo D. M o r e n o pasiūlytas „sociometrijos“ "terminas kilęs iš dviejų lotyniškų žodžių: „sočius“ (draugas, bičiulis) ir , ..metrum“ (matavimas, matas). Tiesiogine prasme „sociometrija“ reiškia

Page 23: Statistika I Ona Gražytė-Molienė

draugiškų santykių matavimą ir yra savotiškas grupinių tarpusavio santykių kiekybinio įvertinimo būdas.

Anketavimas - tai rašytinė, neakivaizdinė apklausa (džniausiai uždaro tipo), interviu — žodinė apklausa (dažniausiai atviro tipo).

Priklausomai nuo komunikacijos su respondentu būdo, skiriamos asmeninės (akivaizdinės), kurių proceso metu palaikomas tiesioginis apklausėjo kontaktas su respondentu, ir neakivaizdinės, kai tokio kontakto nebūna, apklausos.

Pagal procedūrą, apklausa gali būti individuali (kai pats respondentas yra savo nuomonės reiškėjas) ir grupinė, nukreipta iš karto į kokią nors asmenų grupę (ekspertinė, kai respondentas yra tam tikros asmenų grupės interesų reiškėjas).

Apklausos taip pat gali skirtis ir pagal užduodamų klausimų konstrukciją.

ą) atvira (kai respondentas atsakinėja laisva forma);b) uždara (kai visi atsakymų variantai iš anksto numatyti ir užfiksuoti

klausimyne);c) pusiau uždara (kai kombinuojamos abi anksčiau minėtos

procedūros).PAVYZDŽIAI.Atvira apklausa-. Su kokiomis problemomis, Jūsų manymu, susiduria

studentai Vilniaus universitete? Ar būna problemų, kurios būdingos pirmo kurso studentams?

Uždara apklausa: Kaip pasikeitė Jūsų gyvenimo lygis per pastaruosius12 mėnesių?

Labai pagerėjo;Pagerėjo;Nepasikeitė;Pablogėjo;Labai pablogėjo.

Pusiau uždara apklausa: Jei laisvalaikį leidžiate namuose, tai:a) žiūrite televizorių;b) skaitote knygas;c) sėdite prie kompiuterio;d) kita ( įrašyti).

Apklausos tipą ir jo rūšis nulemia konkretaus tyrimo tikslas ir uždaviniai. Visų apklausos metodų pagrindą sudaro klausimynas (klausimų sąrašas), kurio sudarymas yra daugiau menas, negu mokslas. Anketa - tai tam tikru būdu struktūriškai sudarytas klausimų rinkinys, kuriu kiekvienas logiškai susijęs su pagrindiniais tyrimo uždaviniais.

24

Page 24: Statistika I Ona Gražytė-Molienė

Anketos klausimus Įprasta skirstyti pagal tris požymius:AJturinį:~~a) klausimai apie faktus, veiksmus praeityje ir dabar;b) klausimai apie motyvus, vertinimus, nuomones.B) formą:a) atviri;b) uždari;c) pusiau uždari.

Visi jie gali būti tiesioginiai ir netiesioginiai Uždari klausimai - tai tam tikrų atsakymų alternatyvų sąrašas. Klausimai gali būti kokybinio (klausimai su atsakymų vėduokle) ir kiekybinio (vertinimo klausimai, kuriais matuojamas nuomonių intensyvumas) pobūdžio.

Pvz. Ar moterys diskriminuojamos vyrų atžvilgiu?Niekada;Labai retai;Kartais;Dažnokai;Labai dažnai.

Pvz. Kiek cigarečių surūkote per dieną, jei rūkote kasdien?1-4;5-9;10-19;20—>;

C) funkciją:ą) filtruojantys (patikrina respondentų informatyvumo laipsnį), pvz.Ar rūkote?

ė , TaiP Ne( kitas klausimas, jei ruko, kiek suruko cigarečių);b) kontroliniai (jais vertinama gaunamos informacijos kokybė);

•į Pvz., Gimimo metai? Amžius?Išsamią ir patikimą informaciją galima gauti derinant visus anketų

imu tipus ir užduodant tiek tiesioginius, tiek ir netiesioginius klausimus įtarieji dažnai formuojami beasmene forma: „Kai kas mano, ... o kaip ote Jūs“?).

Anketinėje apklausoje klausimynas-skirtas respondentui, o interviu - ėjui. Klausimynas turi būti sudaromas taip, kad būtų efektyvus ir

ausai, ir duomenų apdorojimui. Todėl, sudarant klausimyną, reikia iovautis tam tikrais jo sudarymo principafs Tr taisyklėmis. Pagrindiniaiicipai: v__ —

l) programinių klausimų išdėstymas loginiu nuoseklumu', kai ėjama problema ypač aktuali pačiam apklausiamajam, pvz., jaunimo

Page 25: Statistika I Ona Gražytė-Molienė

pasitenkinimas darbu, galima pradėti formuoti bendrą klausimą, charakterizuojantį tiriamąją problemą visumoje, ir konkrečius klausimus, atskleidžiančius požiūrį į problemą ir atsakymų motyvus. Kitais atvejais klausimai gali būti pateikiami daliniai, konkretūs, o iš atsakymų į juos ir formuosis apklausiamojo nuomonė apie nagrinėjamą problemą. Klausimai išdėstyti skirtinga tvarka gali duoti skirtingą informaciją;

2) tik esminiu klausimų įtraukimas, į kuriuos pateikti atsakymai teikia kaip tik tą informaciją, kuri reikalinga svarbiausiems tyrimo uždaviniams spręsti ir kurios negalima gauti kitaip (nėra reikalo rinkti tą informaciją, kūną galima gauti iš kitų šaltinių);

3) geras stilistinis (kalbos, konceptualumo) ir prasminis klausimų formulavimas (neleistinas klausimų dviprasmiškumas);

4) apklausos lapo (anketos) prasminiai „blokai“ turi būti apytiksliai vienodos apimties;

5) būtinas klausimų išdėstymas pagal sudėtingumo laipsnį (pirma ~ lengvesni, vėliau - sunkesni, svarbiausieji galiausiai — intymūs klausimai)',

6) anketoje neturi būti klausimų, sukeliančių neigiamą respondento reakciją;;

Pvz. „Kiek svaigalų Jūs suvartojate per mėnesį ar savaitę?“ (Galimas netikslus atsakymas, nes respondentas žino, jog etiniu požiūriu visuomenė to netoleruoja).

7) kiti reikalavimai.Anketos kompoziciją paprastai sudaro trys dalys:a) įvadinė (kas atliks šią apklausą, koks tyrimo tikslas, kokia

respondento asmeninio dalyvavimo svarba, atsakymų anonimiškumo užtikrinimas);

b) pagrindinė;c) demografinė.Baigiamasis etapas ruošiant moksliškai pagrįstą anketos klausimų

sąrašą - tai bandomasis tyrimas, kurio metu ir išsiaiškinama, ar gerai suformuluoti klausimai, ar tinkamai jie išdėstyti. Bandomajam tyrimui („pilotažui“) suformuojama 25 -30 žmonių mikroauditorija iš tos visumos, kurią numatoma ateityje masiškai apklausti. Čia turi patekti asmenys su įvairiomis demografinėmis charakteristikomis, nes tik tokiu atveju galima patikrinti anketos tinkamumą. Bandomasis anketos patikrinimas vykdomas asmeninio interviu forma. Klausėjai privalo registruoti bet kurias apklausiamojo reakcijas ir komentarus kiekvienu klausimu, esant reikalui performuluoti klausimus, kad jie būtų suprantami respondenui (klausimo formulavimo pakeitimai tiksliai užfiksuojami).

^Bandomuoju tyrimu siekiama išsiaiškinti, ar išlaikyti tam tikri anketos reikalavimai, kaip antai:

a) ar nepasirodė, jog kai kuriems respondentams anketa buvo per sunki,o kitiems - per daug primityvi;

26

Page 26: Statistika I Ona Gražytė-Molienė

b) ar visi klausimai ir atsakymų variantai suprantami;c) ar ne per daug abstraktūs ar konkretūs klausimai;d) ar respondentai kompetetingi atsakyti į visus anketos klausimus;e) ar nėra pavojaus nuvarginti apklausimąjį (kaip to išvengti; kaip

sumažinti monotoniškumą);f) ar pakankamai gera apklausiamojo atmintis, kad atsakinėtų į

'f klausimus apie praeitį;' g) ar nėra pavojaus gauti stereotipinius atsakymus;

h) ar ne per daug atsakymų variantų, ar gali respondentai išsirinkti jiems tinkantį;

i) ar nėra pavojaus sukelti respondento nepasitikėjimą arba kokias nors teigiamas emocijas;

j) kokius atsakymus reikia priimti „už gryną pinigą“, o kokius suprasti perkeltine prasme;

k) ar tinkamai apipavidalintas apklausos lapas, ar išskirti atitinkamu .< 'Šriftu klausimai ir instrukcija;

1) ar netikslinga kai kuriems klausimams suformuluoti alternatyvas; m) kiti.

‘ . Esant minėtiems anketos sudarymo reikalavimų pažeidimams, gali būti daug atsisakančių atsakinėti, dažni jų atsakymai „nežinau“ arba „negaliu jtesakyti“ arba visų, be išimties, respondentų atsakymai į tą patį klausimą

Jvisiškai vienodi. Tik ištyrus bandomosios apklausos rezultatus ir klausimų sąrašą sunorminus iki tam tikros kondicijos, galima pereiti prie pagrindinės

ausos.Anketavimo būdai:1) pašto (kai anketos išsiuntinėjamos, o paskui grąžinamos tyrėjui

paštu);2) spaudos (kai anketa paskelbiama laikraštyje ir visi norintieji gali į ją

atsakyti).Abiem atvejais anketavimas lengvai organizuojamas, pigesnis, bet daug

ketų negrįžta, o dėl to gali iškreipti tyrimui numatytą imtį.,'^ę 3) išdalijamasis (kai anketą išdalija ir ją užpildo vietoje arba namuose Įk Sutartu laiku grąžina tyrėjui). Tokiu atveju visos anketos grąžinamos, o dar, p i jos užpildomos vietoje, galima kontroliuoti anketų užpildymo procesą, ko j®įmanoma padaryti anketuojant kitais būdais.

i Interviu - tai tiesioginis kryptingas interviuotojo pokalbis su J^spondentu, reikalingas pirminei informacijai gauti. Klausėjas yra

ciatorius, organizuojantis ir vedantis pokalbį, o respondentui priklauso formacijos šaltinio vaidmuo. Interviu metodo pranašumas prieš anketinį

Betodą atsiskleidžia naudojant pusiau fbffflalTOš arba-nefbrmalius klausimyno variantus. Tokiuose interviu numatomas tik pagrindinių klausimų sąrašas ir

^.dalinai - jų tvarka (ji gali keistis pagal aplinkybes), o gaunama informacija

I "

: ' 27

Page 27: Statistika I Ona Gražytė-Molienė

padeda formuoti hipotezes, išryškina tiriamas problemas. Apskritai, interviu panaudojimo sritys gali būti įvairios:

a) didelių apklausų tyrimų metodikai paruošti;b) kaip pagrindinis informacijos šaltinis psichologiniuose tyrimuose,

kai esti ribota atranka;c) kaip papildomas informacijos šaltinis;d) kontroliniuose tyrimuose kitais metodais gautiems duomenims

patikrinti ir patikslinti.Interviu būdu gaunamos informacijos kokybė priklauso nuo daugybės

veiksnių. Pagrindinė užduotis klausėjui kuo tiksliau registruoti respondento atsakymus į užduodamus klausimus, sugebėti juos pateikti (panaudojant savo sumanumą ir žaibišką reakciją) bei sugebėti išklausyti respondentų nuomonių įvairovę. Pastebėta, kad respondento elgesį veikia ir klausėjo kalbos tempas, jo taktiškumas ir išsilavinimas.

Konkretiems tyrimams pasirenkamas tinkamiausias apklausos būdas. Kadangi gaunama informacija yra subjektyvi (kiekvienas žmogus objektyvią tikrovę suvokia skirtingai), svarbu užtikrinti duomenų tikslumą.Tuo reikia rūpintis jau prieš pradedant konstruoti anketą. Reikia nuspręsti, kokiai auditorijai bus skirta anketa, kaip bus vykdoma respondentų atranka, kokius duomenis tikimasi gauti {hipotezių formulavimas), apgalvoti sąvokas, kad jos būtų aiškios ir nedviprasmiškos, apsvarstyti, ar numatytu būdu bus įmanoma gauti visą rūpimą informacią. Atsakymų į klausimus rezultatai gali būti pateikti įvairių rūšių skalėse: pavadinimų, rangų, intervalinės, santykių ir kt., pvz., Laikerto, Gutmano (apie pastarąsias daugiau skaityti sociologinėje literatūroje).

3.4. KONTROLINIAI KLAUSIMAI

1. Kokiais atvejais informacija gaunama apklausos būdu?2. Kas būdinga anketinei apklausai? Kokios jos rūšys?3. Pagal kokius požymius ir į kokias grupes skirstomi anketos

klausimai?4. Kokios pagrindinės k l a u s i m y n o sudarymo taisyklės?5. Koks b a n d o m o j o tyrimo tikslas ir uždaviniai?6. Kokie i n t e r v i u ypatumai?

Page 28: Statistika I Ona Gražytė-Molienė

4. STATISTINIŲ DUOMENŲ SISTEMINIMAS

> 4.1. GRUPAVIMO METODO VIETA STATISTINIUOSE TYRIMUOSE

Statistinių duomenų sisteminimas yra antrasis statistinio tyrimo etapas. Kad masiniai pirminiai duomenys būtų naudingi turiningai analizei ir galėtų tarnauti išvadoms pagrįsti, jie turi būti atitinkamu būdu sutvarkyti (susisteminti). Vienais atvejais pakanka palyginti paprastų operacijų - ūgio eilutės, grupavimo ir lentelių sudarymo, kitais - būtini sudėtingesni metodai

itorinės ar klasterinės analizės ir kt.).Įfets paprasčiausias pirminių duomenų sutvarkymo būdas yra ūgio

/ė^sūHarymas, t. y. tiriamojo požymio reikšmių išdėstymas TficRpnd ar mažėjimo kryptimi. Pvz., tokią procedūrą atlieka Statistikos departamentas, Sistemindamas NŪBT duomenis apie vidutines vartojimo išlaidas, tenkančias vienam namų ūkio nariui per mėnesį, ir suskirstydamas jas deciliais.

Visais atvejais pirmiausia būtina gauti bendrą vaizdą apie pirminius duomenis, t. y. atlikti išankstinį regimąjį duomenų tyrimą (taip, lyg mes anot HtMrenbergo, stengtumėmės įžiūrėti „už atskirų medžių visą mišką“), o tada - jpįūsitinkti tinkamiausiąjų sisteminimo būdą.

Šiuo atveju praverstų prisiminti vaizdingą ekonomisto S. Mitčelo ^ginimą: Statistika - tai šiaudai, kuriuos aš, kaip ir kiekvienas

omistas turiu supresuoti, kad gaučiau briketą'. Iš tikrųjų, bet kokiu būdu . faktų gausybė (masiniai duomenys) apie tiriamus reiškinius ir

^os neaprėpiama apbendrinti, jei ji nebus moksliškai susisteminta ir .

stinis grupavimas - tai stebėjimo vienetų suskirstymas (arba i - aitrini©--grū^avimo atveju) pagal esminius požymius į

vienarūšes grupes. Tai pagrindinė statistinės medžiagoso (plačiąja pfasme)~operacija (kitos operacijos - grupių ir pogrupių

Skaičiaus ir bendrų sumų apskaičiavimas, gautų rezultatų išdėstymas stinėse lentelėse ir grafinis jų pavaizdavimas). Beje, statistinės medžiagos

aas gali būti centralizuotas ir decentralizuotas.Didelės grupavimo metočtO panaudojimo galimybės socialinių ir

aominių reiškinių analizei. Pirmą kartą grupavimo metodą mokslinei alinių ekonominių reiškinių analizei panaudojo anglų statistikas Dž.

fįaantas (1620-1674), padėjęs demografijos, kaip mokslo, pagrindus. Kitas ; mokslininkas, G. Kingas (1648-1712), suskirstė Anglijos gyventojus į ' Visuomenines grupes, po to pagal kiekvieną grupę apskaičiavo pajamas ir *idas. Tai leido sudaryti visų Anglijos socialinių grupių pajamų ir išlaidų fansą. Vėliau, belgų statistikas A. Ketle (1796-1874) savo darbuose

29

Page 29: Statistika I Ona Gražytė-Molienė

grupavimo metodą panaudojo reiškinių ryšių analizei, išplėtęs paprastų porinių ryšių analizės rėmus, plačiai pritaikė trimates ir keturmates lenteles.

Grupavimo metodą iki šiol mokslininkai laiko pagrindiniu metodu, leidžiančiu „priversti duomenis kalbėti“ (anot Erenbergo), nes visuomenės gyvenimo reiškiniai - politiniai, socialiniai, ekonominiai, demografiniai ir pan. yra tarpusavyje susiję ir pasižymi įvairove. Todėl juos reikia sisteminti taip, kad būtų išaiškinti jų esminiai bruožai, savybės ir vystymosi ypatumai.

4.2. MATAVIMŲ SKALĖS

Tiriant įvairius reiškinius, jų ypatybes padeda atskleisti ne tik kiekybinė, bet ir kokybinė informacija apie juos. Statistikos uždavinys - išmatuoti ir pateiktį, nes tik, kiekybinių, bet ir kokybinių požymių charakteristikas. Tam tikslui tarnauja matavimo skalės (skaičių sistemos;- , skirtos dydžiams įvertinti arba išmatuoti).

Dažniausiai naudojamos tokios kintamųjų matavimo skalės:1) P a v a d i n i m ų {nominali, vardinė);2) R a n g ų {eilės);3) In t e r v a l ų ,A) S a n t y k i ų .

P a v a d i n i m ų skalė skirta kokybiniams požymiams klasifikuoti (sutvarkyti), priskiriant juos kokybiškai vienarūšei visumai. Pvz., darbininko profesija, automobilio markė, ekonominės veiklos kodas, sportinių marškinėlių numeris, telefono numeris, pašto indeksas, kraujo grupė, gyvenamoji vieta, tautybė ir 1.1. Čia nėra jokios natūralios tvarkos, o skaičiai (numeriai, kodai ar indeksai) tik identifikuoja atitinkamus vienetus ar jų požymius, bet neatspindi jų dydžio (pvz., nėra prasmės skaičiuoti vidutinį kodą ar numerį). Tačiau ir šiuo atveju galima nustatyti kai kurias statistines charakteristikas: dažnius, modą, įvairius neparametrinius kriterijus (Pirsono, Čuprovo ryšio koeficientus).

R a n g ų (eilės) skalė numato tam tikrą požymių sutvarkymą vienas kito atžvilgiu. Jos pagrindinė savybė yra eiliškumas (ji gali būti taikoma kokybiniams ir kartais - kiekybiniams kintamiesiams išmatuoti): x a< x b < x c ir 1.1. Pvz., darbininko tarifinė kategorija, apibūdinanti jo kvalifikaciją, vieta, užimta pasibaigus sportinėms varžyboms, visuomenės socialinis statusas {žemas, vidutinis, aukštas), mokslinis laipsnis, parodantis tam tikrą vietą (laiptelį) mokslininkų hierarchijoje ir 1.1. Matuojant požymius, galima taikyti rangus (1, 2, 3,.... n), balus (1-10, 10-100) ir pan. Ši skalė leidžia nustatyti tokias specifines charakteristikas, kaip: decilius, kvartilius, medianą ir kai , kuriuos ryšio rodiklius {rangų koreliacijos koeficientus).

Intervalų ir santykių skalės yra, skirtos tik kiekybiniams požymiams (kintamiesiems)-išmatuoti.

Page 30: Statistika I Ona Gražytė-Molienė

I n t e r v a l ų skalė gali būti gaunama iš eilės skalės, įvedus mato vienetus. Ji leidžia nustatyti skirtumą tarp dviejų sutvarkytos eilutės narių, kuris rodo, kiek daugiau (mažiau) matuojamo požymio yra viename elemente, palyginti su kitu elementu. Nulinis taškas intervalų skalėje yra susitarimo reikalas (laisvai parenkamas).

Pvz., temperatūros matavimas pagal Celsijaus arba Farenheito skales. Šių skalių nulinis taškas ir matavimo vienetai skiriasi, tačiau abi jos pateikia vienodą informacijos kiekį, nes jų parodymus sieja tiesinis ryšys: F= 1,8 C + 32, čia F - laipsnių skaičius Farenheito skalėje, C - laipsnių skaičius Celsijaus skalėje.

4.1 lentelė. Celsijaus ir Farenheito skalių palyginimas

CELSIJAUS (° C ) FARENHEITO (° F )0 325 4110 5020 68

Abiejose skalėse dviejų atitinkamų reikšmių skirtumų (intervalų) santykis yra vienodas. Pvz., (20 - 10)/ (10 - 5) = 2 Celsijaus skalėje ir tiek pat — Farenheito skalėje: (68 — 50) / (50 - 41) = 2. Vadinasi, šios skalės savybes išlaikys bet kokia teigiama tiesės transformacija:

y= a + bx, (4.1)čia x - pradinis skalės taškas, b - teigiama konstanta, a - laisvasis

narys, y - transformuota skalės reikšmė.I n t e r v a l ų skale galima matuoti ne tik temperatūrą bet ir

kalendorinį laiką (nuo Kristaus gimimo, nuo Romos įkūrimo ir pan.), intelekto, gabumų ir pan. testų rezultatus ir įvertinti jų kiekybinius skirtumus. Iš intervalinės skalės kintamųjų galima apskaičiuoti aritmetini vidurkį, sklaidos rodiklius, tiesinės koreliacijos koeficientą, atlikti operacijas su natūraliaisiais skaičiais.

S a n t y k i ii skalė skiriasi nuo i n t e r v a l ų skalės tik tuo, kad joje yra apibrėžta absoliuti atskaitos pradžia, t. y. nulinis taškas, rodantis, kad tiriamojo požymio nėra. Ši skalė leidžia nustatyti proporcijas, t. y.skaitmeninį matuojamojo požymio santykį (pastarasis nuo matavimo vienetų nepriklauso). Pvz., dešimtadalio turtingųjų vidutinis pajamų lygis 8 kartus didesnis negu dešimtadalio neturtingųjų. Santykių skalės kintamieji gali būti: ūgis, svoris, amžius, kaina, savikaina, atlyginimas, produkcija, prekių apyvarta, pajamų lygis, vartojimo lygis ir 1.1.

Su santykių skalės kintamaisiais galimos visos matematinės operacijos, visos skirstinio padėties ir sklaidos charakteristikos bei atitinkami ryšio rodikliai. Pažymėtina, jog iš kiekybinių tolydžiųjų (jie gali būti išreikšti ne

31

Page 31: Statistika I Ona Gražytė-Molienė

tik sveikais, bet ir trupmeniniais skaičiais), galima gauti ranginius, o iš pastarųjų - nominaliuosius kintamuosius, tačiau tokiu atveju prarandama dalis informacijos (atitinkamos skaitinės reikšmės pakeičimos kokybinėmis sąvokomis, pvz., mažas, vidutinis, didelis). Galima tik proporcinga santykių skalės transformacija:

y = bx, (4.2)čia b - teigiama konstanta, x - pradinė reikšmė, y - transformuota

skalės reikšmė (pvz., 1 m = 100 cm, 1 h = 60 min.).

4.3. GRUPAVIMO UŽDAVINIAI, RŪŠYS, ETAPAI (GRUPAVIMO TEORIJA)

Statistikoje grupavimo metodas taikomas įvairiems uždaviniams spręsti: —

A. Reiškinių tipams išskirti (tipologiniai grupavimai)',B. Jų sudėčiai ir struktūrai nustatyti (struktūriniai grupavimai)',C. Reiškinių priklausomybei nustatyti {analitiniai grupavimai)',

Kai konkrečiame tyrime yra sprendžiami visi minėti uždaviniai, grupavimo rūšis negali būti tiksliai įvardijama. Tiriant masinius socialinius ekonominius ar kitokio pobūdžio reiškinius grupavimo metodu, galima atsakyti į klausimus, į kuriuos atsakymų negali duoti jokie teoriniai samprotavimai. Svarbu tik, kad grupavimai būtų atlikti moksliškai, laikantis grupavimo teorijos. Grupavimo teorija ir praktika numato tokius nuoseklius etapus'.

1. Esminių grupavimo požymių parinkimas;2. Grupių skaičiaus nustatymas;3. Intervalų pločio ir jų ribų nustatymas (kai grupuojama pagal

kiekybinį požymį);4. Grupių apibūdinimas apibendrinamaisiais rodikliais (absoliutiniais ir

santykiniais dydžiais, vidurkiais).Grupuoj ant imami. es/mmai^pagrindiniai požymM, tačiau skirstymas į

esminius ir neesminius, pagrindinius ir antraeilius, priklauso nuo tyrimo ūbavimų ir sąlygų. Skirtingomis sąlygomis tie patys požymiai gali turėti nevienodą reikšmę, todėl būtina juos vertinti konkrečiomis vietos ir laiko sąlygomis (ypač reikia į tai atsižvelgti sudarant intervalus).

Pagal išraiškos formą visi požymiai skirstomi į dvi rūšis:1. Kokybinius {atributinius)',2. Kiekybinius.

Kiekybiniai požymiai dar skirstomi į:A. Diskrečiuosius (jie gali būti išreikšti tik sveikais skaičiais, pvz.,

vaikų skaičius šeimoje, namų ūkio narių skaičius);B. Tolydžiuosius (jie gali įgyti bet kurią trupmeninę arba sveikojo

skaičiaus reikšmę, pvz., prekės kaina, darbo užmokestis ir pan.).

32

Page 32: Statistika I Ona Gražytė-Molienė

Diskretieji duomenys gaunami kiekvieną kartą skaičiuojant ;puliacijos ar imties vienetus (elementus), o tolydieji - išmatuojant šių

vienetų požymius. Pvz., akcijų skaičius fondų biržoje - diskretusis požymis ritamasis), o akcijų vidutinė kaina - tolydusis.

Visi kiekybiniai požymiai išreiškiami skaičiais, (pvz., gyventojų ličius, darbo stažas, prekių apyvarta ir t. t.) ir jų priskyrimas atitinkamai

,%rupei priklauso nuo šio požymio skaitinės reikšmės dydžio. Kai grupuojama- pagal kokybinį požymį (lytį, gyvenamąją vietą, profesiją ir t. t.), sudarytos

grupės skiriasi požymio pobūdžiu, o ne jo dydžiu., Priklausomai nuo grupavimo požymių skaičiaus, grupavimai gali būti

skirstomi į paprastus (kai grupuojama pagal vieną požymį) ir kombinuotus (kai grupuojama pagal du ir daugiau požymių). Pvz., bedarbių grupavimas pagal lytį - paprastas grupavimas, o pagal lytį ir amžių - kombinuotas grupavimas.

Pasirinkus grupavimo požymį, iškyla grupių skaičiaus nustatymo klausimas. Svarbus grupavimo teisingumo kriterijus - optimalus grupių užpildymas, o kartu - ne per didelis ir ne per mažas grupių skaičius. Apskritai, mokslininkų nuomone, grupių skaičius, priklausomai nuo požymio

tinamM'višumos % 3zi67 to^*b® ^F w aJes«fy‘ nei4-4_grupės ir ne nei 15-20 grupių, išskyrus tuos atvejus, kai pats grupavimopožymis apsprendžia ribotą grupių skaičių, pvz., grupuojant pagal lytį.

Grupių skaičių galima nusatyti pagal amerikiečių mokslininko G. S t e r d ž e s o pasiūlytą formulę:

m = 1 + 3,322 lg N, (4.3)čia N - stebėjimo vienetų skaičius.Pastebėta, kad, skaičiuojant pagal šią formulę, grupių skaičius m,

priklausomai nuo stebėjimo vienetų skaičiaus N arba n, iš pradžių gana intensyviai didėja (m = 4-7, kai n = 10-100), po to jo augimas sulėtėja (m = 7-11, kai n = 100-1000) ir pagaliau tampa beveik nepastebimas (m = 11-14, kai n = 1000-10 000).

Grupių skaičių m galima nustatyti ir pagal T e r e 1 o (Terrel) ir S k o tO (Scott) pasiūlytą formulę:* m = 2 n 0,3333 ; (4.4)

čia n - tiriamo požymio reikšmių variantų skaičius.: Kai grupuojama pagal kiekybinį požymį, kurio reikšmės smarkiai svyruoja, reikia sudaryti grupių intervalus ir nustatyti ribas (rėžius). Grupių intervalai gali būti lygūs ir nelygūs (pastarieji dažniausiai progresiškaiVejantys);--------------------- -

Kai kiekybinio grupavimo požymio reikšmės kinta tolygiai, reikia ig jg ryti lygius intervalus, kitais atvejais - nelygius; svarbiaušra;“katf"Būtų Pteiektas pagrindinis tikslas - išaiškintos tiriamos visumos vienetų esminės #vybės.- /

Page 33: Statistika I Ona Gražytė-Molienė

TytT'Į in1ffrwa1|q plotį, galima apskaičiuoti kaip maksimalios ir minimalios požymio reikšmių skirtumą, padalintą iš grupių skaičiaus, t. y. pagal tokią formulę:

'd ” ..(Xroax-' ) / m, (4*5)čia m - grupių skaičius, kurį galima laisvai pasirinkti, arba nustatyti

pagal anksčiau nurodytas formules..Sudarant grupes, svarbu teisingai nustatyti intervalų ribas (rėžius):

„nuo „iki”.Grupės ribos (rus. predely) - tai skaičiai, kuriais paprastai naudojamasi

identifikuojant grupes pasiskirstymo eilutėse. Jas galima vadinti nominaliomis ribomis. Grupės rėžis (rus. granica) - tai tam tikras taškas, skiriantis vieną grupę nuo kitos, o ne reikšmė, įtraukta į vieną iš grupių. Jis, paprastai būna išdėstytas viduryje tarp vienos grupės viršutinės ribos ir gretimos grupės apatinės ribos. Pvz., turime tokį respondentų pasiskirstymą pagal amžių (metais):

(n = 54)•v 16-19 10 15,5-19,5

/ > 2 0 -24 28 19,5- 24,5 l 25 -29 16 24,5-29,5

:- y k (ribos) (rėžiai)

Šiuo atveju rėžis, skiriantis grupę (16-19) nuo grupės (20-24) yra tarp 19 ir 20, t. y. taške 19,5.

Pagal Alb. Rimką, kiekybinių požymių grupes galima sudaryti dviem būdais: ffldricanuoįu ^ pmgLmmnfu Kai grupavimo požymis diskretusis, intervalų ribos žymimos taip, kad vieno intervalo viršutinė riba ir gretimo intervalo apatinė riba skirtųsi apibrėžtu dydžiu (dažniausiai - vienetu) - tai skiriamasis būdas.; Kai grupuojama pagal tolydųjį požymį, dažniausiai intervalai rašomi taip^kad gretimų intervalų viršutinė ir apatinė ribos (rėžiai) sutaptų (arba skirtųsi labai nežymiai) - tai jungiamasis būdasS^

a) kai požymis diskretusis Įmonių grupės pagal darbuotojų skaičių * . /, ,, .

Iki 10 ^10-19 ...20 -49 50-99 100 +

b) kai požymis tolydusis Pensininkų grupės pagal pensijos dydį (Lt) / / , į

Iki 150 r ’150-200 200-250 250 - 300 300 - 400 400 +

Tais atvejais, kaį kiekybinio požymio maksimali ir minimali reikšmės gerokai atitrūkę nuo gretimų reikšmių, tikslinga sudaryti neapibrėžtus

34

Page 34: Statistika I Ona Gražytė-Molienė

(atvirus) intervalus, pirmajai grupei nenurodant apatinės ribos (rėžio), o paskutinei grupei - viršutinės ribos (rėžio).

Kai grupės sudarytos jungiamuoju būdu, iškyla klausimas, kuriai grupei priskirti tuos tiriamos visumos vienetus, kurių reikšmės visiškai sutampa su nustatytų ribų (rėžių) reikšmėmis, žr. b) pvz. Į kurią grupę turėtų patekti pensininkai, kurių pensija lygi 200 Lt? Atsakymas priklauso nuo to, kaip užrašytas paskutinis neapibrėžtas intervalas. Duotuoju atveju - „400+” (reiškia „400 ir daugiau”), vadinasi reikšmė 200 turėtų patekti į 3, o ne į 2 grupę. Jei paskutinis neapibrėžtas intervalas būtų užrašytas „daugiau 400”, tai reikšmė 400 turėtų patekti į priešpaskutinę grupę, o reikšmė 200 - į 2 grupę.

Išdėstant intervalus, jų pradinio atskaitos taško (rėžio) nustatymas kartais nėra taip svarbus ir siejamas su patogumu, kad intervalų ribos būtų sveikieji skaičiai arba kad intervalų centrai būtų išreikšti sveikaisiais skaičiais. Norint išvengti sunkumų visumos vienetus skirstant į grupes, intervalų ribas galima pasirinkti tokias, kad nė viena jų reikšmė nesutaptų su kuria nors iš užregistruotų požymio reikšmių.

Grupuojant empirinius duomenis, reikia laikytis tokios taisyklės: grupių skaičius, intervalų tipas ir plotis turi būti parenkami taip, kad grupavimas kuo labiau išryškintų esmines tiriamų reiškinių savybes bei jų pasiskirstymo pobūdį.

XX a. statistikos literatūroje skelbiama nuostata, kad neteisinga klasifikuoti pirminius duomenis vien vadovaujantis statistine metodologija, nes toks klasifikavimas negali duoti to, ko iš jo labiausiai pageidaujama - neišskiria socialinių tipų. Tam reikia remtis ekonomikos ir sociologijos teorija.Todėl, norint pažinti socialinius reiškinius ir procesus, statistikos metodai turi būti taįkomi kartu su tiriamų reiškinių socialinių mokslų teorija.

Beje, statistinį grupavimą reikia skirti nuo klasifikacijos. Klasifikacija - tai tvirtai nustatytas grupavimas (dažniausiai - pagal atributinį požymį), kuris ilgą laiką naudojamas kaip tam tikras standartas, patvirtintas nacionalinių arba tarptautinių statistikos institucijų. Pvz., Tarptautinė profesijų klasifikacija (TDO), Tarptautinė standartinė ekonominių veiklų klasifikacija (EUROSTAT), Tarptautinė standartinė švietimo klasifikacija (UNESCO), Tarptautinė standartinė ligų klasifikacija (PSO) irt. t.

Klasifikaciją apibrėžia tam tikras problematikos kryptingumas; kai fcunos jų yra universalios (pagal lytį, tautybę ir pan.), kitos - specializuotos, (Pvz., susijusios su visuomenės saugumu). Socialinėje statistikoje plačiai paplitusios standartinės klasifikacijos, pvz., pagal amžių (nors čia kiekybinis Požymis): iki 1 metų, 1-4, 5-14, 15-19, 20-24, 25- 44, 45-59. 60-69, 70 ir ' au.

1-4 - vaikų grupė - pagrindinis JT vaikų fondo ir sveikatos apsaugos tas;5—14 — mokyklinio — vaikų ir paauglių amžiaus grupė;

35

Page 35: Statistika I Ona Gražytė-Molienė

15-19 - tai pereinamasis laikotarpis ir pasikeitimai, susiję su mokslo užbaigimu, išlaikytinio padėties nutraukimu;

20-24 - darbinės veiklos pradžia; šeimos sukūrimas;60-69 - santykinai aktyvesnis laikotarpis;70 + - problemos, susijusios su sveikata, nedarbingumu, pajamomis ir

ypač ryškiomis socialinėmis problemomis.Pirminės medžiagos grupavimas pagal kiekybinį požymį galimas ir

vadinamuoju Galtono metodu (F. Galionas XIX—XX a. matematinės analizės metodais tyrinėjo paveldimumo klausimus). Šio metodo. esmė- tokia: kiekybinio požymio reikšmės išdėstomos didėjimo kryptimi-« visa tiriama visuma (N) suskaidoma į iš anksto apibrėžtą grupių skaičių, pvz., 10 arba 5, kiekvienai grupei priskriant vienodą stebėjimo vienetų skaičių arba jų dalį. Mūsų Respublikos statistikos departamentas decilių arba kvantilių grupėmis suskirsto NŪBT dalyvaujančius namų ūkio narius pagal vidutinį vartojimo išlaidų lygį. Tai padeda nustatyti visuomenės susisluoksniavimą, socialinę nelygybę ir atkreipti Vyriausybės dėmesį į spręstinas socialnės apsaugos problemas.

Grupuojant pagal kiekybinį požymį, reikšmingas ir kumuliatyvinis metodas, kai nustatomi kumuliuoti (sukaupti) grupių dažniai. Jie rodo, kiek visumos vienetų arba kuri jų dalis neviršija tam tikros požymio reikšmės. Pasiskirstymo eilutės, kurių dažniai sukaupti, vadinamos kumuliatyvinėmis.

4.4. PASISKIRSTYMO EILUTĖS

Statistikoje nagrinėjamos dviejų rūšių statistikos eilutės:f \. Dinamikos;.JL Pasiskirstymo.Dinamikos eilutės parodo reiškinio kitimą laiko atžvilgiu, pvz. prekių

. apyvartos apimtis kiekvieną mėnesį, ketvirtį, metus.Pasiskirstymo eilutės parodo visumos vienetų pasiskirstymą pagal tam

tikrą požymį. Jos gaunamos kiekvieną kartą, kai atliekamas pirminis ar antrinis statistinių duomenų grupavimas. Privalomi pasiskirstymo eilučių elementai yra grupavimo požymio reikšmės - variantai (x;) ir dažniai (f;), parodantys, kiek kartų tos reikšmės pasitaiko.Variantai gali būti išreikšti teigiamais ir neigiamais skaičiais, dažniai - tik teigiamais (absoliučiais arba santykiniais) dydžiais. Santykiniai dažniai parodo kiekvienos gmpės dalį bendrame stebėjimo vienetų skaičiuje; jie išreiškiami vieneto dalimis arba procentais ir jų suma visada turi būti lygi 1 arba 100 proc.

Priklausomai nuo grupavimo požymio {kokybinis ar / kiekybinis), pasiskirstymo eilutės skirstomos į: J /? f ' Ai'

1. Atributines; — / ą i ]/Į , - f > (2. Variacines. — ? ;! , / ;r j i F .Pastarosios, savo ruožtu, skirstomos į:

Page 36: Statistika I Ona Gražytė-Molienė

...... ?A. D i s k r e t i n e s — «-B. Intervalines.Statistikos eilutė prieš analizę apibūdinama: v' A & .. ’ -- kokia tai statistikos eilutė dinamikos ar pasiskirstymo; . ,- jei pasiskirstymo, tai kokia jos rūšis pagal grupavimo požymį

atributinė ar v ariadnė; ,\ -je i variacinė, tai kokia ji diskretinė ar intervalinė; < j / ■i CP ' -Qei intervalinė variacinė, tai kokie intervalai: lygūs ar nelygūs; visi K^apibrėžti ar pirmas ir / arba paskutinis neapibrėžtas;

""— kokiu būdu sudaryti intervalai (jungiamuoju ar skiriamuoju);- jei eilutė diskretinė variacinė, tai kokia tvarka ji išdėstyta (ūgio eilutė

ar ne);- kokie duotos pasiskirstymo eilutės dažniai (absoliutūs ar santykiniai).Tik teisingai charakterizavus duotą statistikos eilutę pereinama prie kito

etapo - šios eilutės apibendrinamųjų rodiklių apskaičiavimo ir jų analizės. Nagrinėjant pasirinktą intervalinę variacinę pasiskirstymo eilutę, tenka tiksliai nustatyti kiekvienos grupės intervalo p lo tį(d j)h in tę™

Kai grupėš\sudaiyt0s jungiamuojubūda, kiekvienos grupės intervalo plotis nustatomas iš tos grupės viršutinės ribos (rėžio) atėmus apatinę ribą (rėžį)- Kai grupės sudarytos skiriamuoju būdu, kiekvienos grupės intervalo plotį nustatome iš tos grupės viršutinio rėžio, atėmę apatinį rėžį arba - kaip gretimų grupių apatinių ribų skirtumą.

In tervalo centras (vidurinė kiekvieno intervalo reikšmė, kuri skaičiavnntKJse' tūri afstovauti visoms kitoms to intervalo reikšmėms), nepriklausomai nuo to, kaip grupės sudarytos - jungiamuoju ar skiriamuoju būdu, apskaičiuojamas kaip paprastas aritmetinį vidurkis (xa+ xv)/2, čia xa. - apatine riba, arba rėžis, xv - viršutinė riba arba rėžis. Kai grupės sudarytos lygiais intervalais ir kai žinomi grupių intervalų centrai, kiekvienos grupės intervalo plotį (dj) galima nustatyti kaip gretimų grupių intervalų centrų skirtumą: dį = X į-xM.

4.5. VARIACINIŲ EILUČIŲ GRAFIKAI

Pasiskirstymo variacinės eilutės grafiškai gali būti pavaizduotos:A. Histograma;B. Dažnių daugiakampu (poligonu);(^Sukauptų dažnių laužte (kumuliate).

f T^istograma paprastai taikoma intervalinei variacinei eilutei, o dažnių fotogiakampis - dišEretinei‘W tač in erėM tėr^afisk a i pavaizduoti. Galima ®Įtervalinę variacinę eilutę pavaizduoti ir histograma, ir dažnių daugiakampiu

diagramoje. Brėžiant histogramą, horizantalioje (x) ašyje pažymimi intervalai (nurodomi rėžiai), kurie tampa stačiakampių pagrindu, o

vQtiklioje (y) ašyje - atitinkamų grupių dažniai (fį), kai grupių intervalai

Page 37: Statistika I Ona Gražytė-Molienė

lygūs, arba dažnių tankiai (hį = fį /dį), kai grupių intervalai nelygūs, kurie parodo stačiakampių aukštį. Gali būti nustatomas kiekvienos grupės absoliutus arba santykinis tankis, priklausomai nuo to, koks — absoliutus ar santykinis dažnis dalijamas iš intervalo pločio.

Grafike histogramoje sujungus visų stačiakampių vidurio taškus vieną su kitu ir su horizontalia (x) ašimi, gaunama uždara figūra, vadinama dažnių daugiakampiu. Grafiškai vaizduojant diskretinę variacinę eilutę,

1 pav. Respondentų pasiskirstymo pagal vidutinę telefono pokalbių trukmę histograma.

Lakas (rrin.)

horizantalioje (x) ašyje atidedamos požymio reikšmės ir iš jų iškeliamos ordinatės, išreiškiančios grupių dažnius, o tada visi gauti taškai sujungiami tarpusavyje ir su horizontalia (x) ašimi.

Sukauptų dažnių laužte (kumuliatė) brėžiama pagal sukauptus absoliučius arba ffimtykmks damius, kurie pažymimi vertikalioje (y) ašyje, o horizantalioje (x) ašyje nurodomos požymio reikšmės (kai turime diskretinę eilutę) arba atitinkami rėžiai (kai turime intervalinę eifcrTęyfTŠ kiekvienos grupės viršutinio rėžio iškeliami taškai, atitinkantys sukauptus dažnius, ir tarpusavyje sujungiami (žr. 1 ir 2 pav.).

120

« 100 c

T3

s. 60 -

1 40 - I

0 -

0 2 4 6 8 10L a ika s (min)

2 pav. R e sp o n d e n tų p a s isk ir s ty m o pagal poka lb ių telefonu trukm ę kum uliatė

(su kau p tų dažn ių laužtė )

Jei grafikai nubrėžti teisingai, iš histogramos galim a nustatyti dažniausiai pasitaikančią požymio reikšmę (modą), o iš sukauptų dažnių laužtės - struktūrinius vidurkius (medianą, kvartilius, decilius).S\arbi vieta socialiniuose ekonominiuose tyrimuose tenka ir kitiems grafikam s Jau XIX a. pabaigoje amerikiečių mokslininkas G. Stenli-Chelas pažymėjo, kad grafinis metodas tampa tarptautine mokslo kalba, kurią turime išmokti ir mes.

38

Page 38: Statistika I Ona Gražytė-Molienė

4.6. ANTRINIS GRUPAVIMAS

Antrinis grupavimas - tai naujų grupių sudarymas, remiantis ankstesniu avimu. Duomenų pergrupavimas rekalingas tais atvejais, kai::— a).anksčiaaišskirtos grupė&nėra tipiškos* ir jas reikiasustambinti;

b) reikia lyginti kelis grupavimus, t.y. gauti vienarūšius duomenis. v Pirmuoju atveju, antrinis grupavimas atliekamas intervalų SUstambinimo metodu, antruoju - dalinio pergrupavimo metodu.

■ Pavyzdys4. 2 lentelė. Namų ūkio narių pasiskirstymas pagal pajamų lygį

Pajamų lygis (Lt) Namų ūkio narių skaičius, % (f))

Iki 60 16 ^ JL60-10A- 18 3100^150/ 20150-200 17200-300 15

300+ 14' <■■ 100t' " UŽDUOTIS. Pergrupuoti duomenis intervalų sustambinimo metodu,

t j į duotiems intervalams priskirti naujus dažnius (f;).

' 4.3 lentelė. Antrinis namų ūkių grupavimas pagal pajamų lygį

Pajamų lygis ( L t) Namų ūkio narių skaičius,%

I Iki 100 34,0II 100-^ŠO 30,2III 180-250 14,3IV 250-400 21,5

u Oo

Skaičiavimo pocedūra tokia: _I g r.= 1 gr. + 2 gr. = 16 + 18 = 34 (fį); ">Hj&T. - 3 gr. + 4 gr. (180—150)/(200—150) = 20+ 17 ■ 0,6 = 30,2 (f2); -Ufgr. = 4 gF.“ Tl-0;S).+ 5 gr. • (250 200) / (300-200) = 17 • 0,4 + 15 • 0,5 ==^4,3 (f3);

Page 39: Statistika I Ona Gražytė-Molienė

4.7. STATISTINĖS LENTELĖS

Statistinio stebėjimo ir medžiagos grupavimo rezultatai paprastai išdėstomi statistinėse lentelėse. Statistinė lentelė - tai racionali duomenų, apibūdinančių socialinius ekonominius reiškinius ir procesus, išdėstymo forma. Statistinėse lentelėse, kitaip negu ne statistinėse (logaritminėse, daugybos ir pan.), pateikiama bendra statistinės visumos charakteristika.

Statistinės lentelės yra daug vaizdingesnės, negu žodinis tekstas. Jau XVII a. statistikos mokslo pradininkai V. Petis ir Dž. Grauntas suprato statistinių lentelių reikšmę ir paskirtį - nuo aprašymo žodžiais palaipsniui buvo pereita prie aprašymo skaitmeninėmis lentelėmis. Statistinėse lentelėse rodikliai išdėstomi logiškiau ir nuoseklesne forma, be to, lentelės užima mažiau vietos negu tekstas. Duomenys išdėstomi eilutėmis ir skiltims, tad lengviau juos apžvelgti, tarpusavyje palyginti ir analizuoti. Didelis statistinių lentelių privalumas - kompaktiškas duomenų pateikimas.

Taigi statistines lenteles sudaro eilučių ir skilčių derinys. Vertikalios linijos sudaro skiltis, horizontalios - eilutes. Vertikalių ir horizontalių linijų susikirtimas sudaro langelį, į kurį įrašomi statistiniai duomenys. Kairėje lentelės dalyje pateikiami eilutėse išdėstytų rodiklių pavadinimai, o viršutinėje jos dalyje - skiltyse išdėstytų rodiklių pavadinimai. Be to, kiekviena lentelė turi bendrą pavadinimą. Statistinės lentelės pagrindiniai elementai yra veiksnys ir tarinys. Lentelės veiksnys parodo, apie ką lentelėje kalbama, o tarinys - tai skaitmeniniai rodikliai, kurie apibūdina veiksnį.

Socialiniuose ekonominiuose tyrimuose naudojamos įvairios statistinių lentelių rūšys. Jos skiriasi savo sudėtingumu - skirtingais veiksnio ir tarinio išdėstymo būdais, jų santykiais ir t.t. Priklausomai nuo veiksnio sudėtingumo, skiriamos trys statistinių.leatelių-Fašys:

1. Paprastos;2. Grupinės;3. Kombinuotos.

Paprastomis vadinamos tokios statistinės lentelės, kurių veiksnys ne­sugrupuotas. Jame pateikiamas tik tam tikrų stebėjimo vienetų, teritorinių padalinių arba chronologinių datų sąrašas. Paprastos statistinės lentelės veiksnį gali sudaryti ir šių požymių junginys (teritorinės-chronologinės lentelės). Pvz., nedarbo lygis apskrityse atskirais metais.

GrupinėmisydL&mamos, tokios statistinės lentelės, kurių veiksnį sudaro stebėjimo vienetai sugrupuoti pagal vieną požymį. Pvz., bedarbių pasiskirstymas pagal amžių N metais.

Kombffiuutuim vadinamos" tokios statistinės lentelės, kurių veiksnį sudaro sugrupuoti stebėjimo vienetai pagal du ar daugiau požymių. Pvz: Bedarbiųpasiskirstymas pagal lytį ir amžių N metais.

Kombinuotos statistmės-te!rfėI^"EaIižei suteikia didesnes analitines galimybes, padeda išaiškinti reiškinių vystymosi ypatumus ir jų

40

Page 40: Statistika I Ona Gražytė-Molienė

priklausomybę. Kombinuotos statistinės lentelės projektą 1882 m. pateikė ir ją teoriškai pagrindė zemstvų statistikas A. Pr~Skkevičius. kuris laikomas frfflMhiniifttu statistinių lentelių pradininku Rusijoje. *"

Statistinių lentelių tarinys gali būti paprastas (tarinio rodikliai išdėstyti atskirai vienas nuo kito) ir kombinuotas (tarinio rodikliai susiję bendru turiniu). Pvz., gimusiųjų skaičius apskrityse N metais (pagal veiksnį kuriame nurodomos apskritys, ši lentelė yra paprastoji - teritorinė, tačiau, jei tarinyje bus pateikiamas gimusiųjų pasiskirstymas pagal gyvenamąją vietą ir lytį, jos tarinys bus kombinuotas).

Sudarant statistines lenteles, reikia laikytis tam tikrų reikalavimų:1) lentelė neturi būti gremėzdiška (geriau sudaryti kelias paprastesnes

tarpusavyje susijusiais lenteles);2) lentelė turi turėti bendrą pavadinimą, (atsakantį į klausimus: kas,

kur, kada?) ir numeri (jį priimta rašyti prieš pavadinimą, pvz., 1 lentelė. Respublikos namų ūkių vartojimo išlaidų struktūra 2002 metais, procentais);

3) je i lentelė sudaro tam tikro teksto, iš kurio aiškus jos turinys, organinę dali tokiu atveju jos pavadinimas gali būti praleistas',

4) je i kokio nors reiškinio tyrimui skiriama daug lentelių, jos numeruojamos loginės sekos tvarka, priskiriant jas atitinkamam darbo skyriui (pvz., 1.2 lentelė);

5) turi būti tiksliai ir aiškiai suformuluoti statistinės lentelės veiksnio eilučių ir jos tarinio skilčių pavadinimai ir nurodyti atitinkami matavimo vienetai'

6) jeigu statistinę lentelę tenka perkelti į kitą puslapi jos skiltis reikia numeruoti (veiksnį žymėti didžiosiomis abėcėlės raidėmis, o tarinio skiltis - skaitmenimis, pvz., A, 1, 2, 3);

7) jeigu santykinis rodiklis, išreikštas procentais, yra didelis skaičius, tikslinga j į išreikšti kartais (pvz., jei prekių apyvartos indeksas - 250 %, tikslinga rašyti 2,5 karto);

8) pildant ir skaitant statistinę lentelę, reikia laikytis tokių sutartiniųženkite.

- - konkretaus reiškinio nėra;... - nėra duomenų apie konkretų reiškinį;0,0 - skaitmeninės reikšmės mažesnės nei pasirinktas tikslumas

lentelėje;( ) - nepakankamas statistinio vertinimo tikslumas;

/ - duomenys neskelbiami, nes parametro įverčio paklaida viršija leistiną dydį;

• - duomenys konfidencialūs (neskelbiami);X - nereikia pildyti eilutės (tokie rodikliai neskaičiuojami);

9) po lentele turi būti išnaša, kurioje nurodomi duomenų šaltiniai Ubartais pateikiami kai kurie paaiškinimai, pvz., dėl rodiklių skaičiavimo arba № Palyginamumo).

41

Page 41: Statistika I Ona Gražytė-Molienė

Būtina sugebėti ne tik teisingai sudaryti statistines lenteles, bet ir jas skaityti bei analizuoti. Statistinės lentelės analizė paprastai pradedama bendrųjų ir grupinių rezultatų aptarimu ir tik po to analizuojami atitinkami (išskirtiniai savo dydžiu ar savybėmis) eilučių ir skilčių rodikliai.

UŽDUOTIS. Iš Statistikos departamento statistinių leidinių p a r i n k - t i statistinių lentelių (paprastos, grupinės ir kombinuotos) pavyzdžių.

4. KONTROLINIAI KLAUSIMAI

1. Ką vadiname statistiniu grupavimu?2. Kokie yra grupavimų uždaviniai ir rūšys?3. Ką vadiname klasifikacija?4. Kokie yra statistinio grupavimo etapai?5. Kaip nustatyti lygių intervalų plotį?6. Kaip sudaryti grupes jungiamuoju ir skiriamuoju būdais?7. Kokia grupavimo Galiono metodu ėmė?8. Ką vadiname pasiskirstymo eilutėmis? Kokios jų rūšys?9. Ką vaizduoja histograma, dažnių daugiakampis ir kumuliatė? Kaip

šie grafikai brėžiami?10. Kada ir kaip atlikti antrinį grupavimą?11. Kas yra statistinės lentelės? Kokios jų rūšys?12. Kokios statistinių lentelių sudarymo taisyklės?13. Kokios matavimo skalės dažniausiai taikomos? Kokia jų paskirtis?14. Nustatyti, kokiai matavimo skalei priklauso kiekvienas požymis:

- tarpmiestinių skambučių skaičius per mėnesį,- vaikų skaičius šeimoje,- tautybė, // ;• i -- mokslinis laipsnis,-svoris, ■ ‘- kalendorinis laikas (nuo Kristaus gimimo, nuo Romos įkūrimo),1 ^- nedarbo trukmė,- asmens kodas,- gyvenimo sąlygos (labai geros, geros, vidutinės, blogos, labai

blogos),-atlyginimas. yi

42

Page 42: Statistika I Ona Gražytė-Molienė

5. STATISTIKOS RODIKLIAI

R E K S 1 E N S Y V 1 K J 1 I N T E N S Y V I E J I f"~U ( A b s o l i u t ū s ) ( S a n t y k i n i a i ) L

S m i č i a u sgfekio)

A p i m t i e s L l L y g i n i a in .

D a l i n i a i

produkcijos (prekių) tiekto;darbuotojų skaičius;pasitfuplotasirt.№

produkcijos vertė; prekių apyvarta; darbo užmokesčio

lėšos; i bendrasis derlius.

r r

* ABSOLIUTŪS DYDŽIAI gali būti iSreiSkiami:

tKti&riniais, natūriniais sąlyginiais, vertuliais, darbo laiko mato vienetais

* SANTYKINIAI DYDŽIAI gali būti

fyęficientais, procentais, promilėmis, P*°decimilėmis, kartais jie yra vardinio ^Pfotens (pvz., gyventojų tankumas).

S t r u k t ū r o s

" " • D in a m ik o s

K o o r d i n a c i j os

I n t e n s y v u m o

(Ekonominio išsivystymo)

Page 43: Statistika I Ona Gražytė-Molienė

SANTYKINIAI DYDŽIAI

■ Struktūros - parodo dalies santykį su visuma, pvz., bedarbių moterų dalį bendrame bedarbių skaičiuje',

■ Dinamikos (grandininiai ir baziniai) - parodo rodiklio kitimą, palyginti su kintama ar pastovia baze;

■ Koordinacijos - parodo atskirų dalių tarpusavio santykį, pvz., vyrų ir moterų skaičiaus; eksporto ir importo',

■ Intensyvumo - parodo reiškinio paplitimo laipsnį, pvz., gimusiųjų skaičių 1000 gyventojų,

iš jų - ekonominio išsivystymo, pvz., BVP1 gyventojui',■ Palyginimo - parodo tų pačių rodiklių, priklausančių

skirtingiems objektams, kiekybinį santykį, pvz., kiek kartų arba procentų vienos valstybės plotas didesnis negu kitos;

■ Plano arba sutartinių įsipareigojimų įvykdymo - parodo, kiek procentų įvykdytas, pvz., tiekimo planas).

1 UŽDUOTIS. Iš naujausių statistikos rinkinių parinkite konkrečių santykinių dydžių pavyzdžių, priskirtinų visoms jų rūšims.

Struktūros, dinamikos ir palyginimo santykinius dydžius pavaizduokite grafiškai.

7. UŽDUOTIS. Žinomi tokie oficialiosios statistikos duomenys apie gyventojų skaičių Lietuvoje metų pradžioje, tūkstančiais:

M e t a i Gyvento ų skaičiusMieste Kaime

1998 2525,2 1178,82000 2522,4 1176,12002 2326,2 1149,4

Pastaba: Lietuvos Respublikos teritorija - 65,3 tūkst. km2.

Apskaičiuokite s a n t y k i n i u s dydžius:a) struktūros (rezultatus pateikite statistinėje lentelėje);b) dinamikos',c) koordinacijos;d) intensyvumo.

Parašykite trumpas išvadas.

44

Page 44: Statistika I Ona Gražytė-Molienė

Pa s is k ir s t y m o c e n t r o c h a r a k t e r is t ik o s

J6.1. VIDURKIO ESMĖ. VIDURKIŲ RŪŠYS IR JIEMS KELIAMI I REIKALAVIMAI

tf Pirminių duomenų grupavimas ir jų pateikimas pasiskirstymo eilutėse ■Reikalauja tolimesnių apibendrinimų. Labiausiai paplitęs apibendrinimo būdas

vidurkių nustatymas.... ,:JiiU~‘XVTr.a. V. Petis nagrinėdamas ekonomines problemas plačiai

įįadojo vidurkiuš. .....* Vėliau juos plačiai taikė G. Kingas (XVII-XVIII a.), apskaičiuodamas

gyventojų vidutines pajamas. Tolesnis šio metodo vystymas ių autorių darbuose: P. Laplaso (XVIII-XIX a.), A. Ketle (XIX a.) i žmogaus teorija, V Leksiso (XIX-XX a.) - laikinų vidurkių teorija, A. Bouli (XIX-XX a.) - efektyvių vidurkių teorija, A.

X-XX a.) - atrankinių ir patikimų vidurkių teorija, Dž. Julo (XIX- Milso (XX a.) ir kt.mimo praktikoje vidurkiai kartais nustatomi „iš akies“, remiantis patyrimu ir ribotu stebėjimų skaičiumi. Statistinis vidurkis

ūdų, būtinai iš kokybiškai vienarūšės visumos,i u r k i s - tai apibendrinantis kiekybinis rodiklis, išreiškiantis reiškinių tipišką lygi (pvz., vidutinis darbo užmokestis, vidutinis s, vidutinis pajamų lygis ir pan.).iant didžiųjų skaičių dėsniui, atsitiktiniai individualių požymio uokrypiai tarpusavyje pasinaikina ir vidurkiai atspindi tai, kasi visumai.itinėje analizėje tikslinga išskirti grupinius ir bendruosius pvz., pagal atrankinius NŪBT duomenil apškaičiuojamas "visų

_ vidutinis vartojimo išlaidų lygis - bendrasis vidurkis, taip pat - attfcrų namų ūkių grupių (miesto ir kaimo, decilinių grupių ir pan.) vartojimo

grupiniai vidurkiai.

įpičiuojamas iš masinių duomenų, gautų ištisinio arba atrankinio

tW£ Žinomi įvairių rūšių vidurkiai: aritmetinis, harmoninis, &^fhetrinis, kvadratinis, antiharmoninis. Matematinė statistika įvairius

ius išveda iš laipsninio vidurkio: (6.1)

(6.2)

Page 45: Statistika I Ona Gražytė-Molienė

I

Kai k = O - geometrini vidurkį (po tam tikro pertvarkymo) (6.3)

xg=»ftū:.

Kai k = 2 - kvadratinį vidurkį (6.4)

Kai k = -1 - harmoninį vidurkį (6.5)n

Šie laipsniniai vidurkiai, apskaičiuoti iš tų pačių duomenų, skiriasi savo dydžiu ir sudaro tokią vidurkių ūgio eilutę, vadinamą vidurkių m a ž o r ą.a -

^_t£-(pranc. majorer - didėti):Xh< x g < x 3< x ą < x ah. (6 .6)

Kaip matome, aritmetinį vidurkį galima laikyti vidurkių vidurkiu.Beje, matematiniai vidurkiai skaičiuotini tais atvejais, kai dydžių

skirtumai yra didesni, o dažniai svertiniams vidurkiams skaičiuoti nežinomi.Taikant vidurkių teoriją praktikoje, svarbią reikšmę turi Dž. Julo (anglų

statistikos mokyklos įkūrėjo K. Pirsono mokinio) knyga įvadas į statistikos teoriją” (pirmąkart išleista 1911 m.), sulaukusi daugybės leidimų, kurioje, be kita ko, suformuluoti vidurkiams tokie pagrindiniai vidurkių reikalavimai:

- vidurkio apskaičiavimas turi būti griežtai apibrėžtas ir nesiremti tik subjektyviu vertinimu;

- vidurkis turi būti paremtas visęis stebėjimo vienetais;- pageidautina, kad vidurkis pasižymėtų aiškiomis savybėmis, kurios

leistų suvokti jo prasmę;- pageidautina, kad be kitų savybių, vidurkį galima būtų lengvai ir

greitai apskaičiuoti;- pageidautina, kad vidurkio dydis kuo mažiau priklausytų nuo

atsitiktinių požymio reikšmių svyravimų;- ypač svarbi sąlyga - galimybė su pasirinktu vidurkiu atlikti įvairius

algebrinius veiksmus (pvz., iš grupinių vidurkių apskaičiuoti bendrąjį vidurkį).

Pažymėtina, kad beveik visus šiuos reikalavimus tenkina aritmetinisvidurkis.

46

Page 46: Statistika I Ona Gražytė-Molienė

6.2. ARITMETINIS VIDURKIS IR JO SAVYBĖS

Analizuojant pasiskirstymo eilutes, iš konkrečių empirinių duomenų apskaičiuojamas aritmetinis statistinis vidurkis. Galimos dvi jo formos: paprastas ir svertinis. p a p r astas aritmetinis vidurkis skaičiuojamas iš pirminių (nesugrupuotų) duomenų:

Iš pasiskirstymo variacinių eilučių dažniausiai skaičiuojamas svertinis aritmetinis vidurkis, kurio formulė tokia (x a): (6.7)

f - =J M j

. cČia Xj - požymte-~i£ikšnles (konkrečios reikšmės diskretinėje variacinėje eilutėje arba intervalų centrai intervalinėje variacinėje eilutėje);

fj - variacinės eilutės dažniai.Skaičiuojant aritmetinį vidurkį iš intervalinės variacinės eilutės, jis

gaunamas mažiau tikslus, nes visos intervalo reikšmės pakeičiamos viena - intervalo centru, t. y. grupuojant visada prarandama tam tikra dalis informacijos. Paklaidos dydis priklauso nuo intervalo dydžio (mažesnis intervalas - mažesnė paklaida), lygūs ar nelygūs, apibrėžti ar neapibrėžti intervalai.Tais atvejais, kai pirmas ir paskutinis intervalai neapibrėžti, ir apie juos nėra jokios papildomos informacijos, apskaičiuotas aritmetinis vidurkis bus tik apytikslė pasiskirstymo padėties charakteristika.

Aritmetiniam vidurkiui būdingos savybės, kurių žinojimas ir praktinis pritaikymas palengvina jo apskaičiavimą (ypač iš intervalinės variacinėseilutęs sulygiaisiftteFvalais):—----------------- —/ Pagrindinės aritmetinio vidurkio savybės:

/ 1. Požymio reikšmių nuokrypių nuo aritmetinio vidurkio suma lygi 0:l E(xs - x a) = 0. (6.8)) (Ši savybė taikoma vidurkio apskaičiavimo teisingumui patikrinti).

2. Visus variantus (x;) padidinus arba sumažinus d kartų vidurkis taip pat padidėja arba sumažėja d kartų (galima skaičiuoti vidurkį iš variantų X; / d, tačiau gautąjį vidurkį padauginti iš d).

3. Visus variantus (xj) padidinus arba sumažinus pastoviu dydžiu A, vidurkis padidėja arba sumažėja tuo pačiu dydžiu A (galima skaičiuoti vidurkį iš variantų Xį - A, o gautąjį vidurkį padidinti A dydžiu).

. 4. Visus dažnius (fį) padidinus arba sumažinus k kartų vidurkis nesikeičia.

Page 47: Statistika I Ona Gražytė-Molienė

5. Vidurkio dydis priklauso ne nuo dažnių absoliutinių reikšmių, o nuo jų proporcijų tarp jų (vadinasi, dažniai gali būti pakeisti atitinkamais svorio koeficientais).

Pasinaudojus aritmetinio vidurkio savybėmis, jį galima apskaičiuoti momento būdų;__ (6.9)

Čia M'i - pirmos eilės sąlyginis momentas, kuris skaičiuojamas tokia formule: (6.10)

SA - vidurinysis arba su didžiausiu dažniu intervalinės eilutės variantas;d - intervalo plotis, jei intervalai lygūs.Pažymėtina, jog svertinis aritmetinis vidurkis yra ne tik racionalesnė

vidurkio užrašymo forma, bet ir lengvai interpretuojamas dydis. Pvz., skaičiuojant vidutinį darbo užmokestį (xa), formulės skaitiklis fį - darbo užmokesčio fondas, o vardiklis £fj - vidutinis darbuotojų skaičius. Taigi turint šiuos tarpusavyje susijusius dydžius, galima rasti ir nežinomąjį.

Skaičiuojant aritmetinį vidurkį dviem etapais, galima nustatyti progresinį ir regresinį vidurkius, įtraukiant tik didesnes arba tik mažesnes už aritmetinį vidurkį reikšmes (pvz., tiriant visuomenės socialinį susiskaidymą, tikslinga skaičiuoti progresinį ir regresinį vartojimo išlaidų vidurkius).

I ^^ 6.3. HARMONINIS VIDURKIS) l~

Harmoninis vidurkis yra atvirkščias aritmetiniam vidurkiui, kuris apskaičiuojamas iš atvirkštinių dydžių. Taikomas paprastas ir svertinis

harmoninis vidurkis: - - (6.11)

' = = t -s . X v » . /

Čia Mį = X; fįHarmoninis vidurkis taikomas vietoje aritmetinio tada, kai nežinoim

individualių požymio reikšmių dažniai (fp^o žinoma sandauga x; f, = M į. ^Pavyzdys. Du mokiniai nuvažiavo tą patį atstumą (S = 60 km); vieno

greitis - 30 km/val., kito - 20 km/val. Koks abiejų mokinių vidutinis greitis?Iš fizikos žinome, kad S = v t, todėl v = S / 1. Kadangi laikas (t), t. y.

dažnis nežinomas, reikia taikyti harmoninį vidurkį:

48

Page 48: Statistika I Ona Gražytė-Molienė

Vadinasi, vidutinis greitis yra 24 km/val., o ne 25 km/val., ką neteisingai nustatytume, skaičiuodami paprastą aritmetinį vidurkį (30+20)/2.

Priklausomai nuo žinomų duomenų harmoninį vidurkį reiktų taikyti skaičiuojaiĮt: _______________— - -----------------

a) vidutinį darbo užmokestį, kai žinomas atskirų darbuotojų arba jų grupių darbo užmokesčio fondas (M;) ir jų darbo užmokestis (Xj), o darbuotojų skaičius (f;) nežinomas;

b) vidutinį derlingumą, kai žinomas bendrasis derlius (M į) ir atskirų kultūrų derlingumas (x;), o pasėlių plotai (f,) nežinomi;

c) vidutinę savikainą, kai žinomas tos pačios produkcijos savikainos lygis (xj) atskirose įmonėse ir šios produkcijos gamybos sąnaudos (M į), o gaminių skaičius (fj) nežinomas;

d) vidutinę akcijų kainą, kai žinoma kiekvieno pirkimo akcijų kaina (Xį) ir joms įsigyti išleista pinigų suma (M į), o įsigytų akcijų skaičius (fį) nežinomas.

6.4. MODA IR STRUKTŪRINIAI VIDURKIAI

Moda - tai dažniausiai pasikartojanti požymio reikšmė tiriamoje visumoje (populiacijoje ar imtyje). Diskretinėje variacinėje. eilutei e moda yra konkreti požymio reikšmė, turinti didžiausią dažnį, p_\iz_r4aodalusis avalynės numeris, modalioji prekės kaina ir pan. Jei du ar daugiauvariacinės eilutės vĖriaatai'-tui^Vienodus didžiąųsius dažnius, toks skkstinys vadinamas bimodaliuojų.

— Bkaičiuojant modą iš intervalinės variacinės eilutės, pirmiausiai nustatomas modalusis intervalas. Čia galimi du atvejai:

1) kai intervalai lygūs - pagal didžiausią dažnį (f,) ir2) kai intervalai nelygūs - pagal didžiausią tankį (h; = f;/d į).Pirmuoju atveju moda Mo skaičiuojama pagal tokią formulę: (6.12)

f - fM o=xn +d 7--------\—-r-------s,° ( / j - / , ) + ( £ - / 3)

kur x0 - apatinė modaliojo intervalo riba (rėžis); d - modaliojo intervalo plotis; f 2 - modaliojo intervalo dažnis; f 1 - priešmodaliojo intervalo dažnis; f 3 - pomodaliojo intervalo dažnis.

*Jeigu duotoje pasiskirstymo eilutėje f = f 3, modai apskaičiuoti formulė nereikalinga, nes tokiu atveju moda lygi modaliojo intervalo centrui (xj).

Page 49: Statistika I Ona Gražytė-Molienė

Kai intervalai nelygus, moda apskaičiuojama pagal tokią formulę(Mo):

Modą taip pat galima nustatyti iš grafiko - histogramos (žr. 1 pav.).Kai analizuojant duotą pasiskirstymo variacinę eilutę nustatoma, kad

aritmetinis vidurkis artimas modai, laikoma, kad šis vidurkis tipiškas.Mediana - požymio reikšmė, esanti ūgio eilutės viduryje, t. y. šią eilutę

dalijanti į dvi lygias 3anš'. Jer vmaCiilĖj5~Tlgi©--«!Iutėje narių (variantų) skaičius nelyginis, mediana yra vidurinioji konkreti požymio reikšmė', jos eilės numeris nustatomas taip: (N+l)/2, o jei lyginis - ji apskaičiuojama kaip dviejų viduriniųjų požymio reikšmių aritmetinis vidurkis.Pavyzdys. Turime duomenis apie kelių studentų praleistas paskaitas:

a) 3 0 4 3 2. Čia nesutvarkyti duomenys (Mo=3; X a=2,4); medianai nustatyti reikia sudaryti ūgio eilutę: 0 2 3 3 4. Kadangi požymio reikšmių skaičius nelyginis, tai Me = 3;

b) 2 2 3 3 4 4. 4-, 5. čia jau duota ūgio eilutė, tačiau požymio reikšmių skaičius lyginis, todėl K5e= (3+4)/2j^ 3,5 (Mo = 4, Xa=3,375).

Norint apskaičiuoti m edianąiŠ intervalinės variacinės eilutės, pirmiausia reikia pagal sukauptus dažnius nustatyti medianinį intervalą, t. y. tą intervalą, kuriame fį' > £ fį/2 .

Jeigu medianinio intervalo sukaupti dažniai (fį') lygūs pusei visų dažnių sumos, medianai apskaičiuoti formulė nereikalinga, j i lygi medianinio intervalo viršutinei ribai (rėžiuij.

Kitais atvejais, mediana skaičiuojama pagal tokią formulę (Me): (6.14)

kur x0 - apatinė medianinio intervalo riba (rėžis); d - medianinio intervalo plotis; fm - medianinio intervalo dažnis;Sm_i - dažnių suma iki medianinio intervalo.

Kaip interpretuoti mediancp. Jei, pvz., tiriant darbo užmokesčio diferenciaciją nustatyta, kad mediana lygi 800 Lt, tai reiškia, kad pusė tiriamųjų darbuotojų gauna ne daugiau kaip 800 Lt, o kita pusė - ne mažiau kaip 800 Lt (praktikoje interpretuojama dar paprasčiau: pusės darbuotojų atlyginimas mažesnis negu 800 Lt, o kitos pusės - didesnis negu 800 Lt).

Jei mediana ūgio eilutę pagal dažnių sumą dalija į dvi lygias dalis, tai kvartiliai - į keturias, o deciliai - į dešimt lygių dalių. Visi šie vidurkiai

Page 50: Statistika I Ona Gražytė-Molienė

vadinami struktūriniais vidurkiais ir apskaičiuojami pagal analogiškas formules:

Struktūrinius vidurkius galimą nustatyti ir pagal T a l i o teoremą, sustatant atitinkamą proporciją. Be to, struktūriniai vidurkiai gali būti nustatomi iš grafiko - sukauptų dažnių laužtis (žr. 2 pav.).

Kai pirminiai duomenys pagal tiriamąjį požymį suskirstyti į decilines grupes G alioną metodu, t. y. kai žinomi deciliai, atitinkamus kvartilius galima nustatyti tokiu būdu:

Skaičiuojant modą ir visus struktūrinius vidurkius iš intervalinės variacinės eilutes s u darvtos^sJdriamuoju būdu, pirmiausia reikia nustatyti rėžius, o tada taikyti atitinkamas formules.

(6.15)(6.16)

Q2 =M e (6.17)(6.18) (6.19)

X / - - V 1

f D1

D5 = Me. (6.20)

Q, = ‘/2 (D2+D3); Q2 = D5 = Me; Q3 = '/a (D7+D8).

(6.21)(6.22)(6.23)

51

Page 51: Statistika I Ona Gražytė-Molienė

6.5. VIDURKIŲ PRANAŠUMAI IR TRŪKUMAI; JŲ TENKINAMI KRITERIJAI

Kaip jau buvo minėta, aritmetinis vidurkis tenkina beveik visus vidurkiams keliamus reikalavimus. Pvz., „lengva suvokti jo prasmę“. Jei 10 darbininkų išmokėta 9800 Lt atlyginimo, tai vidutinis vieno darbininko darbo, užmokestis sudarys 980 Lt. Tuo atveju, kai žinomas vidutinis darbo užmokestis ir darbininkų, skaičius, jų sandauga parodys bendrą darbo užmokesčio fondą. Medianą padauginę iš darbuotojų skaičiaus, darbo užmokesčio fondo negausime (išskyrus tą atvejį, kai Me =Xa). Be to, mediana, apskaičiuota iš lyginio narių skaičiaus diskretinėje variacinėje eilutėje kaip dviejų vidurinių požymio reikšmių aritmetinis vidurkis, ne visiškai atitinka medianos apibrėžimą.

Nepatartina skaičiuoti medianos iš tokios pasiskirstymo eilutės, kai stebėjimo vienetų skaičius nedidelis ir kai kurios jų reikšmės vienodos, pvz., 5 6 6 6 6 9 10. Šiuo atveju Me = 6, tačiau jos interpretacija netiksli.

Mediana netenkina ir kitos sąlygos - su ja negali būti atliekami algebriniai veiksmai. Be to, Me mažiau patikima negu Xa statistinėms išvadoms gauti.

Vis dėlto kai kuriais atvejais mediana pranašesnė už aritmetinį vidurkį:a) ją nesunku apskaičiuoti, pvz., nebūtina tiksliai nustatyti kiekvieno

respondento ūgį, o išrikiavus juos - tik viduriniojo;b) ji tiksliau atspindi visumą kai intervalai neapibrėžti;c) jai mažesnę įtaką turi ypač didelės ar mažos požymio reikšmės (Me

jautri prieš ją ar po jos esančių reikšmių skaičiui, o ne jų skaitiniams dydžiams), todėl ji mažiau priklauso nuo atsitiktinių požymio reikšmių svyravimų. Taigi, mediana yra aritmetinio vidurkio alternatyva, kai skirstinys yra labai asimetriškas.

Moda (Mo) yra paprasčiausias £ir vienintelis - kokybinių duomenų) centrinės tendencijos matas. Ją galima apskaičiuoti-,iai skirstinyje yra atvirų (neapibrėžtų) intervalų. Jai nedaro įtakos ekstremalios reikšmės, tačiau ji pernelyg paveikiama „populiarios” grupės, kai skirstinys yra labai asimetriškas. Kartais moda neegzistuoja (kai pasiskirstymo eilutėje visų stebėjimo vienetų požymio reikšmės skirtingos).

Kokius matematinius kriterijus tenkina Me ir Mo, nesunku įsitikinti iš tokio pavyzdžio:Penki studentai per vasaros atostogas perskaitė knygų:

0 1 4 5 5.Šios eilutės centro charakteristikos tokios:

Xa = 3; Me = 4; Mo = 5.-~Nustatome individualių požymio reikšmių (X;) nuokrypių nuo šių

vidurkių modulius ir šių nuokrypių kvadratus:

52

Page 52: Statistika I Ona Gražytė-Molienė

Xi |X i- x j Xj - M e |xj - M o ( X i Xa)2 (xį -M e)2 (Xj-Mo)20 3 4 5 9 16 251 2 3 4 4 9^ 164 1 0 1 1 0 15 2 1 0 4 1 05 2 1 0 4 1 0E 10 9 10 22 27 42

^ N e = 5 Ne = 4 N e = 3 Šie skaičiavimai patvirtina 3 matematinius kriterijus, kuriuos

tenkina aritmetinis vidurkis, moda ir mediana:1) Ne = mirt, t. y. paklaidų (e) skaičiaus minimizavimo kriterijų tenkina

moda (Ne = 3);2) Ee = min, t. y. paklaidų dydžio minimizavimo kriterijų tenkina

mediana (Ee = 9);3) Ee2 = min, t. y. paklaidų kvadratų sumos minimizavimo kriterijų

tenkina aritmetinis vidurkis (Ee2 = 22).Remiantis šiais kriterijais galima daryti išvadą, jog papildžius duotą

ūgio eilutę didesnėmis požymio reikšmėmis, tai labiausiai veiks X a, mažiau - Me ir nedarys įtakos Mo (pvz., 0 1 4 5 5 8 19, iš šios ūgio eilutės nustatome, kad X a = 6, Me = 5 , o Mo = 5, t. y. nepasikeitė).

K. Pirsonas empiriškai nustatė, kad esant vidutinei skirstinio asimetrijai |Mo - X a| = 3 | Me - X a|. (6.24)

Išvada. Kai pasiskirstymo eilutėje yra ekstremalių reikšmių, vietoje aritmetinio vidurkio ir modos centrinės tendencijos matu galima panaudoti rftedianą. Projektuojant masinio aptarnavimo punktų (degalinių, taksofonų ir pan.) išdėstymą, pasinaudojama medianos matematine savybe E |X; - Me| = = min.

'6. KONTROLINIAI KLAUSIMAI I f

1. Kas yra vidurkiai! Kokios jų rūšys? J2. Kokie reikalavimai keliami vidurkiams?

?3) Kaip skaičiuojamas ir /kada taikomas paprastas ir svertinis aritmetinis vidurkis! - fi-O-t f s a ,y/?; > * "v'''r

4. Kaip skaičiuojamas ir kada taikomas paprastas ir svertinis harmoninis vidurkis?

5. Kas yra moda? Kaip ji skaičiuojama iš diskretinės ir intervalinės variacinės eilutės?

6. Kas yra mediana? Kaip ji skaičiuojama iš diskretinės ir intervalinės variacinės eilutės?

7. Kaip skaičiuojami ir ką rodo kvartiliai ir deciliai?8. Kokius matematinius kriterijus tenkina aritmetinis vidurkis, moda ir

mediana?

53

Page 53: Statistika I Ona Gražytė-Molienė

7. POŽYMIŲ SKLAIDOS TYRIMAS

7.1. SKLAIDOS ESMĖ IR JOS MATAI

Tiriant skirstinį, neužtenka žinoti vien tik jo padėties charakteristikų: vidurkio, modos, medianos. Galimi atvejai, kai dviejose ar didesniame to paties požymio pasiskirstymo eilučių kiekyje aritmetiniai vidurkiai visiškai sutampa, tačiau jos skiriasi šio požymio reikšmių išsibarstymu, t. y. sklaidos laipsniu. Todėl svarbus statistikos, uždavinys - išmatuoti individualių požymio reikšmnį sklaidą. Sklaidos matai turi paMušH"^5yg(3nš7”k5nos sulormuTuotoš vidurkiams. Tai reiškia, kad jie turi:

a) remtis visais stebėjimais;b) būti lengvai suprantami;c) lengvai apskaičiuojami;d) kiek galima mažiau priklausyti nuo atsitiktinių svyravimų;e) būti patogūs algebriniams veiksmams.Pats paprasčiausias absoliutus sklaidos rodiklis - sklaidos plotis, kuris

skaičiuojamas kaip maksimalios ir minimalios požymio re!S§Knų skirtumasR X Tnay X rnin(kai duomenys nesugrupuoti) arba paskutinio intervalo aukštutinio

rėžio ir pirmojo intervalo žemutinio rėžio skirtumas (kai grupės sudarytos skiriamuoju metodu apibrėžtais intervalais). Jeigu nors vienas grupės intervalas neapibrėžtas, sklaidos plotis neskaičiuojamas. Sklaidos plotis yra pats grubiausias sklaidos įvertinimas, nes visiškai priklauso tik nuo kraštinių (neretai ir atsitiktinių) skirstinio reikšmių.

Toks sklaidos matas naudojamas kainų analizei, gamybos statistinei kontrolei ir kitais atvejais.Tačiau praktikoje jis dažniau naudojamas nustatant lygius intervalus bei kituose skaičiavimuose.

Kartais skaičiuojamas kvartilinis plotis (Q3 - Qi) (7.2)ir pusiau kvartilinis (Qj - Qi) / 2. (7.3)

Esant simetriniam skirstiniui galima tokia lygybė:M e-Q = Q! (7.4)Me + Q = Q3 (7.5)Me ± Q apjungia tik 50 proc. visų duoto skirstinio požymio

reikšmių.Q lengvai apskaičiuojamas, aiški prasmė, tačiau su juo neatliekami algebriniai veiksmai, sunku numatyti jo pakitimus dėl atsitiktinių svyravimų, todėl taikomas rečiau.

. Kitas absoljutus_.-Skiaidos matas,- --vidutinis tiesinis nuokrypis, kuris apskaičiuojamas, kaip individualių požymio reikšmių absoliutinių nuokrypių nuo vidurkio aritmetinis vidurkis. Šio sklaidos rodiklio trūkumas -

54

Page 54: Statistika I Ona Gražytė-Molienė

sižvelgiama į nuokrypo ženklą. Iš nesugrupuotų duomenų skaičiuojamas sta (nesvertine) forma, o iš sugrupuotų duomenų - svertine forma:

(7.6)(7.7)

d = I hN

- x h - xV>d ' X / ,

Pastaba. Vidutinis nuokrypis įgauna mažiausią reikšmę, kai šis nuokrypis matuojamas nuo medianos.

—,į; Nors šis rodiklis labiau apibrėžtas negu sklaidos plotis (atsižvelgiama į visas požymio reikšmes), tačiau jis nenustato nuokrypių krypties, todėl praktikoje taikomas retai.

Svarbus absoliutus sklaidos rodiklis yra dispersija, t. y. individualių požymio reikšmių nuokrypių nuo vidurkio kvadratų vidurkis (cr).

Iš nesugrupuotų duomenų dispersija skaičiuojama paprasta (nesvertine) forma, iš sugrupuotų duomenų - svertine forma: (7.8)

' — -.......(7-9)

_ x į _ i A X ( vN

i Čia Xį - kiekvieno intervalo vidurinioji reikšmė, kuri tik apytikriai atspindi visų to intervalo reikšmių tipišką dydį (tiksliau - tik simetriniame skustinyje ir esant ne stambesniam kaip 1/20 R intervalui).

šepardas įrodė, kad:,, Jeigu a) skirstinys tolygusis ir b) dažniai abiem kryptim artėja prie 0

(kreivė varpo formos) - tai į dispersiją, gautą iš sugrupuotų duomenų, tikslinga įnešti pataisą- atimti 1/12 grupinio intervalo kvadrato: (7.10)

* t 2 d2„ r Oy = G -------------

* 12

Z, . stebėjimo vienetų skaičius nedidelis arba grupių intervalai ■ĮBlbesni nei 1/20 R - tokia pataisa nebūtina.

.Dispersijai būdingos kai kurios .savybės, kurių žinojimas ir praktinis kynH5 "pateRgvHKr^r sklaidos rodiklio apskaičiavimą (ypač iš lygių valų variacinės eilutės).

Pagrindinės dispersijos savybės tokios:1- Pastovaus dydžio (vienodų reikšmių) dispersija lygi 0, t. y. a2c= 0.2. Visas požymio reikšmes padidinus ar sumažinus pastoviu dydžiu A,

“sįja nesikeičia:

55

Page 55: Statistika I Ona Gražytė-Molienė

3. Visas požymio reikšmes padidinus ar sumažinus d kartų, dispersija padidėja arba sumažėja d kvadratu.

2 j 2 _ _2(7 x / d ' ( * — O x

4. Visus dažnius padidinus ar sumažinus k kartų, dispersija nesikeičia.5. Požymio dispersija (cj2x) yra mažesnė už požymio reikšmių

nuokrypių nuo pastovaus dydžio A kvadratų vidurkį skirtumo tarp aritmetinio

Dispersija tenkina reikalavimus, kurie keliami sklaidos rodikliams. Pvz., su ja lengviau negu su kitais sklaidos rodikliais atlikti algebrinius veiksmus.

Jei skirstinį padalintume į dvi lygias dalis su vienodu stebėjimų skaičiumi, tai esant vienodiems jų vidurkiams viso skirstinio dispersija būtų

jei skirstinys padalintas į grupes su nevienodu stebėjimo vienetų skaičiumi ir nevienodais vidurkiais (vadinasi, ir nevienoda sklaida tose grupėse), apskaičiuojant bendrąją dispersiją tenka atsižvelgti į tai, kiek vidutiniškai grupiniai vidurkiai nukrypsta nuo bendrojo vidurkio ir kokie sklaidos rodikliai (o2) grupėse./■ Pagal dispersijų sudėties taisyklę, bendroji dispersija lygi tarpgrupinės dispersijos ir vidurkinės dispersijos sumai: (7.15)

vidurkio ir šio dydžio A kvadratu, t. y. (x a-A )2.Taikant 2-4 savybes, dispersiją galima apskaičiuoti momentų būdu:

c2 = d2(M2-M!2).Atitinkamai antros ir pirmos eilės sąlyginiai momentai:

(7.11)

(7.12)(7.13)

Čia A = x0 - vidurinis arba turintis didžiausią dažnį eilutės variantas (intervalo centras);

d - intervalo plotis, kai intervalai lygūs.Dažnai dispersija skaičiuojama tokia formule: (7.14)

lygi aritmetiniam grupinių dispersijų vidurkiui: o2 = 1 /2 (at2 + a22). Tačiau,

s2 . _2a — o +<7 .

56

Page 56: Statistika I Ona Gražytė-Molienė

Šia lygybe praktiškai pasinaudojama tada, kai tiriama visuma yra pagal du požymius į kokybiškai vienarūšes grupes, kurių

Jjčkvieną apibūdina atitinkamas rezultatinio požymio aritmetinis vidurkis(y,) ir atitinkama dispersija (ay ). Tada : (7.16)

a 2 y = 8 2y +cr2y<?y - bendroji dispersija', gali būti apskaičiuojama vienu iš nurodytų

būdų: (7.17)(7.18)

-0 ;, 2 ' L i y i - y f f

0 y = y - t y ) ; y= Y 'f,

Bendroji dispersija parodo rezultatinio požymio reikšmių sklaidą, priklausančią nuo visų sąlygų.

& y- tarpgrupinė dispersija; apskaičiuojama pagal tokią formulę:(7.19)

3iO y ----------^ ----------->2><

čia n j - grupių dažniai.

( Tarpgrupinė dispersija parodo rezultatinio požymio grupinių vidurkių sklmdį'kurią lemia faktorinis požymis.

Vidurkinė dispersija apskaičiuoj ama pagal tokią formulę: (7.20)

jT - h E lU iO y -------- ^ --------- .

2>,Vidurkinė dispersija parodo vidutinį sklaidos dydį grupėse, kurį lemia

visi veiksniai, išskyrus tą pagal kurį buvo atliktas grupavimas.Palyginus tarpgrupinę dispersiją su bendrąja dispersija, gaunamas

determinacijos koeficientas, kuris parodo, kurią rezultatinio požymio y sklaidos dalį lėmė faktorinis požymis x. Tai savotiškas priežastinio ryšio

Page 57: Statistika I Ona Gražytė-Molienė

Pavyzdys7.1 lentelė. Ddarbininkų grupavimo pagal darbo stažą ir valandinį

išdirbį rezultatai

STAŽASX

IŠDIRBISy fi Yi fi Vi fi

2 2 4 8Iki 5 metų 3 2 6 18

4 1 4 16X 5 14 422 2 4 8

5 ir > 3 5 15 454 8 32 128X 15 51 181xv 20 65 223

APSKAIČIUOTI:

1. Vidutinio valandinio išdirbio grupinius ir bendrąjį vidurkius.2. Valandinio išdirbio sklaidos rodiklius - grupinę ir bendrąją

dispersijas.3. Tarpgrupinę ir vidurkinę dispersijas (patikrinti dispersijų sudėties

taisyklę).4. Kokią dalį valandinio išdirbio sklaidos lėmė darbininko darbo

stažas?

SPRENDIMAS

1. Grupinius ir bendrąjį vidurkius skaičiuojame pagal svertinio aritmetinio vidurkio formulę (vietoje x imame y):

1/, ’

a) yt = 14/5 = 2,8; b) y2= 51 /15 = 3,4; c)'y. = 65/20 = 3,25;

2. Grupines ir bendrąją dispersijas skaičiuojame pagal tokią formulę:

o 2 y = y 2-$yf;

a21 = 42/5 - 2,8 2 = 0,56; o22 = 181/15 - 3,4 2 = 0,5067; o2y = 223/20- 3,25 2 = 0,5875;

58

Page 58: Statistika I Ona Gražytė-Molienė

3. Tarpgrupinė dispersija (82y) lygi:[(2,8 - 3,25) 2- 5 + (3,4 - 3,25)2- 15 ] / 20 = 0,0675.

Vidurkinė dispersija lygi:(0,56 • 5 + 0,5067 • 15) / 20 = 0,52.

Patikrinimas. Tarpgrupinė dispersija + vidurkinė dispersija = bendroji dispersija, t.y.

0,0675 + 0,52 = 0,5875, tiek pat, kiek ir pagal tiesioginį dispersijos apskaičiavimą.

4. Determinacijos koeficientas lygus: 82y / a2y = 0,0675/ 0,5875 => 0,1149, arba 11,5 %.

Tai reiškia, kad išdirbio sklaidą tik 11,5 % lėmė darbo stažas.

Dispersijos praktinė reikšmė:* ja pagrįsti kai kurie kiti svarbūs statistiniai rodikliai (sklaidos,

j|oreliacinio ryšio)', jžįk. * ji yra dispersinės analizės metodo pagrindas;

d ffiBL * įspėja dėl galimų per drąsių požymio reikšmių savybių ®M)ibendrinimo, remiantis tik vidurkiu, pvz., jei dispersijos skaitinė reikšmė p ||r a didelė, tai rodo, jog požymio reikšmės labai išsisklaidžiusios apie vidurkį

‘.ir jis nėra tipiškas dydis,

** Atkreiptinas dėmesys į alternatyvių požymių sklaidos išmatavimą. Ta vienetų dalis, kuri tam tikrą pfržymį ttrriV~žynSmap, o kuri jo neturi - q. Variantų skaitinės reikšmės atitinkamai išreiškiamos 1 ir 0. Tada p + q = 1, iš čia: p = 1 — q arba q = 1 - p.

Alternatyvaus požymio vidurkis lygus: (7.21)— 1 p + 0 qx„= ------------ = P-p + q

Alternatyvaus požymio dispersija lygi: (7.22)

Ą - p J P+{ *- pf g = q2p + p 1ęL=pq=p{l _ p y=- p+q p+q

Šios formulės taikomos indukcinėje statistikoje, įvertinant imties paklaidas. Didžiausia alternatyvių požymių dispersijos reikšmė - 0,25 - gaunama tada, kai p = q = 0,5.Pavyzdys. Studentų, gaunančių stipendiją skaičius yra 70, o jos negaunančių - 30 (iš viso 100 studentų). Šiuo atveju p = 70 / 100 = 0,7, o q = 0,3. Alternatyvaus požymio dispersija sudarys: 0,7 • 0,3 = 0,21.

Vienas iš dispersijos trūkumų - mato vienetai pakelti kvadratu, kas apsunkina jos interpretaciją. Tačiau dispersija panaudojama nustatant kitą

59

Page 59: Statistika I Ona Gražytė-Molienė

plačiai paplitusį sklaidos rodiklį - (kvadratinė šaknis iš dispersijos):

a‘ = ^ arba^ *2 ~ ’

Standartinis nuokrypis o yra išreiškiamas tais pačiais mato vienetais, kaip ir požymio reikšmės ir parodo tų reikšmių nuokrypio nuo vidurkio vidutinį lygį. Standartinis nuokrypis leidžia su tam tikra (pasirinkta) tikimybe spręsti apie duoto skirstinio artumą normaliajam skirstiniui. Pvz., jegu X ± 2o ribose telpa ne mažiau kaip 95,4 proc. visų visumos vienetų, tai su praktikoje pakankama tikimybe 0,954 galima tvirtinti, kad tai yra normalusis skirstinys. Beje, skirstinių, kurie yra apytikriai „normalūs”, standartinis nuokrypis turi sudaryti —1/6 sklaidos pločio R.

Standartinio nuokrypio trūkumai:a) standartinio nuokrypio skaitinę reikšmę gali iškreipti kelios

santykinai ekstremalios reikšmės, todėl jis, kaip ir aritmetinis vidurkis, gali prarasti savo atspindimąją savybę labai asimetriškuose skirstiniuose;

b) kai nėra papildomos informacijos, jį netikslinga skaičiuoti iš atviro skirstinio.

standartinį (vidutinį kvadratinį) nuokrypį o- (7.23)

(7.24)

* Kai kintamasis x pakeičiamas standartizuotu z (tai daroma atliekant daugiamačius grupavimus), kuris nustatomas pagal formulę:

zi=(xi-Xa)/ox), (7.25)standartizuoto (normalizuoto) dydžio z; vidurkis lygus 0, o dispersija - 1.

* Natūraliųjų skaičių eilutės (1,2, 3,4, ... n) aritmetinis vidurkis lygus (n+l)/2, (7.26)o dispersija -1 /1 2(n2- 1). (7.27)

UŽDUOTIS. Teiginį įrodyti konkrečiais skaičiais.

Be aptartų vardinių ir bevardžių absoliučių sklaidos matų, dažnai naudojami santykiniai sklaidos rodikliai. Dauguma iš jų apskaičiuojami absoliučius sklaidos rodiklius lyginant su aritmetiniu vidurkiu.

Osciliacijos koeficientas apskaičiuojamas kaip sklaidos pločio ir (/ aritmetinio vidurkio santykis: (7.28)[ Vr= R / xa’100.i Tiesinis sklaidos koeficientas apskaičiuojamas kaip vidutinio tiesinio' nuokrypio santykis su aritmetiniu vidurkiu: (7.29)

Vd= d / x a-100.

60

Page 60: Statistika I Ona Gražytė-Molienė

Variacijos koeficientas apskaičiuojamas kaip standartinio nuokrypio ir tinio vidurkio santykis: (7.30)

Va= o /* a 100.Tai labiausiai paplitęs santykinis sklaidos rodiklis, kurį priimta vertinti

yai variacijos koeficientas yra iki 10 proc. - sklaida maža,10-20 proc. - sklaida vidutinė;20—30 proc. - sklaida didelė;30-50 proc. - sklaida labai didelė.

Kai V > 50 proc., manoma, kad variacijos koeficientas realios prasmės jau neturi.

Variacijos koeficiento privalumai:* nepriklauso nuo požymio matavimo vienetų;* leidžia įvertinti tiriamos visumos vienarūšiškumo laipsnį;* leidžia išaiškinti poveikio tiriamajam reiškiniui galimybes, jo

gerinimo rezervus (mažas variacijos koeficientas rodo, kad tiriamas reiškinys yia daugiau ar mažiau susiformavęs ir todėl sunkiai pasiduodantis poveikiui, t y. reguliavimui).■ Variacijos koeficientas taip pat turi trūkumą - jo negalima naudoti

sklaidai įvertinti tais atvejais, kai:. * požymis turi ir teigiamų, ir neigiamų reikšmių, arba kai jo vidurkis

požymio vidurkis, palyginti su standartiniu nuokrypiu, labai mažas įgauti kiek norima mažai besiskiriantį nuo 0 dydį.

• .Kai aritmetinis vidurkis nežinomas arba jo tikslumas abejotinas, gali

Шčiuojami kvartiliniai variacijos (sklaidos) koeficientai. Iš pastarųjų rodiklių tiksliai nustatyti sklaidos laipsnį neįmanoma, nes skirtumas apima tik 50 proc. visų požymio reikšmių, tad ir spręsti galima tik 5 j į sklaidą. Dėl šios priežasties, kvartiliniai variacijos koeficientai visada (M variacijos koeficientus). (7.31)

^ , (7-32)

V = 'e a - a a + a

•100; a - a / MelOO.

SKIRSTINIO MOMENTAI IR JŲ PRIKLAUSOMYBĖ

rstinio momentu vadinamas individualią požymio reikšmių (Xį) nuo bet kurio pastovaus dydžio A k-ojo laipsnio aritmetinis

(7.33)S h - A j f

S / , •

f6 1 \

Page 61: Statistika I Ona Gražytė-Molienė

Čia k - nuokrypio laipsnis (momento eilė), A - pastovus dydis. Priklausomai nuo to, kam lygus A, skiriami trijų rūšių momentai:

a ) p r a d i n i a i ( m k), kai A= 0: (7.34)

" ' T r

b) c e n t r i n i a i ((it), kai A = X a; (7.35)

1 1 ■

c) s ą l y g i n i a i (M k), kai A ^ X a ir A > 0. (7.36)

X / ■

Statistikos praktikoje paprastai taikomi pirmos, antros, trečios ir ketvirtos eilės momentai. Jų formulės tokios:

Momento eilė PRADINIAI CENTRINIAI SĄLYGINIAIPIRMOJI mi=Exįfį/Xfį

Oa)Hi=S(xi-xa)fį/2;fį

(0)M1=(Xį-A)fį/2fį

ANTROJI m2=2xį2fį/Efi

(* )

^2=S(Xi-Xa)2f,/Sf,(c2)

M2=E(xr A)2f1/ I f

TREČIOJI m3=Exį3fį/Efį (i3= s(x i-xa)3fį/2;f, M3=L(Xį-A)Jfį/Sfi

KETVIRTOJI m4=Lxį4fį/£fj H4=i:(xį—x a)4fj/sfj M4=2(x1-A )4fi/Sf:

Kaip matome, pradinis pirmos eilės momentas (mi) išreiškia aritmetinį vidurkį ir naudojamas kaip pasiskirstymo padėties rodiklis (mi= xa).

Centrinis pirmos eilės momentas (įj.i) visada lygus 0.Centrinis antros eilės momentas (p.2) išreiškia dispersiją (Įi2=a2) ir

naudojamas kaip požymio sklaidos matas.Centrinis trečios eilės momentas (jj.3), kai skirstinys simetrinis, lygus 0,

todėl naudojamas asimetrijos laipsniui nustatyti.Centrinis ketvirtos eilės momentas (m) naudojamas apskaičiuojant

ekscesą (lot. excessus - išėjimas, nukrypimas).

62

J

Page 62: Statistika I Ona Gražytė-Molienė

Kiti momentai savarankiškos reikšmės neturi, bet yra naudojami ^ “ čiavimams palengvinti nustatant centrinius momentus. Centriniams ir

pajiniams atitinkamos eilės momentams galioja tokia priklausomybė:

2 _ _ 2.ii - m 2-m i ,

įa3 = m3 - 3 mim2 + 2mi ;

H4 = nų - 4 mim3 + 6 m |2m2 - 3mi4.

(7.37)

(7.38)

(7.39)

Centriniai momentai tokia pačia priklausomybe susiję ir su sąlyginiais momentais.

Pastaba. Jei sąlyginiai momentai apskaičiuoti iš požymio reikšmių, sumažintų d kartų, juos reikia atitinkamai padauginti iš dk :

= d;M2 =M 2'-d2;M3 =M 3’-d3;M4 = MV- d4.

Page 63: Statistika I Ona Gražytė-Molienė

7.3. PAGRINDINIAI SKIRSTINIO TIPAI. ASIMETRIJOS IR EKSCESO RODIKLIAI

Jei pasiskirstymo eilutėje (skirstinyje) sumažintume intervalus ir tuo pačiu padidintume grupių skaičių, tai skirstinio grafikas (daugiakampis ar histograma) labiau priartės prie tolygios kreivės. Tokia įsivaizduojama daugiakampio ar histogramos riba vadinama pasiskirstymo kreive. Skiriamos empirinės ir teorinės pasiskirstymo kreivės.

Empirinė kreivė - tai faktiška pasiskirstymo kreivė, gauta pagal stebėjfrno duomenis, kurioje atsispindi bendros, ir atsitiktinės sąlygos, veikiančios pasiskirstymą.

Teorinė kreivė - tai kreivė, išreiškianti funkcinį ryšį tarp varijuojančio požymio pakitimo ir dažnių pakitimo, kuri charakterizuoja tam tikrą pasiskirstymo tipą.

Skirtingo sudėtingumo kreivės gali būti priskirtos 4 tipams:1. Simetrinės]2. Vidutinės (saikingos) asimetrijos;3. Labai asimetrinės arba J-tosios formos;4. U-tosios formos;

Simetrinio skirstinio kreivė yra varpo formos (X a = Me = Mo). (7.40)Tokiu atveju tarp atitinkamiems sklaidos rodikliams galioja tokia

priklausomybė:Sklaidos plotis R = 6 o = 9 Q = 7,5 d. (7.41)Esant pakankamam stebėjimo vienetų skaičiui a = 1,25 d. ,Esant vidutinei asimetrija, grupių dažniai nuo maksimumo iš vienos

pusės mažėja greičiau, negu iš kitos pusės. Pvz., gimusiųjų pasiskirstymas pagal motinos amžių. Praktikoje vidutinės asimetrijos kreivė labai dažna.

Esant J-tosios formos pasiskirstymo tipui, grupių dažniai pasiekia maksimumą viename požymio reikšmių svyravimų amplitudės gale (arba arti jo). Pvz., gyventojų pasiskirstymas pagal turto dydį, naujagimių pasiskirstymas pagal mirties atvejų skaičių ir pan.

U-tosios formos pasiskirstymui būdingas grupių dažnių susitelkimas požymio reikšmių svyravimų amplitudės galuose, o jo minimumas yra arti centro. Praktikoje pasitaiko palyginti retai. Pvz., pagal ilgamečius stebėjimus pavaizdavus debesuotumo laipsnį: didelis debesuotumas, mažas debesuotumas, giedras dangus.

Neretai šie pasiskirstymo tipai pasireiškia ne visa forma, todėl atskirti vidutinį arba J-tosios formos pasiskirstymą žymiai sunkiau, negu atskirti simetrinį ir asimetrinį tipus. Kaip žinome, simetriniuose skirstiniuose Xa ; Me = Mo. Kuo didesnis skirtumas tarp Mo ir Xa, tuo'ffidešnFsErstinio asimetrija (simetrinis skirstinys yra toks, kuriame dviejų variantų, esančiu vienodu atstumu nuo centro, dažniai yra lygūs).

64

Page 64: Statistika I Ona Gražytė-Molienė

• Galimi atvejai, kai Xa = Mo, tai reiškia, kad statistinės eilutės dydžiai «I* pasiskirstę simetriškai apie Me. \ n _

Gali būti, kad Xa = Me, o Mo bus gana atokiai nuo abiejų (Xa ir Me). Tokiu atveju, didesnės sankaupos bus dviejose vietose (bus maždaug vienodai pffthl smulkiųjų ir stambiųjų dydžių), o viduryje apie Me dažnių bus visainedaug. _

Esant vidutinei asimetrijai, skirtumas tarp Mo ir Xa maždaug 3 kartusdidesnis negu skirtumas tarp Me ir Xa, t. y.

| X a - M o |« 3 | X a -M e |. (7.42)

IŠ čia, pagal žinomus rodiklius galima nustatyti trečiąjį - nežinomąjį:

Mo = Xa + 3 (Me - Xa) arba Mo - X a - 3 ( X a - Me). (7.43)

Me = (Mo + 2 Xa) / 3. (7.44)

Xa = (3 Me - Mo) / 2. (7.45)

; Jei skirstinyje vyrauja variantai su mažesnėmis negu aritmetinis vidurkis požymio reikšmėmis, tai skirstinio kreivės viršūnė pasislinkusi į kairę ir kreivės dešinioji dalis yra ilgesnė. Tokia asimetrija vadinama

dešiniašone (teigiama); X a >Me > Mo. (7.46)Jei skirstinyje vyrauja variantai su didesnėmis negu aritmetinis vidurkis

reikšmėmis, tai skirstinio kreivės viršūnė pasislinkusi į dešinę, o kreivės kautoji dalis yra ilgesnė. Tokia asimetrija vadinama kairiašone (neigiama):

(7.47)- Norint palyginti dviejų ar daugiau pasiskirstymo eilučių (skirstinių)

asimetriją, galima panaudoti tokius asimetrijos rodiklius:PIRSONO^asimetrijos-. As = (X a-M o)/o (7.48)ir As = (X a-M e)/ a. (7.49)

• i-, ^ > ® ~ teigiama (dešiniašone) asimetrija;Kai As < 0 - neigiama (kairiašone) asimetrija Kai As = 0 — skirstinys simetrinis t/ULO asimetrijos (taikomas, kai nežinoma Mo): fAs = 3 (X a -M e )/o . (7.50)3 1 A® artimesnis 0, o ne 1, o variacijos koeficientas nesiekia 50 proc.,

kad skirstinio asimetrija neesminė.L asimetrijos (taikomas, kai sklaidos matu imamas

tsplotis, o standartinis nuokrypis nežinomas):

Page 65: Statistika I Ona Gražytė-Molienė

x . (a-A fe)-(A fe-a)(Q3 - Me)+ (Me - g , )

Kai (Q3-Me) > (Me-Qi), asimetrijos koeficientas teigiamas, vadinasi, asimetrija dešiniašonė.

Praktikoje dažniausiai taikomi asimetrijos rodikliai, pagrįsti centriniais momentais.

PIRSONO asimetrijos koeficientas Pi = (J.32 / įj.23. (7.52)

FIŠERIO asimetrijos koeficientas y 1 = 1 1 3 / a 3. (7-53)

f / Fišerio asimetrijos koeficientas yra pagrindinis skirstinio į ( asimetriškumo įvertinimo rodiklis. Pagal jį galima nustatyti:

a) asimetrijos egzistavimą, kai As (yi) ^ 0. Tai rodo, kad tarp požymio reikšmes veikiančių daugybės veiksnių yra tokių, kurie jį veikia viena kryptimi ir lemia skirstinio kreivės asimetriją į vieną ar kitą pusę. Šiuo atveju tyrėjo uždavinys - išsiaiškinti tokius veiksnius;

b) asimetrijos pobūdį (kai As > 0 - teigiama, kai As < 0 - neigiama). Jis nusako tų lemiančių veiksnių veikimo krypty

c) asimetrijos laipsnį ir jos esmingumą.Manoma, kad asimetriją galima laikyti neesmine (silpna), o skirstinį

artimą normaliajam, kai |As| < 0,5.Skirstinio asimetnškiūną- galima įvertinti ir švedų matematiko

LINDBERGO pasiūlytu rodikliu: As = P-50, (7.54)čia P - procentas tų reikšmių, kurios viršija aritmetinį vidurkį.Kai P = 50 proc. - simetrinis skirstinys.Kai P > 50 - kairiašonė asimetrija (daugiau atstovaujamos reikšmės

didesnės už aritmetinį vidurkį).Kai P < 50 dešiniašonė asimetrija (daugiau atstovaujamos reikšmės

mažesnės už aritmetinį vidurkį).Skirstinys vadinamas simetriniu, jeigu vienodai nutolusių į abi puses

nuo vidurkio požymio reikšmių dažniai yra lygūs. Toks arba artimas jam skirstinys susidaro tada, kai reiškinį veikia (didina ar mažina) daugybė įvairiu veiksnių, o kiekvieno jų poveikis yra labai mažas, palyginti su veiksnių bendra įtaka. Simetriniai skirstiniai, savo ruožtu, gali skirtis vienas nuo kito pagal kreivės viršūnės formą. Kriterijumi čia imamas normaliojo skirstinio kreivės viršūnės smailumas. Nustatyta, kad šiame skirstinyje 99,7 proc. visų visumos vienetų yra išsidėstę intervale Xa - 3cs iki Xa + 3o (trijų sigmų taisyklė), todėl skirstinio, kurio tik 3 vienetai iš 1000 yra už Xa ± 3o ribų, kreivės viršūnės smailumas vadinamas normaliuoju.

Remiantis centriniu ketvirtos eilės momentu, galima apskaičiuoti eksceso rodiklį, kuris parodo empirinio skirstinio nuokrypį nuo norm aliojo pagal vertikalę. Ekscesu vadinamas skirstinio kreivės išgaubtumas. Skiriafli1

Page 66: Statistika I Ona Gražytė-Molienė

į ekscesai: normalusis, aukščiau normalaus (smailiaviršūnis) ir žemiau (plokščiaviršūnis). Eksceso laipsniui nustatyti skaičiuojamas

ejgeeso koeficientas {Ek):

j Р /Л 50Ш Р 2 = Ц4/Ц24^ 3 . (7.55)

f FIŠERIO y 2= H4 / o4 - 3 -► 0. (7.56)

Vertinimas.Normalus ekscesas, kai p2 = 3, arba y2 = 0.Aukščiau normalaus, kai (32 > 3, arba y2 >0.Žemiau normalaus, kai (32 < 3, arba y2 < 0.

Tuo atveju, kai tirimojo požymio kraštinės ir ypač vidurinės požymio reikšmės turi didesnius už normaliojo skirstinio dažnius, tokio skirstinio viršūnė yra smailesnė ir aukštesnė. Ir priešingai, jeigu apie skirstinio kraštus ir vidurį jų susikoncentruoja mažiau, negu normaliajame skirstinyje, tai kreivės viršūnė yra plokštesnė ir žemesnė.

Dažniausiai taikomas Fišerio eksceso koeficientas, kuris padeda tiesiogiai nustatyti eksceso pobūdį (teigiamas ar neigiamas), jo laipsnį (silpnas, vidutinis, stiprus) ir tiriamojo skirstinio artumą normaliajam.

Kai Ek = 0, ekscesas yra normalus.Kai Ek > 0, ekscesas yra teigiamas. Tokiu atveju, jei Ek < 0,4, jis

nereikšmingu. Vadinasi, dėl eksceso nėra pagrindo tiriamojo skintinio nepriskirti normaliųjų skirstinių klasei.

Kai Ek < 0, ekscesas yra neigiamas. Tokiu atveju kreivės viršūnė yra tidįrj^ubusi, jog siekia X, ašį. Tai rodo statistinės visumos nevienarūšiškumą (fafctiSkai gaunamos dvi kreivės).

Norint palyginti tiramąjį skirstinį su normaliuoju, asimetrijos ir eksceso koeficientus tikslinga skaičiuoti tik tada, kai n > 30-40.

* As reikšmingumas generalinėje visumoje (populiacijoje) P erin am as apskaičiavus asimetrijos koeficiento vidutinę kvadratinę

kun priklauso nuo visumos apimties n ir yra nustatoma pagal tokią formulę; ________ (7 .57)

Г 6(w-l)/(и + 1Хи + 3)'

• U(?. atveiu> ^ai |As|/a As < 3, asimetrija generalinėje visumoje yra nereikšminga ir jos buvimas yra nulemtas atsitiktinių

Ek reikšmingumas populiacijoje patikrinamas apskaičiavus vidutinę kvadratinę paklaidą pagal tokią formulę: (7-58)

67

Page 67: Statistika I Ona Gražytė-Molienė

_ I 24n(n-2X«-3) Ek \ (w-l)2(n + 3X» + 5)

Jei | Ek |/ o Ek < 3, ekscesas populiacijoje yra nereikšmingas, todėl duoto skirstinio nėra pagrindo nepriskirti normaliųjų skirstinių grupei.

Normalusis skirstinys apibūdinamas simetrija ir normaliu ekscesu (skirstinys yrą simetriškas, kai X a = Me = Mo arba As = 0; o ekscesas normalūs, kai Fišero Ek =" 0). Asimetrijos ir eksceso rodikliai, pagrįsti centriniais momentais, padeda nuodugniau ištirti skirstinį ir jo dėsningumus,

skaičiui, ribiniu atveju santykiniai dažniai virsta tikimybėmis).Normalus skirstinys būdingas daugeliui gyvenimo reiškinių.Tokio

skirstinio pavyzdžiu gali būti duomenys apie žmonių ū g i svorį, kritulių kiekį per tam tikrą laikotarpį, augalų dydį, konkretaus darbo atlikimo laiką, sviedimo kritimo nuotolį ir 1. 1. Konkretaus skirstinio atveju reikia nustatyti jo kreivę.

Normaliojo skirstinio kreivės ypatumai:1. Kreivė simetrinė maksimalios ordinatės atžvilgiu. Maksimali

ordinatė atitinka reikšmę X a= Me = Mo, jos dydis yra lygus l/VžITo.2. Grafikas yra varpo formos ir visas juo apribotas plotas lygus 1.3. Kreivė artėja prie X ašies, ištįsusi į abi puses iki begalybės. Vadinasi,

kuo daugiau požymio reikšmė nukrypsta nuo vidurkio, tuo rečiau ji pasitaiko.4. Kai X a = const, didėjant o, krevė labiau nuolaidi.

Kai o = const, kečiantis X a, kreivė nekeičia savo formos, o tik pasislenka į dešinę arba į kairę abscisių ašyje.

5. Intervale X a ± o yra 68,3% visų visumos vienetų; "

K. Gauso ir P. Laplaso atrasta (19 a. pirmoje pusėje) normaliojo

7.4. NORMALIOJO SKIRSTINIO KREIVĖ

kurie labiau išryškėja veikiant didžiųjų skaičių dėsniui (didėjant stebėjimų

X a ± 2 o -9 5 ,4 % X a± 3 o -99,7% . „

skirstinio kreivė išreiškiama tokia lygtimi f(x):

(*,-*. f 2a2

(7.59)

Kadangi (xį-X a)/o = t, tai gaunama tokio pavidalo pasiskirstymo funkcija f(t): (7.60)

68

Page 68: Statistika I Ona Gražytė-Molienė

Čia II = 3,14159... (konstanta);e -2,71828... (natūrinio logaritmo pagrindas); tį - normuoti nuokrypiai.

Ši lygtis vadinama normuota (standartizuota) s kirstinio tankio funkcija. Jos reikšmės nustatomos pagal t; iš specialių lentelių, nekreipiant dėmesio į ženklą.

Teoriniai dažniai, sudarant normaliojo skirstinio kreivę pagal turimus

Čia N - visumos vienetų skaičius; d - grupavimo intervalas.Apskaičiavus teorinius dažnius, reikia patikrinti hipotezę, ar tikrai

empiriniai duomenys aproksimuoja pasirinktą normaliojo skirstinio kreivę. Hipotezės tikrinimas pagrįstas empirinių ir teorinių dažnių sutapimo laipsniu ir jų nesutapimo atsitiktinumu. Hipotezė apie empirinio skirstinio artumą normaliajam skirstiniui gali būti patikrinta Pirsono % 2 (chi - kvadrato) kriterijumi (7.62)

* Specialiose lentelėse surandama P('/) reikšmė atitinkamam laisvės laipsnių skaičiui ir pasirinktam reikšmingumo lygiui a (0,01 arba 0,05). Jei apskaičiuotoji £ reikšmė < už lentelės reikšmę (arba P>a), tai hipotezė apie normalųjį skirstinį neatmetama, o empirinių ir teorinių dažnių skirtumai gali būti traktuojami kaip atsitiktiniai.

Taikant Pirsono kriterijų jj2 reikia laikytis tokių sąlygų:1) stebėjimų skaičius turi būti pakankamai didelis;

. 2) jei teoriniai dažniai kai kuriuose intervaluose yra lygūs 0, tai tokie mtetvalai sujungiami su gretimais.

duomenis, nustatomi pagal formulę (7.61)

empirinio skirstinio sutikimą su normaliuojunormuotą skirstinio tankio funkcij ą).

Page 69: Statistika I Ona Gražytė-Molienė

7.2 lentelė. Ligoniųpasiskistymaspagal sirgtų dienų skaičių

Grupės pagal sirgtų dienų

skaičiųfi Xi X ifį Xį2f; t f (t)

Teoriniaidažniai

f*5C2

0-2 4 1 4 4 -1,662 0,1006 4 02-4 12 3 36 108 - 0,933 0,2589 10 0,44-6 14 5 70 350 -0,204 0,3910 14 06-8 10 7 70 490 0,525 0,3485 13 0,698-10 6 9 54 486 1,254 0,1826 7 0,14

10-12 4 11 44 484 1,983 0,0562 2 2,00E 50 278 1922 50 3,23

Xa = 278 / 50 = 5,56; o2= 1922 / 50 - 5,56 2 = 7,5264; o = 2,7434.

Kai laisvės laipsnių skaičius k = 3, reikšmingumo lygis a = 0,05, %2 =7,815.

Kadangi apskaičiuotas % 2 = 3,234, t.y. mažesnis, negu nurodytas lentelėje, vadinasi, duotas empirinis skirstinys atitinka normalųjį o empirinių ir teorinių dažnių skirtumai yra atsitiktiniai.

1 pav. Ligonių pasiskirstymas pagal sirgtų dienų skaičių. Empirinė ir teorinė kreivės.

Apie kitus skirstinius (lognormalųjį, binominį Puasono ir kt.) kalbama indukcinės statistikos kurse.

7.5. POŽYMIŲ PASISKIRSTYMO NETOLYGUMO TYRIMAS

Požymio reikšmių pasiskirstymo netolygumą apibūdina jU koncentracija. Grafiškai ją galima pavaizduoti L o r e n z o kreive- matematiškai - G i n i ir kitais koeficientais.

70

Page 70: Statistika I Ona Gražytė-Molienė

p a v y z d ž i u i , pajamų / vartojimo statistinei grafinei analizei naudojama kreivė. Tam tikslui, reikia sukaupti tiriamųjų namų ūkių narių

sius svorius (dalis) - fj’ ir pajamų / vartojimo išlaidų pagal decilines grupes lyginamuosius svorius (dalis) - cpį’ (procentais), kvadratas 100*100 ir horizontalioje (X) ašyje žymimi f;’, o

^Sįkgiioje ašyje (Y) - cpį’. Sujungę atitinkamus taškus, gauname Lorenzo Tjįfrr Jeigu pajamos/vartojimo išlaidos pagal namų ūkius būtų pjgįjkirsčiusios absoliučiai po lygiai (pvz., 10 % namų ūkių narių turėtų 10 % pgjdtaų/vartojimo išlaidų, 20 % - 20 % pajamų/vartojimo išlaidų ir t. t.), tai Lorenzo kreivė sutaptų su 45° kampu pasvirusia tiese (kvadrato įstrižaine), ifuri vadinama absoliučios lygybės tiese arba tolygaus pasiskirstymo linija, pymt netolygiam pajamų / vartojimo išlaidų pasiskirstymui, jų koncentracijos i;«ija atitolsta nuo tiesės ir sudaro išlenktą kreivę. Kuo gilesnė Lorenzo kreivė, tuo didesnis pajamų / vartojimo išlaidų koncentracijos lygis.

Svarbiausios Lorenzo kreivės savybės:tT Krėivės pradžia' sutampa su nulinė reikšme, nes nulinis tiriamųjų

skaičius turi nulines pajamas / vartojimo išlaidas.2. Kreivė visada pasibaigia viršutiniame dešiniajame apibrėžto ploto

kampe, kuriame 100 % namų ūkių narių tenka 100 % pajamų / vartojimo išlaidų.

3. Lorenzo kreivė atspindi realią ekonominę padėtį, pasislenka žemyn nuo absoliučios lygybės tiesės, tuo parodydama esamus pajamų/vartojimo išlaidų netolygumus.

Plotas, esantis tarp Lorenzo kreivės ir absoliučios lygybės tiesės, \ atimamas koncentracijos plotu (KF). Jis parodo skirtumus tarp siekiamos ir realios padėtfeffp^^^Tv^Spttcrlšlaidų pasiskirstymo atžvilgiu: (7.63)

{ k f Ą - ~ 1

Grafinę pajamų/vartojimo išlaidų pasiskirstymo analizę galima lengvai transformuoti į matematinę. Tam tikslui nustatomas G i n i (Džini) koeficientas: —-------- ---- -----—___ ęj 54^

! K Gini= KF/ Vi = 2KF.

® atitinkamų decilinių grupių kumuliuoti namų ūkių narių bei ’artojimo išlaidų lyginamieji svoriai (Oi) išreikšti procentais, G i n i to formulė atrodo taip: (7.65)

KGM =_ 10000- ^ / ( 0 .+į». J

10000 = <p'.

71

Page 71: Statistika I Ona Gražytė-Molienė

Yra ir kitokios G i n i koeficiento modifikacijos. Kuo didesnė šio koeficiento reikšmė, tuo pajamų / vartojimo išlaidų pasiskirstymas netolygesnis (svyruoja nuo 0 iki 1). G i n i koeficientas skaičiuojamas ne tik tarptautinėje praktikoje, bet ir mūsų Respublikoje.

Beje, literatūroje siūlomi ir kiti koncentracijos ir diferenciacijos rodikliai, kaip antai: (7.66)

(7.67)

f , ~<P,—_________________.ehferenc. _ ' >1 / _

K I / / -P .I .LORENZO 2 • 100

Šie rodikliai taip pat gali įgyti reikšmes nuo 0 iki 1.

7. KONTROLINIAI KLAUSIMAI

1. Kokia yra sklaidos esmė ir kokie yra sklaidos matams keliami reikalavimai?

2. Kokie yra absoliutūs sklaidos rodikliai?3. Kokie galimi dispersijos apskaičiavimo būdai?4. Kokia yra dispersijų sudėties taisyklė?5. Kaip skaičiuojama ir ką rodo tarpgrupinė dispersija?6. Kaip skaičiuojama ir ką rodo vidurkinė dispersija?7. Kaip skaičiuojamas ir ką rodo vidutinis kvadratinis (standartinis)

nuokrypis?8. Kam lygi alternatyvaus požymio dispersija?9. Kokie yra santykiniai sklaidos rodikliai?

10. Kaip skaičiuojamas ir ką rodo variacijos koeficientas?11. Kam skirti kvartiliniai sklaidos rodikliai?12. Kokie yra skirstinio momentai ir kaip jie susiję?13 Kaip skaičiuojamas ir ką rodo Fišerio asimetrijos koeficientas?14. Ką rodo Fišerio eksceso koeficientas?15. Kas būdinga normaliojo skirstinio kreivei?16. Kam skirta Lorenzo kreivė ir Gini koeficientas?

Page 72: Statistika I Ona Gražytė-Molienė

1 UŽDUOTIS

>%'. I š a n a l i z u o t i pasirinktą intervalinę variacinę eilutę i r p a r a š y t i

Tam tikslui reikia a p s k a i č i u o t i :

. 1. Pasiskirstymo centro charakteristikas: r% a) aritmetinį vidurkį;

b) modą ir medi aną;; c) kvartilius ir decilius.

2. Sklaidos rodiklius (dispersiją, standartinį nuokrypį, kvartilinį ir ijfeacįjos koeficientus)., <iii 3. Fišerio asimetrijos ir eksceso koeficientus.

N u b r ė ž t i histogramąi r n u r o d y t i modą.

7.1 lentelė. įvaikintų vaikų skaičius pagal amžių 2001 metais*

Amžiaus grupės, metais 0,5-2 3-5 6-11 12-17

fi 12 22 7 2

* Šaltinis - SOCIALINIS PRANEŠIMAS 2001, Vilnius, 2002. P. 129.

7.2 lentelė. Bedarbiai pagal nedarbo trukmę 1999 metais

Nedarbo trukmė, mėn. 1 -3 4 - 6 7-12 13 +

fi (%) 26,1 22,0 31,7 20,2

7.3 lentelė. Lietuvos Respublikos savivaldybių tarybų nariai pagal

(1997 03 23 rinkimų duomenimis)*

21-30 31-40 41-50 51-60 61-70 71-803,1 25,2 38,0 25,6 7,3 0,8

altinis - http://rc.lrs.1t/n/rinkimail9970323/amzius.htm

Page 73: Statistika I Ona Gražytė-Molienė

8. REIŠKINIŲ DINAMIKOS TYRIMAS (DINAMIKOS EILUTĖS)

8.1. DINAMIKOS EILUTĖS, JŲ RŪŠYS

Socialiniai ekonominiai reiškiniai tiriami ne tik statikos, bet ir dinamikos metu. Tam sudaromos dinamikos (laiko) eilutės. Dinamikos (laiko) eilutės — tai tokios statistiniu dydžių eilutės, kurios apibūdina reiškinių kitimą laiko atžvilgiu.

Svarbiausia sąlyga, sudarant dinamikos (laiko) eilutes, yra duomenų palyginamumas objekto apimties, mato vienetų apskaičiavimo metodologijos, laiko bei teritorijos aspektais. Dėl administracinio - teritorinio pasikeitimo palyginami duomenys gaunami sujungiant dinamikos eilutes. Pvz., 1999 metais reorganizuota prekybos organizacija. Tai atspindi mažmeninė prekių apyvarta (tūkst. Lt):

1998* 1999 2000Iki

reorganizavimo 216 225 -

Poreorganizavimo (302,4) 315 320

* 1998 m. mažmeninė prekių apyvarta nustatyta naudojantis perskaičiavimo koeficientu: 315 / 225 = 1,4; 216 • 1,4 = 302,4.

Dinamikns. eilutei būdingi du elementai - laikas (t) ir eilutės lygiai (yt).Rodikliai, sudarantys dinamikos eilutę, vadinami dindrmfcoš' eilutės

lygiais (nariais) ir žymimi y0 yi y2 y3 - ..y m, arba y! y2 y3 ....y„ (y0 arba y, - pradinis eilutės lygis, ym arba yn - galutinis eilutės lygis). Dinamikos eilutės lygiai gali būti, išreikšti absoliučiais ir santykiniais dydžiais. Priklausomai nuo to, skiriamos absoliutinių ir santykimų 'ėydžių dinamikos eilutės. Pagrindinės dinamikos (laiko) eilučių rūšys: intervalinė, momentinė. Jos nustatomos pagal tai, kam priskiriami atitinkami eilutės lygiai- atskiriems laikotarpiams (metams, ketvirčiams, mėnesiams) ar tam tikroms datoms. Pvz.,.atskirų mėnesių prekių apyvartos duomenys sudaro intervalinę dinamikos eilutę, o duomenys apie prekių likučius kiekvieno mėnesio pabaigoje - momentinę dinamikos eilutę.

Intervalinės dinamikos eilutės lygius (narius) galima sumuoti (gaunama suma priklauso nuo laikotarpio trukmės). Momentinės dinamikos eilutės lygius sumuoti nėra prasmės, nes jų reikšmės gali būti apskaičiuojamos po kelis kartus. Beje, kiekvieną momentinę dinamikos eilutę galima pertvarkyti į

Page 74: Statistika I Ona Gražytė-Molienė

intervalinę (vidurkinių dydžių) dinamikos eilutę. Tikslesni tokių skaičiavimų rezultatai gaunami tada, kai pertvarkomos eilutės lygiai yra absoliutūs, o ne santykiniai dydžiai. Kiekvienai dinamikos eilutei būtina nurodyti pavadinimą ir atitinkamus mato vienetus. A

Pavyzdys ,-~iV •8.1 lentelė. Nusikalstamumas Lietuvoje 1995-2000 metais *

1995 1996 1997 1998 1999 2000Užregistruotanusikaltimų 60819 68053 75816 78149 77108 82370Išaiškinta nusikaltimų, % 40,0

U *.* .- . / L* *41,3 42,8 40,3 41,0 40,4

'ž&tfĄ"I i /

Čia turime dvi intervalines dinamikos eilutes: pirmoji - absoliutiniųdydžių, antroji - santykinių dydžių. , ' ^ 0 <

.... < «3 C?(.„'.-f '

8.2. DINAMIKOS EILUTĖS ANALITINIAI RODIKLIAI^ > ? į l f 3

Analizuojant dinamikos (laiko) eilutę, pirmiausiai nustatomi jos analitiniai rodikliai:

/ 1) absoliutus lygio pokytis (Ay);! 2) kitimo (didėjimo / mažėjimo) tempas (Tk);

3) pakitimo (padidėjimo / sumažėjimo) tempas (Tp);4) pokyčio 1% absoliutinė reikšmė (Ap).Priklausomai nuo palyginimo bazės, analitiniai dinamikos rodikliai gali

faiįti grandininiai ir baziniai. Grandininiai dinamikos rodikliai gaunami tada, kai palyginimo bazė kinta (lyginama su prieš tai esančiu lygiu), o baziniai - kai palyginimo bazė pastovi (dažniausiai lyginama su pradiniu eilutės lygiu).

1) absoliutus lygio pokytis nustatomas kaip dviejų dinamikos eilutės lygių skirtumas atitinkamais mato vienetais (gali būti teigiamas arba neigiamas).

A y g = y i — y i -i (grandininis); (8.1)A y b= y i ~ y i(0) (bazinis). (8.2)

Grandininiams ir baziniams absoliutaus lygio pokyčio rodikliams galioja tokia priklausomybė:

£ A y g = Ayb, t.y. y n- y ko). _ (8.3)Pastaba. Kai duota santykiniu dydžių dinamikos eilutė ir jos lygiai

-išreikšti procentais, absoliutus lygio pokytis turi būti rodomas procentiniais punktais, o ne procentais. '

‘ " 2) kitimo (didėjimo / mažėjimo) tempas (koeficientas) išreiškia dviejų dinamikos eilutės lygių santykį (jei šis santykis didesnis už 2, reikia jį vertinti kartais, kitais atvejais - procentais):

•75

Page 75: Statistika I Ona Gražytė-Molienė

k k = y J y i-i arba T k = y j / y į., • 100 (grandininis); (8.4) k k= y i / y i (0) arba T t = y i / y i (oj • 100 (bazinis). (8.5)

Grandininiams ir baziniams kitimo koeficientams galioja tokia priklausomybė; —~

\ f T f k g = k b t. y. y n / y i (o)* (8.6)3Į) pakitimo {padidėjimo / sumažėjimo) tempas parodo reiškinio

santykinį pakitimą laiko atžvilgiu (procentais) ir gali būti apskaičiuojamas dviem būdais:

Tpg = A yg / yj_i-100 arba Tpg = Tkg - 100 (grandininis); (8.7)

Tpb= A yb/ yi (oj ‘100 arba Tpb= Tkb - 100 (bazinis). (8.8)

4) pokyčio 1 % absoliutinė reikšmė - tai savotiškas integralinis dinamikos eilutės rodiklis, parodantis kiekvieno pokyčio procento „svorį”; galima apskaičiuoti dviem būdais:

Ap = Ayg / Tpg arba (pertvarkius formulę) Apg = 0,01 • y m . (8.9)

Analizuojant dvi tarpusavyje susijusias dinamikos eilutes galima nustatyti aplenkimo koeficientą t. y.abiejų dinamikos eilučių to paties

/Jaikotarpio kitimo tempų (koeficientų) santykį.Pavyzdys. Įmonės darbuotojų darbo našumas (produktyvumas) einamuoju laikotarpiu, palyginti su baziniu, padidėjo 5 %, o jų darbo užmokestis - 2 %. Kam yra lygus aplenkimo koeficientas?

K* = 1,05 / 1,02 = 1,029 arba 102,9 %... Tai rodo, jog darbo našumas (produktyvumas) per tiriamąjį laikotarpį didėjo 2,9 % sparčiau, negu darbo užmokestis.

Palyginus atitinkamus dinamikos eilučių padidėjimo tempus, gaunamas elastingumo koeficientas:

' E = T^Tužm/^Tį įn .= 2 / 5 = 0,4.Tai reiškia, jog darbo našumui (produktyvumui) padidėjus 1 %, darbo

užmokestis padidėjo 0,4 %.

8.3. DINAMIKOS EILUTĖS APIBENDRINAMIEJI RODIKLIAI. TRADICINIAI IR NETRADICINIAI JŲ APSKAIČIAVIMO BŪDAI

/ Dinamikos eilutės apibendrinamieji rodikliai:1) vidutinis eilutės lygis (chronologinis vidurkis)-,2) vidutinis absoliutus pokytis',3) vidutinis kitimo (didėjimo / mažėjimo) tempas;4) vidutinis pakitimo (padidėjimo / sumažėjimo) tempas (procentais).

76

Page 76: Statistika I Ona Gražytė-Molienė

Vidutinio eilutės lygio apskaičiavimo būdas priklauso nuo dinamikos eilutės rūšies (intervalinė ar momentinė) ir nuo eilutės lygių pateikimo intervalų - lygūs ar nelygūs.

Intervalinės dinamikos eilutės vidutinis lygis (chronologinis vidurkis) apskaičiuojamas kaip paprastas aritmetinis vidurkis: (8.10)

- Z *y = ^ — .n

Čia n - visos dinamikos eilutės narių (lygių) skaičius.Apskaičiuojant vidutinį lygį (chronologinį vidurkį) pagal momentinę

dinamikos eilutę (priklausomai nuo laikotarpių trukmės), galimi trys būdai:1. Paprasto aritmetinio vidurkio, kai dinamikos eilutę sudaro tik du

lygiai; pvz., duomenys apie bedarbių skaičių mėnesio pradžioje ir pabaigoje:(8.11)

22. Svertinio aritmetinio vidurkio, kai dinamikos eilutę sudaro keli nariai

(lygiai), o laikotarpiai tarp datų nelveūs: (8.12)

- _ Z y f t

^ ^ 'Čia tį - laikotarpiai tarp datų.3. Modifikuoto aritmetinio vidurkio (chronologinio tikrąja prasme), kai

dinamikos eilutę sudaro keli nariai (lygiai), o laikotarpiai tarp datų lygūs;.(8.13)

1 1_ T>,l+^2+>,3+- + T3'„y = A

n - 1čia n - visos eilutės narių (lygių) skaičius.Arba: (8.14)

1 1_ -yo+yi +yi +^y» ,y = A----------------- i — ,

mkur m - eilutės narių (lygių) skaičius be pradinio lygio (čia m = n - 1;

y„=ym;yo = yi).PavyzdysTurime tokius duomenis apie N rajono bedarbių skaičių atskirais 2001

metų mėnesiais:01 01 y i 80002 01 y 2 78003 01 y 3 72004 01 y 4 760Koks vidutinis mėnesinis bedarbių skaičius pirmąjį ketvirtį?

11

Page 77: Statistika I Ona Gražytė-Molienė

Kadangi duota momentinė dinamikos eilutė ir laikotarpiai taip datų lygūs, vidutinį eilutės lygį reikia skaičiuoti kaip modifikuotą aritmetini vidurkį (chronologinį tikrąja prasme). Modifikuotu jis vadinamas todėl, kad aritmetinis vidurkis skaičiuojamas dviem etapais:

1) duotoji momentinė dinamikos eilutė pertvarkoma į intervalinę (pagal paprastą aritmetinį vidurkį nustatomas vidutinis kiekvieno mėnesio bedarbių skaičius). Gaunama tokia intervalinė (vidurkinių dydžių) dinamikos eilutė:

N rajono vidutinis bedarbių skaičius atskirais 2001 metų mėnesiais:Sausio - 790;Vasario- 750; v / ■- s f* (J- ’Kovo - 740.2) naujos dinamikos eilutės vidutinis lygis nustatomas kaip paprastas

aritmetinis vidurkis: (790+750+740)/3 = 760.Tą patį rezultatą gauname, taikydami chronologinį (tikrąja prasme)

vidurkį:(l/2-800+780+720+l/2-760)/3 = 760.Vadinasi, vidutinis mėnesinis pirmojo ketvirčio bedarbių skaičius

pirmąjį ketvirtį N rajone - 760 žmonių.Apibendrinamąją reiškinio kitimo charakteristiką duoda vidutinis

absoliutus ir vidutinis santykinis pokytis (padidėjimas ar sumažėjimas) procentais.

Vidutinis absoliutus pokytis, priklausomai nuo turimų duomenų, gali būti apskaičiuojamas tokiais būdais:

1) grandininių absoliutaus pokyčio rodiklių sumą E Ayg dalijant iš jų skaičiaus m t.y.:

(Ay!+ Ay2+ ... +Aym)/m ; (8.15)2) bazinį absoliutaus pokyčio rodiklį Ay b dalinant iš laikotarpių

skaičiaus m arba visos dinamikos eilutės narių (lygių) skaičiaus n-1 (be pradinio lygio): (8.16)

(8.17)-Xy = y ^ l L arha Xy = y ^ 2 ± .

n - 1 m

Čia m = n - 1; ym = yn; y0 = yi-Vidutinis absoliutus pokytis rodo, kiek vidutiniškai kasmet (kas ketvirtį,

kas mėnesį) padidėjo ar sumažėjo tiriamas reiškinys) atitinkamais mato vienetais ar procentiniais punktais.

Vidutiniam santykiniam pokyčiui nustatyti taikomas geometrinis vidurkis (paprastas ar svertinis - tai priklauso nuo turimų duomenų). Šiuo vidurkiu pradžioje nustatomas vidutinis kitimo (didėjimo arba mažėjimo) koeficientas. Galimi tokie jo apskaičiavimo būdai:

1) traukiant m laipsnio šaknį iš grandininių kitimo (didėjimo / mažėjimo) koeficientų sandaugos n kg; (8.18)

i / y ' >78

Page 78: Statistika I Ona Gražytė-Molienė

k = aįkl k 2 kv . k n = ^ U k g ;

2) traukiant n-1 (eilutės narių skaičius be pradinio lygio) laipsnio šaknį iš bazinio kitimo (didėjimo / mažėjimo) koeficiento kb: (8.19)

čia y„ - galutinis dinamikos eilutės lygis;yo ar yi - pradinis dinamikos eilutės lygis (kaip žymėti -

susitarimo reikalas); m = n - 1.

Apskaičiavus vidutinį kitimo (didėjimo / mažėjimo) koeficientą, galima nustatyti ir vidutinį kitimo (didėjimo / mažėjimo) bei vidutinį pakitimo (padidėjimo / sumažėjimo) tempus, išreikštus procentais: (8.20)

(8.21)

Tt=kt 10Q Tp =Tk- 10QVidutinis pakitimo (padidėjimo / sumažėjimo) tempas rodo, kiek

procentų vidutiniškai kasmet (kas ketvirtį, kas mėnesį) padidėjo ar sumažėjo tiriamas reiškinys.

Kartais žinomi duomenys apie kelių nevienodos trukmės laikotarpių vidutinius kitimo arba pakitimo tempus, o reikia nustatyti viso tiriamojo laikotarpio vidutinį pakitimo tempą. Tokiu atveju, nustatant vidutinį kitimo koeficientą, būtina naudoti svertinį geometrinį vidurkį.

PavyzdysŽinoma, kad N produkto vartojimas per 2 metus vidutiniškai kasmet

padidėjo 5 %, o per kitus 3 metus vidutiniškai kasmet padidėjo 1 %. Kokie yra viso tiriamojo laikotarpio vidutiniai metiniai didėjimo ir padidėjimo tempai?

Čia žinomi vidutiniai metiniai padidėjimo tempai procentais, kuriais remiantis nustatomi atitinkamų laikotarpių vidutiniai didėjimo koeficientai:

jfei = l,05;/t2 =1,01.

Šiuos koeficientus pakėlę atitinkamu laipsniu (atskirų laikotarpių trukmė metais) ir juos sudauginę, gauname bazinį viso tiriamojo laikotarpio didėjimo koeficientą: 1,05 2 -1,01 3 = 1,1025 ■ 1,0303 =1,1359, o iš jo ištraukę penktojo laipsnio šaknį (viso tiriamojo laikotarpio trukmė metais), gauname šio laikotarpio vidutinį metinį didėjimo koeficientą (1,0258 arba 102,6 %). Tada:

79

Page 79: Statistika I Ona Gražytė-Molienė

T p = 1 0 2 ,6 -1 00 = 2,6%.

Čia aptarti tradiciniai dinamikos eilutės apibendrinamųjų rodiklių skaičiavimo būdai, tačiau žinomi ir kai kurie netradiciniai jų skaičiavimo būdai, pvz.:

1) vidutinį kitimo tempą galima skaičiuoti kaip aritmetini iš grandininiu kitimo tempų (koeficientų) vidurkį: (8.22)

n2) pagal specialias lenteles sudaryti vidutinius parabolinius tempus

pagal X k į / o / n, kur n - dinamikos eilutės narių (lygių) skaičius be pradinio lygio, t. y. kitimo koeficientų skaičius.

Profesorius B. Jastremskis įrodė jog: kuo grandininių kitimo koeficientų sklaidos laipsnis (variacijos koeficientas) mažesnis, tuo mažesnis vidutinių kitimo koeficientų, apskaičiuotų pagal aritmetini ir geometrinį vidurkius (t. y. netradiciniu ir tradiciniu būdu), skirtumas.

Autorius pasiūlė formulę, išreiškiančią vidutinių kitimo koeficientų, apskaičiuotų skirtingais būdais, priklausomybę: (8.23)

f, J ) _ f hM1— —ka 1—

2 20V y

čia v 2= w 2/10, o w = 2 (T max- T min)2/ (T max + T min) - tai apytikslis kitimo tempų variacijos koeficiento apskaičiavimas.

Galimi netradiciniai ir vidutinio absoliutaus pokyčio nustatymo būdai, kaip antai:

7) svertinio aritmetinio vidurkio taikymas, kai grandininiai absoliutūs pokyčiai „pasveriami” (n-i+1) kartų: (8.24)

Ay = ^ — — r— ;X (* -* + l)

2) rėmimasis bazinių absoliučių pokyčių suma pagal tokią pertvarkytą formulę: (8.25)

7 _ 5 > (/0 _ 2 X ^ . .y Y / n{n + l) ’

čia n - dinamikos eilutės narių (lygių) skaičius be pradinio lygio.

80

Page 80: Statistika I Ona Gražytė-Molienė

Abiem netradiciniais būdais apskaičiuotas vidutinis absoliutus pokytis duoda tą patį rezultatą, tačiau skiriasi nuo tradiciniais būdais apskaičiuoto atitinkamo rodiklio. Tai lemia grandininių absoliučių pokyčių svyravimai - kuo jie didesni, tuo didesni ir skirtumai tarp šių apibendrinamųjų rodiklių, apskaičiuotų netradiciniais ir tradiciniais būdais.

Apibendrinamieji dinamikos eilutės rodikliai paprastai naudojami dinamikos eilutei ekstrapoliuoti, todėl labai svarbu, kaip tiksliai jie atspindi nagrinėjamo reiškinio kitimo tendencijas, nustatytas vienais ar kitais būdais, ir ar jos būdingos laikmečiui.

Kartais gyvenime tenka spręsti praktiškus klausimus - nustatyti laiką, per kurį dominančio reiškimo dviejų dinamikos eilučių galutiniai lygiai (yn) susilygins. Priklausomai nuo žinomų duomenų, galimi du skaičiavimo būdai:

1) remiantis pradiniais duotų dinamikos eilučių lygiais (yo) ir vidutiniais absoliučiais pokyčiais (Ay), taikant formulę (8.26)

.. (y02 - r o i ) .

(Ay, -A v2)’

2) remiantis duotų dinamikos eilučių pradiniais lygiais (y o) ir vidutiniais kitimo koeficientais (k), taikant formulę (paprastai skaitiklyje ir vardiklyje iš didesnio logaritmo atimant mažesnį) (8.27)

(ln&i-lnfo) ’

°avyzdys Duota:

y oi =120; y 02 = 480;

Ayl = 60; Ay2 = 20;

ki =1,2085 ;k2 =1,036.Kada y„i = yn2 (n?).Galima skaičiuoti dviem būdais:1) n = (480 - 120) / (60 - 20) = 9 (metai), arba2) n = (ln 480 - ln 120) / (ln 1,2085 - ln 1,0360) = 1,388630 /

{154013 = 9.(tą patį rezultatą gauname formulėje natūrinius logaritmus pakeistą

dešimtainiais, tada n = 0,60206 / 0,066887 = 9).

Page 81: Statistika I Ona Gražytė-Molienė

8.4. DINAMIKOS EILUTĖS KOMPONENTAI. ADITYVUSIS IR MULTIPLIKATYVUSIS MODELIAI

Dinamikos eilutės lygių kitimą lemia įvairūs veiksniai, kurie, kaip taisyklė, nevienarūšiai savo įtaka, veikimo laiku ir kryptimi. Lemiamos įtakos turi pastovūs veiksniai, kurie ir formuoja pagrindinę dinamikos (laiko) eilutės tendenciją (trendą). Kiti veiksniai veikia periodiškai, o vienkartinių veiksnių įtaka pasireiškia atsitiktiniais trumpalaikiais dinamikos eilutės lygių pokyčiais.

Pagrindiniai dinamikos eilutės komponentai yra:trendas (T), sezoninė (S) ciklinė (C) ir nereguliari (atsitiktinė) (A).Trendas - tai ilgalaikė dinamikos eilutės dedamoji, lemianti bendrą

dinamikos eilutės kitimą.Sezoninis komponentas priklauso tokiam kitimų tipui, kuris laiko

atžvilgiu pasikartoja reguliariai. Be to, šis kitimas turi baigtis per metus ir kartotis metai iš metų, kad jį galima būtų laikyti sezoninių. Pvz., trąšų pardavimo apimties didėjimas kiekvieną pavasarį ir jos sumažėjimas visais kitais tų pačių metų laikais.

Kai kuriems reiškiniams galima nustatyti ir ciklinį komponentą. Cikliniai pakitimai panašūs į sezoninius tuo, kad jie taip pat pasikartoja ir yra banguojantys vaizduojant grafiškai, tačiau skiriasi didesne amplitude ir trukme bei mažesne galimybe prognozuoti ateitį (pvz., verslo ciklas).

Atsitiktinį komponentą sudaro trumpalaikiai, nepasižymintys lygių dydžių formomis, pakitimai. Pvz., kiekvienos dienos ar savaitės trąšų pardavimo apimties svyravimai, kurie susiję su oro permainomis. Jie skatina trumpalaikius pakitimus ir sudaro nereguliarų (atsitiktinį) dinamikos eilutės komponentą.

Visi minėti komponentai atitinkamai veikia dinamikos eilutės lygius. Analizuojant dinamikos eilutes, nustatomas ir eliminuojamas kiekvieno komponento poveikis dinamikos eilutės lygiams. Toks procesas vadinamas dinamikos eilutės suskaidymu. Dinamikos eilutės komponentai gali būti pavaizduoti atitinkamu modeliu - multiplikatyviuoju (paremtu daugyba) arba adityviuoju (paremtu sudėtimi):Y = T S - C A = T S ^ , č i a Ę - likutinis komponentas (C-A); (8.28)Y = T + S + C + A = T + S + ^, čia - likutinis komponentas (C+A). (8.29)

Kada reikia taikyti adityvųįį, o kada multiplikatyvųįį modelį dinamikos eilutės komponentams nustatyti, galima atsakyti pagal išankstinius skaičiavimus.

Kiekvieniems metams iš ketvirtinių arba mėnesinių duomenų apskaičiuojamas aritmetinis vidurkis (y a) ir standartinis nuol^£is (ay)^ Jeigu y a kasmet didėja, o ay ~ const, dinamikos eilutės komponentus galima

82

Page 82: Statistika I Ona Gražytė-Molienė

nustatyti adityviuoju metodu (paremtu sumavimu), o jeigu ay žymiai skiriasi,reikia taikyti multiplikatyvujį metodą (paremtą daugyba); ----- —------------

__--------Pavyzdy s—..—---------------

8.2 lentelė. N produkto gamyba (t ūks 1.1)( K e t v i r č i a i ) ( y > - y a )2

Metai 1 2 3 4 № 1 2 3 4 ay1998 30 20 10 40 25 25 25 225 225 125 11,21999 30 30 20 40 30 0 0 100 100 50 7,12000 40 30 30 60 40 0 100 100 400 150 12,2

8.3 lentelė. BOILIO-BOLIJOTO lentelė

METAI ya < ry1998 25 1251999 30 502000 40 - 150

Išvada. Duotuoju atveju geriau tinka multiplikatyvusis modelis, nes y a didėja, o ir a y2 nėra pastovus. ...—_

Atitinkamą sprendimą galima priimti ir pasinaudojus duotos dinamikos eilutės grafiku. Jei per gautos laužtės iškiliausius taškus galima nubrėžti dvi lygigrečias linijas - tinka adityvusis modelis, o jei šios linijos sudaro „vėduoklę” - taikytinas multiplikatyvusis modelis.

Jei dinamikos eilutės trendo nustatymas reikalingas numatant prognozes ilgesniam laikotarpiui, tai dinamikos eilutės sezoninio komponento analizė reikalinga trumpesnio laikotarpio prognozei. Pvz., darbo jėgos prognozės turi numatyti laukiamus sezoninius darbo rinkos pakitimus.

Sezoninio komponento analizė skiriasi nuo trendo analizės dviem aspektais:

1) trendas nustatomas tiesiogiai pagal turimus empirinius dinamikos eilutės duomenis, o sezoninis komponentas nustatoma išvestiniu būdu, iš turimų duomenų eliminuojant visus kitus komponentus;

2) trendas išreiškiamas lygtimi (arba tam tikra linija), o sezoninis dydis indekso forma apskaičiuojamas kiekvienam mėnesiui arba ketvirčiui. Todėl sezoniškumo analizei reikalingi mėnesiniai arba ketvirčių duomenys, kitaip sezoniniai pakitimai būtų nepastebėti.

Ciklinė ir nereguliari dinamikos eilutės komponentės nustatomos likutiniu metodu, t. y. eliminuojant sezoninį ir trendo komponentus. Jei analizuojami mėnesiniai arba ketvirtiniai kelerių metų duomenys, turi būti elimnuota tiek trendo, tiek sezoninio komponento įtaka (pastaroji

Page 83: Statistika I Ona Gražytė-Molienė

pirmiausiai). Jeigu analizuojami tik metiniai duomenys - eliminuojama tik trendo įtaka (pagal mulliplikatyvųjį modelį dalijant iš T, pagal adityvųįį - atimant T).

Ciklinio komponento įtaka gali būti nustatyta apskaičiuojant slenkamuosius vidurkius, o nereguliaraus komponento (A) - pagal likutį (dalinant arba atimant C). Ekonominei prognozei labiausiai naudingi trendo ir sezoninis komponentai.

84

Page 84: Statistika I Ona Gražytė-Molienė

8.5. TRENDO NUSTATYMO BŪDAI

Iš metinių duomenų dinamikos eilutės pirmiausiai nustatomas komponentas, kuris pasižymi ilgalaikiu, lėtai besikeičiančiu poveikiu dinamikos cilulės lygiams, t. y. trendas. Statistikos uždavinys - kiekybiškai išreikšti pagrindinę reiškinio vystymosi tendenciją, abstrahuojantis nuo kitų veiksnių įtakos (čia laikas yra kaip priežastis).

Kartais vizualiai galima nustatyti bendrą reiškinio vystymosi tendenciją, tačiau neretai ji gali būti išreiškiama tik apkaičiavimo būdu. Grafiškai ją galima pavaizduoti linija (apskaičiavimas analogiškas regresijos linijos nustatymui). Galimi įvairūs trendo linijos nustatymo būdai. Pats paprasčiausias, tačiau mažiausiai tikslus, yra rankinis (mechaninis) būdas, kai dinamikos eilutės grafike trendo linijos padėtis visiškai priklauso nuo analitiko, tiriančio duomenis, nuomonės.

Anglų mokslininkas L. Kazmeras nurodė tikslesnį būdą, vadinamąjį „pusinių vidurkių” m etod^kal viso”laikotarpio duomenys suskirstomi į dvi dalis (pageidautina, lygias), po to apskaičiuojami kiekvienos dalies vidurkiai ir grafike pažymimi du taškai trendo linijai brėžti (ordinatės iškeliamos kiekvieno laikotarpio viduryje). Šis metodas leidžia gauti trendo linjįją kaip tiesę. ' , ~

Pavyzdys > ...y..

Metai 1996 1997 1998 1999 2000 2001Y t 15 13 11 18 19 23

- 2 ^ 3 3Duotą 6j^eūt.laiko]arpį..padalijame. pusiau, ir nustatome. vidutini lygi'-

y i= 13, o y 2 = 20; iškeliame tokio aukščio ordinates iš šių laikotarpių vidurio ir per pažymėtus du taškus nubrėžiame duotos dinamikos eilutės trendo liniją- tiesę.

Praktikoje dažniausiai taikomi šie trendo nustatymo būdai:1. Intervalų sustambinimo;2. Slenkamųjų vidurkių;3. Eksponentinis;4. Analitinio išlyginimo (mažiausių kvadratų).Intervalų sustambinimo būdas geriausiai tinka intervalinės absoliutinių

dydžių dinamikos eilutės pagrindinei vystymosi tendeneijai nustatyti, kai vizualiai iš duotų duomenų ši tendencija neaiški.

Pavyzdys8.5 lentelė. Turime tokius duomenis apie N produkto gamybą

atskirais metų mėnesiais (tūkst vnt)01 02 03 04 05 06 07 08 09 10 11 12234 242 250 246 254 262 270 260 274 282 278 292

\. J

85

Page 85: Statistika I Ona Gražytė-Molienė

Kadangi čia duota intervalinė dinamikos eilutė (vadinasi, jos lygius galima sumuoti), ją galima suglodinti intervalų sustambinimo metodu, t. y. iš mėnesinių duomenų dinamikos eilutės gauti ketvirtinių duomenų apie N produkto gamybą dinamikos eilutę (tūkst. vnt.):

1ketvirtis

2ketvirtis

3ketvirtis

4ketvirtis

726 762 804 852

Kaip matome, gauta visiškai aiški N produkto gamybos didėjimotendencija. —------~~

Trendo nustatymas slenkamųjų vidurkių metodu pagrįstas žinomu teiginiu, jt)g“'Vidurkiuose atsitiktiniai nuokrypiai vienas kitą padengia ir reiškinys įgauna bendrą tendenciją. Pagal šį metodą, kiekvienas dinamikos eilutės narys (lygis) yra pakeičiamas j į supančių narių (lygių) vidurkiu. Slenkamąjį vidurkį trendui nustatyti geriau skaičiuoti iš nelyginio eilutės narių (lygių) skaičiaus, kad kiekvienas slenkamasis vidurkis būtų priskiriamas konkrečiam laikotarpiui, o ne išsidėstytų tarp dviejų laikotarpių, nes gautoji slenkamųjų vidurkių eilutė visada trumpesnė už empirinę eilutę n - 1 nariu (čia n - narių skaičius, pagal kurį skaičiūojamas slenkamasis vidurkis). Pvz., slenkamasis 3 narių vidurkis skaičiuojamas pagal tokią formulę: (8.30)

Mūsų pavyzdyje slenkamųjų vidurkių metodu išlyginta (suglodinta) dinamikos eilutė atrodys taip (tūkst. vnt.):

01 02 03 04 05 06 07 08 09 10 n ! 12- 242 246 250 254 262 264 268 272

ocr(N 284 / -

Kadangi apskaičiuotas 3 narių slenkamasis vidurkis, naujoji dinamikos eilutė 2 nariais trumpesnė (3-1).

Grafiškai vaizduojant dinamikos eilutę, suglodintą slenkamųjų vidurkių metodu, kaip taisyklė, negaunama trendo tiesės linija, nes atidedami ne du, o keli ar keliolika taškų. Šio metodo pagrindinis tikslas - išlyginti (suglodinti) duomenis, kai jie veikiami atsitiktinių veiksnių.

Eksponentinis išlyginimas - tai savotiška slenkamųjų vidurkių metodo atmaina (pradininkas - R. Braunas), pateikianti eksponentiškai pasvertą, laiko progresijoje judantį vidurkį. Taikant šį metodą, kiekviena išlyginta (prognozuojama) reikšmė yra s vertinis naujausios stebėtos reikšmės Yt

Page 86: Statistika I Ona Gražytė-Molienė

(„pasvertos” a koeficientu) ir ankstesnės išlygintos (prognozuojamos) reikšmės Yt_i („pasvertos” (1-a) koeficientu) vidurkis: (8.31)

Yt = a Yt + (1 - a) Y n arba Yt+1 = a Yt + (1 - a) Y t .

Čia a - subjektyviai pasirenkamas išlyginamasis koeficientas (konstanta); jis gali būti artimas 2/rn+1) ir. svyranti nuo 0 iki 1.

Jei norima tik išlyginti duotą dinamikos eilutę, pasalinant ciklinius ir nereguliarius svyravimus, reikėtų išlyginamąjį koeficientą rinktis mažesnį - arčiau 0, o jei tikslas - prognozuoti, reikėtų pasirinkti j į didesnį - artimesnį 1.

Atlikę eksponentinį išlyginimą, matome, jog galutinis stebimas lygis įgauna didžiausią svorį, o pradinis - mažiausią. Kai a artimas 1, gauname nedidelį duomenų išlyginimą, o kai a mažas - gana smarkų išlyginimą (glodinimą).

Paprastas (vienos pakopos) eksponentinis išlyginimas taikytinas dinamikos eilutėms apdoroti, kai nėra staigių krypties pokyčių.

Pavyzdys8.6 lentelė. Einamųjų metų mėnesiniai duomenys apie išlaidas (

komunalinėms paslaugoms (Lt) . VN \

Mėnesiai (t) Y,

t

Slenkamasisvidurkis

Eksponentinis išlyginimas

(a = 0, 154) ,1

15,4 / '* ■)) -2 19,8 J f 3 ' 17,6 C 17,39.' >3 .17,6/ 17,7 17,764 l 3 y 16,5 17,745 16,2 17,1 17,446 19,4 17,7 17,257 17,6 18,4 17,588 18,2 17,0 17.589 15,2 17,1 17,68

10 17,8 17,8 17,3011 20,4 19,3 17,3712 19,6 - 17,84

U

Prognozė: 'Y 13 = a Y n + (1 - a) Y i2 = 0,154 • 19,6 + (1 - 0,154) • 17,84

= 18,11 ' ' ^ ----- - ... - _arba —01 ? T

Y ,3 = (Y t - 1 1) a + Y t = (19,6 - 17,84) ■ 0,154 + 17,84 = 18,11.

81

Page 87: Statistika I Ona Gražytė-Molienė

* Jeigu nustatoma, kad dinamikos eilutės komponentas išreiškiama kreive, tai galimi du analizės atvejai:

1) duotos dinamikos eilutės lygius pertvarkyti į jų logaritmus ir tyrinėti šių logaritmų tiesinę tendenciją;

2) taikant mažiausių kvadratų metodą, surasti nežinomus parametrus aukštesnio laipsnio kreivių lygtyse. Tokiu atveju taikomas analitinio išlyginimo metodas. Jo esmė tokia: į tiriamojo reiškinio lygius žiūrima kaip į laiko funkciją - faktiškieji (empiriniai) dinamikos eilutės lygiai pakeičiami teoriniais, kurie mažiausiai skirtųsi nuo empirinių, t. y. konkretūs dinamikos eilutės lygiai (yt) pakeičiami vidutiniais, kurie tilptų adekvačioje matematinėje funkcijoje. Adekvati matematinė funkcija dažnai parenkama pagal formalų kriterijų (8.32)

S = 2 (yt - yt)2 fnin, t.y. (empirinių ir teorinių reikšmių nuokrypių kvadratų sumos minimizavimas). Tačiau visada toks pasirinkimas turi būti paremtas loginiais samprotavimais.

Trendo statistinio tyrimo praktikoje skiriami tokie etaloniniai socialinių ekonominių reiškinių vystymosi laikui bėgant tipai:

1) tolygus vystymasis (jam būdingi pastovūs absoliutūs pokyčiai: A yg ~ const.). Trendą galima nustatyti tiesės lygtimi: (8.33)

yt = ao + ai t;kai ai > 0, dinamikos eilutės lygiai tolygiai didėja, kai ai < 0, jie tolygiai

mažėja. Parametras ai rodo, kiek vidutiniškai vienetų pasikeičia eilutės lygis kiekvieną laikotarpį

2) tolygiai pagreitintas {sulėtintas) vystymasis (jam būdingi pastovūs padidėjimo tempai: T p g ~ const.).

Šiuo atveju trendui nustatyti geriausiai tinka antros eilės parabolėslygtis: ---------------------- ----- -— — (£34)

y t = ao + ai t + a212,čia a2 - greičio prieaugis, parodantis pastovų vystymosi intensyvumo

pakitimą laiko vienetui; kai a2 > 0 - pagreitintas vystymasis, kai a? < 0 - vyksta lėtėjimo procesas. Parabolės kreivė įgauna min, kai a2 > 0, o max, kai a2 < 0.

3) vystymasis su kintamu pagreitėjimu (sulėtėjimu). Tokiu atveju taikoma trečios eilės parabolės funkcija: (8.35)

y, = ao + ai t + a212 + a313.a3 parodo pagreitėjimo pakitimą: kai a3 > 0 - greitėjimas didėja, kai

a3 < 0 greitėjimas lėtėja.4) vystymasis pagal eksponentą (laipsnio rodiklį): (8.36)

Page 88: Statistika I Ona Gražytė-Molienė

Logaritmuojant paprastoji eksponentė pertvarkoma į tiesės lygtį'. (8.37) ln y t = lna0 + a , /Ine = lna0 + axt,

Čia e =2,71828, o ln e = 1.

Kai dinamikos tipas charakterizuoja stabilius kitimo tempus: T k g ~ const., tada geriausiai tinka rodiklinė funkcija : (8.38)

y t = a 0‘ t al,čia ai - vidutinis kitimo tempas (rodo vystymosi intensyvumą per laiko

vienetą). Logaritmuojant ji pertvarkoma į tiesės lygtį: (8.39)

ln y t = ln a0 + a{ ln t.

5) vystymasis su augimo sulėtėjimu laikotarpio pabaigoje', pagrindinė vystymosi tendencija tokiose dinamikos eilutėse išreiškiama pusiaulogaritmine funkcija: (8.40)

yt=ao + ai lgt.Kai dinamikos eilutės lygių didėjimas nėra begalinis, pvz., prekių

atsargų ar vartojimo lygio trendui nustatyti tinka hiperbolės funkcija (sprendžiant ji pertvarkoma į tiesės lygtį): (8.41)

y, = ao + ai l/t.Sudėtingesnės matematinės funkcijos aptariamos indukcinėje

statistikoje.Norint nustatyti, kaip teorinės reikšmės atitinka empirines, gali būti

skaičiuojama vidutinė aproksimacijos paklaida (e) (8.42)

I y k c Ž J .100y,

arba vidutinė absoliuti procentinė paklaida (MAPE) (8.43)

I y t l Ž J .1 0 0 .n** y,

Jeigu šios paklaidos yra < 10 %, laikoma, kad aproksimacija gera.Analitinis dinamikos eilutės išlyginimas (suglodinimas) yra itin svarbus

ekstrapoliuojant jos lygius, t. y. juos prognozuojant.

8 .6. SEZONINIŲ SVYRAVIMŲ TYRIMAS

Kaip žinome, reguliarūs reiškinio dinamikos eilutės lygių svyravimai, kurie kartojasi metai iš metų, vadinami sezoniniais. Jų pagrindinė priežastis -

Page 89: Statistika I Ona Gražytė-Molienė

klimatinės sąlygos, nors gali turėti įtakos ir įvairūs socialiniai ekonominiai veiksniai, metinės šventės ir kt. Sezoniniai svyravimai pasireiškia įvairiose gyvenimo srityse: gamyboje, cirkuliacijoje, vartojime (pvz., rudenį ir žiemą didėja didesnio kaloringumo maisto produktų poreikis, o vasaros mėnesiais - lengvesnio maisto - vaisių, daržovių; nuo sezono priklauso avalynės, drabužių ir panašių prekių paklausa).

Statistinio tyrimo tikslas - nustatyti tiriamojo reiškinio vystymosi specifiką metų metais, išmatuoti sezoninius svyravimus ir sukurti sezoniškumo bangos modelį.

Sezoniškumui išmatuoti skaičiuojami sezoniškumo indeksai, kurie rodo tam tikro reiškinio atskirų mėnesių arba ketvirčių santykinius nuokrypius nuo lygių, atitinkančių pagrindinę reiškinio vystymosi tendenciją. Sezoniniai svyravimai vadinami stabiliais, jei kasmet labai nepasikeičia svyravimų ciklas (laikotarpis tarp gretimų max ir min taškų), svyravimų amplitudė ( z ^ - z ^ a ) bei ekstremalių reikšmių išsidėstymas svyravimo periode. Sezoniškumo indeksai gali būti nustatomi trimis būdais:

1. Paprastųjų vidurkių;,2. Slenkamųjų vidurkių;,3. Analitinio išlyginimo.Tais atvejais, kai nėra ryškios reiškinio didėjimo ar mažėjimo

tendencijos, sezoniškumo indeksus (z;) galima apskaičiuoti paprastųjų vidurkių metodu, t. y. vienavardžių mėnesių ar ketvirčių vidurkius lyginant su bendruoju vidurkiu: (8.44)

Z f = 7 i / 7 = —------/ -'— L------ ,m 12 m

čia i - mėnuo, j - metai, Zį - sezoniškumo indeksas.

Kartais, kai gruodžio mėnesio ar ketvirto ketvirčio sezoniškumo indeksas didesnis nei sausio mėnesio ar pirmojo ketvirčio, geriau pirmiausia tokią dinamikos eilutę išlyginti ir sezoniškumo indeksus nustatyti ne vidurkio,o trendo atžvilgiu. Tokiu atveju, mėnesiniai ar ketvirčių faktiniai lygiai palyginami su išlygintais kiekvieno mėnesio ar ketvirčio lygiais.

Baigiamasis etapas - sezoniškumo indeksų apskaičiavimas kiekvienam mėnesiui ar ketvirčiui. Juos galima apskaičiuoti keliais būdais:

1) medianinio procentinio santykio;2) vienavardžių mėnesių ar ketvirčių procentinių santykių aritmetinio

vidurkio (dažniausiai taip ir daroma);3) modifikuoto aritmetinio vidurkio (jei palyginti daug tokių santykių,

aritmetinį vidurkį skaičiuoti atmetus max ir min santykius).Vidutiniai kiekvieno mėnesio ar ketvirčio sezoniškumo indeksai turi

būti lygūs 1 arba 100 %. Vadinasi, sezoniškumo indeksų suma 12 mėnesių

90

Page 90: Statistika I Ona Gražytė-Molienė

lygi 12 arba 1200 %, o 4 ketvirčių - 4 arba 400 %. Jei apskaičiuotų sezoniškumo indeksų suma gaunama kitokia, šiuos indeksus reikia koreguoti atitinkamu koeficientu:

Kkooreg.= 1 2 / 2 Zį, kai nustatyti mėnesiniai sezoniškumo indeksai,arba

K koreg-= 4 / S Z į, kai šie indeksai ketvirtiniai.12 mėnesių arba 4 ketvirčių sezoniškumo indeksai sudaro vadinamąją

sezoniškumo bangą, kuri ir rodo svyravimų pobūdį per metus. Sezoniškumo intensyvumą galima atpindėti sezoniškumo indeksų variacijos koeficientu (kadangi sezoniškumo indeksų vidurkis lygus 1, variacijos koeficientas iš esmės sutampa su standartiniu nuokrypiu): (8.45)

čia n - 12 mėnesių arba 4 ketvirčiai.Aptarti sezoniškumo indeksų skaičiavimo būdai galimi tik tais atvejais,

kai dinamikos eilutės komponentai nustatomi pagal multiplikatyvųjį modelį. Tais atvejais, kai dinamikos eilutės komponentai nustatomi pagal adityvųįį modelį, vietoje sezoniškumo indeksų, apskaičiuojama absoliuti sezoniškumo įtaka šios eilutės lygiams (neretai taikomi slenkamųjų vidurkių arba analitinio išlyginimo būdai). Nustatant sezoniškumo komponentą slenkamųjų vidurkių metodu, nepriklausomai nuo pasirinkto modelio, santykinė ar absoliuti sezoniškumo įtaka gali būti išaiškinta tik tada, kai slenkamasis vidurkis apskaičiuotas iš 12 ar 4 narių, t. y. iš lyginio narių skaičiaus, sudarančio metų periodą, per kurį pasireiškia sezoniniai svyravimai. Šiuo atveju tenka skaičiuoti „centruotą” vidurkį, kad išlygintos reikšmės būtų priskirtos konkretiems laikotarpiams (žr. 2.3.2 priedo 1 lentelę).

91

Page 91: Statistika I Ona Gražytė-Molienė

8.7. DINAMIKOS EILUTĖS EKSTRAPOLIACIJA

Dinamikos eilutės ekstrapoliacija - tai duotos dinamikos eilutės analizės metu nustatytų dėsningumų perkėlimas ateičiai (perspektyvai) arba praeičiai (retrospektyvai), o interpoliacija - tai trūkstamo nario (lygio) eilutės viduje suradimas.

Ekstrapoliacija yra vienas iš prognozavimo metodų.* - Kodėl negalima atspėti tikrovės?

- Todėl, kad niekas negali būti toks drąsus, kaip j i pati.Suprantama, patikimesnės yra trumpalaikės prognozės. Paprastai

prognozuojamo laikotarpio ilgis (prognozės horizontas - L) neturi viršyti 1/3 dinamikos eilutės ilgio. Priklausomai nuo tiriamos dinamikos eilutės lygių kitimo tolygumo, ekstrapoliuoti galima keliais būdais - pagal:

1) vidutinį absoliutų lygio pokytį, kai daugiau ar mažiau stabilūs grandininiai absoliutūs pokyčiai (Ayg = const.): (8.46)

Yn+1= Y n+ AY-L;2) vidutinį kitimo (didėjimo ar mažėjimo) koeficientą, kai daugiau ar

mažiau stabilūs grandininai kitimo koeficientai (kdg = const.): (8.47)Y„+l= Yn • k h \

3) pasirinktą trendo funkciją, pvz., tiesės: (8.48)Yn+L= a 0 + a i(n+L).

Kai žinomi sezoniškumo indeksai (multiplikatyvus modelis), jais yra patikslinama prognozė: (8.49)

Y„+l = {a o + a i (n+1)}- Z;.Taip gaunama vadinamoji taškinė prognozė, su kuria empiriniai

duomenys gali nesutapti (galėjo pasikeisti dinamikos eilutės pobūdis, netiksliai buvo pasirinkta trendo funkcija ir pan.). Todėl reikėtų atlikti intervalinę prognozę:

Y'tita • Sjt, (8.50)čia Syt - standartinė prognozės paklaida, kurią galima apskaičiuoti

pagal tokią formulę:(8.51)

t

i + - + n

i r i

(standartinė regresijos paklaida);m - trendo lygties parametrų skaičius; L - prognozuojamo laikotarpio

eilės numeris.

92

Page 92: Statistika I Ona Gražytė-Molienė

t„ - Stiudjento t kriterijaus reikšmė, nustatoma specialiomis lentelėmis pagal atitinkamą laisvės laipsnių skaičių (k = n-m) ir reikšmingumo lygį a =0,05 arba a = 0,01.

Visos prognozės turi būti logiškai pagrįstos. Jų paskirtis - ne įspėti tikslius prognozuojamos eilutės lygius, o perspėti, kokia linkme reiškinys vystysis ateityje. Net geriausi statistikoje taikomi matematiniai metodai dar negarantuoja rezultatų prasmingumo. Visada galutinis žodis tenka tyrinėtojui, jo intuicijai. Ekstrapoliacįjos nereikėtų laikyti baigiamąja prognozės stadija. Tai tik išankstinis prognozės etapas. Galutinei prognozei reikia turėti papildomos informacijos, kurios nepateikia duota dinamikos eilutė.

"‘Olandų ekonometrikas T e i l a s pasiūlė prognozės sutapimo koeficientą U : (8.52)

|z ( y / - y TJ . i ’

čia y TP - prognozuotos reikšmės n laikotarpiui; y T - faktinės reikšmės praėjus šiam laikotarpiui.

Kuo T e i l o sutapimo koeficientas U artimesnis 0, tuo prognozė tikslesnė.

8. KONTROLINIAI KLAUSIMAI

1. Kokias statistikos eilutes vadiname dinamikos eilutėmis? Kokios jųrūšys?

2. Kokia savybe pasižymi intervalinės dinamikos eilutės?3. Kokie yra ir kaip skaičiuojami analitiniai dinamikos eilutės

rodikliai?4. Kokia priklausomybe susiję atitinkami grandininiai ir baziniai

dinamikos rodikliai5. Kas yra chronologinis vidurkis ir kokie jo skaičiavimo būdai?6. Kaip nustatomas ir ką rodo vidutinis absoliutus pokytis?7. Kaip nustatomas ir ką rodo vidutinis didėjimo ir padidėjimo

tempai?8. Kokie yra dinamikos eilutės komponentai?9. Kokie yra trendo nustatymo būdai?

10. Kokie yra sezoniškumo indeksų nustatymo būdai?11. Kas yra dinamikos eilutės ekstrapoliacįja ir kokie jos nustatymo

būdai?12. Ką rodo T e i 1 o sutapimo koeficientas?

Page 93: Statistika I Ona Gražytė-Molienė

II UŽDUOTIS

I š a n a l i z u o t i pasirinktą dinamikos eilutę ir p a r a š y t i išvadas.

Tam tikslui reikia:1. Apskaičiuoti dinamikos eilutės rodiklius:

a) analitinius (grandininius ir bazinius) ir juos pateikti statistinėje lentelėje;

b) apibendrinamuosius.2. Nustatyti dinamikos eilutės trendą ir ją ekstrapoliuoti (L=2).3. Empirinių ir teorinių reikšmių dinamikos eilutę pavaizduoti

grafiškai.

18.7 lentelė. Užregistruota norinčių grįžti į Lietuvą šeimų*

1996 1997 1998 1999 2000 2001717 656 654 710 836 954

* Socialinių įstaigų priežiūros ir audito prie SADM duomenys.

8.8 lentelė. Nedarbo lygis Lietuvoje 1997-2001 metais (pagal Darbo biržos duomenis), procentais

1997 1998 1999 2000 20015,9 6,4 8,4 11,5 12,5

8.9 lentelė. Nedarnių (asocialių) Seimų skaičius (metų pradžioje,tūkst.)*

1998 1999 2000 2001 200214,9 15,1 16,0 18,1 18,7* Socialinės apsaugos ir darbo ministerijos duomenys.

8.10 lentelė. Išlaidų drabužiams ir avalynei dalis visose vartojimo išlaidose 1996-2000 metais (pagal NŪBT duomenis), procentais

1996 1997 1998 1999 20007,8 7,7 8,0 7,7 6,8

\

_______ '; 94 \

Page 94: Statistika I Ona Gražytė-Molienė

9. INDEKSAI

9.1. INDEKSŲ ESMĖ IR PASKIRTIS

Vienas iš seniausių ir labiausiai paplitusių statistikos metodų - indeksų metodas.

Jo paskirtis - kiekybiškai charakterizuoti sudėtingų socialinių reiškinių santykinį kitimą laike ar teritorijoje. Sąvoka „indeksas” turi dvejopą prasmę. Visų pirma, indeksas traktuojamas kaip tam tikras rodiklis arba tam tikrų skaičiavimų rezultatas; antra - kaip ypatinga santykinių dydžių rūšis. Iš tikrųjų, indeksai yra ypatinga santykinių dydžių rūšis, nes vienu rodikliu pateikiama daugelio, dažnai skirtingų pavadinimų vienetų visumos kitimo laiko ir teritorijos atžvilgiu charakteristika, pvz., produkcijos fizinės apimties indeksas atspindi bendrą visos produkcijos kitimą. Nors dažniausiai indeksai naudojami sudėtingų socialinių ekonominių reiškinių dinamikai tirti, tačiau jie taikomi ir šiems reiškiniams lyginti teritorijos atžvilgiu bei atitinkamų reiškinių lygio nukrypimams nuo tam tikro etalono įvertinti.

Indeksai neatspindi vieno ar kito reiškinio dydžio arba jo lygio, o suteikia lyginamąją charakteristiką, t. y. apsiriboja šio reiškinio kitimo keičiantis situacijai (laiko ar teritorijos atžvilgiu) išmatavimu. Indeksu, kaip ir bet kuriuo kitu santykiniu rodikliu, abstrahuojamasi nuo reiškinio absoliučios reikšmės, pvz., einamaisiais metais, palyginti su baziniais, didelės akcinės bendrovės ir mažos privačios įmonės produkcijos apimtis padidėjo

£% (indeksas - 1,05). Abiejose įmonėse produkcijos apimtis didėjo vienodais tempais, tačiau tai nereiškia, kad pagal absoliučią produkcijos apimtį šios įmonės vienodos, kad produkcijos padidėjimas 5 % abiejose įmonėse turi tą pačią ekonominę reikšmę. Todėl indeksinius skaičiavimus būtina papildyti reiškinių absoliutaus pasikeitimo skaičiavimais.

Ne kiekvieną santykinį dydį galima vadinti indeksu, nes lyginami turi būti laiko ar teritorijos atžvilgiu vieno ir to paties ekonominio turinio reiškiniai. Indeksuojamų rodiklių ekonominis turinys - tai pirmiausia jų kokybinė pusė - rodiklio kategorija (pvz., pramonės produkcija), vietos ir laiko bei statistinė charakteristika (absoliutinis dydis, santykinis dydis, vidurkis).

Kaip nurodė anglų ekonomistas R. Alenas, reikėtų neatsieti indeksų ekonominio ir statistinio aspektų ir nenagrinėti indeksinio skaičiaus abstrakčiai. Tačiau rodiklių ekonominis turinys priklauso nuo jų ryšio su kitais rodikliais pobūdžio. Ypač svarbus čia priežasties ir pasekmės ryšys. Indeksams būdingas bruožas - jie sudaro tarpusavyje susijusių rodiklių sistemas. Dažniausiai tai rodiklių - dauginamųjų - sistemos, sudarytos funkcinio ryšio pagrindu.

95

Page 95: Statistika I Ona Gražytė-Molienė

K

i indeksais plačiąja prasme vadinami ypatingos rūšies sisteminiai dydžiai, kurie atspindi sudėtingų socialinių ekonominių reiškinių

arba atskirų elementų kitimą laiko ar teritorijos atžvilgiu. Todėl vieni ir tie patys rodikliai (pvz., dinamikos santykiniai dydžiai) turi dvejopą paskirtį: jeigu jie nesudaro sistemos, tai juos vadiname dinamikos santykiniais dydžiais (didėjimo koeficientais" ar didėjimo tempais), o"jeigu~!iu3!ro - indeksais (kad būtų galima atskirti juos nuo tikrąja ta žodžio prasme apibrėžiamų indeksų, juos priimta vadinti individualiais indeksais, kai jie atspindi sudėtingo reiškinio tam tikro elemento kitimą pvz., konkrečios prekės kainos ar kiekio kitimą). \

Tais atvejais, kai lyginamieji dydžiai laiko ar teritorijos atžvilgiu gali būti pakeisti tam tikrų tarpusavyje susijusių dydžių sandaugos arba tų sandaugų sumos santykiu, pastarąjį be abejonės vadinsime indeksu, pvz., parduotuvės kasos įplaukų sumą galima pakeisti parduotų prekių kiekio ir jų kainų sandaugų suma. Vadinasi, šių dydžių santykis vadinamas indeksu.

Indeksų metodo privalumas sujungti į tam tikrą tikslinės krypties sistemą izoliuotus statistinius dydžius ir yra ta kokybiškai nauja statistinių duomenų apdorojimo pakopa, kuri išskiria šį metodą iš santykinių dydžių ir vidurkių metodų.

Konkretūs įvairiarūšiai uždaviniai, kurie sprendžiami indeksų metodu, gali būti sujungti į du pagrindimus:

a) socialinių ekonominių reiškinių lygių lyginamoji charakteristika (laiko, teritorijos, normatyvų atžvilgiu);

b) sudėtingo reiškinio pokyčio rodiklio (absoliutaus ir santykinio) išskaidymas į jo sudedamąsias dalis arba, kitaip sakant, sudėtingo reiškinio pokyčio dėl kiekvieno veiksnio atskirai nustatymas.

Statistikos praktikoje susiklostė dvi indeksų koncepcijos. Pirmoji, kuri vadinaraa-siatetine, indeksus traktuoja kaip sudėtingų socialinių ekonominių reiškinių lyginamąją charakteristiką (t. y. indeksų metodu sprendžiamas pirmasis uždavinys). Antroji, kuri vadinama analitine, indeksus traktuoja kaip veiksnių įtakos rodiklius (t. y. indeksų metodu sprendžiamas antrasis uždavinys).

Pavyzdžiui, pagal pirmąją koncepciją kainų indeksas yra nustatytos prekių visumos kainų kitimo rodiklis, t. y. suteikia dviejų laikotarpių kainų lygio lyginamąją charakteristiką, o pagal antrąją koncepciją kainų indeksas yra prekių vertės kitimo dėl kainų kitimo rodiklis. Statistikos praktikoje būtina abiejų koncepcijų vienybė, nes indeksų metodas leidžia spręsti ir sintetinio, ir analitinio pobūdžio uždavinius.

Indeksai - tai iš esmės praktinės konstrukcijos, todėl priklausomai nuo tyrimo tikslo ir uždavinio, tiriamų reiškinių pobūdžio bei informacijos apie juos turi būti parenkamos atitinkamos indeksų formos bei jų skaičiavimo būdai.

f Taig santykiniai

96

Page 96: Statistika I Ona Gražytė-Molienė

9.2. INDEKSŲ RŪŠYS

Priklausomai nuo to, ką indeksas atspindi - ar sudėtingo reiškinio tam tikro elemento kitimą, ar to reiškinio tam tikrų elementų grupės kitimą, ar visos sudėtingo reiškinio elementų visumos kitimą laiko ar teritorijos atžvilgiu - turime individualiuosius, grupinius ir bendruosius (suvestinius) indeksus.

'~~“'Makrolygiu yra skaičiuojami indeksai defliatoriai, pvz., bendrojo nacionalinio produkto, nacionalinių pajamų, bendrojo prekių bei paslaugų vartojimo ir pan. Indeksai defliatoriai_.-. tai tiriamo makrolygio rodiklio faktinėmis kainomis” santykis su tuo pačiu rodikliu pastoviomis kainomis (skirtingi šio rodiklio komponentai faktinėmis kainomis atitinkamais būdais perskaičiuojami pastoviomis kainomis).

Tarptautinėje praktikoje indeksus priimta žymėti simboliais “i ” ir “I ” (lotyniško žodžio index pirmOjrraidė), čia i - individualusis indeksas, I - bendrasis indeksas. Ženklas “1 ‘Lj^iški^^inamgjį laikotarpį;. “Q” - bazinį laikotarpį; q - produkcijos (prekių) kiekį p - produkcijos (prekių) kainą. Daugelio kitų rodiklių simbolika neprivaloma ir yra tik susitarimo dalykas.

Socialiniai ekonominiai reiškiniai, galinantys tapti indeksinės analizės objektu, skirstomi į tris tipiškas rūšis: kiekybiniai (charakterizuoja tiriamos visumos arba jos dalies dydį, kurį galima tie'siogiai nustatyti, pvz., prekių kiekis, darbuotojų skaičius, pasėlių plotas), kokybiniai (rodo tam tikrą savybę'būdingą atskTriems vienėtams'arba jų grupėms, pvz., kairia, savikaina, darbo našumas, darbo užmokestis, derlingumas) ir apimties (gaunami kaip pirmųjų rodiklių sandauga, rodanti ’bendrą tiriamo reiškinio apimtį, pvz., prekių apyvarta, gamybos sąnaudos, produkcijos vertė, darbo užmokesčio fondas, bendrasis derlius).

Tarpusavyje susiję ir indeksuotini kiekybiniai bei kokybiniai rodikliai gali būti suskirstyti į dvi rūšis: palyginamus ir nepalyginamus.

Kiekybinių rodiklių lyginamumą lemia jų vienarūšiškumas konkretaus ekonominio ryšio atveju, pvz., vienos ir tos pačios rūšies prekės lyginamos kaip vartojamosios vertės, o įvairios prekės nepalyginamos, nes skirtingos vartojamosios vertės. Tuo tarpu kiekybinio rodiklio mato vienetų skirtingumas yra tik formalus, neturintis įtakos realiam visumos vienetų lyginamumui (pvz., gali būti įvairiarūšės produkcijos vienodi natūriniai mato vienetai, tačiau dėl to ji netampa palyginama).

Kokybinių rodiklių lyginamumas yra visiškai savarankiško pobūdžio ir nepriklauso nuo visumos vienetų arba jų grupės, kurioms šios reikšmės priklauso, lyginamumo. Kokybinių rodiklių lyginamumą sąlygoja visų jo reikšmių bendras matas, įgalinantis nustatyti visų visumos vienetų reikšmių sumą.

97

Page 97: Statistika I Ona Gražytė-Molienė

Apimties rodiklių lyginamumas sutampa su kokybinio rodiklio lyginamumu: jeigu šis rodiklis palyginamas, tai palyginamas ir apimties rodiklis, ir atvirkščiai.

Neretai lyginamumo sąvoka sutapatinama su tiesioginio sumavimo galimybe, o juk yra priešingai, pvz., negalimumas sumuoti įvairių produkcijos rūšių natūrine išraiška yra jų, kaip vartojamųjų verčių, nepalyginamumo padarinys. Todėl tiriant sudėtingų reiškinių kitimą indeksų metodu, svarbu žinoti, jog sumuoti galima tik palyginamus reiškinius, o nepalyginamųreiškimų sumjjSSnegSlimal ........ “....... _ _ ......„— ------ ___

—.Sudarant indeksus reikia vengti formalių jų konstrukcijųTTtlCrTikslu prasmingas kokybinių rodiklių skirstymas į dvi rūšis: endogeninius (vidinės kilmės) ir egzogeninius (išorinės kilmės). Pirmieji yra realus apimties rodiklio veiksnys, antrieji - formalus jo veiksnys. Pavyzdžiui, turime du kokybinius rodiklius, (apskaičiuotus remiantis vienu skaitikliu - grūdų bendrasis derlius): vidutinis grūdų derlingumas ir grūdų gamyba vienam gyventojui. Pirmasis rodiklis yra endogeninis, antrasis - egzogeninis. Todėl apimties rodiklio (bendrojo derliaus) atžvilgiu pirmasis kokybinis rodiklis yra realus veiksnys, o antrasis - formalus. Į apimties rodiklių bendruosius indeksus įtraukiami tik endogeninių požymių rodikliai, nes tik tokiu atveju gaunamas prasmingos statistinės visumos modelis su tiesioginiais jos pokyčių veiksniais.

9.3. BENDRŲJŲ INDEKSŲ FORMOS

Individualiųjų indeksų skaičiavimas kiekybiniams ir kokybiniams

rodikliams nesudaro jokių sunkumų (pvz., kainų indeksas ip = — , kiekiopo

indeksas iq = — ). Bendru pavidalu individualųjį indeksą galime užrašyti taip:qo

ii/ o = — > čia Xi ir x 0 - einamojo ir bazinio laikotarpių indeksuojamas dydisxo

(kaina, kiekis, savikaina ir pan.).Individualieji (elementarūs) indeksai pasižymi tam tikromis savybėmis,

kurios tikrinamos tokiais testais:a) identiškumo (tam tikrą laikotarpį, kurį apima indeksas, paėmus

palyginimo baze, indeksas turi būti lygus 1):(9.1)

b) grįžtamumo laike (indeksai, kurie apskaičiuojami einamąjį laikotarpį lyginant su baziniu, o bazinį - su einamuoju, yra atvirkštiniai dydžiai: jų sandauga lygi 1):

it/o'io/t=l; (9-2)

98

Page 98: Statistika I Ona Gražytė-Molienė

c) veiksnių grįžtamumo (veiksnių indeksų sandauga lygi veiksnių sandaugos indeksui), pvz.:

i p ' i q = i p q , ( 9 - 3 )

d) cirkuliariniu (nuoseklių grandininių indeksų sandauga lygi baziniam indeksui):

i t - i /o ' i t - 2/ t - i ’ • • • i t / t -n =it/o> (9-4)

e) nepriklausomumo nuo mato vienetų (mato vienetams pasikeitus indekso dydis nesikeičia), pvz.:

q»(kg) = j*(t) ( qqo(kg) qo(t)'

Pagrindiniais paprastai laikomi b), c) ir d) testai, kurie taikomi ne tik individualiųjų , bet ir kai kurių bendrųjų indeksų savybėms patikrinti. jf- . Bendriesiems indeksams sudaryti reikia daugiau informacijos, o

priklausomai nuo to - ir atitinkamos indekso formos.Praktikoje naudojami bendrieji agregatiniai ir vidurkiniai indeksai.Pagrindinė bendrųjų indeksų forma yra agregatiniai indeksai (lot.

aggregatus - prijungtas). Agregatiniai indeksai atsirado kaip priemonė atlikti sintetinę funkciją, kad būtų galima gauti apibendrinamąją sudėtingų reiškinių dinamikos charakteristiką.

Indeksų teorijos kūrėjas E. Laspeiresas, pirmąkart pasiūlęs agregatinį kainų indeksą (1871 m.), j į vertino tik kaip apibendrinantį santykinį rodiklį, kurio tikslas - sintezuoti bet kurio įvairiarūšių produktų rinkinio įvairių krypčių kainų kitimą. Toliau šią teoriją rutuliojo indeksologai H. Paašė, A. Maršalas, A. Bouli, I. Fišeris ir kt.

G. Kovalevskio tvirtinimu, agregatiniai indeksai sukurti ir publikuoti daug anksčiau. Šis nuopelnas priskiriamas anglų ekonomistui T. Manui (1609 m.) ir rusų ekonomistams F. Virstui (1803 m.) bei V. Ščiotkinui (1810 m.).

Per ilgą indeksų istoriją jų konstrukcijos keitėsi ir tobulėjo. Tai matyti 1 lentelėje (čia formulės pateiktos supaprastinta algebrine indeksų išraiškos forma, nurodyta ir indeksų paskelbimo data):

99

Page 99: Statistika I Ona Gražytė-Molienė

9.1 lentelė. Bendrųjų indeksų konstrukcijosIndekso

pavadinimasPastabos

I p

Karliindeksas(1750)

n - prekių skaičius; indeksas nesvertinis; mažas informatyvumas

1 y Pi

n Po

i y

Laspeiresoindeksas(1871)

Svoriai yra bazinio laikotarpio kaina (p0) ar kiekis (q 0) 0

'L P o V o

Paašėindeksas(1874)

Svoriai yra einamojo laikotarpio kaina (p i) ar kiekis(qi)

'LP il i, 'L P o V i M

M►o

Maršalo-Edžvortoindeksas(1888)

Svoriai yra bazinio ir einamojo laikotarpio atitinkamų rodiklių suma

X a (9o+9i) £?,(/>»+/v) X?°(p»+p')

Lou indeksas (1822)

Svoriai yra atitinkamų rodiklių vidurkiai M

M lh I

Fišerioindeksas(1911)

Geometrinis atitinkamų Laspeireso ir Paašė indeksų sandaugos vidurkis

Bendrieji indeksai gali būti apskaičiuojami ir palyginamiems, ir nepalyginamiems reiškiniams. Pagrindinė nepalyginamų indeksuojamų reiškimų ypatybė ta, kad jų (pvz., įvairiarūšės produkcijos fizinės apimties) dinamiką galima tirti tik agreguota forma.

Agregatinio indekso skaitiklis ir vardiklis išreiškiami kaip atitinkamų kiekybinio ir kokybinio rodiklių sandaugų suma. Vienas indekso komponentas yra indeksuojamas dydis (tas, kurio kitimą šis indeksas atspindi), kitas indekso komponentas - fiksuotas dydis, paprastai vadinamas svoriu (kiekybinių rodiklių indeksuose jis atlieka bendramačio vaidmenį, pvz^-'teiina, savikaina, darbo laiko sąnaudos).

Ilgametėje mūsų statistikos praktikoje agregatiniai kainų indeksai buvo skaičiuojami pagal Paašė formulę, o fizinės apimties indeksai - pagal Laspeireso formulę (tai sietina su ekonominės prasmės traktavimu):

I p = Ž Plgl (svoriai - einamojo laikotarpio kiekis qt) (9.6) ZjP^l

I,L = l ^ qlP° (svoriai - bazinio laikotarpio kaina p 0). (9.7)

100

Page 100: Statistika I Ona Gražytė-Molienė

Č iaS p ią i, Eq0p 0, ir 2q ip0 - atitinkamai einamojo ir bazinio laikotarpio bei sutartinė produkcijos (prekių) vertė.

Kadangi šiuose indeksuose svoriai yra realūs dydžiai, šie indeksai vadinami apyskaitiniais. Jiems apskaičiuoti būtini ištisinio stebėjimo duomenys apie indeksuojamus dydžius ir svorius. Tokia informacija rinkos sąlygomis galima tik mikro lygiu (įmonės, firmos). Ir tik turint tokią informaciją galima tiriamų reiškinių indeksinė faktorinė analizė (nustatomas santykinis ir absoliutus apimties rodiklio pakitimas dėl konkrečių veiksnių). Iš tikrųjų šių indeksų skaitiklio ir vardiklio skirtumas turi konkrečią ekonominę prasmę. £ p iq i-£ p 0qi rodo absoliučią ekonomijos (arba nuostolio) sumą, t. y. produkcijos (prekių) vertės pakitimą dėl kainų pokyčio. Sqip0-S q 0Po rodo absoliutų vertės pakitimą dėl produkcijos (prekių) fizinės apimties pokyčio.

Atitinkamų indeksų I p ir I q (pagal Laspeiresą ir Paašė) sandauga yra produkcijos (prekių) vertės indeksas:

Ipq= I pp -IqL arba I PL-Iqp. (9.8)

Tiesioginė šio indekso formulė tokia:

I p q = # ^ L. (9-9)

Pats indeksas atspindi santykinį produkcijos (prekių) vertės kitimą, o šio indekso skaitiklio ir vardiklio skirtumas (Sp1q 1-S p ūqo) - absoliutų jos pakitimą dėl dviejų veiksnių:

a) produkcijos (prekių) kainų pakitimo;b) fizinės apimties pakitimo.Beje, kaip nustatė V. Bortkevičius (1922-1924), bendriesiems

indeksams, apskaičiuotiems pagal Paašė ir Laspeireso formules, galioja tokia priklausomybė:

I pp : I pL = l + r ipiq-Vip-Viq; (9.10)

čia rįPjq - tiesinis koreliacijos koeficientas, nustatantis ryšio glaudumą tarp produkcijos kainų ir fizinės apimties individualiųjų indeksų;

Vįp ir Viq - atitinkamai produkcijos kainų ir fizinės apimties individualiųjų indeksų variacijos koeficientai.

V. Bortkevičiaus lygybės sudedamieji elementai apskaičiuojami pagal tokias formules:

101

Page 101: Statistika I Ona Gražytė-Molienė

(9.11)

čia:

(9.12)

(9.13)

(9.14), (9.15)

Analogiška priklausomybe susiję ir bendrieji fizinės apimties indeksai, apskaičiuoti pagal Paašė ir Laspeireso formules.

Statistinis santykis tarp Paašė ir Laspeireso indeksų formų (t.y. tų pačių indeksų su einamojo ir bazinio laikotarpio svoriais) apibūdinamas taip:

1) I p > I , kai r > 0 ; kainos ir kiekiai linkę keistis viena kryptimi;

2) I^ < Ip kai r < 0 ; kainos ir kiekiai turi tendenciją keistis priešingomis kryptimis.

3) tik retais atvejaisl J = I į-, kai:a) neegzistuoja koreliacinis ryšys tarp individualiųjų kainų ir kiekio

indeksų, t. y. ripįq = 0 arbab) visi agreguojamų prekių individualieji kainų indeksai tarpusavyje

lygūs, t. y.Sįp = 0 ir V įP = 0 arbac) visi agreguojamų prekių individualieji kiekio indeksai tarpusavyje

lygūs, t. y. Siq = 0 ir Viq = 0. Reikia pripažinti, kad svorių pasirinkimas yra tik sąlygiškas indeksavimo principas. Kai kurių statistiką tvirtinimu (V. Peregudovo, L. Kazineco ir kt.), reikėtų išlaikyti bendrą svorių parinkimo principą - ir kiekybiniams, ir kokybiniams rodikliams imti bazinio laikotarpio svorius (Laspeireso indeksų variantas). Tačiau tokiu atveju kiekybinių ir kokybinių rodiklių indeksų sandauga neatitiktų apimties rodiklio indekso.

Tiriant kiekybinių palyginamų reiškinių dinamiką, nereikia apskaičiuoti indeksų agregatine forma, kadangi juos galima nustatyti „grynu” pavidalu,

102

Page 102: Statistika I Ona Gražytė-Molienė

pvz., dviejų įmonių vienarūšės produkcijos dinamiką galima nustatyti kaip jos kiekio natūrine išraiška santykį:

(9.16)2 ^°

Tuo tarpu šių reiškinių agregatinis fizinės apimties indeksas atspindi fizinės apimties (kiekio) pasikeitimą ne grynuoju pavidalu, o kartu su struktūra (tiesa, ne su pakitusia ataskaitiniu laikotarpiu, o su buvusia baziniu laikotarpiu). Todėl kiekvienas fizinės apimties indeksas atspindi reiškinio kiekybinį pakitimą kartu su jo struktūrine (kokybine) būkle. Vadinasi, bet kurio apimties rodiklio pokytis formuojasi dėl trijų veiksnių: kiekybinio, kokybinio ir struktūrinio. Tai galima išreikšti lygybe:

I m _ Įg . lipiai rZgiPo , 'L ‘ioPo'

Ipq o(9.17)

Tačiau tai, kaip ir daugelis kitų faktūrinės indeksinės analizės klausimų, yra tolesnių studijų uždavinys.

9.4. VIDURKINIAI INDEKSAI

Be agregatinių, kaip pagrindinės bendrųjų indeksų formos, naudojami^vidurkiniai_indeksai. Pastarieji apskaičiuojami remiantis aritmetiniu,harmoniniu ir geometriniu (Fišerio indeksas) vidurkiais.

Ankstyvieji vidurkiniai kainų indeksai (D. Karli - XVIII a. pab.; A. Sauerbeko - XIX a. pab.) buvo nesvertiniai, todėl negalėjo realiai atspindėti visų įvairiarūšių prekių kainų pakitimo. XIX a. viduryje U. Dževonsas pasiūlė bendrąjį kainų indeksą skaičiuoti pagal paprasto geometrinio vidurkio formulę Vnip, o XX a. pradžioje J. Fišerio pasiūlyta “idealaus” indekso forma buvo atitinkamų agregatinių Laspeireso ir Paašė indeksų sandaugos geometrinis vidurkis:

I nF = ^Ip -Ip i r I qF = Ą H ' - (9-18)

Mūsų statistikos praktikoje dažniausiai buvo naudojami svertiniai vidurkiniai indeksai - tai vidurkinis aritmetinis ir harmoninis indeksai. Jie yra išvestiniai iš agregatinės indekso formos. Praktinis jų naudojimas siejamas su turima informacija apie tiriamų socialinių ekonominių reiškinių apimties rodiklius lyginamaisiais laikotarpiais ir individualius kiekybinių ar kokybinių rodiklių indeksus.

103

Page 103: Statistika I Ona Gražytė-Molienė

Pavyzdžiui, žinant einamojo ir bazinio laikotarpio produkcijos (prekių) vertę ir individualius kainų indeksus, agregatinis kainų indeksas nesunkiai pertvarkomas į vidurkinį harmoninį indeksą: (9-19)

j p =

p,čia po = ■ip

Agregatinis fizinės apimties indeksas, atlikus pertvarkymus, įgauna vidurkinio aritmetinio indekso formą:

y <l\P\

ip'Z .'lo P o

' ffo Po ' f a_

'žioPo Z?oA>(9.20)

(čia svoriai - yra bazinio laikotarpio produkcijos arba prekių vertė). Kaip matome, sąlygiškos produkcijos (prekių) vertė gali būti nustatoma

ne tik tiesioginiu būdu (2q ip 0), bet ir išvestiniu būdu, panaudojantPiindividualius kainų indeksus (tada Sqip0=

indeksus (tada Sqip0=I] i q • qoPo) •5 >

-) arba fizinės apimties

Pavyzdys9.2 lentelė. Turime tokius duomenis apie audinių parduotuvės prekių

apyvartą ir kainų indeksus

Audiniai Prekių apyvarta, tūkst. Lt

Kainųindeksai

Einamojo laikotarpio prekių apyvarta bazinio

laikotarpio kainomis (sutartinė), tūkst. Lt

Bazinįlaikotarpi

Einamąjįlaikotarpį

Medvilniniai 300 380 1,05 361,9Lininiai 250 300 1,20 250,0Vilnoniai 450 520 1,14 456,1Iš viso 1000 1200 - 1068,0

Apskaičiuojame bendruosius vidurkinius indeksus:

a) kainų:. į p _ ^ P \ 9 i _ 1 2 0 0 _ j

1 Pigi ' ip

1068124 arba 112,4'

104

Page 104: Statistika I Ona Gražytė-Molienė

b) fizinės apimties: I L = ip = = 1,068 arba 106,8 %;ZjVoPo 1000

c) prekių apyvartos: I = = 1,2 arba 120 %.2 j Po<1o 1000

Prekių apyvartos indeksą galima apskaičiuoti ir išvestiniu būdu, remiantis indeksų priklausomybe:

Ipq “ J p ' Iq ~ 1 • 124 * 1.068 — 1,2.

Išvada. Audinių kainos einamąjį laikotarpį, palyginti su baziniu, padidėjo 12,4 %, jų fizinė apimtis - 6,8 %, o visa prekių apyvarta - 20 %.

Analogiškai agregatiniams indeksams ir pastarųjų apyskaitinių indeksų ekonominė prasmė nustatoma kaip atitinkamų indeksų skaitiklio ir vardiklio skirtumas.

Dabartiniu metu statistikos praktikoje vis plačiau naudojami atrankiniai duomenys bendriesiems indeksams apskaičiuoti. Ypač paplitęs vartojimo kainų indeksas (VKI), atspindintis realią fiksuoto prekių ir paslaugų rinkinio (atitinkančio vidutinio tipo šeimos vartojimo lygį ir struktūrą), kainų dinamiką. Šiam indeksui apskaičiuoti taikoma modifikuota Laspeireso kainų indekso formulė:

V K I= S ip -w0, (9.21)

čia ip = — individualieji prekių - reprezentančių indeksai;p o

wo = J ioPo-----bazinio laikotarpio vartojamų prekių ir paslaugųZVoPo

lyginamieji svoriai („vartojimo krepšelio” struktūra).(Kadangi £w0= l, svertinio aritmetinio vidurkio formulėje vardiklis

nerašomas). VKI skaičiuojamas naudojant atrankinius namų ūkių tyrimo bei atrankinius vartojimo prekių ir paslaugų kainų stebėjimo rezultatus. Todėl vienintelė jo atliekama funkcija - sintetinė, t. y. lyginamoji kainų lygio charakteristika. Sintetinė ir analitinė funkcijos būdingos tik apyskaitiniams indeksams.

Plačiau apie VKI skaičiavimus žr. S. Martišius, O. Molienė. Vartojimo kainų indeksų teorija ir praktika. V.: VU, 1994.

105

Page 105: Statistika I Ona Gražytė-Molienė

9.5. VIDUTINIO LYGIO INDEKSAI

Statistikos praktikoje dažnai susiduriame su reiškinių vidutinio lygio rodikliais. Tai palyginamų (vienarūšių) kokybinių rodiklių svertiniai vidurkiai (pvz., vienarūšės produkcijos kaina, vidutinė savikaina, vidutinis išdirbis, vidutinis darbo užmokestis, vidutinis derlingumas).

Bendrą kokybinio rodiklio vidurkio dydį lemia, viena vertus, šio rodiklio lygis atskirose visumos dalyse (grupėse), antra vertus, tų dalių (grupių) lyginamasis svoris visumoje. Vadinasi, vidutinio lygio kitimą lemia tie patys veiksniai, t. y. jų pokytis.

Analizuojant vidutinio lygio dinamiką ir ją lemiančių veiksnių įtaką (analitinė indeksų funkcija), naudojama bendrųjų indeksu sistema: kintamos sudėti^Jiaitovias4ftkxmm^ u d ė t ie s ir stridtūuniuį&&ijnkįų indeksai.

JejJuiJtjįį in i rodikli (kainą, savikainą, darbo našumą/'3arb0"ažmokestį, derlit%uM^'pSzymesime x, kiekybinį rodiklį (produkcijos ar prekių kiekį, darbuotojų skaičių, pasėlių plotą) - f ir apimties rodiklį (produkcijos (prekių) vertę, darbo užmokesčio fondą, bendrąjį derlių) - M, tai šie indeksai atrodys taip:

(9.22)

(kintamos sudėties)

čia ir xa - einamojo ir bazinio laikotarpio vidutinis lygis.Tą patį rezultatą galima gauti ir išvestiniu būdu, naudojant indeksų

tarpusavio priklausomybę, t. y. apimties rodiklio indeksą dalijant iš kiekybinio rodiklio indekso: IM/ I f .

_^-T Kiekvienas kintamos sudėties indeksas atspindi tiriamo reiškinio ^ vidutinio lygio santykinį kitimą dėl dviejų veiksnių: s—----- a) reiškinio lygio kitimo konkrečiose visumos grupėse;

b) reiškimo struktūros kitimo.Norint nustatyti šių veiksnių įtaką, apskaičiuojami pastovios sudėties ir

struktūrinių poslinkių indeksai, kurių kiekvienas turi konkrečią ekonominę prasmę.

Kokybinių reiškinių pastovios sudėties indeksas gali būti užrašomas dviem formom:

2) I x = = 4 , (9.23)2 ,-A L ,) i

106

Page 106: Statistika I Ona Gražytė-Molienė

(pastovios sudėties)

čia x' - sąlygiškas vidutinis lygis.Pastarąjį indeksą galima užrašyti ir agregatine forma: (9.24)

T _ X xi/i _ X Mi X V i ' Z K ’

'" Abiem atvejais pastovios sudėties indekso santykinis dydis vienodas Gis atspindi tiriamo reiškinio vidutinio lygio kitimą tik dėl vieno veiksnio - to reiškinio lygio konkrečiose visumos grupėse kitimo, esant pastoviai reiškinio struktūrai), tačiau šių indeksų ekonominė prasmė (kuri nustatoma kaip šio indekso skaitiklio ir vardiklio skirtumas) kitokia:

Axx = * ,-* ; — (9.25)

absoliutus vidutinio lygio pokytis dėl tiriamo reiškinio lygio (kokybinio rodiklio) pakitimo konkrečiose visumos dalyse;

AMx=SX ifi-Sx0f 1 = SM1-SMo'. — (9.26)

absoliutus apimties rodiklio pokytis dėl to paties veiksnio - tiriamo reiškinio lygio pakitimo konkrečiose dalyse.

Ir pagaliau struktūrinių poslinkių indeksas atspindi tiriamo reiškinio vidutinio lygio santykinį kitimą taip pat dėl vieno veiksnio, šiuo atveju -

l^^jejjkioįo^stniktūro^ kitimo:

-j-4 T _ ^ xofi į X xo fp _ 20_J ) 1 (struktunnių poslinkių) X"1 r \ r ----------•I / i

Kai struktūrinių poslinkių indeksas užrašomas kaip dviejų vidurkių - sąlygiško (xj) ir bazinio laikotarpio (x0) santykis, skaitiklio ir vardiklio skirtumas rodo absoliutų vidutinio lygio pakitimą dėl reiškinio struktūros pokyčio.

Visais atvejais tarp šių trijų indeksų galioja priklausomybė:

i I kintam os sudėties I pastovios sudėties * I struktūrinių poslinkių ( 9 . 2 8 )

Remiantis šia priklausomybe, galima apskaičiuoti bet kurį nežinomąjį,pvz.:

I struktūrinių poslinkių I kintam os sudėties • I pastovios sudėties. ( 9 . 2 9 )

107

Page 107: Statistika I Ona Gražytė-Molienė

Vidutinio lygio indeksų sistema įgauna kitokį pavidalą, kai šių indeksų svoriai yra ne kiekybinių rodiklių absoliutinės reikšmės (f), o jų lyginamieji svoriai (d). Šiuo atveju indeksų formulės tokios:

1) I ; = ^ L = (9J0)^J^l 0 *0

čia

- f\ A. - -Jid,= I* “ d,,=XČBe to, sdi=sd0=l.

2) T _ _

x I v ,

3) id_ Z V i

X*orfo

(9.31)

(9.32)

Tai akivaizdus abiejų indeksų sistemų atitinkamų indeksų tapatumas. Jų praktinis naudojimas priklauso nuo turimų duomenų apie indeksų svorius - absoliutūs jie, ar - santykiniai dydžiai (lyginamieji svoriai). Pastarieji vis plačiau taikomi indeksiniuose skaičiavimuose.

Vidutinio lygio dinamiką lemiančių veiksnių tyrimas indeksų metodu galimas tik žinant tiriamos visumos sudėtį (struktūrą) ir atitinkamo kokybinio rodiklio grupinius vidurkius lyginamais laikotarpiais. Tai, be abejo, siejama su tikslingu grupavimo metodo naudojimu, kuris leidžia detaliau analizuoti struktūrinius poslinkius ir jų kaitos intensyvumą.

Šie klausimai išsamiai nagrinėjami S. Martišiaus „Indeksiniai skaičiavimai: teorija ir algoritmai”. V., 1990.

9.6. TERITORINIAI INDEKSAI

Indeksai, kurie išreiškia sudėtingų socialinių ekonominių reiškinių santykinį kitimą erdvėje (įmonių, miestų, ekonominių rajonų, šalių atžvilgiu),^gHinarpi

Individualūs teritoriniai indeksai iš esmės yra lyginimo santykiniai

dydžiai ir jų apskaičiavimas nesudaro sunkumų (jeigu išlaikytos visos tokiems santykiniams dydžiams keliamos lyginamumo sąlygos).

Sudarant bendruosius teritorinius indeksus, iškyla lyginimo bazės (tam tikros teritorijos arba objekto) bei atitinkamų svorių pasirinkimo problema,

108

Page 108: Statistika I Ona Gražytė-Molienė

kuri sprendžiama priklausomai nuo tyrimo tikslo ir uždavinių. Pavyzdžiui, jei norime palyginti daržovių kainas Vilniaus ir Klaipėdos miestuose, iš karto kyla klausimas, kokį tiriamų daržovių kiekį (arba jų dalį) imti svoriu: qv,q K, qv+qK ar q - standartinį rinkinį. Priklausomai nuo to, galimi tokie bendrųjų teritorinių kainų indeksų variantai:

(9'33)' (9'34)

Ziv(qv +qK) . _ Xjvq<PkQd),p = X r - <9J5)-(9'36)

(Maršalo-Edžvorto atsvėrimo principas).Pastaroji teritorinio kainų indekso forma gali būti naudojama tiriant

prekių ir paslaugų vartojimo kainų skirtumus atskiruose miestuose ir rajonuose. Šiuo atveju svoriais galėtų būti fiksuota visos šalies gyventojų vartojamų prekių ir paslaugų struktūra, t. y. atitinkamų prekių ir paslaugų grupių dalis vidutinėse namų ūkių narių vartojimo išlaidose. Tai, savo ruožtu, leistų įvertinti ir teritorinį pinigų perkamosios galios svyravimų aspektą.

Skaičiuojant bendruosius teritorinius fizinės apimties indeksus, svoriais paprastai imamos vidutinės atitinkamų prekių kainos lyginamuose objektuose (pvz., Vilniaus ir Klaipėdos miestuose):

Iq= | ^ £ , (9.37)

čia p - atitinkamos prekės vidutinė kaina abiejuose miestuose.Analogiškai atliekami ir kiti socialinių ekonominių reiškinių

teritoriniai palyginimai indeksų metodu.

9. KONTROLINIAI KLAUSIMAI

1. Kas yra indeksai ir kokia jų paskirtis?2. Ką reiškia indeksų sintetinė ir analitinė funkcijos?3. Kaip skirstomi indeksuotini dydžiai?4. Kokios yra indeksų rūšys?5. Kokios yra bendrųjų indeksų formos?6. Kuo skiriasi Paašė ir Laspeireso bendrieji indeksai?7. Kokia yra vidutinio lygio indeksų sistema? Kokia šių indeksų

prasmė?8. Kokie žinomi indeksų priklausomybės atvejai?9. Kokia teritorinių indeksų esmė ir paskirtis?

109

Page 109: Statistika I Ona Gražytė-Molienė

10. ĮVADAS Į KORELIACINĘ-REGRESINĘ ANALIZĘ

10.1. KORELIACIJOS IR REGRESIJOS SAMPRATA

Reiškinių ryšių tyrimas - svarbi empirinių tyrimų sritis. Visapusiška socialinių ekonominių reiškinių analizė galima tik nustačius jų tarpusavio sąsają, t.y. išaiškinus faktorinius ir rezultatinius požymius (kintamuosius), nustačius sąsajos formą ir jos stiprumą. Kaip žinome, tie požymiai, kurie lemia kitų požymių reikšmes, vadinami f aktoriniais (X), o požymiai, kurie priklauso nuo pirmųjų - rezultatiniais (Y). Pvz., pajamų lygis- X, vartojimo lygis - Y.Galimi atvejai, kai tas pats požymis gali būti faktoriniu arba rezultatiniu, priklausomai nuo to, kieno atžvilgiu jis nagrinėjamas, pvz., darbo stažas (X) —> darbo produktyvumas (Y); darbo produktyvumas (X) —► darbo užmokestis (Y).

Tikroji reiškinių priklausomybė išryškėja ne iš pavienių faktų, o iš didelio jų skaičiaus, nustačius pasikartojančius lemiančius veiksnius. Visuomenės socialiniame gyvenime egzistuojantys ryšiai (sąsajos) didžia dalimi priklauso nuo žmonių tikslinės veiklos ir yra apsprendžiami daugybės vidinių ir išorinių veiksnių, kurių poveikis rezultatiniam požymiui (pvz., gyvenimo lygiui) nevienareikšmis ir nelengvai išmatuojamas.

Rezultatiniu požymių lygį gali atitikti dažnai skirtingos faktoriniu požymių reikšmės. Esant tokiai situacijai, kalbama apie stochastinius

(tikimybinius) ryšius. Statistikos teorijoje stochastinis ryšys laikomas nedeterminuotu, atsitiktiniu (išreiškiamas koreliacijos ir regresijos sąvokomis). Stochastinis ryšys — tai toks ryšys, kuris pasireiškia tarp

atsitiktinių dydžių taip, jog vieno dydžio pokytis veikia kito dydžio pasiskirstymą ir pastarasis nėra griežtai apibrėžtas. (Stochastinis procesas - tai procesas, kuris priklauso nuo atsitiktinumo, pvz., gali laukti autobuso nuo0 iki 30 minučių).

Koreliaciniai ryšiai sudaro stochastinės priklausomybės dalį: požymiai gali tarpusavyje nekoreliuoti, bet būti stochastiniai priklausomi, tačiau atvirkščias teiginys - požymiai stochastiniai nepriklausomi, bet tarpusavyje koreliuoja - neteisingas.

Koreliacinis (priežastinis) ryšis - tai toks ryšis, kai f aktorinio požymio reikšmių kitimas veikia tik vidutines rezultatinio požymio reikšmes. Tuo tarpu funkcinio ryšio atveju kiekvieną/aktorinio požymio reikšmę (jų kompleksą) atitinka visiškai apibrėžta rezultatinio požymio reikšmė (pvz., apskritimo ilgis- 2IIR; trikampio pagrindas ir aukštinė vienareikšmiškai apibrėžia jo plotą). Tačiau pajamų lygis ir šeimos narių skaičius vienareikšmiškai nesąlygoja

110

Page 110: Statistika I Ona Gražytė-Molienė

išlaidų kuriai nors prekei įsigyti, nes čia turime ne funkcinį, o stochastinį ryšį. Savo esme stochastinė priklausomybė yra žymiai sudėtingesnė negu funkcinė (pastarąją reikia suprasti taip: arba ji yra, arba ne). Todėl reikia vengti melagingos priklausomybės atvejų. Pvz., mirtingumo lygis bus didesnis ten, kur koncentruojasi ligoninės; nusikaltimų įvykdoma daugiau ten, kur daugiau policininkų (juk didesnio policininkų skaičiaus buvimas nėra nusikaltimų skaičiaus didėjimo priežastis, kaip ir ligoninių buvimas nėra mirtingumo didėjimo priežastis).

Dar vienas pavyzdys. Saulėtą vasaros dieną daugelis žmonių nešioja tamsius akinius, taip pat daugelis valgo ledų. Remiantis tokiais pastebėjimais neturėtų kilti noras ieškoti ryšio tarp nešiojančiųjų tamsius akinius skaičiaus ir

- valgančiųjų ledus skaičiaus, nes tai nėra priežastis ir pasekmė (čia abu dydžius veikia klimatas).

Visais atvejais, norint atsakyti į klausimą, kokios rezultatinio požymio kitimo priežastys, t. y. kokie tikrieji faktoriniai veiksniai, reikia giliau pažinti tiriamąjį reiškinį, remtis atitinkamos srities moksline teorija ir loginiu mąstymu.

Abu priklausomybės tipai - stochastinis ir funkcinis - stebimi ekonomikoje. Funkcine priklausomybe pagrįsti visi apibendrinamųjų rodiklių (vidurkių, indeksų ir kiti) skaičiavimai, balansiniai analizės metodai. Determinuotas ryšys (determinuoti - lemti, sąlygoti) fiksuojamas apskaičiuojant ekonominius rodiklius (darbo užmokesčio fondą, pelną ir kitus) ir juos analizuojant.

Socialiniams reiškiniams daugiau būdingas koreliacinis ryšys. Svarbi sąlyga, tiriant reiškinių tarpusavio priklausomybę, yra kokybinis jų visumos

vienarūšiškumas (pvz., geriausia tirti konkrečių gyventojų socialinių grupių,o ne visų gyventojų, vartojimo lygio priklausomybę nuo pajamų lygio) ir pakankamai didelis stebėjimo vienetų skaičius (kadangi dėsningumų atskleidimas pagrįstas didžiųjų skaičių dėsniu). Be to, iš daugelio veiksnių reikia atrinkti pagrindinius, kurie apsprendžia rezultatinio požymio reikšmių sklaidos didžiąją dalį, ir nepriklausomus vienas nuo kito (priešingu atveju, tokie veiksniai charakterizuotų vienas ir tas pačias tiriamo reiškinio puses ir didele dalimi dubliuotų vienas kitą), pvz., amžius ir bendras darbo stažas, nustatant sąsają su darbo produktyvumu. Visais atvejais gautos priežastinių ryšių išvados turi būti prasmingos ir logiškai paaiškintos.

Regresija įvertina statistinio ryšio (sąsajos) formą o koreliacinė analizė— to ryšio '(sąsajos) stiprumą.

Regresijos sąvoką pirmasis pavartojo F. Galtonas (XIX a. antroji pusė). Jis domėjosi paveldimumo problemomis ir pastebėjo tėvų ir vaikų ūgio priklausomybę: didelio ūgio tėvų ir vaikai dažniausiai yra aukštaūgiai, o žemo ūgio tėvų vaikai - nedidelio ūgio (čia pastebėjimas ne itin gilus). Tačiau suaugusių sūnų atžvilgiu jam pavyko nustatyti detalesnį ryšį. Jis apskaičiavo

111'

Page 111: Statistika I Ona Gražytė-Molienė

vidutinį tėvų ūgį ir nustatė, kad vidutinis suaugusių sūnų ūgis yra tarp vidutinio gyventojų ir vidutinio jų tėvų ūgio.

Jeigu vidutinis tėvų ūgis didesnis, negu vidutinis gyventojų ūgis, tai jų suaugusių sūnų, kaip taisyklė, mažesnis ir - atvirkščiai. Kitaip tariant, vaikų ūgis siekia pasislinkti nuo vidutinio tėvų ūgio prie vidutinio visų gyventojų ūgio. Šį reiškinį F. Galtonas pavadino regresija prie vidurkio, o liniją, einančią per pažymėtus grafike taškus - regresijos linija.

Iš 1078 stebėjimų Galtonas nustatė: tėvų vidutinis ūgis (x) - 179 cm, o jų suaugusių sūnų (y) - 180 cm (viršija 1 cm). Žemų tėvų (iki 170 cm) suaugusių sūnų ūgis didesnis už tėvų ūgį 5,5 cm, o aukštų tėvų (191 cm ir daugiau) - tik 0,67 cm.

Išvada. Aukštesnių tėvų suaugusių sūnų ūgis santykinai mažesnis negu žemo ūgio tėvų vaikų, palyginus su jų tėvų ūgio vidurkiu.

Skiriamos tokios regresijos rūšys:a) kintamųjų atžvilgiu

- paprastoji (ryšys tarp dviejų kintamųjų);- grupinė (ryšys tarp keleto kintamųjų);

b) formos atžvilgiu- tiesinė (kai rezultatinio požymio reikšmės kinta tolygiai);- netiesinė arba kreivinė (kai jų kitimas netolygus).Skirtinga ir jų matematinė išraiška. Tiesinė regresija išreiškiama tiesės

lygtimi'.

y = ao + aix, čia ai - regresijos koeficientas, kuris rodo, kiek vienetų pasikeičia rezultatinis požymis, faktoriniam požymiui pasikeitus vienu vienetu.

Netiesinė regresija išreiškiama parabolės: y = a0 + ajx + a2x 2; (10.1)hiperBoteSrf'=%^r&J\ ~~~ — (10.2)

ir kitomis lygtimis (plačiau - indukcinėje statistikoje).Priklausomybė tarp požymių (kintamųjų) gali būti:a) tiesioginė {teigiama regresija), kai didėjant X didėja ir Y;b) atvirkštinė {neigiama regresija), kai didėjant X mažėja Y.Tiriant reiškinių priklausomybę, pirmiausia nustatomas koreliacinio

ryšio buvimo faktas, jo kryptis ir forma. Tam tikslui taikomi tokie būdai:* eilučių sugretinimo (kai X reikšmės išdėstomos didėjimo ar mažėjimo

tvarka ir žiūrima, kaip keičiasi atitinkamos Y reikšmės);* analitinio grupavimo (dažniausiai pagal du ir daugiau požymių);* koreliacinių lentelių,

* grafinio duomenų vaizdavimo (sklaidos diagrama);* dispersinės analizės',* Fechnerio ženklų koreliacijos ir kiti.Dvimačio skirstinio pavyzdys - koreliacinė lentelė, leidžianti spręsti

apie dviejų kintamųjų ryšio (X ir Y) egzistavimą. Jos tipinė forma tokia:

112

Page 112: Statistika I Ona Gražytė-Molienė

Faktorinis

požymis (Xi) Y,Rezultatinis požymis (Yj)

Y2 Y3 ... Y;Požymio (Xj) dažniai (n;.)

Xj nn ni2 n„ ... nu Ui-x 2 n2i Ū22 H23 ••• n2l n2.X3 n3i n32 n33 ... n3i n3.

• •

Xk nkl nk2 . . . nu Ilk.Požymio (Yj) dažniai (n.j)

n.1 11.2 n.3 ... n.l n

k l

I I * = *i=l y=i

Pvz., jei faktorinis požymis X - darbininko darbo stažas, o rezultatinis požymis Y - darbo produktyvumas (našumas), tai nagrinėjant koreliacinę lentelę vertikaliai, jos kraštinėje skiltyje yra darbininkų pasiskirstymas pagal

; darbo stažą, vadinamas bendruoju empiriniu skirstiniu, o likusiose lentelės skiltyse gename sąlyginius (dalinius) empirinius s kirstinius. Nagrinėjant lentelę horizontaliai, paskutinėje eilutėje gauname darbininkų pagal darbo produktyvumą (našumą) bendrąjį empirinį skirstinį, o visose kitose eilutėse - sąlyginius (dalinius) empirinius skirstinius. Stochastinės priklausomybės

į egzistavimą apibūdina sąlyginiai skirstiniai (žr. dažnių išsidėstymą pagal i įstrižainę), tačiau koreliacinė lentelė neatsako į klausimą apie ryšio stiprumą, f Koreliacinės lentelės, t. y. dvimačio empirinio skirstinio pagrindinėsf charakteristikos yra bendrųjų ir sąlyginių skirstiniu aritmetiniai vidurkiai ir į dispersijos. Požymiai tarpusavyje nekoreliuoja, jei sąlyginių skirstinų Į vidurkiai yra vienodi, o dispersijos - skirtingos. Tokiu atveju yra tik ' stochastinė priklausomybė.I Esant mažai pradinės informacijos apimčiai, vietoje grupinių arj koreliacinių lentelių galima nustatyti G. Fechnerio ženklų koreliacijos | koeficientą, turintį tą pačią paskirtį - atsakyti į klausimą, ar yra koreliacinis į ryšys ir kokia j o kryptis.i K Fechnerio (na nį) / (n;l t H-,), (10.3)!, čia n a ir n b - individualių požymio reikšmių Xj ir Yį nuokrypių nuoį vidurkių Xa ir Y a sutampančių ir nesutampančių ženklų skaičius. Sis

koeficientas gali įgyti reikšmes nuo - 1 iki + 1.

113

Page 113: Statistika I Ona Gražytė-Molienė

10.2. PARAMETRINIAI SĄSAJOS STIPRUMO RODIKLIAI

Nustačius ryšio formą tarp požymių (kintamųjų), svarbu įvertinti šio ryšio (sąsajos) stiprumą. Ryšio (sąsajos) stiprumui tarp kiekybinių požymių įvertinti gali būti taikomas kovariacijos koeficientas: (10.4), (10.5)

cov lU .- ’ h ,- * ). OOV,., ;cov>- “ „ * L L nv

cov (y, x) - paprastas arba svertinis (jei duomenys sugrupuoti).Šio koeficiento trūkumas - priklausymas nuo mato vienetų (pvz., kg ar g ; m ar cm). Todėl praktikoje dažniausiai taikomas porinis tiesinės koreliacijos

koeficientas (įvairios jo formulės): (10.6), (10.7)

^ _ xy-x-y_ _ ^ xi~ xh i- y )

'" "«V * , ’ ^ = -a,-a, ;(10.8), (10.9)

Iš nesugrupuotų duomenų atitinkami vidurkiai ir standartiniai nuokrypiai apskaičiuojami ne svertine forma. Jei duomenys pateikti koreliacinėje lentelėje, šie rodikliai nustatomi svertine forma. Šiuo atveju koreliacijos koeficiento reikšmė priklauso nuo grupių skaičiaus (intervalų dydžio), todėl yra tiksliau jį skaičiuoti pagal nesugrupuotus duomenis.

Kai žinomas tiesės lygties parametras (regresijos koeficientas) ab tiesinės koreliacijos koeficientas gali būti apskaičiuojamas pagal tokią formulę: (10.10)

Tiesinės koreliacijos koeficientas pagal jo skaitinę reikšmę dažniausiaivertinamas taip: kai |r| = 0 - nėra tiesinio ryšio

iki 0,3 ryšys labai silpnas

. 0,3 - 0,5 ryšys silpnas

\ 0,5 - 0,7 ryšys vidutinio stiprumo

\ 0,7 - 0,9 ryšys stiprus\ 0,9- 1 ryšys labai stiprus

\ 1 - ryšys funkcinis

114

Page 114: Statistika I Ona Gražytė-Molienė

Kai kurie autoriai naudoja šiek tiek kitokią tiesinės koreliacijos koeficiento vertinimo skalę.

Patikrinti hipotezę apie ryšio (sąsajos) nebuvimą galima pagal Fišerio sudarytą lentelę, kurioje pateikti koreliacijos koeficientai, esant tam tikram stebėjimo vienetų skaičiui ir laisvės laipsnių skaičiui, kuris lygus n - 2. Kai prie duotų sąlygų faktinis rxy > rient, turime esminį ryšį.

Kelių veiksnių (Xį) įtakos rezultatinam požymiui ryšio (sąsajos) stiprumą galima įvertinti dauginės koreliacijos koeficientu (Kylio): (10.11)

čia r y, , r yz, r x/-poriniai tiesinės koreliacijos koeficientai.

Pvz.: Y - N produkto vartojimo lygis;X-pajamų lygis;Z - šeimos narių skaičius.

Dauginės koreliacijos koeficientas svyruoja nuo 0 iki 1. Tiesinės dauginės regresijos lygtis atrodo taip:

čia a]> &2, ... an - dalinės regresijos koeficientai, kurie rodo, keliais vienetais pakinta rezultatinis požymis, faktoriniam požymiui pasikeitus vienetu, kai kitų požymių reikšmės nekinta.

Atliekant dauginę koreliacinę-regresinę analizę, pirmiausia atrenkami (pagal porinės koreliacijos koeficientus) pagrindiniai ir nepriklausomi veiksniai (atmetami tarpusavyje glaudžiai susiję - kolinearūs - požymiai, jeigu jų tarpusavio koreliacijos koeficientas didesnis negu 0,6-0,8). Atrenkamų faktūrinių požymių (veiksnių) skaičius ribojamas dėl darbų apimties ir analizės sudėtingumo (manoma, kad stebėjimų skaičius turėtų būti net 8 kartus didesnis už faktūrinių veiksnių skaičių). Beje, porinės regresijos atveju nustačius tiesinį ryšį, nebūtinai jis toks liks ir dauginėje regresijoje (dėl veiksnių tarpusavio sąveikos gali pasikeisti dauginės koreliacijos ryšio forma).

Tiesinės koreliacijosJarefirientas gali būti artimas arba lygus 0, tačiau tai dar aerdSkT ka^įtėFa.kpreliacinkn^tu:4m:ia 7rej,’;»žo ryšio); šiuo atveju gali būti kreivims ryšys Tekiais atvejais, ryšio stiprumui įvertinti galima taikyti empirinį koreliacijos santykį (r|): (10.13)

Y = ao+ aiXi+a2X2+.. .+anXn, (10.12)

Page 115: Statistika I Ona Gražytė-Molienė

čia 62y - tarpgrupinė dispersija (charakterizuoja rezultatinio požymiosklaidą dėl grupavimo požymio sklaidos). Kadangi tarpgrupinė dispersija yra lygi bendrosios dispersijos ir vidurkinės dispersijos skirtumui, empirinis

koreliacijos santykis gali būti skaičiuojamas ir pagal tokią formulę: (10.14)

kad empirinį koreliacijos santykį galima taikyti tik ešantpakankamai dideliam stebėjimo vienetų skaičiui, kai duomenys pateikti koreliacinėje arba grupinėje lentelėje. Ryšio kryptis nustatoma pagal dažnių išsidėstymą koreliacinėje lentelėje jos įstrižainių atžvilgiu - ryšys tiesioginis, kai dažniai susitelkę apie pagrindinę įstrižainę, ir - atvirkščiai.

Esant tiesiniam ryšiui | r | = tį. Jei (ų2 - r2) < 0,1 ryšį galima išreikšti tiesės lygtimi.

Empirinį koreliacijos santykį galima taikyti ir tada, kai grupės sudarytos pagal atributinį požymį, pvz., tiriama išsimokslinimo ir darbo užmokesčio, išsimokslinimo ir nedarbo lygio priklausomybė.

Empirinio koreliacijos santykio pošalmis yra determinacijos

koeficientas (tį2), kuris rodo, kurią rezultatinio požymio sklaidos dalį lėmė faktorinio požymio sklaida.

Kai žinoma regresijos lygtis ir pagal ją apskaičiuotos teorinės rezultatinio požymio reikšmės, ryšio stiprumą galima įvertinti ir teoriniu

koreliacijos santykiu (koreliacijos indeksu): (10.15)

Teorinio koreliacijos santykio, kaip ir empirinio r| skaičiavimo pagrindas - rezultatinio požymio y bendrosios dispersijos suskaidymas į /aktorinę ir liekamąfą dispersijas. Tačiau yra ir skirtumų:

1) bendroji rezultatinio požymio dispersija nėra lygi jo faktorinės ir liekamosios dispersijų sumai (lygios tik atitinkamų nuokrypių kvadratų sumos): (10.16)

t. y. bendro nuokrypio kvadratų suma lygi klaidų nuokrypio kvadratų

sumai ir regresinio nuokrypio kvadratų sumai.2) naudojami nesugrupuoti duomenys;

Empirinis koreliacijos santykis svyruoja nuo 0 iki 1. Reikia pastebėti,

nĮ fc - y J E (y- - y J

l i y . - y J l ' l U - J ) '

X h - y f = l(y < - y j + žfc - y f;

ii6

Page 116: Statistika I Ona Gražytė-Molienė

3) vietoje rezultatinio požymio grupinių vidurkių imamos jo teorinės reikšmės.

Šį rodiklį tam tikra prasme reikėtų laikyti ne tiriamų požymių ryšio stiprumo, o pasirinktos teorinės regresijos linijos artumo laipsnio empiriniams duomenims rodikliu.

10.3. DAŽNIŲ LENTELĖS. NEPARAMETRINIAI SĄSAJOS

STIPRUMO RODIKLAI

Socialinių reiškinių analizėje dažnai tenka įvertinti kokybinių

(atributinių) požymių ryšio (sąsajos) stiprumą. Tam tikslui sudaromos dažnių lentelės ir apskaičiuojami atitinkami neparametriniai ryšio rodikliai (iškeltos hipotezės apie požymių suderinamumą, nepriklausomumą ir homogeniškumą tikrinamos ^kriterijumi).

Ryšiui tarp alternatyvių požymių nustatyti sudaroma 2x2 dažnių lentelė:

X x x 2 E

Y i a b a + b

y 2 c d c + dS a +c b + d n

Šių požymių ryšio (sąsajos) stiprumą tarp X ir Y galima įvertinti J u l o

(1871-1951) asociacijos koeficientu: (10.17)

ad - be , „ .

ad + be1 //] A

K asoc. kinta nuo -1 iki +1. Ryšis patvirtinamas, kai | K^c | > 0,5. Alternatyvių (dichotominių) požymių sąsajos stiprumą galima įvertinti ir kontingencijos bei koligacijos koeficientais: (10.18)

ad - bekonting.

-J(a + b\c + d\a + c)(b + d )’

kolig .

■Įad~4bc

Jad +4bč

(10.19)

Šie koeficientai skirtingai reaguoja į kraštinių pasiskirstymo dažnių pasikeitimą 2x2 lentelėje. Jei eilutę ar stulpelį padauginsime iš tam tikro

117

Page 117: Statistika I Ona Gražytė-Molienė

skaičiaus, tai asociacijos ir koligacijos koeficientams įtakos neturės, o kontingencijos koeficientui - turės.

. Manoma, kad ryšys yra, jei šie koeficientai yra lygūs ar didesni negu0,3. Jie visi gali svyruoti nuo -1 iki +1. Beje, iš 2x2 lentelių kontingencijos

koeficientas sutampa su tp koeficientu, kuris skaičiuojamas pagal tokią formulę: (10.20), (10.21)

ę = — ; 6iax1 =«|X— -- 1V n nį ■ n J

Kai tarp tiriamųjų požymių (kintamųjų) yra vienpusis ryšis, empirinį ryšį geriau atskleidžia asociacijos koeficientas, o kai sieja dvipusis (lygiavertis) ryšys, jį geriau nusako koeficientas tp.

Sis koeficientas taip pat gali įgyti reikšmes nuo -1 iki +1.

Pavyzdys

10.1 lentelė. įvertinti sąsajos stiprumą tarp rūkymo ir lyties, turint tokius apklausos duomenis:

YX

RŪKO NERŪKO I

VYRAI 25 15 40MOTERYS 10 50 60

I 35 65 100

_ - 6c _ 25 • 50 - 10 • 15 _ 1100 _ \

asoc~ ad +bc ~ 20 -50 +10 15 _ 1400 !\ ’ ' '

S '

Ryšys yra, nes IK U ^. > 0,5.

_ . iioo

^ ~ V40 -60 -35 -65 " 0,471 '

Ryšys patvirtinamas, nes | K | ?> 0,3.

Kai kokybiniai (atributiniai) požymiai pateikti didesnėje negu 2x2 dažnių lentelėje, pvz., r*c sąsajos stiprumui įvertinti, taikomi K. Pirsono ii A. Čuprovo ryšio rodikliai: (10.22), (10.23)

..2

118

Page 118: Statistika I Ona Gražytė-Molienė

n - stebėjimų skaičius; r - eilučių skaičius ; c - stulpelių skaičius.

Abu sąsajos rodikliai gali įgyti reikšmes nuo 0 ik 1. Kuo šie rodiklai yra arčiau 1, tuo tiriamųjų požymių sąsaja yra stipresnė (A. Čuprovo ryšio rodiklis sąsajos stiprumą įvertina griežčiau, t. y. C>D).

Kai pradiniai duomenys išreikšti rangais, sąsajos stiprumui nustatyti naudojami rangų koreliacijos koeficientai - Spirmeno ir Kendalo: (10.24)

č i aRxi r R y- X i r Y požymių (kintamųjų) rangai. Beje, ranguojant kiekybinių požymių reikšmes, kai yra kelios pasikartojančios reikšmės, joms priskiriama vidutinė tų reikšmių užimtų vietų - gautų balų - reikšmė.

Kendalo rangų koreliacijos koeficientas skaičiuojamas pagal tokią

čia S~r— Tezultatinio požymio rangų, didesnių už nagrinėjamą rangą, skaičius;

S 2 - rezultatinio požymio rangų, mažesnių už nagrinėjamą rangą, skaičius.

Skaičiuojant Kendalo rangų koreliacijos koeficientą, požymio X rangai išdėstomi didėjimo kryptimi (eilutėje iš kairės į dešinę arba stulpeliu žemyn) ir pagal Ry rangus nustatomas Si ir S2 skaičius. Sis koeficientas dar griežčiau, negu Spirmeno, įvertina porinio ryšio glaudumą. Jis patogus skaičiuoti, kai ūgio eilutė papildyta naujais nariais. Esant pakankamai dideliam stebėjimo vienetų skaičiui, Spirmeno ir Kendalo rangų koreliacijos koeficientus sieja toks santykis:

AbiH^tngt^kai^acijos,keeficieotai svyruoja nuo -1 iki +1.Reikia pastebėti, jog šiais koeficientais įvertinę kiekybinių rodiklių ryšį

(sąsają), negauname tikslaus atsakymo apie to ryšio glaudumą (koreliacijos koeficientai nustatomi tik atsižvelgus į eilės tvarką, o ne tikruosius reikšmių skirtumus). Vadinasi, šiuos koeficientus tikslinga taikyti kokybinių požymių, matuojamų e i l ės skale, sąsajos stiprumui įvertinti.

Neparametriniai koreliacinio ryšio matai turi privalumų ir trūkumų.

Šiuos matus galima naudoti tada, kai:

formulę (10.25)

2(5,- S j ,

«(«-1) ’ .

119

Page 119: Statistika I Ona Gražytė-Molienė

■ nieko nežinoma apie populiaciją (generalinę aibę), iš kurios paimti imties duomenys.

■ duomenys negali būti išreikšti įprastiniais būdais, o turi būti įvertinti pagal tam tikrą tvarką (rangus), t. y. įvertinti pagal silpną matavimo skalę;

■ rezultatai reikalingi greitai, o kompiuterinė analizė nėra galima;■ reikalinga tik apytikslė koreliacijos mato reikšmė.

Tačiau neparametriniai matai:■ yra mažiau efektyvūs, negu parametriniai vienodomis sąlygomis

(esant duotam imties dydžiui ir reikšmingumo lygmeniui);■ dažniau ignoruoja turimą imties informaciją (pvz., daugiau

kreipiama dėmesio į stebėjimo reikšmių tendencijos kryptį, o ne į jų dydžių skirtumus).

10. KONTROLINIAI KLAUSIMAI

1. Kokie požymiai (kintamieji) vadinami /aktoriniais ir rezultatiniaisl

2. Ką vadiname koreliacine ir funkcine priklausomybe?3. Kokių sąlygų reikia laikytis tiriant reiškinių priklausomybę?4. Ką įvertina regresijai Kokios jos rūšys?5. Kokie yra koreliacinio ryšio buvimo fakto nustatymo metodai?6. Kam skirtas porinis tiesinės koreliacijos koeficientas?7. Kam skirtas empirinis koreliacijos santykis?8. Kada taikomi rangų koreliacijos koeficientai?9. Kokiais rodikliais įvertinamas alternatyvių požymių sąsajos

stiprumas?10. Kokie yra neparametrinių sąsajos stiprumo rodiklių privalumai ir

trūkumai? '

120

Page 120: Statistika I Ona Gražytė-Molienė

L I T E R A T Ū R A

1. Aprašomoji statistika: mokomoji priemonė. Vilnius: VU. 1998.2. Avenel J.D., Azolay E. Statistique descriptive. Ediscience international, Paris, 1995.3. Bartosevičienė V. Ekonominė statistika. Mokomoji knyga. Kaunas: Technologija, 2001.4. Bernard P.Y. Exercices corrige’s de statistique descriptive. Paris, 1991.5. Čekanavičius V., Murauskas G. Statistika ir jos taikymai, 1 t., Vilnius, TEV, 2000.6. Efimova M.R, Petrovą E.V., Rumencev V.N. Obščaja teorija statistiki. M, 2001.7. Kazmer A. Metody statističeskovo analiza v ekonomike (perevod s angliskovo). M., 1972.8. Lietuvos statistika XX amžiuje. Straipsnių rinkinys. V., 1999.9. Martišius S.A.,Vaičiūnas G. Taikomoji statistika ekonomistams ir vadybininkams. Teorija ir metodai. Šiauliai: ŠU, 2001.10. Martišius S.A. Pagrindiniai statistiniai matai. Mokomoji knyga EF studentams. Vilnius, 2001.11. Martišius S.A. Koreliacinės-regresinės analizės pradmenys. Mokomoji knyga EF studentams. Vilnius, 2001.12. Martišius S.A., Kėdaitis V. Įvadas į dinamikos eilučių analizę. Mokomoji knyga EF studentams. Vilnius, 2002.13. Martišius S., Molienė O. Vartojimo kainų indeksų teorija ir praktika. Vilnius, 1994.14. Martišius S. Indeksiniai skaičiavimai: teorija ir algoritmai. Vilnius, 1990.15. Newbold P. Statistics for Business and Economies. 4* ed. Prentice Hali International Editions, 1996.16. Molienė O. Socialinės statistikos praktikumas. Vilnius: VU, 1997.17. Oktiabrijskij P.J. Statistika. Sankt-Peterburg, 1999.18. Rimka Alb. Statistika: teorija ir metodai. Kaunas. 1939.19. Sakalauskas V. Statistika su Statistica. Vilnius, 1998.20. Statistikos departamentas. Statistinių ataskaitų formuliarų rinkinys. Vilnius, 2001.21. Valkauskas R. Statistika. Mokomoji knyga. Vilnius: VVK, 2002.

121

Page 121: Statistika I Ona Gražytė-Molienė

PRIEDAI

Page 122: Statistika I Ona Gražytė-Molienė

1 PRIEDAS. FORMULĖS UŽDAVINIAMS SPRĘSTI

1.1. V I D U R K I A I

H A R M O N I N I S

— n=- I f l

S 1 -/XI

G E O M E T R I N I S

Xg =I/įx1A-x2f2-x2n -..x^

K V A D R A T I N I S

n x« =£ X?Z

1 UŽDUOTIS. Savarankiškai pasirinkite kelias pasikartojančias X,

reikšmes ir įrodykite nurodytą vidurkių m a z o r a n tą :X„< X g< X a< X q< X ah

125

Page 123: Statistika I Ona Gražytė-Molienė

Moda ir struktfiriniai vidurkiai

M O D A

f - fMo = x0+ d —r--- -- -^,d = const;

( f i- /> )+ ( / ,- / ,) '

Mo = x n+ d j - — j-Z— j i — - p r , d * c o m t ;(h2 - Ä, J+ (h2 - h3) di

M E D I A N A

Me = x0 + d —

K V A R T I L I A /

l2 J - s<M Ö = ^Q=x0+d^— ---- ; a = Xo+d^— ----

JQ\ J<h

D E C I L T A T

L\ =^, + d-'D IA

fl

D5=Q2=Me; D9 =x0+d m ^ - s‘D9-1

D lD9

126

Page 124: Statistika I Ona Gražytė-Molienė

1.2. SKLAIDOS, ASIMETRIJOS IR EKSCESO RODIKLIAI

Sklaidos plotis: R=X max - X min;

Kvartilinis plotis: Rq=Q3 - Qi;

Pusiaukvartilinis plotis: Q= (Q3 -Qi)/2;

Vidutinis tiesinis nuokrypis'.

I I H . ^ lx' .

iv ’ X / ;

Dispersija (o2):

a 2 = 7 - ^ ; * 7 . 2 * 1

AT / N

^ " I T

Tarpgrupinė dispersija (52y): Vidurkinė dispersija (cr ):

J i I f c - y f ”, .

' 1 » , ’ S »

Bendroji rezultatinio požymio dispersija (c y):

^2 y ff i, 7. ~ 2 f~Y ,.2 _ .

^ =^ r ’ ' " " E P

Dispersijų sudėties taisyklė:

(T2 7 =<52y +<r2>,;

127

Page 125: Statistika I Ona Gražytė-Molienė

Standartinis (vidutinis kvadratinis) nuokrypis'.

1

r=, | S Z ; a = .N

% - ^ f .

1 / , ’

Variacijos koeficientas: Kvartilinis variacijos koeficientas:

V = = 1 0 0 ; X

■o--------lū °;2 e3+aFišerio asimetrijos koeficientas:

A^ J k į k ^

Simetrinis skirstinys, kai As - 0; --► X» - Me - Mo

Teigiama ldešiniašonė) asimetrija, kai As > 0; --► X a > Mc > MoW’Witiiriti (kiūriiiitmč) asinwlrija. kai As ■ 0. ___► \, - Mi* • Mo

Fišerio eksceso koeficientas:

Ekscesas (kreivės iškilumas) normalus, kai Fišerio Ek _ 0; Ekscesas aukščiau normalaus (smailiaviršūniš). kai Fišerio F* > C Ekscesas žemiau normalaus (nlokščiaviršūnis). kai Fišerio Ei, < 0

* Skirstinys laikomas normaliuoju, kai As = 0 ir Ek = 0; tada jo grafikas yra varpo formos, o intervale Xa ± 3o telpa 99,7 % visumos vienetų.

128

Page 126: Statistika I Ona Gražytė-Molienė

1.3. DINAMIKOS EILUTĖS RODIKLIAI

kz =y t

y i- 1

Tg =kg- m

1Kb ~

y i

j ; = v i o o

• Kitimo (didėjimo / mažėjimo)

koeficientas (tempas)

• Pakitimo (padidėjimo / sumažėjimo)

tempas, proc.

• Absoliutinė pokyčio 1% reikšmė

4yb•100;

y i

TPb=Tb- 100

Ay

tp.

1. A P I B E N D R I N A M I E J I

Vidutinis dinamikos eilutės lygis

Vidutinis absoliutus pokytis (padidėjimas / sumažėjimas)

Vidutinis kitimo koeficientas (tempas)

Vidutinis pakitimo (padidėjimo / sumažėjimo) tempas

y = -n

X /> .

2 / ’

- _ 1/2* +y2 +...+l/2_y„ _

«-1

129

Page 127: Statistika I Ona Gražytė-Molienė

4у = ~ — ;т и—1

т = « - 1;

= К 'к 2-кт = 4Ш г,

4 Ï ’

T P = T d - m .

DINAMIKOS EILUTĖS E K S T R A P O L I Ä C I J А

S Упа=Уп+АУ 1 I У,ы.~Уп'к

i У n i . =a0+a](n + L) H t=n+L

yn+L = ao+ar

130

Page 128: Statistika I Ona Gražytė-Molienė

1.4. I N D E K S A I

INDIVIDUALIEJI

l P =

1,=I I

go

BENDRIEJI

S

AGREGATINIAI

I

y p _Į ^ ig i

' E / M

J l = 'Z p}%

P X^o9o

j L _ X g i

" E^oPo

J P _ Ę g i A

" X ? o A

VIDURKINIAI

, p _

MV i l i

\ - ipj L _ 2 ^ P _ ^ P o ^ O _

P X a ,?o

j L _ E *'g ' ffoPo

0

Į p _ X gi A

5 > W i = ! > < , = = S*? • Pog0;

lpqPigi

PogoZ Pi^i

/w X Po?o

/ = I P-ILpq p q

I = I L-IPpi p q

VIDUTINIO LYGIO INDEKSAI

Kintamos sudėties

Xit E xi^ ,Z V o _ *

1 X / i X / o x °

131

Page 129: Statistika I Ona Gražytė-Molienė

• Pastovios sudėties

Struktūrinių poslinkių

T V o _Xostr.posl /. ' j . ~ >

/ J\ / ./n Xo

Ax=xi -xo

Absoliutus vidutinio lygio pokytis'.

— — ' n — — ' —

x i X 0 [J str.posl. — Xo Xo

• x - sąlyg. kokybiniai (intensyvieji) rodikliai (kaina, savikaina, darbo našumas, darbo užmokestis, derlingumas);

• f - kiekybiniai (ekstensyvieji) rodiklai (produkcijos / prekių kiekis, darbuotojų skaičius, pasėlių plotas);

• xf — apimties rodikliai (produkcijos / prekių vertė, gamybos sąnaudos, darbo užmokesčio fondas, bendrasis derlius).

132

Page 130: Statistika I Ona Gražytė-Molienė

1.5. KORELIACIJA IR REGRESIJA

Tiesinės koreliacijos koeficientas:

_ xy-x-y

<**■<* y

r =y*

J i x ~xh - y ) .r?,x = ai

Empirinis koreliacijos santykis (r) - eta):

- y fn-

S * ’77=<J„

; , -(> '}: 0

8y2 (delta) - tarpgrupinė dispersija;

Determinacijos koeficientas[] r)2.;

Spirmeno ranginis koreliacijos koeficientas:

Spirmeno, » I k - * , }

Ę T iT -

DAŽNIU LENTELESAsociacijos koeficientas:

ad-bcK = -

asoc. 1 . 7 ’ad+bc

Kontingencijos koeficientas:

Kad - be

konting .■J(a + b\c + d\a + c\b + d)

P ir š o n o tarpusavio sąveikos koeficientas:

(,gr■ 9 - fi,X ~ chi)

_ \ ~ tK —Pirsono

' 1 v n , n in.

133

Page 131: Statistika I Ona Gražytė-Molienė

2 PRIEDAS. TIPINIAI UŽDAVINIAI

2.1. STATISTINIAI GRUPAVIMAI

1 uždavinys

Į klausimą „Kiek valandų per savaitę žiūrite sportines televizijos laidas?“, 20 studentų atsakė šitaip:

0; 3; 6,5; 7; 1,5; 4,5; 6,5; 8,5; 1; 5; 7; 8,5; 2,5; 5,5; 7; 9; 3; 5; 7;10.

Užduotis:1. Reikia sugrupuoti šiuos duomenis į kelias grupes lygiais intervalais.

Kiekvienai grupei priskirti absoliučius ir santykinius dažnius. Grupavimo rezultatus išdėstyti statistinėje lentelėje.

2. Reikia pergrupuoti pirminio grupavimo rezultatus intervalų stambinimo metodu ir sudaryti 3 naujas grupes. Antrinio grupavimo rezultatus išdėstyti statistinėje lentelėje.

Sp r end i mas

1. Lygių intervalų plotis nustatomas pagal formulę

X — Jt '<■ -y ' '^ _ max min - ^ ’ J

m S

čia xmax ir Kmm - atitinkamai maksimali ir minimali grupavimo požymio reikšmės;m - grupių skaičius (gali būti pasirenkamas laisvai arba nustatomas pagal Sterdžeso formulę: m =1 + 3,322 log N). Mūsų atveju m =1 + 3,322 log 20 »5;

5Kadangi šiuo atveju grupavimo požymis yra tolygusis (gali būti

išreiškiamas ne tik sveikaisiais, bet ir trupmeniniais skaičiais), grupes tikslinga sudaryti jungiamuoju metodu, t. y. taip, kad vieno intervalo aukštutinė ir kito intervalo žemutinė ribos sutaptų. Gauname tokius grupavimo rezultatus:

134

Page 132: Statistika I Ona Gražytė-Molienė

1 lentelė. Studentų grupavimas pagal sportinių televizijos laidų žiūrėjimo laiką per savaitę (val.)

Laikas Studentų skaičius

žmonių

0-2 I I I 3 15,0^2-4 I I I 3 15,0

4-6 I I n 4 20,0

6-8 I I I I I I 6 30,0

8-10 //// 20,0 ;

/ 2 o ) 100,0

S ___

Pergrupuojame pirminio grupavimo rezultatus intervalų stambinimo

metodu. Iš 5 grupių sudarome 3 grupes šiais intervalais:0-33-66- 10.

I grupei priskiriame tuos studentus, kurie sportines laidas žiūri iki 3 valandų per savaitę. Tokių studentų dalis (nustatome santykinius dažnius) sudarys:

f i = f i + f 2 ' (3-2) / (4-2) = 15,0 + 15,0 • 0,5 = 22,5 %.II grupei priskiriame tuos studentus, kurių šis laikas yra ne mažesnis

nei 3 val., t. y. 3-6 intervalas, kurio santykinis dažnis sudarys:f ii = f 2 ' (1 - 0,5) + f 3 = 15,0 • 0,5 + 20,0 = 27,5 %;

III grupei priskiriame visus likusius studentus, kurių šis laikas ne mažesnis nei 6 val., t. y. 6-10 intervalas. Gavome:

f m = f 4 + f s = 30,0 +20,0 = 50,0 % arba 100 - (22,5 +27,5) = 50,0

%.

2 lentelė. Antrinis studentų grupavimas pagal sportinių televizijos laidų žiūrėjimo laiką per savaitę (val.)

* .

La i kas S t u d e n t ų ska i č i us , proc.

0-3 22,5

3-6 27,5

6-10 50,0

E 100,0

135

Page 133: Statistika I Ona Gražytė-Molienė

2.2. INTERVALINĖS VARIACINĖS EILUTĖS ANALIZĖ

1 lentelė. Nuteistųjų pasiskirstymas pagal amžių 1994 metais Lietuvoje

Amžiaus

grupėsNuteistųjų

skaičiusf i ( % )

Intervalų

centrai

X i X į f į

Rėžiai Intervalo

plotis

d i

Tankis

h i

Sukaupti

dažniai

Si (%)14-17 13 15,5

201,513,5-17,5

4 3,25 13

18-24 31 21 651 17,5-24,5 7 1

'' 4,43 ' 44

25-29 18 27 486 24,5-29,5

5 3,60 ' r 62 )

30-49 33 39,51303,5

29,5-49,5

20 1,65 95

50 + 5 59,5297,5

49,5+ 20 0,25 100

L 100 2939,5

1. Pasiskirstymo centro charakteristikos

a) a r i t m e t i n i s v i d u r k i s :

xa = S*«/* = 3 1 = 29,395 « 29,4;X / 100

O 7

b )m o d a: /\\

(Kadangi intervalai nelygūs, modalųjį intervalą nustatome pagal didžiausią tank - intervalas 18-24.)Modos ir visų struktūrinių vidurkių formulėse, kai grupės sudarytos skiriamuoju būdu, Xo imamas apatinis modaliojo, medianinio ir pan. rėžis.

Mo=x0 +d~,---\ f 1--- r{h2-hl)+{h2-h})

= 17,5+74,43-3,25

(4,43-3,25)+(4,43-3,60)= 17,5+4,1 = 21,6;

136

Page 134: Statistika I Ona Gražytė-Molienė

c )m ė d i ana:

{Medianinis intervalas yra 25-29, nes Vi Ef =50 ir patenka į šio intervalo sukauptus dažnius.)

50-44Me = xo + d±------- = 24,5 + 5-— — = 24,5 + 1,67 = 26,2;

fm 18

d) kv a r t i l i a i:(Apatinio kvartilio Qi intervalas yra 18-24, nes 'A Sf = 25, t. y. patenka

į šio intervalo sukauptus dažnius.)

j Z / - V , r 100-13a = x0 + d±-- ----L = 17,5 + 7—— —---= 17,5 + 2,71» 20,2;

J Q l 3 1

Q2 — Me = 26,2;

4 l / - v , r 100-62Q3=x0+ d 4-- ----- = 29,5 + 20—— —---= 37,4;

J Qi 33

(Viršutinio kvartilio Q3 intervalas yra 30—49, nes % Sf = 75, t. y. patenka į šio intervalo sukauptus dažnius.)

e ) de c i l i a i :

Atitinkamai nustatomi ir deciliniai intervalai. Apatinio decilio Di intervalas -14-17,

nes 1/10 Zf = 10, o viršutinio decilio Dg intervalas - 30—49, nes 9/10 Xf = 90, t. y. patenka į nurodytų intervalų sukauptus dažnius.

Gavome tokius decilius:

- Y f - S m , —-100-0£>, =jc0+</10—--- = 13,5 + 4—-----= 16,6;

f m 13

D5 = Me = 26,2;

137

Page 135: Statistika I Ona Gražytė-Molienė

^100-62D9 =x0 + d ------- =29,5+20^2----- =46,5.

J m 33

IŠVADOS:

1994 metais nuteistųjų pasiskistymo pagal amžių analizė parodė, kad:a) vidutinis nuteistųjų amžius - 29,4 m.;b) dažniausiai pasitaikantis nuteistųjų amžius - 21,6 m.;c) pusės visų nuteistųjų amžius buvo iki 26,2 m., kitos pusės - per 26,2

m.;d) Va visų nuteistųjų buvo jaunesni nei 20,2 m. ir Va - vyresni negu 37,4

m;e) 1/10 visų nuteistųjų buvo jaunesni nei 16,6 m. ir 1/10 - vyresni negu

46,5 m.Pastaba. Kai ūginėje eilutėje greta viena kitos yra vienodų reikšmių ir

jos gali būti priskirtos skirtingiems kvantiliams, struktūrinius vidurkius reiktų interpretuoti tiksliau. Pvz., Me = 26,2 reikštų, kad pusė visų tirimųjų buvo ne vyresni nei 26,2 metų ir kita pusė - ne jaunesni nei 26,2 metų.

2. Sklaidos ir asimetrijos rodikliaif)

X i fi

~V'*2 f

j xi f i (xi~ xl f k f t

15,5 13 3123,25 -34913,047 485291,35321 31 2187,36 13671 -18373,824 154340,12227 18 103,68 13122 -248,832 597,19739,5 33 3366,33 51488,25 33999,933 343399,32359,5 5 4530,05 17701,25 136354,505 4104270,601I 100 12699,15 99105,75 116818,735 5087898,596

Sklaidos plotis neskaičiuojamas, nes paskutinis intervalas neapibrėžtas. Kvartilinis plotis Q3 - Q i = 37,4 - 20,2 = 17,2. ____ ,Dispersija apskaičiuota dviem būdais: V-v /

- v . { " 'O

Page 136: Statistika I Ona Gražytė-Molienė

a = VctT = -J126 ,9915 =11,269 »11,3.

Tai rodo, kad 1994 m. nuteistųjų amžius vidutiniškai nukrypo nuo jų vidutinio amžiaus 11,3 metų.

Variacijos koeficientas

V = £ - 1 0 0 = ^ - 100 = 38,4 proc.x 29,4

Tai rodo, kad nagrinėjamais metais nuteistųjų amžiaus sklaida labai didelė, nes variacijos koeficientas V patenka į intervalą 30-50 %.

Kvartilinis variacijos koeficientas:

V = ~ Q - ■ 100 = 3 7 ’ 4 ~ 2 0 » 2 . 1 0 0 = 29,9proc.Q Q} +Q , 37,4 + 20,2

Kvartilinis sklaidos plotis ir kvartilinis variacijos koeficientas rodo ne visos pasiskirstymo eilutės reikšmių sklaidą, o tik 50 % viduriniosios jos dalies reikšmių sklaidą (duotuoju atveju 1994 m. nuteistųjų pasiskirstymo pagal amžių sklaida šioje eilutės dalyje yra didelė, nes kvartilinis variacijos koeficientas patenka į intervalą 20-30 %).

Variacinės eilutės asimetrijai įvertinti pirmiausia palyginami ąritmetinis vidurkis, mediana ir moda. Gavome, kad:

xa> Me > Mo, t.y. 29,4 > 26,2 >21,6.

Tai rodo, kad yra teigiama (dešiniašonė) asimetrija. Vadinasi, 1994 m. daugiau buvo nuteista jaunesnio, negu vidutinis visų nuteistųjų amžiaus asmenų. Tą pačią išvadą patvirtina ir Fišerio asimetrijos koeficientas, kuris skaičiuojamas pagal tokią formulę:

^ . I ( į . - ? r, , Į 16818,735 , = 1168487353 £ / ; 100 1431,054

čia jo.3 — trečios eilės centrinis momentas.Kadangi Fišerio asimetrijos koeficientas |As| > 0,5, tai dar rodo, kad

duoto skirstinio asimetrija - esminė (skirstinys - ne simetrinis).

Fišerio eksceso koeficientas skaičiuojamas pagal tokią formulę:

Standartinis nuokrypis:

139

Page 137: Statistika I Ona Gražytė-Molienė

Ek=ų.JaA-i = L - ^ / a 4 -3 = 508789_8’596 /1 į 2694 -g = 3,155-3 = 0,155.X / 100

Kadangi Et > 0, tai reiškia, kad duotasis skirstinys yra aukščiau normalaus, t. y. smailiaviršūnis.

Pastaba. Skirstinys laikomas normaliuoju, kai As = 0 ir Ek = 0. Vadinasi, šio skirstinio negalima laikyti normaliuoju. Tiksliau galima įvertinti apskaičiavus atitinkamas vidutines paklaidas cjas ir aEk.

2.3. DINAMIKOS EILUČIŲ ANALIZĖ

2.3.1. Intervalinės dinamikos eilutės analizė

1 lentelė. Vidutinė minimali mėnesio alga (MMA), Lt

A n a l i t i n i a i dinamikos eilutės rodikliai

Absoliutūs lygio pokyčiai, Lt

(Ay)

Kitimokoeficientai(didėjimo / mažėjimo)

(Kd)

Pokyčiotempai

(padidėjimo / sumažėjimo),

(Tp) %

Pokyčio 1%

absoliutinėreikšmė

Ap

Metai Yt Grand. Bazin. Grand. Bazin. Grand. Bazin. 0,01-Yį.i

1995 Y1 134,6

1996 Y2 240,0 105,4 105,4 1,783 1,783 78,3 78,3 1,346

1997 Y3 374,2 134,2 239,6 1,559 2,780 55.9 178,0 2,400

1998 Y 4 417,5 43,3 282,9 1,116 3,102 11,6 210,2 3,742

1999 Y5 430,0 12,5 295,4 1,030 3,195 3,0 219,5 4,175

2000 Y6 430,0 0,0 295,4 1,000 3,195 0,0 219,5 0*

x — * n* Ap = 0, kai Yj = Y M

Patikrinimas£ A Y „ = A Y u = 295.4 Lt:II Kd g = Kd b = 3^195.

Page 138: Statistika I Ona Gražytė-Molienė

A n a l i t i n i a i dinamikos eilutės rodikliai apskaičiuoti pagal tokias formules:

1. Ab so l i u t ū s l ygio pok y č i a i : _____________________

Grandininiai: AY g = Y j - Y n Baziniai: A Y b = Y j - Y i

AY i = Y 2 - Y ! = 240,0 - 134,6 = 105,4 AY 2= Y 3 - Y 2 = 374,2 - 240,0 = 134,2 AY3 = Y 4- Y 3 = 417,5- 374,2= 43,3

ir 1.1.

AY ! = Y 2 - Y j = 240,0 - 134,6 = 105,4; AY 2 = Y 3 - Y i = 374,2 - 134,6 = 239,6; AY 3 = Y 4 - Y , = 417,5 - 134,6 = 282,9;

ir t. t.

2. D i d ė j i m o ko e f i c i e n t a i (tempai, proc.; Td = Kd • 100):

Grandininiai: Kd g = Y į / Y »__________ Baziniai: Kd b - Y į / Y į

Kd i = Y 2 / Y ,= 240,0 / 134,6 = 1,783; Kd 2 = Y 3 / Y 2= 374,2 / 240,0 = 1,559; Kd3 = Y 4/Y 3 = 417,5/374,2= 1,116;

ir t. t.

Kd i = Y 2 / Y i = 240,0 / 134,6 = 1,783 Kd 2 = Y 3 / Y ! = 374,2 / 134,6 = 2,780 Kd 3 = Y 4 / Y j = 417,5 /134,6 = 3,102

ir t. t.

3. P a d i d ė j i m o tempai , proc.; Tp = Kd-100 -100:

Grandininiai: Tp g = Kd g-100 -100 Baziniai: Tp b = Kd b • 100 -100;

Tp!= 1,783 -100 - 100 = 78,3 Tp 2 = 1,559- 100- 100 = 55,9 Tp3= 1,116 -100- 100 = 11,6

ir t. t.

Tp! = 1,783-100- 100= 78,3; Tp 2 = 2,780 • 100 - 100 = 178,0; Tp 3=3,102- 100- 100 = 210,2;

ir t. t.

4.A b s o l i u t i n ė p a d i d ė j i m o 1% reikšmė

A p = 0,01 • Y M

A Pl = 134,6 -0,01 = 1,346;A p 2 = 240,0 - 0,01 =2,400;A p 3 = 374,2 • 0,01 = 3,742 ir 1.1.

Pastaba. Grandininiai analitiniai absoliutaus ir santykinio pokyčio rodikliai rodo reiškinio kitimo tendencijas (tolygiai ar netolygiai jis kinta), o atitinkami baziniai analitiniai rodikliai rodo, kiek absoliučiu dydžiu ir procentais (arba kartais) šis reiškinys pakito (padidėjo ar sumažėjo) per visą

tiriamąjį laikotarpį.

141

Page 139: Statistika I Ona Gražytė-Molienė

Išvados1. Per visą tiriamąjį 1995-2000 metų laikotarpį vidutinė MMA

padidėjo 295,4 Lt arba ~ 3,2 karto.2. Vidutinė MMA metai iš metų didėjo, tačiau vis lėtesniais tempais, o

2000 metais jau nebekito. I

_______ 2. A p i b e n d r i n a m i e j i dinamikos eilutės rodikliai

~b° 3 C(h ? d , "įfv _ į'š^C

1. Vidutinis eilutės lygis: Y # £ Yi\ n = 2026,3 / 6 = 337,72 Lt. 1

Pastaba. Vidutinis eilutės lygis-^agal intervalinę dinamikos eilutę skaičiuojamas kaip paprastas aritmetinis vidurkis, o pagal momentinę

dinamikos eilutę - kaip modifikuotas aritmetinis vidurkis, vadinamas chronologiniu vidurkiu, kurio formulė tokia:

- _ l/2 ^ + r2+y3+.... + l/27„

/7 — 1

2. Vidutinis absoliutus pokytis:

p. J& S r ■>

AK = = = 59,08Lt. L t f , 2 n-1 5 < U J Z /

■ i-a ct**' J J >3. Vidutinis didėjimo ir padidėjimo tempai:

K = ^ = ^ f i i = l , 2 6 2 ; J . 'f ■■ / ■ '/f 'V

■ , Tp = Kd 100 -100 = 1,262 100 -100 = 26,2% . ^ ^

Išvados .y -JČ1. Tiriamojo laikotarpio vidutinė MMA buvo 337,72 Lt. į

2. Vidutinė MMA padidėjo vidutiniškai kasmet 59,08 Lt arba 26,2 %. V

f 3 ^ 02. Dinamikos eilutės išlyginimas pagal h i p e r b o l ė s lygtj i

t Y , t' = l/t Y-1’ ( t f Yt=494,587 - 384,171 • l/t(Yt-Y,)/ Yt • 100

1 134,6 1 134,6 1 110,42 21,8982 240,0 0,5 ^ 120,0 0,25 302,50 20,6613 374,2 0,333 1124,609 0,111 366,66 2,0564 417,5 0,250 104,375 0,063 398,54 4,7575 430,0 0,200 83,0 0,040 417,75 2,9326 430,0 0,167 i 71,81 0,028 430,43 0,100E 2026,3 2,450 638,394 1,492 20263 52,404

142

Page 140: Statistika I Ona Gražytė-Molienė

Hiperbolės lygtis Y . = an + a rl/1 pertvarkoma į tiesės lygtį: Y t = a n + a i/t

a,

n 6 6n

Gavome hiperbolės trendo lygtį Yt = 494,587 - 384,171-t' ir pagal jąišlyginome duotą dinamikos eilutę.

Patikrinimas.SY t = £ Y t = 2026,3.

Teorinių dinamikos eilutės reikšmių atitikimą empirinėms patikrinome pagal vidutinę aproksimacijos paklaidą:

Kadangi ši paklaida mažesnė nei 10 %, teigiame, kad aproksimacija gera ir duotoji hiperbolės lygtis prognozei sudaryti tinka labiau, negu tiesinė

trendo lygtis (pastaroji gauta tokio pavidalo:Yt = a o + a j-1 = 128,686 + 59,723-t, ii = 13,2 %).

4. Dinamikos eilutės ekstrapoliacija (prognozė)

Vidutinė MMA 2002 metais (L=2), jei jos kitimo tendencijos nebūtų pasikeitusios, galėjo būti tokia:

a) Y n+2 = Y„ + AYL = 430 + 59,08-2 = 548,16 Lt (jeigu būtų AY g ~

b) Y n+2 = Y „• K L = 430 • 1,2622 = 684,84 Lt O’eigu būtų Kd g ~ const.);

const.);

uc) Y „+2 = a o+ a j* 1 ftj= 494,587 - 384,171 ■ 1 f* b 446.57 Lt.

143O

Page 141: Statistika I Ona Gražytė-Molienė

Seriesl

Series2

Metai

4 pav.Vidutinė M M A (teorinės reikšmės pagal hiperbolės ir tiesinio trendo lygtis)

2.3.2. Dinamikos eilutės komponentai

1 lentelė. Respublikos namų ūkių vartojimo išlaidų lygio 1997-1999 metų atskirais ketvirčiais trendo nustatymas tiesės lygtimi

t Y t Y , t Yt = 370,436 + 6,156-1

|Yt-Yt|100/Y,

|Yt-Yt| • 100/Y t

Yt/ Y t •100

1 359,3 359,3 376,6 4,594 4,815 95,42 360,2 720,4 382,7 5,879 6,247 94,13 391,1 1173,3 388,9 0,566 0,563 100,64 416,5 1666,0 395,1 5,416 5,138 105,45 400,0 2000,0 401,2 0,299 0,300 99,76 424,8 2548,8 407,4 4,271 4,096 104,37 429,5 3006,5 413,5 3,869 3,725 103,98 439,8 3518,4 419,7 4,789 4,570 104,89 422,2 3799,8 425,8 0,845 0,853 99,2

10 424,4 4244,0 432,0 1,759 1,791 98,211 432,3 4755,3 438,2 1,346 1,365 98,712 425,3 5103,6 444,3 4,276 4,467 95,7

n=12 4925,4 J2 S 2 5 ^ 4925,4 37,909 37,930

• f Y,* = an + a t. J: /

Tiesės4ygtiei?fmmn&ttams nustatyti taikome tokias formules:

144

Page 142: Statistika I Ona Gražytė-Molienė

a0 = y -a i • t;

X"1 2 v 1 2w 4-1X* = X '^ -

5 > X>-2>

X '2(X ^ ’

Musų pavyzdyje: 2t = 12-13 / 2 >• 78.,Zt2 = 78 • 25 / 3 = 650.

32895,4-4925,4-78

12

650-78

12

880,3

143= 6,156;

4925,4

12-6456-2* =

12370,436.

Gavome toki tiesinio trendo lygti'. Y. = 370.436 + 6.156 • t.1 lentelėje pateikiamos pagal šią trendo lygtį išlygintos (teorinės)

vartojimo išlaidų lygio reikšmės, kurių suma yra lygi empirinių reikšmių sumai, t.y. 4925,4.

Kaip teorinės reikšmės atitinka empirines, įvertiname pagal atitinkamas paklaidas. Vidutinė aproksimacijos paklaida i i = 37,909 / 12 = 3,16 % ir paklaida MAPE 37,93 / 12 =3,16 %.

2 lentelė. Dinamikos eilutės komponentų nustatymas pagal _ multiplikatyvųjį modelį

t Yt į

(

'Slenka­moji suma v(4ketv.) f

2-jų metų / slenka­moji suma

Centruotas slenkamasis vidurkis (T)

Y/Yt■100

(St)

Y./S;(Y t*)

Yt*-1

1 359,3 ____ . / - - - 369,65 369,65

2 360,2! li 527,1 - -r. - 361,65 723,30

3 391,1 \ 1567,8 3094,9 386,86 101,1 389,54 1168,62

4 416,5/ } 1632,4 3200,2 400,03 " 104,1 405,16 1620,64

5 4ecr;6 1670,8 3303,2 412,90 96,9 411,52 2057.60

6 424,8 1694,1 1 3364,9 420,61 101,0 ,51 2559,06

7 429,5 1716,3 3410,4 426,30 100,8 427,79 2994,53

8 439,8 1715,2 3432,2 429,03 102,5 427,82 3422,56

9 422,2 1718,7 3433,9 429,24 98,4 434,36 3909,24

10 424,4 1704,2 3422,9 427,86 99,2 426,10 4261,00

11 432,3 - - - 430,58 4736,38

12 425,3 - - - 413,72 4964,64

S /f 4924,4 32787,22

145

Page 143: Statistika I Ona Gražytė-Molienė

3 lentelė. Sezoniškumo indeksų apskaičiavimas slenkamųjų vidurkių

metodu

Y / Y , • 100

Ketvirčiai 1997 1998 1999Z i ( %) (Xa)

Koreguoti sezoniškumo indeksai— .

1 - 96,9 98,4 97,65 /1 97,22 - 101,0 99,2 100,10 ' i 99,63 101,1 100,8 - 100,95/ 1 100,4 /4 104,1 102,5 - 103,30 \ 102,8 /

402,0 M /

Pastaba. Kadangi sezoniškumo indeksų suma nelygi 400 %, reikia apskaičiuoti koregavimo koeficientą (k = 400 / 402 = 0,995) ir nustatyti koreguotus sezoniškumo indeksus (žr. 3 lentelę).

Empirinius dinamikos eilutės lygius Yt dalijame iš sezoniškumo indeksų Z\ ir gauname desezonizuotas jų reikšmes Y*r (žr. 2 lentelę), pagal kurias ir nustatome tięsinį-tcendą.

Kaip jau žindme, S t = 78; S t 2 = 650; ZY*'t = 32787,22.Apskaičiuojame parametrus a i ir a 0:

4924,4-78

778,62 4924 4 78a„ = =— 5,445 — = 374,974.

32787,22--12

650-78

12143

• = 5,445;12 12

Gavome tokią desezonizuotų duomenų tiesinio trendo lygtį.

Y*t = 374,974 + 5,445 • t.

Pagal šią lygtį nustatome teorines vartojimo išlaidų reikšmes ir tai, kaip jos atitinka empirines; nustatome ir likutinį dinamikos eilutės komponentą ( t,

t(T )

f* , =^374,974 + 5,445-1

Yt-YtA1 100

Yt*

1 380,42 0,972 5,5522 385,86 0,937 6,6503 391,31 0,995 0,0544 396,75 1,021 4,978

146

Page 144: Statistika I Ona Gražytė-Molienė

5 402,20 1,023 0,547

6 407,64 1,046 4,2107 413,09 1,036 3,9728 418,53 1,022 5,082

9 423,98 1,024 0,420

10 429,43 0,992 1,171

11 434,87 0.990 0,59112 440,32 0,940 3,411

4924,40 . . . _ 36,638

Vidutinė aproksimacijos paklaida ji = 36,638 / 12 = 3,05 %, t. y. mažiau, nei 10 %.

4 lentelė. Sezoniškumo indeksų apskaičiavimas aritmetinio vidurkio

metoduFaktiniai dinamikos eilutės lygiai (Yt) 4\ -

Ketvirčiai 1997 1998 1999 ZYi j \ Y iz ,=

Y i / Y a 100

1 359,3 400,0 422,2 1181,5 393,83 96,02 360,2 424,8 424,4 1209,4 403,13 98,23 391,1 429,5 432,3 1252,9 417,63 101,74 416,5 439,8 425,3 1281,6 427,20 104,1S 4925.4 1641,79 400,0

&TO

Čia i - ketvirčiai, j - metai."Sezoniškumo indeksai aritmetinio vidurkio metodu: Z į = Y i / Y ;Y ^ 4925,4 / 12 = 410,45 arba 1641,79 / 4 = 410,45.

-5 l&htelė. Sezoniškumo indeksų apskaičiavimas analitinio išlyginimo

r if - h metodu/• ; 4-

jT) - f Empirinių din su lygiais išlyj

arnikos eilutės fintais tU’sč.v ly

lygių santykis štimi (proc.)*

Ketvirčiai 1997 1998 1999Zi (proc.)

( Xa )1 95,4 99,7 99,2 98,1002 94,1 104,3 98,2 98,8663 100,6 103,9 98,7 101,0664 105,4 104,8 95,7 101,966

399,998žr. 1 lentelę.

147

Page 145: Statistika I Ona Gražytė-Molienė

Apskaičiuojame sezoniškumo indeksų variacijos koeficientą:

v =JZ (Z ,-100 r (97,2 -100)2 + (99,6 -100)2 + (l00,4 -100f + (l 02,8 -100)2

4= >/4=2%.

Šių sezoniškumo indeksų, apskaičiuotų pagal multiplikatyvųjį modelį slenkamųjų vidurkių metodų, naudojant 1997-lyyy metų T&tvirtinių duomeniį''5vy[aviriią^mpntudė (sklaidos plotis): Z max - Z min = 102,8 - 97,2 = 5,6 punkto. Kadangi variacijos koeficientas lygus 2 %, t. y. mažesnis nei 10 %, galima teigti, jog vartojimo išlaidų lygio sezoniškumo indeksų sklaida maža.

6 lentelė. Respublikos namų ūkių mėnesinio vartojimo išlaidų lygio dinamikos eilutės (1997-1999 metų atskirais ketvirčiais) komponentų

nustatymas adityviuoju metodu

t Y, Y,(S0

Y,- Y, (S)(Y ,*) Yf-S; f i n

(T )

Yt* Y,*-T1 359,3 - -11,904 371,20 371,20 380,85 -9,652 360,2 - - 1,569 361,77 723,54 386,23 -24,463 391,1 386,86 4,24 1,786 389,31 1167,93 391,62 - 2,314 416,5 400,03 A m 11,686 404,82 1619,56 397,00 7,825 400,0 412,9tf -42,90 411,90 2059,50 402,38 9,526 424,8 420,61' -1,569 426,37 2558,22 407,76 18,617 429,5 426,30 3,2<\ 1,78d 427,71 2993,97 413,14 14,578 439,8 429,03 10,77 \ 11,68$ 428,12 3424,96 418,52 9,69 422,2 429,24 7.04 434,10 3906,90 423,90 10,2

10 424,4 427,86 -3,46 ~ 1,569 425,97 4259,70 429,28 - 3,3111 432,3 - 1,786 430,51 4735,61 434,67 - 4,1612 425,3 - 11,686 413,62 4963,44 440,05 - 26,43E 4925,4 (0,003) 4925,4 32784,53 4925,4 0

= ~ 12,9 +f 7>04) = - 9į97; „ 4,24 + 3,20 2 3 2

S2 = 4’19 + (-3’46) = 036S, ^ = IM T + ĮO ^ ^2 2

* Sezoniškumo įtakos nustatymas slenkamųjų vidurkių metodu: Kadangi S Sj 4- 0, nustatoma koreguota sezoniškumo įtaka:

7.735S , '= S , - - L— = S I -1,934.

148

Page 146: Statistika I Ona Gražytė-Molienė

1 ketvirtis -11,9042 ketvirtis -1,5693 ketvirtis 1,7864 ketvirtis 11,686

£_sj=P

** Kita procedūra - eliminuojama sezoniškumo įtaka (Yt*) ir nustatomi desezonizuotų duomenų tiesinio trendo lygties parametrai. Žinome, kad :

X t = 78; 112 = 650; £Y t*-1 = 32784,53.

4925,4-7832784,53-

650

12_____ 769,43

782 ” 143

12

a .= -------- ^ -- = S ^ L = 5381;1 ' i n 2 -i a “s ’ ’

_ 492^4 _ 5 38 i78 _ 3 7 5 4 ^ 4

0 12 12

Taigi, gavome tokią desezonizuotų duomenų tiesinio trendo lygtį:

Y, * = 375,474 + 5,381 -t.

Pagal šią lygtį ir nustatomas trendo komponentas (T), o po to - ir likutinis komponenas: č, t = Yt* - T, arba č, t = Y t - (S + T).

Patikrinimas pagal adityvtgį modelį: Yt=T + S + t-Yi= 380,85 + (-11,904) + (- 9,65) = 359,3;Y 2= 386,23 + (-1,569) + (- 24,46) =360,2; ir 1.1.

DINAMIKOS EILUTĖS EKSTRAPOLIACIJA

Respublikos namų ūkių mėnesinio vartojimo išlaidų lygio prognozės

variantai (L=4):1) naudojant empirinius dinamikos eilutės duomenis pagal tokią tiesinio

trendo lygtį: Yt = 370,436 + 6,156 (n+L)

2000-ųjų metų vartojimo išlaidų lygis (Lt):1 ketvirtis - 450,46 (370,436 + 6,156 • 13);2 ketvirtis - 456,62 (370,436 + 6,156 ■ 14);

149

Page 147: Statistika I Ona Gražytė-Molienė

3 ketvirtis - 462,78 (370,436 + 6,156 • 15);4 ketvirtis - 468,93 (370,436 + 6,156 • 16).

2) Atsižvelgiant į sezoniškumą ir desezonizuotus dinamikos eilutės duomenis (multiplikatyvus modelis) pagal tokią tiesinio trendo lygtį:

Y t=[ 374,974 + 5,445 ( n+L ) ] • Z į , čia Z į - sezoniškumo indeksai:2000-ųjų metų vartojimo išlaidų lygis (Lt):1 ketvirtis - 433,28 [(374,974 + 5,445-13) • 0 972];2 ketvirtis - 449,40 [(374,974 + 5,445 • 14) • 0,996];3 ketvirtis - 458,48 [(374,974 + 5,445 • 15) • 1,004];4 ketvirtis - 475,03 [(374,974 + 5,445 -16)-1,028].

3) Atsižvelgiant į sezoniškumą ir desezonizuotus dinamikos eilutės duomenis (adityvusis modelis) pagal tokią tiesinio trendo lygtį:

Yt = [375,474 + 5,381(n+L)] + Sj, čia Sj - sezoninis komponentas {adityvusis modelis):

2000-jų metų vartojimo išlaidų lygis (Lt):1 ketvirtis - 433,52 [(375,474 + 5,381 • 13) + (-11,904)];2 ketvirtis- 449,24 [(375,474 + 5,381 -14) + (-1,569)];3 ketvirtis - 457,98 [(375,474 + 5,381 ■ 15) + 1,786];4 ketvirtis - 473,26 [(375,474 + 5,381 • 16) + 11,686].

* 2000-ųjų metų atskirų ketvirčių Respublikos namų ūkių mėnesinio vartojimo išlaidų lygio prognozių įvertinimas Teilo sutapimo koeficientu (U):

U =

J )

S rT!

Ketvirčiai YTP YT (Y /-YT)2 YT21 433,3 395,4 1436,41 156341,162 449,4 392,8 3203,56 154291.843 458,5 407,3 2621,44 165893,294 475,0 426,0 2401,00 181476,00E 9662,41 658002,29

u -- I- 9—2’4-1. = 0,015 = 0,121; V 658002,29 y

150

Page 148: Statistika I Ona Gražytė-Molienė

Ketvirčiai Y t Y T ( Y tp-Y t ) 2 Y t11 433,5 395,4 1451,61 156341,162 449,2 392,8 3180,96 154291,843 458,0 407,3 2570,49 165893,294 473,3 426,0 2237,29 181476,00£ 9440,35 658002,29

u = J j 40!3-5 = 0,014 = 0 ,1 2 0 ;V 658002,29 ^

J LKetvirčiai Y TP Y T (Y Tp-Y t) Z Y T2

1 450,5 395,4 3036,00 156341,16

2 456,6 392,8 4070,44 154291,84

3 462,8 407,3 3080,25 165893,29

4 468,9 426,0 1840,41 181476,00

E 12027,10 658002,29

U = I I2Q27’!_ = 0,018 = 0,135. \ 658002,29

Kaip matome, patikimesnė prognozė (mažesnis Teilo nesutapimo koeficientas) gauta pagal antrąjį variantą, t. y. naudojant iš desezonizuotus

duomenis (multiplikatyvusis modelis) pagal nustatytą tiesinio trendo lygtį ir atitinkamą sezoniškumo indeksą.

Page 149: Statistika I Ona Gražytė-Molienė

2.4. KORELIACIJA IR REGRESIJA

1 uždavinys

Tiesinės koreliacijos koeficientu reikia įvertinti gautų matematikos (x) ir statistikos (y) egzaminų balų sąsajos stiprumą, turint tokius studentų anketinės apklausos duomenis, pateiktus koreliacinėje lentelėje:

yjXį \

5-6 7-8 9-10 nj t n,Xį 1 nį.Xį2 SnįjXįyj

j5,5 7,5 9,55-6 5,5

| 00

|§] 41,25|1

52,25|1 10

Os.IT)

, 302,5 335,5

7-8 t 82,5Į2

281.25T5

285 |4 f 11/ 82,5 618,75 648,75

9-10 9,5 213,75|3

541,5}6

^ __^

9 85,5 812,25 755,25n.j 10 9 11 30 223 1733.5 1739,5

55 67,5 104,5 227

n.jyj2 302,5 506,25 992,75 1801,5

SnųS iy j

i324,5 536,25 878,75 1739,5

Tiesinės koreliacijos koeficientą skaičiuojame pagal tokią formulę:

xy-x-yr - •y,x

Iš koreliacinės lentelės vidurkius ir standartinius nuokrypius skaičiuojame svertine forma pagal tokias formules:

; = ^ = 7,43; y = ~ = W ^ = I f r = 57’9833;30 30 j U

O x = Jx 2-(xJ = - 7,432 = 5,5784 = 2,362;

=J ^ - ~ 7’572 =>/2,7451 =1,657;

57,9833-7,43-7,57 1,7382r ---------------------- !— = -------- =0,444.>s 2,362 1,657 3,9138

152

Page 150: Statistika I Ona Gražytė-Molienė

Taigi tiesinės koreliacijos koeficientas yra lygus 0,444. Tai rodo, kad matematikos ir statistikos egzaminų balus sieja tiesinė tiesioginė vidutinio

stiprumo sąsaja.

2 uždavinys

Apskaičiuoti empirinį koreliacijos santykį, turint tokius duomenis apie nedarbo trukmę (mėn.): ___________________________________________

\ y Iki 3 3-6 6-12 12 ir > E

X \1,5 4,5 9 15

Vyrai 32 68 40 20 160

Moterys 10 20 60 50 140

2 42 88 100 70 300

yf — - 396 900 1050 2409

y!f ..94,5 . 1782 8100 15750 25726,5

Pirmiausia pagal svertinio aritmetinio vidurkio formulę apskaičiuojame rezultatinio požymio grupinius ir bendrąjį vidurkius, t. y. vidutinę nedarbo trukmę (mėn.):

- --- . - 2409 y -- ^ —-— > y = ----= 8,03;

Y , f t 300

- 1,5-32 + 4,5-68 + 9-40 + 15-20 _ 48 + 306 + 360 + 300 _ 1014 _ 63

" 160 “ 160 " 160 “

l,5-10 + 4,5-20 + 9-60 + 15-50_ 15 + 90 + 540 + 750 _ 1395 _ .

y"M- - 140 ~ 140 ~ 140

/ 1 Y&-yf-ni fe3-B,03)2 -160 + (l0,0-8,03)2 -140 _ 1022,19 ,

į y 300 300

Kadangi empirinis koreliacijos santykis gali svyruoti nuo 0 iki 1, tai duotuoju atveju, kai jis lygus 0,4, jis rodo nedidelį lyties ir nedarbo trukmės sąsajos stiprumą. Tai patvirtina ir determinacijos koeficientas, kuris lygus 0,16 (nedarbo trukmė priklauso nuo lyties tik 16 proc.).

153