Skripta iz statistike

  • View
    270

  • Download
    9

Embed Size (px)

DESCRIPTION

Skripta sa pitanjima i odgovorima iz statistike. Teorija i zadatci

Text of Skripta iz statistike

1. UvodStojestatistika?Statistika jeznanstvenadisciplinakojaproucavametodeprikupljanja, sre divanja, analizeitumacenjapodataka. Statistikaimavaznuprimjenuuprirodnim, tehnickim, drustvenimihumanistickimznanostima. Uposlovanjuiupravljanjustatistikaseupotrebljavazadonosenjeodlukauuvjetimanesigurnosti.Primjeriproblemakojerjesavajustatisticari:(a) Kolikajestopanezaposlenosti?(b) Tko cepobijeditinasljedecimizborimaizakoliko?(c) Kojaoddvijeilivisemetodapoucavanjadajeboljerezultate?(d) Kakavjeucinaknovoglijeka?(e) Kojisugenivaznizanastanakodre denebolesti?Osim podrucja ljudskog djelovanja, rijec statistika moze oznacavati skup podataka npr.statistikasportskogprvenstvaili statistikaoprometnimnezgodama, ili numerickuvelicinuizracunatunaosnovupodataka, osobitokadasepodaci odnosenauzoraknpr. proporcija(tj. udioilipostotak)studenatakojiradeprekostudentservisa.PopulacijaiuzorakPopulacija ili statisticki skup jeskuposoba, stvari, pojavaili drugihobjekata, cijeosobineistrazujemostatistickommetodom.Clanovi populacijezovusestatistickejedinice, anjihovbrojzovesevelicinapopulacije.Primjer1.1. Nekolikopopulacija:(a) StudentiSveucilistauPulikojistudijpoha dajuuak.god. 2010./2011.(b) NoviosobniautomobiliprodaniuHrvatskojtijekom2010. god.(c) PotresinapodrucjuHrvatskeuposljednjihstotinugodina.(d) HotelisasjedistemuIstrinadan1. svibnja2010.(e) Tekuciracunigra danauZagrebackojbancinadan1. ozujka2011.Populacijaimapojmovno, prostornoi vremenskoodre denje. Pojmovnoodre denjeopisujekategorijuobjekatakoji cinepopulaciju, tj. kojesmatramostatistickimjedinicama. Pros-tornoodre denjekazujemjestoili institucijukojoj pripadajustatistickejedinice. Vremenskoodre denjeopisujevremenskorazdobljeili trenutakuvremenuukojemusestatistickejedi-nicepromatraju. Pojmovno, prostornoi vremenskoodre denjeredomodgovarajunapitanjasto, gdjei kadasepromatra. Npr. akopromatramopopulacijustudenataSveucilistauPuli koji poha dajustudijuak.god. 2010./2011., ondajepojmovnoodre denjestudenti,prostornoodre denjejeSveucilisteuPuliivremenskoodre denjejeak.god. 2010./2011.Promatranjecitave populacije zove se cenzus. Zbogvelicine populacije, njezine nedos-tupnosti ili visokihtroskovaprikupljanjapodataka, cenzus jecestoteskoili caknemoguceprovesti. Utakvimslucajevima, ogranicavamosenapromatranjedijelapopulacije. Dioili1-1podskuppopulacijezoveseuzorak, postupakformiranjauzorkazoveseuzorkovanje, abrojjedinicauuzorkuzovesevelicinauzorka.Primjer 1.2. Potrebno je utvrditi koliko studenata Sveucilista uPuli posjeduje vozackudozvolu. Sobziromdanasveucilistustudiranekolikotisucastudenata, teskoje prikupitipodatke za sve studente. Zbog toga, formiran je uzorak od 50 studenata, za koje je utvr deno daih 29 posjeduje vozacku dozvolu, na osnovu cega se zakljucuje da priblizno 29/50 100% = 58%studenatasveucilistaposjedujevozackudozvolu.Uzorak koristimo da bismo saznali nesto o populaciji,pa se uzorak mora pazljivo odabrati,kakobi valjanopredstavljaopopulaciju. Akoseuzorakbiranekimslucajnimmehanizmomnpr. slucajnimizvlacenjemlisticaizkutijeili generiranjemslucajnihbrojevanaracunalu,ondakazemodaimamoslucajni uzorak. Slucajnost uzorkaje garancijadase uzoraknecesistematicnorazlikovatiodpopulacije.Bezobzirakakojeuzorakodabran,slucajnoilineslucajno,upoopcavanjuosobinauzorkana citavupopulacijunuzno cinimopogresku,kojasezovepogreskauzorkovanja.Stojeuzorakveci, toseonmanjerazlikujeodpopulacije, pajei pogreskauzorkovanjamanja. Sdrugestrane,veciuzorakupraviluznaciivecetroskoveprikupljanjapodataka.Istaknimojos dase numerickaosobinapopulacije zove parametar, anumerickaosobinauzorkazovesestatistika. Npr. akopromatramoautomobileizprimjera1.1b, ondamozemoizracunati proporcijuprodanihautomobilasdiesel motorom. Proporcijapopulacijeprimjerjeparametra. Ogranicimoli promatranjenauzorakautomobila, govoritcemooproporcijiuzorka,stojeprimjerstatistike. Uslucajukadasuparametri nepoznati, statistikekoristimozaprocjenjivanjeparametaraizatestiranjehipotezaoparametrima.DeskriptivnaiinferencijalnastatistikaUobicajenajepodjelastatistikenadeskriptivnuiinferencijalnu.Deskriptivna statistika obuhvacapostupke sre divanja, tablicnogi grackogprikazivanjapodataka,teizracunavanjaraznihstatistickihpokazatelja,kao stojenpr. aritmetickasredina.Dobivenirezultatiodnoseseiskljucivonadanepodatkeineuopcavajuse.Inferencijalnastatistika proucavametodekojimasepomocudijelainformacijauzorka,donosi zakljucakocjelini populaciji. Procjenjivanje parametarai testiranje hipotezasutipicnipostupcikojispadajuuinferencijalnustatistiku. Zainferencijalnustatistikukoristesejoznaziviinduktivnastatistika,statistickozakljucivanjeilimetodauzoraka.Akoseuistrazivanjukoristimocenzusom, ondazadnji korakuistrazivanjujeprimjenametodadeskriptivnestatistike. Naime, utomtrenutkubitcepoznatesvekarakteristikepo-pulacijeimoci cemodonijetiodlukuilidrugezakljuckekojetrebamo. Me dutim,raspolaganjecitavompopulacijomje vise izuzetaknegopravilo. Obicnoraspolazemouzorkom, ahtjelibismonestosaznatiopopulaciji,pri cemusekoristimoinferencijalnomstatistikom.Vaznojenapomenuti dasepostupci inferencijalnestatistikezasnivajunapretpostavci daje uzorak slucajan. Ako imamo neslucajan uzorak,metode inferencijalne statistike se ne moguprimijeniti.StatistickevarijableIstrazivaceobicnozanimajuodre denasvojstvastatistickihjedinica. Svojstvokojeposjedujusve statisticke jedinice i koje za razlicite statisticke jedinice moze poprimiti razlicite vrijednostiilimodalitetezovesestatistickavarijablailistatistickoobiljezje.1-2Primjer1.3. Nekestatistickevarijablezapopulacijeizprimjera1.1:(a) studenti: ime, prezime, spol, godinaro denja, mjestoro denja, broj indeksa, odjel, smjer,godinastudija,brojpolozenihispita,prosjecnaocjena;(b) automobili: proizvo dac, model, godina proizvodnje, cijena, broj sasije, boja, vrsta motora,snaga,potrosnja,brojsjedala, zupanija(ukojojjeautomobilprodan);(c) potresi: vrijemepocetka,trajanje,epicentar,dubina,snaga,intenzitet,broj zrtava;(d) hoteli: naziv, kategorija, sjediste, tvrtka(kojaposlujehotelom), broj soba, broj apart-mana,brojpostelja,brojzaposlenih,brojstalnozaposlenih;(e) tekuciracuni: brojracuna,vlasnik,saldo,dopustenoprekoracenje.Svojstvokojezasvestatistickejediniceimaistuvrijednost, nijevarijabla, negojekons-tantanpr. sveucilistezasveucilisnestudentekojistudirajuuPuliilizupanijazahotelesasjedistemuIstri.Vrijednosti statistickih varijabli utvr duju se mjerenjem, a mjerenje se vrsi prema odre denojmjernojskali.MjerneskaleMjerenje nekogsvojstvajepostupakkojimstatistickimjedinicamadodjeljujemobrojeveilidruge simbole, tako da odnosi me dubrojevima ili simbolima odgovarajuodnosima me dustatistickimjedinicamasobziromnasvojstvokojesemjeri. Pravilopremakojemuprovodimomjerenjezovesemjernaskala. Mjerenjeimjerneskale,tenjihovutjecajnaanalizupodatakaproucavagranaprimijenjenematematikekojasezoveteorijamjerenja.Npr. pretpostavimo da imamo skupcijevi. Svakoj cijevi mozemo dodijeliti broj kojipredstavljanjenuduljinu(npr. umetrima). Akojebrojkoji smotakododijelili jednojcijeviveci odbrojakoji smododijelili nekojdrugojcijevi, ondamozemozakljuciti dajeprvacijevduljaoddruge. Dakle, odnosme dubrojevima(biti veci)odgovaraodnosume ducijevima(bitidulji). Slicnotome,akozbrojimobrojevekojesmododijelilidvjemacijevima,rezultatzbrajanjajeduljinacijevikojabisedobilaspajanjemtihdvijucijevi. Stoga,josjedanodnosme dubrojevima(zbrajanje),odgovaraodre denomodnosume ducijevima(spajanje).Sdruge strane, prepostavimodaimamoskupstudenatai dasmostudentimadodijelilibrojeve,ovisnootomekojistranijezikslusaju: enleskijezik1,njemackijezik2,talijanskijezik3, ostalo4. Koji odnosi me dubrojevimaodgovarajuodnosimame dustudentima?Ociglednoseniti jednosvojstvododijeljenihbrojevaneprenosi nastudente. Takvebrojevenemasmislauspore divati povelicini, niti imasmislas njimaprovoditi racunske operacije,jedino stoznamojedastudentikojimasudodijeljenirazlicitibrojevislusajurazlicitejezike.Statistikapovezujepodatkei zakljucke, ateorijamjerenjapovezujepodatkei stvarnost.Zelimoli danamstatistickaanalizakazenestoostvarnosti, anesamoopodacima, moramorazumjeti svojstva mjernih skala u skladu s kojima je provedeno mjerenje. Poznavanje mjernihskalauvjetjezaispravniizborstatistickihmetodazaanalizupromatranepojave.Najvaznijemjerneskalenominalna, ordinalna, intervalna, omjernai apsolutnatvorehijerarhiju,ukojojsvakasljedecaskalaukljucujeosobineprethodne.Varijablekojimavrijednostdodjeljujemonanominalnoj ili ordinalnoj mjernoj skali zovusekvalitativneili kategoricke, avarijablekojimavrijednostdodjeljujemonaostalimmjernimskalamazovusekvantitativneilinumericke.1-3NominalnamjernaskalaVrijednostnanominalnoj mjernoj skali mozebiti broj ili bilokoji drugi simbol ili rijec. Vri-jednost na nominalnoj skali predstavlja samo identikator, naziv ili kategoriju. Varijabla kojojvrijednost dodjeljujemo prema nominalnoj mjernoj skali zove se nominalnavarijabla. Primjerinominalnihvarijabli: ime, prezime, mjestoro denja(osobe), broj indeksa, odjel (studenta),model,boja(automobila),brojdresa(igracasportskeekipe)itd.Zavrijednostinominalnevarijablemozemosamoutvrditidalisujednakeilirazlicite,npr.mogucejeutvrditidalidvijeosobeimajujednakoilirazlicitoime. Odnosikojimozdavrijedezavrijednostinanominalnojmjernojskalineprenoseseprirodnonastatistickejedinice,npr.cinjenicadajedanigracimamanji broj dresaoddrugogigracanegovori nistaoodnosuiliulozitihigraca.OrdinalnamjernaskalaVrijednostnaordinalnojmjernojskalimozebitibrojilinekidrugisimbolilirijec. Vrijednostnaordinalnoj skali izrazavaredoslijed ili intenzitet. Varijablakojoj vrijednost dodjeljujemopremaordinalnojmjernojskali zoveseordinalnavarijabla. Koristesejosnazivi redoslijednaili rang varijabla. Primjeri ordinalnihvarijabli: ocjena(studentanaispitu), cin(uvojsci ilipoliciji),ekonomskarazvijenost(zemljeiliregije),intenzitetpotresapoMercallijevojljestvici.Vrijednosti ordinalne varijable mogu se poredati po velicini ili intenzitetu. Premda racunskeoperacije s vrijednostima ordinalne varijable nisu moguce, one se ponekad ipak izvode, pa takoracunamonpr. prosjecnuocjenupolozenihispita.IntervalnamjernaskalaPomocuint