STATISTIKA (OPISNA STATISTIKA) - IC GEOSS 2019-04-08آ  STATISTIKA UML. Beseda statistika izvira iz latinske

  • View
    7

  • Download
    0

Embed Size (px)

Text of STATISTIKA (OPISNA STATISTIKA) - IC GEOSS 2019-04-08آ  STATISTIKA UML. Beseda statistika izvira iz...

  • UPORABNA MATEMATIKA V LOGISTIKI za višješolsko strokovno izobraževanje

    STATISTIKA (OPISNA STATISTIKA)

    STATISTIKA UML

    1

  • STATISTIKA UML

    Cilj tega sklopa predavanja je predstaviti obvladovanje računskih spretnosti pri reševanju logističnih problemov in pri statistični analizi.

    Pravilen izračun iskane količine je seveda pomemben, mnogokrat pa je še pomembnejša interpretacija izračunanega rezultata. Na svoji poklicni poti boste morda morali sprejeti kako pomembno poslovno odločitev. Svoje sodelavce boste morali prepričati v pravilnost svoje odločitve. Argumente boste morali podpreti z izračuni in izračunano korektno interpretirati. Ali pa boste morda želeli analizirati povpraševanje potencialnih kupcev izdelka, s katerim želite prodreti na tržišče. V teh in podobnih primerih vam bo priskočilo na pomoč vaše znanje matematike in statistike.

    V uvodu je predstavljeno nekaj matematičnih zakonitosti, prikazanih nekaj računskih spretnosti in obdelana dva temeljna matematična modela soodvisnosti med dvema spremenljivima količinama.

    2

  • STATISTIKA UML

    .

    Beseda statistika izvira iz latinske besede status, ki pomeni država. Statistika je kot metoda za zbiranje podatkov zelo stara, saj so že v starem veku zbirali podatke o prebivalstvu, pridelkih itd.

    Pravi razvoj statistike se je začel v 17. stoletju, ko so znani matematiki tega obdobja postavili temelje verjetnostnega računa, na katerem temelji matematična statistika. V 20. stoletju je z razvojem računalništva postala statistika širše uporabljana.

    Osnovni namen statistike je razumevanje pojavov iste vrste, ki se pojavljajo v velikem številu, zato jih imenujemo množični pojavi. Množičen pojav je na primer serijska proizvodnja določenega izdelka. Med osnovne naloge statistike štejemo zbiranje, razvrščanje in urejanje podatkov ter sprejemanje zaključkov, kot so npr. odkrivanje lastnosti in zakonitosti populacije in napovedovanje vrednosti.

    3

  • STATISTIKA UML

    Statistika je veja matematike, ki proučuje metode zbiranja, urejanja, kvantitativne obdelave, prikazovanja in analiziranja številskih podatkov. Ko zberemo podatke, jih je potrebno »obdelati«. Metodološka obdelava je odvisna od namena in cilja statistične raziskave. V vsakem primeru, pa naj bi vsebovala:

    - ureditev podatkov, - grafični prikaz, - izračun parametrov, - interpretacijo.

    4

  • STATISTIKA UML

    Množica, ki jo statistično proučujemo, se imenuje populacija.

    Populacija je lahko končna ali neskončna množica enot, kot so predmeti, ljudje, dogodki ali kaj drugega.

    Populacijo moramo opredeliti stvarno, geografsko in časovno:

    - s stvarno opredelitvijo natančno določimo, kdo ali kaj spada vanjo in kdo ne, - z geografsko opredelitvijo povemo, kje je zajeta populacija, - s časovno opredelitvijo pa kdaj. Število statističnih enot, ki jih zajamemo v

    raziskavi, po navadi označujemo „N“ (numerus).

    5

  • STATISTIKA UML

    Elementi populacije se imenujejo statistične enote.

    Pogosto ne moremo, ne želimo ali pa je predrago proučevati celotno populacijo, zato izberemo le podmnožico populacije, ki jo imenujemo vzorec, nato pa na podlagi lastnosti vzorca sklepamo o lastnostih populacije.

    Podmnožica je slučajno izbrana, če ima vsak element enako verjetnost, da bo izbran v vzorec. Lastnosti statistične enote, ki jih raziskujemo, imenujemo statistični podatek ali statistična spremenljivka.

    Pri tem poskušamo zagotoviti reprezentativnost vzorca. Vzorec je reprezentativen, če so rezultati raziskave na vzorcu enaki, kot bi bili rezultati raziskave na celotni populaciji.

    6

  • Slučajni vzorec dobimo s slučajnim izborom enot populacije v vzorec. S tem dosežemo, da je struktura vzorca kar najbolj podobna strukturi populacije. Pogosto rečemo, da slučajni vzorec najbolje predstavlja (reprenzetira) celotno populacijo. Velikost vzorca bomo označili z „n“.

    Statistična spremenljivka opisuje lastnost enot.

    Primeri statističnih spremenljivk so spol oseb, število prometnih nesreč, število potnikov na vlaku, poraba goriva avtomobila na 100 km. V vseh opisanih primerih se izraz „spremenljivka“ uporablja upravičeno, saj vsaka opazovana enota zavzame neko določeno vrednost. Te vrednosti so lahko med seboj različne, lahko pa ima nekaj enot enake vrednosti. Vrednosti spremenljivk bomo pogosto imenovali podatki.

    STATISTIKA UML

    7

  • Glede na način izražanja vrednosti spremenljivke delimo spremenljivke na:

     opisne, pri katerih vrednosti le opišemo z besedami in jih ne moremo ovrednotiti numerično (npr. spol, kraj bivanja, nacin transporta) in

     številske, pri katerih vrednosti izrazimo numerično. Številske spremenljivke delimo na diskretne in zvezne.

     Diskretne spremenljivke imajo za zalogo vrednosti končno ali neskončno zaporedje realnih števil. Ce vrednosti diskretne spremenljivke dobimo s stetjem, je njena zaloga vrednosti podmnožica naravnih števil (npr. število prometnih nesreč, število potnikov na avtobusu).

     Zvezne spremenljivke lahko zavzamejo vsako vrednost iz nekega intervala. Vrednosti zveznih spremenljivk dobimo z merjenjem (npr. čas, ki ga potrebuje voznik za določeno pot) ali z izračunavanjem (npr. poraba goriva vozila na 100 km).

    STATISTIKA UML

    8

  • Parameter je statistična karakteristika populacije, ki ga izračunamo iz podatkov celotne populacije in vzorčna statistika je statistična karakteristika vzorca, ki ga izračunamo iz podatkov vzorca

    Kot primer parametra lahko navedemo povprečje populacije ali pa delež populacije z določeno lastnostjo.

    Pri statističnem raziskovanju najprej zberemo podatke od posameznih enot vzorca, na podlagi teh podatkov izračunamo vzorčno statistiko, ki opisuje lastnost vzorca, nato pa s statističnem sklepanjem, ki temelji na matematični statistiki, sklepamo o parametru populacije.

    STATISTIKA UML

    9

  • STATISTIKA UML

    Opisna statistika se ukvarja s predstavitvijo oz. povzemanjem pridobljenih podatkov. Množico informacij želimo obdelati in jih predstaviti na čim bolj nazoren način.

    Inferenčna statistika raziskuje medsebojno povezanost določenih statističnih parametrov. Ukvarja se tudi z ugotavljanjem zanesljivosti sklepov, ki smo jih dobili tako, da nismo raziskali celotne populacije, pač pa samo njen manjši del, vzorec.

    V nadaljevanju bomo spoznali osnove opisne statistike in osnove statističnega sklepanja.

    10

  • Urejanje podatkov Podatke, ki smo jih pridobili od opazovanih statističnih enot populacije, moramo primerno urediti. Najprej si bomo ogledali urejanje številskih podatkov, nato pa se opisnih. Pri številskih podatkih imamo dve možnosti:

     če je podatkov malo, npr. do 30, jih uredimo po velikosti v ranžirno vrsto,  če pa je podatkov veliko, jih grupiramo in prikažemo v tabeli, ki jo imenujemo

    frekvenčna porazdelitev. Število enot populacije smo označili z „N“.

    Ranžirna vrsta

    Po velikosti urejenim številskim podatkom v ranžirni vrsti določimo zaporedno številko, ki jo imenujemo rang. Rang nam pove, na katerem mestu v ranžirni vrsti se nahaja podatek.

    Enaki podatki stojijo v ranžirni vrsti skupaj in imajo enak rang. Izračunamo ga kot povprečje rangov, ki bi jih podatki imeli, če bi bili različni med seboj.

    STATISTIKA UML

    11

  • STATISTIKA UML

    Primer 1: Iz proizvodnje čokolad vzamemo vzorec 9-ih izdelkov (150g lešnikove čokolada) ter izmerimo težo ….

    Vzorec Xi (posamezni rezultat)

    1 150,6 2 151,8 3 151,5 4 153,4 5 150,6 6 152,2 7 149,5 8 150,4 9 150,9

    RANŽIRNA VRSTA:

    149,5 150,4 150,6 150,6 150,9 151,5 151,8 152,2 153,4

    12

  • STATISTIKA UML

    13

  • STATISTIKA UML

    Običajno se podatke uredi v tabelah. Danes se za to uporablja računalniško orodje EXCEL, ki ga boste uporabljali tudi vi pri reševanju študijskih primerih. Če podatke vnesete v excelovo tabelo, ne boste imeli težav z grafično predstavitvijo, saj vam excel ponuja različne vrste grafikonov. Vi se le morate odločite, kateri je za prikaz podatkov, ki ste jih zbrali, najprimernejši.

    Primer 1: Linijski grafikon teže vzorcev mlečne čokolade

    14

  • STATISTIKA UML

    Sedaj pa sledi najtežji del obdelave, to je analitični del, ki mora vsebovati izračune in interpretacije statističnih parametrov. Kateri statistične parametre naj bi vsebovala posamezna poročila, je odvisno od namena in ciljev statističnega proučevanja. Na nacionalnem nivoju je to v pristojnosti Statističnega urada Republike Slovenije; na podjetniškem nivoju pa je to prepuščeno menedžmentu, razen na tistih področjih, ki jih določajo predpisi.

    Odločiti se boste morali za tiste parametre, ki po vašem mnenju najbolj odražajo lastnosti populacije.

    Pri izračunu statističnih parametrov (aritmetična sredina, mediana, modus) je treba upoštevati pravila in postopke, ki jih predpisuje stroka. Aritmetična sredina, mediana, modus kažejo osrednjo težnjo rezultatov, okrog njih se rezultati kopičijo:

    Statistične parametre izračunamo za negrupirane in grupirane podatke.

    15

  • STATISTIKA UML

    Aritmetična sredina

    16

  • STATISTIKA UML

    Aritmetična sredina