32
KLAUSIMAI iš aprašomosios statistikos 1. Prašau pateikti po vieną pavyzdėlį kiekvienam kintamųjų tipui (5 pavyzdžiai). 2. Kuo apibūdinsite požymį, jei jis kategorinis? 3. Kokiomis statistikomis apibūdinsite požymį, jei jis skaitmeninis? 4. Kaip įvertinsite skirstinio normalumą?

KLAUSIMAI iš aprašomosios statistikos

Embed Size (px)

DESCRIPTION

KLAUSIMAI iš aprašomosios statistikos. Prašau pateikti po vieną pavyzdėlį kiekvienam kintamųjų tipui (5 pavyzdžiai). Kuo apibūdinsite požymį, jei jis kategorinis? Kokiomis statistikomis apibūdinsite požymį, jei jis skaitmeninis? Kaip įvertinsite skirstinio normalumą?. - PowerPoint PPT Presentation

Citation preview

Page 1: KLAUSIMAI iš aprašomosios statistikos

KLAUSIMAIiš aprašomosios statistikos

1. Prašau pateikti po vieną pavyzdėlį kiekvienam kintamųjų tipui (5 pavyzdžiai).

2. Kuo apibūdinsite požymį, jei jis kategorinis?

3. Kokiomis statistikomis apibūdinsite požymį, jei jis skaitmeninis?

4. Kaip įvertinsite skirstinio normalumą?

Page 2: KLAUSIMAI iš aprašomosios statistikos

STATISTINĖS IŠVADOS

ATSITIKTINUMO ĮVERTINIMAS• Statistikos pagrindai• Pasikliautinio intervalo samprata• Centrinė ribinė teorema• Pasikliautinio intervalo skaičiavimas ir

interpretacija:– Vienai grupei– Dviejų grupių skirtumui:

– Aritmetiniam skirtumui– Santykiui

Page 3: KLAUSIMAI iš aprašomosios statistikos

Statistikos pagrindai:

• Vienoje dėžėje yra 50 baltų ir 50 raudonų kamuolių.

• Visi kamuoliai skirtingo dydžio (skersmens dydis). Vidutinis skersmuo 16 cm.

Page 4: KLAUSIMAI iš aprašomosios statistikos

Statistikos pagrindai:

• Ištraukiate 4, norėdami įvertinti raudonų kamuolių proporciją.

• Ir apskaičiuojate skersmens vidurkį iš tų 4 kamuolių.

Page 5: KLAUSIMAI iš aprašomosios statistikos

Statistikos pagrindai:

Gali atsitikti taip, kad ištrauksite 2 raudonus ir 2 baltus, tuomet išvada bus – 50% kamuolių yra raudonų, ir tai teisinga!

Bet gali atsitikti, kad ištrauksite 4 raudonus, tuomet išvada bus - 100% kamuolių yra raudonų, ir tai visiškai klaidinga, tiesiog atsitiktinumas.

Page 6: KLAUSIMAI iš aprašomosios statistikos

Statistikos pagrindai:

• Gali atsitikti taip, kad iš tų 4 kamuolių apskaičiuosite vidurkį ir gausite 16 cm ir tai teisinga! Nors vargu, ar įtikėtina, kad taip pavyks.

• Bet gali atsitikti, kad iš tų 4 kamuolių apskaičiuosite vidurkį ir gausite 5 cm arba 30 cm, ir tai visiškai klaidinga, tiesiog atsitiktinumas.

Page 7: KLAUSIMAI iš aprašomosios statistikos

kamuolių traukimo galima padaryti visiškai skirtingas išvadas apie tikrąją raudonų kamuolių dalį bei jų dydį dėžėje dėl– atrankų įvairovės, kai sudaromos skirtingos

imtys,– o taip pat ir jų dydžio.

Page 8: KLAUSIMAI iš aprašomosios statistikos

Statistinės išvados

• Įvertis:– Taškinis įvertis (rezultatas): vidurkis,

standartinis nuokrypis, proporcija– Pasikliautiniai intervalai

• Hipotezės tikrinimas (statistinės hipotezės, kuri yra teiginys apie populiacijos parametrą, bet ne apie imties statistiką)

Page 9: KLAUSIMAI iš aprašomosios statistikos

Pasikliautiniai intervalai

• Intervalas, kuriame su tam tikra tikimybe gali būti tikroji reikšmė

Page 10: KLAUSIMAI iš aprašomosios statistikos

Imčių variacija ir jų parametrai

Imties vidurkis Xi, standartinis nuokrypis SDi, proporcija pi

Populiacijos vidurkis μ, standartinis nuokrypis σ, proporcija p0

Imčių vidurkių vidurkis XX

X1, SD1; p1

X2, SD2; p2 X3, SD3; p3

X4; SD4; p4

μ, σ, p0

Page 11: KLAUSIMAI iš aprašomosios statistikos

Imčių variacija ir jų parametrų pasikliautiniai intervalai

μ, p0

Page 12: KLAUSIMAI iš aprašomosios statistikos

Pasikliautiniai intervalai

• Tikslus statistinis apibrėžimas:

Jei tyrimą atlikote 100 kartų ir gavote 100 reikšmių ir 100 PI, 95 kartus iš 100 tikroji reikšmė bus duotame intervale. 5 atvejais tikroji reikšmė nepateks į tą intervalą.

• Tos reikšmės gali būti vidurkis, skirtumas, reliatyvi rizika ir t.t.

Page 13: KLAUSIMAI iš aprašomosios statistikos

Pasikliautiniai intervalai(bendra, dažniausia išraiška)

95% PI : X ± 1,96 x SE Xmin; Xmax

Pastaba: normaliam skirstiniui, kai didelis n

95% PI : p ± 1,96 x SE pmin ; pmax

Pastaba: kai p ir 1-p > 5/n

Page 14: KLAUSIMAI iš aprašomosios statistikos

Standartinė paklaida(SE, angl. standard error)

• Tai yra imčių pasiskirstymo standartinis nuokrypis

• Rodo, kiek gauta reikšmė yra nukrypusi nuo tikrosios populiacijos reikšmės

Page 15: KLAUSIMAI iš aprašomosios statistikos

Centrinė ribinė teorema

• Kartais sakoma, kad tikimybininkai turi vieną dievą – normalųjį arba Gauso skirstinį.

Page 16: KLAUSIMAI iš aprašomosios statistikos

Centrinė ribinė teorema

Kiekvienas vidurkis apskaičiuotas iš imčių, kur stebėjimų skaičius 10 000.

Page 17: KLAUSIMAI iš aprašomosios statistikos

Centrinė ribinė teoremaJei populiacijos skirstinys normalus, imčių vidurkių

pasiskirstymas (skirstinys) normalus, nepriklausomai nuo imties dydžio.

Imčių (atrankų) vidurkių pasiskirstymas (skirstinys) artėja prie normalaus skirstinio, didėjant imties dydžiui ir tada nepriklauso nuo to, koks yra populiacijos skirstinys.Imčių vidurkiai bus pasiskirstę normaliai (ypač jei imties dydis >30) net jei populiacija asimetriška ar net ir binomiška.

Jei n yra pakankamai didelis, tai skirstinys yra artimas normaliajam skirstiniui.

Page 18: KLAUSIMAI iš aprašomosios statistikos

Centrinė ribinė teorema

• Didėjant imties dydžiui, mažėja imčių variacija, todėl mažėja tikimybė gauti tikrai nereprezentatyvią imtį.

Page 19: KLAUSIMAI iš aprašomosios statistikos

Standartinė paklaida (SE, m)

Skaitmeniniai duomenys

X

Kategoriniai duomenys

p

N

SDN

pp )1(

p

Page 20: KLAUSIMAI iš aprašomosios statistikos

Normalių skirstinių pavyzdžiai

Page 21: KLAUSIMAI iš aprašomosios statistikos

Stjudento t skirstinys priklausomai nuo imties dydžio

Page 22: KLAUSIMAI iš aprašomosios statistikos

Stjudento T skirstinio lentelė

Page 23: KLAUSIMAI iš aprašomosios statistikos

Pasikliautiniai intervalai

• PI plotis priklauso nuo:

a) imties dydžio;

b) tikslumo (norimo užtikrintumo, pasikliovimo lygmens) laipsnio (paprastai 95%, tačiau galima pasirinkti bet kokį %);

c) dispersijos (išsibarstymo).

Page 24: KLAUSIMAI iš aprašomosios statistikos

PI proporcijai

• Apklausus 500 studentų medikų dėl narkotikų vartojimo, 15 iš jų atsakė teigiamai mažiausiai vieną kartą. Kokia dalis studentų vartoja narkotikus (su 95% tikimybe)?

Page 25: KLAUSIMAI iš aprašomosios statistikos

PI proporcijai

• p = 15/500 = 0,03 (3%)

• SE = 0,008

• 95% PI: 0,03 ± 1,96 x 0,008 95% PI : 0,014 ; 0,046 (1,4% ; 4,6%)

• 99% PI: 0,03 ± 2,58 x 0,008 99% PI : 0,010 ; 0,050 (1,0% ; 5,0%)

Page 26: KLAUSIMAI iš aprašomosios statistikos

PI proporcijai

• p = 15/50 = 0,3 (30%)

• SE = 0,065

• 95% PI: 0,3 ± 1,96 x 0,065 95% PI : 0,17 ; 0,43 (17% ; 43%)

Page 27: KLAUSIMAI iš aprašomosios statistikos

PI vidurkiui

Psiciatrų atliktas pirmo kurso studentų medikų streso lygio įvertinimas, matuojant elektrodu frontalinio raumens elektromiografinį aktyvumą. 10 studentų šio matavimo vidurkis buvo 35,8 μvolt, SD 2,5 μvolt. Koks pirmo kurso studentų streso lygis (su 95% tikimybe)?

Page 28: KLAUSIMAI iš aprašomosios statistikos

PI vidurkiui

• SE = 0,79

• 95% PI: 35,8 ± 2,62 x 0,79 95% PI : 33,73 ; 37,87

Page 29: KLAUSIMAI iš aprašomosios statistikos

PI dviejų grupių palyginimui (kiekvienai grupei atskirai)

1) Apklausus 200 studentų ekonomistų dėl narkotikų vartojimo, 10 iš jų atsakė teigiamai mažiausiai vieną kartą. Kokia dalis studentų vartoja narkotikus (su 95% tikimybe)? Kurie daugiau vartoja – medikai ar ekonomistai?

2) Psiciatrų atliktas pirmo kurso studentų ekonomistų streso lygio įvertinimas, matuojant elektrodu frontalinio raumens elektromiografinį aktyvumą. 10 studentų šio matavimo vidurkis buvo 30,2 μvolt, SD 2,5 μvolt. Koks pirmo kurso ekonomistų streso lygis (su 95% tikimybe)? Kurių – medikų ar ekonomistų streso lygis didesnis?

Page 30: KLAUSIMAI iš aprašomosios statistikos

PI dviejų grupių palyginimui - aritmetiniam skirtumui (proporcijos)

2

22

1

11 )1()1(

n

pp

n

ppSEB

2

22

1

11 )1()1(

n

pp

n

ppSEB

SEB – bendra dviejų grupių standartinė paklaida

Page 31: KLAUSIMAI iš aprašomosios statistikos

PI dviejų grupių palyginimui - aritmetiniam skirtumui (vidurkiai)

2

22

1

21

n

SD

n

SDSEB

SEB – bendra dviejų grupių standartinė paklaida

Page 32: KLAUSIMAI iš aprašomosios statistikos

PI dviejų grupių palyginimui - aritmetiniam santykiui (RR, ŠS)

• Pvz.: DES (dietilsilbestrolis) ir krūties vėžys

• RR = 1,4 95% PI = 0,7 ; 2,6

• Su 95% tikimybe galima teigti, kad RR yra tarp 0,7 ir 2,6.

Kadangi PI yra nulinė reikšmė (RR=1,0), neatmetama tikimybė, kad skirtumo nėra, todėl rezultatas nėra statistiškai reikšmingas.