Upload
maureen-cashman
View
53
Download
0
Embed Size (px)
DESCRIPTION
KLAUSIMAI iš aprašomosios statistikos. Prašau pateikti po vieną pavyzdėlį kiekvienam kintamųjų tipui (5 pavyzdžiai). Kuo apibūdinsite požymį, jei jis kategorinis? Kokiomis statistikomis apibūdinsite požymį, jei jis skaitmeninis? Kaip įvertinsite skirstinio normalumą?. - PowerPoint PPT Presentation
Citation preview
KLAUSIMAIiš aprašomosios statistikos
1. Prašau pateikti po vieną pavyzdėlį kiekvienam kintamųjų tipui (5 pavyzdžiai).
2. Kuo apibūdinsite požymį, jei jis kategorinis?
3. Kokiomis statistikomis apibūdinsite požymį, jei jis skaitmeninis?
4. Kaip įvertinsite skirstinio normalumą?
STATISTINĖS IŠVADOS
ATSITIKTINUMO ĮVERTINIMAS• Statistikos pagrindai• Pasikliautinio intervalo samprata• Centrinė ribinė teorema• Pasikliautinio intervalo skaičiavimas ir
interpretacija:– Vienai grupei– Dviejų grupių skirtumui:
– Aritmetiniam skirtumui– Santykiui
Statistikos pagrindai:
• Vienoje dėžėje yra 50 baltų ir 50 raudonų kamuolių.
• Visi kamuoliai skirtingo dydžio (skersmens dydis). Vidutinis skersmuo 16 cm.
Statistikos pagrindai:
• Ištraukiate 4, norėdami įvertinti raudonų kamuolių proporciją.
• Ir apskaičiuojate skersmens vidurkį iš tų 4 kamuolių.
Statistikos pagrindai:
Gali atsitikti taip, kad ištrauksite 2 raudonus ir 2 baltus, tuomet išvada bus – 50% kamuolių yra raudonų, ir tai teisinga!
Bet gali atsitikti, kad ištrauksite 4 raudonus, tuomet išvada bus - 100% kamuolių yra raudonų, ir tai visiškai klaidinga, tiesiog atsitiktinumas.
Statistikos pagrindai:
• Gali atsitikti taip, kad iš tų 4 kamuolių apskaičiuosite vidurkį ir gausite 16 cm ir tai teisinga! Nors vargu, ar įtikėtina, kad taip pavyks.
• Bet gali atsitikti, kad iš tų 4 kamuolių apskaičiuosite vidurkį ir gausite 5 cm arba 30 cm, ir tai visiškai klaidinga, tiesiog atsitiktinumas.
kamuolių traukimo galima padaryti visiškai skirtingas išvadas apie tikrąją raudonų kamuolių dalį bei jų dydį dėžėje dėl– atrankų įvairovės, kai sudaromos skirtingos
imtys,– o taip pat ir jų dydžio.
Statistinės išvados
• Įvertis:– Taškinis įvertis (rezultatas): vidurkis,
standartinis nuokrypis, proporcija– Pasikliautiniai intervalai
• Hipotezės tikrinimas (statistinės hipotezės, kuri yra teiginys apie populiacijos parametrą, bet ne apie imties statistiką)
Pasikliautiniai intervalai
• Intervalas, kuriame su tam tikra tikimybe gali būti tikroji reikšmė
Imčių variacija ir jų parametrai
Imties vidurkis Xi, standartinis nuokrypis SDi, proporcija pi
Populiacijos vidurkis μ, standartinis nuokrypis σ, proporcija p0
Imčių vidurkių vidurkis XX
X1, SD1; p1
X2, SD2; p2 X3, SD3; p3
X4; SD4; p4
μ, σ, p0
Imčių variacija ir jų parametrų pasikliautiniai intervalai
μ, p0
Pasikliautiniai intervalai
• Tikslus statistinis apibrėžimas:
Jei tyrimą atlikote 100 kartų ir gavote 100 reikšmių ir 100 PI, 95 kartus iš 100 tikroji reikšmė bus duotame intervale. 5 atvejais tikroji reikšmė nepateks į tą intervalą.
• Tos reikšmės gali būti vidurkis, skirtumas, reliatyvi rizika ir t.t.
Pasikliautiniai intervalai(bendra, dažniausia išraiška)
95% PI : X ± 1,96 x SE Xmin; Xmax
Pastaba: normaliam skirstiniui, kai didelis n
95% PI : p ± 1,96 x SE pmin ; pmax
Pastaba: kai p ir 1-p > 5/n
Standartinė paklaida(SE, angl. standard error)
• Tai yra imčių pasiskirstymo standartinis nuokrypis
• Rodo, kiek gauta reikšmė yra nukrypusi nuo tikrosios populiacijos reikšmės
Centrinė ribinė teorema
• Kartais sakoma, kad tikimybininkai turi vieną dievą – normalųjį arba Gauso skirstinį.
Centrinė ribinė teorema
Kiekvienas vidurkis apskaičiuotas iš imčių, kur stebėjimų skaičius 10 000.
Centrinė ribinė teoremaJei populiacijos skirstinys normalus, imčių vidurkių
pasiskirstymas (skirstinys) normalus, nepriklausomai nuo imties dydžio.
Imčių (atrankų) vidurkių pasiskirstymas (skirstinys) artėja prie normalaus skirstinio, didėjant imties dydžiui ir tada nepriklauso nuo to, koks yra populiacijos skirstinys.Imčių vidurkiai bus pasiskirstę normaliai (ypač jei imties dydis >30) net jei populiacija asimetriška ar net ir binomiška.
Jei n yra pakankamai didelis, tai skirstinys yra artimas normaliajam skirstiniui.
Centrinė ribinė teorema
• Didėjant imties dydžiui, mažėja imčių variacija, todėl mažėja tikimybė gauti tikrai nereprezentatyvią imtį.
Standartinė paklaida (SE, m)
Skaitmeniniai duomenys
X
Kategoriniai duomenys
p
N
SDN
pp )1(
p
Normalių skirstinių pavyzdžiai
Stjudento t skirstinys priklausomai nuo imties dydžio
Stjudento T skirstinio lentelė
Pasikliautiniai intervalai
• PI plotis priklauso nuo:
a) imties dydžio;
b) tikslumo (norimo užtikrintumo, pasikliovimo lygmens) laipsnio (paprastai 95%, tačiau galima pasirinkti bet kokį %);
c) dispersijos (išsibarstymo).
PI proporcijai
• Apklausus 500 studentų medikų dėl narkotikų vartojimo, 15 iš jų atsakė teigiamai mažiausiai vieną kartą. Kokia dalis studentų vartoja narkotikus (su 95% tikimybe)?
PI proporcijai
• p = 15/500 = 0,03 (3%)
• SE = 0,008
• 95% PI: 0,03 ± 1,96 x 0,008 95% PI : 0,014 ; 0,046 (1,4% ; 4,6%)
• 99% PI: 0,03 ± 2,58 x 0,008 99% PI : 0,010 ; 0,050 (1,0% ; 5,0%)
PI proporcijai
• p = 15/50 = 0,3 (30%)
• SE = 0,065
• 95% PI: 0,3 ± 1,96 x 0,065 95% PI : 0,17 ; 0,43 (17% ; 43%)
PI vidurkiui
Psiciatrų atliktas pirmo kurso studentų medikų streso lygio įvertinimas, matuojant elektrodu frontalinio raumens elektromiografinį aktyvumą. 10 studentų šio matavimo vidurkis buvo 35,8 μvolt, SD 2,5 μvolt. Koks pirmo kurso studentų streso lygis (su 95% tikimybe)?
PI vidurkiui
• SE = 0,79
• 95% PI: 35,8 ± 2,62 x 0,79 95% PI : 33,73 ; 37,87
PI dviejų grupių palyginimui (kiekvienai grupei atskirai)
1) Apklausus 200 studentų ekonomistų dėl narkotikų vartojimo, 10 iš jų atsakė teigiamai mažiausiai vieną kartą. Kokia dalis studentų vartoja narkotikus (su 95% tikimybe)? Kurie daugiau vartoja – medikai ar ekonomistai?
2) Psiciatrų atliktas pirmo kurso studentų ekonomistų streso lygio įvertinimas, matuojant elektrodu frontalinio raumens elektromiografinį aktyvumą. 10 studentų šio matavimo vidurkis buvo 30,2 μvolt, SD 2,5 μvolt. Koks pirmo kurso ekonomistų streso lygis (su 95% tikimybe)? Kurių – medikų ar ekonomistų streso lygis didesnis?
PI dviejų grupių palyginimui - aritmetiniam skirtumui (proporcijos)
2
22
1
11 )1()1(
n
pp
n
ppSEB
2
22
1
11 )1()1(
n
pp
n
ppSEB
SEB – bendra dviejų grupių standartinė paklaida
PI dviejų grupių palyginimui - aritmetiniam skirtumui (vidurkiai)
2
22
1
21
n
SD
n
SDSEB
SEB – bendra dviejų grupių standartinė paklaida
PI dviejų grupių palyginimui - aritmetiniam santykiui (RR, ŠS)
• Pvz.: DES (dietilsilbestrolis) ir krūties vėžys
• RR = 1,4 95% PI = 0,7 ; 2,6
• Su 95% tikimybe galima teigti, kad RR yra tarp 0,7 ir 2,6.
Kadangi PI yra nulinė reikšmė (RR=1,0), neatmetama tikimybė, kad skirtumo nėra, todėl rezultatas nėra statistiškai reikšmingas.