Upload
others
View
14
Download
1
Embed Size (px)
Citation preview
Planiranje
istraživanja
Prikupljanje
podataka
Obrada podataka
Tumačenje rezultata
Unos
podataka
STATISTIČAR
uzorak populacija
CILJ ISTRAŽIVANJA
Opisati
Objasniti
Predvidjeti
Oruđe:
STATISTIKA
Više ili visoko
obrazovanje
12%
Nezavršena
osnovna škola
19%
Osnovna škola
22%
Srednja škola
47%
UZORAK
Kakvo je stanje u populaciji?
Reprezentativan
Nereprezentativan
Nereprezentativan
UZORAK
Vrste uzoraka (načini uzimanja uzoraka)
Slučajni
Stratificirani
Sustavni
Prigodni
Svaki član populacije ima jednaku vjerojatnost biti odabran
(izvlačenje brojeva iz šešira, tablice slučajnih brojeva,
računalni programi...)
Uzima se svaki n-ti član populacije
Populacija se dijeli na “slojeve” pa se iz njih uzimaju
slučajni uzorci
Podatci se uzimaju od ispitanika koje imamo “pri ruci”
UZORAK
Veličina uzorka
Varijabilnost mjerene
pojave
Željena preciznost
mjerenja
Snaga istraživanja – vjerojatnost pronalaženja razlike koja zaista i postoji u populaciji
Pogrješke: alfa – pronašli smo statistički značajnu razliku, a razlike zapravo nema
beta – nismo pronašli razliku, a razlika zapravo postoji
OBLIKOVANJE SKUPINA
Uzorak
Kontrolna Eksperimentalna (1 ili više)
randomizacija
LJESTVICE MJERENJA
NOMINALNA
ORDINALNA
INTERVALNA
OMJERNA
broj stoji umjesto imena (npr. spol – muški=0, žene=1)
brojevi označavaju redoslijed, ali ne znamo KOLIKE su razlike
(npr. školske ocjene – 1, 2, 3, 4, 5)
imamo redoslijed i razlike ali brojčani odnosi ne označavaju
odnose u mjerenoj pojavi jer nema apsolutne nule
(npr. temperatura – 20ºC nije dvostruko toplije od 10ºC)
brojčani odnosi označavaju odnose u mjerenoj pojavi jer
postoji apsolutna nula
(npr. dužina – 20 cm je dvostruko duže od 10 cm)
LJESTVICE MJERENJA-dopušteni postupci
1. NOMINALNA
2. ORDINALNA
3. INTERVALNA
4. OMJERNA
Dominantna vrijednost, račun proporcija, χ2-test,
Cramerov Fi, koeficijent kontingencije C
Sve pod 1 + centralna vrijednost, koeficijent korelacije ρ (Ro),
Tau, Theta i koeficijent W
Sve pod 1 i 2 + aritmetička sredina, standardna devijacija,
z-vrijednosti i koeficijent korelacije r (uključujući parcijalnu i
multiplu korelaciju)
Sve pod 1, 2 i 3 + geometrijska sredina i koeficijent
varijabilnosti V
VJEŽBA
Zbroj bodova na ljestvici stavova prema znanosti
(najmanji mogući rezultat je 10, a najveći 50)
Dob
Brojevi na majicama nogometaša
Doza lijeka koji se daje pacijentu (izražena u mg)
Stupanj opeklina ordinalna
nominalna
intervalna
omjerna
omjerna
OBRADA PODATAKA:
Opis
Usporedba
Povezanost
Kakvi su stavovi studenata medicine
prema znanosti?
Postoje li razlike u stavovima prema
znanosti između studenata različitih godina?
Postoji li povezanost između stavova prema znanosti
prosjeka ocjena?
OPIS
Srednje vrijednosti i raspšenja
Raspodjela
Dominantna vrijednost (Mode)
-najčešći rezultatat-
Središnja vrijednost (Median)
-središnji rezultatat-
Aritmetička sredina (Mean)
-prosjek-
Raspon
Poluinterkvartilno raspršenje
Standardna devijacija
SREDIŠNJE VRIJEDNOSTI
I RASPRŠENJA
1+2+2+2+2+3+3+4+8
1+2+2+3+3+3+4+4+5
9 = 3
9 = 3
M=C
1 2 3 4 8
1 2 3 4 5
SREDNJE VRIJEDNOSTI
C=2 M=3
RASPODJELA PODATAKA
0
5
10
15
20
25
30
35
40
45
1 2 3 4 5
0
5
10
15
20
25
30
35
40
45
1 2 3 4 5
C=4 C=4
VRIJEDNOSTI KOJE SE JAKO RAZLIKUJU
105 110 115 120 125 130 135 140 145 150 155
sfenoidni kut [o]
151
Pažnja! Možda je
pogrješka, a
možda
neistražena
pojava!
NORMALNA RASPODJELA
Testiranje normaliteta raspodjele:
Kolmogorov-Smirnov test
parametri
DRUGE RASPODJELE
Asimetrična udesno
Asimetrična ulijevo
Stožasta
Spljoštena
Bimodalna
Aritmetička sredina i
standardna devijacija
Središnja/dominantna vrijednost
i interkvartilno raspršenje/totalni raspon
Parametrijska statistika
Neparametrijska statistika
ZBOG POGRJEŠKE MJERENJA DOBIVENI REZULTATI
UVIJEK SU SAMO PROCJENA STANJA U POPULACIJI
RASPON POUZDANOSTI (CONFIDENCE INTERVAL)
RASPON U KOJEM SE,
UZ ODREĐENU SIGURNOST (95%, 99%),
NALAZI “PRAVI” REZULTAT U POPULACIJI
Npr. M=20, 95%CI 18-24
C=76, 99%CI 69-85
IZBOR ODGOVARAJUĆEG STATISTIČKOG POSTUPKA
p<0.05 – 95% sigurnosti da dobivena
razlika/povezanost nije posljedica slučaja
p<0.01 – 99% sigurnosti da dobivena
razlika/povezanost nije posljedica slučaja
PRIKAZ p-vrijednosti – tri decimalna mjesta
Npr. p=0.024
p=0.007
p<0.001
ŠTO ZNAČI “STATISTIČKI ZNAČAJNO”?
PRIMJER
Rezultati randomiziranog kontroliranog pokusa
pokazuju da je novi lijek u pokusnoj skupini
prosječno smanjio dijastolički tlak
s 99 mmHg na 96 mmHg, p<0.001
Statistički značajno, ali ne i klinički!
Slušanje kolegija utječe na stvaranje pozitivnijih
stavova prema znanosti
Slušanje kolegija utječe na stvaranje pozitivnijih
stavova prema znanosti
POVEZANOST
Korelacija između stavova prema znanosti
i slušanja kolegija “Uvod u znanstveni rad u medicini”
iznosi ρ=0.84, p<0.001
Studenti koji su slušali kolegij vjerojatno
imaju pozitivnije stavove prema znanosti
NE ZNAČI I UZROČNOST
SAMO POKUSOM
MOŽEMO UTVRDITI
UZROČNOST!!!
ELEMENTARY CONCEPTS IN STATISTICS
http://www.statsoftinc.com/textbook/esc.html
BIOSTATISTICS INSTRUCTIONAL MANUAL
http://www.sjsu.edu/faculty/gerstman/StatPrimer/
POWER CALCULATION
http://calculators.stat.ucla.edu/powercalc/
ONLINE STATISTICS TEXTBOOK
http://www2.chass.ncsu.edu/garson/pa765/statnote.htm
i... RAZGOVARAJTE SA
STATISTIČARIMA, I
ONI SU LJUDI!
ODGOVORNO
TUMAČITE!
PAŽLJIVO
PLANIRAJTE!
SUSTAVNO
OBRAĐUJTE!
Procjena veličine uzorka
• “Koliki uzorak mi treba?”
– često pitanje
– važno pitanje
– odgovor nije sasvim jednostavan
• grafički način procjene veličine uzorka – Altmanov nomogram
Procjena veličine uzorka • potrebna 3 parametra
– (klinički) relevantna razlika
– razina značajnosti (0.05, 0.01)
– snaga
• na temelju razlike koju smatramo relevantnom možemo izračunati standardiziranu razliku koja ovisi o vrsti podataka (kontinuirani/kvantitativni ili kategorijski/kvalitativni)
– za kategorijske varijable:
SR=δ/√p(1-p) , pri čemu je: δ=p1-p2 (razlika u proporcijama)
p=(p1+p2)/2 (prosječna proporcija)
– za kontinuirane varijable:
SR=δ/σ0, pri čemu je: δ – klinički relevantna razlika
σ0 – očekivana standardna devijacija
Procjena veličine uzorka – primjer 1 kategorijske varijable
Ispitujemo novi antibiotik. Dosad korišteni lijek učinkovit je u 40% slučajeva, a novi, da bi se isplatio mora biti učinkovit u barem 60% slučajeva.
Koliko ispitanika trebamo da bismo, uz dvosmjernu značajnost od 0.05 i snagu od 80%, provjerili takvu razliku u učinkovitosti lijekova?
SR=(0.6-0.4)/0.5=04.
SR=δ/√p(1-p) , pri čemu je: δ=p1-p2 (razlika u proporcijama)
p=(p1+p2)/2 (prosječna proporcija)
Procjena veličine uzorka – primjer 1 kategorijske varijable
Koliki uzorak biste trebali
da je sve isto, samo uz
značajnost od 0.01?
Procjena veličine uzorka – primjer 2 kontinuirane varijable
Koliki uzorak je potreban da bi se, uz dvosmjernu značajnost od 0.05 i 80% snage, provjerila razlika u razini kolesterola od 1.0 mmol/l između aritmetičkih sredina dviju skupina ispitanika? Očekujemo podjednaku standardnu devijaciju u obje skupine od 3.0 mmol/l.
SR=1/3=0.333
SR=δ/σ0, pri čemu je: δ – klinički relevantna razlika
σ0 – očekivana standardna devijacija
Procjena veličine uzorka – primjer 2 kontinuirane varijable
150 po skupini
Procjena veličine uzorka – zaključno
• u procjenu veličine uzorka treba uključiti i očekivano
osipanje ispitanika
npr. dodati 20-30% za istraživanja koja će duže trajati
• zaokružite na cijeli broj
• veličina uzorka jest važna, ali ne znači ništa ako uzorak
nije dobro odabran