View
4
Download
0
Category
Preview:
Citation preview
Zaključivanje u istraživanju
Katedra za istraživanja u biomedicini i zdravstvu
Osim ispravo određene vrste podataka za ispravno zaključivanje u istraživanju važno je i :
1. Odrediti ovisne i neovisne varijable u istraživanju Ovisna varijabla ili varijabla ishoda (engl. outcome) –
ishod istraživanja koji nas zanima (% infekcija, % alergija, ukupni bodovi na skali koja
procjenjuje ponašanje) Neovisne varijable - varijable koje su neposredno ili
posredno povezane s varijablom ishoda Npr. ako je ishod % infekcija i gledamo utjecaj dojenja na
%infekcija: neposredno - je li dijete isključivo dojeno posredno - socioekonomski status majke
2. Postavljanje hipoteze
Sva istraživanja moraju započeti s jasno postavljenom hipotezom. Hipoteza je pozitivna tvrdnja koja mora biti kvantitativna (dojenje smanjuje učestalost infekcije uha) i specifična (u koga = dojenčadi do 3 mjeseca života hranjenih isključivo majčinim mlijekom).
Hipoteza i inferencijalna statistika Za dokazivanje ili odbacivanje hipoteze koristimo
statističke testove.
Statistički testovi dio su inferencijalne statistike.
Inferencijalnom statistikom poopćujemo rezultate naših istraživanja (npr. na naših 30 bolesnika) na cijelu populaciju (na sve bolesnike s tom dijagnozom)
Statistički testovi
1. Postavljanje statističke hipoteze 2. Provođenje testa i dobivanje vrijednosti test-
statistike iz koje izvodimo P-vrijednosti kao rezultata testa
3. Tumačenje P-vrijednosti
1. Ništična hipoteza = “ništa značajno nije nađeno” Aritmetička sredina porođajne težine beba čije su majke uzimale folnu
kiselinu tijekom trudnoće jednaka je aritmetičkoj sredini beba iz kontrolne skupine;
µ1=µ2 µ-oznaka za aritmetičku sredinu populacije
2. Alternativna hipoteza Aritmetička sredina porođajne težine beba čije su majke uzimale folnu kiselinu
tijekom trudnoće različita je aritmetičkoj sredini beba iz kontrolne skupine; hipoteza različita od nulte
µ1≠µ2 Kod dvostrane hipoteze ne zanima nas smjer razlike (veće ili
manje) već samo razlika
1. Postavljanje statističke hipoteze Primjer dvostrane hipoteze
1. Ništična hipoteza =“ništa značajno nije nađeno” Aritmetička sredina porođajne težine beba čije su majke uzimale folnu kiselinu
tijekom trudnoće manja je ili jednaka aritmetičkoj sredini beba iz kontrolne skupine
µ1≤µ2 µ-oznaka za aritmetičku sredinu populacije
2. Alternativna hipoteza Aritmetička sredina porođajne težine beba čije su majke uzimale folnu kiselinu
tijekom trudnoće veća je od aritmetičke sredine beba iz kontrolne skupine hipoteza različita od nulte
µ1 > µ2 Kod jednostrane hipoteze zanima nas smjer razlike tj. je li nešto
veće ili manje
1. Postavljanje statističke hipoteze Primjer jednostrane hipoteze
2. Provođenje testa i dobivanje P-vrijednosti kao rezultata testa
Izbor statističkog testa koji ćemo provesti ovisi o vrsti varijabli (podataka) koje testiramo
Rezultat testa: P vrijednost – broj od 0.0 do 1.0
1. Vrsta varijable (vrsta podatka) 2. Broj uzoraka 3. Uzorci ovisni/neovisni
Odabir testa
TIP PODATKA
Kvalitativni
1 neovisna varijabla 2 ili više neovisnih varijabli
Kvantitativni
Povezanost
Razlika
2 skupine
Više skupina
Neparametrijske
Parametrijske
2 ili više ovisnih varijabli
Goodness of fit x 2
Hi kvadrat (x 2)
1 prediktor
Više prediktora
Kontinuirana varijabla
Rangovi
Multipla regresija
Spearman r
Pearson r Regresija
neovisne
ovisne
t test
Mann-Whitney
t test za povezane uzorke Wilcoxon
neovisne
ovisne
One-way ANOVA Kruskal-Wallis
ANOVA za ponavljane uzorke
Friedman
McNemar test
Testiranje hipoteze
Djelovanje novoga lijeka za snižavanje krvnoga tlaka u ukriženom se pokusu uspoređuje s djelovanjem placeba
TIP PODATKA
Kvalitativni
1 neovisna varijabla 2 ili više neovisnih varijabli
Kvantitativni
Povezanost
Razlika
2 skupine
Više skupina
Neparametrijske
Parametrijske
2 ili više ovisnih varijabli
Goodness of fit x 2
Hi kvadrat (x 2)
1 prediktor
Više prediktora
Kontinuirana varijabla
Rangovi
Multipla regresija
Spearman r
Pearson r Regresija
neovisne
ovisne
t test
Mann-Whitney
t test za povezane uzorke Wilcoxon
neovisne
ovisne
One-way ANOVA Kruskal-Wallis
ANOVA za ponavljane uzorke
Friedman
McNemar test
Testiranje hipoteze
Postoji li veći rizik oboljenja od karcinoma dojke u žena koje rabe hormonsku kontracepciju u odnosu na one koje to ne čine?
TIP PODATKA
Kvalitativni
1 neovisna varijabla 2 ili više neovisnih varijabli
Kvantitativni
Povezanost
Razlika
2 skupine
Više skupina
Neparametrijske
Parametrijske
2 ili više ovisnih varijabli
Goodness of fit x 2
Hi kvadrat (x 2)
1 prediktor
Više prediktora
Kontinuirana varijabla
Rangovi
Multipla regresija
Spearman r
Pearson r Regresija
neovisne
ovisne
t test
Mann-Whitney
t test za povezane uzorke Wilcoxon
neovisne
ovisne
One-way ANOVA Kruskal-Wallis
ANOVA za ponavljane uzorke
Friedman
McNemar test
Testiranje hipoteze
Razlikuju li se proporcije pušača u Francuskoj, Velikoj Britaniji i Njemačkoj?
TIP PODATKA
Kvalitativni
1 neovisna varijabla 2 ili više neovisnih varijabli
Kvantitativni
Povezanost
Razlika
2 skupine
Više skupina
Neparametrijske
Parametrijske
2 ili više ovisnih varijabli
Goodness of fit x 2
Hi kvadrat (x 2)
1 prediktor
Više prediktora
Kontinuirana varijabla
Rangovi
Multipla regresija
Spearman r
Pearson r Regresija
neovisne
ovisne
t test
Mann-Whitney
t test za povezane uzorke Wilcoxon
neovisne
ovisne
One-way ANOVA Kruskal-Wallis
ANOVA za ponavljane uzorke
Friedman
McNemar test
Testiranje hipoteze
Je li prosječna vrijednost indeksa tjelesne mase (BMI) petnaestogodišnjaka u Škotskoj veća od istoga indeksa petnaestogodišnjaka u Engleskoj?
TIP PODATKA
Kvalitativni
1 neovisna varijabla 2 ili više neovisnih varijabli
Kvantitativni
Povezanost
Razlika
2 skupine
Više skupina
Neparametrijske
Parametrijske
2 ili više ovisnih varijabli
Goodness of fit x 2
Hi kvadrat (x 2)
1 prediktor
Više prediktora
Kontinuirana varijabla
Rangovi
Multipla regresija
Spearman r
Pearson r Regresija
neovisne
ovisne
t test
Mann-Whitney
t test za povezane uzorke Wilcoxon
neovisne
ovisne
One-way ANOVA Kruskal-Wallis
ANOVA za ponavljane uzorke
Friedman
McNemar test
Testiranje hipoteze
Usporedba djelovanja triju različitih lijekova u bolesnika s hiperkolesterolemijom, pri čemu su skupine ispitanika razdijeljene u podskupine s prosječnom razinom kolesterola.
3. Tumačenje P-vrijednosti
P-vrijednost je vjerojatnost da su uočene razlike između skupina slučajne (beznačajne) P=0.1=10% vjerojatnosti (1 događaj u 10) P=0.99=99% (99 događaja u 100) P=0.001=0.1% (1 događaj u 1000)
Tumačenje P-vrijednosti (0.05)
P>=0.05
Razlike između skupina nisu slučajne - značajne su tj. postoji učinak Ništična hipoteza se odbacuje
P<0.05 tj. 5%
Razlike između skupina su slučajne (beznačajne) Ništična hipoteza se prihvaća
Greške pri zaključivanju
Greške tipa 1 (lažni pozitivi) Ništična hipoteza je
pogrešno odbačena (iako stvarna razlika ne postoji).
Npr. puštanje neučinkovitog lijeka na tržište Statistički je utvrđeno da je
lijek A učinkovitiji od placeba iako u stvarnosti između njih nema razlike!
Greške tipa 2 (lažni negativi) Ništična hipoteza je
pogrešno prihvaćena (iako stvarna razlika postoji)
Npr. skrivanje učinkovitog lijeka od bolesnika
Statistički je utvrđeno da
lijek A nije učinkovitiji od placeba iako je u stvarnosti lijek A značajno učinkovitiji!
Snaga testa
Statistička snaga testa je vjerojatnost da će istraživač u uzorku naći statističku značajnost, ako učinak postoji u cjelokupnoj populaciji.
Uobičajeno je da je snaga 0.8=80% u 100 ponovljenih eksperimenata značajna razlika
naći će se u 80 eksperimenata
Statistička vs klinička značajnost
U usporedbi s isključivo dojenom djecom, utvrđen je statistički značajan porast mase dojenčeta u skupini koja je hranjena na bočicu: porast 3g (P<0.000001).
Je li 3 g klinički značajno!!
α, β i δ
što je α (greška tipa I)? Vjerojatnost pogrešnoga odbacivanja ništične
hipoteze (… pouzdanost da ćemo isključiti slučajne razlike
kao značajne…) Posljedica: Puštanje neefikasnoga lijeka na tržište!)
Što je β (greška Tipa II)? Vjerojatnost da se ne odbaci ništična hipoteza
kada učinak (klinički značajna razlika) ipak postoji
(…pouzdanost detekcije stvarno značajnih razlika…)
Efikasan lijek se ne pušta na tržište – “skriva se
od pacijenata”!
Što je snaga ? Snaga kvantificira “sposobnost” studije da
utvrdi postojeći učinak tj. razliku u razdiobi varijabli/e.
Snaga = 1- β=P (prihvati H1|H1 je istinita) Vjerojatnost da će se H1 hipoteza točno prihvatiti točno identificira bolji lijek
Što je δ?
δ je minimalna razlika između skupina za koju je procijenjeno da je klinički važna. (Minimalna stvarno značajna razlika) Minimalni efekt koji ima kliničku važnost u radu s
pacijentima. Očekivani efekt novoga tretmana.
ODABIR RAZINE ZNAČAJNOSTI
Pitanje štetnih posljedica pogreške: 1. Odluka/zaključak da učinak postoji onda kada ga u
stvarnosti nema može prouzročiti iznimno štetne posljedice => smanjiti vjerojatnost nastajanja pogreške tipa 1, tj. odabrati
manji α
ODABIR RAZINE ZNAČAJNOSTI
2. Odluka/zaključak da nema razlike onda kada u stvarnosti razlika postoji može prouzročiti iznimno štetne posljedice => smanjiti vjerojatnost pogreške tipa 2, tj. odabrati veći α
Zadatak
Ispitivanja lijeka X pokazala su da njegovo korištenje izaziva vrlo štetne posljedice te je lijek X povučen iz uporabe. Ispitan je novi alternativni lijek Y i ustanovljeno je smanjenje štetnog utjecaja u odnosu na lijek X. Koju razinu značajnosti treba upotrijebiti za ocjenu značajnosti smanjenja štetnog utjecaja lijeka Y u odnosu na lijek X?
Zadatak
Na slučajnom uzorku vozača ispitivan je utjecaj alkohola na vrijeme reagiranja. Mjerenja vremena reakcije prije i nakon konzumacije određene količine alkohola pokazala su prosječno povećanje vremena reakcije nakon konzumacije alkohola. Koju razinu značajnosti treba upotrijebiti za
ocjenu značajnosti pronađene razlike?
IZBOR α I β α<β (najčešći pristup 0.05 i 0.20) ako se kontrolna terapija
relativno široko primjenjuje i razumski je sigurna i efektivna, dok je testna terapija nova i skupa te dovodi do ozbiljnijih nuspojava.
α>β ako nije provedena kontrolna terapija, a testna terapija je relativno jeftina, jednostavna za aplikaciju i ne postoje ozbiljnije nuspojave.
Statistička hipoteza – Test
Što ako zaboravim sve o P vrijednostima?
95% CI za aritmetičku sredinu
95% CI za aritmetičku sredinu
0.4
0.5
0.6
0.7
0.8
0.9
meso Fe i Zn žitarice Fe cjelovite žitarice
Apso
rbira
ni c
ink
[mg/
danu
]
Dohrana
95% CI za aritm. sredinu
?
95% CI razlike aritm sredina između skupina
Izvor: American College of Physicians – American Society of Internal Medicine: Effective Clinical Practice
Izračunaj: 1. Glavni učinak (razlika u ishodu!) 2. Varijabilnost glavnog učinka
Postavi ništičnu hipotezu (glavni učinak je 0) Izračunaj
95% CI oko glavnog učinka
Izračunaj test statistiku da odrediš P-vrijednost
Skupina A Skupina B
95% CI razlike između skupina
0
Ako 95% CI uključuje 0 tj. nepostojanje razlike između skupina, tada je P>0.05
Nema razlike između skupina
Ako 95% CI NE uključuje 0 tj. ima razlike između skupina tada je P<0.05
Slika. Odnos između P vrijednosti i 95% CI
TESTIRANJA HIPOTEZE U MEDICINI– Što testiramo?
Učinci ili razlike koje su nam interesantne: Razlike u aritmetičkoj sredini ili proporcijama Omjer izgleda (OR) – povezanost dvaju varijabli Relativni Rizik (RR) – povezanost dvaju varijabli Korelacijski koeficijent – povezanost dvaju varijabli
TESTIRANJA HIPOTEZE U MEDICINI– Što testiramo?
Učinci ili razlike koje su nam interesantne: Razlike u aritmetičkoj sredini ili proporcijama Omjer izgleda (OR) – povezanost dvaju varijabli Relativni Rizik (RR) – povezanost dvaju varijabli Korelacijski koeficijent – povezanost dvaju varijabli
Povezanost varijabli
Kvantitativne koeficijent korelacije
Kategoričke χ2 test, McNemar test omjer izgleda, relativni rizik
Povezanost varijabli
Linearnost i smjer su dva koncepta koja nas interesiraju
Povezanost kvantitativnih varijabli Tumačenje podataka s točkastog grafikona
Pozitivna linearna ovisnost Negativna linearna ovisnost
Slaba ili ne-linearna ovisnost Nema ovisnosti
Povezanost kvantitativnih varijabli Koeficijent korelacije
Koeficijent korelacije je mjera smjera i jakosti povezanosti!
Citat iz rada: Squamous cell carcinoma tumor and perilesional display distinctly different scatter plots from normal tissue. Expresion levels for gene subset 1 in patient 1
Primjer za povezanost kvantitativnih varijabli
http://onlinestatbook.com/stat_sim/reg_by_eye/index.html
Simulacija
OBJECTIVE: To evaluate the efficacy and relative costs of different screening methods for the identification of alcohol use disorders in an opportunistic screening programme in primary care in the United Kingdom.
DESIGN: Comparative study. SETTING: Six general practices in south Wales. PARTICIPANTS: 194 male primary care attendees aged 18 or over who completed an alcohol use
disorders identification test (AUDIT) questionnaire. MAIN OUTCOME MEASURES: Scores on alcohol use disorders identification test and measures of
gamma-glutamyltransferase, aspartate aminotransferase, per cent carbohydrate deficient transferrin, and erythrocyte mean cell volume. Hazardous alcohol consumption, weekly binge consumption, and monthly binge consumption were ascertained using the time line follow back method over the previous 180 days. Alcohol dependence was determined using the Diagnostic and Statistical Manual of Mental Disorders, fourth edition. Unit costs were established from published resource references and from actual costs of analysing the biochemical tests.
Opportunistic screening for alcohol use disorders in primary care: comparative study.
RESULTS: A significant correlation was observed between alcohol consumption and score on the alcohol use disorders identification test (Pearson's correlation coefficient r = 0.74) and measures of gamma-glutamyltransferase (r = 0.20) and per cent carbohydrate deficient transferrin (r = 0.36) but not aspartate aminotransferase (r = 0.08) or erythrocyte mean cell volume (r = 0.02). The alcohol use disorders identification test exhibited significantly higher sensitivity, specificity, and positive predictive value than all of the biochemical markers for hazardous consumption (69%, 98%, and 95%), weekly binge consumption (75%, 90%, and 71%), monthly binge consumption (66%, 97%, and 91%), and alcohol dependence (84%, 83%, and 41%). The questionnaire was also more cost efficient, with a lower cost per true positive for all consumption outcomes.
CONCLUSION: The alcohol use disorders identification test questionnaire is an efficient and cost efficient
diagnostic tool for routine screening for alcohol use disorders in primary care.
Opportunistic screening for alcohol use disorders in primary care: comparative study.
Koeficijent korelacije: 1. utvrđivanje povezanosti (npr. P=0,001) 2. koliko je jaka povezanost (r=0,98 ili r=0,02)
Povezanost kvantitativnih varijabli Koeficijent korelacije – statist. značajnost
Za usporedbu 2 kategorijske varijable
Ako prva varijabla ima r kategorija, druga varijabla c kategorija, tada izrađujemo tablicu frekvencija r×c (cross table).
Povezanost kategorijskih varijabli – Tablice frekvencija
Povezanost kategorijskih varijabli
Bolest X YES NO TOTAL
YPEL
5 G
enot
ip
AA 2 0 2 AB 1 3 4 BB 0 4 4 TOTAL 3 7 10 0
1
2
3
4
AA AB BBBr
oj is
pita
nika
Bolesni
Zdravi
Povezanost genotipa YPEL5 s bolešću X
Analiza učestalosti različitih genotipova u bolesnih i zdravih pokazala je da je bolest X povezana s genotipom. Postotak bolesnih osoba s genotipom AA iznosio je 100%, dok je zdravih osoba s genotipom GG također bilo 100%
χ2 = 6,0; P = 0,05 http://onlinestatbook.com/stat_sim/chisq_theor/index.html
Povezanost kategorijskih varijabli, χ2 test
ᵪ2 test odgovara na pitanje "Ima li povezanosti?"
Odgovor na pitanje “Koliko je jaka povezanost?” daju nam mjere za snagu povezanosti kao što je npr. relativni rizik, atributivni rizik, omjer izgleda,
Povezanost kategorijskih varijabli, Mjere povezanosti
Povezanost kategorijskih varijabli Relativni rizik, Atributivni rizik, Omjer izgleda, …
Recommended