Zaključivanje u istraživanjuneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan8...1. Odrediti...

Preview:

Citation preview

Zaključivanje u istraživanju

Katedra za istraživanja u biomedicini i zdravstvu

Osim ispravo određene vrste podataka za ispravno zaključivanje u istraživanju važno je i :

1. Odrediti ovisne i neovisne varijable u istraživanju Ovisna varijabla ili varijabla ishoda (engl. outcome) –

ishod istraživanja koji nas zanima (% infekcija, % alergija, ukupni bodovi na skali koja

procjenjuje ponašanje) Neovisne varijable - varijable koje su neposredno ili

posredno povezane s varijablom ishoda Npr. ako je ishod % infekcija i gledamo utjecaj dojenja na

%infekcija: neposredno - je li dijete isključivo dojeno posredno - socioekonomski status majke

2. Postavljanje hipoteze

Sva istraživanja moraju započeti s jasno postavljenom hipotezom. Hipoteza je pozitivna tvrdnja koja mora biti kvantitativna (dojenje smanjuje učestalost infekcije uha) i specifična (u koga = dojenčadi do 3 mjeseca života hranjenih isključivo majčinim mlijekom).

Hipoteza i inferencijalna statistika Za dokazivanje ili odbacivanje hipoteze koristimo

statističke testove.

Statistički testovi dio su inferencijalne statistike.

Inferencijalnom statistikom poopćujemo rezultate naših istraživanja (npr. na naših 30 bolesnika) na cijelu populaciju (na sve bolesnike s tom dijagnozom)

Statistički testovi

1. Postavljanje statističke hipoteze 2. Provođenje testa i dobivanje vrijednosti test-

statistike iz koje izvodimo P-vrijednosti kao rezultata testa

3. Tumačenje P-vrijednosti

1. Ništična hipoteza = “ništa značajno nije nađeno” Aritmetička sredina porođajne težine beba čije su majke uzimale folnu

kiselinu tijekom trudnoće jednaka je aritmetičkoj sredini beba iz kontrolne skupine;

µ1=µ2 µ-oznaka za aritmetičku sredinu populacije

2. Alternativna hipoteza Aritmetička sredina porođajne težine beba čije su majke uzimale folnu kiselinu

tijekom trudnoće različita je aritmetičkoj sredini beba iz kontrolne skupine; hipoteza različita od nulte

µ1≠µ2 Kod dvostrane hipoteze ne zanima nas smjer razlike (veće ili

manje) već samo razlika

1. Postavljanje statističke hipoteze Primjer dvostrane hipoteze

1. Ništična hipoteza =“ništa značajno nije nađeno” Aritmetička sredina porođajne težine beba čije su majke uzimale folnu kiselinu

tijekom trudnoće manja je ili jednaka aritmetičkoj sredini beba iz kontrolne skupine

µ1≤µ2 µ-oznaka za aritmetičku sredinu populacije

2. Alternativna hipoteza Aritmetička sredina porođajne težine beba čije su majke uzimale folnu kiselinu

tijekom trudnoće veća je od aritmetičke sredine beba iz kontrolne skupine hipoteza različita od nulte

µ1 > µ2 Kod jednostrane hipoteze zanima nas smjer razlike tj. je li nešto

veće ili manje

1. Postavljanje statističke hipoteze Primjer jednostrane hipoteze

2. Provođenje testa i dobivanje P-vrijednosti kao rezultata testa

Izbor statističkog testa koji ćemo provesti ovisi o vrsti varijabli (podataka) koje testiramo

Rezultat testa: P vrijednost – broj od 0.0 do 1.0

1. Vrsta varijable (vrsta podatka) 2. Broj uzoraka 3. Uzorci ovisni/neovisni

Odabir testa

TIP PODATKA

Kvalitativni

1 neovisna varijabla 2 ili više neovisnih varijabli

Kvantitativni

Povezanost

Razlika

2 skupine

Više skupina

Neparametrijske

Parametrijske

2 ili više ovisnih varijabli

Goodness of fit x 2

Hi kvadrat (x 2)

1 prediktor

Više prediktora

Kontinuirana varijabla

Rangovi

Multipla regresija

Spearman r

Pearson r Regresija

neovisne

ovisne

t test

Mann-Whitney

t test za povezane uzorke Wilcoxon

neovisne

ovisne

One-way ANOVA Kruskal-Wallis

ANOVA za ponavljane uzorke

Friedman

McNemar test

Testiranje hipoteze

Djelovanje novoga lijeka za snižavanje krvnoga tlaka u ukriženom se pokusu uspoređuje s djelovanjem placeba

TIP PODATKA

Kvalitativni

1 neovisna varijabla 2 ili više neovisnih varijabli

Kvantitativni

Povezanost

Razlika

2 skupine

Više skupina

Neparametrijske

Parametrijske

2 ili više ovisnih varijabli

Goodness of fit x 2

Hi kvadrat (x 2)

1 prediktor

Više prediktora

Kontinuirana varijabla

Rangovi

Multipla regresija

Spearman r

Pearson r Regresija

neovisne

ovisne

t test

Mann-Whitney

t test za povezane uzorke Wilcoxon

neovisne

ovisne

One-way ANOVA Kruskal-Wallis

ANOVA za ponavljane uzorke

Friedman

McNemar test

Testiranje hipoteze

Postoji li veći rizik oboljenja od karcinoma dojke u žena koje rabe hormonsku kontracepciju u odnosu na one koje to ne čine?

TIP PODATKA

Kvalitativni

1 neovisna varijabla 2 ili više neovisnih varijabli

Kvantitativni

Povezanost

Razlika

2 skupine

Više skupina

Neparametrijske

Parametrijske

2 ili više ovisnih varijabli

Goodness of fit x 2

Hi kvadrat (x 2)

1 prediktor

Više prediktora

Kontinuirana varijabla

Rangovi

Multipla regresija

Spearman r

Pearson r Regresija

neovisne

ovisne

t test

Mann-Whitney

t test za povezane uzorke Wilcoxon

neovisne

ovisne

One-way ANOVA Kruskal-Wallis

ANOVA za ponavljane uzorke

Friedman

McNemar test

Testiranje hipoteze

Razlikuju li se proporcije pušača u Francuskoj, Velikoj Britaniji i Njemačkoj?

TIP PODATKA

Kvalitativni

1 neovisna varijabla 2 ili više neovisnih varijabli

Kvantitativni

Povezanost

Razlika

2 skupine

Više skupina

Neparametrijske

Parametrijske

2 ili više ovisnih varijabli

Goodness of fit x 2

Hi kvadrat (x 2)

1 prediktor

Više prediktora

Kontinuirana varijabla

Rangovi

Multipla regresija

Spearman r

Pearson r Regresija

neovisne

ovisne

t test

Mann-Whitney

t test za povezane uzorke Wilcoxon

neovisne

ovisne

One-way ANOVA Kruskal-Wallis

ANOVA za ponavljane uzorke

Friedman

McNemar test

Testiranje hipoteze

Je li prosječna vrijednost indeksa tjelesne mase (BMI) petnaestogodišnjaka u Škotskoj veća od istoga indeksa petnaestogodišnjaka u Engleskoj?

TIP PODATKA

Kvalitativni

1 neovisna varijabla 2 ili više neovisnih varijabli

Kvantitativni

Povezanost

Razlika

2 skupine

Više skupina

Neparametrijske

Parametrijske

2 ili više ovisnih varijabli

Goodness of fit x 2

Hi kvadrat (x 2)

1 prediktor

Više prediktora

Kontinuirana varijabla

Rangovi

Multipla regresija

Spearman r

Pearson r Regresija

neovisne

ovisne

t test

Mann-Whitney

t test za povezane uzorke Wilcoxon

neovisne

ovisne

One-way ANOVA Kruskal-Wallis

ANOVA za ponavljane uzorke

Friedman

McNemar test

Testiranje hipoteze

Usporedba djelovanja triju različitih lijekova u bolesnika s hiperkolesterolemijom, pri čemu su skupine ispitanika razdijeljene u podskupine s prosječnom razinom kolesterola.

3. Tumačenje P-vrijednosti

P-vrijednost je vjerojatnost da su uočene razlike između skupina slučajne (beznačajne) P=0.1=10% vjerojatnosti (1 događaj u 10) P=0.99=99% (99 događaja u 100) P=0.001=0.1% (1 događaj u 1000)

Tumačenje P-vrijednosti (0.05)

P>=0.05

Razlike između skupina nisu slučajne - značajne su tj. postoji učinak Ništična hipoteza se odbacuje

P<0.05 tj. 5%

Razlike između skupina su slučajne (beznačajne) Ništična hipoteza se prihvaća

Greške pri zaključivanju

Greške tipa 1 (lažni pozitivi) Ništična hipoteza je

pogrešno odbačena (iako stvarna razlika ne postoji).

Npr. puštanje neučinkovitog lijeka na tržište Statistički je utvrđeno da je

lijek A učinkovitiji od placeba iako u stvarnosti između njih nema razlike!

Greške tipa 2 (lažni negativi) Ništična hipoteza je

pogrešno prihvaćena (iako stvarna razlika postoji)

Npr. skrivanje učinkovitog lijeka od bolesnika

Statistički je utvrđeno da

lijek A nije učinkovitiji od placeba iako je u stvarnosti lijek A značajno učinkovitiji!

Snaga testa

Statistička snaga testa je vjerojatnost da će istraživač u uzorku naći statističku značajnost, ako učinak postoji u cjelokupnoj populaciji.

Uobičajeno je da je snaga 0.8=80% u 100 ponovljenih eksperimenata značajna razlika

naći će se u 80 eksperimenata

Statistička vs klinička značajnost

U usporedbi s isključivo dojenom djecom, utvrđen je statistički značajan porast mase dojenčeta u skupini koja je hranjena na bočicu: porast 3g (P<0.000001).

Je li 3 g klinički značajno!!

α, β i δ

što je α (greška tipa I)? Vjerojatnost pogrešnoga odbacivanja ništične

hipoteze (… pouzdanost da ćemo isključiti slučajne razlike

kao značajne…) Posljedica: Puštanje neefikasnoga lijeka na tržište!)

Što je β (greška Tipa II)? Vjerojatnost da se ne odbaci ništična hipoteza

kada učinak (klinički značajna razlika) ipak postoji

(…pouzdanost detekcije stvarno značajnih razlika…)

Efikasan lijek se ne pušta na tržište – “skriva se

od pacijenata”!

Što je snaga ? Snaga kvantificira “sposobnost” studije da

utvrdi postojeći učinak tj. razliku u razdiobi varijabli/e.

Snaga = 1- β=P (prihvati H1|H1 je istinita) Vjerojatnost da će se H1 hipoteza točno prihvatiti točno identificira bolji lijek

Što je δ?

δ je minimalna razlika između skupina za koju je procijenjeno da je klinički važna. (Minimalna stvarno značajna razlika) Minimalni efekt koji ima kliničku važnost u radu s

pacijentima. Očekivani efekt novoga tretmana.

ODABIR RAZINE ZNAČAJNOSTI

Pitanje štetnih posljedica pogreške: 1. Odluka/zaključak da učinak postoji onda kada ga u

stvarnosti nema može prouzročiti iznimno štetne posljedice => smanjiti vjerojatnost nastajanja pogreške tipa 1, tj. odabrati

manji α

ODABIR RAZINE ZNAČAJNOSTI

2. Odluka/zaključak da nema razlike onda kada u stvarnosti razlika postoji može prouzročiti iznimno štetne posljedice => smanjiti vjerojatnost pogreške tipa 2, tj. odabrati veći α

Zadatak

Ispitivanja lijeka X pokazala su da njegovo korištenje izaziva vrlo štetne posljedice te je lijek X povučen iz uporabe. Ispitan je novi alternativni lijek Y i ustanovljeno je smanjenje štetnog utjecaja u odnosu na lijek X. Koju razinu značajnosti treba upotrijebiti za ocjenu značajnosti smanjenja štetnog utjecaja lijeka Y u odnosu na lijek X?

Zadatak

Na slučajnom uzorku vozača ispitivan je utjecaj alkohola na vrijeme reagiranja. Mjerenja vremena reakcije prije i nakon konzumacije određene količine alkohola pokazala su prosječno povećanje vremena reakcije nakon konzumacije alkohola. Koju razinu značajnosti treba upotrijebiti za

ocjenu značajnosti pronađene razlike?

IZBOR α I β α<β (najčešći pristup 0.05 i 0.20) ako se kontrolna terapija

relativno široko primjenjuje i razumski je sigurna i efektivna, dok je testna terapija nova i skupa te dovodi do ozbiljnijih nuspojava.

α>β ako nije provedena kontrolna terapija, a testna terapija je relativno jeftina, jednostavna za aplikaciju i ne postoje ozbiljnije nuspojave.

Statistička hipoteza – Test

Što ako zaboravim sve o P vrijednostima?

95% CI za aritmetičku sredinu

95% CI za aritmetičku sredinu

0.4

0.5

0.6

0.7

0.8

0.9

meso Fe i Zn žitarice Fe cjelovite žitarice

Apso

rbira

ni c

ink

[mg/

danu

]

Dohrana

95% CI za aritm. sredinu

?

95% CI razlike aritm sredina između skupina

Izvor: American College of Physicians – American Society of Internal Medicine: Effective Clinical Practice

Izračunaj: 1. Glavni učinak (razlika u ishodu!) 2. Varijabilnost glavnog učinka

Postavi ništičnu hipotezu (glavni učinak je 0) Izračunaj

95% CI oko glavnog učinka

Izračunaj test statistiku da odrediš P-vrijednost

Skupina A Skupina B

95% CI razlike između skupina

0

Ako 95% CI uključuje 0 tj. nepostojanje razlike između skupina, tada je P>0.05

Nema razlike između skupina

Ako 95% CI NE uključuje 0 tj. ima razlike između skupina tada je P<0.05

Slika. Odnos između P vrijednosti i 95% CI

TESTIRANJA HIPOTEZE U MEDICINI– Što testiramo?

Učinci ili razlike koje su nam interesantne: Razlike u aritmetičkoj sredini ili proporcijama Omjer izgleda (OR) – povezanost dvaju varijabli Relativni Rizik (RR) – povezanost dvaju varijabli Korelacijski koeficijent – povezanost dvaju varijabli

TESTIRANJA HIPOTEZE U MEDICINI– Što testiramo?

Učinci ili razlike koje su nam interesantne: Razlike u aritmetičkoj sredini ili proporcijama Omjer izgleda (OR) – povezanost dvaju varijabli Relativni Rizik (RR) – povezanost dvaju varijabli Korelacijski koeficijent – povezanost dvaju varijabli

Povezanost varijabli

Kvantitativne koeficijent korelacije

Kategoričke χ2 test, McNemar test omjer izgleda, relativni rizik

Povezanost varijabli

Linearnost i smjer su dva koncepta koja nas interesiraju

Povezanost kvantitativnih varijabli Tumačenje podataka s točkastog grafikona

Pozitivna linearna ovisnost Negativna linearna ovisnost

Slaba ili ne-linearna ovisnost Nema ovisnosti

Povezanost kvantitativnih varijabli Koeficijent korelacije

Koeficijent korelacije je mjera smjera i jakosti povezanosti!

Citat iz rada: Squamous cell carcinoma tumor and perilesional display distinctly different scatter plots from normal tissue. Expresion levels for gene subset 1 in patient 1

Primjer za povezanost kvantitativnih varijabli

http://onlinestatbook.com/stat_sim/reg_by_eye/index.html

Simulacija

OBJECTIVE: To evaluate the efficacy and relative costs of different screening methods for the identification of alcohol use disorders in an opportunistic screening programme in primary care in the United Kingdom.

DESIGN: Comparative study. SETTING: Six general practices in south Wales. PARTICIPANTS: 194 male primary care attendees aged 18 or over who completed an alcohol use

disorders identification test (AUDIT) questionnaire. MAIN OUTCOME MEASURES: Scores on alcohol use disorders identification test and measures of

gamma-glutamyltransferase, aspartate aminotransferase, per cent carbohydrate deficient transferrin, and erythrocyte mean cell volume. Hazardous alcohol consumption, weekly binge consumption, and monthly binge consumption were ascertained using the time line follow back method over the previous 180 days. Alcohol dependence was determined using the Diagnostic and Statistical Manual of Mental Disorders, fourth edition. Unit costs were established from published resource references and from actual costs of analysing the biochemical tests.

Opportunistic screening for alcohol use disorders in primary care: comparative study.

RESULTS: A significant correlation was observed between alcohol consumption and score on the alcohol use disorders identification test (Pearson's correlation coefficient r = 0.74) and measures of gamma-glutamyltransferase (r = 0.20) and per cent carbohydrate deficient transferrin (r = 0.36) but not aspartate aminotransferase (r = 0.08) or erythrocyte mean cell volume (r = 0.02). The alcohol use disorders identification test exhibited significantly higher sensitivity, specificity, and positive predictive value than all of the biochemical markers for hazardous consumption (69%, 98%, and 95%), weekly binge consumption (75%, 90%, and 71%), monthly binge consumption (66%, 97%, and 91%), and alcohol dependence (84%, 83%, and 41%). The questionnaire was also more cost efficient, with a lower cost per true positive for all consumption outcomes.

CONCLUSION: The alcohol use disorders identification test questionnaire is an efficient and cost efficient

diagnostic tool for routine screening for alcohol use disorders in primary care.

Opportunistic screening for alcohol use disorders in primary care: comparative study.

Koeficijent korelacije: 1. utvrđivanje povezanosti (npr. P=0,001) 2. koliko je jaka povezanost (r=0,98 ili r=0,02)

Povezanost kvantitativnih varijabli Koeficijent korelacije – statist. značajnost

Za usporedbu 2 kategorijske varijable

Ako prva varijabla ima r kategorija, druga varijabla c kategorija, tada izrađujemo tablicu frekvencija r×c (cross table).

Povezanost kategorijskih varijabli – Tablice frekvencija

Povezanost kategorijskih varijabli

Bolest X YES NO TOTAL

YPEL

5 G

enot

ip

AA 2 0 2 AB 1 3 4 BB 0 4 4 TOTAL 3 7 10 0

1

2

3

4

AA AB BBBr

oj is

pita

nika

Bolesni

Zdravi

Povezanost genotipa YPEL5 s bolešću X

Analiza učestalosti različitih genotipova u bolesnih i zdravih pokazala je da je bolest X povezana s genotipom. Postotak bolesnih osoba s genotipom AA iznosio je 100%, dok je zdravih osoba s genotipom GG također bilo 100%

χ2 = 6,0; P = 0,05 http://onlinestatbook.com/stat_sim/chisq_theor/index.html

Povezanost kategorijskih varijabli, χ2 test

ᵪ2 test odgovara na pitanje "Ima li povezanosti?"

Odgovor na pitanje “Koliko je jaka povezanost?” daju nam mjere za snagu povezanosti kao što je npr. relativni rizik, atributivni rizik, omjer izgleda,

Povezanost kategorijskih varijabli, Mjere povezanosti

Povezanost kategorijskih varijabli Relativni rizik, Atributivni rizik, Omjer izgleda, …

Recommended