54
Analiza podataka o preživljavanju (vremena do nastajanja izabranog događaja - ishoda) Jelena Marinković Institut za medicinsku statistiku i informatiku Februar, 2012.g.

Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

  • Upload
    vuthu

  • View
    238

  • Download
    3

Embed Size (px)

Citation preview

Page 1: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Analiza podataka opreživljavanju (vremena donastajanja izabranog događaja- ishoda)

Jelena Marinković

Institut za medicinsku statistiku i informatikuFebruar, 2012.g.

Page 2: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Pregled

Šta je analiza preživljavanja? Terminologija i struktura podataka. Funkcije gustine verovatnoća,

preživljavanja i hazarda. Statističke metode analize

preživljavanja. Kaplan-Meierov metod i log-rank test.

Page 3: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Primer analize preživljavanja,1669.

Christiaan Huygens je 1669. godineovom funkcijom izračunao koliko ćeosoba na svakih 100 osoba doživeti86 godina.Izvor: Howard Wainer STATISTICAL GRAPHICS: Mapping thePathways of Science. Annual Review of Psychology. Vol. 52: 305-335

Page 4: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Primer analize preživljavanja,1669 (2)

Kog oblika je ovafunkcija?

Kolika je bila šansaosobe da preživi višeod 20 godina? Više od36? Ovo je analiza preživljavanja!

Pokušavamo da procenimofunkciju—samo što ishodmože biti bilo koji binarnidogađaj, a ne samo smrt.

Page 5: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Analiza preživljavanja - koreni

Edmund Halley , 17-ti vek Aktuarska analiza, tablice

preživljavanja, analiza tablicapreživljavanja

Mortalitetne tablice i očekivano trajanježivota

Page 6: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Šta je analiza preživljavanja?

Statističke metode za analizu longitudinalnihpodataka o pojavljivanju događaja odinteresa.

Događaji uključuju: smrti, povrede,razboljevanje, oporavak, tranziciju kavrednostima ispod ili iznad zadatog pragavažnih kontinuiranih varijabli (npr. broj CD4).

Adekvatna za analizu podataka izrandomizovanih kliničkih ogleda ili kohorti.

Page 7: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Randomizovani klinički ogled (RKO)

Ciljanapopulacija

Intervencija

Kontrole

Bolest

Bez bolesti

Bolest

Bez bolesti

VREME

Randomizacija

Bez bolesti,kohortaispitanika podrizikom

Page 8: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Ciljanapopulacija

Tretman

Kontrole

Izlečeni

Neizlečeni

Izlečeni

Neizlečeni

VREME

Randomizacija

Populacijapacijenata

Randomizovani klinički ogled (RKO)

Page 9: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Ciljanapopulacija

Tretman

Kontrole

Mrtav

Živ

Mrtav

Živ

VREME

Randomizacija

Populacijapacijenata

Randomizovani klinički ogled (RKO)

Page 10: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Kohortna studija(prospektivna/retrospektivna)

Ciljanapopulacija

Ekspozicija

Bezekspozicije

Bolest

Bez bolesti

Bolest

Bez bolesti

VREME

Kohortaisptanika bezbolesti

Page 11: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Primeri analize preživljavanjau medicini

Page 12: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

RKO: Women’s Health Initiative(JAMA, 2001)

Hormoni

PlaceboKumulativnaincidencija

Koronarna bolest

Page 13: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Retrospektivna kohortna studija:Decembar 2003 BMJ:Aspirin, ibuprofen, and mortality after myocardialinfarction: retrospective cohort study

Page 14: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Ocena vremena-do-događaja (time-to-event)za grupu ispitanika, na primer vreme doreinfarkta grupe pacijenata sa IM.

Poređenje vremena-do-događaja između dveili više grupa ispitanika, na primer tretirani vs.placebo pacijenti sa IM u randomizovanomkliničkom ogledu.

Procena povezanosti kovarijati sa vremenom-do-događaja , na primer: da li su telesna masa,insulinska rezistencija ili holesterol povezani savremenom preživljavanja pacijenata sa IM?Primedba: očekivano vreme-do-događaja = 1/incidencija

Ciljevi analize preživljavanja

Page 15: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Zašto koristiti analizu preživljavanja?

1. Zašto ne porediti prosečno vreme-do-događaja između dve grupeprimenom t-testa ili linearne regresije?

-- ignorisanje cenzorisanja!!!!!!2. Zašto ne porediti proporcije događaja

u grupama primenom unakrsnogodnosa šansi (odds ratio) ili logističkeregresije?

--ignorisanje vremena!!!!!

Page 16: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Analiza preživljavanja: Termini

Vreme-do-događaja (time-to-event):Vreme od ulaska u studiju donastupanja specifičnog ishoda

Cenzorisanje (censoring): Ispitanik jecenzorisan kada je ili izgubljen zapraćenje, isključen iz studije ili ako jestudija završena pre nego što je razviodogađaj od interesa.

Page 17: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Struktura podataka: analizapreživljavanja

Ishod je dvodimenzionalan, dve varijable: Vremenska varijabla: ti = vreme do

kada je osoba bez događaja ili vremenastupanja događaja

Cenzorska varijabla: ci =1 ako jenastupio događaj; ci =0 nemadogađaja do vremena ti

Page 18: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Desno cenzorisanje (T>t)

Uobičajeni primeri Završetak istraživanja Smrt usled nekog drugog razloga koji nije

događaj od interesa Izgubljen za praćenje

Znamo da je osoba preživela bar dovremena t.

Page 19: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Izbor početka merenja vremena.

Page 20: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Desno cenzorisanje!

Page 21: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Ishodna varijabla

Binarni ishod i vreme do njegoverealizacije.

Da li su svi umrli ili ne? Ako nisu, imamo cenzorisane podatke. Da li su svi ušli u studiju u isto vreme? Ako nisu imamo progresivno

cenzorisane podatke.

Page 22: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Raspodele preživljavanja

Ti - vreme do nastupanja događaja jeslučajna varijabla sa odgovarajućomraspodelom verovatnoća

Različite metode za analizupreživljavanja određene su tipomraspodele za Ti.

Page 23: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Primer…

Podsetimo se ovog grafika.

Da li liči na normalnu ilieksponencijalnu raspodelu?

Page 24: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Funkcije vremenapreživljavanja

Funkcija gustine verovatnoća f(t) Funkcija preživljavanja S(t) P(osoba preživi duže od t) ocena je = broj pacijenata koji preživi

duže od t / ukupan broj pacijenata Funkcija hazarda H(t)

Page 25: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Funkcija gustine verovatnoća:f(t)

Ljudski vek - Ti će malo verovatno slediti normalnuraspodelu. Zašto?

Ljudi imaju najveću verovatnoćuumiranja u 70-tim i 80-timgodinama;

ALI umaju manju šansuumiranja u 90 i 100, jer malibroj ljudi živi dovoljno dugo dabi umro u ovim godinama.

Page 26: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Funkcija gustine verovatnoća: f(t)

Verovatnoća neuspeha u određenomvremenu t (od svih mogućih vremena t).

tttTtPtf

t

)(lim)(0

Page 27: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Funkcija preživljavanja: 1-F(t)

Cilj analize preživljavanja je da oceni i poredi preživljavanjerazličitih grupa ispitanika.

Preživljavanje se ocenjuje / opisuje kumulativnom funkcijompreživljavanja:

)(1)(1)( tFtTPtS

Primer: Ako je t=100 godina, S(t=100) =verovatnoća preživljavanja iznad 100 godina.

F(t) je KF od f(t),i “zanimljivija” jeod f(t).

Page 28: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Kumulativno preživljavanje

Podsetitise fgv:

Page 29: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Kumulativno preživljavanje

P(T>80)

P(T>20)

Page 30: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Funkcija hazarda

GODINEStopa hazarda je trenutna stopaincidencije.

Page 31: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Funkcija hazarda

ttTttTtPth

t

)/(lim)(0

Rečima: verovatnoća da ako se preživi do t, već usledećem trenutku događaj će se desiti.

)()((t):survivalanddensityfromHazardtStfh

Page 32: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Hazard vs gustina veroavtnoća

Ideja je: Pri rođenju postoji određena verovatnoća

umiranja u bilo kojim godinama; to jegustina verovatnoća Primer: žena koja se danas rodi, ima recimo 1%

šansu da će umreti u 80-toj godini. Međutim, ako osoba preživi već neko

vreme, verovatnoće umiranja će se stalnomenjati Primer: žena koja danas ima 79 godina, ima 5%

šanse da će umreti u 80-toj godini.

Page 33: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Metode I

Određivanje funkcija: Kaplan - Meier-ova metoda Tablice preživljavanja

Poređenje funkcija: Logrank test Mantel-Haenszel-ov tes Gehanov Generalizovani Wilcoxon-ov test

Page 34: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Metode II Identifikacija faktora rizika povezanih

sa binomnim ishodima: Linearna diskriminaciona funkcija Logistički regresioni metod

Identifikacija prognostičkih faktorapovezanih sa vremenompreživljavanja: Cox-ov proporcionalni hazardni

regresioni model Parametarske regresione metode

Page 35: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Kaplan - Meierova metoda iLogrank test

Page 36: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Početak studije Kraj studije Vreme u mes.

Subjekat B

Subjekat A

Subjekat C

Subjekat D

Subjekat E

Kaplan-Meier / neparametarskaocena funkcije preživljavanja

1. subjekat E umro jeu 4 mesecu

X

Page 37: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

100%

Vreme u mes.

Odgovarajuća Kaplan-Meierova kriva

Verovatnoćapreživljavanja do4 meseca je 100%= 5/5

Frakcija kojaje preživelaovu smrt = 4/5

Subjekat E umire u 4mesecu

Page 38: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Početak studije Kraj studije Vreme u mes.

Subjekat B

Subjekat A

Subjekat C

Subjekat D

Subjekat E

Podaci o preživljavanju2. subjekt Aisključen posle6 meseci

1. subjekt E umire u4 mesecu

X

3. subjekt Cumire u 7mesecu

X

Page 39: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

100%

Vreme u mes.

Odgovarajuća Kaplan-Meierovakriva

subjekat Cumire 7 mes.

Frakcija kojapreživi ovusmrt = 2/3

Page 40: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Početak studije Kraj studije Vreme u mes.

Subjekt B

Subjekat A

Subjekt C

Subjekt D

Subjekt E

Podaci o preživljavanju2. subjekt Aisključenposle 6 mes.

4. Subjekti B iDpreživljavajuceojednogodišnjiperiod

1. subjekt E umire u4 mesecu

X

3. subjekt Cumire u 7 mes.X

Page 41: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

100%

Vreme u mes.

Odgovarajuća Kaplan-Meierova kriva

Ocena preživljavanja =P(preživi interval 1/u riziku do prvog događaja 1) *P(preživi interval 2/u riziku do drugog događaja 2)= 4/5 * 2/3= .5333

Page 42: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Metod ocenjivanja je “productlimit method”

Verovatnoća preživljavanja celegodine, uračunavajući cenzorisane je

= (4/5) (2/3) = 53% Verovatnoća preživljavanja, a da nema

cenzorisanih bila bi jednostavna= (3/5) = 60%

Page 43: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Kaplan-Meierova kriva

Time (months) to conception or censoring in 38 sub-fertile women after laparoscopy and hydrotubation

Conceived Did not conceive

1 2

1 3

1 4

1 7

1 7

1 8

2 8

2 9

2 9

2 9

2 11

3 24

3 24

3

4

4

4

6

6

9

9

9

10

13

16

Page 44: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Pažnja!

Ocene preživljavanja postajunepouzdane pri kraju studija kada jebroj osoba pod rizikom da dobijudogađaj mali.

Page 45: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

WHI i rak dojke

Malibrojevi

Page 46: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Poređenje 2 grupe

Koristi se log-rank test / nulta hipoteza o nepostojanju značajnihrazlika između dve funkcije preživljavanja

Page 47: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Kaplan-Meier: primer

Istraživači su randomizovali 44 pacijentasa aktivnim hroničnim hepatitisom ugrupe koje su primale ili prednisolon ilisu bile bez ikakvog tretmana, a potom suporedili njihove funkcije preživljavanja.

Primer iz BMJ 1998;317:468-469 ( 15 August )

Page 48: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Prednisolon (n=22) Kontrole (n=22)

2 26 312 454 756 * 1068 2289 2896 2996 32125* 37128* 40131* 41140* 54141* 61143 63145* 71146 127*148* 140*162* 146*168 158*173* 167*181* 182*

BMJ 1998;317:468-469 ( 15 August ) *=cenzorisani

Vremena preživljavanja (meseci) 44 pacijenta sa hroničnim aktivnim hepatitisom randomizovaniu grupe na prednisolonu ili bez tretmana.

Page 49: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Kaplan-Meier: primer

Da li su ove dve kriveznačajno različite?

Pogrešna konvergencija nakraju studije. Posledica je 6kontrola koje su preživeledovoljno dugo i 3 događaja ugrupi sa tretmanom kada jeveličina uzorka mala.

Veliki pad na kraju kriveposledica je malog brojapreostalih pacijenata.t.j., samo je 2/3 (66%)preživelo ovaj pad.

Page 50: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Log-rank test

Test of Equality over Strata

Pr >Test Chi-Square DF Chi-Square

Log-Rank 4.6599 1 0.0309Wilcoxon 6.5435 1 0.0105-2Log(LR) 5.4096 1 0.0200

Likelihood Ratio test nije u ovomslučaju idealan jer pretpostavljaeksponencijalnu raspodelu(konstantni hazard).

Wilcoxon je samo verzija log-rank testa koja uključuje težinustratuma po njihovoj veličini(dajući veću težinu ranijemvremenu).

Log-rank test ima najveću moć.

Grupe se značajno različito ponašaju.

Page 51: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Ocenjena –log(S(t))

Page 52: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Aproksimacija h(t)

Page 53: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Još jedan grafik …

log(-log(S(t))=

log(kumulativnog hazarda)

Ako su krive grupaparalelne, ona dupretpostavke oproporcionalnosti hazardaispunjene.

Neophodne pretpostavkeza računanje HazardnogOdnosa.

Page 54: Analiza podataka o preživljavanju (vremena do izabranog ... · PDF fileAktuarska analiza, tablice preživljavanja, analiza tablica preživljavanja Mortalitetne tablice i očekivano

Ograničenja Kaplan-Meierove metode

• Uglavnom deskriptivan• Nema kontrole kovarijata• Zahteva kaegorijalne prediktore• Nema mogućnosti uključenja varijabli

koje su vremenski zavisne