72
UNIVERZITET U NOVOM SADU PRIRODNO-MATEMATIKI FAKULTET SEMINARSKI RAD PREDMET: STATISTIKO MODELIRANJE TEMA: ANALIZA PREŽIVLJAVANJA I KOKSOV PH MODEL profesor: studenti: dr Zagorka Lozanov Crvenkovi Buda Bajic 119/07 Milena Kresoja 91m/10 Novi Sad, April 2011.

SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

  • Upload
    lenga

  • View
    239

  • Download
    7

Embed Size (px)

Citation preview

Page 1: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

UNIVERZITET U NOVOM SADU PRIRODNO-MATEMATI�KI FAKULTET�

SEMINARSKI RAD

PREDMET: STATISTI�KO MODELIRANJE

TEMA: ANALIZA PREŽIVLJAVANJA I KOKSOV PH MODEL

profesor: studenti:

dr Zagorka Lozanov Crvenkovi� Buda Bajic 119/07

Milena Kresoja 91m/10

Novi Sad, April 2011.

Page 2: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ��������

SADRŽAJ:

�� ��������� ���������������������������������������������������������������������������������������������������������������������������������

�� ��� ���������������������������������������������������������������������������������������������������������������������������������������������

����������������������������������������������������������������������������������������������������������������������������������������������������

�����������������������������������������������������������������������������������������������������������������������������������������������������������

�������� �������������������������������������������������������������������������������������������������������������������������������������������

�� ��!"����!��������������������������������������������������������������������������������������������������������������������������������������#�

�� ������������������� "������$��������������������������������������������������������������������������������������������������������������

%� &�'�(������� �����'����������������������������������������������������������������������������������������������������������������������������

�� &�'�(������� ���)��'�������������������������������������������������������������������������������������������������������������������������*�

+� ��������������������������������������������������������������������������������������������������������������������������������������������������������������

#� ��������������������������������������������������������������������������������������������������������������������������������������������������������������

,� ������������������������������������������������������������������������������������������������������������������������������������������������������*�

�*� �������������������������-�� ������'��.�������������������������������������������������������������������������������������

��� /���� ������'��.��������������������������������������������������������������������������������������������������������������������������,�

��� 0)������ �������.�������������1�������������������������������������������������������������������������������������������������������

��� ���������������� ������'��.������������������������������������������������������������������������������������������������

��� . �������2���������������������������������������������������������������������������������������������������������������������������������������������

�%� ����'�3���������������������������������������������������������������������������������������������������������������������������������+�

�����.�������������������������������������������������������������������������������������������������������������������������������������������������%*�

�+�������������������������������������������������������������������������������������������������������������������������������������������������������������%��

�#�������'��������������������������������������������������������������������������������������������������������������������������������������������������������%,�

�,��0����2���������������������������������������������������������������������������������������������������������������������������������������������������+��

�*��&��������������������������������������������������������������������������������������������������������������������������������������������������������+��

��

Page 3: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ��������

1. UVOD U ANALIZU PREŽIVLJAVANJA

Analiza preživljavanja generalno predstavlja skup procedura za koje je promenljiva od interesa vreme dok se doga�aj ne pojavi. Pod vremenom podrazumevamo godine, mesece, nedelje ili dane koji pro�u od po�etka posmatranja nekog subjekta, pa do momenta pojavljivanja doga�aja.

Ova analiza se prvo razvila u medicini i biologiji, a kasnije u ekonomiji, društvu i inžinjerstvu. Kada govorimo o živim bi�ima, koji su predmet posmatranja u medicini i biologiji, tada doga�aj predstavlja naj�eš�e smrt, oboljenje ili povratak neke bolesti. U slu�aju kada su mašine posmatrani subjekti, tada je doga�aj uglavnom njihov kvar. U analizi društva ima veoma interesantnih primera, kao što su vreme “preživljavanja” brakova ili vreme do napuštanja škole. Još jedan primer modela gde je promenljiva od interesa vreme dok se doga�aj ne pojavi, može biti vreme do izvršavanja zlo�ina. U ekonomiji se može posmatrati “preživljavanje” neke delatnosti ili vreme “preživljavanja” nekog proizvoda.

Veoma bitan pojam za analizu preživljavanja je i cenzurisanje. Ono se javlja kada imamo neku informaciju o vremenu pojavljivanja doga�aja, ali ne znamo ta�no vreme njegovog pojavljivanja.

Tokom jedne analize pretpostavljamo da je samo jedan doga�aj, nad posmatranim subjektima, nama od interesa, ali može se posmatrati i više od jednog. To može biti, na primer, smrt usled nekoliko razli�itih uzroka ili pojavljivanje bolesti usled razli�itog na�ina života itd. Kada se posmatra više doga�aja tada se statisti�ki problem karakteriše kao problem višestrukog rizika, koji je izvan domena ove prezentacije.

Mnogi koncepti u analizi preživljavanja se objašnjavaju novorazvijenom teorijom prebrojavanja. Ona ovde tako�e ne�e biti prezentovana, ali je od zna�aja pa je treba spomenuti. Fleksibilnost procesa prebrajanja je to što dozvoljava modeliranje višestrukog pojavljivanja doga�aja. Ovaj tip modeliranja se veoma dobro uklapa u mnoge situacije, kao na primer, ljudi koji idu u zatvor iznova, alkoholi�ari koji prestaju i po�inju da piju uvek ispo�etka ili ljudi koji se ven�avaju pa razvode više puta.

Analiza preživljavanja sa osnovnim pojmovima, se definiše pre svega, kako bi se upoznali sa tematikom. Onda se uvodi notacija, koja je se koristi u radu, ali koja je uglavnom i standardna za date pojmove. Prikazuju se tako�e i osnovni podaci koji su potrebni za kompjutersko izra�unavanje.

Zatim sledi grafi�ki prikaz krivih preživljavanja pomo�u Kaplan – Meier-ovog metoda.

Glavni deo predstavlja opis kako da se uporede dve ili više krivih preživljavanja. Nama je od posebnog zna�aja upore�ivanje krivih da bismo utrvdili njihovu ekvivalentnost ili razli�itost. Upore�ivanje vršimo koriste�i Log-rank test za testiranje nulte hipoteze o jednakosti krivih. Kada se radi o dve grupe podataka nije nam problem da sami izra�unamo potrebnu Log-rank vrednost, ali kada je slu�aj sa više grupa, ra�un postaje izuzetno komplikovan pa se koristi samo ra�unar. Test statistika je približno �� ��raspodela sa � � � stepenom slobode.

Alternativni test je Peto test koji se koristi kada želimo da damo ve�i zna�aj informacijama na po�etku krive preživljavanja. Ovaj test je tako�e veliki uzorak �� � testa sa � � � stepenom slobode.

Na osnovu � � vrednosti procenjujemo da li se nulta hipoteza odbacuje ili ne, i tako dolazimo do željenog zaklju�ka o ekvivalenciji ili razli�itosti krivih preživljavanja za date grupe podataka. Upotreba Log-rank i Peto testa zavisi od toga koji deo krive preživljavanja nam je zna�ajniji.

Page 4: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ��������

2. ANALIZA PREŽIVLJAVANJA

2.1 Osnovni pojmovi

Uopšteno, analiza preživljavanja je skup statisti�kih procedura za analizu podataka za koje je rezultuju�a promenljiva od interesa vreme dok se doga�aj ne desi. Pod doga�ajem podrazumevamo smrt, bolest, povratak bolesti, ili bilo koje odre�eno iskustvo koje je od interesa za posmatranje, a koje se može desiti nekoj osobi.

START DOGA�AJ

Kod analize preživljavanja vremenska promenljiva se obi�no odnosi na vreme preživljavanja (vreme pojavljivanja doga�aja). Pojavljivanje doga�aja naravno smatramo neuspehom.

Klju�ni analiti�ki problem je takozvano cenzurisanje. U suštini, cenzurisanje se pojavljuje kada imamo delimi�nu informaciju o pojavi doga�aja ali ne znamo ta�no vreme pojavljivanja. Ako npr. ispitujemo vreme prezivljavanja brakova, na kraju vremena posmatranja neki parovi ce ostati u braku, njima se nije desio doga�aj. Takvi parovi predstavljaju cenzurisana posmatranja. Uopšteno, postoje tri razloga zbog kojih se pojavljuje cenzurisanje:

1. kod osobe se nije pojavio doga�aj pre završetka posmatranja;

2. osoba je izgubljena tokom procesa posmatranja;

3. osoba se povla�i zbog smrtnog ishoda ili nekog drugog razloga.

2.2 Notacija

Slovo � koristimo za proizvoljnu promenljivu koja ozna�ava vreme preživljavanja osobe (vreme dok se ne desi doga�aj). Dalje, malim slovom ozna�avamo bilo koju specifi�nu vrednost koja je od interesa za promenljivu T.

� = �� ������������������������ = �����������������������

Na primer, ako nas zanima da li je vreme prezivljavanja ve�e od 5 godina, onda je t=5.

Gr�kim slovom � � �� !" ozna�avamo statusnu promenljivu koja predstavlja ili cenzurisanje ili neuspeh. Kada je � # � onda se doga�aj pojavio tokom perioda posmatranja, odnosno imamo neuspeh, a kada je � # $ onda je vreme pojave doga�aja cenzurisano ili tokom ili na kraju posmatranog perioda.

������

Page 5: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ��������

������ # ������ % �� ���������&���'���������$� �����������&�������(

Funkcija preživljavanja je ozna�ena sa )�" i predstavlja verovatno�u da proizvoljna promenljiva � prekora�i specifi�no vreme .

)�" # �&������������*������ # +�� , �"

Teoretski gledano, kako se kre�e od do , funkcija preživljavanja se grafi�ki predstavlja kao opadaju�a

glatka kriva koja polazi iz )�" # � za # $ i opada ka nuli kada teži ka (za t=� S(t) je verovatno�a da je

vreme preživljavanja ve�e od � a ta verovatno�a je jednaka nuli), što i pokazuje Grafik 1.

Grafik 1

U praksi, koriste�i podatke, obi�no se dobijaju grafici funkcije preživljavanja kao stepenaste funkcije (kao što je prikazano na Grafiku 2) , pre nego glatke krive.

Page 6: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ��������

Grafik 2

Funkcija rizika je ozna�ena sa -�" i predstavlja trenutni potencijal po jedinici vremena da se doga�aj pojavi, ako se zna da se nije pojavio do momenta (tj. osoba je preživela do momenta ).

Funkcija rizika data je formulom:

0

( | )( ) lim

t

P t T t t T th t

t∆ →

≤ < + ∆ ≥=

Suprotno od funkcije preživljavanja, koja se fokusira na pozitivan doga�aj, tj. da se doga�aj ne pojavi, funkcija rizika se fokusira na neuspeh, tj. da se doga�aj pojavi. Drugim re�ima, kada )�" raste onda -�" opada, i obrnuto. Rizik je stopa, a ne verovatno�a i funkcija rizika se ponekad naziva i uslovna stopa preživljavanja (uslovna zbog toga što je brojilac razlomka u formuli kojom je zadata funkcija rizika uslovna verovatno�a da vreme preživljavanja bude izmedju t i t+ �t ako je vreme preživljavanja ve�e ili jednako od t; stopa jer se deli sa �t). Vrednost funkcije rizika se nalazi izme�u i .

Bez obzira na to koja funkcija se preferira, )�" ili -�", postoji jasna veza izme�u njih. Ako se zna forma od )�" tada se može izvesti odgovaraju�e -�", i obrnuto. Veza izmedju ovih funkcija je data formulama:

( )

0( )

t

h u du

S t e

− �

=

( ) /( )

( )

dS t dth t

S t

� �= − � �

� �

2.3 Prikaz podataka

Osnovni cilj analize preživljavanja da uporedi vremena preživljavanja dve ili više grupa i otkrije da li se statisti�ki zna�ajno ta vremena preživljavanja razlikuju. U tabeli ispod prikazani su opšti podaci za analizu preživljavanja. U prvoj kolini tabele su predstavljene osobe koje se posmatraju (subjekti iz svih grupa). Druga kolona daje informaciju o posmatranom vremenu pojavljivanja doga�aja. Tre�a kolona je promenljiva � koja ozna�ava status cenzurisanja. Ostatak tabele predstavljaju vrednosti za promenljive od interesa koje ih objašnjavaju ( npr. starosno doba, pol, rasa, ... ). Promenljiva od interesa je ono po �emu se grupe me�usobno razlikuju. Ako na primer želimo da ispitamo da li se vremena preživljavanja pacijenata le�enih od leukemije lekovima dve razli�ite farmaceutske kompanije razlikuju, onda imamo samo jednu promenljivu od interesa i to je farmaceutska kompanija �ije su lekove pili pacijenti, ili npr. ako nas interesuje razlika u vremenima prezivljavanja muškaraca i žena onda bi promenljiva od interesa bio pol.

Tabela opštih podataka:

Posmatrane

osobe � .! ./ ... .0

1 �1 21 311 31� ... 314

2 �/ 2� 3�1 3�� ... 3�4

. . . . . .

. . . . . .

Page 7: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ��������

. . . . . .

n �5 26 361 36� ... 364

Ispod je prikazan drugi na�in za predstavljanje redosleda podataka. Ovaj redosled je baza nad kojom se izvode Kaplan – Meier-ove krive preživljavanja. Prva kolona u tabeli daje vremena pojavljivanja doga�aja po redu, od najkra�eg do najdužeg, ozna�ena sa ��7" (dakle u ovu tabelu unosimo samo vremena onih doga�aja koji su se desili, ne i cenzurisana vremena). U drugoj koloni su date frekvencije pojavljivanja doga�aja za svako razli�ito vreme pojavljivanja doga�aja, ozna�ene sa 7 �. U tre�oj koloni su frekvencije pojavljivanja cenzurisanih osoba u intervalu ��7 � �781", njih ozna�avamo sa 97 ( treba napomenuti da prilikom ra�unanja broja cenzurisanih osoba u intervalu ��7 � �781" se ubrajaju osobe �ije je vreme cenzurisanja bilo tj a ne ubrajaju one �ije je vreme cenzurisanja bilo tj+1). Poslednja kolona predstavlja skup rizika, :;�7<�, �iji su elementi osobe kod kojih se najmanje do momenta ��7" nije pojavio doga�aj. Svaka osoba u :;�7< je imala vreme do pojavljivanja doga�aja koje je ve�e ili jednako od �7. Napomenimo da :;�7< nije broj, :;�7< je skup.

Alternativna (ure�ena) tabela podataka:

Vreme za koje se desio doga�aj =

Frekvencija pojavljivanja

doga�aja >=

Broj cenzurisanih u intervalu�=� =8!"

?=

Skup rizika @;=<

� # � >� # � ?� :��A" ! >! ?! :��1" . . . . . . . . . . . .

B >B ?B :��C"

Da bi se izra�unala verovatno�a preživljavanja u datom momentu, koristi se rizi�ni skup da bi se uklju�ila informacija koju imamo o cenzurisanim osobama do momenta cenzurisanja, a ne da se samo odbace sve informacije o cenzurisanim osobama. Za izra�unavanje takve verovatno�e koristimo Kaplan – Meier-ov metod.

Page 8: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ��������

3. KAPLAN MEIER-OVE KRIVE

Sa Kaplan – Meier-ovim metodom upozna�emo se preko primera. Posmatramo istraživanje nad 24 para blizanaca obolelih od sr�ane bolesti, tzv. CHD (coronary heart disease). Podaci su dobijeni iz studije o vremenu remisije, dati u mesecima, za dve grupe blizanaca. U prvoj grupi je 12 blizanaca koji su muškog pola, a u drugoj 12 blizanaca ženskog pola. Osnovno pitanje od interesa ti�e se upore�ivanja iskustava preživljavanja u ove dve grupe, tj. da li postoje statisti�ki zna�ajne razlike u vremenima preživljavanja izme�u grupa.

Primer

Vreme trajanja remisije, u mesecima, za dve grupe blizanaca obolelih od CHD-a

Grupa 1 ( n=12 ) Blizanci

Grupa 2 ( n=12 ) Bliznakinje

49+ 50 56 52 58 63+ 61 67 68 69+ 70+ 70+ 69+ 70+ 74+ 70+ 72 73+ 74+ 75+ 81 74+ 75+ 81+

Tabela 1

+ ozna�ava cenzurisanje

negativan doga�aj cenzurisan UKUPNO Grupa 1 6 6 12 Grupa 2 3 9 12

Tabela 2

Podaci koji su dati u gornjoj tabeli još uvek nisu prikazani u odgovaraju�oj formi za kompjutersku obradu.

Vrednosti u tabeli date za svaku grupu predstavljaju vreme izraženo u mesecima za pacijente u remisiji, pa sve do njihovog izlaska iz remisije ili cenzurisanja. Izlazak iz remisije tretiramo kao negativan doga�aj (neuspeh). Kako remisija predstavlja period nakon nestanka laboratorijskih i fizickih znakova bolesti, izlazak iz remisije ozna�ava povratak bolesti.

U prvoj grupi 6 blizanaca je imalo negativan doga�aj, tj. vratila im se bolest do kraja perioda posmatranja, i isto toliko je cenzurisano, a u drugoj grupu je samo 3 bliznakinje imalo negativan doga�aj, a ostalih 9 je cenzurisano.

Na osnovu uzorka možemo izra�unati prose�no vreme pojavljivanja doga�aja i prose�nu stopu rizika. Za to koristimo slede�e statistike: DE i 'E . Prose�no vreme pojavljivanja doga�aja (DE ) se dobija sabiranjem svih vremena pojavljivanja doga�aja za jednu grupu (tu uklju�ujemo i vremena cenzurisanja i ta �injenica implicira da su prose�na vremena preživljavanja za neku grupu ve�a nego ona koja dobijamo na ovaj na�in) i zatim

Page 9: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ��������

podeli sa brojem osoba koje se posmatraju u toj grupi. Prose�na stopa rizika ('E) se dobija kao koli�nik broja neuspeha u grupi i zbira svih vremena pojavljivanja doga�aja u toj grupi. Odnosno pomo�u formula:

�F # G =5=H!5 -F # IJK=�5LMN0L-O

G =5=H!

Deskriptivna statistika za podatke iz Tabele 1 :

�F! # PPQ�R , -F! # $Q$$S$� �F/ # PSQTU , -F/ # $Q$$VP� Na osnovu ovih podataka možemo zaklju�iti da druga grupa ima bolju prognozu preživljavanja nego prva grupa (jer je njeno prose�no vreme preživljavanja ve�e od prose�nog vremena preživljavanja prve grupe i prose�na stopa rizika joj je manja u pore�enju sa prvom grupom). Medjutim, pitanje je da li su razlike koje postoje statisti�ki zna�ajne da bismo mogli da tvrdimo da je vreme preživljavanja bliznakinja zaista ve�e. �injenicu da postoje razlike u vremenima preživljavanja potvrdi�e nam i Kaplan- Meier- ove krive preživljavanja koje cemo u nastavku skicirati na osnovu dobijenih podataka.

U Tabelama 3 i 4 su prikazana vremena pojavljivanja doga�aja pore�ana rastu�im redom za svaku grupu, kao i osnovne informacije za izra�unavanje KM krivih.

Primer

Grupa 1 (blizanci):

= 5= >= ?= 0 12 0 1

50 11 1 0 56 10 1 0 61 9 1 0 67 8 1 0 68 7 1 5 81 1 1 0

Tabela 3

Grupa 2 (bliznakinje):

= 5= >= ?= 0 12 0 0

52 12 1 0 58 11 1 5 72 5 1 4

Tabela 4

Svaka tabela po�inje sa nultim vremenom pojavljivanja doga�aja, �ak iako se nijednoj osobi nije pojavio doga�aj u tom periodu jer je dozvoljena verovatno�a da neka osoba bude cenzurisana pre prvog vremena pojavljivanja doga�aja.

Page 10: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ������� �

Tako�e, svaka tabela ima kolonu ozna�enu sa 5= koja predstavlja broj osoba u rizi�nom skupu na po�etku intervala. Pretpostavlja se da��5= uklju�uje one osobe kojima može da se pojavi doga�aj u trenutku =, tj. �ije je vreme preživljavanja ve�e ili jednako sa =.

Za crtanje Kaplan – Meier-ovih kriva potrebno je u tabele dodati još jednu kolonu, ozna�enu sa )W;=<�, koja sadrži ocene verovatno�a preživljavanja. Ove verovatno�e su Kaplan – Meier-ove verovatno�e za svaku od grupa.

Verovatno�a preživljavanja daje verovatno�u za koju se kod posmatranog subjekta nije pojavio doga�aj posle specifi�nog vremena, tj. subjekat koji preživi do specifi�nog vremena. Dakle, posmatraju�i podatke iz svake od grupa, verovatno�a da je vreme pojavljivanja doga�aja ve�e od 0 jeste 1, odnosno skoro sigurno, a to �e ina�e biti za bilo koji skup podataka.

Ra�unanje verovatno�e preživljavanja je mnogo jednostavnije kada u posmatranoj grupi nema cenzurisanih subjekata. Tada, za ��D , �7", se )W�=" ra�una po formuli:

)W;=< # IJK=�0JL�XYLZX-�0KNZL�=5 ���� ����� # $ � [ �

Ako posmatramo takvu grupu, bez cenzurisanih subjekata, tada se ? kolona sastoji sastoji samo od nula. Ako je neka ?�- ta vrednost razli�ita od nule, potrebna je neka alternativna formula za ra�unanje verovatno�e preživljavanja. Ova alternativna formula se naziva Kaplan – Meier-ov pristup i može da se koristi �ak i kada su vrednosti ? sve jednake nuli.

Verovatno�e preživljavanja bez cenzurisanih vrednosti, ra�unate pomo�u KM formule, predstavljaju proizvod razlomaka od kojih je svaki uslovna verovatno�a. Odnosno, svaki razlomak u proizvodu je verovatno�a prevazilaženja specifi�nog vremena =�, datog tako da osoba nije imala doga�aj do tog vremena.

Uopšteno gledano, bilo koja KM formula za verovatno�u preživljavanja je ograni�ena proizvodom razlomaka sve do specifi�nog momenta bez doga�aja. Zbog toga se KM formula �esto ozna�ava kao grani�na vrednost proizvoda.

\]�^KJ>MZO # _JO5X�5O�YJL`5KN�0JKXaYK`O

Osnovna formula za Kaplan – Meier-ovu analizu preživljavanja u vremenu pojavljivanja doga�aja = data je sa:

)W;=< # )W;=b!< c +W�� , =d� e ="(

Page 11: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Primer:

Grupa 1 (blizanci):

= 5= >= ?= )W;=< 0 12 0 1 1

50 11 1 0 � c �$�� # �Q f�f!

56 10 1 0 $QT$T� c T�$ # �Q g!g/

61 9 1 0 $QS�SU c ST # �Q h/hi

67 8 1 0 $QRURV c RS # �Q jijk

68 7 1 5 $QPVPl c PR # �Q mkmk

81 1 1 0 $Qnlnl c $ # � Tabela 5

Grupa 2 (bliznakinje):

= 5= >= ?= )W;=< 0 12 0 0 1

52 12 1 0 � c ���U # �Q f!jh

58 11 1 5 $QT�PR c �$�� # �Q giii

72 5 1 4 $QSVVV c ln # �Q jjjh

Tabela 6

U tabelama 5 i 6 su prikazane ocenjene verovatno�e preživljavanja dobijene pomu�u KM formule.

Prva ocena preživljavanja u koloni je op�$" # � , u obe grupe, jer ona daje verovatno�u preživljavanja posle nultog vremena. Ostale ocene preživljavanja su izra�unate množenjem ocena (razlomaka) za preživljavanje. Na primer, za grupu 2, razlomak

111� je preživljavanje posle 52 meseca, jer 12 pari bliznakinja ostaje sve do 52

meseca i 1 od svih pari bliznakinja je imao doga�aj posle 52 meseca. Razlomak 1A11 je preživljavanje posle 58

meseci, jer 11 pari bliznakinja ostaje sve do 58-og meseca i jednom paru se desio doga�aj posle 58-og meseca. A da bi dobili ocenu preživljavanja još množimo taj razlomak sa ocenom iz predhodnom vremenskog trenutka. Ostali razlomci su sli�no izra�unati.

Kaplan – Meier-ove krive preživljavnanja za Grupu 1 i Grupu 2 prikazane su na slede�im graficima:

Page 12: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Grafik 3 – Blizanci

Grafik 4 – Bliznakinje

Page 13: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Znamo kako izgledaju krive preživljavanja za obe grupe pojedina�no, a od velikog zna�aja je i njihovo poredjenje. Kada su obe krive prikazane na istom grafiku možemo jasno da vidimo koliko se poklapaju ili ne, a kasnije to i možemo potvrditi ispitivanjem hipoteza.

Primer

KM krive za podatke remisije:

Grafik 5

Grafik 5 prikazuje KM krive za grupu 1 i grupu 2. Može se lako primetiti da je KM kriva za grupu 2 konzistentno viša od KM krive za grupu 1. To ukazuje da grupa 2, tj. bliznakinje, ima bolje ocene preživljavanja nego grupa 1, tj blizanci.

Prikazan KM grafik se može lako dobiti iz ve�ine kompjuterskih programa koji predstavljaju analizu preživljavanja. Sve što korisnik treba da uradi jeste da obezbedi KM kompjuterski program sa osnovnom bazom podataka i da obezbedi odgovaraju�e komande za dobijanje grafika.

Page 14: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

4. OSNOVNE KARAKTERISTIKE KM KRIVIH

����q0�O�\]�^KJ>MZOr���������������)W;=< # )W;=b!< c +W�� , =d� e ="(

Ova formula daje verovatno�u preživljavanja posle prethodnog vremena pojavljivanja doga�aja =b! pomnožena sa uslovnom verovatno�om preživljavanja posle vremena = , daju�i verovatno�u preživljavanja najmanje do vremena =. Gornja KM formula tako�e može biti predstavljena kao grani�na vrednost proizvoda ako umesto verovatno�e preživljavanja )W;=b!< stavimo proizvod svih razlomaka koji ocenjuju uslovne verovatno�e u momentu =b! i ranije. Opšti izraz za grani�nu vrednost proizvoda za KM ocenu preživljavanja dat je sa:

)W;�=b!"< # s +W�� , Xt� e X"(=b!

Xu!

Na primer, verovatno�a preživljavanja posle 72 meseca je za Grupu 2 u Tabeli 6 data kao

$QSVVV c vw # $QPPPR�, ali broj $QSVVV može biti zapisan kao proizvod razlomaka

1A11 i

111� . Prema tome, grani�na

vrednost proizvoda preživljavanja posle 72 meseca je data preko prizvoda tri razlomka.

Primer

)W�mg" # �Q f!jh c !�!! # �Q giii # !!

!/ c !�!!

)W�h/" # �Q giii c km # �Q jjjh # !!

!/ c !�!! c k

m

Opšti izraz za grani�nu vrednost proizvoda za KM ocenu preživljavanja je ekvivalentan sa opštom KM formulom. Odnosno, važi:

)W;�="< # s +W�� , Xt� e X"(=

Xu!# )W;=b!< c +W�� , =d� e ="(

Jednostavan matemati�ki dokaz za KM formulu može biti izveden u izrazima verovatno�e. Jedna od osnovnih osobina verovatno�e jeste da je verovatno�a preseka dva doga�aja, npr.A i B, jednaka proizvodu verovatno�e jednog od doga�aja, npr. doga�aja A, i uslovne verovatno�e drugog doga�aja, odnosno doga�aja B, ako se desio doga�aj A. Odnosno:

+�x y z" # +�x" c +�ztx"����

Page 15: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Ako uzmemo za doga�aj A da osoba nije imala pojavu posmatranog doga�aja najmanje do vremena = i uzmemo B kao doga�aj da osoba nije imala pojavu tog doga�aja posle vremena =�, tada važi:

x # {� e ={ z # {� , ={ A�B=B

P(A�B)= P(B)= S(tj)

Tako�e, zbog toga što je = slede�e vreme pojavljivanja doga�aja nakon =b! , zo zna�i da nema neuspeha posle =b! , a pre = . Zato, verovatno�a doga�aja A je ekvivalentna sa verovatno�om preživljavanja posle �= � !"�- og vremena pojavljivanja doga�aja.

|L>O�`K_O}O=O������ ���������������������������������������=b! ~ D ~ =�����������������������������������+�x" # +;� , =b!< # );=b!<

���M�X5LJYOZM:

Dalje, uslovna verovatno�a da se desi doga�aj B ako se prethodno desio dogašaj A je ekvivalentna uslovnoj verovatno�i iz KM formule. Odnosno, važi: +�ztx(" # +�� , =d� e ="( Prema tome, koriste�i osnovna pravila verovatno�e možemo izvesti KM formulu: );=< # );=b!< c +�� , =d� e ="(

Page 16: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

5. LOG RANK TEST ZA DVE GRUPE

Kada posmatramo podatke za više grupa pacijenata, od velike nam je važnosti da možemo da ih uporedimo. Interesuje nas kako oceniti da li su ili ne KM krive za dve ili više grupa statisti�ki ekvivalentne. Za po�etak posmatramo samo dve grupe. Najpopularniji test-metod je tzv. Log - rank test.

Kada se uspostavi da su dve KM krive “statisti�ki ekvivalentne“ misli se da, bazirano na proceduri testiranja koja poredi dve krive u nekom globalnom smislu, nemamo dokaza kojim bismo pokazali da su krive preživljavanja razli�ite. Log - rank test je veliki uzorak �� - testa, koji koristi kao svoj kriterijum za testiranje statistiku koja obezbe�uje globalno pore�enje KM krivih, koje se posmatraju. Ova statistika, kao i mnoge druge statistike koje se koriste u �� - testovima, koristi razlike izme�u posmatranih i o�ekivanih (teorijskih) frekvencija. Frekvencije za Log - rank test statistiku su definisane pojedina�no preko vremena pojavljivanja doga�aja, za ceo skup podataka koji se analizira. Kao primer potrebnih informacija za Log - rank test, ponovo posmatramo pore�enje blizanaca (Grupa 1) i bliznakinja (Grupa 2) koji su u fazi remisije kao 24 subjekta obolela od CHD-a. Primer

Podaci remisije za � # Ul

Neuspesi Skup rizika = >!= >/= 5!= 5/= 0 0 0 12 12

50 1 0 11 12 52 0 1 10 12 56 1 0 10 11 58 0 1 9 11 61 1 0 9 10 67 1 0 8 9 68 1 0 7 9 72 0 1 4 5 81 1 0 1 1

Tabela 7

Ovde, za svako odre�eno vreme pojavljivanja doga�aja �7 u �itavom skupu podataka, pokazujemo broj subjekata ( �7) kojima se desio doga�aj u tom trenutku, za grupu �, i broj subjekata (��7) u skupu rizika u datom trenutku, za grupu �.

Prema tome, na primer u 50-om mesecu se jednom subjektu iz grupe 1 desio doga�aj, a u isto vreme se nijednom subjektu iz grupe 2 nije desio doga�aj. Tako�e u 50-om mesecu, skup koji posmatramo sadrži 11 subjekata u grupi 1, dok u grupi 2 ima 12 subjekata.

Sli�no u 72-om mesecu, nijedan subjekat iz grupe 1 nije imao doga�aj, dok iz grupe 2 jedan jeste, a skupovi rizika za svaku grupu sadrže 4 i 5 subjekta, respektivno. Sada proširujemo prethodnu tabelu uklju�uju�i elemente o�ekivanih frekvencija i razliku posmatranih i o�ekivanih vrednosti za svaku grupu za svako vreme pojavljivanja doga�aja, pore�anih rastu�im redosledom.

Page 17: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

O�ekivane frekvencije obeležavamo sa LX= za svaku grupu �, i ra�unamo ih po formuli:

LX= # � 5X=5!= � 5/=� c �>!= � >/="

�� proporcija broj neuspeha u skupu ruzika u obe grupe

Za grupu 1, ova formula izra�unava o�ekivane vrednosti u momentu �, ozna�ene sa L!=, kao proporciju broja subjekata iz grupe 1 i ukupnog broja subjekata u obe grupe u datom momentu pojavljivanja doga�aja, pomnožena sa ukupnim brojem subjekata, iz obe grupe, kojima se desio doga�aj u tom momentu. Za grupu 2, L/=, izra�unava se na isti na�in.

Neuspesi

Skup rizika

O�ekivano registrovano-

o�ekivano

= >!= >/= 5!= 5/= L!= L/= >!= � L!= >/= � L/= 0 0 0 12 12 ��U Ul� )c$

��U Ul� )c$ $ $ 50 1 0 11 12 ��� UV� )c�

��U UV� )c� $QnU�R �$QnU�R 52 0 1 10 12 ��$ UU� )c�

��U UU� )c� �$Qlnln $Qlnln 56 1 0 10 11 ��$ U�� )c�

��� U�� )c� $QnUVS �$QnUVS 58 0 1 9 11 �T U$� )c � ��� U$� )c� �$Qln $Qln 61 1 0 9 10 �T �T� )c � ��$ �T� )c� $QnUPV �$QnUPV 67 1 0 8 9 (8/17)c � (9/17)c �

0.5294 -0.5294 68 1 0 7 9 (7/16)c � (9/16)c �

0.5625 -0.5625 72 0 1 4 5 (4/9)c � (5/9)c �

-0.4444 0.4444 81 1 0 1 1 (1/2)c � (1/2)c �

0.5 0.5

Total

6 3 4.1852 4.8147 1.8148 -1.8148

Tabela 8

Kada se porede dve grupe, Log - rank statistika se formira pomo�u sume registrovanih minus o�ekivanih frekvencija za sva vremena pojavljivanja doga�aja za jednu od te dve grupe. U ovom primeru, ta suma je 1.8148 za grupu 1 i -1.8148 za grupu 2. Koristi�emo vrednost grupe 1 za nastavak testa, ali kao što može da se primeti, osim znaka minus, vrednost je ista za obe grupe.

Page 18: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

qX � �X # ��>X= � LX="!�

=u!���������� �������X # ! /

Primer:

O1 –E1 = 1.8148 O2 –E2 = -1.8148

Za slu�aj sa dve grupe, Log - rank statistika se izra�unava kao koli�nik kvadrata sume registrovanih minus o�ekivanih frekvencija za jednu grupu, i ocene varijanse za sumu registrovanih minus o�ekivanih frekvencija. Npr. za grupu 2, formula je:

�K_ � JO5B�NOXNXBO # �q/ � �/"/�OJ�q/ � �/"

Za dve grupe, formula varijanse je ista za svaku grupu. Ova formula uklju�uje broj subjekata iz skupa rizika u svakoj grupi (��7) i broj subjekata kod kojih se pojavio doga�aj u svakoj grupi ( �7) u momentu �. Sumiranje se vrši po svim vremenima pojavljivanja doga�aja. Izraz za ocenu varijanse je:

�OJ�qX � �X" # � �17��7; 178 �7<��17 � ��7 � 17 � �7";�17 � ��7<���17 � ��7 � �"7

������� ������X # ! /

Uzimamo za nultu hipotezu da nema razlike izme�u krivih preživljavanja. Pod nultom hipotezom (�A), Log - rank statistika je približno �� � statistika sa jednim stepenom slobode. Prema tome, � � vrednost za log - rank test je odre�ena tabelom za �� � raspodelu. �� # 5L�0KNK=X�JOaZXBO�Xa>L�M�BJXYX-�0JL�XYZ=OYO5=O Za izra�unavanje Log - rank statistike imamo nekoliko odgovaraju�ih kompjuterskih programa. Na primer, paket )+��x sadrži proceduru �B>���koja ra�una deskriptivne informacije o KM krivama, zatim Log-rank statistiku i alternativnu statistiku zvanu +LK�NOXNXBO, koja �e biti opisana kasnije, ili paketi poput )x) i z]�+, koji imaju procedure koje daju rezlultate sli�ne onima iz )+��x paketa, ili program STATISTIKA, koji je koriš�en u ovom radu. Primer

Log-Rank Test (uporedjivanje.sta) WW = 1.8148 Sum = 8.0284 Var = 2.0944

Test statistic = 1.254007 p = .02098

Log-rank = 1.254

Gore prikazani podaci remisije su dobijeni pomo�u programa Statistika, Log - rank testa za dve grupe. Log - rank statistika je !Q /mk i odgovaraju�a + � vrednost je data na pet decimala. Ova + � vrednost pokazuje da bi trebalo da odbacimo nultu hipotezu. Na osnovu toga zaklju�ujemo da grupa blizanaca i grupa bliznakinja imaju razli�ite KM krive preživljavanja.

Page 19: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Iako je pomo�u ra�unara bolje i lakše izra�unati log - rank statistiku, pokaza�emo i neke dalove ra�una. Od ranije znamo da je: O1 – E1= 1.8148. Ocena varijanse od �1 � �1 je iza�unata pomo�u formule varijanse i iznosi 2.2358. Log- rank statistika se tada dobija kao koli�nik kvadrata broja 1.8148 i broja 2.2358, što daje 1.4729, što je približno jednako onome što je Statistica dala kao rezultat.

Primer

O1 –E1 = 1.8148

Var (O1 –E1) = 2.2358 Log- rank statiskika =1.4729

Postoji aproksimacija za log-rank statistiku koja se može izra�unati pomo�u registrovanih i o�ekivanih vrednosti za svaku grupu bez izra�unavanja formule za varijansu. Približna formula je klasi�na �� forma koja sumira, za svaku grupu koja se poredi, kvadrat registrovane minus o�ekivane vrednosti, podeljen sa o�ekivanom vrednoš�u. Odnosno:

x0JKBNX>O�XK5O�^KJ>MZOr�������./ # � �qX � �X"/�XX

Primer

Za naš primer aproksimaciona f-la daje: X2 � 1.471 što je približno jednako sa 1.4729.

Page 20: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ������� �

6. LOG RANK TEST ZA VIŠE GRUPA

Log - rank test se može koristiti i za upore�ivanje tri ili više krivih preživljavanja. Nulta hipoteza, za ovaj opštiji slu�aj, glasi da su sve krive iste. Iako se može koristiti isti tabelarni prikaz da se sprovedu izra�unavanja kada ima više od dve grupe, test statistika je matemati�ki komplikovanija, uklju�uju�i i varijanse i kovarijanse sumiranih razlika registrovanih i o�ekivanih vrednosti za svaku grupu.

Detalje za izra�unavanje log - rank statistike nema potrebe ovde opisivati jer kompjuterski program može da izvede ra�unanje iz osnovnog skupa podataka. Umesto toga, ilustrujemo upotrebu ovog testa na podacima iz više grupa.

Ako uzmemo da je broj grupa koje se porede � , �� e U", tada log - rank statistika ima približno raspodelu velikih uzoraka sa � � � stepenom slobode. Prema tome, odluka o zna�ajnosti je doneta pomo�u �� tabela sa odgovaraju�im stepenima slobode.

Aproksimacija postoji i u slu�aju kada ima više od dve grupe. Približna formula, opisana ranije, koja obuhvata samo registrovane i o�ekivane vrednosti bez ra�unanja varijanse i kovarijanse, tako�e se može upotrebiti prilikom pore�enja više grupa. Ipak, prakti�no govore�i, upotreba ove približne formule nije potrebna dokle god je kompjuterski program u mogu�nosti da izra�una ta�nu log-rank statistiku.

Slede�im primerom ilustrujemo upotrebu log-rank statistike za pore�enje više od dve grupe. Dat je skup podataka koji predstavlja vremena pojavljivanja doga�aja izraženih u danima za 137 pacijenata veterana obolelih od kancera plu�a. Status preživljavanja je definisan preko status promenljive (kolona 11).

Primer Vreme pojavljivanja doga�aja u danima 5 # !ih

Vetran’s Administration Lung Cancer Trial Kolona 1: Standardni tretman = 1 , test tretman =2 Kolona 2: Tip �elije 1 ( ve�i = 1 , ostali = 0 ) Kolona 3: Tip �elije 2 ( adeno = 1 , ostali = 0 ) Kolona 4: Tip �elije 3 ( mali = 1 , ostali = 0 ) Kolona 5: Tip �elije 4 ( squamos = 1 , ostali = 0 ) Kolona 6: Vreme pojavljivanja doga�aja ( u danima ) Kolona 7: Prikaz stanja pacijenata ( najgori = 0 , ... , najbolji = 100 ) Kolona 8: Trajanje bolesti ( u mesecima ) Kolona 9: Starosno doba Kolona 10: Prioritetna terapija ( nijedna = 0 , neka = 1 ) Kolona 11: Status ( cenzurisani = 0 , preminuli = 1 )

Tabela 9 Me�u nabrojanim promenljivima, mi se fokusiramo na predstavljanje status pomenljive (kolona 7). Ova promenljiva je interval promenljiva, pa pre nego što dobijemo KM krive i log- rank test, treba kategorizovati ove promenljive. Ako za promenljivu koja prikazuje stanje pacijenta izaberemo kategorije: � � mf, j� � hk, hm � !��, dobijamo tri grupe obima: m/ m��i im, respektivno.

Page 21: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Primer Kategorije koje prikazuju stanje pacijenta

Grupa Kategorija Obim 1 � � mf m/ 2 j� � hk m� 3 hm � !�� im

Tabela 10 Upotrebom programa Statistika dobijamo deskriptivne informacije o ove tri KM krive, zajedno sa log-rank testom i Peto testom. Kako se porede tri grupe, � # i, broj sepeni slobode za log-rank statistiku je tada � � ! ili /. Kompjuterski izra�unata Log-rank statistika je /fQ !g!, koja ima + � vrednost nula datu na tri decimale. Prema tome, na osnovu Log-rank testa zaklju�ujemo da postoji zna�ajna razlika izme�u tri krive preživljavanja za predstavljene status grupe. Važno je primetiti, da je u ovom primeru i Peto-test veoma zna�ajan.

Page 22: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

7. PETO TEST Peto test su predložili Prentice i Marek kao alternativu za log - rank test.

U opisivanju razlike izme�u ova dva testa, podsetimo se da log - rank test koristi razliku sume registrovanih i o�ekivanih vrednosti � � � za svaku grupu, radi formiranja test statistike. Ova jednostavna suma daje istu težinu svakom vremenu pojavljivanja doga�aja kada kombinujemo registrovana minus o�ekivana preživljavanja u svakoj grupi.

�K_ � JO5Br����������������qX � �X # �;>X= � LX=<=

���������������������������������������������������������� # ���������&��� � # � � ����� �������*������

Nasuprot tome, Peto test ocenjuje razliku registrovanih i o�ekivanih vrednosti u vremenu = , pomo�u broja iz skupa rizika, 5= , svih grupa u vremenu =. Prema tome, umesto jednostavne sume, Peto test koristi težinsku

srednju vrednost razlike registrovanih i o�ekivanih vrednosti, što je prikazano ispod. +LK�LNr

L�X5O # 5= # G 5X=�Xu!

L�X5NBO�NJL`5=O�YJL`5KN # G 5=�>X=bLX="�=G 5==

Ove formule nisu kompjuterski zaista važne jer kompjuterski program može sve jednostavno da izra�una. Peto test statistika kao i Log - rank statistika ima približno veliki uzorak �/ raspodele sa � � ! stepenom slobode, gde je � broj krivih preživljavanja koje se upore�uju. Ipak, razli�ite formule koje smo opisali navode da Peto test isti�e informacije na po�etku krive preživljavanja, gde je broj iz skupa rizika veliki. Prema tome, raniji doga�aji dobijaju ve�u težinu (zna�aj) nego doga�aji na kraju krive preživljavanja. Obrnuto, Log - rank test isti�e doga�aje na kraju krive preživljavanja, gde broj osoba u skupu rizika opada tokom vremena, a jednaka težina je data svakom vremenu pojavljivanja doga�aja. Uprkos toj razlici izme�u Log - rank i Peto testa, Peto test nije obavezno konzervativan test, kada se poredi sa Log - rank testom, jer njegova numeri�ka vrednost može biti ili manja ili ve�a od Log - rank testa, u zavisnosti od podataka koji se analiziraju. Kada se bira izme�u Log - rank testa i Peto testa preporu�uje se upotreba Peto testa ako želimo da damo ve�i zna�aj prvom delu krive preživljavanja, gde se nalazi ve�i broj osoba iz skupa rizika. U suprotnom, treba korititi Log - rank test. Ovaj izbor naglašavanja ranijih vremena pojavljivanja doga�aja poti�e iz klini�kih odlika jedne

Page 23: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

studije. Raspravu o relativnim vrednostima ovih testova kao i njihovih alternativa opisali su Harris i Albert u radu “Survivorship Analysis for Clinical Studies”. Ilustujemo Peto test preko primera. U prvom primeru, za podatke remisije, gde se porede grupa od 12 blizanaca sa grupom od 12 bliznakinja, dobili smo Log - rank test ranije, a sada i Peto test. Oba testa su veoma zna�ajna, iako Peto test daje manju �/ vrednost u ovom primeru.

Primer

Peto & Peto Wilcoxon Test (uporedjivanje.sta) WW = 1.4373 Sum = 5.6860 Var = 1.4833

Test statistic = 1.180172 p = .023793

Sada posmatramo drugi primer, koji je opisan ranije, gde se posmatraju osobe obolele od kancera plu�a. Upore�ivanjem Log-rank testa i Peto testa, za tri grupe promeljivih koje prikazuju stanje pacijenata, dobijamo da je Peto statistika i/Q mmg, što je malo ve�e od Log-rank statistike koja iznosi /fQ !g!.

Page 24: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

8. PRIMER 1

U cilju utvr�ivanja efikasnosti hemoterapije nakon odstranjivanja raka plu�a hirurškim putem pacijenata obolelih od ove bolesti, posmatrane su dve grupe od po 12 pacijenata. Prva grupa pacijenata je primala

hemoterapiju neposredno nakon operacije, a druga grupa nije primala hemoterapiju. Negativnim doga�ajem smatramo ponovno pojavljivanje bolesti odnosno pojavu metastaze. Osnovni cilj nam je da utvrdimo da li su

vremena preživljavanja za ove dve grupe jednaka ili se razlikuju. U navedenoj tabeli su data vremena preživljavanja po grupama:

+ozna�ava cenzurisanje�

Primetimo da u drugoj grupi nema cenzurisanih pacijenata, tj. da se svakom od 12 pacijenata iz date grupe pojavila metastaza. Ova informacija nam je od zna�aja prilikom izra�unavanja ocenjenih verovatno�a preživljavanja potrebnih za nalaženje Kaplan- Meier- ovih krivih. Podsetimo se da se u slu�aju kada nema cenzurisanja date verovatno�e izra�unavaju prema formuli:

��;��< # ���������������������� ¡¢ ��� �gde je n veli�ina uzorka.

Dobijene podatke najpre predstavimo pomo�u tabela:

Prva grupa:

Broj osobe Vreme

pojavljivanja

� X

1. 7 0 1

2. 8 1 1

3. 9 1 1

4. 11 0 1

5. 12 0 1

6. 13 1 1

7. 14 0 1

8. 15 1 1

9. 16 0 1

10 . 17 1 1

11. 20 1 1

12. 24 1 1

Prva grupa- primali hemoterapija Druga grupa- nisu primali

hemoterapiju

8 , 9 , 13 , 15 , 17 , 20 , 24, 1 , 2 , 3 , 4 , 5 , 7 , 10 , 11 , 12 , 14 , 16

, 18

7+ , 11+ , 12+ , 14+ , 16+

Page 25: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

4��'�'���5�

Broj osobe Vreme

pojavljivanja

� X

1. 1 1 2

2. 2 1 2

3. 3 1 2

4. 4 1 2

5. 5 1 2

6. 7 1 2

7. 10 1 2

8. 11 1 2

9. 12 1 2

10 . 14 1 2

11. 16 1 2

12. 18 1 2

A zatim pomo�u tabela sa podacima neophodnih za nalaženje Kaplan- Meier- ovih krivih:

Prva grupa:

��� ��� ��� ������ �� )W;=<�*� *� ��

���-����������

������������6*���� ��

#� �� *����-����������

������������6#����

�71A118�*�,��

,� �� �� �� �*� *�,�7£

1A�8�*�#����� �� �� �� +� *�#�7

¤¥�8*�+�

�%� �� �� �� %� *�+7vw�8*�%��

�+� �� *� � �� *�%�7�¦�8*��+�

�*� �� *� � �� *��+71��8*��#+�

��� �� *� � �� *��#+7A18�*�

4��'�'���5�

Page 26: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

��� ��� ��� ������ �� )W;=<��� *� *�

���-����������

������������6*���� ��

�� �� *����-����������

������������6�����

111�8�*�,��

�� �� *� �� ���1A1�8�*�#��

�� �� *� �� �*�£

1�8�*�+%��� �� *� �� ,�

§1�8�*����

�� �� *� � #�¥

1�8�*�%#��� �� *� � +�

¤1�8�*�%�

��� �� *� � ��w

1�8�*������� �� *� � %�

v1�8�*����

��� �� *� � ��¦

1�8�*��%���� �� *� � ��

�1�8�*��+�

�� �� *� � ��1

1�8�*�*#���� �� *� � �� *�

Na osnovu dobijenih podataka mozemo na�i prose�na vremena preživljavanja i prose�ne stope rizika prema ranije pomenutim formulama:

DE # G ¨©ª©H«6 i 'E # ¬­®7�6¯°±4¯²³

G ¨©ª©H«

Za podatke iz tabele:

DE1 # �VQSV , 'E1 # $Q$lU� DE� # SQnSV , 'E� # $Q��Pn�.

Vidimo da je prose�no vreme preživljavanja prve grupe ve�e nego prose�no vreme preživljavanja druge grupe, kao da je i prose�na stopa rizika za prvu grupu manja. I Kaplan- Meier- ove krive govore u prilog tome da je vreme preživljavanja prve grupe ve�e nego vreme preživljavanja druge grupe, tj. da hemoterapija pozitivno uti�e na izle�enje bolesti u smislu produženja vremena u kom su pacijenti zdravi.

Kaplan- Meier- ove krive preživljavanja su za obe grupe prikazane na slede�em grafiku:

Page 27: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Cumulative Proportion Surviving (Kaplan-Meier)

Complete Censored

Group 1. Group 2.

0 5 10 15 20 25 30

Time

-0.2

0.0

0.2

0.4

0.6

0.8

1.0

Cu

mu

lativ

e P

rop

ort

ion

Su

rviv

ing

Testirajmo sada hipotezu H0 (krive preživljavanja se ne razlikuju) protiv alternativne hipoteze H1 (krive preživljavanja se razlikuju) najpre pomo�u log- rank statistike koja ima hi- kvadrat raspodelu sa jednim stepenom slobode. Prikažimo najpre podatke tabelarno kako bismo sra�unali neophodne delove:

Podaci za obe grupe:

��� ��� ���� �� ��� ��� ���� �� ���� ��� �����

�� *� �� ��� ��� �UUl�

�UUl� � �U

Ul��UUl�

�� *� �� ��� ��� �UUV�

��UV�

�� �U

UV��UUV�

�� *� �� ��� �*� �UUU�

�$UU�

�� �U

UU��UUU�

�� *� �� ��� ,� �UU��

TU�� � �U

U���UU��

%� *� �� ��� #� �UU$�

SU$� � �U

U$��

�UU$�

+� *� �� ��� +� �U�T�

R�T� � �U

�T��U�T�

#� �� *� ��� �� ���R�

P�R�

P�R� � P

�R�,� �� *� �*� �� �$

�P�P

�P�P

�P� � P�P�

�*� *� �� ,� �� T�n�

P�n� � T

�n�T

�n���� *� �� ,� %� T

�l�n

�l� � T�l�

T�l�

Page 28: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

��� *� �� #� �� S�U�

l�U� � S

�U�S

�U���� �� *� +� �� R

�$�V

�$�V

�$� � V�$�

��� *� �� �� �� PT�

VT� � P

T�PT�

�%� �� *� %� �� nR�

UR�

UR� � U

R���� *� �� �� �� l

P�UP� � l

P�lP�

�+� �� *� �� �� Vl�

�l�

�l� � �

l��#� *� �� �� �� U

V��V� � U

V�UV�

�*� �� *� �� *� �� *� *� *�

��� �� *� �� *� �� *� *� *�

����� � � � � � � !%�+��� %�+���

Iz tabele vidimo da je O1- E1 = -5.716. Na osnovu formule za ocenu varijanse dobijamo da je var (O1- E1)=

3.8878, te je kona�no registrovana vrednost log- rank statistike jednaka ZK_ � JO5B # �bmQh!j"´/iQgghg � # �gQ k�ig�

Iz tablica za hi- kvadrat raspodelu sa jednim stepenom slobode nalazimo da je dogovaraju�a p- vrednost približno jednaka 0.0025 odakle vidimo da se nulta hipoteza odbacuje (p< 0.05), tj. prihvata se alternativna tj. da krive preživljavanja na nivou zna�ajnosti od 95% nisu iste.

Statistica daje slede�i rezultat:

Log-Rank Test WW = -5.716 Sum = 15.772 Var = 4.1145 Test statistic = -2.81797 p = .00483

I na osnovu p- vrednosti dobijene u njoj vidimo da se nulta hipoteza odbacuje.

Peto test daje slede�e rezultate:

Peto & Peto Wilcoxon Test WW = -4.000 Sum = 7.5031 Var = 1.9573 Test statistic = -2.85913 p = .00425 I on isto odbacuje nultu hipotezu.

Ako uvedemo i trecu grupu pacijenata od 12 koji su primali terapiju zra�enja nakon operacije. Neka su vremena pojavljivanja data u tabeli

Page 29: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Prva grupa

(hemoterapija)

Druga grupa

(nikakva terapija)

Tre�a grupa

(zra�enje)

8 , 9 , 13 , 15 , 17 ,

20 , 24,

1 , 2 , 3 , 4 , 5 , 7 ,

10 , 11 , 12 ,

7 , 7 , 10 , 11 , 11 ,

12 , 13

7+ , 11+ , 12+ , 14+

, 16+

14 , 16 , 18 8+ , 8+, 9+, 10+,

10+

Na�imo najpre krive preživljavanja a zatim testirajmo pomo�u programskog paketa Statistica da li se krive preživljavanja razlikuju.

Kaplan Meier- ove krive izgledaju:

Cumulative Proportion Surviving (Kaplan-Meier)Complete Censored

Group 1 Group 2 Group 3

0 5 10 15 20 25 30

Time

-0.2

0.0

0.2

0.4

0.6

0.8

1.0

Cum

ulat

ive

Pro

port

ion

Sur

vivi

ng

Sa grafika vidimo da je vreme preživljavanja pacijenata koji su primili hemoterapiju (prva grupa) najve�e, pa vreme preživljavanja pacijenata koji su išli na zra�enje (tre�a grupa) i da je vreme preživljavanja pacijenata koji nakon operacije nisu primali nikakvu terapiju (druga grupa).

Page 30: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ������� �

9. KOKSOV PH MODEL

Posebno mesto u klasi statisti�kih modela preživljavanja imaju modeli sa proporcionalnim rizikom. Modele preživljavanja analiziramo posmatraju�i dve fundamentalne stavke, a to su osnovna funkcija rizika koja opisuje kako se menja rizik tokom vremena i efekat parametara koji opisuju kako rizik varira u odnosu na nezavisne promenljive. Dejvid Koks je uocio da ukoliko pretpostavimo da je rizik proporcionalan mogu�e je oceniti efekat parametara bez odre�ivanja same funkcionalne forme rizika. Ovaj pristup analizi podataka preživljavanja se zove primena Koksovog modela sa proporionalnim rizikom li skra�eno Koksov model ili Model sa proporcionalnim rizikom.

Koksova prou�avanja iz 1972 godine promenila su pristup standardnoj parametarskoj analizi preživljavanja i proširila metode nepapametarskih Kaplan Mejerovih ocena na argumente oblika regresije za analizu životnih tablica. Koks je unapredio predvi�anje vremena preživljavanja pojedinanca bez pretpostavki o osnovnoj fukicji rizika pojedinaca ali pretpostavljajuci da funkcija rizika razli�itih subjekata ostaje proprocionalna i konstantna tokom vremena.

Mi cemo pristupiti prou�avanju ovog popularnog matemati�kog modela na slede�i na�in. U desetom poglavlju kroz primer i kompjuterske rezultate obrade podataka pokuša�emo da do�aramo sam model bez direktnog uvo�enja same forme modela. U poglavlju 11 uvodimo formulu modela dok u dvanaestom objasnjavamo razloge zbog kojih je model atraktivan istražva�ima. Poglavlje 13 posve�eno je ocenjivanju parametara modela. Fokus u poglavljima 14, 15 i 16 je na hazard koli�niku i krivama preživljavanja. Posle teorijskog razmatranja rad završavamo sa implementacijom u paketu Statistica 10.

Page 31: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

10. KOMPJUTERSKA UPOTREBA KOKSOVOG PH MODELA

Pri�u o Koks-om modelu zapo�injemo na neuobi�ajen na�in, bez uvo�enja same forme modela, koriste�i kompjuterske rezultate dobijene iz analize remisije vremenskih podataka za slede�i problem. Posmatramo problem �iji skup podataka, prikazan u tabeli, uklju�uje dve grupe pacijenata koji boluju od leukemije. Svaka grupa broji po 21 pacijenta. Grupe su stratifikovane prema tome da li su se pacijenti podvrgli medicinskom tretmanu (tretman grupa-grupa 1), ili takozvanim tobožnjim lekovima (placebo grupa-grupa 2). Takodje, skup podataka sadrži i promenljivu logWBC, (broj belih krvnih zrnaca pacijenata) koja je jedan od najboljih prognosti�kih indikatora preživljavanja za pacijente koji boluju od leukemije.

Podaci o remisiji leukemije Tretman grupa �� # U�" Placebo grupa �� # U�"

Vreme (u nedeljama)

*��µ¶· Vreme (u

nedeljama) *��µ¶·

P� UQV�� �� UQS$�P� lQ$P� �� nQ$$�P� VQUS� U� lQT��R� lQlV� U� lQlS�

�$� UQTP� V� lQ$���V� UQSS� l� lQVP��P� VQP$� l� UQlU�UU� UQVU� n� VQlT�UV� UQnR� n� VQTR�

P �� VQU$� S� VQnU�T �� UQS$� S� VQ$n�

�$ �� UQR$� S� UQVU��� �� UQP$� S� VQUP��R �� UQ�P� ��� VQlT��T �� UQ$n� ��� UQ�U�U$ �� UQ$�� �U� �Qn$�Un �� �QRS� �U� VQ$P�VU �� UQU$� �n� UQV$�VU �� UQnV� �R� UQTn�Vl �� �QlR� UU� UQRV�Vn �� �Qln� UV� �QTR�

+ ozna�ava cenzurisano posmatranje

Osnovno pitanje koje nas interesuje se odnosi na upore�ivanje iskustava preživljavanja ove dve grupe pacijenata prilago�avanjem nekom mogu�em ometanju i/ili efektima interakcije promenljive *��µ¶·.

Promenljive u našem modelu su:

D- vreme (izraženo u nedeljama) do izlaska iz remisije,

Page 32: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

31- status grupe (�) 3� # *��µ¶·�.

Dakle, razmatramo problem koji uklju�uje dve nezavisne promenljive kao predskaziva�e vremena preživljavanja T. Ukoliko želimo da ocenimo mogu�i efekat interakcije promenljive *��µ¶· na status grupe, onda posmatramo još jednu promenljivu:

3¦ # 31 c 3�

Postoji nekoliko programskih paketa pomo�u kojih se mogu uraditi analize preživljavanja ovih grupa koriste�i Koks-ov model i to su: SPIDA, SAS I BMDP. Mi �emo u našem posmatranju koristiti rezultate dobijene pomo�u programskog paketa SPIDA.

Analizira�emo tri modela koji imaju isti skup podataka za ova 42 subjekta, istom zavisnom promenljivom ali su nezavisne promenljive razli�ite za svaki model. Tako model 1 sadrži samo promenljivu koja ozna�ava da li je subjekat u tretman ili placebo grupi, model 2 sadrži dve promenljive: status grupe i logWBC, a tre�i model pored ove dve sadrži i promenljivu datu kao proizvod statusa grupe i logWBC, a ozna�ava delovanje logWBC na status grupe.

U slede�oj tabeli su dati rezultati obrade sva tri modela pomo�u koji �emo izra�unati mogu�i efekat tretman statusa, prilago�enog potencijalnom ometanju i interakcijske efekte promjenjive

Model 1: Promenljive koeficijenti standardna

greška p-vrednost HR

Rx 1.509 0.410 0 4.523 n:42 %Cen:28.571 -2logL:172.759

Model 2: Promenljive koeficijenti standardna

greška p-vrednost HR

Rx 1.294 0.422 0.002 3.648 logWBC 1.604 0.329 0.000 4.975

n:42 %Cen:28.571 -2logL:144.559

Model 3: Promenljive koeficijenti standardna

greška p-vrednost HR

Rx 2.355 1.681 0.161 10.537 log WBC 1.803 0.447 0.000 6.067

Rx×logWBC -0.342 0.520 0.510 0.710 n:42 %Cen:28.571 -2logL:144.131

Page 33: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Za svaki od modela predstavili smo prvih pet kolona iz rezultata koje daje SPIDA. Prva kolona prikazuje promenljive koje u�esvuju u modelu, u drugoj koloni su prikazani odgovaraju�i koeficijenti regresije za svaku od promenljivih u modelu, u tre�oj su standardne greške koeficijenata regresije, u �etvrtoj p-vrednosti za testiranje zna�ajnosti svakog koeficijenta i kona�no u petoj koloni koja je ozna�ena sa HR dat je hazard koli�nik za efekat svake promenljive uskladjene sa ostalim promenljivim u modelu. Ako se izuzme poslednja kolona analiziranje rezultata Koks-ovog modela je analogno analiziranju modela linearne regresije.

Analizirajmo prvo rezultate kompjuterske obrade dobijene za model 3.

Promenljive koeficijenti standardna greška

p-vrednost HR

Rx 2.355 1.681 0.161 10.537 log WBC 1.803 0.447 0.000 6.067

Rx×logWBC -0.342 0.520 0.510 0.710 n:42 %Cen:28.571 -2logL:144.131

Za dobijanje ocena koeficijenata u ovom modelu se koristi metoda maksimalne verodostojnosti.

Cilj nam je da ispitamo da li je efekat promenljive koja predstavlja interakciju zna�ajan. U ocenama metode maksimalne verodostojnosti naj�eš�e se koriste slede�a dva testa, a to su Wald test i Test koli�nika verodostojnosti.

Wald test

Ako ocenu koeficijenta koji odgovara promenljivoj koja ozna�ava interakciju :¸ c *��µ¶· ozna�imo sa ¹p a odgovaraju�u grešku sa �ºW testiranje izvršavamo na slede�i na�in.

Testiramo nultu hipotezu da koeficijent interakcije nije zna�ajan �A�¹ # $" protiv alternativne da je koeficijent zna�ajan �»�¹ ¼ $". Test statistika koju koristimo je

½ # ¹p�ºW

Re� je o Z promenjivoj, odnosno promenljivoj koja ima standardizovanu normalnu raspodelu. Registrovana vrednost test statistike se dakle dobija kao koli�nik ocene koeficijenta -0.342 i njegove standardne greške 0.520, što iznosi -0.66. Ostaje da izra�unamo p-vrednost

� # �¾¿À½ , �­¯Á # �¾¿Ã½ , �$QPPÄ # $Qn�$

Za nivo poverenja Å odluka se donosi na slede�i na�in:

• Ako je � Æ Å, �A se odbacuje; • Ako je � e Å, �A se ne odbacuje.

Za Å # nÇ sledi da se �A ne odbacuje, odnosno da efekat interakcije nije zna�ajan.

Page 34: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Test koli�nika verodostojnosti ili LR test

Test koli�nik verodostojnosti ili LR test uzima u obzir vrednost logaritma funkcije verodostojnosti. Ona je data izrazom �U*��È i njena vrednost za model 3 je 144.131.

Da bi izvršili ovaj test moramo da pogledamo i rezultate kompjuterske obrade za model 2 koji sadrži dve promenljive. Promenljiva od interesa je :É i ona ozna�ava status postupka. Druga promenljiva je *��µ¶· i ona �e biti razmatrana kao eventualni ometa�. Naš cilj je da opišemo efekat statusa postupka prilago�enog za *��µ¶·.

promenljive koeficijenti

standardna greška

p-vrednost HR

:� ���,�� *����� *�**�� ����#�

*���µ¶·� ���*�� *���,� *�***� ��,+%�

�r lU� 9:��#�%+�� ��� �����������

Odavde vidimo da je vrednost logaritma verodostojnosti za model 2 data sa �U*��È # �llQnnT. Ovu vrednost zajedno sa �U*��È vrednosti iz modela 3 koristimo za dobijanje LR statistike za testiranje zna�aja interakcijskog izraza u modelu 3:

�A��� ��������������&� ���*&�V"�����»���������������������&� ���*&"�Test statistika je

È:�������������&� ���*&�V" # �U*�� Èʮ˯Ì�Èʮ˯̦ # �U�*��Èʮ˯Ì� � *��Èʮ˯̦"r ��1�

Ova test statistika ima 2χ raspodjelu sa jednim stepenom slobode sa nultom hipotezom da interakcijski efekat

ne postoji.

Registrovana vrednost test statistike je

�U�*��Èʮ˯Ì� � *��Èʮ˯̦" # �llQnnT � �llQ�V� # $QlUS

P vrednost za ovaj test je u intervalu (0.40, 0.50), što pokazuje da ne postoji zna�ajna interakcija.

Kako je za Wald test je p-vrednost 0.510, što zna�i da p-vrednosti za Waldov i LR test nisu iste ali nas dovode do istih zaklju�aka. Zbog boljih statisti�kih osobina �eš�e se koristi LR test.

Pošto smo zaklju�ili da je zna�aj interakcijskog dejstva zanemarljiv za analizu �emo uzeti model 2.

Page 35: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Promenljive Koeficijenti standardna greška

p-vrednost HR

:¸� !Q /fk� $QlUU� �Q ��/� iQ jkg�*��µ¶·� �QP$l� $QVUT� $Q$$$� lQTRn�

�r lU� Ç·��USQnR�� �U*��Èr �llQnnT�

Prilikom razmatranja ovog problema postoje tri statisti�ka cilja koja treba ispuniti:

1. izvršiti test za zna�ajnost promenljive za status tretmana prilago�enog za logWBC,

2. oceniti efekta statusa tretmana prilago�enog za logWBC

3. odrediti interval poverenja za ovaj efekat.

Ove tri bitne vrednosti još uvek možemo dobiti koriste�i rezultate kompjuterske obrade, bez uvo�enja eksplicitne Koks-ove formule.

Iz tabele se vidi da je test za zna�aj efekta tretmana, p-vrednost dobijena Wald statistikom 0.002, što je veoma zna�ajno.

Bitna ocena efekta tretmana je data u HR koloni sa 3.648. Ova vrednost daje ocenjeni hazard koli�nik (HR) za efekat tretmana, a ra�una se kao �1Q�£v # VQPlSQ Za pojam hazard koli�nika vezuje se interval poverenja. Da bismo opisali interval poverenja, koristimo proširenu tabelu kompjuterski dobijenih rezultata za model 2.

Model 2:

Kolona koeficijenti standardna greška

p-vrijednost

HR 0.95 CI P(PH)

Rx 1.294 0.422 0.002 3.648 1.505 8.343

0.944

logWBC 1.604 0.329 0.000 4.975 2.609 9.486 0.917 n:42 %Cen:28.571 -2logL:144.559

Odavde se vidi da se 95% interval poverenja nalazi izme�u 1.505-8.343. Ovo je interval poverenja za hazard koli�nik i on je ustvari okolina od ranije opisane bitne ocene 3.648. Vidimo da je interval poverenja prili�no širok, što ukazuje na to da je ocena prili�no nepouzdana. Zbog niske p-vrednosti od 0.002, interval poverenja za hazard koli�nik ne sadrži 1 kao po�etnu vrijednost.

Kako ra�unamo interval poverenja ako nam programski paket ne pruža odmah informaciju?

Page 36: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Prvo ra�unamo 95% intervala povjerenja za koeficijent regresije promenljive :É (¹1), a to je

�QUTl� Í �QTP c $QlUU,

gde je 1.96 kvantil, 97.5% normalne ili Z raspodjele. 95% intervala povjerenja za hazard koli�nik (HR) je

�1Q�£v�Í1Q£¤cAQv��

Programski paket SPIDA obezbe�uje traženi interval poverenja direktno, a ostali paketi obezbe�uju samo koeficijente regresije i njihove standardne greške.

Ostalo je još da analiziramo model 1. U odnosu na modele 2 i 3, model 1 sadrži samo jednu promenljivu koja ozna�ava status postupka i zbog toga se on �esto naziva “grub“ model jer ignoriše efekat potencijalne promenljive od interesa kao što je logWBC.

Zbog toga se on naj�eš�e koristi za neka upore�ivanja.

Model 1: Promenljive Koeficijenti Standardna

greška p-vrijednost HR

Rx 1.509 0.410 0 4.523 (grub model) n:42 %Cen:28.571 -2logL:172.579 Model 2: Promenljive Koeficijenti Standardna

greška p-vrijednost HR

Rx 1.294 0.422 0.002 3.648 logWBC 1.604 0.329 0.000 4.975 n:42 %Cen:28.571 -2logL:144.559

Model 1 može biti iskorišten da u pore�enju sa modelom 2 izra�unamo potencijalni efekat ometanja promjenjive logWBC.

Primetimo da je vrednost u HR koloni za promenljivu koja ozna�ava status postupka 4.523 za model 1 i 3.648 za model 2. Prema tome grubi model ima ocenjeni hazard koli�nik koji je nešto viši nego odgovaraju�i koji je

Page 37: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

dobijen kada prilagodimo logWBC. Ako su grube i prilago�ene ocene zna�ajno razli�ite možemo re�i da imamo ometanje usled logWBC. Kada jednom uo�imo da postoji ometanje mi moramo kontrolisati ometa�a-u našem slu�aju je to logWBC-da bi smo dobili validne ocjene efekta. Iz tog razloga koristimo model 2 koji kontroliše logWBC, a ne model 1.

�ak iako ne postoji zna�ajno ometanje, mi ipak želimo kontrolisati logWBC da bi dobili, što precizniju ocjenu hazard koli�nika. Tako, ako je interval povjerenja za hazard koli�nik uži kod modela 2 nego kod modela 1, koristimo model 2 da bi postigli precizniju ocjenu.

Posle analize sva tri modela možemo zaklju�iti da je najbolji model 2 i da koriste�i model 2 dobijamo statisti�ki zna�ajan hazard koli�nik od 3.648 za efekat postupka sa intervalom poverenja koji se kre�e izme�u 1.5 i 8.3.

Sve ove zaklju�ke do sada smo izveli bez korištenja Koksove formule, a analize koje smo uradili su vrlo sli�ne analiziranju logisti�kog regresionog modela i klasi�ne linearne regresije.

Spomenimo još i krive preživljavanja za ovaj model.

Prilago�ene krive preživljavanja za logWBC (model 2):

Kriva za svaku od grupa prilago�enu za efekat od logWBC je bazirana na rezultatima kompjuterske obrade za model 2. Naro�ito je bitno da se uporede obe krive u periodu posmatranja. Upore�ivanjem krivih vidimo da grupa pacijenata koji su na tretmanu ima ve�u verovatno�u preživljavanja od placebo grupe nakon prilago�avanja za logWBC. Razlika izmedju krivih se pove�ava kako vrijeme odmi�e.

Bitno je još napomenuti da se ove krive matemati�ki razlikuju od Kaplan-Mejerovih krivih. Kaplan-Mejerove krive nisu prilago�ene promenljivima pa se i ne dobijaju korištenjem rezultata prilago�enog Koksovog PH modela,ali su ipak sli�ne ovim krivama.

Page 38: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Još jedan podatak koji obezbe�uju programski paketi koji koriste Koksov model je P(PH) vrednost. Ova vrednost nam omogu�ava da uo�imo da li je zadovoljena pretpostavka o proporcionalnom hazardu tj da li je ispunjena PH pretpostavka.

Model 2:

Kolona P(PH) Rx 0.944 logWBC 0.917

P-vrijednost, recimo ve�a od 0.10 pokazuje da je PH pretpostavka zadovoljena, a mala p-vrijednost, recimo manja od 0.05 pokazuje da testirana promenjiva ne zadovoljava ovu pretpostavku.

Kompjuterski dobijena vrednost P(PH) za model 2, za obe promenjive, pokazuje da je PH pretpostavka zadovoljena u oba slu�aja.

Page 39: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

11. FORMA KOKSOVOG MODELA

Koksov PH model se obi�no zapisuje u obliku slede�e formule:

'�� 3" # 'A��"�G ºÎÏÎÐÎH« ���3 # �31 Ñ 34" Koksov model nam daje izraz za rizik u vremenu t subjekta sa skupom nezavisnih promenljivih X. X predstavlja kolekciju ( “vektor“) nezavisnih promenivih koje su modelirane da predvide pojedina�an rizik. Odmah uo�avamo da je rizik u trenutku t proizvod dve veli�ine. Prva od tih veli�ina 'A��" predstavlja funkciju osnovnog rizika. Druga veli�ina je eksponencijalni izraz. Bitno svojstvo formule, a ti�e se PH pretpostvke (pretpostavke o proporcionalnom riziku), je to da je osnovni rizik funkcija od t, ali ona ne uklju�uje X-eve. Suprotno tome, eksponencijalni izraz uklju�uje X-eve ali ne uklju�uje t. Ovakve promenljive se nazivaju još i vremenski-nezavisni X-evi.

Mogu�e je, ipak, razmatrati i vremenski-zavisne promenljive. I u tom slu�aju Koksov model je i dalje mogu�e koristiti samo što takav model ne zadovoljava PH pretpostavku i tada govorimo o proširenom Koksovom modelu.

U ovom radu bavi�emo se isklju�ivo sa vremenski-nezavisnim X-evima.

Vremenski-nezavisna promenljiva je definisana kao promenljiva �ija se vrednost za datog subjekta ne menja kroz vreme. Primeri takvih promenjivih su pol i puša�ki status. Iako se puša�ki status može menjati kroz vrijeme, za ciljeve naše analize je uzeto da se jednom utvr�en status ne�e menjati.

Tako�e prime�ujemo da se promenljive kao što su starosna dob i težina menjaju kroz vreme, ali može biti veoma zgodno tretirati takve promenljive kao vremenski-nezavisne, ukoliko se njihova vrednost ne menja drasti�no kroz vreme ili ako efekat takvih promenljivih na rizik preživljavanja u biti zavisi od jednom utvr�ene vrednosti tih promenjivih.

Koksova formula ima osobinu da ukoliko su sve nezavisne promenljive jednake nuli, da se ona svodi na funkciju osnovnog rizika, jer je �A # �.

31 Ñ 34 # $ Ò �'�� 3" # 'A��"�G ºÎÏÎÐÎH« # 'A��"�A # 'A��".

Ova osobina Koksovog modela jeste i razlog zašto je 'A��" zove osnovna funkcija.

Druga�ije re�eno Koksov model se svodi na funkciju 'A��" osnovnog rizika kada u modelu nema nezavisnih promenljivih. Tako, može biti smatrana kao osnovna verzija hazard funkcije pre uklju�ivanja i razmatranja nezavisnih promenljivih.

Druga važna osobina Koksovog modela je ta da je osnovna funkcija, 'A��" neodre�ena funkcija. Ova osobina �ini Koks-ov model neparametarskim modelom.

Nasuprot tome, parametarski model, je onaj �ija je funkcionalna forma potpuno odre�ena, osim vrednosti nepoznatih parametara. Jedan od najpoznatijih parametarskih modela je Veilbulov hazard model:

Page 40: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ������� �

'�� 3" # Ó�Ôb1�G ºÎÏÎÐÎH« �gde su nepoznati parametri su �, i ¹�. Posmatraju�i ovaj model prime�ujemo da je 'A��" dato sa�Ó�Ôb1.

Page 41: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

12. ZAŠTO JE KOKSOV MODEL POPULARAN?

Klju�ni razlog za popularnost Koksovog modela leži u cinjenici da iako je funkcija osnovnog rizika neodre�ena, dobre ocene koeficijenata regresije, hazard koli�nici i prilago�ene krive preživljavanja se mogu izvesti za širok spektar podataka. Drugim re�ima, Koksov model je “�vrst“ model. Rezultati dobijeni upotrebom Koksovog modela su veoma približni rezultatima ta�nog parametarskog modela. Na primer, ako je Veibulov model ispravan parametarski model, onda koriš�enjem Koksovog modela dobijamo rezultate približne onim koji su dobijeni koriš�enjem Veibulovog modela.

U principu, uvek koristimo parametarski model ukoliko smo sigurni u pravilnost modela. Postoje razli�ite metode da za procenu prednost koriš�enja parametarskog modela, ali nikada ne možemo biti potpuno sigurni da je dati parametarski model prikladan. Baš iz tog razloga što �esto dolazimo u nedoumicu, biramo Koksov model jer on daje dovoljno pouzdane rezultate i možemo ga smatrati sigurnim izborom.

Generalno gledano “�vrstina“ Koksovog modela i njegov specifi�an oblik je atraktivan iz nekoliko razloga.

Kao što znamo formula za Koksov model je proizvod osnovne hazard funkcije koja sadrži t i eksponencijalnog izraza koji sadrži X-ove a ne sadrži t. Eksponencijalni deo ove formule je privla�an jer obezbe�uje nenegativne ocene prilago�enog modela. Pošto se po definiciji vrednost bilo koje funkcije rizika mora kretati izme�u $ i �Õ želimo da i drugi deo formule bude nenegativan. Ukoliko bi umesto eksponencijalnog dela imali linearnu funkciju po X, mogli bi dobiti negativne ocjene rizika što nije dozvoljeno.

Još jedna bitna osobina Koksovog modela je to što iako funkcija osnovnog rizika nije odre�ena možemo oceniti ¹ parametre u eksponencijalnom delu modela, koji su nam kako �emo kasnije videti, potrebni da bi procenili efekat promenljivih od interesa. Mera efekta, koja se zove hazard koli�nik, se tako�e ra�una bez ocene osnovne hazard funkcije.

Primetimo da hazard funkcija '�� ." i odgovaraju�a kriva preživljavanja o�� ." mogu biti ocenjene za Koksov model �ak iako osnovna hazard funkcija nije odre�ena. To zna�i da sa Koksovim modelom, uz minimum pretpostavki možemo dobiti primarne informacije iz analize preživljavanja a to su hazard koli�nik i kriva preživljavanja.

Još jedna bitna cinjenica zbog koje je Koksov model popularan je upravo to što on ima prioritet nad logisti�kim modelom kad imamo informaciju o vremenu preživljavanja i kada postoje cenzurisanja. Koksov model koristi više informacija - vreme preživljavanja- nego logisti�ki model, koji razmatra samo opcije �$ �" i ignoriše vreme preživljavanja i cenzurisanje.

Page 42: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

13. OCENJIVANJE PARAMETARA KOKSOVOG MODELA

U ovom poglavlju opisa�emo postupak za dobijanje ocena parametara Koksovog modela. Kao što znamo formula za Koksov model ima oblik:

'�� 3" # 'A��"�G ºÎÏÎÐÎH«

a parametri koje ocenjujemo su koeficijenti ¹� . Odgovaraju�e ocene ovih parametara zovu se ocene maksimalne verodostojnosti i ozna�avamo ih sa ¹ÖW .

Još jednom �emo pogledati rezultate kompjuterske obrade za model 2 i na tom primeru objasniti izvo�enje ovih ocena.

Model 2: Promenljive Koeficijenti standardna

greška p-vrijednost HR

Rx 1.294 0.422 0.002 3.648 logWBC 1.604 0.329 0.000 4.975

n:42 %Cen28.571 -2logL:144.559

Koksov model za ovaj primer uklju�uje dva parametra, jedan koji je koeficijent promenljive koja ozna�ava status grupe (:É) a drugi je koeficijent uz promenjivu *��µ¶·. Dakle, model je:

'�� 3" # 'A��"�º«×É8ºØÌ®ÁÙÚÛ.

Koristimo ocene koeficijenata iz tabele i dobijamo ocenjeni model

'��� 3" # 'AÜ��"�1Q�£v×É81Q¤AvÌ®ÁÙÚÛ.

Kao i kod logisti�ke regresije, ocene parametara metodom maksimalne verodostojnosti za Koksov model dobijaju se maksimiziranjem funkcije verodostojnosti koja se obi�no ozna�ava sa L ili L() gde ozna�ava skup nepoznatih parametara.

Matemati�ki izraz za ovu formulu je veoma komplikovan, a kako je sama formula ugra�ena u kompjuterski program, na�in dobijanja MV ocena ne može videti.

Funkcija verodostojnosti za Koksov model se �esto naziva i parcijalna funkcija verodostojnosti jer ona razmatra samo verovatno�e za one subjekte kod kojih se desio doga�aj i ne razmatra verovatno�e za subjekte koji su cenzurisani.

Takva parcijalna funkcija verodostojnosti se može zapisati kao proizvod nekoliko funkcija verodostojnosti, jedna za svaki od recimo k neuspeha:

Page 43: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

È # È1 c Ñ c ÈC # s È7C

7u1

Indeksi od � Q Q Q � ozna�avaju intervale u kojima se desio doga�aj. Tako je È7 funkcija verodostojnosti za j-to

vreme neuspeha, a subjekti kod kojih postoji rizik da se desi doga�aj u vremenu �� �ine grupu rizika i ozna�avaju sa :���7"". Jasno, skup - grupa rizika se smanjuje kako se vreme pove�ava.

Ve� smo rekli da funkcija verodostojnosti ne razmatra cenzurisane subjekte, ali ako je subjekat cenzurisan nakon vremena �, onda je on deo grupe rizika koju koristimo za ra�unanje È7.

Dakle ako imamo � intervala neuspeha ��1" ~ ���" ~ Ñ ~ ��C", tako da se ta�no jedan neuspeh desi u svakom

���" � # � Ñ �. Sa Ý�Þ ozna�imo subjekta kome se desio doga�aj u intervalu ���". Koksova funkija verodostojosti

je tada data sa:

È # s �G ºÎÏÝÎÞ©ÐÎH«G �ºÎÏßÎÌ�×�¨�©""

C

7u1

Nakon formiranja funkcije verodostojnosti za dati model, sledi maksimiziranje te funkcije. Maksimiziranje vršimo izjedna�avanjem parcijalnih izvoda funkcije L po svakom parametru u modelu sa 0. Tako dobijamo sistem jedna�ina oblika:

àÈà¹� # $ � # � Ñ �

Sistem se rešava iterativnim postupkom, gde se na po�etku uzima neka pretpostavljena (naga�ana) vrednost i onda se postepeno modifikuje dok se ne dobije kona�no rješenje.

Da sumiramo: ocene koeficijenata Koksovog modela dobijamo izvršavanjem slede�ih koraka:

• formirati È�¹"

• max�È�¹" ili max�*�È�¹"

• rešiti sistem áâ

áºÎ # $ � # � Ñ �

Rešenje se dobija iteracijom, po�inje pretpostavljanjem vrednosti rešenja i onda se ta vrednost sukcesivno modifikuje dok se ne dobije rešenje.

Page 44: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

14. HAZARD (RIZIK) KOLI�NIK

Hazard koli�nik se definiše kao koli�nik rizika dva subjekta. Individualci koji se porede se razlikuju po vrednostima nezavisnih promenljivih koje ih karakterišu.

Ocenu koli�nika rizika možemo stoga zapisati kao:

�:Ü # '��� 3ã"'��� 3"

gde vektori

3ã # ;3ã1 Ñ 3ã4<���3 # �31 Ñ 34",

ozna�avaju skupove predvi�aju�ih promenljivih, X-eva, koji karakterišu jedinku.

Kao i sa koli�nikom verovatno�a, lakše je predstaviti koli�nik rizika koji ima vrednost ve�u od 1 nego koli�nik rizika koji je manji od jedan a to �e se desiti ako je brojilac ve�i od imenioca, odnosno ako je:

'��� 3ã" e '��� 3"

Stoga, X-evi su naj�eš�e kodirani tako da grupi sa ve�im rizikom – obi�no neizloženoj grupi odgovara�3ã a grupi sa manjim rizikom odgovara 3.

Na našem primeru, placebo grupa je kodirana sa 3ã1 # �, a tretman grupa sa 31 # $, to jest:

3ã # ;3ã1 # � Ñ 3ã4<, gde 3ã1 # � ozna�ava placebo grupu, a 3 # �31 Ñ 34", gde�31 # $ ozna�ava tretman grupu. Sre�ivanjem izraza za koli�nik rizika, HR, dobijamo:

�:Ü # '��� 3ã"'��� 3" # 'AÜ��"�G ºäÜÏÎãÐÎH«

'AÜ��"�G ºäÜÏÎÐÎH«# �G ºäÜ�ÏÎãbÏÎ"ÐÎH«

odnosno:

�:Ü # �G ºäÜ�ÏÎãbÏÎ"ÐÎH« .

Sada �emo na primerima pokušati da se što više približimo ovoj formuli.

Pretpostavimo da postoji samo jedna promenljiva od interesa, X, koja uzima vrednosti 0 ili 1 i p=1. Ocena hazard koli�nika je tada:

�:Ü # �G ºäÜ�ÏÎãbÏÎ"ÐÎH« # �º«Ü �1bA" # �º«Ü . Prisetimo se sada podataka remisije iz modela 1 koji sadrži samo jednu promenljivu :É.

Page 45: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Model 1: Promenljive Koeficijenti standardna

greška p-vrijednost HR

:É 1.509 0.410 0 4.523

Ocenjeni koli�nik rizika je

�:Ü # �1 wA£ # lQnUV.

Za model 2 situacija je slede�a:

Model 2: Promenljive Koeficijenti standardna

greška p-vrijednost HR

Rx 1.294 0.422 0.002 3.648 logWBC 1.604 0.329 0.000 4.975

3ã # �� *��µ¶·"� 3 # �$ *��µ¶·"

Hazard koli�nik za efekat promenljive status grupe prilago�en za logWBC je

�:Ü # �º«Ü �Ï«ãbÏ«"8ºØÜ �ÏØãbÏØ" # ��QUTl�1bA"81Q¤Av�Ì®ÁÙÚÛbÌ®ÁÙÚÛ" # ��QUTl

Ovaj primer ilustruje osnovno pravilo da je hazard koli�nik, za efekte �$ �" date promenljive uskla�ene za ostale promenljive, dobijen kao �º gde je ¹ koeficijent date promenljive. Ovo pravilo ima uslov da model ne sme sadržati izraz u obliku proizvoda.

Pogledajmo još šta se dešava ako model sadrži izraz u obliku proizvoda, to jest na primeru modela 3:

Model 3: Kolona Koeficijenti Standardna

greška p-vrijednost HR

Rx 2.355 1.681 1.161 10.537 log WBC 1.803 0.447 0.000 6.067 Rx×logWBC -0.342 0.520 0.510 0.710

Model sadrži tri promjenjive. Vektor 3ã koji ozna�ava placebo subjekat, ima komponente:

3ã # �� *��µ¶· � c *��µ¶·"

a vektor 3, koji ozna�ava subjekat na tretmanu ima komponente:

3 # �$ *��µ¶· $ c *��µ¶·"

Page 46: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Zamenjuju�i vrednosti dobijene kompjuterskom obradom i vrednosti vektora X* i X dobijamo da je ocena za HR jednaka

�:Ü # �º«Ü �Ï«ãbÏ«"8ºØÜ �ÏØãbÏØ"8ºåÜ �ÏåãbÏå" # ��Q¦ww�1bA"81Q§A¦�Ì®ÁÙÚÛbÌ®ÁÙÚÛ"bAQ¦v��Ì®ÁÙÚÛbA"# ��Q¦wwbAQ¦v�Ì®ÁÙÚÛ

Da bismo dobili konkretnu numeri�ku vrednost za HR moramo odrediti vrednost za *��µ¶· . Tako za *��µ¶· # U , ocjena HR-a je nQVU , a za vrijednost *��µ¶· # l , ocjena HR-a je UQPS . Kako za razli�ite vrednosti *��µ¶· dobijamo razli�ite vrednosti za ocenu koli�nika rizika, što ima smisla jer je *��µ¶· modifikacioni efekat u modelu 3.

Ovaj primer upravo ilustruje pravilo za odre�ivanje hazard koli�nika u modelu koji sadrži izraz u obliku proizvoda promenljivih koje u�estvuju u modelu, a to je:

�:Ü # �ºW8G æW©Ù© gdje je ¹p ocena koeficijenta od E, a 2p7 od promenljive � c µ7.

Koriste�i ovu formulu dobijamo isti rezultat za model 3:

�:Ü # �ºW8æW«Ì®ÁÙÚÛ # ��Q¦wwbAQ¦v�Ì®ÁÙÚÛ, gde je � # :¸ a µ1 # *��µ¶·

Page 47: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

15. PRILAGO�ENE KRIVE PREŽIVLJAVANJA

Dve osnovne veli�ine koje nas zanimaju iz analize preživljavanja su:

• ocena koli�nika rizika • ocene kriva preživljavanja

Kako smo upravo opisali postupak za ra�unanje ocene koli�nika rizika, preostaje nam da kažemo nešto o ocenjivanju kriva preživljavanja koriste�i Koksov model.

Podsetimo se, ukoliko nemamo model za fitovanje podataka preživljavanja, onda se krive preživljavanja dobijaju Kaplan-Mejerovom metodom. To su su stepenaste funkcije. Me�utim, kada se Koksov model koristi za fitovanje podataka preživljavanja, krive preživljavanja se dobijaju tako da budu prilago�ene nezavisnim promenljivim u modelu. Otuda i poti�e naziv prilago�ene krive preživljavanja. Kao i KM krive i one su stepenastog oblika.

Formula funkcije rizika za Koks-ov model

'�� 3" # 'A��"�G ºÎÏÎÐÎH«

može biti pretvorena u odgovaraju�u formulu za funkciju preživljavanja:

o�� 3" # oA��"¯G çÎèÎÐÎH« �Ova formula je osnova za odre�ivanje prilago�enih krivih preživljavanja..

Ocenjena funkcija preživljavanja je:

op�� 3" # oAW ��"¯G çäÜ èÎÐÎH« �

Ocene oAÜ��" i ¹� se dobijaju pomo�u kompjuterskih programa koji imaju ugra�enu funkciju za Koks-ov model, gde vrednosti za 3� moraju biti odre�ene od strane istraživa�a, kako bi program mogao da izra�una ocene za funkcije preživljavanja.

Objasnimo ovo na ranije razmatranom modelu 2.

'��� 3" # 'AÜ��"�1Q�£v×É81Q¤AvÌ®ÁÙÚÛ

op�� 3" # oAW ��"¯«QØéêëìí«Qî¿êßïðñòó. �

Ovdje vidimo izraze za hazard funkciju i odgovaraju�u funkciju preživljavanja. Ako unesemo konkretne vrijednosti za vektor 3, �ije su komponente :¸�i *��µ¶· , na primjer, ako uzmemo da je :¸ # � i *��µ¶· #UQTV, dobijamo konkretnu funkciju preživljavanja.

op�� 3" # oAÜ��"¯«QØéêã«í«Qî¿êãØQéå # oAÜ��"¯ôQéé # oAÜ��"vAAQ£

Page 48: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Primetimo da je vrednost 2.93 od *��µ¶· artmeti�ka sredina *��µ¶· na �itavom skupu od 42 subjekta.

Sli�no je i za :¸ # $ i *��µ¶· # UQTV.

op�� 3" # oAÜ��"¯«QØéêã¿í«Qî¿êãØQéå # oAÜ��"¯êQõ¿ # oAÜ��"1A£Q£

Svaki od ova dva izraza daje prilago�ene krive preživljavanja, gde je prilago�avanje za vrednosti vektora 3.

Primetimo još iz ovih izraza da verovatno�a preživljavanja može biti dobijena za bilo koju vrijednost �.

Ovako dobijene krive preživljavanja nam omogu�uju da uporedimo krive preživljavanja za razli�ite tretman grupe, prilago�ene promjenjivoj *��µ¶·.

Obe krive opisuju ocenjene verovatno�e preživljavanja pod pretpostavkom da je sve vreme vrednost promjenjive *��µ¶· jednaka,a u našem slu�aju je to 2.93.

Kada ra�unamo krivu preživljavanja, vrednost koja se bira za promenjivu kojoj se prilago�avamo je srednja vrijednost. U našem primjeru srednja vrednost za *��µ¶·, za svih 42-ije promjenjive u skupu je UQTV.

Ako želimo uporediti krive preživljavanja na dva nivoa (za tretman i za placebo grupu) date promenjive i želimo ih prilagoditi za nekoliko promenljivih u modelu, možemo koristiti posebne formule za svaku od tih krivih:

op�� 31" # oAÜ��"¯ç«ã«íG çäÜ èäEEEEÎö«

op�� 3A" # oAÜ��"¯ç«ã¿íG çäÜ èäEEEEÎö« �Ako želimo dobiti prilago�enu krivu koja se prilago�ava svim promenivim u modelu, opšta formula koja koristi srednju vrednost za svaku promenjivu je:

op�� 3E" # oAÜ��"¯G çäÜ èäEEEEÐÎH« �Ova formula daje jedinstvenu prilago�enu krivu preživljavanja.

Ilustrujmo to na slede�em primeru:

:¸�EEEE � # $Qn, *��µ¶·EEEEEEEEEEE # UQTV

op�� 3E" # oAÜ��"¯ç«ëì�EEEEEíçØÜ ßïðñòóEEEEEEEEEEEEE # oAÜ��"¯«QØéêã¿Qôí«Qî¿êãØQéå # oAÜ��"�1AQ¤

Iz ovakvog izraza za krivu preživljavanja, verovatno�a preživljavanja može biti izra�unata za bilo koje t. Ako krivu preživljavanja crtamo koriste�i neki programski paket vrijednost od t �e biti birana automatski izmedju vremena dok se doga�aj ne desi, odre�enih za svaki subjekat u posmatranju koji je imao doga�aj.

Grafik prilago�enih krivih preživljavanja dobijen iz prilago�enog Koksovog modela nacrtan kao stepenasta funkcija.

Page 49: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Vidimo stepenaste funkcije za dvije prilago�ene krive preživljavanja dobijene za 0 ili 1 tretman status i uzevši da je prosje�na vrednost za *��µ¶·�UQTV.

( )tS �

1,0

0,8

0,6

0,4

0,2

t

( )[ ] 9.109

0ˆ tS �

( )[ ] 9.400

0ˆ tS �

Page 50: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ������� �

16. PH PRETPOSTAVKA

PH pretpostavka zahteva da je HR konstantan u vremenu, to jest da je rizik jednog subjekta proporcionalan riziku drugog subjekta, gdje je konstanta proporcije nezavisna od vremena.

Da bismo bolje razumjeli PH pretpostavku, vratimo se na formulu za HR, gde se porede dve jedinke koje karakterišu vektori 3ã 3.

�:Ü # '��� 3ã"'��� 3" # 'AÜ��"�G ºäÜÏÎãÐÎH«

'AÜ��"�G ºäÜÏÎÐÎH«# �G ºäÜ�ÏÎãbÏÎ"ÐÎH«

Kona�ni izraz za hazard koli�nik dakle uklju�uje ocene koeficijenata ¹� i vrednosti koje primaju promenljive 3ã i 3.

Kao što vidimo osnovna hazard funkcija se poništila i kona�ni izraz ne zavisi od t. Pošto je kona�na vrednost hazard koli�nika konstantna ozna�imo je sa ÷� i onda dobijamo :

÷� # �G ºäÜ�ÏÎãbÏÎ"ÐÎH«

'��� 3ã" # ÷�'��� 3".

Ovo je matemati�ki izraz koji odre�uje proporcionalnu hazard pretpostavku.

Drugim re�ima:�'��� 3ã" # ÷�'��� 3"

Ovaj izraz nam govori da je hazard funkcija za jednog subjekta proporcionalna hazard funkciji za nekog drugog subjekta, gdje je ÷� konstanta proporcionalnosti koja ne zavisi od vremena.

Da bi smo bolje objasnili hazard pretpostavku ponovo �emo razmotriti Koks-ov model za podatke remisije koji uklju�uje dvije promenjive :¸���*��µ¶·.

'��� 3" # 'AÜ��"�1Q�£v×É81Q¤AvÌ®ÁÙÚÛ.

Page 51: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

�:Ü # '��� :¸ # � *��µ¶· # UQTV"'��� :¸ # $ *��µ¶· # UQTV" # �1Q�£v # VQPn

'��� :¸ # � *��µ¶· # UQTV" # VQPn'��� :¸ # $ *��µ¶· # UQTV"

U ovom modelu, hazard koli�nik je ocenjen pore�enjem placebo �:¸ # �" sa tretiranim �:¸ # $" subjektom, kontrolišu�i *��µ¶· i njegova vrednost je 3.65. Prema tome hazard koli�nik za placebo grupu je VQPn puta ve�i od hazard koli�nik za tretman grupu, a vrednost 3.65 konstatnta proporcionalnosti.

U cilju još boljeg objašnjenja hazard pretpostavke razmotri�emo situaciju kada proporcionalna hazard pretpostavka nije zadovoljena.

Posmatrajmo studiju u kojoj su pacijenti koji boluju od kancera nasumi�no izabrani za operaciju ili radijaciju bez operacije. Tako imamo (0,1) zadatu promjenjivu koja ozna�ava status operacije i to tako što 0 ozna�ava da pacijent ide na operaciju, a 1 da ne ide. Pretpostavimo dalje da je to jedina promjenjiva od interesa, pa �e tako Koks-ov model za analizu ovih podataka sadržati samo jednu promjenjivu E, koja oza�ava zadatu promjenjivu.

'�� 3" # 'A��"�ºø

Pitanje koje se ovde postavlja je to da li je Koks-ov model koji sadrži promjenjivu E prikladan model za ovakvu situaciju?

Da bi odgovorili na ovo pitanje, primijetimo prvo da kad se pacijent podvrgne delikatnoj operaciji, kao što je uklanjanje kancerogenog tumora, on je izložen riziku da dodje do komplikacija tokom operacije, rane smrti tokom rehabilitacionog toka i tak kada pacijent pro�e odre�eni kriti�ni period korist operacije, ukoliko postoji, može biti prime�ena.

Prema tome, u studiji koja poredi ove dvije mogu�nosti, operacija ili ne, možemo o�ekivati da hazard funkciju grafi�ki izgleda:

E=0 (operacija)

E=0 (bez operacije)

E=1

E=0

3 t (dani)

h(t ,X)

Page 52: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Prime�ujemo da se ove dve funkcije seku približno na tre�i dan i da pre tre�eg dana rizik grupe koja se podvrgne operaciji je ve�i nego rizik grupe koja se le�i bez operacije, dok nakon tre�eg dana rizik grupe koja se podvrla operaciji je niži nego rizik grupe bez operacije.

Pažljivije posmatraju�i grafik vidimo da drugi dan, kada je 2t = , koli�nik rizika grupe koja se le�i bez operacije (E=1) i grupe koja se le�i sa operacijom (E=0) ima vrednost manju od jedan:

�:Ü # '��� # U � # �"'��� # U � # $" ~ �

Nasuprot tome, kada je 5t = koli�nik rizika grupa bez i sa operacijom ima vrednost ve�u od jedan:

�:Ü # '��� # n � # �"'��� # n � # $" ~ �

Ako je opis funkcije rizika za svaku od grupa ta�an koli�nici rizika nisu konstantni u toku vremena. Ta�nije, koli�nik rizika je neki broj koji je manji od jedan pre tre�eg dana, i ve�i od jedan nakon tri dana, zbog toga je neprikladno koristiti Koksov PH model u ovoj situaciji jer ovaj model pretpostavlja konstantan koli�nik rizika a u ovom slu�aju on varira u toku vremena.

Ako koristimo Koksov model u ovoj situaciji ocenjeni koli�nik rizika koji poredi dve grupe pacijenata je dat

konstantnom vrednoš�u �ºW .

Ovaj primer pokazuje opšte pravilo da ako se rizici presecaju PH pretpostavka ne može biti zadovoljena tako da je Koksov PH model neprikladan.

Prirodno je zapitati se, ako je Koksov model neprikladan, kako bi trebalo izvesti analizu?

Za studiju operacije postoji nekoliko opcija za analizu. To uklju�uje:

• analiziranje stratifikovanjem promenljive, to jest, ne prilago�avati je nijednom modelu i umesto toga dobiti Kaplan – Meier-ove krive za svaku grupu te promenljive posebno;

• po�eti analizu za tri dana i primeniti Koks-ov PH model na trodnevno preživljavanje;

• prilagoditi Koks-ov model za manje od tri dana i druga�iji Koks-ov model za više od tri dana da

bismo dobili dve razli�ite ocene koli�nika rizika, po jednu za svaki od perioda(dobijemo HR

(< 3

dana) i HR

(> 3 dana));

• prilagoditi modifikovani Koks-ov model koji uklju�uje vremenski zavisnu promenljivu koja meri interakciju promenljive sa vremenom. Ovaj model se naziva prošireni Koks-ov model.

Dalja diskusija ovih opcija je izvan domena teme ovog rada, me�utim, ista�i �emo da razli�ite opcije mogu dovasti do razli�itih zaklju�aka, tako da bi istražitelj morao da proceni relativne vrline svake opcije u smislu podataka koji su dobijeni pre nego što odlu�i da je bilo koja opcija najbolja.

Page 53: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

17. PRIMER 2

Posmatramo dve grupe pacijenata obolelih od melanoma, od ukupno 65 pacijenata. Grupe su stratifikovane prema tome da li imaju normalnan i abnormalan broj trombocita na dijagnozi. Osnovni skup podataka pored statusa grupe sadrži i promenljive: starosna dob i pol. Ukoliko želimo još da ocenimo efekat interakcije starosne dobi ili pola na status grupe posmatra�emo još dve promenljive u obliku proizvoda.

Cilj posmatranja ove dve grupe je upore�ivanje iskustava preživljavanja prilago�avanjem nekom mogu�em ometanju ili efektima interakcije promenljive starosna dob i pol.

Promenljive koje se pojavljuju u ovom posmatranju su:

T – vreme dok se ne iza�e iz remisije

31 - status grupe # %�����$ �������ù������� ù�������ù��� �*��� �������ù������� ù��������� �*�� ( 3� – starosna dob (izražena u godinama)

3¦ - pol # %� &��*���������������� &�������*�U &��*��������������������������*�( 3v # 31 c 3�

3w # 31 c 3¦

model 1:

promenljive koeficijenti st. greška p-vrednost HR

trombociti 0.470 2.854 0.869 1.600

starosna dob 0.000 0.037 0.998 1.000

pol 0.183 0.725 0.801 1.200

trom x stdob -0.008 0.041 0.850 0.992

trom x pol -0.503 0.804 0.532 0.605

-2 ln L: 306.080

Page 54: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

model 2

promenljive koeficijenti st. greška p-vrednost HR

trombociti -0.725 0.401 0.071 0.484

starosna dob -0.005 0.016 0.740 0.995

pol -0.221 0.311 0.478 0.802

-2 ln L:306.505

model 3

promenljive koeficijenti st. greška p-vrednost HR

trombociti -0.706 0.401 0.078 0.493

starosna dob -0.003 0.015 0.828 0.997

-2 ln L: 307.018

model 4

promenljive koeficijenti st. greška p-vrednost HR

trombociti -0.705 0.397 0.076 0.494

pol -0.204 0.307 0.506 0.815

-2 ln L: 306.616

model 5

promenljive koeficijenti st. greška p-vrednost HR

trombociti -0.694 0.397 0.080 0.500

-2 ln L: 307.065

Sada uo�avamo razlike me�u rezultatima ovih pet prikazanih modela. Svaki od ovih modela obra�uje isti skup podataka, me�utim, nezavisne promenljive su razli�ite za svaki model. Tako, model 1 sadrži promenljivu koja ozna�ava da li je broj trombocita u dijagnozi normalan ili abnormalan, starosnu dob, pol, kao i promenljive koje

Page 55: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

su proizvod promenljivih – trombociti x starosna dob, i trombociti x pol. Model 2 sadrži tri promenljive – status trombocita, starosnu dob i pol. Model 3 sadrži dve promenljive, broj trombocita i starosnu dob, model 4 broj trombocita i pol, dok model 5 sadrži samo jednu promenljivu i to je broj trombocita.

Posmatramo rezultate modela 1. Metod koji se koristio za dobijanje koeficijenata je ocena metodom maksimalne verodostojnosti (ML)

model 1:

promenljive koeficijenti st. greška p-vrednost HR

trombociti 0.470 2.854 0.869 1.600

starosna dob 0.000 0.037 0.998 1.000

pol 0.183 0.725 0.801 1.200

trom x stdob -0.008 0.041 0.850 0.992

trom x pol -0.503 0.804 0.532 0.605

-2 ln L: 306.080

Dobijena p-vrednost za promenljivu koja je proizvod broja trombocita i starosne dobi je 0.850 i rezultat je deljenja koeficijenta -0.008 sa njegovom standardnom greškom 0.041, što daje -0.195 i onda pretpostavimo da ova promenljiva ima približno standardnu normalnu raspodelu, tj. da je standardna normalna ili Z promenljiva. Ova Z statistika je poznata kao Wald statistika koja je jedna od dve test statistike koje se koriste za ocenu metodom maksimalne verodostojnosti. Druga test statistika zvana koli�nik verodostojnosti ili LR statistika koristi vrednost logaritma verodostojnosti. Ovo je dato izrazom -2 ln L i ta vrednost za model 1 je 306.080. isti postupak se primenjuje i na promenljivu koja je u obliku proizvoda broja trombocita i pola. p-vrednost te promenljive jednaka je 0.532 i dobijena je deljenjem koeficijenta -0.503 standardnom greškom 0.804 i rezultat je -0.626 i onda pretpostavljamo da ta promenljiva ima približno normalnu raspodelu. Tako�e, i za ovu promenljivu je druga test statistika koli�nik verodostojnosti i koristi vrednost logaritma verodostojnosti.

Sada gledamo rezultate modela 2 koji sadrži tri promenljive. Promenljiva koja ozna�ava status broja trombocita je promenljiva od interesa. Druga i tre�a promenljiva su starosna dob i pol, i posmatraju se kao smetnja. Naš cilj je da opišemo efekat broja trombocita prema starosnoj dobi i polu.

Page 56: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Model 2

promenljive koeficijenti st. greška p-vrednost HR

trombociti -0.725 0.401 0.071 0.484

starosna dob -0.005 0.016 0.740 0.995

pol -0.221 0.311 0.478 0.802

-2 ln L:306.505

Najpre primetimo da je vrednost logaritma verodostojnosti za model 2 data sa -2 ln L = 306.505 i tu vrednost možemo koristiti zajedno sa vrednoš�u -2 ln L iz modela 1 da dobijemo LR statistiku za testiranje zna�aja promenljive koja predstavlja interakciju promenljivih u modelu 1. Nju dobijamo

tako što od 306.505 oduzmemo 306.080 i dobijemo 0.425. Ova test statistika ima 2χ raspodelu sa dva stepena

slobode i sa nultom hipotezom da ne postoji efekat interakcije. p-vrednost za ovaj test je izme�u 0.4 i 0.5 što ukazuje na to da ne postoji zna�ajna interakcija u modelu 1. Iako p-vrednosti za Wald test i LR test nisu potpuno iste dovode do istog zaklju�ka. Uopšteno, Wald i LR statistika mogu dati razli�ite rezultate. Statisti�ari su pokazali da od te dve test procedure LR statistika ima bolja statisti�ka svojstva tako da ako smo u nedoumici treba da se odlu�imo za LR test.

Postoje tri statisti�ka cilja koji se obi�no uzimaju u obzir. Prvi je da testiramo zna�aj promenljive koja ozna�ava status broja trombocita prilago�en starosnoj dobi i polu, drugi je da dobijemo ocenu efekta broja trombocita, prilago�enog starosnoj dobi i polu, i tre�i je da dobijemo interval poverenja za ovaj efekat. Ovo možemo posti�i koriste�i dobijene rezultate bez direktnog koriš�enja formule za Koks-ov model.

Za testiranje zna�aja broja trombocita, p-vrednost u tabeli za Wald statistiku je 0.071 što je veoma zna�ajno. Alternativno, koli�nik verodostojnosti može biti izveden pore�enjem statistike logaritma verodostojnosti za model 1 sa logaritmom statistike verodostojnosti za model koji ne sadrži promenljivu koja predstavlja stanje broja trombocita. Ovaj drugi model koji bi trebao da sadrži samo drugu promenljivu ovde nije prikazan pa �emo samo primetiti da je LR test tako�e veoma zna�ajan. Stoga, ovi rezultati pokazuju da upotreba modela 2, promenljiva koja ozna�ava broj trombocita je zna�ajna, nakon prilago�avanja za starosnu dob i pol.

Procena efekta promenljive broja trombocita je obezbe�ena u koloni HR sa vrednoš�u 0.484. Ova vrednost je

ocena koli�nika rizika za efekat broja trombocita a ra�una se kao 0.725e

− = 0.484. Za pojam koli�nika rizika vezuje se interval poverenja.

Da bismo opisali interval poverenja za efekat broja trombocita posmatramo rezultate za proširenu tabelu datu za model 2 koji je prikazan ranije.

Page 57: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Model 2

promenljive koeficijenti st. greška p-vrednost HR 0.95 CI P(PH)

trombociti -0.725 0.401 0.071 0.484 0.221 1.063 0.863

st.dob -0.005 0.016 0.740 0.995 0.965 1.026 0.405

Pol -0.221 0.311 0.478 0.802 0.436 1.476 0.487

-2 ln L: 306.505

Iz tabele se vidi da je 95% interval poverenja za efekat broja trombocita izme�u 0.221 i 1.063. Ovo je interval poverenja za koli�nik rizika (HR) koji okružuje ta�ku 0.484, koja je prethodno opisana.

Ostaje još da analiziramo modele 3, 4 i 5.

model 3

promenljive koeficijenti st. greška

p-vrednost

HR

trombociti -0.706 0.401 0.078 0.493

starosna dob

-0.003 0.015 0.828 0.997

-2 ln L: 307.018

model 4

promenljive koeficijenti st. greška

p-vrednost

HR

trombociti -0.705 0.397 0.076 0.494

pol -0.204 0.307 0.506 0.815

-2 ln L: 306.616

model 5

promenljive koeficijenti st. greška

p-vrednost

HR

trombociti -0.694 0.397 0.080 0.500

-2 ln L: 307.065

Model 5 sadrži samo jednu promenljivu koja ozna�ava status broja trombocita i zbog toga se �esto naziva „grub“ model, jer ignoriše efekat mogu�e promenljive od interesa kao što je starosna dob ili pol.

Vrednost HR za promenljivu koja ozna�ava status broja trombocita je nešto ve�i nego odgovaraju�i koji se dobije kada prilagodimo starosnu dob i pol. Ako su grube i prilago�ene ocene razli�ite možemo re�i da postoji ometanje zbog starosne dobi i pola. Ako jednom ustanovimo smetnju moramo je kontrolisati da bismo dobili važe�e ocene efekta. Zbog toga koristimo neki od modela 2, 3, 4 ili 5 a ne 1. �ak iako ne postoji zna�ajno

Page 58: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

ometanje ipak ga kontrolišemo da bismo dobili što ta�niju ocenu koli�nika rizika. Tako da, ako je interval poverenja za koli�nik rizika kod nekig modela uži nego kod nekog drugog koristi�emo model sa užim intervalom poverenja da bismo dobili što precizniju ocenu.

Opštevaže�i koli�nik rizika je 0.484, koji je dobijen u modelu 2. primetimo da model 2 ne sadrži promenljive koje predstavljaju interakciju i kontroliše obe promenljive od interesa. Kada su ili pol ili starosna dob izba�eni iz modela koli�nik rizika (za broj trombocita) se ne menja primetno. Stoga, izgleda da ni pol ni starosnu dob ne treba tretirati kao smetnju, odnosno ne treba ih kontrolisati.

Modeli 2, 3, 4 I 5 su dosta sli�ni, budu�i da svi u suštini daju isti koli�nik rizika i interval poverenja za promenljivu broj trombocita.

Nakon analize svih pet modela zaklju�ujemo da je najpodesniji model 2 i da koriste�i njega dobijamo statisti�ki zna�ajan koli�nik rizika od 0.484 za status broja trombocita sa intervalom poverenja od 0.221 do 1.063 i kontrolišemo obe promenljive, i starosnu dob i pol.

Page 59: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

18. PRILOG

Analiza preživljavanja

Rešavanje KM krivih, Log - rank testa i Peto testa na primerima iz rada, pomo�u kompjuterskog programa Statistika.

Grupa 1 - Blizanci

Za date podatke iz grupe 1, predstavljen je niz koraka kojima se dolazi do odgovaraju�e KM krive preživljavanja.

Page 60: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ������� �

Page 61: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Grupa 2.

Page 62: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Podaci remisije za 24 para blizanaca

Predstavljen je niz koraka za dobijenje odgovaraju�ih KM krivih, Log-rank test i Peto test.

Page 63: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Page 64: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Page 65: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Page 66: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Koksov PH model

Rad završavamo prilgom rezultata koje nam daju razli�iti programski paketi za naš po�etni primer o pacijentima koji boluju od leukemije iz dela o Koksovom modelu. Dacemo uputstvo kako se obra�uju podaci u paketu SPIDA i programu Statistica10. U dodatku vezanom za Statistiku pokaza�emo i razliku izme�u kriva preživljavanja koje se dobijaju Kaplan Majerovim metodom i prilago�enoh kriva preživljavanja.

SPIDA

Za unete podatke o vremenu preživljavanja i broju krvih zrnaca za svih 42 pacijenta i funkcijom ozna�enom kod svakog modela dobijamo slede�e vrednosti.

Za

Page 67: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Statistica 10

Unesemo podatke:

Statistics ú Advanced models ú Survival ú Regression models

Page 68: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Sada upore�ujemo krive koje odgovaraju grupama:

Statistics ú Advaced models ú Survivalú Comparing multiple samples

Page 69: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

Statistica 10 ima u sebi i odvojenu rubriku za Cox Proportional Hazards Regression pod odeljkom Statistics ú Advanced models koja crta prilago�ene krive prilago�avanja.

Page 70: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ������� �

Page 71: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

19. ZAKLJU�AK

Statistika kao nauka je sama po sebi zna�ajna zbog toga što nalazi široku primjenu u realnom životu. Mnoge životne situacije i procjene se rade upravo pomo�u razli�itih statisti�kih metoda, što smo uostalom i vidjeli kroz ovaj rad, gdje je Koks-ova metoda primijenjena na analizu preživljavanja. Neke od tih metoda su matemati�ki veoma složene, ali razvojem ra�unara i stvaranjem programskih paketa koji imaju ugra�ene funkcije za odre�ene postupke, to više nije problem.

Statistika je oblast matematike koja se bavi sakupljanjem, analizom, interpretacijom, objašnjavanjem i prezentacijom podataka. Ima svoje primene u širokom spektru akademskih disciplina, od fizike do ekonomije i sociologiije. Predmet statisti�kog istraživanja su masovne pojave koje su po svojoj prirodi promenljive i nastaju pod uticajem nekih faktora.

Danas statistika prevazilazi svoje nekadašnje okvire - opisivanje pojava, i koristi se za davanje procena, odmeravanje rizika, istražuje tendencije, analizira odnose i faktore koji odre�uju pojavu. Statistika se danas koristi prakti�no u svakoj profesiji. Ekonomisti je koriste da testiraju razli�ite tehnike proizvodnje; poslovni ljudi je koriste da testiraju dizajn proizvoda koji daje maksimalnu prodaju; sociolozi koriste statisti�ke testove da testiraju rezultate programa rehabilitacije alkoholi�ara; industrijski psiholozi da provere uticaj fabri�kog okruženja na radnike; politi�ari je koriste da predvide rezultate izbora; hemi�ari da bi proizveli jeftinije �ubrivo, lekari da odrede efikasnost novog leka itd. Mnoge životne situacije i procene se vrše upravo pomo�u statisti�kih metoda, što smo videli i kroz ovaj rad gde je Koks-ova metoda primenjena na analizu preživljavanja. Neke od metoda su veoma složene ali razvojem ra�unara i programskih paketa koji imaju ugra�ene funkcije za odre�ene postupke to više ne predstavlja problem.

Koksova metoda ima veoma široku primjenu u razli�itim sferama života i nauke uopšte, a ovdje smo vidjeli njenu primjenu u medicinskim naukama.

Page 72: SEMINARSKI RAD - people.dmi.uns.ac.rspeople.dmi.uns.ac.rs/~zlc/fajlovi/Analiza_prezivljavnja.pdf · univerzitet u novom sadu prirodno-matemati ki fakultet seminarski rad predmet:

����������������������� ��������������

��������������������� ���������

20. LITERATURA

1. David G. Kleinbaum, “Survival Analysis“, Springer-Verlag, New York, 1996.

2. Survival Analysis Using SAS : Practical Guide“ , Paul D. Allison

3. SPIDA manual, Sydney, Australia, 1991; i Krall et al., „A step-up procedure for Selecting Variables Associated with Survival Data“, Biometrics, vol.31, pp 49-57, 1975.

4. www.bmj.com

5. www.ncbi.nlm.nih.gov > Journal List > Crit Care > v.8(5); 2004

6. Medical College of Wiskoncin: www.mcw.edu