19
JAK NA ODHAD JOINPOINT REGRESE ˇ arka Hudecov´ a E-mail : [email protected] Adresa : KPMS MFF UK, Sokolovsk´ a 83, 186 00, Praha 8 Abstrakt: V pˇ ıspˇ evku se zab´ yv´ ame modelem joinpoint regrese, tj. mo- delem po ˇ astech line´ arn´ ı spojit´ e z´ avislosti. Tento model nach´ az´ ı zaj´ ımav´ a uplatnˇ en´ ıvˇ radˇ e oblast´ ı. Pro jeho odhad byl vyvinut speci´ aln´ ı software Join- point Regression Program, jehoˇ z metodologii a pouˇ zit´ ı bl´ ıˇ ze pop´ ıˇ seme. D´ ale ˇ cten´ re sezn´ am´ ıme s knihovnou segmented, kter´ a je k dispozici v progra- mu R. V obou pˇ ıpadech uvedeme hlavn´ ı v´ yhody a nev´ yhody dan´ eho softwaru a nˇ ekter´ e probl´ emy, na nˇ z m˚ ze uˇ zivatel pˇ ri pr´ aci narazit. Na nˇ ekolika da- tov´ ych souborech (simulovan´ ych i re´ aln´ ych) provedeme praktick´ e porovn´ an´ ı chov´ an´ ı obou softwar˚ u. Abstract: We deal with a joinpoint regression model, i.e. with a piecewise linear continuous regression. This model is common in many fields and finds various interesting applications. We give a description of the Joinpoint Re- gression Program, a special software developed for the estimation of the jo- inpoint regression models. The library segmented available in program R is presented as well. We provide a practical comparison of these two programs based on analyses of several data sets, simulated as well as real data. Advan- tages, disadvantages, and possible problems with estimation are discussed. 1. ´ Uvod Regrese joinpoint (v literatuˇ re tak´ e segmented regression, piecewise regres- sion, broken line regression ) je model, v nˇ emˇ z je z´ avislost odezvy na vy- svˇ etluj´ ıc´ ı promˇ enn´ e pops´ ana po ˇ astech line´ arn´ ı spojitou funkc´ ı. Ta mˇ en´ ı svou smˇ ernici v nˇ ekolika obecnˇ e nezn´ am´ ych bodech zlomu (transition points, break-points, change-points, joinpoints ). V nˇ ekter´ ych praktick´ ych situac´ ıch takov´ yto model vyvst´ av´ a zcela pˇ rirozenˇ e z podstaty sledovan´ eho probl´ emu, jinde ho lze s ´ uspˇ echem pouˇ ıt k pˇ ribliˇ zn´ emu pops´ an´ ı komplikovanˇ ejˇ ı ne- line´ arn´ ı z´ avislosti. V´ yhodou joinpoint regrese je zejm´ ena snadn´ a interpretace parametr˚ u, kter´ a n´ am umoˇ nuje velice jednoduˇ se popsat zmˇ eny ve sledo- van´ e z´ avislosti nebo trendu. Pr´ avˇ e tato pˇ ımoˇ car´ a interpretace b´ yv´ casto uvodem vyuˇ zit´ ı joinpoint modelu. redpoklad spojitosti regresn´ ı funkce je v nˇ ekter´ ych situac´ ıch pˇ rirozenˇ e vyˇ zadov´ an, jinde zase usnadˇ nuje interpretaci (nespojitost regresn´ ı funkce 1

JAK NA ODHAD JOINPOINT REGRESE - Univerzita Karlovahudecova/research/download/joinpoint_Hudecova.pdf · ho po ctu bod u zvratu kzalo zen na sekvenci permuta cn ch test u, v ce viz

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

Page 1: JAK NA ODHAD JOINPOINT REGRESE - Univerzita Karlovahudecova/research/download/joinpoint_Hudecova.pdf · ho po ctu bod u zvratu kzalo zen na sekvenci permuta cn ch test u, v ce viz

JAK NA ODHAD JOINPOINT REGRESE

Sarka Hudecova

E-mail : [email protected]

Adresa: KPMS MFF UK, Sokolovska 83, 186 00, Praha 8

Abstrakt: V prıspevku se zabyvame modelem joinpoint regrese, tj. mo-delem po castech linearnı spojite zavislosti. Tento model nachazı zajımavauplatnenı v rade oblastı. Pro jeho odhad byl vyvinut specialnı software Join-point Regression Program, jehoz metodologii a pouzitı blıze popıseme. Dalectenare seznamıme s knihovnou segmented, ktera je k dispozici v progra-mu R. V obou prıpadech uvedeme hlavnı vyhody a nevyhody daneho softwarua nektere problemy, na nez muze uzivatel pri praci narazit. Na nekolika da-tovych souborech (simulovanych i realnych) provedeme prakticke porovnanıchovanı obou softwaru.

Abstract: We deal with a joinpoint regression model, i.e. with a piecewiselinear continuous regression. This model is common in many fields and findsvarious interesting applications. We give a description of the Joinpoint Re-gression Program, a special software developed for the estimation of the jo-inpoint regression models. The library segmented available in program R ispresented as well. We provide a practical comparison of these two programsbased on analyses of several data sets, simulated as well as real data. Advan-tages, disadvantages, and possible problems with estimation are discussed.

1. Uvod

Regrese joinpoint (v literature take segmented regression, piecewise regres-

sion, broken line regression) je model, v nemz je zavislost odezvy na vy-svetlujıcı promenne popsana po castech linearnı spojitou funkcı. Ta menısvou smernici v nekolika obecne neznamych bodech zlomu (transition points,break-points, change-points, joinpoints). V nekterych praktickych situacıchtakovyto model vyvstava zcela prirozene z podstaty sledovaneho problemu,jinde ho lze s uspechem pouzıt k pribliznemu popsanı komplikovanejsı ne-linearnı zavislosti. Vyhodou joinpoint regrese je zejmena snadna interpretaceparametru, ktera nam umoznuje velice jednoduse popsat zmeny ve sledo-vane zavislosti nebo trendu. Prave tato prımocara interpretace byva castoduvodem vyuzitı joinpoint modelu.

Predpoklad spojitosti regresnı funkce je v nekterych situacıch prirozenevyzadovan, jinde zase usnadnuje interpretaci (nespojitost regresnı funkce

1

Page 2: JAK NA ODHAD JOINPOINT REGRESE - Univerzita Karlovahudecova/research/download/joinpoint_Hudecova.pdf · ho po ctu bod u zvratu kzalo zen na sekvenci permuta cn ch test u, v ce viz

by se obtızne zduvodnovala odborne verejnosti z daneho oboru). Z teore-tickeho hlediska je tento predpoklad dulezity, jelikoz cinı cely problem tro-chu slozitejsım, viz [15], [7]. Pri hledanı optimalnıho resenı je totiz potrebazajistit, aby parametry modelu odpovıdali spojite funkci. Modely po castechlinearnı regrese bez predpokladu spojitosti spadajı do trıdy tzv. change-pointregresnıch modelu, blıze viz cast 2.

V mnohych aplikacıch je velmi dulezita identifikace bodu zvratu, v nichznastavajı zmeny ve smernici zavislosti. Tyto body majı casto velmi konkretnı(napr. biologicky, fyzikalnı, ekonomicka, apod.) vyznam, jelikoz v nich do-chazı ke strukturalnı zmene sledovane zavislosti. Proto je nutne odhadu jejichpoctu a polohy venovat dostatecnou pozornost.

V nasledujıcım textu nejdrıve uvedeme par poznamek k teorii joinpiontregrese. Nasledne predstavıme nekolik vybranych zajımavych aplikacı, kdese tento model objevuje. Pote popıseme, jak lze joinpoint regresi odhadovatpomocı specialnıho softwaru Joinpoint Regression Program, a zmınıme takevlastnosti knihovny segmented v programu R, kterou se ve svem prıspevkuzabyva blıze prof. Andel. Nakonec se pokusıme o strucne porovnanı nasichzkusenostı s obema softwary.

2. Nekolik poznamek k teorii

V teto casti uvedeme nekolik poznamek k teorii spojite po castech linearnıregrese s odkazy na literaturu zabyvajıcı se touto problematikou.

Uvazujeme nasledujıcı model zavislosti promenne Y na regresory x:

E[Y ] = µ(x) = β0 +β1x+ δ1(x− τ1)+ + δ2(x− τ2)

+ + · · ·+ δk(x− τk)+, (1)

kde τ1 < · · · < τk jsou nezname body zvratu, β0, β1, δ1, . . . , δk jsou neznameparametry a (·)+ znacı kladnou cast. Predpokladame, ze strednı hodnota µ(x)je spojita funkce promenne x. Model (1) budeme nazyvat joinpoint models k body zvratu. Pocet zvratu k je pevne cıslo zvolene na zaklade drıvejsıchzkusenostı nebo pomocı nektereho ze statistickych nastroju, o kterych se blızezmınıme v dalsıch odstavcıch tohoto textu. Necht’ (x1, Y1), . . . , (xn, Yn) jsourealizace modelu (1) a εi = Yi − µ(xi) nahodne chyby.

Modelem (1) se v literature zabyvala rada autoru. Jiz pro prıpad k = 1,tj. pro model linearnı funkce s jednım neznamym bodem zlomu τ , a normalnerozdelene nezavisle chyby se situace ukazala byti dosti komplikovana. Prvotnıprace proto vetsinou uvazovali dodatecne predpoklady upresnujıcı polohubodu zvratu τ , viz napr. [21]. Chceme-li totiz odhadovat a provadet testyo neznamych bodech zvratu, nenı mozne automaticky pouzıt standardnı po-

2

Page 3: JAK NA ODHAD JOINPOINT REGRESE - Univerzita Karlovahudecova/research/download/joinpoint_Hudecova.pdf · ho po ctu bod u zvratu kzalo zen na sekvenci permuta cn ch test u, v ce viz

stup zalozeny na maximalnı verohodnosti a je treba postupovat s urcitouobezretnostı, viz [6].

Pro obecny prıpad modelu (1) Hudson v [9] navrhl dvoukrokovou me-todu pro odhad parametru τ metodou nejmensıch ctvrecu (resp. maximalneverohodny odhad v modelu s gaussovskymi chybami). Hinkley v [8] naslednemodifikoval tento odhadovacı postup pro k = 1 a ukazal, jak konstruovalverohodnostnı intervaly spolehlivosti pro parametry uvazovaneho modelu.Test nulove hypotezy o neprıtomnosti zmeny v zavislosti (tj. test δ1 = 0) jezde konstruovan na zaklade verohodnostnıho pomeru, pricemz je uvazovanoF -rozdelenı (namısto klasickeho χ2) pro tuto statistiku. Feder v [5] ukazal,ze rozdelenı teto statistiky je za nulove hypotezy komplikovanejsı a dokoncemuze zaviset na rozlozenı x-ovych souradnic pozorovanych dat.

Joinpoint regresi se dale venovala cela rada dalsıch autoru. O nekterychpracıch se blıze zmınıme v castech 4. a 5., kde budeme popisovat softwaryzalozene na jejich metodologiıch ([12],[15],[17]). Zde take popıseme vyhodya nevyhody jednotlivych postupu a blıze zmınıme problemy, na nez se zdenarazı. Obsahlejsı vycet relevantnıch pracı lze nalezt napr. v [6] a [12]. Vyseuvedeny prehled prvotnıch vysledku ma za ukol ilustrovat, ze po teoretickestrance nenı joinpoint regrese jednoduchy problem, a to dokonce i v tom nej-jednodussım prıpade. Problemy se zde neobjevujı jenom pri testovanı boduzvratu, ale i pri samotnem jejich odhadu. V praxi se totiz obcas stava, ze jeverohodnostnı funkce v okolı sveho maxima pomerne dost

”plocha“. Pak se

muze stat, ze dosti rozlicnym bodum z parametrickeho prostoru odpovıdajıvelmi podobne hodnoty verohodnosti. Odhadovacı algoritmy zalozene na pro-hledavanı mrızky (grid search, viz [15] a nase cast 4.) a jine iteracnı postupypak mohou vest k vysledkum, ktere se znacne lisı od optimalnıho resenı.

Problematice odhadu (resp. testovanı) vhodneho poctu zvratu k bylo v li-teraure venovano o poznanı mene prostoru. Volba k je vetsinou opomıjenanebo je doporuceno volit jej na zaklade nektereho z informacnıch kriteriı,pricemz nejdoporucovanejsı je zrejme BIC kriterium, ktere vede za urcitychpredpokladu ke konzistentnımu odhadu k. V clanku [12] je pak vyber vhodne-ho poctu bodu zvratu k zalozen na sekvenci permutacnıch testu, vıce viz nasecast 4. Pro obsahlejsı prehled literatury viz [14]. Zde autori provedli porovnanıasymptotickych vlastnostı jednotlivych metod a jejich chovanı na konecnych(simulovanych) datech. Strucne lze shrnout, ze BIC lepe odhalı mensı zmeny,zatımco permutacnı test je spıse konzervativnı a na mensı zmeny nereagujedostatecne citlive. To ma pak v praxi za nasledek, ze BIC reaguje i na velmimale zmeny a nekdy tak navrhuje model s nesmyslne vysokym poctem boduzvratu, ktery je v realu nepouzitelny. Pouzıvanı BIC by proto nemelo byt au-tomaticke a finalnı model by mel byt zvolen s prihlednutım k apriornı znalosti

3

Page 4: JAK NA ODHAD JOINPOINT REGRESE - Univerzita Karlovahudecova/research/download/joinpoint_Hudecova.pdf · ho po ctu bod u zvratu kzalo zen na sekvenci permuta cn ch test u, v ce viz

analyzovaneho problemu a nasledne interpretaci. V [23] byla pro odhad poctuzvratu navrzena take modifikace BIC kriteria. Toto kriterium vsak v prıpadedat analyzovanych v casti 6.1. a 6.2. vede k dosti bizardnım vysledkum (mo-del bez jedineho joinpointu), a proto jej rozhodne nemuzeme doporucit.

Jiz v uvodu jsme uvedli, ze joinpoint model ma blızko ke trıde tzv. change-point regresnıch modelu. Zde je tez uvazovan model regresnı zavislosti, kterav nekolika neznamych bodech menı svuj tvar, avsak bez predpokladu spo-jitosti vysledne krivky (ktery ale hraje z vypocetnıho hlediska dulezitouroli). K teto problematice existuje rozsahla literatura a byly pro ni odvo-zeny odhadovacı a testovacı metody zalozene na nejmodernejsıch statistickychprıstupech. Navıc, rada z vyznamnych pracı vznikla na MFF UK v Praze,viz napr. [1], [2]. Pro detailnı prehled literatury viz napr. [16]. V programuR je pro tyto modely k dispozici knihovna strucchange.

Nakonec jeste poznamenejme, ze kazdou po castech linearnı spojitou funk-ci lze jiste dostatecne dobre aproximovat hladkou krivkou. Z tohoto pohleduby tedy bylo mozne namısto joinpoint modelu uvazovat napr. regresnı poly-nom dostatecne vysokeho stupne nebo vhodnou nelinearnı regresnı krivku.Namısto ke skokovite zmene smernice by pak ke zmene prvnı derivace za-vislosti dochazelo

”hladce“. To ale v rade aplikacı, kde je joinpoint mo-

del pouzıvan, nenı zadoucı, protoze je vyzadovana prave identifikace onoho

”mısta zmeny“ v zavislosti.

3. Vybrane prıklady aplikacı

Joinpoint regrese je aktualnı tema, ktere nachazı uplatnenı v rade oblastı,predevsım v biostatistice, epidemiologii, biologii, chemii a dalsıch. Z kon-kretnıch zajımavych aplikacı jmenujme napr. modelovanı pravdepodobnostivyskytu Downova syndromu u dıtete v zavislosti na veku matky, viz [18] anas obrazek 1, ci sledovanı vyskytu nekterych infekcnıch chorob, viz [3]. Dalsıkonkretnı prıklady vyuzitı v ruznych odvetvıch jsou uvedeny napr. v [17].

Joinpoint model je velmi casto vyuzıvan pri sledovanı zmen v trenduumrtnosti a vyskytu nekterych druhu onkologickych onemocnenı. Aplikaceprave v tomto specifickem odvetvı byla take hlavnı motivacı pro vznik meto-dologie navrzene v praci [12], na jejımz zaklade byl vyvinut specialnı softwareJoinpoint Regression Program, o nemz se blıze zmınıme v casti 4.

Autori Kim a kol. v [12] ukazujı jako prıklad aplikaci joinpoint modeluna data umrtnosti a vyskytu rakoviny prostaty v case. Je obecne znamo, zevyskyt tohoto typu rakoviny zaznamenal v poslednıch letech vyrazne zmeny,a to predevsım z duvodu zavedenı screeningoveho testu PSA (prostate spe-cific antigen). Zavedenı jakehokoliv obdobneho testu ma vzdy za nasledek

4

Page 5: JAK NA ODHAD JOINPOINT REGRESE - Univerzita Karlovahudecova/research/download/joinpoint_Hudecova.pdf · ho po ctu bod u zvratu kzalo zen na sekvenci permuta cn ch test u, v ce viz

20 25 30 35 40 45

−7−6

−5−4

Věk matky

Logi

t pra

vděp

odob

nost

i Dow

n. s

yndr

omu

odhadnutý modelint. spol. pro bod zvratu

Obrazek 1: Logit pravdepodobnosti vyskytu Downova syndromu dıtetev zavislosti na veku matky. Odhadnuty model byt spocten v programu Rfunkcı segmented.

nejdrıve rapidnı zvysenı vyskytu choroby (o prıpady, ktere by jinak bylyobjeveny mnohem pozdeji) casem nasledovane poklesem. Joinpoint modelumoznuje detekovat tyto prave popsane zmeny v trendu a nasledne pak lepeporozumet nekterym nepozorovatelnym charakteristikam PSA testu jako jsounapr. tzv. lead time (o jaky cas drıve je choroba odhalena pomocı tohototestu nez by byla objevena standardnımi technikami) a overdiagnosis (irele-vantnı diagnoza

”choroby“, ktera by nikdy nevytvorila symptomy a nevedla

by k umrtı). Joinpoint model odhadnuty pro data umrtnosti umoznuje nao-pak popsat benefity PSA screeningu.

Dalo by se namıtnout, ze pro prıslusna data by bylo mozne pouzıt i so-fistikovanejsı statisticke modely. Skutecnostı vsak je, ze joinpoint regrese jejednou z doporucovanych analytickych metod na webu National Cancer In-stitute of USA, viz [20]. Je proto mozne dohledat stovky medicınskych clankus onkologickou tematikou, ktere pouzıvajı prave tento model.

Zajımave vyuzitı joinpoint regrese lze nalezt take v clanku [19], kde jespojita po castech linearnı funkce pouzita k modelovanı chovanı poctu ci-

5

Page 6: JAK NA ODHAD JOINPOINT REGRESE - Univerzita Karlovahudecova/research/download/joinpoint_Hudecova.pdf · ho po ctu bod u zvratu kzalo zen na sekvenci permuta cn ch test u, v ce viz

5 10 15 20

010

030

050

0

Statistické časopisy

Rok od publikace

Poče

t cita

50 % kvantil 75 % kvantil95 % kvantil99 % kvantil

2 4 6 8 10 12 14

010

030

050

0

Časopisy JCO

Rok od publikace

Poče

t cita

50 % kvantil75 % kvantil95 % kvantil99 % kvantil

Obrazek 2: Nektere vyberove kvantily poctu citacı pro prednı statistickecasopisy a pro clanky z casopisu Journal of Clinical Oncology (JCO). Muzemepozorovat rozdılne trendy v case.

tacı statistickych clanku v zavislosti na poctu let od publikace. Nejprve jsouanalyzovany rozdılnosti v trendu poctu citacı v case pro prednı statistickecasopisy ve srovnanı s casopisem Journal of Clinical Oncology (JCO), vizobrazek 2. Dale je joinpoint model aplikovan prımo na jednotlive nejvıce cito-vane statisticke clanky a jsou zachycene ruzne trendy chovanı v case. Zajemceo tento problem odkazeme na www.beststatisticalpractices.org, kde jek dispozici jak clanek [19], tak i aktualizovany seznam

”nejvyznamnejsıch“

(ve smyslu nejvyssıho poctu tzv. aplikovanych citacı) statistickych clanku.K teto aplikaci joinpoint modelu si dovolıme nekolik poznamek. Jeho

pouzitı pro clanky z casopisu JCO se zda byt opravnene, jelikoz oba soft-wary nami popisovane v castech 4. a 5. zde dochazejı k vıcemene stejnymvysledkum — modelu s jednım bodem zvratu. Na druhou stranu pro prıpadstatistickych clanku nenı situace tak jednoducha a interpretace uvedena v [19]muze byt mozna i mırne zavadejıcı. Na zaklade nası analyzy se zda, ze v [19]je mensı nesrovnalost v modelu pro 99% kvantil poctu citacı statistickychclanku, kde se zda byt jednoducha linearnı zavislost dostacujıcı (namıstouvedeneho modelu s jednım zvratem).

6

Page 7: JAK NA ODHAD JOINPOINT REGRESE - Univerzita Karlovahudecova/research/download/joinpoint_Hudecova.pdf · ho po ctu bod u zvratu kzalo zen na sekvenci permuta cn ch test u, v ce viz

4. Software Joinpoint Regression Program

Kim a kol. ve svem clanku [12] navrhujı postup, na jehoz zaklade lze urcitpocet bodu zvratu a odhadnout parametry joinpoint modelu, vcetne polohybodu zvratu. Metoda je navrzena jak pro standardnı situaci, kdy jsou reg-resnı chyby nekorelovane nahodne veliciny s konstantnım rozptylem, tak ipro prıpad heteroskedastickych a autokorelovanych chyb. Tım je umoznenamj. prace s poissonovskymi odezvami, coz je vyhodne zejmena pro modelo-vanı vyskytu nejakeho jevu (napr. choroby) nebo umrtnosti v case.

Identifikace poctu bodu zvratu je zalozena na sekvenci nekolika permu-tacnıch testu zalozenych na modifikaci klasicke F-statistiky1. Tyto testy do-sahujı predepsane hladiny spolehlivosti asymptoticky a jejich p-hodnoty jsouspocteny pomocı Monte Carlo metody. Mnohonasobne testovanı je osetre-no Bonferroniho korekcı. Parametry modelu jsou odhadovany metodou grid

search navrzenou v clanku [15]. Body zvratu jsou nalezeny iteracne (prohleda-vanım mrızky) a odhad ostatnıch regresnıch parametru je proveden metodounejmensıch ctvercu, resp. vazenych nejmensıch ctvercu.

Obrazek 3: Joinpoint Regression Program: vstupnı dialog (vlevo) a vystupnıdialog (vpravo).

Na zaklade vyse popsane metodiky byl vyvinut software Joinpoint Re-gression Program (v dalsım jen JRP) pro odhad joinpoint modelu, viz [11].Tento program je k dispozici zdarma po zaregistrovanı se na webove strancehttp://surveillance.cancer.gov/joinpoint/. Jak jsme jiz zmınili v casti3., tento program je jednım z doporucenych analytickych nastroju pro praci

1Pro prehled vyuzitı permutacnıch prıstupu v analyze change-point modelu viz [10].

7

Page 8: JAK NA ODHAD JOINPOINT REGRESE - Univerzita Karlovahudecova/research/download/joinpoint_Hudecova.pdf · ho po ctu bod u zvratu kzalo zen na sekvenci permuta cn ch test u, v ce viz

s daty umrtnosti a vyskytu onkologickych onemocnenı na webu NationalCancer Institute of USA, viz [20]. Software JRP vıcemene vznikl pro tytopotreby, takze se nejvıce hodı pro modelovanı nejake promenne sledovane vpravidelnych intervalech v case. Pro slozitejsı modely s vıce promennymi nenı(zatım) velmi prizpusoben.

V soucasne dobe (8. prosince 2011) je k dispozici verze 3.5.2, ktera jizzaznamenala nekolik vylepsenı a rozsırenı oproti clanku [12]. Krome per-mutacnıho testu je mozne vybrat finalnı model na zaklade BIC nebo modifi-kovaneho BIC kriteria (jejich porovnanı jsme jiz strucne uvedli v casti 2., viztake [14]). Odhad parametru lze provadet jak metodou grid search, tak i po-mocı Hudsonovy metody, viz [9]. O techto dvou moznostech se blıze zmınımev nasledujıcım textu. Dale je mozne statisticky porovnat joinpoint model prodve skupiny dat. Konkretne je k dispozici test paralelnosti a identity zalozenyna metode popsane v [13]. Upravena je take korekce pro vıcenasobne tes-tovanı, ktere je nynı mene konzervativnı nez puvodne pouzita Bonferronihokorekce, viz [14].

JRP bezı pod operacnım systemem Windows (Windows 95 a novejsı). Jeuzivatelsky velice pohodlny a prehledny, viz obrazek 3. Uzivatel zvolı

”zaklik-

nutım“, zda chce modelovat prımo zavisle promennou nebo jejı logaritmus, avybere, zda je uvazovan model s konstantnım rozptylem nebo model heteros-kedasticky. Zde uzivatel bud’ sam specifikuje smerodatnou odchylku, nebovybere model s predpokladanym Poissonovym rozdelenım. Nasledne zvolıminimalnı a maximalnı pocet bodu zvratu, ktery ma byt uvazovan, metoduodhadu parametru (grid search nebo Hudsonovu), kriterium pro vyber nej-lepsıho modelu (permutacnı test, BIC, modifikovane BIC) a pocet MonteCarlo simulacı pro vypocet p-hodnoty permutacnıho testu. Defaultnı nasta-venı je grid search a permutacnı test zalozeny na 4499 simulacıch (test jetedy pak zalozen na 4500 vyberech). Krome toho je mozne odhadovat models autokorelovanymi chybami a regulovat nektere dalsı parametry.

Vystup z programu je opet uzivatelsky velmi pohodlny a prehledny, vizobrazek 3. Umoznuje prohlednout si vysledky (graf a tabulky vysledku) provsechny uvazovane pocty bodu zvratu. Vsechny casti vystupu (graf, vy-rovnane hodnoty, odhady parametru i vysledky jednotlivych permutacnıchtestu) je mozne exportovat. Prıklad toho, jak vypada graf exportovany z JRPvlozeny do LaTeXu, je uveden na obrazku 4.

Pro odhad modelu je k dispozici metoda grid search (prohledavanı mrız-ky) a Hudsonova metoda. Metoda grid search defaultne predpoklada bodzvratu v x-ove souradnici nekterych z pozorovanych dat. Za teto omezujıcıpodmınky vsak nedostaneme optimalnı resenı. Lepsıho vysledku lze dosah-nout zjemnenım mrızky, coz je mozne dosahnout vhodnou volbou prıslusneho

8

Page 9: JAK NA ODHAD JOINPOINT REGRESE - Univerzita Karlovahudecova/research/download/joinpoint_Hudecova.pdf · ho po ctu bod u zvratu kzalo zen na sekvenci permuta cn ch test u, v ce viz

Obrazek 4: Joinpoint model pro zavislost vyskytu rakoviny tlusteho strevau muzu v prubehu let

parametru (maximalne vsak 9 bodu mezi x-ove souradnice jednotlivych po-zorovanı). Druhou alternativou je Hudsonova dvoukrokova metoda navrzenav [9], kterou jsme jiz strucne zmınili v casti 2. Ta prochazı prıslusne pa-rametricke prostory spojite, viz [22], takze vede ke skutecne optimalnımuresenı, ktere je vzdy lepsı (resp. nenı horsı) nez resenı obdrzene metodou gridsearch. V tomto prıpade lze ale vybırat z modelu s maximalne ctyrmi zvraty(vıce by jiz bylo zrejme vypocetne neunosne). Oba prıstupy jsou v kombinacis provadenım permutacnıho testu pro vyber vhodneho poctu bodu zvratu do-sti casove narocne. Vypocet Hudsonovou metodou pak muze trvat i nekolikhodin, pouzitı grid search zabere radove nekolik minut nebo i mene. Privyberu BIC kriteria nebo modifikovaneho BIC (ktere vsak rozhodne nedo-porucujeme) trva vypocet nekolik vterin.

Zasadnı nevyhodou softwaru JRP je skutecnost, ze umoznuje pracovatpouze s modelem s jednou nezavisle promennou. To muze byt v praxi dostilimitujıcı. Duvodem je skutecnost, ze byl navrzen pro sledovanı vyskytu on-kologickych onemocnenı v case a v prıslusnych modelech je jedna nezavislepromenna (cas) vetsinou dostacujıcı. Vzhledem k tomu, ze vyvoj JRP staleprobıha a objevujı se nova vylepsenı a funkce, je mozne, ze se casem dockamei rozsırenı umoznujıcı praci s bohatsımi modely.

9

Page 10: JAK NA ODHAD JOINPOINT REGRESE - Univerzita Karlovahudecova/research/download/joinpoint_Hudecova.pdf · ho po ctu bod u zvratu kzalo zen na sekvenci permuta cn ch test u, v ce viz

Program JRP lze vyuzıt pro praci s linearnım nebo loglinearnım modelem.Pro prıpad joinpoint logisticke regrese byla metodologie z [12] modifikovanav clanku [3], ktery take nabızı alternativnı zpusob odhadu parametru (po-mocı podmınene verohodnostnı funkce) a je na nem zalozena knihovna ljr

v programu R.

5. Knihovna segmented v programu R

V programu R je pro odhad po castech linearnı spojite regresnı funkcek dispozici knihovna segmented, ktera je popsana v [18] a jejız metodikaje zalozena na clanku [17]. Zde se docteme, ze knihovna umoznuje odhadovatjoinpoint model pro celou trıdu zobecnenych linearnıch modelu, pricemz jemozne pracovat s vıce vysvetlujıcımi promennymi. Odhad modelu je prove-den nasledujıcım

”trikovym“ iteracnım postupem, ktery vsak bohuzel v praxi

casto selhava.Uvazujme, ze chceme odhadnout joinpoint model, ktery ma zlom v bode

ψ, ve kterem se smernice menı z β1 na β2 = β1 + δ1, tj. model

y = β0 + β1x+ δ1(x− ψ)+. (2)

V praci [17] je ukazano, ze jestlize ψ je pocatecnı odhad bodu zvratu ψ,pak model (2) je mozne odhadnout iterativnım odhadovanım nasledujıcıholinearnıho modelu

y = β0 + β1x+ δ1(x− ψ) + γI(x > ψ), (3)

kde I(·) je identifikator a γ je parametr, ktery merı nespojitost v bode zvratua pomocı nehoz je prepocıtavan odhad ψ, viz obrazek 5. Jestlize algoritmuskonverguje, pak by vysledna regresnı funkce mela byt spojita, tj. γ ≈ 0. Zo-becnenı postupu pro vıce bodu zvratu je zrejma. Pocatecnı hodnoty boduzvratu se doporucuje volit na zaklade posouzenı grafickeho znazornenı sledo-vane zavislosti.

Autor knihovny segmented v [17] prohlasuje, ze stejny postup lze pouzıti pro trıdu zobecnenych linearnıch modelu nebo modely prezıtı — obecne projakykoliv regresnı model s linearnım prediktorem. Blıze se vsak touto otazkounezabyva. Jak jsme uvedli v casti 2., odhady a testovanı bodu zvratu nenısnadna problematika ani v nejjednodussım prıpade linearnıho modelu s jed-nım zvratem a nezavislymi normalnımi chybami, viz napr. [8], [6]. Detekcezmen v zobecnenych linearnıch modelech je jeste o poznanı komplikovanejsız duvodu menıcıho se rozptylu. O tomto aspektu se vsak autor knihovnysegmented nijak nezminuje.

10

Page 11: JAK NA ODHAD JOINPOINT REGRESE - Univerzita Karlovahudecova/research/download/joinpoint_Hudecova.pdf · ho po ctu bod u zvratu kzalo zen na sekvenci permuta cn ch test u, v ce viz

5 10 15 20

510

15

β1

β2 = β1 + δ1

γ

β0 + β1xβ0 + β1x + δ1(x − ψ) + γI(x > ψ)

ψ

Obrazek 5: Model, pomocı nehoz je iterativne odhadnuta joinpoint regresefunkcı segmented

Knihovna segmented se nijak nezabyva odhadem poctu bodu zvratu.V manualu je uzivateli doporuceno pouzıt BIC kriterium nebo apriornı zna-lost problemu pro vyber vhodneho poctu bodu zvratu. O moznych nevyho-dach BIC kriteria jsme se jiz zmınili v sekci 2. K dispozici je take test nazvanydavies.test vychazejıcı z obecneho clanku [4], ktery je zde aplikovan na testhypotezy H0 : δ1 = 0 (podrobnosti viz [18]). Tento test je vsak spıse konzer-vativnı a rozhodne jej nelze doporucit pro vyber poctu bodu zvratu.

Pri praci s knihovnou segmented muze uzivatel narazit na ruzne problemy.Verohodnostnı funkce v joinpoint modelu nemusı byt konkavnı, takze algo-ritmus nemusı nalezt globalnı maximum. Doporucuje se proto spustit pro-gram pro nekolik ruznych pocatecnıch hodnot parametru ψ. Samozrejme,cım vyraznejsı je skutecna zmena ve smernici, tım mensı je vyznam pocatecnıvolby ψ. Dostaneme-li ruzne hodnoty odhadu bodu zvratu, je mozne pozadatprogram o vypis verohodnosti odpovıdajıcı jednotlivym modelum a

”rucne“

vybrat ten nejvhodnejsı. V prıpade, kdy je verohodnostnı funkce v okolı svehomaxima

”plocha“, mohou ruznym bodum parametrickeho prostoru odpovıdat

11

Page 12: JAK NA ODHAD JOINPOINT REGRESE - Univerzita Karlovahudecova/research/download/joinpoint_Hudecova.pdf · ho po ctu bod u zvratu kzalo zen na sekvenci permuta cn ch test u, v ce viz

temer identicke hodnoty logaritmicke verohodnosti. Pak muze popsany al-goritmus vest k vetsımu mnozstvı

”kandidatnıch modelu“ v zavislosti na

pocatecnı volbe ψ. Uzivatel pak jen stezı zvolı ten”spravny“.

Dalsım problemem je situace, kdy algoritmus nekonverguje vubec, nacoz nas program upozornı varovnou hlaskou (byl dosazen maximalnı pocetiteracnıch kroku). Navysenı poctu povolenych iteracı vetsinou problem nevy-resı, jelikoz tato situace nastava casto v prıpade, kdy minimalizovana funkce(rezidualnı soucet ctvercu) alternuje mezi dvema ruznymi hodnotami. Jednoumoznostı napravy je (jak navrhuje manual) zmensenı prırustku, ktery se mezijednotlivymi kroky pripocıtava k dosavadnımu odhadu bodu zvratu. To alebohuzel problem dost casto neresı a konvergence nenı dosazena ani po tetozmene nastavenı. V takovem prıpade program sice jakysi odhad poskytne,jedna se ale o nespojitou funkci.

Autor [18] upozornuje, ze jestlize konvergence nenı dosazena automatickynebo v prıpade, kdy obdrzıme ruzne vysledky pro ruzna pocatecnı nasta-venı parametru ψ, muze byt parametrizace joinpoint modelem pro dana datadiskutabilnı. Doporucuje pak test prıtomnosti bodu zvratu (vyse zmınenydavies.test) nebo posouzenı BIC kriteria. Jak vsak ukazuje nase analyzasimulovanych dat, viz cast 6.1., tyto problemy mohou nastat i v prıpade datgenerovanych z joinpoint modelu.

Jeste neprıjemnejsı je vsak situace, kdy se program tvarı, ze odhad probehlv poradku, ale vysledkem odhadu je nespojita funkce. Bohuzel, i s takovousituacı se muze setkat uzivatel knihovny segmented, viz nas prıklad s realny-mi daty v casti 6.2. V manualu o tomto problemu nenı ani zmınka. Uzivatel bypak bez dukladne inspekce grafickeho znazornenı odhadnute zavilosti (neboalgebraickeho prepocıtanı prusecıku) nemusel tuto zavadu vubec odhalit, cozby mohlo byt nasledne dosti zavazne.

6. Porovnanı

Nektere rozlisnosti softwaru JRP a knihovny segmented jiz byly popsanyvyse. Pripomenme, ze JRP oproti segmented umoznuje testovat pocet boduzvratu pomocı permutacnıch testu a praci s autokorelovanymi chybami. Nadruhou stranu v nem lze pracovat jen s modely s jednou nezavisle promennou.Knihovna segmented je schopna pracovat (byt’ ne vzdy s uspechem) s obec-nejsımi modely (zobecnene linearnı modely, Coxuv model prezitı apod.). Me-tody dohadu parametru se taktez lisı.

Jak jsme uvedli v casti 4., program JRP defaultne predpoklada bodyzvratu v nektere z x-ovych souradnic namerenych dat, coz vsak nevede k opti-malnımu resenı. Tento predpoklad lze zmenit volbou Hudsonovy odhadovacı

12

Page 13: JAK NA ODHAD JOINPOINT REGRESE - Univerzita Karlovahudecova/research/download/joinpoint_Hudecova.pdf · ho po ctu bod u zvratu kzalo zen na sekvenci permuta cn ch test u, v ce viz

metody, ktera jiz dava optimalnı odhad. V nasledujıcıch prıkladech ukazemevysledky pro Hudsonovu metodu, pricemz pro volbu vhodneho poctu boduzvratu byla pouzita sekvence permutacnıch testu. Je vsak treba upozornit,ze takovy vypocet trva na beznem pocıtaci i nekolik hodin (volı-li programmezi 0 az 4 body zvratu).

Nynı uvedeme porovnanı chovanı obou softwaru na nekolika konkretnıchdatovych souborech.

6.1. Analyza simulovanych dat

V clanku prof. Andela byl proveden odhad joinpoint modelu v programuR funkcı segmented pro simulovana data. Pripomenme, ze se jedna o datagenerovana z modelu

Ey = 2 + x− 1.5 (x− 10)+ + 0.5 (x− 20)+ − (x− 26)+

s nezavislymi gausovskymi chybami.Pro model s chybami se smerodatnou odchylkou 0.4 probıha vsechno bez

problemu, avsak pro prıpad chyb se smerodatnou odchylkou 0.6 jiz algo-ritmus nekonverguje. Zvolenı mensıho kroku nebo nastavenı vyssıho poctuiteracı problem neresı. Menıme-li dostatecne vytrvale startovacı hodnoty projoinpoint body zvratu, pak pro volbu (11, 17, 29) lze dosahnout konvergencek ponekud nespravnemu modelu, ktery ma zvraty v bodech 4.6, 10.1 a 29.8.Pro nastavenı (8, 15, 27) zase dostaneme model se zvraty v bodech 9.8, 27.6a 30.4. Z porovnanı verohodnostnı funkce bychom mohli dojıt k zaveru, zeprvnı (

”spatny“) model je o neco lepsı nez druhy zmıneny (

”spatny“) model.

Nicmene, oba se jiste lisı od skutecneho modelu, viz obrazek 6. Pro vyssıhodnoty smerodatne odchylky (0.8, 1 a 1.2) je situace podobna az horsı.

Stejna data jsme analyzovali take v programu JRP. Pro pozorovanı sesmerodatnou odchylkou 0.4 dostavame prakticky identicke vysledky (rozdılyv odhadech se objevujı az na patem desetinnem mıste). Pro model se smero-datnou odchylkou 0.6 JRP odhadne tri body zvratu (10.5, 21.1 a 27), bodoveodhady smernic jsou 0.95,−0.58,−0.07,−1.04. JRP dale uspesne

”zvladne“

i situace, kdy je smerodatna odchylka zvolena jako 0.8 a 1. Napr. pro datasimulovana s rozptylem 1 permutacnı test vybere model se tremi body zvratu10.8, 20.6 a 27 a bodove odhady smernic jsou 0.92, −0.63, −0.02, −1.00. Proprıpad dat generovanych se smerodatnou odchylkou 1.2 jiz permutacnı testnavrhuje model pouze s jednım bodem zvratu v bode 10.3, kde se smernicemenı z 0.90 na −0.45.

Na zaklade techto vysledku lze konstatovat, ze pro uvedena simulova-na data dava program JRP (permutacnı test a Hudsonova metoda) lepsı

13

Page 14: JAK NA ODHAD JOINPOINT REGRESE - Univerzita Karlovahudecova/research/download/joinpoint_Hudecova.pdf · ho po ctu bod u zvratu kzalo zen na sekvenci permuta cn ch test u, v ce viz

0 5 10 15 20 25 30

24

68

1012

x

y

skutečný modelmodel s poč. volbou (10,20,26)model s poč. volbou (8,15,27)

Obrazek 6: Dva”spatne“ modely pro simulovana data se smerodatnou od-

chylkou 0.6 v porovnanı se skutecnym modelem

vysledky nez knihovna segmented v R.

6.2. Analyza vyskytu rakoviny tlusteho streva

Na internetovych strankach softwaru JRP, viz [11], jsou k dispozici datao vyskytu rakoviny tlusteho streva v USA v letech 1973–2002 pochazejıcız databaze SEER (Surveillance Epidemiology and End Results), viz [20]. Kekazdemu roku je k dispozici pocet prıpadu, velikost populace, vyskyt cho-roby mereny pomocı AAR (age adjusted rate) a spoctena smerodatna chyba(spocteno v SEER), ktera se vyuzıva pro vypocet vah v heteroskedastickemmodelu. Data jsou k dispozici jak zvlast’ pro muze a zeny, tak i bez rozlisenı.Je uvazovan heteroskedasticky model zavislosti logaritmu AAR na roku diag-nozy s nekorelovanymi chybami. Porovnejme vysledky JRP a segmented prosoubor muzu.

Vybırame-li mezi modely s nula az ctyrmi body zvratu (vıce nenı proHudsonovu metodu v JRP mozne), vybere JRP jako nejlepsı model se ctyrmibody zvratu. Vysledne prolozenı je uvedeno na obrazku 4. Konkretnı odhady

14

Page 15: JAK NA ODHAD JOINPOINT REGRESE - Univerzita Karlovahudecova/research/download/joinpoint_Hudecova.pdf · ho po ctu bod u zvratu kzalo zen na sekvenci permuta cn ch test u, v ce viz

1975 1980 1985 1990 1995 2000

4.10

4.20

4.30

Rok

log(

AA

R)

pozorováníodhadnutý modelint. spol. pro bod zvratu

Obrazek 7: Odhadnuty nespojity model z programu R pro data vyskytu ra-koviny tlusteho streva u muzu

parametru zde uvadet nebudeme.Stejny model se ctyrmi body zvratu se pokusıme odhadnout v programu

R funkcı segmented. Zadame proto stejne vahy v JRP a zvolıme pocatecnıhodnoty bodu zvratu napr. jako 1985, 1989, 1994 a 1998. Algoritmus v tomtoprıpade konverguje ve ctyrech krocıch a vsechno se zda byt v poradku, vizvystup uvedeny v tabulce 1. Kdyz si ovsem nechame vykreslit graf odhad-nute funkce, zjistıme, ze je nespojita. To je patrne z obrazku 7. Navıc lzespocıtat, ze odhadnute body zvratu skutecne nejsou prusecıky jednotlivychodhadnutych prımek. Takovy vysledek lze jen stezı povazovat za uspokojivy.Poznamenejme jeste, ze stejny problem nastava i pro model s mene bodyzvratu. Proto pro prıpad techto realnych je urcite vhodnejsı pouzitı softwaruJRP nez knihovny segmented.

7. Zaver

V nasem prıspevku jsme se pokusili podat strucny prehled toho, k cemujoinpoint model v praxi slouzı a jak jej lze odhadovat. Naznacili jsme, ze

15

Page 16: JAK NA ODHAD JOINPOINT REGRESE - Univerzita Karlovahudecova/research/download/joinpoint_Hudecova.pdf · ho po ctu bod u zvratu kzalo zen na sekvenci permuta cn ch test u, v ce viz

***Regression Model with Segmented Relationship(s)***

Call:

segmented.lm(obj = mod1, seg.Z = ~year, psi = list(year = c(10,

16, 21, 25) + 1973), control = seg.control(display = T, it.max = 20,

h = 0.001))

Estimated Break-Point(s):

Est. St.Err

psi1.year 1985 0.5260

psi2.year 1991 0.6866

psi3.year 1995 0.3139

psi4.year 1997 0.2435

t value for the gap-variable(s) V: 1.1032e-13 1.6078e-13 2.6054e-13

2.3227e-13

Meaningful coefficients of the linear terms:

Estimate Std. Error t value Pr(>|t|)

(Intercept) -1.835e+01 1.816e+00 -10.108 2.64e-09 ***

year 1.145e-02 9.174e-04 12.477 6.81e-11 ***

U1.year -2.400e-02 3.559e-03 -6.745 NA

U2.year -2.035e-02 4.840e-03 -4.205 NA

U3.year 7.115e-02 1.513e-02 4.701 NA

U4.year -6.547e-02 1.510e-02 -4.336 NA

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.837 on 20 degrees of freedom

Multiple R-Squared: 0.9859, Adjusted R-squared: 0.9795

Convergence attained in 4 iterations with relative change -3.496302e-15

Tabulka 1: Vysledek funkce summary pro joinpoint model se ctyrmi bodyzvratu pro data vyskytu rakoviny tlusteho streva u muzu

16

Page 17: JAK NA ODHAD JOINPOINT REGRESE - Univerzita Karlovahudecova/research/download/joinpoint_Hudecova.pdf · ho po ctu bod u zvratu kzalo zen na sekvenci permuta cn ch test u, v ce viz

z teoretickeho hlediska se nejedna o snadne tema a vyzkum v teto oblasti jestale aktualnı. Provedli jsme porovnanı softwaru Joinpoint Regression Pro-gram a knihovny segmented z programu R. Z tohoto souboje nevychazı anijeden jako jasny vıtez. JRP bohuzel umoznuje pracovat pouze s pomernejednoduchymi modely s jedinou nezavisle promennou. V prıpadech, kdy ses takovym modelem spokojıme, vsak lze tento program z uzivatelskeho hle-diska doporucit. Naproti tomu segmented dava v nekterych prıpadech neu-spokojive vysledky, viz odstavec 6.2.. Z tohoto duvodu bychom potencialnımuzivatelum urcite doporucili obezretnost pri praci s touto knihovnou.

Jak jsme uvedli v casti 2., joinpoint model ma blızko k change-point reg-resnım modelum, o kterych existuje rozsahla literatura, viz [16]. V prıpa-de, kdy spojitost regresnı funkce nenı vyzadovana, je proto mozne pouzıtnekterou z metod vyvinutych pro tuto trıdu modelu. Nektere z nich jsou vprogramu R implementovany v knihovne strucchange.

Podekovanı: Prace byla podporena vyzkumnym zamerem MSM 0021620839Metody modernı matematiky a jejich aplikace. Autorka je vdecna prof. J. An-tochovi a prof. M. Huskove za jejich cenne pripomınky.

Reference

[1] Antoch, J.; Huskova, M.: Permutation tests in change point analysis.Statist. Probab. Lett., rocnık 53, 2001: s. 37–46.

[2] Antoch, J.; Huskova, M.; Praskova, Z.: Effect of dependence on statisticsfor determination of change. J. Statist. Plann. Inferenc, rocnık 60, c. 2,1997: s. 291–310.

[3] Czajkowski, M.; Gill, R.; Rempala, G.: Model selection in logistic jo-inpoint regression with applications to analyzing cohort mortality pat-terns. Stat.Med., rocnık 27, c. 9, 2008: s. 1508–1526.

[4] Davies, R.: Hypothesis testing when a nuisance parameter is present onlyunder the alternative. Biometrika, rocnık 74, 1987: s. 33–43.

[5] Feder, P.: The log likelihood ration in segmented regression. Ann. Sta-

tist., rocnık 3, 1975: s. 84–97.

[6] Feder, P.: On asymptotic distribution theory in segmented regressionproblems — identified case. Ann. Statist., rocnık 3, 1975: s. 49–83.

[7] Hawkins, D. M.: Point estimation of the parameters of piecewise regres-sion models. Appl. Statist., rocnık 25, 1976: s. 51–57.

17

Page 18: JAK NA ODHAD JOINPOINT REGRESE - Univerzita Karlovahudecova/research/download/joinpoint_Hudecova.pdf · ho po ctu bod u zvratu kzalo zen na sekvenci permuta cn ch test u, v ce viz

[8] Hinkley, D. V.: Inference in two-phase regression. J. Amer. Statist. As-

soc., rocnık 66, c. 336, 1971: s. 736–743.

[9] Hudson, D.: Fitting segmented curves whose join points have to be esti-mated. J. Amer. Statist. Assoc., rocnık 61, 1966: s. 1097–1129.

[10] Huskova, M.: Permutation principle and bootstrap in change point ana-lysis. In Asymptotic Methods in Stochastics, Fields Institute Communi-

cations, rocnık 44, editace M. Csorgo; L. Horvath; B. Szyszkowicz, 2004,s. 273–291.

[11] Joinpoint Regression Program: Version 3.5 — April 2011. StatisticalMethodology and Applications Branch and Data Modeling Branch, Sur-veillance Research Program National Cancer Institute, 2011, web pagehttp://surveillance.cancer.gov/joinpoint/.

[12] Kim, H. J.; Fay, M. P.; Feuer, E. J.; aj.: Permutation tests for joinpointregression with applications to cancer rates. Stat. Med., rocnık 19, 2000:s. 335–351, correction 2001, 20, 655.

[13] Kim, H.-J.; Fay, M. P.; Yu, B.; aj.: Comparability of segmented lineregression models. Biometrics, rocnık 60, c. 4, 2004: s. 1005–1014.

[14] Kim, H.-J.; Yu, B.; Feuer, E. J.: Selecting the number of change-pointsin segmented line regression. Statist. Sinica, rocnık 19, 2009: s. 597–609.

[15] Lerman, P.: Fitting segmented regression models by grid search. Appl.

Statist., rocnık 29, 1980: s. 77–84.

[16] Marusiakova, M.: Tests for multiple changes in linear regression models.Dizertacnı prace, Charles University in Prague, 2009.

[17] Muggeo, V. M. R.: Estimating regression models with unknown break-points. Stat.Med., rocnık 22, 2003: s. 3055–3071.

[18] Muggeo, V. M. R.: segmented: An R package to fit regression modelswith broken-line relationships. R News, rocnık 8, c. 1, 2008: s. 20–25.

[19] Schell, M. J.: Identifying key statistical papers from 1985 to 2002 usingcitation data for applied biostatisticians. Amer. Statist., rocnık 64, c. 4,2010: s. 310–317.

[20] SEER: The Surveillance, Epidemiology, and End Results Program. Nati-onal Cancer Institute, web page http://seer.cancer.gov/.

18

Page 19: JAK NA ODHAD JOINPOINT REGRESE - Univerzita Karlovahudecova/research/download/joinpoint_Hudecova.pdf · ho po ctu bod u zvratu kzalo zen na sekvenci permuta cn ch test u, v ce viz

[21] Sprent, P.: Some hypotheses concerning two-phase regression lines. Bi-

ometrics, rocnık 17, 1961: s. 634–45.

[22] Yu, B.; Barrett, M.; Kim, H.-J.; aj.: Estimating Joinpoints in ContinuousTime Scale for Multiple Change-Point Models. Comput. Statist. Data

Anal., rocnık 51, 2007: s. 2420–2427.

[23] Zhang, N. R.; Siegmund, D. O.: A modified Bayes information criterionwith applications to the analysis of comparative genomic hybridizationdata. Biometrics, rocnık 63, 2007: s. 22–32.

19