HABILITATION A DIRIGER DES RECHERCHES - · PDF fileHABILITATION A DIRIGER ... La ligne directrice de ces travaux concerne l’ etude ... Chapitre 4 visent a d evelopper de nouveaux

UNIVERSITE PIERRE ET MARIE CURIE

HABILITATION A DIRIGER

DES RECHERCHES

Auteur :

Olivier Lopez

Contributions a l’etude desmodeles de duree dans un cadre

multivarie

Laboratoire de Statistique Theorique et Appliquee

Jury :

Rapporteurs : Christian Genest - Universite Mc GillIrene Gijbels - Katholieke Universiteit LeuvenChristian Robert - Universite Lyon 1

Examinateurs : Gerard Biau - Universite Pierre et Marie CurieJean-David Fermanian - Crest-Ensae Paris TechMathieu Rosenbaum - Universite Pierre et Marie CurieJean-Michel Zakoian - Crest-Ensae Paris Tech

Table des matieres

1 Estimation nonparametrique pour la regression censuree 5

1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.2 Donnees censurees et regression . . . . . . . . . . . . . . . . . . . . . 7

1.2.1 Cadre general . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.2.2 Exemples d’applications . . . . . . . . . . . . . . . . . . . . . 7

1.2.3 Les hypotheses d’identifiabilite . . . . . . . . . . . . . . . . . 8

1.3 Estimation de la fonction de repartition dans le cadre d’un modele

de regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.3.1 Estimation de la fonction de repartition conditionnelle . . . . 11

1.3.2 Estimation de la loi jointe de (T,X) . . . . . . . . . . . . . . 11

1.3.3 Resultats theoriques obtenus . . . . . . . . . . . . . . . . . . 12

1.4 Premieres applications et extensions . . . . . . . . . . . . . . . . . . 13

1.4.1 Estimation dans un modele de regression parametrique . . . . 13

1.4.2 Extension au cas ou la fonction g est inconnue . . . . . . . . 13

1.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2 Modeles single-index 15

2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.2 Deux modeles single-index . . . . . . . . . . . . . . . . . . . . . . . . 16

2.2.1 Modele 1 : estimation de la densite conditionnelle . . . . . . . 16

2.2.2 Modele 2 : estimation d’une esperance conditionnelle. . . . . 18

2.3 Resultats theoriques . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.3.1 Formulation des resultats pour le Modele 1. . . . . . . . . . . 19


2.3.3 Arguments principaux des preuves . . . . . . . . . . . . . . . 21

2.4 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3 Evenements recurrents 25

3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

3.2 Modele single-index pour l’analyse d’evenements recurrents . . . . . 26

3.2.1 Description du modele . . . . . . . . . . . . . . . . . . . . . . 26

3.2.2 Resultats obtenus . . . . . . . . . . . . . . . . . . . . . . . . 28

3.3 Combinaison d’un modele de detection de rupture et d’un modele de

Cox . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29


3.3.2 Estimation et choix du parametre l . . . . . . . . . . . . . . . 31

3.3.3 Synthese des principaux resultats obtenus . . . . . . . . . . . 31

3.4 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.4.1 Formulation du probleme . . . . . . . . . . . . . . . . . . . . 32

3.4.2 Combinaison des differents modeles de ce chapitre . . . . . . 33

ii Table des matieres

4 Regression et censure multivariee 35

4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4.2 Estimation de la fonction de repartition . . . . . . . . . . . . . . . . 37

4.2.1 Les observations . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.2.2 Revue de la litterature . . . . . . . . . . . . . . . . . . . . . . 37

4.2.3 Approche generale pour estimer la distribution de (T,U) . . . 39

4.2.4 Un premier cadre : modelisation de la loi des censures . . . . 39

4.2.5 Un second cadre : introduction d’une variable auxiliaire . . . 41

4.3 Proprietes theoriques des estimateurs obtenus . . . . . . . . . . . . . 42

4.3.1 Premier cadre . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

4.3.2 Deuxieme cadre . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4.4 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4.4.1 Regression : illustration dans le cadre 1 . . . . . . . . . . . . 44

4.4.2 Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.4.3 Tests d’adequation pour des modeles de copules . . . . . . . . 46

4.5 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

5 Censure multivariee et troncature a gauche 51

5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

5.2 Construction de l’estimateur . . . . . . . . . . . . . . . . . . . . . . . 53

5.2.1 Observations . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

5.2.2 Une equation aux derivees partielles . . . . . . . . . . . . . . 53

5.2.3 Definition de l’estimateur et justification de son existence . . 54

5.3 Proprietes de convergence . . . . . . . . . . . . . . . . . . . . . . . . 56

5.3.1 Etude des poids Wi,n . . . . . . . . . . . . . . . . . . . . . . . 56

5.3.2 Integrales par rapport a F . . . . . . . . . . . . . . . . . . . . 57

5.4 Application sur donnees reelles . . . . . . . . . . . . . . . . . . . . . 57

5.4.1 Applications generales . . . . . . . . . . . . . . . . . . . . . . 57

5.4.2 Jeu de donnees canadiennes . . . . . . . . . . . . . . . . . . . 57

5.5 Extension de la notion de copule empirique et perspectives . . . . . 58

5.5.1 Copule empirique . . . . . . . . . . . . . . . . . . . . . . . . . 58

5.5.2 Evolution generationnelle de la dependance . . . . . . . . . . 60

Bibliographie 63

Introduction

Ce memoire d’habilitation presente la synthese des travaux que j’ai pu effectuer

depuis mon arrivee au Laboratoire de Statistique Theorique et Appliquee en sep-

tembre 2008. Ils s’inscrivent dans la continuite d’un parcours debute au cours de

ma these de doctorat, et enrichi par le contact avec de nouvelles thematiques.

La ligne directrice de ces travaux concerne l’etude des modeles de durees dans

un cadre multivarie. Plus precisement, l’une des thematiques principales concerne

l’impact de phenomenes omnipresents dans ce type de modeles : la censure et la

troncature. Ces phenomenes parasites, qui entraınent la presence d’observations

incompletes, sont lies a la structure meme des donnees utilisees pour l’etude des

modeles de duree. En effet, une duree n’est pas une variable mesurable instan-

tanement. Par exemple, si l’on considere l’etude de la duree de vie de personnes

detenant un contrat d’assurance, le rachat anticipe du contrat par l’assure (avant son

deces, donc), empeche d’observer completement la variable d’interet. Le probleme

de la censure ne se restreint pas neanmoins a la seule modelisation des durees. On

peut egalement donner l’exemple, en assurance, d’un cout de sinistre qui n’est pas

necessairement regle dans sa totalite. Ce type de situation intervient notamment

dans le cadre des garanties a developpement longs, notamment responsabilite civile,

ou la liquidation de certains sinistres peut prendre plusieurs annees.

Les modeles consideres dans ce memoire ont donc pour vocation de s’appliquer

dans un large eventail de situations. Par ailleurs, les techniques utilisees pour prou-

ver la convergence des estimateurs consideres (notamment les techniques issues de

la theorie des processus empiriques) peuvent etre reemployees dans d’autres cadres,

et certaines de ces extensions seront exposees dans le present memoire.

L’une des particularites des travaux presentes ici tient au fait que l’on etudie

des durees dans un univers multivarie : en plus d’une variable de duree, plusieurs

variables sont disponibles, qu’elles soient des variables explicatives non censurees

(Chapitres 1 a 3), ou d’autres variables de duree (Chapitres 4 et 5). Ce cadre multi-

varie ne presente pas de difficultes majeures si l’on se place dans un cadre purement

parametrique, ou des techniques d’estimation par maximum de vraisemblance sont

largement employees. En revanche, des lors que l’on se place dans des modeles sta-

tistiques non parametriques (ou semi parametriques comme aux Chapitres 2 et 3), la

definition d’outils adaptes s’avere plus delicate. Les reponses pertinentes reclament

notamment de se placer sous des hypotheses d’identifiabilite raisonnables quand on

les confronte aux situations modelisees. Cette question des hypotheses d’identifiabi-

lite est un probleme crucial en presence de donnees censurees et/ou tronquees. Elle

est indispensable a la bonne definition des objets que l’on souhaite estimer. Cette

problematique, presente tout au long du memoire, est notamment evoquee plus en

detail au Chapitre 1.

La premiere partie de ce memoire d’habilitation prolonge des resultats obtenus

dans ma these de doctorat (voir Lopez (2007)). Elle vient completer des approches

2 Table des matieres

presentes dans ce precedent travail, afin de les generaliser a un contexte plus realiste

et plus complet du point de vue des hypotheses sous-jacentes. Dans le Chapitre 1,

on effectue une presentation generale du cadre des modeles de regression censures,

pour lesquels les observations sont constituees d’une variable d’interet censuree,

et de plusieurs variables explicatives. De facon sommaire, il existe deux grands

types de modeles dans ce cadre : ceux bases sur une independance entre les va-

riables du modele et le phenomene de censure, et ceux qui autorisent ce phenomene

de censure a dependre des variables explicatives. Ce deuxieme cadre entraıne des

developpements plus delicats, necessitant la construction d’un estimateur non pa-

rametrique de la distribution des variables. Cet estimateur est la principale contri-

bution de ce chapitre. Il presente notamment l’avantage, contrairement aux estima-

teurs concurrents, de conserver de bonnes proprietes de convergence meme quand

la dimension des variables explicatives est superieure a 1.

Le Chapitre 2 s’interesse a des modeles de regression semi-parametriques type

single-index. Les modeles single-index repondent a un imperatif de reduction de di-

mension : en supposant que la fonction de regression ne depend des variables expli-

catives qu’a travers une combinaison lineaire de ces variables, on se premunit contre

la trop faible vitesse de convergence des estimateurs purement non parametriques.

Les travaux presentes au Chapitre 2 peuvent etre vus comme un prolongement de

Lopez (2011), puisqu’ils repondent a deux difficultes pointees dans cet article : la

difficulte d’estimer convenablement la queue droite de distribution en presence de

censure a droite, et la necessite de considerer un cadre (conforme a celui expose

dans le Chapitre 1) ou la censure peut dependre des variables explicatives. Les

outils techniques utilises pour valider ces methodes presentent l’avantage de pou-

voir etre adaptees (via un certain nombre d’amenagements) a d’autres cadres, on

considerera notamment le cas d’un modele de regression Pareto.

Dans le Chapitre 3, on considere des problematiques liees a l’analyse des

evenements recurrents. Plusieurs approches sont developpees pour modeliser le

temps entre deux occurrences successives. On examinera une approche single-index,

inspiree des elements du Chapitre 2, pour cerner l’impact de variables explicatives

sur la frequence de ces evenements recurrents. On s’interrogera egalement sur des

approches permettant de detecter d’eventuels changements brutaux de dynamique

dans de tels processus. Les modeles de detection de rupture qui sont consideres dans

ce chapitre sont motives par des applications, l’une a l’analyse des reservations a la

SNCF, l’autre a l’etude de la repartition des sinistres d’une compagnie d’assurance

sur l’ensemble d’une annee.

Les deux derniers chapitres de ce memoire d’habilitation se penchent sur le cas ou

plusieurs variables de duree sont modelisees conjointement. La gestion d’une censure

multivariee pose de nombreuses difficultes techniques. Les approches developpees au

Chapitre 4 visent a developper de nouveaux estimateurs de la distribution au prix

d’hypotheses simplificatrices sur le processus de censure, hypotheses qui restent

neanmoins valides pour de nombreuses applications. Si les techniques utilisees pour

prouver la convergence asymptotique sont differentes, le principe de construction

des estimateurs reprend, dans un nouveau cadre, une logique deja presente au Cha-

Table des matieres 3

pitre 1. Le Chapitre 5 vise quant a lui a s’affranchir des contraintes imposees par

les conditions simplificatrices du Chapitre 4. Les variables de censure considerees ne

sont sujettes qu’a des hypotheses minimales. On introduit egalement la presence de

troncature a gauche, frequemment rencontree dans les modeles de duree. Le fait de

se placer dans ce cadre general necessite l’introduction de techniques d’estimation

plus elaborees. L’approche developpee pour estimer non parametriquement la distri-

bution des variables du modele est basee sur la resolution d’une version discretisee

d’une equation aux derivees partielles. L’interet des estimateurs des Chapitres 4 et

5 est illustre notamment pour la construction de tests d’adequation a des modeles

de copules, ainsi que de procedures de type bootstrap.

Chapitre 1

Estimation nonparametrique

pour la regression censuree

Sommaire

1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.2 Donnees censurees et regression . . . . . . . . . . . . . . . . 7

1.2.1 Cadre general . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.2.2 Exemples d’applications . . . . . . . . . . . . . . . . . . . . . 7

1.2.3 Les hypotheses d’identifiabilite . . . . . . . . . . . . . . . . . 8

1.3 Estimation de la fonction de repartition dans le cadre d’un

modele de regression . . . . . . . . . . . . . . . . . . . . . . . 10

1.3.1 Estimation de la fonction de repartition conditionnelle . . . . 11

1.3.2 Estimation de la loi jointe de (T,X) . . . . . . . . . . . . . . 11

1.3.3 Resultats theoriques obtenus . . . . . . . . . . . . . . . . . . 12

1.4 Premieres applications et extensions . . . . . . . . . . . . . . 13

1.4.1 Estimation dans un modele de regression parametrique . . . . 13

1.4.2 Extension au cas ou la fonction g est inconnue . . . . . . . . 13

1.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.1 Introduction

D’un point de vue statistique, l’une des specificites des modeles de duree tient

dans le fait que les observations dont dispose le praticien sont souvent incompletes.

En effet, contrairement a d’autres types de variables statistiques qui peuvent etre

mesurees ou recuperees instantanement, un grand nombre de phenomenes parasites

peuvent se produire entre le moment ou debute une etude statistique, et le moment

ou la duree recherchee est effectivement observee.

Par exemple, un probleme usuel en assurance-vie consiste a inferer sur la dis-

tribution de la duree de vie des assures, et l’estimation de cette duree s’effectue

a partir de donnees issues d’un portefeuille d’assures observes sur un certain laps

de temps. Entre le debut de la periode d’observation et sa fin, certains assures

peuvent, par exemple, rompre leur contrat et cessent alors d’etre observes. Dans ce

cas, de meme que pour les individus qui se trouvent etre toujours vivants a la fin de

l’etude, la duree qui interesse le statisticien n’est pas connue pour tous les individus

(phenomene dit de censure).

6 Chapitre 1. Estimation nonparametrique pour la regression censuree

L’introduction dans les demarches statistiques de ce type d’observations in-

completes necessite de redefinir les outils classiques d’estimation ou de test. On peut

en effet mettre facilement en evidence le fait que l’occultation de ce phenomene n’est

pas pertinente : negliger les observations censurees entraıne une sous-representation

des durees les plus importantes, lesquelles sont plus souvent sujettes a la censure

(plus la duree de vie d’un individu est longue, plus la probabilite qu’il cesse d’etre

observe pour une raison ou une autre dans ce laps de temps devient importante).

L’estimateur de Kaplan-Meier (Kaplan et Meier (1958)) est l’un des outils fon-

damentaux de l’estimation non-parametrique de la distribution d’une duree en

presence de censure. On pourra consulter Gill (1983), Stute et Wang (1993), Stute

(1995) ou Gijbels et Veraverbeke (1991) pour differentes proprietes asymptotiques

du processus de Kaplan-Meier.

Dans le contexte de la regression, ces techniques doivent etre adaptees, car

l’introduction d’une ou plusieurs variables explicatives change la donne. La princi-

pale question qui se pose est liee aux conditions d’identifiabilite du modele. Si on

considere que les variables explicatives n’ont pas (ou peu) d’impact sur le phenomene

de censure, des techniques basees sur l’estimateur de Kaplan-Meier peuvent etre

utilisees, voir notamment Stute (1993) et Stute (1996). Si, a l’inverse, les variables

explicatives influencent la censure, un nouveau faisceau de methodes doit etre uti-

lise, voir notamment Beran (1981), Dabrowska (1988), Van Keilegom et Akritas

(1999).

Les deux contextes repondent a des exigences de modelisation differentes (voir les

exemples dans la section 1.2.3). Nous nous concentrons, dans le present chapitre, sur

le cadre ou la censure depend des variables explicatives. On considerera un nouvel

estimateur de la distribution de l’ensemble des variables (explicatives et expliquees)

impliquees dans le modele. Cet estimateur est la pierre angulaire des techniques

d’estimation qui peuvent etre developpees dans ce cadre (on verra, section 1.4,

l’utilisation dans des modeles ou la fonction de regression est parametrique, puis,

dans un modele semi-parametrique au Chapitre 2).

La construction de cet estimateur vient repondre a plusieurs exigences. La sim-

plicite, d’une part : son calcul ne necessitant que des developpements simples, est

base sur l’affectation d’un poids choisi avec soin pour chaque observation. D’autre

part, il repond a une problematique particuliere : l’introduction de variables expli-

catives en grand nombre. En effet, l’une des limites des approches concurrentes uti-

lisees jusqu’ici reside dans le fait qu’elles fonctionnent difficilement lorsque le nombre

de variables explicatives est superieur a 1. Ces raisons sont a la fois theoriques

(des arguments techniques empechent l’extension directe de certaines preuves), et

pratiques (les estimateurs proposes butent sur le mauvais comportement des es-

timateurs non-parametriques en ”grande” dimension). Par ailleurs, les resultats

theoriques fournis dans ce chapitre permettent la validation de techniques d’esti-

mation basees sur ce nouvel outil.

Le plan de ce chapitre est le suivant. Dans la section 1.2, nous definissons un

modele de censure qui sera considere dans les chapitres 1 a 3 de ce memoire. On

discutera notamment la question des hypotheses d’identifiabilite qui determine le

1.2. Donnees censurees et regression 7

type de techniques de regression devant etre mis en œuvre. Dans la section 1.3, nous

definissons l’estimateur de la fonction de repartition qui repond aux objectifs fixes.

Ses proprietes theoriques sont presentees. Des applications et perspectives sur cet

estimateur sont proposees dans la section 1.4.

1.2 Donnees censurees et regression

Dans cette section, nous definissons un modele de regression ou la variable

d’interet est censure, formalise en section 1.2.1. A titre indicatif, quelques cadres

d’application sont proposes en section 1.2.2. La section 1.2.3 aborde la question des

conditions d’identifiabilite du modele. Selon l’hypothese sous laquelle on se place,

les techniques d’inference developpees sont en effet differentes, comme on le verra

par la suite.

1.2.1 Cadre general

Dans le reste de ce document, on considere une variable T qui pourra etre

consideree comme une duree. Cette identification a une duree n’est pas absolue, le

phenomene de donnees censurees n’etant pas circonscrit aux durees de vie ainsi que

nous le verrons dans la section 1.2.2. On introduit une variable de censure C, et la

duree observee

Y = inf(T,C).

On considere egalement

δ = 1T≤C ,

qui permet de distinguer entre les cas ou l’on observe effectivement T et ou l’ob-

servation est censuree par C. On supposera dans toute la suite que P(T = C) = 0

pour eviter tout probleme cause par une eventuelle dissymetrie entre les variables

T et C vis-a-vis de l’indicatrice δ.

Dans le cadre d’un probleme de regression, on considere un vecteur X ∈ Rd de

variables explicatives. Ces variables sont supposees etre observees exactement. L’in-

troduction de variables explicatives elles-memes sujettes a la censure sera consideree

aux Chapitres 4 et 5.

Les observations disponibles sont constituees d’un vecteur (Yi, δi, Xi)1≤i≤n de

replications i.i.d. du vecteur aleatoire (Y, δ,X).

1.2.2 Exemples d’applications

Nous presentons ici plusieurs exemples d’applications, la liste ne se voulant pas

exhaustive.

Durees de vie. T designe la duree de vie d’un individu. C designe le temps

au bout duquel l’individu cesse d’etre observe pour une raison autre que le deces

(date de rachat de contrat pour des individus observes a partir de portefeuilles

d’assurance-vie, date de fin de contrat, fin de la periode d’etude...). X designe un

ensemble de caracteristiques (age, categorie socio-professionnelle, revenu...).

8 Chapitre 1. Estimation nonparametrique pour la regression censuree

Temps passe au chomage. T designe le temps au bout duquel l’individu re-

trouve un emploi. C designe le temps au bout duquel l’individu cesse d’etre observe

pour une raison autre (fin de droit, fin de la periode d’etude...). A nouveau, X

designe un ensemble de caracteristiques permettant d’expliquer T.

Montants de sinistres. Dans cet exemple, T ne designe plus une duree mais

un montant de sinistre. C designe le plafond d’indemnisation. Si T excede C, la vraie

valeur de T est inconnue puisque l’assureur ne prend en charge que le montant C. Un

autre exemple concerne les reglements lies aux sinistres a temps de developpement

long (i.e. qui mette un temps important avant d’etre totalement regles). Dans ce

cas, pour les sinistres non clos, on peut considerer que le montant regle jusqu’a

aujourd’hui C est une sous-estimation de la somme totale a reglee T.

1.2.3 Les hypotheses d’identifiabilite

Si l’on evacue le probleme des regresseurs, le modele de censure decrit dans

la section 1.2 requiert l’utilisation d’hypothese d’identifiabilite, si l’on veut etre

a meme d’estimer la loi de T. Ainsi, l’estimateur de Kaplan-Meier requiert l’hy-

pothese d’independance entre T et C afin d’etre consistant (voir Stute et Wang

(1993)). D’autres hypotheses d’identifiabilite peuvent etre envisagees, voir par

exemple Othus et collab. (2009) et Li et collab. (2007), reposant elles aussi sur

une modelisation de la loi conditionnelle de T sachant C.

Dans le cadre qui nous preoccupe, nous nous focalisons sur l’hypothese

d’independance entre T et C, qui doit etre generalisee a la presence de regresseurs.

Deux cadres principaux existent dans la litterature.

Cadre 1 : Independance.

On suppose

T ⊥ C

P (T ≤ C|T,X) = P (T ≤ C|T ) .

Cette hypothese est due a Stute (1993). Un cas particulier important est celui

ou (T,X) ⊥ C, mais le jeu d’hypotheses ci-dessus est sensiblement plus general.

Neanmoins, du point de vue de la modelisation, il paraıt difficile de justifier l’op-

portunite de cette hypothese, si ce n’est dans le cas ou (T,X) ⊥ C.Ce cadre est bien adapte notamment a des phenomenes de censure dite admi-

nistrative, ou la censure n’est causee que par la fin de la periode d’observation,

et nullement par d’autres facteurs. Dans ce cas, les caracteristiques d’un individu

n’influent pas sur la loi de la censure s’ils n’influent pas sur la date d’entree en

observation.

1.2. Donnees censurees et regression 9

Cadre 2 : Independance conditionnelle.

On suppose

T ⊥ C | X.

Dans ce cas, la loi de la censure est autorisee a dependre des caracteristiques

X.

Si l’on reprend l’exemple du temps passe au chomage, ce type d’hypothese est

plus conforme que le cadre 1 a la situation modelisee. En effet, si X contient no-

tamment une variable representant la categorie socio-professionnelle d’origine, il est

raisonnable de penser que le temps avant radiation (qui est une cause de censure)

depend de cette caracteristique.

Du point de vue des techniques statistiques mises en œuvre, le Cadre 1 presente

l’avantage majeur de permettre l’importation quasi-directe de methodes basees sur

l’estimateur de Kaplan-Meier. En effet, puisque T ⊥ C (ce qui n’est en general

pas le cas dans le Cadre 2), l’estimateur de Kaplan-Meier est consistant dans cette

situation.

Ainsi, Stute (1993) propose un estimateur base sur la construction suivante.

Soit FKM l’estimateur de Kaplan-Meier de la fonction de repartition de T. Cet

estimateur peut s’exprimer comme une fonction constante par morceaux, affectant

une masse Win a l’observation i, autrement dit

FKM (t) =

n∑i=1

Win1Ti≤t.

Stute propose d’estimer F (t, x) = P (T ≤ t,X ≤ x) par

FS(t, x) =

n∑i=1

Win1Ti≤t,Xi≤x.

Des resultats de convergence pour FS ainsi que pour les integrales par rapport a la

mesure qu’il definit ont ete prouves par Stute (1996), et, dans un cadre plus general

incorporant de la troncature a gauche, par Sanchez Sellero et collab. (2005). Ces

resultats deviennent des elements importants permettant de prouver des resultats

de convergence pour differents problemes lies a la regression, voir notamment Stute

(1999), Gannoun et collab. (2005), Delecroix et collab. (2008), Lopez (2009), et

Lopez et Patilea (2009).

Dans le Cadre 2, l’estimateur de Kaplan-Meier conditionnel, introduit initiale-

ment par Beran (1981), puis etudie notamment par Dabrowska (1989) est l’outil de

base qui permet l’estimation non-parametrique de F (t|x) = P(T ≤ t|X = x). Il est

defini de facon plus precise dans la section 1.3.1 ci-dessous. Plusieurs estimateurs

non parametriques de F (t, x) ont ete etudies par Van Keilegom et Akritas (1999)

et Akritas et Van Keilegom (2001). Ainsi qu’il l’a deja ete precise, la performance

de ces estimateurs souffre d’une valeur de d (dimension de X) grande. Ce souci ne

se rencontre pas dans le Cadre 1 (a moins que la dimension de X soit de l’ordre

10Chapitre 1. Estimation nonparametrique pour la regression censuree

du nombre d’observations, mais on retombe alors sur l’un des problemes classiques

de la grande dimension qui frappe meme des problemes parametriques), du fait de

l’absence d’estimateurs bases sur du lissage non parametrique dans la definition de

FS .

Nous proposons un troisieme cadre, qui peut etre vu comme un compromis entre

les deux situations ci-dessus, et qui permet l’estimation de F meme lorsque d est

important.

Cadre 3 : Independance conditionnellement a un facteur uni-

dimensionnel.

Soit g : Rd → R. On suppose

T ⊥ C | g(X)

P (T ≤ C|T,X) = P (T ≤ C|T, g(X)) .

Cette hypothese est verifiee notamment lorsque la loi de C sachant X ne depend

que du facteur uni-dimensionnel g(X).

Ceci permet a la fois d’autoriser la censure a dependre des variables explica-

tives, tout en restreignant cette dependance a un seul facteur, ce qui permettra de

n’avoir besoin que de lissages non-parametriques uni-dimensionnels pour estimer la

distribution de (T,X). En particulier, on pense a g(X) = X(i), ou X(i) represente

la i−eme composante du vecteur X, dans le cas ou C ne depend que d’une compo-

sante particuliere des covariables. L’autre exemple important, inspire des methodes

de reduction de dimension de type single-index (voir Chapitres 2 et 3), consiste a

supposer que g(X) = θ′0X, ou θ0 definit une combinaison lineaire des composantes

de X qui resume la facon dont C depend de X.

Dans un premier temps, on supposera g(X) connue, ce qui est le cadre de l’article

Lopez (2011). Le cas ou l’on dispose d’un estimateur de g(X) consistant a la vitesse

n−1/2, qui est la situation consideree dans Lopez et collab. (2013), est considere par

la suite.

1.3 Estimation de la fonction de repartition dans le

cadre d’un modele de regression

Le but de cette section est de definir une estimation de la distribution jointe

de (T,X) dans les Cadres 2 et 3 definis en section 1.2.3. Cet estimation repose sur

celle de la fonction de repartition conditionnelle de C sachant X, via l’estimateur de

Kaplan-Meier conditionnel defini en section 1.3.1. La section 1.3.2 presente l’estima-

tion de la loi jointe, et la section 1.3.3 presente les principaux resultats theoriques

lies a cette technique.

1.3. Estimation de la fonction de repartition dans le cadre d’un modelede regression 11

1.3.1 Estimation de la fonction de repartition conditionnelle

Beran (1981) propose l’estimateur suivant de F (t|x) dans le Cadre 2,

F (t|x) = 1−∏ti≤t

(1− dH1(ti|x)

1− H(ti − |x)

), (1.1)

ou {t1, ..., tk} designe les valeurs distinctes prises par (Y1, ..., Yn), et

H1(t|x) =

n∑i=1

δiwin(x)1Yi≤t,

H(t|x) =

n∑i=1

win(x)1Yi≤t,

avec

win(x) =K(Xi−xh

)∑n

j=1K(Xj−xh

) ,en introduisant une fonction noyau K symetrique, positive, d’integrale 1, et une

suite de fenetres h tendant vers 0.

De facon similaire, on peut estimer la loi conditionnelle de la censure G(t|x) =

P(C ≤ t|x) par un estimateur similaire G(t|x) en remplacant dans (1.1) la fonction

H1 par H0(t|x) =∑n

i=1(1− δi)win(x)1Yi≤t.

Des proprietes theoriques de cet estimateur ont ete demontrees par Dabrowska

(1989), Dabrowska (1992), Van Keilegom et Akritas (1999), Du et Akritas (2002).

1.3.2 Estimation de la loi jointe de (T,X)

L’estimateur propose dans le Cadre 3 est decrit plus avant dans Lopez (2011).

Le principe de sa definition repose sur la traduction suivante des hypotheses d’iden-

tifiabilite. Pour toute fonction φ telle que E[|φ(X,T )|] <∞,

E

[δφ(X,Y )

1−G(Y − |g(X))

]= E[φ(X,T )],

ou G(t|g(x)) = P(C ≤ t|g(X) = g(x)). La fonction G(·|g(x)) n’etant pas disponible,

elle peut etre estimee via l’estimateur de Beran defini section 1.3.1, permettant ainsi

de definir l’estimateur de F (t, x),

F (t, x) =1

n

n∑i=1

δi1Yi≤y,Xi≤x

1− G(Yi − |g(Xi)). (1.2)

Comme annonce, l’interet de travailler dans le Cadre 3 plutot que le Cadre 2 permet

de se restreindre a des estimateurs a noyau en dimension 1, evitant ainsi leur mauvais

comportement quand la dimension de X est importante.


1.3.3 Resultats theoriques obtenus

Le resultat cle de Lopez (2011) permet d’obtenir une representation asympto-

tique des integrales par rapport a la mesure definie par l’estimateur F defini en

(1.2). Cette representation decompose ces integrales, du point de vue asympto-

tique, en deux termes principaux (l’un fournissant la limite, l’autre n’intervenant

que dans la variance asymptotique), plus un terme negligeable. Ce terme residuel

converge vers 0 uniformement sur une classe de fonctions dont la complexite est

controlee. Cette notion d’uniformite est cruciale, comme on le verra dans la section

1.4, si l’on souhaite appliquer ce type de resultat a l’etude de modeles de regression

parametriques.

Theoreme 1 Soit H(t|z) = P(Y ≤ t|g(X) = z), et τz = inf{t : H(t|z) = 1}.Soit τ0 = inf{τz : z ∈ Z}, ou Z designe le support de la variable g(X). On

suppose τ0 > −∞. Soit F une classe de fonctions satisfaisant des hypotheses

de complexite (voir Lopez (2011)), et telle qu’il existe τ < τ0 tel que, pour tout

φ ∈ F , φ(t, x) = 0, pour t > τ. En notant dP(t, x|z) la loi de (T,X) sachant

g(X) = z, pour i = 1, ..., n,

φz(t) =

∫ ∞t

∫xφ(s, x)dP(s, x|z),

MGi (s) = (1− δi)1Yi≤s −

∫ s

−∞

1Yi≥sdG(s|g(Xi))

1−G(s|g(Xi)),

∫φ(t, x)F (t, x) =

1

n

n∑i=1

δiφ(Yi, Xi)

1−G(Yi − |g(Xi))+

1

n

n∑i=1

∫φg(Xi)(s)dM

Gi (s)

1−H(s|g(Xi))

+Rn(φ),

avec supφ∈F |Rn(φ)| = OP (h2 + [log n]n−1h−1).

La preuve de ce theoreme repose sur une amelioration de la representation

asymptotique que Du et Akritas (2002) fournissent pour G(t|x). Cette amelioration,

basee sur des resultats de convergence des U−processus de Major (2006), permet

d’atteindre un ordre de convergence du reste optimal, i.e. un terme en h2 venant

du biais de l’estimateur, et un terme correspondant au carre de la variance d’un

estimateur a noyau, a un facteur logarithmique pres. A partir de la representation

du Theoreme 1, on observe qu’on peut en deduire un resultat type theoreme central

limite, puisque le terme principal du membre de droite est une somme de termes

i.i.d.

Sans entrer dans le detail des hypotheses techniques introduites pour obtenir le

Theoreme 1 (qui sont presentees en detail dans Lopez (2011)), precisons les grandes

lignes de ces hypotheses.

1.4. Premieres applications et extensions 13

– L’hypothese sur τ0 : cette hypothese est egalement presente chez Du et Akri-

tas (2002). Elle est necessaire pour se premunir contre des denominateurs

proches de 0 qui posent des problemes du point de vue theorique. Cette diffi-

culte pour gerer des denominateurs proches de 0 se trouve egalement dans la

litterature de l’estimateur de Kaplan-Meier, voir par exemple Gill (1983), Gi-

jbels et Veraverbeke (1991), Sanchez Sellero et collab. (2005). Pour resoudre

ce probleme, les approches telles que celles de Stute (1995) et Akritas (2000),

utilisent des troncations analogues, avant d’utiliser des resultats sur la ten-

sion des processus pour faire tendre cette borne de troncation vers l’infini.

La generalisation de ces approches aux Cadres 2 et 3 n’est pas evidente, et

n’a jusqu’a present pas ete abordee (voir des hypotheses similaires dans Heu-

chenne et Van Keilegom (2010b), Heuchenne et Van Keilegom (2010a), Du

et Akritas (2002), Van Keilegom et collab. (2011)).

– Hypotheses sur les distributions de Y et X : on doit supposer une

regularite par rapport a g(X) des fonctions de repartitions F (t|g(x)) et

H(t|g(x)). La loi de g(X) doit egalement etre absolument continue par rapport

a la mesure de Lebesgue si l’on veut utiliser des estimateurs a noyau.

– Hypotheses sur F : essentiellement, on a besoin que F soit une VC-classe

de fonctions (voir e.g. van der Vaart et Wellner (1996)). Il faut egalement

que cette classe de fonctions soit reguliere par rapport a la variable x (2 fois

continument derivable).

1.4 Premieres applications et extensions

1.4.1 Estimation dans un modele de regression parametrique

Pour τ < τ0, considerons le modele E[T |X,T ≤ τ ] = f(θ0, X), ou θ0 ∈ Θ ⊂ Rkest un parametre inconnu, et f une fonction connue. La presence de la troncation

τ est un ecueil theorique du, pour le moment, a l’absence de resultat valide sur

l’ensemble de la distribution. Puisque θ0 = arg minθ∈Θ

∫(t− f(θ, x))21t≤τdF (t, x),

on peut definir un estimateur des moindres carres generalises du type

θ = arg minθ∈Θ

∫(t− f(θ, x))21t≤τdF (t, x).

Sa convergence vers θ0 peut se deduire du Theoreme 1 en considerant la classe de

fonctions F = {(t, x) → (t − f(θ, x))21t≤τ ; θ ∈ Θ}. Sa normalite asymptotique se

deduit egalement de l’application de ce resultat aux derivees par rapport a θ des

fonctions de F , voir Lopez (2011).

1.4.2 Extension au cas ou la fonction g est inconnue

Si la fonction g n’est pas connue, une modelisation de la loi conditionnelle de

la censure peut permettre d’utiliser l’estimateur propose dans ce chapitre. Cette

situation a ete consideree dans Lopez et collab. (2013). Si on suppose que C|X


suit un modele de regression semi-parametrique de Cox (voir Cox (1972), Andersen

et Gill (1982)), la loi de C sachant X ne depend de X qu’a travers une variable

uni-dimensionnelle θ′0X, ou θ0 est le parametre du modele de Cox. Cette situation

correspond au Cadre 3 avec g(X) = θ′0X.

Si l’on dispose d’un estimateur θ de θ0 qui converge a la vitesse n−1/2 (ce qui

est le cas dans le modele de Cox), les resultats du Theoreme 1 restent conserves en

remplacant g(X) dans l’estimateur par g(X) = θ′X. On note alors la presence d’un

terme supplementaire dans la representation asymptotique (lie a l’estimation de θ0,

voir Lopez et collab. (2013)).

1.5 Conclusion

L’estimateur propose dans ce chapitre presente l’avantage d’etre adapte a des

modeles de regression ou la censure est autorisee a dependre des variables expli-

catives. Il conserve une certaine simplicite de calcul. Neanmoins, il repose sur une

hypothese modelisant la loi de C sachant X, afin de se ramener a une loi condi-

tionnelle qui ne depend que d’un facteur de dimension 1. Cette approche peut se

reveler delicate. En effet, la censure est une variable souvent plus mysterieuse que la

variable d’interet, et il devient plus difficile de justifier des choix de modelisation la

concernant. Cependant, l’avantage principal est de beneficier d’un estimateur non-

parametrique de la distribution de (T,X) qui autorise la censure a dependre de X

sans pour autant se restreindre a des X uni-dimensionnels, contrairement a ce que

proposent les autres estimateurs existant dans ce cadre.

Chapitre 2

Modeles single-index

Sommaire

2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.2 Deux modeles single-index . . . . . . . . . . . . . . . . . . . . 16

2.2.1 Modele 1 : estimation de la densite conditionnelle . . . . . . . 16

2.2.2 Modele 2 : estimation d’une esperance conditionnelle. . . . . 18

2.3 Resultats theoriques . . . . . . . . . . . . . . . . . . . . . . . . 19



2.3.3 Arguments principaux des preuves . . . . . . . . . . . . . . . 21

2.4 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.1 Introduction

Dans un probleme de regression, deux approches extremes existent :

modelisation parametrique de la fonction de regression (sans necessairement

modeliser la distribution des residus), et modelisation non parametrique. La

premiere presente l’avantage de la simplicite et de la facilite d’interpretation. Elle

repose en revanche sur des hypotheses contraignantes, puisque rien n’indique a

priori que la fonction de regression admette une forme aussi particuliere que celle

postulee par le modele. A l’inverse, la modelisation non parametrique fait peu d’hy-

potheses contraignantes, mais l’interpretation du modele est moins aisee, et les

vitesses de convergence des estimateurs correspondants sont moins rapides que la

vitesse usuelle n−1/2 du modele parametrique. De plus, ces vitesses de convergence

sont dependantes de la dimension d du vecteur de variables explicatives X.

Les approches de type single-index (voir notamment Ichimura (1993), Hardle

et collab. (1993), Xia et Li (1999), Xia et collab. (1999)) apparaissent comme

un compromis semi-parametrique entre ces deux philosophies diametralement op-

posees. Elles consistent a supposer que la fonction de regression (qu’il s’agisse d’une

esperance conditionnelle ou d’une autre quantite liee a la distribution conditionnelle)

ne depend que d’une combinaison lineaire inconnue des variables explicatives. Si

cette combinaison lineaire etait connue, l’estimation serait ramenee a un probleme

non parametrique en dimension 1, ce qui le rendrait moins sensible a la deterioration

de la vitesse des estimateurs non parametriques.

16 Chapitre 2. Modeles single-index

Ici, nous considerons deux modeles single-index adaptes a la presence d’obser-

vations censurees. Le premier porte sur l’estimation d’une densite conditionnelle

dans le Cadre 1 (censure independante, voir chapitre precedent), correspondant a

l’independance entre C et (T,X). Ce travail vient completer l’approche de Lopez

(2009), sous des hypotheses sensiblement plus restrictives, mais qui ameliorent la

performance d’estimation. Le second modele porte sur l’esperance conditionnelle,

dans le Cadre 3 ou la censure est autorisee a dependre des variables explicatives.

L’organisation du present chapitre est la suivante. Dans la section 2.2, on

presente les deux modeles single-index. Les resultats theoriques sont regroupes dans

la section 2.3, et les arguments permettant de justifier de la convergence des deux

estimateurs sont mis en parallele. La section 2.4 discute des extensions et perspec-

tives.

2.2 Deux modeles single-index

Dans cette section, on presente deux estimateurs dans des modeles single-index

censures. Le premier, defini en section 2.2.1 est adapte aux situations ou la censure

empeche la bonne estimation de la queue de distribution de la variable d’interet.

Le second modele, dans la section 2.2.2, fournit un estimateur dans un cadre ou la

censure peut dependre des variables explicatives.

2.2.1 Modele 1 : estimation de la densite conditionnelle

Dans toute cette section 2.2.1, on suppose que la loi de T sachant X = x

admet une densite f(t|x) par rapport a la mesure de Lebesgue. L’estimation de

cette densite conditionnelle est frappee par les problemes usuels de dimension de

X, ainsi qu’on l’a expose dans l’introduction de ce chapitre. L’hypothese single-index

consiste a supposer que la loi de T sachant X ne depend que d’une combinaison

lineaire inconnue des variables explicatives θ′0X. Le vecteur θ0 est defini a une

constante multiplicative pres, et on supposera donc que sa premiere composante est

egale a 1 de facon a le definir de maniere unique. Une autre hypothese classique

consiste a supposer que ce vecteur est de norme 1 pour une certaine norme de Rd, ce

qui n’entraıne pas de changement des resultats mais rend plus delicat la definition

d’objets tels que la differentielle, l’ensemble des parametres Θ etant alors d’interieur

vide dans Rd.

Modele 1 : On suppose que C est independant de (T,X). Soit fθ(t|u) la densite

conditionnelle de T sachant θ′X = u. On suppose qu’il existe un θ0 ∈ Θ ⊂ Rdtel que θ0 ait sa premiere composante egale a 1, et

f(t|x) = fθ0(t|θ′0X = θ′0x).

2.2. Deux modeles single-index 17

Ce modele a ete initialement introduit par Delecroix et collab. (2003) en l’ab-

sence de censure. L’une des motivations des auteurs etait de parvenir a obtenir des

estimateurs de θ0 asymptotiquement efficaces. L’idee etant d’estimer θ0 par

θ = arg maxθ∈Θ

n−1n∑i=1

log(fθ(Ti|θ′Xi)

), (2.1)

ou fθ(t|u) est la densite de T sachant θ′X = u evaluee au point t, et fθ un estimateur

non parametrique de cette densite. Le contraste defini dans (2.1) peut etre vu comme

une estimation non parametrique de la log-vraisemblance, et de ce fait, permet

d’obtenir l’efficacite asymptotique.

En presence de censure, et en se placant dans le Cadre 1 (voir section 1.2.3), le

contraste (2.1) n’est plus calculable puisque les Ti ne sont pas directement observes,

mais il peut etre generalise en remplacant la somme empirique (qui est en fait une

integrale par rapport a la distribution empirique de (T,X)) par une integrale par

rapport a l’estimateur de Stute (1993) FS defini au chapitre precedent. Avec les

notations du Chapitre 1, l’estimateur devient

θ = arg maxθ∈Θ

M τn(θ, h) = arg max

θ∈Θ

n∑i=1

Win log(fθ,h(Yi|θ′Xi)

), (2.2)

ou la famille d’estimateurs non parametriques {fθ,h : θ ∈ Θ} doit egalement etre

redefinie. On peut notamment utiliser des versions des estimateurs a noyau adaptes

a la censure, en definissant

fθ,h(y|u) =

∑ni=1WinK

(Yi−yh

)K(θ′Xi−u

h

)∑n

j=1WjnK(θ′Xj−u

h

) ,

ou K est une fonction symetrique positive d’integrale 1 et h une suite tendant vers

0. Il n’est bien entendu pas necessaire d’utiliser la meme fenetre h pour traiter Y

et θ′X, cette convention n’etant utilisee que pour simplifier les notations.

Contrairement a ce qui se passe en l’absence de censure, cet estimateur ne peut

pretendre etre asymptotiquement efficace, puisque la log-vraisemblance possede une

forme differente dans ce cadre. En effet les observations non censurees contribuent

a cette log-vraisemblance via le logarithme de la densite de T sachant X, mais les

observations censurees apportent une contribution egale au logarithme de la fonction

de repartition conditionnelle de T sachant X, voir Schnedler (2005). Dans Bouaziz

et Lopez (2010), une approche basee sur la forme specifique de la log-vraisemblance

en presence de censure ne nous est pas apparue souhaitable. En effet, le contraste qui

en resulterait serait trop complexe a maximiser d’un strict point de vue numerique

(notamment parce qu’il necessiterait d’integrer les estimateurs non parametriques

fθ,h(Yi|θ′Xi) par rapport a la mesure de Lebesgue.

L’interet de l’estimateur que nous considerons ici, si on le compare a celui de Lo-

pez (2009), tient dans la remarque suivante. Soit τ un reel quelconque. L’hypothese

single-index suppose que

L(T |X) = L(T |θ′0X),


ou L designe la loi d’une variable aleatoire. Sous cette hypothese,

L(T |X,T ≤ τ) = L(T |θ′0X,T ≤ τ),

avec la meme valeur du parametre θ0.

Cette propriete est particulierement attractive, puisqu’elle permet de se

premunir contre l’eventuel mauvais comportement des estimateurs non pa-

rametriques tels que FS dans la partie droite de la distribution de T. Ainsi, l’estima-

teur propose par Lopez (2009) dans un modele plus general portant sur l’esperance

conditionnelle, necessite une hypothese restrictive (bien que raisonnable pour cer-

tains cas ou la censure n’est pas trop intense) sur les queues de distribution de T

et C. Dans le cas present, cette hypothese n’est plus necessaire, puisqu’on pourra

eliminer les observations trop importantes sans pour autant introduire de biais dans

l’estimation de θ0.

On dispose donc d’une collection d’estimateurs

θ(τ, h) = arg maxθ∈Θ

n∑i=1

Win log(fθ,h(Yi|θ′Xi)

)1Yi≤τ .

Nous proposons une methode qui permet de choisir a partir des donnees quelle

valeur de τ et quelle valeur de h est la plus adaptee. Cette technique est deduite

des resultats theoriques presentes dans la section 2.2, ou on revient egalement sur

le gain de la methode, observe empiriquement via des simulations.

2.2.2 Modele 2 : estimation d’une esperance conditionnelle.

Le second modele porte sur une estimation de l’esperance conditionnelle, dans

un cadre ou la censure est autorisee a dependre des variables explicatives (voir

Cadre 3 du chapitre precedent).

Modele 2 : On suppose qu’il existe β0 tel que l’hypothese du Cadre 3 du cha-

pitre precedent soit verifiee pour g(X) = β′0X. On suppose de plus que l’on

dispose d’un estimateur preliminaire β de β0 qui converge a la vitesse n−1/2.

Soit mθ0(u) = E [T |θ′0X = u, T ≤ τ ] . On suppose qu’il existe un θ0 ∈ Θ ⊂ Rdtel que θ0 ait sa premiere composante egale a 1, et

E [T |X,T ≤ τ ] = mθ0(θ′0X).

Ici, contrairement a l’approche precedente, τ est une borne fixee telle que, si

l’on considere H(t|x) = P(Y ≤ t|X = x), pour tout x, τ < inf {t : H(t|x) = 1} .La presence de cette troncation est rendue necessaire par la difficulte d’evaluer le

comportement de l’estimateur Kaplan-Meier conditionnel dans la queue de distri-

bution de T. Contrairement aux resultats existants dans le cas de l’estimateur de

Kaplan-Meier (et donc de l’estimateur FS), memes sous des hypotheses concernant

2.3. Resultats theoriques 19

les queues de distribution de C et T, aucune convergence dans tout l’espace n’a

ete montree jusqu’a present. Il s’agit du meme probleme que celui constate dans la

section 1.4.1 du chapitre precedent.

Du point de vue des hypotheses d’identifiabilite, la situation est similaire a

celle de la section 1.4.2. L’exemple pratique etudie dans Lopez et collab. (2013)

correspond a la situation ou C suit un modele de regression Cox conditionnellement

a X.

Dans ce cas, l’estimateur de θ0 que nous proposons est

θ = arg minθ∈Θ

∫(t− mθ(θ

′x))21t≤τdFg(t, x),

ou {mθ : θ ∈ Θ} est une famille d’estimateurs non parametriques des fonctions mθ,

g(x) = β′x, et ou l’on rappelle que Fg correspond a l’estimateur defini au cha-

pitre precedent. Il s’agit d’une extension de la technique etudiee par Ichimura

(1993), Hardle et collab. (1993), Delecroix et collab. (2006). Du point de vue des

resultats asymptotiques, la forme des estimateurs non parametriques importe peu.

Nos resultats sont valides a partir du moment ou ces estimateurs satisfont un en-

semble de conditions standards. En particulier, nous verifions ces hypotheses pour

des estimateurs particuliers, qui sont des versions d’estimateurs a noyau adaptes a

la censure, i.e.

mθ(u) =

∑ni=1W

′inYi1Yi≤τK

(θ′Xi−u

h

)∑n

j=1W′jn1Yj≤τK

(θ′Xj−u

h

) ,ou W ′jn correspond a la masse que l’estimateur Fg place a l’observation j.

2.3 Resultats theoriques

Les proprietes theoriques des deux estimateurs proposees sont resumees dans

les sections 2.3.1 et 2.3.2. Les arguments utilises pour prouver ces resultats sont

resumes en section 2.3.3.

2.3.1 Formulation des resultats pour le Modele 1.

Le principe de la preuve des resultats presentes dans Bouaziz et Lopez (2010)

consiste a obtenir des representations du type

θ(τ, h)− θ0 =1

n

n∑i=1

ψτ,h(Yi, δi, Xi) +Rn(τ, h),

avec supτ,h∈Hn|Rn(τ, h)| = oP (n−1/2), ou Hn est un ensemble fini inclus dans

[an−α, bn−α] pour 1/8 < α < 1/6, et E[ψτ,h(Y, δ,X)] = 0 pour tout (τ, h).

Cette representation uniforme permet de valider la convergence d’un estima-

teur θ = θ(τ , h), ou τ et h sont choisis a partir des donnees. A τ fixe, on choi-

sit hτ tel que hτ maximise arg maxθMτn(θ, h). Pour choisir τ, on utilise comme


critere de comparaison des estimateurs le cout quadratique. En definissant E2(τ) :=

E[‖θ(τ, hτ ) − θ0‖22], on deduit des resultats asymptotiques presentes au Theoreme

suivant une estimation E2(τ) du critere E2(τ) et on choisit τ qui minimise ce critere

estime.

Theoreme 2 Sous des hypotheses de regularite des fonctions fθ (detaillees

dans Bouaziz et Lopez (2010)), et en supposant que knn−4α → 0 ou kn designe

le cardinal de Hn, on obtient pour tout (τ, h),

n1/2[θ(τ, hτ )− θ0] =⇒ N (0,Στ ),

cette matrice de variance-covariance pouvant s’estimer de facon consistante.

Par ailleurs, soit τ0 = arg minτ E2(τ), et θ = θ(τ , hτ ),

n1/2[θ − θ0] =⇒ N (0,Στ0).

Les simulations conduites dans Bouaziz et Lopez (2010) montrent l’interet de

ce choix de τ a partir des donnees. En effet, elles mettent en evidence que le choix

de τ optimal ne consiste pas a prendre toutes les observations. En effet, certaines

observations correspondant a un Y de grande taille induisent un poids excessif dans

l’estimateur de Kaplan-Meier, et polluent donc l’estimation.

2.3.2 Formulation des resultats pour le Modele 2.

On retrouve des resultats similaires a ceux de Lopez (2009), mais avec une

variance asymptotique differente, due a la presence d’un mecanisme de censure

different.

Theoreme 3 Sous des hypotheses de regularite de la fonction de regression et

de ses derivees (jusqu’a l’ordre 2), et sous des conditions de convergence des

estimateurs non parametriques consideres, on obtient

θ − θ0 =1

n

n∑i=1

Λ(Yi, δi, Xi) + oP (n−1/2),

ou Λ est une fonction telle que E[Λ(Y, δ,X)] = 0.

Les hypotheses sont detaillees dans Lopez et collab. (2013). Concernant les pro-

prietes que doivent satisfaire les estimateurs non parametriques correspondants, il

s’agit essentiellement de :

– Regularite des estimateurs (deux fois derivables par rapport a θ),

– Convergence uniforme des derivees par rapport a θ jusqu’a l’ordre 2,

– Vitesses de convergences suffisamment rapides pour mθ0 et ∇θmθ0 .

Ces conditions sont verifiees dans le cas des estimateurs a noyau consideres, en

rajoutant des conditions sur la fenetre h.

2.3. Resultats theoriques 21

2.3.3 Arguments principaux des preuves

Dans les deux cas, les estimateurs sont obtenus par minimisation d’un contraste

Mn(θ, rθ), ou rθ designe soit les estimateurs de la densite conditionnelle dans le

modele 1, soit les estimateurs des esperances conditionnelles dans le modele 2.

Les preuves consistent a verifier cette propriete connue des modeles single-index

en l’absence de censure, qui veut que maximiser Mn(θ, rθ) soit asymptotiquement

equivalent a maximiser Mn(θ, rθ), c’est a dire le contraste qui serait calcule si la

famille parametrique sous-jacente etait connue exactement. Pour cela, nous nous

basons sur des resultats classiques en M-estimation (voir Sherman (1993), Sherman

(1994)), qui reviennent, dans notre cas, a effectuer un developpement de Taylor de

Mn autour du point θ0.

Contrairement a la plupart des approches developpees en l’absence de censure,

qui reposent le plus souvent sur l’utilisation de proprietes specifiques aux types

d’estimateurs non parametriques utilises (noyaux, estimateurs par projection...),

nous developpons des techniques issues de la theorie des processus empiriques. De

cette facon, les conditions necessaires pour obtenir la convergence reposent sur

l’appartenance de la fonction de regression (ainsi que de ses estimateurs) a une

classe de fonctions suffisamment simple du point de vue de son entropie.

Ainsi, dans les deux cas, on se ramene a l’hypothese cruciale suivante :

On suppose que

– les fonctions rθ0 et rθ0 appartiennent a une classe de fonctions D1 qui est une

classe de Donsker (voir par exemple van der Vaart et Wellner (1996) pour

une definition des classes de Donsker),

– les fonctions ∇θrθ0 et ∇θrθ0 appartiennent a une classe de fonctions D2+xD3

ou D2 et D3 sont deux classes de Donsker.

Ces hypotheses ne sont pas contraignantes. Pour la premiere, rθ0 etant une

fonction d’une variable (Modele 2) ou de deux variables (Modele 1), il suffit de

supposer que rθ0 et son estimateur sont C1 avec derivee bornee satisfaisant une

condition de Holder, ce qui les place dans une classe de Donsker, voir van der Vaart

et Wellner (1996). Pour la seconde, il s’agit d’une consequence de la structure du

modele single-index, qui permet d’ecrire ∇θrθ0 sous la forme ∇θrθ0 = r1 +xr2 ou r1

et r2 sont des fonctions de θ′0x (et y dans le Modele 1). Des hypotheses de regularite

de r1 et r2 permettent a nouveau de trouver les classes de Donsker adaptees.

L’appartenance des estimateurs non parametriques (ainsi que de leurs gradients)

a de telles classes de fonctions se deduit d’une part de leur forme, d’autre part de

leurs proprietes de convergence uniformes a des vitesses suffisamment rapides. Pour

l’obtention de telles vitesses de convergence uniforme, nous nous basons sur les tra-

vaux de Einmahl et Mason (2005), ou de leur adaptation directe puisque l’indexa-

tion des processus que nous considerons par θ n’est pas presente dans les travaux

de Einmahl et Mason (2005). De plus amples precisions peuvent etre trouvees dans

la version arXiv de l’article Lopez et collab. (2013).


2.4 Perspectives

La demarche decrite dans ce chapitre pour l’etude de modeles single-index en

presence de censure presente l’avantage de pouvoir s’adapter a d’autres types de

modeles single-index. En effet, les techniques de processus empiriques employees

pour prouver la convergence reposent essentiellement sur :

– les resultats de convergence dans le modele parametrique associe (i.e. le

modele qu’on pourrait etudier si la famille de fonctions de regression etait

connue),

– la regularite de la fonction de regression (quelle que soit sa nature),

– des proprietes generales des modeles single-index, notamment le fait que le

gradient de la fonction de regression rθ0 puisse s’exprimer sous la forme d’une

decomposition rθ0 = r1 + xr2 ou r1 et r2 sont des fonctions regulieres d’un

faible nombre de variables.

Dans un travail en cours en collaboration avec Cedric Heuchenne (Universite

Catholique de Louvain), on utilise ainsi une approche similaire pour etudier un

modele de regression Pareto reposant sur une hypothese single-index (en l’absence

de censure). Il peut etre vu comme une version semi-parametrique du modeles

etudie par Beirlant et Goegebeur (2003). Si l’on note GPD(γ, σ) la distribution

Pareto generalisee de fonction de repartition

G(x; γ, σ) = 1− 1(1 + γ xσ

)1/γ ,Smith (1987) a montre que, pour une variable T dont l’indice de valeurs extremes

est γ > 0, la queue de distribution de T peut etre approchee par une loi GPD(γ, σ)

pour un certain σ > 0. En notant γ(x) l’indice de valeurs extremes de la loi de T

sachant X = x,le modele de regression que nous considerons dans ce travail est,

γ(X) = γθ0(θT0 X),

ou θ0 ∈ Rd inconnu, ainsi que la famille de fonctions de lien {γθ : θ ∈ Θ}. Au-

cune modelisation de σ(X) (parametre d’echelle correspondant a la loi GPD qui

approche la queue de distribution de T sachant X) n’est effectuee, puisque ce pa-

rametre est considere comme un parametre de nuisance, de moindre importance

que γ. Neanmoins, ce second parametre pourrait etre modelise egalement en intro-

duisant un autre index θ1, entraınant vers un modele ou deux directions doivent

etre estimees au prix de developpements similaires mais plus fastidieux (y compris

du point de vue algorithmique).

Soit l(γ, σ; y) le logarithme de la densite d’une loi GPD(γ, σ) evaluee en y.

L’estimation du parametre θ est obtenue par maximisation du contraste

Mn(θ) =1

n

n∑i=1

l(γθ0(θ′0Xi), σ(Xi);Ti)1Ti≥τ(Xi),

ou, dans l’esprit de la technique ”Peaks Over Threshold”, on ne conserve que les

observations superieures a un seuil τ dependant de Xi, et ou γθ0 et σ sont des estima-

teurs non-parametriques des fonctions γθ0 et σ. Les estimateurs non parametriques

2.4. Perspectives 23

que nous considerons sont les estimateurs localement lineaires proposes par Beir-

lant et Goegebeur (2004), dont nous prouvons la convergence uniforme, basee sur

les resultats de Einmahl et Mason (2005).

Les difficultes particulieres de l’etude de ce modele sont notamment :

– le caractere mal specifie des distributions conditionnelles (celles-ci ne sont pas

exactement de type Pareto generalise),

– la presence du parametre de nuisance σ,

– les estimateurs non parametriques utilises qui sont definis de facon implicite

(contrairement a l’estimateur de Nadaraya-Watson pour l’esperance condi-

tionnelle).

Chapitre 3

Evenements recurrents

Sommaire

3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

3.2 Modele single-index pour l’analyse d’evenements recurrents 26


3.2.2 Resultats obtenus . . . . . . . . . . . . . . . . . . . . . . . . 28

3.3 Combinaison d’un modele de detection de rupture et d’un

modele de Cox . . . . . . . . . . . . . . . . . . . . . . . . . . . 29


3.3.2 Estimation et choix du parametre l . . . . . . . . . . . . . . . 31

3.3.3 Synthese des principaux resultats obtenus . . . . . . . . . . . 31

3.4 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.4.1 Formulation du probleme . . . . . . . . . . . . . . . . . . . . 32

3.4.2 Combinaison des differents modeles de ce chapitre . . . . . . 33

3.1 Introduction

Il existe un lien naturel entre un modele de duree et un processus de comptage.

En effet, l’observation d’une duree T est equivalente a l’observation d’un proces-

sus N(t) qui vaut 0 a la date de debut d’observation et 1 a la date T . Dans ce

chapitre, nous nous interessons a deux problemes qui concernent la modelisation

d’evenements recurrents, c’est a dire un probleme ou on s’interesse a compter des

evenements qui interviennent de maniere repetee au cours du temps (deces, sinistres,

crises d’asthme, reservations...).

La premiere situation consideree fait le lien avec le chapitre precedent. On

cherche, dans le modele expose a la section 3.2, a mesurer l’impact de variables

explicatives X ∈ Rd sur un processus de comptage N(t). Une facon classique de

modeliser une telle dependance consiste a se baser sur le modele de Cox, voir Pren-

tice et collab. (1981), Andersen et Gill (1982), Andersen et collab. (1993), Lin

et collab. (2000), ou le modele AFT, voir Ghosh et Lin (2003). Ce modele semi-

parametrique, dans lequel le taux de risque instantane depend d’une combinaison

lineaire inconnue des variables explicatives, est un cas particulier de modele single-

index. Pour cette raison, une modelisation plus flexible peut etre proposee, sur une

logique similaire a celle decrite dans le chapitre precedent. Ces resultats sont l’objet

d’un article soumis, voir Bouaziz et collab. (2012).

26 Chapitre 3. Evenements recurrents

Le second type de problemes abordes dans ce chapitre concerne la detection de

changement brutaux dans la structure du processus de comptage, c’est a dire dans

son taux de risque instantane. Le modele considere dans la section 3.3 est initiale-

ment motive par une problematique industrielle, introduite par un partenariat avec

la SNCF dans le cadre d’un contrat CIFRE. Le but de ce modele, qui se transpose

a de nombreuses autres situations, est d’etudier un processus N(t) qui compte le

nombre de reservations effectuees sur un ou plusieurs trajets (et sur un ou plusieurs

tarifs). Il s’agit ensuite de distinguer deux types de comportements chez les clients

de la SNCF : report des clients sur certains tarifs suite a la rupture de stock des ta-

rifs plus attractifs, et evolution naturelle de la frequence des reservations (lesquelles

peuvent avoir tendance a s’intensifier a mesure que le depart du train se rapproche).

L’approche consideree dans ce travail est basee sur une generalisation du modele

de Cox, le taux de risque de base etant modelise par une fonction constante par

morceaux. L’estimation de cette fonction constante par morceaux est effectuee via

des techniques de detection de ruptures. Ces ruptures permettent de prendre en

compte l’evolution generale de l’intensite des reservations, separee de l’influence

des covariables qui transportent l’information sur la disponibilite de certains types

de tarifs. L’une des difficultes supplementaires, dans ce contexte, vient de l’aspect

discret des donnees qui sont exploitables. Les resultats detailles de cette seconde

approche sont consultables dans Lopez et Oueslati (2013).

Dans la section 3.4.1 sont presentes diverses perspectives de ses travaux, la

premiere d’entre elles se penchant sur l’obtention de resultats theoriques valides a

distance finie dans un modele de detection de rupture (qui peut apparaıtre comme

un cadre simplifie du modele de la section 3.3).

3.2 Modele single-index pour l’analyse d’evenements

recurrents

Dans cette section, nous presentons des modeles parametriques et semi-

parametriques permettant d’estimer le nombre moyen d’evenements par unite de

temps conditionnellement a des covariables. La description de ces modeles est faite

en section 3.2.1, ou l’on insiste egalement sur la technique d’estimation. Celle-ci est

basee sur un processus ”renormalise” afin de compenser les phenomenes lies a la

censure. Les resultats theoriques sont resumes dans la section 3.2.2.

3.2.1 Description du modele

On considere un processus d’evenements recurrents N∗(t), observe pour t ∈[0, T ] ou T designe donc la variable aleatoire duree d’observation, et on suppose que

ce processus depend de variables explicatives Z ∈ Rd. Deux modeles sont consideres

pour le nombre moyen d’evenements sachant Z. Le premier modele est purement

parametrique, le second est de type single-index.

3.2. Modele single-index pour l’analyse d’evenements recurrents 27

Observations : On suppose que l’on observe n realisations i.i.d.

(Yi, δi, Zi, Ni(·))1≤i≤n de Z et

Y = inf(T,C),

δ = 1T≤C ,

N(t) = N∗(t ∧ Y ),

ou C designe une variable de censure. On note µ(t|z) = E[N∗(t)|Z = z].

Modele parametrique : On suppose qu’il existe θ0 ∈ Rk tel que

µ(t|z) = µ0(θ0, t, z),

ou µ0 est une fonction connue.

Modele semi-parametrique : Soit µθ(t|u) = E[N∗(t)|θ′Z = u]. On suppose

qu’il existe θ0 ∈ Rd tel que

µ(t|z) = µθ0(t|θ′0z).

L’interet du modele semi-parametrique single-index est similaire a celui evoque

dans les situations du chapitre precedent : assurer suffisamment de flexibilite tout

en effectuant une hypothese de reduction de dimension. Par ailleurs, il s’agit

d’une generalisation des modeles type Cox tels que consideres dans Lin et collab.

(2000). Un modele voisin base sur des modeles AFT (accelerated failure time) a ete

developpe par Ghosh et Lin (2003).

La base de la procedure d’estimation decrite dans Bouaziz et collab. (2012)

repose sur une remise a l’echelle du processus N afin de compenser la presence de

la censure. On definit pour cela

Y (t) =

∫ t

0

dN(s)

1−G(s−),

ou G(s) = P(C ≤ s). Si l’on suppose que C est independante de (T,Z), E[Y (t)|Z] =

µ(t|Z), la fonction G pouvant etre estime par un estimateur de Kaplan-Meier. On

peut noter qu’on peut generaliser l’approche presentee au cas C independant de

T sachant Z en utilisant des techniques semblables a celles des deux chapitres

precedents basees sur l’estimateur Kaplan-Meier conditionnel.

Dans le cas du modele parametrique, le parametre θ0 minimise

Mw(θ, µ0) =

∫E[µ0(θ, t, z)2]dw(t)− 2

∫E[Y (t)µ0(θ, t, Z)]dw(t),

pour toute mesure positive w, un contraste similaire pouvant etre defini de maniere

analogue. Une version empirique pouvant etre maximisee devient alors

Mnw(θ, µ0) =1

n

n∑i=1

∫µ0(θ, t, Zi)

2dw(t)− 2

n

n∑i=1

∫Yi(t)µ0(θ, t, Zi)dw(t),


ou Yi designe la version estimee du processus Yi.

La mesure w peut etre choisie notamment pour repondre a l’objectif d’attenuer

le mauvais comportement de l’estimateur Kaplan-Meier (et donc de Y ) dans la

queue droite de distribution. Par ailleurs, nous nous interrogeons sur la question du

choix de cette mesure w a partir des donnees. Nous nous restreignons, en pratique,

au choix de la mesure w parmi un ensemble fini de mesures discretes note W.

3.2.2 Resultats obtenus

Par souci de simplicite, ne sont presentes ici que les resultats concer-

nant le modele parametrique. Les resultats asymptotiques pour le modele semi-

parametrique sont sensiblement les memes, puisque, comme dans les modeles

consideres au chapitre precedent, on observe une equivalence asymptotique entre

l’estimateur semi-parametrique et l’estimateur parametrique qui s’en deduit (cor-

respondant au cas ou la famille de fonctions µθ serait connue). La demonstration

de cette equivalence asymptotique utilise egalement des techniques de processus

empiriques via l’introduction de classes de Donsker appropriees.

Parmi les hypotheses utilisees pour obtenir la representation asymptotique du

Theoreme 4, certaines concernent la regularite des fonctions µ0(θ, ·, ·). Ces hy-

potheses sont detaillees dans Bouaziz et collab. (2012), et sont du meme ordre

(quoiqu’adaptees a un autre contextes) que celles presentees au chapitre precedent.

Ces hypotheses sont completees par des hypotheses sur la famille de mesure W. La

presence de cette famille etant l’une des specificites du modele etudie, l’hypothese

principale les concernant est detaillee ci-apres.

Hypotheses sur W : On suppose qu’il existe une mesure de probabilite w0(t)

telle que, en definissant W0(t) =∫∞t dw0(t), on ait, pour toute mesure w ∈ W,∫ ∞

tdw(t) ≤ c0W0(t),

pour une constante c0. On suppose de plus que W0 peut s’ecrire sous la forme

W0(t) = W1(t)W2(t),

ou W1 et W2 sont deux fonctions positives decroissantes telles que, si F designe

la fonction de repartition de T,

1.∫W1(t)2(1− F (t−))−1(1−G(t−))−2dG(t) <∞,

2.∫W2(t)E[dN∗(t)] <∞,

3. limt→∞W2(t) = 0.

Ces hypotheses expliquent le role de w dans la procedure. Comme toutes les

ponderations, elle peut bien entendu servir a donner plus de poids aux intervalles de

valeurs de t sur lesquels le praticien juge plus important de renforcer l’adequation.

3.3. Combinaison d’un modele de detection de rupture et d’un modelede Cox 29

Mais elle intervient ici surtout pour contre-balancer les difficultes associees aux

grandes valeurs de t. En effet, si l’on regarde les hypotheses 1-3, l’hypothese 1 montre

que W1 permet de compenser les problemes d’estimation liees a la censure. Plus les

fonctions F et G croissent rapidement, plus W1 doit compenser cette croissance.

L’hypothese 2 sert a compenser l’inflation de N∗ quand t tend vers l’infini. Si l’on

suppose que E[dN∗(t)] ∼ ctkdt (pour un processus de Poisson homogene on aurait

notamment k = 1), W2 doit decroıtre au moins en t−k−1−ε pour ε > 0.

Le resultat essentiel obtenu dans Bouaziz et collab. (2012) est le suivant.

Theoreme 4 On considere une famille de mesures positives W sa-

tisfaisant les hypotheses decrites precedemment. Sous des hypotheses

complementaires detaillees dans Bouaziz et collab. (2012), en definissant θ(w) =

arg minθMnw(θ), on a la representation,

θ(w)− θ0 =1

n

n∑i=1

ψw(Ni, δi, Yi, Zi) +Rn(w),

ou supw∈W |Rn(w)| = oP (n−1/2), et ψw satisfait E[ψw(N, δ, Y, Z)] = 0. Si on

note Σw la matrice de variance-covariance de ψw(N, δ, Y, Z), on en deduit

n1/2(θ(w)− θ0) =⇒ N (0,Σw) .

A partir d’une estimation des matrices Σw, on peut donc proposer un choix de la

mesure W a partir des donnees, en reprenant la logique decrite dans la section 2.3.

Si on se donne comme critere l’erreur quadratique moyenne, on peut donc estimer

celle de l’estimateur θ(w) et choisir le w correspondant a la valeur minimale de cette

erreur estimee.

3.3 Combinaison d’un modele de detection de rupture

et d’un modele de Cox

Nous presentons ici un modele propose dans le cadre d’une application a des

donnees SNCF. Il s’agit de modeliser le nombre de reservations par unite de temps,

en modelisant l’influence de la disponibilite de certains types de tarifs. Ce modele

combine des techniques de detection de rupture avec des modeles de regression

de type risque multiplicatif. Le modele est decrit dans la section 3.3.1. La tech-

nique d’estimation est decrite dans la section 3.3.2, et les principales proprietes

sont resumees dans la section 3.3.3.

3.3.1 Description du modele

On considere le modele de Cox avec rupture, defini de la facon suivante, repre-

nant la description complete fournie dans Lopez et Oueslati (2013).


Modele de Cox avec rupture : On considere m processus de comptages

(Nj(t))1≤j≤m, de fonction de risque instantanee

λj(t) = Yj(t)λ0(t) exp(β′Xj(t)),

ou Yj(t) = 1 si le processus Nj est ”a risque” a l’instant t, et Xj(t) sont des

variables explicatives dependant du temps. Soit t0 < ... < ti < ... < tn des dates

discretes. On observe

– Yi,j = Yj(ti) pour 0 ≤ i ≤ n, 1 ≤ j ≤ m,– Xj(ti) pour 0 ≤ i ≤ n, 1 ≤ j ≤ m,– Nj(ti) pour 0 ≤ i ≤ n, 1 ≤ j ≤ m. On suppose de plus qu’il existe l > 0 tel

que λ0 suive le modele (Ml),

(Ml) ∃(µ0, ..., µl), et une suite strictement croissante (ks)1≤s≤l t.q.

λ0(t) =

l∑s=0

µs1tks≤t<tks+1,

avec les conventions k0 = 0 et kl+1 = n.

La motivation de ce probleme vient d’une application avec la SNCF, qui consiste

a modeliser le nombre de reservations Nj(t) entre 0 et t pour le train numero j. Les

variables Xj(t) sont des indicatrices qui definissent si des classes tarifaires sont

ouvertes ou non a la reservation. On s’attend en effet a ce que la fermeture des

classes tarifaires les plus avantageuses diminue l’intensite des reservations. En plus

des classes tarifaires, on peut egalement integrer l’ouverture ou la fermeture des

reservations sur d’autres trains ou d’autres moyens de transports tels que l’avion,

pour modeliser le report sur la concurrence.

Par rapport a un modele de Cox, le modele que nous considerons fait une hy-

pothese sur l’intensite de base λ0(t) (supposee constante par morceaux). Dans

le cadre de l’application consideree, cette hypothese permet une meilleure in-

terpretation de ce taux de risque de base. L’influence du report sur la concur-

rence ou sur des tarifs plus avantageux etant modelisee par la partie exp(β′Xj(t)),

les changements d’intensite dans le taux de risque de base peuvent s’interpreter

comme des changements structurels dans le comportement des usagers, permettant

ainsi de definir plusieurs regimes de reservation suivant que l’on est proche ou loin

du depart. On aboutit donc a une separation des effets lies au contexte particulier

(disponibilite, concurrence...), et a un regime general qui se trouve modelise par le

λ0.

Le modele considere presente deux specificites :

1. Les dates de changement de regime sont inconnues, ce qui est une amelioration

des modeles proposes par Holford (1980) ou Aalen et collab. (2008).

2. Le nombre de changements l n’est pas suppose connu.

3.3. Combinaison d’un modele de detection de rupture et d’un modelede Cox 31

3.3.2 Estimation et choix du parametre l

A l fixe, le modele (Ml) est purement parametrique, avec deux types de

parametres : les intensites µi et les parametres β par rapport auxquels la

log-vraisemblance est differentiable, et les instants de ruptures (tks)1≤s≤l. En

definissant θ = (β, k1, ..., kl, µ0, ..., µl), on obtient la log-vraisemblance du modele

(Ml),

Ll(θ) = −l∑

s=0

µs

ks+1−1∑i=ks

di

m∑j=1

YijeβXj(ti) +

l∑s=0

log(µs)∑

ks≤i≤ks+1−11≤j≤m

Zij

+ β∑

1≤i≤n1≤j≤m

Xj(ti)Zij ,

ou Zij = Nj(ti)−Nj(ti−1), et di = ti − ti−1.

Dans Lopez et Oueslati (2013), on s’interesse plus en detail a la maximisation

de ce critere. Cette maximisation repose essentiellement sur deux principes :

1. separation de l’estimation des instants de rupture de celle des autres pa-

rametres via un algorithme iteratif,

2. acceleration de la phase d’estimation des instants de rupture via des methodes

de programmation dynamique, en utilisant des techniques similaires a celles

de Bellman (1961), Jackson et collab. (2005) et Salmenkivi et Mannila (2005).

En effet, comme il l’a deja ete precise, la log-vraisemblance n’est pas

differentiable par rapport aux instants de ruptures. On doit donc, a l fixe, envisager

tous les decoupages possibles de l’intervalle de temps, et calculer autant de valeurs

du contraste qu’il y a d’intervalles de temps. Le temps de calcul augmenterait tres

fortement avec l sans l’utilisation de la programmation dynamique.

Pour choisir le nombre de ruptures, nous considerons deux types de procedures.

L’une en testant (Ml) contre (Ml+1) et en s’arretant des que l’on ne rejette pas le

modele (Ml). L’autre consiste a utiliser une adaptation de l’heuristique de pente,

voir par exemple Baudry et collab. (2012).

3.3.3 Synthese des principaux resultats obtenus

Comparaison avec le modele de Cox. Le modele que nous considerons

contient comme cas limite le modele de Cox, puisque le nombre de ruptures n’est

pas specifie. Les resultats de Lopez et Oueslati (2013) montrent que les performances

de la procedure que nous proposons ameliorent les resultats des estimateurs de Cox

notamment dans le cas ou de nombreux ex-aequos sont presents.

Selection du nombre de ruptures l. Sur l’etude de donnees reelles que nous

avons consideree, les techniques d’heuristique de pente selectionnaient un nombre de

ruptures plus faible que la technique de tests ascendants. Par ailleurs, l’apport de ces

ruptures supplementaires ne semblait pas ameliorer significativement l’adequation

du modele. Ceci suggere, dans le cas particulier considere, une preference pour


la technique d’heuristique de pente qui selectionne un plus faible nombre de pa-

rametres.

Extensions. Au lieu de considerer un λ0 constant par morceaux, on peut

considerer de facon plus generale des taux de risques polynomiaux par morceaux.

Cette approche n’a pas ete consideree dans notre cas, puisqu’elle entraıne une forte

augmentation du nombre de parametres qui n’etait pas adaptee a notre volume

d’observations.

3.4 Perspectives

3.4.1 Formulation du probleme

Dans un travail en cours en collaboration avec Olivier Faugeras (Universite

Toulouse 1), on considere un modele de rupture dans un processus de Poisson.

Modele de Poisson a k ruptures : Dans le modele a k ruptures, l’intensite

λ(t) d’un processus de Poisson N(t) observe sur [0, T ] s’exprime comme,

(M′k) λ(t) =

k∑i=1

λi(θ(i)0 , t)1

t(i−1)0 <t<t

(i)0

,

ou les fonctions λi sont connuse, les parametres θ(i)0 et t

(i)0 sont inconnus.

Conditions d’identifiabilite : On impose λi(0, t) = 0, et θ(i)0 = 0 implique

θ(j)0 = 0 pour j > i, et on impose θ

(i)0 = 0 si t

(i−1)0 = T.

Les differents parametres du modele sont estimes par maximum de vraisem-

blance. Csorgo et Horvath (1997) fournissent des resultats asymptotiques pour ce

type de probleme, en supposant que l’amplitude de chacun des changements d’inten-

site et/ou la longueur de chacune des plages de temps [t(i−1)0 ; t

(i)0 ] tend vers l’infini.

Par rapport a ce type de resultats, le present travail repond aux objectifs suivants :

1. obtenir des resultats qui ne reposent pas sur une approximation gaussienne,

2. obtenir des resultats valides a distance finie, i.e. y compris si un changement

d’intensite n’a pu etre observe que durant une courte periode, ou s’il a une

faible intensite,

3. considerer le cas d’une intensite mal-specifiee, i.e. la veritable intensite λ∗(t) 6=λ(t).

Des resultats de ce type ont ete obtenus dans le cas gaussien par Lebarbier (2005).

Soit d(θ, θ0) = − logE [exp([L(θ)− L(θ0)]/2)] , ou L designe la log-

vraisemblance du modele. Notre approche consiste a montrer que le processus

Y (θ) =1

2{L(θ)− L(θ0)}+ d(θ, θ0)1L(θ)>L(θ0)


possede une norme ψ1 d’Orlicz bornee (voir notamment le chapitre 2.2 de van der

Vaart et Wellner (1996)), qui est definie comme

‖X‖ψ1 = inf

{C > 0 : E

[ψ1

(|X|C

)≤ 1

]},

ou ψ1(x) = ex − 1. Cette norme est liee a la vitesse de decroissance de la queue

de distribution de X, puisque P(|X| > x) ≤ Ce−αx, lorsque ‖X‖ψ1 ≤ (1 + α)/C

(voir Lemme 2.2.1 de van der Vaart et Wellner (1996)). Le controle de ‖ supθ Yθ‖ψ1

s’obtient en etudiant l’entropie de l’espace des parametres pour une metrique liee a

la transformee de Laplace de L(θ)− L(θ0).

On montre ainsi que

‖ supθY (θ)‖ψ1 ≤ Ck log κ(T ),

ou

κ(T ) =1

log(

1 + 1λ∗(T )

) ,pourvu que les fonctions λi soient suffisamment simples (notamment polynomiales),

et que l’ecart entre λ(t) et λ∗(t) soit controle. On remarque que log κ(T ) = O(log T )

si le modele est bien specifie. Puisque, pour θ estimateur du maximum de vrai-

semblance, L(θ) > L(θ0), on deduit de ce resultat des proprietes de θ. On

prouve notamment que E[d(θ, θ0)

]≤ C ′k log κ(T ), et on deduit egalement des

bornes exponentielles pour P(θ0 /∈ R(x)), ou R(x) designe la region de confiance

{θ : L(θ)− L(θ) < x}.Ce type de resultat incite a definir un critere penalise pour selectionner le nombre

de ruptures adapte a decrire des donnees,

k = arg maxk

Lk(θk)− C ′′ log κ(T ),

ou Lk designe la log-vraisemblance dans le modele a k ruptures et θk l’estimateur du

maximum de vraisemblance correspondant. Nous travaillons actuellement a l’uti-

lisation de ces techniques pour des donnees d’assurance non-vie ou N(t) designe

le nombre de sinistres enregistres dans un portefeuille automobile. Le probleme de

selection du nombre de ruptures permet notamment de definir, au sein d’une annee,

differentes periodes sur laquelle la sinistralite est differente, et ainsi de mieux saisir

la repartition de la charge de sinistres sur une annee.

3.4.2 Combinaison des differents modeles de ce chapitre

Les approches des sections 3.2 et les approches des sections 3.3 et 3.4.1 peuvent

etre combinees. En particulier, dans les modeles des sections 3.3 et 3.4.1, la forme

specifique postulee pour l’intensite λ(t), si elle est adaptee aux situations que nous

avons considere du point des applications, n’offre pas forcement suffisamment de

flexibilite, contrairement a l’approche semi-parametrique de la section 3.2. Par


ailleurs, pour le modele de la section 3.2, l’hypothese single-index devant toujours

etre envisagee comme une approximation raisonnable de la realite. Supposer que,

pour tout t, la fonction µ(t|Z) ne depend que d’une combinaison lineaire θ′0Z ou

θ0 ne depend pas du temps, est sans doute une hypothese trop forte. Elle peut ap-

paraıtre legitime sur un court intervalle de temps, mais l’introduction de techniques

de detection de rupture permettrait sans doute de raffiner le modele, permettant

ainsi d’envisager un processus θ0(t) qui aurait un nombre inconnu de sauts.

Chapitre 4

Regression et censure

multivariee

Sommaire

4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4.2 Estimation de la fonction de repartition . . . . . . . . . . . . 37

4.2.1 Les observations . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.2.2 Revue de la litterature . . . . . . . . . . . . . . . . . . . . . . 37

4.2.3 Approche generale pour estimer la distribution de (T,U) . . . 39

4.2.4 Un premier cadre : modelisation de la loi des censures . . . . 39

4.2.5 Un second cadre : introduction d’une variable auxiliaire . . . 41

4.3 Proprietes theoriques des estimateurs obtenus . . . . . . . . 42

4.3.1 Premier cadre . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

4.3.2 Deuxieme cadre . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4.4 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4.4.1 Regression : illustration dans le cadre 1 . . . . . . . . . . . . 44

4.4.2 Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.4.3 Tests d’adequation pour des modeles de copules . . . . . . . . 46

4.5 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

4.1 Introduction

Dans les deux derniers chapitres de ce memoire d’habilitation, on s’interesse a

la modelisation jointe de deux durees de vie T et U, ou plus generalement de deux

variables sujettes a la censure (et eventuellement a la troncature a gauche dans le

chapitre suivant).

Un exemple naturel d’application provient, en assurance, des contrats portant

sur plusieurs tetes. Par exemple, les contrats de retraite avec clause de reversion,

mais egalement les contrats de type rente d’education. Dans le premier cas, apres

le deces du beneficiaire du contrat, le conjoint continue de percevoir tout ou par-

tie de la pension de retraite jusqu’a son propre deces. Dans le second, le deces

du souscripteur entraıne le versement d’une rente a son ou ses enfants destinee a

prendre en charge leurs frais d’education jusqu’a la fin de leurs etudes (la duree

de ces etudes etant elle aussi une variable aleatoire). D’autres exemples classiques

36 Chapitre 4. Regression et censure multivariee

motivent l’etude de donnees multivariees sujettes a la censure, l’un d’entre eux

concernant une etude danoise sur la mortalite de jumeaux, voir notamment Frees

et Valdez (1998), Herskind et collab. (1996).

Dans chacun de ces exemples, il n’est pas satisfaisant de se contenter d’une

modelisation separee des differentes durees concernees. Nous envisageons deux types

de formalisation pour decrire la dependance entre ces deux variables aleatoires. La

premiere, dans le prolongement des chapitres precedents, concerne une approche via

la regression. Cet objectif etait annoncee au Chapitre 1 de ce memoire d’habilita-

tion : il s’agit de completer les approches developpees precedemment dans un cadre

ou les variables explicatives X du modele de regression peuvent etre elles-memes

sujettes a la censure.

Une deuxieme approche naturelle consiste a utiliser la theorie des copules

pour modeliser la dependance entre ces deux variables. Dans ce domaine, une

vaste litterature concernant l’etude des modeles de copules en analyse de survie

existe deja, voir notamment Frees et Valdez (1998), Youn et Shemyakin (1999),

Youn et Shemyakin (2001), Luciano et collab. (2008). Dans ce cadre, l’objet de

notre travail est de completer cette approche par l’introduction de procedure de

tests non parametriques d’adequation, qui permettent de valider ou non de tels

modeles. Plusieurs approches ont d’ores et deja ete proposees par Luciano et collab.

(2008), Wang (1991), Wang et Wells (1997), mais celles que nous decrivons dans

ce memoire reposent sur de nouveaux estimateurs non parametriques. Par ailleurs,

elles presentent l’avantage d’etre validees de facon theorique, et d’etre compatibles

avec des methodes de simulation, notamment bootstrap.

Dans les deux cas, l’outil essentiel reside dans l’utilisation d’un estimateur non

parametrique de la fonction de repartition de (T,U) qui soit pertinent dans le

contexte de censure multivariee. De meme que dans le Chapitre 1, ou une seule des

variables etait censuree, la question des conditions d’identifiabilite du modele va se

reveler cruciale.

Dans le present chapitre, nous considerons deux situations particulieres. Les

conditions d’identifiabilite de chacun de ces modeles reposent sur quelques res-

trictions portees sur le modele de censure. La premiere situation repose sur une

modelisation de la loi jointe des deux variables de censure (celle qui intervient sur

T , et celle qui intervient sur U). Cet outil est adapte notamment dans le cas ou les

deux variables de censure sont independantes, mais peut etre adapte a un contexte

plus general. La seconde situation suppose l’existence d’une troisieme variable auxi-

liaire, qui correspond a un schema de censure simplifie (la censure sur T se deduit

de celle sur U via une translation representee par cette variable auxiliaire). Dans

l’exemple concret considere par la suite, la variable auxiliaire represente la difference

d’age entre les deux individus consideres, donnee qui est generalement presente dans

les bases de donnees d’assurance. Un modele plus general, qui integre egalement la

presence de troncature a gauche, sera presente au chapitre suivant.

Dans la section 4.2, on s’interesse a l’estimation de la fonction de repartition

de deux variables censurees T et U, et des integrales par rapport a la mesure

qu’elle definit. Nous envisageons le probleme dans les differents cadres annonces

4.2. Estimation de la fonction de repartition 37

precedemment. La section 4.3 presente les proprietes theoriques de ces estimateurs.

La section 4.4 revient sur les applications de ces estimateurs a l’etude de modeles

de regression ainsi qu’aux tests d’adequation pour certains modeles de copules.

4.2 Estimation de la fonction de repartition

Dans la section 4.2.1, nous precisons les observations disponibles dans le cadre

de l’etude d’un modele de censure bivariee. La section 4.2.2 presente une revue

de la litterature et fait l’inventaire des principales techniques d’estimation non pa-

rametrique dans ce cadre. Une approche generale est proposee dans la section 4.2.3

pour traiter ce type de probleme, les sections 4.2.4 et 4.2.5 presentant son applica-

tion a deux situations distinctes.

4.2.1 Les observations

Les observations que nous considerons sont formees d’un vecteur

(Yi, Zi, δi, γi)1≤i≤n (et eventuellement de variables auxiliaires εi ainsi qu’il

sera precise dans la section 4.2.5) de replications i.i.d. du vecteur (Y,Z, δ, γ), ouY = inf(T,C),

Z = inf(U,D),

δ = 1T≤C ,

γ = 1U≤D,

(4.1)

ou l’on rappelle que les variables d’interet sont T et U, et ou C et D sont les variables

de censures.

4.2.2 Revue de la litterature

La plupart des approches existant jusqu’ici dans ce type de probleme se foca-

lisent sur l’estimation de F (t, u) = P(T ≤ t, U ≤ u). Si cette fonction caracterise

bien la distribution de (T,U), il nous paraıt plus approprie de nous poser la ques-

tion plus generale de l’estimation de quantites du type E[φ(T,U)] pour une large

classe de fonctions φ (la fonction de repartition n’etant alors qu’un cas particulier

de ce probleme). Notre volonte est donc plus d’etudier la mesure sous-jacente que

la fonction F en tant que telle.

Parmi les approches developpees dans la litterature, Campbell et Foldes (1982)

proposent un estimateur de F qui n’est generalement pas une veritable fonction

de repartition a cause de l’absence de monotonie. De plus, leur estimateur n’est

pas invariant par permutation des roles de T et U, son calcul reposant sur une

decomposition de la fonction de survie bivariee ou T et U ne jouent pas un role

symetrique. Hanley et Parnes (1983), quant a eux, proposent une procedure d’es-

timation de F par maximum de vraisemblance non parametrique (NPMLE dans

la suite) a partir de l’algorithme auto-consistant d’Efron et de l’algorithme EM.

Neanmoins, cet estimateur est inconsistant pour des donnees continues et n’est pas


defini de maniere unique en general. Tsai et collab. (1986) suggerent une estimation

basee sur la fonction de repartition Kaplan-Meier conditionnelle de Beran (1981).

Malgre sa consistance, l’estimateur qui en resulte a une vitesse de convergence relati-

vement lente (moins rapide que n−1/2), et a nouveau ne dispose pas d’une definition

symetrique en (T,U).

L’une des approches les plus utilisees actuellement est l’estimateur propose par

Dabrowska (1988). La decomposition sous forme de produit-limite multivarie de la

fonction F n’introduit pas de dissymetrie. Neanmoins, l’estimateur de Dabrowska ne

definit pas une veritable fonction de repartition, puisqu’il assigne une masse negative

a certains points du plan, voir Pruitt (1991b). Ceci pose probleme notamment pour

simuler des donnees a partir de cet estimateur. On pourra egalement consulter

Prentice et Cai (1992) pour un estimateur inspire de celui de Dabrowska et base sur

de series de Peano, et Gill et collab. (1995) pour des ameliorations de ces resultats

grace a l’application de la Delta-Methode fonctionnelle.

D’autres approches consistent a utiliser des techniques de lissage non

parametrique pour estimer la courbe de survie multivariee, voir Pruitt (1991a).

Il s’agit d’utiliser un estimateur type produit-limite pour imputer des valeurs aux

observations censurees, et ensuite d’appliquer des techniques type NPMLE. L’in-

convenient majeur de cette strategie est la definition implicite de l’estimateur. Par

ailleurs, ses performances empiriques sont apparues moins satisfaisantes que prevu

(van der Laan (1996)). Une approche NPMLE est proposee egalement par van der

Laan (1996), mais elle necessite de modifier les donnees pour les transformer en

observations censurees par intervalle. L’estimateur est asymptotiquement efficace,

mais uniquement pour ces donnees modifiees. De plus, la vitesse de convergence

depend d’un parametre implique dans la modification des donnees, et pour cette

raison n’atteint pas n−1/2. Le meme probleme de convergence trop lente inter-

vient dans Akritas et Van Keilegom (2003), meme si, contrairement a la plupart

des approches presentees dans cette breve revue de la litterature, les estimateurs

definis par Akritas et Van Keilegom (2003) sont bien d’authentiques fonctions de

repartition. Les autres inconvenients de cette derniere approche tiennent dans le

fait que la generalisation de cet estimateur a plus de deux variables censurees est

delicate, et que les variables de censure sont necessairement absolument continues.

Apports des techniques proposees dans le present chapitre.

Par rapport a ces travaux, notre travail permet de :

1. fournir des estimateurs de F qui sont de veritables fonctions de repartition

(avec eventuellement une masse residuelle a l’infini, ce qui se produit

egalement pour l’estimateur de Kaplan-Meier quand la plus grande ob-

servation est censuree), et par la-meme ouvrir le champ a des techniques

de type bootstrap basees sur ces estimateurs,

2. estimer, a partir de cet estimateur de F, des quantites du type E[φ(T,U)],

3. conserver une vitesse de convergence identique a celle de Kaplan-Meier et

de la fonction de repartition empirique en n−1/2.


4.2.3 Approche generale pour estimer la distribution de (T, U)

En absence de censure, on peut estimer la distribution des donnees en

considerant la distribution empirique qui assigne la masse n−1 indifferemment a

chacune des observations. Comme nous l’avons deja remarque au Chapitre 1, l’ap-

proche de Kaplan-Meier consiste a n’introduire une masse qu’aux observations non

censurees (plus une masse residuelle a l’infini eventuellement), de facon a allouer

plus de poids aux grandes observations et compenser ainsi l’effet de la censure. Base

sur la meme idee, nous recherchons un estimateur de F du type

F (t, u) =n∑i=1

δiγiWi(Y1, Z1, δ1, γ1, ..., Yn, Zn, δn, γn)1Yi≤t,Zi≤u. (4.2)

Dans la section 4.2.5, ces fonctions Wi sont egalement autorisees a dependre des

variables auxiliaires. Dans tous les cas, on souhaite n’assigner du poids qu’aux ob-

servations ou les deux composantes sont effectivement observees, puisqu’elles seules

sont pleinement informatives sur la loi jointe de (T,U), le poids Wi devant etre

choisi pour compenser le phenomene de censure bivariee. Ce choix de Wi depend

des conditions d’identification du modele.

Plus precisement, nous considerons des fonctions Wi de la forme

Wi(Y1, Z1, δ1, γ1, ..., Yn, Zn, δn, γn) =1

nδiγif(Yi, Zi),

ou f est un estimateur consistant d’une fonction f qui satisfait la relation

E [δγf(Y, Z)φ(Y, Z)] = E[φ(T,U)], (4.3)

pour toute fonction φ ∈ L1. Un calcul standard montre que le choix f(t, u) =

E[δγ|T = t, U = u]−1 est adapte. Le calcul de cette quantite f se fait a partir des

hypotheses d’identifiabilite postulees.

Pour etudier les estimateurs de type (4.2), nous employons un schema sensible-

ment similaire dans la section 4.2.4 comme dans la section 4.2.5. Dans un premier

temps, nous utilisons une approche generale (voir Theoreme 3.1 dans Lopez et

Saint Pierre (2011)) mais qui n’est valide que sur un compact. Puis, suivant le

cadre dans lequel nous nous trouvons, la convergence sur l’ensemble du plan est

obtenue en utilisant des arguments de tension. Ceux-ci amenent a introduire des

hypotheses sur les queues de distribution. Il est important de noter que, dans les

approches existant jusqu’a present, la convergence sur le plan tout entier n’avait

ete prouvee pour aucun estimateur de F, meme sous des conditions de moments

forcement plus restrictives.

4.2.4 Un premier cadre : modelisation de la loi des censures

Le cadre considere ici est celui de Lopez et Saint Pierre (2011).


Modele 1 : modelisation de la loi des variables de censure.

On suppose que (T,U) est independant de (C,D) et qu’il existe une fonction

copule connue C telle que

P(t ≤ C, u ≤ D) = C(G1(t), G2(u)),

ou G1 designe la fonction de survie de C et G2 celle de D.

A titre de comparaison, l’estimateur de Dabrowska suppose que (T,U) est

independant de (C,D) sans modeliser la dependance entre les censures. Cette hy-

pothese est le prix a payer pour utiliser notre approche plus confortable. Un cas par-

ticulier important est celui ou C(x1, x2) = x1x2, ce qui correspond a l’independance

de C et D. Sous cette hypothese,

f(t, u) =1

C(G1(t), G2(u)).

Cette hypothese d’identifiabilite a ete introduite initialement par Wang et Wells

(1997), qui utilisent neanmoins une approche differente de la notre. Quoique fort

simple dans sa logique, la demarche de Wang et Wells (1997) n’aboutit pas a la

construction d’une vraie fonction de repartition, et n’est donc pas adaptee aux

exigences fixees. Ils remarquent en effet que

P(T ≥ t, U ≥ u) = H(t, u)C(G1(t), G2(u))−1,

ou H(t, u) = P(Y ≥ t, Z ≥ u). H est alors estimee par la fonction de survie

empirique et G1 et G2 par des estimateurs de Kaplan-Meier.

Pour estimer la fonction f, nous pouvons egalement utiliser des estimateurs de

Kaplan-Meier pour estimer G1 et G2, puisque nous sommes dans ce cas ramenes a

un probleme de censure uni-dimensionnelle. Comme T et C ainsi que U et D sont

independants, nous sommes dans le cadre ou ces estimateurs sont consistants, si

l’on ajoute l’hypothese P(T = C) = P(U = D) = 0.

Finalement, l’estimateur F1 que nous considerons est

F1(t, u) =1

n

n∑j=1

δiγi

C(G1(Yi), G2(Zi))1Yi≤t,Zi≤u,

ou les Gi designent les estimateurs de Kaplan-Meier correspondant, et∫φ(t, u)dF1(t, u) =

1

n

n∑j=1

δiγiφ(Yi, Zi)

C(G1(Yi), G2(Zi)).

Cet estimateur peut donc etre vu comme une extension de l’estimateur de

Kaplan-Meier et de l’estimateur FS de Stute (voir Stute (1993)) ou la variable

explicative serait elle aussi censuree.


Remarque.

Dans cette procedure, on suppose que la copule liant les deux variables de cen-

sure est connue. Si elle ne l’est pas, une extension naturelle consiste a postuler

un modele parametrique de copule sur les censures, et a estimer le parametre via

la technique purement parametrique decrite dans Shih et Louis (1995). Sous cer-

taines conditions de regularite de la famille de copules, l’estimateur du parametre

d’association obtenu sera n−1/2−consistant, et cela n’impactera pas la vitesse de

convergence de notre estimateur (meme si la loi limite s’en trouverait modifiee).

4.2.5 Un second cadre : introduction d’une variable auxiliaire

Le cadre suivant, etudie dans Gribkova et collab. (2013), est motive par un

exemple d’application precis. Supposons que T designe la duree de vie totale d’un

individu, et U celle de son conjoint. Ces deux individus entrent en observation a

une meme date aleatoire t1, et sortent d’observation a une meme date aleatoire t2.

Si ces deux durees sont rattachees au meme contrat d’assurance, ce phenomene de

simultaneite de la sortie sera la regle. Dans ce cas, supposons que la difference d’age

entre l’individu et son conjoint est de ε. Alors, necessairement, puisque C designe

l’age de sortie de l’individu pour une cause autre que le deces, et D l’age de sortie

de son conjoint pour une autre cause que le deces, on a la relation

D = C + ε.

Dans ce type de probleme, la variable ε est generalement connue, et on peut

considerer que le phenomene de censure est decrit par une seule variable aleatoire

C, ce qui simplifie l’etude.

Les hypotheses d’identifiabilite que nous posons sont alors les suivantes.

Modele 2 : utilisation d’une variable auxiliaire.

On suppose que

1. D = C + ε.

2. (T,U) est independant de ε et de C, et P(T = C) = P(U = C + ε) = 0.

3. C est independant de ε.

La variable ε est supposee observee.

Dans ce cas, la fonction f est definie comme

f(t, u, ε) =1

SG(max(t, u− ε)−),

ou SG(t) = P(C > t). L’estimation de SG se fait a nouveau par l’estimateur de

Kaplan-Meier, mais afin d’utiliser le maximum d’informations, son estimation est

faite a partir de ηi = 1− δiγi, et Bi = inf(Ci, Ai), ou Ai = max(Ti, Ui − εi). L’idee

est que, meme si Ti n’est pas censuree, la variable Ci peut etre observee si Ui est

censuree.


Base sur un tel estimateur SG, notre estimateur devient alors

F2(t, u) =1

n

n∑j=1

δiγi

SG(max(Yi, Zi − εi)−)1Yi≤t,Zi≤u,

ou les Gi designent les estimateurs de Kaplan-Meier correspondants, et∫φ(t, u)dF2(t, u) =

1

n

n∑j=1

δiγiφ(Yi, Zi)

SG(max(Yi, Zi − εi)−).

4.3 Proprietes theoriques des estimateurs obtenus

Dans toute cette section, F ∗ designe l’estimateur (incalculable en pratique car

necessitant la connaissance de la distribution des censures) de F base sur f au lieu

de f . Cette estimateur ideal F ∗ presente l’avantage d’etre une somme de quantites

i.i.d., et de ce fait peut s’etudier via les outils classiques probabilistes que sont

la loi des grands nombres et le theoreme central limite. Tous les resultats obtenus

s’effectuent via une comparaison entre F et F ∗, dans le premier cadre (section 4.3.1)

comme dans le second (section 4.3.2).

4.3.1 Premier cadre

Nous listons les hypotheses principales qui sont necessaires pour obtenir un

resultat de representation asymptotique des integrales par rapport a F1. Ces

resultats sont obtenus de facon uniforme sur une classe de fonctions (classe de

Donsker).

Hypothese 5 La fonction (x1, x2) → C(x1, x2) est deux fois continument

differentiable. Par ailleurs, on designe par ∂1C(x1, x2) (resp. ∂2C(x1, x2)) les

derivees partielles de C par rapport a x1 (resp. x2), et on suppose que

supx1,x2

|∂1C(x1, x2)|+ supx1,x2

|∂2C(x1, x2)|+∑

i,j∈{1,2}

supx1,x2

|∂i∂jC(x1, x2)| <∞,

et que C(x1, x2) 6= 0 for x1 6= 0 and x2 6= 0.

Seule cette hypothese est necessaire si l’on s’interesse a des fonctions φ qui

valent zero hors d’un compact strictement inclus dans le support de (T,U). Les

hypotheses supplementaires sont necessaires pour prouver l’extension du resultat a

R2 tout entier.

Hypothese 6 On suppose que

C(x1, x2) ≥ xα11 xα2

2 ,

avec 0 ≤ αi ≤ 1 pour i = 1, 2.

4.3. Proprietes theoriques des estimateurs obtenus 43

Cette hypothese est verifiee notamment pour la copule de Frank, et sera verifiee

pour la plupart des familles classiques si on reste a l’ecart des bords du carre unite.

Hypothese 7 F est une classe de fonctions localement bornees avec une enveloppe

Φ telle que ∫Φ2(t, u)dF (t, u)

C(G1(t), G2(u))<∞, (4.4)

et pour un ε > 0 arbitrairement petit,∫Φ(t, u)

[G1−α1

1 (t)K1/2+ε1 (t)

Gα22 (u)

+G1−α2

2 (u)K1/2+ε2 (u)

Gα11 (t)

]dF (t, u) <∞ (4.5)

ou, pour i = 1, 2,

Ki(u) = −∫ u

0

dGi(t)

Gi(t)2Fi(t),

avec F1 (reps. F2) fonction de survie marginale de T (resp. U).

Ces conditions imposent que l’information sur F n’est pas trop grande dans les

queues de distributions par rapport a l’effet de la censure. Des hypotheses similaires,

dans le cas univarie, sont presentes dans l’etude de l’estimateur de Kaplan-Meier,

voir notamment Stute (1995) pour une discussion detaillee de ce type d’hypotheses.

Theoreme 8 Soit F une classe de fonction qui satisfait l’Hypothese 7. Alors,

sous les hypotheses 5 et 6,∫φ(t, u)d[F1 − F ∗1 ](t, u) =

1

n

n∑j=1

∫ηφ(Yj , Zj , δj , γj , t, u)dF (t, u) +Rn(φ),

avec supφ∈F |Rn(φ)| = oP (n−1/2), et ou ηφ est un terme d’esperance nulle dont

on trouvera l’expression explicite au Theoreme 3.4 de Lopez et Saint Pierre

(2011).

Ce type de decomposition permet l’obtention de theoremes type TCL, puisque

F ∗1 s’etudie comme une somme i.i.d. On remarque au passage la consistance, puisque

les hypotheses d’identifiabilite assurent la consistance de F ∗1 , et que le terme η est

d’esperance nulle (il n’intervient que dans la variance asymptotique).

4.3.2 Deuxieme cadre

On suppose egalement dans ce deuxieme cadre que les classes de fonctions im-

pliquees satisfont des proprietes de Donsker (a une transformation pres).


Hypothese 9 Soit G la classe des fonctions positives, monotones, bornees par 1,

et χ(T,U,C, ε) = δγSG(max(T,U − ε)−)−2. Pour tout (t0, u0) dans R2 tels que

SF (t0, u0) > 0, on definit

Ht0,u0 = {(T,U,C, ε)→ χ(T,U,C, ε)f(T,U)g(max(T,U − ε)−)1T≤t0,U≤u0 ,

f ∈ F , g ∈ G} ,

et on suppose que Ht0,u0 est une classe de Donsker de fonctions.

L’hypothese 10 n’est requise que pour obtenir la consistance sur R2 tout entier,

et est automatiquement satisfaite si on considere des fonctions bornees dont le

support est inclus strictement dans celui de la distribution de (T,U). A nouveau, il

s’agit d’une hypothese sur les queues de distribution.

Hypothese 10 On suppose que E[Φ(T,U)2SG(max(T,U − ε)−)−1

]< ∞. De

plus, on definit

C(y) =

∫ y

−∞

dG(t)

[1− F (t)][1−G(t−)]2,

ou F est la fonction de repartition de la variable A, et on suppose que

E[Φ(T,U)C1/2+υ(max(T,U − ε)−)SG(max(T,U − ε)−)−1] < ∞, pour un υ > 0

(arbitrairement petit).

Le resultat theorique que nous obtenons est le suivant.

Theoreme 11 Sous les hypotheses enoncees precedemment,∫φ(t, u)d(F2 − F ∗2 )(t, u) =

1

n

n∑i=1

ψφ(Yi, Zi, δi, γi, εi) +Rn(φ), (4.6)

ou l’expression de ψφ, qui satisfait E[ψφ(Yi, Zi, δi, γi, εi)] = 0, est donnee dans

Gribkova et collab. (2013), et supφ∈F |Rn(φ)| = oP (n−1/2).

4.4 Applications

4.4.1 Regression : illustration dans le cadre 1

On suppose ici que

T = m(θ0, U) + ε,

ou m est une fonction connue. Dans ce cas, si l’on cherche le parametre dans l’espace

Θ ⊂ Rk, alors

θ0 = arg minθ∈Θ

∫(t−m(θ, u))2dF (t, u),

4.4. Applications 45

ou on suppose que l’espace Θ est suffisamment restreint pour que θ0 soit defini de

maniere unique. On definit donc

θ = arg minθ∈Θ

∫(t−m(θ, u))2dF1(t, u).

En appliquant le resultat precedent a la famille de fonctions, φθ(t, u) = (t −m(θ, u))2, on peut en deduire la consistance de θ, sous reserve d’hypotheses de

regularite sur la famille de fonctions, et d’hypotheses sur les queues de distribution

de T et U . Concernant les hypotheses de regularite sur φθ, une condition suffisante

est

|φθ1(t, u)− φθ2(t, u)| ≤ ψ(t, u)‖θ1 − θ2‖a, (4.7)

pour a > 0 et ou ‖ · ‖ est une norme sur Rk, et ψ satisfait la condition (4.4).

Si on suppose des conditions de regularite similaires sur les derivees de φθ par

rapport a θ jusqu’a l’ordre 2, on peut en deduire la normalite asymptotique de θ

(en supposant que M(θ) = E[φθ(T,U)] est deux fois differentiable en θ0).

La loi asymptotique de θ ainsi que des simulations validant le comportement

empirique d’une telle technique sont presentees en detail dans Lopez et Saint Pierre

(2011).

4.4.2 Bootstrap

Si les representations asymptotiques obtenues precedemment sont precieuses du

point de vue theorique, et permettent d’assurer que l’on possede bien une conver-

gence a la vitesse n−1/2, elles se revelent assez delicates a utiliser pour construire

des intervalles de confiance. En particulier, dans de nombreux cas d’applications

(en particulier lorsque la proportion d’observations censurees est importante), on

est loin du cadre d’approximation gaussienne que fournit le TCL.

A titre d’illustration, nous presentons ce resultat expose dans Gribkova et collab.

(2013), concernant le coefficient τ de Kendall. Cette mesure d’association d’usage

courant peut s’exprimer via la fonction de repartition via la formule suivante,

τ = 4

∫F (t, u)dF (t, u)− 1.

Dans le cas ou une seule variable est censuree, on pourra consulter Beaudoin et col-

lab. (2007) pour une estimation de ce coefficient.

Dans Gribkova et collab. (2013), on montre la normalite asymptotique de l’es-

timateur base sur le remplacement de F par F2. Sur des donnees reelles provenant

d’un portefeuille d’assurances classiquement etudie dans la litterature, voir Frees et

Valdez (1998), Carriere (2000), la technique bootstrap que nous decrivons ci-dessous

fournit l’histogramme presente en figure 4.1 pour estimer la loi de l’estimateur τ .

On observe graphiquement qu’on semble loin du cadre gaussien, ce qui motive

l’utilisation de procedures bootstrap.


Bootstrap for Kendall’s tau coefficient

Tau

Fre

quency

0.4 0.5 0.6 0.7 0.8 0.9 1.0

050

100

150

Figure 4.1 – Histogramme de la distribution de τ en utilisant la procedure boots-

trap.

La procedure que nous utilisons est la suivante (dans le cadre 2, mais elle

s’adapte sans mal au premier cadre) :

Pour b = 1, ..., B, on simule le b−eme echantillon bootstrap par le procede

suivant :

1. Simulation de (T b1 , Ub1 ..., T

bn, U

b1) suivant F2.

2. Simulation des variables auxiliaires (εi)1≤i≤n via leur distribution empirique.

3. Simulation des Cbi grace a l’estimateur SG.

4. Reconstruction des Dbi , et de la des Y b

i , δbi , Z

bi , γ

bi .

Cette procedure bootstrap est une extension du schema de bootstrap d’Efron,

voir Efron (1981), propose dans le cas d’un probleme de censure univariee. Cette

procedure, dans le cas de l’estimateur Kaplan-Meier, est consistante, comme l’a

montre Akritas (1986), contrairement au schema concurrent de Reid, voir Reid

(1981). Les mesures positives definies par F2 et SG n’etant pas necessairement de

masse egale a 1 (elle peut etre inferieure), plusieurs conventions sont possibles pour

se ramener a une vraie distribution, la plus simple etant la normalisation de ces

mesures, en les divisant par leur masse totale.

4.4.3 Tests d’adequation pour des modeles de copules

Ainsi que nous l’avons deja mentionne, les copules de survie sont une facon

classique de modeliser la dependance entre deux durees de vie T et U. Ainsi, si on

4.4. Applications 47

definit SF (t, u) = P(T > t, U > u), par le theoreme de Sklar (Sklar (1959)), on

obtient la representation

SF (t, u) = C(ST (t), SU (u)),

ou ST (t) = P(T > t) et SU (u) = P(U > u), et ou C est une copule de survie (voir

par exemple Nelsen (2006)). Pour interpreter la dependance entre T et U, qui est

representee par la fonction copule C, il est naturel de chercher une estimation de

C, le plus souvent basee sur une modelisation parametrique ou semi-parametrique,

voir Shih et Louis (1995). Les estimateurs non parametriques que nous proposons

permettent ensuite de valider ou d’invalider le modele via une procedure de test

d’adequation.

Pour ce faire, Wang et Wells (2000) ont propose d’etendre la methodologie de

Genest et Rivest (1993) en presence de censure. Cette approche repose sur l’esti-

mation de la fonction v → K(v) = P(SF (T,U) ≤ v). Si on considere le cas parti-

culier des familles de copules archimediennes, (c’est a dire des copules definies par

C(u, v) = φ−1(φ(u) + φ(v)) ou le generateur φ est une fonction convexe satisfaisant

les conditions du Theoreme 4.3.4 dans Nelsen (2006)), il existe une correspondence

entree φ et K via

K(v) = v − φ(v)

φ′(v). (4.8)

L’idee de base de la procedure qui en derive consiste a comparer une estimation

parametrique de K (base sur un estimateur φθ dependant du modele parametrique

postule, et de θ, le parametre d’association estime a partir des donnees) a une

estimation non parametrique. Wang et Wells (2000) utilisent un estimateur base

sur l’estimateur de Dabrowska (1988). Celui que nous proposons est

K(v) =

∫1SF2

(t,u)≤vdF2(t, u), (4.9)

etudie ici dans le cadre 2, ou SF2 est l’estimateur de la fonction de survie qui se

deduit de F2.

Dans la Proposition suivante, on montre que le processus n1/2(K(v) − K(v))

converge vers un processus gaussien, ce qui legitime la procedure de test que nous

utilisons par la suite. En revanche, nous ne nous focalisons pas sur la covariance qui

est difficilement manipulable. Les valeurs critiques du test sont en fait calculees par

bootstrap. Les hypotheses techniques de cette proposition peuvent etre retrouvees

dans Gribkova et collab. (2013).

Proposition Sous des hypotheses adaptees (voir Gribkova et collab. (2013)), il

existe un processus gaussien W tel que,{n1/2

(K(v)−K(v)

), v ∈ R

}=⇒

{−∫ ∫

1SF (t,u)>vdW (t, u)

−∫ ∫

W (t, u)dµ·(t, u), v ∈ R}.


On considere a present une famille parametrique de copules archimediennes

FC = {Cθ : θ ∈ Θ}, dont on designe par φθ le generateur archimedien de la copule

Cθ. Nous decrivons comment etendre la procedure de Genest et Rivest (1993) (on

pourra consulter Genest et collab. (2009) pour d’autres procedures possibles) afin

de tester

H0 : C ∈ FC ,

contre

H1 : C /∈ FC .

Pour cela, on calcule un estimateur du parametre d’association θ a partir des

donnees (en supposant, donc, que H0 est vraie), puis on utilise φθ et (4.8) pour

calculer un estimateur parametrique Kθ de la fonction K. A partir d’une distance d

entre deux courbes sur [0, 1], la statistique de test est Tn = d(K, Kθ). H0 est rejetee

quand Tn > sα, ou sα est une valeur critique qui permet d’atteindre le niveau α.

Ces valeurs critiques sont calculees a partir de la procedure bootstrap definie

dans la section precedente, avec modification de la premiere etape. En effet, pour la

premiere etape, on doit se placer sous H0 et simuler les donnees a partir du modele

de copule Cθ. Plus precisement, la premiere etape devient

1’. Simuler (T bi , Ubi )1≤i≤n sous la distribution definie par Cθ ou les f.d.r. de T et

U sont definies par les estimateurs de Kaplan-Meier correspondants.

Pour une procedure de test voisine, Wang et Wells (2000) ont propose une methode

bootstrap qui a ete montree comme etant inconsistante par Genest et collab. (2006),

d’ou l’interet d’utiliser la nouvelle procedure que nous proposons.

A titre d’illustration, nous presentons les resultats pour les donnees reelles

considerees dans Gribkova et collab. (2013).

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

Estimation of K(v)

v

Pro

babili

ty

Nonparametric

Nelsen

Frank

Clayton

Figure 4.2 – Comparaison entre K et Kθ pour trois modeles de copules.


Trois familles de copules sont considerees : Frank, Clayton et une copule due a

Nelsen (voir exemple 4.2.4 de Nelsen (2006)). Gribkova et collab. (2013) proposent

egalement le calcul par bootstrap des p−values des differents tests associes a chacun

des modeles, dans le cas ou l’on considere une distance L2 entre K et Kθ. Les

valeurs des statistiques de tests sont du meme ordre pour chacun des modeles, mais

la p−value du modele de Frank est bien plus faible que celle des deux autres (0.008

contre environ 0.5 pour les deux autres modeles).

4.5 Perspectives

A partir des estimateurs de la fonction de repartition de (T,U) consideres dans

ce chapitre, il devient possible de generaliser la notion de copule empirique definie

par Deheuvels (1979). Cette estimateur non parametrique de la copule peut servir

d’outil pour tester l’adequation a des modeles de copules. On peut egalement en-

visager des techniques de lissage qui permettent l’estimation non parametrique de

la densite de copule. Ces extensions sont considerees dans un cadre plus general au

chapitre suivant.

Chapitre 5

Censure multivariee et

troncature a gauche

Sommaire

5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

5.2 Construction de l’estimateur . . . . . . . . . . . . . . . . . . . 53

5.2.1 Observations . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

5.2.2 Une equation aux derivees partielles . . . . . . . . . . . . . . 53

5.2.3 Definition de l’estimateur et justification de son existence . . 54

5.3 Proprietes de convergence . . . . . . . . . . . . . . . . . . . . 56

5.3.1 Etude des poids Wi,n . . . . . . . . . . . . . . . . . . . . . . 56

5.3.2 Integrales par rapport a F . . . . . . . . . . . . . . . . . . . . 57

5.4 Application sur donnees reelles . . . . . . . . . . . . . . . . . 57

5.4.1 Applications generales . . . . . . . . . . . . . . . . . . . . . . 57

5.4.2 Jeu de donnees canadiennes . . . . . . . . . . . . . . . . . . . 57

5.5 Extension de la notion de copule empirique et perspectives 58

5.5.1 Copule empirique . . . . . . . . . . . . . . . . . . . . . . . . . 58

5.5.2 Evolution generationnelle de la dependance . . . . . . . . . . 60

5.1 Introduction

Les cas de figure representes dans le chapitre precedent possedent plusieurs ca-

racteres limitatifs. D’une part, on l’a vu, il est necessaire d’introduire des hypotheses

restrictives sur les variables de censure. L’autre probleme est qu’elles n’integrent pas

la presence d’un phenomene supplementaire qui frappe generalement les observa-

tions issues des durees de vie, la troncature a gauche.

Pour justifier l’interet de considerer cette troncature, reprenons l’exemple ou T

designe la duree de vie d’un individu, U celle de son conjoint, et C et D designent

respectivement l’age de l’individu et celui de son conjoint a la sortie d’observation

(pour une autre cause que le deces). Si on introduit µ (resp. ν) l’age de l’individu

(resp. celui du conjoint) au moment ou il entre en observation, par exemple parce

qu’il souscrit un contrat d’assurance, les observations ne sont composees que de

couples qui satisfont inf(T,C) ≥ µ et inf(U,D) ≥ ν. A l’inverse de la censure

a droite, negliger la troncature a gauche conduit une mauvaise estimation de la

52 Chapitre 5. Censure multivariee et troncature a gauche

distribution de (T,U) dans sa partie basse, puisque les observations avec une faible

valeur de T ou une faible valeur de U sont generalement peu representees.

Dans un cadre univarie, l’estimateur de Kaplan-Meier peut etre adapte, voir

notamment Tsai et collab. (1987). En revanche, les estimateurs proposes jusqu’a

present dans le cadre de la censure bivariee, voir section 4.2.2 peuvent difficilement

etre generalises de facon immediate a la presence de troncature.

Si l’on examine le cadre univarie, la convergence de l’estimateur qui derive de

Kaplan-Meier repose sur les hypotheses que T est independant de C et de µ, et que

C est independant de µ (avec quelques hypotheses supplementaires qui assurent que

l’ensemble des observations non tronquees n’est jamais vide). Dans ce chapitre, nous

nous fixons comme objectif de generaliser de facon minimale de telles hypotheses au

cadre bivarie. Plus precisement, on se placera dans le cadre suivant (en reprenant

les notations du chapitre precedent).

Hypothese 12 On suppose que

1. (T,U) est independant de (C,D, µ, ν),

2. (C,D) est independant de (T,U, µ, ν),

3. P(Y ≥ µ,Z ≥ ν) > 0.

La seule restriction supplementaire, qui sera supposee verifiee dans l’ensemble de

ce chapitre, tient du fait que nous supposons que T et U sont absolument continues

par rapport a la mesure de Lebesgue.

La technique de construction du nouvel estimateur que nous proposons dans

Lopez (2012), si elle comporte des points communs avec le chapitre precedent (on

cherche un estimateur qui ne met du poids qu’aux observations doublement non cen-

surees et qui definit une vraie fonction de repartition), requiert une approche par-

ticuliere, puisque notre estimateur n’est pas defini de maniere directe, mais comme

solution de la version discrete d’une equation aux derivees partielles qui decrit le

modele de censure/troncature. La resolution exacte de cette equation aux derivees

partielles est possible, via l’inversion d’une matrice relativement simple, calculable

a partir des donnees.

Nous montrons que l’estimateur qui en resulte est consistant a la vitesse n−1/2,

comme l’est celui de Dabrowska (1988). La definition implicite de l’estimateur ne

permet pas, pour le moment, d’obtenir la normalite asymptotique. Cependant, pour

les applications qui nous motivent, cette normalite asymptotique n’est pas necessaire

puisque les intervalles de confiance et les procedures de tests proposees sont obtenues

par des procedures bootstrap, similaires a celles decrites au chapitre precedent.

Le chapitre est organise de la facon suivante. Dans la section 5.2, nous decrivons

la construction de l’estimateur de la fonction de repartition jointe de (T,U), base

sur l’obtention d’une equation aux derivees partielles. La section 5.3 presente les

resultats de convergence de cette estimateur et de fonctionnelles derivees. Enfin, la

section 5.4 propose des resultats obtenues sur donnees reelles, qui peuvent etre com-

5.2. Construction de l’estimateur 53

pares a ceux du chapitre precedent ou l’on ne prenait pas en compte la troncature

a gauche. Des perspectives sont presentees dans le section 5.5.

5.2 Construction de l’estimateur

L’introduction des variables de troncation est faite dans la section 5.2.1. La

construction de l’estimateur repose sur une equation aux derivees partielles decrite

dans la section 5.2.2. La resolution d’une version empirique de cette equation est

discutee dans la section 5.2.3.

5.2.1 Observations

Les observations dont on dispose sont similaires a celles decrites dans la section

4.2, a ceci pres qu’on observe deux variables supplementaires (µi, νi)1≤i≤n avec

µi ≤ Yi et νi ≤ Zi. Le principal changement est que toutes les quantites du type

n−1∑n

i=1 φ(Y, Z) convergent vers E[φ(Y, Z)|µ ≤ Y, ν ≤ Z], au lieu de converger

vers E[φ(Y, Z)].

5.2.2 Une equation aux derivees partielles

Nous introduisons un certain nombre de notations. Soit

SF (t, u) = P (T > t, U > u) ,

V (t, u) = P (Y ≤ t, Z ≤ u, δ = γ = 1|Y ≥ µ,Z ≥ ν) ,

H(t, u) = P (µ ≤ t ≤ Y, ν ≤ u ≤ Z|Y ≥ µ,Z ≥ µ) .

La proposition suivante etablit une relation entre ces fonctions et dF (t, u).

Theoreme 13 Sous l’Hypothese 12,

dF (t, u) =SF (t, u)dV (t, u)

H(t, u)=

{∫t+

∫u+ dF (t′, u′)

}dV (t, u)

H(t, u), (5.1)

ou, de facon equivalente pour tout φ ∈ L1,

E [φ(T,U)] =

∫ ∫φ(y, z)SF (y, z)dV (y, z)

H(y, z)= E [δγw(Y,Z)φ(Y,Z)|Y ≥ µ,Z ≥ ν] ,

avec

w(y, z) =SF (y, z)

H(y, z). (5.2)

Cette proposition permet de definir un estimateur ideal de F. En definissant

W ∗i,n = n−1δiγiw(Yi, Zi), on peut considerer

F ∗(t, u) =

n∑i=1

W ∗i,n1Yi≤t,Zi≤u. (5.3)


A partir du Theoreme 13, on voit que∫ ∫φ(t, u)dF ∗(t, u)→

∫ ∫φ(y, z)w(y, z)dV (y, z) = E [φ(T,U)] , p.s.,

quand n tend vers l’infini.

Bien entendu, F ∗ ne peut etre calculee, puisque ceci necessiterait la connaissance

de H et de SF (t, u) =∫t+

∫u+ dF (t′, u′). Neanmoins, F ∗ joue le role de reference,

qui presente l’avantage de ne dependre que de (Yi, Zi, δi, γi)1≤i≤n et non pas des va-

riables non observables (Ti, Ui)1≤i≤n. Il joue un role cle dans l’obtention des resultats

de convergence, qui s’obtiennent par comparaison de l’estimateur final avec cette

reference.

On peut remarquer que F ∗ ne definit pas necessairement une vraie distribution

de probabilite, puisqu’il n’y a pas de raison de penser que∑n

i=1W∗i,n = 1. On

designera par W ∗∞,∞ = 1 −∑n

i=1Wi,n qui peut etre interpretee comme la masse

additionnelle qui doit etre affectee au point (∞,∞) (ici cette masse correspondant

a F ∗ peut etre negative dans le cas ou la masse totale de F ∗ est plus grande que 1).

5.2.3 Definition de l’estimateur et justification de son existence

Dans la section precedente, on a montre que F etait solution d’une equation

aux derivees partielles. Nous utilisons le terme d’equation aux derivees partielles,

puisque, dans le cas ou F correspond a une mesure absolument continue par rap-

port a la mesure de Lebesgue, dF (t, u) = f(t, u)dtdu, ou f(t, u) = ∂t∂uF (t, u).

Comme nous l’avons signale, l’equation (5.1) depend de quantites inconnues V et

H. Neanmoins, ces quantites peuvent etre estimees empiriquement a la vitesse n−1/2

par

V (t, u) =1

n

n∑i=1

δiγi1Yi≤t,Zi≤t,

H(t, u) =1

n

n∑i=1

1µi≤t≤Yi,νi≤u≤Zi .

De la, nous definissons notre estimateur F comme la solution de la version

empirique de (5.1), c’est a dire :

Definition de F :

F est l’unique solution de

dF (t, u) =

{∫t+

∫u+ dF (t′, u′)

}dV (t, u)

H(t, u). (5.4)

avec la condition que la masse totale de F doit etre egale a 1.

5.2. Construction de l’estimateur 55

Puisque V est une sous-fonction de repartition qui ne met de la masse qu’aux

observations telles que δi = γi = 1, c’est egalement le cas pour F , qui peut donc

s’ecrire

F (t, u) =

n∑i=1

Wi,n1Yi≤t,Zi≤u,

avec Wi,n = 0 si δi = 0 ou γi = 0, et on peut egalement definir W∞,∞ la masse

a l’infini. C’est cette forme simple qui va assurer l’existence et l’unicite de F et

fournir une methode pour la calculer de facon exacte.

En effet, dans ce cas, resoudre (5.4) est equivalent a determiner le vecteur W =

(W1,n, ...,Wn,n,W∞,∞). A partir de (5.4), on voit que, pour i ≤ n,

Wi,n =δiγi

∑nj=1(Wj,n1Yj>Yi,Zj>Zi +W∞,∞)

nH(Yi, Zi)

=δiγi

∑nj=1(δjγjWj,n1Yj>Yi,Zj>Zi +W∞,∞)

nH(Yi, Zi),

puisque Wi,n = 0 si δiγi = 0. De la, cette equation peut etre reecrite de la facon

suivante,

Wi,n −n∑j=1

ai,jWj,n − ai,n+1W∞,∞ = 0,

avec, pour j ≤ n,

ai,j =δjγjδiγi1Yj>Yi,Zj>Zi

nH(Yi, Zi),

et ai,n+1 = δiγin−1H(Yi, Zi)

−1. De plus, si on definit an+1,j = 0 pour j ≤ n, et

an+1,n+1 = 1, l’equation (5.4) peut etre reecrite sous forme matricielle de la facon

suivante,

(In+1 − A)W = 0, (5.5)

ou A = (ai,j)1≤i,j≤n. On peut remarquer qu’il n’y a pas de probleme de definition

des coefficients ai,j , puisque H(Yi, Zi) > 0, pour tout i.

Le Theoreme 14 fournit l’existence de solutions de (5.5). A travers la preuve

qui est decrite dans Lopez (2012), on en deduit une facon de resoudre l’inversion

matricielle de facon rapide du point de vue computationnel.

Theoreme 14 Sous l’Hypothese 12, il existe une unique solution de (5.5) telle

que

1. W∞,∞ > 0,

2. Wi,n = 0 if δi = 0 or γi = 0,

3.∑n+1

i=1 Wi,n = 1.

De plus, Wi,n > 0 pour tout i tel que δi = γi = 1.


La positivite des poids permet d’assurer que l’on obtient bien une distribution

de probabilite. Il faut egalement remarquer que l’introduction d’une masse a l’infini

joue un role cle dans la resolution du systeme lineaire. Elle permet notamment

d’assurer que le noyau de In+1 − A est de dimension exactement 1. Neanmoins,

comme on le verra dans la partie theorique, cette masse a l’infini est toujours petite,

de l’ordre de n−3/2.

Il faut egalement remarquer la similitude entre cet estimateur et l’estimateur

de Kaplan-Meier, qui lui aussi peut etre vu comme la solution d’une equation

differentielle analogue.

5.3 Proprietes de convergence

La convergence de F repose sur une comparaison des poids Wi,n avec les poids

W ∗i,n de F ∗, qui est effectuee dans la section 5.3.1. De la, on deduit aisement les

resultats de convergence sur les integrales par rapport a F , presentes dans la section

5.3.2.

5.3.1 Etude des poids Wi,n

La premiere etape cruciale consiste a comparer Wi,n au poids ideal W ∗i,n. Une

fois que cette difference est evaluee, l’etude de F devient tres simple, puisqu’elle se

resume a l’etude de F ∗ qui est une somme de quantites i.i.d.

Theoreme 15 Sous l’Hypothese 12, supposons qu’il existe une constante K

telle que1

H(Y, Z)< K, p.s. (5.6)

alors

sup1≤i≤n

|Wi,n −W ∗i,n|+ |W∞,∞ −W ∗∞,∞| = OP (n−3/2).

L’hypothese (5.6) est technique, et doit etre mise sur le compte de la diffi-

culte d’estimer correctement la distribution pour les grandes valeurs de T et de U.

En pratique, elle n’est que rarement verifiee, puisqu’elle supposerait un compor-

tement vraiment particulier de la censure (voir remarque 3.3 dans Lopez (2012)).

Neanmoins, on trouvera dans Lopez (2012) une discussion qui permet d’expliquer

comment, via l’introduction d’un biais, on peut toujours se ramener a ce cadre en

tronquant a droite les donnees. Pour obtenir des resultats sur R2 tout entier, il fau-

drait introduire des conditions de moments analogues a celles qui sont decrites dans

le chapitre precedent, mais qui sont difficiles a determiner dans le cadre present.

On se trouve alors dans une situation similaire a celle decrite dans le Chapitre 1,

ou, du point de vue theorique, la convergence n’est obtenue que sur un compact qui

n’englobe pas la queue de distribution.

5.4. Application sur donnees reelles 57

5.3.2 Integrales par rapport a F

On deduit ensuite du Theoreme 15 le resultat suivant.

Theoreme 16 Soit F une classe de fonctions telle que, pour tout φ ∈ F ,φ(∞,∞) = 0, φ(t, u) = 0 quand H(t, u) = 0, et |φ(y, z)| ≤ Φ(y, z) avec

E[Φ(Y,Z)] <∞. Alors, sous les hypotheses du Theoreme 15,∫ ∫φ(t, u)dF (t, u) =

∫ ∫φ(t, u)dF ∗(t, u) +Rn(φ), (5.7)

avec supφ∈F |Rn(φ)| = OP (n−1/2). De plus, si

supφ∈F

∣∣∣∣∣ 1nn∑i=1

δiγiSF (Yi, Zi)φ(Yi, Zi)

H(Yi, Zi)− E[φ(Y,Z)]

∣∣∣∣∣ = OP (n−1/2), (5.8)

on obtient

supφ∈F

∣∣∣∣∫ ∫ φ(t, z)dF (t, z)−∫ ∫

φ(t, z)dF (t, z)

∣∣∣∣ = OP (n−1/2). (5.9)

La condition (5.8) est satisfaite des que F est une classe de Donsker.

5.4 Application sur donnees reelles

5.4.1 Applications generales

On peut deduire des resultats de la section precedente la convergence d’estima-

teurs des quantites τ, K et SF decrites au chapitre precedent. On n’obtient qu’une

vitesse de convergence (uniforme pour K et SF ) d’ordre n−1/2. On pourra consulter

Lopez (2012) pour plus de precisions sur ce point.

De plus, les techniques bootstrap du chapitre precedent peuvent etre appliquees

aisement, puisqu’on a bien pris soin de definir des distributions de probabilite.

5.4.2 Jeu de donnees canadiennes

A titre de comparaison, nous presentons les resultats obtenus sur les memes

donnees reelles que celles presentees dans le chapitre precedent dans la section 4.4.3

(la difference avec la section 4.4.3 vient du fait que l’on ne neglige plus la troncature

a gauche). Une description complete des resultats est fournie dans Lopez (2012).

Nous considerons a nouveau la comparaison entre l’estimateur non parametrique de

K base sur l’estimation de la fonction de repartition definie dans le present chapitre,

et les versions qui utilisent les estimateurs parametriques dans les differents modeles.

Les resultats obtenus sont sensiblement differents, notamment en terme de p-value

pour la procedure de test associee. La famille de Frank voit sa p−value augmenter

a 0.15, tandis qu’elle est aux environs de 0.3 pour les deux autres familles.


0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

Estimation of K(v)

v

Pro

bab

ility

Nonparametric

Nelsen

Frank

Clayton

Figure 5.1 – Comparaison des estimateurs Kθ avec l’estimateur non parametrique

K.

5.5 Extension de la notion de copule empirique et pers-

pectives

5.5.1 Copule empirique

A partir d’un estimateur de la fonction de repartition multivariee, on peut en

deduire un estimateur non parametrique de la copule C qui lie (T,U), qui prolonge

ainsi la definition de la copule empirique de Deheuvels (1979). Dans Gribkova et

Lopez (2013), on etude des estimateurs non parametriques de la copule de la forme

C(u, v) = F (F−1T (u), F−1

U (v)),

5.5. Extension de la notion de copule empirique et perspectives 59

ou F est un estimateur de la fonction de repartition de (T,U) (soit tel que defini

dans le present chapitre, soit tel qu’au chapitre precedent), et ou FT (t) = F (t,∞)

(resp. FU (u) = F (∞, u)) designe l’estimateur de FT (t) = P(T ≤ t) (resp. FU (u) =

P(U ≤ u)). Les resultats de Gribkova et Lopez (2013) negligent le phenomene de

la troncature a gauche, mais la forme generale des estimateurs consideres peut

egalement s’adapter a ce cadre.

Dans Gribkova et Lopez (2013), on prouve deux proprietes de convergence pour

C(·, ·) suivant les proprietes dont on dispose sur l’estimateur F . Soit on ne dispose

que de resultats de convergence uniforme pour l’estimateur F , ce qui est le cas du

present chapitre, et on en deduit la convergence uniforme de C(·, ·) (voir Theoreme

?? ci-dessous). Soit on dispose de la convergence en loi du processus F (ce qui est

le cas, notamment, des estimateurs consideres au chapitre precedent), et on peut

en deduire la loi limite de C(·, ·) (voir Theoreme 18 ci-dessous).

Theoreme 17 Pour un estimateur F tels que FT et FU sont monotones, soit

T1 = [−∞, A1], et T2 = [−∞, A2] tels que

supt1∈T1,t2∈T2

|F (t1, t2)− F (t1, t2)| = OP (n−1/2),

et tels que

supt1∈T1

|FT (t1)− FT (t1)|+ supt2∈T2

|FU (t2)− FU (t2)| = OP (n−1/2).

Soit (u1, u2) tels que FT (T1) = [0, u1] et FU (T2) = [0, u2], alors, pour tout η > 0,

supu≤u1−η,v≤u2−η

|C(u, v)− C(u, v)| = OP (n−1/2).

Il apparaıt, dans ce resultat, que la convergence n’est pas necessairement obte-

nue sur [0, 1]2 tout entier, du fait de la presence de censure a droite qui entraıne

des difficultes d’estimation dans les queues droites de distribution. La convergence

peut etre obtenue sur [0, 1]2 via des hypotheses sur les queues de distribution qui

dependent du cadre considere, voir la discussion a l’issue du Theoreme 18.

Theoreme 18 On suppose que n1/2{F − F} convergent faiblement vers un

processus GF dans l∞(R2). Soit Z∗C = GF (F−1T (u), F−1

U (v)). Alors le processus

n1/2{C(u, v)− C(u, v)} converge dans l∞([0, 1]2) vers

ZC(u, v) = Z∗C(u, v)− ∂uC(u, v)Z∗C(u, 1)− ∂vC(u, v)Z∗C(1, v).

A nouveau, la convergence de F sur R2 tout entier n’est en general possible qu’au

prix d’hypotheses sur les queues de distribution, faute de quoi la convergence de C

n’intervient que sur [0, a]2 avec a < 1. A titre d’exemple, pour l’estimateur F2 du


chapitre precedent (defini dans Gribkova et collab. (2013)), la condition 10 permet

d’assurer cette convergence. En particulier, on s’attend a ce que cette condition ne

soit pas verifiee lorsque le phenomene de censure est trop important.

Par ailleurs, on considere egalement des estimateurs lisses de la copule C. Le

premier est une adaptation de Fermanian et collab. (2004), base sur une version

lissee de F . Le second est une adaptation d’une procedure proposee par Omelka

et collab. (2009) afin d’attenuer l’importance des lois marginales dans la perfor-

mance de l’estimateur final. Cet estimateur est obtenu a partir d’une transfor-

mation des observations. Soit Φ une fonction de repartition. Le vecteur aleatoire

(U ′, V ′) = (Φ−1(FT (T ))),Φ−1(FU (U)) a pour fonction de repartition C. A partir

d’estimations de ces variables U ′ et V ′ (en remplacant FT par FT et FU par FU ),

on peut fournir un estimateur lisse de la fonction de repartition de (U ′, V ′) (donc

de C). On renvoie a Omelka et collab. (2009) et Gribkova et Lopez (2013) (pour la

version en presence de censure) pour plus de details sur cette construction.

Nous montrons que les deux versions lissees ont meme limite que celle de l’esti-

mateur non lisse decrit au Theoreme 18. Par ailleurs, nous demontrons egalement

des vitesses de convergence uniforme pour les estimateurs de la densite de copule

associes.

5.5.2 Evolution generationnelle de la dependance

Si l’on reprend l’exemple de donnees reelles, Luciano et collab. (2012) ont no-

tamment montre l’importance de la generation des deux membres du couple pour

modeliser la dependance entre leurs durees de vie.

L’utilisation de techniques de lissages non parametriques, basees sur des idees

similaires a celle de l’estimateur de Kaplan-Meier conditionnel defini par Be-

ran (1981), peuvent permettre de prendre en compte cet effet generationel, en

considerant que deux variables explicatives de la mortalite sont presentes : la date

de naissance de l’individu et celle de son conjoint.

Dans un travail en cours, on s’interesse a l’adaptation de l’estimateur propose

dans le present chapitre a ce cadre generationel. Il peut en effet etre pris en compte

en remplacant les probabilites definissant les fonctions H et V par des probabilites

conditionnelles (conditionnelles a la date de naissance). On peut utiliser des estima-

teurs a noyau pour estimer non parametriquement ces probabilites conditionnelles.

Conclusion

Dans ce memoire d’habilitation, on s’est interesse a plusieurs problemes lies

aux modeles de duree, et notamment a la modelisation de la dependance entre une

duree et un certain nombre de variables explicatives (qui peuvent elles-memes etre

des variables de duree, notamment dans les Chapitres 4 et 5). Sur chacune des

thematiques decrites dans les differents chapitres, je me suis attache a degager un

certain nombre de perspectives qui permettent d’envisager des prolongements pour

les resultats obtenus.

Pour conclure ce memoire, je synthetise les trois grands axes dans lesquels

s’inserent ces perspectives. Ces trois axes ne sont pas disjoints et des ponts peuvent

permettre des recoupements entre ces differentes problematiques.

1. Grande dimension. Les modeles single-index sont une reponse aux donnees

de grandes dimensions : elles resument l’information portee par les variables

explicatives en un indicateur uni-dimensionnel. Par ailleurs, la grande flexibi-

lite sur la partie non parametrique du modele permet de les envisager comme

des concurrents serieux au modele de Cox (dans le domaine des durees de

vie), ou aux modeles lineaires generalises tres utilises notamment en assurance

non-vie. Ainsi qu’il a ete precise au Chapitre 2, un travail en cours concerne

l’utilisation des methodes single-index dans un modele de regression Pareto.

La flexibilite de la fonction de lien, selectionnee dans une famille non pa-

rametrique, nous paraıt particulierement adaptee a ce contexte ou il apparaıt

a premiere vue difficile de justifier l’utilisation de modeles parametriques pour

modeliser l’indice de valeurs extremes conditionnel.

2. Stabilite des modeles, detection de rupture, risque de longevite. La

plupart des modeles consideres dans ce memoire d’habilitation etant relies a

un probleme temporel, la stabilite de ce type de modeles dans le temps merite

d’etre interrogee (voir les perspectives des Chapitres 3 et 5). Dans l’exemple

important de l’etude du risque de longevite, cette question revet une impor-

tance particuliere, puisque cette etude requiert des projections de la mortalite

a long terme, lesquelles peuvent se reveler tres sensible a un ecart par rap-

port aux tendances observees par le passe. Il convient alors de s’interroger sur

la stabilite des modeles a travers les generations, ainsi que de l’homogeneite

des donnees utilisees pour l’estimation (en assurance, les donnees de porte-

feuilles utilisees peuvent notamment etre sujettes a des changements dans leur

composition d’une annee a l’autre). Des techniques de detection de rupture

peuvent etre employees soit de facon retrospective pour identifier des change-

ments dans le passe, soit de facon dynamique en permettant de mettre a jour

les modeles consideres.

3. Dependance, copules. Dans les Chapitres 4 et 5, on s’est interesse a uti-

liser des estimateurs non parametriques de la fonction de repartition pour


tester l’adequation a des modeles de copules et proposer (voir perspectives du

Chapitre 5) des estimateurs non parametriques de la copule liant un couple

de variables aleatoires. La question du choix approprie du modele de copule

pour decrire la dependance entre plusieurs variables est une problematique

delicate. Les outils des Chapitres 4 et 5 ouvrent donc a des developpements

futurs, dans le cadre de variables de duree comme dans le cadre ”usuel” ou ni

censure, ni troncature ne sont presents.

Bibliographie

Aalen, O. O., Ø. Borgan et H. K. Gjessing. 2008, Survival and event history analysis,

Statistics for Biology and Health, Springer, New York, ISBN 978-0-387-20287-

7, xviii+539 p., doi :10.1007/978-0-387-68560-1. URL http://dx.doi.org/10.

1007/978-0-387-68560-1, a process point of view. 30

Akritas, M. G. 1986, �Bootstrapping the Kaplan-Meier estimator�, J.

Amer. Statist. Assoc., vol. 81, no 396, p. 1032–1038, ISSN 0162-1459.

URL http://links.jstor.org/sici?sici=0162-1459(198612)81:396<1032:

BTKE>2.0.CO;2-Q&origin=MSN. 46

Akritas, M. G. 2000, �The central limit theorem under censoring�, Bernoulli, vol. 6,

no 6, doi :10.2307/3318473, p. 1109–1120, ISSN 1350-7265. URL http://dx.doi.

org/10.2307/3318473. 13

Akritas, M. G. et I. Van Keilegom. 2001, �Non-parametric estimation of the resi-

dual distribution�, Scand. J. Statist., vol. 28, no 3, doi :10.1111/1467-9469.00254,

p. 549–567, ISSN 0303-6898. URL http://dx.doi.org/10.1111/1467-9469.

00254. 9

Akritas, M. G. et I. Van Keilegom. 2003, �Estimation of bivariate and marginal

distributions with censored data�, J. R. Stat. Soc. Ser. B Stat. Methodol., vol. 65,

no 2, doi :10.1111/1467-9868.00396, p. 457–471, ISSN 1369-7412. URL http:

//dx.doi.org/10.1111/1467-9868.00396. 38

Andersen, P. K., Ø. Borgan, R. D. Gill et N. Keiding. 1993, Statistical models based

on counting processes, Springer Series in Statistics, Springer-Verlag, New York,

ISBN 0-387-97872-0, xii+767 p., doi :10.1007/978-1-4612-4348-9. URL http://

dx.doi.org/10.1007/978-1-4612-4348-9. 25

Andersen, P. K. et R. D. Gill. 1982, �Cox’s regression model for counting pro-

cesses : a large sample study�, Ann. Statist., vol. 10, no 4, p. 1100–1120, ISSN

0090-5364. URL http://links.jstor.org/sici?sici=0090-5364(198212)10:

4<1100:CRMFCP>2.0.CO;2-V&origin=MSN. 14, 25

Baudry, J.-P., C. Maugis et B. Michel. 2012, �Slope heuristics : over-

view and implementation�, Statistics and Computing, vol. 22, doi :10.1007/

s11222-011-9236-1, p. 455–470, ISSN 0960-3174. URL http://dx.doi.org/10.

1007/s11222-011-9236-1. 31

Beaudoin, D., T. Duchesne et C. Genest. 2007, �Improving the estimation of ken-

dall’s tau when censoring affects only one of the variables�, Computational Sta-

tistics Data Analysis, vol. 51, no 12, doi :http://dx.doi.org/10.1016/j.csda.2006.

09.044, p. 5743 – 5764, ISSN 0167-9473. URL http://www.sciencedirect.com/

science/article/pii/S0167947306003653. 45

http://dx.doi.org/10.1007/978-0-387-68560-1

http://dx.doi.org/10.1007/978-0-387-68560-1

http://links.jstor.org/sici?sici=0162-1459(198612)81:396<1032:BTKE>2.0.CO;2-Q&origin=MSN

http://links.jstor.org/sici?sici=0162-1459(198612)81:396<1032:BTKE>2.0.CO;2-Q&origin=MSN

http://dx.doi.org/10.2307/3318473

http://dx.doi.org/10.2307/3318473

http://dx.doi.org/10.1111/1467-9469.00254

http://dx.doi.org/10.1111/1467-9469.00254

http://dx.doi.org/10.1111/1467-9868.00396

http://dx.doi.org/10.1111/1467-9868.00396

http://dx.doi.org/10.1007/978-1-4612-4348-9

http://dx.doi.org/10.1007/978-1-4612-4348-9

http://links.jstor.org/sici?sici=0090-5364(198212)10:4<1100:CRMFCP>2.0.CO;2-V&origin=MSN

http://links.jstor.org/sici?sici=0090-5364(198212)10:4<1100:CRMFCP>2.0.CO;2-V&origin=MSN

http://dx.doi.org/10.1007/s11222-011-9236-1

http://dx.doi.org/10.1007/s11222-011-9236-1

http://www.sciencedirect.com/science/article/pii/S0167947306003653


64 Bibliographie

Beirlant, J. et Y. Goegebeur. 2003, �Regression with response distributions

of Pareto-type�, Comput. Statist. Data Anal., vol. 42, no 4, doi :10.1016/

S0167-9473(02)00120-2, p. 595–619, ISSN 0167-9473. URL http://dx.doi.org/

10.1016/S0167-9473(02)00120-2. 22

Beirlant, J. et Y. Goegebeur. 2004, �Local polynomial maximum likelihood es-

timation for Pareto-type distributions�, J. Multivariate Anal., vol. 89, no 1,

doi :10.1016/S0047-259X(03)00125-8, p. 97–118, ISSN 0047-259X. URL http:

//dx.doi.org/10.1016/S0047-259X(03)00125-8. 23

Bellman, R. 1961, �On the approximation of curves by line segments using dynamic

programming�, Commun. ACM, vol. 4, no 6, doi :10.1145/366573.366611, p. 284–

, ISSN 0001-0782. URL http://doi.acm.org/10.1145/366573.366611. 31

Beran, R. 1981, �Nonparametric regression with randomly censored survival data�,

cahier de recherche, University of California, Berkeley. 6, 9, 11, 38, 60

Bouaziz, O., S. Geffray et O. Lopez. 2012, �Semiparametric inference for the re-

current event process by means of a single-index model�, Preprint. 25, 27, 28,

29

Bouaziz, O. et O. Lopez. 2010, �Conditional density estimation in a censored single-

index regression model�, Bernoulli, vol. 16, no 2, doi :10.3150/09-BEJ221, p.

514–542, ISSN 1350-7265. URL http://dx.doi.org/10.3150/09-BEJ221. 17,

19, 20

Campbell, G. et A. Foldes. 1982, �Large-sample properties of nonparametric biva-

riate estimators with censored data�, dans Nonparametric statistical inference,

Vol. I, II (Budapest, 1980), Colloq. Math. Soc. Janos Bolyai, vol. 32, North-

Holland, Amsterdam, p. 103–121. 37

Carriere, J. F. 2000, �Bivariate survival models for coupled lives�, Scand. Actuar.

J., , no 1, doi :10.1080/034612300750066700, p. 17–32, ISSN 0346-1238. URL

http://dx.doi.org/10.1080/034612300750066700. 45

Cox, D. R. 1972, �Regression models and life-tables�, J. Roy. Statist. Soc. Ser. B,

vol. 34, p. 187–220, ISSN 0035-9246. With discussion by F. Downton, Richard

Peto, D. J. Bartholomew, D. V. Lindley, P. W. Glassborow, D. E. Barton, Su-

sannah Howard, B. Benjamin, John J. Gart, L. D. Meshalkin, A. R. Kagan, M.

Zelen, R. E. Barlow, Jack Kalbfleisch, R. L. Prentice and Norman Breslow, and

a reply by D. R. Cox. 14

Csorgo, M. et L. Horvath. 1997, Limit theorems in change-point analysis, Wiley

Series in Probability and Statistics, John Wiley & Sons Ltd., Chichester, ISBN

0-471-95522-1, xvi+414 p.. With a foreword by David Kendall. 32

Dabrowska, D. M. 1988, �Kaplan-Meier estimate on the plane�, Ann. Statist.,

vol. 16, no 4, p. 1475–1489, ISSN 0090-5364. 6, 38, 47, 52

http://dx.doi.org/10.1016/S0167-9473(02)00120-2

http://dx.doi.org/10.1016/S0167-9473(02)00120-2

http://dx.doi.org/10.1016/S0047-259X(03)00125-8

http://dx.doi.org/10.1016/S0047-259X(03)00125-8

http://doi.acm.org/10.1145/366573.366611

http://dx.doi.org/10.3150/09-BEJ221

http://dx.doi.org/10.1080/034612300750066700

Bibliographie 65

Dabrowska, D. M. 1989, �Uniform consistency of the kernel conditional

Kaplan-Meier estimate�, Ann. Statist., vol. 17, no 3, doi :10.1214/aos/

1176347261, p. 1157–1167, ISSN 0090-5364. URL http://dx.doi.org/10.1214/

aos/1176347261. 9, 11

Dabrowska, D. M. 1992, �Variable bandwidth conditional Kaplan-Meier estimate�,

Scand. J. Statist., vol. 19, no 4, p. 351–361, ISSN 0303-6898. 11

Deheuvels, P. 1979, �La fonction de dependance empirique et ses proprietes. Un test

non parametrique d’independance�, Acad. Roy. Belg. Bull. Cl. Sci. (5), vol. 65,

no 6, p. 274–292, ISSN 0001-4141. 49, 58

Delecroix, M., W. Hardle et M. Hristache. 2003, �Efficient estimation in condi-

tional single-index regression�, J. Multivariate Anal., vol. 86, no 2, doi :

10.1016/S0047-259X(02)00046-5, p. 213–226, ISSN 0047-259X. URL http://dx.

doi.org/10.1016/S0047-259X(02)00046-5. 17

Delecroix, M., M. Hristache et V. Patilea. 2006, �On semiparametric M -estimation

in single-index regression�, J. Statist. Plann. Inference, vol. 136, no 3, doi :

10.1016/j.jspi.2004.09.006, p. 730–769, ISSN 0378-3758. URL http://dx.doi.

org/10.1016/j.jspi.2004.09.006. 19

Delecroix, M., O. Lopez et V. Patilea. 2008, �Nonlinear censored regression using

synthetic data�, Scand. J. Statist., vol. 35, no 2, doi :10.1111/j.1467-9469.2007.

00591.x, p. 248–265, ISSN 0303-6898. URL http://dx.doi.org/10.1111/j.

1467-9469.2007.00591.x. 9

Du, Y. et M. G. Akritas. 2002, �Uniform strong representation of the conditional

Kaplan-Meier process�, Math. Methods Statist., vol. 11, no 2, p. 152–182, ISSN

1066-5307. 11, 12, 13

Efron, B. 1981, �Censored data and the bootstrap�, J. Amer. Statist. Assoc.,

vol. 76, no 374, p. 312–319, ISSN 0003-1291. URL http://links.jstor.org/

sici?sici=0162-1459(198106)76:374<312:CDATB>2.0.CO;2-2&origin=MSN.

46

Einmahl, U. et D. M. Mason. 2005, �Uniform in bandwidth consistency of

kernel-type function estimators�, Ann. Statist., vol. 33, no 3, doi :10.1214/

009053605000000129, p. 1380–1403, ISSN 0090-5364. URL http://dx.doi.org/

10.1214/009053605000000129. 21, 23

Fermanian, J.-D., D. Radulovic et M. Wegkamp. 2004, �Weak convergence of empi-

rical copula processes�, Bernoulli, vol. 10, no 5, doi :10.3150/bj/1099579158, p.

847–860, ISSN 1350-7265. URL http://dx.doi.org/10.3150/bj/1099579158.

60

Frees, E. W. et E. A. Valdez. 1998, �Understanding relationships using copulas�,

N. Am. Actuar. J., vol. 2, no 1, p. 1–25, ISSN 1092-0277. 36, 45

http://dx.doi.org/10.1214/aos/1176347261


http://dx.doi.org/10.1016/S0047-259X(02)00046-5

http://dx.doi.org/10.1016/S0047-259X(02)00046-5

http://dx.doi.org/10.1016/j.jspi.2004.09.006


http://dx.doi.org/10.1111/j.1467-9469.2007.00591.x

http://dx.doi.org/10.1111/j.1467-9469.2007.00591.x

http://links.jstor.org/sici?sici=0162-1459(198106)76:374<312:CDATB>2.0.CO;2-2&origin=MSN

http://links.jstor.org/sici?sici=0162-1459(198106)76:374<312:CDATB>2.0.CO;2-2&origin=MSN

http://dx.doi.org/10.1214/009053605000000129

http://dx.doi.org/10.1214/009053605000000129

http://dx.doi.org/10.3150/bj/1099579158

66 Bibliographie

Gannoun, A., J. Saracco, A. Yuan et G. E. Bonney. 2005, �Non-parametric quantile

regression with censored data�, Scand. J. Statist., vol. 32, no 4, doi :10.1111/j.

1467-9469.2005.00456.x, p. 527–550, ISSN 0303-6898. URL http://dx.doi.org/

10.1111/j.1467-9469.2005.00456.x. 9

Genest, C., J.-F. Quessy et B. Remillard. 2006, �Goodness-of-fit procedures for co-

pula models based on the probability integral transformation�, Scand. J. Statist.,

vol. 33, no 2, doi :10.1111/j.1467-9469.2006.00470.x, p. 337–366, ISSN 0303-6898.

URL http://dx.doi.org/10.1111/j.1467-9469.2006.00470.x. 48

Genest, C. et L.-P. Rivest. 1993, �Statistical inference procedures for bivariate Ar-

chimedean copulas�, J. Amer. Statist. Assoc., vol. 88, no 423, p. 1034–1043, ISSN

0162-1459. URL http://links.jstor.org/sici?sici=0162-1459(199309)88:

423<1034:SIPFBA>2.0.CO;2-G&origin=MSN. 47, 48

Genest, C., B. Remillard et D. Beaudoin. 2009, �Goodness-of-fit tests for co-

pulas : A review and a power study�, Insurance : Mathematics and Econo-

mics, vol. 44, no 2, doi :http://dx.doi.org/10.1016/j.insmatheco.2007.10.005, p.

199 – 213, ISSN 0167-6687. URL http://www.sciencedirect.com/science/

article/pii/S0167668707001205. 48

Ghosh, D. et D. Y. Lin. 2003, �Semiparametric analysis of recurrent events data

in the presence of dependent censoring�, Biometrics, vol. 59, no 4, doi :10.1111/

j.0006-341X.2003.00102.x, p. 877–885, ISSN 0006-341X. URL http://dx.doi.

org/10.1111/j.0006-341X.2003.00102.x. 25, 27

Gijbels, I. et N. Veraverbeke. 1991, �Almost sure asymptotic representation for

a class of functionals of the Kaplan-Meier estimator�, Ann. Statist., vol. 19,

no 3, doi :10.1214/aos/1176348256, p. 1457–1470, ISSN 0090-5364. URL http:

//dx.doi.org/10.1214/aos/1176348256. 6, 13

Gill, R. 1983, �Large sample behaviour of the product-limit estimator on the whole

line�, Ann. Statist., vol. 11, no 1, doi :10.1214/aos/1176346055, p. 49–58, ISSN

0090-5364. URL http://dx.doi.org/10.1214/aos/1176346055. 6, 13

Gill, R. D., M. J. van der Laan et J. A. Wellner. 1995, �Inefficient estimators of

the bivariate survival function for three models�, Ann. Inst. H. Poincare Probab.

Statist., vol. 31, p. 547–597. 38

Gribkova, S. et O. Lopez. 2013, �Empirical copula under random censoring�, Pre-

print. URL http://hal.archives-ouvertes.fr/hal-00817262. 58, 59, 60

Gribkova, S., O. Lopez et P. Saint-Pierre. 2013, �A simplified model for

studying bivariate mortality under right-censoring�, Journal of Multivariate

Analysis, vol. 115, no 0, doi :10.1016/j.jmva.2012.10.005, p. 181 – 192,

ISSN 0047-259X. URL http://www.sciencedirect.com/science/article/

pii/S0047259X1200228X. 41, 44, 45, 47, 48, 49, 60

http://dx.doi.org/10.1111/j.1467-9469.2005.00456.x

http://dx.doi.org/10.1111/j.1467-9469.2005.00456.x

http://dx.doi.org/10.1111/j.1467-9469.2006.00470.x

http://links.jstor.org/sici?sici=0162-1459(199309)88:423<1034:SIPFBA>2.0.CO;2-G&origin=MSN

http://links.jstor.org/sici?sici=0162-1459(199309)88:423<1034:SIPFBA>2.0.CO;2-G&origin=MSN



http://dx.doi.org/10.1111/j.0006-341X.2003.00102.x

http://dx.doi.org/10.1111/j.0006-341X.2003.00102.x




http://hal.archives-ouvertes.fr/hal-00817262

http://www.sciencedirect.com/science/article/pii/S0047259X1200228X

http://www.sciencedirect.com/science/article/pii/S0047259X1200228X

Bibliographie 67

Hanley, J. A. et M. N. Parnes. 1983, �Nonparametric estimation of a multivariate

distribution in the presence of censoring�, Biometrics, vol. 39, no 1, doi :10.

2307/2530813, p. 129–139, ISSN 0006-341X. URL http://dx.doi.org/10.2307/

2530813. 37

Hardle, W., P. Hall et H. Ichimura. 1993, �Optimal smoothing in single-index mo-

dels�, Ann. Statist., vol. 21, no 1, doi :10.1214/aos/1176349020, p. 157–178, ISSN

0090-5364. URL http://dx.doi.org/10.1214/aos/1176349020. 15, 19

Herskind, A. M., M. McGue, N. V. Holm, T. I. Sorensen, B. Harvald et J. W.

Vaupel. 1996, �The heritability of longevity : a population-based study of 2872

danish twin pairs born 1870-1900�, Hum. Genet., vol. 97, p. 319–323. 36

Heuchenne, C. et I. Van Keilegom. 2010a, �Estimation in nonparametric location-

scale regression models with censored data�, Ann. Inst. Statist. Math., vol. 62,

no 3, doi :10.1007/s10463-009-0219-3, p. 439–463, ISSN 0020-3157. URL http:

//dx.doi.org/10.1007/s10463-009-0219-3. 13

Heuchenne, C. et I. Van Keilegom. 2010b, �Goodness-of-fit tests for the error dis-

tribution in nonparametric regression�, Comput. Statist. Data Anal., vol. 54,

no 8, doi :10.1016/j.csda.2010.02.010, p. 1942–1951, ISSN 0167-9473. URL http:

//dx.doi.org/10.1016/j.csda.2010.02.010. 13

Holford, T. 1980, �The analysis of rates of survivorship using log-linear models�,

Biometrics, vol. 36, p. 299–305. 30

Ichimura, H. 1993, �Semiparametric least squares (SLS) and weighted SLS esti-

mation of single-index models�, J. Econometrics, vol. 58, no 1-2, doi :10.1016/

0304-4076(93)90114-K, p. 71–120, ISSN 0304-4076. URL http://dx.doi.org/

10.1016/0304-4076(93)90114-K. 15, 19

Jackson, B., J. Scargle, D. Barnes, S. Arabhi, A. Alt, P. Gioumousis, E. Gwin,

P. Sangtrakulcharoen, L. Tan et T. T. Tsai. 2005, �An algorithm for optimal

partitioning of data on an interval�, Signal Processing Letters, IEEE, vol. 12,

no 2, doi :10.1109/LSP.2001.838216(410)12, p. 105 – 108, ISSN 1070-9908. 31

Kaplan, E. L. et P. Meier. 1958, �Nonparametric estimation from incomplete ob-

servations�, J. Amer. Statist. Assoc., vol. 53, p. 457–481, ISSN 0162-1459. 6

van der Laan, M. J. 1996, �Efficient estimation in the bivariate censoring model and

repairing NPMLE�, Ann. Statist., vol. 24, no 2, doi :10.1214/aos/1032894454, p.

596–627, ISSN 0090-5364. URL http://dx.doi.org/10.1214/aos/1032894454.

38

Lebarbier, E. 2005, �Detecting multiple change-points in the mean of gaussian

process by model selection�, Signal Process., vol. 85, no 4, doi :10.1016/j.sigpro.

2004.11.012, p. 717–736, ISSN 0165-1684. URL http://dx.doi.org/10.1016/

j.sigpro.2004.11.012. 32

http://dx.doi.org/10.2307/2530813

http://dx.doi.org/10.2307/2530813


http://dx.doi.org/10.1007/s10463-009-0219-3

http://dx.doi.org/10.1007/s10463-009-0219-3

http://dx.doi.org/10.1016/j.csda.2010.02.010

http://dx.doi.org/10.1016/j.csda.2010.02.010

http://dx.doi.org/10.1016/0304-4076(93)90114-K

http://dx.doi.org/10.1016/0304-4076(93)90114-K


http://dx.doi.org/10.1016/j.sigpro.2004.11.012

http://dx.doi.org/10.1016/j.sigpro.2004.11.012

68 Bibliographie

Li, Y., R. C. Tiwari et S. Guha. 2007, �Mixture cure survival models with dependent

censoring�, J. R. Stat. Soc. Ser. B Stat. Methodol., vol. 69, no 3, doi :10.1111/j.

1467-9868.2007.00589.x, p. 285–306, ISSN 1369-7412. URL http://dx.doi.org/

10.1111/j.1467-9868.2007.00589.x. 8

Lin, D. Y., L. J. Wei, I. Yang et Z. Ying. 2000, �Semiparametric regression for

the mean and rate functions of recurrent events�, J. R. Stat. Soc. Ser. B Stat.

Methodol., vol. 62, no 4, doi :10.1111/1467-9868.00259, p. 711–730, ISSN 1369-

7412. URL http://dx.doi.org/10.1111/1467-9868.00259. 25, 27

Lopez, O. 2007, Reduction de dimension en presence de donnees censurees, These

de doctorat, Universite Rennes 1, Rennes, ISBN 0-387-98873-4, xviii+542 p.. 1

Lopez, O. 2009, �Single-index regression models with right-censored responses�,

J. Statist. Plann. Inference, vol. 139, no 3, doi :10.1016/j.jspi.2008.06.012, p.

1082–1097, ISSN 0378-3758. URL http://dx.doi.org/10.1016/j.jspi.2008.

06.012. 9, 16, 17, 18, 20

Lopez, O. 2011, �Nonparametric estimation of the multivariate distribution func-

tion in a censored regression model with applications�, Communications in Sta-

tistics : Theory and Methods, vol. 40, no 15, p. 2639–2660. 2, 10, 11, 12, 13

Lopez, O. 2012, �A generalization of the kaplana“meier estimator for analy-

zing bivariate mortality under right-censoring and left-truncation with appli-

cations in model-checking for survival copula models�, Insurance : Mathema-

tics and Economics, vol. 51, no 3, doi :10.1016/j.insmatheco.2012.07.009, p.

505 – 516, ISSN 0167-6687. URL http://www.sciencedirect.com/science/

article/pii/S0167668712000881. 52, 55, 56, 57

Lopez, O. et A. Oueslati. 2013, �A proportional hazards regression model with

change-points in the baseline function�, Lifetime Data Analysis, vol. 19, doi :10.

1007/s10985-012-9231-7, p. 59–78, ISSN 1380-7870. URL http://dx.doi.org/

10.1007/s10985-012-9231-7. 26, 29, 31

Lopez, O. et V. Patilea. 2009, �Nonparametric lack-of-fit tests for parametric mean-

regression models with censored data�, J. Multivariate Anal., vol. 100, no 1, doi :

10.1016/j.jmva.2008.04.008, p. 210–230, ISSN 0047-259X. URL http://dx.doi.

org/10.1016/j.jmva.2008.04.008. 9

Lopez, O., V. Patilea et I. Van Keilegom. 2013, �Single-index regression models in

the presence of censoring depending on the covariates�, Bernoulli, vol. to appear.

10, 13, 14, 19, 20, 21

Lopez, O. et P. Saint Pierre. 2011, �Bivariate censored regression relying on a

new estimator of the joint distribution function�, Preprint. URL http://hal.

archives-ouvertes.fr/hal-00584379/fr/. 39, 43, 45

http://dx.doi.org/10.1111/j.1467-9868.2007.00589.x

http://dx.doi.org/10.1111/j.1467-9868.2007.00589.x

http://dx.doi.org/10.1111/1467-9868.00259





http://dx.doi.org/10.1007/s10985-012-9231-7

http://dx.doi.org/10.1007/s10985-012-9231-7

http://dx.doi.org/10.1016/j.jmva.2008.04.008

http://dx.doi.org/10.1016/j.jmva.2008.04.008

http://hal.archives-ouvertes.fr/hal-00584379/fr/

http://hal.archives-ouvertes.fr/hal-00584379/fr/

Bibliographie 69

Luciano, E., J. Spreeuw et E. Vigna. 2008, �Modelling stochastic mortality for

dependent lives�, Insurance Math. Econom., vol. 43, no 2, doi :10.1016/j.

insmatheco.2008.06.005, p. 234–244, ISSN 0167-6687. URL http://dx.doi.org/

10.1016/j.insmatheco.2008.06.005. 36

Luciano, E., J. Spreeuw et E. Vigna. 2012, �Evolution of coupled lives’ dependency

across generations and pricing impact�, Preprint. 60

Major, P. 2006, �An estimate on the supremum of a nice class of stochastic integrals

and U -statistics�, Probab. Theory Related Fields, vol. 134, no 3, doi :10.1007/

s00440-005-0440-9, p. 489–537, ISSN 0178-8051. URL http://dx.doi.org/10.

1007/s00440-005-0440-9. 12

Nelsen, R. B. 2006, An introduction to copulas, 2e ed., Springer Series in Statistics,

Springer, New York, ISBN 978-0387-28659-4 ; 0-387-28659-4, xiv+269 p.. 47, 49

Omelka, M., I. Gijbels et N. Veraverbeke. 2009, �Improved kernel estimation of

copulas : weak convergence and goodness-of-fit testing�, Ann. Statist., vol. 37,

no 5B, doi :10.1214/08-AOS666, p. 3023–3058, ISSN 0090-5364. URL http://

dx.doi.org/10.1214/08-AOS666. 60

Othus, M., Y. Li et R. C. Tiwari. 2009, �A class of semiparametric mixture cure

survival models with dependent censoring�, J. Amer. Statist. Assoc., vol. 104,

no 487, doi :10.1198/jasa.2009.tm08033, p. 1241–1250, ISSN 0162-1459. URL

http://dx.doi.org/10.1198/jasa.2009.tm08033. 8

Prentice, R. L. et J. Cai. 1992, �Covariance and survivor function estimation

using censored multivariate failure time data�, Biometrika, vol. 79, no 3, doi :

10.1093/biomet/79.3.495, p. 495–512, ISSN 0006-3444. URL http://dx.doi.

org/10.1093/biomet/79.3.495. 38

Prentice, R. L., B. J. Williams et A. V. Peterson. 1981, �On the regression

analysis of multivariate failure time data�, Biometrika, vol. 68, no 2, doi :

10.1093/biomet/68.2.373, p. 373–379, ISSN 0006-3444. URL http://dx.doi.

org/10.1093/biomet/68.2.373. 25

Pruitt, R. C. 1991a, �On negative mass assigned by the bivariate Kaplan-Meier

estimator�, Ann. Statist., vol. 19, no 1, doi :10.1214/aos/1176347992, p. 443–

453, ISSN 0090-5364. URL http://dx.doi.org/10.1214/aos/1176347992. 38

Pruitt, R. C. 1991b, �Strong consistency of self-consistent estimators : general

theory and an application to bivariate survival analysis�, cahier de recherche

543, University of Minnesota, Minneapolis. 38

Reid, N. 1981, �Estimating the median survival time�, Biometrika, vol. 68, no 3,

doi :10.1093/biomet/68.3.601, p. 601–608, ISSN 0006-3444. URL http://dx.

doi.org/10.1093/biomet/68.3.601. 46

http://dx.doi.org/10.1016/j.insmatheco.2008.06.005

http://dx.doi.org/10.1016/j.insmatheco.2008.06.005

http://dx.doi.org/10.1007/s00440-005-0440-9

http://dx.doi.org/10.1007/s00440-005-0440-9

http://dx.doi.org/10.1214/08-AOS666

http://dx.doi.org/10.1214/08-AOS666

http://dx.doi.org/10.1198/jasa.2009.tm08033

http://dx.doi.org/10.1093/biomet/79.3.495







70 Bibliographie

Salmenkivi, M. et H. Mannila. 2005, �Using markov chain monte carlo and dynamic

programming for event sequence data�, Knowl. Inf. Syst., vol. 7, no 3, doi :

10.1007/s10115-004-0157-6, p. 267–288, ISSN 0219-1377. URL http://dx.doi.

org/10.1007/s10115-004-0157-6. 31

Sanchez Sellero, C., W. Gonzalez Manteiga et I. Van Keilegom. 2005, �Uniform

representation of product-limit integrals with applications�, Scand. J. Statist.,

vol. 32, no 4, doi :10.1111/j.1467-9469.2005.00453.x, p. 563–581, ISSN 0303-6898.

URL http://dx.doi.org/10.1111/j.1467-9469.2005.00453.x. 9, 13

Schnedler, W. 2005, �Likelihood estimation for censored random vectors�, Eco-

nometric Rev., vol. 24, no 2, doi :10.1081/ETC-200067925, p. 195–217, ISSN

0747-4938. URL http://dx.doi.org/10.1081/ETC-200067925. 17

Sherman, R. P. 1993, �The limiting distribution of the maximum rank correlation

estimator�, Econometrica, vol. 61, no 1, doi :10.2307/2951780, p. 123–137, ISSN

0012-9682. URL http://dx.doi.org/10.2307/2951780. 21

Sherman, R. P. 1994, �Maximal inequalities for degenerate U -processes with

applications to optimization estimators�, Ann. Statist., vol. 22, no 1, doi :

10.1214/aos/1176325377, p. 439–459, ISSN 0090-5364. URL http://dx.doi.

org/10.1214/aos/1176325377. 21

Shih, J. H. et T. A. Louis. 1995, �Inferences on the association parameter in

copula models for bivariate survival data�, Biometrics, vol. 51, no 4, doi :

10.2307/2533269, p. 1384–1399, ISSN 0006-341X. URL http://dx.doi.org/10.

2307/2533269. 41, 47

Sklar, M. 1959, �Fonctions de repartition a n dimensions et leurs marges�, Publ.

Inst. Statist. Univ. Paris, vol. 8, p. 229–231. 47

Smith, R. L. 1987, �Estimating tails of probability distributions�, Ann. Statist.,

vol. 15, no 3, doi :10.1214/aos/1176350499, p. 1174–1207, ISSN 0090-5364. URL

http://dx.doi.org/10.1214/aos/1176350499. 22

Stute, W. 1993, �Consistent estimation under random censorship when covariables

are present�, J. Multivariate Anal., vol. 45, no 1, doi :10.1006/jmva.1993.1028, p.

89–103, ISSN 0047-259X. URL http://dx.doi.org/10.1006/jmva.1993.1028.

6, 8, 9, 17, 40

Stute, W. 1995, �The central limit theorem under random censorship�, Ann. Sta-

tist., vol. 23, no 2, doi :10.1214/aos/1176324528, p. 422–439, ISSN 0090-5364.

URL http://dx.doi.org/10.1214/aos/1176324528. 6, 13, 43

Stute, W. 1996, �Distributional convergence under random censorship when cova-

riables are present�, Scand. J. Statist., vol. 23, no 4, p. 461–471, ISSN 0303-6898.

6, 9

http://dx.doi.org/10.1007/s10115-004-0157-6

http://dx.doi.org/10.1007/s10115-004-0157-6

http://dx.doi.org/10.1111/j.1467-9469.2005.00453.x

http://dx.doi.org/10.1081/ETC-200067925

http://dx.doi.org/10.2307/2951780



http://dx.doi.org/10.2307/2533269

http://dx.doi.org/10.2307/2533269


http://dx.doi.org/10.1006/jmva.1993.1028


Bibliographie 71

Stute, W. 1999, �Nonlinear censored regression�, Statist. Sinica, vol. 9, no 4, p.

1089–1102, ISSN 1017-0405. 9

Stute, W. et J.-L. Wang. 1993, �The strong law under random censorship�, Ann.

Statist., vol. 21, no 3, doi :10.1214/aos/1176349273, p. 1591–1607, ISSN 0090-

5364. URL http://dx.doi.org/10.1214/aos/1176349273. 6, 8

Tsai, W.-Y., N. P. Jewell et M.-C. Wang. 1987, �A note on the product-limit

estimator under right censoring and left truncation�, Biometrika, vol. 74, no 4,

p. 883–886. 52

Tsai, W.-Y., S. Leurgans et J. Crowley. 1986, �Nonparametric estimation of a

bivariate survival function in the presence of censoring�, Ann. Statist., vol. 14,

no 4, doi :10.1214/aos/1176350162, p. 1351–1365, ISSN 0090-5364. URL http:

//dx.doi.org/10.1214/aos/1176350162. 38

van der Vaart, A. W. et J. A. Wellner. 1996, Weak convergence and empirical

processes with applications to statistics, Springer Series in Statistics, Springer-

Verlag, New York, ISBN 0-387-94640-3, xvi+508 p.. 13, 21, 33

Van Keilegom, I. et M. G. Akritas. 1999, �Transfer of tail information in

censored regression models�, Ann. Statist., vol. 27, no 5, doi :10.1214/aos/

1017939150, p. 1745–1784, ISSN 0090-5364. URL http://dx.doi.org/10.1214/

aos/1017939150. 6, 9, 11

Van Keilegom, I., J. de Una-Alvarez et L. Meira-Machado. 2011, �Nonparametric

location-scale models for censored successive survival times�, J. Statist. Plann.

Inference, vol. 141, no 3, doi :10.1016/j.jspi.2010.09.010, p. 1118–1131, ISSN 0378-

3758. URL http://dx.doi.org/10.1016/j.jspi.2010.09.010. 13

Wang, M.-C. 1991, �Nonparametric estimation from cross-sectional survival data�,

Journal of the American Statistical Association, vol. 86, no 413, p. pp. 130–143,

ISSN 01621459. URL http://www.jstor.org/stable/2289722. 36

Wang, W. et M. T. Wells. 1997, �Nonparametric estimators of the bivariate survival

function under simplified censoring conditions�, Biometrika, vol. 84, no 4, doi :10.

1093/biomet/84.4.863, p. 863–880, ISSN 0006-3444. URL http://dx.doi.org/

10.1093/biomet/84.4.863. 36, 40

Wang, W. et M. T. Wells. 2000, �Model selection and semiparametric inference

for bivariate failure-time data�, J. Amer. Statist. Assoc., vol. 95, no 449, p. 62–

76, ISSN 0162-1459. With a comment by Edsel A. Pena and a rejoinder by the

authors. 47, 48

Xia, Y. et W. K. Li. 1999, �On single-index coefficient regression models�, J. Amer.

Statist. Assoc., vol. 94, no 448, doi :10.2307/2669941, p. 1275–1285, ISSN 0162-

1459. URL http://dx.doi.org/10.2307/2669941. 15







http://www.jstor.org/stable/2289722



http://dx.doi.org/10.2307/2669941

72 Bibliographie

Xia, Y., H. Tong et W. K. Li. 1999, �On extended partially linear single-index

models�, Biometrika, vol. 86, no 4, doi :10.1093/biomet/86.4.831, p. 831–842,

ISSN 0006-3444. URL http://dx.doi.org/10.1093/biomet/86.4.831. 15

Youn, H. et A. Shemyakin. 1999, �Statistical aspects of joint life insurance pricing�,

Proceedings of the business and statistics section of the American Statistical As-

sociation, p. 34–38, ISSN 8. 36

Youn, H. et A. Shemyakin. 2001, �Pricing practices for joint last survivor insu-

rance�, Actuarial Research Clearing House. 36


Documents

HABILITATION A DIRIGER DES RECHERCHES - · PDF fileHABILITATION A DIRIGER ... La ligne directrice de ces travaux concerne l’ etude ... Chapitre 4 visent a d evelopper de nouveaux