Upload
tranbao
View
218
Download
0
Embed Size (px)
Citation preview
UNIVERSITE PIERRE ET MARIE CURIE
HABILITATION A DIRIGER
DES RECHERCHES
Auteur :
Olivier Lopez
Contributions a l’etude desmodeles de duree dans un cadre
multivarie
Laboratoire de Statistique Theorique et Appliquee
Jury :
Rapporteurs : Christian Genest - Universite Mc GillIrene Gijbels - Katholieke Universiteit LeuvenChristian Robert - Universite Lyon 1
Examinateurs : Gerard Biau - Universite Pierre et Marie CurieJean-David Fermanian - Crest-Ensae Paris TechMathieu Rosenbaum - Universite Pierre et Marie CurieJean-Michel Zakoian - Crest-Ensae Paris Tech
Table des matieres
1 Estimation nonparametrique pour la regression censuree 5
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Donnees censurees et regression . . . . . . . . . . . . . . . . . . . . . 7
1.2.1 Cadre general . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.2 Exemples d’applications . . . . . . . . . . . . . . . . . . . . . 7
1.2.3 Les hypotheses d’identifiabilite . . . . . . . . . . . . . . . . . 8
1.3 Estimation de la fonction de repartition dans le cadre d’un modele
de regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3.1 Estimation de la fonction de repartition conditionnelle . . . . 11
1.3.2 Estimation de la loi jointe de (T,X) . . . . . . . . . . . . . . 11
1.3.3 Resultats theoriques obtenus . . . . . . . . . . . . . . . . . . 12
1.4 Premieres applications et extensions . . . . . . . . . . . . . . . . . . 13
1.4.1 Estimation dans un modele de regression parametrique . . . . 13
1.4.2 Extension au cas ou la fonction g est inconnue . . . . . . . . 13
1.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2 Modeles single-index 15
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2 Deux modeles single-index . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2.1 Modele 1 : estimation de la densite conditionnelle . . . . . . . 16
2.2.2 Modele 2 : estimation d’une esperance conditionnelle. . . . . 18
2.3 Resultats theoriques . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.3.1 Formulation des resultats pour le Modele 1. . . . . . . . . . . 19
2.3.2 Formulation des resultats pour le Modele 2. . . . . . . . . . . 20
2.3.3 Arguments principaux des preuves . . . . . . . . . . . . . . . 21
2.4 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3 Evenements recurrents 25
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.2 Modele single-index pour l’analyse d’evenements recurrents . . . . . 26
3.2.1 Description du modele . . . . . . . . . . . . . . . . . . . . . . 26
3.2.2 Resultats obtenus . . . . . . . . . . . . . . . . . . . . . . . . 28
3.3 Combinaison d’un modele de detection de rupture et d’un modele de
Cox . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.3.1 Description du modele . . . . . . . . . . . . . . . . . . . . . . 29
3.3.2 Estimation et choix du parametre l . . . . . . . . . . . . . . . 31
3.3.3 Synthese des principaux resultats obtenus . . . . . . . . . . . 31
3.4 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.4.1 Formulation du probleme . . . . . . . . . . . . . . . . . . . . 32
3.4.2 Combinaison des differents modeles de ce chapitre . . . . . . 33
ii Table des matieres
4 Regression et censure multivariee 35
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2 Estimation de la fonction de repartition . . . . . . . . . . . . . . . . 37
4.2.1 Les observations . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.2.2 Revue de la litterature . . . . . . . . . . . . . . . . . . . . . . 37
4.2.3 Approche generale pour estimer la distribution de (T,U) . . . 39
4.2.4 Un premier cadre : modelisation de la loi des censures . . . . 39
4.2.5 Un second cadre : introduction d’une variable auxiliaire . . . 41
4.3 Proprietes theoriques des estimateurs obtenus . . . . . . . . . . . . . 42
4.3.1 Premier cadre . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.3.2 Deuxieme cadre . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.4 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.4.1 Regression : illustration dans le cadre 1 . . . . . . . . . . . . 44
4.4.2 Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.4.3 Tests d’adequation pour des modeles de copules . . . . . . . . 46
4.5 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
5 Censure multivariee et troncature a gauche 51
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
5.2 Construction de l’estimateur . . . . . . . . . . . . . . . . . . . . . . . 53
5.2.1 Observations . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.2.2 Une equation aux derivees partielles . . . . . . . . . . . . . . 53
5.2.3 Definition de l’estimateur et justification de son existence . . 54
5.3 Proprietes de convergence . . . . . . . . . . . . . . . . . . . . . . . . 56
5.3.1 Etude des poids Wi,n . . . . . . . . . . . . . . . . . . . . . . . 56
5.3.2 Integrales par rapport a F . . . . . . . . . . . . . . . . . . . . 57
5.4 Application sur donnees reelles . . . . . . . . . . . . . . . . . . . . . 57
5.4.1 Applications generales . . . . . . . . . . . . . . . . . . . . . . 57
5.4.2 Jeu de donnees canadiennes . . . . . . . . . . . . . . . . . . . 57
5.5 Extension de la notion de copule empirique et perspectives . . . . . 58
5.5.1 Copule empirique . . . . . . . . . . . . . . . . . . . . . . . . . 58
5.5.2 Evolution generationnelle de la dependance . . . . . . . . . . 60
Bibliographie 63
Introduction
Ce memoire d’habilitation presente la synthese des travaux que j’ai pu effectuer
depuis mon arrivee au Laboratoire de Statistique Theorique et Appliquee en sep-
tembre 2008. Ils s’inscrivent dans la continuite d’un parcours debute au cours de
ma these de doctorat, et enrichi par le contact avec de nouvelles thematiques.
La ligne directrice de ces travaux concerne l’etude des modeles de durees dans
un cadre multivarie. Plus precisement, l’une des thematiques principales concerne
l’impact de phenomenes omnipresents dans ce type de modeles : la censure et la
troncature. Ces phenomenes parasites, qui entraınent la presence d’observations
incompletes, sont lies a la structure meme des donnees utilisees pour l’etude des
modeles de duree. En effet, une duree n’est pas une variable mesurable instan-
tanement. Par exemple, si l’on considere l’etude de la duree de vie de personnes
detenant un contrat d’assurance, le rachat anticipe du contrat par l’assure (avant son
deces, donc), empeche d’observer completement la variable d’interet. Le probleme
de la censure ne se restreint pas neanmoins a la seule modelisation des durees. On
peut egalement donner l’exemple, en assurance, d’un cout de sinistre qui n’est pas
necessairement regle dans sa totalite. Ce type de situation intervient notamment
dans le cadre des garanties a developpement longs, notamment responsabilite civile,
ou la liquidation de certains sinistres peut prendre plusieurs annees.
Les modeles consideres dans ce memoire ont donc pour vocation de s’appliquer
dans un large eventail de situations. Par ailleurs, les techniques utilisees pour prou-
ver la convergence des estimateurs consideres (notamment les techniques issues de
la theorie des processus empiriques) peuvent etre reemployees dans d’autres cadres,
et certaines de ces extensions seront exposees dans le present memoire.
L’une des particularites des travaux presentes ici tient au fait que l’on etudie
des durees dans un univers multivarie : en plus d’une variable de duree, plusieurs
variables sont disponibles, qu’elles soient des variables explicatives non censurees
(Chapitres 1 a 3), ou d’autres variables de duree (Chapitres 4 et 5). Ce cadre multi-
varie ne presente pas de difficultes majeures si l’on se place dans un cadre purement
parametrique, ou des techniques d’estimation par maximum de vraisemblance sont
largement employees. En revanche, des lors que l’on se place dans des modeles sta-
tistiques non parametriques (ou semi parametriques comme aux Chapitres 2 et 3), la
definition d’outils adaptes s’avere plus delicate. Les reponses pertinentes reclament
notamment de se placer sous des hypotheses d’identifiabilite raisonnables quand on
les confronte aux situations modelisees. Cette question des hypotheses d’identifiabi-
lite est un probleme crucial en presence de donnees censurees et/ou tronquees. Elle
est indispensable a la bonne definition des objets que l’on souhaite estimer. Cette
problematique, presente tout au long du memoire, est notamment evoquee plus en
detail au Chapitre 1.
La premiere partie de ce memoire d’habilitation prolonge des resultats obtenus
dans ma these de doctorat (voir Lopez (2007)). Elle vient completer des approches
2 Table des matieres
presentes dans ce precedent travail, afin de les generaliser a un contexte plus realiste
et plus complet du point de vue des hypotheses sous-jacentes. Dans le Chapitre 1,
on effectue une presentation generale du cadre des modeles de regression censures,
pour lesquels les observations sont constituees d’une variable d’interet censuree,
et de plusieurs variables explicatives. De facon sommaire, il existe deux grands
types de modeles dans ce cadre : ceux bases sur une independance entre les va-
riables du modele et le phenomene de censure, et ceux qui autorisent ce phenomene
de censure a dependre des variables explicatives. Ce deuxieme cadre entraıne des
developpements plus delicats, necessitant la construction d’un estimateur non pa-
rametrique de la distribution des variables. Cet estimateur est la principale contri-
bution de ce chapitre. Il presente notamment l’avantage, contrairement aux estima-
teurs concurrents, de conserver de bonnes proprietes de convergence meme quand
la dimension des variables explicatives est superieure a 1.
Le Chapitre 2 s’interesse a des modeles de regression semi-parametriques type
single-index. Les modeles single-index repondent a un imperatif de reduction de di-
mension : en supposant que la fonction de regression ne depend des variables expli-
catives qu’a travers une combinaison lineaire de ces variables, on se premunit contre
la trop faible vitesse de convergence des estimateurs purement non parametriques.
Les travaux presentes au Chapitre 2 peuvent etre vus comme un prolongement de
Lopez (2011), puisqu’ils repondent a deux difficultes pointees dans cet article : la
difficulte d’estimer convenablement la queue droite de distribution en presence de
censure a droite, et la necessite de considerer un cadre (conforme a celui expose
dans le Chapitre 1) ou la censure peut dependre des variables explicatives. Les
outils techniques utilises pour valider ces methodes presentent l’avantage de pou-
voir etre adaptees (via un certain nombre d’amenagements) a d’autres cadres, on
considerera notamment le cas d’un modele de regression Pareto.
Dans le Chapitre 3, on considere des problematiques liees a l’analyse des
evenements recurrents. Plusieurs approches sont developpees pour modeliser le
temps entre deux occurrences successives. On examinera une approche single-index,
inspiree des elements du Chapitre 2, pour cerner l’impact de variables explicatives
sur la frequence de ces evenements recurrents. On s’interrogera egalement sur des
approches permettant de detecter d’eventuels changements brutaux de dynamique
dans de tels processus. Les modeles de detection de rupture qui sont consideres dans
ce chapitre sont motives par des applications, l’une a l’analyse des reservations a la
SNCF, l’autre a l’etude de la repartition des sinistres d’une compagnie d’assurance
sur l’ensemble d’une annee.
Les deux derniers chapitres de ce memoire d’habilitation se penchent sur le cas ou
plusieurs variables de duree sont modelisees conjointement. La gestion d’une censure
multivariee pose de nombreuses difficultes techniques. Les approches developpees au
Chapitre 4 visent a developper de nouveaux estimateurs de la distribution au prix
d’hypotheses simplificatrices sur le processus de censure, hypotheses qui restent
neanmoins valides pour de nombreuses applications. Si les techniques utilisees pour
prouver la convergence asymptotique sont differentes, le principe de construction
des estimateurs reprend, dans un nouveau cadre, une logique deja presente au Cha-
Table des matieres 3
pitre 1. Le Chapitre 5 vise quant a lui a s’affranchir des contraintes imposees par
les conditions simplificatrices du Chapitre 4. Les variables de censure considerees ne
sont sujettes qu’a des hypotheses minimales. On introduit egalement la presence de
troncature a gauche, frequemment rencontree dans les modeles de duree. Le fait de
se placer dans ce cadre general necessite l’introduction de techniques d’estimation
plus elaborees. L’approche developpee pour estimer non parametriquement la distri-
bution des variables du modele est basee sur la resolution d’une version discretisee
d’une equation aux derivees partielles. L’interet des estimateurs des Chapitres 4 et
5 est illustre notamment pour la construction de tests d’adequation a des modeles
de copules, ainsi que de procedures de type bootstrap.
Chapitre 1
Estimation nonparametrique
pour la regression censuree
Sommaire
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Donnees censurees et regression . . . . . . . . . . . . . . . . 7
1.2.1 Cadre general . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.2 Exemples d’applications . . . . . . . . . . . . . . . . . . . . . 7
1.2.3 Les hypotheses d’identifiabilite . . . . . . . . . . . . . . . . . 8
1.3 Estimation de la fonction de repartition dans le cadre d’un
modele de regression . . . . . . . . . . . . . . . . . . . . . . . 10
1.3.1 Estimation de la fonction de repartition conditionnelle . . . . 11
1.3.2 Estimation de la loi jointe de (T,X) . . . . . . . . . . . . . . 11
1.3.3 Resultats theoriques obtenus . . . . . . . . . . . . . . . . . . 12
1.4 Premieres applications et extensions . . . . . . . . . . . . . . 13
1.4.1 Estimation dans un modele de regression parametrique . . . . 13
1.4.2 Extension au cas ou la fonction g est inconnue . . . . . . . . 13
1.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.1 Introduction
D’un point de vue statistique, l’une des specificites des modeles de duree tient
dans le fait que les observations dont dispose le praticien sont souvent incompletes.
En effet, contrairement a d’autres types de variables statistiques qui peuvent etre
mesurees ou recuperees instantanement, un grand nombre de phenomenes parasites
peuvent se produire entre le moment ou debute une etude statistique, et le moment
ou la duree recherchee est effectivement observee.
Par exemple, un probleme usuel en assurance-vie consiste a inferer sur la dis-
tribution de la duree de vie des assures, et l’estimation de cette duree s’effectue
a partir de donnees issues d’un portefeuille d’assures observes sur un certain laps
de temps. Entre le debut de la periode d’observation et sa fin, certains assures
peuvent, par exemple, rompre leur contrat et cessent alors d’etre observes. Dans ce
cas, de meme que pour les individus qui se trouvent etre toujours vivants a la fin de
l’etude, la duree qui interesse le statisticien n’est pas connue pour tous les individus
(phenomene dit de censure).
6 Chapitre 1. Estimation nonparametrique pour la regression censuree
L’introduction dans les demarches statistiques de ce type d’observations in-
completes necessite de redefinir les outils classiques d’estimation ou de test. On peut
en effet mettre facilement en evidence le fait que l’occultation de ce phenomene n’est
pas pertinente : negliger les observations censurees entraıne une sous-representation
des durees les plus importantes, lesquelles sont plus souvent sujettes a la censure
(plus la duree de vie d’un individu est longue, plus la probabilite qu’il cesse d’etre
observe pour une raison ou une autre dans ce laps de temps devient importante).
L’estimateur de Kaplan-Meier (Kaplan et Meier (1958)) est l’un des outils fon-
damentaux de l’estimation non-parametrique de la distribution d’une duree en
presence de censure. On pourra consulter Gill (1983), Stute et Wang (1993), Stute
(1995) ou Gijbels et Veraverbeke (1991) pour differentes proprietes asymptotiques
du processus de Kaplan-Meier.
Dans le contexte de la regression, ces techniques doivent etre adaptees, car
l’introduction d’une ou plusieurs variables explicatives change la donne. La princi-
pale question qui se pose est liee aux conditions d’identifiabilite du modele. Si on
considere que les variables explicatives n’ont pas (ou peu) d’impact sur le phenomene
de censure, des techniques basees sur l’estimateur de Kaplan-Meier peuvent etre
utilisees, voir notamment Stute (1993) et Stute (1996). Si, a l’inverse, les variables
explicatives influencent la censure, un nouveau faisceau de methodes doit etre uti-
lise, voir notamment Beran (1981), Dabrowska (1988), Van Keilegom et Akritas
(1999).
Les deux contextes repondent a des exigences de modelisation differentes (voir les
exemples dans la section 1.2.3). Nous nous concentrons, dans le present chapitre, sur
le cadre ou la censure depend des variables explicatives. On considerera un nouvel
estimateur de la distribution de l’ensemble des variables (explicatives et expliquees)
impliquees dans le modele. Cet estimateur est la pierre angulaire des techniques
d’estimation qui peuvent etre developpees dans ce cadre (on verra, section 1.4,
l’utilisation dans des modeles ou la fonction de regression est parametrique, puis,
dans un modele semi-parametrique au Chapitre 2).
La construction de cet estimateur vient repondre a plusieurs exigences. La sim-
plicite, d’une part : son calcul ne necessitant que des developpements simples, est
base sur l’affectation d’un poids choisi avec soin pour chaque observation. D’autre
part, il repond a une problematique particuliere : l’introduction de variables expli-
catives en grand nombre. En effet, l’une des limites des approches concurrentes uti-
lisees jusqu’ici reside dans le fait qu’elles fonctionnent difficilement lorsque le nombre
de variables explicatives est superieur a 1. Ces raisons sont a la fois theoriques
(des arguments techniques empechent l’extension directe de certaines preuves), et
pratiques (les estimateurs proposes butent sur le mauvais comportement des es-
timateurs non-parametriques en ”grande” dimension). Par ailleurs, les resultats
theoriques fournis dans ce chapitre permettent la validation de techniques d’esti-
mation basees sur ce nouvel outil.
Le plan de ce chapitre est le suivant. Dans la section 1.2, nous definissons un
modele de censure qui sera considere dans les chapitres 1 a 3 de ce memoire. On
discutera notamment la question des hypotheses d’identifiabilite qui determine le
1.2. Donnees censurees et regression 7
type de techniques de regression devant etre mis en œuvre. Dans la section 1.3, nous
definissons l’estimateur de la fonction de repartition qui repond aux objectifs fixes.
Ses proprietes theoriques sont presentees. Des applications et perspectives sur cet
estimateur sont proposees dans la section 1.4.
1.2 Donnees censurees et regression
Dans cette section, nous definissons un modele de regression ou la variable
d’interet est censure, formalise en section 1.2.1. A titre indicatif, quelques cadres
d’application sont proposes en section 1.2.2. La section 1.2.3 aborde la question des
conditions d’identifiabilite du modele. Selon l’hypothese sous laquelle on se place,
les techniques d’inference developpees sont en effet differentes, comme on le verra
par la suite.
1.2.1 Cadre general
Dans le reste de ce document, on considere une variable T qui pourra etre
consideree comme une duree. Cette identification a une duree n’est pas absolue, le
phenomene de donnees censurees n’etant pas circonscrit aux durees de vie ainsi que
nous le verrons dans la section 1.2.2. On introduit une variable de censure C, et la
duree observee
Y = inf(T,C).
On considere egalement
δ = 1T≤C ,
qui permet de distinguer entre les cas ou l’on observe effectivement T et ou l’ob-
servation est censuree par C. On supposera dans toute la suite que P(T = C) = 0
pour eviter tout probleme cause par une eventuelle dissymetrie entre les variables
T et C vis-a-vis de l’indicatrice δ.
Dans le cadre d’un probleme de regression, on considere un vecteur X ∈ Rd de
variables explicatives. Ces variables sont supposees etre observees exactement. L’in-
troduction de variables explicatives elles-memes sujettes a la censure sera consideree
aux Chapitres 4 et 5.
Les observations disponibles sont constituees d’un vecteur (Yi, δi, Xi)1≤i≤n de
replications i.i.d. du vecteur aleatoire (Y, δ,X).
1.2.2 Exemples d’applications
Nous presentons ici plusieurs exemples d’applications, la liste ne se voulant pas
exhaustive.
Durees de vie. T designe la duree de vie d’un individu. C designe le temps
au bout duquel l’individu cesse d’etre observe pour une raison autre que le deces
(date de rachat de contrat pour des individus observes a partir de portefeuilles
d’assurance-vie, date de fin de contrat, fin de la periode d’etude...). X designe un
ensemble de caracteristiques (age, categorie socio-professionnelle, revenu...).
8 Chapitre 1. Estimation nonparametrique pour la regression censuree
Temps passe au chomage. T designe le temps au bout duquel l’individu re-
trouve un emploi. C designe le temps au bout duquel l’individu cesse d’etre observe
pour une raison autre (fin de droit, fin de la periode d’etude...). A nouveau, X
designe un ensemble de caracteristiques permettant d’expliquer T.
Montants de sinistres. Dans cet exemple, T ne designe plus une duree mais
un montant de sinistre. C designe le plafond d’indemnisation. Si T excede C, la vraie
valeur de T est inconnue puisque l’assureur ne prend en charge que le montant C. Un
autre exemple concerne les reglements lies aux sinistres a temps de developpement
long (i.e. qui mette un temps important avant d’etre totalement regles). Dans ce
cas, pour les sinistres non clos, on peut considerer que le montant regle jusqu’a
aujourd’hui C est une sous-estimation de la somme totale a reglee T.
1.2.3 Les hypotheses d’identifiabilite
Si l’on evacue le probleme des regresseurs, le modele de censure decrit dans
la section 1.2 requiert l’utilisation d’hypothese d’identifiabilite, si l’on veut etre
a meme d’estimer la loi de T. Ainsi, l’estimateur de Kaplan-Meier requiert l’hy-
pothese d’independance entre T et C afin d’etre consistant (voir Stute et Wang
(1993)). D’autres hypotheses d’identifiabilite peuvent etre envisagees, voir par
exemple Othus et collab. (2009) et Li et collab. (2007), reposant elles aussi sur
une modelisation de la loi conditionnelle de T sachant C.
Dans le cadre qui nous preoccupe, nous nous focalisons sur l’hypothese
d’independance entre T et C, qui doit etre generalisee a la presence de regresseurs.
Deux cadres principaux existent dans la litterature.
Cadre 1 : Independance.
On suppose
T ⊥ C
P (T ≤ C|T,X) = P (T ≤ C|T ) .
Cette hypothese est due a Stute (1993). Un cas particulier important est celui
ou (T,X) ⊥ C, mais le jeu d’hypotheses ci-dessus est sensiblement plus general.
Neanmoins, du point de vue de la modelisation, il paraıt difficile de justifier l’op-
portunite de cette hypothese, si ce n’est dans le cas ou (T,X) ⊥ C.Ce cadre est bien adapte notamment a des phenomenes de censure dite admi-
nistrative, ou la censure n’est causee que par la fin de la periode d’observation,
et nullement par d’autres facteurs. Dans ce cas, les caracteristiques d’un individu
n’influent pas sur la loi de la censure s’ils n’influent pas sur la date d’entree en
observation.
1.2. Donnees censurees et regression 9
Cadre 2 : Independance conditionnelle.
On suppose
T ⊥ C | X.
Dans ce cas, la loi de la censure est autorisee a dependre des caracteristiques
X.
Si l’on reprend l’exemple du temps passe au chomage, ce type d’hypothese est
plus conforme que le cadre 1 a la situation modelisee. En effet, si X contient no-
tamment une variable representant la categorie socio-professionnelle d’origine, il est
raisonnable de penser que le temps avant radiation (qui est une cause de censure)
depend de cette caracteristique.
Du point de vue des techniques statistiques mises en œuvre, le Cadre 1 presente
l’avantage majeur de permettre l’importation quasi-directe de methodes basees sur
l’estimateur de Kaplan-Meier. En effet, puisque T ⊥ C (ce qui n’est en general
pas le cas dans le Cadre 2), l’estimateur de Kaplan-Meier est consistant dans cette
situation.
Ainsi, Stute (1993) propose un estimateur base sur la construction suivante.
Soit FKM l’estimateur de Kaplan-Meier de la fonction de repartition de T. Cet
estimateur peut s’exprimer comme une fonction constante par morceaux, affectant
une masse Win a l’observation i, autrement dit
FKM (t) =
n∑i=1
Win1Ti≤t.
Stute propose d’estimer F (t, x) = P (T ≤ t,X ≤ x) par
FS(t, x) =
n∑i=1
Win1Ti≤t,Xi≤x.
Des resultats de convergence pour FS ainsi que pour les integrales par rapport a la
mesure qu’il definit ont ete prouves par Stute (1996), et, dans un cadre plus general
incorporant de la troncature a gauche, par Sanchez Sellero et collab. (2005). Ces
resultats deviennent des elements importants permettant de prouver des resultats
de convergence pour differents problemes lies a la regression, voir notamment Stute
(1999), Gannoun et collab. (2005), Delecroix et collab. (2008), Lopez (2009), et
Lopez et Patilea (2009).
Dans le Cadre 2, l’estimateur de Kaplan-Meier conditionnel, introduit initiale-
ment par Beran (1981), puis etudie notamment par Dabrowska (1989) est l’outil de
base qui permet l’estimation non-parametrique de F (t|x) = P(T ≤ t|X = x). Il est
defini de facon plus precise dans la section 1.3.1 ci-dessous. Plusieurs estimateurs
non parametriques de F (t, x) ont ete etudies par Van Keilegom et Akritas (1999)
et Akritas et Van Keilegom (2001). Ainsi qu’il l’a deja ete precise, la performance
de ces estimateurs souffre d’une valeur de d (dimension de X) grande. Ce souci ne
se rencontre pas dans le Cadre 1 (a moins que la dimension de X soit de l’ordre
10Chapitre 1. Estimation nonparametrique pour la regression censuree
du nombre d’observations, mais on retombe alors sur l’un des problemes classiques
de la grande dimension qui frappe meme des problemes parametriques), du fait de
l’absence d’estimateurs bases sur du lissage non parametrique dans la definition de
FS .
Nous proposons un troisieme cadre, qui peut etre vu comme un compromis entre
les deux situations ci-dessus, et qui permet l’estimation de F meme lorsque d est
important.
Cadre 3 : Independance conditionnellement a un facteur uni-
dimensionnel.
Soit g : Rd → R. On suppose
T ⊥ C | g(X)
P (T ≤ C|T,X) = P (T ≤ C|T, g(X)) .
Cette hypothese est verifiee notamment lorsque la loi de C sachant X ne depend
que du facteur uni-dimensionnel g(X).
Ceci permet a la fois d’autoriser la censure a dependre des variables explica-
tives, tout en restreignant cette dependance a un seul facteur, ce qui permettra de
n’avoir besoin que de lissages non-parametriques uni-dimensionnels pour estimer la
distribution de (T,X). En particulier, on pense a g(X) = X(i), ou X(i) represente
la i−eme composante du vecteur X, dans le cas ou C ne depend que d’une compo-
sante particuliere des covariables. L’autre exemple important, inspire des methodes
de reduction de dimension de type single-index (voir Chapitres 2 et 3), consiste a
supposer que g(X) = θ′0X, ou θ0 definit une combinaison lineaire des composantes
de X qui resume la facon dont C depend de X.
Dans un premier temps, on supposera g(X) connue, ce qui est le cadre de l’article
Lopez (2011). Le cas ou l’on dispose d’un estimateur de g(X) consistant a la vitesse
n−1/2, qui est la situation consideree dans Lopez et collab. (2013), est considere par
la suite.
1.3 Estimation de la fonction de repartition dans le
cadre d’un modele de regression
Le but de cette section est de definir une estimation de la distribution jointe
de (T,X) dans les Cadres 2 et 3 definis en section 1.2.3. Cet estimation repose sur
celle de la fonction de repartition conditionnelle de C sachant X, via l’estimateur de
Kaplan-Meier conditionnel defini en section 1.3.1. La section 1.3.2 presente l’estima-
tion de la loi jointe, et la section 1.3.3 presente les principaux resultats theoriques
lies a cette technique.
1.3. Estimation de la fonction de repartition dans le cadre d’un modelede regression 11
1.3.1 Estimation de la fonction de repartition conditionnelle
Beran (1981) propose l’estimateur suivant de F (t|x) dans le Cadre 2,
F (t|x) = 1−∏ti≤t
(1− dH1(ti|x)
1− H(ti − |x)
), (1.1)
ou {t1, ..., tk} designe les valeurs distinctes prises par (Y1, ..., Yn), et
H1(t|x) =
n∑i=1
δiwin(x)1Yi≤t,
H(t|x) =
n∑i=1
win(x)1Yi≤t,
avec
win(x) =K(Xi−xh
)∑n
j=1K(Xj−xh
) ,en introduisant une fonction noyau K symetrique, positive, d’integrale 1, et une
suite de fenetres h tendant vers 0.
De facon similaire, on peut estimer la loi conditionnelle de la censure G(t|x) =
P(C ≤ t|x) par un estimateur similaire G(t|x) en remplacant dans (1.1) la fonction
H1 par H0(t|x) =∑n
i=1(1− δi)win(x)1Yi≤t.
Des proprietes theoriques de cet estimateur ont ete demontrees par Dabrowska
(1989), Dabrowska (1992), Van Keilegom et Akritas (1999), Du et Akritas (2002).
1.3.2 Estimation de la loi jointe de (T,X)
L’estimateur propose dans le Cadre 3 est decrit plus avant dans Lopez (2011).
Le principe de sa definition repose sur la traduction suivante des hypotheses d’iden-
tifiabilite. Pour toute fonction φ telle que E[|φ(X,T )|] <∞,
E
[δφ(X,Y )
1−G(Y − |g(X))
]= E[φ(X,T )],
ou G(t|g(x)) = P(C ≤ t|g(X) = g(x)). La fonction G(·|g(x)) n’etant pas disponible,
elle peut etre estimee via l’estimateur de Beran defini section 1.3.1, permettant ainsi
de definir l’estimateur de F (t, x),
F (t, x) =1
n
n∑i=1
δi1Yi≤y,Xi≤x
1− G(Yi − |g(Xi)). (1.2)
Comme annonce, l’interet de travailler dans le Cadre 3 plutot que le Cadre 2 permet
de se restreindre a des estimateurs a noyau en dimension 1, evitant ainsi leur mauvais
comportement quand la dimension de X est importante.
12Chapitre 1. Estimation nonparametrique pour la regression censuree
1.3.3 Resultats theoriques obtenus
Le resultat cle de Lopez (2011) permet d’obtenir une representation asympto-
tique des integrales par rapport a la mesure definie par l’estimateur F defini en
(1.2). Cette representation decompose ces integrales, du point de vue asympto-
tique, en deux termes principaux (l’un fournissant la limite, l’autre n’intervenant
que dans la variance asymptotique), plus un terme negligeable. Ce terme residuel
converge vers 0 uniformement sur une classe de fonctions dont la complexite est
controlee. Cette notion d’uniformite est cruciale, comme on le verra dans la section
1.4, si l’on souhaite appliquer ce type de resultat a l’etude de modeles de regression
parametriques.
Theoreme 1 Soit H(t|z) = P(Y ≤ t|g(X) = z), et τz = inf{t : H(t|z) = 1}.Soit τ0 = inf{τz : z ∈ Z}, ou Z designe le support de la variable g(X). On
suppose τ0 > −∞. Soit F une classe de fonctions satisfaisant des hypotheses
de complexite (voir Lopez (2011)), et telle qu’il existe τ < τ0 tel que, pour tout
φ ∈ F , φ(t, x) = 0, pour t > τ. En notant dP(t, x|z) la loi de (T,X) sachant
g(X) = z, pour i = 1, ..., n,
φz(t) =
∫ ∞t
∫xφ(s, x)dP(s, x|z),
MGi (s) = (1− δi)1Yi≤s −
∫ s
−∞
1Yi≥sdG(s|g(Xi))
1−G(s|g(Xi)),
∫φ(t, x)F (t, x) =
1
n
n∑i=1
δiφ(Yi, Xi)
1−G(Yi − |g(Xi))+
1
n
n∑i=1
∫φg(Xi)(s)dM
Gi (s)
1−H(s|g(Xi))
+Rn(φ),
avec supφ∈F |Rn(φ)| = OP (h2 + [log n]n−1h−1).
La preuve de ce theoreme repose sur une amelioration de la representation
asymptotique que Du et Akritas (2002) fournissent pour G(t|x). Cette amelioration,
basee sur des resultats de convergence des U−processus de Major (2006), permet
d’atteindre un ordre de convergence du reste optimal, i.e. un terme en h2 venant
du biais de l’estimateur, et un terme correspondant au carre de la variance d’un
estimateur a noyau, a un facteur logarithmique pres. A partir de la representation
du Theoreme 1, on observe qu’on peut en deduire un resultat type theoreme central
limite, puisque le terme principal du membre de droite est une somme de termes
i.i.d.
Sans entrer dans le detail des hypotheses techniques introduites pour obtenir le
Theoreme 1 (qui sont presentees en detail dans Lopez (2011)), precisons les grandes
lignes de ces hypotheses.
1.4. Premieres applications et extensions 13
– L’hypothese sur τ0 : cette hypothese est egalement presente chez Du et Akri-
tas (2002). Elle est necessaire pour se premunir contre des denominateurs
proches de 0 qui posent des problemes du point de vue theorique. Cette diffi-
culte pour gerer des denominateurs proches de 0 se trouve egalement dans la
litterature de l’estimateur de Kaplan-Meier, voir par exemple Gill (1983), Gi-
jbels et Veraverbeke (1991), Sanchez Sellero et collab. (2005). Pour resoudre
ce probleme, les approches telles que celles de Stute (1995) et Akritas (2000),
utilisent des troncations analogues, avant d’utiliser des resultats sur la ten-
sion des processus pour faire tendre cette borne de troncation vers l’infini.
La generalisation de ces approches aux Cadres 2 et 3 n’est pas evidente, et
n’a jusqu’a present pas ete abordee (voir des hypotheses similaires dans Heu-
chenne et Van Keilegom (2010b), Heuchenne et Van Keilegom (2010a), Du
et Akritas (2002), Van Keilegom et collab. (2011)).
– Hypotheses sur les distributions de Y et X : on doit supposer une
regularite par rapport a g(X) des fonctions de repartitions F (t|g(x)) et
H(t|g(x)). La loi de g(X) doit egalement etre absolument continue par rapport
a la mesure de Lebesgue si l’on veut utiliser des estimateurs a noyau.
– Hypotheses sur F : essentiellement, on a besoin que F soit une VC-classe
de fonctions (voir e.g. van der Vaart et Wellner (1996)). Il faut egalement
que cette classe de fonctions soit reguliere par rapport a la variable x (2 fois
continument derivable).
1.4 Premieres applications et extensions
1.4.1 Estimation dans un modele de regression parametrique
Pour τ < τ0, considerons le modele E[T |X,T ≤ τ ] = f(θ0, X), ou θ0 ∈ Θ ⊂ Rkest un parametre inconnu, et f une fonction connue. La presence de la troncation
τ est un ecueil theorique du, pour le moment, a l’absence de resultat valide sur
l’ensemble de la distribution. Puisque θ0 = arg minθ∈Θ
∫(t− f(θ, x))21t≤τdF (t, x),
on peut definir un estimateur des moindres carres generalises du type
θ = arg minθ∈Θ
∫(t− f(θ, x))21t≤τdF (t, x).
Sa convergence vers θ0 peut se deduire du Theoreme 1 en considerant la classe de
fonctions F = {(t, x) → (t − f(θ, x))21t≤τ ; θ ∈ Θ}. Sa normalite asymptotique se
deduit egalement de l’application de ce resultat aux derivees par rapport a θ des
fonctions de F , voir Lopez (2011).
1.4.2 Extension au cas ou la fonction g est inconnue
Si la fonction g n’est pas connue, une modelisation de la loi conditionnelle de
la censure peut permettre d’utiliser l’estimateur propose dans ce chapitre. Cette
situation a ete consideree dans Lopez et collab. (2013). Si on suppose que C|X
14Chapitre 1. Estimation nonparametrique pour la regression censuree
suit un modele de regression semi-parametrique de Cox (voir Cox (1972), Andersen
et Gill (1982)), la loi de C sachant X ne depend de X qu’a travers une variable
uni-dimensionnelle θ′0X, ou θ0 est le parametre du modele de Cox. Cette situation
correspond au Cadre 3 avec g(X) = θ′0X.
Si l’on dispose d’un estimateur θ de θ0 qui converge a la vitesse n−1/2 (ce qui
est le cas dans le modele de Cox), les resultats du Theoreme 1 restent conserves en
remplacant g(X) dans l’estimateur par g(X) = θ′X. On note alors la presence d’un
terme supplementaire dans la representation asymptotique (lie a l’estimation de θ0,
voir Lopez et collab. (2013)).
1.5 Conclusion
L’estimateur propose dans ce chapitre presente l’avantage d’etre adapte a des
modeles de regression ou la censure est autorisee a dependre des variables expli-
catives. Il conserve une certaine simplicite de calcul. Neanmoins, il repose sur une
hypothese modelisant la loi de C sachant X, afin de se ramener a une loi condi-
tionnelle qui ne depend que d’un facteur de dimension 1. Cette approche peut se
reveler delicate. En effet, la censure est une variable souvent plus mysterieuse que la
variable d’interet, et il devient plus difficile de justifier des choix de modelisation la
concernant. Cependant, l’avantage principal est de beneficier d’un estimateur non-
parametrique de la distribution de (T,X) qui autorise la censure a dependre de X
sans pour autant se restreindre a des X uni-dimensionnels, contrairement a ce que
proposent les autres estimateurs existant dans ce cadre.
Chapitre 2
Modeles single-index
Sommaire
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2 Deux modeles single-index . . . . . . . . . . . . . . . . . . . . 16
2.2.1 Modele 1 : estimation de la densite conditionnelle . . . . . . . 16
2.2.2 Modele 2 : estimation d’une esperance conditionnelle. . . . . 18
2.3 Resultats theoriques . . . . . . . . . . . . . . . . . . . . . . . . 19
2.3.1 Formulation des resultats pour le Modele 1. . . . . . . . . . . 19
2.3.2 Formulation des resultats pour le Modele 2. . . . . . . . . . . 20
2.3.3 Arguments principaux des preuves . . . . . . . . . . . . . . . 21
2.4 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.1 Introduction
Dans un probleme de regression, deux approches extremes existent :
modelisation parametrique de la fonction de regression (sans necessairement
modeliser la distribution des residus), et modelisation non parametrique. La
premiere presente l’avantage de la simplicite et de la facilite d’interpretation. Elle
repose en revanche sur des hypotheses contraignantes, puisque rien n’indique a
priori que la fonction de regression admette une forme aussi particuliere que celle
postulee par le modele. A l’inverse, la modelisation non parametrique fait peu d’hy-
potheses contraignantes, mais l’interpretation du modele est moins aisee, et les
vitesses de convergence des estimateurs correspondants sont moins rapides que la
vitesse usuelle n−1/2 du modele parametrique. De plus, ces vitesses de convergence
sont dependantes de la dimension d du vecteur de variables explicatives X.
Les approches de type single-index (voir notamment Ichimura (1993), Hardle
et collab. (1993), Xia et Li (1999), Xia et collab. (1999)) apparaissent comme
un compromis semi-parametrique entre ces deux philosophies diametralement op-
posees. Elles consistent a supposer que la fonction de regression (qu’il s’agisse d’une
esperance conditionnelle ou d’une autre quantite liee a la distribution conditionnelle)
ne depend que d’une combinaison lineaire inconnue des variables explicatives. Si
cette combinaison lineaire etait connue, l’estimation serait ramenee a un probleme
non parametrique en dimension 1, ce qui le rendrait moins sensible a la deterioration
de la vitesse des estimateurs non parametriques.
16 Chapitre 2. Modeles single-index
Ici, nous considerons deux modeles single-index adaptes a la presence d’obser-
vations censurees. Le premier porte sur l’estimation d’une densite conditionnelle
dans le Cadre 1 (censure independante, voir chapitre precedent), correspondant a
l’independance entre C et (T,X). Ce travail vient completer l’approche de Lopez
(2009), sous des hypotheses sensiblement plus restrictives, mais qui ameliorent la
performance d’estimation. Le second modele porte sur l’esperance conditionnelle,
dans le Cadre 3 ou la censure est autorisee a dependre des variables explicatives.
L’organisation du present chapitre est la suivante. Dans la section 2.2, on
presente les deux modeles single-index. Les resultats theoriques sont regroupes dans
la section 2.3, et les arguments permettant de justifier de la convergence des deux
estimateurs sont mis en parallele. La section 2.4 discute des extensions et perspec-
tives.
2.2 Deux modeles single-index
Dans cette section, on presente deux estimateurs dans des modeles single-index
censures. Le premier, defini en section 2.2.1 est adapte aux situations ou la censure
empeche la bonne estimation de la queue de distribution de la variable d’interet.
Le second modele, dans la section 2.2.2, fournit un estimateur dans un cadre ou la
censure peut dependre des variables explicatives.
2.2.1 Modele 1 : estimation de la densite conditionnelle
Dans toute cette section 2.2.1, on suppose que la loi de T sachant X = x
admet une densite f(t|x) par rapport a la mesure de Lebesgue. L’estimation de
cette densite conditionnelle est frappee par les problemes usuels de dimension de
X, ainsi qu’on l’a expose dans l’introduction de ce chapitre. L’hypothese single-index
consiste a supposer que la loi de T sachant X ne depend que d’une combinaison
lineaire inconnue des variables explicatives θ′0X. Le vecteur θ0 est defini a une
constante multiplicative pres, et on supposera donc que sa premiere composante est
egale a 1 de facon a le definir de maniere unique. Une autre hypothese classique
consiste a supposer que ce vecteur est de norme 1 pour une certaine norme de Rd, ce
qui n’entraıne pas de changement des resultats mais rend plus delicat la definition
d’objets tels que la differentielle, l’ensemble des parametres Θ etant alors d’interieur
vide dans Rd.
Modele 1 : On suppose que C est independant de (T,X). Soit fθ(t|u) la densite
conditionnelle de T sachant θ′X = u. On suppose qu’il existe un θ0 ∈ Θ ⊂ Rdtel que θ0 ait sa premiere composante egale a 1, et
f(t|x) = fθ0(t|θ′0X = θ′0x).
2.2. Deux modeles single-index 17
Ce modele a ete initialement introduit par Delecroix et collab. (2003) en l’ab-
sence de censure. L’une des motivations des auteurs etait de parvenir a obtenir des
estimateurs de θ0 asymptotiquement efficaces. L’idee etant d’estimer θ0 par
θ = arg maxθ∈Θ
n−1n∑i=1
log(fθ(Ti|θ′Xi)
), (2.1)
ou fθ(t|u) est la densite de T sachant θ′X = u evaluee au point t, et fθ un estimateur
non parametrique de cette densite. Le contraste defini dans (2.1) peut etre vu comme
une estimation non parametrique de la log-vraisemblance, et de ce fait, permet
d’obtenir l’efficacite asymptotique.
En presence de censure, et en se placant dans le Cadre 1 (voir section 1.2.3), le
contraste (2.1) n’est plus calculable puisque les Ti ne sont pas directement observes,
mais il peut etre generalise en remplacant la somme empirique (qui est en fait une
integrale par rapport a la distribution empirique de (T,X)) par une integrale par
rapport a l’estimateur de Stute (1993) FS defini au chapitre precedent. Avec les
notations du Chapitre 1, l’estimateur devient
θ = arg maxθ∈Θ
M τn(θ, h) = arg max
θ∈Θ
n∑i=1
Win log(fθ,h(Yi|θ′Xi)
), (2.2)
ou la famille d’estimateurs non parametriques {fθ,h : θ ∈ Θ} doit egalement etre
redefinie. On peut notamment utiliser des versions des estimateurs a noyau adaptes
a la censure, en definissant
fθ,h(y|u) =
∑ni=1WinK
(Yi−yh
)K(θ′Xi−u
h
)∑n
j=1WjnK(θ′Xj−u
h
) ,
ou K est une fonction symetrique positive d’integrale 1 et h une suite tendant vers
0. Il n’est bien entendu pas necessaire d’utiliser la meme fenetre h pour traiter Y
et θ′X, cette convention n’etant utilisee que pour simplifier les notations.
Contrairement a ce qui se passe en l’absence de censure, cet estimateur ne peut
pretendre etre asymptotiquement efficace, puisque la log-vraisemblance possede une
forme differente dans ce cadre. En effet les observations non censurees contribuent
a cette log-vraisemblance via le logarithme de la densite de T sachant X, mais les
observations censurees apportent une contribution egale au logarithme de la fonction
de repartition conditionnelle de T sachant X, voir Schnedler (2005). Dans Bouaziz
et Lopez (2010), une approche basee sur la forme specifique de la log-vraisemblance
en presence de censure ne nous est pas apparue souhaitable. En effet, le contraste qui
en resulterait serait trop complexe a maximiser d’un strict point de vue numerique
(notamment parce qu’il necessiterait d’integrer les estimateurs non parametriques
fθ,h(Yi|θ′Xi) par rapport a la mesure de Lebesgue.
L’interet de l’estimateur que nous considerons ici, si on le compare a celui de Lo-
pez (2009), tient dans la remarque suivante. Soit τ un reel quelconque. L’hypothese
single-index suppose que
L(T |X) = L(T |θ′0X),
18 Chapitre 2. Modeles single-index
ou L designe la loi d’une variable aleatoire. Sous cette hypothese,
L(T |X,T ≤ τ) = L(T |θ′0X,T ≤ τ),
avec la meme valeur du parametre θ0.
Cette propriete est particulierement attractive, puisqu’elle permet de se
premunir contre l’eventuel mauvais comportement des estimateurs non pa-
rametriques tels que FS dans la partie droite de la distribution de T. Ainsi, l’estima-
teur propose par Lopez (2009) dans un modele plus general portant sur l’esperance
conditionnelle, necessite une hypothese restrictive (bien que raisonnable pour cer-
tains cas ou la censure n’est pas trop intense) sur les queues de distribution de T
et C. Dans le cas present, cette hypothese n’est plus necessaire, puisqu’on pourra
eliminer les observations trop importantes sans pour autant introduire de biais dans
l’estimation de θ0.
On dispose donc d’une collection d’estimateurs
θ(τ, h) = arg maxθ∈Θ
n∑i=1
Win log(fθ,h(Yi|θ′Xi)
)1Yi≤τ .
Nous proposons une methode qui permet de choisir a partir des donnees quelle
valeur de τ et quelle valeur de h est la plus adaptee. Cette technique est deduite
des resultats theoriques presentes dans la section 2.2, ou on revient egalement sur
le gain de la methode, observe empiriquement via des simulations.
2.2.2 Modele 2 : estimation d’une esperance conditionnelle.
Le second modele porte sur une estimation de l’esperance conditionnelle, dans
un cadre ou la censure est autorisee a dependre des variables explicatives (voir
Cadre 3 du chapitre precedent).
Modele 2 : On suppose qu’il existe β0 tel que l’hypothese du Cadre 3 du cha-
pitre precedent soit verifiee pour g(X) = β′0X. On suppose de plus que l’on
dispose d’un estimateur preliminaire β de β0 qui converge a la vitesse n−1/2.
Soit mθ0(u) = E [T |θ′0X = u, T ≤ τ ] . On suppose qu’il existe un θ0 ∈ Θ ⊂ Rdtel que θ0 ait sa premiere composante egale a 1, et
E [T |X,T ≤ τ ] = mθ0(θ′0X).
Ici, contrairement a l’approche precedente, τ est une borne fixee telle que, si
l’on considere H(t|x) = P(Y ≤ t|X = x), pour tout x, τ < inf {t : H(t|x) = 1} .La presence de cette troncation est rendue necessaire par la difficulte d’evaluer le
comportement de l’estimateur Kaplan-Meier conditionnel dans la queue de distri-
bution de T. Contrairement aux resultats existants dans le cas de l’estimateur de
Kaplan-Meier (et donc de l’estimateur FS), memes sous des hypotheses concernant
2.3. Resultats theoriques 19
les queues de distribution de C et T, aucune convergence dans tout l’espace n’a
ete montree jusqu’a present. Il s’agit du meme probleme que celui constate dans la
section 1.4.1 du chapitre precedent.
Du point de vue des hypotheses d’identifiabilite, la situation est similaire a
celle de la section 1.4.2. L’exemple pratique etudie dans Lopez et collab. (2013)
correspond a la situation ou C suit un modele de regression Cox conditionnellement
a X.
Dans ce cas, l’estimateur de θ0 que nous proposons est
θ = arg minθ∈Θ
∫(t− mθ(θ
′x))21t≤τdFg(t, x),
ou {mθ : θ ∈ Θ} est une famille d’estimateurs non parametriques des fonctions mθ,
g(x) = β′x, et ou l’on rappelle que Fg correspond a l’estimateur defini au cha-
pitre precedent. Il s’agit d’une extension de la technique etudiee par Ichimura
(1993), Hardle et collab. (1993), Delecroix et collab. (2006). Du point de vue des
resultats asymptotiques, la forme des estimateurs non parametriques importe peu.
Nos resultats sont valides a partir du moment ou ces estimateurs satisfont un en-
semble de conditions standards. En particulier, nous verifions ces hypotheses pour
des estimateurs particuliers, qui sont des versions d’estimateurs a noyau adaptes a
la censure, i.e.
mθ(u) =
∑ni=1W
′inYi1Yi≤τK
(θ′Xi−u
h
)∑n
j=1W′jn1Yj≤τK
(θ′Xj−u
h
) ,ou W ′jn correspond a la masse que l’estimateur Fg place a l’observation j.
2.3 Resultats theoriques
Les proprietes theoriques des deux estimateurs proposees sont resumees dans
les sections 2.3.1 et 2.3.2. Les arguments utilises pour prouver ces resultats sont
resumes en section 2.3.3.
2.3.1 Formulation des resultats pour le Modele 1.
Le principe de la preuve des resultats presentes dans Bouaziz et Lopez (2010)
consiste a obtenir des representations du type
θ(τ, h)− θ0 =1
n
n∑i=1
ψτ,h(Yi, δi, Xi) +Rn(τ, h),
avec supτ,h∈Hn|Rn(τ, h)| = oP (n−1/2), ou Hn est un ensemble fini inclus dans
[an−α, bn−α] pour 1/8 < α < 1/6, et E[ψτ,h(Y, δ,X)] = 0 pour tout (τ, h).
Cette representation uniforme permet de valider la convergence d’un estima-
teur θ = θ(τ , h), ou τ et h sont choisis a partir des donnees. A τ fixe, on choi-
sit hτ tel que hτ maximise arg maxθMτn(θ, h). Pour choisir τ, on utilise comme
20 Chapitre 2. Modeles single-index
critere de comparaison des estimateurs le cout quadratique. En definissant E2(τ) :=
E[‖θ(τ, hτ ) − θ0‖22], on deduit des resultats asymptotiques presentes au Theoreme
suivant une estimation E2(τ) du critere E2(τ) et on choisit τ qui minimise ce critere
estime.
Theoreme 2 Sous des hypotheses de regularite des fonctions fθ (detaillees
dans Bouaziz et Lopez (2010)), et en supposant que knn−4α → 0 ou kn designe
le cardinal de Hn, on obtient pour tout (τ, h),
n1/2[θ(τ, hτ )− θ0] =⇒ N (0,Στ ),
cette matrice de variance-covariance pouvant s’estimer de facon consistante.
Par ailleurs, soit τ0 = arg minτ E2(τ), et θ = θ(τ , hτ ),
n1/2[θ − θ0] =⇒ N (0,Στ0).
Les simulations conduites dans Bouaziz et Lopez (2010) montrent l’interet de
ce choix de τ a partir des donnees. En effet, elles mettent en evidence que le choix
de τ optimal ne consiste pas a prendre toutes les observations. En effet, certaines
observations correspondant a un Y de grande taille induisent un poids excessif dans
l’estimateur de Kaplan-Meier, et polluent donc l’estimation.
2.3.2 Formulation des resultats pour le Modele 2.
On retrouve des resultats similaires a ceux de Lopez (2009), mais avec une
variance asymptotique differente, due a la presence d’un mecanisme de censure
different.
Theoreme 3 Sous des hypotheses de regularite de la fonction de regression et
de ses derivees (jusqu’a l’ordre 2), et sous des conditions de convergence des
estimateurs non parametriques consideres, on obtient
θ − θ0 =1
n
n∑i=1
Λ(Yi, δi, Xi) + oP (n−1/2),
ou Λ est une fonction telle que E[Λ(Y, δ,X)] = 0.
Les hypotheses sont detaillees dans Lopez et collab. (2013). Concernant les pro-
prietes que doivent satisfaire les estimateurs non parametriques correspondants, il
s’agit essentiellement de :
– Regularite des estimateurs (deux fois derivables par rapport a θ),
– Convergence uniforme des derivees par rapport a θ jusqu’a l’ordre 2,
– Vitesses de convergences suffisamment rapides pour mθ0 et ∇θmθ0 .
Ces conditions sont verifiees dans le cas des estimateurs a noyau consideres, en
rajoutant des conditions sur la fenetre h.
2.3. Resultats theoriques 21
2.3.3 Arguments principaux des preuves
Dans les deux cas, les estimateurs sont obtenus par minimisation d’un contraste
Mn(θ, rθ), ou rθ designe soit les estimateurs de la densite conditionnelle dans le
modele 1, soit les estimateurs des esperances conditionnelles dans le modele 2.
Les preuves consistent a verifier cette propriete connue des modeles single-index
en l’absence de censure, qui veut que maximiser Mn(θ, rθ) soit asymptotiquement
equivalent a maximiser Mn(θ, rθ), c’est a dire le contraste qui serait calcule si la
famille parametrique sous-jacente etait connue exactement. Pour cela, nous nous
basons sur des resultats classiques en M-estimation (voir Sherman (1993), Sherman
(1994)), qui reviennent, dans notre cas, a effectuer un developpement de Taylor de
Mn autour du point θ0.
Contrairement a la plupart des approches developpees en l’absence de censure,
qui reposent le plus souvent sur l’utilisation de proprietes specifiques aux types
d’estimateurs non parametriques utilises (noyaux, estimateurs par projection...),
nous developpons des techniques issues de la theorie des processus empiriques. De
cette facon, les conditions necessaires pour obtenir la convergence reposent sur
l’appartenance de la fonction de regression (ainsi que de ses estimateurs) a une
classe de fonctions suffisamment simple du point de vue de son entropie.
Ainsi, dans les deux cas, on se ramene a l’hypothese cruciale suivante :
On suppose que
– les fonctions rθ0 et rθ0 appartiennent a une classe de fonctions D1 qui est une
classe de Donsker (voir par exemple van der Vaart et Wellner (1996) pour
une definition des classes de Donsker),
– les fonctions ∇θrθ0 et ∇θrθ0 appartiennent a une classe de fonctions D2+xD3
ou D2 et D3 sont deux classes de Donsker.
Ces hypotheses ne sont pas contraignantes. Pour la premiere, rθ0 etant une
fonction d’une variable (Modele 2) ou de deux variables (Modele 1), il suffit de
supposer que rθ0 et son estimateur sont C1 avec derivee bornee satisfaisant une
condition de Holder, ce qui les place dans une classe de Donsker, voir van der Vaart
et Wellner (1996). Pour la seconde, il s’agit d’une consequence de la structure du
modele single-index, qui permet d’ecrire ∇θrθ0 sous la forme ∇θrθ0 = r1 +xr2 ou r1
et r2 sont des fonctions de θ′0x (et y dans le Modele 1). Des hypotheses de regularite
de r1 et r2 permettent a nouveau de trouver les classes de Donsker adaptees.
L’appartenance des estimateurs non parametriques (ainsi que de leurs gradients)
a de telles classes de fonctions se deduit d’une part de leur forme, d’autre part de
leurs proprietes de convergence uniformes a des vitesses suffisamment rapides. Pour
l’obtention de telles vitesses de convergence uniforme, nous nous basons sur les tra-
vaux de Einmahl et Mason (2005), ou de leur adaptation directe puisque l’indexa-
tion des processus que nous considerons par θ n’est pas presente dans les travaux
de Einmahl et Mason (2005). De plus amples precisions peuvent etre trouvees dans
la version arXiv de l’article Lopez et collab. (2013).
22 Chapitre 2. Modeles single-index
2.4 Perspectives
La demarche decrite dans ce chapitre pour l’etude de modeles single-index en
presence de censure presente l’avantage de pouvoir s’adapter a d’autres types de
modeles single-index. En effet, les techniques de processus empiriques employees
pour prouver la convergence reposent essentiellement sur :
– les resultats de convergence dans le modele parametrique associe (i.e. le
modele qu’on pourrait etudier si la famille de fonctions de regression etait
connue),
– la regularite de la fonction de regression (quelle que soit sa nature),
– des proprietes generales des modeles single-index, notamment le fait que le
gradient de la fonction de regression rθ0 puisse s’exprimer sous la forme d’une
decomposition rθ0 = r1 + xr2 ou r1 et r2 sont des fonctions regulieres d’un
faible nombre de variables.
Dans un travail en cours en collaboration avec Cedric Heuchenne (Universite
Catholique de Louvain), on utilise ainsi une approche similaire pour etudier un
modele de regression Pareto reposant sur une hypothese single-index (en l’absence
de censure). Il peut etre vu comme une version semi-parametrique du modeles
etudie par Beirlant et Goegebeur (2003). Si l’on note GPD(γ, σ) la distribution
Pareto generalisee de fonction de repartition
G(x; γ, σ) = 1− 1(1 + γ xσ
)1/γ ,Smith (1987) a montre que, pour une variable T dont l’indice de valeurs extremes
est γ > 0, la queue de distribution de T peut etre approchee par une loi GPD(γ, σ)
pour un certain σ > 0. En notant γ(x) l’indice de valeurs extremes de la loi de T
sachant X = x,le modele de regression que nous considerons dans ce travail est,
γ(X) = γθ0(θT0 X),
ou θ0 ∈ Rd inconnu, ainsi que la famille de fonctions de lien {γθ : θ ∈ Θ}. Au-
cune modelisation de σ(X) (parametre d’echelle correspondant a la loi GPD qui
approche la queue de distribution de T sachant X) n’est effectuee, puisque ce pa-
rametre est considere comme un parametre de nuisance, de moindre importance
que γ. Neanmoins, ce second parametre pourrait etre modelise egalement en intro-
duisant un autre index θ1, entraınant vers un modele ou deux directions doivent
etre estimees au prix de developpements similaires mais plus fastidieux (y compris
du point de vue algorithmique).
Soit l(γ, σ; y) le logarithme de la densite d’une loi GPD(γ, σ) evaluee en y.
L’estimation du parametre θ est obtenue par maximisation du contraste
Mn(θ) =1
n
n∑i=1
l(γθ0(θ′0Xi), σ(Xi);Ti)1Ti≥τ(Xi),
ou, dans l’esprit de la technique ”Peaks Over Threshold”, on ne conserve que les
observations superieures a un seuil τ dependant de Xi, et ou γθ0 et σ sont des estima-
teurs non-parametriques des fonctions γθ0 et σ. Les estimateurs non parametriques
2.4. Perspectives 23
que nous considerons sont les estimateurs localement lineaires proposes par Beir-
lant et Goegebeur (2004), dont nous prouvons la convergence uniforme, basee sur
les resultats de Einmahl et Mason (2005).
Les difficultes particulieres de l’etude de ce modele sont notamment :
– le caractere mal specifie des distributions conditionnelles (celles-ci ne sont pas
exactement de type Pareto generalise),
– la presence du parametre de nuisance σ,
– les estimateurs non parametriques utilises qui sont definis de facon implicite
(contrairement a l’estimateur de Nadaraya-Watson pour l’esperance condi-
tionnelle).
Chapitre 3
Evenements recurrents
Sommaire
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.2 Modele single-index pour l’analyse d’evenements recurrents 26
3.2.1 Description du modele . . . . . . . . . . . . . . . . . . . . . . 26
3.2.2 Resultats obtenus . . . . . . . . . . . . . . . . . . . . . . . . 28
3.3 Combinaison d’un modele de detection de rupture et d’un
modele de Cox . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.3.1 Description du modele . . . . . . . . . . . . . . . . . . . . . . 29
3.3.2 Estimation et choix du parametre l . . . . . . . . . . . . . . . 31
3.3.3 Synthese des principaux resultats obtenus . . . . . . . . . . . 31
3.4 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.4.1 Formulation du probleme . . . . . . . . . . . . . . . . . . . . 32
3.4.2 Combinaison des differents modeles de ce chapitre . . . . . . 33
3.1 Introduction
Il existe un lien naturel entre un modele de duree et un processus de comptage.
En effet, l’observation d’une duree T est equivalente a l’observation d’un proces-
sus N(t) qui vaut 0 a la date de debut d’observation et 1 a la date T . Dans ce
chapitre, nous nous interessons a deux problemes qui concernent la modelisation
d’evenements recurrents, c’est a dire un probleme ou on s’interesse a compter des
evenements qui interviennent de maniere repetee au cours du temps (deces, sinistres,
crises d’asthme, reservations...).
La premiere situation consideree fait le lien avec le chapitre precedent. On
cherche, dans le modele expose a la section 3.2, a mesurer l’impact de variables
explicatives X ∈ Rd sur un processus de comptage N(t). Une facon classique de
modeliser une telle dependance consiste a se baser sur le modele de Cox, voir Pren-
tice et collab. (1981), Andersen et Gill (1982), Andersen et collab. (1993), Lin
et collab. (2000), ou le modele AFT, voir Ghosh et Lin (2003). Ce modele semi-
parametrique, dans lequel le taux de risque instantane depend d’une combinaison
lineaire inconnue des variables explicatives, est un cas particulier de modele single-
index. Pour cette raison, une modelisation plus flexible peut etre proposee, sur une
logique similaire a celle decrite dans le chapitre precedent. Ces resultats sont l’objet
d’un article soumis, voir Bouaziz et collab. (2012).
26 Chapitre 3. Evenements recurrents
Le second type de problemes abordes dans ce chapitre concerne la detection de
changement brutaux dans la structure du processus de comptage, c’est a dire dans
son taux de risque instantane. Le modele considere dans la section 3.3 est initiale-
ment motive par une problematique industrielle, introduite par un partenariat avec
la SNCF dans le cadre d’un contrat CIFRE. Le but de ce modele, qui se transpose
a de nombreuses autres situations, est d’etudier un processus N(t) qui compte le
nombre de reservations effectuees sur un ou plusieurs trajets (et sur un ou plusieurs
tarifs). Il s’agit ensuite de distinguer deux types de comportements chez les clients
de la SNCF : report des clients sur certains tarifs suite a la rupture de stock des ta-
rifs plus attractifs, et evolution naturelle de la frequence des reservations (lesquelles
peuvent avoir tendance a s’intensifier a mesure que le depart du train se rapproche).
L’approche consideree dans ce travail est basee sur une generalisation du modele
de Cox, le taux de risque de base etant modelise par une fonction constante par
morceaux. L’estimation de cette fonction constante par morceaux est effectuee via
des techniques de detection de ruptures. Ces ruptures permettent de prendre en
compte l’evolution generale de l’intensite des reservations, separee de l’influence
des covariables qui transportent l’information sur la disponibilite de certains types
de tarifs. L’une des difficultes supplementaires, dans ce contexte, vient de l’aspect
discret des donnees qui sont exploitables. Les resultats detailles de cette seconde
approche sont consultables dans Lopez et Oueslati (2013).
Dans la section 3.4.1 sont presentes diverses perspectives de ses travaux, la
premiere d’entre elles se penchant sur l’obtention de resultats theoriques valides a
distance finie dans un modele de detection de rupture (qui peut apparaıtre comme
un cadre simplifie du modele de la section 3.3).
3.2 Modele single-index pour l’analyse d’evenements
recurrents
Dans cette section, nous presentons des modeles parametriques et semi-
parametriques permettant d’estimer le nombre moyen d’evenements par unite de
temps conditionnellement a des covariables. La description de ces modeles est faite
en section 3.2.1, ou l’on insiste egalement sur la technique d’estimation. Celle-ci est
basee sur un processus ”renormalise” afin de compenser les phenomenes lies a la
censure. Les resultats theoriques sont resumes dans la section 3.2.2.
3.2.1 Description du modele
On considere un processus d’evenements recurrents N∗(t), observe pour t ∈[0, T ] ou T designe donc la variable aleatoire duree d’observation, et on suppose que
ce processus depend de variables explicatives Z ∈ Rd. Deux modeles sont consideres
pour le nombre moyen d’evenements sachant Z. Le premier modele est purement
parametrique, le second est de type single-index.
3.2. Modele single-index pour l’analyse d’evenements recurrents 27
Observations : On suppose que l’on observe n realisations i.i.d.
(Yi, δi, Zi, Ni(·))1≤i≤n de Z et
Y = inf(T,C),
δ = 1T≤C ,
N(t) = N∗(t ∧ Y ),
ou C designe une variable de censure. On note µ(t|z) = E[N∗(t)|Z = z].
Modele parametrique : On suppose qu’il existe θ0 ∈ Rk tel que
µ(t|z) = µ0(θ0, t, z),
ou µ0 est une fonction connue.
Modele semi-parametrique : Soit µθ(t|u) = E[N∗(t)|θ′Z = u]. On suppose
qu’il existe θ0 ∈ Rd tel que
µ(t|z) = µθ0(t|θ′0z).
L’interet du modele semi-parametrique single-index est similaire a celui evoque
dans les situations du chapitre precedent : assurer suffisamment de flexibilite tout
en effectuant une hypothese de reduction de dimension. Par ailleurs, il s’agit
d’une generalisation des modeles type Cox tels que consideres dans Lin et collab.
(2000). Un modele voisin base sur des modeles AFT (accelerated failure time) a ete
developpe par Ghosh et Lin (2003).
La base de la procedure d’estimation decrite dans Bouaziz et collab. (2012)
repose sur une remise a l’echelle du processus N afin de compenser la presence de
la censure. On definit pour cela
Y (t) =
∫ t
0
dN(s)
1−G(s−),
ou G(s) = P(C ≤ s). Si l’on suppose que C est independante de (T,Z), E[Y (t)|Z] =
µ(t|Z), la fonction G pouvant etre estime par un estimateur de Kaplan-Meier. On
peut noter qu’on peut generaliser l’approche presentee au cas C independant de
T sachant Z en utilisant des techniques semblables a celles des deux chapitres
precedents basees sur l’estimateur Kaplan-Meier conditionnel.
Dans le cas du modele parametrique, le parametre θ0 minimise
Mw(θ, µ0) =
∫E[µ0(θ, t, z)2]dw(t)− 2
∫E[Y (t)µ0(θ, t, Z)]dw(t),
pour toute mesure positive w, un contraste similaire pouvant etre defini de maniere
analogue. Une version empirique pouvant etre maximisee devient alors
Mnw(θ, µ0) =1
n
n∑i=1
∫µ0(θ, t, Zi)
2dw(t)− 2
n
n∑i=1
∫Yi(t)µ0(θ, t, Zi)dw(t),
28 Chapitre 3. Evenements recurrents
ou Yi designe la version estimee du processus Yi.
La mesure w peut etre choisie notamment pour repondre a l’objectif d’attenuer
le mauvais comportement de l’estimateur Kaplan-Meier (et donc de Y ) dans la
queue droite de distribution. Par ailleurs, nous nous interrogeons sur la question du
choix de cette mesure w a partir des donnees. Nous nous restreignons, en pratique,
au choix de la mesure w parmi un ensemble fini de mesures discretes note W.
3.2.2 Resultats obtenus
Par souci de simplicite, ne sont presentes ici que les resultats concer-
nant le modele parametrique. Les resultats asymptotiques pour le modele semi-
parametrique sont sensiblement les memes, puisque, comme dans les modeles
consideres au chapitre precedent, on observe une equivalence asymptotique entre
l’estimateur semi-parametrique et l’estimateur parametrique qui s’en deduit (cor-
respondant au cas ou la famille de fonctions µθ serait connue). La demonstration
de cette equivalence asymptotique utilise egalement des techniques de processus
empiriques via l’introduction de classes de Donsker appropriees.
Parmi les hypotheses utilisees pour obtenir la representation asymptotique du
Theoreme 4, certaines concernent la regularite des fonctions µ0(θ, ·, ·). Ces hy-
potheses sont detaillees dans Bouaziz et collab. (2012), et sont du meme ordre
(quoiqu’adaptees a un autre contextes) que celles presentees au chapitre precedent.
Ces hypotheses sont completees par des hypotheses sur la famille de mesure W. La
presence de cette famille etant l’une des specificites du modele etudie, l’hypothese
principale les concernant est detaillee ci-apres.
Hypotheses sur W : On suppose qu’il existe une mesure de probabilite w0(t)
telle que, en definissant W0(t) =∫∞t dw0(t), on ait, pour toute mesure w ∈ W,∫ ∞
tdw(t) ≤ c0W0(t),
pour une constante c0. On suppose de plus que W0 peut s’ecrire sous la forme
W0(t) = W1(t)W2(t),
ou W1 et W2 sont deux fonctions positives decroissantes telles que, si F designe
la fonction de repartition de T,
1.∫W1(t)2(1− F (t−))−1(1−G(t−))−2dG(t) <∞,
2.∫W2(t)E[dN∗(t)] <∞,
3. limt→∞W2(t) = 0.
Ces hypotheses expliquent le role de w dans la procedure. Comme toutes les
ponderations, elle peut bien entendu servir a donner plus de poids aux intervalles de
valeurs de t sur lesquels le praticien juge plus important de renforcer l’adequation.
3.3. Combinaison d’un modele de detection de rupture et d’un modelede Cox 29
Mais elle intervient ici surtout pour contre-balancer les difficultes associees aux
grandes valeurs de t. En effet, si l’on regarde les hypotheses 1-3, l’hypothese 1 montre
que W1 permet de compenser les problemes d’estimation liees a la censure. Plus les
fonctions F et G croissent rapidement, plus W1 doit compenser cette croissance.
L’hypothese 2 sert a compenser l’inflation de N∗ quand t tend vers l’infini. Si l’on
suppose que E[dN∗(t)] ∼ ctkdt (pour un processus de Poisson homogene on aurait
notamment k = 1), W2 doit decroıtre au moins en t−k−1−ε pour ε > 0.
Le resultat essentiel obtenu dans Bouaziz et collab. (2012) est le suivant.
Theoreme 4 On considere une famille de mesures positives W sa-
tisfaisant les hypotheses decrites precedemment. Sous des hypotheses
complementaires detaillees dans Bouaziz et collab. (2012), en definissant θ(w) =
arg minθMnw(θ), on a la representation,
θ(w)− θ0 =1
n
n∑i=1
ψw(Ni, δi, Yi, Zi) +Rn(w),
ou supw∈W |Rn(w)| = oP (n−1/2), et ψw satisfait E[ψw(N, δ, Y, Z)] = 0. Si on
note Σw la matrice de variance-covariance de ψw(N, δ, Y, Z), on en deduit
n1/2(θ(w)− θ0) =⇒ N (0,Σw) .
A partir d’une estimation des matrices Σw, on peut donc proposer un choix de la
mesure W a partir des donnees, en reprenant la logique decrite dans la section 2.3.
Si on se donne comme critere l’erreur quadratique moyenne, on peut donc estimer
celle de l’estimateur θ(w) et choisir le w correspondant a la valeur minimale de cette
erreur estimee.
3.3 Combinaison d’un modele de detection de rupture
et d’un modele de Cox
Nous presentons ici un modele propose dans le cadre d’une application a des
donnees SNCF. Il s’agit de modeliser le nombre de reservations par unite de temps,
en modelisant l’influence de la disponibilite de certains types de tarifs. Ce modele
combine des techniques de detection de rupture avec des modeles de regression
de type risque multiplicatif. Le modele est decrit dans la section 3.3.1. La tech-
nique d’estimation est decrite dans la section 3.3.2, et les principales proprietes
sont resumees dans la section 3.3.3.
3.3.1 Description du modele
On considere le modele de Cox avec rupture, defini de la facon suivante, repre-
nant la description complete fournie dans Lopez et Oueslati (2013).
30 Chapitre 3. Evenements recurrents
Modele de Cox avec rupture : On considere m processus de comptages
(Nj(t))1≤j≤m, de fonction de risque instantanee
λj(t) = Yj(t)λ0(t) exp(β′Xj(t)),
ou Yj(t) = 1 si le processus Nj est ”a risque” a l’instant t, et Xj(t) sont des
variables explicatives dependant du temps. Soit t0 < ... < ti < ... < tn des dates
discretes. On observe
– Yi,j = Yj(ti) pour 0 ≤ i ≤ n, 1 ≤ j ≤ m,– Xj(ti) pour 0 ≤ i ≤ n, 1 ≤ j ≤ m,– Nj(ti) pour 0 ≤ i ≤ n, 1 ≤ j ≤ m. On suppose de plus qu’il existe l > 0 tel
que λ0 suive le modele (Ml),
(Ml) ∃(µ0, ..., µl), et une suite strictement croissante (ks)1≤s≤l t.q.
λ0(t) =
l∑s=0
µs1tks≤t<tks+1,
avec les conventions k0 = 0 et kl+1 = n.
La motivation de ce probleme vient d’une application avec la SNCF, qui consiste
a modeliser le nombre de reservations Nj(t) entre 0 et t pour le train numero j. Les
variables Xj(t) sont des indicatrices qui definissent si des classes tarifaires sont
ouvertes ou non a la reservation. On s’attend en effet a ce que la fermeture des
classes tarifaires les plus avantageuses diminue l’intensite des reservations. En plus
des classes tarifaires, on peut egalement integrer l’ouverture ou la fermeture des
reservations sur d’autres trains ou d’autres moyens de transports tels que l’avion,
pour modeliser le report sur la concurrence.
Par rapport a un modele de Cox, le modele que nous considerons fait une hy-
pothese sur l’intensite de base λ0(t) (supposee constante par morceaux). Dans
le cadre de l’application consideree, cette hypothese permet une meilleure in-
terpretation de ce taux de risque de base. L’influence du report sur la concur-
rence ou sur des tarifs plus avantageux etant modelisee par la partie exp(β′Xj(t)),
les changements d’intensite dans le taux de risque de base peuvent s’interpreter
comme des changements structurels dans le comportement des usagers, permettant
ainsi de definir plusieurs regimes de reservation suivant que l’on est proche ou loin
du depart. On aboutit donc a une separation des effets lies au contexte particulier
(disponibilite, concurrence...), et a un regime general qui se trouve modelise par le
λ0.
Le modele considere presente deux specificites :
1. Les dates de changement de regime sont inconnues, ce qui est une amelioration
des modeles proposes par Holford (1980) ou Aalen et collab. (2008).
2. Le nombre de changements l n’est pas suppose connu.
3.3. Combinaison d’un modele de detection de rupture et d’un modelede Cox 31
3.3.2 Estimation et choix du parametre l
A l fixe, le modele (Ml) est purement parametrique, avec deux types de
parametres : les intensites µi et les parametres β par rapport auxquels la
log-vraisemblance est differentiable, et les instants de ruptures (tks)1≤s≤l. En
definissant θ = (β, k1, ..., kl, µ0, ..., µl), on obtient la log-vraisemblance du modele
(Ml),
Ll(θ) = −l∑
s=0
µs
ks+1−1∑i=ks
di
m∑j=1
YijeβXj(ti) +
l∑s=0
log(µs)∑
ks≤i≤ks+1−11≤j≤m
Zij
+ β∑
1≤i≤n1≤j≤m
Xj(ti)Zij ,
ou Zij = Nj(ti)−Nj(ti−1), et di = ti − ti−1.
Dans Lopez et Oueslati (2013), on s’interesse plus en detail a la maximisation
de ce critere. Cette maximisation repose essentiellement sur deux principes :
1. separation de l’estimation des instants de rupture de celle des autres pa-
rametres via un algorithme iteratif,
2. acceleration de la phase d’estimation des instants de rupture via des methodes
de programmation dynamique, en utilisant des techniques similaires a celles
de Bellman (1961), Jackson et collab. (2005) et Salmenkivi et Mannila (2005).
En effet, comme il l’a deja ete precise, la log-vraisemblance n’est pas
differentiable par rapport aux instants de ruptures. On doit donc, a l fixe, envisager
tous les decoupages possibles de l’intervalle de temps, et calculer autant de valeurs
du contraste qu’il y a d’intervalles de temps. Le temps de calcul augmenterait tres
fortement avec l sans l’utilisation de la programmation dynamique.
Pour choisir le nombre de ruptures, nous considerons deux types de procedures.
L’une en testant (Ml) contre (Ml+1) et en s’arretant des que l’on ne rejette pas le
modele (Ml). L’autre consiste a utiliser une adaptation de l’heuristique de pente,
voir par exemple Baudry et collab. (2012).
3.3.3 Synthese des principaux resultats obtenus
Comparaison avec le modele de Cox. Le modele que nous considerons
contient comme cas limite le modele de Cox, puisque le nombre de ruptures n’est
pas specifie. Les resultats de Lopez et Oueslati (2013) montrent que les performances
de la procedure que nous proposons ameliorent les resultats des estimateurs de Cox
notamment dans le cas ou de nombreux ex-aequos sont presents.
Selection du nombre de ruptures l. Sur l’etude de donnees reelles que nous
avons consideree, les techniques d’heuristique de pente selectionnaient un nombre de
ruptures plus faible que la technique de tests ascendants. Par ailleurs, l’apport de ces
ruptures supplementaires ne semblait pas ameliorer significativement l’adequation
du modele. Ceci suggere, dans le cas particulier considere, une preference pour
32 Chapitre 3. Evenements recurrents
la technique d’heuristique de pente qui selectionne un plus faible nombre de pa-
rametres.
Extensions. Au lieu de considerer un λ0 constant par morceaux, on peut
considerer de facon plus generale des taux de risques polynomiaux par morceaux.
Cette approche n’a pas ete consideree dans notre cas, puisqu’elle entraıne une forte
augmentation du nombre de parametres qui n’etait pas adaptee a notre volume
d’observations.
3.4 Perspectives
3.4.1 Formulation du probleme
Dans un travail en cours en collaboration avec Olivier Faugeras (Universite
Toulouse 1), on considere un modele de rupture dans un processus de Poisson.
Modele de Poisson a k ruptures : Dans le modele a k ruptures, l’intensite
λ(t) d’un processus de Poisson N(t) observe sur [0, T ] s’exprime comme,
(M′k) λ(t) =
k∑i=1
λi(θ(i)0 , t)1
t(i−1)0 <t<t
(i)0
,
ou les fonctions λi sont connuse, les parametres θ(i)0 et t
(i)0 sont inconnus.
Conditions d’identifiabilite : On impose λi(0, t) = 0, et θ(i)0 = 0 implique
θ(j)0 = 0 pour j > i, et on impose θ
(i)0 = 0 si t
(i−1)0 = T.
Les differents parametres du modele sont estimes par maximum de vraisem-
blance. Csorgo et Horvath (1997) fournissent des resultats asymptotiques pour ce
type de probleme, en supposant que l’amplitude de chacun des changements d’inten-
site et/ou la longueur de chacune des plages de temps [t(i−1)0 ; t
(i)0 ] tend vers l’infini.
Par rapport a ce type de resultats, le present travail repond aux objectifs suivants :
1. obtenir des resultats qui ne reposent pas sur une approximation gaussienne,
2. obtenir des resultats valides a distance finie, i.e. y compris si un changement
d’intensite n’a pu etre observe que durant une courte periode, ou s’il a une
faible intensite,
3. considerer le cas d’une intensite mal-specifiee, i.e. la veritable intensite λ∗(t) 6=λ(t).
Des resultats de ce type ont ete obtenus dans le cas gaussien par Lebarbier (2005).
Soit d(θ, θ0) = − logE [exp([L(θ)− L(θ0)]/2)] , ou L designe la log-
vraisemblance du modele. Notre approche consiste a montrer que le processus
Y (θ) =1
2{L(θ)− L(θ0)}+ d(θ, θ0)1L(θ)>L(θ0)
3.4. Perspectives 33
possede une norme ψ1 d’Orlicz bornee (voir notamment le chapitre 2.2 de van der
Vaart et Wellner (1996)), qui est definie comme
‖X‖ψ1 = inf
{C > 0 : E
[ψ1
(|X|C
)≤ 1
]},
ou ψ1(x) = ex − 1. Cette norme est liee a la vitesse de decroissance de la queue
de distribution de X, puisque P(|X| > x) ≤ Ce−αx, lorsque ‖X‖ψ1 ≤ (1 + α)/C
(voir Lemme 2.2.1 de van der Vaart et Wellner (1996)). Le controle de ‖ supθ Yθ‖ψ1
s’obtient en etudiant l’entropie de l’espace des parametres pour une metrique liee a
la transformee de Laplace de L(θ)− L(θ0).
On montre ainsi que
‖ supθY (θ)‖ψ1 ≤ Ck log κ(T ),
ou
κ(T ) =1
log(
1 + 1λ∗(T )
) ,pourvu que les fonctions λi soient suffisamment simples (notamment polynomiales),
et que l’ecart entre λ(t) et λ∗(t) soit controle. On remarque que log κ(T ) = O(log T )
si le modele est bien specifie. Puisque, pour θ estimateur du maximum de vrai-
semblance, L(θ) > L(θ0), on deduit de ce resultat des proprietes de θ. On
prouve notamment que E[d(θ, θ0)
]≤ C ′k log κ(T ), et on deduit egalement des
bornes exponentielles pour P(θ0 /∈ R(x)), ou R(x) designe la region de confiance
{θ : L(θ)− L(θ) < x}.Ce type de resultat incite a definir un critere penalise pour selectionner le nombre
de ruptures adapte a decrire des donnees,
k = arg maxk
Lk(θk)− C ′′ log κ(T ),
ou Lk designe la log-vraisemblance dans le modele a k ruptures et θk l’estimateur du
maximum de vraisemblance correspondant. Nous travaillons actuellement a l’uti-
lisation de ces techniques pour des donnees d’assurance non-vie ou N(t) designe
le nombre de sinistres enregistres dans un portefeuille automobile. Le probleme de
selection du nombre de ruptures permet notamment de definir, au sein d’une annee,
differentes periodes sur laquelle la sinistralite est differente, et ainsi de mieux saisir
la repartition de la charge de sinistres sur une annee.
3.4.2 Combinaison des differents modeles de ce chapitre
Les approches des sections 3.2 et les approches des sections 3.3 et 3.4.1 peuvent
etre combinees. En particulier, dans les modeles des sections 3.3 et 3.4.1, la forme
specifique postulee pour l’intensite λ(t), si elle est adaptee aux situations que nous
avons considere du point des applications, n’offre pas forcement suffisamment de
flexibilite, contrairement a l’approche semi-parametrique de la section 3.2. Par
34 Chapitre 3. Evenements recurrents
ailleurs, pour le modele de la section 3.2, l’hypothese single-index devant toujours
etre envisagee comme une approximation raisonnable de la realite. Supposer que,
pour tout t, la fonction µ(t|Z) ne depend que d’une combinaison lineaire θ′0Z ou
θ0 ne depend pas du temps, est sans doute une hypothese trop forte. Elle peut ap-
paraıtre legitime sur un court intervalle de temps, mais l’introduction de techniques
de detection de rupture permettrait sans doute de raffiner le modele, permettant
ainsi d’envisager un processus θ0(t) qui aurait un nombre inconnu de sauts.
Chapitre 4
Regression et censure
multivariee
Sommaire
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2 Estimation de la fonction de repartition . . . . . . . . . . . . 37
4.2.1 Les observations . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.2.2 Revue de la litterature . . . . . . . . . . . . . . . . . . . . . . 37
4.2.3 Approche generale pour estimer la distribution de (T,U) . . . 39
4.2.4 Un premier cadre : modelisation de la loi des censures . . . . 39
4.2.5 Un second cadre : introduction d’une variable auxiliaire . . . 41
4.3 Proprietes theoriques des estimateurs obtenus . . . . . . . . 42
4.3.1 Premier cadre . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.3.2 Deuxieme cadre . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.4 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.4.1 Regression : illustration dans le cadre 1 . . . . . . . . . . . . 44
4.4.2 Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.4.3 Tests d’adequation pour des modeles de copules . . . . . . . . 46
4.5 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.1 Introduction
Dans les deux derniers chapitres de ce memoire d’habilitation, on s’interesse a
la modelisation jointe de deux durees de vie T et U, ou plus generalement de deux
variables sujettes a la censure (et eventuellement a la troncature a gauche dans le
chapitre suivant).
Un exemple naturel d’application provient, en assurance, des contrats portant
sur plusieurs tetes. Par exemple, les contrats de retraite avec clause de reversion,
mais egalement les contrats de type rente d’education. Dans le premier cas, apres
le deces du beneficiaire du contrat, le conjoint continue de percevoir tout ou par-
tie de la pension de retraite jusqu’a son propre deces. Dans le second, le deces
du souscripteur entraıne le versement d’une rente a son ou ses enfants destinee a
prendre en charge leurs frais d’education jusqu’a la fin de leurs etudes (la duree
de ces etudes etant elle aussi une variable aleatoire). D’autres exemples classiques
36 Chapitre 4. Regression et censure multivariee
motivent l’etude de donnees multivariees sujettes a la censure, l’un d’entre eux
concernant une etude danoise sur la mortalite de jumeaux, voir notamment Frees
et Valdez (1998), Herskind et collab. (1996).
Dans chacun de ces exemples, il n’est pas satisfaisant de se contenter d’une
modelisation separee des differentes durees concernees. Nous envisageons deux types
de formalisation pour decrire la dependance entre ces deux variables aleatoires. La
premiere, dans le prolongement des chapitres precedents, concerne une approche via
la regression. Cet objectif etait annoncee au Chapitre 1 de ce memoire d’habilita-
tion : il s’agit de completer les approches developpees precedemment dans un cadre
ou les variables explicatives X du modele de regression peuvent etre elles-memes
sujettes a la censure.
Une deuxieme approche naturelle consiste a utiliser la theorie des copules
pour modeliser la dependance entre ces deux variables. Dans ce domaine, une
vaste litterature concernant l’etude des modeles de copules en analyse de survie
existe deja, voir notamment Frees et Valdez (1998), Youn et Shemyakin (1999),
Youn et Shemyakin (2001), Luciano et collab. (2008). Dans ce cadre, l’objet de
notre travail est de completer cette approche par l’introduction de procedure de
tests non parametriques d’adequation, qui permettent de valider ou non de tels
modeles. Plusieurs approches ont d’ores et deja ete proposees par Luciano et collab.
(2008), Wang (1991), Wang et Wells (1997), mais celles que nous decrivons dans
ce memoire reposent sur de nouveaux estimateurs non parametriques. Par ailleurs,
elles presentent l’avantage d’etre validees de facon theorique, et d’etre compatibles
avec des methodes de simulation, notamment bootstrap.
Dans les deux cas, l’outil essentiel reside dans l’utilisation d’un estimateur non
parametrique de la fonction de repartition de (T,U) qui soit pertinent dans le
contexte de censure multivariee. De meme que dans le Chapitre 1, ou une seule des
variables etait censuree, la question des conditions d’identifiabilite du modele va se
reveler cruciale.
Dans le present chapitre, nous considerons deux situations particulieres. Les
conditions d’identifiabilite de chacun de ces modeles reposent sur quelques res-
trictions portees sur le modele de censure. La premiere situation repose sur une
modelisation de la loi jointe des deux variables de censure (celle qui intervient sur
T , et celle qui intervient sur U). Cet outil est adapte notamment dans le cas ou les
deux variables de censure sont independantes, mais peut etre adapte a un contexte
plus general. La seconde situation suppose l’existence d’une troisieme variable auxi-
liaire, qui correspond a un schema de censure simplifie (la censure sur T se deduit
de celle sur U via une translation representee par cette variable auxiliaire). Dans
l’exemple concret considere par la suite, la variable auxiliaire represente la difference
d’age entre les deux individus consideres, donnee qui est generalement presente dans
les bases de donnees d’assurance. Un modele plus general, qui integre egalement la
presence de troncature a gauche, sera presente au chapitre suivant.
Dans la section 4.2, on s’interesse a l’estimation de la fonction de repartition
de deux variables censurees T et U, et des integrales par rapport a la mesure
qu’elle definit. Nous envisageons le probleme dans les differents cadres annonces
4.2. Estimation de la fonction de repartition 37
precedemment. La section 4.3 presente les proprietes theoriques de ces estimateurs.
La section 4.4 revient sur les applications de ces estimateurs a l’etude de modeles
de regression ainsi qu’aux tests d’adequation pour certains modeles de copules.
4.2 Estimation de la fonction de repartition
Dans la section 4.2.1, nous precisons les observations disponibles dans le cadre
de l’etude d’un modele de censure bivariee. La section 4.2.2 presente une revue
de la litterature et fait l’inventaire des principales techniques d’estimation non pa-
rametrique dans ce cadre. Une approche generale est proposee dans la section 4.2.3
pour traiter ce type de probleme, les sections 4.2.4 et 4.2.5 presentant son applica-
tion a deux situations distinctes.
4.2.1 Les observations
Les observations que nous considerons sont formees d’un vecteur
(Yi, Zi, δi, γi)1≤i≤n (et eventuellement de variables auxiliaires εi ainsi qu’il
sera precise dans la section 4.2.5) de replications i.i.d. du vecteur (Y,Z, δ, γ), ouY = inf(T,C),
Z = inf(U,D),
δ = 1T≤C ,
γ = 1U≤D,
(4.1)
ou l’on rappelle que les variables d’interet sont T et U, et ou C et D sont les variables
de censures.
4.2.2 Revue de la litterature
La plupart des approches existant jusqu’ici dans ce type de probleme se foca-
lisent sur l’estimation de F (t, u) = P(T ≤ t, U ≤ u). Si cette fonction caracterise
bien la distribution de (T,U), il nous paraıt plus approprie de nous poser la ques-
tion plus generale de l’estimation de quantites du type E[φ(T,U)] pour une large
classe de fonctions φ (la fonction de repartition n’etant alors qu’un cas particulier
de ce probleme). Notre volonte est donc plus d’etudier la mesure sous-jacente que
la fonction F en tant que telle.
Parmi les approches developpees dans la litterature, Campbell et Foldes (1982)
proposent un estimateur de F qui n’est generalement pas une veritable fonction
de repartition a cause de l’absence de monotonie. De plus, leur estimateur n’est
pas invariant par permutation des roles de T et U, son calcul reposant sur une
decomposition de la fonction de survie bivariee ou T et U ne jouent pas un role
symetrique. Hanley et Parnes (1983), quant a eux, proposent une procedure d’es-
timation de F par maximum de vraisemblance non parametrique (NPMLE dans
la suite) a partir de l’algorithme auto-consistant d’Efron et de l’algorithme EM.
Neanmoins, cet estimateur est inconsistant pour des donnees continues et n’est pas
38 Chapitre 4. Regression et censure multivariee
defini de maniere unique en general. Tsai et collab. (1986) suggerent une estimation
basee sur la fonction de repartition Kaplan-Meier conditionnelle de Beran (1981).
Malgre sa consistance, l’estimateur qui en resulte a une vitesse de convergence relati-
vement lente (moins rapide que n−1/2), et a nouveau ne dispose pas d’une definition
symetrique en (T,U).
L’une des approches les plus utilisees actuellement est l’estimateur propose par
Dabrowska (1988). La decomposition sous forme de produit-limite multivarie de la
fonction F n’introduit pas de dissymetrie. Neanmoins, l’estimateur de Dabrowska ne
definit pas une veritable fonction de repartition, puisqu’il assigne une masse negative
a certains points du plan, voir Pruitt (1991b). Ceci pose probleme notamment pour
simuler des donnees a partir de cet estimateur. On pourra egalement consulter
Prentice et Cai (1992) pour un estimateur inspire de celui de Dabrowska et base sur
de series de Peano, et Gill et collab. (1995) pour des ameliorations de ces resultats
grace a l’application de la Delta-Methode fonctionnelle.
D’autres approches consistent a utiliser des techniques de lissage non
parametrique pour estimer la courbe de survie multivariee, voir Pruitt (1991a).
Il s’agit d’utiliser un estimateur type produit-limite pour imputer des valeurs aux
observations censurees, et ensuite d’appliquer des techniques type NPMLE. L’in-
convenient majeur de cette strategie est la definition implicite de l’estimateur. Par
ailleurs, ses performances empiriques sont apparues moins satisfaisantes que prevu
(van der Laan (1996)). Une approche NPMLE est proposee egalement par van der
Laan (1996), mais elle necessite de modifier les donnees pour les transformer en
observations censurees par intervalle. L’estimateur est asymptotiquement efficace,
mais uniquement pour ces donnees modifiees. De plus, la vitesse de convergence
depend d’un parametre implique dans la modification des donnees, et pour cette
raison n’atteint pas n−1/2. Le meme probleme de convergence trop lente inter-
vient dans Akritas et Van Keilegom (2003), meme si, contrairement a la plupart
des approches presentees dans cette breve revue de la litterature, les estimateurs
definis par Akritas et Van Keilegom (2003) sont bien d’authentiques fonctions de
repartition. Les autres inconvenients de cette derniere approche tiennent dans le
fait que la generalisation de cet estimateur a plus de deux variables censurees est
delicate, et que les variables de censure sont necessairement absolument continues.
Apports des techniques proposees dans le present chapitre.
Par rapport a ces travaux, notre travail permet de :
1. fournir des estimateurs de F qui sont de veritables fonctions de repartition
(avec eventuellement une masse residuelle a l’infini, ce qui se produit
egalement pour l’estimateur de Kaplan-Meier quand la plus grande ob-
servation est censuree), et par la-meme ouvrir le champ a des techniques
de type bootstrap basees sur ces estimateurs,
2. estimer, a partir de cet estimateur de F, des quantites du type E[φ(T,U)],
3. conserver une vitesse de convergence identique a celle de Kaplan-Meier et
de la fonction de repartition empirique en n−1/2.
4.2. Estimation de la fonction de repartition 39
4.2.3 Approche generale pour estimer la distribution de (T, U)
En absence de censure, on peut estimer la distribution des donnees en
considerant la distribution empirique qui assigne la masse n−1 indifferemment a
chacune des observations. Comme nous l’avons deja remarque au Chapitre 1, l’ap-
proche de Kaplan-Meier consiste a n’introduire une masse qu’aux observations non
censurees (plus une masse residuelle a l’infini eventuellement), de facon a allouer
plus de poids aux grandes observations et compenser ainsi l’effet de la censure. Base
sur la meme idee, nous recherchons un estimateur de F du type
F (t, u) =n∑i=1
δiγiWi(Y1, Z1, δ1, γ1, ..., Yn, Zn, δn, γn)1Yi≤t,Zi≤u. (4.2)
Dans la section 4.2.5, ces fonctions Wi sont egalement autorisees a dependre des
variables auxiliaires. Dans tous les cas, on souhaite n’assigner du poids qu’aux ob-
servations ou les deux composantes sont effectivement observees, puisqu’elles seules
sont pleinement informatives sur la loi jointe de (T,U), le poids Wi devant etre
choisi pour compenser le phenomene de censure bivariee. Ce choix de Wi depend
des conditions d’identification du modele.
Plus precisement, nous considerons des fonctions Wi de la forme
Wi(Y1, Z1, δ1, γ1, ..., Yn, Zn, δn, γn) =1
nδiγif(Yi, Zi),
ou f est un estimateur consistant d’une fonction f qui satisfait la relation
E [δγf(Y, Z)φ(Y, Z)] = E[φ(T,U)], (4.3)
pour toute fonction φ ∈ L1. Un calcul standard montre que le choix f(t, u) =
E[δγ|T = t, U = u]−1 est adapte. Le calcul de cette quantite f se fait a partir des
hypotheses d’identifiabilite postulees.
Pour etudier les estimateurs de type (4.2), nous employons un schema sensible-
ment similaire dans la section 4.2.4 comme dans la section 4.2.5. Dans un premier
temps, nous utilisons une approche generale (voir Theoreme 3.1 dans Lopez et
Saint Pierre (2011)) mais qui n’est valide que sur un compact. Puis, suivant le
cadre dans lequel nous nous trouvons, la convergence sur l’ensemble du plan est
obtenue en utilisant des arguments de tension. Ceux-ci amenent a introduire des
hypotheses sur les queues de distribution. Il est important de noter que, dans les
approches existant jusqu’a present, la convergence sur le plan tout entier n’avait
ete prouvee pour aucun estimateur de F, meme sous des conditions de moments
forcement plus restrictives.
4.2.4 Un premier cadre : modelisation de la loi des censures
Le cadre considere ici est celui de Lopez et Saint Pierre (2011).
40 Chapitre 4. Regression et censure multivariee
Modele 1 : modelisation de la loi des variables de censure.
On suppose que (T,U) est independant de (C,D) et qu’il existe une fonction
copule connue C telle que
P(t ≤ C, u ≤ D) = C(G1(t), G2(u)),
ou G1 designe la fonction de survie de C et G2 celle de D.
A titre de comparaison, l’estimateur de Dabrowska suppose que (T,U) est
independant de (C,D) sans modeliser la dependance entre les censures. Cette hy-
pothese est le prix a payer pour utiliser notre approche plus confortable. Un cas par-
ticulier important est celui ou C(x1, x2) = x1x2, ce qui correspond a l’independance
de C et D. Sous cette hypothese,
f(t, u) =1
C(G1(t), G2(u)).
Cette hypothese d’identifiabilite a ete introduite initialement par Wang et Wells
(1997), qui utilisent neanmoins une approche differente de la notre. Quoique fort
simple dans sa logique, la demarche de Wang et Wells (1997) n’aboutit pas a la
construction d’une vraie fonction de repartition, et n’est donc pas adaptee aux
exigences fixees. Ils remarquent en effet que
P(T ≥ t, U ≥ u) = H(t, u)C(G1(t), G2(u))−1,
ou H(t, u) = P(Y ≥ t, Z ≥ u). H est alors estimee par la fonction de survie
empirique et G1 et G2 par des estimateurs de Kaplan-Meier.
Pour estimer la fonction f, nous pouvons egalement utiliser des estimateurs de
Kaplan-Meier pour estimer G1 et G2, puisque nous sommes dans ce cas ramenes a
un probleme de censure uni-dimensionnelle. Comme T et C ainsi que U et D sont
independants, nous sommes dans le cadre ou ces estimateurs sont consistants, si
l’on ajoute l’hypothese P(T = C) = P(U = D) = 0.
Finalement, l’estimateur F1 que nous considerons est
F1(t, u) =1
n
n∑j=1
δiγi
C(G1(Yi), G2(Zi))1Yi≤t,Zi≤u,
ou les Gi designent les estimateurs de Kaplan-Meier correspondant, et∫φ(t, u)dF1(t, u) =
1
n
n∑j=1
δiγiφ(Yi, Zi)
C(G1(Yi), G2(Zi)).
Cet estimateur peut donc etre vu comme une extension de l’estimateur de
Kaplan-Meier et de l’estimateur FS de Stute (voir Stute (1993)) ou la variable
explicative serait elle aussi censuree.
4.2. Estimation de la fonction de repartition 41
Remarque.
Dans cette procedure, on suppose que la copule liant les deux variables de cen-
sure est connue. Si elle ne l’est pas, une extension naturelle consiste a postuler
un modele parametrique de copule sur les censures, et a estimer le parametre via
la technique purement parametrique decrite dans Shih et Louis (1995). Sous cer-
taines conditions de regularite de la famille de copules, l’estimateur du parametre
d’association obtenu sera n−1/2−consistant, et cela n’impactera pas la vitesse de
convergence de notre estimateur (meme si la loi limite s’en trouverait modifiee).
4.2.5 Un second cadre : introduction d’une variable auxiliaire
Le cadre suivant, etudie dans Gribkova et collab. (2013), est motive par un
exemple d’application precis. Supposons que T designe la duree de vie totale d’un
individu, et U celle de son conjoint. Ces deux individus entrent en observation a
une meme date aleatoire t1, et sortent d’observation a une meme date aleatoire t2.
Si ces deux durees sont rattachees au meme contrat d’assurance, ce phenomene de
simultaneite de la sortie sera la regle. Dans ce cas, supposons que la difference d’age
entre l’individu et son conjoint est de ε. Alors, necessairement, puisque C designe
l’age de sortie de l’individu pour une cause autre que le deces, et D l’age de sortie
de son conjoint pour une autre cause que le deces, on a la relation
D = C + ε.
Dans ce type de probleme, la variable ε est generalement connue, et on peut
considerer que le phenomene de censure est decrit par une seule variable aleatoire
C, ce qui simplifie l’etude.
Les hypotheses d’identifiabilite que nous posons sont alors les suivantes.
Modele 2 : utilisation d’une variable auxiliaire.
On suppose que
1. D = C + ε.
2. (T,U) est independant de ε et de C, et P(T = C) = P(U = C + ε) = 0.
3. C est independant de ε.
La variable ε est supposee observee.
Dans ce cas, la fonction f est definie comme
f(t, u, ε) =1
SG(max(t, u− ε)−),
ou SG(t) = P(C > t). L’estimation de SG se fait a nouveau par l’estimateur de
Kaplan-Meier, mais afin d’utiliser le maximum d’informations, son estimation est
faite a partir de ηi = 1− δiγi, et Bi = inf(Ci, Ai), ou Ai = max(Ti, Ui − εi). L’idee
est que, meme si Ti n’est pas censuree, la variable Ci peut etre observee si Ui est
censuree.
42 Chapitre 4. Regression et censure multivariee
Base sur un tel estimateur SG, notre estimateur devient alors
F2(t, u) =1
n
n∑j=1
δiγi
SG(max(Yi, Zi − εi)−)1Yi≤t,Zi≤u,
ou les Gi designent les estimateurs de Kaplan-Meier correspondants, et∫φ(t, u)dF2(t, u) =
1
n
n∑j=1
δiγiφ(Yi, Zi)
SG(max(Yi, Zi − εi)−).
4.3 Proprietes theoriques des estimateurs obtenus
Dans toute cette section, F ∗ designe l’estimateur (incalculable en pratique car
necessitant la connaissance de la distribution des censures) de F base sur f au lieu
de f . Cette estimateur ideal F ∗ presente l’avantage d’etre une somme de quantites
i.i.d., et de ce fait peut s’etudier via les outils classiques probabilistes que sont
la loi des grands nombres et le theoreme central limite. Tous les resultats obtenus
s’effectuent via une comparaison entre F et F ∗, dans le premier cadre (section 4.3.1)
comme dans le second (section 4.3.2).
4.3.1 Premier cadre
Nous listons les hypotheses principales qui sont necessaires pour obtenir un
resultat de representation asymptotique des integrales par rapport a F1. Ces
resultats sont obtenus de facon uniforme sur une classe de fonctions (classe de
Donsker).
Hypothese 5 La fonction (x1, x2) → C(x1, x2) est deux fois continument
differentiable. Par ailleurs, on designe par ∂1C(x1, x2) (resp. ∂2C(x1, x2)) les
derivees partielles de C par rapport a x1 (resp. x2), et on suppose que
supx1,x2
|∂1C(x1, x2)|+ supx1,x2
|∂2C(x1, x2)|+∑
i,j∈{1,2}
supx1,x2
|∂i∂jC(x1, x2)| <∞,
et que C(x1, x2) 6= 0 for x1 6= 0 and x2 6= 0.
Seule cette hypothese est necessaire si l’on s’interesse a des fonctions φ qui
valent zero hors d’un compact strictement inclus dans le support de (T,U). Les
hypotheses supplementaires sont necessaires pour prouver l’extension du resultat a
R2 tout entier.
Hypothese 6 On suppose que
C(x1, x2) ≥ xα11 xα2
2 ,
avec 0 ≤ αi ≤ 1 pour i = 1, 2.
4.3. Proprietes theoriques des estimateurs obtenus 43
Cette hypothese est verifiee notamment pour la copule de Frank, et sera verifiee
pour la plupart des familles classiques si on reste a l’ecart des bords du carre unite.
Hypothese 7 F est une classe de fonctions localement bornees avec une enveloppe
Φ telle que ∫Φ2(t, u)dF (t, u)
C(G1(t), G2(u))<∞, (4.4)
et pour un ε > 0 arbitrairement petit,∫Φ(t, u)
[G1−α1
1 (t)K1/2+ε1 (t)
Gα22 (u)
+G1−α2
2 (u)K1/2+ε2 (u)
Gα11 (t)
]dF (t, u) <∞ (4.5)
ou, pour i = 1, 2,
Ki(u) = −∫ u
0
dGi(t)
Gi(t)2Fi(t),
avec F1 (reps. F2) fonction de survie marginale de T (resp. U).
Ces conditions imposent que l’information sur F n’est pas trop grande dans les
queues de distributions par rapport a l’effet de la censure. Des hypotheses similaires,
dans le cas univarie, sont presentes dans l’etude de l’estimateur de Kaplan-Meier,
voir notamment Stute (1995) pour une discussion detaillee de ce type d’hypotheses.
Theoreme 8 Soit F une classe de fonction qui satisfait l’Hypothese 7. Alors,
sous les hypotheses 5 et 6,∫φ(t, u)d[F1 − F ∗1 ](t, u) =
1
n
n∑j=1
∫ηφ(Yj , Zj , δj , γj , t, u)dF (t, u) +Rn(φ),
avec supφ∈F |Rn(φ)| = oP (n−1/2), et ou ηφ est un terme d’esperance nulle dont
on trouvera l’expression explicite au Theoreme 3.4 de Lopez et Saint Pierre
(2011).
Ce type de decomposition permet l’obtention de theoremes type TCL, puisque
F ∗1 s’etudie comme une somme i.i.d. On remarque au passage la consistance, puisque
les hypotheses d’identifiabilite assurent la consistance de F ∗1 , et que le terme η est
d’esperance nulle (il n’intervient que dans la variance asymptotique).
4.3.2 Deuxieme cadre
On suppose egalement dans ce deuxieme cadre que les classes de fonctions im-
pliquees satisfont des proprietes de Donsker (a une transformation pres).
44 Chapitre 4. Regression et censure multivariee
Hypothese 9 Soit G la classe des fonctions positives, monotones, bornees par 1,
et χ(T,U,C, ε) = δγSG(max(T,U − ε)−)−2. Pour tout (t0, u0) dans R2 tels que
SF (t0, u0) > 0, on definit
Ht0,u0 = {(T,U,C, ε)→ χ(T,U,C, ε)f(T,U)g(max(T,U − ε)−)1T≤t0,U≤u0 ,
f ∈ F , g ∈ G} ,
et on suppose que Ht0,u0 est une classe de Donsker de fonctions.
L’hypothese 10 n’est requise que pour obtenir la consistance sur R2 tout entier,
et est automatiquement satisfaite si on considere des fonctions bornees dont le
support est inclus strictement dans celui de la distribution de (T,U). A nouveau, il
s’agit d’une hypothese sur les queues de distribution.
Hypothese 10 On suppose que E[Φ(T,U)2SG(max(T,U − ε)−)−1
]< ∞. De
plus, on definit
C(y) =
∫ y
−∞
dG(t)
[1− F (t)][1−G(t−)]2,
ou F est la fonction de repartition de la variable A, et on suppose que
E[Φ(T,U)C1/2+υ(max(T,U − ε)−)SG(max(T,U − ε)−)−1] < ∞, pour un υ > 0
(arbitrairement petit).
Le resultat theorique que nous obtenons est le suivant.
Theoreme 11 Sous les hypotheses enoncees precedemment,∫φ(t, u)d(F2 − F ∗2 )(t, u) =
1
n
n∑i=1
ψφ(Yi, Zi, δi, γi, εi) +Rn(φ), (4.6)
ou l’expression de ψφ, qui satisfait E[ψφ(Yi, Zi, δi, γi, εi)] = 0, est donnee dans
Gribkova et collab. (2013), et supφ∈F |Rn(φ)| = oP (n−1/2).
4.4 Applications
4.4.1 Regression : illustration dans le cadre 1
On suppose ici que
T = m(θ0, U) + ε,
ou m est une fonction connue. Dans ce cas, si l’on cherche le parametre dans l’espace
Θ ⊂ Rk, alors
θ0 = arg minθ∈Θ
∫(t−m(θ, u))2dF (t, u),
4.4. Applications 45
ou on suppose que l’espace Θ est suffisamment restreint pour que θ0 soit defini de
maniere unique. On definit donc
θ = arg minθ∈Θ
∫(t−m(θ, u))2dF1(t, u).
En appliquant le resultat precedent a la famille de fonctions, φθ(t, u) = (t −m(θ, u))2, on peut en deduire la consistance de θ, sous reserve d’hypotheses de
regularite sur la famille de fonctions, et d’hypotheses sur les queues de distribution
de T et U . Concernant les hypotheses de regularite sur φθ, une condition suffisante
est
|φθ1(t, u)− φθ2(t, u)| ≤ ψ(t, u)‖θ1 − θ2‖a, (4.7)
pour a > 0 et ou ‖ · ‖ est une norme sur Rk, et ψ satisfait la condition (4.4).
Si on suppose des conditions de regularite similaires sur les derivees de φθ par
rapport a θ jusqu’a l’ordre 2, on peut en deduire la normalite asymptotique de θ
(en supposant que M(θ) = E[φθ(T,U)] est deux fois differentiable en θ0).
La loi asymptotique de θ ainsi que des simulations validant le comportement
empirique d’une telle technique sont presentees en detail dans Lopez et Saint Pierre
(2011).
4.4.2 Bootstrap
Si les representations asymptotiques obtenues precedemment sont precieuses du
point de vue theorique, et permettent d’assurer que l’on possede bien une conver-
gence a la vitesse n−1/2, elles se revelent assez delicates a utiliser pour construire
des intervalles de confiance. En particulier, dans de nombreux cas d’applications
(en particulier lorsque la proportion d’observations censurees est importante), on
est loin du cadre d’approximation gaussienne que fournit le TCL.
A titre d’illustration, nous presentons ce resultat expose dans Gribkova et collab.
(2013), concernant le coefficient τ de Kendall. Cette mesure d’association d’usage
courant peut s’exprimer via la fonction de repartition via la formule suivante,
τ = 4
∫F (t, u)dF (t, u)− 1.
Dans le cas ou une seule variable est censuree, on pourra consulter Beaudoin et col-
lab. (2007) pour une estimation de ce coefficient.
Dans Gribkova et collab. (2013), on montre la normalite asymptotique de l’es-
timateur base sur le remplacement de F par F2. Sur des donnees reelles provenant
d’un portefeuille d’assurances classiquement etudie dans la litterature, voir Frees et
Valdez (1998), Carriere (2000), la technique bootstrap que nous decrivons ci-dessous
fournit l’histogramme presente en figure 4.1 pour estimer la loi de l’estimateur τ .
On observe graphiquement qu’on semble loin du cadre gaussien, ce qui motive
l’utilisation de procedures bootstrap.
46 Chapitre 4. Regression et censure multivariee
Bootstrap for Kendall’s tau coefficient
Tau
Fre
quency
0.4 0.5 0.6 0.7 0.8 0.9 1.0
050
100
150
Figure 4.1 – Histogramme de la distribution de τ en utilisant la procedure boots-
trap.
La procedure que nous utilisons est la suivante (dans le cadre 2, mais elle
s’adapte sans mal au premier cadre) :
Pour b = 1, ..., B, on simule le b−eme echantillon bootstrap par le procede
suivant :
1. Simulation de (T b1 , Ub1 ..., T
bn, U
b1) suivant F2.
2. Simulation des variables auxiliaires (εi)1≤i≤n via leur distribution empirique.
3. Simulation des Cbi grace a l’estimateur SG.
4. Reconstruction des Dbi , et de la des Y b
i , δbi , Z
bi , γ
bi .
Cette procedure bootstrap est une extension du schema de bootstrap d’Efron,
voir Efron (1981), propose dans le cas d’un probleme de censure univariee. Cette
procedure, dans le cas de l’estimateur Kaplan-Meier, est consistante, comme l’a
montre Akritas (1986), contrairement au schema concurrent de Reid, voir Reid
(1981). Les mesures positives definies par F2 et SG n’etant pas necessairement de
masse egale a 1 (elle peut etre inferieure), plusieurs conventions sont possibles pour
se ramener a une vraie distribution, la plus simple etant la normalisation de ces
mesures, en les divisant par leur masse totale.
4.4.3 Tests d’adequation pour des modeles de copules
Ainsi que nous l’avons deja mentionne, les copules de survie sont une facon
classique de modeliser la dependance entre deux durees de vie T et U. Ainsi, si on
4.4. Applications 47
definit SF (t, u) = P(T > t, U > u), par le theoreme de Sklar (Sklar (1959)), on
obtient la representation
SF (t, u) = C(ST (t), SU (u)),
ou ST (t) = P(T > t) et SU (u) = P(U > u), et ou C est une copule de survie (voir
par exemple Nelsen (2006)). Pour interpreter la dependance entre T et U, qui est
representee par la fonction copule C, il est naturel de chercher une estimation de
C, le plus souvent basee sur une modelisation parametrique ou semi-parametrique,
voir Shih et Louis (1995). Les estimateurs non parametriques que nous proposons
permettent ensuite de valider ou d’invalider le modele via une procedure de test
d’adequation.
Pour ce faire, Wang et Wells (2000) ont propose d’etendre la methodologie de
Genest et Rivest (1993) en presence de censure. Cette approche repose sur l’esti-
mation de la fonction v → K(v) = P(SF (T,U) ≤ v). Si on considere le cas parti-
culier des familles de copules archimediennes, (c’est a dire des copules definies par
C(u, v) = φ−1(φ(u) + φ(v)) ou le generateur φ est une fonction convexe satisfaisant
les conditions du Theoreme 4.3.4 dans Nelsen (2006)), il existe une correspondence
entree φ et K via
K(v) = v − φ(v)
φ′(v). (4.8)
L’idee de base de la procedure qui en derive consiste a comparer une estimation
parametrique de K (base sur un estimateur φθ dependant du modele parametrique
postule, et de θ, le parametre d’association estime a partir des donnees) a une
estimation non parametrique. Wang et Wells (2000) utilisent un estimateur base
sur l’estimateur de Dabrowska (1988). Celui que nous proposons est
K(v) =
∫1SF2
(t,u)≤vdF2(t, u), (4.9)
etudie ici dans le cadre 2, ou SF2 est l’estimateur de la fonction de survie qui se
deduit de F2.
Dans la Proposition suivante, on montre que le processus n1/2(K(v) − K(v))
converge vers un processus gaussien, ce qui legitime la procedure de test que nous
utilisons par la suite. En revanche, nous ne nous focalisons pas sur la covariance qui
est difficilement manipulable. Les valeurs critiques du test sont en fait calculees par
bootstrap. Les hypotheses techniques de cette proposition peuvent etre retrouvees
dans Gribkova et collab. (2013).
Proposition Sous des hypotheses adaptees (voir Gribkova et collab. (2013)), il
existe un processus gaussien W tel que,{n1/2
(K(v)−K(v)
), v ∈ R
}=⇒
{−∫ ∫
1SF (t,u)>vdW (t, u)
−∫ ∫
W (t, u)dµ·(t, u), v ∈ R}.
48 Chapitre 4. Regression et censure multivariee
On considere a present une famille parametrique de copules archimediennes
FC = {Cθ : θ ∈ Θ}, dont on designe par φθ le generateur archimedien de la copule
Cθ. Nous decrivons comment etendre la procedure de Genest et Rivest (1993) (on
pourra consulter Genest et collab. (2009) pour d’autres procedures possibles) afin
de tester
H0 : C ∈ FC ,
contre
H1 : C /∈ FC .
Pour cela, on calcule un estimateur du parametre d’association θ a partir des
donnees (en supposant, donc, que H0 est vraie), puis on utilise φθ et (4.8) pour
calculer un estimateur parametrique Kθ de la fonction K. A partir d’une distance d
entre deux courbes sur [0, 1], la statistique de test est Tn = d(K, Kθ). H0 est rejetee
quand Tn > sα, ou sα est une valeur critique qui permet d’atteindre le niveau α.
Ces valeurs critiques sont calculees a partir de la procedure bootstrap definie
dans la section precedente, avec modification de la premiere etape. En effet, pour la
premiere etape, on doit se placer sous H0 et simuler les donnees a partir du modele
de copule Cθ. Plus precisement, la premiere etape devient
1’. Simuler (T bi , Ubi )1≤i≤n sous la distribution definie par Cθ ou les f.d.r. de T et
U sont definies par les estimateurs de Kaplan-Meier correspondants.
Pour une procedure de test voisine, Wang et Wells (2000) ont propose une methode
bootstrap qui a ete montree comme etant inconsistante par Genest et collab. (2006),
d’ou l’interet d’utiliser la nouvelle procedure que nous proposons.
A titre d’illustration, nous presentons les resultats pour les donnees reelles
considerees dans Gribkova et collab. (2013).
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Estimation of K(v)
v
Pro
babili
ty
Nonparametric
Nelsen
Frank
Clayton
Figure 4.2 – Comparaison entre K et Kθ pour trois modeles de copules.
4.5. Perspectives 49
Trois familles de copules sont considerees : Frank, Clayton et une copule due a
Nelsen (voir exemple 4.2.4 de Nelsen (2006)). Gribkova et collab. (2013) proposent
egalement le calcul par bootstrap des p−values des differents tests associes a chacun
des modeles, dans le cas ou l’on considere une distance L2 entre K et Kθ. Les
valeurs des statistiques de tests sont du meme ordre pour chacun des modeles, mais
la p−value du modele de Frank est bien plus faible que celle des deux autres (0.008
contre environ 0.5 pour les deux autres modeles).
4.5 Perspectives
A partir des estimateurs de la fonction de repartition de (T,U) consideres dans
ce chapitre, il devient possible de generaliser la notion de copule empirique definie
par Deheuvels (1979). Cette estimateur non parametrique de la copule peut servir
d’outil pour tester l’adequation a des modeles de copules. On peut egalement en-
visager des techniques de lissage qui permettent l’estimation non parametrique de
la densite de copule. Ces extensions sont considerees dans un cadre plus general au
chapitre suivant.
Chapitre 5
Censure multivariee et
troncature a gauche
Sommaire
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
5.2 Construction de l’estimateur . . . . . . . . . . . . . . . . . . . 53
5.2.1 Observations . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.2.2 Une equation aux derivees partielles . . . . . . . . . . . . . . 53
5.2.3 Definition de l’estimateur et justification de son existence . . 54
5.3 Proprietes de convergence . . . . . . . . . . . . . . . . . . . . 56
5.3.1 Etude des poids Wi,n . . . . . . . . . . . . . . . . . . . . . . 56
5.3.2 Integrales par rapport a F . . . . . . . . . . . . . . . . . . . . 57
5.4 Application sur donnees reelles . . . . . . . . . . . . . . . . . 57
5.4.1 Applications generales . . . . . . . . . . . . . . . . . . . . . . 57
5.4.2 Jeu de donnees canadiennes . . . . . . . . . . . . . . . . . . . 57
5.5 Extension de la notion de copule empirique et perspectives 58
5.5.1 Copule empirique . . . . . . . . . . . . . . . . . . . . . . . . . 58
5.5.2 Evolution generationnelle de la dependance . . . . . . . . . . 60
5.1 Introduction
Les cas de figure representes dans le chapitre precedent possedent plusieurs ca-
racteres limitatifs. D’une part, on l’a vu, il est necessaire d’introduire des hypotheses
restrictives sur les variables de censure. L’autre probleme est qu’elles n’integrent pas
la presence d’un phenomene supplementaire qui frappe generalement les observa-
tions issues des durees de vie, la troncature a gauche.
Pour justifier l’interet de considerer cette troncature, reprenons l’exemple ou T
designe la duree de vie d’un individu, U celle de son conjoint, et C et D designent
respectivement l’age de l’individu et celui de son conjoint a la sortie d’observation
(pour une autre cause que le deces). Si on introduit µ (resp. ν) l’age de l’individu
(resp. celui du conjoint) au moment ou il entre en observation, par exemple parce
qu’il souscrit un contrat d’assurance, les observations ne sont composees que de
couples qui satisfont inf(T,C) ≥ µ et inf(U,D) ≥ ν. A l’inverse de la censure
a droite, negliger la troncature a gauche conduit une mauvaise estimation de la
52 Chapitre 5. Censure multivariee et troncature a gauche
distribution de (T,U) dans sa partie basse, puisque les observations avec une faible
valeur de T ou une faible valeur de U sont generalement peu representees.
Dans un cadre univarie, l’estimateur de Kaplan-Meier peut etre adapte, voir
notamment Tsai et collab. (1987). En revanche, les estimateurs proposes jusqu’a
present dans le cadre de la censure bivariee, voir section 4.2.2 peuvent difficilement
etre generalises de facon immediate a la presence de troncature.
Si l’on examine le cadre univarie, la convergence de l’estimateur qui derive de
Kaplan-Meier repose sur les hypotheses que T est independant de C et de µ, et que
C est independant de µ (avec quelques hypotheses supplementaires qui assurent que
l’ensemble des observations non tronquees n’est jamais vide). Dans ce chapitre, nous
nous fixons comme objectif de generaliser de facon minimale de telles hypotheses au
cadre bivarie. Plus precisement, on se placera dans le cadre suivant (en reprenant
les notations du chapitre precedent).
Hypothese 12 On suppose que
1. (T,U) est independant de (C,D, µ, ν),
2. (C,D) est independant de (T,U, µ, ν),
3. P(Y ≥ µ,Z ≥ ν) > 0.
La seule restriction supplementaire, qui sera supposee verifiee dans l’ensemble de
ce chapitre, tient du fait que nous supposons que T et U sont absolument continues
par rapport a la mesure de Lebesgue.
La technique de construction du nouvel estimateur que nous proposons dans
Lopez (2012), si elle comporte des points communs avec le chapitre precedent (on
cherche un estimateur qui ne met du poids qu’aux observations doublement non cen-
surees et qui definit une vraie fonction de repartition), requiert une approche par-
ticuliere, puisque notre estimateur n’est pas defini de maniere directe, mais comme
solution de la version discrete d’une equation aux derivees partielles qui decrit le
modele de censure/troncature. La resolution exacte de cette equation aux derivees
partielles est possible, via l’inversion d’une matrice relativement simple, calculable
a partir des donnees.
Nous montrons que l’estimateur qui en resulte est consistant a la vitesse n−1/2,
comme l’est celui de Dabrowska (1988). La definition implicite de l’estimateur ne
permet pas, pour le moment, d’obtenir la normalite asymptotique. Cependant, pour
les applications qui nous motivent, cette normalite asymptotique n’est pas necessaire
puisque les intervalles de confiance et les procedures de tests proposees sont obtenues
par des procedures bootstrap, similaires a celles decrites au chapitre precedent.
Le chapitre est organise de la facon suivante. Dans la section 5.2, nous decrivons
la construction de l’estimateur de la fonction de repartition jointe de (T,U), base
sur l’obtention d’une equation aux derivees partielles. La section 5.3 presente les
resultats de convergence de cette estimateur et de fonctionnelles derivees. Enfin, la
section 5.4 propose des resultats obtenues sur donnees reelles, qui peuvent etre com-
5.2. Construction de l’estimateur 53
pares a ceux du chapitre precedent ou l’on ne prenait pas en compte la troncature
a gauche. Des perspectives sont presentees dans le section 5.5.
5.2 Construction de l’estimateur
L’introduction des variables de troncation est faite dans la section 5.2.1. La
construction de l’estimateur repose sur une equation aux derivees partielles decrite
dans la section 5.2.2. La resolution d’une version empirique de cette equation est
discutee dans la section 5.2.3.
5.2.1 Observations
Les observations dont on dispose sont similaires a celles decrites dans la section
4.2, a ceci pres qu’on observe deux variables supplementaires (µi, νi)1≤i≤n avec
µi ≤ Yi et νi ≤ Zi. Le principal changement est que toutes les quantites du type
n−1∑n
i=1 φ(Y, Z) convergent vers E[φ(Y, Z)|µ ≤ Y, ν ≤ Z], au lieu de converger
vers E[φ(Y, Z)].
5.2.2 Une equation aux derivees partielles
Nous introduisons un certain nombre de notations. Soit
SF (t, u) = P (T > t, U > u) ,
V (t, u) = P (Y ≤ t, Z ≤ u, δ = γ = 1|Y ≥ µ,Z ≥ ν) ,
H(t, u) = P (µ ≤ t ≤ Y, ν ≤ u ≤ Z|Y ≥ µ,Z ≥ µ) .
La proposition suivante etablit une relation entre ces fonctions et dF (t, u).
Theoreme 13 Sous l’Hypothese 12,
dF (t, u) =SF (t, u)dV (t, u)
H(t, u)=
{∫t+
∫u+ dF (t′, u′)
}dV (t, u)
H(t, u), (5.1)
ou, de facon equivalente pour tout φ ∈ L1,
E [φ(T,U)] =
∫ ∫φ(y, z)SF (y, z)dV (y, z)
H(y, z)= E [δγw(Y,Z)φ(Y,Z)|Y ≥ µ,Z ≥ ν] ,
avec
w(y, z) =SF (y, z)
H(y, z). (5.2)
Cette proposition permet de definir un estimateur ideal de F. En definissant
W ∗i,n = n−1δiγiw(Yi, Zi), on peut considerer
F ∗(t, u) =
n∑i=1
W ∗i,n1Yi≤t,Zi≤u. (5.3)
54 Chapitre 5. Censure multivariee et troncature a gauche
A partir du Theoreme 13, on voit que∫ ∫φ(t, u)dF ∗(t, u)→
∫ ∫φ(y, z)w(y, z)dV (y, z) = E [φ(T,U)] , p.s.,
quand n tend vers l’infini.
Bien entendu, F ∗ ne peut etre calculee, puisque ceci necessiterait la connaissance
de H et de SF (t, u) =∫t+
∫u+ dF (t′, u′). Neanmoins, F ∗ joue le role de reference,
qui presente l’avantage de ne dependre que de (Yi, Zi, δi, γi)1≤i≤n et non pas des va-
riables non observables (Ti, Ui)1≤i≤n. Il joue un role cle dans l’obtention des resultats
de convergence, qui s’obtiennent par comparaison de l’estimateur final avec cette
reference.
On peut remarquer que F ∗ ne definit pas necessairement une vraie distribution
de probabilite, puisqu’il n’y a pas de raison de penser que∑n
i=1W∗i,n = 1. On
designera par W ∗∞,∞ = 1 −∑n
i=1Wi,n qui peut etre interpretee comme la masse
additionnelle qui doit etre affectee au point (∞,∞) (ici cette masse correspondant
a F ∗ peut etre negative dans le cas ou la masse totale de F ∗ est plus grande que 1).
5.2.3 Definition de l’estimateur et justification de son existence
Dans la section precedente, on a montre que F etait solution d’une equation
aux derivees partielles. Nous utilisons le terme d’equation aux derivees partielles,
puisque, dans le cas ou F correspond a une mesure absolument continue par rap-
port a la mesure de Lebesgue, dF (t, u) = f(t, u)dtdu, ou f(t, u) = ∂t∂uF (t, u).
Comme nous l’avons signale, l’equation (5.1) depend de quantites inconnues V et
H. Neanmoins, ces quantites peuvent etre estimees empiriquement a la vitesse n−1/2
par
V (t, u) =1
n
n∑i=1
δiγi1Yi≤t,Zi≤t,
H(t, u) =1
n
n∑i=1
1µi≤t≤Yi,νi≤u≤Zi .
De la, nous definissons notre estimateur F comme la solution de la version
empirique de (5.1), c’est a dire :
Definition de F :
F est l’unique solution de
dF (t, u) =
{∫t+
∫u+ dF (t′, u′)
}dV (t, u)
H(t, u). (5.4)
avec la condition que la masse totale de F doit etre egale a 1.
5.2. Construction de l’estimateur 55
Puisque V est une sous-fonction de repartition qui ne met de la masse qu’aux
observations telles que δi = γi = 1, c’est egalement le cas pour F , qui peut donc
s’ecrire
F (t, u) =
n∑i=1
Wi,n1Yi≤t,Zi≤u,
avec Wi,n = 0 si δi = 0 ou γi = 0, et on peut egalement definir W∞,∞ la masse
a l’infini. C’est cette forme simple qui va assurer l’existence et l’unicite de F et
fournir une methode pour la calculer de facon exacte.
En effet, dans ce cas, resoudre (5.4) est equivalent a determiner le vecteur W =
(W1,n, ...,Wn,n,W∞,∞). A partir de (5.4), on voit que, pour i ≤ n,
Wi,n =δiγi
∑nj=1(Wj,n1Yj>Yi,Zj>Zi +W∞,∞)
nH(Yi, Zi)
=δiγi
∑nj=1(δjγjWj,n1Yj>Yi,Zj>Zi +W∞,∞)
nH(Yi, Zi),
puisque Wi,n = 0 si δiγi = 0. De la, cette equation peut etre reecrite de la facon
suivante,
Wi,n −n∑j=1
ai,jWj,n − ai,n+1W∞,∞ = 0,
avec, pour j ≤ n,
ai,j =δjγjδiγi1Yj>Yi,Zj>Zi
nH(Yi, Zi),
et ai,n+1 = δiγin−1H(Yi, Zi)
−1. De plus, si on definit an+1,j = 0 pour j ≤ n, et
an+1,n+1 = 1, l’equation (5.4) peut etre reecrite sous forme matricielle de la facon
suivante,
(In+1 − A)W = 0, (5.5)
ou A = (ai,j)1≤i,j≤n. On peut remarquer qu’il n’y a pas de probleme de definition
des coefficients ai,j , puisque H(Yi, Zi) > 0, pour tout i.
Le Theoreme 14 fournit l’existence de solutions de (5.5). A travers la preuve
qui est decrite dans Lopez (2012), on en deduit une facon de resoudre l’inversion
matricielle de facon rapide du point de vue computationnel.
Theoreme 14 Sous l’Hypothese 12, il existe une unique solution de (5.5) telle
que
1. W∞,∞ > 0,
2. Wi,n = 0 if δi = 0 or γi = 0,
3.∑n+1
i=1 Wi,n = 1.
De plus, Wi,n > 0 pour tout i tel que δi = γi = 1.
56 Chapitre 5. Censure multivariee et troncature a gauche
La positivite des poids permet d’assurer que l’on obtient bien une distribution
de probabilite. Il faut egalement remarquer que l’introduction d’une masse a l’infini
joue un role cle dans la resolution du systeme lineaire. Elle permet notamment
d’assurer que le noyau de In+1 − A est de dimension exactement 1. Neanmoins,
comme on le verra dans la partie theorique, cette masse a l’infini est toujours petite,
de l’ordre de n−3/2.
Il faut egalement remarquer la similitude entre cet estimateur et l’estimateur
de Kaplan-Meier, qui lui aussi peut etre vu comme la solution d’une equation
differentielle analogue.
5.3 Proprietes de convergence
La convergence de F repose sur une comparaison des poids Wi,n avec les poids
W ∗i,n de F ∗, qui est effectuee dans la section 5.3.1. De la, on deduit aisement les
resultats de convergence sur les integrales par rapport a F , presentes dans la section
5.3.2.
5.3.1 Etude des poids Wi,n
La premiere etape cruciale consiste a comparer Wi,n au poids ideal W ∗i,n. Une
fois que cette difference est evaluee, l’etude de F devient tres simple, puisqu’elle se
resume a l’etude de F ∗ qui est une somme de quantites i.i.d.
Theoreme 15 Sous l’Hypothese 12, supposons qu’il existe une constante K
telle que1
H(Y, Z)< K, p.s. (5.6)
alors
sup1≤i≤n
|Wi,n −W ∗i,n|+ |W∞,∞ −W ∗∞,∞| = OP (n−3/2).
L’hypothese (5.6) est technique, et doit etre mise sur le compte de la diffi-
culte d’estimer correctement la distribution pour les grandes valeurs de T et de U.
En pratique, elle n’est que rarement verifiee, puisqu’elle supposerait un compor-
tement vraiment particulier de la censure (voir remarque 3.3 dans Lopez (2012)).
Neanmoins, on trouvera dans Lopez (2012) une discussion qui permet d’expliquer
comment, via l’introduction d’un biais, on peut toujours se ramener a ce cadre en
tronquant a droite les donnees. Pour obtenir des resultats sur R2 tout entier, il fau-
drait introduire des conditions de moments analogues a celles qui sont decrites dans
le chapitre precedent, mais qui sont difficiles a determiner dans le cadre present.
On se trouve alors dans une situation similaire a celle decrite dans le Chapitre 1,
ou, du point de vue theorique, la convergence n’est obtenue que sur un compact qui
n’englobe pas la queue de distribution.
5.4. Application sur donnees reelles 57
5.3.2 Integrales par rapport a F
On deduit ensuite du Theoreme 15 le resultat suivant.
Theoreme 16 Soit F une classe de fonctions telle que, pour tout φ ∈ F ,φ(∞,∞) = 0, φ(t, u) = 0 quand H(t, u) = 0, et |φ(y, z)| ≤ Φ(y, z) avec
E[Φ(Y,Z)] <∞. Alors, sous les hypotheses du Theoreme 15,∫ ∫φ(t, u)dF (t, u) =
∫ ∫φ(t, u)dF ∗(t, u) +Rn(φ), (5.7)
avec supφ∈F |Rn(φ)| = OP (n−1/2). De plus, si
supφ∈F
∣∣∣∣∣ 1nn∑i=1
δiγiSF (Yi, Zi)φ(Yi, Zi)
H(Yi, Zi)− E[φ(Y,Z)]
∣∣∣∣∣ = OP (n−1/2), (5.8)
on obtient
supφ∈F
∣∣∣∣∫ ∫ φ(t, z)dF (t, z)−∫ ∫
φ(t, z)dF (t, z)
∣∣∣∣ = OP (n−1/2). (5.9)
La condition (5.8) est satisfaite des que F est une classe de Donsker.
5.4 Application sur donnees reelles
5.4.1 Applications generales
On peut deduire des resultats de la section precedente la convergence d’estima-
teurs des quantites τ, K et SF decrites au chapitre precedent. On n’obtient qu’une
vitesse de convergence (uniforme pour K et SF ) d’ordre n−1/2. On pourra consulter
Lopez (2012) pour plus de precisions sur ce point.
De plus, les techniques bootstrap du chapitre precedent peuvent etre appliquees
aisement, puisqu’on a bien pris soin de definir des distributions de probabilite.
5.4.2 Jeu de donnees canadiennes
A titre de comparaison, nous presentons les resultats obtenus sur les memes
donnees reelles que celles presentees dans le chapitre precedent dans la section 4.4.3
(la difference avec la section 4.4.3 vient du fait que l’on ne neglige plus la troncature
a gauche). Une description complete des resultats est fournie dans Lopez (2012).
Nous considerons a nouveau la comparaison entre l’estimateur non parametrique de
K base sur l’estimation de la fonction de repartition definie dans le present chapitre,
et les versions qui utilisent les estimateurs parametriques dans les differents modeles.
Les resultats obtenus sont sensiblement differents, notamment en terme de p-value
pour la procedure de test associee. La famille de Frank voit sa p−value augmenter
a 0.15, tandis qu’elle est aux environs de 0.3 pour les deux autres familles.
58 Chapitre 5. Censure multivariee et troncature a gauche
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Estimation of K(v)
v
Pro
bab
ility
Nonparametric
Nelsen
Frank
Clayton
Figure 5.1 – Comparaison des estimateurs Kθ avec l’estimateur non parametrique
K.
5.5 Extension de la notion de copule empirique et pers-
pectives
5.5.1 Copule empirique
A partir d’un estimateur de la fonction de repartition multivariee, on peut en
deduire un estimateur non parametrique de la copule C qui lie (T,U), qui prolonge
ainsi la definition de la copule empirique de Deheuvels (1979). Dans Gribkova et
Lopez (2013), on etude des estimateurs non parametriques de la copule de la forme
C(u, v) = F (F−1T (u), F−1
U (v)),
5.5. Extension de la notion de copule empirique et perspectives 59
ou F est un estimateur de la fonction de repartition de (T,U) (soit tel que defini
dans le present chapitre, soit tel qu’au chapitre precedent), et ou FT (t) = F (t,∞)
(resp. FU (u) = F (∞, u)) designe l’estimateur de FT (t) = P(T ≤ t) (resp. FU (u) =
P(U ≤ u)). Les resultats de Gribkova et Lopez (2013) negligent le phenomene de
la troncature a gauche, mais la forme generale des estimateurs consideres peut
egalement s’adapter a ce cadre.
Dans Gribkova et Lopez (2013), on prouve deux proprietes de convergence pour
C(·, ·) suivant les proprietes dont on dispose sur l’estimateur F . Soit on ne dispose
que de resultats de convergence uniforme pour l’estimateur F , ce qui est le cas du
present chapitre, et on en deduit la convergence uniforme de C(·, ·) (voir Theoreme
?? ci-dessous). Soit on dispose de la convergence en loi du processus F (ce qui est
le cas, notamment, des estimateurs consideres au chapitre precedent), et on peut
en deduire la loi limite de C(·, ·) (voir Theoreme 18 ci-dessous).
Theoreme 17 Pour un estimateur F tels que FT et FU sont monotones, soit
T1 = [−∞, A1], et T2 = [−∞, A2] tels que
supt1∈T1,t2∈T2
|F (t1, t2)− F (t1, t2)| = OP (n−1/2),
et tels que
supt1∈T1
|FT (t1)− FT (t1)|+ supt2∈T2
|FU (t2)− FU (t2)| = OP (n−1/2).
Soit (u1, u2) tels que FT (T1) = [0, u1] et FU (T2) = [0, u2], alors, pour tout η > 0,
supu≤u1−η,v≤u2−η
|C(u, v)− C(u, v)| = OP (n−1/2).
Il apparaıt, dans ce resultat, que la convergence n’est pas necessairement obte-
nue sur [0, 1]2 tout entier, du fait de la presence de censure a droite qui entraıne
des difficultes d’estimation dans les queues droites de distribution. La convergence
peut etre obtenue sur [0, 1]2 via des hypotheses sur les queues de distribution qui
dependent du cadre considere, voir la discussion a l’issue du Theoreme 18.
Theoreme 18 On suppose que n1/2{F − F} convergent faiblement vers un
processus GF dans l∞(R2). Soit Z∗C = GF (F−1T (u), F−1
U (v)). Alors le processus
n1/2{C(u, v)− C(u, v)} converge dans l∞([0, 1]2) vers
ZC(u, v) = Z∗C(u, v)− ∂uC(u, v)Z∗C(u, 1)− ∂vC(u, v)Z∗C(1, v).
A nouveau, la convergence de F sur R2 tout entier n’est en general possible qu’au
prix d’hypotheses sur les queues de distribution, faute de quoi la convergence de C
n’intervient que sur [0, a]2 avec a < 1. A titre d’exemple, pour l’estimateur F2 du
60 Chapitre 5. Censure multivariee et troncature a gauche
chapitre precedent (defini dans Gribkova et collab. (2013)), la condition 10 permet
d’assurer cette convergence. En particulier, on s’attend a ce que cette condition ne
soit pas verifiee lorsque le phenomene de censure est trop important.
Par ailleurs, on considere egalement des estimateurs lisses de la copule C. Le
premier est une adaptation de Fermanian et collab. (2004), base sur une version
lissee de F . Le second est une adaptation d’une procedure proposee par Omelka
et collab. (2009) afin d’attenuer l’importance des lois marginales dans la perfor-
mance de l’estimateur final. Cet estimateur est obtenu a partir d’une transfor-
mation des observations. Soit Φ une fonction de repartition. Le vecteur aleatoire
(U ′, V ′) = (Φ−1(FT (T ))),Φ−1(FU (U)) a pour fonction de repartition C. A partir
d’estimations de ces variables U ′ et V ′ (en remplacant FT par FT et FU par FU ),
on peut fournir un estimateur lisse de la fonction de repartition de (U ′, V ′) (donc
de C). On renvoie a Omelka et collab. (2009) et Gribkova et Lopez (2013) (pour la
version en presence de censure) pour plus de details sur cette construction.
Nous montrons que les deux versions lissees ont meme limite que celle de l’esti-
mateur non lisse decrit au Theoreme 18. Par ailleurs, nous demontrons egalement
des vitesses de convergence uniforme pour les estimateurs de la densite de copule
associes.
5.5.2 Evolution generationnelle de la dependance
Si l’on reprend l’exemple de donnees reelles, Luciano et collab. (2012) ont no-
tamment montre l’importance de la generation des deux membres du couple pour
modeliser la dependance entre leurs durees de vie.
L’utilisation de techniques de lissages non parametriques, basees sur des idees
similaires a celle de l’estimateur de Kaplan-Meier conditionnel defini par Be-
ran (1981), peuvent permettre de prendre en compte cet effet generationel, en
considerant que deux variables explicatives de la mortalite sont presentes : la date
de naissance de l’individu et celle de son conjoint.
Dans un travail en cours, on s’interesse a l’adaptation de l’estimateur propose
dans le present chapitre a ce cadre generationel. Il peut en effet etre pris en compte
en remplacant les probabilites definissant les fonctions H et V par des probabilites
conditionnelles (conditionnelles a la date de naissance). On peut utiliser des estima-
teurs a noyau pour estimer non parametriquement ces probabilites conditionnelles.
Conclusion
Dans ce memoire d’habilitation, on s’est interesse a plusieurs problemes lies
aux modeles de duree, et notamment a la modelisation de la dependance entre une
duree et un certain nombre de variables explicatives (qui peuvent elles-memes etre
des variables de duree, notamment dans les Chapitres 4 et 5). Sur chacune des
thematiques decrites dans les differents chapitres, je me suis attache a degager un
certain nombre de perspectives qui permettent d’envisager des prolongements pour
les resultats obtenus.
Pour conclure ce memoire, je synthetise les trois grands axes dans lesquels
s’inserent ces perspectives. Ces trois axes ne sont pas disjoints et des ponts peuvent
permettre des recoupements entre ces differentes problematiques.
1. Grande dimension. Les modeles single-index sont une reponse aux donnees
de grandes dimensions : elles resument l’information portee par les variables
explicatives en un indicateur uni-dimensionnel. Par ailleurs, la grande flexibi-
lite sur la partie non parametrique du modele permet de les envisager comme
des concurrents serieux au modele de Cox (dans le domaine des durees de
vie), ou aux modeles lineaires generalises tres utilises notamment en assurance
non-vie. Ainsi qu’il a ete precise au Chapitre 2, un travail en cours concerne
l’utilisation des methodes single-index dans un modele de regression Pareto.
La flexibilite de la fonction de lien, selectionnee dans une famille non pa-
rametrique, nous paraıt particulierement adaptee a ce contexte ou il apparaıt
a premiere vue difficile de justifier l’utilisation de modeles parametriques pour
modeliser l’indice de valeurs extremes conditionnel.
2. Stabilite des modeles, detection de rupture, risque de longevite. La
plupart des modeles consideres dans ce memoire d’habilitation etant relies a
un probleme temporel, la stabilite de ce type de modeles dans le temps merite
d’etre interrogee (voir les perspectives des Chapitres 3 et 5). Dans l’exemple
important de l’etude du risque de longevite, cette question revet une impor-
tance particuliere, puisque cette etude requiert des projections de la mortalite
a long terme, lesquelles peuvent se reveler tres sensible a un ecart par rap-
port aux tendances observees par le passe. Il convient alors de s’interroger sur
la stabilite des modeles a travers les generations, ainsi que de l’homogeneite
des donnees utilisees pour l’estimation (en assurance, les donnees de porte-
feuilles utilisees peuvent notamment etre sujettes a des changements dans leur
composition d’une annee a l’autre). Des techniques de detection de rupture
peuvent etre employees soit de facon retrospective pour identifier des change-
ments dans le passe, soit de facon dynamique en permettant de mettre a jour
les modeles consideres.
3. Dependance, copules. Dans les Chapitres 4 et 5, on s’est interesse a uti-
liser des estimateurs non parametriques de la fonction de repartition pour
62 Chapitre 5. Censure multivariee et troncature a gauche
tester l’adequation a des modeles de copules et proposer (voir perspectives du
Chapitre 5) des estimateurs non parametriques de la copule liant un couple
de variables aleatoires. La question du choix approprie du modele de copule
pour decrire la dependance entre plusieurs variables est une problematique
delicate. Les outils des Chapitres 4 et 5 ouvrent donc a des developpements
futurs, dans le cadre de variables de duree comme dans le cadre ”usuel” ou ni
censure, ni troncature ne sont presents.
Bibliographie
Aalen, O. O., Ø. Borgan et H. K. Gjessing. 2008, Survival and event history analysis,
Statistics for Biology and Health, Springer, New York, ISBN 978-0-387-20287-
7, xviii+539 p., doi :10.1007/978-0-387-68560-1. URL http://dx.doi.org/10.
1007/978-0-387-68560-1, a process point of view. 30
Akritas, M. G. 1986, �Bootstrapping the Kaplan-Meier estimator�, J.
Amer. Statist. Assoc., vol. 81, no 396, p. 1032–1038, ISSN 0162-1459.
URL http://links.jstor.org/sici?sici=0162-1459(198612)81:396<1032:
BTKE>2.0.CO;2-Q&origin=MSN. 46
Akritas, M. G. 2000, �The central limit theorem under censoring�, Bernoulli, vol. 6,
no 6, doi :10.2307/3318473, p. 1109–1120, ISSN 1350-7265. URL http://dx.doi.
org/10.2307/3318473. 13
Akritas, M. G. et I. Van Keilegom. 2001, �Non-parametric estimation of the resi-
dual distribution�, Scand. J. Statist., vol. 28, no 3, doi :10.1111/1467-9469.00254,
p. 549–567, ISSN 0303-6898. URL http://dx.doi.org/10.1111/1467-9469.
00254. 9
Akritas, M. G. et I. Van Keilegom. 2003, �Estimation of bivariate and marginal
distributions with censored data�, J. R. Stat. Soc. Ser. B Stat. Methodol., vol. 65,
no 2, doi :10.1111/1467-9868.00396, p. 457–471, ISSN 1369-7412. URL http:
//dx.doi.org/10.1111/1467-9868.00396. 38
Andersen, P. K., Ø. Borgan, R. D. Gill et N. Keiding. 1993, Statistical models based
on counting processes, Springer Series in Statistics, Springer-Verlag, New York,
ISBN 0-387-97872-0, xii+767 p., doi :10.1007/978-1-4612-4348-9. URL http://
dx.doi.org/10.1007/978-1-4612-4348-9. 25
Andersen, P. K. et R. D. Gill. 1982, �Cox’s regression model for counting pro-
cesses : a large sample study�, Ann. Statist., vol. 10, no 4, p. 1100–1120, ISSN
0090-5364. URL http://links.jstor.org/sici?sici=0090-5364(198212)10:
4<1100:CRMFCP>2.0.CO;2-V&origin=MSN. 14, 25
Baudry, J.-P., C. Maugis et B. Michel. 2012, �Slope heuristics : over-
view and implementation�, Statistics and Computing, vol. 22, doi :10.1007/
s11222-011-9236-1, p. 455–470, ISSN 0960-3174. URL http://dx.doi.org/10.
1007/s11222-011-9236-1. 31
Beaudoin, D., T. Duchesne et C. Genest. 2007, �Improving the estimation of ken-
dall’s tau when censoring affects only one of the variables�, Computational Sta-
tistics Data Analysis, vol. 51, no 12, doi :http://dx.doi.org/10.1016/j.csda.2006.
09.044, p. 5743 – 5764, ISSN 0167-9473. URL http://www.sciencedirect.com/
science/article/pii/S0167947306003653. 45
64 Bibliographie
Beirlant, J. et Y. Goegebeur. 2003, �Regression with response distributions
of Pareto-type�, Comput. Statist. Data Anal., vol. 42, no 4, doi :10.1016/
S0167-9473(02)00120-2, p. 595–619, ISSN 0167-9473. URL http://dx.doi.org/
10.1016/S0167-9473(02)00120-2. 22
Beirlant, J. et Y. Goegebeur. 2004, �Local polynomial maximum likelihood es-
timation for Pareto-type distributions�, J. Multivariate Anal., vol. 89, no 1,
doi :10.1016/S0047-259X(03)00125-8, p. 97–118, ISSN 0047-259X. URL http:
//dx.doi.org/10.1016/S0047-259X(03)00125-8. 23
Bellman, R. 1961, �On the approximation of curves by line segments using dynamic
programming�, Commun. ACM, vol. 4, no 6, doi :10.1145/366573.366611, p. 284–
, ISSN 0001-0782. URL http://doi.acm.org/10.1145/366573.366611. 31
Beran, R. 1981, �Nonparametric regression with randomly censored survival data�,
cahier de recherche, University of California, Berkeley. 6, 9, 11, 38, 60
Bouaziz, O., S. Geffray et O. Lopez. 2012, �Semiparametric inference for the re-
current event process by means of a single-index model�, Preprint. 25, 27, 28,
29
Bouaziz, O. et O. Lopez. 2010, �Conditional density estimation in a censored single-
index regression model�, Bernoulli, vol. 16, no 2, doi :10.3150/09-BEJ221, p.
514–542, ISSN 1350-7265. URL http://dx.doi.org/10.3150/09-BEJ221. 17,
19, 20
Campbell, G. et A. Foldes. 1982, �Large-sample properties of nonparametric biva-
riate estimators with censored data�, dans Nonparametric statistical inference,
Vol. I, II (Budapest, 1980), Colloq. Math. Soc. Janos Bolyai, vol. 32, North-
Holland, Amsterdam, p. 103–121. 37
Carriere, J. F. 2000, �Bivariate survival models for coupled lives�, Scand. Actuar.
J., , no 1, doi :10.1080/034612300750066700, p. 17–32, ISSN 0346-1238. URL
http://dx.doi.org/10.1080/034612300750066700. 45
Cox, D. R. 1972, �Regression models and life-tables�, J. Roy. Statist. Soc. Ser. B,
vol. 34, p. 187–220, ISSN 0035-9246. With discussion by F. Downton, Richard
Peto, D. J. Bartholomew, D. V. Lindley, P. W. Glassborow, D. E. Barton, Su-
sannah Howard, B. Benjamin, John J. Gart, L. D. Meshalkin, A. R. Kagan, M.
Zelen, R. E. Barlow, Jack Kalbfleisch, R. L. Prentice and Norman Breslow, and
a reply by D. R. Cox. 14
Csorgo, M. et L. Horvath. 1997, Limit theorems in change-point analysis, Wiley
Series in Probability and Statistics, John Wiley & Sons Ltd., Chichester, ISBN
0-471-95522-1, xvi+414 p.. With a foreword by David Kendall. 32
Dabrowska, D. M. 1988, �Kaplan-Meier estimate on the plane�, Ann. Statist.,
vol. 16, no 4, p. 1475–1489, ISSN 0090-5364. 6, 38, 47, 52
Bibliographie 65
Dabrowska, D. M. 1989, �Uniform consistency of the kernel conditional
Kaplan-Meier estimate�, Ann. Statist., vol. 17, no 3, doi :10.1214/aos/
1176347261, p. 1157–1167, ISSN 0090-5364. URL http://dx.doi.org/10.1214/
aos/1176347261. 9, 11
Dabrowska, D. M. 1992, �Variable bandwidth conditional Kaplan-Meier estimate�,
Scand. J. Statist., vol. 19, no 4, p. 351–361, ISSN 0303-6898. 11
Deheuvels, P. 1979, �La fonction de dependance empirique et ses proprietes. Un test
non parametrique d’independance�, Acad. Roy. Belg. Bull. Cl. Sci. (5), vol. 65,
no 6, p. 274–292, ISSN 0001-4141. 49, 58
Delecroix, M., W. Hardle et M. Hristache. 2003, �Efficient estimation in condi-
tional single-index regression�, J. Multivariate Anal., vol. 86, no 2, doi :
10.1016/S0047-259X(02)00046-5, p. 213–226, ISSN 0047-259X. URL http://dx.
doi.org/10.1016/S0047-259X(02)00046-5. 17
Delecroix, M., M. Hristache et V. Patilea. 2006, �On semiparametric M -estimation
in single-index regression�, J. Statist. Plann. Inference, vol. 136, no 3, doi :
10.1016/j.jspi.2004.09.006, p. 730–769, ISSN 0378-3758. URL http://dx.doi.
org/10.1016/j.jspi.2004.09.006. 19
Delecroix, M., O. Lopez et V. Patilea. 2008, �Nonlinear censored regression using
synthetic data�, Scand. J. Statist., vol. 35, no 2, doi :10.1111/j.1467-9469.2007.
00591.x, p. 248–265, ISSN 0303-6898. URL http://dx.doi.org/10.1111/j.
1467-9469.2007.00591.x. 9
Du, Y. et M. G. Akritas. 2002, �Uniform strong representation of the conditional
Kaplan-Meier process�, Math. Methods Statist., vol. 11, no 2, p. 152–182, ISSN
1066-5307. 11, 12, 13
Efron, B. 1981, �Censored data and the bootstrap�, J. Amer. Statist. Assoc.,
vol. 76, no 374, p. 312–319, ISSN 0003-1291. URL http://links.jstor.org/
sici?sici=0162-1459(198106)76:374<312:CDATB>2.0.CO;2-2&origin=MSN.
46
Einmahl, U. et D. M. Mason. 2005, �Uniform in bandwidth consistency of
kernel-type function estimators�, Ann. Statist., vol. 33, no 3, doi :10.1214/
009053605000000129, p. 1380–1403, ISSN 0090-5364. URL http://dx.doi.org/
10.1214/009053605000000129. 21, 23
Fermanian, J.-D., D. Radulovic et M. Wegkamp. 2004, �Weak convergence of empi-
rical copula processes�, Bernoulli, vol. 10, no 5, doi :10.3150/bj/1099579158, p.
847–860, ISSN 1350-7265. URL http://dx.doi.org/10.3150/bj/1099579158.
60
Frees, E. W. et E. A. Valdez. 1998, �Understanding relationships using copulas�,
N. Am. Actuar. J., vol. 2, no 1, p. 1–25, ISSN 1092-0277. 36, 45
66 Bibliographie
Gannoun, A., J. Saracco, A. Yuan et G. E. Bonney. 2005, �Non-parametric quantile
regression with censored data�, Scand. J. Statist., vol. 32, no 4, doi :10.1111/j.
1467-9469.2005.00456.x, p. 527–550, ISSN 0303-6898. URL http://dx.doi.org/
10.1111/j.1467-9469.2005.00456.x. 9
Genest, C., J.-F. Quessy et B. Remillard. 2006, �Goodness-of-fit procedures for co-
pula models based on the probability integral transformation�, Scand. J. Statist.,
vol. 33, no 2, doi :10.1111/j.1467-9469.2006.00470.x, p. 337–366, ISSN 0303-6898.
URL http://dx.doi.org/10.1111/j.1467-9469.2006.00470.x. 48
Genest, C. et L.-P. Rivest. 1993, �Statistical inference procedures for bivariate Ar-
chimedean copulas�, J. Amer. Statist. Assoc., vol. 88, no 423, p. 1034–1043, ISSN
0162-1459. URL http://links.jstor.org/sici?sici=0162-1459(199309)88:
423<1034:SIPFBA>2.0.CO;2-G&origin=MSN. 47, 48
Genest, C., B. Remillard et D. Beaudoin. 2009, �Goodness-of-fit tests for co-
pulas : A review and a power study�, Insurance : Mathematics and Econo-
mics, vol. 44, no 2, doi :http://dx.doi.org/10.1016/j.insmatheco.2007.10.005, p.
199 – 213, ISSN 0167-6687. URL http://www.sciencedirect.com/science/
article/pii/S0167668707001205. 48
Ghosh, D. et D. Y. Lin. 2003, �Semiparametric analysis of recurrent events data
in the presence of dependent censoring�, Biometrics, vol. 59, no 4, doi :10.1111/
j.0006-341X.2003.00102.x, p. 877–885, ISSN 0006-341X. URL http://dx.doi.
org/10.1111/j.0006-341X.2003.00102.x. 25, 27
Gijbels, I. et N. Veraverbeke. 1991, �Almost sure asymptotic representation for
a class of functionals of the Kaplan-Meier estimator�, Ann. Statist., vol. 19,
no 3, doi :10.1214/aos/1176348256, p. 1457–1470, ISSN 0090-5364. URL http:
//dx.doi.org/10.1214/aos/1176348256. 6, 13
Gill, R. 1983, �Large sample behaviour of the product-limit estimator on the whole
line�, Ann. Statist., vol. 11, no 1, doi :10.1214/aos/1176346055, p. 49–58, ISSN
0090-5364. URL http://dx.doi.org/10.1214/aos/1176346055. 6, 13
Gill, R. D., M. J. van der Laan et J. A. Wellner. 1995, �Inefficient estimators of
the bivariate survival function for three models�, Ann. Inst. H. Poincare Probab.
Statist., vol. 31, p. 547–597. 38
Gribkova, S. et O. Lopez. 2013, �Empirical copula under random censoring�, Pre-
print. URL http://hal.archives-ouvertes.fr/hal-00817262. 58, 59, 60
Gribkova, S., O. Lopez et P. Saint-Pierre. 2013, �A simplified model for
studying bivariate mortality under right-censoring�, Journal of Multivariate
Analysis, vol. 115, no 0, doi :10.1016/j.jmva.2012.10.005, p. 181 – 192,
ISSN 0047-259X. URL http://www.sciencedirect.com/science/article/
pii/S0047259X1200228X. 41, 44, 45, 47, 48, 49, 60
Bibliographie 67
Hanley, J. A. et M. N. Parnes. 1983, �Nonparametric estimation of a multivariate
distribution in the presence of censoring�, Biometrics, vol. 39, no 1, doi :10.
2307/2530813, p. 129–139, ISSN 0006-341X. URL http://dx.doi.org/10.2307/
2530813. 37
Hardle, W., P. Hall et H. Ichimura. 1993, �Optimal smoothing in single-index mo-
dels�, Ann. Statist., vol. 21, no 1, doi :10.1214/aos/1176349020, p. 157–178, ISSN
0090-5364. URL http://dx.doi.org/10.1214/aos/1176349020. 15, 19
Herskind, A. M., M. McGue, N. V. Holm, T. I. Sorensen, B. Harvald et J. W.
Vaupel. 1996, �The heritability of longevity : a population-based study of 2872
danish twin pairs born 1870-1900�, Hum. Genet., vol. 97, p. 319–323. 36
Heuchenne, C. et I. Van Keilegom. 2010a, �Estimation in nonparametric location-
scale regression models with censored data�, Ann. Inst. Statist. Math., vol. 62,
no 3, doi :10.1007/s10463-009-0219-3, p. 439–463, ISSN 0020-3157. URL http:
//dx.doi.org/10.1007/s10463-009-0219-3. 13
Heuchenne, C. et I. Van Keilegom. 2010b, �Goodness-of-fit tests for the error dis-
tribution in nonparametric regression�, Comput. Statist. Data Anal., vol. 54,
no 8, doi :10.1016/j.csda.2010.02.010, p. 1942–1951, ISSN 0167-9473. URL http:
//dx.doi.org/10.1016/j.csda.2010.02.010. 13
Holford, T. 1980, �The analysis of rates of survivorship using log-linear models�,
Biometrics, vol. 36, p. 299–305. 30
Ichimura, H. 1993, �Semiparametric least squares (SLS) and weighted SLS esti-
mation of single-index models�, J. Econometrics, vol. 58, no 1-2, doi :10.1016/
0304-4076(93)90114-K, p. 71–120, ISSN 0304-4076. URL http://dx.doi.org/
10.1016/0304-4076(93)90114-K. 15, 19
Jackson, B., J. Scargle, D. Barnes, S. Arabhi, A. Alt, P. Gioumousis, E. Gwin,
P. Sangtrakulcharoen, L. Tan et T. T. Tsai. 2005, �An algorithm for optimal
partitioning of data on an interval�, Signal Processing Letters, IEEE, vol. 12,
no 2, doi :10.1109/LSP.2001.838216(410)12, p. 105 – 108, ISSN 1070-9908. 31
Kaplan, E. L. et P. Meier. 1958, �Nonparametric estimation from incomplete ob-
servations�, J. Amer. Statist. Assoc., vol. 53, p. 457–481, ISSN 0162-1459. 6
van der Laan, M. J. 1996, �Efficient estimation in the bivariate censoring model and
repairing NPMLE�, Ann. Statist., vol. 24, no 2, doi :10.1214/aos/1032894454, p.
596–627, ISSN 0090-5364. URL http://dx.doi.org/10.1214/aos/1032894454.
38
Lebarbier, E. 2005, �Detecting multiple change-points in the mean of gaussian
process by model selection�, Signal Process., vol. 85, no 4, doi :10.1016/j.sigpro.
2004.11.012, p. 717–736, ISSN 0165-1684. URL http://dx.doi.org/10.1016/
j.sigpro.2004.11.012. 32
68 Bibliographie
Li, Y., R. C. Tiwari et S. Guha. 2007, �Mixture cure survival models with dependent
censoring�, J. R. Stat. Soc. Ser. B Stat. Methodol., vol. 69, no 3, doi :10.1111/j.
1467-9868.2007.00589.x, p. 285–306, ISSN 1369-7412. URL http://dx.doi.org/
10.1111/j.1467-9868.2007.00589.x. 8
Lin, D. Y., L. J. Wei, I. Yang et Z. Ying. 2000, �Semiparametric regression for
the mean and rate functions of recurrent events�, J. R. Stat. Soc. Ser. B Stat.
Methodol., vol. 62, no 4, doi :10.1111/1467-9868.00259, p. 711–730, ISSN 1369-
7412. URL http://dx.doi.org/10.1111/1467-9868.00259. 25, 27
Lopez, O. 2007, Reduction de dimension en presence de donnees censurees, These
de doctorat, Universite Rennes 1, Rennes, ISBN 0-387-98873-4, xviii+542 p.. 1
Lopez, O. 2009, �Single-index regression models with right-censored responses�,
J. Statist. Plann. Inference, vol. 139, no 3, doi :10.1016/j.jspi.2008.06.012, p.
1082–1097, ISSN 0378-3758. URL http://dx.doi.org/10.1016/j.jspi.2008.
06.012. 9, 16, 17, 18, 20
Lopez, O. 2011, �Nonparametric estimation of the multivariate distribution func-
tion in a censored regression model with applications�, Communications in Sta-
tistics : Theory and Methods, vol. 40, no 15, p. 2639–2660. 2, 10, 11, 12, 13
Lopez, O. 2012, �A generalization of the kaplana“meier estimator for analy-
zing bivariate mortality under right-censoring and left-truncation with appli-
cations in model-checking for survival copula models�, Insurance : Mathema-
tics and Economics, vol. 51, no 3, doi :10.1016/j.insmatheco.2012.07.009, p.
505 – 516, ISSN 0167-6687. URL http://www.sciencedirect.com/science/
article/pii/S0167668712000881. 52, 55, 56, 57
Lopez, O. et A. Oueslati. 2013, �A proportional hazards regression model with
change-points in the baseline function�, Lifetime Data Analysis, vol. 19, doi :10.
1007/s10985-012-9231-7, p. 59–78, ISSN 1380-7870. URL http://dx.doi.org/
10.1007/s10985-012-9231-7. 26, 29, 31
Lopez, O. et V. Patilea. 2009, �Nonparametric lack-of-fit tests for parametric mean-
regression models with censored data�, J. Multivariate Anal., vol. 100, no 1, doi :
10.1016/j.jmva.2008.04.008, p. 210–230, ISSN 0047-259X. URL http://dx.doi.
org/10.1016/j.jmva.2008.04.008. 9
Lopez, O., V. Patilea et I. Van Keilegom. 2013, �Single-index regression models in
the presence of censoring depending on the covariates�, Bernoulli, vol. to appear.
10, 13, 14, 19, 20, 21
Lopez, O. et P. Saint Pierre. 2011, �Bivariate censored regression relying on a
new estimator of the joint distribution function�, Preprint. URL http://hal.
archives-ouvertes.fr/hal-00584379/fr/. 39, 43, 45
Bibliographie 69
Luciano, E., J. Spreeuw et E. Vigna. 2008, �Modelling stochastic mortality for
dependent lives�, Insurance Math. Econom., vol. 43, no 2, doi :10.1016/j.
insmatheco.2008.06.005, p. 234–244, ISSN 0167-6687. URL http://dx.doi.org/
10.1016/j.insmatheco.2008.06.005. 36
Luciano, E., J. Spreeuw et E. Vigna. 2012, �Evolution of coupled lives’ dependency
across generations and pricing impact�, Preprint. 60
Major, P. 2006, �An estimate on the supremum of a nice class of stochastic integrals
and U -statistics�, Probab. Theory Related Fields, vol. 134, no 3, doi :10.1007/
s00440-005-0440-9, p. 489–537, ISSN 0178-8051. URL http://dx.doi.org/10.
1007/s00440-005-0440-9. 12
Nelsen, R. B. 2006, An introduction to copulas, 2e ed., Springer Series in Statistics,
Springer, New York, ISBN 978-0387-28659-4 ; 0-387-28659-4, xiv+269 p.. 47, 49
Omelka, M., I. Gijbels et N. Veraverbeke. 2009, �Improved kernel estimation of
copulas : weak convergence and goodness-of-fit testing�, Ann. Statist., vol. 37,
no 5B, doi :10.1214/08-AOS666, p. 3023–3058, ISSN 0090-5364. URL http://
dx.doi.org/10.1214/08-AOS666. 60
Othus, M., Y. Li et R. C. Tiwari. 2009, �A class of semiparametric mixture cure
survival models with dependent censoring�, J. Amer. Statist. Assoc., vol. 104,
no 487, doi :10.1198/jasa.2009.tm08033, p. 1241–1250, ISSN 0162-1459. URL
http://dx.doi.org/10.1198/jasa.2009.tm08033. 8
Prentice, R. L. et J. Cai. 1992, �Covariance and survivor function estimation
using censored multivariate failure time data�, Biometrika, vol. 79, no 3, doi :
10.1093/biomet/79.3.495, p. 495–512, ISSN 0006-3444. URL http://dx.doi.
org/10.1093/biomet/79.3.495. 38
Prentice, R. L., B. J. Williams et A. V. Peterson. 1981, �On the regression
analysis of multivariate failure time data�, Biometrika, vol. 68, no 2, doi :
10.1093/biomet/68.2.373, p. 373–379, ISSN 0006-3444. URL http://dx.doi.
org/10.1093/biomet/68.2.373. 25
Pruitt, R. C. 1991a, �On negative mass assigned by the bivariate Kaplan-Meier
estimator�, Ann. Statist., vol. 19, no 1, doi :10.1214/aos/1176347992, p. 443–
453, ISSN 0090-5364. URL http://dx.doi.org/10.1214/aos/1176347992. 38
Pruitt, R. C. 1991b, �Strong consistency of self-consistent estimators : general
theory and an application to bivariate survival analysis�, cahier de recherche
543, University of Minnesota, Minneapolis. 38
Reid, N. 1981, �Estimating the median survival time�, Biometrika, vol. 68, no 3,
doi :10.1093/biomet/68.3.601, p. 601–608, ISSN 0006-3444. URL http://dx.
doi.org/10.1093/biomet/68.3.601. 46
70 Bibliographie
Salmenkivi, M. et H. Mannila. 2005, �Using markov chain monte carlo and dynamic
programming for event sequence data�, Knowl. Inf. Syst., vol. 7, no 3, doi :
10.1007/s10115-004-0157-6, p. 267–288, ISSN 0219-1377. URL http://dx.doi.
org/10.1007/s10115-004-0157-6. 31
Sanchez Sellero, C., W. Gonzalez Manteiga et I. Van Keilegom. 2005, �Uniform
representation of product-limit integrals with applications�, Scand. J. Statist.,
vol. 32, no 4, doi :10.1111/j.1467-9469.2005.00453.x, p. 563–581, ISSN 0303-6898.
URL http://dx.doi.org/10.1111/j.1467-9469.2005.00453.x. 9, 13
Schnedler, W. 2005, �Likelihood estimation for censored random vectors�, Eco-
nometric Rev., vol. 24, no 2, doi :10.1081/ETC-200067925, p. 195–217, ISSN
0747-4938. URL http://dx.doi.org/10.1081/ETC-200067925. 17
Sherman, R. P. 1993, �The limiting distribution of the maximum rank correlation
estimator�, Econometrica, vol. 61, no 1, doi :10.2307/2951780, p. 123–137, ISSN
0012-9682. URL http://dx.doi.org/10.2307/2951780. 21
Sherman, R. P. 1994, �Maximal inequalities for degenerate U -processes with
applications to optimization estimators�, Ann. Statist., vol. 22, no 1, doi :
10.1214/aos/1176325377, p. 439–459, ISSN 0090-5364. URL http://dx.doi.
org/10.1214/aos/1176325377. 21
Shih, J. H. et T. A. Louis. 1995, �Inferences on the association parameter in
copula models for bivariate survival data�, Biometrics, vol. 51, no 4, doi :
10.2307/2533269, p. 1384–1399, ISSN 0006-341X. URL http://dx.doi.org/10.
2307/2533269. 41, 47
Sklar, M. 1959, �Fonctions de repartition a n dimensions et leurs marges�, Publ.
Inst. Statist. Univ. Paris, vol. 8, p. 229–231. 47
Smith, R. L. 1987, �Estimating tails of probability distributions�, Ann. Statist.,
vol. 15, no 3, doi :10.1214/aos/1176350499, p. 1174–1207, ISSN 0090-5364. URL
http://dx.doi.org/10.1214/aos/1176350499. 22
Stute, W. 1993, �Consistent estimation under random censorship when covariables
are present�, J. Multivariate Anal., vol. 45, no 1, doi :10.1006/jmva.1993.1028, p.
89–103, ISSN 0047-259X. URL http://dx.doi.org/10.1006/jmva.1993.1028.
6, 8, 9, 17, 40
Stute, W. 1995, �The central limit theorem under random censorship�, Ann. Sta-
tist., vol. 23, no 2, doi :10.1214/aos/1176324528, p. 422–439, ISSN 0090-5364.
URL http://dx.doi.org/10.1214/aos/1176324528. 6, 13, 43
Stute, W. 1996, �Distributional convergence under random censorship when cova-
riables are present�, Scand. J. Statist., vol. 23, no 4, p. 461–471, ISSN 0303-6898.
6, 9
Bibliographie 71
Stute, W. 1999, �Nonlinear censored regression�, Statist. Sinica, vol. 9, no 4, p.
1089–1102, ISSN 1017-0405. 9
Stute, W. et J.-L. Wang. 1993, �The strong law under random censorship�, Ann.
Statist., vol. 21, no 3, doi :10.1214/aos/1176349273, p. 1591–1607, ISSN 0090-
5364. URL http://dx.doi.org/10.1214/aos/1176349273. 6, 8
Tsai, W.-Y., N. P. Jewell et M.-C. Wang. 1987, �A note on the product-limit
estimator under right censoring and left truncation�, Biometrika, vol. 74, no 4,
p. 883–886. 52
Tsai, W.-Y., S. Leurgans et J. Crowley. 1986, �Nonparametric estimation of a
bivariate survival function in the presence of censoring�, Ann. Statist., vol. 14,
no 4, doi :10.1214/aos/1176350162, p. 1351–1365, ISSN 0090-5364. URL http:
//dx.doi.org/10.1214/aos/1176350162. 38
van der Vaart, A. W. et J. A. Wellner. 1996, Weak convergence and empirical
processes with applications to statistics, Springer Series in Statistics, Springer-
Verlag, New York, ISBN 0-387-94640-3, xvi+508 p.. 13, 21, 33
Van Keilegom, I. et M. G. Akritas. 1999, �Transfer of tail information in
censored regression models�, Ann. Statist., vol. 27, no 5, doi :10.1214/aos/
1017939150, p. 1745–1784, ISSN 0090-5364. URL http://dx.doi.org/10.1214/
aos/1017939150. 6, 9, 11
Van Keilegom, I., J. de Una-Alvarez et L. Meira-Machado. 2011, �Nonparametric
location-scale models for censored successive survival times�, J. Statist. Plann.
Inference, vol. 141, no 3, doi :10.1016/j.jspi.2010.09.010, p. 1118–1131, ISSN 0378-
3758. URL http://dx.doi.org/10.1016/j.jspi.2010.09.010. 13
Wang, M.-C. 1991, �Nonparametric estimation from cross-sectional survival data�,
Journal of the American Statistical Association, vol. 86, no 413, p. pp. 130–143,
ISSN 01621459. URL http://www.jstor.org/stable/2289722. 36
Wang, W. et M. T. Wells. 1997, �Nonparametric estimators of the bivariate survival
function under simplified censoring conditions�, Biometrika, vol. 84, no 4, doi :10.
1093/biomet/84.4.863, p. 863–880, ISSN 0006-3444. URL http://dx.doi.org/
10.1093/biomet/84.4.863. 36, 40
Wang, W. et M. T. Wells. 2000, �Model selection and semiparametric inference
for bivariate failure-time data�, J. Amer. Statist. Assoc., vol. 95, no 449, p. 62–
76, ISSN 0162-1459. With a comment by Edsel A. Pena and a rejoinder by the
authors. 47, 48
Xia, Y. et W. K. Li. 1999, �On single-index coefficient regression models�, J. Amer.
Statist. Assoc., vol. 94, no 448, doi :10.2307/2669941, p. 1275–1285, ISSN 0162-
1459. URL http://dx.doi.org/10.2307/2669941. 15
72 Bibliographie
Xia, Y., H. Tong et W. K. Li. 1999, �On extended partially linear single-index
models�, Biometrika, vol. 86, no 4, doi :10.1093/biomet/86.4.831, p. 831–842,
ISSN 0006-3444. URL http://dx.doi.org/10.1093/biomet/86.4.831. 15
Youn, H. et A. Shemyakin. 1999, �Statistical aspects of joint life insurance pricing�,
Proceedings of the business and statistics section of the American Statistical As-
sociation, p. 34–38, ISSN 8. 36
Youn, H. et A. Shemyakin. 2001, �Pricing practices for joint last survivor insu-
rance�, Actuarial Research Clearing House. 36