Variations spatiales et spatio-temporelles de l’incidence des LA de
l’enfant en France – 1990-2003
Journées du GDR « statistique et santé »
26-27 novembre 2007Hôpital Cochin – Paris 14
Stéphanie BELLEC – Jacqueline CLAVEL
Inserm U754
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 2
Les cancers de l’enfant
• En France :– 1 enfant sur 500 est atteint avant l’âge de 15 ans
– 1500 nouveaux cas par an (la moitié avant 6 ans)
– 2ème cause de mortalité infantile
Source : Registre National des Tumeurs Solides de l’Enfant
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 3
Enregistrement des cancers de l’enfant
• Deux registres à l’échelle nationale– Le Registre National des Hémopathies malignes de l’Enfant
(RNHE)
• http://www.u754.idf.inserm.fr/
• Créé en 1995 (U170/U754)
• Enregistrement des cas diagnostiqués depuis 1990 chez des enfants âgés de moins de 15 ans et résidant en France métropolitaine au moment du diagnostic
– Le Registre National des Tumeurs Solides de l’Enfant (RNTSE)
• http://www.chu-nancy.fr/rntse/
• Créé en 2000
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 4
Les leucémies aiguës de l’enfant
• Environ 40 cas par million d’enfants et par an
• 80% des leucémies aiguës sont des leucémies aiguës
lymphoblastiques (LAL), dont une majorité de LAL
communes de la lignée B (LALBc)
• <20% de leucémies aiguës myéloblastiques (LAM)
• Les LAL présentent un pic d’incidence autour de 2 ans
• Les LAM ont une incidence plus élevée avant un an
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 5
Facteurs de risque des LA
• Peu de facteurs de risque établis– Rayonnements ionisants à forte dose
– Certains traitements anti-cancéreux
– Certains syndromes génétiques
• Nombreuses pistes– Expositions environnementales in utero ou dans la petite
enfance (CEM-EBF, pesticides, tabagisme passif, consommation maternelle de tabac et d’alcool pendant la grossesse, agents infectieux ...)
– Facteurs génétiques prédisposants
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 6
Le problème particulier des clusters
• Premiers signalements au début du 20ème siècle
• Cas de leucémies signalés au sein d’une population restreinte sur une période de temps assez courte
→ Hypothèse : présence d’un agent infectieux ?
→ Aucune information sur la population à risque
• 1960 : premier rapport statistique : tendance des LA à apparaître sous formes de petits groupes
• Depuis, de nombreuses études sur l’hétérogénéité spatiale et spatio-temporelle ont été réalisées
→ Légère tendance à l’agrégation spatio-temporelle
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 7
Objectif de l’étude
• Étude des variations spatiales et spatio-temporelles des LA de l’enfant en France, sur la période 1990-2003
• Deux approches :– «clustering » : recherche d’une hétérogénéité globale
• Hétérogénéité spatiale globale (tests de Potthoff-Whittinghill et de Rogerson)
• Interaction spatio-temporelle (test de Knox)
– « détection de cluster » : localisation d’une zone/période à plus fort risque de LA
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 8
Données
• 6281 cas de leucémies aiguës (LA) sur la période 1990-2003
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
0,0 2,0 4,0 6,0 8,0 10,0 12,0 14,0
TI (
*1E
6/an
)
LAL
LALBc
LAM
LA
< 1 an 1-4 ans 5-9 ans 10-14 ans
Les cas sont rattachés à leur commune de résidence au moment du diagnostic
Nb. cas
LAL 5 122 (82%)
LALBc 4 092 (65%)
LAM 1 069 (17%)
Autre LA 90 (1,4%)
LA 6 281
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 9
Méthodes – Notations
• Oi le nombre de cas observés dans la commune i
(O le nombre total de cas observés)
• Ei le nombre de cas attendus, dans la commune i, sous l’hypothèse de non hétérogénéité spatiale de l’incidence des LA
(E le nombre total de cas attendus)
• m le nombre d’unités géographiques considérées (36344 communes ou 3644 cantons)
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 10
Méthodes – Hétérogénéité globale (1)
• Hétérogénéité spatiale globale– Test de surdispersion (Potthoff-Whittinghill)
Hypothèse: Oi suit une loi binomiale négative V(Oi)/E(Oi) = 1+β
– Test d’hétérogénéité spatiale globale (Rogerson)
m
i i
ii OE
OOA
1
)1(1*
2
1 et
O
OmC
)1(*)1(*
2
1
m
i
m
ijj ji
jjiiij
m
i i
ii
pp
prprw
p
prR
1 11
)(*)()²(avec
O
Or ii ,
E
Ep ii
C
A
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 11
Méthodes – Hétérogénéité globale (2)
• Interaction spatio-temporelle (test de Knox)– Sous H0 (absence d’interaction), la survenue des cas dans
l’espace est indépendante de leur survenue dans le temps
– Statistique de test basée sur les nombres, observés et attendus, de paires de cas proches dans l’espace et dans le temps ( te
ObsP , et teAttP
, )
etotPttotP
: nombre total observé de paires de cas proches dans l’espace
: nombre total observé de paires proches dans le temps.
teAtt
teAtt
teObs
P
PPS
,
,, )( avec t
tot
etotte
Att POO
PP *
2/)1(,
Paramètres de proximité : - espace (communes de résidence au diag) : 0, 5, 10, 15, 20, 30, 50 km- temps (dates de diag) : 1, 3, 6, 9, 12 mois
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 12
Méthodes – Détection de clusters (1)
• Test de Kulldorff– Le territoire est parcouru par une fenêtre mobile circulaire, pour
la détection de clusters spatiaux, ou cylindrique, pour la détection de clusters spatio-temporels.
– Fenêtre centrée sur une commune, de taille variable
– Tailles limites (dans l’espace et le temps) fixées arbitrairement (espace :10% de la population, temps : 50%)
y
x x
y
t
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 13
Méthodes – Détection de clusters (2)
• A chaque fenêtre est associée une zone z composée des communes dont les centres sont inclus dans la fenêtre
• Pour chaque zone, rapport de vraisemblance sous l’hypothèse d’une distribution poissonnienne des cas, avec un risque p à l’intérieur de la zone, q à l’extérieur
• Localisation de la zone de cluster la plus probable définie par:
0
1 )(max
L
zLz
=
z
z
z
z
oO
z
z
o
z
z
z eE
oO
e
o
eE
oO
e
ozz
1max
oz et ez les nombres de cas observés et attendus dans la zone z
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 14
Simulations de Monte Carlo (1)
• P-values déterminées par simulations sous H0
• A chaque simulation, répartition du nombre total de cas LA dans les communes à l’aide d’une distribution multinomiale de paramètres Ei/E (Tests de Potthoff-Whittinghill, Rogerson, Kulldorff version spatiale)
OU
• A chaque simulation, permutations des dates de diagnostic (conservation des structures spatiale et temporelle observées)
(Tests de Knox, Kulldorff version spatio-temporelle)
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 15
Simulations de Monte Carlo (2)
• Pour chaque jeu de données simulé, calcul de la statistique de test Sk
p-value =
K
SS obsk
K
k
1
1
Sobs : valeur de la statistique calculée sur les données observées
K : Nombre de simulations réalisées
1{..} : fonction indicatrice
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 16
Etapes d’analyses
• Analyse sur l’ensemble des données (LA, 0-14 ans, 1990-2003)
• Analyse par diagnostic (LAL, LALBc, LAM)
• Analyse par groupe d’âges (0-4 ans, 5-9 ans, 10-14 ans, 1-6 ans)
• Analyses sur 3 sous-périodes (1990-1994, 1995-1999, 2000-2003)
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 17
Résultats – Hétérogénéité globale (1)
• Test de Potthoff-Whittinghill sur 1990-2003
Période LA LAL LALBc LAM
âge au diagnostic O β (p-value) O β (p-value) O β (p-value) O β (p-value)
0-14 ans 6 281 0,3% (0,33) 5 122 0,4% (0,29) 4 092 0,4% (0,26) 1 069 -0,8% (0,92)
0-4 ans 3 137 -0,1% (0,52) 2 599 0,0% (0,43) 2 325 0,4% (0,24)
5-9 ans 1 842 0,9% (0,91) 1 558 -0,8% (0,91) 1 114 -0,5% (0,74)
10-14 ans 1 300 0,9% (0,11) 963 1,5% (0,03) 652 -0,8% (0,95)
1-6 ans 3 725 0,1% (0,43) 3 234 0,0% (0,42) 2 780 0,3% (0,33)
Quel que soit le diagnostic, quel que soit l’âge, aucune surdispersion mise en évidence sur la période 1990-2003
m
i i
ii OE
OOA
1
)1(1*
2
1 et
O
OmC
)1(*)1(*
2
1
C
A
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 18
Résultats – Hétérogénéité globale (2)
• Test de Potthoff-Whittinghill par périodes (LA)
Période 1990-2003 1990-1994 1995-1999 2000-2003
âge au diagnostic O β (p-value) O β (p-value) O β (p-value) O β (p-value)
0-14 ans 6 281 0,3% (0,33) 2 234 1,3% (0,05) 2 227 0,7% (0,14) 1 820 -0,8% (0,88)
0-4 ans 3 137 -0,1% (0,52) 1 138 0,5% (0,21) 1 108 -0,5% (0,79) 891 -0,4% (0,66)
5-9 ans 1 842 -0,9% (0,91) 668 -0,3% (0,55) 660 0,1% (0,29) 514 -0,3% (0,57)
10-14 ans 1 300 0,9% (0,11) 427 -0,1% (0,50) 459 -0,3% (0,57) 414 -0,1% (0,44)
1-6 ans 3 725 0,1% (0,43) 1 368 0,5% (0,20) 1 309 -0,5% (0,71) 1 048 -0,5% (0,75)
Légère surdispersion sur la période 1990-1994, pour les 0-14 ans uniquement (retrouvée pour les LAL et LALBc)
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 19
Résultats – Hétérogénéité globale (3)
• Tests de Rogerson sur la période 1990-2003
Période LA LAL LALBc LAM
âge au diagnostic
O R (p-value) O R (p-value) O R (p-value) O R (p-value)
0-14 ans 6 254 0,62 (0,26) 5 100 0,75 (0,30) 4 073 0,97 (0,26) 1 064 3,02 (0,77)
0-4 ans 3 123 1,25 (0,26) 2 587 1,46 (0,37) 2 314 1,62 (0,39)
5-9 ans 1 834 2,07 (0,35) 1 552 2,39 (0,40) 1 109 3,77 (0,14)
10-14 ans 1 297 2,80 (0,46) 961 3,53 (0,63) 650 5,66 (0,37)
1-6 ans 3 710 0,91 (0,64) 3 220 1,10 (0,50) 2 767 1,23 (0,59)
m
i
m
ijj ji
jjiiij
m
i i
ii
pp
prprw
p
prR
1 11
)(*)()²(avec
O
Or ii ,
E
Ep ii
Quel que soit le diagnostic, quel que soit l’âge, aucune hétérogénéité spatiale mise en évidence globalement sur la période 1990-2003
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 20
Résultats – Hétérogénéité globale (4)
• Tests de Rogerson par périodes
Période 1990-2003 1990-1994 1995-1999 2000-2003
âge au diagnostic
O R P-value O R p-value O R p-value O R p-value
0-14 ans 6 254 0,62 (0,26) 2 224 1,83 (0,18) 2 216 1,42 (0,78) 1 814 2,54 (0,05)
0-4 ans 3 123 1,25 (0,26) 1 134 4,38 (0,02) 1 102 3,09 (0,61) 887 3,58 (0,28)
5-9 ans 1 834 2,07 (0,35) 664 4,73 (0,79) 657 6,55 (0,11) 513 7,77 (0,23)
10-14 ans 1 297 2,80 (0,46) 426 9,24 (0,26) 457 6,38 (0,89) 414 8,82 (0,44)
1-6 ans 3 710 0,91 (0,64) 1 362 3,33 (0,05) 1 304 2,16 (0,92) 1 044 3,39 (0,49)
• Hétérogénéité spatiale sur la période 1990-1994, pour les plus jeunes enfants (retrouvée pour les LAL et LALBc)
• et sur 2000-2003 pour les 0-14 ans uniquement (et LAL)
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 21
Résultats – Interaction spatio-temporelle
• Test de Knox
teAtt
teAtt
teObs
P
PPS
,
,, )( avec t
tot
etotte
Att POO
PP *
2/)1(,
0-14 ans : aucune interaction mise en évidence
0-4 ans : 3 mois – 15 et 30 km (+ LAL et LALBC et retrouvée sur 1995-99)
5-9 ans : uniquement pour les LALBc (et sur 2000-2003)
10-14 ans : 9 et 12 mois – 0 et 5 km (+ LAL et retrouvée sur 1990-94)
LAM 0-14 ans : interaction significative (1 à 12 mois – 15 et 20 km)
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 22
Résultats – Détection de clusters (1)
• Test de Kulldorff1990-2003 1995-1999
LA 0-14 0-4 5-9 10-14 0-14 0-4 5-9 10-14
Analyses spatiales
NS 1 60 30 1 442 8 554 2
OS 5 14 5 2 76 2 35 2
ES0,35 3,37 0,24 <0,01 39,2 0,02 13,2 0,01
PS 0,96 0,67 0,34 0,24 0,02 1,00 0,04 0,80
Analyses spatio-temp.
NST442 833 1344 886
T 1996-99 1998 1996-99 1993
OST 65 9 50 5
EST 31,7 1,54 25,9 0,41
PST 0,78 0,71 0,40 0,57
LAM 0-14 0-4 5-9 10-14 0-14 0-4 5-9 10-14
Analyses spatiales
NS142 1077 87 24 3994 3462 504 20
OS12 20 3 4 50 24 9 3
ES2,45 6,77 0,11 0,24 24,85 8,75 1,76 0,07
PS0,51 0,70 0,96 0,92 0,20 0,34 0,69 0,59
Analyses spatio-temp.
Nst 4302 645 913 2712
T 1994-97 1992 1996-98 1995 OST
44 5 11 5
EST19,18 0,58 2,21 0,43
PST0,83 0,81 0,01 0,16
- Deux clusters de LA sur 1995-99, 0-14 ans et 5-9 ans
- Aucun cluster de LAL significatif
- Un cluster de LAM, 5-9 ans sur 1996-1998
→ clusters « emboîtés »
→ cluster de LAM 5-9 ans sur 96-98 (11 cas, 2,21 attendus)
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 23
Résultats – Détection de clusters (2)
Représentation du cluster de cas de LAM observé sur la période 1996-1998
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 24
Synthèse des résultats
• Très légère hétérogénéité des LA sur la période 1990-1994 (LALBc, plus jeunes enfants)
• Interaction spatio-temporelle des LAL 0-4 ans, 5-9 ans et 10-14 ans, ainsi que pour les cas de LAM. Mais résultats instables selon les périodes
• Cluster de cas de LA de 5-9 ans sur la période 1995-1999 (pas d’hypothèse actuellement)
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 25
Critiques
• Méthodes soumises à des limites importantes– PW : contribution des communes ayant au moins deux cas
– Knox : Forte influence de l’évolution de la population au cours du temps. Test adapté à une application à l’échelle individuelle
• Multiplicité des tests– 4 familles de diagnostic, 5 groupe d’âges, 4 périodes
– Paramètres de proximités définis arbitrairement
→ Augmentation du risque de faux-positifs
Journées du GDR « Statistiques et santé » - 26-27 novembre 2007 26
Conclusion
• Concordance avec la littérature concernant l’existence d’une hétérogénéité spatiale des LA (en particulier LALBc) MAIS de très faible amplitude
• Résultats à approfondir– Données plus précises (adresses des cas)
– Echelle géographique différente ?
– Autres méthodes ?