Upload
joie
View
51
Download
9
Embed Size (px)
DESCRIPTION
Intérêt et principes des analyses multivariées. FRT C7. Analyse multivariée par opposition à univariée en complément d’une analyse univariée. Rappel sur l’analyse univariée. Analyse univariée : relation entre 2 variables Principe : Hypothèse nulle d ’indépendance (H0) - PowerPoint PPT Presentation
Citation preview
Intérêt et principes des analyses multivariées
FRT C7
Analyse multivariée
par opposition à univariée
en complément d’une analyse univariée
Rappel sur l’analyse univariée
Analyse univariée : relation entre 2 variables– Principe :
• Hypothèse nulle d ’indépendance (H0)
• Hypothèse alternative de relation (H1)
– entre une variable dépendante, à expliquer et une variable expliquante
– Quantification de la différence entre l’observation et la théorie sous l’hypothèse nulle
– test statistique dépend du type de variable
Principaux tests d ’analyse univariée
• 2 variables qualitatives (catégorielles)– guérison oui/non vs traitement A/B
– test du chi² ou test exact de Fisher
Principaux tests d ’analyse univariée
• 2 variables qualitatives (catégorielles)– guérison oui/non vs traitement A/B
– test du chi² ou test exact de Fisher
• 1 variable qualitative et 1 variable quantitative
– récidive oui/non vs taille initiale de la tumeur
– Tests de comparaisons de moyenne :• distribution normale de la variable quantitative
– 2 groupes : test t
– > 2 groupes : analyse de variance (ANOVA)
• petits effectifs ou distributions non normales
– 2 groupes : test de Mann Whitney
– > 2 groupes test de Kruskall Wallis
Principaux tests d ’analyse univariée
• 2 variables qualitatives (catégorielles)– guérison oui/non vs traitement A/B
– test du chi² ou test exact de Fisher
• 1 variables qualitative et 1 variable quantitative– récidive oui/non vs taille initiale de la tumeur
– test t (distrib. normale de la var quantitative) ou test de Mann Whitney (Kruskall Wallis) pour petits effectifs
• 2 variables quantitatives – production d ’une protéine vs dose d’une substance– test du coefficient de régression r
Principaux tests d ’analyse univariée
• 2 variables qualitatives (catégorielles)– guérison oui/non vs traitement A/B
– test du chi² ou test exact de Fisher
• 1 variables qualitative et 1 variable quantitative– récidive oui/non vs taille initiale de la tumeur
– test t (distrib. normale de la var quantitative) ou test de Mann Whitney (Kruskall Wallis) pour petits effectifs
• 2 variables quantitatives – production d ’une protéine vs dose d’une substance– test du coefficient de régression
• 1 variable qualitative et 1 variable censurée– traitement A/B vs délai de récidive tumorale
– test du log rank
Estimation de courbes de survie par la méthode de Kaplan Meïer
Taux de survie
Temps (mois)50 %
100 %
3 6 9 12
Traitement A
Traitement B
Principe de l ’analyse unidimensionnelle
Réponse au traitement(Evènement à expliquer)
Age
Stade histologique
Anciennetéde l ’infection
Sexe
Génotypeviral
Mode decontamination
?
?
?
?
? ?
Charge virale
?
Principe de l ’analyse unidimensionnelle
Réponse au traitement(Evènement à expliquer)
Age
Stade histologique
Anciennetéde l ’infection
Sexe
Génotypeviral
Mode decontamination
S
S
S
S
NS S
Charge virale
S
Intérêt de l ’analyse multidimensionnelle
Réponse au traitement(Evènement à expliquer)
Age
Stade histologique
Anciennetéde l ’infection
Sexe
Génotypeviral
Mode decontamination
S
S
S
S
S
S
Charge virale
Intérêt de l’analyse multivariée
Réponse au traitement(Evènement à expliquer)
Age
Stade histologique
Anciennetéde l ’infection
Sexe
Génotypeviral
Mode decontamination
Quels sont les facteurs indépendamment liés à l’événement ?Qui apportent chacun une part d’explication complémentaire ? Stratégies thérapeutiques différentes en fonction de ces facteurs
Charge virale
Types d’analyses multivariées
Analyses bivariées : relation entre 2 facteurs en prenant en compte un 3ème : (2 variables explicatives potentielles) Test de Mantel-Haenszel
Analyse de variance à 2 facteurs
Test du Log rank ajusté
Types d’analyses multivariées
Analyses bivariées : relation entre 2 facteurs en prenant en compte un 3ème : (2 variables explicatives potentielles) Test de Mantel-Haenszel
Analyse de variance à 2 facteurs
Test du Log rank ajusté
analyses multidimensionnelles : font appel à des modèles mathématiques Régression logistique
Modèle de Cox
Régression multiple
(analyse discriminante, analyse factorielle ….)
Analyse bivariée : test de Mantel-Haenszel
Question : en univariée traitt A > traitt B ; Vrai ou liée à une mauvaise répartition d’un facteur lié à la réponse au traitt ?Réponse : on étudie la relation réponse/traitt à chaque niveaudu facteur :
Strate Génotype 1 Strate génotype non 1
réponse réponse oui non oui nonA pA1 A pAnon1
traitt traittB pB1 B pBnon1
pA1 > pB1 pAnon1 > pBnon1
Conclusion : A > B indépendammentdu génotype (à niveau égal de génotype)
p=0.03 (Mantel-Haenszel statistics)
40 > 40
22.6%
42.9% 44.4%
57.9%
0
20
40
60
80
Non & occasional cannabis smokersDaily cannabis smokers
Age at biopsy (yrs)
Fib
rosi
s >
F2
(%
)
Figure 1
Exemple numérique
Rep + Rep-TtA 70(60)(40)30 100 Tx rép 70 % vs 50 %TtB 50(60)(40)50 100 ² = 8,33 p < 0,001
120 80 200
Exemple numérique
Rep + Rep- Rep + Rep -
TtA 70 30 100 Geno 1 60 60 120
TtB 50 50 100 Geno non1 60 20 80
120 80 200 120 80 200
Tx rep : 50 % vs 75 %, p< 0,001
Exemple numérique
Rep + Rep- Rep + Rep -
TtA 70 30 100 Geno 1 60 60 120TtB 50 50 100 Geno non1 60 20 80
120 80 200 120 80 200
Geno 1 Gnon 1TtA 40 60 100 33 % vs 75 % de TtATtB 80 20 100 p < 0,0001
120 80 200
Exemple numérique
Test de Mantel HaenszelGeno 1 Geno non1Rep + Rep- Rep + Rep-
TtA 20(20)20 40 TtA 50(45)(15)10 60TtB 40(40)40 80 TtB 10(15) (5) 10 20
60 60 120 60 20 80Rep+ Rep-TtA 70(65)(35)30 100TtB 50(55)(45) 50100 ² = 2,11 NS120 80 200
Analyse bivariée : ANOVA à 2 facteurs
• Question : en univariée traitt A > traitt B sur la taille tumorale; Vrai ou liée à une mauvaise répartition d’un facteur lié à la réponse au traitt ?
• Réponse : l ’ANOVA permet de tester :– l ’effet du traitement « à niveau égal » de l ’autre
facteur– l ’effet de ce facteur, indépendamment du
traitement– l ’interaction traitement x facteur : l ’effet du
traitement est-il différent selon le niveau de l ’autre facteur ?
Exemple d’ANOVA à 2 facteurs
• Variable à expliquer : vitesse de progression de la fibrose après TH pour cirrhose C
• 2 variables explicatives :– Le génotype viral VF gén1 > VF gén non1– L’immunosuppresseur : VF ss tacrolimus > VF ss ciclosp
• Résultats : ciclo tacro
Vit Fibrose géno non1 0.316 0.207 0.280 effet génotype
géno 1 0.606 0.837 0.659 p = 0.008
0.540 0.627 0.562
interaction : p = 0.315 effet immunosup : p = 0.718
Analyse bivariée : test du Log rank ajustéTaux de survie
50 %
100 %
1 2 3 4
Traitement Asans métastase
Traitement Bsans métastase
0 %
Traitement Aavec métastases
5 Temps (ans)
Traitement Bavec métastases
Permet de conclure A > B, qu’il y ait ou non des métastases initiales
Stratification vs ajustement
Stratification = prendre en compte un facteur lié au critèrede jugement dans la méthodologie de l’étude
Ajustement = technique prendre en compte dans un test unique un facteur qui la variabilité du critère, pallier larépartition inégale d’un facteur pronostique
Stratification Ajustement randomisation randomisationparmi chaque strate sur l’ensemble Ttt A Ttt B Ttt A Ttt B
immunocompétent
immunodéprimé
Analyse multidimensionnelle : la régression logistique
• Permet de prédire la probabilité d’un événement à l’aide de divers facteurs : quantitatifs ou qualitatifs
• Principe : à partir d’une série d’observations, on cherche à estimer les paramètres d’un modèle mathématique, prédisant au mieux la probabilité d’un événement :
Proba (événement) = exp(u) / 1 + exp(u)
u = fonction linéaire de la forme : + i xi
x = 0 ou 1 si qualitative, et valeur mesurée xi si quantitative
i = coefficient associé au facteur : « poids du facteur »
exp = Odds ratio (OR) associé à une variable et ajusté sur les autres variables du modèle
Régression logistique : exemple
Facteur coef DS p exp (OR) IC 95% OR
Traitement(A 0 1 ) B - 1,204 0,45 0,001 0,3 0,19 – 0,47
Génotype(1 0 1 )non 1 1,335 0,54 0,002 3,8 2,21 – 6,52
Histologie(F0F1 0 1 )F2F3F4 - 0,615 0,30 0,03 0,54 0,40 – 0,7
Charge virale(>6 logUI 0 1 ) <6 logUI 1,172 0,44 0,01 3,2 1,36 – 7,65
4 facteurs indépendamment liés à l’obtention d’une réponse
Régression logistique : exemple
Facteur coef DS p exp (OR) IC 95% ORTraitement
(A 0 1 ) B - 1,204 0,45 0,001 0,3 0,19 – 0,47
Génotype(1 0 1 )non 1 1,335 0,54 0,002 3,8 2,21 – 6,52
Histologie(F0F1 0 1 )F2F3F4 - 0,615 0,30 0,03 0,54 0,40 – 0,7
Charge virale(>6 logUI 0 1 ) <6 logUI 1,172 0,44 0,01 3,2 1,36 – 7,65
4 facteurs indépendamment liés à l’obtention d’une réponse :- A > B; geno non1 > geno 1; F0F1 > F2F3F4; faible CV > forte CV
Analyse multidimensionnelle : le modèle de Cox
(modèle des risques instantanés proportionnels de Cox)
• Objectif : évaluer les facteurs pronostiques de mortalité ou tout autre événement lié au temps
• Principe : – On considère le risque instantané de décès (force de mortalité, hazard)
= probabilité de mourir à l’instant t pour un sujet qui a survécu jusque là : (t)
– Fonction du temps passé et de covariables (facteurs de risque x1,
x2, …. xk) recueillis en début d’étude ou en cours d’étude
– Hypothèse de proportionnalité des risques instantanés constante au cours du temps (ex : risque H = toujours 1,5 fois risque F)
(t; x1,x2, … xk) = 0(t).f(x1,x2, … xk) où f(x1,x2, … xk) = exp(1x1+2x2+, …+ kxk)
Analyse multidimensionnelle : le modèle de Cox
temps
(t) Placebo
Traitement B
Traitement A
Le risque instantané de décès est proportionnel selon que les patients reçoivent A ou B : il est décroissant au cours du temps
il n’est pas proportionnel sous placebo : le modèle de Cox n’est pas applicable
En conclusion
Dans toutes études : recueil de données pertinentes (essai thérapeutique, étude pronostique, étude explicative)
1ére étape : analyse univariée Permet de déterminer les variables qui semblent liées à
l’événement Étudie les relations entre les variables explicatives
2ème étape : analyse multivariée Permet de mettre en évidence les variables
indépendamment liées à l’événement étudié et leur poids (coefficient , OR)
ATTENTION : le modèle déterminé à partir d’une série d’observations doit être validé sur d’autres séries indépendantes de données