Intérêt et principes des analyses multivariées

Intérêt et principes des analyses multivariées

FRT C7

Analyse multivariée

par opposition à univariée

en complément d’une analyse univariée

Rappel sur l’analyse univariée

Analyse univariée : relation entre 2 variables– Principe :

• Hypothèse nulle d ’indépendance (H0)

• Hypothèse alternative de relation (H1)

– entre une variable dépendante, à expliquer et une variable expliquante

– Quantification de la différence entre l’observation et la théorie sous l’hypothèse nulle

– test statistique dépend du type de variable

Principaux tests d ’analyse univariée

• 2 variables qualitatives (catégorielles)– guérison oui/non vs traitement A/B

– test du chi² ou test exact de Fisher




• 1 variable qualitative et 1 variable quantitative

– récidive oui/non vs taille initiale de la tumeur

– Tests de comparaisons de moyenne :• distribution normale de la variable quantitative

– 2 groupes : test t

– > 2 groupes : analyse de variance (ANOVA)

• petits effectifs ou distributions non normales

– 2 groupes : test de Mann Whitney

– > 2 groupes test de Kruskall Wallis




• 1 variables qualitative et 1 variable quantitative– récidive oui/non vs taille initiale de la tumeur

– test t (distrib. normale de la var quantitative) ou test de Mann Whitney (Kruskall Wallis) pour petits effectifs

• 2 variables quantitatives – production d ’une protéine vs dose d’une substance– test du coefficient de régression r




• 1 variables qualitative et 1 variable quantitative– récidive oui/non vs taille initiale de la tumeur

– test t (distrib. normale de la var quantitative) ou test de Mann Whitney (Kruskall Wallis) pour petits effectifs

• 2 variables quantitatives – production d ’une protéine vs dose d’une substance– test du coefficient de régression

• 1 variable qualitative et 1 variable censurée– traitement A/B vs délai de récidive tumorale

– test du log rank

Estimation de courbes de survie par la méthode de Kaplan Meïer

Taux de survie

Temps (mois)50 %

100 %

3 6 9 12

Traitement A

Traitement B

Principe de l ’analyse unidimensionnelle

Réponse au traitement(Evènement à expliquer)

Age

Stade histologique

Anciennetéde l ’infection

Sexe

Génotypeviral

Mode decontamination

?

?

?

?

? ?

Charge virale

?

Principe de l ’analyse unidimensionnelle


Age

Stade histologique


Sexe

Génotypeviral


S

S

S

S

NS S

Charge virale

S

Intérêt de l ’analyse multidimensionnelle


Age

Stade histologique


Sexe

Génotypeviral


S

S

S

S

S

S

Charge virale

Intérêt de l’analyse multivariée


Age

Stade histologique


Sexe

Génotypeviral


Quels sont les facteurs indépendamment liés à l’événement ?Qui apportent chacun une part d’explication complémentaire ? Stratégies thérapeutiques différentes en fonction de ces facteurs

Charge virale

Types d’analyses multivariées

Analyses bivariées : relation entre 2 facteurs en prenant en compte un 3ème : (2 variables explicatives potentielles) Test de Mantel-Haenszel

Analyse de variance à 2 facteurs

Test du Log rank ajusté

Types d’analyses multivariées

Analyses bivariées : relation entre 2 facteurs en prenant en compte un 3ème : (2 variables explicatives potentielles) Test de Mantel-Haenszel

Analyse de variance à 2 facteurs

Test du Log rank ajusté

analyses multidimensionnelles : font appel à des modèles mathématiques Régression logistique

Modèle de Cox

Régression multiple

(analyse discriminante, analyse factorielle ….)

Analyse bivariée : test de Mantel-Haenszel

Question : en univariée traitt A > traitt B ; Vrai ou liée à une mauvaise répartition d’un facteur lié à la réponse au traitt ?Réponse : on étudie la relation réponse/traitt à chaque niveaudu facteur :

Strate Génotype 1 Strate génotype non 1

réponse réponse oui non oui nonA pA1 A pAnon1

traitt traittB pB1 B pBnon1

pA1 > pB1 pAnon1 > pBnon1

Conclusion : A > B indépendammentdu génotype (à niveau égal de génotype)

p=0.03 (Mantel-Haenszel statistics)

40 > 40

22.6%

42.9% 44.4%

57.9%

0

20

40

60

80

Non & occasional cannabis smokersDaily cannabis smokers

Age at biopsy (yrs)

Fib

rosi

s >

F2

(%

)

Figure 1

Exemple numérique

Rep + Rep-TtA 70(60)(40)30 100 Tx rép 70 % vs 50 %TtB 50(60)(40)50 100 ² = 8,33 p < 0,001

120 80 200

Exemple numérique

Rep + Rep- Rep + Rep -

TtA 70 30 100 Geno 1 60 60 120

TtB 50 50 100 Geno non1 60 20 80

120 80 200 120 80 200

Tx rep : 50 % vs 75 %, p< 0,001

Exemple numérique

Rep + Rep- Rep + Rep -

TtA 70 30 100 Geno 1 60 60 120TtB 50 50 100 Geno non1 60 20 80

120 80 200 120 80 200

Geno 1 Gnon 1TtA 40 60 100 33 % vs 75 % de TtATtB 80 20 100 p < 0,0001

120 80 200

Exemple numérique

Test de Mantel HaenszelGeno 1 Geno non1Rep + Rep- Rep + Rep-

TtA 20(20)20 40 TtA 50(45)(15)10 60TtB 40(40)40 80 TtB 10(15) (5) 10 20

60 60 120 60 20 80Rep+ Rep-TtA 70(65)(35)30 100TtB 50(55)(45) 50100 ² = 2,11 NS120 80 200

Analyse bivariée : ANOVA à 2 facteurs

• Question : en univariée traitt A > traitt B sur la taille tumorale; Vrai ou liée à une mauvaise répartition d’un facteur lié à la réponse au traitt ?

• Réponse : l ’ANOVA permet de tester :– l ’effet du traitement « à niveau égal » de l ’autre

facteur– l ’effet de ce facteur, indépendamment du

traitement– l ’interaction traitement x facteur : l ’effet du

traitement est-il différent selon le niveau de l ’autre facteur ?

Exemple d’ANOVA à 2 facteurs

• Variable à expliquer : vitesse de progression de la fibrose après TH pour cirrhose C

• 2 variables explicatives :– Le génotype viral VF gén1 > VF gén non1– L’immunosuppresseur : VF ss tacrolimus > VF ss ciclosp

• Résultats : ciclo tacro

Vit Fibrose géno non1 0.316 0.207 0.280 effet génotype

géno 1 0.606 0.837 0.659 p = 0.008

0.540 0.627 0.562

interaction : p = 0.315 effet immunosup : p = 0.718

Analyse bivariée : test du Log rank ajustéTaux de survie

50 %

100 %

1 2 3 4

Traitement Asans métastase

Traitement Bsans métastase

0 %

Traitement Aavec métastases

5 Temps (ans)

Traitement Bavec métastases

Permet de conclure A > B, qu’il y ait ou non des métastases initiales

Stratification vs ajustement

Stratification = prendre en compte un facteur lié au critèrede jugement dans la méthodologie de l’étude

Ajustement = technique prendre en compte dans un test unique un facteur qui la variabilité du critère, pallier larépartition inégale d’un facteur pronostique

Stratification Ajustement randomisation randomisationparmi chaque strate sur l’ensemble Ttt A Ttt B Ttt A Ttt B

immunocompétent

immunodéprimé

Analyse multidimensionnelle : la régression logistique

• Permet de prédire la probabilité d’un événement à l’aide de divers facteurs : quantitatifs ou qualitatifs

• Principe : à partir d’une série d’observations, on cherche à estimer les paramètres d’un modèle mathématique, prédisant au mieux la probabilité d’un événement :

Proba (événement) = exp(u) / 1 + exp(u)

u = fonction linéaire de la forme : + i xi

x = 0 ou 1 si qualitative, et valeur mesurée xi si quantitative

i = coefficient associé au facteur : « poids du facteur »

exp = Odds ratio (OR) associé à une variable et ajusté sur les autres variables du modèle

Régression logistique : exemple

Facteur coef DS p exp (OR) IC 95% OR

Traitement(A 0 1 ) B - 1,204 0,45 0,001 0,3 0,19 – 0,47

Génotype(1 0 1 )non 1 1,335 0,54 0,002 3,8 2,21 – 6,52

Histologie(F0F1 0 1 )F2F3F4 - 0,615 0,30 0,03 0,54 0,40 – 0,7

Charge virale(>6 logUI 0 1 ) <6 logUI 1,172 0,44 0,01 3,2 1,36 – 7,65

4 facteurs indépendamment liés à l’obtention d’une réponse

Régression logistique : exemple

Facteur coef DS p exp (OR) IC 95% ORTraitement

(A 0 1 ) B - 1,204 0,45 0,001 0,3 0,19 – 0,47

Génotype(1 0 1 )non 1 1,335 0,54 0,002 3,8 2,21 – 6,52

Histologie(F0F1 0 1 )F2F3F4 - 0,615 0,30 0,03 0,54 0,40 – 0,7

Charge virale(>6 logUI 0 1 ) <6 logUI 1,172 0,44 0,01 3,2 1,36 – 7,65

4 facteurs indépendamment liés à l’obtention d’une réponse :- A > B; geno non1 > geno 1; F0F1 > F2F3F4; faible CV > forte CV

Analyse multidimensionnelle : le modèle de Cox

(modèle des risques instantanés proportionnels de Cox)

• Objectif : évaluer les facteurs pronostiques de mortalité ou tout autre événement lié au temps

• Principe : – On considère le risque instantané de décès (force de mortalité, hazard)

= probabilité de mourir à l’instant t pour un sujet qui a survécu jusque là : (t)

– Fonction du temps passé et de covariables (facteurs de risque x1,

x2, …. xk) recueillis en début d’étude ou en cours d’étude

– Hypothèse de proportionnalité des risques instantanés constante au cours du temps (ex : risque H = toujours 1,5 fois risque F)

(t; x1,x2, … xk) = 0(t).f(x1,x2, … xk) où f(x1,x2, … xk) = exp(1x1+2x2+, …+ kxk)

Analyse multidimensionnelle : le modèle de Cox

temps

(t) Placebo

Traitement B

Traitement A

Le risque instantané de décès est proportionnel selon que les patients reçoivent A ou B : il est décroissant au cours du temps

il n’est pas proportionnel sous placebo : le modèle de Cox n’est pas applicable

En conclusion

Dans toutes études : recueil de données pertinentes (essai thérapeutique, étude pronostique, étude explicative)

1ére étape : analyse univariée Permet de déterminer les variables qui semblent liées à

l’événement Étudie les relations entre les variables explicatives

2ème étape : analyse multivariée Permet de mettre en évidence les variables

indépendamment liées à l’événement étudié et leur poids (coefficient , OR)

ATTENTION : le modèle déterminé à partir d’une série d’observations doit être validé sur d’autres séries indépendantes de données

Documents

Intérêt et principes des analyses multivariées