30
Le test Le test t t

Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

Embed Size (px)

Citation preview

Page 1: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

Le test Le test tt

Page 2: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

Procédure de l’inférence statistiqueProcédure de l’inférence statistique

1.1. Contexte théoriqueContexte théorique

2.2. HypothèsesHypothèses

3.3. Seuil de signification et puissanceSeuil de signification et puissance

4.4. Taille de l’effetTaille de l’effet

5.5. Collecte de donnéesCollecte de données

6.6. Test critiqueTest critique

7.7. Test observéeTest observée

8.8. DécisionDécision

9.9. InterprétationInterprétation

Page 3: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

PlanPlan

Qu’est-ce qu’on fait lorsqu’on compare deux Qu’est-ce qu’on fait lorsqu’on compare deux groupes (ou 1 groupe) et que la variance de la groupes (ou 1 groupe) et que la variance de la population est inconnue ?population est inconnue ?

Page 4: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

Comparaisons entre un groupe Comparaisons entre un groupe

et une populationet une population

Page 5: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

IdéeIdée

Puisque l’écart type de la population est inconnue, on ne peut donc pas obtenir l’erreur type de la moyenne. On va donc utiliser un estimé de ce dernier.

xn

x

ss

n

xx

xt

s

1dl n

Page 6: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

Distribution des Distribution des t t (Student)(Student)

Page 7: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

Distribution des Distribution des t t (Student)(Student)

Page 8: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

ExempleExemple

On veut mesurer l’effet d’une formation pour la réussite du On veut mesurer l’effet d’une formation pour la réussite du SAT. Neuf participants ont été sélectionnés aléatoirement et SAT. Neuf participants ont été sélectionnés aléatoirement et ont reçus une formation d’une journée.ont reçus une formation d’une journée.

0

1

: 1000

: 1000

0,05

9

1084

67.24

H

H

n

x

s

1084 10003,75

22.41xx

xt

s

67,2422,41

9x

ss

n

( , ) (0,05;8) 2,306critique critiquet dl t

Page 9: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

ExempleExemple

0

1

: 1000

: 1000

0,05

9

1084

67.24

2,306

3,95

critique

x

H

H

n

x

s

t

t

.

.

H

H

observé critique

0

1

Comme t > t (3,75 > 2,306)

on rejette Par conséquent, on accepte

l'hypothèse alternative

Donc, le fait d'avoir suivie la formation

permet de mieux réussir le SAT que la

population en général.

On veut mesurer l’effet d’une formation pour la réussite du On veut mesurer l’effet d’une formation pour la réussite du SAT. Neuf participants ont été sélectionnés aléatoirement et SAT. Neuf participants ont été sélectionnés aléatoirement et ont reçus une formation d’une journée.ont reçus une formation d’une journée.

Page 10: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

Intervalles de confianceIntervalles de confiance

1 x xIC x t s x t s

Page 11: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

Comparaisons entre deux groupes Comparaisons entre deux groupes

indépendantsindépendants

Page 12: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

IdéeIdée

Puisque les écart types des deux populations sont inconnues, on va utiliser des estimés.

1 2

2 21 2

1 2x x n n

1 2

2 21 2

1 2x x

s ss

n n 1 2

1 2

1 2x x

x x

x xt

s

Si les Si les nn sont égaux ( sont égaux (nn11==nn22))

1 2 1 1( 1) ( 1) 2dl n n n n

Page 13: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

IdéeIdée

Puisque les écart types des deux populations sont inconnues, on va utiliser des estimés.

1 2

2

1 2

1 1( )x x coms sn n

Si les Si les nn sont inégaux ( sont inégaux (nn11nn22))

2 2 2 22 1 1 2 2 1 1 2 2

1 2 1 2

( 1) ( 1) ( 1) ( 1)

( 1) ( 1) 2com

n s n s n s n ss

n n n n

1 2

1 2

1 2x x

x x

x xt

s

Page 14: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

Pré requis et PostulatsPré requis et Postulats

Il y a une seule variable dépendante.Il y a une seule variable dépendante. Les participants appartiennent à un et un seul groupe.Les participants appartiennent à un et un seul groupe. La variable indépendante peuvent être continue ou La variable indépendante peuvent être continue ou

nominale.nominale.

Les données sont indépendantes et échantillonnées Les données sont indépendantes et échantillonnées aléatoirement.aléatoirement.

Les données dans chacune des populations sont Les données dans chacune des populations sont distribuées normalementdistribuées normalement

Les variances sont homogènesLes variances sont homogènes2121

0,5 2s

s

Page 15: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

Formes des distributions de Formes des distributions de fréquencesfréquences

II IIII IIIIII IVIV

VIVI VIIVIIVV

Modalité - unimodale :- unimodale :I, IV,V, VI, VIII, IV,V, VI, VII

- bimodale :- bimodale :IIII

- Rectangulaire :- Rectangulaire :IIIIII

Courbure (kurtosis) - Mesokurtique - Mesokurtique

::

Symétrie - symétrique :- symétrique :I, III, II

- - Platykurtique :Platykurtique :

VV

- Leptokurtique - Leptokurtique ::

IV,VI,VIIIV,VI,VII

- - asymétrique :asymétrique :

I, II, III, V, VII, II, III, V, VI

IV (+), VII IV (+), VII (-)(-)

Page 16: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

ExempleExemple On veux mesurer l’effet de l’homéothérapie sur la réduction de l’anxiété. 10 On veux mesurer l’effet de l’homéothérapie sur la réduction de l’anxiété. 10

participants anxieux ont été assignés au hasard dans le groupe contrôle participants anxieux ont été assignés au hasard dans le groupe contrôle (placebo) ou le groupe expérimental (l’homéothérapie ). Après une semaine, on (placebo) ou le groupe expérimental (l’homéothérapie ). Après une semaine, on a mesuré le niveau d’anxiété des 2 groupes; échelle de 1 à 150 (1 = absence a mesuré le niveau d’anxiété des 2 groupes; échelle de 1 à 150 (1 = absence d’anxiété; 150 = le summum de l’anxiété)d’anxiété; 150 = le summum de l’anxiété)

0

1

2 2

:

:

0,01

5 5

116,4 105,2

55,8 151,70

E C

E C

E C

E C

E C

H

H

n n

x x

s s

Les participants sont assignés aléatoirement et Les participants sont assignés aléatoirement et sont indépendants.sont indépendants.

Les données dans chacune des populations sont Les données dans chacune des populations sont distribuées normalement.distribuées normalement.

Les variances sont homogènesLes variances sont homogènes

Postulats

2

2

2

2

0,5 2

55,80,37

151,7

E

C

E

C

s

s

s

s

Page 17: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

116,4 105,21,74

6,44E C

E C

E Cx x

x x

x xt

s

ExempleExemple

0

1

2 2

:

:

0,01

5 5

116,4 105,2

55,8 151,7

E C

E C

E C

E C

E C

H

H

n n

x x

s s

2 2 55,8 151,76,44

5E C

E Cx x

s ss

n

On veux mesurer l’effet de l’homéothérapie sur la réduction de l’anxiété. 10 On veux mesurer l’effet de l’homéothérapie sur la réduction de l’anxiété. 10 participants anxieux ont été assignés au hasard dans le groupe contrôle participants anxieux ont été assignés au hasard dans le groupe contrôle (placebo) ou le groupe expérimental (l’homéothérapie ). Après une semaine, on (placebo) ou le groupe expérimental (l’homéothérapie ). Après une semaine, on a mesuré le niveau d’anxiété des 2 groupes; échelle de 1 à 150 (1 = absence a mesuré le niveau d’anxiété des 2 groupes; échelle de 1 à 150 (1 = absence d’anxiété; 150 = le summum de l’anxiété)d’anxiété; 150 = le summum de l’anxiété)

Page 18: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

ExempleExemple

0

1

2 2

:

:

0,01

5 5

116,4 105,2

55,8 151,7

E C

E C

E C

E C

E C

H

H

n n

x x

s s

( , ) (0,05,8) 2,306critique critiquet dl t

. H

observé critique

0

Comme t < t (1,74 < 2,306)

on conserve Par conséquent, il n'y a pas

assez de preuves pour nous permettre de

conclure que cette différence représente autre

chose que du hasard.

On veux mesurer l’effet de l’homéothérapie sur la réduction de l’anxiété. 10 On veux mesurer l’effet de l’homéothérapie sur la réduction de l’anxiété. 10 participants anxieux ont été assignés au hasard dans le groupe contrôle participants anxieux ont été assignés au hasard dans le groupe contrôle (placebo) ou le groupe expérimental (l’homéothérapie ). Après une semaine, on (placebo) ou le groupe expérimental (l’homéothérapie ). Après une semaine, on a mesuré le niveau d’anxiété des 2 groupes; échelle de 1 à 150 (1 = absence a mesuré le niveau d’anxiété des 2 groupes; échelle de 1 à 150 (1 = absence d’anxiété; 150 = le summum de l’anxiété)d’anxiété; 150 = le summum de l’anxiété)

Page 19: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

Taille d’effet et puissanceTaille d’effet et puissance

Cohen’s DCohen’s D

2 21 2

1 2

2s s

x xd

n = Min(n1;n2)

Page 20: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

ExempleExemple

0

1

2 2

:

:

0,01

5 5

116,4 105,2

55,8 151,7

E C

E C

E C

E C

E C

H

H

n n

x x

s s

2 21 2

1 2

55,8 151,722

116,4 105,21.1

s s

x xd

On veux mesurer l’effet de l’homéothérapie sur la réduction de l’anxiété. 10 On veux mesurer l’effet de l’homéothérapie sur la réduction de l’anxiété. 10 participants anxieux ont été assignés au hasard dans le groupe contrôle participants anxieux ont été assignés au hasard dans le groupe contrôle (placebo) ou le groupe expérimental (l’homéothérapie ). Après une semaine, on (placebo) ou le groupe expérimental (l’homéothérapie ). Après une semaine, on a mesuré le niveau d’anxiété des 2 groupes; échelle de 1 à 150 (1 = absence a mesuré le niveau d’anxiété des 2 groupes; échelle de 1 à 150 (1 = absence d’anxiété; 150 = le summum de l’anxiété)d’anxiété; 150 = le summum de l’anxiété)

Page 21: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

ExempleExemple On veux mesurer l’effet de l’homéothérapie sur la réduction de l’anxiété. 10 On veux mesurer l’effet de l’homéothérapie sur la réduction de l’anxiété. 10

participants anxieux ont été assignés au hasard dans le groupe contrôle participants anxieux ont été assignés au hasard dans le groupe contrôle (placebo) ou le groupe expérimental (l’homéothérapie ). Après une semaine on (placebo) ou le groupe expérimental (l’homéothérapie ). Après une semaine on a mesuré le niveau d’anxiété des 2 groupes; échelle de 1 à 150 (1 = absence a mesuré le niveau d’anxiété des 2 groupes; échelle de 1 à 150 (1 = absence d’anxiété; 150 = le summum de l’anxiété)d’anxiété; 150 = le summum de l’anxiété)

Puisque la puissance est faible (1- = 0,3), nous recommendons

de refaire l'étude avec au moins 14 participants par groupe (1- = 0,8)

Page 22: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

Intervalles de confianceIntervalles de confiance

1 2 1 21 1 2 1 2 1 2( ) ( )x x x xIC x x t s x x t s

1 0.01 1 2

0.99 1 2

0.99 1 2

(116.4 105.2) (2.306)(6.44) (116.4 105.2) (2.306)(6.44)

11.2 14.85064 (116.4 105.2) 14.85064

-3.65064 26.05064

IC

IC

IC

Page 23: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

Comparaisons entre deux groupes Comparaisons entre deux groupes

dépendants (données pairées)dépendants (données pairées)

Page 24: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

IdéeIdée

On utilise les mêmes sujets qu’on mesure à deux reprises. L’avantage du schème à mesure répétées est de réduire la

variabilité des résultats en éliminant celle due aux différences individuelles.

Cependant, les données ne sont plus indépendantes, toutefois, on se souvient que la différence entre les deux est distribuée normalement.

Nous allons donc recoder l’information de la façon suivante:

.1, .2,, gr i gr ii Di x x

Page 25: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

Structure du testStructure du test

obs

D

DD

Dt

s

ss

n

La moyenne et l’écart type sont calculé à partir des différences.

Le nombre de dégrées de liberté sera égal au nombre de différence -1.

Page 26: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

Pré requis et PostulatsPré requis et Postulats

Il y a deux variables dépendantes.Il y a deux variables dépendantes. Tous les participants sont mesurés à deux Tous les participants sont mesurés à deux

reprises.reprises.

Les participants sont sélectionnés aléatoirement.Les participants sont sélectionnés aléatoirement. Les données de la population sont distribuées Les données de la population sont distribuées

normalement.normalement.

Page 27: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

ExempleExemple On veut mesurer l’efficacité d’une formation sur le développement de On veut mesurer l’efficacité d’une formation sur le développement de

l’estimation de soi des maringoins d’élevage. Pour ce faire, 5 participants ont l’estimation de soi des maringoins d’élevage. Pour ce faire, 5 participants ont été sélectionnés aléatoirement de la population des maringoins de Outatouais. été sélectionnés aléatoirement de la population des maringoins de Outatouais. Le bonheur de chaque maringoin fut mesuré avant la formation (pré-test). Puis, Le bonheur de chaque maringoin fut mesuré avant la formation (pré-test). Puis, après 15 séances d’une heure, l’estime de soi des maringoins fut mesuré de après 15 séances d’une heure, l’estime de soi des maringoins fut mesuré de nouveau (post-test). Voici les résultatsnouveau (post-test). Voici les résultats

0

1

:

:

0,05

5

pré post

pré post

H

H

n

1

2

3

4

5

Pré-test Post-test

60 107

85 111

90 117

110 125

115 122

Participant

m

m

m

m

m

Page 28: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

ExempleExemple

1

2

3

4

5

Pré-test Post-test

60 107 47

85 111 26

90 117 27

110 125 15

115 122 7

Participant D

m

m

m

m

m

24.4

15.093D

D

s

15.0936.75

5

24.43.615

6.75

DD

obs

D

ss

n

Dt

s

( ; 0,05; 4) 2.776critt bic dl

Page 29: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

ExempleExemple

Comme le |Comme le |ttobsobs| >| >ttcritcrit (3,615>2,776) , on rejette l’hypothèse nulle et (3,615>2,776) , on rejette l’hypothèse nulle et

on accepte l’hypothèse alternative. on accepte l’hypothèse alternative.

Donc, la formation de 15 séances d’une heure à permis Donc, la formation de 15 séances d’une heure à permis d’augmenter significativement (d’augmenter significativement (tt(4)=3,615; (4)=3,615; pp0.05) l’estime de 0.05) l’estime de soi des maringouins.soi des maringouins.

Page 30: Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte

Intervalles de confianceIntervalles de confiance

1 1 2D DIC D t s D t s

1 1 2

1 0.05 1 2

0.95 1 2

0.95 1 2

24.4 (2.776)(6.75) 24.4 (2.776)(6.75)

24.4 18.738 24.4 18.738

-43.138 -5.662

D DIC D t s D t s

IC

IC

IC