20
Domaines d’intérêt: architecture, urbanisme, VBA, SPSS, électronique pratique. 1 Question de recherche Hypothèses de recherche Variables et échelles de mesure Types de données Nombre d’échantillons

Choix de l’analyse statistique appropriée

Embed Size (px)

Citation preview

Page 1: Choix de l’analyse statistique appropriée

Domaines d’intérêt: architecture, urbanisme, VBA, SPSS, électronique pratique. 1

Question de recherche Hypothèses de recherche Variables et échelles de mesure Types de données Nombre d’échantillons

Page 2: Choix de l’analyse statistique appropriée

Introduction

Quand on est amené à faire une recherche, on est sensé suivre les principales étapes de la méthode scientifique suivante :

• la définition du sujet de recherche; • la délimitation du terrain d'étude ; • la définition de l'objet de recherche; • l’état de l’art (exploration); • la question de recherche ; • la problématique; • les hypothèses ; • l’échantillonnage ; • la construction du dispositif du recueil des données; • Les investigations sur terrain (Observation, questionnaire,

entrevue ) ; • l'analyse des données recueillies et leurs interprétations en

vérifiant s’il y a une possible relation entre les variables de l’hypothèse de départ au moyen de tests statistiques ;

• Conclusion .

2

Page 3: Choix de l’analyse statistique appropriée

Le choix d’un test statistique le plus approprié pour votre recherche dépend de la question de recherche , de l’hypothèse, du type de mesure des données, et du nombre d’échantillons.

Ce qui nous intéresse pour le moment dans toutes ces étapes, c’est l’analyse des données.

3

Le choix du test approprié n’est une chose aisée étant donné l’existence d’une pléthore de tests. Ce que nous présentons ici, n’est pas une recette mais plutôt des idées pour une meilleure réflexion dans le choix adéquat. Ici, nous nous concentrons uniquement sur certains les tests paramétriques (les données analysées ont une distribution normale) et non-paramétriques.

Page 4: Choix de l’analyse statistique appropriée

Les tests statistiques paramétriques les plus couramment utilisés

T test apparié T test à échantillons indépendants Corrélation/ analyse de régression Khi 2 ANOVA à 1 facteur Analyse multivariée

4

Page 5: Choix de l’analyse statistique appropriée

* TEST WILCOXON * TEST MANN-WHITNEY * LE TEST DE MCNEMAR * LE KRUSKAL-WALLIS

Les tests statistiques non-paramétriques

5

Page 6: Choix de l’analyse statistique appropriée

Question de recherche Toute recherche doit commencer par une question. Cette question de recherche fait partie du processus de conceptualisation. En d’autre termes, qu’est ce qu’on veut chercher au juste? Chaque question lui correspond des tests.

• Est-ce que on veut faire une description . • Est-ce que on cherche une relation ou association entre variables . • Est-ce qu’on cherche à comparer les échantillons ou les variables . • Est-ce qu’on veut faire une prédiction .

Description Association Comparaison Prédiction

Descriptives Effectifs Moyen Ecart-type Pourcentage Médiane Pourcentage

• Corrélation de Person et de Spearman

T test apparié T test à échantillon

indépendant ANOVA à facteur Chi 2

Régression linéaire Régression

logistique Régression

multiple

Les tests

Page 7: Choix de l’analyse statistique appropriée

A- Si l’hypothèse est monovariée, c’est-à-dire elle se limite à une seule variable, nous utilisons l’analyse descriptive (Effectifs ou descriptives). (Nous voulons faire uniquement une description, d’où on fait référence à la moyenne, l’écart-type, le mode, la médiane, le pourcentage etc. C’est ce qui est appelé le tri à plat. On peut faire aussi appel au T test à échantillon apparié: 2 tests, un avant et un autre après , tous les deux appliqués au même échantillon (ou pour la même variable)

1- Quelle est l’hypothèse de recherche ?

1- Hypothèse monovariée (à un seule variable) 2- Hypothèse bivariée (à 2 variables) 2- Hypothèse trivariée (à 3 variables )

Page 8: Choix de l’analyse statistique appropriée

Ici, il y a une seule variable. Donc , on peut faire appelle à la moyenne, l’écart-type, pourcentage, le graphique etc.

8

Exemple Soit la 1ère l’hypothèse de recherche suivante : « Les maisons contemporaines sont toutes bien isolées »

Page 9: Choix de l’analyse statistique appropriée

Il s’agit de comparer les moyennes ou les écart-types des variables (ou 2 échantillons) s’ils sont les mêmes ou différents . On ne soucie guère de la relation qui pourrait exister entre elles. Exemples : -- comparaison « des températures intérieures d’une maison avant (sans isolation ) et après la mise en place de l’isolation thermique des murs extérieurs » -- comparaison « du nombre d’agressions nocturnes dans un espace public avant et après l’introduction de l’éclairage public durant une période donnée» - T test à échantillons indépendants (différence entre les 2 échantillons) - test ANOVA (différence entre plus de 2 échantillons)

9

B- Si l’hypothèse est bivariée ou trivariée, 2 types d’analyse se présentent: 1- la comparaison des données

Page 10: Choix de l’analyse statistique appropriée

2- la recherche d’une relation ou d’association entre variables

(ou échantillons):

10

Est-ce que l’une dépend de l’autre; Est-ce- que l’une prédit l’autre .

Il s’agit de déterminer la variable indépendante ( appelée aussi variable prédicteur, variable des données ) et la variable dépendante (appelée aussi variable à prédire, variable test, variable à observée). En d’autres termes, la variable indépendante agit sur la variable dépendante.

Ici, nous pouvons faire appel à: analyse de corrélation (ou de Pearson) (Voir s’il y a association entre variables ) analyse de régression linéaire et analyse de régression logistique (association et prédiction);

Page 11: Choix de l’analyse statistique appropriée

11

Il y a aussi le test Khi 2 qui permet de se prononcer

sur une relation éventuelle entre variables qualitatives uniquement .

L’ACP (Analyse en composantes principales ) consiste à analyser les corrélations entre plusieurs variables.

Page 12: Choix de l’analyse statistique appropriée

Exemple « Soit l’hypothèse de recherche suivante »

Dans le contexte algérien, l'offre d’immobilier réduit la demande de logements pour les jeunes mariés?

Ici, il y a association entre l’offre de l’immobilier et la demande de logements pour jeunes mariés. Donc , il y a deux variables quantitatives (hypothèse bivariée).

L’offre de l’immobilier

La demande de logements pour les jeunes mariés

Les analyses possibles pour ces 2 variables sont l’ analyse de corrélation linéaire et l’analyse de régression linéaire .

12

Page 13: Choix de l’analyse statistique appropriée

2- Quel type de données à recueillir ?

• Qualitative

Nominale (Genre, profession, statut familial etc.)

Ordinale (Echelle de Likert) ( Niveau de satisfaction, niveau d’instruction )

13

• Quantitative

Continue , généralement on procède à des mesures (La température,

la descente de charge, le poids, l’humidité, la vitesse de l’air, le moment fléchissant etc)

Discrète, le dénombrement ou le comptage de quelque chose, le

classement ( Le nombre de chambres dans une maison, le nombre de poteaux dans un hall , le nombre d’enfants dans le ménage, le classement d’un élève etc.)

Données qualitatives et données quantitatives

Page 14: Choix de l’analyse statistique appropriée

Quelles sont les échelles de mesure?

Dans le même contexte , on peut aussi parler de variables mesurées dans une échelle de mesure .

14

Donnée qualitative Donnée quantitative

Echelles nominale Echelle ordinale Echelle de rapport Echelle d’intervalle

permet de mesurer une variable quantitative dont •Le point zéro et l'unité de mesure sont arbitraires

de mesurer une variable quantitative

L'existence d'un zéro absolu

Il permet de mesurer une variable ordinale

Arrangement selon l’échelle de Likert L’inadéquation

des opérations arithmétiques.

Il permet de mesurer une variable nominale

Chaque modalité lui est affectée un nombre pour l’identifier

L’inadéquation des opérations arithmétiques.

Page 15: Choix de l’analyse statistique appropriée

tests en fonction du type de données

15

Données qualitatives test Khi 2 cherche la relation entre variables qualitatives uniquement .

Exemple: chercher la relation entre genre et la qualité de service d’un supermarché,

Genre: données nominales (Masculin ou féminin ) Qualité de service : données ordinales (Satisfaction du client homme et femme, échelle de Likert)

Données quantitatives T test à échantillons appariés T test à échantillons indépendants Corrélation linéaire (corrélation de Pearson ) ou de Spearman Analyse de régression ANOVA à1 facteur ACP etc.

Page 16: Choix de l’analyse statistique appropriée

3- Le nombre d’échantillons

16

Certaines recherches reposent soit sur un , deux ou un jeu d’échantillons

de la même population d’étude.

Un seul échantillon 1- Deux cas peuvent se présenter pour les tests paramétriques

Une simple mesure (moyenne, l’écart-type, la médiane etc). Exemple, la moyenne des températures durant un mois, ou des poids d’un groupe de personnes, ou des notes des élèves d’une classe. ( pas de comparaison) (Analyse descriptive)

Une mesure avant et après . C’est-à-dire avec le même échantillon nous avons 2 mesures différentes ( comparaison la différence des moyennes des 2 échantillons) . Exemple, le poids de quelqu’un avant et après un régime alimentaire sévère ( à comparer la différence des résultats) (T test apparié)

Page 17: Choix de l’analyse statistique appropriée

2- Deux cas peuvent se présenter pour les tests non-paramétriques

17

Si les données ne suivent pas la loi normal ou ordinales , on fera appel au test Wilcoxon. Ainsi, l'hypothèse alternative est vérifiée si la différence des médianes de 2 échantillons est différente de zéro

Le test de McNemar est utilisé pour comparer deux

échantillons appariés lorsque les données sont nominales et

dichotomiques ( Oui/non, Male/femelle, Noir/Blanc).

Page 18: Choix de l’analyse statistique appropriée

Deux échantillons: les mesures des 2 échantillons sont à comparer. C’est-à-dire que le même test est appliqué à 2 échantillons différents. - On utilise le T test à échantillons indépendants. Exemples : on compare les moyennes des notes des élèves de 2 classes différentes du même niveau. - Si les données sont intervalles qui ne satisfont pas les conditions de normalité et sont ordinales , on utilisera le test Mann-Whitney au lieu de T test à échantillons indépendants pour comparer deux échantillons indépendants. C’est un test non-paramétrique. Ici on compare les médianes des 2 échantillons.

18

Page 19: Choix de l’analyse statistique appropriée

• Plus de 2 échantillons: comparaison de leurs mesures. Deux tests se présentent

- ANOVA à 1 facteur (test paramétrique )

- Si les données ne suivent pas la loi normale ou sont ordinales,

on utilisera le Kruskal-Wallis à la place de ANOVA 1 facteur

(Kruskal-Wallis est un test non-paramétrique)

19

Page 20: Choix de l’analyse statistique appropriée

Merci pour votre attention

20

Prof. Adad Mohamed Cherif