Psychologie,Première année,Questionnaire.
Description des résultats
Remarques
On commence par décrire la situation statistique.Les variables sont au nombre de 63. Chaque variable peut être étudiée séparément des autres ;Ou bien, les variables peuvent être étudiées par deux ;Ou bien par groupes plus importants.
Remarques
L’étude des variables une par une est une étape indispensable, mais non suffisante en général, de la description des résultats.
De même, les méthodes permettant d’étudier le lien entre deux variables ne répondent pas à toutes les questions possibles, et des méthodes plus générales devront être utilisées par la suite.
Remarques
Du fait du grand nombre de variables, nous ne les détaillerons pas toutes, donnant seulement quelques exemples particulièrement parlants.
Plan
1. Situation statistique
2. Une variable à la fois
3. Deux variables à la fois
4. Limites et compléments
1. La situation statistique
Poser les bases pour un traitement approprié
Sujets
On a relevé pour chaque étudiant volontaire (individu) de la promotion (échantillon) un certain nombre de grandeurs afin de déterminer le profil, l’attitude face à la psychologie, etc. de l’ensemble des étudiants en psychologie (population).
L’échantillon est de taille 232 (n=232).
Variables
Certaines des 63 variables sont dichotomiques (mots à entourer, sexe), ou nominales (exemple de fruit, d’animal, groupe).
D’autres sont quantitatives (notes).
Tableau descriptif (SPSS)
Tableaux statistiques (SPSS)
2. Une variable à la fois
Présentation, représentation, calcul de paramètres.
Exemple 1
Description de la population
Variables inutiles ?
Une étape préliminaire est la description de la population.
On utilise pour cela des variables (âge, sexe, niveau d’étude) qui n’ont pas d’intérêt direct dans l’étude, mais qui permettent de se faire une idée de la population.
Groupes
L’une des variables importantes est ici le « groupe » (hasard, typique, premier).Pour que les comparaisons entre les groupes soient pertinentes, il est évidemment nécessaire que les groupes soient similaires du point de vue des variables sexe, âge, étude.Nous allons donc construire des tableaux donnant les différences entre les groupes.
Survol
Pour décrire une variable, on peut :1. Présenter les fréquences ou effectifs dans
des tableaux (construire le tableau statistique)
2. Représenter les données (en général distribution de la variable) par un graphique
3. Calculer des indices ou paramètres (position, dispersion, forme…)
Tableau de contingence
Remarques
Il est évidemment délicat, voire impossible, de construire un tableau de contingence si l’une des variables a trop de modalités (âge par exemple)
On pourrait cependant le faire pour croiser les variables « groupe » et « étude », mais le tableau serait peu lisible.
Graphiques
M
F
Graphiques
ETUDE
854321
Occ
urre
nces
200
100
0
GraphiquesLes bâtons montrent des effectifs
20,00 30,00 40,00 50,00
age
0
25
50
75
Effectif
Paramètres
Pour la variable dichotomique « sexe », les pourcentages contiennent toute l’information nécessaire, on calculera seulement : 87.5% de filles.
Paramètres
La variable « étude », comme la variable « âge », est numérique, si bien que l’on calculera, selon le procédé le plus courant, la moyenne et l’écart type.
On trouve ainsi pour l’âge : 20.99 3.96
Et pour « étude » : 1.51 0.96
Remarques
En réalité, les calculs que nous venons de faire devraient être effectués pour chaque groupe, séparément, puisque nous voulons ensuite pouvoir comparer ces groupes.
Cependant, nous nous contenterons pour le moment de ces mesures globales.
Exemple 2
Les notes au bac
Remarques
Il s’agit de variables quantitatives. Nous les traiterons comme telles.
Le nombre de modalités (21) pousse à éviter les tableaux statistiques, un peu lourds.
Représentation graphique
Les aires montrent effectifs
0 5 10 15
francais
10
20
30
40
Effectif
Représentation graphique
PHILO
171513119753
Pou
r-ce
nt
16
14
12
10
8
6
4
2
0
Remarques
On pourrait aussi représenter les distributions sur le même graphique, ce qui permettrait de les comparer plus aisément.
Cela ne permettrait pas, pourtant, de lire le lien entre les variables.
Paramètres
Exemple 3
Attitude face à la psychologie
Tableaux
On pourrait construire les tableaux statistiques, mais il restent moins lisibles qu’un graphique.
Les variables sont pseudo-numériques, mais nous les traiterons comme si elles étaient véritablement quantitatives.
Faut-il être altruiste ?
ALTRUIST
54321
Pou
r-ce
nt
50
40
30
20
10
0
Moyenne : 4.1
Écart type : 0.9
Asymétrie : -0.9
Faut-il rester détaché ?
Moyenne : 4.1
Écart type : 0.9
Asymétrie : -0.9
DÉTACHÉ
DÉTACHÉ
54321
Fré
quen
ce
120
100
80
60
40
20
0
La psychanalyse est une science ?
Moyenne : 3.0
Écart type : 1.0
Asymétrie : -0.7
SCIENCE2
SCIENCE2
54321
Fré
quen
ce
100
80
60
40
20
0
Prestige de la psycho ?
Moyenne : 3.4
Écart type : 0.9
Asymétrie : -0.5
PRESTIGE
PRESTIGE
54321
Fré
quen
ce
140
120
100
80
60
40
20
0
Un don pour la psychologie ?
Moyenne : 2.2
Écart type : 1.5
Asymétrie : 0.5
DON
DON
54321
Fré
quen
ce
100
80
60
40
20
0
La psychologie une philosophie ?
Moyenne : 3.3
Écart type : 1.2
Asymétrie : -0.5
PSYPHIL
PSYPHIL
54321
Fré
quen
ce
100
80
60
40
20
0
Exemple 4
Prototypes
Présentation
Les trois groupes ont donné des exemples de fruit, animal, etc…
Les variables sont nominales, si bien qu’il est difficile de calculer des paramètres.
Les modalités sont nombreuses, si bien que les tableaux statistiques sont peu lisibles.
Enfin, ce qui nous intéresse ici est la distribution CONDITIONNELLE de la variable considérée (par groupe).
Remarques
Cette partie de l’expérience a été traitée plus sérieusement.En particulier, on a supprimé dans chaque groupes des individus qui empêchaient les groupes d’être similaires.Cela est possible car les individus « supprimés » sont choisis indépendamment des réponses aux questions catégorielles.
Arbres
saulesapinpommierchênebouleau
70
60
50
40
30
20
10
0
GROUPE
hasard Pour-cent
first Pour-cent
typique Pour-cent
Les modalités peu fréquentes ont été supprimées pour une meilleure lisibilité.
Arbres
Les modalités peu fréquentes ont été supprimées pour une meilleure lisibilité.
typique Pour-centfirst Pour-centhasard Pour-cent
70
60
50
40
30
20
10
0
ARBRE
bouleau
chêne
pommier
sapin
saule
2. Deux variables numériques
Liens entre deux variables numériques
Survol
Il arrive qu’on s’interroge (c’est très fréquent) sur le lien éventuel entre deux variables.
Si les variables sont numériques, ce que nous supposerons ici, le diagramme de dispersion s’impose, avec le calcul du coefficient de corrélation linéaire (r), ou le coefficient de détermination (r²), plus facile à interpréter.
Exemple 1
Notes au bac.
Maths et Français
MATHS
20100
FR
AN
CA
IS
20
10
0
r=0.027, r²=0.0007
Soit 0.07%.
Moins de 0.1% de la variation de « français » est expliqué linéairement par « maths ».
C’est presque nul, quoique plutôt positif.
Histoire et Philosophie
r=0.036,
Soit r²=0.0013, soit 0.13%.
HISTOIRE
2018161412108642
PH
ILO
18
16
14
12
10
8
6
4
2
Exemple 2
Attitudes face à la psychologie
La psycha/psycho comme science
Nuage de points
Variable dépendante : SCIENCE1
SCIENCE1
5,55,04,54,03,53,02,52,01,5
Rég
ress
ion
Pré
visi
on s
tand
ardi
sée
2
1
0
-1
-2
r=0.36.
r²=13%
Le diagramme est malheureusement peu lisible à cause du grand nombre de points superposés.
Remarques
Tous les r sont positifs, mais la plupart sont proches de 0.Cela laisse penser qu’il y a des « manières de coder », ou des personnalités plus ou moins « acquiesçantes ».Sinon, il devrait y avoir des coefficients négatifs (notamment entre mémoire et logique, ou philosophie et science (r=0.009)).
3. Envoi
Limites
Ce qu’on n’a pas fait
Toute question relative àDes interactions
Des groupes de variables
La définition globale des individus par des faisceaux de variables
Ne peut pas se résoudre par les méthodes utilisées plus haut, qui ne prennent pas en compte plus de deux variables simultanément.
Quelques exemples
Nous allons passer en revue quelques résultats concernant plus de deux variables, de manière plus ou moins intuitive.
Les méthodes diffèrent selon qu’on étudie des variables numériques ou nominales.
Analyse factorielle
Les notes
Diagramme des variables
Diagramme de composantes
Composante 1
1,0,50,0-,5-1,0
Com
posa
nte
2
1,0
,5
0,0
-,5
-1,0
philo
sport
maths
francais
lv1
histoire
Y a-t-il des matières scientifiques et des matières littéraires ?
Le sport est-il plutôt littéraire ou scientifique ?
Les différentes matières mesurent-elles les même compétences ?
Diagramme de dispersion
facteur 2
43210-1-2-3
fact
eur
2
3
2
1
0
-1
-2
-3
La promotion est-elle homogène du point de vue des résultats au baccalauréat ?
Où se situe les individus par rapport aux deux facteurs déterminés plus haut ?
Diagramme de dispersion
Y a-t-il des différences de notes entre les filières ?
Les filières STT et STI sont-elles similaires ?
D’où proviennent les individus atypiques ?
facteur 1
43210-1-2-3
fact
eur
2
3
2
1
0
-1
-2
-3
FILIÈRE
STT
STI
SMS
S
L
ES
BTA
Codage optimal
Attitudes face aux études de psychologie
Variables
axe 1
3,02,01,00,0-1,0-2,0-3,0
axe
2
2
1
0
-1
-2
-3
-4
DON
MEM
LOGIQU
5
4
3
2
1
54
3
2
1
5
4
3
2
1
Quelles modalités s’attirent ?
Quelles modalités se repoussent ?
Les étudiants hésitent-ils entre la psychologie comme don et la psychologie comme matière fastidieuse ?
Individus
axe 1
3210-1-2-3
axe
2
3
2
1
0
-1
-2
-3
-4
Où se situent, globalement, les individus ?
Comment décrire, globalement, l’attitude des étudiants face à la psychologie comme matière ?