Upload
buinhi
View
263
Download
2
Embed Size (px)
Citation preview
Mémoire de �n d'étude: Etudes statistiques
Mémoire de �n d'étude:
Etudes statistiques
Nicolas Sutton-Charani
Université Montpellier 1
1/31
Mémoire de �n d'étude: Etudes statistiques
PlanRappels de cours
La baseLa Statistique
Types des variables
Outils mathématiques
Statistiques descriptives ou exploratoiresMoyennes, variances, écart-type
Corrélation
Statistiques con�rmatoiresTests
Régression, prédiction
Pratique sur Excel
Prérequis
Statistiques exploratoiresHistogrammes
Statistiques con�rmatoiresTests
Régression linéaire 2/31
Mémoire de �n d'étude: Etudes statistiques
Rappels de cours
La base
Principe de la Statistique
Dé�nition: La statistique est l'ensemble des méthodes qui ont
pour objet la collecte, le traitement et l'interprétation de données
d'observation relatives à un groupe d'individus ou d'unités.
Idée: Généraliser à une population des résultats observés sur un
échantillon (x1, . . . ,xn).
Concrètement, une statistique = un résumé des données
3/31
Mémoire de �n d'étude: Etudes statistiques
Rappels de cours
La base
Variables
Ï quantitative → nombres: taille, poids,...
Ï qualitative → classes: couleur, type de traitement,...
B souvent discutable → se poser la question d'un ordre régulier
des classes
4/31
Mémoire de �n d'étude: Etudes statistiques
Rappels de cours
La base
Outils
Outil incontournable: Théorie des probabilités → mathématiques
2 théorèmes fondamentaux:
Ï Loi des grands nombres: X̄ = X1+···+Xnn →µ
Ï Théorème central limite:X̄−µσ/pn
→N (0,1)
B ces 2 outils supposent que l'échantillon est iid.
5/31
Mémoire de �n d'étude: Etudes statistiques
Rappels de cours
Statistiques descriptives ou exploratoires
Variable quantitatives
Moyenne:
moyenne théorique µ= E[X ] estimée par X̄ = X1+···+Xnn
B moyenne pas sensible à la variabilité → variance, écart-type
Variance et écart-type:
variance théorique σ2 = Var[X ] = E[X 2]−E[X ]2
→ estimée par (X1−X̄)2+···+(Xn−X̄)2
n−1
Ecart-type (théorique) σ=pσ2
6/31
Mémoire de �n d'étude: Etudes statistiques
Rappels de cours
Statistiques descriptives ou exploratoires
Variable quantitativesVisualisation graphique: HISTOGRAMME
variable quantitative → qualitative
comment créer les classes? → plusieurs façons7/31
Mémoire de �n d'étude: Etudes statistiques
Rappels de cours
Statistiques descriptives ou exploratoires
Histogramme à pas �xe
Ï nombre de classes: K =pn ou 1+ ln(n)
ln(2) (entre 5 et 20 classes)
Ï ordonner les données → x1 ≤ ·· · ≤ xn
Ï calcul des bornes:a0, . . . ,aK
Souvent:
a0 = x1 −0.025(xn −x1) (1)
aK = xn +0.025(xn −x1) (2)
→ détermination du pas: h = aK−a0K
→ ak = ak−1 +h
8/31
Mémoire de �n d'étude: Etudes statistiques
Rappels de cours
Statistiques descriptives ou exploratoires
Variable qualitative
diagrammes en bâton ou en secteur: représentation graphique
des e�ectifs ou proportions de chaque classe
classe blonds chatains roux bruns cheveux blancs chauve
e�ectif 20 50 6 30 15 8
9/31
Mémoire de �n d'étude: Etudes statistiques
Rappels de cours
Statistiques descriptives ou exploratoires
Corrélation: cas quantitatif
Dépendance entre variables
Covariance: σ2XY = Cov(X ,Y ) = E[XY ]−E[X ]E[Y ]
Coe�cient de corrélation: ρX ,Y = Cov(X ,Y )pVar(X)Var(Y )
= σ2XY
σXσY∈ [0,1]
X 1, . . . ,X J → matrice de corrélation:
ρ1,1 . . . ρ1,J...
...
ρJ ,1 . . . ρJ ,J
=
σ21 ρ1,2 . . . ρ1,J−1 ρ1,J...
...
ρJ ,1 ρJ ,2 . . . ρJ ,J−1 σ2J
où σ2
i = Var(Xi) et ρi,j = ρXi,Xj
10/31
Mémoire de �n d'étude: Etudes statistiques
Rappels de cours
Statistiques descriptives ou exploratoires
Corrélation: cas qualitatif
Ï lien entre une variable quantitative X et une autre qualitative
Y à K classes
→ comparer X sur les K sous-échantillons (déterminés par la
classe de Y )
Ï lien entre 2 variables qualitatives
→ test du Khi-Deux
11/31
Mémoire de �n d'étude: Etudes statistiques
Rappels de cours
Statistiques con�rmatoires
Tests statistiques
2 types principaux d'hypothèse à tester:
Ï Egalité de moyenne
→ Student, Ecart réduit, etc
Ï Indépendance
→ Khi-Deux, régression
Rappel:
Ï hypothèse nulle H0 = statut-quo (égalité, indépendance, etc)
Ï calcul de la statistique de test tobs et du seuil critique tα pour
un certain risque toléré α
Ï conclusion: tobs > tα → rejet de H0 (Bexceptions)
12/31
Mémoire de �n d'étude: Etudes statistiques
Rappels de cours
Statistiques con�rmatoires
Tests statistiques
B il peut arriver qu'on rejette H0 pour α= 5% alors qu'on ne
l'aurait pas rejeter pour α= 1%
→ regarder la p-value:
Pour un test donné, (x1, . . . ,xn) → p-value
p-value < α→ rejet de H0
C'est le risque maximal impliquant le rejet de H0
13/31
Mémoire de �n d'étude: Etudes statistiques
Rappels de cours
Statistiques con�rmatoires
Tests statistiques
Choisir le bon test en fonction de certains critères:
Ï que veut-on faire?
Ï type de(s) variable(s)?
Ï données appariées?
Ï comparaison de moyennes: → même variance? → test de
Fisher
14/31
Mémoire de �n d'étude: Etudes statistiques
Rappels de cours
Statistiques con�rmatoires
Régression linéaire
On se pose ici la question d'un éventuel lien linéaire entre 2
variables du type Y = aX +b
→ on cherche à calculer a et b à partir d'un échantillon
(x1,y1), . . . , (xn,yn)
Si on y arrive, on pourra prédire Y à partir de X
En général ce lien = imparfait → évaluation de la régression:
coe�cient R2 ∈ [0,1]
15/31
Mémoire de �n d'étude: Etudes statistiques
Rappels de cours
Statistiques con�rmatoires
Régression linéaire
Démarche:
Ï calcul de ρX ,Y
Ï nuage de points
Ï régression
Ï test de nullité: H0 : a = 0, si rejet → régression valide
Ï évaluation re la régression par le R2
B X et Y indépendantes → ρX ,Y = 0 mais la réciproque est fausse!
16/31
Mémoire de �n d'étude: Etudes statistiques
Pratique sur Excel
Prérequis
Excel: rappels
Ï tableur, classeur, feuilles, cellules
Ï fonctions
Ï glissements de formules
Ï �ltres
17/31
Mémoire de �n d'étude: Etudes statistiques
Pratique sur Excel
Prérequis
tableur, classeur, feuilles, cellules
18/31
Mémoire de �n d'étude: Etudes statistiques
Pratique sur Excel
Prérequis
fonctions excel
Fonctions très pratiques:
Ï =SOMME()
Ï =MOYENNE()
Ï =ECARTYPEP()
Ï ...
19/31
Mémoire de �n d'étude: Etudes statistiques
Pratique sur Excel
Prérequis
glisser les formules
20/31
Mémoire de �n d'étude: Etudes statistiques
Pratique sur Excel
Prérequis
�ltrer
21/31
Mémoire de �n d'étude: Etudes statistiques
Pratique sur Excel
Prérequis
�ltrer
22/31
Mémoire de �n d'étude: Etudes statistiques
Pratique sur Excel
Prérequis
�ltrer
23/31
Mémoire de �n d'étude: Etudes statistiques
Pratique sur Excel
Prérequis
Excel: charger utilitaire d'analyseSur Excel 2007:
Ï cliquer sur le symbole microsoft en haut à gaucheÏ sélectionner "Options Excel"
Sur Excel 2010:Ï cliquer sur l'onlet "Fichier" en haut à gaucheÏ cliquer sur "Options" à gauche
Puis:Ï cliquer sur "Compléments" à gaucheÏ cliquer sur "Analysis ToolPack"Ï cliquer sur "Atteindre"Ï cocher "Analysis ToolPack" et "Analysis ToolPack - VBA"Ï cliquer sur "OK"
Ensuite, pour l'utiliser, aller dans l'onglet Données, il se trouve tout
à droite24/31
Mémoire de �n d'étude: Etudes statistiques
Pratique sur Excel
Statistiques exploratoires
Statistiques descriptives
Ï NE PAS NOYER LE LECTEUR!!! → ne présenter que
l'essentiel
Ï variables quantitatives: moyennes, écart-types,
histogrammes
Ï variables qualitatives: diagrammes
Ï corrélations entre les variables
25/31
Mémoire de �n d'étude: Etudes statistiques
Pratique sur Excel
Statistiques exploratoires
Histogramme avec l'utilitaire d'analyse
Ï dé�nir les classes
Ï indiquer plage de sortie
Ï sélectionner représentation graphique
26/31
Mémoire de �n d'étude: Etudes statistiques
Pratique sur Excel
Statistiques con�rmatoires
Tests statistiques avec Excel
Ï indépendance de 2 variables qualitatives → fonction Excel
"TEST.khideux()" → p-value
Ï Egalités de moyennes → utilitaire d'analyse
Ï Egalités de variances → utilitaire d'analyse
27/31
Mémoire de �n d'étude: Etudes statistiques
Pratique sur Excel
Statistiques con�rmatoires
Test d'indépendance (Khi-deux) avec Excel
Ï partir d'un tableau d'e�ectifs observés
Ï faire un tableau d'e�ectifs attendus (en cas d'indépendance):
A et B indépendants → P(A∩B) = P(A)×P(B)
Ï p-value=TEST.khideux(tableau observé;tableau attendu)
28/31
Mémoire de �n d'étude: Etudes statistiques
Pratique sur Excel
Statistiques con�rmatoires
Interprétation des résultats de test avec l'utilitaire d'analysesur Excel
29/31
Mémoire de �n d'étude: Etudes statistiques
Pratique sur Excel
Statistiques con�rmatoires
Interprétation des résultats de régression linéaire avecl'utilitaire d'analyse sur Excel
30/31
Mémoire de �n d'étude: Etudes statistiques
Pratique sur Excel
Statistiques con�rmatoires
Fin du cours
AU BOULOT!!!
31/31