31

Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

  • Upload
    buinhi

  • View
    263

  • Download
    2

Embed Size (px)

Citation preview

Page 1: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Mémoire de �n d'étude:

Etudes statistiques

Nicolas Sutton-Charani

Université Montpellier 1

1/31

Page 2: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

PlanRappels de cours

La baseLa Statistique

Types des variables

Outils mathématiques

Statistiques descriptives ou exploratoiresMoyennes, variances, écart-type

Corrélation

Statistiques con�rmatoiresTests

Régression, prédiction

Pratique sur Excel

Prérequis

Statistiques exploratoiresHistogrammes

Statistiques con�rmatoiresTests

Régression linéaire 2/31

Page 3: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Rappels de cours

La base

Principe de la Statistique

Dé�nition: La statistique est l'ensemble des méthodes qui ont

pour objet la collecte, le traitement et l'interprétation de données

d'observation relatives à un groupe d'individus ou d'unités.

Idée: Généraliser à une population des résultats observés sur un

échantillon (x1, . . . ,xn).

Concrètement, une statistique = un résumé des données

3/31

Page 4: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Rappels de cours

La base

Variables

Ï quantitative → nombres: taille, poids,...

Ï qualitative → classes: couleur, type de traitement,...

B souvent discutable → se poser la question d'un ordre régulier

des classes

4/31

Page 5: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Rappels de cours

La base

Outils

Outil incontournable: Théorie des probabilités → mathématiques

2 théorèmes fondamentaux:

Ï Loi des grands nombres: X̄ = X1+···+Xnn →µ

Ï Théorème central limite:X̄−µσ/pn

→N (0,1)

B ces 2 outils supposent que l'échantillon est iid.

5/31

Page 6: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Rappels de cours

Statistiques descriptives ou exploratoires

Variable quantitatives

Moyenne:

moyenne théorique µ= E[X ] estimée par X̄ = X1+···+Xnn

B moyenne pas sensible à la variabilité → variance, écart-type

Variance et écart-type:

variance théorique σ2 = Var[X ] = E[X 2]−E[X ]2

→ estimée par (X1−X̄)2+···+(Xn−X̄)2

n−1

Ecart-type (théorique) σ=pσ2

6/31

Page 7: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Rappels de cours

Statistiques descriptives ou exploratoires

Variable quantitativesVisualisation graphique: HISTOGRAMME

variable quantitative → qualitative

comment créer les classes? → plusieurs façons7/31

Page 8: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Rappels de cours

Statistiques descriptives ou exploratoires

Histogramme à pas �xe

Ï nombre de classes: K =pn ou 1+ ln(n)

ln(2) (entre 5 et 20 classes)

Ï ordonner les données → x1 ≤ ·· · ≤ xn

Ï calcul des bornes:a0, . . . ,aK

Souvent:

a0 = x1 −0.025(xn −x1) (1)

aK = xn +0.025(xn −x1) (2)

→ détermination du pas: h = aK−a0K

→ ak = ak−1 +h

8/31

Page 9: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Rappels de cours

Statistiques descriptives ou exploratoires

Variable qualitative

diagrammes en bâton ou en secteur: représentation graphique

des e�ectifs ou proportions de chaque classe

classe blonds chatains roux bruns cheveux blancs chauve

e�ectif 20 50 6 30 15 8

9/31

Page 10: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Rappels de cours

Statistiques descriptives ou exploratoires

Corrélation: cas quantitatif

Dépendance entre variables

Covariance: σ2XY = Cov(X ,Y ) = E[XY ]−E[X ]E[Y ]

Coe�cient de corrélation: ρX ,Y = Cov(X ,Y )pVar(X)Var(Y )

= σ2XY

σXσY∈ [0,1]

X 1, . . . ,X J → matrice de corrélation:

ρ1,1 . . . ρ1,J...

...

ρJ ,1 . . . ρJ ,J

=

σ21 ρ1,2 . . . ρ1,J−1 ρ1,J...

...

ρJ ,1 ρJ ,2 . . . ρJ ,J−1 σ2J

où σ2

i = Var(Xi) et ρi,j = ρXi,Xj

10/31

Page 11: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Rappels de cours

Statistiques descriptives ou exploratoires

Corrélation: cas qualitatif

Ï lien entre une variable quantitative X et une autre qualitative

Y à K classes

→ comparer X sur les K sous-échantillons (déterminés par la

classe de Y )

Ï lien entre 2 variables qualitatives

→ test du Khi-Deux

11/31

Page 12: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Rappels de cours

Statistiques con�rmatoires

Tests statistiques

2 types principaux d'hypothèse à tester:

Ï Egalité de moyenne

→ Student, Ecart réduit, etc

Ï Indépendance

→ Khi-Deux, régression

Rappel:

Ï hypothèse nulle H0 = statut-quo (égalité, indépendance, etc)

Ï calcul de la statistique de test tobs et du seuil critique tα pour

un certain risque toléré α

Ï conclusion: tobs > tα → rejet de H0 (Bexceptions)

12/31

Page 13: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Rappels de cours

Statistiques con�rmatoires

Tests statistiques

B il peut arriver qu'on rejette H0 pour α= 5% alors qu'on ne

l'aurait pas rejeter pour α= 1%

→ regarder la p-value:

Pour un test donné, (x1, . . . ,xn) → p-value

p-value < α→ rejet de H0

C'est le risque maximal impliquant le rejet de H0

13/31

Page 14: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Rappels de cours

Statistiques con�rmatoires

Tests statistiques

Choisir le bon test en fonction de certains critères:

Ï que veut-on faire?

Ï type de(s) variable(s)?

Ï données appariées?

Ï comparaison de moyennes: → même variance? → test de

Fisher

14/31

Page 15: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Rappels de cours

Statistiques con�rmatoires

Régression linéaire

On se pose ici la question d'un éventuel lien linéaire entre 2

variables du type Y = aX +b

→ on cherche à calculer a et b à partir d'un échantillon

(x1,y1), . . . , (xn,yn)

Si on y arrive, on pourra prédire Y à partir de X

En général ce lien = imparfait → évaluation de la régression:

coe�cient R2 ∈ [0,1]

15/31

Page 16: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Rappels de cours

Statistiques con�rmatoires

Régression linéaire

Démarche:

Ï calcul de ρX ,Y

Ï nuage de points

Ï régression

Ï test de nullité: H0 : a = 0, si rejet → régression valide

Ï évaluation re la régression par le R2

B X et Y indépendantes → ρX ,Y = 0 mais la réciproque est fausse!

16/31

Page 17: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Pratique sur Excel

Prérequis

Excel: rappels

Ï tableur, classeur, feuilles, cellules

Ï fonctions

Ï glissements de formules

Ï �ltres

17/31

Page 18: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Pratique sur Excel

Prérequis

tableur, classeur, feuilles, cellules

18/31

Page 19: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Pratique sur Excel

Prérequis

fonctions excel

Fonctions très pratiques:

Ï =SOMME()

Ï =MOYENNE()

Ï =ECARTYPEP()

Ï ...

19/31

Page 20: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Pratique sur Excel

Prérequis

glisser les formules

20/31

Page 21: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Pratique sur Excel

Prérequis

�ltrer

21/31

Page 22: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Pratique sur Excel

Prérequis

�ltrer

22/31

Page 23: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Pratique sur Excel

Prérequis

�ltrer

23/31

Page 24: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Pratique sur Excel

Prérequis

Excel: charger utilitaire d'analyseSur Excel 2007:

Ï cliquer sur le symbole microsoft en haut à gaucheÏ sélectionner "Options Excel"

Sur Excel 2010:Ï cliquer sur l'onlet "Fichier" en haut à gaucheÏ cliquer sur "Options" à gauche

Puis:Ï cliquer sur "Compléments" à gaucheÏ cliquer sur "Analysis ToolPack"Ï cliquer sur "Atteindre"Ï cocher "Analysis ToolPack" et "Analysis ToolPack - VBA"Ï cliquer sur "OK"

Ensuite, pour l'utiliser, aller dans l'onglet Données, il se trouve tout

à droite24/31

Page 25: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Pratique sur Excel

Statistiques exploratoires

Statistiques descriptives

Ï NE PAS NOYER LE LECTEUR!!! → ne présenter que

l'essentiel

Ï variables quantitatives: moyennes, écart-types,

histogrammes

Ï variables qualitatives: diagrammes

Ï corrélations entre les variables

25/31

Page 26: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Pratique sur Excel

Statistiques exploratoires

Histogramme avec l'utilitaire d'analyse

Ï dé�nir les classes

Ï indiquer plage de sortie

Ï sélectionner représentation graphique

26/31

Page 27: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Pratique sur Excel

Statistiques con�rmatoires

Tests statistiques avec Excel

Ï indépendance de 2 variables qualitatives → fonction Excel

"TEST.khideux()" → p-value

Ï Egalités de moyennes → utilitaire d'analyse

Ï Egalités de variances → utilitaire d'analyse

27/31

Page 28: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Pratique sur Excel

Statistiques con�rmatoires

Test d'indépendance (Khi-deux) avec Excel

Ï partir d'un tableau d'e�ectifs observés

Ï faire un tableau d'e�ectifs attendus (en cas d'indépendance):

A et B indépendants → P(A∩B) = P(A)×P(B)

Ï p-value=TEST.khideux(tableau observé;tableau attendu)

28/31

Page 29: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Pratique sur Excel

Statistiques con�rmatoires

Interprétation des résultats de test avec l'utilitaire d'analysesur Excel

29/31

Page 30: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Pratique sur Excel

Statistiques con�rmatoires

Interprétation des résultats de régression linéaire avecl'utilitaire d'analyse sur Excel

30/31

Page 31: Mémoire de fin d'étude: Etudes statistiques sur Excel Prérequis ... Corrélation: cas quantitatif Dépendance entre variables Covariance: ... Sur Excel 2010:

Mémoire de �n d'étude: Etudes statistiques

Pratique sur Excel

Statistiques con�rmatoires

Fin du cours

AU BOULOT!!!

31/31