Upload
others
View
18
Download
0
Embed Size (px)
Citation preview
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
Chapitre 2
---
Introduction aux Probabilités Les principales lois
1. Notion d’expérience aléatoire
Chap 2. • Expérience aléatoire • Opérations • Variables discrètes • Lois pour les var. discrètes • Variables continues • Lois pour les var. continues
• Expériences déterministes: obéissant à des lois connues; • Expériences aléatoires:
Série de résultats imprévisibles (issues); Répétées dans des conditions identiques, exp. ne donne pas forcément le même résultat.
Une expérience déterministe pourra être entachée d’erreurs => résultats répartis autour de la loi étudiée.
En environnement: variabilité naturelle + incertitudes liées à la mesure/l’observation è expériences donc souvent considérées comme aléatoires.
Quelques notions de base:
• Issue= résultat d’une expérience aléatoire
• Univers des possibles ou ensemble fondamental Ω = ensemble des issues possibles
• Evénement = sous-ensemble de Ω; Evénement élémentaire A = une seule issue • A chaque événement A correspond
une probabilité de se réaliser:
Ensemble complémentaire à A:
Ensemble fondamental:
1)(0 ≤≤ AP
1)( =ΩP
)(1)( APAP −=
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
Exemple du jet de dés:
Ensemble fondamental: { }6,5,4,3,2,1=Ω
On considère l’événement pour lequel on obtient un chiffre paire:
{ }6,4,2=AProbabilité de cet événement:
( )21
63==AP
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
Chap 2. • Expérience aléatoire • Opérations • Variables discrètes • Lois pour les var. discrètes • Variables continues • Lois pour les var. continues
3. Variables aléatoires discrètes
3.1 Cas univarié
Ω est souvent très grand et on ne s’intéresse pas au détail des événements individuels. On définit alors une variable aléatoire X à partir de l’ensemble des possibles Ω, en associant un nombre réel caractéristique à chaque événement.
Variable aléatoire discrète: variable aléatoire ne peut prendre qu’un nombre entier de valeurs. Exemple: n lancés d’une pièce: la variable aléatoire X (nombres de faces parmi n épreuves) peut prendre les valeurs 0,1,2….,n. Ici, la variable aléatoire X ne peut prendre qu’un nombre fini ou dénombrable de valeurs.
Convention: X = variable; x= valeur prise.
Domaine de définition ou support: ensemble des valeurs de X { }nX xxxD ,...,, 21=Probabilité associée à l’événement X=x: pX =P(X=x)
Loi de probabilité: relation entre x et P(x).
1)(
1)(0
==
≤=≤
∑i
i
i
xXP
xXP
Fonction de répartition: F(x) ∈ [0,1]
∑≤
==≤=xx
ii
xXPxXPxF )()()(
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
Espérance de X (ou valeur moyenne, moyenne théorique, moyenne en population):
∑ ===x
X xXPxXE )()( µ
≠ de la moyenne expérimentale (pour n réalisations):
∑=
==n
iixn
xm0
1
Propriétés de l’espérance:
Si a et b sont deux constantes, et X et Y deux variables aléatoires, alors:
)()()()()(YEXEYXEbxEabaXE
+=+
+=+
Exemple: si l’on répète indéfiniment un jet de dé, la variable aléatoire X étant le nombre affiché sur le dé, l’espérance de X se calcule comme:
5,3616
615
614
613
612
611)()( =+++++==∑
xxxPxE
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
Variance de X:
( )( ) ( ) )()( 222 xPXXEXVARx
X ∑ −=−== µµσ
Propriétés de la variance:
)()(
)()(
0)(
2
22
XVarabaXVAR
XEXVAR
XVAR
X
=+
−=
≥
µ
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
3.2 Cas bivarié
L’expérience est ici décrite par 2 variables aléatoires discrètes. En plus des propriétés statistiques des variables individuelles, il faut alors de tenir compte des propriétés jointes du couple.
Loi de probabilité jointe du couple (X,Y) X prend valeurs x ∈ domaine de définition DX; X prend valeurs y ∈ domaine de définition DY;
),(),( yYxXPyxpXY ===
1),(),(1 1,
====∑∑∑= =∈∈
n
i
m
jji
DyDxXY yYxXPyxpYX
Lois de probabilité marginales de X et Y
( ) ( )
( ) ( )∑∑
∑∑
=∈
=∈
======
======
n
ii
DxXYY
m
jj
DyXYX
yYxXPyxpyYPyp
yYxXPyxpxXPxp
X
Y
1
1
,,)()(
,,)()(
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
Lois de probabilité conditionnelle de Y sachant X=x0 :
∑=
==
==== m
jjXY
XY
yxp
yxpxXP
yYxXPxXYP
10
0
0
00
),(
),()(),()/(
Deux variables discrètes aléatoires sont indépendantes si et seulement si:
00 ,)()/( xyyYPxXYP ∀∀===
Définition équivalente à la propriété de multiplication des probabilités:
)()(),( xXPyYPxXyYP =====
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
Matrice de variance-covariance permet de résumer les caractéristiques du couple de variables:
⎟⎟⎠
⎞⎜⎜⎝
⎛=∑ )(),(
),()(, YVarYXCov
YXCovXVarYX
Variance d’une combinaison linéaire:
),(2)()()(),(2)()()(
22 YXabCovYVARbXVARabYaXVARYXCovYVARXVARYXVAR
++=+
++=+
Espérance d’une distribution bivariée: couple de valeurs
( ) )(),(),( YEXEXYE =Si les variables sont indépendantes: )()(),( YEXEXYE =Sinon, on doit tenir compte de la covariance:
( )( )( )
)()()()()(),cov(YEYXEXE
YEXEXYEXY−−=
−=
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
Chap 2. • Expérience aléatoire • Opérations • Variables discrètes • Lois pour les var. discrètes • Variables continues • Lois pour les var. continues
4. Quelques lois pour les variables aléatoires discrètes
4.1 La loi de Bernouilli
S’applique dans le cas d’événements binaires, ayant 2 solutions possibles: succès et échec, de probabilités respectives p et q=1-p. On a alors:
pXE =)()1()( pppqXVAR −==
Exemple: jet de pièce: Probabilité d’obtenir pile p = q =1/2 Même chose pour probabilité d’avoir un enfant de sexe féminin ou masculin, etc.
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
4.2 Loi Binomiale B(n, p)
S’applique pour le cas de n épreuves de Bernoulli (2 solutions) indépendantes.
Exemples: • Nombre de 6 obtenus en lançant 10 fois un même dé. • Nombre de graines qui vont germer sur un total de 100 graines semées.
)1()()(
)()(
1
1
pnpnpqXVARXVAR
npXEXE
n
ii
n
ii
−===
==
∑
∑
=
=
Propriétés:
∑=
=n
iiXX
1
Variable aléatoire X = nombre de d’apparition d’un événement A donné (succès), avec Ω={0,1,2,….,n}.
A chaque tirage, on peut associer une variable de Bernoulli Xi et donc la variable binomiale est équivalente à:
Exemple: n lancés d’une pièce non truquée. Variable aléatoire sera le nombre de succès, face par exemple, sur les n lancés.
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
xnxi qpxXP
−== )(
xnxxn qpCxXP
−== )(
!)!(!xxn
nCxn −= Où n!=n(n-1)(n-2)(n-3)…1
Avec 0!=1
Nombre de combinaisons possibles pour obtenir x succès (X = x):
L’événement considéré, dont on veut déterminer la probabilité est une suite particulière de x succès, et n-x échec sur les n épreuves. Les épreuves étant indépendantes, et chacune ayant une probabilité p, la probabilité d’obtenir x succès est donc:
La probabilité d’avoir x succès quel que soit l’ordre des succès et des échecs (combinaisons) est donc:
Loi de probabilité:
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
La loi binomiale est donc caractérisée par deux paramètres: • Nombres n d’épreuves de Bernoulli • Probabilité p de succès d’une épreuve de Bernoulli
Propriété: Si deux variables indépendantes sont de loi binomiale de même paramètre p, alors leur somme est aussi une loi binomiale. On dit alors que la loi binomiale est fermée sous l’addition. Ainsi:
2
1
XX
),(),(
2
1
pnBpnB ),( 21 pnnB +21 XX +
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
4.3 Loi de Poisson
Cette loi caractérise une variable aléatoire entière ≥ 0 qui satisfait à:
IRINxx
xXPx
∈∈== − λλλ etoù!
e)(
En pratique: s’applique à des événements rares (e.g. comptabilité des accidents, défauts dans une chaîne de production, éruptions volcaniques…) Elle correspond à une succession de lois de Bernoulli avec:
• p très faible (p< 0.1) par rapport à n (> 50) • le produit np tendant vers un nombre fini λ.
On a alors:
∑=
−− ≈==n
x
xnpxnxx
n xnpqpCxXP
PpnB
0 !)(e)(
)(~),( λou
Exemples: P(1) P(2) P(5)
x x x
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
Propriétés de P(λ):
λ=)(XEλ=)(XVAR
Soient X et Y deux variables aléatoires indépendantes qui suivent des lois de Poisson de paramètres λ et μ, alors X+Y est une variable aléatoire qui suit la loi de Poisson de paramètre λ + μ. Démo:
µλ
µ
λ
+=+=+=>
=
=
)()()()()(
YEXEYXEYEXE
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
Chap 2. • Expérience aléatoire • Opérations • Variables discrètes • Lois pour les var. discrètes • Variables continues • Lois pour les var. continues
5. Les variables aléatoires continues
5.1 Cas univarié
Fonction de répartition ou fonction de distribution cumulée:
IRxxXPxF ∈≤= pour)()(
Propriétés de cette fonction: • continue • croissante : si x1 ≤ x2 alors F(x1) ≤ F(x2) • ∈ [0 1]
Fonction de densité de probabilité ou fonction de distribution: Permet de décrire le comportement de la variable de manière détaillée.
dxxdFxf )()( =
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
Exemple:
)( 21 xXxP ≤≤
)(xf
1x 2x
Cette fonction n’est nulle que pour des valeurs impossibles et vérifie:
Probabilité sur des intervalles donnés:
∫∞−
=≤=
2
d)()()(
x
uufxXPxF
1d)( =∫+∞
∞−
uuf
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
5.2 Cas bivarié
On définit alors une fonction de densité de probabilité jointe du couple (X,Y), fX,Y sur le domaine de définition DX x DY dans [0,1].
Propriétés: •
• Densités de probabilités marginales
1=∫ ∫X YD D
dxdyyxf ),(
∫∫ ===XY DD
dxyxfdyyxfyfxf ),(),()()(
• Densité conditionnelle de Y sachant X=x0, x0 ∈ DX
∫==
YD
dyyxfyxf
xfyxfxyf
),(),(
)(),()/(
0
0
0
00
• Si X et Y sont indépendantes: yxyfxfyxf ∀∀= ,)()(),(
• Fonction de distribution cumulée:
IRyIRxyYxXPyxF ∈∈≤≤= ,),(),( pour
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
5.3 Moments d’une distribution
Paramètres caractéristiques permettant de résumer une distribution: caractérisent la position et la forme de la distribution.
Moyenne ou espérance
Propriétés:
• E(a)=a avec a constante réelle; • E(aX+b)=aE(X)+b avec a et b constantes réelles; • E(X+Y)=E(X)+E(Y) où X et Y sont des variables aléatoires continues. • E(g(X))=∫ g(x) f(x) dx
Remarque: Variable centrée è moyenne nulle
∫∞
∞−= dxxfxXE )()(
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
Variance: caractérise la dispersion autour de la moyenne
( )[ ]( )∫
∞+
∞−−=
−=−=
dxxfXEX
XEXEXEXEXVAR
)()(
)()()()(2
222
Equivalent à l’écart type au carré.
2)( XXVAR σ=
Propriétés: • VAR(a)=0 avec a constante réelle; • VAR(aX+b)=a2VAR(X) avec a et b constantes réelles; • VAR(X+Y)=VAR(X)+VAR(Y) où X et Y sont des variables aléatoires continues indépendantes.
Remarque: Variable réduite è σ =1
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
5.4 Multivariables aléatoires
Au cours d’une expérience, on peut être amenés à s’intéresser à plusieurs variables simultanément. On définit alors un ensemble de N variables aléatoires:
(X1, X2, X3, …, XN) Comme pour le cas bivarié, on devra alors définir une densité de probabilité jointe ou une fonction de distribution cumulée:
IRxIRxxXxXxXPxxxF
N
NNN
∈∈
≤≤≤=
,...,),...,,(),...,,(
1
221121
pour
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
Chap 2. • Expérience aléatoire • Opérations • Variables discrètes • Lois pour les var. discrètes • Variables continues • Lois pour les var. continues
6. Quelques lois de probabilité pour les variables aléatoires continues
6.1 La loi uniforme
Densité de probabilité f(x) Fonction de répartition F(x)
Caractérise une variable aléatoire équiprobable dans un intervalle [a,b].
⎪⎩
⎪⎨
⎧
>
≤≤−
<
=
bx
bxaab
axxf
si
si
si
0
10
)(⎪⎩
⎪⎨
⎧
>
≤≤−
−<
=
bx
bxaabax
axxF
si
si
si
1
0)(
∫
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
( )12
)()()()()(
221)()(
22222
2
abXEdxxfxXEXEXVAR
baxab
dxabxdxxfxXE
b
a
b
a
−=−=−=
+=⎥
⎦
⎤⎢⎣
⎡
−=
−==
∫
∫∫∞+
∞−
+∞
∞−
Paramètres de la loi uniforme:
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
6.2 La loi exponentielle
Densité de probabilité f(x) Fonction de répartition F(x)
La variable X suit une loi exponentielle de paramètre λ si
xxXPxF λ−=>= e)()(
xxXPxF λ−−=>= e1)()(⎩⎨⎧
<
≥=
−
000e
)(xx
xfx
si
siλλ ∫
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
C’est une loi typiquement utilisée pour les phénomènes faisant intervenir une durée de vie (radioactivité, réponse des composants électroniques, etc…)
Paramètres:
2
1)(
1)(
λ
λ
=
=
XVAR
XE
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
6.3 La loi normale
Densité de probabilité f(x) Fonction de répartition F(x)
Une variable aléatoire suit une loi normale si sa densité de probabilité est telle que:
2
21
e21)(
⎟⎟⎠
⎞⎜⎜⎝
⎛ −−
= σπσ
Xx
xf
),( 2σXN
2)()(
σ=
=
XVARXXE
avec
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
Changement de variable: Toute variable aléatoire Gaussienne peut se ramener par à une variable aléatoire gaussienne centrée-réduite suivant la loi normale N(0,1), i.e. E(U)=0, σ=1.
σXxU −=
⎟⎠
⎞⎜⎝
⎛ −
=2
21
e21)(
uuf
π
Propriété d’additivité: Si X1 et X2 sont des variables indépendantes suivant des lois normales alors: ⎟
⎟⎠
⎞⎜⎜⎝
⎛++ 22
2121 , σσXXN21 XX + suit une loi normale
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
Fonction de répartition:
Si u
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
Exemple: Température moyenne d'une ville – Loi normale La température X (en degrés Celsius) dans une ville à un jour donné est une variable de loi
N(22,4). Calculez:
a) P(X < 16) b) P(X > 30) c) P( |X-24| < 10) Changement de variable pour utilisation de la loi Normale N(0,1) ⇒ utilisation d’une variable centré réduite.
a) P(X 4) = 1 – P(U
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
6.4 La loi du Chi2
On considère n variables aléatoires indépendantes gaussiennes centrées et réduites Ui. Une variable suivra une loi du Chi2 à n degrés de liberté si elle peut être définie comme:
223
22
21
2 ... nn UUUU ++++=χ
Densité de probabilité f(x) Fonction de répartition F(x)
(k degrés de liberté)
Paramètres:
nVARnE
n
n
2)(
)(2
2
=
=
χ
χ
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
La Table donne pour une variable centrée réduite qui suit une loi de Fischer, les fractiles en fonction du nombre de degrés de liberté ν. Ainsi pour une degré de liberté de 30, Pratiquement, ces tables permettent de trouver le fractile ( ici 40,255), si on choisit la probabilité ( ici 0.9).
0.9 40,255) P( ==230χ
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
6.5 La loi de Student
Densité de probabilité f(x) Fonction de répartition F(x)
On considère deux variables aléatoires indépendantes U è N(0,1); X è
La variable aléatoire suivante suit une loi de Student de degré de liberté n:
2nχ
nXUTn =
Si n à ∞ (n > 30 en pratique), la loi de Student tend vers la loi normale standard (moyenne nulle, écart type égal à 1).
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
Table donnant les valeurs de T ayant la probabilité d’être dépassées: (Attention: il ne s’agit plus de la fonction de répartition)
Pour un degré de liberté de 10, P(T ≥ 2,228) = 0,05 La fonction de répartition peut alors être déduite: P(T ≤ 2,228) =1− P/2= 0,95
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC
6.6 La loi de Fisher-Snedecor
On considère 2 variables indépendantes X1 et X2 suivant des lois du Chi2 de degrés de liberté n et m. La variable aléatoire suivante suit une loi de Fisher-Snedecor:
mXnX
Fm
n
mn =,
C’est une loi non-symétrique ayant les propriétés suivantes:
mnmnmn F
FFFP,,
,,1,,1)(α
ααα =>= − alors Si
Cela permet de calculer des probabilités sur les deux ailes de la distribution.
Densité de probabilité f(x) Fonction de répartition F(x)
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC