1 Étude dun caractère Présentation des résultats Calcul des indicateurs Interprétation Étude...
of 22/22
1 Étude d’un caractère Présentation des résultats Calcul des indicateurs Interprétation Étude simultanée de deux caractères Tableau de contingence Conditionnement Ajustement Statistique
1 Étude dun caractère Présentation des résultats Calcul des indicateurs Interprétation Étude simultanée de deux caractères Tableau de contingence Conditionnement
Text of 1 Étude dun caractère Présentation des résultats Calcul des indicateurs Interprétation Étude...
Page 1
1 tude dun caractre Prsentation des rsultats Calcul des
indicateurs Interprtation tude simultane de deux caractres Tableau
de contingence Conditionnement Ajustement Statistique
Page 2
2 1. Tri des donnes Utilisation des outils Diagramme en tiges
et feuilles tude dun caractre
Page 3
3 TigeFeuilles 1051 111 120 5 6 65 130 2 3 4 5 8 812 141 4 6 8
8 8 919 150 0 0 1 1 3 3 4 4 5 6 6 832 160 0 3 4 4 5 6 8 841 170 2 2
945 Soit une srie de 45 valeurs de taux dhmoglobine (en g.L 1 )
105, 120, 125, 126, 126, 130, 132, 133, 134, 135, 138, 138, 141,
144, 146, 148, 148, 148, 149, 150, 150, 150, 151, 151, 153, 153,
154, 154, 155, 156, 156, 158, 160, 160, .., 179 Quartiles : 1 er
quartile : la plus petite valeur observe telle que, au moins 25%
des donnes lui soient infrieures ou gales. Site Euler : Lexique et
Fiches n 470 Mdiane
Page 4
4 Indicateur de centralitIndicateur de dispersion Mdiane
Quantiles, intervalle interquartile.. Moyennecart type 2.
Caractrisation dune srie statistique
7 effectifsOABABTotal R 3 5663 9687533858672 RR 576578110641328
Total4142454686344910 000 Groupe sanguin et facteur Rhsus (10 000
naissances dans des maternits de France) frquencesOABABTotal R
0,35660,39680,07530,03850,8672 RR 0,05760,05780,01100,00640,1328
Total0,41420,45460,08630,04491 Frquences marginales : f (O) =
0,4142 f (R + ) = 0,8672 Frquences partielles ou conjointes : f (O
R ) = 0,3566 Frquences par rapport la population totale Sries
statistiques deux variables 1. Deux variables qualitatives : tude
frquentielle
Page 8
8 frquencesOABABTotal R 0,35660,39680,07530,03850,8672 RR
0,05760,05780,0110,00640,1328 Total 0,41420,45460,08630,04491
Frquence de R + sachant O : Frquence de O sachant R + : Frquences
conditionnelles Frquences par rapport une sous - population
Consquence :
Page 9
9 Arbre de rpartition des frquences f (O) f (O R + ) =f O (R +
) f (O) R+R+ R-R- R+R+ R+R+ R+R+ R-R- R-R- R-R- A O B AB
Page 10
10 Ajustement Sur chaque individu dune population de n
individus, on mesure deux variables, x et y. Les valeurs prises par
x et y pour un individu donn sont notes x i et y i. On cherche sil
existe une relation simple entre x et y. 2. Deux variables
quantitatives Nuage de points, point moyen Exemple
Page 11
11 Probabilits Introduction : simulation dpreuves alatoires et
fluctuation dchantillonnage Existence dun modle thorique, loi de
probabilit Conditionnement et indpendance
Page 12
12 familles de 4 enfants : nombre de filles F G F F F F F F G G
G G G Nombre de Filles F............................ 4
G............................ 3 F............................ 3
G............................ 2 F............................ 3
G............................ 2 F............................ 2
G............................ 1 F............................ 3
G............................ 2 F............................ 2
G............................ 1 F............................ 2
G............................ 1 F............................ 1
G............................ 0 G Valeurs possibles01234
probabilits Simulation 1. Existence dun modle thorique
Page 13
13 2. Probabilits conditionnelles Groupes sanguins et facteur
rhsus Choix dune personne au hasard dans la population P(O) =
0,4142P(R ) = 0,8672 P(O R ) = 0,3566 Probabilit de R + sachant O :
Proprit : La probabilit sachant O est une nouvelle probabilit sur
le mme univers. OABABTotal R 356639687533848672 RR 576578110641328
Total4142454686344910 000 Consquence : Fiches Euler : 326 -
436
Page 14
14 frquencesOABABTotal R 0,35660,39680,07530,03850,8672 RR
0,05760,05780,0110,00640,1328 Total0,41420,45460,08630,04491
OABABTotal f RH+ (...)0,4110,4580,0870,0441 f RH
(...)0,4340,4350,0830,0481 f O (...) f A (...)f B (...)f AB (...)
RH + 0,8610,873 0,857 RH 0,1390,127 0,143 Total 1111 Frquences
conjointes et frquences marginales Frquences conditionnelles, selon
le groupe sanguin Frquences conditionnelles, selon le facteur rhsus
3. Indpendance f RH+ (O) f (O) f O (RH+) f (RH+)
Page 15
15 Deux vnements A et B, tels que P(A) 0 et P(B) 0 sont
indpendants si et seulement si P B (A) = P(A). La ralisation de B
ne modifie pas la valeur de la probabilit de A. Soit deux vnements
A et B, tels que P(A) 0 et P(B) 0. Deux vnements A et B, tels que
P(A) 0 et P(B) 0 sont indpendants si et seulement si P (A B) = P(A)
P(B). Dfinition de lindpendance Fiche Euler : 446
Page 16
16 B : la famille compte exactement deux filles A : lain est
une fille Nombre de filles dans une famille de 4 enfants Les
vnements A et B sont indpendants. Les vnements A et C ne sont pas
indpendants C : la famille compte au moins deux filles
Page 17
17 Arbre de probabilit Deux tirages successifs dans une urne
contenant 3 boules blanches et deux boules noires. 1 er cas :
Tirages sans remise N1N1 B2B2 B1B1 B2B2 N2N2 N2N2
Page 18
18 2 me cas : Tirages avec remise N1N1 B2B2 B1B1 B2B2 N2N2 N2N2
Tirages indpendants Deux tirages successifs dans une urne contenant
3 boules blanches et deux boules noires.
Page 19
19 On dispose dun test de dpistage pour une maladie qui peut
affecter les individus dune certaine population. Application : Test
de dpistage vnements : M : tre malade T + : prsenter un test
positif T : prsenter un test ngatif MaladesNon MaladesTotal Test
PositifVrais PositifsFaux Positifs Test Ngatif Faux Ngatifs Vrais
Ngatifs Total
Page 20
20 talonnage : donnes statistiques et dfinition dun modle
Comment interprter le rsultat dun test qui aurait t pratiqu sur un
individu appartenant la population considre ? Quelle est la
probabilit, sachant que le test est positif, dtre malade ?
Utilisation du test et calcul de probabilits Prvalence : p = P(M)
Quelle est la probabilit, sachant que le test est ngatif, de ntre
pas malade ? Sensibilit : Valeur Prdictive Positive : Valeur
Prdictive ngative : Spcificit :
Page 21
21 Un exemple Prvalence : p = P(M) Sensibilit : Spcificit :
Valeur Prdictive Positive : Valeur Prdictive Ngative : p VPP(p) est
croissante p VPN(p) est dcroissante p 1 p M
Page 22
22 Dpendance ou causalit Lindpendance : une proprit numrique du
modle probabiliste choisi. Lancer dun d 6 faces. Les faces 1 et 2
sont blanches, les faces 3, 4, 5 et 6 sont rouges A: numro pair et
B : face blanche 1 er cas : modle quiprobable P(A) =, P(B) =, P(A
B) = 2 ime cas p 1 = p 2 = p 3 = p 4 = p 5 = 0,165 et p 6 = 0,175
P(A) = 0,33 + 0,175 = 0,505 P(B) = 0,33, P(A B) = 0,165 P(A) P(B) =
0,16665 P(A B) = P(A) P(B) A et B sont indpendants P(A B) P(A) P(B)
A et B ne sont pas indpendants