of 22 /22
1 Étude d’un caractère Présentation des résultats Calcul des indicateurs Interprétation Étude simultanée de deux caractères Tableau de contingence Conditionnement Ajustement Statistique

1 Étude dun caractère Présentation des résultats Calcul des indicateurs Interprétation Étude simultanée de deux caractères Tableau de contingence Conditionnement

Embed Size (px)

Text of 1 Étude dun caractère Présentation des résultats Calcul des indicateurs Interprétation Étude...

  • Page 1
  • 1 tude dun caractre Prsentation des rsultats Calcul des indicateurs Interprtation tude simultane de deux caractres Tableau de contingence Conditionnement Ajustement Statistique
  • Page 2
  • 2 1. Tri des donnes Utilisation des outils Diagramme en tiges et feuilles tude dun caractre
  • Page 3
  • 3 TigeFeuilles 1051 111 120 5 6 65 130 2 3 4 5 8 812 141 4 6 8 8 8 919 150 0 0 1 1 3 3 4 4 5 6 6 832 160 0 3 4 4 5 6 8 841 170 2 2 945 Soit une srie de 45 valeurs de taux dhmoglobine (en g.L 1 ) 105, 120, 125, 126, 126, 130, 132, 133, 134, 135, 138, 138, 141, 144, 146, 148, 148, 148, 149, 150, 150, 150, 151, 151, 153, 153, 154, 154, 155, 156, 156, 158, 160, 160, .., 179 Quartiles : 1 er quartile : la plus petite valeur observe telle que, au moins 25% des donnes lui soient infrieures ou gales. Site Euler : Lexique et Fiches n 470 Mdiane
  • Page 4
  • 4 Indicateur de centralitIndicateur de dispersion Mdiane Quantiles, intervalle interquartile.. Moyennecart type 2. Caractrisation dune srie statistique
  • Page 5
  • 5 TigeFeuilles 1051 111 120 5 6 65 130 2 3 4 5 8 812 141 4 6 8 8 8 919 150 0 0 1 1 3 3 4 4 5 6 6 832 160 0 3 4 4 5 6 8 841 170 2 2 945 Diagramme en bote Q1Q1 Q3Q3 max D1D1 D9D9 me min Fiches Euler : 470 1460 1461
  • Page 6
  • 6 Comparaison de 2 sries
  • Page 7
  • 7 effectifsOABABTotal R 3 5663 9687533858672 RR 576578110641328 Total4142454686344910 000 Groupe sanguin et facteur Rhsus (10 000 naissances dans des maternits de France) frquencesOABABTotal R 0,35660,39680,07530,03850,8672 RR 0,05760,05780,01100,00640,1328 Total0,41420,45460,08630,04491 Frquences marginales : f (O) = 0,4142 f (R + ) = 0,8672 Frquences partielles ou conjointes : f (O R ) = 0,3566 Frquences par rapport la population totale Sries statistiques deux variables 1. Deux variables qualitatives : tude frquentielle
  • Page 8
  • 8 frquencesOABABTotal R 0,35660,39680,07530,03850,8672 RR 0,05760,05780,0110,00640,1328 Total 0,41420,45460,08630,04491 Frquence de R + sachant O : Frquence de O sachant R + : Frquences conditionnelles Frquences par rapport une sous - population Consquence :
  • Page 9
  • 9 Arbre de rpartition des frquences f (O) f (O R + ) =f O (R + ) f (O) R+R+ R-R- R+R+ R+R+ R+R+ R-R- R-R- R-R- A O B AB
  • Page 10
  • 10 Ajustement Sur chaque individu dune population de n individus, on mesure deux variables, x et y. Les valeurs prises par x et y pour un individu donn sont notes x i et y i. On cherche sil existe une relation simple entre x et y. 2. Deux variables quantitatives Nuage de points, point moyen Exemple
  • Page 11
  • 11 Probabilits Introduction : simulation dpreuves alatoires et fluctuation dchantillonnage Existence dun modle thorique, loi de probabilit Conditionnement et indpendance
  • Page 12
  • 12 familles de 4 enfants : nombre de filles F G F F F F F F G G G G G Nombre de Filles F............................ 4 G............................ 3 F............................ 3 G............................ 2 F............................ 3 G............................ 2 F............................ 2 G............................ 1 F............................ 3 G............................ 2 F............................ 2 G............................ 1 F............................ 2 G............................ 1 F............................ 1 G............................ 0 G Valeurs possibles01234 probabilits Simulation 1. Existence dun modle thorique
  • Page 13
  • 13 2. Probabilits conditionnelles Groupes sanguins et facteur rhsus Choix dune personne au hasard dans la population P(O) = 0,4142P(R ) = 0,8672 P(O R ) = 0,3566 Probabilit de R + sachant O : Proprit : La probabilit sachant O est une nouvelle probabilit sur le mme univers. OABABTotal R 356639687533848672 RR 576578110641328 Total4142454686344910 000 Consquence : Fiches Euler : 326 - 436
  • Page 14
  • 14 frquencesOABABTotal R 0,35660,39680,07530,03850,8672 RR 0,05760,05780,0110,00640,1328 Total0,41420,45460,08630,04491 OABABTotal f RH+ (...)0,4110,4580,0870,0441 f RH (...)0,4340,4350,0830,0481 f O (...) f A (...)f B (...)f AB (...) RH + 0,8610,873 0,857 RH 0,1390,127 0,143 Total 1111 Frquences conjointes et frquences marginales Frquences conditionnelles, selon le groupe sanguin Frquences conditionnelles, selon le facteur rhsus 3. Indpendance f RH+ (O) f (O) f O (RH+) f (RH+)
  • Page 15
  • 15 Deux vnements A et B, tels que P(A) 0 et P(B) 0 sont indpendants si et seulement si P B (A) = P(A). La ralisation de B ne modifie pas la valeur de la probabilit de A. Soit deux vnements A et B, tels que P(A) 0 et P(B) 0. Deux vnements A et B, tels que P(A) 0 et P(B) 0 sont indpendants si et seulement si P (A B) = P(A) P(B). Dfinition de lindpendance Fiche Euler : 446
  • Page 16
  • 16 B : la famille compte exactement deux filles A : lain est une fille Nombre de filles dans une famille de 4 enfants Les vnements A et B sont indpendants. Les vnements A et C ne sont pas indpendants C : la famille compte au moins deux filles
  • Page 17
  • 17 Arbre de probabilit Deux tirages successifs dans une urne contenant 3 boules blanches et deux boules noires. 1 er cas : Tirages sans remise N1N1 B2B2 B1B1 B2B2 N2N2 N2N2
  • Page 18
  • 18 2 me cas : Tirages avec remise N1N1 B2B2 B1B1 B2B2 N2N2 N2N2 Tirages indpendants Deux tirages successifs dans une urne contenant 3 boules blanches et deux boules noires.
  • Page 19
  • 19 On dispose dun test de dpistage pour une maladie qui peut affecter les individus dune certaine population. Application : Test de dpistage vnements : M : tre malade T + : prsenter un test positif T : prsenter un test ngatif MaladesNon MaladesTotal Test PositifVrais PositifsFaux Positifs Test Ngatif Faux Ngatifs Vrais Ngatifs Total
  • Page 20
  • 20 talonnage : donnes statistiques et dfinition dun modle Comment interprter le rsultat dun test qui aurait t pratiqu sur un individu appartenant la population considre ? Quelle est la probabilit, sachant que le test est positif, dtre malade ? Utilisation du test et calcul de probabilits Prvalence : p = P(M) Quelle est la probabilit, sachant que le test est ngatif, de ntre pas malade ? Sensibilit : Valeur Prdictive Positive : Valeur Prdictive ngative : Spcificit :
  • Page 21
  • 21 Un exemple Prvalence : p = P(M) Sensibilit : Spcificit : Valeur Prdictive Positive : Valeur Prdictive Ngative : p VPP(p) est croissante p VPN(p) est dcroissante p 1 p M
  • Page 22
  • 22 Dpendance ou causalit Lindpendance : une proprit numrique du modle probabiliste choisi. Lancer dun d 6 faces. Les faces 1 et 2 sont blanches, les faces 3, 4, 5 et 6 sont rouges A: numro pair et B : face blanche 1 er cas : modle quiprobable P(A) =, P(B) =, P(A B) = 2 ime cas p 1 = p 2 = p 3 = p 4 = p 5 = 0,165 et p 6 = 0,175 P(A) = 0,33 + 0,175 = 0,505 P(B) = 0,33, P(A B) = 0,165 P(A) P(B) = 0,16665 P(A B) = P(A) P(B) A et B sont indpendants P(A B) P(A) P(B) A et B ne sont pas indpendants