325
MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS SOSA SANTILLÁN FECHA DE ELABORACIÓN: ENERO 2016

MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

MATERIA: BIOESTADÍSTICA

AUTOR: DR. GERARDO DE JESÚS SOSA SANTILLÁN

FECHA DE ELABORACIÓN: ENERO 2016

Page 2: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

1

FUNDAMENTOS DE

PROBABILIDAD Y ESTADÍSTICA

Dr. Gerardo de Jesús Sosa Santillán

Departamento de Biotecnología

Facultad de Ciencias Químicas

Universidad Autónoma de Coahuila.

Page 3: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

2

I. Introducción

Page 4: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

3

“Hay tres tipos de mentiras: las mentiras, las

mentiras infames, y las mentiras estadísticas”

-Benjamin Desraelí, 1766-1848, estadista inglés-

Page 5: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

4

> Conjunto de métodos científicos ligados a la toma, organización,

recopilación, presentación y análisis de datos, tanto para la deducción de

conclusiones como para tomar decisiones razonables de acuerdo con

tales análisis.

>Arte de la decisión en presencia de incertidumbre.

>Ciencias que sirve para demostrar que dos personas han comido 1/2

pollo cada una, cuando en realidad una ha comido uno y la otra

ninguno.

Tres definiciones de estadística

Page 6: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

5

•La estadística desempeña un papel fundamental y cada vez más relevante en prácticamente todas las áreas de la ciencia. •Etimológicamente, la palabra estadística significa “cifras relacionadas con el Estado”.

•La estadística es concebida popularmente como conjuntos de cifras o gráficas, asociadas generalmente con promedios.

Page 7: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

6

•La estadística es concebida popularmente como conjuntos de cifras o gráficas, asociadas generalmente con promedios. •Como procedimiento de toma de decisiones, la estadística es de importancia creciente en varios campos, por ejemplo, en la producción industrial en masa, medicina y biología, economía, política, psicología, análisis de opinión pública y otras ciencias sociales, agricultura, meteorología, física, química e ingeniería.

Page 8: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

7

CLASIFICACIÓN

ESTADÍSTICA INFERENCIAL

ESTADÍSTICA DESCRIPTIVA

A partir del cálculo de probabilidades y datos muestrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.

Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos.

Page 9: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

8

Relación entre estadística y probabilidad:

•La probabilidad es el estudio de fenómenos puramente aleatorios, mientras que la estadística se puede describir como la ciencia o el arte de reunir y analizar datos e inferir consecuencias a partir de estos elementos. •El azar afecta tanto a la reunión de datos como a su análisis y se debe tener en cuenta al hacer inferencias.

Page 10: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

9

SEMBLANZA HISTÓRICA DE LA ESTADÍSTICA.

•Se cree que los orígenes de la estadística están ligados al antiguo Egipto y a los censos chinos hace unos 4000 años, aproximadamente. •Desde esa época, diversos estados realizaron estudios sobre algunas características de sus poblaciones, sus riquezas, posesiones, etc. •En 1662, John Graunt, un mercader Inglés, publicó un libro sobre los nacimientos y defunciones ocurridos en Londres; el libro tenia conclusiones acerca de ciertos aspectos relacionados con estos acontecimientos. Esta obra es considerada como el punto de partida de la estadística moderna.

Page 11: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

10

•La palabra estadística comenzó a usarse en el siglo XVIII, en Alemania, en relación a estudios donde los grandes números, que representaban datos, eran de importancia para el estado. Sin embargo, la estadística moderna se desarrolló en el siglo XX a partir de los estudios de Karl Pearson.

•Hoy la estadística tiene gran importancia, no sólo por que presenta información, sino que además permite inferir y y predecir lo que va a ocurrir, y por lo tanto, es una herramienta fundamental a la hora de tomar decisiones de importancia.

Page 12: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

11

•Girolamo Cardano (1501-1576). La Teoría de probabilidad tuvo su origen en apuestas en juegos de azar. •Pascal (1623-1705) y Fermat (1601-1665). Desarrollaron la Teoría de la Probabilidad. •Jakob Bernoulli (1654-1705). De los primeros en estudiar la probabilidad matemática. •Laplace (1749-1827) y Gauss (1777-1855). Ecuación de la curva normal, conocida en la actualidad como curva de Gauss o campana de Gauss.

Page 13: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

12

•Charles Lyell en el siglo XIX encontró aplicación de la estadística a un problema de geología. •Darwin (1809-1882) y Mendel (1866) realizaron trabajos netamente estadísticos. •Karl Pearson (1857-1936). Considerado el padre de la estadística. Fundador de la revista “Biometrika” y de la Escuela de Estadística en Cambridge, Inglaterra. A él se debe el estudio de la bondad de ajuste con la X2 y el coeficiente de correlación entre dos variables.

Page 14: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

13

W.S. Gosset (1876-1937). Estadística de muestras pequeñas. La “t de student”, herramienta básica para los estadísticos y experimentadores. Ronald Alymer Fisher (1890-1962). Genetista y estadístico. Prueba de F para probar hipótesis acerca de dos varianzas de muestras pequeñas. Prueba de Z de Fisher, para probar hipótesis acerca del coeficiente de correlación lineal. William Feller . Teorema del Límite Central.

Page 15: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

14

•1834. Se crea la primera sociedad científica específica en estadística: “Royal Statistical Society”, que en 1838 crea la primera revista de estadística, “Journal of Royal Statistical Society”. •1839. Se crea en USA la American Statistical Association (ASA), que en 1841 crea la revista “Journal of American Statistical Association”. •1853. Primer Congreso Internacional de Estadística, Bruselas Bélgica. •1885. Se crea el International Statistical Institute (ISI).

Page 16: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

15

•1940. Se crea el Instituto Interamericano de Estadística (IASI). •1953. El IASI crea el Centro Interamericano de enseñanza Estadística, Económica y Financiera, que en 1962 se transformó en el Centro Interamericano de enseñanza de la Estadística (CIENES), cuya sede desde esa fecha y hasta la actualidad funciona en Santiago de Chile.

Page 17: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

16

La estadística en la investigación científica.

•La estadística interviene en la investigación y/o el método científico a través de la experimentación y la observación. •Los científicos deben ser capaces de observar un suceso o un conjunto de eventos como resultado de un plan o diseño. Esto es el experimento, la sustancia del método científico. •El diseño experimental es un campo de la estadística; cuando se aplica en ciencias de la vida, se denomina bioestadística.

Page 18: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

17

•La evaluación objetiva de una hipótesis presenta problema. Puesto que no es posible observar todos los eventos concebibles, existirá variación entre los que son observados. •El científico razona de lo particular a lo general. Este proceso es de inferencia incierta. •Este tipo de procesos nos permite desaprobar hipótesis incorrectas, pero no permite aprobar hipótesis correctas. Lo único que se puede dar como demostración es una comprobación fuera de duda razonable. •El azar entra en juego en la obtención de la información y es la causa de la incertidumbre. El estadístico realiza una medición objetiva y precisa de la incertidumbre de las inferencias.

Page 19: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

18

•El uso de la estadística como herramienta de la investigación no puede separarse de la planeación general del proyecto de investigación. •El método estadístico apropiado debe formar parte integral del diseño total. •Un proyecto de investigación debe ser diseñado y planificado antes de efectuarse. Los datos no deben ser obtenidos con la convicción de que un método estadístico estará automáticamente disponible para analizarlos. •En muchas ocasiones el estadístico se ve en la necesidad de comunicar al investigador que sus esfuerzos fueron desperdiciados porque no hay una manera legítima de analizar sus datos.

Page 20: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

19

Etapas de una investigación estadística

1. Formulación del problema.

2. Diseño del experimento.

3. Colección de datos y experimentación.

4. Tabulación y descripción de los resultados.

5. Inferencias estadística y formulación de la

respuesta.

Page 21: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

20

1. Formulación del problema

- Crear conceptos precisos, formular preguntas claras, imponer limitaciones adecuadas al problema.

- La calidad de las conclusiones estadísticas depende de la precisión de los datos, que a su vez dependen dela exactitud en la formulación del problema.

Page 22: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

21

2. Diseño del experimento.

- Obtener un máximo de información empleando un mínimo de costo y tiempo.

- Debemos determinar tamaño de la muestra, cantidad y tipo de datos a obtener.

- Establecer el método matemático que se empleará en la última etapa para analizar los datos.

- Debe tenerse cuidado al planificar y diseñar un experimento, de otro modo no se alcanzará ninguna conclusión válida.

Page 23: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

22

3. Colección de datos y experimentación.

- Métodos usados para obtener información pertinente.

- Esta es la parte que más tiempo consume en toda investigación.

- Debe sujetarse a reglas esctrictas.

- Cuanto menos opiniones impongamos, serán mejores los resultados.

Page 24: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

23

4. Tabulación y descripción de los resultados.

- Ordenación de los datos en forma legible e ilustración con representaciones gráficas. - Cálculo de parámetros descriptivos.

Page 25: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

24

5. Inferencia estadística y formulación de la respuesta.

- Al aplicar el método estadístico seleccionado en la etapa 2, se obtienen conclusiones acerca de la población a partir de la muestra. Esto es la inferencia estadística.

- Toma de decisiones y formulación de respuestas.

Page 26: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

25

- No existe una fórmula en estadística que tome en cuenta todas las situaciones prácticas concebibles.

- Es necesario adquirir conocimientos generales de los métodos más importantes para la inferencia estadística.

- En cada caso práctico debe estudiarse con cuidado la naturaleza del problema específico, y sólo así se podrá escoger el método apropiado.

Page 27: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

26

II. FUNDAMENTOS DE PROBABILIDAD.

Page 28: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

27

Espacio de muestreo

El conjunto de todos los resultados posibles de un experimentos estadístico se llama espacio muestral o espacio de muestreo y se representa con el símbolo S.

El espacio muestral S de los resultados posibles cuando se lanza al aire una moneda se puede escribir como:

S={A, S}

Page 29: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

28

Considere el experimento de lanzar un dado. Si nos interesamos en el número que muestra en la cara superior, el espacio muestral sería: S1={1,2,3,4,5,6} Si nos interesamos sólo en si el número es par o impar, el espacio muestral es simplemente: S2={par, impar}

Page 30: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

29

El ejemplo anterior ilustra el hecho de que se puede usar más de un espacio muestral para describir los resultados de un experimento. En general es deseable utilizar el espacio muestral que dé mayor información acerca de los resultados del experimento. En este caso S1 proporciona más información que S2.

Page 31: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

30

•En algunos experimentos es útil listar los elementos del espacio muestral de forma sistemática mediante un diagrama de árbol. •Por ejemplo, un experimento consiste en lanzar una moneda y después lanzarla una segunda vez si sale cara. Si en el primer lanzamiento sale cruz, entonces se lanza un dado una vez.

¿Cuál es el espacio muestral para este experimento?

Page 32: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

31

HH

HT

H

H

T

T1

T2

T3

T4

T5

T6

1

2

3

4

5

6

T

Primer resultado

Segundo resultado

Punto de la muestra

S={HH, HT, T1, T2, T3, T4, T5, T6}

Page 33: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

32

Ejemplo: Suponga que seleccionamos tres artículos de forma aleatoria de un proceso de fabricación. Cada artículo se inspecciona y se clasifica como defectuoso, D, o sin defectos, N. Realice un diagrama de árbol y determine el espacio muestral S para este caso.

S= {DDD, DDN, DND, DNN, NDD, NDN, NND, NNN}

Page 34: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

33

Cuando en un espacio muestral hay un número grande o infinito de puntos muestrales, la descripción es mejor con un enunciado o regla. Por ejemplo: Si los resultados posibles de un experimento son el conjunto de ciudades en el mundo con una población de más de 1 millón, el espacio muestral sería:

S={X/X es una ciudad con una población de más de 1 millón}

Page 35: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

34

De manera similar, si S es el conjunto de todos los puntos (x,y) sobre la frontera o el interior de un círculo de radio 2, con centro en el origen, escribimos:

S={(x,y)/x2+y2≤4}

El método de la regla tiene ventajas prácticas, en particular para los muchos experimentos donde un listado se vuelve una tarea tediosa.

Page 36: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

35

Ejercicio 1. Liste los elementos de cada uno de los espacios

muestrales siguientes: a) El conjunto de enteros entre 1 y 50, divisibles

entre 8.

b) El conjunto S={x/x2+4x-5=0}

Donde

c) El conjunto S={x/x es un continente}

a

acbbx

2

42

Page 37: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

36

Ejercicio 2. ¿Cuáles de los siguientes eventos son iguales? a) A={1,3}

b) B={x/x es un número en un dado}

c) C={x/x2-4x+3=0}

d) D={x/x es el número de caras cuando se lanzan 6

monedas}

Page 38: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

37

Ejercicio 3. Un experimento implica lanzar un par de dados, uno

verde y uno rojo, y registrar los números que salen. Si “x” es el resultado en el dado verde y “y” es el resultado en el dado rojo, describa el espacios muestral S:

a) Mediante la lista de los elementos (x,y)

b) Mediante el uso del método de la regla.

Page 39: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

38

Respuestas

Ejercicio 1. a) S={8,16,24,32,40,48}

b) S={1,-5}

c) S={América, Asia, Europa, Africa, Oceanía}

Ejercicio 2. A=C

Page 40: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

39

Ejercicio 3: a) S={(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),(2,3),(2,4),(2,5),(2,6),(3,1),(3,2),(3,3),(3,4),(3,5)(3,6),(4,1),(4,2),(4,3),(4,4),(4,5),(4,6),(5,1),(5,2),(5,3),(5,4),(5,5),(5,6),(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)} b) S={(x,y)/”x” es el número en el dado verde y “y” es el número en el dado rojo}

Page 41: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

40

Eventos y Probabilidad de Eventos

-Para cualquier experimento podemos estar interesados en la ocurrencia de ciertos eventos más que en el resultado de un evento específico.

- Por ejemplo, podemos estar interesados en el evento A en el que el resultado cuando se lanza un dado sea divisible entre 3.

- Esto ocurrirá si el resultado es un elemento del subconjunto A={3,6} del espacio muestral S={1,2,3,4,5,6}

Page 42: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

41

Para cada evento se asigna una colección de puntos muestrales que constituye un subconjunto del espacio muestral. Este subconjunto representa la totalidad de los elementos para los que el evento es cierto. Podemos entonces definir un evento como un subconjunto de un espacio muestral.

Page 43: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

42

Por ejemplo: Dado el espacio muestral S={t/t≥0}, donde t es la vida en años de cierto componente electrónico, entonces el evento A de que el componente falle antes de que finalice el quinto año es el subconjunto: A={t/0≤t≤5}

Page 44: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

43

Un evento puede ser un subconjunto que incluya todo el espacio muestral S; o un subconjunto de S que se denomina conjunto vacío, que se denota por el símbolo ø, que no contiene elemento alguno. Por ejemplo: Si A={x/x es un factor par de 7} Entonces B debe ser un conjunto vacío, pues los únicos factores posibles de 7 son los números nones 1 y 7.

Page 45: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

44

Considere un experimento donde se registran los hábitos de fumar de los empleados de una empresa. Sea el subconjunto de los fumadores un evento. Entonces la totalidad de los no fumadores corresponde a un evento diferente, también subconjunto de S, que se denomina complemento. Entonces el complemento de un evento A con respecto a S es el subconjunto de todos los elementos de S que no están en A. Denotamos el complemento de A como A’.

Page 46: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

45

Ejemplo: Un experimento consiste en lanzar un dado y después lanzar una moneda una vez si el número en el dado es par. Si el número en el dado es impar la moneda se lanza dos veces. Sea H la notación para cara y T la notación para cruz. El espacio muestral S, es: S={1HH,1HT,1TH,1TT,2H,2T,3HH,3HT,3TH,3TT,4H,4T,5HH,5HT,5TH,5TT,6H,6T}

Page 47: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

46

a) Liste los elementos que correspondan el evento A de que salga en el dado un número menor a 3.

b) Liste los elementos que correspondan al evento B de que ocurran dos cruces.

c) Liste los elementos que corresponden al evento A’

d) Liste los elementos que correspondan al evento B’

A={1HH,1HT,1TH,1TT,2H,2T}

B={1TT,3TT,5TT}

S={3HH,3HT,3TH,3TT,4H,4T,5HH,5HT,5TH,5TT,6H,6T}

S={1HH,1HT,1TH,2H,2T,3HH,3HT,3TH,4H,4T,5HH,5HT,5TH,6H,6T}

Page 48: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

47

Probabilidad de un evento

¿Qué queremos decir cuando hacemos afirmaciones como: “Juan probablemente ganará el torneo de tenis”, o “Tengo una oportunidad de 50% de obtener un número para cuando lanzo un dado”?

En cada caso expresamos un resultado del cual no estamos seguros, pero debido a la información del pasado o a partir de una comprensión de la estructura del experimento, tenemos algún grado de confianza en la validez de la afirmación.

Page 49: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

48

Consideremos aquellos experimentos para los cuales S tiene un número finito de elementos. -La probabilidad de ocurrencia de un evento que resulta de tal experimento estadístico se evalúa por medio de un conjunto de números reales denominados probabilidades que van de 0 a 1.

- Para todo punto en el espacio muestral asignamos una probabilidad tal que la suma de todas las probabilidades es 1.

- Un evento altamente probable tendrá una probabilidad cercana a 1.

- Un evento altamente improbable tendrá una probabilidad cercana a 0.

Page 50: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

49

- Para encontrar la probabilidad de un evento A se suman todas las probabilidades que se asignan a los puntos muestrales en A. esta suma se denomina probabilidad de A y se denota como P(A).

- Entonces la probabilidad de un evento A es la suma de las probabilidades de todos los puntos muestrales en A. Por tanto:

0≤P(A)≤1, P(ø)=0 y P(S)=1

Page 51: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

50

Ejemplo: Se lanza dos veces una moneda. ¿Cuál es la probabilidad de que ocurra al menos una cara? S={HH,HT,TH,TT} -Asignamos una probabilidad w a cada uno de los puntos muestrales. Entonces 4w=1 o w=1/4.

- Si A representa el evento de que ocurra al menos 1 cara, entonces:

A={HH,HT,TH} y P(A)=1/4+1/4+1/4=3/4=0.75

Page 52: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

51

Ejemplo. Se carga un dado de forma que sea dos veces más probable que salga un número para que uno non. Si E es el evento de que ocurra un numero menor que 4 en un solo lanzamiento del dado, encuentre P(E). S={1,2,3,4,5,6}

P(par)=2w; P(non)=w entonces 9w=1 o w=1/9

E={1,2,3} y P(E)=1/9+2/9+1/9=4/9=0.44

Page 53: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

52

Si un experimento puede tener como resultado cualquiera de N diferentes resultados igualmente probables, y si exactamente n de estos resultados corresponden al evento A, entonces la probabilidad del evento A es:

P(A)=n/N

Page 54: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

53

Ejemplo: Un surtido de dulces contiene 6 mentas, 4 chiclosos y 3

chocolates. Si una persona hace una selección alaetoria de uno de los dulces, encuntre la probabilidad de sacar:

a) Una menta.

b) Un chicloso o un chocolate

P(M)=6/13=0.46

P(T U C)=7/13=0.54

Page 55: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

54

Relaciones entre eventos

Consideremos ahora ciertas operaciones con eventos que tendrán como resultado la formación de nuevos eventos. Estos nuevos eventos serán subconjuntos del mismo espacio muestral que los eventos dados. Por ejemplo, en el lanzamiento de un dado podemos hacer que A sea el evento de que ocurra un número par y B el evento de que aparezca un número mayor que 3. Entonces los subconjuntos A={2,4,6} y B={4,5,6} son subconjuntos del mismo espacio muestral S={1,2,3,4,5,6}

Page 56: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

55

Nótese que A y B ocurrirán ambos en un lanzamiento dado si el resultado es un elemento del subconjunto {4,6}, que es precisamente la intersección de A y B. Entonces, la intersección de dos eventos A y B, denotada mediante el símbolo A ∩ B, es el evento que contiene a

todos los elementos que son comunes a A y a B. Dos eventos A y B son mutuamente excluyentes si A ∩

B=ø, es decir, si no tienen elementos en común.

Page 57: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

56

En el experimento de lanzamiento de un dado si: A={2,4,6} y B={4,5,6} Podemos interesarnos en que ocurra A o B, o en que ocurran A y B. Tal evento, que se llama la unión de A y B, ocurrirá si el resultado es un elemento del subconjunto {2,4,5,6}. Entonces la unión de dos eventos A y B, que se denota mediante el símbolo A∪B, es el evento que contiene todos

los elementos que pertenecen a A o B, o a ambos.

Page 58: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

57

La relación entre eventos y el correspondiente espacio muestral se puede ilustrar de forma gráfica mediante diagramas de Venn. En un diagrama de Venn se representa el espacio muestral como un rectángulo y los eventos con círculos trazados dentro del rectángulo.

Page 59: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

58

1

2

3 4

5

6 7

A B

C

S En esta figura se observa que: A ∩ B= regiones 1 y 2

B ∩ C= regiones 1 y 3

A∪C= regiones 1,2,3,4,5,7

B’ ∩ C= regiones 7 y 4

A ∩ B ∩ C=región 1

(A∪B) ∩ C’=regiones 2, 6 y 7

Y así sucesivamente…

Page 60: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

59

Dado el siguiente diagrama de Venn:

A

B

C

S

Podemos ver que:

- Los eventos A, B y C, son subconjuntos del espacio muestral S.

- El evento B es un subconjunto del evento A.

- El evento B ∩ C=ø y por ello B y C son mutuamente excluyentes.

- El evento A ∩ C tiene al menos un elemento.

- El evento A∪B=A

Page 61: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

60

Varios resultados que derivan de las definiciones precedentes, y que se pueden verificar de forma fácil mediante diagramas de Venn, son los siguientes:

1. A ∩ ø = ø

2. A∪ø = A

3. A ∩ A’ = ø

4. A∪A’ = S

5. S’ = ø

6. ø’ = S 7. (A’)’ = A 8. (A ∩ B)’ = A’∪B’

9. (A∪B)’ = A’ ∩ B’

Page 62: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

61

Suma de probabilidades

Si A y B son cualquiera de dos eventos, entonces.

P(A∪B)=P(A)+P(B)-P(A ∩ B)

Si A y B son mutuamente excluyentes, entonces:

P(A∪B)=P(A)+P(B)

Page 63: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

62

Si A1, A2,…An es una partición de un espacio muestral S, entonces:

P(A1∪A2∪…∪An)=P(A1)+P(A2)+…+P(An)=P(S)=1

Para 3 eventos A, B y C:

P(A∪B∪C)=P(A)+P(B)+P(C)-P(A∩B)-P(A∩C)-P(B∩C)

Page 64: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

63

Ejemplo: La probabilidad de que un estudiante apruebe matemáticas es 2/3 y a probabilidad de que apruebe inglés es 4/9. Si la probabilidad de aprobar ambos cursos es ¼. ¿Cuál es la probabilidad de que el estudiante apruebe al menos uno de estos cursos?

Si M es el evento de aprobar matemáticas y E el evento de aprobar inglés, entonces tenemos que: P(M∪E)=P(M)+P(E)-P(M∩E)=2/3+4/9-1/4= 31/36

Page 65: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

64

A menudo es más difícil calcular la probabilidad de que ocurra un evento que la probabilidad de que el evento no ocurra. Si este es el caso para algún evento A, simplemente encontramos primero P(A’) y después encontramos P(A) por sustracción:

Si A y A’ son eventos complementarios, entonces P(A)+P(A’)=1

Page 66: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

65

Probabilidad condicional.

La probabilidad de que un evento B ocurra cuando se sabe que ya ocurrió algún evento A se llama probabilidad condicional y se denota por P(B/A), lo cual por lo general se lee “la probabilidad de que ocurra B dado que ocurrió A”, o simplemente “la probabilidad de B dado A”.

)(

)()/(

AP

BAPABP

Page 67: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

66

Ejemplo: La probabilidad de que un vuelo programado

normalmente salga a tiempo es P(D)=0.83; la probabilidad de que llegue a tiempo es de P(A)=0.82; y la probabilidad de que salga y llegue a tiempo es P(D∩A)=0.78

Encuentre la probabilidad de que un avión: a) Llegue a tiempo dado que salió a tiempo

b) Salió a tiempo, dado que llegó a tiempo

Page 68: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

67

94.083.0

78.0

)(

)()/(

DP

ADPDAP

a)

95.082.0

78.0

)(

)()/(

AP

ADPADP

b)

Page 69: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

68

Teorema de la multiplicación

Si en un experimento pueden ocurrir los eventos A y B, entonces:

P(A∩B)=P(A)P(B/A)

Page 70: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

69

Suponga que tenemos una caja de fusibles que contiene 20 unidades, de las cuales 5 están defectuosas. Si se seleccionan dos fusibles al azar y se separan de la caja uno después del otro sin reemplazar el primero, ¿cuál es la probabilidad de que ambos fusibles sean defectuosos?

P(A∩B)= P(A)P(B/A)=(1/4)(4/19)=1/19

Page 71: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

70

Si en el ejemplo anterior el primer fusible se reemplaza y los fusibles se reacomodan por completo antes de que se extraiga el segundo, entonces P(B/A)=P(B)=1/4 y los eventos Ay B son independientes. Por tanto:

Dos eventos A y B son independientes si y sólo si P(A∩B)=P(A)P(B)

Page 72: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

71

Ejercicios

Ejercicio 1. ¿Cuál es la probabilidad de obtener un total de 7 u 11 cuando se lanza un par de dados? Ejercicio 2. Si la probabilidad de que una persona compre un automóvil nuevo elija el color verde, blanco, rojo o azul son, respectivamente, 0.09, 0.15, 0.21 y 0.23. ¿Cuál es la probabilidad de que un comprador dado adquiera un automóvil nuevo que tenga uno de estos colores?

Page 73: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

72

Ejercicio 3. Determinar la probabilidad de extraer un rey, un as, un 3 de diamantes o un 7 de tréboles en una sola extracción de una baraja de 52 cartas. Ejercicio 4. ¿Cuál es la probabilidad de obtener un cerrojo no defectuoso al extraerlo de una población si de 600 ya examinados 12 fueron defectuosos?

Page 74: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

73

Ejercicio 5. Se lanza un par de dados y se definen los siguientes

eventos: A={La suma de los dados es 6} B={Aparece por lo menos un 2} a) ¿Cuál es la probabilidad de que la suma de los dados

sea 6 si apareció por lo menos un 2?

b) ¿Cuál es la probabilidad de que aparezca por lo menos un 2 si la suma de los dados fue 6?

Page 75: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

74

Respuestas

Ejercicio 1. P(A∪B)=P(A)+P(B)=6/36+2/36= 2/9

Ejercicio 2. P(V∪B∪R∪A)=P(V)+P(B)+P(R)+P(A)=0.09+0.015+0.

21+0.23=0.68

Page 76: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

75

Ejercicio 3. P(A∪B∪C∪D)=P(A)+P(B)+P(C)+P(D)=4/52+4/52+1

/52+1/52)=10/52=0.1923

Ejercicio 4. P(A)=? P(A’)=12/600 Entonces P(A)=1-P(A’)=1-12/600 P(A)=588/600=0.98

Page 77: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

76

Ejercicio 5. a)

11

2

36

1136

2

)(

)()/(

BP

BAPBAP

5

2

36

536

2

)(

)()/(

AP

BAPABP

b)

Page 78: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

77

Regla de Bayes.

- Una generalización al caso en que un espacio muestral se parte en k subconjuntos la cubre el siguiente teorema, llamado en ocasiones teorema de la probabilidad total o regla de eliminación.

Page 79: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

78

Ejemplo: En cierta planta de montaje tres máquinas, B1, B2 y B3, montan 30%, 45% y 25% de los productos, respectivamente. Se sabe por la experiencia que 2%, 3% y 2% de los productos ensamblados por cada máquina, respectivamente, tienen defectos. Ahora suponga que se selecciona de forma aleatoria un producto terminado, ¿cuál es la probabilidad de que esté defectuoso? Solución: Considere los eventos siguientes: A: el producto está defectuoso, B1: el producto está ensamblado por la máquina B1, B2: el producto está ensamblado por la máquina B2, B3: el producto está ensamblado por la máquina B3.

Page 80: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

79

Al aplicar la regla de eliminación podemos escribir: P(A)=P(B1)P(A/B1)+P(B2)P(A/B2)+P(B3)P(A/B3) P(A)=(0.3)(0.02)+(0.45)(0.03)+(0.25)(0.02) P(A)=0.0245

Page 81: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

80

Suponga que consideramos ahora el problema de encontrar la probabilidad condicional P(B1/A) en el ejemplo anterior. En otras palabras, suponga que se seleccionó un producto de forma aleatoria y es defectuoso. ¿Cuál es la probabilidad de que este producto fuera hecho por la máquina B1?

Preguntas de este tipo se pueden contestar mediante el uso del teorema siguiente, que se llama Regla de Bayes.

Page 82: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

81

Si los eventos B1, B2,…,Bk constituyen una partición del espacio muestral S donde P(B1)≠0 para i=1,2,…k, entonces,

para cualquier evento A en S tal que P(A)≠0:

Para r=1,2,…k

Page 83: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

82

Con referencia al problema anterior, si se elige al azar un producto y se encuentra que es defectuoso, ¿cuál es la probabilidad de que esté ensamblado por la máquina B3?

Page 84: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

83

Page 85: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

84

Ejemplo: La proporción de personas en una comunidad que tiene cierta enfermedad es 0.005. Está disponible una prueba para diagnosticar la enfermedad. Si una persona la padece, la probabilidad de que la prueba dé señal positiva es de 0.99. Si una persona no está enferma, la probabilidad de que la prueba dé una señal positiva es de 0.01. Si una persona sale positiva en la prueba, ¿cuál es la probabilidad de que la persona realmente esté enferma?

Page 86: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

85

Page 87: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

86

- Sólo aproximadamente la tercera parte de los que resultan positivos en la prueba están realmente enfermos. - La prueba es bastante exacta.

- ¿Por qué una proporción grande de pruebas resulta positiva

cuando en realidad se está libre de la enfermedad?

- Esto ocurre porque la enfermedad es rara, sólo el 0.5% de la población la padece.

- Para enfermedades raras, muchas pruebas médicas resultarán en falsos positivos a pesar de ser muy exactas.

- Por esta razón, cuando una prueba sale positiva, se hace generalmente una segunda prueba antes de confirmar el diagnóstico.

Page 88: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

87

III. ESTADÍSTICA DESCRIPTIVA BÁSICA.

Page 89: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

88

Conceptos Básicos.

Estadística. La ciencia de recolectar, clasificar, describir e interpretar datos numéricos.

Estadística Descriptiva. Parte de la estadística dedicada a la recolección, presentación y descripción de datos numéricos.

Estadística inferencial. Parte de la estadística encargada de interpretar los valores que se obtienen a partir de las técnicas descriptivas para posteriormente tomar decisiones en base a los resultados.

Page 90: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

89

Población. Colección completa de individuos, objetos o medidas que tienen una característica en común.

El concepto de población es la idea fundamental más importante de la estadística

La población debe definirse cuidadosamente, en cada caso, a fin de poder determinar la pertenencia a ella.

Page 91: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

90

Muestra. Es un subconjunto de la población; es decir, una muestra se compone de algunos de los individuos, objetos o medidas de una población.

Datos. Comprenden el conjunto de valores asignados a la variable de respuesta para cada elemento perteneciente a la muestra.

Page 92: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

91

Experimento. Una actividad planificada cuyos resultados producen un conjunto de datos.

Parámetro. Una característica medible de una población completa. En estadística se acostumbra asignar a los parámetros un nombre simbólico, representado por una letra griega (como µ ó σ).

Page 93: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

92

Estadístico. Es la medida de una característica relativa a una muestra. La mayoría de los estadísticos muestrales se encuentran por medio de una fórmula y suele asignárseles nombres simbólicos que son letras del alfabeto latino (como X o S).

Variable. Una característica de cada elemento individual de una población o de una muestra. El valor de la variable será la medida de la característica que interesa. También se le llama variable de respuesta.

Page 94: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

93

CLASIFICACION DE VARIABLES

CUALITATIVAS CUANTITATIVAS

NOMINAL ORDINAL DISCRETO CONTINUO

ATRIBUTOS NUMERICO

Page 95: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

94

De acuerdo a la escala de medición usada se clasifica en:

VARIABLE CUALITATIVA O CATEGÓRICA.

Nominal Ordinal

VARIABLE CUANTITATIVA O ESTADÍSTICA:

Continúa Discreta

Page 96: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

95

VARIABLE CUALITATIVA

Son aquellas variables que no aparecen en forma numérica, sino como categorías o atributos y tiene sentido cuando se usa bajo escala nominal u ordinal.

EJEMPLOS: Lugar de Residencia, Idioma, Sexo, Religión, Categoría

Ocupacional, Nivel de Educación de las PERSONAS. Actividad Económica, Condición Jurídica, Año de Inicio

Actividades de EMPRESAS. Materiales de Techo, Piso y Paredes; Régimen de Tenencia,

Estado de Conservación y Tipo de las VIVIENDAS.

Page 97: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

96

Ejemplo cualitativa nominal

Religión:

Católica

Protestante

Ateo

Musulmana

Mormon

Religion:

Ateo

Mormon

Católica

Protestante

Musulmana

Nótese que el orden de las religiones como se han presentado no afectan en nada. Las dos presentaciones son validas.

Page 98: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

97

Ejemplo cualitativa ordinal

Nivel Educativo:

Maestría

Primaria

Sin Estudio

Secundaria

Universitaria

Doctorado

Nivel Educativo:

Sin Estudio

Primaria

Secundaria

Universitaria

Maestría

Doctorado

Nótese que el orden del nivel educativo como se ve en el primer cuadro si afecta la presentación. En tanto en el segundo hay un orden correlativo

Page 99: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

98

VARIABLE CUANTITATIVA

Son las que tienen por modalidades cantidades numéricas, por lo que puede ser medida directamente en la práctica, usando bajo un intervalo o de razón.

Ejemplo: La variable que a cada persona le hace corresponder un INGRESO, es una variable cuantitativa.

DISCRETA, son las que al tomar valores, estos solamente pueden ser representados con números enteros y generalmente es resultado de conteos.

CONTÍNUA, cuando la variable toma cualquier valor real dentro de un intervalo dado, generado al efectuar operaciones de medición.

Page 100: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

99

VARIABLE DISCRETA: Ejemplos

Número de clientes por día de un Banco. Número de ventas diarias de una Empresa. Número de vuelos por día en el Aeropuerto. Número de accidentes por día. Número de personas por hogar. Número de pacientes por hospital. Número de hijos por mujer. Número de cuartos por vivienda. Número de nacimientos por día de maternidad. Número de alumnos desaprobados por curso.

Page 101: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

100

VARIABLE CONTÍNUA : Ejemplos

Persona: Estatura, peso, etc. Ingreso, gastos, etc. Hogar: Ingresos por hogar. Gastos por hogar en alimentación. Monto de alquiler por hogar. Establecimiento comercial: Valor de las ventas por establecimiento. Valor de las compras por establecimiento. Gastos (electricidad, agua, teléfono)

Page 102: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

101

REPRESENTACIÓN DE DATOS ESTADÍSTICOS

Page 103: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

102

•Textual.

Empleo de palabras y cifras combinadas en un texto para informar los datos obtenidos. Es el más difícil de seguir para el lector; para el redactor tiene la ventaja de que puede influenciar al lector.

•Tabular.

Presentación de los datos por medio de una tabla o cuadro. Es el método más imparcial para presentar la información ya que muestra los datos crudos, dejando al lector la tarea de interpretarlos sin hacer sugerencias ni comentarios.

Page 104: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

103

•Gráfico. Es el método de presentación de información más simple para el lector,

porque se puede captar la tendencia de los datos de un solo vistazo. Su desventaja más

notoria es la pérdida de precisión y exactitud en comparación con la tabla.

•Al crear un gráfico es importante seguir los consejos de los expertos:

Conviene hacer varios modelos diferentes en borrador antes del definitivo.

La disposición del gráfico debe ser de izquierda a derecha.

Debe colocarse siempre el cero de la escala.

Para la comparaciones conviene usar sólo una dimensión, antes de dos o tres.

En los gráficos de porcentaje acumulativo además del nivel cero se debe colocar el

100%.

La línea más gruesa de todas debe ser la del gráfico.

La línea de ayuda visual del gráfico debe ser la más fina de todas.

Debe tener un título claro, conciso y completo.

Debe colocarse siempre la escala empleada y las unidades de las magnitudes

mostradas.

La escala del gráfico debe adaptarse para que incluya toda la información.

No se debe utilizar un gráfico para mostrar la información de un modo tendencioso.

Si un gráfico no resulta claro para el autor, mucho menos lo será para el lector.

Page 105: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

104

ESTADÍSTICA DESCRIPTIVA

DATOS CUALITATIVOS

Nominal

Gráficos

Diagramas de Barras

Diagramas de Sectores

Ordinal

Contingencia

Tablas

Frecuencia

Se miden en escala

Se representan en

Page 106: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

105

DATOS CUANTITATIVOS

Discretos Continuos

Se dividen en

Se miden en escalas

Intervalos Razón

Se representan en Se resumen en medidas de

ESTADÍSTICA DESCRIPTIVA

Moda

Mediana

Media

Diagramas de

Dispersión

Boxplot

Histogramas

Frecuencia no

Agrupada

Frecuencia

Agrupada

Variabilidad Centralidad Tablas Gráficos

Coeficiente de

Variación

Rango

Varianza

Page 107: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

106

REPRESENTACIÓN TABULAR

CLASE FRECUENCIA FRECUENCIA RELATIVA FRECUENCIA

ACUMULADA

FRECUENCIA RELATIVA

ACUMULADA

Bachiller 40 0,33 40 0,33

Técnico 27 0,23 67 0,56

Tecnólogo 27 0,23 94 0,78

Profesional 20 0,17 114 0,95

Posgrado 6 0,05 120 1,00

Page 108: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

107

DIAGRAMA DE BARRAS

0

5

10

15

20

25

30

35

40

45

Bachiller Técnico Tecnólogo Profesional Posgrado

Page 109: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

108

Gráfico circular

FRECUENCIAS RELATIVAS

0.33

0.23

0.23

0.17

0.05

Bachiller

Técnico

Tecnólogo

Profesional

Posgrado

Page 110: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

109

TABLAS DE CONTINGENCIA

La empresa del ejemplo anterior consta de tres plantas y sus empleados están distribuidos de la siguiente forma:

Page 111: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

110

0

2

4

6

8

10

12

14

16

18

Planta A Planta B Planta C

Bachiller

Técnico

Tecnólogo

Profesional

Posgrado

Diagrama de Barras:

Page 112: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

111

0

5

10

15

20

25

30

35

40

45

Planta A Planta B Planta C

Posgrado

Profesional

Tecnólogo

Técnico

Bachiller

Diagrama de Barras:

Page 113: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

112

Page 114: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

113

•Gráficos cronológicos:

Page 115: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

114

Page 116: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

115

Abusos que se pueden cometer con la Estadística

Conclusiones erróneas debido a que los datos son numéricamente insuficientes.

Representaciones gráficas engañosas (escalas).

Datos muestrales no representativos:

Muestra que no incluye a elementos de toda la población.

Ciertas categorías de personas no responden correctamente.

Respuestas voluntarias (sesgadas).

Page 117: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

116

Organización de los datos

Una vez que se ha realizado la recolección de los datos, se obtienen datos en bruto, los cuales rara vez son significativos sin una organización y tabulación.

Page 118: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

117

Formas de organizar los datos:

Un arreglo: es la forma más sencilla de organizar los datos en bruto, consiste en colocar las observaciones en orden según su magnitud: ascendente o descendente.

Poco práctica cuando se tiene una gran cantidad de datos.

Page 119: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

118

Una distribución de frecuencias: es un arreglo de los datos que permite expresar la frecuencia de ocurrencias de las observaciones en cada una de las clases, mostrando el patrón de la distribución de manera más significativa.

Clase Pto.

Medio

fi Fi fri FRi

Page 120: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

119

La Distribución de Frecuencias:

Se recomienda su uso cuando se tienen grandes cantidades de datos (n).

Su construcción requiere, en primer lugar, la selección de los límites de los intervalos de clase.

Para definir la cantidad de intervalos de clase (k), se puede usar:

La regla de Sturges: k = 1 + 3.3log(n)

k = n

Page 121: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

120

La cantidad de clases no puede ser tan pequeño (menos de 5) o tan grande (más de 20), que la verdadera naturaleza de la distribución sea imposible de visualizar.

La amplitud de todas las clases deberá ser la misma.

Se recomienda que sea impar y que los puntos medios tengan la misma cantidad de cifras significativas que los datos en bruto.

Los límites de las clases deben tener una cifra

significativa más que los datos en bruto.

Page 122: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

121

Determinar:

Punto medio = (Li+Ls)/2.

Frecuencia absoluta de la clase (fi).

Frecuencia acumulada de la clase (Fi).

Frecuencia relativa de la clase (fri):

fri = fi/n

Frecuencia relativa acumulada de la clase (FRi).

Page 123: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

122

23 60 79 32 57 74 52 70 82 36

80 77 81 95 41 65 92 85 55 76

52 10 64 75 78 25 80 98 81 67

41 71 83 54 64 72 88 62 74 43

60 78 89 76 84 48 84 90 15 79

34 67 17 82 69 74 63 80 85 61

a) Construya una distribución de frecuencias.

b) ¿Qué puede concluir de estos datos?

Page 124: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

123

Los gráficos permiten visualizar en forma global y rápida el comportamiento de los datos.

Para datos cuantitativos agrupados en clases, comúnmente se utilizan tres gráficos:

Histogramas.

Polígono de frecuencias.

Ojiva o Polígono de frecuencias acumuladas.

Page 125: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

124

Los gráficos permiten visualizar en forma global y rápida el comportamiento de los datos.

Para datos cuantitativos agrupados en clases, comúnmente se utilizan tres gráficos:

Histogramas.

Polígono de frecuencias.

Ojiva o Polígono de frecuencias acumuladas.

Page 126: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

125

Histograma

Page 127: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

126

Tem

a 2

. Esta

dís

tica D

escrip

tiva

Histograma y Polígono de Frecuencias

Page 128: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

127

Ojiva

Page 129: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

128

Medidas de tendencia central o posición

Corresponden a valores que generalmente se ubican en la parte central de un conjunto de datos.

Forma como los datos pueden condensarse en un solo valor central alrededor del cual todos los datos muestrales se distribuyen.

Las medidas de tendencia central más importantes son:

Media: Aritmética y Aritmética ponderada.

Mediana.

Moda.

Page 130: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

129

Media Aritmética

Es la suma de todas las observaciones dividida entre el número total de observaciones.

Expresada de forma más intuitiva, podemos decir que la media aritmética es la cantidad total de la variable distribuida a partes iguales entre cada observación.

Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen en sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la información de una distribución (dinero en el bolsillo) suponiendo que cada observación (persona) tendría la misma cantidad de la variable.

Page 131: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

130

Cálculo de la media aritmética

Para datos no agrupados:

n

x

X

n

i

i 1

Para datos agrupados:

n

fm

X

k

i

ii 1

Donde: mi: punto medio de la clase i fi: frecuencia absoluta de la clase i k: cantidad de clases

Page 132: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

131

Mediana

Es el valor que ocupa la posición central de un conjunto de observaciones, una vez que han sido ordenados en forma ascendente o descendente.

Divide al conjunto de datos en dos partes iguales.

Cálculo de la mediana

Para datos no agrupados:

Si n es impar: posición donde se ubica la mediana es igual a (n+1)/2.

Si n es par: (n+1)/2 no es entero, por lo tanto la mediana será igual al promedio de las dos posiciones centrales.

Page 133: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

132

Datos agrupados: clase mediana es la que contiene a la observación que ocupa la posición n/2.

Cmxf

xFn

LmMdm

m

)(

)(2

11

Donde: Lm: límite inferior de la clase mediana. F(xm-1): frecuencia acumulada de la clase anterior a la clase mediana. f(xm): frecuencia absoluta de la clase mediana. Cm: amplitud de la clase mediana.

Page 134: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

133

Moda

Observación o clase que tiene la mayor frecuencia en un conjunto de observaciones.

Un conjunto de datos puede ser unimodal, bimodal o multimodal.

Es la única medida de tendencia central que se puede determinar para datos de tipo cualitativo.

Page 135: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

134

Cálculo de la moda

Para datos no agrupados: es simplemente la observación que más se repite.

Para datos agrupados:

CmLimMo21

1

Donde: Lim: límite inferior de la clase modal. 1: diferencia entre fi de la clase modal y la anterior. 2: diferencia entre fi de la clase modal y la posterior. Cm: amplitud de la clase modal (clase de mayor frecuencia).

Page 136: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

135

Relación entre la media, la mediana y la moda

Cuando los datos son sesgados es mejor emplear la Md

Page 137: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

136

Propiedades, ventajas y desventajas de la media

Propiedades:

La suma de las diferencias entre las media muestral y el valor de cada observación es cero.

La media de una constante es la constante.

Si todas las observaciones xi se multiplican por una constante a, la media también se debe multiplicar por ese mismo valor constante.

Page 138: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

137

Si se somete a una variable estadística X a un cambio de origen y escala, Y = a + bX, la media aritmética de dicha variable X varía en la misma proporción.

La media de la suma de dos variables es igual a la suma de sus medias.

Page 139: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

138

Ventajas:

Emplea en su cálculo toda la información disponible.

Se expresa en las mismas unidades que la variable en estudio.

Es el centro de gravedad de toda la distribución, representando a todos los valores observados.

Es un valor único.

Page 140: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

139

Se trata de un concepto familiar para la mayoría de las personas.

Es útil para llevar a cabo procedimientos estadísticos como la comparación de medias de varios conjuntos de datos.

Page 141: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

140

Desventajas:

Se ve adversamente afectada por valores extremos, perdiendo representatividad.

Si el conjunto de datos es muy grande puede ser tedioso su cálculo manual.

No se puede calcular para datos cualitativos.

No se puede calcular para datos que tengan clases de extremo abierto, tanto superior como inferior.

Page 142: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

141

Ventajas y desventajas de la mediana

Ventajas:

Fácil de calcular si el número de observaciones no es muy grande.

No se ve influenciada por valores extremos, ya que solo influyen los valores centrales.

Fácil de entender.

Page 143: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

142

Se puede calcular para cualquier tipos de datos cuantitativos, incluso los datos con clase de extremo abierto.

Es la medida de tendencia central más representativa en el caso de variables que solo admiten la escala ordinal.

Page 144: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

143

Desventajas:

No utiliza en su “cálculo” toda la información disponible.

No pondera cada valor por el número de veces que se ha repetido.

Hay que ordenar los datos antes de determinarla.

Page 145: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

144

Ventajas y desventajas de la moda

Ventajas:

No requiere cálculos.

Puede usarse para datos tanto cuantitativos como cualitativos.

Fácil de interpretar.

No se ve influenciada por valores extremos.

Se puede calcular en clases de extremo abierto.

Page 146: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

145

Desventajas:

Para conjuntos pequeños de datos su valor no tiene casi utilidad, si es que de hecho existe. Solo tiene significado en el caso de una gran cantidad de datos.

No utiliza toda la información disponible.

No siempre existe, si los datos no se repiten.

Page 147: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

146

En ocasiones, el azar hace que una sola observación no representativa sea el valor más frecuente del conjunto de datos.

Difícil de interpretar si los datos tiene 3 o más modas.

Page 148: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

147

Medidas de dispersión, variación o variabilidad.

Son valores numéricos que indican o describen la forma en que las observaciones están dispersas o diseminadas, con respecto al valor central.

Son importantes debido a que dos muestras de observaciones con el mismo valor central pueden tener una variabilidad muy distinta.

Page 149: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

148

Rango.

Varianza.

Desviación Típica o estándar.

Coeficiente de variación.

Las medidas de dispersión más comunes son:

Page 150: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

149

Rango (amplitud o recorrido):

Está determinado por los dos valores extremos de los datos muestrales, es simplemente la diferencia entre la mayor y menor observación.

Es una medida de dispersión absoluta, ya que depende solamente de los datos y permite conocer la máxima dispersión.

R=Xmax-Xmin

Page 151: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

150

Casi no se emplea debido a que depende únicamente de dos valores.

No proporciona una medida de variabilidad de las observaciones con respecto al centro de la distribución.

Notación: R

Page 152: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

151

Varianza

Es un valor numérico que mide el grado de dispersión relativa porque depende de la posición de los datos x1,x2,…,xn con respecto a la media.

Es el promedio al cuadrado de las desviaciones de cada observación con respecto a la media.

Notación: s2, 2, var(X)

Page 153: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

152

Si la varianza de un conjunto de observaciones es grande se dice que los datos tiene una mayor variabilidad que un conjunto de datos que tenga un varianza menor.

21

2

2

1

2

2

xn

x

s

n

xx

s

n

i

i

n

i

i

Para datos NO agrupados:

Page 154: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

153

Para datos agrupados en una distribución de frecuencias:

21

2

2

1

2

2

xn

fm

s

n

fxm

s

k

i

ii

k

i

ii

Page 155: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

154

Desviación Típica

Es la raíz cuadrada de la varianza.

Notación: s, .

2ss

Page 156: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

155

Coeficiente de Variación

Es una medida de dispersión relativa que permite comparar el nivel de dispersión de dos muestras de variables estadísticas diferentes.

No tiene dimensiones.

Notación: CV

%100x

sCV

Page 157: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

156

Ventajas y Desventajas del Rango

Ventajas:

Útil cuando se quiere conocer la extensión de las variaciones extremas (valor máximo de la dispersión).

Fácil de calcular.

Page 158: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

157

Desventajas:

No es una medida de dispersión con respecto al centro de la distribución.

Solo emplea dos valores en su cálculo.

No se puede calcular en distribuciones de límite de clase abierto.

Page 159: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

158

Propiedades, Ventajas y Desventajas de la Varianza

Propiedades:

1. Siempre es mayor o igual a cero y menor que infinito.

2. La varianza de una constante es cero.

3. Si a una variable X la sometemos a Y=a+bX, la

varianza de Y será Var(Y) = b2Var(X)

Page 160: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

159

Ventajas:

Es útil cuando se compara la variabilidad de dos o más conjuntos de datos.

Utiliza toda la información disponible.

Desventajas:

No proporciona ayuda inmediata cuando se estudia la dispersión de un solo conjunto de datos.

Difícil de interpretar por tener sus unidades elevadas al cuadrado.

Page 161: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

160

Ventajas y Desventajas de la Desviación Típica

Ventajas:

Esta expresada en las mismas unidades que la variable en estudio.

Utiliza todas las observaciones en su cálculo.

Fácil de interpretar.

Desventajas:

No tiene.

Page 162: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

161

Ventajas y Desventajas del Coeficiente de Variación

Ventajas:

Es la única medida de dispersión que permite comparar el nivel de dispersión de dos muestras de variables diferentes.

Emplea toda la información disponible en su cálculo.

Fácil de calcular.

Page 163: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

162

Desventaja:

No es una medida de dispersión con respecto al centro de la distribución de los datos.

Page 164: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

163

Medidas de Forma

Son medidas numéricas que permiten determinar la forma que tiene la curva de los datos, por lo tanto, sirven para corroborar lo que los gráficos muestran.

Medidas de forma

-Asimetría

-Kurtosis o apuntamiento

Coeficiente de Pearson Coeficiente de Fisher

Page 165: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

164

Asimetría

Permiten estudiar la forma de la curva, dependiendo de cómo se agrupan los datos.

Page 166: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

165

Coeficiente de Asimetría de Pearson:

Fácil de calcular e interpretar.

Cálculo:

s

MdXASP

3

o Interpretación:

ASP

= 0, X=Md Simétrica > 0, X>Md Asimétrica Positiva < 0, X<Md Asimétrica Negativa

Page 167: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

166

Coeficiente de Asimetría de Fisher:

No es de fácil cálculo, pero si su interpretación.

3

1

3

3

1

3

ns

fxM

ASF

ns

Xx

ASF

k

i

ii

n

i

i

Datos NO agrupados

Datos Agrupados

Page 168: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

167

o Interpretación:

ASF

= 0, Simétrica > 0, Asimétrica Positiva < 0, Asimétrica Negativa

Page 169: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

168

Kurtosis

Miden si los valores de la distribución están más o menos concentrados alrededor de los valores medios de la muestra (zona central de la distribución).

Se definen tres tipos de distribución según su grado de Kurtosis:

Page 170: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

169

Mesocúrtica: grado de concentración medio alrededor de los valores centrales de la variable.

Leptocúrtica: grado de concentración elevado.

Platicúrtica: grado de concentración reducido.

Page 171: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

170

3

3

4

1

4

4

1

4

ns

fXM

CK

ns

Xx

CK

k

i

ii

n

i

i

Datos No Agrupados

Datos Agrupados

Interpretación:

CK

=0 Mesocúrtica >0 Leptocúrtica <0 Platicúrtica

Page 172: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

171

Ejercicio 1

30 55 44 60 43 72 47 65 67 40

59 58 14 32 58 46 41 35 68 50

59 21 42 45 41 48 28 47 77 60

30 57 45 49 33 48 47 52 38 61

54 42 54 42 49 51 39 60 61 63

Supóngase que 50 estudiantes han presentado su examen de admisión a la U.A. de C. Las calificaciones individuales se presentan en la siguiente tabla.

Page 173: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

172

a) Construya una tabla de distribución de frecuencias.

b) Construya un histograma de frecuencias, un polígono de frecuencias relativas y una ojiva.

c) Calcule la media y la desviación estándar para los datos agrupados.

Page 174: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

173

23 60 79 32 57 74 52 70 82 36

80 77 81 95 41 65 92 85 55 76

52 10 64 75 78 25 80 98 81 67

41 71 83 54 64 72 88 62 74 43

60 78 89 76 84 48 84 90 15 79

34 67 17 82 69 74 63 80 85 61

a) Calcule la media aritmética, la varianza, la desviación estándar y el coeficiente de variación.

Ejercicio 2. Dada la siguiente serie de datos.

Page 175: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

1

DISTRIBUCIONES

DE PROBABILIDAD

Dr. Gerardo de Jesús Sosa Santillán

Departamento de Biotecnología

Facultad de Ciencias Químicas

Universidad Autónoma de Coahuila.

Page 176: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

2

INTRODUCCIÓN

Page 177: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

3

- La inferencia estadística consiste en extraer una muestra de una población y analizar sus datos para aprender acerca de ello.

- Muchas veces se tiene un conocimiento superficial de la función de masa de probabilidad o de la función densidad de probabilidad de la población.

- En estos casos se hace una aproximación mediante una de muchas familias comunes de curvas o funciones.

Page 178: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

4

Definición

Una tabla, gráfica o expresión matemática que dé las probabilidades con que una variable aleatoria toma diferentes valores, se llama distribución de probabilidad de la variable aleatoria. Al conjunto de pares ordenados (x,f(x)) donde x es el conjunto de valores de una variable aleatoria y f(x) las probabilidades asignadas a x, se le llama función de probabilidad (para variables discretas), y función densidad de porbabilidad (para variables continuas).

Page 179: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

5

Distribuciones de Probabilidad

Distribuciones discretas

Distribución Binomial

Distribución Poisson

Distribuciones continuas

Distribución Exponencial

Distribución Normal

Page 180: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

6

Dato histórico

El cálculo de probabilidades tuvo un

notable desarrollo con el trabajo del

matemático suizo Jacob Bernoulli (1654-1705).

Bernoulli definió el proceso conocido por su

nombre el cual establece las bases para el

desarrollo y utilización de la distribución binomial.

Page 181: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

7

Propiedades de un experimento de Bernoulli

1 - En cada prueba del experimento sólo hay dos posibles resultados: éxitos o fracasos.

2 - El resultado obtenido en cada prueba es independiente de los resultados obtenidos en pruebas anteriores.

3 - La probabilidad de un suceso es constante, la representamos por p, y no varía de una prueba a otra. La probabilidad del complemento es 1- p y la representamos por q .

Si repetimos el experimento n veces podemos

obtener resultados para la construcción de la

distribución binomial.

Page 182: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

8

La distribución binomial

La distribución de probabilidad binomial es un ejemplo de distribución de probabilidad discreta.

Esta formada por una serie de experimentos de Bernoulli. Los resutados de cada experimento son mutuamente excluyentes.

Para contruirla necesitamos:

1 - la cantidad de pruebas n

2 - la probabilidad de éxitos p

3 - utilizar la función matemática.

Page 183: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

9 9

Utilidad

La distribución binomial se utiliza en situaciones cuya solución tiene dos posibles resultados.

Por ejemplo:

Al nacer un bebé puede ser varón o hembra.

En el deporte un equipo puede ganar o perder.

En pruebas de cierto o falso sólo hay dos alternativas.

Page 184: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

10 10

Utilidad

También se utiliza cuando el resultado se puede reducir a dos opciones.

Por ejemplo:

Un tratamiento médico puede ser efectivo o inefectivo.

La meta de producción o ventas del mes se pueden o no lograr.

En pruebas de selección múltiple, aunque hay cuatro o cinco alternativas, se pueden clasificar como correcta o incorrecta.

Estos ejemplos los podemos considerar como

“experimentos de Bernoulli”

Page 185: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

11

La función P(x=k)

La función de probabilidad de la distribución Binomial, también denominada Función de la distribución de Bernoulli: k - es el número de aciertos. n - es el número de experimentos. p - es la probabilidad de éxito, como por ejemplo, que salga "cara" al lanzar la moneda. 1-p - también se le denomina como “q ”

Page 186: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

12

Ejemplo1 de la función F(x=k)

¿Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces?

El número de aciertos k es 6. Esto es x=6

El número de experimentos n son 10

La probabilidad de éxito p, es decir, que salga "cara" al lanzar la moneda es 50% ó 0.50

La fórmula quedaría:

P (k = 6) = 0.205

Es decir, que la probabilidad de obtener 6 caras al lanzar 10 veces una moneda es de 20.5% .

Page 187: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

13

Ejemplo 2 de la función F(x=k)

¿Cuál es la probabilidad de obtener cuatro veces el número 3 al lanzar un dado ocho veces?

El número de aciertos k es 4. Esto es x=4

El número de experimentos n son 8

La probabilidad de éxito p (probabilidad de que salga un 3 al tirar el dado) es 1 / 6 (= 0.1666)

La fórmula queda:

P (k = 4) = 0.026

Es decir, que la probabilidad de obtener cuatro veces el números 3 al tirar un dado 8 veces es de 2.6%.

Page 188: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

14

17

Características de la distribución binomial

n = 5 p = 0.1

n = 5 p = 0.5

Media

= E(X) = n p

= 5 · 0.1 = 0.5

= 5 · 0.5 = 0.25

Desviación estándar

0

.2

.4

.6

0 1 2 3 4 5

X

P(X)

.2

.4

.6

0 1 2 3 4 5

X

P(X)

0

1.1)5.01(5.05

67.0)1.01(1.05

)1(

pnp

Page 189: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

15

Ejercicio de prueba #1

Un comerciante de verduras tienen conocimiento de que el 10% de la caja está descompuesta. Si un comprador elige 4 verduras al azar, encuentre la probabilidad de que.

a) las 4 estén descompuestas.

b) de 1 a 3 estén descompuestas.

Para resolver la pregunta “b” repase el

modulo de las reglas de probabilidad.

En este caso se resuelve sumando las

probabilidades P(x=1) + P(x=2) + P(x=3)

= 0.6561 + 0.2916 + 0.0486

Page 190: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

16

Ejercicio de prueba #2

En pruebas realizadas a un amortiguador para automóvil se encontró que el 20% presentaban fuga de aceite. Si se instalan 20 de estos amortiguadores, hallar la probabilidad de que,

a) 4 salgan defectuosos,

b) más de 5 tengan fuga de aceite.

c) de 3 a 6 amortiguadores salgan defectuosos.

d) Determine el promedio y la desviación estándar de amortiguadores con defectos.

La pregunta “b” debe sumar las probabilidades desde

P(x=6) en adelante.

En la “c” debe sumar P(x=3) + P(x=4) + P(x=5) + P(x=6).

Page 191: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

17

Ejercicio de prueba #3

Un ingeniero que labora en el departamento de control de calidad de una empresa eléctrica, inspecciona una muestra al azar de 10 alternadores de un lotes. Si el 15% de los alternadores del lote están defectuosos. Cuál es la probabilidad de que en la muestra,

a) ninguno esté defectuoso,

b) uno salga defectuoso,

c) al menos dos salgan defectuosos

d) más de tres estén con defectos

Para la pregunta “d” puede realizar la siguiente operación:

1 – [P(x=0) + P(x=1) + P(x=2)]

Page 192: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

18

Ejercicio de prueba #4

Se lanza al aire ocho veces un dado. Determine la probabilidad de que no salgan más de dos números seis.

Page 193: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

19

Ejercicio de prueba #5

Construya la gráfica de distribución de probabilidad binomial para: a) n=5, p=1/2

b) n= 8, p=1/3

Page 194: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

20

La distribución de Poisson se llama así

en honor a su creador, el francés

Simeón Dennis Poisson (1781-1840),

Esta distribución de probabilidades fue

uno de los múltiples trabajos matemáticos

que Dennis completó en su productiva trayectoria.

Dato histórico

Page 195: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

21

Utilidad

La distribución de Poisson se utiliza en situaciones donde los sucesos son impredecibles o de ocurrencia aleatoria. En otras palabras no se sabe el total de posibles resultados.

Permite determinar la probabilidad de ocurrencia de un suceso con resultado discreto.

Es muy útil cuando la muestra o segmento n es grande y la probabilidad de éxitos p es pequeña.

Se utiliza cuando la probabilidad del evento que nos interesa se distribuye dentro de un segmento n dado como por ejemplo distancia, área, volumen o tiempo definido.

Page 196: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

22

Ejemplos de la utilidad

La llegada de un cliente al negocio durante una hora.

Las llamadas telefónicas que se reciben en un día.

Los defectos en manufactura de papel por cada metro producido.

Los envases llenados fuera de los límites por cada 100 galones de producto terminado.

La distribución de Poisson se emplea para describir procesos con un elemento en común, pueden ser descritos por una variable aleatoria discreta.

Page 197: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

23

Propiedades de un proceso de Poisson

1. La probabilidad de observar exactamente un éxito en el segmento o tamaño de muestra n es constante.

2. El evento debe considerarse un suceso raro.

3. El evento debe ser aleatorio e independiente de otros eventos

Si repetimos el experimento n veces podemos obtener

resultados para la construcción de la distribución de Poisson.

Page 198: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

24

La distribución de Poisson

La distribución de probabilidad de Poisson es un ejemplo de distribución de probabilidad discreta.

La distribución de Poisson parte de la distribución binomial.

Cuando en una distribución binomial se realiza el experimento muchas veces, la muestra n es grande y la probabilidad de éxito p en cada ensayo es baja, es aquí donde aplica el modelo de distribución de Poisson.

Se tiene que cumplir que:

p < 0.10

p * n < 10

Page 199: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

25

La función P(x=k)

Donde: P(X=K) es la probabilidad de ocurrencia cuando la variable discreta X toma un valor finito k. λ = Lambda es la ocurrencia promedio por unidad (tiempo, volumen, área, etc.). Es igual a p por el segmento dado. La constante e tiene un valor aproximado de 2.711828 K es el número de éxitos por unidad

Page 200: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

26

Ejemplo1

La probabilidad de que haya un accidente en una compañía de manufactura es de 0.02 por cada día de trabajo. Si se trabajan 300 días al año, ¿cuál es la probabilidad de tener 3 accidentes?

Como la probabilidad p es menor que 0.1, y el producto n * p es menor que 10 (300 * 0.02 = 6), entonces, aplicamos el modelo de distribución de Poisson:

Al realizar el cómputo tenemos que P(x = 3) = 0.0892

Por lo tanto, la probabilidad de tener 3 accidentes laborales en 300 días de trabajo es de 8.9%.

Page 201: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

27

Ejemplo 2

La probabilidad de que un producto salga defectuoso es de 0.012. ¿Cuál es la probabilidad de que entre 800 productos ya fabricados hayan 5 defectuosos?

En este ejemplo vemos nuevamente la probabilidad p menor que 0.1, y el producto n * p menor que 10, por lo que aplicamos el modelo de distribución de Poisson:

El resultado es P (x = 5) = 0.04602

Por lo tanto, la probabilidad de que haya 5 productos defectuosos entre 800 recién producidos es de 4.6%.

Page 202: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

28

La media μ y la varianza σ2

17

Características de la distribución Poisson

k = 5 λ = 0.1

k = 5 λ = 0.5

Media

= E(X) = λ

Varianza

λ = σ2

0

.2

.4

.6

0 1 2 3 4 5

X

P(X)

.2

.4

.6

0 1 2 3 4 5

X

P(X)

0

Page 203: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

29

Ejercicio de prueba #1

Un comerciante de verduras tiene conocimiento de que el 3% de la caja está descompuesta. Si un comprador elige 100 verduras al azar, encuentre la probabilidad de que,

a) las 4 estén descompuestas.

b) de 1 a 3 estén descompuestas

Page 204: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

30

Ejercicio de prueba #2

En pruebas realizadas a un amortiguador para automóvil se encontró que el 0.04 presentaban fuga de aceite. Si se instalan 150 de estos amortiguadores, hallar la probabilidad de que,

a) 4 salgan defectuosos,

b) más de 5 tengan fuga de aceite.

c) de 3 a 6 amortiguadores salgan defectuosos.

d) Determine el promedio y la desviación estándar de amortiguadores con defectos.

Page 205: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

31

Ejercicio de prueba #3

Un ingeniero que labora en el departamento de control de calidad de una empresa eléctrica, inspecciona una muestra al azar de 200 alternadores de un lote. Si el 2% de los alternadores del lote están defectuosos. Cuál es la probabilidad de que en la muestra,

a) ninguno esté defectuoso,

b) uno salga defectuoso,

c) al menos dos salgan defectuosos

d) más de tres estén con defectos

Page 206: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

32

Ejercicio de prueba #4

La probabilidad de que un CD de música dure al menos un año sin que falle es de 0.95, calcular la probabilidad de que en una muestra de 15,

a) 12 duren menos de un año,

b) a lo más 5 duren menos de un año,

c) al menos 2 duren menos de un año.

Page 207: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

33

Ejercicio de prueba #5

Si 8 de 100 viviendas violan el código de construcción. ¿cuál es la probabilidad de que un inspector de viviendas, que selecciona aleatoriamente a 50 de ellas, descubra que:

a) ninguna de las casas viola el código de construcción

b) una viola el código de construcción

c) dos violan el código de construcción

d) al menos tres violan el código de construcción

Page 208: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

34

Distribuciones de Probabilidad

Distribuciones de

Probabilidad

Continuas

Binomial

Poisson

Distribuciones de

Probabilidad

Distribuciones de

Probabilidad

Discretas

Normal

Page 209: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

35

La distribución normal

Page 210: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

36

Sin duda la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución normal, gaussiana o de Laplace- Gauss. Fue descubierta y publicada por primera vez en 1733 por De Moivre. A la misma llegaron, de forma independiente, Laplace (1812) y Gauss (1809), en relación a la teoría de los errores de observación astronómica y física .

Pierre Simon de Laplace

(1749-1827)

Karl Gauss

(1777-1855)

Page 211: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

37

Distribución normal o gaussiana

Está caracterizada por dos parámetros: la media, μ y la desviación típica, σ.

Su función de densidad es:

0) (σ

x -eπσ

xPσ)μ,N2

2

σ

μ)x

2

(

2

1)((

La curva normal adopta un número infinito de

formas, determinadas por sus parámetros μ y σ.

Page 212: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

38

La familia de las distribuciones

de probabilidad normal

Cada una de las distribuciones puede

tener una media distinta (u)

y desviación estándar distinta (ơ).

No existe una sola distribución

de probabilidad normal, sino más bien

se trata de toda una “familia” de ellas.

Por tanto, eI número de distribuciones

normales es ilimitado.

Page 213: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

39

Page 214: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

40

Al variar los parámetros μ and σ, obtenemos diferentes

distribuciones normales

Page 215: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

41

X

f(X)

μ

σ

Cambiando μ movemos la

distribución hacia la izquierda

o derecha.

Cambiando σ aumentamos o

disminuímos su altura..

Page 216: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

42

La curva normal

tiene forma de

campana y un

sólo pico en el

centro de la

distribución.

La distribución de probabilidad normal y

la curva normal que la acompaña tienen

las siguientes características:

Page 217: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

43

La media, la mediana y la moda de la

distribución son iguales y se ubican en el

pico.

Características (cont.)

Page 218: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

44

Características (cont.)

La mitad del área

bajo la curva se

encuentra a la

derecha de este

punto central y la

otra mitad está a

la izquierda de

dicho punto.

Page 219: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

Características (cont.)

Es simétrica en torno a su promedio. Si

se corta Ia curva normal de manera vertical

por el valor central, las dos mitades serán

como imágenes en un espejo.

Page 220: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

46

Características (cont.)

La curva normal desciende suavemente en ambas

direcciones a partir del valor central.

Es asintótica, Ia curva se acerca cada vez más al

eje de X pero jamás llega a tocarlo. Es decir, las “colas” de

Ia curva se extienden de manera indefinida en ambas

direcciones.

Page 221: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

47

Características (cont.)

Page 222: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

48

La distribución de probabilidad

normal estándar

Sería físicamente imposible proporcionar

una tabla de probabilidades para cada

combinación de µ y Ơ.

Es posible utilizar un sólo miembro de Ia

familia de distribuciones normales para

todos los problemas en los que se aplica

Ia distribución normal.

Page 223: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

49

La distribución de probabilidad

normal estándar

Tiene una media de 0 y una desviación

estándar de 1

Los valores mayores al promedio tienen

valores Z positivos y, valores menores al

promedio tendrán valores Z negativos.

Z

f(Z)

1

0

Page 224: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

50

Utilizando un valor z, se convertirá, o

estandarizará, Ia distribución real a una

distribución normal estándar.

Transformamos unidades X en unidades Z

Todas las distribuciones normales pueden

convertirse a “distribución normal estándar”

restando Ia media de cada observación y

dividiendo por Ia desviación estándar.

Page 225: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

51

Un valor z es Ia distancia a partir de

Ia media, medida en las unidades de

desviación estándar.

El valor z

Page 226: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

52

Valor z es Ia distancia entre un valor

seleccionado (x) y Ia media (u),

dividida por la desviación estándar (ơ).

El valor z

Page 227: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

53

Límites sigma

Page 228: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

54

Límites dos sigma

Page 229: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

55

Límites tres sigma

Page 230: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

56

Al determinar el valor z empleando Ia fórmula

anterior, es posible encontrar eI área de

probabilidad bajo cualquier curva normal

haciendo referencia a Ia distribución normal

estándar en la tabla de z.

Page 231: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

57

Tabla de z Áreas debajo de la

curva normal

z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359

0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753

0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141

0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517

0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879

0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224

0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549

0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852

0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133

0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389

1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621

1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830

1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015

1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177

1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319

1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441

1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545

1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633

1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706

1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767

2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817

2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857

2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890

2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916

2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936

2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952

2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964

2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974

2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981

2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986

3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990

Page 232: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

58

Ejemplo:

Supongamos que se calculó el valor z y el

resultado es 1.91.

¿CuáI es eI área bajo la curva normal entre

u y X?

Page 233: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

59

Baja por Ia columna de la tabla

encabezada con Ia Ietra z hasta llegar

a 1.9.

Luego muévete en dirección

horizontal a la derecha y lee Ia

probabilidad en Ia columna con el

encabezado 0.01.

Es 0.4719.

Utilizamos la tabla de z.

Page 234: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

60

Esto significa que 47.19 por ciento

del área bajo Ia curva se encuentra

entre u y eI valor X,1.91

desviaciones estandar a la derecha

de Ia media.

Esta es Ia probabilidad de que una

observación esté entre 0 y 1.91

desviaciones estándar de Ia media.

Page 235: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

61

Valor z calculado

Ejercicios:

Area bajo Ia curva

2.84

1.00

0.49

.4977

.3413

.1879

Page 236: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

62

Ahora calcularemos eI valor z dada:

Ia media de Ia población, u,

la desviación estándar de ésta, ơ,

y una X seleccionada.

Page 237: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

63

Ejercicios:

Los ingresos semanales de los gerentes de

nivel intermedio tienen una distribución

aproximadamente normal con una media de

$1,000.00 y una desviación estándar de

$100.00.

¿Cuál es el valor z para un ingreso X de

$1,100.00?

Y, ¿para uno de $900.00?

Page 238: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

64

Para X = $1,100:

1100 – 1000

100

= 1.00

Utilizando la fórmula:

Para X = $900:

900 - 1000

100

= - 1.00

Page 239: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

65

La z de 1.00 indica que un ingreso semanal de $1,100.00 para un gerente de nivel intermedio está una desviación estándar a la derecha de Ia media. La z de -1.00 indica que un ingreso de $900.00 está una desviación estándar a la izquierda de Ia media. Ambos ingresos ($1,100 y $900) están a Ia misma distancia ($100) de la media.

Page 240: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

66

900 1,100 1,000

Page 241: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

67

La primera aplicación de la distribución normal estándar es encontrar el área bajo la curva normal entre una media y un valor seleccionado, designado como X.

Utilizando la misma distribución que en el ejemplo anterior del ingreso semanal

(u = $1 000, ơ = $100) ¿Cuál es el área bajo la curva normal entre $1,000 y

$1,100?

Page 242: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

68

La probabilidad asociada con el valor z de 1.00 se encuentra en la tabla de z. Para ubicar el área, desciende por la columna de la izquierda hasta 1.0. Luego muévete a la derecha y lee el área bajo la curva en la columna marcada 0.00.

Ya se calculó el valor z para $1,100 utilizando la fórmula: z = 1.00

Es 0.3413.

Page 243: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

69

Utilizando nuevamente el ingreso medio de

$1,000 al mes y Ia desviación estándar de

$100 al mes:

1.¿Cuál es Ia probabilidad de que un ingreso

semanal específico elegido aI azar esté

entre 790 y 1,000 dólares?

Ejercicios:

Page 244: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

70

Calculamos el valor z para $790 utilizando la fórmula:

790 – 1000 = - 210 = -2.10 100 100

Pregunta 1

Page 245: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

71

900 1,100 1,000 -2.10

El signo negativo en 2.10 indica que el área está a la izquierda de la media.

Page 246: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

72

El área bajo Ia curva normal entre u y X que

corresponde a un valor z de -2.10 es:

(tabla de z).

.4821

Page 247: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

73

900 1,100 1,000 -2.10

.4821

|

|

|

Page 248: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

74

2.¿CuáI es Ia probabilidad de que eI ingreso

sea menos de 790 dólares?

Page 249: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

75

La media divide Ia curva normal en dos

mitades idénticas. El área bajo Ia mitad a Ia

izquierda de Ia media es 0.5 y eI área a Ia

derecha de Ia media es tambien 0.5.

0.5 0.5

Page 250: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

76

Por tanto,

0.5000 - 0.4821 = 0.0179

Page 251: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

77

900 1,100 1,000

|

.0179 |

|

.4821

|

|

|

-2.10

Page 252: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

78

Una segunda aplicación de Ia distribución

normal estándar es:

combinar dos áreas:

- una a Ia derecha

- y Ia otra a Ia izquierda de Ia media.

Page 253: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

79

Regresemos a Ia distribución de

ingresos semanales

(u = $1,000 ơ = $100)

¿CuáI es el área bajo Ia curva normal entre

$ 840 y $1,200?

Page 254: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

80

Es necesario dividir la pregunta en dos partes.

Para el área entre $840 y la media de $1,000: 840 -1000 = -160 = 1.60 100 100

Para el área entre $1,200 y la media de $1,000: 1,200 -1000 = 200 = 2.00 100 100

Page 255: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

81

El área bajo la curva para un valor z de -1.60

es:

El área bajo Ia curva para un valor z de 2.00

es

0.4452.

(Tabla de z).

Sumando las dos áreas:

0.4452+ 0.4772 = 0.9224

0.4772.

Page 256: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

82

Así, Ia probabilidad de seleccionar un

ingreso entre $840 y $1,200 es 0.9224.

En otras palabras, 92.24 por ciento de los

gerentes tienen ingresos semanales entre

$840 y $1,200.

Page 257: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

83

840 1,200 1,000

|

|

|

|

|

|

|

0.4452. 0.4772.

Page 258: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

84

Otra aplicación de Ia distribución normal

estándar esi:

encontrar el área mayor o menor de

un valor específico.

Page 259: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

Continuemos con Ia distribución de

ingresos semanales

(u = $1 000, ơ = $100)

¿qué porcentaje de los ejecutivos recibe

ingresos semanales de $1,245 o más?

Page 260: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

86

Para el área entre $1,245 y Ia media de

$1,000:

1,245 -1000 = 245 = 2.45

100 100

Page 261: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

87

El área bajo Ia curva para un valor z de 2.45

es

(de la tabla de z).

Restando: 0.5 - 0.4929 = 0.0071

0.4929.

Page 262: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

88

Sólo el .71 por ciento de los gerentes tienen

ingresos semanales de $1,245 o más.

Page 263: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

89

840 1,245 1,000

|

|

|

0.4929 0.0071

Page 264: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

90

Otra aplicación de Ia distribución normal

estándar es:

determinar el área entre dos valores en el

mismo lado de la media.

Page 265: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

91

Sigamos con Ia distribución de

ingresos semanales

(u = $1 000, ơ = $100)

¿CuáI es el área bajo Ia curva normal entre

$ 1,150 y $1,250?

Page 266: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

92

Es necesario dividir Ia pregunta en dos partes.

Para el área entre $1,250 y Ia media de $1,000:

1,250 -1000 = 250 = 2.50

100 100

Para el área entre $1,150 y Ia media de $1,000:

1,150 -1000 = 150 = 1.50

100 100

Page 267: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

93

El área bajo la curva para un valor z de 2.50

es:

El área bajo Ia curva para un valor z de 1.50

es

0.4938.

(de la tabla de z).

Restando las dos áreas:

0.4938 - 0.4332 = 0.0606

0.4332.

Page 268: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

94

Así, Ia probabilidad de seleccionar un

ingreso entre $1,150 y $1,250 es 0.0606.

En otras palabras, 6.06 por ciento de los

gerentes tienen ingresos semanales entre

$1,150 y $1,250.

Page 269: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

95

1,150 1,250 1,000

|

|

|

|

|

|

0.0606.

Page 270: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

96

Para resumir, existen cuatro situaciones en

las que pudiera ser posible encontrar el área

bajo Ia distribución normal estándar.

Page 271: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

1. Para encontrar el área entre u y z,

entonces es posible buscar directamente el

valor en Ia tabla.

2. Para encontrar el área más alIá (mayor o

menor) de z, entonces localice Ia

probabilidad de z en Ia tabla y reste ese

valor de 0.5000.

Page 272: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

98

3. Para encontrar eI área entre dos puntos a

diferentes lados de Ia media, determine los

valores z y sume las áreas

correspondientes.

4. Para encontrar el área entre dos puntos

en el mismo lado de Ia media, determine los

valores z y reste el área menor de Ia mayor.

Page 273: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

99

Una última aplicación de Ia distribución normal

supone encontrar el valor de Ia observación X

cuando se conoce eI porcentaje por encima o

por debajo de Ia observación.

Page 274: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

100

Un fabricante de goma de auto desea establecer una garantía de millaje mínimo para su nueva goma MX100. Las pruebas revelan que el millaje promedio es de 47,900 millas, con una desviación estandar de 2,050 millas y una distribución normal.

Ejemplo:

El fabricante quiere establecer el millaje mínimo garantizado de modo que no se deba reemplazar más del 4 por ciento de las gomas.

¿Qué millaje minimo garantizado deberá anunciar el fabricante?

Page 275: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

101

Utilizando Ia fórmula, X representa el millaje

mínimo garantizado

Z = X – 47900

2050

Page 276: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

102

Existen dos incógnitas, z y X.

Para encontrar z, observemos que el área

bajo Ia curva normal a Ia izquierda de u es

0.5000.

El area entre u y X es 0.4600,

que se encuentra restando 0.5000 - 0.0400.

Page 277: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

103

X 47,900

|

|

|

|

4%

0.04

0.4600

Page 278: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

104

El área más cercana a 0.4600 es: 0.4599

Moviéndose a los márgenes de este valor se lee el

valor z. El valor es: 1.75

(de la tabla de z).

Debido a que el valor se encuentra a Ia

izquierda de Ia media, en realidad es

-1.75.

Page 279: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

105

Sabiendo que la distancia entre u y X es -1.75 ơ, ahora es posible determinar X (el millaje minimo

garantizado):

-1.75 = X – 47900 2050

-1.75 (2050) = X – 47900

X = 47900 – 1.75 (2050) = 44312

Page 280: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

106

El fabricante puede anunciar que

reemplazará en forma gratuita cualquier

goma que se desgaste antes de recorrer

44,312 millas y Ia empresa sabe que, bajo

este plan, debe reemplazar sólo el 4 por

ciento de las gomas.

Conclusión:

Page 281: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

107

Otra aplicación de Ia distribución

normal consiste en comparar dos o

más observaciones que están en

distintas escalas o unidades.

Es decir, ambas observaciones se

encuentran en distribuciones distintas.

Page 282: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

108

Un estudio de los internos en una

institución correccional evalúa Ia

responsabilidad social de los internos

de Ia prisión y de sus perspectivas de

rehabilitación cuando se les Iibere.

Ejemplo:

Page 283: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

109

Las puntuaciones tienen una

distribución normal, con una media de

100 y una desviación estándar de 20.

Para medir su responsabilidad social,

se administró a cada interno una

prueba

Page 284: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

110

Los psicólogos de Ia prisión calificaron

a cada interno respecto de las

perspectivas de rehabilitación.

Las calificaciones tienen tambien una

distribución normal, con una media de

500 y una desviación estándar de 100.

Page 285: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

111

La calificación de Tora Carney en Ia

prueba de responsabilidad social fue

146, y en rehabilitación obtuvo una

puntuación de 335.

¿Cómo se compara Tora con otros

miembros del grupo en cuanto a

responsabilidad social y a Ia

perspectiva de rehabilitación?

Page 286: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

112

Convertimos Ia puntuación de Ia

prueba de responsabilidad social, 146,

a un valor z utilizando Ia fórmula:

Pasos a seguir:

Z = 146 – 100

20

Z = 2.30

Page 287: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

113

Convertimos Ia puntuación de Ia

prueba de responsabilidad social, 146,

a un valor z utilizando Ia fórmula:

Pasos a seguir:

Z = 146 – 100

20

Z = 2.30

Page 288: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

114

Por lo tanto, en lo referente a

responsabilidad social, Tora Carney se

encuentra en el 1 por ciento más alto del

grupo.

Conclusión:

Sin embargo, al compararla con otras

internas, Tora se encuentra entre eI 5 por

ciento más bajo en cuanto a las

perspectivas de rehabilitación.

Page 289: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

115

-1.65 2.30

|

|

|

|

|

|

|

0.4505 0.4893

0.0107 0.0495

Page 290: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

Distribución Ji-Cuadrada o Chi-cuadrada o X2?.

Es una prueba útil para variables categóricas y

estadística, es aplicable cuando la variable

nominal está compuesto por dos o más categorías.

Tiene dos aplicaciones:

1. La prueba de bondad de ajuste Chi-cuadrada.

2. La prueba Chi-cuadrada de asociación.

Ambas pruebas se utilizan para determinar si las

frecuencias observadas (O) en las categorías

difieren significativamente de las frecuencias

esperadas (E).

Page 291: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

117

Es una prueba estadística para evaluar hipótesis

acerca de la relación entre dos variables categóricas.

Símbolo: X2

Hipótesis a probar: Correlaciones

Variables

involucradas:

Dos variables (la prueba Chi-cuadrada no

considera relaciones causales).

Nivel de medición de

las variables

Nominal u ordinal (o intervalos o razón reducidas

a ordinales)

Procedimiento La Chi-cuadrada se calcula por medio de una

tabla de contingencia o tabulación cruzada, que

es una tabla de dos dimensiones y cada

dimensión contiene una variable. A su vez, cada

variable se subdivide en dos o más categorías.

Page 292: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

118

Total de Fila x Total de ColumnaF. Esperada=

Total General

CARACTERÍSTICAS

1. La Distribución X2 se lee con grados de libertad G.L = (Nº de filas - 1)(Nº de columnas - 1).

2. No tiene valores negativos. El valor mínimo es 0.

3. Todas las curvas son asimétricas

4. Cuando aumentan los grados de libertad las curvas son menos elevadas y más extendidas a la derecha.

5. Se utiliza para variables medidas en escala nominal u ordinal.

6. Las fórmulas son:

Page 293: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

119

DISTRIBUCIONES CHI CUADRADO

Page 294: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

120

Ejemplo 1. Variable, categoría y tabla de contingencia 2x2:

Sean las variables SEXO (Masculino y Femenino) y CANDIDATO

(“A” y “B”). La tabla de contingencia o tabulación cruzada es:

CANDIDATO

“A” “B”

Masculino

SEXO

Femenino

20 30

40 25

Page 295: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

121

Variable

Categoría

CANDIDATO

“A” “B”

Masculino

SEXO

Femenino

20 30

40 25

Page 296: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

122

Ejemplo 2. Estudio de Tabla de contingencia 3x2: Se estudia a 1040 estudiantes de los niveles de educación primaria y secundaria y a los cuales se aplica un instrumento que mide el aprendizaje de la matemática, en las dimensiones de aprendizaje conceptual, procedimental y actitudinal. Variables: APRENDIZAJE categorías: Conceptual, Procedimental, Actitudinal. NIVEL DE EDUCACIÓN categorías: Primaria, Secundaria.

NIVEL DE EDUCACIÓN

Primaria Secundaria

APRENDIZAJE

Conceptual

Procedimental

Actitudinal

180 100

190 280

170 120

TABLA DE CONTINGENCIA

Page 297: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

123

Tabla de frecuencias observadas (O):

NIVEL DE EDUCACIÓN TOTAL

Primaria Secundaria

APRENDIZAJE

Conceptual

Procedimental

Actitudinal

180 100 280

190 280 470

170 120 290

TOTAL 540 500 1040

La Chi-cuadrada es una comparación entre las tablas

de frecuencias observadas y la denominada tabla de

frecuencias esperadas (la tabla que esperaríamos

encontrar si las variables fueran estadísticamente

independientes o no estuvieran relacionadas).

Page 298: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

124

La frecuencia esperada de cada celda, casilla o recuadro, se calcula mediante la siguiente fórmula aplicada a la tabla de frecuencias observadas: N = es el número total de frecuencias observadas. E = (marginal del reglón)(marginal de columna) / N.

NIVEL DE EDUCACIÓN

Marginal

de filas

Primaria Secundaria

APRENDIZAJE

Conceptual

Procedimental

Actitudinal

(280)(540)/1040 (280)(500)/1040 280

(470)(540)/1040 (470)( 500)/1040 470

(290)(540)/1040 (290)(500)/1040 290

marginal de columnas 540 500 1040

Tabla de frecuencias esperadas (E):

Page 299: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

125

Frecuencia observada:

NIVEL DE EDUCACIÓN TOTAL

Primaria Secundaria

APRENDIZ

AJE

Conceptual

Procedimental

Actitudinal

145,4 134,6 280

244,0 226,0 470

150,6 139,4 290

TOTAL 540 500 1040

NIVEL DE EDUCACIÓN TOTAL

Primaria secundaria

APRENDI

ZAJE

Conceptual

Procedimental

Actitudinal

180 100 280

190 280 470

170 120 290

TOTAL 540 500 1040

Frecuencia esperada:

Donde:

O: frecuencia observada

en cada celda

E: frecuencia esperada

en cada celda

Page 300: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

126

E

EOX

2

2

Celda O E O-E (O-E)2 (O-E)2 / E

Conceptual/Primaria 180 145,4 34,6 1197,16 8,23

Procedimental/ Primaria 190 244,4 -54,4 2959,36 12,11

Actitudinal / Primaria 170 150,6 19,4 376,36 2,50

Conceptual / Secundaria 100 134,6 -34,6 1197,16 8,69

Procedimental /Secundaria 280 226,0 54,0 2916,00 12,80

Actitudinal / Secundaria 120 139,4 -19,4 376,36 2,70

X2 = 47,33

Para saber si el valor de X2 es o no significativo, debemos

calcular los grados de libertad.

G.L. = (Nº de filas - 1)(Nº de columnas - 1).

Page 301: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

127

Para el ejemplo: Nº de filas = 3 y Nº de columnas = 2; entonces

G.L. = (3-1)(2-1) = 2.

Luego, acudimos a la “tabla de distribución de Chi-

cuadrado”, eligiendo nuestro nivel de confianza ( = 0,05 ó

= 0,01).

Si el valor obtenido de X2 es igual o superior al valor de la

“tabla”, decimos que las variables están relacionadas o no

son independientes.

Aplicación:

Para el nivel de confianza de =0,05 y g.l. = 2, el X2 de tabla

es 5,9915 (ver tabla).

X2Obtenido

= 47,33

X2Crítico = 5,9915

Page 302: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

128

Page 303: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

129

Prueba de hipótesis:

H0: No existe relación entre el aprendizaje y los

niveles de educación.

H1: Existe relación entre el aprendizaje y niveles de

educación.

X2obtenido X2

crítico entonces variables no son

independientes; es decir existe una relación entre

Aprendizaje y los niveles educativos

X2obtenido < X2

crítico entonces se rechaza la

hipótesis nula (H0), y por lo tanto se acepta la hipótesis

alterna (H1).

Page 304: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

130

Establezca la Ho a ser probada; por ejemplo,

Ho: 1 = 2 = 0,5

Especifique el nivel de significancia α, por ejemplo: α = 0.5

Haga una tabla de frecuencias obtenidas

Deduzca las frecuencias esperadas a partir de Ho:

Calcule el grado de libertad: Producto de (categorías - 1)

Calcule el valor de X2 a partir de las frecuencias obtenidas y

frecuencias esperadas.

Mediante la tabla de X2 obtenga el valor teórico.

Compara dichos valores.

Establezca la conclusión con respecto a Ho:

Retenga Ho si valor de tabla > Valor calculado.

Retenga Ho si valor de tabla < Valor calculado.

Paso Nº 1

Paso Nº 2

Paso Nº 3

Paso Nº 4

Page 305: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

131

Un politólogo cree que, durante los últimos años, la composición étnica

de la ciudad donde vive ha cambiado. Las cifras más actuales

(reunidas hace unos cuántos años) muestran que los habitantes de

dicha ciudad presentan la siguiente composición étnica: 53% noruegos,

32% suecos, 8% irlandeses, 5% alemanes y 2% italianos. Para verificar

esta idea, este científico social obtiene una muestra aleatoria de 750

habitantes, con los resultados que se presentan en la siguiente tabla:

Países Noruegos Suecos Irlandeses Alemanes Italianos

frecuencia 399 193 63 82 13

a). ¿Cuál es la hipótesis nula?

b). ¿Cuál es la hipótesis alterna?

c). ¿Cuál es la conclusión?. Utilice = 0,05.

Ejercicio:

Page 306: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

132

Una universidad está pensando en implantar uno de los tres sistemas de

calificaciones siguientes: (1) todas las calificaciones son aprobados-reprobado;

(2) todas las calificaciones están en el sistema 4.0 y (3) 90% de las

calificaciones están en el sistema 4.0 y 10% son a probados-reprobado. Se

realiza una encuesta para determinar si existe una relación entre el área de

interés de cada alumno y su presencia para algún sistema de calificación. Se

elige una muestra aleatoria de 200 estudiantes del área ingeniería, 200 de

ciencias, y 100 de bellas artes. Se pregunta a cada alumno cuál de los tres

calificaciones prefieren. Los resultados aparecen en la siguiente tabla:

Sistema de calificación

Aprobado-reprobado 4,0 4,0 y aprobado-reprobado

Bellas artes 26 55 19

Ciencias 24 118 58

Ingeniería 20 112 68

a). ¿Cuál es la hipótesis nula?

b). ¿Cuál es la hipótesis alterna?

c). ¿Cuál es la conclusión?. Utilice = 0,05.

Ejercicio:

Page 307: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

133

DISTRIBUCIÓN “t” de STUDENT

- Utilizada por primera vez por W.S. Gosset (1908).

- Su uso potencial fue descrito por Fisher (1925).

- Se calcula restando al número de observaciones independientes en una muestra el número “k” de parámetros de la población.

- La distribución t es igual a la disribución X2 cuando los grados de libertad tienden a infinito.

Page 308: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

134

Se puede probar que siendo `x el promedio de una muestra tomada de una población normal con media y varianza 2, el estadístico t es el valor de una variable aleatoria con distribución "t" de Student y parámetro (grados de libertad) = n-1.

t =x -

s / n

Definiendo el estadístico t:

Page 310: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

136

Características Distribución “t”

Tiene media igual 0, es asintótica al eje x y su dominio va de - a +;

El área bajo la curva desde - a + es igual a 1

0, 2 depende parámetro (grados libertad)

Varianza > 1, pero se aproxima a 1 cuando n

Al aumentar n, la distribución “t se aproxima a la Normal; n > 30 ó más, excelente aproximación

Entre las aplicaciones:

Estimación de intervalos de confianza para medias a partir de muestras pequeñas

Pruebas de hipótesis basadas en muestras < 30

Page 311: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

137

Tabla de Distribución “t”

Valores de t a la derecha de los cuales se encuentra el (100 x )% área de la curva.

Localizamos la columna del valor de y fila del valor de . La intersección de la fila y la columna nos dará el valor de t.

Page 312: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

138

H0: µ=µ0 es la hipótesis nula que se plantea en esta distribución. HA: µ≠ µ0

Si tc < tα (2), gl se acepta H0 tc > t α(2), gl se rechaza H0

Page 313: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

139

Ejemplo 1.

Suponga que la edad promedio de muerte de ciertos mamíferos es de 22 años (µ) y que en una muestra de 25 individuos se obtuvieron los siguientes resultados:

17.2 18.0 18.7 19.8 20.3 20.9 21.0 21.7 22.3 22.6 23.1 23.4 23.8 24.2 25.8 26.0 26.3 27.2 27.6 28.1 28.6 29.3 30.1 35.1 24.6

Pruebe la hipótesis nula de que µ=µ0

Page 314: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

140

Ejemplo 2.

Suponga que se toman 12 ratones y se examina el efecto que determinada dieta tiene sobre su ganancia de peso. Los datos obtenidos fueron los siguientes:

1.7 0.7 -0.4 -1.8 0.2 0.9 -1.2 -0.9 -1.8 -1.4 -1.8 -2.0

Pruebe la hipótesis nula de que µ=0

Page 315: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

141

Distribución F de Fisher

El nombre de esta distribución se debe a R. A. Fisher, quién primero la desarrolló y describió. La prueba F se utiliza principalmente para probar la igualdad entre dos varianzas. Se puede observar, que esta prueba para la igualdad de varianzas se utiliza generalmente para probar la igualdad entre tres o más medias. Cuando se procede a realizar la inferencia estadística para probar igualdad entre 3 o más medias comúnmente se denomina análisis de varianza. El que implica medir la variabilidad de las medias de las muestras obtenidas a partir de las poblaciones problema.

Page 316: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

142

Cuando se tiene interés en comparar varianzas, se puede recurrir a la variable aleatoria F, que es la razón de los estimadores insesgados de dos varianzas poblacionales esto es:

2

2

2

1

s

sF

Page 317: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

143

La distribución F tiene dos parámetros: los números de grados de libertad que se denotan con el símbolo 1 y 2 .

El parámetro 1 está asociado con el numerador de la razón F; esto es s2

1, estimador insesgado de la varianza 2

1 de la población 1.

La varianza s21 , se obtiene a partir de una muestra

de n1 observaciones tomadas aleatoriamente a partir de la población 1.

Page 318: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

144

Puesto que la suma de las desviaciones a partir

de la media muestral, al cuadrado, para s21 tiene

(n-1) grados de libertad, el parámetro 1 es igual

a (n1 - 1), así también el parámetro 2 es igual a

(n2 - 1), de modo semejante, 2 está asociado

con el denominador de la razón F; esto es, s22 ,

estimador insesgado para la varianza 22 de la

población 2.

Page 319: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

145

La varianza s22 se obtiene a partir de una muestra de

n2 observaciones tomadas aleatoriamente a partir de la población 2.

La distribución F se denota con dos subíndices, el primero corresponde a 1 y el segundo a 2

Page 320: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

146

Propiedades

El estadístico de prueba toma solamente valores no negativos, debido a que tanto numerador y denominador de la razón F son varianzas, las que NO pueden ser valores negativos.

El valor de F varía de cero a infinito, sin embargo en la práctica se considera a 1 como límite inferior del valor F, debido a que siempre es posible utilizar la mayor varianza muestral como numerador de forma que la relación F no sea menor que 1. El límite superior del valor F rara vez es de más de unos cuantos dígitos en la mayor parte de las situaciones. Ejemplo, una F(0.05;20;24) = 2.03 con un alfa =0.05.

Page 321: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

147

La tabla F se construye en base a que el numerador de la razón F es mayor que el denominador, y luego los valores de F generalmente son mayores que 1 y tienden a 1 cuando tanto 1 y 2 tienden a infinito.

Bajo la Ho, de que las dos varianzas poblacionales son iguales, se espera que las varianzas de dos muestras cualesquiera tomadas respectivamente a partir de las dos poblaciones sean iguales también.

Page 322: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

148

Sin embargo, a pesar que la hipótesis nula sea verdadera, debido a la naturaleza aleatoria del muestreo las dos varianzas muestrales es muy posible difieran una de otra. Mientras mayor sea la diferencia entre las dos varianzas muestrales, mayor será la magnitud en que el estadístico de prueba F esté por encima de 1. La hipótesis nula Ho, se rechaza solamente cuando el valor del estadístico de prueba F es suficientemente mayor que 1.

Page 323: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

149

Nota: Cuando s21 es mayor que s2

2, no hay dificultad en

probar la hipótesis nula de Ho: 21 = 2

2 en contra de H1: 21

> 22 , pues sólo se divide la mayor varianza entre la menor

y después se compara con el valor de tabla, sin embargo, la

practica de considerar a s21 como numerador de la razón es

solamente adecuada cuando es la mayor de las dos varianzas

muestrales en una prueba de una cola.

Page 324: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

150

Ejemplo:

Suponga que en un invernadero se ha determinado el porcentaje de germinación de semillas de ciertas plantas. Los resultados obtenidos fueron los siguientes:

41 34 33 36 40 25 31 37 34 30 38

Muestra 1

52 57 57 55 62 56 55 64

Muestra 2

Pruebe H0: Ambas muestras pertenecen a la misma población.

Page 325: MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

151

En caso de que la hipótesis nula sea aceptada, debe calcularse una varianza ponderada:

Donde: