MATERIA: BIOESTADÍSTICA AUTOR: DR. GERARDO DE JESÚS …

Preview:

Citation preview

MATERIA: BIOESTADÍSTICA

AUTOR: DR. GERARDO DE JESÚS SOSA SANTILLÁN

FECHA DE ELABORACIÓN: ENERO 2016

1

FUNDAMENTOS DE

PROBABILIDAD Y ESTADÍSTICA

Dr. Gerardo de Jesús Sosa Santillán

Departamento de Biotecnología

Facultad de Ciencias Químicas

Universidad Autónoma de Coahuila.

2

I. Introducción

3

“Hay tres tipos de mentiras: las mentiras, las

mentiras infames, y las mentiras estadísticas”

-Benjamin Desraelí, 1766-1848, estadista inglés-

4

> Conjunto de métodos científicos ligados a la toma, organización,

recopilación, presentación y análisis de datos, tanto para la deducción de

conclusiones como para tomar decisiones razonables de acuerdo con

tales análisis.

>Arte de la decisión en presencia de incertidumbre.

>Ciencias que sirve para demostrar que dos personas han comido 1/2

pollo cada una, cuando en realidad una ha comido uno y la otra

ninguno.

Tres definiciones de estadística

5

•La estadística desempeña un papel fundamental y cada vez más relevante en prácticamente todas las áreas de la ciencia. •Etimológicamente, la palabra estadística significa “cifras relacionadas con el Estado”.

•La estadística es concebida popularmente como conjuntos de cifras o gráficas, asociadas generalmente con promedios.

6

•La estadística es concebida popularmente como conjuntos de cifras o gráficas, asociadas generalmente con promedios. •Como procedimiento de toma de decisiones, la estadística es de importancia creciente en varios campos, por ejemplo, en la producción industrial en masa, medicina y biología, economía, política, psicología, análisis de opinión pública y otras ciencias sociales, agricultura, meteorología, física, química e ingeniería.

7

CLASIFICACIÓN

ESTADÍSTICA INFERENCIAL

ESTADÍSTICA DESCRIPTIVA

A partir del cálculo de probabilidades y datos muestrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.

Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos.

8

Relación entre estadística y probabilidad:

•La probabilidad es el estudio de fenómenos puramente aleatorios, mientras que la estadística se puede describir como la ciencia o el arte de reunir y analizar datos e inferir consecuencias a partir de estos elementos. •El azar afecta tanto a la reunión de datos como a su análisis y se debe tener en cuenta al hacer inferencias.

9

SEMBLANZA HISTÓRICA DE LA ESTADÍSTICA.

•Se cree que los orígenes de la estadística están ligados al antiguo Egipto y a los censos chinos hace unos 4000 años, aproximadamente. •Desde esa época, diversos estados realizaron estudios sobre algunas características de sus poblaciones, sus riquezas, posesiones, etc. •En 1662, John Graunt, un mercader Inglés, publicó un libro sobre los nacimientos y defunciones ocurridos en Londres; el libro tenia conclusiones acerca de ciertos aspectos relacionados con estos acontecimientos. Esta obra es considerada como el punto de partida de la estadística moderna.

10

•La palabra estadística comenzó a usarse en el siglo XVIII, en Alemania, en relación a estudios donde los grandes números, que representaban datos, eran de importancia para el estado. Sin embargo, la estadística moderna se desarrolló en el siglo XX a partir de los estudios de Karl Pearson.

•Hoy la estadística tiene gran importancia, no sólo por que presenta información, sino que además permite inferir y y predecir lo que va a ocurrir, y por lo tanto, es una herramienta fundamental a la hora de tomar decisiones de importancia.

11

•Girolamo Cardano (1501-1576). La Teoría de probabilidad tuvo su origen en apuestas en juegos de azar. •Pascal (1623-1705) y Fermat (1601-1665). Desarrollaron la Teoría de la Probabilidad. •Jakob Bernoulli (1654-1705). De los primeros en estudiar la probabilidad matemática. •Laplace (1749-1827) y Gauss (1777-1855). Ecuación de la curva normal, conocida en la actualidad como curva de Gauss o campana de Gauss.

12

•Charles Lyell en el siglo XIX encontró aplicación de la estadística a un problema de geología. •Darwin (1809-1882) y Mendel (1866) realizaron trabajos netamente estadísticos. •Karl Pearson (1857-1936). Considerado el padre de la estadística. Fundador de la revista “Biometrika” y de la Escuela de Estadística en Cambridge, Inglaterra. A él se debe el estudio de la bondad de ajuste con la X2 y el coeficiente de correlación entre dos variables.

13

W.S. Gosset (1876-1937). Estadística de muestras pequeñas. La “t de student”, herramienta básica para los estadísticos y experimentadores. Ronald Alymer Fisher (1890-1962). Genetista y estadístico. Prueba de F para probar hipótesis acerca de dos varianzas de muestras pequeñas. Prueba de Z de Fisher, para probar hipótesis acerca del coeficiente de correlación lineal. William Feller . Teorema del Límite Central.

14

•1834. Se crea la primera sociedad científica específica en estadística: “Royal Statistical Society”, que en 1838 crea la primera revista de estadística, “Journal of Royal Statistical Society”. •1839. Se crea en USA la American Statistical Association (ASA), que en 1841 crea la revista “Journal of American Statistical Association”. •1853. Primer Congreso Internacional de Estadística, Bruselas Bélgica. •1885. Se crea el International Statistical Institute (ISI).

15

•1940. Se crea el Instituto Interamericano de Estadística (IASI). •1953. El IASI crea el Centro Interamericano de enseñanza Estadística, Económica y Financiera, que en 1962 se transformó en el Centro Interamericano de enseñanza de la Estadística (CIENES), cuya sede desde esa fecha y hasta la actualidad funciona en Santiago de Chile.

16

La estadística en la investigación científica.

•La estadística interviene en la investigación y/o el método científico a través de la experimentación y la observación. •Los científicos deben ser capaces de observar un suceso o un conjunto de eventos como resultado de un plan o diseño. Esto es el experimento, la sustancia del método científico. •El diseño experimental es un campo de la estadística; cuando se aplica en ciencias de la vida, se denomina bioestadística.

17

•La evaluación objetiva de una hipótesis presenta problema. Puesto que no es posible observar todos los eventos concebibles, existirá variación entre los que son observados. •El científico razona de lo particular a lo general. Este proceso es de inferencia incierta. •Este tipo de procesos nos permite desaprobar hipótesis incorrectas, pero no permite aprobar hipótesis correctas. Lo único que se puede dar como demostración es una comprobación fuera de duda razonable. •El azar entra en juego en la obtención de la información y es la causa de la incertidumbre. El estadístico realiza una medición objetiva y precisa de la incertidumbre de las inferencias.

18

•El uso de la estadística como herramienta de la investigación no puede separarse de la planeación general del proyecto de investigación. •El método estadístico apropiado debe formar parte integral del diseño total. •Un proyecto de investigación debe ser diseñado y planificado antes de efectuarse. Los datos no deben ser obtenidos con la convicción de que un método estadístico estará automáticamente disponible para analizarlos. •En muchas ocasiones el estadístico se ve en la necesidad de comunicar al investigador que sus esfuerzos fueron desperdiciados porque no hay una manera legítima de analizar sus datos.

19

Etapas de una investigación estadística

1. Formulación del problema.

2. Diseño del experimento.

3. Colección de datos y experimentación.

4. Tabulación y descripción de los resultados.

5. Inferencias estadística y formulación de la

respuesta.

20

1. Formulación del problema

- Crear conceptos precisos, formular preguntas claras, imponer limitaciones adecuadas al problema.

- La calidad de las conclusiones estadísticas depende de la precisión de los datos, que a su vez dependen dela exactitud en la formulación del problema.

21

2. Diseño del experimento.

- Obtener un máximo de información empleando un mínimo de costo y tiempo.

- Debemos determinar tamaño de la muestra, cantidad y tipo de datos a obtener.

- Establecer el método matemático que se empleará en la última etapa para analizar los datos.

- Debe tenerse cuidado al planificar y diseñar un experimento, de otro modo no se alcanzará ninguna conclusión válida.

22

3. Colección de datos y experimentación.

- Métodos usados para obtener información pertinente.

- Esta es la parte que más tiempo consume en toda investigación.

- Debe sujetarse a reglas esctrictas.

- Cuanto menos opiniones impongamos, serán mejores los resultados.

23

4. Tabulación y descripción de los resultados.

- Ordenación de los datos en forma legible e ilustración con representaciones gráficas. - Cálculo de parámetros descriptivos.

24

5. Inferencia estadística y formulación de la respuesta.

- Al aplicar el método estadístico seleccionado en la etapa 2, se obtienen conclusiones acerca de la población a partir de la muestra. Esto es la inferencia estadística.

- Toma de decisiones y formulación de respuestas.

25

- No existe una fórmula en estadística que tome en cuenta todas las situaciones prácticas concebibles.

- Es necesario adquirir conocimientos generales de los métodos más importantes para la inferencia estadística.

- En cada caso práctico debe estudiarse con cuidado la naturaleza del problema específico, y sólo así se podrá escoger el método apropiado.

26

II. FUNDAMENTOS DE PROBABILIDAD.

27

Espacio de muestreo

El conjunto de todos los resultados posibles de un experimentos estadístico se llama espacio muestral o espacio de muestreo y se representa con el símbolo S.

El espacio muestral S de los resultados posibles cuando se lanza al aire una moneda se puede escribir como:

S={A, S}

28

Considere el experimento de lanzar un dado. Si nos interesamos en el número que muestra en la cara superior, el espacio muestral sería: S1={1,2,3,4,5,6} Si nos interesamos sólo en si el número es par o impar, el espacio muestral es simplemente: S2={par, impar}

29

El ejemplo anterior ilustra el hecho de que se puede usar más de un espacio muestral para describir los resultados de un experimento. En general es deseable utilizar el espacio muestral que dé mayor información acerca de los resultados del experimento. En este caso S1 proporciona más información que S2.

30

•En algunos experimentos es útil listar los elementos del espacio muestral de forma sistemática mediante un diagrama de árbol. •Por ejemplo, un experimento consiste en lanzar una moneda y después lanzarla una segunda vez si sale cara. Si en el primer lanzamiento sale cruz, entonces se lanza un dado una vez.

¿Cuál es el espacio muestral para este experimento?

31

HH

HT

H

H

T

T1

T2

T3

T4

T5

T6

1

2

3

4

5

6

T

Primer resultado

Segundo resultado

Punto de la muestra

S={HH, HT, T1, T2, T3, T4, T5, T6}

32

Ejemplo: Suponga que seleccionamos tres artículos de forma aleatoria de un proceso de fabricación. Cada artículo se inspecciona y se clasifica como defectuoso, D, o sin defectos, N. Realice un diagrama de árbol y determine el espacio muestral S para este caso.

S= {DDD, DDN, DND, DNN, NDD, NDN, NND, NNN}

33

Cuando en un espacio muestral hay un número grande o infinito de puntos muestrales, la descripción es mejor con un enunciado o regla. Por ejemplo: Si los resultados posibles de un experimento son el conjunto de ciudades en el mundo con una población de más de 1 millón, el espacio muestral sería:

S={X/X es una ciudad con una población de más de 1 millón}

34

De manera similar, si S es el conjunto de todos los puntos (x,y) sobre la frontera o el interior de un círculo de radio 2, con centro en el origen, escribimos:

S={(x,y)/x2+y2≤4}

El método de la regla tiene ventajas prácticas, en particular para los muchos experimentos donde un listado se vuelve una tarea tediosa.

35

Ejercicio 1. Liste los elementos de cada uno de los espacios

muestrales siguientes: a) El conjunto de enteros entre 1 y 50, divisibles

entre 8.

b) El conjunto S={x/x2+4x-5=0}

Donde

c) El conjunto S={x/x es un continente}

a

acbbx

2

42

36

Ejercicio 2. ¿Cuáles de los siguientes eventos son iguales? a) A={1,3}

b) B={x/x es un número en un dado}

c) C={x/x2-4x+3=0}

d) D={x/x es el número de caras cuando se lanzan 6

monedas}

37

Ejercicio 3. Un experimento implica lanzar un par de dados, uno

verde y uno rojo, y registrar los números que salen. Si “x” es el resultado en el dado verde y “y” es el resultado en el dado rojo, describa el espacios muestral S:

a) Mediante la lista de los elementos (x,y)

b) Mediante el uso del método de la regla.

38

Respuestas

Ejercicio 1. a) S={8,16,24,32,40,48}

b) S={1,-5}

c) S={América, Asia, Europa, Africa, Oceanía}

Ejercicio 2. A=C

39

Ejercicio 3: a) S={(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),(2,3),(2,4),(2,5),(2,6),(3,1),(3,2),(3,3),(3,4),(3,5)(3,6),(4,1),(4,2),(4,3),(4,4),(4,5),(4,6),(5,1),(5,2),(5,3),(5,4),(5,5),(5,6),(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)} b) S={(x,y)/”x” es el número en el dado verde y “y” es el número en el dado rojo}

40

Eventos y Probabilidad de Eventos

-Para cualquier experimento podemos estar interesados en la ocurrencia de ciertos eventos más que en el resultado de un evento específico.

- Por ejemplo, podemos estar interesados en el evento A en el que el resultado cuando se lanza un dado sea divisible entre 3.

- Esto ocurrirá si el resultado es un elemento del subconjunto A={3,6} del espacio muestral S={1,2,3,4,5,6}

41

Para cada evento se asigna una colección de puntos muestrales que constituye un subconjunto del espacio muestral. Este subconjunto representa la totalidad de los elementos para los que el evento es cierto. Podemos entonces definir un evento como un subconjunto de un espacio muestral.

42

Por ejemplo: Dado el espacio muestral S={t/t≥0}, donde t es la vida en años de cierto componente electrónico, entonces el evento A de que el componente falle antes de que finalice el quinto año es el subconjunto: A={t/0≤t≤5}

43

Un evento puede ser un subconjunto que incluya todo el espacio muestral S; o un subconjunto de S que se denomina conjunto vacío, que se denota por el símbolo ø, que no contiene elemento alguno. Por ejemplo: Si A={x/x es un factor par de 7} Entonces B debe ser un conjunto vacío, pues los únicos factores posibles de 7 son los números nones 1 y 7.

44

Considere un experimento donde se registran los hábitos de fumar de los empleados de una empresa. Sea el subconjunto de los fumadores un evento. Entonces la totalidad de los no fumadores corresponde a un evento diferente, también subconjunto de S, que se denomina complemento. Entonces el complemento de un evento A con respecto a S es el subconjunto de todos los elementos de S que no están en A. Denotamos el complemento de A como A’.

45

Ejemplo: Un experimento consiste en lanzar un dado y después lanzar una moneda una vez si el número en el dado es par. Si el número en el dado es impar la moneda se lanza dos veces. Sea H la notación para cara y T la notación para cruz. El espacio muestral S, es: S={1HH,1HT,1TH,1TT,2H,2T,3HH,3HT,3TH,3TT,4H,4T,5HH,5HT,5TH,5TT,6H,6T}

46

a) Liste los elementos que correspondan el evento A de que salga en el dado un número menor a 3.

b) Liste los elementos que correspondan al evento B de que ocurran dos cruces.

c) Liste los elementos que corresponden al evento A’

d) Liste los elementos que correspondan al evento B’

A={1HH,1HT,1TH,1TT,2H,2T}

B={1TT,3TT,5TT}

S={3HH,3HT,3TH,3TT,4H,4T,5HH,5HT,5TH,5TT,6H,6T}

S={1HH,1HT,1TH,2H,2T,3HH,3HT,3TH,4H,4T,5HH,5HT,5TH,6H,6T}

47

Probabilidad de un evento

¿Qué queremos decir cuando hacemos afirmaciones como: “Juan probablemente ganará el torneo de tenis”, o “Tengo una oportunidad de 50% de obtener un número para cuando lanzo un dado”?

En cada caso expresamos un resultado del cual no estamos seguros, pero debido a la información del pasado o a partir de una comprensión de la estructura del experimento, tenemos algún grado de confianza en la validez de la afirmación.

48

Consideremos aquellos experimentos para los cuales S tiene un número finito de elementos. -La probabilidad de ocurrencia de un evento que resulta de tal experimento estadístico se evalúa por medio de un conjunto de números reales denominados probabilidades que van de 0 a 1.

- Para todo punto en el espacio muestral asignamos una probabilidad tal que la suma de todas las probabilidades es 1.

- Un evento altamente probable tendrá una probabilidad cercana a 1.

- Un evento altamente improbable tendrá una probabilidad cercana a 0.

49

- Para encontrar la probabilidad de un evento A se suman todas las probabilidades que se asignan a los puntos muestrales en A. esta suma se denomina probabilidad de A y se denota como P(A).

- Entonces la probabilidad de un evento A es la suma de las probabilidades de todos los puntos muestrales en A. Por tanto:

0≤P(A)≤1, P(ø)=0 y P(S)=1

50

Ejemplo: Se lanza dos veces una moneda. ¿Cuál es la probabilidad de que ocurra al menos una cara? S={HH,HT,TH,TT} -Asignamos una probabilidad w a cada uno de los puntos muestrales. Entonces 4w=1 o w=1/4.

- Si A representa el evento de que ocurra al menos 1 cara, entonces:

A={HH,HT,TH} y P(A)=1/4+1/4+1/4=3/4=0.75

51

Ejemplo. Se carga un dado de forma que sea dos veces más probable que salga un número para que uno non. Si E es el evento de que ocurra un numero menor que 4 en un solo lanzamiento del dado, encuentre P(E). S={1,2,3,4,5,6}

P(par)=2w; P(non)=w entonces 9w=1 o w=1/9

E={1,2,3} y P(E)=1/9+2/9+1/9=4/9=0.44

52

Si un experimento puede tener como resultado cualquiera de N diferentes resultados igualmente probables, y si exactamente n de estos resultados corresponden al evento A, entonces la probabilidad del evento A es:

P(A)=n/N

53

Ejemplo: Un surtido de dulces contiene 6 mentas, 4 chiclosos y 3

chocolates. Si una persona hace una selección alaetoria de uno de los dulces, encuntre la probabilidad de sacar:

a) Una menta.

b) Un chicloso o un chocolate

P(M)=6/13=0.46

P(T U C)=7/13=0.54

54

Relaciones entre eventos

Consideremos ahora ciertas operaciones con eventos que tendrán como resultado la formación de nuevos eventos. Estos nuevos eventos serán subconjuntos del mismo espacio muestral que los eventos dados. Por ejemplo, en el lanzamiento de un dado podemos hacer que A sea el evento de que ocurra un número par y B el evento de que aparezca un número mayor que 3. Entonces los subconjuntos A={2,4,6} y B={4,5,6} son subconjuntos del mismo espacio muestral S={1,2,3,4,5,6}

55

Nótese que A y B ocurrirán ambos en un lanzamiento dado si el resultado es un elemento del subconjunto {4,6}, que es precisamente la intersección de A y B. Entonces, la intersección de dos eventos A y B, denotada mediante el símbolo A ∩ B, es el evento que contiene a

todos los elementos que son comunes a A y a B. Dos eventos A y B son mutuamente excluyentes si A ∩

B=ø, es decir, si no tienen elementos en común.

56

En el experimento de lanzamiento de un dado si: A={2,4,6} y B={4,5,6} Podemos interesarnos en que ocurra A o B, o en que ocurran A y B. Tal evento, que se llama la unión de A y B, ocurrirá si el resultado es un elemento del subconjunto {2,4,5,6}. Entonces la unión de dos eventos A y B, que se denota mediante el símbolo A∪B, es el evento que contiene todos

los elementos que pertenecen a A o B, o a ambos.

57

La relación entre eventos y el correspondiente espacio muestral se puede ilustrar de forma gráfica mediante diagramas de Venn. En un diagrama de Venn se representa el espacio muestral como un rectángulo y los eventos con círculos trazados dentro del rectángulo.

58

1

2

3 4

5

6 7

A B

C

S En esta figura se observa que: A ∩ B= regiones 1 y 2

B ∩ C= regiones 1 y 3

A∪C= regiones 1,2,3,4,5,7

B’ ∩ C= regiones 7 y 4

A ∩ B ∩ C=región 1

(A∪B) ∩ C’=regiones 2, 6 y 7

Y así sucesivamente…

59

Dado el siguiente diagrama de Venn:

A

B

C

S

Podemos ver que:

- Los eventos A, B y C, son subconjuntos del espacio muestral S.

- El evento B es un subconjunto del evento A.

- El evento B ∩ C=ø y por ello B y C son mutuamente excluyentes.

- El evento A ∩ C tiene al menos un elemento.

- El evento A∪B=A

60

Varios resultados que derivan de las definiciones precedentes, y que se pueden verificar de forma fácil mediante diagramas de Venn, son los siguientes:

1. A ∩ ø = ø

2. A∪ø = A

3. A ∩ A’ = ø

4. A∪A’ = S

5. S’ = ø

6. ø’ = S 7. (A’)’ = A 8. (A ∩ B)’ = A’∪B’

9. (A∪B)’ = A’ ∩ B’

61

Suma de probabilidades

Si A y B son cualquiera de dos eventos, entonces.

P(A∪B)=P(A)+P(B)-P(A ∩ B)

Si A y B son mutuamente excluyentes, entonces:

P(A∪B)=P(A)+P(B)

62

Si A1, A2,…An es una partición de un espacio muestral S, entonces:

P(A1∪A2∪…∪An)=P(A1)+P(A2)+…+P(An)=P(S)=1

Para 3 eventos A, B y C:

P(A∪B∪C)=P(A)+P(B)+P(C)-P(A∩B)-P(A∩C)-P(B∩C)

63

Ejemplo: La probabilidad de que un estudiante apruebe matemáticas es 2/3 y a probabilidad de que apruebe inglés es 4/9. Si la probabilidad de aprobar ambos cursos es ¼. ¿Cuál es la probabilidad de que el estudiante apruebe al menos uno de estos cursos?

Si M es el evento de aprobar matemáticas y E el evento de aprobar inglés, entonces tenemos que: P(M∪E)=P(M)+P(E)-P(M∩E)=2/3+4/9-1/4= 31/36

64

A menudo es más difícil calcular la probabilidad de que ocurra un evento que la probabilidad de que el evento no ocurra. Si este es el caso para algún evento A, simplemente encontramos primero P(A’) y después encontramos P(A) por sustracción:

Si A y A’ son eventos complementarios, entonces P(A)+P(A’)=1

65

Probabilidad condicional.

La probabilidad de que un evento B ocurra cuando se sabe que ya ocurrió algún evento A se llama probabilidad condicional y se denota por P(B/A), lo cual por lo general se lee “la probabilidad de que ocurra B dado que ocurrió A”, o simplemente “la probabilidad de B dado A”.

)(

)()/(

AP

BAPABP

66

Ejemplo: La probabilidad de que un vuelo programado

normalmente salga a tiempo es P(D)=0.83; la probabilidad de que llegue a tiempo es de P(A)=0.82; y la probabilidad de que salga y llegue a tiempo es P(D∩A)=0.78

Encuentre la probabilidad de que un avión: a) Llegue a tiempo dado que salió a tiempo

b) Salió a tiempo, dado que llegó a tiempo

67

94.083.0

78.0

)(

)()/(

DP

ADPDAP

a)

95.082.0

78.0

)(

)()/(

AP

ADPADP

b)

68

Teorema de la multiplicación

Si en un experimento pueden ocurrir los eventos A y B, entonces:

P(A∩B)=P(A)P(B/A)

69

Suponga que tenemos una caja de fusibles que contiene 20 unidades, de las cuales 5 están defectuosas. Si se seleccionan dos fusibles al azar y se separan de la caja uno después del otro sin reemplazar el primero, ¿cuál es la probabilidad de que ambos fusibles sean defectuosos?

P(A∩B)= P(A)P(B/A)=(1/4)(4/19)=1/19

70

Si en el ejemplo anterior el primer fusible se reemplaza y los fusibles se reacomodan por completo antes de que se extraiga el segundo, entonces P(B/A)=P(B)=1/4 y los eventos Ay B son independientes. Por tanto:

Dos eventos A y B son independientes si y sólo si P(A∩B)=P(A)P(B)

71

Ejercicios

Ejercicio 1. ¿Cuál es la probabilidad de obtener un total de 7 u 11 cuando se lanza un par de dados? Ejercicio 2. Si la probabilidad de que una persona compre un automóvil nuevo elija el color verde, blanco, rojo o azul son, respectivamente, 0.09, 0.15, 0.21 y 0.23. ¿Cuál es la probabilidad de que un comprador dado adquiera un automóvil nuevo que tenga uno de estos colores?

72

Ejercicio 3. Determinar la probabilidad de extraer un rey, un as, un 3 de diamantes o un 7 de tréboles en una sola extracción de una baraja de 52 cartas. Ejercicio 4. ¿Cuál es la probabilidad de obtener un cerrojo no defectuoso al extraerlo de una población si de 600 ya examinados 12 fueron defectuosos?

73

Ejercicio 5. Se lanza un par de dados y se definen los siguientes

eventos: A={La suma de los dados es 6} B={Aparece por lo menos un 2} a) ¿Cuál es la probabilidad de que la suma de los dados

sea 6 si apareció por lo menos un 2?

b) ¿Cuál es la probabilidad de que aparezca por lo menos un 2 si la suma de los dados fue 6?

74

Respuestas

Ejercicio 1. P(A∪B)=P(A)+P(B)=6/36+2/36= 2/9

Ejercicio 2. P(V∪B∪R∪A)=P(V)+P(B)+P(R)+P(A)=0.09+0.015+0.

21+0.23=0.68

75

Ejercicio 3. P(A∪B∪C∪D)=P(A)+P(B)+P(C)+P(D)=4/52+4/52+1

/52+1/52)=10/52=0.1923

Ejercicio 4. P(A)=? P(A’)=12/600 Entonces P(A)=1-P(A’)=1-12/600 P(A)=588/600=0.98

76

Ejercicio 5. a)

11

2

36

1136

2

)(

)()/(

BP

BAPBAP

5

2

36

536

2

)(

)()/(

AP

BAPABP

b)

77

Regla de Bayes.

- Una generalización al caso en que un espacio muestral se parte en k subconjuntos la cubre el siguiente teorema, llamado en ocasiones teorema de la probabilidad total o regla de eliminación.

78

Ejemplo: En cierta planta de montaje tres máquinas, B1, B2 y B3, montan 30%, 45% y 25% de los productos, respectivamente. Se sabe por la experiencia que 2%, 3% y 2% de los productos ensamblados por cada máquina, respectivamente, tienen defectos. Ahora suponga que se selecciona de forma aleatoria un producto terminado, ¿cuál es la probabilidad de que esté defectuoso? Solución: Considere los eventos siguientes: A: el producto está defectuoso, B1: el producto está ensamblado por la máquina B1, B2: el producto está ensamblado por la máquina B2, B3: el producto está ensamblado por la máquina B3.

79

Al aplicar la regla de eliminación podemos escribir: P(A)=P(B1)P(A/B1)+P(B2)P(A/B2)+P(B3)P(A/B3) P(A)=(0.3)(0.02)+(0.45)(0.03)+(0.25)(0.02) P(A)=0.0245

80

Suponga que consideramos ahora el problema de encontrar la probabilidad condicional P(B1/A) en el ejemplo anterior. En otras palabras, suponga que se seleccionó un producto de forma aleatoria y es defectuoso. ¿Cuál es la probabilidad de que este producto fuera hecho por la máquina B1?

Preguntas de este tipo se pueden contestar mediante el uso del teorema siguiente, que se llama Regla de Bayes.

81

Si los eventos B1, B2,…,Bk constituyen una partición del espacio muestral S donde P(B1)≠0 para i=1,2,…k, entonces,

para cualquier evento A en S tal que P(A)≠0:

Para r=1,2,…k

82

Con referencia al problema anterior, si se elige al azar un producto y se encuentra que es defectuoso, ¿cuál es la probabilidad de que esté ensamblado por la máquina B3?

83

84

Ejemplo: La proporción de personas en una comunidad que tiene cierta enfermedad es 0.005. Está disponible una prueba para diagnosticar la enfermedad. Si una persona la padece, la probabilidad de que la prueba dé señal positiva es de 0.99. Si una persona no está enferma, la probabilidad de que la prueba dé una señal positiva es de 0.01. Si una persona sale positiva en la prueba, ¿cuál es la probabilidad de que la persona realmente esté enferma?

85

86

- Sólo aproximadamente la tercera parte de los que resultan positivos en la prueba están realmente enfermos. - La prueba es bastante exacta.

- ¿Por qué una proporción grande de pruebas resulta positiva

cuando en realidad se está libre de la enfermedad?

- Esto ocurre porque la enfermedad es rara, sólo el 0.5% de la población la padece.

- Para enfermedades raras, muchas pruebas médicas resultarán en falsos positivos a pesar de ser muy exactas.

- Por esta razón, cuando una prueba sale positiva, se hace generalmente una segunda prueba antes de confirmar el diagnóstico.

87

III. ESTADÍSTICA DESCRIPTIVA BÁSICA.

88

Conceptos Básicos.

Estadística. La ciencia de recolectar, clasificar, describir e interpretar datos numéricos.

Estadística Descriptiva. Parte de la estadística dedicada a la recolección, presentación y descripción de datos numéricos.

Estadística inferencial. Parte de la estadística encargada de interpretar los valores que se obtienen a partir de las técnicas descriptivas para posteriormente tomar decisiones en base a los resultados.

89

Población. Colección completa de individuos, objetos o medidas que tienen una característica en común.

El concepto de población es la idea fundamental más importante de la estadística

La población debe definirse cuidadosamente, en cada caso, a fin de poder determinar la pertenencia a ella.

90

Muestra. Es un subconjunto de la población; es decir, una muestra se compone de algunos de los individuos, objetos o medidas de una población.

Datos. Comprenden el conjunto de valores asignados a la variable de respuesta para cada elemento perteneciente a la muestra.

91

Experimento. Una actividad planificada cuyos resultados producen un conjunto de datos.

Parámetro. Una característica medible de una población completa. En estadística se acostumbra asignar a los parámetros un nombre simbólico, representado por una letra griega (como µ ó σ).

92

Estadístico. Es la medida de una característica relativa a una muestra. La mayoría de los estadísticos muestrales se encuentran por medio de una fórmula y suele asignárseles nombres simbólicos que son letras del alfabeto latino (como X o S).

Variable. Una característica de cada elemento individual de una población o de una muestra. El valor de la variable será la medida de la característica que interesa. También se le llama variable de respuesta.

93

CLASIFICACION DE VARIABLES

CUALITATIVAS CUANTITATIVAS

NOMINAL ORDINAL DISCRETO CONTINUO

ATRIBUTOS NUMERICO

94

De acuerdo a la escala de medición usada se clasifica en:

VARIABLE CUALITATIVA O CATEGÓRICA.

Nominal Ordinal

VARIABLE CUANTITATIVA O ESTADÍSTICA:

Continúa Discreta

95

VARIABLE CUALITATIVA

Son aquellas variables que no aparecen en forma numérica, sino como categorías o atributos y tiene sentido cuando se usa bajo escala nominal u ordinal.

EJEMPLOS: Lugar de Residencia, Idioma, Sexo, Religión, Categoría

Ocupacional, Nivel de Educación de las PERSONAS. Actividad Económica, Condición Jurídica, Año de Inicio

Actividades de EMPRESAS. Materiales de Techo, Piso y Paredes; Régimen de Tenencia,

Estado de Conservación y Tipo de las VIVIENDAS.

96

Ejemplo cualitativa nominal

Religión:

Católica

Protestante

Ateo

Musulmana

Mormon

Religion:

Ateo

Mormon

Católica

Protestante

Musulmana

Nótese que el orden de las religiones como se han presentado no afectan en nada. Las dos presentaciones son validas.

97

Ejemplo cualitativa ordinal

Nivel Educativo:

Maestría

Primaria

Sin Estudio

Secundaria

Universitaria

Doctorado

Nivel Educativo:

Sin Estudio

Primaria

Secundaria

Universitaria

Maestría

Doctorado

Nótese que el orden del nivel educativo como se ve en el primer cuadro si afecta la presentación. En tanto en el segundo hay un orden correlativo

98

VARIABLE CUANTITATIVA

Son las que tienen por modalidades cantidades numéricas, por lo que puede ser medida directamente en la práctica, usando bajo un intervalo o de razón.

Ejemplo: La variable que a cada persona le hace corresponder un INGRESO, es una variable cuantitativa.

DISCRETA, son las que al tomar valores, estos solamente pueden ser representados con números enteros y generalmente es resultado de conteos.

CONTÍNUA, cuando la variable toma cualquier valor real dentro de un intervalo dado, generado al efectuar operaciones de medición.

99

VARIABLE DISCRETA: Ejemplos

Número de clientes por día de un Banco. Número de ventas diarias de una Empresa. Número de vuelos por día en el Aeropuerto. Número de accidentes por día. Número de personas por hogar. Número de pacientes por hospital. Número de hijos por mujer. Número de cuartos por vivienda. Número de nacimientos por día de maternidad. Número de alumnos desaprobados por curso.

100

VARIABLE CONTÍNUA : Ejemplos

Persona: Estatura, peso, etc. Ingreso, gastos, etc. Hogar: Ingresos por hogar. Gastos por hogar en alimentación. Monto de alquiler por hogar. Establecimiento comercial: Valor de las ventas por establecimiento. Valor de las compras por establecimiento. Gastos (electricidad, agua, teléfono)

101

REPRESENTACIÓN DE DATOS ESTADÍSTICOS

102

•Textual.

Empleo de palabras y cifras combinadas en un texto para informar los datos obtenidos. Es el más difícil de seguir para el lector; para el redactor tiene la ventaja de que puede influenciar al lector.

•Tabular.

Presentación de los datos por medio de una tabla o cuadro. Es el método más imparcial para presentar la información ya que muestra los datos crudos, dejando al lector la tarea de interpretarlos sin hacer sugerencias ni comentarios.

103

•Gráfico. Es el método de presentación de información más simple para el lector,

porque se puede captar la tendencia de los datos de un solo vistazo. Su desventaja más

notoria es la pérdida de precisión y exactitud en comparación con la tabla.

•Al crear un gráfico es importante seguir los consejos de los expertos:

Conviene hacer varios modelos diferentes en borrador antes del definitivo.

La disposición del gráfico debe ser de izquierda a derecha.

Debe colocarse siempre el cero de la escala.

Para la comparaciones conviene usar sólo una dimensión, antes de dos o tres.

En los gráficos de porcentaje acumulativo además del nivel cero se debe colocar el

100%.

La línea más gruesa de todas debe ser la del gráfico.

La línea de ayuda visual del gráfico debe ser la más fina de todas.

Debe tener un título claro, conciso y completo.

Debe colocarse siempre la escala empleada y las unidades de las magnitudes

mostradas.

La escala del gráfico debe adaptarse para que incluya toda la información.

No se debe utilizar un gráfico para mostrar la información de un modo tendencioso.

Si un gráfico no resulta claro para el autor, mucho menos lo será para el lector.

104

ESTADÍSTICA DESCRIPTIVA

DATOS CUALITATIVOS

Nominal

Gráficos

Diagramas de Barras

Diagramas de Sectores

Ordinal

Contingencia

Tablas

Frecuencia

Se miden en escala

Se representan en

105

DATOS CUANTITATIVOS

Discretos Continuos

Se dividen en

Se miden en escalas

Intervalos Razón

Se representan en Se resumen en medidas de

ESTADÍSTICA DESCRIPTIVA

Moda

Mediana

Media

Diagramas de

Dispersión

Boxplot

Histogramas

Frecuencia no

Agrupada

Frecuencia

Agrupada

Variabilidad Centralidad Tablas Gráficos

Coeficiente de

Variación

Rango

Varianza

106

REPRESENTACIÓN TABULAR

CLASE FRECUENCIA FRECUENCIA RELATIVA FRECUENCIA

ACUMULADA

FRECUENCIA RELATIVA

ACUMULADA

Bachiller 40 0,33 40 0,33

Técnico 27 0,23 67 0,56

Tecnólogo 27 0,23 94 0,78

Profesional 20 0,17 114 0,95

Posgrado 6 0,05 120 1,00

107

DIAGRAMA DE BARRAS

0

5

10

15

20

25

30

35

40

45

Bachiller Técnico Tecnólogo Profesional Posgrado

108

Gráfico circular

FRECUENCIAS RELATIVAS

0.33

0.23

0.23

0.17

0.05

Bachiller

Técnico

Tecnólogo

Profesional

Posgrado

109

TABLAS DE CONTINGENCIA

La empresa del ejemplo anterior consta de tres plantas y sus empleados están distribuidos de la siguiente forma:

110

0

2

4

6

8

10

12

14

16

18

Planta A Planta B Planta C

Bachiller

Técnico

Tecnólogo

Profesional

Posgrado

Diagrama de Barras:

111

0

5

10

15

20

25

30

35

40

45

Planta A Planta B Planta C

Posgrado

Profesional

Tecnólogo

Técnico

Bachiller

Diagrama de Barras:

112

113

•Gráficos cronológicos:

114

115

Abusos que se pueden cometer con la Estadística

Conclusiones erróneas debido a que los datos son numéricamente insuficientes.

Representaciones gráficas engañosas (escalas).

Datos muestrales no representativos:

Muestra que no incluye a elementos de toda la población.

Ciertas categorías de personas no responden correctamente.

Respuestas voluntarias (sesgadas).

116

Organización de los datos

Una vez que se ha realizado la recolección de los datos, se obtienen datos en bruto, los cuales rara vez son significativos sin una organización y tabulación.

117

Formas de organizar los datos:

Un arreglo: es la forma más sencilla de organizar los datos en bruto, consiste en colocar las observaciones en orden según su magnitud: ascendente o descendente.

Poco práctica cuando se tiene una gran cantidad de datos.

118

Una distribución de frecuencias: es un arreglo de los datos que permite expresar la frecuencia de ocurrencias de las observaciones en cada una de las clases, mostrando el patrón de la distribución de manera más significativa.

Clase Pto.

Medio

fi Fi fri FRi

119

La Distribución de Frecuencias:

Se recomienda su uso cuando se tienen grandes cantidades de datos (n).

Su construcción requiere, en primer lugar, la selección de los límites de los intervalos de clase.

Para definir la cantidad de intervalos de clase (k), se puede usar:

La regla de Sturges: k = 1 + 3.3log(n)

k = n

120

La cantidad de clases no puede ser tan pequeño (menos de 5) o tan grande (más de 20), que la verdadera naturaleza de la distribución sea imposible de visualizar.

La amplitud de todas las clases deberá ser la misma.

Se recomienda que sea impar y que los puntos medios tengan la misma cantidad de cifras significativas que los datos en bruto.

Los límites de las clases deben tener una cifra

significativa más que los datos en bruto.

121

Determinar:

Punto medio = (Li+Ls)/2.

Frecuencia absoluta de la clase (fi).

Frecuencia acumulada de la clase (Fi).

Frecuencia relativa de la clase (fri):

fri = fi/n

Frecuencia relativa acumulada de la clase (FRi).

122

23 60 79 32 57 74 52 70 82 36

80 77 81 95 41 65 92 85 55 76

52 10 64 75 78 25 80 98 81 67

41 71 83 54 64 72 88 62 74 43

60 78 89 76 84 48 84 90 15 79

34 67 17 82 69 74 63 80 85 61

a) Construya una distribución de frecuencias.

b) ¿Qué puede concluir de estos datos?

123

Los gráficos permiten visualizar en forma global y rápida el comportamiento de los datos.

Para datos cuantitativos agrupados en clases, comúnmente se utilizan tres gráficos:

Histogramas.

Polígono de frecuencias.

Ojiva o Polígono de frecuencias acumuladas.

124

Los gráficos permiten visualizar en forma global y rápida el comportamiento de los datos.

Para datos cuantitativos agrupados en clases, comúnmente se utilizan tres gráficos:

Histogramas.

Polígono de frecuencias.

Ojiva o Polígono de frecuencias acumuladas.

125

Histograma

126

Tem

a 2

. Esta

dís

tica D

escrip

tiva

Histograma y Polígono de Frecuencias

127

Ojiva

128

Medidas de tendencia central o posición

Corresponden a valores que generalmente se ubican en la parte central de un conjunto de datos.

Forma como los datos pueden condensarse en un solo valor central alrededor del cual todos los datos muestrales se distribuyen.

Las medidas de tendencia central más importantes son:

Media: Aritmética y Aritmética ponderada.

Mediana.

Moda.

129

Media Aritmética

Es la suma de todas las observaciones dividida entre el número total de observaciones.

Expresada de forma más intuitiva, podemos decir que la media aritmética es la cantidad total de la variable distribuida a partes iguales entre cada observación.

Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen en sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la información de una distribución (dinero en el bolsillo) suponiendo que cada observación (persona) tendría la misma cantidad de la variable.

130

Cálculo de la media aritmética

Para datos no agrupados:

n

x

X

n

i

i 1

Para datos agrupados:

n

fm

X

k

i

ii 1

Donde: mi: punto medio de la clase i fi: frecuencia absoluta de la clase i k: cantidad de clases

131

Mediana

Es el valor que ocupa la posición central de un conjunto de observaciones, una vez que han sido ordenados en forma ascendente o descendente.

Divide al conjunto de datos en dos partes iguales.

Cálculo de la mediana

Para datos no agrupados:

Si n es impar: posición donde se ubica la mediana es igual a (n+1)/2.

Si n es par: (n+1)/2 no es entero, por lo tanto la mediana será igual al promedio de las dos posiciones centrales.

132

Datos agrupados: clase mediana es la que contiene a la observación que ocupa la posición n/2.

Cmxf

xFn

LmMdm

m

)(

)(2

11

Donde: Lm: límite inferior de la clase mediana. F(xm-1): frecuencia acumulada de la clase anterior a la clase mediana. f(xm): frecuencia absoluta de la clase mediana. Cm: amplitud de la clase mediana.

133

Moda

Observación o clase que tiene la mayor frecuencia en un conjunto de observaciones.

Un conjunto de datos puede ser unimodal, bimodal o multimodal.

Es la única medida de tendencia central que se puede determinar para datos de tipo cualitativo.

134

Cálculo de la moda

Para datos no agrupados: es simplemente la observación que más se repite.

Para datos agrupados:

CmLimMo21

1

Donde: Lim: límite inferior de la clase modal. 1: diferencia entre fi de la clase modal y la anterior. 2: diferencia entre fi de la clase modal y la posterior. Cm: amplitud de la clase modal (clase de mayor frecuencia).

135

Relación entre la media, la mediana y la moda

Cuando los datos son sesgados es mejor emplear la Md

136

Propiedades, ventajas y desventajas de la media

Propiedades:

La suma de las diferencias entre las media muestral y el valor de cada observación es cero.

La media de una constante es la constante.

Si todas las observaciones xi se multiplican por una constante a, la media también se debe multiplicar por ese mismo valor constante.

137

Si se somete a una variable estadística X a un cambio de origen y escala, Y = a + bX, la media aritmética de dicha variable X varía en la misma proporción.

La media de la suma de dos variables es igual a la suma de sus medias.

138

Ventajas:

Emplea en su cálculo toda la información disponible.

Se expresa en las mismas unidades que la variable en estudio.

Es el centro de gravedad de toda la distribución, representando a todos los valores observados.

Es un valor único.

139

Se trata de un concepto familiar para la mayoría de las personas.

Es útil para llevar a cabo procedimientos estadísticos como la comparación de medias de varios conjuntos de datos.

140

Desventajas:

Se ve adversamente afectada por valores extremos, perdiendo representatividad.

Si el conjunto de datos es muy grande puede ser tedioso su cálculo manual.

No se puede calcular para datos cualitativos.

No se puede calcular para datos que tengan clases de extremo abierto, tanto superior como inferior.

141

Ventajas y desventajas de la mediana

Ventajas:

Fácil de calcular si el número de observaciones no es muy grande.

No se ve influenciada por valores extremos, ya que solo influyen los valores centrales.

Fácil de entender.

142

Se puede calcular para cualquier tipos de datos cuantitativos, incluso los datos con clase de extremo abierto.

Es la medida de tendencia central más representativa en el caso de variables que solo admiten la escala ordinal.

143

Desventajas:

No utiliza en su “cálculo” toda la información disponible.

No pondera cada valor por el número de veces que se ha repetido.

Hay que ordenar los datos antes de determinarla.

144

Ventajas y desventajas de la moda

Ventajas:

No requiere cálculos.

Puede usarse para datos tanto cuantitativos como cualitativos.

Fácil de interpretar.

No se ve influenciada por valores extremos.

Se puede calcular en clases de extremo abierto.

145

Desventajas:

Para conjuntos pequeños de datos su valor no tiene casi utilidad, si es que de hecho existe. Solo tiene significado en el caso de una gran cantidad de datos.

No utiliza toda la información disponible.

No siempre existe, si los datos no se repiten.

146

En ocasiones, el azar hace que una sola observación no representativa sea el valor más frecuente del conjunto de datos.

Difícil de interpretar si los datos tiene 3 o más modas.

147

Medidas de dispersión, variación o variabilidad.

Son valores numéricos que indican o describen la forma en que las observaciones están dispersas o diseminadas, con respecto al valor central.

Son importantes debido a que dos muestras de observaciones con el mismo valor central pueden tener una variabilidad muy distinta.

148

Rango.

Varianza.

Desviación Típica o estándar.

Coeficiente de variación.

Las medidas de dispersión más comunes son:

149

Rango (amplitud o recorrido):

Está determinado por los dos valores extremos de los datos muestrales, es simplemente la diferencia entre la mayor y menor observación.

Es una medida de dispersión absoluta, ya que depende solamente de los datos y permite conocer la máxima dispersión.

R=Xmax-Xmin

150

Casi no se emplea debido a que depende únicamente de dos valores.

No proporciona una medida de variabilidad de las observaciones con respecto al centro de la distribución.

Notación: R

151

Varianza

Es un valor numérico que mide el grado de dispersión relativa porque depende de la posición de los datos x1,x2,…,xn con respecto a la media.

Es el promedio al cuadrado de las desviaciones de cada observación con respecto a la media.

Notación: s2, 2, var(X)

152

Si la varianza de un conjunto de observaciones es grande se dice que los datos tiene una mayor variabilidad que un conjunto de datos que tenga un varianza menor.

21

2

2

1

2

2

xn

x

s

n

xx

s

n

i

i

n

i

i

Para datos NO agrupados:

153

Para datos agrupados en una distribución de frecuencias:

21

2

2

1

2

2

xn

fm

s

n

fxm

s

k

i

ii

k

i

ii

154

Desviación Típica

Es la raíz cuadrada de la varianza.

Notación: s, .

2ss

155

Coeficiente de Variación

Es una medida de dispersión relativa que permite comparar el nivel de dispersión de dos muestras de variables estadísticas diferentes.

No tiene dimensiones.

Notación: CV

%100x

sCV

156

Ventajas y Desventajas del Rango

Ventajas:

Útil cuando se quiere conocer la extensión de las variaciones extremas (valor máximo de la dispersión).

Fácil de calcular.

157

Desventajas:

No es una medida de dispersión con respecto al centro de la distribución.

Solo emplea dos valores en su cálculo.

No se puede calcular en distribuciones de límite de clase abierto.

158

Propiedades, Ventajas y Desventajas de la Varianza

Propiedades:

1. Siempre es mayor o igual a cero y menor que infinito.

2. La varianza de una constante es cero.

3. Si a una variable X la sometemos a Y=a+bX, la

varianza de Y será Var(Y) = b2Var(X)

159

Ventajas:

Es útil cuando se compara la variabilidad de dos o más conjuntos de datos.

Utiliza toda la información disponible.

Desventajas:

No proporciona ayuda inmediata cuando se estudia la dispersión de un solo conjunto de datos.

Difícil de interpretar por tener sus unidades elevadas al cuadrado.

160

Ventajas y Desventajas de la Desviación Típica

Ventajas:

Esta expresada en las mismas unidades que la variable en estudio.

Utiliza todas las observaciones en su cálculo.

Fácil de interpretar.

Desventajas:

No tiene.

161

Ventajas y Desventajas del Coeficiente de Variación

Ventajas:

Es la única medida de dispersión que permite comparar el nivel de dispersión de dos muestras de variables diferentes.

Emplea toda la información disponible en su cálculo.

Fácil de calcular.

162

Desventaja:

No es una medida de dispersión con respecto al centro de la distribución de los datos.

163

Medidas de Forma

Son medidas numéricas que permiten determinar la forma que tiene la curva de los datos, por lo tanto, sirven para corroborar lo que los gráficos muestran.

Medidas de forma

-Asimetría

-Kurtosis o apuntamiento

Coeficiente de Pearson Coeficiente de Fisher

164

Asimetría

Permiten estudiar la forma de la curva, dependiendo de cómo se agrupan los datos.

165

Coeficiente de Asimetría de Pearson:

Fácil de calcular e interpretar.

Cálculo:

s

MdXASP

3

o Interpretación:

ASP

= 0, X=Md Simétrica > 0, X>Md Asimétrica Positiva < 0, X<Md Asimétrica Negativa

166

Coeficiente de Asimetría de Fisher:

No es de fácil cálculo, pero si su interpretación.

3

1

3

3

1

3

ns

fxM

ASF

ns

Xx

ASF

k

i

ii

n

i

i

Datos NO agrupados

Datos Agrupados

167

o Interpretación:

ASF

= 0, Simétrica > 0, Asimétrica Positiva < 0, Asimétrica Negativa

168

Kurtosis

Miden si los valores de la distribución están más o menos concentrados alrededor de los valores medios de la muestra (zona central de la distribución).

Se definen tres tipos de distribución según su grado de Kurtosis:

169

Mesocúrtica: grado de concentración medio alrededor de los valores centrales de la variable.

Leptocúrtica: grado de concentración elevado.

Platicúrtica: grado de concentración reducido.

170

3

3

4

1

4

4

1

4

ns

fXM

CK

ns

Xx

CK

k

i

ii

n

i

i

Datos No Agrupados

Datos Agrupados

Interpretación:

CK

=0 Mesocúrtica >0 Leptocúrtica <0 Platicúrtica

171

Ejercicio 1

30 55 44 60 43 72 47 65 67 40

59 58 14 32 58 46 41 35 68 50

59 21 42 45 41 48 28 47 77 60

30 57 45 49 33 48 47 52 38 61

54 42 54 42 49 51 39 60 61 63

Supóngase que 50 estudiantes han presentado su examen de admisión a la U.A. de C. Las calificaciones individuales se presentan en la siguiente tabla.

172

a) Construya una tabla de distribución de frecuencias.

b) Construya un histograma de frecuencias, un polígono de frecuencias relativas y una ojiva.

c) Calcule la media y la desviación estándar para los datos agrupados.

173

23 60 79 32 57 74 52 70 82 36

80 77 81 95 41 65 92 85 55 76

52 10 64 75 78 25 80 98 81 67

41 71 83 54 64 72 88 62 74 43

60 78 89 76 84 48 84 90 15 79

34 67 17 82 69 74 63 80 85 61

a) Calcule la media aritmética, la varianza, la desviación estándar y el coeficiente de variación.

Ejercicio 2. Dada la siguiente serie de datos.

1

DISTRIBUCIONES

DE PROBABILIDAD

Dr. Gerardo de Jesús Sosa Santillán

Departamento de Biotecnología

Facultad de Ciencias Químicas

Universidad Autónoma de Coahuila.

2

INTRODUCCIÓN

3

- La inferencia estadística consiste en extraer una muestra de una población y analizar sus datos para aprender acerca de ello.

- Muchas veces se tiene un conocimiento superficial de la función de masa de probabilidad o de la función densidad de probabilidad de la población.

- En estos casos se hace una aproximación mediante una de muchas familias comunes de curvas o funciones.

4

Definición

Una tabla, gráfica o expresión matemática que dé las probabilidades con que una variable aleatoria toma diferentes valores, se llama distribución de probabilidad de la variable aleatoria. Al conjunto de pares ordenados (x,f(x)) donde x es el conjunto de valores de una variable aleatoria y f(x) las probabilidades asignadas a x, se le llama función de probabilidad (para variables discretas), y función densidad de porbabilidad (para variables continuas).

5

Distribuciones de Probabilidad

Distribuciones discretas

Distribución Binomial

Distribución Poisson

Distribuciones continuas

Distribución Exponencial

Distribución Normal

6

Dato histórico

El cálculo de probabilidades tuvo un

notable desarrollo con el trabajo del

matemático suizo Jacob Bernoulli (1654-1705).

Bernoulli definió el proceso conocido por su

nombre el cual establece las bases para el

desarrollo y utilización de la distribución binomial.

7

Propiedades de un experimento de Bernoulli

1 - En cada prueba del experimento sólo hay dos posibles resultados: éxitos o fracasos.

2 - El resultado obtenido en cada prueba es independiente de los resultados obtenidos en pruebas anteriores.

3 - La probabilidad de un suceso es constante, la representamos por p, y no varía de una prueba a otra. La probabilidad del complemento es 1- p y la representamos por q .

Si repetimos el experimento n veces podemos

obtener resultados para la construcción de la

distribución binomial.

8

La distribución binomial

La distribución de probabilidad binomial es un ejemplo de distribución de probabilidad discreta.

Esta formada por una serie de experimentos de Bernoulli. Los resutados de cada experimento son mutuamente excluyentes.

Para contruirla necesitamos:

1 - la cantidad de pruebas n

2 - la probabilidad de éxitos p

3 - utilizar la función matemática.

9 9

Utilidad

La distribución binomial se utiliza en situaciones cuya solución tiene dos posibles resultados.

Por ejemplo:

Al nacer un bebé puede ser varón o hembra.

En el deporte un equipo puede ganar o perder.

En pruebas de cierto o falso sólo hay dos alternativas.

10 10

Utilidad

También se utiliza cuando el resultado se puede reducir a dos opciones.

Por ejemplo:

Un tratamiento médico puede ser efectivo o inefectivo.

La meta de producción o ventas del mes se pueden o no lograr.

En pruebas de selección múltiple, aunque hay cuatro o cinco alternativas, se pueden clasificar como correcta o incorrecta.

Estos ejemplos los podemos considerar como

“experimentos de Bernoulli”

11

La función P(x=k)

La función de probabilidad de la distribución Binomial, también denominada Función de la distribución de Bernoulli: k - es el número de aciertos. n - es el número de experimentos. p - es la probabilidad de éxito, como por ejemplo, que salga "cara" al lanzar la moneda. 1-p - también se le denomina como “q ”

12

Ejemplo1 de la función F(x=k)

¿Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces?

El número de aciertos k es 6. Esto es x=6

El número de experimentos n son 10

La probabilidad de éxito p, es decir, que salga "cara" al lanzar la moneda es 50% ó 0.50

La fórmula quedaría:

P (k = 6) = 0.205

Es decir, que la probabilidad de obtener 6 caras al lanzar 10 veces una moneda es de 20.5% .

13

Ejemplo 2 de la función F(x=k)

¿Cuál es la probabilidad de obtener cuatro veces el número 3 al lanzar un dado ocho veces?

El número de aciertos k es 4. Esto es x=4

El número de experimentos n son 8

La probabilidad de éxito p (probabilidad de que salga un 3 al tirar el dado) es 1 / 6 (= 0.1666)

La fórmula queda:

P (k = 4) = 0.026

Es decir, que la probabilidad de obtener cuatro veces el números 3 al tirar un dado 8 veces es de 2.6%.

14

17

Características de la distribución binomial

n = 5 p = 0.1

n = 5 p = 0.5

Media

= E(X) = n p

= 5 · 0.1 = 0.5

= 5 · 0.5 = 0.25

Desviación estándar

0

.2

.4

.6

0 1 2 3 4 5

X

P(X)

.2

.4

.6

0 1 2 3 4 5

X

P(X)

0

1.1)5.01(5.05

67.0)1.01(1.05

)1(

pnp

15

Ejercicio de prueba #1

Un comerciante de verduras tienen conocimiento de que el 10% de la caja está descompuesta. Si un comprador elige 4 verduras al azar, encuentre la probabilidad de que.

a) las 4 estén descompuestas.

b) de 1 a 3 estén descompuestas.

Para resolver la pregunta “b” repase el

modulo de las reglas de probabilidad.

En este caso se resuelve sumando las

probabilidades P(x=1) + P(x=2) + P(x=3)

= 0.6561 + 0.2916 + 0.0486

16

Ejercicio de prueba #2

En pruebas realizadas a un amortiguador para automóvil se encontró que el 20% presentaban fuga de aceite. Si se instalan 20 de estos amortiguadores, hallar la probabilidad de que,

a) 4 salgan defectuosos,

b) más de 5 tengan fuga de aceite.

c) de 3 a 6 amortiguadores salgan defectuosos.

d) Determine el promedio y la desviación estándar de amortiguadores con defectos.

La pregunta “b” debe sumar las probabilidades desde

P(x=6) en adelante.

En la “c” debe sumar P(x=3) + P(x=4) + P(x=5) + P(x=6).

17

Ejercicio de prueba #3

Un ingeniero que labora en el departamento de control de calidad de una empresa eléctrica, inspecciona una muestra al azar de 10 alternadores de un lotes. Si el 15% de los alternadores del lote están defectuosos. Cuál es la probabilidad de que en la muestra,

a) ninguno esté defectuoso,

b) uno salga defectuoso,

c) al menos dos salgan defectuosos

d) más de tres estén con defectos

Para la pregunta “d” puede realizar la siguiente operación:

1 – [P(x=0) + P(x=1) + P(x=2)]

18

Ejercicio de prueba #4

Se lanza al aire ocho veces un dado. Determine la probabilidad de que no salgan más de dos números seis.

19

Ejercicio de prueba #5

Construya la gráfica de distribución de probabilidad binomial para: a) n=5, p=1/2

b) n= 8, p=1/3

20

La distribución de Poisson se llama así

en honor a su creador, el francés

Simeón Dennis Poisson (1781-1840),

Esta distribución de probabilidades fue

uno de los múltiples trabajos matemáticos

que Dennis completó en su productiva trayectoria.

Dato histórico

21

Utilidad

La distribución de Poisson se utiliza en situaciones donde los sucesos son impredecibles o de ocurrencia aleatoria. En otras palabras no se sabe el total de posibles resultados.

Permite determinar la probabilidad de ocurrencia de un suceso con resultado discreto.

Es muy útil cuando la muestra o segmento n es grande y la probabilidad de éxitos p es pequeña.

Se utiliza cuando la probabilidad del evento que nos interesa se distribuye dentro de un segmento n dado como por ejemplo distancia, área, volumen o tiempo definido.

22

Ejemplos de la utilidad

La llegada de un cliente al negocio durante una hora.

Las llamadas telefónicas que se reciben en un día.

Los defectos en manufactura de papel por cada metro producido.

Los envases llenados fuera de los límites por cada 100 galones de producto terminado.

La distribución de Poisson se emplea para describir procesos con un elemento en común, pueden ser descritos por una variable aleatoria discreta.

23

Propiedades de un proceso de Poisson

1. La probabilidad de observar exactamente un éxito en el segmento o tamaño de muestra n es constante.

2. El evento debe considerarse un suceso raro.

3. El evento debe ser aleatorio e independiente de otros eventos

Si repetimos el experimento n veces podemos obtener

resultados para la construcción de la distribución de Poisson.

24

La distribución de Poisson

La distribución de probabilidad de Poisson es un ejemplo de distribución de probabilidad discreta.

La distribución de Poisson parte de la distribución binomial.

Cuando en una distribución binomial se realiza el experimento muchas veces, la muestra n es grande y la probabilidad de éxito p en cada ensayo es baja, es aquí donde aplica el modelo de distribución de Poisson.

Se tiene que cumplir que:

p < 0.10

p * n < 10

25

La función P(x=k)

Donde: P(X=K) es la probabilidad de ocurrencia cuando la variable discreta X toma un valor finito k. λ = Lambda es la ocurrencia promedio por unidad (tiempo, volumen, área, etc.). Es igual a p por el segmento dado. La constante e tiene un valor aproximado de 2.711828 K es el número de éxitos por unidad

26

Ejemplo1

La probabilidad de que haya un accidente en una compañía de manufactura es de 0.02 por cada día de trabajo. Si se trabajan 300 días al año, ¿cuál es la probabilidad de tener 3 accidentes?

Como la probabilidad p es menor que 0.1, y el producto n * p es menor que 10 (300 * 0.02 = 6), entonces, aplicamos el modelo de distribución de Poisson:

Al realizar el cómputo tenemos que P(x = 3) = 0.0892

Por lo tanto, la probabilidad de tener 3 accidentes laborales en 300 días de trabajo es de 8.9%.

27

Ejemplo 2

La probabilidad de que un producto salga defectuoso es de 0.012. ¿Cuál es la probabilidad de que entre 800 productos ya fabricados hayan 5 defectuosos?

En este ejemplo vemos nuevamente la probabilidad p menor que 0.1, y el producto n * p menor que 10, por lo que aplicamos el modelo de distribución de Poisson:

El resultado es P (x = 5) = 0.04602

Por lo tanto, la probabilidad de que haya 5 productos defectuosos entre 800 recién producidos es de 4.6%.

28

La media μ y la varianza σ2

17

Características de la distribución Poisson

k = 5 λ = 0.1

k = 5 λ = 0.5

Media

= E(X) = λ

Varianza

λ = σ2

0

.2

.4

.6

0 1 2 3 4 5

X

P(X)

.2

.4

.6

0 1 2 3 4 5

X

P(X)

0

29

Ejercicio de prueba #1

Un comerciante de verduras tiene conocimiento de que el 3% de la caja está descompuesta. Si un comprador elige 100 verduras al azar, encuentre la probabilidad de que,

a) las 4 estén descompuestas.

b) de 1 a 3 estén descompuestas

30

Ejercicio de prueba #2

En pruebas realizadas a un amortiguador para automóvil se encontró que el 0.04 presentaban fuga de aceite. Si se instalan 150 de estos amortiguadores, hallar la probabilidad de que,

a) 4 salgan defectuosos,

b) más de 5 tengan fuga de aceite.

c) de 3 a 6 amortiguadores salgan defectuosos.

d) Determine el promedio y la desviación estándar de amortiguadores con defectos.

31

Ejercicio de prueba #3

Un ingeniero que labora en el departamento de control de calidad de una empresa eléctrica, inspecciona una muestra al azar de 200 alternadores de un lote. Si el 2% de los alternadores del lote están defectuosos. Cuál es la probabilidad de que en la muestra,

a) ninguno esté defectuoso,

b) uno salga defectuoso,

c) al menos dos salgan defectuosos

d) más de tres estén con defectos

32

Ejercicio de prueba #4

La probabilidad de que un CD de música dure al menos un año sin que falle es de 0.95, calcular la probabilidad de que en una muestra de 15,

a) 12 duren menos de un año,

b) a lo más 5 duren menos de un año,

c) al menos 2 duren menos de un año.

33

Ejercicio de prueba #5

Si 8 de 100 viviendas violan el código de construcción. ¿cuál es la probabilidad de que un inspector de viviendas, que selecciona aleatoriamente a 50 de ellas, descubra que:

a) ninguna de las casas viola el código de construcción

b) una viola el código de construcción

c) dos violan el código de construcción

d) al menos tres violan el código de construcción

34

Distribuciones de Probabilidad

Distribuciones de

Probabilidad

Continuas

Binomial

Poisson

Distribuciones de

Probabilidad

Distribuciones de

Probabilidad

Discretas

Normal

35

La distribución normal

36

Sin duda la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución normal, gaussiana o de Laplace- Gauss. Fue descubierta y publicada por primera vez en 1733 por De Moivre. A la misma llegaron, de forma independiente, Laplace (1812) y Gauss (1809), en relación a la teoría de los errores de observación astronómica y física .

Pierre Simon de Laplace

(1749-1827)

Karl Gauss

(1777-1855)

37

Distribución normal o gaussiana

Está caracterizada por dos parámetros: la media, μ y la desviación típica, σ.

Su función de densidad es:

0) (σ

x -eπσ

xPσ)μ,N2

2

σ

μ)x

2

(

2

1)((

La curva normal adopta un número infinito de

formas, determinadas por sus parámetros μ y σ.

38

La familia de las distribuciones

de probabilidad normal

Cada una de las distribuciones puede

tener una media distinta (u)

y desviación estándar distinta (ơ).

No existe una sola distribución

de probabilidad normal, sino más bien

se trata de toda una “familia” de ellas.

Por tanto, eI número de distribuciones

normales es ilimitado.

39

40

Al variar los parámetros μ and σ, obtenemos diferentes

distribuciones normales

41

X

f(X)

μ

σ

Cambiando μ movemos la

distribución hacia la izquierda

o derecha.

Cambiando σ aumentamos o

disminuímos su altura..

42

La curva normal

tiene forma de

campana y un

sólo pico en el

centro de la

distribución.

La distribución de probabilidad normal y

la curva normal que la acompaña tienen

las siguientes características:

43

La media, la mediana y la moda de la

distribución son iguales y se ubican en el

pico.

Características (cont.)

44

Características (cont.)

La mitad del área

bajo la curva se

encuentra a la

derecha de este

punto central y la

otra mitad está a

la izquierda de

dicho punto.

Características (cont.)

Es simétrica en torno a su promedio. Si

se corta Ia curva normal de manera vertical

por el valor central, las dos mitades serán

como imágenes en un espejo.

46

Características (cont.)

La curva normal desciende suavemente en ambas

direcciones a partir del valor central.

Es asintótica, Ia curva se acerca cada vez más al

eje de X pero jamás llega a tocarlo. Es decir, las “colas” de

Ia curva se extienden de manera indefinida en ambas

direcciones.

47

Características (cont.)

48

La distribución de probabilidad

normal estándar

Sería físicamente imposible proporcionar

una tabla de probabilidades para cada

combinación de µ y Ơ.

Es posible utilizar un sólo miembro de Ia

familia de distribuciones normales para

todos los problemas en los que se aplica

Ia distribución normal.

49

La distribución de probabilidad

normal estándar

Tiene una media de 0 y una desviación

estándar de 1

Los valores mayores al promedio tienen

valores Z positivos y, valores menores al

promedio tendrán valores Z negativos.

Z

f(Z)

1

0

50

Utilizando un valor z, se convertirá, o

estandarizará, Ia distribución real a una

distribución normal estándar.

Transformamos unidades X en unidades Z

Todas las distribuciones normales pueden

convertirse a “distribución normal estándar”

restando Ia media de cada observación y

dividiendo por Ia desviación estándar.

51

Un valor z es Ia distancia a partir de

Ia media, medida en las unidades de

desviación estándar.

El valor z

52

Valor z es Ia distancia entre un valor

seleccionado (x) y Ia media (u),

dividida por la desviación estándar (ơ).

El valor z

53

Límites sigma

54

Límites dos sigma

55

Límites tres sigma

56

Al determinar el valor z empleando Ia fórmula

anterior, es posible encontrar eI área de

probabilidad bajo cualquier curva normal

haciendo referencia a Ia distribución normal

estándar en la tabla de z.

57

Tabla de z Áreas debajo de la

curva normal

z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359

0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753

0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141

0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517

0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879

0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224

0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549

0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852

0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133

0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389

1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621

1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830

1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015

1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177

1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319

1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441

1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545

1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633

1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706

1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767

2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817

2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857

2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890

2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916

2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936

2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952

2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964

2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974

2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981

2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986

3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990

58

Ejemplo:

Supongamos que se calculó el valor z y el

resultado es 1.91.

¿CuáI es eI área bajo la curva normal entre

u y X?

59

Baja por Ia columna de la tabla

encabezada con Ia Ietra z hasta llegar

a 1.9.

Luego muévete en dirección

horizontal a la derecha y lee Ia

probabilidad en Ia columna con el

encabezado 0.01.

Es 0.4719.

Utilizamos la tabla de z.

60

Esto significa que 47.19 por ciento

del área bajo Ia curva se encuentra

entre u y eI valor X,1.91

desviaciones estandar a la derecha

de Ia media.

Esta es Ia probabilidad de que una

observación esté entre 0 y 1.91

desviaciones estándar de Ia media.

61

Valor z calculado

Ejercicios:

Area bajo Ia curva

2.84

1.00

0.49

.4977

.3413

.1879

62

Ahora calcularemos eI valor z dada:

Ia media de Ia población, u,

la desviación estándar de ésta, ơ,

y una X seleccionada.

63

Ejercicios:

Los ingresos semanales de los gerentes de

nivel intermedio tienen una distribución

aproximadamente normal con una media de

$1,000.00 y una desviación estándar de

$100.00.

¿Cuál es el valor z para un ingreso X de

$1,100.00?

Y, ¿para uno de $900.00?

64

Para X = $1,100:

1100 – 1000

100

= 1.00

Utilizando la fórmula:

Para X = $900:

900 - 1000

100

= - 1.00

65

La z de 1.00 indica que un ingreso semanal de $1,100.00 para un gerente de nivel intermedio está una desviación estándar a la derecha de Ia media. La z de -1.00 indica que un ingreso de $900.00 está una desviación estándar a la izquierda de Ia media. Ambos ingresos ($1,100 y $900) están a Ia misma distancia ($100) de la media.

66

900 1,100 1,000

67

La primera aplicación de la distribución normal estándar es encontrar el área bajo la curva normal entre una media y un valor seleccionado, designado como X.

Utilizando la misma distribución que en el ejemplo anterior del ingreso semanal

(u = $1 000, ơ = $100) ¿Cuál es el área bajo la curva normal entre $1,000 y

$1,100?

68

La probabilidad asociada con el valor z de 1.00 se encuentra en la tabla de z. Para ubicar el área, desciende por la columna de la izquierda hasta 1.0. Luego muévete a la derecha y lee el área bajo la curva en la columna marcada 0.00.

Ya se calculó el valor z para $1,100 utilizando la fórmula: z = 1.00

Es 0.3413.

69

Utilizando nuevamente el ingreso medio de

$1,000 al mes y Ia desviación estándar de

$100 al mes:

1.¿Cuál es Ia probabilidad de que un ingreso

semanal específico elegido aI azar esté

entre 790 y 1,000 dólares?

Ejercicios:

70

Calculamos el valor z para $790 utilizando la fórmula:

790 – 1000 = - 210 = -2.10 100 100

Pregunta 1

71

900 1,100 1,000 -2.10

El signo negativo en 2.10 indica que el área está a la izquierda de la media.

72

El área bajo Ia curva normal entre u y X que

corresponde a un valor z de -2.10 es:

(tabla de z).

.4821

73

900 1,100 1,000 -2.10

.4821

|

|

|

74

2.¿CuáI es Ia probabilidad de que eI ingreso

sea menos de 790 dólares?

75

La media divide Ia curva normal en dos

mitades idénticas. El área bajo Ia mitad a Ia

izquierda de Ia media es 0.5 y eI área a Ia

derecha de Ia media es tambien 0.5.

0.5 0.5

76

Por tanto,

0.5000 - 0.4821 = 0.0179

77

900 1,100 1,000

|

.0179 |

|

.4821

|

|

|

-2.10

78

Una segunda aplicación de Ia distribución

normal estándar es:

combinar dos áreas:

- una a Ia derecha

- y Ia otra a Ia izquierda de Ia media.

79

Regresemos a Ia distribución de

ingresos semanales

(u = $1,000 ơ = $100)

¿CuáI es el área bajo Ia curva normal entre

$ 840 y $1,200?

80

Es necesario dividir la pregunta en dos partes.

Para el área entre $840 y la media de $1,000: 840 -1000 = -160 = 1.60 100 100

Para el área entre $1,200 y la media de $1,000: 1,200 -1000 = 200 = 2.00 100 100

81

El área bajo la curva para un valor z de -1.60

es:

El área bajo Ia curva para un valor z de 2.00

es

0.4452.

(Tabla de z).

Sumando las dos áreas:

0.4452+ 0.4772 = 0.9224

0.4772.

82

Así, Ia probabilidad de seleccionar un

ingreso entre $840 y $1,200 es 0.9224.

En otras palabras, 92.24 por ciento de los

gerentes tienen ingresos semanales entre

$840 y $1,200.

83

840 1,200 1,000

|

|

|

|

|

|

|

0.4452. 0.4772.

84

Otra aplicación de Ia distribución normal

estándar esi:

encontrar el área mayor o menor de

un valor específico.

Continuemos con Ia distribución de

ingresos semanales

(u = $1 000, ơ = $100)

¿qué porcentaje de los ejecutivos recibe

ingresos semanales de $1,245 o más?

86

Para el área entre $1,245 y Ia media de

$1,000:

1,245 -1000 = 245 = 2.45

100 100

87

El área bajo Ia curva para un valor z de 2.45

es

(de la tabla de z).

Restando: 0.5 - 0.4929 = 0.0071

0.4929.

88

Sólo el .71 por ciento de los gerentes tienen

ingresos semanales de $1,245 o más.

89

840 1,245 1,000

|

|

|

0.4929 0.0071

90

Otra aplicación de Ia distribución normal

estándar es:

determinar el área entre dos valores en el

mismo lado de la media.

91

Sigamos con Ia distribución de

ingresos semanales

(u = $1 000, ơ = $100)

¿CuáI es el área bajo Ia curva normal entre

$ 1,150 y $1,250?

92

Es necesario dividir Ia pregunta en dos partes.

Para el área entre $1,250 y Ia media de $1,000:

1,250 -1000 = 250 = 2.50

100 100

Para el área entre $1,150 y Ia media de $1,000:

1,150 -1000 = 150 = 1.50

100 100

93

El área bajo la curva para un valor z de 2.50

es:

El área bajo Ia curva para un valor z de 1.50

es

0.4938.

(de la tabla de z).

Restando las dos áreas:

0.4938 - 0.4332 = 0.0606

0.4332.

94

Así, Ia probabilidad de seleccionar un

ingreso entre $1,150 y $1,250 es 0.0606.

En otras palabras, 6.06 por ciento de los

gerentes tienen ingresos semanales entre

$1,150 y $1,250.

95

1,150 1,250 1,000

|

|

|

|

|

|

0.0606.

96

Para resumir, existen cuatro situaciones en

las que pudiera ser posible encontrar el área

bajo Ia distribución normal estándar.

1. Para encontrar el área entre u y z,

entonces es posible buscar directamente el

valor en Ia tabla.

2. Para encontrar el área más alIá (mayor o

menor) de z, entonces localice Ia

probabilidad de z en Ia tabla y reste ese

valor de 0.5000.

98

3. Para encontrar eI área entre dos puntos a

diferentes lados de Ia media, determine los

valores z y sume las áreas

correspondientes.

4. Para encontrar el área entre dos puntos

en el mismo lado de Ia media, determine los

valores z y reste el área menor de Ia mayor.

99

Una última aplicación de Ia distribución normal

supone encontrar el valor de Ia observación X

cuando se conoce eI porcentaje por encima o

por debajo de Ia observación.

100

Un fabricante de goma de auto desea establecer una garantía de millaje mínimo para su nueva goma MX100. Las pruebas revelan que el millaje promedio es de 47,900 millas, con una desviación estandar de 2,050 millas y una distribución normal.

Ejemplo:

El fabricante quiere establecer el millaje mínimo garantizado de modo que no se deba reemplazar más del 4 por ciento de las gomas.

¿Qué millaje minimo garantizado deberá anunciar el fabricante?

101

Utilizando Ia fórmula, X representa el millaje

mínimo garantizado

Z = X – 47900

2050

102

Existen dos incógnitas, z y X.

Para encontrar z, observemos que el área

bajo Ia curva normal a Ia izquierda de u es

0.5000.

El area entre u y X es 0.4600,

que se encuentra restando 0.5000 - 0.0400.

103

X 47,900

|

|

|

|

4%

0.04

0.4600

104

El área más cercana a 0.4600 es: 0.4599

Moviéndose a los márgenes de este valor se lee el

valor z. El valor es: 1.75

(de la tabla de z).

Debido a que el valor se encuentra a Ia

izquierda de Ia media, en realidad es

-1.75.

105

Sabiendo que la distancia entre u y X es -1.75 ơ, ahora es posible determinar X (el millaje minimo

garantizado):

-1.75 = X – 47900 2050

-1.75 (2050) = X – 47900

X = 47900 – 1.75 (2050) = 44312

106

El fabricante puede anunciar que

reemplazará en forma gratuita cualquier

goma que se desgaste antes de recorrer

44,312 millas y Ia empresa sabe que, bajo

este plan, debe reemplazar sólo el 4 por

ciento de las gomas.

Conclusión:

107

Otra aplicación de Ia distribución

normal consiste en comparar dos o

más observaciones que están en

distintas escalas o unidades.

Es decir, ambas observaciones se

encuentran en distribuciones distintas.

108

Un estudio de los internos en una

institución correccional evalúa Ia

responsabilidad social de los internos

de Ia prisión y de sus perspectivas de

rehabilitación cuando se les Iibere.

Ejemplo:

109

Las puntuaciones tienen una

distribución normal, con una media de

100 y una desviación estándar de 20.

Para medir su responsabilidad social,

se administró a cada interno una

prueba

110

Los psicólogos de Ia prisión calificaron

a cada interno respecto de las

perspectivas de rehabilitación.

Las calificaciones tienen tambien una

distribución normal, con una media de

500 y una desviación estándar de 100.

111

La calificación de Tora Carney en Ia

prueba de responsabilidad social fue

146, y en rehabilitación obtuvo una

puntuación de 335.

¿Cómo se compara Tora con otros

miembros del grupo en cuanto a

responsabilidad social y a Ia

perspectiva de rehabilitación?

112

Convertimos Ia puntuación de Ia

prueba de responsabilidad social, 146,

a un valor z utilizando Ia fórmula:

Pasos a seguir:

Z = 146 – 100

20

Z = 2.30

113

Convertimos Ia puntuación de Ia

prueba de responsabilidad social, 146,

a un valor z utilizando Ia fórmula:

Pasos a seguir:

Z = 146 – 100

20

Z = 2.30

114

Por lo tanto, en lo referente a

responsabilidad social, Tora Carney se

encuentra en el 1 por ciento más alto del

grupo.

Conclusión:

Sin embargo, al compararla con otras

internas, Tora se encuentra entre eI 5 por

ciento más bajo en cuanto a las

perspectivas de rehabilitación.

115

-1.65 2.30

|

|

|

|

|

|

|

0.4505 0.4893

0.0107 0.0495

Distribución Ji-Cuadrada o Chi-cuadrada o X2?.

Es una prueba útil para variables categóricas y

estadística, es aplicable cuando la variable

nominal está compuesto por dos o más categorías.

Tiene dos aplicaciones:

1. La prueba de bondad de ajuste Chi-cuadrada.

2. La prueba Chi-cuadrada de asociación.

Ambas pruebas se utilizan para determinar si las

frecuencias observadas (O) en las categorías

difieren significativamente de las frecuencias

esperadas (E).

117

Es una prueba estadística para evaluar hipótesis

acerca de la relación entre dos variables categóricas.

Símbolo: X2

Hipótesis a probar: Correlaciones

Variables

involucradas:

Dos variables (la prueba Chi-cuadrada no

considera relaciones causales).

Nivel de medición de

las variables

Nominal u ordinal (o intervalos o razón reducidas

a ordinales)

Procedimiento La Chi-cuadrada se calcula por medio de una

tabla de contingencia o tabulación cruzada, que

es una tabla de dos dimensiones y cada

dimensión contiene una variable. A su vez, cada

variable se subdivide en dos o más categorías.

118

Total de Fila x Total de ColumnaF. Esperada=

Total General

CARACTERÍSTICAS

1. La Distribución X2 se lee con grados de libertad G.L = (Nº de filas - 1)(Nº de columnas - 1).

2. No tiene valores negativos. El valor mínimo es 0.

3. Todas las curvas son asimétricas

4. Cuando aumentan los grados de libertad las curvas son menos elevadas y más extendidas a la derecha.

5. Se utiliza para variables medidas en escala nominal u ordinal.

6. Las fórmulas son:

119

DISTRIBUCIONES CHI CUADRADO

120

Ejemplo 1. Variable, categoría y tabla de contingencia 2x2:

Sean las variables SEXO (Masculino y Femenino) y CANDIDATO

(“A” y “B”). La tabla de contingencia o tabulación cruzada es:

CANDIDATO

“A” “B”

Masculino

SEXO

Femenino

20 30

40 25

121

Variable

Categoría

CANDIDATO

“A” “B”

Masculino

SEXO

Femenino

20 30

40 25

122

Ejemplo 2. Estudio de Tabla de contingencia 3x2: Se estudia a 1040 estudiantes de los niveles de educación primaria y secundaria y a los cuales se aplica un instrumento que mide el aprendizaje de la matemática, en las dimensiones de aprendizaje conceptual, procedimental y actitudinal. Variables: APRENDIZAJE categorías: Conceptual, Procedimental, Actitudinal. NIVEL DE EDUCACIÓN categorías: Primaria, Secundaria.

NIVEL DE EDUCACIÓN

Primaria Secundaria

APRENDIZAJE

Conceptual

Procedimental

Actitudinal

180 100

190 280

170 120

TABLA DE CONTINGENCIA

123

Tabla de frecuencias observadas (O):

NIVEL DE EDUCACIÓN TOTAL

Primaria Secundaria

APRENDIZAJE

Conceptual

Procedimental

Actitudinal

180 100 280

190 280 470

170 120 290

TOTAL 540 500 1040

La Chi-cuadrada es una comparación entre las tablas

de frecuencias observadas y la denominada tabla de

frecuencias esperadas (la tabla que esperaríamos

encontrar si las variables fueran estadísticamente

independientes o no estuvieran relacionadas).

124

La frecuencia esperada de cada celda, casilla o recuadro, se calcula mediante la siguiente fórmula aplicada a la tabla de frecuencias observadas: N = es el número total de frecuencias observadas. E = (marginal del reglón)(marginal de columna) / N.

NIVEL DE EDUCACIÓN

Marginal

de filas

Primaria Secundaria

APRENDIZAJE

Conceptual

Procedimental

Actitudinal

(280)(540)/1040 (280)(500)/1040 280

(470)(540)/1040 (470)( 500)/1040 470

(290)(540)/1040 (290)(500)/1040 290

marginal de columnas 540 500 1040

Tabla de frecuencias esperadas (E):

125

Frecuencia observada:

NIVEL DE EDUCACIÓN TOTAL

Primaria Secundaria

APRENDIZ

AJE

Conceptual

Procedimental

Actitudinal

145,4 134,6 280

244,0 226,0 470

150,6 139,4 290

TOTAL 540 500 1040

NIVEL DE EDUCACIÓN TOTAL

Primaria secundaria

APRENDI

ZAJE

Conceptual

Procedimental

Actitudinal

180 100 280

190 280 470

170 120 290

TOTAL 540 500 1040

Frecuencia esperada:

Donde:

O: frecuencia observada

en cada celda

E: frecuencia esperada

en cada celda

126

E

EOX

2

2

Celda O E O-E (O-E)2 (O-E)2 / E

Conceptual/Primaria 180 145,4 34,6 1197,16 8,23

Procedimental/ Primaria 190 244,4 -54,4 2959,36 12,11

Actitudinal / Primaria 170 150,6 19,4 376,36 2,50

Conceptual / Secundaria 100 134,6 -34,6 1197,16 8,69

Procedimental /Secundaria 280 226,0 54,0 2916,00 12,80

Actitudinal / Secundaria 120 139,4 -19,4 376,36 2,70

X2 = 47,33

Para saber si el valor de X2 es o no significativo, debemos

calcular los grados de libertad.

G.L. = (Nº de filas - 1)(Nº de columnas - 1).

127

Para el ejemplo: Nº de filas = 3 y Nº de columnas = 2; entonces

G.L. = (3-1)(2-1) = 2.

Luego, acudimos a la “tabla de distribución de Chi-

cuadrado”, eligiendo nuestro nivel de confianza ( = 0,05 ó

= 0,01).

Si el valor obtenido de X2 es igual o superior al valor de la

“tabla”, decimos que las variables están relacionadas o no

son independientes.

Aplicación:

Para el nivel de confianza de =0,05 y g.l. = 2, el X2 de tabla

es 5,9915 (ver tabla).

X2Obtenido

= 47,33

X2Crítico = 5,9915

128

129

Prueba de hipótesis:

H0: No existe relación entre el aprendizaje y los

niveles de educación.

H1: Existe relación entre el aprendizaje y niveles de

educación.

X2obtenido X2

crítico entonces variables no son

independientes; es decir existe una relación entre

Aprendizaje y los niveles educativos

X2obtenido < X2

crítico entonces se rechaza la

hipótesis nula (H0), y por lo tanto se acepta la hipótesis

alterna (H1).

130

Establezca la Ho a ser probada; por ejemplo,

Ho: 1 = 2 = 0,5

Especifique el nivel de significancia α, por ejemplo: α = 0.5

Haga una tabla de frecuencias obtenidas

Deduzca las frecuencias esperadas a partir de Ho:

Calcule el grado de libertad: Producto de (categorías - 1)

Calcule el valor de X2 a partir de las frecuencias obtenidas y

frecuencias esperadas.

Mediante la tabla de X2 obtenga el valor teórico.

Compara dichos valores.

Establezca la conclusión con respecto a Ho:

Retenga Ho si valor de tabla > Valor calculado.

Retenga Ho si valor de tabla < Valor calculado.

Paso Nº 1

Paso Nº 2

Paso Nº 3

Paso Nº 4

131

Un politólogo cree que, durante los últimos años, la composición étnica

de la ciudad donde vive ha cambiado. Las cifras más actuales

(reunidas hace unos cuántos años) muestran que los habitantes de

dicha ciudad presentan la siguiente composición étnica: 53% noruegos,

32% suecos, 8% irlandeses, 5% alemanes y 2% italianos. Para verificar

esta idea, este científico social obtiene una muestra aleatoria de 750

habitantes, con los resultados que se presentan en la siguiente tabla:

Países Noruegos Suecos Irlandeses Alemanes Italianos

frecuencia 399 193 63 82 13

a). ¿Cuál es la hipótesis nula?

b). ¿Cuál es la hipótesis alterna?

c). ¿Cuál es la conclusión?. Utilice = 0,05.

Ejercicio:

132

Una universidad está pensando en implantar uno de los tres sistemas de

calificaciones siguientes: (1) todas las calificaciones son aprobados-reprobado;

(2) todas las calificaciones están en el sistema 4.0 y (3) 90% de las

calificaciones están en el sistema 4.0 y 10% son a probados-reprobado. Se

realiza una encuesta para determinar si existe una relación entre el área de

interés de cada alumno y su presencia para algún sistema de calificación. Se

elige una muestra aleatoria de 200 estudiantes del área ingeniería, 200 de

ciencias, y 100 de bellas artes. Se pregunta a cada alumno cuál de los tres

calificaciones prefieren. Los resultados aparecen en la siguiente tabla:

Sistema de calificación

Aprobado-reprobado 4,0 4,0 y aprobado-reprobado

Bellas artes 26 55 19

Ciencias 24 118 58

Ingeniería 20 112 68

a). ¿Cuál es la hipótesis nula?

b). ¿Cuál es la hipótesis alterna?

c). ¿Cuál es la conclusión?. Utilice = 0,05.

Ejercicio:

133

DISTRIBUCIÓN “t” de STUDENT

- Utilizada por primera vez por W.S. Gosset (1908).

- Su uso potencial fue descrito por Fisher (1925).

- Se calcula restando al número de observaciones independientes en una muestra el número “k” de parámetros de la población.

- La distribución t es igual a la disribución X2 cuando los grados de libertad tienden a infinito.

134

Se puede probar que siendo `x el promedio de una muestra tomada de una población normal con media y varianza 2, el estadístico t es el valor de una variable aleatoria con distribución "t" de Student y parámetro (grados de libertad) = n-1.

t =x -

s / n

Definiendo el estadístico t:

136

Características Distribución “t”

Tiene media igual 0, es asintótica al eje x y su dominio va de - a +;

El área bajo la curva desde - a + es igual a 1

0, 2 depende parámetro (grados libertad)

Varianza > 1, pero se aproxima a 1 cuando n

Al aumentar n, la distribución “t se aproxima a la Normal; n > 30 ó más, excelente aproximación

Entre las aplicaciones:

Estimación de intervalos de confianza para medias a partir de muestras pequeñas

Pruebas de hipótesis basadas en muestras < 30

137

Tabla de Distribución “t”

Valores de t a la derecha de los cuales se encuentra el (100 x )% área de la curva.

Localizamos la columna del valor de y fila del valor de . La intersección de la fila y la columna nos dará el valor de t.

138

H0: µ=µ0 es la hipótesis nula que se plantea en esta distribución. HA: µ≠ µ0

Si tc < tα (2), gl se acepta H0 tc > t α(2), gl se rechaza H0

139

Ejemplo 1.

Suponga que la edad promedio de muerte de ciertos mamíferos es de 22 años (µ) y que en una muestra de 25 individuos se obtuvieron los siguientes resultados:

17.2 18.0 18.7 19.8 20.3 20.9 21.0 21.7 22.3 22.6 23.1 23.4 23.8 24.2 25.8 26.0 26.3 27.2 27.6 28.1 28.6 29.3 30.1 35.1 24.6

Pruebe la hipótesis nula de que µ=µ0

140

Ejemplo 2.

Suponga que se toman 12 ratones y se examina el efecto que determinada dieta tiene sobre su ganancia de peso. Los datos obtenidos fueron los siguientes:

1.7 0.7 -0.4 -1.8 0.2 0.9 -1.2 -0.9 -1.8 -1.4 -1.8 -2.0

Pruebe la hipótesis nula de que µ=0

141

Distribución F de Fisher

El nombre de esta distribución se debe a R. A. Fisher, quién primero la desarrolló y describió. La prueba F se utiliza principalmente para probar la igualdad entre dos varianzas. Se puede observar, que esta prueba para la igualdad de varianzas se utiliza generalmente para probar la igualdad entre tres o más medias. Cuando se procede a realizar la inferencia estadística para probar igualdad entre 3 o más medias comúnmente se denomina análisis de varianza. El que implica medir la variabilidad de las medias de las muestras obtenidas a partir de las poblaciones problema.

142

Cuando se tiene interés en comparar varianzas, se puede recurrir a la variable aleatoria F, que es la razón de los estimadores insesgados de dos varianzas poblacionales esto es:

2

2

2

1

s

sF

143

La distribución F tiene dos parámetros: los números de grados de libertad que se denotan con el símbolo 1 y 2 .

El parámetro 1 está asociado con el numerador de la razón F; esto es s2

1, estimador insesgado de la varianza 2

1 de la población 1.

La varianza s21 , se obtiene a partir de una muestra

de n1 observaciones tomadas aleatoriamente a partir de la población 1.

144

Puesto que la suma de las desviaciones a partir

de la media muestral, al cuadrado, para s21 tiene

(n-1) grados de libertad, el parámetro 1 es igual

a (n1 - 1), así también el parámetro 2 es igual a

(n2 - 1), de modo semejante, 2 está asociado

con el denominador de la razón F; esto es, s22 ,

estimador insesgado para la varianza 22 de la

población 2.

145

La varianza s22 se obtiene a partir de una muestra de

n2 observaciones tomadas aleatoriamente a partir de la población 2.

La distribución F se denota con dos subíndices, el primero corresponde a 1 y el segundo a 2

146

Propiedades

El estadístico de prueba toma solamente valores no negativos, debido a que tanto numerador y denominador de la razón F son varianzas, las que NO pueden ser valores negativos.

El valor de F varía de cero a infinito, sin embargo en la práctica se considera a 1 como límite inferior del valor F, debido a que siempre es posible utilizar la mayor varianza muestral como numerador de forma que la relación F no sea menor que 1. El límite superior del valor F rara vez es de más de unos cuantos dígitos en la mayor parte de las situaciones. Ejemplo, una F(0.05;20;24) = 2.03 con un alfa =0.05.

147

La tabla F se construye en base a que el numerador de la razón F es mayor que el denominador, y luego los valores de F generalmente son mayores que 1 y tienden a 1 cuando tanto 1 y 2 tienden a infinito.

Bajo la Ho, de que las dos varianzas poblacionales son iguales, se espera que las varianzas de dos muestras cualesquiera tomadas respectivamente a partir de las dos poblaciones sean iguales también.

148

Sin embargo, a pesar que la hipótesis nula sea verdadera, debido a la naturaleza aleatoria del muestreo las dos varianzas muestrales es muy posible difieran una de otra. Mientras mayor sea la diferencia entre las dos varianzas muestrales, mayor será la magnitud en que el estadístico de prueba F esté por encima de 1. La hipótesis nula Ho, se rechaza solamente cuando el valor del estadístico de prueba F es suficientemente mayor que 1.

149

Nota: Cuando s21 es mayor que s2

2, no hay dificultad en

probar la hipótesis nula de Ho: 21 = 2

2 en contra de H1: 21

> 22 , pues sólo se divide la mayor varianza entre la menor

y después se compara con el valor de tabla, sin embargo, la

practica de considerar a s21 como numerador de la razón es

solamente adecuada cuando es la mayor de las dos varianzas

muestrales en una prueba de una cola.

150

Ejemplo:

Suponga que en un invernadero se ha determinado el porcentaje de germinación de semillas de ciertas plantas. Los resultados obtenidos fueron los siguientes:

41 34 33 36 40 25 31 37 34 30 38

Muestra 1

52 57 57 55 62 56 55 64

Muestra 2

Pruebe H0: Ambas muestras pertenecen a la misma población.

151

En caso de que la hipótesis nula sea aceptada, debe calcularse una varianza ponderada:

Donde: