30
Estadística inferencial aplicada Editorial MARTÍN DÍAZ RODRÍGUEZ guía TEXTOS UN

MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

  • Upload
    others

  • View
    92

  • Download
    14

Embed Size (px)

Citation preview

Page 1: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

Estadísticainferencialaplicada

Editorial

MARTÍN DÍAZ RODRÍGUEZ

guíaT E X T O S UN

Page 2: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

MARTÍN DÍAZ RODRÍGUEZ

Licenciado en Matemáticas y Física, Universidad del Atlántico (Colombia). Magíster en Matemáticas, Universidad del Valle - Universidad del Norte (Colombia). Con más de 32 años de experiencia docente. Profesor de tiempo completo de la Universidad del Norte.

EL AUTOR

Page 3: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

ESTADÍSTICA INFERENCIAL APLICADA

Martín Díaz Rodríguez

Área metropolitana de Barranquilla (Colombia), 2019

Page 4: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

© Universidad del Norte, 2019Martín Díaz Rodríguez

Coordinación editorialZoila Sotomayor O.

Asistente editorialMaría Margarita Mendoza

Diseño y diagramaciónMartín Díaz Rodríguez

Diseño de portadaJoaquín Camargo

Corrección de textosNury Ruíz Bárcenas

Procesos técnicosMunir Kharfan de los Reyes

Hecho en ColombiaMade in Colombia

Díaz Rodríguez, Martín.

Estadística inferencial aplicada / Martín Díaz Rodríguez. -- Barranquilla: Editorial Universidad del Norte, 2019.

290 p. : gráficas, cuadros, tablas ; 29 cm.Incluye referencias bibliográficas (página 289) e índice.

ISBN 978-958-789-120-1 (PDF)

1. Estadística matemática. I.Tít.

(CO-BrUNB) (519.5 D542 ed. 23)

© Reservados todos los derechos. Queda prohibida la reproducción total o parcial de esta obra por cualquier medio reprográfico, fónico o informático, así como su transmisión por cualquier medio mecánico o electrónico, fotocopias, microfilm, offset, mimeográfico u otros sin autorización previa y escrita de los titulares del copyright. La violación de dichos

derechos constituye un delito contra la propiedad intelectual.

Vigilada Mineducaciónwww.uninorte.edu.coKm 5, vía a Puerto Colombia, A.A. 1569Área metropolitana de Barranquilla (Colombia)

Page 5: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

A mi querida madre, María La Paz Rodríguez España

y a un querido amigo, Álvaro Luis Cañavera Gutiérrez,

que en paz descansen.

A mi querida esposa, Candelaria Mora Pérez y a mis queridos hijos,

Leslie Johanna, Martín Emilio y Paulo César Díaz Mora; a mis actuales nietos Anthony José

y Emily María Díaz Mercado.

Page 6: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

Indice general

Capıtulo 1 Distribuciones continuas 41.1 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.2 Problemas de aplicacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.3 Distribuciones continuas de interes . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.3.1 Distribucion Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.3.2 Propiedades de la distribucion normal . . . . . . . . . . . . . . . . . . . . 171.3.3 Distribucion Gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241.3.4 Distribucion t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . 291.3.5 Propiedades de la distribucion t de Student . . . . . . . . . . . . . . . . . 301.3.6 Distribucion chi-cuadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . 331.3.7 Propiedades de la distribucion chi-cuadrado . . . . . . . . . . . . . . . . . 331.3.8 Distribucion F de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . 411.3.9 Propiedades de la distribucion F de Fisher . . . . . . . . . . . . . . . . . . 431.3.10 Familia exponencial de distribuciones . . . . . . . . . . . . . . . . . . . . 451.3.11 Ejemplos: Caso uniparametrico . . . . . . . . . . . . . . . . . . . . . . . 461.3.12Ejemplos: Caso multiparametrico . . . . . . . . . . . . . . . . . . . . . . . 46

1.4 Taller . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

Capıtulo 2 Distribuciones muestrales 562.1 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 562.2 Parametros y estadısticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 572.3 Distribuciones muestrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

2.3.1 Definiciones sobre algunas distribuciones muestrales . . . . . . . . . . . . . 632.3.2 Distribucion de la diferencia de dos

medias muestrales. Muestras independientes . . . . . . . . . . . . . . . . 752.3.3 Distribucion de la proporcion muestral . . . . . . . . . . . . . . . . . . . . 782.3.4 Distribucion de la diferencia de dos proporciones muestrales . . . . . . . . 83

2.4 Distribuciones para muestras pequenas . . . . . . . . . . . . . . . . . . . . . . . 872.4.1 Media muestral, muestras pequenas . . . . . . . . . . . . . . . . . . . . . . 882.4.2 Diferencia de dos medias muestrales con

varianzas poblacionales iguales y desconocidas . . . . . . . . . . . . . . . 912.4.3 Diferencia de dos medias muestrales con

varianzas poblacionales desiguales y desconocidas . . . . . . . . . . . . . 932.4.4 Distribucion para la varianza muestral . . . . . . . . . . . . . . . . . . . 942.4.5 Distribucion para el cociente de dos varianzas muestrales . . . . . . . . . . 96

2.5 Taller . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1002.6 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

iv

Page 7: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

v

Capıtulo 3 Estimacion de parametros 1083.1 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1083.2 Estimacion de parametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

3.2.1 Propiedades de un buen estimador puntual . . . . . . . . . . . . . . . . 1103.3 Metodos de estimacion puntual . . . . . . . . . . . . . . . . . . . . . . . . . 115

3.3.1 Metodo de maxima verosimilitud (ML) . . . . . . . . . . . . . . . . . . . 1163.3.2 Metodo de los mınimos cuadrados . . . . . . . . . . . . . . . . . . . . . 1173.3.3 Estimadores puntuales para los parametros estudiados . . . . . . . . . . 118

3.4 Metodo de estimacion por intervalo . . . . . . . . . . . . . . . . . . . . . . . 1183.4.1 Estimacion por intervalos para los parametros estudiados . . . . . . . . 120

3.5 Taller . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1383.6 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

Capıtulo 4 Prueba de hipotesis 1454.1 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1464.2 Prueba de hipotesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1464.3 Prueba de hipotesis para los parametros estudiados . . . . . . . . . . . . . . . . 154

4.3.1 Prueba de hipotesis para la media enpoblacion normal con varianza conocida . . . . . . . . . . . . . . . . . . 154

4.3.2 Prueba de hipotesis para la media en unapoblacion con varianza desconocida, muestra grande . . . . . . . . . . . 161

4.3.3 Prueba de hipotesis para la diferencia de dos medias en poblacionesnormalmente distribuidas con varianzas conocidas . . . . . . . . . . . . 166

4.3.4 Prueba de hipotesis para la diferencia de dos mediasen poblaciones con varianzas desconocidas, muestras grandes . . . . . . . 168

4.3.5 Prueba de hipotesis para una proporcion . . . . . . . . . . . . . . . . . . 1704.3.6 Prueba de hipotesis para la proporcion en una poblacion finita . . . . . . 1724.3.7 Prueba de hipotesis para la diferencia

de dos proporciones poblacionales . . . . . . . . . . . . . . . . . . . . . . 1734.3.8 Prueba de hipotesis para la media en una

poblacion normal con varianza desconocida, muestra pequena . . . . . . 1744.3.9 Prueba de hipotesis para la diferencia de dos medias en poblaciones

normalmente distribuidas con varianzas finitas desconocidas, pero iguales,en muestras pequenas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177

4.3.10 Prueba de hipotesis para la diferencia de dos mediasen poblacionales con distribuciones normales, varianzas finitas descono-cidas y desiguales, en muestras pequenas . . . . . . . . . . . . . . . . . . 179

4.3.11 Prueba de hipotesis para la varianza enuna poblacion con distribucion normal . . . . . . . . . . . . . . . . . . . 181

4.3.12 Prueba de hipotesis para el cociente de dosvarianzas en poblaciones con distribuciones normales . . . . . . . . . . . 181

4.4 Prueba de hipotesis para los parametrosestudiados, en mas de dos poblaciones . . . . . . . . . . . . . . . . . . . . . . . 1854.4.1 Prueba de hipotesis para la igualdad

de mas de dos medias en poblaciones normales . . . . . . . . . . . . . . . 1854.4.2 Prueba de hipotesis para la igualdad

de mas de dos varianzas en poblaciones normales . . . . . . . . . . . . . 186

Indice general

Page 8: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

vi

4.5 Prueba de hipotesis con el estadıstico chi-cuadrado . . . . . . . . . . . . . . . . . 1884.5.1 Prueba de hipotesis para la igualdad de proporciones

en dos o mas poblacionales (prueba de homogeneidad) . . . . . . . . . . 1894.6 Prueba de hipotesis sobre la forma de la funcion

de distribucion de una variable en una poblacion . . . . . . . . . . . . . . . . . 1954.6.1 Prueba de bondad de ajuste a una distribucion discreta . . . . . . . . . . 1954.6.2 Prueba de bondad de ajuste a una distribucion continua . . . . . . . . . . 199

4.7 Prueba de independenciaentre dos variables cualitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203

4.8 Taller . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2124.9 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215

Capıtulo 5 Regresion Lineal Simple 2245.1 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2245.2 Presentacion del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2255.3 Interpretacion de los parametros

en el modelo de regresion poblacional . . . . . . . . . . . . . . . . . . . . . . . . 2265.4 Supuestos del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2265.5 Ecuacion de regresion lineal simple estimada . . . . . . . . . . . . . . . . . . . . 2275.6 Bondad de ajuste del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2355.7 Prediccion para un valor

promedio de Y dado un valor x0 de X, µY . . . . . . . . . . . . . . . . . . . . . 2375.8 Valor pronosticado de Y

dado un valor especıfico x0 de X . . . . . . . . . . . . . . . . . . . . . . . . . . . 2385.9 Resumen de intervalo de confianza de

100(1− α) % para los parametros estudiados . . . . . . . . . . . . . . . . . . . . 2395.10 Resumen de pruebas de hipotesis

para los parametros estudiados . . . . . . . . . . . . . . . . . . . . . . . . . . . 2405.11 Taller . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2425.12 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245

Capıtulo 6 Solucion: problemas de aplicacion 2516.1 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2516.2 Solucion: problema de aplicacion 1 . . . . . . . . . . . . . . . . . . . . . . . . . 2516.3 Solucion: problema de aplicacion 2 . . . . . . . . . . . . . . . . . . . . . . . . . 2646.4 Solucion: problema de aplicacion 3 . . . . . . . . . . . . . . . . . . . . . . . . . 275

Indice general

Page 9: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

Indice de tablas

1.2.1 Grado de satisfaccion en ciencias economicas . . . . . . . . . . . . . . . . . . . . 61.2.2 Grado de satisfaccion en ciencias economicas, continuacion . . . . . . . . . . . . 71.2.3 Grado de satisfaccion por profesion . . . . . . . . . . . . . . . . . . . . . . . . . 81.2.4 Respuestas correctas o incorrectas al inicio del curso . . . . . . . . . . . . . . . . 101.2.5 Respuestas correctas o incorrectas al final del curso . . . . . . . . . . . . . . . . 101.2.6 Resultados por tema de los examenes antes de iniciar el curso . . . . . . . . . . . . . 121.2.7 Resultados por tema de los examenes al final del curso . . . . . . . . . . . . . . . . 131.3.1 Area a la izquierda de un valor de Z dado . . . . . . . . . . . . . . . . . . . . . 201.3.2 Area a la derecha de un valor de t dado . . . . . . . . . . . . . . . . . . . . . . 321.3.3 Area a la derecha de un valor dado de la χ2 . . . . . . . . . . . . . . . . . . . . 361.3.4 Area a la derecha de un valor dado de la F(m,n) . . . . . . . . . . . . . . . . . . 43

2.2.1 Definiciones y teoremas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

4.4.1 Medida de la variabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1874.5.1 Numero de puntajes en cada categorıa . . . . . . . . . . . . . . . . . . . . . . . 1934.5.2 Frecuencias marginales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1934.5.3 Frecuencias esperadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1934.5.4 Frecuencias esperadas, con dos categorıas . . . . . . . . . . . . . . . . . . . . . . 1944.5.5 Frecuencias marginales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1944.6.1 Resultados en el lanzamiento de un dado . . . . . . . . . . . . . . . . . . . . . . 1964.6.2 Resultados en el lanzamiento de un dado . . . . . . . . . . . . . . . . . . . . . . 1964.6.3 Numero de errores ortograficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1974.6.4 Frecuencias esperadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1984.6.5 Intervalos de clase para el grado de satisfaccion en trabajo . . . . . . . . . . . . 2004.7.1 Tabla de frecuencias absolutas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2034.7.2 Resumen de procedimientos de prueba de hipotesis para los parametros

estudiados en una o dos poblaciones . . . . . . . . . . . . . . . . . . . . . . . . . 2104.7.3 Resumen de procedimientos de prueba de hipotesis para los parametros en mas

de dos poblaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2114.9.1 Calculos del ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2224.9.2 Creencia religiosa vs. interes por la polıtica . . . . . . . . . . . . . . . . . . . . 2224.9.3 Numero de personas por profesion interesadas en el programa Python . . . . . . 223

5.5.1 Estimaciones para Y y residuales del modelo . . . . . . . . . . . . . . . . . . . . 2345.12.1 Residuales para el tiempo en espera . . . . . . . . . . . . . . . . . . . . . . . 247

6.2.1 Desviaciones absolutas para las variables Trabajo, Salario, Ascenso . . . . . . . 2546.2.2 Intervalos de clase para el grado de satisfaccion en trabajo . . . . . . . . . . . . 260

vii

Page 10: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

viii

6.3.1 Frecuencias observadas de respuestas al inicio del curso . . . . . . . . . . . . . . 2666.3.2 Marginales de respuestas correctas o incorrectas . . . . . . . . . . . . . . . . . . 2666.3.3 Frecuencias esperadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2676.3.4 Frecuencias observadas de respuestas al final del curso . . . . . . . . . . . . . . . 2696.3.5 Frecuencias esperadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2696.3.6 Frecuencias observadas de respuestas al inicio del curso . . . . . . . . . . . . . . 2706.3.7 Frecuencias esperadas en el grupo control . . . . . . . . . . . . . . . . . . . . . . 2716.3.8 Frecuencias observadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2736.3.9 Frecuencias esperadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2746.4.1 P (Z ≥ z)Distribucion Normal estandar . . . . . . . . . . . . . . . . . . . . . . . . 2776.4.2 P (tv ≥ t) Distribucion t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . 2786.4.3 P (χ2

v ≥ χ2) Distribucion chi-cuadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . 2796.4.4 P (χ2

v ≥ χ2) Distribucion chi-cuadrado, continuacion . . . . . . . . . . . . . . . . . 2806.4.5 P (F(v1,v2) ≥ f) Distribucion F de Fisher . . . . . . . . . . . . . . . . . . . . . . . 2816.4.6 P (F(v1,v2) ≥ f) Distribucion F, continuacion . . . . . . . . . . . . . . . . . . . . . 2826.4.7 P (F(v1,v2) ≥ f) Distribucion F, continuacion . . . . . . . . . . . . . . . . . . . . . 2836.4.8 P (F(v1,v2) ≥ f) Distribucion F, continuacion . . . . . . . . . . . . . . . . . . . . . 2846.4.9 P (F(v1,v2) ≥ f) Distribucion F, continuacion . . . . . . . . . . . . . . . . . . . . . 2856.4.10 P (F(v1,v2) ≥ f) Distribucion F, continuacion . . . . . . . . . . . . . . . . . . . . 2866.4.11P (F(v1.v2) ≥ f) Distribucion F, continuacion . . . . . . . . . . . . . . . . . . . . . 2876.4.12P (F(v1.v2) ≥ f) Distribucion F, continuacion . . . . . . . . . . . . . . . . . . . . . 288

Indice de tablas

Page 11: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

Introduccion

Este libro, dirigido a estudiantes de pregrado que tienen un conocimiento previo sobre teorıade probabilidad, recoge, por una parte, las experiencias adquiridas en el desarrollo de estostemas por el autor como docente en cursos de pregrado y postgrado en diferentes disciplinas,como matematicas, estadıstica aplicada, ciencias economicas y ciencias de la salud. Ası comotambien en el continuo procesamiento y analisis estadıstico de datos reales en trabajos detesis o de profundizacion dirigidos por el autor en diferentes disciplinas, lo que permite elenriquecimiento del enfoque y la seleccion de ejemplos y ejercicios de aplicacion que se hanincluido en este libro con la intencion de hacer mas comprensible el desarrollo de los temastratados. Es ası como el autor se ha propuesto hacer su mayor esfuerzo para aportar lo mejorde sus conocimientos para el exito de este proyecto academico.

Estadıstica inferencial aplicada surge por la inquietud del autor de darle un enfoquepractico a temas que se presentan con frecuencia en algunos cursos de pregrado y postgrado dela Universidad del Norte, que permita a cualquier lector seleccionar del texto los procedimientosestadısticos que requiera en la solucion de problemas de aplicacion y de toma de decisiones,en su campo, con un grado mınimo de dificultad. Por eso, al inicio del primer capıtulo eneste texto, se presentan tres problemas de aplicacion y en cada uno de ellos una serie depreguntas que seran respondidas a partir del capıtulo 2, preguntas estas, que generaran lanecesidad de desarrollar algunos procedimientos estadısticos para su solucion. Las preguntas enestos problemas fueron elaboradas de tal forma que para dar respuesta a ellas desde el puntode vista estadıstico, sea necesario el desarrollo por etapas, de toda la teorıa de estadısticainferencial que generalmente se hace en un curso de pregrado y como a partir de esa teorıay de problemas de aplicacion, se toman decisiones sobre los mismos con base en resultadosestadısticos obtenidos. Basicamente, lo que se presenta aquı es un estudio de casos, en el cualel problema nos lleva al desarrollo de la teorıa estadıstica que se ve en un cursoregular de estadıstica inferencial.

En el primer problema de aplicacion se tomo una muestra de 50 observaciones en laque se midieron tres variables distintas y se formularon una serie de preguntas en relacioncon ellas. Las variables de interes son: grado de satisfaccion con la profesion, grado desatisfaccion con el salario y grado de satisfaccion con el ascenso en campo de cienciaseconomicas. El segundo problema de aplicacion tiene que ver con el rendimiento academi-co de estudiantes en cierto tema de estadıstica descriptiva, utilizando dos procedimientosdiferentes; se quiere saber con cual de los dos procedimientos se obtiene un mejor rendimientoacademico, en este caso, la variable de interes en la toma de decisiones es cualitativa (contestacorrecta o incorrectamente una pregunta relacionada con estadıstica descriptiva), mientras queel tercer problema es exactamente el problema de aplicacion dos, pero la variable de interes

1

Page 12: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

2 Dıaz Rodrıguez

es cuantitativa (nota obtenida entre 0 y 5).

Para el calculo de algunos estadısticos o probabilidades utilizando los archivos de datos,he utilizado, en ciertos casos, los programas: Excel 2016, IBM SPSS 25 Statistics o el MatlabR2012b.

Este texto esta conformado por seis capıtulos. El capıtulo 1 inicia con la presentacion delos tres problemas de aplicacion sobre los cuales gira toda la teorıa estadıstica presentada,luego un repaso sobre algunas variables aleatorias continuas, sus funciones de densidad,propiedades y algunas demostraciones de variables aleatorias continuas; termina este capıtulocon un taller en el que se hacen una serie de afirmaciones sobre conceptos basicos de variablesaleatorias continuas que el estudiante debera validar o refutar utilizando el material desarro-llado. Para los lectores con un interes solo practico sobre el tema es suficiente con la lectura delas propiedades, sin tener en cuenta sus demostraciones.

En los problemas de aplicacion de este capıtulo se formula una serie de preguntas, lascuales se espera queden completamente respondidas al terminar el ultimo capıtulo del libro. Alterminarlo se pretende que el estudiante tenga un buen manejo de las diferentes distribuciones,las propiedades asociadas a cada una de ellas y un concepto claro de lo que necesita saber pararesponder las preguntas formuladas en cada problema de aplicacion

En el capıtulo 2 se presentan las distribuciones muestrales de variables aleatoria relacionadascon los siguientes parametros: media poblacional, diferencia de dos medias poblacionales,proporcion poblacional, diferencias de dos proporciones poblacionales, la varianza y el cocientede dos varianzas poblacionales, en cada caso se presenta una serie de ejemplos de aplicacion, ytermina el capıtulo con un taller y ejercicios.

Al final, tambien se busca que el estudiante identifique correctamente las diferentes dis-tribuciones muestrales estudiadas, su media, su varianza y que calcule probabilidades asociadascon estas variables para dar respuesta a algunas preguntas en los problemas de aplicacionpresentados en el capıtulo 1.

En el capıtulo 3 se presentan los intervalos de confianza para los parametros: media po-blacional, diferencia de dos medias poblacionales, proporcion poblacional, diferencias de dosproporciones poblacionales, la varianza y el cociente de dos varianzas poblacionales, en cadacaso se presenta una serie de ejemplos de aplicacion, y termina el capıtulo con un tallery ejercicios relacionados con la toma de decisiones basada en los intervalos de confianzaestudiados.

Al final, se espera que el estudiante construya correctamente intervalos de confianza pa-ra cada uno de los parametros estudiados en los capıtulos anteriores y que, con base en ellos,pueda dar respuesta a algunas preguntas en los problemas de aplicacion presentados en elcapıtulo 1.

Indice de tablas

Page 13: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

Estadıstica inferencial aplicada 3

El capıtulo 4 inicia con la presentacion de modelos de pruebas de hipotesis para los parametrosestudiados en el capıtulo 3, y luego una generalizacion de estudios de parametros en elcaso de dos o mas poblaciones, como lo son las pruebas de igualdad de mas de dos medias(Anova), las pruebas de homogeneidad de mas de dos varianzas poblacionales, y otrosconjuntos de pruebas que involucran al estadıstico chi-cuadrado, como lo son las pruebas dehomogeneidad de dos o mas proporciones, pruebas de independencia entre dos variables cuali-tativas y finaliza el capıtulo con pruebas de bondad de ajuste, un taller y ejercicios de aplicacion.

Al concluir este capıtulo se espera que el estudiante construya correctamente pruebasde hipotesis para cada uno de los parametros vistos en los capıtulos anteriores y que con baseen ellos pueda dar respuesta a algunas preguntas en los problemas de aplicacion presentadosen el capıtulo 1.

En el capıtulo 5 se trata el tema de regresion lineal simple. Los supuestos, las estima-ciones de los parametros, pruebas de hipotesis para los parametros en el modelo, ejemplos deaplicacion y al final un taller y ejercicios de aplicacion.

Al final, el estudiante construira correctamente modelos de regresion lineal simple e in-terpretara los parametros del modelo; y con base en ellos estimar valores de la variabledependiente, ası como tambien dar respuesta a algunas preguntas en los problemas deaplicacion presentados en el capıtulo 1.

En el capıtulo 6 se presentan las soluciones de los dos primeros problemas de aplicacionpresentados en el primer capıtulo y una sugerencia para la solucion del tercero.

Al final, se espera que el estudiante haya resuelto las preguntas formuladas en cada unode los problemas de aplicacion presentados en el capıtulo 1.

Reconocimiento

El autor expresa sus agradecimientos a todas aquellas personas que de alguna manera hancontribuido al desarrollo de este texto, especialmente a los estudiantes de pregrado de laUniversidad del Norte, por las observaciones hechas en clase, por errores numericos observadosen este material, ası como tambien a los estudiantes de postgrado de la maestrıa en estadısticaaplicada y de la maestrıa en educacion con enfasis en matematicas.

Un agradecimiento muy especial a la abogada Viviana Munoz, en Santiago de Chile,por su inconmensurable colaboracion.

Indice de tablas

Page 14: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

Capıtulo 1

Distribuciones continuas

Introduccion

En este texto presentamos una serie de casos (problemas de aplicacion) que pueden serresueltos utilizando tecnicas estadısticas de uso frecuente en cursos de pregrado e incluso en losprimeros semestres en cursos de postgrado. Los tres problemas de aplicacion que se presentanen la siguiente seccion no son mas que un pretexto para desarrollar toda la teorıa basica deestadıstica inferencial de un curso de pregrado.

Al terminar este capıtulo se espera que el estudiante tenga un manejo correcto de lasdiferentes distribuciones continuas estudiadas, ademas de poder calcular probabilidadesutilizando estas distribuciones a traves de las tablas de sus distribuciones.

1.1 Resumen

En la seccion 1.3, se presentan tres problemas de aplicacion y una serie de preguntas que seespera sean respondidas a medida que se avanzan en el desarrollo de los temas.

En la seccion 1.4, se presentan las distribuciones de algunas variables aleatorias discre-tas y continuas ası como tambien sus propiedades, demostraciones de algunas propiedades y secalculan probabilidades utilizando estas distribuciones.

En la subseccion 1.4.10, se presenta la definicion de familia exponencial de distribucio-nes, como un caso general de varias de las distribuciones estudiadas, ademas se plantean unpar de ejemplos en el caso uniparametrico y otro tanto en el caso multiparametrico; en amboscasos las distribuciones presentadas son la binomial y la normal.

Terminamos el desarrollo teorico del capıtulo con la presentacion de los teoremas; desiguadadde Markov, desigualdad de Chebyshev, sus demostraciones, la definicion de convergencia endistribucion, en probabilidad, casi segura y en media, teoremas sobre ley fuerte de los grandesnumeros, ley debil de los grandes numeros y el teorema del lımite central.

Cerramos el capıtulo con un taller en el que se formulan una serie de preguntas relacio-nadas con los temas teoricos desarrollados.

4

Page 15: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

Estadıstica inferencial aplicada 5

Previo a cada tema, se formulan preguntas relacionadas con el tema a desarrollar inme-diatamente despues de la pregunta.

El siguiente mapa conceptual muestra la forma como seran desarrollados los temas eneste capıtulo.

Figura 1.1.1. Mapa conceptual de los problemas de aplicacion y su relacion con la estadıstica

1.2 Problemas de aplicacion

En esta seccion presentamos los tres problemas de aplicacion, que mencionamos a continuacion.

Problema de aplicacion 1 A la Asociacion Colombiana de Ciencias Economicas le preocupala escasez de profesionales en este campo que parece se dara en un futuro no lejano en laciudad de Barranquilla; ellos creen que ese problema esta relacionado con los factores: gradode satisfaccion con la profesion, grado de satisfaccion con el trabajo y grado de satisfaccionsalarial. Para determinar la influencia de estos tres factores en esa posible escasez futura, se hacontratado un estudio con una firma especializada en pronosticos. Como parte de este estudiose pidio a 50 profesionales de ciencias economicas de la ciudad que indicaran su grado desatisfaccion con respecto al trabajo, el salario y las oportunidades de ascenso.

1.2. Problemas de aplicacion

Page 16: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

6 Dıaz Rodrıguez

Figura 1.2.1. Grado de satisfaccion

Se reunieron los datos en la tabla que se presenta a continuacion:

Tabla 1.2.1 Grado de satisfaccion en ciencias economicas

Trabajo Salario Ascensos71 49 5884 53 6384 74 3787 66 4972 59 7972 37 8672 57 4063 48 7872 76 3771 25 7469 47 1690 56 2384 28 6286 37 5970 38 5486 72 72

Capıtulo 1. Distribuciones continuas

Page 17: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

Estadıstica inferencial aplicada 7

Tabla 1.2.2 Grado de satisfaccion en ciencias economicas, continuacion

Trabajo Salario Ascensos84 60 2990 62 6673 56 5594 60 5284 42 6685 56 6488 55 5274 70 5171 45 6888 49 4290 27 6785 89 4679 59 4172 60 4588 36 4777 60 7564 43 6187 51 5777 90 5171 36 5575 53 9276 59 8295 66 5289 66 6285 57 6765 42 6882 37 5482 60 5689 80 6474 47 6382 49 9190 76 7078 52 7274 59 82

Ademas los datos anteriores fueron clasificados segun la profesion en: administrador, contadory economista. A continuacion se presentan los datos anteriores ya clasificados por profesion:

1.2. Problemas de aplicacion

Page 18: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

8 Dıaz Rodrıguez

Tabla 1.2.3 Grado de satisfaccion por profesion

Administrador Contador Economista

Trabajo Salario Ascenso Trabajo Salario Ascenso Trabajo Salario Ascenso

72 57 40 71 49 58 84 53 6390 62 66 84 74 37 87 66 4984 42 66 72 37 86 72 59 7985 56 64 63 48 78 88 55 5271 45 68 84 60 29 74 70 5188 49 42 73 56 55 85 89 4672 60 45 94 60 52 79 59 4188 36 47 90 27 67 69 47 1677 60 75 72 76 37 90 56 2364 43 61 86 37 59 77 90 5171 75 74 86 72 72 71 36 5584 28 62 95 66 52 75 53 9270 38 54 65 42 68 76 51 5487 51 57 82 37 54 89 80 6474 59 82 82 60 5689 66 62 90 76 7085 57 67 78 52 7274 47 6382 49 91

Se quiere identificar las caracterısticas generales del grupo de profesionales en general yen particular en cada profesion y presentar los resumenes de interes que permitan valorarlas variables en estudio, como son: grado de satisfaccion con el trabajo (Trabajo), grado desatisfaccion con el salario (Salario) y grado de satisfaccion con el ascenso (Ascenso).

Si se quiere hacer un analisis desde el punto de vista estadıstico, se deberıan tener encuenta los siguientes interrogantes:

1. Con base en estas variables ¿que aspecto del trabajo satisface mas a los profesionales deesta ciencia?, ¿cual parece ser el que menos lo satisface?, ¿en cual de las tres variablesse deben introducir mejoras para estimular a mas personas a vincularse a la formacioncomo profesionales en las distintas ramas de las ciencias economicas?

2. ¿Cual de las tres variables parece generar mayor diferencia de opinion entre estosprofesionales? ¿Cual de las variables parece tener mayor cohesion entre ellos?

3. ¿Que se puede decir acerca de la satisfaccion de estos profesionales segun su tipo deprofesion? ¿Cual rama de las ciencias economicas parece tener los mejores niveles desatisfaccion?

Capıtulo 1. Distribuciones continuas

Page 19: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

Estadıstica inferencial aplicada 9

4. Considere la variable Ascenso como una variable categorica (cualitativa), haga lo mismocon el grado de satisfaccion del salario (Salario), ¿es el grado de satisfaccion del ascensoindependiente del grado de satisfaccion en salario?

5. Considere la variable Trabajo como una variable categorica (cualitativa), haga lo mismocon el grado de satisfaccion en el salario, ¿es el grado de satisfaccion del trabajoindependiente del grado de satisfaccion del salario?

6. Considere la variable Ascenso como una variable categorica (cualitativa), haga lo mismocon el grado de satisfaccion en el trabajo, ¿es el grado de satisfaccion en el ascensoindependiente del grado de satisfaccion en trabajo?

7. Considere el grado de satisfaccion en salario como una variable cuantitativa, ¿se ajustanlos valores de la variable grado de satisfaccion en el salario a los valores de una variablecon distribucion normal?

8. Considere el grado de satisfaccion en el ascenso como una variable cuantitativa, ¿seajustan los valores de la variable grado de satisfaccion en el ascenso a los valores deuna variable con distribucion normal?

9. Considere el grado de satisfaccion en el trabajo como una variable cuantitativa, ¿se ajustanlos valores de la variable grado de satisfaccion en el trabajo a los valores de una variablecon distribucion normal?

10. Considere el grado de satisfaccion en salario y grado de satisfaccion en ascenso comovariables cuantitativas. En cada una de las profesiones analizadas, determine si el gradode satisfaccion en salario es funcion del grado de satisfaccion en el ascenso.

11. Considere el grado de satisfaccion en salario y grado de satisfaccion en el trabajo comovariables cuantitativas. En cada una de las profesiones analizadas, determine si el gradode satisfaccion en el salario es funcion del grado de satisfaccion en el trabajo.

12. Considere el grado de satisfaccion en salario y grado de satisfaccion en ascenso comovariables cuantitativas, determine si el grado de satisfaccion en salario es funcion delgrado de satisfaccion en ascenso en las ciencias economicas.

13. Con base en los resultados anteriores, cree usted, ¿hay razones para que la AsociacionColombiana de Ciencias Economicas este preocupada?

Problema de aplicacion 2 Se quiere saber entre dos procedimientos para ensenar estadısticadescriptiva, con cual se obtiene un mejor rendimiento por parte de los estudiantes. Paraaveriguarlo, se escogieron aleatoriamente dos grupos de 54 estudiantes cada uno de unainstitucion educativa; en el primer grupo se utilizo el procedimiento tradicional de ensenanza,mientras que en el segundo grupo se uso el procedimiento experimental. En cada grupo se aplicoal inicio del curso un cuestionario que abordaba seis temas de estadıstica descriptiva y en cadatema se hicieron cuatro preguntas, cada pregunta con solo dos opciones de respuesta (falsoo verdad) y luego al final del curso se hicieron las mismas preguntas formuladas de maneradiferente (algunas invertidas). Los resultados obtenidos utilizando el programa estadıstico IBMStatistics SPSS 25 se muestran en la tabla siguiente; donde con E denotamos los estudiantes que

1.2. Problemas de aplicacion

Page 20: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

10 Dıaz Rodrıguez

pertenecen al grupo experimental y con C, los que pertenecen al grupo control, con 0 denotamoslas preguntas con respuestas incorrectas y con 1, las preguntas respondidas correctamente. Alfinal del curso en el grupo control, un estudiante no se presento a la prueba.

Tabla 1.2.4 Respuestas correctas o incorrectas al inicio del curso

GRUPOC E

P1 0 71 561 145 160

P2 0 132 1151 84 101

P3 0 196 1811 20 35

P4 0 157 1611 59 55

P5 0 215 2131 1 3

P6 0 203 2021 13 14

Tabla 1.2.5 Respuestas correctas o incorrectas al final del curso

GRUPOC E

P1 0 32 21 180 214

P2 0 78 81 134 208

P3 0 170 301 42 186

P4 0 126 661 86 150

P5 0 212 381 0 178

P6 0 208 631 4 153

Las preguntas de interes en este problema son:

1. ¿Al inicio del curso son homogeneos los dos grupos en relacion con el conocimiento quetienen de los temas de estadıstica descriptiva a estudiar?

2. ¿Al final del curso son homogeneos los dos grupos en relacion con el conocimiento de lostemas de estadıstica descriptiva estudiados?

3. Con base en los resultados obtenidos en las tablas, ¿aprendieron los estudiantes con elprocedimiento tradicional de ensenanza?

4. Con base en los resultados obtenidos en las tablas, ¿aprendieron los estudiantes con elprocedimiento experimental de ensenanza?

Capıtulo 1. Distribuciones continuas

Page 21: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

Estadıstica inferencial aplicada 11

5. Si son homogeneos al inicio del curso los dos grupos, ¿con cual procedimiento obtuvieronmejores resultados los estudiantes? ¿es decir, cual de los grupos tuvo un mejor desempenoacademico en terminos generales?

6. ¿En cual de los seis temas evaluados tuvieron un mejor desempeno academico los grupos?

7. ¿En cual de los seis temas evaluados cree usted se deben introducir mejoras o estrategiasdiferentes (en cada grupo) a las aquı aplicadas para que los estudiantes tengan un mejordesempeno academico?, es decir, ¿cual de los seis temas es el mas crıtico en cuanto abajo rendimiento academico en cada grupo y entre grupos?

8. Con base en los resultados anteriores, describa las caracterısticas mas importantes quetienen los grupos en relacion con los temas evaluados.

Problema de aplicacion 3 Se quiere saber entre dos procedimientos para ensenar estadısticadescriptiva, con cual se obtiene un mejor rendimiento por parte de los estudiantes. Paraaveriguarlo, se escogieron aleatoriamente dos grupos de 54 estudiantes cada uno de unainstitucion educativa; en el primer grupo se utilizo el procedimiento tradicional de ensenanza,mientras que en el segundo grupo se uso el procedimiento experimental. En cada grupo se aplicoal inicio del curso un cuestionario que abordaba, seis temas de estadıstica descriptiva y en cadatema se hicieron cuatro preguntas de desarrollo, cada pregunta con nota mınima de 0 y maximade 5; y luego al final del curso se hicieron las mismas preguntas formuladas en problemasde aplicacion con caracterısticas similares a los presentados en el cuestionario inicial. Losresultados de las notas obtenidas por temas, en cada grupo, son las que se muestran en la tablasiguiente; donde con E denotamos los estudiantes que pertenecen al grupo experimental y conC, los del grupo control.

1.2. Problemas de aplicacion

Page 22: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

12 Dıaz Rodrıguez

Tabla 1.2.6 Resultados por tema de los examenes antes de iniciar el curso

GRUPO EXPERIMENTAL GRUPO CONTROLP1 P2 P3 P4 P5 P6 P1 P2 P3 P4 P5 P6

1.4 0.1 0.6 0.6 2.8 0.6 1.3 3.4 2.5 4 2.3 0.53.4 0.1 0.6 0 4 0.6 1.9 0.4 0.4 1.1 1.9 1.34.3 0.1 0.6 0.1 1.1 0.8 0.6 1.6 1.9 1.1 0 3.71.7 2.6 4.9 0.3 3 0 3.7 4.3 2.1 2.9 1.6 2.81.7 1.1 1 1.7 1.7 2.4 3.1 0.7 3.1 3.8 1 0.31.7 1.1 1 2.3 1 2.2 1.7 3.9 0.1 1.8 2.1 2.71.7 1.1 1 1.5 3.8 3.9 2 1.4 0.5 0.3 2.8 3.80.3 3 2.3 1.6 2 1 2.2 0.1 1.8 0.3 0.6 0.22.2 0.5 4.8 2.4 1.9 0.4 2.2 0.1 0.1 0.9 4.5 3.61.5 0.6 4.3 1.5 0.4 2.6 4.9 2.5 0.1 2.1 0.5 11.4 4.2 0.1 3.5 3.3 2 2.7 0.2 0 0.5 2.9 2.50.5 0.6 0.9 1.4 0.1 0.3 2.6 1 1.2 2.7 1.6 50.5 0.6 0.9 1.4 0.1 0.3 2.9 1.7 2.6 0.9 0.6 0.60.5 0.6 0.9 1.4 0.1 0.3 2 2.1 1.1 1.4 0.8 1.20.5 0.6 0.9 1.4 0.1 0.3 2.1 3.7 0.6 2.5 0.9 0.80.5 0.6 0.9 1.4 0.1 0.3 3 0.2 3.2 3.5 1.6 1.90.6 4.4 1.9 2 1.1 5 2.7 0.3 1.5 1 0.1 0.80.5 0.1 4.6 0.8 0.1 0 3.9 0.5 0.5 1 0.3 1.62.6 4.6 2.3 1.7 1.2 0.4 0.5 0.2 1.4 0.3 1.5 0.12.3 2.9 3.5 2.3 1.8 0.9 0.1 0.6 4 2.7 0.4 0.12.9 0.4 4 1.9 1.8 0.6 0.4 0.5 1.6 0.4 2.8 0.71.7 1 0.5 1.6 1.1 1.1 2 0.5 0.9 0.3 1.1 0.93.1 4 4.2 0.6 4.4 0.7 3.1 0.4 3.6 1.2 3 00 0.2 1.8 0.7 1.3 1.9 0.3 1 1.1 4.5 1.4 0.2

2.2 3.5 2.1 0.1 3.1 1.3 2 3.7 3.5 0.1 0.3 0.81.7 1.3 4.2 4.7 1.6 0.8 0.9 1.9 0 2.3 0.5 3.71.8 2.8 0.5 4.2 4.4 3 0.8 2.7 0.1 3.5 0.7 2.80.3 3.3 1.5 1.9 1.1 0.1 2.2 2.3 1 0 0.5 0.71.2 3.2 2 1.9 1.1 0.1 1.2 1.4 0.3 2.9 1.6 0.42 0.5 0 0.7 1.1 0.1 0.1 0.2 0.1 2.8 0.3 1.72 1.7 1.6 1 0.1 1.9 1.8 3.2 1.3 1.6 0.5 0.2

0.2 0.9 1 3.8 2.7 2.9 2.3 2.6 3 0.2 4.3 1.51.9 1.4 1.1 1.2 4.4 1.2 2.2 2.3 0.4 0.7 1.3 1.92.8 2.7 0.1 3.3 3.3 1.6 0.8 0.7 3.5 0.1 1.5 0.14.4 2.8 0.5 2.6 3.3 0.7 2.4 1.2 2.6 1.5 3.3 1.50.6 4.6 4.6 0.9 0.4 0.5 0.6 0 1.9 0.5 0.2 0.12.5 0.2 0 1.3 4.7 0.4 3.6 1.7 0.3 0.7 0.4 0.70.8 1.1 3.9 0.8 2.3 0.3 1.8 0.5 2.8 0.6 4 1.92.8 1.8 0.4 0.4 1.5 0.6 0.2 1.5 0.8 0.6 1.9 41.7 4.5 3.5 3.5 1.2 2.5 0.5 3.8 0.3 1.9 0.2 1.60.1 2.5 0.9 2.5 0.1 2 0.9 3.9 0.8 1.4 0.7 1.60.4 1.3 0.7 0.6 2 1 2.5 3 0.8 1.5 0.1 0.80.4 1.3 0.7 3.2 0.1 0 0.5 4.4 0.8 1.5 1.5 2.10.5 0.6 0.6 2.4 1.4 1.5 1.5 1.1 1.7 1.1 2.1 1.24.9 0.6 0.6 2.3 0.7 1.4 1.7 3.8 2 1.7 2.8 4.41.8 0.6 0.6 0.6 1.8 1.8 0.1 3.5 1 2.2 0.7 0.92.1 0.6 1 0.7 0.9 2 0.2 0.5 0.4 0.7 1.6 0.22.6 2.1 2.7 0.3 2.8 1.1 1 0.7 3.7 3.5 0.3 2.84.2 3.2 4 1.1 2.3 1.4 0.6 1.4 1.9 2.9 3 3.80 0.3 1.9 1 0.4 1.4 2 0.2 0.5 0.2 1.1 3

3.5 1.1 3.2 2.6 0.8 3 0.7 0.9 1.3 3.5 0.5 0.94.7 1 0.1 1.6 0.6 0.8 0.9 0.1 0.5 2.3 4.1 0.20 1.8 4.2 1.8 1.7 3.7 0.3 1.1 1.4 2 3.2 2.3

2.1 3.2 1 1.7 2 2.2 0.1 1.3 0.4 0.2 0.8 3.9

Capıtulo 1. Distribuciones continuas

Page 23: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

Estadıstica inferencial aplicada 13

Tabla 1.2.7 Resultados por tema de los examenes al final del curso

GRUPO EXPERIMENTAL GRUPO CONTROLP1 P2 P3 P4 P5 P6 P1 P2 P3 P4 P5 P6

3.9 3.9 2.6 4.9 4.6 4.6 4.5 1.8 4.5 4 4 1.13.7 4 5 3.4 4.5 4.6 4.2 2.5 4.4 0.5 0.6 3.53.2 4.2 4.3 3.1 4.5 3.9 1.8 3.6 3.5 2.8 4.8 53.2 3.5 4.2 4.2 2.7 4.8 1.7 1.6 4.7 4.9 3.9 4.54.1 4.3 5 4 4.6 2.9 4.4 4.5 4.6 2.6 2.4 3.14.5 5 4.1 3.8 3.9 4.1 0.1 4.6 4.4 4.7 1.7 3.14.7 3.4 4.1 4.2 4.7 3.9 4.4 4.6 2.5 4.9 4.7 1.63.3 5 3.7 3.8 3.9 3.3 3.9 5 4.6 0 2.1 4.14.9 4.8 4.5 4.1 3.8 3.8 4 2.3 2.2 4.9 3 4.74.9 3 4.1 3.7 3.7 3.9 4.1 4.9 4.6 5 5 4.83.1 4.3 4.9 4.4 5 4.4 4.8 3.1 4 3.3 0.9 2.83.2 3.8 4.2 4.2 5 4.7 2.4 4.4 4.5 3.8 0.2 4.24.6 3.4 4.4 3.2 4.9 4.1 4.5 4.1 4.6 2.2 3.2 4.64.6 4.1 2.5 4.3 2.5 4.5 4.9 4.4 5 0.3 3.3 4.84.8 3.3 4.9 4.5 3.5 4.8 4.9 3.6 3.4 3.6 2.5 4.54.5 5 4.9 3.2 4.6 4.5 4.8 3.5 2.9 4.9 4 33.5 4.4 2.8 4.1 4.5 4 4.6 1.9 5 4.8 4.9 4.64.6 4.8 4.6 4.7 3.7 4.6 3.7 2.8 2.6 3.5 2.5 4.33.7 4.8 5 5 3.5 3.7 3.5 4.8 4.8 4.8 3.7 2.83.9 4 3.8 3 2.5 4.3 2.2 5 3.4 3.6 1.9 4.64.3 2.9 3.9 3.5 3.8 3.3 1.9 4.9 2 4.8 1.7 24.5 4.2 4.6 5 4 3.9 4.6 4.1 4.2 4.6 0.2 0.64.1 4.8 4.7 4.4 4 3.6 2.8 3.1 4.7 4.7 3.6 4.53.8 3.2 4.9 5 2.5 3.8 2.4 4.3 4 2.5 1.6 4.24.6 4.9 4.8 3.1 3.6 2.9 4.7 0.2 2.3 4.8 1.3 3.34.8 3.9 3.8 4.3 4.9 4 4.3 2.1 3.7 5 3.9 53.6 5 3 3.6 2.7 4.4 3.1 4.4 3.5 4.5 3.7 3.53.7 3.2 4.9 2.6 3.6 3 3.9 3.8 1.2 4.6 2.3 4.14.6 4.1 4.8 4.9 4.2 2.9 1.9 4.1 4.8 4.6 0.3 4.13.9 4.4 4.9 4.6 4.8 4.7 4.2 4.4 4.3 2.1 2.9 4.84.7 5 3.4 4.6 4.5 4.2 3.7 4.4 0.3 3.7 4.4 4.64.4 4.1 4.9 4.6 2.6 4.7 3.7 3.9 2.5 3.4 4.5 3.94.5 4.3 3.9 3.7 4.1 2.5 4 3.4 4.2 1.9 4.2 4.74.4 3.5 4.9 3.9 4.8 3.2 3.8 3.5 4.5 0.7 3.2 3.64.5 3.9 4.2 4.3 4.5 3.4 4.6 2.4 3.2 2.1 4.9 1.93.5 4.5 4.2 5 4.2 4.4 5 2.7 4.9 3.5 4.3 4.14.6 4.4 4.1 3.9 4.9 4.1 1.7 4.4 3.4 2.3 4.7 4.15 5 3.6 2.6 4.4 4.4 4.7 4.1 1.5 4.5 2.6 4.1

4.8 4.8 3.9 4.5 4.9 4.2 3.2 2.8 4.4 4.1 4.6 3.84.5 4.6 4.3 3.5 3.6 4.1 1.3 2.5 2 1.5 3.3 44.7 3.9 4.3 4.7 3.1 3.9 3.5 3.9 1.8 1.1 4.3 34.6 4.4 4.8 2.6 4.7 4.4 0.8 3.9 2.6 4.6 4.6 4.35 4.9 4 4.7 4.2 2.8 0.6 5 0.9 3.3 4.3 4.5

4.1 4.2 3.9 3.9 3.7 2.5 2.9 3.5 2.4 3.3 4.6 0.42.6 4.6 4.2 2.5 2.8 4.2 3.3 4.4 1 3.7 4 2.45 3.3 4.6 3.5 3 3.1 0.5 2.3 4.8 2.7 2.3 2.5

4.2 4.3 4.2 3.4 4.3 3 1.2 3 0.6 4.7 4.4 4.53.8 3.7 4.5 4 4.7 4.6 3.1 4.8 3.2 0.7 3.9 0.94.8 4.1 3.9 4.1 3.9 3.4 1.5 4 4.6 1.1 3.3 3.13.7 2.5 4.7 3.9 3 3.6 0 5 4.9 1.3 4.2 2.34.3 4.2 4.7 2.5 4.8 3 3.2 4.2 3.8 0.6 0.4 4.94.3 4.5 4.6 4.5 4.7 3.4 2 3.4 1.3 4.2 1.8 3.54 4.4 3.4 3 3.4 4.3 4.4 4.8 2.6 2.1 4.5 0.2

3.9 4 4.7 5 3.2 2.6 3.4 3.8 3.5 3.9 3 4.7

Las preguntas de interes en este problema son:

1. ¿Al inicio del curso son homogeneos los dos grupos en relacion con el conocimiento quetienen de los temas de estadıstica descriptiva a estudiar?

1.2. Problemas de aplicacion

Page 24: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

14 Dıaz Rodrıguez

2. ¿Al final del curso son homogeneos los dos grupos en relacion con el conocimiento de lostemas de estadıstica descriptiva estudiados?

3. Con base en los resultados obtenidos, ¿aprendieron los estudiantes con el procedimientotradicional de ensenanza?

4. Con base en los resultados obtenidos, ¿aprendieron los estudiantes con el procedimientoexperimental de ensenanza?

5. Si son homogeneos al inicio del curso los dos grupos, ¿con cual procedimiento obtuvieronmejores resultados los estudiantes?, es decir, ¿cual de los grupos tuvo un mejor desempenoacademico en terminos generales?

6. ¿En cual de los seis temas evaluados tuvieron un mejor desempeno academico los grupos?

7. ¿En cual de los seis temas evaluados cree usted hay que introducir mejoras o estrategiasdiferentes (en cada grupo) a las aquı aplicadas para que los estudiantes tengan un mejordesempeno academico?

8. Con base en los resultados anteriores describa las caracterısticas mas importantes quetienen los grupos en relacion con los temas evaluados.

Problemas de estas caracterısticas son los que queremos abordar en este textoy presentar una propuesta de solucion desde el punto de vista estadıstico,para lo cual necesitaremos una serie de conceptos estadısticos que iremosmencionando en cada uno de los pasos en el proceso de solucion del problemaque iniciaremos a partir del capıtulo 2.

En este primer capıtulo presentamos un repaso sobre algunas funcionesde densidad para variables aleatorias continuas en una dimension, comotambien algunos conceptos sobre convergencia en distribucion y variablesaleatorias, conceptos que juegan un papel fundamental en el buen desarro-llo y comprehension de los conceptos estadısticos que se presentan en este texto.

Los lectores interesados solo en un curso de estadıstica infe-rencial pueden omitir el resto de este capıtulo, sin perdida de generalidad,ya que, como se dijo antes, esto es solo un repaso sobre algunos temas deprobabilidad. Otros lectores podrıan estar interesados en el enunciado de losteoremas, para recordar algunas propiedades, mientras que otros, ademas delenunciado, en sus demostraciones; ası que en ese sentido se tienen diferentesopciones de lectura para el resto de este primer capıtulo.

Capıtulo 1. Distribuciones continuas

Page 25: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

Estadıstica inferencial aplicada 15

1.3 Distribuciones continuas de interes

En esta seccion presentamos las distribuciones continuas y sus propiedades.

Figura 1.3.1. Mapa conceptual para las distribuciones continuas

¿Que se puede decir del rendimiento academico de un curso de estadıstica I, si se sabe queel grupo tuvo una media de 4.0 con una varianza de 0.25, en una universidad donde la notamınima y maxima son 0 y 5, respectivamente?

A continuacion un esquema que muestra el contenido de esta seccion.

1.3. Distribuciones continuas de interes

Page 26: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

16 Dıaz Rodrıguez

1.3.1 Distribucion normal Definicion 2.3.1

1.3.2 Propiedades de la normal

Teorema 1.3.1 DemostracionTeorema 1.3.2 DemostracionTeorema 1.3.3 DemostracionEjemplo 1.3.1 Solucion

1.3.3 Distribucion Gamma

Definicion funcion Gamma 1.3.21.3.3.1 Propiedades de la funcionDefinicion distribucion Gamma 1.3.3Teorema 1.3.4 Demostracion1.3.3.2 Propiedades de la distribucion

1.3.4 Distribucion t de Student Definicion 1.3.4

1.3.5Propiedades de la distribucion t de Student

Teorema 1.3.5Ejemplo 1.3.2Teorema 1.3.6 Demostracion

1.3.6 Distribucion Chi-cuadrado Definicion 1.3.5

1.3.7 Propiedades de la distribucion

Teorema 1.3.7 DemostracionEjemplo 1.3.3Teorema 1.3.8 DemostracionTeorema 1.3.9 DemostracionTeorema 1.3.10 DemostracionTeorema 1.3.11 Demostracion

1.3.8 Distribucion F de Fisher

{Definicion 1.3.6Ejemplo 1.3.4

1.3.9 Propiedades de la distribucion F

{Teorema 1.3.12 DemostracionTeorema 1.3.13 Demostracion

1.3.10 Familia exponencial de distribuciones

{Definicion 1.3.7Definicion 1.3.8

Ejemplos 1.3.12: Caso uniparametrico

{Binomial con parametro desconocido pNormal con µ y σ conocida

Ejemplos 1.3.6: Caso multiparametrico

Ejemplo 1.3.6 binomial con parametros p y n desconocidosEjemplo 1.3.8 normal con µ y σ desconocidosTeorema 1.3.7 Desigualdad de Markov DemostracionTeorema 1.3.8 desigualdad de Chebyshev DemostracionDefinicion 1.3.14 convergencia en distribucionTeorema 1.3.15 DemostracionEjemplo 1.3.9Ejemplo 1.3.9 convergencia en probabilidadEjemplo 1.3.10Ejemplo 1.3.11Definicion 1.3.12Ejemplo 1.3.10Ejemplo 1.3.13Definicion 1.3.14 convergencia casi seguraEjemplo 1.3.11Definicion 1.3.15 convergencia en mediaTeorema 1.3.12 Ley debil de los grandes numerosTeorema 1.3.16 Ley fuerte de los grandes numerosTeorema 1.3.17 del Lımite central

1.3.1 Distribucion Normal

Definicion 1.3.1 Distribucion Normal. Sea X una variable aleatoria continua, se dice que Xtiene una distribucion normal, si y solo si, su funcion de densidad viene dada por:

f(x) =1√

2πσ2e−

12

(x−µσ

)2

; para todo x ∈ R; σ > 0; µ, σ ∈ R

con parametros µ y σ.

Capıtulo 1. Distribuciones continuas

Page 27: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

Estadıstica inferencial aplicada 17

En la grafica 1.3.2 se muestra la curva de distribucion de una variable con distribucion normal.Como se puede ver, esta grafica es simetrica con respecto al parametro µ, que es precisamentesu media, como se menciona en el teorema siguiente.

Figura 1.3.2. Distribucion normal

1.3.2 Propiedades de la distribucion normal

Teorema 1.3.1 Sea X una variable con distribucion normal con parametros µ y σ, entonces

E(X) = µ y V (X) = σ2

DemostracionBasta hallar la funcion generadora de momento, MX(t) = E(eXt), para esta variable aleatoriaalrededor del origen y calcular la primera y segunda derivada y evaluarla en t = 0.

MX(t) = E(eXt) =1√

2πσ2

∫ ∞−∞

etxe−12(x−µσ )

2

dx =1√

2πσ2

∫ ∞−∞

etx−12(x−µσ )

2

dx

1√2πσ2

∫ ∞−∞

e2σ2tx−(x2−2µx+µ2)

2σ2 dx =1√

2πσ2

∫ ∞−∞

e−(−2σ2tx+x2−2µx+µ2

2σ2

)dx︸ ︷︷ ︸

(a)

El numerador del exponente e, en la ultima integral a la derecha del signo igual, se puedeexpresar de la siguiente manera

−2σ2tx+ x2 − 2µx+ µ2 = x2 − 2σ2tx− 2µx+ µ2 = x2 − 2x (σ2t+ µ)︸ ︷︷ ︸(b)

+µ2

1.3. Distribuciones continuas de interes

Page 28: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

18 Dıaz Rodrıguez

sacando factor comun 2x en el segundo y tercer termino.

Sumando y restando el cuadrado de (a) para completar un trinomio cuadrado perfectocon los dos primeros terminos de la ultima expresion, se tiene

x2 − 2x (σ2t+ µ)︸ ︷︷ ︸a

+µ2 = x2 − 2x(σ2t+ µ) + (σ2t+ µ)2︸ ︷︷ ︸cuadrado perfecto

−(σ2t+ µ)2 + µ2

que al simplicarlo queda de la siguiente manera

x2 − 2x(σ2t+ µ) + (σ2t+ µ)2︸ ︷︷ ︸cuadrado perfecto

−(σ2t+ µ)2 + µ2 = (x− (σ2t+ µ))2 − σ4t2 − 2µσ2t︸ ︷︷ ︸(c)

Reemplazando (c) en (a) y teniendo en cuenta que los dos ultimos terminos de (c) no dependende X en el integrando, se tiene

1√2πσ2

∫ ∞−∞

e−(−2σ2tx+x2−2µx+µ2

2σ2

)dx = e

σ2t2

2+µt 1√

2πσ2

∫ ∞−∞

e−(x−(σ2t+µ))

2

2σ2 dx︸ ︷︷ ︸(d)

= eσ2t2

2+µt

Pero (d) en la expresion anterior es igual a 1, por ser esta la distribucion de densidad de unavariable normal con media σ2t+µ y varianza σ2, o sea, que la funcion generadora de momentopara una variable con distribucion normal con media µ y varianza σ2 es

MX(t) = eσ2t2

2+µt

Observe que a partir de la funcion generadora de momento se puede demostrar que la mediade una variable con distribucion normal es µ y que su varianza es σ2, para ello basta hallarla primera derivada de MX(t) y evaluarla en t = 0; y para la varianza, calcular la segundaderivada de MX(t) evaluarla en t = 0 y luego recordar que V (X) = M

′′X(0)− (M

′X(0))2.

M′

X(t) = (σ2t+ µ)eσ2t2

2+µt,

entonces al evaluar a M′X(t) en t = 0, se tiene M

′X(0) = µ.

Para el caso de la varianza, como

M′

X(t) = (σ2t+ µ)eσ2t2

2+µt,

entonces

M′′

X(t) = (σ2t+ µ)2eσ2t2

2+µt + σ2e

σ2t2

2+µt,

por lo que M′′X(0) = µ2 + σ2, entonces V (X) = M

′′X(0)− (M

′X(0))2 = µ2 + σ2 − µ2 = σ2.

Teorema 1.3.2 Si X es una variable con distribucion normal con media µ, entonces su curvade distribucion es simetrica con respeco a µ.DemostracionEste resultado es evidente, ya que al evaluar la funcion de densidad de la variable aleatoria X,en los puntos µ − x y µ + x, se tienen los mismos resultados, es decir f(µ − x) = f(µ + x),para todo xεR.

Capıtulo 1. Distribuciones continuas

Page 29: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

Estadıstica inferencial aplicada 19

Nota 1 Si µ = 0 y σ2 = 1; se dice que X tiene distribucion normal estandar con funcionde densidad:

f(x) =1√2πe−

12x2

; para todo x ∈ R

en cuyo caso la funcion generadora de momento viene dada ası:

MX(t) = et2

2

La grafica de la funcion de densidad de una variable con distribucion normal estandar es la quese muestra en la figura 1.3.3.

Figura 1.3.3. Distribucion normal estandar

Se observa en la misma que su media es cero, es decir, µ = 0 y que en el intervalo abier-to (−4, 4), se encuentra basicamente, el 100 % del area bajo la curva de su distribucion (p = 1).

En este texto simbolizaremos con la letra Z cuando una variable tenga distribucionnormal estandar.

El calculo de probabilidades de una variable con distribucion normal estandar, general-mente se realiza utilizando tablas de su distribucion. Estas tablas se encuentran en la mayorıade los libros de probabilidad y estadıstica. Si quisieramos calcular la probabilidad de que unavariable con distribucion normal estandar este entre -4 y 0, es decir, P (−4 ≤ Z ≤ 0), esclaro que esta probabilidad es igual a 0,5; ver en la figura 1.3.3 que el area a la izquierda de

1.3. Distribuciones continuas de interes

Page 30: MARTÍN DÍAZ RODRÍGUEZ Estadística inferencial aplicada€¦ · ESTADÍSTICA INFERENCIAL APLICADA Martín Díaz Rodríguez Área metropolitana de Barranquilla (Colombia), 2019

20 Dıaz Rodrıguez

cero es la mitad del area total bajo la curva, por ser esta una curva simetrica con respectoa su media. Ahora si lo que queremos es calcular la probabilidad de que la variables Z tomevalores menores o iguales que 1,88, es decir, P (Z ≤ 1.88), basta hallar el area bajo la curva dedistribucion de la variable Z a la izquierda del valor 1,88 que se muestra en la figura 1.3.4; unaopcion razonable, es utilizar una tabla de la distribucion normal estandar (ver la tabla 1.3.1 enla que se muestran valores de la distribucion normal estandar). En esa tabla se muestra en laprimera columna los valores de la variable Z con una cifra decimal, es decir, en el caso 1,88, enesa primera columna debemos buscar el valor 1,8 y en la primera fila se muestran los valorescorrespondientes a las centesimas de la variable Z, es decir, en este caso, tendrıamos que buscaren esa primera fila el valor 0,08; para hallar la probabilidad pedida, basta desplazarse hacia laderecha por la fila que contiene a 1,8 y luego hacer los mismo hacıa abajo sobre la columna quecontiene a 0,08, el numero en la interseccion de esas dos lıneas es el valor en probabilidad parael area a la izquierda de 1,88, que en este caso es 0,97 (si se toma con dos cifras decimales).

Tabla 1.3.1 Area a la izquierda de un valor de Z dado

Z 0.00 · · · 0.08 0.09⇓

-3.8 0.0000 · · · 0.0001 0.0001...

......

......

1.8 =⇒ 0.9641 · · · 0.9699 0.9706...

......

......

3.8 0.9999 · · · 1.0000 1.0000

Figura 1.3.4. Area a la izquierda de 1.88 en la distribucion normal estandar

El siguiente teorema muestra un procedimiento para convertir cualquier variable condistribucion normal en una variable con distribucion normal estandar.

Capıtulo 1. Distribuciones continuas