80
ESTADÍSTICA GUÍAS DE LABORATORIO CARLOS ALBERTO MEJÍA COLINDRES Universidad Tecnológica Centroamericana Honduras Prentice Hall

ESTADÍSTICA GUÍAS DE LABORATORIO

Embed Size (px)

Citation preview

ESTADÍSTICAGUÍAS DE LABORATORIO

CARLOS ALBERTO MEJÍA COLINDRESUniversidad Tecnológica Centroamericana

Honduras

Prentice Hall

Datos de catalogación bibliográfica

MEJÍA COLINDRES, CARLOS ALBERTO

Páginas: 80

PEARSON EDUCACIÓN, México, 2010

ISBN: 978-607-442-423-2Área: Matemáticas

Formato: 21 27 cm

EstadísticaGuías de laboratorio

Todos los derechos reservados

Editora: Ma. Elena Zahar Arellanoe-mail: [email protected]

Editor de desarrollo: Alejandro Agustín Gómez RuizSupervisor de producción: Rodrigo Romero Villalobos

PRIMERA EDICIÓN, 2010

D.R. © 2010 por Pearson Educación de México, S.A. de C.V.Atlacomulco Núm. 500-5o. pisoCol. Industrial Atoto53519, Naucalpan de Juárez, Edo. de México

Cámara Nacional de la Industria Editorial Mexicana. Reg. núm. 1031.

Custom Publishing es una marca registrada de Pearson Educación de México. S.A. de C.V.

Reservados todos los derechos. Ni la totalidad ni parte de esta publicación pueden reproducirse, registrarse o transmitirse, por un sistema de recuperación de información, en ninguna forma ni por ningún medio, sea electrónico, mecánico, fotoquímico, magnético o electroóptico, por fotocopia, grabación o cualquier otro, sin permiso previo por escrito del editor.

El préstamo, alquiler o cualquier otra forma de cesión de uso de este ejemplar requerirá también la autorización del editor o de sus representantes.

ISBN: 978-607-442-423-2

Impreso en México. Printed in Mexico.1 2 3 4 5 6 7 8 9 0 - 12 11 10 09

es una división de

Apreciados estudiantes y docentes:

La obra que hoy ponemos en sus manos es parte del Programa One to One el cual garantiza a todos los estudiantes de nuevo ingreso a UNITEC, la dotación de sus libros de texto y una computadora portátil, ambos recursos fundamentales durante el proceso de formación profesional.

Nuestro modelo educativo está centrado en el aprendizaje de los estudiantes, de ahí que enfaticemos en el uso de la tecnología y en distintos medios didácticos y audiovisuales, entre los que destaca el libro de texto como recurso fundamental. Como resultado de esta necesidad es que iniciamos en 2008 una alianza estratégica con la editorial Pearson con el propósito de editar libros de texto personalizados para mejorar la calidad del aprendizaje en UNITEC.

Consideramos que nuestra experiencia, pionera en América Latina, ha sido exitosa, pues inició con cuatro asignaturas y actualmente hemos logrado 20 títulos distintos para igual número de asignaturas correspondientes a distintas disciplinas y áreas académicas. Este resultado nos entusiasma a continuar, pues además hemos abierto otro importante espacio para estimular a los docentes a que participen en el proceso de producción intelectual y desarrollo del conocimiento.

Sin embargo, como los anhelos no se cumplen tan sólo por desearlos, ustedes deben mostrar cotidianamente una voluntad expresa por querer ser los profesionales idóneos y competitivos que nuestro país requiere; por nuestra parte, como institución educativa, habremos de mostrar que aceptamos el reto de formar a ciudadanos competentes y a la vez sensibles para apreciar valores y tradiciones con las particularidades de cada una de ellas.

Me entusiasma avanzar con ustedes en la consecución de nuestra filosofía institucional, pues nos hemos empeñado en que sean los mejores ciudadanos, profesionales innovadores, todos hombres y mujeres de bien que enaltezcan la sociedad donde decidan desarrollarse.

Les deseo éxito en sus estudios.

Fraternalmente,

Luis Zelaya Medrano

Rector

CONTENIDO

v

11 GUÍA DE LABORATORIO 1

22 GUÍA DE LABORATORIO 6

33 GUÍA DE LABORATORIO 12

44 GUÍA DE LABORATORIO 15

55 GUÍA DE LABORATORIO 19

66 GUÍA DE LABORATORIO 23

77 GUÍA DE LABORATORIO 27

88 GUÍA DE LABORATORIO 34

99 GUÍA DE LABORATORIO 39

1010 GUÍA DE LABORATORIO 42

1111 GUÍA DE LABORATORIO 46

1212 GUÍA DE LABORATORIO 49

1313 GUÍA DE LABORATORIO 55

1414 GUÍA DE LABORATORIO 59

1515 GUÍA DE LABORATORIO 62

1616 GUÍA DE LABORATORIO 67

Las Guías de laboratorio de estadística surgieron como un recurso didáctico destinado a facilitar la labor del estudiante en la descripción de datos muestrales, así como en la estimación de parámetros y en las pruebas de hipótesis. Las guías comenzaron a escribirse en 2006 y se han mejorado con el tiempo y la experiencia. Se ha hecho un esfuerzo por incluir problemas de la vida real a través de datos recopilados por el autor en sus propias investigaciones, así como por los estudiantes de la UNITEC durante actividades realizadas en clase.

Desde un inicio se decidió que las guías se basaran principalmente en el uso de Excel de Microsoft Office. Aunque existen paquetes estadísticos más poderosos, Excel es muy popular y la mayoría de los estudiantes lo ha utilizado alguna vez. Además, Excel produce gráficas de gran calidad y cuenta con las herramientas de análisis necesarias para llevar a cabo trabajos estadísticos de magnitud moderada. También se ilustra el uso del programa Winstats, creado por Rick Parris de la Phillips Exeter Academy, y que se descarga gratuitamente de Internet.

Las guías siguen la secuencia del texto Estadística para administración, cubriendo el material contenido en los capítulos 1 al 13. El curso de Estadística I se apoya en las primeras nueve guías de laboratorio, mientras que el curso de Estadística II se apoya en las guías restantes. Se tomaron en cuenta las necesidades de los estudiantes de ingeniería en la redacción de las guías de laboratorio, por lo que pueden utilizarse perfectamente en los cursos de Estadística Matemática I y II. Los sílabos para dichas materias sugieren qué guías utilizar y en qué secuencia.

El mejor método para la resolución de las guías dentro del aula es la organización de grupos de tres personas que se apoyarán unas a otras y compararán los resultados. Para esto, es indispensable que todo estudiante lleve su computadora portátil en cada ocasión, así como sus guías de laboratorio, las cuales deberán ser llenadas y revisadas por el profesor al finalizar la sesión. La experiencia indica que la mejor manera de afianzar los conocimientos adquiridos durante los laboratorios es a través de tareas y trabajos, en los cuales el estudiante deba usar lo aprendido. También es posible aplicar pruebas cortas en la que se pida al estudiante interpretar la salida de Excel o Winstats para un problema dado.

Las guías de laboratorio serán siempre un trabajo en progreso, debido a los cambios en los planes de estudio, mejoras en la tecnología y sobre todo, por las sugerencias de estudiantes y colegas, que serán siempre bienvenidas.

PREFACIO

Las guías de laboratorio se redactaron gracias a la iniciativa de la licenciada Alexandra de Guardado en su cargo como directora de la entonces llamada Escuela de Ciencias Básicas. La implementación de las guías en los cursos de estadística fue apoyada en forma entusiasta por la licenciada Karim Martínez, Jefa del Área de Matemáticas durante los años 2007 y 2008. La publicación del material se llevó a cabo finalmente gracias a la gestión de la licenciada Montserrat Amador Nuñez, actual Jefa Académica de Ciencias Matemáticas, y también al interés mostrado por Pearson Custom Publishing, a través de su editora, María Elena Zahar Arellano.

La guía de laboratorio sobre regresión múltiple se escribió siguiendo el método que el licenciado Alex Tábora utiliza en sus cursos de estadística, cuya secuencia es inmejorable en el análisis de modelos de regresión.

Agradezco también a mis estudiantes que han contribuido al recolectar muchos de los datos que se utilizan en las guías, y a mi familia: Daisy, Eva y Todd.

AGRADECIMIENTOS

Temas

• Conteo de datos categóricos. • Gráficos circulares y debarras.

GUÍA DE LABORATORIO

Objetivos

Tras efectuar esta práctica delaboratorio, el estudiante serácapaz de:

• Usar Excel en la creación dedistribuciones de frecuenciaspara datos categóricos.

• Usar Excel en la elaboraciónde gráficos circularesy de barras para datoscategóricos.

• Aplicar el conceptode probabilidad comofrecuencia relativa en laresolución de problemas.

Herramientas a utilizar

Funciones de Excel:

11

Excel en inglés Excel en español

COUNTIF(rango, criterio) CONTAR.SI(rango, criterio)

INSTALACIÓN DE LA HERRAMIENTA ANÁLISIS DE DATOSLas siguientes instrucciones de instalación son válidas para Microsoft Office Excel 2007.

Haga clic en el botón Office . A continuación siga los siguientes pasos:

Opciones de Excel Complementos Ir…

2 ESTADÍSTICA. GUÍAS DE LABORATORIO

Cuando el cuadro de diálogo Complementos aparezca, marque la casilla Herramientas para análisisy luego haga clic en el botón Aceptar.

Las últimas dos selecciones se ilustran en la siguiente figura:

Problema 1 En un restaurante se tomó al azar una muestra de los clientes que pagaron su cuenta con tarjeta de crédito (el restaurante sólo acepta tarjetas MasterCard, Visa, American Express y Diners Club), detectando la siguiente muestra:

MasterCard, Visa, MasterCard, Visa, Diners Club, MasterCard, MasterCard, Visa, Diners Club, American Express, American Express, MasterCard, MasterCard, Diners Club, Diners Club, American Express, MasterCard, Visa, MasterCard, Visa, Visa, Visa, MasterCard, MasterCard, MasterCard, Visa, American Express, Diners Club, American Express, American Express, Diners Club, Diners Club, MasterCard, MasterCard, MasterCard, Diners Club, Diners Club, MasterCard, Visa, MasterCard, Visa, MasterCard, MasterCard, Visa, Visa, American Express, American Express, American Express, MasterCard, MasterCard, Diners Club, Visa, MasterCard, American Express, Visa, Visa, MasterCard, MasterCard, Diners Club, Visa.

GUÍA DE LABORATORIO 1 3GUÍA DE LABORATORIO 1 3

Paso 1 Escriba los datos en la columna A y titule la celda A1 como TARJETA. En lugar de American Express y Diners Club, escriba Amex y Diners, respectivamente.

Paso 2 Elabore una tabla de frecuencias en las columnas C y D de la siguiente forma:

Paso 3 Seleccione desde la celda D2 hasta la D5 y en la barra de fórmulas introduzca:

=CONTAR.SI(A2:A61, C2:C5)

Posteriormente oprima al mismo tiempo las teclas Ctrl y Shift y en seguida presione Enter.Los valores para las frecuencias se llenarán inmediatamente. Compruebe que la suma de los valores sea 60.

Paso 4 Con la distribución de frecuencias para las tarjetas de crédito, realice un gráfico circular porcentual.

Haga clic en la pestaña Insertar y a continuación seleccione la celda C2 hasta la D5. Después,en la sección Gráficos oprima el botón Circular y elija la gráfica que desee generar.

4 ESTADÍSTICA. GUÍAS DE LABORATORIO

Haga clic sobre el gráfico recién creado para que aparezca la pestaña Herramientas de gráficos en la parte superior de la pantalla.

Al hacer clic en la pestaña Diseño, se desplegarán las opciones que le permitirán cambiar la apariencia de su gráfica. En la sección Diseños de gráfico, seleccione Diseño 2 para obtener un gráfico circular porcentual.

Para finalizar titule su gráfico y guarde. En la pestaña Insertar hallará el botón Otros gráficos en el cual puede encontrar una

alternativa para el gráfico circular: el gráfico de anillo. Le recomendamos la exploración de esta opción.

Preguntas Indique qué porcentaje de los clientes:

a) Utilizó una tarjeta Visa. ________________

b) Utilizó una tarjeta MasterCard o Diners Club. ________________

c) No usó una tarjeta American Express. ________________

d) No usó una tarjeta Visa ni MasterCard. ________________

Paso 5 Con la distribución de frecuencias para las tarjetas de crédito, elabore un gráfico de barras. Haga clic en la pestaña Insertar y a continuación seleccione desde la celda C2 hasta la D5.

Después, en la sección Gráficos seleccione el botón Columnas y escoja la gráfica que desee generar.

Haga clic sobre el gráfico recién creado para que aparezca una pestaña adicional (Herramienta para gráficos). Dé clic en la pestaña Diseño para mejorar la presentación de su gráfica de barras al combinar tanto los diseños como los estilos gráficos.

Problema 2 Con el objetivo de medir el grado de desarrollo de las competencias emprendedoras de los estudiantes de la UNITEC, se realizó una encuesta entre 44 estudiantes del campus de Tegucigalpa durante el mes de marzo de 2008. La composición de la muestra se detalla en la siguiente tabla:

GUÍA DE LABORATORIO 1 5GUÍA DE LABORATORIO 1 5

Se midieron nueve competencias emprendedoras, una de las cuales fue planificación y organización.Las opciones para la medición de esta competencia fueron:

a) Puedo emprender varios proyectos simultáneamente sin perder el control.

b) Establezco plazos y prioridades para el cumplimiento de mis objetivos.

c) Administro mis recursos con atención.

d) Formulo objetivos racionales para plazos determinados.

e) Me es difícil manejar adecuadamente el tiempo.

La escala descendente se diseñó para que el inciso a) mostrara un desarrollo pleno de la competencia en cuestión, mientras que el correspondiente al inciso e) señalara una deficiencia considerable. El estudiante seleccionaría la opción que mejor lo describiera. Las respuestas obtenidas fueron:

e, b, e, c, b, b, a, e, b, d, e, c, b, e, d, b, e, b, c, b, e, b, a, b, b, b, b, b, b, e, b, a, d, b, c, e, b, b, b, b, c, d, d y a.

Con la información anterior, haga lo siguiente:

1. Realice un gráfico circular o de anillo porcentual para la tabla de composición de la muestra. Después, elabore un gráfico de barras con los mismos datos.

2. Elabore una tabla de frecuencias para las letras seleccionadas siguiendo los pasos del problema 1.

3. Haga un gráfico circular o de anillo porcentual para la tabla de frecuencias.

4. Calcule el porcentaje de los estudiantes que no marcó ni el inciso a) ni el e).

CARRERA FRECUENCIA

Administración 12

Ingeniería industrial 18

Otras ingenierías 12

Otras carreras 2

Total 44

Temas

• Distribuciones de frecuencias.

• Histogramas.

GUÍA DE LABORATORIO

Objetivos

Después de efectuar esta prácticade laboratorio, el estudiante serácapaz de:

• Utilizar Excel para elaboraruna tabla de clases yfrecuencias absolutas yrelativas.

• Utilizar Excel para laelaboración de gráficos depareto.

• Utilizar Excel para laelaboración de histogramas,por medio del Asistente para gráficos.

22

Problema 1 Utilice Excel para analizar los siguientes datos, los cuales corresponden al número de cerillos encontrados dentro de 54 cajas de la marca Cóndor. Ésta asegura que las cajas contienen 40 unidades, en promedio.

GUÍA DE LABORATORIO 2 7

Paso 1 Elabore una distribución de clases y frecuencias utilizando todos los datos. En las columnas N, O y P realice la siguiente tabla:

Al realizar lo anterior, aparecerá un nuevo cuadro de diálogo donde se indicarán la localización de los datos, los límites superiores de clase, el lugar donde se desplegarán los resultados y los gráficos que serán elaborados.

Llene el cuadro como se muestra a continuación:

Paso 2 Haga clic en la pestaña Datos y posteriormente seleccione el botón Análisis de datos. En el cuadro de diálogo pulse la opción Histograma y haga clic en el botón Aceptar.

8 ESTADÍSTICA. GUÍAS DE LABORATORIO

Al hacer clic en el botón Aceptar, se generará la siguiente tabla:

Clase Frecuencia

29 1

32 2

35 9

38 19

41 15

44 8

y mayor… 0

También se elaborará la gráfica de barras que a continuación se muestra:

Paso 3 Con el objeto de darle a la gráfica la apariencia de un histograma verdadero, haga clic en la pestaña Diseño y escoja el diseño de gráfico 8 y luego, el estilo 35. Escriba el título de la gráfica y de los ejes.

Un histograma verdadero debe mostrar en su eje horizontal los puntos medios de las clases, en lugar de los límites superiores de clase. En el problema 2 se indicará cómo efectuar ese cambio.

Si desea generar una gráfica de Pareto en lugar de un histograma, también debe elegir la casilla Pareto en el cuadro de diálogo Histograma. Con lo anterior se elaborará una gráfica de barras ordenada de acuerdo con las frecuencias. También se generará una gráfica del porcentaje acumulado si se selecciona el cuadro correspondiente a Porcentaje acumulado.

GUÍA DE LABORATORIO 2 9

Debe escoger una celda adecuada para la opción Rango de salida. El gráfico generado puede verse a continuación:

Problema 2 Se lanzan 5 monedas y se anota el número de caras obtenidas. Este proceso se repite 30 veces consiguiendo los siguientes datos:

5 2 4 4 34 4 3 3 44 0 5 1 33 1 1 2 21 2 2 4 32 2 2 1 4

Paso 1 Traslade los datos anteriores a una hoja de Excel, desde la celda A1 hasta la celda E6. A continuación elabore la siguiente tabla:

G H I1 Clase2 03 14 25 36 47 5

Paso 2 Utilice la herramienta Análisis de datos (Histograma) para crear una distribución de frecuencias y un histograma. Debido al corto recorrido de los datos, las clases son de tamaño 1 y, por lo tanto, deben usarse las celdas G2:G7 como el rango de clases. Establezca la celda I1 como el Rango de salida.

10 ESTADÍSTICA. GUÍAS DE LABORATORIO

Problema 3 Tras analizar las calificaciones parciales de un grupo de estudiantes de la asignatura de Estadística, se llegó a la siguiente distribución de clases y frecuencias:

Paso 1 Para obtener un histograma de la distribución de calificaciones del grupo, seleccione las celdas E2:E6. En seguida haga clic en el botón Insertar y oprima el botón Columna. Haga clic sobre el tipo de gráfico que desee realizar, por ejemplo en Columna agrupada 3D.

La gráfica realizada debe incluir título, nombre de las variables y puntos medios de clase en el eje horizontal.

GUÍA DE LABORATORIO 2 11

Paso 2 Haga clic sobre el gráfico para que la pestaña Herramientas de gráficos aparezca en la parte superior de la pantalla. Seleccione la pestaña Diseño y luego el botón Seleccionar datos.

Al hacer lo anterior se desplegará el cuadro de diálogo siguiente:

Pulse Editar en la columna Etiquetas del eje horizontal y luego seleccione las celdas D2 a D6.

Para terminar, haga clic en el botón Aceptar en ambos cuadros de diálogo.Si desea agregar nombres a los ejes, elija la pestaña Herramientas de gráficos y a continuación

seleccione Presentación. Luego haga clic en Rótulos del eje e incorpore lo que considere necesario. El título del gráfico puede agregarse oprimiendo el icono Título del gráfico.

Otra alternativa para agregar los títulos, es seleccionando la pestaña Diseño y escogiendo el bosquejo predeterminado que más se acople a sus deseos. Pruebe, por ejemplo, el diseño de gráfico 8 y el estilo 35, para darle a su gráfica la apariencia de un histograma.

Temas

• Gráficas de datos bivariados. • Diagramas de dispersión.

GUÍA DE LABORATORIO

Objetivos

Después de efectuar esta prácticade laboratorio, el estudiante serácapaz de:

• Usar Excel para trazargráficas de barras agrupadas.

• Usar Excel para trazar elgráfico de dispersión parados variables.

• Determinar empíricamenteuna posible relación linealentre las variables.

33

Problema 1 La siguiente tabla de contingencias muestra los resultados de la encuesta realizada a 50 empresas familiares de Tegucigalpa, en junio de 2008, por la Universidad Tecnológica Centroamericana.

1a. Generación 2a. Generación 3a. Generación

Hombres 59 41 10

Mujeres 27 37 12

Se trazará una gráfica de barras agrupadas para estos datos.

Paso 1 Copie la tabla de contingencias en una hoja de Excel.

GUÍA DE LABORATORIO 3 13

Paso 2 Seleccione toda la tabla (datos y rótulos) y luego, en la barra de herramientas, haga clic en la pestaña Insertar. Al desplegarse el menú, seleccione el botón Barra y después Barra agrupada (primer icono a la izquierda).

De lo anterior, se generará el siguiente gráfico:

Explore otras posibilidades de color y forma para el gráfico de barras agrupadas. ¿Qué información revela este gráfico sobre los empleados de las empresas familiares, según la generación que las administra?

Problema 2 Para un proyecto de inversión se analizan los flujos de caja. Dicho proyecto consiste en la construcción de una residencia para estudiantes universitarios. En él se consideran diferentes rentas posibles, las cuales originan distintas Tasas Internas de Retorno (TIR) para el proyecto. La siguiente tabla ilustra esta situación.

Renta TIR

$150 19

$160 20

$170 22

$180 24

$190 26

$200 27

$250 36

14 ESTADÍSTICA. GUÍAS DE LABORATORIO

Elabore un diagrama de dispersión para estas variables y así determinar una posible relación entre ellas.

Paso 1 Introduzca los valores para las variables Renta (x) y TIR (y) en una hoja de Excel. En seguida, seleccione los datos de la tabla (sin los rótulos), haga clic en Insertar y finalmente en el botón Dispersión. Al hacer esto último se despliega un menú, seleccione el primer icono correspondiente a Dispersión sólo con marcadores para elaborar el diagrama solicitado.

Paso 2 Mejore el gráfico. Haga clic sobre éste para que aparezca la pestaña Herramientas de gráficos en la parte superior de la pantalla. En la pestaña Diseño puede cambiar el aspecto de los puntos. En la pestaña Presentación puede agregarle un título, así como también nombre a los ejes. Asimismo en la pestaña Formato puede cambiar el color del fondo del gráfico.

Preguntas 1. ¿Cuál es el comportamiento de los puntos?

2. ¿Podría una recta ser un buen modelo para describir la variación de la TIR?

3. ¿Cómo sería su pendiente: positiva o negativa? Explique.

Problema 3 El comportamiento del Índice de Precios al Consumidor (IPC) en Honduras durante el periodo 2003-2007, se ilustra en la siguiente tabla. (Diciembre 1999 = 100).

Estos datos forman una serie de tiempo, pues describen el cambio de la variable IPC a través de los años. Haga lo siguiente:

Use el programa Excel para elaborar un gráfico de dispersión para estos datos.

Preguntas 1. ¿Podría una recta ser un buen modelo para describir la variación del IPC?

2. ¿Cómo sería su pendiente: positiva o negativa? Explique.

Año 2003 2004 2005 2006 2007

IPC 138.3 151 162.7 171.3 186.5

Fuente: Honduras en cifras, 2003–2007.

Temas

• Medidas de tendencia centraly de dispersión.

GUÍA DE LABORATORIO

Objetivos

Después de efectuar esta prácticade laboratorio, el estudiante serácapaz de:

• Encontrar las medidas detendencia central y dedispersión de datos sinagrupar usando las funcionesadecuadas de Excel.

• Utilizar Excel paradeterminar las medidasde tendencia central y

de dispersión usando laherramienta Análisis de Datos.

• Utilizar Winstats paraobtener las medidasde tendencia centraly de dispersión de datos.

Obtenga el programa Winstats dela siguiente página electrónica:http://math.exeter.edu/rparris/winstats.html

44

Herramientas a utilizar

Excel en inglés Excel en español

MAX(número1, [número2]) MAX(número1, [número2])

MIN(número1, [número2]) MIN(número1, [número2])

AVERAGE(número1, [número2]) PROMEDIO(número1, [número2])

MEDIAN(número1, [número2]) MEDIANA(número1, [número2])

MODE(número1, [número2]) MODA(número1, [número2])

STDEV(número1, [número2]) DESVEST(número1, [número2])

QUARTILE(matriz, cuartil) CUARTIL(matriz, cuartil)

16 ESTADÍSTICA. GUÍAS DE LABORATORIO

Problema 1 Considere los siguientes datos que corresponden al número de cerillos encontrados dentro de 54 cajas de la marca Cóndor, los cuales ya fueron estudiados en la Guía de Laboratorio 2.

Cóndor asegura que las cajas contienen, en promedio, 40 unidades.

Paso 1 Copie los datos en la hoja de trabajo de Excel tal y como se muestra en la imagen anterior. Luego copie la siguiente tabla en la columna K.

Note que Excel sólo devuelve un valor para la moda (la primera moda encontrada), aunque los datos sean multimodales.

Observe también que Excel utiliza una fórmula diferente de interpolación para el cálculo de los cuartiles, por lo que los resultados pueden variar cuando se utilice la fórmula de su texto.

Pregunta ¿Poseen estos datos una moda única?

Paso 2 Determine en la columna L los valores máximo, mínimo, media, mediana, moda, desviación estándar, Q1 y Q3 de los datos introduciendo las funciones apropiadas de Excel:

L

1 =MAX(A1:I6)2 =MIN(A1:I6)3 =PROMEDIO(A1:I6)4 =MEDIANA(A1:I6)5 =MODA(A1:I6)6 =DESVEST(A1:I6)7 =CUARTIL(A1:I6,1)8 =CUARTIL(A1:I6,3)

GUÍA DE LABORATORIO 4 17GUÍA DE LABORATORIO 4 17

Problema 2 En esta ocasión considere el problema del lanzamiento de las 5 monedas estudiado en la Guía de laboratorio 2. Se registra el número de caras obtenidas como consecuencia de la repetición (30 veces) de este proceso. La siguiente tabla muestra los resultados:

Traslade los datos anteriores a una hoja de trabajo de Excel. Nombre la celda A1 Total de caraspara aludir a la variable, asimismo ubique de la celda A2 a la A31 los 30 valores conseguidos. A continuación realice lo siguiente:

Paso 1 Oprima la pestaña Datos.

Paso 2 Seleccione la opción Análisis de datos.

Paso 3 Cuando aparezca el cuadro de diálogo Análisis de datos, elija Estadística descriptiva y haga clic en el botón Aceptar.

Paso 4 Al aparecer el cuadro de diálogo Estadística descriptiva:

• Teclee en el cuadro Rango de entrada lo siguiente: A1:A31• Seleccione la opción Columnas.• Elija la opción Rótulos en la primera fila. • Seleccione Rango de salida y anote C1 en el cuadro de diálogo.• Dé clic en Resumen de estadísticas.• Oprima el botón Aceptar.

5 2 4 4 34 4 3 3 44 0 5 1 33 1 1 2 21 2 2 4 32 2 2 1 4

18 ESTADÍSTICA. GUÍAS DE LABORATORIO

Determine el coeficiente de variación de los datos, escribiendo en la celda C16: CV=, y en la celda D16 la fórmula =D7/D3*100. Al finalizar presione Enter. Es importante mencionar que este programa (Excel) no posee una función específica para el cálculo del coeficiente de variación.

A continuación utilice Winstats para calcular los valores estadísticos más importantes de los datos.

Paso 1 Abra Winstats y haga clic en Window, posteriormente seleccione 1-var data.

Al desplegarse la ventana de datos, regrese a la hoja de cálculo y copie los 30 datos obtenidos de las repeticiones. Luego, pegue los datos en Winstats haciendo clic en File y en seguida elija Paste from clipboard.

Paso 2 Al concluir el paso anterior, seleccione Stats y luego Overall.

Los estadísticos se generarán en una ventana separada. A continuación se presentan los resultados:

items: 30 Número de datosminimum value: 0.00000 Valor mínimofirst quartile: 2.00000 Cuartil 1median: 3.00000 Medianathird quartile: 4.00000 Cuartil 3maximum value: 5.00000 Valor máximomean value: 2.70000 Mediamidrange: 2.50000range: 5.00000 Rangointerquartile range: 2.00000 Rango intercuartilmean deviation: 1.12000sample std dev (n): 1.29486sample std dev (n-1): 1.31700 Desviación estándar

Temas

• Gráficas de caja y bigote. • Covarianza y coeficiente decorrelación.

GUÍA DE LABORATORIO

Objetivos

Después de efectuar esta prácticade laboratorio, el estudiante serácapaz de:

• Usar el programa Winstatspara trazar gráficas de cajay bigote.

• Usar Excel para calcular lacovarianza y el coeficientede correlación de dosvariables numéricas.

55

Herramientas a utilizar

1. Paquete Winstats de Peanut Software. Puede descargarse gratuitamentede la siguiente página electrónica:

http://math.exeter.edu/rparris/winstats.html

2. Funciones de Excel:

Excel en inglés Excel en español

COVAR(matriz1, matriz2) COVAR(matriz1, matriz2)

CORREL(matriz1, matriz2) COEF.DE.CORREL(matriz1, matriz2)

Problema 1 Se tomaron muestras de dos marcas de mondadientes. Ambas aseguran que sus cajas contienen 250 unidades, en promedio. Las siguientes tablas muestran los resultados:

MONDADIENTES EMPERADOR

211 230 238 246 248 251 253

MONDADIENTES ZOTZ

240 246 250 251 253 254 255 256 259 262 277

20 ESTADÍSTICA. GUÍAS DE LABORATORIO

Elabore gráficos de caja y bigote para ambas muestras.

Paso 1 Abra una hoja de Excel y copie los datos de ambas muestras en dos columnas distintas. No es necesario incluir rótulos.

Paso 2 Abra el programa Winstats, en seguida pulse el botón Window y luego 1-var data.

Al desplegarse la ventana de datos, regrese a la hoja de cálculo y copie los datos correspondientes a la marca Emperador. Luego, pegue los datos en Winstats haciendo clic en File y posteriormente en Paste from clipboard.

Los datos para la marca Emperador deben aparecer en la ventana. Antes de crear el gráfico de caja y bigote de esta muestra, es necesario indicarle al programa (Winstats) que también se desea formar el gráfico de la marca Zotz en la misma ventana. Para esto, oprima el botón Stats para abrir el menú de la opción Boxplots, del cual debe elegir Multiple boxplots e Interpolated, ya que su libro de texto utiliza la interpolación para determinar los cuartiles.

Haga clic en Stats, y en seguida en Boxplots para desplegar un segundo menú. Seleccione Boxplotpara generar el gráfico de caja y bigote correspondiente a la marca Emperador.

211.00 246 .00 253.00

230.00 251.00

25.0% 25.0%

GUÍA DE LABORATORIO 5 21

Paso 3 Vuelva a la hoja de Excel y copie la columna de los datos para la marca Zotz. Péguelos en la misma ventana de datos de Winstats, haciendo clic en File y luego en Paste from clipboard. La nueva información reemplazará a la anterior.

Para crear el segundo gráfico, haga clic en el botón Stats, y en el menú Boxplots seleccione Boxplot. El resultado debe verse así:

211.00 246.00 253.00

230.00 251.00

25.0% 25.0%

240.00 254.00 262.00

250.00 259.00

25.0% 25.0%

Pregunta 1. ¿Qué similitudes y diferencias existen entre las distribuciones de los mondadientes Emperador y Zotz?

Problema 2 El gerente de MIVACSA, una pequeña empresa dedicada a la elaboración de concentrados de fruta, desea saber si las ventas de sus concentrados de horchata y piña colada están correlacionadas. Con este propósito, tomó una muestra de las ventas de ambos productos durante 24 meses, teniendo como resultado la siguiente tabla:

Horchata Piña colada Horchata Piña colada

220 212 240 302171 158 209 414201 332 172 427220 282 193 407238 398 315 514215 302 251 474206 459 266 471304 501 219 474227 337 238 262257 421 264 487225 330 108 267171 356 203 340

Paso 1 En una hoja de Excel introduzca los valores para las variables HORCHATA (x) y PIÑA COLADA (y) en las columnas A y B. Incluya los encabezados.

Paso 2 Copie la siguiente tabla:

D E1 Covarianza

2 Coeficiente de correlación

22 ESTADÍSTICA. GUÍAS DE LABORATORIO

Paso 3 Excel calcula la covarianza poblacional, cuya fórmula tiene a N en el denominador. Para obtener covarianzas muestrales, debe multiplicarse el resultado por n y dividirlo por n – 1.

En la celda E1, anote la fórmula:

=COVAR(A2:A25,B2:B25)*24/23

Ahora calcule el coeficiente de correlación de la muestra en la celda E2, registrando la fórmula:

=COEF.DE.CORREL(A2:A25,B2:B25)

Pregunta ¿A qué conclusión llega sobre la relación que existe entre las ventas de los concentrados para horchata y piña colada?

Temas

• Probabilidad comofrecuencia relativa.

GUÍA DE LABORATORIO

Después de efectuar esta práctica delaboratorio, el estudiante será capazde:

• Usar Excel en problemas básicosde simulación para experimentosestadísticos.

• Comparar el concepto deprobabilidad clásica con elaplicado a frecuencia relativa.

Herramientas a utilizar

Funciones de Excel:

Excel en inglés Excel en español

RANDBETWEEN(inferior, superior) ALEATORIO.ENTRE(inferior, superior)

FREQUENCY(datos, grupos) FRECUENCIA(datos, grupos)

AVERAGE(número1, [número2]) PROMEDIO(número1, [número2])

MEDIAN(número1, [número2]) MEDIANA(número1, [número2])

MODE(número1, [número2]) MODA(número1, [número2])

STDEV(número1, [número2]) DESVEST(número1, [número2])

Autosum Autosuma

Chart Assistant Asistente para gráficos

66Objetivos

24 ESTADÍSTICA. GUÍAS DE LABORATORIO

Problema 1 Considere el experimento de lanzar un par de dados 100 veces, anotando en cada ocasión la suma de los números obtenidos. Use Excel para simular este experimento, generando 200 números aleatorios del 1 al 6: 100 en la columna A y 100 en la columna B. Reserve las celdas A1, B1 y C1 para los títulos DADO 1, DADO 2 y SUMA, respectivamente.

Paso 1 En la celda A2 escriba: =ALEATORIO.ENTRE(1,6). Se producirá un número aleatorio entre 1 y 6.

Paso 2 Mantenga oprimido el botón izquierdo del mouse y arrástrelo desde la esquina inferior derecha de la celda A2 hasta la celda B2. Suelte el botón para formar un segundo número aleatorio entre 1 y 6.

Paso 3 Para crear los números restantes, arrastre el mouse sosteniendo el botón izquierdo, desde la esquina inferior derecha de B2 hasta la esquina inferior derecha de B101, por lo que habrá generado 100 números aleatorios entre 1 y 6.

1.1: Sección Título 25

Paso 4 Debido a la volatilidad de los números aleatorios, éstos cambiarán en cada paso. Una vez creados todos los valores deseados, cópielos y luego péguelos en la misma posición donde estaban antes, por medio de la opción Pegar valores, para así fijarlos.

Paso 5 Sume las cantidades de las casillas A2 y B2 oprimiendo el botón (Autosuma) y el resultado ubíquelo en la celda C2.

Paso 6 Seleccione la celda C2 y arrastre el mouse, sin soltar el botón izquierdo, desde la esquina superior izquierda hasta la esquina inferior derecha de la celda C101, con lo cual se obtienen las 100 sumas resultantes de los lanzamientos de los dados.

Paso 7 Determine la media, mediana, moda y desviación estándar de las sumas, a partir de las celdas A103 y B103.

26 ESTADÍSTICA. GUÍAS DE LABORATORIO

Paso 8 Elabore una tabla de frecuencias para las sumas obtenidas. Use las columnas E y F, como se muestra en la siguiente imagen.

Seleccione las celdas que van de F2 a F12 e introduzca en la barra de fórmulas lo que se muestra a continuación:

=FREQUENCY(C2:C101,E2:E12)

Presione las teclas Ctrl y Shift al mismo tiempo y oprima Enter. Los valores para las frecuencias se crearán inmediatamente.

Paso 9 Use la tabla anterior y el Asistente de gráficos para elaborar un histograma titulado: Distribución de la suma de dos dados en 100 lanzamientos.

Nota: Recuerde que los pasos 8 y 9 también se pueden realizar simultáneamente usando la función Histograma de la herramienta Análisis de datos (vea la Guía de Laboratorio 1).

Preguntas 1. ¿Cómo describiría la forma de la distribución?

2. Según el concepto clásico de probabilidad, ¿cuántos sietes y nueves debieron obtenerse?

3. Si hubo una diferencia con lo que ocurrió en la simulación, ¿puede explicar por qué?

Problema 2 Un experimento consiste en lanzar 10 monedas idénticas y luego anotar el número de escudos obteni-dos. Use Excel para simular los resultados que se pueden obtener en caso de realizar este experimento 100 veces. Represente con ceros las caras y con el número uno los escudos. Posteriormente elabore una tabla de frecuencias para los resultados, así como un histograma de la distribución.

Preguntas 1. ¿Cómo describiría la forma de la distribución?

2. ¿Qué pasaría si se repitiera el experimento en más ocasiones?

3. Calcule la media, mediana, moda y desviación estándar usando Excel.

Temas

• Distribuciones binomial y dePoisson.

• Distribución normal.

GUÍA DE LABORATORIO

Después de efectuar esta prácticade laboratorio, el estudiante serácapaz de:

• Utilizar Excel para calcularprobabilidades para

variables aleatorias discretasbinomiales y de Poisson.

• Utilizar Excel para calcularáreas bajo una curva normalcualquiera.

Herramientas a utilizar

1. Funciones de Excel:

Excel en inglés Excel en español

NORMDIST(x;media;desvest;acum) DISTR.NORM(x;media;desvest;acum)

POISSON(x;media, acum) POISSON(x;media, acum)

BINOMDIST(núm_éxito;ensayos;prob_éxito;acumulado)

DISTR.BINOM(núm_éxito;ensayos;prob_éxito;acumulado)

2. Paquete Winstats de Peanut Software. Puede descargarse gratuitamentede la siguiente página electrónica:http://math.exeter.edu/rparris/winstats.html

77Objetivos

28 ESTADÍSTICA. GUÍAS DE LABORATORIO

Problema 1 Elabore histogramas para tres distribuciones binomiales con valores de p distintos, pero con el mismo número n de ensayos.

Para el parámetro p considere los valores 0.2, 0.5 y 0.8. En cada caso n = 10.

Paso 1 En una hoja de Excel elabore las tres tablas siguientes:

Paso 2 Calcule P(X = 0) cuando p = 0.2 y n = 10 de la siguiente forma:

Seleccione la celda B3 y luego haga clic en el icono (Insertar función).

Al desplegarse el cuadro de diálogo, seleccione la categoría Estadísticas y busque la función DISTR.BINOM y a continuación pulse Aceptar.

GUÍA DE LABORATORIO 7 29

Al hacer lo anterior, se desplegará un nuevo cuadro de diálogo, el cual debe llenarse de la siguiente manera:

En la celda correspondiente a Núm_éxito coloque la casilla donde se encuentra el cero, puesto que se desea calcular P(X= 0). En la ventana Acumulado escriba 0 (cero) o falso, con lo que le indica al programa que desea una probabilidad puntual.

En seguida calcule las demás probabilidades de la tabla eligiendo la celda B3 y luego arrastrando su esquina inferior derecha hasta la celda B13. Al completarse la tabla, ésta debe verse así:

p = 0.2

x P(X = x)

0 0.107374181 0.268435462 0.301989893 0.201326594 0.088080385 0.026424126 0.005505027 0.000786438 7.3728E-059 4.096E-0610 1.024E-07

Dé clic en la pestaña Insertar y elabore un histograma para la tabla anterior, tal y como se explica en la Guía de Laboratorio 2. El gráfico se muestra a continuación.

30 ESTADÍSTICA. GUÍAS DE LABORATORIO

Paso 3 Repita el paso 2 para las siguientes tablas. Compare los histogramas y concluya.

Paso 4 Se desea calcular P(x< 4) cuando p = 0.2 y n = 10. Tomando los resultados de la tabla correspondiente, vemos que:

P(x < 4) = P (x < 3) = 0.10737418 + 0.26843546 + 0.30198989 + 0.20132659

= 0.87912612

Excel puede calcular este resultado con mayor rapidez mediante la función DISTR.BINOM. Lleneel cuadro de diálogo de la siguiente forma:

El resultado obtenido es el mismo. Si a la ventana Acumulado se le hubiera asignado el valor falso,la salida de Excel hubiera sido 0.20132659.

Ejercicio ¿Cuál es valor de las siguientes probabilidades si se utiliza la función DISTR.BINOM?

a) P(x > 6), p = 0.5, n = 10.b) P(x > 4), p = 0.8, n = 10.c) P(x < 60), p = 0.75, n = 100.d) P(x < 90) o (x > 105), p = 0.1, n = 1000.

Problema 2 En una fábrica de galletas se sabe que el número de chispas de chocolate en una galleta cualquiera sigue un proceso de Poisson con una media de = 3 chispas de chocolate por producto. Se considera que una galleta con menos de dos chispas de chocolate no cumple con los estándares de calidad. Useel programa Excel para calcular la probabilidad de que ocurra esto.

Paso 1 Seleccione una celda libre en una hoja de Excel. Oprima el icono para desplegar el cuadro de diálogo Insertar función. En él seleccione la categoría Estadísticas y a continuación la función POISSON. Cuando elija dicha función, se despliega el siguiente cuadro de diálogo, el cual debe completar de esta forma:

GUÍA DE LABORATORIO 7 31

Se tiene entonces que P(x < 2) = P(x < 1) = 0.199148273.La fábrica considera que una galleta con más de 5 chispas de chocolate no cumple con los

estándares de calidad. Si un supervisor selecciona una galleta al azar, ¿cuál es la probabilidad de que ésta contenga demasiadas chispas de chocolate? ¿Cuál es la probabilidad de que contenga exactamente tres chispas de chocolate?

Paso 2 Use una hoja de cálculo en Excel para elaborar una distribución de probabilidad para el número de chispas de chocolate en una galleta cualquiera. Tome las categorías x = 0, 1, 2, 3, 4, 5, 6, 7 o más. Genere el histograma de la distribución.

Paso 3 El programa Winstats también puede usarse para generar histogramas de probabilidad. Abra el programa y en el botón Window seleccione Probability y luego Poisson.

Se abrirá una ventana, la cual muestra un ejemplo de una distribución de Poisson. Para cambiar el parámetro , seleccione Edit y luego Parameters.

Coloque el valor = 3 en la ventana emergente como se ilustra en la figura.

32 ESTADÍSTICA. GUÍAS DE LABORATORIO

Al oprimir Ok se formará la distribución de probabilidad para el número de chispas de chocolate en una galleta cualquiera. Posteriormente dé clic en Edit y luego en Label bars. Con lo anterior, cada barra se ha rotulado con el número de chispas de chocolate respectivo. El gráfico debe verse así:

Problema 3 Las estaturas de los habitantes de una población se describen muy bien por medio de una curva normal con μ = 1.68 m y = 0.1 m. Si se selecciona una persona al azar de dicha población, ¿cuál es la probabilidad de que su estatura sea, a lo sumo, 1.75 m?

Solución con Excel. Si X es la estatura de la persona, se desea encontrar P(X 1.75). Seleccione

una celda libre de su hoja de Excel y posteriormente dé clic en , el cual desplegará el cuadro de diálogo Insertar función. En éste seleccione la categoría Estadísticas y luego la función DISTR.NORM con lo que se despliega un cuadro de diálogo que se llena de la siguiente forma:

Luego PX 1.75 – 0.758

Solución con Winstats. Abra el programa y en el botón Window seleccione Probability y luego Normal. Cuando se despliegue el gráfico, cambie los parámetros haciendo clic en Edit y posteriormente en Parameters. Llene el cuadro de diálogo emergente como se muestra:

GUÍA DE LABORATORIO 7 33

La gráfica presenta la curva normal con μ = 1.68 m y = 0.1. La probabilidad buscada se determina haciendo clic en Calc y luego en Probabilities. Llene el cuadro emergente de la siguiente forma:

Al hacer clic en el botón Probability obtenemos 0.75804 como respuesta.Como se deseaba calcular P(x 1.75), se anotó 1.75 en high x (límite superior) y en low x se

colocó un valor muy lejano a 1.75 y a su izquierda. En este ejemplo se escogió cero, pero cualquier número menor que 11.68 – 3(0.1) = 11.38 se considera lejano.

Winstats también genera la gráfica de la región, cuya área se acaba de determinar.

Ejercicio Mediante Excel y Winstats, calcule las siguientes probabilidades:

a) P(X > 1.80) =b) P(1.65 < X 1.72) =c) P(1.58 < X) o (X > 1.77) =

Nota: Recuerde que en las distribuciones continuas se tiene que:

P(X a) = P(X > a)

P(X a) = P(X < a)

Lo anterior NO es válido para las distribuciones discretas.

Temas

• Evaluación de la normalidad.

GUÍA DE LABORATORIO

Después de efectuar esta prácticade laboratorio, el estudiante serácapaz de:

• Usar Winstats para compararlas características de unconjunto de datos con

las propiedades de ladistribución normal.

• Usar Excel para realizarun plano de probabilidadnormal.

Herramientas a utilizar

1. Paquete Winstats de Peanut Software. Puede descargarse gratuitamentede la siguiente página electrónica:

http://math.exeter.edu/rparris/winstats.html

2. Funciones de Excel:

88Objetivos

Excel en inglés Excel en español

NORMSINV(probabilidad) DISTR.NORM.ESTAND.INV(probabilidad)

GUÍA DE LABORATORIO 8 35

Problema 1 Evaluar las propiedades reales frente a las teóricas

Se tomó una muestra de 32 cajas de la marca popular de cerillos Pantera Negra. Esta marca asegura que sus cajas contienen, en promedio, 40 unidades. Al contar el contenido de las cajas, se obtuvo lo siguiente:

42 39 41 4133 43 35 4142 41 41 3850 38 31 3837 35 38 3737 38 38 3540 35 39 3839 33 40 44

Determine si los datos parecen o no distribuirse normalmente por medio de la comparación de las propiedades reales frente a las propiedades teóricas. Primero traslade los datos a la columna D en una hoja de cálculo en Excel y ordénelos de menor a mayor usando la herramienta Ordenar y filtrar. Abra el paquete Winstats y copie los datos siguiendo los pasos del problema 2 de la Guía de Laboratorio 4, al momento en que se utilizó este programa. Determine los datos estadísticos de la muestra. Con lo anterior obtendrá la siguiente tabla:

items: 32

minimum value: 31.00000first quartile: 37.00000median: 38.00000third quartile: 41.00000maximum value: 50.00000

mean value: 38.65625midrange: 40.50000

range: 19.00000interquartile range: 4.00000mean deviation: 2.69727sample std dev (n): 3.61083sample std dev (n-1): 3.66861

Utilice los resultados anteriores en el análisis de normalidad.

Paso 1 Siguiendo los pasos del problema 1 de la Guía de Laboratorio 5, elabore el gráfico de caja y bigote para los datos previos. El resultado debe ser el siguiente:

31 .00 38.00 44.00

37 .00 41.00

25 .0%

Pregunta Después de realizar un análisis del gráfico, conteste:

¿Qué tipo de distribución tienen los datos?_______________________________________________________________________________

_______________________________________________________________________________

36 ESTADÍSTICA. GUÍAS DE LABORATORIO

Paso 2 Compare la media con la mediana.

Pregunta ¿Son aproximadamente iguales?_______________________________________________________________________________

_______________________________________________________________________________

Paso 3 Calcule 6s.

Pregunta ¿Este número se aproxima de igual manera al rango de los datos?_______________________________________________________________________________

_______________________________________________________________________________

Paso 4 Calcule 1.33s.

Pregunta ¿Este número se aproxima al rango intercuartil de los datos?_______________________________________________________________________________

_______________________________________________________________________________

Paso 5 Calcule x– s y x– s y determine el porcentaje de datos que se encuentran entre estos dos números.

Pregunta ¿Este porcentaje es cercano a 68%?_______________________________________________________________________________

_______________________________________________________________________________

Solución: x– s = 34.99. x– + s = 42.33. Al contar el número de datos que son mayores que 34.99 pero menores que 42.33, el resultado es 26. Esto es 81.25% de los datos, lo cual no es cercano a 68% teórico.

Paso 6 Calcule x– 2s y x– + 2s y determine el porcentaje de datos que se encuentran entre estos dos números.

Pregunta ¿Este porcentaje es cercano a 80%?_______________________________________________________________________________

_______________________________________________________________________________

Paso 7 Calcule x– 2s y x– + 2s y determine el porcentaje de datos que se encuentran entre estos dos números.

Pregunta 1. ¿Este porcentaje es cercano a 95%?_______________________________________________________________________________

_______________________________________________________________________________

Paso 8 Dados los resultados anteriores, ¿puede decirse que la cantidad de cerillos en las cajas de la marca Pantera Negra está distribuido de forma aproximadamente normal? Explique._______________________________________________________________________________

_______________________________________________________________________________

GUÍA DE LABORATORIO 8 37

Problema 2 Construcción de la gráfica cuantil

Paso 1 En la hoja de Excel donde previamente se ordenaron los datos en la columna D enumere, en la columna A, los datos del 1 al 32.

Paso 2 Los 32 datos determinan una partición de 33 partes iguales de la curva normal que los describe. Así, el primer dato tiene un área acumulada de 1/33; el segundo, un área acumulada de 2/32 y así sucesivamente. Estas áreas acumuladas se generan en la columna B, empezando por anotar la fórmula =A1/33 en la celda B1. En seguida, realice automáticamente los demás resultados hasta la celda B32.

38 ESTADÍSTICA. GUÍAS DE LABORATORIO

Paso 3 Ahora realice las puntuaciones Z para cada área acumulada encontrada en el paso anterior. En la celda C1 escriba la fórmula:

=DISTR.NORM.ESTAND.INV(B1)

Después genere de manera automática los resultados hasta la celda C32.

Paso 4 Para finalizar, seleccione los datos de las columnas C y D y trace un diagrama de dispersión, como se mostró en el problema 2 de la Guía de Laboratorio 3.

Si los puntos se trazan aproximadamente a lo largo de una línea recta, entonces los datos se distribuyen en forma normal.

Conclusión

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

Temas

• Muestreo aleatorio. • Distribución muestralde la media.

GUÍA DE LABORATORIO

Después de efectuar esta prácticade laboratorio, el estudiante serácapaz de:

• Utilizar Excel para encontraruna muestra aleatoria (conreemplazo) de una poblaciónfinita.

• Utilizar Excel para comprobarque x

_ y que x_2 2/n.

Herramientas a utilizar

99Objetivos

Excel en inglés Excel en español

VARP(número1, [número2]) VARP(número1, [número2])

Sampling Muestra

Problema 1 La compañía MIVACSA elabora concentrados de frutas naturales y los vende a importantes cafeterías de Tegucigalpa. A continuación se presenta una tabla con las ventas mensuales en galones del concentrado para el té frío, durante los dos años que la compañía lleva funcionando en esa capital.

12 11 5 1017 23 10 1216 2 10 2618 13 15 2718 20 20 358 10 10 10

40 ESTADÍSTICA. GUÍAS DE LABORATORIO

Paso 1 Abra una hoja de Excel y anote los datos desde la celda A1 hasta la D6. Luego, encuentre la media y la varianza de esta población. Use en las celdas B8 y B9 las funciones PROMEDIO y VARP respectivamente, las cuales se encuentran en el cuadro de diálogo desplegado al oprimir el botón fx.

Paso 2 De la población de 24 valores, tome 10 muestras (con reemplazo) de tamaño n=3 y elabore la tabla que se muestra a continuación.

Haga clic en el icono de Office y realice los pasos señalados en la Guía de Laboratorio 1 para desplegar el recuadro de Análisis de datos. En seguida seleccione Muestra.

Lo anterior desplegará el siguiente cuadro de diálogo:

Para obtener la muestra 1, anote los 24 datos poblacionales en el recuadro Rango de entrada. En la sección Método de muestreo, dé clic en Aleatorio y en la ventana Número de muestras escriba el número 3. En Rango de salida, de la sección Opciones de salida, seleccione la celda F2.

GUÍA DE LABORATORIO 9 41

Paso 3 Repita el paso 2 para crear las 10 muestras. Después, calcule la media de la muestra 1 en la celda F5 usando la función PROMEDIO. Genere las medias de las demás muestras automáticamente seleccionando la celda F5 y en seguida arrastre su esquina inferior derecha hasta la celda O5.

A continuación calcule las varianzas de cada muestra utilizando la función VARP.Una vez completa la tabla, calcule la gran media y la gran varianza, así como la varianza de las

medias muestrales y el error estándar muestral. Al finalizar, coloque los resultados obtenidos en la siguiente tabla:

Calcule los cuatro valores requeridos de la siguiente forma:

F

8 =PROMEDIO(F5:O5)

9 =PROMEDIO(F6:O6)

10 =VAR(F5:O5)

11 =B9/3

Pregunta Puede observarse que la gran media aproxima mejor a la media poblacional que las 10 medias mues-trales individualmente, ¿a qué se debe esto?

_______________________________________________________________________________

_______________________________________________________________________________

La gran varianza aproxima mejor a la varianza poblacional que las 10 varianzas muestrales individualmente. Existen 24*24*24 = 13 824 muestras posibles de tamaño 3 (con reemplazo). Si calculara la media y la varianza para todas ellas, entonces la gran media y la gran varianza coincidirían exactamente con la media y varianza poblacionales. De manera similar, la varianza de las medias muestrales sería igual al error estándar si se calculara con base en las 13 824 muestras posibles.

Problema 2 Considere una población que consta de los números 2, 4, 6, 8 únicamente.

1. Encuentre las 16 muestras de tamaño n= 2 posibles (con reemplazo).

2. Calcule las medias de cada muestra posible.

3. Construya una distribución de frecuencias para las medias encontradas.

4. Elabore un histograma de la distribución de frecuencias anterior.

5. Comente sobre el resultado.

Temas

• Intervalos de confianza.

GUÍA DE LABORATORIO

Después de efectuar esta prácticade laboratorio, el estudiante serácapaz de:

• Utilizar Excel para calcularintervalos de confianza con

2 conocida o cuando n 30.

• Utilizar Excel para calcularintervalos de confianza con

2 desconocida y n 30.

Herramientas a utilizar

1010Objetivos

Excel en inglés Excel en español

CONFIDENCE INTERVALO.CONFIANZA

Problema 1 Muestras grandes

La fábrica de cerillos Tucán asegura que sus cajas contienen, en promedio, 40 unidades. Se tomó una muestra de 32 cajas, obteniéndose los siguientes resultados:

40 37 38 39

35 37 37 32

39 34 37 30

43 39 36 34

40 38 35 36

39 37 39 36

40 38 38 37

38 33 36 33

GUÍA DE LABORATORIO 10 43

Paso 1 Copie los datos en una hoja de Excel y calcule lo siguiente:

1. Media (PROMEDIO).

2. Mediana (MEDIANA).

3. Moda (MODA).

4. Rango = MAX(numvar) – MIN(numvar).

5. Varianza (VAR).

6. Desviación estándar (DESVEST).

Paso 2 Determine el intervalo de confianza de 95% para μ, así como la media del contenido de todas las cajas de cerillos que la fábrica Tucán produce en la actualidad. Debido a que la desviación estándar poblacional se desconoce, use la desviación estándar muestral s como estimador puntual de .

Seleccione una celda vacía. Haga clic en el icono para desplegar el cuadro de diálogo Insertarfunción. Seleccione la categoría Estadísticas y luego la función INTERVALO.CONFIANZA.

Al hacer clic en el botón Aceptar, se abrirá otro cuadro de diálogo que deberá llenar.

El valor a anotar en la casilla Alfa es el nivel de significancia, el cual en este caso es 1 – 0.95 = 0.05. En el recuadro Desviación estándar va el valor s muestral y finalmente, el Tamaño de la muestra se escribe en la última casilla.

Una vez que el cuadro esté completo, dé clic en Aceptar. El valor obtenido es el resultado de evaluar la fórmula:

zs

n=

Ejercicios 1. Encuentre el intervalo de confianza al efectuar la ecuación: x– z s

na) Límite inferior: _______

b) Límite superior: _______

44 ESTADÍSTICA. GUÍAS DE LABORATORIO

2. Determine el intervalo de confianza de 98% para .

a) Límite inferior: _______

b) Límite superior: _______

3. ¿Es válida la afirmación de la fábrica Tucán? Explique.

_______________________________________________________________________________

_______________________________________________________________________________

Problema 2 Muestras pequeñas

En un estudio realizado por la Universidad Tecnológica Centroamericana en junio de 2008, se encuestó a 18 empresas familiares de primera generación ubicadas en Tegucigalpa, Honduras. Los siguientes datos muestran el número de empleados que dichas empresas tienen en la actualidad:

17 40 910 10 1010 20 1310 35 186 20 4025 14 5

Calcule intervalos de confianza de 95 a 98% para la media μ del número de empleados de las empresas familiares de primera generación en Tegucigalpa encuestadas.

Usando los datos de la tabla, llame la celda A1 Número de empleados la cual representará a la variable, y ubique los 18 valores obtenidos de la encuesta de las celdas A2 a la A19.

Paso 1 Oprima la pestaña Datos y luego el icono Análisis de datos. Cuando aparezca el cuadro de diálogo, seleccione Estadística descriptiva.

Paso 2 Al hacer clic en el botón Aceptar, se desplegará un cuadro de diálogo. Llénelo como se muestra a continuación:

GUÍA DE LABORATORIO 10 45

Oprima Aceptar para formar una tabla con un resumen estadístico para los datos. La media de la muestra aparecerá en la celda D3 y el error máximo t ˆ

x aparecerá en la celda D16. El intervalo de confianza de 95% se obtiene sumando y restando el error máximo a la media muestral.

a) Límite inferior: __________

b) Límite superior: __________

Pregunta 1. En seguida, determine el intervalo de confianza de 98% para μ.

a) Límite inferior: ______

b) Límite superior: ______

42 39 41 41

33 43 35 41

42 41 41 38

50 38 31 38

37 35 38 37

37 38 38 35

40 35 39 38

39 33 40 44

Problema 3 Establezca un intervalo de confianza de 96% para el contenido promedio de las cajas de cerillos de la marca Pantera Negra, de acuerdo con la siguiente muestra:

Pantera Negra es un competidor de la marca Tucán. Ambos fabricantes aseveran que el contenido promedio de las cajas es de 40 cerillos.

Pregunta ¿La evidencia confirma la aseveración de Pantera Negra?_______________________________________________________________________________

_______________________________________________________________________________

Temas

• Pruebas de hipótesis parauna media.

GUÍA DE LABORATORIO

Herramientas a utilizar

1111

Después de efectuar esta prácticade laboratorio, el estudiante serácapaz de:

• Utilizar Excel para probarhipótesis para una media con

2 conocida o cuando n 30.

• Utilizar Excel para probarhipótesis para una media con

2 desconocida y n < 30.

Objetivos

Excel en inglés Excel en español

ZTEST PRUEBA.Z

TDIST DISTR.T

ABS ABS

Problema 1 Muestras grandes (prueba de dos colas)

La fábrica de cerillos Cóndor lucha por posicionarse en el mercado, por lo que es muy importante comprobar si los mecanismos de control de calidad funcionan apropiadamente. La competencia por parte de las marcas Tucán y Pantera Negra es muy fuerte, sin embargo Cóndor busca enfrentar este reto a través de la diferenciación.

Un primer paso para alcanzar su meta fue determinar si el contenido promedio de las cajas es de 40 cerillos. Para esto, se tomó una muestra aleatoria de 34 cajas y se contó su contenido. Los resultados fueron los siguientes:

40 37 37 32 3937 41 38 36 3236 34 36 33 3833 37 44 39 3645 40 36 38 3739 30 42 39 3130 38 40 37

GUÍA DE LABORATORIO 11 47

Las hipótesis apropiadas son:

H0: 40 cerillos.

H1: 40 cerillos.

Se tomó un nivel de significancia de = 0.05 para esta prueba de hipótesis.

Paso 1 Usando los datos de la tabla, escriba en la celda A1 CERILLOS como nombre de la variable y anote los 34 valores obtenidos en las celdas que van de A2 a A35. Finalmente determine el valor de P por medio de la fórmula:

= 2*MIN(PRUEBA.Z(A2:A35,40),1-PRUEBA.Z(A2:A35,40))

Si P > , no se rechaza que H0. Si P < , entonces se rechaza que H0.

Pregunta ¿Debe Cóndor mejorar sus mecanismos de control de calidad?_______________________________________________________________________________

_______________________________________________________________________________

Nota: En pruebas de una cola, el valor de P se determina por medio de las siguientes fórmulas:a) Si es de cola derecha: =PRUEBA.Z(arreglo, 0, ).

b) Si es de cola izquierda: =1-PRUEBA.Z(arreglo, 0, ).

En ambos casos omita si no se conoce. Excel usará en su lugar el valor muestral s.

Problema 2 Muestras pequeñas (prueba de una cola)

Al igual que los cerillos, los mondadientes se venden en empaques con un contenido promedio establecido por la fábrica. El gerente del restaurante Tallarín y Soya siempre ha sospechado que las cajas de los mondadientes Emperador contienen una cantidad, en promedio, menor a los 250 que el fabricante ha establecido. Para cerciorarse, el gerente tomó una muestra de 16 cajas y, tras un laborioso conteo, llegó a los siguientes resultados:

259 226 234 203

275 196 234 230

254 235 217 248

249 234 224 240

Las hipótesis son:

H0: = 250 mondadientes.

H1: < 250 mondadientes.

Se tomó un nivel de significancia de = 0.05.Por tratarse de una muestra pequeña, es necesario utilizar la distribución t con 15 grados de

libertad en esta prueba de hipótesis.

Paso 1 Abra una hoja de cálculo de Excel e introduzca los datos en la columna A bajo el título Mondadientes.

48 ESTADÍSTICA. GUÍAS DE LABORATORIO

Paso 2 Oprima la pestaña Datos, posteriormente Análisis de datos y finalmente elija la opción Estadísticadescriptiva.

El cuadro de diálogo que aparece al realizar lo anterior, debe llenarse de la siguiente manera:

Excel calculará las estadísticas para los datos que se introdujeron, tal como se muestra a continuación:

En la tabla anterior, el error típico es x–. Ahora calcule el valor de prueba mediante la fórmula:

tX

X

= − μσ

Para esto, introduzca la expresión =(D3 – 250)/D4 en la celda D18.

Paso 3 A continuación, calcule el valor P introduciendo la fórmula:

=DISTR.T(ABS(D18),15,1)

Donde D18 es la celda en la que el valor de prueba t se calculó, 15 son los grados de libertad y 1 el número de colas de la prueba.

Si P > , no se rechaza H0. Por el contrario, si P < , se rechaza H0.

Pregunta ¿El restaurante Tallarín y Soya debe cambiar la marca de mondadientes que usa? Explique._______________________________________________________________________________

_______________________________________________________________________________

Temas

• Pruebas de hipótesis paradiferencias de medias.

GUÍA DE LABORATORIO

Herramientas a utilizar

1212

Después de efectuar esta prácticade laboratorio, el estudiante serácapaz de:

• Utilizar Excel en pruebas dehipótesis para 1- 2 cuandolas muestras son grandes.

• Utilizar Excel en pruebas dehipótesis para 1- 2 cuandolas muestras son pequeñas.

• Utilizar Excel en pruebasde hipótesis para 1- 2cuando las muestras sondependientes.

Objetivos

Excel en inglés Excel en español

z-Test: Two Sample for Means. Prueba z para medias de dos muestras.

t-Test: Two Sample Assuming Equal Variances.

Prueba t para dos muestras suponiendo varianzas iguales.

t-Test: Paired Two Samples for Means. Prueba t para medias de dos muestras emparejadas.

F-Test Two Sample for Variances. Prueba F para varianzas de dos muestras.

50 ESTADÍSTICA. GUÍAS DE LABORATORIO

Problema 1 Muestras grandes e independientes

Las fábricas de cerillos Pantera Negra y Tucán aseguran que sus cajas contienen, en promedio, 40 unidades. Sin embargo, se sospecha que la marca Pantera Negra tiene un mejor promedio que Tucán. Para comprobar lo anterior, se tomó una muestra de 30 cajas de cada marca. Los resultados pueden verse a continuación:

Pantera negra

38 40 37 36 4142 43 36 43 4239 47 37 38 4439 43 39 38 4440 30 34 38 4540 38 33 40 46

Tucán

40 40 43 40 3639 40 38 43 3640 38 40 34 3940 39 41 35 4038 41 43 35 4039 43 39 35 41

Con un nivel de significancia de = 0.05, se desea probar las hipótesis:

H0: μP = μT

H1: μP > μT

Paso 1 Abra una hoja de Excel y escriba en la celda A1 Pantera negra como nombre de la variable y Tucán en la celda B1. Anote los datos para Pantera Negra en las celdas A2:A31 y los correspondientes a Tucán en las casillas B2:B31. Determine la varianza de las muestras anteriores, como se muestra a continuación:

Paso 2 Pulse de la barra principal de Excel la pestaña Datos. Haga clic en el icono Análisis de datosy cuando aparezca el cuadro de diálogo, seleccione Prueba z para medias de dos muestras.Finalmente oprima Aceptar.

Cuando aparezca el cuadro de diálogo, llénelo de la siguiente forma:

GUÍA DE LABORATORIO 12 51

Al pulsar el botón Aceptar, Excel generará la siguiente tabla:

Prueba z para medias de dos muestras

PANTERA NEGRA TUCÁNMedia 39.66666667 39.16667Varianza (conocida) 14.9195402 6.143678Observaciones 30 30Diferencia hipotética de las medias 0z 0.596716802P(Z<=z) una cola 0.275348236Valor crítico de z (una cola) 1.644853627Valor crítico de z (dos colas) 0.550696473Valor crítico de z (dos colas) 1.959963985

Problema 2 Muestras pequeñas e independientes

En referencia al problema 2 de la Guía de Laboratorio 10 y al estudio realizado por la Universidad Tecnológica Centroamericana en junio de 2008, aparte de encuestarse a 18 empresas familiares de primera generación en Tegucigalpa realizado en la Guía de Laboratorio 10, también se encuestaron 19 empresas familiares de segunda generación. Los siguientes datos muestran el número de empleados que dichas empresas tienen en la actualidad:

Nota: Excel, en su versión en español, produce un error en esta prueba. El renglón señalado en rojo corresponde en realidad al valor P para dos colas. Tome en cuenta este hecho al efectuar pruebas de hipótesis para muestras grandes.

Al observar la tabla, se ve que el valor de P para una cola es mayor que , por lo que no se rechaza H0. No hay evidencia de que Pantera Negra tenga un mejor llenado por caja promedio que Tucán.

También se pudo llegar a esta conclusión notando que el valor z = 0.5967, es menor que el valor crítico 1.64 para la prueba de una cola.

Note que, para la prueba de dos colas, el valor de P es 0.551 y que los valores críticos son ±1.96.

1a. Generación

17 40 9

10 10 10

10 20 13

10 35 18

6 20 40

25 14 5

2a. Generación

6 4 32 18

13 10 6 12

30 8 10 1000

40 15 14 1

300 25 6

Existe evidencia de que en promedio, ambos tipos de emplean una cantidad distinta de trabajadores? Probaremos las hipótesis:

H0: μ1 = μ2

H1: μ1 μ2

Con un nivel de significancia de = 0.05.

Paso 1 Abra una hoja de Excel y escriba el nombre de las variables en las celdas A1 y B1. Los valores de la muestra 1 se anotan en las celdas A2:A19 y los de la muestra 2 en las casillas B2:B20. Calcule las varianzas de ambas muestras.

52 ESTADÍSTICA. GUÍAS DE LABORATORIO

Paso 2 Se debe comprobar si las varianzas poblacionales se pueden considerar iguales o no. Las hipótesis son:

H

H

O :

:

22

12

1 22

12

La hipótesis alternativa surge del hecho de que s s22

12> .

Paso 3 Realice una prueba F para probar la hipótesis considerando = 0.05. Seleccione la pestaña Datos y luego Análisis de datos. En el cuadro de diálogo, pulse Prueba F para varianzas de dos muestras y complételo como se muestra:

Al dar clic en Aceptar se obtiene la siguiente tabla:

Como P < , se rechaza H0 y la varianza de la segunda generación se considera mayor que la de la primera.

Paso 4 Continúe ahora con la prueba de hipótesis para las medidas. Haga clic en Análisis de datos. En seguida seleccione Prueba t para dos muestras suponiendo varianzas desiguales y finalmente oprima Aceptar.Cuando aparezca el cuadro de diálogo, llénelo de esta manera:

Prueba F para varianzas de dos muestras

2a. Generación 1a. Generación Media 81.57894737 17.33333333Varianza 53841.59064 121.2941176Observaciones 19 18Grados de libertad 18 17F 443.8928424P(F<=f) una cola 3.33581E-19Valor crítico para F (una cola) 2.256670966

GUÍA DE LABORATORIO 12 53

Haga clic en Aceptar. Cuando Excel genere la salida, compare el valor de P (dos colas) respecto al valor = 0.05.

Pregunta Determine si se rechaza o no se rechaza H0. ¿Qué significa esto en términos de la cantidad promedio de trabajadores que las empresas de primera y segunda generación emplean?_______________________________________________________________________________

_______________________________________________________________________________

Problema 3 Muestras dependientes (emparejadas)

Los siguientes datos corresponden a la producción agrícola en Honduras, durante los años 2006 y 2007 (en miles de quintales), para productos seleccionados.

Producción agrícola seleccionada 2006 2007

Arroz en granza 487 521Banano 11,369 11,710Café en oro 4,396 4,805Caña de azúcar 122,798 131,359Frijoles 2,200 2,392Maicillo o sorgo 1,424 1,520Maíz 11,709 13,606Palma africana 22,944 24,518Plátanos 1,607 1,663Fuente: Honduras en cifras, 2003-2007. p.5

Se desea saber si hubo un cambio significativo en la producción agrícola del año 2007 respecto al 2006. Las hipótesis apropiadas son:

H0: μD = 0

H1: μD 0

Se hará la prueba de hipótesis con = 0.05.

Paso 1 Abra una hoja de Excel y copie la tabla de datos en las columnas A, B y C.

Paso 2 En Análisis de datos elija Prueba t para medias de dos muestras emparejadas y oprima Aceptar.

Llene el cuadro de diálogo que se desplegará al realizar la acción anterior como se muestra a continuación:

54 ESTADÍSTICA. GUÍAS DE LABORATORIO

Pregunta Observe la salida de Excel. Al comparar el valor P para dos colas con el nivel de significancia ,¿a qué conclusión llega respecto a la producción agrícola en Honduras durante los años 2006 y 2007?_______________________________________________________________________________

_______________________________________________________________________________

Temas

• 2 como prueba deindependencia.

GUÍA DE LABORATORIO

Herramientas a utilizar

1313

Después de efectuar esta prácticade laboratorio, el estudiante serácapaz de:

• Usar Excel en la elaboraciónde tablas de contingenciapara valores observados yesperados.

• Probar hipótesis sobrela independencia de dosvariables por medio de Excel.

Objetivos

Excel en inglés Excel en español

CHITEST(rango actual, rango esperado) PRUEBA.CHI(rango actual, rango esperado)

CHIINV(probabilidad, grados de libertad)

PRUEBA.CHI.INV(probabilidad, grados de libertad)

Autosum Autosuma

56 ESTADÍSTICA. GUÍAS DE LABORATORIO

Problema 1 Con el objetivo de medir el grado de desarrollo de las competencias emprendedoras de los estudiantes de la UNITEC, se realizó una encuesta entre 44 estudiantes del campus Tegucigalpa durante el mes de marzo de 2008. Se midieron nueve competencias emprendedoras por medio de una escala descendente, diseñada para que el inciso a) mostrara un desarrollo pleno de la competencia en cuestión, mientras que el paréntesis e) señalara una deficiencia considerable. El estudiante debía seleccionar el inciso que mejor lo describiera. A continuación se resumen los resultados de acuerdo con la carrera que cursan los estudiantes.

Se obtuvieron 377 respuestas de 396 posibles. Se desea saber si existe una relación entre la carrera que se cursa y el desarrollo de las competencias emprendedoras.

Las hipótesis son:

H0: La carrera que cursa el estudiante y el desarrollo de sus competencias emprendedoras son independientes.

H1: La carrera que cursa el estudiante y el desarrollo de sus competencias emprendedoras son depen-dientes.

Se tomará = 0.05.

Paso 1 Introduzca en Excel la tabla 3 × 5 que se muestra en la imagen anterior. Los totales por filas y columnas se dan en la fila 5 y la columna G, respectivamente. Puede corroborar estos totales haciendo uso de la herramienta (Autosuma).

Paso 2 Construya una tabla de valores esperados. Sólo será necesario teclear la fórmula en la primera casilla de la tabla para que Excel llene los demás recuadros. El valor esperado para el valor observado 41 (en la celda B2) es:

fe108 102

33729 22

( ).

Es decir, G2*B5/G5. Para que no sea necesario escribir una fórmula para cada una de las casillas restantes, teclee la fórmula =$G2*B$5/$G$5 en la celda J2, como se muestra en la siguiente imagen:

GUÍA DE LABORATORIO 13 57

Al presionar Enter aparecerá el número 29.2202. Para generar los demás valores esperados, haga clic en la celda J2 y luego, empezando por la esquina inferior derecha, arrastre el mouse hasta la celda N2.

Al hacer esto, todos los valores esperados para la primera fila se formarán. Los valores esperados restantes se obtienen arrastrando el mouse (siempre desde la esquina inferior derecha) hasta la celda N4.

Agregue las sumas de las filas y columnas para comprobar que coinciden con los incluidos de la tabla de los valores observados.

Paso 3 Construya la siguiente tabla.

58 ESTADÍSTICA. GUÍAS DE LABORATORIO

Dado que la tabla de contingencias es de tamaño 3 × 5, los grados de libertad son: v = 2(4) = 8.En la celda R1 introduzca la fórmula

=PRUEBA.CHI(B2:F4,J2:N4)

Con lo anterior, el valor P aparecerá. Este número representa el área a la derecha del estadístico 2.Si P < , se rechaza la hipótesis nula (y las variables son dependientes). En cambio, si P > , la hipótesis nula no se rechaza y no habría evidencia de dependencia entre las variables.

También se puede llegar a la conclusión comparando el valor crítico con el valor de prueba. En la celda R4 introduzca la fórmula:

=PRUEBA.CHI.INV(R2,R3)

y se generará el valor crítico. En la celda R5 introduzca la fórmula

= PRUEBA.CHI.INV(R1,R3)

y se obtendrá el estadístico 2 de prueba. Al compararla con el valor crítico, se corroborará si la hipótesis nula se rechaza o no.

Pregunta 1. ¿Existe una relación entre la carrera que se cursa y el desarrollo de las competencias emprendedoras?

_______________________________________________________________________________

_______________________________________________________________________________

Problema 2 La siguiente tabla de contingencias muestra los resultados de la encuesta realizada por la Universidad Tecnológica Centroamericana, en junio de 2008, a 50 empresas familiares de Tegucigalpa.

1a. Generación 2a. Generación 3a. Generación

Hombres 59 41 10

Mujeres 27 37 12

Preguntas 1. ¿Existe una relación entre el género de los empleados que trabajan para estas empresas y la antigüedad del negocio? Plantee las hipótesis apropiadas y pruébelas usando Excel. Tome = 0.05.

2. Si existiera una relación, establézcala y explíquela._______________________________________________________________________________

_______________________________________________________________________________

Temas

• Análisis de varianza.

GUÍA DE LABORATORIO

Herramientas a utilizar

1414

Después de efectuar esta prácticade laboratorio, el estudiante serácapaz de:

• Usar Excel en el análisis devarianza de un factor.

Objetivos

Excel en inglés Excel en español

ANOVA: Single factor. Análisis de varianza de un factor.

Problema 1 Por su naturaleza, las empresas familiares tienen dificultades administrativas que conducen a conflictos entre los diferentes miembros de la familia. Para estas empresas es difícil equilibrar los intereses familiares, inversionistas y administrativos.

La encuesta realizada por la Universidad Tecnológica Centroamericana en junio de 2008 a 50 empresas (42 de ellas calificadas como familiares), contenía la pregunta: ¿entran los familiares frecuentemente en conflicto y están en desacuerdo sobre las decisiones administrativas? La respuesta se daba en una escala de Likert del uno al siete, siendo este último el valor asignado a la opinión Totalmente de acuerdo.

60 ESTADÍSTICA. GUÍAS DE LABORATORIO

Generación 1 Generación 2 Generación 3

3 1 43 2 51 1 73 5 11 3 33 12 12 11 14 12 54 64 12 12 42 12 22 1

1

¿Tienen las empresas familiares la misma cantidad de conflictos, independientemente de la generación que las administre?

Con un nivel de significancia de = 0.05, probaremos las hipótesis:

H0: 1 = 2 = 3

H1: 1, 2, 3 no son todas iguales.

Introduzca los datos en una hoja de Excel, en las columnas A, B y C. Haga clic en la etiqueta Datos y luego en Análisis de Datos. Al desplegarse el cuadro de diálogo, seleccione Análisis de varianza de un factor. Haga clic en Aceptar. Cuando aparezca el cuadro de diálogo, llénelo de la siguiente forma:

Al hacer clic en Aceptar Excel generará la siguiente salida:

A continuación se presentan los resultados clasificados de acuerdo con las generaciones que participan en la administración de la empresa.

GUÍA DE LABORATORIO 14 61

Se puede llegar a la conclusión de dos formas:

1. Comparando el valor P (llamado Probabilidad en la tabla) con .

2. Comparando el valor F con el Valor crítico para F.

Paso 2 Concluya y explique las razones que provocan el problema._______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

Problema 2 En la misma encuesta del problema 1 se hizo la pregunta: ¿la empresa emplea consultores externos, consejeros y servicios profesionales? Ocho de las 50 empresas encuestadas se calificaron a sí mismas como No familiares. Estos negocios contestaron la pregunta en cuestión, por lo que los resultados se clasificaron en esta ocasión en cuatro grupos como se ve en la siguiente tabla.

Generación 1 Generación 2 Generación 3 No familiar

5 3 7 12 6 7 11 5 1 55 1 5 55 1 2 52 1 71 6 31 6 36 46 11 16 41 72 11 61 64 73 2

7

Pregunta ¿Son las actitudes de los cuatro grupos similares respecto a la asesoría externa? Explique las posibles razones de su conclusión._______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

Temas

• Regresión lineal simple.

GUÍA DE LABORATORIO1515

Después de efectuar esta prácticade laboratorio, el estudiante serácapaz de:

• Usar Excel para encontrarla gráfica y la ecuación de larecta de regresión para dosvariables x y y.

• Determinar los coeficientesde determinación ycorrelación, así como loserrores se y sb, por mediode Excel.

Objetivos

Problema 1 Se analiza los flujos de caja para un proyecto de inversión, el cual consiste en la construcción de una residencia para estudiantes universitarios. Se consideran diferentes rentas posibles, que originan distintas Tasas Internas de Retorno (TIR) para el proyecto. La siguiente tabla ilustra la situación.

Renta TIR

$150 19

$160 20

$170 22

$180 24

$190 26

$200 27

$250 36

Pregunta ¿Podrá una recta describir bien la variación de la TIR?_______________________________________________________________________________

_______________________________________________________________________________

GUÍA DE LABORATORIO 15 63

Paso 1 Introduzca los valores para las variables Renta (x) y TIR (y) en una hoja de Excel. Luego, seleccione los datos (sin los rótulos) y haga clic en la pestaña Insertar para después hacerlo en Dispersión. Enel menú, seleccione Dispersión sólo con marcadores.

Cuando aparezca el gráfico, pulse el botón secundario del mouse sobre un punto cualquiera.

En el menú seleccione Agregar línea de tendencia para desplegar un cuadro de diálogo, el cual llenará así:

64 ESTADÍSTICA. GUÍAS DE LABORATORIO

Con la indicación anterior se generará el siguiente gráfico:

Preguntas 1. ¿Cuál es el aumento de la TIR por cada dólar de aumento en la renta? ¿y por cada $10.00 de aumento?_______________________________________________________________________________

_______________________________________________________________________________

2. ¿La recta de regresión es un buen modelo para describir la variación de la TIR? ¿Por qué?_______________________________________________________________________________

_______________________________________________________________________________

3. ¿Cuál es la TIR del proyecto cuando la renta a cobrar es de $230.00?_______________________________________________________________________________

_______________________________________________________________________________

Paso 2 Mejore el gráfico. Dé clic sobre él para que aparezca la pestaña Herramientas de gráficos en la parte superior de la pantalla. En la pestaña Diseño puede cambiar el aspecto de los puntos. En la pestaña Presentación, puede agregarle un título, así como nombre a los ejes. En Formato puede cambiar el color del fondo del gráfico, así como también el de la recta de tendencia. Un ejemplo del gráfico mejorado se ve a continuación.

Paso 3 Determine los errores se y sb. En la pestaña Datos haga clic en Análisis de datos. Al desplegarse el cuadro de diálogo seleccione Regresión.

GUÍA DE LABORATORIO 15 65

Llene el cuadro de diálogo así:

Al pulsar el botón Aceptar, la salida de Excel contendrá los errores buscados.

Puede observarse que se = 0.339436874 (amarillo) y sb = 0.004187252 (azul). Además, los valores de a y b pueden verse en la columna Coeficientes (verde). Los límites del intervalo de confianza de 95% para b están encerrados en rojo.

Nota: Excel, en su versión en español, tiene un error de traducción en la tabla anterior. En lugar de Valor crítico de F debe leerse Valor P de F.

Problema 2 El comportamiento del Índice de Precios al Consumidor (IPC) durante los años 2003 al 2007 en Honduras, se ilustra en la siguiente tabla (diciembre 1999=100).

Año 2003 2004 2005 2006 2007

Tipc 138.3 151 162.7 171.3 186.5

Fuente: Honduras en cifras, 2003–2007.

Paso 1 Use Excel para generar el gráfico de la recta de regresión para estos datos.

66 ESTADÍSTICA. GUÍAS DE LABORATORIO

Preguntas 1. ¿Cuál es su ecuación?_______________________________________________________________________________

_______________________________________________________________________________

2. ¿Cuánto aumenta el IPC por cada año que pasa?_______________________________________________________________________________

_______________________________________________________________________________

3. Determine el coeficiente de determinación e interprételo._______________________________________________________________________________

_______________________________________________________________________________

4. Pronostique el IPC para 2008._______________________________________________________________________________

_______________________________________________________________________________

5. Determine los errores se y sb._______________________________________________________________________________

_______________________________________________________________________________

Problema 3 La siguiente tabla muestra el comportamiento del consumo de agua potable (en miles de metros cúbicos) y el crecimiento de la población en Tegucigalpa, Honduras, desde el año 2003 al 2007.

Paso 1 Use Excel para generar un gráfico del modelo de regresión lineal, así como el valor r2 y la ecuación de la recta para cada pareja de variables. Indique en cada caso si el modelo de regresión es explicativo de la variación de y.

1. Año (x) y Población (y). ________________________________________________________________________________________________________________

2. Año (x) y Consumo (y). _________________________________________________________________________________________________________________

3. Población (x) y Consumo (y). ________________________________________________________________________________________________________

Año 2003 2004 2005 2006 2007

Población (miles) 858.4 879.2 900.4 922.2 944.4

Consumo 50,566 46,691 46,451 48,113 49,113

Fuente: Honduras en cifras, 2003-2007.

Temas

• Regresión múltiple.

GUÍA DE LABORATORIO1616

Después de efectuar esta prácticade laboratorio, el estudiante serácapaz de:

• Usar Excel para determinarla ecuación de regresiónque mejor se ajuste a datoscon múltiples variablesindependientes.

• Usar Excel para determinar sila regresión como un todo essignificativa.

• Usar Excel para determinarqué variables explicativas sonsignificativas.

• Usar Excel para obtenerintervalos de confianza parala pendiente poblacional Bi.

Objetivos

Problema 1 La calificación final en un curso universitario de matemáticas básicas podría verse afectada por las siguientes variables:

x1: El número de días que el estudiante faltó a clase.

x2: La calificación obtenida por el estudiante en el examen del I Parcial.

x3: La asistencia a un curso nivelatorio previo.

x4: El estudiante repite la clase.

Las variables x3 y x4 se han codificado de la siguiente manera:

x3 = 1 si el estudiante asistió al curso de regularización y 0 de otra manera.

x4 = 1 si el estudiante repite la clase y 0 de otra manera.

68 ESTADÍSTICA. GUÍAS DE LABORATORIO

Calificaciónfinal

yInasistencias

x1

Calificación del I Parcial

x2

Asistencia al curso regularización

x3

Repitela clase

x4

18 8 5 0 075 6 68 1 053 6 38 1 191 0 72 1 068 0 43 0 025 6 7 0 041 3 20 1 163 0 45 1 1

Determine un modelo de regresión lineal para la calificación final del curso básico de matemáticas usando Excel.

Paso 1 Traslade los datos a una hoja de Excel.

Paso 2 Haga clic en la pestaña Datos, luego en Análisis de datos y elija Regresión para llenar el cuadro de diálogo emergente de la siguiente manera:

Se tomó una muestra de 8 estudiantes que llevaron esta clase y los resultados fueron los siguientes:

GUÍA DE LABORATORIO 16 69

Al hacer clic en el botón Aceptar, Excel generará la siguiente tabla:

Paso 3 Determine la ecuación de regresión Y = a + b1 X1 + b2X2 + b3X3 + b4X4 basándose en los coeficientes (en verde) generados por Excel.

_______________________________________________________________________________

Paso 4 Interprete ahora cada coeficiente.

• Intercepto a = 28.27. Cuando el número de días de inasistencia a clase es 0, la calificación del I Parcial es 0, El estudiante no asistió al curso nivelatorio (valor 0) y además cursó la clase por primera vez (valor 0), entonces la calificación final sería 28.27%.

• Pendiente b1 = 1.64. Por cada día que no se asiste a clase, la calificación final baja en 1.64 en puntos porcentuales.

• Pendiente b2 = 0.89. __________________________________________________________

________________________________________________________________________

• Pendiente b3 = 2.97. Si la variable toma el valor 1 (el estudiante asistió al curso nivelatorio), entonces la calificación final disminuye 2.97%.

• Pendiente b4 = 1.25. ___________________________________________________________

________________________________________________________________________

Paso 5 Pruebe el modelo de regresión como un todo.El coeficiente de determinación R2 (en rojo) está muy cercano a 1. Sin embargo, la prueba F

indicará si en realidad x1, x2, x3 y x4 tomadas en conjunto, explican significativamente la variabilidad de y. Las hipótesis son:

H0: B1 = B2 = B3 = B4 = 0 y no depende de x1, x2, x3 y x4.

H1: B1, B2, B3, B4 no son todas cero. y depende de al menos una xi.

Se tomará = 0.05 en esta prueba. El valor de P (amarillo) es considerablemente menor que ,por lo que se rechaza H0. Entonces, hay evidencia de que y depende de al menos una xi. En otras palabras, existe por lo menos una variable explicativa significativa para la calificación final del curso de matemática básica.

Paso 6 Pruebe cada variable independiente.Para cada prueba se tomará un = 0.1, permitiendo una mayor flexibilidad. Consideremos las hipótesis:

H0: B1 = 0 y no depende de x1.

H1: B1 0 y depende de x1.

70 ESTADÍSTICA. GUÍAS DE LABORATORIO

El valor P para esta prueba (en azul) es 0.051, por lo que se rechaza H0. Hay evidencia de que y depende de x1. En otras palabras, el número de días de inasistencia a clase es una variable explicativa significativa de la calificación final del estudiante.

Realice ahora una prueba de hipótesis individual para x2, x3 y x4.

H0: ________

H1: ________

Valor de P = _____

Conclusión: _____________________________________________________________________

H0: ________

H1: ________

Valor de P = _____

Conclusión: _____________________________________________________________________

H0: ________

H1: ________

Valor de P = _____

Conclusión: _____________________________________________________________________

Paso 7 Realice un nuevo modelo de regresión usando únicamente las variables explicativas significativas.En una nueva hoja de Excel pegue la columna Y, así como las columnas de las variables

explicativas significativas y repita el paso 3. La ecuación de regresión debe ser:

y = 28.93 – 1.74x1 + 0.85x2

Note la mejoría ocurrida en el valor de P de la prueba F y en los valores P para las pruebas por variable (marcadas en amarillo y azul respectivamente, en la tabla del paso 2).

Paso 8 Determine intervalos de confianza de 95% para B1 y B2.Los límites inferior y superior para cada intervalo se obtienen de la tabla generada por Excel

(están en color gris en la tabla obtenida en el paso 2). Utilizando los límites generados en el modelo depurado, se tiene que:

2.623237073 < B1 < 0.849008867

___________ < B2 < ____________

Para otros niveles de confianza, basta elegir la casilla Nivel de confianza en el cuadro de diálogo Regresión y luego teclear la confianza deseada (vea el paso 2).