17
Actividad 10 – Trabajo Colaborativo 2 100105 – Estadística Descriptiva Grupo N° 298 1 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA ESTADÍSTICA DESCRIPTIVA Trabajo Colaborativo 2 – Actividad 10 Presentado por: OSCAR JOSÉ RAMÍREZ CARDONA – 79.810.115 VALENTIN ARIZA MARTINEZ – 79.793.251 Tutor MILTON FERNANDO ORTEGON PAVA Noviembre de 2012

TC2_100105_298.pdf

Embed Size (px)

Citation preview

Page 1: TC2_100105_298.pdf

Actividad 10 – Trabajo Colaborativo 2 100105 – Estadística Descriptiva Grupo N° 298

1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA ESTADÍSTICA DESCRIPTIVA

Trabajo Colaborativo 2 – Actividad 10

Presentado por:

OSCAR JOSÉ RAMÍREZ CARDONA – 79.810.115 VALENTIN ARIZA MARTINEZ – 79.793.251

Tutor

MILTON FERNANDO ORTEGON PAVA

Noviembre de 2012

Page 2: TC2_100105_298.pdf

Actividad 10 – Trabajo Colaborativo 2 100105 – Estadística Descriptiva Grupo N° 298

2

Introducción Los datos son la materia prima con que trabaja la estadística, puesto que la estadística se ocupa de una gran cantidad de datos, debe primeramente definir de cuáles datos se va a ocupar. El conjunto de datos de los cuales se ocupa un determinado estudio estadístico se llama población. Los datos de la totalidad de una población pueden obtenerse a través de un censo. Sin embargo, en la mayoría de los casos no es posible obtenerlos por razones de tiempo y dinero, razón por la cual se extrae, de la población, una muestra, mediante un procedimiento llamado muestreo. Se llama muestra a un subconjunto de la población, preferiblemente representativo de la misma.

Page 3: TC2_100105_298.pdf

Actividad 10 – Trabajo Colaborativo 2 100105 – Estadística Descriptiva Grupo N° 298

3

Justificación Dentro de un proceso de investigación existen varias etapas, entre las cuales tenemos los antecedentes históricos, y la recolección previa de la información de los conceptos a estudiar; este material no será bien entendido si no se organiza y se presenta de una manera clara y sencilla, por esto en el primer trabajo nos centramos en la herramienta más conocida de la estadística, las gráficas y tablas. Hay situaciones en las que no bastan las tablas y gráficas, por esto en la estadística existen otras herramientas precisas, como son las medidas estadísticas univariantes y bivariantes; las cuales permiten el estudio de una serie de variables que se involucran en los cálculos matemáticos. Además la estadística necesita de una serie de conceptos y propiedades aritméticas y matemáticas, como es la sumatoria y la productoria. Con el siguiente trabajo queremos mostrar como se aplican estas herramientas en la interpretación de una investigación acerca de un estudio de la población, a partir de una información previa.

Page 4: TC2_100105_298.pdf

Actividad 10 – Trabajo Colaborativo 2 100105 – Estadística Descriptiva Grupo N° 298

4

Objetivos Realizar un muestreo, diseñar un experimento sencillo y recolectar datos de manera

apropiada. Analizar los datos obtenidos de manera descriptiva y formular una interpretación de

los resultados. Interpretarlas medidas de tendencia central y comprender sus aplicaciones. Reconocer que las medidas de dispersión complementan la descripción que

proporcionan las medidas de tendencia central. Interpretar y utilizar las medidas de dispersión. Estimular y promover el trabajo en equipo.

Page 5: TC2_100105_298.pdf

Actividad 10 – Trabajo Colaborativo 2 100105 – Estadística Descriptiva Grupo N° 298

5

1. Realizar un mentefacto conceptual sobre las medidas de dispersión. Estadística Descriptiva Mentefacto. Medidas de Dispersión Proposiciones Supra ordinadas: P1. Las medidas de dispersión son la forma mas acertada de medir la variación respecto a

los promedios en el tratamiento estadístico de los datos. Exclusiones: P2a. Son diferentes a las bivariantes, ya que estas se encargan de comparar variables y

determinar su relación. Isoordinadas: P3a. Permite identificar si los datos se distribuyen uniformemente alrededor del punto

central. P3b. Determina el grado de concentración que presentan los valores en la región central de

la distribución. Infraordinadas: P4a. Diferencia entre el menor y mayor de los valores. P4b. Mide la dispersión de los valores respecto a un valor central. P4c. Medida de dispersión para variables de razón y de intervalos. P4d. Valor porcentual de la desviación estándar. P4e. Valor absoluto de la media aritmética de las desviaciones.

Page 6: TC2_100105_298.pdf

Actividad 10 – Trabajo Colaborativo 2 100105 – Estadística Descriptiva Grupo N° 298

6

2. Las estaturas en centímetros de los socios de un club juvenil de Bogotá, son las siguientes:

153 123 129 132 147 138 137 134 131 147 138 128 134 148 125 139 146 145 148 135 152 128 146 143 138 138 122 146 137 151 145 124 132 138 144 141 137 146 138 146 152 156 160 159 157 168 178 142 113 130

Realizar una tabla de distribución de frecuencias para datos agrupados dado que la variable es estatura (cuantitativa continua), Calcular varianza, desviación estándar y coeficiente de variación. Interprete los resultados.

INTERVALOS DE CLASE FRECUENCIA FRECUENCIA

ACUMULADA 111 - 116 1 1 117 - 122 1 2 123 - 128 5 7 129 - 134 7 14 135 - 140 11 25 141 - 146 11 36 147 - 152 7 43 153 - 158 3 46 159 - 164 2 48 165 - 170 1 49 171 - 176 0 49 177 - 182 1 50

TOTAL 50 Varianza: Teniendo la fórmula

𝑠2 =Σf ∗ 𝑥2

𝑛− �̅�

Page 7: TC2_100105_298.pdf

Actividad 10 – Trabajo Colaborativo 2 100105 – Estadística Descriptiva Grupo N° 298

7

rango FRECUENCIA fi FRECUENCIA ACUMULADA r*f prevarianza r^2*f

111 1 1 111 12.321 117 1 2 117 13.689 123 5 7 615 75.645 129 7 14 903 116.487 135 11 25 1.485 200.475 141 11 36 1.551 218.691 147 7 43 1.029 151.263 153 3 46 459 70.227 159 2 48 318 50.562 165 1 49 165 27.225 171 0 49 0 0 177 1 50 177 31.329

TOTAL 50 6.930 967.914

promedio real 138,6 Σ(𝑟 ∗ 𝑓)𝑛

varianza 148,32

=Σ(𝑟2 ∗ 𝑓)

𝑛− �̅�

desviación 12,17866988 = �Σf ∗ 𝑥2

𝑛− �̅�

coeficiente de variación 9% =𝑠�̅�∗ 100%

3. Un empleado de la empresa de Acueducto de la ciudad de Cartagena, realiza un estudio sobre los reclamos realizados en los 2 últimos años, para ello elige una muestra de 60 personas, con los siguientes resultados:

Nº Reclamaciones 0 1 2 3 4 5 6 7

Nº De usuarios 26 10 8 6 4 3 2 1

Page 8: TC2_100105_298.pdf

Actividad 10 – Trabajo Colaborativo 2 100105 – Estadística Descriptiva Grupo N° 298

8

Calcular: a. El promedio de reclamos. Para calcular el promedio de reclamaciones tomamos la suma de ellas dividido en la cantidad :

= 288

= 3,5

b. La varianza y su deviación típica:

Nº Reclamaciones

Nº De usuarios X² F.X²

0 26 0 0 1 10 1 10 2 8 4 32 3 6 9 54 4 4 16 64 5 3 25 75 6 2 36 72 7 1 49 49

28 60 140 356

𝑆 = �∑𝐹. 𝑥2

𝑛− ²

𝑆 = �35628

− 3,5²

𝑺 = 𝟎,𝟔𝟔𝟔 c. El coeficiente de variación.

𝐶𝐶 =𝑆

. 100%

Page 9: TC2_100105_298.pdf

Actividad 10 – Trabajo Colaborativo 2 100105 – Estadística Descriptiva Grupo N° 298

9

𝐶𝐶 =0,681

3,5. 100%

𝑪𝑪 = 𝟔𝟏,𝟓%

4. En un examen final de Estadística la puntuación media de un grupo de 150 estudiantes fue de 78 y la varianza 64. En álgebra, sin embargo, la media final del grupo fue de 73 y la desviación típica 7,6. En que asignatura hubo mayor: a. Dispersión absoluta

𝑺² = 𝟔𝟔

𝑺 = 𝟔 Se tiene entonces que en Estadística hubo una mayor dispersión absoluta, pues 8 > 7.6 b. Dispersión relativa - Estadística

𝐶𝐶 =𝑆

. 100%

𝐶𝐶 =8

78. 100%

𝐶𝐶 = 10,26%

- Algebra

𝐶𝐶 =7,673

. 100%

𝐶𝐶 = 10,41% En álgebra hubo una mayor dispersión relativa 10,41%>10,26% c. Si el estudiante consiguió 75 en estadística y 71 en álgebra. ¿En qué asignatura fue su puntuación relativa superior?

Page 10: TC2_100105_298.pdf

Actividad 10 – Trabajo Colaborativo 2 100105 – Estadística Descriptiva Grupo N° 298

10

- Estadística

𝑍 =𝑥 − 𝑥𝑥𝑥𝑥‾

𝑍 =75 − 78

8

𝑍 = −0,38

- Algebra

𝑍 =𝑥 − 𝑥𝑥𝑥𝑥‾

𝑍 =71 − 73

7,6

𝑍 = −0,26

-0.26 se encuentra más cera a 0 (la media de la variable estandarizada), se dice que la puntuación relativa del estudiante fue superior en Algebra. 5. Ingresar al blog de Estadística Descriptiva que se encuentra en la página principal del curso en el TOPICO DE CONTENIDOS, posteriormente buscar el LABORATORIO (RERESIÓN Y CORRELACIÓN LINEAL –EXCEL) y realizar el ejercicio número 1 que se encuentra al final del laboratorio. Se requiere estudiar la asociación entre el consumo de sal y tensión arterial. A una serie de voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensión arterial un tiempo después.

x(sal) y(presión) 1,8 100 2,2 98 3,5 105 4,0 110 4,3 112 5,0 120

Page 11: TC2_100105_298.pdf

Actividad 10 – Trabajo Colaborativo 2 100105 – Estadística Descriptiva Grupo N° 298

11

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre

la otra. Es confiable? El modelo matemático es: 𝑦 = 6,3137𝑥 + 85,612 si es confiable, pues se comprobó con uno de los puntos que están sobre la línea de tendencia y su resultado es el que se encuentra en la tabla. c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos

variables.

El grado de relación de las dos variables es de 91,65%, lo cual nos indica una buena estimación entre ambas. d. Si a una paciente se le administra una dosis de sal de 6,5. ¿Cuál es la tensión arterial

esperada? Para hallar la tensión esperada, usaremos la ecuación: 𝑦 = 6,3137𝑥 + 85,612 en la que remplazaremos el valor de x por 6,2, lo que nos daría una presión esperada de 126,65, veamos:

𝑦 = 6,3137(6,2) + 85,612 = 126,65

y = 6,3137x + 85,612 R² = 0,9165

0

20

40

60

80

100

120

140

0,0 1,0 2,0 3,0 4,0 5,0 6,0

pres

ión

sal

Diagrama de Dispersión

Page 12: TC2_100105_298.pdf

Actividad 10 – Trabajo Colaborativo 2 100105 – Estadística Descriptiva Grupo N° 298

12

6. A continuación Se presentan las ventas nacionales de móviles nuevos de 1992 a 2004 en la siguiente tabla. Obtenga un índice simple para las ventas nacionales utilizando una base variable: Teniendo en cuenta que:

𝐼 =𝑋𝑡𝑋𝑡−1

∗ 100%

Donde: I= Índice t-1 = Periodo base t = Periodo que se analizará Xt = Valor del periodo que se investiga Xt-1=Valor del periodo base Analizaremos el comportamiento de las ventas respecto al año anterior.

AÑO VENTAS (MILLONES) ÍNDICE ANÁLISIS

1992 8,8

1993 9,7 𝐼 =9,78,8

∗ 100% = 110% Hubo aumento del 10%

1994 7,3 𝐼 =7,39,7

∗ 100% = 72% Disminución del 28%

1995 6,7 𝐼 =6,77,3

∗ 100% = 91% Disminución del 9%

1996 8,5 𝐼 =8,56,7

∗ 100% = 126% Hubo aumento del 26%

1997 9,2 𝐼 =9,28,5

∗ 100% = 108% Hubo aumento del 8%

1998 9,2 𝐼 =9,29,2

∗ 100% = 100% Las ventas se

mantuvieron estables

1999 8,4 𝐼 =8,49,2

∗ 100% = 91% Disminución del 9%

2000 6,4 𝐼 =6,48,4

∗ 100% = 76% Disminución del 24%

2001 6,2 𝐼 =6,26,4

∗ 100% = 96% Disminución del 4%

Page 13: TC2_100105_298.pdf

Actividad 10 – Trabajo Colaborativo 2 100105 – Estadística Descriptiva Grupo N° 298

13

2002 5,0 𝐼 =5,06,2

∗ 100% = 80% Disminución del 20%

2003 6,7 𝐼 =6,75,0

∗ 100% = 134% Hubo aumento del 34%

2004 7,6 𝐼 =7,66,7

∗ 100% = 113% Hubo aumento del 13%

II-ACTIVIDAD DE INVESTIGACIÓN Realizar un recorrido a través de los resultados del Censo General 2005, ingresando a la página Web del DANE Posteriormente ingresar teniendo en cuenta la siguiente ruta: Información Dane / sociales / calidad de vida / Encuesta nacional de calidad de vida-2011>>presentación resultados generales 2011. ACTIVIDAD A REALIZAR: En este segundo trabajo colaborativo, deberán escoger previo acuerdo entre los integrantes del grupo, una tabla de distribución de frecuencias que presente una variable cuantitativa para la cuales se pide Calcular:

Page 14: TC2_100105_298.pdf

Actividad 10 – Trabajo Colaborativo 2 100105 – Estadística Descriptiva Grupo N° 298

14

• Media o Promedio aritmético. • Medidas de dispersión.

Teniendo en cuenta las fórmulas

promedio real Σ(𝑟 ∗ 𝑓)𝑛

varianza

=Σ(𝑟2 ∗ 𝑓)

𝑛− �̅�

desviación = �Σf ∗ 𝑥2

𝑛− �̅�

coeficiente de variación =𝑠�̅�∗ 100%

Calculamos:

2010

RANGO FRECUENCIA FRECUENCIA ACUMULADA r*f Pre varianza

r^2*f 5 5.931.000 5.931.000 29.655.000 148.275.000

12 3.390.000 9.321.000 40.680.000 488.160.000 16 1.389.000 10.710.000 22.224.000 355.584.000 18 1.885.000 12.595.000 33.930.000 610.740.000 26 910.000 13.505.000 23.660.000 615.160.000

TOTAL 13.505.000 150.149.000 2.217.919.000

promedio real 11,12

varianza 40,62

desviación media 6,37

coeficiente de variación 57%

Page 15: TC2_100105_298.pdf

Actividad 10 – Trabajo Colaborativo 2 100105 – Estadística Descriptiva Grupo N° 298

15

2011

RANGO FRECUENCIA FRECUENCIA ACUMULADA r*f Pre varianza

r^2*f 5 5.902.000 5.902.000 29.510.000 147.550.000

12 3.257.000 9.159.000 39.084.000 469.008.000 16 1.393.000 10.552.000 22.288.000 356.608.000 18 1.793.000 12.345.000 32.274.000 580.932.000 26 939.000 13.284.000 24.414.000 634.764.000

TOTAL 13.284.000 147.570.000 2.188.862.000

promedio real 11,11

varianza 41,37

desviación media 6,43

coeficiente de variación 58%

Interpretar los resultados obtenidos Después se calcular las medidas de variación estándar de los dos años analizados se puede observar que ambos tienen un comportamiento muy similar, presentando un mínimo aumento en el 2011.

Page 16: TC2_100105_298.pdf

Actividad 10 – Trabajo Colaborativo 2 100105 – Estadística Descriptiva Grupo N° 298

16

Conclusiones La estadística es la ciencia que le facilita al hombre el estudio de datos masivos, pasa de esa manera a obtener conclusiones valederas y efectuar predicciones razonables de ellos; mostrando así una visión de conjunto clara y de más fácil apreciación, tanto para describirlos como para compararlos. Las herramientas de la estadística descriptiva, permiten entender y comprender de una manera clara, veraz, ágil y sencilla la información recopilada dentro de una investigación, ya sea previa o el resultado de un trabajo de campo, dichas herramientas están relacionadas con una serie de operaciones matemáticas que conllevan a conocer una serie de conceptos que permiten clasificar y destacar elementos relevantes del proceso investigativo.

Page 17: TC2_100105_298.pdf

Actividad 10 – Trabajo Colaborativo 2 100105 – Estadística Descriptiva Grupo N° 298

17

Referencias Encuesta Nacional de calidad de vida DANE 2011 Naranjo, Fernando (2011): “Varianza y Desviación Estándar”, disponible en: http://www.

youtube.com/watch?v=xZ3ho9gPHCo&feature=related (visitada el 30.10.2012) Ortegón Pava, Milton Fernando (2010): Contenido Didáctico del curso 100105 – Estadística

Descriptiva. Ibagué