12
ESTA Estadística descriptiva Se registró en la siguiente ta consultorio médico: G (gripe), F (fie aparecen a continuación: G F E E F E G G O E G G F F F F O E ¿Qué conclusiones se pueden obten Ahora obsérvense los siguientes grá La estadística descriptiva es una té Algunos conceptos estadísticos: POBLACIÓN: Es el conjunto de elem 0 2 4 6 8 10 12 Gripe Fiebre Otitis 1 5, 17% 6, 20% 8, 27% ADÍSTICA Y PROBABILIDAD 6TOD abla la enfermedad por la que consultaron ebre), O (otitis) y E (malestar estomacal). O E G E G G G O O O G G O ner a partir de la tabla? áficos: écnica para la organización, resumen y anál mentos que son objeto de un estudio estad Estomacal 11, 36% Gripe Fiebre Otitis Estomacal ¿Representan ambas l información? ¿Cuál de gráficas es más senci interpretar? ¿Representan las gráf misma información qu aparece en la tabla? ¿ extrae mejor la infor a partir de la tabla o alguna de las gráficas 1 30 niños en un Observar los datos que lisis de información dístico. la misma e las illa de ficas la ue ¿Cómo se rmación, de s?

ESTADÍSTICA Y PROBABILIDAD 6TOD 2016

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: ESTADÍSTICA Y PROBABILIDAD 6TOD 2016

ESTADÍSTICA Y PROBABILIDAD 6TOD

Estadística descriptiva

Se registró en la siguiente tabla la enfermedad por la que consultaron 30 niños en un consultorio médico: G (gripe), F (fiebre), O (otitis) y E (malestar estomacal). Observar los datos que aparecen a continuación:

G F E E F E G G O E G G F F F F O E

¿Qué conclusiones se pueden obtener a partir de la tabla?

Ahora obsérvense los siguientes gráficos:

La estadística descriptiva es una técnica para la organización, resumen y análisis de información

Algunos conceptos estadísticos: POBLACIÓN: Es el conjunto de elementos que son objeto de un estudio estadístico.

0

2

4

6

8

10

12

Gripe Fiebre Otitis

11, 36%

5, 17%

6, 20%

8, 27%

ESTADÍSTICA Y PROBABILIDAD 6TOD

Se registró en la siguiente tabla la enfermedad por la que consultaron 30 niños en un consultorio médico: G (gripe), F (fiebre), O (otitis) y E (malestar estomacal). Observar los datos que

E G E G G G O O O G G O

¿Qué conclusiones se pueden obtener a partir de la tabla?

Ahora obsérvense los siguientes gráficos:

es una técnica para la organización, resumen y análisis de información

POBLACIÓN: Es el conjunto de elementos que son objeto de un estudio estadístico.

Estomacal

11, 36%Gripe

Fiebre

Otitis

Estomacal

¿Representan ambas la misma información? ¿Cuál de las gráficas es más sencilla de interpretar?

¿Representan las gráficas la misma información que aparece en la tabla? ¿Cómo se extrae mejor la información, a partir de la tabla o de alguna de las gráficas?

1

Se registró en la siguiente tabla la enfermedad por la que consultaron 30 niños en un consultorio médico: G (gripe), F (fiebre), O (otitis) y E (malestar estomacal). Observar los datos que

es una técnica para la organización, resumen y análisis de información

POBLACIÓN: Es el conjunto de elementos que son objeto de un estudio estadístico.

¿Representan ambas la misma ¿Cuál de las

gráficas es más sencilla de

¿Representan las gráficas la misma información que

¿Cómo se extrae mejor la información, a partir de la tabla o de alguna de las gráficas?

Page 2: ESTADÍSTICA Y PROBABILIDAD 6TOD 2016

2

MUESTRA: Es un subconjunto, extraído de la población con el objeto de estudiarlo para inferir características de toda la población. Para que el estudio estadístico sea fiable, la muestra ha de ser representativa del total de la población Cuanto mayor sea el tamaño de la muestra, mayor será también su fiabilidad. Hay dos tipos de estadísticas: ESTADÍSTICA DESCRIPTIVA Y ESTADÍSTICA INFERENCIAL. La primera estudia toda la población e intenta describir la característica que se estudia. La segunda trabaja con una muestra y luego infiere la característica a toda la población. INDIVIDUO: Es cada uno de los elementos de una población. VARIABLE o CARÁCTER: Es la cualidad que se estudia en los individuos de la población. MODALIDAD: Son los distintos valores que puede tomar la variable. La variable puede ser: CUALITATIVA si sus modalidades no son numéricas, o CUANTITATIVA si sus modalidades son numéricas. La variable cuantitativa puede ser: DISCRETA si sólo puede tomar valores aislados, o CONTÍNUA si puede tomar todos los valores de un intervalo. La variable cualitativa puede ser: NOMINAL cuando no se puede establecer un criterio para ordenar sus valores, u ORDINAL cuando existe un criterio para ordenarlos.

FRECUENCIA ABSOLUTA: Es el número de individuos correspondiente a cada valor de la variable o a cada intervalo. También se le llama simplemente frecuencia.

FRECUENCIA RELATIVA: Es el cociente entre la frecuencia absoluta y el número total de individuos (tanto por uno del total). También puede expresarse en tantos por ciento.

EJERCICIO 1:

Busca en la matriz de datos los correspondientes al número de personas por hogar y completa con ellas la siguiente tabla de distribución de estadística:

VARIABLE ESTADÍSTICA CUANTITATIVA

CONTINUA

DISCRETA

CUALITATIVA

NOMINAL

ORDINAL

Page 3: ESTADÍSTICA Y PROBABILIDAD 6TOD 2016

3

xi fi fri

Realiza con estos datos un gráfico de barras y un diagrama circular.

Las tablas y gráficas son ideales para efectuar el estudio de cada distribución por separado, o para comparar algunas de ellas siempre que sean pocas. Pero a veces es necesario comparar varias tablas y no es tan cómodo hacerlo. Para sintetizar la información dada por una tabla, están los parámetros estadísticos.

Primero vamos a estudiar las llamados MEDIDAS DE CENTRALIZACIÓN.

MEDIA:

Casi siempre, el valor idóneo para representar una colección de datos numéricos es la media aritmética o promedio.

Veamos un ejemplo:

Las edades de un grupo de alumnos de un curso nocturno son: 17 17 18 18 18 19 19 19 22 22 22 22 27

Realicemos con ellos una tabla de distribución estadística:

xi fi fa

MEDIANA:

Teniendo los datos ordenados, la mediana Me es el valor que está en medio, es decir que tiene tantos individuos por debajo como por encima de él.

Si el número de individuos fuera par la mediana se le asigna al valor medio de los dos términos centrales.

La MEDIA se designa con la letra x y se calcula:( )n

fxx ii∑= siendo n el número total de in

dividuos de la población (es decir la suma de todas las frecuencias).

Halla la media de la distribución dada.

Page 4: ESTADÍSTICA Y PROBABILIDAD 6TOD 2016

Para ello es muy cómodo tener lo que llamamos las frecuencias acumuladas, que vas a completar en la última columna de la tabla sumando para cada x

Halla Me en la distribución anterior

MODA:

Se llama moda Mo al valor con mayor frecuencia.

Es fácil hallar la moda en la distribución anterior, hazlo.

EJEMPLO

Las dos distribuciones de notas corresponden a las calificaciones obtenidas por los alumnos de dos clases en un examen final donde las calificaciones son del 1 al 10.

Ambas tienen la misma media ( 5x =bastantes parecidas, poco extremas, en cambio la segunda tiene muchos 1 y 10 y pocas notas intermedias. En el segundo caso las notas son dispersas.

Vamos a estudiar ahora parámetros que sirven para medir la medir cómo de separados de la media están los datos.

x f

1 0

2 0

3 0

4 12

5 13

6 5

7 2

8 1

9 0

10 0

33

Para ello es muy cómodo tener lo que llamamos las frecuencias acumuladas, que vas a completar en la última columna de la tabla sumando para cada xi su frecuencia con todas las anteriores.

en la distribución anterior

al valor con mayor frecuencia.

Es fácil hallar la moda en la distribución anterior, hazlo.

Las dos distribuciones de notas corresponden a las calificaciones obtenidas por los alumnos de dos s en un examen final donde las calificaciones son del 1 al 10.

5 ). Sin embargo son muy diferentes. La primera tiene notas bastantes parecidas, poco extremas, en cambio la segunda tiene muchos 1 y 10 y pocas notas intermedias. En el segundo caso las notas son muy dispersas, mientras que las primeras son

Vamos a estudiar ahora parámetros que sirven para medir la dispersión. En todos ellos la idea clave es medir cómo de separados de la media están los datos.

x f

1 7

2 6

3 5

4 0

5 2

6 0

7 2

8 0

9 3

10 8

33

4

Para ello es muy cómodo tener lo que llamamos las frecuencias acumuladas, que vas a completar en su frecuencia con todas las anteriores.

Las dos distribuciones de notas corresponden a las calificaciones obtenidas por los alumnos de dos

). Sin embargo son muy diferentes. La primera tiene notas bastantes parecidas, poco extremas, en cambio la segunda tiene muchos 1 y 10 y pocas notas

, mientras que las primeras son poco

todos ellos la idea clave es

Page 5: ESTADÍSTICA Y PROBABILIDAD 6TOD 2016

5

MEDIDA DE DISPERSIÓN:

DESVIACIÓN TÍPICA:

La desviación típica o desviación standard (S) es otra medida de dispersión mucho más usada en estadística, que se calcula haciendo la raíz cuadrada del promedio de los cuadrados de las distancias de los datos a la media.

S=n

f.)xx( i2

i∑ − Se puede demostrar que : S=

2i2

i xn

f.x−∑

Halla la desviación típica para cada uno de los ejemplos anteriores.

PROBLEMA:

El señor Marco Piretti, dueño y principal creativo de la casa de látex más conocida de Italia, está diseñando un nuevo producto, orientado a la mujer moderna: unos estupendos guantes de goma.

Su intención es crear como lo han hecho sus pares de Taiwán, un guante de talle único.

Pero había algo que no convencía del todo a Piretti, y era la gran variedad de estaturas, contexturas y pesos de las mujeres a las que estaban destinados estos guantes. Por esa razón, Piretti decide hacer un relevamiento acerca del ancho de las manos de todas las mujeres que trabajaban en su empresa, que incluía a secretarias, operarias, administrativas y ejecutivas. Los resultados expresados en cm son los siguientes:

6.5 7 7.8 8.8 8.5 6.2 8 7.4 7.6 8 8.4 8.7 10.5 8 9 7.6

Piretti pidió que le presentaran estos resultados en un gráfico que fuera sencilla su visualización.

�Realiza el gráfico para Piretti.

Luego le pareció una buena idea calcular el promedio de los anchos de las manos y hacer un talle único para ese valor.

�¿Cuál es el promedio de esa muestra? Indica su valor en el gráfico anterior.

�¿Cuántas de sus empleadas podrían llegar a usar ese guante? ¿Qué porcentaje del total representan?

�¿Podría suceder que ninguna de las chicas tuviera un ancho de guante igual al promedio? Justifica tu respuesta.

Viendo tan pobre resultado, Piretti se anima pensando en que se podría usar una goma con una elasticidad tal que el guante resultara cómodo para anchos de manos iguales al promedio con 0.5cm de diferencia en más y en menos.

Page 6: ESTADÍSTICA Y PROBABILIDAD 6TOD 2016

6

�De esta manera, ¿Piretti se asegura vender más guantes?

�¿A cuántas mujeres de su empresa le irían bien los guantes del nuevo material? ¿Qué porcentaje representan?

Piretti no quedó muy conforme con el resultado. Más del 40% del supuesto mercado se le estaba “escapando de las manos”.

El necesitaba tener una medida que le permitiera saber cómo se iban agrupando los distintos anchos alrededor del promedio, si la mayor parte de los casos estaban muy alejados respecto al promedio o si se concentraban alrededor de éste. La solución se la dio su administrador, Marco Domenichini.

�¿Qué parámetro le habrá sugerido calcular su administrador? Calcúlalo.

Ahora Piretti baila en una pata. El sueño del guante de talle único

podría hacerse realidad. Fabricaría un tamaño apto para el ancho

de mano promedio, pero de un material con una elasticidad tal,

que el guante fuera adaptable a manos de un centímetro más o

menos anchas del promedio.

�Mirando el gráfico, ¿podés decir cuántas de las empleadas

podrían usar el guante de talle único? ¿Qué porcentaje representan

del total?

�¿Qué porcentaje se quedarían sin poder usar el guante?

EJERCICIO 2 a) Se realizó una encuesta a los 20 trabajadores de una empresa. La pregunta que se les hizo fue: “¿Cuántas veces visitaron al dentista durante el último año?” Y las respuestas fueron:

1 , 5 , 2 , 0 , 1 , 2 , 2 , 3 , 2 , 2 , 7 , 2 , 1 , 2 , 6 , 2 , 4 , 4 , 3 , 3

b) Ahora se le ha preguntado a esas mismas 20 personas acerca de las veces que visitaron al médico en el año, y las respuestas fueron las sgtes:

0 , 1 , 2 , 3 , 1 , 5 , 2 , 1 , 4 , 5 , 1 , 2 , 2 , 2 , 6 , 6 , 2 , 2 , 6 , 5

Halla en cada caso: media, mediana, moda y desviación típica y realiza con esos datos un gráfico de barras y un polígono de frecuencias.

Halla el rango intercuartil.

Interpretación conjunta de la media y la desviación típica.

Veamos que nos dicen los parámetros x y S acerca de una distribución

Page 7: ESTADÍSTICA Y PROBABILIDAD 6TOD 2016

7

Las cuatro gráficas siguientes corresponden a las estaturas de los jugadores de cuatro equipos de baloncesto: A, B, C, D cuyos parámetros vienen dados a continuación. ¿Cuál es la gráfica de cada equipo?

180 195 210 180 195 210 180 195 210 180 195 210

Teniendo en cuenta que la media nos dice donde está el centro de la distribución y la desviación típica nos dice como de alejados de la media, como de dispersos, están los datos.

EJERCICIO 3: (a) Los pesos en kilogramos de 12 integrantes de un equipo deportivo son: 63 76 99 65 63 51 52 95 63 71 65 83

(i) Indica el valor de la moda (ii) Calcula el peso medio, la mediana, la desviación media y la desviación típica (b) Cuando un integrante del equipo se va, el peso medio de los 11 restantes pasa a ser 70 Kg. Halla

el peso del deportista que se ha ido.

Datos agrupados

Si el conjunto de categorías resulta muy grande, es posible reducirlas agrupando los valores en intervalos, que se llaman clases.

En el ejemplo:

Para una muestra de 708 conductores de ómnibus, se registra el número de accidentes en los que ha estado implicado cada uno de ellos durante un período de 4 años. El número mínimo de accidentes es 0 y el máximo es 11. La distribución de frecuencias es:

equipo x S

A 198.5 9.7

B 198.1 3.9

C 193 4.6

D 193.4 8.1

I II III IV

Page 8: ESTADÍSTICA Y PROBABILIDAD 6TOD 2016

8

Marca de clase

La marca de clase es el punto medio de cada intervalo y es el valor que representa al intervalo para el cálculo de parámetros.

EJERCICIO 4

Completa la tabla utilizando la matriz de datos del comienzo del tema:

Estatura Número

Los intervalos te los va a indicar el profesor)

¿Cómo podríamos hacer para representar estos datos en un diagrama?

Utilizaremos una gráfica llamada histograma.

Número de accidentes Frecuencia

0 117 1 157 2 158 3 115 4 78 5 44 6 21 7 7 8 6 9 1 10 3 11 1

Podemos agrupar estos datos, usando por ejemplo 4 clases: 0 a 2, 3 a 5, 6 a 8 y 9 a 11 como sigue:

Número de accidentes

0-2 3-5 6-8 9-11

Page 9: ESTADÍSTICA Y PROBABILIDAD 6TOD 2016

9

Por lo tanto para estudiar la media y la desviación típica formaremos una nueva tabla en la que los valores xi son las marcas de clase de los intervalos correspondientes. Con ella procederemos como con las otras tablas de frecuencias.

El valor que se obtiene para σparayx procediendo de este modo, es muy parecido al que se obtendría si las calculáramos a partir de los datos exactos de todos los individuos. Por eso, cuando el número de individuos es grande, aunque se conozcan cada uno de sus valores, resulta muy conveniente calcular los parámetros a partir de la tabla de datos agrupados.

EJERCICIO 5

Calcula la media y la desviación típica de cada una de las siguientes distribuciones:

a) Tiempo que emplean en ir de su casa al Colegio un grupo de alumnos. Tiempo (minutos) (0,5] (5,10] (10,15] (15,20] (20,25] (25,30]

Número de alumnos 2 11 13 6 3 1

b) Número semanal de horas de estudio de un grupo de alumnos. Número de alumnos (2,7] (7,12] (12,17] (17,22] (22,27]

Número de alumnos 5 11 12 9 3

c) Estatura de los jugadores de un equipo de baloncesto. Estatura (cm) (180,185] (185,190] (190,195] (195,200] (200,205] (205,210]

Número de jugadors 2 4 1 2 3 2

xi fi fi.xi fi.x2

Media: ( )

== ∑

nx.f

x ii

Desviación típica: ( )

=−=σ ∑ 22

ii xnx.f

Page 10: ESTADÍSTICA Y PROBABILIDAD 6TOD 2016

10

EJERCICIO 6: En la siguiente tabla representa la distribución de frecuencias del peso de un cierto número de atletas.

(a) ¿Cuántos atletas están involucrados en el estudio? (b) Completa la tabla. (c) Calcula el peso medio. (d) Indica la clase modal. (e) ¿Cuántos atletas pesan menos de 50 Kg.? (f) ¿Qué porcentaje de atletas pesa entre 50 y 60 Kg? (g) Realiza un histograma para la distribución de frecuencias. Se realiza una selección de individuos para una determinada actividad. Para estar entre los seleccionados se necesita un peso mínimo. Si el 50% de los atletas fueron seleccionados: ¿Cuál fue el peso mínimo exigido?

EJERCICIO 7: En una carrera, el tiempo (en minutos) de 80 competidores se registró en la siguiente tabla:

tiempo fi Marca de clase

fac

20 ≤ t < 25 15 25 ≤ t < 30 33 30 ≤ t < 35 21 35 ≤ t < 40 10 40 ≤ t < 45 1

Halla: media ( x )

Peso en Kg. Frecuencia Frecuencia Acumulada

Frecuencia Relativa

[45,50) 10

[50,55) 15

[55,60) 20

[60,65) 30

[65,70) 10

[70,75] 5

Page 11: ESTADÍSTICA Y PROBABILIDAD 6TOD 2016

11

Grupo modal

Desviación típica

Realiza un histograma.

Realiza una curva de frecuencias acumuladas.

Halla: mediana (percentil 50)

Rango intercuartil

COEFICIENTE DE VARIACIÓN:

En una granja hay conejos y en una cuadra caballos de carrera. Los parámetros estadísticos de los pesos de estas dos poblaciones, referidas a individuos adultos son:

El valor de S de los caballos es muy superior al de los conejos. Sin embargo, es claro que los caballos son más iguales entre sí que los conejos. Es decir, en términos absolutos, las diferencias del peso de los caballos son mayores que la de los conejos, pero en términos relativos, son mucho menores.

En este caso la desviación típica no es una medida adecuada para comparar dispersiones. Por ello, en estos casos definimos el siguiente parámetro estadístico llamado coeficiente de variación:

C.V.= x

S

Al dividir S entre x estamos “relativizando” la dispersión. En el caso de los conejos y caballos:

Conejos: C.V.= 0.4 Caballos: C.V. = 0.08

el C.V. de los caballos es notablemente inferior.

EJERCICIO 8:

El peso de los luchadores de Sumo de un cierto país en unos campeonatos, tiene media 205kg y desviación típica 48kg.

Los mismos parámetros para un equipo de lucha grecorromana son: media 72kg, y desviación típica 11kg.

Compara sus dispersiones mediante el coeficiente de variación.

peso(kg) x S

Conejos 2.5 1

Caballos 250 20

¿Cuál de las dos poblaciones te parece más dispersa?

Page 12: ESTADÍSTICA Y PROBABILIDAD 6TOD 2016

12

EJERCICIO 9:

Se midió el peso en gramos del fruto de una determinada planta, obteniéndose los siguientes datos:

a) Completa la tabla

b) Halla la media de la distribución

c) Si se agregan los datos de cierto número de frutos comprendidos entre los 200 y los 250 gramos, la media cambia a 137 gr.¿El peso de cuántos frutos se agregó a la tabla?

EJERCICIO 10:

En una fábrica de tornillos se mide la longitud (en mm) de algunos de ellos y se obtienen las siguientes medidas: 22, 20, 18, 21, 19, 22, 16, 19, 23, 18, 17, 23, 23, 21, 18, 20, 22, 18, 25, 23, 22, 22, 19, 19, 20, 21, 18, 24, 17, 20.

a) Haz una tabla de frecuencias, la representación gráfica y calcula: media, mediana y desviación típica de las medidas.

b) Se pierde uno de estos tornillos y se sabe que, la nueva media es 20,4483, ¿cuánto mide el tornillos perdido?

c) Haz una nueva tabla agrupando los nuevos valores así: de 16 a 17mm, de 18 a 19, de 20 a 21, de 22 a 23 y de 24 a 25. Calcula la nueva media y desviación típica.

EJERCICIO 11:

Un equipo de basketball en 15 partidos ha anotado los siguientes puntos: 80, 105, 97, 80, 111, 85,

97, 75, 80, 105, 75, 85, 80, 111 y 92.

a) Construye la tabla de frecuencias correspondiente.

b) Calcula: media, mediana, moda y desviación típica.

c) Andrés se equivocó, al mirar los resultados sólo consideró 14 de estos y la media le dió 90,07,

¿cuántos puntos hizo el cuadro en el partido que no consideró Andrés?

Intervalos frecrel frecabs

(0,50] 0,05

(50,100] 224

(100,150] 224

(150,200] 0,25