Upload
others
View
11
Download
0
Embed Size (px)
Citation preview
Colegio Ecológico Paine Profesora Marcia Garrido Vargas Departamento de Matemática Tercer año Medio
Módulo de Aprendizaje de Estadística Descriptiva
Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de
Moda, Mediana y Media Aritmética. Determinar e interpretar el valor de los
indicadores de tendencia central en un conjunto de datos no agrupados y agrupados.
I. Medidas Estadísticas Descriptivas
Si queremos resumir la información de la muestra para poder analizarlos con más precisión
y describir el comportamiento de estos valores en torno a un valor más específico, con el fin
de lograr una comparación precisa de lo que se puede conseguir con tablas y gráficos, se
deberá calcular una serie de datos mediante expresiones llamadas MEDIDAS
ESTADÍSTICAS DESCRIPTIVAS.
Es decir,
Cuando se calculen estos valores a partir de una población se llaman PARÁMETROS y
suelen estar representados con letras griegas (por ejemplo µ y σ), en cambio si es a partir
de una muestra se llaman ESTADÍSTICOS y son representados por letras de nuestro
alfabeto (por ejemplo, x ó s).
Estas medidas estadísticas descriptivas se clasifican en:
a. Medidas de Tendencia Central: Sirven para determinar los valores centrales o medios
de la distribución.
b. Medidas de Dispersión: Indican la variabilidad de los datos.
c. Medidas de Localización: Indican el lugar donde se ubica un valor de la variable dentro
de un conjunto ordenado de valores.
Cada una de estas medidas poseen indicadores descriptivos, que permiten calcularlas con
precisión los cuales trataremos con detalle más adelante.
Pero,
¿De qué tipo deben ser estos valores a calcular?
Como puedes intuir el tipo de variable que utilizaremos para realizar los cálculos de estas
medidas debe ser cuantitativa, pues la cualitativa no permite realizar operaciones
aritméticas.
¿Qué consideraciones debemos tener en cuenta en el procedimiento y resultado de una
medida estadística descriptiva?
Se deben tomar las siguientes consideraciones:
1. Utilizar todas las observaciones, de manera que si varía alguna observación, la medida
considerada debe reflejar esta variación.
Las medidas estadísticas descriptivas corresponden a valores numéricos calculados a
partir de una muestra de una población en estudio que resumen la información
contenida en ella.
2
2. Ser sencilla de calcular.
3. Ser interpretable de forma inmediata y sencilla.
4. Debe definirse de manera objetiva, es decir, dos ó más observadores distintos deben
llegar al mismo resultado numérico para el mismo conjunto de datos.
ACTIVIDAD Nº 1
1. En la siguiente sopa de letras encuentra 7 palabras relacionadas con la página anterior.
2. Completa las siguientes oraciones con las palabras que faltan (Pista: las palabras
encontradas en la sopa, te ayudarán a completar algunas de las oraciones).
a) Las medidas estadísticas__________________ corresponden a valores
___________________ calculados a partir de una __________________ de una población
en estudio que __________________ la información contenida en ella.
b) En las medidas descriptivas se clasifican en: ______________________ , Localización y
________________ Central.
c) Se conoce como ____________________ a la medida descriptiva obtenida de una
población, en cambio si es partir de una muestra se llama________________________.
d) Para calcular las medidas descriptivas es indispensable utilizar los
____________________ descriptivos.
3
A. Medidas De Tendencia Central
Hemos observado a través de la Historia que el hombre se ha desarrollado
gracias al trabajo colaborativo con sus demás pares, con el fin de lograr
satisfacer sus necesidades, y permitir desenvolverse en sociedad. A pesar
que han transcurrido los años, aún lo seguimos observando en nuestros días:
la junta de vecinos, colegios, empresas, etc. Es decir pertenecemos a alguna
identidad o asociación que nos identifica. Sin embargo, si se quiere tratar de
satisfacer o mejorar las necesidades que existen en cada una de estas
asociaciones (mejora en los servicios básicos salud, educación, transporte ó también
aumento de sueldos, condiciones de higiene laboral, etc.), se debe
decidir en conjunto, las posibles soluciones del entorno en el que
se desarrollan. Para eso escogemos a un líder que posee las
características y necesidades de este grupo a la que forma parte,
siendo así el representante que dará a conocer las demandas de su
entidad, como por ejemplo el presidente de la junta de vecinos,
director de un colegio municipal, etc.
Esta similitud ocurre con las muestras: cuando queremos precisar la información que los
datos arrojan, necesitamos que haya un “representante” dentro de este conjunto de valores
que los caracterice, con el fin de resumir e interpretar dicha información. Para esto
necesitaremos de las medidas de tendencia central también llamadas medidas de
centralización que permiten dar una idea general de qué valor sería el más representativo
en magnitud para el conjunto de datos.
En otras palabras diremos que:
Generalmente estos valores se ubican en la parte central del conjunto de datos.
Para lograr calcular estas medidas de tendencia central necesitaremos de indicadores
descriptivos por ser útiles herramientas de cálculos que trabajan con precisión, que
utilizaremos para definir el "centro" de las observaciones o representante en un conjunto de
datos. Estos son: MODA, MEDIANA y MEDIA ARITMÉTICA.
¿Qué está de moda?
Has estudiado los distintos tipos de frecuencia, ahora nos
detendremos nuevamente en la frecuencia absoluta pero para
estudiar uno de los indicadores de tendencia central que se
denomina MODA.
Observa los siguientes datos obtenidos de ocho personas que lanzaron 10 veces un balón de
básquetbol y se contabilizó las veces que encestaron:
2, 3, 3, 4, 4, 4, 5, 5
Las Medidas de Tendencia Central corresponden a los valores que caracterizan a una
muestra e indican la tendencia de los datos a concentrarse en torno a un valor central.
Sabes que…
Generalmente usas el concepto
MODA con el significado de
uso, modo o costumbre que está
en boga durante algún tiempo, o
en determinado país, con
especialidad en los trajes, telas y
adornos, principalmente los
recién introducidos.
4
¿Cuál de los valores tiene mayor frecuencia absoluta?
Es rápido y fácil responder: el valor que tiene mayor frecuencia absoluta es el 4, pues hubo
tres personas que encestaron cuatro veces. De esta manera podemos decir que la MODA de
esta muestra es 4.
Definamos…
Pero, ¿qué sucede si hay dos o más valores que tengan la mayor frecuencia?
Hablaremos de una distribución BIMODAL de los datos cuando encontremos dos modas,
es decir, dos datos que tengan la misma frecuencia absoluta máxima. Una distribución
TRIMODAL de los datos es en la que encontramos tres modas. También podemos hablar
de distribución MULTIMODAL cuando se encuentran dos o más modas.
Ejemplo:
Se realizó el mismo experimento del lanzamiento del balón de básquetbol, pero esta vez
con 13 personas. Los resultados fueron:
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9
En éste caso tenemos tres valores que tienen la frecuencia mayor, por lo tanto:
Mo= 1, 5, 9
Y si todos los valores tienen la misma frecuencia ¿cuál es la moda?
Si TODOS los valores tienen la misma frecuencia diremos que no hay moda.
Por ejemplo:
Ocho personas realizaron el experimento aleatorio de lanzar un balón de básquetbol en diez
oportunidades y contar las veces que encestaban los resultados fueron:
2, 2, 3, 3, 6, 6, 9, 9
Como ves los cuatro valores de la variable tienen la misma frecuencia por lo tanto diremos
que esta colección de datos no tiene moda.
Observación: Se puede hallar la moda para variables cualitativas y cuantitativas.
Como has podido apreciar sólo se ha trabajado con datos no agrupados, es por esto que
ahora estudiarás como obtener el valor de la moda de un conjunto de datos agrupados.
La MODA es el valor que tiene mayor frecuencia absoluta. Se representa por Mo.
5
Cálculo de la moda para conjunto de datos agrupados
Para empezar debes tener conocimiento de ciertos conceptos que describiremos a
continuación:
Clase modal (Ci): Corresponde a la clase que posee mayor frecuencia absoluta.
Límite inferior de la clase modal (Li): Es el menor valor del intervalo de la clase
modal.
Frecuencia absoluta de la clase modal (fi): valor de la frecuencia absoluta del
intervalo al cual pertenece la clase modal.
Frecuencia absoluta inmediatamente inferior a la clase modal (fi – 1):
corresponde a la frecuencia absoluta del intervalo anterior al perteneciente a la clase
modal.
Frecuencia absoluta inmediatamente posterior a la clase modal (fi + 1):
corresponde a la frecuencia absoluta del intervalo siguiente al perteneciente a la
clase modal.
Amplitud de la clase modal (ai): es el valor de la diferencia entre el límite superior
y el límite inferior del intervalo de la clase modal.
Te preguntarás para qué los conceptos, pues bien cada uno de ellos permite obtener un
valor que será reemplazado en la siguiente expresión para obtener la moda de un conjunto
de datos agrupados:
Parece complicado pero realicemos la siguiente actividad:
Se ha realizado una encuesta con el fin de conocer la cantidad de adultos mayores que
viven en un pueblo ubicado en el sur de chile. La Tabla N°1 muestra la cantidad de
personas por intervalo de edad:
Tabla N°1
Edad Cantidad de adultos mayores (fi)
[60, 63[ 5
[63, 66[ 18
[66, 69[ 42
[69, 72[ 27
[72, 75[ 8
Se ha oscurecido la fila que posee la clase modal (intervalo con mayor frecuencia absoluta)
pues es esencial para iniciar el reemplazo de los valores para obtener la moda, y su
amplitud es 3 pues es el valor de la diferencia entre 66 y 69.
𝑴𝒐 = 𝑳𝒊 + 𝒇𝒊 − 𝒇𝒊;𝟏
𝒇𝒊 − 𝒇𝒊;𝟏 + 𝒇𝒊 − 𝒇𝒊:𝟏 ∙ 𝒂𝒊
Límite inferior
de la clase modal
Frecuencia absoluta
de la clase modal
Frecuencia absoluta
inmediatamente inferior
a la clase modal
Frecuencia absoluta
inmediatamente posterior
a la clase modal
6
De acuerdo a esta clase modal obtendremos los valores de los conceptos mencionados
antes, que ya hemos marcado en la tabla y ahora reemplazaremos en la expresión:
= + −
− + − ∙
= +
+ ∙
= +
∙
= +
=
Una vez encontrado el valor podemos decir que la moda de la muestra es 67,846.
Observación: En el caso de un conjunto de datos agrupados, el valor de la moda es un
valor teórico que no necesariamente corresponde a una frecuencia absoluta como en el
caso de los datos no agrupados y que no se sabe si la edad 67,846 es la que más se repite
efectivamente.
ACTIVIDAD N°2
1. Determina la moda del experimento aleatorio cuyo fin era conocer los tipos de
hoteles en la Quinta Región según la cantidad de estrellas que los especialistas les
han asignado. Estos son los datos obtenidos:
3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1,
2, 2, 4, 1.
Respuesta:
2. Se ha aplicado un test de coeficiente intelectual a los empleados de
una fábrica, obteniéndose la siguiente tabla (Tabla N°2) con la
información obtenida.
La moda de este experimento aleatorio es:
Respuesta:
Tabla N°2
Puntaje fi
[38, 44[ 7
[44, 50[ 8
[50, 56[ 15
[56, 62[ 25
[62, 68[ 18
[68, 74[ 9
[74, 80[ 6
7
3. Completa la siguiente oración:
“En un experimento aleatorio sobre el modelo de automóvil preferido, en el cual se
entrevistó a 30 personas la moda obtenida fue “Sedan” esto quiere decir que tal
modelo tuvo la _________________ frecuencia _________________”
Propiedades de la MODA
Cálculo sencillo.
Interpretación muy clara.
Al depender sólo de las frecuencias, puede calcularse para variables cualitativas. Es
por ello el parámetro más utilizado cuando al resumir una población no es posible
realizar otros cálculos, por ejemplo, cuando se enumeran en medios periodísticos las
características más frecuentes de determinado sector social.
Inconvenientes
1. Su valor es independiente de la mayor parte de los datos, lo que la hace muy
sensible a variaciones muestrales. Por otra parte, en variables agrupadas en
intervalos, su valor depende excesivamente del número de intervalos y de su
amplitud.
2. Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos
fuera de la moda, no afectan en modo alguno a su valor.
Ejemplo para 1 y 2:
A continuación se presentan las notas de Lenguaje de un curso de 30 estudiantes,
donde la moda es la nota 4,0.
1,0 - 2,0 - 2,5 - 3,0 - 3,0 - 3,5 - 3,8 - 4,0 - 4,0 - 4,0 - 4,0 - 4,0 - 6,0 - 6,0 - 6,1 - 6,1 -
6,2 - 6,2 - 6,3 - 6,4 - 6,5 - 6,6 - 6,6 - 6,6 - 6,7 - 6,8 - 6,9 - 7,0 - 7,0 - 7,0
Se puede observar que las notas superiores a la moda son 18 y la diferencia con
ésta es notable, sobre 2,0 puntos, pero ésta variación no afecta el valor de este
indicador, además sólo considera 5 datos de los 30 presentados.
3. No siempre se sitúa hacia el centro de la distribución.
Como ejemplo podemos tomar la situación anterior donde se tienen dos valores
centrales 6,0 y 6,1, pero no coinciden con el valor de la moda.
4. Puede haber más de una moda.
Ejemplo: Un grupo de 10 amigos tratan de decidir de qué color será un poleron que
quieren hacer. Tres de ellos lo prefieren negro, otros tres amarillo, tres más rojo y
uno blanco. Se puede apreciar que en definitiva existen 3 modas: negro, rojo y
amarillo, lo que hace difícil la elección.
8
Mediana
Para estudiar los datos arrojados por un experimento aleatorio siempre
los organizamos y los ordenamos, lo que para el estudio de este
indicador de tendencia central es una medida imprescindible.
Para empezar definamos tal indicador:
Según la definición el conjunto de datos menores o iguales que la mediana representarán el
50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del
total de datos de la muestra.
Veamos cómo encontrar el valor de la mediana, primero en datos no agrupados.
Para empezar es importante saber el tamaño de la muestra pues de ella dependerá el
cómo determinar el valor de la mediana.
Pues bien:
Si el tamaño de la muestra es un número impar, el valor de la mediana será el
mismo del dato que se encuentra en el centro, una vez que estos hayan sido
ordenados de menor a mayor, por ejemplo:
Se han seleccionado 9 gatas que han tenido gatitos recientemente para conocer
cuál es la cantidad de hijos que éstas tuvieron, los datos obtenidos ordenados de
menor a mayor fueron los siguientes:
2, 3, 4, 4, 5, 5, 5, 6, 6
Valor del dato central
Como puedes observar el valor del dato central es 5, por lo cual ese es el valor de la
mediana. Por lo tanto = .
Si el tamaño de la muestra es un número par, el valor de la mediana será el
promedio de los dos valores de los datos centrales, una vez que estos hayan sido
ordenados de menor a mayor, por ejemplo:
Se han seleccionado 8 gatas que han tenido gatitos recientemente para conocer
cuál es la cantidad de hijos que éstas tuvieron, los datos obtenidos ordenados de
menor a mayor fueron los siguientes:
2, 3, 4, 4, 5, 5, 6, 6
Valores de los datos centrales
Ahora debemos calcular el promedio de estos valores:
+
=
Por lo tanto = .
La MEDIANA es el valor central de todos los datos cuando éstos están ordenados
de menor a mayor. Se representa por Me.
9
Veamos ahora cómo encontrar el valor de la mediana en datos agrupados.
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la
mitad de la suma de las frecuencias absolutas, es decir debes buscar el intervalo en que
se encuentre la mitad del tamaño de la muestra (
).
Es esencial este intervalo pues a partir de él determinarás los valores de los siguientes
conceptos:
Límite inferior de la clase (intervalo) donde se encuentra la mediana (Li).
Frecuencia absoluta de la clase (intervalo) donde se encuentra la mediana (fi)
Frecuencia acumulada anterior a la clase (intervalo) de la mediana (Fi - 1).
Amplitud de la clase (intervalo) (ai).
Para reemplazarlos en la siguiente expresión, que permite conocer el valor de la mediana de
un experimento aleatorio de datos agrupados:
Lee con atención el siguiente ejemplo:
El entrenador de un equipo de básquetbol decidió medir la altura en centímetros de sus
jugadores y calcular la mediana de éstas, para ello confeccionó la siguiente tabla con los
datos obtenidos:
Tabla N°3
Altura [170, 175[ [175, 180[ [180, 185[ [185, 190[ [190, 195[ [195, 200]
fi 1 3 4 8 5 2
Fi 1 4 8 16 21 23
En la tabla se han marcado los datos necesarios para calcular la mediana que necesita el
entrenador del equipo:
= + (
−
) ∙
= + ( −
) ∙
= + (
) ∙
𝑴𝒆 = 𝑳𝒊 + (
𝑵𝟐 − 𝑭𝒊;𝟏
𝒇𝒊) ∙ 𝒂𝒊
Sabes que la última frecuencia
absoluta acumulada es igual al
tamaño de la muestra (N).
Este es el intervalo donde se encuentra la mediana pues: 𝑁
2=
23
2= 11 .
Su amplitud ai es 5, pues 190 – 185 = 5 y el límite inferior Li es 185.
Fi-1 fi
10
= + ∙
= +
=
Luego la altura mediana de los jugadores de básquetbol es 187,1875 cm.
ACTIVIDAD N°3
1. Hay tres equipos de básquetbol y cada uno ha jugado cinco partidos. Tienes los
resultados de cada equipo de los partidos jugados.
Tabla N°4
Partido 1 Partido 2 Partido 3 Partido 4 Partido 5
Jaguares 67 87 54 99 78
Lobos 85 90 44 80 46
Leones 32 101 65 88 55
Usa la mediana de cada equipo para decidir a qué equipo te unirías.
Respuesta:
2. En una familia se encuestó a sus integrantes menores de 35 años
para saber cuántos de ellos según su edad usaban consola de
videojuegos, los resultados se muestran en la Tabla N°5.
¿Cuál es la edad mediana de este experimento?
Respuesta:
Como puedes haber notado la mediana se puede hallar solo en variables cuantitativas,
pues es difícil establecer, por ejemplo, entre tres colores cuál es el central ya que no se
pueden ordenar.
Propiedades de la Mediana
Es única, sólo existe una mediana para un conjunto de datos.
Su significado es sencillo y fácil de entender.
Su cálculo es rápido y fácil.
Es poco sensible a las fluctuaciones del muestreo.
Desventajas de la Mediana
El hecho de tener que ordenar los datos hace que se disponga de una cantidad de
tiempo directamente proporcional a la cantidad de datos que presente la muestra.
Tabla N°5
Edad fi Fi
[0, 5[ 1
[5, 10[ 1
[10, 15[ 3
[15, 20[ 3
[20, 25[ 4
[25, 30[ 6
[30, 35[ 7
11
Media Aritmética
Es probable que hayas escuchado esta palabra
más de alguna vez en tu diario vivir, pero quizás,
la conoces coloquialmente como promedio o
simplemente media, la que a su vez conllevará a
distintas acepciones. Sin embargo, nosotros nos
importará aquellas que se relacionen con cálculos
matemáticos o estadísticos, por ejemplo, cuando
nos referimos a las temperaturas, cantidad de
precipitaciones caída ó humedad durante el día,
mes, año, etc. Como en cualquiera de estos casos, las magnitudes varían durante esos
períodos por lo que se hace necesario estimar o calcular un promedio de éstas, es decir,
hallar un valor representativo dentro del conjunto de datos.
Consideremos, por ejemplo Isla de Pascua, uno de los lugares menos contaminados de
nuestro país y entre los factores que influyen para que el aire sea limpio, están las
precipitaciones.
La tabla siguiente muestra las precipitaciones caídas durante el año 2010.
Tabla Nº6
Precipitaciones Isla de Pascua
Mes Cantidad (mm)
Enero 1021,8
Febrero 1022,2
Marzo 1019,3
Abril 1022,0
Mayo 1022,8
Junio 1026,9
Julio 1025,8
Agosto 1024,6
Septiembre 1022,2
Octubre 1024,6
Noviembre 1023,4
Diciembre 1025,7
Si queremos determinar de la cantidad promedio de precipitaciones en el primer trimestre
del 2010, es decir, entre los meses de Enero y Abril, debemos hacer lo siguiente:
Tomamos los datos entre los meses mencionados:
1021,8 ; 1022,2 ; 1019,3 ; 1022,0
Los sumamos y luego dividimos por la cantidad de los datos sumados, que en este caso es
4, o sea:
Promedio = 2 8 : 22 2 : 9 3 : 22
4=
4 85 3
4= 1 1
Por lo tanto el promedio de cantidad de precipitaciones caída entre Enero y Abril del 2010
es 1021,3 mm. (El resultado de la media lo aproximamos al primer decimal)
12
Entonces cuando hablamos de promedio, nos estamos refiriendo a la MEDIA
ARITMÉTICA o MEDIA.
Es decir,
Nota: Utilizamos la notación cuando nos referimos a la media de una muestra y µ (mu) cuando es
a la media de una población. Para nuestro caso, utilizaremos preferentemente la primera notación.
Si retomamos el ejemplo de las precipitaciones de Isla de Pascua, el promedio del primer
trimestre del 2010 obtenido fue de 1021,3 mm, que es el valor medio de la serie de valores
de los datos 1021,8; 1022,2; 1019,3 y 1022,0 lo que corresponde a la media aritmética de
estos.
Además si te distes cuenta, el cálculo para obtener la media (promedio) fue sencillo. Ahora
lo formalizaremos.
Cálculo de la Media Aritmética para un conjunto de datos no agrupados
Para obtener el cálculo de la media para datos no agrupados se debe sumar todos los valores
de los datos y luego dividir el resultado obtenido por la cantidad total de datos.
Lo expresaremos en forma general de la siguiente manera:
Dónde:
: simboliza media aritmética.
2 3 4 : corresponde a cada uno de los valores de los datos.
n: cantidad total de datos.
n
i
ix1
: representa la sumatoria de los términos 2 3 4 .
El valor resultante de no necesariamente debe coincidir con algún dato.
La MEDIA ARITMÉTICA es el valor medio ponderado de una serie de valores de
datos. Este valor no tiene por qué ser siempre un dato. Se representa por �� .
𝒙 =𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + 𝒙𝟒 + ⋯+ 𝒙𝒏
𝒏=
13
Observa que la variación de ambas fórmulas radica
en el tamaño de los datos (N identifica el tamaño
de la población, mientras que n el de la muestra).
Para conveniencia nuestra, utilizaremos la primera
expresión pues siempre nos referiremos a la
muestra.
¿Qué significa este signo ?
El símbolo es la letra griega “sigma” mayúscula que equivale a la letra S de nuestro
alfabeto. Este símbolo permite expresar de manera resumida la sumatoria de términos de
una sucesión de números reales. Esta símbolo o registro
n
i
ix1
, representa la sumatoria de
los términos, que parte de 1x hasta el nx , indicados por lo límites inferior y superior de la
sumatoria.
n
n
i
i xxxxx
.......321
1
Este símbolo de sumatoria lo utilizaremos para expresar en forma general la media
aritmética. NOTA: Para expresar la media aritmética de los datos ya sea de una población o muestra, se utiliza
dos formas para representarla, que son:
x
n
i
ix1
(Muestra)
N
i
ix1
(Población)
Ejemplo
Retomemos la tabla de las precipitaciones en Isla de Pascua y calculemos la media
aritmética de la cantidad de agua caída durante todo el año 2010.
Primero determinamos los datos:
1021,8 1022,2 1019,3 1022,0 1022,8 1026,9
1025,8 1024,6 1022,2 1024,6 1023,4 1025,7
Como el números de datos es 12, por lo tanto n=12
Límite superior ó término con el último subíndice de la sumatoria
Límite inferior ó término con el 1º subíndice de la sumatoria
Término general de la sucesión, donde i
es el índice de la sumatoria ( )
14
Ahora podemos calcular la media aritmética reemplazando los datos anteriores:
x
12
1i
ix
2=
: : : : : : : : : : :
2
=1 1 + 1 + 1 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1
1
=1 1
1
x 1 1
Luego el promedio (media aritmética) de precipitaciones caídas en Isla de Pascua durante
todo el año 2010 fue de 1023,4 mm.
Si te fijas en este caso el valor de la media aritmética obtenido coincide coincidió por
casualidad con uno de los datos (generalmente esto no ocurre).
Pon atención… Ahora que sabes cómo calcular la media aritmética para datos no
agrupados, es necesario detenerse para examinar el resultado que obtienes. Por ejemplo si
consideramos el número de hijos de 6 familias con los siguientes resultados:
1, 2, 4, 5, 5, 6
La media aritmética del número de hijos es 3,8; ya que
8,36
23
6
655421
x
Si observas la media aritmética no coincide con ningún valor de los datos, pues
corresponden a números enteros positivos. Una posibilidad de expresar este resultado
salvando este inconveniente es decir: “el valor aproximado al entero de la media aritmética
es 4”, esto último es importante tenerlo presente cuando debamos contestar alguna pregunta
para que tenga sentido.
ACTIVIDAD Nº 4
1. Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
Respuesta:
15
2. Calcula la media aritmética de las veces que un grupo de 8 personas asiste al cine en
un mes, observando el siguiente gráfico de barras:
Respuesta:
En el colegio es seguramente donde más has escuchado y usado la palabra promedio, o
mejor dicho media aritmética. Los profesores de todas las asignaturas calculan la media de
su curso en cada evaluación y tú más de alguna vez has calculado tu promedio en las
diferentes asignaturas como una información objetiva de tus resultados de estudio.
Consideremos el siguiente ejemplo:
Se registraron en forma ordenada las notas de un curso en la última prueba de matemáticas,
que fueron las siguientes:
2 2 2 3 3 3 3 3 4 4
4 4 4 4 4 4 5 5 5 5
5 5 5 6 6 6 6 6 6 6
6 6 6 7 7 7 7
Se desea saber el promedio del curso. ¿Cómo lo harías?
Lo más probable es que lo resuelvas como ya lo hemos hecho anteriormente. Hagámoslo!!!
Tenemos en total 37 notas que sumar (n=37).
37
7777666666666655555554444444433333222 x
8,437
176x
El promedio o media aritmética del curso en la prueba de matemáticas fue 4,8.
Pero, ¿Qué desventaja encontraste para calcular la media aritmética?
012345678
Fre
cue
nci
as
Número de visitas al cine
16
Si te habrás dado cuenta fueron varios los datos los que se debieron sumar, más aún varias
de estos estaban repetidos, lo que exige ser más cuidadoso en el momento de realizar las
operatorias involucradas en el cálculo de la media aritmética para evitar cometer errores en
el cálculo de la
Para estos casos, se recomienda ordenarlos en una tabla de frecuencias como se muestra a
continuación:
Tabla Nº7
Así se entiende entonces, que la nota 2 fue obtenida por 3 alumnos, la nota 3 por 5 alumnos,
la nota 4 por 8 alumnos, y así sucesivamente. Esto se puede expresar del siguiente modo:
37
4710675845332 x
37
28603532156 x
37
176x
8,4x
Hacerlo de esta forma salió simplificado y además se obtuvo el mismo resultado
Esta forma similar de hacerlo es muy recomendable para calcular la media en datos
agrupados y recibe el nombre de MEDIA ARITMÉTICA PONDERADA.
Cálculo de la Media Aritmética para un conjunto de datos agrupados
Para calcular la media aritmética para datos agrupados se calcula multiplicando la marca de
clase de cada intervalo por sus respectivas frecuencias absolutas, se suman los resultados
obtenidos y este total se divide por el número total de datos.
Es decir:
Donde
:ix marca de clase de cada intervalo (i= 1, 2, 3,….n.)
Notas Nº de alumnos
2 3
3 5
4 8
5 7
6 10
7 4
𝒙 =𝒙𝟏 ∙ 𝒇𝟏 + 𝒙𝟐 ∙ 𝒇𝟐 + 𝒙𝟑 ∙ 𝒇𝟑 + 𝒙𝟒 ∙ 𝒇𝟒 + ⋯+ 𝒙𝒌 ∙ 𝒇𝒌
𝒏=
17
:if frecuencias absolutas de cada intervalo (i= 1, 2, 3,….n.)
n : número total de datos.
k: número total de intervalos.
i
k
i
i fx 1
: representa la sumatoria de la multiplicación de las marcas de clases con
sus respectivas frecuencias absolutas, es decir ∙ + 2 ∙ 2 + 3 ∙ 3 + 4 ∙ 4 +
⋯+ ∙ . Es decir, en estos casos las marcas de clases de cada intervalo son los
factores ó ponderadores de la frecuencia absoluta de los intervalos.
Ejemplo
1. En una prueba de Física realizada a un cuarto año medio , se obtuvieron los siguientes
resultados:
Tabla Nº8
Calculemos el puntaje promedio del curso.
En este caso n= 19, que resulta al sumar las frecuencias absolutas: 2+2+3+5+4+2+1=19,
que es el número total de los datos. Además k=7, ya que corresponde al número total de
intervalos que aparecen en la tabla.
Como tenemos la marca de clase de cada intervalo con su respectiva frecuencia absoluta
debemos multiplicar ambos, para eso anexaremos una columna.
Tabla Nº8.1
Nota: Recuerda que cuando hablamos de producto nos referimos a la operación multiplicación.
Puntaje
Marca de
Clase
(xi)
Frecuencia
Absoluta
(fi)
[0-10[ 5 2
[10-20[ 15 2
[20-30[ 25 3
[30-40[ 35 5
[40-50[ 45 4
[50-60[ 55 2
[60-70] 65 1
Puntaje
Marca de
Clase
(xi)
Frecuencia
Absoluta
(fi)
∙
[0-10[ 5 2 ∙ = 1
[10-20[ 15 2 1 ∙ =
[20-30[ 25 3 ∙ =
[30-40[ 35 5 ∙ = 1
[40-50[ 45 4 ∙ = 1
[50-60[ 55 2 ∙ = 11
[60-70] 65 1 ∙ 1 =
n=19 645
Este es el total obtenido
luego de sumar todos
los resultados de los
productos ( 𝑥𝑖∙𝑓𝑖
Se multiplica
𝑥 ∙ 𝑓 → 5∙ = 1
𝑥2 ∙ 𝑓2 → 1 ∙ =
𝑥3 ∙ 𝑓3 → ∙ =
⋮ ⋮
Y así sucesivamente.
Recuerda que la Marca de Clase
corresponde al punto medio del
intervalo y se calcula con el
promedio entre los límites ó
extremos de este.
18
Luego reemplazamos en
x
i
i
i fx
7
1
9=
5∙2 : 5∙2 : 25∙3 : 35∙5 : 45∙4 : 55∙2 :65∙
9
=1 + + + 1 + 1 + 11 +
1
=
1
=
Por lo tanto el puntaje promedio del cuarto año medio en la prueba de Física es 33,94
puntos (que no podemos saber, con la información que tenemos, si corresponde o no a uno
de los datos).
ACTIVIDAD Nº 5
1. Se realizo un estudio sobre los años de servicio a 16 trabajadores de un minimarket de la
capital donde los resultados se muestran en la tabla que aparece a continuación. Completa
esta tabla y luego calcula la media aritmética correspondiente a los años de servicio de estos
trabajadores.
Tabla Nº 9
Intervalos
(Años) xi fi ∙
[0-10[
5
2
[10-20[
15
2
[20-30[
25
3
[30-40[
35
5
[40-50[
45
4
[50-60[
55
2
Cálculo de la media (𝒙 )
19
Respuesta: La media aritmética de los años de servicio estos trabajadores es
años.
2. La siguiente tabla de distribución muestra las alturas de un curso de enseñanza media de
cierto colegio.
Tabla Nº10
Alturas Marca de clase
(xi)
Nº de alumnos
(fi)
[150, 154[ 152 5
[154, 158[ 156 3
[158, 162[ 160 7
[162, 166[ 164 6
[166, 170[ 168 4
[170, 174[ 172 5
¿Cuál es la estatura media del curso?
Respuesta:
Propiedades de la media aritmética
Si xi son las variables de una muestra de tamaño n, y la media aritmética de
la muestra, entonces, la suma de las desviaciones de las variables con respecto a
la media es nula (ó cero), es decir:
∑ − =
<
Antes de comprender esta propiedad, es necesario que analices lo siguiente .El gráfico de
barras o el histograma nos permite calcular a priori la aproximación del valor con respecto
a la media aritmética de los datos representados. A su vez la media aritmética coincide con
el "punto de equilibrio" del gráfico es decir, está en la vertical que pasa por su centro de
gravedad. Es decir, imagina que el gráfico es un objeto con masa y necesitamos colocarlo
20
en equilibrio sobre un punto del eje horizontal: el punto de apoyo ha de estar situado en la
media aritmética de los datos representados como aparece en el esquema siguiente, que
corresponde al triángulo que está debajo del gráfico de barras.
Esquema Nº1
Si ese punto de apoyo estuviera situado a la izquierda o a la derecha de la media, el gráfico
se iría hacia un lado o hacia el otro, o sea se desequilibraría. Basándonos en esto, podemos
hacer un cálculo aproximado de la media aritmética: observamos el gráfico y tratamos de
determinar donde está situado su centro de gravedad. La proyección de este punto sobre el
eje horizontal nos da el valor de la media.
Veamos la siguiente situación:
Consideremos las notas de matemática de un alumno que cursa segundo año medio:
6,5; 4,9; 5,0; 5,9; 6,2
Primero calculemos la media aritmética, siendo n=5.
= + + + +
=
=
Como ves, en la expresión matemática de la propiedad, debemos calcular cada una de las
diferencias entre el valor y la media respectiva. Esta diferencia se conoce con el nombre de
desviación. Estas se muestran en la siguiente tabla:
Tabla Nº 12
Gráficamente esta situación la podemos graficar:
Esquema Nº 2
Nº de nota Nota (xi) Desviación − 1 6,5 − =
2 4,9 − = −
3 5,0 − = −
4 5,9 − =
5 6,2 − =
21
Como puedes ver, la media es el centro de gravedad de la distribución de las cinco notas de
matemática. Si apoyamos la barra en un punto tal que ésta quede equilibrada perfectamente,
es porque esa posición ha coincidido con la media. Entonces las medidas en toda muestra
están perfectamente equilibradas en torno a su media aritmética.
Cada puntuación de esta pequeña distribución posee un peso efectivo en proporción a su
distancia desde la media. Si te fijas en la tabla Nº 12, la tercera columna, están calculadas
estas distancias que se llaman desviaciones respecto de la media. La magnitud de cada
desviación indica el peso efectivo de cada observación y su signo algebraico dice en que
dirección está aplicado el peso. La suma algebraica de las desviaciones es cero, lo que
indica equilibrio perfecto. Por eso la propiedad esta anunciada como tal.
Ahora que ya tienes una idea del porqué de esta propiedad, ejemplificaremos dicha
propiedad, es decir que la suma de todas las desviaciones respecto a la media es igual a
cero.
Ejemplo:
Al lanzar un dado doce veces, los resultados fueron los siguientes:
Tabla Nº12
Verifiquemos la propiedad.
Primero calculamos la media aritmética que para este caso es = 2. Ahora anexamos a la
tabla anterior una columna en la cual calculamos cada diferencia entre el valor obtenido
(frecuencia) y la media aritmética.
Tabla Nº12.1
Al sumar los resultados obtenidos de las diferencias resulto ser igual a cero. Por lo tanto
la propiedad se cumple.
Número obtenido Frecuencias
1 2
2 0
3 1
4 3
5 4
6 2
Número obtenido Frecuencias −
1 2 − =
2 0 − = −
3 1 1 − = −1
4 3 − = 1
5 4 − =
6 2 − =
SUMA n=12 0
Este resultado corresponde a la suma de las
diferencias, es decir 𝑥𝑖 − ��
22
Si a todos los valores de la variable se les suma un mismo número, la media
aritmética queda aumentada en dicho número.
Verifiquemos la propiedad con el ejemplo siguiente.
Se realizó un estudio a un grupo de 6 amigos, sobre el peso (kg) que posee cada uno de
ellos .
La siguiente tabla Nº13 muestra los resultados.
Si calculamos la media aritmética, sabiendo que n= 6 nos da:
= + + + + + 1
=
=
Por lo tanto = (valor que no corresponde a ninguno de los datos)
Sin embargo estos amigos se fueron al supermercado a comprar lo necesario para el asado
pues van a celebrar el triunfo de su equipo de fútbol favorito. Para que todos llevarán el
mismo peso de bolsas, se repartieron 6 kilos cada uno, para así equilibrar todo el peso de
las compras. Por lo tanto el peso de cada uno de ellos se vio afectado por este exceso de
peso de las bolsas, como se muestra en la tabla:
Tabla Nº13.1
Ahora si calculemos nuevamente la media aritmética para estos nuevos pesos, resulta:
=82:84:88:83:86:87
6=
5
6= Por lo tanto =85 kg.
Si comparamos los valores de las dos medias aritméticas obtenidas = y =85
difieren por 6 kilos, es decir que la primera media aritmética aumento en 6 kilos más,
debido al peso de las bolsas del supermercado. Este resultado muestra que la propiedad
funciona.
Amigos Peso (kg)
A 76
B 78
C 82
D 77
E 80
F 81
Amigos Peso (kg) Pesomás(kg)
A 76 76 + 6 = 82
B 78 78 + 6 = 84
C 82 82 + 6 = 88
D 77 77 + 6 = 83
E 80 80 + 6 = 86
F 81 81 + 6 = 87
23
Si todos los valores de la variable se multiplican por un mismo número la
media aritmética queda multiplicada por dicho número.
Verifiquemos esta propiedad utilizando los datos de la tabla Nº12 y recordando que su
media aritmética es = en la siguiente situación:
En Física los conceptos de masa y peso son diferentes, pues el primero se relaciona con la
cantidad de materia de los cuerpos medida en kilógramos, y el segundo hace referencia
en que la masa de cada cuerpo es atraída por la fuerza de gravedad de la Tierra. Esa
fuerza de atracción hace que el cuerpo (la masa) tenga un peso, que se cuantifica con una
unidad diferente: el Newton (N). Para obtener el peso en Newton, se calcula con la
siguiente fórmula: donde : P= peso en Newton(N) , = masa (kg) y
= 9,8 siendo la constante gravitacional de la Tierra (kg. m/s).
Calculemos los pesos en Newton, utilizando los datos de la tabla Nº 12. (Para eso hacemos
la siguiente modificación en la tabla, en vez de “peso (kg)” anotamos “masa (kg)”) para
luego calcular la media aritmética y así compararlos con la media inicial, es decir, = .
Recuerda que cada valor (masa) de la tabla lo multiplicamos por 9,8, según la fórmula.
Tabla Nº13.2
Estos son los pesos obtenidos en Newton, ahora calculemos la media aritmética.
= + + + + +
=
=
Por lo tanto = 774,2 en Newton.
Con anterioridad la media de esta masas era de 79, ahora como sabemos que a cada masa
(kg) le multiplicamos la constante gravitacional 9,8 , obtuvimos una nueva media aritmética
que resulto ser 774,2. Si observas con atención esta última corresponde a 9,8 veces la
primera, es decir que si multiplicamos 79 por 8,9 nos da 774,2 que corresponde al peso
promedio del grupo de amigos. Este resultado muestra que la propiedad funciona.
Observaciones de la media aritmética
La media se puede hallar sólo para variables cuantitativas, pues estamos realizando
cálculos con operatorias aritméticas.
En su cálculo intervienen todos los valores de la distribución.
Es única, pues cuando la calculamos obtenemos sólo un valor que le corresponde.
Amigos Masa (kg) Peso(N)= ∙
A 76 76 ∙ 9,8 = 744,8
B 78 78 ∙ 9,8 = 764,4
C 82 82 ∙ 9,8 = 803,6
D 77 77 ∙ 9,8 = 754,6
E 80 80 ∙ 9,8 = 784
F 81 81 ∙ 9,8 = 793,8
𝑃 = 𝑚 ∙ 𝑔
24
La media aritmética viene expresada en las mismas unidades que la variable, pero
no necesariamente coincide con alguno de los datos.
La media es un estadístico “sensible” a valores extremos. Basta que algún dato
dentro de la muestra sea muy alto o muy bajo, y la media se verá alterada.
Ejemplo: Si tenemos una distribución de 8 pesos (kg) que son:
72, 69, 72, 68, 75, 70, 71,71
Al calcular la media aritmética de estos valores obtenemos que es igual a 71 kg, que
corresponde al peso medio de la distribución.
Ahora si cambiamos unos de los valores, por ejemplo en vez de 71 kg. es 111 kg.
72, 69, 72, 68, 75, 70, 71, 111
La media resultante es 76 kg que corresponde al peso medio de esta nueva distribución,
notamos que la media cambia considerablemente, o sea aumento en 5 kilos y además este
valor no es representativo de todos los pesos.
Ahora si consideramos la distribución de pesos inicial y cambiamos 71 kg por 47 kg nos
queda
72,69, 72, 68, 75, 70, 71, 47
La media es 68 kg que corresponde al peso medio de esta nueva distribución, notamos que
la media cambia nuevamente, o sea disminuyó en 3 kilos y además este valor no es
representativo de todos los pesos.
Por lo tanto basta que un dato de la muestra sea muy alto o muy bajo para que afecte al
valor de la media aritmética.