44
Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 1 Estadística-Unidad 4 Medidas de Tendencia Central y Medidas de Dispersión

0 Unidad 4

Embed Size (px)

Citation preview

Page 1: 0 Unidad 4

Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 1

Estadística-Unidad 4

Medidas de Tendencia Central y

Medidas de Dispersión

Page 2: 0 Unidad 4

Herramientas numéricas para el tratamiento

de datos cuantitativos

Tendencia central

Posición

Forma

Dispersión

Media

Mediana

Moda

Cuartiles

Percentiles

Asimetría

Curtosis

Rango - Rango Intercuartílico

Varianza

Desviación Estándar

Coeficiente variación

Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 2

Page 3: 0 Unidad 4

Medidas de Tendencia Central

Permiten tener una idea rápida de cómo están

distribuidos los datos

Buscan determinar un valor “común” o valor “central”

alrededor del cual está la mayoría de ellos

0

2

4

6

8

10

12

14

16

2 3 4 5 6 7 8

mero

de e

xám

en

es

Calificaciones obtenidas

Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma

3

Page 4: 0 Unidad 4

Medidas de Posición o de orden Se basan en dividir los datos en porciones (cuartos, décimos)

se busca eliminar del análisis los datos extremos, o analizar

los datos por tramos

Valores que toma la variable en lugares específicos Ej:

percentil 20

Percentiles P10 P20 P30 P40 P50 P60 P70 P80 P90 P100

Curtiles C1 =Q1 C2= Me C3= Q3

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Datos ordenados según su valor Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 4

Page 5: 0 Unidad 4

Medidas de Forma

Junto con la centralidad y la dispersión, conviene ver

otras medidas que tienen que ver con la forma de la

distribución y nos da una información complementaria

Kurtosis Asimetría

Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 5

Page 6: 0 Unidad 4

Medidas de Dispersión

Además de conocer el punto central de un conjunto de

datos también interesa conocer su dispersión, es decir

cuán lejos tienden a estar los datos del centro

0

5

10

15

20

25

30

35

40

45

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 6

Page 7: 0 Unidad 4

Ejemplo 1: Se tienen los exámenes de 29 alumnos de Estadística

con los siguientes valores:

4, 5, 7, 5, 2, 6, 4, 5, 3, 6, 4, 7, 3, 5, 4, 4, 6, 5, 3, 8, 2, 7, 5,

3, 6, 5, 8, 7, 6

Nota: éstos números desordenados son muy difícil de

interpretar

Paso 1: Ordenar mis datos:

2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6,

7, 7, 7, 7, 8, 8

Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 7

Page 8: 0 Unidad 4

Paso 2: se debe confeccionar una “Tabla de Frecuencias” (cuando son muchas categorías es útil agrupar los datos en “intervalos de clase” - Regla empírica: entre 6 y 15 intervalos)

Calificación (valor) (x1)

Nº de pruebas (Frecuencia) ( f1)

2 2 3 4 4 5 5 7 6 5 7 4 8 2

Observar los valores !!!

0

1

2

3

4

5

6

7

8

2 3 4 5 6 7 8

Núm

ero

de e

xám

enes

Calificaciones obtenidas

Paso 3: Aplicar las técnicas de tratamiento de datos

cuantitativos Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 8

Page 9: 0 Unidad 4

Medidas de Tendencia Central

0

2

4

6

8

10

12

14

16

2 3 4 5 6 7 8

mero

de e

xám

en

es

Calificaciones obtenidas

Media, Mediana y Moda

Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 9

Page 10: 0 Unidad 4

La media Resulta de dividir la suma de todos los

valores observados de la variable por el

número de observaciones

datos no agrupados

datos agrupados

Símbolos: `X para una muestra (x barra) y

m para una población (mu)

Unidad 4: Medidas de Tendencia Central y de Forma 10 Estadística - FHyCS

...21

n

x

n

xxxx

in

n

fx

n

fxfxfxx

iiyy

....... 2211

Page 11: 0 Unidad 4

Descripción de un conjunto de datos más elemental:

su “centro”

Media o promedio: el “centro de gravedad”

Ejemplos: la nota media en un examen, ingreso

medio por familia, número de hijos medio por pareja

MUY IMPORTANTE: la media no tiene por qué ser

“representativa”

Cuando puede utilizarse?

Cuando los datos estén agrupados en torno a un

valor central

No debe utilizarse cuando estén muy dispersos, o

tienen valores extremos

Unidad 4: Medidas de Tendencia Central y de Forma 11 Estadística - FHyCS

Page 12: 0 Unidad 4

Ventajas y Desventajas de la Media: Ventajas:

Toma en cuenta todos los valores

Es de fácil cálculo e interpretación

Se puede usar para cálculos

Permite estimar totales a partir de muestras

Desventajas:

Muy afectada por valores extremos

No puede calcularse en el caso de intervalos de

clase abierto.

Unidad 4: Medidas de Tendencia Central y de Forma 12 Estadística - FHyCS

Page 13: 0 Unidad 4

Propiedades de la Media: Suma de las desviaciones de un conjunto de

observaciones respecto a su media, es igual a

cero

La media puede verse muy afectada por unas

pocas observaciones cuyo valor sea muy diferente

de los demás, valor atípico (outlier)

Cuando el gráfico que representa la distribución

de valores no es simétrico, sino sesgado, la media

está desviada, hacia la cola más larga.

Cuanto más sesgada es la distribución: menos

representativa es la media

Unidad 4: Medidas de Tendencia Central y de Forma 13 Estadística - FHyCS

0 ~ xxi

Page 14: 0 Unidad 4

Ejemplo 1 – Cálculo de la Media

07.529

147

29

8...322x

07.529

147

29

)28(..)43()22(x

xxx

Interpretación: el promedio de las evaluaciones del exámen de

Estadística es de 5.07

o

n

fixix

.~

Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 14

...21

n

x

n

xxxx

in

Page 15: 0 Unidad 4

Mediana: Si todos los valores se ordenan de menor a mayor, es

el valor que divide el conjunto de datos en dos mitades

con igual número de observaciones hacia cada lado

El valor de mediana puede ser uno directo o el

promedio de dos valores directos

Símbolo: Mdn

Propiedades:

La Mediana es menos sensible a datos extremos.

La mediana es más sensible que la media a la

variabilidad en el muestreo.

Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 15

Page 16: 0 Unidad 4

Ventajas y Desventajas de la Mediana Ventajas:

Fácil cálculo

Es posible utilizar intervalos abiertos

No está afectada por valores extremos

Desventajas:

No utiliza todos los valores

No hay una fórmula matemática sólo aproximación.

No puede usarse para cálculos

No puede obtenerse una medida total. Unidad 4: Medidas de Tendencia Central y de Forma 16 Estadística - FHyCS

Page 17: 0 Unidad 4

En nuestro ejemplo (muestra impar):

2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 6,

6, 6, 6, 6, 7, 7, 7, 7, 8, 8

Mediana: Fórmula y cálculos

2

2

2

ny

nMnaPosición

2

1

nMnaPosición

15 nº posición2

30

2

129

MnaPosición

Muestras

pares

Muestras

impares

Posición nº 15

Interpretación: el Valor de la Mediana es “5”

Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 17

Page 18: 0 Unidad 4

La moda El valor de mayor frecuencia

Si hay dos, la distribución es “bimodal”

es el valor que más se repite en un conjunto de datos.

Símbolo: Mo

En nuestro ejemplo el número que más se repite es el

número “5”

Medidas de Resumen de nuestro ejemplo:

Media: 5,0

Mediana: 5

Modo: 5

Interpretación: el conjunto de datos de éste ejemplo presenta una

distribución “simétrica”

0

10

20

30

40

50

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 18

Page 19: 0 Unidad 4

Ventajas y Desventajas del Modo Ventajas:

Fácil cálculo

No está afectado por valores extremos

Puede obtenerse con cualquier escala

Desventajas:

Afectado por el redondeo y agrupamiento de datos

No utiliza todas las observaciones

Pueden ser 1,2, 3 o 0

No pueden hacerse cálculos

Unidad 4: Medidas de Tendencia Central y de Forma 19 Estadística - FHyCS

Page 20: 0 Unidad 4

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8 9 10 11 12 13

Moda

Mediana Media

Distribución sesgada a la Derecha – A. positiva

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8 9 10 11 12 13

Moda

Mediana

Media

Distribución sesgada a la izquierda

Asimetría negativa

0

10

20

30

40

50

60

70

80

90

1 2 3 4 5 6 7 8 9 10 11 12 13

Distribución simétrica

Moda

Mediana

Media Cuando hay datos

extremos muy diferentes

se debe usar la mediana

como medida del

“centro”.

Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 20

Page 21: 0 Unidad 4

Relación entre Medidas:

DISTRIBUCIÓN RELACIÓN

Simétrica Media=Mediana =Modo

Asimétrica

Positiva Mo<Me<Media

Negativa Media<Me<Mo

Unidad 4: Medidas de Tendencia Central y de Forma 21 Estadística - FHyCS

Page 22: 0 Unidad 4

Gráfico Resumen: Cajas y bigotes

Presenta al mismo tiempo una medida de dispersión,

tendencia central y de valores extremos

Se debe determinar la mediana, el primero y el tercer

cuartil y los valores máximo y mínimo y el rango IC

Gráfico confeccionado con software Infostat

Ejemplo: Máximo Máximo

Mediana Cuartil 1

Mínimo

8

6

5

4

2

Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 22

Cuartil 3

Mínimo

Page 23: 0 Unidad 4

Gráfico de Caja y Bigotes (Box-plot)

Escala

Q1 Q3 mediana

Max Min

Especialmente útiles cuando queremos comparar

varios conjuntos de datos

Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 23

Page 24: 0 Unidad 4

Ejercicio a resolver:

En un diario de tirada nacional presentan el siguiente gráfico de

caja y bigotes. La variable en estudio es “calificación en un

examen de ingreso”

Teniendo en cuenta esta gráfica indique en forma aproximada:

a)¿Qué calificación obtuvo el estudiante con menor nota?

b)¿Qué calificación obtuvo el estudiante con mayor nota?

c)¿Cuál es el primer cuartil?

d)¿Cuál es el tercer cuartil?

e)¿Cuál es la mediana?

Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 24

Page 25: 0 Unidad 4

Medidas de Dispersión

Rango, Varianza, Desviación Media,

Desviación Tipo

Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 25

0

5

10

15

20

25

30

35

40

45

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Page 26: 0 Unidad 4

Dos conjuntos de datos pueden tener la

misma media pero ser muy distintos

13, 15, 17, 21, 23, 25 (media es 19)

3, 5, 7, 31, 33, 35 (media es 19)

Diferencia: dispersión respecto a media

Consecuencia: junto a la media (central)

es necesario otro valor que exprese la

dispersión.

Unidad 4: Medidas de Tendencia Central y de Forma 26 Estadística - FHyCS

Page 27: 0 Unidad 4

El rango o recorrido

La diferencia entre el máximo y el mínimo

de los valores de la población

Es de fácil cálculo

Muy afectado por los valores extremos

No toma en cuenta todas las observaciones

No puede hacerse operaciones algebraicas

Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 27

minmaxe xxR

Page 28: 0 Unidad 4

Desviación Media Promedio de las distancias de los valores

observados respecto a la media.

Cálculo: la media de las desviaciones respecto a

la media

Problema: el numerador es cero (se compensan)

Solución: elevar al cuadrado, calcular la media

de los cuadrados, y hallar la raíz cuadrada

Unidad 4: Medidas de Tendencia Central y de Forma 28 Estadística - FHyCS

n

xxiDM

~

Page 29: 0 Unidad 4

Desviación media: Ejemplo 2: hallar la desviación media de

la serie Xi = 2, 3, 5, 8 y 12

Usa valores absolutos (sin tomar en

cuenta el signo).

Unidad 4: Medidas de Tendencia Central y de Forma 29 Estadística - FHyCS

65

30 x~

2,35

16

5

6 ~

xi

n

xxiDM

Page 30: 0 Unidad 4

Desviación Tipo o Estándar Indica como se dispersan los datos por

encima y por debajo de la media.

Es igual a la raíz cuadrada de la varianza

Símbolo:

S para una muestra

s para una población (sigma)

Unidad 4: Medidas de Tendencia Central y de Forma 30 Estadística - FHyCS

n

xxiSDS

2)~(

Page 31: 0 Unidad 4

Varianza: Promedio de los cuadrados de las

desviaciones de la media.

Valores más altos de varianza indican que

los datos están más dispersos (alejados

de la media)

Se expresa en unidades al cuadrado

(difícil interpretación) Unidad 4: Medidas de Tendencia Central y de Forma 31 Estadística - FHyCS

)~

Varianza

22

n

x(xi - S

Page 32: 0 Unidad 4

Cálculo alternativo de la DT o DS

Igual que la media, cuando hay valores

repetidos, la desviación típo también

puede calcularse con esta otra fórmula:

Si tenemos intervalos de clase el xi es la

marca de clase del intervalo

Unidad 4: Medidas de Tendencia Central y de Forma 32 Estadística - FHyCS

n

fxxSDS

ii

.)~( 2

Page 33: 0 Unidad 4

Propiedades de la DT Siempre valor positivo

Sólo valor 0 si todas las observaciones tienen el

mismo valor

Ventajas:

Está definida rigurosamente

Se basa en todos los valores

Fácil cálculo

Se pueden realizar operaciones algebraicas

Desventajas:

Como la media, muy afectada por valores atípicos

Unidad 4: Medidas de Tendencia Central y de Forma 33 Estadística - FHyCS

Page 34: 0 Unidad 4

Observaciones e Interpretación: Por razones técnicas (matemáticas), cuando se calcula la

desviación típica y la varianza de una muestra, en lugar de

la de una población, el denominador es (n-1) en lugar de n

Mide la dispersión: cuanto más grande, mayor dispersión.

Es la “media de las desviaciones respecto a la media”

Unidades: las mismas en las que se exprese la variable

(pesos, metros, puntos en examen...)

¿Grande o pequeña? Según lo que sepamos de la variable

misma

IMPORTANTE: si la DT es mayor que la media indica

asimetría (sesgo), si no es menor que la mitad de la media

cuidado!, puede haber sesgos.

Unidad 4: Medidas de Tendencia Central y de Forma 34 Estadística - FHyCS

Page 35: 0 Unidad 4

Cálculo de DS Ejemplo – Tabla 4 – Unidad 3

Edad Marca de

clase (xi)

Frecuencia

fi

fi.xi Xi -`X (xi - `X )2 fi.(xi -`X)2

1-11 6 8 48 -16,775 281,400625 2251,205

12-22 17 13 221 -5,775 33,350625 433,558125

23-33 28 14 392 5,225 27,300625 382,20875

34-44 39 2 78 16,225 263,250625 526,50125

45-55 50 1 50 27,225 741,200625 741,200625

56-66 61 2 122 38,225 1461,150625 2922,30125

40 911 7256,975 7256,975

Unidad 4: Medidas de Tendencia Central y de Forma 35 Estadística - FHyCS

775,2240

911.

n

fxx

ii 4,13 4,180 .)~( 2

n

fxxS

ii

Page 36: 0 Unidad 4

Interpretación de las medidas: `X = 22,7 años

Mo = 24 años

Mdn = 22 años

Q1 = 17 años ; Q3 = 23 años

DS = 13,4 años

El promedio de edad de los lesionados es de 22,7

años, con una dispersión tipo de más o menos 13,4

años. El 50% de los valores se encuentra entre los

17 y 23 años.

Se puede utilizar Archivo Excel Unidad 4.XLSX y

Archivo Infostat Unidad 4.IDB2

Unidad 4: Medidas de Tendencia Central y de Forma 36 Estadística - FHyCS

Page 37: 0 Unidad 4

Tratamiento de Datos:

Resumen descriptivo que se realiza para la

organización, representación y medición de datos.

Unidad 4: Medidas de Tendencia Central y de Forma 37 Estadística - FHyCS

Tratamiento de Datos

de

Variable Cualitativa

nominal

Tablas de Frecuencia

Gráficos: Diagrama de

barras. Diagrama de

Pareto. Gráfico circular o

de sectores.

Medidas: de Tendencia

central: Moda

Page 38: 0 Unidad 4

Tratamiento de Datos:

Resumen descriptivo que se realiza para la

organización, representación y medición de datos.

Unidad 4: Medidas de Tendencia Central y de Forma 38 Estadística - FHyCS

Tratamiento de Datos

de

Variable Cualitativa

ordinal

Tablas de Frecuencia

Moda

Gráficos: Diagrama de

barras. Diagrama de

Pareto. Gráfico circular o

de sectores.

Medidas: de Tendencia

central: Moda y Mediana

Page 39: 0 Unidad 4

Tratamiento de Datos:

Resumen descriptivo que se realiza para la

organización, representación y medición de datos.

Unidad 4: Medidas de Tendencia Central y de Forma 39 Estadística - FHyCS

Tratamiento de Datos

de Variable

Cuantitativa Discreta

Tablas de Frecuencia: serie

simple y datos agrupados.

Gráficos: Diagrama de

barras. Diagrama de Caja.

Gráfico de frecuencias

acumuladas.

Medidas: de Tendencia

central, posición, dispersión

y de forma

Page 40: 0 Unidad 4

Tratamiento de Datos:

Resumen descriptivo que se realiza para la

organización, representación y medición de datos.

Unidad 4: Medidas de Tendencia Central y de Forma 40 Estadística - FHyCS

Tratamiento de Datos

de Variable

Cuantitativa continua

Tablas de Frecuencia:

para datos agrupados.

Gráficos: Histograma,

Ojiva, Polígono de

frecuencias, Tallos y Hojas

Gráfico de Caja.

Medidas: de Tendencia

central, posición, dispersión

y de forma

Page 41: 0 Unidad 4

¿Qué hemos visto?

Medidas de Tendencia Central

Media

Mediana

Moda

Medidas de Dispersión

Varianza

Desviación Media

Desviación Tipo

Rango o Recorrido

Ejemplos y Ejercicios

Unidad 4: Medidas de Tendencia Central y de Forma 41 Estadística - FHyCS

Page 42: 0 Unidad 4

Actividades:

Conformación de grupos de trabajo ( no

más de cinco integrantes)

Planteo y resolución de los Ejercicio n° 1

y 5 de ambas series en forma grupal y

presentación en forma oral de un grupo

elegido al azar.

Realice los Ejercicios de aplicación de la

Guia de Aprendizaje N°4.

Unidad 4: Medidas de Tendencia Central y de Forma 42 Estadística - FHyCS

Page 43: 0 Unidad 4

Bibliografía:

Cap. 2 y 3 “Estadística Fácil”, Clegg F., 1984,

Ed. Crítica. España.

Apuntes de la Cátedra

Unidad 4: Medidas de Tendencia Central y de Forma 43 Estadística - FHyCS

Page 44: 0 Unidad 4

Preguntas ??

Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 44