25
1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez 1 MEDIDAS DE POSICIÓN de una distribución de frecuencias

MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

  • Upload
    others

  • View
    25

  • Download
    0

Embed Size (px)

Citation preview

Page 1: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez1

MEDIDAS DE POSICIÓN

de una distribución de frecuencias

Page 2: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez2

Medidas Descriptivas Numéricas:

• Medidas de posición:

- central

- no central

• Medidas de dispersión

• Medidas de forma:

- simetría

- curtosis

Page 3: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez3

Las medidas de posición nos ayudan a saber dónde están

localizados los datos, pero sin saber cómo están distribuidos.

Page 4: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez4

Medidas de posición central:

• La media aritmética:

- pretende representar un valor central del conjunto de datos observados

- para ello se busca un valor k que haga mínima la distancia del mismo a cada una de las observaciones: d(xi, k) mínima

- la fórmula de cálculo es: ∑=

=

=ni

iixn

x1

1

Page 5: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez5

La media aritmética: ejemplo

• Las observaciones que surgen de tirar 6 veces un dado son las siguientes:

1 – 1 – 2 – 3 – 5 – 6

Si calculamos:

(1 – k) + (1 – k) + (2 – k) + (3 – k) + (5 – k) + (6 – k) = 18 – 6 x k , por lo que k = 3.

Si observamos las distancias (con signo) al valor k obtenido: -2 + -2 + -1 + 0 + 2 + 3 = 0

Page 6: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez6

La media es el “pivote” de los valores observados

11

2 3 5 6

Page 7: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez7

La media, cálculo con datos agrupados:

)y...yy....y...yy(n1

xn1

x kkk111

ni

1ii ++++++==

=

=∑

∑kj

1jjjkk2211 ynn

1)yn...ynyn(n

1x

=

==+++=

Page 8: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez8

La media: ejemplo de cálculo con datos agrupados

Se dispone del peso de diez cerdos de entre 4 y 5

meses de edad (en kg.):

…queremos calcular la media de esos pesos.

xi fi

54 2

59 3

63 4

64 1

N = 10

Page 9: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez9

La media: ejemplo de cálculo con datos agrupados

Calculamos entonces:

Por lo que la media resulta ser de 60,1 kg.

xi fi xi * fi

54 2 108

59 3 177

63 4 252

64 1 64

N = 10 601

Page 10: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez10

La media aritmética: propiedades

baXY += bxay +=⇒

Linealidad:

“Sensibilidad”, en caso de valores extremos:

- supongamos queremos la media de edades del siguiente conjunto de observaciones (un hogar):

1 – 2 – 4 – 29 – 34 , ésta es 70 / 5 = 14

- ahora, por algún motivo, la persona de 29 años se va de casa con los niños, y pasa a vivir con su madre que tiene 64 años. La media ahora es: 100 / 5 = 20

Page 11: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez11

La media aritmética: aclaración

El valor promedio de las observaciones

no es necesariamente

uno de los datos observados

Page 12: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez12

La media aritmética: inconvenientes

• No se puede calcular para variables categóricas

• En el caso de variables continuas discretas, su resultado puede ser chocante: la media de hijos por familia puede ser 2,1 hijos.

• No es robusta: es muy sensible a valores extremos.

Page 13: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez13

La media recortada (α-podada)

Para evitar problemas de “sensibilidad” a valores extremos, se ordena la muestra y se

eliminan (por ejemplo) el 10% de los valores extremos. Entonces, se calcula la

media artimética de los valores (centrales) restantes.

Page 14: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez14

La media ponderada

A veces es necesario darle mayor importancia a determinados datos observados que a otros.

Un ejemplo usual, es la media de calificaciones de los alumnos en secundaria: hay porcentajes asignados a participación oral, escrita y a pruebas especiales.

∑=

=

=

== ni

ii

ni

iii

w

xwx

1

1

Page 15: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez15

Medidas de posición central:

• La moda:

- datos sin agrupar: es el valor más frecuente en el conjunto de observaciones

- datos agrupados: es el intervalo o clase que tiene mayor número de observaciones por unidad de longitud (es el de mayor valor de la densidad empírica f* )

Page 16: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez16

La moda: aclaración

La moda de las observaciones

es necesariamente

uno de los datos observados

En el ejemplo de los pesos, la moda es 63

(es el valor observado más frecuente)

Page 17: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez17

La moda y sus dificultades

• Para el caso de variables cuantitativas continuas sin agrupar, siendo muy raras las repeticiones, no tiene mucho sentido.

• Al agrupar datos continuos, ya no podemos hablar de una moda sino de un intervalo modal: tomamos la marca de clase como valor de la moda.

• Al cambiar la forma de agrupar datos continuos, el intervalo modal varía.

Page 18: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez18

Medidas de posición central:

• La mediana: - pretende representar al conjunto de datos

observados.- para ello se ordenan las observaciones (de

menor a mayor) y se elige el valor observado que ocupa el lugar central (o bien el promedio de los dos datos centrales).

- la mediana es el valor que alcanza o supera el 50% de las observaciones, cuando éstas están ordenadas en forma creciente.

Page 19: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez19

La mediana: datos agrupados

• Al agrupar datos, todos los valores de cada clase (intervalo) son posibles, por lo que se puede definir siempre el valor que acumula exactamente el 50% de las observaciones como:

mf

jcLx +=50.0

[ )''150.0 ;∈ ii xxxsi

L: límite inferior de la clase donde está la mediana

c: amplitud de la clase

j: cantidad de observaciones que faltan adicionar para llegar a n/2

fm: frecuencia absoluta de la clase donde está la mediana

Page 20: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez20

La mediana: propiedades

• Se puede establecer aún en variables cualitativas, si son ordinales.

• Su valor es uno de los valores observados.• No es necesarios considerar los valores de

las observaciones para calcularla.• Es robusta. En el ejemplo de las edades, en

los dos casos: 1 – 2 – 4 – 29 – 34 y 1 – 2 – 4 – 29 – 64 la mediana es 4.

Page 21: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez21

Medidas Descriptivas Numéricas:

• Medidas de posición:

- central

- no central

• Medidas de dispersión

• Medidas de forma:

- simetría

- curtosis

Page 22: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez22

Los cuantiles:

• Son aquellos valores observados que, ordenados de menor a mayor, dividen a la función de distribución empírica en partes iguales.

• Los cuartiles: la dividen en cuatro partes, cada una de ellas engloba el 25% de las observaciones. Q1 es el primer cuartil (valor que alcanza o supera el 25% de los datos observados), Q3 es el tercer cuartil (alcanza o supera el 75% de los datos observados), Q2 = Mediana.

• Los más comunes: deciles, percentiles.

Page 23: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez23

Dependiendo del estudio que queramos realizar, será la

medida de posición que adoptaremos.

Page 24: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez24

Cambios de origen y de escala

• Cambios de origen: es cuando sumamos (restamos) una cantidad constante a todos los datos observados.

• Cambio de escala: es cuando afectamos a todos los datos observados de un mismo factor.

Page 25: MEDIDAS DE POSICIÓN de una distribución de frecuencias · Medidas de posición central: • La media aritmética: - pretende representar un valor central del conjunto de datos observados

1er semestre 2012 UDE Fac. CC. Agrarias Celina Gutiérrez25

Los cambios de origen y de escala afectan a todas las medidas de posición por igual: éstas cambiarán en el mismo sentido e

intensidad que lo hicieron los datos analizados.