Upload
cesar-alvarez-apuela
View
93
Download
0
Embed Size (px)
Citation preview
MEDIDAS DE MEDIDAS DE DISPERSIÓN O DE DISPERSIÓN O DE
VARIABILIDADVARIABILIDAD
Lic. Tatiana RettisLic. Tatiana Rettis
¿Qué tan separados están nuestros datos?
¿Qué tan "desparramados" están los datos?
Estas medidas nos permiten analizar la DISPERSIÓN o
VARIABILIDAD de las distribuciones que queremos
analizar
Medidas de Dispersión
Algunas medidas de variabilidad son:
Rango
Rango intercuartilico
Varianza
Desviación estándar
Coeficiente de variación
RANGO
Una alternativa como medida de dispersión es el RANGOCorresponde a la diferencia entre el mayor y el menor de nuestras observaciones
Claramente influenciado por valores extremos
Estimador “grueso”
Por esta razón no es una buena medida de dispersión.
RECORRIDO INTERCUARTILICO O AMPLITUD INTERCUARTILICA
Rq = Q3 - Q1
DESVIACIÓN MEDIADESVIACIÓN MEDIA
Es una medida de variabilidad que se obtiene promediando Es una medida de variabilidad que se obtiene promediando los valores absolutos de las desviaciones de los datos con los valores absolutos de las desviaciones de los datos con respecto al promedio.respecto al promedio.
Ejemplo: Halle la Desviación Media de los siguientes datos: Ejemplo: Halle la Desviación Media de los siguientes datos: 2, 3, 6, 8, 112, 3, 6, 8, 11
2-4 0 2 5
3 8 116
X = 6
-3
DESVIACIÓN MEDIA
n
XxDM
n
ii
1
n
nXxDM
k
iii
1
Datos No Agrupados Datos Agrupados
2
-42 02 22 52
3 8 116
X = 6
-32
Varianza Varianza Es una medida de variabilidad cuyo valor nos indicará si Es una medida de variabilidad cuyo valor nos indicará si los datos están concentrados o dispersos con respecto al los datos están concentrados o dispersos con respecto al promedio y se define como el promedio de los cuadrados promedio y se define como el promedio de los cuadrados de las desviaciones de cada valor con respecto a la media.de las desviaciones de cada valor con respecto a la media.
Ejemplo: Halle la Varianza de los siguientes datos: 2, 3, 6, Ejemplo: Halle la Varianza de los siguientes datos: 2, 3, 6, 8, 118, 11
VARIANZA POBLACIONAL
2
2 1
N
i
i
x
N
Cuantifica la cantidad de variabilidad o dispersión en relación a la media (o promedio) de las
observaciones.
PARA DATOS NO TABULADOS2
2 21
N
ii
x
N
n
XxS
n
ii
1
2
2
)(21
2
2 Xn
xS
n
ii
VARIANZA MUESTRAL
VARIANZA POBLACIONAL para Datos Agrupados en tabla de Frecuencia
N
nxk
iii
1
2
2
21
2
2
N
nxk
iii
n
nXxS
k
iii
1
2
2
21
2
2 Xn
nxS
k
iii
VARIANZA MUESTRAL para Datos Agrupados en tabla de Frecuencia
DESVIACIÓN ESTÁNDAR
2
La desviación estándar se define como la raíz La desviación estándar se define como la raíz cuadrada de la varianzacuadrada de la varianza
En la práctica, la desviación estándar se utiliza con más frecuencia que la varianza
Una de las razones es que se expresa en las mismas unidades de medida de la variable.
COEFICIENTE DE VARIACIÓN
Como el coeficiente de variación no tiene unidad de medida , permite comparar variabilidad entre distribuciones.
Se define como el cuociente entre LA DESVIACIÓN ESTÁNDAR y LA MEDIA:
SCV
X
APLICACIONES DEL COEFICIENTE DE VARIACIÓN
1.- Comparar variabilidad de dos distribuciones de una misma variable con unidades de medida
distintas.
Ejemplo: comparar la estatura de los estadounidenses , en pulgadas con la estatura
de los chilenos en cm.
2.- Comparar variabilidad de dos distribuciones de variables distintas.
Ejemplo: comparar la estatura en cm y el peso en kg. de los 20 niños seleccionados de
gimnasia artística:Estatura (X)Estatura (X) Peso (Y)Peso (Y)
128,5
8,4X
X
S
9,4
4,36
YS
Y
Comparar la variabilidad de estas dos distribuciones.
Peso de Corderos: s=40 k ; = 98 k
Peso de Toros: s=50 k; = 400 k
Peso de Elefantes: s=120 k; = 1500 k
¿Qué grupo presenta la menor dispersión?
3.- Comparar la variabilidad de distribuciones con promedios distintos.
X
X
X
MEDIDAS DE DISPERSIÓNMEDIDAS DE DISPERSIÓN
Partimos de una muestra de tamaño
n=15, 2 2 3 3 4 4 4 5 6 6 6 7 7 8 8
• RANGO O RECORRIDO: R = Max-Min =
7
1jj
2j
n
1i
2i
2 nXx151
Xxn1
S
8 - 2 = 6
7 -3 = 4
3.87
• RECORRIDO INTERCUARTÍLICO: RQ = Q3 - Q1 =
• VARIANZA
• CUASIDESVIACIÓN TÍPICA:
2sS = 2.04
• DESVIACIÓN TÍPICA:
= 1.97
7
1jj
2j
n
1i
2i
2 nxx141
xx1n-
1 S 4.14
• CUASIVARIANZA:
2sS
D mC V m
M e = 0.347
• COEFICIENTE DE VARIACIÓN MEDIA:
• COEFICIENTE DE VARIACIÓN DE PEARSON:
= 0.394
j
7
1jj
n
1ii nx
151
xn1
Dm
XX = 1.73
• DESVIACIÓN MEDIA:
XS
CV
AlturaAltura(cm)(cm)
Frecuencia Frecuencia AbsolutaAbsoluta
157 – 162157 – 162 77
162 – 167162 – 167 88
167 – 172167 – 172 99
172 – 177172 – 177 3030
177 – 182177 – 182 2525
182 – 187182 – 187 1414
TOTALTOTAL 9393
Distribución de frecuencia de la altura (cm) de los estudiantes de la generación 2008
0
10
20
30
40
50
60
149.5 154.5 159.5 164.5 169.5 174.5 179.5 184.5 189.5
Altura (cm)
Fre
cue
nci
a r
ela
tiva
Calcule la VARIANZA POBLACIONAL y la DESVIACIÓN ESTÁNDAR
MEDIDAS DE ASIMETRÍAMEDIDAS DE ASIMETRÍAMide el grado de deformación horizontal de la distribución de Frecuencias y se define:
I. Sk es la mas usada.
II. Sk se usa cuando la distribución es unimodal.
III. Sk, llamada también media asimétrica, se usa cuando existen intervalos extremos abiertos ilimitados y no es posible calcular el promedio y consecuentemente la varianza.
SMeX
Sk3
SMoX
Sk
13
31 2QQMeQQ
Sk
Si es una Distribución Asimétrica Sk = o o tiende a cero.
Si es una Distribución Asimétrica Positiva o sesgada a la derecha Sk > 0
Si es una Distribución Asimétrica Negativa o sesgda a la izquierda Sk < 0
Valor del Coef. AsimetríaValor del Coef. Asimetría CalificaciónCalificación
(-0.05(-0.05≤≤SSkk<0) ó (0<S<0) ó (0<Skk≤≤0.05)0.05) Casi simétricaCasi simétrica
(-0.3(-0.3≤≤SSkk<-0.05) ó (0.05<S<-0.05) ó (0.05<Skk≤≤0.30.3 Ligeramente asimétricaLigeramente asimétrica
(-0.6(-0.6≤≤SSkk< -0.3) ó (0.3 < S< -0.3) ó (0.3 < Skk≤≤0.6)0.6) ModeradamenteModeradamente
(S(Skk<-0.6) ó (S<-0.6) ó (Skk>0.6)>0.6) Muy asimétricaMuy asimétrica
Propiedades del Coeficiente de Asimetría (Continuación)
Renta familiar Longitud de piezas
Tamaño de partículasGasto en transporte
A B Longitud de piezas Tiempo entre accidentes
MEDIDAS DE KURTOSIS
)(2 1090
13
PPQQ
K
Mide el grado de deformación vertical de la distribución de Frecuencias y se define:
Si 0,2630 < K < 0,5 es una Distribución Leptokúrtica ( picuda o puntiaguda).
Si K< 0,2630 es una Distribución Mesokúrtica (moderada o normal).Si 0 < K < 0,2630 es una Distribución Platikúrtica (achatada o plana).
1.No tiene unidad de medida.
2.Se aplica a distribuciones unimodales con un valor del coeficiente de asimetría entre –0.3 y 0.3.
3.Su valor debe encontrarse en el intervalo 0 á 0.5.
DIAGRAMA DE CAJA (BOX-PLOT)DIAGRAMA DE CAJA (BOX-PLOT)Se construye del siguiente modo:
•Con los datos ordenados se obtienen los tres cuartiles
•Se dibuja un rectángulo cuyos extremos son Q1 y Q3 y se indica la posición de la mediana mediante una línea.
•Se calculan los límites de admisión ( los valores que queden fuera se consideran atípicos)
)QQ(5'1QLS
)QQ(5'1QLI
133
131
•Se dibuja una línea desde cada extremo del rectángulo hasta el valor más alejado no atípico.
•Se marcan todos los datos considerados como atípicos.
DIAGRAMA DE CAJA (BOX-DIAGRAMA DE CAJA (BOX-PLOT)PLOT)
Dato menor no atípicoMedia
Mediana
Dato mayor no atípico
Dato atípico
Box-and-Whisker Plot
Altura150 160 170 180 190 200
Dato atípicoQ1
Q3
PromedioPromedio 174.9174.9 MeMe 175.75175.75 MoMo 176.038462176.038462
S2S2 49.5949.59 Q1Q1 171.58333171.58333 Q3Q3 180.15180.15
SS 7.0427.042 LILI 158.73333158.73333
LSLS 193193
0
5
10
15
20
25
30
35
159.5 164.5 169.5 174.5 179.5 184.5