Upload
carlos-valenzuela-ramirez
View
24
Download
3
Embed Size (px)
DESCRIPTION
Medidas numéricas descriptivas - Análisis de datos
Citation preview
1 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
CURSO: Análisis de Datos para la Gerencia
José Antonio Robles Flores
Sistemas de Información y Métodos Cuantitativos
ESAN Graduate School of Business
Lima - Peru
Basado en: Levine; Krehbiel & Berenson 2014.
Estadística para Administración 6ta Edición.
Pearson.
2 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
CURSO: Análisis Cuantitativo para la Gerencia
SESSION 04: Medidas Numéricas Descriptivas
(Capítulo 03)
Basado en: Levine; Krehbiel & Berenson 2014. Estadística para
Administración 6ta Edición. Pearson.
3 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Medidas numéricas
• Medidas de posición (o localización)
– Media
– Mediana
– Moda
– Percentiles
– Cuartiles
• Medidas de Variabilidad
– Rango
– Rango intercuartiles (intercuartílico)
– Varianza
– Desviación Estándar
– Coeficiente de Variación
• Forma
– Sesgo
4 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Medidas de Resumen
Media Aritmética
Mediana
Moda
Descripción Numérica de la Data
Varianza
Desviación Estándar
Coeficiente de Variación
Rango
Rango Intercuartiles
Sesgo
Tendencia Central Variabilidad Forma Percentiles
Cuartiles
5 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Media Aritmética
• La media aritmética (media de la muestra) es la
medida de tendencia central más común
– Para una muestra de tamaño n: (para la población: µ
Tamaño de la muestra
n
XXX
n
X
X n21
n
1i
i
Valores observados
6 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
La Media Aritmética (continuación)
• La medida de tendencia central más común
• Media = suma de valores dividido entre el número de
valores
• Se ve afectada por los valores extremos (outliers)
0 1 2 3 4 5 6 7 8 9 10
Media = 3
0 1 2 3 4 5 6 7 8 9 10
Media = 4
35
15
5
54321
4
5
20
5
104321
7 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Mediana
• En un arreglo ordenado, la mediana es el número
en el “medio” (50% por arriba, 50% por debajo)
• No se ve afectada por los valores extremos
0 1 2 3 4 5 6 7 8 9 10
Mediana = 3
0 1 2 3 4 5 6 7 8 9 10
Mediana = 3
8 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Hallando la Mediana
• La localización de la mediana:
– Si el número de valores es impar, la mediana es el número en el
medio
– Si el número de valores es par, la mediana es el promedio de los dos
números del medio
• Note que no es el valor de la mediana, solo la posición
de la mediana en la data ordenada
ordenadadatalaenposiciónn
MedianaladePosición2
1
2
1n
9 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Una medida de tendencia central
• El valor que ocurre más frecuentemente
• No está afectado por los valores extremos
• Se utiliza tanto para datos numéricos como
categóricos (nominales)
• Es posible que no haya una moda
• Pueden haber varias modas
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Moda = 9
0 1 2 3 4 5 6
No hay Moda
Moda
10 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Cinco casas de playa en una loma
$2,000 K
$500 K
$300 K
$100 K
$100 K
Precios de la
Casas:
$2,000,000
500,000
300,000
100,000
100,000
Ejemplo de Repaso
11 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Media: ($3,000,000/5)
= $600,000
• Mediana: valor medio de datos
ordenados
= $300,000
• Moda: el valor más frecuente
= $100,000
Precios de las
casas:
$2,000,000
500,000
300,000
100,000
100,000
Suma $3,000,000
Ejemplo de Repaso: Estadísticas de Resumen
12 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• La media es la que generalmente se utiliza a menos que hallan valores extremos (outliers).
• Luego, la mediana es la más utilizada, puesto que la mediana no es sensible a los valores extremos. – Ejemplo: La mediana de los precios de las
casas es un valor que se puede reportar para una región – es menos sensible a los valores extremos
¿Qué medida de ubicación es la “mejor”?
13 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Percentiles
• Un percentil proporciona información sobre la
distribución de los datos en el intervalo de los datos
(del valor menor al valor mayor).
• Por ejemplo, los resultados del GMAT (o del
examen de admisión a ESAN) se reportan en
términos de percentiles.
• El p-ésimo percentil es un valor tal que por lo menos
p por ciento de las observaciones es menor o igual
a este valor y por lo menos (100-p) es mayor o igual
a ese valor.
14 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Ordenar los datos en orden ascendente.
Computar el índice i, la posición del p-ésimo percentil
i = (p/100)n
Si i no es un entero, redondear. El p-ésimo percentil es el valor en la i-ésima posición.
Si i es un entero, el p-ésimo percentil es el promedio de los valores en las posiciones i e i +1.
Percentiles
15 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Ejemplo para el percentil 80
i = (p/100)n = (80/100)70 = 56
Promediando los valores de los datos 56avo y 57avo:
Percentil 80 = (535 + 549)/2 = 542
Nota: Los datos están en orden ascendente.
Ejemplo: Alquiler de Departamentos
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
16 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Ejemplo para el percentil 80
Ejemplo: Alquiler de Departamentos
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
Por lo menos el 80% de los ítems toman un valor de 542 o menos
56/70 = .8 or 80% 14/70 = .2 or 20%
Por lo menos el 20% de los ítems toman un valor de 542 o más
17 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Cuartiles
• Los cuartiles dividen la data ordenada en 4 segmentos con igual número de valores por segmento
25% 25% 25% 25%
• El primer cuartil, Q1, es el valor para el cual 25% de las observaciones son más pequeñas y 75% más grandes
• Q2 es igual a la mediana (50% más pequeñas, 50% más grandes)
• Sólo 25% de las observaciones son más grandes que el tercer cuartil
Q1 Q2 Q3
18 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Encontrar un cuartil determinando el valor en la posición
apropiada en la data ordenada, donde
Posición del primer cuartil: Q1 = (n+1)/4
Posición del segundo cuartil: Q2 = (n+1)/2 (posición de la mediana)
Posición del tercer cuartil: Q3 = 3(n+1)/4
donde n es el número de valores observados
Fórmulas para los cuartiles
19 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
(n = 9)
Q1 está en la posición (9+1)/4 = 2.5 de la data ordenada,
entonces, utilizar el valor en medio del 2do y 3er valor,
entonces Q1 = 12.5
Cuartiles
Sample Data in Ordered Array: 11 12 13 16 16 17 18 21 22
• Ejemplo: Encuentre el primer cuartil
Q1 y Q3 son medidas de ubicación no-central
Q2 = mediana, una medida de tendencia central
20 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
(n = 9)
Q1 está en la posición (9+1)/4 = 2.5 de la data ordenada,
entonces Q1 = 12.5
Q2 está en la posición (9+1)/2 = 5th de la data ordenada,
entonces Q2 = mediana = 16
Q3 está en la posición 3(9+1)/4 = 7.5 de la data ordenada,
entonces Q3 = 19.5
Cuartiles (continuación)
Data muestral en arreglo ordenado: 11 12 13 16 16 17 18 21 22
• Ejemplo:
21 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Mismo centro,
diferente variación
Medidas de Variación (o Variabilidad)
Variación
Varianza Desviación
Estándar
Coeficiente
de Variación
Rango Rango
Intercuartil
• Las medidas de variación
brindan información
respecto a la dispersión o
variabilidad de los valores
de la data
22 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Rango
• La medida de variación más simple
• La diferencia entre los valores más grande y
más pequeño en un conjunto de datos:
Rango = Xmás grande – Xmás pequeño
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Rango = 14 - 1 = 13
Ejemplo:
23 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Ignora la forma en que la data está distribuida
• Sensible a los valores extremos
7 8 9 10 11 12
Rango = 12 - 7 = 5
7 8 9 10 11 12
Rango = 12 - 7 = 5
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
Rango = 5 - 1 = 4
Rango = 120 - 1 = 119
Desventajas del Rango
24 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Puede eliminar algunos problemas de valores extremos utilizando el rango intercuartil
• Eliminar algunas observaciones grandes y pequeñas y calcular el rango de los valores que quedan
• Rango Intercuartil = 3er cuartil – 1er cuartil
= Q3 – Q1
Rango Intercuartil
25 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Mediana
(Q2) X
máximo X mínimo Q1 Q3
Ejemplo:
25% 25% 25% 25%
12 30 45 57 70
Rango Intercuartil
= 57 – 30 = 27
Rango Intercuartil
26 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Promedio (aproximadamente) del cuadrado de las
desviaciones de los valores desde la media
– Varianza de la muestra:
Varianza
1-n
)X(X
S
n
1i
2
i2
Donde = media
n = tamaño de la muestra
Xi = iésimo valor de la variable X
X
27 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Desviación Estándar
• La medida de variabilidad más utilizada
• Muestra la variación sobre la media
• Es la raíz cuadrada de la varianza
• Tiene las mismas unidades que la data original
– Desviación estándar
de la muestra:
1-n
)X(X
S
n
1i
2
i
28 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Data de la
Muestra (Xi) : 10 12 14 15 17 18 18 24
n = 8 Media = X = 16
4.30957
130
18
16)(2416)(1416)(1216)(10
1n
)X(24)X(14)X(12)X(10S
2222
2222
Medida de la dispersión “promedio”
alrededor de la media
Ejemplo de cálculo:
Desviación estándar de la muestra
29 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Desviación estándar pequeña
Desviación estándar grande
Midiendo la variabilidad
30 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Comparando Desviaciones Estándar
Media = 15.5
S = 3.338 11 12 13 14 15 16 17 18 19 20 21
11 12 13 14 15 16 17 18 19 20 21
Data B
Data A
Media = 15.5
S = 0.926
11 12 13 14 15 16 17 18 19 20 21
Media = 15.5
S = 4.567
Data C
31 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Todos los valores en el conjunto de datos se utilizan
en el cálculo
• Los valores distantes de la media tienen un peso
extra
(porque las desviaciones de la media están elevadas al
cuadrado)
Ventajas de la Varianza y la Desviación Estándar
32 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Coeficiente de Variación
• Mide la variación relativa
• Siempre en porcentajes (%)
• Muestra la variación relativa a la media
• Puede utilizarse para comparar dos o más
conjuntos de datos medidos en diferentes unidades
100%X
SCV
33 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Acción A:
– Precio promedio el año pasado = $50
– Desviación estándar = $5
• Acción B:
– Precio promedio el año pasado = $100
– Desviación estándar = $5
Ambas
acciones tienen
la misma
desviación
estándar, pero
la acción B es
menos variable
en relación a su
precio
10%100%$50
$5100%
X
SCVA
5%100%$100
$5100%
X
SCVB
Comparando coeficientes de variación
34 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Medidas de Distribución
• Forma de la distribución
• Valores (o puntuaciones) z
• El Teorema de Chebyshev
• La Regla Empírica
• Detección de valores extremos (atípicos)
35 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Forma de la Distribución
• Describe cómo está distribuida la data
• Medidas de la forma
– Simétrica o sesgada
Media = Mediana Media < Mediana Mediana < Media
Sesgada a la
Derecha
Sesgada a la
Izquierda
Simétrica
36 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Forma de la Distribución: Sesgo
Una medida importante de la forma de una distribución es llamada sesgo.
La fórmula para el sesgo de una muestra de datos es:
El sesgo es computado por un paquete estadístico.
3
21 s
xx
))(n(n
nSesgo i
37 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Simétrica (no hay sesgo) F
recu
enci
a R
elat
iva
.05
.10
.15
.20
.25
.30
.35
0
Sesgo = 0
Sesgo es cero.
La media y la mediana son iguales.
Forma de la Distribución: Sesgo
38 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Fre
cuen
cia
Rel
ativ
a
.05
.10
.15
.20
.25
.30
.35
0
Moderadamente sesgada a la izquierda
Sesgo = .31
Sesgo es negativo.
La media será usualmente menos que la mediana.
Forma de la Distribución: Sesgo
39 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Moderadamente sesgada a la derecha F
recu
enci
a R
elat
iva
.05
.10
.15
.20
.25
.30
.35
0
Sesgo = .31
Sesgo es positivo
La media usualmente será más que la mediana.
Forma de la Distribución: Sesgo
40 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Altamente sesgada a la derecha
Fre
cuen
cia
Rel
ativ
a
.05
.10
.15
.20
.25
.30
.35
0
Sesgo = 1.25
El sesgo es positivo (usualmente mayor a 1.0).
La media usualmente será más que la mediana.
Forma de la Distribución: Sesgo
41 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Setenta departamentos fueron aleatoriamente muestreados. El precio de alquiler mensual para los departamentos aparece abajo en orden ascendente.
Forma de la Distribución: Sesgo
Ejemplo: Alquiler de Departamentos
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
42 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Fre
cuen
cia
Rel
ativ
a
.05
.10
.15
.20
.25
.30
.35
0
Sesgo = .92
Ejemplo: Alquiler de Departamentos
Forma de la Distribución: Sesgo
43 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Valores Z
• Una medida de la distancia hacia la media (por ejemplo, un
valor Z de 2.0 significa que un valor está a 2.0 desviaciones
estándar de la media)
• La diferencia entre un valor y la media, dividida entre la
desviación estándar
• Un valor Z por encima de 3.0 o por debajo de -3.0 se
considera un valor extremo (outlier)
S
XXZ
44 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Valores Z (continuación)
Ejemplo:
• Si la media es 14.0 y la desviación estándar es 3.0,
cuál es el valor Z para el valor 18.5?
• El valor 18.5 está 1.5 desviaciones estándar por
encima de la media
• (un valor Z negativo significa que un valor es menor
que la media)
1.53.0
14.018.5
S
XXZ
45 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Independientemente de cómo está distribuida la
data, al menos (1 - 1/z2) x 100% de los valores
estarán dentro de z desviaciones estándar de la
media (para z > 1)
– Ejemplos:
(1 - 1/12) x 100% = 0% ……..... z=1 (μ ± 1σ)
(1 - 1/22) x 100% = 75% …........ z=2 (μ ± 2σ)
(1 - 1/32) x 100% = 89% ………. z=3 (μ ± 3σ)
El Teorema (la regla) de Chebyshev
dentro de Al menos
46 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Si la distribución de la data tiene
aproximadamente la forma de campana,
entonces el intervalo:
• contiene aproximadamente el 68% de los
valores en la población o la muestra
La Regla Empírica
1σμ
μ
68%
1σμ
47 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• contiene aproximadamente el 95% de los valores en la población o la muestra
• contiene aproximadamente el 99.7% de
los valores en la población o la muestra
La Regla Empírica
2σμ
3σμ
3σμ
99.7% 95%
2σμ
48 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Análisis Exploratorio de la Data
• Gráfico de Caja y Bigote: Una representación visual de la data utilizando el resumen de 5 números:
Mínimo -- Q1 -- Mediana -- Q3 -- Máximo
Ejemplo:
Minimum 1st Median 3rd Maximum Quartile Quartile
Minimum 1st Median 3rd Maximum Quartile Quartile
25% 25% 25% 25%
3er
Cuartil
Mediana 1er
Cuartil
Mínimo Máximo
49 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Forma del Diagrama (Gráfico) de Caja
• La Caja y la línea central están centradas entre los puntos finales si la data es simétrica alrededor de la mediana
• Un gráfico de caja puede mostrarse tanto en el formato vertical como en el horizontal
Min Q1 Mediana Q3 Max
50 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Sesgo a la
Derecha
Sesgo a la
Izquierda Simétrica
Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3
La Forma de la Distribución y
el Gráfico de Caja y Bigote
51 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Gráfico de caja para la siguiente data:
0 2 2 2 3 3 4 5 5 10 27
• La data está sesgada a la derecha, como lo
muestra el gráfico
0 2 3 5 270 2 3 5 27
Min Q1 Q2 Q3 Max
Ejemplo de un gráfico de caja y bigote
52 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Diagrama de Caja (comparación entre grupos)
53 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Medidas de Asociación entre dos variables
• Hasta ahora hemos utilizado métodos numéricos
para una sola variable
• Pero usualmente estamos interesados en conocer
la relación entre dos variables para tomar
decisiones
• Dos medidas de descripción de las relaciones entre
dos variables son la covarianza y el coeficiente de
correlación.
54 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
La Covarianza de la Muestra
• La covarianza de la muestra mide el grado de relación
lineal entre dos variables (llamado data bivariada)
• La covarianza de la muestra:
– Sólo se preocupa por el grado de relación
– No se implica un efecto causal (relación causal)
1n
)YY)(XX(
)Y,X(cov
n
1i
ii
55 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Covarianza entre dos variables aleatorias:
cov(X,Y) > 0 X e Y tienden a moverse en la misma
dirección
cov(X,Y) < 0 X e Y tienden a moverse en direcciones
opuestas
cov(X,Y) = 0 X e Y son independientes
Interpretando la Covarianza
56 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Coeficiente de Correlación
• Mide el grado relativo de relación lineal entre
dos variables
• Coeficiente de correlación de la muestra:
donde
YXSS
Y),(Xcovr
1n
)X(X
S
n
1i
2
i
X
1n
)Y)(YX(X
Y),(Xcov
n
1i
ii
1n
)Y(Y
S
n
1i
2
i
Y
57 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Características del
Coeficiente de Correlación, r
• No tiene unidades
• El rango está entre –1 y 1
• A medida que se acerca a –1, más fuerte la relación
lineal negativa
• A medida que se acerca a 1, más fuerte la relación
lineal positiva
• A medida que se acerca a 0, más débil la relación lineal
58 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Diagramas de Dispersión de Data con
Varios Coeficientes de Correlación
Y
X
Y
X
Y
X
Y
X
Y
X
r = -1 r = -.6 r = 0
r = +.3 r = +1
Y
X r = 0
59 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Seleccione Herramientas
/ Análisis de Datos
• Elegir Correlación del
menú de selección
• Clic Aceptar . . .
Utilizando Excel para encontrar
el Coeficiente de Correlación
60 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Ingresar el rango de datos y
seleccionar la opción
correspondiente
• Clic Aceptar para obtener el
resultado
Utilizando Excel para encontrar
el Coeficiente de Correlación (continuación)
61 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Interpretando el Resultado
• r = .733
• Hay una relativa relación lineal fuerte entre el puntaje del examen #1 y el puntaje del examen #2
• Los estudiantes que lograron un puntaje alto en el primer examen tienden a obtener un puntaje alto en el segundo y los estudiantes que obtuvieron un puntaje bajo en el primer examen tienden a obtener puntajes bajos en el segundo examen
Diagrama de Dispersión de los
Puntajes de Examen
70
75
80
85
90
95
100
70 75 80 85 90 95 100
Puntaje Examen #1
Pu
nta
je E
xa
me
n #
2
62 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Trampas y peligros en las
Medidas Numéricas de Descripción
• El análisis de datos es objetivo
– Se debe reportar el resumen de medidas que mejor
describe los supuestos sobre el conjunto de datos
• La interpretación de la data es subjetiva
– Debe realizarse de manera justa, neutral y clara
63 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Consideraciones Éticas
Las medidas numéricas de descripción:
• Deben documentar resultados tanto buenos como
malos
• Deben presentarse de manera justa, objetiva y
neutral
• No debe utilizarse medidas de resumen
inapropiadas que distorsionen los hechos
64 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Resumen del Capítulo
• Se describió las medidas de tendencia central
– Media, mediana, moda, media geométrica
• Se discutió el concepto de cuartiles
• Se describió las medidas de variabilidad
– Rango, rango intercuartil, varianza y desviación estándar, coeficiente de
variación, valores Z
• Se ilustró las formas de la distribución
– Simétrica, sesgada, gráficos de caja y bigotes
• Se discutió la covarianza y el coeficiente de correlación
• Se trataron las trampas y peligros en el uso de medidas numéricas de
descripción y algunas consideraciones éticas