18
Estadística Descriptiva SESIÓN 11 Medidas de dispersión

Estadística Descriptiva - Mi Materia en Líneamoodle2.unid.edu.mx/dts_cursos_mdl/ejec/AE/ED/S11/ED11...Introducción de la sesión 11 Las medidas de dispersión se asocian a la precisión

Embed Size (px)

Citation preview

Estadística Descriptiva SESIÓN 11

Medidas de dispersión

Contextualización de la sesión 11

En la sesión anterior se explicaron los temas relacionados con la dispersión, una de las medidas de dispersión, además de los diversos temas relacionados con ella. Esta es una cuantificación del grado de alejamiento de los datos respecto a su media aritmética. Ahora es necesario conocer otra de las medidas de dispersión conocida como desviación típica o estándar y los temas relacionados con esta medida.

Al terminar esta sesión habrás comprendido el concepto de desviación estándar relacionado con los estudios estadísticos.

Introducción de la sesión 11

Las medidas de dispersión se asocian a la precisión

estadística de las observaciones o datos muestrales. Cuando

la dispersión de un conjunto de datos es muy alta, las

estimaciones que se realizan en función de éstas conllevan un

notable grado de imprecisión. Y en sentido inverso, cuando un

conjunto de datos presenta una dispersión baja, el nivel de

incertidumbre disminuye notablemente.

La desviación típica o estándar, denotada por la literal s, es una

medida de dispersión que se emplea para variables de razón

(también conocidas como ratio o cociente) y para variables de

intervalo. La desviación estándar se considera una medida

cuadrática que representa el promedio de las desviaciones

(distancias) de los datos muestrales respecto de su media

aritmética, expresada en las mismas unidades que la variable.

Explicación: Desviación típica o

estándar

La fórmula para calcular la desviación estándar para

datos no agrupados está dada por la siguiente

expresión:

Explicación: Desviación típica o

estándar

Dónde:

Explicación: Desviación típica o

estándar

n = Número de datos o elementos de la muestra.

i = Índice de la suma que toma los valores 1, 2, 3...n.

xi = Valor del i-ésimo dato de la muestra.

= Media aritmética de la muestra.

Es importante señalar que la siguiente fórmula se

considera más apropiada para una mejor estimación de

la desviación estándar de la población a partir de la

muestra:

Explicación: Desviación típica o

estándar

Cualquiera de las fórmulas puede usarse indistintamente, pero

en la práctica es común el uso de la segunda. En ésta, al

cociente n – 1 se le denomina corrección de Bessel.

Calculemos la desviación estándar para el siguiente conjunto de

datos no agrupados:

A = {2, 4, 6, 8, 10}

De este conjunto se desprende que:

Explicación: Desviación típica o

estándar

n = 5 x1 = 2 x2 = 4 x3 = 6 x4 = 8 x5 = 10

Con estos datos, procedemos a calcular la media aritmética

del conjunto:

Y a continuación se sustituyen los valores anteriores en la

fórmula:

Explicación: Desviación típica o

estándar

Tal como se muestra a continuación:

Explicación: Desviación típica o

estándar

Por su parte, la fórmula para calcular la desviación estándar de

datos agrupados está dada por la siguiente expresión:

Dónde:

Explicación: Desviación típica o

estándar

k = Número de intervalos de clase en la distribución de frecuencias.

n = Número de datos o elementos de la muestra.

i = Índice de la suma que toma los valores 1,2,3...k.

fi = Frecuencia del i-ésimo intervalo de clase.

xi = Marca de clase del i-ésimo intervalo de la muestra.

Media aritmética de la muestra.

Para calcular la desviación estándar en un conjunto de datos

agrupados, también empleamos la versión que incorpora la

corrección de Bessel. Como puede observarse, cada elemento

de la fórmula se toma directamente de la tabla de datos

agrupados. Considerando el caso práctico de una bebida, se

toma de la tabla de datos agrupados las columnas referentes a

las frecuencias de clase (fi) y a las marcas de clase (xi).

Explicación: Desviación típica o

estándar

De esta tabla se obtienen los siguientes valores para las frecuencias de clase:

Y para las marcas de clase:

Asimismo, dado que hay cinco intervalos de clase y la muestra tiene 100 elementos, los valores de k y n respectivamente son:

Y como ya se determinó en ejercicios anteriores:

= 20

Explicación: Desviación típica o

estándar

f1 = 5 f2 = 10 f3 = 30 f4 = 40 f5 = 15

x1 = 7.5 x2 = 12.5 x3 = 17.5 x4 = 22.5 x5 = 27.5

k = 5 n = 100

Ahora, sustituyendo estos valores en la respectiva

fórmula se tiene que:

Explicación: Desviación típica o

estándar

La desviación estándar es una medida de dispersión que

nos permite evaluar la incertidumbre de los datos

obtenidos por la muestra; es decir, analiza todos aquellos

datos que se alejan de nuestro promedio para determinar

si nuestra predicción o teoría está alejada del modelo

que se construyó con la muestra.

Explicación: Desviación típica o

estándar

En esta sesión se han explicado la desviación estándar como

una medida de dispersión, que sirve para evaluar la

incertidumbre de los datos de una muestra, además, se

explicó el procedimiento para el correcto cálculo de esta

desviación en un conjunto de datos no agrupados y

agrupados.

Conclusión

En la siguiente sesión conocerás los temas correspondientes a

la varianza como la última de las medidas de dispersión, así

como el procedimiento para su cálculo en conjuntos de datos

agrupados y no agrupados.

Conclusión