Trabajo Medidas de Tendencia Central

CENTRO DE ESTUDIOS SUPERIORES ISLA DEL CARMEN

LICENCIATURA: INGENIERIA INDUSTRIAL

MEDIDAS DE TENDENCIA CENTRAL

DANIEL IVAN CEBALLOS CABRERA DIAZ

PROBABILIDAD Y ESTADISTICA

RESUMEN

03 DE SEPTIEMBRE DEL 2009

MEDIDAS DE TENDENCIA CENTRAL

Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida (Media) o parámetro de tendencia central o de centralización.

Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de que esta esté más o menos centrada, se habla de estas medidas como medidas de posición. En este caso se incluyen también los cuantiles entre estas medidas.

Las medidas de tendencia central corresponden a valores que generalmente se ubican en la parte central de un conjunto de datos. (Ellas permiten analizar los datos en torno a un valor central). Entre éstas están la media aritmética, la moda y la mediana.

Entre las medidas de tendencia central tenemos:

Media aritmética. Media ponderada. Media geométrica. Media armónica. Mediana. Moda.

La media aritmética

La media aritmética es el valor obtenido sumando todas las observaciones y dividiendo el total por el número de observaciones que hay en el grupo.

X =suma de todos los valores

=x1 + x2 + x3 + x4 + ......

número total de datos n

La media resume en un valor las características de una variable teniendo en cuenta a todos los casos. Solamente puede utilizarse con variables cuantitativas.

_( X )

http://es.wikipedia.org/wiki/Moda_(estad%C3%ADstica)

http://es.wikipedia.org/wiki/Mediana_(estad%C3%ADstica)

http://es.wikipedia.org/wiki/Media_arm%C3%B3nica

http://es.wikipedia.org/wiki/Media_geom%C3%A9trica

http://es.wikipedia.org/wiki/Media_ponderada

http://es.wikipedia.org/wiki/Media_aritm%C3%A9tica

http://es.wikipedia.org/wiki/Cuantil

Ejemplo 1: Datos Agrupados

Notas de 5 alumnos en una prueba:

Alumno Nota 1 6.0 2 5.4 3 3.1 4 7.0 5 6.1

Entonces se suman las Notas: 6.0+5.4+3.1+7.0+6.1=27.6 Luego el total se divide entre la cantidad de alumnos: 27.6/5=5.52

LA MEDIA ARITMÉTICA EN ESTE PROBLEMA SERÍA 5.52 Este número representa el promedio.


Cuando se tienen muchos datos es más conveniente agruparlos en una tabla de frecuencias y luego calcular la media aritmética. El siguiente cuadro lo ilustra.

Largo (en m) Frecuencia absoluta Largo por Frecuencia absoluta

3 10 5 . 10 = 50

6 15 6 . 15 = 90

7 20 7 . 20 = 140

8 12 8 . 12 = 96

9 6 9 . 6 = 54

Frecuencia total = 63 430

X =430 =

6,825

63

Se debe recordar que la frecuencia absoluta indica cuántas veces se repite cada valor, por lo tanto, la tabla es una manera más corta de anotar los datos (si la frecuencia absoluta es 10, significa que el valor a que corresponde se repite 10 veces).

Ejemplo 3: Datos No Agrupados

Calcular la T.A. sistólica media de 5 pacientes en los que se han obtenido las siguientes cifras. 110, 118, 125, 136, 145

X = 110 + 118 + 125 + 136 + 145 = 634 = 126,8

5 5


xi fi xi . fi

1 3 3

2 4 8

3 6 18

4 5 20

5 2 10

___ ___

20 59

X = Σxi . fi = 59 = 2,95

N 20

La estatura media como resumen de una población homogénea (abajo) o heterogénea (arriba).

La media aritmética es, probablemente, uno de los parámetros estadísticos más extendidos. Se le llama también promedio o, simplemente, media.

Definición formal

Dado un conjunto numérico de datos, x1, x2,..., xn, se define su media aritmética como

DATOS SIN AGRUPAR:

X = x1 + x2 + x3 +....... + xn = Σxi N N

DATOS AGRUPADOS:

X = Σxi. fi N

Esta definición varía, aunque no sustancialmente, cuando se trata de variables continuas, esto es, también puede calcularse para variables agrupadas en intervalos.

Propiedades

Las principales propiedades de la media aritmética son:

http://es.wikipedia.org/wiki/Intervalo_(matem%C3%A1tica)

http://es.wikipedia.org/wiki/Variable_estad%C3%ADstica

http://es.wikipedia.org/wiki/Archivo:Estatura_media.svg

Su cálculo es muy sencillo y en él intervienen todos los datos.

Su valor es único para una serie de datos dada.

Se usa con frecuencia para comparar poblaciones, aunque es más apropiado acompañarla de una medida de dispersión.

Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos, ya que tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio valor:

Minimiza las desviaciones cuadráticas de los datos respecto de

cualquier valor prefijado, esto es, el valor de es mínimo cuando . Este resultado se conoce como Teorema de König. Esta propiedad permite interpretar uno de los parámetros de dispersión más importantes: la varianza.

Se ve afectada por transformaciones afines (cambios de origen y escala), esto es, si

xi' = axi + b entonces , donde es la media aritmética de los xi', para i = 1, ..., n y a y b números reales.

Es poco sensible a fluctuaciones muéstrales, por lo que es un parámetro muy útil en inferencia estadística.

Inconvenientes de su uso

Este parámetro, aún teniendo múltiples propiedades que aconsejan su uso en situaciones muy diversas, tiene también algunos inconvenientes, como son:

Para datos agrupados en intervalos (variables continuas) su valor oscila en función de la cantidad y amplitud de los intervalos que se consideren.

Es una medida a cuyo significado afecta sobremanera la dispersión, de modo que cuanto menos homogéneos son los datos, menos información proporciona. Dicho de otro modo, poblaciones muy distintas en su composición pueden tener la misma media.4 Por ejemplo, un equipo de baloncesto con cinco jugadores de igual estatura, 1,95, pongamos por caso, tendría una estatura media de 1,95, evidentemente, valor que representa fielmente a esta homogénea población. Si embargo, un equipo de estaturas más heterogéneas, 2,20, 2,15, 1,95, 1,75 y 1,70, por ejemplo, tendría también, como puede comprobarse, una estatura media de 1,95, valor que no representa a casi ninguno de sus componentes.

http://es.wikipedia.org/wiki/Intervalo_(matem%C3%A1tica)

http://es.wikipedia.org/wiki/Inferencia_estad%C3%ADstica

http://es.wikipedia.org/wiki/Funci%C3%B3n_lineal#Abuso_del_lenguaje:_identificaci.C3.B3n_con_funciones_afines

http://es.wikipedia.org/wiki/Par%C3%A1metro_estad%C3%ADstico#Varianza_y_desviaci.C3.B3n_t.C3.ADpica

http://es.wikipedia.org/w/index.php?title=Teorema_de_K%C3%B6nig&action=edit&redlink=1

http://es.wikipedia.org/wiki/Centro_de_masas

http://es.wikipedia.org/wiki/Equilibrio_mec%C3%A1nico

En el cálculo de la media no todos los valores contribuyen de la misma manera. Los valores altos tienen más peso que los valores cercanos a cero. Por ejemplo, en el cálculo del salario medio de un empresa, el salario de un alto directivo que gane 1.000.000 de € tiene tanto peso como el de diez empleados "normales" que ganen 1.000 €. En otras palabras, se ve muy afectada por valores extremos.

No se puede determinar si en una distribución de frecuencias hay intervalos de clase abiertos.

Media aritmética ponderada

A veces puede ser útil otorgar pesos o valores a los datos dependiendo de su relevancia para determinado estudio. En esos casos se puede utilizar una media ponderada.

Si x1,x2,...,xn son nuestros datos y w1,w2,...,wn son sus "pesos" respectivos, la media ponderada se define de la siguiente forma:

Media muestral

Esencialmente, la media muestral es el mismo parámetro que el anterior, aunque el adjetivo "muestral" se aplica a aquellas situaciones en las que la media aritmética se calcula para un subconjunto de la población objeto de estudio.

La media muestral es un parámetro de extrema importancia en la inferencia estadística, siendo de gran utilidad para la estimación de la media poblacional, entre otros usos.

Moda (Mo)

La moda es el dato más repetido, el valor de la variable con mayor frecuencia absoluta. En cierto sentido se corresponde su definición matemática con la locución "estar de moda", esto es, ser lo que más se lleva.

Su cálculo es extremadamente sencillo, pues sólo necesita de un recuento. En variables continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario obtener un valor concreto de la variable, se recurre a la interpolación.

Ejemplo 1:

Número de personas en distintos carros en una carretera: 5-7-4-6-9-5-6-1-5-3-7 en este caso el número que más se repite es 5, entonces la moda es 5.

http://es.wikipedia.org/wiki/Moda_(estad%C3%ADstica)#Moda_de_datos_agrupados

http://es.wikipedia.org/wiki/Moda

http://es.wikipedia.org/wiki/Frecuencia_estad%C3%ADstica

http://es.wikipedia.org/wiki/Estimaci%C3%B3n

http://es.wikipedia.org/wiki/Inferencia_estad%C3%ADstica

http://es.wikipedia.org/wiki/Muestra_estad%C3%ADstica

http://es.wikipedia.org/wiki/%E2%82%AC

Ejemplo 2:

Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de niñas de un Jardín Infantil.

5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3

La edad que más se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)

Ejemplo 3:

20, 12, 14, 23, 78, 56, 96

En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este conjunto de valores no tiene moda.

Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Cuando en una distribución de datos se encuentran tres o más modas, entonces es multimodal. Por último, si todas las variables tienen la misma frecuencia diremos que no hay moda.

Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha de definir el intervalo modal. El intervalo modal es el de mayor frecuencia absoluta.

La moda, cuando los datos están agrupados, es un punto que divide al intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:

Siendo ni la frecuencia absoluta del intervalo modal y ni − 1 y ni + 1 las frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una clase viene dada por la siguiente tabla (debajo):

Calificaciones 1 2 3 4 5 6 7 8 9

Número de alumnos 2 2 4 5 8 9 3 4 2

Propiedades

Sus principales propiedades son:

Cálculo sencillo. Interpretación muy clara.

http://es.wikipedia.org/wiki/Archivo:Imagenmarcos2.JPG

Al depender sólo de las frecuencias, puede calcularse para variables cualitativas. Es por ello el parámetro más utilizado cuando al resumir una población no es posible realizar otros cálculos, por ejemplo, cuando se enumeran en medios periodísticos las características más frecuentes de determinado sector social. Esto se conoce informalmente como "retrato robot".

Inconvenientes

Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a variaciones muéstrales. Por otra parte, en variables agrupadas en intervalos, su valor depende excesivamente del número de intervalos y de su amplitud.

Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de la moda, no afectan en modo alguno a su valor.

No siempre se sitúa hacia el centro de la distribución. Puede haber más de una moda en el caso en que dos o más valores de

la variable presenten la misma frecuencia (distribuciones bimodales o multimodales).

Mediana (Med)

La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez que estos están ordenados de menor a mayor.

Según el número de valores que se tengan se pueden presentar dos casos:

1. Si el número de valores es impar, la Mediana corresponderá al valor central de dicho conjunto de datos.

2. Si el número de valores es par, la Mediana corresponderá al promedio de los dos valores centrales (los valores centrales se suman y se dividen por 2).

DATOS SIN AGRUPAR:

a) Nº de datos impares: Valor central

7, 4, 2, 5,9 2, 4, 5, 7,9 X = 5

b) Nº de datos pares: Media de los dos valores centrales:

7,4,2,5,9,6 2,4,5,6,7,9 X = 5 +6 = 5,5

2

Ejemplo 1: Datos Impares

Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2

Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene:

http://es.wikipedia.org/w/index.php?title=Variable_cualitativa&action=edit&redlink=1

http://es.wikipedia.org/w/index.php?title=Variable_cualitativa&action=edit&redlink=1

1, 2, 4, 5, 8, 9, 10

El 5 corresponde a la Med, porque es el valor central en este conjunto de datos impares.

Ejemplo 2: Datos Pares

El siguiente conjunto de datos está ordenado en forma decreciente, de mayor a menor, y corresponde a un conjunto de valores pares, por lo tanto, la Med será el promedio de los valores centrales.

21, 19, 18, 15, 13, 11, 10, 9, 5, 3

Med =13 + 11

=24

= 122 2

Ejemplo 3: Datos Pares

En el gráfico de barras (que tiene un número par de columnas) los valores centrales son 72 y 77, por lo tanto, la

Med =

72 + 77 = Med

= 149

= 74,52 2

Ejemplo 4:

La mediana del número de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2:

En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los anteriores:

Se toma como mediana

Existen métodos de cálculo más rápidos para datos más númerosos (véase el artículo principal dedicado a este parámetro). Del mismo modo, para valores agrupados en intervalos, se halla el "intervalo mediano" y, dentro de este, se obtiene un valor concreto por interpolación.

Cálculo de la mediana para datos agrupados

Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla).

Así, aplicando la formula asociada a la mediana para n impar, obtenemos X (39+1)/2 = X20 y basándonos en la fórmula que hace referencia a las frecuencias absolutas:

Ni-1< n/2 < Ni = N19 < 19.5 < N20

X = Li + N/2 – fd

fc

Donde: Li = Límite inferior del intervalo crítico

N = Nº total de datos

fd = Frecuencia acumulada por debajo del intervalo crítico

http://es.wikipedia.org/wiki/Mediana_(estad%C3%ADstica)

fc = Frecuencia del intervalo crítico

i = Amplitud del intervalo

Por tanto la mediana será el valor de la variable que ocupe el vigésimo lugar. En nuestro ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos (es aconsejable no olvidar las unidades; en este caso como estamos hablando de calificaciones, serán puntos)

La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o más.

Ejemplo 5 (N par):

Las calificaciones en la asignatura de Matemáticas de 38 alumnos de una clase vienen dadas por la siguiente tabla (debajo):

Calificaciones 1 2 3 4 5 6 7 8 9

Número de alumnos 2 2 4 5 6 9 4 4 2

Calculemos la Mediana:

Primero hallamos las frecuencias absolutas acumuladas Fi

Si volvemos a utilizar la fórmula asociada a la mediana para n par, obtenemos X (38/2) = X19 y basándonos en la fórmula que hace referencia a las frecuencias absolutas --> Ni-1< n/2 < Ni = N18 < 19 < N19

xi fi Fi

1 2 2

2 2 4

3 4 8

4 5 13

5 6 19 = 19

6 9 28

7 4 32

8 4 36

9 2 38

Con lo cual la mediana será la media aritmética de los valores de la variable que ocupen el decimonoveno y el vigésimo lugar.

En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigésimo el 6, (desde el vigésimo hasta el vigésimo octavo)

Con lo que Me = (5+6)/2 = 5,5 puntos.

La mitad de la clase ha obtenido un 5,5 o menos y la otra mitad un 5,5 o más

Propiedades e inconvenientes

Las principales propiedades de la mediana son:

Es menos sensible que la media a oscilaciones de los valores de la variable. Un error de transcripción en la serie del ejemplo anterior en, pongamos por caso, el último número, deja a la mediana inalterada.

Como se ha comentado, puede calcularse para datos agrupados en intervalos, incluso cuando alguno de ellos no está acotado.

No se ve afectada por la dispersión. De hecho, es más representativa que la media aritmética cuando la población es bastante heterogénea. Suele darse esta circunstancia cuando se resume la información sobre los salarios de un país o una empresa. Hay unos pocos salarios muy altos que elevan la media aritmética haciendo que pierda representatividad respecto al grueso de la población. Sin embargo, alguien con el salario "mediano" sabría que hay tanta gente que gana más dinero que él, como que gana menos.

Sus principales inconvenientes son que en el caso de datos agrupados en intervalos, su valor varía en función de la amplitud de estos. Por otra parte, no se presta a cálculos algebraicos tan bien como la media aritmética.

Medidas de posición no central (Índices de posición)

En estadística descriptiva, las medidas de posición no central permiten conocer otros puntos característicos de la distribución que no son los valores centrales. Entre las medidas de posición central más importantes están los cuantiles que son aquellos valores de la variable, que ordenados de menor a mayor, dividen a la distribución en partes, de tal manera que cada una de ellas contiene el mismo número de frecuencias.

Los tipos más importantes de cuantiles son:

Los cuartiles, que dividen a la distribución en cuatro partes; Los quintiles, que dividen a la distribución en cinco partes;

http://es.wikipedia.org/wiki/Estad%C3%ADstica_descriptiva

Los deciles, que dividen a la distribución en diez partes; Los percentiles, que dividen a la distribución en cien partes.

PERCENTILES (P): Es el valor de la variable por debajo del cual se encuentra un porcentaje determinado de observaciones.

CUARTILES (Q): Son los valores de la variable que dejan por debajo el

25% de los datos............... Primer cuartil Q1 (25%)

50% de los datos................ Segundo cuartil Q2 (50%)

75% de los datos................ Tercer cuartil Q3 (75%)

USO DE LAS MEDIDAS DE TENDENCIA CENTRAL

¿Cuál será la medida de tendencia central que se debe usar,

teniendo un conjunto de observaciones?

Para responder a este cuestionamiento, se debe tomar en cuenta la

necesidad de considerar dos factores muy importantes uno es la escala de

medición, que tiene que ser ordinal o numérica; y otra, la forma de distribución

de las observaciones, porque se tiene que saber si la distribución de las

observaciones se desvía a la izquierda o a la derecha de la media. Si hay

observaciones distantes en una sola dirección se trata de una distribución

sesgada. Si los valores distantes son pequeños se sesga a la izquierda, sesgo

negativo. Si los valores distantes son grandes se sesga a la derecha, sesgo

positivo

Izquierda

derecha

MedianaMediana

Media Media

Sesgo negativo sesgo positivo

Distribuciones simétricas

Las siguientes reglas deben considerarse al decidir cual medida se

aplicará a las observaciones del trabajo de investigación. La media se usa para

datos numéricos y distribuciones simétricas, es decir sin ningún tipo de sesgo,

y es sensible a los valores absolutos. La mediana se emplea para datos

ordinales o para datos numéricos con distribución sesgada, porque no es

sensible a la variación de los extremos. El modo se utiliza para distribuciones

bimodales (dos observaciones que se repiten el mismo numero de veces en la

distribución). Una forma de saber la forma que tiene la distribución de

observaciones es la siguiente: Si la media y la mediana son iguales la

distribución es simétrica (se usa la media). Si la media es mayor que la

mediana, la distribución está sesgada a la derecha. Si la media es menor que

la mediana la distribución está sesgada a la izquierda (en los últimos dos

casos, se usa la mediana).

MEDIDAS DE DISPERSIÓN

Cuando se tiene una serie de mediciones de observaciones realizadas

en una investigación no basta con presentar la media o la mediana según sea

el caso. Desde luego que la información no es despreciable, pero se requiere

lograr información mas objetiva, por ejemplo saber como es la variación de

dichas observaciones, es decir, como se dispersan, o se sitúan en el área bajo

la curva.

Varias son las medidas estadísticas, que se utilizan para dar una idea

clara de cómo es la dispersión o variación de las observaciones. Entre otras, el

Mediana

Media

rango, extensión o amplitud, la desviación estándar, el coeficiente de

variación, percentiles y el rango o amplitud intercuartil.

VARIANZA: Es la media de los cuadrados de las diferencias entre cada valor

de la variable y la media aritmética.

_

S² = Σ (xi - X )² o bien S² = 1 Σxi ² - ( Σ xi ) ²

N N N

Para datos agrupados:

S² = Σ fi (xi - X )² o bien S² = 1 Σfi . xi ² - ( Σ fi . xi ) ²

N N N

DESVIACIÓN TÍPICA: Es la raíz cuadrada de la varianza

La diferencia entre la observación mas grande y la mas pequeña es lo

que se denomina rango (Recorrido o Amplitud), lo primero que se tiene que

hacer es organizar los datos, por ejemplo en una grafica de tronco y hoja o bien

una lista en orden ascendente o descendente. Se hace la operación aritmética

y se obtiene un número que es el rango, esta información o número obtenido

es poco útil, por lo cual muchos autores al mencionar y exponer el rango,

anotan los valores mínimo y máximo de la lista de observaciones, lo cual tiene

mayor utilidad, porque nos indica de alguna forma como están dispersos los

datos o más bien cual es la amplitud de la dispersión de las observaciones.

RANGO SEMIINTERCUARTÍLICO:

Es la semidiferencia entre el tercer cuartil y el primero

(Q3 – Q1) / 2

Ejemplo 1:

23,34,33,32,35,36,28,27,30 ( primero ponerlos en orden)

23, 27, 28, 30, 32, 33, 34, 35,36

En el primer caso, el rango sería = (36 – 23 = 13)

En el segundo caso se pondría: rango = 23 a 36, esta información

tendría mayor utilidad para describir la amplitud de los datos

Cuando se tienen intervalos en una tabla de frecuencias, se hace un cálculo

aproximado usando el límite inferior del intervalo de clase menor y el límite

superior del intervalo de clase más alto. En el ejemplo de abajo sería 3.0 a 7.9

Una medida de dispersión, muy útil y por lo tanto comúnmente utilizada

es la desviación estándar.

Es una medida de cómo se dispersan los datos alrededor de su media.

Partimos del hecho de que se pudiera medir que tanto se desvía de la media,

cada una de las observaciones. Se sumarían todas estas mediciones y se

dividirían entre el número de ellas, para formar una analogía de la media. Es

decir una desviación media, luego entonces tendría como fórmula (X – X) /

n. Sin embargo si sumamos todas las desviaciones el resultado será siempre

igual a cero. Entonces se pueden hacer dos cosas, una sumar los valores

absolutos de las desviaciones (sin signos, por ejemplo el valor absoluto de 3 es

I3I, y de –3 es I –3 I entonces es igual a 3 el número con barras verticales) o

bien elevando al cuadrado las desviaciones antes de sumarlas (se quitan los

signos) entonces quedaría la fórmula, así

Intervalos

3.0 – 3.9

4.0 – 4.9

5.0 – 5.9

6.0 – 6.9

7.0 – 7.9

I X – X I / n, sin embargo ésta fórmula, no es útil para hacer inferencias. Por

lo tanto se usa la segunda opción que es elevar al cuadrado las desviaciones

antes de sumarlas y se extrae la raíz cuadrada para volver al estado original de

medición de las observaciones. El denominador también se modifica, para

producir una estimación más precisa de la desviación estándar verdadera de la

población, queda n – 1, para que no se tenga el resultado de cero (que es en

otras operaciones lo que se conoce como grados de libertad)

Pacientes X X – X (X – X)2

1 0.13 0.01 0.0001

2 0 -0.12 0.0144

3 -0.18 -0.30 0.0900

4 -0.15 -0.27 0.0729

5 0.11 -0.01 0.0001

6 0.43 0.31 0.0961

7 0.41 0.29 0.0841

8 -0.12 -0.24 0.0576

9 0.06 -0.06 0.0036

10 0.06 -0.06 0.0036

11 -0.19 -0.31 0.0961

12 0.39 0.27 0.0729

13 0.30 0.18 0.0324

14 0.18 0.06 0.0036

15 0.11 -0.01 0.0001

16 0.94 0.82 0.6724

17 -0.07 -0.19 0.0361

18 -0.23 -0.35 0.1225

total 2.18 1.4586

La varianza es el resultado obtenido, antes de extraer la raíz cuadrada

La raíz cuadrada = 0.2929 que es la desviación estándar (DE)

La variación o desviación de los datos del paciente 16 es casi la mitad

del resultado total, si se elimina, la DE es igual a 0.22, lo que demuestra la

importancia de que una o más desviaciones sean muy distantes de la media.

Un aspecto relevante es que la desviación de la media indica por

ejemplo que 2 DE abarcan casi las tres cuartas partes de todos los datos

(75%), es decir 2DE de la media.

En una distribución simétrica 67% de las observaciones quedan entre la

media y 1DE 95% quedan entre 2DE, y 99.7% se agrupan entre 3DE.

Otra medida útil para la dispersión relativa de los datos es el coeficiente

de variación es la desviación estándar dividida entre la media por 100%, es

una medida de la variación relativa con respecto a la media, y se usa cuando

se comparan dos escalas de medición diferentes, este coeficiente las

estandariza. La fórmula es: CV = (DE / X) 100%. Los valores del resultado

indican que tan grande o pequeña es la variación, si es pequeña se puede

utilizar adecuadamente por ejemplo una prueba diagnostica.

Documents

Trabajo Medidas de Tendencia Central