41
ESTADISTICA DESCRIPTIVA Tablas y gráficos de frecuencias. Medidas de resumen para variables cuantitativas. Análisis Exploratorio de Datos

Medidas de Resumen

Embed Size (px)

DESCRIPTION

estadistica medidas de resumen

Citation preview

Page 1: Medidas de Resumen

ESTADISTICA DESCRIPTIVA

Tablas y gráficos de frecuencias.

Medidas de resumen para variables cuantitativas.

Análisis Exploratorio de Datos

Page 2: Medidas de Resumen

2

Al resumir datos cuando la variable es cuantitativa, surgen preguntas como:

¿Existen valores extraños? ¿Los datos siguen una distribución simétrica

o no? ¿Cuál es el valor central , alrededor del cual

se concentran los datos? ¿Cuán dispersos se encuentran los datos

respecto al valor central? ¿Cuáles son las medidas de resumen que se

utilizarán?

Resúmen de datos: variables cuantitativas.

Page 3: Medidas de Resumen

3

PASOS A SEGUIR EN EL ANÁLISIS DESCRIPTIVO DE VARIABLES CUANTITATIVAS.

Análisis exploratorio de los datos para:1. Identificar datos faltantes, datos

extraños en los formatos o cuestionarios aplicados.

2. Identificar la simetría de los datos3. Identificar la variabilidad 4. Decidir que medidas de resumen

utilizar

Page 4: Medidas de Resumen

Edad de 100padres de

familia Fr20 122 223 124 225 526 527 328 429 630 531 432 533 434 635 636 237 338 439 240 642 543 244 145 246 147 148 350 252 153 154 155 160 3

Total 100

60

50

40

30

20

10Edad

Gráfico 2.- Edad de 100 padres de familia

Valor máximo

Cuartil 1

Cuartil 2

Cuartil 3

IC

Valor mínimo

Datos discordantes

Los cuartiles son medidas de posición.

Cuartil 1 = Q1 Representa el 25% inferior

Cuartil 2 = Q2 Representa el 50% (mediana)

Cuartil 3 = Q3 Representa el 25% superior

IQ = Intervalo cuartilar Representa el 50% central

Es igual al Cuartil 3 – Cuartil 1

Datos discordantes, extraños u “outliers”

Un dato es discordante si:

< Cuartil 1 - 1.5*IQ

> Cuartil 3 + 1.5*IQ

CajasCajas

Page 5: Medidas de Resumen

5

EJEMPLO: Se tienen las edades de 35 madres:

35 32 21 43 39 28 2836 12 54 45 37 53 2645 23 64 21 34 22 2936 45 55 20 38 46 2722 38 35 56 45 33 28

Page 6: Medidas de Resumen

6

DIAGRAMA DE CAJAS

Valor máximo

Edad

70

60

50

40

30

20

10

EDAD DE 35 MADRES

Me

Q3

Q1

Valor Máximo

Valor mínimo

Page 7: Medidas de Resumen

Estudio comparativo del desarrollo físico en niños que practican la disciplina del fútbol en etapa de formación

http://www.efdeportes.com/efd104/futbol-formacion.htm

OBJETIVO: Comparar el Desarrollo Físico en niños que practican la disciplina del fútbol en etapa de formaciones pertenecientes a la escuela de fútbol menor del "Luis Ghersy Govea" del Municipio Libertador y la escuela de fútbol menor "Carlos Guillén" del Municipio Pueblo Llano ambas del Estado Mérida.

Con respecto a la variable talla no hay diferencias significativas entre los dos grupos de edades de los niños del Municipio Libertador, lo que si se deduce es que para la Edad =11 la talla está mas dispersa.

En cuanto al Peso no hay diferencias significativas con respecto a la edad de los dos grupos de edades del Municipio Libertador, esto porque ambas cajas están contenidas en la otra, lo que si se puede observar es que para la Edad =10 el Peso tiene mayor dispersión. El punto marcado con 51 en el gráfico representa un valor extremo o excepcional dentro del grupo de Edad =11.

Page 8: Medidas de Resumen

Métodos para la detección de la variación estacional en Cuba aplicados a la vigilancia en

salud

http://www.scielosp.org/scielo.php?pid=S0864-34662007000100006&script=sci_arttext&tlng=es

Revista Cubana de Salud Pública vol.33 no.1 La Habana Jan./Mar. 2007

….. la mortalidad infantil alcanzó los mayores valores de las tasas mensuales en los primeros siete meses del año, con un gran pico en julio, y después descendió con el menor valor en el mes de diciembre.

Page 9: Medidas de Resumen

LA INTEGRACIÓN DE LA TECNOLOGÍA EDUCATIVACOMO ALTERNATIVA PARA AMPLIAR

LA COBERTURA EN LA EDUCACIÓN SUPERIOR

http://www.comie.org.mx/documentos/rmie/v11/n28/pdf/rmiev11n28scB02n01es.pdf

Se obtuvo información de 161 cursos: 60 de ciencias naturales y exactas, 63 de sociales y políticas y, 38 de tecnologías e ingeniería. La consideración del profesor en cuanto a su percepción del tiempo de exposición –excluyendo talleres y laboratorios (EETL)– se obtuvo para 42 cursos y 119 para estimaciones globales (EG).

…… se busca utilizar un modelo deorganización de las actividades de los cursos que, al integrar tecnología educativa y considerar el conocimiento explícito, disminuya los requerimientosde tiempo aula y optimice el tiempo de atención a los estudiantes.

Page 10: Medidas de Resumen

10

DIAGRAMA DE TALLOS Y HOJAS

1 1 2 1 1 7 2 011223 13 2 667889 16 3 234(8) 3 55667889 11 4 3 10 4 55556 5 5 34 3 5 56 1 6 4

13 madres tienen 29 años

o menos

11 madres tiene 43 años o

más

Stem-and-leaf of Edad N = 35 Un conjunto de datos

de una variable cuantitativa se

descompone en dos partes:

TALLO: Uno o más dígitos iniciales. HOJA: Cada dígito representa un valor

Page 11: Medidas de Resumen

TALLO Y HOJASTALLO Y HOJAS 1.00 2 . 0 3.00 2 . 223 7.00 2 . 4455555 8.00 2 . 66666777 10.00 2 . 8888999999 9.00 3 . 000001111 9.00 3 . 222223333 12.00 3 . 444444555555 5.00 3 . 66777 6.00 3 . 888899 6.00 4 . 000000 7.00 4 . 2222233 3.00 4 . 455 2.00 4 . 67 3.00 4 . 888 2.00 5 . 00 2.00 5 . 23 2.00 5 . 45 3.00 Extremes (>=60)

Edad de 100padres de

familia Fr20 122 223 124 225 526 527 328 429 630 531 432 533 434 635 636 237 338 439 240 642 543 244 145 246 147 148 350 252 153 154 155 160 3

Total 100

Datos originales: Edades 100 padres

Un conjunto de datos de una variable cuantitativa se

descompone en dos partes:

TALLO: Uno o más dígitos iniciales. HOJA: Cada dígito representa un valor

Page 12: Medidas de Resumen

26 1 6666666 77777777777777777 7 7 75 1 8888888888888888888899999999999999999999999999999 (58) 2 0000000000000000000000000000000000111111111111111111111111 127 2 2222222222222222222222222222222233333333333333333333333333333 66 2 4444444444444444444444444444455555555555555555555555 14 2 66666777 6 2 888 3 3 00 1 3 9

cada dato se representa por si mismo.

Edad de los Ingresantes EAP Medicina UNMSM, Julio 2008

Page 13: Medidas de Resumen

13

ASIMETRÍA Distribución simétrica: Cuando su curva de

frecuencia es simétrica con respecto al centro de los datos, en este caso =Me=Mo.

7654321

9

8

7

6

5

4

3

2

1

0

X

Freq

uenc

y

Distribucion simetrica

Me=Mo=

Frec

uenc

ia

3210-1-2-3

3.0

2.5

2.0

1.5

1.0

0.5

0.0

Mean 0StDev 1N 7

CURVA NORMAL

µ

Page 14: Medidas de Resumen

14

Distribución asimétrica positiva >Me>Mo

654321

8

7

6

5

4

3

2

1

0

X

Freq

uenc

yDistribucion asimetrica positiva

►Distribución asimétrica negativaDistribución asimétrica negativa <Me<Mo<Me<Mo

654321

8

7

6

5

4

3

2

1

0

X

Freq

uenc

y

Distribucion asimetrica negartiva

Page 15: Medidas de Resumen

15

Medidas de tendencia

central Media aritmética Mediana Moda Otras medidas de

posición: Cuartiles y percentiles.

Medidas de dispersión

Rango Varianza Desviación

estándar Coeficiente de

variabilidad

Decidir que medidas de resumen utilizar

Page 16: Medidas de Resumen

Llamadas también de ubicación, nos permite determinar en qué parte de la escala de medición tiende a agruparse un conjunto de valores obtenidos de una variable cuantitativa.

Las medidas de posición más usadas son la media, la mediana, la moda y los percentiles y cuantiles.

MEDIDAS DE POSICIÓN

Page 17: Medidas de Resumen

nx...xx

n

xx n21

n

1ii

muestralaesobservaiondenúmeroniablevarladevaloresx

medialaesx

i

Fórmula:

)x(

Media aritmética o promedio: Es la medida que representa al conjunto de

datos. Se obtiene de sumar todos los valores de una muestra y la sumatoria resultante se divide entre el número de valores que se sumaron. Se ve afectada por valores extremos

Page 18: Medidas de Resumen

Ejemplo 1 Se tienen los pesos de 10 recién nacidos:

gramos328810

3400...28003300x

La edad promedio de los recién nacidos es de 3 288 3 288 gramosgramos.

Nro Peso1 28002 29503 29604 31005 33006 34007 34008 35209 365010 3800

Nro Peso1 12002 29503 29604 31005 33006 34007 34008 35209 3650

10 3800

La edad promedio de los recién nacidos es de 3 128 3 128 gramosgramos

Page 19: Medidas de Resumen

Mediana: Valor central que divide al conjunto de

datos ordenados de menor a mayor, en dos grupos de igual tamaño. El 50% es igual o menor a la mediana, mientras que el 50% restante es igual o mayor.

Fórmulas:

imparesCuandoparesCuando

)2

1n(

)12n()

2n(

xMe2

xxMe

Page 20: Medidas de Resumen

20

Ejemplo:A continuación se presentan las edades en años correspondientes a los pacientes atendidos en un hospital un viernes por la noche. Diga cuál es el valor de la mediana de estas edades?

añosXMe n 4321

N° 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29Edad 12 21 22 22 23 32 34 35 35 36 36 37 38 39 43 44 45 45 45 45 46 53 54 55 55 56 57 60 64

Me;15

21nmedianaladePosición

Page 21: Medidas de Resumen

Nro Peso Nro Peso1 2800 1 12002 2950 2 29503 2960 3 29604 3100 4 31005 3300 5 33006 3400 6 34007 3400 7 34008 3520 8 35209 3650 9 365010 3650 10 365011 3800 11 4200

A B

Pesos de 10 recién nacidos:

En ambos casos la Mediana se encuentra en la posición 6.

No se ve No se ve afectada por afectada por valores valores extremosextremos.

Me

Page 22: Medidas de Resumen

Nro Peso1 28002 29503 29604 31005 33006 34007 34008 35209 365010 367011 3800

ANro Peso

1 12002 29503 29604 31005 33006 34007 35008 35209 3650

10 367011 4200

B

ModaValor que se repite con más frecuencia dentro de un conjunto de datos.

El valor modal es 3400 (el valor se repite dos veces)

Page 23: Medidas de Resumen

Otras medidas de posiciónCuartiles: Son tres valores (Q1, Q2 , Q3)

que dividen a un conjunto de datos, ordenados en forma creciente, en 4 partes iguales. Cada cuartil contiene el 25% de datos.

Percentiles: Son 99 valores que dividen 100 partes iguales a un conjunto de datos. El percentil 25 es el cuartril 1 y el 75 es el cuartil 3.

25% 25% 25% 25%Q1 Q2 Q3

RICRIC

Page 24: Medidas de Resumen

Desigualdades en salud y desigualdades sociales: un abordaje epidemiológico en un municipio urbano de

Argentina

Page 25: Medidas de Resumen

Antropometría del trabajador minero de la altura

An Fac Med Lima 2006; 67(4)

Objetivo: Caracterizarantropométricamente a una población andina de trabajadores mineros en la sierra central del Perú.

Page 26: Medidas de Resumen

TÍTULO INVESTIGACIÓN: Aptitud clínica en estudiantes de enfermería ante situaciones clínicas complejas

Objetivo: Evaluar la aptitud clínica en estudiantes de licenciatura en enfermería y obstetricia, antes y después de iniciar la etapa práctica en el área de pediatría

Aptitud clínica: Conjunto de acciones y conocimientos del estudiante de enfermería, aunados a la reflexión y la crítica que tienen como finalidad el restablecimiento del paciente pediátrico. Indicadores1. Reconocimiento de signos y síntomas clínicos: Capacidad del estudiante para identificar, valorar e integrar los datos clínicos del paciente en base a la reflexión.2. Fundamentación de acciones de enfermería: Grado de mayor o menor información que sustentan las acciones de enfermería.3. Implementación de las acciones de enfermería: Es la relación de intervenciones de enfermería no rutinarias, que al ser llevadas a cabo, contribuyen a una evolución favorable en el paciente.

Page 27: Medidas de Resumen

La Desnutrición Crónica, el Sobrepeso y la Obesidad en Niños de Areas Rurales del Perú

OBJETIVO: Determinar prevalencia de desnutrición crónica (DC), sobrepeso y obesidad en niños de áreas rurales

 

TABLA N°2.- PROMEDIO Y DESVIACIÓN ESTÁNDAR DE LOS DIFERENTES INDICADORES POR EDAD Y SEXO

Edad(años

Peso (kg) Talla (m) IMC (kg/m2)FemeninoPromedio

(DE)

MasculinoPromedio

(DE)

FemeninoPromedio

(DE)

MasculinoPromedio

(DE)

FemeninoPromedio

(DE)

MasculinoPromedio

(DE)6 18.3 (2.3) 18.7 (2.2) 1.08 (0.05) 1.09 (0.07) 15.6 (1.3) 15.7 (1.3)7 19.7 (2.4) 20.3 (2.6) 1.12 (0.05) 1.13 (0.05) 15.6 (1.3) 15.9 (1.5)8 22.3

24.1(2.6) 22.2 (2.8) 1.17 (0.05) 1.17 (0.05) 16.1 (1.4) 16.2 (1.4)

9 (3.1) 24.3 (2.9) 1.22 (0.05) 1.21 (0.05) 16.3 (1.4) 16.4 (1.2)

Page 28: Medidas de Resumen

Estas medidas pueden ser absolutas, si están expresadas en unidades de la

variable, como la varianza (desviación estándar, rango, rango intercuartílico) o

pueden ser relativas si no se expresan en unidades de la variable (coeficiente de

variación).

MEDIDAS DE DISPERSION O VARIABILIDAD

Page 29: Medidas de Resumen

Medidas de dispersiónRango (R)Diferencia entre el valor máximo y el mínimo de un conjunto de datos.

Ejemplo:Sean las edades de pacientes según sexo:

La dispersión es mayor en el grupo de las mujeres.

Grupo Edades RangoHombres 20 22 22 24 24 25 25 27 27 29 30 10

Mujeres 12 20 20 22 24 25 25 27 27 29 44 32

Page 30: Medidas de Resumen

VarianzaVarianzaMedida que cuantifica la cantidad de

variabilidad de los datos respecto a

la media. También se define como el

cuadrado de la desviación estándar.

1n)xx(...)xx()xx(

1n)xx(s

2n

22

21

2i2

Desviación Desviación estándarestándarMide la

variabilidad de los datos en unidades

en que estos fueron medidos originalmente.

Medida obtenida de sacar la raíz cuadrada de la

varianza.

Page 31: Medidas de Resumen

25 - 29,5 = -4,523 - 29,5 = -6,522 - 29,5 = -7,534 - 29,5 = 4,532 - 29,5 = 2,545 - 29,5 = 15,533 - 29,5 = 3,521 - 29,5 = -8,522 - 29,5 = -7,538 - 29,5 = 8,5

Cada valor menos el promedio

Elevamosal cuadrado

2042,2556,2520,256,25

240,2512,2572,2556,2572,25

Varianza 66,56 Dividimos entre "n" - 1 (9)

Desviación estándar 8,16

Nro Peso

1 252 233 224 345 326 457 338 219 2210 38

29,5Promedio 599,00

599,0/9 = 66,5666,5616,856,66

Page 32: Medidas de Resumen

Varianza:Varianza: En inferencia

estadística Cálculo de la

desviación estándar

Cálculo del tamaño de muestra.

UsosDesviación Desviación

Estándar:Estándar: Es un valor

positivo Está influenciada

por valores extremos

Se emplea en numerosas pruebas estadísticas

Page 33: Medidas de Resumen

95% del área bajo la curva:

1.96

95% del área bajo la curva:

1.96

95% del área bajo la curva:

1.96

Siempre es un valor positivoEstá influenciada por todos los valores de la muestra o población. Sirve para definir la dispersión de los datos alrededor de la media.

Page 34: Medidas de Resumen

Coeficiente de variación:Coeficiente de variación:Relaciona la desviación estándar de un conjunto de datos con su media. Es una medida de variación relativa. Útil para comparar dos o más grupos medidos en la misma unidad de medida o no.

%2.3110025

8.7CV

%4.1210025

1.3100xSCV

mujeres

breshom

Si el coeficiente es:< 10 % poca dispersión10 – 33% aceptable34 – 50% alta dispersión> 50% muy alta

Page 35: Medidas de Resumen

Estudio epidemiológico del tabaquismo en médicosÁrea de Investigación, Sociedad Argentina de Cardiología

Page 36: Medidas de Resumen

Factores de riesgo asociados con la tensión arterial en adolescentes

http://scielo.sld.cu/scielo.php?pid=S0864-21252001000500005&script=sci_arttext&tlng=es

estudio descriptivo, transversal y analítico a 355 estudiantes cuyas edades se encontraban comprendidas entre los 11 y 15 años y que cursaban desde el 7mo. al 9no. grados. Se evaluaron las variables antropométricas, los antecedentes patológicos familiares de hipertensión arterial (HTA), el hábito de fumar y su relación con la tensión arterial (TA).

Page 37: Medidas de Resumen

Curvas de crecimiento fetal de niños peruanos

Ginecol Obstet Mex 2008;76(8):476-82

Manuel Ticona Rendón,* Diana Huanco Apaza**

Objetivo: obtener curvas de crecimiento fetal propias de un grupo seleccionado de recién nacidos peruanos

La talla promedio de nacimiento a las 39 y 40 semanas de gestación fue de 49.7 cm ± 2.3 y 50.1 cm ± 2.3, respectivamente. El perímetro cefálico fue de 343 mm ± 16 y 345 mm ± 16, respectivamente (cuadro 2).

http://nietoeditores.com.mx/download/gineco/2008/agosto2008/gineco476-82.pdf

Page 38: Medidas de Resumen

Las semanas 39 y 40 de la gestación son las más representativasy corresponden, respectivamente, a 29.6 y 26.2% de los recién nacidos; es decir, más de la mitad del total de recién nacidos (55.8%).

Page 39: Medidas de Resumen

http://redalyc.uaemex.mx/redalyc/pdf/487/48712302.pdf

Page 40: Medidas de Resumen
Page 41: Medidas de Resumen

Gracias41

Gracias