Upload
giuvy-rs
View
21
Download
0
Embed Size (px)
DESCRIPTION
estadistica medidas de resumen
Citation preview
ESTADISTICA DESCRIPTIVA
Tablas y gráficos de frecuencias.
Medidas de resumen para variables cuantitativas.
Análisis Exploratorio de Datos
2
Al resumir datos cuando la variable es cuantitativa, surgen preguntas como:
¿Existen valores extraños? ¿Los datos siguen una distribución simétrica
o no? ¿Cuál es el valor central , alrededor del cual
se concentran los datos? ¿Cuán dispersos se encuentran los datos
respecto al valor central? ¿Cuáles son las medidas de resumen que se
utilizarán?
Resúmen de datos: variables cuantitativas.
3
PASOS A SEGUIR EN EL ANÁLISIS DESCRIPTIVO DE VARIABLES CUANTITATIVAS.
Análisis exploratorio de los datos para:1. Identificar datos faltantes, datos
extraños en los formatos o cuestionarios aplicados.
2. Identificar la simetría de los datos3. Identificar la variabilidad 4. Decidir que medidas de resumen
utilizar
Edad de 100padres de
familia Fr20 122 223 124 225 526 527 328 429 630 531 432 533 434 635 636 237 338 439 240 642 543 244 145 246 147 148 350 252 153 154 155 160 3
Total 100
60
50
40
30
20
10Edad
Gráfico 2.- Edad de 100 padres de familia
Valor máximo
Cuartil 1
Cuartil 2
Cuartil 3
IC
Valor mínimo
Datos discordantes
Los cuartiles son medidas de posición.
Cuartil 1 = Q1 Representa el 25% inferior
Cuartil 2 = Q2 Representa el 50% (mediana)
Cuartil 3 = Q3 Representa el 25% superior
IQ = Intervalo cuartilar Representa el 50% central
Es igual al Cuartil 3 – Cuartil 1
Datos discordantes, extraños u “outliers”
Un dato es discordante si:
< Cuartil 1 - 1.5*IQ
> Cuartil 3 + 1.5*IQ
CajasCajas
5
EJEMPLO: Se tienen las edades de 35 madres:
35 32 21 43 39 28 2836 12 54 45 37 53 2645 23 64 21 34 22 2936 45 55 20 38 46 2722 38 35 56 45 33 28
6
DIAGRAMA DE CAJAS
Valor máximo
Edad
70
60
50
40
30
20
10
EDAD DE 35 MADRES
Me
Q3
Q1
Valor Máximo
Valor mínimo
Estudio comparativo del desarrollo físico en niños que practican la disciplina del fútbol en etapa de formación
http://www.efdeportes.com/efd104/futbol-formacion.htm
OBJETIVO: Comparar el Desarrollo Físico en niños que practican la disciplina del fútbol en etapa de formaciones pertenecientes a la escuela de fútbol menor del "Luis Ghersy Govea" del Municipio Libertador y la escuela de fútbol menor "Carlos Guillén" del Municipio Pueblo Llano ambas del Estado Mérida.
Con respecto a la variable talla no hay diferencias significativas entre los dos grupos de edades de los niños del Municipio Libertador, lo que si se deduce es que para la Edad =11 la talla está mas dispersa.
En cuanto al Peso no hay diferencias significativas con respecto a la edad de los dos grupos de edades del Municipio Libertador, esto porque ambas cajas están contenidas en la otra, lo que si se puede observar es que para la Edad =10 el Peso tiene mayor dispersión. El punto marcado con 51 en el gráfico representa un valor extremo o excepcional dentro del grupo de Edad =11.
Métodos para la detección de la variación estacional en Cuba aplicados a la vigilancia en
salud
http://www.scielosp.org/scielo.php?pid=S0864-34662007000100006&script=sci_arttext&tlng=es
Revista Cubana de Salud Pública vol.33 no.1 La Habana Jan./Mar. 2007
….. la mortalidad infantil alcanzó los mayores valores de las tasas mensuales en los primeros siete meses del año, con un gran pico en julio, y después descendió con el menor valor en el mes de diciembre.
LA INTEGRACIÓN DE LA TECNOLOGÍA EDUCATIVACOMO ALTERNATIVA PARA AMPLIAR
LA COBERTURA EN LA EDUCACIÓN SUPERIOR
http://www.comie.org.mx/documentos/rmie/v11/n28/pdf/rmiev11n28scB02n01es.pdf
Se obtuvo información de 161 cursos: 60 de ciencias naturales y exactas, 63 de sociales y políticas y, 38 de tecnologías e ingeniería. La consideración del profesor en cuanto a su percepción del tiempo de exposición –excluyendo talleres y laboratorios (EETL)– se obtuvo para 42 cursos y 119 para estimaciones globales (EG).
…… se busca utilizar un modelo deorganización de las actividades de los cursos que, al integrar tecnología educativa y considerar el conocimiento explícito, disminuya los requerimientosde tiempo aula y optimice el tiempo de atención a los estudiantes.
10
DIAGRAMA DE TALLOS Y HOJAS
1 1 2 1 1 7 2 011223 13 2 667889 16 3 234(8) 3 55667889 11 4 3 10 4 55556 5 5 34 3 5 56 1 6 4
13 madres tienen 29 años
o menos
11 madres tiene 43 años o
más
Stem-and-leaf of Edad N = 35 Un conjunto de datos
de una variable cuantitativa se
descompone en dos partes:
TALLO: Uno o más dígitos iniciales. HOJA: Cada dígito representa un valor
TALLO Y HOJASTALLO Y HOJAS 1.00 2 . 0 3.00 2 . 223 7.00 2 . 4455555 8.00 2 . 66666777 10.00 2 . 8888999999 9.00 3 . 000001111 9.00 3 . 222223333 12.00 3 . 444444555555 5.00 3 . 66777 6.00 3 . 888899 6.00 4 . 000000 7.00 4 . 2222233 3.00 4 . 455 2.00 4 . 67 3.00 4 . 888 2.00 5 . 00 2.00 5 . 23 2.00 5 . 45 3.00 Extremes (>=60)
Edad de 100padres de
familia Fr20 122 223 124 225 526 527 328 429 630 531 432 533 434 635 636 237 338 439 240 642 543 244 145 246 147 148 350 252 153 154 155 160 3
Total 100
Datos originales: Edades 100 padres
Un conjunto de datos de una variable cuantitativa se
descompone en dos partes:
TALLO: Uno o más dígitos iniciales. HOJA: Cada dígito representa un valor
26 1 6666666 77777777777777777 7 7 75 1 8888888888888888888899999999999999999999999999999 (58) 2 0000000000000000000000000000000000111111111111111111111111 127 2 2222222222222222222222222222222233333333333333333333333333333 66 2 4444444444444444444444444444455555555555555555555555 14 2 66666777 6 2 888 3 3 00 1 3 9
cada dato se representa por si mismo.
Edad de los Ingresantes EAP Medicina UNMSM, Julio 2008
13
ASIMETRÍA Distribución simétrica: Cuando su curva de
frecuencia es simétrica con respecto al centro de los datos, en este caso =Me=Mo.
7654321
9
8
7
6
5
4
3
2
1
0
X
Freq
uenc
y
Distribucion simetrica
Me=Mo=
Frec
uenc
ia
3210-1-2-3
3.0
2.5
2.0
1.5
1.0
0.5
0.0
Mean 0StDev 1N 7
CURVA NORMAL
µ
14
Distribución asimétrica positiva >Me>Mo
654321
8
7
6
5
4
3
2
1
0
X
Freq
uenc
yDistribucion asimetrica positiva
►Distribución asimétrica negativaDistribución asimétrica negativa <Me<Mo<Me<Mo
654321
8
7
6
5
4
3
2
1
0
X
Freq
uenc
y
Distribucion asimetrica negartiva
15
Medidas de tendencia
central Media aritmética Mediana Moda Otras medidas de
posición: Cuartiles y percentiles.
Medidas de dispersión
Rango Varianza Desviación
estándar Coeficiente de
variabilidad
Decidir que medidas de resumen utilizar
Llamadas también de ubicación, nos permite determinar en qué parte de la escala de medición tiende a agruparse un conjunto de valores obtenidos de una variable cuantitativa.
Las medidas de posición más usadas son la media, la mediana, la moda y los percentiles y cuantiles.
MEDIDAS DE POSICIÓN
nx...xx
n
xx n21
n
1ii
muestralaesobservaiondenúmeroniablevarladevaloresx
medialaesx
i
Fórmula:
)x(
Media aritmética o promedio: Es la medida que representa al conjunto de
datos. Se obtiene de sumar todos los valores de una muestra y la sumatoria resultante se divide entre el número de valores que se sumaron. Se ve afectada por valores extremos
Ejemplo 1 Se tienen los pesos de 10 recién nacidos:
gramos328810
3400...28003300x
La edad promedio de los recién nacidos es de 3 288 3 288 gramosgramos.
Nro Peso1 28002 29503 29604 31005 33006 34007 34008 35209 365010 3800
Nro Peso1 12002 29503 29604 31005 33006 34007 34008 35209 3650
10 3800
La edad promedio de los recién nacidos es de 3 128 3 128 gramosgramos
Mediana: Valor central que divide al conjunto de
datos ordenados de menor a mayor, en dos grupos de igual tamaño. El 50% es igual o menor a la mediana, mientras que el 50% restante es igual o mayor.
Fórmulas:
imparesCuandoparesCuando
)2
1n(
)12n()
2n(
xMe2
xxMe
20
Ejemplo:A continuación se presentan las edades en años correspondientes a los pacientes atendidos en un hospital un viernes por la noche. Diga cuál es el valor de la mediana de estas edades?
añosXMe n 4321
N° 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29Edad 12 21 22 22 23 32 34 35 35 36 36 37 38 39 43 44 45 45 45 45 46 53 54 55 55 56 57 60 64
Me;15
21nmedianaladePosición
Nro Peso Nro Peso1 2800 1 12002 2950 2 29503 2960 3 29604 3100 4 31005 3300 5 33006 3400 6 34007 3400 7 34008 3520 8 35209 3650 9 365010 3650 10 365011 3800 11 4200
A B
Pesos de 10 recién nacidos:
En ambos casos la Mediana se encuentra en la posición 6.
No se ve No se ve afectada por afectada por valores valores extremosextremos.
Me
Nro Peso1 28002 29503 29604 31005 33006 34007 34008 35209 365010 367011 3800
ANro Peso
1 12002 29503 29604 31005 33006 34007 35008 35209 3650
10 367011 4200
B
ModaValor que se repite con más frecuencia dentro de un conjunto de datos.
El valor modal es 3400 (el valor se repite dos veces)
Otras medidas de posiciónCuartiles: Son tres valores (Q1, Q2 , Q3)
que dividen a un conjunto de datos, ordenados en forma creciente, en 4 partes iguales. Cada cuartil contiene el 25% de datos.
Percentiles: Son 99 valores que dividen 100 partes iguales a un conjunto de datos. El percentil 25 es el cuartril 1 y el 75 es el cuartil 3.
25% 25% 25% 25%Q1 Q2 Q3
RICRIC
Desigualdades en salud y desigualdades sociales: un abordaje epidemiológico en un municipio urbano de
Argentina
Antropometría del trabajador minero de la altura
An Fac Med Lima 2006; 67(4)
Objetivo: Caracterizarantropométricamente a una población andina de trabajadores mineros en la sierra central del Perú.
TÍTULO INVESTIGACIÓN: Aptitud clínica en estudiantes de enfermería ante situaciones clínicas complejas
Objetivo: Evaluar la aptitud clínica en estudiantes de licenciatura en enfermería y obstetricia, antes y después de iniciar la etapa práctica en el área de pediatría
Aptitud clínica: Conjunto de acciones y conocimientos del estudiante de enfermería, aunados a la reflexión y la crítica que tienen como finalidad el restablecimiento del paciente pediátrico. Indicadores1. Reconocimiento de signos y síntomas clínicos: Capacidad del estudiante para identificar, valorar e integrar los datos clínicos del paciente en base a la reflexión.2. Fundamentación de acciones de enfermería: Grado de mayor o menor información que sustentan las acciones de enfermería.3. Implementación de las acciones de enfermería: Es la relación de intervenciones de enfermería no rutinarias, que al ser llevadas a cabo, contribuyen a una evolución favorable en el paciente.
La Desnutrición Crónica, el Sobrepeso y la Obesidad en Niños de Areas Rurales del Perú
OBJETIVO: Determinar prevalencia de desnutrición crónica (DC), sobrepeso y obesidad en niños de áreas rurales
TABLA N°2.- PROMEDIO Y DESVIACIÓN ESTÁNDAR DE LOS DIFERENTES INDICADORES POR EDAD Y SEXO
Edad(años
Peso (kg) Talla (m) IMC (kg/m2)FemeninoPromedio
(DE)
MasculinoPromedio
(DE)
FemeninoPromedio
(DE)
MasculinoPromedio
(DE)
FemeninoPromedio
(DE)
MasculinoPromedio
(DE)6 18.3 (2.3) 18.7 (2.2) 1.08 (0.05) 1.09 (0.07) 15.6 (1.3) 15.7 (1.3)7 19.7 (2.4) 20.3 (2.6) 1.12 (0.05) 1.13 (0.05) 15.6 (1.3) 15.9 (1.5)8 22.3
24.1(2.6) 22.2 (2.8) 1.17 (0.05) 1.17 (0.05) 16.1 (1.4) 16.2 (1.4)
9 (3.1) 24.3 (2.9) 1.22 (0.05) 1.21 (0.05) 16.3 (1.4) 16.4 (1.2)
Estas medidas pueden ser absolutas, si están expresadas en unidades de la
variable, como la varianza (desviación estándar, rango, rango intercuartílico) o
pueden ser relativas si no se expresan en unidades de la variable (coeficiente de
variación).
MEDIDAS DE DISPERSION O VARIABILIDAD
Medidas de dispersiónRango (R)Diferencia entre el valor máximo y el mínimo de un conjunto de datos.
Ejemplo:Sean las edades de pacientes según sexo:
La dispersión es mayor en el grupo de las mujeres.
Grupo Edades RangoHombres 20 22 22 24 24 25 25 27 27 29 30 10
Mujeres 12 20 20 22 24 25 25 27 27 29 44 32
VarianzaVarianzaMedida que cuantifica la cantidad de
variabilidad de los datos respecto a
la media. También se define como el
cuadrado de la desviación estándar.
1n)xx(...)xx()xx(
1n)xx(s
2n
22
21
2i2
Desviación Desviación estándarestándarMide la
variabilidad de los datos en unidades
en que estos fueron medidos originalmente.
Medida obtenida de sacar la raíz cuadrada de la
varianza.
25 - 29,5 = -4,523 - 29,5 = -6,522 - 29,5 = -7,534 - 29,5 = 4,532 - 29,5 = 2,545 - 29,5 = 15,533 - 29,5 = 3,521 - 29,5 = -8,522 - 29,5 = -7,538 - 29,5 = 8,5
Cada valor menos el promedio
Elevamosal cuadrado
2042,2556,2520,256,25
240,2512,2572,2556,2572,25
Varianza 66,56 Dividimos entre "n" - 1 (9)
Desviación estándar 8,16
Nro Peso
1 252 233 224 345 326 457 338 219 2210 38
29,5Promedio 599,00
599,0/9 = 66,5666,5616,856,66
Varianza:Varianza: En inferencia
estadística Cálculo de la
desviación estándar
Cálculo del tamaño de muestra.
UsosDesviación Desviación
Estándar:Estándar: Es un valor
positivo Está influenciada
por valores extremos
Se emplea en numerosas pruebas estadísticas
95% del área bajo la curva:
1.96
95% del área bajo la curva:
1.96
95% del área bajo la curva:
1.96
Siempre es un valor positivoEstá influenciada por todos los valores de la muestra o población. Sirve para definir la dispersión de los datos alrededor de la media.
Coeficiente de variación:Coeficiente de variación:Relaciona la desviación estándar de un conjunto de datos con su media. Es una medida de variación relativa. Útil para comparar dos o más grupos medidos en la misma unidad de medida o no.
%2.3110025
8.7CV
%4.1210025
1.3100xSCV
mujeres
breshom
Si el coeficiente es:< 10 % poca dispersión10 – 33% aceptable34 – 50% alta dispersión> 50% muy alta
Estudio epidemiológico del tabaquismo en médicosÁrea de Investigación, Sociedad Argentina de Cardiología
Factores de riesgo asociados con la tensión arterial en adolescentes
http://scielo.sld.cu/scielo.php?pid=S0864-21252001000500005&script=sci_arttext&tlng=es
estudio descriptivo, transversal y analítico a 355 estudiantes cuyas edades se encontraban comprendidas entre los 11 y 15 años y que cursaban desde el 7mo. al 9no. grados. Se evaluaron las variables antropométricas, los antecedentes patológicos familiares de hipertensión arterial (HTA), el hábito de fumar y su relación con la tensión arterial (TA).
Curvas de crecimiento fetal de niños peruanos
Ginecol Obstet Mex 2008;76(8):476-82
Manuel Ticona Rendón,* Diana Huanco Apaza**
Objetivo: obtener curvas de crecimiento fetal propias de un grupo seleccionado de recién nacidos peruanos
La talla promedio de nacimiento a las 39 y 40 semanas de gestación fue de 49.7 cm ± 2.3 y 50.1 cm ± 2.3, respectivamente. El perímetro cefálico fue de 343 mm ± 16 y 345 mm ± 16, respectivamente (cuadro 2).
http://nietoeditores.com.mx/download/gineco/2008/agosto2008/gineco476-82.pdf
Las semanas 39 y 40 de la gestación son las más representativasy corresponden, respectivamente, a 29.6 y 26.2% de los recién nacidos; es decir, más de la mitad del total de recién nacidos (55.8%).
http://redalyc.uaemex.mx/redalyc/pdf/487/48712302.pdf
Gracias41
Gracias