34
BIOESADÍSTICA PRESENTACIÓN DE LOS DATOS Bio.Est. Wilver Rodríguez López. M.Sc. UNIVERSIDAD DE SAN MARTIN DE PORRES ESCUELA DE MEDICINA HUMANA

02. Presentación de Datos

  • Upload
    chijf

  • View
    8

  • Download
    1

Embed Size (px)

DESCRIPTION

Bioestadística

Citation preview

Page 1: 02. Presentación de Datos

BIOESADÍSTICAPRESENTACIÓN DE LOS

DATOS

Bio.Est. Wilver Rodríguez López. M.Sc.

UNIVERSIDAD DE SAN MARTIN DE PORRES

ESCUELA DE MEDICINA HUMANA

Page 2: 02. Presentación de Datos

1. Recolección de datos

• En una investigación, la recolección de datos es un paso crucial e indispensable.

• Los datos se obtienen de una medición o de un conteo de las variables de interés (cuantitativas o cualitativas) .

Page 3: 02. Presentación de Datos

Fuentes de Datos– Primarias: Aquellos datos que son

generados por el investigador, quien los obtiene directamente de las unidades de observación. – Se registran usando diversas técnicas:

cuestionario , entrevista, observación, experimentación, entre otros.

– Secundarios: Aquellos datos obtenidos anteriormente de las unidades de observación y que se encuentran documentados en: revistas, tesis, censos, registros, publicaciones de organizaciones, publicaciones en Internet, entre otros.

Page 4: 02. Presentación de Datos

2. Presentación de los datos

 Después de recopilar y revisar los datos necesarios para la investigación, se deben clasificar y presentar de forma adecuada para permitir su análisis e interpretación.

Page 5: 02. Presentación de Datos

La presentación de los datos puede hacerse en:

• Tablas de frecuencia• Gráfica de frecuencias

Page 6: 02. Presentación de Datos

Tipo de Frecuencias

• Frecuencia absoluta simple (fi) Indica el número de veces que

aparece repetido dicho valor en el conjunto de observaciones estudiadas.

•  Frecuencia absoluta acumulada (Fi): indica la suma de las frecuencias absolutas.

Page 7: 02. Presentación de Datos

• Frecuencia relativa simple porcentual (hi%) Indica el porcentaje del total de observaciones que representa el valor, es el cociente entre la frecuencia absoluta simple y el número total de observaciones, multiplicado por 100.

fi hi% = ______x 100 n•  Frecuencia relativa acumulada (Hi%):

Indica la suma de las frecuencias relativas porcentual

Page 8: 02. Presentación de Datos

Componentes de una tabla de frecuencias:

1.Número de la tabla.

2.Titulo de la tabla: Debe ser claro y preciso. Debe responder a las siguientes preguntas: ¿Qué contiene la tabla?, ¿Cómo se esta presentando la tabla?, ¿ A dónde pertenecen los datos? y ¿A que tiempo pertenecen los datos?.

Page 9: 02. Presentación de Datos

3. Cuerpo de la tabla: Aquí va la variable de estudio, las frecuencias absolutas y relativas simples y acumuladas.

4. Fuente: Es el lugar de donde se obtuvo los datos.

5. Notas aclaratorias. En el caso en que se quiera hacer alguna aclaración a la información de la tabla. También se le conoce como pie de llamada.

Page 10: 02. Presentación de Datos

En la práctica cuando se recoge la información de variables cualitativas o categóricas, los datos se presentan en forma desordenada, como por ejemplo:

El registro del servicio de emergencia del Hospital Regional de Trujillo tiene información de la intensidad de dolor del cólico renal de 50 pacientes atendidos en el mes de enero del 2013. La intensidad de dolor se registro como Leve (L), Moderado (M), Severo(S). L, L, M, L, S, S, S, L, M, S,

S, S, S, L, L, M, S, S, S, S,

S, L, M, M, M, S, L, M, S, S,

S, L, M, S, S, S, S, M, M, S,

S, M, M, M, S, S, S, S, S, L

Page 11: 02. Presentación de Datos

Intensidad de dolor

Nº Pacientes

%

LeveModerado Severo

101327

202654

Total 50 100

Tabla 1: Pacientes según intensidad de dolor,Servicio de emergencia. Hospital Regional de Trujillo.Enero 2013.

Fuente: Archivo del Servicio de emergencia. Hospital Regional de Trujillo.*Pacientes con cólico renal

Page 12: 02. Presentación de Datos
Page 13: 02. Presentación de Datos
Page 14: 02. Presentación de Datos

Tabla de frecuencias para variable cuantitativa discreta El registro del servicio de emergencia del

Hospital Regional de Trujillo tiene información del N° de hijos de 50 pacientes atendidos en el mes de enero del 2013. Los datos son los siguientes: 3,5,1,1,2,2,2,2,4,4,1,0,0,6,6,3,1,2,0,0,0,2,2,4,4,4,4,4,3,1,3,4,5,1,1,0,2,4,4,5,6,5,5,5,5,5,4,1,0,2

Page 15: 02. Presentación de Datos

Paciente 1 2 3 4 …

# de hijos 3 5 1 1 …

# de hijos fi Fi hi% Hi%0 7 7 14 14

1 8 15 16 30

2 9 24 18 48

3 4 28 8 56

4 11 39 22 78

más de 4 11 50 22 100

TOTAL 50

Page 16: 02. Presentación de Datos

Tabla 2: Pacientes según número de hijos.Servicio de emergencia. Hospital Regional de Trujillo.

Enero 2013.

# de hijos fi Fi hi% Hi%

0 7 7 14 14

1 8 15 16 30

2 9 24 18 48

3 4 28 8 56

4 11 39 22 78

más de 4 11 50 22 100

TOTAL 50 100

Page 17: 02. Presentación de Datos
Page 18: 02. Presentación de Datos

Caso de las variables cuantitativas continuas

En el caso de las variables continuas, hay una cantidad muy grande de posibles valores.

Cuando se manejan más de 30 observaciones es necesario usar intervalos que permitan ordenar de forma práctica los valores.

Sólo cuando se dividen los valores en intervalos encontramos en la tabla de frecuencias: clase, marca de clase y límites reales.

Para crearlos existe un procedimiento e implica la aparición de 3 nuevas columnas:

Clase: indica el número de intervalo del que se trata. Marca de clase (Xi): es un promedio de los límites del

intervalo de clase i. Es el número representativo del intervalo.

Límites reales: cada intervalo tiene números que representan sus límites, pero los límites reales indican los verdaderos valores que toma una medición, ya que los límites nominales son aparentes.

Page 19: 02. Presentación de Datos

Datos de 30 pacientes con cáncer pulmonar.

Paciente Ciudad Edad Sexo

1 A 30 M2 A 43 M3 B 58 F4 C 61 M5 A 70 M6 D 42 F7 C 58 F8 A 39 M9 B 60 F10 B 55 M11 C 57 M12 A 49 M13 A 61 F14 D 69 M15 D 43 M16 B 46 F17 A 69 M18 A 44 M19 C 59 F20 D 62 M21 D 66 M22 C 71 M23 C 70 F24 C 65 M25 D 37 M26 A 40 F27 A 61 F28 B 65 M29 B 56 M30 C 38 M

Page 20: 02. Presentación de Datos

PROCEDIMIENTO PARA CONSTRUIR TABLAS DE FRECUENCIAS

1.- Encontrar la amplitud (R) del conjunto de datos, es decir el valormáximo menos el valor mínimo, mas una unidad de medida.

R=(Vmax – Vmin)

Ejemplo.- Considerando los datos de edad dado en el tabla tenemos:

R=(71 – 30)= 41

Page 21: 02. Presentación de Datos

2-Determinar el número de intervalos (k), utilizando la siguiente fórmula:

k= 1 + 3.322 log n

En relación al ejemplo se tiene que:k=1 + 3.322 log 30 = 5.9

En este caso K puede ser: 4, 5 o 6; se elige el valor de K con menor exceso

3-Determinar la amplitud del intervalo de clase (C), utilizando la siguiente expresión:

C= A / k

Page 22: 02. Presentación de Datos

Asumiendo K=4 C=41/4=10.25 ˜11 Rt= KxC= 4X11=44 Ex=3Asumiendo K=5 C=41/5=8.2 ˜9 Rt= KxC= 5x9=45 Ex=4Asumiendo K=6 C=41/6=6.8 ˜7 Rt= KxC= 6X7=42 Ex=1

En este caso K=6

5- La clasificación de los datos de una variable continua puede hacerse manualmente o en forma automatizada.

Page 23: 02. Presentación de Datos

Clase Edad Xi fi Fi hi% Hi% Límites reales

1

2

3

4

5

6

100

R = 41K = 6C = 7

Paciente

Edad

1 302 433 584 615 706 427 588 399 6010 5511 5712 4913 6114 6915 4316 4617 6918 4419 5920 6221 6622 7123 7024 6525 3726 4027 6128 6529 5630 38

29-36  36-43  43-50  50-57  57-64  64-71  

Page 24: 02. Presentación de Datos

Clase Edad Xi fi Fi hi% Hi%

1 29-36 33 1 1 3 3

2 36-43 40 5 6 17 20

3 43-50 47 5 11 17 37

4 50-57 54 2 13 6 43

5 57-64 61 9 22 30 73

6 64-71 68 8 30 27 100

Total 30 100

Tabla 3: Pacientes con cáncer pulmonar, según edad. Hospital Regional de Lambayeque. Año 2013

Page 25: 02. Presentación de Datos

Propiedades de las frecuencias Las frecuencias absolutas son siempre valores

enteros. La suma de las frecuencias absolutas es igual

n. Las frecuencias relativas son siempre valores

fraccionarios. O < h1 < 1

La suma de las frecuencias relativas es igual 1 El último valor de las frecuencias absolutas

acumuladas es igual a n El último valor correspondiente a las

frecuencias relativas debe ser igual a 1

Page 26: 02. Presentación de Datos

donde:

fi: Frecuencia absoluta del i-ésimo intervalo, nos indica número de veces que aparece repetido dicho valor en el conjunto de observaciones estudiadas.

Fi: Frecuencia absoluta acumulada de la clase i nos indica la suma de las frecuencias absolutas de los iguales o inferiores a el.

F1=f1F2=f1+f2

hi%: Frecuencia relativa de la clase i es el cociente entre la frecuencia absoluta y el número total de observaciones multiplicando por 100.

hi% = fi/n*100

Page 27: 02. Presentación de Datos

Hi%: Frecuencia relativa acumulada de la clase i, es la frecuencia absoluta acumulada dividido por el número total de observaciones. Hi% = Fi/n*100

Xi: Es la marca de clase de la clase i se determina mediante el promedio de los límites de dicho intervalo.

Page 28: 02. Presentación de Datos

Método GráficoEn esencia, un gráfico estadístico es la presentación de la

información por medio de figuras geométricas. El objetivo primordial de un gráfico es dar una impresión

visual de conjunto para una rápida y fácil comprensión. No deben considerarse como sustitutos de un tratamiento

estadístico de los datos, sino más bien como ayuda visual para interpretar problemas estadísticos.

Debe ser sencillo y explicativo; en un buen gráfico se puede:Apreciar tendencias, variaciones, cambios y realizar

visualmente comparaciones.Relacionar 2 o más series de datos superpuestos en un

mismo gráfico.

Page 29: 02. Presentación de Datos

Histograma

Muestra la distribución de datos cuantitativos

El área es proporcional a la frecuencia respectiva

Representa a la frecuencias absolutas o relativas

Tiene como base los límites reales de los intervalos de clase.

Page 30: 02. Presentación de Datos
Page 31: 02. Presentación de Datos

Polígono de frecuencias (simples), Este gráfico se obtiene uniendo los

puntos medios superiores de los rectángulos del histograma, formándose de esta manera un gráfico lineal, el cual debe llevarse hasta el eje x en los extremos del límite inferior del primer intervalo y superior del último intervalo respectivamente.

El área total bajo el polígono equivale al área del histograma.

Page 32: 02. Presentación de Datos
Page 33: 02. Presentación de Datos

Polígono de frecuencias (acumuladas) OJIVA

Denominado también ojiva, utiliza las

frecuencias absolutas o relativas acumuladas, y consiste en un gráfico lineal que nos permite observar la cantidad de elementos que quedan por encima o por debajo de determinados valores de los límites de los intervalos de clase.

La ojiva se obtiene uniendo los puntos que le corresponden a las frecuencias acumuladas de los respectivos límites superiores de cada intervalo.

Page 34: 02. Presentación de Datos