Informe final de estadística, Ana María Pavón Reyes

Preview:

Citation preview

INFORME FINAL DE ESTADÍSTICA

ANA MARÍA PAVÓN REYES

Primer curso de Enfermería, Macarena Grupo A. Primer curso de Enfermería, Macarena Grupo A.

ÍnÍndidicece

0. Resumen del contenido

1. Vista de la matriz de datos

1.1 Vista de variables

1.2 Vista de datos / vista de datos mostrando los nombres de los valores

2. Tablas de frecuencias y estadísticos

2.1 Sexo

2.2 Año de nacimiento

2.3 Trabajo

2.4 Fumar tabaco

2.5 Peso

2.6 Altura

2.7 Gasto de móvil

2.8 Transporte

ÍnÍndidicece

3. Gráficos

3.1 Sexo

3.2 Año de nacimiento

3.3 Trabajo

3.4 Fumar tabaco

3.5 Peso

3.6 Altura

3.7 Gasto de móvil

3.8 Transporte

4. Tabla cruzada

4.1 Tabla cruzada: sexo-gasto de móvil

0.0. Resu Resumen dmen del coel contenintenidodo

La matriz de datos que he construido consta de las siguientes variables: Sexo Año de nacimiento Trabajo Fumar tabaco Peso Altura Gasto de móvil Transporte

De cada una de ellas vamos a obtener: Tabla de frecuencia Estadísticos de tendencia central, posición y dispersión Gráficos

ResuResumen dmen del coel contenintenidodoEstadísticos de tendencia central

● Media: es la suma de los valores de cada una de las unidades de análisis de

nuestra población, divida por el número de unidades. Se calcula de la siguiente

forma:

● Mediana: es la puntuación que ocupa la posición central de la distribución. Para

poder hallarla necesitamos que nuestros datos estén ordenados, de forma creciente

o decreciente.

La mediana deja a un lado y a otro el 50% de los casos y divide la distribución en dos

mitades. Cuando el número de unidades de análisis sea par, cualquier número entre

las dos puntuaciones centrales servirá como mediana.

● Moda: es la categoría o valor de la variable que se presenta mayor número de

veces, es decir, la variable que presenta mayor frecuencia.

1

n

ii

XX

n==

ResuResumen dmen del coel contenintenidodoEstadísticos de posición

● Percentiles: dividen la distribución de frecuencia en 100 partes iguales.

● Deciles: dividen la distribución de frecuencia en 10 partes iguales.

● Cuartiles: son las puntuaciones que dividen a la distribución en cuatro partes iguales, cada una de ellas con el 25% de los casos, por lo tanto hay tres cuartiles. La forma de identificar estos tres cuartiles, y una vez ordenadas las puntuaciones de menor a mayor, es la siguiente:

- Primer cuartil, Q1, es la puntuación que deja a su izquierda el primer 25%

de las observaciones. Es decir, la puntuación que ocupa la posición N/4 en

la población.

- Segundo cuartil, Q2, es la puntuación que deja a su izquierda el 50% de los

casos. Coincide con la mediana. Por lo tanto, es la puntuación que ocupa la

posición 2N/4.

- Tercer cuartil, Q3, es la puntuación que deja a su izquierda el 75% de la

población es la puntuación que ocupa el lugar 3N/4.

Para calcularlo en la distribución de frecuencias se calcula la frecuencia porcentual acumulada.

ResuResumen dmen del coel contenintenidodoEstadísticos de dispersión

● Desviación media: es la media aritmética de los valores absolutos de las diferencias entre cada valor de la distribución (x) y su media aritmética . Su fórmula para calcularla es: Dm= x- /n. Cuánto menor sea el valor de la DM menor será la dispersión de los datos.

● Varianza: mide la dispersión de los valores respecto a un valor central (media), es decir, es el cuadrado de las desviaciones:

● Desviación típica: informa del grado de homogeneidad de los datos o de dispersión que presentan respecto a la media. La desviación típica es más baja si los datos están más próximos a la media; es más alta si hay puntuaciones extremas muy alejadas de la media.

● Rango: es la diferencia entre el valor máximo y el valor mínimo en un grupo de números aleatorios. Su formula para calcularlo es la siguiente: Rango = Máximo - mínimo

2( )N

i

X

X X

−=

1.1. VistVista de la de la mata matriz deriz de datosdatos1.1 Vista de variables

En la imagen que vamos a ver a continuación, podemos apreciar la matriz de datos que he construido tras haber elegido 8 variables para realizar este trabajo.

Las variables elegidas son sexo, año de nacimiento, trabajo, fumar tabaco, peso, altura, gasto de móvil y transporte.

En la vista de variables podemos observar, entre otras cosas, la medida de cada variable y los valores que toman si es que los presentan.

Tipo de variables: Sexo →nominal Año de nacimiento →escala Trabajo →ordinal Fumar tabaco → nominal Peso →escala Altura →escala Gasto de móvil →ordinal Transporte →nominal

Sexo:

1. Varón, 2. Mujer Trabajo:

1. Sí, a media jornada; 2. Sí, fines de semana; 3. Sí, de manera ocasional; 4. No, nunca Fumar tabaco:

1. Sí, 2. No Gasto de móvil:

1. menos de 15 euros; 2. de 15 a 25 euros; 3. de 26 a 35 euros; 4. de 36 a 45 euros; 5. más de 45 euros Transporte:

1. A pié; 2. Coche; 3. Bicicleta; 4. Autobús; 5. Metro; 6. Metro y autobús

Valores que toman algunas de las variables elegidas:

1.2 Vista de datosEn este tipo de vista, podemos observar el conjunto de datos que presenta cada

variable.

Si pulsamos sobre este icono, obtendremos los nombres que le hemos asignado a nuestros valores.

2.2. Tabla Tablas de frs de frecuencecuencias y esias y estadístadísticosticos

Para obtener la tabla de frecuencias de cada una de nuestras variables vamos a realizar el siguiente proceso:

1. Pulsamos sobre “analizar”

2.Pulsamos sobre “estadísticos descriptivos”

3.Pulsamos sobre “Frecuencias”

4.Elegimos la variable de la cual queremos obtener la tabla de frecuencias

Con todo este proceso realizado, nos aparecerá la tabla de frecuencias de la variable elegida.

Para obtener los estadísticos de cada una de ellas realizamos el siguiente proceso:

1. Pulsamos sobre el cuadro “estadísticos”

2. Según el tipo de variable (caulitativa o cuantitativa) marcaremos unos estadísticos y otros.

Si la variable es cualitativa (nominal u ordinal) sólo eligiremos moda.

Si la variable es cuantitativa (o de escala) elegiremos media, mediana, moda, rango, máximo y mínimo, varianza, desviación típica y cuartiles.

2.1 Sexo

La primera variable que hemos elegido es la variable “Sexo”.

Es una variable cualitativa, es decir, son variables que expresan distintas cualidades, características o modalidad. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles, ó politómicas cuando pueden adquirir tres o más valores.

Por tanto, la variable sexo es una variable cualitativa dicotómica porque sólo puede tener dos valores (varón y mujer).

Además, es una variable nominal porque sus valores no pueden ser sometidos a un orden.

Al ser una variable nominal no presenta: Estadísticos de tendencia central: media y mediana. Sólo presenta moda (la moda es la categoría o valor de la variable que se presenta mayor número de veces, es decir, la variable que presenta mayor frecuencia). Estadísticos de posición: cuartiles, deciles y percentiles. Estadísticos de dispersión: rango (máximo y mínimo), desviación típica y varianza.

En la siguiente imagen observamos la moda de esta variable y la tabla de frecuencias de la misma.

La moda al ser 2 correspondería con

“mujer”,por lo que hay un mayor número

de mujeres que de hombres.

2.2 Año de nacimiento

La siguiente variable que nos encontramos es la variable “Año de nacimiento”.

Es una variable cuantitativa, es decir, son las variables que toman como argumento cantidades numéricas. Son variables matemáticas. Las variables cuantitativas además pueden ser:

● Variable discreta: variables que admiten un número limitado de valores y no se pueden subdividir en partes más pequeñas. Toman sólo valores enteros. Ejemplo, número de hijos.

● Variable continua: variables que admiten un número infinito de valores y se pueden subdividir en partes más pequeñas. Ejemplo, edad, altura, peso, tensión arterial.

Por tanto, la variable “Año de nacimiento” es una variable cuantitativa discreta.

Al ser una variable cuantitativa presenta:

● Estadísticos de tendencia central: media, mediana y moda.

● Estadísticos de posición: cuartiles, deciles y percentiles.

● Estadísticos de dispersión: rango (máximo y mínimo), desviación típica y varianza.

En la siguiente imagen observaremos estos estadísticos nombrados anteriormente, y la tabla de frecuencias de esta variable.

El percentil 25 corresponde con el Q1; el percentil 50

con el Q2; y el percentil 75 con

el Q3.

2.3 Trabajo

La variable que analizaremos a continuación, es la variable “Trabajo”.

Es una variable cualitativa y politómica porque adquiere más de dos valores.

Además, es una variable ordinal porque además de clasificar, como las nominales, ordenan a las unidades de análisis, es decir, ordena sus valores de mayor a menor intensidad (1. Sí, a media jornada; 2. Sí, fines de semana; 3. Sí, de manera ocasional; 4. No, nunca)

Al ser una variable ordinal presenta:

Estadísticos de tendencia central: moda. No presenta media ni mediana.

Estadísticos de posición: cuartiles, deciles y percentiles.

Estadísticos de dispersión: no presenta rango (máximo y mínimo), desviación típica ni varianza.

En la siguiente imagen observamos la moda de esta variable y la tabla de frecuencias de la misma.

Los cuartiles de esta variable son los siguientes:

El percentil 25 corresponde con el Q1; el percentil 50

con el Q2; y el percentil 75 con

el Q3.

2.4 Fumar tabaco

La siguiente variable que analizaremos es la variable “Fumar tabaco”.

Es una variable cualitativa dicotómica porque sólo puede tener dos valores (sí y no).

Además, es una variable nominal porque sus valores no pueden ser sometidos a un orden.

Al ser una variable nominal no presenta:

● Estadísticos de tendencia central: ni media, ni mediana. Sólo presenta moda.

● Estadísticos de posición: no presenta cuartiles, deciles ni percentiles.

●Estadísticos de dispersión: no presenta rango (máximo y mínimo), desviación típica ni varianza.

En la siguiente imagen observamos la moda de esta variable y la tabla de frecuencias de la misma.

La moda 2 correspondería con el valor “no”

2.5 Peso

La siguiente variable que nos encontramos es la variable “Peso”.

Es una variable cuantitativa y continua.

Al ser una variable cuantitativa presenta:

● Estadísticos de tendencia central: media, mediana y moda.

● Estadísticos de posición: cuartiles, deciles y percentiles.

● Estadísticos de dispersión: rango (máximo y mínimo), desviación típica y varianza.

En la siguiente imagen observaremos estos estadísticos nombrados anteriormente, y la tabla de frecuencias de esta variable.

El percentil 25 corresponde con el Q1; el percentil 50

con el Q2; y el percentil 75 con

el Q3.

2.6 Altura

La siguiente variable que nos encontramos es la variable “Altura”.

Es una variable cuantitativa y continua.

Al ser una variable cuantitativa presenta:

● Estadísticos de tendencia central: media, mediana y moda.

● Estadísticos de posición: cuartiles, deciles y percentiles.

● Estadísticos de dispersión: rango (máximo y mínimo), desviación típica y varianza.

En la siguiente imagen observaremos estos estadísticos nombrados anteriormente, y la tabla de frecuencias de esta variable.

El percentil 25 corresponde con el Q1; el percentil 50

con el Q2; y el percentil 75 con

el Q3.

2.7 Gasto de móvil

La variable que analizaremos a continuación, es la variable “Gasto de móvil”.

Es una variable cualitativa y politómica porque adquiere más de dos valores.

Además, es una variable ordinal porque además de clasificar, como las nominales, ordenan a las unidades de análisis, es decir ordena los valores de menor a mayor ( 1. menos de 15 euros; 2. de 15 a 25 euros; 3. de 26 a 35 euros; 4. de 36 a 45 euros; 5. más de 45 euros)

Al ser una variable ordinal presenta:

Estadísticos de tendencia central: moda. No presenta media ni mediana.

Estadísticos de posición: cuartiles, deciles y percentiles.

Estadísticos de dispersión: no presenta rango (máximo y mínimo), desviación típica ni varianza.

En la siguiente imagen observamos la moda de esta variable y la tabla de frecuencias de la misma.

Los cuartiles de esta variable son los siguientes: El percentil 25

corresponde con el Q1; el percentil 50

con el Q2; y el percentil 75 con

el Q3.

Moda de15-25euros

2.8 Transporte

La siguiente variable que analizaremos es la variable “Transporte”.

Es una variable cualitativa politómica porque presenta más de dos valores.

Además, es una variable nominal porque sus valores no pueden ser sometidos a un orden.

Al ser una variable nominal no presenta:

● Estadísticos de tendencia central: media y mediana. Sólo presenta moda.

● Estadísticos de posición: no presenta cuartiles, deciles ni percentiles.

●Estadísticos de dispersión: no presenta rango (máximo y mínimo), desviación típica ni varianza.

En la siguiente imagen observamos la moda de esta variable y la tabla de frecuencias de la misma.

El valor 5 correspondería

a “metro”

3. Gráficos

Según el tipo de variable que queramos representar debemos de utilizar unos gráficos u otros.

Para variables cualitativas y cuasicuantitativas utilizaremos los siguientes gráficos: Diagrama de Sectores Circulares Diagrama de Barras Simples Diagrama de Barras Compuestas

Para una sola variable cuantitativa utilizaremos los siguientes gráficos: Histograma Polígono de Frecuencias Diagrama de Cajas

Para dos variables cuantitativas utilizaremos el siguiente gráfico: Diagrama de dispersión

3.1 SexoComo esta variable es de tipo nominal hemos seleccionado el Diagrama de Barras que es utilizado para variables cualitativas y cuasicuantitativas.

3.2 Año de nacimientoComo esta variable es de escala la hemos representado mediante un Histograma, ya que este tipo de gráfico es utilizado para variables cuantitativas.

3.3 TrabajoPara esta variable hemos utilizado el Diagrama de sectores circulares, ya que es una variable ordinal, y este tipo de gráficos puede ser usado para este tipo de variables.

3.4 Fumar tabacoComo esta variable es de tipo nominal hemos seleccionado el Diagrama de Barras que es utilizado para variables cualitativas y cuasicuantitativas.

3.5 PesoComo esta variable es de escala la hemos representado mediante un Diagrama de Cajas, ya que este tipo de gráfico es utilizado para variables cuantitativas.

3.6 AlturaComo esta variable es de escala la hemos representado mediante un Histograma, ya que este tipo de gráfico es utilizado para variables cuantitativas.

3.7 Gasto de móvilPara esta variable hemos utilizado el Diagrama de sectores circulares, ya que es una variable ordinal, y este tipo de gráficos puede ser usado para este tipo de variables.

3.8 TransporteComo esta variable es de tipo nominal hemos seleccionado el Diagrama de Barras que es utilizado para variables cualitativas y cuasicuantitativas.

4.4. Tab Tabla cla cruzruzadaada4.1 Tabla cruzada sexo-gasto de móvil

Recommended