18
SEMINARIO VI: Mª Dolores Gómez Molina Subgrupo16 R Commander: Formación y r ecod ificación de variable s.

Sseminario 6

Embed Size (px)

Citation preview

Page 1: Sseminario 6

SEMINARIO VI:

Mª Dolores Gómez MolinaSubgrupo16

R Commander: Formación y recodifica

ción de variables.

Page 2: Sseminario 6

1.Cambiamos el directorio de trabajo.

Page 3: Sseminario 6

2. Cargamos los datos del archivo de R “activossalud.Rdata”

Page 4: Sseminario 6

SELECCIONA DOS VARIABLES CUALITATIVAS-FACTOR DEL FICHERO “ACTIVOSSALUD.RDATA”, DESCRÍBELAS EN TABLAS DE FRECUENCIAS E INTERPRETA AL MENOS 3 ASPECTOS EN RELACIÓN A LA DISTRIBUCIÓN DE LAS MISMAS.

1º ACTIVIDAD

Page 5: Sseminario 6

Seleccionamos las variables que de las que queremos visualizar su dsitribución de frecuencia, en este caso “Botellón” y “Dulces”. vallamos a comentar.

Page 6: Sseminario 6

Al aparecer la tabla de frecuencia de las variables, interpretamos 3 aspectos de cada una.

BOTELLÓN- 90 individuos del total hacen botellón los fines de semana (31.58%)- 51 individuos del total no han hecho nunca botellón (17.89%)- Solo 3 personas del total hacen botellón a diario (1.05)

DULCES- 20 individuos del total toman dulces a diario (6.90%)- 42 individuos del total nunca han tomado dulces (14.48%)- 87 individuos toman dulces 1 o 2 veces a la semana (30%)

Page 7: Sseminario 6

2º ACTIVIDAD

Selecciona dos variables numéricas del fichero “activossalud.RData”, y

mediante resúmenes numéricos describe e interpreta la distribución

de las mismas.

Page 8: Sseminario 6

Seleccionamos las variables de las que queremos visualizar los resúmenes numéricos, en mi caso “altura” y “comunicacionfmailiar”.

Page 9: Sseminario 6

Analizar las tablas de frecuencia de “altura” y “comunicaciónfamiliar”.

COMUNICACIÓN FAMILIAR- La mediana coincidirá con el 2º cuartil y es 7. No es una distribución asimétrica, pues no coinciden la media y la mediana.- La muestra presenta 147 individuos y 144 no han contestado. La media es de 7,829932 y la DT es de 2,82448722. El rango intercuartílico sería 3; el primer cuartil es 6 y el tercer cuartil es 9.

ALTURA- La mediana coincide con el 2º cuartil y es 1,655m. Es una distribución casi asimétrica, la mediana y la media tienen valores similares.- La muestra presenta presenta 291 individuos y sólo uno no ha contestado. La media es 1,6670m y la DT 0,08078. El rango intercuartílico sería 0,12; el 1er cuartil sería 1,6 y el 3er cuartil sería 1,72.

Page 10: Sseminario 6

3º ACTIVIDAD

Debes realizar al menos un gráfico de cada tipo con variables adecuadamente seleccionadas del fichero “activossalud.RData”, describe e interpreta la distribución los mismos.

Page 11: Sseminario 6

1) Gráfica de sectores.

En mi caso he seleccionado las variables “dulce”

Page 12: Sseminario 6

Interpretación de los datos de la gráfica de sectores “dulces”.

INTERPRETACIÓN: Mui pocos individuos toman

dulces a diario. De lo contrario la mayoría de

los individuos consumen dulces menos de una vez a la semana o, 1 - 2 veces a la semana.

Además una parte importante no consume dulces nunca.

Page 13: Sseminario 6

2) Diagrama de barras.En mi caso he seleccionado la variable “cerveza”

Page 14: Sseminario 6

Interpretación de los datos del diagrama de barras sobre la variable “cerveza”

INTERPRETACIÓN: Resulta significativo el hecho de que

muy pocos individuos beben cerveza a diario.

Por el contrario la mayoría de los individuos no la han bebido nunca.

Page 15: Sseminario 6

3) Histograma.En mi caso he seleccionado la variable “altura”

Page 16: Sseminario 6

Interpretación de los datos del histograma sobre la variable “altura”.

INTERPRETACIÓN: Muestra una distribución asimétrica algo

sesgada hacia la izquierda La moda la podemos encontrar entre las

puntuaciones 1,6-1,7m Hay muy pocos individuos que midan

menos de 1,5m o más de 1,9m

Page 17: Sseminario 6

4) Diagrama de cajas y bigotes.

En mi caso he seleccionado la variable “peso”

Page 18: Sseminario 6

Interpretación de los datos del diagrama de cajas y bigotes sobre la variable “peso”INTERPRETACIÓN: La mediana de la variable

es 60; los cuartiles 1 y 3, serían respectivamente 50 y 70 aproximadamente. EL Rango intercuartílico sería 70-50=20 (Q3-Q1).

Existen datos “atípicos” que se encuentran fuera de la caja y de los bigotes; por lo que existe una gran dispersión.

El puntaje más bajo está entre 37 o 40 aproximadamente y el más alto 90.