Upload
maria-dolores-gomez-molina
View
100
Download
0
Embed Size (px)
Citation preview
SEMINARIO VI:
Mª Dolores Gómez MolinaSubgrupo16
R Commander: Formación y recodifica
ción de variables.
1.Cambiamos el directorio de trabajo.
2. Cargamos los datos del archivo de R “activossalud.Rdata”
SELECCIONA DOS VARIABLES CUALITATIVAS-FACTOR DEL FICHERO “ACTIVOSSALUD.RDATA”, DESCRÍBELAS EN TABLAS DE FRECUENCIAS E INTERPRETA AL MENOS 3 ASPECTOS EN RELACIÓN A LA DISTRIBUCIÓN DE LAS MISMAS.
1º ACTIVIDAD
Seleccionamos las variables que de las que queremos visualizar su dsitribución de frecuencia, en este caso “Botellón” y “Dulces”. vallamos a comentar.
Al aparecer la tabla de frecuencia de las variables, interpretamos 3 aspectos de cada una.
BOTELLÓN- 90 individuos del total hacen botellón los fines de semana (31.58%)- 51 individuos del total no han hecho nunca botellón (17.89%)- Solo 3 personas del total hacen botellón a diario (1.05)
DULCES- 20 individuos del total toman dulces a diario (6.90%)- 42 individuos del total nunca han tomado dulces (14.48%)- 87 individuos toman dulces 1 o 2 veces a la semana (30%)
2º ACTIVIDAD
Selecciona dos variables numéricas del fichero “activossalud.RData”, y
mediante resúmenes numéricos describe e interpreta la distribución
de las mismas.
Seleccionamos las variables de las que queremos visualizar los resúmenes numéricos, en mi caso “altura” y “comunicacionfmailiar”.
Analizar las tablas de frecuencia de “altura” y “comunicaciónfamiliar”.
COMUNICACIÓN FAMILIAR- La mediana coincidirá con el 2º cuartil y es 7. No es una distribución asimétrica, pues no coinciden la media y la mediana.- La muestra presenta 147 individuos y 144 no han contestado. La media es de 7,829932 y la DT es de 2,82448722. El rango intercuartílico sería 3; el primer cuartil es 6 y el tercer cuartil es 9.
ALTURA- La mediana coincide con el 2º cuartil y es 1,655m. Es una distribución casi asimétrica, la mediana y la media tienen valores similares.- La muestra presenta presenta 291 individuos y sólo uno no ha contestado. La media es 1,6670m y la DT 0,08078. El rango intercuartílico sería 0,12; el 1er cuartil sería 1,6 y el 3er cuartil sería 1,72.
3º ACTIVIDAD
Debes realizar al menos un gráfico de cada tipo con variables adecuadamente seleccionadas del fichero “activossalud.RData”, describe e interpreta la distribución los mismos.
1) Gráfica de sectores.
En mi caso he seleccionado las variables “dulce”
Interpretación de los datos de la gráfica de sectores “dulces”.
INTERPRETACIÓN: Mui pocos individuos toman
dulces a diario. De lo contrario la mayoría de
los individuos consumen dulces menos de una vez a la semana o, 1 - 2 veces a la semana.
Además una parte importante no consume dulces nunca.
2) Diagrama de barras.En mi caso he seleccionado la variable “cerveza”
Interpretación de los datos del diagrama de barras sobre la variable “cerveza”
INTERPRETACIÓN: Resulta significativo el hecho de que
muy pocos individuos beben cerveza a diario.
Por el contrario la mayoría de los individuos no la han bebido nunca.
3) Histograma.En mi caso he seleccionado la variable “altura”
Interpretación de los datos del histograma sobre la variable “altura”.
INTERPRETACIÓN: Muestra una distribución asimétrica algo
sesgada hacia la izquierda La moda la podemos encontrar entre las
puntuaciones 1,6-1,7m Hay muy pocos individuos que midan
menos de 1,5m o más de 1,9m
4) Diagrama de cajas y bigotes.
En mi caso he seleccionado la variable “peso”
Interpretación de los datos del diagrama de cajas y bigotes sobre la variable “peso”INTERPRETACIÓN: La mediana de la variable
es 60; los cuartiles 1 y 3, serían respectivamente 50 y 70 aproximadamente. EL Rango intercuartílico sería 70-50=20 (Q3-Q1).
Existen datos “atípicos” que se encuentran fuera de la caja y de los bigotes; por lo que existe una gran dispersión.
El puntaje más bajo está entre 37 o 40 aproximadamente y el más alto 90.