13
Curso 2014/2015 Índice de Masa Corporal CELIA RUIZ BALLESTEROS GRADO EN ESTADÍSTICA

Índice de Masa Corporal - UVavalentin/mem/2015/trabajos_alumnos...El índice de grasa corporal calculado con la ecuación de Brozek (PERBFAT1) , el mismo índice calculado con la

  • Upload
    others

  • View
    11

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Índice de Masa Corporal - UVavalentin/mem/2015/trabajos_alumnos...El índice de grasa corporal calculado con la ecuación de Brozek (PERBFAT1) , el mismo índice calculado con la

Curso 2014/2015

Índice de Masa Corporal

CELIA RUIZ BALLESTEROS GRADO EN ESTADÍSTICA

Page 2: Índice de Masa Corporal - UVavalentin/mem/2015/trabajos_alumnos...El índice de grasa corporal calculado con la ecuación de Brozek (PERBFAT1) , el mismo índice calculado con la

RESUMEN

Disponemos de una muestra de 252 hombres a los que se les ha tomado 19 medidas corporales

diferentes:

El índice de grasa corporal calculado con la ecuación de Brozek (PERBFAT1) , el mismo índice

calculado con la ecuación de Siri(PERBFAT2), la densidad (g/cm3), edad, peso (libras), altura

(pulgadas), índice de adiposidad (peso/altura^2), masa libre de grasa, y en cm las circunferencias del

cuello , del pecho , del abdomen , de la cadera , del muslo , de la rodilla , del tobillo , de los bíceps en

extensión , del antebrazo y de la muñeca.

Los datos fueron tomados en Penrose en 1985 por la universidad de Brigham Young, Provo, Utah.

El objetivo del estudio es obtener una ecuación de predicción para la composición general del

cuerpo utilizando simples medidas técnicas. Y comparar si ambas ecuaciones, aunque diferentes, son

equivalentes.

MODELO COMPLETO proc reg data=fat;

model PerBFat1 PerBFat2 = Density Age Weight Height

AdipInd FatFreeW Beck Chest Abdomen Hip Thigh Knee

Nakle Bideocs Forearm Wrist;

plot npp.*r. r.*p. ;

run; quit;

PERBFAT1:

Parameter Estimates

Variable Label DF Parameter Estimate

Standard Error

t Value Pr > |t|

Intercept Intercept 1 -10.54558 5.59043 -1.89 0.0605

Density Density 1 0.00000260 0.00002545 0.10 0.9187

Age Age 1 0.00485 0.01053 0.46 0.6456

Weight Weight 1 0.33543 0.02000 16.78 <.0001

Height Height 1 0.04617 0.03642 1.27 0.2061

AdipInd AdipInd 1 -0.44777 0.09730 -4.60 <.0001

FatFreeW FatFreeW 1 -0.52247 0.01258 -41.55 <.0001

Beck Beck 1 0.01947 0.07661 0.25 0.7996

Chest Chest 1 0.11080 0.03411 3.25 0.0013

Abdomen Abdomen 1 0.13021 0.03474 3.75 0.0002

Hip Hip 1 -0.00418 0.04790 -0.09 0.9306

Thigh Thigh 1 0.18333 0.04725 3.88 0.0001

Knee Knee 1 0.08152 0.07979 1.02 0.3080

Nakle Nakle 1 0.12655 0.07204 1.76 0.0803

Bideocs Bideocs 1 0.09887 0.05559 1.78 0.0766

Forearm Forearm 1 0.21659 0.06438 3.36 0.0009

Wrist Wrist 1 0.14033 0.17701 0.79 0.4287

Para la ecuación de Brozek, la densidad, edad, altura, cuello, cadera, rodilla, gemelo, bíceps y

muñeca no son significativos

Page 3: Índice de Masa Corporal - UVavalentin/mem/2015/trabajos_alumnos...El índice de grasa corporal calculado con la ecuación de Brozek (PERBFAT1) , el mismo índice calculado con la

PERBFAT2:

Parameter Estimates

Variable Label DF Parameter Estimate

Standard Error

t Value Pr > |t|

Intercept Intercept 1 -13.06029 6.09304 -2.14 0.0331

Density Density 1 0.00000363 0.00002774 0.13 0.8959

Age Age 1 0.00606 0.01148 0.53 0.5979

Weight Weight 1 0.35968 0.02179 16.50 <.0001

Height Height 1 0.05081 0.03969 1.28 0.2018

AdipInd AdipInd 1 -0.47677 0.10605 -4.50 <.0001

FatFreeW FatFreeW 1 -0.56327 0.01371 -41.10 <.0001

Beck Beck 1 0.02132 0.08350 0.26 0.7987

Chest Chest 1 0.12035 0.03718 3.24 0.0014

Abdomen Abdomen 1 0.13996 0.03786 3.70 0.0003

Hip Hip 1 0.00131 0.05221 0.03 0.9800

Thigh Thigh 1 0.18343 0.05150 3.56 0.0004

Knee Knee 1 0.11676 0.08696 1.34 0.1807

Nakle Nakle 1 0.13343 0.07852 1.70 0.0906

Bideocs Bideocs 1 0.12295 0.06059 2.03 0.0436

Forearm Forearm 1 0.22139 0.07016 3.16 0.0018

Wrist Wrist 1 0.12265 0.19293 0.64 0.5256

La densidad, edad, altura, cuello, cadera, rodilla y muñeca no son significativas para la ecuación

de Siri. Son prácticamente las mismas que en el caso anterior.

SELECCIÓN DE VARIABLES

En este conjunto de datos vamos a pasar directamente el código que realiza la selección con los

3 métodos debido al gran número de variables de las que disponemos. Todos coinciden con el

modelo de 9 variables: peso, adiposidad, masa libre de grasa, pectoral, abdomen, muslo, tobillo,

bíceps y antebrazo.

-----------------------------------------------------------------

Summary

------------------------------------------------------------------

FORWARD 3 5 6 8 9 11 13 14 15

BACKWARD 3 5 6 8 9 11 13 14 15

STEPWISE 3 5 6 8 9 11 13 14 15

Nuestro modelo pasa a ser el siguiente:

Parameter Estimates PERBFAT1

Variable Label DF Parameter Estimate

Standard Error

t Value Pr > |t|

Intercept Intercept 1 -4.14131 3.09851 -1.34 0.1826

Weight Weight 1 0.34651 0.01650 21.00 <.0001

AdipInd AdipInd 1 -0.52678 0.07832 -6.73 <.0001

FatFreeW FatFreeW 1 -0.51753 0.01185 -43.68 <.0001

Chest Chest 1 0.11185 0.03298 3.39 0.0008

Abdomen Abdomen 1 0.14779 0.03169 4.66 <.0001

Thigh Thigh 1 0.16496 0.03792 4.35 <.0001

Nakle Nakle 1 0.15947 0.06778 2.35 0.0194

Bideocs Bideocs 1 0.11127 0.05427 2.05 0.0414

Forearm Forearm 1 0.23815 0.06112 3.90 0.0001

Page 4: Índice de Masa Corporal - UVavalentin/mem/2015/trabajos_alumnos...El índice de grasa corporal calculado con la ecuación de Brozek (PERBFAT1) , el mismo índice calculado con la

Parameter Estimates PERBFAT2

Variable Label DF Parameter Estimate

Standard Error

t Value Pr > |t|

Intercept Intercept 1 -5.47247 3.38136 -1.62 0.1069

Weight Weight 1 0.37392 0.01800 20.77 <.0001

AdipInd AdipInd 1 -0.56821 0.08547 -6.65 <.0001

FatFreeW FatFreeW 1 -0.55833 0.01293 -43.18 <.0001

Chest Chest 1 0.12047 0.03599 3.35 0.0009

Abdomen Abdomen 1 0.16138 0.03459 4.67 <.0001

Thigh Thigh 1 0.16964 0.04138 4.10 <.0001

Nakle Nakle 1 0.17166 0.07397 2.32 0.0211

Bideocs Bideocs 1 0.13429 0.05922 2.27 0.0242

Forearm Forearm 1 0.24258 0.06670 3.64 0.0003

ELIMINACION DE OUTLIERS proc iml;

* lectura de datos; reset print;

use fat;

read all var {PerBFat1 PerBFat2 Weight AdipInd FatFreeW

Chest Abdomen Thigh Nakle Bideocs Forearm};

show names; *LCURRENT LSTART EDUC SENIOR AGE EXPERIENCE ;

print PerBFat1 PerBFat2 Weight AdipInd FatFreeW Chest

Abdomen Thigh Nakle Bideocs Forearm;

* matriz de diseño X y matriz de respuestas Y;

Y= PerBFat1|| PerBFat2;

n=nrow(Y); * observaciones;

s=ncol(Y); * vbles respuesta;

X=j(n,1)||Weight||AdipInd||FatFreeW||Chest||Abdomen||Thigh||Nakle||Bid

eocs||Forearm;

p=ncol(X)-1; * vbles explicativas;

* estimacion;

* parametros; Bhat=inv(X`*X)*X`*Y;

* medias/Valores predichos; Yhat=X*Bhat;

* errores; err=Y-Yhat;

create residtot from err;

append from err;

* suma de cuadrados; E=err`*err;

* sigma estimada insesgada; Sigmahat=E/(n-p-1);

proc iml; reset noprint;

/* Como hicimos en la practica IML 3, calculamos la atipicidad de cada

individuo

mediante su distancia de Mahalanobis al punto medio de la nube.*/

*cargo matriz de datos X desde SDS;

use residtot;

read all into X;

n=nrow(X); p=ncol(X); *dimensiones;

Ind=(1:n)`; * Identificador de los individuos;

* nivel del test;

alfa=0.10;

*inicializo las variables condicion y el contador de outliers nout;

Qdmax=0;Qalfa=0;

nout=0; *inicializo nout, contador del nº de outliers detectados;

************************************ comienzo bucle

*******************;

do until (Qdmax<Qalfa);

*computo medias y covarianzas empiricas;

Page 5: Índice de Masa Corporal - UVavalentin/mem/2015/trabajos_alumnos...El índice de grasa corporal calculado con la ecuación de Brozek (PERBFAT1) , el mismo índice calculado con la

Xmed=X[:,]`;

Q=X`*X-n*Xmed*Xmed`;

S=Q/(n-1);

* matriz de datos centrados;

Xcen=X-J(n,1,1)*(Xmed)`;

* matriz de productos desviaciones_i`*inv(S)*desviaciones_j ;

D=Xcen*inv(S)*Xcen`;

* en la diagonal de D encuentro las DM2 de los n individuos;

DM2=vecdiag(D); DM=sqrt(DM2);

* busco la observacion con mayor DM2;

Qdmax=max(DM2);

outlier=DM2[<:>];

* calculo el punto critico de nivel alfa;

calfa=p*finv(1-alfa/n,p,n-p-1)/(n-p-1);

Qalfa=calfa/(1+calfa); Qalfa=Qalfa*(n-1)**2/n;

* decision;

if Qdmax<Qalfa then do; *he terminado, guardo los datos depurados;

print 'Finalizada Deteccion de outliers ';

print nout ' observaciones declaradas outliers y eliminadas';

create fat_sinout from X;

append from X;

abort;

end;

*si no, es que hay outlier. Lo elimino y repito el proceso;

print 'la observacion ' (ind[outlier]) ' es un outlier';

print (X[outlier,]);

print Qdmax Qalfa ;

* ordeno los individuos por atipicidad creciente;

r=rank(DM);

Xcop=X; Indcop=Ind;

X[r,]=Xcop; Ind[r]=Indcop;

* elimino el outlier y modifico n y nout;

X=X[1:(n-1),];

Ind=Ind[1:(n-1)];

n=n-1;

nout=nout+1;

end;

Ejecutando este codigo detectamos 14 outliers y los eliminamos de nuestro

conjunto de datos creando uno nuevo fat_sinout

CONTRASTES DE HIPÓTESIS

Test 1

Contrastamos en primer lugar la hipótesis básica: si las variables independientes influyen

globalmente en las variables respuesta:

En forma ABM con M la matriz identidad.

𝐴 =

0 1 0 0 0 0 0 0 0 00 0 1 0 0 0 0 0 0 00 0 0 1 0 0 0 0 0 00 0 0 0 1 0 0 0 0 00 0 0 0 0 1 0 0 0 00 0 0 0 0 0 1 0 0 00 0 0 0 0 0 0 1 0 00 0 0 0 0 0 0 0 1 00 0 0 0 0 0 0 0 0 1

proc glm data=fat_sinout;* regresion;

Page 6: Índice de Masa Corporal - UVavalentin/mem/2015/trabajos_alumnos...El índice de grasa corporal calculado con la ecuación de Brozek (PERBFAT1) , el mismo índice calculado con la

model PerBFat1 PerBFat2 = Weight AdipInd FatFreeW Chest

Abdomen Thigh Nakle Bideocs Forearm/nouni; *nouni

elimina las salidas univariantes;

* test 1 Ho_basica;

contrast 'Ho_basica' Weight 1, AdipInd 1,FatFreeW 1,Chest

1,Abdomen 1,Thigh 1,Nakle 1,Bideocs 1,Forearm

1; *****tests univariantes, matriz A;

manova; * si no incluimos nada es la identidad

*****tests MULTIivariantes, matriz M;

run;

MANOVA Test Criteria and F Approximations for the Hypothesis of No Overall Ho_basica Effect H = Contrast SSCP Matrix for Ho_basica

E = Error SSCP Matrix

S=2 M=3 N=119.5

Statistic Value F Value Num DF Den DF Pr > F

Wilks' Lambda 0.02966230 128.70 18 482 <.0001

Pillai's Trace 1.00041267 26.91 18 484 <.0001

Hotelling-Lawley Trace 31.69891194 423.02 18 397.91 <.0001

Roy's Greatest Root 31.66689389 851.49 9 242 <.0001

Rechazamos la no asociación entre las variables dependientes y las variables independientes.

Test 2

A la vista de los contrastes individuales, si son o no significativas las variables en cada regresión

individual, cabe contrastar si la variable Bíceps realmente debe estar en el modelo, está en el

límite en las 2 ecuaciones.

En forma ABM:

𝐴 = (0 0 0 0 0 0 0 0 1 0)

proc glm data=fat;* regresion;

model PerBFat1 PerBFat2 = Weight AdipInd FatFreeW Chest

Abdomen Thigh Nakle Bideocs Forearm/nouni; *nouni

elimina las salidas univariantes;

contrast 'Biceps se queda?' Bideocs 1; *****tests univariantes, matriz

A;

manova; * si no incluimos nada es la identidad

*****tests MULTIivariantes, matriz M;

run;

MANOVA Test Criteria and Exact F Statistics for the Hypothesis of No Overall Biceps se queda? Effect

H = Contrast SSCP Matrix for Biceps se queda? E = Error SSCP Matrix

S=1 M=0 N=119.5

Statistic Value F Value Num DF Den DF Pr > F

Wilks' Lambda 0.96936681 3.81 2 241 0.0235

Pillai's Trace 0.03063319 3.81 2 241 0.0235

Hotelling-Lawley Trace 0.03160124 3.81 2 241 0.0235

Roy's Greatest Root 0.03160124 3.81 2 241 0.0235

A niveles de alfa del 5% rechazamos que se pueda eliminar del modelo. Pero a niveles del 1%

no.

Page 7: Índice de Masa Corporal - UVavalentin/mem/2015/trabajos_alumnos...El índice de grasa corporal calculado con la ecuación de Brozek (PERBFAT1) , el mismo índice calculado con la

Test 3

Uno de nuestros objetivos era comparar si ambas ecuaciones eran equivalentes, para ello

contrastamos si los coeficientes en ambas regresiones coinciden.

En forma ABM:

𝐴 =

0 1 0 0 0 0 0 0 0 00 0 1 0 0 0 0 0 0 00 0 0 1 0 0 0 0 0 00 0 0 0 1 0 0 0 0 00 0 0 0 0 1 0 0 0 00 0 0 0 0 0 1 0 0 00 0 0 0 0 0 0 1 0 00 0 0 0 0 0 0 0 1 00 0 0 0 0 0 0 0 0 1

𝑀 = (1

−1)

proc glm data=fat;* regresion;

model PerBFat1 PerBFat2 = Weight AdipInd FatFreeW Chest

Abdomen Thigh Nakle Bideocs Forearm/nouni; *nouni

elimina las salidas univariantes;

contrast 'coef iguales?' Weight 1, AdipInd 1,FatFreeW 1,Chest

1,Abdomen 1,Thigh 1,Nakle 1,Bideocs 1,Forearm

1; *****tests univariantes, matriz A;

manova m=(1 -1); * si no incluimos nada es la identidad

*****tests MULTIivariantes, matriz M;

run;

MANOVA Test Criteria and Exact F Statistics for the Hypothesis of No Overall Biceps se queda? Effect

on the Variables Defined by the M Matrix Transformation H = Contrast SSCP Matrix for Biceps se queda?

E = Error SSCP Matrix

S=1 M=3.5 N=120

Statistic Value F Value Num DF Den DF Pr > F

Wilks' Lambda 0.11383531 209.32 9 242 <.0001

Pillai's Trace 0.88616469 209.32 9 242 <.0001

Hotelling-Lawley Trace 7.78462029 209.32 9 242 <.0001

Roy's Greatest Root 7.78462029 209.32 9 242 <.0001

Rechazamos que los coeficientes sean iguales para las dos regresiones.

Test 4

Contrastamos que el coeficiente del abdomen y el del peso son iguales para el IMC calculado

con la ecuación de Siri y de Brozek.

En forma ABM:

𝐴 = (0 1 0 0 0 0 0 0 0 00 0 0 0 0 1 0 0 0 0

) 𝑀 = (1

−1)

proc glm data=fat;* regresion;

model PerBFat1 PerBFat2 = Weight AdipInd FatFreeW Chest

Abdomen Thigh Nakle Bideocs Forearm/nouni; *nouni

elimina las salidas univariantes;

Page 8: Índice de Masa Corporal - UVavalentin/mem/2015/trabajos_alumnos...El índice de grasa corporal calculado con la ecuación de Brozek (PERBFAT1) , el mismo índice calculado con la

contrast 'Biceps se queda?' Weight 1, Abdomen 1;

*****tests univariantes, matriz A;

manova m=(1 -1); * si no incluimos nada es la identidad

*****tests MULTIivariantes, matriz M;

run;

MANOVA Test Criteria and Exact F Statistics for the Hypothesis of No Overall Biceps se queda? Effect

on the Variables Defined by the M Matrix Transformation H = Contrast SSCP Matrix for Biceps se queda?

E = Error SSCP Matrix

S=1 M=0 N=120

Statistic Value F Value Num DF Den DF Pr > F

Wilks' Lambda 0.51085030 115.86 2 242 <.0001

Pillai's Trace 0.48914970 115.86 2 242 <.0001

Hotelling-Lawley Trace 0.95752061 115.86 2 242 <.0001

Roy's Greatest Root 0.95752061 115.86 2 242 <.0001

Aunque numéricamente veamos que las cifras son similares, los test nos indican que rechazamos

dicha hipótesis.

Test 5

Contrastar si la variable Chest realmente debe estar en el modelo, está en el límite en las 2

ecuaciones.

En forma ABM:

𝐴 = (0 0 0 0 1 0 0 0 0 0)

proc glm data=fat;* regresion;

model PerBFat1 PerBFat2 = Weight AdipInd FatFreeW Chest

Abdomen Thigh Nakle Bideocs Forearm/nouni; *nouni

elimina las salidas univariantes;

contrast 'Biceps se queda?' chest 1; *****tests univariantes, matriz

A;

manova; * si no incluimos nada es la identidad

*****tests MULTIivariantes, matriz M;

run;

MANOVA Test Criteria and Exact F Statistics for the Hypothesis of No Overall Biceps se queda? Effect

H = Contrast SSCP Matrix for Biceps se queda? E = Error SSCP Matrix

S=1 M=0 N=119.5

Statistic Value F Value Num DF Den DF Pr > F

Wilks' Lambda 0.95456677 5.74 2 241 0.037

Pillai's Trace 0.04543323 5.74 2 241 0.037

Hotelling-Lawley Trace 0.04759566 5.74 2 241 0.037

Roy's Greatest Root 0.04759566 5.74 2 241 0.037

A niveles de alfa del 5% rechazamos que se pueda eliminar del modelo. Pero a niveles del 1%

no.

Page 9: Índice de Masa Corporal - UVavalentin/mem/2015/trabajos_alumnos...El índice de grasa corporal calculado con la ecuación de Brozek (PERBFAT1) , el mismo índice calculado con la

Test 6

Contrastar si la variable thigh realmente debe estar en el modelo, está en el límite en las 2

ecuaciones.

En forma ABM:

𝐴 = (0 0 0 0 0 0 1 0 0 0)

proc glm data=fat;* regresion;

model PerBFat1 PerBFat2 = Weight AdipInd FatFreeW Chest

Abdomen Thigh Nakle Bideocs Forearm/nouni; *nouni

elimina las salidas univariantes;

contrast thigh 1; *****tests univariantes, matriz A;

manova; * si no incluimos nada es la identidad

*****tests MULTIivariantes, matriz M;

run;

MANOVA Test Criteria and Exact F Statistics for the Hypothesis of No Overall contraste Effect H = Contrast SSCP Matrix for contraste

E = Error SSCP Matrix

S=1 M=0 N=119.5

Statistic Value Num DF Den DF Pr > F

Wilks' Lambda 0.91710365 2 241 <.018

Pillai's Trace 0.08289635 2 241 <.018

Hotelling-Lawley Trace 0.09038929 2 241 <.018

Roy's Greatest Root 0.09038929 2 241 <.018

A niveles de alfa del 5% rechazamos que se pueda eliminar del modelo. Pero a niveles del 1%

no.

Test 7

Contrastar si la variable nakle realmente debe estar en el modelo, está en el límite en las 2

ecuaciones.

En forma ABM:

𝐴 = (0 0 0 0 0 0 0 1 0 0)

proc glm data=fat;* regresion;

model PerBFat1 PerBFat2 = Weight AdipInd FatFreeW Chest

Abdomen Thigh Nakle Bideocs Forearm/nouni; *nouni

elimina las salidas univariantes;

contrast ‘contraste’ nakle 1; *****tests univariantes, matriz A;

manova; * si no incluimos nada es la identidad

*****tests MULTIivariantes, matriz M;

run;

MANOVA Test Criteria and Exact F Statistics for the Hypothesis of No Overall contraste Effect H = Contrast SSCP Matrix for contraste

E = Error SSCP Matrix

S=1 M=0 N=119.5

Statistic Value F Value Num DF Den DF Pr > F

Wilks' Lambda 0.97759265 2.76 2 241 0.0652

Pillai's Trace 0.02240735 2.76 2 241 0.0652

Hotelling-Lawley Trace 0.02292094 2.76 2 241 0.0652

Roy's Greatest Root 0.02292094 2.76 2 241 0.0652

Page 10: Índice de Masa Corporal - UVavalentin/mem/2015/trabajos_alumnos...El índice de grasa corporal calculado con la ecuación de Brozek (PERBFAT1) , el mismo índice calculado con la

A niveles de alfa del 5% no rechazamos que se pueda eliminar del modelo.

Finalmente nos quedamos con el modelo con las variables peso, adiposidad, masa libre de

grasa y abdomen.

Posteriormente veremos que habrá que hacer transformaciones sobre estas variables.

NORMALIDAD DE RESIDUOS %inc "F:\4 Estadistica\MEM\Tema1\Practica\multnorm.sas";

%multnorm(data=residtot, var=col1 col2, plot=both, hires=yes);

Normality Test

Equation Test Statistic Value Prob

COL1 Shapiro-Wilk W 0.94 <.0001

COL2 Shapiro-Wilk W 0.94 <.0001

System Mardia Skewness 834.1 <.0001

Mardia Kurtosis 119.6 <.0001

Henze-Zirkler T 11.52 <.0001

Rechazamos completamente la normalidad de los residuos.

Vamos a realizar una representación gráfica para intentar descubrir que sucede.

proc gplot data=fat;

plot (PerBFat1 PerBFat2)*(Weight AdipInd FatFreeW abdomen);run;

quit;

La variable masa libre de grasa no guarda una relación lineal con el IMC. Realizaremos una

transformación logarítmica de esta variable.

PerBFat2

0

10

20

30

40

50

FatFreeW

100 110 120 130 140 150 160 170 180 190 200 210 220 230 240 250

Independent variables that appear as 1, 2, 3, ..., 12 13 etc., they mean x1, X2, ..., x1 x2, x1 x3, etc.

Resid

ual

-5

-4

-3

-2

-1

0

1

2

Predicted Value

0 5 10 15 20 25 30 35 40 45 50

Page 11: Índice de Masa Corporal - UVavalentin/mem/2015/trabajos_alumnos...El índice de grasa corporal calculado con la ecuación de Brozek (PERBFAT1) , el mismo índice calculado con la

En el plot de reiduos vemos que hay términos cuadráticos que debemos incluir ya que no es nulo.

data auxi;

set fat;

x1=log(FatFreeW);*transformacion logaritmo;

Abdomen2=Abdomen*Abdomen;

AdipInd2=AdipInd*AdipInd;

run;

El modelo que nos queda es:

proc reg data=auxi;

model PerBFat1 PerBFat2 = Weight AdipInd AdipInd2 x1

Abdomen abdomen2;

plot r.*p.;

run;

Parameter Estimates PERBFAT1

Variable Label DF Parameter Estimate

Standard Error

t Value Pr > |t|

Intercept Intercept 1 246.72655 6.36263 38.78 <.0001

Weight Weight 1 0.40779 0.00968 42.13 <.0001

AdipInd AdipInd 1 0.61121 0.25995 2.35 0.0195

AdipInd2 1 -0.01043 0.00492 -2.12 0.0352

x1 1 -76.07925 1.16689 -65.20 <.0001

Abdomen Abdomen 1 1.41118 0.14698 9.60 <.0001

Abdomen2 1 -0.00722 0.00079401 -9.09 <.0001

Parameter Estimates PERBFAT2

Variable Label DF Parameter Estimate

Standard Error

t Value Pr > |t|

Intercept Intercept 1 264.36306 6.84986 38.59 <.0001

Weight Weight 1 0.43975 0.01042 42.20 <.0001

AdipInd AdipInd 1 0.59525 0.27985 2.13 0.0344

AdipInd2 1 -0.01005 0.00530 -1.89 0.0593

x1 1 -82.15885 1.25625 -65.40 <.0001

Abdomen Abdomen 1 1.56006 0.15823 9.86 <.0001

Abdomen2 1 -0.00798 0.00085481 -9.33 <.0001

Con estas transformaciones hemos conseguido que los plots de residuos sean completamente

nulos.

Page 12: Índice de Masa Corporal - UVavalentin/mem/2015/trabajos_alumnos...El índice de grasa corporal calculado con la ecuación de Brozek (PERBFAT1) , el mismo índice calculado con la

Si volvemos a contrastar la normalidad de estos nuevos residuos:

%multnorm(data=res_fat_sinout, var=col1 col2, plot=both, hires=yes);

Normality Test

Equation Test Statistic Prob

COL1 Shapiro-Wilk W 0.2900

COL2 Shapiro-Wilk W 0.200

System Mardia Skewness 0.1802

Mardia Kurtosis 0.08

Henze-Zirkler T 0.07

Pe r BFa t 1 = 2 4 6 . 7 3 + 0 . 4 0 7 8 We i g h t + 0 . 6 1 1 2 Ad i p I n d - 0 . 0 1 0 4 Ad i p I n d 2 - 7 6 . 0 7 9 x 1 + 1 . 4 1 1 2 Ab d o me n - 0 . 0 0 7 2 Ab d o me n 2

N

2 5 2

Rs q

0 . 9 8 5 5

Ad j Rs q0 . 9 8 5 2

RMSE

0 . 9 4 3 2

Independent variables that appear as 1, 2, 3, ..., 12 13 etc., they mean x1, X2, ..., x1 x2, x1 x3, etc.

Resid

ual

-4

-2

0

2

4

6

8

Predicted Value

0 5 10 15 20 25 30 35 40 45

Pe r BFa t 2 = 2 6 4 . 3 6 + 0 . 4 3 9 7 We i g h t + 0 . 5 9 5 2 Ad i p I n d - 0 . 0 1 Ad i p I n d 2 - 8 2 . 1 5 9 x 1 + 1 . 5 6 0 1 Ab d o me n - 0 . 0 0 8 Ab d o me n 2

N

2 5 2

Rs q

0 . 9 8 5 6

Ad j Rs q0 . 9 8 5 3

RMSE

1 . 0 1 5 4

Independent variables that appear as 1, 2, 3, ..., 12 13 etc., they mean x1, X2, ..., x1 x2, x1 x3, etc.

Resid

ual

-4

-2

0

2

4

6

8

10

Predicted Value

0 5 10 15 20 25 30 35 40 45 50

Page 13: Índice de Masa Corporal - UVavalentin/mem/2015/trabajos_alumnos...El índice de grasa corporal calculado con la ecuación de Brozek (PERBFAT1) , el mismo índice calculado con la

Mediante estas transformaciones e incluyendo términos cuadráticos de los regresores hemos conseguido mejorar el ajuste del modelo. Por lo que podemos afirmar que se trata de un modelo razonablemente bueno.