UNIVERSIDAD NACIONAL ABIERTA
CARRERA ADMINISTRACIÓN DE EMPRESAS
CONTADURIA PÚBLICA (CÓD. 610)
ANALISIS COMPARATIVO DE
TRES (3) MODELOS DE REGRESIÓN MÚLTIPLE
Preparado por YONIRA MARCANOC.I. No. XXXXXXXXAsignatura ESTADÍSTICA APLICADA (CÓD. 746)
Enero, 2011
RESUMEN
No existen estándares únicos, perfectamente reconocidos y universalmente aceptados en los
procesos de ventas. Lo que se tiene son muchísimos modelos o metodologías. Los Gerentes de
Mercadeo desarrollan estrategias que deben fundamentar la orientación que deseamos darle a un
producto o servicio con los objetivos de rentabilidad y de asignación eficiente de los recursos. En
éste proceso debemos evaluar cuidadosamente el impacto que puede tener para nuestra Empresas
sus fortalezas, debilidades, oportunidades, amenazas y ventajas competitivas. La toma de
conciencia por parte de los directivos y responsables de la venta respecto a que "cuanto mejor sea
y resulte la formación e idoneidad de cada uno de los representantes de venta, más cerca y segura
estará la empresa de su destino posible de éxito", representa el camino que corresponderá
transitarse. En la medida que más aciertos existan en cada una de las decisiones y acciones
operativas del negocio, tanto mayor será la probabilidad de una alta rentabilidad del negocio, en
donde no surjan por generación espontánea sino sólo por la implementación eficiente de tales
decisiones estratégicas y operativas. La Empresa busca esas ventajas competitivas mediante
programas de mercadeo bien integrados que coordinen el precio, el producto, la distribución y las
comunicaciones de nuestra oferta de bienes o servicios para satisfacer las necesidades de un
mercado meta. es por ello, que se desea conocer que factores afectan el volumen de ventas, para
ello se cuenta con 60 observaciones de mercadeo para cada territorio que le está asignado a cada
representante de ventas.
Con la construcción de tres modelos propuestos se busca:
Inferir sobre los parámetros poblacionales para cada uno de los modelos.
Realizar un análisis de residuos para cada uno de los modelos propuestos.
Determinar cuál de los modelos propuestos explica mejor la variable dependiente.
Para lo cual se consideraran las siguientes variables como objeto de estudio: X1: Total de ventas
acreditadas al vendedor. X2: Antigüedad del vendedor en la empresa, en meses. X3: Potencial de
mercado, ventas totales en unidades en el territorio de ventas. X4: Gastos de publicidad en el
territorio. X5: Participación en el mercado, promedio ponderado de los últimos cuatro años. X6:
Cambio de participación en el mercado en los últimos cuatro años. X7: Número de cuentas
asignadas a los vendedores. X8: Trabajo, índice ponderado basado en compras anuales y
concentración de cuentas. X9: Evaluación general del vendedor sobre ocho aspectos de su
desempeño, en una escala del 1 al 7. X10: Zona, división geográfica del país. X11: Territorio,
división estratégica de cada Zona.
INDICE
RESUMEN..................................................................................................................................................2
INTRODUCCION.......................................................................................................................................5
METODOLOGIA........................................................................................................................................8
RESULTADOS............................................................................................................................................9
DISCUSIÓN..............................................................................................................................................15
CONCLUSIONES.....................................................................................................................................23
REFERENCIAS.........................................................................................................................................25
INTRODUCCION
EL procedimiento de análisis de varianza, o ANOVA, utiliza una sola variable numérica medida
en los elementos de la muestra para probar la hipótesis nula de igualdad de medias poblaciones.
Esta variable puede ser de intervalo o de escala de razón.
Esta variable algunas veces recibe el nombre de variable dependiente, en especial en programas
de computadora que ejecutan ANOVA.
La hipótesis nula que se prueba en el ANOVA es que la mayoría de las poblaciones que se
estudian (al menos tres) tienen el mismo valor de la media para la variable dependiente. Las
hipótesis nula y alternativa en ANOVA son:
Ho: β1 = β2 … = βk = 0
HA: Al menos un no es cero
En la prueba ANOVA, se reúne evidencia muestral de cada población bajo estudio y se usan
estos datos para calcular un estadístico muestral. Después se consulta la distribución muestral
apropiada para determinar si el estadístico muestral contradice la suposición de que la hipótesis
nula es cierta. Si es así, se rechaza; de lo contrario no se rechaza.
Hemos de recordar que en la prueba de varianza con dos poblaciones se calcula el coeficiente de
las varianzas muestrales y se verifica con arreglo a la distribución F. Este procedimiento también
se usa en ANOVA para probar la hipótesis nula.
Se supone que todas las poblaciones bajo estudio tienen la misma varianza, sin importar si sus
medias son iguales. Es decir, ya sea que las poblaciones tengan medias iguales o distintas, la
variabilidad de los elementos alrededor de su respectiva media es la misma. Si esta suposición es
válida, entonces se puede probar la hipótesis nula de las medias poblacionales iguales usando la
distribución F.
El paso final en ANOVA requiere el cálculo de un cociente con la estimación del método entre en
el numerador y la estimación del método dentro en el denominador.. Si la hipótesis nula de que
las poblaciones tienen la misma media es cierta, esta razón consiste en dos estimaciones
separadas de la misma varianza poblacional y, se puede obtener la distribución F si las medias
poblacionales no son iguales. La estimación en el numerador estará inflada, y el resultado será un
cociente muy grande. Al consultar la distribución F no es probable que un cociente tan grande
haya sido obtenido de esta distribución, y la hipótesis nula será rechazada. La prueba de hipótesis
en ANOVA es de una cola: un estadístico F grande llevará al rechazo de la hipótesis nula y un
valor pequeño hará que no se rechace.
Para los efectos del presente informe se estudiarán 60 observaciones suministradas por la
empresa, a fin de conocer los factores que afectan el volumen de las ventas en cada territorio, se
procederá a estudiar la correlación existente entre las variables independientes, un coeficiente de
intercepción y una variable dependiente. Las variables objeto de estudio son:
X1: Total de ventas acreditadas al vendedor.
X2: Antigüedad del vendedor en la empresa, en meses.
X3: Potencial de mercado, ventas totales en unidades en el territorio de ventas.
X4: Gastos de publicidad en el territorio.
X5: Participación en el mercado, promedio ponderado de los últimos cuatro años.
X6: Cambio de participación en el mercado en los últimos cuatro años.
X7: Número de cuentas asignadas a los vendedores.
X8: Trabajo, índice ponderado basado en compras anuales y concentración de cuentas.
X9: Evaluación general del vendedor sobre ocho aspectos de su desempeño, en una escala del 1
al 7.
X10: Zona, división geográfica del país Además para mejor desarrollo y elaboración del
informe se emplearan diversas herramientas descriptivas, tablas de distribución, tablas de
contingencia y varios gráficos que se aplicará al conjunto de datos.
X11: Territorio, división estratégica de cada Zona.
El estudio de las mismas permitirán lograr determinar los factores de mayor incidencia en las
ventas.
Para efectos de este estudio se requiere la elaboración de tres (3) modelos, previamente
establecidos, a saber:
Modelo 1
X1 = b2 X2 + b3 X3 + b 4 X 4 + b5 X5 + b6 X6 + b7 X7 + b8 X8 + b9 X9 + b10 X10 + b11 X11
Modelo 2
X1 = b2 X2 + b3 X3 + b 4 X 4 + b9 X9 + b10 X10 + b11X11
Modelo 3
X1 = b2 X2 + b7 X7 + b8 X8
Todo esto con la finalidad de:
Inferir sobre los parámetros poblacionales para cada uno de los modelos.
Realizar un análisis de residuos para cada uno de los modelos propuestos.
Determinar cuál de los modelos propuestos explica mejor la variable dependiente.
Para el estudio de los parámetros poblacionales de los modelos se utilizará el método de
Mínimos Cuadrados Ordinarios (MCO).
METODOLOGIA
POBLACION:
Los datos del problema nos suministran claramente la muestra a ser evaluada. En este caso las 60
observaciones suministradas por la empresa
INSTRUMENTOS/MATERIALES:
Se utilizarán tablas de distribución, de contingencia y herramientas estadísticas descriptivas de
los datos para crear grupos, pruebas de hipótesis, etc., utilizando para ello el Programa
Computacional EXCEL de Microsoft Office, bajo sistema operativo Windows XP, versión 2002.
PROCEDIMIENTO:
Se cargó en el programa Excel los datos suministrados por la Universidad para efectos de este
trabajo. Se corrió el mismo y se obtuvieron los índices y coeficientes, así como la tabla ANOVA
para efectuar el análisis de Varianza, los estadísticos "t" para cada una de las variables
independientes y determinar el valor significativo de cada una de ellas, los valores del parámetro
"F" y el valor crítico de "F" el cual nos indica el mínimo de grado de confianza con el que se
aceptarán los modelos a estudiar..
RESULTADOS
De acuerdo a los coeficientes obtenidos con la herramienta Excel indicados en las tablas adjunta,
podemos determinar la ecuación de regresión para cada uno de los modelos.
Modelo 1:
Estadísticas de la regresión
Coeficiente de correlaciónmúltiple
0,62465428
Coeficiente dedeterminación R^2
0,39019297
R^2 ajustado 0,26574256
Error típico 1186,45691
Observaciones 60
ANÁLISIS DE VARIANZAGrados de
libertadSuma de
cuadradosPromedio delos cuadrados
FValor crítico de
FRegresió
n10 44135397,5 4413539,75
3,13532885
0,00361348
Residuos 49 68976320,4 1407680,01
Total 59 113111718
Coeficientes Error típico Estadístico t
Probabilidad
Inferior 95%
Superior 95%
Intercepción -345,996633
1126,1395 -0,30724136
0,7599617 -2609,05864
1917,06538
X2 4,82908813 2,11678432 2,28133215 0,02691228 0,57525085 9,08292541X3 0,01235371 0,01060051 1,16538886 0,24950344 -0,0089488 0,03365623X4 0,08011024 0,07100008 1,128312 0,26468247 -
0,062569750,22279023
X5 21,7932595 66,1048013 0,32967741 0,74304896 -111,04931 154,635829
X6 -12,642434 182,520663 -0,06926577
0,94505998 -379,431431
354,146563
X7 4,09915876 3,73550031 1,097352 0,27785103 -3,40761003
11,6059275
X8 32,6180575 46,1824503 0,70628685 0,4833547 -60,1890494
125,425164
X9 214,490886 158,870894 1,35009554 0,18318899 -104,772123
533,753895
X10 165,905196 138,377183 1,19893462 0,23631945 -112,17416 443,984552X11 -
51,881645932,6930531 -
1,586931810,11896098 -
117,58079513,8175029
Ecuación de la RegresiónX1 = b2 X2 + b3 X3 + b 4 X 4 + b5 X5 + b6 X6 + b7 X7 + b8 X8 + b9 X9 + b10 X10 + b11 X11
Y = -345,99+ 4,82+0,01+0,08+21,79-12,64+4,09+32,61+214,49+165,90-51,88
Observación Pronóstico X1 ResiduosResiduos
estándares1 3157,44949 512,430513 0,47392648
2 3921,25281 -447,302805 -0,41369247
3 2277,11888 17,9811227 0,01663002
4 3899,69598 775,864024 0,7175656
5 4389,09482 1736,86518 1,60635712
6 2850,58459 -715,644593 -0,66187105
7 5572,31507 -540,655066 -0,50003024
8 3706,04271 -338,592708 -0,31315085
9 4767,46685 1751,98315 1,62033913
10 3188,54709 1687,82291 1,56099989
11 2415,87747 52,3925286 0,04845575
12 2882,70566 -349,395661 -0,32314207
13 2302,12183 105,98817 0,09802422
14 2563,77935 -226,399352 -0,2093877
15 4174,40056 412,549441 0,38155047
16 3172,3806 -443,140595 -0,40984301
17 3200,49018 88,9098222 0,08222914
18 2911,31582 -110,535818 -0,10223016
19 3040,69895 223,501053 0,20670718
20 3721,76698 -268,146985 -0,24799842
21 1889,84576 -148,395755 -0,1372453
22 2606,56547 -570,815475 -0,5279244
23 1876,92376 -298,923758 -0,27646263
24 3198,54466 968,895337 0,89609254
25 3322,54258 -522,572585 -0,48330648
26 653,403566 1406,32643 1,30065506
27 3914,1889 -487,7289 -0,45108095
28 3517,48647 -533,046473 -0,49299336
29 2811,35912 -793,759119 -0,73411605
30 3580,8362 377,693803 0,34931389
Observación Pronóstico Residuos Residuos
X1 estándares31 3739,00992 -910,719923 -0,84228842
32 3520,97309 -2361,88309 -2,18441118
33 1954,7735 -214,723502 -0,19858918
34 4659,47107 1004,47893 0,92900238
35 2234,97922 -1008,39922 -0,93262809
36 2179,53049 -841,460494 -0,77823315
37 5167,48367 836,536332 0,77367899
38 3213,55574 145,494262 0,13456182
39 3171,70673 -408,616725 -0,37791326
40 3321,3976 565,022397 0,52256661
41 3459,98577 1617,57423 1,49602969
42 3214,40267 2019,88733 1,86811298
43 3358,69686 142,983142 0,13223939
44 3262,39367 -1006,79367 -0,93114319
45 3072,1342 640,1558 0,59205449
46 2232,41875 -1426,07875 -1,31892318
47 3509,32187 -3087,34187 -2,85535899
48 2709,86788 -148,967876 -0,13777443
49 3758,01616 -796,106155 -0,73628673
50 3449,28447 -583,31447 -0,53948422
51 2130,03472 390,435277 0,36109797
52 1937,76519 1040,05481 0,96190509
53 2078,78381 4015,53619 3,71380878
54 2844,44097 -482,430967 -0,4461811
55 2348,74614 -1254,87614 -1,16058474
56 4256,01963 -885,419628 -0,81888919
57 3169,25616 -681,946155 -0,63070472
58 3065,04787 222,722127 0,20598679
59 3390,89549 -592,205493 -0,54770717
60 3742,63455 726,25545 0,67168461
Modelo 2:
Estadísticas de la regresiónCoeficiente de correlaciónmúltiple 0,60215002Coeficiente dedeterminación R^2 0,36258465R^2 ajustado 0,29042442Error típico 1166,34525Observaciones 60
Análisis de VarianzaGrados de
libertadSuma de
cuadradosPromedio de los cuadrados
FValor crítico de
FRegresió
n6 41012572,5 6835428,75
5,02471593
0,0003841
Residuos 53 72099145,3 1360361,23
Total 59 113111718
Coeficientes Error típico
Estadístico t
Probabilidad
Inferior 95%
Superior 95%
Intercepción
558,031765 799,167198 0,6982666 0,48806302 -1044,8946 2160,95813
X2 5,4255281 1,90075154 2,85441204 0,00614023 1,61310339 9,23795281X3 0,01616705 0,01002822 1,61215605 0,11286767 -0,003947 0,0362811X4 0,10452256 0,06556776 1,59411515 0,11685706 -0,02698971 0,23603483X9 206,51111 142,056668 1,45372346 0,15191921 -78,418476 491,440697X10 208,350436 131,263475 1,58726894 0,11840047 -54,9307465 471,631618X11 -
64,070260430,1505094 -2,1250142 0,0382656 -124,544522 -3,59599839
Ecuación de la RegresiónX1 = b2 X2 + b3 X3 + b 4 X 4 + b9 X9 + b10 X10 + b11X11
Y = 558,03+5,42+0,01+0,10+206,51+208,35-64,07
Observación Pronóstico X2 ResiduosResiduos
estándares1 3624,48719 45,3928123 0,04106275
2 4069,15071 -595,200709 -0,53842397
3 2170,26232 124,83768 0,1129293
4 3837,02623 838,533774 0,75854527
5 4290,4835 1835,4765 1,66038872
6 2958,45335 -823,513352 -0,74495766
7 5201,23574 -169,575742 -0,15339976
8 3727,25675 -359,806754 -0,32548446
9 4574,81163 1944,63837 1,75913754
10 3078,87959 1797,49041 1,62602616
11 2427,75497 40,5150289 0,03665026
12 2882,03929 -348,729288 -0,31546368
13 2153,46827 254,641732 0,23035123
14 2508,94853 -171,568533 -0,15520245
15 4383,05636 203,893637 0,18444404
16 3491,6239 -762,383898 -0,6896594
17 3584,2996 -294,899602 -0,26676886
18 3204,60185 -403,821852 -0,36530092
19 3024,39552 239,80448 0,21692931
20 3801,16543 -347,545427 -0,31439275
21 1808,56166 -67,1116595 -0,06070982
22 2428,56338 -392,813375 -0,35534255
23 1792,95557 -214,955571 -0,19445076
24 2777,61606 1389,82394 1,25724737
25 3195,82912 -395,859116 -0,35809775
26 1227,1871 832,542898 0,75312587
27 3877,06948 -450,609484 -0,40762544
28 3098,77516 -114,335161 -0,10342863
29 2888,8349 -871,234898 -0,78812701
30 3508,28647 450,243525 0,40729439
ObservaciónPronóstico
X2Residuos
Residuos estándares
31 3753,35423 -925,064233 -0,83682151
32 3729,01999 -2569,92999 -2,32478203
33 2099,03474 -358,98474 -0,32474086
34 4637,93499 1026,01501 0,9281425
35 2149,19851 -922,618511 -0,83460909
36 2004,03186 -665,961856 -0,60243515
37 4797,59538 1206,42462 1,09134268
38 3716,47097 -357,420971 -0,32332626
39 3254,78433 -491,694327 -0,44479116
40 3472,4875 413,932504 0,37444711
41 3608,44625 1469,11375 1,32897365
42 2981,07327 2253,21673 2,03828034
43 3054,20193 447,47807 0,40479273
44 3382,4765 -1126,8765 -1,01938273
45 3056,48328 655,80672 0,59324872
46 2069,08889 -1262,74889 -1,14229412
47 3373,9536 -2951,9736 -2,67038215
48 2451,56189 109,338113 0,09890825
49 3732,9759 -771,065904 -0,69751323
50 3347,37403 -481,404031 -0,43548246
51 2280,02227 240,447733 0,21751121
52 2534,21119 443,608813 0,40129257
53 1873,4005 4220,9195 3,81828215
54 2418,70585 -56,6958536 -0,05128758
55 2509,20049 -1415,33049 -1,28032083
56 4375,08306 -1004,48306 -0,90866451
57 3093,30645 -605,996454 -0,5481899
58 3111,43555 176,334448 0,15951374
59 3331,25843 -532,568434 -0,48176625
60 3844,57853 624,311473 0,56475783
Modelo 3:
Estadísticas de la regresiónCoeficiente de correlaciónmúltiple 0,5221449Coeficiente dedeterminación R^2 0,2726353R^2 ajustado 0,23366933Error típico 1212,09287Observaciones 60
Análisis de VarianzaGrados de
libertadSuma de
cuadradosPromedio de los
cuadradosF Valor crítico
de FRegresión 3 30838246,7 10279415,6 6,99675441 0,00044403Residuos 56 82273471,2 1469169,13Total 59 113111718
Coeficientes Error típico Estadístico t Probabilidad Inferior 95%Superior
95%Intercepción 658,298 837,232712 0,78627858 0,43501896 -1018,8805 2335,4768X2 4,785 2,01421308 2,37559041 0,02096823 0,74999165 8,81989892X7 8,470 3,46699197 2,44302341 0,01774381 1,52472311 15,415162X8 54,019 40,4606185 1,33508845 0,18724958 -27,0338533 135,070862
Ecuación de la RegresiónX1 = b2 X2 + b7 X7 + b8 X8
Ŷ = 658,30+4,78+8,47+54,02
Observación Pronóstico X3 ResiduosResiduos
estándares1 2311,56768 1358,31232 1,15025925
2 3163,43805 310,511948 0,26295075
3 2480,5739 -185,473902 -0,15706481
4 3925,66241 749,897589 0,63503557
5 3913,6573 2212,3027 1,87344369
6 2465,58328 -330,643277 -0,27999856
7 5589,69475 -558,034746 -0,47256041
8 3859,56761 -492,117607 -0,41673982
9 3931,56674 2587,88326 2,19149648
10 3332,79803 1543,57197 1,30714263
11 2800,7827 -332,512704 -0,28158164
12 2760,03908 -226,729084 -0,19200093
13 2527,15112 -119,041117 -0,10080756
14 2522,0102 -184,630196 -0,15635034
15 2911,10575 1675,84425 1,41915473
16 2990,90067 -261,660667 -0,22158203
17 2793,30516 496,09484 0,42010786
18 2392,84138 407,938623 0,34545455
19 3010,04213 254,157871 0,21522844
20 3589,88899 -136,268989 -0,11539663
21 2483,13579 -741,685787 -0,62808157
22 2762,12782 -726,377815 -0,61511833
23 2503,70987 -925,709871 -0,78391864
24 3433,33365 734,106354 0,62166308
25 2858,36007 -58,3900739 -0,04944645
26 1230,9575 828,772504 0,70182919
27 3640,77266 -214,312659 -0,18148633
28 3835,72113 -851,281129 -0,72089017
29 3010,35952 -992,759516 -0,84069827
30 3480,45705 478,072954 0,40484639
ObservaciónPronóstico
X3Residuos
Residuos estándares
31 3295,32004 -467,030045 -0,39549493
32 2674,01334 -1514,92334 -1,28288212
33 2162,20486 -422,154864 -0,35749329
34 3532,37254 2131,57746 1,80508316
35 2381,10484 -1154,52484 -0,97768596
36 3065,06557 -1726,99557 -1,46247119
37 4817,24129 1186,77871 1,00499949
38 3080,09321 278,956788 0,2362289
39 2701,13094 61,9590599 0,05246877
40 3238,55325 647,866752 0,54863283
41 3835,55058 1242,00942 1,0517705
42 3609,66296 1624,62704 1,37578247
43 3663,3466 -161,666603 -0,13690409
44 3436,72881 -1181,12881 -1,00021499
45 3580,63898 131,651021 0,111486
46 2792,80313 -1986,46313 -1,68219603
47 4078,12835 -3656,14835 -3,09613511
48 3222,74671 -661,846715 -0,56047147
49 3932,8843 -970,974296 -0,8222499
50 2761,71519 104,254806 0,08828607
51 2583,61649 -63,1464885 -0,05347432
52 1802,8491 1174,9709 0,99500029
53 2665,41365 3428,90635 2,90369983
54 3696,57815 -1334,56815 -1,13015199
55 2399,7363 -1305,8663 -1,1058464
56 4222,19634 -851,596337 -0,72115709
57 3388,40262 -901,092618 -0,76307202
58 3190,43265 97,3373487 0,08242816
59 3273,86941 -475,179411 -0,40239605
60 4044,31783 424,572173 0,35954034
DISCUSIÓN
El análisis de varianza, como técnica de lo que trata es: si se está estudiando la característica
cuyos valores dependen de varias clases de efectos que operan simultáneamente, poder decidir si
tales efectos son debido al azar o si realmente son diferentes. Para la aplicación de ANOVA son
esenciales tres (3) suposiciones:
1. Todas las poblaciones involucradas son normales.
2. Todas las poblaciones tienen la misma varianza.
3. Las muestras se seleccionan independientemente.
El análisis de varianza o ANOVA, es un procedimiento que prueba si algunas de las variables
independientes tienen relación con la variable dependiente, si alguna variable independiente no
está relacionada con la variable Y, su coeficiente debería ser cero. Es decir, Si X1 no está
relacionada con Y, entonces βi = 0. Al mismo tiempo prueba la hipótesis nula de que todos los
valores β son cero contra la alternativa de que por los menos un β no es cero. Si no se rechaza la
hipótesis nula, entonces no hay relación lineal entre Y i cualquiera de las variables
independientes. Por otra parte, si la hipótesis nula se rechaza, entonces por los menos una
variable independiente está relacionada linealmente con Y.
Continuado con el ANOVA, estructuramos la hipótesis y la evaluamos
HO: β2 = β3 = β4 = β5 = β6 = β7 = β8 = β9 = β10 = β11 =0
HA : Al menos un β no es cero
Siguiendo la metodología implementada, procedemos a describir los hallazgos encontrados según
los modelos en estudio:
Modelo 1
Los coeficientes que acompañan a cada variable independiente en la Ecuación de Regresión
obtenida nos indican el grado de relación que éstas tienen con respecto a la variable dependiente,
para este primer modelo:
Y = b2 X2 + b3 X3 + b 4 X 4 + b5 X5 + b6 X6 + b7 X7 + b8 X8 + b9 X9 + b10 X10 + b11 X11
El resultado obtenido es:
Y = -345,99+ 4,82+0,01+0,08+21,79-12,64+4,09+32,61+214,49+165,90-51,88
Estos resultados muestran que si varia la Antigüedad del vendedor en la empresa en una unidad,
manteniéndose fijos los valores de las otras variables, la variable dependiente Total de Ventas
acreditadas al vendedor variará en 4,83; igual criterio se aplicaría a las demás variables.
El error típico o error estándar de estimación mide los grados de dispersión de los valores Yi
alrededor del plano de regresión, entre menos dispersión se presente, más pequeño será el Se
(error estándar), y más preciso será el modelo en su predicción y pronostico, los resultados
obtenidos para el Modelo 1 muestran un resultado de 1186,456914.
El coeficiente de determinación múltiple mide la fuerza de la relación entre Y y las variables
independientes, entre mayor sea R2 mayor poder explicativo tendrá el modelo, para el Modelo 1
este coeficiente según los resultados es de 0.62465428; la relación es de 62.47%.
El coeficiente de determinación ajustado o corregido procura contrarrestar la incorporación de
alguna variable absurda sin un poder realmente explicativo al modelo, es una corrección de
honestidad, R2 nos castigará si introducimos variables innecesarias en nuestro modelo, los
resultados de Modelo 1 en estudio nos muestran un coeficiente de determinación ajustado de
0,265742559.
Para el Modelo 1, el valor de F es de 3,13532885 y los grados de libertad son 10 y 49, probamos
nuestra hipótesis con un nivel de significancia del 5%, con la ayuda de la tabla G se determina
que F0.05,10,49 es 1,92. La regla de decisión es “no rechazar si F < 1.92; rechazar si F>1,92, debido
a que el valor de F = 3,13532885 > 1.92, la hipótesis se rechaza, existe por los menos con un α =
0,05 una relación lineal entre Y y por lo menos una de las variables independientes.
A un nivel de significancia del 5%, con grados de libertad g.l. = n-k-1 = 60-10-1 = 49, el valor
t0.05,49 es de 2.0116 (con la ayuda de la Tabla F, hallamos el valor para 40 y 60 g.l, e
interpolamos); la regla de decisión es “no rechazar si t ± 2.0116; de lo contrario rechazar”.
X2 como 2,28133215 > 2.0116 Se rechaza la hipótesis nulaX3 como 1,16538886 Está entre ± 2.0116 No se rechaza la hipótesis nulaX4 como 1,128312 Está entre ± 2.0116 No se rechaza la hipótesis nulaX5 como 0,32967741 Está entre ± 2.0116 No se rechaza la hipótesis nulaX6 como -0,06926577 Está entre ± 2.0116 No se rechaza la hipótesis nulaX7 como 1,097352 Está entre ± 2.0116 No se rechaza la hipótesis nulaX8 como 0,70628685 Está entre ± 2.0116 No se rechaza la hipótesis nulaX9 como 1,35009554 Está entre ± 2.0116 No se rechaza la hipótesis nulaX10 como 1,19893462 Está entre ± 2.0116 No se rechaza la hipótesis nulaX11 como -1,58693181 Está entre ± 2.0116 No se rechaza la hipótesis nula
Se extrae que con un nivel del 95% de confianza que la variable 2, contribuyen
significativamente a la explicación del modelo, debido a que este caso la hipótesis se rechaza; por
otra parte, podemos estar seguros en un 95% que las demás variables contribuyen
significativamente con la explicación del modelo, pues en estos casos la hipótesis no es
rechazada.
La gráfica para este modelo:
Modelo 2
Los coeficientes que acompañan a cada variable independiente en la Ecuación de Regresión
obtenida nos indican el grado de relación que éstas tienen con respecto a la variable dependiente,
para este primer modelo:
X1 = b2 X2 + b3 X3 + b 4 X 4 + b9 X9 + b10 X10 + b11X11
El resultado obtenido es:
Y = 558,03+5,42+0,01+0,10+206,51+208,35-64,07
El grado de relación que existe entre las variables, podemos decir que si aumentamos en una
unidad la variable Antigüedad del vendedor en la empresa (X2), dejando fijos el valor de las otras
variables independientes, la variable dependiente X1 variará 5.4255281; el mismo razonamiento
se puede aplicar a las otras variables independientes, de acuerdo a los resultados mostrados en la
Tabla.
Al evaluar el Modelo 2 propuesto, con la finalidad de determinar su grado de significancia y su
aporte explicativo. Cuando detallamos los resultados arrojados por el Modelo 1, definimos cada
una de las herramientas estadísticas de la cuales nos valemos para evaluar un modelo o ecuación
de regresión múltiple. Sería redundante volver a explicar lo mismo, motivo por el cual nos
limitaremos a describir cada uno de los resultados arrojados y sus correspondientes estimaciones
más importantes.
El error típico o error estándar de estimación muestra un resultado de 1166,34525, una leve
diferencia con el Modelo 1, mostrando éste ultimo una menor dispersión, esto no puede ser
concluyente pues esto tan solo muestra el grado de dispersión que tienen o presentan los datos.
El coeficiente de determinación múltiple es de 0,60215002; podemos inferir que las variables
independientes están relacionadas en un 60.02% con la variable Y, al ser el resultado positivo, la
relación es directa, los valores de la variable dependiente aumentarán o disminuirán de acuerdo a
los aumentos o disminuciones de las variables independientes.
El coeficiente de determinación corregido es de 0.29042442; lo cual indica que las variaciones de
la variable dependiente X1 pueden ser explicadas en un 29,04% por el comportamiento de las
variables independientes.
El Modelo 2, muestra un valor de F de 5.0271593 y grado de libertad de 6 y 53, vamos utilizar un
nivel de significancia del 5%, con la ayuda de la Tabla G buscamos el valor t0.05,6,53 el cual es
2,25; la regla de decisión es “no rechazar si F > 2,25; rechazar si F > 2,25”; Como F = 5.0271593
> 2,25; la hipótesis se rechaza, podemos decir con un α = 0,05 que existe por lo menos una
relación lineal de Y por los menos con una de las variables independientes.
Al aplicar nivel de significancia del 5%, con grados de libertad g.l. = n-k-1 = 100-3-1 = 96, con la
ayuda de las tablas buscamos el valor de t0.05, 96 el cual es 2,0074; la regla de decisión es “no
rechazar si t ± 2,0074 (con la ayuda de la Tabla F, hallamos el valor para 60 y 120 g.l, e
interpolamos); de lo contrario rechazar”.
X2 como 2,85441204 > 2.0074 Se rechaza la hipótesis nulaX3 como 1,61215605 Está entre ± 2.0074 No se rechaza la hipótesis nulaX4 como 1,59411515 Está entre ± 2.0074 No se rechaza la hipótesis nulaX9 como 1,45372346 Está entre ± 2.0074 No se rechaza la hipótesis nulaX10 como 1,58726894 Está entre ± 2.0074 No se rechaza la hipótesis nulaX11 como -2,1250142 Está entre ± 2.0074 No se rechaza la hipótesis nula
Con un grado de confianza del 95% que sólo la variable X2, contribuye significativamente en la
explicación del modelo, al ser rechazada, mientras que las variables independientes de este
modelo (X3, X4, X9, X10 Y X11), no contribuyen significativamente a la explicación del modelo
al ser aceptada su hipótesis. Las gráficas de los residuales para este modelo:
Modelo 3
X1 = b2 X2 + b7 X7 + b8 X8
Los resultados obtenidos de la regresión de esta ecuación o modelo de regresión múltiple,
presentan los siguientes coeficientes:
Ŷ = 658,30+4,78+8,47+54,02
La ecuación de regresión múltiple muestra la relación que existe entre las variables
independientes y la variable dependiente, de cómo el comportamiento o variación de las primeras
afectan a la segunda, los resultados nos dicen que si la variable Antigüedad del vendedor en la
empresa (X2) aumenta en una unidad, manteniendo fijo el valor de las otras variables
independientes, la variable dependiente Evaluación del Vendedor (X9) modificará su valor en
4.78494529.
El error típico o error estándar de estimación es de 1212.09287; si verificamos los resultados
podemos afirmar que la dispersión de datos más alta la posee el Modelo 3, esto no debe tomarse
como concluyente por cuanto debemos seguir evaluando la ecuación.
El coeficiente de determinación es de 0,2726353; se puede decir que un 27,27% el grado de
relación que existe entre las variables independientes con la variable dependiente Ŷ.
El coeficiente de determinación ajustado o corregido es de 0,23366933; el grado de relación de
las variables independientes X2, X7 y X8 según este coeficiente es de 23,37%, prevé la posible
inclusión por accidente, error u omisión de una variable absurda.
En el Modelo 3, el valor de F es 6.99675441; con grados de libertad de 3 y 56, probamos la
hipótesis con un grado de significancia del 5%, con la ayuda de la Tabla G hallamos del valor
para F0,05;3;56 y nos da 2,61; la regla de decisión es “no rechazar si F > 2,61; rechazar si F > 2,61;
Como F = 6.99675441 > 2,61 la hipótesis se rechaza, podemos inferir con un grado de seguridad
del 95% que existe por lo menos una relación entre el comportamiento de la variable dependiente
X1 y alguna de la variables independientes.
Con un grado de significancia del 5%, con grados de liberta g.l. = n-k-1 = 60-3-1 = 56, con la
ayuda de la Tabla T, para la distribución t buscamos el valor para t 0,05;56 el cual es 2.0042;
construimos la regla de decisión “no rechazar si t ± 2.0042; de lo contrario rechazar la hipótesis”
X2 como 2,37559041 > 2.0074 Se rechaza la hipotesisX7 8,470 2,44302341 > 2.0074 Se rechaza la hipotesisX8 54,019 1,33508845 < 2.0074 No se rechaza la hipotesis
Podemos inferir, por los resultados obtenidos, con un 95% de seguridad que las variables X2 y
X7, contribuyen significativamente a la explicación del modelo, pues para estas variables la
hipótesis nula se rechaza, mientras que la variable independiente X8 no contribuyen con la
explicación del modelo, pues las hipótesis no fueron rechazadas.
Las graficas de los residuales del tercer modelo en estudio son:
CONCLUSIONES
De menor a mayor los modelos objeto de estudio de acuerdo al grado de dispersión de los
datos, el cual es medido a través del error típico o error estándar de estimación:
Modelo 1 1186,46
Modelo 2 1166.35
Modelo 3 1212.09
Se evidencia que el Modelo 2 es el presenta menor grado de dispersión de los datos
La relación que existe entre las variables independientes y la variable dependiente,
medidas a través del coeficiente de determinación múltiple, mostramos los hallazgos
realizados, según el modelo:
Modelo 1 0.39019297 ó 39.02%
Modelo 2 0.36258465 ó 36.26%
Modelo 3 0.2726353 ó 27.26%
Se muestra que el Modelo 1 es el que presenta mayor grado de relación entre las variables
independientes y la variable dependiente.
El coeficiente de determinación corregido o ajustado, que prevé la posible la introducción
de una variable absurda, se presenta en el siguiente orden según el modelo:
Modelo 1 0.26574257 ó 26.57%
Modelo 2 0.29042442 ó 29.04%
Modelo 3 0.23366933 ó 23.37%
Se demuestra que el Modelo 2 es el más propenso a la introducción de una variable
absurda
El análisis de varianza o ANOVA demostró que de los Modelos 1, 2 y 3, por lo menos una de sus
variables independientes tienen relación con la variable dependiente, el mayor valor F lo tiene el
Modelo 3 con 6.99675441; seguido del Modelo 2 con 5.02471593; y por último el Modelo 1 con
3.13532885.
Se concluye que el Modelo 1 explica con mayor fuerza la relación entre las variables
independientes y la variable dependiente, ya que presenta una mayor significancia en predecir el
comportamiento de la variable dependiente.
REFERENCIAS
Webster A. (2003) Estadística aplicada a los negocios y a la economía. 3ª Edición, Colombia:
Irwin Editorial McGraw Hill
Prof. Gilberto Noguera (2007) Elementos de Excel para la Estadística – Guía de Excel
Venezuela: Universidad Nacional Abierta