Download doc - 746 a Aplicada Trabajo Final-yonira Marcano

UNIVERSIDAD NACIONAL ABIERTA

CARRERA ADMINISTRACIÓN DE EMPRESAS

CONTADURIA PÚBLICA (CÓD. 610)

ANALISIS COMPARATIVO DE

TRES (3) MODELOS DE REGRESIÓN MÚLTIPLE

Preparado por YONIRA MARCANOC.I. No. XXXXXXXXAsignatura ESTADÍSTICA APLICADA (CÓD. 746)

Enero, 2011

RESUMEN

No existen estándares únicos, perfectamente reconocidos y universalmente aceptados en los

procesos de ventas. Lo que se tiene son muchísimos modelos o metodologías. Los Gerentes de

Mercadeo desarrollan estrategias que deben fundamentar la orientación que deseamos darle a un

producto o servicio con los objetivos de rentabilidad y de asignación eficiente de los recursos. En

éste proceso debemos evaluar cuidadosamente el impacto que puede tener para nuestra Empresas

sus fortalezas, debilidades, oportunidades, amenazas y ventajas competitivas. La toma de

conciencia por parte de los directivos y responsables de la venta respecto a que "cuanto mejor sea

y resulte la formación e idoneidad de cada uno de los representantes de venta, más cerca y segura

estará la empresa de su destino posible de éxito", representa el camino que corresponderá

transitarse. En la medida que más aciertos existan en cada una de las decisiones y acciones

operativas del negocio, tanto mayor será la probabilidad de una alta rentabilidad del negocio, en

donde no surjan por generación espontánea sino sólo por la implementación eficiente de tales

decisiones estratégicas y operativas. La Empresa busca esas ventajas competitivas mediante

programas de mercadeo bien integrados que coordinen el precio, el producto, la distribución y las

comunicaciones de nuestra oferta de bienes o servicios para satisfacer las necesidades de un

mercado meta. es por ello, que se desea conocer que factores afectan el volumen de ventas, para

ello se cuenta con 60 observaciones de mercadeo para cada territorio que le está asignado a cada

representante de ventas.

Con la construcción de tres modelos propuestos se busca:

Inferir sobre los parámetros poblacionales para cada uno de los modelos.

Realizar un análisis de residuos para cada uno de los modelos propuestos.

Determinar cuál de los modelos propuestos explica mejor la variable dependiente.

Para lo cual se consideraran las siguientes variables como objeto de estudio: X1: Total de ventas

acreditadas al vendedor. X2: Antigüedad del vendedor en la empresa, en meses. X3: Potencial de

mercado, ventas totales en unidades en el territorio de ventas. X4: Gastos de publicidad en el

territorio. X5: Participación en el mercado, promedio ponderado de los últimos cuatro años. X6:

Cambio de participación en el mercado en los últimos cuatro años. X7: Número de cuentas

asignadas a los vendedores. X8: Trabajo, índice ponderado basado en compras anuales y

concentración de cuentas. X9: Evaluación general del vendedor sobre ocho aspectos de su

desempeño, en una escala del 1 al 7. X10: Zona, división geográfica del país. X11: Territorio,

división estratégica de cada Zona.

INDICE

RESUMEN..................................................................................................................................................2

INTRODUCCION.......................................................................................................................................5

METODOLOGIA........................................................................................................................................8

RESULTADOS............................................................................................................................................9

DISCUSIÓN..............................................................................................................................................15

CONCLUSIONES.....................................................................................................................................23

REFERENCIAS.........................................................................................................................................25

INTRODUCCION

EL procedimiento de análisis de varianza, o ANOVA, utiliza una sola variable numérica medida

en los elementos de la muestra para probar la hipótesis nula de igualdad de medias poblaciones.

Esta variable puede ser de intervalo o de escala de razón.

Esta variable algunas veces recibe el nombre de variable dependiente, en especial en programas

de computadora que ejecutan ANOVA.

La hipótesis nula que se prueba en el ANOVA es que la mayoría de las poblaciones que se

estudian (al menos tres) tienen el mismo valor de la media para la variable dependiente. Las

hipótesis nula y alternativa en ANOVA son:

Ho: β1 = β2 … = βk = 0

HA: Al menos un no es cero

En la prueba ANOVA, se reúne evidencia muestral de cada población bajo estudio y se usan

estos datos para calcular un estadístico muestral. Después se consulta la distribución muestral

apropiada para determinar si el estadístico muestral contradice la suposición de que la hipótesis

nula es cierta. Si es así, se rechaza; de lo contrario no se rechaza.

Hemos de recordar que en la prueba de varianza con dos poblaciones se calcula el coeficiente de

las varianzas muestrales y se verifica con arreglo a la distribución F. Este procedimiento también

se usa en ANOVA para probar la hipótesis nula.

Se supone que todas las poblaciones bajo estudio tienen la misma varianza, sin importar si sus

medias son iguales. Es decir, ya sea que las poblaciones tengan medias iguales o distintas, la

variabilidad de los elementos alrededor de su respectiva media es la misma. Si esta suposición es

válida, entonces se puede probar la hipótesis nula de las medias poblacionales iguales usando la

distribución F.

El paso final en ANOVA requiere el cálculo de un cociente con la estimación del método entre en

el numerador y la estimación del método dentro en el denominador.. Si la hipótesis nula de que

las poblaciones tienen la misma media es cierta, esta razón consiste en dos estimaciones

separadas de la misma varianza poblacional y, se puede obtener la distribución F si las medias

poblacionales no son iguales. La estimación en el numerador estará inflada, y el resultado será un

cociente muy grande. Al consultar la distribución F no es probable que un cociente tan grande

haya sido obtenido de esta distribución, y la hipótesis nula será rechazada. La prueba de hipótesis

en ANOVA es de una cola: un estadístico F grande llevará al rechazo de la hipótesis nula y un

valor pequeño hará que no se rechace.

Para los efectos del presente informe se estudiarán 60 observaciones suministradas por la

empresa, a fin de conocer los factores que afectan el volumen de las ventas en cada territorio, se

procederá a estudiar la correlación existente entre las variables independientes, un coeficiente de

intercepción y una variable dependiente. Las variables objeto de estudio son:

X1: Total de ventas acreditadas al vendedor.

X2: Antigüedad del vendedor en la empresa, en meses.

X3: Potencial de mercado, ventas totales en unidades en el territorio de ventas.

X4: Gastos de publicidad en el territorio.

X5: Participación en el mercado, promedio ponderado de los últimos cuatro años.

X6: Cambio de participación en el mercado en los últimos cuatro años.

X7: Número de cuentas asignadas a los vendedores.

X8: Trabajo, índice ponderado basado en compras anuales y concentración de cuentas.

X9: Evaluación general del vendedor sobre ocho aspectos de su desempeño, en una escala del 1

al 7.

X10: Zona, división geográfica del país Además para mejor desarrollo y elaboración del

informe se emplearan diversas herramientas descriptivas, tablas de distribución, tablas de

contingencia y varios gráficos que se aplicará al conjunto de datos.

X11: Territorio, división estratégica de cada Zona.

El estudio de las mismas permitirán lograr determinar los factores de mayor incidencia en las

ventas.

Para efectos de este estudio se requiere la elaboración de tres (3) modelos, previamente

establecidos, a saber:

Modelo 1

X1 = b2 X2 + b3 X3 + b 4 X 4 + b5 X5 + b6 X6 + b7 X7 + b8 X8 + b9 X9 + b10 X10 + b11 X11

Modelo 2

X1 = b2 X2 + b3 X3 + b 4 X 4 + b9 X9 + b10 X10 + b11X11

Modelo 3

X1 = b2 X2 + b7 X7 + b8 X8

Todo esto con la finalidad de:

Inferir sobre los parámetros poblacionales para cada uno de los modelos.

Realizar un análisis de residuos para cada uno de los modelos propuestos.

Determinar cuál de los modelos propuestos explica mejor la variable dependiente.

Para el estudio de los parámetros poblacionales de los modelos se utilizará el método de

Mínimos Cuadrados Ordinarios (MCO).

METODOLOGIA

POBLACION:

Los datos del problema nos suministran claramente la muestra a ser evaluada. En este caso las 60

observaciones suministradas por la empresa

INSTRUMENTOS/MATERIALES:

Se utilizarán tablas de distribución, de contingencia y herramientas estadísticas descriptivas de

los datos para crear grupos, pruebas de hipótesis, etc., utilizando para ello el Programa

Computacional EXCEL de Microsoft Office, bajo sistema operativo Windows XP, versión 2002.

PROCEDIMIENTO:

Se cargó en el programa Excel los datos suministrados por la Universidad para efectos de este

trabajo. Se corrió el mismo y se obtuvieron los índices y coeficientes, así como la tabla ANOVA

para efectuar el análisis de Varianza, los estadísticos "t" para cada una de las variables

independientes y determinar el valor significativo de cada una de ellas, los valores del parámetro

"F" y el valor crítico de "F" el cual nos indica el mínimo de grado de confianza con el que se

aceptarán los modelos a estudiar..

RESULTADOS

De acuerdo a los coeficientes obtenidos con la herramienta Excel indicados en las tablas adjunta,

podemos determinar la ecuación de regresión para cada uno de los modelos.

Modelo 1:

Estadísticas de la regresión

Coeficiente de correlaciónmúltiple

0,62465428

Coeficiente dedeterminación R^2

0,39019297

R^2 ajustado 0,26574256

Error típico 1186,45691

Observaciones 60

ANÁLISIS DE VARIANZAGrados de

libertadSuma de

cuadradosPromedio delos cuadrados

FValor crítico de

FRegresió

n10 44135397,5 4413539,75

3,13532885

0,00361348

Residuos 49 68976320,4 1407680,01

Total 59 113111718

Coeficientes Error típico Estadístico t

Probabilidad

Inferior 95%

Superior 95%

Intercepción -345,996633

1126,1395 -0,30724136

0,7599617 -2609,05864

1917,06538

X2 4,82908813 2,11678432 2,28133215 0,02691228 0,57525085 9,08292541X3 0,01235371 0,01060051 1,16538886 0,24950344 -0,0089488 0,03365623X4 0,08011024 0,07100008 1,128312 0,26468247 -

0,062569750,22279023

X5 21,7932595 66,1048013 0,32967741 0,74304896 -111,04931 154,635829

X6 -12,642434 182,520663 -0,06926577

0,94505998 -379,431431

354,146563

X7 4,09915876 3,73550031 1,097352 0,27785103 -3,40761003

11,6059275

X8 32,6180575 46,1824503 0,70628685 0,4833547 -60,1890494

125,425164

X9 214,490886 158,870894 1,35009554 0,18318899 -104,772123

533,753895

X10 165,905196 138,377183 1,19893462 0,23631945 -112,17416 443,984552X11 -

51,881645932,6930531 -

1,586931810,11896098 -

117,58079513,8175029

Ecuación de la RegresiónX1 = b2 X2 + b3 X3 + b 4 X 4 + b5 X5 + b6 X6 + b7 X7 + b8 X8 + b9 X9 + b10 X10 + b11 X11

Y = -345,99+ 4,82+0,01+0,08+21,79-12,64+4,09+32,61+214,49+165,90-51,88

Observación Pronóstico X1 ResiduosResiduos

estándares1 3157,44949 512,430513 0,47392648

2 3921,25281 -447,302805 -0,41369247

3 2277,11888 17,9811227 0,01663002

4 3899,69598 775,864024 0,7175656

5 4389,09482 1736,86518 1,60635712

6 2850,58459 -715,644593 -0,66187105

7 5572,31507 -540,655066 -0,50003024

8 3706,04271 -338,592708 -0,31315085

9 4767,46685 1751,98315 1,62033913

10 3188,54709 1687,82291 1,56099989

11 2415,87747 52,3925286 0,04845575

12 2882,70566 -349,395661 -0,32314207

13 2302,12183 105,98817 0,09802422

14 2563,77935 -226,399352 -0,2093877

15 4174,40056 412,549441 0,38155047

16 3172,3806 -443,140595 -0,40984301

17 3200,49018 88,9098222 0,08222914

18 2911,31582 -110,535818 -0,10223016

19 3040,69895 223,501053 0,20670718

20 3721,76698 -268,146985 -0,24799842

21 1889,84576 -148,395755 -0,1372453

22 2606,56547 -570,815475 -0,5279244

23 1876,92376 -298,923758 -0,27646263

24 3198,54466 968,895337 0,89609254

25 3322,54258 -522,572585 -0,48330648

26 653,403566 1406,32643 1,30065506

27 3914,1889 -487,7289 -0,45108095

28 3517,48647 -533,046473 -0,49299336

29 2811,35912 -793,759119 -0,73411605

30 3580,8362 377,693803 0,34931389

Observación Pronóstico Residuos Residuos

X1 estándares31 3739,00992 -910,719923 -0,84228842

32 3520,97309 -2361,88309 -2,18441118

33 1954,7735 -214,723502 -0,19858918

34 4659,47107 1004,47893 0,92900238

35 2234,97922 -1008,39922 -0,93262809

36 2179,53049 -841,460494 -0,77823315

37 5167,48367 836,536332 0,77367899

38 3213,55574 145,494262 0,13456182

39 3171,70673 -408,616725 -0,37791326

40 3321,3976 565,022397 0,52256661

41 3459,98577 1617,57423 1,49602969

42 3214,40267 2019,88733 1,86811298

43 3358,69686 142,983142 0,13223939

44 3262,39367 -1006,79367 -0,93114319

45 3072,1342 640,1558 0,59205449

46 2232,41875 -1426,07875 -1,31892318

47 3509,32187 -3087,34187 -2,85535899

48 2709,86788 -148,967876 -0,13777443

49 3758,01616 -796,106155 -0,73628673

50 3449,28447 -583,31447 -0,53948422

51 2130,03472 390,435277 0,36109797

52 1937,76519 1040,05481 0,96190509

53 2078,78381 4015,53619 3,71380878

54 2844,44097 -482,430967 -0,4461811

55 2348,74614 -1254,87614 -1,16058474

56 4256,01963 -885,419628 -0,81888919

57 3169,25616 -681,946155 -0,63070472

58 3065,04787 222,722127 0,20598679

59 3390,89549 -592,205493 -0,54770717

60 3742,63455 726,25545 0,67168461

Modelo 2:

Estadísticas de la regresiónCoeficiente de correlaciónmúltiple 0,60215002Coeficiente dedeterminación R^2 0,36258465R^2 ajustado 0,29042442Error típico 1166,34525Observaciones 60

Análisis de VarianzaGrados de

libertadSuma de

cuadradosPromedio de los cuadrados

FValor crítico de

FRegresió

n6 41012572,5 6835428,75

5,02471593

0,0003841

Residuos 53 72099145,3 1360361,23

Total 59 113111718

Coeficientes Error típico

Estadístico t

Probabilidad

Inferior 95%

Superior 95%

Intercepción

558,031765 799,167198 0,6982666 0,48806302 -1044,8946 2160,95813

X2 5,4255281 1,90075154 2,85441204 0,00614023 1,61310339 9,23795281X3 0,01616705 0,01002822 1,61215605 0,11286767 -0,003947 0,0362811X4 0,10452256 0,06556776 1,59411515 0,11685706 -0,02698971 0,23603483X9 206,51111 142,056668 1,45372346 0,15191921 -78,418476 491,440697X10 208,350436 131,263475 1,58726894 0,11840047 -54,9307465 471,631618X11 -

64,070260430,1505094 -2,1250142 0,0382656 -124,544522 -3,59599839

Ecuación de la RegresiónX1 = b2 X2 + b3 X3 + b 4 X 4 + b9 X9 + b10 X10 + b11X11

Y = 558,03+5,42+0,01+0,10+206,51+208,35-64,07


estándares1 3624,48719 45,3928123 0,04106275

2 4069,15071 -595,200709 -0,53842397

3 2170,26232 124,83768 0,1129293

4 3837,02623 838,533774 0,75854527

5 4290,4835 1835,4765 1,66038872

6 2958,45335 -823,513352 -0,74495766

7 5201,23574 -169,575742 -0,15339976

8 3727,25675 -359,806754 -0,32548446

9 4574,81163 1944,63837 1,75913754

10 3078,87959 1797,49041 1,62602616

11 2427,75497 40,5150289 0,03665026

12 2882,03929 -348,729288 -0,31546368

13 2153,46827 254,641732 0,23035123

14 2508,94853 -171,568533 -0,15520245

15 4383,05636 203,893637 0,18444404

16 3491,6239 -762,383898 -0,6896594

17 3584,2996 -294,899602 -0,26676886

18 3204,60185 -403,821852 -0,36530092

19 3024,39552 239,80448 0,21692931

20 3801,16543 -347,545427 -0,31439275

21 1808,56166 -67,1116595 -0,06070982

22 2428,56338 -392,813375 -0,35534255

23 1792,95557 -214,955571 -0,19445076

24 2777,61606 1389,82394 1,25724737

25 3195,82912 -395,859116 -0,35809775

26 1227,1871 832,542898 0,75312587

27 3877,06948 -450,609484 -0,40762544

28 3098,77516 -114,335161 -0,10342863

29 2888,8349 -871,234898 -0,78812701

30 3508,28647 450,243525 0,40729439

ObservaciónPronóstico

X2Residuos

Residuos estándares

31 3753,35423 -925,064233 -0,83682151

32 3729,01999 -2569,92999 -2,32478203

33 2099,03474 -358,98474 -0,32474086

34 4637,93499 1026,01501 0,9281425

35 2149,19851 -922,618511 -0,83460909

36 2004,03186 -665,961856 -0,60243515

37 4797,59538 1206,42462 1,09134268

38 3716,47097 -357,420971 -0,32332626

39 3254,78433 -491,694327 -0,44479116

40 3472,4875 413,932504 0,37444711

41 3608,44625 1469,11375 1,32897365

42 2981,07327 2253,21673 2,03828034

43 3054,20193 447,47807 0,40479273

44 3382,4765 -1126,8765 -1,01938273

45 3056,48328 655,80672 0,59324872

46 2069,08889 -1262,74889 -1,14229412

47 3373,9536 -2951,9736 -2,67038215

48 2451,56189 109,338113 0,09890825

49 3732,9759 -771,065904 -0,69751323

50 3347,37403 -481,404031 -0,43548246

51 2280,02227 240,447733 0,21751121

52 2534,21119 443,608813 0,40129257

53 1873,4005 4220,9195 3,81828215

54 2418,70585 -56,6958536 -0,05128758

55 2509,20049 -1415,33049 -1,28032083

56 4375,08306 -1004,48306 -0,90866451

57 3093,30645 -605,996454 -0,5481899

58 3111,43555 176,334448 0,15951374

59 3331,25843 -532,568434 -0,48176625

60 3844,57853 624,311473 0,56475783

Modelo 3:

Estadísticas de la regresiónCoeficiente de correlaciónmúltiple 0,5221449Coeficiente dedeterminación R^2 0,2726353R^2 ajustado 0,23366933Error típico 1212,09287Observaciones 60

Análisis de VarianzaGrados de

libertadSuma de

cuadradosPromedio de los

cuadradosF Valor crítico

de FRegresión 3 30838246,7 10279415,6 6,99675441 0,00044403Residuos 56 82273471,2 1469169,13Total 59 113111718

Coeficientes Error típico Estadístico t Probabilidad Inferior 95%Superior

95%Intercepción 658,298 837,232712 0,78627858 0,43501896 -1018,8805 2335,4768X2 4,785 2,01421308 2,37559041 0,02096823 0,74999165 8,81989892X7 8,470 3,46699197 2,44302341 0,01774381 1,52472311 15,415162X8 54,019 40,4606185 1,33508845 0,18724958 -27,0338533 135,070862

Ecuación de la RegresiónX1 = b2 X2 + b7 X7 + b8 X8

Ŷ = 658,30+4,78+8,47+54,02


estándares1 2311,56768 1358,31232 1,15025925

2 3163,43805 310,511948 0,26295075

3 2480,5739 -185,473902 -0,15706481

4 3925,66241 749,897589 0,63503557

5 3913,6573 2212,3027 1,87344369

6 2465,58328 -330,643277 -0,27999856

7 5589,69475 -558,034746 -0,47256041

8 3859,56761 -492,117607 -0,41673982

9 3931,56674 2587,88326 2,19149648

10 3332,79803 1543,57197 1,30714263

11 2800,7827 -332,512704 -0,28158164

12 2760,03908 -226,729084 -0,19200093

13 2527,15112 -119,041117 -0,10080756

14 2522,0102 -184,630196 -0,15635034

15 2911,10575 1675,84425 1,41915473

16 2990,90067 -261,660667 -0,22158203

17 2793,30516 496,09484 0,42010786

18 2392,84138 407,938623 0,34545455

19 3010,04213 254,157871 0,21522844

20 3589,88899 -136,268989 -0,11539663

21 2483,13579 -741,685787 -0,62808157

22 2762,12782 -726,377815 -0,61511833

23 2503,70987 -925,709871 -0,78391864

24 3433,33365 734,106354 0,62166308

25 2858,36007 -58,3900739 -0,04944645

26 1230,9575 828,772504 0,70182919

27 3640,77266 -214,312659 -0,18148633

28 3835,72113 -851,281129 -0,72089017

29 3010,35952 -992,759516 -0,84069827

30 3480,45705 478,072954 0,40484639

ObservaciónPronóstico

X3Residuos

Residuos estándares

31 3295,32004 -467,030045 -0,39549493

32 2674,01334 -1514,92334 -1,28288212

33 2162,20486 -422,154864 -0,35749329

34 3532,37254 2131,57746 1,80508316

35 2381,10484 -1154,52484 -0,97768596

36 3065,06557 -1726,99557 -1,46247119

37 4817,24129 1186,77871 1,00499949

38 3080,09321 278,956788 0,2362289

39 2701,13094 61,9590599 0,05246877

40 3238,55325 647,866752 0,54863283

41 3835,55058 1242,00942 1,0517705

42 3609,66296 1624,62704 1,37578247

43 3663,3466 -161,666603 -0,13690409

44 3436,72881 -1181,12881 -1,00021499

45 3580,63898 131,651021 0,111486

46 2792,80313 -1986,46313 -1,68219603

47 4078,12835 -3656,14835 -3,09613511

48 3222,74671 -661,846715 -0,56047147

49 3932,8843 -970,974296 -0,8222499

50 2761,71519 104,254806 0,08828607

51 2583,61649 -63,1464885 -0,05347432

52 1802,8491 1174,9709 0,99500029

53 2665,41365 3428,90635 2,90369983

54 3696,57815 -1334,56815 -1,13015199

55 2399,7363 -1305,8663 -1,1058464

56 4222,19634 -851,596337 -0,72115709

57 3388,40262 -901,092618 -0,76307202

58 3190,43265 97,3373487 0,08242816

59 3273,86941 -475,179411 -0,40239605

60 4044,31783 424,572173 0,35954034

DISCUSIÓN

El análisis de varianza, como técnica de lo que trata es: si se está estudiando la característica

cuyos valores dependen de varias clases de efectos que operan simultáneamente, poder decidir si

tales efectos son debido al azar o si realmente son diferentes. Para la aplicación de ANOVA son

esenciales tres (3) suposiciones:

1. Todas las poblaciones involucradas son normales.

2. Todas las poblaciones tienen la misma varianza.

3. Las muestras se seleccionan independientemente.

El análisis de varianza o ANOVA, es un procedimiento que prueba si algunas de las variables

independientes tienen relación con la variable dependiente, si alguna variable independiente no

está relacionada con la variable Y, su coeficiente debería ser cero. Es decir, Si X1 no está

relacionada con Y, entonces βi = 0. Al mismo tiempo prueba la hipótesis nula de que todos los

valores β son cero contra la alternativa de que por los menos un β no es cero. Si no se rechaza la

hipótesis nula, entonces no hay relación lineal entre Y i cualquiera de las variables

independientes. Por otra parte, si la hipótesis nula se rechaza, entonces por los menos una

variable independiente está relacionada linealmente con Y.

Continuado con el ANOVA, estructuramos la hipótesis y la evaluamos

HO: β2 = β3 = β4 = β5 = β6 = β7 = β8 = β9 = β10 = β11 =0

HA : Al menos un β no es cero

Siguiendo la metodología implementada, procedemos a describir los hallazgos encontrados según

los modelos en estudio:

Modelo 1

Los coeficientes que acompañan a cada variable independiente en la Ecuación de Regresión

obtenida nos indican el grado de relación que éstas tienen con respecto a la variable dependiente,

para este primer modelo:

Y = b2 X2 + b3 X3 + b 4 X 4 + b5 X5 + b6 X6 + b7 X7 + b8 X8 + b9 X9 + b10 X10 + b11 X11

El resultado obtenido es:

Y = -345,99+ 4,82+0,01+0,08+21,79-12,64+4,09+32,61+214,49+165,90-51,88

Estos resultados muestran que si varia la Antigüedad del vendedor en la empresa en una unidad,

manteniéndose fijos los valores de las otras variables, la variable dependiente Total de Ventas

acreditadas al vendedor variará en 4,83; igual criterio se aplicaría a las demás variables.

El error típico o error estándar de estimación mide los grados de dispersión de los valores Yi

alrededor del plano de regresión, entre menos dispersión se presente, más pequeño será el Se

(error estándar), y más preciso será el modelo en su predicción y pronostico, los resultados

obtenidos para el Modelo 1 muestran un resultado de 1186,456914.

El coeficiente de determinación múltiple mide la fuerza de la relación entre Y y las variables

independientes, entre mayor sea R2 mayor poder explicativo tendrá el modelo, para el Modelo 1

este coeficiente según los resultados es de 0.62465428; la relación es de 62.47%.

El coeficiente de determinación ajustado o corregido procura contrarrestar la incorporación de

alguna variable absurda sin un poder realmente explicativo al modelo, es una corrección de

honestidad, R2 nos castigará si introducimos variables innecesarias en nuestro modelo, los

resultados de Modelo 1 en estudio nos muestran un coeficiente de determinación ajustado de

0,265742559.

Para el Modelo 1, el valor de F es de 3,13532885 y los grados de libertad son 10 y 49, probamos

nuestra hipótesis con un nivel de significancia del 5%, con la ayuda de la tabla G se determina

que F0.05,10,49 es 1,92. La regla de decisión es “no rechazar si F < 1.92; rechazar si F>1,92, debido

a que el valor de F = 3,13532885 > 1.92, la hipótesis se rechaza, existe por los menos con un α =

0,05 una relación lineal entre Y y por lo menos una de las variables independientes.

A un nivel de significancia del 5%, con grados de libertad g.l. = n-k-1 = 60-10-1 = 49, el valor

t0.05,49 es de 2.0116 (con la ayuda de la Tabla F, hallamos el valor para 40 y 60 g.l, e

interpolamos); la regla de decisión es “no rechazar si t ± 2.0116; de lo contrario rechazar”.

X2 como 2,28133215 > 2.0116 Se rechaza la hipótesis nulaX3 como 1,16538886 Está entre ± 2.0116 No se rechaza la hipótesis nulaX4 como 1,128312 Está entre ± 2.0116 No se rechaza la hipótesis nulaX5 como 0,32967741 Está entre ± 2.0116 No se rechaza la hipótesis nulaX6 como -0,06926577 Está entre ± 2.0116 No se rechaza la hipótesis nulaX7 como 1,097352 Está entre ± 2.0116 No se rechaza la hipótesis nulaX8 como 0,70628685 Está entre ± 2.0116 No se rechaza la hipótesis nulaX9 como 1,35009554 Está entre ± 2.0116 No se rechaza la hipótesis nulaX10 como 1,19893462 Está entre ± 2.0116 No se rechaza la hipótesis nulaX11 como -1,58693181 Está entre ± 2.0116 No se rechaza la hipótesis nula

Se extrae que con un nivel del 95% de confianza que la variable 2, contribuyen

significativamente a la explicación del modelo, debido a que este caso la hipótesis se rechaza; por

otra parte, podemos estar seguros en un 95% que las demás variables contribuyen

significativamente con la explicación del modelo, pues en estos casos la hipótesis no es

rechazada.

La gráfica para este modelo:

Modelo 2

Los coeficientes que acompañan a cada variable independiente en la Ecuación de Regresión

obtenida nos indican el grado de relación que éstas tienen con respecto a la variable dependiente,

para este primer modelo:

X1 = b2 X2 + b3 X3 + b 4 X 4 + b9 X9 + b10 X10 + b11X11

El resultado obtenido es:

Y = 558,03+5,42+0,01+0,10+206,51+208,35-64,07

El grado de relación que existe entre las variables, podemos decir que si aumentamos en una

unidad la variable Antigüedad del vendedor en la empresa (X2), dejando fijos el valor de las otras

variables independientes, la variable dependiente X1 variará 5.4255281; el mismo razonamiento

se puede aplicar a las otras variables independientes, de acuerdo a los resultados mostrados en la

Tabla.

Al evaluar el Modelo 2 propuesto, con la finalidad de determinar su grado de significancia y su

aporte explicativo. Cuando detallamos los resultados arrojados por el Modelo 1, definimos cada

una de las herramientas estadísticas de la cuales nos valemos para evaluar un modelo o ecuación

de regresión múltiple. Sería redundante volver a explicar lo mismo, motivo por el cual nos

limitaremos a describir cada uno de los resultados arrojados y sus correspondientes estimaciones

más importantes.

El error típico o error estándar de estimación muestra un resultado de 1166,34525, una leve

diferencia con el Modelo 1, mostrando éste ultimo una menor dispersión, esto no puede ser

concluyente pues esto tan solo muestra el grado de dispersión que tienen o presentan los datos.

El coeficiente de determinación múltiple es de 0,60215002; podemos inferir que las variables

independientes están relacionadas en un 60.02% con la variable Y, al ser el resultado positivo, la

relación es directa, los valores de la variable dependiente aumentarán o disminuirán de acuerdo a

los aumentos o disminuciones de las variables independientes.

El coeficiente de determinación corregido es de 0.29042442; lo cual indica que las variaciones de

la variable dependiente X1 pueden ser explicadas en un 29,04% por el comportamiento de las

variables independientes.

El Modelo 2, muestra un valor de F de 5.0271593 y grado de libertad de 6 y 53, vamos utilizar un

nivel de significancia del 5%, con la ayuda de la Tabla G buscamos el valor t0.05,6,53 el cual es

2,25; la regla de decisión es “no rechazar si F > 2,25; rechazar si F > 2,25”; Como F = 5.0271593

> 2,25; la hipótesis se rechaza, podemos decir con un α = 0,05 que existe por lo menos una

relación lineal de Y por los menos con una de las variables independientes.

Al aplicar nivel de significancia del 5%, con grados de libertad g.l. = n-k-1 = 100-3-1 = 96, con la

ayuda de las tablas buscamos el valor de t0.05, 96 el cual es 2,0074; la regla de decisión es “no

rechazar si t ± 2,0074 (con la ayuda de la Tabla F, hallamos el valor para 60 y 120 g.l, e

interpolamos); de lo contrario rechazar”.

X2 como 2,85441204 > 2.0074 Se rechaza la hipótesis nulaX3 como 1,61215605 Está entre ± 2.0074 No se rechaza la hipótesis nulaX4 como 1,59411515 Está entre ± 2.0074 No se rechaza la hipótesis nulaX9 como 1,45372346 Está entre ± 2.0074 No se rechaza la hipótesis nulaX10 como 1,58726894 Está entre ± 2.0074 No se rechaza la hipótesis nulaX11 como -2,1250142 Está entre ± 2.0074 No se rechaza la hipótesis nula

Con un grado de confianza del 95% que sólo la variable X2, contribuye significativamente en la

explicación del modelo, al ser rechazada, mientras que las variables independientes de este

modelo (X3, X4, X9, X10 Y X11), no contribuyen significativamente a la explicación del modelo

al ser aceptada su hipótesis. Las gráficas de los residuales para este modelo:

Modelo 3

X1 = b2 X2 + b7 X7 + b8 X8

Los resultados obtenidos de la regresión de esta ecuación o modelo de regresión múltiple,

presentan los siguientes coeficientes:

Ŷ = 658,30+4,78+8,47+54,02

La ecuación de regresión múltiple muestra la relación que existe entre las variables

independientes y la variable dependiente, de cómo el comportamiento o variación de las primeras

afectan a la segunda, los resultados nos dicen que si la variable Antigüedad del vendedor en la

empresa (X2) aumenta en una unidad, manteniendo fijo el valor de las otras variables

independientes, la variable dependiente Evaluación del Vendedor (X9) modificará su valor en

4.78494529.

El error típico o error estándar de estimación es de 1212.09287; si verificamos los resultados

podemos afirmar que la dispersión de datos más alta la posee el Modelo 3, esto no debe tomarse

como concluyente por cuanto debemos seguir evaluando la ecuación.

El coeficiente de determinación es de 0,2726353; se puede decir que un 27,27% el grado de

relación que existe entre las variables independientes con la variable dependiente Ŷ.

El coeficiente de determinación ajustado o corregido es de 0,23366933; el grado de relación de

las variables independientes X2, X7 y X8 según este coeficiente es de 23,37%, prevé la posible

inclusión por accidente, error u omisión de una variable absurda.

En el Modelo 3, el valor de F es 6.99675441; con grados de libertad de 3 y 56, probamos la

hipótesis con un grado de significancia del 5%, con la ayuda de la Tabla G hallamos del valor

para F0,05;3;56 y nos da 2,61; la regla de decisión es “no rechazar si F > 2,61; rechazar si F > 2,61;

Como F = 6.99675441 > 2,61 la hipótesis se rechaza, podemos inferir con un grado de seguridad

del 95% que existe por lo menos una relación entre el comportamiento de la variable dependiente

X1 y alguna de la variables independientes.

Con un grado de significancia del 5%, con grados de liberta g.l. = n-k-1 = 60-3-1 = 56, con la

ayuda de la Tabla T, para la distribución t buscamos el valor para t 0,05;56 el cual es 2.0042;

construimos la regla de decisión “no rechazar si t ± 2.0042; de lo contrario rechazar la hipótesis”

X2 como 2,37559041 > 2.0074 Se rechaza la hipotesisX7 8,470 2,44302341 > 2.0074 Se rechaza la hipotesisX8 54,019 1,33508845 < 2.0074 No se rechaza la hipotesis

Podemos inferir, por los resultados obtenidos, con un 95% de seguridad que las variables X2 y

X7, contribuyen significativamente a la explicación del modelo, pues para estas variables la

hipótesis nula se rechaza, mientras que la variable independiente X8 no contribuyen con la

explicación del modelo, pues las hipótesis no fueron rechazadas.

Las graficas de los residuales del tercer modelo en estudio son:

CONCLUSIONES

De menor a mayor los modelos objeto de estudio de acuerdo al grado de dispersión de los

datos, el cual es medido a través del error típico o error estándar de estimación:

Modelo 1 1186,46

Modelo 2 1166.35

Modelo 3 1212.09

Se evidencia que el Modelo 2 es el presenta menor grado de dispersión de los datos

La relación que existe entre las variables independientes y la variable dependiente,

medidas a través del coeficiente de determinación múltiple, mostramos los hallazgos

realizados, según el modelo:

Modelo 1 0.39019297 ó 39.02%

Modelo 2 0.36258465 ó 36.26%

Modelo 3 0.2726353 ó 27.26%

Se muestra que el Modelo 1 es el que presenta mayor grado de relación entre las variables

independientes y la variable dependiente.

El coeficiente de determinación corregido o ajustado, que prevé la posible la introducción

de una variable absurda, se presenta en el siguiente orden según el modelo:

Modelo 1 0.26574257 ó 26.57%

Modelo 2 0.29042442 ó 29.04%

Modelo 3 0.23366933 ó 23.37%

Se demuestra que el Modelo 2 es el más propenso a la introducción de una variable

absurda

El análisis de varianza o ANOVA demostró que de los Modelos 1, 2 y 3, por lo menos una de sus

variables independientes tienen relación con la variable dependiente, el mayor valor F lo tiene el

Modelo 3 con 6.99675441; seguido del Modelo 2 con 5.02471593; y por último el Modelo 1 con

3.13532885.

Se concluye que el Modelo 1 explica con mayor fuerza la relación entre las variables

independientes y la variable dependiente, ya que presenta una mayor significancia en predecir el

comportamiento de la variable dependiente.

REFERENCIAS

Webster A. (2003) Estadística aplicada a los negocios y a la economía. 3ª Edición, Colombia:

Irwin Editorial McGraw Hill

Prof. Gilberto Noguera (2007) Elementos de Excel para la Estadística – Guía de Excel

Venezuela: Universidad Nacional Abierta