13
ASIGNACIÓN REGRESIÓN Y CORRELACIÓN 1. Calcule las medidas de Tendencia Central de los siguientes datos: 3, 5, 6, 8, 8, 8, 9, 9, 10, 11 Sol.- Media (Ma): Llamado también “Promedio Aritmético” ó “Media Aritmética” Ma = 7.70 Mediana (Me): El valor mediano o mediana de un conjunto de valores es aquel que tiene la propiedad de dividir al conjunto en 2 partes igualmente numerosas. Si el número de elementos fuese impar se tomará el valor central como la mediana; pero si el número de elementos fuese par hay dos elementos en el centro y como mediana se tomará el promedio de ellos. En nuestro caso para el problema el Número de elementos (n) es 10, entonces se toma los dos números centrales y se promedia. Me = 8.00

Asignacion_Regresion_Correlacion

Embed Size (px)

DESCRIPTION

Estadisticas

Citation preview

ASIGNACIN REGRESIN Y CORRELACIN

ASIGNACIN REGRESIN Y CORRELACIN

1. Calcule las medidas de Tendencia Central de los siguientes datos:

3, 5, 6, 8, 8, 8, 9, 9, 10, 11

Sol.-

Media (Ma): Llamado tambin Promedio Aritmtico Media Aritmtica

Ma = 7.70 Mediana (Me): El valor mediano o mediana de un conjunto de valores es aquel que tiene la propiedad de dividir al conjunto en 2 partes igualmente numerosas. Si el nmero de elementos fuese impar se tomar el valor central como la mediana; pero si el nmero de elementos fuese par hay dos elementos en el centro y como mediana se tomar el promedio de ellos.

En nuestro caso para el problema el Nmero de elementos (n) es 10, entonces se toma los dos nmeros centrales y se promedia.

Me = 8.00 Moda (Mo): Es el valor que se presenta con mayor frecuencia en un grupo de datos, a una distribucin que tiene una sola moda se le denomina unimodal. Si hubiese ms de dos valores no adyacentes con frecuencias mximas similares la distribucin es multimodal; bimodal, trimodal, etc. En el caso que no exista ningn valor que se repita se dice que no existe moda, el sistema ser amodal.

En nuestro caso para el problema el valor que ms se repite es:

Mo = 8.00

2. Calcule las medidas de Dispersin de los datos anteriores:

3, 5, 6, 8, 8, 8, 9, 9, 10, 11

Sol.-

Rango: Es la diferencia entre el mayor y el menor valor de un conjunto de datos.

Rango = 8.00

Desviacin Media: Se conoce tambin como promedio de desviacin, para una serie de N valores: ...., puede calcularse a travs de la siguiente expresin:

Desviacin media =

Donde:

:

media aritmtica

:valor absoluto de las desviaciones de los Xj valores,

respecto de la media.

Sabemos: = Ma = 7.70

1.82

D.M. = 1.82

Varianza: Dado un conjunto de nmeros se define como varianza al cuadro de la desviacin tpica.

Sabemos: = Ma = 7.70

EMBED Equation.3 S2 = 5.21

Desviacin Estndar: La desviacin estndar se representa con S y se define como.

Como tenemos el valor de S2 solo procederemos a sacar raz cuadrada a la varianza.

2.283

S = 2.28

Coeficiente de Variacin: A la dispersin relativa se le conoce con el nombre de coeficiente de variacin que se expresa como un porcentaje.

Sabemos: = Ma = 7.70

S = 2.28

V = 29.61

3. Los valores reducidos de lpidos en las heces se relacionan con valores reducidos de energa. Calcule el coeficiente de correlacin del siguiente grupo de datos e interprete su valor.

SujetoLpidos fecales

(gramos/da)Energa fecal

(MJ/da)

110.02.1

211.01.1

39.91.1

49.80.9

515.50.7

65.00.4

710.71.0

813.01.5

913.81.2

1016.71.4

113.21.0

124.00.5

136.00.9

148.90.8

159.10.6

164.10.5

1717.01.2

1822.21.1

192.90.9

205.01.0

Sol.-

Definicin:

En el contexto del anlisis de la regresin lineal simple el coeficiente de correlacin establece una medida del grado de asociacin lineal entre la variable respuesta y la variable predictora, concretamente entre la variable respuesta y la recta de regresin estimada. Se define, a partir de los n pares de observaciones, mediante:

A continuacin podremos observar un cuadro del cual obtendremos las sumatorias pedidas para desarrollar el clculo del coeficiente de relacin.

LpidosEnerga

XiYiXi - xYi - y(Xi - x)(Yi - y)(Xi - x)(Yi - y)

10.02.10.11.10.1220.0121.221

11.01.11.10.10.1171.2320.011

9.91.10.00.10.0010.0000.011

9.80.9-0.1-0.10.0090.0080.009

15.50.75.6-0.3-1.65531.4720.087

5.00.4-4.9-0.62.91023.9120.354

10.71.00.80.00.0040.6560.000

13.01.53.10.51.5719.6720.255

13.81.23.90.20.80215.2880.042

16.71.46.80.42.75846.3760.164

3.21.0-6.70.0-0.03344.7560.000

4.00.5-5.9-0.52.91634.6920.245

6.00.9-3.9-0.10.37015.1320.009

8.90.8-1.0-0.20.1930.9800.038

9.10.6-0.8-0.40.3120.6240.156

4.10.5-5.8-0.52.86633.5240.245

17.01.27.10.21.45850.5520.042

22.21.112.30.11.293151.5360.011

2.90.9-7.0-0.10.66448.8600.009

5.01.0-4.90.0-0.02423.9120.000

9.91.016.649533.1982.910

Total

Luego ingresamos estos valores en la formula de correlacin:

Coeficiente Correlacin = 0.423

Interpretacin del r:

Valor de r de 0 a 0.25 implica que no existe correlacin entre ambas variables.

Valor de r de 0.25 a 0.50 implica una correlacin baja a moderada.

Valor de r de 0.50 a 0.75 implica correlacin moderada a buena.

Valor de r de 0.75 o mayor, implica una muy buena a excelente correlacin.

Estos rangos de valores se pueden extrapolar a correlaciones negativas tambin.

Por lo tanto podemos decir que para nuestro caso el Coeficiente de Correlacin, r = 0.42, implica una correlacin baja (a moderada).

4. Se desea predecir si el puntaje logrado con el examen preliminar (A) puede predecir el puntaje logrado con un examen final (B). Represente el grfico de Dispersin respectivo.

SujetoExamen Preliminar (A)Examen Final (B)

1288

2257

3247

4289

52510

6258

7249

8215

9259

10299

112710

12186

132410

142910

15278

16216

17276

18173

19288

20206

Sol.-

Si utilizamos un sistema de coordenadas cartesianas para representar la distribucin bidimensional, obtendremos un conjunto de puntos conocido con el diagrama de dispersin, cuyo anlisis permite estudiar cualitativamente, la relacin entre ambas variables tal como se ve en el Grfico 1. El siguiente paso, es la determinacin de la dependencia funcional entre las dos variables x e y que mejor ajusta a la distribucin bidimensional.

El grfico de Dispersin lo hallaremos mediante el ingreso de los datos a una hoja de Excel, de donde exportaremos para poder visualizar los datos en el Grfico Examen A vs. Examen B.

Grfico 1.

5. Determine el modelo de regresin lineal simple.

Sol.-

Se denomina regresin lineal cuando la funcin es lineal, es decir, requiere la determinacin de dos parmetros: la pendiente y la ordenada en el origen de la recta de regresin, y=ax+b. La regresin nos permite adems, determinar el grado de dependencia de las series de valores X e Y, prediciendo el valor y estimado que se obtendra para un valor x que no est en la distribucin.

Vamos a determinar la ecuacin de la recta que mejor ajusta a los datos representados en el Grfico 1. En concreto queremos expresar mediante una relacin cmo depende una de ellas (variable dependiente) de la otra (variable independiente). Normalmente se elige como y la variable dependiente y como x la independiente

Luego procesando los datos podemos obtener las sumatorias respectivas para el clculo de a y b, con n = 20.

Exam. AExam. B

XiYiXi * YiXi

288224784

257175625

247168576

289252784

2510250625

258200625

249216576

215105441

259225625

299261841

2710270729

186108324

2410240576

2910290841

278216729

216126441

276162729

17351289

288224784

206120400

492154388312344

Por lo tanto el modelo de Regresin Lineal es:

6. Como interpreta el coeficiente alfa (a)

Sol.-

El Coeficiente Alfa (a) indica la pendiente de la Recta de Regresin Lineal, la cual se define como la divisin entre el Examen Final (B) y el Examen Preliminar (A); esta pendiente es baja y positiva.

7. Como interpreta el coeficiente beta (b)

Sol.-

El Coeficiente Beta (b) indica el valor de la ordenada en el origen, es decir cuando x (Examen Preliminar A) es cero (0).

8. Cual sera el puntaje probable de un alumno en el examen final (B) si en el examen de tipo (A) obtuvo 25.

Sol.-

Como la frmula de regresin lineal es: y sabiendo que y (Examen A) es la variable dependiente de x (Examen B) procedemos a reemplazar el valor de 25 en x para hallar el Examen Final (B):

7.8582

_1179895542.unknown

_1179898003.unknown

_1179920897.unknown

_1179921014.unknown

_1179921212.unknown

_1179921464.unknown

_1179922785.unknown

_1179922871.unknown

_1179921338.unknown

_1179921067.unknown

_1179920928.unknown

_1179920975.unknown

_1179920907.unknown

_1179909846.unknown

_1179912028.unknown

_1179920855.unknown

_1179911447.unknown

_1179898124.unknown

_1179896955.unknown

_1179897723.unknown

_1179897843.unknown

_1179897639.unknown

_1179896558.unknown

_1179896779.unknown

_1179896042.unknown

_1179895073.unknown

_1179895450.unknown

_1179894936.unknown

_1179894992.unknown

_1179895003.unknown

_1179894979.unknown

_1179893976.unknown

_1179894800.unknown

_1179893634.unknown