32
Variables estadísticas Variables estadísticas bidimensionales bidimensionales Se trata de variables que surgen Se trata de variables que surgen cuando se estudian dos cuando se estudian dos características asociadas a la características asociadas a la observación de un fenómeno. observación de un fenómeno.

Variables estadísticas bidimensionales

  • Upload
    coen

  • View
    59

  • Download
    0

Embed Size (px)

DESCRIPTION

Variables estadísticas bidimensionales. Se trata de variables que surgen cuando se estudian dos características asociadas a la observación de un fenómeno. Variables estadísticas bidimensionales. - PowerPoint PPT Presentation

Citation preview

Page 1: Variables estadísticas bidimensionales

Variables estadísticas Variables estadísticas bidimensionales bidimensionales

Se trata de variables que surgen cuando Se trata de variables que surgen cuando se estudian dos características asociadas se estudian dos características asociadas a la observación de un fenómeno.a la observación de un fenómeno.

Page 2: Variables estadísticas bidimensionales

Variables estadísticas Variables estadísticas bidimensionales bidimensionales

Ejemplo 1.- Estudiamos la talla, medida en cm. y el peso, medido en Ejemplo 1.- Estudiamos la talla, medida en cm. y el peso, medido en kg. de un grupo de 10 personas, podemos obtener los siguientes kg. de un grupo de 10 personas, podemos obtener los siguientes

valoresvalores

TallaTalla

(cms)(cms)160160 165165 168168 170170 171171 175175 175175 180180 180180 182182

Peso Peso

(kgs)(kgs)5555 5858 5858 6161 6767 6262 6666 7474 7979 8383

Page 3: Variables estadísticas bidimensionales

Podemos llamar X a la talla e Y al peso con lo que se Podemos llamar X a la talla e Y al peso con lo que se obtendría la obtendría la variable bidimensional (X, Y) que que toma 10 valores: toma 10 valores:

(160,55), (165,58),…, etc.(160,55), (165,58),…, etc.

83797466626761585855Peso

(kgs)

182180180175175171170168165160Talla

(cms)

83797466626761585855Peso

(kgs)

182180180175175171170168165160Talla

(cms)

Variables estadísticas Variables estadísticas bidimensionalesbidimensionales

Page 4: Variables estadísticas bidimensionales

Variables estadísticas Variables estadísticas bidimensionalesbidimensionales En algunos casos el número de "parejas" de valores (x,y) es En algunos casos el número de "parejas" de valores (x,y) es

grande y además muchos de ellos aparecen repetidos; en este grande y además muchos de ellos aparecen repetidos; en este caso se utiliza una caso se utiliza una ""Tabla de doble entradaTabla de doble entrada""

En la primera fila se colocan los valores de una de las En la primera fila se colocan los valores de una de las características o variable que componen la variable características o variable que componen la variable

bidimensional y en la primera columna los de la otrabidimensional y en la primera columna los de la otra..

(x(xii)) (y(yii))

X11 Y11

X22 Y22

. .

. .

. .

Xnn Ynn

Page 5: Variables estadísticas bidimensionales

Variables estadísticas Variables estadísticas bidimensionales bidimensionales

Ejemplo 1.Ejemplo 1.

Estudiamos la talla, medida en Estudiamos la talla, medida en cm. y el peso, medido en kg. cm. y el peso, medido en kg. de un grupo de 10 personas. de un grupo de 10 personas.

Talla (x)Talla (x) Peso (y)Peso (y)160 55

165 58

168 58

170 61

171 67

175 62

175 66

180 74

180 79

182 83

Total 1726Total 1726 663663

Page 6: Variables estadísticas bidimensionales

Variables estadísticas Variables estadísticas bidimensionales bidimensionales

Ejemplo 2.El esfuerzo cortante del suelo en un cierto estrato arcilloso, parece estar relacionado con la profundidad.En una región se toman 10 muestras de suelo a diferentes profundidades y se mide a cada una el esfuerzo cortante, en miles de libras por pie cuadrado [Klb/pie2].

OBSERVACION (i)

Profundidad x (pies)

Esfuerzo cortante y (Klb/pie2)

1 6 0,282 8 0,583 14 0,504 14 0,835 18 0,716 20 1,017 20 1,298 24 1,509 28 1,29

10 30 1,58

Page 7: Variables estadísticas bidimensionales

Variables estadísticas Variables estadísticas bidimensionales bidimensionales

Ejemplo 3.Ejemplo 3.Con el fin de determinar la Con el fin de determinar la relación existente entre la relación existente entre la resistenciaresistencia de una de una determinada pieza de determinada pieza de plástico y plástico y uno de sus uno de sus componentescomponentes (componente (componente A) se fabrican 10 piezas de A) se fabrican 10 piezas de prueba, cada una con una prueba, cada una con una concentración distinta y se concentración distinta y se obtienen los siguientes obtienen los siguientes resultados:resultados:

Pieza X (% A)

Y (Rotura)

1 1,5 3,04

2 1,2 2,96

3 1,1 2,66

4 1 3,17

5 4,5 9,82

6 5,2 9,68

7 8,7 17,71

8 9 18,18

9 9,2 18,32

10 9,5 19,3

Total 50,9 104,84

Page 8: Variables estadísticas bidimensionales

Variables estadísticas Variables estadísticas bidimensionales bidimensionales

Ejemplo 4.Ejemplo 4.El tiempo de respuesta (en El tiempo de respuesta (en nanosegundos) de un nanosegundos) de un circuito lógico en frió (X) y circuito lógico en frió (X) y tras una hora de uso tras una hora de uso intensivo (Y), para un intensivo (Y), para un conjunto de 8 maquinas conjunto de 8 maquinas

Maquina X Y

1 6 4

2 5 8

3 8 11

4 16 9

5 7 10

6 4 6

7 5 9

8 9 6

Total 60 63

Page 9: Variables estadísticas bidimensionales

Variables estadísticas Variables estadísticas bidimensionales bidimensionales

Ejemplo 5.Ejemplo 5.

El número de libras de vapor utilizadas por mes por una planta química, está relacionado con la temperatura ambiente promedio (en grados Farenheit) de ese mes. En la tabla siguiente se muestra el uso del vapor de un año y la temperatura del mes correspondiente.

 Consumo de Vapor por Mes

 

MesTemperatura

Uso/1000

Enero 21 185.79

Febrero 24 214.47

Marzo 32 288.03

Abril 47 424.84

Mayo 50 454.58

Junio 59 539.03

Julio 68 21.55

Agosto 74 675.06

Septiembre 62 562.03

Octubre 50 452.93

Noviembre 41 369.96

Diciembre 30 273.98

Page 10: Variables estadísticas bidimensionales

Representación Representación gráficagráfica

Diagramas de dispersión o Diagramas de dispersión o nubes de puntos nubes de puntos

Page 11: Variables estadísticas bidimensionales

Diagramas de dispersión o Diagramas de dispersión o nubes de puntos nubes de puntos

La representación gráfica de este tipo de La representación gráfica de este tipo de variables es en realidad semejante a la variables es en realidad semejante a la representación de puntos en el plano, representación de puntos en el plano, usando unos ejes de coordenadas. Cada usando unos ejes de coordenadas. Cada pareja de valores da lugar a un punto en el pareja de valores da lugar a un punto en el plano y el conjunto de puntos que se plano y el conjunto de puntos que se obtiene se denomina obtiene se denomina ""diagrama de diagrama de dispersión o nube de puntosdispersión o nube de puntos".".

Page 12: Variables estadísticas bidimensionales

Diagramas de dispersión o Diagramas de dispersión o nubes de puntos nubes de puntos

En el En el ejemplo 1ejemplo 1 en el que se estudia la talla y el peso de en el que se estudia la talla y el peso de 10 personas se obtendría el siguiente diagrama de 10 personas se obtendría el siguiente diagrama de dispersión: (En el eje X se representa la talla en cm. y en dispersión: (En el eje X se representa la talla en cm. y en el eje Y el peso en kg.) el eje Y el peso en kg.)

0102030405060708090

155 160 165 170 175 180 185

Peso

(kg)

Talla (cms)

Peso por tallaTalla (x)Talla (x) Peso (y)Peso (y)

160 55

165 58

168 58

170 61

171 67

175 62

175 66

180 74

180 79

182 83

Total 1726Total 1726 663663

Page 13: Variables estadísticas bidimensionales

Diagramas de dispersión o Diagramas de dispersión o nubes de puntos nubes de puntos

Ejemplo 2. El esfuerzo cortante del suelo en un cierto estrato arcilloso, parece estar relacionado con la profundidad.

En una región se toman 10 muestras de suelo a diferentes profundidades y se mide a cada una el esfuerzo cortante, en miles de libras por pie cuadrado [Klb/pie2].

OBSERVACION (i)

Profundidad x (pies)

Esfuerzo cortante y (Klb/pie2)

1 6 0,28

2 8 0,58

3 14 0,50

4 14 0,83

5 18 0,71

6 20 1,01

7 20 1,29

8 24 1,50

9 28 1,29

10 30 1,58

Page 14: Variables estadísticas bidimensionales

Diagramas de dispersión o Diagramas de dispersión o nubes de puntos nubes de puntos

En el ejemplo 3 en el que se estudia la relación existente la relación existente entre la entre la resistenciaresistencia (Y) de una determinada pieza de plástico (Y) de una determinada pieza de plástico y y uno de sus componentesuno de sus componentes (componente A) se fabrican 10 (componente A) se fabrican 10 piezas de prueba, cada una con una concentración distinta piezas de prueba, cada una con una concentración distinta

Pieza X (% A)

Y (Rotura)

1 1,5 3,04

2 1,2 2,96

3 1,1 2,66

4 1 3,17

5 4,5 9,82

6 5,2 9,68

7 8,7 17,71

8 9 18,18

9 9,2 18,32

10 9,5 19,3

Resistencia por componentes

0

5

10

15

20

25

0 1 2 3 4 5 6 7 8 9 10

Concentracion del componente

Res

iste

ncia

Page 15: Variables estadísticas bidimensionales

Diagramas de dispersión o Diagramas de dispersión o nubes de puntos nubes de puntos En el ejemplo 4 en el que se estudia El tiempo de respuesta (en El tiempo de respuesta (en nanosegundos) de un circuito lógico en frió (X) y tras una nanosegundos) de un circuito lógico en frió (X) y tras una hora de uso intensivo (Y), para un conjunto de 8 maquinas hora de uso intensivo (Y), para un conjunto de 8 maquinas

Maq. X Y

1 6 4

2 5 8

3 8 11

4 16 9

5 7 10

6 4 6

7 5 9

8 9 6

Tiempo de respuesta por uso de un circuito

0

2

4

6

8

10

12

0 2 4 6 8 10 12 14 16 18

Tiempo

Uso

Page 16: Variables estadísticas bidimensionales

Diagramas de dispersión o Diagramas de dispersión o nubes de puntos nubes de puntos

Ejemplo 5. Ejemplo 5. El número de libras de vapor utilizadas por mes por una planta química, está relacionado con la temperatura ambiente promedio (en grados Farenheit) de ese mes. En la tabla siguiente se muestra el uso del vapor de un año y la temperatura del mes correspondiente.

 Consumo de Vapor por Mes

 

MesTemperatura

Uso/1000

Enero 21 185.79

Febrero 24 214.47

Marzo 32 288.03

Abril 47 424.84

Mayo 50 454.58

Junio 59 539.03

Julio 68 21.55

Agosto 74 675.06

Septiembre 62 562.03

Octubre 50 452.93

Noviembre 41 369.96

Diciembre 30 273.98

Page 17: Variables estadísticas bidimensionales

Diagramas de dispersión o Diagramas de dispersión o nubes de puntosnubes de puntos

Se puede ver en el primera figura que correspondía Se puede ver en el primera figura que correspondía al diagrama deal diagrama de talla - peso talla - peso que la serie de puntos que la serie de puntos presenta una tendencia "presenta una tendencia "ascendenteascendente"" . Se dice en . Se dice en este caso que existen entre las dos variables una este caso que existen entre las dos variables una ""dependencia directadependencia directa" . " .

En caso en que la tendencia sea "En caso en que la tendencia sea "descendentedescendente" " se diría que estaríamos ante una " se diría que estaríamos ante una " dependencia dependencia inversainversa ""

Naturalmente en caso en que no se pueda Naturalmente en caso en que no se pueda observar una tendencia clara estaríamos ante una observar una tendencia clara estaríamos ante una dependencia muy débil que no se puede observar dependencia muy débil que no se puede observar mediante la nube de puntosmediante la nube de puntos

Page 18: Variables estadísticas bidimensionales

Regresión y CorrelaciónRegresión y Correlación

Page 19: Variables estadísticas bidimensionales

Regresión lineal simpleRegresión lineal simple

La regresión lineal simple, La regresión lineal simple,  muestra como para cada muestra como para cada valor valor xx de una variable no aleatoria de una variable no aleatoria X X  - conocida como - conocida como variable variable predictora o independientepredictora o independiente-, -,  interviene una interviene una variable aleatoria variable aleatoria YY, denominada , denominada variable respuesta o variable respuesta o dependiente;dependiente;  relacionadas, a través del valor medio o   relacionadas, a través del valor medio o esperado de la esperado de la variable respuestavariable respuesta,  por la expresión ,  por la expresión    

Donde a y b son los coeficientes de regresiónDonde a y b son los coeficientes de regresión

bχaγ

Page 20: Variables estadísticas bidimensionales

Estimación de los parámetros de a recta de regresiónEl primer problema a abordar es obtener los

estimadores de los parámetros de la recta de regresión,  partiendo de una muestra de tamaño n, es decir, n pares (x1, Y1) , (x2, Y2), ..., (xn, Yn); que

representan nuestra intención de extraer para cada xi un

individuo de la población o variable Yi .  

Una vez realizada la muestra, se dispondrá de n pares de valores o puntos del plano (x1, y1) , (x2, y2), ..., (xn,

yn). El método de estimación aplicable en regresión,

denominado de los mínimos cuadrados, permite esencialmente determinar la recta que "mejor" se ajuste o mejor se adapte a la nube de n puntos.

Page 21: Variables estadísticas bidimensionales

Estimación de los parámetros de a recta de regresiónLas estimaciones de los parámetros de la recta de regresión obtenidas con este procedimiento son:

n n

ii

n

i

n

ii

n

i

xxn

yxyxnb

1

2

1

2

111

n

xbya

n

i

n

i 11

Page 22: Variables estadísticas bidimensionales

Estimación de los parámetros de a recta de regresión

Talla (x) Peso (y) XY X²

160 55 8.800 25.600

165 58 9.570 27.225

168 58 9.744 28.224

170 61 10.370 28.900

171 67 11.457 29.241

175 62 10.850 30.625

175 66 11.550 30.625

180 74 13.320 32.400

180 79 14.220 32.400

182 83 15.106 33.124

       

1726 663 114987 298364

a = -142.91

b = 1.2120

Y = -142.91 + (1.21)XY = -142.91 + (1.21)X

bXaY

n n

ii

n

i

n

ii

n

i

xxn

yxyxnb

1

2

1

2

111

n

xbya

n

i

n

i 11

Page 23: Variables estadísticas bidimensionales

En esta imagen se muestra la recta de regresión de y (peso) sobre x (talla). Se representa cómo depende el peso de su talla en en una persona

Si recordamos que entre la talla y el peso decíamos que existía una dependencia directa, la recta de regresión lo confirma ya que su pendiente es positiva: a medida que aumenta la talla aumenta el peso. Por tanto:

Hay dependencia directa con pendiente de la recta positiva creciente

Recta de regresiónRecta de regresión

Page 24: Variables estadísticas bidimensionales

Utilidad de la recta de regresión Utilidad de la recta de regresión

Mediante la recta de regresión podríamos obtener Mediante la recta de regresión podríamos obtener de manera aproximada el valor de la variable de manera aproximada el valor de la variable dependiente (y) de la que conociéramos la dependiente (y) de la que conociéramos la variable independiente (x), en una población variable independiente (x), en una población semejante a aquella de la que se ha obtenido la semejante a aquella de la que se ha obtenido la muestramuestra

De manera más precisa, si conocemos la De manera más precisa, si conocemos la expresión de la recta de regresión, se pueden expresión de la recta de regresión, se pueden calcular valores para la variable y, conocidos los calcular valores para la variable y, conocidos los de x, como si se tratara de una funciónde x, como si se tratara de una función

Page 25: Variables estadísticas bidimensionales

Si observamos la gráfica, podríamos suponer por ejemplo que una persona de 185 cm pesaría algo más de 80 kg

De acuerdo a la formula

La recta de regresión de la variable y (talla) sobre x (peso) será la recta:

El valor del peso estimado para una talla de 185 cm sería:

Peso= -142.91 + 185(1.21) = 81.33

Este valor obtenido es algo menor al esperado. Eso quiere decir que las predicciones hechas con la recta de regresión no son exactas. Mas adelante precisaremos la "fiabilidad" de las mismas.

Por tanto la recta de regresión se puede utilizar para realizar predicciones para la variable y a partir de valores conocidos de la variable x.

Y = -142.91 + (1.21)X

Estimación o pronostico

Page 26: Variables estadísticas bidimensionales

Coeficiente de correlaciónCoeficiente de correlación

Page 27: Variables estadísticas bidimensionales

Una vez observado que en una variable bidimensional Una vez observado que en una variable bidimensional existe una cierta dependencia entre las dos características existe una cierta dependencia entre las dos características o variables que la forman (nube de puntos), podemos o variables que la forman (nube de puntos), podemos precisar el grado de dicha dependencia. precisar el grado de dicha dependencia.

Si los puntos de la nube estuvieran todos sobre la recta de Si los puntos de la nube estuvieran todos sobre la recta de regresión se diría que existe una regresión se diría que existe una dependencia funcionaldependencia funcional. .

Si los puntos no están todos sobre la recta de regresión se Si los puntos no están todos sobre la recta de regresión se dice que entre las variables hay una ciertadice que entre las variables hay una cierta correlación correlación lineal.lineal. Este es el caso que nos ocupa. Para cuantificar el Este es el caso que nos ocupa. Para cuantificar el grado de dicha correlación se usa el coeficiente de grado de dicha correlación se usa el coeficiente de correlacióncorrelación

Dependencia de las variablesDependencia de las variables

Page 28: Variables estadísticas bidimensionales

El valor del coeficiente esta comprendido entre -1 y 1.

Si r se acerca a -1 o a +1, la dependencia es fuerte y por tanto las predicciones que se realicen a partir de la recta de regresión serán bastante fiables.

Si r se acerca a 0 la dependencia es débil y por tanto las predicciones que se realicen a partir de la recta de regresión serán poco fiables

2_

1

2_

1

__

1

)()(

))((

yyxx

yyxxr

n

i

n

i

i

n

i

Coeficiente de correlación Coeficiente de correlación de Pearsonde Pearson

Page 29: Variables estadísticas bidimensionales

Calcularemos la correlación para el ejemplo de las tallas y los pesos

r se acerca a 0 la dependencia es débil y por tanto las predicciones que se realicen a partir de la recta de regresión serán poco fiables

Coeficiente de correlación de Pearson

Talla (x)Talla (x) Peso (y)Peso (y) (x-x)(x-x) (x-x)(x-x)22 (y-y)(y-y) (y-y)(y-y)22

160 55 -13,0 169 -11,0 121

165 58 -8,0 64 -8,0 64

168 58 -5,0 25 -8,0 64

170 61 -3,0 9 -5,0 25

171 67 -2,0 4 1,0 1

175 62 2,0 4 -4,0 16

175 66 2,0 4 0,0 0

180 74 7,0 49 8,0 64

180 79 7,0 49 13,0 169

182 83 9,0 81 17,0 289

           

1726 663 -4 458 3 813

172,6 66,3        

173_

x 66_

y

rr22 = = 0.820.82

Page 30: Variables estadísticas bidimensionales

Cálculos de los coeficientes Cálculos de los coeficientes con Excelcon Excel

Page 31: Variables estadísticas bidimensionales

Cálculos de los coeficientes Cálculos de los coeficientes con Excelcon Excel

Page 32: Variables estadísticas bidimensionales

a

Cálculos de los coeficientes Cálculos de los coeficientes con Excelcon Excel

b

r

Y = -142.9 + 1.21 XLa ecuación con el valor de los parámetros

bXaY