22
ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL tinaramirez24@hotmail. com Mg. AGUSTINA RAMÍREZ TORRES

Estadisitca Bidimensional

Embed Size (px)

DESCRIPTION

listo

Citation preview

Page 1: Estadisitca Bidimensional

ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL

[email protected]

Mg. AGUSTINA RAMÍREZ TORRES

Page 2: Estadisitca Bidimensional

LOGRO DE APRENDIZAJE:

Al finalizar la clase, el estudiante elabora e interpreta tablas bivariadas de los problemas planteados, para determinar la relación de dos variables demostrando su capacidad de análisis y precisión de resultados.

Page 3: Estadisitca Bidimensional

ESTADÍSTICA BIDIMENSIONAL

Analiza el comportamiento conjunto de dos variables en una unidad de estudio, es decir busca la asociación o relación que existe entre ambas variables, se representa como un conjunto de pares de datos (X,Y), donde:

X : es la variable independiente (llamado factor)

Y : es la variable dependiente (llamado resultado)

Ejemplos:• Estrés laboral y desempeño de los trabajadores• Gasto en publicidad y volumen de ventas • Nivel de estudios y región de procedencia• Ingresos y nivel socioeconómico • Cociente intelectual y rendimiento académico

Page 4: Estadisitca Bidimensional

La relación o asociación de variables se da entre:

I. Dos variables cualitativas; carrera profesional y género; Nivel de satisfacción y nivel de estudios, Nivel de pobreza y Zona de residencia.

II. Dos variables cuantitativas; Ingresos y gastos en una familia, Precio de PC y la velocidad del procesador.

III. Una variable cualitativa y una cuantitativa; Nivel de estudios y sueldo de las personas; Zona de ventas y volumen de ventas.

Page 5: Estadisitca Bidimensional

PRESENTACIÓN DE DATOS BIVARIADOS

Variable aleatoria 1

Varia

ble

ale

ator

ia 2

Tablas de contingencia

Masculino Femenino0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

36%

16%18%

30%

DepresiónSin depresión

Gráfico de barras agrupadas

Grupo 1 Grupo 2 Total

Factor 1 1 (a) 2 (b)

Factor 2 3 (c) 4 (d)

Total Total (n)

Page 6: Estadisitca Bidimensional

ORGANIZACIÓN Y PRESENTACIÓN DE DATOS

La asociación o relación de dos variables se debe resumir los resultados en:• Tablas de frecuencias bidimensionales o contingencia• Gráfico de barras agrupadas

Var Y

Var X y1 y2 ... yj ... yl

x1 f11 f12… f1j

… f1l f1.

x2 f21 f22… f2j

… f2l f2.

…… …

……

……

xi fi1 fi2… fij

… fil fi.

…… …

……

…… …

xk fk1 fk2… fkj

… fkl fk.

f.1 f.2… f.j

… f.l

k

1i.i.i nf

1jj.j. nf nfn

k

1i 1jij..

Page 7: Estadisitca Bidimensional

Donde:Las frecuencias absolutas conjuntas se designa con el índice ij es decir: fij

La suma de los totales se considera de tres formas:

a) Totales por fila; es la suma total de las frecuencias absolutas en fila:

b) Totales por columna; es la suma total de las frecuencias absolutas en columna:

c) Total general; es la suma total de las frecuencias absolutas: f.. (igual a n)

.if

jf.

Page 8: Estadisitca Bidimensional

Para obtener los porcentajes, llamadas también frecuencias relativas o proporciones, existen tres maneras:

a) Con relación al total general, está dado por:

b) Con relación al total de fila :

c) Con relación al total de columna :

n

fh ij

ij

..

i

iji f

fh

j

ijj f

fh

..

Page 9: Estadisitca Bidimensional

a) Distribución marginal de X; está dado por las marcas de clase (Xi) y por los totales de las frecuencia por filas (fi.) :

b) Distribución marginal de Y; está dado por las marcas de clase (Yj) y por los totales de las frecuencias por columnas (f.j) :

X fi.x1 f1.

x2 f2.

: :xk fk.

Total ni.

Y f.jy1 f.j

y2 f.j: :yl f.l

Total n.j

Distribuciones marginales

Page 10: Estadisitca Bidimensional

Variable de estudio

Varia

ble

secu

ndar

iaTABLAS DE CONTINGENCIA

Grupo 1 Grupo 2 Total

Factor 1 1 (a) 2 (b) Marginal (a+b)

Factor 2 3 (c) 4 (d) Marginal (b+c)

Total Marginal (a+c) Marginal (b+d) Total (n)

Page 11: Estadisitca Bidimensional

Variable de estudio

Es la variable que identifica la línea de investigación

Variable aleatoria

Es la variable cuya distribución se va a conocer con la recogida de los datos

Variable fija

Es la variable cuya distribución se conoce antes de realizar el estudio

Ejemplo. comparar el rendimiento académico de 30

estudiantes de la sección A y 35 estudiantes de la sección B

Page 12: Estadisitca Bidimensional

Grupo 1 Grupo 2

Factor 1

Factor 2

100%

Variable aleatoria

Varia

ble

ale

ator

iaTABLAS DE CONTINGENCIA

(Objetivo asociar)

Page 13: Estadisitca Bidimensional

La municipalidad del distrito de Ventanilla está interesada en averiguar si el nivel de estudios de sus pobladores está asociado a la región de procedencia, para ello ha seleccionado un grupo de personas que se encuentran registradas en la RENIEC correspondientes a su distrito.Los resultados se presentan en la siguiente tabla de frecuencias bidimensional.

EJEMPLO 1:

Page 14: Estadisitca Bidimensional

Presentación de resultados

Región de procedencia

Nivel de estudios TotalPrimaria Secundaria Superior

n % n % n % n %

Costa40 10.7 80 21.3 60 16.0 180 48.0

Sierra 35 9.3 35 9.3 30 8.0 100 26.7

Selva 30 8.0 40 10.7 25 6.7 95 25.3

Total 105 28.0 155 41.3 115 30.7 375 100.0

Tabla1. Nivel de estudios de pobladores de Ventanilla por región de procedencia

De las 375 personas encuestadas, 40 son de la costa y tienen grado de instrucción primaria y son el 10.7%, 35 son de la sierra y tienen secundaria y son el 9.3%, ….40 son de la selva y tienen secundaria y son el 10.7%, …. Se observa en la tabla 1, que las personas mayormente han alcanzado estudios secundarios, el 21.3% son de la costa, el 10.7% de la selva y el 9.3% son de la selva.

Page 15: Estadisitca Bidimensional

Gráfico 1. Nivel de estudios de pobladores de Ventanilla por región de procedencia

Costa Sierra Selva0

5

10

15

20

25

10.79.3

8.0

21.3

9.3

10.7

16.0

8.06.7

Primaria Secundaria Superior

Frec

uenc

ia (%

)

De acuerdo a la región de procedencia, el nivel de estudios que mayormente han alcanzado los pobladores de Ventanilla, es secundaria; el 21.3% para los que son de la costa, el 9.3% para los de la sierra y el 10.3% los que han migrado de la selva

Page 16: Estadisitca Bidimensional

Grupo 1 Grupo 2

Factor 1

Factor 2

100% 100% 100%

Variable fija

Varia

ble

ale

ator

iaTABLAS DE CONTINGENCIA

(Objetivo comparar)

Page 17: Estadisitca Bidimensional

Grupo 1 Grupo 2

Factor 1 100%

Factor 2 100%

100%

Variable aleatoria

Varia

ble

fjia

TABLAS DE CONTINGENCIA (Objetivo comparar)

Page 18: Estadisitca Bidimensional

Área de residencia

Nivel de pobreza TotalNo pobre Pobre no extremo Pobre extremo

n % n % n % n %

Urbana2336 270 10 2616 100

Rural 203 20 9 232 100

Total 2539 290 19 2848 100

EJEMPLO 2.En la encuesta nacional de hogares realizada por el INEI en el 2012, se ha registrado la zona de residencia y el nivel de pobreza de los hogares del departamento de Lima.1) Hallar los porcentajes por fila de las familias del departamento

de Lima2) Interpretar : f11, h23%, f1. , f.2

Tabla 2. Nivel de pobreza según región de procedencia

Page 19: Estadisitca Bidimensional

a) Media o promedio de la variable X :

b) Media o promedio de la variable Y :

c) Varianza de la variable X :

d) Varianza de la variable Y :

e) Covarianza de la variable X e Y : mide la variabilidad de X e Y

n

fxx

k

iii

1.

n

fy

y

l

jjj

1.

Resumen de estadísticos (Datos cuantitativos bivariados)

n

xxf

S

k

1i

2i.i

2x

n

yyf

S

l

1j

2ij.

2y

n

yyxxf

yxCov

k

i

l

jjiij

1 1,

Page 20: Estadisitca Bidimensional

a) Covarianza: mide la variabilidad conjunta de X e Y

MEDIDAS DE ASOCIACIÓN

n

yyxxf

yxCov

k

i

l

jjiij

1 1,

b) Coeficiente de correlación de Pearson : mide el grado de asociación lineal entre las variables X e Y, se simboliza con R

1R1:Donde yx SS

)Y,Xcov(R

Grado de relación de variables

Page 21: Estadisitca Bidimensional

Muy baja Baja Moderada Alta Muy alta

0 0.2 0.4 0.6 0.8 1

Interpretación del coeficiente de correlación de Pearson:

Punto de corte

?

Page 22: Estadisitca Bidimensional

EJEMPLO 3Se ha recolectado la estatura (X) en cm y su peso (Y) en kg de un grupo de estudiantes cuyos resultados se muestran en la tabla de distribución de frecuencias bidimensionales.

Estatura en cm

Peso en kg[50, 60> [60, 70> [70, 80>

[160, 165> 12 18 3

[165, 170> 15 25 8

[170, 175> 4 10 5

[175, 180> 1 3 10

a) Hallar las distribuciones marginalesb) Interprete f22 , f33 , f41, f1. , f.2 , h12%, h2.%, c) Encuentre e interprete el peso y la talla promediod) Encuentre la covarianza entre peso y estatura e) Hallar e interpretar el coeficiente de correlación de Pearson