27
UNIVERSIDAD DE CONCEPCION FACULTAD DE CIENCIAS FISICAS Y MATEMATICAS DEPARTAMENTO DE ESTADISTICA 1º Semestre de 2015 ESTADISTICA DESCRIPTIVA 1 Prof. Francisco Pradenas P. ESTADISTICA DESCRIPTIVA BIDIMENSIONAL

Analisis Descriptivo Bidimensional

Embed Size (px)

DESCRIPTION

estadistica

Citation preview

  • UNIVERSIDAD DE CONCEPCIONFACULTAD DE CIENCIAS FISICAS Y MATEMATICAS

    DEPARTAMENTO DE ESTADISTICA1 Semestre de 2015

    ESTADISTICA DESCRIPTIVA

    1Prof. Francisco Pradenas P.

    ESTADISTICA DESCRIPTIVA BIDIMENSIONAL

  • Un anlisis estadstico descriptivo anlisis estadstico descriptivo bidimensionalbidimensional, estudia el

    comportamiento simultneo entre dos variables aplicadas a una cierta

    2

    dos variables aplicadas a una cierta unidad de observacin, con el

    propsito de determinar si existe o no alguna relacin de dependencia

    lineal entre ellas.

  • ALGUNOS EJEMPLOS DE APLICACIN ... Determinar si el consumoconsumo de un producto

    depende del ingresoingreso del grupo familiar.

    Decidir si la humedadhumedad relativarelativa en unaRegin tiene relacin con las temperaturastemperaturasdel sector geogrfico.

    3

    Calcular la alturaaltura de una planta segn lacantidadcantidad de fertilizante suministrado.

    Averiguar si el rendimientorendimiento acadmicoacadmico delos estudiantes tiene relacin con el tiempotiempode estudio diario.

    Determinar la resistenciaresistencia de una barra deacero sometida a diferentes niveles detemperaturatemperatura.

  • Supondremos que existen las variables XX e YY, de lascuales se dispone de n datos bidimensionales (xi , yi ).

    Los pares de datos (xi , yi ), se pueden clasificar en rclases respecto de la variable XX y en s clasesrespecto de la variable YY.

    4

    respecto de la variable YY.

    Denotaremos por nij a la frecuencia absoluta de laclase conjunta (Ai Bj).

    La clasificacin de los datos se resume en una tablatabladede contingenciacontingencia.

  • TABLA DE CONTINGENCIATABLA DE CONTINGENCIA

    5

  • EJEMPLO

    Supongamos que se desea realizar un estudio, respecto de la eventual relacin entre el nmero de avisos publicitarios por televisin y el monto

    total de las ventas semanales de un cierto producto.

    6

    producto.

    Para ello, se dispone de una muestra de 20 semanas (5 meses) donde se registro las ventas

    del producto, en millones de pesos, y el nmero de avisos publicitarios durante los

    fines de semana.

  • Datos de la MuestraSemana N xi (N avisos publicitarios) yi (monto de ventas)

    1 8 802 4 503 5 624 4 415 4 586 4 347 5 668 7 729 5 59

    7

    9 5 5910 6 7411 8 9012 6 6813 4 3814 5 6315 6 7016 7 7417 8 8518 8 8619 7 7920 4 37

  • DIAGRAMA DE DISPERSION

    50

    60

    70

    80

    90

    M

    o

    n

    t

    o

    d

    e

    V

    e

    n

    t

    a

    s

    8

    20

    30

    40

    3 4 5 6 7 8 9

    N de Avisos Publicitarios en TV

    M

    o

    n

    t

    o

    d

    e

    V

    e

    n

    t

    a

    s

  • TABLA DE CONTINGENCIATABLA DE CONTINGENCIASemana N xi (N avisos publicitarios) yi (monto de ventas)

    1 8 802 4 503 5 624 4 415 4 586 4 347 5 668 7 729 5 59

    10 6 7411 8 9012 6 6813 4 3814 5 6315 6 70

    9

    4 4 1 1 65 4 46 1 2 37 3 38 1 3 4n

    .j 4 1 6 6 3 n.. = 20

    N Avisos Publicitarios (X)Monto de Ventas (Y)

    69 - 81 81 - 93 ni.33 - 45 45 - 57 57 - 69

    15 6 7016 7 7417 8 8518 8 8619 7 7920 4 37

  • DISTRIBUCIONES MARGINALESDISTRIBUCIONES MARGINALES

    Permiten conocer el comportamiento individual de cada variable, aislando el

    efecto que puede provocar la otra variable.

    Cmo Describir Datos Bidimensionales?Cmo Describir Datos Bidimensionales?

    10

    Se construyen mediante las clases de cada variable y su frecuencia correspondiente.

    Las distribuciones marginales son tiles cuando las variables son independientes, es decir, no existe relacin funcional entre

    ellas.

  • EJEMPLO (avisos vs. ventas)

    Distribucin Marginal de X

    4 65 4

    N Avisos Publicitarios (X) ni.

    Semana N xi (N avisos publicitarios)1 82 43 54 45 46 47 58 79 510 6

    11

    5 46 37 38 4n.. 20

    10 611 812 613 414 515 616 717 818 819 720 4

  • EJEMPLO (avisos vs. ventas)

    Distribucin Marginal de Y

    33 - 45 445 - 57 1

    Monto de Ventas (Y) n.j

    Semana N yi (monto de ventas)1 802 503 624 415 586 347 668 729 59

    12

    45 - 57 157 - 69 669 - 81 681 - 93 3

    n.. 20

    9 5910 7411 9012 6813 3814 6315 7016 7417 8518 8619 7920 37

  • ANALISIS DESCRIPTIVO DEANALISIS DESCRIPTIVO DEDISTRIBUCIONES MARGINALESDISTRIBUCIONES MARGINALES

    Una vez obtenidas las distribuciones marginales de XX e YY, el analista pueda

    estudiar el comportamiento cualitativo y cuantitativo de ellas, mediante grficos y

    medidas estadsticas.

    13

    medidas estadsticas.

    Puede ser de inters averiguar sobre la forma de la distribucin de frecuencias de X y de Y, estudiar la variabilidad de cada una y

    compararlas, analizar las medidas de tendencia central, etc.

  • DISTRIBUCIONES CONDICIONALESDISTRIBUCIONES CONDICIONALES

    Permiten conocer el comportamiento de una de las variables, sujeta o condicionada

    a valores de la otra variable.

    Se construyen mediante las clases de una

    14

    Se construyen mediante las clases de una de las variables y la frecuencia

    correspondiente de la otra variable.

    Las distribuciones condicionales son tiles cuando las variables son dependientes, es decir, existe relacin funcional entre ellas.

  • Distribucin Condicional de X si Y]57 , 69]

    EJEMPLO (avisos vs. ventas)

    4 4 1 1 65 4 46 1 2 37 3 38 1 3 4n

    .j 4 1 6 6 3 n.. = 20

    N Avisos Publicitarios (X)Monto de Ventas (Y)

    69 - 81 81 - 93 ni.33 - 45 45 - 57 57 - 69

    15

    4 15 46 17 08 0

    n.3 6

    X / ]57 , 69]N Avisos Publicitarios (X)

    n.j 4 1 6 6 3 n.. = 20

  • EJEMPLO (avisos vs. ventas)

    Distribucin Condicional de Y si X = 6

    4 4 1 1 65 4 46 1 2 37 3 38 1 3 4n n.. = 20

    N Avisos Publicitarios (X)Monto de Ventas (Y)

    69 - 81 81 - 93 ni.33 - 45 45 - 57 57 - 69

    16

    33 - 45 045 - 57 057 - 69 169 - 81 281 - 93 0

    n3. 3

    Monto de Ventas (Y) Y / 6

    n.j 4 1 6 6 3 n.. = 20

  • COVARIANZA Y CORRELACIONCOVARIANZA Y CORRELACION

    Como ya mencionamos, uno de los objetivos en el estudio de variables

    bidimensionales, es determinar si existe o no relacin lineal entre las variables X e Yrelacin lineal entre las variables X e Y.

    17

    no relacin lineal entre las variables X e Yrelacin lineal entre las variables X e Y.

    Las medidas estadsticas que permiten cuantificar la relacin lineal entre estas

    variables, son la covarianzacovarianza y el coeficiente de correlacincoeficiente de correlacin.

  • COVARIANZACOVARIANZA

    La covarianzacovarianza mide la dispersin conjunta entre dos variables

    cuantitativas X e Y, con respecto de la media aritmtica de cada una de ellas.

    18

    media aritmtica de cada una de ellas.

  • PROPIEDADES DE LA COVARIANZAPROPIEDADES DE LA COVARIANZA

    1. Si las variables X e Y sonindependientes entre s, entoncesla covarianza es cero. El inverso nosiempre se cumple.

    19

    2. Si la covarianza es distinta de cero,entonces las variables X e Y sondependientes entre s.

  • 3. Si Cov(X,Y) > 0, entonces existedependencia lineal directa entrelas variables, es decir, un aumento

    PROPIEDADES DE LA COVARIANZAPROPIEDADES DE LA COVARIANZA

    20

    las variables, es decir, un aumentoo disminucin en una de estasvariables provocar el mismoefecto en la otra variable.

  • 4. Si Cov(X,Y) < 0, entonces existedependencia lineal inversa entrelas variables, es decir, un aumento

    PROPIEDADES DE LA COVARIANZAPROPIEDADES DE LA COVARIANZA

    21

    las variables, es decir, un aumentoo disminucin en una de estasvariables provocar un efectocontrario en la otra variable.

  • EJEMPLO (avisos vs. ventas)

    Varianza de X = 2,2875

    X YX 2,2875Y 23,125 274,81

    22

    Cov(X,Y)= 23,125

    Varianza de X = 2,2875

    Varianza de Y = 274,81

  • EJEMPLO (avisos vs. ventas)

    Como Cov(X,Y) > 0, entonces existe dependencia lineal directa entre el nmero de avisos

    publicitarios (X) y el monto total de ventas

    Cov(X,Y)= 23,125

    23

    publicitarios (X) y el monto total de ventas semanales (Y).

    Mientras mayor es el nmero de avisos publicitarios en TV, mayor es el monto obtenido

    por concepto de ventas del producto.

  • COEFICIENTE DE CORRELACIONCOEFICIENTE DE CORRELACION

    El coeficiente de correlacincoeficiente de correlacin mide el gradoo magnitud de la asociacin lineal entre

    dos variables cuantitativas X e Y.

    24

    sX : desviacin estndar de X.

    sY : desviacin estndar de Y.

  • PROPIEDADES DELPROPIEDADES DELCOEFICIENTE DE CORRELACIONCOEFICIENTE DE CORRELACION

    1. |rXY| 1 -1 rXY 1.2. Si rXY > 0, entonces la asociacin lineal

    entre X e Y es directa.

    25

    entre X e Y es directa.

    3. Si rXY < 0, entonces la asociacin linealentre X e Y es inversa.

    4. Si las variables X e Y son independientesentre s, entonces rXY = 0.

  • EJEMPLO (avisos vs. ventas)

    rX,Y = 0,922

    X YX 1Y 0,922 1

    Varianza de X = 2,2875

    26

    Cov(X,Y)= 23,125

    Varianza de X = 2,2875

    Varianza de Y = 274,81

    922.081.2742875.2

    125.23 .

    ),(,

    ===

    YXYX

    ss

    YXCovr

  • El grado de dependencia lineal directa entre el nmero de avisos publicitarios (X) y el monto total de ventas semanales (Y), es de 0,9220,922.

    EJEMPLO (avisos vs. ventas)

    rX,Y = 0,922

    27

    total de ventas semanales (Y), es de 0,9220,922.

    Existe un 92.2%92.2% de relacin lineal entre el nmero de avisos publicitarios en TV y el monto obtenido por concepto de ventas del producto.