Guia Inferencia Regresion

Embed Size (px)

Citation preview

  • 8/18/2019 Guia Inferencia Regresion

    1/7

    GUÍA METODOLÓGICA DE ESTADÍSTICA INFERENCIAL

    ING. R OBERTO LINCE

    ANALISIS DE CORRELACION Y REGRESION

    Hasta el momento, nos hemos ocupado del análisis de una sola variable,es decir de una sola característica, desde una sola población hastavarias poblaciones, corresponde entonces realizar el análisis sobre dos omás variables. El análisis de correlación y regresión corresponde alanálisis respecto del comportamiento que presentan en conjunto dos omás variables relacionadas, es decir dos o más características en los

    mismos elementos poblacionales; para esto, es necesario entender aque nos reerimos con relación;

    En virtud de tal relación se de!nen y dierencian dos tipos de variables"

     #ambi$n, se requiere dierenciar el sentido de la relación que presentanlas variables analizadas, para esto se tiene que"

    %or ejemplo, si se relaciona las ventas con la publicidad, la publicidadsería la variable independiente &, porque es la que in'uye en elcomportamiento de las ventas, y lógicamente las ventas sería (; elsentido de la relación podría tener los siguientes esquemas"

    a) *irectab) +ndirectac) ula

    Relación: se refiere a la influencia que ejerce una característica sobre otra, entendiéndose lainfluencia como la afectación o estímulo de la una variable respecto de la otra o viceversa. Lo

     

    Variable Independiente: es aquella característica que influye o incide en el comportamiento dela otra variable, y se la nomina siempre como X.Variable Dependiente: es aquella que es influida o afectada por la otra variable y es la que

     

    Relación Positiva o directa: se da cuando a un incremento de la variable independiente X lecorresponde un incremento en la variable dependiente Y.Relación Negativa o indirecta:  es cuando a un incremento en X le corresponde unadisminución en Y.Relación Nula: cuando no eiste ning!n tipo de sentido definible respecto del comportamientoconjunto de las variables.

  • 8/18/2019 Guia Inferencia Regresion

    2/7

    -rá!camente será"

    %or otro lado, se requiere determinar el tipo de relación que describen

    las dos variables en virtud de identi!car el comportamiento conjunto deambas variables y establecer los criterios para la predicción y pronósticoque corresponde al análisis de regresión, encontrándose que la relaciónpodría ser de tipo lineal, eponencial o logarítmica.

    1. ANÁLISIS DE CORRELACIÓN

    En primera instancia, se debe obtener un panorama respecto de larelación que de!nen las dos variables analizadas, lo cual se consigue atrav$s del diagrama de dispersión, una vez identi!cado elcomportamiento conjunto, se requiere de un descriptor que eprese el

    sentido y la uerza de la relación identi!cada y su correspondienteparámetro, para esto se tiene el coe!ciente de correlación r, y suparámetro ρ /rho).

    *onde el signo del indicador epresa si la relación es directa o inversa yel valor representa la uerza de la relación, entendi$ndose que 0 implica

    una relación perecta.

    %ara tener un reerente para su interpretación se podría considerar elsiguiente esquema"

    1i r ≥ 2.3 se considera una relación uerte1i 2.4 ≤ r > 0.9 será una relación significativa o moderadaSi 0.5 ≤ r > 0.7 será una relación débil

    Coeficiente de correlación ρ (rho": mide el grado de relación que eiste entre dos variables ypuede tomar valores desde #$ %asta $, siendo su estimador puntual r, es decir:

    #$ & r ' $

  • 8/18/2019 Guia Inferencia Regresion

    3/7

    ás allá de estos valores !a no resulta relevante la relación encontrada ! se la "odr#a consideraraleatoria.

    *ebe considerarse que, la relación que se está analizando debe guardar

    una escenario lógico y coherente, num$ricamente se puede establecerrelación entre variables que no la tienen en la realidad.

    %or ejemplo; la producción de petróleo con la crianza de ovejas,num$ricamente pueden presentar relación pero no la tienen en realidad.

    *entro del escenario de la inerencia estadística, corresponde entoncesrealizar las estimaciones y sus respectivas pruebas de hipótesis,considerando que se lo hace a partir de la inormación generada por unamuestra, seg5n los esquemas analizados en las herramientasrespectivas.

    %ara calcular r se tiene la siguiente ecuación"

    r=  (n−1 )S x S y

    √ [n∑ x2−(∑  x)2 ] [n∑  y2−(∑  y )2 ]

    *onde se entiende que r es una medida de la relación entre, la variaciónconjunta de &( respecto de la media de la variación conjugada de & conla de (.

    %ara realizar la prueba respectiva, se deben considerar los siguiente

    puntos"

    0. Defniciones.6 %oblación, 7ariables independiente y dependiente, y%arámetro.

    8. Realizar la gráfca de dispersión.6 para identi!car grá!camente elsentido y tipo de relación.

    9. Formular las hipótesis.6 para este caso las hipótesis serán"H2" ρ : 2H0" ρ  2 ó ρ < 2 seg5n si la relación se considera positiva onegativa respectivamente

    =. Determinar la signifcancia y el valor crítico.6 es decir, el valor de t enla tabla conorme la signi!cancia /$), los grados de libertad serán gl :n 6 8

    >. Establecer la regla de decisión.6 1i tc > t α   se rechaza !"?. Escoger el estadístico de prueba.6 en este caso la prueba para ρ es"

    tc=r √ n−2

    √ 1−r 2

  • 8/18/2019 Guia Inferencia Regresion

    4/7

    4. #alcular los valores.6 determinar el valor de r y r8, y remplazar en laecuación,

    @. $omar la decisión.6 esto es, rechazar o aceptar H2 seg5n la evidenciamuestral, 

    3. Elaborar la conclusión general.6 resolución conorme el escenario deaplicación de la prueba.

    %ara demostrar el procedimiento anterior se tiene el siguiente ejemplo"

  • 8/18/2019 Guia Inferencia Regresion

    5/7

    Ejemplo"

    Ana muestra de 02 amilias en el área de Buito reveló las siguientes cirasreerentes al tamaCo de amilia y la cantidad de dinero /en dólares) gastadaen alimentos, por semana.

     #amaCo Dantid  #amaCo Dantid

    de laamilia

    gastada

    de laamilia

    gastada

    9 33 9 000? 02= = 4=> 0>0 = 30? 083 > 003? 0=8 9 30

    Fa variable independiente & será el tamaCo de la amilia y la variabledependiente ( será el gasto, es decir el gasto depende del tamaCo de laamilia.

    El diagrama de dispersión será"

    8.> 9 9.> = =.> > >.> ? ?.>2

    >2

    022

    0>2

    822

    Diagrama de dispersión

    Tamaño

    Gaso

    Donorme la grá!ca parece eistir una relación positiva entre ambasvariables, habrá que determinar si es estadísticamente signi!cativa.

    0. Defniciones.6 %oblación, todas las casas del sector de Buito7ariable independiente, el tamaCo de la amilia7ariable dependiente, el -asto delas amilias,%arámetro, ρ el nivel de correlación entre el tama%o ! el gastode todas las familias de &uito.

    %. Formular las hipótesis.6 para este caso las hipótesis serán&H2" ρ : 2

  • 8/18/2019 Guia Inferencia Regresion

    6/7

    H0" ρ  2 por cuanto se supone positiva'. Determinar la signifcancia y el valor crítico.( la signi!cancia )

    * "."+, con gl * -" % * /, t * %./%'0. Establecer la regla de decisión.( 1i tc >%,/%' se rechaza !"+. Escoger el estadístico de prueba.( en este caso la prueba para

    1 es"

    tc=r √ n−2

    √ 1−r 2

    2. #alcular los valores.( remplazando valores se tiene,

    tc=0.5892√ 10−2

    √ 1−0.58922=2,062

    3. $omar la decisión.( como 8,2?8 es menor que 8,@89 se aceptala hipótesis !",

    @. Elaborar la conclusión general.( seg5n la evidencia de lamuestra, la relación observada entre el tamaCo de la amilia yel gasto amiliar no es estadísticamente signi!cativa.

  • 8/18/2019 Guia Inferencia Regresion

    7/7