analiza formei distributiilor

Embed Size (px)

Citation preview

  • Analiza formei distribuiein cazul variabilelor numerice ne intereseaz i forma distribuieiDistribuia datelor se compar, n general, cu distribuia normal teoretic i se analizeaz dou aspecte:- oblicitatea = msura n care distribuia se abate de la forma perfect de simetrie a valorilor n jurul tendinei centrale- boltirea sau aplatizarea = msura n care distribuia este mai plat sau mai boltit n raport cu distribuia normal teoretic

  • ASIMETRIAAsimetria (skewness, n engl.) unei serii de distribuie de frecvene se observ din reprezentarea grafic prin histogram sau poligonul frecvenelor, prin modalitatea n care sunt situai, unul fa de cellalt, indicatorii tendinei centrale. Coeficientul de asimetrie (skewness) exprim gradul de dezechilibru al unei distribuii i se determin, pe eantion, cu formula:

  • ASIMETRIA

    Dac

    , avem asimetrie pozitiv, coada distribuiei este mai alungit la dreapta, n serie predominnd valorile mici

    Dac

    , avem asimetrie negativ, coada distribuiei este mai alungit la stnga, n serie predominnd valorile mari

    Dac

    , avem serie perfect simetric

    Dac

    distribuia empiric difer semnificativ de distribuia normal i se recomand tranformarea datelor (se logaritmeaz valorile variabilei, obinndu-se astfel o distribuie aproximativ normal)

    _1313597810.unknown

    _1313597859.unknown

    _1313597994.unknown

    _1313597703.unknown

  • ASIMETRIA

  • BOLTIREA/APLATIZAREABoltirea (kurtosis, n engl.) exprim nlimea curbei (cocoaei) comparativ cu distribuia normal teoretic. ntlnim, astfel distribuii leptocurtice, ascuite (cu cocoaa nalt) i distribuii platicurtice, aplatizate.

  • BOLTIREA/APLATIZAREA

    Coeficientul de boltire sau aplatizare (kurtosis) este o msur a mprtierii fiecrei observaii n jurul unei valori centrale i se determin, pe eantion, cu formula:

    , unde

    .

    Dac

    , avem distribuie leptocurtic, valorile varibilei fiind concentrate n jurul indicatorilor tendinei centrale

    Dac

    , avem distribuii platicurtice valorile varibilei fiind dispersate n raport cu indicatorii tendinei centrale

    Dac

    , avem distribuie mezocurtic, adic distribuia normal.

    _1313599531.unknown

    _1313916144.unknown

    _1313916537.unknown

    _1313599562.unknown

    _1313599348.unknown

  • Transformarea datelor n cazul distribuiilor profund asimetrice ntr-o distribuie profund asimetric datele sunt concentrate fie n zona valorilor mici, fie n zona valorilor mariIndicatorii statistici descriptivi (ai tendinei centrale, variabilitii i formei distribuiei) se utilizeaz pentru caracterizarea distribuiilor normale sau cu tendin de normalitate. Indicatorii calculai pentru distribuii profund asimetrice nu caracterizeaz corect datele. O soluie este transformarea datelor pentru a nlocui distribuiile asimetrice cu unele cu tendin de normalitate. Transformarea nseamn nlocuirea fiecrei valori observate cu o nou valoare obinut prin aplicarea unei anumite funcii.

  • Transformarea datelor n cazul distribuiilor profund asimetriceTransformarea recomandat n cazul distribuiilor asimetrice cu valori pozitive (majoritatea variabilelor economico-sociale au valori pozitive) este logaritmarea. Prin logaritmare, scala se lrgete lng valoarea zero, permind mprtierea valorilor mici, care erau concentrate n primele intervale. Prin logaritmare, valorile mari se concentreaz. n interpretarea ulterioar a indicatorilor calculai va trebui s inem seama de aceste transformri.

  • Exemplu: Distribuia a 296 abonai n funcie de valoarea facturilor telefonice pltite Me=36,4

  • Dup logaritmarePrin antilogaritmare se obine c media este egal cu 36,56, iar mediana este egal cu 36,4, valori mult mai apropiate dect n cazul datelor iniiale:

  • Indicatorii statistici descriptiviobinui n EXCELMediaMedianaModulAbaterea medie ptratic (standard)DispersiaCoeficientul de boltireCoeficientul de asimetrieVolumul eantionului (n)Amplitudinea