of 34 /34
9. SONDAJUL STATISTIC 9.1. Consideraţii generale Creşterea necesarului de informaţii ce trebuie obţinute cu maximă operativitate a condus la extinderea utilizării sondajului statistic. Această expansiune a sondajului statistic se explică prin operativitatea şi economicitatea obţinerii datelor statistice. Mai mult sondajul statistic este caracteristic dezvoltării libere, economiei de piaţă, aşa cum rapoartele statistice sunt caracteristice economiilor centralizate. De asemenea în unele situaţii practice din tehnică, economie, societate, sondajul statistic este singura metodă de obţinere a informaţiilor statistice. Prin sondaj statistic înţelegem procedeul prin care se caracterizează o populaţie statistică, pe baza cercetării unei părţi a acesteia, numită eşantion, mostră sau uneori selecţie, prelevată din populaţia generală cercetată. Trebuie subliniat că toate afirmaţiile, concluziile statistice stabilite pe baza datelor provenite dintr-un sondaj, nu pot fi considerate de tip determinist, ele având un caracter statistic, există un risc ca ele să fie eronate, fiind efectuate în condiţiile unei anumite probabilităţi, deci cu un anumit nivel de încredere. Metodele sondajului statistic nu-şi propun să elimine acest risc de eroare, ci să-l preevalueze, să determine probabilităţile concluziilor exacte sau aproximative. Sursa principală a erorilor de sondaj o constitue erorile de reprezentativitate a eşantionului în raport cu populaţia de ansamblu. Prin reprezentativitate se înţelege că, într-un număr mic de unităţi care formează un eşantion, să se găsească aceleaşi trăsături esenţiale ca în întreaga populaţie supusă cercetării. Un sondaj care conduce la erori de maximum ± 5% faţă de populaţia de bază se consideră suficient de reprezentativ. Teoretic, eroarea de reprezentativitate poate fi redusă oricât de mult, odată cu creşterea volumului eşantionului până la a îngloba întreaga populaţie. În acest caz dispar avantajele cercetării prin sondaj (de cost, timp etc.). Să considerăm o populaţie statistică P de volum finit N şi E P un eşantion de volum n. Parametrii populaţiei corespunzători unei caracteristici X, ca valoarea medie m, dispersia σ 2 , pot lua o singură valoare, pe când parametrii corespunzători asociaţi unui eşantion, pe care-i notăm de obicei cu x , respectiv s 2 pot lua valori diferite de la eşantion la eşantion (de acelaşi volum sau de volume diferite) ceea ce ne

9.1. Consideraţii generale · PDF file9.1. Consideraţii generale 195 determinată de legea de repartiţie teoretică a variabilei X cercetate prin sondaj X. Un caz important, prin

  • Author
    lephuc

  • View
    218

  • Download
    1

Embed Size (px)

Text of 9.1. Consideraţii generale · PDF file9.1. Consideraţii generale 195 determinată de legea...

  • 9. SONDAJUL STATISTIC

    9.1. Consideraii generale

    Creterea necesarului de informaii ce trebuie obinute cu maxim operativitate a condus la extinderea utilizrii sondajului statistic. Aceast expansiune a sondajului statistic se explic prin operativitatea i economicitatea obinerii datelor statistice. Mai mult sondajul statistic este caracteristic dezvoltrii libere, economiei de pia, aa cum rapoartele statistice sunt caracteristice economiilor centralizate. De asemenea n unele situaii practice din tehnic, economie, societate, sondajul statistic este singura metod de obinere a informaiilor statistice.

    Prin sondaj statistic nelegem procedeul prin care se caracterizeaz o populaie statistic, pe baza cercetrii unei pri a acesteia, numit eantion, mostr sau uneori selecie, prelevat din populaia general cercetat.

    Trebuie subliniat c toate afirmaiile, concluziile statistice stabilite pe baza datelor provenite dintr-un sondaj, nu pot fi considerate de tip determinist, ele avnd un caracter statistic, exist un risc ca ele s fie eronate, fiind efectuate n condiiile unei anumite probabiliti, deci cu un anumit nivel de ncredere.

    Metodele sondajului statistic nu-i propun s elimine acest risc de eroare, ci s-l preevalueze, s determine probabilitile concluziilor exacte sau aproximative.

    Sursa principal a erorilor de sondaj o constitue erorile de reprezentativitate a eantionului n raport cu populaia de ansamblu.

    Prin reprezentativitate se nelege c, ntr-un numr mic de uniti care formeaz un eantion, s se gseasc aceleai trsturi eseniale ca n ntreaga populaie supus cercetrii.

    Un sondaj care conduce la erori de maximum 5% fa de populaia de baz se consider suficient de reprezentativ.

    Teoretic, eroarea de reprezentativitate poate fi redus orict de mult, odat cu creterea volumului eantionului pn la a ngloba ntreaga populaie. n acest caz dispar avantajele cercetrii prin sondaj (de cost, timp etc.).

    S considerm o populaie statistic P de volum finit N i E P un eantion de volum n. Parametrii populaiei corespunztori unei caracteristici X, ca valoarea medie m, dispersia 2, pot lua o singur valoare, pe cnd parametrii corespunztori asociai unui eantion, pe care-i notm de obicei cu x , respectiv s2 pot lua valori diferite de la eantion la eantion (de acelai volum sau de volume diferite) ceea ce ne

  • Sondajul statistic - 9 194

    d posibilitatea s-i interpretm ca pe nite variabile aleatoare cu valori i frecvene de apariie diferite.

    Caracteristica X poate fi asimilat cu o variabil aleatoare pe populaia cercetat statistic, ea nu este determinat probabilistic apriori i se mai numete variabil aleatoare teoretic. Dac variabila aleatoare X ia valori discrete, atunci legea ei de repartiie poate fi dat prin funcia frecvenelor relative cumulate. Dac variabila teoretic este continu, atunci legea ei de repartiie poate fi dat prin funcia de repartiie sau prin densitatea de repartiie.

    Am vzut c cele mai ntlnite legi de repartiie depind de anumii parametri, care au interpretri semnificative ca medie ,dispersie etc.

    Cnd o populaie statistic poate fi considerat din punct de vedere practic infinit, singura metod de cercetare a populaiei dup caracteristica X este cea a sondajului. Dac efectum msurtori asupra a n uniti statistice alese ntmpltor cu o aceiai probabilitate, atunci valorile nregistrate {x1 ,x 2 ,,x n } formeaz o valoare de observaie a variabilei n-dimensionale ( X1 ,X 2 ,,X n ), unde variabilele componente sunt independente, identic repartizate cu variabila teoretic asociat caracteristicii X.

    Variabilele X1 ,X 2 ,,X n fiind identic repartizate cu variabila teoretic X ( caracteristica populaiei ) au aceiai valoare medie i momente cu aceasta , numite i caracteristici numerice teoretice ale populaiei.

    S considerm sondajul ( selecia ) aleator { X 1 ,X 2 ,,X n }, atunci orice funcii de aceste variabile aleatoare S(X1 ,X 2 ,,X n ), numit funcie de selecie sau statistic, este la rndul ei o variabil aleatoare a crei funcie de selecie este unic determinat de funcia de repartiie a variabilei aleatoare X care a generat aceast selecie aleatoare. Pentru o realizare a sondajului (x 1 ,x 2 ,,x n ), S(x 1 ,x 2 ,,x n ) este un numr ce reprezint o realizare prin sondaj (selecie) a statisticii S(X 1 ,X 2 ,,X n ).

    Cunoaterea legii de repartiie a statisticii S(X 1 ,X 2 ,,X n ) este foarte important deoarece ea permite s se trag concluzii referitoare la caracteristica X a populaiei statistice din care a provenit selecia. Se numete repartiie exact a statisticii S = S n repartiia determinat pentru orice volum de sondaj n, iar prin repartiie asimptotic ( limit ) se nelege repartiia ctre care tinde repartiia exact cnd volumul n tinde ctre infinit.

    Repartiia exact a statisticii S este deosebit de util n cazurile n care se impune folosirea unor eantioane de volum redus ( n < 30 ). Dac volumul eantionului n este mai mare dect 30, atunci folosirea repartiiei asimptotice conduce de asemenea la rezultate suficient de precise. n general, este dificil de stabilit repartiia exact sau asimptotic a unei statistici. Aceasta este strns legat i unic

  • 9.1. Consideraii generale 195

    determinat de legea de repartiie teoretic a variabilei X cercetate prin sondaj X. Un caz important, prin faptul c este frecvent ntlnit in practica statistic, n care se pot determina repartiiile exacte pentru diferite statistici de sondaj, este cel n care repartiia teoretic a caracteristicii care a generat selecia este normal. n practic se ntlnesc de asemenea destul de multe situaii cnd populaia statistic are pentru o caracteristic o repartiie diferit de una normal i n acest caz determinarea repartiiilor exacte ale variabilelor de selecie este sau imposibil sau prezint dificulti practice deosebite. Dac volumul de selecie este foarte mare repartiiile limit ale variabilelor de selecie ofer avantaje practice foarte mari. n continuare prezentm repartiiile unor statistici de sondaj foarte importante pentru aplicaiile lor. Teorema 1. Dac (x 1 ,x 2 ,,x n ) este o selecie de volum n din o populaie statistic

    a crei caracteristic studiat este repartizat normal de parametrii m i , atunci media de selecie

    n

    x x xx n21 +++=

    are o repartiie normal de valoare medie m i dispersie n

    2.

    Teorema 2. Dac (x 1 ,x 2 ,,x k ) i (y 1 ,y 2 ,,y n ) sunt dou selecii independente de volum k i respectiv n din dou populaii ale cror caracteristici studiate au repartiii teoretice normale de parametrii m1 i 1 i respectiv m 2 i 2 , atunci variabila aleatoare diferen a mediilor de selecie x - y are o repartiie normal de valoare

    medie m1 - m 2 i abatere medie ptratic nk

    22

    21

    .

    Teorema 3. Dac (x 1 ,x 2 ,,x k ) i (y 1 ,y 2 ,,y n ) sunt dou selecii independente de volum k i respectiv n din dou populaii ale cror caracteristici studiate au repartiii teoretice normale de parametrii m1 i 1 i respectiv m 2 i 2 , iar x , y sunt mediile de selecie corespunztoare i

    1k1s21

    = k

    1

    2i )xx( , s

    22 =

    n

    1

    2i )yy(1n

    1 sunt dispersiile de selecie

    corespunztoare, atunci variabila aleatoare ( statistica) de sondaj

    nkkn

    2nks)1n(s)1k(

    )mm(yxt

    22

    21

    21+

    ++

    =

  • Sondajul statistic - 9 196

    are o repartiie Student cu k+n-2 grade de libertate. Ca o consecin a teoremelor referitoare la repartiiile limit se obin teoreme care stabilesc repartiiile asimptotice ale unor variabile aleatoare de sondaj obinute prin selecii dintr-o populaie oarecare. O astfel de teorem cu o importan deosebit n statistic este urmtoarea. Teorema 4. Dac (x 1 ,x 2 ,,x n ) este o selecie de volum n ce const din n observaii independente dintr-o populaie statistic a crei caracteristic studiat are o repartiie teoretic oarecare cu valoarea medie m i abaterea medie ptratic finite, atunci media de selecie

    n

    x xxx n21

    +++=

    are pentru n tinznd la , o repartiie normal de valoare medie m i dispersie n

    2.

    Dintre indicatorii care definesc statistic o anumit colectivitate, media are cel mai nalt grad de sintetizare a tuturor valorilor luate de o caracteristic. Din acest motiv se consider, ca principal msurtor al erorii de sondaj, diferena dintre media de selecie i media general a populaiei. Astfel eroarea de reprezentativitate datorat sondajului se poate msura n mod absolut prin :

    (9.1.1) e mx =

    Astfel definit, eroarea absolut de sondaj msoar deplasarea absolut a indicatorului de sondaj x , fa de indicatorul real m al ntregii populaii.

    Ponderea erorii absolute n raport cu valoarea real a parametrului populaiei este dat prin :

    (9.1.2) % 100m

    mx

    =

    Deci media eantionului x este reprezentativ pentru media ntregii populaii m dac :

    (9.1.3) %5100m

    mx

    Se disting prin coninutul lor, dou tipuri de erori de reprezentativitate i anume : a) erori de reprezentativitate sistematice, care provin din nclcarea principiilor

    corecte de alctuire a eantioanelor (fiecare unitate statistic trebuie s aibe aceeai ans de a face parte din eantion).

    b) erori ntmpltoare, care nu pot fi evitate, ele reflectnd natura procedeului de sondaj, ca cercetare parial a unui ntreg.

    S presupunem c dintr-o cercetare anterioar se cunoate media general a populaiei. Calculnd media unui eantion i comparnd cele dou medii spunem c

  • 9.1. Consideraii generale 197

    am calculat eroarea efectiv. Dac aceasta se ncadreaz n intervalul de variaie de 5% spunem c eantionul este suficient de reprezentativ. n foarte multe cazuri nu se dispune de o observare total, atunci se pot utiliza mai multe sondaje de prob prin care se verific stabilitatea mediei i dispersiei.