Author
lephuc
View
218
Download
1
Embed Size (px)
9. SONDAJUL STATISTIC
9.1. Consideraii generale
Creterea necesarului de informaii ce trebuie obinute cu maxim operativitate a condus la extinderea utilizrii sondajului statistic. Aceast expansiune a sondajului statistic se explic prin operativitatea i economicitatea obinerii datelor statistice. Mai mult sondajul statistic este caracteristic dezvoltrii libere, economiei de pia, aa cum rapoartele statistice sunt caracteristice economiilor centralizate. De asemenea n unele situaii practice din tehnic, economie, societate, sondajul statistic este singura metod de obinere a informaiilor statistice.
Prin sondaj statistic nelegem procedeul prin care se caracterizeaz o populaie statistic, pe baza cercetrii unei pri a acesteia, numit eantion, mostr sau uneori selecie, prelevat din populaia general cercetat.
Trebuie subliniat c toate afirmaiile, concluziile statistice stabilite pe baza datelor provenite dintr-un sondaj, nu pot fi considerate de tip determinist, ele avnd un caracter statistic, exist un risc ca ele s fie eronate, fiind efectuate n condiiile unei anumite probabiliti, deci cu un anumit nivel de ncredere.
Metodele sondajului statistic nu-i propun s elimine acest risc de eroare, ci s-l preevalueze, s determine probabilitile concluziilor exacte sau aproximative.
Sursa principal a erorilor de sondaj o constitue erorile de reprezentativitate a eantionului n raport cu populaia de ansamblu.
Prin reprezentativitate se nelege c, ntr-un numr mic de uniti care formeaz un eantion, s se gseasc aceleai trsturi eseniale ca n ntreaga populaie supus cercetrii.
Un sondaj care conduce la erori de maximum 5% fa de populaia de baz se consider suficient de reprezentativ.
Teoretic, eroarea de reprezentativitate poate fi redus orict de mult, odat cu creterea volumului eantionului pn la a ngloba ntreaga populaie. n acest caz dispar avantajele cercetrii prin sondaj (de cost, timp etc.).
S considerm o populaie statistic P de volum finit N i E P un eantion de volum n. Parametrii populaiei corespunztori unei caracteristici X, ca valoarea medie m, dispersia 2, pot lua o singur valoare, pe cnd parametrii corespunztori asociai unui eantion, pe care-i notm de obicei cu x , respectiv s2 pot lua valori diferite de la eantion la eantion (de acelai volum sau de volume diferite) ceea ce ne
Sondajul statistic - 9 194
d posibilitatea s-i interpretm ca pe nite variabile aleatoare cu valori i frecvene de apariie diferite.
Caracteristica X poate fi asimilat cu o variabil aleatoare pe populaia cercetat statistic, ea nu este determinat probabilistic apriori i se mai numete variabil aleatoare teoretic. Dac variabila aleatoare X ia valori discrete, atunci legea ei de repartiie poate fi dat prin funcia frecvenelor relative cumulate. Dac variabila teoretic este continu, atunci legea ei de repartiie poate fi dat prin funcia de repartiie sau prin densitatea de repartiie.
Am vzut c cele mai ntlnite legi de repartiie depind de anumii parametri, care au interpretri semnificative ca medie ,dispersie etc.
Cnd o populaie statistic poate fi considerat din punct de vedere practic infinit, singura metod de cercetare a populaiei dup caracteristica X este cea a sondajului. Dac efectum msurtori asupra a n uniti statistice alese ntmpltor cu o aceiai probabilitate, atunci valorile nregistrate {x1 ,x 2 ,,x n } formeaz o valoare de observaie a variabilei n-dimensionale ( X1 ,X 2 ,,X n ), unde variabilele componente sunt independente, identic repartizate cu variabila teoretic asociat caracteristicii X.
Variabilele X1 ,X 2 ,,X n fiind identic repartizate cu variabila teoretic X ( caracteristica populaiei ) au aceiai valoare medie i momente cu aceasta , numite i caracteristici numerice teoretice ale populaiei.
S considerm sondajul ( selecia ) aleator { X 1 ,X 2 ,,X n }, atunci orice funcii de aceste variabile aleatoare S(X1 ,X 2 ,,X n ), numit funcie de selecie sau statistic, este la rndul ei o variabil aleatoare a crei funcie de selecie este unic determinat de funcia de repartiie a variabilei aleatoare X care a generat aceast selecie aleatoare. Pentru o realizare a sondajului (x 1 ,x 2 ,,x n ), S(x 1 ,x 2 ,,x n ) este un numr ce reprezint o realizare prin sondaj (selecie) a statisticii S(X 1 ,X 2 ,,X n ).
Cunoaterea legii de repartiie a statisticii S(X 1 ,X 2 ,,X n ) este foarte important deoarece ea permite s se trag concluzii referitoare la caracteristica X a populaiei statistice din care a provenit selecia. Se numete repartiie exact a statisticii S = S n repartiia determinat pentru orice volum de sondaj n, iar prin repartiie asimptotic ( limit ) se nelege repartiia ctre care tinde repartiia exact cnd volumul n tinde ctre infinit.
Repartiia exact a statisticii S este deosebit de util n cazurile n care se impune folosirea unor eantioane de volum redus ( n < 30 ). Dac volumul eantionului n este mai mare dect 30, atunci folosirea repartiiei asimptotice conduce de asemenea la rezultate suficient de precise. n general, este dificil de stabilit repartiia exact sau asimptotic a unei statistici. Aceasta este strns legat i unic
9.1. Consideraii generale 195
determinat de legea de repartiie teoretic a variabilei X cercetate prin sondaj X. Un caz important, prin faptul c este frecvent ntlnit in practica statistic, n care se pot determina repartiiile exacte pentru diferite statistici de sondaj, este cel n care repartiia teoretic a caracteristicii care a generat selecia este normal. n practic se ntlnesc de asemenea destul de multe situaii cnd populaia statistic are pentru o caracteristic o repartiie diferit de una normal i n acest caz determinarea repartiiilor exacte ale variabilelor de selecie este sau imposibil sau prezint dificulti practice deosebite. Dac volumul de selecie este foarte mare repartiiile limit ale variabilelor de selecie ofer avantaje practice foarte mari. n continuare prezentm repartiiile unor statistici de sondaj foarte importante pentru aplicaiile lor. Teorema 1. Dac (x 1 ,x 2 ,,x n ) este o selecie de volum n din o populaie statistic
a crei caracteristic studiat este repartizat normal de parametrii m i , atunci media de selecie
n
x x xx n21 +++=
are o repartiie normal de valoare medie m i dispersie n
2.
Teorema 2. Dac (x 1 ,x 2 ,,x k ) i (y 1 ,y 2 ,,y n ) sunt dou selecii independente de volum k i respectiv n din dou populaii ale cror caracteristici studiate au repartiii teoretice normale de parametrii m1 i 1 i respectiv m 2 i 2 , atunci variabila aleatoare diferen a mediilor de selecie x - y are o repartiie normal de valoare
medie m1 - m 2 i abatere medie ptratic nk
22
21
.
Teorema 3. Dac (x 1 ,x 2 ,,x k ) i (y 1 ,y 2 ,,y n ) sunt dou selecii independente de volum k i respectiv n din dou populaii ale cror caracteristici studiate au repartiii teoretice normale de parametrii m1 i 1 i respectiv m 2 i 2 , iar x , y sunt mediile de selecie corespunztoare i
1k1s21
= k
1
2i )xx( , s
22 =
n
1
2i )yy(1n
1 sunt dispersiile de selecie
corespunztoare, atunci variabila aleatoare ( statistica) de sondaj
nkkn
2nks)1n(s)1k(
)mm(yxt
22
21
21+
++
=
Sondajul statistic - 9 196
are o repartiie Student cu k+n-2 grade de libertate. Ca o consecin a teoremelor referitoare la repartiiile limit se obin teoreme care stabilesc repartiiile asimptotice ale unor variabile aleatoare de sondaj obinute prin selecii dintr-o populaie oarecare. O astfel de teorem cu o importan deosebit n statistic este urmtoarea. Teorema 4. Dac (x 1 ,x 2 ,,x n ) este o selecie de volum n ce const din n observaii independente dintr-o populaie statistic a crei caracteristic studiat are o repartiie teoretic oarecare cu valoarea medie m i abaterea medie ptratic finite, atunci media de selecie
n
x xxx n21
+++=
are pentru n tinznd la , o repartiie normal de valoare medie m i dispersie n
2.
Dintre indicatorii care definesc statistic o anumit colectivitate, media are cel mai nalt grad de sintetizare a tuturor valorilor luate de o caracteristic. Din acest motiv se consider, ca principal msurtor al erorii de sondaj, diferena dintre media de selecie i media general a populaiei. Astfel eroarea de reprezentativitate datorat sondajului se poate msura n mod absolut prin :
(9.1.1) e mx =
Astfel definit, eroarea absolut de sondaj msoar deplasarea absolut a indicatorului de sondaj x , fa de indicatorul real m al ntregii populaii.
Ponderea erorii absolute n raport cu valoarea real a parametrului populaiei este dat prin :
(9.1.2) % 100m
mx
=
Deci media eantionului x este reprezentativ pentru media ntregii populaii m dac :
(9.1.3) %5100m
mx
Se disting prin coninutul lor, dou tipuri de erori de reprezentativitate i anume : a) erori de reprezentativitate sistematice, care provin din nclcarea principiilor
corecte de alctuire a eantioanelor (fiecare unitate statistic trebuie s aibe aceeai ans de a face parte din eantion).
b) erori ntmpltoare, care nu pot fi evitate, ele reflectnd natura procedeului de sondaj, ca cercetare parial a unui ntreg.
S presupunem c dintr-o cercetare anterioar se cunoate media general a populaiei. Calculnd media unui eantion i comparnd cele dou medii spunem c
9.1. Consideraii generale 197
am calculat eroarea efectiv. Dac aceasta se ncadreaz n intervalul de variaie de 5% spunem c eantionul este suficient de reprezentativ. n foarte multe cazuri nu se dispune de o observare total, atunci se pot utiliza mai multe sondaje de prob prin care se verific stabilitatea mediei i dispersiei.