Author
dohanh
View
256
Download
3
Embed Size (px)
coala Doctoral de Fizic Direcia de studii
Fizic atomic, Fizic nuclear,
Fizica particulelor elementare, Astrofizic
Fizic teoretic i experimental
- curs general -
Tema I
Statistic pentru Fizic nuclear i Fizica particulelor
elementare
1
ERORI EXPERIMENTALE.
METODE DE NREGISTRARE A DATELOR EXPERIMENTALE
I.1. Definiii. Tipuri de erori. Metode de aproximare
Definiie: Studiul msurtorilor fizice are ca obiect dezvoltarea posibilitilor de a
concepe experimente adecvate pentru nelegerea fenomenele fizice, furnizarea de tipuri
speciale de "instrumente" mentale i dezvoltarea de tipuri speciale de atitudini mentale care
rezult din forma corespunztoare i analiza diferitelor tipuri de msurtori cu privire, n
principal, la precizia i acurateea (corectitudinea) lor.
Orice experiment tiinific se bazeaz pe msurtori. Analiza experimentelor
conduce la fapte tiinifice care pot sau nu s fie puse sub semnul ntrebrii. Acelai fapt
tiinific poate fi pus n eviden prin diferite forme de investigare i, de aceea, este necesar
ca oamenii de tiin s aib un limbaj comun n prezentarea rezultatelor experimentale.
Pentru aceasta este necesar s existe metode precise i repetabile de prelucrare a datelor
experimentale [1-5].
Fizicienii trebuie s aib la ndemn metodele consacrate de investigare i prelucrarea
a datelor experimentale i de prezentare a rezultatelor experimentale, trebuie s cunoasc i s
foloseasc astfel de metode, avnd n vedere faptul c, n prezent, exist metode i ci de
obinere a unor rezultate experimentale sigure.
Un prim pas pe calea stabilirii unor rezultate experimentale sigure l reprezint
distingerea ntre erorile care afecteaz o msurtoare fizic i greelile care se pot face la
realizarea msurtorilor.
Greelile sunt datorate neateniei, neglijenei sau incompetenei experimentatorului.
Erorile sunt inerente oricrei metode sau tehnici de msurare. Pentru reducerea sau eliminarea
erorilor exist o serie de metode speciale.
Erorile se pot clasifica n dou categorii mari:
(a) erori sistematice;
(b) erori aleatoare (statistice).
Erorile sistematice se pot clasifica, la rndul lor, n urmtoarele tipuri: (i) erori
teoretice; (ii) erori instrumentale; (iii) erori personale.
2
Erorile sistematice de pot fi reduse, corectate sau chiar nlturate. Pentru toate acestea
exist metode speciale.
Erorile statistice sunt datorate fluctuaiilor. n cazul reducerii la minimul posibil sau
eliminrii erorilor sistematice se poate afirma c principala surs de eroare i de imprecizie
asupra unor msurtori fizice o reprezint erorile statistice. Acest fapt impune acordarea unei
atenii deosebite acestui tip de eroare i metodelor de calculare statistice asociate pentru
obinerea de rezultate experimentale ct mai sigure i precise.
Pentru a avea posibilitatea analizrii corecte a datelor experimentale trebuie s fie
respectate o serie de aspecte de interes la colectarea acestora. Un prim aspect de interes este
legat de modul de nregistrare a datelor experimentale. Aici trebuie avute n vedere
eliminarea evenimentelor care sunt afectate de greeli n timpul msurtorilor fizice, precum i
a celor afectate de erori prea mari. De asemenea, este necesar respectarea cu strictee a
procedurilor de msurare, citire i nregistrare a datelor experimentale. Un alt aspect este
determinat de modul de scriere a datelor experimentale i de legtura dintre forma de scriere
i eroarea de citire specific aparaturii folosite n experiment. Trebuie avut n vedere faptul
c o practic comun este ca eroarea de citire a unui instrument s fie considerat diviziunea
cea mai mic posibil i observabil n experiment.
Corectitudinea unei msurtori poate fi descris folosind 2 termeni: (a) acurateea
(exactitatea); (b) precizia. n general, noiunea de acuratee este legat de erorile
sistematice, iar noiunea de precizie de erorile statistice.
n prezent nu exist un experiment care s nu fie afectat de erori. De aceea, nu se
poate determina valoarea adevrat a unei mrimi i numai o valoare care se stabilete cu o
anumit acuratee sau precizie. Acestea din urm impun un anumit numr de cifre
semnificative la scrierea valorii mrimii fizice determinate experimental. Dac aceast valoare
este folosit n diferite calcule este necesar ca numrul de cifre semnificative s se conserve.
Acolo unde este cazul, dup calcule, se va proceda la rotunjiri pentru a pstra numrul de
cifre semnificative. Pstrarea numrului de cifre semnificative, precum i rotunjirea numerelor
se face cu respectarea unor reguli care permit s nu se introduc erori suplimentare
semnificative asupra rezultatelor finale.
Pentru aceasta este necesar s se ia n considerare urmtoarele relaii de calcul pentru
cazul n care se folosesc mrimi fizice determinate n experimente:
3
(1+x)n = 1 + nx + n(n-1)x
2/2 +
(1+a)l(1+b)
m(1+c)
n = 1 + la + mb + nc , a,b,c
4
Curba de fit d legtura dintre variabilele msurate. De obicei, curba de fit se traseaz
printre punctele experimentale. La trasarea ei se respect anumite reguli i se folosesc anumite
metode specifice.
Cel mai important aspect este s se gseasc o ecuaie matematic care s fit-eze
curba respectiv. n acest mod se poate obine mult mai mult informaie. La obinerea
ecuaiilor matematice se pleac de la cea mai simpl form - cea a liniei drepte - mergnd spre
forme din ce n ce mai complicate. Legea liniei drepte este destul de des ntlnit n Fizic i, n
particular, n Fizica nuclear, deoarece numeroase date experimentale urmeaz n mod natural
o astfel de dependen sau pot fi puse ntr-o form care s urmeze o astfel de dependen.
De exemplu, timpul de njumtire se poate obine din curbele de dezintegrare punnd relaia
dintre vitezele de numrare adevrate - R = Roe-t
- sub forma ln R = ln Ro - t [6].
Multe din legile Fizicii nu sunt ns liniare. n acest caz sunt dou aspecte care trebuie
avute n vedere, anume:
(a) legea neliniar de variaie este cunoscut din considerente teoretice; n acest caz
problema care se pune este aceea de a stabili constantele ecuaiei matematice prin fit-area
datelor experimentale;
(b) legea nelinar de variaie nu este cunoscut; de data aceasta se pune problema
efecturii unei aproximaii empirice la datele experimentale.
Remarc. Introducerea de mai muli termeni n funcia de fit mrete posibilitatea de a sesiza
imprecizia aproximaiei utilizate n problemele de tip (b).
n analiza datelor experimentale un rol fundamental l au metodele statistice. Ele dau
o metod clar de a construi o linie dreapt ca rezultat al unui fit la datele experimentale
(metoda celor mai mici ptrate, de exemplu) i pun la dispoziia fizicianului testele necesare
pentru stabilirea unui fit corect n toate situaiile [1-6].
Pentru o mai corect nelegere a acestor aspecte n cele ce urmeaz vor fi prezentate
unele aspecte legate de noiuni de teoria probabilitilor i statistic matematic.
5
Bibliografie
[1]. H.G.Worthing, J.Geffner - Prelucrarea datelor experimentale, Editura Tehnic, Bucureti,
1959
[2]. B.R.Martin - Statistics for Physicists - Academic Press, London and New York, 1971
[3]. A.Solmitz - Annual Review of Nuclear Science (1963)
[4]. W.T.Eadie et al - Statistical Methods in Experimental Physics, North-Holland Publishing
Company, Amsterdam, 1971
[5]. F.James - Proceedings of the 1970 CERN Computing and Data Processing School - Via
Monastero, Varenna, Italy, 30 August-12 September 1970 - Preprint CERN 71-6 (1971)
[6]. Colectiv de catedr - Fizic nuclear - ndrumtor de laborator, Tipografia Universitii
Bucureti, 1987
[7]. Louis Lyons Statistics for nuclear and particle physicists Cambridge University Press,
1992
6
NOIUNI DE TEORIA PROBABILITILOR
II.1. Noiuni fundamentale
Pentru analiza datelor experimentale, prelucrarea lor i prezentarea rezultatelor
experimentale este important definirea noiunii de probabilitate. Trebuie avute n vedere
dou ci de definire a probabilitii: calea matematic, respectiv, calea fizic. Pentru
discutarea acestor probleme este necesar definirea unor noiuni [1-6].
Fie un set de condiii iniiale, reproductibile, care definesc un experiment. Prin
realizarea unei observaii sau a unui set de observaii se produce un efect (rezultat) al
experimentului. Fie xi, cu i = 1,2,,n, rezultatele experimentului. Trebuie menionat c
mrimile xi pot fi numere sau seturi de numere.
Definiie Setul tuturor rezultatelor posibile {xi} (i = 1,2,,n) ale unui experiment se numete
spaiul probelor sau populaie, iar xi este un punct din acest spaiu. Se noteaz n modul
urmtor:
S = {xi/i = 1,2,,n}
Definiie Un subset de puncte din populaie {xk}, cu k = 1,2,,m, unde m < n, se numete
eveniment. Se noteaz astfel: E = {xk/k = 1,2,,m}.
Atunci cnd m = n toat populaia este inclus n eveniment. Realizarea unui
eveniment nseamn c un punct din populaie este inclus n subsetul de puncte din populaie
care definesc un anumit eveniment.
Calea matematic presupune definirea unei populaii cu proprieti specifice. n acest
caz, teoria probabilitilor se dezvolt axiomatic i implic stabilirea exact a parametrilor i
naturii populaiei [7,8].
Calea fizic este strns legat de situaiile reale, situaii n care parametrii i natura
populaiei sunt foarte rar cunoscute. De aceea, scopul analizei statistice este tocmai acela de
a stabili natura populaiei din care face parte eantionul (proba, mostra,) de date
experimentale, precum i valorile parametrilor populaiei. n acest mod se ncearc gsirea
acelei expresii matematice care descrie corect o anumit situaie cnd se cunoate o anumit
parte a populaiei [1-4]. n acest caz se introduc probabiliti operaionale, iar rezultatele
obinute se prezint n termenii acestor probabiliti.
7
Definiie Se consider o secven de n ncercri (extrageri, probe) n care evenimentul E se
realizeaz de nE ori. Raportul nE/n se numete frecven relativ a unui eveniment E, de
clas dat. Se noteaz cu R[E].
Probabilitatea P[E] a unui eveniment E este limita lui R[E], cnd n crete nedefinit,
presupunnd c limita exist.
Aceasta este definiia fizic a probabilitii. Limitrile sunt determinate de faptul c se poate
realiza doar un numr finit de ncercri (extrageri).
n terminologia curent se mai ntlnete noiunea de probabilitate "a posteriori",
respectiv, cea de probabilitate "a priori". Prima este legat de observaiile experimentale, iar
cea de a doua de modelarea matematic a unui eveniment.
Conform definiiilor i comentariilor de mai sus se poate defini probabilitatea unui
eveniment E ca un numr cuprins n intervalul nchis [0,1] pentru care se realizeaz
condiia:
0 P[E] 1.
Dac E S, atunci P[E] = 1.
Complementul unui eveniment E se noteaz prin E*.
Definirea evenimentelor s-a fcut folosind noiuni specifice mulimilor. De aceea se
poate defini intersecia i reuniunea a dou evenimente. Rezultatul interseciei a dou
evenimente A i B este un eveniment de tip "A sau B", iar reuniunea acestor evenimente d un
eveniment de tip "A i B". Ele au reflectri diferite n teoria probabilitilor. Dou evenimente
sunt distincte dac intersecia lor este mulimea vid.
Se poate defini o probabilitate condiional, anume: dac un eveniment poate rezulta
din n efecte reciproc exclusive - realizarea unui eveniment exclude realizarea celorlalte - i
egale ca posibiliti de realizare, din care nB corespund la realizarea evenimentului B, iar
nAB corespund la realizarea evenimentului A, n condiiile n care evenimentul B s-a realizat,
atunci probabilitatea unui eveniment A obinut dup realizarea unui eveniment B este:
P[A / B] = n
n
AB
A
i se numete probabilitate condiional a evenimentului A.
Expresia probabilitii condiionale a lui A se mai poate scrie astfel:
P A BP A B
P B[ / ]
[ ]
[ ]
8
Evenimentele se pot clasifica dup diferite criterii. Fie A, B, C trei criterii de
clasificare. n aceste condiii se poate defini probabilitatea marginal.
Dac clasificrile n criterii sunt A1, A2, , Ar, B1, B2, , Bs i C1, C2, , Ct, iar condiia:
P A P B P Cj k ll
t
k
s
j
r
[ ] [ ] [ ]
1111
este ndeplinit, atunci probabilitatea marginal a lui Aj i Cl se definete astfel:
P A C P A B Cj l j k lk
s
[ ] [ ]
1
.
Se poate defini i probabilitatea marginal a lui Cl prin relaia urmtoare:
P C P A B C P A C P B Cl j k l j l k lk
s
j
r
k
s
j
r
[ ] [ ] [ ] [ ]
1111
.
Pe baza noiunilor definite pn n prezent se poate defini independena
evenimentelor, astfel:
Evenimentul A este independent de evenimentul B dac P A B P AP A P B
P B[ / ] [ ]
[ ] [ ]
[ ] .
Folosind relaia de definiie de mai sus se pot scrie urmtoarele relaii:
P[A*] = 1 - P[A],
P[AB] = P[A].P[B/A] = P[A].P[B],
P[AB] = P[A] + P[B] - P[AB].
Dac evenimentele A i B sunt independente se poate scrie urmtoarea relaie:
P[AB] = P[A] + P[B] - P[AB] = P[A] + P[B].
Pentru analiza i prelucrarea datelor experimentale teorema lui Thomas Bayes - care
dateaz din anul 1763 - este destul de des folosit. Enunul acestei teoreme este urmtorul:
Dac Bi (i = 1,2,,n) sunt evenimente exclusive reciproc i exhaustive - adic, toate
evenimentele posibile sunt incluse n Bi - i dac evenimentul A se poate realiza numai n
combinaie cu unul din cele n evenimente Bi, atunci:
P B AP B P A B
P B P A Bi
i i
j jj
n[ / ][ ]. [ / ]
( [ ]. [ / ])
1
Teorema Bayes d probabilitatea "a posteriori" de a avea evenimentul Bi cnd
evenimentul A este cunoscut i realizat. Mrimea P[Bi/A] se numete verosimilitate. Se alege,
n general, acea situaie care are cea mai mare probabilitate "a posteriori" i, de aceea,
9
metoda se mai numete metoda verosimilitii maxime. Pentru folosirea metodei este necesar
s se cunoasc i probabilitile "a priori" P[Bi]. Trebuie menionat faptul c aceste
probabiliti sunt - pentru cele mai multe situaii de interes - necunoscute. Prin teorema Bayes
toate probabilitile "a priori" sunt luate egale.
Aceast teorem, alturi de aranjamente, permutri i combinri, este de mare utilitate
n procesul complex i delicat al deducerii statistice.
II.2. Parametrii populaiei
ntr-un experiment nu se dispune de o populaie complet ci numai de diferite probe
(eantioane, mostre) care reprezint submulimi (subseturi) ale populaiei totale. Problema
fizic care se pune este cea a estimrii proprietilor pornind de la natura probei prin
deducie statistic.
Printre cei mai folosii parametrii ai populaiei se numr: media aritmetic, mediana
(valoarea median), modul, abaterea medie, variana, abaterea standard, momentele
asociate de diferite ordine.
Media aritmetic a unui set de N valori xi (i = 1,2,,N) se definete prin relaia de
mai jos:
m
x
Na
jj
N
1
. (II.1)
Dac mrimile x1,x2,,xN sunt aranjate n ordine cresctoare sau descresctoare i
sunt renumerotate ca x(1),x(2),,x(N) se definete mediana ca valoarea de mijloc a noului set -
pentru N numr impar - respectiv, ca valoarea de mijloc a perechii mijlocii - pentru N numr
par.
Un alt parametru de interes este modul. Acesta reprezint acea valoare din setul de
x1,x2,,xN care se realizeaz cu frecven maxim.
Pentru a avea o msur a dispersiei datelor i rezultatelor experimentale se pot folosi
mai muli parametrii ai populaiei. Ca i cei definii anterior ei dau o msur a localizrii.
Media aritmetic a valorilor absolute ale abaterilor observaiilor de la median (mm)
se numete abatere medie i are urmtoarea expresie:
10
m
j m
j
N
x m
N
1
. (II.2)
Variana unei populaii - notat prin 2 - se definete ca media aritmetic a
abaterilor mrimilor xi, din setul dat, de la media aritmetic, ma. Relaia de definiie are
urmtoarea form:
2
2
1
( )x m
N
i ai
N
. (II.3)
De interes n analiza datelor experimentale i n prezentarea rezultatelor experimentale
este abaterea standard, . Ea se definete ca rdcina ptrat a varianei.
O alt mrime de interes este coeficientul de variaie, definit ca raportul dintre
abaterea standard i media aritmetic, anume /ma.
Alturi de mrimile menionate mai sus, de mare interes n analiza datelor
experimentale i n obinerea de informaii dinamice n ciocniri nucleare la diferite energii, cu
deosebire la energii relativiste, sunt momentele asociate unei distribuii de probabilitate
specifice unei anumite populaii. Se folosesc mai multe tipuri de momente. Dintre aceste de
mare interes sunt momentele simple (ordinare) i momentele factoriale.
Dac momentele simple sunt calculate n raport cu un punct arbitrar m se obin
momentele simple (ordinare) necentrate definite astfel:
m
x m
Nk
i
k
i
N
'
( )
1
. (II.4)
Trebuie subliniat aici c momentul simplu necentrat de ordinul nti este egal cu valoarea
medie (media aritmetic).
Atunci cnd punctul ales este chiar valoarea medie ma se obin momentele simple (ordinare)
centrate:
m
x m
Nk
i a
k
i
N
( )1
. (II.5)
Trebuie menionat aici faptul c ntre cele dou tipuri de momente simple exist
urmtoarele relaii de recuren:
11
m C m mk kj
k j
j
j
k
' '( )10
, (II.6.1)
m C m mk kj
k j
j
j
k
' ( )
10
. (II.6.2)
Momentele factoriale se definesc prin relaia urmtoare:
( ) ( )n n pk k nn k
, (II.7)
unde (n)k = n(n-1)(n-k+1).
Caracteristicile generale ale populaiei sunt reflectate i de civa parametrii care pot fi
definii n funcie de valorile momentelor asociate [2-5,8,9]. Fiind determinai de forma
distribuiei de probabilitate care descrie populaia ei pot fi legai de indicatorii de form [2-
5,8,9].
Parametrul de asimetrie se definete prin urmtorul raport:
1 = m32/m2
3 . (II.8)
La definirea acestui parametru care indic abaterea de la forma simetric a populaiei s-a avut
n vedere faptul c pentru o populaie distribuit simetric n jurul valorii medii momentul
simplu centrat de ordinul al III-lea este nul (m3 = 0).
Un alt parametru important este parametrul de formare de maxime. Ele se poate
defini tot cu ajutorul momentelor simple centrate de ordin superior. Relaia de definiie este
urmtoarea:
2 = m4/m22 . (II.9)
Acest parametru ia valori standard pentru populaii diferite.
Toi parametrii menionai anterior sunt extrem de utili n analiza statistic a datelor
experimentale, precum i n descrierea dinamicii diferitelor ciocniri hadronice [9-11]. Ei sunt
strns legai de noiunea de distribuie, n general, i de distribuie de probabilitate, n
particular. De aceea, n cele ce urmeaz vor fi abordate cteva aspecte legate de aceast
noiune.
II.3. Distribuii pentru populaii. Legturi cu momente i cumulani
Noiunea de distribuie este strns legat de noiunea de variabil aleatoare. Se
definete variabila aleatoare ca o funcie care poate lua o valoare definit n orice punct din
12
populaie (spaiul probelor).
Fie o populaie SP cu o funcie de probabilitate P i o variabil aleatoare X care este
definit n populaia respectiv. n aceste condiii pentru fiecare punct din populaie (spaiul
probelor) - x SPi - se poate stabili o probabilitate P[xi] i o valoare numeric definit, X(xi),
pentru o variabil aleatoare. Variabila aleatoare poate fi continu sau discret.
Pentru o variabil aleatoare continu x se poate introduce o funcie de densitate de
probabilitate (funcie de densitate), f(x). Acest lucru este posibil numai dac sunt satisfcute
urmtoarele condiii:
(i) f(x) este un numr real, nenegativ, unic, pentru toate valorile reale ale lui x;
(ii) f(x) este normat la unitate, anume:
f x dx( )
1, (II.10);
(iii) probabilitatea cu care x cade ntre orice dou valori reale a i b - pentru care a
13
(c) momentele simple, centrate i necentrate, de ordin k:
m f x x m dxk ak
( )( ) , (II.15.1)
m f x x m dxkk' ( )( )
. (II.15.2)
Remarc. Pentru variabilele discrete se folosesc relaii de definiie similare n care
integralele trec n sume. De exemplu,
m f x x mk j j ak
j
( )( )1
, (II.15.1')
m f x x mk j jk
j
' ( )( )
1
. (II.15.2')
n analiza statistic a datelor experimentale este de interes cunoaterea valorii
ateptate pentru un anumit tip de populaie. Pentru o variabil aleatoare continu x care are o
funcie de densitate f(x) valoare ateptat a lui x, A[x], se poate defini astfel:
A x xf x dx
x
[ ] ( )
, (II.16)
Pentru o funcie g(x) a lui x se poate scrie:
A g x g x f x dx
x
[ ( )] ( ) ( )
, (II.17)
Din relaiile de mai sus rezult urmtoarele relaii de legtur:
A[c] = c,
A[cg(x)] = cA[g(x)],
A[g1(x) + g2(x)] = A[g1(x)] + A[g2(x)],
A[g1(x).g2(x)] = A[g1(x)].A[g2(x)].
(II.18)
unde c = constant.
Relaii similare se pot scrie pentru momentele de diferite tipuri i diferite ordine.
Cunoaterea primelor cteva momente, n practic, determin caracteristicile eseniale
ale distribuiei. De aceea, este util s se stabileasc o metod general de determinare a
momentelor de orice ordin. Pentru aceasta este necesar introducerea unei funcii speciale,
numit funcie generatoare de momente (f.g.m.).
Funcia generatoare de momente simple necentrate se definete astfel, dac variabila
14
aleatoare x are funcia de densitate f(x):
M z A e e f x dxxxz xz( ) [ ] ( )
. (II.19)
Pentru momentele de diferite ordine se dezvolt n serie exz
i se obine, dac m = 0:
M z A xz xzn
m zx nn
n
( ) [!( ) .....]
!'
11
2
12
0
. (II.20)
Dac relaia (IV.20) se difereniaz de n ori i se calculeaz pentru z = 0, atunci se obine
urmtoarea relaie general pentru momentele simple necentrate de ordin n:
mM z
zn
n
x
n
z
'( )
0
. (II.21)
Funcia generatoare de momente simple, n jurul oricrui punct m, se poate scrie
astfel:
M z A exx m z( ) [ ]( ) . (II.22)
Pentru funcia generatoare de momente simple centrate se definete n modul urmtor:
M z e M zmm z
xa( ) ( ) . (II.23)
Logaritmii funciilor generatoare de momente sunt folosii pentru definirea
cumulanilor de diferite ordine. Fie dezvoltarea n serie Taylor a ln Mx(z):
ln ( )!
.....M t k z kz
x 1 2
2
2 , (II.24)
unde kM z
zi
i
x
i
z
( )
0
reprezint cumulanii de ordin i. Pentru fiecare tip de moment se pot
defini cumulani corespunztori.
Exist distribuii pentru care nu se pot defini astfel de funcii simple. n aceste situaii
se introduce funcia caracteristic, x(t). Dac variabila aleatoare x are funcia de densitate
f(x), atunci se poate defini urmtoarea funcie caracteristic:
15
xixz ixz
xz A e f x e dx M iz( ) [ ] ( ) ( )
. (II.25)
Legtura dintre funcia de densitate i funcia caracteristic este dat de teorema
urmtoare, numit teorema de inversie: dac f(x) este o funcie de densitate cu o funcie de
distribuie continu peste tot i are o funcie caracteristic x(t), definit prin relaia (II.25),
atunci:
f x z e dzxixz( ) ( )
1
2 . (IV.26)
Relaia (IV.26) reprezint transformata Fourier.
Observaii
1. Toate mrimile i noiunile introduse pn n prezent se pot extinde i pentru
distribuii de mai multe variabile. n acest caz variabila aleatoare x devine un vector de n
componente, iar integralele, respectiv, sumrile se vor face n spaii cu n dimensiuni,
respectiv, dup n indici.
2. Dac variabila aleatoare este o funcie de o variabil x, y({x}), iar y({x}) este o
funcie monoton, atunci funcia de densitate se poate fi scris sub forma urmtoare:
f y x f x ydx
dy( { }) ( { }) . (II.27)
3. Exist cazuri n care funcia de densitate se calculeaz numai dac sunt satisfcute
condiiile:
(i) dy/dx 0;
(ii) y = y({x}) are o soluie real, finit, iar expresia este de forma:
f y x f x ydy
dxx( { }) ( { })
1
. (IV.28)
n cazurile n care condiiile de mai sus nu sunt respectate f(y{x}) = 0.
Din multitudinea de distribuii folosite n Fizica nuclear, Fizica particulelor elementare
i Fizica nuclear relativist cele mai des folosite sunt: distribuia Poisson, distribuia
binomial, distribuia Gauss i distribuia binomial negativ [1-9]. n multe situaii de
interes sunt utile combinaii ale acestor distribuii [2,4,5,9,11,12]. Unele aspecte de interes
legate de aceste distribuii vor fi considerate n curs i n diferitele lucrri de laborator incluse
n acest manual.
16
Bibliografie
[1]. H.G.Worthing, J.Geffner - Prelucrarea datelor experimentale, Editura Tehnic, Bucureti,
1959
[2]. B.R.Martin - Statistics for Physicists, Academic Press, London and New York, 1971
[3]. A.Solmitz - Annual Review of Nuclear Science (1963)
[4]. W.T.Eadie et al - Statistical Methods in Experimental Physics, North-Holland Publishing
Company, Amsterdam, 1971
[5]. F.James - Proceedings of the 1970 CERN Computing and Data Processing School - Via
Monastero, Varenna, Italy, 30 August-12 September 1970 - Preprint CERN 71-6 (1971)
[6]. Colectiv de catedr - Fizic nuclear - ndrumtor de laborator, Tipografia Universitii
Bucureti, 1987
[7]. B.Gndenko - Theory of probability, MIR , Moscow,1982
[8]. Gh.Mihoc, V.Craiu - Tratat de Statistic matematic, Editura Academiei RSR, Bucureti,
1981
[9]. P.Carruthers, C.C.Shih - International Journal of Modern Physics A2(5)(1987)1447-1547
[10].Isac Stern - Tez de doctorat, IFIN Bucureti-Mgurele, 1981
[11].Al.Jipa - Tez de doctorat, Facultatea de Fizic, Universitatea Bucureti, 1989
[12].Al.Jipa, C.Beliu, R.Zaharia, A.M.David - Journal of Physics G: Nuclear and Particle
Physics 22(2)(1996)221-230
17
PROBE EXPERIMENTALE DIN POPULAII
III.1. Noiuni fundamentale
O problem major n deducerea statistic este legat de faptul c ntr-un experiment
nu se poate avea acces la ntreaga populaie. ntr-un experiment se are acces la o parte din
populaie, parte care se numete eantion (prob sau mostr) din populaie [1-8]. Din
aceast cauz este foarte important s se aleag corect metoda de caracterizare a probei,
astfel nct concluziile asupra populaiei s rmn relativ stabile de la o prob la alta.
Acest lucru nseamn c parametrii variaz puin de la o prob la alta.
Proprietile de dorit pentru diferite probe din populaii sunt legate de o serie de
definiii i teoreme.
Se definete o prob de dimensiune n ca fiind setul de valori numerice x1, x2, , xn
pentru cele n observaii selectate dintr-un set mai mare.
Statistica reprezint o valoare numeric determinat din prob. Tot prin statistic se
nelege totalitatea valorilor probei.
Media unei probe de dimensiune n, , se calculeaz astfel:
mn
xap
ii
n1
1
. (V.1)
Pentru proba de dimensiune n considerat se poate calcula variana folosind urmtoarea
relaie:
p i ap
j
n
nx m2 2
1
1
1
( ) . (V.2)
p p2
reprezint abaterea standard a probei experimentale.
Not. Factorul 1/N folosit n definirea varianei populaiei se nlocuiete n cazul varianei
probei experimentale prin factorul 1/(n-1) pentru a avea asigurri c valoarea ateptat a
ntregii statistici de un tip dat, calculat pentru o prob experimental de dimensiune n, va fi
egal cu parametrul corespunztor pentru populaie.
Fie o prob aleatoare de dimensiune n - x1, x2, , xn - cu o funcie de densitate f(x).
n acest caz, funcia de distribuie a unei probe statistice y(x1, x2, , xn), este dat de o relaie
de forma urmtoare:
18
F y f x dxj jj
n
( ) ... ( )
1
. (III.3)
Observaii
(a) Integrarea se face pentru regiunea n care y y(x1, x2, , xn).
(b) Se poate considera c y(x1, x2, , xn) este o nou variabil. n acest caz se aleg (n-1)
variabile - funcii de xj - astfel nct integrandul n-dimensional din relaia (V.3) s ia o form
simpl.
(c) n foarte multe lucrri de interes din domeniu se folosete convenia urmtoarea:
parametrii populaiei sunt notai cu litere greceti, iar parametrii probei experimentale din
populaie sunt notai cu litere latine.
III.2. Distribuii asociate probelor experimentale
Fie o prob, PS, de n observaii xj (j = 1,2,,n) selectate la ntmplare. Proba
experimental PS se numete prob aleatoare cu nlocuire sau prob aleatoare simpl dac -
n general - observaia xn-1 este napoiat populaiei nainte ca observaia xn s fie selectat.
Dac observaia xn-1 nu este napoiat populaiei, atunci PS este numit prob aleatoare fr
nlocuire. n cele mai multe situaii de interes se ntlnete cea de a doua situaie.
Legturile dintre parametrii populaiei i parametrii probei experimentale sunt
exprimate n cteva teoreme de interes.
Teorema I. Fie N dimensiunea unei populaii finite i fie n dimensiunea unei probe
experimentale fr nlocuire. n acest caz, pentru toate probele experimentale de dimensiune
n, media mediilor este egal cu media populaiei, iar variana mediilor este egal cu
variana populaiei nmulit cu un factor (N-n)/[n(N-1)].
Conform teoremei de mai sus se poate scrie:
1.
22
N
nN
n
mm
p
a
p
a
. (III.4)
Remarc. Dac proba este cu nlocuire, atunci relaiile de mai sus, (V.4), se modific astfel:
.2
2
n
mm
p
a
p
a
. (III.5)
19
Observaie. Pentru populaii discrete infinite se realizeaz numai relaiile (III.5), indiferent
de tipul probei.
Pentru unele populaii continue infinite este util urmtoarea teorem:
Teorema II. Fie x o variabil aleatoare continu distribuit cu media , variana 2 i
funcia de densitate f(x). Fie nite probe aleatoare de dimensiune n scoase din aceast
distribuie. Atunci distribuia asociat mediilor are media egal cu media populaiei,
ma, i variana, p2, egal cu variana populaiei, 2, nmulit cu un factor 1/n.
Conform teoremei de mai sus sunt ndeplinite relaiile:
.2
2
n
mm
p
a
p
a
. (III.6)
Cele dou teoreme conduc la urmtoarea concluzie: pe msur ce dimensiune probei
crete variana mediei probei descrete, astfel nct probabilitatea ca media probei s fie o
estimare bun a mediei populaiei crete. Aceast concluzie este strns legat de legea slab
a numerelor mari. Enunul acestei legi este urmtorul:
Fie xi o populaie de variabile aleatoare independente cu media ma i varian finit.
Fie media unei probe de dimensiune n, definit prin relaia:
mn
xap
jj
n1
1
. (III.7)
Atunci, pentru orice valori date > 0 i 0 < < 1, exist un numr ntreg n, astfel nct,
pentru toate numerele m n, este satisfcut relaia:
P m m map
a[ ( ) ] 1 . (III.8)
Legea numerelor mari este o consecin (un caz special) de inegalitate Cebev.
Teorema asociat acestei inegaliti se enun astfel:
Fie f(x) o funcie de densitate pentru o populaie cu media ma i variana finit 2.
Fie p orice numr pozitiv i fie media unei probe aleatoare de dimensiune n obinut
din f(x). n acest caz este satisfcut relaia:
P m m mp
n pa
p
a[ ( ) ]
11
2 . (III.9)
Teoremele enunate anterior permit s se introduc una din cele mai importante
20
teoreme pentru analiza statistic, anume: teorema limitei centrale. Teorema se aplic att
pentru distribuii discrete ct i pentru distribuii continue i se enun n modul urmtor:
Fie variabilele aleatoare independente xi, de funcie de densitate necunoscut, identic
distribuite, cu media ma i variana 2, ambele finite. Atunci, distribuia avnd media probei
tinde la distribuia normal cu media ma i variana
2/n, cnd n devine mare. Dac
u(t) este forma standard a distribuiei normale, atunci, pentru t1 i t2 arbitrari, se realizeaz
urmtoarea relaie de legtur:
lim { } ( )n
a
p
a
t
t
P tm m
n
t u t dt
1 21
2
. (III.10)
O alt teorem de interes este urmtoarea:
Fie l a xj jj
n
1
, unde aj sunt constante reale i xj sunt variabile aleatoare cu media ma,
variana 2 i covariane ij (i,j = 1,2,,n i ij). Atunci
m a ml j jj
n
1
, (III.11)
l j j j k kj kj
n
a a a2 2 2
1
2
. (III.12)
Dac variabilele aleatoare xj sunt independente, atunci:
l j jj
n
a2 2 2
1
. (III.13)
Odat stabilite aceste reguli teoretice importante pentru analiza statistic este necesar
gsirea unei "puni" cu diferite situaii experimentale concrete.
21
III.3. Erori experimentale.
Formula de propagare a erorilor
Dup cum s-a artat anterior ntr-un experiment nu se poate determina valoarea
unei mrimi cu o precizie absolut. Cu alte cuvinte nu se pot reduce erorile fcute n
msurtori la zero. n acest context este important s se gseasc "puni de legtur" ntre
statistica teoretic i diferitele situaii experimentale i, mai ales, modaliti de aplicare n
situaii concrete.
nainte de a trece la aceste trebuie reamintit faptul c prin precizie - n statistica datelor
i rezultatelor experimentale - se are n vedere micimea erorilor, iar prin exactitatea
(acuratee, corectitudine) se definete devierea (abaterea) observaiei de la valoarea
"adevrat" - n ipoteza c are sens acest concept.
n mod convenional, ca msur a erorilor aleatoare (ntmpltoare) se folosete
abaterea standard, . De multe ori, n practic, ea mai este denumit i eroare standard.
Trebuie menionat aici c n anumite situaii se mai folosete i conceptul de eroare probabil,
definit prin urmtoarea relaie:
f x dxm p
m p
a
a
( )
1
2 . (III.14)
Determinarea valorii unei mrimi din date i rezultate experimentale afectate de diferite
erori impune stabilirea unei metode sigure i repetabile de calculare sau estimare a erorii de
care este afectat mrime respectiv. Aceast metod poart numele de legea propagrii
erorilor.
Fie y=y(p)=y(p1,p2,,pm) o funcie de m parametri pj (j=1,2,,m). Dac se dorete
cunoaterea erorii experimentale asupra lui y, atunci cnd se cunosc erorile experimentale
asupra lui pj, este necesar s se ia n considerare valorile "adevrate" pentru parametrii pj. Fie
pj* aceste valori "adevrate". n acest caz, dac mrimile (pj-pj
*) sunt mici, atunci funcia
y=y(p)=y(p1,p2,,pm) se poate dezvolta n serie Taylor n jurul punctului p=p*. Se obine
urmtoarea expresie:
y p y p p py p
pj j
j
m
jp p
( ) ( ) ( )( )
.....* *
*
1
. (III.15)
Observaie. Pentru valori mici ale diferenei (pj-pj*) se poate considera numai aproximaia de
22
ordinul nti n dezvoltarea Taylor.
Variana mrimii y(p) se poate scrie sub forma urmtoare:
var[ ( )] [[ ( ) [ ( )]] ] [[ ( ) ( )] ]*y p A y p A y p A y p y p 2 2 . (III.16)
Elementele matricei de varian au expresii de forma:
V A p p p pij i i j j [( )( )]* * . (III.17)
Fie (y)2=var[y(p)]. Atunci se poate scrie urmtoarea relaie, lund n considerare mrimile
calculate anterior:
( ) {( ) ( )
}* *
yy p
pV
y p
pi
m
ij
m
p p
ij
jp p
2
1 1
. (III.18)
Relaia (V.18) este cunoscut sub numele de formula de propagare a erorilor.
n cazul unor erori necorelate este ndeplinit urmtoarea relaie pentru covarian:
cov( )p pi j 0 . (III.19)
De aceea, Vij = 0 - pentru ij, respectiv, Vij = (pi)2 - pentru i=j. n acest caz, formula de
propagare a erorilor, pentru erori necorelate se poate scrie astfel:
( ) [( )
]*
yy p
pp
i p p
i
i
m2 2
1
. (III.20)
Remarc. La utilizarea formulei de propagare a erorilor, indiferent de form - (III.18) sau
(III.20) - trebuie ca s se analizeze dac mrimile pi sunt suficient de mici pentru a se putea
aplica formula lui Taylor, de dezvoltare n serie.
23
III.4. Metode de fit pentru distribuiile experimentale
III.4.1. Consideraii generale
n mod obinuit distribuiile experimentale sunt comparate cu diferite distribuii
teoretice. Alegerea distribuiei teoretice depinde de ipotezele fcute pentru descrierea unui
anumit set de date experimentale [9-12].
Stabilirea acordului dintre rezultatele experimentale i diferitele modelri propuse se
poate face cu ajutorul unor tipuri specifice de teste. Multe din aceste teste sunt legate de
distribuia normal (Gauss), distribuie care se bucur de un numr de proprieti speciale [1-
9].
Msurtorile fizice implic, n multe situaii de interes, distribuii care au abateri
standard relativ mici, att de la o prob la alta, ct i de la valoarea adevrat (ateptat). Din
acest motiv se poate considera c chiar cu un numr relativ mic de observaii experimentale se
poate defini o distribuie caracterizat de o valoare medie i o varian suficient de bune pentru
scopuri practice, n raport cu o populaie de acelai tip de populaie.
Aceste metode - numite metode de fit (potrivire) - trebuie s ndeplineasc anumite
condiii i s satisfac anumite necesiti practice. Una din condiiile de baz este ca ele s fie
aplicabile indiferent de numrul de "citiri" implicate. De aceea, este necesar raportarea
fiecrei "citiri".
Trebuie menionat aici faptul c intr n sarcina celui care face un experiment i
prelucreaz datele experimentale obinute s foloseasc o estimare descriptibil i repetabil n
mod exact pentru erori experimentale i distribuiile asociate acestora.
24
III.4.2. Metoda celor mai mici ptrate
III.4.2.1. Principiul metodei
Printr-un numr finit de citiri nu se poate determina exact distribuia erorilor. Din acest
motiv nu se poate determina valoarea adevrat a oricrei mrimi msurate. Printr-un
experiment se poate obine valoarea cea mai probabil.
Fie xi (i = 1,,n) valoarea unei citiri i fie xo valoarea cea mai probabil. Pentru
valoarea cea mai probabil trebuie avut n vedere urmtoarea definiie: cea mai probabil
valoare care poate fi obinut dintr-un set dat de observaii experimentale este cea care face
ca setul de observaii respectiv s fie cel mai probabil.
Se poate consta c metoda verosimilitii maxime este cea mai util n acest caz,
pentru stabilirea setului de observaii care d probabilitatea maxim. De aceea, trebuie s se
considere c xo este o variabil aleatoare, deoarece - n acest caz - mrimile x1, x2,,xn sunt
cunoscute. Dou direcii de studiu sunt importante: stabilirea probabilitii de a gsi setul de
observaii experimentale care d probabilitatea maxim i gsirea valorii maxime a expresiei
considerate.
Probabilitatea de a gsi setul de citiri setul de "citiri" cu probabilitatea maxim se
obine prin nmulirea probabilitilor individuale pentru toate "citirile". Se poate scrie o relaie
de forma:
P P P Pn 1 2 ..... , (III.21)
unde
P Q x m x x m xi i a i a ( ) . (III.22)
Se face ipoteza c mrimile Pi sunt distribuite conform distribuiei normale (Gauss),
anume:
P e xi
x mi a
1
2
2
22
( )
. . (III.23)
n acest mod se poate determina probabilitatea de a gsi grupul de "citiri" cutat. Expresia
acestei probabiliti este urmtoarea:
P x en nx mj
j
n
a
( ) ( )
( )1
2
1
2 2 1
2
. (III.24)
25
Metoda celor mai mici ptrate este o metod de fit care permite estimarea valorilor
ateptate pentru distribuia considerat folosind valori j = xj - xo diferite i modificnd
valoare xo pn cnd probabilitatea P atinge valoarea maxim. Acest mod de lucru nu
afecteaz mrimile n, x i 1
2.
Argumentul funciei exponeniale conine numai termeni ptratici. De aceea, valoarea
maxim a probabilitii P se obine atunci cnd valoarea sumei jj
n
2
1
este cea mai mic
posibil n condiiile date. Acesta este principiul metodei celor mai mici ptrate.
III.4.2.2. Aplicarea metodei celor mai mici ptrate
Ideea fundamental pentru gsirea valorii celei mai probabile a mrimii msurate este
aceea de a lua din "citirile" existente pe cele mai probabile.
nainte de a se discuta cazuri concrete de aplicare a metodei celor mai mici ptrate
trebuie fcute dou observaii importante, anume:
A. Metoda se poate aplica att pentru cazul n care se consider o singur
necunoscut, ct i pentru cazul n care se consider mai multe necunoscute.
B. n general, xo este media aritmetic a observaiilor.
Fie cazul unei singure necunoscute. Pentru a respecta condiia ca suma jj
n
2
1
s fie
minim este necesar s fie satisfcut urmtoarea relaie:
jj
n
o
o o n oxx x x x x x
2
1
1 22 0
[( ) ( ) ..... ( )] . (III.25)
Din relaia (V.25) se obine:
x
x
no
jj
n
1
. (III.26)
Se confirm astfel observaia de la punctul A.
Fie cazul general n care se consider m necunoscute care satisfac n ecuaii, unde m <
n. Fie A1, A2,,Am mrimile necunoscute, iar x1,x2,,xn observaiile experimentale. Dac
26
variabilele experimentale cunoscute sunt a1, b1,,an, bn,, iar ntre ele exist o relaie liniar,
atunci se pot scrie urmtoarele ecuaii:
A a A b A q x k n j mj k j k j k k ..... , , , ,1 1 . (III.27)
Pentru a pstra liniaritatea ecuaiilor trebuie ca: ak = bk2.
Este necesar calcularea sumei ptratelor mrimilor i. n acest mod se obine un
sistem de m ecuaii cu m necunoscute. Suma ptratelor se poate scrie n modul urmtor:
j j k l k l k ll
n
k
m
j
n
j
n
x A a A b A q2
1
2
111
[ ( ..... )] . (III.28)
Folosind o relaie de tipul relaiei (V.25) se obin ecuaiile normale pentru coeficienii
Ak:
)29.(.0)]}.....([
.....)].....([)].....([{2
21
22221221121111
1
2
IIIqAbAaAxa
qAbAaAxaqAbAaAxaA
nmnnnn
mm
k
n
j
j
Pentru rezolvarea sistemului se introduc urmtoarele notaii:
[ ] ; [ ] ;...;[ ] ;...;[ ] ; [ ]aa a bb b ab a b aq a q ax a xj j j jj
n
j j j jj
n
j
n
j
n
j
n
2 21 1111
.(III.30)
Cu ajutorul notaiilor de mai sus sistemul de m ecuaii normale (III.29), cu m necunoscute, se
poate scrie n modul urmtor:
[ ] [ ] ..... [ ] [ ]
[ ] [ ] ..... [ ] [ ]
.
.
.
[ ] [ ] ..... [ ] [ ]
aa A ab A aq A ax
ab A bb A bq A bx
aq A bq A qq A qx
m
m
m
1 2
1 2
1 2
. (V.31)
Pentru rezolvarea sistemului de ecuaii (V.31) se pot folosi diferite metode. O cale
folosit relativ frecvent este cea care implic introducerea determinanilor. Calculul unui
coeficient Al se poate face folosind proprietile determinanilor, anume:
27
A
aa ab ax aq
ab bb bx bq
aq bq qx qq
aa ab al aq
ab bb bl bq
aq bq ql qq
l
[ ] [ ]....[ ]....[ ]
[ ] [ ]....[ ]....[ ]
.
.
.
[ ] [ ]....[ ]....[ ]
[ ] [ ]....[ ]....[ ]
[ ] [ ]....[ ]....[ ]
.
.
.
[ ] [ ]....[ ]....[ ]
. (V.32)
Exist i alte ci de rezolvarea a sistemului de ecuaii (V.31).
Metoda celor mai mici ptrate se poate folosi pentru fit-area cu o dreapt a unui set de
date experimentale, situaie des ntlnit n experimentele de Fizic nuclear [6].
Fie cazul n care nu exist nici un motiv "a priori" de a presupune c datele experimentale nu
sunt de ncredere. Fie y = A + Bx ecuaia dreptei cu care se face fit-area i fie yi valoarea
observat a mrimii y atunci cnd mrimea x are valoarea xi. Aplicnd principiul fundamental
al metodei se obine:
iii
i iA Bx y2 2 ( ) , (V.33)
de unde se ajunge, prin derivare, la urmtoarele ecuaii:
i
i
i i
iAA Bx y
2
2 0
( ) , (V.34)
i
i
i i i
iBA Bx y x
2
2 0
( ) . (V.35)
Cele dou ecuaii ale sistemului se mai pot scrie astfel:
nA B x yi ii
n
i
n
11
, (V.36)
A x B x x yii
n
i i ii
n
i
n
1
2
11
. (V.37)
28
Aici n este numrul de date experimentale considerate n eantionul respectiv.
Soluiile pentru parametrii A i B sunt urmtoarele:
A
y x x x y
n x x
i i i i i
i
n
i
n
i
n
i
n
i i
i
n
i
n
2
1111
2
1
2
1
( )
, (V.38)
B
n x y x y
n x x
i i i ii
n
i
n
i ii
n
i
n
( )
( )
11
2 2
11
. (V.39)
Prin efectuarea calculelor se obin cele mai bune valori ale parametrilor A i B pentru situaia
considerat. Cu ajutorul lor se poate trasa - printre punctele experimentale - dreapta care
descrie cel mai bine eantionul respectiv.
n multe experimente fiecare observaie experimental este caracterizat prin precizie
specific, diferit de a celorlalte. De aceea, este necesar introducerea unei distribuii "printe"
a erorilor de dimensiune infinit. Eroarea fiecrei observaii (date) experimentale poate fi
caracterizat prin valori diferite ale mrimii h1
2 care intr n expresia ecuaiei pentru
funcia de distribuie normal [1-6].
Fie un set de n date experimentale avnd erori I, caracterizate de un indice de precizie
hii
1
2 , dar avnd toate aceeai valoare ateptat [1-8]. Probabilitatea de a obine un astfel
de set este urmtoarea:
Ph
ei
i
nn
hi ii
n
1
2 2
1( ) . (V.40)
Valoarea ateptat, comun pentru cele n date, se estimeaz pentru valoarea maxim a
probabilitii P. Aceast valoare maxim se obine atunci cnd hi ii
n
2 2
1
are cea mai mic
valoare posibil. Cele mai probabile valori ale necunoscutelor se obin atunci cnd hi ii
n
2 2
1
este minim.
Fie h w hi i2 2 , unde h este o constant. Pe baza relaiilor anterioare se poate scrie:
29
h wii
n
i
2
1
2
min . (V.41)
Se consider I de forma urmtoare:
i ix x ,
unde x este valoarea ateptat a mrimii necunoscute, putnd fi considerat ca o variabil. Prin
nlocuirea n ecuaia (V.41) i diferenierea n raport cu variabila aleatoare x se obine, din
condiia de minim
w
x
i i
i
n2
10
, urmtoarea expresie a valorii ateptate:
x
w x
w
i ii
n
ii
n
1
1
. (V.42)
Relaia de mai sus este util n obinerea mediilor ponderate. De aceea, se consider c
wi reprezint ponderile observaiilor, iar h reprezint precizia msurrii pentru cazul n care
ponderea este egal cu unitatea.
Din relaiile anterioare - (V.40)(V.42) - se obine urmtoarea relaie de legtur:
h
h
w
w
p
p
1
2
1
2
2
1
2
1
, (V.43)
Dac ho, respectiv, o, sunt precizia msurrii, respectiv, abaterea standard pentru
distribuia mediilor aleatoare pentru n date experimentale, atunci ecuaia (V.43) conduce la
urmtoare relaie de legtur:
o n2 2
1 . (V.44)
Pentru aceast situaie se obine un nou sistem de ecuaii, asemntor cu cel din ecuaia
(V.31), anume:
[ ] [ ] .... . [ ] [ ]
[ ] [ ] ... . . [ ] [ ]
.
.
.
[ ] [ ] ... . . [ ] [ ]
waa A wab A waq A wax
wab A wbb A wbq A wbx
waq A wbq A wqq A wqx
m
m
m
1 2
1 2
1 2
. (V.45)
30
Aici [ ]waa w ai ii
n
21
.a.m.d. Rezolvarea sistemului se face ca i n cazul sistemului de ecuaii
(V.31).
Exist situaii cnd un set de observaii/date experimentale poate s conin cteva
mrimi (necunoscute) care satisfac exact una sau mai multe condiii teoretice care se stabilesc
ntre necunoscute. n aceste situaii se reduce numrul necunoscutelor care trebuie s fie
calculate. Numrul necunoscutelor care nu mai trebuie s fie calculate este dat de numrul de
condiii care sunt satisfcute de mrimile considerate.
Trebuie menionat aici faptul c exist experimente n care ecuaiile care definesc
condiiile conin necunoscute neliniare. n aceste cazuri metoda celor mai mici ptrate se poate
aplica numai dac se cunosc valorile aproximative pentru necunoscute. Aceste valori pot fi
obinute prin metode care necesit calcule mai puin complicate i laborioase.
Fie Z1 i Z2 astfel de necunoscute. Se consider relaii de legtur de forma fi(Z1,Z2) =
Xi, i=1,n i ponderile wi corespunztoare. Se presupune c funciile fi(Z1,Z2) sunt neliniare n
cele dou variabile, Z1 i Z2.
Dac se presupune c valorile aproximative ale lui Z1 i Z2 au fost obinute prin alte
metode, atunci se poate considera c Z1 = A + z1 i Z2 = B + z2, unde z1 i z2 sunt noile
necunoscute de determinat. Prin dezvoltarea n serie Taylor a funciilor fi(Z1,Z2) = Xi, pentru
z1 i z2 foarte mici, se obine:
f Z Z f A Bf
Zz
f
Zzi i
i
A B
i
A B( , ) ( , ) . . . . .
, ,1 2
1
1
2
2
, i=1,n. (V.46)
Se introduc notaiile: Xi - fi(A,B) = mi, i=1,n. Mrimile mi sunt foarte mici i pot fi considerate
ca noi variabile. n acest caz se obine un nou set de ecuaii, i anume:
X f A Bf
Zz
f
Zz mi i
i
A B
i
A Bi ( , ) , ,
11
2
2 , i=1,n. (V.47)
Ecuaiile (V.47) sunt liniare n mrimile z1 i z2. Ele se rezolv prin metoda celor mai
mici ptrate, n modul artat anterior.
Metoda celor mai mici ptrate se poate utiliza n estimarea mprtierii unor mrimi
determinate din date experimentale. Trebuie avut n vedere faptul c ntre abaterea standard a
populaiei, , i abaterea standard a eantionului (probei), p, exist unele diferene
(subcapitolul V.1). De obicei, intereseaz cea mai bun estimare a abaterii standard a
populaiei.
31
Fie o distribuie "mam" centrat pe valoarea ateptat, ma. Fie o distribuie specific
unei probe centrat pe valoarea cea mai probabil, mn, rezultat din n date experimentale sau
observaii. Cunoscnd cea mai bun estimare a centrului de simetrie pentru distribuia "mam"
este necesar stabilirea lrgimii sale, n ipoteza c sub curba specific probei este inclus
0.6827 din aria unitate a curbei "mam".
Fie d = mn - ma. Pentru o valoare experimental ei se pot scrie urmtoarele relaii:
i i a
i i n
i i
e m
e m
d
(V.48)
Deoarece valoarea lui mn se gsete punnd condiia ii
n
01
din relaiile (V.48) se obine:
i ii
n
i
n
nd2 2 2
11
(V.49)
Valoarea lui d trebuie s fie, cel mult, de acelai ordin de mrime cu una din msurile
mprtierii pentru o distribuie a mediilor, n cazul unor probe de dimensiune n. Toate
msurile mprtierilor au aceeai form, i sunt legate unele de altele prin constante.
n ipoteza c:
d c cn
cnp
ii
n
2 2
22
1
2
, (V.50)
relaia (V.49) se poate scrie astfel:
i i
ii
n
i
n
i
n
cn
2 2
2
1
11
(V.51)
Soluia este de forma:
ii
n
ii
n
n n c
2
1
2
1
. (V.52)
Observaii
1. Pentru valori foarte mari ale lui n corecia nu este important.
2. Corecia este important numai pentru valori mici ale lui n.
32
3. n cazul n=1 se ajunge la o valoare nedeterminat a raportului
ii
n
n
2
1
. De aceea, pentru
n=1 se alege c =1.
Avnd n vedere rezultatele anterioare, se consider c pentru o singur variabil cea
mai bun estimare a abaterii standard este de forma urmtoare:
ii
n
n
2
1
1 (V.53)
Cea mai bun estimare a abaterii standard pentru medie se poate scrie astfel:
p
i
i
n
n n
21
1( ) (V.54)
n relaia (V.54) mrimea (n-1) reprezint numrul gradelor de libertate ale sistemului.
Remarc. n acest caz prin grad de libertate se nelege numrul de date experimentale sau
observaii n exces n raport cu numrul minim teoretic necesar pentru a obine mrime
necunoscut. n general, pentru n date experimentale sau observaii asupra a q necunoscute
este (n-q).
Pentru q necunoscute abaterea standard - n cazul unor ponderi egale cu unitatea ale
datelor experimentale sau observaiilor - are urmtoarea expresie:
ii
n
n q
2
1 (V.55)
Dac ponderile sunt diferite de unitate i au valori specifice wi, atunci abaterea standard are o
form nou, anume:
w
n q
i i
i
n2
1 (V.56)
Abaterea standard pentru o dat experimental sau observaie de pondere wk se poate
scrie n modul urmtor:
33
w
k
i i
i
n
kk w
w
w n q
21
( ) (V.57)
Pentru cazul unei singure necunoscute abaterea standard a mediei (eroarea) se poate
scrie astfel:
p
k
n
k
i i
i
n
k
n
kw
w
w n
1
2
1
1
1( )
(V.58)
n cazul mai multor necunoscute soluia se complic i se calculeaz diferit, de la caz la caz.
Exist situaii n care printre datele experimentale se pot afla i unele afectate de
greeli. Pentru a le elimina se consider c sunt afectate de greeli cele pentru care valoare este
mai mare dect 3291
2
1.
ii
n
n
.Valoarea respectiv este stabilit cu ajutorul unei relaii de tipul
relaiei (V.23), integrnd de la 0 la valoarea considerat ca admisibil.
O alt metod de eliminare a datelor experimentale (observaiilor) afectate de greeli
este cea cunoscut sub nmumele de criteriul lui Chauvenet. Aceast metod d probabilitatea
limit de realizare pentru date experimentale (observaii) "acceptabile", n funcie de
nnumrul acestora. Aceast probabilitate este dat de urmtoarea relaie:
Pn
nlim
2 1
4 (V.59)
Estimarea gradului de precizie se poate face prin observarea diferenei dintre valorile
cele mai mari i cele mai mici ale datelor experimentale (observaiilor). Diferena poart
numele de domeniu i nu are aceeai distribuie de probabilitate ca acestea.
Fie R dimensiunea unui domeniu. Fie = R/2 diferena dintre cea mai mare i cea mai mic
valoare din cele n date experimentale (observaii). n aceste condiii este satisfcut
urmtoarea relaie:
n nPR
2 2
2 , (V.60)
unde PR
2 este probabilitatea de a observa o diferen mai mic dect R/2.
34
n general, sunt depinite urmtoarele condiii:
22
1
2nP
R
(V.61)
PR
PR
21
2 (V.62)
V.4.3. Distribuia 2
Pentru descrierea dispersiei unei populaii folosind variana probei a fost introdus
distribuia 2. Definirea ei se poate face n cadrul urmtoarei teoreme:
Dac xi (i=1,2,.,n)sunt probe de variabile aleatoare distribuite normal i independente,
de medii mi i variane i, atunci statistica
2
1
2
x mi i
ii
n
(V.63)
este distribuit cu funcia de densitate de probabilitate:
f e( , )
2
2
22
12
1
22
2
, 2>0, (V.64)
de medie i varian 2.
Statistica (V.63) se numete distribuie 2 cu n grade de libertate.
Funcia gamma este definit prin integrala urmtoare:
( ) ,x due u xu x
1
0
0 (V.65)
Funcia carateristic a distribuiei 2 are urmtoarea expresie:
( ) ( )t it
1 2 2
(V.66)
innd seama de expresia funciei generatoare, anume:
M t E e dxe f xxxt tx( ) [ ] ( )
(V.67)
se poate scrie urmtoarea funcie generatoare de momente pentru distribuia 2:
M t t( ) ( )
1 2 2
(V.68)
35
Proprietile funciei generatoare de momente permit obinerea expresiilor pentru momentele
simple necentrate, anume:
M t
tm
t
( )'
0 1
2
2
0
22M t
tm
t
( )'
3
3
0
38M t
tm
t
( )'
4
4
0
412 4M t
tm
t
( )( ) '
Cu ajutorul acestor momente se pot defini parametrii de asimetrie i de formare de maxime -
1, respectiv, 2. Se obin urmtoarele expresii:
1
2
8
3 14
Se observ c, pentru , valorile parametrilor de mai sus tind spre cele caracteristice
distribuiei normale, i anume:
1
2
0
3
n
n
n condiia menionat - - distribuia 2 nsi tinde lent spre distribuia normal.
Distribuia 2 este o distribuie uniparametric. De aceea, n anumite situaii, se
folosete statistica 2 2 care tinde rapid spre distribuia normal, atunci cnd , avnd
media ' 2 1 i variana 1.
O proprietate important a statisticii 2 este proprietatea de aditivitate. Aceast
proprietate arat c suma a n variabile independente 2j, j=1,2,,n, fiecare avnd
distribuii 2 cu j, j=1,2,,n, grade de libertate, este ea nsi distribuit ca 2 cu
jj
n
1
grade de libertate.
n folosirea statisticii i distribuiei 2 sunt utile i urmtoarele dou teoreme.
36
Teorema I. Fie x1, x2, , xn o prob de dimensiune n extras dintr-o populaie normal cu
medie 0 i varian unitate. Atunci, statistica u x xii
n
( )21
este distribuit ca 2 cu n-
1 grade de libertate, iar variana probei este
p n
2 2
1, fiind distribuit, de asemenea, ca
2 cu n-1 grade de libertate i independent de media probei, .
Teorema II. Media i variana probei sunt variabile aleatoare independente atunci cnd
proba este extras la ntmplare dintr-o populaie normal.
Este util calcularea proporiei a ariei de sub curbele ditribuiei 2 a diferitelor puncte
2 pentru care este satisfcut urmtoarea condiie:
P f d( ) ( , )
2 2 2 2
2
(V.69)
Punctele definite de relaia (V.69) sunt numite i puncte de procentaj.
Determinarea parametrilor - n cazul folosirii testului 2 - se face prin impunerea
condiiei de minimizare pentru distribuia 2. Este cea mai utilizat metod de analiz a
datelor experimentale obinute prin msurtori fizice.
37
V.4.4. Distribuia t
n marea majoritate a situaiilor de interes nu sunt cunoscute media i variana
populaiei. De aceea, acestea se nlocuiesc cu estimri calculate din proba respectiv.
Distribuia unei probe de medie este aproximativ normal, cu o medie a populaiei i o
varian 2
n, unde 2 este variana populaiei, iar n este dimensiunea probei.
Statistica ux
n
este distribuit aproximativ normal cu medie 0 i varian 1,
pentru n mare.
n aceste condiii este important s se stabileasc care este distribuia care permite s
se foloseasc variana probei pentru a putea face afirmaii cu privire la media populaiei.
Acest tip de distribuie se numete distribuie t sau distribuie Student. Ea se poate introduce
pe baza urmtoarei teoreme:
Fie ux
n
cu o distribuie normal de medie 0 i varian 1. Fie w cu o
distribuie 2 cu n grade de libertate. Mrimile w i u sunt independente statistic. Atunci,
variabila aleatoare
tu
w
n
(V.70)
are o funcie de densitate de probabilitate
f t n
n
nn
t
nt
n
( , ) ,
1
2
2
1
21
2
(V.71)
de medie 0 i varian n
n 2, pentru n>2.
Statistica t se spune c are o distribuie t (Student) cu n grade de libertate.
Principalele proprieti ale distribuiei t (Student) sunt cuprinse n urmtoarele 3
teoreme:
38
Teorema I. Fie xi, i=1,2,,n, o prob de dimensiune n extras dintr-o populaie normal
de medie i varian 2. Atunci statistica
tn
xp
( ) , (V.72)
unde p ii
n
nx x
1
12
1
( ) i
xn
xii
n1
1
, este dsitribuit ca distribuia t (Student)
cu n-1 grade de libertate.
Teorema II. Cu ct numrul gradelor de libertate ale distribuiei t (Student) se apropie de
infinit cu att distribuia tinde la distribuia normal, n forma standard.
Teorema III. Fie probele aleatoare x11, x12, , x1n i x21, x22, , x2n de dimensiuni n1,
respectiv, n2, independente, reprezentate prin populaiile normale 1, respectiv, 2, avnd
medii 1, respectiv, 2, i aceeai varian, 2. Atunci, definind
xn
x iii
ijj
n11 2
1
, , ,
statistica
tx x
n n
( ) ( )1 2 1 2
12
2
1 2
1 1
(V.73)
are o distribuie t (Student) cu n=n1+n2 grade de libertate.
n relaia (V.73) 122 este variana sumei probelor 1 i 2 i este definit prin urmtoarea
expresie:
122
2
11
2
1 2 2
( )x x
n n
ij ij
n
i
i
(V.74)
Ca i distribuia 2 i distribuia t (Student) este o familie uniparametric de curbe.
Valorile - n procente - ale punctelor din familia de curbe se obine inndu-se cont de faptul c
distribuia este simetric n jurul valorii t=0. Se obine urmtorul rezultat:
P t t n P t t n[ ( )] [ ( )] (V.75)
39
V.4.5. Distribuia F
n cazul n care este necesar s se compare dou variane sau mai mult de dou valori
medii se folosete un alt tip de distribuie, anume distribuia F.
Teorema care permite introducerea acestui tip de distribuie se enun astfel:
Fie dou variabile aleatoare 2i (i=1,2), distribuite ca 2 cu ni grade de libertate. Statistica
F F n nn
n
( , )1 2
1
2
1
2
2
2
(V.76)
este distribuit, n acest caz, cu funcia de densitate de probabilitate
f F n n
n n
n n
n
n
F
n
nF
n n
n n( ; , )1 2
1 2
1 2
1
2
2
2
2
1
2
2
2
2 2 1
1 1
1 2
(V.77)
cu F0, medie
n
nn
2
2
222, i varian 2
2
2
1 2
1 1
2
2
2
2 2
2 44
n n n
n n nn
( )
( ) ( ), .
Punctele din familia de curbe - n procente - se definesc prin relaia de mai jos:
P F F dFf F n nF
[ ] ( ; , )
1 2 . (V.78)
Trebuie menionat, n ncheierea acestui capitol, c exist i alte metode de analiz a
datelor experimentale [1-12]
40
Bibliografie
[1]. H.G.Worthing, J.Geffner - Prelucrarea datelor experimentale, Editura Tehnic, 1959
[2]. B.R.Martin - Statistics for Physicists, Plenum Press, 1971
[3]. A.Solmitz - Annual Review of Nuclear Science (1963)
[4]. W.T.Eadie et al - Statistical Methods in Experimental Physics, North-Holland Publishing
Company, Amsterdam, 1971
[5]. F.James - Proceedings of the 1970 CERN Computing and Data Processing School - Via
Monastero, Varenna, Italy, 30 August-12 September 1970 - Preprint CERN 71-6 (1971)
[6]. Colectiv de catedr - Fizic nuclear - ndrumtor de laborator, Tipografia Universitii
Bucureti, 1987
[7]. B.Gndenko - Theory of probability, MIR , Moscow,1982
[8]. Gh.Mihoc, V.Craiu - Tratat de Statistic matematic, Editura Academiei RSR, Bucureti,
1981
[9]. P.Carruthers, C.C.Shih - International Journal of Modern Physics A2(5)(1987)1447-1547
[10].Isac Stern - Tez de doctorat, IFIN Bucureti-Mgurele, 1981
[11].Al.Jipa - Tez de doctorat, Facultatea de Fizic, Universitatea Bucureti, 1989
[12].Al.Jipa et al - Journal of Physics G: Nuclear and Particle Physics 22(2)(1996)221-230