Distribucija frekvencija

Preview:

DESCRIPTION

Distribucija frekvencija. Frekvencija. Interval. f. Masa (g). Karakteristike : Vrednost x i = m ima najveću frekvenciju javljanja kriva je simetrična maksimum na x i = m prevojne tačke na x i = m  s. najčešći matematički model raspodele - PowerPoint PPT Presentation

Citation preview

VVeerroovvaattnnooććaa

matematička verovatnoća (P) = odnos između broja povoljnih

događaja (m) i ukupnog broja događaja (n):

nmP 0 P 1

m = n (svi mogući događaji su povoljni)

P = 1 apsolutna sigurnost nekog događanja

m = 0, onda je i P = 0 apsolutna nemogućnost događanja

Vrlo često: %100nm

P

Statistička definicija verovatnoće: verovatnoća je odnos

između broja pojavljivanja događaja A i svih događaja

0

A

nn

p

Kada n0 ili kada n0 n, p P

Verovatnoća izvlačenja “keca” iz špila od 52 karte:

m = 4, n = 52, P = 4/52 = 0,0769 ili 7,69%

Verovatnoća “keca” pik: Pp = 1/52 = 0,0192, verovatnoća

“keca” tref je takođe 0,0192, itd.

P = Pp + Pt + Pk + Ph = 4/52

OOppššttee pprraavviilloo:: aakkoo ddooggaađđaajjii AA,, BB ii CC mmoogguu ddaa ssee ddooggooddee,, AA ii CC

ssuu nnpprr.. ““ppoovvoolljjnnii”” ddooggaađđaajjii,, vveerroovvaattnnooććaa ddaa ććee ssee ddooggooddiittii iillii AA iillii

CC jjeeddnnaakkaa jjee zzbbiirruu vveerroovvaattnnooććaa ppoojjeeddiinnaaččnniihh ddooggaađđaajjaa AA ii CC..

Verovatnoća izvlačenja dva “keca” uzastopno iz špila

od 52 karte:

P1 = 4/52, a P2 = 3/51

Verovatnoća sukcesivnog događanja događaja A i C

data je proizvodom pojedinačnih verovatnoća:

OOppššttee pprraavviilloo:: P = PA × PC

PPrriimmeerr:: P = (4/52)×(3/51) = 0,00452 (0,452%)

““SSttaattiissttiiččkkii”” kkaarraakktteerr vveerroovvaattnnooććee

Verovatnoća izvlačenja bilo kog keca:

P = 4 / 52 = 1 / 13

13 uzastopnih izvlačenja kec će jednom biti izvučen ?!?!

13000 uzastopnih izvlačenja broj slučajeva izvlačenja

keca 1000

BBiinnoommnnaa ddiissttrriibbuucciijjaa ((rraassppooddeellaa))

Klasifikacija pojedinačnih devijacija samo na osnovu

znaka, bez obzira na veličinu devijacije

n = 1

+ -

P+ = (1/2) P- = (1/2)

P1 = P+ + P- = (1/2) + (1/2) = 1

n = 2

++

P2+ = (1/4) P+ - = (1/2) P2- = (1/4)

P2 = (1/4) + (1/2) + (1/4) = 1, ili:

P2 = (1/2)2 + 2(1/2)(1/2) + (1/2)2

n = 3

+++ ++- --+ - - -

+-+ -+-

-++ +--

P3+ = (1/8) P2+1- = (3/8) P1+2- = (3/8) P3- = (1/8)

P3 = (1/8) + (3/8) + (3/8) + (1/8) = 1, ili

P3 = (1/2)3 + 3(1/2)2(1/2) + 3(1/2)(1/2)2 + (1/2)3

Ukupna verovatnoća (Pn) može se predstaviti opštim

binomnim izrazom:

Pn = (1/2 + 1/2)n, ili:

121

21

21

...

...21

21

21

21

21

P

nnn

1nn

1n

22nn2

1nn1

nn0n

odnosno:

121

21

Pkkn

nkn

,

gde su nk tzv. binomni (kombinatorni) koeficijenti

Paskalovog trougla

Tablica I. Paskalov trougao

n

0 00 1

1 10 11 1 1

2 20 2

1 22 1 2 1

3 30 31 3

2 33 1 3 3 1

itd. itd.

)!(!

!

knk

nnk ; n! = 1 × 2 × 3 … × (n-1) × n

10 nn

n

Tablica II. Vrednosti izraza (1/2)n

n (1/2)n

0 1

1 0,5

2 0,25

3 0,125

4 0,0625

5 0,03125

6 0,015625

7 0,0078125

8 0,00390625

9 0,001953125

10 0,0009765625

B i n o m n a r a s p o d e l a u o p š t e m s l u č a j u m o ž e s e

p r e d s t a v i t i s l e d e ć o m j e d n a č i n o m :

P n = ( p + q ) n , g d e j e p + q = 1 , i l i :

knknkn qpP .

N a j v e r o v a t n i j i b r o j d o g a đ a n j a n e k o g

d o g a đ a j a ( E ) k o j i i m a v e r o v a t n o ć u p ( t z v . s r e d n j a

v r e d n o s t b i n o m n e d i s t r i b u c i j e ) m o ž e s e o d r e d i t i

p r e m a r e l a c i j i :

E = n p .

Binomna distribucija može da se upotrebi za

izračunavanje verovatnoće da će sve greške

merenja imati isti znak, pa da će se prema tome

adirati. Ova verovatnoća se izračunava na

osnovu relacije:

Pmax = 2 × (1/2)n = (1/2)n-1.

Sa povećanjem broja merenja iz kojih se

izračunava krajnji rezultat analize, verovatnoća

da će sve greške biti aditivne naglo opada.

Za n = 2, Pmax=0,5; za n = 3, Pmax= 0,25;

za n = 6, Pmax= 0,031.

Distribucija frekvencija

Interval Frekvencija

Masa (g)

f

2ix

21

i e2

1)x(f

GGaauussoovvaa iillii nnoorrmmaallnnaa ddiissttrriibbuucciijjaa ((rraassppooddeellaa))

Karakteristike:Vrednost xi = m ima najveću

frekvenciju javljanja kriva je simetrična maksimum na xi = m prevojne tačke na xi = m s

najčešći matematički model raspodele analitičkih rezultata, koji podležusamo slučajnim greškama

Oblik i položaj moguda se upotrebe zaocenu rezultata!

Parametri normalne raspodele grešaka

očekivana (tačna) vrednost – m“rasutost”s2

U analitičkoj praksi se obično rade 2-3 paralelne analize istog uzorka nije moguće tačno odrediti parametre normalne raspodele procena odgovarajućih parametara

Procena = tačno izračunata veličina zasnovana na preciznim merenjima

za n , procena mora asimptotski da se približavapravoj vrednosti parametra konzistencija rasipanje procene u odnosu na pravu vrednostparametra što je moguće manje efikasnost

Aritmetička sredina (srednja vrednost) rezultataje najčešće konzistentna i efikasna procenaparametra m Gausove raspodele:

ixn

1x

Malo n velika osetljivost na simetriju raspodele

Medijana x~

za set od dve vrednosti x1 < x2, 2

xxx~ 21

za set od tri vrednosti x1 < x2 < x3, medijana je x2

ako je n 3, ekstremne vrednosti nemaju uticaja

manje efikasna procena prave vrednosti od aritmetičke sredine

Relativna efikasnost medijane u odnosu na srednju vrednost seta rezultata.

n Relativna efikasnost

2 1,00 3 0,74 4 0,84 5 0,70 6 0,78 7 0,68 8 0,74 9 0,67 10 0,72 0,64

Velika razlika između srednje vrednosti i medijane set rezultata nije simetričan jedan od rezultata podleže nekoj gruboj grešci !?!

Još neke mere centralne tendencije:Dominantna vrednost (moda, mod) = najčešćepostignuta vrednost;

Geometrijska sredina - prosečna mera brzine promena

Harmonična sredina – daje prosek nekih odnosaH = n / Σ(1/x)

MERE VARIJABILNOSTI

Interval (Opseg, Raspon, R od Range) = najjednostavnija

ali i najnetačnija mera grupisanja rezultata oko nekesrednje vrednosti (osetljiv na ekstremne vrednosti)

R = xn – x1 za set: x1 < x2 < x3 < ...< xn.

Srednje odstupanje: Σ devijacija / n - može da se računa u odnosu na srednju vrednost, medijanu ili dominantnu vrednost

PPOOCCEENNEE SSTTAANNDDAARRDDNNEE DDEEVVIIJJAACCIIJJEE Standardna devijacija predstavlja apsolutnu grešku za onu vrednost xi za koju Gausova kriva raspodele ima prevojnu tačku.

n

x

n

ds

2i

2i

0

Statistički neopterećena i

efikasna procena

1n

xx

1ns

2i

2i

Konzistentna,statistički neopterećenaasimptotski efikasnaprocena

n – 1 = broj stepeni slobode

Drugi metod za određivanje procene standardne devijacije

sR = knR

Koeficijent varijacije (relativna standardna devijacija):

Γ = 1/v = /s

Često se izražava u %

x

x

sv

STANDARDNA DEVIJACIJA SREDNJE VREDNOSTI

nx

Rasipanje aritmetičkesredine

1nn

xxs

2i

x

= standardna greška (standard error, S.E.)

n

Rks n

x Za relativno malo n

INTERVAL POUZDANOSTI (RELIABILNOSTI)

Srednja vrednost kao procena μ ne izražava pouzdanostsa kojom je određena. Bolje: odrediti interval (interval pouzdanosti) u kome se sa velikom verovatnoćom (koeficijent pouzdanosti, (1-α))može nalaziti prava vrednost

n

zxL

2,1

n

tsxL 2,1

RKxL n2,1

x

z Standardizovananormalna promenljiva

t-raspodela

Vrednost t za interval pouzdanosti od

90% 95% 98% 99%

Kritična t vrednost za P

vrednosti od 0,10 0,05 0,02 0,01

Broj stepeni slobode

1 6,31 12,71 31,82 63,66 2 2,92 4,30 6,96 9,92 3 2,35 3,18 4,54 5,84 4 2,13 2,78 3,75 4,60 5 2,02 2,57 3,36 4,03 6 1,94 2,45 3,14 3,71 7 1,89 2,36 3,00 3,50 8 1,86 2,31 2,90 3,36 9 1,83 2,26 2,82 3,25 10 1,81 2,23 2,76 3,17 12 1,78 2,18 2,68 3,05 14 1,76 2,14 2,62 2,98 16 1,75 2,12 2,58 2,92 18 1,73 2,10 2,55 2,88 20 1,72 2,09 2,53 2,85 30 1,70 2,04 2,46 2,75 50 1,68 2,01 2,40 2,68 1,64 1,96 2,33 2,58

Kritične t vrednosti odgovaraju dvosmernom testu. Za jednosmerni test vrednosti se uzimaju

iz kolona koje odgovaraju dvostruko većim vrednostima P. Npr. za jednosmerni test, P = 0,05, ν = 5, očitava se vrednost iz kolone za P = 0,10 koja iznosi 2,02.

x

LL100i 12

x

RK2100i n

Relativna širina intervala pouzdanosti

U analitičkoj praksi se veoma često dešava da analitičar mora da bude zadovoljan ako je relativni interval pouzdanosti oko 5%, a pri analizi veoma niskih koncentracija, uz samo nekoliko paralelnih određivanja, prihvatljive su i i-vrednosti od oko 10%.

DEVIJACIJE OD GAUSOVOG ZAKONA RASPODELE

Pretpostavke na osnovu kojih je Gausov zakon izveden nisu ispunjene u praktičnoj analitičkoj hemiji različita odstupanja od normalne raspodele čak i u oblastima vrlo bliskim pravoj vrednosti μ. odstupanja od simetrije raspodele:

greške jednog znaka verovatnije od grešaka drugog znaka (npr. titracija uz indikator)

od posebne su važnosti one kod kojih izmerene vrednosti nisu simetrično raspoređene, ali zato neke funkcije izmerenih vrednosti imaju normalnu raspodelu; npr. log-normalna distribucija: logaritam

promenljive ima normalnu raspodelu: vrednosti Xi = log xi, podležu Gausovoj raspodeli; procena parametra μ je:

n

XX i n

xx ig

loglog

nng xxxx ...21

Devijacije od Gausove raspodele

Koncentracija

f

logC

f

U praktičnoj analitičkoj hemiji, moguća su dva slučaja kod kojih se javlja log-normalna distribucija: 1. Izmerene vrednosti zavise od veličina koje imaju normalnu distribuciju, a ta zavisnost je logaritamska; 2. Izmerene vrednosti su bliske teorijskim ili praktičnim granicama.

STANDARDNA DEVIJACIJA KRAJNJEG REZULTATA

konstante,...,,..., baba kkkbkakky

...22 bbaay kk

dc

baky

k = konstanta; a,b,c,d = nezavisne izmerene veličine

2222

dcbaydcbay

y = an

a

n

yay

y = f(x)

dx

dyxy