Upload
lazar
View
118
Download
0
Embed Size (px)
DESCRIPTION
Универзитет у Београду – Хемијски факултет Катедра за Аналитичку хемију. O брада резултата мерења. Школска 201 3 /14. година. ОБРАДА РЕЗУЛТАТА МЕРЕЊА [У (БИО)ХЕМИЈИ]. Циљ курса је да студента упозна са основним методама статистичке обраде резултата мерења у хемији. - PowerPoint PPT Presentation
Citation preview
Oбрада резултата мерења
Школска 2013/14. година
Универзитет у Београду – Хемијски факултетКатедра за Аналитичку хемију
ОБРАДА РЕЗУЛТАТА МЕРЕЊА[У (БИО)ХЕМИЈИ]
Задатак курса:
Да вас оспособи да
Своје експерименталне резултате
изражавате на правилан начин,
Из добијених података извучете што
је могуће више корисних
информација,
Донесете исправне закључке.
Циљ курса је да студента упозна са основним методама статистичке обраде
резултата мерења у хемији
Исход: студент оспособљен да:• разуме изворе несигурности мерења• оцени тачност и прецизност резултата хем. анализе• своје резултате исправно групише, табеларно и графички прикаже• упоређује резултате применом параметријских тестова• користи линеарну регресиону анализу• користи PC за статистичку обраду и приказ резултата
PRIMER 1
Izvršena je analiza deset uzoraka rude nikla sa različitih lokaliteta jednog budućeg rudnika. Nađeno je da u uzorcima rude ima 4,0%, 3,7%, 2,7%, 2,6%, 2,6%, 2,6%, 2,5%, 0,9%, 0,9% i 0,3% nikla. Srednja vrednost ovih deset merenja je 2,3%. (I. Gutman: Obrada rezultata
merenja u hemiji, Kragujevac, 2000.) RUDNIK? Da, ako u rudi ima više od 2% Ni.
OBAZRIVO! Možemo jedino sa 95% verovatnoćom tvrditi da sardžaj nikla u rudi prelazi 1,4%.
Primer 2: Prilikom analize krvi dve grupe ljudi (prva je kontrolna, a druga je grupa obolelih od reumatoidnog artritisa) nađene su sledeće koncentracije tiola u krvi (mM): kontrolna: 1,84; 1,92; 1,94; 1,92; 1,85; 1,91; 2,07 reumatoidna: 2,81; 4,06; 3,62; 3,27;
3,27; 3,76. Da li je jedan od simptoma artritisa povećan sadržaj tiola u krvi?
Primer 3: U dve laboratorije određivan je sadržaj nitrata u pijaćoj vodi i dobijeni su sledeći rezultati:
Maksimalna dozvoljena količina nitrata u pijaćoj vodi po propisima EU je 50 mg/dm3. Da li se može tvrditi da sadržaj nitrata u ovoj vodi premašuje MDK vrednost?
Koncentracija nitrata (mg/dm3)
Lab. 1 Lab. 2 51,0 52,8 51,3 53,0 51,6 53,5 50,9 52,6 50,5 52,8 52,0 53,8
Stanica Montparnas, Pariz, 22.10.1895.
Greške u hemijskoj analizi mogu da imaju ozbiljne posledice: kontrola kvaliteta industrijskih
proizvoda postavljanje dijagnoze bolesti i
određivanje terapije određivanje opasnog otpada i zagađenja razrešavanje krivičnih dela
E: Statistics F: Statistique N: Statistik
status, -us, m. (lat.) = stanje
Обрада бројчаних података ради јаснијег
приказивања Настала из практичних потреба и
проблема
свакодневног живота (примитивни
пописи) Касније развијена као грана примењене
математике Данас: део опште научне методологије
XVII век:
немачка “Универзитетска статистика”
(систематизација података о становништву
и привреди у циљу вођења државне политике)
енглеска “Политичка аритметика”
(научно сазнање о друштву; откривање
законитости у понашању посматраних појава)
крај XVIII – почетак XIX века:
интензивнији развој
Зашто нам је потребна статистика?
Праћење стручне и научне литературе Обрада експерименталних резултата
ДЕСКРИПТИВНА СТАТИСТИКА Закључивање од посебног ка општем
ИНФЕРЕНЦИЈАЛНА СТАТИСТИКА Планирање истраживања (експеримента)
Variable StatisticsHoney type
Acacia (n = 167) Linden (n = 11) Sunflower (n = 23)
Moisture
Median 16.12 17.35 17.98
Mean ± SD 16.48 ± 1.3 17.41 ± 2.5 18.07 ± 1.5
Range 13.90 - 20.57 13.41 - 22.48 15.50 - 20.63
Electrical conductivity
[mScm-1]
Median 0.14 0.67 0.32
Mean ± SD 0.16 ± 0.067 0.64 ± 0.1 0.31 ± 0.1
Range 0.10 - 0.69 0.30 - 0.76 0.19 - 0.55
pH
Median 4.08 4.63 3.39
Mean ± SD 4.07 ± 0.26 4.56 ± 0.4 3.49 ± 0.3
Range 3.49 - 5.85 3.98 - 5.40 3.17 - 4.14
Free acidity
[meq/kg ]
Median 11.20 13.00 25.65
Mean ± SD 11.64 ± 2.5 14.93 ± 5.7 27.16 ± 7.1
Range 7.80 - 29.60 8.20 - 26.20 11.00 - 42.70
Optical rotation
[α 20]
Median -14.49 -10.35 -16.90
Mean ± SD -14.47 ± 2.4 -10.10 ± 2.8 -16.50 ± 3.0
Range (-27.21)–(-8.77) (-14.85)–(-5.02) (-22.77)–(-10.67)
Table 1. Parameters of descriptive statistics
Our studiesCollected 380 honey samples of different botanical and geographical origin
Glu
cose
Fruct
ose
Mois
ture pH
Free a
cidit
y
Speci
fic
opti
cal ro
ta-
tion
-20.00
-10.00
0.00
10.00
20.00
30.00
40.00
Tre
chalo
se
Sacc
haro
se
Isom
alt
ose
Mele
sito
se
gent+
tur
Isom
alt
otr
iose
Malt
ose
Ele
ctri
cal co
nduc-
tivit
y
0.00
0.50
1.00
1.50
2.00
2.50
Acacia
Linden
Sunflower
Polyfloral
Our studiesPCA Principal component analysis – sugar profile
-5 0 5 10-5
-4
-3
-2
-1
0
1
2
3
4
5
Scores on PC 1 (32.84%)
Sco
res
on P
C 2
(19
.30%
)
Scores on PC 2 (19.30%)
Robinia pseudoacacia
Tilia cordataPolyfloral
Helianthus annuus
95% Confidence Level
-0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
Loadings on PC 1 (32.84%)L
oa
din
gs
on
PC
2 (
19
.30
%)
Trehalose
Glucose
Fructose
Sacarose Isomaltose
Melezitose
Gentiobiose+turanose
Isomaltotriose Maltose
Honey type Melezitose Glucose Fructose Gentiobiose+Turanose Isomaltose
Acacia (Robinia pseudoacacia) 1.33 17.93↓ 28.89 1.05 0.58
Linden (Tilia cordata) 1.50 24.66 35.52→ 2.01→ 1.45→
Sunflower (Heliantus annuus) 0.45↓ 21.73 26.81 ←0.37 ←0.20
Polyfoloral 1.13 19.50 28.96 1.00 0.62
“Jedino statistički obrađeni podaci mogu imati naučnu vrednost.”
TAČNO, ALI
Statistička obrada NE GARANTUJE naučnu vrednost podataka
“Statistika može biti samo pomoć, ali nikada zamena za zdrav razum” (Blalock)
“POČEVŠI OD PRAKTIČNOG HEMIČARA, KOJI SAMO VRŠI HEMISKE ANALIZE, PA DO ČISTIH TEORETIČARA KOJI U HEMIJU UVODE NOVE HIPOTEZE I OTKRIVAJU NOVA POLJA ZA ISTRAŽIVANJA, SVAKI HEMIČAR IMA DA RAČUNA, DA VRŠI IZRAČUNAVANJA BILO POMOĆU PROSTIH ARITMETIČKIH RADNJA, BILO SA KOMPLIKOVANIJIM RAČUNSKIM INSTRUMENTOM KOJI DAJU RAZNE PARTIJE TEORISKE MATEMATIKE”. (Mihajlo Petrović, Spomenica Lozanića, Beograd, 1922.)
~ 1960:
компјутеризација инструменталних метода
тзв. “експлозија података” у хемији
хемометрија
(примена математичких метода на
хемијске податке)
1972: уведен назив (Wold и Kowalski)
1974: интернационално хемометријско друштво
1975: опис научне дисциплине
Серија конференција;
Журнали ...
Journal of Chemical Information and Computer Sciences,Analytical Chemistry,Chemometrics and Intelligent Laboratory Systems,Journal of Chemometrics, …
Hemometrija je hemijska disciplina koja koristi matematiku, statistiku i formalnu logiku radi: a) planiranja (dizajniranja) ili odabira
optimalnih eksperimentalnih postupaka;
b) obezbeđivanja maksimuma relevantih hemijskih informacija analizom hemijskih podataka, i
c) dobijanja znanja o hemijskim sistemima (D. L. Massart).
ЛИТЕРАТУРА
Ivan Gutman, Obrada rezultata hemijskih merenja, PMF, Kragujevac, 2000.J. C. Miller and J. N. Miller, Statistics and Chemometrics for nalytical Chemistry, Pearson Education, Harlow, 2000, 2005, 2010
2013 – Међународна година статистике
ONO ŠTO VAS NAJVIŠE ZANIMA
Nastavnik: Dušanka Milojković-Opsenicalab. 547 / II C
Konsultacije: ? Asistenti: dr Jelena Trifković,
dr Filip Andrić, lab. 552,
Finalni ispit – pismeni (praktični) Ocena: Predavanja 10 + vežbe 20 +
kolokvijum 10 + ispit 60
ZNAČAJNE CIFRE
merenje = poređenje veličine koja se meri sa nekom standardnom, referentnom veličinom l = 1,237 cm Ovakav zapis u sebi sadrži nekoliko informacija: 1. merni uređaj je podeljen na stote delove
centimetra 2. dužina objekta se prostire iza 1,23 cm za
7/10 delova razdaljine između 1,23 i 1,24 cm 3. apsolutna nesigurnost ovog merenja iznosi
0,001 cm
Apsolutna i relativna nesigurnost
Rezultate merenja (analize) treba izražavati samo značajnim ciframa
Značajnim ciframa se nazivaju sve cifre od prve sleva, različite od nule, do poslednje zapisane cifre sdesna, pri čemu se nule koje slede iz množioca 10n ne uzimaju u obzir. Brojevi: 0,00104; 0,104; 1,04; 104 i 1,04×104 su brojevi sa po tri značajne cifre.
ZAOKRUGLJIVANJE BROJEVA
1. ako je cifra koju treba odbaciti manja od 5, prethodna cifra se ne menja;
2. ako je cifra koju treba odbaciti veća od 5, prethodnu cifru treba uvećati za jedan;
3. ako je cifra koju treba odbaciti jednaka 5 i bar jedna od cifara koje iza nje slede različita od nule kao u slučaju 2;
4. ako je cifra koju treba odbaciti jednaka 5, a sve cifre koje slede (ako ih ima) jednake nuli, onda se razlikuju dva slučaja: ako je prethodna cifra parna kao u slučaju 1, a ako je neparna kao u slučaju 2.
Primer. Zaokrugliti na tri decimale sledeće brojeve:
2,97628; 0,0175; 1,436501; 6,7185; 4,9996.
nikada se zaokrugljivanje ne vrši sekvencijalno
Primer:
Broj 4,1748 zaokrugljen na tri cifre postaje 4,17.
Ne treba na osnovu pete cifre (8) zaokrugliti
četvrtu sa 4 na 5, pa zatim istim postupkom doći
do broja 4,18.
Sabiranje i oduzimanje
Apsolutna nesigurnost rezultata ne sme da bude manja
od najnesigurnije vrednosti koja podleže sabiranju,
odnosno oduzimanju.
Primer. 12,2 + 0,365 + 1,04 = 13,605 13,6
Primer.
4,16×10-3 + 1,724×10-1 + 3,86×10-4 treba prevesti u:
0,0416×10-1 + 1,724×10-1 + 0,00386×10-1 = 1,76946×10-1
1,769×10-1
Množenje i deljenje:
Relativna nesigurnost rezultata treba da bude
jednaka onoj koju ima komponenta sa
najvećom relativnom nesigurnošću
proizvod i količnik treba da sadrže onoliko
značajnih cifara koliko i član sa najmanjim
brojem značajnih cifara
128,6 · 0,069 = 8,8734
%)08,0(0008,0)100(
6,128
1,0
%)4,1(014,0)100(
069,0
001,0
Apsolutna nesigurnost proizvoda
je 8,8734·0,014 = 0,124, pa rezultat
treba zaokrugliti do 8,9.
128,6 : 0,069 = 1863,768116
1863,768116 · 0,014 = 26
nesigurnost na mestu desetica
rezultat treba zapisati u obliku
1,86×103.
Drugo pravilo:
128,6 : 0,069 = 1863,768116 1,9×103
(broj sa dve značajne cifre)
Dobijeni rezultat, ne računajući predznak i mesto zareza,
manji od “ograničavajućeg broja”
u dobijenom rezultatu treba zadržati još jednu cifru
19 < 69 rezultat je 1,86×103
128,6 : 0,069 = 1863,768116 1,9×103
Treba razlikovati
eksperimentalne vrednosti od
tzv. “čistih brojeva”:
39,622
47,6231,62
Logaritmovanje
Rezultat treba da sadrži onoliko cifara
desno od decimalnog zareza
koliko ima značajnih cifara broj čiji se
logaritam traži.
Npr. log 3,67×10-3 = -2,435;
log 3,67×10-13 = -12,435;
log 3,67×10-33 = -32,435.
Stepenovanje i korenovanje
Rezultat treba da ima onoliko
značajnih cifara
koliko ima i osnova ili broj pod
korenom
Npr.: 23,152= 535,9225 ≈ 535,9
35207, = 2,7114571 ≈ 2,7115
PREGLED GREŠAKA U HEMIJSKOJ
ANALIZI
brza i pouzdana analitička kontrola nemoguće potpuno eliminisanje grešaka pri hemijskoj analizi značajno određivanje veličine i orijentacije grešaka
pouzdanost rezultata
hemičar - pouzdano izvršavanje odgovarajuće analize(analitičar): - odabir odgovarajućeg postupka
- ocena dobijenih rezultata
Iskustvo ili statistika?
GREŠKE KOJE PRATE HEMIJSKU ANALIZU
Greška = razlika između prave i izmerene (izračunate) vrednosti
Na osnovu uticaja na rezultat analize:
Slučajne (neodređene): uvek se javljaju; obično male; ne iskrivljuju konačni rezultat u odnosu na tačnu vrednost;
uzroci nepoznati; matematički model raspodele
Grube: obično GREŠKE ANALITIČARA (izbor metode, čuvanje uzoraka, izračunavanje); jako iskrivljuju krajnji rezultat;
Primena statistike
Sistematske (određene): uvek iskrivljuju rezultat; uslovljene analitičkim postupkom (smanjena preciznost aparata, pogrešno rukovanje, nečistoća reagenasa);
Matematika nemoćna!
PRECIZNOST I TAČNOST REZULTATA HEMIJSKE ANALIZE
Precizni = rezultati paralelnih određivanja se međusobno dobro slažu
Tačni = oni koji se slažu sa stvarnim sadržajem određivane komponente (ne podležu nekoj sistematskoj grešci)
C ili D?
APSOLUTNE I RELATIVNE GREŠKE
xxd )( Apsolutnu grešku treba uvek procenjivati u odnosu na apsolutnu vrednost rezultata sa kojim stoji u odnosu.
xxd
xe
)(
)(Procenti ili promiliOmogućava poređenje tačnosti rezultata
1)(1
ezaxe
x
)(xdx
Prava vrednost najčešće nije poznata
x
x xxx
y
ydyexdxdydxxy
)()()()()( 2121
)()()()( xeyexdaydxay
)()()()()( 212
121 xexeyeyyeyd
x
xyilixxy
)()()( xdxfyd
RELATIVNA GREŠKA KRAJNJEG REZULTATA HEMIJSKE ANALIZE
merenje određene mase uzorka (x1)
analitički postupak parametar (x2)
p = k (x2/x1)
k nije prava konstanta
p = x3 k’(x2/x1)
1
jxxxxp j321
Maksimalnavrednost
xxdxe
)()(
Greške procedure > greške merenja
e(x) ako: d(x) i x
Problem smanjivanja relativne greške krajnjeg razultata treba rešavati preciznijim merenjem parametara x1 i x2, a ne povećanjem njihove vrednosti.
Npr. ako se 0,50 g izmeri sa preciznošću od 0,2 mg, relativna greška je e = (0,2/500)x100 = 0,04%. Za merenje 25 mg sa istom e, mora d da bude: 0,04 = (d/25)x100 d = 0,01 mg. preciznije vage od analitičkih
Reliabilnost (pouzdanost) i reproduktibilnost (ponovljivost) rezultata hemijske analize Reproduktibilnost = stabilnost preciznosti nema univerzalnog recepta za eliminisanje svih grešaka za sve analitičke metode
SREĐIVANJE PODATAKA
Grupisanje podataka
Prikazivanje podataka:
Tabeliranje
Grafičko prikazivanje
GRUPISANJE PODATAKA Cilj: učiniti podatke preglednijim
Veoma važno: obezbeđuje vrednost
drugih statističkih postupaka
Osnovna pravila: Sveobuhvatnost
Sistematičnost
Određenost
Postupak: podaci se grupišu u razrede (intervale, grupe, grupne intervale) međusobno jednake po veličini
Određivanje R = Xmax – Xmin utvrđivanje širine grupnog intervala, w
Širina razreda zavisi od n:
Za n = 30 – 400: n
Rw
Za n > 400: 20
Rw
Važno:
Malo w veliki broj grupnih intervala
detaljnije informacije ALI slabija preglednost
w broj intervala
preglednost detaljnost informacija
CILJ: PREGLEDNA I DOBRA INFORMACIJA
Prvi interval mora da sadrži Xmin;
može da počne nulom
Poslednji interval mora da sadrži Xmax
Donja granica intervala:
treba da bude deljiva sa w
za jedinicu mere je veća od gornje
granice prethodnog intervala
jednake je preciznosti kao gornja
granica i eksperimentalni rezultati
FREKVENCIJA (UČESTALOST), f = broj jedinica posmatranja koje pripadaju jednom razredu
apsolutna i relativna f pojedinačna (parcijalna) i kumulativna
DISTRIBUCIJA FREKVENCIJA (Raspodela učestalosti) = prikaz raspoređivanja jedinica statističkog skupa po grupama (razredima)
Raspodela frekvencija oboljevanja 17 pacijenata u periodu od 6 meseci:
Primer:
Apsolutna frekvencija Relativna frekvencija (%) Meseci Pojedinačna Kumulativna Pojedinačna Kumulativna
0,0 – 1,0 4 4 23,5 23,5 1,1 – 2,0 6 10 35,3 58,8 2,1 – 3,0 3 13 17,6 76,4 3,1 – 4,0 2 15 11,8 88,2 4,1 – 5,0 1 16 5,9 94,1 5,1 – 6,0 1 17 5,9 100,0 Ukupno 17 / 100,0 /
Statističke serije = sređeni podaci statističkog skupa
- atributivne
- numeričke (jedinice posmatranja uređene u odnosu na numeričko obeležje)
PRIKAZIVANJE PODATAKA brz i lak uvid u prikupljene i grupisane podatke radi dalje stat. obrade TABELIRANJE = pregledno prikazivanje prethodno grupisanih podataka tabelom Tabela mora da sadrži:
redni broj naslov šemu (maksimalno prilagođenu
sadržaju) izvore podataka
TABELA MORA DA BUDE: pregledna – ograničen broj redova i
kolona jasna i razumljiva – oznake u
predkoloni i zaglavlju precizne i detaljne potpuna – svaka rubrika popunjenja
brojem ili odgovarajućim znakom tehnički pravilna – po obliku, veličini i
odnosu rubrika prilagođena sadržaju (veličina brojeva, znakova i opisa)
GGRRAAFFIIČČKKOO PPRRIIKKAAZZIIVVAANNJJEE PPOODDAATTAAKKAA "Crtež vredi koliko i hiljadu reči"
(kineska poslovica)
- Poređenje veličina jasnije - Upadljivije razlike i odnosi među veličinama Obično slika ilustruje (ne zamenjuje) tabelu!
DIJAGRAMI tačkasti (korelacioni) linijski (poligon f, kriva f, štapićasti) površinski (stubičasti, histogram f, kružni) prostorni (stereogram)
Grafički prikaz pomoću:• oznaka i simbola kartogrami
simbolički crteži• geometrijskih oblika dijagrami
Histogram – serija pravougaonika; - površinski dijagram (dve dimenzije) - apscisa: grupni intervali, ordinata: frekvencija
Poligon – linijski dijagram- apscisa: grupni intervali, ordinata: frekvencija - Spaja tačke sredina grupnih intervala i frekvencija u izlomljenu, poligonalnu liniju
Хистограм расподеле апсолутних фреквенција
0
1
2
3
4
5
6
7
8
бр
ој с
туд
енат
а
6,90-7,49
7,50-8,09
8,10-8,69
8,70-9,29
9,30-9,89
9,90-10,49
Полигон рсподеле апсолутнох фреквенција из примера 1.
012345678
6.3-
6.89
6.9-
7.49
7.5-
8.09
8.1-
8.69
8.7-
9.29
9.3-
9.89
9.9-
10.49
10.5-
11.0
9
просек
бр
ој
студ
енат
а
Štapićasti dijagram - Linijski dijagram - Visina štapića odgovara f
Kružni dijagram – grafički prikaz strukture pojave (odnos delova prema celini)
- površinski dijagram: P kruga = pojava u celini, P isečaka = delovi celine
- Ugaoni sistem, veličina isečka određena vel. ugla (100% = 360º, tj. 1% = 3,6º)
Kružni i štapićasti dijagram
Kružni dijagram
0
4
10
1312
7
00.00%
8.70%
30.43%
58.70%
84.78%
100.00%
100.00%
0 2 4 6 8 10 12 14 16
1.2
2.3
3.3
4.5
6.8
10.1
More
Frequency Cumulative %
Distribucija frekvencija
Interval Frekvencija
Masa (g)
f