Upload
phamanh
View
215
Download
2
Embed Size (px)
Citation preview
STATYSTYKA MATEMATYCZNA –narzędzie do opracowywania
i interpretacji wyników pomiarów
Piotr Konieczka
Katedra Chemii AnalitycznejWydział Chemiczny
Politechnika Gdańska
XX Sympozjum w Ślesinie, MSSpektrum 2014
2
Statystyka matematyczna - część matematyki opartana wykorzystaniu rachunku prawdopodobieństwaoraz ukierunkowana na badanie prawidłowościpojawiania się określonych cech w obiektachmaterialnych lub zjawiskach, występujących masowo,tzn. mogących pojawiać się dowolną ilość razy.
Statystyka przedstawia te prawidłowości za pomocąliczb.
XX Sympozjum w Ślesinie, MSSpektrum 2014
3
Statystyka pozwala znaleźć odpowiedź na wiele pytańnp.:
- Jak dokładny jest wynik oznaczenia?
- Jak wiele oznaczeń powinno być przeprowadzonychaby zwiększyć precyzję pomiaru?
- Czy badany produkt spełnia stawiane mu wymogi,normy?
Statystyka to narzędzie, którego używanie musi byćprowadzone w sposób rozsądny i zrozumiały.
XX Sympozjum w Ślesinie, MSSpektrum 2014
4
Zastosowanie określonej metody analitycznej sprawia,że w sposób jednoznaczny wyznaczony jest rozkładwyników pomiarów (cechy), które można traktowaćjako niezależne zmienne losowe. Wynik jestkonsekwencją przeprowadzenia pomiaru. Zbiórotrzymanych wyników oznaczeń tworzy rozkład(empiryczny).
XX Sympozjum w Ślesinie, MSSpektrum 2014
5XX Sympozjum w Ślesinie, MSSpektrum 2014
Analityka Statystyka
6
Rozkład normalnyniezwykle ważny rozkład prawdopodobieństwa wwielu dziedzinach (rozkład Gaussa)definiowany dwoma parametrami: średnią(odpowiada za położenie rozkładu) i odchyleniemstandardowym (skala).Własności rozkładu normalnego N(µx, s):
• wartość oczekiwana: µx;• mediana: µx;• wariancja: s2;
XX Sympozjum w Ślesinie, MSSpektrum 2014
7
ciągły rozkład prawdopodobieństwa, dla którego gęstośćprawdopodobieństwa w przedziale jest stała i różna od zera, a poza nim równa zeru.Ponieważ rozkład jest ciągły, nie ma większego znaczenia czy punkty -a i +a włączy się do przedziału czy nie. Rozkład jest określony parą parametrów -a i +a.Własności rozkładu jednostajnego:
⟩+⟨− aa ,
Rozkład jednostajny (prostokątny)
• wartość oczekiwana: 0• mediana: 0• wariancja: a2/3
XX Sympozjum w Ślesinie, MSSpektrum 2014
8
Własności rozkładu trójkątnego w przedziale :⟩+⟨− aa ,
Rozkład trójkątny
• wartość oczekiwana: 0;
• mediana: 0;
• wariancja: a2/6
XX Sympozjum w Ślesinie, MSSpektrum 2014
9
Znajomość rozkładu zmiennej losowej - pełnainformacja na temat badanej cechy (może to byćnp.: stężenie, zawartość, właściwośćfizykochemiczna).
Rzadko istnieje możliwość dysponowania taką pełnąinformacją.
XX Sympozjum w Ślesinie, MSSpektrum 2014
10
Wnioskowanie na temat cechy oparte o analizępewnej ograniczonej liczby elementów (próbek)reprezentujących fragment całego zbioruopisywanego rozkładem.
Wtedy należy wnioskować o badanej cesze napodstawie oszacowania niektórych jej parametrów(parametry statystyczne) lub na podstawie rozkładuempirycznego.
XX Sympozjum w Ślesinie, MSSpektrum 2014
11
Parametry statystyczne to wielkości liczbowe służącedo opisu struktury zbiorowości statystycznej wsposób systematyczny.
Wśród tych parametrów wyróżnić można czterypodstawowe grupy:
• miary położenia;
• miary rozproszenia;
• miary asymetrii;
• miary skupienia;
XX Sympozjum w Ślesinie, MSSpektrum 2014
12
Wybrane właściwości średniej arytmetycznej:• suma wartości cechy jest równa iloczynowi średniej
arytmetycznej i liczebności zbiorowości; • średnia arytmetyczna spełnia warunek:
• (suma odchyleń poszczególnych wartości cechy od średniej równa się zero:
• suma kwadratów odchyleń poszczególnych wartości cechy od średniej jest minimalna:
• średnia arytmetyczna jest wrażliwa na skrajne wartości cechy, • średnia arytmetyczna z próby jest dobrym przybliżeniem
(oszacowaniem, estymatorem) wartości oczekiwanej.
maxmin xxx śr <<
∑=
=−n
iśri xx
1
0)(
( )∑=
=−n
iśri xx
1
2 min
XX Sympozjum w Ślesinie, MSSpektrum 2014
13
Mediana
Mediana (wartość środkowa) Me – środkowa liczba wuporządkowanej niemalejąco próbce (dla próbki o licznościnieparzystej) lub średnia arytmetyczna dwóch liczb środkowych(dla próbki o liczności parzystej).
Mediana dzieli zbiorowość na dwie równe części; połowajednostek ma wartości cechy mniejsze lub równe medianie, apołowa wartości cechy równe lub większe od Me; stąd nazwawartość środkowa.
Mediana jest odporna na wartości skrajne (odbiegające)
XX Sympozjum w Ślesinie, MSSpektrum 2014
14XX Sympozjum w Ślesinie, MSSpektrum 2014
Miary rozproszenia (zmienności, dyspersji)
Z reguły miary rozproszenia odnoszą się do określania różnicpomiędzy obserwacjami a wartością średnią.
Do najczęściej stosowanych miar rozproszenia należą:
• rozstęp
• wariancja
• odchylenie standardowe
• odchylenie przeciętne (średnie)
• współczynnik zmienności
15XX Sympozjum w Ślesinie, MSSpektrum 2014
Rozstęp
Rozstęp to różnica pomiędzy wartością maksymalną, aminimalną cechy - jest miarą charakteryzującą empirycznyobszar zmienności badanej cechy, nie daje on jednakinformacji o zróżnicowaniu poszczególnych wartości cechy wzbiorowości.
minmax xxR −=
16XX Sympozjum w Ślesinie, MSSpektrum 2014
Wariancja
Wariancja jest to średnia arytmetyczna kwadratów odchyleńposzczególnych wartości cechy od średniej arytmetycznejzbiorowości.
( )2
1
2
11 ∑
−
−−
=n
iśri xx
ns
17XX Sympozjum w Ślesinie, MSSpektrum 2014
Odchylenie standardowe
Definiowane jako miara rozproszenia uzyskanychposzczególnych wartości oznaczeń wokół wartości średniej:
( )
11
2
−
−=∑=
n
xxs
n
iśri
gdzie:xi – wartość pojedynczego wyniku oznaczenia;xśr – średnia arytmetyczna z uzyskanych wyników;n – liczba uzyskanych wyników;
18XX Sympozjum w Ślesinie, MSSpektrum 2014
Odchylenie standardowe jest równe zeru wtedy i tylko wtedy,gdy wszystkie wyniki są identyczne. W każdym innymprzypadku wielkość ta jest dodatnia. Zatem im większerozproszenie wyników, tym wartość s jest większa.
W tym miejscu należy zwrócić uwagę na jeden podstawowyfakt. Rozrzut wyników związany jest z każdym postępowaniemanalitycznym. Możliwe jest natomiast, że zjawiska tego nieudało się zaobserwować ze względu na np. zbyt niskąrozdzielczość stosowanego przyrządu kontrolno-pomiarowego.
19XX Sympozjum w Ślesinie, MSSpektrum 2014
Przyrząd 1 Przyrząd 2 Przyrząd 3 17 16,8 16,83 17 17,1 17,14 17 16,9 16,88 17 17,4 17,43 17 17,3 17,27 17 17,2 17,24
Uzyskane wyniki
17 17,0 16,96 Wartość odchylenia standardowego
0 0,22 0,223
Serie wyników pomiarów uzyskane z wykorzystaniemprzyrządów kontrolno-pomiarowych o różnej rozdzielczości.
20XX Sympozjum w Ślesinie, MSSpektrum 2014
Właściwości odchylenia standardowego
• jeżeli do każdej wartości wyniku pomiaru dodamy (lub odniej odejmiemy) stałą wartość to wartość odchyleniastandardowego nie zmieni się,
• jeżeli każdą wartość wyniku pomiaru pomnożymy lubpodzielimy przez dowolną stałą to wartość odchyleniastandardowego zostanie także pomnożona lub podzielonaprzez tę stałą,
• odchylenie standardowe jest zawsze liczbą mianowaną,przy czym miano jego jest wyrażone w takich samychjednostkach jak miano wartości wyników w próbce,
21XX Sympozjum w Ślesinie, MSSpektrum 2014
Odchylenie standardowe:
a. dla znanej wartości rzeczywistej µx
( )
n
xs
n
ixi∑
=
−= 1
2µ
( )
11
2
−
−=∑=
n
xxs
n
iśri
b. dla nieznanej wartości rzeczywistej (oszacowanie xśr)
22XX Sympozjum w Ślesinie, MSSpektrum 2014
c. względne odchylenie standardowe
( )śr
R xsRSDs =
d. odchylenie standardowe średniej arytmetycznej
nss =
23XX Sympozjum w Ślesinie, MSSpektrum 2014
( )∑=
−−
=k
iiig ns
kns
1
2 11
gdzie:n - ogólna liczba oznaczeńk - liczba serii
∑=
⋅=k
iig s
ks
1
21
dla równolicznych serii wzór upraszcza się do postaci:
e. odchylenie standardowe metody (ogólne)
24XX Sympozjum w Ślesinie, MSSpektrum 2014
Współczynnik zmienności
Współczynnik zmienności (CV) powstaje przez pomnożeniewartości RSD przez 100%:
%100⋅= RSDCV
Współczynnik zmienności - jest ilorazem bezwzględnej miaryzmienności cechy i średniej wartości tej cechy, jest wielkościąniemianowaną, najczęściej podawaną w procentach.
Współczynnik zmienności stosuje się w porównaniachzróżnicowania:
• kilku zbiorowości pod względem tej samej cechy,
• tej samej zbiorowości pod względem kilku różnych cech.
25
Wyznaczenie poprawności(analiza próbek materiałów odniesienia)
Wyznaczenie odtwarzalności(np. porównania międzylaboratoryjne)
RAPORT WALIDACYJNY
Określenie elastyczności(na podstawie odtwarzalności i precyzji
pośredniej)
Określenie dokładności(na podstawie precyzji i poprawności)
Określenie selektywności(analiza próbek rzeczywistych)
Określenie selektywności(analiza próbek roztworów wzorcowych)
Wyznaczenie liniowości,LOD, LOQ, zakresu pomiarowego
Wyznaczenie powtarzalności
Wyznaczenie precyzji pośredniej
Określenie odporności(na podstawie powtarzalności i precyzji
pośredniej)
( )
11
2
−
−=∑=
n
xxs
n
iśri
( )
CVxsRSDsśr
R =
XX Sympozjum w Ślesinie, MSSpektrum 2014
26
Wyznaczenie poprawności(analiza próbek materiałów odniesienia)
Wyznaczenie odtwarzalności(np. porównania międzylaboratoryjne)
RAPORT WALIDACYJNY
Określenie elastyczności(na podstawie odtwarzalności i precyzji
pośredniej)
Określenie dokładności(na podstawie precyzji i poprawności)
Określenie selektywności(analiza próbek rzeczywistych)
Określenie selektywności(analiza próbek roztworów wzorcowych)
Wyznaczenie liniowości,LOD, LOQ, zakresu pomiarowego
Wyznaczenie powtarzalności
Wyznaczenie precyzji pośredniej
Określenie odporności(na podstawie powtarzalności i precyzji
pośredniej)a
oa s
aat −=
b
ob s
bbt −=
XX Sympozjum w Ślesinie, MSSpektrum 2014
27
Wyznaczenie poprawności(analiza próbek materiałów odniesienia)
Wyznaczenie odtwarzalności(np. porównania międzylaboratoryjne)
RAPORT WALIDACYJNY
Określenie elastyczności(na podstawie odtwarzalności i precyzji
pośredniej)
Określenie dokładności(na podstawie precyzji i poprawności)
Określenie selektywności(analiza próbek rzeczywistych)
Określenie selektywności(analiza próbek roztworów wzorcowych)
Wyznaczenie liniowości,LOD, LOQ, zakresu pomiarowego
Wyznaczenie powtarzalności
Wyznaczenie precyzji pośredniej
Określenie odporności(na podstawie powtarzalności i precyzji
pośredniej)
n
xx
n
ii
śr
∑== 1
XX Sympozjum w Ślesinie, MSSpektrum 2014
28
Weryfikacja hipotez statystycznych
Hipoteza to sąd o populacji oparty naprawdopodobieństwie, przyjęty w celu wyjaśnieniajakiegoś zjawiska, prawa lub faktu i wymagającysprawdzenia; przypuszczenie.
Weryfikacją hipotez nazywamy sprawdzanie sądów opopulacji, sformułowanych bez zbadania jej całości.
XX Sympozjum w Ślesinie, MSSpektrum 2014
29
Przebieg procedury weryfikacyjnej wygląda następująco:
Sformułowanie hipotezy zerowej i alternatywnej
Hipoteza zerowa – Ho - prosta postać hipotezy poddana testom;
Hipoteza alternatywna – H1 - przeciwstawiona hipotezie zerowej;
XX Sympozjum w Ślesinie, MSSpektrum 2014
30
Przebieg procedury weryfikacyjnej wygląda następująco:
Wybór odpowiedniego testu
Test służy do sprawdzania hipotezy.
XX Sympozjum w Ślesinie, MSSpektrum 2014
31
Przebieg procedury weryfikacyjnej wygląda następująco:
Określenie poziomu istotności α
z reguły α=0,05 co odpowiada poziomowi prawdopodobieństwa 0,95, czyli prawdopodobieństwu 95%
XX Sympozjum w Ślesinie, MSSpektrum 2014
32
Przebieg procedury weryfikacyjnej wygląda następująco:
Wyznaczenie obszaru krytycznego testu
Wielkość obszaru krytycznego wyznaczadowolnie mały poziom istotności α, natomiastjego położenie określane jest przez hipotezęalternatywną.
XX Sympozjum w Ślesinie, MSSpektrum 2014
33
Przebieg procedury weryfikacyjnej wygląda następująco:
Obliczenie parametru testu na podstawie próby
Wyniki próby opracowuje się w odpowiednisposób, zgodnie z procedurą wybranego testu isą one podstawą do obliczenia statystykitestowej.
XX Sympozjum w Ślesinie, MSSpektrum 2014
34
Przebieg procedury weryfikacyjnej wygląda następująco:
Podjęcie decyzji
Wyznaczona na podstawie próby wartość statystykiporównywana jest z wartością krytyczną testu.
· Jeżeli wartość ta znajdzie się w obszarze krytycznymto hipotezę zerową należy odrzucić jakonieprawdziwą.
· Jeżeli natomiast wartość ta znajdzie się pozaobszarem krytycznym oznacza to, że brak jestpodstaw do odrzucenia hipotezy zerowej. Stądwniosek, że hipoteza zerowa może być prawdziwa.
XX Sympozjum w Ślesinie, MSSpektrum 2014
35
Rodzaje błędów popełnianych przy weryfikacji:
błędy I-go rodzaju - odrzucenie hipotezy zerowej Ho gdy jest ona prawdziwa;
błędy II-go rodzaju - przyjęcie Ho gdy jest ona fałszywa;
hipoteza
prawdziwa fałszywa
błąd II-go rodzaju
błąd I-go rodzaju
hipo
teza
odrz
ucon
apr
zyję
ta
XX Sympozjum w Ślesinie, MSSpektrum 2014
36
Coraz częściej do weryfikowania hipotez statystycznychwykorzystywane są różnego rodzaju programy komputerowe(np. program Statistica). W takim przypadku sposóbpostępowania ogranicza się do wyliczenia, dla badanego zbiorudanych, parametru p – po wybraniu odpowiedniego testustatystycznego. Tak obliczona wartość porównuje się następniez przyjętą wartością poziomu istotności α. Jeżeli obliczonawartość p jest mniejsza od wartości α: p < α odrzuca sięhipotezę zerową Ho. W przeciwnym przypadku hipotezyzerowej nie odrzuca się.
XX Sympozjum w Ślesinie, MSSpektrum 2014
37
Testy parametryczne służą do weryfikacji hipotez parametrycznych, odnoszących się do parametrów rozkładu badanej cechy w populacji generalnej. Najczęściej za ich pomocą dokonuje się weryfikacji sądów o takich parametrach populacji jak średnia arytmetyczna i wariancja.
Testy nieparametryczne są stosowane do sprawdzania różnorodnych hipotez, dotyczących m.in. zgodności rozkładu cechy w populacji z określonym rozkładem teoretycznym, zgodności rozkładów w dwóch populacjach, a także losowości doboru próby.
XX Sympozjum w Ślesinie, MSSpektrum 2014
38
• PRECYZJA (powtarzalność, precyzja pośrednia, odtwarzalność)
• ODPORNOŚĆ
• ELASTYCZNOŚĆ
• KALIBRACJA (liniowość, trwałość (stabilność) krzywej kalibracyjnej)
XX Sympozjum w Ślesinie, MSSpektrum 2014
39
Ocena (porównanie) uzyskanej(ych) wartości odchylenia standardowego1. Ocena na podstawie obliczonej wartości RSD (bądź
CV)
2. Z zastosowaniem odpowiedniego testu statystycznegoa. w celu sprawdzenia istotności różnicy między
odchyleniem standardowym badanej populacji awartością zadaną stosujemy test χ2.
b. w celu porównania precyzji dwóch niezależnychserii pomiarowych uzyskanych w trakcie analizypróbek o zawartości analitu na takim samympoziomie, stosujemy test F-Snedecora
XX Sympozjum w Ślesinie, MSSpektrum 2014
40
c. do porównania precyzji dwóch zależnych seriipomiarowych, stosujemy test Morgana
d. do porównywania precyzji dla równolicznychpopulacji (ilość wyników uzyskanychporównywanymi procedurami) stosujemy testFmax Hartleya
e. w celu porównywania precyzji (kilka metod,serie nie koniecznie równoliczne) - test Bartletta
XX Sympozjum w Ślesinie, MSSpektrum 2014
41XX Sympozjum w Ślesinie, MSSpektrum 2014
Dokładność i miary niedokładności
1. dokładność wyniku pojedynczego oznaczenia (DOKŁADNOŚĆ):
2. dokładność wyniku analizy (POPRAWNOŚĆ):
3. dokładność procedury analitycznej:
iisystxix xxxxdi
δµ +∆+∆=−=
śrsystxśrx xxxdśr
∆+∆=−= µ
systxmetx xxEdmet
∆=−= µ)(
Wynik odbiegający
Wynik obarczony błędem grubym
?
42XX Sympozjum w Ślesinie, MSSpektrum 2014
43
• POPRAWNOŚĆ (odzysk)
• DOKŁADNOŚĆ (poprawność i precyzja)
• KALIBRACJA (liniowość, trwałość (stabilność) krzywej kalibracyjnej)
XX Sympozjum w Ślesinie, MSSpektrum 2014
44XX Sympozjum w Ślesinie, MSSpektrum 2014
Porównanie dokładności dwóch metod (wartości średnich)
Jeżeli porównywane metody nie różnią się w sposóbstatystycznie istotny pod względem precyzji(stosujemy w tym celu test F-Snedecora) ichdokładność porównujemy stosując test t-Studenta.
Jeżeli porównywane metody różnią się w sposóbstatystycznie istotny pod względem precyzji(stosujemy w tym celu test F-Snedecora) ichdokładność (POPRAWNOŚĆ) porównujemy stosującprzybliżony test C-Cochrana i Coxa - serie mało licznelub test Aspina i Welcha.
45
„Istnieją trzy stopnie kłamstwa: przepowiadanie pogodystatystykai komunikat dyplomatyczny.”
Jean Rigaux
XX Sympozjum w Ślesinie, MSSpektrum 2014
46
„Statystyka nie kłamie. Kłamią jedynie statystycy.”
XX Sympozjum w Ślesinie, MSSpektrum 2014
Janusz Leon Wiśniewski
XX Sympozjum Klubu POLLAB 2014 47