47
STATYSTYKA MATEMATYCZNA – narzędzie do opracowywania i interpretacji wyników pomiarów Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska XX Sympozjum w Ślesinie, MSSpektrum 2014

Statystyka matematyczna - narzędzie do opracowania i interpretacji

  • Upload
    phamanh

  • View
    215

  • Download
    2

Embed Size (px)

Citation preview

Page 1: Statystyka matematyczna - narzędzie do opracowania i interpretacji

STATYSTYKA MATEMATYCZNA –narzędzie do opracowywania

i interpretacji wyników pomiarów

Piotr Konieczka

Katedra Chemii AnalitycznejWydział Chemiczny

Politechnika Gdańska

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 2: Statystyka matematyczna - narzędzie do opracowania i interpretacji

2

Statystyka matematyczna - część matematyki opartana wykorzystaniu rachunku prawdopodobieństwaoraz ukierunkowana na badanie prawidłowościpojawiania się określonych cech w obiektachmaterialnych lub zjawiskach, występujących masowo,tzn. mogących pojawiać się dowolną ilość razy.

Statystyka przedstawia te prawidłowości za pomocąliczb.

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 3: Statystyka matematyczna - narzędzie do opracowania i interpretacji

3

Statystyka pozwala znaleźć odpowiedź na wiele pytańnp.:

- Jak dokładny jest wynik oznaczenia?

- Jak wiele oznaczeń powinno być przeprowadzonychaby zwiększyć precyzję pomiaru?

- Czy badany produkt spełnia stawiane mu wymogi,normy?

Statystyka to narzędzie, którego używanie musi byćprowadzone w sposób rozsądny i zrozumiały.

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 4: Statystyka matematyczna - narzędzie do opracowania i interpretacji

4

Zastosowanie określonej metody analitycznej sprawia,że w sposób jednoznaczny wyznaczony jest rozkładwyników pomiarów (cechy), które można traktowaćjako niezależne zmienne losowe. Wynik jestkonsekwencją przeprowadzenia pomiaru. Zbiórotrzymanych wyników oznaczeń tworzy rozkład(empiryczny).

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 5: Statystyka matematyczna - narzędzie do opracowania i interpretacji

5XX Sympozjum w Ślesinie, MSSpektrum 2014

Analityka Statystyka

Page 6: Statystyka matematyczna - narzędzie do opracowania i interpretacji

6

Rozkład normalnyniezwykle ważny rozkład prawdopodobieństwa wwielu dziedzinach (rozkład Gaussa)definiowany dwoma parametrami: średnią(odpowiada za położenie rozkładu) i odchyleniemstandardowym (skala).Własności rozkładu normalnego N(µx, s):

• wartość oczekiwana: µx;• mediana: µx;• wariancja: s2;

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 7: Statystyka matematyczna - narzędzie do opracowania i interpretacji

7

ciągły rozkład prawdopodobieństwa, dla którego gęstośćprawdopodobieństwa w przedziale jest stała i różna od zera, a poza nim równa zeru.Ponieważ rozkład jest ciągły, nie ma większego znaczenia czy punkty -a i +a włączy się do przedziału czy nie. Rozkład jest określony parą parametrów -a i +a.Własności rozkładu jednostajnego:

⟩+⟨− aa ,

Rozkład jednostajny (prostokątny)

• wartość oczekiwana: 0• mediana: 0• wariancja: a2/3

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 8: Statystyka matematyczna - narzędzie do opracowania i interpretacji

8

Własności rozkładu trójkątnego w przedziale :⟩+⟨− aa ,

Rozkład trójkątny

• wartość oczekiwana: 0;

• mediana: 0;

• wariancja: a2/6

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 9: Statystyka matematyczna - narzędzie do opracowania i interpretacji

9

Znajomość rozkładu zmiennej losowej - pełnainformacja na temat badanej cechy (może to byćnp.: stężenie, zawartość, właściwośćfizykochemiczna).

Rzadko istnieje możliwość dysponowania taką pełnąinformacją.

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 10: Statystyka matematyczna - narzędzie do opracowania i interpretacji

10

Wnioskowanie na temat cechy oparte o analizępewnej ograniczonej liczby elementów (próbek)reprezentujących fragment całego zbioruopisywanego rozkładem.

Wtedy należy wnioskować o badanej cesze napodstawie oszacowania niektórych jej parametrów(parametry statystyczne) lub na podstawie rozkładuempirycznego.

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 11: Statystyka matematyczna - narzędzie do opracowania i interpretacji

11

Parametry statystyczne to wielkości liczbowe służącedo opisu struktury zbiorowości statystycznej wsposób systematyczny.

Wśród tych parametrów wyróżnić można czterypodstawowe grupy:

• miary położenia;

• miary rozproszenia;

• miary asymetrii;

• miary skupienia;

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 12: Statystyka matematyczna - narzędzie do opracowania i interpretacji

12

Wybrane właściwości średniej arytmetycznej:• suma wartości cechy jest równa iloczynowi średniej

arytmetycznej i liczebności zbiorowości; • średnia arytmetyczna spełnia warunek:

• (suma odchyleń poszczególnych wartości cechy od średniej równa się zero:

• suma kwadratów odchyleń poszczególnych wartości cechy od średniej jest minimalna:

• średnia arytmetyczna jest wrażliwa na skrajne wartości cechy, • średnia arytmetyczna z próby jest dobrym przybliżeniem

(oszacowaniem, estymatorem) wartości oczekiwanej.

maxmin xxx śr <<

∑=

=−n

iśri xx

1

0)(

( )∑=

=−n

iśri xx

1

2 min

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 13: Statystyka matematyczna - narzędzie do opracowania i interpretacji

13

Mediana

Mediana (wartość środkowa) Me – środkowa liczba wuporządkowanej niemalejąco próbce (dla próbki o licznościnieparzystej) lub średnia arytmetyczna dwóch liczb środkowych(dla próbki o liczności parzystej).

Mediana dzieli zbiorowość na dwie równe części; połowajednostek ma wartości cechy mniejsze lub równe medianie, apołowa wartości cechy równe lub większe od Me; stąd nazwawartość środkowa.

Mediana jest odporna na wartości skrajne (odbiegające)

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 14: Statystyka matematyczna - narzędzie do opracowania i interpretacji

14XX Sympozjum w Ślesinie, MSSpektrum 2014

Miary rozproszenia (zmienności, dyspersji)

Z reguły miary rozproszenia odnoszą się do określania różnicpomiędzy obserwacjami a wartością średnią.

Do najczęściej stosowanych miar rozproszenia należą:

• rozstęp

• wariancja

• odchylenie standardowe

• odchylenie przeciętne (średnie)

• współczynnik zmienności

Page 15: Statystyka matematyczna - narzędzie do opracowania i interpretacji

15XX Sympozjum w Ślesinie, MSSpektrum 2014

Rozstęp

Rozstęp to różnica pomiędzy wartością maksymalną, aminimalną cechy - jest miarą charakteryzującą empirycznyobszar zmienności badanej cechy, nie daje on jednakinformacji o zróżnicowaniu poszczególnych wartości cechy wzbiorowości.

minmax xxR −=

Page 16: Statystyka matematyczna - narzędzie do opracowania i interpretacji

16XX Sympozjum w Ślesinie, MSSpektrum 2014

Wariancja

Wariancja jest to średnia arytmetyczna kwadratów odchyleńposzczególnych wartości cechy od średniej arytmetycznejzbiorowości.

( )2

1

2

11 ∑

−−

=n

iśri xx

ns

Page 17: Statystyka matematyczna - narzędzie do opracowania i interpretacji

17XX Sympozjum w Ślesinie, MSSpektrum 2014

Odchylenie standardowe

Definiowane jako miara rozproszenia uzyskanychposzczególnych wartości oznaczeń wokół wartości średniej:

( )

11

2

−=∑=

n

xxs

n

iśri

gdzie:xi – wartość pojedynczego wyniku oznaczenia;xśr – średnia arytmetyczna z uzyskanych wyników;n – liczba uzyskanych wyników;

Page 18: Statystyka matematyczna - narzędzie do opracowania i interpretacji

18XX Sympozjum w Ślesinie, MSSpektrum 2014

Odchylenie standardowe jest równe zeru wtedy i tylko wtedy,gdy wszystkie wyniki są identyczne. W każdym innymprzypadku wielkość ta jest dodatnia. Zatem im większerozproszenie wyników, tym wartość s jest większa.

W tym miejscu należy zwrócić uwagę na jeden podstawowyfakt. Rozrzut wyników związany jest z każdym postępowaniemanalitycznym. Możliwe jest natomiast, że zjawiska tego nieudało się zaobserwować ze względu na np. zbyt niskąrozdzielczość stosowanego przyrządu kontrolno-pomiarowego.

Page 19: Statystyka matematyczna - narzędzie do opracowania i interpretacji

19XX Sympozjum w Ślesinie, MSSpektrum 2014

Przyrząd 1 Przyrząd 2 Przyrząd 3 17 16,8 16,83 17 17,1 17,14 17 16,9 16,88 17 17,4 17,43 17 17,3 17,27 17 17,2 17,24

Uzyskane wyniki

17 17,0 16,96 Wartość odchylenia standardowego

0 0,22 0,223

Serie wyników pomiarów uzyskane z wykorzystaniemprzyrządów kontrolno-pomiarowych o różnej rozdzielczości.

Page 20: Statystyka matematyczna - narzędzie do opracowania i interpretacji

20XX Sympozjum w Ślesinie, MSSpektrum 2014

Właściwości odchylenia standardowego

• jeżeli do każdej wartości wyniku pomiaru dodamy (lub odniej odejmiemy) stałą wartość to wartość odchyleniastandardowego nie zmieni się,

• jeżeli każdą wartość wyniku pomiaru pomnożymy lubpodzielimy przez dowolną stałą to wartość odchyleniastandardowego zostanie także pomnożona lub podzielonaprzez tę stałą,

• odchylenie standardowe jest zawsze liczbą mianowaną,przy czym miano jego jest wyrażone w takich samychjednostkach jak miano wartości wyników w próbce,

Page 21: Statystyka matematyczna - narzędzie do opracowania i interpretacji

21XX Sympozjum w Ślesinie, MSSpektrum 2014

Odchylenie standardowe:

a. dla znanej wartości rzeczywistej µx

( )

n

xs

n

ixi∑

=

−= 1

( )

11

2

−=∑=

n

xxs

n

iśri

b. dla nieznanej wartości rzeczywistej (oszacowanie xśr)

Page 22: Statystyka matematyczna - narzędzie do opracowania i interpretacji

22XX Sympozjum w Ślesinie, MSSpektrum 2014

c. względne odchylenie standardowe

( )śr

R xsRSDs =

d. odchylenie standardowe średniej arytmetycznej

nss =

Page 23: Statystyka matematyczna - narzędzie do opracowania i interpretacji

23XX Sympozjum w Ślesinie, MSSpektrum 2014

( )∑=

−−

=k

iiig ns

kns

1

2 11

gdzie:n - ogólna liczba oznaczeńk - liczba serii

∑=

⋅=k

iig s

ks

1

21

dla równolicznych serii wzór upraszcza się do postaci:

e. odchylenie standardowe metody (ogólne)

Page 24: Statystyka matematyczna - narzędzie do opracowania i interpretacji

24XX Sympozjum w Ślesinie, MSSpektrum 2014

Współczynnik zmienności

Współczynnik zmienności (CV) powstaje przez pomnożeniewartości RSD przez 100%:

%100⋅= RSDCV

Współczynnik zmienności - jest ilorazem bezwzględnej miaryzmienności cechy i średniej wartości tej cechy, jest wielkościąniemianowaną, najczęściej podawaną w procentach.

Współczynnik zmienności stosuje się w porównaniachzróżnicowania:

• kilku zbiorowości pod względem tej samej cechy,

• tej samej zbiorowości pod względem kilku różnych cech.

Page 25: Statystyka matematyczna - narzędzie do opracowania i interpretacji

25

Wyznaczenie poprawności(analiza próbek materiałów odniesienia)

Wyznaczenie odtwarzalności(np. porównania międzylaboratoryjne)

RAPORT WALIDACYJNY

Określenie elastyczności(na podstawie odtwarzalności i precyzji

pośredniej)

Określenie dokładności(na podstawie precyzji i poprawności)

Określenie selektywności(analiza próbek rzeczywistych)

Określenie selektywności(analiza próbek roztworów wzorcowych)

Wyznaczenie liniowości,LOD, LOQ, zakresu pomiarowego

Wyznaczenie powtarzalności

Wyznaczenie precyzji pośredniej

Określenie odporności(na podstawie powtarzalności i precyzji

pośredniej)

( )

11

2

−=∑=

n

xxs

n

iśri

( )

CVxsRSDsśr

R =

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 26: Statystyka matematyczna - narzędzie do opracowania i interpretacji

26

Wyznaczenie poprawności(analiza próbek materiałów odniesienia)

Wyznaczenie odtwarzalności(np. porównania międzylaboratoryjne)

RAPORT WALIDACYJNY

Określenie elastyczności(na podstawie odtwarzalności i precyzji

pośredniej)

Określenie dokładności(na podstawie precyzji i poprawności)

Określenie selektywności(analiza próbek rzeczywistych)

Określenie selektywności(analiza próbek roztworów wzorcowych)

Wyznaczenie liniowości,LOD, LOQ, zakresu pomiarowego

Wyznaczenie powtarzalności

Wyznaczenie precyzji pośredniej

Określenie odporności(na podstawie powtarzalności i precyzji

pośredniej)a

oa s

aat −=

b

ob s

bbt −=

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 27: Statystyka matematyczna - narzędzie do opracowania i interpretacji

27

Wyznaczenie poprawności(analiza próbek materiałów odniesienia)

Wyznaczenie odtwarzalności(np. porównania międzylaboratoryjne)

RAPORT WALIDACYJNY

Określenie elastyczności(na podstawie odtwarzalności i precyzji

pośredniej)

Określenie dokładności(na podstawie precyzji i poprawności)

Określenie selektywności(analiza próbek rzeczywistych)

Określenie selektywności(analiza próbek roztworów wzorcowych)

Wyznaczenie liniowości,LOD, LOQ, zakresu pomiarowego

Wyznaczenie powtarzalności

Wyznaczenie precyzji pośredniej

Określenie odporności(na podstawie powtarzalności i precyzji

pośredniej)

n

xx

n

ii

śr

∑== 1

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 28: Statystyka matematyczna - narzędzie do opracowania i interpretacji

28

Weryfikacja hipotez statystycznych

Hipoteza to sąd o populacji oparty naprawdopodobieństwie, przyjęty w celu wyjaśnieniajakiegoś zjawiska, prawa lub faktu i wymagającysprawdzenia; przypuszczenie.

Weryfikacją hipotez nazywamy sprawdzanie sądów opopulacji, sformułowanych bez zbadania jej całości.

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 29: Statystyka matematyczna - narzędzie do opracowania i interpretacji

29

Przebieg procedury weryfikacyjnej wygląda następująco:

Sformułowanie hipotezy zerowej i alternatywnej

Hipoteza zerowa – Ho - prosta postać hipotezy poddana testom;

Hipoteza alternatywna – H1 - przeciwstawiona hipotezie zerowej;

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 30: Statystyka matematyczna - narzędzie do opracowania i interpretacji

30

Przebieg procedury weryfikacyjnej wygląda następująco:

Wybór odpowiedniego testu

Test służy do sprawdzania hipotezy.

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 31: Statystyka matematyczna - narzędzie do opracowania i interpretacji

31

Przebieg procedury weryfikacyjnej wygląda następująco:

Określenie poziomu istotności α

z reguły α=0,05 co odpowiada poziomowi prawdopodobieństwa 0,95, czyli prawdopodobieństwu 95%

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 32: Statystyka matematyczna - narzędzie do opracowania i interpretacji

32

Przebieg procedury weryfikacyjnej wygląda następująco:

Wyznaczenie obszaru krytycznego testu

Wielkość obszaru krytycznego wyznaczadowolnie mały poziom istotności α, natomiastjego położenie określane jest przez hipotezęalternatywną.

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 33: Statystyka matematyczna - narzędzie do opracowania i interpretacji

33

Przebieg procedury weryfikacyjnej wygląda następująco:

Obliczenie parametru testu na podstawie próby

Wyniki próby opracowuje się w odpowiednisposób, zgodnie z procedurą wybranego testu isą one podstawą do obliczenia statystykitestowej.

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 34: Statystyka matematyczna - narzędzie do opracowania i interpretacji

34

Przebieg procedury weryfikacyjnej wygląda następująco:

Podjęcie decyzji

Wyznaczona na podstawie próby wartość statystykiporównywana jest z wartością krytyczną testu.

· Jeżeli wartość ta znajdzie się w obszarze krytycznymto hipotezę zerową należy odrzucić jakonieprawdziwą.

· Jeżeli natomiast wartość ta znajdzie się pozaobszarem krytycznym oznacza to, że brak jestpodstaw do odrzucenia hipotezy zerowej. Stądwniosek, że hipoteza zerowa może być prawdziwa.

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 35: Statystyka matematyczna - narzędzie do opracowania i interpretacji

35

Rodzaje błędów popełnianych przy weryfikacji:

błędy I-go rodzaju - odrzucenie hipotezy zerowej Ho gdy jest ona prawdziwa;

błędy II-go rodzaju - przyjęcie Ho gdy jest ona fałszywa;

hipoteza

prawdziwa fałszywa

błąd II-go rodzaju

błąd I-go rodzaju

hipo

teza

odrz

ucon

apr

zyję

ta

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 36: Statystyka matematyczna - narzędzie do opracowania i interpretacji

36

Coraz częściej do weryfikowania hipotez statystycznychwykorzystywane są różnego rodzaju programy komputerowe(np. program Statistica). W takim przypadku sposóbpostępowania ogranicza się do wyliczenia, dla badanego zbiorudanych, parametru p – po wybraniu odpowiedniego testustatystycznego. Tak obliczona wartość porównuje się następniez przyjętą wartością poziomu istotności α. Jeżeli obliczonawartość p jest mniejsza od wartości α: p < α odrzuca sięhipotezę zerową Ho. W przeciwnym przypadku hipotezyzerowej nie odrzuca się.

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 37: Statystyka matematyczna - narzędzie do opracowania i interpretacji

37

Testy parametryczne służą do weryfikacji hipotez parametrycznych, odnoszących się do parametrów rozkładu badanej cechy w populacji generalnej. Najczęściej za ich pomocą dokonuje się weryfikacji sądów o takich parametrach populacji jak średnia arytmetyczna i wariancja.

Testy nieparametryczne są stosowane do sprawdzania różnorodnych hipotez, dotyczących m.in. zgodności rozkładu cechy w populacji z określonym rozkładem teoretycznym, zgodności rozkładów w dwóch populacjach, a także losowości doboru próby.

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 38: Statystyka matematyczna - narzędzie do opracowania i interpretacji

38

• PRECYZJA (powtarzalność, precyzja pośrednia, odtwarzalność)

• ODPORNOŚĆ

• ELASTYCZNOŚĆ

• KALIBRACJA (liniowość, trwałość (stabilność) krzywej kalibracyjnej)

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 39: Statystyka matematyczna - narzędzie do opracowania i interpretacji

39

Ocena (porównanie) uzyskanej(ych) wartości odchylenia standardowego1. Ocena na podstawie obliczonej wartości RSD (bądź

CV)

2. Z zastosowaniem odpowiedniego testu statystycznegoa. w celu sprawdzenia istotności różnicy między

odchyleniem standardowym badanej populacji awartością zadaną stosujemy test χ2.

b. w celu porównania precyzji dwóch niezależnychserii pomiarowych uzyskanych w trakcie analizypróbek o zawartości analitu na takim samympoziomie, stosujemy test F-Snedecora

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 40: Statystyka matematyczna - narzędzie do opracowania i interpretacji

40

c. do porównania precyzji dwóch zależnych seriipomiarowych, stosujemy test Morgana

d. do porównywania precyzji dla równolicznychpopulacji (ilość wyników uzyskanychporównywanymi procedurami) stosujemy testFmax Hartleya

e. w celu porównywania precyzji (kilka metod,serie nie koniecznie równoliczne) - test Bartletta

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 41: Statystyka matematyczna - narzędzie do opracowania i interpretacji

41XX Sympozjum w Ślesinie, MSSpektrum 2014

Dokładność i miary niedokładności

1. dokładność wyniku pojedynczego oznaczenia (DOKŁADNOŚĆ):

2. dokładność wyniku analizy (POPRAWNOŚĆ):

3. dokładność procedury analitycznej:

iisystxix xxxxdi

δµ +∆+∆=−=

śrsystxśrx xxxdśr

∆+∆=−= µ

systxmetx xxEdmet

∆=−= µ)(

Page 42: Statystyka matematyczna - narzędzie do opracowania i interpretacji

Wynik odbiegający

Wynik obarczony błędem grubym

?

42XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 43: Statystyka matematyczna - narzędzie do opracowania i interpretacji

43

• POPRAWNOŚĆ (odzysk)

• DOKŁADNOŚĆ (poprawność i precyzja)

• KALIBRACJA (liniowość, trwałość (stabilność) krzywej kalibracyjnej)

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 44: Statystyka matematyczna - narzędzie do opracowania i interpretacji

44XX Sympozjum w Ślesinie, MSSpektrum 2014

Porównanie dokładności dwóch metod (wartości średnich)

Jeżeli porównywane metody nie różnią się w sposóbstatystycznie istotny pod względem precyzji(stosujemy w tym celu test F-Snedecora) ichdokładność porównujemy stosując test t-Studenta.

Jeżeli porównywane metody różnią się w sposóbstatystycznie istotny pod względem precyzji(stosujemy w tym celu test F-Snedecora) ichdokładność (POPRAWNOŚĆ) porównujemy stosującprzybliżony test C-Cochrana i Coxa - serie mało licznelub test Aspina i Welcha.

Page 45: Statystyka matematyczna - narzędzie do opracowania i interpretacji

45

„Istnieją trzy stopnie kłamstwa: przepowiadanie pogodystatystykai komunikat dyplomatyczny.”

Jean Rigaux

XX Sympozjum w Ślesinie, MSSpektrum 2014

Page 46: Statystyka matematyczna - narzędzie do opracowania i interpretacji

46

„Statystyka nie kłamie. Kłamią jedynie statystycy.”

XX Sympozjum w Ślesinie, MSSpektrum 2014

Janusz Leon Wiśniewski

Page 47: Statystyka matematyczna - narzędzie do opracowania i interpretacji

XX Sympozjum Klubu POLLAB 2014 47