41
2015-03-23 1 dr hab.inż. Katarzyna Zakrzewska, prof.AGH Katedra Elektroniki, AGH e-mail: [email protected] http://home.agh.edu.pl/~zak Wykład 1. Wstęp Wstęp do probabilistyki i statystyki Wstęp do probabilistyki i statystyki. wykład 1 1 Literatura: D.C. Montgomery, G.C. Runger, Applied Statistics and Probability for Engineers, Third Edition, J. Wiley & Sons, 2003 A. Plucińska, E. Pluciński, Probabilistyka, rachunek prawdopodobieństwa, statystyka matematyczna, procesy stochastyczne, WNT, 2000 J. Jakubowski, R. Sztencel, Wstęp do teorii prawdopodobieństwa, SCRIPT, 2000 M. Sobczyk, Statystyka, Wydawnictwo C.H. Beck, Warszawa 2010 A. Zięba, Analiza danych w naukach ścisłych i technice, PWN, Warszawa 2013, 2014 Wstęp do probabilistyki i statystyki. wykład 1 2

Wykład 1. Wstęp - Strona główna AGHhome.agh.edu.pl/~zak/downloads/1-Elektronika-2015.pdf · M. Sobczyk, Statystyka, Wydawnictwo C.H. Beck, Warszawa 2010 ... Statystyka - typy

Embed Size (px)

Citation preview

2015-03-23

1

dr hab.inż. Katarzyna Zakrzewska, prof.AGH Katedra Elektroniki, AGHe-mail: [email protected]

http://home.agh.edu.pl/~zak

Wykład 1.Wstęp

Wstęp do probabilistyki i statystyki

Wstęp do probabilistyki i statystyki. wykład 1 1

Literatura:

● D.C. Montgomery, G.C. Runger, Applied Statistics and Probability for

Engineers, Third Edition, J. Wiley & Sons, 2003

● A. Plucińska, E. Pluciński, Probabilistyka, rachunek

prawdopodobieństwa, statystyka matematyczna, procesy

stochastyczne, WNT, 2000

● J. Jakubowski, R. Sztencel, Wstęp do teorii prawdopodobieństwa,

SCRIPT, 2000

● M. Sobczyk, Statystyka, Wydawnictwo C.H. Beck, Warszawa 2010

● A. Zięba, Analiza danych w naukach ścisłych i technice, PWN,

Warszawa 2013, 2014

Wstęp do probabilistyki i statystyki. wykład 1 2

2015-03-23

2

Plan

● Przedmiot probabilistyki i statystyki

● Rys historyczny

● Paradoks kawalera de Méré

● Statystyka - typy danych i pojęcie zmiennej losowej

● Graficzna prezentacja danych

● Znaczenie rachunku prawdopodobieństwa i statystyki

w nauce i problemach inżynierskich

Wstęp do probabilistyki i statystyki. wykład 1 3

Czym zajmuje się probabilistyka i statystyka?

Wstęp do probabilistyki i statystyki. wykład 1 4

Teoria prawdopodobieństwa (także rachunek prawdopodobieństwa lub probabilistyka) – dział matematykizajmujący się zdarzeniami losowymi. Zdarzenie losowe to wynik doświadczenia losowego.

Doświadczenie losowe może być powtarzane dowolnie wiele razy w warunkach identycznych lub bardzo zbliżonych a jego wynik nie daje się przewidzieć jednoznacznie.

Ll – oznacza ile razy zaszło dane zdarzenie gdy doświadczenie powtarzano n razy

Prawidłowość statystyczna – przy coraz większej liczbie doświadczeń losowych częstość zdarzenia dąży do pewnej stałej liczby

2015-03-23

3

Czym zajmuje się probabilistyka i statystyka?

Statystyka zajmuje się metodami zbierania informacji(liczbowych) oraz ich analizą i interpretacją.

Wstęp do probabilistyki i statystyki. wykład 1 5

• Rachunek prawdopodobieństwa zajmuje się badaniem abstrakcyjnych pojęć matematycznych stworzonych do opisu zjawisk, które nie są deterministyczne:

1. zmiennych losowych w przypadku pojedynczych zdarzeń oraz2. procesów stochastycznych w przypadku zdarzeń

powtarzających się (w czasie). • Jako matematyczny fundament statystyki, teoria

prawdopodobieństwa odgrywa istotną rolę w sytuacjach, w których konieczna jest analiza dużych zbiorów danych.

Jednym z największych osiągnięć fizyki dwudziestego wieku było odkrycie probabilistycznej natury zjawisk fizycznych w skali mikroskopowej, co zaowocowało powstaniem mechaniki kwantowej.

Statystyka

OPISOWA ANALIZA DANYCH(DESCRIPTIVE STATISTICS)

●Organizacja danych●Podsumowanie danych●Prezentacja danych

DEDUKCYJNA – MODELOWANIE STOCHASTYCZNE( STATISTICAL INFERENCE)

Podaje metody formułowania wniosków dotyczące obiektu badań (populacji generalnej) w oparciu o mniej liczny zbiór (próbę)

GRAFICZNA NUMERYCZNA

Wstęp do probabilistyki i statystyki. wykład 1 6

Czym zajmuje się probabilistyka i statystyka?

2015-03-23

4

Rys historyczny

Wstęp do probabilistyki i statystyki. wykład 1 7

• Matematyczna teoria prawdopodobieństwa sięga swoimi korzeniami do analizy gier losowych podjętej w siedemnastym wieku przez Pierre de Fermata oraz Blaise Pascala.

• Z tego powodu, początkowo teoria prawdopodobieństwa zajmowała się niemal wyłącznie zjawiskami dyskretnymi i używała metod kombinatorycznych. Zmienne ciągłezostały wprowadzone do teorii prawdopodobieństwa znacznie później.

• Za początek stworzenia współczesnej teorii prawdopodobieństwa powszechnie uważa się jej aksjomatyzację, której w 1933 dokonał Andriej Kołmogorow.

Hazard

Zdecydowana większość gier losowych opiera się na prawdopodobieństwie zdarzenia...

...oraz może być pod tym kątem analizowana.

●Prawdopodobieństwo trafienia „oczka”●Ilość unikatowych rozdań w pokerze

...najprostszy,jak rzut monetą, ...

...całkowicie losowy jak ruletka...

...złożony, jak rozdanie pokera...

Wstęp do probabilistyki i statystyki. wykład 1 8

2015-03-23

5

Rys historyczny

Blaise Pascal (1601-1662)

XVII w. , Paryż, Francja

Unieśmiertelnił kawalera de Méréoraz jego paradoks hazardowy

„Trójkąt Pascala” wykorzystywany przy potędze sumy

Wstęp do probabilistyki i statystyki. wykład 1 9

knkn

k

n bakn

ba −

=⎟⎟⎠

⎞⎜⎜⎝

⎛=+ ∑

0)(

dwumian Newtona

Trójkąt Pascala

Wstęp do probabilistyki i statystyki. wykład 1 10

166

656

1546

2036

1526

616

106

6

155

545

1035

1025

515

105

5

144

434

624

414

104

4

133

323

313

103

3

122

212

102

2

111

101

1

100

0

=⎟⎟⎠

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=

=⎟⎟⎠

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=

=⎟⎟⎠

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=

=⎟⎟⎠

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=

=⎟⎟⎠

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=

=⎟⎟⎠

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=

=⎟⎟⎠

⎞⎜⎜⎝

⎛=

n

n

n

n

n

n

n

!!)(!

kknn

kn

−=⎟⎟

⎞⎜⎜⎝

⎛Symbol

2015-03-23

6

Trójkąt Pascala

11 1

1 2 11 3 3 1

1 4 6 4 11 5 10 10 5 1

1 6 15 20 15 6 1

Wstęp do probabilistyki i statystyki. wykład 1 11

n = 0

n = 1

n = 2

n = 3

n = 4

n = 5

n = 6

+

Pierre de Fermat (1601-1665)

Początek XVII w., Touluse, Francja

Badał właściwości liczb pierwszych, teorię liczb, równolegle opracował metodę współrzędnych w geometrii. Razem z Pascalem stworzył podstawy pod współczesny rachunek prawdopodobieństwa.

Rys historyczny

Wstęp do probabilistyki i statystyki. wykład 1 12

2015-03-23

7

Siméon Denis Poisson (1781-1840)

XVIII-XIX w., Paryż, Francja

Przyjaciel Lagrange'a, uczeń Laplace'a na sławnej École Polytechnique.

Poza zagadnieniami fizycznymi zajmował się teorią prawdopodobieństwa.

Proces stochastyczny (podobnie jak pr. Markowa), rozkład Poissona -dystrybuanta!

Rys historyczny

Wstęp do probabilistyki i statystyki. wykład 1 13

Carl Frederich Gauss (1777-1855)

XVIII-XIX w., Getynga, Niemcy

Profesor Uniwersytetu w Getyndze

Genialny matematyk, który już w dzieciństwie wyprzedzał umiejętnościami rówieśników. W szkole podstawowej jako jedyny rozwiązał zadanie nauczyciela - zsumowanie liczb 1 do 40 –zauważając, że jest to (40+1)*20

Rozkład normalny, zwany krzywą Gaussa

Rys historyczny

Wstęp do probabilistyki i statystyki. wykład 1 14

2015-03-23

8

Paradoks kawalera de Méré

Dwaj hazardziści S1 i S2 umawiają się, że zagrają pewną serię partii i że zwycięzcą będzie ten, kto pierwszy wygra pięć partii.

Wstęp do probabilistyki i statystyki. wykład 1 15

Co należy zrobić, gdy trzeba będzie grę przedwcześnie przerwać?

Załóżmy, że S1 wygrywa cztery partie, a S2 tylko trzy. Jak sprawiedliwie podzielić stawki?Propozycja 1: podzielić stawki w stosunku 4:3

Propozycja 2: podzielić stawki w stosunku (5-3):(5-4)=2:1

wg W.R. Fuchs, Matematyka popularna, Wiedza Powszechna, Warszawa 1972

Paradoks kawalera de Méré

Blaise Pascal rozwiązał zadanie rozumując bardzo prosto. Aby rozstrzygnąć grę, należy zagrać jeszcze najwyżej dwie partie.

Wstęp do probabilistyki i statystyki. wykład 1 16

Jeżeli pierwszą partię wygra S1, to gra będzie rozstrzygnięta od razu.

Gdy pierwszą partię wygra S2, to wygranie drugiej partii przez S1przesądziłoby grę na jego korzyść.

Jednak jeśli pozostałe dwie partie wygra S2 to on zostanie zwycięzcą. Zatem sprawiedliwy podział stawki to 3:1

2015-03-23

9

Statystyka - typy danych

ILOŚCIOWE(QUANTITATIVE, NUMERICAL)

Przykłady:●Zbiór ludzi●Wiek●Wzrost●Wysokość zarobków

Obliczenia pewnych parametrów, jak np. średnia arytmetyczna, mediana, ekstrema, mają sens

JAKOŚCIOWE(QUALITATIVE, CATEGORIAL)

Przykłady:PłećStan cywilny

Można przypisać różnym cechom arbitralne wartości liczbowe.

Obliczenia parametrów nie mają sensu, można jedynie podawać np. udział procentowy

Wstęp do probabilistyki i statystyki. wykład 1 17

Pojęcie zmiennej losowej

RxeXRXee

ii ∈=→Ω

)(:

},,{ 21 K

Zmienna losowa jest to funkcja X, która przypisuje liczbę rzeczywistą x danemu wynikowi eksperymentu losowego.

Przykłady: 1) Rzut monetą: zdarzeniu ‘orzeł’ przypisujemy 1; zdarzeniu reszka

przypisujemy 0.2) Analog. losowanie wyrobów: zdarzeniu ‘brak’ (wadliwy) - 0, dobry – 13) Rzut kostką wyrzucenie ‘1’ – 1, ‘2’ – 2 itd…4) Odcinek [a, b] na osi liczbowej – wybór punktu o współrzędnej ‘x’

przypisujemy np. wartość x ; wartość sin2(3x+17) itp.…

Wstęp do probabilistyki i statystyki. wykład 1 18

2015-03-23

10

Zmienna losowa

dyskretna

Gdy wartości zmiennej losowej X są izolowanymi punktami na osi liczbowej (obejmują skończonyprzedział wartości)

• Rzut monetą• Błędy przy transmisji• Wadliwe układy na linii produkcyjnej• Ilość połączeń przychodzących w

ciągu 5 minut

ciągła

Gdy wartości zmiennej losowej stanowią wszystkie punkty odcinka(obejmują przedziałliczb rzeczywistych)

• Natężenie prądu w przewodniku• Temperatura• Ciśnienie

Wstęp do probabilistyki i statystyki. wykład 1 19

Graficzna prezentacja danych

Dane statystyczne można prezentować na wiele sposobów, np. częstość występowania danej cechy

x Ilość wystąpień Częstotliwość

1 3 3/23 = 0,1304

2 5 5/23 = 0,2174

3 10 10/23 = 0,4348

4 4 4/23 = 0,1739

5 1 1/23 = 0,0435

Razem: 23 1,0000

Wstęp do probabilistyki i statystyki. wykład 1 20

2015-03-23

11

Graficzna prezentacja danych

Wstęp do probabilistyki i statystyki. wykład 1 21

13%

22%

44%

17%

4%

Wykres kołowy1 2 3 4 5

1 0,13043478

2 0,2173913

3 0,43

4 0,17391

5 0,04347826

graf1

Graficzna prezentacja danych

Wstęp do probabilistyki i statystyki. wykład 1 22

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

1 2 3 4 5

Wykres kolumnowy

Serie1

1 0,13043478

2 0,2173913

3 0,43

4 0,17391

5 0,04347826

2015-03-23

12

Dane ilościowe

Wyniki 34 pomiarów (np. wielkość ziaren w [nm], temperatura w kolejnych dniach o godz. 11:00 w [deg. C], czas rozmów telefonicznych w [min], itp.

3,6 13,2 12 12,8 13,5 15,2 4,8

12,3 9,1 16,6 15,3 11,7 6,2 9,4

6,2 6,2 15,3 8 8,2 6,2 6,3

12,1 8,4 14,5 16,6 19,3 15,3 19,2

6,5 10,4 11,2 7,2 6,2 2,3

Tak podane wartości są mało czytelne!

Wstęp do probabilistyki i statystyki. wykład 1 23

Histogram

Sporządzenie wykresu (histogramu):1. Uporządkować zbiór wg. rosnących (lub malejących) wartości –

program Excel ma taką opcję.

2. Wyniki próby (o liczebności n) stanowią zbiór n-liczb (niekoniecznie różniących się od siebie). Celem ich ilustracji dzieli się je na klasy, tworząc tzn. szereg rozdzielczy.

3. Szerokość poszczególnych klas nie musi być taka sama, choć zwykle stosuje się klasy o tej samej szerokości

4. Ilość klas nie może być zbyt mała ani też zbyt liczna. Najbardziej optymalną liczbę klas 'k' określa reguła Sturge'a.

Wstęp do probabilistyki i statystyki. wykład 1 24

2015-03-23

13

Histogram

0 2 8 14 200

2

4

6

8

10

12

14

16

3 klasy

x

Czę

stość

bezw

ględ

na

Wstęp do probabilistyki i statystyki. wykład 1 25

Histogram

0 2 3,5 5 6,5 8 9,5 11 12,5 14 15,5 17 18,5 200

1

2

3

4

5

6

7

8

12 klas

x

Czę

stość

bezw

zglę

dna

Wstęp do probabilistyki i statystyki. wykład 1 26

2015-03-23

14

Histogram

0 2 2,5 3 3,5 4 4,5 5 5,5 6 6,5 7 7,5 8 8,5 9 9,5 10 10,5 11 11,5 12 12,5 13 13,5 14 14,5 15 15,5 16 16,5 17 17,5 18 18,5 19 19,50

1

2

3

4

5

6

7

8

35 klas

x

Czę

stość

bezw

zglę

dna

Wstęp do probabilistyki i statystyki. wykład 1 27

Reguła Sturge'a

k=1+3,3log10 n

n= 34k=5. 59≈ 6Dla naszego przykładu:

Liczebność próbki, n Liczba klas, k< 50 5 – 7

50 – 200 7 – 9200 – 500 9 – 10500 – 1000 10 -11

1000 – 5000 11 – 135000 – 50000 13 – 17

50000 < 17 – 20

Wstęp do probabilistyki i statystyki. wykład 1 28

2015-03-23

15

Histogram optymalny

0 2 5 8 11 14 17 200

0,05

0,1

0,15

0,2

0,25

0,3

6 klas (optymalnie)

x

Czę

stość

wzg

lędn

a

Wstęp do probabilistyki i statystyki. wykład 1 29

Rachunek prawdopodobieństwa i statystyka w nauce i technice

Statystyka umożliwia analizę i modelowanie rozwoju chorób oraz pomaga zapobiegać epidemiom.

Statystyka medyczna, np. średnia liczba zachorowań w regionie

Statystyka społeczna, np. gęstość zaludnienia

Statystyka gospodarcza, np. PKB, wydatki na opiekę zdrowotną

Liczba zachorowań na świńską grypę w roku 2009 w USA(Źródło: http://commons.wikimedia.org)

Wstęp do probabilistyki i statystyki. wykład 1 30

2015-03-23

16

Meteorologia

Modele pogodowe umożliwiające przewidywanie pogody oraz wykrywanie potencjalnych kataklizmów, np. huraganów

(Źródło:stormdebris.net/Math_Forecasting.html)

Wstęp do probabilistyki i statystyki. wykład 1 31

Wstęp do probabilistyki i statystyki. wykład 1 32

Opis problemu

Identyfikacja najważ-niejszychczynników

Przeprowadzenie eksperymentów

Propozycja modelu

Modyfikacja modelu

Potwierdzenierozwiązania

Wnioski i rekomendacje

Jak rozwiązuje się problem inżynierski?

2015-03-23

17

33

Przykład: Załóżmy, że inżynier projektuje przewód paliwowy,który ma zastosowanie w silnikach samochodowych. Inżynierwybiera grubość ściany 3/32 cale ale nie jest pewny czy to jestwystarczające dla uzyskania odpowiedniej siły ciągu.

Jak rozwiązuje się problem inżynierski?

Opis problemu

Identyfikacja najważniejszych czynników

Wyprodukowano osiem elementów, dla których zmierzono siły ciągu i otrzymano następujące wartości (w funtach): 12.6, 12.9, 13.4, 12.3, 13.6, 13.5, 12.6, 13.1. Siła ciągu może być traktowana jako zmienna losowa.

Wstęp do probabilistyki i statystyki. wykład 1

34Wstęp do probabilistyki i statystyki. wykład 1

Jak rozwiązuje się problem inżynierski?

Propozycja modelu

Przyjmijmy model, w którym zmienna losowa X jest przedstawiona jako:

Stała wartość Zaburzenie (błąd, szum)

Stała µ nie zmienia się przy kolejnych pomiarach. Małe zmiany w otoczeniu, układzie pomiarowym, różnice obserwowane dla obiektu mierzonego wpływają na wartość zaburzenia ε. W świecie rzeczywistym zawsze istnieją czynniki prowadzące do niezerowego zaburzenia. Musimy je opisać w sposób ilościowy i znaleźć sposób na ograniczenie ich wpływu na wynik pomiaru.

2015-03-23

18

35

Rysunek 1-2 przedstawia uzyskane wyniki w postaci diagramu punktowego (dot diagram).

Diagramy tego typu są użyteczne dla małej ilości danych (do ok. 20 obserwacji).

Wykresy tego typu pozwalają ocenić położenie (środek) i rozproszenie (rozrzut)

Średnia wartość siły ciągu wynosi 13.0 funtów.

Wstęp do probabilistyki i statystyki. wykład 1

Jak rozwiązuje się problem inżynierski?

Przeprowadzenie eksperymentów

36

Inżynier zmienia grubość ściany do 1/8 cali zakładając, że pomoże to zwiększyć siłę ciągu. Znowu zbudowano 8 prototypów, przeprowadzono eksperymenty i otrzymano wyniki siły ciągu: 12.9, 13.7, 12.8, 13.9, 14.2, 13.2, 13.5, 13.1. Wyniki, w porównaniu z poprzednim eksperymentem, zestawiono na Rys. 1-3.

.

Średnia wartość siły ciągu wynosi 13.4 funty.

Wstęp do probabilistyki i statystyki. wykład 1

Jak rozwiązuje się problem inżynierski?

Modyfikacja (udoskonalenie) modelu

2015-03-23

19

37

Wykres stwarza wrażenie, że zwiększenie grubości ściany prowadzi do wzrostu siły ciągu.

Wstęp do probabilistyki i statystyki. wykład 1

Jak rozwiązuje się problem inżynierski?

Potwierdzenie rozwiązania?

Jednak, pozostaje pytanie czy jest tak istotnie?

38Wstęp do probabilistyki i statystyki. wykład 1

Jak rozwiązuje się problem inżynierski?

Statystyka pomoże nam udzielić odpowiedzi na pytania:

• Skąd pewność, że inna próbka elementów nie da innych wyników?

• Czy próbka 8-elementowa jest wystarczająca aby dać wyniki, którym można ufać?

• Jeżeli użyjemy wyników, które do tej pory otrzymaliśmy, aby sformułować wniosek (decyzja), że wzrost grubości ściany jest korzystny, jak oszacować ryzyko z tym związane?

• Czy jest możliwe, że pozorny wzrost siły ciągu obserwowany dla grubszych elementów ma charakter jedynie losowy? Może nie ma sensu zwiększanie grubości ścian (powiększanie kosztów produkcji)?

Wnioski (rekomendacje?)

2015-03-23

20

http://physics.nist./gov/Uncertainty

Wyrażanie Niepewności Pomiaru. Przewodnik. Warszawa, Główny Urząd Miar 1999

H. Szydłowski, Pracownia fizyczna, PWN Warszawa 1999

A.Zięba, Postępy Fizyki, tom 52, zeszyt 5, 2001, str.238-247

A.Zięba, Pracownia Fizyczna WFiTJ, Skrypt Uczelniany SU 1642, Kraków 2002

Międzynarodowa Norma Oceny Niepewności Pomiaru (Guideto Expression of Uncertainty in Measurements-Międzynarodowa Organizacja Normalizacyjna ISO)

Wstęp do probabilistyki i statystyki. wykład 1 39

Rachunek niepewności pomiaru

POMIAR

Pomiary w laboratorium można podzielić napomiary wielkości:

prostychzłożonych

Przykład 1: Pomiar długości nici przymiarem metrowym, pomiarokresu drgań wahadła – pomiary wielkości prostych – pomiarybezpośrednieWyznaczanie przyspieszenia ziemskiego na podstawie wzoru

- pomiar wielkości złożonej

gl2T π=

Wstęp do probabilistyki i statystyki. wykład 1 40

2015-03-23

21

W trakcie pomiaru uzyskujemy wartości różniące się odprzewidywań teorii. Źródłem rozbieżności między teorią ieksperymentem są niedoskonałości:-osoby wykonującej pomiar,-przyrządów pomiarowych,-obiektów mierzonych

Gdy doświadczenie staje się doskonalsze, rozbieżności temaleją. Maleje błąd pomiaru, niepewność pomiaru.

POMIAR

Wstęp do probabilistyki i statystyki. wykład 1 41

Wynik pomiaru jest zawsze obarczony błędem ipo przeprowadzeniu odpowiedniej analizybłędów podajemy go w jednej z następującychpostaci:

2s/m)28(866,9g =

C10)398(F 3⋅±=

Przykład 2: Załóżmy, że przy wyznaczaniu równoważnika elektrochemicznego pewnego pierwiastka uzyskaliśmy następujące liczby:

k=0,0010963 g/C

Δk=0,0000347 g/C

Jak podać wynik?

cyfry znaczące cyfry nieznaczące

Odp. k= (0,00110 ± 0,00004) g/C lub k= 0,00110(4) g/C Wstęp do probabilistyki i statystyki. wykład 1 42

2015-03-23

22

Błąd bezwzględny pojedynczego pomiaru:

xi – wartość zmierzona, x0 – wartość rzeczywista

Błąd względny:

0ii xxx −=Δ

0

i

xxΔ

(1)

(2)

Niepewność a błąd pomiaru

Uwaga: wartości rzeczywiście wielkości mierzonej zazwyczaj nie są znane

Wstęp do probabilistyki i statystyki. wykład 1 43

Niepewność pomiaru

Wielkości określone wzorami (1) i (2) są pojedyncząrealizacją zmiennej losowej i nie wchodzą do teoriiniepewności. W praktyce nie znamy wartości rzeczywistychwielkości mierzonych i szacujemy niepewnościpomiarowe wynikające ze statystycznych praw rozrzutupomiarów.

Niepewność pomiaru jest• związanym z rezultatem pomiaru parametrem,• charakteryzującym rozrzut wyników, który można• w uzasadniony sposób przypisać wartości mierzonej.

Wstęp do probabilistyki i statystyki. wykład 1 44

2015-03-23

23

Niepewność u (ang. uncertainty) posiada wymiar, taki sam jak wielkość mierzona

Symbolika: u lub u(x) lub u(stężenie NaCl)

Niepewność względna ur(x) to stosunek niepewności (bezwzględnej) do wielkości

mierzonej:

xxuxur)()( =

Niepewność względna jest wielkością bezwymiarową i może być wyrażona w %

Wstęp do probabilistyki i statystyki. wykład 1 45

Miary niepewności

Istnieją dwie miary niepewności pomiaru:niepewność standardowa u(x)

niepewność maksymalna ∆x

x0

x

x0-u(x) x0+u(x)

x0-Δx x0+Δx

Wstęp do probabilistyki i statystyki. wykład 1 46

2015-03-23

24

Niepewność standardowa

Jest miarą dokładności pomiaru najpowszechniej stosowaną i uznawaną obecnie za podstawową.

1. Rezultat pomiaru jest zmienną losową xi , której rozrzut wokół wartości średniej x charakteryzuje parametr zwany odchyleniem standardowym

2. Dokładnej wartości odchylenia standardowego nie znamy. Niepewność standardowa jest jego niezbyt dokładnym oszacowaniem (estymatorem, oceną).

( )n

xx 2i

nlim ∑ −

=σ∞→

Wstęp do probabilistyki i statystyki. wykład 1 47

Niepewność maksymalna

Jest miarą deterministyczną, gdyż zakłada, żemożna określić przedział wielkości mierzonej x, wktórym na pewno znajdzie się wielkość rzeczywista.

W tym przypadku staramy się określić przedział

x0 - ∆x < xi < x0 + ∆x

w którym mieszczą się wszystkie wyniki pomiaru xi, aktualnie wykonane i przyszłe.

Zaleca się obecnie niepewność maksymalną specyfikowaną przez producenta zamieniać na niepewność standardową wg wzoru:

3x)x(u Δ

=

Wstęp do probabilistyki i statystyki. wykład 1 48

2015-03-23

25

Test 117.03.2015

Różne wartości,  xk

Krotności ich występowania,  nkCzęstości, wk

1. Wykonano 18 pomiarów masy pewnej próbki i otrzymano następujące wyniki xk [kg]: 20, 19, 16, 18, 24, 18,19, 21,19, 22, 18, 19, 19, 20, 19, 20, 21, 20. a) Uporządkować wyniki rosnącob) Uzupełnić tabelę, w której należy zestawić różne wartości xk

pod podając liczbę nk określającą , ile razy występuje dana wartość

c) Obliczyć częstość występowania danej wartości xkd) Narysować histogram

2. Dwaj hazardziści S1 i S2 umawiają się, że zagrają pewną serię partii i że zwycięzcą będzie ten, kto pierwszy wygra sześć partii.

Wstęp do probabilistyki i statystyki. wykład 1 50

W jakim stosunku należy podzielić stawki, gdy trzeba będzie grę przedwcześnie przerwać?

Zakładamy, że S1 wygrywa cztery partie, a S2 tylko trzy.

Ile partii trzeba rozważyć aby rozwiązać teoretycznie ten problem?

Test 117.03.2015

2015-03-23

26

Podział błędów

Wyniki pomiarów podlegają pewnymprawidłowościom, tzw. rozkładom typowym dlazmiennej losowej. Z tego względu błędy dzielimyna:

Błędy grube (pomyłki), które należy eliminować

Błędy systematyczne, które można ograniczyćudoskonalając pomiar

Błędy przypadkowe, które podlegają prawomstatystyki i rachunku prawdopodobieństwa,wynikają z wielu losowych przyczynków i niedają się wyeliminować

Wstęp do probabilistyki i statystyki. wykład 1 51

Krzywe rozkładu błędu

x xx0

x x0=x

Φ(x)Φ(x)

błąd systematyczny błąd przypadkowy-rozkład Gaussa

Wstęp do probabilistyki i statystyki. wykład 1 52

2015-03-23

27

Są wynikiem pomyłki eksperymentatora np. przy odczytywaniu wartości mierzonych, przy przeliczaniu jednostek etc., nieprawidłowego stosowania przyrządu pomiarowego, poważnego i nieuświadomionego uszkodzenia przyrządu pomiarowego, zastosowania nieodpowiedniej metody pomiaru lub niewłaściwych wzorów teoretycznych do opracowania wyników. Fakt zaistnienia błędu grubego należy sobie jak najszybciej uświadomić a wynik obarczony takim błędem wykluczyć z dalszych analiz. Jeśli to możliwe, pomiar powtórzyć.

Błędy grube

Wstęp do probabilistyki i statystyki. wykład 1 53

Błędy systematyczne zawsze w ten sam sposób wpływająna wyniki pomiarów wykonanych za pomocą tej samejmetody i aparatury pomiarowej. Minimalna wartość błędusystematycznego jest określona dokładnością stosowanegoprzyrządu (lub klasą w przypadku analogowych miernikówelektrycznych). Wprowadza się pojęcie działkielementarnej czyli wartość najmniejszej działki (odległośćmiędzy sąsiednimi kreskami na skali przyrządu lub ułamektej odległości określony klasą przyrządu), która określadokładność odczytu.

Błędy systematyczne

Wstęp do probabilistyki i statystyki. wykład 1 54

2015-03-23

28

Źródłem błędu systematycznego są: skalemierników (np. niewłaściwe ustawienie „zera”),nieuświadomiony wpływ czynników zewnętrznych(temperatura, wilgotność) na wartość wielkościmierzonej, niewłaściwy sposób odczytu (błądparalaksy) lub pomiaru, przybliżony charakterwzorów stosowanych do wyznaczenia wielkościzłożonej.

Błędy systematyczne czasami można ograniczyć wprowadzając poprawki, np.

)Rr4,21(v6F +πη=

Błędy systematyczne

Wstęp do probabilistyki i statystyki. wykład 1 55

Występują zawsze w eksperymencie, lecz ujawniają się gdy wielokrotnie dokonujemy pomiaru przyrządem, którego dokładność jest bardzo duża a błędy systematyczne wynikające z innych przyczyn są bardzo małe. Wynikają one z własności obiektu mierzonego(np. wahania średnicy drutu na całej jego długości), własności przyrządu pomiarowego (np. wskazania przyrządu zależą od przypadkowych drgań budynku, fluktuacji ciśnienia czy temperatury, docisku dla suwmiarki), lub mają podłoże fizjologiczne (refleks eksperymentatora, subiektywność oceny maksimum natężenia dźwięku czy równomierności oświetlenia poszczególnych części pola widzenia)

Błędy przypadkowe

Wstęp do probabilistyki i statystyki. wykład 1 56

2015-03-23

29

Błędy przypadkowe zawsze towarzyszą eksperymentowi, nawet jeśli inne błędy zostaną wyeliminowane. W przeciwieństwie do błędu systematycznego, ich wpływ na wynik ostateczny pomiaru można ściśle określić.

Błędy przypadkowe

Wstęp do probabilistyki i statystyki. wykład 1

57

Dawniej uważano, że miarą błędusystematycznego może być tylko niepewnośćmaksymalna. Nowa Norma traktuje błądsystematyczny jako zjawisko przypadkowe, gdyżnie znamy a priori jego wielkości i znaku. Normazaleca stosowanie niepewności standardowej u.

Typy oceny niepewności wg nowej Normy

Typ AMetody wykorzystujące statystyczną analizę serii

pomiarów:•wymaga odpowiednio dużej liczby powtórzeń pomiaru

• ma zastosowanie do błędów przypadkowychTyp B

Opiera się na naukowym osądzie eksperymentatora wykorzystującym wszystkie informacje o pomiarze i

źródłach jego niepewności•stosuje się gdy statystyczna analiza nie jest możliwa•dla błędu systematycznego lub dla jednego wyniku

pomiaru

Wstęp do probabilistyki i statystyki. wykład 1 58

2015-03-23

30

TYP A

Wstęp do probabilistyki i statystyki. wykład 1 59

Przykład 3 : Seria wyników (próba)

x1,x2, ….xn obarczonych niepewnością przypadkową jest duża gdy 30<n≤100. W próbie takiej wyniki się powtarzają: nk jest liczbą pomiarów, w których wystąpił wynik xk,

nk/n jest częstością występowania wyniku

xk nk nk/n

5,2 1 0,0115,3 1 0,0115,4 2 0,0215,5 4 0,0435,6 7 0,0755,7 10 0,1065,8 14 0,1495,9 16 0,1706,0 13 0,1386,1 12 0,1286,2 6 0,0646,3 4 0,0436,4 3 0,0326,5 1 0,011

Suma 94Wstęp do probabilistyki i statystyki. wykład 1 60

2015-03-23

31

Opracowanie serii pomiarów bezpośrednich dużej próby

5,2 5 ,4 5,6 5 ,8 6,0 6 ,2 6,40

2

4

6

8

10

12

14

16

nk

xk

H is togramŚrednia arytmetyczna

x=5,9

Odchylenie standardowe

( )1

)(2

−== ∑

nxx

xu iσ

σ=0,2

n

xx

n

ii∑

== 1

Wstęp do probabilistyki i statystyki. wykład 1 61

Niepewność standardowa średniej ( )

)1n(nxx

)x(u2

i

−−

= ∑

Rozkład normalny Gaussa

Gęstość prawdopodobieństwa wystąpienia wielkości x lubjej błędu Δx podlega rozkładowi Gaussa

x0 jest wartością najbardziej prawdopodobną i może być nią średnia arytmetyczna, σ jest odchyleniem standardowym, σ2 jest wariancją rozkładu

⎟⎟⎠

⎞⎜⎜⎝

⎛ −−=Φ 2

20

2)(exp

21)(

σπσxxx

Wstęp do probabilistyki i statystyki. wykład 1 62

2015-03-23

32

Rozkład normalny Gaussa

2σ95.4 % 99.7 %

x

Φ(x

)

W przedziale x0-σ < x < x0+σ zawiera się 68.2 % (2/3), w przedziale x0-2σ < x < x0+2σ zawiera się 95.4 %w przedziale x0-3σ < x < x0+3σ zawiera się 99.7 %

wszystkich wyników

68.2% pow.

Wstęp do probabilistyki i statystyki. wykład 1 63

0 5 10 15 20 25 300

1

2

3

Φ(x)

x

x0=15σ=2 σ=5

Pomiar o większym σ charakteryzuje się większym rozrzutem wyników wokół wartości średniej a zatem mniejszą precyzją

Wstęp do probabilistyki i statystyki. wykład 1 64

Rozkład normalny Gaussa

2015-03-23

33

TYP B

Wstęp do probabilistyki i statystyki. wykład 1 65

Dla oceny typu B wykorzystać można m.in.:

dane z pomiarów poprzednich,doświadczenie i wiedzę na temat przyrządów i obiektów

mierzonych,informacje producenta przyrządów,niepewności przypisane danym zaczerpniętym z literatury

Gdy informacja o pomiarze i źródle jegoniepewności jest dobra, dokładność oceny typu Bjest porównywalna z dokładnością oceny typu A.

Wstęp do probabilistyki i statystyki. wykład 1 66

TYP B

2015-03-23

34

Przykład 4: Ocena niepewności typu B dla pomiaru długościwahadła.

Długość wahadła mierzymy przymiaremmilimetrowym uzyskując wartość L=140 mm.Przyjmujemy niepewność równą działceelementarnej (działka skali 1mm). A zatemu(L)=1 mm, ur(L)=u(L)/L=1/140, błądprocentowy 0,7%

Najczęściej ocena typu B dotyczy określenianiepewności wynikającej ze skończonejdokładności przyrządu.

Wstęp do probabilistyki i statystyki. wykład 1 67

TYP B

NIEPEWNOŚĆ WIELKOŚCI ZŁOŻONEJ – PRAWO PRZENOSZENIA BŁĘDU

0 2 4

0

20

40

60

80

100

120

140

y

x

u(y)

u(x)

funkcja y = f(x)

styczna dy/dx

)x(udxdy)y(u =

Wstęp do probabilistyki i statystyki. wykład 1 68

2015-03-23

35

Metoda różniczki zupełnej

Dla wielkości złożonej y=f(x1,x2,...xn) gdyniepewności maksymalne Δx1 , Δx2 , ... Δxn sąmałe w porównaniu z wartościami zmiennychx1,x2, ... xn niepewność maksymalną wielkości ywyliczamy z praw rachunku różniczkowego:

nn

xxyx

xyx

xyy Δ

∂∂

++Δ∂∂

+Δ∂∂

=Δ ...22

11

(3)

Wstęp do probabilistyki i statystyki. wykład 1 69

Prawo przenoszenia niepewności

Niepewność standardową wielkości złożonejy=f(x1,x2,...xn) obliczamy z tzw. prawaprzenoszenia niepewności jako sumęgeometryczną różniczek cząstkowych

22

22

2

11

)(...)()()( ⎥⎦

⎤⎢⎣

∂∂

++⎥⎦

⎤⎢⎣

⎡∂∂

+⎥⎦

⎤⎢⎣

⎡∂∂

= nn

c xuxyxu

xyxu

xyyu

yyuyu c

cr)()( =

Wstęp do probabilistyki i statystyki. wykład 1 70

2015-03-23

36

Przykład

W pewnym eksperymencie wyznaczono przyspieszenie ziemskie g mierząc okres T i długość L odpowiedniego wahadła matematycznego. Wyznaczona długość wahadła wynosi 1.1325±0.0014 m. Niezależnie określona niepewność względna pomiaru okresu wahadła wynosi 0,06%, tj.

4r 106

T)T(u)T(u −⋅==

Obliczyć względną niepewność pomiarową przyspieszenia ziemskiego lub niepewność procentową zakładając, że niepewności pomiarowe L i T są niezależne i mają charakter przypadkowy.

Wstęp do probabilistyki i statystyki. wykład 1 71

0 40 80 120 160 200 240 280 32060708090

100110120130140150160170180

Zasady rysowania wykresów

Czy ten wykres jest narysowany zgodnie z zasadami?

1. Należy wyraźnie zaznaczyć punkty eksperymentalne !!!

Wstęp do probabilistyki i statystyki. wykład 1 72

2015-03-23

37

2. Trzeba nanieść błąd pomiaru

0 40 80 120 160 200 240 280 32060708090

100110120130140150160170180

Wstęp do probabilistyki i statystyki. wykład 1 73

3. Dobrać zakresy osi współrzędnych odpowiednio do zakresu zmienności danych pomiarowych !!!

0 40 80 120 160 200 240 280 32060708090

100110120130140150160170180

Wstęp do probabilistyki i statystyki. wykład 1 74

2015-03-23

38

4. Właściwie opisać osie współrzędnych i dobrać skalę, tak aby łatwo można było odczytać wartości zmierzone.

160 200 240 280 32060708090

100110120130140150160170180

co jest na osiach ???Wstęp do probabilistyki i statystyki. wykład 1 75

5. Nie łączyć punktów eksperymentalnych liniąłamaną!!! Jeśli znany jest przebieg teoretycznyto dokonać dopasowania teorii dodoświadczenia (przeprowadzić fitowanie)

160 200 240 280 32060

90

120

150

180

ρ [μ

Ω c

m]

T [K]Wstęp do probabilistyki i statystyki. wykład 1 76

2015-03-23

39

160 200 240 280 32060

90

120

150

180 dane eksperymentalne dopasowanie

ρ [μ

Ω c

m]

T [K]

6. Zadbać o aspekt estetyczny wykresu (opis,zamknięcie ramką, itp.)

Wstęp do probabilistyki i statystyki. wykład 1 77

160 200 240 280 32060

90

120

150

180

dane eksperymentalne dopasowanie

ρ [μ

Ω c

m]

T [K]

Wykres 1Rezystywnosc ρ probki Bi w funkcji temperatury T

Wstęp do probabilistyki i statystyki. wykład 1 78

2015-03-23

40

Metoda najmniejszych kwadratówRegresja liniowa

4 6 8 10 12 14 160

20

40

60

f(xi)yi

x i

y

x

f(x)=ax+ba=3.23, b=-2.08

( )[ ] min2

2 =∑ +−=n

iii baxyS

Wstęp do probabilistyki i statystyki. wykład 1 79

PODSUMOWANIE

1. Każdy pomiar w laboratorium jest obarczony niepewnością pomiarową, którą eksperymentator musi określić zgodnie z pewnymi zasadami.

2. W pierwszej kolejności należy przeanalizować źródła błędów, pamiętając, aby wyeliminować wyniki obarczone błędem grubym. W laboratorium studenckim błędy systematyczne z reguły przewyższają błędy przypadkowe.

3. Wielokrotne powtarzanie pomiarów, gdy dominuje błąd systematyczny, nie ma sensu. W takim przypadku dokonujemy tylko 3-5 pomiarów w tych samych warunkach w celu sprawdzenia powtarzalności.

Wstęp do probabilistyki i statystyki. wykład 1 80

2015-03-23

41

4. Gdy błąd przypadkowy dominuje w eksperymencie, należy sprawdzić czy rozkład wyników może być opisany funkcją Gaussa czy też należy spodziewać się innego rozkładu. W tym celu dokonujemy wielokrotnego (np. 100 razy) pomiaru w tych samych warunkach, obliczamy średnią i wariancję rozkładu, rysujemy histogram, etc.)

5. Jako miarę niepewności stosujemy raczej niepewność standardową, rzadziej niepewność maksymalną.

6. W przypadku wielkości złożonej, stosujemy prawo przenoszenia błędu. Staramy się przeprowadzić analizę niepewności wielkości złożonej tak, aby uzyskać informacje dotyczące wagi przyczynków, jakie wnoszą do całkowitej niepewności pomiary poszczególnych wielkości prostych. W tym celu należy analizować niepewności względne.

Wstęp do probabilistyki i statystyki. wykład 1 81

PODSUMOWANIE

7. Ważnym elementem sprawozdania z przebiegu eksperymentu (i to nie tylko w laboratorium studenckim) jest wykres. Wykresy sporządzamy zgodnie z dobrymi zasadami, pamiętając o jednoznacznym opisie.

8. Jeżeli znane są podstawy teoretyczne badanego zjawiska, na wykresie zamieszczamy krzywą teoretyczną (linia ciągła) na tle wyraźnych punktów eksperymentalnych (dobieramy odpowiednie symbole i nanosimy niepewności eksperymentalne). Możemy wcześniej dokonać dopasowania parametrów przebiegu teoretycznego w oparciu o znane metody „fitowania”

9. Zawsze, gdy to możliwe, dokonujemy linearyzacji danych eksperymentalnych, np. rysując y vs. ln (x), lub log y vs. log x, lub y vs. 1/x itp. Do tak przygotowanych danych można zastosować metodę regresji liniowej .

Wstęp do probabilistyki i statystyki. wykład 1 82

PODSUMOWANIE