If you can't read please download the document
Upload
august
View
32
Download
1
Embed Size (px)
DESCRIPTION
Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží. Zdeněk Karpíšek “Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky.” “Statistika je logická a přesná metoda, jak nepřesně sdělit polopravdu.”. Od vědy o státu a hazardních her k matematické statistice. - PowerPoint PPT Presentation
Citation preview
Statistick metody - nstroj poznn a rozhodovnanebo zdroj omyl a l
Zdenk Karpek
Jsou ti druhy l: li, odsouzenhodn li a statistiky.
Statistika je logick a pesn metoda, jak nepesn sdlit polopravdu.
Od vdy o sttu a hazardnch her kmatematick statistice
Statistika:
seln daje o hromadnch jevech
sbr, zpracovn a vyhodnocovn statistickch daj
teoretick disciplna
Ti etapy statistickho zkoumn:
zskvn statistickch daj statistickm zjiovnm (etenm)
kontrola, verifikace, tdn a agregace statistickch soubor
vyhodnocovn a rozbor zskanch statistickch daj
Aplikace vsledk + zptn vazba
Od vdy o sttu a hazardnch her kmatematick statistice
Popisn statistika:
vytvoen a tdn statistickch soubor
seln a grafick zpracovn
Teorie pravdpodobnosti:
nhodn jevy a pravdpodobnost
nhodn veliiny, vektory a procesy
Matematick statistika:
nhodn vbr
odhady parametr a rozdlen
testovn statistickch hypotz
Od vdy o sttu a hazardnch her kmatematick statistice
Historie:
Od vdy o sttu a hazardnch her kmatematick statistice
Historie:
Od vdy o sttu a hazardnch her kmatematick statistice
Historie:
Od vdy o sttu a hazardnch her kmatematick statistice
Historie:
Populace, vbr, nhoda a neuritost pat ksob
Zkladn soubor (populace) = souhrn statistickch jednotek
Statistick jednotky - statistick znaky - hodnoty
Populace, vbr, nhoda a neuritost pat ksob
Zkladn soubor ( vbrov soubor, rozsah
Vbry:
mal (obvykle do 30 a 50)
velk (dov stovky, tisce i vce)
Poadavky na vbr:
reprezentativn (informace bez omezen)
homogenn (bez vlivu dalch faktor)
nhodn
Neuritost vbru = zkreslen informac o zkladnm souboru
Populace, vbr, nhoda a neuritost pat ksob
Statistick soubor = soubor pozorovanch hodnot (x1, x2, , xn)
znaku X na vybranch statistickch jednotkch
Druhy vbr:
bezopakovn
sopakovnm
zmrn
oblastn
mechanick
Prmry a jejich ctnosti i nectnosti
Zpracovn statistickho souboru = pprava + grafick znzornn + vpoet selnch charakteristik
Roztdn soubor - tdy, sted a etnost
Grafy = vizuln informace o poloze, variabilit, symetrii, modalit,
Prmry a jejich ctnosti i nectnosti
seln (empirick) charakteristiky = seln informace
o poloze, variabilit, symetrii, modalit,
Aritmetick prmr = (x1 + x2 + (((+ xn)/n
Medin = prostedn hodnota uspodanho souboru
Pklad:
Msn platy 10 pracovnk (v tis. K): 3, 3, 4, 4, 5, 6, 7, 7, 11, 50.
Prmrn msn plat = 100/10 = 10.
Medin msnho platu = 5 a 6 ( (5 + 6)/2 = 5,5.
Prmrn msn plat po zmn (50 na 100) = 150/10 = 15.
Medin msnho platu po zmn (50 na 100) = 5 a 6 ( (5 + 6)/2 = 5,5.
Graf2
2
2
1
1
2
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
3 4 5 6 7 11 50
5,5 10
etnost
Tdy
etnost
Histogram
List7
Tdyetnost
32
42
51
61
72
80
90
100
111
120
130
140
150
160
170
180
190
200
210
220
230
240
250
260
270
280
290
300
310
320
330
340
350
360
370
380
390
400
410
420
430
440
450
460
470
480
490
501
Dal0
List7
3 4 5 6 7 11 50
5,5 10
etnost
Tdy
etnost
Histogram
List1
33322
34422
45511
46611
57722
611801
750901
7100
11111
50120
130
140
150
160
170
180
190
200
210
220
230
240
250
260
270
280
290
300
310
320
330
340
350
360
370
380
390
400
410
420
430
440
450
460
470
480
490
500
511
List2
List3
Prmry a jejich ctnosti i nectnosti
Vlastnosti prmru:
pomrn citliv na zmnu hodnot souboru
u kladn (zporn) asymetrickch soubor je prmr vt (men) ne medin
konvergence s rostoucm rozsahem souboru kprmru cel populace
rychl konvergence rozdlen pravdpodobnosti prmru k normlnmu rozdlen
Mme promnlivost veliin a vztahy mezi nimi
Rozptyl (disperze) = prmr kvadrt odchylek od prmru
Smrodatn odchylka = druh odmocnina z rozptylu
Graf1
01
00
11
10
22
22
21
11
11
00
01
Hmotnost
etnost
Balky kvy
List1
67656501
68676600
69696711
69696810
70706922
70707022
71717121
71727211
72737311
73757400
37.497501
List1
Hmotnost
etnost
Balky kvy
List2
List3
Pklad:
Dva soubory hmotnosti balku kvy (v gramech):
1. automat: 67; 68; 69; 69; 70; 70; 71; 71; 72; 73
2. automat: 65; 67; 69; 69; 70; 70; 71; 72; 72; 75
Prmrn hmotnost je stejn = 70
Rozptyl (smrodatn odchylka) pro 1. automat = 3,00 (1,732)
Rozptyl (smrodatn odchylka) pro 2. automat = 7,49 (2,737)
Mme promnlivost veliin a vztahy mezi nimi
Koeficient korelace = normovan kovariance = prmr souin odchylek od prmr/souin smrodatnch odchylek (hodnoty od -1 do 1)
Mme promnlivost veliin a vztahy mezi nimi
Koeficient korelace = 0 nemus znamenat nezvislost
Regresn analza = "jemnj" vyjden zvislosti mezi znaky a predikce
y = 0,361 + 0,181x ; y(10) ( 2,172; r = 0,984798
y(10) ( ; y(10) (
Mme promnlivost veliin a vztahy mezi nimi
Rozdlen pravdpodobnosti a zkon velkch sel jsou obrazem ns i okolnho svta
Pravdpodobnost P(A) - teoretick mra monosti nastoupen nhodnho jevu A
Klasick definice: P(A) = m/n
m = poet pznivch ppad jevu A
n = poet vech monch ppad
Axiomatick definice - zaloen na teorii mnoin
Funkn charakteristiky: distribun funkce, hustota aj.
seln charakteristiky: stedn hodnota, rozptyl aj.
Rozdlen pravdpodobnosti pro modelovn relnch jev: binomick, hypergeometrick, normln aj.
Rozdlen pravdpodobnosti a zkon velkch sel jsou obrazem ns i okolnho svta
Bernoulliv zkon velkch sel - asymptotick chovn relativn etnosti
Normln rozdlen - vznamn postaven pi modelovn relnho svta
Rozdlen pravdpodobnosti a zkon velkch sel jsou obrazem ns i okolnho svta
Rozdlen pravdpodobnosti a zkon velkch sel jsou obrazem ns i okolnho svta
Vbrov charakteristiky a kletba statistikova
Zkladn lohy matematick statistiky:
odhady parametr a rozdlen
testovn statistickch hypotz o parametrech a rozdlench
Principy matematick statistiky:
hodnoty zskan vbrem ze zkladnho souboru jsou nhodn
zskan statistick soubor je hodnotou nhodnho vbru
Statistick indukce:
Vbrov charakteristiky a kletba statistikova
Nap.:
Stedn hodnota vbrovho prmru = stedn hodnota pozorovan veliiny ("prmru" populace) a rozptyl vbrovho prmru ( 0 pro n ( ( , take pro dostaten velk n je takka jist prmr souboru blzk neznm stedn hodnot; avak tento rozptyl ( 0 s rychlost n1/2. Velmi asto vak rozdlen vbrovho prmru konverguje krozdlen normlnmu:
Vbrov charakteristiky a kletba statistikova
Je lep odhad statistika anebo experta?
Odhad parametru ( = vbrov charakteristika T(X1,,Xn)
Bodov odhad (: t = T(x1,..,xn)
Intervalov odhad ( se spolehlivost 1 - (: konfidenn interval
(
Riziko chybnho odhadu = (
Je lep odhad statistika anebo experta?
Pklad:
Pi przkumu nzoru z dotzanch n osob eklo "ano" x osob.
Pro spolehlivost 0,95:
n
x
Bodov odhad (%)
Intervalov odhad (%)
Od
Do
400
80
20
16,08
23,92
1600
320
20
18,04
21,96
6400
1280
20
19,02
20,98
Nezamtnut statistick hypotzy jet nen potvrzen jej sprvnosti
Statistick hypotzy = tvrzen o vlastnostech pozorovanho statistickho znaku
Nulov hypotza H0 ( Alternativn hypotza HA
Algoritmus testovn hypotzy pomoc statistickho souboru:
1. Stanoven hypotz H0 a HA.
2. Volba testovho kritria T(X1,,Xn).
3. Vpoet hodnoty testovho kritria
t = T(x1,..,xn).
1. Stanoven hladiny vznamnosti (
a kritickho oboru W(.
2. Rozhodnut o hypotzch H0 a HA.
Hladina vznamnosti:
( = obvykle 5% anebo 1%
Nezamtnut statistick hypotzy jet nen potvrzen jej sprvnosti
Rozhodnut:
t ( W( ( H0 zamtme a HA nezamtme
t ( W( ( H0 nezamtme a HA zamtme
H0
PLAT
NEPLAT
ZAMTME
CHYBA 1. DRUHU
-------
NEZAMTME
-------
CHYBA 2. DRUHU
Rizika :
pravdpodobnost chyby 1. druhu = hladina vznamnosti (
pravdpodobnost chyby 2. druhu sniujeme zvenm rozsahu
Aspekty:
nezamtnut hypotzy neznamen vdy jej pijet (
( zvme rozsah vbru a znovu testujeme
nezamtnut nebo pijet hypotzy nen potvrzen jej platnosti
Nezamtnut statistick hypotzy jet nen potvrzen jej sprvnosti
Pouvn statistickch metod pi zen jakosti technologickch proces nen samoeln ani mdou
Statistick metody (SPC) = nstroje pro hodnocen a zen jakosti vroby (QC)
Shewhartovy regulan diagramy:
regulace menm (normln rozdlen)
regulace porovnvnm (binomick a Poissonovo rozdlen)
Pouvn statistickch metod pi zen jakosti technologickch proces nen samoeln ani mdou
Aplikace:
vbry relativn malch skupin sledovanch vrobk ke kontrole bhem vroby ve stanovench asovch intervalech
grafick zpracovn selnch charakteristik pro informace o negativnch vlivech na kvalitu vroby
pi vyboen sledovan charakteristiky mimo statisticky uren meze zsah nebo vyhodnocen pro ppravu dal vroby
Dsledek : finann efekt pro vrobce a zven dvry odbratele
Nyn: SPC soust norem pro QC na sttn a nadsttn rovni i obsahem pruek jakosti u jednotlivch firem (certifikace)
Dal metody: zpsobilost vrobnch proces, statistick pejmky, optimalizace nklad aj.
Spolehlivost vrobku se d mit a spn vyuvat
Spolehlivost vrobku = jeho schopnost plnit poadovan innosti
Statistick princip: doba bezporuchovho stavu, doba opravy apod. sledovanho objektu jsou nhodn veliiny
Charakteristiky spolehlivosti:
funkn: funkce spolehlivosti, intenzita poruch, hustota obnov aj.
seln: stedn doba do poruchy, koeficient pohotovosti aj.
Spolehlivost vrobku se d mit a spn vyuvat
Postupy:
odhady charakteristik ze statistickch soubor asto speciln orientovanmi metodami podle realizace zkouek (nap.cenzorovan vbry)
plny drby
pravdpodobnostn modely systm - celk (nap. vrobn linky, energetick bloky)
optimalizace spolehlivosti vzhledem k nkladm
Efekty spolehlivosti: uitn hodnota, bezpenosti, cena
Pro a jak nkdy statistiky lou, a co dl
No to snad ne!?
Pro a jak nkdy statistiky lou, a co dl
Pro a jak nkdy statistiky lou, a co dl
k se, e statistiky nkdy lou. Pojmy, metody a postupy matematick statistiky jsou soust matematiky, tedy produktem naeho abstraktnho mylen. Jejich aplikace (tzv. statistiky) jsou vsledkem konkrtn innosti lid, kter me bt seriozn anebo naopak neseriozn. Ve druhm ppad pak me jt bu o nevdomost anebo zmr. Tak i onak za to samy statistiky nemohou - lht me jen lovk. Statistiky proto nelou, avak hor to bv sjejich realiztory a vykladai, kte znich nkdy polopravdy, nepravdy, ppadn a li vytvej. Racionln a zodpovdn pouvn statistickch metod naopak pin pozitivn vsledky tm, e roziuje nae poznn okolnho svta i sebe sama a umouje nm eln rozhodovat o naem dalm konn. Avtom lze vidt i jejich mon pnos vbudoucnosti.