View
9
Download
0
Category
Preview:
Citation preview
Základy zpracování dat
chemometrie, statistika
Doporučená literatura
• Pytela O., Chemometrie pro organické chemiky (prodejna skript)
• Hendl J., Přehled statistických metod zpracování dat, Portál, Praha 2004
• Otyepka (web: fch.upol.cz; chemie.upol.cz)
Pravděpodobnostelementární základy
Náhodné jevy
• statistická definice pravděpodobnosti• náhodný pokus
– různé možné výsledky– nelze určit, který v daném pokusu získáme– pokusy lze opakovat a jednotlivá opakování se
neovlivňují
• všechny možné výsledky = prostor náhodných výsledků– př. mince „orel“, „panna“
• množina výsledků = náhodný jev• náhodný jev – jeden výsledek = elementární jev
– př. kostka „sudá“ – náhodný jev; padnutí dvou ok –elementární jev
• jev jistý = všechny možné výsledky náhodného pokusu
• jev nemožný• sjednocení jevů (padne 2 nebo 3)• současný výskyt (padne sudá a 2)• vylučující-se jevy, disjunktní jevy
BA∪BA∩
prázdná =∩ BA
Pravděpodobnost
• pravděpodobnost náh. jevu A je číslo P(A) ~relativní četnost jevu A
( )
( )( )( )( ) ( )APAPAPAPAP
APn
mAn
−===
∉
=∞→
101
1,0
lim
Náhodná proměnná
• výsledku náh. pokusu přiřadíme číslo →náh. proměnná
prostor náhodných
výsledků
reálná čísla
náhodnáproměnná
Rozdělení náhodné proměnné
• pravděpodobnost, kterých náhodná proměnná nabývá (nebo interval) –pravděpodobnostní rozdělení (rozdělení) náhodné proměnné
• náhodná proměnná– diskrétní (házení kostkou, ruleta ...)– spojitá (měření délek, apod.)
př. rozdělení
• kostka – diskrétní rozdělení
xi 1 2 3 4 5 6
pi 1/6 1/6 1/6 1/6 1/6 1/6
• náh. proměnná se řídí daným zákonem rozdělení
Distribuční funkce
• F(x), nejúplnější popis pravd. chování náh. proměnné X
( ) ( ) ( )∞∞−∈≤= , , xxXPxF( )
1)(lim
0)(lim1 ,0
=
=
∈
∞→
−∞→
xF
xFxF
x
x
neklesající, nemusí být spojitá
Hustota pravděpodobnostifrekvenční funkce
• má-li F(x), pro všechna x derivaci, nazýváme derivaci F(x) podle x hustotou pravděpodobnosti f(x); rozdělení s hustotou jsou vždy spojitá!
( ) ( )∫∞−
=x
xxfxF d
Distribuční funkce frekvenční funkce
Kvantil
1−= FQ
kvantilová funkce
5.0xmedián
25.0x 75.0x
dolní kvartil
horní kvartil
Normální rozdělení
• též Gaussovo rozdělení
( )
( )( )
( )2
2
2
,~
21
,
2
2
σμ
πσ
σμ
σ
μ
NX
exf
Nx−
−
=
Normální rozdělení
Nor. roz a EXCEL
• cvičení – EXCEL• pomocí EXCELu vytvořte graf frekvenční a
distribuční funkce normálního rozdělení• nápověda: funkce statistické, NORMDIST
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
-10 -8 -6 -4 -2 0 2 4 6 8 10
Obecné a centrální momenty
• střední hodnota = 1. ob. moment( ) ( ) ( )
( )( ) ( )( )
( )( )kk
kk
x
XEXE
XEXEX
XE
xxxfxFxXE
−=
−=
=′
== ∫∫∞
∞−
∞
∞−
μ
μ2var
dd
( )( )( ) 2
2
var
,
σ
μ
σμ
=
=
xxE
N
Důležité vlastnosti
výběr 1
Výběrové rozdělení stř. hod.
populace výběr 2náhodný výběr2,σμ
náhodný výběr⎟⎟⎠
⎞⎜⎜⎝
⎛
nN
2
,σ
μ
Centrální limitní teorém• významné postavení norm. rozdělení
Normování
( ) ( )
σμ
σμ
−=
→
Xz
NN 1 ,0, 2
Výběrové rozdělení stř. hod.neznáme σ
populace výběr 2náhodný výběr
σσ
σμ
ˆ?
, 2
=
( )( )
( ) ( )1~/
−=−
=− nvt
nsXE
sXE
XE
μμ
Studentovo rozděleníStudent = W. S. Gosset
(sládek u Guinesse)
Výběrové rozdělení rozptylu
• chí-kvadrát (chi-square) • EXCEL = CHIDIST, CHIINV
2χ
Výběrové rozdělení poměrů rozptylů
• F-rozdělení (Fisherovo)• EXCEL = FDIST, FINV
vyžaduje se normalita dat
Kovariance, korelacekovariance
korelace
Recommended