34
1 Základy teórie pravdepodobností

Základy teórie pravdepodobností

  • Upload
    kairos

  • View
    74

  • Download
    0

Embed Size (px)

DESCRIPTION

Základy teórie pravdepodobností. Často sa hovorí, že štatistika je “ aplikovaný počet pravdepodobností” Š tatistika popisná - vyčerpávajúce skúmanie (veda o štáte, popisná aritmetika) induktívna - výberové skúmanie (štatistické analýzy, výberové vzorky ). - PowerPoint PPT Presentation

Citation preview

Page 1: Základy  teórie pravdepodobností

1

Základy teórie pravdepodobností

Page 2: Základy  teórie pravdepodobností

2

Často sa hovorí, že štatistika je “aplikovaný počet pravdepodobnost픊tatistika

popisná - vyčerpávajúce skúmanie (veda o štáte, popisná aritmetika)

induktívna - výberové skúmanie (štatistické analýzy, výberové vzorky)

Most medzi oboma druhmi štatistiky tvorí teória pravdepodobnosti

• tvorí teoretický základ pre posudzovanie spoľahlivosti a presnosti výberových postupov

Page 3: Základy  teórie pravdepodobností

3

Výberový súborVýberový súbor

Základný

súbor

Základný

súbor

Rozsah ZS >> VS Rozsah ZS >> VS

Page 4: Základy  teórie pravdepodobností

4

ZÁKLADNÉ POJMY TP:

Náhodný jav, je jav ktorý ako výsledok určitého pokusu (komplexu podmienok) môže alebo nemusí nastať. Označujeme veľkými písmenami zo začiatku abecedy A,B,C....

Extrémnymi prípadmi javov je jav istý a jav nemožný.

Jav istý (I)je taký jav ktorý ako výsledok daného pokusu nastane vždy.

Jav nemožný (O)je taký jav ktorý ako výsledok pokusu nemôže nastať nikdy.

Pravdepodobnosť je číselná miera možnosti nastatia náhodného javu

n

mAP

Page 5: Základy  teórie pravdepodobností

5

KLASICKÁ definícia pravdepodobnosti (Pierre Simon Laplace)

n

mAP

n.... Počet všetkých možných výsledkov pokusu

m... Počet výsledkov pokusu v ktorých jav A nastane (priaznivé výsledky).

ŠTATISTICKÁ definícia pravdepodobnosti (Richard von Mises)

n

mAP

n lim

Táto definícia je spojená s pojmon relatívnej početnosti, kedy pri malom počte pokusov má relatívna početnosť náhodný charakter.S rastúcim počtom pokusov sa však stabilizuje a približuje k určitému číslu (pravdepodobnosti).

Page 6: Základy  teórie pravdepodobností

6

Quetélet meral obvod hrude 5738 škótskych

vojakov

Page 7: Základy  teórie pravdepodobností

7

Základné vlastnosti pravdepodobnosti

10 )A(P

.)(P 00

1)I(P

A A

)A(P)A(P 1

Pravdepodobnosť, ako číselná miera možnosti nastatia náhodného javu, má niektoré dôležité vlastnosti:

1.Pre každý náhodný jav A platí:

3. Pravdepodobnosť javu nemožného 0 ( jav, ktorý ako výsledok náhodného pokusu nikdy nenastane) je rovný nule:

2. Pravdepodobnosť javu istého I ( jav, ktorý ako výsledok

náhodného pokusu nastane vždy ) je rovná jednej:

.

4. Pravdepodobnosť javu opačného k javu sa rovná:

Page 8: Základy  teórie pravdepodobností

8

Náhodný jav charakterizuje výsledok náhodného pokusu kvalitatívne (slovne). V mnohých prípadoch je však výhodnejšie charakterizovať výsledok kvantitatívne (číselne), k čomu používame náhodnú premennú.

Náhodná premenná je taká premenná, ktorá môže nadobúdať rôzne hodnoty, alebo hodnoty z rôznych intervalov v závislosti na náhode. Náhodné veličiny budeme označovať veľkými písmenami s konca abecedy X,Y,Z a ich konkrétne hodnoty: xj, j=1,2…n

Na štatistické znaky môžme pozerať ako na náhodné premenné NP……….

Členenie NP:diskrétne (DNP) -nadobúdajú izolované, väčšinou celočíselné hodnoty, napr. počet narodených chlapcov z 1000 narodených detí, počet chybných výrobkov….

spojité (SNP)-môžu nadobúdať ľubovoľné hodnoty z ohraničeného, alebo neohraničeného intervalu, napr.: hmotnosť, výška človeka, chyby merania v mm, príjem...

Page 9: Základy  teórie pravdepodobností

9

Náhodná premenná je plne popísaná zákonom rozdelenia NP

Zákon rozdelenia náhodnej premennej je pravidlo pomocou, ktorého definujeme obor hodnôt NP a pravdepodobnosti s ktorými tieto hodnoty nadobúda.

Môže byť vyjadrený rôznymi formami

pravdepodobnostná tabuľka, alebo rad rozdelenia

distribučná funkcia

funkcia hustoty pravdepodobnosti

DNP má dve formy zákona rozdelenia:

–- pravdepodobnostná tabuľka, alebo rad rozdelenia

–- distribučná funkcia

SNP má dve formy zákona rozdelenia:

– distribučná funkcia

– funkcia hustoty pravdepodobnosti

Page 10: Základy  teórie pravdepodobností

10

Pravdepodobnostná tabuľka- rad rozdelenia pravdepodobností - popisuje len diskrétnu náhodnú premennú (DNP),

je najjednoduchšou formou zákona rozdelenia

xi x1 x2 ... xnSpolu

pi p1 p2 ... pn 1

V prvom riadku tabuľky sú uvedené všetky možné hodnoty diskrétnej premennej a druhom riadku im zodpovedajúce pravdepodobnosti

Page 11: Základy  teórie pravdepodobností

11

Distribučná funkcia je univerzálnejšou formou vyjadrenia zákona rozdelenia, slúži k popisu tak diskrétnej ako aj spojitej NP. Každému reálnemu číslu priraďuje pravdepodobnosť,že NP nadobudne hodnotu menšiu než toto číslo tj.:

F(x) = P(X x)

Každá distribučná funkcia má tieto základné vlastnosti

1. , tj. distribučná funkcia nadobúda hodnoty od nuly do jednej vrátane.

2. a

3. Distribučná funkcia je neklesajúca tzn.: ak

4.

5. Distribučná funkcia je spojitá zľava.

10 )X(F

0 )(F 1)(F

)()(x 2121 xFFxx

)()()( 1221 xFxFxXxP

Graf distribučnej funkcie zodpovedá v popisnej štatistike grafu kumulatívnych relatívnych početností.

Page 12: Základy  teórie pravdepodobností

12

0

0,2

0,4

0,6

0,8

1

-3 -2 -1 0 1 2 3

F(x)

x

x

Distribučná funkcia DNP Distribučná funkcia SNP

Page 13: Základy  teórie pravdepodobností

13

Funkcia hustoty pravdepodobnosti

Pre spojitú náhodnú premennú je možné definovať zákon rozdelenia pomocou funkcie hustoty pravdepodobnosti f(x), alebo stručne hustota NP )()( xFxf

x

dttfxXPxF )()()(

Funkcia hustoty pravdepodobnosti má tieto základné vlastnosti:

1. )()( xFxf

2.

3.

4.

0)( xf x

2

1

)()()()( 1221

x

x

xFxFdxxfxXxP

1)( dxxf

Page 14: Základy  teórie pravdepodobností

14

Funkcia hustoty

0

0,1

0,2

0,3

0,4

0,5

-3 -2 -1 0 1 2 3

f(x)

x

F(x)

Page 15: Základy  teórie pravdepodobností

15

Koncentrovaný popis rozdelenia náhodných premenných využíva (podobne ako v popisnej štatistike), číselné hodnoty, ktoré nazývame charakteristiky náhodných premenných. Najčastejšie používanými charakteristikami sú stredná hodnota, popisujúca polohu (úroveň) náhodnej premennej a rozptyl popisujúci variabilitu náhodnej premennej

Charakteristiky náhodných premenných

k

iii pxXE

1

.)(

dxxfxXE )(.)(

Pre DNP Pre SNP

Page 16: Základy  teórie pravdepodobností

16

Rozptyl je mierou variability náhodnej premennej, pričom ho môžeme všeobecne definovať v tvare:

222 )()()()( XEXEXExEXD

k

iii pXExXD

1

2 .)()(

Pre DNP Pre SNP

dxxfXExXD )()()( 2

Pri popise náhodných premenných, najmä spojitých, sa veľmi často používajú tiež kvantily: p % kvantilom náhodnej premennej X, ktorá má spojité rozdelenie s distribučnou funkciou a hustotu pravdepodobnosti je číslo , pre ktoré platí:

px

pp dxxfxFxXP )()()( 10 pkde

Page 17: Základy  teórie pravdepodobností

17

Najčastejšie používané rozdelenia náhodných premenných

Diskrétne rozdelenia NP Rozdelenia spojitej NP

1. Alternatívne rozdelenie2. Binomické rozdelenie 3. Poissonovo rozdelenie4. Hypergeometrické

rozdelenie

a iné

1. Normálne rozdelenie

2. Normované normálne rozdelenie

3. Rovnomerné rozdelenie

4. Exponenciálne rozdelenie

5. Weibullovo rozdelenie

6. Gama rozdelenie

a iné

Výberové rozdelenia

•chí- kvadrát rozdelenie

•Studentovo t – rozdelenie

•F- rozdelenie

2

Page 18: Základy  teórie pravdepodobností

18

Alternatívne rozdelenieNáhodná premenná X má alternatívne rozdelenie

s parametrom , kde , a ak nadobúda len dve hodnoty x = 0, a x = 1 a to s pravdepodobnosťami a , kde .

Stredná hodnota alternatívneho rozdelenia je

a rozptyl

Uvedenú náhodnú premennú nazývame nula – jedničková, v praxi sa používa pri popise výskytu určitého javu.

p 10 ppXP 1)0(

pXP )1( 10 p

pXE )(

)1()( 2 ppppXD

Rozdelenia diskrétnej náhodnej premennej

Page 19: Základy  teórie pravdepodobností

19

Binomické rozdeleniePredpokladajme, že určitý pokus opakujeme n- krát za tých istých podmienok ( tj. takých pokusov, kedy výsledok žiadneho pokusu neovplyvní pravdepodobnosť výsledkov iných pokusov), pri ktorých môže nastať jav A s pravdepodobnosťou p, a nenastane s pravdepodobnosťou .

Pravdepodobnosť, že sa jav A objaví práve k- krát, je daná vzťahom:

pq 1

knkk q.p

k

n)kX(Pp

kde k = 0, 1, 2, ..., n

Hodnoty n a p sú parametre binomického rozdelenia tj. také veličiny, ktoré musíme poznať, aby sme mohli ľubovoľnému X priradiť jeho pravdepodobnosť . Pre strednú hodnotu a rozptyl náhodnej premennej s binomickým rozdelením platí

np)X(E npq)X(D

Page 20: Základy  teórie pravdepodobností

20

Poissonovo rozdelenie

Predpokladajme, že počet pokusov n je dostatočne veľký (stačí ) a pravdepodobnosť p je veľmi malá (prakticky ), potom môžeme binomické rozdelenie aproximovať Poissonovým rozdelením s parametrom

Pravdepodobnostná funkcia Poissonovho rozdelenia je daná vzťahom

n30n ,10p

p.n

e.

!xp

k

kKde k = 0, 1, 2, ...

Pre strednú hodnotu a rozptyl náhodnej veličiny s Poissonovým rozdelením platí ich rovnosť, tj )X(D)X(E

Poissonovo rozdelenie tým lepšie aproximuje binomické rozdelenie, čím väčší je počet pokusov n a čím menšia je pravdepodobnosť p Riadi sa ním počet javov v priestorovej jednotke alebo počet udalostí v časovej jednotke. Niekedy sa zvykne Poissonovo rozdelenie označovať ako zákon vzácnych resp. zriedkavých javov. Príkladom môže byť počet výskytov vzácneho ochorenia zvierat, výskyt porúch strojného zariadenia v čase t, a pod.

Page 21: Základy  teórie pravdepodobností

21

Hypergeometrické rozdelenie

Predpokladajme, že v súbore N prvkov ich M má určitú vlastnosť A. Zo súboru náhodne vyberieme n prvkov, bez toho aby sme ich vracali späť do pôvodného súboru ( tzv. výber bez opakovania ). Počet prvkov s vlastnosťou A , ktoré boli vybrané do výberu prvkov je zrejme náhodná premenná X, ktorá môže nadobúdať hodnoty

)n,Mmin(,),NMn,max(k 0

s pravdepodobnosťami

n

N

kn

MN

k

M

pk

Ak je rozsah výberu príliš malý vzhľadom na rozsah základného súboru , je možné hypergeometrické rozdelenie úspešne nahradiť binomickým rozdelením. V praxi sa často vyskytuje tiež aproximácia hypergeometrického rozdelenia Poissonovým rozdelením s parametrom

náhrada je kvalitná už pri a .

Hypergeometrické rozdelenie sa využíva v teórii výberových šetrení a štatistickej kontrole akosti.

N

Mn

1,0N

M1,0

M

n

Page 22: Základy  teórie pravdepodobností

22

Rozdelenia spojitej náhodnej premennejNormálne rozdelenie (Gaussovo)

Normálne rozdelenie má v štatistike kľúčové postavenie, slúži ako pravdepodobnostný model chovania veľkého počtu náhodných javov v biológii, technike i ekonómii. Normálne rozdelenie je vhodným pravdepodobnostným modelom takých náhodných premenných, ktoré sú súčtom veľkého počtu nezávislých alebo len slabo závislých veličín ( zložiek ) Veľký význam normálneho rozdelenia je aj v tom, že za určitých podmienok je možné pomocou neho aproximovať rad iných spojitých i nespojitých rozdelení. Uvedeným podmienkam vyhovuje mnoho dôležitých premenných, s ktorými sa v praxi často stretávame napr.: úroda tej istej rastliny na rôznych pozemkoch, výška, hmotnosť, chyby merania a iné.

Hustota pravdepodobnosti normálne rozdelenej náhodnej premennej je daná vzťahom:

2

2

2

2

1)(

x

exf x

kde konštanty a sú parametre normálneho rozdelenia, kde je stredná hodnota, charakterizujúca polohu tohto rozdelenia, a je jeho rozptyl.

22

Page 23: Základy  teórie pravdepodobností

23

)(XE 2)( XDačo stručne zapíšeme

2,NNormálne rozdelenie má tvar zvonovitej krivky, ktorá nadobúda maxima v bode a pri sa asymptoticky približuje k osi x.

x x

Funkcia hustoty pravdepodobnosti

y=normal(x;0;1)

0,00

0,15

0,30

0,45

0,60

-3,50 -1,75 0,00 1,75 3,50

Page 24: Základy  teórie pravdepodobností

24

Pre distribučnú funkciu normálneho rozdelenia platí vzťah:

dtexFx t

2

2

2

)(

2

1)(

0

0,2

0,4

0,6

0,8

1

1,2

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61

Page 25: Základy  teórie pravdepodobností

25

Normované normálne rozdelenie

Parametre normovaného normálneho rozdelenia sú

resp. , normovaná náhodná premenná U má teda normálne rozdelenie so strednou hodnotou 0 a rozptylom 1, čo stručne zapíšeme N(0,1). Stačí teda poznať normované normálne rozdelenie N(0,1), pomocou ktorého s využitím transformácie

Každé normálne rozdelenie

je možné pomocou transformácie U upraviť na normované

N(0,1)

Hustota pravdepodobnosti je symetrická okolo nuly, preto platí:

0)( XE1)(2 XD

X

U

)(1)( uFuF

popíšeme akékoľvek normálne rozdelenie 2,N

2,N

Page 26: Základy  teórie pravdepodobností

26

Častou úlohou pri aplikácii normálneho rozdelenia je nájsť pravdepodobnosť toho, že náhodná premenná X nadobudne hodnoty z intervalu x1 až x2 . Pri výpočte tejto pravdepodobnosti využívame

normovanie takto:

)()( 2121

21 uUuPxXx

PxXxP

1221 )()( uFuFuUuP

z vlastnosti distribučnej funkcie vyplýva :

Podobne postupujeme aj pri výpočte pravdepodobnosti toho, že náhodná premenná X je menšia než vopred zvolená konštanta x

)()()( uFuUPxX

PxXP

Page 27: Základy  teórie pravdepodobností

27

Porovnanie normálnych rozdelení

0

0,1

0,2

0,3

0,4

0,5

-4 -3 -2 -1 0 1 2 3 4

funk

cia

hus

toty

N(0,1)

N(0,1.5)

N(1,1)

Page 28: Základy  teórie pravdepodobností

28

pravidlo 6 - sigma

-0,05

0,05

0,15

0,25

0,35

0,45

-3 -2 -1 0 1 2 3

- ++2-2

-3 +3

68,26%

95,45%

99,73%

Page 29: Základy  teórie pravdepodobností

29

Typ rozdelenia Parametre E(X) D(X) Hustota pravdepodobnosti Distribučná funkcia

Rovnomerné a, b

Exponenciálne

Weibullovo

a, b, c

Gama a,b a.b

2

ba 12

2ab ab

xf

1

ab

axxF

1

2

1

xexf . xexF 1

0xf

0x

0xF 0x

a

cxb

b

b

ecxa

bxf

1

0xf

cx

cx

b

a

x

exF

1

0xF

ba2 a

x

b

b

eba

xxf

1

0x

0x

Page 30: Základy  teórie pravdepodobností

30

Výberové rozdelenia Ft,,2S normálnym rozdelením sú úzko spojené tri dôležité rozdelenia spojitých náhodných premenných: chí- kvadrát rozdelenie , Studentovo t – rozdelenie a F- rozdelenie. Majú mimoriadny význam pri analýze štatistických údajov, získaných náhodným výberom

2 -rozdelenie

vUUU ,,, 21 Ak sú , nezávislé náhodné premenné, z ktorých každá má normálne rozdelenie N(0,1), potom súčet štvorcov týchto náhodných premenných, tj. premenná:

v

iiU

1

22má - rozdelenie s v stupňami voľnosti. Počet stupňov voľnosti je daný počtom nezávislých sčítancov, a je jediným parametrom tohto rozdelenia. Kvantily tohto rozdelenia je možné bežne vyhľadávať v tabuľkách resp. vypočítať s pomocou dostupného štatistického softwaru.

2

Má rozsiahle použitie v teórii odhadu, testovaní štatistických hypotéz, pri overovaní nezávislosti kvalitatívnych znakov ......

Page 31: Základy  teórie pravdepodobností

31

Page 32: Základy  teórie pravdepodobností

32

► Studentovo t-rozdelenie

U Z U2 v

t

Nech  a sú nezávislé náhodné premenné, z ktorých

má normálne rozdelenie N(0,1) a Z má -rozdelenieso stupňami voľnosti .

Náhodná premenná

:

v

Z

Ut

má Studentovo t- rozdelenie s v stupňami voľnosti. Počet stupňov voľnosti je jediný parameter tohto rozdelenia. Stretávame sa s ním v matematickej štatistike - odhady, testy hypotéz ....

Page 33: Základy  teórie pravdepodobností

33

F - rozdelenie

Ak uvažujeme dve nezávislé náhodné premenné a s -rozdelením a a stupňami voľnosti, potom náhodná premenná :

21

22

21v 2v

2

22

1

21

v

vF

má F - rozdelenie s a stupňami voľnosti, čo sú zároveň aj dva parametre tohto rozdelenia

1v 2v

Stretávame sa s ním v matematickej štatistike - testy hypotéz, ANOVA ....

Page 34: Základy  teórie pravdepodobností

34