58
Číselné charakteristiky Číselné charakteristiky a jejich výpočet Jiří Neubauer Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:[email protected] Jiří Neubauer Číselné charakteristiky a jejich výpočet

Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

  • Upload
    others

  • View
    7

  • Download
    1

Embed Size (px)

Citation preview

Page 1: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristiky

Číselné charakteristiky a jejich výpočet

Jiří Neubauer

Katedra ekonometrie, FVL, UO Brnokancelář 69a, tel. 973 442029email:[email protected]

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 2: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Číselné charakteristiky

charakteristiky polohy

charakteristiky variability

charakteristiky koncetrace

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 3: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Číselné charakteristiky

charakteristiky polohy

charakteristiky variability

charakteristiky koncetrace

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 4: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Číselné charakteristiky

charakteristiky polohy

charakteristiky variability

charakteristiky koncetrace

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 5: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Charakteristiky polohy

Charakteristiky polohy (úrovně) měří obecnou velikost hodnot znakuv souboru a dělí se na průměry (počítané ze všech dat) a ostatní mírypolohy (počítané z vybraných hodnot).

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 6: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Aritmetický průměr

DefiniceAritmetický průměr je dán vztahem

x =1n

n∑i=1

xi ,

kde x1, x2 . . . , xn jsou naměřené hodnoty, n je celkový počet pozorování.

Aritmetický průměr nejčastěji užívaný druh průměru, který má uplatněnípři řešení téměř všech úloh statistiky.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 7: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Aritmetický průměr

Jsou-li hodnoty statistického znaku uspořádány do tabulky rozděleníčetností, určíme aritmetický průměr pomocí vztahu

x =1n

k∑i=1

ni · xi ,

kde n1, n2, . . . , nk jsou četnosti jednotlivých variant znaku x1, x2 . . . , xk .Tyto četnosti udávají váhu jednotlivých variantám znaku x , protomluvíme o váženém aritmetickém průměru.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 8: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Aritmetický průměr

Aritmetický průměr má tyto základní vlastnosti:

součet jednotlivých odchylek od průměru je nulový, tj

n∑i=1

(xi − x) = 0,

aritmetický průměr konstanty je opět roven konstantě, tj.

1n

n∑i=1

c = c ,

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 9: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Aritmetický průměr

Aritmetický průměr má tyto základní vlastnosti:

součet jednotlivých odchylek od průměru je nulový, tj

n∑i=1

(xi − x) = 0,

aritmetický průměr konstanty je opět roven konstantě, tj.

1n

n∑i=1

c = c ,

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 10: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

přičteme-li k jednotlivým hodnotám znaku x konstantu c , zvýší seo tuto konstantu i aritmetický průměr, tj.

1n

n∑i=1

(xi + c) = c + x ,

násobíme-li jednotlivé hodnoty znaku x konstantou c , je toutokonstantou násoben i průměr, tj.

1n

n∑i=1

c · xi = c · x .

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 11: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

přičteme-li k jednotlivým hodnotám znaku x konstantu c , zvýší seo tuto konstantu i aritmetický průměr, tj.

1n

n∑i=1

(xi + c) = c + x ,

násobíme-li jednotlivé hodnoty znaku x konstantou c , je toutokonstantou násoben i průměr, tj.

1n

n∑i=1

c · xi = c · x .

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 12: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Harmonický průměr

Aritmetický průměr však není jediným druhem průměru, existují i jiné,jenž se používají ve speciálních případech.

DefiniceHarmonický průměr xH je dán vztahem

xH =nn∑i=1

1xi

.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 13: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Harmonický průměr

Harmonický průměr má specifické uplatnění v situacích, kdy má logickývýznam součet převrácených hodnot znaku. Bude tomu tak tehdy, kdyprůměrovaná veličina má charakter části z celku, tedy průměrovat mámetzv. poměrná čísla. Např. průměrnou hustotu h obyvatelstva na km2

v kraji, známe-li počet obyvatel p a hustotu h v okresech, určíme zevztahu h =

∑p∑r , kde rozloha r = p

h , nebo průměrnou rychlost v autav km/hod., známe-li dráhu s a jí odpovídající rychlost v , určíme zevztahu v =

∑s∑t , kde čas t = s

t .

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 14: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Geometrický průměr

DefiniceGeometrický průměr xG je dán vztahem

xG = n√x1 · x2 · · · xn.

Geometrický průměr je např. využíván při jednoduché analýze časové řadypro určení tzv. průměrného tempa růstu nebo průměrného tempa poklesu.Např. pro tři meziroční indexy výroby 1,05; 1,06 a 1,02 je průměrnétempo růstu výroby rovno xG = 3

√1,05 · 1,06 · 1,02 .

= 1,043, cožznamená, že průměrně za rok činil nárůst výroby 4,3 %.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 15: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Příklad

Určete aritmetický, harmonický, geometrický a kvadratický průměrz hodnot 1, 2, 5, 6, 7, 8, 8, 9.

Aritmetický průměr

x =1 + 2 + 5 + 6 + 7 + 8 + 8 + 9

8= 5,75.

Harmonický průměr

xH =8

11 + 1

2 + 15 + 1

6 + 17 + 1

8 + 18 + 1

9

.= 3,375.

Geometrický průměr

xG =8√

1 · 2 · 5 · 6 · 7 · 8 · 8 · 9 .= 4,709.

Všimněte si, že pro naše průměry platí xH ≤ xG ≤ x , tento vztah meziprůměry platí obecně.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 16: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Průměry

Pro výpočet aritmetického průměru v programu EXCEL existuje funkcePRŮMĚR, pro určení harmonického a geometrického průměru funkceHARMEAN a GEOMEAN. Harmonický průměr hodnot z předchozíhopříkladu by se např. určil příkazem HARMEAN(1;2;5;6;7;8;8;9) nebozadáním daných hodnot do polí A1 až A8 a příkazemHARMEAN(A1:A8).

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 17: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Kvantil

Definice

Kvantil xp je hodnota znaku, pro kterou platí, že 100p% jednotekuspořádaného souboru má hodnotu menší nebo rovnu xp a 100(1− p) %jednotek má hodnotu větší nebo rovnu xp.

Takto definovaný kvantil není určen jednoznačně. Na jednoduchémpříkladu ukážeme, jak počítají kvantily některé softwarové produkty.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 18: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Kvantil

Mějme následující datový soubor 2 5 7 10 12 13 18 21.Možné výpočty kvantilů

Uspořádejme data vzestupně od nejmenší hodnoty k největší. Určímepořadový index ip kvantilu xp, který musí vyhovovat nerovnosti

np < ip < np + 1.

Kvantil xp je potom roven hodnotě znaku na pozici ip, tedyxp = x(ip). Jsou-li hodnoty np, np + 1 celočíselné, určíme kvantil jakoaritmetický průměr hodnot x(np) a x(np+1), tj. xp =

x(np)+x(np+1)

2 . Tímtozpůsobem určuje kvantily např. statistický software STATISTICA.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 19: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Kvantil

Mějme následující datový soubor 2 5 7 10 12 13 18 21.Možné výpočty kvantilů

Uspořádejme data vzestupně od nejmenší hodnoty k největší. Určímepořadový index ip kvantilu xp, který musí vyhovovat nerovnosti

np < ip < np + 1.

Kvantil xp je potom roven hodnotě znaku na pozici ip, tedyxp = x(ip). Jsou-li hodnoty np, np + 1 celočíselné, určíme kvantil jakoaritmetický průměr hodnot x(np) a x(np+1), tj. xp =

x(np)+x(np+1)

2 . Tímtozpůsobem určuje kvantily např. statistický software STATISTICA.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 20: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Kvantil

Podle MATLABuSpočteme se číslo

ip =np + np + 1

2=

2np + 12

určující polohu kvantilu. Hodnota kvantilu se určí lineární interpolací

xp = x([ip ]) + (x([ip ]+1) − x([ip ]))(ip − [ip]),

kde [·] značí celou část čísla. Je-li ip < 1 položíme xp = x(1), je-liip > n položíme xp = x(n).

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 21: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Kvantil

Podle EXCELuHodnotám uspořádaného souboru se přiřadí postupně hodnoty0, 1n−1 ,

2n−1 , . . . ,

n−2n−1 , 1. Pokud je hodnota P rovna násobku 1

n−1 , jekvantil xp roven hodnotě znaku odpovídající danému násobku.Jestliže P není násobkem 1

n−1 , určí se hodnota kvantilu lineárníinterpolací.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 22: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Kvantil

xp 0,10 0,25 0,50 0,75 0,90Sylabus 2 6 11 15,5 21MATLAB 2,9 6 11 15,5 20,1EXCEL 4,1 6,5 11 14,25 18,9

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 23: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Příklad

Určete medián, dolní kvartil a horní decil z hodnot 1, 2, 5, 6, 7, 8, 8, 9.

Nejprve určíme medián, tedy prostřední hodnotu uspořádaného souboru.Rozsah souboru je n = 8, neexistuje tedy jedna prostřední hodnota, alehodnoty dvě (6 a 7). Hodnotu mediánu učíme jako aritmetický průměrtěchto hodnot

x = x0,50 =6 + 7

2= 6,5.

Tento výsledek budeme interpretovat takto: 50 % uspořádaných hodnot vsouboru je menší nebo rovno 6,5, tedy nepřekročí hodnotu 6,5.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 24: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Příklad

Nyní určíme dolní kvartil x0,25. Vyjdeme ze vztahu

np < ip < np + 1

a dostáváme 8 · 0,25 < ip < 8 · 0,25 + 1⇔ 2 < ip < 3. V případě, žežádné přirozené číslo nesplňuje danou nerovnici (ip je pořadový index,tedy přirozené číslo), určíme hledaný kvartil jako aritmetický průměrhodnot, které jsou na pořadí np a np + 1, v našem případě průměr druhéa třetí hodnoty v uspořádaném souboru

x0,25 =x(2) + x(3)

2=

2 + 52

= 3,5.

Analogicky určíme horní decil x0,90,8 · 0,90 < ip < 8 · 0,90 + 1⇔ 7,2 < ip < 8,2, odkud ip = 8 a

x0,90 = x(8) = 9.

Řekneme, že 25 % uspořádaných hodnot v souboru je menší nejvýšerovno 3,5. Analogicky 90 % hodnot nepřekročí 9.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 25: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Příklad

Pro určení mediánu je v EXCELu k dispozici funkce MEDIAN, libovolnýkvantil lze spočítat pomocí funkce PERCENTIL, PERCENTIL.INC. Dolníkvartil z příkladu by se potom určil příkazemPERCENTIL.INC(A1:A8;0,25) = 4,25. Dané hodnoty jsou zapsányv polích A1 až A8. Všimněte si, že hodnota určená v EXCELu je odlišnáod hodnoty spočítané v příkladu.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 26: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Modus

DefiniceModus x je hodnota znaku s největší četností.

V případě spojitého statistického znaku pojem nejčetnější hodnotaobvykle nedává smysl, neboť četnosti jednotlivých hodnot znaku jsou buďjedničky, nebo velice malá čísla. (Budeme-li vážit rohlíky na dostatečněpřesné váze, hodnoty zjištěné hmotnosti se nebudou zpravidla vůbecopakovat.) Taková data se obvykle zpracovávají pomocí intervalovéhorozdělení četností a zobrazí pomocí histogramu. Ten interval, který mánejvětší četnost, nazveme modálním intervalem.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 27: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Modus

Obrázek: Dvoumodální rozdělení četností

Modus se v EXCELu určí pomocí funkce MODE, MODE.SNGL.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 28: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Charakteristiky variability

Průměry, kvantily a modus, tedy charakteristiky o jež byly zmíněnyv předchozím odstavci, v sobě shrnují informaci pouze o jedné vlastnostirozdělení četností, o poloze. Při zpracování dat je možné se setkats případem, kdy rozdělení četností budou mít shodnou polohu, ale přestose od sebe budou lišit.Existuje řada měr variability, zmíníme pouze ty nejdůležitější.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 29: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Charakteristiky variability

Obrázek: Rozdělení lišící se variabilitou

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 30: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Variační rozpětí

DefiniceVariační rozpětí R je definováno jako rozdíl největší a nejmenší hodnotyznaku

R = xmax − xmin.

Je to nejjednodušší, ale i nejhrubší míra variability. Udává šířku intervalu,v němž se nacházejí všechny hodnoty znaku.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 31: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Kvantilová rozpětí

Kvantilová rozpětí jsou dalšími jednoduchými měrami variability

Definicekvartilové rozpětí

RQ = x0,75 − x0,25decilové rozpětí

RD = x0,90 − x0,10percentilové rozpětí

RC = x0,99 − x0,01

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 32: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Kvantilová rozpětí

Kvantilová rozpětí jsou dalšími jednoduchými měrami variability

Definicekvartilové rozpětí

RQ = x0,75 − x0,25decilové rozpětí

RD = x0,90 − x0,10percentilové rozpětí

RC = x0,99 − x0,01

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 33: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Kvantilová rozpětí

Kvantilová rozpětí jsou dalšími jednoduchými měrami variability

Definicekvartilové rozpětí

RQ = x0,75 − x0,25decilové rozpětí

RD = x0,90 − x0,10percentilové rozpětí

RC = x0,99 − x0,01

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 34: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Kvantilová rozpětí

Kvartilové rozpětí udává šířku intervalu, ve kterém leží 50 % prostředníchhodnot uspořádaného souboru. Analogicky decilové resp. percentilovérozpětí určuje šířku intervalu, ve kterém leží 80 % resp. 98 % prostředníchhodnot uspořádeného souboru.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 35: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Příklad

V dřívějším příkladu jsme určovali kvantily z dat 2, 5, 7, 10, 12, 13, 18 a21. Vyjdeme z hodnot vypočítaných první metodou (podle programuSTATISTICA: x0,10 = 2, x0,25 = 6, x0,50 = 11, x0,75 = 15,5, x0,90 = 21) aurčíme variační, kvartilové a decilové rozpětí.

Variační rozpětí R = xmax − xmin = 21− 2 = 19, všechny hodnoty senacházejí v intervalu šířky 19. Kvartilové rozpětí má hodnotuRQ = x0,75 − x0,25 = 15,5− 6 = 9,5. Znamená to, že 50 % prostředníchhodnot se nachází v intervalu šířky 9,5. Decilové rozpětí je rovnoRD = x0,90 − x0,10 = 21− 2 = 19.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 36: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Kvantilové odchylky

DefiniceKvantilové odchylky

kvartilová odchylkaQ = RQ/2

decilová odchylkaD = RD/8

percentilová odchylka

C = RC/98

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 37: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Kvantilové odchylky

DefiniceKvantilové odchylky

kvartilová odchylkaQ = RQ/2

decilová odchylkaD = RD/8

percentilová odchylka

C = RC/98

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 38: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Kvantilové odchylky

DefiniceKvantilové odchylky

kvartilová odchylkaQ = RQ/2

decilová odchylkaD = RD/8

percentilová odchylka

C = RC/98

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 39: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Kvantilové odchylky

Hodnota kvartilové odchylky udává průměrnou vzdálenost mezi dvěmakvartily, analogicky decilová resp. percentilová odchylka určujeprůměrnou vzdálenost mezi sousedními decily, resp. percentily.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 40: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Příklad

Určete kvartilovou a decilovou odchylku z hodnot 2, 5, 7, 10, 12, 13, 18a 21. Využijte dřívějších výsledků.

Kvartilová odchylka Q = RQ/2 = 9,5/2 = 4,75. Decilová odchylka máhodnotu D = RD/8 = 19/8 = 2,375. To znamená, že průměrná délkadvou (osmi) prostředních kvartilových (decilových) intervalů je 4,75(2,375).

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 41: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Průměrná odchylka

DefinicePrůměrná odchylka je definována jako aritmetický průměr absolutníchodchylek jednotlivých hodnot od aritmetického průměru

dx =1n

n∑i=1

|xi − x |.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 42: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Příklad

Určete průměrnou odchylku z hodnot 1, 2, 5, 6, 7, 8, 8 a 9.

Hodnota aritmetického průměru je x = 5,75. Dosazením do definičníhovzorce dostáváme

dx =|1− 5,75|+ |2− 5,75|+ |5− 5,75|+ |6− 5,75|

8+

+|7− 5,75|+ |8− 5,75|+ |8− 5,75|+ |9− 5,75|

8= 2,3125.

Průměrnou odchylku získáme v EXCELu pomocí funkcePRŮMODCHYLKA, pro dané hodnoty příkazemPRŮMODCHYLKA(1;2;5;6;7;8;8;9) nebo PRŮMODCHYLKA(A1:A8),pokud jsou data zadána v polích A1 až A8.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 43: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Rozptyl

Definice

Rozptyl s2n je definován jako aritmetický průměr čtverců odchylekjednotlivých hodnot znaku od aritmetického průměru

s2n =1n

n∑i=1

(xi − x)2.

Patří k nejpoužívanějším mírám variability.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 44: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Rozptyl

Pro ruční výpočty rozptylu je možné odvodit jednodušší vzorec

s2n =1n

n∑i=1

(xi − x)2 =1n

(n∑i=1

x2i − 2xn∑i=1

xi +n∑i=1

x2)

=1n

(n∑i=1

x2i − 2nx2 − nx2)

=1n

n∑i=1

x2i − x2 = x2 − x2.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 45: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Rozptyl

Rozptyl má tyto základní vlastnosti:rozptyl konstanty je roven nule, tj.

1n

n∑i=1

(c − c)2 = 0,

přičteme-li k jednotlivým hodnotám znaku x konstantu c , hodnotarozptylu se nezmění, tj.

1n

n∑i=1

[(xi + c)− (x + c)]2 = s2n ,

násobíme-li jednotlivé hodnoty znaku x konstantou c , je rozptylnásoben čtvercem této konstanty, tj.

1n

n∑i=1

(c · xi − c · x)2 = c2 · s2n .

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 46: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Rozptyl

Rozptyl má tyto základní vlastnosti:rozptyl konstanty je roven nule, tj.

1n

n∑i=1

(c − c)2 = 0,

přičteme-li k jednotlivým hodnotám znaku x konstantu c , hodnotarozptylu se nezmění, tj.

1n

n∑i=1

[(xi + c)− (x + c)]2 = s2n ,

násobíme-li jednotlivé hodnoty znaku x konstantou c , je rozptylnásoben čtvercem této konstanty, tj.

1n

n∑i=1

(c · xi − c · x)2 = c2 · s2n .

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 47: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Rozptyl

Rozptyl má tyto základní vlastnosti:rozptyl konstanty je roven nule, tj.

1n

n∑i=1

(c − c)2 = 0,

přičteme-li k jednotlivým hodnotám znaku x konstantu c , hodnotarozptylu se nezmění, tj.

1n

n∑i=1

[(xi + c)− (x + c)]2 = s2n ,

násobíme-li jednotlivé hodnoty znaku x konstantou c , je rozptylnásoben čtvercem této konstanty, tj.

1n

n∑i=1

(c · xi − c · x)2 = c2 · s2n .

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 48: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Směrodatná odchylka

DefiniceOdmocnina z rozptylu se nazývá směrodatná odchylka

sn =√s2n

Směrodatná odchylka je, na rozdíl od rozptylu, vyjádřena ve stejnýchjednotkách jako sledovaný znak. Tvoří-li např. statistický soubor výsledkyve skoku vysokém vyjádřené v centimetrech, má i směrodatná odchylkajednotku cm, rozptyl je potom vyjádřen v jednotkách cm2.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 49: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Výběrový rozptyl a směrodatná odchylka

Definice

Výběrový rozptyl s2 je definovaný vztahem

s2 =1n − 1

n∑i=1

(xi − x)2,

odmocnina z výběrového rozptylu se nazývá výběrová směrodatnáodchylka

s =√s2.

Používá se v induktivní statistice. Jak plyne z definic rozptylu avýběrového rozptylu, platí mezi nimi vztah

s2n =n − 1ns2.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 50: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Příklad

Určete rozptyl, směrodatnou odchylku, výběrový rozptyl a výběrovousměrodatnou odchylku z hodnot 1, 2, 5, 6, 7, 8, 8 a 9.

Určili hodnotu aritmetického průměru x = 5,75. Nejprve spočítámehodnotu rozptylu z definičního vzorce

s2n =(1− 5,75)2 + (2− 5,75)2 + (5− 5,75)2 + (6− 5,75)2

8+

+(7− 5,75)2 + (8− 5,75)2 + (8− 5,75)2 + (9− 5,75)2

8= 7,4375.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 51: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Příklad

Rozptyl je možné také určit pomocí vztahu s2n = x2 − x2. Určíme tedyhodnotu

x2 =1n

n∑i=1

x2i =12 + 22 + 52 + 62 + 72 + 82 + 82 + 92

8= 40,5,

odtud potom dostáváme

s2n = x2 − x2 = 40,5− 5,752 = 7,4375.

Směrodatná odchylka je

sn =√s2n =

√7,4375 .

= 2,72718.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 52: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Příklad

Výběrový rozptyl můžeme samozřejmě určit z definice, jednodušší budeale využít vztahu

s2 =nn − 1

s2n =87· 7,4375 = 8,5.

Výběrová směrodatná odchylka má potom hodnotu

s =√s2 =

√8,5 .

= 2,91548.

Pomocí EXCELu můžeme vypočítat hodnotu rozptylu pomocí funkceVAR, VAR.P, směrodatnou odchylku pomocí funkce SMODCH,SMODCH.P, výběrový rozptyl příkazem VAR.VÝBĚR, VAR.Sa výběrovou směrodatnou odchylku příkazem SMODCH.VÝBĚR,SMODCH.VÝBĚR.S. Syntaxe zadávání je podobná jako např.u aritmetického průměru.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 53: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Variační koeficient

DefiniceNejznámější mírou relativní variability je variační koeficient

ν =sn|x |,

který je definován jako poměr směrodatné odchylky a absolutní hodnotyaritmetického průměru.

Variační koeficient je bezrozměrné číslo, lze jej vyjádřit i v procentech.Využít ho můžeme v případě, když budeme chtít porovnávat variabilitu vedvou nebo více statistických souborech, jejichž hodnoty budou vyjádřenyv jiných jednotkách.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 54: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Obecný a centrální moment

Definicer-tý obecný moment je definován vztahem

m′r =1n

n∑i=1

x ri ,

r-tý centrální moment je definován vztahem

mr =1n

n∑i=1

(xi − x)r .

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 55: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Koeficient šikmosti

DefiniceKoeficient šikmosti je dán vztahem

a3 =m3m3/22

=

n∑i=1

(xi − x)3

ns3n=m3s3n

Je-li a3 = 0, je stupeň hustoty malých a velkých hodnot stejný, cožpředstavuje souměrné rozdělení četností. Je-li a3 > 0, je stupeň hustotymalých hodnot ve srovnání s hustotou velkých hodnot větší a rozděleníčetností je proto zešikmené doleva. Analogicky je-li a3 < 0, je rozděleníčetností zešikmené doprava.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 56: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Koeficient šikmosti

Obrázek: Rozdělení lišící se šikmostí

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 57: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Koeficient špičatosti

DefiniceKoeficient špičatosti je dán vztahem

a4 =m4m22− 3 =

n∑i=1

(xi − x)4

ns4n− 3

Je-li a4 > 0, je stupeň koncentrace prostředních hodnot ve srovnání skoncentrací všech hodnot větší a rozdělení četností se potom projevíšpičatým tvarem. Analogicky je-li a4 < 0, má rozdělení četností plochýtvar.

Jiří Neubauer Číselné charakteristiky a jejich výpočet

Page 58: Císelné charakteristiky a jejich výpocetneubauer/pdf/ciselne...¨íselnØ charakteristiky ¨íselnØ charakteristiky a jejich výpoŁet Jiłí Neubauer Katedra ekonometrie, FVL,

Číselné charakteristikyCharakteristiky polohyCharakteristiky variabilityCharakteristiky koncentrace

Koeficient špičatosti

Obrázek: Rozdělení lišící se špičatostí

Jiří Neubauer Číselné charakteristiky a jejich výpočet