37
STATISTICKÉ METODY STATISTICKÉ METODY V GEOGRAFII V GEOGRAFII

STATISTICKÉ METODY V GEOGRAFII

Embed Size (px)

DESCRIPTION

STATISTICKÉ METODY V GEOGRAFII. Odhady parametrů intervaly spolehlivosti. Základní pojmy. základní soubor, statistický soubor výběrový soubor náhodný výběr k základnímu jednomu souboru lze získat více výběrových, různé charakteristiky - PowerPoint PPT Presentation

Citation preview

Page 1: STATISTICKÉ METODY    V GEOGRAFII

STATISTICKÉ METODY STATISTICKÉ METODY V GEOGRAFII V GEOGRAFII

Page 2: STATISTICKÉ METODY    V GEOGRAFII

Odhady parametrůOdhady parametrůintervaly spolehlivostiintervaly spolehlivosti

Page 3: STATISTICKÉ METODY    V GEOGRAFII

základní soubor, statistický souborvýběrový soubor náhodný výběr k základnímu jednomu souboru lze získat

více výběrových, různé charakteristikyU dobré výběrové metody - dílčí

směrodatné odchylky se kompenzují

Základní pojmy

Page 4: STATISTICKÉ METODY    V GEOGRAFII

reprezentativnost výběru – kvalita výběruprostý náhodný výběr ( s opakováním a bez

opakování)oblastní náhodný výběr ( výběr z každé dílčí

části) systematický náhodný výběr ( podle pravidla,

které nesouvisí se sledovaným znakem, např. sledovaný znak - počet obyvatel obce, seřadit obce podle abecedy a vybrat vždy každou pátou obec)

Základní pojmy

Page 5: STATISTICKÉ METODY    V GEOGRAFII

Intervaly spolehlivostiIntervaly spolehlivostinormální rozdělení, interval spolehlivosti hranice (μ + - 2σ), hodnoty, které leží mimo interval, v tzv.

kritickém oboru se považují za nepřípustné, jejich odchylky od průměru za významné

lze použít i jiné intervaly spolehlivostinapř. pro 95 % (μ + - 1,960σ),pro 99 % (μ + - 2,576σ),

Page 6: STATISTICKÉ METODY    V GEOGRAFII

Testování statistických Testování statistických hypotézhypotéz

jak ověřit předpoklady o charakteristikách statistických souborů?

Je soubor A výběrem ze souboru B?Do jaké míry se soubory shodují v rozdělení

četností, podle aritm. Průměru, podle směrodatné odchylky apod.

Page 7: STATISTICKÉ METODY    V GEOGRAFII

PříkladPříklad

měsíc % dětí narozených v ČR % dětí narozených v okrese Brno - venkov1 8,39 8,522 7,91 8,813 9,02 9,014 9,03 8,725 9,15 9,126 8,64 7,947 8,45 7,848 8,04 7,939 8,28 7,74

10 7,93 8,1311 7,41 7,4412 7,75 8,81

Soubor A Soubor a

Page 8: STATISTICKÉ METODY    V GEOGRAFII

Rozdělení četností Rozdělení četností souborů A , asouborů A , a

% dětí narozených v ČR

0

1

2

3

4

5

6

7

8

9

10

1 3 5 7 9 11měsíce

% % dětí narozených v

ČR

% dětí narozených v okrese Brno - venkov

0

2

4

6

8

10

1 2 3 4 5 6 7 8 9 10 11 12

měsíce

% % dětí narozených vokrese Brno - venkov

průměr průměr8,333333333 8,334166667

směrodatná odchylka směrodatná odchylka0,529013757 0,537563304

rozptyl rozptyl0,279855556 0,288974306

Page 9: STATISTICKÉ METODY    V GEOGRAFII

STATISTICKÁ HYPOTÉZA: předpoklad: průměrná výška studentek PdF MU je shodná s

průměrnou výškou žen ve věku 20 - 25 let v ČR NULOVÁ HYPOTÉZA Průměry obou souborů jsou shodné zvolíme hladinu významnosti např. 5% , tj. p= 0,05, tj. shoda je s pravděpodobností 95 % aplikace testovacího kritéria je výsledek testování významný ? podle výsledku přijmeme nebo odmítneme nulovou

hypotézu

Page 10: STATISTICKÉ METODY    V GEOGRAFII

Závislost náhodných veličinZávislost náhodných veličin

Page 11: STATISTICKÉ METODY    V GEOGRAFII

Do jaké míry závisí změna prvku jednoho statistického souboru změnu prvku druhého statistického souboru?

Jak podmiňuje změna prvku x změnu prvku y? Jak těsně na sobě závisí prvky dvourozměrného

statistického souboru? Např. vztahy teplota a nadm. výška, srážky a odtok v povodí váha a výška člověka,

Závislost náhodných veličinZávislost náhodných veličin

Page 12: STATISTICKÉ METODY    V GEOGRAFII

Vztahy náhodných veličinVztahy náhodných veličin

Jednostranné ( nezávislá hodnota x jednoho stat. souboru podmiňuje hodnotu y druhého stat. Souboru

Vzájemné (nelze rozlišit závislou a nezávislou proměnou)

Page 13: STATISTICKÉ METODY    V GEOGRAFII

Vztahy náhodných veličinVztahy náhodných veličinPodle stupně závislostiFunkční ( pevnou)( určité hodnotě x odpovídá jediná hodnota

y, vztah x a y lze tedy vyjádřit mat. funkcí),

např. Konkrétní teplotě odpovídá jedna hodnota

stupně nasycení vodní párou

Page 14: STATISTICKÉ METODY    V GEOGRAFII

Vztahy náhodných veličinVztahy náhodných veličin

Statistická ( jedné hodnotě x odpovídá více hodnot y,

hodnoty y mají své rozdělení s průměrem, tento průměr hodnot y je i pro různá x shodný)

Page 15: STATISTICKÉ METODY    V GEOGRAFII

Vztahy náhodných veličinVztahy náhodných veličin

Korelační Se změnou hodnot x se mění soubory hodnot y,

které mají své rozdělení a různých průměrech např. pro určitou těl výšku existuje více hodnot

hmotnosti, které budou mít normální rozdělení, různým výškám odpovídají hmotnosti s normálním

rozdělením, ale s různým průměrem Př. Pro 170 cm existuje norm. rozdělení hmotností

o průměru 68 kg, pro 180 cm opět normální rozdělení hmotností s průměrem 76 kg

Page 16: STATISTICKÉ METODY    V GEOGRAFII

Korelační závislostKorelační závislost

Určení těsnosti korelační závislosti

(jak těsný je vztah mezi výškou a hmotností člověka)

Korelační počet – snaha vyjádřit tendenci změny hodnoty závislé proměnné na nezávislé proměnné pomocí matematické funkce

Tuto regresní funkci lze graficky znázornit regresní čárou

Page 17: STATISTICKÉ METODY    V GEOGRAFII

Korelace je druh závislosti mezi prvky dvou souborů

Regresní čára znázorňuje graficky tuto korelační závislost

Page 18: STATISTICKÉ METODY    V GEOGRAFII

Určení korelační závislostiUrčení korelační závislosti 1. Korelační závislost vyjádřená lineární regresní přímkou

( lineární regrese) Jedna nezávislá proměnná x a jedna závislá proměnná y´ ( ta je

průměrem možných hodnot – viz. definice korelace) X = 170 cm a y´ = 68 kg ( 68 kg zastupuje možné hodnoty

hmotnosti pro 170cm) Regresní přímku lze analyticky vyjádřit jako y´ = bx + a, kde b je koeficient regrese a a dopočítáme po pomocném výpočtu průměrů

souborů a dosazením jedné dvojice hodnot do rovnice y´ - y = b(x – x) + a

Page 19: STATISTICKÉ METODY    V GEOGRAFII

Intervaly a pásy spolehlivosti Intervaly a pásy spolehlivosti pro lineární regresní závislostpro lineární regresní závislost

Kolem regresní přímky lze sestrojit interval spolehlivosti, který určuje pro vybrané x interval, ve kterém se budou s určitou

pravděpodobností nacházet hodnoty y

Page 20: STATISTICKÉ METODY    V GEOGRAFII

Př. lineární regresePř. lineární regreseVypočítejte parametry lineární regrese pro

vztah délky slunečního svitu a teploty na datech meteorol. stanice Tuřany, 2002

Délka slun. svitu (h)

55,6 82,7 183,4

169,5 238,3

291,4 288,0

221,2

174,5

89,4

44,7

40,3

Teplota

(° C )

-1,2 3,6 5,8 9,4 17,1 19,1 20,9

20,4

14,0 7,6

6,0 -3,1

Page 21: STATISTICKÉ METODY    V GEOGRAFII

Závislost teploty na délce slunečního svitu, Brno, 2002

-5,0

0,0

5,0

10,0

15,0

20,0

25,0

0,0 50,0 100,0 150,0 200,0 250,0 300,0 350,0

délka slun. svitu (h)

tep

lota

(°C

, mě

síč

prů

ry)

Page 22: STATISTICKÉ METODY    V GEOGRAFII

Výpočet koeficientu regrese b :Excel, funkce CORREL, POLE1 - hodnoty délka slun. Svitu, Pole2 - hodnoty teploty

Page 23: STATISTICKÉ METODY    V GEOGRAFII

Regresní parametr b= 0,9 Určení parametru a Rovnice: y´ - y = b(x – x) + a 1. Vypočítám aritm. průměr z hodnot x a y x = 156,6 a y = 9,6 2. Dosadíme z tabulky dvojici např. (82,7 ; 3,6 3. řeším rovnici o jedné neznámé 3,6 – 9,6 = 0,9 * ( 82,7 - 156,6)+ a a = - 60

Page 24: STATISTICKÉ METODY    V GEOGRAFII

Závislost teploty na délce slunečního svitu, Brno, 2002

-5,0

0,0

5,0

10,0

15,0

20,0

25,0

0,0 50,0 100,0 150,0 200,0 250,0 300,0 350,0

délka slun. svitu (h)

tep

lota

(°C

, mě

síč

prů

ry)

60

Page 25: STATISTICKÉ METODY    V GEOGRAFII

Časové řadyČasové řadyBazické a řetězové Bazické a řetězové

Z - diagramZ - diagram

Page 26: STATISTICKÉ METODY    V GEOGRAFII

časová řady – základní časová řady – základní pojmypojmy

statistická řada posloupnost hodnot znaku uspořádaných

podle určitého hlediskačasová řada statistická řada upořádaná podle času časová řada=dynamická=chronologická =

vývojová

Page 27: STATISTICKÉ METODY    V GEOGRAFII

Sestavování časových řadSestavování časových řad

dodržovat zásady:– stejně dlouhá časová období

( přepočet na „standardizovaný“ měsíc se 30 dny, přepočet na počet shodný počet pracovních dní v měsíci p

– stejně velká území, příp. stejná úroveň (shodná rozloha, povodí řádu toku, administrativní jednotka)

– stejné jednotky

Cíl – získat porovnatelná čísla

Page 28: STATISTICKÉ METODY    V GEOGRAFII

časová řada OKAMŽIKOVÁ – sleduje se hodnoty znaku k určitému okamžiku – např. počet obyvatel ČR k 31.12. 2000, 2001,

časová řada INTERVALOVÁ– sleduje se hodnota znaku v intervalu , období– denní úhrn srážek, průměrná denní teplota,

měsíční těžba… pouze k této řadě se vztahuje požadavek stejného

intervalu zvláště u sledování ekonomických ukazatelů

Page 29: STATISTICKÉ METODY    V GEOGRAFII

Klouzavé úhrnyKlouzavé úhrny

zvláštní typ součtové čáryvhodné pro porovnávání dvou či více řad

hodnot za po sobě následující období např. kolísání ročního chodu srážekpostup viz. např. skripta Brázdil. a kol. str.

147

Page 30: STATISTICKÉ METODY    V GEOGRAFII

měsíc 1 2 3 4 5 6 7 8 9 10 1112

prům úhrn srážek;2002; mm 8,1 21,3 21 29 45,8 81,7 58 91,2 39,2 71,9 48,2 46

prům úhrn srážek;2003, mm 26,6 4,3 4,1 22 92,8 59,8 66,1 37 24,3 58,5 32,4

54,3

KLOUZAVÝ ÚHRN

482,6

454,9

486

521

586

565

573

518

504

490

474,3

483

LEDNOVÁ HODNOTA – SOUČET „NOVÝ“ LEDEN + STARÉ OSTATNÍ MĚSÍCE

ÚNOROVÁ HODNOTA – SOUČET „NOVÝ“ LEDEN + ÚNOR +STARÉ OSTATNÍ MĚSÍCE

Page 31: STATISTICKÉ METODY    V GEOGRAFII

Z - diagramyZ - diagramyGRAFICKÉ ZNÁZORNĚNÍ

– řada běžných hodnot,– součtová čára,– řada klouzavých úhrnů

společné body Z - diagramu( tj. spol. hodnoty)– výchozí bod součtové č. a řady běžných hodnot – poslední hodnota součtové čáry a poslední hodnota

klouzavého úhrnu

Page 32: STATISTICKÉ METODY    V GEOGRAFII
Page 33: STATISTICKÉ METODY    V GEOGRAFII

Z - diagram průměrných úhrnů srážek (mm), Brno, 2003

0

100

200

300

400

500

600

700

1 2 3 4 5 6 7 8 9 10 11 12

měsíc

úh

rn s

ráže

k m

m)

MĚSÍČNÍ PRŮMĚRY

KUMULOVANÝ SOUČET

KLOUZAVÝ ÚHRN

Z - diagramyZ - diagramy

Page 34: STATISTICKÉ METODY    V GEOGRAFII

Analýza časových řadAnalýza časových řad cíle analýzy:

– zjistit hlavní rysy průběhu časových řad a analyzovat je

podle průběhu časové řady:stacionární nebo s trendems periodickým opakováním výkyvů nebo

bez výkyvůvšechny možné kombinace

Page 35: STATISTICKÉ METODY    V GEOGRAFII

Charakteristiky časových řadCharakteristiky časových řad

přírůstky:absolutní přírůstek – rozdíl hodnot po

sobě následujících ( „druhá“ – „ první“) x i – x i-1

relativní přírůstek podíl x i – x i-1 / x i-1

přírůstky a indexy

Page 36: STATISTICKÉ METODY    V GEOGRAFII

Řetězové a bazické indexyŘetězové a bazické indexy

bazický index podíl x i / x z * 100, x z - první „ základní „ hodnota časové řady změny k jedné základní ( bazické) hodnotě

řetězový index (koeficient růstu ) podíl x i / x i-1 * 100 podíl v procentech po sobě následujících hodnot ( změny např. z měsíce na měsíc“ – řetězení)

Page 37: STATISTICKÉ METODY    V GEOGRAFII

Témata přednášek k Témata přednášek k samostudiusamostudiu

Geografická metodologie Definice geografie Geografičnost studia Formy geogr. studia Obecný přístup k VŠ studiu

– Literatura: skripta MEČIAR, J. Úvod do studia geografie, od. str. 107 do konce