Klimatoloogiline andmetöötlus

Preview:

DESCRIPTION

Klimatoloogiline andmetöötlus. Kliima kirjeldus põhineb pikaajalistel ilmavaatlustel. Töötluse käigus andmeid tihendatakse, keskmistatakse ja üldistatakse Koostatakse teatud ajaintervallide kaupa üldistatud read Andmeread muudetakse ümber nende väärtuste jaotusteks gradatsioonide järgi - PowerPoint PPT Presentation

Citation preview

Klimatoloogiline andmetöötlus

Kliima kirjeldus põhineb pikaajalistel ilmavaatlustel

• Töötluse käigus andmeid tihendatakse, keskmistatakse ja üldistatakse

• Koostatakse teatud ajaintervallide kaupa üldistatud read

• Andmeread muudetakse ümber nende väärtuste jaotusteks gradatsioonide järgi

• Arvutatakse suhteliselt väike arv aegridade statistilisi karakteristikuid, mis väljendavad jaotuste üldisi omadusi

• Kasutatakse tõenäosuslikke (stohhastilisi) meetodeid

Kliimaridade spetsiifilised omadused

• Mittehomogeensus (mõõtmistingimuste ja kliimategurite muutus pikema perioodi jooksul)

• Mittestatsionaarsus (ööpäevane, aastane jt. perioodilised kõikumised)

• Kliimanäitajate seostatus ajas ja ruumis (autokorrelatsioon), seetõttu pole üksikmõõtmised täiesti juhuslikeks väärtusteks

• Andmetöötlusel tuleb arvestada iga konkreetse kliimanäitaja spetsiifikat

Meteoroloogiliste vaatlusandmete klimatoloogilise töötluse peamised etapid

• Kliimaridade koostamine ja kontroll• Üldise klimaatilise informatsiooni saamine ja

selle täpsuse hindamine• Kliima diagnoosi ja prognoosi jaoks info saamine• Praktika jaoks kliimanäitajate väljatöötamine ja

nende arvutamine• Klimaatilise info territoriaalne üldistamine

Klimaatiliste aegridade liigid

• Aegread koosnevad üksikelementidest, millest igaüks võib olla kas vaatlustulemus või vaatluste üldistus mingi ajavahemiku jaoks.

• I. Erinevused rea elemendi ajalise lahutuse poolest (tähtajalised, ööpäevased, dekaadi, kuu, sesooni või aasta kohta)

• Ajaühikut saab üldistada keskmistamise alusel, ekstreemumi järgi, antud väärtusega juhtude arvu alusel, ülemineku kuupäevaga üle mingi piirväärtuse

Klimaatiliste aegridade liigid

• II. Erinevused diskreetsuse vahemiku alusel (üht ja sama näitajat on võimalik arvutada mitme mõõtmistulemuse põhjal)

• III. Erinevused aegrea realisatsiooni pikkuses (ühest päevast kuni aastani)

• IV. Erinevused ilmaelemendi iseloomustajas (kas selle enda väärtus, päevade arv mingi väärtusega, mingist väärtusest ülemineku kuupäev, mingi väärtusega perioodi pikkus, mingi nähtusega päevade arv, selle kestus ja intensiivsus, vektorväärtused)

Kliimaridade koostamise andmeallikad

• TM-1 – tabel iga kuu andmetega (v.a. Päikesekiirgus ja mullatemperatuurid)

• TM-3 – tabel mullatemperatuuri andmetega• TM-11, TM-12 – päikesekiirguse andmed• Õhutemperatuuri, õhurõhu, niiskuse ja sademete

isekirjutajate tabelid• Vaatlusraamatud (KM-1, KM-2 jne.) 3 aasta järel

hävitatakse• Sünoptilised kaardid ja bülletäänid

Kliimaridade kvaliteedi kontroll

• Aegrea mittehomogeensust põhjustab kaks peamist tegurit

• – esineb trend (kliimategurite muutumine, inimmõju), s.t. ajas muutub keskväärtus ja ka dispersioon (N. ööpäevane või aastane käik, tsüklilisus) – statistiline mittehomogeensus

• - vaatlusmetoodika ja vaatlustingimuste muutus (klimatoloogiline mittehomogeensus)

Klimaatilise mittehomogeensuse põhjused

• Jaama asukoha muutus, ümbruskonna muutus (puud, ehitised), mikrokliima muutus

• Mõõteriista ja metoodika muutumine (Nipheri ja Tretjakovi sademetemõõtja, tuulelipp, vaatlusajad)

• Vaatleja juhuslikud vead, eriti visuaalsetel vaatlustel (pilved, nähtavus)

• Vaatlusaegade ja keskväärtuste arvutamise metoodika muutus, parandid

Aasta keskmine temperatuur Tallinnas (A. Tarandi järgi)

1

2

3

4

5

6

7

8

17

56

17

76

17

96

18

16

18

36

18

56

18

76

18

96

19

16

19

36

19

56

19

76

19

96

t°C

Eesti ala keskmine sademete hulk soojal poolaastal (IV-X)

200

250

300

350

400

450

500

550

600

1866 1876 1886 1896 1906 1916 1926 1936 1946 1956 1966 1976 1986 1996 2006

mm

Eesti ala keskmine sademete hulk külmal poolaastal (XI-III)

50

100

150

200

250

300

1867 1877 1887 1897 1907 1917 1927 1937 1947 1957 1967 1977 1987 1997 2007

mm

Aasta keskmine temperatuur Tartus

2

3

4

5

6

7

8

1866 1876 1886 1896 1906 1916 1926 1936 1946 1956 1966 1976 1986 1996 2006

°C

Homogeensuse kontroll Studenti kriteeriumi abil

mn

mnnm

mn

xyt

yx

)2(22

Kus n ja m on aegrea kahe osa liikmete arv (N=n+m) ning

x, y, σ ja σ – aegrea kahe osa (liikmete arvuga vastavalt n ja m) liikmete keskväärtused ja standardhälbed

Alexanderssoni test SNHT (Standard Normal Homogeneity Test)

• Võrreldakse uuritavat aegrida näidisreaga• Leitakse uuritava rea ja näidisrea vahede või

suhete aegrida qi kus i=1,2,...N

• Leitakse standardiseeritud aegrida• Leitakse testi statistikute aegrida

q

ii s

qqz

2

2

2

1 )( zNzT

11

1

iizz

N

iizN

z1

2

1

Alexanderssoni test SNHT (Standard Normal Homogeneity Test)

• Kui testi statistik on suurem, kui kriitiline väärtus (ca 10), siis on toimunud oluline mittehomogeensus vastava aasta puhul

• Standardprogrammid võimaldavad arvutada ka sellist mittehomogeensust, mida on põhjustanud trend ning kahe punkti mittehomogeensust

Bologna, 17 - 18 May, 2005 17

Homogenisation of Temperature Series for Metheorological Stations in Northwestern

Slovenia

INTRODUCTION

• In climatological studies, trend analysis and climate change studies it is importaint to operate with homogeneised time series, since the inhomogeneities in time series, due to various factors give wrong idea about climatic conditions.

• We present the method and causes of homogeneisation of temperature time series for metheorological stations in Gorenjska region, t.i. in the northwestern part of Slovenia.

• The decision for homogeneisation was taken on the basis of SNHT - Alexandersson test, the final decision for homogeneisation was taken on the basis of metadata about the station history.

METHODOLOGY – Alexandersson test

/H. Alexandersson, 1986, Journal of Climatology, V 6, p.661/

• In the test monthly and yearly data of the tested station and one or more reference series are needed.

• Since the temperature series were analysed, the series of temperature differences between the test and the reference series was formed.

• We define a new standardized series of ratios according to

iq

iz

q

ii s

qqz

izZ ,

Null hypothesis:• H0 : Z N(0,1), i

Z has a normal distribution with zero mean value and unit standard deviation

Alternative hypothesis:• H1 : For some 1 n and 1 2 Z N(1 ,1), for i Z N(2 ,1), for i

• Z has a normal distribution• The possible break is one single break• It consists of only a shift of a mean value

• The problem is to find a test quantity that can give an answer to the question:

‘ When and by how many per cent and how certain is it that a series contains a non-homogeneity?’

• The standard technique of likelihood ratios is used

2

2

2

111

0 )(maxmax znzTTnn

11

1

iizz

n

iizn

z1

2

1

In Alexandersson test T0 is the test statistics and the critical levels are

determined by the simulation.

Thus we obtain:

1. T0 . If T0 is larger than a certain critical level the series should be classified as non-homogeneous at a certain level, t.i. with 95 per cent confidence

2. The year (or the month and the year) which is the most probable for a break

3. The mean values of sequences of the differences and before and after the break

Anclim program of the author Petr Štěpánek / P. Štepanek, 2003, AnCLim – software for time series analysis. Dept. Of Geograghy,

Fac of Natural Sciences, MU, Brno/

• The year of the inhomogeneity was checked in the metadata, in the station history, on the basis of which the final decision for homogenasation was taken.

• The series was homogeneised by the method 'User defined homogeneisation' in Anclim program.

• Missing values were completed by the Anclim program.

RESULTS

Metheorological stations in Slovenia:• all together 634 metheorological stations, 379 of them are still in

operation• 218 climatological stations, 40 of them are still in operation.

0,0

5,0

10,0

15,0

20,0

25,0

30,0

10 20 30 40 50 60 70 80 90 100 More

years of operation

pe

rce

nta

ge

(%

)

Figure 1: The percentage of climatological

stations regarding the years of operation

• We plan to test the temperature series for various regions in Slovenia, for the regions where the stations have similar climatic conditions.

• The temperature series of metheorological stations in northwestern part of Slovenia, t.i. 18 metheorological stations were tested.

Figure 2: The spatial distribution of metheorological stations with homogeneized temperature series in Gorenjska region

• Monthly time series for temperatures at 7 a.m. (T7), 2 p.m. (T14), 9 p.m. (T21) and maximal and minimal temperatures were analysed,

• 90 temperature series were tested.

Meteorological station

Latitude Longitude Elev.a.s.l. (m)

Homogen. series

R.m.v. T

R.m.v.

Tmax

R.m.v.

Tmin

T7 T14 T21 Tmax Tmin

Brnik 460 13' 04'' 140 28' 39'' 364 1954-2003 / 1 1 11.197808.1993

11.197808.1993

11.197808.1993

11.197808.199306.1966

11.197808.199311.1983

Dom na Komni 460 17' 04'' 130 46' 41'' 1520 1951-1983 16 52 51 01.1965 07.1965 08.1968 07.1961 ______

Golnik 460 19' 45'' 140 20' 12'' 500 1954-1978 19 19 19 01.1965 11.196402.1972

01.1965 06.1958 07.1964

Javorje 460 09' 26'' 140 10' 56'' 690 1955-1990 2 2 2 03.196307.1980

03.196305.1970

11.195905.1970

07.1963 ______

Kredarica 460 22' 46'' 130 51' 14'' 2514 1954-2003 7 7 7 01.1983 01.1983 01.1983 09.1976 02.199110.1978

Krvavec 460 17' 52'' 140 32' 19'' 1740 1961-2003 16 18 20 08.197304.1981

08.1973 08.197304.1981

08.197310.1981

08.197304.198607.1965

Lesce-Radovljica 460 21' 56'' 140 10' 45'' 515 1954-2003 16 19 22 01.197901.1965

01.197901.1965

01.197901.1965

01.197911.1965

01.197906.196510.1972

Novaki 460 09' 140 03' 650 1961-1977 4 5 5 07.1971 ______ ______ 10.1966 06.1971

Planina pod Golico

460 28' 03'' 140 03' 27'' 970 1951-2003 3 7 11 01.196108.1979

01.196108.1979

01.196108.1979

01.196106.1970

01.196102.1976

Preddvor 460 18' 11'' 140 25' 23'' 485 1991-2003 6 6 6 07.1994 ______ ______ ______ ______

Rovtarica 460 17' 09'' 140 05' 42'' 1077 1954-1970 6 7 6 09.1964 ______ 09.1964 ______ 11.1962

Rudno polje 460 21' 130 56' 1347 1951-1964 24 29 26 ______ 08.1958 ______ ______ ______

Šmarna gora 460 07' 48'' 140 28' 08'' 665 1961-1989 1 2 2 01.196905.1979

07.1975 01.1969 07.1975 01.1969

Stara Fužina 460 17' 14'' 130 53' 52'' 547 1951-2002 28 35 39 ______ 05.1981 12.1969 03.1964 05.1966

Topol 460 05' 36'' 140 22' 32'' 660 1989-2003 8 8 8 ______ ______ ______ ______ ______

Vogel 460 15' 50'' 130 50' 44'' 1535 1982-2003 5 5 5 11.1985 06.1995*

06.1985

06.1995* 10.1996 04.1989

Voglje 460 13' 140 27' 371 1954-1964 7 7 7 _____ _______

______ ______ ______

Žeje 460 17' 140 18' 427 1954-1973 11 12 20 05.1960 05.1960 05.196009.1966

05.1960 09.1967

Brnik, 364 m a.s.l.• Temperature series T7, T14, T21, Tmax, Tmin were first

homogeneised till the breakpoint in November 1978, when the station was relocated and the temperature rose,

• The second homogeneisation was done till August 1993 when the automatic meteorological station was introduced and the station was relocated as well. At this relocation the temperature fell.

• Tmax was homogeneised once more till the breakpoint in June 1966 (station relocation)

• Tmin was corrected till November 1983, when the minimal thermometer was replaced.

Brnik

Breakpoint T0 T (°C)

T7 Oct. 1978

Aug. 1993

21.05

17.42 +1.15

-0.96 T14 Nov. 1978

Aug. 1993

13.56

14.96

-0.65

-0.61

T21 Sep. 1978

Aug. 1993

20.01

15.82

+1.36

-1.06

Tmax Sep. 1978

Aug. 1993

Mar. 1966

17.03

21.58

15.60

+0.45

-0.88

+0.60

Tmin Oct. 1978

Aug. 1993

Aug. 1982

34.07

26.52

13.61

+2.00

-1.43

+0.22

• We analysed 7 mountainous metheorological stations with the

elevation above 950 m.

• Krvavec, 1740 m a.s.l.• Station relocation:

In August 1973 for 800 m towards NE to a 268m higher location, on 1740m above sea level.

• Reference series:

The reference series was created by the series for Planina pod Golico (970m a.s.l.) and Kredarica (2514 m a.s.l.).

T7, September T14, September

T21, September Tmax, September

Figure 3a,b,c,d: Temperature differences between the T7,T14, T21, Tmax series for Krvavec and the reference series.

Krvavec, 1740 m a.s.l.

Krvavec, 1740 m a.s.l.

• Temperature series T7, T14, T21, Tmax, Tmin were first homogeneised till August 1973, the temperatures fell

Breakpoint T0 T (°C)

T7 Sep. 1973 23.76 -0.96

T14 Sep. 1973 34.03 -3.13

T21 Sep. 1973 33.92 -1.98

Tmax Sep. 1973 29.98 -3.15

Tmin Apr. 1974 24.67 -1.31

• T7 and T21 were additionaly corrected regarding the dry thermometer

replacement in April 1981

• Tmax was additionaly corrected regarding the maximal thermometer

replacement in October 1981,

• Tmin was additionaly corrected regarding the minimal thermometer

change in April 1986

Krvavec, 1740 m a.s.l.

T7, September T14, September

T21, September Tmax, September

Figure 4a,b,c,d: Temperature differences between the T7,T14, T21, Tmax series for Krvavec and the reference series after homogeneisation

Iseseisva töö ülesanded

• Teostada Studenti test antud jaama õhutemperatuuri aegridade jaoks

– Näidisfailid on Student.xls ja SorveStudent.xls – Leida t ja p väärtused iga kuu ja aasta keskmise

aegrea jaoks

• Teostada Alexanderssoni test antud jaama õhutemperatuuri aastase ja sesoonsete aegridade jaoks

– Näidisfail on Alexandersson.xls

• Näidisfailid asuvad aadressil http://taurus.gg.bg.ut.ee/jaagus

Kliimakarakteristikute arvutamise meetodid

• Meteoelemendi väärtuste jaotuse korduvused ja empiirilised funktsioonid

• Arvulised karakteristikud, eriti neli esimest keskmomenti

• Meteoelementide ja nähtuste äärmusväärtused

• Meteoroloogilised kompleksid

Korduvuse ja empiiriliste funktsioonide arvutamine

• Jaotuse uurimiseks jagatakse maksimumi ja miinimumi vahele jäävad väärtused intervallideks

• Loetakse ära vaatluste arv ehk korduvus nk , mis sattus vahemikku Δxk.

• Arvutatakse suhteline sagedus pk=nk/N,

– kus k=1,2,...,s – N – vaatluste arv, s – gradatsioonide arv

• Suhteline tihedus igas intervallis (histogramm)

kkkkk xNnxp //

Kuu keskmise õhutemperatuuri histo-grammid Kuusikul jaanuaris ja juulis

Histogram

0

5

10

15

20

-15.9

-14.0

7777

778

-12.2

5555

556

-10.4

3333

333

-8.61

1111

111

-6.78

8888

889

-4.96

6666

667

-3.14

4444

444

-1.32

2222

222

Mor

e

Bin

Fre

qu

ency

Histogram

02468

1012141618

13.4

14.24

4444

44

15.08

8888

89

15.93

3333

33

16.77

7777

78

17.62

2222

22

18.46

6666

67

19.31

1111

11

20.15

5555

56M

ore

Bin

Fre

qu

ency

Korduvuse ja empiiriliste funktsioonide arvutamine

• Empiiriline jaotusfunktsioon F(x)=nx/N

– kus nx – juhtude arv, kui muutuja väärtused jäävad alla piirväärtuse x.

– Jaotusfunktsiooni graafik on astmeline kõver

• Empiiriline jaotusfunktsioon kahanevas järjekorras Φ(x)=1-F(x)

Kuu keskmise õhutemperatuuri jaotus-funktsioonid Kuusikul jaanuaris ja juulis

Histogram

02468

101214161820

-15.9

-12.2

5555

556

-8.6

11111

111

-4.9

66666

667

-1.3

22222

222

Bin

Fre

qu

ency

0.00%

20.00%

40.00%

60.00%

80.00%

100.00%

120.00%

Frequency

Cumulative %

Histogram

02468

1012141618

13.4

15.0

8888

889

16.7

7777

778

18.4

6666

667

20.1

5555

556

Bin

Fre

qu

ency

0.00%20.00%40.00%60.00%80.00%100.00%120.00%

Frequency

Cumulative %

Peamised kliimakarakteristikud

• Kliimanäitajate keskmisi, muutlikkust, seostatust ja teisi näitajaid saab väljendada jaotuse alg- ja keskmomentide kaudu

• Algmoment

• Keskmoment

– kus xi – meteoelemendi väärtus, pi – suhteline jaotustihedus

N

ii

qiq px

1

N

ii

qiiq px

1

)(

Peamised kliimakarakteristikud

• Segamoment

– kus pij – kahe juhusliku väärtuse koosesinemise tõenäosus

• Praktikas kasutatakse nelja esimest järku momente ja teist järku segamomenti

N

i

M

jij

lyj

kxikl pyx

1 111 )()(

Peamised kliimakarakteristikud

• Keskväärtus

• Standardhälve

• Variatsioonikordaja

N

xx

N

ii

11

N

xxN

ii

1

2

2/12

)(

xV /

Peamised kliimakarakteristikud

• Asümmeetriakordaja

• Ekstsessikordaja

• Korrelatsioonikordaja

31

3

2/323

)(

N

xxA

N

ii

3)(

34

1

4

224

N

xxE

N

ii

yx

N

iii

yx

yyxxr

12/1

200211,

))(()(

Peamised kliimakarakteristikud

• Mood – juhusliku suuruse x väärtus, mis vastab maksimaalsele tõenäosustihedusele

• Mediaan F(xi) = 0,5• Kvantiil (q-ndat järku) F(xq) = q• Dispersioon D=σ2

• Keskmine absoluuthälve

• Väike asümmeetria kuni A<0,25, mõõdukas asümmeetria 0,25<A<0,50, suur asümmeetria A>0,50

N

ii xx

N 1

1

Moe, mediaani ja keskväärtuse omavaheline asend erineva

asümmeetriaga jaotuste korral

Iseseisva töö ülesanded

• Arvutada iga kuu ja aasta kohta– keskmine, mediaan, mood– standardhälve, maksimum, miinimum– asümmeetria- ja ekstsessikordaja– 5, 25, 75 ja 95 % kvantiilid

• Koostada histogrammid jaanuari, juuli ja aasta temperatuuri kohta

• Näidisfail tartust.xls asub aadressil http://taurus.gg.bg.ut.ee/jaagus

Aegrea hinnangute täpsus sõltub

• Aegrea pikkusest• Aegrea seostatuse määrast• Juhuslike suuruste jaotuse iseloomust

• Dispersioon on pöördvõrdeline aegrea pikkusega

• Dispersioon suureneb aegrea liikmete vahelise korrelatsiooni olemasolu korral

Leitud karakteristiku usalduspiiride määramine

• Usaldusvahemikuks nimetatakse uuritava suuruse vahemikku pikkusega (λ1, λ2), mille sisse jääb kliimanäitaja hinnang ja milles on selle tegelik väärtus tõenäosusega β.

• Usaldusvahemiku määramiseks on vaja teada kliimanäitaja jaotusseadusi. Pikkade aegridade (N>50) korral on tegemist asümptootilise normaaljaotusega (N lähenemisel lõpmatusele jaotus muutub normaalseks)

Usalduspiirid

qq ttI ,)(

Kus θ – kliimanäitaja hinnang (keskmine)

tq – normaaljaotuse kvantiil, mis on määratud tingimusega Φ(t)=(1-q/100)/2

q – olulisusnivoo, mis on seotud usaldustõenäosusega β: β=1-q/100

Kõige sagedasemad usaldustõenäosused on 0,95 või 0,99 (q=5% ja q=1%).

Siis on tq väärtused vastavalt 1,96 ja 2,58

Keskväärtuse, standardhälbe ja korrelatsioonikordaja usalduspiirid 5%-

lise usaldusnivoo korral

1

96,1;1

96,1)(95,0N

xN

xxI xx

12

96,1;12

96,1)(95,0NN

I xx

xxx

N

rr

N

rrrI xy

xyxy

xyxy

22

95,0

196,1;

196,1)(

Keskväärtuse ja standardhälbe usaldus-piirid 5%-lise usaldusnivoo korral

• Lühikeste aegridade (N<50) korral määratakse kvantiil tq kindlal olulisusnivool Studenti seadusega keskväärtuse jaoks ja χ2 seadusega standardhälbe jaoks

1

;1

)(N

txN

txxI xq

xq

12

1;

1)(

NNI

Korrelatsioonikordaja usalduspiirid 5%-lise usaldusnivoo korral

• Lühikese aegrea korral kasutatakse juhuslikku suurust

• Siis arvutatakse usalduspiirid valemiga

• Kus σz ≈ 1/(N-3) ja tq – normaaljaotuse kvantiil. Seda võrreldakse kriitilise väärtusega

)1/()1(ln5,0 xyxy rrz

zqzq tztzzI ;)(

3/ Ntz qcr

Jaotuste aproksimeerimine teoreetiliste jaotustega

• Diskreetne või pidev jaotus• Jaotused on kas ühetipulised, mitmetipulised, U

või J kujulised• Sümmeetrilised jaotused ei oma füüsilist piiri ja

neid mõjutab palju tegureid• Ebasümmeetrilise jaotuse korral esineb

domineeriv tegur, mis piirab teatud väärtuste esinemist

Ööpäevase õhutemperatuuri jaotus jaanuaris Moskvas ja Oimjakonis

U- ja J-kujuline jaotus

• Esineb siis, kui on ilmaelemendil kergelt saavutatav füüsiline piir (erinevate pilvevormide paksus, sademete hulk, tuule kiirus, pilvisus)

• Kahetipuline jaotus esineb seal, kus ilmastikutingimused kujunevad välja mitme kuid ajas püsiva protsessi poolt (mussoonid, sademed, mittehomogeensus))

Pilve paksus

Tuule kiirus

Pilvisus

Pilve alampiir

Normaaljaotus

• Normaaljaotuse tõenäosustihedus on ära määratud kahe parameetriga: matemaatiline ootus (keskmine) ja dispersioon

2

2

2

)(exp

2

1)(

xx

xp

2/2

2

1)( tetp

/)( xxt

Normaaljaotuse korral

• f(xk)=0,3989• f(xk-σ)=0,2420• f(xk-2σ)=0,0540• f(xk-3σ)=0,0044

Aegridade trendi analüüs

• Enamasti kasutatakse lineaarset regressioonianalüüsi, mille käigus leitakse lineaarse trendi võrrand, tõusukordaja usaldusnivoo ja determinatsioonikordaja

• Regressioon – ühepoolne statistiline sõltuvus kahe juhusliku suuruse vahel

• Kui y sõltub x-st, siis see ei tähenda, et x sõltub y-st. Tõenäosuslik seos

• Regressioonianalüüs uurib seose kuju, korrelatsioonianalüüs aga seose tugevust

Regressioonisirge y = ax + b

• y – uuritav suurus, sõltuv muutuja (õhutemperatuur)

• x – mõjutav suurus, sõltumatu muutuja (aastaarv)

• a – sirge tõusukordaja, näitab muutust ühe x-i ühiku (aasta) kohta

• b – vabaliige, näitab y väärtust juhul, kui x = 0

Determinatsioonikordaja

• Näitab seda, kui suure osa muutuja y dispersioonist kirjeldab muutuja x

• Võrdub arvuliselt korrelatsioonikordaja ruuduga• Näiteks r = -0,77, D = 0,593

Regressioonianalüüsi valemid

2)(

))((

xx

yyxxa

i

ii

xayb

))((

)(22

2

iiiiii

iiiiyx

yyyNxxxN

yxyxNB

Kodune ülesanne

• Leida keskmiste temperatuuride usalduspiirid• Eeldades, et on tegemist normaaljaotusega,

– leida jaanuari keskmise õhutemperatuuri tõenäosused 0°, -5°, -10° ja -15° kohta

– leida juuli keskmise õhutemperatuuri tõenäosused +10°, +15°, +20° kohta

• Leida iga kuu ja aasta õhutemperatuuri aegrea regressioonisirge tõus, muutus perioodi kohta ja tõusu usaldusnivoo P

• Näidisfail Tartust.xls asub aadressil http://map.gg.bg.ut.ee/jaagus

Mann-Kendalli test

• Mitteparameetriline, võimaldab analüüsida mittenormaalse jaotusega aegridu

• Vähene tundlikkus mittehomogeensusest põhjustatud hüpete suhtes

• Põhimõtteks kindlaks määrata aegrea kõigi järjestikuste väärtuste paarikaupa arvutatavate vahede märk, kusjuures aegrea igat elementi võrreldakse kõigi talle eelnevate elementidega

Mann-Kendalli test

• MK statistik monotoonse trendi jaoks

» 1, kui xi-xj>0

• sgn (xi-xj)= 0, kui xi-xj =0

» -1, kui xi-xj<0

1

1 1

)sgn(n

j

n

jiji xxS

Mann-Kendalli test

• Statistikult S minnakse selle standardiseerimisel üle MK teststatistikule Z. Eelnevalt leitakse S väärtuste dispersioon

• D(S)=n(n-1)(2n+5)/18

• kui S > 0

• Z = 0, kui S = 0

• kui S < 0

,)(

1

SD

SZ

,)(

1

SD

SZ

Mann-Kendalli test

• Kuna teststatistiku jaotus on asümptootiliselt lähendatav normaaljaotusele, on võimalik kontrollida trendi usaldusväärsust

• Konkreetse Z-i absoluutväärtust võrreldakse teoreetilisest jaotusest tuleneva kriitilise väärtusega

• Kahepoolse testi puhul võib väita, et aegreas esineb usaldusväärne monotoonne trend, kui Z-i absoluutväärtus osutub suuremaks Z-i kriitilisest väärtusest nivool α/2 (1,96)

Tingimuslik Mann-Kendalli test

• Kasutatakse siis, kui uuritakse ühe aegrea (sõltuva muutuja) trendi seostatuna teise aegrea (sõltumatu muutuja ehk kaasmuutuja) trendiga

• Eelduseks on see, et mõlemas aegreas esineb statistiliselt oluline trend

• Eesmärgiks on kontrollida, kas sõltuva muutuja trend on statistiliselt ära määratud trendi poolt kaasmuutuja aegreas

Autokorrelatsioon

• Ühe ja sama muutuja vaheline korrelatsioon• Võib olla kas ajaline või ruumiline

autokorrelatsioon• Aegrea autokorrelatsioonifunktsioon näitab

aegrea liikmete omavahelist seostatust sõltuvalt ajasammust

• Kasutatakse aegreas esinevate perioodiliste kõikumiste uurimiseks

Eesti keskmine sademete aegrida

300

350

400

450

500

550

600

650

700

750

800

850

9001

86

6

18

76

18

86

18

96

19

06

19

16

19

26

19

36

19

46

19

56

19

66

19

76

19

86

19

96

sa

de

me

d m

m

Eesti keskmise sademete aastasumma

korrelatsioonifunktsioon

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76

Õhutemperatuur

• Peamised näitajad: keskmine, standardhälve, asümmeetriakordaja, autokorrelatsioonifunktsioon

• Kuu, ööpäeva ja tähtajalised väärtused, ööpäeva maksimum ja miinimum, ülemineku kuupäevad, päevade arvud temperatuuriga üle või alla mingi piirväärtuse, esimese ja viimase öökülma kuupäev

• Mittehomogeensus erinevatest vaatlusaegadest• Aastase käigu kujutamine graafiliselt

Ööpäeva keskmised õhutemperatuurid Tartus

-10

-5

0

5

10

15

20

1-J

an

1-F

eb

1-M

ar

1-A

pr

1-M

ay

1-J

un

1-J

ul

1-A

ug

1-S

ep

1-O

ct

1-N

ov

1-D

ec

päevad

°C

Tuule kiirus ja suund

• Peamised näitajad: kuu keskmine tuule kiirus, variatsiooni- ja asümmeetriakordajad, tuule kiiruse gradatsioonide korduvus, tuule suuna korduvus ilmakaarte kaupa

• Andmed sõltuvad väga palju jaama asukohast ja mõõteriistast

• Maksimaalset tuulekiirust lähendatakse Weibulli jaotusega

• Tormipäevade arv (kiirus > 15 m/s)

Sademed

• Peamised näitajad: sademete hulk, intensiivsus, variatsiooni- ja asümmeetriakordaja, sademete kestus, erineva tagatusega kvantiilid

• Suur sõltuvus jaama asukohast, palju homogeensuse muutusi

• Tuuleparand, märgumisparand, auramisparand• Sademetega päevade arv gradatsioonide kaupa

Lumikate

• Mõõdetakse lumemõõdu püsilati järgi ja marsruutmõõtmistel

• Näitajad: lumikatte paksus ja kestus, lume tihedus ja veevaru, lumikatte esinemise esimene ja viimane kuupäev

• Püsiv lumikate: mitte vähem kui kuu aega, lumeta päevi võib olla kuni 3 päeva, ühele lumeta päevale peab eelnema 5 lumepäeva, 2-3 lumeta päevale vähemalt 10 lumepäeva

• Kui on kahe lumeperioodi vahel kuni 5 lumeta päeva, siis püsiv lumikate ei katkenud

Kodune ülesanne

• Teostada vastava jaama keskmiste temperatuuride trendi analüüs Mann-Kendalli testi abil. Abifail Mann-Kendalltemp.xls on

toodud internetis http://taurus.gg.bg.ut.ee/jaagus • Koostada temperatuuri aegridade

autokorrelatsioonifunktsioonid kuude ja aasta jaoks. Näidisfail internetis on Tartust.xls

Spektraalanalüüs

• Spektraalanalüüs on meetod, mis võimaldab leida aegrea sageduste tihedusjaotuse ehk aegrea sagedusspektri. Spektraalanalüüs kujutab endast Fourier analüüsi rakendamist stohhastilistele funktsioonidele.

• Üks võimalikest sagedusanalüüsi mudelitest on lihtne sinusoidaalne mudel, mida kasutatakse aegrea varjatud perioodsuste otsimiseks.

-0.3

-0.2

-0.1

0

0.1

0.2

0.3

1 10 19 28 37 46 55 64 73 82 91 100

Korrelogramm

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 93 97

Sk

SilutudPeriodogramm ja spekter (maksimumid 12,5 ja 7,7 a.)

Spektraalanalüüs

• Periodogramm ehk spektraalse tiheduse graafik näitab, kui suure osa kogu varieeruvusest kirjeldavad erineva perioodiga kõikumised

• Perioodi pikkus ja võnkesagedus on pöördvõrdelised. Näiteks olgu aegrida 100 aastat, 1. harmoonik perioodiga 100 a. ja sagedusega 1, 2. harmoonik perioodiga 50 a, sagedus 2, 3. harmoonik 33,3 a., 4. harmoonik 25 a., 5. harmoonik 20 a., viimane harmoonik perioodiga 2 a.

Harmoonikud 1-7

Kesk-Inglismaa aasta keskmine õhutemperatuur

Aasta keskmine õhurõhk Baselis

Aasta sademete hulk Zwanenburgis

Ruumiline autokorrelatsiooni-funktsioon

• Näitab korrelatsiooni muutust jaamade-vahelise kauguse muutusega

• Eelduseks meteoroloogilise välja homogeensus ja isotroopsus

• Alguses leitakse jaamadevaheline korrelatsioonimaatriks

• Leitakse jaamadevaheliste kauguste maatriks• Keskmistatakse korrelatsioonikordajad

kaugusvahemike kaupa

Väli on homogeenne, kui korr. f. ei muutu, kui jaamadevaheline kaugus ja orientatsioon on sama.Väli on isotroopne, kui korr. f. ei muutu, kaugus on

sama aga orientatsioon muutub

Aasta sademete summa autokorrelatsioonifunktsioon

Aasta sademed

00.10.20.30.40.5

0.60.70.80.9

1

10 30 50 70 90 110

130

150

170

190

210

230

250

270

290

310

330

350

km

Sademetevälja autokorrelatsiooni-funktsioon Eestis erinevatel perioodidel

Sademetevälja autokorrelatsiooni-funktsioon Eestis erinevatel kuudel

Kuu sademete autokorrelatsiooni-funktsioonide aastane käik

Kodune töö

• Ühe kuu sademete autokorrelatsiooni-funktsiooni leidmine, näidisfail aasta.xls

• Jaamadevahelise korrelatsioonimaatriksi leidmine Tools/Data Analysis/Correlation

• Kopeerida näidisfailist jaamadevahelise kauguse maatriks töölehelt Kaugus.

• Kopeerida näidisfaili töölehelt Korr. funktsioon kogu sisu oma faili samale lehele. Kustutada ära väärtused väljadel b2:d14. Sinna tulevad hiljem uued korrelatsioonifunktsiooni väärtused.

Kodune töö

Leida iga kaugusvahemiku jaoks keskmise korrelatsioonikordaja väärtus, selle määramise juhtude arv ja standardhälve. Selleks tuleb väljal G2 tingimusliku funktsiooni valemisse panna vastava kaugusvahemiku alumine ja ülemine piir. Antud näites tuleks numbri 340 asemele kirjutada esimesel korral 0 ja 360 asemele 20. Kui valem on õigesti sisestatud, siis tuleks seda lohistada kogu maatriksi ulatuses. Tulemused ilmuvad automaatselt väljadele B21:d21. Need tuleb kopeerida (ainult väärtused) ülevalpool olevasse tabelisse vastava kaugusvahemiku järele. Siis korrata seda protseduuri, tuues väljal G2 valemisse uue kaugusvahemiku piirid.

Peakomponentanalüüs (Principal Component Analysis - PCA)

• On faktoranalüüsi üks modifikatsioon• Kasutatakse kliimanäitajate ajalis-ruumilise

varieeruvuse kirjeldamiseks, piirkondade klimaatiliseks liigendamiseks (rajoneerimiseks), klassifitseerimiseks

• Andmete varieeruvust kirjeldatakse väikse arvu komponentide abil, mis kirjeldavad ära suurema osa koguvarieeruvusest

Peakomponentanalüüs (Principal Component Analysis - PCA)

• Sisendmaatriks – hulk mõõtmiskohti (jaamad, postid, võrgustiku sõlmpunktid), mille kohta on mõõdetud väärtuste aegrida

• T-moodi PCA – tunnusteks on ajaühikud ja juhtudeks mõõtmiskohad

• S-moodi PCA – tunnusteks mõõtmiskohad ja juhtudeks ajaühikud

PCA väljund iga komponendi jaoks

• Omaväärtused – näitavad komponentide osa koguvarieeruvuses (dispersioonis)

• Laadungid – näitavad komponendi korrelatsiooni antud mõõtmiskoha väärtustega

• Skoorid – näitavad komponendi hälvet nullist vaadeldava ajaühiku korral

• Komponentide pööramine aitab tulemusi paremini interpreteerida (Kaiseri kriteerium)

• Varimax normalized

1. näide: Eesti rajoneerimine õhutemperatuuri alusel

• Algandmeteks kuu keskmised õhutemperatuurid 22 jaamas 1966-2000

• Kasutati lisaks PCA-le ka klasteranalüüsi• Kasutati pööramata komponente

Kasutatud ilmajaamad

Kuude temperatuuride dendrogramm

Talve temperatuuri 1. komponent

Mai temperatuuri 1. komponent

Mai temperatuuri 2. komponent

Temperatuuride 1. ja 2. komponendi hajuvusdiagramm

Kuude temperatuuride korrelatsioonid kahe esimese komponendiga

Eesti rajoneering õhutemperatuuri alusel

2. näide: Eesti lumikatte rajoneerimine lumikatte paksuse ja kestuse andmetel

• Algandmeteks kuue kuu (november-aprill) keskmised lume paksused (cm) ja lumikatte kestused päevades

• Aegrida 40 aastat – 1961/1962 – 2000/2001• Mõõtmisandmed on interpoleeritud 5x5 km

võrgustikku (1734 punkti), millest on tegelikult kasutatud iga neljandat punkti (433 punkti)

• Komponendid on pööratud

Lume paksuse 1. komponent

Lume paksuse 2. komponent

Lume paksuse 3. komponent

Valdkonnad lumikatte paksuse järgi

0.366 0.304 0.226

Lume paksuse kolme esimese komponendi aegread ja trendid

-3

-2

-1

0

1

2

3

4

5

6

1962 1967 1972 1977 1982 1987 1992 1997

Lumikatte kestuse 1. komponent

Lumikatte kestuse 2. komponent

Valdkonnad lumikatte paksuse järgi

Lumikatte kestuse kahe esimese komponendi skooride aegread ja

lineaarsed trendid

3. näide: Euroopa sademete rajoneering

• Algandmed East Anglia Ülikooli kliimauurimise keskuse (CRU) globaalsest andmebaasist

• Periood 1900-1996, kahe tihedusega võrgustikku interpoleeritud sademete kuusummad

• Hõredam võrgustik 5x5 kraadi, 88 sõlmpunkti• Tihedam võrgustik 2,5x3,75 kraadi, 212 punkti• Kasutati pööramata S-moodi PCA-d järjestikuste

kuu- ja sesoonisademete jaoks

5x5 kraadi võrgustik, 88 punkti

2,5x3,75 kraadi võrgustik, 212 punkti

Sesoonisademete 1. komponent

Kuusademete 2. komponent

Kuusademete 3. komponent

Sesoonisademete 4. komponent

Kuusademete rajoneering 5x5 kraadi võrgustiku alusel

Kuusademete rajoneering 2,5x3,75 kraadi võrgustiku alusel

4. näide: Baltimaade sademete rajoneering

• Algandmed: kuu sademed 120 Eesti, Läti ja Leedu ilmajaamas perioodil 1966-2005

• S-moodi PCA koos komponentide pööramisega

A hja

H elterm aaJõgeva

Jõhvi

K asari

K eila

K ihnu

K oodu

K unda

K uusiku

K ääpa

Lüganuse

M assum õisa

M auri

M ehikoorm a

N arva

N igula

O andu

O reküla

P akri

P ärnuP raaga

R annu-Jõesuu

R istna R ohuküla

R uhnu

R äpina

S õrve

S äm i

Tahkuse

Tallinn

Tartu

T iiriko ja

Tõllis te

Toom a

Tõravere

Tõrva

Tõrve

Tudu

Tudulinna

Türi

U ue-Lõve

V alga

V anaküla

V asknarva

V ihterpalu

V iljandiV ilsandi

V irtsu

V äike-M aarja

V õruA inaþi

A lûksne

A tas iene

B auska

C arn ikava

D augavpils

D obele

G ulbene

K olka

K râslava

K uldîga

Liepâja

M ersrags

N ereta

P âvilosta

P iedruja

P lavinas

P ravin i

P rieku li

R îga-LU

R oja

R ûjiena

S aldus

S igulda

S îli

S krîveri

S kulteS tende

V alm iera

V ârdava

V entsp ils

Z îlâni

Zoseni

B irzai

D otnuva

K aunas

K ybarta i

K la ipeda

Laukuva

Lazdija i

N ida

P anevezys

R asein ia i

S iau lia i

S ilu te

Tels ia i

U km erge

U tena

V arena

V iln ius

A km ene (N )

A ly tus

A nyksc ia i

B irs tonas

D rusk in inka i

Jonava

K artenaK retinga

M azeik ia i

P abrade

P apile

P uvocia i

R okisk is

S kuodas

S vencionys Taurage

Tauragnai

T rakai

V ente

1. komponent 2. komponent

3. komponent 4. komponent

Sademete regioonid Baltimaades

Kodune ülesanne – koostada kuu sademete rajoneering Eesti jaoks kasutades PCA-d

• Sademete andmemaatriksi transponeerimine EXCELis (copy/paste special/transpose)

• Sademete andmemaatriksi sisestamine programmi STATISTICA (Open, EXCEL files, esimene rida ja veerg lugeda nimedeks)

• Statistics/Multivariate Exploratory Techniques/ Factor Analysis

• Variables/Select all• Maximum number of factors – 10

Kodune ülesanne – koostada kuu sademete rajoneering Eesti jaoks kasutades PCA-d

Teostada pööramine: Factor rotation/Varimax normalized

• Avada laadungite tööleht: Summary Factor Loadings, kopeerida see EXCELi töölehele

• Iga jaama kohta teha kindlaks suurim laadung• Koostada Surferis kaart, kus eri valdkonnad on

toodud erineva värviga• Vaadata skooride aegridu ja teostada trendi

analüüs