View
106
Download
0
Category
Preview:
DESCRIPTION
Klimatoloogiline andmetöötlus. Kliima kirjeldus põhineb pikaajalistel ilmavaatlustel. Töötluse käigus andmeid tihendatakse, keskmistatakse ja üldistatakse Koostatakse teatud ajaintervallide kaupa üldistatud read Andmeread muudetakse ümber nende väärtuste jaotusteks gradatsioonide järgi - PowerPoint PPT Presentation
Citation preview
Klimatoloogiline andmetöötlus
Kliima kirjeldus põhineb pikaajalistel ilmavaatlustel
• Töötluse käigus andmeid tihendatakse, keskmistatakse ja üldistatakse
• Koostatakse teatud ajaintervallide kaupa üldistatud read
• Andmeread muudetakse ümber nende väärtuste jaotusteks gradatsioonide järgi
• Arvutatakse suhteliselt väike arv aegridade statistilisi karakteristikuid, mis väljendavad jaotuste üldisi omadusi
• Kasutatakse tõenäosuslikke (stohhastilisi) meetodeid
Kliimaridade spetsiifilised omadused
• Mittehomogeensus (mõõtmistingimuste ja kliimategurite muutus pikema perioodi jooksul)
• Mittestatsionaarsus (ööpäevane, aastane jt. perioodilised kõikumised)
• Kliimanäitajate seostatus ajas ja ruumis (autokorrelatsioon), seetõttu pole üksikmõõtmised täiesti juhuslikeks väärtusteks
• Andmetöötlusel tuleb arvestada iga konkreetse kliimanäitaja spetsiifikat
Meteoroloogiliste vaatlusandmete klimatoloogilise töötluse peamised etapid
• Kliimaridade koostamine ja kontroll• Üldise klimaatilise informatsiooni saamine ja
selle täpsuse hindamine• Kliima diagnoosi ja prognoosi jaoks info saamine• Praktika jaoks kliimanäitajate väljatöötamine ja
nende arvutamine• Klimaatilise info territoriaalne üldistamine
Klimaatiliste aegridade liigid
• Aegread koosnevad üksikelementidest, millest igaüks võib olla kas vaatlustulemus või vaatluste üldistus mingi ajavahemiku jaoks.
• I. Erinevused rea elemendi ajalise lahutuse poolest (tähtajalised, ööpäevased, dekaadi, kuu, sesooni või aasta kohta)
• Ajaühikut saab üldistada keskmistamise alusel, ekstreemumi järgi, antud väärtusega juhtude arvu alusel, ülemineku kuupäevaga üle mingi piirväärtuse
Klimaatiliste aegridade liigid
• II. Erinevused diskreetsuse vahemiku alusel (üht ja sama näitajat on võimalik arvutada mitme mõõtmistulemuse põhjal)
• III. Erinevused aegrea realisatsiooni pikkuses (ühest päevast kuni aastani)
• IV. Erinevused ilmaelemendi iseloomustajas (kas selle enda väärtus, päevade arv mingi väärtusega, mingist väärtusest ülemineku kuupäev, mingi väärtusega perioodi pikkus, mingi nähtusega päevade arv, selle kestus ja intensiivsus, vektorväärtused)
Kliimaridade koostamise andmeallikad
• TM-1 – tabel iga kuu andmetega (v.a. Päikesekiirgus ja mullatemperatuurid)
• TM-3 – tabel mullatemperatuuri andmetega• TM-11, TM-12 – päikesekiirguse andmed• Õhutemperatuuri, õhurõhu, niiskuse ja sademete
isekirjutajate tabelid• Vaatlusraamatud (KM-1, KM-2 jne.) 3 aasta järel
hävitatakse• Sünoptilised kaardid ja bülletäänid
Kliimaridade kvaliteedi kontroll
• Aegrea mittehomogeensust põhjustab kaks peamist tegurit
• – esineb trend (kliimategurite muutumine, inimmõju), s.t. ajas muutub keskväärtus ja ka dispersioon (N. ööpäevane või aastane käik, tsüklilisus) – statistiline mittehomogeensus
• - vaatlusmetoodika ja vaatlustingimuste muutus (klimatoloogiline mittehomogeensus)
Klimaatilise mittehomogeensuse põhjused
• Jaama asukoha muutus, ümbruskonna muutus (puud, ehitised), mikrokliima muutus
• Mõõteriista ja metoodika muutumine (Nipheri ja Tretjakovi sademetemõõtja, tuulelipp, vaatlusajad)
• Vaatleja juhuslikud vead, eriti visuaalsetel vaatlustel (pilved, nähtavus)
• Vaatlusaegade ja keskväärtuste arvutamise metoodika muutus, parandid
Aasta keskmine temperatuur Tallinnas (A. Tarandi järgi)
1
2
3
4
5
6
7
8
17
56
17
76
17
96
18
16
18
36
18
56
18
76
18
96
19
16
19
36
19
56
19
76
19
96
t°C
Eesti ala keskmine sademete hulk soojal poolaastal (IV-X)
200
250
300
350
400
450
500
550
600
1866 1876 1886 1896 1906 1916 1926 1936 1946 1956 1966 1976 1986 1996 2006
mm
Eesti ala keskmine sademete hulk külmal poolaastal (XI-III)
50
100
150
200
250
300
1867 1877 1887 1897 1907 1917 1927 1937 1947 1957 1967 1977 1987 1997 2007
mm
Aasta keskmine temperatuur Tartus
2
3
4
5
6
7
8
1866 1876 1886 1896 1906 1916 1926 1936 1946 1956 1966 1976 1986 1996 2006
°C
Homogeensuse kontroll Studenti kriteeriumi abil
mn
mnnm
mn
xyt
yx
)2(22
Kus n ja m on aegrea kahe osa liikmete arv (N=n+m) ning
x, y, σ ja σ – aegrea kahe osa (liikmete arvuga vastavalt n ja m) liikmete keskväärtused ja standardhälbed
Alexanderssoni test SNHT (Standard Normal Homogeneity Test)
• Võrreldakse uuritavat aegrida näidisreaga• Leitakse uuritava rea ja näidisrea vahede või
suhete aegrida qi kus i=1,2,...N
• Leitakse standardiseeritud aegrida• Leitakse testi statistikute aegrida
q
ii s
qqz
2
2
2
1 )( zNzT
11
1
iizz
N
iizN
z1
2
1
Alexanderssoni test SNHT (Standard Normal Homogeneity Test)
• Kui testi statistik on suurem, kui kriitiline väärtus (ca 10), siis on toimunud oluline mittehomogeensus vastava aasta puhul
• Standardprogrammid võimaldavad arvutada ka sellist mittehomogeensust, mida on põhjustanud trend ning kahe punkti mittehomogeensust
Bologna, 17 - 18 May, 2005 17
Homogenisation of Temperature Series for Metheorological Stations in Northwestern
Slovenia
INTRODUCTION
• In climatological studies, trend analysis and climate change studies it is importaint to operate with homogeneised time series, since the inhomogeneities in time series, due to various factors give wrong idea about climatic conditions.
• We present the method and causes of homogeneisation of temperature time series for metheorological stations in Gorenjska region, t.i. in the northwestern part of Slovenia.
• The decision for homogeneisation was taken on the basis of SNHT - Alexandersson test, the final decision for homogeneisation was taken on the basis of metadata about the station history.
METHODOLOGY – Alexandersson test
/H. Alexandersson, 1986, Journal of Climatology, V 6, p.661/
• In the test monthly and yearly data of the tested station and one or more reference series are needed.
• Since the temperature series were analysed, the series of temperature differences between the test and the reference series was formed.
• We define a new standardized series of ratios according to
iq
iz
q
ii s
qqz
izZ ,
Null hypothesis:• H0 : Z N(0,1), i
Z has a normal distribution with zero mean value and unit standard deviation
Alternative hypothesis:• H1 : For some 1 n and 1 2 Z N(1 ,1), for i Z N(2 ,1), for i
• Z has a normal distribution• The possible break is one single break• It consists of only a shift of a mean value
• The problem is to find a test quantity that can give an answer to the question:
‘ When and by how many per cent and how certain is it that a series contains a non-homogeneity?’
• The standard technique of likelihood ratios is used
2
2
2
111
0 )(maxmax znzTTnn
11
1
iizz
n
iizn
z1
2
1
In Alexandersson test T0 is the test statistics and the critical levels are
determined by the simulation.
Thus we obtain:
1. T0 . If T0 is larger than a certain critical level the series should be classified as non-homogeneous at a certain level, t.i. with 95 per cent confidence
2. The year (or the month and the year) which is the most probable for a break
3. The mean values of sequences of the differences and before and after the break
Anclim program of the author Petr Štěpánek / P. Štepanek, 2003, AnCLim – software for time series analysis. Dept. Of Geograghy,
Fac of Natural Sciences, MU, Brno/
• The year of the inhomogeneity was checked in the metadata, in the station history, on the basis of which the final decision for homogenasation was taken.
• The series was homogeneised by the method 'User defined homogeneisation' in Anclim program.
• Missing values were completed by the Anclim program.
RESULTS
Metheorological stations in Slovenia:• all together 634 metheorological stations, 379 of them are still in
operation• 218 climatological stations, 40 of them are still in operation.
0,0
5,0
10,0
15,0
20,0
25,0
30,0
10 20 30 40 50 60 70 80 90 100 More
years of operation
pe
rce
nta
ge
(%
)
Figure 1: The percentage of climatological
stations regarding the years of operation
• We plan to test the temperature series for various regions in Slovenia, for the regions where the stations have similar climatic conditions.
• The temperature series of metheorological stations in northwestern part of Slovenia, t.i. 18 metheorological stations were tested.
Figure 2: The spatial distribution of metheorological stations with homogeneized temperature series in Gorenjska region
• Monthly time series for temperatures at 7 a.m. (T7), 2 p.m. (T14), 9 p.m. (T21) and maximal and minimal temperatures were analysed,
• 90 temperature series were tested.
Meteorological station
Latitude Longitude Elev.a.s.l. (m)
Homogen. series
R.m.v. T
R.m.v.
Tmax
R.m.v.
Tmin
T7 T14 T21 Tmax Tmin
Brnik 460 13' 04'' 140 28' 39'' 364 1954-2003 / 1 1 11.197808.1993
11.197808.1993
11.197808.1993
11.197808.199306.1966
11.197808.199311.1983
Dom na Komni 460 17' 04'' 130 46' 41'' 1520 1951-1983 16 52 51 01.1965 07.1965 08.1968 07.1961 ______
Golnik 460 19' 45'' 140 20' 12'' 500 1954-1978 19 19 19 01.1965 11.196402.1972
01.1965 06.1958 07.1964
Javorje 460 09' 26'' 140 10' 56'' 690 1955-1990 2 2 2 03.196307.1980
03.196305.1970
11.195905.1970
07.1963 ______
Kredarica 460 22' 46'' 130 51' 14'' 2514 1954-2003 7 7 7 01.1983 01.1983 01.1983 09.1976 02.199110.1978
Krvavec 460 17' 52'' 140 32' 19'' 1740 1961-2003 16 18 20 08.197304.1981
08.1973 08.197304.1981
08.197310.1981
08.197304.198607.1965
Lesce-Radovljica 460 21' 56'' 140 10' 45'' 515 1954-2003 16 19 22 01.197901.1965
01.197901.1965
01.197901.1965
01.197911.1965
01.197906.196510.1972
Novaki 460 09' 140 03' 650 1961-1977 4 5 5 07.1971 ______ ______ 10.1966 06.1971
Planina pod Golico
460 28' 03'' 140 03' 27'' 970 1951-2003 3 7 11 01.196108.1979
01.196108.1979
01.196108.1979
01.196106.1970
01.196102.1976
Preddvor 460 18' 11'' 140 25' 23'' 485 1991-2003 6 6 6 07.1994 ______ ______ ______ ______
Rovtarica 460 17' 09'' 140 05' 42'' 1077 1954-1970 6 7 6 09.1964 ______ 09.1964 ______ 11.1962
Rudno polje 460 21' 130 56' 1347 1951-1964 24 29 26 ______ 08.1958 ______ ______ ______
Šmarna gora 460 07' 48'' 140 28' 08'' 665 1961-1989 1 2 2 01.196905.1979
07.1975 01.1969 07.1975 01.1969
Stara Fužina 460 17' 14'' 130 53' 52'' 547 1951-2002 28 35 39 ______ 05.1981 12.1969 03.1964 05.1966
Topol 460 05' 36'' 140 22' 32'' 660 1989-2003 8 8 8 ______ ______ ______ ______ ______
Vogel 460 15' 50'' 130 50' 44'' 1535 1982-2003 5 5 5 11.1985 06.1995*
06.1985
06.1995* 10.1996 04.1989
Voglje 460 13' 140 27' 371 1954-1964 7 7 7 _____ _______
______ ______ ______
Žeje 460 17' 140 18' 427 1954-1973 11 12 20 05.1960 05.1960 05.196009.1966
05.1960 09.1967
Brnik, 364 m a.s.l.• Temperature series T7, T14, T21, Tmax, Tmin were first
homogeneised till the breakpoint in November 1978, when the station was relocated and the temperature rose,
• The second homogeneisation was done till August 1993 when the automatic meteorological station was introduced and the station was relocated as well. At this relocation the temperature fell.
• Tmax was homogeneised once more till the breakpoint in June 1966 (station relocation)
• Tmin was corrected till November 1983, when the minimal thermometer was replaced.
Brnik
Breakpoint T0 T (°C)
T7 Oct. 1978
Aug. 1993
21.05
17.42 +1.15
-0.96 T14 Nov. 1978
Aug. 1993
13.56
14.96
-0.65
-0.61
T21 Sep. 1978
Aug. 1993
20.01
15.82
+1.36
-1.06
Tmax Sep. 1978
Aug. 1993
Mar. 1966
17.03
21.58
15.60
+0.45
-0.88
+0.60
Tmin Oct. 1978
Aug. 1993
Aug. 1982
34.07
26.52
13.61
+2.00
-1.43
+0.22
• We analysed 7 mountainous metheorological stations with the
elevation above 950 m.
• Krvavec, 1740 m a.s.l.• Station relocation:
In August 1973 for 800 m towards NE to a 268m higher location, on 1740m above sea level.
• Reference series:
The reference series was created by the series for Planina pod Golico (970m a.s.l.) and Kredarica (2514 m a.s.l.).
T7, September T14, September
T21, September Tmax, September
Figure 3a,b,c,d: Temperature differences between the T7,T14, T21, Tmax series for Krvavec and the reference series.
Krvavec, 1740 m a.s.l.
Krvavec, 1740 m a.s.l.
• Temperature series T7, T14, T21, Tmax, Tmin were first homogeneised till August 1973, the temperatures fell
Breakpoint T0 T (°C)
T7 Sep. 1973 23.76 -0.96
T14 Sep. 1973 34.03 -3.13
T21 Sep. 1973 33.92 -1.98
Tmax Sep. 1973 29.98 -3.15
Tmin Apr. 1974 24.67 -1.31
• T7 and T21 were additionaly corrected regarding the dry thermometer
replacement in April 1981
• Tmax was additionaly corrected regarding the maximal thermometer
replacement in October 1981,
• Tmin was additionaly corrected regarding the minimal thermometer
change in April 1986
Krvavec, 1740 m a.s.l.
T7, September T14, September
T21, September Tmax, September
Figure 4a,b,c,d: Temperature differences between the T7,T14, T21, Tmax series for Krvavec and the reference series after homogeneisation
Iseseisva töö ülesanded
• Teostada Studenti test antud jaama õhutemperatuuri aegridade jaoks
– Näidisfailid on Student.xls ja SorveStudent.xls – Leida t ja p väärtused iga kuu ja aasta keskmise
aegrea jaoks
• Teostada Alexanderssoni test antud jaama õhutemperatuuri aastase ja sesoonsete aegridade jaoks
– Näidisfail on Alexandersson.xls
• Näidisfailid asuvad aadressil http://taurus.gg.bg.ut.ee/jaagus
Kliimakarakteristikute arvutamise meetodid
• Meteoelemendi väärtuste jaotuse korduvused ja empiirilised funktsioonid
• Arvulised karakteristikud, eriti neli esimest keskmomenti
• Meteoelementide ja nähtuste äärmusväärtused
• Meteoroloogilised kompleksid
Korduvuse ja empiiriliste funktsioonide arvutamine
• Jaotuse uurimiseks jagatakse maksimumi ja miinimumi vahele jäävad väärtused intervallideks
• Loetakse ära vaatluste arv ehk korduvus nk , mis sattus vahemikku Δxk.
• Arvutatakse suhteline sagedus pk=nk/N,
– kus k=1,2,...,s – N – vaatluste arv, s – gradatsioonide arv
• Suhteline tihedus igas intervallis (histogramm)
kkkkk xNnxp //
Kuu keskmise õhutemperatuuri histo-grammid Kuusikul jaanuaris ja juulis
Histogram
0
5
10
15
20
-15.9
-14.0
7777
778
-12.2
5555
556
-10.4
3333
333
-8.61
1111
111
-6.78
8888
889
-4.96
6666
667
-3.14
4444
444
-1.32
2222
222
Mor
e
Bin
Fre
qu
ency
Histogram
02468
1012141618
13.4
14.24
4444
44
15.08
8888
89
15.93
3333
33
16.77
7777
78
17.62
2222
22
18.46
6666
67
19.31
1111
11
20.15
5555
56M
ore
Bin
Fre
qu
ency
Korduvuse ja empiiriliste funktsioonide arvutamine
• Empiiriline jaotusfunktsioon F(x)=nx/N
– kus nx – juhtude arv, kui muutuja väärtused jäävad alla piirväärtuse x.
– Jaotusfunktsiooni graafik on astmeline kõver
• Empiiriline jaotusfunktsioon kahanevas järjekorras Φ(x)=1-F(x)
Kuu keskmise õhutemperatuuri jaotus-funktsioonid Kuusikul jaanuaris ja juulis
Histogram
02468
101214161820
-15.9
-12.2
5555
556
-8.6
11111
111
-4.9
66666
667
-1.3
22222
222
Bin
Fre
qu
ency
0.00%
20.00%
40.00%
60.00%
80.00%
100.00%
120.00%
Frequency
Cumulative %
Histogram
02468
1012141618
13.4
15.0
8888
889
16.7
7777
778
18.4
6666
667
20.1
5555
556
Bin
Fre
qu
ency
0.00%20.00%40.00%60.00%80.00%100.00%120.00%
Frequency
Cumulative %
Peamised kliimakarakteristikud
• Kliimanäitajate keskmisi, muutlikkust, seostatust ja teisi näitajaid saab väljendada jaotuse alg- ja keskmomentide kaudu
• Algmoment
• Keskmoment
– kus xi – meteoelemendi väärtus, pi – suhteline jaotustihedus
N
ii
qiq px
1
N
ii
qiiq px
1
)(
Peamised kliimakarakteristikud
• Segamoment
– kus pij – kahe juhusliku väärtuse koosesinemise tõenäosus
• Praktikas kasutatakse nelja esimest järku momente ja teist järku segamomenti
N
i
M
jij
lyj
kxikl pyx
1 111 )()(
Peamised kliimakarakteristikud
• Keskväärtus
• Standardhälve
• Variatsioonikordaja
N
xx
N
ii
11
N
xxN
ii
1
2
2/12
)(
xV /
Peamised kliimakarakteristikud
• Asümmeetriakordaja
• Ekstsessikordaja
• Korrelatsioonikordaja
31
3
2/323
)(
N
xxA
N
ii
3)(
34
1
4
224
N
xxE
N
ii
yx
N
iii
yx
yyxxr
12/1
200211,
))(()(
Peamised kliimakarakteristikud
• Mood – juhusliku suuruse x väärtus, mis vastab maksimaalsele tõenäosustihedusele
• Mediaan F(xi) = 0,5• Kvantiil (q-ndat järku) F(xq) = q• Dispersioon D=σ2
• Keskmine absoluuthälve
• Väike asümmeetria kuni A<0,25, mõõdukas asümmeetria 0,25<A<0,50, suur asümmeetria A>0,50
N
ii xx
N 1
1
Moe, mediaani ja keskväärtuse omavaheline asend erineva
asümmeetriaga jaotuste korral
Iseseisva töö ülesanded
• Arvutada iga kuu ja aasta kohta– keskmine, mediaan, mood– standardhälve, maksimum, miinimum– asümmeetria- ja ekstsessikordaja– 5, 25, 75 ja 95 % kvantiilid
• Koostada histogrammid jaanuari, juuli ja aasta temperatuuri kohta
• Näidisfail tartust.xls asub aadressil http://taurus.gg.bg.ut.ee/jaagus
Aegrea hinnangute täpsus sõltub
• Aegrea pikkusest• Aegrea seostatuse määrast• Juhuslike suuruste jaotuse iseloomust
• Dispersioon on pöördvõrdeline aegrea pikkusega
• Dispersioon suureneb aegrea liikmete vahelise korrelatsiooni olemasolu korral
Leitud karakteristiku usalduspiiride määramine
• Usaldusvahemikuks nimetatakse uuritava suuruse vahemikku pikkusega (λ1, λ2), mille sisse jääb kliimanäitaja hinnang ja milles on selle tegelik väärtus tõenäosusega β.
• Usaldusvahemiku määramiseks on vaja teada kliimanäitaja jaotusseadusi. Pikkade aegridade (N>50) korral on tegemist asümptootilise normaaljaotusega (N lähenemisel lõpmatusele jaotus muutub normaalseks)
Usalduspiirid
qq ttI ,)(
Kus θ – kliimanäitaja hinnang (keskmine)
tq – normaaljaotuse kvantiil, mis on määratud tingimusega Φ(t)=(1-q/100)/2
q – olulisusnivoo, mis on seotud usaldustõenäosusega β: β=1-q/100
Kõige sagedasemad usaldustõenäosused on 0,95 või 0,99 (q=5% ja q=1%).
Siis on tq väärtused vastavalt 1,96 ja 2,58
Keskväärtuse, standardhälbe ja korrelatsioonikordaja usalduspiirid 5%-
lise usaldusnivoo korral
1
96,1;1
96,1)(95,0N
xN
xxI xx
12
96,1;12
96,1)(95,0NN
I xx
xxx
N
rr
N
rrrI xy
xyxy
xyxy
22
95,0
196,1;
196,1)(
Keskväärtuse ja standardhälbe usaldus-piirid 5%-lise usaldusnivoo korral
• Lühikeste aegridade (N<50) korral määratakse kvantiil tq kindlal olulisusnivool Studenti seadusega keskväärtuse jaoks ja χ2 seadusega standardhälbe jaoks
1
;1
)(N
txN
txxI xq
xq
12
1;
1)(
NNI
Korrelatsioonikordaja usalduspiirid 5%-lise usaldusnivoo korral
• Lühikese aegrea korral kasutatakse juhuslikku suurust
• Siis arvutatakse usalduspiirid valemiga
• Kus σz ≈ 1/(N-3) ja tq – normaaljaotuse kvantiil. Seda võrreldakse kriitilise väärtusega
)1/()1(ln5,0 xyxy rrz
zqzq tztzzI ;)(
3/ Ntz qcr
Jaotuste aproksimeerimine teoreetiliste jaotustega
• Diskreetne või pidev jaotus• Jaotused on kas ühetipulised, mitmetipulised, U
või J kujulised• Sümmeetrilised jaotused ei oma füüsilist piiri ja
neid mõjutab palju tegureid• Ebasümmeetrilise jaotuse korral esineb
domineeriv tegur, mis piirab teatud väärtuste esinemist
Ööpäevase õhutemperatuuri jaotus jaanuaris Moskvas ja Oimjakonis
U- ja J-kujuline jaotus
• Esineb siis, kui on ilmaelemendil kergelt saavutatav füüsiline piir (erinevate pilvevormide paksus, sademete hulk, tuule kiirus, pilvisus)
• Kahetipuline jaotus esineb seal, kus ilmastikutingimused kujunevad välja mitme kuid ajas püsiva protsessi poolt (mussoonid, sademed, mittehomogeensus))
Pilve paksus
Tuule kiirus
Pilvisus
Pilve alampiir
Normaaljaotus
• Normaaljaotuse tõenäosustihedus on ära määratud kahe parameetriga: matemaatiline ootus (keskmine) ja dispersioon
2
2
2
)(exp
2
1)(
xx
xp
2/2
2
1)( tetp
/)( xxt
Normaaljaotuse korral
• f(xk)=0,3989• f(xk-σ)=0,2420• f(xk-2σ)=0,0540• f(xk-3σ)=0,0044
Aegridade trendi analüüs
• Enamasti kasutatakse lineaarset regressioonianalüüsi, mille käigus leitakse lineaarse trendi võrrand, tõusukordaja usaldusnivoo ja determinatsioonikordaja
• Regressioon – ühepoolne statistiline sõltuvus kahe juhusliku suuruse vahel
• Kui y sõltub x-st, siis see ei tähenda, et x sõltub y-st. Tõenäosuslik seos
• Regressioonianalüüs uurib seose kuju, korrelatsioonianalüüs aga seose tugevust
Regressioonisirge y = ax + b
• y – uuritav suurus, sõltuv muutuja (õhutemperatuur)
• x – mõjutav suurus, sõltumatu muutuja (aastaarv)
• a – sirge tõusukordaja, näitab muutust ühe x-i ühiku (aasta) kohta
• b – vabaliige, näitab y väärtust juhul, kui x = 0
Determinatsioonikordaja
• Näitab seda, kui suure osa muutuja y dispersioonist kirjeldab muutuja x
• Võrdub arvuliselt korrelatsioonikordaja ruuduga• Näiteks r = -0,77, D = 0,593
Regressioonianalüüsi valemid
2)(
))((
xx
yyxxa
i
ii
xayb
))((
)(22
2
iiiiii
iiiiyx
yyyNxxxN
yxyxNB
Kodune ülesanne
• Leida keskmiste temperatuuride usalduspiirid• Eeldades, et on tegemist normaaljaotusega,
– leida jaanuari keskmise õhutemperatuuri tõenäosused 0°, -5°, -10° ja -15° kohta
– leida juuli keskmise õhutemperatuuri tõenäosused +10°, +15°, +20° kohta
• Leida iga kuu ja aasta õhutemperatuuri aegrea regressioonisirge tõus, muutus perioodi kohta ja tõusu usaldusnivoo P
• Näidisfail Tartust.xls asub aadressil http://map.gg.bg.ut.ee/jaagus
Mann-Kendalli test
• Mitteparameetriline, võimaldab analüüsida mittenormaalse jaotusega aegridu
• Vähene tundlikkus mittehomogeensusest põhjustatud hüpete suhtes
• Põhimõtteks kindlaks määrata aegrea kõigi järjestikuste väärtuste paarikaupa arvutatavate vahede märk, kusjuures aegrea igat elementi võrreldakse kõigi talle eelnevate elementidega
Mann-Kendalli test
• MK statistik monotoonse trendi jaoks
» 1, kui xi-xj>0
• sgn (xi-xj)= 0, kui xi-xj =0
» -1, kui xi-xj<0
1
1 1
)sgn(n
j
n
jiji xxS
Mann-Kendalli test
• Statistikult S minnakse selle standardiseerimisel üle MK teststatistikule Z. Eelnevalt leitakse S väärtuste dispersioon
• D(S)=n(n-1)(2n+5)/18
• kui S > 0
• Z = 0, kui S = 0
• kui S < 0
,)(
1
SD
SZ
,)(
1
SD
SZ
Mann-Kendalli test
• Kuna teststatistiku jaotus on asümptootiliselt lähendatav normaaljaotusele, on võimalik kontrollida trendi usaldusväärsust
• Konkreetse Z-i absoluutväärtust võrreldakse teoreetilisest jaotusest tuleneva kriitilise väärtusega
• Kahepoolse testi puhul võib väita, et aegreas esineb usaldusväärne monotoonne trend, kui Z-i absoluutväärtus osutub suuremaks Z-i kriitilisest väärtusest nivool α/2 (1,96)
Tingimuslik Mann-Kendalli test
• Kasutatakse siis, kui uuritakse ühe aegrea (sõltuva muutuja) trendi seostatuna teise aegrea (sõltumatu muutuja ehk kaasmuutuja) trendiga
• Eelduseks on see, et mõlemas aegreas esineb statistiliselt oluline trend
• Eesmärgiks on kontrollida, kas sõltuva muutuja trend on statistiliselt ära määratud trendi poolt kaasmuutuja aegreas
Autokorrelatsioon
• Ühe ja sama muutuja vaheline korrelatsioon• Võib olla kas ajaline või ruumiline
autokorrelatsioon• Aegrea autokorrelatsioonifunktsioon näitab
aegrea liikmete omavahelist seostatust sõltuvalt ajasammust
• Kasutatakse aegreas esinevate perioodiliste kõikumiste uurimiseks
Eesti keskmine sademete aegrida
300
350
400
450
500
550
600
650
700
750
800
850
9001
86
6
18
76
18
86
18
96
19
06
19
16
19
26
19
36
19
46
19
56
19
66
19
76
19
86
19
96
sa
de
me
d m
m
Eesti keskmise sademete aastasumma
korrelatsioonifunktsioon
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76
Õhutemperatuur
• Peamised näitajad: keskmine, standardhälve, asümmeetriakordaja, autokorrelatsioonifunktsioon
• Kuu, ööpäeva ja tähtajalised väärtused, ööpäeva maksimum ja miinimum, ülemineku kuupäevad, päevade arvud temperatuuriga üle või alla mingi piirväärtuse, esimese ja viimase öökülma kuupäev
• Mittehomogeensus erinevatest vaatlusaegadest• Aastase käigu kujutamine graafiliselt
Ööpäeva keskmised õhutemperatuurid Tartus
-10
-5
0
5
10
15
20
1-J
an
1-F
eb
1-M
ar
1-A
pr
1-M
ay
1-J
un
1-J
ul
1-A
ug
1-S
ep
1-O
ct
1-N
ov
1-D
ec
päevad
°C
Tuule kiirus ja suund
• Peamised näitajad: kuu keskmine tuule kiirus, variatsiooni- ja asümmeetriakordajad, tuule kiiruse gradatsioonide korduvus, tuule suuna korduvus ilmakaarte kaupa
• Andmed sõltuvad väga palju jaama asukohast ja mõõteriistast
• Maksimaalset tuulekiirust lähendatakse Weibulli jaotusega
• Tormipäevade arv (kiirus > 15 m/s)
Sademed
• Peamised näitajad: sademete hulk, intensiivsus, variatsiooni- ja asümmeetriakordaja, sademete kestus, erineva tagatusega kvantiilid
• Suur sõltuvus jaama asukohast, palju homogeensuse muutusi
• Tuuleparand, märgumisparand, auramisparand• Sademetega päevade arv gradatsioonide kaupa
Lumikate
• Mõõdetakse lumemõõdu püsilati järgi ja marsruutmõõtmistel
• Näitajad: lumikatte paksus ja kestus, lume tihedus ja veevaru, lumikatte esinemise esimene ja viimane kuupäev
• Püsiv lumikate: mitte vähem kui kuu aega, lumeta päevi võib olla kuni 3 päeva, ühele lumeta päevale peab eelnema 5 lumepäeva, 2-3 lumeta päevale vähemalt 10 lumepäeva
• Kui on kahe lumeperioodi vahel kuni 5 lumeta päeva, siis püsiv lumikate ei katkenud
Kodune ülesanne
• Teostada vastava jaama keskmiste temperatuuride trendi analüüs Mann-Kendalli testi abil. Abifail Mann-Kendalltemp.xls on
toodud internetis http://taurus.gg.bg.ut.ee/jaagus • Koostada temperatuuri aegridade
autokorrelatsioonifunktsioonid kuude ja aasta jaoks. Näidisfail internetis on Tartust.xls
Spektraalanalüüs
• Spektraalanalüüs on meetod, mis võimaldab leida aegrea sageduste tihedusjaotuse ehk aegrea sagedusspektri. Spektraalanalüüs kujutab endast Fourier analüüsi rakendamist stohhastilistele funktsioonidele.
• Üks võimalikest sagedusanalüüsi mudelitest on lihtne sinusoidaalne mudel, mida kasutatakse aegrea varjatud perioodsuste otsimiseks.
-0.3
-0.2
-0.1
0
0.1
0.2
0.3
1 10 19 28 37 46 55 64 73 82 91 100
Korrelogramm
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 93 97
Sk
SilutudPeriodogramm ja spekter (maksimumid 12,5 ja 7,7 a.)
Spektraalanalüüs
• Periodogramm ehk spektraalse tiheduse graafik näitab, kui suure osa kogu varieeruvusest kirjeldavad erineva perioodiga kõikumised
• Perioodi pikkus ja võnkesagedus on pöördvõrdelised. Näiteks olgu aegrida 100 aastat, 1. harmoonik perioodiga 100 a. ja sagedusega 1, 2. harmoonik perioodiga 50 a, sagedus 2, 3. harmoonik 33,3 a., 4. harmoonik 25 a., 5. harmoonik 20 a., viimane harmoonik perioodiga 2 a.
Harmoonikud 1-7
Kesk-Inglismaa aasta keskmine õhutemperatuur
Aasta keskmine õhurõhk Baselis
Aasta sademete hulk Zwanenburgis
Ruumiline autokorrelatsiooni-funktsioon
• Näitab korrelatsiooni muutust jaamade-vahelise kauguse muutusega
• Eelduseks meteoroloogilise välja homogeensus ja isotroopsus
• Alguses leitakse jaamadevaheline korrelatsioonimaatriks
• Leitakse jaamadevaheliste kauguste maatriks• Keskmistatakse korrelatsioonikordajad
kaugusvahemike kaupa
Väli on homogeenne, kui korr. f. ei muutu, kui jaamadevaheline kaugus ja orientatsioon on sama.Väli on isotroopne, kui korr. f. ei muutu, kaugus on
sama aga orientatsioon muutub
Aasta sademete summa autokorrelatsioonifunktsioon
Aasta sademed
00.10.20.30.40.5
0.60.70.80.9
1
10 30 50 70 90 110
130
150
170
190
210
230
250
270
290
310
330
350
km
Sademetevälja autokorrelatsiooni-funktsioon Eestis erinevatel perioodidel
Sademetevälja autokorrelatsiooni-funktsioon Eestis erinevatel kuudel
Kuu sademete autokorrelatsiooni-funktsioonide aastane käik
Kodune töö
• Ühe kuu sademete autokorrelatsiooni-funktsiooni leidmine, näidisfail aasta.xls
• Jaamadevahelise korrelatsioonimaatriksi leidmine Tools/Data Analysis/Correlation
• Kopeerida näidisfailist jaamadevahelise kauguse maatriks töölehelt Kaugus.
• Kopeerida näidisfaili töölehelt Korr. funktsioon kogu sisu oma faili samale lehele. Kustutada ära väärtused väljadel b2:d14. Sinna tulevad hiljem uued korrelatsioonifunktsiooni väärtused.
Kodune töö
Leida iga kaugusvahemiku jaoks keskmise korrelatsioonikordaja väärtus, selle määramise juhtude arv ja standardhälve. Selleks tuleb väljal G2 tingimusliku funktsiooni valemisse panna vastava kaugusvahemiku alumine ja ülemine piir. Antud näites tuleks numbri 340 asemele kirjutada esimesel korral 0 ja 360 asemele 20. Kui valem on õigesti sisestatud, siis tuleks seda lohistada kogu maatriksi ulatuses. Tulemused ilmuvad automaatselt väljadele B21:d21. Need tuleb kopeerida (ainult väärtused) ülevalpool olevasse tabelisse vastava kaugusvahemiku järele. Siis korrata seda protseduuri, tuues väljal G2 valemisse uue kaugusvahemiku piirid.
Peakomponentanalüüs (Principal Component Analysis - PCA)
• On faktoranalüüsi üks modifikatsioon• Kasutatakse kliimanäitajate ajalis-ruumilise
varieeruvuse kirjeldamiseks, piirkondade klimaatiliseks liigendamiseks (rajoneerimiseks), klassifitseerimiseks
• Andmete varieeruvust kirjeldatakse väikse arvu komponentide abil, mis kirjeldavad ära suurema osa koguvarieeruvusest
Peakomponentanalüüs (Principal Component Analysis - PCA)
• Sisendmaatriks – hulk mõõtmiskohti (jaamad, postid, võrgustiku sõlmpunktid), mille kohta on mõõdetud väärtuste aegrida
• T-moodi PCA – tunnusteks on ajaühikud ja juhtudeks mõõtmiskohad
• S-moodi PCA – tunnusteks mõõtmiskohad ja juhtudeks ajaühikud
PCA väljund iga komponendi jaoks
• Omaväärtused – näitavad komponentide osa koguvarieeruvuses (dispersioonis)
• Laadungid – näitavad komponendi korrelatsiooni antud mõõtmiskoha väärtustega
• Skoorid – näitavad komponendi hälvet nullist vaadeldava ajaühiku korral
• Komponentide pööramine aitab tulemusi paremini interpreteerida (Kaiseri kriteerium)
• Varimax normalized
1. näide: Eesti rajoneerimine õhutemperatuuri alusel
• Algandmeteks kuu keskmised õhutemperatuurid 22 jaamas 1966-2000
• Kasutati lisaks PCA-le ka klasteranalüüsi• Kasutati pööramata komponente
Kasutatud ilmajaamad
Kuude temperatuuride dendrogramm
Talve temperatuuri 1. komponent
Mai temperatuuri 1. komponent
Mai temperatuuri 2. komponent
Temperatuuride 1. ja 2. komponendi hajuvusdiagramm
Kuude temperatuuride korrelatsioonid kahe esimese komponendiga
Eesti rajoneering õhutemperatuuri alusel
2. näide: Eesti lumikatte rajoneerimine lumikatte paksuse ja kestuse andmetel
• Algandmeteks kuue kuu (november-aprill) keskmised lume paksused (cm) ja lumikatte kestused päevades
• Aegrida 40 aastat – 1961/1962 – 2000/2001• Mõõtmisandmed on interpoleeritud 5x5 km
võrgustikku (1734 punkti), millest on tegelikult kasutatud iga neljandat punkti (433 punkti)
• Komponendid on pööratud
Lume paksuse 1. komponent
Lume paksuse 2. komponent
Lume paksuse 3. komponent
Valdkonnad lumikatte paksuse järgi
0.366 0.304 0.226
Lume paksuse kolme esimese komponendi aegread ja trendid
-3
-2
-1
0
1
2
3
4
5
6
1962 1967 1972 1977 1982 1987 1992 1997
Lumikatte kestuse 1. komponent
Lumikatte kestuse 2. komponent
Valdkonnad lumikatte paksuse järgi
Lumikatte kestuse kahe esimese komponendi skooride aegread ja
lineaarsed trendid
3. näide: Euroopa sademete rajoneering
• Algandmed East Anglia Ülikooli kliimauurimise keskuse (CRU) globaalsest andmebaasist
• Periood 1900-1996, kahe tihedusega võrgustikku interpoleeritud sademete kuusummad
• Hõredam võrgustik 5x5 kraadi, 88 sõlmpunkti• Tihedam võrgustik 2,5x3,75 kraadi, 212 punkti• Kasutati pööramata S-moodi PCA-d järjestikuste
kuu- ja sesoonisademete jaoks
5x5 kraadi võrgustik, 88 punkti
2,5x3,75 kraadi võrgustik, 212 punkti
Sesoonisademete 1. komponent
Kuusademete 2. komponent
Kuusademete 3. komponent
Sesoonisademete 4. komponent
Kuusademete rajoneering 5x5 kraadi võrgustiku alusel
Kuusademete rajoneering 2,5x3,75 kraadi võrgustiku alusel
4. näide: Baltimaade sademete rajoneering
• Algandmed: kuu sademed 120 Eesti, Läti ja Leedu ilmajaamas perioodil 1966-2005
• S-moodi PCA koos komponentide pööramisega
A hja
H elterm aaJõgeva
Jõhvi
K asari
K eila
K ihnu
K oodu
K unda
K uusiku
K ääpa
Lüganuse
M assum õisa
M auri
M ehikoorm a
N arva
N igula
O andu
O reküla
P akri
P ärnuP raaga
R annu-Jõesuu
R istna R ohuküla
R uhnu
R äpina
S õrve
S äm i
Tahkuse
Tallinn
Tartu
T iiriko ja
Tõllis te
Toom a
Tõravere
Tõrva
Tõrve
Tudu
Tudulinna
Türi
U ue-Lõve
V alga
V anaküla
V asknarva
V ihterpalu
V iljandiV ilsandi
V irtsu
V äike-M aarja
V õruA inaþi
A lûksne
A tas iene
B auska
C arn ikava
D augavpils
D obele
G ulbene
K olka
K râslava
K uldîga
Liepâja
M ersrags
N ereta
P âvilosta
P iedruja
P lavinas
P ravin i
P rieku li
R îga-LU
R oja
R ûjiena
S aldus
S igulda
S îli
S krîveri
S kulteS tende
V alm iera
V ârdava
V entsp ils
Z îlâni
Zoseni
B irzai
D otnuva
K aunas
K ybarta i
K la ipeda
Laukuva
Lazdija i
N ida
P anevezys
R asein ia i
S iau lia i
S ilu te
Tels ia i
U km erge
U tena
V arena
V iln ius
A km ene (N )
A ly tus
A nyksc ia i
B irs tonas
D rusk in inka i
Jonava
K artenaK retinga
M azeik ia i
P abrade
P apile
P uvocia i
R okisk is
S kuodas
S vencionys Taurage
Tauragnai
T rakai
V ente
1. komponent 2. komponent
3. komponent 4. komponent
Sademete regioonid Baltimaades
Kodune ülesanne – koostada kuu sademete rajoneering Eesti jaoks kasutades PCA-d
• Sademete andmemaatriksi transponeerimine EXCELis (copy/paste special/transpose)
• Sademete andmemaatriksi sisestamine programmi STATISTICA (Open, EXCEL files, esimene rida ja veerg lugeda nimedeks)
• Statistics/Multivariate Exploratory Techniques/ Factor Analysis
• Variables/Select all• Maximum number of factors – 10
Kodune ülesanne – koostada kuu sademete rajoneering Eesti jaoks kasutades PCA-d
Teostada pööramine: Factor rotation/Varimax normalized
• Avada laadungite tööleht: Summary Factor Loadings, kopeerida see EXCELi töölehele
• Iga jaama kohta teha kindlaks suurim laadung• Koostada Surferis kaart, kus eri valdkonnad on
toodud erineva värviga• Vaadata skooride aegridu ja teostada trendi
analüüs
Recommended