38
GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja Alfred Stach Instytut Paleogeografii i Geoekologii Wydział Nauk Geograficznych i Geologicznych UAM

GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

  • Upload
    cathy

  • View
    162

  • Download
    0

Embed Size (px)

DESCRIPTION

GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja. Alfred Stach Instytut Paleogeografii i Geoekologii Wydział Nauk Geograficznych i Geologicznych UAM. Analiza struktury przestrzennej dwóch zmiennych. z i ( u  + h ). „głowa” head. „ogon” tail. h. - PowerPoint PPT Presentation

Citation preview

Page 1: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

GEOSTATYSTYKAWykład dla III roku Geografii

specjalność - geoinformacja

Alfred StachInstytut Paleogeografii i Geoekologii

Wydział Nauk Geograficznych i Geologicznych UAM

Page 2: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Analiza struktury przestrzennej dwóch zmiennych

zi(u)

zi(u+h)

„ogon”tail

„głowa”head

h

Wartość cechy w punktach u i u + h dotyczy jednej zmiennej zi.

zi(u)

zj(u+h)

„ogon”tail

„głowa”head

h

Wartość cechy w punktach u i u + h dotyczy dwóch zmiennych zi i zj.

Page 3: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Wykresy rozrzutu dwóch zmiennych z przesunięciem (cross h-scattergram)

Dane z punktów odległych od siebie o 0-22,5mŚrednia odległość 17,645m

Ilość par punktów: 74kowariancja: 62,033korelacja: 0,5063

Dane cech b1_03b i b3n_03b ze zbioru Horbye3.dat

280 300 320 340 360 380 400220

240

260

280

300

320

b1_03b (x)

b3

n_

03

b (

x+h

)

Page 4: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Wykresy rozrzutu dwóch zmiennych z przesunięciem (cross h-scattergram)

Dane z punktów odległych od siebie o 22,5-67,5mŚrednia odległość 51,381m

Ilość par punktów: 640kowariancja: 63,051korelacja: 0,4165

Dane cech b1_03b i b3n_03b ze zbioru Horbye3.dat

280 300 320 340 360 380 400220

240

260

280

300

320

b1_03b (x)

b3

n_

03

b (

x+h

)

Page 5: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Wykresy rozrzutu dwóch zmiennych z przesunięciem (cross h-scattergram)

Dane z punktów odległych od siebie o 67,5-112,5mŚrednia odległość 92,41m

Ilość par punktów: 1048kowariancja: 49,056korelacja: 0,29181

Dane cech b1_03b i b3n_03b ze zbioru Horbye3.dat

280 300 320 340 360 380 400220

240

260

280

300

320

b1_03b (x)

b3

n_

03

b (

x+h

)

Page 6: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Wykresy rozrzutu dwóch zmiennych z przesunięciem (cross h-scattergram)

Dane z punktów odległych od siebie o 112,5-157,5mŚrednia odległość 136,27m

Ilość par punktów: 1472kowariancja: 36,042korelacja: 0,2139

Dane cech b1_03b i b3n_03b ze zbioru Horbye3.dat

280 300 320 340 360 380 400220

240

260

280

300

320

b1_03b (x)

b3

n_

03

b (

x+h

)

Page 7: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Wykresy rozrzutu dwóch zmiennych z przesunięciem (cross h-scattergram)

Dane z punktów odległych od siebie o 157,5-202.5mŚrednia odległość 181,33m

Ilość par punktów: 1930kowariancja: 21,321korelacja: 0,1293

Dane cech b1_03b i b3n_03b ze zbioru Horbye3.dat

280 300 320 340 360 380 400220

240

260

280

300

320

b1_03b (x)

b3

n_

03

b (

x+h

)

Page 8: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Wykresy rozrzutu dwóch zmiennych z przesunięciem (cross h-scattergram)

h (m) – ij0 – 0,80717,6 – 0,50651,4 – 0,41692,4 – 0,292136,3 – 0,214181,3 – 0,129

280 300 320 340 360 380 400220

240

260

280

300

320

b1_03b (x)

b3

n_

03

b (

x+h

)

280 300 320 340 360 380 400220

240

260

280

300

320

b1_03b (x)

b3

n_

03

b (

x+h

)

280 300 320 340 360 380 400220

240

260

280

300

320

b1_03b (x)

b3

n_

03

b (

x+h

)

280 300 320 340 360 380 400220

240

260

280

300

320

b1_03b (x)

b3

n_

03

b (

x+h

)

280 300 320 340 360 380 400220

240

260

280

300

320

b1_03b (x)

b3

n_

03

b (

x+h

)

Page 9: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Funkcja kros kowariancji

( )

1

1( ) ( ) ( )

( )

N

ij i j i jC z z m mN

h

-h +hh u u h

h

( )

1

1( )

( )

N

i im zN

h

-hu

h

( )

1

1( )

( )

N

j jm zN

h

+hu h

h

Kowariancja między wartościami cech zi i zj odległymi o wektor h jest obliczona według wzoru:

gdzie:N(h) to ilość par punktów odległych o wektor h, a

mi-h i mj+h

to średnie

wartości zi „ogona”, i wartości zj „głowy”.

Page 10: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Powierzchnia kros kowariancji zmiennych b1_03b i b3n_03b

-400 -300 -200 -100 0 100 200 300 400

X (W – E) - m

-400

-300

-200

-100

0

100

200

300

400Y

(S

– N

) -

m

-60

-40

-20

0

20

40

60

80

100

120

Page 11: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Funkcja kros kowariancji zmiennych b1_03b i b3n_03b

0 100 200 300 400 500 600Odstęp - h (m )

-40

-20

0

20

40

60

80

100

Kro

s k

ow

ari

an

cja

– C

ij(h

)

K roskowariancjekierunkowe

bezkierunkow a

45°

90°

320°

Uporządkowany zbiór kroskowariancji Cij(h1),

Cij (h2), … jest zwany eksperymentalną funkcją

kros kowariancji

Page 12: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Kros korelogram

2 2

( )( ) [ 1, 1]ij

ij

i j

C

-h +h

hh

2( )

2

1- -

1

( )

N

i i iz mN

h

h hu

h

2( )

2

1+ +

1

( )

N

j j jz mN

h

h hu h

h

Wariancja wartości „ogona” (zi)

Wariancja wartości „głowy” (zj)

Page 13: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Powierzchnia kros korelogramu zmiennych b1_03b i b3n_03b

-400 -300 -200 -100 0 100 200 300 400

X (W – E) - m

-400

-300

-200

-100

0

100

200

300

400

Y (

S –

N)

- m

-0.4

-0.2

0

0.2

0.4

0.6

Page 14: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Kros korelogramy zmiennych b1_03bi b3n_03b

0 100 200 300 400 500 600Odstęp - h (m)

0

0.2

0.4

0.6

0.8

Kro

s k

ow

aria

ncj

a –

ij(h

)

K ros kore logram ykierunkowe

bezkierunkow y

45°

90°

320°

ij=0,910h=20,7mN=7

Page 15: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Efekt przesunięcia (lag effect)

• Kros kowariancja obliczana w przeciwnych kierunkach jest zazwyczaj odmienna: Cij(h) Cij(-h)

• Znacząca różnica pomiędzy Cij(h) i Cij(-h) może oznaczać, że jedna wartość jednej cechy zmienia się w przestrzeni z pewnym opóźnieniem w stosunku do zmian drugiej cechy. Zjawisko to nazywane jest efektem przesunięcia.

• Jeśli brak jest klarownej fizycznej interpretacji tego zjawiska, lepiej je zignorować, gdyż może być skutkiem przypadkowej fluktuacji związanej z małą ilością par danych z których wyliczono kowariancję.

Page 16: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Efekt przesunięcia - przykładBadamy skażenie gleb wokół zakładu przemysłowego. Jest ono związane z emisjami gazów i pyłów z komina zakładu. Składnik A zanieczyszczeń związany jest z emisjami pyłowymi, a składnik B – gazowymi. Składnik A będzie zatem „wypadał” z chmury zanieczyszczeń szybciej niż składnik B. Zmiany przestrzenne obu składników będą miały podobną strukturę przestrzenną (bo są efektem tego samego zjawiska), ale z przesunięciem.

Page 17: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Czy nasze zmienne b1_03b i b3n_03b wykazują efekt przesunięcia?

0 100 200 300 400 500 600Odstęp - h (m)

-20

0

20

40

60

80

100

Kro

s k

ow

ari

an

cja

– C

ij(h

)

Kros kowariancjeC ij(h ) i C ij(-h )

140°

320°

Page 18: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Rozrzut gradientów zmian par punktów dwóch zmiennych• Kros kowariancja (kros korelacja) określa jak wygląda

relacja wartości cechy zi w jednej lokalizacji w stosunku do wartości innej cechy zj w lokalizacji odległej o wektor h.

• Zamiast porównywać parę danych (zi(u), zj(u+h)) możemy rozważyć porównanie pary przyrostów na dystansie h ([zi(u), zi(u+h)], [zj(u), zj(u+h)]), które pokazują wspólną zmianę gradientów wartości zi- i zj- przy zmianie położenia o wektor h.

• Jeśli obie cechy są skorelowane dodatnio, to przyrost (spadek) wartości zi- od punktu u do punktu u+h będzie związany ze wzrostem (spadkiem) wartości zj-.

• A jeśli obie cechy są skorelowane ujemnie, to ….

Page 19: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Różnice wartości par punktów dwóch cech (h-increments)

zi(u)

zi(u+h)

„ogon”tail

„głowa”head

h

zj(u)

zj(u+h)

„ogon”tail

„głowa”head

h

Analiza wspólnej zmienności cech zi i zj przy przemieszczeniu o dystans h

Page 20: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Wykresy rozrzutu z przesunięciem dla różnic (h-increments scatergrams)

-60 -40 -20 0 20 40 60

b1_03b (u) - b1_03b (u + h )

-60

-40

-20

0

20

40

60

b3n_

03b(

u

) -

b3n_

03b(

u

+ h

)

-60 -40 -20 0 20 40 60

b1_03b (u) - b1_03b (u + h )

-60

-40

-20

0

20

40

60

b3n_

03b(

u

) -

b3n_

03b(

u

+ h

)

Cechy b1_03b i b3n_3b. Kierunek = 130°; tolerancja kierunku = 22,5°; szerokość pasa tolerancji = 100 m; odstęp = 45 m; tolerancja odstępu = 22,5 m

h = 50,8 mh = 21,8 m

Page 21: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Wykresy rozrzutu z przesunięciem dla różnic (h-increments scatergrams)

-60 -40 -20 0 20 40 60

b1_03b (u) - b1_03b (u + h )

-60

-40

-20

0

20

40

60

b3n_

03b(

u

) -

b3n_

03b(

u

+ h

)

Cechy b1_03b i b3n_3b. Kierunek = 130°; tolerancja kierunku = 22,5°; szerokość pasa tolerancji = 100 m; odstęp = 45 m; tolerancja odstępu = 22,5 m

h = 134,4 mh = 90,7 m

-60 -40 -20 0 20 40 60

b1_03b (u) - b1_03b (u + h )

-60

-40

-20

0

20

40

60

b3n_

03b(

u

) -

b3n_

03b(

u

+ h

)

Page 22: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

-60 -40 -20 0 20 40 60

b1_03b (u) - b1_03b (u + h )

-60

-40

-20

0

20

40

60

b3n_

03b(

u

) -

b3n_

03b(

u

+ h

)

Wykresy rozrzutu z przesunięciem dla różnic (h-increments scatergrams)

-60 -40 -20 0 20 40 60

b1_03b (u) - b1_03b (u + h )

-60

-40

-20

0

20

40

60

b3n_

03b(

u

) -

b3n_

03b(

u

+ h

)

Cechy b1_03b i b3n_3b. Kierunek = 130°; tolerancja kierunku = 22,5°; szerokość pasa tolerancji = 100 m; odstęp = 45 m; tolerancja odstępu = 22,5 m

h = 226,0 mh = 181,0 m

Page 23: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Kros semiwariogram

( )

1

1( ) ( ) ( ) ( ) ( )

2 ( )

N

ij i i j jz z z zN

h

h u u h u u hh

Kros semiwariogram jest definiowany jako „połowa nie scentralizowanej kowariancji pomiędzy różnicami na dystansie h”.W przeciwieństwie do kros kowariancji i kros korelogramu kros semiwariogram jest symetryczny w stosunku do cech i wektora przesunięcia to jest zamiana ij na ji, oraz (h) na (-h) nie wpływa na jego wartość. Kros semiwariogram nie może zatem pomagać w wykrywaniu efektu „przesunięcia”.Poza tym kros semiwariogram może być obliczany jedynie dla takich lokalizacji, w których zmierzono obie cechy.

Page 24: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Powierzchnia kros semiwariancji zmiennych b1_03b i b3n_03b

-400 -300 -200 -100 0 100 200 300 400

X (W – E) - m

-400

-300

-200

-100

0

100

200

300

400

Y (

S –

N)

- m

20

60

100

140

180

220

260

300

Page 25: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Kros semiwariogram zmiennych b1_03b i b3n_03b

0 100 200 300 400 500 600Odstęp - h (m)

0

40

80

120

160

200

Kro

s k

ow

ari

an

cja

ij(h

)

K ros sem iwariogram ykierunkowe

bezkierunkow y

45°

90°

320°

Page 26: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Funkcja kodyspersji

( )( ) 1, 1

( ) ( )ij

ij

ii jj

hh

h h

Uporządkowany zbiór współczynników kodyspersji ij(h1), ij(h2), ... jest zwany eksperymentalną funkcją kodyspersji.Współczynnik kodyspersji można interpretować jako współczynnik korelacji pomiędzy zmianami cech na dystansie h, kiedy wykres rozrzutu rysowany jest w postaci symetrycznej, tj. każda para lokalizacji (u, u+h) pojawia się dwukrotnie, raz jako punkt o współrzędnych ([zi(u), zi(u+h)], [zj(u), zj(u+h)]), a drugi raz jako punkt ([zi(u+h), zi(u)], [zj(u+h), zj(u)]).

Page 27: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Funkcja kodyspersji cechb1_03b i b3n_03b

0 100 200 300 400 500 600

Odstęp - h (m)

0.2

0.4

0.6

0.8

Ko

dy

sp

ers

ja

Page 28: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Funkcja kros kowariancji kodówTak samo jak w przypadku analizy struktury przestrzennej

jednej zmiennej, charakter i siła relacji między dwoma zmiennymi może zależeć o skali natężenia porównywanych cech: niskiej, średniej, czy wysokiej.

Często wysokie wartości skorelowanych przestrzennie cech będące efektem tego samego zjawiska mogą wykazywać większe podobieństwo niż średnie i niskie, mające odmienną genezę.

Przykładem może być zawartość toksycznych metali ciężkich w glebach. Ich niskie lub średnie stężenia mają najczęściej genezę naturalną, związaną z procesami wietrzeniowymi skał macierzystych. Wysokie koncentracje natomiast są zazwyczaj związane z antropogenicznymi emisjami.

Page 29: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Funkcja kros kowariancji kodów

( )

' '1

'

' '

1( ; , ) ; ;

( )

( ) ( )

( ; , ) ( ) ( )

NIij i k j k i k j k

i i k j j k

ij i k j k i i k j j k

C z z i z i zN

F z F z

F z z F z F z

h

-h +h

-h +h

h u u hh

h

Gdzie: Fi-h(zik) i Fj+h

(zjk') to proporcje wartości ogona zi i głowy

zj, które nie przekraczają poziomów progowych zik i zjk'.

Kros kowariancja jest miarą wspólnej dwu-punktowej

skumulowaną frekwencji Fij(h;zik, zjk'), określającej jak często

wartości zi i zj oddalone o wektor h są jednocześnie nie większe

od określonych wartości progowych (zik, zjk').

Page 30: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Kros korelogram kodów

'

'2 2

'

; ,( ; , )

Iij i k j kI

ij i k j k

i i k i j k

C z zz z

z z

-h +h

hh

Standaryzowaną postacią kros kowariancji kodów jest kros korelogram kodów:

Gdzie wariancja wartości kodów ogona i(u;zik) jest równa:

2 ( )i ikz-h

- -

1i ik i ikF z F z h h

Page 31: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Kros semiwariogram kodów

( )

'1

' '

1; , ; ;

2 ( )

; ;

N hIij i k j k i k i k

j k j k

z z i u z i u h zN h

i u z i u h z

h

Niezerowy udział w kros semiwariogramie kodów mają jedynie te pary danych, w których wartości obu cech zi, i zj są po przeciwnych stronach ich wartości progowych (zik, zjk').

Udział pary danych w może być pozytywny (+1) lub negatywny (-1), w zależności od tego czy wartości zi i zj wspólnie rosną (maleją) przy przejściu od u do u + h, lub też zmieniają się w sposób przeciwny.

'; ,Iij i k j kz z h

Page 32: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Strukturę przestrzenną danych kodowanych dwóch cech badać można także w innych przypadkach:

• i(u;zk) i i(u;zk') mogą dotyczyć tej samej ciągłej (ilościowej) cechy z, ale dla dwóch różnych wartości progowych zk i zk'

• i(u;sk) i i(u;sk') odnoszących się do dwóch różnych kategorii sk i sk'

• i(u;zk) i i(u;sk) odnoszących się cechy ilościowej i jakościowej (kategorii)

Page 33: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Standaryzowane kros semiwariogramy bezkierunkowe kodów b1_03b i b3n_03b

0 100 200 300 400 500 600Odstęp - h (m)

0

0.2

0.4

0.6

Kro

s s

emiw

ario

gra

m –

ij(h

)

Kros semiwariogramy kodów10 percentyl

25 percentyl

50 percentyl

75 percentyl

90 percentyl

Page 34: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Efekt proporcjonalności: relacja między lokalną średnią, a lokalną wariancją

Próbka preferencyjna, zmienna b1_03b

Próbka preferencyjna, zmienna b3n_03b

300 310 320 330 340 350 360Lokalna średnia

0

100

200

300

400

Lo

kaln

a w

ari

an

cja

250 260 270 280 290 300Lokalna średnia

0

200

400

600

Lo

kaln

a w

ari

an

cja

Page 35: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Semiwariogramy względne 1

ˆˆ

ˆGR f m

hh

h

1

2 2

N m mm z z

N

hh hh u u h

h

Ogólny semiwariogram względny skaluje wartości semiwariogramu za pomocą funkcji średniej odstępu h

Średnia wszystkich wartości danych dla odstępu h, czyli średnia ze średnich dla danych ogona i głowy.

Funkcję f można określić na podstawie wykresu rozrzutu lokalnych średnich w stosunku do lokalnych wariancji.

Dla rozkładów prawoskośnych funkcję tę zazwyczaj przyjmuje się jak kwadrat średniej odstępu: 2

m̂ h

Page 36: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Semiwariogramy względne 2

2

21

2

2

N

PR

z z

N z z

h u u h

hh u u h

Porównawczy semiwariogram względny skaluje wartości semiwariogramu dla każdej różnicy w parze za pomocą podniesionej do kwadratu średniej wartości ogona i głowy.

Miara ta bezpośrednio redukuje wpływ poszczególnych wysokich wartości danych w obliczeniach semiwariogramu.

Ze względu na matematyczny charakter (ułamki) zastosowanie semiwariogramów względnych jest ograniczone do danych o wartościach dodatnich

Page 37: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

0 100 200 300 400 500 600Odstęp - h (m )

0

50

100

150

200

250

Se

miw

ari

an

cja

(h)

Sem iwariogram ykierunkowe – 50°

populacja

próbka losow a

próbkapreferencyjna

0 100 200 300 400 500 600Odstęp - h (m )

0

50

100

150

200

Se

miw

ari

an

cja

(h)

Sem iwariogram ykierunkowe – 320°

populacja

próbka losow a

próbkapreferencyjna

Wpływ preferencyjnego próbkowania na semiwariogram empiryczny b1_03b

Page 38: GEOSTATYSTYKA Wykład dla III roku Geografii specjalność - geoinformacja

Wpływ preferencyjnego próbkowania na semiwariogram empiryczny b1_03b

0 100 200 300 400 500 600Odstęp - h (m )

0

40

80

120

160

Se

miw

ari

an

cja

(h)

Sem iwariogram ykierunkowe – 320°

populacja

próbka losow a

próbkapreferencyjna – G R

próbkapreferencyjna – PR

0

0.001

0.002

0.003

0 100 200 300 400 500 600Odstęp - h (m )

0

50

100

150

Se

miw

ari

an

cja

(h)

Sem iwariogram ykierunkowe – 50°

populacja

próbka losow a

próbkapreferencyjna – G R

próbkapreferencyjna – PR

0

0.001

0.002

0.003

0.004