27
GEOSTATYSTYKA Wykłady dla III roku Geografii specjalność – geoinformacja Estymacja na podstawie danych jednej zmiennej I Alfred Stach Instytut Paleogeografii i Geoekologii Wydział Nauk Geograficznych i Geologicznych UAM

Alfred Stach Instytut Paleogeografii i Geoekologii

  • Upload
    neo

  • View
    51

  • Download
    0

Embed Size (px)

DESCRIPTION

GEOSTATYSTYKA Wykłady dla III roku Geografii specjalność – geoinformacja Estymacja na podstawie danych jednej zmiennej I. Alfred Stach Instytut Paleogeografii i Geoekologii Wydział Nauk Geograficznych i Geologicznych UAM. Podstawy krigingu. Problem : - PowerPoint PPT Presentation

Citation preview

Page 1: Alfred Stach Instytut Paleogeografii i Geoekologii

GEOSTATYSTYKAWykłady dla III roku Geografiispecjalność – geoinformacja

Estymacja na podstawie danych

jednej zmiennej I

Alfred StachInstytut Paleogeografii i Geoekologii

Wydział Nauk Geograficznych i Geologicznych UAM

Page 2: Alfred Stach Instytut Paleogeografii i Geoekologii

Podstawy krigingu

Problem:Estymacja wartości ciągłej cechy z w dowolnej lokalizacji u z wykorzystaniem jedynie istniejących n danych z na obszarze badań A : {z(u), =1, ...., n}

Rozwiązanie:Kriging to nazwa własna grupy algorytmów opartych na uogólnionej regresji metodą najmniejszych kwadratów, przyjęta przez geostatystyków dla uhonorowania pionierskich prac południowoafrykańskiego geologa Danie Krige (1951)

Page 3: Alfred Stach Instytut Paleogeografii i Geoekologii

Podstawy krigingu

• Wszystkie estymatory krigingowe są wariantami podstawowej formuły regresji liniowej zgodnie z poniższym wzorem:

*

1

n

Z m Z m

u

u u u u u

gdzie: (u) jest wagą przypisaną do danej z(u), która jest interpretowana jako realizacja Zmiennej Losowej Z(u).Wartości m(u) i m(u) to oczekiwane wartości ZL Z(u) i Z(u).

Page 4: Alfred Stach Instytut Paleogeografii i Geoekologii

Podstawy krigingu

Ilość danych używanych do estymacji oraz ich wagi mogą się zmieniać przy kolejnych lokalizacjach. W praktyce używane jest jedynie n(u) danych leżących najbliżej lokalizacji punktu estymacji, to jest dane znajdujące się w określonym sąsiedztwie/oknie W(u) mający swoje centrum w u.

Interpretacja nieznanej wartości z(u) i wartosci danych z(u) jako realizacji ZL Z(u) i Z(u) pozwala na zdefiniowanie błędu estymacji jako zmiennej losowej Z*(u) – Z(u). Wszystkie zalety krigingu wynikają z tego samego założenia minimalizacji wariancji (błędu) estymacji przy respektowaniu warunku nieobciążenia estymatora, czyli:

2E u

Page 5: Alfred Stach Instytut Paleogeografii i Geoekologii

Podstawy krigingu

2 VarE Z Z u u u

jest minimalizowany przy uwzględnieniu ograniczenia, że:

E 0Z Z u u

Estymacja za pomocą krigingu może się różnić ze względu na przyjęty model Funkcji Losowej Z(u). Przyjmuje się zazwyczaj, że FL Z(u) można rozłożyć na dwa komponenty: trend m(u) i resztę R(u):

( ) ( ) ( )Z R m u u u

Page 6: Alfred Stach Instytut Paleogeografii i Geoekologii

Podstawy krigingu

Składowa resztowa jest modelowana jako stacjonarna FL o średniej równej zero i kowariancji CR(h):

E 0

, E R

R

R R R R C

u

Cov u u h u u h h

Oczekiwana wartość ZL Z w lokalizacji u jest zatem równa wartości składowej trendu w tej lokalizacji:

E Z mu u

Page 7: Alfred Stach Instytut Paleogeografii i Geoekologii

Podstawy kriginguW zależności od przyjętego modelu trendu m(u) możemy wyróżnić trzy warianty krigingu:

1. Prosty kriging (Simple Kriging) zakłada że średnia m(u) jest znana i stała na całym analizowanym obszarze A :

, znane m m u u A

2. Zwykły kriging (Ordinary Kriging) uwzględnia lokalne fluktuacje średniej, ograniczając domenę stacjonarności średniej do lokalnego sąsiedztwa (ruchomego okna) W(u):

stała lecz nieznana m W u u uw przeciwieństwie do SK w tym przypadku średnia jest traktowana jako nieznana.

Page 8: Alfred Stach Instytut Paleogeografii i Geoekologii

Czy lokalna średnia jest w przypadku danych satelitarnych ze Spitsbergenu stała?

310 320 330 340 350Lokalna średnia

0

400

800

1200

Loka

lna

war

ianc

ja

Próbka losowa, zmienna b1_03b

250 260 270 280 290 300Lokalna średnia

0

400

800

1200

Loka

lna

wa

rian

cja

Próbka losowa, zmienna b3n_03b

Page 9: Alfred Stach Instytut Paleogeografii i Geoekologii

Podstawy krigingu3. Kriging z trendem (Kriging with a Trend model) zakłada że nieznana lokalna średnia m(u´) zmienia się stopniowo wewnątrz każdego lokalnego sąsiedztwa (okna) W(u), a zatem również w całym obszarze A . Składowa trendu jest modelowana jako liniowa funkcja współrzędnych fk(u):

0

z stały lecz nieznany

K

k kk

k k

m a f

a a W

u u u

u u u

Współczynniki ak(u´) są nieznane, lecz zakłada się, że są one stałe w obrębie każdego lokalnego sąsiedztwa W(u). Przyjęto, że f0(u´) = 1, tak więc przypadek gdzie K = 0 jest odpowiednikiem zwykłego krigingu (stała lecz nieznana średnia a0).

Page 10: Alfred Stach Instytut Paleogeografii i Geoekologii

Prosty kriging (SK)Modelowanie składowej trendu (-owej) m(u) jako znanej stacjonarnej średniej m pozwala na zapisanie formuły estymatora jako liniowej kombinacji (n(u)+1) danych: n(u) ZL Z(u) i wartości średniej m:

( )

1

( ) ( )

1 1

1

nSK

SK

n nSK SK

Z Z m m

Z m

u

u u

u u u

u u u

n(u) wag jest w taki sposób wyznaczane, aby zminimalizować wariancję błędów uwzględnia-jąc kryterium nieobciążenia estymatora.

2 *VarE SKZ Z u u u

Page 11: Alfred Stach Instytut Paleogeografii i Geoekologii

Prosty kriging

Estymator prostego krigingu (SK) jest z góry nieobciążony ponieważ średni błąd jest równy 0. Używając pierwszej formy zapisu estymatora SK możemy stwierdzić, że:

* ( ) ( ) 0SKE Z u Z u m m

Estymacja metodą prostego krigingu wykonywana jest za pomocą układu n(u) równań liniowych znanych pod nazwą układu zwykłych równań, które można zapisać używając kowariancji zmiennej z w postaci:

( )

1

( ) ( ) ( ) 1,...., ( )n

SK C C n

u

u u u u u u

Page 12: Alfred Stach Instytut Paleogeografii i Geoekologii

Prosty kriging

Wariancja błędu – wariancja SK:( )

2

1

( ) (0) ( ) ( )n

SKSK C C

u

u u u u

Prosty kriging – notacja macierzowa

Układ równań SK można również zapisać w postaci macierzowej:

( )SK SK SKK λ u k

Gdzie KSK jest macierzą kowariancji danych o wymiarach n(u) n(u), SK jest wektorem wag SK, a kSK jest wektorem kowariancji dane-do-nieznanej

Page 13: Alfred Stach Instytut Paleogeografii i Geoekologii

Prosty kriging – notacja macierzowa

1 1 1 ( )

( ) 1 ( ) ( )

( ) ..... ( )

..... ..... .....

( ) ..... ( )

n

SK

n n n

C C

C C

u

u u u

u u u u

K

u u u u

1 ( )

( ) .....

( )

SK

SKSKn

u

λ u

u

1

( )

( )

.....

( )SK

n

C

C

u

u u

k

u u

Page 14: Alfred Stach Instytut Paleogeografii i Geoekologii

Prosty kriging – notacja macierzowa

Wagi krigingowe wymagane do estymacji SK są obliczane przez mnożenie odwrotności macierzy kowariancji danych przez wektor kowariancji dane-do-nieznanej:

1( )SK SK SK λ u K k

Odpowiedni zapis macierzowy wariancji krigingowej SK jest następujący:

2 1( ) (0) ( ) (0)T TSK SK SK SK SK SKC C u λ u k k K k

Page 15: Alfred Stach Instytut Paleogeografii i Geoekologii

Prosty krigingSystem równań SK ma jednoznaczne rozwiązanie i wynikowa wariancja krigingowa jest dodatnia, jeżeli macierz kowariancji KSK = [C(u - u)] jest pozytywnie określona, czyli w praktyce:

• żadna para danych nie ma takiej samej lokalizacji: u u dla • zastosowano dopuszczalny model kowariancji C(h) Podstawowe cechy estymatora SK• Jest to estymator wierny – to znaczy, że wartość estymowana w lokalizacji punktu danych jest jemu równa,• Jeśli lokalizacja estymacji znajduje się poza zasięgiem autokorelacji w stosunku najbliższego punktu danych wartość estymowana jest równa stacjonarnej średniej m

Page 16: Alfred Stach Instytut Paleogeografii i Geoekologii

Prosty kriging – przykłady

Korzystając z relacji: C(h) = C(0) - (h)

Estymacja cechy w punkcie 0 za pomocą danych pomiarowych z punktów 1,2 i 3.

Page 17: Alfred Stach Instytut Paleogeografii i Geoekologii

Prosty kriging – przykładyProsty kriging dla modelu z zerowym efektem nuggetowym i izotropowym wariogramem sferycznym o trzech różnych zasięgach.

Zasięg Waga

1 2 3

1 0,781 0,012 0,065

5 0,648 -0,027 0,001

10 0,000 0,000 0,000

Page 18: Alfred Stach Instytut Paleogeografii i Geoekologii

Prosty kriging – przykładyProsty kriging dla modelu z izotropowym wariogramem sferycznym o zasięgu 10 jednostek odległości i trzech różnych względnych udziałach wariancji nuggetowej

Nugget= Waga

1 2 3

0% 0,781 0,012 0,065

25% 0,468 0,203 0,064

75% 0,172 0,130 0,053

100% 0,000 0,000 0,000

Page 19: Alfred Stach Instytut Paleogeografii i Geoekologii

Prosty kriging – przykładyProsty kriging dla sferycznego modelu z 25% nuggetem i zasięgiem głównej osi wynoszącym 10 jednostek odległości w przypadku trzech różnych stosunków anizotropii

Anizo- tropia=

Waga

1 2 3

1:1 0,468 0,203 0,064

2:1 0,395 0,087 0,141

5:1 0,152 -0,055 0,232

20:1 0,000 0,000 0,239

Page 20: Alfred Stach Instytut Paleogeografii i Geoekologii

Prosty przykład estymacji SK

Dane jednowymiarowe:profil 7 punktów b1_03bprzy Y = 240 m

0 500 1000 1500Odległość W-E (m)

280

300

320

340

360

War

tość

ce

chy

b1

_03b

0 100 200 300 400 500 600Odstęp - h (m)

0

40

80

120

160

Se

miw

ari

an

cja

– (h

)

Semiwariogramybezkierunkowe

m odel

em piryczny

G am m a(h) = 18 + 78Sph (95) + 82Sph (628)

Izotropowy model semiwariancji obliczony

dla wszystkich 256 danych

Page 21: Alfred Stach Instytut Paleogeografii i Geoekologii

Prosty przykład estymacji SK

0 500 1000 1500Odległość W-E (m)

280

300

320

340

360

Wa

rto

ść c

ech

y b

1_0

3b

Legenda:pom iaryrzeczyw isty profilg lobalna średniaestym acja SKwaga średnie j

0

0.2

0.4

0.6

0.8

1

Dane jednowymiarowe: profil dla Y = 240 m

0 500 1000 1500Odległość W-E (m)

280

300

320

340

360

War

toś

ć c

ech

y b

1_0

3b

Legenda:pom iaryrzeczyw isty profilg lobalna średniaestym acja SKwaga średnie j

0 500 1000 1500Odległość W-E (m)

280

300

320

340

360

War

toś

ć c

ec

hy

b1

_03b

Legenda:pom iaryrzeczyw isty profilg lobalna średniaestym acja SKwaga średnie j

0 500 1000 1500Odległość W-E (m)

280

300

320

340

360

Wa

rto

ść c

ech

y b

1_0

3b

Legenda:pom iaryrzeczyw isty profilg lobalna średniaestym acja SKwaga średnie j

0

0.2

0.4

0.6

0.8

1

Page 22: Alfred Stach Instytut Paleogeografii i Geoekologii

Prosty kriging – zmienna b1_03b

Page 23: Alfred Stach Instytut Paleogeografii i Geoekologii

Prosty kriging – zmienna b1_03b

-60 -40 -20 0 20 40 60 80 100Błąd estymacji

0

0.1

0.2

0.3

Fre

kw

encj

a

Page 24: Alfred Stach Instytut Paleogeografii i Geoekologii

Prosty kriging – zmienna b1_03b

-60 -40 -20 0 20 40 60 80 100Błąd estymacji

0

0.1

0.2

0.3

Fre

kw

encj

a

-50 0 50 100 150Rzeczywiste błędy estymacji SK

-50

0

50

100

150

Wa

ria

ncj

a k

rig

ing

ow

a S

K

Page 25: Alfred Stach Instytut Paleogeografii i Geoekologii

Weryfikacja jakości modelu -kroswalidacja

Page 26: Alfred Stach Instytut Paleogeografii i Geoekologii

Weryfikacja jakości modelu -kroswalidacja

280 320 360 400W artości rzeczywiste

300

320

340

360

War

tośc

i es

tym

ow

ane

Fit R esults

F it 1 : L inearEquation Y = 0.3890339957 * X + 200.4089956Num ber of data points used = 256Average X = 328.492Average Y = 328.204Residual sum of squares = 12069.7Regression sum of squares = 7306.45Coef of determ ination, R -squared = 0.377085Residual m ean square, sigm a-hat-sq 'd = 47.5184

Page 27: Alfred Stach Instytut Paleogeografii i Geoekologii

Weryfikacja jakości modelu – walidacja podzbioru