12
MONOGRAFIE KOMITETU GOSPODARKI WODNEJ PAN z. XX 2014 Agnieszka RUTKOWSKA 1 , Kazimierz BANASIK 2 1 Uniwersytet Rolniczy w Krakowie Wydział Inżynierii Środowiska i Geodezji 2 Szkoła Główna Gospodarstwa Wiejskiego w Warszawie Wydział Budownictwa i Inżynierii Środowiska PARAMETR KSZTAŁTU ROZKŁADÓW GEV I GP PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH ORAZ POWYŻEJ PROGU ODCIĘCIA – ANALIZA STATYSTYCZNA 1. WSTĘP Wyznaczanie przepływów o określonym prawdopodobieństwie przewyższenia jest kluczowe, jeśli chodzi o projektowanie urządzeń przeciwpowodziowych oraz sporządzanie map ryzyka. W praktyce są one estymowane na podstawie empirycz- nych przepływów maksymalnych rocznych (AM), z półrocza zimowego (letniego) lub przepływów powyżej poziomu (progu) odcięcia. Szczególną uwagę należy przy tym zwrócić na estymację prawego ogona rozkładu, gdyż w nim zawarta jest infor- macja o przepływach mających długi okres powtarzalności. Jeśli przepływ maksy- malny prawdopodobny jest estymowany za pomocą rozkładu uogólnionego wartości ekstremalnych (GEV) lub uogólnionego Pareto (GP), to o kształcie ogona rozkładu decyduje jego współczynnik kształtu. Stąd też kluczowa jest poprawna estymacja tego współczynnika. Prekursorami w badaniach rozkładów ekstremów zmiennych losowych byli Fréchet (1927), Fisher i Tippet (1928), Gumbel (1935), von Mises (1936). Rozkład GEV został wprowadzony przez Jenkinsona (1955) przez połączenie trzech rozkła- dów Fishera-Tippetta. Jest to asymptotyczny rozkład maksimów ciągów niezależ- nych zmiennych losowych o tym samym rozkładzie. Rozkład GEV jest często stosowany w hydrologii i meteorologii do opisu zja- wisk ekstremalnych (Katz i in. 2002; Renard i in. 2006; Tiago de Oliviera 1986), a także we wskazaniach dotyczących metodyki obliczania przepływów maksymal- nych prawdopodobnych w wielu krajach (CWC 2010; Kjeldsen 2008; USGS 1982). Dystrybuanta tego rozkładu ma postać (Węglarczyk 2005): Monografia KGW-PAN, z. XX, tom 1.indb 95 2014-09-05 07:46:31

ONORIE KOITETU OSPODRKI WODNE PN . 2014ziw.sggw.pl/zaklad/Tom 1, 8. Rutkowska, Banasik.pdf · się przynajmniej 1 raz średni przepływ dobowy z wielolecia (Banasik, Bycz-kowski 2007)

Embed Size (px)

Citation preview

Page 1: ONORIE KOITETU OSPODRKI WODNE PN . 2014ziw.sggw.pl/zaklad/Tom 1, 8. Rutkowska, Banasik.pdf · się przynajmniej 1 raz średni przepływ dobowy z wielolecia (Banasik, Bycz-kowski 2007)

M O N O G R A F I E K O M I T E T U G O S P O D A R K I W O D N E J PA Nz. XX 2014

Agnieszka RUTKOWSKA1, Kazimierz BANASIK2

1Uniwersytet Rolniczy w Krakowie Wydział Inżynierii Środowiska i Geodezji

2Szkoła Główna Gospodarstwa Wiejskiego w Warszawie Wydział Budownictwa i Inżynierii Środowiska

PARAMETR KSZTAŁTU ROZKŁADÓW GEV I GP PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH ORAZ POWYŻEJ PROGU ODCIĘCIA – ANALIZA STATYSTYCZNA

1. WSTĘP

Wyznaczanie przepływów o określonym prawdopodobieństwie przewyższenia jest kluczowe, jeśli chodzi o projektowanie urządzeń przeciwpowodziowych oraz sporządzanie map ryzyka. W praktyce są one estymowane na podstawie empirycz-nych przepływów maksymalnych rocznych (AM), z półrocza zimowego (letniego) lub przepływów powyżej poziomu (progu) odcięcia. Szczególną uwagę należy przy tym zwrócić na estymację prawego ogona rozkładu, gdyż w nim zawarta jest infor-macja o przepływach mających długi okres powtarzalności. Jeśli przepływ maksy-malny prawdopodobny jest estymowany za pomocą rozkładu uogólnionego wartości ekstremalnych (GEV) lub uogólnionego Pareto (GP), to o kształcie ogona rozkładu decyduje jego współczynnik kształtu. Stąd też kluczowa jest poprawna estymacja tego współczynnika.

Prekursorami w badaniach rozkładów ekstremów zmiennych losowych byli Fréchet (1927), Fisher i Tippet (1928), Gumbel (1935), von Mises (1936). Rozkład GEV został wprowadzony przez Jenkinsona (1955) przez połączenie trzech rozkła-dów Fishera-Tippetta. Jest to asymptotyczny rozkład maksimów ciągów niezależ-nych zmiennych losowych o tym samym rozkładzie.

Rozkład GEV jest często stosowany w hydrologii i meteorologii do opisu zja-wisk ekstremalnych (Katz i in. 2002; Renard i in. 2006; Tiago de Oliviera 1986), a także we wskazaniach dotyczących metodyki obliczania przepływów maksymal-nych prawdopodobnych w wielu krajach (CWC 2010; Kjeldsen 2008; USGS 1982). Dystrybuanta tego rozkładu ma postać (Węglarczyk 2005):

Monografia KGW-PAN, z. XX, tom 1.indb 95 2014-09-05 07:46:31

Page 2: ONORIE KOITETU OSPODRKI WODNE PN . 2014ziw.sggw.pl/zaklad/Tom 1, 8. Rutkowska, Banasik.pdf · się przynajmniej 1 raz średni przepływ dobowy z wielolecia (Banasik, Bycz-kowski 2007)

A. Rutkowska, K. Banasik96

gdzie: k ϵ R – parametr kształtu,σ1 > 0 – parametr skali,c ϵ R – parametr położenia, przy czym .

Jeśli k < 0, to x ϵ (– ∞, c – ], a jeśli k > 0, to x ϵ [c – , +∞). Przypadki k = 0, k > 0, k < 0 odpowiadają rozkładom Fishera-Tippetta I, II, III. Rozkład ten jest też zwany rozkładem Gumbela dla k = 0, Frécheta dla k > 0 oraz odwróconym rozkładem Weibulla dla k < 0. Rozkład Frécheta jest ciężkoogonowy, gdyż jego funkcja gęstości maleje do 0 wolniej niż dowolna funkcja wykładnicza. Przyjmowanie bardzo du-żych wartości jest dla niego bardzo prawdopodobne. Jeśli jest on rzeczywistym roz-kładem przepływów maksymalnych rocznych, to wskazuje na możliwe występowa-nie bardzo wysokich przepływów lub inaczej: na bardzo wysokie przepływy dla długich okresów powtarzalności. Rozkład Gumbela, jako wykładniczy, ma lekki prawy ogon i jego kwantyle są niższe niż Frécheta. Dlatego też, z punktu widzenia estymowania przepływów maksymalnych prawdopodobnych, istotne jest rozróżnie-nie między przypadkami k = 0 i k > 0. W literaturze znanych jest kilka testów do we-ryfikacji hipotezy H : k = 0 przeciw HA : k > 0, także w kontekście przepływów i opa-dów (Otten, van Montfort 1978, Hosking 1984).

Rozkład uogólniony Pareto (GP) jest przedmiotem analizy w kontekście prze-pływów powyżej poziomu odcięcia (Madsen i in. 1997; Anderson, Meerschaert 1998; Renard i in. 2006; Onyutha,Willems 2013). W metodzie POT (Peak Over Threshold), zwanej też metodą wszystkich wezbrań, rozważane są wszystkie prze-pływy, które przekroczyły pewną, z góry ustaloną wartość. Zastosowanie tego spo-sobu modelowania umożliwia wykorzystanie dodatkowych informacji, gdyż zwięk-szana jest liczebność próby oraz rozważane są chwile przekroczenia ustalonego progu. Z twierdzenia udowodnionego niezależnie przez Balkema i de Haana oraz Pickandsa (Beirland i in. 2005) wynika, że dla długich okresów obserwacji przepły-wy powyżej progu mogą być opisane rozkładem GP o dystrybuancie:

gdzie: σ > 0 – parametr skali,k ϵ R – parametr kształtu, który zastosowany do przepływów POT jest teoretycznie

taki sam, jak parametr kształtu rozkładu GEV zastosowany do przepływów AM,

u ϵ R – parametr położenia, przy czym x – u > 0.Parametr k, podobnie jak w rozkładzie GEV, decyduje o grubości prawego ogo-

{F(x) = exp ( – (1 + k x–c

σ1 ) 1k– )

exp ( – exp (– x–cσ1 ))

jeśli k ≠ 0

jeśli k = 0 } (1)

σ1

kσ1

k

{G(x) = 1– (1 + k x–u

σ ) 1k–

1 – exp (– x–uσ )

jeśli k ≠ 0

jeśli k = 0 } (2)

Monografia KGW-PAN, z. XX, tom 1.indb 96 2014-09-05 07:46:32

Page 3: ONORIE KOITETU OSPODRKI WODNE PN . 2014ziw.sggw.pl/zaklad/Tom 1, 8. Rutkowska, Banasik.pdf · się przynajmniej 1 raz średni przepływ dobowy z wielolecia (Banasik, Bycz-kowski 2007)

Parametr kształtu rozkładów GEV i GP przepływów maksymalnych... 97

na, a przy tym jest on niezmienniczy ze względu na wzrost progu. Prawy ogon roz-kładu GP z k > 0 jest bardzo ciężki i opisuje ekstremalne zjawiska, z k < 0 jest lekki (ucięty), a z k = 0 – wykładniczy. Stąd też wskazane jest badanie jego znaku. Problem ten był przedmiotem wielu opracowań statystycznych (np. Davidson, Smith 1990; Brilhante 2004), także w kontekście opadów (Gomes, van Montfort 1987; Groisman i in. 2005; Kozubowski i in. 2008) i przepływów (van Montfort, Witter 1985; Smith 1989). W pracach Cunnane’a (1973, 1979) oraz Langa i in. (1999) przedstawiona została obszerna metodologia modelowania POT dla przepływów. Polska literatura o POT to np. prace Byczkowskiego i in. (2008), Strupczewskiego (1967) i Zieliń-skiej (1965).

Można pokazać teoretycznie, że jeśli rozkład przepływów POT jest wykładni-czy o dystrybuancie G(x) = 1 – exp (– ) to rozkład AM jest rozkładem Gumbela o dystrybuancie F(x) = exp (– μ · exp (– )), a jeśli rozkład POT jest GP z k ≠ 0, to

rozkład AM jest GEV z dystrybuantą F(x) = exp (i vice versa),

gdzie μ jest średnią liczbąprzekroczeń progu w roku. Stąd mając rozkład przepły-wów POT, można oszacować przepływy maksymalne prawdopodobne, uwzględnia-jąc średnią liczbę przekroczeń w roku. Z powyższego wynika także, że teoretycznie rozkłady GEV i GP mają taki sam parametr kształtu i dlatego jest on często oznacza-ny tym samym symbolem.

Celem pracy jest poznanie własności parametru kształtu rozkładów GEV i GP przy użyciu metod statystycznych.

2. OBSZAR BADAŃ

Pierwszym badanym szeregiem czasowym przepływów były przepływy rzeki Zagożdżonki w przekroju Płachty Stare. Rzeka płynie przez Puszczę Kozienicką i jest lewym dopływem środkowej Wisły. Jej zlewnia ma typowo nizinny charakter. Powierzchnia zlewni do przekroju Płachty wynosi 82,4 km2 przy czym około 24% tego obszaru stanowią tereny nieaktywne hydrologicznie ze względu na lokalne de-presje. Wpływa to znacząco na małą wartość współczynnika odpływu (c = 0,17). Średnie roczne warstwy opadu i odpływu wynoszą odpowiednio 612 i 107 mm. Przepływy zwyczajne roczne w Płachtach wahają się od 0,11 do 0,37 m3 s-1. Reżim hydrologiczny Zagożdżonki jest szczegółowo opisany w artykule Banasika i in. (2013). Zlewnia ta od roku 1962 jest przedmiotem badań prowadzonych przez Katedrę Inżynierii Wodnej SGGW w Warszawie. Przepływy maksymalne wyzna-czone wg kryteriów AM i POT były przedmiotem kilku opracowań (m.in. Banasik, Byczkowski 2007; Byczkowski i in. 2008). W bieżącym artykule poddano badaniu przepływy POT oraz AM, a osobno maksima pochodzenia opadowego (zwykle z półrocza letniego) i roztopowego (z półrocza zimowego) z okresu 1963-2012.

Drugi szereg tworzyły przepływy Dunajca w przekroju Nowy Targ. Dunajec jest prawym dopływem Wisły i do przekroju Nowy Targ ma charakter rzeki gór-skiej. Obszar do przekroju ma powierzchnię 681 km2 i zawiera aż 25% zasobów

x–uσ

x–uσ

( – μ (1 + k x–uσ )

1k– )

Monografia KGW-PAN, z. XX, tom 1.indb 97 2014-09-05 07:46:32

Page 4: ONORIE KOITETU OSPODRKI WODNE PN . 2014ziw.sggw.pl/zaklad/Tom 1, 8. Rutkowska, Banasik.pdf · się przynajmniej 1 raz średni przepływ dobowy z wielolecia (Banasik, Bycz-kowski 2007)

A. Rutkowska, K. Banasik98

wodnych całej zlewni Dunajca, mimo że obejmuje tylko 16% jej powierzchni. Ta część dorzecza charakteryzuje się dużą amplitudą stanów i wysokim spływem po-wierzchniowym. W Nowym Targu średni przepływ z wielolecia 1951-2012 wynosi 14,1 m3 s-1, a średnia roczna suma opadów – 915 mm. Poddano analizie przepływy AM oraz POT z okresu 1951-2012. Dane dla Dunajca otrzymano od IMGW-PIB w Warszawie.

3. METODY

Wstępna analiza każdego szeregu obejmowała badanie trendu przy pomocy testów Manna-Kendalla (Kendall 1938; Mann 1945) oraz Coxa-Stuarta (McCuen 2003; Niedzielski, Kosek 2011; Rutkowska 2014), a także testu Pettitta na skokową zmianę w średniej (Pettitt 1979; Kundzewicz, Robson 2004). Estymatory wszys- tkich parametrów rozkładu GEV oraz parametrów skali i kształtu rozkładu GP wy-znaczano metodą największej wiarygodności.

We wszystkich testach przyjęto poziom istotności α = 0,05.

3.1. Test istotności parametru kształtu rozkładu GEV: przepływy AM

Zgodność rozkładu przepływów maksymalnych z rozkładem GEV sprawdzono testem Andersona-Darlinga (AD).

Do testowania H : k = 0 przeciw HA : k > 0 zastosowano test wprowadzony przez Ottena i van Montforta (1978). Został on wybrany spośród kilkunastu innych testów przez Hoskinga (1984) jako mający dużą moc. Zakładamy uporządkowanie próby x1 ≤ x2 ... ≤ xn. Procedura jest następująca:

Statystyka testowa ma postać:

∆i = – ln (– lnn + 1

i – 12 )

∆ = 1 n – 1 ∑

n i=2 ∆i, σ2

∆= 1 n – 1 ∑

n i=2 (∆i – ∆)2– –

m1 = – ln (– ln( 1 n+1 )), mi = – ln (– ln i

n+1 ), li = xi – xi-1 mi – mi-1 dla i = 2, ... , n

(3)A = (∑ n i=2 li∆i

∑ n i=2 li

σ 2 ∆

n )12

– ∆ ) · (– −

Monografia KGW-PAN, z. XX, tom 1.indb 98 2014-09-05 07:46:32

Page 5: ONORIE KOITETU OSPODRKI WODNE PN . 2014ziw.sggw.pl/zaklad/Tom 1, 8. Rutkowska, Banasik.pdf · się przynajmniej 1 raz średni przepływ dobowy z wielolecia (Banasik, Bycz-kowski 2007)

Parametr kształtu rozkładów GEV i GP przepływów maksymalnych... 99

Wielkości ∆i oraz mi są kwantylami rozkładu Gumbela rzędua mierzy zależność między mi a wartościami z próby. Pierwszy czynnik A można, po przekształceniu, wyrazić przez kowariancję w próbie(∆i, li), a drugi pełni rolę nor-malizacyjną. Statystyka A bada więc siłę zależności między próbą a kwantylami rozkładu Gumbela. Wartość krytyczna dla n = 50 (100) wynosi 1,87 (1,89) (Otten, van Montfort 1978).

3.2. Rozkład GP: przepływy POT

Aby zbadać adekwatność rozkładu GP, należało przeanalizować przepływy POT, a przy tym (i) zapewnić niezależność zmiennych w szeregu czasowym oraz (ii) dobrać odpowiedni próg.

3.2.1. Wybór progu odcięciaProblem (ii) jest złożony, gdyż własności rozkładu GP zmieniają się wraz

z poziomem odcięcia. W szczególności, jeśli σu jest parametrem skali dla progu u, to σv = σu + k (v – u) dla v > u, więc skala rośnie liniowo ze wzrostem progu. Do-datkowo wzrasta niepewność szacowania parametrów. W praktyce rozsądnym wyborem jest próg dający średnio około 5 przekroczeń na rok (Lang i in. 1999), a następnie obserwacja rozkładu przy zwiększającym się progu.

Niech X będzie przepływem ponad poziomem odcięcia u, a x1, ... , xn próbą losową, przy czym x1 > u. Proces wyboru progu bazował na:• warunkach zapewniających niezależność, tj. by między wezbraniami pojawił

się przynajmniej 1 raz średni przepływ dobowy z wielolecia (Banasik, Bycz-kowski 2007) oraz by w ostatecznym wyborze progu między wezbraniami mi-nęło nie mniej niż 5 + log(P) dni, gdzie P – powierzchnia zlewni w mila2 (Lang i in. 1999). Niezależność potwierdzano przy pomocy testu na istotność funkcji autokorelacji cząstkowej PACF, mierzącej korelacje między zmiennymi w sze-regu z pominięciem korelacji zmiennych pośrednich;

• funkcji określonej jako średnie wezbranie ponad próg (Mean Excess, w na-ukach ekonomicznych znanej jako średnia nadwyżka ponad próg), zdefiniowa-nej dla poziomu u przez

Dla rozkładu GP zachodzi więc e jest liniowa. Stąd naj-lepszym wyjściowym poziomem odcięcia jest taki, od którego wykres estyma-tora tej funkcji jest w przybliżeniu liniowy. Estymatorem e(u) jest:

• wartościach estymatora parametru kształtu, które od pewnego u powinny się stabilizować ze względu na niezmienniczość parametru kształtu rozkładu GP;

i – 12

n + 1 i

n + 1 oraz

e(u) = E (X – u|X > u) (4)

e(u) = 1 – k σ + 1 – k k u

e(u) =∑n

i=1(xi – u) ·1{xi>u}

∑ni=11{xi>u}

ˆ

Monografia KGW-PAN, z. XX, tom 1.indb 99 2014-09-05 07:46:32

Page 6: ONORIE KOITETU OSPODRKI WODNE PN . 2014ziw.sggw.pl/zaklad/Tom 1, 8. Rutkowska, Banasik.pdf · się przynajmniej 1 raz średni przepływ dobowy z wielolecia (Banasik, Bycz-kowski 2007)

A. Rutkowska, K. Banasik100

• zgodności liczby przekroczeń progu z rozkładem Poissona. Dla dowolnego przedziału czasowego o ustalonej długości, liczba wezbrań ponad próg powin-na być rozkładem Poissona. Wykorzystano indeks dyspersji zdefiniowany jako

dla dowolnej zmiennej U , a równy 1 dla rozkładu Poissona. Jeśli U jest liczbą przekroczeń ustalonego progu w ciągu 1 roku, to zmienna ψ(N – 1) ma (asymptotycznie) rozkład χ2 o N – 1 stopniach swobody, gdzie N – liczba lat (Lang i in. 1999). Stąd wyznaczono dla każdego progu przedział ufności dla ψ.

• wyborze u = NWQ, gdzie NWQ = minimum AM (Banasik, Byczkowski 2007) jako progu wyjściowym oraz obserwacji powyższych funkcji przy zmieniają-cym się u;

• warunku, by ostatecznie wybrany próg był mniejszy niż ZQW = mediana AM.Po wyborze progu przeanalizowano wykres kwantyl-kwantyl, a testem AD

sprawdzono zgodność z rozkładem GP.

3.2.2. Test istotności parametru kształtu rozkładu GPTest H : k = 0 przeciw HA : k ≠ 0 (ew. k > 0, k < 0) przy założeniu, że zmienna pod-

lega rozkładowi GP, został zaczerpnięty z pracy Brilhante (2004). Zaletą testu jest jego prostota. Statystyka testowa przy uporządkowanej rosnąco próbie ma postać:

Brilhante (2004) wskazał test V jako mocniejszy od testu przedstawionego przez Montforta i Wittera (1985), stosowanego w kontekście przepływów. Dwu-stronnym obszarem krytycznym jest zbiór (0;3,57] [11,79;+∞), a prawostronnym (ew. lewostronnym) zbiór [10,73;+ ∞) (ew. (0;3,88]) dla n = 100. Przedziały te ule-gają niewielkim zmianom dla n = 50 (Brilhante 2004).

4. WYNIKI

Przeprowadzone testy nie wykazały istnienia trendu w żadnym z analizowa-nych szeregów.

4.1. Przepływy AM

W tablicy 1 podano wyniki analizy przepływów maksymalnych na Zagożdżon-ce oraz na Dunajcu. Test AD wskazał dużą zgodność z rozkładem GEV, gdyż wartość p była równa co najmniej 0,78 dla każdego szeregu. Estymowany parametr k wahał się dla Zagożdżonki od 0,35 do 0,98, a test A (wzór (3)) wskazał, że w każdym sze-regu jest on istotnie większy od 0. Wynika stąd, że dla Zagożdżonki ciężkoogonowy rozkład Frécheta lepiej opisuje rzeczywiste przepływy maksymalne niż lekkoogono-wy Gumbela. Dla Dunajca wartość statystyki testowej A nie przekroczyła wartości krytycznej, stąd rozkład Gumbela jest lepszym wyborem niż rozkład Frécheta.

ψ = D2UEU

V =xn – xmed

xmed – x1(5)

Monografia KGW-PAN, z. XX, tom 1.indb 100 2014-09-05 07:46:32

Page 7: ONORIE KOITETU OSPODRKI WODNE PN . 2014ziw.sggw.pl/zaklad/Tom 1, 8. Rutkowska, Banasik.pdf · się przynajmniej 1 raz średni przepływ dobowy z wielolecia (Banasik, Bycz-kowski 2007)

Parametr kształtu rozkładów GEV i GP przepływów maksymalnych... 101

4.2. Przepływy POT

Dla przepływów Zagożdżonki wybrano wyjściowy poziom odcięcia 0,63 m3 s-1, który był najniższym z rocznych maksimów w okresie 1963-2012. Próba miała 306 elementów, co dało μ = 6,12 przewyższeń na rok. Następnie próg przesuwano od 0,7 do 4,5 co 0,1 m3 s-1, dokonując dla każdego poziomu analizy przedstawionej w rozdziale 3.2.

Wartości funkcji autokorelacji PACF okazały się nieistotne już dla u = 0,7, stąd nie było przeciwwskazań do uznania zmiennych za niezależne. Na rys. 1 przed-stawiono wykres estymatora funkcji e. Jest on rosnący i zbliżony do liniowego, co świadczy na korzyść rozkładu GP. Rys. 2 przedstawia zależność estymatora k od u. Zauważalna jest jego stabilność dla u < 3,0 oraz pewna niestabilność dla u > 3,0, co może świadczyć o nieadekwatności rozkładu GP. Przerywane linie wyznaczają niepewność estymacji k.

Wartości indeksu ψ wahały się od 1,40 do 2,44 dla 0,63 ≤ u ≤ 4,5 i spełniały wa-runek Poissona tylko dla u = 1,60 oraz u = 2,40. Dla pozostałych progów wartości indeksów ψ leżały poza 95% przedziałem ufności.

Ostatecznie wybrano próg u = 1,60 m3 s-1, który ograniczył liczebność szeregu do 99 przepływów oraz dał μ = 1,98.

Tablica 1Wartości estymatora parametru kształtu, wartości p testu AD oraz wartości

statystyki testowej A dla przepływów maksymalnych Zagożdżonki (Z.) oraz Dunajca (D.)

Maksima Estymator parametru kształtu

Wartości p testu AD

Statystyka testowa A

Roczne Z. 0,58 0,94 4,86Roztopowe Z. 0,35 0,94 4,23Deszczowe Z. 0,98 0,84 7,71

Roczne D. 0,20 0,78 0,98

Rys. 1. Wykres średniego wezbrania ponad próg, Zagożdżonka

Monografia KGW-PAN, z. XX, tom 1.indb 101 2014-09-05 07:46:32

Page 8: ONORIE KOITETU OSPODRKI WODNE PN . 2014ziw.sggw.pl/zaklad/Tom 1, 8. Rutkowska, Banasik.pdf · się przynajmniej 1 raz średni przepływ dobowy z wielolecia (Banasik, Bycz-kowski 2007)

A. Rutkowska, K. Banasik102

Rys. 3 przedstawia wykres kwantyl-kwantyl dla rozkładu GP. Widoczna jest idealna zgodność dla przepływów poniżej 8 m3 s-1 oraz duża niezgodność dla wyż-szych oraz to, że przepływy rzeczywiste powyżej 8 m3 s-1 są znacznie wyższe niż estymowane, co może świadczyć o ciężkim ogonie rozkładu rzeczywistego. Test AD wskazał zgodność z rozkładem GP (wartość p = 0,51). Zadecydowała o tym bardzo dobra zgodność kwantyli dla przepływów mniejszych niż 8 m3 s-1, które stanowiły ok. 93% próby. Wynika stąd, że przepływy POT dla Zagożdżonki z u = m3 s-1 można opisać rozkładem GP, mając jednak na względzie możliwe duże błędy estymacji wysokich kwantyli.

Testując wykładniczość (wzór (5)) przy HA : k > 0, otrzymano V = 16,63, leżące w obszarze krytycznym. Tym samym stwierdzono istnienie ciężkiego ogona rozkładu.

Dla Dunajca wybrano najpierw 375 wezbrań przy u = NWQ = 33,3 m3 s-1, a następnie próg przesuwano do u = 200 m3 s-1. Analiza wartości indeksu ψ wskazała na spełnianie warunku Poissona dla wszystkich progów ponad 33,3 m3 s-1. Wykres funkcji e był zbliżony do liniowego dla u < 100 m3 s-1 (silnie rosnący) oraz dla u > 100

Rys. 2. Wykres zależności estymatora parametru kształtu od poziomu odcięcia, Zagożdżonka

Rys. 3. Wykres kwantyl-kwantyl dla Zagożdżonki rozkład GP z σ = 1,24, k = 0,44

Monografia KGW-PAN, z. XX, tom 1.indb 102 2014-09-05 07:46:33

Page 9: ONORIE KOITETU OSPODRKI WODNE PN . 2014ziw.sggw.pl/zaklad/Tom 1, 8. Rutkowska, Banasik.pdf · się przynajmniej 1 raz średni przepływ dobowy z wielolecia (Banasik, Bycz-kowski 2007)

Parametr kształtu rozkładów GEV i GP przepływów maksymalnych... 103

m3 s-1 (słabo malejący). Na rys. 4 widoczna jest oscylacja parametru k wokół 0 oraz pewna jego stabilizacja dla u > 100 m3 s-1. Poziom u = 100 m3 s-1 był jednak zbyt wy-soki, gdyż dostarczał tylko 58 wezbrań. Ostatecznie wybrano u = 90 m3 s-1, co dało 76 wezbrań (μ = 1,2). Rys. 5 przedstawia wykres kwantyl-kwantyl z rozkładem GP. Zauważalna jest dość dobra zgodność kwantyli, nawet dla wysokich wezbrań. Test AD nie zaprzeczył zgodności z rozkładem GP (wartość p = 0,12). Testując wykład-niczość, otrzymano V = 4,40 leżące poza obszarem krytycznym. Stąd lekkoogonowy rozkład wykładniczy poprawnie opisuje przepływy POT dla Dunajca przy u = 90 m3 s-1.

5. PODSUMOWANIE

Testy parametru kształtu są praktycznym narzędziem do oceny, czy rozkład jest lekko- czy ciężkoogonowy.

Przedstawione metody statystyczne umożliwiają analizę własności parametru kształtu rozkładów GEV i GP dla szeregów AM i POT. Zaletą metody POT jest roz-ważanie dużej liczby wezbrań, a wadą – jej pewien subiektywizm.

Rys. 4. Wykres zależności estymatora parametru kształtu od poziomu odcięcia, Dunajec

Rys. 5. Wykres kwantyl-kwantyl dla Dunacja rozkład GP z σ = 84,94, k = -0,10

Monografia KGW-PAN, z. XX, tom 1.indb 103 2014-09-05 07:46:33

Page 10: ONORIE KOITETU OSPODRKI WODNE PN . 2014ziw.sggw.pl/zaklad/Tom 1, 8. Rutkowska, Banasik.pdf · się przynajmniej 1 raz średni przepływ dobowy z wielolecia (Banasik, Bycz-kowski 2007)

A. Rutkowska, K. Banasik104

Dla każdej rzeki uzyskano podobne wnioski o ciężkości ogona dla szeregów AM i POT.

Zagożdżonka jest przykładem rzeki, dla której przepływy AM można opisać rozkładem Frécheta, a przepływy POT – rozkładem GP, przy czym oba są ciężko-ogonowe. Analizując przepływy POT, należy jednak zwrócić uwagę na niespełnia-nie warunku Poissona dla większości progów, co może świadczyć o istnieniu pew-nej niejednorodności szeregu. Ponieważ testy nie wykazały istnienia trendu, zmiany mają zapewne charakter bardziej nieregularny. Ich analiza w kontekście przepływów POT wymaga osobnego opracowania.

Dunajec jest przykładem rzeki, dla której przepływy POT można opisać rozkła-dem wykładniczym, jako szczególnym przypadkiem GP. Spełnianie warunku Poissona w okresie 62-letnim świadczy o stabilności warunków hydrologicznych w tej zlewni. Przepływy AM na Dunajcu mogą być opisane przez rozkład GEV, ale wynik analizy sugeruje jego szczególny przypadek, tj. rozkład Gumbela jako ostateczny wybór.

Przedstawiona metodologia POT może być także zastosowana do analizy in-nych charakterystyk hydrologicznych lub meteorologicznych.

THE SHAPE PARAMETER OF THE GEV AND GP DISTRIBUTIONS OF ANNUAL MAXIMA AND PEAK OVER THRESHOLD DISCHARGES

– STATISTICAL ANALYSIS

AbstractIdentification of the annual maximum discharge (AM) distribution is fundamental in

flood frequency analysis. The Extreme Value Theory states that the asymptotic distribution of maximum of iid variables is the Generalized Extreme Value (GEV) distribution, particularly Fréchet, Gumbel or Reversed Weibull. They differ in the shape parameter which decides on the thickness of the distribution tail. Therefore its estimation plays a crucial role in the as-sessment of flood discharges.

Flood discharges can also be estimated using flood peaks over a certain threshold (POT). The POT method uses the Generalized Pareto (GP) distribution. The tail thickness of the GP distribution is also expressed by the shape parameter.

In the study the statistical tests A and V for the shape parameters were presented and applied to AM and POT discharges, respectively, to distinguish between the heavy- and light-tailed distributions. The investigation was carried out for the Zagożdżonka river and the Dunajec river.

For each river the conclusions on the heaviness of the tails were similar for the AM and POT discharges. The study revealed that the AM series in the Zagożdżonka river was featured by a heavy tail. Additionally, the GP distribution with heavy tail was adequate to the POT series. The POT discharge distribution in the Dunajec river was properly depicted by the GP distribution and the test V indicated the light-tailed exponential distribution as a good fit. The Gumbel distribution was identified as a proper parent distribution function of the AM in the Dunajec river.

Key words: tests for shape of GEV and GP distributions, annual maxima, peak over thres-hold method.

Monografia KGW-PAN, z. XX, tom 1.indb 104 2014-09-05 07:46:33

Page 11: ONORIE KOITETU OSPODRKI WODNE PN . 2014ziw.sggw.pl/zaklad/Tom 1, 8. Rutkowska, Banasik.pdf · się przynajmniej 1 raz średni przepływ dobowy z wielolecia (Banasik, Bycz-kowski 2007)

Parametr kształtu rozkładów GEV i GP przepływów maksymalnych... 105

BIBLIOGRAFIA

Anderson P.L., Meerschaert M.M., 1998, Modeling river flows with heavy tails, Water Resources Re-search, 34 (9), 2271-2280

Beirland J., Goegebeur Y., Segers J., Teugels J., 2004, Statistics of Extremes, Theory and Applications, Wiley, Chichester, UK

Banasik K., Byczkowski A., 2007, Probable annual floods in a small lowland river estimated with the use of various sets of data, Annals of Warsaw University of Life Sciences – SGGW, Land Reclama-tion, 38, 3-10

Banasik K., Hejduk L., Hejduk A., Kaznowska E., Byczkowski A., 2013, Wieloletnia zmienność odpły-wu z małej zlewni rzecznej w regionie Puszczy Kozienickiej, Sylwan, 157 (8), 578-586

Brilhante M., 2004, Exponentiality versus generalized Pareto – a resistant and robust test, REVSTAT – Statistical Journal, 2 (1), 2-13

Byczkowski A., Banasik K., Hejduk L., 2008, Obliczanie przepływów powodziowych o określonym prawdopodobieństwie przekroczenia, Infrastruktura i Ekologia Terenów Wiejskich, 5, 199-208

Cunnane C., 1973, A particular comparison of annual maxima and partial duration series methods of flood frequency prediction, Journal of Hydrology, 18, 257-271

Cunnane C., 1979, A note on the Poisson assumption in partial duration series models, Water Re-sources Research, 15 (2), 489-494

CWC, 2010, Development of Hydrological Design Aids (Surface Water) under Hydrology Project. State of The Art Report, Central Water Commision, Ministry of Water Res., Gouvernment of India, dostęp online 30.06.2014: www.cwc.gov.in/main/downloads/SAR%20Report%20of%20Novem-ber%202010.pdf

Davidson A.C., Smith R.L., 1990, Models for exceedances over high thresholds, Journal of the Royal Statistic Society, Series B, 52, 393-442

Fisher R.A., Tippett L.H.C., 1928, Limiting forms of the frequency distribution of the largest and small-est member of a sample, Proceedings of the Cambridge Philosophical Society, 24, 180-190

Fréchet M., 1927, Sur la loi de probabilité de l’écart maximum, Annales de la Société Polonaise de Mathématique, 6

Gomes M.I., van Montfort M.A.J., 1987, Exponentiality versus generalized Pareto – quick tests, Sta-tistical Climatology, 87, 185-195

Groisman P.Y., Knight R.W., Karl T.R., Hegerl G.C., 2005, Trends in intense precipitation in the cli-mate record, Journal of Climate, 18, 1326-1350

Gumbel E.J., 1935, Les valeurs extrêmes des distributions statistiques, Annales de l’Institut Henri Poin-caré, 5 (2), 115-158

Hosking J.R.M., 1984, Testing whether the shape parameter is zero in the generalized extreme-value distribution, Biometrika, 71 (2), 367-374

Jenkinson A.F., 1955, The frequency distribution of the annual maximum (or minimum) of meteoro-logical elements, Quarterly Journal of the Royal Meteorological Society, 81, 158-171

Katz R.W., Parlange M.B., Naveau P., 2002, Statistics of extremes in hydrology, Advances in Water Resources, 25, 1287-1304

Kendall, M.G., 1938, A New Measure of Rank Correlation, Biometrika, 30, 81-93Kjeldsen T.R., Jones D.A., Bayliss A.C., 2008, Improving the FEH statistical procedures for flood fre-

quency estimation. Science Report: SC050050, Environment Agency, dostęp online 30.06.2014: www.gov.uk/government/uploads/system/uploads/attachment_data/file/291096/scho0608boff-e-e.pdf

Monografia KGW-PAN, z. XX, tom 1.indb 105 2014-09-05 07:46:33

Page 12: ONORIE KOITETU OSPODRKI WODNE PN . 2014ziw.sggw.pl/zaklad/Tom 1, 8. Rutkowska, Banasik.pdf · się przynajmniej 1 raz średni przepływ dobowy z wielolecia (Banasik, Bycz-kowski 2007)

A. Rutkowska, K. Banasik106

Kozubowski T.J., Panorska I., Qeadan F., Gershunov A., Rominger D., 2008, Testing Exponentiality Versus Pareto Distribution via Likelihood Ratio, Communications in Statistics – Simulation and Computation, 38 (1), 118-139

Kundzewicz Z.W., Robson A.J., 2004, Change detection in river flow recordsreview of methodology, Hydrological Sciences Journal, 49 (1), 7-19

Lang M., Ouarda T.B.M.J., Bobée B., 1999, Towards operational guidelines for over-threshold mode-ling, Journal of Hydrology, 225, 103-117

Mann, H.B., 1945, Nonparametric test against trend, Econometrica, 13, 245-259Madsen H., Rasmussen P.F., Rosbjerg D., 1997, Comparison of annual maximum series and partial du-

ration series methods for modeling extreme hydrologic events. 1. At-site modeling, Water Resources Research, 33 (4), 747-757

McCuen R.H., 2003, Modeling Hydrologic Change, Statistical Methods, Lewis Publishers CRC PressNiedzielski T., Kosek W., 2011, Minimum time span of TOPEX/Poseidon, Jason-1 and Jason-2 global

altimeter data to detect a significant trend and acceleration in sea level change, Advances in Space Research, 47, 1248-1255

Onyutha C., Willems P., 2013, Uncertainties in flow-duration-frequency relationships of high and low flow extremes in Lake Victoria basin, Water, 5, 1561-1579

Otten A, van Montfort M.A.J., 1978, The power of two tests on the type of distributions of extremes, Journal of Hydrology, 37 (1-2), 195-199

Pettitt A.N., 1979, A non-parametric approach to the change-point problem, Journal of the Royal Sta-tistical Society, Series C – Applied Statistics, 28 (2), 126-135

Renard B., Lang M., Bois P., 2006, Statistical analysis of extreme events in a nonstationary context via a Bayesian framework: case study with peak-over-threshold data, Stochastic Environmental Research and Risk Assessment, 21 (2), 97-112

Rutkowska A., 2014, Properties of the Cox-Stuart test for trend in application to hydrologi-cal series: the simulation study, Communications in Statistics – Simulation and Computation, doi:10.1080/03610918.2013.78498 (in press)

Smith J.A., 1989, Regional flood frequency analysis using extreme order statistics of the annual peak record. Water Resources Research, 25, 311-317

Strupczewski W. G., 1967, Determination of the probability of repeating phenomena, Acta Geophysica Polonica, XV (2), 147-158

Tiago de Oliviera J., 1986, Extreme Values and Meteorology, Theoretical and Applied Climatology, 37, 184-193

USGS, 1982, Flood Flow Frequency, Bulletin #17B of the Hydrology Subcommittee, dostępu online 30.06.2014: http://water.usgs.gov/osw/bulletin17b/dl_flow.pdf

van Montfort M.A.J., Witter J.V, 1985, Testing exponentiality against generalized Pareto distribution, Journal of Hydrology, 78 (3-4), 305-315

von Mises, R., 1936, La distribution de la plus grande de n valeurs, Revues in Mathematic Union Interbalcanique, 1, 141-160

Węglarczyk S., 2005, Statystyka w inżynierii środowiska, Politechnika Krakowska, Kraków, 90-92Zielińska M., 1965, Sposoby zestawiania danych hydrometeorologicznych dla opracowań statystycz-

nych, Gospodarka Wodna, 7, 245-251

Adres do korespondencji – Corresponding author: dr Agnieszka Rutkowska, Uniwersytet Rolniczy, Wydział Inżynierii Środowiska i Geodezji, Katedra Zastosowań Matematyki, 30-198 Kraków, ul. Ba-licka 253C, e-mail: [email protected]

Monografia KGW-PAN, z. XX, tom 1.indb 106 2014-09-05 07:46:33