34
© 2016 Gürkan Sin and Krist V. Gernaey. Experimental Methods In Wastewater Treatment. Edited by M.C.M. van Loosdrecht, P.H. Nielsen. C.M. Lopez-Vazquez and D. Brdjanovic. ISBN: 9781780404745 (Hardback), ISBN: 9781780404752 (eBook). Published by IWA Publishing, London, UK. OBRADA PODATAKA I PROCJENA PARAMETARA Autori: Gürkan Sin Krist V. Gernaey Recenzenti: Sebastiaan C.F. Meijer Juan A. Baeza 5.1 UVOD Modeliranje je jedan od glavnih alata na raspolaganju modernim stručnjacima, istraživačima i inženjerima koji se bave obradom otpadne vode. Ono im omogućuje istraživanje i razumijevanje složenih pojava na kojima se temelji fizički, kemijski i biološki rad uređaja za pročćavanje otpadne vode u različitim vremenskim i prostornim okvirima. Na uređajima za pročćavanje otpadne vode (UPOV), determinističko modeliranje pomoću ASM obitelji modela (npr. Henze i sur., 2000), postalo je važan alat za procesne inženjere. Ono podupire projektiranje, rad, optimizaciju i kontrolu uređaja. Modeli se isto tako sve više koriste kao pomoć u donošenju odluka o složenim problemima uključujući odabir procesa/tehnologije za naknadno poboljšanje, kao i validaciju strategija kontrole i optimizacije (Gernaey i sur., 2014; Mauricio-Iglesias i sur., 2014; Vangsgaard i sur., 2014; Bozkurt i sur., 2015). Modeli se također koriste kao sastavni dio sveobuhvatne analize i tumačenja podataka dobivenih iz niza eksperimentalnih metoda iz laboratorija, kao i pilot studija za karakteriziranje i istraživanje uređaja za pročćavanje otpadne vode. S tim u vezi, modeli pomažu, na valjani način objasniti različite kinetičke parametre za različite skupine mikroorganizama i njihove aktivnosti na UPOV-u pomoću tehnika procjene parametara. Doista, procjena parametara je sastavni dio razvoja i primjene modela (Seber i Wild, 1989; Ljung, 1999; Dochain i Vanrolleghem, 2001; Omlin i Reichert, 1999; Brun i sur., 2002; Sin i sur., 2010) i može se u grubim crtama definirati kako slijedi: Uz zadan model i skup podataka/mjerenja iz predmetne eksperimentalne strukture, procijeniti sve ili neke od parametara modela pomoću odgovarajuće statističke metode. Svrha ovog poglavlja je osigurati skup alata i tehnika potrebnih za procjenu kinetičkih i stehiometrijskih parametara za procese obrade otpadne vode dobivene iz eksperimentalnih šaržnih testova aktivnosti. Te metode i alati su uglavnom namijenjeni za praktičnu primjenu, 5

5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

  • Upload
    others

  • View
    21

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

© 2016 Gürkan Sin and Krist V. Gernaey. Experimental Methods In Wastewater Treatment. Edited by M.C.M. van Loosdrecht, P.H. Nielsen. C.M. Lopez-Vazquez and D. Brdjanovic. ISBN: 9781780404745 (Hardback), ISBN: 9781780404752 (eBook). Published by IWA Publishing, London, UK.

OBRADA PODATAKA I PROCJENA PARAMETARA Autori:

Gürkan Sin Krist V. Gernaey

Recenzenti: Sebastiaan C.F. Meijer Juan A. Baeza

5.1 UVOD

Modeliranje je jedan od glavnih alata na raspolaganju modernim stručnjacima, istraživačima i inženjerima koji se bave obradom otpadne vode. Ono im omogućuje istraživanje i razumijevanje složenih pojava na kojima se temelji fizički, kemijski i biološki rad uređaja za pročišćavanje otpadne vode u različitim vremenskim i prostornim okvirima.

Na uređajima za pročišćavanje otpadne vode (UPOV), determinističko modeliranje pomoću ASM obitelji modela (npr. Henze i sur., 2000), postalo je važan alat za procesne inženjere. Ono podupire projektiranje, rad, optimizaciju i kontrolu uređaja. Modeli se isto tako sve više koriste kao pomoć u donošenju odluka o složenim problemima uključujući odabir procesa/tehnologije za naknadno poboljšanje, kao i validaciju strategija kontrole i optimizacije (Gernaey i sur., 2014; Mauricio-Iglesias i sur., 2014; Vangsgaard i sur., 2014; Bozkurt i sur., 2015).

Modeli se također koriste kao sastavni dio sveobuhvatne analize i tumačenja podataka dobivenih iz

niza eksperimentalnih metoda iz laboratorija, kao i pilot studija za karakteriziranje i istraživanje uređaja za pročišćavanje otpadne vode. S tim u vezi, modeli pomažu, na valjani način objasniti različite kinetičke parametre za različite skupine mikroorganizama i njihove aktivnosti na UPOV-u pomoću tehnika procjene parametara. Doista, procjena parametara je sastavni dio razvoja i primjene modela (Seber i Wild, 1989; Ljung, 1999; Dochain i Vanrolleghem, 2001; Omlin i Reichert, 1999; Brun i sur., 2002; Sin i sur., 2010) i može se u grubim crtama definirati kako slijedi:

Uz zadan model i skup podataka/mjerenja iz predmetne eksperimentalne strukture, procijeniti sve ili neke od parametara modela pomoću odgovarajuće statističke metode.

Svrha ovog poglavlja je osigurati skup alata i tehnika potrebnih za procjenu kinetičkih i stehiometrijskih parametara za procese obrade otpadne vode dobivene iz eksperimentalnih šaržnih testova aktivnosti. Te metode i alati su uglavnom namijenjeni za praktičnu primjenu,

5

Page 2: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

202 EKSPERIMENTALNE METODE U OBRADI OTPADNIH VODA

odnosno za konzultante, inženjere i profesionalce. Međutim, očekuje se da će biti korisne i za poduku studentima, te kao polazište za akademske istraživače koji žele proširiti svoj teorijski interes na ovom polju. Za modele odabrane za tumačenje eksperimentalnih podataka u ovom se poglavlju koriste modeli dostupni iz literature, a koji se uglavnom temelje na ASM obitelji modela aktivnog mulja i njihovim nadogradnjama (Henze i sur., 2000).

U ovom se poglavlju daje prikaz najčešće korištenih metoda u procjeni parametara dobivenih iz podataka šaržnih eksperimenata, odnosno: (i) obrada i validacija podataka, (ii) procjena parametara: metoda procjene maksimalne vjerojatnosti (MLE) i bootstrap metoda, (iii) analiza nesigurnosti: linearna propagacija pogreške i metoda Monte Carlo te (iv) analiza osjetljivosti i raspoznatljivosti.

5.2 TEORIJA I METODE

5.2.1 Obrada i validacija podataka

5.2.1.1 Sustavna analiza podataka za biološke procese

Većina procesa s aktivnim muljem može se proučavati pomoću pojednostavljenih modela procesne stehiometrije koji se oslanjaju na opis staničnog metabolizma prema modelu ‘crne kutije’ korištenjem podataka iz mjerenja koncentracija reaktanata (onečišćujućih tvari) i produkata, npr. CO2, prijelaznih vrsti oksidiranog dušika itd. Slično tome, obitelj modela aktivnog mulja (ASM) (Henze i sur., 2000) se oslanja na opis aerobnih i anoksičnih heterotrofnih aktivnosti, nitrifikacije, hidrolize i procesa raspadanja prema modelu ‘crne kutije’.

Općenit model procesne stehiometrije koji opisuje pretvaranje supstrata u biomasu i metaboličke produkte je formuliran u nastavku (za metabolizam ugljika):

5.1

Jednadžba 5.1 predstavlja pojednostavljivanje složene metaboličke ‘mašinerije’ stanične aktivnosti u jedan globalni odnos. Ova pojednostavljena reakcija omogućuje izračun prinosa procesa uključujući YSO (prinos kisika po jedinici supstrata), YSN (prinos dušika po jedinici supstrata), YSX (prinos biomase po jedinici

supstrata), YSC (prinos CO2 po jedinici supstrata), YSP1 (prinos prijelaznog produkta P1 po jedinici supstrata) te YSW (prinos vode po jedinici supstrata).

Koeficijenti ove jednadžbe su napisani na temelju 1 C-mola ugljikovog supstrata. To uključuje prirast za biomasu, YSX, prinose od potrošnje supstrata (amonijak), YSN, prinose od potrošnje kisika, YSO, prinos za proizvodnju CO2, YSC, i prinos za vodu, YSW. I biomasa, X, se piše na temelju 1 C-mola i pretpostavlja se da ima tipičan sastav CHaObNc. Sastav biomase se može eksperimentalno mjeriti, pri čemu je CH1,8O0,5N0,2 tipična vrijednost. Neki od prinosa se također eksperimentalno mjere iz opaženih brzina potrošnje i proizvodnje komponenti u procesu kako slijedi:

5.2

U gornjem izrazu qi se odnosi na volumetrijsku brzinu konverzije/proizvodnje komponente i, tj. mase komponente i po jediničnom volumenu reaktora i po jedinici vremena (Masa i Volumen-1 Vrijeme-1), ri se odnosi na izmjerenu brzinu, masa komponente i u jedinici vremena po jediničnoj težini biomase (Masa i Vrijeme-1 Masa biomasa-1), a Yji je prinos komponente i po jedinici komponente „j“. U slučaju biomase, x, to bi se odnosilo na specifičnu brzinu rasta μ:

5.3

Jedna od prednosti korištenja ove stehiometrije procesa jest to da omogućuje da se odrede elementarne bilance za C, H, N i O i da se osigura da je stehiometrija procesa uravnotežena. Za stehiometriju procesa u jedn. 5.1 vrijedit će sljedeća elementarna bilanca za ugljik, pod pretpostavkom da su izmjereni svi relevantni prinosi:

5.4

Slično bilanci ugljika, može se provesti elementarna bilanca i za N, O i H. U studijama biološkog procesa, koeficijent prinosa za vodu, YSW, se obično ne uzima u obzir budući da je proizvodnja vode zanemariva u usporedbi s velikim protocima koji se obično obrađuju u UPOV-ima. Iz tog razloga, bilance H i O i stehiometrija procesa u primjenama na području otpadnih voda obično nisu zatvorene. Međutim, bilanca za stupanj redukcije je zatvorena u stehiometriji procesa obrade otpadne vode.

2 SO 2 SN 3

SX SC 2 SP1 1 SW 2

CH O Y O Y NH

Y X Y CO Y P …+ Y H O

+ +→ + +

1i iji ji ij

j j

r qY and Y Y

r q−= = =

xx

qr

xμ = =

1sx sc spC balance : 1 Y Y Y 0− − + + + =

Page 3: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

OBRADA PODATAKA I PROCJENA PARAMETARA 203

To je okvir na kojem se temelji ASM. Bilanca stupnja redukcije je bitna budući da većina bioloških reakcija uključuje reakcije kemijske pretvorbe tipa redukcija-oksidacija (redoks) u metaboličkim aktivnostima.

5.2.1.2 Analiza stupnja redukcije

U biološkom će se procesu supstrat, tj. ono što se unosi u metabolički put, pretvoriti u produkt koji je u reduciranom ili oksidiranom stanju u odnosu na supstrat. Kako bi se provela redoks analiza biološkog procesa, potrebna je metoda za izračun redoks potencijala supstrata i produkata. U ASM obitelji modela i ostalim biotehničkim primjenama (Heijnen, 1999; Villadsen i sur., 2011) koristi se sljedeća metodologija:

1) Definirati standard za redoks stanje za elemente čije se bilance mogu uravnotežiti, tipično C, O, N, S i P.

2) Odabrati H2O, CO2, NH3, H2SO4 i H3PO4 kao referentne redoks-neutralne spojeve za izračun redoks stanja za elemente O, C, N, S odnosno P. Nadalje, jedinica za redoks se definira kao H = 1. S tim definicijama, dobivaju se sljedeće redoks razine pet navedenih elemenata: O = -2, C = 4, N = -3, S = 6 i P = 5.

3) Izračunati redoks razinu supstrata i produkata pomoću standardnih redoks razina elemenata. U nastavku slijedi nekoliko primjera: a) Glukoza (C6H12O6): 6 · 4 + 12 · 1 + 6 · (-2) = 24.

Po 1 C-molu, redoks razina glukoze postaje γg = 24/6 = 4 mol e- C-mol-1.

b) Octena kiselina (C2H4O2): 2 · 4 + 4 · 1 + 2 · (-2) = 8. Po 1 C-molu, redoks razina HAc postaje γa = 8/2 = 4 mol e- C-mol-1

c) Propionska kiselina (C3H6O2): 3 · 4 + 6 · 1 + 2 · (-2) = 14. Po 1 C-molu, redoks razina HPr postaje γp = 14/3 = 4.67 mol e- C-mol-1.

d) Etanol (C2H6O): 2 · 4 + 6 · 1 + 1 · (-2) = 12. Po 1 C-molu, redoks razina HAc postaje γe = 12/2 = 6

mol e- C-mol-1. 4) Provesti bilancu stupnja redukcije nad danom

procesnom stehiometrijom (vidi primjer 5.1).

Primjer 5.1 Elementarna bilanca i analiza stupnja redukcije za aerobnu oksidaciju glukoze

Opća procesna stehiometrija za aerobnu oksidaciju glukoze do biomase:

5.5

Pretpostavka je da biomasa X ima sastav CH1.8O0.5N0.2. Stupanj redukcije za biomasu se izračunava pod pretpostavkom da je izvor dušika amonijak (otuda je oksidacijsko stanje dušika -3, γX: 4 + 1.8 + 0.5 · (-2) + 0.2 · (-3) = 4.2 mol e- C-mol-1.

Sada se bilance C, N i stupnja redukcije mogu za stehiometriju procesa provesti kako slijedi:

Bilanca ugljika: 5.6

Bilanca dušika: 5.7

Redoks bilanca:

U ovim jednadžbama bilanci, četiri su nepoznanice (YSN, YSO, YSX, YSC). Budući da su dostupne tri jednadžbe, potrebno je samo jedno mjerenje prinosa da se izračunaju svi drugi. Na primjer, kod primjene ASM modela, prirast biomase se obično pretpostavlja, izmjeren je ili poznat, tako da se preostali prinosi mogu izračunati kako slijedi:

Prinos CO2: YSC = 1 - YSX 5.9

Prinos NH3: YSN = 0.2YSX 5.10

Prinos O2: g x SX SXSO

O2

Y 4 4.2YY

4

γ − γ ⋅ −= =γ

5.11

Kada se ti koeficijenti znaju, model stehiometrije procesa za 1 C-mol potrošnje glukoze postaje:

( )

SX2 2 SX 3

SX SX 2

4 4.2YCH O O 0.2Y NH

4Y X 1 Y CO

−+ ⋅ + ⋅ →

⋅ + − ⋅ 5.12

U okviru ASM modela, stehiometrija procesa se izračunava koristeći kao referencu jediničnu proizvodnju biomase. Prema tome, koeficijenti jedn. 5.12 se mogu presložiti kako slijedi:

SX2 2 3

SX SX

SX 2SX

4 4.2Y1CH O O 0.2NH

Y 4Y

1X Y CO

Y

−⋅ + ⋅ + →

+ − ⋅

5.13 2 SO 2 SN 3 SX SC 2CH O Y O Y NH Y X Y CO+ + → +

SX SC1 Y Y 0− + + =

SN SXY 0.2 Y 0− + ⋅ =

g O2 SO NH3 SN X SX CO2 SC

g O2 SO SN X SX SC

1 Y Y Y Y 0

1 Y 0 Y Y 0 Y 0

γ γ γ γ γγ γ γ

− ⋅ − ⋅ − ⋅ + ⋅ + ⋅ =

− ⋅ − ⋅ − ⋅ + ⋅ + ⋅ = 5.8

Page 4: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

204 EKSPERIMENTALNE METODE U OBRADI OTPADNIH VODA

Konverzija jedinice iz C-mola u g COD, što je jedinica ASM modela, definira se koristeći O2 kao referentni spoj. Slijedom toga, 1 g COD se definira kao -1 g O2. Iz stupnja redukcije kisika, konverzija na COD iz jedne jedinice redoksa (mol e-) se izračunava na sljedeći način:

O22

2 O2

1 1

MWMolecular weight of O

Degree of reduction of O γ

328 g COD L (mole )

4− − −

= =

=

5.14

Kako bi se C-mol pretvorio u g COD, jedinični redoks treba pomnožiti sa stupnjem redukcije supstrata kako slijedi:

g

mol e g COD g COD8

C mole mol e C mol

⋅ = γ ⋅ − −

5.15

5.2.1.3 Provjera konzistentnosti eksperimentalnih podataka

Vrijednost izvođenja elementarnih bilanci s podacima prikupljenim u eksperimentima s biološkim procesima je očita: potvrditi podudarnost podataka s prvim zakonom termodinamike, koji govori o očuvanju energije (u obliku tvari, topline itd.). Glavni i očiti zahtjev za izvođenje elementarnih bilanci jest da model bude provjeren i konzistentan. Eksperimentalne podatke treba provjeriti u smislu bruto pogrešaka (mjerenja) do kojih može doći neispravnim kalibriranjem ili neispravnim radom instrumenata, oprema i/ili senzora.

Nepodudarnost u podacima može se provjeriti iz zbroja elemenata koji čine supstrate potrošene u reakciji (npr. glukoza, amonijak, kisik itd.). To bi trebalo biti jednako zbroju elemenata (produkata) proizvedenih u reakciji (stoga vidi i jedn. 5.4 za bilancu ugljika). Odstupanje od ove elementarne bilance ukazuje na krivo definiran opis sustava, nedosljednost modela i/ili nedostatke mjerenja.

Pored elementarnih bilanci, bilanca stupnja redukcije daje informacije o tome jesu li za određeni put uključeni pravi spojevi ili nedostaje li u stehiometriji procesa neki spoj. Dodavanje ove provjere je korisno i osigurava usklađenost s bioenergetskim načelima bioloških procesa (Roels, 1980; Heijnen, 1999; Villadsen i sur., 2011).

Provjere konzistentnosti i elementarne bilance (pored bilanci naboja) su uključene u ASM obitelj modela kao matrica očuvanja kako bi se provjerila unutarnja konzistentnost koeficijenata prinosa (Henze i sur., 2000).

Elementarni sastav i stupanj redukcije mogu se provesti sustavno pomoću sljedeće generičke jednadžbe bilance kako bi se ispitala konzistentnost izmjerenih podataka:

5.16

Gornja jednadžba je formulirana za biološki proces s N supstrata i M metaboličkih produkata. U jednadžbi, e je elementarni sastav (C, H, O i N) za komponentu, a q je brzina volumetrijske proizvodnje (ili potrošnje) za supstrate (qsj), biomasu (qx) i metaboličke produkte (qpj). Prema tome, elementarna bilanca može se formulirati kako slijedi:

5.17

U ovoj jednadžbi, E je matrica očuvanja, a njezini stupci se odnose na svaki očuvani element i svojstvo, npr. C, H, O, N, γ itd. Svaki redak matrice E sadrži vrijednosti očuvanog svojstva povezane sa supstratima, produktima i biomasom; q je vektor kolone uključujući izmjerene volumetrijske brzine za svaki spoj. To je supstrat, kao i produkti i biomasa.

Ukupan broj stupaca u E je broj spojeva, koji je zbroj supstrata (N), produkata (M) i biomase, dakle N + M + 1. Ukupan broj ograničenja je 5 (C, H, O, N i γ). To znači da je N+M-4 broj stupnjeva slobode koju treba izmjeriti ili specificirati kako bi se izračunale sve brzine.

U šaržnim testovima obično se neće izmjeriti sve brzine. Zbog toga, pretpostavimo da je qm izmjereni skup volumetrijskih brzina, a qu neizmjereni skup volumetrijskih brzina koje treba izračunati. U tom slučaju jedn. 5.17 može se preformulirati kako slijedi:

( )m m u u

-1

u u m m

E q + E q = 0

q = E E q = 0−

5.18

Pod uvjetom da postoji inverz od Eu (det(Eu) ≠ 0), jedn. 5.18 daje izračun/procjenu neizmjerenih brzina u biološkom procesu. Ove procijenjene brzine su vrijedne same po sebi, ali mogu se koristiti i za potrebe validacije

N M

sj sj x x pj pjj 1 j 1e q e q e q 0

= =+ + =

E q = 0⋅

Page 5: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

OBRADA PODATAKA I PROCJENA PARAMETARA 205

ako su dostupna redundantna mjerenja. Ova sistematična metoda provjere konzistentnosti podataka istaknuta je u primjeru 5.2.

Svi ovi izračuni će pomoći verificirati i validirati eksperimentalne podatke i mjerenje prinosa procesa. Podaci se sada mogu koristiti za daljnju kinetičku analizu i procjenu parametara.

5.2.2 Procjena parametara

Ovdje se za potrebe opisivanja sustava od interesa podsjećamo formalizma modela prostora stanja. Neka y bude vektor rezultata iz dinamičkog modela, f, koristeći pritom vektor parametara, θ, vektor ulaznih varijabli, u, te vektor varijabli stanja, x:

5.19

U gornjoj jednadžbi opisan je sustav (šaržni sustav u laboratorijskom okruženju ili gradski UPOV) u pogledu sparenih običnih diferencijalnih jednadžbi (ODE) i algebarskog sustava jednadžbi pomoću formalizma prostora stanja.

Kratak opis problema za procjenu parametara onda glasi kako slijedi: za određeni skup mjerenja, y, pri čemu je njegova slučajna greška mjerenja prikupljena iz sustava od interesa, i uz strukturu modela u jedn. 5.19, procijenite nepoznate parametre modela (θ).

Pristupi rješavanju ovog problema mogu se u grubo podijeliti na metodu ručnog pokušaja i pogreške te formalne statističke metode.

5.2.2.1 Metoda ručnog pokušaja i pogreške

Ovaj pristup nema formalni znanstveni temelj osim praktične motivacije da se dobije dobra prilagodba modela podacima. Radi na sljedeći način: korisnik iz skupa parametara odabire jedan parametar i onda ga postepeno mijenja (povećava ili smanjuje oko njegove nominalne vrijednosti) dok se ne dobije realna prilagodba modela izmjerenim podacima. Isti se proces može ponoviti za neki drugi parametar. Proces prilagodbe završava kad korisnik smatra da je model dobro prilagođen podacima. To je često određeno praktičnim i/ili vremenskim ograničenjima budući da ova procedura nikad neće dovesti do optimalne

prilagodbe modela izmjerenim podacima. Uz to, mogu se dobiti višestruki različiti skupovi vrijednosti parametara koji ne moraju nužno imati fizičko značenje. Uspjeh ove procedure se često oslanja na iskustvo osobe koja modelira u odabiru odgovarajućih parametara koje će prilagoditi određenim aspektima izmjerenih podataka. Premda je ovaj pristup uvelike subjektivan i daleko od optimalnog, još uvijek se naveliko koristi u industriji kao i u akademskim/istraživačkim krugovima. Praktična pitanja kvalitete podataka često ne omogućuju precizno određivanje parametara. Isto tako, ne pružaju sve (komercijalne) softverske platforme za modeliranje odgovarajuće statističke alate za procjenu parametara. Postoje automatizirane procedure za kalibraciju modela pomoću algoritama kao što su tehnike statističkog uzorkovanja, optimizacijski algoritam itd. (Sin i sur., 2008). Međutim, takve procedure su fokusirane na dobivanje dobre prilagodbe eksperimentalnim podacima, a ne nužno na raspoznatljivost i/ili procjenu parametra iz skupa podataka. To je zato što ovo potonje zahtijeva valjano korištenje statističke teorije.

5.2.2.2 Formalne statističke metode

U ovom pristupu, valjani statistički pristup se koristi da se ukaže na problem koji se onda rješava matematički korištenjem odgovarajućih strategija numeričkog rješavanja, npr. algoritmi minimiziranja ili algoritmi uzorkovanja. Unutar ove kategorije, obično se koriste sljedeći statistički pristupi: a. Frekvencijski pristup (najveća vjerodostojnost,

najmanji kvadrati, nelinearna regresija itd.). b. Bayesov pristup (Metropolis-Hasting, Markovljev

lanac Monte Carlo (MCMC), uzorkovanje po važnosti itd.).

c. Pragmatični/hibridni okvir (koristi određene elemente dvaju gornjih pristupa, npr. bootstrap metoda, Monte Carlo filtriranje itd.).

Gore navedene statističke metode su među najčešće korištenima, a preporučuju se i ovdje. Konkretno, fokusirat ćemo se na frekvencijsku i bootstrap metodu budući da više odgovaraju ciljnoj svrsi ovog poglavlja.

Frekvencijska metoda - teorija najveće vjerodostojnosti Kod problema procjene parametara obično definiramo procjenitelje parametara, θ, kako bismo ih razlikovali od parametara pravog modela, θ. U kontekstu statističke procjene, parametri modela se definiraju kao nepoznati i statističke metode se koriste za procjenu njihove prave vrijednosti. Ova razlika je suptilna, ali važna za

( ) ( )

( )0

dxf x,θ,u, t ; x 0 x

dty g x,θ,u, t

= =

=

Page 6: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

206 EKSPERIMENTALNE METODE U OBRADI OTPADNIH VODA

razumijevanje i tumačenje rezultata procjene parametara, neovisno o korištenim metodama.

Najveća vjerodostojnost je opća metoda za pronalaženje procjenitelja, θ, iz danog skupa mjerenja, y. U ovom pristupu, parametri modela θ se tretiraju kao prave, fiksne vrijednosti, ali njihovi odgovarajući procjenitelji θ se tretiraju kao slučajne varijable. Razlog tome je to što procjenitelji ovise o mjerenjima, za koja se pretpostavlja da su stohastički proces:

5.20

Pogreške mjerenja, ε, definira distribucija vjerojatnosti, npr. normalna distribucija, N, s nultom sredinom i standardnom devijacijom (σ). S takvim pretpostavkama, funkcija vjerojatnosti (L) za procjenu parametara postaje sljedeća (Seber i Wild, 1989):

5.21

Najizglednija procjena θ se pronalazi kao one vrijednosti parametara kojima se maksimira funkcija vjerodostojnosti:

( )θθ̂: min L y,θ 5.22

Rješenje za ovako postavljen problem (5.24) se često pronalazi optimizacijskim algoritmima kao što su simpleks metoda, metode unutarnje točka, genetički algoritmi, simulirano hlađenje itd. Parametri dobiveni računanjem najveće vjerodostojnosti (jedn. 5.21) su isti kao i parametri dobiveni računanjem funkcije najmanjeg troška u jedn. 5.23.

Metoda najmanjih kvadrata Ovo je poseban slučaj metode najveće vjerodostojnosti gdje se pretpostavlja da su mjerenja neovisna i identično distribuirana pri čemu male pogreške mjerenja imaju poznatu standardnu devijaciju, σ (Gaussova). Funkcija vjerodostojnosti postaje ekvivalentna minimiziranju sljedeće funkcije troškova (ili cilja), S(y,θ) (Seber i Wild, 1989):

5.23

U gornjem izrazu y predstavlja skup mjerenja, (θ) odgovarajuća predviđanja modela, a Σ standardnu devijaciju pogrešaka mjerenja. Rješenje za funkciju cilja (jedn. 5.24) se pronalazi pomoću minimizacijskih algoritama (npr. Newtonova metoda, metoda gradijentnog spusta, metoda unutarnje točke, Nelder-Meadov simpleks, genetički algoritam itd.).

( )

( )

θ

θ̂

θ̂: min S y,θ

S y,θ =0θ

∂∂

5.24

Rješenje za gornji optimizacijski problem daje najbolju procjenu vrijednosti parametara. Idući korak je ocijeniti kvalitetu procjenitelja parametara. Taj korak zahtijeva procjenu intervala pouzdanosti vrijednosti parametara i paralelnu linearnu korelaciju među parametrima.

Matrica kovarijance procjenitelja parametara Kao rezultat stohastičkog mjerenja, procjenitelji imaju određen stupanj nesigurnosti. U frekvencijskom statističkom pristupu, vjerojatnost se definira u smislu učestalosti javljanja ishoda. Prema tome, u ovoj metodi nesigurnost procjenitelja parametara definira 95 %-tni interval pouzdanosti koji se tumači kao raspon u kojemu je vjerojatno da će se 95 od 100 puta locirati vrijednosti procjenitelja parametara. To se može objasniti kao da čovjek provede isto mjerenje 100 puta i onda napravi procjenu parametara na tih 100 skupova i opazi sljedeće: 95 javljanja vrijednosti procjenitelja leži u intervalu pouzdanosti, dok je 5 javljanja izvan tog intervala.

Kako bi se procijenio interval pouzdanosti, prvo treba procijeniti matricu kovarijance ( cov θ ), koja sadrži cjelovite informacije o nesigurnosti procjenitelja parametara. Jedna metoda za dobivanje cov θ jest koristiti metodu linearne aproksimacije kroz procjenu Jacobijeve matrice (F.) problema procjene parametara (Seber i Wild, 1989):

5.25

U gornjem izrazu, s2 je nepristrana procjena σ2 dobivena iz rezidualnih odstupanja pri procjeni parametara:

( ) ( )y f θ where N 0, = + ε ε ∝ σ

( ) ( ) ( )12

θ θ

θˆcov θ F.' F. where F. θ

fs

=

∂= ⋅ =

( ) ( )( )2

2

y θ1L y,θ = exp

2σσ 2π

− −

f

( ) ( )( )2

2

y θS y,θ =

σ

f

Page 7: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

OBRADA PODATAKA I PROCJENA PARAMETARA 207

( )min2ˆS y,θ

s = n p−

5.26

Ovdje je n ukupan broj mjerenja, p je broj procijenjenih parametara, n-p su stupnjevi slobode, Smin(y,θ) je najmanja vrijednost funkcije cilja, a F. je Jacobijeva matrica koja odgovara derivaciji prvog reda modelirane funkcije, f, u odnosu na vektor parametra θ evaluiranog pri θ = θ.

Matrica kovarijance je kvadratna matrica s (p×p) dimenzijama. Dijagonalni elementi matrice su procjenitelji parametara, dok su nedijagonalni elementi kovarijanca između bilo kojeg para procjenitelja parametara.

Sada se može aproksimirati 95 %-tni interval pouzdanosti procjenitelja parametara. Uz pretpostavku velikog n, intervali pouzdanosti (razlika između procjenitelja i pravih vrijednosti parametara) slijede studentovu t-distribuciju, interval pouzdanosti pri 100 (1-α) %-tnoj značajnosti:

( )α/21-α N-pθ = θ ± t cov θ diag

5.27

U gornjem izrazu tN-pα/2 je gornji α/2 percentil

t-distribucije s N-p stupnjevima slobode, a diagcov(θ) predstavlja dijagonalne elemente matrice kovarijance parametara.

Paralelna linearna korelacija između procjenitelja parametara, Rij, može se dobiti izračunom korelacijske matrice iz jedinične standardizacije matrice kovarijance kako slijedi:

( )i j

i j

ijθ θ

cov θ ,θR =

σ × σ 5.28

Ova linearna korelacija će se kretati u rasponu od [-1 1] i ukazivat će na to može li se procjenitelj parametara jedinstveno raspoznati (ako je koeficijent korelacije nizak) ili korelirati (ako je koeficijent korelacije visok).

Bootstrap metoda Jedna od glavnih pretpostavki za korištenje metode procjene najveće vjerodostojnosti (MLE) kao i njezine pojednostavljene verzije, nelinearne metode najmanjih kvadrata, je da se pretpostavlja da temeljna distribucija pogrešaka slijedi normalnu (Gaussovu) distribuciju.

Međutim, u mnogim praktičnim primjenama taj uvjet je rijetko ispunjen. Prema tome, teoretski se metoda MLE za procjenu parametara ne može koristiti bez kompromitiranja njezinih pretpostavki, što može dovesti do precjenjivanja ili podcjenjivanja pogrešaka procjene parametara i njihove kovarijantne strukture.

Alternativa ovom pristupu je metoda bootstrap koju je razvio Efron (1979), kojom se uklanja pretpostavka da rezidualna odstupanja slijede normalnu distribuciju. Umjesto toga, metoda bootstrap radi sa stvarnom distribucijom pogrešaka mjerenja, koje se onda propagiraju na pogreške procjene parametara pomoću odgovarajuće sheme Monte Carlo (slika 5.1).

Metoda bootstrap koristi originalni skup podataka D(0) s njegovih N podatkovnih točaka kako bi se generirao bilo koji broj skupova sintetičkih podataka DS(1);DS(2);…., također s N podatkovnih točaka. Procedura se sastoji u tome da se jednostavno izvuku N podatkovne točke sa zamjenama iz skupa D(0). Zbog zamjene, dobivaju se skupovi u kojima se nasumična frakcija originalnih izmjerenih točaka, obično 1/e = 37 %, zamjenjuje s dupliciranim originalnim točkama. To je ilustrirano na slici 5.1.

Primjena metode bootstrap za procjenu parametara na području pročišćavanja otpadnih voda zahtijeva prilagodbu zbog prirode podataka u vremenskom nizu. Prema tome, uzorkovanje se ne provodi iz originalnih podatkovnih točaka (koje su vremenski niz i ukazuju na određeni trend). Umjesto toga, uzorkovanje se provodi iz rezidualnih odstupanja i onda se dodaje rezultatima simuliranog modela (dobivenih korištenjem procjene referentnih parametara) (slika 5.1). To je razumno zato što su pogreške mjerenja ono što se pretpostavlja da je stohastično, a ne glavni trend izmjerenih podatkovnih točaka koje uzrokuju biološki procesi/mehanizmi. Imajući to na umu, u nastavku je prikazana teoretska pozadina metode bootstrap.

Page 8: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

208 EKSPERIMENTALNE METODE U OBRADI OTPADNIH VODA

Slika 5.1 Prikaz tijeka rada za metodu bootstrap: skupovi sintetičkih podataka se generiraju iz uzoraka Monte Carlo (izbor slučajnog uzorka s ponavljanjem) iz referentnog MLE. Za svaki skup podataka, provodi se ista procedura procjene kojom se dobivaju M različiti skupovi procjena parametara: θS

(1), θS(2), …

θS(M).

Definirajmo jednostavan nelinearni model gdje je yi i-nto mjerenje, fi je i-nto modelirano predviđanje, θ je vektor parametra (dužine p), a εi je pogreška mjerenja yi:

( )i i i iy = f θ + ε where ε F ∞ 5.29

Distribucija pogrešaka, F, nije poznata. To je različito od MLE, gdje se distribucija pretpostavlja a priori. Uz zadan y, koristimo minimizaciju najmanjim kvadratima kako bismo procijenili θ:

( ) 2

θθ̂ : min y f θ − 5.30

Metoda bootstrap definira F kao distribuciju vjerojatnosti uzorka ε kako slijedi:

( )( )i i i

1F̂ = (density) at ε = y f θ i =1,2,…n

n−

Gustoća je vjerojatnost i-ntog opažanja. U jednolikoj distribuciji, svako opažanje (u ovom slučaju pogreška mjerenja, εi) ima jednaku vjerojatnost pojavljivanja, pri čemu se gustoća procjenjuje iz 1/n. Bootstrap uzorak, y*, uz zadan (, F), se onda generira kako slijedi:

( )* * *i i i

ˆ ˆy θ ε where ε F if= + ∝ 5.32

Realizacija pogreške mjerenja u svakoj bootstrap metodi, ε∗ , se simulira izborom slučajnog uzorka s ponavljanjem iz originalnih rezidualnih odstupanja, čime se svakoj točki pripisuje jedinstvena težina (vjerojatnosti). Provođenjem N izbora slučajnog uzorka s ponavljanjem i onda njihovim dodavanjem modeliranom predviđanju (jedn. 5.31), generira se novi skup sintetičkih podataka, Ds(1) = y*.

Ponavljanjem gornje procedure uzorkovanja M puta generiraju se M skupovi podataka: Ds(1), Ds(2), Ds(3), … Ds(M).

Svaki skup sintetičkih podataka, Ds(j), omogućuje dobivanje novog procjenitelja parametara θ(j) istom metodom minimizacije najmanjih kvadrata koja se ponavlja M puta:

( ) ( ) 2sj θθ̂ : min D j f θ where j = 1,2…M−

Ishod ove iteracije je matrica procjenitelja parametara, θ(M×p) (M je broj Monte Carlo uzoraka sintetičkih podataka, a p je broj procijenjenih parametara). Prema tome, svaki procjenitelj parametara sada ima vektor kolone s vrijednostima. Ovaj vektor s

Skuppodataka, y

Referentna procjenaparametra, θ̂

^

^

^

^

^

^

^

^

^

^

Sintetički podaci y1

^Sintetički podaci y2

^Sintetički podaci y3

^Sintetički podaci y4

^Uzorak Monte Carlo, θ1

Izbor slučajnog uzorkas ponavljanjem, e

s

^Uzorak Monte Carlo, θ2

s

^Uzorak Monte Carlo, θ3

s

^Uzorak Monte Carlo, θ4

s

5.31

5.33

Page 9: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

OBRADA PODATAKA I PROCJENA PARAMETARA 209

vrijednostima može se grafički prikazati kao histogram i tumačiti pomoću uobičajenih frekvencijskih pristupa kao što su sredina, standardna devijacija i 95 %-tni percentil. Matrica kovarijance i korelacije može se izračunati pomoću samog θ(M×p). Time se uspješno dobivaju sve potrebne informacije o kvaliteti procjenitelja parametara.

Za pogreške mjerenja koje slijede normalnu distribuciju, i MLE i bootstrap metoda će u biti dati iste rezultate. Međutim, ako temeljna distribucija mjerenja značajno odstupa od normalne distribucije, očekuje se da će bootstrap metoda dati bolju analizu intervala pouzdanosti procjenitelja.

5.2.3 Analiza nesigurnosti

5.2.3.1 Linearna propagacija pogreške

U linearnoj propagaciji pogreške, matrica kovarijance procjenitelja parametara, cov(θ), se koristi za propagaciju pogrešaka mjerenja na pogreške modeliranih predviđanja i izračun standardnih pogrešaka i intervala pouzdanosti procjenitelja parametara. Prema tome, matrica kovarijance modeliranih predviđanja, cov(y), može se procijeniti pomoću cov θ kako slijedi (Seber i Wild, 1989):

( ) ( ) ( ) ( ) 1ˆcov y F.' F. cov θ F.' F. −= ⋅ ⋅ 5.34

Na sličan način, 1-α interval pouzdanosti predviđanja, y, može se aproksimirati kako slijedi:

( )α/21 N-py y t cov y diag− = ±α 5.35

Ovime zaključujemo procjenu parametara, intervale pouzdanosti i nesigurnost predviđanja sa stajališta frekvencijske analize.

5.2.3.2 Metoda Monte Carlo

Metoda Monte Carlo (MC) je originalno korištena za izračun višedimenzionalnih integrala, a s njezinim sustavnim korištenjem počeli su 40-ih godina 20. stoljeća matematičari i fizičari u ‘Školi Los Alamos’, konkretno Von Neumann, Ulam, Metropolis, Kahn, Fermi i njihovi suradnici. Naziv metode je skovao Ulam 1946. godine u čast rođaka koji je volio kockati (Metropolis i Ulam, 1949).

U kontekstu analize nesigurnosti, koja se bavi procjenom propagacije pogreške iz skupa ulaznih podataka (inputs) u skup ishoda (outputs) modela, integral od interesa je izračun sredine i varijance rezultata modela koji su i sami višedimenzionalni integrali (broj dimenzionalnosti je određen dužinom vektora ulaznih parametara):

5.36

Autori integral funkcije f(x) s x smatraju ulaznim vektorom x = (u1,…ud). Prema tome, integral se izvodi na d varijabli u1, .., ud nad jediničnom hiperkockom [0, 1]d. U procjeni parametara, te ulazne varijable su parametri modela koji imaju određen raspon s donjom i gornjom granicom. Pretpostavljamo da je f kvadratno integrabilna, što znači da rješenje sa stvarnom vrijednosti postoji u svakoj točki integracije. U kratkim crtama, označit ćemo točku u jediničnoj hiperkocki s x = (u1, .. ud), a funkciju evaluiranu u toj točki s f(x) = f(u1, .. ud), nakon čega se višedimenzionalna operacija integracije zadaje kao:

Zakon velikih brojeva osigurava da se procjena MC (E) približava pravoj vrijednosti ovog integrala. Međutim, kako je većinu vremena F konačan (broj uzorkovanja iz prostora unosa u s dimenzijom dxd), u Monte Carlo integraciji višedimenzionalnih funkcija postojat će pogreška. Ova pogreška Monte Carlo integracije se izražava kao 1/√N. Prema tome, prosječnu pogrešku Monte Carlo integracije daje MCerr=(f)/√N, gdje je σ(f) standardna devijacija pogreške, koja se može aproksimirati pomoću varijance uzorka:

Radi lakšeg bilježenja, razmatramo sljedeći jednostavan model: y=f(x), gdje funkcija f predstavlja ispitivani model, x:[x1;… xd] je vektor ulaznih podataka za model, a y:[y1;… yn] je vektor modeliranih predviđanja.

Svrha analize nesigurnosti je odrediti nesigurnost u elementima od y koja proizlazi iz nesigurnosti u elemente od x. Zbog nesigurnosti u vektor x koji karakteriziraju funkcije distribucije D=[D1,… Dd], gdje

5.37 ( )N

N1

1E = x

Nf

( ) ( ) ( )( )N

22 2N

1

1σ s = f x E

N 1f f≈ −

5.38

( ) ( ) d1 d= x dx u …u d xI f f=

( )N

NN

1

1lim x = I

Nf

→∞

Page 10: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

210 EKSPERIMENTALNE METODE U OBRADI OTPADNIH VODA

je D1 funkcija distribucije povezana s x1, nesigurnost u y se izražava kao:

U gornjem izrazu, var(y) i E(y) su varijanca odnosno očekivana vrijednost vektora slučajnih varijabli, y, koje se izračunavaju tehnikom uzorkovanja Monte Carlo. Pored varijance i srednje vrijednosti, lako se može izračunati i percentil za y uključujući gornju i donju 95 %-tnu granicu.

5.2.4 Lokalna analiza osjetljivosti i analiza raspoznatljivosti

5.2.4.1 Lokalna analiza osjetljivosti

Većina rezultata analize osjetljivosti navedenih u literaturi je lokalne prirode, a poznate su i kao metode „jedan po jedan faktor“ (OAT). U OAT metodama, svaka ulazna varijabla se varira (to se naziva i perturbacija) jedna po jedna oko svoje nominalne vrijednosti i mjeri se proizašli učinak na ishod. Rezultati analize osjetljivosti iz ovih metoda su korisni i valjani u blizini analiziranih parametara, otkuda i dolazi naziv lokalna. Uz to, funkcije osjetljivosti parametara ovise o nominalnim vrijednostima korištenima u analizi. Alternativne metode, kao što su regionalne ili globalne metode, proširuju analizu s jedne točke u prostoru parametra na širi raspon u čitavom prostoru parametra, ali to je van opsega ovog poglavlja (čitatelje koje to zanima upućujemo na radove autora kao što su Saltelli i sur., 2000; Sin i sur., 2009).

Mjera lokalne osjetljivosti se obično definira pomoću derivacije prvog reda kao ishod, y = f(x), u odnosu na ulazni parametar, x:

Apsolutna osjetljivost: sa = ∂y

∂x 5.40

(učinak na y perturbiranjem x oko njegove nominalne vrijednosti x0).

Relativna osjetljivost: sr = ∂y

∂xx°

y° 5.41

(relativni učinak y perturbiranjem x fiksnom frakcijom njegove nominalne vrijednosti x0).

Funkcije relativne osjetljivosti su nedimenzionalne u odnosu na jedinice i koriste se za međusobno uspoređivanje učinaka ulaznih podataka modela.

Ove derivacije prvog reda mogu se izračunati analitički, na primjer pomoću softvera Maple ili Matlab. Alternativno, derivacije se mogu dobiti numeričkim simulacijama modela s malom pozitivnom ili negativnom perturbacijom, Δx, ulaznih podataka modela oko njihovih nominalnih vrijednosti, x0. Ovisno o smjeru perturbacije, analiza osjetljivosti se može aproksimirati pomoću metoda diferencije unaprijed, diferencije unazad ili centralne diferencije:

Perturbacija unaprijed:

( ) ( )0 0x +Δx x

Δx

f fy

x

−∂ =∂

5.42

Perturbacija unatrag:

( ) ( )0 0x x Δx

Δx

f fy

x

− −∂ =∂

5.43

Centralna diferencija:

( ) ( )0 0x +Δx x Δx

2Δx

f fy

x

− −∂ =∂

5.44

Kada se odabere prikladno mali korak perturbacije, Δx (obično se koristi faktor perturbacije ε = 10-3. Prema tome Δx = ε · x), sve tri metode daju sasvim iste rezultate.

Nakon što se izračunaju funkcije osjetljivosti, mogu se koristiti za procjenu značajnosti parametara pri određivanju ishoda modela. Velike apsolutne vrijednosti obično ukazuju na veliku važnost parametra, dok vrijednost blizu nule ukazuje da parametar nema učinak na ishod modela (dakle parametar nije utjecajan). Ove informacije su korisne za ocjenu problema raspoznatljivosti parametara za oblikovanje eksperimenata.

5.39

( ) ( ) ( )( )( ) ( )

2var y y x dx

E y x dx

f

f

= −

=

Page 11: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

OBRADA PODATAKA I PROCJENA PARAMETARA 211

5.2.4.2 Analiza raspoznatljivosti pomoću indeksa kolinearnosti

Prvi korak u procjeni parametara je odrediti koji se skupovi parametara mogu odabrati za procjenu. Ovaj problem je predmet analize raspoznatljivosti koja se bavi utvrđivanjem koji podskupovi parametara se mogu jedinstveno raspoznati iz danog skupa mjerenja. Pri tome se pretpostavlja da model može imati niz parametara. Ovdje je pojam jedinstveno važan i mora ga se razumjeti kako slijedi: procjena parametra je jedinstvena kada se njegova vrijednost može procijeniti neovisno od vrijednosti ostalih parametara i s dovoljno velikom točnošću (tj. malom nesigurnošću). To znači da koeficijent korelacije između bilo kojeg para parametara treba biti nizak (npr. niži od 0,5) i standardna pogreška procjena parametara treba biti niska (npr. relativna pogreška procjene parametra, σθ /θ, niža od npr. 25%).

Kako ispada, mnogi problemi procjene parametara su loše uvjetovani problemi. Problem se definira kao loše uvjetovan kad je broj uvjetovanosti funkcije/matrice jako visok, što uzrokuju problemi više-kolinearnosti. U problemima regresije, broj uvjetovanosti se koristi kao dijagnostičko sredstvo za identificiranje problema raspoznatljivosti parametara. Takva regresijska dijagnostika pomaže u generiranju potencijalnih kandidata skupova parametara za procjenu među kojima korisnik može birati.

U literaturi je predloženo nekoliko testova raspoznatljivosti koji se u cijelosti temelje na funkcijama osjetljivosti parametara na ishode. Ovdje koristimo proceduru u dva koraka Bruna i sur., 2002. Ta procedura funkcionira na sljedeći način: (i) procjena rangiranja značajnosti parametra, (ii) analiza kolinearnosti (analiza ovisnosti funkcija osjetljivosti parametara u podskupu parametara):

1. korak Rangirajte značajnost parametara: δmsqr

δmsqr

=1

N∑ (sri)N

i

gdje je sr vektor bez-dimenzionalnih vrijednosti osjetljivosti, sr = i...N vrijednosti.

2. korak Izračunajte indeks kolinearnosti podskupa parametara K, γK.

γ = 1minλ λK=eigen(snormK

T snormK) snorm= sr‖sr‖

gdje K označava podskup parametara, snorm je normalizirana bezdimenzionalna funkcija osjetljivosti pomoću euklidske norme, a λ predstavlja eigen-vrijednosti normalizirane matrice osjetljivosti za podskup parametara K.

U 1. koraku, parametri koji imaju zanemariv ili gotovo nikakav utjecaj na izmjerene ishode modela se izdvajaju iz razmatranja za procjenu parametara. U drugom koraku, za svaki podskup parametara (sve kombinacije podskupova parametara koje uključuju 2, 3, 4,…m parametara) izračunava se indeks kolinearnosti. Indeks kolinearnosti je mjera sličnosti između bilo koja dva vektora funkcija osjetljivosti. Podskupovi koji imaju vrlo slične funkcije osjetljivosti će imati vrlo velik broj (γK ~ inf), dok će neovisni vektori imati manju vrijednost γK ~ 1 koja je poželjna. U analizi raspoznatljivosti, u literaturi se obično koristi granična vrijednost od 5-20 (Brun i sur., 2001; Sin i Vanrolleghem, 2007; Sin i sur., 2010). Primjećuje se da tu vrijednost γK treba koristiti kao smjernicu za odabir podskupova parametara kao kandidata za procjenu parametara. Najbolja praksa je ponavljati i isprobati veći broj rangiranih podskupova.

5.3 METODOLOGIJA I TIJEK RADA

5.3.1 Provjera konzistentnosti podataka pomoću elementarne bilance i analize stupnja redukcije

U provođenje elementarne bilance i analizu stupnja redukcije uključeni su sljedeći koraci:

1. korak Formulirati stehiometriju procesa za biološki proces prema modelu crne kutije.

U ovom koraku se identificiraju i zapisuju najvažniji reaktanti i produkti potrošeni i proizvedeni u biološkom procesu. Rezultat je popis reaktanata i produkata za 2. korak.

2. korak Izraditi matrice elementarnog sastava (Em i Eu).

Jedn. 5.45

5.46

5.47

5.48

Page 12: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

212 EKSPERIMENTALNE METODE U OBRADI OTPADNIH VODA

Prvo odredite koje varijable od interesa se mjere, nakon čega definirajte matrice kako slijedi: Em uključuje elementarni sastav i stupanj redukcija za te mjerene varijable, dok Eu uključuje one nemjerenih varijabli. Za izračun stupnja redukcije, koristite proceduru predstavljenu u odjeljku 5.2.1.2.

3. korak Izračunati neizmjerene brzine (qu).

Pomoću Em i Eu zajedno s vektorom izmjerenih brzina (qm), neizmjerene brzine (qu) se procjenjuju iz rješenja linearnog skupa jednadžbi u jedn. 5.18.

4. korak Izračunati koeficijente prinosa.

U ovom koraku, budući da su sada poznate brzine potrošnje/proizvodnje svih reaktanata i produkata, koeficijenti prinosa se mogu izračunati pomoću jedn. 5.2, a procesna stehiometrija može se zapisati koristeći vrijednosti koeficijenata prinosa.

5. korak Verificirati elementarnu bilancu.

U ovom koraku se provodi jednostavna provjera kako bi se verificiralo jesu li elementarna bilanca i bilanca stupnja redukcije zatvorene. Ako nisu, proceduru treba ponoviti uz pretpostavku drugačije hipoteze o nastajanju nusproizvoda.

5.3.2 Tijek procjene parametara za nelinearnu metodu najmanjih kvadrata

Ovdje se pretpostavlja da se za opisivanje podataka koristi prikladan i konzistentan matematički model. Takav model potvrđuje elementarnu bilancu i analizu stupnja redukcije (vidi korake u odjeljku 5.3.1). U literaturi su obično dostupna tri modela. Većina njih je modificirana iz ASM modela s odgovarajućim pojednostavljenjima i/ili dodacima koji odražavaju uvjete šaržnog eksperimenta.

1. korak Pokretanje.

U ovom koraku se specificiraju početni uvjeti za varijable modela, kao i nominalni skup parametara za model. Početni uvjeti za model se specificiraju u skladu s eksperimentalnim uvjetima (npr. 10 mg NH4-N dodanih u trenutku 0, kLa je određena vrijednost, specificirano je zasićenje kisikom na određenoj temperaturi itd.). Početna vrijednost modeliranih parametara uzeta je iz literature.

2. korak Odabrati eksperimentalne podatke i podskup parametara za procjenu parametara.

U ovom koraku se razmatraju eksperimentalni podaci za procjenu parametara i definira se koje parametre treba procijeniti. To se može napraviti stručnom prosudbom ili, sistematičnije, analizom osjetljivosti i raspoznatljivosti (vidi odjeljak 5.3.4).

3. korak Definirati i riješiti problem procjene parametara.

U ovom koraku se definira problem procjene parametara kao minimizacijski problem i rješava se pomoću optimizacijskih algoritama (npr. fminsearch u Matlabu).

4. korak Procijeniti nesigurnost procjenitelja parametara i ishoda modela.

U ovom koraku izračunajte matricu kovarijance procjenitelja parametara i izračunajte intervale pouzdanosti u parametre kao i korelacijsku matricu parametara. Uz zadanu matricu kovarijance procjenitelja parametara, procijenite matricu kovarijance ishoda modela pomoću linearne propagacije pogreške.

5. korak Pregledati i analizirati rezultate.

U ovom koraku pregledajte vrijednosti parametarskih vrijednosti koje bi trebale biti unutar raspona parametarskih vrijednosti dobivenih iz literature. Uz to, pregledajte intervale pouzdanosti procjenitelja parametara. Jako veliki intervali pouzdanosti ukazuju na to da predmetni parametar možda neće biti pouzdano procijenjen i da bi ga trebalo isključiti iz podskupa.

Nadalje, grafički prikažite i pregledajte rezultate iz rješenja s najboljom prilagodbom. Obično bi podaci i modelirana predviđanja trebali biti dobro prilagođeni.

Ako rezultati (obje parametarske vrijednosti) rješenja s najboljom prilagodbom podacima nisu zadovoljavajući, ponovite postupak ovisno o slučaju vrativši se na 1. korak ili 2. korak.

5.3.3 Tijek procjene parametara za metodu bootstrap

Tijek rada s metodom bootstrap nastavlja se na 1. korak, 2. korak i 3. korak nelinearne metode najmanjih kvadrata.

Page 13: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

OBRADA PODATAKA I PROCJENA PARAMETARA 213

1. korak Napraviti procjenu referentnog parametra pomoću nelinearne metode najmanjih kvadrata.

Ovaj korak je u osnovi izvođenje 1., 2. i 3. koraka u nelinearnoj tehnici najmanjih kvadrata. Ishod je rezidualni vektor koji se prosljeđuje na idući korak. Rezidualni vektor se potom prikazuje na grafikonu i pregledava. Ako rezidualna odstupanja slijede sustavni obrazac (trebao bi biti nasumičan) ili sadrže stršeće vrijednosti, to je razlog za brigu budući da može ukazivati na to da metoda bootstrap nije prikladna za ovu svrhu.

2. korak Generirati sintetičke podatke bootstrap uzorkovanjem i ponoviti procjenu parametara.

Sintetički podaci se generiraju pomoću jedn. 5.29-5.32 pomoću bootstrap uzorkovanja (izbor slučajnog uzorka s ponavljanjem) iz rezidualnog vektora i doda ga se modeliranom predviđanju dobivenom u 1. koraku. Za svaki sintetički podatak, procjena parametara u 1. koraku se ponavlja i ishod (odnosno vrijednosti procjenitelja parametara) se bilježi u matrici.

4. korak Pregledati i analizirati rezultate.

U ovom koraku se iz zabilježenih podataka u matrici u 2. koraku izračunava sredina, standardna devijacija i korelacijska matrica procjenitelja parametara. Štoviše, funkcija distribucije procjenitelja parametara može se procijeniti i grafički prikazati pomoću vektora parametarskih vrijednosti koji je dobiven u 2. koraku.

Kao u 5. koraku u nelinearnoj metodi najmanjih kvadrata, rezultati se tumače i ocjenjuju koristeći saznanja iz literature i procesnog inženjerstva.

5.3.4 Tijek analize lokalne osjetljivosti i analize raspoznatljivosti

Tijek ove procedure počinje pretpostavkom da je matematički model dostupan i spreman za korištenje kako bi se opisao skup eksperimentalnih podataka.

1. korak Pokretanje.

Definiran je okvir za analizu osjetljivosti definiranjem eksperimentalnih uvjeta (početni uvjeti za šaržne eksperimente) kao i skup nominalnih vrijednosti za analizu modela. Model se rješava s ovim početnim uvjetima, a ishodi se modela grafički prikazuju i pregledavaju prije provođenja analize osjetljivosti.

2. korak Izračunati funkcije osjetljivosti.

Definirajte koji se rezultati mjere i zbog toga bi trebali biti uključeni u analizu osjetljivosti. Definirajte eksperimentalne podatkovne točke (svaku 1 min nasuprot svakih 5 min).

Izračunajte funkcije osjetljivosti parametara na ishodima pomoću numeričkog deriviranja, npr. diferencija unaprijed, diferencija unazad ili centralna diferencija. Grafički prikažite, pregledajte i analizirajte rezultate.

3. korak Rangirati značajnost parametra.

Izračunajte delta mjeru srednjeg kvadrata, δmsqr, i rangirajte parametre u skladu s time. Isključite sve parametre koji nemaju nikakav ili imaju zanemariv utjecaj na rezultate.

4. korak Izračunati indeks kolinearnosti.

Za sve kombinacije parametara (npr. veličina podskupa 2, 3, 4….m) se izračunava indeks kolinearnosti, γK. Svaki podskup parametara se rangira u skladu s vrijednošću indeksa kolinearnosti.

5. korak Pregledati i analizirati rezultate.

Na temelju rezultata iz 3. koraka i 4. koraka identificirajte uži izbor kandidata (podskupova parametara) koji su raspoznatljivi. Te parametre isključite iz bilo kojeg podskupa parametara koji ima gotovo nikakvu ili zanemarivu osjetljivost na rezultate.

5.3.5 Analiza nesigurnosti pomoću metode Monte Carlo i linearne propagacije pogreške

Tijek rada za metodu Monte Carlo uključuje sljedeće korake:

1. korak Unijeti definiciju nesigurnosti.

Identificirajte koji ulazni podaci (parametri) imaju nesigurnost. Definirajte raspon/distribuciju za svaki unos nesigurnosti, npr. normalna distribucija, jednolika distribucija itd. Ovdje se kao ulazni podatak može koristiti ishod iz procjenitelja parametara (npr. bootstrap).

2. korak Uzorkovanje iz prostora ulaznih podataka (input).

Page 14: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

214 EKSPERIMENTALNE METODE U OBRADI OTPADNIH VODA

Definirajte broj uzorkovanja, N, (npr. 50, 100 itd.) i uzorkujte iz prostora ulaznih podataka pomoću odgovarajuće tehnike uzorkovanja. Najčešće tehnike uzorkovanja su slučajno uzorkovanje, uzorkovanje metodom latinskih kvadrata itd. Ishod ovog koraka je matrica uzorkovanja, XNxm, gdje je N broj uzoraka i m je broj ulaznih podataka (inputs).

3. korak Provesti Monte Carlo simulacije.

Provedite N simulacija s modelom koristeći matricu uzorkovanja iz 2. koraka. Zabilježite ishode u odgovarajući oblik matrice kako bi ih se moglo obraditi u idućem koraku.

4. korak Pregledati i analizirati rezultate.

Grafički prikažite ishode i pregledajte rezultate. Izračunajte sredinu, standardnu devijaciju/varijancu i percentile (npr. 95 %) za ishode. Analizirajte rezultate u kontekstu kvalitete procjene parametara i nesigurnosti modeliranog predviđanja. Prema potrebi, ponovite analizu vrativši se na 1. korak ili 2. korak.

Tijek rada za linearnu propagaciju pogreške:

Tijek rada je relativno jednostavan budući da je komplementaran matrici kovarijance procjenitelja parametara i trebalo bi ga provesti kao dio procjene parametara u nelinearnoj metodi najmanjih kvadrata. Zahtijeva matricu kovarijance procjenitelja parametara kao i Jacobijevu matricu koje se obje dobivaju u 4. koraku nelinearne metodologije najmanjih kvadrata.

5.4 DODATNI PRIMJERI

Primjer 5.2 Anaerobna fermentacija glukoze

U ovom primjeru se razmatra anaerobna fermentacija glukoze u etanol i glicerol kao metaboličke produkte.

1. korak Formulirati stehiometriju procesa.

Pretpostavlja se da je amonijak izvor dušika za rast. Pretpostavljeni sastav biomase je CH1.6O0.5N0.15. Svi supstrati su dani na temelju 1 C-mola, dok se dušik temelji na 1 N-molu. U ovom biološkom procesu supstrati su CH2O (glukoza) i NH3. Produkti su CH1.61O0.52N0.15 (biomasa), CH3O0.5 (etanol), CH8/3O (glicerol) i CO2. Voda je isključena iz analize budući da se njezina brzina proizvodnje ne smatra relevantnom za

proces. To znači da se neće razmatrati ni bilanca H niti O.

2. korak Sastaviti matrice elementarnog sastava (Em i Eu).

Budući da proces ima šest vrsta (supstrati + produkti) i tri ograničenja (dvije elementarne bilance za C i N plus bilanca stupnja redukcije), mjerenje tri brzine je dovoljno za procjenu/izvođenje preostalih brzina.

Kako bi se koncept ilustrirao, mjerene brzine se odabiru kao volumetrijska brzina potrošnje supstrata (-qs), brzina proizvodnje biomase (qx) te brzina proizvodnje glicerola (qg), tako da preostale brzine za proizvodnju amonijaka kao i proizvodnju etanola i CO2 treba procijeniti pomoću jedn. 5.18. U vektorima izmjerene brzine, negativan znak ukazuje na potrošnju neke vrste, dok pozitivni znak ukazuje na proizvodnju neke vrste.

3. korak Izračunati nemjerene brzine vrsta (qu).

Podsjetimo se jedn. 5.18, koja se rješava kako slijedi:

m m u

3 2

ns

ex

g c

E q E q = 0

S X Gly NH Eth CO

-qC 1 1 1 -q 0 1.0 1.0

qN 0 0 15 0 q 1 0 0 0

4 4 12 4 67 q 0 6 0 q

u

.

γ . .

⋅ + ⋅

⋅ + ⋅ =

( ) 1

u m m

1

n s

e x

c g

q E E q

-q 0 1.0 1.0 1 1 1 -q

q 1 0 0 0 0 15 0 q

q 0 6 0 4 4 12 4 67 q

u

.

. .

= − ⋅ ⋅

= − ⋅ ⋅

Rješavanje sustava gornjih linearnih jednadžbi dovodi do sljedećeg rješenja gdje se tri nemjerene brzine računaju kao funkcija mjerenih brzina qs, qg i qx:

xn

e s g x

c s g x

0 15q-q

q 2q 3 467q 600 103q / 150

q q 3 133q 600 47q 150

.

/ /

/ / /

− = − − − −

Page 15: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

OBRADA PODATAKA I PROCJENA PARAMETARA 215

4. korak Izračunati procesne prinose.

Nakon što se procijene brzine svih produkata i supstrata, mogu se izračunati koeficijenti prinosa za proces, podsjetivši se jedn. 5.2 kako slijedi:

( )

( )

gxsx sg

s s

n xsn sx

s s

s g xese

s s

sg sx

s g xcsc

s s

sg sx

qqY = and Y =

q q

q 0.15qY = = = 0.15Y

q q

2q 3 467q 600 103q /150qY =

q q

20 7783Y 0 6867Y

3

q 3 133q 600 47q 150qY =

q q

10.2217Y 0 3133Y

3

/ /

. .

/ / /

.

− −

− −= =

− −

− −= =

− −

S tim procijenjenim koeficijentima prinosa, pojednostavljena stehiometrija procesa glasi kako slijedi:

2 sx 3

sx 1.61 0.52 0.15 sg sx 3 0.5

sg 8/3 sg sx 2

0 = CH O 0.15Y NH …

2+ Y CH O N + 0.7783Y 0.6867Y CH O +

3

1Y CH O + 0.2217Y 0.3133Y CO

3

− − ⋅

⋅ − − ⋅

⋅ − − ⋅

5. korak Verificirati elementarnu bilancu.

Iz stehiometrije procesa, jednostavno je verificirati da su elementarna bilanca i redukcijska bilanca zatvorene:

sx sg sx sg

sg

21 Y 0 7783 Y 0 6867 Y Y

3

10.2217 Y 0 3133 Y 0

3 sx

. .

.

− + + − ⋅ − ⋅ + +

− ⋅ − ⋅ =

Bilanca dušika:

sx sx0 0.15 Y 0.15 Y 0 0 0 0− − ⋅ + ⋅ + + + =

Bilanca stupnja redukcije:

sx sg sx

sg

21 4 Y 4.12 0 7783 Y 0 6867 Y 6

3

Y 4.67 0

. . − ⋅ + ⋅ + − ⋅ − ⋅ ⋅ +

⋅ =

U gornjem primjeru, pretpostavilo se da su tri izmjerene brzine dostupne kao minimalni zahtjev za identificiranje sustava linearnih jednadžbi. U praktičnim primjenama mogle bi se javiti druge dvije situacije: (i) redundantna mjerenja: dostupna su mjerenja brzine proizvodnje/potrošnje većine ili možda svih vrsti. U ovom slučaju, dodatna mjerenja brzina mogu se koristiti za provjeru i validaciju kvalitete podataka (gdje bi se neke od izmjerenih brzina mogle koristiti kao validacija procijenjenih koeficijenata iz analize bilance); (ii) ograničen skup mjerenja: u ovom slučaju dostupno je premalo mjerenja brzina kako bi se nemjerene brzine mogle jedinstveno procijeniti. Ako nisu dostupni podaci iz dovoljno varijabli, neke varijable bi trebale biti fiksirane (npr. to bi se moglo napraviti iterativno u pretražnom algoritmu) kako bi se smanjili stupnjevi slobode. Ako ne, postoje beskonačna rješenja. Ove tehnike su dodatno obrađene u relevantnoj literaturi (Villadsen i sur., 2011; Meijer i sur., 2002; van der Heijden i sur., 1994).

Primjer 5.3 Procijeniti parametre procesa oksidacije amonija i nitrita pomoću podataka iz šaržnih testova: nelinearna metoda najmanjih kvadrata

Aerobni šaržni testovi s uzorkom mulja iz uređaja za pročišćavanje otpadnih voda s prethodnom denitrifikacijom, provode se kako bi se izmjerili parametri nitrifikacijskih bakterija, naročito organizmi koji oksidiraju amonij (AOO) i organizmi koji oksidiraju nitrit (NOO). Slijedom preporučene eksperimentalne procedure u literaturi (Guisasola i sur., 2005), provedena su dva zasebna šaržna testa kako slijedi: (i) šaržni test br. 1 s dodanim amonijem od 20 mg NH4-N L-1 i inhibitorom (natrijev azid) kako bi se suzbila aktivnost NOO, (ii) šaržni test br. 2 s dodanim amonijem od 20 mg NH4-N L-

1 bez dodavanja inhibitora. U oba testa, pH se kontrolira na 7.5, a temperatura na 25 ºC. Tijekom oba šaržna testa, amonij, nitrit i nitrat se mjere svakih 5 minuta, dok se otopljeni kisik mjeri svake minute. Prikupljeni podaci su prikazani na slici 5.2. Radi jednostavnosti i kako bi se fokus zadržao na demonstriranju metoda i njihovog ispravnog tumačenja, u ovim primjerima se koriste sintetički podaci dobiveni nasumičnim izborom.

Dio 1. Procijeniti parametre procesa oksidacije amonija. Nekoliko modela je predloženo u literaturi koju su razmotrili Sin i sur., 2008. Za opis kinetike oksidacije amonija i nitrita koristimo matematički model prikazan u tablici 5.1. Radi jednostavnosti, pretpostavlja se sljedeće: (i) endogena respiracija povezana s heterotrofnom biomasom je konstantna (zbog toga nije

Page 16: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

216 EKSPERIMENTALNE METODE U OBRADI OTPADNIH VODA

modelirana), (ii) inertna frakcija biomase nastala tijekom raspadanja je zanemariva (zbog toga nije modelirana) te (iii) amonij potrošen za rast autotrofne biomase je zanemariv. Napominjemo da bi radi cjelovitosti svaku od

gornjih pojava trebalo opisati, što analizu čini točnijom. Međutim, ovdje se zadržava jednostavan model kako bi se čitateljevu pažnju održalo na tijeku procjene parametara.

Tablica 5.1 Struktura modela nitrifikacije u dva koraka pomoću prikaza matrice (prilagođeno iz Sin i sur., 2008)

Varijable→Ci Procesi ↓j

SNH mg N L-1

SO

mg O2 L-1

SNO2

mg N L-1

SNO3

mg N L-1

XAOO

mg COD L-1 XNOO

mg COD L-1 Brzine reakcija qj

Rast AOO ‒1

YAOO 1‒

3.43

YAOO

1

YAOO 1 µmax

AOO · MNH · MO,AOO · XAOO

Raspadanje AOO 1 ‒1 bAOO · XAOO

Rast NOO 1‒1.14

YNOO

‒1

YNOO

1

YNOO 1 µmax

NOO · MNO2 · MO,NOO · XNOO

Raspadanje NOO

1 ‒1 bNOO · XNOO

Aeracija 1 kLa·(Sosat ‒ So)

MNH:SNH

SNH+Ks,AOO ; MO,AOO:SO

SO+Ko,AOO; MO,NOO:

SO

SO+Ko,NOO; MNO2:

SNO2

SNO2+Ks,NOO

Model ima ukupno šest običnih diferencijalnih jednadžbi (ODE), što odgovara jednoj masenoj bilanci za svaku varijablu od interesa. Pomoću zapisa matrice, svaka ODE se može formulirati kako slijedi:

iij j

dCν q

dt j

= ⋅ 5.49

Model se provodi u Matlabu i rješava pomoću standardnog alata za rješavanje diferencijalne jednadžbe (ODE45 u Matlabu).

%% solve the ODE model:

%[time,output] = ODEsolver('Model',[starttime

simulation endtime simulation],Initial conditions for

model variables,simulation options,model parameters);

options=odeset('RelTol',1e-7,'AbsTol',1e-8);

[t,y] = ode45(@nitmod,t,x0,options,par);

1. korak Pokretanje.

Model ima ukupno 12 parametara. Nominalne vrijednosti, kao i njihov raspon, preuzeti su iz literature (Sin i sur., 2008) i prikazani su u tablici 5.2

Model ima šest varijabli stanja, od kojih svaku treba specificirati kako bi se riješio sustav jednadžbi ODE. Početno stanje koje odgovara 1. šaržnom testu prikazano je u tablici 5.3.

2. korak Odabrati mjerenja i podskup parametara za procjenu parametara.

Koristili smo podatke prikupljene iz 1. šaržnog testa koji uključuje mjerenja amonija, nitrita i otopljenog kisika. Zbog suzbijanja aktivnosti NOO, ne opaža se proizvodnja nitrata. Budući da 1. šaržni test nije osmišljen za procjenu koeficijenta brzine raspadanja, sve parametre AOO osim bAOO razmatramo za procjenu. Prema tome, naš je odabir sljedeći:

• Y = [NH4 NO2 DO]; odabrani skup mjerenja, Y. • θ = [YAOO µmax

AOO Ks,AOO Ko,AOO]; podskup parametara za procjenu.

3. korak Riješiti problem procjene parametara.

Procjena parametara je programirana kao minimizacijski problem koji koristi zbroj kvadratnih pogrešaka kao funkciju troškova i koji se rješava pomoću neograničenog nelinearnog optimizacijskog alata

Page 17: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

OBRADA PODATAKA I PROCJENA PARAMETARA 217

(fminsearch algoritam u Matlabu) koristeći početnu vrijednost parametra navedenu u tablici 5.2 i početna stanja u tablici 5.3. Kako bi se simuliralo dodavanje

inhibitora, u simulacijama modela pretpostavlja se da je maksimalna brzina rasta NOO nula. Najbolje procjene procjenitelja parametara navedene su u tablici 5.3.

Tablica 5.2 Nominalne vrijednosti modeliranih parametara korištene kao početna vrijednost za procjenu parametara zajedno s njihovom gornjom i donjom granicom.

Parametar Simbol Jedinica Nominalna vrijednost RasponOrganizmi koji oksidiraju amonij (AOO) Prinos biomase YAOO mg COD mg N-1 0.15 0.11 - 0.21Maksimalna brzina rasta μmax

AOO d-1 0.8 0.50 - 2.10Afinitet prema supstratu (NH4) Ks,AOO mg N L-1 0.4 0.14 - 1.00Afinitet prema kisiku Ko,AOO mg O2 L-1 0.5 0.10 - 1.45Koeficijent brzine raspadanja bAOO d-1 0.1 0.07 - 0.30Organizmi koji oksidiraju nitrit (NOO) Prinos biomase YNOO mg COD mg N-1 0.05 0.03 - 0.09Maksimalna brzina rasta μmax

NOO d-1 0.5 0.40 - 1.05Afinitet prema supstratu (NO2) Ks,NOO mg N-1 1.5 0.10 - 3.00Afinitet prema kisiku Ko,NOO mg O2 L-1 1.45 0.30 - 1.50Koeficijent brzine raspadanja bNOO d-1 0.12 0.08 - 0.20Eksperimentalna struktura Maseni prijenos kisika kLa d-1 360 *Zasićenje kisikom SO,sat mg O2 L-1 8 *

* Ne procjenjuje se u ovom primjeru ali se pretpostavlja kao poznat.

Tablica 5.3 Početno stanje varijabli stanja za model u 1. šaržnom testu.

Varijabla Simbol Jedinica Početna vrijednost Komentar Amonij SNH mg N L-1 20 Dodavanje odjednom Kisik SO mg O2 L-1 8 Zasićenje Nitrit SNO2 mg N L-1 0 Naknadno denitrificiran Nitrat SNO3 mg N L-1 0 Naknadno denitrificiran Biomasa AOO XAOO mg COD L-1 75 Omjer AOO naprema NOO odražava omjer

njihovih prinosa Biomasa NOO XNOO m COD L-1 25

Slika 5.2 Podaci prikupljeni u 1. šaržnom testu. NH4, NO2 i DO se koriste kao skup mjerenih podataka.

0,00

5

1,2 2,4 3,6 1,2 2,4 3,6

NH

4+ -N

, N

O3- -

N,

NO

2- -N

(m

g N

L-1)

10

15

20

25

Vrijeme (h)0,0

3

0

4

2

1

5

6

7

8

9

Vrijeme (h)

DO

(m

g O

2L-1

)

NH4+-N

NO2--N

NO3--N

Page 18: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

218 EKSPERIMENTALNE METODE U OBRADI OTPADNIH VODA

%%step 3 define and solve parameter estimation problem (as a minimization problem) options =optimset('display', 'iter','tolfun',1.0e-06, 'tolx',1.0e-5, 'maxfunevals', 1000); [pmin,sse]=fminsearch(@costf,pinit,options,td,yd,idx,iy);

4. korak Procijeniti nesigurnost procjenitelja parametara i nesigurnost modeliranog predviđanja.

U ovom koraku se izračunava matrica kovarijance procjenitelja parametara. Iz matrice kovarijance se dobivaju standardna devijacija, 95 %-tni interval pouzdanosti kao i korelacijska matrica. Rezultati su prikazani u tablici 5.4.

Tablica 5.4 Optimalne vrijednosti procjenitelja parametara nakon rješavanja problema procjene parametara.

Parametar Početna vrijednost, θ° Optimalne vrijednosti, θ YAOO 0,1 0,15 μmax

AOO 0,8 1,45 Ks,AOO 0,4 0,50 Ko,AOO 0,5 0,69

%% get the Jacobian matrix. use built-in "lsqnonlin.m" but with no iteration. options =optimset('display', 'iter','tolfun',1.0e-06, 'tolx',1.0e-5, 'maxfunevals', 0); [~,~,residual,~,~,~,jacobian]=lsqnonlin(@costl,pmin,[],[],options,td,yd,idx,iy); j(:,:)=jacobian; e=residual; s=e'*e/dof; %variance of errors %% calculate the covariance of parameter estimators pcov = s*inv(j'*j) ; %covariance of parameters psigma=sqrt(diag(pcov))'; % standard deviation parameters pcor = pcov ./ [psigma'*psigma]; % correlation matrix alfa=0.025; % significance level tcr=tinv((1-alfa),dof); % critical t-dist value at alfa p95 =[pmin-psigma*tcr; pmin+psigma*tcr]; %+-95% confidence intervals

Tablica 5.5 Kvaliteta procjene parametara za proces oksidacije amonija: standardna devijacija, 95%-tni intervali pouzdanosti i korelacijska matrica.

Parametar Optimalna vrijednost, θ

Standardna devijacija,

95 %-tni interval pouzdanosti (CI) Korelacijska matrica

YAOO μmaxAOO Ks,AOO Ko,AOO

YAOO 0,15 0,0076 0,130 0,160 1 0,96 0,0520 0,17 μmax

AOO 1,45 0,0810 1,290 1,610 1 0,0083 0,42 Ks,AOO 0,50 0,0180 0,470 0,540 1 -0,26 Ko,AOO 0,69 0,0590 0,570 0,800 1

Pomoću matrice kovarijance procjenitelja parametara izračunava se i nesigurnost u modelirano predviđanje, a rezultati su prikazani na slici 5.3.

%% calculate confidence intervals on the model output ycov = j * pcov * j'; ysigma=sqrt(diag(ycov)); % std of model outputs ys=reshape(ysigma,n,m); y95 = [y(:,iy) - ys*tcr y(:,iy)+ys*tcr]; % 95% confidence intervals

Page 19: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

OBRADA PODATAKA I PROCJENA PARAMETARA 219

Slika 5.3 Ishodi modela uključujući 95 %-tne intervale pouzdanosti izračunate pomoću linearne propagacije pogreške (crvene linije). Rezultati se uspoređuju sa skupom eksperimentalnih podataka.

5. korak Pregledati i analizirati rezultate.

Utvrđeno je da su procijenjene vrijednosti parametara (tablica 5.5) unutar raspona navedenog u literaturi. To ukazuje na to da su vrijednosti parametara vjerodostojne. Nesigurnost ovih procjenitelja parametara je prilično niska. Na primjer, relativna pogreška (npr. standardna devijacija/srednja vrijednost vrijednosti parametara) je manja od 10 %, što se odražava i u malom intervalu pouzdanosti. To ukazuje na dobru kvalitetu procjene parametara. Obično se navodi da relativna pogreška veća od 50 % ukazuje na lošu kvalitetu, dok je relativna pogreška manja od 10 % dobra.

Vezano uz korelacijsku matricu, obično iz procjenjivanja parametara iz šaržnih podataka za modele tipa Monod, prirast je u značajnoj korelaciji s maksimalnom brzinom rasta (linearni korelacijski koeficijent iznosi 0,96). Također je primjetna korelacija između maksimalne brzine rasta i konstante afiniteta prema kisiku. To znači da nije moguća jedinstvena procjena prirasta i maksimalne brzine rasta. Daljnje istraživanje korelacije zahtijeva analizu osjetljivosti, koja je pokazana u primjeru 5.5.

Budući da je nesigurnost procjene parametara niska, nesigurnost u modelirana predviđanja je također niska. Na slici 5.3, srednje (ili prosječno) modelirano predviđanje i 95 %-tna gornja i donja granica su prilično

blizu jedno drugom. To znači da je nesigurnost modeliranog predviđanja zbog nesigurnosti procjene parametara zanemariva. Primjetno je da će sveobuhvatna analiza nesigurnosti modeliranih predviđanja zahtijevati analizu svih drugih izvora nesigurnosti uključujući ostale modelirane parametre kao i početna stanja. Međutim, to je izvan opsega ovog primjera i može se pronaći u drugim izvorima (Sin i sur., 2010). Nesigurnost pogreške mjerenja razmatra se u primjeru 5.6.

Ovime završava analiza procjene parametara pomoću nelinearne metode najmanjih kvadrata za parametre AOO.

Dio 2. Procijeniti parametre za korak NOO.

1. i 2. korak Početna stanja i odabir podataka i podskupova parametara za procjenu parametara.

U 2. šaržnom testu koristi se isto početno stanje kao za 1. šaržni test ali bez dodavanja inhibitora, što znači da je u ovom primjeru nitratacija aktivna. Podaci prikupljeni iz 2. šaržnog testa prikazani su na slici 5.3, što uključuje mjerenja amonija, nitrita, nitrata i DO.

• Y2 = [NH4 NO2 NO3 DO]; odabrani skup mjerenja, Y.

0

2

0

4

1,2 2,4 3,6 1,2 2,4 3,6 1,2 2,4 3,6

6

8

12

14

16

18

10

20

NH

4+ -N

(m

gN/L

)

Vrijeme (h)

3

2

4

6

7

8

5

Vrijeme (h)0

2

0

4

6

8

12

14

16

18

10

20

Vrijeme (h)

NO

2- -N

(m

gN/L

)

DO

(m

gO2/

L)

Page 20: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

220 EKSPERIMENTALNE METODE U OBRADI OTPADNIH VODA

Parametarske vrijednosti AOO su podešene prema procijenjenim vrijednostima (tablica 5.4) u prvom dijelu pa su prema tome poznate, dok se prinos i kinetički parametri NOO mogu identificirati iz podataka:

• θ2 = [YNOO µmaxNOO Ks,NOO Ko,NOO]; podskup

parametara za procjenu.

Slika 5.4 Izmjereni podaci iz 2. šaržnog testa.

3. i 4. korak Riješiti problem procjene parametara i izračunati nesigurnosti procjene parametara.

Parametri AOO su prethodno procijenjeni u 1. dijelu. Rezultati rješavanja problema procjene parametara kao i

nesigurnosti parametara za NOO prikazani su u tablici 5.6.

Tablica 5.6 Optimalne vrijednosti procjenitelja parametara nakon rješavanja problema procjene parametara.

Parametar Optimalne vrijednosti, θ Standardna devijacija, 95 %-tni interval pouzdanosti (CI) Korelacijska matrica Donja granica Gornja granica YNOO μmax

NOO Ks,NOO Ko,NOO

YNOO 0.04 0.01 0.01 0.07 1.00 1.00 0.54 -0.86μmax

NOO 0.41 0.13 0.15 0.66 1.00 0.55 -0.86Ks,NOO 1.48 0.03 1.42 1.55 1.00 -0.37Ko,NOO 1.50 0.05 1.39 1.60 1.00

Linearna propagacija pogreške procjene parametara (matrica kovarijance) do nesigurnosti modeliranog predviđanja prikazana je na slici 5.5.

00

5

1,2 2,4 3,6 4,8 1,2 2,4 3,6 4,8

NH

4+ -N

, N

O3- -

N,

NO

2- -N

(m

g N

L-1)

10

15

20

NH4+-N

NO2--N

NO3--N

Vrijeme (h)0

3

2

4

5

6

7

8

O2

Vrijeme (h)

DO

(m

g O

2L-1

)

Page 21: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

OBRADA PODATAKA I PROCJENA PARAMETARA 221

Slika 5.5 Ishodi modela uključujući 95 %-tne intervale pouzdanosti u usporedbi sa skupom eksperimentalnih podataka.

5. korak Pregledati i analizirati rezultate

Procijenjene vrijednosti parametara su unutar raspona za parametre NOO navedenog u literaturi, što ih čini vjerodostojnima. Međutim, ovoga puta pogreška procjene parametara je osjetno veća, npr. relativna pogreška (omjer standardne devijacije prema optimalnoj vrijednosti parametra) je veća od 30 %, naročito za prinos i maksimalnu brzinu rasta. To nije iznenađujuće budući da su procjena i prinosa i maksimalne brzine rasta u potpunosti u korelaciji (paralelni linearni korelacijski koeficijent iznosi 1). Ti statistički podaci znače da s ovim šaržnim eksperimentom nije moguća jedinstvena procjena parametara za prinos, maksimalnu brzinu rasta i koeficijent polu-zasićenja kisikom za NOO (paralelni linearni korelacijski koeficijent iznosi 0,86). Prema tome, ovaj podskup parametara bi trebalo promatrati kao podskup koji daje dobru prilagodbu eksperimentalnim podacima, dok pojedinačno svaka parametarska vrijednost ne mora imati razumno/fizičko značenje.

Propagacija matrice kovarijance parametara do nesigurnosti modeliranog predviđanja ukazuje na malu nesigurnost ishoda modela. To znači da, premda sami parametri nisu jedinstveno raspoznatljivi, ipak ih se može koristiti za predviđanje modeliranjem, npr. za

opisivanje podataka šaržnog testa. Međutim, prilikom izvođenja simulacija pomoću modela, treba prijaviti i 95 %-tne intervale pouzdanosti simuliranih vrijednosti. Ovo potonje odražava kako kovarijanca procjena parametara (koja ukazuje na kvalitetu procjene parametara) djeluje na kvalitetu modeliranog predviđanja. Na primjer, ako je 95 %-tni interval pouzdanosti modeliranih predviđanja nizak, onda je učinak pogreške procjene parametara zanemariv.

1. dio i 2. dio zaključuju procjenu parametara za nitrifikaciju u dva koraka. Rezultati pokazuju da je kvaliteta procjene parametara za AOO relativno viša od one za NOO pomoću šaržnih podataka za ove eksperimente. Ova slaba raspoznatljivost će se kasnije istražiti pomoću analize osjetljivosti kako bi se poboljšala raspoznatljivost pojedinih parametara modela.

Vezano uz pogreške modeliranog predviđanja, 95 %-tni interval pouzdanosti ishoda modela je prilično nizak. To znači da su učinci pogrešaka procjene parametara na ishode modela niski.

0,00

1,2 2,4 3,6 4,8 1,2 2,4 3,6 4,8

Nit

rat

(mg

NL

)

10

20

NH4+-N NO2

--N

NO3--N DO

Vrijeme (h)

0,00

1,2 2,4 3,6 4,8

Am

onij

(m

g N

L )

10

20

Vrijeme (h)0,0

01,2 2,4 3,6 4,8

Nit

rit

(mg

NL

)

10

20

Vrijeme (h)

0,02

4

6

8

Vrijeme (h)

DO

(m

g O

2L

)

-1-1 -1

-1

Page 22: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

222 EKSPERIMENTALNE METODE U OBRADI OTPADNIH VODA

Primjer 5.4 Procijeniti parametre oksidacije amonija pomoću podataka iz šaržnog testa – metoda bootstrap

U ovom primjeru istražujemo problem procjene parametara u 1. dijelu primjera 5.3. Za procjenu parametara AOO koristili smo podatke iz 1. šaržnog testa.

1. korak Napraviti procjenu referentnih parametara pomoću metode nelinearnih najmanjih kvadrata.

Tijek rada u ovom koraku je potpuno jednak 1., 2. i 3. koraku u primjeru 5.3. Ishod ovog koraka je najbolja prilagodba podacima i distribucija rezidualnih odstupanja (slika 5.6).

Slika 5.6 Rezidualna odstupanja iz procjene referentnih parametara.

2. korak Generirati sintetičke podatke bootstrap uzorkovanjem i ponoviti procjenu parametara.

U ovom koraku se provodi bootstrap uzorkovanje iz rezidualnih odstupanja.

nboot=50; % bootstrap samples for i=1:nboot disp(['the iteration number is : ',num2str(i)]) onesam =ceil(n*rand(n,m)); % random sampling with replacement rsam =res(onesam); % measurement errors for each variable

ybt = y(:,iy) + rsam ; % synthetic data: error + model (ref PE) options =optimset('display','iter','tolfun',1.0e-06,'tolx',1.0e-5,'maxfunevals',1000); [pmin(i,:),sse(i,:)]=lsqnonlin(@costl,pmin1,plo,phi,options,td,ybt,idx,iy); bootsam(:,:,i)=ybt; % record samples end

Izabire se pedeset bootstrap uzoraka iz rezidualnih odstupanja (slučajni uzorak s ponavljanjem) i dodaje modelu, čime se dobiva 50 skupova sintetičkih podataka mjerenja prikazanih na slici 5.7.

Kisik

50-0.2

0.2

0.0

10 15 20 25 30 35Indeks podataka

Resi

dual

na o

dstu

panj

a

Nitrit

50-0.2

0.2

0.0

10 15 20 25 30 35

Resi

dual

na o

dstu

panj

a

Amonij

50-0.2

0.2

0.0

10 15 20 25 30 35

Resi

dual

na o

dstu

panj

a

Page 23: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

OBRADA PODATAKA I PROCJENA PARAMETARA 223

Slika 5.7 Generiranje sintetičkih podataka pomoću bootstrap uzorkovanja iz rezidualnih odstupanja (ukupno 50 uzoraka).

Za svaki takav sintetički podatak (bootstrap uzorak), provodi se procjena parametara i bilježe se rezultati za analizu. Budući da se generira 50 skupova sintetičkih

podataka, to znači da se dobiva 50 različitih procjena parametara. Rezultati su prikazani kao histogram za svaku procjenu parametra na slici 5.8.

Slika 5.8 Distribucija procjena parametara dobivena pomoću bootstrap metode (svaka distribucija sadrži 50 procijenjenih vrijednosti za svaki parametar).

0,020,000

10

5

0,04 0,06 0,08 0,10 1,20

0,02 0,04 0,06 0,08 0,10 1,20

0,02 0,04 0,06 0,08 0,10 1,20

Kisi

k (m

gO

2 L-1

)

0,000

20

10

Nit

rat

(mg

N L

-1)

0,000

20

10A

mon

ij (

mg

N L

-1)

0,450

0,47 0,5 0,52 0,55 0,60 0,70 0,80 0,90

Vrij

edno

st

10

20

0,120

0,140,13 0,15 0,16 0,17 0,18

Vrij

edno

st

10

20

1,00

1,2 1,4 1,61,31,1 1,5 1,7 1,8

Vrij

edno

st

10

20

30

0,502

5

10

15

Distribucija od KS,AOB

Distribucija od YAOB

Distribucija od KO,AOB

Distribucija od µmaxAOB

0,65 0,75 0,850,55

Vrij

edno

st

Page 24: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

224 EKSPERIMENTALNE METODE U OBRADI OTPADNIH VODA

3. korak Pregledati i analizirati rezultate.

2. korak je dao matricu procjena parametara, θ50x4. U ovom koraku se ocjenjuje sredina, standardna devijacija i svojstva korelacijske matrice. Rezultati su prikazani u tablici 5.7.

.%step 3 Evaluate/interpret distribution of theta disp('The mean of distribution of theta are') disp(mean(pmin)) disp('The std.dev. of distribution of theta are') disp(std(pmin)) disp('') disp('The correlation of parameters') disp(corr(pmin))

Tablica 5.7 Optimalne vrijednosti procjenitelja parametara nakon rješavanja problema procjene parametara.

Parametar Optimalna vrijednost, θ Standardna devijacija, Korelacijska matrica YAOO μmax

AOO Ks,AOO Ko,AOO YAOO 0.14 0.01 1.00 0.97 -0.03 0.20 μmax

AOO 1.40 0.11 1.00 -0.07 0.41 Ks,AOO 0.50 0.02 1.00 -0.28 Ko,AOO 0.68 0.07 1.00

Svi rezultati, uključujući procjene srednje vrijednosti

parametara, njihovu standardnu devijaciju i korelacijsku matricu dobro se slažu s procjenama parametara dobivenima iz nelinearne metode najmanjih kvadrata (usporedi s tablicom 5.6.). To je očekivano, budući da je distribucija rezidualnih odstupanja prilično slična normalnoj distribuciji (slika 5.6). U ovom slučaju, i nelinearnom metodom najmanjih kvadrata (i linearnom aproksimacijom procjene matrice kovarijance) kao i bootstrap metodom dobit će se statistički slični rezultati.

I modelirana simulacija sa srednjim vrijednostima dobivenima iz bootstrap uzoraka dala je sličnu dobru prilagodbu izmjerenim podacima, kako je prikazano na slici 5.3.

Budući da je bootstrap metoda intuitivno jednostavna i lagana i ne zahtijeva izračun Jacobijeve matrice, preporučujemo je za korištenje u praksi, no uz jednu ogradu: distribuciju rezidualnih odstupanja trebalo bi pregledati i ne bi trebala sadržavati nikakav sustavni obrazac (koji bi ukazivao na probleme u strukturi modela ili sustavne probleme u mjerenju).

%% get the Jacobian matrix. use built-in "lsqnonlin.m" but with no iteration. options =optimset('display', 'iter','tolfun',1.0e-06, 'tolx',1.0e-5, 'maxfunevals', 0);

[~,~,residual,~,~,~,jacobian]=lsqnonlin(@costl,pmin,[],[],options,td,yd,idx,iy); j(:,:)=jacobian; e=residual; s=e'*e/dof; %variance of errors %% calculate the covariance of parameter estimators pcov = s*inv(j'*j) ; %covariance of parameters psigma=sqrt(diag(pcov))'; % standard deviation parameters pcor = pcov ./ [psigma'*psigma]; % correlation matrix alfa=0.025; % significance level tcr=tinv((1-alfa),dof); % critical t-dist value at alfa p95 =[pmin-psigma*tcr; pmin+psigma*tcr]; %+-95% confidence intervals

Primjer 5.5 Analiza osjetljivosti i raspoznatljivosti parametara procesa oksidacije amonija u šaržnim testovima

Ovdje se proces oksidacije amonija koristi kako je opisano u Primjer 5.3. Cilj ovog primjera je dvojak: u prvom dijelu želimo ocijeniti osjetljivost svih parametara AOO na sve ishode modela u eksperimentalnim uvjetima 1. šaržnog testa. U drugom dijelu želimo ispitati, uz zadan skup izmjerenih podataka, koji podskupovi parametara su potencijalno raspoznatljivi i usporediti ih s podskupom parametara koji se već koristio u procjeni parametara u primjeru 5.3.

Page 25: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

OBRADA PODATAKA I PROCJENA PARAMETARA 225

1. korak Pokretanje. Koristimo početna stanja 1. šaržnog testa opisana u tablici 5.3, kao i nominalne vrijednosti modeliranih parametara AOO navedene u tablici 5.2.

Ishodi modela od interesa:

• y = [NH4 NO2 NO3 DO AOO NOO]

Skup parametara od interesa:

• θ = [YAOO µmaxAOO Ks,AOO Ko,AOO bAOO]

2. korak Izračunati i analizirati funkcije osjetljivosti.

U ovom koraku, apsolutne funkcije osjetljivosti se izračunavaju pomoću numeričke diferencijacije, a rezultati se bilježe za analizu.

for i=1:m; %for each parameter dp(i) = pert(i) * abs(ps(i)); % parameter perturbation p(i) = ps(i) + dp(i); % forward perturbation [t1,y1] = ode45(@nitmod,td,x0,options,p); p(i) = ps(i) - dp(i); %backward perturbation [t2,y2] = ode45(@nitmod,td,x0,options,p); dydpc(:,:,i) = (y1-y2) ./ (2 * dp(i)); %central difference dydpf(:,:,i) = (y1-y) ./ dp(i); %forward difference dydpb(:,:,i) = (y-y2) ./ dp(i); %backward difference p(i)=ps(i); % reset parameter to its reference value end

Funkcije osjetljivosti ishoda (apsolutne) grafički su prikazane na slici 5.9 za jedan parametar, odnosno prirast AOO za potrebe detaljnog proučavanja. Tumačenje funkcije osjetljivosti je sljedeće: (i) veća magnituda (bilo pozitivna ili negativna) znači veći utjecaj, dok manja ili gotovo nikakva magnituda znači zanemariv/nulti utjecaj parametra na ishod, (ii) negativna osjetljivost znači da bi se povećavanjem parametarske vrijednosti smanjio ishod modela, a (iii) pozitivna osjetljivost znači da bi se povećavanjem parametarske vrijednosti povećao ishod modela. Imajući to na umu, primjetno je da prinos AOO ima pozitivni učinak na amonij i jednako negativan utjecaj na nitrit. To se očekuje od strukture modela gdje postoji inverzni odnos između prinosa i potrošnje amonija (supstrata). Veći prinos znači da se po jedinici rasta

biomase potroši manje amonija, što bi ujedno značilo i više amonija prisutnog u šaržnom testu. Budući da se troši manje amonija, proizvelo bi se manje nitrita (otuda negativna korelacija).

S druge strane, primjetno je i da osjetljivost parametara prinosa postupno raste tijekom faze linearnog rasta i počinje opadati što smo bliže iscrpljivanju amonija. Kada se amonij iscrpi, osjetljivost kako se i očekuje postaje nulta. Prema predviđanju, prinos ima pozitivan utjecaj na rast AOO budući da veći prinos znači veću proizvodnju biomase. Vezano uz kisik, prinos prvo ima pozitivan utjecaj koji postaje negativan kako se bliži iscrpljivanje amonija. To znači da postoji prilično nelinearan odnos između profila kisika i parametra prinosa. Prema očekivanju, prinos AOO nema utjecaj na ishode nitrata i NOO u 1. šaržnom testu zbog dodavanja inhibitora koji je uspješno suzbio drugi korak nitrifikacije.

U analizi osjetljivosti, korisno je međusobno usporediti funkcije osjetljivosti. To je napravljeno na slici 5.10 pomoću bezdimenzionalnih funkcija osjetljivosti, koje su dobivene crtanjem funkcije apsolutne osjetljivosti s nominalnim vrijednostima parametara i ishoda (jedn. 5.41). Na slici 5.10 grafički je prikazana osjetljivost svih modeliranih parametara u odnosu na šest ishoda modela. Svaki od grafova na slici predstavlja funkcije osjetljivosti svih parametara u odnosu na jedan ishod modela prikazan u tumaču. Os y označava bezdimenzionalnu mjeru osjetljivosti, dok os x označava vrijeme tijekom aktivnosti u šaržnom pokusu. Na primjer, opažamo da je osjetljivost parametara na nitrat i NOO nula. To ima smisla budući da se u ovoj simulaciji pretpostavlja da je aktivnost NOO nula.

Za ishode modela za amonij, nitrit i kisik, funkcije osjetljivosti prinosa i maksimalne stope rasta za AOO slijede obrnuto proporcionalni trend/obrazac. Ovaj obrnuto proporcionalni odnos je razlog zašto je problem procjene parametara loše uvjetovan problem. To znači da ako pretražni algoritam poveća prinos, ali u isto vrijeme smanji maksimalnu brzinu rasta za određenu frakciju, učinak na ishod modela bi se mogao poništiti. Rezultat je taj da mnoge kombinacije parametarskih vrijednosti za prinos i maksimalnu brzinu rasta mogu imati sličan učinak na ishod modela. To je razlog zašto se dobije visoki koeficijent korelacije nakon što se provede procjena parametara. To znači da, kako bi neki parametar bio jedinstveno raspoznatljiv, njegova funkcija osjetljivosti bi trebala biti jedinstvena i ne u korelaciji s funkcijom osjetljivosti ostalih parametara.

Page 26: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

226 EKSPERIMENTALNE METODE U OBRADI OTPADNIH VODA

Slika 5.9 Apsolutna osjetljivost prinosa AOO u svim ishodima modela.

Druga stvar vezana uz ove grafove jest to da je relativni učinak (odnosno, magnituda vrijednosti na osi y) parametara na amonij, kisik i nitrit prilično sličan. To znači da su sve te tri varijable jednako relevantne i važne za procjenjivanje tih parametara.

3. korak Rangiranje značajnosti parametara.

U ovom koraku se značajnost parametara rangira svođenjem bezdimenzionalnih funkcija osjetljivosti parametara na ishod modela pomoću mjere δmsqr. Rezultati su prikazani na slici 5.11.

Rezultati pokazuju da brzina raspadanja AOO nema gotovo nikakav učinak na tri mjerene varijable (amonij, nitrit i kisik), zbog čega je se ne može procijeniti. To se zna iz procesnog inženjerstva i zbog toga se kratkotrajni šaržni testovi ne koriste za određivanje konstanti raspadanja. Ovaj rezultat je dakle potvrda ispravnosti analize osjetljivosti. Vezano uz maksimalnu brzinu rasta i prinos, ovi parametri su jednako važni, nakon čega slijedi konstanta afiniteta za kisik i amonij. To ukazuje na to da se najmanje četiri parametra potencijalno mogu procijeniti iz skupa podataka.

0,0

20

0

40

60

80

100

1,2 2,4 3,6 1,2 2,4 3,6 1,2 2,4 3,6

dNH

4/dY

AOB

dNO

2/dY

AOB

dNO

3/dY

AOB

Vrijeme (h)

-0,5

-1,0

0,0

0,5

1,0

Vrijeme (h)0,0

-80

-100

-60

-40

-20

0

20Amonij Nitrit Nitrat

Kisik AOB NOB

Vrijeme (h)

0,0

-100

-150

-50

0

50

1,2 2,4 3,6 1,2 2,4 3,6 1,2 2,4 3,6

dO2/

dYAO

B

dAO

B/dY

AOB

dNO

B/dY

AOB

Vrijeme (h)

-0,5

-1,0

0,0

0,5

1,0

Vrijeme (h)0,0

0

15

0

15

20

Vrijeme (h)

0,0

0,0

Page 27: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

OBRADA PODATAKA I PROCJENA PARAMETARA 227

Slika 5.10 Funkcije relativne osjetljivosti parametara AOO na ishodima modela.

5. korak Analiza raspoznatljivosti.

U ovom koraku se normalizirane funkcije osjetljivosti koriste za procjenu koji podskupovi parametara imaju mali indeks kolinearnosti. Indeks kolinearnosti je mjera toga kako su dvije funkcije osjetljivosti usklađene, što podrazumijeva linearnu ovisnost.

for i = 2:subset combos = combnk(set,i); % all possible parameter combinations of different subset size (2,3,4...) for j=1:n tempn = snormy(:,combos(j,:)) ; tempa = say(:,combos(j,:)) ; nsm = tempn'*tempn; % normalized sensitivity matrix asm = tempa'*tempa; % absolute sensitivity matrix, fim

dtm = sqrt(det(asm))^(1/(i*2)); %determinant index col = 1/sqrt(min(eig(nsm))); % collinearity index subs(j,:) = [k i col dtm] ; end end

Analiza raspoznatljivosti ukazuje na to da postoji 26 različitih kombinacija podskupova parametara koji se potencijalno mogu koristiti za procjenu parametara pomoću mjerenja amonija, nitrita i kisika (tablica 5.8). Vrijednost indeksa kolinearnosti je promijenjena s 1,2 na 53 i općenito ima tendenciju rasta za veće podskupove parametara. Podskup parametara K#21 je onaj korišten u gornjoj procjeni parametara (vidi primjere 5.3 i 5.4). Ovaj podskup ima indeks kolinearnosti od 45, što je puno više od tipično razmatranih graničnih vrijednosti od 5-15 kako bi se podskup smatrao praktično raspoznatljivim

0.0

-10

-15

-5

0

5

10

15

1.2 2.4 3.6 1.2 2.4 3.6 1.2 2.4 3.6

dy/dθ

dy/dθ

dy/dθ

Vrijeme (h)

-0.5

-1.0

0.0

0.5

1.0

Vrijeme (h)0.0

-10

-15

-5

0

5

1015Amonij Nitrit Nitrat

Kisik AOB NOB

Vrijeme (h)

0.0

-10

-20

0

10

20

1.2 2.4 3.6 1.2 2.4 3.6 1.2 2.4 3.6

dy/dθ

dy/dθ

dy/dθ

Vrijeme (h)

-0.5

-1.0

0.0

0.5

1.0

Vrijeme (h)0

-1

2

1

0

3

Vrijeme (h)

YAOB μmaxAOB KsAOB KoAOBbAOB

0.0

0.0

Page 28: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

228 EKSPERIMENTALNE METODE U OBRADI OTPADNIH VODA

(Brun i sur., 2002; Sin i sur., 2010). Kako je ovdje prikazano, analizom bi se dijagnosticirao problem prije

provođenja procjene parametara (PE), što bi ukazalo da ovaj podskup nije prikladan za procjenu.

Slika 5.2 Rangiranje značajnosti parametara AOO u odnosu na ishode modela.

Međutim, budući da osjetljivost bAOO nije imala utjecaj na ishode (vidi 3. korak), bilo koji podskup koji sadrži ovaj parametar ne bi bio preporučen za procjenu parametara. Ipak, ostaje mnogo podskupova koji zadovoljavaju graničnu vrijednost od 5-15 za γK koji se mogu razmatrati za problem procjene parametara. Podskupovi parametara osjenčani u tablici 5.8 ispunjavaju te kriterije raspoznatljivosti, tako da se mogu koristiti za procjenu parametara. Najbolja praksa je započeti s podskupom parametara s najvećom veličinom (parametara) i najnižim γK. Uzimanjem u obzir osjetljivosti i indeksa kolinearnosti podskupova parametara lakše se izbjegava loše uvjetovan problem procjene parametara i poboljšava kvaliteta procjena parametara.

Primjer 5.6 Procijeniti nesigurnost modeliranog predviđanja modela nitrifikacije – metoda Monte Carlo

U ovom primjeru želimo propagirati nesigurnosti parametara koje proizlaze iz procjene parametara (npr. Primjer 5.3 i Primjer 5.4) na nesigurnost ishoda modela pomoću metode Monte Carlo.

Za analizu nesigurnosti, problem se definira na sljedeći način: (i) razmatra se jedino nesigurnost u procijenjene parametre AOO, (ii) u obzir se uzimaju eksperimentalni uvjeti 1. šaržnog testa (tablica 5.3) i (iii) model u tablici 5.1 se koristi za opis sustava i nominalne vrijednosti parametara u tablici 5.2.

10

4

2 3 4 5Rank značajnosti

AOB

δmsq

r

KsAOBKoAOB

YAOB

bAOBμmaxAOB

0

4Kisik

δmsq

r

KsAOB

KoAOB

YAOB

bAOB

μmaxAOB

0

5Nitrit

δmsq

r

KsAOB

KoAOB

YAOB

bAOB

μmaxAOB

0

5Amonij

δmsq

r

KsAOB

KoAOB

YAOB

bAOB

μmaxAOB

Page 29: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

OBRADA PODATAKA I PROCJENA PARAMETARA 229

Tablica 5.8 Izračun indeksa kolinearnosti za sve kombinacije parametara.

Podskup K Veličina podskupa Kombinacija parametara γK

1 2 Ko,AOO bAOO

1.32

2 2 Ks,AOO bAOO 1.26

3 2 Ks,AOO Ko,AOO

2.09

4 2 μmaxAOO bAOO

1.30

5 2 μmaxAOO Ko,AOO

13.92

6 2 μmaxAOO Ks,AOO

2.03

7 2 YAOO bAOO

1.28

8 2 YAOO Ko,AOO

12.55

9 2 YAOO Ks,AOO

2.02

10 2 YAOO μmaxAOO 42.93

11 3 Ks,AOO Ko,AOO bAOO 2.10

12 3 μmaxAOO Ko,AOO bAOO 14.05

13 3 μmaxAOO Ks,AOO bAOO 2.03

14 3 μmaxAOO Ks,AOO Ko,AOO 14.23

15 3 YAOO Ko,AOO bAOO 13.09

16 3 YAOO Ks,AOO bAOO 2.02

17 3 YAOO Ks,AOO Ko,AOO 12.89

18 3 YAOO μmaxAOO bAOO 51.25

19 3 YAOO μmaxAOO Ko,AOO 45.87

20 3 YAOO μmaxAOO Ks,AOO 43.37

21 4 YAOO μmaxAOO Ks,AOO Ko,AOO 45.91

22 4 YAOO μmaxAOO Ks,AOO bAOO 51.25

23 4 YAOO μmaxAOO Ko,AOO bAOO 53.01

24 4 YAOO Ks,AOO Ko,AOO bAOO

13.30

25 4 μmaxAOO Ks,AOO Ko,AOO bAOO

14.30

26 5 YAOO μmaxAOO Ks,AOO Ko,AOO bAOO 53.07

1. korak Unijeti definiciju nesigurnosti.

Kako je definirano u gornjoj definiciji problema, u obzir se uzimaju jedino nesigurnosti u procijenjene parametre AOO:

• θinput = [YAOO µmaxAOO Ks,AOO Ko,AOO].

Uzimaju se procjene srednje vrijednosti i standardne devijacije kakve su dobivene iz bootstrap metode zajedno s njihovom korelacijskom matricom (tablica 5.7). Nadalje, pretpostavlja se da ti parametri slijede normalnu distribuciju ili multivarijatnu normalnu distribuciju budući da imaju matricu kovarijance i

korelirani su. Ova pretpostavka se može provjeriti tako da se izračuna funkcija empirijske gustoće za svaki parametar pomoću matrice procjena parametara (θ50x4), a prikazana je na slici 5.12.

figure labels=['\theta_1';'\theta_2';'\theta_3';'\theta_4']; %or better the name of parameter for i=1:4 subplot(2,2,i) [f xi]=ksdensity(pmin(:,i)); plot(xi,f) xlabel(labels(i,:),'FontSize',fs,'FontWeight','bold') end

Page 30: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

230 EKSPERIMENTALNE METODE U OBRADI OTPADNIH VODA

Slika 5.12 Empirijske procjene gustoće vjerojatnosti za parametre AOO dobivene bootstrap metodom.

2. korak Uzorkovanje iz prostora ulaznih podataka

Budući da ulazni parametri imaju poznatu matricu kovarijance, svaka tehnika uzorkovanja to mora uzeti u obzir. U ovom primjeru, budući da su parametri definirani tako da slijede normalnu distribuciju, prostor nesigurnosti ulaznih podataka predstavlja multivarijatna normalna distribucija. Za uzorkovanje iz tog prostora koristi se tehnika slučajnog uzorkovanja:

%% do random sampling N= 100; %% sampling number mu=mean(pmin); %% mean values of parameters sigma=cov(pmin); %% covariance matrix (includes stand dev and correlation information) X = mvnrnd(mu,sigma,N); % sample parameter space using multivariate random sampling

Ishod ovog koraka je matrica uzorkovanja, XNxm, gdje je N broj uzorkovanja, a m je broj ulaznih podataka. Uzorkovane vrijednosti se mogu vidjeti pomoću grafikona matrice poput onog na slici 5.13. Na toj slici, koja je grafikon matrice, dijagonalni skupovi podataka su histogram parametarskih vrijednosti, dok nedijagonalni skupovi podataka pokazuju uzorkovane vrijednosti dva para parametara. U ovom slučaju

najvažnija opažanja su da (i) je prostor ulaznih parametara uzorkovan slučajno i da (ii) je u vrijednostima iz kojih je uzet uzorak sačuvana korelacijska struktura parametara.

3. korak Provesti simulacije Monte Carlo.

U ovom koraku N modelirane simulacije se provode pomoću matrice uzorkovanja iz 2. koraka (XNxm), a ishodi modela se bilježe u obliku matrice kako bi ih se obradilo u idućem koraku.

%%step 2 perform monte carlo simulations for each parameter value % Solution of the model initcond;options=odeset('RelTol',1e-7,'AbsTol',1e-8); for i=1:nboot disp(['the iteration number is : ',num2str(i)]) par(idx) = X(i,:) ; %read a sample from sampling matrix [t,y1] = ode45(@nitmod,td,x0,options,par); ; %solve the model y(:,:,i)=y1; %record the outputs end

0,400

0,45 0,50 0,55 0,60 1,0

Vrij

edno

st

10

20

0,100

0,12 0,160,15 1,2 1,61,40,18

Vrij

edno

st

20

10

30

40

1,00

1,8

Vri

jednost

1

3

2

4

0,40

2

4

6

Distribucija od θ3

Distribucija od θ1

Distribucija od θ4

Distribucija od θ2

0,6 0,8

Vrij

edno

st

15

5

Page 31: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

OBRADA PODATAKA I PROCJENA PARAMETARA 231

Slika 5.13 Grafički prikaz matrice uzorkovanja prostora ulaznih podataka, XNxm – multivarijatna tehnika slučajnog uzorkovanja s poznatom matricom kovarijance.

Slika 5.14 Simulacije Monte Carlo (N = 100) ishoda modela.

0,1 0,15 0,2

KoAO

B

0,8

0,6

1,0

YAOB

KSAO

B

0,5

0,4

0,6

µ max

AOB

1,5

1,0

2,0

Y AOB 0,15

0,10

0,20

1,0 1,5 2,0

µmaxAOB

0,4 0,5 0,6

KsAOB

0,6 0,8 1,0

KoOAOB

0,0

5

0

10

15

20

5

0

10

15

20

1,2 2,4 3,6 1,2 2,4 3,6

Vrijeme (h)

0,0

Vrijeme (h)

0,0

4

2

6

8

1,2 2,4 3,6 1,2 2,4 3,6

Vrijeme (h)

0,075

78

77

76

79

Vrijeme (h)

Am

onij

(m

g N

L-1)

K

isik

(m

g O

2

L-1 )

Nit

rit

(mg

NL-1

)A

OB

(mg

CO

DL-1

)

Page 32: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

232 EKSPERIMENTALNE METODE U OBRADI OTPADNIH VODA

4. korak Pregledati i analizirati rezultate.

U ovom koraku ishodi se prikazuju na grafikonu i rezultati se provjeravaju. Na slici 5.14 grafički su prikazani rezultati simulacija Monte Carlo za četiri ishoda modela.

Kako je prikazano na slici 5.15, srednja vrijednost, standardna devijacija i percentili (npr. 95 %) se mogu izračunati iz matrice ishoda. Rezultati ukazuju da se za izvore nesigurnosti koji se proučavaju, nesigurnost u

ishode modela može smatrati zanemarivom. Ti rezultati su u skladu s rezultatima linearne propagacije pogreške prikazanima na slici 5.5.

To znači da premda postoji nesigurnost u same procjene parametara, kad se podskup procijenjenih parametara koristi zajedno s njegovom matricom kovarijance, nesigurnost u modelom dobivenom predviđanju je niska. Za svaku primjenu ovih modeliranih parametara, trebalo bi ih koristiti zajedno kao skup, a ne pojedinačno.

Slika 5.15 Izračun sredine i 95 %-tnog percentila nesigurnosti ishoda modela.

Druga stvar koju treba napomenuti jest to da ocjenjivana nesigurnost ishoda ovisi o definiranoj nesigurnosti ulaznih podataka, kao i o okviru izbora uzorka, npr. početnom stanju eksperimentalne strukture. Na primjer, u gornjem primjeru nije razmatrana

nesigurnost mjerenja ili nesigurnost zbog ostalih fiksnih parametara (raspadanje) i početnog stanja (početna koncentracija autotrofnih bakterija). Zbog toga te rezultate treba tumačiti u kontekstu u kojem su generirani.

0,0

5

0

10

15

20

5

0

10

15

20

1,2 2,4 3,6 1,2 2,4 3,6

Vrijeme (h)

0,0

Vrijeme (h)

0,0

4

2

6

8

1,2 2,4 3,6 1,2 2,4 3,6

Vrijeme (h)

0,075

78

77

76

Vrijeme (h)

Am

onij

(m

g N

L-1)

Kisi

k (m

g O

2L-1

)

Nit

rit

(mg

N L

-1)

AO

B (m

g C

OD

L-1)

Page 33: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

OBRADA PODATAKA I PROCJENA PARAMETARA 233

5.5 DODATNA RAZMATRANJA

Najbolja praksa u procjeni parametara U praksi, premda pretpostavka asimptotske teorije daje razumne rezultate, često postoje odstupanja od pretpostavki. Konkretno:

• Pogreške mjerenja su često auto-korelirane, što znači da je previše opažanja redundantno i nije nezavisno (ne-nezavisno i identično distribuirane (iid) nasumične varijable). To dovodi do podcjenjivanja asimptotskih intervala pouzdanosti zbog manje varijance uzorka, σ2. Praktično rješenje ovog problema je da se provjeri funkcija autokorelacije rezidualnih odstupanja i filtrira ih se ili da se provede pod-uzorkovanje tako da se autokorelacija smanji u skupu podataka. Procjena parametara se nakon toga može ponoviti pomoću skupa podataka poduzoraka.

• Algoritmi procjene parametara mogu se zaustaviti na lokalnim minimumima, što dovodi do netočnog rezultata linearizacije (točka u kojoj su nelinearni najmanji kvadrati linearizirani). Kako bi se taj problem ublažio, procjenu parametara treba provesti nekoliko puta ili s različitim početnim vrijednostima, različitim pretražnim algoritmima i/ili analizom raspoznatljivosti.

Nakon toga je važno verificirati da je minimalno rješenje usklađeno s različitim algoritmima minimizacije.

Problem raspoznatljivost ili loše uvjetovanosti: Ne mogu se svi parametri točno procijeniti. Uzrok tome može biti preveliki interval pouzdanosti u usporedbi sa srednjom ili optimiranom vrijednosti procjenitelja parametara. Rješenje se sastoji u tome da se provede analiza raspoznatljivosti ili ponovno određivanje parametara modela, tako da treba procijeniti manji broj parametara.

I premda imamo robusne i opširne statističke teorije i metode relevantne za procjenu modeliranih parametara

kako je gore prikazano, definicija samog problema procjene parametara, koja se tiče toga koji su podaci dostupni, koja struktura modela je kandidat, te koja je polazna točka za parametarske vrijednosti, se uzima zdravo za gotovo. Zbog toga će kvalitetna analiza i definicija problema procjene parametara uvijek zahtijevati dobru tehničku prosudbu. Za robusnu procjenu parametara u praksi, zbog empirijske/eksperimentalne prirode definicije parametara, statističke metode (uključujući procjene MLE) bi trebalo tretirati u kontekstu/definiciji problema od interesa.

Po pitanju bootstrap uzorkovanja, najvažnije pitanje je predstavljaju li rezidualna odstupanja tipične pogreške mjerenja. Ovo pitanje je detaljnije obradio Efron (1979).

Najbolja praksa u analizi nesigurnosti Kad se provodi analiza nesigurnosti, najvažnije pitanje je okvir izbora uzorka i odgovarajuće definiranje izvora nesigurnosti ulaznih podataka. Prema tome, ishod analize nesigurnosti ne bi trebalo tretirati kao apsolutan, već ovisan o okviru analize. Detaljna rasprava o tim pitanjima dostupna je u drugoj literaturi (e.g. Sin i sur., 2009; Sin i sur., 2010).

Drugo važno pitanje je matrica kovarijance parametara (ili korelacijske matrice), koju bi trebalo dobiti tehnikom procjene parametara. Pretpostavka da je korelacijska matrica zanemariva može dovesti do precjenjivanja ili podcjenjivanja nesigurnosti ishoda modela. Prema tome, pri uzorkovanju bi trebalo definirati odgovarajuću korelacijsku matricu za ulazne podatke (npr. parametre) razmatrane za analizu.

Vezano uz broj uzorkovanja, potrebno ga je ponoviti nekoliko puta kako bi se vidjelo razlikuju li se rezultati od jedne iteracije do druge. Budući da je modele korištene za procjenu parametara relativno jednostavno numerički riješiti, preporučuje se da se koristi dovoljno velik broj iteracija, npr. 250 ili 500.

Reference Brun, R., Kühni, M., Siegrist, H., Gujer, W., Reichert, P. (2002).

Practical identifiability of ASM2d parameters - systematic selection and tuning of parameter subsets. Water Res. 36(16): 4113-4127.

Brun, R., Reichert, P., and Künsch, H. R. (2001). Practical identifiability analysis of large environmental simulation models. Water Resources Research, 37(4):1015-1030.

Bozkurt, H., Quaglia, A., Gernaey, K.V., Sin, G. (2015). A mathematical programming framework for early stage design of wastewater treatment plants. Environmental Modelling & Software, 64: 164-176.

Dochain, D., Vanrolleghem, P.A. (2001). Dynamical Modelling and Estimation in Wastewater Treatment Processes. London UK: IWA Publishing.

Efron, B. (1979). Bootstrap methods: another look at the jackknife. The Annals of Statistics, 7(1):1-26.

Page 34: 5 OBRADA PODATAKA I PROCJENA PARAMETARA · obrada podataka i procjena parametara 203

234 EKSPERIMENTALNE METODE U OBRADI OTPADNIH VODA

Gernaey, K.V., Jeppsson, U., Vanrolleghem, P.A., Copp, J.B. (Eds.). (2014). Benchmarking of control strategies for wastewater treatment plants. IWA Publishing.

Guisasola, A., Jubany, I., Baeza, J.A., Carrera, J., Lafuente, J. (2005). Respirometric estimation of the oxygen affinity constants for biological ammonium and nitrite oxidation. Journal of Chemical Technology and Biotechnology, 80(4): 388-396.

Heijnen, J.J. (1999). Bioenergetics of microbial growth. Encyclopaedia of Bioprocess Technology.

Henze, M., Gujer, W., Mino, T., van Loosdrecht, M.C.M., (2000). ASM2, ASM2d and ASM3. IWA Scientific and Technical Report, 9. London UK.

Ljung L. (1999). System identification - Theory for the user. 2nd edition. Prentice-Hall.

Mauricio-Iglesias, M., Vangsgaard, A.K., Gernaey, K.V., Smets, B.F., Sin, G. (2015). A novel control strategy for single-stage autotrophic nitrogen removal in SBR. Chemical Engineering Journal, 260: 64-73.

Meijer, S.C.F., Van Der Spoel, H., Susanti, S., Heijnen, J.J., van Loosdrecht, M.C.M. (2002). Error diagnostics and data reconciliation for activated sludge modelling using mass balances. Water Sci Tech. 45(6): 145-156.

Metropolis, N., Ulam, S. (1949). The Monte Carlo method. Journal of the American Statistical Association, 44(247): 335-341.

Omlin, M. and Reichert, P. (1999). A comparison of techniques for the estimation of model prediction uncertainty. Ecol. Model., 115: 45-59.

Roels, J.A. (1980). Application of macroscopic principles to microbial metabolism. Biotechnology and Bioengineering, 22(12): 2457-2514.

Saltelli, A., Tarantola, S., and Campolongo, F. (2000). Sensitivity analysis as an ingredient of modeling. Statistical Science, 15(4):377-395.

Seber G. and Wild C. (1989) Non-linear regression. Wiley, New York.

Sin, G., Gernaey, K.V., Neumann, M.B., van Loosdrecht, M.C.M., Gujer, W. (2009). Uncertainty analysis in WWTP model applications: a critical discussion using an example from design. Water Res. 43(11): 2894-2906.

Sin, G., Gernaey, K.V., Neumann, M.B., van Loosdrecht, M.C.M., Gujer, W. (2011). Global sensitivity analysis in wastewater treatment plant model applications: prioritizing sources of uncertainty. Water Research, 45(2): 639-651.

Sin, G., de Pauw, D.J.W., Weijers, S., Vanrolleghem, P.A. (2008). An efficient approach to automate the manual trial and error calibration of activated sludge models. Biotechnology and Bioengineering. 100(3): 516-528.

Sin, G., Meyer, A.S., Gernaey, K.V. (2010). Assessing reliability of cellulose hydrolysis models to support biofuel process design-identifiability and uncertainty analysis. Computers & Chemical Engineering, 34(9): 1385-1392.

Sin, G., Vanrolleghem, P.A. (2007). Extensions to modeling aerobic carbon degradation using combined respirometric–titrimetric measurements in view of activated sludge model calibration. Water Res. 41(15): 3345-3358.

Vangsgaard, A.K., Mauricio-Iglesias, M., Gernaey, K.V., Sin, G. (2014). Development of novel control strategies for single-stage autotrophic nitrogen removal: A process oriented approach. Computers & Chemical Engineering, 66: 71-81.

van der Heijden, R.T.J.M., Romein, B., Heijnen, J.J., Hellinga, C., Luyben, K. (1994). Linear constraint relations in biochemical reaction systems: II. Diagnosis and estimation of gross errors. Biotechnology and bioengineering, 43(1): 11-20.

Villadsen, J., Nielsen, J., Lidén, G. (2011). Elemental and Redox Balances. In Bioreaction Engineering Principles (pp. 63-118). Springer, US.