13
 RETEA BAYESIANA INTEGRATA CU GIS (Foamete Dragos-Iulian) Voi incerca sa arat cum o retea bayesiana(sau o retea Pearl Bayes) poate fi folosita cu un GIS, pentru a combina informatii din diferite surse de date cu scopul de a le clasifica. Aceste date pot include imagini satelitare, harti topografice, harti geologice, etc. , fiecare dintre ele cu rezolutia si acuratetea sa. Introducere: GIS GI S es te acroni mu l pr ovenit de la Geografi c Informat ion Sy st em (Sis tem Informational Geografic – uneori tradus in forma SIG in limba romana). Acest sistem e utilizat pentru a crea, stoca, a analiza şi prelucra informaţii distribuite spaţial printr-un  proces co mputerizat. Tehnologia GIS poate fi utilizată în diverse domenii ştiinţifice cu m ar fi: managementul resurselor, studii de impact asupra mediului, cartografie, planificarea rutelor. Specific unui GIS este modul de organizare a informaţiei gestionate. Există două tipuri de informaţie: una grafică care indică repartiţia spaţială a elementelor studiate şi alta sub formă de bază d e date pentru a stoca atributele asociate acestor elemente (de ex.  pentru o şosea lungimea ei, lăţimea, numărul benzilor, materialul de construcţie etc.). Informaţia grafică poate fi de două feluri: raster sau vectorială . Grafica raster este o modalitate de reprezentare a imaginilor în aplicaţii software sub forma de matrice de pixeli în timp ce grafica vectorial ă este o metoda de reprezentare a imaginilor cu ajutorul unor primitive geometrice (puncte, segmente, poligoane), caracterizate de ecuatii matematice. Specific sis tem elor GIS este aso cie rea unui sis tem de coo rdo nat e geog raf ic mat ricii de pixeli (la imagi nil e ras ter ) sau vec tor ilo r - pro ced eul poarta numele de Georeferentiere . Astfel unui obiect (reprezentat fie printr-o imagine, fie printr-un vector) îi este asociată o poziţie unică în Sistemul Informatic corespunzătoare poziţiei geografice din lumea reală.  Datori t ă inf ormaţ i ilor asocia te gra ficii, Sis tem ele Inf ormati ce Geo gra fice  beneficiază de toate oportunităţile de interogare pe care le ofera sistemele moderne de  baze de date şi în plus pot oferi uşor analize orientate pe anumite zone geografice - aşa numitele hărţi tematice. Un exemplu comun de Sistem Informatic Geografic îl reprezentă Sistemele de  Navigaţie. Harta rutieră în formă vectorială este georeferenţiată astfel încât Sistemul de Poziţionare Globală (Global Positioning System - GPS) să poată indica poziţia exactă a autovehiculului. Planificarea rutei este în fapt o hartă tematică obţinută în urma unei interogări spaţiale (căutarea distanţei celei mai scurte între două puncte) combinată cu o interogare a bazei de date asociate drumurilor din hartă astfel încât să fie respectate o serie de condiţii (limitări de viteză, gabarit, sensuri de circulaţie, interdicţii, etc.). Datorită impactului pozitiv, sistemele software GIS s-au dezvoltat foarte mult. Exist ă pe piaţă un număr foarte mare de produse, atât ale dezvoltatorilor consacraţ i

retele_bayesiene

  • Upload
    gigiion

  • View
    29

  • Download
    0

Embed Size (px)

DESCRIPTION

retele_bayesiene

Citation preview

  • RETEA BAYESIANA INTEGRATA CU GIS(Foamete Dragos-Iulian)

    Voi incerca sa arat cum o retea bayesiana(sau o retea Pearl Bayes) poate fi folosita cu un GIS, pentru a combina informatii din diferite surse de date cu scopul de a le clasifica. Aceste date pot include imagini satelitare, harti topografice, harti geologice, etc. , fiecare dintre ele cu rezolutia si acuratetea sa.

    Introducere:

    GISGIS este acronimul provenit de la Geografic Information System (Sistem

    Informational Geografic uneori tradus in forma SIG in limba romana). Acest sistem e utilizat pentru a crea, stoca, a analiza i prelucra informaii distribuite spaial printr-un proces computerizat. Tehnologia GIS poate fi utilizat n diverse domenii tiinifice cum ar fi: managementul resurselor, studii de impact asupra mediului, cartografie, planificarea rutelor.

    Specific unui GIS este modul de organizare a informaiei gestionate. Exist dou tipuri de informaie: una grafic care indic repartiia spaial a elementelor studiate i alta sub form de baz de date pentru a stoca atributele asociate acestor elemente (de ex. pentru o osea lungimea ei, limea, numrul benzilor, materialul de construcie etc.).

    Informaia grafic poate fi de dou feluri: raster sau vectorial. Grafica raster este o modalitate de reprezentare a imaginilor n aplicaii software sub forma de matrice de pixeli n timp ce grafica vectorial este o metoda de reprezentare a imaginilor cu ajutorul unor primitive geometrice (puncte, segmente, poligoane), caracterizate de ecuatii matematice.

    Specific sistemelor GIS este asocierea unui sistem de coordonate geografic matricii de pixeli (la imaginile raster) sau vectorilor - procedeul poarta numele de Georeferentiere. Astfel unui obiect (reprezentat fie printr-o imagine, fie printr-un vector) i este asociat o poziie unic n Sistemul Informatic corespunztoare poziiei geografice din lumea real.

    Datorit informaiilor asociate graficii, Sistemele Informatice Geografice beneficiaz de toate oportunitile de interogare pe care le ofera sistemele moderne de baze de date i n plus pot oferi uor analize orientate pe anumite zone geografice - aa numitele hri tematice.

    Un exemplu comun de Sistem Informatic Geografic l reprezent Sistemele de Navigaie. Harta rutier n form vectorial este georefereniat astfel nct Sistemul de Poziionare Global (Global Positioning System - GPS) s poat indica poziia exact a autovehiculului. Planificarea rutei este n fapt o hart tematic obinut n urma unei interogri spaiale (cutarea distanei celei mai scurte ntre dou puncte) combinat cu o interogare a bazei de date asociate drumurilor din hart astfel nct s fie respectate o serie de condiii (limitri de vitez, gabarit, sensuri de circulaie, interdicii, etc.).

    Datorit impactului pozitiv, sistemele software GIS s-au dezvoltat foarte mult. Exist pe pia un numr foarte mare de produse, att ale dezvoltatorilor consacrai

  • (ESRI, Intergraph, Autodesk, MapInfo, etc.) dar i de tip Open source (Grass GIS, Quantum GIS, GVSIG, OpenJump, etc.).

    Retea bayesianaThomas Bayes(1702-1761) a fost un matematician britanic si in acelasi timp un

    pastor prezbiterian, cunoscut a fi formulat o teorema care ii poarta si numele : Teorema lui Bayes(adesea numita legea lui Bayes), publicata post-mortem sub forma unui eseu Essay Towards Solving a Problem in the Doctrine of Chances (1764), de catre prietenul sau Richard Price in Philosophical Transactions of the Royal Society of London.

    Teorema lui Bayes este una din teoremele fundamentale ale teoriei probabilitii, care determin probabilitatea apartenenei evenimentelor i a obiectelor la o anumit grup. n cazul filtrelor spam bazate pe teorema lui Bayes (numite i filtre bayesiene), pentru determinarea probabilitii apartenenei unui anumit mesaj la spam, snt utilizate dicionarele create n timpul nvrii filtrului. De regul programul nva analiznd arhivele de email-uri, selectate n prealabil manual. Cnd dicionarele snt create definitiv, probabilitatea apartenenei unui nou mesaj la spam este calculat prin normalizarea i sumarea probabilitii fiecrui cuvnt n parte. Prin urmare, adunnd informaii statistice despre rata de apariie a unor diferite cuvinte i structuri n mesajele de tip spam sau n mesajele legitime, filtrul compar apoi noile mesaje cu aceste modele i le clasific corespunztor. Filtrele bayesiene ofer o precizie de filtrare de 97%-99%, iar fiind corect antrenat poate atinge i 100%.

    O retea bayesiana(BN) este o constructie matematico-grafica, folosita pentru a modela probabilistic procesele care includ variabile interdependente, deciziile care afecteaza acele variabile, si costurile asociate deciziilor si starilor acelor variabile. Retelele Bayesiene sunt reprezentari intrinseci ale unui sistemului si, tocmai de aceea, sunt des folosite pentru modelarea proceselor de mediu, naturale. Din aceasta cauza exista o legatura naturala intre anumite retele bayesiene si GIS. Retelele Bayesiene sunt reprezentate ca structuri de grafuri acyclici directionati(orientati) cu noduri (reprezentand variabile, costuri si decizii) si arce (linii orientate reprezentand dependentele probabilistic conditionate intre noduri).

    O retea baeyesiana poate fi folosita pentru predictia sau analiza problemelor din lumea reala si din sistemele naturale complexe, unde corelatiile statistice pot fi gasite intre variabile sau aproximate folosind opiniile expertilor. Aceste retele au o vasta arie de aplicabilitate, cum ar fi ajutorul in luarea deciziilor in domenii ca medicina, ingineria, resurse naturale si managementul decizional. Retelele baeysiene pot fi folosite pentru modelarea variabilelor geospatiale interdependente cat si pentru modelarea dependentelor conditionale intre straturile(layere) geospatiale. In plus, aceste retele si-au demonstrat utilitatea si eficienta ridicata in clasificarea imaginilor rezultate din datele de teledetectie.

    Scurt istoric :Descrise pentru prima oara de Pearl(1988), retelele bayesiene au fost folosite pe

    scara larga in medicina si stiinta calculatoarelor. In ultimii ani, aceste retele au fost aplciate si in studii de managementul mediilor explicit spatiale. Exemplele includ: The Neuse Estuary Bayesian ecological response network reteaua bayesiana de raspuns

  • ecologic a estuarului Neuse(Borsuk and Reckhov 2000), Baltic salmon management managementul somonului baltic(Varis and Kuikka 1996), climate change impact on Finnish watersheds impactul schmibarilor climatice asupra raurilor din Finlanda (Kuikka and Varis 1997), the Interior Columbia Basin Ecosystem Management Project proiect de management al ecosistemului din bazinul interior al Columbiei(Lee and Bradshaw 1998).

    Cum a fost ilustrat si in aceste studii, un graf de retea bayesiana structureaza o problema intr-o asemenea maniera incat este interpretabila visual de catre mandatari sau de catre manageri, servind in acelasi timp ca un mijloc eficient pentru evaluarea rezultatelor probabile ale deciziilor de management asupra variabilelor selectate.

    Atat retelele bayesiene cat si GIS-ul pot fi folosite pentru reprezentarea sistemelor explicit spatiale, probabilistic conectate de mediu si alte sisteme, cu toate ca integrarea acestor doua tehnici a fost relativ recent explorata. Integrarea retelelor bayesiene cu GIS in mod specific ia una dintre urmatoarele 4 forme distincte:

    1. combinarea straturilor folosind retele bayesiene(probabilistic map algebra) cum a fost demonstrata de Taylor(2003)

    2. clasificarea folosind retele bayesiene Stassopoulou s.a. (1998) si Stassopoulu and Caelli(2000)

    3. folosirea retelelor bayesiene pentru recuperarea inteligenta a datelor orientate spatial Walker s.a.(2004, 2005)

    4. GIS based BN decision support system(DSS) frameworks cardu pentru sistem de suport a deciziilor folosind retele bayesiene bazate pe GIS, unde nodurile retelei bayesiene sunt reprezentate spatial intr-un cadru(framework) GIS cum a fost prezentat de Ames(2005)

    Baza matematica : Cum a fost prezentat si mai sus, retelele bayesiene sunt folosite pentru a modela

    realitatea prin reprezentarea dependentelor conditional probabilistice intre variabilele intedependente, decizii si rezultate. Pentru o mai buna intelegere a acestor retele bayesiene si a utilizarii lor o sa folisim un model de retea bayesiana numit Umbrella, o versiune amplificata a bine cunoscutei diagrame de influenta Weather(Vreme)prezentata de Shachter si peot (1992).

    Aceasta retea bayesiana simpla incearca sa modeleze variabilele si rezultatele asociate deciziei de a lua sau nu o umbrela la o iesire oarecare in oras.

  • Aceasta problema este reprezentata in retea bayesiana prin 4 noduri. Vreme si Prognoza sunt noduri naturale sau de noroc, unde Prognoza este conditionat de starea nodului Vreme si Vreme este tratat ca o variabila aleatoare(random) cu o distributie de probabilitate anterioara, bazata pe conditiile istorice. Ia umbrela este o variabila decizionala care, impreuna cu variabila Vreme definesc starea variabilei Satisfactie. Nodul Satisfactie este cunoscut ca nod utility sau value(utilitate sau valoare).

    Acest nod asociaza o valoare de efect rezultant pentru a reprezenta satisfactia individului, bazata pe decizia de a lua umbrela si daca ploua sau nu. Fiecare dintre nodurile aceste retele bayesiene contin stari discrete, in care fiecare variabila de stare reprezinta evenimente abstracte, conditii sau domeniul fiecarei variabile(raza).

    Modelul Umbrela poate fi interpretat astfel: daca ploua este o probabilitate mai ridicata ca prognoza sa fie de ploaie. Invers, prin procedeul de propagare inversa a probelor a unei retele bayesiene, daca prognoza anunta ploaie se poate deduce ca exista o sansa mai mare de a ploua intr-adevar. Legatura intre Prognoza si Ia Umbrela indica faptul ca decizia Ia Umbrela indica faptul ca decizia Ia Umbrela se bazeaza in mare parte pe prognoza observata. In final, legatura dintre nodul utilitate Satisfactie si cele 2 noduri Ia Umbrela si Vreme capteaza castigurile relative in satisfactie din fiecare combinatie de stari ale variabilelor retelei bayesiene.

    Retelele bayesiene sunt guvernate de 2 tehnici matematice: probabilitatea conditionata si teorema lui Bayes.

    Probabilitatea conditionata este definita ca fiind probabilitatea aparitiei unui eveniment oarecare data fiind aparitia unui alt eveniment si poate fi calculata ca fiind probabilitatea reunita a aparitiei celor 2 evenimente impartita la probabilitatea celui de-al doilea eveniment:

    ( , )( | )( )

    P A BP A BP B

    =

    Din aceasta ecuatie, poate deriva regula fundamentala pentru calculul probabilitatii si propagarea descrescatoare a probleor intr-o retea bayesiana. In mod specific rezulta ca probabilitatea reunita a lui A si B este egal cu probabilitatea unui eveniment A dat fiind evenimentul B inmultita cu probabilitatea evenimentului B:

    ( , ) ( , ) ( )P A B P A B P B=

    Aceasta ecuatie este folosita pentru a estima probabilitatea oricarei stari in reteaua bayesiana date fiind starile evenimentelor nodurilor parinte. In urmatoarea ecuatie, probabilitatea aparitiei starii xA data fiind starea nodului parinte B este suma probabilitatilor starii xA data fiind aparitia starii iB , cu i fiind un index al starilor lui B, inmultit cu probabilitatea starii lui B.

    ( , ) ( | ) ( )x x i ii

    P A B P A B P B= In mod similar, pentru calcularea starilor cu noduri parinte multipli, ecuatia se

    modifica pentru a exprima suma probabilitatilor conditionate a starii xA date fiind starile

  • iB si jC :

    ,( , , ) ( | , ) ( ) ( )x x i j i j

    i jP A B C P A B C P B P C=

    In final, desi similare ca forma, nodurile utilitare nu calculeaza probabilitatea, dar in loc de asta calculeaza valoarea de utilitate ca un metric sau un index date fiind starile parintilor sau parintii:

    ,

    ( , ) ( | ) ( )

    ( , , ) ( | , ) ( ) ( )

    i ii

    i j i ji j

    U A B U A B P B

    U A B C U A B C P B P C

    =

    =

    Cea de-a doua ecuatie care este critica pentru modelarea cu retele bayesiene este teorema lui Bayes :

    ( | ) ( )( | )( )

    P B A P AP A BP B

    =

    Inversiunea probabilitatii conditionate reprezentata face loc pentru puternica tehnica a deductiei Bayesiene, pentru care in mod particular retelele bayesiene sunt foarte potrivite. In modelul Umbrela, deducerea unei probabilitati mai mari de a ploua data fiind prognoza ploioasa este un exemplu al aplicarii teoremei lui Bayes.

    Conectand fiecare nod din reteaua bayesiana rezulta o tabela de probabilitati conditionate(CPT conditional probability table).Fiecare nod natural(variabila de stare) include un CPT(o tabela de probabilitati conditionate) care stocheaza distributia probabilitatilor pentru posibilele stari ale variabilei date fiind fiecare combinatie a starilor nodurilor parinte(daca are vreunul). Aceste distributii de probabilitate pot fi atribuite prin analiza frecventei variabilelor, parerea expertilor bazata pe observare sau experienta sau pot fi setate ca o distributie anterioara bazata pe observatii sau sisteme echivalente.

    Tabelele 1 si 2 arata tabela de probabilitati conditionate a retelei bayesiene Umbrela. In tabelul 1, distributia de probabilitate a ploii este reprezentata ca fiind 70% sansa sa nu ploua si 30% sa ploua. Tabelul 2 reprezinta distributia de probabilitate a posibilelor prognoze(Insorit, Innorat, Ploios) conditionate in sine de conditiile meteo. De exemplu, cand chiar ploua, prognoza anterioara atrage evenimentul Ploios 65% din timp, Innorat 25% dint timp si Insorit 15% din timp. Inca o data, aceste observatii pot deriva din observatiile istorice asupra acuratetii predictiilor sau prin rationamentul expertilor.

    Tabelul 3 este un tabel de utilitate, definind castigurile relative in utilitate(in termeni denumiti generic unitati de satisfactie) sub posibilele stari ale retelei bayesiene. Aici, satisfactia este cea mai mare cand nu este ploaie si cand nu este luata umbrela si cea mai mica atunci cand nu este luata dar ploua. Unitatile de satisfactie sunt in acest caz atribuite ca evaluari arbitrare pe o scara de la 0 la 100, dar in sisteme mai complexe, aceasta utilitate poate fi folosita pentru a reprezenta marimi monetare sau alte marimi.

    Urmeaza o explicatie succinta a implementarii si folosirii retelei bayesiene Umbrela. Mai intai este util sa evaluam P(Prognoza=Insorit) dat fiind faptul ca nu se cunosc conditiile meteo Vreme:

  • Tabelul 2. Probabilitatea de ploaie

    Tabelul 3. Probabilitatea prognozei in functie de ploaie

    Tabelul 4. Utilitatea Satisfactie conditionata de ploaie si de actiunea Take Umbrella

    Este clar ca satisfactia maxima este prevazuta pentru lasarea umbrelei acasa, furnizand astfel un exemplu de cum poate o simpla retea bayesiana sa ajute un proces decizional. In timp ce reteaua bayesiana Umbrela prezentata aici este destul de simpla si nu este in mod particular explicitata spatial, serveste ca un exemplu generic de retea bayesiana.

  • Reteaua bayesiana folosita pentru East CanyonCreek Ames s.a.(2005)(Asa cum este vazuta in editorul grafic de noduri - GeNIe)

    Aplicatii CHEIE:

    Cum am spus si mai inainte, integrarea GIS cu retele bayesiene este folositoare in orice retea bayesiana care are componente spatiale, fie ca prezinta o retea bayesiana orientata, folosind functionalitatea GIS ca date de intrare pentru reteaua bayesiana, fie ca formeaza o retea bayesiana din analiza unui GIS. Date fiind acestea, aplicatiile unei astfel de integrari sunt limitate doar de asocierile spatiale. Un exemplu mentionat mai sus de astfel de orientare spatiala s-a aratat a fi foarte folositor in managementul unei retele bayesiene de rauri, dar mai sunt si alte tipuri de retele care pot beneficia de aceasta integrare. De exemplu, multe studii ecologice, sociolgice si geologice, care pot beneficia de pe urma unei retele bayesiene, pot avea de asemenea asocieri spatiale puternice. Un alt exemplu poate fi acela ca analiza traficului unei retele bayesiene are deseori asocieri spatiale foarte clare. In final, chiar si retelele bayesiene care incearca sa caracaterizeze extinderea unor boli in epidemiologie, este foarte probabil sa aiba asocieri spatiale clare.

    Cum a fost subliniat si mai sus, o analiza a unei retele bayesiene bazata pe GIS, ia una din urmatoarele 4 forme:

    1. Probabilistic map algebra(algebra de probabilitati a hartii)2. Clasificarea imaginilor3. Recuperarea si interogarrea automata a datelor4. Reprezentarea spatiala a nodurilor retelei bayesieneProbabilistic Map AlgebraImplica folosirea unei retele bayesiene ca o functie combinatorica folosita la

    combinarea celula cu celula a straturilor(layer) raster. De exemplu sa luam in considerare modelele de habitat ecologic descrise de Taylor(2003). Aici, cateva dintre seturile de date raster geospatiale sunt derivate, reprezentand zonele de proximitate pentru tulburarile de peisaj cauzate de om asociate cu dezvoltarea de drumuri, fantani si linii de conducte. De

  • asemenea sunt dezvoltate si suprapuse peste straturile de tulburare si straturi aditionale, reprezentand habitatele cunoscute ale speciilor amenintate si pe cale de disparitie.

    Dupa aceasta, a fost construita o retea bayesiana reprezentand probabilitatea riscului de habitat conditionata de tulburarea umana si locatia habitatului. Tabela probabilitatilor conditionate(CPT) in aceasta retea deriva din interviuri cu recunoscuti experti in ecologie in aceasta zona. In final, aceasta retea bayesiana a fost aplicata in intregime celula cu celula in aria de studiu, rezultand o harta de probabilitate a riscului pentru aceasta regiune pentru fiecare specie de interes.

    Folosirea retelelor bayesiene in acest fel de algebra probabilistica a hartii este in prezent impiedicata de lipsa uneltelor specializate pentru suportul analizei. Totusi, conceptul ocupa un rol important pentru alternativa mai traditionalei analize de indicatori bazata pe GIS, in care fiecare layer(strat) este reclasificat pentru a reprezenta un index arbitrar si apoi insumat pentru a da in final o mertrica(adesea pe o scara de la 1 la 100 a potrivirii sau nepotrivirii).

    Fireste, abordarea prin metoda retelelor bayesiene da o harta de probabilitati mai usor de interepretat. De exemplu, o astfel de analiza poate fi utilizata sa genereze o harta a probabilitatii alunecarilor de teren conditionate de panta, umiditate, vegetatie, etc. In mod cert o harta care indica procentul de risc de alunecare ar trebui sa fie mult mai informativ pentru cei ce iau aceste decizii, decat un model indicator care afiseaza in mod simplist suma unor indicatori reclasificati.

    Clasificarea Imaginilor:In exemplele anterioare, tabelele de probabilitati conditionate ale retelelor

    bayesiene deriva din datele istorice sau informatiile expertilor. Totusi, foarte multe aplicatii de retele bayesiene folosesc conceptul de Bayesian lerning(Invatare Bayesiana) ca mijloc de estimare automata a probabilitatilor din datele existente. Invatarea implica un proces formal automatizat de creare si simplificare structura nodala a retelei bayesiene bazata pe reguli menite sa maximizeze volumul de informatii reprezentat de tabela de probabilitati conditionate(CPT) a retelei bayesiene. In contextul de GIS, algoritmii de invatare a retelei bayesiene au fost aplicati in mod considerabil in problemele de clasificarea imaginilor.

    Clasificarea imaginilor utilizand o retea bayesiana necesita identificarea unui set de straturi de intrare(in mod obisnuit benzi multispectrale sau hyperspectrale) din care va fi identificat un set cunoscut de obiecte sau clasificari.

    Seturile de date de invatare includ atat straturi de intrare cat si de iesire, unde straturile de iesire indica foarte clar trasaturile claselor cerute(de ex. poligoane care indica tipurile de acoperire ale unui teritoriu). Un algoritm de invatare a retelei bayesiene aplicat unor asemenea date va produce un model optim(in contextul retelelor bayesiene) pentru predictia tipului acoperirii sau alte scheme de clasificare ale unei celule raster bazata pe straturile de intrare.

    Aplicarea modelului final de retea bayesiana pentru predictia acoperirii sau altor clasificari intr-un punct necunoscut este similara procedeului descris mai inainte de algebra probabilistica a hartii.

  • Recuperarea si inteorgarea automata a datelor:In cazul aplicarii retelelor bayesiene in interogarea si recuperarea automata a

    seturilor de date geospatiale, telul este in mod special de a folosi cunostintele expertilor pentru a defini tabela de probabilitati conditionate care determina care dintre straturi (layer) sunt incarcate pentru vizualizare si analiza. Folosind aceasta abordare intr-un sistem de mapare(de constructie a unei harti) dinamic pe web, cineva poate dezvolta o retea bayesiana pentru afisarea straturilor folosind o tabela de probabilitati conditionate care indica probabilitatea ca stratul sa fie important, data fiind prezenta sau absenta altor straturi sau caracteristici intre straturi la vizionarea curenta(la zoom-ul actual). Un asemenea instrument va inlocui abordarea tipica, si anume aceea de a activa sau dezactiva straturi bazate strict pe nivelul de zoom.

    De exemplu, sa luam in considerare un sistem militar GIS de mapare folosit pentru a identifica tintele propuse. Un sistem de recuperare a datelor care foloseste o retea bayesiana poate optimiza semnificativ transferul de date si intrebuintarea latimii de banda, aratand doar imagini specifice de inalta rezolutie, cand probabilitatea de nevoie a datelor creste datorita prezentei altor caracteristici care sa indice o probabilitate ridicata a prezentei unei tinte specifice.

    Sistemele de interogare si recuperare a datelor folosind retele bayesiene, pot de asemenea beneficia de pe urma capabilitatilor de invatare bayesiena, prin actualizarea tabelei de probabilitati conditionate cu noi informatii sau dovezi observate de-a lungul folosirii retelei bayesiene. De exemplu, daca utilizatorul vizioneaza in mod constant unele seturi de date simultan la un anumit zoom sau intr-o anumita zona, aceasta creste probabilitatea ca aceste seturi de date sa fie intercorelate si va rezulta intr-o tabela de probabilitati conditionate modificata, reprezentand acele relatii conditionate.

    Reprezentarea spatiala a nodurilor unei retele bayesiene:Multe dintre problemele si analizele unei retele bayesiene desi nu se bazeaza

    complet pe date geospatiale, au o componenta geospatiala clara, si in acest mod pot fi cartografiate(mapate) in peisaj.

    Aceasta metodologie combinata GIS-retele bayesiene este relativ noua, dar are un potential semnificativ de a ajuta la imbunatatirea folosirii si intelegerii unei retele bayesiene.

    De exemplu sa consideram reteau bayesiana a East Canyon Creek(golful canionului estic) Ames s.a. 2005, reprezentat in figura 2. Aceasta retea bayesiana este un model de curgere (FL_TP si FL_HW) atat intr-o uzina de tratament a apei menajere cat si in cursul superior al apei, conditionat de sezonul curent(SEASON). De asemenea, modelul include estimari ale concenratiilor de fosfor la uzina de tratament si in cursul superior al apei(PH_TP si PH_HW) conditionat de sezon si de asemenea de operatiile efectuate atat la uzina(OP_TP) cat si in cursul superior(OP_HW). Fiecare dintre aceste variabile afecteaza concetratiile de fosfor din curs(PH_ST) si in cele din urma vizitele la rezervor(VIS_RS). Costurile operatiilor (CO_TP si CO_HW), ca si castigurile la rezervor(REV_RS) sunt reprezentate ca noduri de utilitate in reteaua bayesiana.

    Cele mai multe dintre nodurile din aceasta retea(in afara de nodu SEASON) au o locatie explicita spatiala(reprezinta conditii intr-un loc anume). Din cauza acestei spatialitati intrinseci reteaua bayesiana a canionului de est(East Canion) poate fi

  • reprezentata intr-un GIS cu puncte, care indica nodurile si sageti care indica arcele retelei bayesiene. O astfel de reprezentare ofera utilizatorului o intelegere mai mare a contextului si semnificatiei nodurilor unei retele bayesiene. In plus, in multe dintre cazuri, se poate intampla ca nodurile retelei bayesiene sa corespunda unor caracteristici geospatiale specifice (de ex. o anume statie meteo), caz in care reprezentarea spatiala a nodurilor retelei bayesiene intr-un GIS poate fi deosebit de explicita.

    Exemple de utilizare a retelelor bayesiene:

    1. Folosirea unei retele bayesiene intr-un GIS pentru modelarea relatiilor si amenintarilor pentru populatiile de ursi koala aflate in apropierea mediilor urbane

    - D.V. Pullar si T.H. Phan, Geography, Planning and Architecture, University of Queensland, Australia

    Predictia aparitiei speciilor native la marginea oraselor este problematica datorita nivelului inalt de tulburarii umane.

    Studiul se preocupa de conservarea populatiilor de ursi koala in regiunea costala din Australia.

  • 2. Aplicarea unei retele bayesiene intr-un sistem decizional care foloseste un GIS - A. Stassopoulou, M. Petrou & J. Kittler Dept. of Electronic and Electrical Engineering University of Surrey

    Lucrarea incearca sa demonstreze abordarea in cadrul problemei de ecvaluare a rsicului de desertificare a unor paduri care au luat foc, in regiunea Mediteraneana. Este un poriect cu fonduri provenite de la Consiliul European. Arata intr-un mod specific cum o retea bayesiana poate fi folosita ca un isntrument pentru a realiza rationamente probabilistice intr-un GIS.

    3. O retea bayesiana pentru investigarea declinului in pescuitul din Elvetia- Mark E. Borsuk, Patricia Burkhardt-Holm, and Peter Reichert, Swiss Federal

    Institute for Environmental Science and Technology (EAWAG)

  • 4. Un instrument de evaluare a riscului pentru proiectarea cladirilor complexe folosind o retea bayesiana

    - Mario De Grassi s.a. , Polytechnic University of Marche - DACS, Ancona, Italy

    Lucrarea descrie utilizarea unei retele bayesiene pentru modelarea riscurilor prezente in consctructia unui parc auto cu mai multe etaje. S-a demonstrat ca acest model ar fi fost folositor in prevenirea unor evenimente neasteptate, experimentate in timpul constructiei.

    Directii viitoare:

    Se asteapta ca cercetarea si dezvoltarea instrumentelor pentru integrarea combinata a GIS si retelelor bayesiene sa continue atat in mediul academic cat si in cel comercial. Noi descoperiri in ambele zone de aplicatii descrise au loc in mod regulat si reprezinta o zona de studiu activa si interesanta pentru multi analisti si utilizatori de GIS.

  • Bibliografie:

    Encyclopedia of GIS : http://books.google.ro/books?id=6q2lOfLnwkAC

    Using a Bayesian Network in a GIS to Model Relationships and Threats to Koala Populations Close to Urban Environments - D.V. Pullar and T.H. Phan : http://www.mssanz.org.au/MODSIM07/papers/21_s46/UsingABayesian_s46_Pullar_.pdf

    A Bayesian risk assessment tool for designingcomplex buildings : http://www.irbdirekt.de/daten/iconda/CIB9829.pdf

    Bayesian network Wikipedia : http://en.wikipedia.org/wiki/Bayesian_network