50
Introducere în subiectul datelor deschise (open data) - suport de curs - Editor: Coaliția pentru date deschise prin Asociația pentru Tehnologie și Internet – ApTI Autori: Nicolaie Constantinescu Codrina Maria Ilie Matei-Eugen Vasile Proiect finanțat prin granturile SEE 2009 – 2014, în cadrul Fondului ONG în

Introducere în subiectul datelor deschise, suport de curs pentru

  • Upload
    dodat

  • View
    254

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Introducere în subiectul datelor deschise, suport de curs pentru

Introducere în subiectul datelor deschise (open data)- suport de curs -

Editor: Coaliția pentru date deschise prin Asociația pentru Tehnologie și Internet – ApTI

Autori:

Nicolaie ConstantinescuCodrina Maria IlieMatei-Eugen Vasile

Proiect finanțat prin granturile SEE 2009 – 2014, în cadrul Fondului ONG înRomânia. Mai multe detalii despre granturi vezi la http://www.eeagrants.org și

http://www.fondong.fdsc.ro.

Octombrie 2014

Document pus la dispoziție sub licența CC-BY

Conţinutul acestui material nu reprezintă în mod necesar poziţia oficială a granturilor SEE2009 – 2014

Page 2: Introducere în subiectul datelor deschise, suport de curs pentru

I. Ce sunt datele deschise? (tehnic, juridic, exemple practice)

1. Concept

Datele deschise sunt un concept care nu poate fi definit doar din punct de vedere tehnic sau doar din punct de vedere juridic. Pentru a defini datele deschise, trebuiesc luate în considerare în același timp atât aspectele tehnice cât și aspectele juridice. Foarte succint, în context European, „datele deschise sunt date ce pot fi utilizate în mod liber, reutilizate și redistribuite de către oricine – supuse doar, cel mult, la necesitatea atribuirii în condiții identice.”1

Pentru o definiție mai precisă, trebuiesc analizate definițiile date de diverse organizații conceptului de date deschise. De exemplu, definiția dată de Open Knowledge Foundation conceptului de 'deschis', în special când vine vorba de date deschise, este: „Datele deschise sunt elementele de bază ale cunoașterii deschise2. Cunoașterea deschisă este ceea ce devin datele deschise când acestea sunt folositoare, pot fi folosite și sunt folosite.

Trăsăturile cheie ale deschiderii sunt:

Disponibilitate și acces: seturile de date trebuie să fie disponibile în întregime și la un cost nu mai mare decât ar fi rezonabil, de preferință disponibile pentru a fi descărcate de pe Internet. De asemenea, datele trebuie să fie disponibile într-un format ușor de folosit și de modificat. Reutilizare și redistribuție: seturile de date trebuie să fie puse la dispoziție sub termeni care permit reutilizarea și redistribuirea acestora, inclusiv combinarea acestora cu alte seturi de date. Datele trebuie să poate fi citite în mod automat. Participare universală: oricine trebuie să poată folosi, refolosi și redistribui – nu ar trebui să existe nici o discriminare pe baza modului de utilizare, a persoanelor sau a grupurilor. De exemplu, restricțiile de tipul 'necomercial' care interzic utilizarea în scopuri 'comerciale', sau restricții care permit utilizarea doar în anumite scopuri (de exemplu, doar în scop educațional) nu sunt permise.”3

Descrierea completă, la care se face referire mai sus, dată de Open Knowledge Foundation pentru conceptul de 'deschis' este:

„Sumar: Cunoașterea este deschisă dacă oricine poate să o acceseze, folosească, modifice și redistribuie – singurii termeni impuși fiind, cel mult, unii având ca scop conservarea datelor de proveniență și a caracterului deschis al acesteia.Acest sens esențial al termenului 'deschis' corespunde cu sensul termenului 'deschis' folosit în legătură cu

1 Manual despre Date Deschise (Open Data Handbook) versiunea 1.0 produs de Open Knowledge Foundation http://opendatahandbook.org/ro/what-is-open-data/index.html

2 N.A. original în Engleză: open knowledge3 https://okfn.org/opendata/

Page 3: Introducere în subiectul datelor deschise, suport de curs pentru

software-ul cu sursă deschisă4 și este sinonim cu 'liber', așa cum este acest termen descris în definiția operelor culturale libere5. Definiția termenului 'deschis' a fost derivată, inițial, din definiția software-ului cu sursă deschisă, care la rândul său a fost derivată din Ghidul pentru Software Liber al Proiectului Debian6.

Termenul operă va fi folosit pentru a descrie o cunoștință care este transferată.Termenul licență se referă la condițiile legale sub care este publicată o operă. Acolo unde nu este specificată o licență, vor fi folosiți termenii legali care se aplică din oficiu utilizării unei opere (de exemplu, legislația privind drepturile de autor sau domeniul public).

1. Opere Deschise

O operă deschisă trebuie să îndeplinească următoarele cerințe atunci când este distribuită:

1.1. Licență deschisăOpera trebuie să fie pusă la dispoziție sub o licență deschisă (în concordanță cu definiția din secțiunea 2). Orice termeni suplimentari care însoțesc opera (cum ar fi termeni de utilizare sau brevete deținute de titularul licenței) trebuie să nu contrazică termenii licenței.

1.2. AccesibilitateOpera va fi disponibilă în întregime și contra unui cost unic și nu mai mare decât ar fi rezonabil, de preferință fiind ca aceasta să fie disponibilă pentru descărcare gratuită pe Internet . Orice alte informații necesare pentru respectarea licenței (cum ar fi numele contribuitorilor, necesare pentru cerințele de atribuire) trebuie să însoțească opera.

1.3. Format deschisOpera trebuie să fie furnizată într-un format convenabil și ușor de modificat, astfel încât să nu existe obstacole tehnologice nenecesare în calea exercitării drepturilor oferite de licență. În particular, datele trebuie să poată fi citite automat, în volum mare și să fie reprezentate într-un format deschis (adică un format ale cărui specificații să fie publice, disponibile gratuit și care să nu impună restricții, materiale sau de altă natură, asupra folosirii acestuia) sau, în cel mai rău caz, să poată fi procesate cu cel puțin un instrument software cu surse libere/deschise.

4 http://www.opensource.org/docs/osd 5 http://freedomdefined.org/Definition 6 https://www.debian.org/social_contract

Page 4: Introducere în subiectul datelor deschise, suport de curs pentru

Figura 1: Formatele fișierelor disponibile pe data.gov.ro

2. Licențe deschise

O licență este deschisă dacă termenii săi satisfac următoarele condiții:

2.1. Permisiuni necesareLicența trebuie să permită în mod irevocabil următoarele:2.1.1. FolosireLicența trebuie să permită folosirea liberă a operei licențiate.2.1.2 RedistribuireLicența trebuie să permită redistribuirea operei licențiate, inclusiv vânzarea, fie doar a operei individuale sau folosind-o ca parte a unei colecții alcătuite din opere din multiple surse de proveniență2.1.3. ModificareLicența trebuie să permită creerea de opere derivate din opera licențiată și să permită distribuția acestor opere derivate sub aceiași termeni ca opera originală licențiată.2.1.4. SeparareLicența trebuie să permită ca orice parte a operei să poată fi folosită, distribuită sau modificată separat de oricare altă parte a operei sau de orice colecție din care opera făcea parte când a fost distribuită. Toți cei care primesc price orice parte a unei opere sub termenii licenței originale ar trebui să aibă aceleași drepturi ca cele acordate împreună cu opera originală.2.1.5. CompilațieLicența trebuie să permită ca opera licențiată să fie distribuită împreună cu alte opere distincte fără a se impune restricții asupra acestor alte opere.2.1.6. NediscriminareLicența trebuie să nu discrimineze împotriva oricărei persoane sau a oricărui grup.2.1.7 PropagareDrepturile atașate operei trebuie să se aplice tuturor celor cărora le este redistribuită opera fără a fi necesară acceptarea de către aceștia a oricăror altor termeni legali suplimentari.2.1.8. Utilizare în orice scop

Page 5: Introducere în subiectul datelor deschise, suport de curs pentru

Licența trebuie să permită folosirea, redistribuirea, modificarea și compilația în orice scop. Licența trebuie să nu restrângă abilitatea nimănui de a folosi opera într-un anumit context sau scop.2.1.9 GratisLicența trebuie să nu impună nici un fel de onorariu, plată recurentă pentru drepturi intelectuale sau orice alt mecanism de remunerație materiala ca parte a condițiilor impuse.

2.2. Condiții acceptabile

Licența nu va limita, introduce ambiguități sau reduce în vreun fel permisiunile specificate în secțiunea 2.1. cu excepția următoarelor condiții permise:

2.2.1. AtribuțieLicența poate cere ca distribuirea operei să trebuie să includă atribuția contribuitorilor, titularilor de drepturi, sponsorilor și creatorilor cât timp cât această cerință nu este oneroasă.2.2.2. IntegritateLicența poate cere ca versiunile modificate ale operei licențiate să poarte un alt nume sau număr de versiune decât opera inițială sau, altfel, să indice care sunt modificările care au fost făcute.2.2.3. Redistribuire similarăLicența poate cere ca operele derivate sau copiile să rămână sub aceiași licență sau o licență similară celei a operei originale.2.2.4. ÎnștiințareLicența poate cere menținerea înștiințărilor de drepturi de autor și identificarea licenței.2.2.5. SursăLicența poate cere ca operele derivate să fie distribuite într-o formă care să permită modificări ulterioare.2.2.6. Interzicere a restricțiilor tehniceLicența poate interzice distribuirea operei prin mijloace care folosesc măsuri de natură tehnica care impun restricții asupra exercitării drepturilor care sunt, altfel, acordate.2.2.7. NeagresiuneLicența poate cere ca cei care aduc modificări operei să acorde publicului permisiuni suplimentare (de exemplu, licențe de brevet) necesare pentru exercitarea drepturilor acordate de licență. De asemenea, licența poate condiționa permisiuni pe neagresiunea față de licențiați când vine vorba exercitarea oricărui drept acordat (din nou, de exemplu, cum ar fi cazul disputelor privind brevete).”

Trebuie ținut cont că această definiție a datelor deschise nu face nici o referire la proveniența datelor. Se poate face o clasificare a datelor deschise și în funcție de proveniența acestora, în acest caz unele dintre cele mai semnificative categorii fiind datele deschise științifice și datele deschise guvernamentale.

După cum a fost specificat la început, aceasta este definiția datelor deschise în context European. În Statele Unite ale Americii, când se vorbește de date deschise, de cele mai multe ori se subînțelege că este vorba de date deschise guvernamentale. Acest fapt poate fi remarcat, de exemplu, în ghidul politicilor de date deschise al Sunlight Foundation7. Sunlight Foundation este o organizație Americană8 în timp ce

7 http://sunlightfoundation.com/opendataguidelines/ 8 http://sunlightfoundation.com/about/

Page 6: Introducere în subiectul datelor deschise, suport de curs pentru

Open Knowlegde Foundation este o organizație Europeană (Britanică)9.

Întrebarea firească care se pune în acest moment este „De unde acestă diferență între perspectiva Europeană și cea Americană?”. Răspunsul la acestă întrebare stă în faptul că, în Europa, în legislația privind drepturile de proprietate intelectuală există conceptul de drepturi asupra bazelor de date în timp ce în Statele Unite ale Americii acest drept nu există.

În contextul drepturilor de proprietate intelectuală, o entitate fizică sau juridică nu poate avea drepturi de proprietate asupra datelor în sine, ci doar asupra unor creații. Prin introducerea dreptului asupra bazelor de date10, datele propriu-zise nu pot fi în proprietatea cuiva în continuare, dar colecțiile de date pot fi11. Din această cauză, datele produse de instituțiile publice, din fonduri publice și de interes public, deși individual nu pot fi în proprietatea cuiva, prin intermediul faptului că aceste date formează baze de date iar legislația acordă drepturi în mod explicit asupra bazelor de date, instituțiile care gestionează aceste baze de date se pot folosi de această situație legislativă pentru a nu furniza publicului datele respective.

Un exemplu de astfel de situație poate fi observat la CFR și mersul trenurilor. Datele legate de mersul trenurilor, individual, nu pot intra sub incidenta legislației privind drepturile de proprietate intelectuală. Totalitatea acestor date, însă, formând o bază de date, poate intra sub incidența legislației privind drepturile de proprietate intelectuală din cauza dreptului de baze de date iar CFR-ul se folosește de această stare de fapt pentru a interzice oricărei terțe părți de la a crea aplicații sau servicii pornind de la aceste date. O interogare a mersului trenurilor pe site-ul oficial al CFR-ului produce, în subsolul paginii, următorul mesaj „Toate drepturile rezervate. Acest site contine material protejat de Legea 8 din 1996 cu modificarile si completarile ulterioare. Orice utilizare sau reproducere neautorizata este interzisa. Nicio parte a www.cfrcalatori.ro nu poate fi reprodusa, transmisa prin orice mijloc electronic sau mecanic, inclusiv fotocopiere, inregistrare sau prin stocarea si extragerea de informatii fara dreptul explicit in scris al SNTFC CFR Calatori.”12 Un exemplu de terț care a fost scos de pe piață de CFR prin folosirea dreptului de baze de date este site-ul mersultrenurilor.ro, care oferea servicii bazate pe datele din mersul trenurilor. După cum se poate vedea de pe prima pagină a acestui site, acesta nu a mai fost actualizat din Octombrie 201313. Acesta este un exemplu clasic de cum date care sunt disponibile din punct de vedere tehnic nu sunt open data pentru că datele respective nu sunt disponibile și din punct de vedere juridic.

Așadar, în context American, conceptul de date deschise se referă în principal la transparența organizației care furnizează respectivele date și la aspectele tehnice privitoare la modul în care respectivele date sunt făcute publice, fără a fi nevoie de a lua în calcul aspecte juridice. În context European, în plus față de cele enumerate mai sus trebuiesc luate în calcul și aspectele juridice ale modului în care sunt publicate datele pentru ca aceste date să poată fi considerate date deschise.

9 https://okfn.org/about/ 10 N.A. original în Engleză: database rights11 Bogdan Manolea Introducere în subiectul datelor deschise și problemelor sale juridice (I) – Rev. Romana de Dreptul

Afacerilor12 http://www.cfrcalatori.ro/ 13 http://www.mersultrenurilor.ro/

Page 7: Introducere în subiectul datelor deschise, suport de curs pentru

1. Juridic

Pentru ca un set de date făcut public să poată fi considerat date deschise, din punct de vedere juridic, conform definiției extinse de la punctul 1, acesta trebuie să fie publicat sub o licență care să ofere utilizatorilor o serie de drepturi fără de care utilizarea datelor nu ar fi posibilă din punct de vedere juridic. O alternativă mai radicală este ca aceste date să fie puse explicit în domeniul public. Problema este că punerea în domeniul public este foarte dificilă, dacă nu de-a dreptul imposibilă în multe jurisdicții. Ca substitut la punerea în domeniul public sunt licențele care oferă aceleași drepturi ca domeniul public.

Lista de licențe recomandate de Open Knowledge Foundation pentru datele deschise conține următoarele licențe14:

1. Creative Commons CCZero (CC0)1516 – licență echivalentă cu a pune date sau conținut în domeniul public2. Open Data Commons Public Domain Dedication and Licence (PDDL)17 – licență echivalentă cu a pune date în domeniul public3. Creative Commons Attribution 4.0 (CC-BY-4.0)18 – licență care poate fi folosită pentru date sau conținut și care necesită atribuție – aceasta este una dintre licențele de date deschise cu cea mai mare răspândire4. Open Data Commons Attribution License (ODC-BY)19 – licență care poate fi folosită pentru date și care necesită atribuție – aceasta a fost creată special pentru baze de date5. Creative Commons Attribution Share-Alike 4.0 (CC-BY-SA-4.0)20 – licență care poate fi folosită pentru date sau conținut și care necesită atribuție și redistribuire similară – aceasta este alta dintre licențele de date deschise cu cea mai mare răspândire6. Open Data Commons Open Database License (OdbL)21 – licență care poate fi folosită pentru date și care necesită atribuție și redistribuire similară – aceasta a fost creată special pentru baze de date

Desigur, pot fi folosite sau create alte licențe care să îndeplinească cerințele necesare unei licențe compatibile cu conceptul de date deschise. Un exemplu de astfel de licență este:

7. Licența pentru o Guvernare Deschisă (OGL-ROU-1.0)22 – Licența de utilizare a informațiilor deschise publicate pe portalul de date deschise http://data.gov.ro

14 http://opendefinition.org/licenses/ 15 https://creativecommons.org/about/cc0 16 https://creativecommons.org/publicdomain/zero/1.0/ 17 http://opendatacommons.org/licenses/pddl/ 18 https://creativecommons.org/licenses/by/4.0/ 19 http://opendatacommons.org/licenses/by/ 20 https://creativecommons.org/licenses/by-sa/4.0/ 21 http://opendatacommons.org/licenses/odbl/ 22 http://data.gov.ro/base/images/logoinst/OGL-ROU-1.0.pdf

Page 8: Introducere în subiectul datelor deschise, suport de curs pentru

1. Tehnic

Pentru ca un set de date făcut public să poată fi considerat date deschise, din punct de vedere tehnic, conform definiției extinse de la punctul 1 acesta trebuie să ofere23:

1. Accesibilitate: Setul de date trebuie să fie disponibil contra unui cost rezonabil sau, de preferință, gratuit pe Internet.2. En-gros: Întregul set de date trebuie să fie făcut disponibil, nu doar părți din acesta.3. Format deschis: Setul de date trebuie fie disponibil într-un format care să nu condiționeze (ca de exemplu formatele de date brevetate) sau îngreuneze reutilizarea respectivelor date.

Dincolo de datele propriu-zise, foarte importante sunt și metadatele cum ar fi data și ora la care a fost creată fiecare înregistrare, data și ora la care a fost creat un fișier care conține un set de date etc.

În ziua de astăzi, modalitatea care asigură accesul celor mai mulți utilizatori cu cel mai mic efort este publicarea pe Internet. Orice altceva nici nu se poate considera că respectă cerințele de ordin tehnic ale definiției datelor deschise. Dincolo de acest aspect fundamental, un set de date poate fi publicat pe Internet folosind mai multe metode:1. Publicarea seturilor de date folosind fișiere2. Publicarea seturilor de date prin intermediul unui API web

3.1. Publicarea seturilor de date folosind fișiere

În cazul publicării seturilor de date folosind fișiere, trebuiesc luate în considerare două aspecte:1. Modalitatea tehnică de publicare a fișierelor2. Formatul de fișier folosit

3.1.1. Modalitatea tehnica de publicare a fișierelor

Publicarea fișierelor poate fi realizată în multiple feluri. Nu are rost încercarea de a crea o listă exhaustivă de metode care pot fi folosite pentru că numărul acestora este foarte mare. Vom prezenta doar câteva dintre modalitățile cele mai comune și mai convenabile pentru toate părțile implicate:

1. Publicarea pe web, pe pagina instituției/organizației: Aceasta este una dintre modalitățile cele mai simple din punct de vedere tehnic dacă instituția/organizația care publică respectivele date are deja o pagină web funcțională. Dacă respectiva instituție/organizație nu are deja o pagină web, atunci soluția devine mai complicată, în funcție de disponibilitățile tehnice și/sau financiare ale respectivei instituții/organizații. Din punctul de vedere al utilizatorilor datelor publicate, publicarea acestora pe pagina web proprie a instituției/organizației poate pune cel puțin două tipuri de probleme. În primul rând, în funcție de design-ul paginii, pot exista dificultăți în a identifica informațiile privitoare la momentul publicării datelor respective. În al doilea rând, în funcție de design-ul paginii, pot exista dificultăți în găsirea fișierelor pe pagină. Un exemplu de organizație care publică seturi de date deschise pe propria pagină web este Eurostat24.

23 http://opendatahandbook.org/en/how-to-open-up-data/make-data-available.html 24 http://epp.eurostat.ec.europa.eu/portal/page/portal/eurostat/home

Page 9: Introducere în subiectul datelor deschise, suport de curs pentru

2. Publicarea pe web, pe portaluri unor terți: Aceasta modalitate este similară cu precedenta. Din punct de vedere tehnic, pentru instituția/organizația care publică respectivele date este mai simplu pentru ca terța parte care se ocupa de platforma respectivă este entitatea care se ocupă de aspectele tehnice. Instituția/organizația care publică respectivele date trebuie doar să furnizeze fișierul/fișierele cu seturile de date. Singurele probleme care pot apărea din punctul de vedere al instituției/organizației care publică setul de date sunt cele de natură de politică a instituției/organizației. Din punctul de vedere al utilizatorilor, această alternativă este mai convenabilă pentru ca aceștia pot găsi date din multiple surse în același loc iar un astfel de portal, fiind special creat pentru publicarea de seturi de date, ar trebui să aibă, cel puțin teoretic, un design optimizat pentru nevoile utilizatorilor. Un exemplu autohton de astfel de portal de date deschise este portalul data.gov.ro25. Un alt exemplu este portalul de date deschise al Uniunii Europene26.3. Publicarea prin intermediul BitTorrent: Aceasta este o altă alternativă foarte ușor de folosit atât de către instituția/organizația care publică datele cât și de către utilizatori. Avantajul acestei alternative față de cele precedente este că degrevează resursele tehnice ale instituției/organizației care publica datele și asigură o mai mare robustețe a mecanismului de publicare a datelor.

3.1.2. Formatul de fișier folosit

Când vine vorba formatul fișierelor publicate, în primul rând, acest format trebuie să satisfacă cerința de format deschis, ale cărui specificații să fie publice, disponibile gratuit și care să nu impună limitări de natură materială, tehnica sau de orice alt fel. În cel mai rău caz, în caz că formatul folosit nu este un format deschis așa cum a fost acesta definit mai sus, trebuie ca să existe cel puțin un instrument cu surse libere/deschise care să poată deschide fișierul și exporta datele într-un format deschis.

În al doilea rând, formatul folosit trebuie să fie interpretabil automat. De exemplu, dacă un set de date este publicat în fișiere PDF, chiar dacă sunt îndeplinite toate celelalte cerințe impuse de conceptul de date deschise, respectivul set de date nu sunt date deschise pentru că fișierul nu este ușor interpretabil în mod automat. Acest lucru este valabil pentru fișiere PDF generate direct din date, dar cu atât mai mult pentru fișiere PDF care conțin pagini scanate. Evident, aceasta problemă nu se limitează la fișiere PDF, ci se referă la orice format de fișier care nu poate fi ușor interpretat în mod automat.

Câteva formate deschise care satisfac toate cerințele pentru date deschise:1. CSV (Comma Separated Values – Valori Separate prin Virgulă): Acesta este cel mai comun și mai accesibil format de fișier pentru reprezentarea seturilor de date. Acest format poate fi deschis atât cu programe de calcul tabelar cât și cu orice editor de text.2. XML (eXtended Markup Language): Acest format poate fi folosit pentru a reprezenta atât date cât și metadate într-un mod structurat.3. ODS (Open Document Spreadsheet): Acesta este formatul de fișier de calcul tabelar din suita de formate de fișier publicate de Open Document Format27.

Un exemplu de format care nu satisface cerințele de format deschis dar pentru care există cel puțin un instrument cu surse libere/deschise care să poate deschide astfel de fișiere și să le poată exporta într-un

25 http://data.gov.ro/ 26 https://open-data.europa.eu/en/data 27 http://www.opendocumentformat.org/aboutODF/

Page 10: Introducere în subiectul datelor deschise, suport de curs pentru

format deschis:1. XLS (Microsoft Excel Spreadsheet): Acest format de fișier poate fi deschis cu instrumente cu surse libere/deschise cum ar fi LibreOffice Calc28 sau Gnumeric29.

Figura 2: Formate de fișiere disponibile pentru salvarea de date de pe site-ul Eurostat

3.2. Publicarea seturilor de date prin intermediul unui API online

Publicarea datelor se poate face și prin intermediul unui API (Application Programming Interface) online.

Pentru instituțiile/organizațiile care pun la dispoziție seturi de date prin intermediul unui API online, beneficiul este că pot furniza întotdeauna cele mai recente date utilizatorilor, în unele cazuri chiar în timp real. Dezavantajul este că furnizarea acestui serviciu de API online înseamnă costuri materiale și necesită expertiză tehnică mai avansată decât furnizarea unor fișiere care conțin seturi de date.

Pentru utilizatori care sunt și dezvoltatori de software această alternativă poate fi foarte convenabilă pentru că datele folosite sunt totdeauna cele mai recente. Pe de altă parte, publicarea datelor doar prin 28 https://www.libreoffice.org/discover/calc/ 29 http://gnumeric.org/

Page 11: Introducere în subiectul datelor deschise, suport de curs pentru

intermediul unui API online nu este suficientă din punct de vedere al accesului en-gros la date. De exemplu, dacă un utilizator ar dori să analizeze întregul set de date, acesta ar trebui să folosească un instrument software pentru a descărca întregul set de date, instrument care s-ar putea să nu existe, fie să creeze acest instrument, ceea ce nu este întotdeauna fezabil ținând cont ca dezvoltatorii de software sunt doar un subset al întregii mulțimi de utilizatori al unui set de date. Din aceste motive, instituțiile/organizațiile care pun la dispoziție seturi de date prin intermediul unui API online o fac ca un serviciu suplimentar publicării seturilor de date folosind fișiere.

Un exemplu autohton de instituție care oferă accesul deschis la date prin intermediul unui API este Ministerul Justiției30, care oferă astfel acces la datele despre dosare, părți și ședințe de judecată.

30 http://portal.just.ro/SitePages/acces.aspx

Page 12: Introducere în subiectul datelor deschise, suport de curs pentru

II. Politici și legislație de la nivel european și în România

Pentru a avea o privire de ansamblu la nivel european iar apoi la nivelul României, trebuie înțeleasă evoluția graduală de la Informațiile din Sectorul Public la Datele Deschise. Europa a pornit pe drumul valorificării informațiilor produse de instituțiile sale și cele publice ale statelor membre odată cu deschiderea pe care a oferit-o strategia pe zece ani a Uniunii Europene Europa 2020. Multe dintre recomandările actuale privind accesul și reutilizarea informațiilor din sectorul public, pot fi identificate chiar și într-o recomandare a Organizației pentru Cooperare și Dezvoltare Economică (OECD) în aprilie 2008 (http :// www . oecd . org / dataoecd /41/52/44384673. pdf ).

În primăvara anului 2010, este lansată Strategia pe 10 ani a Uniunii Europene: „Europa 2020”. Una dintre cele șapte inițiative-pilot ale Strategiei Europa 2020 este Agenda digitală pentru Europa iar mai târziu, în toamna aceluiași an, doamna Vicepreședinte a Comisiei Europene Neelie Kroes „spunea DA datelor deschise” (în contextul îndemnului pentru reutilizarea informațiilor din sectorul public). Un cadru firesc de evoluție l-a constituit Agenda Digitală pentru Europa.

Agenda Digitală pentru Europa este documentul care deschide cel mai mult subiectul datelor deschise cu o puternică focalizare pe generarea de valoare prin reutilizarea unor date specifice produse de administrațiile publice, date rezultate din proiecte de cercetare finanțate din buget, cărți în format digital existente în biblioteci și care se află dincolo de perioada de protecție a drepturilor de autor, etc.

„Datele Deschise se referă la ideea că anumite date ar trebui să fie liber disponibile pentru utilizare și reutilizare.” (Agenda Digitală pentru Europa, http://ec.europa.eu/digital-agenda/public-sector-information-raw-data-new-services-and-products).

Ce reprezintă datele deschise pentru CE?

„[...] informații geografice, statistici, date meteorologice, date provenind de la proiectele de cercetare finanțate public și cărțile digitizate din biblioteci". O altă reprezentare poate fi oferită ca și valoare calculată a beneficiilor: „câștigurile economice totale din deschiderea acestei resurse ar putea urca până la 40 de milioane de euro în UE.” spune „Open data: An engine for innovation, growth and transparent governance”31.

Un alt moment important pentru politicile europene privind Datele Deschise este Carta pentru Date Deschise a grupului G8 (18 iunie, 2013), care afirm că „întreaga lume asistă la creșterea unei mișcări globale mijlocită de tehnologie, de media socială fiind alimentată de informație [...] datele deschise stau

31 http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=COM:2011:0882:FIN:EN:PDF

Page 13: Introducere în subiectul datelor deschise, suport de curs pentru

în inima acestei mișcări globale”.

Principiile mari pentru care documentul militează sunt:

● Date Deschise prin definiție,● Calitate și cantitate,● Utilizabile de toată lumea,● Difuzare de date pentru o mai bună guvernare,● Difuzare de date pentru inovare

Principiul 1 recunoaște faptul că ceea ce se înțelege prin „date guvernamentale” are o percepție foarte largă, dar sunt emise de organismele administrative și guvernamentale. Un accent este pus pe recunoașterea aspectelor ce țin de proprietate intelectuală cât și de informațiile cu un caracter special, recunoscându-se faptul că nu toate datele pot fi publicate.

Principiul a doilea recunoaște bogăția „informațiilor” care pot face interesul cetățenilor, dar și nevoia de timp pentru a pregăti date de înaltă calitate. Angajamentul G8 dincolo de aspectele privind publicarea datelor, introduce aspectele care privesc descrierea datelor, procesarea acestora, cât și momentul de publicare care să permită un feedback, care, la rândul său să conducă la revizuiri.Al treilea principiu spune că datele vor fi puse la dispoziția celor interesați fără taxe și fără impedimente administrative sau de natură birocratică. Acesta este și punctul în care se menționează faptul că datele vor fi puse la dispoziție în formate deschise.

Principiul patru are în vedere asigurarea transparenței privind colecțiile de date, standardele și procesele de publicare prin documentarea acestora online.Cel de-al cincilea principiu implică o zonă de educație în ceea ce privește datele deschise urmată de încurajarea celor care doresc exploatarea. Aici apare mențiunea că pentru cei care doresc inovarea domeniului, datele vor fi puse la dispoziție și în formate citibile de mașină.

Directiva 98 din 2003 este primul text cu valoare juridică care adresează problematica exploatării informațiilor din sectorul public țintind să „stabilească un set minim de reguli care să guverneze reutilizarea”.

În motivație, textul Directivei aduce în discuție potențialele beneficii pe care le-ar aduce valorificarea informațiilor din sectorul public dacă ar exista o „minimă armonizare a regulilor la nivel național și a practicilor privind reutilizarea”. Ținta vizată „stabilirea un set minim de reguli care să guverneze reutilizarea”.

Tot acest act definește ce este un „document” - „orice reprezentare a unor acte, fapte sau informații și

Page 14: Introducere în subiectul datelor deschise, suport de curs pentru

orice compilație ale acestora” „indiferent de mediul de stocare” „în orice format sau limbă”. Sunt menționate și regulile minime privind taxarea și sunt menționate chiar și instituțiile a căror documente nu intră sub incidența acestei directive. O parte dintre aspectele menționate au fost modificate ulterior prin noua Directivă din 2013.

În Articolul 2, aliniatul 2 este definit documentul însuși.

„Prin «document» se înțelege: (a) orice conținut indiferent de mediu (scris pe hârtie sau stocat în format electronic sau ca fonograme, înregistrare vizuală sau audio-vizuală); (b) oricare parte a acestui conținut”

Decizia Comisiei Europene din 12 decembrie 2011 privind reutilizarea documentelor Comisiei 2011/833/EU„Decizia determină condițiile privind reutilizarea documentelor deținute de Comisie sau de Oficiul pentru Publicații al Uniunii Europene în numele său cu scopul de a înlesni o mai largă reutilizare a informației [...]”.Comisia Europeană face un pas suplimentar propunând construcția unui „portal de date ca un unic punct de acces la documentele disponibile pentru reutilizare”. Acesta va conține și documentele disponibile produse de Joint Research Centre. Acestă Decizie o înlocuiește pe cea privind Euratom: 291 din 2006. În Articolul 3, aliniatul 1 este oferită o definire a documentului identică cu cea existentă în Directiva 98 din 2003. „Prin «document» se înțelege: (a) orice conținut indiferent de mediu (scris pe hârtie sau stocat în format electronic sau ca fonograme, înregistrare vizuală sau audio-vizuală); (b) oricare parte a acestui conținut”. Aportul important al deciziei este stabilirea unei terminologii necesare creării premizelor pentru un adevărat portal de date european. Astfel, rând pe rând sunt introduși termenii de „prelucrare automată” (machine readable), „date structurate” (structured data) și portal. Această nouă terminologie a fost utilizată și în modificarea Directivei 98 cu 37 din 2013 - vezi articolul 5. Tot acest document introduce și un concept nou și important: licențierea deschisă prin definirea unei „licențe deschise”.

Directiva 2013/37/UE pentru modificarea Directivei 2003/98/EC privind reutilizarea informațiilor din sectorul public

Documentul:● Propune un număr minim de reguli pentru a pune la dispoziție informația produsă de instituțiile

publice și agențiile guvernamentale.

Page 15: Introducere în subiectul datelor deschise, suport de curs pentru

● Specifică drepturile persoanelor fizice și juridice privitor la reutilizare.● Recomandă distribuirea prin mijloace electronice.

Directiva a intrat în vigoare la 31 decembrie 2003 și se focalizează pe reutilizarea informației. Până în 2008 Statele Membre au raportat implementarea în propriile sisteme legislative a obligațiilor pe care Directiva le prevede.

Revizuirea Directivei în 2013 are ca scop direct stimularea utilizării Informațiilor din Sectorul Public în procesele de business și într-o manieră unitară la nivelul pieței comunitare.Unul dintre cele mai spinoase aspecte în ceea ce privește reutilizarea îl constituie licențierea seturilor de date. Este de menționat faptul că articolul 8 permite statelor membre să-și aleagă PSI-urile care să poată fi puse la dispoziție fără nicio condiție, fie că se află în Domeniul Public, fie că sunt exceptate de la aplicarea drepturilor de autor.

Un aspect important ține de monitorizare. Articolul 13, paragraful 2: „o dată la trei ani, statele membre prezintă Comisiei un raport privind informațiile din sectorul public disponibile în vederea reutilizării, condițiile în care sunt puse la dispoziție respectivele informații și practicile în materie de căi de atac. Pe baza respectivului raport, care se face public, statele membre întreprind o revizuire a punerii în aplicare a articolului 6, în special în ceea ce privește impunerea de taxe superioare costului marginal”.Există o pagină dedicată implementării directivei în statele memebre accesibilă la https://ec.europa.eu/digital-agenda/en/implementation-public-sector-information-directive-member-states. Pentru a vedea mai clar situația la nivel european, proiectul ePSIplatform a elaborat o tabelă comparativă prin care a agregat indicatori privind adoptarea datelor deschise și a Informațiilor din Sectorul Public la nivel european (http://www.epsiplatform.eu/content/european-psi-scoreboard).

Există șapte aspecte pe baza cărora s-a făcut evaluarea reutilizării informațiilor din sectorul public: implementarea Directivei; practică de reutilizare; formats; taxare; aranjamente de exclusivitate; informații din sectorul public local; evenimente și activități. O țară poate acumula 100 de puncte pentru fiecare dintre aceste aspecte dintr-un total de 700. Considerând aceste informații România se poziționează pe undeva pe la mijloc:

Page 16: Introducere în subiectul datelor deschise, suport de curs pentru
Page 17: Introducere în subiectul datelor deschise, suport de curs pentru

Comunicarea „Orientări privind licențele standard recomandate, seturile de date și taxarea reutilizării documentelor” apărută în iulie 2014 se constituie ca un adevărat ghid în ceea ce privește implementarea Directivei PSI 37 din 2013.

Este important de menționat faptul că „directiva nu se aplică documentelor asupra cărora părți terțe dețin drepturi de proprietate intelectuală” și „nu impune utilizarea licențelor formale”. Este menționat faptul că se pot elabora licențe naționale dacă este necesar, preferată fiind totuși utilizarea unei licențe global acceptată cum este CCO versiunea 4.0. Sunt menționate chiar seturile de date care prezintă importanță:

Categorie Exemple seturi de date

Date geospațialeCoduri poștale, hărți naționale și regionale (planuri cadastrale, hărți

topografice, marine, ale frontierelor administrative etc.)

Observarea Pământului și

mediu

Date spațiale și in situ (monitorizarea condițiilor meteorologice, a calității terenurilor și a apei, a consumului de energie, a nivelurilor

emisiilor etc.)

Date privind transporturile

Orarele transportului public (toate modurile de transport) la nivel național, regional și local, informații privind lucrările rutiere, traficul

etc.

StatisticiDate statistice naționale, regionale și locale, însoțite de principalii indicatori demografici și economici (PIB, vârstă, stare de sănătate,

nivelul șomajului, venituri, educație etc.)

ÎntreprinderiRegistrul comerțului și registrul întreprinderilor (listele întreprinderilor

înregistrate, informații privind forma de proprietate și modul de gestionare, identificatorii înregistrării, bilanțuri financiare etc.)

Documentul orientează și în ceea ce privește felul în care ar trebui publicate seturile de date cu un accent pe formatul de date deschise (acestea sunt specificate clar), pe metadate, fiind menționate și câteva repere privind vocabularele iar acolo unde este posibil cei care gestionează seturile de date sunt îndemnați să expună public o interfață de programare a aplicațiilor - API.

O altă perspectivă asupra depozitelor de date de această dată ne este oferită de http :// datacatalogs . org / - o listă completă a cataloagelor de date deschise din întreaga lume.

Page 18: Introducere în subiectul datelor deschise, suport de curs pentru

Încă un detaliu important angajat de textul document este cel legat de costuri care pot fi considerate a fi eligibile. Există trei categorii de costuri: întocmirea datelor, distribuția datelor și vânzarea și promovarea sau furnizarea de servicii cu valoare adăugate. Aceste categorii de costuri sunt comparate cu ceea ce directiva înțelege a fi costuri marginale. Concluzia este să singurul cost care se apropie de costul marginal este cel care privește larga distribuție a seturilor de date.

Directiva a fost transpusă și în sistemul legislativ românesc prin adoptarea Legii 109 privind reutilizarea informaţiilor din instituţiile publice din 25 aprilie 2007 care a fost modificată prin Legea nr. 213 din 24 octombrie 2008. Legea transpune Directiva nr. 98 din 2003 privind reutilizarea informațiilor din sectorul public, publicată în Jurnalul Oficial al Uniunii Europene nr. L345/31 decembrie 2003. Legea definește termenii (instituție publică, document, reutilizare, scop comercial, terț) și stabilește termele la care instituțiile trebuie să răspundă solicitanților. Ceea ce legea revizuită spune privind modul de organizare administrativ este că trebuie să existe un departament „desemnat”, care să fie calificat în a răspunde celor interesați iar acesta nu sunt obligate să facă eforturi suplimentare pentru a rezolva cererea. Documentele (iar aici merită subliniat termenul folosit de legiuitor, nefiind menționate datele) „sunt puse la dispoziția solicitantului în forma deținută”. Instituțiile publice pot acorda drepturi de exclusivitate (vor fi public afișate - transparență) „numai dacă un astfel de drept este necesar desfășurării unui serviciu public”, dar cu re-examinarea periodică a acestora cel puțin o dată la trei ani.

Nu putem vorbi despre accesul liber la informații și în special la cel provenite din instituțiile publice fără

Page 19: Introducere în subiectul datelor deschise, suport de curs pentru

a supune atenției și Legea 544 din 2001 privind liberul acces la informațiile de interes public. Această lege este instrumentul prin care este reglementat „accesul liber și neîngrădit la orice informații de interes public”. Ca și în cazul legii 109, sarcinile privind aplicarea legii cad în activitatea compartimentului de informare și relații publice și la fel legiuitorul se referă la documente, nu explicit la date. Este de reținut că prin această lege încă din 2011 avem un principiu fundamental: „accesul liber și neîngrădit”. Legiuitorul pune accentul pe documente și nu pe informațiile pe care acestea le conțin.

Un alt document care are o importanță deosebită pentru evoluția practicilor privind datele deschise este Hotărârea nr. 215 din 20 martie 2012 privind Strategia Națională Anticorupție.Acesta este un document cu adevărat important pentru promovarea Datelor Deschise și alinierea la Inițiativa Parteneriat pentru o Guvernare Deschisă (lansat oficial în 2011) este Strategia Națională Anticorupție. Obiectivul specific 2 face parte din setul de „măsuri specifice pentru creșterea gradului de integritate și transparență în domenii/sectoare prioritare” și vizează „creșterea transparenței instituționale prin sporirea gradului de disponibilitate a datelor publice deschise (open data) puse la dispoziție de către autoritățile publice”. România este semnatară din 2012 a Parteneriatului. Parte a eforturilor de împlinire a angajamentelor o constituie și măsurile privind creșterea transparenței. Documentul Strategiei Naționale Anticorupție este și cel care include definirea datelor publice deschise întărind prevederile Legii 109. În Raportul Anual privind stadiul implementării Strategiei Naționale Anticorupție 2012 - 201532 datele deschise sunt prezentate prin prisma eforturilor depuse de Departamentul pentru Servicii Online și Design, în cadrul Cancelariei Primului ministru. „Această structură a preluat coordonarea implementării angajamentelor asumate de România în cadrul Parteneriatului pentru o Guvernare Deschisă”. Merită menționat cel mai vizibil serviciu: data.gov.ro, un portal dedicat seturilor de date adunate din administrație.

Pentru a extinde și mai mult sfera de cercetare este necesară prezentarea unor proiecte europene care prin studii au lămurit mai multe aspecte pe care accesul, reutilizarea și valorificarea datelor deschise pe care le expune.

Open Data Support este un proiect al DG Connect al Comisiei Europene menit să îmbunătățească vizibilitatea și ușurința în accesarea seturilor de date publicate în portalurile de date deschise de la nivel local și național pentru a mări gradul de reutilizare în interiorul și în afara granițelor. Open Data Support este o inițiativă pan-europeană care îi are în vedere pe cei care publică date și care sunt avansați, dar și celor care abia încep.

Open Data Support este finanțat prin SMART 2012/0107 ‘Lot 2: Provision of services for the

32 href="http://sna.just.ro/Portals/0/Raport%20Anual%20SNA%20%20RO%20FINAL%2022%2005%202013.pdf

Page 20: Introducere în subiectul datelor deschise, suport de curs pentru

Publication, Access and Reuse of Open Public Data across the European Union, through existing open data portals’(Contract No. 30-CE-0530965/00-17).

Open Data Support oferă:➔ Date și modalități de pregătire a metadatelor; servicii de editare și publicare➔ Servicii de instruire în zona datelor deschise (interconectare)➔ Servicii de consultanță pentru servicii și pentru IT

Portalul pentru Date Deschise al Uniunii Europene este un punct unic de acces pentru datele emise de instituțiile din Uniunea Europeană. Aceste date sunt libere pentru utilizare în scopuri comerciale sau nu.

Portalul pentru Date Deschise este condus de Oficiul pentru Publicații al Uniunii Europene ca implementare a politicii privind datele deschise la nivel european. Implementarea este în sarcina Directoratului general pentru Rețele de Comunicare, Conținut și Tehnologie al Comisiei Europene.Portalul are expus celor interesați și un punct de acces33 (triple store) către datele deschise interconectate. Portalul de Date Deschise al UE se poate accesa și utilizând API-ul de tip REST. API-ul vă oferă toate funcționalitățile de bază ale portalului. Informațiile obținute pot fi folosite de coduri externe care solicită portalul API.Pentru uz programatic, API-ul este disponibil la următoarea adresă URL: http :// open - data . europa . eu / data / api /

ePSIplatform este inițiativa Comisiei Europene prin Directoratul general CONNECT care are drept obiectiv promovarea unei piețe destinate reutilizării Informațiilor din Sectorul Public și a Datelor Deschise în întreaga Europă.În portalul accesibil la http://www.epsiplatform.eu veți putea găsi noutățile, studii legale privind reutilizarea Informațiilor din Sectorul Public, bune practici și exemple de produse și servicii dezvoltate din reutilizarea datelor deschise și toate evenimentele care se desfășoară pe continent.

LAPSI (Legal Aspects of Public Sector Information) 2.0 este o rețea tematică dezvoltată de Comisia Europeană care a avut drept scop identificarea obstacolelor din calea accesului și a reutilizării Informației din Sectorul Public. Ceea ce a făcut în doi ani rețeaua este să colecteze exemple de bune practici privind licențierea deschisă, întărirea legislației și pentru a găsi un echilibru între drepturile de protecție intelectuală, protecția datelor și datele deschise.

HOMER Project - Harmonising Open Data in the Mediterranean through better access and Reuse of public sector information34.

33 http://open-data.europa.eu/ro/linked-data34 http://homerproject.eu

Page 21: Introducere în subiectul datelor deschise, suport de curs pentru

HOMER este un proiect strategic focalizat pe problematica Datelor Deschise în contextul valorificării Informațiilor din Sectorul Public.

Page 22: Introducere în subiectul datelor deschise, suport de curs pentru

III. Introducere în domeniul geospațial. Definirea termenilor utilizați în documentul de față

În cele ce urmează vom defini o serie de termeni specifici pe care îi considerăm fundamentali în domeniul geospațial și pe care îi vom utiliza în documentul de față.

Harta este o reprezentare grafică în plan orizontal a suprafeței Pământului sau altor planete (totală sau parțială), generalizată și micșorată conform unei anumite scări de proporție și întocmită pe baza unei proiecții cartografice. Există o multitudine de tipuri de hărți, împărțite fie în funcție de scară (scară mică, scară mare - detaliere a informației), de ce anume reprezintă (hartă turistică, geologică), de tipul de proiecție cartografică folosită șamd.

Proiecție cartografică reprezintă un procedeu matematic prin care suprafața curbă a Pâmântului este reprezentată în plan. (exemple în figura XXX) Tipul de proiecție cartografică determină categoriile de erori pe care le vom avea pe hartă, cât și dimensiunea și localizarea acestora.  Selecția unei proiecții cartografice în defavoarea alteia, se realizează în funcție de scara hărții pe care o vom realiza, de ce anume vom reprezenta, de poziția geografică a suprafeței proiectată șamd.

Figura XXX. Forma conturului României în funcție de proiecțiile cartografice utilizate

Scara reprezintă raportul dintre dimensiunea unui obiect pe hartă și corespondentul său în lumea reală.

Georeferentiere reprezintă procesul invers al proiectării suprafeței plane pe suprafața curbă. (Figura XXX)

Page 23: Introducere în subiectul datelor deschise, suport de curs pentru

Figura XXX. Exemplificarea procedeului de georeferențiere a unei hărți

Geocodare reprezintă procesul de atribuire de coordonate geografice unui descriere de loc, precum ar fi numărul poștal al unei case. Geocodarea facilitează analizele spațiale utilizând Sisteme Informaționale Geografice.

Standardul reprezintă o convenție, o normă general acceptată și aplicată în cadrul unui domeniu pentru definirea, reprezentarea, construirea unui element al acelui domeniu.

Formatul reprezintă un standard în care o informație este codificată pentru introducerea acesteia într-un sistem automatic. În cadrul domeniului geospațial, acesta reprezintă codificarea unui informații geografice astfel încât să fie ‘înțeleasă’ de un sistem computerizat. Aceste formate sunt dezvoltate de către organizații internaționale de standardizare (de exemplu, Open Geospatial Consortium), agenții de cadastru sau de către producătorii de soluții GIS.

Modelul de date geospațiale este o structură ce definește și caracterizează atât elementele spațiale ce aparțin unui anumit domeniu, cât și interacțiunile și relațiile ce se stabilesc între acestea.

Geodatele (datele geografice, datele spațiale) reprezintă acele seturi de date care au o componentă de localizare, permițând reprezentarea acestora într-un sistem de referință.

Page 24: Introducere în subiectul datelor deschise, suport de curs pentru

Fig. xxx Exemplu de geodate - un tabel conținând date referitoare la poziționarea informației de interes

Fig. XXX Captură de ecran prezentând informații despre un punct de interes, în cazul de față Catedrala Ortodoxă din Timișoara

Geodatele pot fi stocate într-o multitudine de formate. Utilizarea unui sau altui format depinde de software-ul folosit, de preferințele utilizatorului șamd.

Geodatele sunt, precum alte seturi de date, purtătoare de informații. Aspectul esențial al acestora constă în localizarea lor într-un anumit loc al lumii. Existența acestui parametru de localizare poate determina o multitudine de analize și identifica complexe relații, care, altfel, ar fi fost dificil de descoperit și înțeles. Majoritatea seturilor de date au o referință spațială, fie că vorbim despre date despre calitatea spitalelor din Romania sau despre rezultatele alegerilor electorale. Având în vedere multitudinea soluțiilor existente pentru manipularea și vizualizarea geodatelor la momentul de față, problema nu mai este posibilitatea creării de hărți, ci înțelegerea limitărilor acestor reprezentări și interpretarea lor corespunzătoare.

Metadatele  sunt  “date despre date” sau, cu alte cuvinte, “informaţii despre date”, aceste informaţii fiind exprimate tot prin date. Dintre cele mai importante utilizări ale metadatelor, se reţin documentarea referitoare la mulţimea de date, analiza posibilităţilor de utilizare a datelor pentru rezolvarea unor probleme specifice, asigurarea accesului la date şi a transferului datelor. Crearea metadatelor este o necesitate pentru un management eficient al seturilor de date geospatiale și nu numai. Utilizarea unui standard în crearea acestor date despre date reprezintă un avantaj superior, permițând inglobarea informației în diferite sisteme automatizate sau pentru un transferului via Internet ușor de realizat. Pentru informația geospațială, în Uniunea Europeană, standardul este definit prin Directiva Europeană INSPIRE. O motivaţie majoră a folosirii standardelor şi metadatelor este volumul mare de date, costul foarte mare

Page 25: Introducere în subiectul datelor deschise, suport de curs pentru

al culegerii şi caracteristicile superioare de precizie pentru aceste datele descrise. Se pot dezvolta astfel sisteme informaționale geografice superioare calitativ.

2. Geodatele deschise.

Geodatele deschise sunt geodatele ce pot fi utilizate în mod liber, reutilizate și redistribuite de către oricine – supuse doar, cel mult, la necesitatea atribuirii în condiții identice. Acestea se împart în 3 categorii:1. Geodate proprietare în mod FreemimCele mai potrivite exemple sunt oferite de către Google, Yahoo, Nokia, Apple etc.

Fig. XXX - Capturi de ecran cu produsele Google Maps și Yahoo Bing.

Serviciul cartografic oferit (Google Maps, Yahoo Bing, Nokia HERE) poate fi folosit gratis, dar: de obicei, este restricționat utilizării comerciale de obicei, sunt acceptate un anumit număr de accesări existența Termenilor de Utilizare, uneori de neînțelesDATELE utilizate pentru realizarea acestor hărți NU sunt LIBERE.

Page 26: Introducere în subiectul datelor deschise, suport de curs pentru

Fig. xxx - Extras din licența de utilizare a produsului Google Maps

2. Geodate publice libereGeodatele publice sunt datele spațiale colectate sau produse de către instituții ale statului. Pentru că acestea să fie libere, trebuie să îndeplinească aceleași condiții ca orice set de date: să fie libere pentru reutilizare, redistribuie, cu menționarea sursei cel mult.

Fig. XXX Captură de ecran prezentând setul de date spațiale deschis de către ANCPI prin portalul data.gov.ro

Page 27: Introducere în subiectul datelor deschise, suport de curs pentru

Fig. xxx. Captură de ecran cu geodatele eliberate de către ANCPI prin portalul data.gov.ro și importate în Google Earth

3. Date produse de către comunitateCel mai bun exemplu al acestei categorii este OpenStreetMap.OpenStreetMap este un proiect inițiat în 2004, în regim open source, ce are ca scop construirea unei baze de date geografice globale, utilizând datele colectate de către utilizatori, fie prin vectorizarea având ca fundal imagini spațiale, fie prin colectare utilizând dispozitive GPS.La ora actuala, OSM este un produs extrem de puternic, folosit în numeroase aplicații ca hartă de fundal, ori ca bază de date spațială utilizată în cadrul analizelor spațiale.

DATELE utilizate pentru realizarea hărții OSM SUNT LIBERE, cu mențiunea că este necesară menționarea sursei.

4. Exemple de aplicații care au utilizat geodate deschise

Deschiderea geodatelor publice este un demers care are două motivații principale. O motivație este dată de necesitatea unei guvernări cât mai transparente, care implică și eliberarea datelor brute care sunt uneori integrate în multiple studii și analize, alteori nefolosite, dar cu potențialul de a releva informații folositoare pentru comunitatea respectivă. Se înceracă în acelasși timp ca prin accesul la aceste baze de date să se ridice nivelul de implicare al societății civile în administrația publică.A doua motivație este consolidată prin ideea de reutilizare a datelor de către sectorul public prin

Page 28: Introducere în subiectul datelor deschise, suport de curs pentru

dezvoltarea de produse și servicii noi, care va duce, în timp, la un  model de business sustenabil.  În statele pionier ale acestei inițiative de deschidere a (geo)dateor publice, există numeroase aplicații și servicii noi dezvoltate și utilizate de către comunitate. Deși cuantificarea creșterii economice influențată de deschiderea datelor publice este dificilă, periodic sunt întocmite rapoarte, de regulă regionale, care să probeze dacă deschiderea datelor publice prezintă avantajul economic scontat. În anul 2000, studiul ‘Exploatarea comercială a informațiilor din sectorul public UE ’ [Commercial exploitation of Europe’s public sector information], finanțat de către Comisia Europeană estima valoarea economică a PSI la 68 miliarde EUR. După adoptarea Directiei Europene de Re-Utilizare a datelor publice, Comisia Europeană finanțează un nou studiu economic, ‘Măsurarea Resurselor Sectorului Public European (MEPSIR)’ [Measuring European Public Sector Information Resources]. Urmează studiile ‘Analiza reutilizării Informațiilor din Sectorul Public (PSI) în Informația Geografică, Meteorologică și în Sectorul Informațiilor Legislative’ [Assessment of the Re-use of Public Sector Information (PSI) in the Geographical Information, Meteorological Information and Legal Information Sectors] în  2008 și ‘Studiul prețurilor Informațiilor din Sectorul Public’ [Prices of Public Sector Information Study] în 2011.

Aplicații dezvoltate pe datele publice deschise sunt tot mai întâlnite în diferite țări ale lumii. De cele mai multe ori, cele mai vizibile dintre acesta sunt listate chiar pe portatul datelor deschise a țării respective. Mai mult, catalogarea oferă mai multe informații precum ce seturi de date au fost folosite, tehnologie utilizată, număr de utilizatori înregistrați șamd. Ca exemplu de aplicație identificată pe astfel de pagină putem menționa aplicația dezvoltată pe datele spațiale eliberate de către UK, denumită Neighbourhood Checker.  Serviciul permite unui utilizator să descopere mai multe informații despre zona în care locuiește sau zone care pot fi luate în considerare pentru locuire în viitor. Neighbourhood Checker combină informații referitoare la școli, criminalitate și populația locală pentru a oferi  în profunzime o perspectivă echilibrată referitoare la orice zonă din UK, printr-o interfață ușor de utilizat.

Page 29: Introducere în subiectul datelor deschise, suport de curs pentru

Figura XXX Interfața aplicației Neighbourhood Checker

Pentru o analiză imediat a impactului pe care serviciile și aplicații bazate pe date publice deschise îl au, data.gov, portalul de date deschise al SUA, menține o pagină de impact al companiilor care au activități bazate pe open data. Câteva exemple enumerate sunt grăitoare în privința potențialului datelor deschise: Sănătate : Archimedes ajută utilizatorul să descopere informații referitoare la serviciul de sănătatea, realizează simulări permițând decizii mai informate privind asigurarea de sănătate. Compania are un număr de 130 de angajați și folosește datele deschise de către Departamenul de Sănătate și Servicii Umane Financiar : BillGuard identifică taxe ‘ascunse’ pe extrasele de cont ale utilizatorilor și le elimină. Firma are un număr de 30 de angajați și folosește datele deschise de către Serviciul de Protecție a Consumatorului Energetic : Clean Power Finance este o aplicație care reunește profesioniști din domeniul energiei regenerabile și investitori posibili. Compania are un umăr de aproximativ 120 și folosește datele deschise de către Laboratorul Național de Energie Regenerabilă.Mai mult, US menține și dezvoltă o listă ce se dorește a fi exhaustivă a companiilor care obțin profit prin utilizarea datelor guvernamentale deschise. Lista poate fi consultată de către oricine și se numește Open Data 500 Companies.

În România, inițiativa de deschidere a datelor publice este la început. Necesitatea creșterii gradului de încredere al sectorului privat suficient pentru a investi în dezvoltarea unui produs sau serviciu bazat pe acestea este prezentă.  În acest context, Departamentul de Servicii Online și Design, responsabil cu

Page 30: Introducere în subiectul datelor deschise, suport de curs pentru

implementarea angajamentelor din cadrul Parteneriatului pentru o Guvernare Deschisă , împreună cu societatea civilă organizeză întâlniri și codefests regulat pentru a demonstra potențialul inițiative. În cadrul unui astfel de eveniment, s-au dezvoltat mai multe aplicații pe baza datelor existente pe portalul data.gov.ro.  Utilizându-se seturile de date publicate de către Ministerul Sănătății s-a făcut o distribuție spațială a spitalelor din România coroborată cu o statistică asupra numărului de paturi pe categorii (Figura XXX).

Figura XXX. Prezentarea aplicației realizate utilizând geodate libere de pe portalul data.gov.ro  

De asemenea, sunt cunoscute inițiative lăudabile de reutilizare a informațiilor publice. Prezentăm câteva exemple:

1. http://onoratainstanta.ro/ Platforma onoratainstanta.ro reprezintă finalitatea proiectului Open Justice 2.0 for Romania, ce vizează elaborarea unei metodologii de evaluare a predictibilităţii actului de justiţiei pe baza unor indicatori cantitativi şi calitativi şi a unei analize cu privire la relevanţa datelor astfel obţinute în vederea formulării unor politici publice în domeniu. Platforma urmăreşte totodată să contribuie la sporirea transparenţei actului de justiţie, aducându-şi astfel aportul şi la creşterea încrederii cetăţenilor în sistemul de justiţie în ansamblul său.2. https://banipierduti.ro/ banipierduți.ro este o platfomă unde sunt monitorizate cheltuielile publice, indexând contracte în derulare, bugete pe domenii şi instituţii.  Este o platformă pentru informarea cetăţenilor despre importanţa unui stat mai eficient şi promovează mecanisme legislative existente pentru a-i împuternici pe

Page 31: Introducere în subiectul datelor deschise, suport de curs pentru

contribuabili să schimbe destinaţia banilor publici. Platforma utilizează numai date publice, aşa cum apar ele în Bugetul de Stat, Bugetul Fondului naţional unic de asigurări sociale de sănătate şi în Bugetul Asigurărilor Sociale de Stat, aşa cum sunt ele furnizate de către Ministerul Finanţelor Publice http://www.mfinante.ro/proiectbuget2012.html?pagina=domenii. Datale sunt actualizate în fiecare an, odată cu adoptarea legilor care aprobă aceste bugete, fiind supuse modificărilor survenite în cazul unor rectificări bugetare.

3. http://hartapoliticii.ro/Acesta este o platformă care preia informațiile publice referitoare la activitățile, declarațiile și modul în care votează persoanele politice și le oferă într-un mod structurat și condensat. Proiectul este dezvoltat în întregime pe tehnologii Open Source.

4. geoidea.roGeodata Openness Initiative for Development and Economic Advancement in Romania (geoidea.ro) este un proiect de cercetare în derulare, o colaborare între ETH Zurich și Universitatea Tehnica de Construcții București demarat în 2013. Obiectivul principal al GEOIDEA.RO este de a îmbunătăți baza științifică pentru adoptarea unui model de date geografice deschise. Următoarele acțiuni sunt planificate pentru atingerea obiectivelor proiectului GEOIDEA.RO: Revizuirea strategiilor și legislațiilor internaționale cu privire la date deschise, Analiza impactului ce îl poate avea adoptarea unei politici de acces la date spațiale deschise în România; Dezvoltarea unor tehnologii și a unor instrumente inovative pentru publicarea și organizarea datelor spațiale; Explorarea unor instrumente și metode care pot reduce costurile de publicare a datelor spațiale deschise.

Sunt cunoscute inițiative privitoare la deschiderea datelor publice și din partea autorităților publice. Un exemplu relevant în acest sens este inițiativa Ministerului Agriculturii și Dezvoltării Rurale: http://www.madr.ro/ro/date-deschise.html .