213
Universidad Nacional del Sur Tesis de Magister en Ciencias de la Computaci ´ on Modelos de Representaci´on de Informaci´on Geogr´ afica Mar´ ıa Mercedes Vitturini Bah ´ ıa Blanca Argentina 2010

Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Universidad Nacional del Sur

Tesis de Magister en Ciencias de la Computacion

Modelos de Representacion

de Informacion Geografica

Marıa Mercedes Vitturini

Bahıa Blanca Argentina

2010

Page 2: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,
Page 3: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Universidad Nacional del Sur

Tesis de Magister en Ciencias de la Computacion

Modelos de Representacion

de Informacion Geografica

Marıa Mercedes Vitturini

Bahıa Blanca Argentina

2010

Page 4: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,
Page 5: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Prefacio

Esta Tesis es presentada como parte de los requisitos para optar al grado academico

de Magister en Ciencias de la Computacion, de la Universidad Nacional del Sur, y no ha

sido presentada previamente para la obtencion de otro tıtulo en esta Universidad u otras.

La misma contiene los resultados obtenidos en investigaciones llevadas a cabo en el De-

partamento de Ciencias e Ingenierıa de la Computacion, durante el perıodo comprendido

entre el 1 de noviembre de 2002 y el 24 de diciembre e 2010, bajo la direccion del Dr.

Pablo R. Fillottrani, Profesor Asociado del Departamento de Ciencias e Ingenierıa de la

Computacion y la Dra. Silvia M. Castro, Profesora Titular del Departamento de Ciencias

e Ingenierıa de la Computacion.

Marıa Mercedes Vitturini

[email protected]

Departamento de Ciencias e Ingenierıa de la Computacion

Universidad Nacional del Sur

Bahıa Blanca, 24 de Diciembre de 2010.

Page 6: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,
Page 7: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

UNIVERSIDAD NACIONAL DEL SUR

Secretarıa General de Posgrado y Educacion Continua

La presente tesis ha sido aprobada el . . . / . . . / . . ., mereciendo la

calificacion de . . . . . . (. . . . . . . . .).

Page 8: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,
Page 9: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Agradecimientos

A mis directores de tesis, Dr. Pablo R. Fillottrani y Dra. Silvia M. Castro por su

generosidad, capacidad y experiencia cientıfica brindadas en un marco de confianza y

afecto.

Al jurado, Dr. Marcelo A. Falappa, Dr. Daniel E. Riesco y Dra. Aurora Vizcaıno por

la dedicacion y valiosas devoluciones.

A las autoridades y directivos del Departamento de Ciencias e Ingenierıa de la Compu-

tacion y de la Direccion General de Sistemas de Informacion por alentar, comprender y

permitir que trabaje en este proyecto.

A mi amiga y companera de trabajo Mg. Karina M. Cenci por su animo, presencia y

colaboracion desinteresada leyendo y corrigiendo este trabajo de tesis.

Al Ing. Carlos J. Matrangolo y personal tecnico del Centro Cientıfico Tecnologico

CONICET de Bahıa Blanca que hicieron posible el desarrollo de la defensa mediado por

video conferencia.

Al personal administrativo del Departamento de Ciencias e Ingenierıa de la Compu-

tacion por su disposicion, colaboracion y calidez humana.

A mi familia y amigos por su comprension y companıa en todo momento.

A mis companeros de trabajo del Departamento de Ciencias e Ingenierıa de la Compu-

tacion y de la Direccion General de Sistemas de Informacion que me brindan cotidiana-

mente la oportunidad de crecer compartiendo la actividad profesional.

A mis padres y mi hermano que me acompanan y estan siempre presentes.

A mis sobrinos Juan, Ramiro, Tomas y Violeta que alegran mi vida.

A todos GRACIAS!

Mercedes Vitturini

Page 10: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,
Page 11: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Resumen

Los primeros sistemas automatizados que usaron informacion geografica datan de los

’70. Desde esa epoca y hasta ahora se crean aplicaciones para satisfacer las necesidades de

diversos ambitos de uso y problemas variados incluyendo: metereologıa, planeamiento

urbano, transporte, servicios ambientales, turismo, distribucion economica, etc. Entre

sus usuarios se cuenta a organizaciones estatales y gubernamentales, educativas y de

investigacion, industriales y comerciales.

Representar informacion geografica es un problema complejo, se necesita mantener

referencia a una o mas ubicaciones de la superficie de la Tierra y eventualmente se puede

requerir de propiedades geometricas. La informacion geografica que modela a los fenome-

nos del mundo real se organiza en dos abstracciones: el modelo discreto que considera al

espacio y sus objetos, y el modelo continuo que imagina al espacio formado por posicio-

nes junto con las propiedades que las describen. Originalmente cada solucion resulto en

un sistema de informacion que administra datos espaciales desarrollado en base a una

tecnologıa, jurisdiccion y empresa, y generalmente no interoperable con otros sistemas.

En las ultimas decadas, con la explosion de los sistemas distribuidos y las redes globales,

ha crecido el interes por facilitar la interoperabilidad, reutilizacion e integracion de da-

tos espaciales. Para muchos sistemas, incorporar tecnologıas con gestion de informacion

geografica resulta un valor agregado que no habıa sido considerado previamente, como es

el caso de los servicios basados en ubicacion.

La Web Semantica se relaciona con la nocion de interoperabilidad. Se pretende dispo-

ner en la Web de conocimiento formal y explıcito que pueda ser interpretado por agentes

de software. En particular, se plantea la necesidad de una Web Semantica Geoespacial.

La demanda es por mejorar la disponibilidad de informacion y servicios geograficos. Con-

tar con la posibilidad de compartir datos y servicios implica disminuir costos y tiempos

de puesta en funcionamiento, ası como optimizar la confiabilidad de la informacion. Pa-

Page 12: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

iv

ra ello se necesitan estandares que provean el marco para la definicion de fenomenos y

servicios geograficos y unifiquen los modelos de representacion. Compartir informacion

no solo significa proveer acceso a los datos, tambien se debe brindar conocimiento para

que los datos puedan ser “interpretados”. Una forma de representar conocimiento es por

medio de ontologıas. Las ontologıas en Ciencias de la Computacion sirven como medio

para especificar formalmente el significado que se le asigna a los conceptos que modela

un programa o sistema. La especificacion formal y explıcita permite que el conocimiento

pueda ser compartido y reutilizado. En esta tesis se estudian los modelos de representa-

cion para informacion geografica, los resultados en estandarizacion sobre representacion de

fenomenos geograficos, y las necesidades y posibles soluciones usando ontologıas para des-

cribir semanticamente la informacion geografica, encausados a mejorar la disponibilidad

de entornos distribuidos heterogeneos.

Page 13: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Abstract

First automated systems working with geographic information date back to the ’70s.

Since then, several applications have evolved to satisfy the needs of different areas, like

meteorology, urban planning, transport, environmental services, tourism, economic distri-

bution, etc. Among its users are state and governmental organizations, educational and

research institutions, industry and commerce.

Finding ways for representing geographic information is a complex problem. Geograp-

hic data have references to one or more locations of the Earth’s surface and eventually

may require to include geometric properties. Models to represent geographic information

about real-world phenomena are organized in one of two abstractions: discrete model,

which considers the space and its objects, and continuous model, which imagines the spa-

ce as formed by positions with properties that describe them. First information systems

with the capacity of managing spatial data were restricted to a certain technology, juris-

diction and business rules, and in general were not interoperable with other systems of

the same kind. In the last few decades, due to the explosion of distributed systems and

global networks, a strong interest in providing interoperability, reuse and integration of

spatial data have emerged. Nowadays, for many systems incorporating technologies with

geographic information management is an added value that was not previously considered,

like is the case of location-based services.

The Semantic Web is related to the notion of interoperability. The desire is to have

formal and explicit knowledge in the Web so that it can be interpreted by software agents.

Particularly, there is a need of a Geospatial Semantic Web. The new demand is to improve

the availability of geographic information and services. Providing data and services sharing

means lower costs and start-up times beside optimize the reliability of the information.

This involves standards which provide the framework for defining services and geographic

phenomena and unify the models of representation. Sharing of information not only means

Page 14: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

vi

providing access to data, but also provide knowledge to make the data “interpretable”.

One way to represent knowledge is through the use of ontologies. In Computer Science

ontologies are a tool to formally specify the meaning assigned to concepts that use a

program or system. This formal and explicit specification allows knowledge to be shared

and reused. This thesis focuses on models to represent geographic information, standards

of representation for geographic features and needs and potential solutions using ontologies

for describe the semantic of geographic information aimed at improving the availability

of distributed heterogeneous geographic environments.

Page 15: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Indice general

Indice general VII

Indice de figuras XIII

Indice de cuadros XVII

1. Introduccion 2

1.1. Contexto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.3. Propuesta de investigacion . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.4. Organizacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.5. Resumen de las contribuciones . . . . . . . . . . . . . . . . . . . . . . . . . 9

2. Fundamentos de Bases de Datos Geograficas 11

2.1. Niveles de abstraccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.2. Modelos conceptuales para sistemas geograficos . . . . . . . . . . . . . . . 14

2.2.1. Modelo de datos geografico . . . . . . . . . . . . . . . . . . . . . . . 14

2.2.2. Modelos para esquemas de aplicacion geograficos . . . . . . . . . . 16

2.3. Modelos logicos para informacion geografica . . . . . . . . . . . . . . . . . 24

2.3.1. Modelo mosaico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.3.2. Modelo vector . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

Page 16: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

viii INDICE GENERAL

2.3.3. Representacion de geometrıa para colecciones de objetos . . . . . . 26

2.3.4. Evaluacion de los modelos . . . . . . . . . . . . . . . . . . . . . . . 29

2.4. Bases de Datos Espaciales . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.4.1. Tipos de Datos Abstractos Espaciales . . . . . . . . . . . . . . . . . 31

2.4.2. Operaciones espaciales . . . . . . . . . . . . . . . . . . . . . . . . . 31

2.5. Resumen del capıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3. Sistemas de Informacion Geografica 37

3.1. La tecnologıa SIG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.1.1. Alcance y servicios . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.1.2. Organizacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.2. Informacion geografica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.3. Caracterizacion de las aplicaciones SIG . . . . . . . . . . . . . . . . . . . . 42

3.3.1. Aspectos funcionales . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.3.2. Restricciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.4. Visualizacion de mapas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.4.1. Formas de representacion . . . . . . . . . . . . . . . . . . . . . . . . 46

3.4.2. Los mapas interactivos . . . . . . . . . . . . . . . . . . . . . . . . . 47

3.5. Arquitectura de los SIG . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.6. Areas de aplicacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

3.7. Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

3.7.1. Sismos y Terremotos en el mundo . . . . . . . . . . . . . . . . . . . 52

3.7.2. TOXMAP: Mapas sobre salud ambiental . . . . . . . . . . . . . . . 53

3.7.3. MAPS: Herramientas de Analisis y Mapas sobre Seguridad Publica 54

3.7.4. PROSIGA: Proyecto Sistema de Informacion Geografica Nacional

de la Republica Argentina . . . . . . . . . . . . . . . . . . . . . . . 55

3.8. Resumen del capıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

Page 17: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

INDICE GENERAL ix

4. Integracion de Informacion Geografica 59

4.1. Motivacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.2. Interoperabilidad e Integracion . . . . . . . . . . . . . . . . . . . . . . . . . 61

4.2.1. Heterogoneidad de informacion . . . . . . . . . . . . . . . . . . . . 62

4.2.2. Integracion de bases de datos heterogeneas . . . . . . . . . . . . . . 65

4.3. Integracion de Informacion Geograficos . . . . . . . . . . . . . . . . . . . . 67

4.3.1. Caracterizacion de la informacion geografica . . . . . . . . . . . . . 67

4.3.2. Heterogeneidad en informacion geografica . . . . . . . . . . . . . . . 68

4.4. Solucion a los problemas anteriores . . . . . . . . . . . . . . . . . . . . . . 74

4.4.1. Vocabularios y tesauros . . . . . . . . . . . . . . . . . . . . . . . . 74

4.4.2. Limitaciones de los tesauros . . . . . . . . . . . . . . . . . . . . . . 77

4.5. Resumen del capıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

5. Estandares Internacionales para Sistemas de Informacion Geografica 81

5.1. Conceptos generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

5.2. Organismos internacionales de estandarizacion . . . . . . . . . . . . . . . . 83

5.2.1. Open Geospatial Consortium (OGC) . . . . . . . . . . . . . . . . . 84

5.2.2. Organizacion Internacional para la Estandarizacion ISO/TC 211 . . 85

5.3. Estandares para informacion geografica . . . . . . . . . . . . . . . . . . . . 87

5.3.1. ISO/TC211 19101 Modelo de Referencia . . . . . . . . . . . . . . . 88

5.3.2. ISO/TC211 19109 Modelo conceptual estandar para Esquemas de

Aplicacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

5.3.3. ISO/TC211 19107 Modelo conceptual estandar para Fenomenos

Geograficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

5.3.4. Otras normas de la familia ISO 19000 . . . . . . . . . . . . . . . . . 99

5.4. GML: El Lenguaje de Marcado Geografico . . . . . . . . . . . . . . . . . . 101

5.4.1. Caracterısticas de GML . . . . . . . . . . . . . . . . . . . . . . . . 102

Page 18: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

x INDICE GENERAL

5.4.2. Descripcion de GML schema . . . . . . . . . . . . . . . . . . . . . . 103

5.4.3. Ventajas de GML . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

5.5. Resumen del capıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

6. Ontologıas para Informacion Geografica 109

6.1. Ontologıas y representacion de conocimiento . . . . . . . . . . . . . . . . . 110

6.1.1. ¿Por que definir ontologıas? . . . . . . . . . . . . . . . . . . . . . . 111

6.1.2. Uso de ontologıas en Ciencias de la Computacion . . . . . . . . . . 112

6.2. Formalizacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

6.2.1. Definicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

6.2.2. Componentes de una ontologıa . . . . . . . . . . . . . . . . . . . . . 114

6.2.3. Definicion formal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

6.3. Tipos de ontologıas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

6.3.1. Clasificacion segun generalidad . . . . . . . . . . . . . . . . . . . . 117

6.3.2. Clasificacion segun expresividad . . . . . . . . . . . . . . . . . . . . 117

6.4. Interoperabilidad e Integracion para Informacion Geografica . . . . . . . . 120

6.4.1. Recuperacion de IG basada en catalogos . . . . . . . . . . . . . . . 120

6.4.2. Recuperacion de IG basada en ontologıa . . . . . . . . . . . . . . . 122

6.5. Diseno de ontologıas para informacion geografica . . . . . . . . . . . . . . . 124

6.5.1. Creacion de ontologıas . . . . . . . . . . . . . . . . . . . . . . . . . 124

6.5.2. Cohesion entre una aplicacion y una ontologıa de dominio . . . . . 126

6.6. Sistemas de Informacion Geografica conducidos por ontologıas . . . . . . . 128

6.6.1. El ciclo de vida del sistema . . . . . . . . . . . . . . . . . . . . . . 128

6.6.2. Inclusion de ontologıas en la etapa de desarrollo . . . . . . . . . . . 129

6.6.3. Vinculacion de un SIG en produccion con nuevas ontologıas . . . . 130

6.7. Resumen del capıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

Page 19: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

INDICE GENERAL xi

7. Conclusiones y Trabajos Futuros 133

7.1. Resumen de la investigacion . . . . . . . . . . . . . . . . . . . . . . . . . . 133

7.2. Resultados obtenidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

7.3. Publicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

7.4. Trabajo Futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

A. Ejmplo GML 141

A.1. Definicion GML del Esquema de Aplicacion Mapa Urbano . . . . . . . . . 141

B. Abreviaturas y Acronimos 147

C. Glosario 149

Bibliografıa 157

Page 20: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,
Page 21: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Indice de figuras

1.1. El proceso de modelado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2. Niveles de Abstraccion y Modelos de Representacion . . . . . . . . . . . . 7

1.3. Integracion de IG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.1. Abstracciones en SMBD . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.2. Modelos Conceptuales Geograficos . . . . . . . . . . . . . . . . . . . . . . . 14

2.3. El espacio segun el modelo basado en campos . . . . . . . . . . . . . . . . 15

2.4. El espacio segun el modelo basado en objetos . . . . . . . . . . . . . . . . 15

2.5. Jerarquıa de abstraccion espacial en MADS . . . . . . . . . . . . . . . . . 19

2.6. Vista parcial de un modelo conceptual para un problema disenado con MADS 20

2.7. Esquema de aplicacion en MADS con objetos y relaciones espaciales . . . . 21

2.8. Clases espaciales Geo-campos o continuas . . . . . . . . . . . . . . . . . . 22

2.9. Clases espaciales Geo-objetos o discretas . . . . . . . . . . . . . . . . . . . 22

2.10. Generalizacion en OMT-G . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.11. Agregacion espacial en OMT-G . . . . . . . . . . . . . . . . . . . . . . . . 23

2.12. Modelos de representacion . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.13. Dos representaciones del modelo mosaico . . . . . . . . . . . . . . . . . . . 25

3.1. Composicion de un SIG . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3.2. Representaciones geograficas en el mapa . . . . . . . . . . . . . . . . . . . 46

3.3. Google Maps - Buscar camino . . . . . . . . . . . . . . . . . . . . . . . . . 48

Page 22: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

xiv INDICE DE FIGURAS

3.4. Earthquake Hazards Program - Mapas sobre los terremotos de Chile 2010 53

3.5. SIG - TOXMAP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

3.6. PROSIGA - Datos provistos por la Secretarıa de Energıa de la Nacion . . . 56

4.1. Dos modelos de datos para un mismo problema inmobiliario . . . . . . . . 64

4.2. Mapas Tematicos de Europa - variables cualitativas y cuantitativas . . . . 68

4.3. Definicion del Thesaurus GEMET para el concepto “Wetland” . . . . . . . 75

5.1. El proceso de modelado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

5.2. Proceso de Transformacion: de la realidad a los datos . . . . . . . . . . . . 89

5.3. Fragmento del Modelo de Fenomeno General . . . . . . . . . . . . . . . . . 90

5.4. Fragmento del Esquema Conceptual de Aplicacion “Rıos de Argentina” . . 91

5.5. Modelo de Objetos de GFM para el modelado de “Rıos de Argentina” . . . 91

5.6. Jerarquıa de Tipo de Atributo . . . . . . . . . . . . . . . . . . . . . . . . . 93

5.7. Jerarquıa de Tipo de Asociacion . . . . . . . . . . . . . . . . . . . . . . . . 93

5.8. ISO 19107 - Paquetes y sus clases geometricas . . . . . . . . . . . . . . . . 95

5.9. Jerarquıa de clases de geometricas . . . . . . . . . . . . . . . . . . . . . . . 97

5.10. Paquetes Topologicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

5.11. Diagrama de Clases Topologicas . . . . . . . . . . . . . . . . . . . . . . . . 99

5.12. Primitivas topologicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

5.13. Relacion entre geometrıa y topologıa . . . . . . . . . . . . . . . . . . . . . 100

5.14. Ejemplo de esquema de aplicacion Mapa Urbano . . . . . . . . . . . . . . . 105

6.1. Ejemplo de Modelado de Conceptos y Relaciones . . . . . . . . . . . . . . 112

6.2. Composicion de una ontologıa . . . . . . . . . . . . . . . . . . . . . . . . . 113

6.3. Conceptualizacion y ontologıa . . . . . . . . . . . . . . . . . . . . . . . . . 114

6.4. El entorno Cliente-Proveedores en el proceso de busqueda de IG . . . . . . 120

6.5. Formas de usar ontologıas para incluir conocimiento . . . . . . . . . . . . . 123

Page 23: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

INDICE DE FIGURAS xv

6.6. Un ejemplo de ontologıas de dominio . . . . . . . . . . . . . . . . . . . . . 125

6.7. Asociaciones semanticas entre Fenomenos, Tipos de Fenomenos y Onto-

logıas de Dominio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

6.8. Vistas multiples de un fenomenos geograficos . . . . . . . . . . . . . . . . . 126

6.9. Integracion entre aplicaciones usando ontologıa hıbrida . . . . . . . . . . . 126

6.10. Cohesion: Ontologıa de Aplicacion y Ontologıa de Dominio . . . . . . . . . 128

A.1. Ejemplo de esquema de aplicacion Mapa Urbano . . . . . . . . . . . . . . . 141

Page 24: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,
Page 25: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Indice de cuadros

1.1. Ejemplos de heterogeneidad entre SIG . . . . . . . . . . . . . . . . . . . . 6

2.1. Ejemplos de Objetos Espaciales . . . . . . . . . . . . . . . . . . . . . . . . 16

2.2. Ejemplos de aplicacion para los tipos espaciales en MADS . . . . . . . . . 20

2.3. Operaciones de los tipos region y lınea . . . . . . . . . . . . . . . . . . . 32

4.1. Heterogeneidad semantica en ontologıas . . . . . . . . . . . . . . . . . . . . 71

4.2. Definicion de las Relaciones entre Terminos de un Tesauro . . . . . . . . . 76

4.3. Relaciones entre termino Zona Inundable y otros elementos del tesauro . 77

5.1. Modelos Abstractos OGC . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

6.1. Ejemplos de Ontologıas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

Page 26: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,
Page 27: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Capıtulo 1

Introduccion

1.1. Contexto

Se reune bajo el nombre de Sistema de Informacion Geografico (SIG)1 al conjunto

de herramientas que sirven para capturar, almacenar, analizar, administrar y presentar

datos con referencia a una o varias ubicaciones sobre la superficie terrestre. Los requisitos

principales que se consideran para la definicion de los servicios esperados de un SIG son

[Lua04, Mit99a]:

1. un SIG es una coleccion de herramientas computacionales para realizar analisis

geografico y simulaciones [RSV02, BM98, DJ06].

2. un SIG esta basado en un conjunto de estructuras de datos y algoritmos para repre-

sentar, recuperar y gestionar informacion geografica[WD04, RSV02].

3. un SIG es una herramienta que colabora con la toma de decisiones en tareas rela-

cionadas con aspectos geograficos [RSV02, LGMR05].

En la tecnologıa SIG se combina conocimiento de diversas areas de las ciencias como

Cartografıa, Analisis Estadıstico y Bases de Datos, entre otras. Los SIG son una tecno-

logıa de proposito general que incluye servicios para analizar modelos, localizar eventos,

medir distancia entre eventos, encontrar caminos y explorar las relaciones entre dos o mas

1En Ingles Geographic Information System (GIS).

Page 28: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

2 Capıtulo 1. Introduccion

objetos. Los campos de aplicacion de esta tecnologıa son diversos, y entre ellos se pue-

den citar cartografıa, sensado remoto, distribucion de superficie, manejo de distribucion

polıtica, analisis sociologico, distribucion de recursos naturales, planeamiento urbano y

localizacion.

En un SIG las piezas de informacion se organizan por temas [Cor00, ASR+05,

LGMR05]. Un ejemplo de tema podrıa ser “Hidrografıa de Argentina” con datos sobre

rıos, lagos, lagunas; ası como sus ubicaciones, caudales, cuencas, cauces, etc. Tradicional-

mente, en el campo de la geografıa, se utilizo la estrategia de organizar la informacion

por temas. Utilizar esta misma abstraccion en la representacion digital de informacion

geografica (IG) favorece el modelado y los servicios de visualizacion. Desde la vision del

modelado, permite dividir y concentrar las necesidades de representacion a un conjunto

acotado de fenomenos reales y sus vınculos. Desde la visualizacion, la opcion de filtrado

por tema da libertad a los usuarios para decidir dinamicamente que temas mostrar y

que temas ocultar creando distintas representaciones visuales del mismo espacio geografi-

co. Por ejemplo, de la superposicion de los temas “Hidrografıa de Argentina ” y “Caminos

y rutas de acceso de Argentina” se puede responder a la consulta ¿como llegar desde Bahıa

Blanca al lago Nahuel Huapi?

La unidad de representacion en IG se denomina fenomeno geografico o simplemen-

te fenomeno2[MFW90, SMB+97]. Cada fenomeno es unico y distinguible; este referencia

a una locacion, espacio, area o region, y se puede visualizar en un mapa. Los fenome-

nos geograficos se organizan en dos abstracciones: objetos discretos, por ejemplo, un

monumento, una montana o un lago, y objetos continuos, por ejemplo, elevacion de la

superficie terrestre o el nivel de lluvias. Paralelamente, tambien existen dos formas de

representar digitalmente los datos geograficos: el modelo mosaico o raster y el modelo

vector [LT92, SCG+97, SC03].

En el proceso de modelado de un tema se identifican los fenomenos de interes para un

contexto de aplicacion, se los organiza en patrones o tipos de fenomenos y se caracteri-

zan por sus atributos y relaciones. Los atributos pueden ser atributos alfanumericos y/o

atributos espaciales. Finalmente, la instanciacion de los fenomenos reales a los tipos de

fenomenos y relaciones materializa la base de datos de la aplicacion (figura 1.1). Los atri-

butos espaciales tienen asociada una componente geometrica, que determina la forma y

dimension del fenomeno. Tambien se identifican las relaciones espaciales geometricas y/o

2En Ingles feature.

Page 29: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Contexto 3

Figura 1.1: El proceso de modelado

topologicas de interes. Las propiedades metricas de objetos geograficos incluyen longitud

y superficie (dependen de de la dimension del objeto) y relaciones metricas entre objetos

como distancia y/o relaciones de orientacion (“sobre”, “a la derecha de”, etc.). Las ope-

raciones topologicas hacen referencia a propiedades de vecindad, adyacencia, inclusion y

conectividad y permanecen invariantes ante cambios morfologicos, de escala o de proyec-

cion. Las representaciones usando los modelos vector o mosaico difieren en cuanto a la

eficiencia de representacion y la capacidad para resolver consultas espaciales. La eleccion

de una u otra implementacion depende principalmente del problema. En general los SIG

proveen ambos modelos de representacion.

Las calidades “interoperabiliadad” e “integracion” en varias oportunidades se utilizan

indistintamente, aunque en un sentido estricto son distintas [GJM02]. En Ingenierıa de

Software, la calidad de interoperabilidad se relaciona con la capacidad de un sistema

para integrar componentes de software que provienen de diferentes desarrolladores. Esto

permite a un nuevo producto ingresar al mercado a competir con otros y ofrecer software

integrable con otros modulos. Desde el modelo de datos, la calidad de integracion se refiere

a la posibilidad de compartir informacion, esto es, los datos y su significado. Cuando la

informacion es producida y gestionada localmente, en general, resulta precisa en el ambito

Page 30: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

4 Capıtulo 1. Introduccion

de su comunidad de uso. Sin embargo, cuando la misma ha sido producida por otros esto

deja de ser cierto, y se requiere de conocimiento y de reglas de transformacion para integrar

informacion “heterogenea” o de fuentes no relacionadas.

En la ultima decada esta creciendo la necesidad de interoperabilidad e integracion en

distintos ambitos de aplicacion de IG: SIG, Infraestructuras de Datos Espaciales (IDE)3

y Sistemas Moviles Basados en Ubicacion (LBMS)4. Interoperabilidad e integracion son

calidades que ganan importancia en el campo de los productos tecnologicos de infor-

macion geografica. La integracion en las aplicaciones que trabajan con IG presenta una

dificultad adicional: al momento de intercambiar informacion no solo aparecen diferencias

a nivel de modelos del dominio, sino tambien de modelos de representacion para datos

geograficos heredados desde sistemas de geoprocesamiento ya desarrollados y que carecen

de estandarizacion en lo que hace a la representacion de la IG.

Los problemas de heterogeniedad en IG se clasifican en niveles o vistas que impactan

de distinta forma en cuanto a las dificultades de integracion. La vista de heterogeneidad

sintactica considera que distintas soluciones pueden ofrecer diferentes formatos y modelos

de datos (vector y mosaico) y hasta distintos sistemas de coordenadas para representar

fenomenos identicos. Se considera como nivel de heterogeneidad estructural en IG cuan-

do los modelos de distintas soluciones representan los mismos fenomenos con distintos

atributos (estructuras distintas). El nivel de heterogeneidad semantica en IG se establece

cuando distintas soluciones interpretan significados distintos para los mismos fenomenos

del mundo a modelar. El cuadro 1.1 ejemplifica dichos niveles de heterogeneidad. Las

dificultades de heterogeneidad sintactica son mas simples de resolver usando sistemas de

transformacion automaticos. Una solucion parcial a los problemas de heterogeneidad es-

tructural y semantica es contar con tesauros que normalicen los terminos del dominio de

aplicacion. La integracion semantica de IG ha motivado importantes investigaciones en el

area de Ciencias de la Computacion. Las soluciones a problemas de integracion semanti-

ca generalmente se vinculan con la definicion de ontologıas que incluyan especificaciones

formales para los modelos de representacion de cada solucion.

3En Ingles Spatial Data Infraestructure (SDI).4En Ingles Local Based Mobile System (LBMS).

Page 31: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Objetivos 5

Ejemplos

Heterogeneidad Sistema S1 Sistema S2

sintatica S1 representa zonas por

densidad de poblacion de

Bahıa Blanca bajo el mode-

lo vector.

S2 representa zonas por

densidad de poblacion de

Bahıa Blanca bajo el mode-

lo mosaico.

estructural S1 representa zonas por

densidad de poblacion de

Bahıa Blanca, incluyendo

detalle de los servicios

publicos.

S2 representa zonas por

densidad de poblacion de

Bahıa Blanca, incluyendo

detalles sobre los tipos de

construccion (edificios, ca-

sas, barrios cerrados, etc.).

semantica S1 representa densidad de

poblacion de Bahıa Blanca

considerando numero de ha-

bitantes.

S2 representa densidad de

poblacion de Bahıa Blanca

considerando unidades fa-

miliares.

Cuadro 1.1: Ejemplos de heterogeneidad entre SIG

1.2. Objetivos

El objetivo principal de este trabajo es “estudiar los modelos de representacion para

IG con el fin de establecer las necesidades de descripcion semantica que permitan avanzar

hacia una mejora en la disponibilidad de la IG en entornos heterogeneos distribuidos”.

Como parte de este objetivos se identifican las siguientes metas parciales que colabo-

raran con el resultado final:

1. Estudiar las particularidades de representar IG.

2. Estudiar los modelos de representacion para IG existentes, organizandolos segun su

nivel de abstraccion.

3. Identificar las necesidades y las dificultades en integracion de IG.

4. Relevar el estado actual del arte en estandarizacion de IG y las posibilidades de

integracion basada en estandares.

Page 32: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

6 Capıtulo 1. Introduccion

5. Relevar el estado actual del arte en definicion de ontologıas de IG y las posibilidades

de integracion semantica.

1.3. Propuesta de investigacion

Como se menciono en la seccion anterior, el objetivo de esta tesis es el estudio de los

modelos de representacion de IG con el proposito de anadir conocimiento semantico a

los mismos. Inicialmente, el tema de investigacion plantea dos desafıos: existen diversas

formas de representacion para la IG y de las que no se tiene un conocimiento acabado y

por otra parte, el dominio de aplicacion y las necesidades de los SIG son desconocidos.

Como inicio de la investigacion se abordaran estos dos temas. Para los modelos exis-

tentes, se utilizara la estrategia usada por las tecnologıas de bases de datos y se iden-

tificaran las vistas abstractas para los datos geograficos: fısica, logica y conceptual. Se

hara un relevamiento de los modelos actuales, analizando sus caracterısticas y restriccio-

nes [Ull88, RSV02, PSZ+98, RJB98, RBP+91]. En la figura 1.2 se presentan graficamente

las piezas en las que se organizan estos temas de estudio.

A partir del conocimiento basico sobre representacion de IG, se hara un relevamiento

de las caracterısticas y requerimientos de los SIG. Para ellos se estudiaran las tecno-

logıas existentes, arquitecturas, representacion de abstracciones geograficas, los SIG como

una herramienta de proposito general para problemas con datos espaciales, ambitos de

aplicacion y algunos ejemplos de uso [Zei99, Cla86, BM98].

Las tecnologıas SIG comenzaron a utilizarse en decada del ‘70. Las caracterısticas

especiales de la IG, como mantener referencias con una o mas locaciones de un espa-

cio subyacente y eventualmente requerir mantener propiedades geometricas, hicieron que

originalmente, cada propuesta de implementacion eligiera soluciones diferentes y propias.

Esto impacta al momento de buscar compartir datos o servicios entre sistemas. En la deca-

da del ‘90, e impulsados por las necesidades de nuevas tecnologıas emergentes (LBMS,

IDE), organizaciones internacionales comienzan a trabajar fuertemente en definir estanda-

res para sistemas geograficos [OGC94, ISO94, CEN07]. Se hara un relevamiento de las

necesidades de integracion, resultados en lo relacionado con recomendaciones y estandares

para gestion de IG y limitaciones. Finalmente, dada la tendencia actual, para enriquecer

semanticamente la informacion y analizar el impacto en cuanto a capacidades de integra-

cion de informacion, se estudiara el uso de las ontologıas aplicado al ambito de aplicaciones

Page 33: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Organizacion 7

Figura 1.2: Niveles de Abstraccion y Modelos de Representacion

con IG [Gru93, Gua98, WVV+01, Usc98]. En la figura 1.3 se esquematiza como se orga-

niza la definicion de estandares y ontologıas para SIG en relacion con las posibilidades de

integracion.

1.4. Organizacion

La estructura de esta tesis es la siguiente:

En el Capıtulo 2 se describen los modelos de representacion para la IG. La IG es un

tipo particular de informacion con exigencias comparables a las de cualquier otra infor-

macion que requiera de persistencia. En el area de bases de datos se usa la estrategia

de identificar distintos niveles de abstraccion para los modelos de datos. Ası se identifi-

ca el nivel conceptual o de mayor abstraccion. Este nivel provee los constructores para

identificar los elementos del dominio que se desea modelar y como se relacionan. El nivel

Page 34: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

8 Capıtulo 1. Introduccion

Figura 1.3: Integracion de IG

logico o discreto es un nivel de abstraccion intermedia. Este provee los constructores para

representar los esquemas de aplicacion en la computadora. Finalmente el nivel fısico o

menos abstracto es el que se ocupa de las estructuras de bajo nivel para administrar y

optimizar el acceso a los datos almacenados. En este capıtulo se caracterizan los requeri-

mientos especıficos de la IG en los distintos niveles y se recopilan y describen los modelos

de datos para IG existentes.

En el Capıtulo 3 se hace un estudio de las caracterizaciones y requerimientos de los

SIG y se identifican sus componentes. En los ‘70 cuando surgen las primeras aplicaciones

SIG, bases de datos, lenguajes de programacion y paradigmas de desarrollo no estaban

preparados para representar informacion con requerimientos espaciales. Ası cada provee-

dor definio sus propios modelos y estrategias de representacion. Las areas de aplicacion

para los SIG son amplias y siguen creciendo. Asimismo, son diversas las necesidades de

informacion y consulta. Entre los dominios de aplicacion se incluyen economıa, gestion

ambiental, turismo, comunicaciones, demografıa y organizacion polıtica entre varios otros.

Estas y otras areas pueden tomar ventajas del conocimiento de la informacion vinculada

Page 35: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Organizacion 9

al espacio de referencia. Por esta razon los SIG se han hecho populares en el ambito pri-

vado, publico y de investigacion y educacion. Al final de este capıtulo se incluyen a modo

de ejemplo algunas aplicaciones de variados dominios de interes.

En el Capıtulo 4 se presentan los conceptos de integracion e interoperabilidad relacio-

nados con aplicaciones que manejan IG. Se clasifican y estudian los niveles de heterogenei-

dad en la informacion en general y en particular los relacionados con IG. Varias fuentes de

datos SIG heterogeneas acumulan IG con datos espaciales en diversos formatos. El costo

que significa para un SIG contar con IG y el hecho de que cierta informacion de base,

como por ejemplo la distribucion polıtica de una region exista, hacen que haya crecido el

interes en clientes y proveedores por compartir datos y servicios. Para compartir IG se

trabaja en definir normas y estandares relacionados con la representacion de informacion

en los distintos niveles de abstraccion.

En el Capıtulo 5 se recopila el trabajo en estandarizacion de los dos organismos in-

ternacionales que trabajan en normalizacion geoespacial: el consorcio “Open Geoespacial

Consortium” (OGC) y el Organismo Internacional de Estandarizacion (ISO) desde su co-

mite Tecnico ISO/TC 211. Ambas organizaciones vienen trabajando desde el ano 1990,

y lo siguen haciendo en la actualidad, en lo que respecta a la definicion de estandares

para favorecer la geodisponibilidad de la informacion y de los servicios geograficos. Ac-

tualmente trabajan cooperativamente, ISO/TC 211 definiendo las normas y estandares de

representacion y OGC especificando estandares implementables que respeten las normas

ISO. Los resultados obtenidos hasta el momento son aceptados en el dominio de IG y han

incrementado las posibilidades de compartir informacion y servicios.

En el Capıtulo 6 se estudian a las ontologıas como medio para enriquecer semantica-

mente a las aplicaciones geograficas. Las ontologıas buscan unificar la representacion para

sımbolos y terminos de forma tal que dicha interpretacion sea unica y ademas pueda ser

“leida” por agentes automaticos. Existen diversas ontologıas y entre ellas difieren en el

nivel de detalle que expresan. Mas aun, una buena practica es organizar los terminos en

distintas ontologıas segun el nivel de detalle. Esto permite contar con ontologıas generales

y especıficas. Una o mas ontologıas definidas para un dominio de aplicacion comun a va-

rios SIG podrıan ser las mediadoras para la integracion de informacion. En este capıtulo

se va estudiar el estado actual del arte en el uso de ontologıas para SIG.

En el Capıtulo 7 se cierra este trabajo de investigacion. Se presentan los principales

logros alcanzados, conclusiones y trabajos futuros.

Page 36: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

10 Capıtulo 1. Introduccion

Se incluyen ademas Apendices con el desarrollo de un ejemplo en GML, las abreviatu-

ras y acronimos usados y un glosario de definiciones. Finalmente se ubican las referencias

bibliograficas.

1.5. Resumen de las contribuciones

Como resultado de este trabajo de investigacion se esperan realizar las siguientes

contribuciones:

1. Recopilar y organizar el estado actual del arte en modelos de representacion para

IG. La informacion geografica es naturalmente compleja y variada. Para administrar

su complejidad se han definido diversos modelos con diferentes grados de represen-

tacion. Sin embargo, el material existente sobre este topico es disperso y en general

poco relacionado. Se espera contribuir en su organizacion.

2. Hacer un analisis exhaustivo de los problemas de integracion de IG y las soluciones

actuales. Las exigencias por integrar informacion y servicios geograficos han tomado

impulso como resultado de las tecnologıas emergentes para IG. Las caracterısticas

particulares de los fenomenos geograficos y las heterogeneidades de representacion

exigen analizar los nuevos desafıos de integracion que se presentan.

3. Recopilar los estandares en IG e identificar los aportes de los mismos con relacion

a interoperabildad e integracion de IG. Las primeras tecnologıas SIG datan de los

‘70. Originalmente cada proveedor determino sus propios modelos y estructuras de

representacion. La falta de unificacion en los modelos es la primera dificultad a

sortear para avanzar en las calidades de interoperabilidad e integracion. Desde la

decada del ‘90 organizaciones internacionales vienen trabajando en definir estanda-

res para datos y servicios geograficos. En este trabajo se recopilaran los principales

resultados obtenidos.

4. Recopilar y organizar el estado actual del arte en ontologıas para IG y soluciones

propuestas. Sin la definicion de estandares de representacion la comunicacion en-

tre clientes y proveedores heterogeneos es casi imposible. Sin embargo, esta unica

solucion no es suficiente si se desea avanzar en la automatizacion del proceso de

integracion. Cada modelo de datos de un problema tiene conocimiento semantico

Page 37: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Resumen de las contribuciones 11

implıcito que no se puede expresar en el diccionario de datos. Un medio emergen-

te para representar conocimiento semantico son las ontologıas. En este trabajo se

van a investigar las posibilidades de uso de ontologıas para modelar conocimiento

semantico sobre IG.

5. Identificar problemas abiertos y trabajos futuros. Finalmente, como resultado de

este trabajo se espera identificar problemas abiertos a la investigacion que generen

nuevos desafıos y lıneas de investigacion.

Page 38: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,
Page 39: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Capıtulo 2

Fundamentos de Bases de Datos

Geograficas

Se denominan Sistemas de Informacion Geografica (SIG) a los sistemas usados para

recolectar, analizar y presentar informacion que describe propiedades fısicas y logicas del

mundo de la geografıa. En un sentido amplio, el termino SIG se aplica al conjunto de

procedimientos manuales o asistidos por la tecnologıa que sirven para gestionar datos

con referencias geograficas [SMB+97] o datos espaciales1. Los datos geograficos estan

vinculados con una locacion en la superficie terrestre.

En sus orıgenes, el manejo de IG se limito a procesos manuales no interactivos con

representacion en el plano bajo la forma de mapas. Con el desarrollo de tecnologıas para

la recoleccion y digitalizacion de datos geograficos surgio la necesidad de proveer algun

tipo de aplicacion que permitiera el manejo y analisis interactivo de los mismos. Esto dio

lugar a aplicaciones que se conocen como aplicaciones geograficas o SIG. Un SIG [RSV02]

es mas que una herramienta cartografica para producir mapas, es un tipo de software de

aplicacion que incluye, entre otras, capacidades para manipular datos geograficos, provee

herramientas para analisis espacial y ofrece mecanismos de visualizacion e interaccion que

permiten que usuarios expertos del dominio analicen la informacion.

Debido al incremento en el volumen de los datos geograficos, una de las tareas de un

SIG es tambien administrar eficientemente grandes bases de datos con IG. Las bases de

1En esta tesis se refiere a los terminos dato espacial y geografico indistintamente. En un sentido

estricto, dato espacial es mas general. Refiere datos con referencia a un plano, que puede ser la Tierra u

otro.

Page 40: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

14 Capıtulo 2. Fundamentos de Bases de Datos Geograficas

datos espaciales se ocupan especıficamente de la gestion de este tipo de informacion con

referencia a un plano. En representacion de datos, y usando el principio de abstraccion, se

definen distintos modelos de datos para manejar representaciones de datos con diversos

grados de detalle. Los modelos de datos utilizados por los sistemas de informacion (SI)

para aplicaciones comerciales no estan preparados para representar y administrar IG. Ni

los modelos conceptuales de datos tradicionales como Modelo Entidad−Relacion (MER)

[Che76] o los modelos orientados a objetos como el Modelo de Clases de UML [RJB98]; ni

los modelos logicos como el relacional [Cod70] cuentan con las estructuras adecuadas para

representar entidades y relaciones que se ajusten naturalmente a problemas geograficos.

La representacion de IG en una computadora requiere de nuevas abstracciones como pun-

to, curva o surperficie y colecciones de estos. Las operaciones provistas por los modelos

logicos tradicionales tambien resultan incompletas para resolver consultas como distan-

cia, direccion o interseccion. Finalmente las representaciones fısicas tıpicas tampoco son

adecuadas para manipular de forma eficiente datos geograficos almacenados.

En este capıtulo se recopilan y se describen los requerimientos para representar IG en

los distintos niveles de abstraccion conceptual, logico y fısico bajo la premisa de cubrir las

necesidades de diversas aplicaciones SIG. Se presentan los principales modelos existentes

para cada uno de los niveles, sus componentes, capacidades y limitaciones. Se presentan

los sistemas de manejo o gestion para Bases de Datos Espaciales como el componente de

la arquitectura de un SIG responsable de la representacion, recuperacion y consulta de

IG.

2.1. Niveles de abstraccion

Para proveer manejo eficiente de grandes volumenes de informacion almacenada las

bases de datos se apoyan en estructuras complejas. Tradicionalmente, los Sistemas de

Manejo de Bases de Datos (SMBD)2 [Ull88, EN00, GMPQ+04, SKS10] han utilizado el

recurso de definir niveles o vistas abstractas sobre los datos para lograr cierta indepen-

dencia entre modelos. Esto permite ocultar detalles de implementacion y simplificar las

interfaces a los usuarios de bases de datos. La figura 2.1 muestra los tres modelos de

abstraccion tradicionalmente usados.

2En Ingles Database Management System (DBMS).

Page 41: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Niveles de abstraccion 15

Figura 2.1: Abstracciones en SMBD

El modelo conceptual o abstracto se utiliza para identificar componentes del mundo

real. El modelo conceptual no es directamente representable en la computadora porque

ignora las limitaciones computacionales para expresar tamano, continuidad o precision.

El modelo logico o discreto provee los constructores para trasladar el modelo conceptual a

las estructuras usadas a nivel de desarrollo. El modelo fısico, por su parte, define como se

almacenan los datos. Los modelos del nivel fısico incluyen estructuras de datos complejas

y de bajo nivel.

Los modelos de datos para SI tradicionales son insuficientes para modelar IG. Mode-

los conceptuales historicos como el MER carecen de constructores para describir ciertas

propiedades espaciales tıpicas de las entidades geograficas como forma o relaciones y/o

restricciones espaciales: distancia, inclusion, area y adyacencia entre otras. De la misma

forma, las transformaciones al modelo logico son incompletas en los mismos aspectos. El

modelo relacional tradicional ampliamente utilizado para SI provee un conjunto de tipos

de datos basicos (cadena, fecha, numero) insuficiente. Estos problemas de representacion

obviamente tampoco han sido considerados en el modelo fısico.

A continuacion a modo de ejemplo plantean se los requerimientos para un problema

que requiere de entidades geograficas y relaciones espaciales.

Ejemplo 2.1.1 Plantear el diseno para un problema que modele la organizacion admi-

nistrativa de una region. Se requiere representar a las entidades Provincias junto con

Page 42: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

16 Capıtulo 2. Fundamentos de Bases de Datos Geograficas

sus propiedades nombre, extension, numero de habitantes y forma (representando la ocu-

pacion geografica). Se definen ademas las entidades Ciudades, con atributos nombre y

ubicacion sobre la provincia y Paises con atributos nombre, sistema de gobierno y forma.

Entre ellas se establecen relaciones espaciales de inclusion, distancia y area ocupada.

Dificultades de modelar el problema con los modelos tradicionales.

No contar con tipos de datos para representar la geometrıa de las provincias.

No existen constructores para relaciones espaciales como Bahıa Blanca “esta inclui-

da” en la provincia de Buenos Aires, o Buenos Aires “limita con” La Pampa.

Responder a consultas como “¿que distancia separa a Bahıa Blanca de Mar del

Plata?” no es simple.

En las proximas secciones se presentan los principales modelos desarrollados para repre-

sentar IG. El proceso de modelado se basa en fundamentos matematicos rigurosos fuera

del alcance de esta tesis. A modo de referencia las entidades se localizan sobre un espacio

de interes <d y la funcion distancia euclidiana al que se denomina Espacio Euclıdeo. Los

puntos son elementos del espacio, asociados a un par de coordenadas cartesianas x e y. Las

entidades geograficas a traves del proceso denominado proyeccion al mapa son mapeadas

a una representacion plana.

En lo que sigue siempre que se hable de “entidad espacial” se esta refiriendo indis-

tintamente a una entidad geografica siguiendo el tema de interes de esta tesis. En un

sentido estricto, el termino “espacial” implica un alcance mas general, una instancia es-

pacial esta vinculada a una ubicacion en un plano, que puede ser la Tierra o cualquier

otro, como por ejemplo el plano de diseno de un circuito electronico. Los datos geograficos

estan especıficamente vinculados con una locacion en la superficie terrestre.

2.2. Modelos conceptuales para sistemas geograficos

En la representacion de problemas geograficos se distinguen dos planos concep-

tuales de abstraccion [MGR99, RSV02, Lua04]: un modelo conceptual para el “espacio

geografico” o modelo de datos geografico y un modelo conceptual para especificar el

“esquema de datos” o modelo de esquema de aplicacion geografica (figura 2.2). A

continuacion se presentan las alternativas para cada uno de ellos.

Page 43: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Modelos conceptuales para sistemas geograficos 17

Figura 2.2: Modelos Conceptuales Geograficos

2.2.1. Modelo de datos geografico

La interpretacion del espacio geografico depende de la semantica del problema. Por

ejemplo, dado el territorio de la provincia de Buenos Aires, en un problema administrativo,

la provincia se particiona en municipios; desde una vision geologica, el espacio se organiza

en areas geologicas; en control del trafico, el foco se ubica en la red de caminos. Cada

problema define una interpretacion del espacio y la coleccion de entidades necesarias para

describirlo. La organizacion de las entidades sobre un topico particular en un SIG se

denomina tema.

Las tecnologıas SIG reconocen dos formas diferentes de representacion para el espacio

subyacente [SCG+97]: el modelo espacial basado en campos3 y el modelo espacial basado en

objetos4. En la aproximacion espacial basada en campos cada punto del espacio esta aso-

ciado con uno o varios valores de atributos definidos como funciones continuas sobre x e

y. Por ejemplo, altitud sobre el nivel del mar, temperatura, etc. Las mediciones sobre los

distintos fenomenos se reunen como valores de atributos variando con la ubicacion en el

plano. La figura 2.3 muestra la representacion en un mapa para el modelo espacial basado

en campos. La interpretacion del espacio como un campo continuo es lo que contrasta con

el modelo basado en objetos.

En la aproximacion basada en objetos el espacio esta poblado de entidades discretas

con identificacion. Cada entidad tiene asociada un componente espacial, que se corres-

ponde con la forma y ubicacion del objeto en el espacio subyacente, y un conjunto de

propiedades descriptivas. En la figura 2.4 se muestra el mapa de la provincia de Buenos

Aires bajo esta representacion; se pueden observar las entidades discretas rutas repre-

sentadas como “lıneas” y ciudades que estan simbolizadas con “puntos”.

3En Ingles Field-based model.4En Ingles Object-based model.

Page 44: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

18 Capıtulo 2. Fundamentos de Bases de Datos Geograficas

Figura 2.3: El espacio segun el modelo basado en campos

Los modelos basados en objetos usan abstracciones para representar las distintas clases

de objetos geograficos. La eleccion de alguna abstraccion depende de las dimensiones

del objeto geografico punto(0−dimension), curva(1−dimension), superficie(2−dimension)

o volumen(3−dimension). Los puntos son usados para representar entidades cuya forma

no es de interes o es despreciable, pero sı se quiere conocer su ubicacion. Los objetos de tipo

lıneas communmente se utilizan para representar redes. El tipo geometrico generalmente

se conoce como polilınea. Una polilınea se define como un conjunto finito de arcos o

segmentos, de modo que cada extremo es compartido exactamente por dos segmentos a

excepcion de los puntos extremos, que pertenecen a un unico segmento. Los objetos de

dimension dos se usan para representar areas y su tipo geometrico es el polıgono. Un

polıgono es una region del plano limitada por una polilınea cerrada.

El cuadro 2.1 muestra algunos de los usos clasicos de estas abstracciones. La eleccion

del tipo de abstraccion no es fija y depende del uso que se dara a la coleccion de entidades.

Distintos factores pueden influenciar en la decision, uno especialmente importante es la

escala de interes. Por ejemplo, un aeropuerto puede representarse como un punto, si

interesan representar lıneas aereas, o como un area, si el foco es la organizacion interna

Page 45: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Modelos conceptuales para sistemas geograficos 19

Figura 2.4: El espacio segun el modelo basado en objetos

del aeropuerto.

2.2.2. Modelos para esquemas de aplicacion geograficos

El termino esquema de aplicacion en el area de bases de datos se utiliza para referir al

diseno de la estructura estatica que mantiene la informacion, mientras que se denomina

instancia de base de datos al conjunto de valores ajustados a un esquema en un instan-

te de tiempo. Las instancias son dinamicas y se espera que el contenido de la base de

datos evolucione constantemente en el tiempo; los esquemas son estaticos y se desea que

permanezcan invariantes.

El modelo conceptual para especificar bases de datos espaciales debe permitir a los

disenadores definir esquemas de aplicacion para SIG con una variedad de necesidades. En

SI tradicionales este rol es cubierto por el MER [Che76] o los Diagramas de Clases del

Dominio de UML [RJB98], pero resultan insuficientes para aplicaciones espaciales. Un

modelo conceptual para representar problemas del area de la Geografıa debe ser capaz de

representar:

Page 46: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

20 Capıtulo 2. Fundamentos de Bases de Datos Geograficas

Dimension Nombre Aplicacion

0-Dimension punto Ubican entidades cuya forma no es considerada

relevante o la superficie que ocupan es muy

chica con relacion al espacio.

Ejemplos: ciudades, centros comerciales, etc.

1-Dimension lınea Se usan para representar entidades con forma de

redes o grafos.

Ejemplos: rıos, caminos, etc.

2-Dimension superficie Representan entidades con area. Los polıgonos son

el principal tipo geometrico para representar tales

objetos.

Ejemplos: regiones, secciones, etc.

Cuadro 2.1: Ejemplos de Objetos Espaciales

Abstracciones de alto nivel para modelos espaciales basadas en objetos o en campos.

Entidades tradicionales y georeferenciadas.

Tipos de atributos usados por aplicaciones geograficas incluyendo abstracciones

geometricas.

Relaciones espaciales y restricciones de integridad espacial.

El modelo conceptual de esquemas de aplicacion provee las abstracciones para repre-

sentar a los elementos del mundo real. En orientacion a objetos a esta abstraccion se la

denomina objeto, mientras que en el MER se la identifica como entidad. En los modelos

conceptuales para IG recibe el nombre de fenomeno y es lo que identifica a un objeto

geografico del mundo real distinguible de otros. Por ejemplo, el parque nacional “Los

Arrayanes” es un fenomeno. Los fenomenos se caracterizan por atributos que pueden ser

atributos espaciales y/o atributos descriptivos o alfanumericos.

Ejemplo 2.2.1 Fenomeno

Parque Nacional Los Arrayanes = ((nombre,“Los Arrayanes”), (ano-

fundacion,“1971”), (ubicacion, instancia de GM Surface5), (descripcion, “Unidad boscosa

5Instancia de GM Surface sobre el extremo norte del Lago Nahuel Huapi.

Page 47: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Modelos conceptuales para sistemas geograficos 21

compuesta por arrayanes. El Parque Nacional Los Arrayanes conserva una muestra de la

eco-region bosque patagonico, cuyo clima es templado a frıo y humedo, con nevadas y llu-

vias invernales. Se caracteriza por un paisaje de montana de relieve abrupto y escarpado,

con valles glaciarios”)).

En la literatura se pueden encontrar diversas propuestas para modelar esquemas con

IG [SCG+97, KPS95, OPM97, MFW90]. Los beneficios de utilizar un enfoque de mo-

delado conceptual que apoye el diseno de la base de datos son conocidos y ampliamen-

te aceptados: disenadores y usuarios pueden expresar e intercambiar su conocimiento

acerca de la aplicacion utilizando conceptos que les son familiares; independizandose

ası de cuestiones propias de la herramienta de software de implementacion. En esta

seccion se incluye la presentacion de dos de los modelos existentes para esquemas de

aplicacion geograficos: Modeling Application Data with Spatio-temporal features (MADS)

[PSZ99, PSZ+98, PSZ06b, PSZ06a] y OMT−G [BLD99, KABL01]. Ambos proveen so-

porte visual para representar informacion espacial y temporal, lo que los hace mas claros

e intuitivos para modelar. Se eligieron estos dos modelos por ser representativos de los

tipos de modelos mas usados en diseno conceptual de SI. Mientras que MADS se asemeja

al MER tradicional, OMT−G se presenta como una extension del Lenguaje de Modelado

Orientado a Objetos OMT6 [RBP+91], que sustento la definicion del Lenguaje Unificado

de Modelado UML [RJB98].

MADS: Modelado de aplicaciones de datos que incluyen fenomenos espacio

temporales

MADS es un modelo conceptual creado para problemas que manejan datos espaciales

y/o temporales disenado respetando las calidades de simplicidad y poder expresivo. Una

caracterıstica saliente de MADS es que se apoyo en el principio de ortogonalidad. Maneja

los aspectos multidimensionales descomponiendolos en vistas independientes, consideran-

do por separado las diferentes dimensiones a modelar: estructuras de datos, espacio, tiem-

po y representacion. Incluye una sintaxis visual y adopta el paradigma objeto−relacional

y las definiciones normalizadas por Object Database Management Group (ODMG)7.

En MADS la espacialidad y la temporalidad se asocian con tipos de objetos, atributos,

relaciones y agregados. El sistema de tipos cuenta con los tipos espaciales basicos: punto,

6En Ingles Object-Modeling Technique.7http://www.odbms.org/odmg/

Page 48: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

22 Capıtulo 2. Fundamentos de Bases de Datos Geograficas

Figura 2.5: Jerarquıa de abstraccion espacial en MADS

lınea, area y especializaciones de estas. Tambien incluye tipos espaciales para representar

conjuntos homogeneos de objetos basicos: conjunto de puntos, conjunto de lıneas, conjunto

de lıneas orientadas y conjuntos de areas. Estos tipos espaciales conforman la jerarquıa

que se muestra en la figura 2.5. La raız se corresponde con el tipo espacial “geo” del que

desprenden “simple geo” y “complex geo”. Tambien se puede observar que para cada tipo

espacial la espacialidad se visualiza con ıconos que expresan la informacion de manera no

ambigua, visual y sintetica.

Cada tipo espacial tiene asociado un conjunto de metodos que permiten definir y

manipular instancias del tipo. Por ejemplo, el metodo dimension esta definido para tipo

geo, mientras que longitud se define para lınea. De manera similar MADS define una

jeraquıa de tipos para tipos de datos temporales [PSZ06b].

Ejemplo 2.2.2 Problema de Aplicacion

Disenar el modelo de datos para el problema de representar recorridos de las lıneas de

colectivo urbano.

El cuadro 2.2 muestra ejemplos de entidades y sus tipos espaciales segun MADS para

el problema del ejemplo.

Los objetos pueden tener espacialidad estatica, si se les asigna alguno de los tipos

espaciales hoja a su tipo de objeto, o indeterminada si se le asigna el tipo espacial geo.

Page 49: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Modelos conceptuales para sistemas geograficos 23

Tipo de Objeto Tipo Espacial Descripcion

Parada punto Representa a fenomenos del tipo para-

da de coletivo.

ParadasLinea conjunto de pun-

tos

Representa a fenomenos formados por

todas las paradas de una lınea de colec-

tivos.

RedVial conjunto de

lıneas

Representa a los fenomenos de tipo red

de caminos.

Cuadra lınea dirigida Mantiene a los fenomenos Cuadra. La

direccion senala el sentido de numera-

cion.

Parcelaarea simple

Mantiene fenomenos que representan a

porciones pequenas de terreno. Cada

Parcela tiene un propietario

Manzana conjunto de

areas

Contiene fenomenos manzana como la

composicion de varias Parcelas.

Cuadro 2.2: Ejemplos de aplicacion para los tipos espaciales en MADS

Para los objetos asociados a un tipo espacial generico, el tipo espacial de cada instancia

se define en tiempo de creacion. La posicion de un objeto tambien se puede definir en

forma absoluta fijando las coordenadas del objeto, o relativa, definiendo la posicion con

respecto a otra ubicacion conocida, por ejemplo, X esta a 60km de Y , sobre la ruta Z.

Ademas MADS define relaciones espaciales, las que pueden ser topologicas, de orien-

tacion, metricas o agregados espaciales. Las relaciones espaciales estan restringidas por

la espacialidad de los objetos. Sin embargo, es importante contar con medios para definir

explıcitamente relaciones espaciales en el modelo conceptual, por ejemplo, para especifi-

car que dos secciones de un mismo rıo pertenecen a la relacion “esta adyacente a”. Esto

enriquece el esquema, permite nombrar a las relaciones, agregarles atributos y metodos y

darles semantica adicional. Una relacion espacial vincula al menos dos objetos espaciales.

Ejemplo 2.2.3 Vista de un modelo conceptual MADS

La figura 2.6 muestra una vista parcial del diseno en MADS para un problema. Del

diagrama se puede interpretar que se consideraron los tipos de fenomeno Pais, con un

Page 50: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

24 Capıtulo 2. Fundamentos de Bases de Datos Geograficas

Figura 2.6: Vista parcial de un modelo conceptual para un problema disenado con MADS

atributo espacial de tipo conjunto de areas, Ciudad cuyo atributo espacial es de tipo punto

y Lago, con espacialidad de tipo area simple. Entre los tipos de objeto Pais y Ciudad

se definio la relacion espacial “contiene” por la cual se impone la restriccion que una

instancia de Ciudad debe estar incluida en el espacio ocupado por la instancia de Pais

a la que pertenece. Existe otra relacion topologica entre Ciudad y Lago que permite

expresar si un fenomeno ciudad esta en relacion de “adyacencia” a un lago.

La figura 2.7 muestra un modelo conceptual completo para un problema disenado

usando MADS [PSZ06b]. Incluye atributos y relaciones espaciales y temporales. La misma

figura contiene las referencias simbolicas. Se puede observar que el modelo es claramente

interpretable por distintos usuarios: fenomenos que maneja, sus representaciones y las

relaciones de asociacion y espaciales definidas entre ellos.

En general se puede decir que MADS favorece el diseno de estructuras para una repre-

sentacion del espacio basada en objetos. Sin embargo tambien provee mecanismos para

representar vistas continuas del espacio basadas en campos.

OMT−G: Lenguaje de Modelado Orientado a Objetos para fenomenos

geograficos

OMT−G es un modelo conceptual para disenar esquemas de aplicacion que incluyan

elementos geograficos. Provee las primitivas para modelar geometrıa y topologıa de da-

tos geograficos, soporta estructuras topologicas agregadas bajo el modelo “todo-parte”,

estructuras de red, multiples vistas de objetos, y relaciones espaciales.

Incluye los conceptos basicos de clases, relaciones y restricciones de integridad espacial.

Distingue entre clases convencionales o no espaciales y clases espaciales o georeferenciadas

que pueden representar a datos geograficos continufos o discretos. Las clases convencio-

nales describen a un conjunto de objetos con propiedades, comportamiento, relaciones

Page 51: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Modelos conceptuales para sistemas geograficos 25

Figura 2.7: Esquema de aplicacion en MADS con objetos y relaciones espaciales

y semantica similares, y que mantienen alguna relacion con clases espaciales. Las clases

georeferenciadas se especializan de los tipos de clases geo-campos y geo-objetos. Las clases

geo-campos se usan para representar a los fenomenos continuos, mientras que las clases

geo-objetos representan a objetos geograficos individuales particulares. Notar que esta

discriminacion permite modelar las dos vistas del espacio basado en campos y en objetos.

Una clase georeferenciada se representa por un rectangulo subdividido en cuatro partes. El

rectangulo superior izquierdo es utilizado para ubicar en forma simbolica la geometrıa de

la clase. El resto de las secciones organiza los atributos geograficos, atributos descriptivos

Page 52: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

26 Capıtulo 2. Fundamentos de Bases de Datos Geograficas

Figura 2.8: Clases espaciales Geo-campos o continuas

y operaciones.

OMT-G propone un conjunto fijo de tipos geometricos y usa representacion simbolica

para distinguir las clases georeferenciadas de geo-objetos y de geo-campos (Figuras 2.9

y 2.8). El uso de estos tipos y su iconografıa simplifica el modelado. Cuenta con cinco

clases descendientes de geo-campos: isolınea, polıgonos adyacentes, mosaico, muestreo y

red triangular irregular. Existen dos clases descendientes de geo-objetos: geo-objetos con

geometrıa y geo-objetos con geometrıa y topologıa. Estas especializaciones junto con la

agregacion espacial (la primitiva todo-parte) permiten definir reglas de integridad espa-

cial. Las clases de geo-objetos con geometrıa se utilizan para los objetos que solo tienen

propiedades geometricas que se especializan en las clases Punto, Lınea, y Polıgono. Las

clases de geo-objetos geometrıa y topologıa representan a los objetos que tienen, ademas

de geometrıa, propiedades de conectividad topologicas y se usan para representar estruc-

turas de red. Incluyen a las clases Nodo y Arco con o sin direccion.

OMT-G considera tres tipos de relaciones entre sus clases: asociaciones simples, re-

laciones topologicas de red y relaciones espaciales. La discriminacion de estas clases de

relaciones permite definir explıcitamente el tipo de interaccion que existe entre objetos.

Las asociaciones simples muestran relaciones entre objetos de diferentes clases conven-

cionales o georeferenciadas. Las relaciones espaciales representan relaciones topologicas y

metricas: tangente, dentro, atraviesa, superpone, disjunto, adyacente, coincide, contiene,

etc. Para cada unas de estas relaciones se definen las restricciones de integridad espacial,

y es posible definir nuevas relaciones espaciales con sus restricciones. Las relaciones de

red se definen entre objetos que estan conectados bajo alguno de los modelos arco−nodo

o arco− arco.

OMT−G ademas incluye la definicion semantica para relaciones espaciales “genera-

lizacion” y “agregacion”. Las asociaciones de generalizacion y especializacion se aplican

Page 53: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Modelos conceptuales para sistemas geograficos 27

Figura 2.9: Clases espaciales Geo-objetos o discretas

Page 54: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

28 Capıtulo 2. Fundamentos de Bases de Datos Geograficas

Figura 2.10: Generalizacion en OMT-G

sobre clases georeferenciadas y clases convencionales, siguiendo las definiciones y notacion

propuesta por UML (figura 2.10). La agregacion es una forma especial de asociacion entre

objetos que define la composicion (figura 2.11); se puede definir entre clases convencio-

nales, georeferenciadas o combinaciones de ambas. Cuando la agregacion esta definida

entre clases georeferenciadas, se denomina “agregacion espacial”. En la agregacion espa-

cial la relacion topologica todo-parte es explıcita. El uso de agregacion espacial impone

restricciones de integridad.

Ejemplo 2.2.4 En la figura 2.11 se muestra un ejemplo de agregacion espacial entre

las clases espaciales Manzana y Lote, ambas con geometrıa polıgono. Esta agregacion

implica las siguientes restricciones de integridad espacial:

1. El area de una instancia de Manzana esta limitada al area ocupada por las ins-

tancias de Lote que la componen.

2. No existe superposicion entre instancias de Lote.

3. No existe ningun objeto de Lote fuera de un objeto Manzana.

Justamente, una caracterıstica de OMT−G es que transforma las relaciones topologi-

cas y espaciales en restricciones de integridad. Las restricciones de integridad se clasifican

Page 55: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Modelos logicos para informacion geografica 29

Figura 2.11: Agregacion espacial en OMT-G

ası en reglas de integridad topologicas, semanticas y/o restricciones definidas por el usua-

rio. Las reglas de integridad topologicas estan restringidas por las propiedades geometricas

y las relaciones espaciales de las entidades espaciales [EF91]. Por ejemplo, una restriccion

de integridad topologica podrıa ser: “la parada(punto) de una lınea de colectivos debe

estar ubicada sobre la ruta(conjunto de lıneas) de recorrido”. Las restricciones semanti-

cas tienen que ver con el significado de los fenomenos y son propias de la aplicacion. Un

ejemplo de restriccion semantica es el siguiente: “no es posible ubicar una construccion

de edificio sobre un rıo”. Las restricciones definidas por el usuario se conocen como “re-

glas de negocio”. Por ejemplo: “por cuestiones legales no se permiten centros comerciales

cercanos a menos de 200mts de un hospital”.

Una caracterıstica saliente de OMT−G es que se diseno no solo resaltando las carac-

terısticas de modelado, sino tambien la capacidad de definir restricciones de integridad a

nivel conceptual. OMT−G provee las primitivas necesarias para definir datos espaciales,

relaciones espaciales, y permite definir explıcitamente restricciones topologicas, semanti-

cas y reglas de negocio. Siendo un modelo orientado a objetos, ademas permite que ciertas

restricciones espaciales sean encapsuladas como metodos asociados a clases espaciales.

2.3. Modelos logicos para informacion geografica

Como ya se dijo, definir niveles de abstraccion es una practica comun en Ciencias

de la Computacion para resolver un problema enfocandose en un conjunto reducido de

conceptos y ocultando los detalles que no son de interes. En el campo de modelado de

informacion por medio de SMBD, estos niveles estan bien definidos y son ampliamente

utilizados (figura 2.1) [Ull88, SKS10, GMPQ+04, EN07]. Cada nivel representa una “vista”

diferente de la misma informacion, donde un nivel superior se fundamenta en el nivel

inferior.

Page 56: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

30 Capıtulo 2. Fundamentos de Bases de Datos Geograficas

El nivel logico esta debajo del nivel conceptual y describe el modelo de datos en

terminos de un conjunto de estructuras relativamente simples, enfocandose en objetos

de almacenamiento de alto nivel. Seguramente, las estructuras simples del nivel logico

implican estructuras de nivel fısico complejas. En la implementacion de un problema se

usan las estructuras logicas, sin necesidad de manejarse con la complejidad del nivel fısico,

lo que simplifica considerablemente el diseno de la aplicacion.

Con relacion a los modelos de datos para informacion espacial de interes en esta tesis,

en la seccion anterior se identificaron los objetos espaciales y su componente geometrica

al mayor nivel de abstraccion. A nivel logico se definen primitivas como puntos, arcos o

superficies y se considera sus formas de representaciones. Se necesita representar conjuntos

infinitos de puntos del espacio Euclıdeo en la computadora. Existen dos modos principales

de resolver ese problema [RSV02, Mol95]:

Modelo mosaico8, aproxima el espacio continuo a uno discreto (figura 2.12(a)).

Modelo vector, construye estructuras de datos que incluyen arcos y puntos (figura

2.12(b)). De manera similar trabaja la representacion “Medio Plano” [BT88].

Ejemplo 2.3.1 Supongamos que se requiere mantener informacion sobre el area ocupada

por una ciudad C. La geometrıa del area que ocupa la ciudad es un polıgono. Bajo la

representacion mosaico, se identifica al conjunto de celdas que aproximan el area ocupada

por el interior de la ciudad, mientras que en el modelo vector se representarıa con la lista

de puntos que definen el contorno del polıgono que aproxima al area.

2.3.1. Modelo mosaico

El modelo mosaico define una descomposicion celular del plano como una grilla o

arreglo de celdas disjuntas. A cada celda se le asocia un conjunto de valores de atributos.

La particion del espacio en celdas define el plano discreto, llamado malla, el que puede

hacerse en un azulejado de celdas fijas o regulares denominado raster o en mosaicos

variables o irregulares (figura 2.13 (a-b)). En este modelo cada celda esta asociada con

una posicion en el arreglo y podrıa asociarse con un pixel.

8En Ingles tessellation model.

Page 57: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Modelos logicos para informacion geografica 31

Figura 2.12: Modelos de representacion

Si bien en la practica existe una asociacion natural entre el modelo mosaico y la

representacion del espacio basado en campos, el modelo mosaico tambien se puede utilizar

para el modelo del espacio basado en objetos, donde los objetos abstractos como polilınea,

polıgono o region se representan por la enumeracion finita de celdas. En el modelo mosaico

se aproxima cada objeto espacial con un conjunto finito de celdas. A mayor resolucion de

grilla, mejor representacion pero mayor cantidad de celdas a almacenar para representar

un objeto. Por ejemplo, para una imagen A4, con 12pts/mm se requieren de 9 millones

de pixels. Un problema claro es que a mayor resolucion, mas ineficiente sera el tiempo de

respuesta de las operaciones.

2.3.2. Modelo vector

En el modelo vector los objetos son construidos a partir de las primitivas punto y arco.

El punto se almacena a partir del par de coordenadas con respecto al espacio de referencias

y el arco se modela como un segmento definido por sus puntos extremos. Los objetos

mas complejos requieren de estructuras auxiliares de representacion: listas, arreglos y/o

conjuntos. En general, la representacion en memoria del modelo vector requiere de menos

recursos que el modelo mosaico. Existen variantes en cuanto a la representacion del modelo

vector. Una representacion simple serıa:

Page 58: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

32 Capıtulo 2. Fundamentos de Bases de Datos Geograficas

Figura 2.13: Dos representaciones del modelo mosaico

Representar polilıneas como una lista de puntos < p1, ..., pn >, donde cada pi es un

vertice. Cada par (pi, pi+1), con i < n, representa un segmento de la polilınea.

Representar polıgonos tambien como una lista de puntos con la restriccion polilınea

cerrada, y el par (pn, p1) como un arco mas del polıgono.

Representar region como un conjunto de polıgonos.

Para el modelo espacial basado en campos la presentacion generalmente se basa en

Modelos de Elevacion Digital (DEM’s). Los DEM’s son utiles para representar cualquier

fenomeno natural que es una funcion continua del espacio 2D. Los DEM’s toman colec-

ciones de datos de muestra, a partir de los cuales los otros puntos son obtenidos por

interpolacion. Un metodo de interpolacion usado es el de Redes Irregulares Triangulares

(TIN’s).

2.3.3. Representacion de geometrıa para colecciones de objetos

Las siguientes representaciones estan enfocadas al modelo vector y espacio basado

en objetos. Al considerar colecciones y no objetos individuales interesan las relaciones

entre objetos de la misma coleccion. Los modelos mas comunes usados para colecciones

Page 59: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Modelos logicos para informacion geografica 33

de objetos son [RSV02]: spaghetti, red, y topologico. Entre ellos fundamentalmente difieren

en la expresion de las relaciones topologicas entre los objetos componentes. Las relaciones

topologicas entre los objetos espaciales son aquellas que permanecen invariantes bajo

transformaciones topologicas (adyacencia, superposicion, disjunto e inclusion). Esto es,

se preservan aun cuando los objetos espaciales son trasladados, rotados o escalados en

el plano. La representacion explıcita de tales relaciones en el modelo de datos espacial

provee mayor conocimiento y es util para la evaluacion de consultas espaciales.

En el modelo de representacion spaghetti [LT92, WD04], la geometrıa de cualquier

objeto espacial que pertenece a la coleccion se describe en forma independiente de los

otros objetos. En este modelo no se guarda la topologıa y las relaciones topologicas se

calculan por demanda. Las principales caracterısticas del modelo son que es simple y que

habilita la representacion heterogenea para poder mezclar puntos, polilıneas y regiones sin

restricciones. Ademas, debido a que los objetos se guardan independientemente, provee

al usuario final una manera simple de ingresar nuevos objetos a la coleccion. Por otro

lado, las desventajas del modelo son principalmente la perdida de informacion explıcita

sobre las relaciones topologicas entre objetos espaciales y la redundancia que implica

la representacion. Por ejemplo, los lımites entre dos regiones adyacentes se mantienen

duplicados y eventualmente podrıan no coincidir.

El modelo de representacion red9 [LT92, WD04] fue disenado para modelar redes y

grafos. Es especialmente adecuado para aplicaciones cuyo modelo conceptual subyacente

es del tipo red, como por ejemplo las redes de transporte. El modelo almacena las relacio-

nes topologicas entre puntos y polilıneas. El conjunto de tipos geometricos a considerar

incluye:

punto: [x : real, y : real]

nodo: [punto,< arco >]

arco: [nodo− inicial, nodo− final, < punto >]

polıgono: < punto >

region: {polıgono}9En Ingles Network.

Page 60: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

34 Capıtulo 2. Fundamentos de Bases de Datos Geograficas

Introduce los conceptos nodo y arco. Un nodo es un punto distinguido que conecta

una lista de arcos. Un arco es una polilınea que comienza en un nodo y finaliza en un

nodo. Con esta representacion es posible navegar a traves de la red; cuando se alcanza

un nodo se elige el arco por donde seguir. Los nodos permiten definir eficientemente

el test de conectividad y calculos de red, como camino mas corto. Dependiendo de la

implementacion, las redes pueden ser planas o no. La principal ventaja de este modelo

es su descripcion intrınseca de topologıas de red, con la nocion de conectividad. Esto lo

hace apropiado para los requerimientos de representacion y consultas de cierto tipo de

aplicaciones basadas en redes.

El modelo topologico [LT92, WD04] es similar al modelo de red, excepto que la red es

planar. Este tipo de red induce a la subdivision planar en polıgonos adyacentes, algunos

de los cuales pueden no corresponder a objetos geograficos. Los objetos de interes de este

modelo son:

punto: [x : real, y : real]

nodo: [punto,< arco >]

arco: [nodo-inicial, nodo-final, polıgono-izq, polıgono-der, <punto>]

polıgono: < arco >

region: {polıgono}

Como en el modelo de red, un nodo se representa por un punto y la lista de arcos

que se inician o terminan en dicho nodo. Si la lista esta vacıa corresponde a un punto.

Los puntos sueltos se usan para identificar ubicaciones especıficas, como torres, capitales,

etc. Los arcos, ademas de los puntos extremos y vertices, tienen referencia al polıgono

izquierdo y derecho que los tienen como lımite comun.

Un polıgono se representa por una lista de arcos, cada arco siendo compartido con

polıgonos vecinos. Existe cierta redundancia por razones de eficiencia al acceder a los ob-

jetos. Por ejemplo, los polıgonos pueden ser accedidos a traves de la estructura polıgono o

de sus arcos. Sin embargo, no hay redundancia al almacenar la geometrıa, cada punto/lınea

se guarda una unica vez.

Una ventaja del modelo topologico es que es eficiente para el calculo de consultas

topologicas. Por ejemplo, la consulta “encontrar los polıgonos adyacentes a un polıgono

Page 61: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Modelos logicos para informacion geografica 35

P” es directa. Otra ventaja esta relacionada con la consistencia de la actualizacion. Como

los objetos estan compartidos, la consistencia de operaciones de actualizacion es mas facil

de garantizar. Esta aproximacion tiene algunas desventajas. Mostrar una region requiere

recuperar los polıgonos adyacentes y filtrar la informacion que no interese. Segundo, la

complejidad de la estructura subyacente puede resultar en perdida de eficiencia para

algunas operaciones, por ejemplo, mostrar una vista de un mapa. En el modelo topologico,

las operaciones de recorrido son mucho mas lentas que en otros modelos. Y finalmente,

agregar un objeto requiere el calculo previo de parte del grafo planar.

2.3.4. Evaluacion de los modelos

La seleccion de un modelo conceptual y un modelo logico son independientes. Cualquie-

ra de los dos modelos logicos vistos sirve para representar tanto los modelos conceptuales

basados en objetos como en campos. En [Lua04] se enumeran algunos aspectos que pueden

considerarse al momento de tomar una decision:

Eficiencia de la representacion. El modelo vector es mas eficiente en el uso del

espacio de almacenamiento que el modelo mosaico, que dependiendo de la precision

requerida, puede implicar grandes volumenes de datos o celdas. Esto ademas implica

que las operaciones sobre los datos consumen mas tiempo.

Eficiencia de calculo. El modelo vector implica el manejo de estructuras de datos

mas complejas que hace que ciertas operaciones espaciales como por ejemplo “cubri-

miento” entre fenomenos sean mas ineficientes que en el modelo mosaico. El modelo

mosaico, por su parte, usa una estructura de datos simple como el arreglo y las que

operaciones como filtrado son simples de implementar.

Poder expresivo. El modelo vector permite representaciones explıcitas de las rela-

ciones topologicas entre objetos geograficos, por lo que resulta mas apropiado en

problemas que requieren de analisis topologico como “identificar caminos”.

Manejo de transformaciones. Las operaciones de transformacion de coordenadas

como rotacion, traslacion y cambio de escala, en general, son mas simples en el

modelo vector. En la representacion mosaico son mas ineficientes y pueden resultar

en distorsion y/o perdida de informacion.

Page 62: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

36 Capıtulo 2. Fundamentos de Bases de Datos Geograficas

Analisis de espacio. El analisis del comportamiento en cada ubicacion del espacio

es mas simple en el modelo vector.

Produccion de datos. El modelo mosaico se asocia a la recuperacion de datos que

provienen de satelites y existen aplicaciones donde esta manera de recuperar in-

formacion es esencial. El modelo vector se asocia a aplicaciones donde los datos

provienen de disenos del tipo Diseno Asistido por Computadora (CAD)10.

2.4. Bases de Datos Espaciales

Un Sistema de Manejo de Bases de Datos Espacial (SMBDE)11 provee la administra-

cion efectiva y eficiente de datos que estan relacionados con un espacio de interes. Este

espacio puede referirse al mundo fısico (geografıa, planificacion urbana, astronomıa), a par-

tes de organismos vivos (anatomıa humana), a disenos de ingenierıa (circuitos integrados

de gran escala, diseno de automoviles o estructuras moleculares para drogas farmacologi-

cas), etc. Un SMBDE es una clase particular de Sistemas de Manejo de Base de Datos

(DBMS) (SMBD)12 que ademas administra informacion con referencia a un espacio. Los

requerimientos y tecnicas necesarias para manipular objetos geograficos, que tienen iden-

tidad, extension, ubicacion y relaciones particulares son diferentes de los necesarios para

manejar imagenes capturadas. Por su parte, los servicios ofrecidos por los sistemas de

bases de datos tradicionales tampoco son suficientes. Segun [Gut95] un sistema de bases

de datos espacial se puede definir como un software con las siguientes caracterısticas.

1. Un SMBDE es un SMBD.

2. Cuenta con un modelo de datos, tipos de datos espaciales y el lenguaje de consulta

para acceder a los datos.

3. Provee la implementacion de datos espaciales, capacidades para indexado espacial

y algoritmos eficientes para recuperar informacion.

Una forma de extender un SMDB Relacional a un SMBDE serıa enriqueciendo el

sistema de tipos de forma que incluya datos espaciales. La inclusion de estos tipos de datos

10En Ingles Computer-Aided Design (CAD).11En Ingles Spatial Database Management System(SDBMS).12En Ingles Database Management System (DBMS).

Page 63: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Bases de Datos Espaciales 37

requiere definir su estructura junto con las operaciones sobre ellos. Por ejemplo, si se define

el tipo de datos polıgono se podrıa incluir la operacion areaPoligono. Las combinaciones

de tipos de datos y sus operaciones se definen como tipos de datos abstractos espaciales

(TDAE). Definir el sistema de TDAE adecuado es una tarea desafiante y, en general, se

puede decir que el resultado final es un compromiso entre simplicidad de la definicion y

riqueza de la representacion.

Por otra parte, los Sistemas de Manejo de Bases de Datos Relacionales Orientados

(SMBDROO)a Objetos13 combinan dos tecnologıas: sistemas de bases de datos y len-

guajes de programacion orientados a objetos. Esta mezcla trae ventajas tanto desde el

punto de vista de diseno como desde el punto de vista de desarrollo: poder de modelado,

extensibilidad, reutilizacion de codigo y facilidad de mantenimiento.

2.4.1. Tipos de Datos Abstractos Espaciales

La definicion de tipos de datos abstractos (TDA) es una estrategia de los SMBDROO

para solucionar la falta de poder de modelado de las bases de datos relacionales para ciertos

problemas. Un TDA es una vista de los objetos que define y el conjunto de operaciones

sobre ellos. La idea es ocultar la estructura del tipo de dato y extender el lenguaje de

consulta. El primer desafıo consiste en definir los tipos geometricos. En general, existe

un compromiso entre el poder de modelado capturado por la definicion y las restricciones

impuestas sobre la representacion geometrica elegida. Esta relacion esta fuera del estudio

de esta tesis. Sin perder generalidad se enumeran los siguientes objetos espaciales:

punto(0-dimension).

polilınea(1-dimension). Lista de pares de segmentos conectados, quedan fuera las

polilıneas complejas.

region(2-dimension). Una instancia de este tipo es cualquier conjunto de polıgonos

no superpuestos.

Para completar la definicion de un TDA Espacial (TDAE) el proximo paso es definir

las operaciones necesarias para expresar las consultas.

13En Ingles Object Relational Database Management System (ORDBMS).

Page 64: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

38 Capıtulo 2. Fundamentos de Bases de Datos Geograficas

Operaciones para region

Operacion Descripcion

PuntoEnRegion : region× punto→ bool Verdadero si el punto pertenece a la region.

Overlaps : region× region→ bool Verdadero si las regiones se intersectan.

Clipping : region× rectangulo→ region Calcula la interseccion entre una region y un

rectangulo. El resultado es una region even-

tualmente vacıa.

Interseccion : region× region→ region Es un caso general de la anterior. Calcula

la region resultante de la interseccion de dos

regiones.

Meets : region× region→ bool Verdadero si las regiones de entrada son ad-

yacentes.

Area : region→ real Devuelve el area ocupada por la region.

UnionRegion : {region} → region Dado un conjunto de regiones, se retorna una

nueva region con la union de ellas.

Operaciones para lınea

Operacion Descripcion

PuntoEnLinea : linea× punto→ bool Verdadero si el punto pertenece a la lınea.

Longitud : linea→ real Retorna la longitud de la lınea.

OverlapsLR : linea× region→ bool Verdadero si la linea intersecta a la region.

Cuadro 2.3: Operaciones de los tipos region y lınea

2.4.2. Operaciones espaciales

Encontrar todas las operaciones de un TDAE es un problema que no tiene una ca-

racterizacion absoluta. Se espera que un SMBDE cuente con un conjunto general de

operaciones, capaces de proveer un rango amplio de funciones. El cuadro 2.4.1 presenta

algunos ejemplos de las operaciones espaciales mas comunes para los tipos de datos region

y lınea y sus interfaces. Sin embargo, los requerimientos funcionales de las aplicaciones

SIG son amplios y exceden a las funcionalidades que estan bajo la responsabilidad del

SMBDE. Por ejemplo, para el analisis de mercado es necesario mostrar datos a distintos

niveles de resolucion. Los sistemas de rutas necesitan operaciones de busqueda de caminos

Page 65: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Bases de Datos Espaciales 39

y las aplicaciones que manejan modelado de territorio necesitan interpolacion, entre otros

ejemplos.

Para ilustrar la complejidad del problema y la gran variedad de posibilidades que

existen se confecciono la siguiente lista que organiza las operaciones segun sus argumentos.

Se asume que al lo menos uno de los argumentos es espacial.

Operaciones unarias con resultado booleano. Operaciones testean sobre alguna pro-

piedad de un objeto espacial, por ejemplo, existe(f).

Operaciones unarias con resultado escalar. Las operaciones de este tipo mas comunes

incluyen el calculo sobre alguna medida escalar, por ejemplo, longitud(f), area(f),

entre otras.

Operaciones unarias con resultados espaciales. Una variedad de operaciones caen

dentro de este tipo.

• Transformaciones geometricas. En este grupo se incluyen rotacion, traslacion,

cambio de escala, entre otras.

• Operaciones de transformacion de dimension. A partir de un objeto en

d−dimensional generan otro de una dimension superior o inferior, por ejemplo

limite(f).

• Operaciones para extraccion de objetos. Retornan un objeto espacial que satis-

face la operacion. Por ejemplo, copiar(f).

Operaciones binarias con resultados booleanos. Tambien denominadas predicados

espaciales, son la base de los lenguajes de consulta espacial. Se distinguen seleccion

espacial y join espacial.

• Predicados topologicos. Son invariantes con respecto a transformacion topologi-

ca, tal como intersecta(f1, f2), limita(f1, f2), cubre(f1, f2).

• Predicados de direccion, tales como alNorte(f1, f2).

• Predicados metricos, por ejemplo, testear si la distancia entre dos objetos es

menor o igual a un numero de unidades.

Operaciones binarias con resultados espaciales. Las operaciones de uso mas fre-

cuente para consultas espaciales son las operaciones de conjunto que aplican sobre

Page 66: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

40 Capıtulo 2. Fundamentos de Bases de Datos Geograficas

objetos representados como conjuntos, union(f1, f2), interserccion(f1, f2) y diferen-

cia(f1, f2). Sirven para crear un nuevo objeto espacial, por ejemplo, la interseccion

puede usarse en la consulta “Filtrar las lıneas de ferrocarril que pertenecen a la

provincia de Buenos Aires”.

Operaciones binarias con resultados escalares. La operacion tıpica es

distancia(f1, f2).

Operaciones n-arias con resultados espaciales. Por ejemplo seleccionar-n.

Semantica de las Operaciones

Una operacion puede tener distintos significados segun la dimension de los objetos con-

siderados. Por ejemplo, la operacion interseccion no necesariamente preserva la dimension

de sus operandos. Una solucion es acotar el problema definiendo diferentes operaciones de

interseccion de manera que cada una preserve la dimension de sus operandos (interseccion

regularizada). Aun con la interseccion regularizada, si los polıgonos no son convexos, se

puede generar mas de un polıgono.

Tipos Fuertes versus Tipos Debiles

El resultado de operaciones espaciales deberıa satisfacer alguno de los tipos existentes.

La razon detras de esta exigencia es que existen situaciones en las que el resultado de

una operacion es reutilizado por la siguiente operacion. Hay numerosos ejemplos que

muestran los lımites en las operaciones con tipos simples: la interseccion de una lınea con

una region no necesariamente retorna una lınea, la diferencia de dos polıgonos sin agujeros

puede resultar en un polıgono con agujeros. Una solucion es redefinir la region como un

conjunto de polıgonos. La definicion de tipos mas abarcativos puede ser apropiada en

algunos casos, por lo menos incorporando a la definicion la nocion de conjunto. Esta

aproximacion se denomina tipado debil. Sin embargo, trabajar con tipos genericos, en

muchos casos hace que se pierda el poder de los tipados fuertes. Por ejemplo, redefinir la

lınea como conjunto de lıneas, hace que la union de lıneas acepte cualquier conjunto de

lıneas.

Page 67: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Resumen del capıtulo 41

2.5. Resumen del capıtulo

La caracterıstica saliente que distingue a los SIG de otros tipos de SI es que inclu-

yen datos con referencias geograficas o datos espaciales. Eventualmente ademas pueden

incluir algun atributo geometrico para representar el espacio ocupado. Actualmente, las

aplicaciones SIG delegan la responsabilidad sobre la gestion de datos al SMBDE.

El diseno apropiado de la base de datos es fundamental para satisfacer los requeri-

mientos de los usuarios. Los modelos de datos capturan la naturaleza de los datos y sus

relaciones. Tradicionalmente los SMBD utilizan modelos de datos de distinto nivel de abs-

traccion para separar la complejidad de la implementacion de los requerimientos de datos

del problema. En el nivel superior se ubica a los modelos conceptuales, que sirven como

herramienta de diseno y comunicacion entre desarrolladores y expertos del dominio. En el

diseno de modelos de datos para SIG se consideran dos abstracciones conceptuales: el mo-

delo de datos geografico y el modelo para el esquema de aplicacion. La interpretacion del

espacio varıa entre los modelos basado en campos y basado en objetos. Adicionalmente,

el modelo conceptual tambien describe el diseno del esquema de aplicacion y debe proveer

las abstracciones para representar los distintos tipos de fenomenos geograficos junto con

sus relaciones espaciales, de una manera grafica y sin ambiguedad.

El proximo nivel de representacion lo constituyen los modelos logicos, que se encargan

de trasladar el modelo conceptual a estructuras internas. En el nivel logico se ubican los

constructores que se utilizan en el desarrollo de la aplicacion, y se siguen ocultando detalles

propios sobre la implementacion de los mismos. Relacionados con la representacion logica

existen dos alternativas: el modelo mosaico y el modelo vector. Entre ellos difieren en la

concepcion del plano, los requerimientos de almacenamiento y la capacidad para resolver

consultas espaciales. El modelo vector considera la existencia de objetos en el plano. Para

la representacion de estos objetos existen distintas alternativas como son los modelos

spaghetti, red y topologico. La seleccion del modelo conceptual y su representacion a

nivel logico es ortogonal.

Page 68: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,
Page 69: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Capıtulo 3

Sistemas de Informacion Geografica

Bajo la sigla SIG se reune al conjunto de herramientas que sirven para capturar, al-

macenar, analizar, administrar y presentar datos con referencia a una o varias ubicaciones

sobre la superficie terrestre. La tecnologıa SIG combina conocimiento de diversas areas

de las ciencias como son cartografıa, analisis estadıstico y bases de datos, entre otras. Los

SIG son una tecnologıa de proposito general que incluye servicios para analizar modelos,

localizar eventos, medir distancia entre eventos, encontrar caminos y explorar las rela-

ciones entre dos o mas objetos. Esto permite a usuarios expertos del dominio combinar

capas de informacion cruda de manera que se genere un nuevo conocimiento sobre un

espacio geografico. Los campos de aplicacion para esta tecnologıa son diversos y entre

ellos se pueden citar: cartografıa, sensado remoto, distribucion de superficie, organizacion

polıtica, analisis sociologico, distribucion de recursos naturales, planeamiento urbano y

localizacion.

Los datos de un SIG se corresponden con fenomenos del mundo real (por ejemplo:

rutas, edificios, superficies agrıcolas, etc.) representados digitalmente. Como se vio en el

capıtulo anterior, las entidades reales se organizan en dos abstracciones: objetos discretos

(por ejemplo: un monumento o un lago) y campos continuos (por ejemplo: elevacion de

la superficie terrestre o nivel de lluvias). Tradicionalmente, tambien existen dos formas

de almacenar los datos en un SIG para ambas clases de abstracciones: mosaico y vector.

Los SIG que se centran en el manejo de datos en formato vectorial son populares. Sin

embargo, los SIG raster son utilizados en problemas que requieren la generacion de capas

continuas. Ambos modelos difieren en cuanto a la eficiencia de representacion y a la

capacidad y eficacia para resolver determinado tipo de consultas espaciales.

Page 70: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

44 Capıtulo 3. Sistemas de Informacion Geografica

En este capıtulo se describe la tecnologıa SIG, sus componentes y servicios como un

tipo de herramienta de proposito general, y se presentan algunos ejemplos de aplicaciones

desarrolladas en base a esta tecnologıa. En la actualidad los SIG estan teniendo un fuerte

impulso con los llamados Servicios Basados en la Localizacion(LBS)1 debido a la masi-

ficacion de la tecnologıa de los Sistemas de Posicionamiento Global(GPS)2 integrada en

dispositivos moviles. Cada instancia desarrollada en base a tecnologıa SIG es un SI que

administra datos espaciales con un proposito para el cual fue desarrollado. Un sistema

desarrollado con tecnologıa SIG para una aplicacion, jurisdiccion, empresa o proposito

no siempre es interoperable o compatible con otra instancia SIG desarrollado para otra

aplicacion, jurisdiccion, empresa o proposito. En los ultimos anos ha crecido el interes en

la integracion de IG, buscando facilitar la interoperabilidad y la reutilizacion de datos

entre aplicaciones SIG.

3.1. La tecnologıa SIG

Hasta hace unas decadas atras, manipular, sintetizar y representar IG estaba limitado

al uso de mapas de papel, siguiendo algun procedimiento esencialmente manual y no inter-

activo. En los ’70 y con el avance de la tecnologıa, sumado a la demanda de manipulacion

y analisis interactivo de IG surge un nuevo tipo de herramienta denominada SIG. En

un sentido general, el termino SIG se aplica a sistemas que integran, almacenan, editan,

analizan, comparten y muestran IG para colaborar en la toma de decisiones. Los SIG

son herramientas que permiten a los usuarios crear consultas interactivas con busquedas

orientadas, analizar informacion espacial, editar datos, mapas y presentar los resultados

de aplicar tales operaciones [Cla86].

3.1.1. Alcance y servicios

En la introduccion del capıtulo 1 (seccion 1.1) se presento una definicion para tecno-

logıas SIG propuesta por [Lua04, Mit99a]. De ella se consideran los siguientes tipos de

servicios esperados:

1. Soporte de al menos un modelo de datos geografico.

1En Ingles Location Based Services (LBS).2En Ingles Global Position System (GPS).

Page 71: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

La tecnologıa SIG 45

2. Herramientas para analisis y simulacion.

3. Herramientas alternativas de visualizacion.

De lo anterior se puede concluir que un SIG es un tipo de sistema con facilidades

para modelar, capturar, almacenar, manipular, guardar, consultar, recuperar, analizar

y visualizar informacion que tiene algun componente geografico. Ademas se espera que

provea las herramientas para analizar modelos, localizar eventos, medir distancia entre

dichos eventos, encontrar la mejor manera de llegar a un destino y explorar como los

problemas se relacionan unos con otros.

Cada una de las piezas de informacion se organiza en una capa3 o tema y los usuarios

deciden dinamicamente que capas mostrar y que capas ocultar. Por ejemplo, una capa

podrıa representar los lagos de una zona geografica y otra los caminos y rutas de la misma

region. Superponiendo ambas capas se puede responder a la pregunta “¿es cierto que para

todo lago existe un camino que lo comunica?”.

Combinar capas de informacion y ofrecer una nueva representacion visual del espacio

geografico es un recurso flexible. Que capas de informacion definir y como y cuales com-

binar depende del objetivo de investigacion. Un software tipo SIG debe permitir realizar

el mapeo entre donde ocurren los hechos y los atributos que poseen, organizados en una

estructura de capas. Superponer informacion y seleccionar aquella que es relevante en

una vision particular, fortalece los cuatro modos de preguntar de cualquier proyecto de

investigacion: exploracion, explicacion, prediccion y planificacion.

3.1.2. Organizacion

Una aplicacion SIG de calidad resulta de la combinacion del conocimiento de los

expertos, la IG en la forma de datos, hardware, software y metodos de analisis (figura

3.1), organizados para automatizar, gestionar y distribuir informacion y proporcionar una

representacion geografica.

Las personas juegan un papel activo tanto en la etapa de diseno como en la de uso

de los servicios de una aplicacion SIG. Durante el diseno y la construccion se sugiere la

conformacion de equipos de trabajo interdisciplinario con expertos del dominio, expertos

3En Ingles layer.

Page 72: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

46 Capıtulo 3. Sistemas de Informacion Geografica

Figura 3.1: Composicion de un SIG

del area de geociencias y desarrolladores. Entre los actores de un SIG se caracterizan los

siguientes segun su perfil:

Lectores de mapas. Suelen ser los consumidores finales. Estas personas usan los

mapas creados con un proposito especıfico.

Disenadores de mapas. Organizan las informacion por temas de interes y combinan

datos para disenar mapas de acuerdo a un proposito.

Analista geografico. Encargado de resolver problemas geograficos, como dispersion

de contaminacion, encontrar la ubicacion para una industria o buscar recorridos.

Operador de datos. Ingresa los datos geograficos que nutren al sistema. Se vale de

tecnicas de edicion, conversion y generacion de datos.

Disenador de esquemas o disenador de base de datos. Construye los modelos con-

ceptuales y logicos apropiados de acuerdo a las necesidades de un problema.

Desarrollador. Personaliza un software SIG para resolver una necesidad especıfica.

Una fabrica de IG cuenta con diversas formas de capturar IG y diversas fuentes orıge-

nes de datos. Algunos de los metodos usados para generar los datos de un SIG son la

Page 73: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Informacion geografica 47

digitalizacion de datos (impresos o filmados), mapas digitales, fotografıas aereas, datos

obtenidos de mediciones topograficas y/o sensores remotos. En caso de usar represen-

taciones vectoriales, puede ocurrir que la misma se genere a partir de un proceso de

vectorizado de datos analogicos. Dependiendo del metodo usado para capturar datos, se

deben considerar el coeficiente de exactitud del metodo y si al proceso de captura se le

debe adicionar las etapas de edicion y procesado posterior para eliminar los errores (lim-

pieza de datos). Actualmente, la mayorıa de los datos digitales provienen de fotografıas

aereas que capturan datos en dos y tres dimensiones. Otra fuente de informacion muy

utilizada ultimamente son las coordenadas de posicion tomadas a traves de tecnologıa

GPS.

Entre las razones por las que se extendio el desarrollo de aplicaciones SIG se considera

la versatilidad que ofrecen como fuente de investigacion y analisis [Mit99b]. La tecnologıa

SIG suele incluir instrumentos para analisis, ası como tambien opciones alternativas del

tipo “plug-in” de herramientas de analisis geografico. Como se vio en el capıtulo anterior,

las capacidades de analisis geografico estan restringidas y condicionadas por el modelo de

datos subyacente. Por ejemplo, un SIG basado en el modelo topologico podra reconocer

y analizar relaciones topologicas espaciales, como “identificar la/s parcela/s catastrales

que carecen de un servicio”, esto es, no lo incluyen dentro sus lımites. Las aplicaciones

representadas bajo el modelo red son mas adecuadas si se quiere hacer analisis sobre

“mejor camino” a seguir para trasladarse desde un punto origen a un destino. Otros

ejemplos de funciones de analisis mas complejos incluyen conocimiento cientıfico y se

aplican para analisis y prediccion en meteorologıa, epidemiologıa, riesgos de catastrofe,

etc.

3.2. Informacion geografica

En el ambito de uso de la tecnologıa SIG se utilizan diversos terminos relacionados

con IG. En esta seccion se presentan definiciones de tales conceptos que seran usados en

el resto de esta tesis.

Se denomina informacion geografica (IG) a los datos espaciales georreferenciados, esto

es, vinculados con uno o varios puntos sobre la superficie terrestre. La IG posee una po-

sicion implıcita (la poblacion de una seccion censal, una referencia catastral), o explıcita

(coordenadas obtenidas a partir de datos capturados mediante GPS, etc.). En general

Page 74: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

48 Capıtulo 3. Sistemas de Informacion Geografica

se dice que un SIG administra IG. La IG se caracteriza por su volumen y estructura

intrınsecamente compleja. Para representar IG se requiere de modelos conceptuales, logi-

cos y fısicos (secciones 2.2 y 2.3) con constructores especıficos.

Los datos que mantiene un SIG son abstracciones que se corresponden con objetos

del mundo real (por ejemplo rutas, edificios, superficies agrıcolas, etc.) representados en

forma digital. Cada uno estos objetos que conforma la IG recibe el nombre de fenomeno

geografico. Como se vio en la seccion 2.2.2 cada fenomeno es unico y distinguible, esta re-

ferenciado a una locacion, espacio, area o region y se puede visualizar en un mapa.

La abstraccion que representa al conjunto de fenomenos geograficos de una misma

clase se denomina tipo de fenomeno. Un tipo de fenomeno caracteriza los atributos y rela-

ciones de fenomenos reales. Los atributos pueden ser atributos alfanumericos y/o atributos

espaciales. Los atributos espaciales tienen asociada una componente geometrica, que de-

termina la forma y dimension del fenomeno (seccion 2.2.1). Un modelo para informacion

geografica tambien incluye la definicion de relaciones espaciales en fenomenos, que pueden

ser geometricas y/o topologicas. Entre las propiedades metricas de objetos geograficos se

incluyen longitud y superficie (dependen de la dimension del objeto) y relaciones metricas

entre objetos como distancia y/o relaciones de orientacion (“arriba de”, “a la derecha

de”, etc.). La topologıa hace referencia a propiedades de vecindad, adyacencia, inclusion

y conectividad, que permanecen invariables ante cambios morfologicos, de escala o de

proyeccion.

Si bien el tipo de analisis sobre IG es variado, no existe un modelo logico que asegure

proveer el conjunto completo de operaciones de analisis. Generalmente, la tecnologıa SIG

posee un conjunto de primitivas que cubren ciertas capacidades de analisis y ofrecen la

posibilidad de desarrollo de funcionalidades especıficas. Desde la perspectiva de un SIG las

relaciones entre fenomenos geograficos se organizan en alguna de las siguientes categorıas:

topologicas, de direccion, metricas o generales. Por relaciones generales se refiere a vınculos

que pueden existir entre objetos del sistema como por ejemplo la relacion “es dueno” entre

personas y parcelas.

Page 75: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Caracterizacion de las aplicaciones SIG 49

3.3. Caracterizacion de las aplicaciones SIG

3.3.1. Aspectos funcionales

Presentados la definicion y el alcance de una aplicacion del tipo SIG y bajo conoci-

miento de las caracterısticas particulares que comprende manejar datos geograficos digi-

talizados, se propone la siguiente organizacion de los componentes funcionales de un SIG

[BM98]:

Ingreso de datos y verificacion. Esta funcionalidad se relaciona con aspectos de

captura de datos geograficos, verificacion de su correctitud y conversion a forma

digital.

Almacenamiento y gestion de datos. Abarca la estructura y organizacion de la IG en

terminos de la manera en la que la percibe el usuario (es decir el modelo conceptual)

y sobre la forma en que se maneja en la computadora (modelo logico y modelo fısico)

Transformacion y analisis de datos. Esta funcionalidad comprende el proceso de

edicion de informacion con el fin de mantenerla actualizada y libre de errores. El

analisis de datos es una de las tareas principales de cualquier SIG y comprende la

aplicacion de metodos de analisis de informacion para alcanzar las respuestas para

las consultas recibidas.

Presentacion de Resultados. La funcionalidad de producir mapas y/o materiales

similares es una de las caracterısticas de los SIG que los diferencia de los sistemas

de proposito general.

El ingreso y verificacion de datos es una de las fuentes principales de costo y tiempo

de una aplicacion SIG. Para la obtencion de datos se necesita definir un procedimiento

de extraccion, transformacion y carga (ETL)4 adecuado. Existen metodos y herramientas

para mover datos desde multiples fuentes, “limpiarlos”, reformatearlos y cargarlos en el

SIG. Para obtener informacion geografica, los metodos de captura son variados. Origi-

nalmente los datos se recuperaron a partir de mapas existentes. En la actualidad, se han

ampliado las posibilidades de obtener datos digitales de fuentes diversas, incluyendo: foto-

grafıas aereas, tecnologıas de posicionamiento (GPS [KH96], EGNOS, GALILEO [LB00],

4En Ingles Extract-Transform-Load (ETL).

Page 76: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

50 Capıtulo 3. Sistemas de Informacion Geografica

DGPS [GHEK00]), imagenes de sensores remotos (IKONOS [ME02], QBIRD) o nuevos

mapas creados. Ası tambien existe la posibilidad de contar con datos espaciales digitales

ya producidos por instituciones, companıas privadas o servicios de la armada [Raj10].

Organismos e instituciones de Estados Unidos y Europa trabajan para definir estandares

de exactitud y precision de datos geograficos [FGD07, CEN07].

Los servicios referidos a la gestion de datos, esto es, fundamentalmente almacenado

y recuperacion, suelen ser trasladados a un SMBDE. Como vimos, los datos que gestio-

nan los SMBD en aplicaciones del tipo procesamiento de transacciones en lınea5 estan

limitados a grandes volumenes de datos simples (numeros, caracteres, fechas, etc). La IG

requiere de nuevos tipos de datos como son punto, curvas, superficie y colecciones de estos

como coleccion de puntos, coleccion de lıneas, coleccion de superficie (seccion 2.3). Los

SMBDE extienden los SMBD con capacidades para gestionar datos espaciales. Algunos

ejemplos de SMBDE son Oracle Spatial & Oracle Locator [ORA] y PostGIS [POS10].

Oracle Database 11g incluye servicios 3-D y Web para gestionar datos geoespaciales bajo

los modelos vector y mosaico, representacion de topologıa y modelos de red, cubriendo

ası las necesidades de diversas aplicaciones SIG. Ademas trabaja con formatos estandares

lo que le permite poder interactuar con servicios de diferentes proveedores. PostGIS por su

parte incorpora a PostgresSQL el concepto base de datos objeto−relacional para objetos

geograficos. PostGIS “globaliza” al servidor PostgreSQL, ya que puede ser usado como

el servidor de base de datos espacial de diversos SIG. PostGIS cumple con las especifi-

caciones OpenGIS “Simple Features Specification for SQL”[BCU+99] certificando como

estandar.

Los datos que son procesados por un SIG describen fenomenos en terminos de “que”,

“cuando” y “donde” [Raj10]. La magnitud de la componente ubicacion puede medirse en

unidades que van desde los centımetros a miles de kilometros. La habilidad de transformar

datos de una escala a otra y de un sistema de proyeccion a otro es una parte importante

del procesamiento de datos. Involucra no solo el cambio de tamano, sino como tratar

los problemas de precision, eficiencia y consistencia. Otros tipos de transformaciones de

datos ocurren cuando se realizan cambios de modelo mosaico a modelo vector y a la

inversa. Estas transformaciones se relacionan con la funcionalidad de ingreso de datos.

Finalmente, otras tareas de procesamiento tienen que ver con el objetivo principal de

un SIG que consiste en transformar “datos” en “informacion”. La tecnologıa SIG ofrece

5En Ingles On-Line Transaction Processing (OLTP).

Page 77: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Caracterizacion de las aplicaciones SIG 51

metodos para elaborar y analizar los datos geograficos y generar nuevos temas o salidas

en mapas. Las aplicaciones SIG funcionan como herramientas de soporte de decision. El

proceso de interpretacion involucra medidas objetivas y juicio subjetivo de expertos, para

realizar asociaciones, identificar hechos y patrones.

Las habilidades de presentacion de la tecnologıa SIG permiten comunicar hechos a la

audiencia general. Incluye mapas, resumenes, cuadros, reportes, animacion, siendo conti-

nuos los avances en este area. Un calidad importante cuando se requiere de tecnicas de

analisis es la eficiencia. Para ello es importante la seleccion del modelo de datos adecuado

para representar los fenomenos de cada problema particular, de forma que permita la

recuperacion de datos y algoritmos eficientes para procesamiento de consultas.

3.3.2. Restricciones

Es amplio el rango de problemas para los que una propuesta de solucion es el desarrollo

de una aplicacion SIG. Las diferentes aplicaciones, mas alla de la diversidad del dominio

de aplicacion, comparten las siguientes caracterısticas comunes [Zei99]:

En general un SIG necesita estar integrado con otras aplicaciones. Es importante

que los datos del SIG se almacenen y organicen de forma tal que permitan el acceso

distribuido.

Es especialmente importante considerar una arquitectura de datos abierta6 que fa-

cilite la integracion de datos geograficos con otros datos como pueden ser: datos

obtenidos en tiempo real, imagenes o bases de datos corporativas generadas por

proveedores externos.

Los mapas siguen siendo la manera mas usada para visualizar IG. En el uso de

SIG las aplicaciones con acceso dinamico a mapas vıa Internet actualmente son una

restriccion importante a considerar.

Se debe elegir la estructura de datos apropiada que permita obtener la clase de

analisis que se desea realizar. Por ejemplo, es diferente el modelado de una superficie

continua si se usa un modelo mosaico o si se opta por un modelo del tipo vector y

tambien es muy diferente el tipo de consultas que se podran realizar al sistema.

6En Ingles open data architecture.

Page 78: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

52 Capıtulo 3. Sistemas de Informacion Geografica

3.4. Visualizacion de mapas

El mapa es la representacion visual principal de un sistema geografico. En el mapa

se vuelca el conocimiento sobre donde se ubican ciertos fenomenos, como se puede lle-

gar a ellos, su referencia geografica con relacion a otros elementos del mapa, etc. Esta

informacion se puede obtener en un mapa tradicional; sin embargo, la caracterıstica dife-

rente de un SIG es que permite sesiones interactivas, destacando los aspectos de interes

y ocultando informacion no relevante.

Por definicion, un mapa es una proyeccion especıfica que transfiere puntos o locacio-

nes de la Tierra escaladas en una superficie o mapa de acuerdo con una transformacion

sistematica y usando alguna grilla latitud/longitud. Las imagenes y mapas son inherente-

mente bi-dimensionales o planos, aunque con el uso de colorimetrıa y sombreado pueden

presentar una apariencia tri-dimensional.

3.4.1. Formas de representacion

Desde hace anos que existen convenciones para describir accidentes geograficos e iden-

tificar objetos en un mapa. Algunos ejemplos ampliamente conocidos son: el uso de lınea

doble para representar rutas, etiquetas para identificar lugares y el color azul para repre-

sentar cuerpos de agua. Los accidentes geograficos representan elementos naturales (rıos,

vegetacion o montanas), elementos creados por el hombre (rutas, redes de comunicacion

o edificios) o pueden incluir divisiones administrativas (paıses, provincias, parcelas etc).

Existen tres maneras principales de representacion de un area geografica sobre un mapa:

como un conjunto de elementos discretos (figura 3.2(a)).

como una imagen o grilla de datos de muestra (figura 3.2(b)).

como una descripcion de la superficie (figura 3.2(c)).

Cuando se habla de fenomenos geograficos con representacion discreta, se refiera a ras-

gos que tienen distinta forma y que se pueden representar por puntos, lıneas y/o polıgonos.

Los puntos representan rasgos geograficos muy pequenos como para ser modelados usan-

do lıneas o areas. Entre los objetos que suelen tomar esta representacion se pueden citar

localidades, edificios o ubicaciones que no tienen area, como puede ser un pico montanoso.

Page 79: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Visualizacion de mapas 53

Figura 3.2: Representaciones geograficas en el mapa

Hay que tener presente que la calidad de pequeno depende de la escala que se utilice. Las

lıneas representan accidentes geograficos demasiado delgados como para ser modeladas

usando areas. En general incluyen a caminos, rıos, lıneas de comunicacion, y en algunos

casos particulares, contornos. Por ultimo, los polıgonos son figuras cerradas que represen-

tan la forma y la ubicacion de un fenomeno geografico, como pueden ser estados, paıses,

parcelas o zonas.

Un mapa como grilla de datos se obtiene en forma de fotografıas aereas o imagenes

satelitales. Similarmente, representan fenomenos continuos muestreados como son tempe-

ratura, precipitaciones o elevaciones. El mapa se representa como una matriz comprimida

bi-dimensional de celdas, donde cada celda mantiene sus propios atributos.

La superficie terrestre es continua. Algunos aspectos de dicha superficie pueden incluir

elevaciones, declinaciones, picos y corrientes de agua. Las lıneas que comparten igual

elevacion se representan dibujandolas en el mismo color. Ası para describir la forma de

la tierra se puede crear una superficie que se muestra usando algun rango de colores

de manera de caracterizar la iluminacion del sol, elevacion, pendiente y apariencia. En

general, este tipo de mapas modela la topografıa de un lugar, pero la misma idea puede

utilizarse para representar otros atributos como densidad de poblacion de una superficie.

En resumen, se puede decir que al hablar sobre IG existen distintas caracterısticas o

propiedades geograficas que necesitan de diferentes abstracciones para su representacion

[Mit99b]. Cada abstraccion ofrece sus propias cualidades y restricciones, es ası, que de-

pendiendo del dominio de aplicacion y de las necesidades de consultas se debera optar

Page 80: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

54 Capıtulo 3. Sistemas de Informacion Geografica

por la representacion que mejor responda a las calidades de performance, usabilidad y

requerimientos de almacenamiento.

3.4.2. Los mapas interactivos

Los mapas tienen uno o mas propositos particulares. El primer objetivo es simplemente

registrar donde se ubica algo. A partir de allı dan a sus usuarios la posibilidad de ubicar

una posicion relativa. El tercer proposito serıa el de interrelacionar la informacion de

distintos mapas para alguna tarea de analisis o investigacion especıfica que conduzca

a diferentes acciones. Ası, por ejemplo, para el objetivo “encontrar el mejor lugar donde

instalar una fabrica”, se podrıan integrar mapas con informacion topografica, demografica

y de distribucion de la energıa, entre otros. Los mapas interactivos, son capaces de [Zei99]

compartir y visualizar concocimiento del mundo de distintas maneras:

Identificar con que se corresponde una posicion. Se puede obtener el nombre y otros

atributos descriptivos.

Identificar distribuciones, relaciones y tendencias. Por ejemplo, un especialista en

demografıa estarıa en condiciones de definir guıas de polıticas publicas a partir

de comparar mapas urbanos. Un especialista en epidemiologıa puede vincular los

lugares en donde se desarrolla una epidemia con factores ambientales para encontrar

las posibles causas.

Integrar datos de diversas fuentes en un sistema de referencias geograficas compar-

tido. Ası, por ejemplo, se pueden combinar imagenes satelitales sobre climatologıa

con mapas de distribucion de siembra para mejorar la productividad.

Resolver problemas espaciales. Por ejemplo, se pueden combinar varios niveles de

datos para encontrar la mejor ubicacion para un deposito de desechos.

Encontrar el mejor camino. Por ejemplo, obtener el mejor recorrido para distribuir

una carga, o definir el camino optimo para un transporte publico.

Simular comportamiento ante posibles eventos futuros. Por ejemplo, simular el im-

pacto de una emanacion toxica y desarrollar escenarios de evacuacion.

Page 81: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Visualizacion de mapas 55

Figura 3.3: Google Maps - Buscar camino

Uno de los ejemplos mas populares de mapas interactivos lo constituyen los Mapas

Google7 [Goo05]. Mapas Google es un servidor de aplicaciones de mapas vıa web libre.

Cuenta con tres alternativas de representacion: vista mapa (representacion vectorial),

imagenes satelitales e imagenes 3D (representaciones mosaico y 3-D). La representacion

satelital da opcion de superponer la capa “calles y nombres”. Provee herramientas para

aproximar/alejar y cambiar orientacion. Cuenta con servicios para localizar una direccion,

“pinchar” marcas en el mapa y buscar un camino para llegar desde un sitio a otro/s,

bajo las alternativas desplazarse “a pie”, “en auto” o “transporte publico”. Los mapas

generados son facilmente integrables a sitios web. En la figura 3.3 se puede observar un

ejemplo de uso de la aplicacion Google Maps para encontrar el camino para llegar desde

la Universidad Nacional del Sur a un destino dado. Incluye el detalle de calles a tomar y

el tiempo estimado del recorrido.

7En Ingles Google Maps.

Page 82: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

56 Capıtulo 3. Sistemas de Informacion Geografica

3.5. Arquitectura de los SIG

Dada una aplicacion SIG tıpica se identifican las siguientes cuatro unidades funcionales

principales [SMB+97]:

Unidad para ingreso de datos. El origen de datos de un SIG es diverso. Tıpica-

mente, se vincula con sensores, camaras y/o sistemas de posicionamiento global. Los

datos obtenidos son discretizados para ser representados en la computadora. En al-

gunos casos se combinan con procedimientos manuales. El proceso de discretizacion

puede imponer errores o distorsiones. La unidad de ingreso de datos debe contar con

alguna polıtica para medir la calidad de los datos: procedimientos de validacion y

cuantificacion de errores. Una propuesta consiste en definir y chequear restricciones

de integridad y topologicas. Un ejemplo de restriccion topologica podrıa ser “Car-

men de Patagones esta contenida dentro de los lımites de la provincia de Buenos

Aires”.

Modelo de datos. Los modelos de datos proveen las abstracciones para referir a los

fenomenos. Se fundamentan en la identificacion de conceptos tal como se refieren en

el mundo real y definir para ellos una representacion logica. Los datos que administra

un SIG generalmente se agrupan en temas. Cada tema presenta valores sobre un

topico particular, por ejemplo “Rutas y caminos”. En el modelado de un tema se

descompone y fragmenta el espacio como un conjunto de objetos o modelo vector,

o como un conjunto de valores asociados a una ubicacion o modelo de campos

(seccion 2.2). Las operaciones sobre el modelo de datos generalmente se delegan a

algun SMBDE.

Unidad de Consultas. Los datos geograficos son analizados y consultados por va-

rias operaciones. Algunas de las consultas sobre datos involucran busquedas espacia-

les y superposiciones. Las operaciones sobre tipos de dato vector incluyen operacio-

nes geometricas, operaciones topologicas y operaciones metricas. La disponibilidad

de operaciones esta condicionada y restringida por el modelo de datos subyacente.

Por ejemplo, un SIG que contiene un nivel de “rutas y caminos” de la provincia de

Buenos Aires, representado por el modelo red, podra calcular caminos para llegar a

Mar del Plata partiendo desde Capital Federal.

Page 83: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Areas de aplicacion 57

Unidad de Visualizacion. Un SIG generalmente cuenta con capacidades para

presentar resultados visuales en la forma de mapa. La representacion visual de las

salidas de operaciones espaciales puede incluir: imagenes graficas con objetos, image-

nes discretizadas bajo el modelo de campos, composicion o superposicion de mapas

y produccion cartografica.

3.6. Areas de aplicacion

Los SIG son ampliamente usados y su aplicacion abarca una gran variedad de tipos

de problemas. Entre los usuarios de los sistemas SIG se incluyen a grandes empresas,

organismos estatales o gubernamentales, y organizaciones internacionales. En el ambito

privado, las empresas estan interesadas en crear y mantener bases de informacion sobre

comunicaciones, tendidos, desagues, etc. Por su lado los organismos estatales y guber-

namentales estan interesados en los SIG y su aplicacion en proyectos de planeamiento

urbano, transporte, servicios ambientales, turismo e informacion censal. Tambien existe

interes en utilizar tecnologıa SIG por miembros internacionales como la Organizacion para

la Agricultura y la Alimentacion de las Naciones Unidas (FAO)8 [SWB+], y una variedad

de organizaciones comerciales que abarcan desde grandes cadenas de supermercados a

productores de baja escala. A modo descriptivo, los distintos tipos de problemas [Cor00]

para los que esta indicado el uso de SIG se pueden clasificar en las siguientes categorıas:

Analisis demografico: comprende el estudio sobre la distribucion de la poblacion de

un paıs o region. Su conocimiento es importante para muchas actividades relacio-

nadas con analisis de captacion de interes, como puede ser para el desarrollo de

pequenas y medianas empresas, el planeamiento publico (transporte, salud, servi-

cios) y la distribucion la tecnologıa de comunicacion. En tales actividades, el objetivo

es encontrar regiones apropiadas para cierto desarrollo y el impacto del mismo.

Gestion ambiental : varıan desde el monitoreo de polucion hasta estudios de distri-

bucion de la fauna silvestre. La mayorıa de los proyectos en este area son menos

comerciales y, a menudo, se valen de grandes volumenes de datos sensados remo-

tamente. Un area que esta en crecimiento es el estudio de impacto ambiental, que

necesita que se considere en su analisis el contexto geografico. Agricultura de alta

8En Ingles Food and Agriculture Organization of the United Nations.

Page 84: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

58 Capıtulo 3. Sistemas de Informacion Geografica

precision, planes de fertilizacion y sembrado son otro tipo de tareas que se pueden

organizar usando los servicios de un SIG.

Administracion de servicios publicos : se refieren al mantenimiento y planificacion

eficiente del uso, por ejemplo, de redes de gas o comunicacion. En este caso un SIG

se puede utilizar para estudiar la distribucion eficiente de la energıa, el balance de

carga de redes electricas, etc. Las organizaciones se valen de datos propios para crear

sus bases de informacion, y estos datos son combinados con datos de infraestructura

y demograficos.

Analisis de redes de comunicacion: esta relacionado con el diseno eficiente de sis-

temas de transporte y rutas de distribucion, y son de interes para companıas de

distribucion o mensajerıa a traves de la busqueda de caminos optimos. Aunque este

area es una aplicacion propia de los SIG, en ciertos casos se deben incluir paquetes

especıficos debido a la complejidad de las funciones de analisis. Para el desarrollo

de este tipo aplicaciones, ademas de los datos del sistema de conexion, tambien se

necesita de informacion demografica.

Distribucion territorial : esta relacionada con tareas de planificacion y desarrollo. Si

bien estas aplicaciones en cierto modo se interceptan con el analisis demografico y la

gestion ambiental, se mantienen como un ıtem separado dado que los departamen-

tos de planeamiento pueden necesitar que el SIG mantenga atributos especıficos e

incluso aspectos temporales.

Esta clasificacion no es rıgida ni exclusiva y muchas aplicaciones SIG ocupan mas de

una categorıa. De este breve resumen es claro que los SIG son ampliamente aplicables y

de allı el interes de las empresas de desarrollo de software en invertir sus esfuerzos en la

investigacion y desarrollo de los mismos.

Otras aplicaciones que siguen ganando interes son las aplicaciones espaciales que in-

corporan aspectos temporales. La combinacion de espacio y tiempo permite observar

el comportamiento de objetos en movimiento y predecir o informar caminos, como por

ejemplo movimientos de tormentas, desplazamiento de vehıculos, personas o cualquier

otro objeto en movimiento.

Page 85: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Aplicaciones 59

3.7. Aplicaciones

A continuacion se presentan algunos ejemplos de aplicaciones del tipo SIG. Todos ellos

corresponden a aplicaciones gubernamentales de uso publico.

3.7.1. Sismos y Terremotos en el mundo

El “Earthquake Hazards Program”9 [USG07] forma parte de la multi-agencia National

Earthquake Hazards Reduction Program (NEHRP). Cuenta con un sitio web proporcio-

nado por los United States Geological Survey (USGS) con varias aplicaciones que incluyen

componentes SIG. Una de las areas de investigacion en desarrollo de USGS es este progra-

ma que se ocupa de colaborar en la prediccion para reducir peligros a causas de tsunamis,

sismos y erupciones volcanicas. En el sitio se puede encontrar una aplicacion en lınea con

informacion en tiempo real sobre los movimientos terrestres en el mundo. La informacion

a visualizar incluye informacion historica y hasta los movimientos terrestres registrados en

la ultima hora. Provee mapas con vistas vectoriales y satelitales. Permite consultar infor-

macion mundial, posee facilidades de zoom y detalles descriptivos de los eventos. Visualiza

en mapas los movimientos sistemicos. En la figura 3.4 se ven dos mapas con informacion

de los movimientos terrestres ocurridos en Chile en febrero de 2010. La imagen 3.4(a)

corresponde a un mapa con informacion continua que muestra la escala de intensidad de

los movimientos, la imagen 3.4 (b) identifica los distintos puntos de movimientos, donde

el color y tamano de los puntos sirve como referencia sobre la intensidad.

Con relacion a las caracterısticas del software, se trata de un desarrollo que trabaja

con informacion en tiempo real. Como resultado de este desarrollo se creo una nueva

herramienta, Mecanismos focales 3D (3DFM), para ver dimensionalmente los sımbolos

que simulan focos de terremoto. Esta herramienta opera bajo Environmental Systems

Research Institute (ESRI) GIS software ArcScene 9.x [ESR08]. El programa funciona con

las entradas provistas por Advanced National Seismic System (ANSS) que se ocupa de

obtener datos precisos y en lınea de eventos sısmicos y sus efectos. Para ello se emplean

las ultimas tecnologıas y metodos de monitoreo con foco en regiones de riesgo alto a

moderado y redistribucion automatica de los eventos detectados, alarmas de tsunamis y

erupciones volcanicas. ANSS cuenta con una red de 7000 sensores que proveen datos en

lınea con detalle, profundidad y valores muestreados.

9http://earthquake.usgs.gov/

Page 86: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

60 Capıtulo 3. Sistemas de Informacion Geografica

Figura 3.4: Earthquake Hazards Program - Mapas sobre los terremotos de Chile 2010

3.7.2. TOXMAP: Mapas sobre salud ambiental

TOXMAP: Environmental Health e-Maps [oM09] es una aplicacion SIG que provee

la Division of Specialized Information Services10 de la US National Library of Medicine

(NLM)11. Es una aplicacion SIG que combina una capa de “division administrativa de

Estados Unidos” con capas de contaminacion ambiental generadas a partir de datos pro-

vistos por la US Environmental Protection Agency (EPA) sobre componentes toxicos y

manejo de desechos industriales.

El origen de datos de contaminacion es la base de datos publica “Toxics Release

Inventory (TRI)” que se genera a partir del inventario de liberacion de quımicos toxicos y

manejo de desperdicios reportados anualmente por los grupos industriales e instalaciones

federales segun lo establece la ley “the Emergency Planning and Community Right to

Know Act (EPCRA)”12. Esta base de informacion mantiene datos sobre cantidades y

distribucion de toxicos quımicos que son liberados al aire, al agua y/o que son enterrados

cada ano, ası como el tratamiento, ubicacion y cantidades de desperdicios quımicos.

10http://sis.nlm.nih.gov11http://www.nlm.nih.gov12http://www.epa.gov/regulations/laws/epcra.html

Page 87: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Aplicaciones 61

Figura 3.5: SIG - TOXMAP

La aplicacion TOXMAP: Environmental Health e-Maps recupera y transforma la in-

formacion que le provee la agencia de proteccion ambiental siguiendo procesos estrictos de

control de calidad sobre los datos generados. Provee facilidades para crear en lınea mapas

interactivos que combinan las capas de organizacion administrativa de Estados Unidos,

con las capas de emanacion de toxicos, medidas paliativas y mortalidad de las personas.

La aplicacion es de uso publico y esta disponible vıa Web. Permite confeccionar mapas,

aproximar regiones, ver informacion de contaminacion y combinarlas con medidas de pla-

neamiento y mortalidad. Es posible ajustar la capas de mortalidad definiendo filtros por

sexo, raza y causal (cancer u otros) (figura 3.5).

Page 88: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

62 Capıtulo 3. Sistemas de Informacion Geografica

3.7.3. MAPS: Herramientas de Analisis y Mapas sobre Seguri-

dad Publica

Mapping and Analysis for Public Safety (MAPS) [oJ09] del National Institute of Jus-

tice (NIJ). El departamento de justicia de Estados Unidos participa del proyecto MAPS,

un programa que apoya la investigacion y ayuda a los organismos a usar tecnologıa SIG

para mejorar la seguridad publica. El programa incluye: usar mapas y datos espaciales

para realizar analisis del delito, integrar el trabajo de investigadores para evaluar y definir

programas y polıticas y elaborar herramientas para construir mapas, agregar datos y rea-

lizar analisis espacial. En el marco del proyecto se crearon tres aplicaciones geoespaciales

de escritorio para la aplicacion cotidiana en organismos de seguridad publica:

CrimeStat III: es un programa con estadısticas espaciales que se utiliza para ana-

lizar los lugares de incidencia de delito. Incluye caracterısticas para identificar y

analizar los lugares de mayor riesgo, trasladar incidentes a mapas, resaltar visual-

mente las zonas de concentracion del delito, seguir la pista del comportamiento de

los delincuentes, hacer seguimiento de la residencia de delincuentes seriales y conocer

las rutas de persecucion mas agiles.

FacilityCop software mapas: es un software para analisis y registro de incidentes

de delito en carceles o prisiones. Las instalaciones carcelarias pueden utilizarlo para

generar reportes tabulares, cuadros y graficos.

School Crime Operations Package (School COP): provee herramientas visua-

les para personal de escuelas que se puede utilizar para analizar mapas de incidentes

de delito de la zona de influencia. Permite trabajar con informacion por escuela o

por distrito escolar.

Este grupo de herramientas fue disenado para ayudar a mejorar la seguridad, investigar

los delitos y delincuencia, y definir iniciativas de prevencion.

Page 89: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Aplicaciones 63

3.7.4. PROSIGA: Proyecto Sistema de Informacion Geografica

Nacional de la Republica Argentina

El Proyecto Sistema de Informacion Geografica Nacional de la Republica Argentina

(PROSIGA)13 [Nac06] integra esfuerzos de distintos organismos de la Republica Argenti-

na que trabajan en IG y promueve la vinculacion de informacion que es generada por los

responsables oficiales. El objetivo es conformar un “mapa global del paıs” con informacion

generada por productores oficiales, en formato digital, de acceso publico y disponible a

traves de Internet. Se espera contar con informacion de utilidad para la toma de decisio-

nes a nivel local, regional y nacional. Incluye informacion de dominio publico relativa a

diversos temas: relieve, hidrografıa, composicion de los suelos, bosques, produccion agro-

pecuaria, datos de los catastros urbanos y rurales, y equipamientos, entre otros.

El proyecto tiene por objetivos proveer disponibilidad en forma integrada de IG de

la Republica Argentina, dar intervencion directa a multiples actores gubernamentales,

vincular a los actores mediante una estructura nodal de intercambio de datos y brindar

acceso a la comunidad a traves de una herramienta que integra IG de distintas fuentes.

Caracterısticas de la propuesta:

Provee acceso remoto en lınea vıa Web a IG.

Garantiza datos actualizados por los distintos organismos responsables de proveer

los datos.

Ofrece acceso a informacion a escalas nacional, regional y catastral.

Promueve el trabajo respetando normas y estandares que aseguren la integracion

de la informacion.

Entre las aplicaciones posibles se pueden citar: planificacion y desarrollo, seguridad,

forestacion, gestion de la energıa, catastro urbano y rural, agricultura, pesca, industria-

lizacion, ganaderıa, educacion, etc. Un aspecto importante que favorecio el avance del

proyecto fue la adopcion de las tecnologıas IDE y las normas y estandares ISO/TC 211,

ISO y OGC.

13http://www.sig.gov.ar/

Page 90: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

64 Capıtulo 3. Sistemas de Informacion Geografica

Figura 3.6: PROSIGA - Datos provistos por la Secretarıa de Energıa de la Nacion

La operacion de la aplicacion es en lınea. Es de dominio publico, aunque requiere

de la registracion de usuarios. El ambiente posee multiples capas. Posee facilidades para

integrar nuevas capas y facilidades para definir zonas. El proyecto esta en etapa de desa-

rrollo. Algunas interacciones no pueden superponerse. La figura 3.6 muestra un ejemplo

de mapa generado a partir de los datos y temas provistos por la Secretarıa de Energıa

de la Nacion. En el ejemplo se superpuso la capa de radiacion solar medida en el mes de

Noviembre (modelo continuo), con la capa de distribucion de minas y canteras (modelo

discreto). La aplicacion interactiva provee diversas capas predefinidas, seleccion de capas

por superposicion, posibilidades de activar y desactivar capas, aproximar y alejar, y definir

consultas.

Page 91: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Resumen del capıtulo 65

Organismos que integran el proyecto PROSIGA

Actualmente veinte organismos y municipios forman parte del proyecto, ellos son: la

Secretarıa de Energıa de la Nacion (SE), el Gobierno de la Ciudad Autonoma de Buenos

Aires (GCBA), la Secretarıa de Agricultura Ganaderıa Pesca y Alimentos (SAGPyA), el

Instituto Geografico Nacional (IGN), la Municipalidad de Malvinas Argentinas (Pcia. de

Bs As), el Instituto Nacional de Estadısticas y Censos (INDEC), el Ente Nacional Regula-

dor del Gas (ENARGAS), la Municipalidad de Lujan (Pcia. de Bs As), la Municipalidad

de Junın (Pcia. de Bs As), la Municipalidad de Viedma (Pcia de Rıo Negro), la Univer-

sidad Provincial de la Punta (Pcia. de San Luis), el ETISIG Chaco (Equipo de Trabajo

Interdisciplinario en Sistemas de IG de la Provincia del Chaco), el Servicio Nacional de

Sanidad y Calidad Agroalimentaria (SENASA), la Universidad Nacional de Catamarca,

la Municipalidad de Rosario, la Secretarıa de Ambiente y Desarrollo Sustentable de la

Nacion, el Centro Argentino de Cartografıa, la Administracion de Parques Nacionales, la

Municipalidad de La Plata y la Universidad Catolica de Salta.

3.8. Resumen del capıtulo

Los SIG son una tecnologıa de “proposito general” que provee servicios para adminis-

trar datos geograficos, localizar eventos, encontrar caminos, explorar relaciones, y visuali-

zar y analizar informacion a traves de su uso interactivo. Basandose en esta tecnologıa se

construyen diversas aplicaciones SIG para satisfacer los requerimientos de algun proble-

ma particular. Los datos geograficos que nutren las aplicaciones SIG estan vinculados con

uno o varios puntos de la superficie terrestre. La IG que representa a fenomenos reales

se organiza en dos abstracciones: modelos discretos con objetos y campos continuos. Los

SIG cuentan con los modelos de datos para poder representar en la computadora ambas

abstracciones.

La estrategia de diseno ampliamente utilizada en geografıa y que simplifica el modelo

conceptual de una aplicacion SIG es la de agrupar los hechos o fenomenos relativos a un

topico en “capas” o “temas”. Ası, por ejemplo, para una region particular (paıs, provincia,

distrito, ciudad) se podrıan definir la capa rutas y caminos, para contener los elementos

que representan a las vıas de comunicacion de dicha region, y la capa espejos de agua que

se encargue de representar a lagos, rıos, lagunas, arroyos y diques. La organizacion por

Page 92: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

66 Capıtulo 3. Sistemas de Informacion Geografica

temas permite trabajar superponiendo o quitando capas segun se requiera. Superponer

ambas capas permite tener conocimiento sobre que caminos tomar para llegar a una

laguna.

Un componente importante de la tecnologıa SIG lo constituye la unidad de visua-

lizacion. En informacion geografica la representacion tradicional de fenomenos es en el

mapa. El uso de mapas digitales agrega las posibilidades de superponer/quitar temas,

enfocar/alejar una zona, optar por visualizaciones discretas o imagenes satelitales. Esto

permite a usuarios expertos del dominio combinar capas de informacion cruda de manera

que se genere un nuevo conocimiento sobre determinado espacio geografico. Otro tipo de

herramientas que acompana a la visualizacion es la de consultas espaciales. Las consultas

espaciales pueden ser metricas, geometricas o topologicas.

Los campos de aplicacion para esta tecnologıa son diversos; entre ellos se pueden citar

cartografıa, sensado remoto, distribucion de superficie, manejo de distribucion polıtica,

analisis sociologico, distribucion de recursos naturales, planeamiento urbano y localiza-

cion. Ası tambien el numero de usuarios de aplicaciones SIG es amplio, incluyendo em-

presas privadas, organismos estatales y usuarios particulares. Entre los mayores costos

(economicos y en tiempo) de una aplicacion SIG esta el de generar los datos. Esto suma-

do a los avances en tecnologıa de la comunicacion que permiten tener acceso en lınea a

informacion distribuida ha aumentado el interes por poder compartir IG.

Page 93: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Capıtulo 4

Integracion de Informacion

Geografica

A traves de los anos varios problemas se han enfrentado con la necesidad de compartir

y reutilizar el conocimiento adquirido sobre un dominio. Compartir conocimiento incluye

transferir el saber de una persona a otra, de una organizacion a otra, de un grupo a una

persona, entre otros modelos de colaboracion. La comunicacion distingue las entidades

remitente y receptor. Si ocurre que el receptor y emisor son entes arbitrarios que no

comparten el mismo lenguaje, terminologıa y/o modelo mental, se hace difıcil o imposible

descifrar el mensaje. La solucion a este problema consiste en estructurar el mensaje con

informacion suficiente para que el receptor pueda entenderlo.

La Web Semantica se relaciona con la nocion de interoperabilidad. Se busca disponer

en la Web de conocimiento especificado sin ambiguedades y que pueda ser interpretado

por agentes automaticos. Esto permitira usar la informacion mas inteligentemente que

simplemente para mostrarla, e incluso se podrıan compartir y reusar datos y/o servicios

de fuentes diversas. En particular, se plantea la necesidad disponer de una Web Semantica

Geoespacial [Ege02], basada en un marco que comprenda diversas ontologıas espaciales

tematicas junto con una forma canonizada para especificar consultas geoespaciales. La de-

manda es por el acceso completo a la IG, que es heterogenea y esta distribuida. Compartir

IG en forma eficiente requiere encontrar una solucion a los problemas tecnicos relaciona-

dos con la heterogeneidad en la forma de representacion. Las dificultades que surgen al

reunir sistemas distribuidos heterogeneos se conocen como problemas de interoperabilidad.

Para compartir informacion no solo se requiere proveer acceso a los datos, sino tambien

Page 94: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

68 Capıtulo 4. Integracion de Informacion Geografica

brindar informacion para que los datos puedan ser procesados e interpretados por sistemas

remotos.

4.1. Motivacion

Como se explico en el seccion 3.6 del capıtulo anterior, los usos de SIG abarcan una

amplia variedad de areas de interes. Los propietarios incluyen a empresas privadas, orga-

nismos nacionales e internacionales y de educacion e investigacion. La IG en general es

voluminosa, con estructura compleja y puede estar distribuida y clasificada por temas en

diversos servidores. Uno de los mayores costos de implementacion de una aplicacion SIG

es la adquisicion de datos geograficos cuando no se dispone de ellos. En muchos casos, la

IG de algun topico especıfico, como por ejemplo “rutas y caminos”, ya existe para algun

otro desarrollo. Contar con la posibilidad de compartir datos y servicios implica disminuir

costos y tiempos de puesta en funcionamiento, ası como optimizar la confiabilidad de la

informacion. Los distintos ambitos de uso de aplicaciones SIG comparten los siguientes

requisitos:

Necesitan estar integrados con otras aplicaciones. Es importante que los datos se

almacenen y organicen de forma que permitan el acceso distribuido.

Deben optar por la representacion de datos apropiada ya que de ello depende el tipo

de consultas que se podran realizar al sistema.

Por muchos anos, cada desarrollo SIG definio sus formatos de representacion y alma-

cenamiento para los datos geograficos, ası como sus modelos conceptuales. A la hora de

compartir se requieren establecer los formatos con los cuales se brindara la informacion (o

se espera recibirla). El receptor posteriormente debera convertirla al formato utilizado por

su sistema. Los diversos formatos de IG existentes implican problemas de interoperabili-

dad entre diferentes SIG y aun entre aplicaciones desarrollados con la misma herramienta.

Los costos y la posibilidad de automatizar la integracion de datos se veran beneficiados

si los formatos de los datos geograficos siguen algun estandar. Entre las propuestas de

estandares para modelar e intercambiar datos y servicios geograficos se pueden citar por

ejemplo, los propuestos por el consorcio Open Geoespatial Consortium (OGC) 1 [OGC94],

1http://www.opengeospatial.org

Page 95: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Interoperabilidad e Integracion 69

el comite Tecnico de normalizacion sobre Geomatica e Informacion Geografica ISO/TC

2112 [ISO94], Spatial Data Transfer Standard (SDTS)3, y otras propuestas como la in-

tegracion semantica guiada por ontologıas para asegurar la integracion semantica en el

ambito conceptual.

4.2. Interoperabilidad e Integracion

Los sistemas y aplicaciones con datos geograficos y/o cartograficos surgen en la decada

del ’70. Los primeros desarrollos se basaron en productos comerciales propietarios y con

fuentes de datos propias, las que raramente se obtenıan en forma digital. Los datos no

se compartıan entre organizaciones o empresas fundamentalmente porque era imposible.

Cada SIG se podıa considerar una “isla de informacion” [Bis98]. En las ultimas decadas

se viene trabajando fuertemente para revertir esta situacion buscando contar con SIG

“interoperables”.

Desde la perspectiva de Ingenierıa de Software, la calidad de interoperabilidad se re-

laciona con sistemas con capacidades para integrar componentes de software que provie-

nen de diferentes proveedores. Esto permite a un nuevo producto de software ingresar al

mercado a competir con otros productos, rompiendo la dependencia cliente−proveedor,

ası como tambien ofrecer software integrable con otros modulos. En el ambito de sistemas

geoespaciales se requiere que SIG, bases de datos espaciales, servicios de mapas y otras

aplicaciones sean capaces de integrarse de forma transparente.

Desde el punto de vista de los datos, el termino integracion de informacion se refiere

a la necesidad de compartir datos y mas especıficamente informacion, esto es, datos y su

significado. Si la informacion es producida y gestionada localmente, en general resulta no

ambigua para su comunidad de uso. Sin embargo, cuando la misma ha sido producida

por otros esto deja de ser cierto, y se requiere de conocimiento y reglas de transformacion

para integrar informacion “heterogenea”.

Los principales organismos trabajando en estandarizacion para asegurar interoperabi-

lidad e integracion en el ambito de SIG son OGC e ISO/TC 211. La organizacion interna-

cional OGC se encarga de promover y garantizar interoperabilidad para los componentes

2http://www.isotc211.org/3http://mcmcweb.er.usgs.gov/sdts/

Page 96: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

70 Capıtulo 4. Integracion de Informacion Geografica

de software geoespacial. Se trata de un consorcio de companıas privadas, agencias guberna-

mentales y universidades que acuerdan en la especificacion de interfaces de codigo abierto

aplicables a sistemas de geoprocesamiento. Las Especificaciones OpenGIS proveen solu-

ciones interoperativas. El comite ISO/TC 211 define normativas de representacion para

la IG digital y transferencia de datos y servicios que se ocupan de los metodos, herra-

mientas y servicios para la gestion de datos, adquisicion, procesamiento, analisis, acceso,

presentacion y transferencia de IG en formato digital entre diferentes usuarios, sistemas

y localizaciones. El proximo capıtulo de este trabajo (seccion 5.2) presenta los principales

resultados en estandarizacion para interoperabilidad e integracion geoespacial.

En esta tesis nos hemos concentrado en identificar los problemas y los principales resul-

tados obtenidos en el area integracion de IG. Quedan fuera de este trabajo la investigacion

y el analisis de problemas y resultados relacionados con la interoperabilidad de servicios

geograficos. En las secciones siguientes de este capıtulo se presentan los principales pro-

blemas en integracion geografica y se los clasifica en distintos niveles de heterogeneidad.

En los proximos capıtulos se recopilan los principales esfuerzos y resultados alcanzados

en integracion de IG.

4.2.1. Heterogoneidad de informacion

La integracion de datos, mas alla del tipo de sistemas a integrar, presenta una serie

de problemas que, en general, son complejos de resolver. El concepto de integracion en

sı mismo involucra decisiones a tomar en forma correcta para lograr un resultado consis-

tente. Las principales fuentes de informacion son almacenamientos de datos persistentes o

bases de datos. La integracion de los diversos modelos de datos que utilizan las distintas

soluciones de un mismo problema es clave para compartir informacion. Usando el recur-

so de abstraccion se identifican dos vistas para el problema de heterogeneidad en bases

de datos: heterogeneidad estructural y heterogeneidad semantica [KS96]. Se dice que dos

soluciones presentan heterogeneidad estructural si almacenan sus datos bajo modelos de

representacion diferentes. Este tipo de heterogeneidad se relaciona con cuestiones “tecni-

cas” o de un nivel de abstraccion bajo y resultan mas simples de generalizar. Desde otro

punto de vista, la heterogeneidad semantica considera el “significado” de cada elemento de

informacion. Los conflictos semanticos ocurren cuando en contextos diferentes no se utili-

zan las mismas interpretaciones. En general, los problemas de heterogeneidad semantica

Page 97: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Interoperabilidad e Integracion 71

son mas difıciles de comprender, generalizar y solucionar. Es necesario definir reglas de

integracion semantica para encontrar las correspondencias o “mapeos” entre los modelos.

Ejemplo 4.2.1 Sean dos sistemas de informacion inmobiliarios S y T interesados en

compartir informacion, ambos desarrollados bajo el modelo relacional. S considera dos

esquemas de relacion: Propiedades con los atributos ubicacion, precio e idAgente y

Agentes con los atributos idAgente, nombre, domicilio, ciudad, provincia y comision.

En esta organizacion existen las relaciones “propiedades” y “agentes”, vinculadas por el

identificador de agente. La solucion T por su parte considera un unico esquema Ofer-

tas con los atributos zona, precioOferta, agente, contacto y una unica relacion “ofertas”

(figura 4.1). A partir de estas dos propuestas se puede realizar el siguiente analisis sobre

heterogeneidad:

Heterogeneidad estructural: no existe. Ambas soluciones utilizan como modelo de

representacion al modelo Relacional.

Heterogeneidad semantica: claramente el modelo conceptual elegido por ambas solu-

ciones es distinto. Sin embargo, se pueden plantear las siguientes reglas de corres-

pondencia semantica:

• el atributo “ubicacion” de S.propiedades se corresponde con el atributo “zona”

de T.ofertas.

• el atributo “precio” de S.propiedades se corresponde con el atributo “precioO-

ferta” de T.ofertas.

• el atributo “nombre” de S.agentes se corresponde con el atributo “agente” de

T.ofertas.

• los atributos “domicilio+ciudad” en S.agentes se corresponden con el atributo

“contacto” de T.ofertas.

Para definir correspondencia semantica se requiere decidir si dos elementos s de S y t

de T refieren a un mismo concepto, lo que no es facil por varias razones:

Existen pocas fuentes de informacion de donde se pueda recuperar la semantica de

los elementos. En general, el conocimiento semantico se debe capturar desde los

Page 98: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

72 Capıtulo 4. Integracion de Informacion Geografica

disenadores del modelo, que no siempre estan disponibles; desde la documentacion,

tambien no siempre disponible y posiblemente desactualizada; o desde el “reconoci-

miento” de los datos asociados.

Aunque existen pistas tanto en los esquemas como en los datos, estas pueden llegar

a ser falsas. Dos elementos que comparten un mismo nombre de atributo pueden no

referirse al mismo concepto real. Por ejemplo, un atributo contacto en un modelo

podrıa referir a un nombre de persona y en otro a un telefono. La inversa tambien es

cierta: existen conceptos identicos que se modelan con distintos nombres de atributo

segun el modelo. En el ejemplo de la inmobiliaria, los atributos ubicacion y zona

referencian al mismo concepto del mundo real.

Decidir si un elemento s de S corresponde con un elemento t de T requiere que se

examinen todos los otros elementos de T para asegurar que no hay otro elemento

con el que hacer una correspondencia mejor.

La correspondencia entre elementos es subjetiva y depende del entorno de aplicacion.

Por ejemplo, el atributo propiedad-descripcion podrıa corresponder con propiedad-

estilo en dos aplicaciones inmobiliarias, pero seguramente refieren a cosas distintas si

el atributo propiedad-estilo esta en el contexto de un modelo de datos de un sistema

de turismo.

Encontrar correspondencias entre elementos no se limita unicamente a definir equi-

valencias entre ellos. Dos elementos podrıan estar vinculados por otros tipos de

relaciones semanticas como por ejemplo: el concepto A “es una especializacion de”

B (calleV ecinal es un tipo de camino), el concepto A “es uno de los componentes

de” B (parcela es una parte de manzana), ademas de otras asociaciones diversas

que se quieran conocer dentro del dominio de aplicacion (rıo “desemboca en” rıo

o rıo “desemboca en” mar).

En el ejemplo 4.2.1 se muestra como se pueden establecer correspondencias semanti-

cas entre estructuras o esquemas. La correspondencia entre instancias de datos enfrenta

dificultades similares. Se trata de determinar si dos elementos de datos se corresponden

con la misma informacion. Aplicado al ejemplo inmobiliario, se refiere a como identificar

si ambos sistemas comparten una o mas propiedades.

Page 99: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Interoperabilidad e Integracion 73

Figura 4.1: Dos modelos de datos para un mismo problema inmobiliario

En general se reconoce que encontrar correspondencias en forma manual es muy costo-

so. Existen algunos intentos de sistemas de integracion que utilizan tecnicas automaticas

o semi-automaticas para encontrar correspondencias [MKS+05, MDVK, DDH01, DH05].

Investigaciones sobre este problema han tomado relevancia debido a la necesidad de ad-

ministrar volumenes muy importantes de datos distribuidos y heterogeneos.

4.2.2. Integracion de bases de datos heterogeneas

Se definen como sistemas de bases de datos distribuidos heterogeneos a los entornos con

varios sitios o nodos (servidores de bases de datos), con diferentes esquemas e instancias

de base de datos y software de base [SKS10]. En un entorno distribuido no se requiere

que todos los sitios conozcan de la existencia del resto y es posible que solo esten dispues-

tos a compartir parcialmente sus datos. Las diferencias de esquemas entre bases causan

problemas en el procesamiento de las consultas; estas diferencias, como se explico ante-

riormente, se relacionan con la heterogeneidad semantica. Las diferencias en el modelo

de representacion (por ejemplo, relacional y orientado a objetos) se ubican dentro de la

heterogeneidad sintactica.

Sobre heterogeneidad semantica en bases de datos, las tecnicas de correspondencia

entre modelos se organizan en dos grupos que dan origen a distintos sistemas de inte-

gracion: soluciones basadas en reglas y soluciones basadas en aprendizaje. Obviamente a

Page 100: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

74 Capıtulo 4. Integracion de Informacion Geografica

partir de estas soluciones de integracion existen sistemas que combinan ambas propues-

tas. Las soluciones basadas en reglas automaticas o semi-automaticas emplean reglas de

correspondencia entre esquemas en forma similar a lo que se harıa en forma manual. En

general, exploran metadatos de los esquemas: nombre de los atributos, tipos de dominio,

estructuras, numero de subelementos y restricciones de integridad. Algunos sistemas de

integracion basados en reglas son: TranScm [MZ98], DIKE [PU98], MOMIS (ARTEMIS)

[CdA99] y CUPID [MBR01]. Estos sistemas calculan mapeos entre esquemas basandose

en similitudes encontradas. Como ventajas de los sistemas basados en reglas se puede

decir que son eficientes y funcionan en forma apropiada para cierto tipo de dominios de

aplicacion. Las principales desventajas estan en que no explotan efectivamente las instan-

cias de datos, existen combinaciones de informacion entre esquemas que son complicadas

de comparar y a pesar de que encuentran coincidencias, es difıcil garantizar que estas son

correctas. Estos sistemas ademas no tienen capacidad para aprender del conocimiento ya

adquirido.

Las soluciones basadas en aprendizaje usan tecnicas de inteligencia artificial y explo-

ran informacion tanto de los esquemas como de los datos en sı mismos. Para encontrar

coincidencias analizan la especificacion de los atributos (tipos de datos, escalas, restric-

ciones), informacion estadıstica (valores mınimos, maximos, promedios y varianzas) y la

naturaleza jerarquica de los datos. Ademas, estos sistemas son capaces de aprender a

partir de “reglas de coincidencia” encontradas y predecir satisfactoriamente futuras co-

rrespondencias. Algunos desarrollos en este sentido son: Semint [LC00], LSD [DDH01],

iMAPS [DLD+04].

Tambien existen trabajos que explotan la nocion de correspondencia entre colecciones

de esquemas. Este escenario es tıpico si se exploran modelos de varias fuentes de datos. Los

resultados en este sentido demuestran que buscar coincidencias entre un numero mayor

de fuentes de informacion favorece encontrar mejores coincidencias que entre dos fuentes

especıficas [MKS+05, MDVK].

El problema de encontrar correspondencias varıa si se consideran solo relaciones 1:1 del

tipo “direccion es equivalente a domicilio” a si se pretende ademas considerar relaciones

mas complejas, como “nombre” en el esquema E1 se corresponde con la concatenacion de

primerNombre y segundoNombre y apellido del esquema E2.

Los trabajos mas recientes han desarrollado tecnicas para encontrar mapeos comple-

jos basandose en ontologıas de dominio [XE03]. Usan una combinacion de busquedas y

Page 101: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Integracion de Informacion Geograficos 75

tecnicas de aprendizaje y tecnicas de data mining. Por ejemplo, para encontrar mejores

mapeos entre dos esquemas, primero se hace un mapeo de ellos a una ontologıa de domi-

nio y se construyen las coincidencias basandose en las relaciones heredadas del dominio.

Se destaca la importancia de contar con conocimiento del dominio para obtener mapeos

complejos. Este conocimiento colabora en la construccion de correspondencias multiples,

eliminando tempranamente los caminos incorrectos, evaluando solo los caminos posibles

en un tiempo de ejecucion aceptable. Sobre ontologıas de dominio nos ocuparemos en el

capıtulo 6 de esta tesis.

Otro enfoque para integracion es establecer correspondencia entre datos. Incluye deci-

dir si dos objetos de distintas fuentes refieren a la misma entidad real [BM03, AMT04]. El

ejemplo mas popular de correspondencia de datos se aplica al dominio de material de in-

vestigacion y la busqueda de correspondencia entre publicaciones, autores e instituciones.

La problematica de correspondencias de datos se conoce bajo distintos nombres: limpie-

za de datos, eliminacion de duplicados, consolidacion de informacion y correspondencia

entre objetos, entre otros, y constituye un area de investigacion en Inteligencia Artificial,

Minerıa de Datos y Recuperacion de Informacion en la Web. Los sistemas de integracion

de datos tambien incluyen soluciones basadas en reglas y basadas en aprendizaje. Las

primeras propuestas emplearon reglas definidas de forma manual [HS95], las que posibi-

litan que se adquieran las proximas reglas de mapeo [SB02]. Otras soluciones se enfocan

en tecnicas de mapeo para cadenas [ME96]. Otras se ocupan del problema de escalabili-

dad para bases de datos muy grandes. Los metodos mas recientes usan recuperacion de

informacion [AMT04] y tecnicas de teorıa de la informacion.

4.3. Integracion de Informacion Geograficos

4.3.1. Caracterizacion de la informacion geografica

La IG distingue los componentes: espacial y tematico4. El componente espacial man-

tiene la referencia a un espacio, que para el caso de interes sobre IG es la superficie

terrestre. El componente tematico tiene que ver con la descripcion de las entidades fısicas

o abstractas de dicho espacio geografico. La integracion semantica en IG se relaciona con

el componente tematico.

4Opcionalmente puede existir un componente temporal.

Page 102: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

76 Capıtulo 4. Integracion de Informacion Geografica

Las variables tematicas o atributos se clasifican en cualitativas o cuantitativas segun

su dominio de valores. Las variables cuantitativas tienen por rango valores numericos, que

pueden ser continuos, como es el caso de temperatura o precipitacion; o discretos como

cuando se refiere a poblacion o cantidad de especies. El valor de un atributo cuantitativo a

su vez puede ser una medida directa como es el caso de poblacion o temperatura, o puede

ser calculado como por ejemplo ingreso-per-capita. Otra caracterıstica de las variables

tematicas cuantitativas es que opcionalmente se pueden agrupar en intervalos. Ası, por

ejemplo, la temperatura se podrıa clasificar segun un rango de valores en “caluroso”,

“templado” y “frıo”. Cada rango estara asociado con intervalos de valores. De esta manera,

una variable cuantitativa clasificada tiene un rango que consiste en conjuntos numericos de

intervalos disjuntos. Los aspectos semanticos de una variable tematica cuantitativa tienen

que ver justamente con el tema. Por ejemplo, para un atributo temperatura: las unidades

de medida, grados Celsius o Fahrenheit; como se tomaron las muestras, si el conjunto de

datos representan temperaturas mınimas y maximas; si el valor mınimo representa el de

todo un ano o un promedio de valores mınimos diarios. Problemas semanticos adicionales

ocurren cuando las variables cuantificadas se organizan por rango donde, por ejemplo, los

intervalos son distintos o se define una cantidad de subrangos diferentes.

Las variables tematicas cualitativas o variables nominales, tienen asociado un conjunto

de valores nominales discretos y cada valor tıpicamente esta vinculado a un termino. Es

frecuente el uso de IG cualitativa relacionada con areas como “geomorfologıa”, “uso del

terreno” y “tipos de cultivos” entre otros. Las variables tematicas cualitativas relacionan

una ubicacion con un concepto tematico que representa una cualidad de la variable. Algu-

nos ejemplos de valores para la variable cualitativo tipo de region son “zona de pinos”,

“area de aluviones”, “territorio de yacimientos”. Desde el punto de vista conceptual, el

valor de un tema cualitativo es un concepto para el termino o terminos que represen-

ta. Cada uno de los valores cualitativos corresponde a un tema geografico, que es mas

especıfico que el tema principal del mapa, por ejemplo, el valor “ganado vacuno” en el

mapa sobre producciones agrarias. Tambien podrıa ser el tema principal en otro mapa,

donde los subtipos diferentes de razas vacunas serıan los valores cualitativos. Este ejemplo

ilustra como valores cualitativos de fuentes de datos diferentes podrıan estar relacionados

y hasta conformar una taxonomıa de temas. En la figura 4.2 se pueden observar dos visua-

lizaciones de mapas con atributos tematicos cuantitativos y cualitativos respectivamente.

En general, esta establecido que la semantica para variables tematicas cuantitativas es

mas simple que para variables tematicas cualitativas ya que el significado de los valores

Page 103: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Integracion de Informacion Geograficos 77

Figura 4.2: Mapas Tematicos de Europa - variables cualitativas y cuantitativas

cuantitativos es menos propenso a ambiguedades.

4.3.2. Heterogeneidad en informacion geografica

Segun [Bis98] “la comunidad de IG identifica fenomenos del mundo real, les asocia un

modelo mental conceptual y luego elige una representacion en un modelo logico discreto”.

Estos modelos varıan de una representacion a otra (seccion 2.3). En los diferentes modelos

de IG se identifican los siguientes tipos de heterogeneidad especialmente referida a SIG

[Ter06]:

Heterogeneidad Sintactica: se refiere al modelo de datos utilizado por distintas so-

luciones. Diferentes SIG ofrecen soluciones que utilizan diferentes formatos y sus

datos espaciales podrıan estar representados con distintos modelos (vector o raster)

o inclusive referenciar a distintos sistemas de coordenadas. En este sentido, el Len-

guaje de Marcado Geografico (Geographic Markup Languaje - GML) (OGC 2004)

Page 104: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

78 Capıtulo 4. Integracion de Informacion Geografica

es una especificacion OGC que provee un formato comun para representar IG y da

una solucion para los problemas de heterogeneidad sintactica (ver seccion 5.4)

Ejemplo 4.3.1 Dos soluciones SIG S1 y S2 incluyen a la variable tematica “cubier-

ta forestal” con la representacion de las areas forestales de una region. Mientras que

S1 opto por el modelo vectorial y la descripcion de cada area incluye al componente

geometrico GM Surface, S2 eligio la representacion espacial mosaico manteniendo

para cada celda si pertenece o no a un area forestal.

Heterogeneidad Estructural : se relaciona con la forma en que se representan los

modelos mentales, por ejemplo, en el caso de SIG usando distintos atributos. Los

metadatos describen la estructura del esquema de representacion y se requiere de

herramientas que sean capaces de manejar esta heterogeneidad estructural.

Ejemplo 4.3.2 Dos soluciones SIG S1 y S2 consideran el modelado del tema “cu-

bierta forestal”. El modelo considerado por S1 incluye informacion de cada area

sobre si se trata de un area protegida o de un recurso economico. Por otro lado,

S2 no registra esas propiedades y sı mantiene informacion sobre la normativa que

regula cada area y los planes de reforestacion.

Heterogeneidad Semantica: se refiere al hecho que distintos agentes (personas u

organizaciones) usan distintos esquemas mentales, esto es, categorizan el mundo real

de diferentes maneras. En el caso de SIG, estas categorıas corresponden a conceptos

tematicos, y en consecuencia la semantica esta principalmente relacionada con el

componente tematico de la IG que se esta modelando.

Ejemplo 4.3.3 Dos soluciones SIG S1 y S2 consideran el modelado del tema “cu-

bierta forestal”. Sin embargo, S1 considera como area forestal a las areas cubiertas

de montes, bosques o selvas, mientras que S2 define como area forestal unicamente

a las regiones de bosque nativo o implantado.

Por integracion geografica se refiere a dotar a la informacion con “conocimiento” para

que agentes externos de software puedan encontrar, integrar y compartir IG de distintas

fuentes de origen. Las propuestas de solucion para la gestion de heterogeneidad sintactica

se encaminan por el uso de modelos de representacion estandar junto con traducciones

Page 105: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Integracion de Informacion Geograficos 79

entre modelos. Por otra parte, los problemas de integracion estructural y semantica han

motivado importantes investigaciones en el area de Ciencias de la Informacion Geografica.

Las soluciones se vinculan con la definicion de ontologıas que enriquezcan cada solucion

SIG con la especificacion formal de sus conceptos. Tambien se requieren de servicios

semanticos con capacidad para integrar datos que provienen de diferentes fuentes de in-

formacion. La logica que fundamenta a las ontologıas provee la base para estos servicios.

El uso de sistemas especificados por ontologıas trae nuevos problemas de integracion:

¿como integrar sistemas de distintas ontologıas? La clasificacion provista por el Consorcio

de Web Semantica [MSv+05] identifica los siguientes tres subniveles de heterogeneidad

semantica ontologica:

1. El nivel sintactico, que se refiere al hecho que distintas ontologıas podrıan estar

expresadas en diferentes lenguajes (OWL o KIF).

2. El nivel terminologico, comprende las diferencias en la denominacion de los con-

ceptos. En este nivel se incluye a sinonimos, diferencias relacionadas con el idioma

(Espanol, Ingles, etc), polisemias o sobrecarga de un termino y derivados (sufijos o

prefijos).

3. El nivel conceptual, incluye las diferencias relacionadas con el contenido de la onto-

logıa. Existen dos tipos de diferencias conceptuales: diferencias metafısicas que se

refieren a “como esta dividido el mundo en piezas” y diferencias epistemicas, que

se refieren a “como se entienden las entidades”. En el cuadro 4.1 se clasifican y

ejemplifican las diferencias semanticas entre ontologıas.

La interoperabilidad semantica esta relacionada con la nocion de Web Semantica. Se

buscan formas de representacion de la informacion en la web que pueda ser interpretada

por personas y maquinas. Esto permitirıa hacer un uso mas inteligente de la informacion,

y compartir y reusar datos entre aplicaciones. En particular, en [Ege02] se define la ne-

cesidad de una Web Semantica Geoespacial, basada en un marco que abarque multiples

ontologıas espaciales tematicas, ası como una forma canonizada de especificar consultas

geoespaciales. Relacionado con el concepto de interoperabilidad geoespacial esta la nocion

de IDE. Un IDE se define como la infraestructura que provee el marco de trabajo para la

optimizacion de tareas relacionadas con la creacion, mantenimiento y distribucion de IG

Page 106: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

80 Capıtulo 4. Integracion de Informacion Geografica

Integracion de Informacion Geografica basada en Ontologıas

Heterogeneidad

semantica en

SIG: agen-

tes distintos

representan

fenomenos del

mundo de mane-

ra diferente.

Diferencias me-

tafısicas: como se

divide el mundo

en piezas (entida-

des, propiedades y

relaciones).

Cubrimiento:

ontologıas que

cubren diferen-

tes porciones del

mundo.

O1 considera estable-

cimientos educativos

de una ciudad y O2 de

otra.

Las diferencias

se vinculan

con conceptos

tematicos.

Granularidad:

ontologıas con

distinto grado

de detalle pa-

ra los mismos

conceptos.

O1 trata sobre infor-

macion censal y toma

valores por provincia

mientras que O2 con-

sidera por distrito.

Perspectiva:

ontologıas dife-

rentes para el

mismo mundo

real pero con

distintos puntos

de vista.

O1 y O2 modelan

la misma region, una

analiza la fauna desde

el punto de vista del

ecosistema y otra des-

de el punto de vista

antropologico.

Diferencias

epistemicas:

como se entienden

las entidades, esto

es, que aserciones

representan.

El conjunto de

conocimientos

condicionan las

formas de enten-

der e interpretar

el mundo.

O1 considera “vıas de

comunicacion” como

rutas y caminos y O2

interpreta a los me-

dios de comunicacion

e incluye “telecomuni-

caciones”.

Cuadro 4.1: Heterogeneidad semantica en ontologıas

Page 107: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Integracion de Informacion Geograficos 81

a diferentes niveles (regional, nacional o global) e involucra tanto a instituciones publi-

cas como privadas. Como una de las principales responsabilidades de los servicios IDE

esta recuperar metadatos y traducirlos a esquemas estandares.

Ejemplos de diferencias semanticas en IG

Como ya se observo, el hecho que los datos a procesar provengan de distintas comu-

nidades es causa de heterogeneidad sintactica, estructural y semantica [BEH+03]. Ocurre

que distintos conceptos refieren al mismo tipo de informacion en distintas fuentes de datos

o, por el contrario, diferentes orıgenes de datos usen el mismo termino para referirse a

distinta clase de informacion. A continuacion se plantean algunos ejemplos de diferencias

semanticas en integracion de IG.

Ejemplo 4.3.4 Consideremos un organismo nacional que mantiene informacion sobre

usos de la tierra en Argentina. Probablemente sus necesidades son diferentes de las de

una municipalidad que lleva la misma informacion, pero reducida a su propio municipio,

por ejemplo, Bahıa Blanca.

A nivel paıs, seguramente interesara mantener informacion que describa categorıas

de orden general: sector urbano, agricultura, industria, etc., mientras que a nivel local,

el municipio usara conceptos mas especıficos relacionados con su realidad, objetivos y

regulaciones locales. Por ejemplo, mientras que a nivel paıs puedan interesar las areas

urbanas, a nivel local, el municipio puede estar interesado en describir areas urbanas que

carecen del servicio de gas natural.

Seguramente, si existen soluciones implementadas por cada organismo, las mismas

estructuraron la IG de distinta manera. Las entidades o conceptos se eligen de acuerdo con

las necesidades especıficas del propietario de la informacion. Ası, aunque ambos proyectos

comparten la misma realidad, la representan de manera distinta. Este ejemplo muestra un

caso de heterogeneidad semantica metafısica, particularmente por utilizar conceptos con

diferente granularidad. El nivel de detalle de los conceptos definidos esta directamente

afectado por la escala y el tamano mınimo considerado para las unidades espaciales, que

determina el tipo de representacion y el modelo mental subyacente.

Ejemplo 4.3.5 Un experto en ecologıa y un experto en geomorfologıa observan una mis-

ma porcion del mundo real.

Page 108: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

82 Capıtulo 4. Integracion de Informacion Geografica

En este ejemplo, aunque en ambos casos se utilice la misma escala de informacion,

seguramente uno y otro se enfocaran en distintas categorıas. Mientras que el primero

puede distinguir secciones como “sector de conıferas”, el ultimo tal vez use categorıas

como “zona de inundacion”. Este es otro ejemplo de heterogeneidad semantica metafısica,

aunque la misma es producida por perspectivas o enfoques diferentes para analizar una

misma region.

Ejemplo 4.3.6 Distintos productores y obviamente consumidores de IG mantienen mo-

delos mentales diferentes para el mismo concepto “terreno edificable”.

La IG generada por distintos productores es localmente correcta, pero ha sido pro-

ducida para distintos propositos, con distintos esquemas mentales y, consecuentemente,

con distintos esquemas de representacion. En este caso se dice que los distintos conjuntos

de datos presentan heterogeneidad semantica epistemica. En este punto se resalta que

de ninguna manera debe pensarse que alguna de las ontologıas es incorrecta. El objetivo

es encontrar una solucion interoperativa a estos problemas, la que no se puede basar en

restringir las libertades de los productores de IG tal como la entiendan y requieran.

Aunque en el entorno de las geociencias esta consensuada la voluntad de comuni-

car y compartir, cada esquema de solucion define su propia ontologıa de aplicacion, que

conceptualiza de distinta manera segun las propias necesidades. Se requiere que las on-

tologıas de aplicacion se expresen de manera formal. Ası, definir una ontologıa de mayor

nivel que se obtenga a traves de un proceso de “merging” o mezcla y represente el co-

nocimiento completo especificando las relaciones semanticas entre distintas ontologıas de

aplicacion. El problema de heterogeneidad semantica tambien causa conflictos durante el

proceso de busqueda de fuentes de informacion [LRP03]. Por ejemplo, un servicio cuya

tarea se describe como clasificacion de zonas inundables en imagenes satelitales podrıa

no estar seleccionado con un buscador tradicional si se buscan las palabra claves servicios

de clasificacion para datos sensados remotamente.

4.4. Solucion a los problemas anteriores

De lo expuesto en las secciones anteriores se concluye que se necesitan resolver pro-

blemas tecnicos y semanticos en integracion para IG. Los estandares tecnologicos desa-

rrollados por OGC e ISO/TC 211 proveen las bases para la interoperabilidad sintactica

Page 109: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Solucion a los problemas anteriores 83

y catalogos de datos geograficos y servicios. La solucion a problemas semanticos, como

ocurre en otros entornos de informacion, requiere de un marco que formalice las relacio-

nes semanticas entre conceptos de distintas fuentes de datos. A continuacion se presentan

algunas soluciones parciales basadas en vocabularios y tesauros. En los capıtulos siguien-

tes se desarrollan en detalle las propuestas en estandarizacion (capıtulo 5) y soluciones

semanticas basadas en ontologıas (capıtulo 6).

4.4.1. Vocabularios y tesauros

Una solucion parcial al problema de integracion semantica es la definicion de un vo-

cabulario compartido por una comunidad. Un vocabulario esta formado por un conjunto

de terminos relacionados por su significado. Las relaciones basicas que se definen entre

terminos de un vocabulario incluyen termino mas amplio (o mas abarcativo), termino mas

especıfico y termino sinonimo. Existen algunos vocabularios normalizados para algunas

subareas de geociencias [Ter06]. Por ejemplo, el vocabulario usado en CORINE [BO00]

sobre cobertura y uso del territorio de Europa.

Cuando el vocabulario esta mas formalizado y acuerda una jerarquıa de conceptos se

denomina tesauro (ejemplo 4.4.1). Informalmente un tesauro es una “estructura jerarqui-

ca” y “controlada” de terminos. Los terminos comprenden a una o mas palabras que

se organizan a traves de un conjunto de relaciones recıprocas entre ellas. En el cuadro

4.2 se definen las relaciones estandar que se plantean entre terminos de un tesauro para

organizarlos como una jerarquıa.

Ejemplo 4.4.1 Ejemplo de un extracto de tesauro:

Relieve

• Elementos del relieve

◦ Cerros Testigo

◦ Colinas

◦ Collados

◦ Dunas

◦ Gargantas

◦ Litoral

Page 110: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

84 Capıtulo 4. Integracion de Informacion Geografica

� Bahıas

� Acantilados

� Dunas

Los nombres de estas relaciones (BT, NT, TT, RT, USE y UF) estan regulados por los

estandares ISO 2788:1986 [ISO07f] e ISO 5964:1985 [std85], normas internacionales para

la definicion de tesauros mono-lengua y multi-lengua respectivamente.

Ejemplos de vocabularios y tesauros en el ambito geografico

El vocabulario CORINE [BO00] sobre cobertura y uso del territorio de Europa dis-

tingue 44 tipos diferentes de cubiertas del territorio. Cada paıs, si lo desea, puede refinar

estas categorıas. CORINE Land Cover actua como una articulacion entre el conocimiento

local (micro) y la Union Europea (macro) sobre informacion ambiental y colabora con la

vision micro/macro para la definicion de polıticas sobre el medio ambiente.

El tesauro GEMET [EEA01] definido sobre el dominio Gestion Ambiental, incluye

ademas las relaciones “GROUP” y “THEME”, como opciones de indexacion de terminos

por grupo y tema. En la figura 4.3 se observa la visualizacion en el tesauro GEMET del

termino “zona inundable”. La relaciones subyacentes entre “zona inundable” con otros

elementos del GEMET se muestran en el cuadro 4.3.

Tambien estan relacionados con vocabularios en el dominio geografico los trabajos

sobre Land Cover Classification System (LCCS) [DGJ98], que definen tipos de cubiertas

del terreno. LCCS se utiliza en el marco de produccion de mapas sobre destino de la tierra

en varios paıses de Africa. Sin embargo, en el LCCS no es un vocabulario normalizado,

sino que provee de un meta-vocabulario para crear nuevos vocabularios, especificando

como cada clase del vocabulario se determina por distintitos clasificadores. Otra iniciativa

relacionada con tesauros para terminos geograficos en el contexto de los nomencladores de

la web es el tesauro GETTY de nombres geograficos [Ins00]. Estas opciones no incluyen

a todos los conceptos para mapas tematicos.

Un inconveniente en el dominio de IG es que aun no existe un vocabulario compartido

global, ya que el dominio en sı mismo es muy amplio. Las distintas iniciativas definen

jerarquıas normalizadas de terminos para algunos dominios mas especıficos.

Page 111: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Solucion a los problemas anteriores 85

Relaciones estandar

Relacion Sigla Descripcion Ejemplo

TerminoAbarcativo BT Representa la relacion

entre un termino mas ge-

neral y otro mas especıfi-

co

Calle “es BT de” Ave-

nida

TerminoEspecıfico NT Inversa de BT. Repre-

senta la relacion entre

un termino mas especıfi-

co hacia un termino mas

general

Avenida “es NT de”

Calle

TerminoRaız TT Indica si un BT es raız de

la jerarquıa

Via “es TT” en la je-

rarquıa de terminos de

un tesauro sobre vıas de

transporte

TerminosRelacionados RT Relacion recıproca que

representa un vınculo di-

ferente del jerarquico

Zona de Maderas

“RT” Reforestacion

Usado USE Representa la relacion

entre un termino no pre-

ferido y su preferido

Area (termino no

preferido) “USE” Zona

(termino preferido)

UsadoPor UF Inversa de USE. Solo los

terminos preferidos par-

ticipan de otras relacio-

nes.

Zona (termino pre-

ferido) “UF” Area

(termino no preferido),

Zona (termino prefe-

rido) “UF” Region

(termino no preferido).

Relacion optativa

Relacion Sigla Descripcion Ejemplo

Define DEF Representa la relacion

entre un termino y su de-

finicion en formato texto

Masa de agua acumula-

da en la depresion de un

terreno “DEF” Lago

Cuadro 4.2: Definicion de las Relaciones entre Terminos de un Tesauro

Page 112: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

86 Capıtulo 4. Integracion de Informacion Geografica

Figura 4.3: Definicion del Thesaurus GEMET para el concepto “Wetland”

4.4.2. Limitaciones de los tesauros

El usar unicamente vocabularios o tesauros como base para una aproximacion de

interoperabilidad semantica presenta distintos problemas. Ningun tesauro cubre todas las

subareas de IG, sino que generalmente se especializa en algun subtema particular. Otra

limitacion es que los tesauros, como por ejemplo GEMET, tienen como objetivo definir

conceptos tematicos, pero su estructura no esta orientada a organizar modelos de datos.

Esto implica que si, por ejemplo, buscamos el termino “Foresta”, no existe un termino

abarcativo que describa a la foresta como un tipo especıfico de “Area Vegetal”. Esta

informacion serıa necesaria para representar las relaciones semanticas entre valores de

distintos modelos de datos enfocados en problemas diferentes.

Un tercer problema es que los terminos que se encuentran en un vocabulario o tesauro

se definen teniendo presente un contexto particular y con el objeto de evitar ambiguedades,

que es el uso principal de un buen tesauro. De esta forma, para que un tesauro sea claro y

no ambiguo, debe restringirse a un contexto especıfico. Por ejemplo, en el caso de CORINE

se enfoca sobre una escala 1:10000 donde la unidad espacial menor considerada tiene una

extension de al menos 25 hectareas.

Page 113: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Solucion a los problemas anteriores 87

Zona Inundable

Relacion Instancias de la relacion

DEF Areas que son inundadas desde la superficie o aguas sub-

terraneas con la frecuencia suficiente para apoyar un

predominio de vida vegetativa o acuatica que tiene las

condiciones de saturado para el crecimiento o la repro-

duccion

UF zona encharcada

THEMA area natural, paisaje, ecosistema

GROUP tierra (Paisaje, Geografıa)

TT tierra

BT area terrestre

NT pantano, estanque, piscina, zona ribera

Cuadro 4.3: Relaciones entre termino Zona Inundable y otros elementos del tesauro

Un cuarto inconveniente esta en que los terminos del tesauro estan definidos por des-

cripciones textuales y no es posible derivar conclusiones logicas. Esta limitacion es par-

ticularmente significativa en el caso de temas modelados donde el mismo termino, como

por ejemplo “Terreno apto para construccion”, el cual tiene definiciones distintas segun

se consideren legislaciones locales o de planeamiento urbano.

Ası, una aproximacion basada unicamente en la definicion de un tesauro restringe las

posibilidades de descripcion de un concepto real vinculado con IG. Tambien es cierto que

dominios que estan en constante evolucion requieren de la evolucion de los tesauros. Esto

trae como consecuencia problemas de mantenimiento y de vinculacion de informacion

disenada bajo diferentes versiones de un mismo tesauro. Un resultado mas adecuado es

combinar el uso de vocabularios con el de ontologıas que conviertan terminos en clases

ontologicas, con definiciones de terminos mas amplios y mas especıficos en relaciones de

generalizacion-especializacion, sinonimos en relaciones de equivalencia y otras asociaciones

no restringidas entre clases. Ası los valores se relacionan con clases que estan claras, aunque

el vocabulario en sı mismo no se referencie en la fuente de datos. El uso de ontologıas

para la integracion de IG se va a desarrollar en el capıtulo 6 de esta tesis.

Page 114: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

88 Capıtulo 4. Integracion de Informacion Geografica

4.5. Resumen del capıtulo

El campo de aplicacion de la IG es muy amplio incluyendo turismo, comunicacion,

defensa nacional, transporte, agricultura, etc. La mayorıa de estas areas estan interesa-

das en compartir informacion y servicios en lınea a traves de la Web. Las calidades de

interoperabilidad e integracion de datos ganan importancia en el campo de los productos

tecnologicos de informacion. Las aplicaciones que trabajan con IG al momento de inter-

cambiar informacion enfrentan diferencias tanto a nivel de modelos del dominio como

tambien de modelos de representacion, especialmente para datos geograficos heredados

desde sistemas de geoprocesamiento desarrollados careciendo de estandarizacion.

En este capıtulo se organizaron los problemas de heterogeneidad en IG en dos grandes

tipos: heterogeneidad sintactica y heterogeneidad semantica. Desde la vista sintactica, si

bien existen diferentes formatos y modelos (vector o raster) y hasta distintos sistemas

de coordenadas, desde la decada del ’90 se viene trabajando para definir normativas

en el Comite Tecnico Internacional ISO/TC 211 y la industria representada por Open

Geospatial Consortium (OGC). En el capıtulo 5 de esta tesis se presentan y analizan los

principales resultados en estandarizacion alcanzados hasta el momento.

En la vista de heterogeneidad estructural y heterogeneidad semantica se considera

como se representan los modelos mentales para el de caso desarrollos SIG usando organi-

zaciones tematicas distintas. Distintas soluciones categorizan el mundo real de diferentes

maneras. Una aproximacion es la definicion de tesauros compartidos; sin embargo, estos

no resuelven todas las relaciones entre valores tematicos de distintas fuentes de datos y

contextos, ya que el tesauro en si mismo tiene una tendencia segun su propio contexto.

El problema de integracion semantica de IG ha motivado importantes investigaciones en

el area de Ciencias de la Informacion Geografica. Las soluciones generalmente se vinculan

con la definicion de ontologıas que provean la especificacion formal de los modelos de

representacion de cada SIG. En el capıtulo 6 de esta tesis se abordara el uso de ontologıas

aplicado al ambito de IG.

Page 115: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Capıtulo 5

Estandares Internacionales para

Sistemas de Informacion Geografica

A lo largo de las decadas distintas organizaciones han recolectado y gestionado IG si-

guiendo modelos y polıticas individuales. Hoy en dıa hay una fuerte exigencia por integrar

distintos servicios web a los entornos operacionales. El ultimo impulso surge con la indus-

tria de servicios basados en ubicacion (LBS). Como se vio en el Capıtulo 2 existen varias

aproximaciones para modelar el espacio geografico y los fenomenos que lo componen. Las

distintas implementaciones SIG han ido adoptando diferentes modelos de representacion,

lo que hace difıcil la integracion tanto de datos como de servicios. Con este marco en

los ‘90 nacen dos organizaciones que se ocupan de la estandarizacion de IG: ISO/TC

211 [ISO94] y el OpenGIS Consortium (OGC) [OGC94] (mas adelante denominado Open

Geoespatial Consortium).

OGC e ISO/TC 211 conforman una propuesta de trabajo coordinado que alienta el

desarrollo cooperativo y que apunta a minimizar la superposicion de tareas. OGC envıa

sus especificaciones a la ISO para que terminen siendo aprobadas vıa ISO/TC 211. El

consorcio industrial OGC tiene su propio programa de conformidad y testing para las es-

pecificaciones que desarrolla y un programa de interoperabilidad para el desarrollo rapido

de prototipos de sus especificaciones. En general, OGC es responsable de las especifi-

caciones de interfaces, mientras que ISO/TC 211 desarrolla estandares para modelos de

datos geograficos, transferencias y servicios. Algunos resultados de este proceso incluyen:

la especificacion de la Interface OGC Web Map Service [wms04, ISO05e] que ha sido

implementada por mas de 100 proveedores SIG, bajo la conformidad cooperativa OGC e

Page 116: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

90 Capıtulo 5. Estandares Internacionales para Sistemas de Informacion Geografica

ISO 19128. Otra especificacion OGC incluida en ISO/TC 211 es el Lenguaje de Marcas

Geografico (GML)1. En lo que sigue de este capıtulo se recopilan y analizan estos y otros

resultados del proceso de estandarizacion.

5.1. Conceptos generales

Originalmente, el contar con IG en diferentes formatos propietarios restringio la po-

sibilidad de compartir informacion entre aplicaciones SIG que no compartieran la misma

plataforma de base. La gran diversidad y esfuerzos duplicados junto con la necesidad de

propiciar interoperabilidad e integracion entre sistemas motiva a diversas organizaciones

a trabajar en normativas estandares para informacion y servicios geograficos digitales. A

continuacion se definen los conceptos norma, estandar, recomendacion y especificacion,

utilizados en el ambito del vocabulario tecnico de normalizacion:

Norma es todo documento que armoniza aspectos tecnicos de un producto, servicio

o componente, definido como tal por algun organismo oficial de normalizacion, como son

ISO, CEN o AENOR. Tambien se llaman normas de jure o normas de derecho.

Estandar es un documento o practica que, sin ser norma, esta consagrado y aceptado

por el uso. Tambien se conocen como normas de facto o normas de hecho. En el ambito

de SIG las especificaciones de Open Geospatial Consortium y los formatos DGN serıan

estandares. Un estandar es el estadio anterior a una norma regulada.

Recomendacion es una directriz que promueve un organismo que busca definir

practicas y usos para una comunidad determinada. El exito depende de la influencia

que es capaz de ejercer el organismo que la propone. Por ejemplo: EUROSTAT produce

recomendaciones para armonizar las practicas estadısticas en Europa; el Consejo Superior

Geografico define recomendaciones acerca de la cartografıa en Espana, entre otros. La

diferencia con estandar esta en que este ultimo esta “aceptado por el uso” mientras que

una recomendacion busca promover el uso.

Especificacion, es una descripcion tecnica, detallada y exhaustiva de un producto o

servicio, con la informacion necesaria para su produccion.

En las siguientes secciones se recopilan los principales resultados alcanzados en el pro-

ceso de regulacion en representacion y servicios geograficos por los organismos internacio-

1En Ingles Geography Markup Language (GML).

Page 117: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Organismos internacionales de estandarizacion 91

nales ISO/TC 211 y el consocio OGC. Ambas agrupaciones trabajan colaborativamente,

la primera con facultad de definir normas y la segunda a traves del consenso de la indus-

tria, agencias gubernamentales y universidades, definiendo especificaciones y estandares

aprobados por el uso.

5.2. Organismos internacionales de estandarizacion

El desarrollo y uso de aplicaciones SIG data de los ‘70. En sus orıgenes, cada SIG

diseno sus modelos de datos, formatos de almacenamiento y operaciones de analisis, bus-

cando satisfacer sus requerimientos particulares. Los primeros esfuerzos para resolver las

dificultades de interoperabilidad entre sistemas los realizo un grupo heterogeneo inte-

grado por representantes del gobierno, de las ciencias de investigacion, y socios de la

industria que fundaron en 1994 el OpenGIS Consortium con el objetivo de definir y di-

vulgar estandares para representar y manipular IG y favorecer la interoperabilidad entre

herramientas SIG. OGC crea dos tipos de productos: especificaciones abstractas y especi-

ficaciones sobre implementacion. El proposito de las especificaciones abstractas es crear

y documentar el modelo conceptual que sirva de base a las especificaciones de implemen-

tacion. Las especificaciones de implementacion [OGC06, OGC07] definen e implementan

interfaces estandares.

Contemporaneamente, ISO a traves del Comite Tecnico ISO 211 (ISO/TC 211) tam-

bien comienza a ocuparse del desarrollo de normas y estandares de caracter internacional

aplicables al entorno IG. El proposito de ambas organizaciones es crear especificaciones

para que las tecnologıas SIG resulten interoperables. Las especificaciones son desarro-

lladas, para luego ser finalmente adoptadas siguiendo un proceso de consenso entre los

miembros. El objetivo es amplio, por lo que ambas organizaciones han distribuido el tra-

bajo de especificacion en unidades mas pequenas abordadas en paralelo. Estas unidades

reciben el nombre de topicos abstractos2 por OGC [OGC05, Pau05, OGC99, Cli09] y de

estandar internacional por ISO [ISO03c, ISO05c, ISO05e]. Actualmente, ambas organi-

zaciones trabajan colaborativamente.

2En Ingles abstract specification topics.

Page 118: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

92 Capıtulo 5. Estandares Internacionales para Sistemas de Informacion Geografica

5.2.1. Open Geospatial Consortium (OGC)

El proyecto OpenGIS precedio al lanzamiento formal del actual Open Geospatial Con-

sortium (OGC) en septiembre de 1994. OGC es un consorcio internacional que comprende

a mas de 360 companıas, agencias gubernamentales y universidades, participando de un

proceso consensuado para el desarrollo de especificaciones de interfaces de codigo abierto

aplicables a sistemas de geoprocesamiento. Los resultados de OGC se denominan Especi-

ficaciones OpenGIS y proveen soluciones interoperativas para hacer “geo-disponible” la

informacion de la Web y los servicios wireless de ubicacion. La mision del OGC [OGC05]

es conducir hacia desarrollos que promuevan el uso de arquitecturas que permitan la

integracion de aplicaciones con servicios y datos geoespaciales.

OGC desarrolla, distribuye y promueve el uso de estandares abiertos para procesa-

miento espacial desde sus programas “Especificacion”, “Interoperabilidad”, “Evaluacion”

y “Difusion y Adopcion”. El Programa de Especificacion trabaja en el proceso de consenso

formal para llegar a especificaciones OpenGIS aprobadas o adoptadas. El Programa de

Interoperabilidad promueve iniciativas de ingenierıa practica para acelerar los desarrollos

y aceptacion de las especificaciones OpenGIS. El Consejo de Evaluacion crea y mantiene

documentacion de los puntos de referencia basicos, procedimentales y tecnicos. La Junta

de Evaluacion examina los documentos antes de ser publicados. El Programa de Difusion

y Adopcion distribuye y publicita especificaciones e interfaces espaciales de codigo abierto

para su uso globalizado. El objetivo es lograr tecnologıas de geoprocesamiento interopera-

tivas, segun el esquema “plug and play”. De hecho, se asocia la marca registrada OpenGIS

a aquellos productos que cumplen con sus especificaciones.

Los miembros de OGC ademas participan en ISO/TC 211 a traves del Consejo Con-

sultivo Conjunto ISO/TC211-OGC. La mision es coordinar los esfuerzos de ambos orga-

nismos y asegurar una unica norma de referencia. A pesar de tener orıgenes distintos,

OGC reemplazo topicos relacionados con la representacion de datos por los estandares

definidos por ISO/TC 211.

Especificaciones OpenGIS

Las Especificacion OpenGIS son documentos tecnicos que definen las interfaces para

productos y servicios geoespaciales. Las especificaciones OpenGIS son el “producto” o

resultado generado por OGC y se desarrollan respetando el desafıo de interoperabilidad. Se

Page 119: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Organismos internacionales de estandarizacion 93

asegura que las aplicaciones desarrolladas bajo estas especificaciones garanticen sistemas

o componentes interoperables.

Las especificaciones OpenGIS se clasifican segun su proposito en dos grupos: los mo-

delos abstractos y las especificaciones de implementacion. Las primeras son conceptuales

mientras que las especificaciones de implementacion son tecnicas y proveen detalles de

implementacion. El Comite Tecnico desarrollo un modelo de arquitectura denominada

Especificacion Abstracta OpenGIS [OGC05] segun su vision de la tecnologıa geoespacial

y las necesidades de interoperabilidad. Los componentes de este modelo proveen el marco

conceptual para los distintos desarrollos. Los protocolos e interfaces de codigo abierto

se construyen respetando este modelo abstracto para garantizar interoperabilidad entre

distintas marcas y tipos de sistemas de procesamiento espacial. El cuadro 5.1 muestra

los dominios de modelos abstractos ordenados por topicos tal como los define OGC. Las

especificaciones OpenGIS son especificaciones tecnicas que detallan las interfaces de los

componentes. Una especificacion de interface se considera implementada, cuando habien-

do sido desarrollada independientemente por al menos dos ingenieros de software, las

componentes resultantes pueden interoperar.

Otros documentos incluyen el Modelo de Referencia OpenGIS (ORM) [OGC08] que

da el marco a las tareas continuas del OGC, el documento Practicas Recomendadas con

las posiciones oficiales de los miembros OGC entre otros. Todos los productos OGC son

de dominio publico, resultan del trabajo colaborativo y consensuado de sus miembros, y

estan disponibles en el sitio oficial OGC3.

5.2.2. Organizacion Internacional para la Estandarizacion

ISO/TC 211

Paralelamente en 1994 la Organizacion Internacional de Estandares (ISO) crea el co-

mite Tecnico para normalizacion en Geomatica e Informacion Geografica ISO/TC 211.

Al comite se le asigno la responsabilidad de definir normativas de referencia para IG di-

gital y transferencia de datos y servicios, requeridos especialmente por la industria IDE o

SIG distribuidos. Ası surge la familia ISO 19100, un conjunto de normas relacionadas con

fenomenos geograficos. Estas normativas tratan sobre los metodos, herramientas y servi-

cios para la gestion de datos, adquisicion, procesamiento, analisis, acceso, presentacion y

3 http://www.opengeospatial.org/

Page 120: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

94 Capıtulo 5. Estandares Internacionales para Sistemas de Informacion Geografica

Topico 0 Revision.

Topico 1 Geometrıa de Fenomenos.

Topico 2 Referencia Espacial por Coordenadas.

Topico 3 Estructuras Geometricas de Ubicacion.

Topico 4 Funciones Almacenadas e Interpolacion.

Topico 5 Fenomenos.

Topico 6 El Tipo Cobertura.

Topico 7 Imagenes de la Tierra.

Topico 8 Relaciones entre Fenomenos.

Topico 10 Colecciones de Fenomenos.

Topico 11 Metadatos.

Topico 12 La Arquitectura de Servicios OpenGIS.

Topico 13 Catalogo de Servicios.

Topico 14 Semanticas y Comunidades de Informacion.

Topico 15 Servicios de Explotacion de Imagenes.

Topico 16 Servicios de Transformacion de Coordenadas

de Imagenes.

Topico 17 Servicios de Ubicacion de Base de Moviles.

Topico 18 Geospatial Digital Rights Management Refe-

rence Model (GeoDRM RM).

Topico Domain 1 Dominio de Telecomunicaciones.

Cuadro 5.1: Modelos Abstractos OGC

transferencia de IG en formato digital entre diferentes usuarios, sistemas y localizaciones.

ISO/TC 211 comenzo con un programa de trabajo que comprendio el desarrollo paralelo

de varios estandares relacionados con IG para avanzar rapidamente en interoperabilidad.

La familia ISO 19100 se baso en el paradigma orientado a objetos y mantiene relacion

con otras normas y estandares internacionales como Lenguaje Unificado de Modelado

UML, ISO 9000 sobre gestion de la calidad, ISO 8601 de formatos de fechas y horas,

entre otras. Comprende alrededor de cincuenta normas organizadas segun la siguiente

clasificacion [Pas08]:

Normas de proposito general: ISO 19101: Modelo de Referencia [ISO02c], ISO

Page 121: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Estandares para informacion geografica 95

19103: Lenguaje de Modelado Conceptual, ISO 19104: Terminologıa, ISO 19105:

Conformidad y Pruebas, ISO 19106: Perfiles, ISO 19107: Modelo Espacial [ISO03c],

ISO 19108: Modelo Temporal [ISO02d], ISO 19111: Referencia Espacial por Coor-

denadas [ISO07e], ISO 19112: Referencia Espacial por Identificadores Geograficos

[ISO03b], ISO 19115: Metadatos [ISO], ISO 19115-2: Metadatos para Imagenes y

Mallas, ISO 19139: Metadatos. Esquema de Implementacion XML [ISO07d], ISO

19137: Perfiles mas usados del Modelo Espacial [ISO02a].

Normas sobre calidad: ISO 19113: Principios de Calidad [ISO02b], ISO 19114:

Procedimientos para Evaluacion de Calidad [ISO03a], ISO 19138: Medidas de Cali-

dad [ISO06], ISO 2859 e ISO 3951: Procedimientos de Muestreo para la inspeccion

de atributos y variables, ISO 9000: Gestion de Calidad.

Normas de servicios geograficos: ISO 19119: Servicios, ISO 19128: Interface de

Servidor Web de Mapas [ISO05e], ISO 19133: Servicios de Rastreo y Navegacion Ba-

sados en Localizacion [ISO05a], ISO 19134: Servicios de Enrutamiento y Navegacion

Basados en Localizacion de Modo Multiple [ISO07c].

Normas sobre aplicaciones, formato y representacion: ISO 19109: Reglas

para Esquemas de Aplicacion [ISO05c], ISO 19110: Metodologıa para la Creacion de

Catalogos de Elementos [ISO05d], ISO 19117: Representacion [ISO05b], ISO 19131:

Especificacion de Productos de Datos [ISO07a], ISO 19136: Geographic Markup

Lenguaje (GML)[ISO07b].

Normas relacionadas con representaciones raster y malla: ISO 19101-2, ISO

19121, ISO 19123, ISO 19124, ISO 19129, ISO 19130.

En la proxima seccion se analizan en detalle los estandares y especificaciones princi-

pales que tienen relacion con el diseno del modelo de datos de una aplicacion SIG.

5.3. Estandares para informacion geografica

En cualquier sistema o aplicacion que incluya “gestion de datos” generalmente se

construyen dos modelos de datos: el modelo conceptual y el modelo logico. El modelo con-

ceptual sirve a los efectos de clasificar, identificar y representar fenomenos del mundo real

Page 122: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

96 Capıtulo 5. Estandares Internacionales para Sistemas de Informacion Geografica

que se esta modelando. Se utiliza como herramienta de comunicacion entre el equipo de

desarrollo y los clientes o usuarios del sistema. El modelo conceptual utiliza abstracciones

de alto nivel que no son directamente representables en la maquina, por ejemplo, con IG

el modelo conceptual se abstrae de como representar conjuntos infinitos de puntos. El mo-

delo logico o modelo discreto se ocupa de la representacion adecuada en la computadora.

La figura 5.1 muestra la relacion entre los elementos del mundo real y sus abstracciones

en un sistema de informacion.

La construccion del modelo de datos de un problema sigue un proceso iterativo que

pasa por los estadios: identificar los fenomenos del mundo a modelar, construir el es-

quema conceptual, y traducirlo al esquema logico. El esquema conceptual de aplicacion

surge de un modelo conceptual representado usando las abstracciones de algun lenguaje

de representacion conceptual. En la seccion 2.2 del capıtulo 2 de esta tesis se presentaron

las abstracciones requeridas para la construccion de esquemas conceptuales en problemas

que incluyan IG y ejemplos de lenguajes de modelado existentes. Una vez que el esquema

conceptual se discute con los usuarios y se refina hasta llegar al diseno conceptual adecua-

do para el problema, el mismo se traduce a un esquema logico o discreto. La traduccion

consiste en encontrar para cada elemento del esquema conceptual su correspondiente abs-

traccion en el modelo discreto segun las componentes de un lenguaje de modelado logico.

Sobre abstracciones y lenguajes de nivel logico para representacion de IG se discutio en

la seccion 2.3 del mismo capıtulo.

En esta seccion se presentan los resultados mas relevantes para esta tesis relacionados

con estandares para la representacion de IG a nivel de modelos conceptuales y de modelos

logicos.

5.3.1. ISO/TC211 19101 Modelo de Referencia

El estandar internacional ISO 19101: Modelo de Referencia [ISO02c] provee el marco

que contiene el alcance de la serie de estandares ISO 19XXX sobre modelos geoespaciales.

En este estandar se introduce el ”Modelo de Referencia de Dominio”, que provee la arqui-

tectura de informacion para IDE’s. En ISO 19101 estan las bases para la estandarizacion

que luego son abordadas por otra serie de estandares. El nucleo del modelo esta en la ba-

se de informacion con datos geoespaciales o “dataset”. Un dataset contiene las instancias

de “Fenomenos Geograficos” que son descriptos por sus “metadatos”. Estos metadatos

Page 123: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Estandares para informacion geografica 97

Figura 5.1: El proceso de modelado

especifican la estructura logica y semantica a traves de su “esquema de aplicacion”. Los

esquemas de aplicacion especifican tipos de fenomenos con sus restricciones, relaciones y

metadados. Un esquema de aplicacion puede definir los “tipos de fenomenos” propios o

referir a “Catalogos de Fenomenos” externos.

Fenomeno Geografico

El termino fenomeno se utiliza para nombrar una abstraccion del mundo real, por

ejemplo, un rıo, una parcela, el mapa de un continente, etc. Los fenomenos se integran en el

“Modelo de Fenomeno General” (GFM)4. La Figura 5.2(a) muestra las etapas del proceso

de modelado adaptadas a la construccion de modelos de datos para sistemas geograficos.

La Figura 5.2(b) muestra como se realiza el proceso de transformacion desde los objetos

del mundo real al conjunto de datos geograficos que los modela usando GFM. ISO 19109

4En Ingles General Feature Model(GFM).

Page 124: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

98 Capıtulo 5. Estandares Internacionales para Sistemas de Informacion Geografica

Figura 5.2: Proceso de Transformacion: de la realidad a los datos

provee un modelo abstracto o metamodelo, el cual clasifica una vista del mundo real en

el GFM, un metamodelo para la representacion de IG.

El GFM define un fenomeno abstracto con atributos y operaciones. Los atributos man-

tienen la informacion estatica de un fenomeno como pueden ser: la calidad del fenomeno o

sus propiedades geometricas. Las operaciones contienen informacion sobre los cambios del

fenomeno a causa de influencias externas como puede ser el mostrar una carretera para

unos intervalos de escalas determinados. Existen otros conceptos adicionales que tambien

puede tener asociado un fenomeno: asociaciones con otros fenomenos, relaciones de gene-

ralizacion y especializacion, y restricciones. El siguiente ejemplo explica la interpretacion

de las figuras 5.2(a) y (b) en un problema concreto:

Ejemplo 5.3.1 Asumamos que el universo de discurso o problema de interes es “Rıos

de Argentina”. Desde el punto de vista del proceso de modelado se identifica el tipo de

fenomeno FT rıo. Como instancias de FT rıo figuraran Parana, Grande, Bermejo,

Negro, entre otros. Desde el punto de vista del modelo de datos, para los fenomenos de

Page 125: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Estandares para informacion geografica 99

FT rıo se identifican los atributos nombre, bajo el dominio cadena de caracteres; lon-

gitud en km y caudal ambos definidos en el dominio de los Reales y el atributo espacial

curso para el que se selecciono la representacion geometrica curva. Esta informacion del

Modelo de Tipos de Fenomenos forma parte del Catalogo de Fenomenos. El

siguiente paso traduce el modelo conceptual a un Esquema de Aplicacion siguiendo

un modelo espacial, por ejemplo, al modelo vector. Los distintos rıos con sus valores de

atributos conforman los Datos del sistema.

5.3.2. ISO/TC211 19109 Modelo conceptual estandar para Es-

quemas de Aplicacion

El estandar internacional ISO 19109: Reglas para Esquemas de Aplicacion

[ISO05c] fija las reglas para crear y documentar Esquemas Conceptuales de Aplicacion,

incluyendo los principios para la definicion de fenomenos geograficos. Con la definicion del

GFM se proporciona la descripcion formal para el esquema de datos, esto es, la descripcion

general de los elementos tipo de fenomeno y sus atributos. Las definiciones de ISO 19109

han sido adoptadas como Modelo Conceptual de Aplicacion estandar por OGC.

GML, especificado por ISO 19109, define un metamodelo para tipos de objetos espacia-

les, sus tipos de propiedades (atributos, asociaciones, roles y operaciones) y las restriccio-

nes. Tambien sirve como metamodelo para el catalogo de fenomenos, dando la estructura

para representar la semantica de la IG.

La Figura 5.3 muestra una vista parcial de GFM, expresada utilizando notacion UML.

Se observa que GF FenomenoGeografico o fenomeno, es la unidad para IG. Esta definida

como una “metaclase” que se instancia con las clases que representan fenomenos geografi-

cos individuales. Las instancias de una clase que representa un fenomeno geografico indi-

vidual se las denomina instancias de fenomeno.

Ejemplo 5.3.2 Continuando con el ejemplo 5.3.1, supongamos la siguiente simplificacion

para del Esquema Conceptual de Aplicacion que se muestra en la figura 5.4. En el modelo

se puede observar que se identificaron a los tipos de fenomenos rio y tramo, bajo la

asociacion de composicion por la que una instancia de rio resulta de la composicion

de varias instancias de tramo. En el modelo ademas se puede observar que el tipo de

fenomeno rio esta descripto por los atributos nombre, longitud, caudal y curso (atributo

Page 126: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

100 Capıtulo 5. Estandares Internacionales para Sistemas de Informacion Geografica

Figura 5.3: Fragmento del Modelo de Fenomeno General

espacial) y el tipo de fenomeno tramo cuenta con el atributo descriptivo numero y los

atributos espaciales punto de inicio, punto de finalizacion y segmento. El modelo de objetos

UML que resulta de instanciar el Esquema Conceptual de Aplicacion de la figura 5.4 al

estandar GFM (figura 5.3) se muestra en la figura 5.5. El patron de colores es al unico

efecto de visualizar las instancias que corresponden a clases de GFM distintas.

A continuacion se describe en detalle los componentes de GFM de la figura 5.3.

TipoPropiedad (GF TipoPropiedad): es la metaclase para cualquier tipo de propie-

dad de un fenomeno geografico. Son tipos de propiedad: atributos, comportamiento,

y/o roles de asociacion. Cada tipo de propiedad posee el nombre, la definicion (atri-

buto, comportamiento o rol) y una asociacion con un fenomeno geografico para

indicar con cual de ellas esta ligada. Como tipo de propiedad se consideran:

Page 127: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Estandares para informacion geografica 101

Figura 5.4: Fragmento del Esquema Conceptual de Aplicacion “Rıos de Argentina”

• TipoAtributo (GF TipoAtributo): es la metaclase para la definicion de tipos

de atributos. Posee los descriptores tipo de dato, nombre, dominio de valores

y cardinalidad. Los tipos de atributos estan organizados en tipos de atributos

espaciales, que asumen valores del dominio espacial geometrico o topologico,

tipos de atributos temporales, cuyos valores pertenecen al dominio temporal,

tipo de atributos de ubicacion, cuyos valores son identificadores a un ındice

geografico, atributos de tipo metadada y atributos tematicos o descriptivos

(Figura 5.6). La jerarquıa de atributos espaciales referencia a la norma ISO

19107. En este estandar tambien se define una jerarquıa de tipos de asociaciones

posibles, las que incluyen agregaciones, asociaciones espaciales o asociaciones

temporales (Figura 5.7).

En la figura 5.5-GFM para el modelado “Rıos de Argentina”, sobre el fenomeno

rio se definen las instancias de GF TipoAtributo descriptivos nombre, lon-

gitud y caudal y un GF TipoAtributo espacial curso, en este caso de tipo

GM CompositeCurve. Por simplicidad en la figura 5.5 no se incluyo su instan-

ciacion con la jerarquıa de tipos espaciales. Para el fenomeno tramo se define

un unico GF TipoAtributo descriptivo numero y GF TipoAtributo espaciales ini-

cio y fin de tipo GM point y segmento de tipo GM curva.

• Roles de asociaciones (GF RolDeAsociacion): es la metaclase para la definicion

Page 128: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

102 Capıtulo 5. Estandares Internacionales para Sistemas de Informacion Geografica

Figura 5.5: Modelo de Objetos de GFM para el modelado de “Rıos de Argentina”

de clases de roles. Indica el rol que juega un fenomeno geografico en terminos

de la asociacion y especifica el contexto para estos tipos y sus instancias. Posee

el nombre del rol y la cardinalidad denotando el numero de instancias que un

fenomeno geografico puede tener con respecto a ese rol.

El modelo GFM de referencia (figura 5.5) incluye para el fenomeno rio por

la propiedad GF RolDeAsociacion el rol compuesto y el fenomeno tramo tiene

asignado en GF RolDeAsociacion el rol componente

• Operaciones (GF Operacion): es la metaclase para describir el comportamiento

de los fenomenos geograficos en terminos de sus operaciones. Las instancias de

esta clase pueden ser de tres tipos diferentes: de observacion, de cambio o

de construccion. Las operaciones de observacion retornan los valores actuales

de los atributos, las de cambio poseen acciones que cambian el valor de esos

Page 129: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Estandares para informacion geografica 103

atributos y los constructores crean nuevas instancias.

En la figura 5.5-GFM para el modelado de Rıos de Argentina, se observan las

instancias de GF Operacion misTramos y darNombre asociadas con el fenomeno

rio y darTramo asociada a tramo. En este punto queremos aclarar que las

operaciones que se incluyeron en el modelo son a tıtulo ilustrativo del ejemplo

y no representan el conjunto completo de operaciones requeridas. Por ejemplo,

no se incluyo ninguna operacion de construccion.

Tipos de asociaciones (GF TipoAsociacion): es la metaclase para describir asocia-

ciones entre fenomenos geograficos. Puede contener atributos ya que esta clase es

una especializacion de la clase GF TipoPropiedad. A su vez, posee una asociacion

con esta misma clase llamada “vinculadaCon” para denotar los fenomenos geografi-

cos que se relacionan. Tambien incluye una asociacion de agregacion llamada “Rol”

entre esta clase y la clase GF RolDeAsociacion. La misma indica los roles que posee

la asociacion (al menos uno).

En el ejemplo de la figura 5.5 existe una unica instancia de GF TipoAsociacion com-

puesto con la asociacion de composicion que existe entre rio y tramo.

Relaciones de herencia (GF RelacionHerencia): es la clase que representa una re-

lacion generica entre un fenomeno geografico mas general (supertipo) y uno o

mas fenomenos geograficos mas especıficos (subtipos). Cualquier miembro de un

fenomeno geografico especializado es miembro tambien de uno mas general. Como

atributos posee nombre, descripcion e instancias, un valor booleano que indica si

una instancia del supertipo puede o no ser una instancia de mas de un subtipo. Los

roles “generalizacion” y “especializacion” denotan justamente las instancias mas es-

pecıficas y mas generales entre uno o mas fenomenos geograficos.

En este caso el ejemplo de la figura 5.5 no plantea instancias de GF RelacionHerencia.

Se podrıa incluir una instancia de GF RelacionHerencia con una superclase

GF FenomenoGeografico FuentesDeAgua, de la cual especialice Rio.

Restricciones (GF Restriccion): es la clase para representar restricciones tanto de los

fenomenos geograficos como de las propiedades. Posee una descripcion en lenguaje

natural indicando el significado de la misma y una asociacion con rol “restringido-

Por” GF TipoPropiedad o GF TipoCaracteristica.

En el ejemplo de la figura 5.5 se incluyo una instancia de GF Restriccion inicioDis-

Page 130: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

104 Capıtulo 5. Estandares Internacionales para Sistemas de Informacion Geografica

tintoFin vinculado con el fenomeno tramo para indicar que los puntos de inicio y

fin de tramo deben ser distintos.

Entre las ventajas que ofrece utilizar el modelo GFM se pueden decir que modela

cierta informacion semantica ademas de la representacion, las instancias de fenomeno

llevan asociadas el tipo de fenomeno y es posible asociar mas de una geometrıa a un

tipo de fenomeno. La ISO 19109 se complementa con la norma ISO 19110 [ISO05d]. Un

esquema de aplicacion se crea para proceder a la definicion de los fenomenos. Todos los

detalles de cada uno de estos fenomenos, una vez definidos, se muestran mediante un

catalogo de fenomenos. La norma Internacional ISO 19110 describe la metodologıa para

construir estos catalogos.

5.3.3. ISO/TC211 19107 Modelo conceptual estandar para

Fenomenos Geograficos

La norma ISO 19107: El Modelo Espacial proporciona los elementos conceptuales para

describir y manipular las caracterısticas espaciales asociadas a fenomenos geograficos.

Dichas caracterısticas estan representadas por uno o mas atributos espaciales, los que

pueden ser cuantitativos o cualitativos y cuyo valor se vincula con un objeto geometrico

(GM Object) o un objeto topologico (TP Object).

La geometrıa proporciona la descripcion geografica cuantitativa de las caracterısticas

espaciales, por medio de coordenadas y funciones matematicas. En ella se incluyen

dimensiones, posicion, tamano, forma y orientacion. Las funciones matematicas que

se usan para describir la geometrıa de un objeto dependen del tipo de sistema de

coordenadas de referencia usado para definir la posicion espacial. La geometrıa es

el unico aspecto de la IG que cambia cuando la informacion se transforma de un

sistema geodesico de referencia o de coordenadas a otro. Por ejemplo, “la parcela

numero 80150 tiene la esquina inferior izquierda en las coordenadas UTM (450228;

4499053), es rectangular y la orientacion del lado mayor es noroeste, su superficie

es de 5 ha y sus lados miden 500 m x 100 m”. Ante una deformacion del espacio,

estas caracterısticas cambian.

Page 131: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Estandares para informacion geografica 105

Figura 5.6: Jerarquıa de Tipo de Atributo

Page 132: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

106 Capıtulo 5. Estandares Internacionales para Sistemas de Informacion Geografica

Figura 5.7: Jerarquıa de Tipo de Asociacion

La topologıa proporciona una descripcion geografica cualitativa, y se encarga de las

caracterısticas de las figuras geometricas que permanecen invariantes frente a defor-

maciones elasticas y continuas del espacio, como por ejemplo las transformaciones

de un sistema de coordenadas a otro. Dentro del contexto de la IG, la topologıa se

suele usar para describir la conectividad, propiedad que es invariante bajo cualquier

transformacion continua y que se deriva de la propia geometrıa. Por ejemplo, “la

parcela numero 80150 contiene un pozo, se encuentra incluida dentro del polıgono

catastral 80 y es adyacente a las parcelas 80151, 80152 y 80149”. Aun ante una defor-

macion elastica y continua del espacio, estas caracterısticas espaciales permanecen

invariantes.

Las definiciones de la norma ISO 19107 estan organizadas siguiendo la distribucion en

paquetes de UML. Se distinguen paquetes geometricos y topologicos. Las clases del modelo

geometrico se desprenden de la raız GM Object y heredan una asociacion opcional a un

sistema de referencia de coordenadas. La figura 5.8 muestra las dependencias entre los

paquetes geometricos y el listado de clases de cada uno. El nombre de las clases geometricas

comienza con el prefijoGM.

Un objeto geometrico pertenece a uno de los siguientes tipos:

Primitiva (GM Primitive): representa a los elementos graficos basicos que compo-

nen al conjunto de datos geograficos. Las primitivas geometricas, segun su dimension

son:

• Punto (GM Point): primitiva geometrica cero dimensional que representa una

posicion.

Page 133: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Estandares para informacion geografica 107

Figura 5.8: ISO 19107 - Paquetes y sus clases geometricas

• Curva (GM Curve): primitiva geometrica unidimensional formada por una

secuencia de posiciones; se compone de uno o mas segmentos curvos

(GM CurveSegment). Diferentes metodos de interpolacion entre los puntos de

control permiten generar distintos tipos de segmentos curvos: clotoides, conicas,

geodesicas, arcos, etc.

• Superficie (GM Surface): primitiva geometrica bidimensional que se define co-

mo superficies poligonales conectadas entre sı por las curvas fronteras de ma-

nera que se genere una superficie continua sin agujeros (superficie poliedrica),

Page 134: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

108 Capıtulo 5. Estandares Internacionales para Sistemas de Informacion Geografica

o como una malla rectangular de puntos (GM GriddedSurface) en el espacio

unidos por filas y columnas utilizando funciones matematicas (superficie pa-

rametrica).

• Solido (GM Solid): primitiva tridimensional.

Las primitivas existen por sı mismas y son abiertas, esto es, no contienen a sus

lımites como posiciones directas, aunque pueden tenerlos como referencia.

Complejo (GM Complex): es una coleccion de GM Primitives disjuntas. Si una

GM Primitive (exceptuando GM Point) pertenece a un GM Complex, entontes exis-

te un conjunto de primitivas de una dimension menor en el objeto complejo que

pertenecen a la frontera de dicha primitiva. Los complejos se usan en esquemas de

aplicacion donde es importante compartir la geometrıa, como es el caso en topo-

logıa digital. Un complejo se dice compuesto si se componen de primitivas de igual

dimension. Ası se distinguen:

• Punto compuesto (GM CompositePoint): objeto complejo compuesto de un

unico punto GM Point. Se incluye en el modelo por completitud.

• Curva compuesta (GM CompositeCurve): curva formada por un conjunto de

curvas donde cada una (excepto la primera) empieza en el punto final de la

anterior de la secuencia.

• Superficie compuesta (GM CompositeSurface): superficie formada por un con-

junto de superficies conectadas entre sı por sus fronteras que son curvas.

• Solido compuesto (GM CompositeSolid): conjunto de solidos unidos por sus

superficies lımites formando un unico solido.

El uso de objetos complejos permite introducir restricciones a partir de compartir

primitivas y bajo la asociacion “contiene” y los roles de subcomplejo y supercom-

plejo. Por ejemplo, la restriccion “para toda provincia P debe existir una region

R tal que Supercomplex(P)=R” expresa que toda provincia esta contenida en una

region.

Agregado (GM Aggregate): agrupa elementos geometricos sin limitaciones. El

ejemplo tıpico es un conjunto de puntos de elevacion los cuales, sin agregados, solo

podrıan ser despcritos como puntos individuales; sin embargo, la agregacion da la

Page 135: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Estandares para informacion geografica 109

posiblidad de hacer referencia a los mismos como una unidad. Las agregaciones se de-

nominan “Multi primitivas” cuando son composicion de primitivas de igual dimen-

sion, y de esta forma existen: GM Multipoint, GM Multicurve, GM Multisurface y

GM Multisolid.

Las clases GM Object y GM Primitive son abstractas, ningun objeto o estructura de

datos de una aplicacion las instancia directamente, sino por medio de sus subclases no

abstractas como GM Point, GM Curve o GM Surface. Este no es el caso de GM Complex

o GM Aggregate que pueden instanciarse.

La Figura 5.9 muestra las clases principales del paquete geometrıa. Cualquier objeto

que hereda la semantica de GM Object actua como un conjunto de posiciones directas.

Su comportamiento estara determinado por las posiciones directas que contiene. Los ob-

jetos bajo GM Primitive son abiertos, eso es, no contienen a sus lımites. Los objetos

bajo GM Complex son cerrados, esto es, contienen a sus lımites. Esto conduce a cierta

ambiguedad. Una representacion de una lınea como una primitiva debe referenciar sus

puntos finales, pero no contendra estos puntos como un conjunto de posiciones directas.

Una representacion de una lınea como un complejo tambien referenciara sus puntos fi-

nales, y contendra estos puntos como un conjunto de posiciones directas. Esto significa

que representaciones digitales semejantes tendran semantica diferente dependiendo de ser

referidos como primitiva o complejo.

El estandar usa la clase GM Position para almacenar una posicion, la que puede estar

instanciada con un objeto de la clase DirectPosition o indirectamente haciendo referencia

a un objeto (GM PointRef). GM Point tiene asignada una posicion directa, mientras que

otros objetos como curvas, superficies y solidos estan formados por una secuencia de

referencias.

Los objetos de una clase compartiran las mismas operaciones. Las que se enumeran a

continuacion son algunas de las operaciones definidas que se aplican a clases geometricas:

mbRegion: devuelve la region que contiene al objeto geometrico en el Sistema de

Coordenadas de Referencia.

boundary: aplicada a un objeto, devuelve su lımite que tendra una dimension

menos que el propio objeto.

Page 136: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

110 Capıtulo 5. Estandares Internacionales para Sistemas de Informacion Geografica

Figura 5.9: Jerarquıa de clases de geometricas

distance: devuelve la distancia entre dos objetos geometricos. La distancia se define

como la longitud mınima entre las posibles calculadas por cada par de puntos de los

dos objetos.

closure: que combina un objeto con su lımite. Por ejemplo, aplicado a

GM LineString la operacion devolvera la lınea mas sus puntos inicial y final.

Las relaciones espaciales topologicas son cualitativas y se deducen de la geometrıa.

Algunos ejemplos de las propiedades cualitativas son conectividad, inclusion, vecindad

o coincidencia. La topologıa describe las propiedades geometricas que son invariantes a

deformaciones continuas. Ası un cuadrado es topologicamente equivalente a un rectangu-

lo o un trapezoide. Un aspecto importante de la topologıa es que permite trabajar con

Page 137: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Estandares para informacion geografica 111

Figura 5.10: Paquetes Topologicos

algoritmos combinatorios para relacionar fenomenos geograficos y esto tiene un impacto

positivo sobre la performance. La manera de lograrlo es asociando explıcitamente fenome-

nos y objetos geometricos junto con sus relaciones geometricas implıcitas. Es por esto que

se definieron paquetes topologicos que son paralelos a los paquetes geometricos. La figura

5.10 muestra estos paquetes y sus dependencias.

El estandar incluye en el modelo de clases una jerarquıa que tiene como raız el objeto

topologico (TP Object) (figura 5.11) . Los objetos topologicos a su vez se clasifican en

uno de dos tipos: primitivo (TP Primitive) o complejo (TP Complex). Las primitivas

topologicas estan definidas segun su dimension como:

Nodo (TP Node): primitiva topologica de dimension cero. Los nodos representan

a los puntos topologicos donde se cortan dos o mas curvas. Identifican los extremos

inicial y final de los arcos.

Page 138: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

112 Capıtulo 5. Estandares Internacionales para Sistemas de Informacion Geografica

Figura 5.11: Diagrama de Clases Topologicas

Arco (TP Edge): primitiva topologica unidimensional. Representan a las curvas

topologicas que estan delimitadas por dos nodos y que, a su vez, delimitan caras.

Cara (TP Face): primitiva topologica 2D. Una cara es una region cerrada delimitada

por arcos.

Solido (TP Solid): primitiva topologica 3D. Son cuerpos definidos y delimitados

por nodos, arcos y caras.

En la figura 5.12 se puede ver un ejemplo grafico de las primitivas topologicas. La

estructura del diagrama de clases muestra a la clase raız TP Objet, de la que se despren-

den TP Primitivo y TP Complejo. Claramente, esta organizacion es analoga a la que se

mostro en el diagrama de clases de geometrıa con GM Primitivo y el GM Complejo. Como

Page 139: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Estandares para informacion geografica 113

Figura 5.12: Primitivas topologicas

se muestra en la figura 5.13, hay un paralelismo entre las maneras en que los primitivos

y los complejos estan relacionados en los dos sistemas de clases.

En la representacion de IG se distinguen dos dimensiones: espacial y temporal. El

modelo espacial es mas complejo y esta considerado en toda su extension en ISO 19107

[ISO03c]. Posteriormente la norma ISO 19137 definio un conjunto reducido de perfiles del

esquema espacial solo con el conjunto de elementos geometricos mas utilizados.

Por su parte, el conjunto de clases estandares definidas para la dimension tempo-

ral es mas simple. En la definicion de este conjunto de normas participo activamente el

OGC. Incluso en algunos casos el comite ISO/TC 211 adopto estandares ya definidos

por OGC. Para manipular las caracterısticas espaciales de los fenomenos geograficos se

definio ademas un conjunto de operadores espaciales acordes con dichos modelos concep-

tuales.

5.3.4. Otras normas de la familia ISO 19000

Las normas ISO 19111 [ISO07e] e ISO 19112 [ISO03b] consideran el sistema de refe-

rencia de los fenomenos, ya sea por posicionamiento directo o coordenadas (ISO 19111), o

por medio de identificadores geograficos (ISO 19112). ISO 19111 cubre las operaciones de

conversion y transformacion de coordenadas y establece los atributos para dar informacion

precisa sobre las caracterısticas y propiedades del sistema de referencia.

Relacionadas con interoperabilidad existen cuatro normas que se orientan de manera

general a los servicios. Las normas ISO 19133 [ISO05a] e ISO 19134 [ISO07c] se refieren

Page 140: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

114 Capıtulo 5. Estandares Internacionales para Sistemas de Informacion Geografica

Figura 5.13: Relacion entre geometrıa y topologıa

a servicios basados en la posicion del objeto: seguimiento, enrutamiento y navegacion en

redes lineales. Las normas ISO 19119 e ISO 19128 [ISO05e] referencian a los servidores de

mapas y servicios cartograficos de edicion, transformacion de coordenadas, rectificacion,

cartometrıa, etc.

La norma ISO 19110 [ISO05d] establece la organizacion para la confeccion de catalogos

de fenomenos. Esta estructura facilita la posibilidad de comparar, conocer y explotar

diferentes catalogos. Los elementos del catalogo dan una idea mas concreta de los tipos

de fenomenos y las propiedades que los definen.

La norma ISO 19117 [ISO05b] se ocupa de la obtencion de salidas graficas con valor

cartografico. Su objetivo es definir el esquema que se aplica a los fenomenos para obtener

su representacion. La especificacion de representacion y las reglas de representacion no

son parte de la base de datos y se almacenan independientemente. La especificacion de

representacion se almacena externamente utilizando una URL como referencia universal.

Por su parte, las reglas de representacion se almacenan en el catalogo de representacion.

Page 141: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

GML: El Lenguaje de Marcado Geografico 115

Esto preve un sistema que despega al dato de su representacion y con ello se tiene una

gran versatilidad.

Las normas ISO 19115 [ISO] e ISO 19131 [ISO07a] se ocupan de los metadatos que

hacen posible el uso IG en la red. ISO 19115 es un modelo que ofrece versatilidad y flexibi-

lidad por medio de la definicion de perfiles, extensiones y soporte multilingue. Constituye

la referencia para trabajar en el campo de los metadatos para datos y servicios geograficos.

ISO 19131 define como describir las especificaciones de datos geograficos. Su aplicacion

esta condicionada por la adopcion de las restantes normas de la serie y el nivel de madurez

tecnica de los usuarios. La mayor dificultad reside en conocer los objetivos de utilizacion

de la IG que, naturalmente, condicionan la especificacion del producto, y para los cuales

una norma con un nivel de abstraccion necesariamente elevado no puede presentar indi-

caciones concretas.

Las normas ISO 19113 [ISO02b], 19114 [ISO03a] y 19138 [ISO06] se centran en aspectos

complementarios y relativos a la calidad: identificar factores relevantes de calidad, evaluar

calidad, usar medidas y metodos estandar para informar sobre la calidad. Estas normas

no marcan niveles de calidad. Los niveles de calidad se deben establecer de mutuo acuerdo

entre productores y usuarios en funcion del proposito de cada producto.

5.4. GML: El Lenguaje de Marcado Geografico

El Lenguaje de Marcado Geografico (GML) es un lenguaje de marcado que sirve para

transportar IG a traves de la red de forma que pueda ser compartida [LBTR04]. GML

cuenta con capacidades para describir objetos geograficos complejos. Fue desarrollado en

el marco OGC y esta basado en OpenGIS Abstract Specification y la serie ISO 19100

de ISO/TC 211. Desde sus inicios ha evolucionado hasta lograr actualmente soportar

un modelo de datos para IG robusto. GML ha sido aprobado por un gran numero de

companıas internacionales y organizaciones que definen en gran parte los lineamientos

que siguen las tecnologıas SIG, entre las que se encuentran Oracle, Esri, Intergraph y

NTT Data.

Historicamente traducir datos geograficos de un formato a otro ha sido difıcil. Como

consecuencia, los usuarios con importantes bases de datos geograficas han estado res-

tringidos a usar las herramientas de un unico proveedor. El GML busca disminuir estas

Page 142: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

116 Capıtulo 5. Estandares Internacionales para Sistemas de Informacion Geografica

dificultades y aumentar la posibilidad de compartir informacion geografica. GML esta ba-

sado en el Lenguaje de Marcado Extensible (XML)5. Las especificaciones XML proveen

una forma estandar para definir lenguajes de marcado para “documentos de texto”. Los

documentos XML se almacenan como texto plano lo que trae como ventajas que no se

requiere de herramientas de edicion sofisticadas, son facilmente transferibles entre plata-

formas y no estan sujetos a ningun proveedor; por esto es simple compartir informacion.

Dado que GML esta definido con XML hereda estos beneficios.

5.4.1. Caracterısticas de GML

En GML las entidades geograficas se denominan fenomenos. Los fenomenos pueden

ser concretos, como por ejemplo rıos, construcciones o calles; o pueden ser abstractos,

por ejemplo, lımites polıticos o de distritos de salud y se describen por sus propiedades,

sean estas geometricas y/o descriptivas. Los fenomenos no son representados en forma

directa en GML, sino que son definidos en esquemas de aplicacion segun lo determine el

disenador. Esto permite que se puedan definir elementos con variadas caracterısticas.

GML esta basado en XML por lo que resulta muy adecuado para transferir informa-

cion a traves de Internet. Entre sus componentes se encuentran geometrıas complejas,

sistemas de referencia espaciales y temporales, tipos de proyeccion, topologıa y unidades

de medida. Siguiendo a XML, GML separa contenido de representacion. Ası, un mismo

grupo de elementos puede ser representado de multiples formas de acuerdo a las necesida-

des de los clientes o usuarios de los datos, utilizando otros formatos intermedios para su

visualizacion grafica como son SVG o VML, mediante la aplicacion de transformaciones y

hojas de estilo CSS o XSL. Es importante senalar la diferencia entre datos geograficos y

las interpretaciones graficas de estos como las que se ven en un mapa o en cualquier otra

forma de representacion. Los datos geograficos atanen a la representacion del mundo en

terminos espaciales que es independiente de cualquier forma particular de visualizacion de

los mismos. Ası, al referir a datos geograficos se considera a las propiedades y la geometrıa

de los objetos. La forma como son representados en un mapa, por ejemplo, que colores o

que tipo de lıneas usar no se considera parte del dato.

GML codifica entidades geometricas y tiene capacidad para trabajar con conjuntos

de entidades. Una entidad geografica asociada a una locacion se puede conceptualizar

5En Ingles eXtensible Markup Languaje (XML).

Page 143: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

GML: El Lenguaje de Marcado Geografico 117

como un conjunto de entidades correlacionadas espacialmente. El estado de la entidad

queda definido por un conjunto de propiedades, cada propiedad esta definida por la tri-

logıa <nombre, tipo, valor>. Utiliza el concepto de agregacion, lo que permite que

un conjunto de entidades sea considerado como otra entidad. Por ejemplo, las entidades

recorrido, lınea de colectivo y parada se podrıan reunir en una nueva entidad

transporte urbano de pasajeros. A la nueva entidad se le podrıan definir atributos

propios, como pueden ser horarios picos, cantidad promedio de pasajeros, etc.

El siguiente ejemplo muestra una codificacion basica GML.

Ejemplo 5.4.1 Instancia de fenomeno

<Feature fid="12" featureType="universidad" Description="universidad nacional">

<Description>UNS Universidad Nacional del Sur</Description>>

<Property Name="NumCarr" type="Integer" value="57"/>

<Property Name="NumAlumnos" type="Integer" value="22000"/>

<Polygon name="extent" srsName="epsg:27354">

<LineString name="extent" srsName="epsg:27354">

<CData>

491888.999999459, 5458045.99963358

491904.999999458, 5458044.99963358

491908.999999462, 5458064.99963358

491924.999999461, 5458064.99963358

491925.999999462, 5458079.99963359

491977.999999466, 5458120.9996336

491953.999999466, 5458017.99963357

</CData>

</LineString>

</Polygon>

</Feature>

Un aspecto poderoso de GML es que da libertad a los usuarios para definir sus esque-

mas de aplicacion personalizados. Del ejemplo anterior se puede observar que define al

fenomeno real concreto “Universidad Nacional del Sur (UNS)”. En el primer renglon de

la definicion se lo instancia como fenomeno y se lo relaciona con tipo de fenomeno uni-

versidad nacional. El fenomeno UNS esta descripto por las propiedades descriptivas

numero de carreras (NumCarr) y numero de alumnos (NumAlumnos). Ademas tiene una

propiedad espacial polıgono y su referencia con la superficie terrestre.

Page 144: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

118 Capıtulo 5. Estandares Internacionales para Sistemas de Informacion Geografica

5.4.2. Descripcion de GML schema

GML como la mayorıa de las gramaticas basadas en XML, tiene dos partes: el docu-

mento de definicion de esquema y el documento de instancias que contiene los datos. Da

libertad a usuarios y desarrolladores para disenar datos con geografıas genericas (puntos,

lıneas y polıgonos) segun los requerimientos del problema. De todas formas cuenta algunos

esquemas predefinidos para ciertas comunidades de aplicacion especıficas6. La posibilidad

de definir esquemas de aplicacion permite que los usuarios puedan referirse a objetos como

caminos, carreteras o puentes en lugar de puntos, lıneas o polıgonos. Si una comunidad

de uso acuerda en utilizar el mismo esquema, aplicaciones distintas podran intercambiar

datos facilmente y estar seguros que los datos no pierden identidad. Todos los clientes y

proveedores con interfaces que implementen el OpenGIS Web Feature Service Interface

Standard7 podran leer o escribir GML data.

Respetando las reglas de ISO 19109, los tipos de fenomenos de una aplicacion se

especifican en el documento de esquema de aplicacion. El esquema de aplicacion GML

especificado en XML Schema se importa a GML Schema. Para definir en GML los tipos

de datos de una aplicacion se pueden extender o restringir los tipos definidos en GML

Schema o usarlos directamente en el esquema de aplicacion si no requieren cambios. Todos

los esquemas de aplicacion se deben modelar siguiendo el Modelo de Fenomeno General

de ISO 19109.

La figura 5.14 muestra el modelo de un esquema de aplicacion que incluye a los fenome-

nos parcela, construccion y persona. Se observa que parcela se relaciona por aso-

ciacion de propiedad con persona y por agregacion con construccion. El diagrama

esta modelado usando UML e incluye los estereotipos de las clases definidas en ISO 19109.

Una posible codificacion para el tipo de fenomeno parcela podrıa ser:

Ejemplo 5.4.2 Descripcion en GML del tipo de fenomeno parcela

<!-- Parcela - AbstractFeature -->

<element name="Parcel" substitutionGroup="gml:AbstractFeature">

<complexType>

<complexContent>

6en.wikipedia.org/wiki/GML_Application_Schemas7http://www.opengeospatial.org/standards/wfs

Page 145: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

GML: El Lenguaje de Marcado Geografico 119

<extension base="gml:AbstractFeatureType">

<sequence>

<element name="area" type="gml:AreaType"/>

<element name="extent" type="gml:SurfacePropertyType"/>

<element name="owner" type="ex:PersonPropertyType" maxOccurs="unbounded">

<annotation>

<appinfo><gml:reverseProperty>ex:owns</gml:reverseProperty></appinfo>

</annotation>

</element> <element name="hasBuilding" type="ex:BuildingPropertyType" minOccurs="0" maxOccurs="unbounded"/>

</sequence>

</extension>

</complexContent>

</complexType>

</element>

<complexType name="ParcelPropertyType">

<sequence minOccurs="0">

<element ref="ex:Parcel"/>

</sequence>

<attributeGroup ref="gml:AssociationAttributeGroup"/>

<attributeGroup ref="gml:OwnershipAttributeGroup" />

</complexType>

<!-- ================================== -->

El codigo asociado a la definicion del esquema de aplicacion parcela muestra como

los elementos del modelo se definen respetando las clases del Modelo de Fenomeno General

del estandar ISO 19109. El desarrollo completo de este ejemplo se puede ver en el apendice

A.

GML especifica las codificaciones XML de ciertas clases conceptuales definidas en

la serie ISO 19100. Los modelos conceptuales relevantes incluyen los elementos de defi-

nidos en: ISO/TS 19103 Conceptual Schema Language (units of measure, basic types);

ISO 19107 Spatial Schema (spatial geometry and topology); ISO 19108 Temporal Sche-

ma (temporal geometry and topology, temporal reference systems); ISO 19109 Rules for

Application Schemas (features); ISO 19111 Spatial referencing by coordinates (coordinate

reference systems); ISO 19123 Schema for coverage geometry and functions (coverages,

grids).

Page 146: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

120 Capıtulo 5. Estandares Internacionales para Sistemas de Informacion Geografica

Figura 5.14: Ejemplo de esquema de aplicacion Mapa Urbano

5.4.3. Ventajas de GML

A continuacion se describen algunas de las ventajas de uso del lenguaje de marcado

geografico GML, y como estas pueden impactar de forma positiva en el tratamiento de la

IG [dSR04]:

El estar basado en XML lo hace adecuado para transferir la IG a traves de Inter-

net. Por otro lado, GML define una codificacion XML que permite que los datos

geograficos puedan ser transferidos entre sistemas dispares de forma sencilla.

Los usuarios pueden ver el mapa resultante utilizando un navegador estandar, sin

necesidad de un software GIS propietario en el cliente. Esta caracterıstica lo hace

mucho mas versatil y potente que los metodos convencionales basados en imagenes.

Page 147: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

GML: El Lenguaje de Marcado Geografico 121

Los mapas son de mayor calidad. GML codifica informacion sobre entidades geografi-

cas y objetos, y estos pueden visualizarse con tanta resolucion como se requiera.

Permite manejar estilos de mapa personalizados. En GML se almacena unicamente

el contenido del mapa, donde estan los fenomenos, su geometrıa, tipos y atributos,

pero no como se deben mostrar. Se pueden aplicar diferentes estilos a los datos

geograficos de manera que se muestren como el usuario desee. Por ejemplo, un

usuario puede elegir el sımbolo de la cruz para situar centros de salud, mientras que

otro pondrıa representarlos con un texto. Los datos GML son los mismos en ambos

casos; cada visualizacion simplemente utiliza un estilo diferente a traves de las hojas

de estilo.

Relacionado con el ıtem anterior, esta el control sobre los contenidos. En GML

resulta sencillo aplicar funciones de filtrado que permitan a los usuarios descargar

solo los tipos de fenomenos que deseen visualizar en sus mapas. Por ejemplo, si no

se requiere informacion sobre las lıneas de ferrocarril, no se necesitan descargar del

servidor, aunque la informacion este disponible. El contenido del mapa puede ser

controlado incluso despues de ser descargado sobre el navegador Web del cliente.

Una vez que el mapa ha sido descargado y visualizado en el navegador (transformado

de GML a SVG) es simple aplicar funciones de edicion: anadir texto, agregar marcas,

etc.

Un navegador Web no es la unica forma de pensar donde usar la IG, sino que se

puede ver como un formato de intercambio de proposito general. Los datos pueden

ser compartidos con cualquier otro dispositivo que este en condiciones de procesar

codigo XML (SIG, telefonos moviles, etc).

GML reutiliza la experiencia existente en modelos de informacion geografica.

Por supuesto tambien puede traer algunas desventajas que deberan ser analizadas

a la hora de considerar un proyecto usando GML [dSR04]. Genera archivos de texto

grandes que desde el punto de vista del almacenamiento no estan optimizados y presenta

dificultades para manipular archivos raster de gran tamano.

Page 148: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

122 Capıtulo 5. Estandares Internacionales para Sistemas de Informacion Geografica

5.5. Resumen del capıtulo

Los requerimientos de estandarizacion para IG digital en cuanto a transferencia de

datos y servicios provienen de la industria IDE y la necesidad de cooperar con sistemas

distribuidos. El potencial de los entornos web podra ser verdaderamente explotado en

la medida en que el numero de fuentes de IG accesibles sea cada vez mayor. Los avan-

ces en estandarizacion han significado que los entornos de servicios web para IG hayan

aumentado considerablemente.

Los resultados mas importantes logrados en estandarizacion e interoperabilidad estan

conducidos por los organismos internacionales OGC e ISO. Desde sus ambitos de trabajo

ambas organizaciones apuntan a definir una forma normalizada para servicios, catalogos

y metadatos, y representacion de datos geograficos. Actualmente ambas organizaciones

trabajan cooperativamente. Aun el grado de aplicacion de las normas es bastante desigual.

En general, las normas que son base para la interoperabilidad de paquetes informaticos

tienen un alto grado de aplicacion en los productores de software. La explosion de las

IDE esta potenciando enormemente por todo lo relacionado con metadatos y servicios.

OGC como representante de la industria, se ocupa de las especificaciones de implementa-

cion para servicios. Su objetivo es lograr tecnologıas de geoprocesamiento interoperables

siguiendo el esquema “plug and play”. Entre los resultados mas destacados se pueden

nombrar las especificaciones de implementacion para diversos tipos de servicios: servicios

de mapas web (WMS)8[wms04], servicios de fenomenos web (WFS)9 [Ope02] y el lengua-

je de marcas geografico GML. Estos resultados han sido llevados adelante respetando los

estandares geograficos de la serie ISO 19000.

Los catalogos y metadatos favorecen que distintos clientes puedan encontrar y acceder

a recursos, datos y servicios, disponibles en los servidores de los proveedores, aunque

estos no necesariamente sean conocidos previamente por el cliente. Hacer la informacion

geo-disponible justamente se relaciona con dar la posibilidad a los clientes de encontrar

proveedores de servicios de geoprocesamiento y datos buscando a traves de la descripcion

de los mismos en metadatos interpretables. En este capıtulo se mostraron estandares para

datos geograficos y metadatos de esquemas definidos por ISO/TC-211 y adoptados por

las implementaciones OGC.

8En Ingles Web Map Service (WMS).9En Ingles Web Feature Service (WFS).

Page 149: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Resumen del capıtulo 123

La normalizacion conlleva notables beneficios; sin embargo, dada la libertad que tienen

los usuarios para definir sus esquemas de aplicacion y servicios personalizados hace que en

muchos casos exista la informacion que se esta buscando, pero que no se llegue a ella porque

los patrones de busquedas siguen siendo por coincidencia y no por significado. Por ejemplo,

si un cliente esta buscando “zonas de ganado vacuno”, podrıa no vincularse con servicios de

un proveedor que ofrece “crıa de Aberdeen Angus”. Esto es ası porque para un buscador

automatico no hay coincidencia en los patrones de busquedas, aunque semanticamente

cliente y proveedor estan relacionados. Esto forma parte de los nuevos desafıos semanticos

para la informacion. En el siguiente capıtulo se presentan las propuestas de incrementar

el significado de la informacion mediante el uso de ontologıas.

Page 150: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Capıtulo 6

Ontologıas para Informacion

Geografica

La Web Semantica se relaciona con la nocion de interoperabilidad e integracion de

informacion. Para ello se requiere de compartir y transferir “conocimiento”. El modelo de

comunicacion distingue dos entidades: el emisor y el receptor. Un medio para posibilitar

esta comunicacion podrıa estar dado por el uso de ontologıas mediadoras. Una ontologıa

es una especificacion formal de los terminos de un dominio junto con las relaciones que

existen entre ellos [Gru93]. La ontologıa define un lenguaje comun para los usuarios de

una comunidad que desean compartir informacion. Mas interesante aun es que las defini-

ciones de los conceptos y sus relaciones serıan potencialmente interpretables por agentes

automaticos.

Los diversos repositorios distribuidos con IG y el costo que significa generar y procesar

datos geograficos que ya existen en otros medios trae como consecuencia la necesidad

de poder evaluar, combinar y reusar recursos de fuentes multiples. Buscar, recuperar e

integrar informacion es un proceso de comunicacion que involucra a un cliente y a uno o

varios proveedores. Se espera que en el proceso de comunicacion el cliente y los proveedores

no interactuen directamente sino a traves de un sistema de informacion que funcione

como distribuidor y administre las negociaciones entre ellos. Para que esto sea posible se

necesitan resolver los problemas relacionados con la heterogeneidad semantica causada

por conceptualizaciones diferentes, terminologıas, contexto o informacion incompleta.

Page 151: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Ontologıas y representacion de conocimiento 125

Como se vio en el capıtulo anterior la normalizacion trae beneficios importantes. Al

unificar los modelos de representacion bajo las ISO 19XXX se ha establecido un marco

comun para todas las herramientas SIG y se ha favorecido la interoperabilidad actual que

existe entre aplicaciones. La norma ISO 19109 permite especificar como estan definidos

los fenomenos geograficos del modelo conceptual de una aplicacion concreta, conformando

su diccionario de datos accesible. Por su parte, GML es un lenguaje de marcado con

capacidad de describir objetos geograficos complejos que sirve para transportar IG a

traves de la red. Estos resultados han mejorado las posibilidades de integracion entre

aplicaciones. Sin embargo, aun faltan recursos para hacer realmente geo-disponible a la

IG. En la medida que los algoritmos de busqueda se basen unicamente en “coincidencias”

de terminos en metadatos y/o datos, el resultado sera pobre, ya que no se considera a la

conceptualizacion subyacente. En este capıtulo se estudian a las ontologıas como medio

para enriquecer semanticamente a los modelos de datos espaciales.

6.1. Ontologıas y representacion de conocimiento

El concepto de ontologıa originalmente se asocio a la investigacion en el campo de

la Filosofıa. Sin embargo, actualmente, varias lıneas de investigacion en Ciencias de la

Computacion que aplican a diversas areas tambien se ocupan del estudio de ontologıas:

Ingenierıa del Conocimiento, Representacion del Conocimiento, Diseno e Integracion de

Bases de Datos y Recuperacion y Extraccion de Informacion, entre otras. La proliferacion

en la aplicacion de ontologıas tiene dos aspectos a observar: el metodologico y el arqui-

tectonico [Gua98]. Desde lo metodologico la caracterıstica relevante es la adopcion de

una apuesta fuertemente interdisciplinaria. La definicion de una ontologıa es el resultado

de trabajos colaborativos entre especialistas del dominio, profesionales de ingenierıa de

software y expertos en filosofıa y linguıstica, cada uno jugando un rol fundamental para

analizar la estructura de una realidad con un alto nivel de generalidad y formulando un

vocabulario claro y riguroso.

Desde la vista arquitectonica, se destaca el rol que puede ocupar una ontologıa en

un sistema de informacion (SI); en una perspectiva futura se habla de SI conducidos por

ontologıas. El enfoque en el uso de ontologıas en SI dependera del momento en que se le

de la oportunidad de intervencion a las distintas ontologıas previas. A grandes rasgos se

pueden evaluar dos instancias diferentes: en la etapa de desarrollo del sistema o en tiempo

Page 152: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

126 Capıtulo 6. Ontologıas para Informacion Geografica

de produccion. El primer caso propicia SI semanticos, integrables y que eventualmente

hasta pueden resultar en nuevas ontologıas. La intervencion de ontologıas en tiempo de

produccion permite la comunicacion entre agentes de software en terminos ontologicos y

usando contenido semantico.

6.1.1. ¿Por que definir ontologıas?

Las ontologıas unifican la interpretacion de conceptos o terminos de forma tal que

dicha interpretacion sea unica. Esta afirmacion es valida entre personas ası como tam-

bien si en la comunicacion participan agentes automaticos. Las comunicaciones personales

pueden resolver la heterogeneidad semantica a causa de conceptualizaciones diferentes,

terminologıas, contexto o informacion incompleta. Para las personas, el significado de las

cosas lo tiene “el termino” mismo, como expresion del lenguaje natural junto con las re-

laciones implıcitas que tiene con otros terminos. La relacion superconcepto/subconcepto

entre elementos cotidianos es comprendida claramente por las personas. Por ejemplo,

dados los terminos “transporte” y “automovil” entre ellos existe la relacion superconcep-

to/subconcepto que identifica al automovil como una especializacion de un transporte.

Sin embargo, esta relacion no es trivial para los algoritmos de busqueda disponibles ac-

tualmente que se basan en encontrar coincidencias de terminos en los esquemas y los

datos.

La tarea de una ontologıa es la especificacion formal de los conceptos y sus relaciones.

La figura 6.1 presenta un ejemplo simple de especificacion ontologica de conceptos y

relaciones. La representacion grafica utilizada es la propuesta por UML [RJB04]. Los

conceptos estan representados por rectangulos. Entre los conceptos se distinguen las clases

(en color), que definen las propiedades comunes a los elementos del mismo tipo y las

instancias (en blanco) que representan a un concepto concreto, ejemplar o “instancia”.

En el figura se plantea una relacion de jerarquıa entre las clases Fuente de Agua Dulce

y Rıo por medio de la asociacion distinguida es un, en el grafico representada por una

lınea con un triangulo blanco sobre el concepto mas abarcativo y que define a Rıo como

un tipo de Fuente de Agua Dulce. El uso de la asociacion distinguida es un refleja la

relacion entre un concepto especializado y su padre. Definir conceptos y relaciones es un

no recursivas entre los mismos explicita una jerarquıa o taxonomıa. Otras asociaciones

definidas en el ejemplo son desemboca que especifica que un Rio desemboca en el Oceano

y termina para representar que Rıo termina en una Localidad. Las instancias de clases

Page 153: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Ontologıas y representacion de conocimiento 127

Figura 6.1: Ejemplo de Modelado de Conceptos y Relaciones

y asociaciones estan representados por la dependencia estereotipada ((instantiate)). Con

esta simple definicion es posible obtener algunas conclusiones basicas, como por ejemplo:

El Rıo Negro es un Rıo.

El Oceano Atlantico es un Oceano.

Viedma es una Localidad.

El Rıo Negro desemboca en el Oceano Atlantico.

El Rıo Negro termina en Viedma.

Y otras conclusiones implıcitas mas elaboradas:

El Rıo Negro es una Fuente de Agua Dulce.

Viedma esta proxima al Oceano Atlantico.

Viedma cuenta con una Fuente de Agua Dulce.

Page 154: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

128 Capıtulo 6. Ontologıas para Informacion Geografica

Figura 6.2: Composicion de una ontologıa

Lo atractivo de contar con este modelo de representacion explıcito es que a las mismas

conclusiones podrıa llegar un agente automatico, tal como si comprendiera o razonara.

6.1.2. Uso de ontologıas en Ciencias de la Computacion

El Diccionario de la Real Academia Espanola define como ontologıa a “la parte de la

metafısica que trata del ser en general y de sus propiedades trascendentales”. La definicion

anterior se aplica al area de Ciencias de la Filosofıa y su analisis esta fuera de los obje-

tivos de esta tesis. Para la comunidad de Ciencias de la Computacion, la aplicacion del

concepto ontologıa originalmente se vinculo con Inteligencia Artificial. Segun la definicion

de Inteligencia Artificial una ontologıa es “un artefacto de ingenierıa, constituido por un

vocabulario especıfico usado para describir una determinada realidad, mas un conjunto

de hipotesis explıcitas sobre el significado de las palabras del vocabulario”. En la figura

6.2 se muestra graficamente el alcance de esta definicion. Las hipotesis deben responder

a la estructura de una Logica de Primer Orden, los terminos del vocabulario se utilizan

como predicados unarios o binarios, conformando respectivamente los conceptos y las re-

laciones. En su expresion mas simple, una ontologıa describe una jerarquıa de conceptos

vinculados por las relaciones de generalizacion/especializacion. En casos mas sofisticados,

anaden axiomas para expresar otras relaciones entre los conceptos y restringir o precisar

la interpretacion pretendida.

Las ontologıas en Ciencias de la Computacion se utilizan como medio para especificar

formalmente el significado que se le asigna a la parte del mundo real que se esta modelando

en un programa o sistema. La especificacion formal y explıcita permite que el conocimiento

que tiene dicha aplicacion sobre el mundo real se pueda compartir y reutilizar.

Page 155: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Formalizacion 129

6.2. Formalizacion

6.2.1. Definicion

Una ontologıa es una especificacion formal de los conceptos de un dominio de aplica-

cion. Define un vocabulario y relaciones de uso comun entre varios usuarios que desean

compartir informacion relativa a un dominio [dB93], de forma que las definiciones de con-

ceptos y sus relaciones puedan ser interpretadas por agentes automaticos. El estudio de

ontologıas aun constituye un tema de investigacion. En la bibliografıa tecnica existen di-

ferentes definiciones para el termino ontologıa, y todas ellas pretenden capturar el mismo

espıritu. Hemos seleccionado la siguiente por considerarla la mas concisa y clara [Gru93]:

“Una ontologıa es una especificacion explıcita y formal de una conceptualizacion

compartida.”

donde el termino conceptualizacion se refiere a que utiliza la estrategia de definir modelos

abstractos para representar elementos del mundo real trasladados a la computadora con

algun proposito. Ademas, una ontologıa es una especificacion porque define de forma con-

creta tales conceptos. Es explıcita porque todos los conceptos, relaciones y restricciones

deben estar definidos explıcitamente. Es formal porque las definiciones deben estar expre-

sadas sin ambiguedades de forma tal que sean interpretables por componentes automati-

cos. Por ultimo, la calidad de compartida refleja la nocion de que captura conocimiento

consensuado por una comunidad de expertos del dominio.

6.2.2. Componentes de una ontologıa

Conceptos

El concepto es la unidad basica a la que la ontologıa le asigna un significado. Un

concepto en una ontologıa representa a un conjunto de elementos o instancias del mundo

real que comparten una misma definicion, esto es, significado, propiedades y relaciones.

Por ejemplo, una ontologıa para sistemas hıdricos incluira la definicion del concepto rıo.

La especificacion debera ser representativa para todas las instancias o ejemplares de rıo.

Establecida la porcion del mundo a modelar por una ontologıa, esta debera incluir la

definicion del cada uno de los conceptos que maneja para estar completa.

Page 156: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

130 Capıtulo 6. Ontologıas para Informacion Geografica

Figura 6.3: Conceptualizacion y ontologıa

El significado que se da en este entorno al vocablo “concepto” no se debe confun-

dir con el significado filosofico mas amplio que se les da a los terminos “Concepto” o

“Conceptualizacion”. La figura 6.3 muestra graficamente la relacion. Mientras que una

conceptualizacion filosofica es la definicion que se le asigna a un elemento del mundo real

a partir de su participacion en varias situaciones o mundos posibles, las ontologıas en

Ciencias de la Computacion definen conceptos en un sentido mas estricto y, en parte,

restringidas por el poder expresivo del lenguaje ontologico utilizado [Gua98].

Instancias

La especificacion de un concepto define el patron o molde para un grupo de instan-

cias o ejemplares. Luego, para dicho concepto pueden existir varias instancias, cada una

representando a un objeto del mundo real que se distingue de otros objetos. Por ejemplo,

el rıo “Parana” es una instancia del concepto rıo. Las instancias son distinguibles unas

Page 157: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Formalizacion 131

de otras por los valores particulares de sus propiedades y/o sus asociaciones con otros

terminos.

Propiedades

Las propiedades son las caracterısticas o atributos usados para describir a los concep-

tos. Para cada concepto se definen un conjunto de una o mas propiedades. Las instancias

de los conceptos asocian sus valores a las propiedades. Por ejemplo, nombre y longitud

podrıan ser propiedades que describen al concepto rıo. La instancias rıo Parana tiene los

valores de propiedad “Parana” y “2.570 km.” respectivamente.

Relaciones

Las relaciones mantienen las asociaciones que existen entre conceptos, propiedades

e instancias. Cuando se define una relacion entre conceptos esta es heredada por sus

instancias. Un tipo particular de relaciones frecuentemente utilizado en la definicion de

ontologıas es generalizacion/especializacion. Por ejemplo, dados los conceptos Fuente

de Agua Dulce y Rıo, entre ellos se define la relacion es un1que especifica que todo

Rio es una Fuente de Agua Dulce. Ası, la instancia “(Parana, 2.570 km)”, por ser un

ejemplar de Rıo, tambien es una Fuente de Agua Dulce. El tipo de relaciones capaces

de ser definidos por una ontologıa depende del poder expresivo del lenguaje ontologico

que utilice.

6.2.3. Definicion formal

Habiendo presentado la definicion conceptual de ontologıa y los elementos que la cons-

truyen, estamos en condiciones de proveer una definicion formal. Una ontologıa es 4−tuplaO =< C,P, I, A > donde C representa un conjunto de clases o conceptos, P un conjunto

de propiedades, I un conjunto de instancias y A un conjunto de axiomas. Las clases son

los patrones para las entidades u objetos del mundo real; las propiedades estan asociadas

a las clases como atributos o representan relaciones entre las mismas (tal como relaciones

de generalizacion/especializacion, agregacion, etc); las instancias son los individuos de las

1Nombre generico dado a la relacion generalizacion-especializacion.

Page 158: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

132 Capıtulo 6. Ontologıas para Informacion Geografica

clases; y los axiomas modelan restricciones adicionales que involucran tanto clases como

propiedades.

6.3. Tipos de ontologıas

Existen diversas ontologıas, construidas para diferentes dominios de aplicacion. Entre

ellas difieren en el nivel de detalle que expresan. La vision de la ontologıa como un vo-

cabulario mas la especificacion del significado de los terminos de dicho vocabulario sirve

como base para organizarlas segun el grado de formalidad utilizado en la especificacion de

significados. Las ontologıas mas informales usan definiciones en lenguaje natural, las on-

tologıas semiformales proporcionan axiomatizaciones debiles tales como taxonomıas y las

ontologıas formales definen la semantica del vocabulario por una axiomatizacion completa

y efectiva. Los siguientes son algunos ejemplos de ontologıas.

Ejemplo 6.3.1 Ejemplos de ontologıas

WordNet[WOR98] es una ontologıa que cubre terminos del idioma Ingles con des-

cripcion en lenguaje natural. Incluye relaciones para sinonimos o terminos equiva-

lentes y relaciones de hiper/hiponimo con otros terminos. WordNet es una ontologıa

de amplio alcance de aplicacion y con nivel de detalle bajo.

Cyc[RL02] es otro ejemplo de ontologıa de alcance amplio. Formaliza conocimientos

basicos o de sentido comun. Esta desarrollada con alto nivel y alto detalle. Establece

varias relaciones formales estrictas entre terminos.

De los ejemplos anteriores se pueden tomar dos dimensiones para caracterizar una

ontologıa: generalidad y expresividad. Generalidad se refiere al campo de aplicacion o uso

de la ontologıa. Cuanto mas general, mayores seran los dominios donde se pueda emplear.

La expresividad se refiere al nivel de formalidad con el que esta definida y la capacidad

de razonar que provee.

6.3.1. Clasificacion segun generalidad

Partiendo de que una ontologıa es una especificacion sobre una conceptualizacion

compartida, expertos del dominio, usuarios y disenadores deben acordar el conocimiento

Page 159: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Tipos de ontologıas 133

especificado en la ontologıa para que la misma sea usable, al menos por los miembros de

la comunidad. Naturalmente este acuerdo es difıcil de lograr. Una forma de abordar una

solucion es dividir el conocimiento compartido en distintas ontologıas, segun su alcance o

nivel de generalidad. De esta forma, aquellas ontologıas mas generales se puede usar en

distintos problemas, mas alla de no estar necesariamente de acuerdo con las definiciones

de ontologıas de mayor nivel de detalle. Distintos autores proponen formas levemente

diferentes en cuanto a la manera de nombrar y clasificar ontologıas segun el nivel de

generalidad [IIMM99, Gua98, Usc98]. Una practica comun es distinguir los siguientes

niveles de generalidad:

Ontologıas genericas (Top-Level): capturan conocimiento de proposito general, in-

dependiente del dominio de aplicacion, por ejemplo: espacio, tiempo, evento, accion,

etc. En teorıa se espera que estas ontologıas se adopten por una amplia comunidad

de usuarios.

Ontologıas de dominio y ontologıas de tarea: definen el conocimiento usado por un

dominio (medicina, geografıa) o por una actividad especıfica (comercio) describien-

do su vocabulario mediante la especializacion de los terminos introducidos en la

ontologıa de alto nivel.

Ontologıas de aplicacion: capturan el conocimiento necesario de un sistema o apli-

cacion especıfica. Describen conceptos que dependen tanto del dominio como de la

actividad, los cuales frecuentemente son especializaciones de ambas ontologıas ante-

riores. A menudo se corresponde con roles desarrollados por las entidades mientras

realizan una actividad.

6.3.2. Clasificacion segun expresividad

Otra forma de organizar las ontologıas es por su grado de expresividad. En este sentido

se abre un amplio espectro de posibilidades. En [McG03] se identifican las siguientes

posiblilidades, en orden ascendente segun su poder expresivo:

Vocabulario controlado: es una lista de conceptos que carece de relaciones entre ellos.

Las definiciones estan dadas en lenguaje natural.

Page 160: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

134 Capıtulo 6. Ontologıas para Informacion Geografica

Ejemplo 6.3.2 Se sugiere el uso de un vocabulario controlado para fijar los termi-

nos de un campo o atributo. Por ejemplo, acordar para un atributo idioma usar el

valor “espanol” y evitar otros sinonimos como “espanola”.

Tesauro: define algunas relaciones basicas entre conceptos, como sinonimos, termino

abarcativo, termino menor, termino raız. En la seccion 4.4.1 del capıtulo 4 se des-

criben en detalle las posibles relaciones entre terminos de un tesauro.

Taxonomıa informal : incluye una jerarquizacion explıcita de conceptos (generaliza-

cion y especializacion), pero no usa herencia estricta; esto es, una instancia de una

subclase no necesariamente es instancia de la superclase.

Taxonomıa formal : se diferencia de la anterior en que incluye herencia estricta.

Marcos : definen especies de clases que asocian propiedades a los conceptos. Las

propiedades son heredadas por las subclases y las instancias.

Con restricciones sobre valores : agregan la posibilidad de restringir los valores que

pueden asumir ciertas propiedades como, por ejemplo, restringir el dominio.

Con restricciones logicas generales : pueden restringir los valores de las propiedades

definiendo para ellos formulas logicas o matematicas basadas en valores de otras

propiedades.

Con restricciones de Logica de Primer Orden: los lenguajes de ontologıa mas expre-

sivos como Ontolingua o CycL permiten definir restricciones en Logica de Primer

Orden entre terminos y relaciones mas refinadas como clases disjuntas, cubrimientos,

relaciones inversas, relaciones todo-parte, etc.

Otra forma de organizar las ontologıas segun el nivel de expresividad consiste en di-

vidirlas en ontologıas livianas y ontologıas pesadas. Las ontologıas livianas incluyen con-

ceptos, propiedades que describen los conceptos, relaciones entre conceptos y taxonomıas

de conceptos. Las ontologıas pesadas ademas agregan axiomas y restricciones. El cuadro

6.1 muestra algunos ejemplos de ontologıas conocidas organizadas segun la clasificacion

por poder expresivo presentada.

Page 161: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Tipos de ontologıas 135

Nombre Descripcion

Dublin Core Vocabulario controlado destinado a especificar metadatos de

documentos. Contiene terminos como “autor”, “tıtulo”, “edi-

tor”, etc.

WordNet [WOR98] Tesauro de palabras del idioma Ingles que incluye algunas

relaciones basicas entre terminos (sinonimos e hiponimos).

AGROVOC [LTM82] Tesauro estructurado multilingue del dominio de agricultu-

ra, silvicultura, pesca, alimentos y topicos relacionados como

medio ambiente. Consta de palabras y expresiones en diver-

sos idiomas, organizados a traves de sus relaciones “termino

generico”, “termino especıfico” y “termino relacionado”.

Yahoo!Dictionary Define una taxonomıa informal utilizada para clasificacion de

sitios web. Incluye categorıas generales como “economıa y ne-

gocios”, que a su vez contiene subcategorıas como “shopping”,

“servicios”., etc.

UNSPSC [UNS] Taxonomıa formal de productos de Estados Unidos. Clasifica

los productos desde el punto de vista del proveedor.

Cyc [CYC02] Es una ontologıa desarrollada EN KIF (Knowledge Interchan-

ge Format). Este lenguaje tiene la expresividad total de un

lenguaje de logica de primer orden.

Cuadro 6.1: Ejemplos de Ontologıas

Page 162: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

136 Capıtulo 6. Ontologıas para Informacion Geografica

Figura 6.4: El entorno Cliente-Proveedores en el proceso de busqueda de IG

6.4. Interoperabilidad e Integracion para Informa-

cion Geografica

6.4.1. Recuperacion de IG basada en catalogos

Existe un interes creciente en investigar interoperabilidad e integracion semantica den-

tro del campo de las Ciencias de Informacion Geografica. Los repositorios distribuidos y

el procesamiento de IG nacen como consecuencia de la necesidad de los clientes de eva-

luar y combinar recursos de fuentes de multiples proveedores. La tarea crucial es entonces

encontrar y acceder a la IG adecuada distribuida entre los servidores de sus proveedo-

res. En la actualidad, los repositorios de informacion cuentan con informacion descripta

por catalogos, pero esto en muchos casos resulta insuficiente. La figura 6.4 presenta una

representacion grafica de este entorno.

Ası, en el proceso de busqueda de IG se distinguen dos actividades, descubrir a los

potenciales proveedores de fuentes de datos y recuperar la informacion que se necesita.

Page 163: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Interoperabilidad e Integracion para Informacion Geografica 137

Descubrir IG. Bajo el contexto de sistemas distribuidos heterogeneos, clientes y

proveedores de datos (o servicios) estan arbitrariamente distribuidos en grandes

redes y cada uno desconoce la existencia del resto. La falta o insuficiencia de do-

cumentacion hace difıcil o imposible a los clientes descubrir las posibles fuentes de

datos o determinar si una fuente de datos es util para sus tareas. Las busquedas son

por catalogo. Los proveedores ofrecen datos y servicios geoespaciales descriptos con

los metadatos del catalogo. El catalogo reune metadatos de proveedores conocidos

y suele proveer funciones de librerıa para mostrar y consultar el catalogo.

Recuperar IG. Los formatos heterogeneos hacen difıcil comprender y plantear con-

sultas sobre el conjunto de datos de otros sistemas. En varias oportunidades de re-

quiere de conversiones. Las soluciones en estandarizacion favorecen la normalizacion

de interfaces para servicios y formatos de intercambio. Por ejemplo, la especificacion

Web Feature Service (WFS) de OCG [Ope02] propone interfaces para describir las

operaciones de manipulacion de fenomenos geograficos y capacidades para recuperar

fenomenos basados en restricciones espaciales y no espaciales (GetFeature) y para

generar la descripcion de tipos de fenomenos (DescribeFeatureType).

Los problemas de heterogeneidad semantica causados por la ambiguedad del lenguaje

natural persisten en la busqueda por palabras claves en los catalogos, cuando se formu-

lan las consultas para acceder a datos o servicios, causando serios conflictos durante la

busqueda de fuentes de datos y/o servicios apropiados [LRP03]. Por ejemplo, un servicio

cuya tarea esta descripta por los metadatos “clasificar las areas de inundacion en image-

nes satelitales” podrıa no ser encontrado si se busca por la palabras claves “servicios

de clasificacion para datos sensados remotamente”. Las dificultades de interoperabilidad

semantica ocurren a tres niveles de interpretacion [BEH+03]:

Interpretacion de metadatos.

Interpretacion de datos.

Integracion de informacion.

En la interpretacion de metadatos ocurre que los terminos utilizados para un mismo

concepto varıan. Esto a veces tiene que ver con el uso de distintos idiomas, pero tambien

dentro de un mismo idioma (sinonimos).

Page 164: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

138 Capıtulo 6. Ontologıas para Informacion Geografica

Ejemplo 6.4.1 Supongamos tres proveedores S1, S2 y S3 que mantienen informacion

sobre las mediciones de nivel de agua de un rıo. S1 registra sus datos con el termino

“Medida”, mientras que S2 usa el termino “Nivel-de-Agua”. Para las personas, no es

difıcil ver que ambos terminos se refieren a nivel de agua, especialmente en el contexto

de mediciones de rıos. En contraste, para un agente de busqueda automatico no existe

coherencia entre los terminos, y no puede asumir ningun tipo de similitud por lo que los

terminos son tratados como si fueran totalmente diferentes.

Tambien ocurre, que en ciertos casos se omiten metadatos. Por ejemplo, el proveedor

S3 provee sus datos en forma de registros sin descripcion:

... 04.06.2003; 00:45; 138.00;

04.06.2003; 01:00; 138.00;

04.06.2003; 01:15; 138.00;

04.06.2003; 01:30; 138.00;

04.06.2003; 01:45; 137.00; ...

Sin metadatos para un buscador automatico es imposible trabajar con hechos ocultos.

En cuanto a interpretacion de los datos geograficos ocurren los mismos problemas

semanticos. Por ejemplo, sea una fuente de informacion con datos sobre la cuenca de un

rıo. Estos datos incluyen descripcion del tipo de terreno. Existen varios vocabularios para

clasificar el uso o destino del suelo. Algunos estan estandarizados y su uso esta difundido,

por ejemplo, ATKIS [atk03] o CORINE [BO00], mientras que otros son creados por los

mismos proveedores de datos. La clase de problemas que surge cuando se interpretan

datos es similar a los problemas que existen con los metadatos. En la interpretacion

de metadatos los terminos usados para describir los tipos de propiedades (en el modelo

relacional los encabezados de las columnas) son ambiguos; en el caso de interpretacion de

datos los terminos usados como valores (en el modelo relacional los valores de atributos)

son ambiguos.

El problema de integracion de informacion se deriva de los dos anteriores: cuando

datos de fuentes diferentes necesitan ser combinados e integrados en una unica coleccion

de datos, se requiere superar ambiguedades de la interpretacion de metadatos y datos. Ası,

en el resultado, cada campo descriptivo de metadato debe pertenecer a un vocabulario

definido explıcitamente y debe estar claro desde que vocabulario se toman los terminos

para comprender el significado de los mismos.

Page 165: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Interoperabilidad e Integracion para Informacion Geografica 139

6.4.2. Recuperacion de IG basada en ontologıa

Como vimos, encontrar y recuperar eficientemente IG heterogenea distribuida es un

factor clave. Las especificaciones de OGC favorecen la interoperabilidad sintactica y la

clasificacion de IG por catalogo. Los problemas causados por heterogeneidad semantica

constituyen aun un desafıo en recuperacion de IG para entornos abiertos distribuidos.

Las aproximaciones usando ontologıas para hacer conocida la informacion semantica de

fuentes de datos se pueden organizar de distintas maneras. En [WVV+01] se introducen

distintas arquitecturas usando ontologıas para integrar informacion (ver figura 6.5). En

lo que sigue se explican las distintas arquitecturas con referencia al dominio de IG.

La aproximacion de la figura 6.5-a) u ontologıa unica define una ontologıa global que

provee el vocabulario compartido para especificar la semantica de todas las fuentes de

informacion. Tal solucion se puede aplicar a problemas donde las descripciones semanti-

cas disponibles han sido creadas en el marco de una vision de dominio comun, tambien

compartido por los consumidores o clientes.

En contraste, en la aproximacion de la figura 6.5-b) o multiples ontologıas, cada fuente

de informacion esta descripta por su propia ontologıa local u ontologıa de aplicacion. Es

posible que una ontologıa local resulte de la combinacion de varias otras ontologıas. Sin

embargo, no se puede asumir que varias ontologıas locales compartan el mismo vocabu-

lario. La falta de un vocabulario comun hace difıcil comparar diferentes ontologıas de

aplicacion.

La aproximacion ontologıa hıbrida (figura 6.5 c)) tambien usa un vocabulario com-

partido global, que contiene los terminos basicos del dominio (primitivas). Estos pueden

ser combinados para describir las semanticas mas complejas de cada fuente de dato o

consulta, resultando en ontologıas de aplicacion separadas. En contraste con la propues-

ta multiples ontologıas, los conceptos de cada una de estas ontologıas de aplicacion son

comparables ya que estan fundados sobre las primitivas del vocabulario compartido.

Para los casos ontologıa unica y ontologıa hıbrida se asume que la semantica de las

primitivas es conocida y comprendida por los clientes y proveedores del dominio. En al-

gunos casos hasta es util representar al vocabulario compartido como una ontologıa de

dominio. La propuesta ontologıa hıbrida provee mayor flexibilidad para construir onto-

logıas de aplicacion [Buc09], mientras que al mismo tiempo las ontologıas de aplicacion

resultan comparables, lo que es crucial al momento de realizar busquedas semanticas.

Page 166: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

140 Capıtulo 6. Ontologıas para Informacion Geografica

Figura 6.5: Formas de usar ontologıas para incluir conocimiento

6.5. Diseno de ontologıas para informacion geografica

El diseno y definicion de ontologıas para IG es una actividad creativa compleja en

la que deben participar ingenieros de software, responsables de construir los modelos

semanticos, y especialistas del dominio encargados de definir, precisar y validar la defini-

cion conceptual del dominio. La dificultad no esta en la traduccion del modelo conceptual

a un lenguaje ontologico, sino en la construccion y validacion del modelo mismo. El di-

seno del modelo ontologico destaca el uso de los principios de ingenierıa de software de

generalidad, abstraccion y separacion de intereses [GJM02]. En esta seccion se presentan

consideraciones generales para construir y usar modelos ontologicos.

Page 167: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Diseno de ontologıas para informacion geografica 141

6.5.1. Creacion de ontologıas

La construccion de ontologıas de dominio necesita considerar la definicion de un esque-

ma conceptual general para uno o varios dominios de uso. Durante el diseno de ontologıas

de dominios, las relaciones o roles entre conceptos tienen un significado relevante y de-

berıan ser usados en la descripcion semantica siempre que fuera posible [SHW+04]. Esto

es, se deben incluir vınculos taxonomicos y no taxonomicos entre conceptos. De esta for-

ma, se pueden proveer significados conceptuales mas flexibles y precisos que los que tienen

con definiciones jerarquicas estaticas.

Ejemplo 6.5.1 Uso de roles en las definiciones semanticas.

Continuando con el ejemplo 6.4.1 sobre representacion de informacion para un proble-

ma hıdrico, entre los conceptos cantidad y fenomeno se podrıa anotar semanticamente

a cantidad como lo “observable” de fenomeno (figura 6.6).

En la figura 6.6 se muestra una representacion grafica usando notacion UML para dos

ontologıas de dominio relacionadas: mediciones e hidrologıa [Kli08]. Se observa que existen

asociaciones jerarquicas entre conceptos, representadas por relaciones es un, por ejemplo,

entre cantidad y su especializacion cantidad hıdrica. Tambien existen asociaciones

no jerarquicas o “por roles”, expresadas como asociaciones dirigidas con nombre, por

ejemplo, medida tiene por resultado a cantidad. La escala de colores esta asociada a

los conceptos donde estan definidos.

Por otra parte, el enfoque para disenar ontologıas de aplicacion esta en describir

semanticamente los conceptos que representan a los tipos de fenomenos geograficos de

la aplicacion. Esto es, representar la semantica de Feature Type. Los conceptos de la

ontologıa de aplicacion deberıan derivarse como subconceptos de los conceptos de alguna

ontologıa de dominio restringiendo su definicion. Esta estrategia asegura no solo informa-

cion explıcita sino tambien informacion implıcita derivada de la ontologıa de dominio. La

ontologıa de aplicacion no tiene que describir todas las relaciones semanticas posibles en

el area, sino describir en forma precisa y formal el contenido de su aplicacion.

La propuesta de integracion con ontologıas hıbridas trabaja definiendo ontologıas de

aplicacion y de dominio. Para explicarlo mejor vamos a utilizar el ejemplo de la figura 6.7

tomado de [Kli08]. Sobre la izquierda, siguiendo OGC Reference Model se observa la defini-

cion del esquema para fenomenos geograficos para ‘‘FT tierrasBajasInnundables’’en

Page 168: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

142 Capıtulo 6. Ontologıas para Informacion Geografica

Figura 6.6: Un ejemplo de ontologıas de dominio

GML. Esta definicion juega el rol de ontologıa de aplicacion. La aplicacion contara con

multiples instancias de ‘‘FT tierraBajaInnundable’’, en el grafico simbolizadas con

la imagen de un fenomeno real. A nivel de ontologıa de dominio el autor propone

una abstraccion superior a la que denomina categorıa. La ontologıa de dominio para

TierraInundada provee una caracterizacion formal para las entidades que pertene-

cen a dicha categorıa. Finalmente, establece la asociacion anotacion semantica entre

la ontologıa de dominio TierraInundada y la ontologıa de aplicacion del esquema

‘‘FT tierraBajaInnundable’’que representa al tipo de fenomeno tierraBajaInun-

dable definido por una aplicacion. La asociacion anotacion sematica no se define como

una relacion de taxonomıa porque el esquema de aplicacion y la categorıa de la ontologıa

de dominio describen entidades diferentes. Tambien se establecen enlaces categoriza entre

la ontologıa de dominio y las instancias de tierraBajaInundable.

Las anotaciones semanticas establecen vınculos entre tipo de fenomeno y categorıa, y

entre categorıa y fenomeno. La flexibilidad extra de la propuesta en [Kli08] esta en que

Page 169: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Diseno de ontologıas para informacion geografica 143

Figura 6.7: Asociaciones semanticas entre Fenomenos, Tipos de Fenomenos y Ontologıas

de Dominio

se permite a un mismo fenomeno asociarse por categorıa con mas de una ontologıa de

dominio. El la figura 6.8 se muestra como un mismo objeto es categorizado por distintas

ontologıas de dominio: TierraInundada, ZonaRecreativa, Habitat y TierrasBa-

jas. Cada categorıa de dominio conceptualiza su vision de dominio. De esta forma, un

fenomeno geografico exhibe las propiedades especificadas por su dueno ası como las cali-

dades y relaciones indirectamente definidas en alguna ontologıa de dominio. Por ejemplo,

si una zona inundable esta cercana a un rıo, en el caso de que una zona inundable tambien

juegue el rol de area recreativa estara tambien proxima a un rıo.

6.5.2. Cohesion entre una aplicacion y una ontologıa de dominio

A partir de lo visto en la seccion anterior, la propuesta de integracion con ontologıa

hıbrida se muestra la figura 6.9. Cada aplicacion cuenta con su ontologıa de aplicacion, la

que eventualmente podrıa estar compartida por mas de una aplicacion en la medida que

la definicion conceptual de tipos de fenomenos sea compartida. A mayor nivel de genera-

Page 170: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

144 Capıtulo 6. Ontologıas para Informacion Geografica

Figura 6.8: Vistas multiples de un fenomenos geograficos

lidad se ubican las ontologıas de dominio que, como se vio, modelan la conceptualizacion

semantica consensuada por el dominio de uso. Esta propuesta supone la existencia de on-

tologıas de dominio de forma que cada aplicacion que requiera compartir IG se encargue

de definir la conexion entre su ontologıa de aplicacion y la/las ontologıa de dominio.

A continuacion se propone una tecnica para determinar el grado de interrelacion o

cohesion entre una ontologıa de dominio y un problema particular. En particular, nos

interesa la relacion de cohesion que existe entre los conceptos definidos por una ontologıa

de dominio y los conceptos de la ontologıa de aplicacion de un SIG.

Si bien las definicion de nivel de cohesion no esta formalizada, para ganar en rigu-

rosidad se presenta la siguiente definicion: sea CSIG el conjunto de conceptos definidos

en la ontologıa de aplicacion de un SIG y COD el conjunto de conceptos definidos por

la ontologıa de dominio, podemos identificar el nivel de cohesion entre el sistema y la

ontologıa segun las siguientes relaciones de pertenencia entre los conjuntos:

CSIG ⊆ COD ∧ |CSIG| ≈ |COD|, se presenta como una situacion de maxima cobertu-

ra de la ontologıa de dominio y alta precision. Representa la relacion optima entre

ontologıa y SIG. Se trata del caso para el cual la ontologıa de dominio cubre los con-

ceptos requeridos por la aplicacion. La ontologıa contiene las definiciones semanticas

requeridas y su semantica se aproxima a las necesidades del problema.

Page 171: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Diseno de ontologıas para informacion geografica 145

Figura 6.9: Integracion entre aplicaciones usando ontologıa hıbrida

CSIG ⊂ COD ∧ ¬(|CSIG| ≈ |COD|), se presenta como una situacion de maxima

cobertura, pero de baja precision. La relacion entre ontologıa de dominio y SIG se

puede definir como “buena”. En este caso tambien la ontologıa cubre los conceptos

requeridos por la aplicacion. Sin embargo, el contenido semantico de la ontologıa

no esta proximo al contenido semantico requerido por el SIG y potencialmente es

menos preciso.

COD ⊂ CSIG. La ontologıa de dominio no cubre el universo de conceptos requeridos

por la aplicacion. Para ciertos conceptos definidos por el SIG no existen conceptos

relacionados en la ontologıa de dominio, esto es, existen conceptos en el SIG que

no mapean a conceptos de la ontologıa. La relacion ontologıa−SIG no es buena.

Cuanto mayor sea el numero de conceptos que no estan en COD peor es la relacion.

Una solucion puede ser usar mas de una ontologıa de dominio para cubrir todos los

conceptos.

¬(CSIG ⊂ COD∨COD ⊂ CSIG)∧(CSIG∩COD) 6= �, de ambos lados existen conceptos

que no mapean en el otro universo, con lo que se puede afirmar que ambos conjuntos

no modelan el mismo dominio del problema. Como en el caso anterior se pueden

considerar usar mas de una ontologıa de dominio. Si se usa mas de una ontologıa

de dominio es importante que entre ellas no compartan la definicion de conceptos.

Page 172: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

146 Capıtulo 6. Ontologıas para Informacion Geografica

Figura 6.10: Cohesion: Ontologıa de Aplicacion y Ontologıa de Dominio

En la figura 6.10 se muestra una representacion grafica de estas relaciones.

6.6. Sistemas de Informacion Geografica conducidos

por ontologıas

Hoy dıa existen numerosas aplicaciones SIG que colaboran con el trabajo cotidiano de

empresas, organismos gubernamentales y educativos y de casi cualquier otro ambito de

Page 173: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Sistemas de Informacion Geografica conducidos por ontologıas 147

aplicacion. Generalmente estas aplicaciones cuentan en sus bases de informacion con datos

geograficos acumulados por varios anos. La informacion acumulada resulta una fuente de

conocimiento que en muchos casos tambien serıa importante poder compartir y relacionar.

En un sentido figurado, todo SIG cuenta con su propia ontologıa de aplicacion desde

el momento en que le asocia significado a los sımbolos que usa para representar su vision

particular de un problema, la que ademas, esta aceptada por la comunidad que utiliza la

aplicacion. El problema esta en que existen muchas de estas ontologıas para usos super-

puestos. Esto es, cada una de estas ontologıas de aplicacion es de generalidad acotada a

su entorno de uso. Por otra parte, en cuanto a expresividad tambien son pobres y muchas

veces el significado de los conceptos no esta explıcito. Todo esto lleva a que a pesar de

la cantidad de datos que existen y de que muchas organizaciones estan interesadas en

compartirlos, se hace difıcil cualquier intento por integrarlos.

En forma paralela, la definicion de ontologıas con distintos niveles de generalidad y

expresividad sigue avanzando, buscando satisfacer las necesidades de la web semantica y

el analisis de la informacion a traves de agentes automaticos. A continuacion se muestran

y analizan las distintas alternativas de participacion de ontologıas en el ciclo de vida de

un sistema.

6.6.1. El ciclo de vida del sistema

Si se considera el estado del arte en SIG, existen incontables sistemas funcionando que

dan soporte a millones de usuarios y que fueron disenados bajo sus propias definiciones

de conceptos no estandares. Estos sistemas perduran en el tiempo produciendo muchos de

los datos que interesa relacionar, analizar y disponer de su contenido semantico. Por otra

parte, la dinamica en el ambito de produccion de sistemas indica que constantemente

surgen nuevos proyectos de desarrollo. Los nuevos sistemas cubren las necesidades no

satisfechas hasta el momento o reemplazan a viejos sistemas adecuandolos a las nuevas

alternativas tecnologicas. Estas nuevas ofertas tambien son generadoras de datos con las

mismas necesidades de informacion semantica explıcita.

De lo anterior se puede inferir que una ontologıa consensuada, con conceptos, relacio-

nes y definiciones semanticas surge mientras diversas aplicaciones SIG que comparten su

dominio transitan por diferentes estadios de sus ciclos de vida. Ası, el rol de una ontologıa

en SIG se puede analizar bajo las siguientes situaciones:

Page 174: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

148 Capıtulo 6. Ontologıas para Informacion Geografica

Desarrollar una nueva aplicacion SIG siguiendo una o mas ontologıas de dominios

existentes.

Vincular un SIG en produccion con una o mas ontologıas que surgieron posterior-

mente al sistema.

Para el analisis se tienen en cuenta la clasificacion de ontologıas segun el nivel de

generalidad presentada en la seccion 6.3.1.

6.6.2. Inclusion de ontologıas en la etapa de desarrollo

Ontologıas de dominio

Dado el caso de un nuevo proyecto SIG, existe al menos una ontologıa de domi-

nio/tarea cuyo contenido semantico se adecua al requerido por la nueva aplicacion. En

este entorno, incluir en las etapas analisis, diseno y desarrollo actividades de conciliacion

con la/s ontologıa/s de dominio previas sera altamente favorable para el resultado final.

El contenido semantico de la/s ontologıa/s involucradas se trasladara al SIG, donde facil-

mente se reducen costos y tiempos de analisis conceptual y se asegura la creacion de un

SIG que a posteriori se integrara naturalmente con otros sistemas de su comunidad con

los que comparta definiciones semanticas. Desde lo tecnico, favorece equipos de desarrollo

con habilidades para pensar en terminos de generalidad, reutilizacion y mecanismos para

compartir conocimiento del area de aplicacion y vocabulario estandarizado entre diversas

plataformas. Se dice que el SIG resultante es conducido por la ontologıa, y el sistema se

encuadra en un componente clasificado como ontologıa de aplicacion.

El punto desfavorable es que aun no existen ontologıas consensuadas de dominio y/o

tarea para la mayor parte de los problemas de aplicacion con IG. El escenario planteado

es difıcil de alcanzar. Tambien es cierto, que la de inclusion de ontologıas en la fase de

desarrollo del sistema aun no esta incorporada como una practica estandar en los modelos

de proceso de desarrollo.

Ontologıas de nivel general

Esta situacion se presenta en el caso de nuevo proyecto de desarrollo para el que

existe al menos una ontologıa de alto nivel cuyos conceptos se ajustan a los tipos de

Page 175: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Resumen del capıtulo 149

datos requeridos por el SIG. En la practica, este entorno comparado con el anterior, es

mas factible de lograr. Existen ontologıas de nivel general que se adecuan a distintos

entornos de problemas: un ejemplo son las definiciones ISO 19107, 19108, 19110 y en

general catalogos como GEMET [EEA01]. Igual que en la situacion anterior, disenar desde

el principio el SIG exigiendo que se ajuste a las definiciones provistas por la ontologıa de

nivel general sera favorable para el resultado final del proyecto y su futura integracion con

otros sistemas. Tambien es cierto que es mas simple de aceptar y comprender el alcance de

las ontologıas de nivel general. El conocimiento semantico de estas ontologıas es reducido

y de buena calidad. La ontologıa cumple el rol de asegurar un nivel de abstraccion logico

para administrar objetos con atributos que pertenecen a un dominio no trivial, como

si fuera un TDA. Al momento de buscar integrar aplicaciones que pertenecen al mismo

dominio, esta situacion simplificara el trabajo, pero no garantizara que compartan el

significado conceptual de los fenomenos.

6.6.3. Vinculacion de un SIG en produccion con nuevas onto-

logıas

La inclusion de ontologıas a un sistema que esta en produccion es la propuesta para

permitir la comunicacion de componentes de software existentes en terminos ontologicos.

En este punto es cuando efectivamente se requiere de la integracion del SIG y la ontologıa.

Para ello es necesario mapear los conceptos definidos en el SIG primero al diseno de su

propia ontologıa de aplicacion, para luego relacionarlos con los conceptos de la ontologıa

de dominio. Si el SIG desarrollado mantiene concordancia semantica con los terminos de la

ontologıa, la relacion sera mas directa estableciendo los mapeos necesarios; de lo contrario,

se requerira de la definicion de mapeos parciales entre conceptos, que dependiendo del caso

podran o no ser exactos y causar cierto grado de perdida de informacion.

6.7. Resumen del capıtulo

La Web Semantica Geografica se relaciona con las calidades de interoperabilidad e

integracion de servicios y datos geograficos. Hoy en dıa existen numerosas fuentes distri-

buidas con IG heterogenea. Es una necesidad poder evaluar, combinar y reusar los recursos

Page 176: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

150 Capıtulo 6. Ontologıas para Informacion Geografica

geograficos en forma transparente. Para que esto sea posible se deben enriquecer los mo-

delos de datos y servicios con su significado semantico y estas definiciones semanticas

deberıan ser interpretadas por agentes automaticos.

Una propuesta de solucion esta dada por el uso de ontologıas. En Ciencias de la

Computacion las ontologıas sirven para especificar formalmente el significado que se le

asigna a los conceptos que modela un programa o sistema. La especificacion formal y

explıcita permite que el conocimiento que tiene dicha aplicacion se pueda compartir y

reutilizar. Ademas, si la especificacion es formal, es posible navegar el modelo semantico

permitiendo que agentes automaticos no solo capturen las definiciones explıcitas sino

tambien que pueden hacer inferencias u obtener conocimiento implıcito.

El problema esta en que el conocimiento semantico de la ontologıa debe ser consen-

suado y aprobado por toda la comunidad de uso. Esto, en general, es difıcil de alcanzar,

especialmente si ya existen aplicaciones con sus propias definiciones conceptuales que no

pueden dejarse de utilizar. La solucion a este inconveniente esta en organizar los conceptos

en distintas ontologıas clasificadas por generalidad. Ası se definen ontologıas genericas,

ontologıas de dominio y ontologıas de aplicacion (seccion 6.3.1). Existen diversos modelos

de integracion basados en el uso de ontologıas (seccion 6.4.2). El modelo de integracion

mas flexible es el de ontologıa hıbrida que establece al menos dos niveles ontologicos conec-

tados: el nivel de aplicacion y el nivel de dominio. Aun no existen definiciones ontologicas

para muchos de los dominios de la IG. Para el diseno de modelos ontologicos se requiere de

un trabajo interdisciplinario que destaque el uso de los principios de generalidad, abstrac-

cion y separacion de intereses (seccion 6.5). El diseno de ontologıas de aplicacion requiere

la adopcion de estandares en la definicion de los esquemas de los tipos de fenomenos y su

vinculacion con los conceptos definidos por la ontologıa de dominio.

Finalmente en este capıtulo se elaboro un criterio para determinar el grado de cohesion

entre las definiciones semanticas que provee una ontologıa de dominio y los conceptos

definidos por un SIG. Para lograr un nivel de integracion optimo con mınima perdida de

informacion se requiere encontrar y establecer conexiones semanticas con ontologıas de

dominio con las que exista buena cohesion (no siempre disponibles). Una forma de lograr

esto a futuro sera mediante el desarrollo de nuevas aplicaciones que consideren desde su

diseno la vinculacion con ontologıas de dominio existentes. Esto se conoce como desarrollo

de sistemas conducidos por ontologıas.

Page 177: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Capıtulo 7

Conclusiones y Trabajos Futuros

En el capıtulo final de esta tesis, se hace un analisis sobre las conclusiones y principales

aportes de la investigacion realizada para este proyecto. En primer lugar, se presenta un

resumen con los puntos principales de estudio y como fueron abordados. En la segunda

seccion se retoman los objetivos presentados en el capıtulo 1 y se analizan los resultados

obtenidos. En tercer lugar, se presentan las contribuciones teoricas producidas en esta

investigacion. En la ultima seccion del capıtulo se presentan las lıneas de investigacion

futura que quedan abiertas a la investigacion.

7.1. Resumen de la investigacion

Los sistemas con gestion de IG han ganado relevancia en las ultimas decadas. Muchas

aplicaciones usadas en ambitos industriales, gubernamentales y educativos tienen a la IG

como componente central. Para muchos otros sistemas las tecnologıas de gestion de IG

resultan un valor agregado que no se habıa considerado previamente [Lua04] por ejemplo,

si se decide incorporarles servicios basados en ubicacion.

La IG es un tipo especial de informacion que no se representa, manipula y visualiza con

los metodos tradicionales usados por los SI. Al comienzo de esta investigacion se realizo un

trabajo de recopilacion de las soluciones propuestas para representar IG, desde lo mas

concreto, como son los modelos de representacion fısica, hasta lo mas conceptual. Esto

permitio comprender las necesidad de los SIG de contar con las dos conceptualizaciones del

espacio: basada en objetos y basada en campos (seccion 2.2), cada una de ellas apropiada

Page 178: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

152 Capıtulo 7. Conclusiones y Trabajos Futuros

para distintas familias de problemas y con diferentes representaciones y capacidades para

consultas y analisis espacial.

Luego, el segundo orden de prioridades en la investigacion fue estudiar y caracterizar

a las tecnologıas SIG y sus aplicaciones. La investigacion se abordo desde distintos enfo-

ques: desde la vision de la arquitectura, identificando organizacion y componentes; desde

la vision funcional, clasificando los servicios esperados de un SIG y desde los modelos de

datos espaciales y sus capacidades de analisis espacial. Se consiguio ampliar el conoci-

miento sobre las necesidades y usos de la tecnologıa SIG, abstraer las particularidades

y comprender las exigencias de los modelos de representacion en cuanto a generalidad,

abstraccion y reutilizacion (capıtulo 3).

Las primeras aplicaciones SIG surgieron en la decada del ‘70 y fueron pensadas como

soluciones particulares autonomas e independientes. En particular, cada SIG definio sus

formatos de representacion y almacenamiento para los datos geograficos espaciales. Esto

naturalmente represento una dificultad extra al pretender avanzar hacia la interoperabi-

lidad e integracion de sistemas heterogeneos. Actualmente, el Consorcio OpenGIS y el

Comite Tecnico ISO 211 trabajan en la especificacion de estandares para la representa-

cion, manipulacion y visualizacion de IG que permiten disenar aplicaciones SIG que usen

estandares. Las exigencias en estandarizacion e interoperabilidad son muchas y se traba-

ja en paralelo desde diversos frentes. Como parte del trabajo de esta tesis se estudio el

estado del arte, los resultados alcanzados, usos y avances en cuanto a la integracion de

informacion espacial (capıtulo 5.2).

El analisis anterior nos permitio determinar que las soluciones basadas en estandares

para la gestion de IG no son suficientes para alcanzar los siguientes objetivos en cuanto

interoperabilidad e integracion de sistemas con gestion de IG:

Aprovechar el potencial de los entornos de servicios web.

Aumentar el numero de fuentes de IG accesible.

Interpretar correctamente el significado de los datos provistos por los usuarios.

Buscar, recuperar e integrar informacion es un proceso de comunicacion que involucra

al cliente y a uno o varios proveedores. En este proceso de comunicacion se espera que el

cliente y los proveedores interactuen de forma transparente. En el capıtulo 6 se estudiaron

Page 179: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Resultados obtenidos 153

las propuestas basadas en ontologıas para resolver los problemas que surgen de concep-

tualizaciones diferentes, terminologıa, contexto y perdida de informacion considerando la

representacion formal y explıcita del significado de los datos.

7.2. Resultados obtenidos

Para esta seccion vamos a retomar los objetivos planteados en el capıtulo 1 y analizar

a partir de ellos resultados alcanzados. Recordemos que el objetivo principal definido para

este trabajo fue:

“Estudiar los modelos de representacion para IG con el fin de establecer las necesidades

de descripcion semantica que permitiesen avanzar hacia mejorar la disponibilidad de la

IG en entornos heterogeneos distribuidos”.

En el camino hacia el objetivo se plantearon las siguientes metas parciales, de las que

vamos ir presentando brevemente los aportes surgidos:

1. Estudiar las particularidades de la IG.

En esta parte de la investigacion se caracterizaron y explicaron las dos concep-

tualizaciones posibles para el espacio geografico: basada en campos y basada

en objetos, segun las interpretaciones del espacio geografico discreto o continuo

respectivamente (seccion 2.2).

Se definio al fenomeno geografico como la unidad de modelado en un SIG. Se

analizaron sus requerimientos particulares como elemento de abstraccion para

incidentes geograficos reales: necesidades de atributos descriptivos y atributos

espaciales, representacion geometrica y relaciones y operaciones espaciales de

composicion, geometricas y topologicas (secciones 2.2.1 y 3.2).

2. Estudiar los modelos de representacion para IG existentes, organizandolos segun su

nivel de abstraccion.

Al inicio de la investigacion se recopilo y analizo un numero importante de

material y publicaciones de estudio sobre modelos de datos espaciales. Como

Page 180: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

154 Capıtulo 7. Conclusiones y Trabajos Futuros

experiencia personal, para quien aborda por primera vez el tema de investiga-

cion “modelos de representacion de IG”, se encuentra mucha informacion pero

poco organizada.

Como parte del trabajo de esta tesis se propone y concreta la organizacion de

los modelos recopilados a partir de considerar a los SIG con un tipo de SI que

administra datos persistentes, con informacion geo-referenciada y caracterısti-

cas geometricas. Ası se estudiaron y clasificaron los modelos de datos segun

la organizacion que ofrece el area de bases de datos: modelos fısicos, modelos

logicos y modelos conceptuales (capıtulo 2). Ordenar los modelos en grados de

abstraccion contribuyo en cuanto a organizar, comprender y presentar cada uno

de los modelos, concentrando su descripcion en su usabilidad y abstrayendolos

de las responsabilidades de los modelos de otro nivel de abstraccion.

3. Identificar la necesidades y dificultades en integracion de IG.

Los requerimientos de integracion e interoperabilidad para entornos hete-

rogeneos incluyen encontrar o capturar a los posibles proveedores de la infor-

macion requerida e integrar IG o administrar la informacion de los proveedores

de acuerdo a las necesidades propias. Encontrar y recuperar en forma eficiente

IG distribuida es un factor clave en el planeamiento y soporte de decision para

una variedad de dominios.

Para los problemas que administran IG se identificaron los problemas de in-

tegracion y se organizaron las dificultades en tres niveles: problemas de re-

presentacion, problemas sintacticos y problemas semanticos (secciones 4.2.1 y

4.3).

4. Relevar el estado actual del arte en estandarizacion de IG y las posibilidades de

integracion basada en estandares.

Los requerimientos de estandarizacion para IG digital, transferencia de datos

y servicios resurgen principalmente con la industria IDE y los LBS. Los resul-

tados en estandarizacion han significado que los entornos web para IG hayan

aumentado considerablemente.

Como parte de esta investigacion se estudiaron y presentaron resultados en

estandares relacionados con los modelos de representacion de IG conducidos

Page 181: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Publicaciones 155

por los organismos internacionales OGC e ISO. Desde sus ambitos y siguiendo

un trabajo colaborativo, ambas organismos definen formas normalizadas para

servicios, catalogos y metadatos y representacion datos geograficos (capıtulo

4).

5. Relevar el estado actual del arte en definicion de ontologıas para IG y sus posibili-

dades de integracion semantica.

Los catalogos, formatos y metadatos definidos por los estandares mejoran la

recuperacion e integracion de informacion. Sin embargo, hacer geo-disponible

los datos y servicios geograficos requiere de metadatos semanticos interpreta-

bles por los clientes. Una forma de incluir informacion semantica es a traves

del uso de ontologıas. En este capıtulo se realizaron las siguientes tareas:

• Se reunieron las definiciones y uso de ontologıas relacionados con IG (sec-

cion 6.1).

• Se caracterizaron las ontologıas para SIG segun el nivel de generalidad

(seccion 6.3.1).

• Se identificaron posibles arquitecturas para sistemas de integracion basados

en ontologıa (seccion 6.4.2).

• Se presentaron las consideraciones para el diseno de ontologıas de dominio

y ontologıas de aplicacion (seccion 6.5).

• Se elaboro una propuesta para identificar el nivel de cohesion entre una

ontologıa de dominio y la ontologıa de aplicacion de un desarrollo particular

(seccion 6.5.2).

• Se evaluaron las posibilidades de considerar ontologıas en el proceso de

desarrollo de SIG y el impacto sobre integracion e interoperabilidad (sec-

cion 6.6).

7.3. Publicaciones

Como parte de esta investigacion se realizaron las siguientes presentaciones a Congre-

sos y Workshops:

Page 182: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

156 Capıtulo 7. Conclusiones y Trabajos Futuros

“Integracion de Sistemas de Informacion Geografica”[MV10]. Este trabajo presenta

resultados en estandarizacion, plantea problemas semanticos y soluciones basadas

en ontologıas con incorporacion de informacion semantica.

“Interoperabilidad y Estandares de Datos para Informacion Geografica”[VF08]. Este

trabajo se centra en presentar resultados en estandarizacion para IG de la familia

normativa ISO 19100, desarrollados por el Comite Tecnico ISO/TC 211 y por Open

Geospatial Consortium (OGC) desde la industria y sus usos.

“Modelos de Datos Espaciales” y “Modelos de Datos para Datos Espaciales”

[VCM05, VFC03]. Estos trabajos resumen la recopilacion realizada sobre modelos

de datos para IG. En [VFC03] se resumen los modelos de representacion logicos, ca-

racterısticas, y su comportamiento en consultas especiales. En [VCM05] se presenta

la taxonomıa de modelos por niveles de abstraccion.

“Interfaces en la Visualizacion de Informacion” [DLCMT02]. Este trabajo se escri-

bio en el ambito de un grupo de investigacion sobre Visualizacion. Si bien no se

relaciona directamente con los temas de esta tesis, a partir de la investigacion en

tecnicas de visualizacion, se disparo el interes en conocer los modelos de represen-

tacion de IG con el fin de estudiar la visualizacion y la exploracion de colecciones

de informacion espacial.

7.4. Trabajo Futuro

La mayor parte del trabajo de investigacion realizado en esta tesis consistio en la

recopilacion y organizacion de informacion distribuida en diversos materiales de estudio

sobre modelos de representacion de informacion espacial referidos al dominio de la IG,

con el objetivo de caracterizar los requerimientos para la representacion de informacion

semantica.

Este trabajo partio del estudio de un dominio de aplicacion desconocido y del estu-

dio de ontologıas para SI y su generalizacion hacia ontologıas para SIG. Como parte de

este estudio se elaboraron los siguientes resultados propios que requieren del desarrollo e

investigacion futura:

Page 183: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Trabajo Futuro 157

Se identifico la propuesta de integracion de informacion basada en la arquitectura de

ontologıa hıbrida como la mas flexible y se planteo su personalizacion a SIG usando

ontologıas de dominio geografico y ontologıas de aplicacion que respeten el estandar

GFM de ISO 19109. Se planteo ademas una propuesta de diseno para las ontologıas

de esquemas de aplicacion de tipos de fenomeno y sus relaciones semanticas con

la o las ontologıas de dominio. Queda abierto como trabajo futuro experimentar en

aplicaciones del dominio geografico la propuesta de diseno de ontologıas de aplicacion

para tipos de fenomenos.

La implementacion de integracion usando la arquitectura de ontologıa hıbrida re-

quiere identificar para una aplicacion una o mas ontologıas de dominio. En este

trabajo se propuso una tecnica empırica para medir el nivel de interrelacion entre

una ontologıa de aplicacion y una ontologıa de dominio. Esta clasificacion esta ba-

sada unicamente en la experiencia personal en el desarrollo y migracion de sistemas.

Queda propuesto como trabajo futuro profundizar y formalizar la propuesta para

poder medir nominalmente la cohesion entre una ontologıa de dominio y un SIG.

Alcanzar resultados en este sentido puede constituir un aporte significativo a la

investigacion.

Se analizaron las posibilidades de incluir el uso de modelos ontologicos en las distin-

tas etapas del ciclo de vida de un SIG. Para desarrollos futuros se deberıa preveer

la construccion del sistema considerando las definiciones semanticas de uno o mas

modelos ontologicos de dominio. Como en el punto anterior, en esta tesis se anali-

zaron y presentaron las distintas posibilidades, junto con sus ventajas y desventajas

a partir de la experiencia empırica. Queda propuesto como tema de investigacion

futuro formalizar para cada una de las actividades de desarrollo su vinculacion con

los modelos ontologicos y definir lo que serıa un modelo de proceso de ingenierıa de

software incluyendo ontologıas.

Page 184: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,
Page 185: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Apendice A

Ejmplo GML

En esta seccion se transcribe la definicion complete en GML de figura A La figura

muestra un modelo conceptual para una aplicacion que incluye a los fenomenos Parcela

(Parcel), Construccion (Building) y Persona (Person). Parcela es un tipo

de fenomeno geografico que esta relacionado por asociacion de propiedad con Persona

y por agregacion con el fenomeno geografico Construccion.

A.1. Definicion GML del Esquema de Aplicacion

Mapa Urbano

<?xml version="1.0" encoding="UTF-8"?>

<schema targetNamespace="http://www.someorg.de/example"

xmlns="http://www.w3.org/2001/XMLSchema" xmlns:ex="http://www.someorg.de/example"

xmlns:gml="http://www.opengis.net/gml/3.2" elementFormDefault="qualified" version="1.0">

<!-- ================================== -->

<import namespace="http://www.opengis.net/gml/3.2" schemaLocation="./gml.xsd"/>

<import namespace="http://www.w3.org/1999/xlink" schemaLocation="./xlinks.xsd"/>

<!-- ================================== -->

<!-- Parcela - AbstractFeature -->

<element name="Parcel" substitutionGroup="gml:AbstractFeature">

<complexType>

<complexContent>

<extension base="gml:AbstractFeatureType">

Page 186: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

160 Apendice A. Ejmplo GML

Figura A.1: Ejemplo de esquema de aplicacion Mapa Urbano

Page 187: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Definicion GML del Esquema de Aplicacion Mapa Urbano 161

<sequence>

<element name="area" type="gml:AreaType"/>

<element name="extent" type="gml:SurfacePropertyType"/>

<element name="owner" type="ex:PersonPropertyType" maxOccurs="unbounded">

<annotation>

<appinfo><gml:reverseProperty>ex:owns</gml:reverseProperty></appinfo>

</annotation>

</element> <element name="hasBuilding" type="ex:BuildingPropertyType" minOccurs="0" maxOccurs="unbounded"/>

</sequence>

</extension>

</complexContent>

</complexType>

</element>

<complexType name="ParcelPropertyType">

<sequence minOccurs="0">

<element ref="ex:Parcel"/>

</sequence>

<attributeGroup ref="gml:AssociationAttributeGroup"/>

<attributeGroup ref="gml:OwnershipAttributeGroup" />

</complexType>

<!-- ================================== -->

<!-- Construccion - AbstractFeature -->

<element name="Building" substitutionGroup="gml:AbstractFeature">

<complexType>

<complexContent>

<extension base="gml:AbstractFeatureType">

<sequence>

<element name="extent" type="gml:SurfacePropertyType"/>

<element name="address">

<complexType>

<sequence>

<element name="Address" type="ex:AddressType"/>

</sequence>

</complexType>

</element>

<element name="type" type="ex:BuildingTypeType"/>

</sequence>

</extension>

</complexContent>

Page 188: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

162 Apendice A. Ejmplo GML

</complexType>

</element>

<complexType name="BuildingPropertyType">

<sequence minOccurs="0">

<element ref="ex:Building"/>

</sequence>

<attributeGroup ref="gml:AssociationAttributeGroup"/>

<attributeGroup ref="gml:OwnershipAttributeGroup" />

</complexType>

<!-- ================================== -->

<!-- Persona - AbstractFeature -->

<element name="Person" substitutionGroup="gml:AbstractFeature">

<complexType>

<complexContent>

<extension base="gml:AbstractFeatureType">

<sequence>

<element name="firstName" type="string"/>

<element name="lastName" type="string"/>

<element name="owns" type="ex:ParcelPropertyType" minOccurs="0" maxOccurs="unbounded">

<annotation>

<appinfo><gml:reverseProperty>ex:owner</gml:reverseProperty></appinfo>

</annotation>

</element>

</sequence>

</extension>

</complexContent>

</complexType>

</element>

<complexType name="PersonPropertyType">

<sequence minOccurs="0">

<element ref="ex:Person"/>

</sequence>

<attributeGroup ref="gml:AssociationAttributeGroup"/>

<attributeGroup ref="gml:OwnershipAttributeGroup" />

</complexType>

<!-- ================================== -->

<complexType name="AddressType">

<sequence>

Page 189: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Definicion GML del Esquema de Aplicacion Mapa Urbano 163

<element name="street" type="string" minOccurs="0"/>

<element name="housenumber" type="string" minOccurs="0"/>

<element name="poBox" type="string" minOccurs="0"/>

<element name="city" type="string"/>

<element name="postalCode" type="string"/>

<element name="country" type="ex:CountryCodeType" minOccurs="0" default="DE"/>

</sequence>

</complexType>

<!-- ================================== -->

<simpleType name="BuildingTypeType">

<restriction base="string">

<enumeration value="church"/>

<enumeration value="school"/>

<enumeration value="garage"/>

<enumeration value="residential houses"/>

<enumeration value="unknown"/>

<enumeration value="mixed"/>

</restriction>

</simpleType>

<!-- ================================== -->

<simpleType name="CountryCodeType">

<union memberTypes="ex:CountryCodeEnumerationType ex:CountryCodeOtherType"/>

</simpleType>

<simpleType name="CountryCodeEnumerationType">

<restriction base="string">

<enumeration value="DE"/>

<enumeration value="US"/>

<enumeration value="CA"/>

<enumeration value="..."/>

</restriction>

</simpleType>

<simpleType name="CountryCodeOtherType">

<restriction base="string">

<pattern value="other: \w{2,}"/>

</restriction>

</simpleType>

<!-- ================================== -->

<element name="Ellipse" type="ex:EllipseType" substitutionGroup="gml:AbstractCurveSegment"/>

<complexType name="EllipseType">

<complexContent>

<extension base="gml:AbstractCurveSegmentType">

Page 190: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

164 Apendice A. Ejmplo GML

<sequence>

<element name="center" type="gml:DirectPositionType"/>

<element name="semiminor" type="gml:VectorType"/>

<element name="semimajor" type="gml:VectorType"/>

</sequence>

</extension>

</complexContent>

</complexType>

</schema>

Page 191: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Apendice B

Abreviaturas y Acronimos

GML (GML)1: Lenguaje de Marcado Geografico.

IDE (SDI): Infraestructuras de Datos Espaciales.

IG (GI): Informacion Geografica.

ISO/TC 211: Comite Tecnico Internacional para Estadarizacion de IG.

MER (ERM): Modelo Entidad Relacion.

SMBL (LBMS): Sistemas Moviles Basados en Localizacion.

SBL (LBS): Servicios Basados en la Localizacion.

MADS: Modeling of Application Data with Spatio-temporal features. Lenguaje de

modelado para aplicaciones geograficas.

OMT: Obejet-Oriented Modeling Technique. Lenguaje de modelado.

OMT-G: Object-Oriented Data Model for Geographic Applications. Lenguaje de mo-

delado para aplicaciones geograficas.

SI (IS): Sistema de Informacion.

SIG (GIS): Sistema de Informacion Geografico.

SMBD (DBMS): Sistema de Gestion (Manejo) de Bases de Datos.

SMBDE (SDBMS): Sistema de Gestion (Manejo) de Bases de Datos Espaciales.

1Acronimo en Ingles

Page 192: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

166 Apendice B. Abreviaturas y Acronimos

SMBDROO (ORDBMS): Sistema de Gestion (Manejo) de Bases de Datos Rela-

cionales Orientadas a Objetos.

TDAE (SADT): Tipo de Dato Abstracto Espacial.

UML: Lenguaje Unificado de Modelado.

XML: Lenguaje de Marcado Extensible.

Page 193: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Apendice C

Glosario

En esta seccion se incluyen definiciones en lenguaje natural para algunos terminos de

uso frecuente en el entorno de SIG y con las interpretaciones usadas en el desarrollo de

este trabajo de tesis:

A,B,C

Arquitectura de ontologıa hıbrida − define un vocabulario compartido global con los

terminos del dominio (primitivas). Estos se vinculan con las semanticas de aplicacion

de cada fuente de informacion.

Arquitectura de ontologıa multiple − cada fuente de informacion define su ontologıa

local u ontologıa de aplicacion.

Arquitectura de ontologıa unica − define una unica ontologıa global que provee el

vocabulario compartido para especificar la semantica de todas las fuentes de infor-

macion.

Bases de Datos Espaciales − son un tipo de base de datos basada en un modelo de

datos espacial.

Ciclo de vida del sistema − define los estadios por los que transcurre el desarrollo de

sistema particular, desde la concepcion del mismo, pasando por las actividades de

analisis, diseno, implementacion y mantenimiento, hasta que se deja de usar.

Page 194: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

168 Apendice C. Glosario

D,E,F

Dato Geografico − informacion relativa a una locacion en la superficie terrestre.

Dato Espacial − informacion relativa a una locacion en un plano. Un dato geografico

es una especializacion para dato espacial.

Esquema conceptual de aplicacion − el esquema de base de datos conceptual que

surge de del diseno del modelo conceptual representado usando las abstracciones de

un lenguaje de representacion conceptual.

Esquema logico de aplicacion − esquema de base de datos logico o discreto. Surge de

la traduccion de cada elemento del esquema conceptual de aplicacion a su corres-

pondiente abstraccion en el modelo discreto usando los componentes de un lenguaje

de modelado logico.

Fenomeno (feature) − objeto geografico distinguible de otros. Por ejemplo, el parque

nacional “Los Arrayanes” es un fenomeno del conjunto de fenomenos “parques”.

Los fenomenos se describen por atributos tradicionales y atributos espaciales.

G,H,I

General Feature Model GFM − Modelo de Fenomeno General. Definido por ISO

19109. Proporciona la descripcion formal para el esquema de datos, la descripcion

general de los elementos tipo de fenomeno y sus atributos.

Geography Markup Language - GML − lenguaje de marcado basado en XML defi-

nido para transportar IG y su definicion sintactica a traves de la red. GML cuenta

con capacidades para describir objetos geograficos complejos. Fue desarrollado en el

marco OGC y esta basado en OpenGIS Abstract Specification y la serie ISO 19100

de ISO/TC 211.

GPS − Sistema de posicionamiento global.

Heterogeneidad Estructural − se relaciona con la forma en que dos soluciones repre-

sentan los modelos mentales usando distintos atributos descriptivos.

Page 195: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

169

Heterogeneidad Semantica − considera el “significado” de cada elemento de infor-

macion. La heterogeneidad semanticos ocurre cuando en contextos diferentes no se

utilizan las mismas interpretaciones. Se requiere de reglas de integracion semantica

para encontrar las correspondencias o “mapeos” entre los modelos.

Heterogeneidad Sintactica − cuando dos soluciones almacenan sus datos bajo mode-

los de representacion diferentes. Se refiere al modelo de datos utilizado.

Integracion de informacion − se refiere a la necesidad de compartir datos entre siste-

mas heterogeneos. Mas especıficamente informacion, esto es datos y su significado.

Interoperabilidad − se relaciona con la calidad de cierto sistemas que cuentan capacida-

des para integrar componentes de software que provienen de diferentes proveedores.

ISO/TC 211 − comite tecnico dentro de la Organizacion Internacional de Estandares

(ISO) creado para la normalizacion en Geomatica e Informacion Geografica. A es-

te comite se le asigno la responsabilidad de definir normativas de referencia para

IG digital y transferencia de datos y servicios requeridos por la industria de SIG

distribuidos.

J,K,L

LBMS − Sistema de gestion basado en ubicacion.

LBS − Servicio basado en ubicacion.

M,N,O

Modelo de Clases UML − el modelo o diagrama de clase de UML conceptual visualiza

las clases que involucra un sistema y sus relaciones. Un diagrama de clases esta

compuesto por las clases con atributos, metodos y visibilidad, y las relaciones, que

pueden ser de herencia, composicion, agregacion, asociacion o uso.

Modelo Conceptual Estandar para Esquemas de Aplicacion - ISO 19109 −estandar internacional ISO que define las Reglas para crear y documentar Esquemas

de Aplicacion.

Page 196: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

170 Apendice C. Glosario

Modelo Conceptual Estandar para Fenomenos Geograficos - ISO 19107 −estandar internacional ISO que proporciona los elementos conceptuales para des-

cribir y manipular las caracterısticas espaciales asociadas a fenomenos geograficos.

Modelo de Referencia - ISO 19101 − estandar ISO que provee el marco de la se-

rie de estandares ISO 19XXX sobre modelos geoespaciales. Introduce el ”Modelo

de Referencia de Dominio”, que provee la arquitectura de informacion para SIG

distribuidos.

Modelo Entidad Relacion (MER) − modelo conceptual de datos para representar la

vista estructural de un sistema. Expresa el modelo de datos a traves del conjunto de

entidades relevantes para un sistema, junto con sus propiedades e interrelaciones.

Modelo de Datos Espaciales − modelo de datos con abstracciones para objetos espa-

ciales. Los principales modelos de datos espaciales son:

Raster− divide el terreno o espacio en celdas iguales y regulares en tamano y

forma. El valor de cualquier celda para un atributo particular se corresponde

con el valor del atributo en dicha celda, por ejemplo nivel sobre el mar. Cuando

se desea tener informacion sobre otro atributo, por ejemplo temperatura, se

define lo que se conoce como capa (en ingles layer). La celda se asocia con el

pixel

Vector− divide el espacio en elementos discretos, basado en alguna carac-

terıstica geografica. Se define una jerarquıa de tres particiones basicas para el

modelo vector:

1. Punto: se representa por un par coordenado (x, y)

2. Lınea: es una secuencia de puntos que forma un arco dirigido.

3. Polıgono: ciclo simple cerrado limitando a una region

Las estructuras de datos usadas para implementar el modelo vector incluyen

K-D-B trees, quadtrees, grid files y R-trees

Modelo espacial basado en campos − asocia a cada punto del espacio con uno o

varios valores de atributos definidos como funciones continuas sobre x e y. Por

ejemplo, altitud sobre el nivel del mar.

Page 197: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

171

Modelo espacial basado en objetos − asocia sobre el espacio entidades discretas. Ca-

da entidad tiene asociada un componente espacial, que corresponde con la forma y

ubicacion del objeto en el espacio subyacente, y un conjunto de propiedades des-

criptivas.

Niveles de Abstraccion de Datos − son un medio para ordenar los modelos de da-

tos en sistemas que administran datos con persistencia. Los niveles de abstraccion

usandos incluyen.

Nivel conceptual− modela los objetos del mundo real y sus relaciones sin con-

siderar las limitaciones de representacion.

Nivel logico− provee los constructores para representar los datos dentro del

sistema. Oculta detalles de implementacion.

Nivel fısico− se ocupan de las estructuras para que la gestion (recuperacion

y guardado) de los datos sea eficiente. Trabajan con estructuras de archivos e

ındices.

Objetos Geograficos − representa la unidad de informacion a nivel conceptual. Un

tema es una coleccion de objetos geograficos. Un objeto geografico se corresponde

con una entidad del mundo real y tiene dos componentes:

Una descripcion, cada objeto se describe por su conjunto de atributos descrip-

tivos. Por ejemplo el nombre y la poblacion de una ciudad.

Una componente espacial, tambien denominado objeto espacial o extension es-

pacial, puede incluir geometrıa (ubicacion en el espacio geometrico subyacente,

forma, etc.) y topologıa (relaciones espaciales con otros objetos). Por ejemplo,

una ciudad puede tener como valor geometrico un polıgono en el espacio 2D.

La componente espacial aislada de un objeto geometrico se denomina objeto

espacial. Puede darse el caso que se considere separadamente.

OGC Open GeoSpatial Consortium − organismo internacional integrado por repre-

sentantes del gobierno, de las ciencias de investigacion y socios de la industria que

tienen por objetivo definir y divulgar estandares para representar y manipular IG

que favorezcan la interoperabilidad entre herramientas SIG.

Page 198: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

172 Apendice C. Glosario

Ontologıa − en Ciencias de la Computacion se define como ontologıa a la especificacion

explıcita y formal de una conceptualizacion compartida.

Ontologıa de Aplicacion − clasificacion de ontologıa segun generalidad. Captura el

conocimiento de un sistema o aplicacion. Describen conceptos que dependen del

dominio. A menudo se corresponde con roles desarrollados por las entidades mientras

realizan una actividad.

Ontologıa de dominio − clasificacion de ontologıa segun generalidad. Define el cono-

cimiento usado por un dominio o actividad especıfica describiendo su vocabulario.

Tambien se denominan ontologıas de tarea.

Ontologıa genericas (Top-Level) − clasificacion de ontologıa segun generalidad. Cap-

tura conocimiento de proposito general independiente del dominio de aplicacion.

Objetos geometricos − segun su dimension incluyen punto, lınea y polıgono. Los ob-

jetos geometricos se pueden agrupar formando conjuntos de objetos de la misma

dimension (por ejemplo conjunto de puntos) o distinta.

Operador Espacial − operador del lenguaje de consulta que opera sobre datos espa-

ciales. Por ejemplo join espacial, seleccion espacial.

Operacion Geometrica − operaciones metricas sobre fenomenos geograficos. Incluye

distancia, superficie, etc.

Operacion Topologica − operaciones que permanecen invariantes ante cambios mor-

fologicos, de escala o de proyeccion. Incluye vecindad, adyacencia, inclusion y co-

nectividad.

P,Q,R

Proceso ETL − proceso que sigue un modelo lineal para la extraccion, transformacion

y carga de datos.

Relaciones espaciales − son relaciones entre objetos del espacio. Se organizan en:

Topologica− se refieren a calidades topologicas objetos espaciales que son

invariantes bajo transformaciones topologicas, si un objeto esta adyacente a,

conectado a, incluido en, disjuntos con,

Page 199: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

173

Direccionales− posicion relativa de un objeto con otro.

Metricas− dan por resultado una medida, como puede ser distancia.

S,T,U

Sistemas de Bases de Datos Distribuidos Heterogeneos − representa a los entor-

nos con varios sitios o nodos (sean SMBD o SMBDE) con diferentes esquemas e

instancias de base de datos y software de base. No se requiere que todos los sitios

conozcan de la existencia del resto y es posible que solo esten dispuestos a compartir

parcialmente sus datos.

Sistemas de Informacion Geografica (SIG) − sistema con capacidad para recolec-

tar, analizar y presentar informacion que describe propiedades fısicas y logicas del

mundo de la geografıa.

Sistema de Manejo de Bases de Datos Espaciales (SMBDE) − SMBD con ca-

pacidad para almacenar datos espaciales, ası como proveer soporte para operaciones

y consultas espaciales.

TDAE − Tipo de datos abstracto espacial.

Tema − la informacion geoespacial correspondiente a un topico particular se denomina

tema. Un tema tiene un esquema e instancias. Rıos, ciudades y paıses son ejemplos

de tema.

Tesauro − conjunto de terminos mas formalizados que en un vocabulario. Acuerda una

jerarquıa de conceptos.

Tipo de fenomeno − unidad que agrupa a los fenomenos de una misma clase. El tipo

de fenomeno provee la descripcion general para los elementos que pertenecen a el,

sus atributos y asociaciones.

V,W,X,Y,Z

Variable cualitativa − tiene asociado un conjunto de valores nominales discretos y cada

valor tıpicamente esta vinculado a un termino.

Page 200: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

174 Apendice C. Glosario

Variable cuantitativa − tiene por rango valores numericos, que pueden ser continuos,

como temperatura o precipitacion; o discretos como poblacion o cantidad de espe-

cies. La variables cuantitativas pueden ser calculadas. Tambien se pueden agrupar

por rangos disjuntos

Vocabulario − es un conjunto de terminos relacionados por su significado. Las relaciones

basicas que se definen entre terminos de un vocabulario incluyen termino mas amplio

(o mas abarcativo), termino mas especıfico y termino sinonimo.

Page 201: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

Bibliografıa

[AMT04] Andritsos, P., Miller, R. J., and Tsaparas, P. Information-theoretic

tools for mining database structure from large data sets. In SIGMOD ’04:

Proceedings of the 2004 ACM SIGMOD international conference on Mana-

gement of data (New York, NY, USA, 2004), ACM, pp. 731–742.

[ASR+05] Arpinar, I. B., Sheth, A., Ramakrishnan, C., Usery, E. L., Azami,

M., and Kwan, M. Handbook of geographic information science, 2005.

[atk03] ATKIS – Objektartenkatalog Basis – DLM http://www.atkis.de/

dstinfo/dstinfo2.dst_deckblatt_25?dst_ver=dst. Website, 2003.

[BCU+99] Beddoe, D., Cotton, P., Uleman, R., Johnson, S., and Herring,

J. R. OpenGIS Simple Features Specification For SQL. Tech. rep., OGC,

May 1999.

[BEH+03] Bernard, L., Einspanier, U., Haubrock, S., Hubner, S., Kuhn,

W., Lessing, R., Lutz, M., and Visser, U. Ontologies for intelligent

search and semantic translation in spatial data infrastructures, 2003.

[Bis98] Bishr, Y. Overcoming the semantic and other barriers to gis interoperabi-

lity. International Journal of Geographical Information Science 12, 4 (1998),

299–314.

[BLD99] Borges, K. A. V., Laender, A. H. F., and Davis, Jr., C. A. Spatial

data integrity constraints in object oriented geographic data modeling. In

GIS ’99: Proceedings of the 7th ACM international symposium on Advances

in geographic information systems (New York, NY, USA, 1999), ACM, pp. 1–

6.

Page 202: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

176 BIBLIOGRAFIA

[BM98] Burrough, P., and McDonnell, R. Principles of Geographical Infor-

mation Systems. Oxford University Press, 1998.

[BM03] Bilenko, M., and Mooney, R. J. Adaptive duplicate detection using

learnable string similarity measures. In KDD ’03: Proceedings of the ninth

ACM SIGKDD international conference on Knowledge discovery and data

mining (New York, NY, USA, 2003), ACM, pp. 39–48.

[BO00] Bossard, M., J. F., and Otahel, J. Corine land cover technical guide,

2000.

[BT88] Battista, G. D., and Tamassia, R. Algorithms for plane representations

of acyclic digraphs. Theoretical Computer Science 61, 2-3 (1988), 175 – 198.

[Buc09] Buccella, A. Integracion de Sistemas de Informacion Geografica. PhD

thesis, Departamento de Ciencias e Ingenierıa de la Computacion, Universi-

dad Nacional del Sur. Bahıa Blanca. Argentina, 2009.

[CdA99] Castano, S., and de Antonellis, V. A schema analysis and reconci-

liation tool environment for heterogeneous databases. In IDEAS ’99: Pro-

ceedings of the 1999 International Symposium on Database Engineering &

Applications (Washington, DC, USA, 1999), IEEE Computer Society, p. 53.

[CEN07] CEN, I. Cen tc 287 geographic information. inspire, 2007.

[Che76] Chen, P. P.-S. The entity-relationship model—toward a unified view of

data. ACM Trans. Database Syst. 1, 1 (1976), 9–36.

[Cla86] Clarke, K. C. Advances in geographic information systems. Computers,

Environment and Urban Systems 10, 3-4 (1986), 175 – 184.

[Cli09] The opengis abstract specification. topic 5: Features, 2009.

[Cod70] Codd, E. F. A relational model of data for large shared data banks. Com-

mun. ACM 13, 6 (1970), 377–387.

[Cor00] Corford, D. Geographic Information System. Computer Science Aston

University, http://www.cs.aston.ac.uk, October 2000.

[CYC02] Cyc Knowledge Server. Website, 2002. http://www.cyc.com/.

Page 203: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

BIBLIOGRAFIA 177

[dB93] de Bruijn, J. Using ontologies - enabling knowledge sharing and reuse on

the semantic web. DERI Technical Report DERI-2003-10-29 (1993).

[DDH01] Doan, A., Domingos, P., and Halevy, A. Y. Reconciling schemas of

disparate data sources: A machine-learning approach. In SIGMOD Confe-

rence (2001).

[DGJ98] Di Gregorio, A., and Jansen, L. J. M. Land cover classification system

(lccs): Classification concepts and user manual., 1998.

[DH05] Doan, A., and Halevy, A. Semantic integration research in database

community: A brief survey, 2005.

[DJ06] Devillers, R., and Jeansoulin, R. Fundamentals of Spatial Data Qua-

lity (Geographical Information Systems series). ISTE, 2006.

[DLCMT02] Di Luca, S., Castro, S., Martig, S., and Trutner, G.and Vittu-

rini, M. Interfaces en la visualizacion de informacion. IV Workshop de

Investigadores en Ciencias de la Computacion (WICC2002) 1, 1 (2002).

[DLD+04] Dhamankar, R., Lee, Y., Doan, A., Halevy, A., and Domingos,

P. imap: Discovering complex semantic matches between database schemas,

2004.

[dSR04] de Sevilla Riaza., T. F. Gml: El lenguaje de marcado extendido (xml)

para la ingenierıa geografica. tesis de doctorado en ingenierıa geografica,

2004.

[EEA01] EEA. Gemet version 2001 (general multilingual environmental thesaurus),

2001.

[EF91] Egenhofer, M. J., and Franzosa, R. D. Point-set topological spatial

relations. International Journal of Geographical Information Systems 5, 2

(1991), 161–174.

[Ege02] Egenhofer, M. Toward the semantic geospatial web, 2002.

[EN00] Elmasri, R., and Navathe, S. Fundamentals of Database Systems. Ad-

dison Wesley 3d. Ed., 2000.

Page 204: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

178 BIBLIOGRAFIA

[EN07] Elmasri, R., and Navathe, S. Fundamentals of Database Systems (4th

Edition), 5 ed. Addison Wesley, 2007.

[ESR08] ESRI. Geologic fault-finding with gis, 2008.

[FGD07] FGDC, N. National geospatial program standards. the federal geographic

data committee, 2007.

[GHEK00] Goldbeck, J., Huertgen, B., Ernst, S., and Kelch, L. Lane follo-

wing combining vision and dgps. Image and Vision Computing 18, 5 (2000),

425 – 433.

[GJM02] Ghezzi, C., Jazayeri, M., and Mandrioli, D. Fundamentals of Soft-

ware Engineering, 2nd ed. Prentice Hall PTR, Upper Saddle River, NJ,

USA, 2002.

[GMPQ+04] Garcia-Molina, H., Papakonstantinou, Y., Quass, D., Rajara-

man, A., Sagiv, Y., Ullman, J., Vassalos, V., and Widom, J. The

tsimmis approach to mediation: Data models and languages. Journal of

Intelligent Information Systems 8, 2 (2004), 117–132.

[Goo05] Google. Google maps web site, 2005.

[Gru93] Gruber, T. R. A translation approach to portable ontology specifications.

Knowledge Acquisition (1993).

[Gua98] Guarino, N. Formal ontology and information systems. 3–15.

[Gut95] Guting, R. H. An introduction to spatial database systems. GeoInforma-

tica 3, 3 (1995), 245–268.

[HS95] Hernandez, M. A., and Stolfo, S. J. The merge/purge problem for

large databases. In SIGMOD Conference (1995), pp. 127–138.

[IIMM99] Informatica, V., Informatica, E. T., Meersman, R., and Meers-

man, R. A. Semantic ontology tools in is design, 1999.

[Ins00] Institute, T. G. R. Getty vocabularies, 2000.

[ISO] Geographic information – metadata. international organization for standar-

dization (iso) 19115. Tech. rep., ISO/TC 211.

Page 205: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

BIBLIOGRAFIA 179

[ISO94] ISO/TC 211 Geographic information/Geomatics. Website, 1994. http:

//www.isotc211.org/.

[ISO02a] Geographic information – core profile of the spatial schema. International

Organization for Standardization (ISO) 19137. Tech. rep., ISO/TC 211,

2002.

[ISO02b] Geographic information – quality principles. International Organization for

Standardization (ISO) 19113. Tech. rep., ISO/TC 211, 2002.

[ISO02c] Geographic information – reference model. International Organization for

Standardization (ISO) 19101. Tech. rep., ISO/TC 211, 2002.

[ISO02d] Geographic information - temporal schema. International Organization for

Standardization (ISO) 19108. Tech. rep., ISO/TC 211, 2002.

[ISO03a] Geographic information – quality evaluation procedures. International Or-

ganization for Standardization (ISO) 19114. Tech. rep., ISO/TC 211, 2003.

[ISO03b] Geographic information - spatial referencing by geographic identifiers. Inter-

national Organization for Standardization (ISO) 19112. Tech. rep., ISO/TC

211, 2003.

[ISO03c] Geographic information - spatial schema. International Organization for

Standardization (ISO) 19107. Tech. rep., ISO/TC 211, 2003.

[ISO05a] Geographic information – location-based services – tracking and navigation.

International Organization for Standardization (ISO) 19133. Tech. rep.,

ISO/TC 211, 2005.

[ISO05b] Geographic information – portrayal. International Organization for Standar-

dization (ISO) 19117. Tech. rep., ISO/TC 211, 2005.

[ISO05c] Geographic information – rules for application schemas. International Orga-

nization for Standardization (ISO) 19109. Tech. rep., ISO/TC 211, 2005.

[ISO05d] Geographic information - methodology for feature cataloguing. International

Organization for Standardization (ISO) 19110. Tech. rep., ISO/TC 211,

2005.

Page 206: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

180 BIBLIOGRAFIA

[ISO05e] Geographic information - web map server interface. International Organiza-

tion for Standardization (ISO) 19128. Tech. rep., ISO/TC 211, 2005.

[ISO06] Geographic information – data quality measures. International Organization

for Standardization (ISO) 19138. Tech. rep., ISO/TC 211, 2006.

[ISO07a] Geographic information – data product specifications. International Orga-

nization for Standardization (ISO) 19131. Tech. rep., ISO/TC 211, 2007.

[ISO07b] Geographic information – Geography Markup Language (GML). Internatio-

nal Organization for Standardization (ISO) 19136. Tech. rep., ISO/TC 211,

2007.

[ISO07c] Geographic information – location-based services – multimodal routing and

navigation. International Organization for Standardization (ISO) 19134.

Tech. rep., ISO/TC 211, 2007.

[ISO07d] Geographic information – metadata – xml schema implementation . Inter-

national Organization for Standardization (ISO) 19139. Tech. rep., ISO/TC

211, 2007.

[ISO07e] Geographic information – spatial referencing by coordinates International

Organization for Standardization (ISO) 19111. Tech. rep., ISO/TC 211,

2007.

[ISO07f] ISO. Documentation – Guidelines for the establishment and development of

monolingual thesauri. International Organization for Standardization (ISO)

2788:1986. Multiple. Distributed through American National Standards Ins-

titute (ANSI), August 2007.

[KABL01] Karla A.V. Borges, C. A. D., and Laender, A. H. Omt-g: An

object-oriented data model for geographic applications. Springer Nether-

lands GeoInformatica 5, 3 (2001), 221–260.

[KH96] Kaplan, E. D., and Hegarty, C. Understanding GPS Principles and

Applications. Artech-House, Boston London, 1996.

[Kli08] Klien, E. Semantic Annotation of Geographic Information. PhD thesis,

Institute for Geoinformatics, University of Muenster. Muenster, Germany,

2008.

Page 207: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

BIBLIOGRAFIA 181

[KPS95] Kosters, G., Pagel, B.-U., and Six, H.-W. Object-oriented require-

ments engineering for gis-applications, 1995.

[KS96] Kashyap, V., and Sheth, A. Semantic and schematic similarities between

database objects: a context-based approach. The VLDB Journal 5, 4 (1996),

276–304.

[LB00] Lechner, W., and Baumann, S. Global navigation satellite systems.

Computers and Electronics in Agriculture 25, 1-2 (2000), 67 – 85.

[LBTR04] Lake, R., Burggraf, D., Trninic, M., and Rae, L. Geography Mark-

Up Language: Foundation for the Geo-Web. John Wiley & Sons, June 2004.

[LC00] Li, W.-S., and Clifton, C. Semint: a tool for identifying attribute corres-

pondences in heterogeneous databases using neural networks. Data Knowl.

Eng. 33, 1 (2000), 49–84.

[LGMR05] Longley, P., Goodchild, M., Maguire, D., and Rhind, D. Geograp-

hic information systems and science. Wiley, John and Sons, Incorporated,

2005.

[LRP03] Lutz, M., Riedeman, C., and Probst, F. A classification framework

for approaches to achieving semantic interoperability, 2003.

[LT92] LAURINI, R., and THOMPSON, D. Fundamentals of Spatial Informa-

tion Systems. Academic Press, 1992.

[LTM82] Leatherdale, D., Tidbury, G. E., and Mack, R. AGROVOC: a

multilingual thesaurus of agricultural terminology. Food and Agriculture Or-

ganization of the United Nations. and Commission of the European Commu-

nities, english version. ed. Apimondia, by arrangement with the Commission

of the European Communities, [S.l.] :, 1982.

[Lua04] Luaces, M. A. R. A Generic Architecture for Geographic Information

Systems. PhD thesis, Universidade Da Caruna, 2004.

[MBR01] Madhavan, J., Bernstein, P. A., and Rahm, E. Generic schema mat-

ching with cupid. In The VLDB Journal (2001), pp. 49–58.

Page 208: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

182 BIBLIOGRAFIA

[McG03] McGuiness, D. L. Ontologies come of age. In Spinning the Semantic

Web, D. Fensel, J. Hendler, H. Lieberman, and W. Wahlster, Eds. MIT

Press, Cambridge, MA, 2003, ch. 6, pp. 171–196.

[MDVK] McCann, R., Doan, A., Varadarajan, V., and Kramnik, A. Buil-

ding data integration systems via mass collaboration.

[ME96] Monge, A. E., and Elkan, C. The field matching problem: Algorithms

and applications. In Knowledge Discovery and Data Mining (1996), pp. 267–

270.

[ME02] Mumby, P. J., and Edwards, A. J. Mapping marine environments with

ikonos imagery: enhanced spatial resolution can deliver greater thematic

accuracy. Remote Sensing of Environment 82, 2-3 (2002), 248 – 257.

[MFW90] Michael F. Worboys, Hilary M. Hearnshaw, D. J. M. Object-

oriented data modelling for spatial databases. International Journal of Geo-

graphical Information Science 4, 4 (1990), 369 – 383.

[MGR99] Maguire, D., Goodchild, M., and Rhind, D. Geographic Information

Systems. Longman Scientific and Technical, 1999.

[Mit99a] Mitchell, A. The ESRI Guide to GIS Analysis Volume 1: Geographic

Patterns and Relationships. ESRI, 1999.

[Mit99b] Mitchell, A. GIS Analysis. Geographic Patterns and Relationships. Evi-

ronmental Systems Research Institute, Inc, 1999.

[MKS+05] McCann, R., Kramnik, A., Shen, W., Varadarajan, V., Sobulo,

O., and Doan, A. Integrating data from disparate sources: a mass colla-

boration approach, 2005.

[Mol95] Molenaar, M. Spatial concepts as implemented in gis, 1995.

[MSv+05] Menken, M., Stuckenschmidt, H., (vrije, H. W., Stoilos, G.,

Tzouvaras, V., Hellas, T., Fensel, C. P. D., and Leger, C. P. A.

Knowledge web consortium, 2005.

Page 209: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

BIBLIOGRAFIA 183

[MV10] Mercedes Vitturini, P. F. Integracion de sistemas de informacion

geografica. XII Workshop de Investigadores en Ciencias de la Computacion

(WICC2010) 1, 1 (2010).

[MZ98] Milo, T., and Zohar, S. Using schema matching to simplify heteroge-

neous data translation. In Proc. 24th Int. Conf. Very Large Data Bases,

VLDB (24–27 1998), pp. 122–133.

[Nac06] Nacional, I. G. Prosiga - proyecto sistema de informacion geografica

nacional de la republica argentina. Website, 2006. http://www.sig.gov.

ar/.

[OGC94] Open Geospatial Consortium, Inc. (OGC). Website, 1994. http://www.

opengeospatial.org/.

[OGC99] The OpenGIS Abstract Specification. Topic 3: Locational Geometry Struc-

tures, 1999.

[OGC05] The OGC Abstract Specification. Open Geospatial Consortium (OGC).

Website, 2005. http://www.opengeospatial.org/.

[OGC06] OpenGIS Web Map Server Implementation Specification. Open Geospatial

Consortium (OGC). Website, 2006. http://www.opengeospatial.org/.

[OGC07] OpenGIS Geography Markup Language (GML). Open Geospatial Consor-

tium (OGC) . Website, 2007. http://www.opengeospatial.org/.

[OGC08] OGC Reference Model (ORM). Open Geospatial Consortium (OGC). Web-

site, 2008. http://www.opengeospatial.org/.

[oJ09] of Justice, U. D. Maps: Geospatial tools. Website, 2009. http://www.

ojp.usdoj.gov/nij/maps/tools.htm.

[oM09] of Medicine, N. L. Toxmap: Environmental health e-maps. Website, 2009.

http://toxmap.nlm.nih.gov/toxmap/combo/applyLayerOptions.do.

[Ope02] Open GIS Consortium Inc. Web feature service implementation specifi-

cation, 2002.

Page 210: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

184 BIBLIOGRAFIA

[OPM97] Oliveira, J. L. D., Pires, F., and Medeiros, C. B. An environment

for modeling and design of geographic applications. Geoinformatica 1, 1

(1997), 29–58.

[ORA] ORACLE. Oracle spatial and oracle locator: Location features for oracle

database 11g.

[Pas08] Pascual, A. R. Revista interancional de ciencias de la tierra. instituto

geografico nacional francisco javier ariza lopez. universidad de jaen. enero

2008, 2008.

[Pau05] The OpenGIS Abstract Specification. Topic 2: Spatial referencing by coor-

dinates, 2005.

[POS10] POSTGRES. Postgis 1.5.2, 2010.

[PSZ+98] Parent, C., Spaccapietra, S., Zimanyi, E., Donini, P., Plazanet,

C., and Vangenot, C. Modeling spatial data in the mads conceptual

model. In in Proceedings of the 8th International Symposium on Spatial

Data Handling (1998), pp. 138–150.

[PSZ99] Parent, C., Spaccapietra, S., and Zimanyi, E. Spatio-temporal con-

ceptual models: data structures + space + time. In GIS ’99: Proceedings of

the 7th ACM international symposium on Advances in geographic informa-

tion systems (New York, NY, USA, 1999), ACM, pp. 26–33.

[PSZ06a] Parent, C., Spaccapietra, S., and Zimanyi, E. Conceptual Modeling

for Traditional and Spatio-Temporal Applications: The MADS Approach.

Springer-Verlag, 2006.

[PSZ06b] Parent, C., Spaccapietra, S., and Zimanyi, E. The mads data mo-

del: Concepts to understand the structure of your spatial and temporal da-

ta. Journal of Informative Modelling for the Architectural Heritage, 1 (July

2006), 51–64. Proceedings of the MIA 2006 International Workshop.

[PU98] Palopoli, D. S. L., and Ursino, D. Semi-automatic, semantic disco-

very of properties from database schemes. In IDEAS ’98: Proceedings of

the 1998 International Symposium on Database Engineering & Applications

(Washington, DC, USA, 1998), IEEE Computer Society, p. 244.

Page 211: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

BIBLIOGRAFIA 185

[Raj10] Rajesh, M. Geographic information system and mapping, 2010.

[RBP+91] Rumbaugh, J., Blaha, M., Premerlani, W., Eddy, F., and Loren-

sen, W. Object-oriented modeling and design. Prentice-Hall, Inc., Upper

Saddle River, NJ, USA, 1991.

[RJB98] Rumbaugh, J., Jacobson, I., and Booch, G. The Unified Modeling

Language Reference Manual. Addison-Wesley, 1998.

[RJB04] Rumbaugh, J., Jacobson, I., and Booch, G. Unified Modeling Lan-

guage Reference Manual, The (2nd Edition). Pearson Higher Education,

2004.

[RL02] Reed, S. L., and Lenat, D. B. Mapping ontologies into cyc. Tech. rep.,

Cycorp, Inc,, 2002.

[RSV02] Rigaux, P., Scholl, M., and Voisard, A. Spatial databases with appli-

cation to GIS. Morgan Kaufmann Publishers Inc., San Francisco, CA, USA,

2002.

[SB02] Sarawagi, S., and Bhamidipaty, A. Interactive deduplication using

active learning. In KDD ’02: Proceedings of the eighth ACM SIGKDD in-

ternational conference on Knowledge discovery and data mining (New York,

NY, USA, 2002), ACM, pp. 269–278.

[SC03] Shekhar, S., and Chawla, S. Spacial Databases: A Tour. Prentice Hall,

2003.

[SCG+97] Shekhar, S., Coyle, M., Goyal, B., Liu, D.-R., and Sarkar, S. Da-

ta models in geographic information systems. Commun. ACM 40, 4 (1997),

103–111.

[SHW+04] Stuckenschmidt, H., Harmelen, F. V., Waard, A. D., Scerri, T.,

Bhogal, R., Buel, J. V., Crowlesmith, I., Fluit, C., Kampman,

A., Broekstra, J., and Mulligen, E. V. Exploring large document

repositories with rdf technology: The dope project, 2004.

[SKS10] Silberschatz, A., Korth, H., and Sudershan, S. Database System

Concepts, 6th ed. McGraw-Hill, Inc. New York, NY, USA, 2010.

Page 212: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

186 BIBLIOGRAFIA

[SMB+97] Shekhar, S., M.Coyle, B.Goyal, Liu, D., and S.Sarkar. Experien-

ces with data models in geographic information systems. Communications

of the ACM 40, 4 (1997).

[std85] Documentation – Guidelines for the Establishment and Development of

Multilingual Thesauri International Organization for Standardization (ISO)

5964:1985=BS 6723:1985. Tech. rep., ISO, 1985.

[SWB+] Salokhe, G., Weinheimer, J., Bovo, M. G., Agrimi, M., Keizer,

J., and Katz, S. Food and agriculture organization of the united nations,

italy.

[Ter06] Terrasa, A. N. Semantic integration of thematic geographic information

in a multimedia context. Doctorate in Computer Science and Communica-

tion Department of Technology. Universitat Pompeu Fabra (2006).

[Ull88] Ullman, D. Principles of Database and Knowledge-base Systems. Compu-

ter Science Press, Rockville, 1988.

[UNS] United Nations Standard Products and Services Code (UNSPSC). Website.

http://www.unspsc.org.

[Usc98] Uschold, M. Knowledge level modelling: concepts and terminology.

Knowl. Eng. Rev. 13, 1 (1998), 5–29.

[USG07] Earthquake Hazards Program. Website, 2007. http://earthquake.usgs.

gov/earthquakes/.

[VCM05] Vitturini, M., Castro, S., and Martig, S. Modelos de datos es-

paciales. VII Workshop de Investigadores en Ciencias de la Computacion

(WICC2005) 1, 1 (2005).

[VF08] Vitturini, M., and Fillottrani, P. Interoperabilidad y estandares de

datos para informacion geografica. XIV Congreso Argentino de Ciencias de

la Computacion (CACIC 2008) 1, 1 (2008).

[VFC03] Vitturini, M., Fillottrani, P., and Castro, S. Modelos de datos

para datos espaciales. V Workshop de Investigadores en Ciencias de la

Computacion (WICC 2003) 1, 1 (2003).

Page 213: Universidad Nacional del Sur Tesis de Magister en Ciencias de ...repositoriodigital.uns.edu.ar/bitstream/123456789/2215/1/...partamento de Ciencias e Ingenier a de la Computaci on,

BIBLIOGRAFIA 187

[WD04] Worboys, M. F., and Duckham, M. GIS: A Computing Perspective.

CRC Press, 2004.

[wms04] Web Map Service Interface. Open GeoSpatial Consortium (OGC). Tech.

rep., OGC, January 2004.

[WOR98] Wordnet an electronic lexical database, 1998. http://wordnet.princeton.

edu/wordnet/.

[WVV+01] Wache, H., Vogele, T., Visser, U., Stuckenschmidt, H., Schus-

ter, G., Neumann, H., and Hubner, S. Ontology-based integration of

information - a survey of existing approaches. pp. 108–117.

[XE03] Xu, L., and Embley, D. W. Discovering direct and indirect matches for

schema elements. Database Systems for Advanced Applications, Internatio-

nal Conference on 0 (2003), 39.

[Zei99] Zeiler, M. Modeling our Word. The ESRI Guide to Geodatabase Design.

Evironmental Systems Research Institute, Inc, 1999.