44
BASE DE DATOS Alumno: José Gómez CI: 20982963 Sección: 1451

Tabajo de base de datos

Embed Size (px)

Citation preview

Page 1: Tabajo de base de datos

BASE DE DATOS

Alumno: José GómezCI: 20982963

Sección: 1451

Page 2: Tabajo de base de datos

Sistemas administradores de base de datos

La administración de bases de datos se realiza con un sistema llamado DBMS Database management system [Sistema de administración de bases de datos]). El DBMS es un conjunto de servicios (aplicaciones de software) para administrar bases de datos, que permite:

· un fácil acceso a los datos · el acceso a la información por parte de múltiples usuarios · la manipulación de los datos encontrados en la base de

datos (insertar, eliminar, editar) El DBMS puede dividirse en tres subsistemas: · El sistema de administración de archivos: para almacenar

información en un medio físico · El DBMS interno: para ubicar la información en orden · El DBMS externo: representa la interfaz del usuario

Page 3: Tabajo de base de datos

EVOLUCIÓN

En 1964, se conciben los primeros Gestores de Base de Datos (DBMS: Database Management System), por medio de los cuales se pretende dar un viraje a los Sistemas de Archivos, los cuales se limitan a la estructuración del almacenamiento físico de los datos.

Con los DBMS se crea el concepto de Administración de los datos. El primer gestor de bases de datos (DBMS) comercial, IDS:

Integrated Data Store ; luego se desarrolla el IMS: Information Management System , sobre el concepto del Modelo de Datos Jerárquico. Comenzando los años 80’s se da inicio a dos grandes tendencias: los ORDBMS (Object Relational Database Management System) los cuales se proyectan como una extensión de los RDBMS hacia el paradigma OO, y los OODBMS (Object Oriented Database Management System) estarían disponibles para almacenar y manipular las clases, los objetos, la asociación entre ellos y sus métodos. Luego en 1992 el comité ANSI X3H2 inicia un trabajo en SQL3, del cual surgen los DBMS objeto relacional ORDBMS.

Page 4: Tabajo de base de datos

ESQUEMA DE UN DBMS

Page 5: Tabajo de base de datos

LENGUAJE DEL DBMS

En la estructura básica de un Sistema Manejador de Base de Datos se enuncian dos lenguajes que permiten trabajar sobre la base de datos. Estos lenguajes estándar son:

DDL (Data Definition language): Lenguaje de Definición de Datos. Por medio de este el DBMS identifica las descripciones de los elementos de los esquemas y almacena la descripción del esquema en el catálogo del DBMS.

SDL (Store Definition language): Lenguaje de definición de almacenamiento. Es utilizado por el DBMS para especificar el esquema interno que corresponde a la Base de Datos Almacenada.

VDL (View Definition language): Lenguaje de Definición de Vistas. Es utilizado por el DBMS para especificar las vistas del usuario y sus correspondencias con el esquema conceptual.

DML (Data Manipulation language): Lenguaje de Manipulación de Datos. Permite la manipulación de las operaciones de Inserción, Eliminación y Modificación.

Page 6: Tabajo de base de datos

USUARIO DE UN SISTEMA MANEJADOR DE BASE DE DATOS

-Usuarios de la categoría DBA (administradores) estos controlan el acceso a la base de datos, establecen procesos para la recuperación y respaldo de los datos.

-Usuarios de tipo RESOURCE, que pueden crear sus propios objetos y tener acceso a los objetos sobre los que se les ha concedido permisos.

-Usuarios Especializados: Como analista y auditores de sistema

-Usuarios Programadores/Diseñadores: Estos construyen la base de datos.

Usuarios Finales.

Page 7: Tabajo de base de datos

TRANSACCIONES

Una transacción es un conjunto de acciones llevadas a cabo por un usuario o un programa de aplicación, que acceden o cambian el contenido de la base de datos. Estas transacciones se deben realizar sobre la base de datos para que ésta siga siendo un fiel reflejo de la realidad.

Page 8: Tabajo de base de datos

MODELO RELACIONAL (MR)

El modelo relacional para la gestión de una base de datos es un modelo de datos basado en la lógica de predicados y en la teoría de conjuntos.

Estas relaciones podrían considerarse en forma lógica como conjuntos de datos llamados tuplas. En este modelo todos los datos son almacenados en relaciones, y como cada relación es un conjunto de datos, el orden en el que estos se almacenen no tiene relevancia.

La información puede ser recuperada o almacenada por medio de consultas que ofrecen una amplia flexibilidad y poder para administrar la información.

Page 9: Tabajo de base de datos

MODELO DE RED

Este modelo representa los datos mediante colecciones de registros y sus relaciones se representan por medio de liga o enlaces, los cuales pueden verse como punteros.Los registros se organizan en un conjunto de gráficas arbitrarias.

 

Page 10: Tabajo de base de datos

MODELO JERÁRQUICO

La estructura de datos del modelo jerárquico es como un árbol de registros, con cada registro que tiene un registro paternal y muchos hijos, el modelo de red permite a cada registro tener múltiples registros paternales y de Hijos, formando una estructura de enrejado.

 

Page 11: Tabajo de base de datos

MODELOS DE DATO: basados en objetos:

El Modelo de Datos Orientado a Objetos, es una adaptación para los sistemas de Bases de Datos del Paradigma de la Programación Orientada a Objetos. Se basa en el concepto de Encapsular elementos de datos, sus características, atributos y el código que opera sobre ellos en elementos complejos llamados Objetos.

Las bases de datos orientadas a objetos se diseñan para trabajar bien en conjunción con lenguajes de programación orientados a objetos como Java, C#, Visual Basic.NET y C++. Los ODBMS usan exactamente el mismo modelo que estos lenguajes de programación.

Page 12: Tabajo de base de datos

Algebra relacional

El álgebra relacional es un conjunto de operaciones que describen paso a paso como computar una respuesta sobre las relaciones, tal y como éstas son definidas en el modelo relacional. Denominada de tipo procedimental, a diferencia del Cálculo.

relacional que es de tipo declarativo.

Page 13: Tabajo de base de datos

Base de datos relacionales

Una base de datos relacional es un conjunto de una o más tablas estructuradas en registros (líneas) y campos (columnas), que se vinculan entre sí por un campo en común, en ambos casos posee las mismas características como por ejemplo el nombre de campo, tipo y longitud; a este campo generalmente se le denomina ID, identificador o clave. A esta manera de construir bases de datos se le denomina modelo relacional.

Las bases de datos relacionales pasan por un proceso al que se le conoce como normalización de una base de datos, el cual es entendido como el proceso necesario para que una base de datos sea utilizada de manera óptima.

Page 14: Tabajo de base de datos

Diseños de las bases de datos relacionales

El primer paso para crear una base de datos, es planificar el tipo de información que se quiere almacenar en la misma, teniendo en cuenta dos aspectos: la información disponible y la información que necesitamos.

La planificación de la estructura de la base de datos, en particular de las tablas, es vital para la gestión efectiva de la misma. El diseño de la estructura de una tabla consiste en una descripción de cada uno de los campos que componen el registro y los valores o datos que contendrá cada uno de esos campos.

Los registros constituyen la información que va contenida en los campos de la tabla. En resumen, el principal aspecto a tener en cuenta durante el diseño de una tabla es determinar claramente los campos necesarios, definirlos en forma adecuada con un nombre especificando su tipo y su longitud.

Page 15: Tabajo de base de datos

MULTITAREA

La ejecución de más de un programa a la vez en una computadora. Los sistemas operativos multitarea (Windows, OS/2, Unix y otros) permiten que múltiples operaciones se ejecuten simultáneamente. Sus mayores beneficios se obtienen cuando se realizan tareas largas y complejas (como consultar una base de datos).

Page 16: Tabajo de base de datos

MULTIUSUARIO

Una base de datos multiusuario permite a más de un solo usuario acceder a los datos almacenados.

Ocurre cuando existe información contradictoria o incongruente en la base de datos.

INCONSISTENCIA

Page 17: Tabajo de base de datos

INTEGRIDAD REFERENCIAL

La integridad referencial es un sistema de reglas que utilizan la mayoría de las bases de datos relacionales para asegurarse que los registros de tablas relacionadas son válidos y que no se borren o cambien datos relacionados de forma accidental produciendo errores de integridad.

Page 18: Tabajo de base de datos

REDUNDANCIA

Esta se presenta cuando se repiten innecesariamente datos en los archivos que conforman la base de datos.

  Una tupla se define como una función finita

que asocia unívocamente los nombres de los atributos de una relación con los valores de una instanciación de la misma. En términos simplistas, es una fila de una tabla relacional.

TUPLA

Page 19: Tabajo de base de datos

TABLA

En las bases de datos, se refiere al tipo de modelado de datos, donde se guardan los datos recogidos por un programa. En la definición de cada campo, debe existir un nombre único, con su tipo de dato correspondiente.

Page 20: Tabajo de base de datos

ENTIDAD

Es la representación de un objeto o concepto del mundo real que se describe en una base de datos. Una entidad se describe en la estructura de la base de datos empleando un modelo de datos. Por ejemplo, nombres de entidades pueden ser: Alumno, Empleado, Artículo, entre otros. Cada entidad está constituida por uno o más atributos.

Page 21: Tabajo de base de datos

ATRIBUTOS Representan una propiedad de

interés de una entidad. En un registro de base de datos, es el nombre o estructura de un campo por ejemplo, los archivos apellidos, nombre y teléfono serian los atributos de cada uno de los registros de una base de datos lista teléfono.

Page 22: Tabajo de base de datos

VENTAJAS Y DESVENTAJAS DE UN MODELO DE BASA DE DATOS

Ventajas: Mejora en la integridad de datos. Mejora en la seguridad. Mejora en la accesibilidad a los datos.

  Desventajas:  Complejidad. Tamaño. Coste de la conversión. Vulnerable a los fallos.

Page 23: Tabajo de base de datos

BASE DE DATOS INTELIGENTES

Se describen como una base de datos que contiene el conocimiento sobre el contenido de la información. Es un sistema de manejo de bases de datos el cual ejecuta la validación y el proceso de la información a través de programas de aplicación tradicionales.

Algunas bases de datos inteligentes pueden incluir reglas que pueden ser aplicadas a la información entrante o saliente. Mientras la base de datos esté consciente de su contenido, puede responder efectivamente a las peticiones complejas de su usuario.

Page 24: Tabajo de base de datos

CARDINALIDAD

Forma como cada elemento de la entidad participa de la relación (Mínima, Máxima)

Relaciones de uno a uno 1:1 Relaciones de uno a muchos 1:n Relaciones de muchos a muchos n:m La participación de la entidad puede

o no ser obligatoria, pero siempre interviene por lo menos una entidad en una relación

Page 25: Tabajo de base de datos

REGISTRO

Un registro es un conjunto de campos que contienen los datos que pertenecen a una misma repetición de entidad.

Se le asigna automáticamente un número consecutivo (número de registro) que en ocasiones es usado como índice aunque lo normal y práctico es asignarle a cada registro un campo clave para su búsqueda.

Page 26: Tabajo de base de datos

ARQUITECTURA DE UNA BASE DE DATO

Esta consiste en formar una separación entre las aplicaciones del usuario y la base de datos física. En esta arquitectura, los esquemas se pueden definir en los tres niveles siguientes:

El nivel interno: Tiene un esquema interno, que describe la estructura física de almacenamiento de la base de datos.

El nivel conceptual: Tiene un esquema conceptual, que describe la estructura de toda la base de datos para una comunidad de usuarios. El esquema conceptual oculta los detalles de las estructuras físicas de almacenamiento y se concentra en describir entidades, tipos de datos, vínculos, operaciones de los usuarios y restricciones.

El nivel externo o de vistas: Incluye varios esquemas externos o vistas de usuario. Cada esquema externo describe la parte de la base de datos que interesa a un grupo de usuarios determinado, y oculta a ese grupo el resto de la base de datos. En este nivel podemos usar un modelo de datos de alto nivel o uno de implementación. Cabe señalar que los tres esquemas no son más que descripciones de los datos; los únicos datos que existen realmente están en el nivel físico.

Page 27: Tabajo de base de datos

BASE DE DATOS DISTRIBUIDAS

Una base de datos distribuida (BDD) es un conjunto de múltiples bases de datos lógicamente relacionadas las cuales se encuentran distribuidas en diferentes espacios lógicos (ej. un servidor corriendo 2 maquinas virtuales) e interconectados por una red de comunicaciones. Dichas BDD tienen la capacidad de realizar procesamiento autónomo, esto permite realizar operaciones locales o distribuidas. Un sistema de Bases de Datos Distribuida (SBDD) es un sistema en el cual múltiples sitios de bases de datos están ligados por un sistema de comunicaciones de tal forma que, un usuario en cualquier sitio puede acceder los datos en cualquier parte de la red exactamente como si estos fueran accedidos de forma local.

Page 28: Tabajo de base de datos

DIFERENCIA ENTRE UN DBMS Y UNA BASE DE

DATOS La base de datos es una colección de

archivos interrelacionados almacenados en conjunto sin redundancia y la DBMS es un conjunto de numerosas rutinas de software interrelacionadas cada una de ellas es responsable de una determinada tarea.

Page 29: Tabajo de base de datos

DESCRICCION DE LAS FUNCIONES DE CADA COMPONENTE DE UN

SISTEMA DE BASA DE DATO Los datos: Es lo que se conoce como base de datos propiamente dicha. Los

datos en realidad son hechos dados, a partir de los cuales es posible inferir hechos adicionales. Para manejar estos datos utilizamos una serie de programas.

Los Programas: Son los encargados de manejar los datos, son conocidos como

DBMS (Data Base Management System) o también SGBD (Sistema Gestor de Base de Datos). Los DBMS tienen dos funciones principales que son:

- La definición de las estructuras para almacenar los datos. - La manipulación de los datos. Las personas: Son los usuarios programadores y usuarios finales de la base de

datos, ellos determinan el modelo que esta seguirá, e ingresan los datos que han de ser almacenados.

Page 30: Tabajo de base de datos

BASE DE DATOS ORIENTADAS A OBJETOS

El Modelo de Datos Orientado a Objetos, es una adaptación para los sistemas de Bases de Datos del Paradigma de la Programación Orientada a Objetos. Se basa en el concepto de Encapsular elementos de datos, sus características, atributos y el código que opera sobre ellos en elementos complejos llamados Objetos.

Las bases de datos orientadas a objetos se diseñan para trabajar bien en conjunción con lenguajes de programación orientados a objetos como Java, C#, Visual Basic.NET y C++. Los ODBMS usan exactamente el mismo modelo que estos lenguajes de programación.

Page 31: Tabajo de base de datos

IDENTIFICACION DE OBJETOS, ESTRUCTURA Y CONSTRUCTORES

Los objetos de las bases de datos orientadas a objetos suelen corresponder a entidades del sistema modelado por la base de datos. Las entidades conservan su identidad aunque algunas de sus propiedades cambien con el tiempo. De manera parecida, los objetos deben conservar su identidad aunque los valores de las variables o las definiciones de los métodos cambien total o parcialmente con el tiempo. Este concepto de identidad no se aplica a las tuplas de las bases de datos relacionales. En los sistemas relacionales las tuplas de una relación solo se distinguen por los valores que contienen.

Los identificadores de los objetos son únicos; es decir, cada objeto tiene un solo identificador y no hay dos objetos que tengan el mismo identificador. Los identificadores de los objetos no tienen por qué estar en una forma con la que los seres humanos se encuentren cómodos; pueden ser números grandes. Utilizar un identificador de un objeto como atributo de otro se denomina referenciar un objeto.

Page 32: Tabajo de base de datos

ENCAPSULAMIENTO DE OPERACIONES, METODOS Y

PERSISTENCIA Encapsulamiento: Es la ocultación de información.

Significa mantener la información dentro del objeto y mantenerlo como una caja negra. Puede ser accedida por métodos.

Persistencia: Un objeto puede seguir existiendo tras desaparecer su antecesor.

En los lenguajes de programación orientados a objetos estos son transitorios, desaparecen cuando se termina el programa, Si se desea transformar uno de estos lenguajes en un lenguaje para la programación de bases de datos, el primer paso consiste en proporcionar una manera de hacer persistentes a los objetos. Esto se puede hacer mediante la persistencia por clases, por creación o por marcas.

Page 33: Tabajo de base de datos

JERARQUIA DE CLASES Y HERENCIA

Es cualquier clasificación u ordenación de abstracciones en una estructura de árbol. Éste concepto es sumamente importante ya que con ello conocemos la importancia de dividir los problemas en una jerarquía de ideas. Los dos tipos importantes de jerarquía son: la de generalización/especialización y la de todo/parte.

Herencia: Es la propiedad que permite a los objetos crearse a partir de otros objetos. Cada subclase comparte características comunes con la clase de la que deriva. La clase original la llamamos clase base y las nuevas clases creadas a partir de ella clases derivadas. Una clase derivada puede ser también clase base dando lugar a una jerarquía de clases.

Page 34: Tabajo de base de datos

LENGUAJES ORIENTADOS A OBJETOS

Tienen tres características básicas: debe estar basado en objetos, basado en clases y capaz de tener herencia de clases. Muchos lenguajes cumplen uno o dos de estos puntos; muchos menos cumplen los tres. La barrera más difícil de sortear es usualmente la herencia.

El elemento fundamental de la OOP es, como su nombre lo indica, el objeto. Podemos definir un objeto como un conjunto complejo de datos y programas que poseen estructura y forman parte de una organización.

Page 35: Tabajo de base de datos

LENGUAJE DE PROGRAMACION PERSISTENTES

Los lenguajes de las bases de datos trabajan directamente con datos que son persistentes, es decir, los datos siguen existiendo una vez que el programa que los creo ha concluido. Las relaciones de las bases de datos y las tuplas de las relaciones son ejemplos de datos persistentes. Por el contrario, los únicos datos persistentes con los que los lenguajes de programación tradicionales trabajan directamente son los archivos.

Page 36: Tabajo de base de datos

BASES DE DATOS DEDUCTIVAS

Es, en esencia, un programa lógico; mapeo de relaciones base hacia hechos, y reglas que son usadas para definir nuevas relaciones en términos de las relaciones base y el procesamiento de consultas. Los sistemas Bases de Datos Deductivas intentan modificar el hecho de que los datos requeridos residan en la memoria principal (por lo que la gestión de almacenamiento secundario no viene al caso) de modo que un SGBD se amplíe para manejar datos que residen en almacenamiento secundario. En un sistema de Bases de Datos Deductivas por lo regular se usa un lenguaje declarativo para especificar reglas. Con lenguaje declarativo se quiere decir un lenguaje que define lo que un programa desea lograr, en vez de especificar los detalles de cómo lograrlo.

Page 37: Tabajo de base de datos

NOTACION PROLOG/DATALOG

El lenguaje DATALOG se deriva de la lógica de primer orden. Es a la vez un lenguaje de descripción y de manipulación de bases de datos.

•El modelo de descripción de datos sostenido por DATALOG es esencialmente relacional, viéndose una relación como un predicado de la lógica.

•El lenguaje de manipulación es un lenguaje de reglas construido a partir de las cláusulas de Horn. El nombre Datalog significa “lógica para los datos”. Ha sido inventado para sugerir una versión de Prolog utilizable por los datos.

Page 38: Tabajo de base de datos

MECANISMOS BASICOS DE INFERENCIA PARA PROGRAMACION DE LOGICA

La Programación Lógica estudia el uso de la lógica para el planteamiento de problemas y el control sobre las reglas de inferencia para alcanzar la solución automática. La Programación Lógica, junto con la funcional, forma parte de lo que se conoce como Programación Declarativa, es decir la programación consiste en indicar como resolver un problema mediante sentencias, en la Programación Lógica, se trabaja en una forma descriptiva, estableciendo relaciones entre entidades, indicando no como, sino que hacer. Las características de la programación lógica son las siguientes:

· Unificación de términos · Mecanismos de inferencia automática · Visión lógica de la computación

Page 39: Tabajo de base de datos

SISTEMA DE LENGUAJE LOGICO DE DATOS

Un lenguaje es el CLP pero el lenguaje de programación lógica por excelencia es el PROLOG, este es un Lenguaje de Programación diseñado para representar y utilizar el conocimiento que se tiene sobre un determinado dominio. Los programas en Prolog responden preguntas sobre el tema del cual tienes conocimiento.

Escribir un programa en Prolog consiste en declarar el conocimiento disponible acerca de objetos, además de sus relaciones y sus reglas, en lugar de correr un programa para obtener una solución, se hace una pregunta, el programa revisa la base de datos para encontrar la solución a la pregunta, si existe más de una solución, Prolog hace un barrido para encontrar soluciones distintas. El propio sistema es el que deduce las respuestas a las preguntas que se le plantean, dichas respuestas las deduce del conocimiento obtenido por el conjunto de reglas dadas.

Page 40: Tabajo de base de datos

BASES DE DATOS ACTIVAS

Tradicionalmente, los SGBD han sido pasivos, pero muchas aplicaciones como el control de procesos, las redes de generación / distribución de energía eléctrica, el control automatizado del flujo de trabajo de una oficina, el intercambio de programas, la gestión de batallas y la vigilancia de pacientes hospitalarios no reciben un servicio adecuado de estos SGBD "pasivos". En estas aplicaciones restringidas por el tiempo, es preciso vigilar la ocurrencia de condiciones definidas sobre estados de la base de datos y, en caso de ocurrir, invocar acciones específicas, quizá sujetas a ciertas restricciones de tiempo. Una posible situación en la fabricación automatizada consistiría en vigilar la ocurrencia de un suceso, evaluar una condición y emprender una o más acciones. En todo esto puede caber el acceso a bases de datos compartidas que varios usuarios estén actualizando constantemente y que deban mantenerse en un estado. Para resolver este problema se pudiera escribir un programa que consulte periódicamente la BD para determinar si ha ocurrido la situación que se espera , o incorporar código en cada uno de los programas que actualizan la BD de modo que verifiquen si se ha presentado la situación que se vigila. Estas son las bases de datos activas.

Page 41: Tabajo de base de datos

BASES DE DATOS MULTIMEDIA

Una base de datos multimedia es una base de datos que alberga uno o más tipos de archivos de los medios de

comunicación principales como. Txt (documentos), Jpg (imágenes), Swf (vídeos),. Mp3 (audio), etc., y poco se dividen en tres categorías principales:

· Los medios de comunicación (independientes del tiempo, es decir, imágenes y escritura)

· Medios dinámicos (en función del tiempo, es decir, video y sonido bytes)

· Dimensional medios de comunicación (es decir, los juegos 3D o con ayuda de computadoras, elaboración de programas de CAD). Todos los principales medios de comunicación se guardan en los archivos de cadenas binarias de ceros y unos, y se codifican de acuerdo con el tipo de archivo.

Page 42: Tabajo de base de datos

BASES DE DATOS ESPACIALES Y TEMPORALES

Los sistemas de bases de datos espacio-temporales integran características de las bases de datos espaciales o multidimensionales, con características de las bases de datos temporales, para permitir de manera eficiente, consultas que involucran ambos aspectos. Una aplicación común soportada por este modelo es la que realiza el seguimiento de objetos en movimientos que reportan su ubicación mediante dispositivos GPS. En otras aplicaciones, en lugar de cambiar de ubicación, los objetos pueden cambiar de forma, e incluso de identidad. Los DBMS tradicionales no tienen incorporadas las dimensiones de tiempo y espacio, por lo cual es difícil especificar consultas que combinan estos aspectos. Inicialmente se desarrollaron los sistemas de bases de datos espaciales, y los sistemas de bases de datos temporales, por separado. Comenzaremos viendo una introducción a cada una de ellas, para luego describir los sistemas de bases de datos espacio-temporales.

Page 43: Tabajo de base de datos

LENGUAJE DE TERCERA Y CUARTA GENERACION

Los lenguajes de tercera generación (3GL; third-generation languages) son los lenguajes propiamente como los conocemos (poseen instrucciones, funciones, sintaxis, semántica); ya trascienden el uso de los términos nemotécnicos. Una instrucción puede indicar una o más tareas para el computador.

Los lenguajes 4GL son Generadores de aplicaciones que no dependen de una metodología. Lo que en un lenguaje de tercera generación (3GL) como COBOL requiere cientos de líneas de código, tan solo necesita diez o veinte líneas en un 4GL. Comparado con un 3GL, que es procedural, un 4GL es un lenguaje no procedural: el usuario define qué se debe hacer, no cómo debe hacerse. Los 4GL se apoyan en unas herramientas de mucho más alto nivel denominadas herramientas de cuarta generación. El usuario no debe definir los pasos a seguir en un programa para realizar una determinada tarea, tan sólo debe definir una serie de parámetros que estas herramientas utilizarán para generar un programa de aplicación.

Page 44: Tabajo de base de datos

TENDENCIAS FUTURAS

Dentro del panorama futuro de las bases de datos múltiples hay un aspecto importante que considerar, el inusitado éxito del World Wide Web (WWW o, de forma abreviada, "el web") como medio de publicación de documentos y como medio de intercambio de información. El WWW proporciona uno de los medios más heterogéneos y retadores en el campo de la interoperabilidad. Recientemente han surgido tecnologías y estándares enfocados a hacer del web una infraestructura escalable y manejable. Una de dichas tecnologías es XML [4] (eXtensible Markup Language), sobre la cual la comunidad científica tiene muchas expectativas. Una de ellas es que XML convierta a Internet en un sistema de bases de datos, haciendo posible especificar consultas en el estilo de los manejadores de bases de datos tradicionales lo cual da muchos mejores resultados que las actuales máquinas de búsqueda.