Upload
luisa-canto
View
7
Download
0
Embed Size (px)
Citation preview
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES WEB
Sesión IV:
Metadatos y metainformación
GEMA BUENO DE LA FUENTEUNIVERSIDAD CARLOS III DE MADRID
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
METADATOS Y METAINFORMACIÓN EN LA AI
Cualquier repositorio de contenidos Web sin metadatos es como una biblioteca sin un índice. Más que los
usuarios, el personal no sabría dónde poner las cosas y encontrarlas de nuevo. Los metadatos son la clave para conseguir que las máquinas guarden los contenidos y los encuentren cuando sea necesario –abriendo las
puertas al 80% de la información de una organización que no reside en una base de datos. (Interwoven, 2001)
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Contenidos
• Metadatos para el diseño de sedes web.• Concepto de metadatos y metainformación.• Marcado procedural y descriptivo.• Metadatos y descripción de los contenidos de la
sede.• Metadatos e indización de contenidos.• Prácticas.
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
METADATOS Y METAINFORMACIÓN EN LA AI
Metadatos para el diseño de sedes Web: Implicaciones, concepto y
matices.
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
¿Qué son los metadatos/metainformación?
• Meta-datos: 'junto a', 'después de', 'entre' o 'con'.
• Por definición: información descriptiva 'junto a', 'después de', 'entre' o 'con' (incluso, ‘sobre’) los datos.
• Ejemplos tradicionales son: las fichas de catálogo, los registros de una base de datos bibliográfica.
• En la Web: información descriptiva (ej. etiquetas META) del contenido de un recurso electrónico.
• A pesar de la simplicidad de la definición, los metadatos albergan una gran complejidad, dimensiones e importancia en la arquitectura de la información.
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Metadatos son...
• Datos que soportan operaciones llevadas a cabo con OBJETOS DE INFORMACIÓN de la Red.
• Evitan al usuario la necesidad de tener que poseer un conocimiento completo de las características de los recursos.
• Estructuras de organización de la información legibles por máquina.
• Destinados a ordenar y describir la información contenida en un e-documento.
• Para: hacer útiles los datos.
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Metadatos son...
... Datos
... Datos sobre datos
... Descripciones estructuradas de un objeto de información.
... Un conjunto de elementos y atributos para caracterizar la información.
... Estándares para describir objetos de datos discretos, que precisan de una semántica y estructura.
Su finalidad es...... Describir y recuperar información Web.... Fundamentar SRI de sistemas y servicios de
información digital.
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Metadatos ¿por qué?
• Justificación tradicional: – Para describir la información existente. – Para organizar el conocimiento.– Para poder encontrar y utilizar dicha información y/o
conocimiento.
• Justificación en entorno Web:– Gran volumen de información en formato electrónico.– Necesidad de aunar recursos en la Web (verticalización de la
información: Sedes Web especializadas-Modelos de metadatos específicos).
– Valor añadido al Web (AI): Oportunidad de proporcionar a los profesionales servicios de mayor calidad (precisión y relevancía) que Google, etc.
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Metadatos ¿para qué?
recuperación de recursos
administración de documentos
gestión de derechos
valoración de contenidos
seguridad y
autentificación
estado de
archivo
productos y
servicios
esquemas de
bases de datos
control o
descripción de procesos
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Metadatos para el diseño de sedes web
• Metaetiquetas HTML (head)• Promoción del Web (mediante software especializado)• Búsqueda all-the-web: dirigidos a buscadores de
carácter global.• Spamming Otras técnicas de cálculo de la relevancia
(Google-page rank)• Análisis cibermétricos• Visibilidad a niveles científicos: OAI
Búsqueda: Visibilidad y posicionamientoBúsqueda: Visibilidad y posicionamiento
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Metadatos para el diseño de sedes web
• Findability (Facilidad de búsqueda“encontrabilidad”): el arte de conseguir que un usuario encuentre lo que necesita en una web (Rosenfeld)
• Búsqueda interna en una sede Web:– Motor de búsqueda interno– Clasificación automática (elemento de metadatos de
descripción de materias. P. ej. DC.Subject)
• Desarrollo: schema de metadatos-sistema de recuperación cualificado orientado a metadatos
• Complejidad e interrelación de metadatos orientados a la búsqueda (all-the-web y/o Findability): Ej.
Búsqueda: “Findability”Búsqueda: “Findability”
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Ejemplo: AVEL http://avel.edu.au
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Metadatos para el diseño de sedes web
• Objetivo: gestión flexible de contenidos distribuidos.• Precisan el carácter de los contenidos del sitio web o de las
páginas que lo componen:– Alcance– Objetivos particulares de una sede (dominios/comunidades).
Distintos modelos de metadatos (Web disciplinar)– A qué usuarios están dirigidos (valoración)– Descripción multilingüe– Usuarios / utilidad de los datos
• Dos niveles: – Nivel de descripción del recurso: formal– Nivel de descripción temática: ontologías, tesauros
(metadatos dependientes del contenido)
Descripción de contenidosDescripción de contenidos
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Metadatos para el diseño de sedes web
• Parte de la AI en CMS y Bloggers.• Importancia en la actualización de contenidos. Compartir
información de noticias• RSS (Rich/RDF Site Summary): formato de intercambio
de contenidos para crear canales de publicación que pueden leerse con programas específicos tipo: NewsGator, Freereader (ej.)
• Conlleva otro tipo de “visibilidad” Web.
Agregación y sindicación de contenidosAgregación y sindicación de contenidos
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Metadatos para el diseño de sedes web
• Los metadatos mejoran la accesibilidad al contenido: – WCAG (Web Content Accesibility Guidelines)
http://www.w3.org/TR/WAI-WEBCONTENT/ Pauta 13: Proporcione mecanismos claros de navegación. Verificación 13.2. Proporcione metadatos para añadir información semántica a las páginas y sitios web. (Nivel AA).
• Acceso vs. Accesibilidad: “estar” accesible (disponible) / “ser” accesible.
AccesibilidadAccesibilidad
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Metadatos para el diseño de sedes web
• EARL: Evaluation And Report Language 1.0 Schema– Documento de trabajo del W3C: http://www.w3.org/TR/EARL10/– Es un lenguaje (vocabulario RDF Resource Description Framework)
para expresar un tipo de metainformación específica: los resultados de los test de accesibilidad.
– EARL es un lenguaje sencillo que permite establecer resultados de test para cualquier cuestión de accesibilidad analizada (web, herramienta de autor, etc.) según un conjunto de criterios.
– Al igual que otras expresiones RDF está compuesto de tres elementos atributo-propiedad-valor (sujeto-verbo-predicado): Assertor-asserts-assertion.
– Elementos básicos: Assertor, Assertion, TestSubject, TestMode, TestCase, TestResult, ValidityLevel, ConfidenceLevel, Software y WebContent.
AccesibilidadAccesibilidad
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Metadatos para el diseño de sedes web
• Conjunto de tecnologías para la organización y representación del conocimiento digital.
• Objetivos: – Proporcionar un acceso inteligente a la información heterogénea y
distribuida en la WWW, posibilitando a los agentes de software mediar entre las necesidades de los usuarios y los recursos de información disponibles.
– Creación de una Web de datos con significado, de tal forma que un programa de ordenador pueda aprender tanto acerca de lo que quieren decir los datos, como acerca de la información necesaria para procesarlos.
• Procesamiento global e interoperable de la información Web (marcado semántico XML + estructuras de metadatos).
Web Semántica (SW)Web Semántica (SW) http://www.w3.org/2001/sw/
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Metadatos para el diseño de sedes web
• Lenguajes formales como: DAML+OIL, RDF, OWL
• Metadatos y esquemas de metadatos (DCMI: infraestructura operacional de la SW).
• Ontologías: – tanto específicas de un dominio, como ontologías de
alto nivel, de tal forma que se proporcionen relaciones entre ontologías para la recuperación, el intercambio y la integración de la información interdisciplinar en la Web
Web Semántica (SW)Web Semántica (SW) http://www.w3.org/2001/sw/
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Metadatos para el diseño de sedes web
Web Semántica (SW)Web Semántica (SW) http://www.w3.org/2001/sw/
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Metadatos para el diseño de sedes web
• Los Servicios Web son aplicaciones de software que pueden localizarse y recuperarse, describirse y accederse gracias a XML y a protocolos web normalizados [HTTP y SOAP], a través de intranets, extranets y de Internet.
• Objetivo: permitir que un usuario (humano o aplicación software) pueda lanzar una búsqueda de información sobre gestores de contenidos en un dominio de aplicación (agencias de noticias, portales B2B, etc.).
• Funciones de los metadatos en WS:– Sindicación– Transformación de datos– Traducción a otros idiomas– Creación y autoría de contenidos distribuidos (interoperabilidad).
• XML+distribución de contenidos+gestión de metadatos.
Servicios Web (WS)Servicios Web (WS) http://www.w3.org/2002/ws/
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
BACK-END
Contenidos
estructura
navegación
rotulado
búsqueda y feedback
hardware
software
programación
FRONT-END
(Arquitectura de la Información)
Recordemos...DIMENSIONES DEL DISEÑO DE
SEDES WEB
pro
toti
pad
o
Recordemos...DIMENSIONES DEL DISEÑO DE
SEDES WEB
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Ejemplo de codificación de metadatos en una sede Web (DCMI)
http://dublincore.org/index.shtml.rdf
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Ejemplo de codificación de metadatos en una sede Web (DCMI)
http://dublincore.org/index.shtml.rdf
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Ejemplo de codificación de metadatos en una sede Web (DCMI)
Metadatos descriptivos embebidos (HTML)Metadatos descriptivos embebidos (HTML)
Metadatos para la sindicación de noticias (RSS)Metadatos para la sindicación de noticias (RSS)
Metadatos descriptivos (RDF vinculado link rel)Metadatos descriptivos (RDF vinculado link rel)
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Ejemplo de codificación de metadatos en una sede Web (DCMI)
http://dublincore.org/news.rss http://dublincore.org/news.rss Metadatos para la sindicación de noticias (RSS)Metadatos para la sindicación de noticias (RSS)
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Edición digital:Publicación de
contenidos
Edición digital:Publicación de
contenidosIdentificar y localizar cada
DLO
Identificar y localizar cada
DLO
Organización
de contenidos
Organización
de contenidos
Interoperabilidad entre sistemas
distribuidos
Interoperabilidad entre sistemas
distribuidos
Preservar y conservar el cont. digital
Preservar y conservar el cont. digital
Descripción de DLOs
(Metadatos)
Descripción de DLOs
(Metadatos)
Recuperación de DLOs
Recuperación de DLOs
Facilitar la
accesibilidad
Facilitar la
accesibilidad
Visión particular de la AI y función de los metadatos
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Tipos de metadatos
• Clasificación Funcional:• Administrativos• Descriptivos• Conservación• Técnicos• Uso
• Esquema Dublin Core:• Administrativos• Descriptivos• Estructurales
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Estado actual de la teoría de metadatos
La estructura y semántica de los modelos de metadatos aplicados a la recuperación es factible, aplicable y operativa en entornos de información abarcables,
definidos y finitos (p. ej. una sede Web).
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
3 Niveles de metainformación:– Metadatos recuperación-sistema– Metaetiquetas de búsqueda Web– Metadatos de usuario/servicio
Búsqueda en SRII
Búsqueda global Integrada
Búsqueda local Búsqueda en BD propia
Búsqueda texto completo
Búsqueda global
Definición de tipos de metadatos (finalidad)
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
METADATOS Y METAINFORMACIÓN EN LA AI
Marcado semántico y procedural
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
WWW: Marcado/edición digital
• Marcado de procedimiento o procesado (procedural): relativo a la apariencia física o de formato, restrictivo a cada sistema de edición electrónica de documentos, que no tiene ninguna implicación expresa para el contenido del documento.
• Marcado descriptivo o declarativo: identifica los elementos estructurales de un documento, determinando su estructura lógica. Se describe la estructura y/o el contenido de un documento– el contenido de los documentos marcados descriptivamente
puede reutilizarse con distintas finalidades (p. ej., la identificación de los elementos que describen un documento desde el punto de vista bibliográfico: título, autor, etc., y/o de contenido= Metadatos: marcado semántico).
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Metainformación & Marcado
ESTRUCTURALenguajes de marcado:
HTMLXHTML
XMLSMIL/SVG
ESTRUCTURALenguajes de marcado:
HTMLXHTML
XMLSMIL/SVG
PRESENTACIÓN
Hojas de estilo
CSS
XSLT
PRESENTACIÓN
Hojas de estilo
CSS
XSLT
Semántica que no se ve (metadatos)
Semántica que no se ve (metadatos)
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
WWW: Lenguajes de marcado
• HTML– Estándar para formatear la información publicada en Ia Web,
distribuida a través de HTTP.– Diseñado principalmente para visualización de datos y se centra
en cómo aparece la información, no en su estructura.– Pobre mecanismo de descripción: metaetiquetas.
• XML– Subconjunto/simplificación de SGML: Lenguaje de marcas que
añade información estructural y semántica (metadatos) a los propios datos.
– Enfocado a la descripción, no a la visualización.– Metalenguaje que sirve para definir otros lenguajes de propósito
específico (v.g., XHTML, WML, XSL, RDF, etc.)– Múltiples representaciones de la información a través de
metadatos.
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Modelos/formatos/esquemas... ...estándares de metadatos
RDF: metamodelo de metadatosXMLXMLXMLXML DCMIDCMIDCMIDCMIRDFMS RDFS
Perfiles de aplicación
Metadatos de propósito generalXML autodescriptivo
Etiquetas <meta> HTML
DCMI
Metadatos de propósito específico– TEI-H– Otros esquemas: VRA, DIG35,
MPEG7, EdNA, IMS, AGLS, GILS, FGDC
– DCMI
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
METADATOS Y METAINFORMACIÓN EN LA AI
Descripción e indización de contenidos de la sede: DCMI + estructuras de
codificación de metadatos
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Metadatos de propósito general: DCMI
• Un mecanismo básico de descripción que: – Puede usarse en todos los dominios.– Para todo tipo de recursos.– Es sencillo, pero potente.– Puede extenderse fácilmente.– Puede trabajar conjuntamente con otras soluciones
específicas.
• Para ayudar a la recuperación de información en la Web
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Dublin Core - DCMI (1995-2003)
• Nace de la imposibilidad de catalogar la Web.• Para mejorar la recuperación de información a
través de la inclusión de catalogación de metadatos de autor embebidos.
• Inicialmente: 13 elementos para describir recursos / 15 elementos (1996).
• DCq (Dublin Core Qualified)• Integración RDF.
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Metadatos Dublin Core
• 15 elementos básicos:– Título, Creador, Colaborador, Editor, Fecha de publicación,
Identificador (URI), Materia, Descripción, Cobertura, Tipo de recurso, Idioma, Formato, Fuente, Relación con otros documentos, Derechos.
• Detalles adicionales: Cualificadores– Matizaciones: p.ej. Date.Created (fecha de creación),
Relation.IsPartOf (relacionado por ser parte de)– Vocabularios controlados (p. ej. Encabezamientos de materia
normalizados, clasificaciones, nombres geográficos) – Tipos de datos (formatos de fecha/tiempo, tipos MIME)
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Tabla de elementos de Dublin Core
Contenido Propiedad Intelectual TemporalidadEjemplo
Title Creator DateSubject Publisher TypeDescription Contributor FormatSource Rights IdentifierLanguageRelationCoverage
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Dublin Core en la Web
• Estándar de metadatos con más éxito en la Web• Uso creciente en dominios específicos:
– Información del Sector Público y del Estado– Gestión del conocimiento corporativo
• Fundamento esencial en la Web Semántica
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
• Motores de búsqueda no soportan DC (sólo algunos search engines)
• Falta de reglas y principios directores que aseguren la calidad del contenido.
• No responsabilidad formal.• Ausencia de masa crítica.
Críticas al DC (1997-98)
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
• Simplicidad.• Responsabilidad formal consorciada: DCMI• Independencia sintáctica.
– Integración en la nueva estructuración de la información (XML/RDF)
• Norma ANSI/NISO Z39.85-2001.• Norma ISO 15836-2003 (08/04).• PNE 15836-2005 (Aenor, en español)
Fortalezas del DC (2000-05)
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Actividades de la DCMI
• Desarrollar y mantener estándares.• Dar soporte al desarrollo de herramientas,
servicios e infraestructuras.• Establecer un gran alcance educativo.• Establecer relaciones entre comunidades de
información (interoperabilidad).
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Principales temas
• Expresar metadatos Dublin Core metadata en (X)HTML, XML, RDF/XML, etc.
• Extensión y uso del DC a dominios específicos de información (Perfiles de aplicación).
• El Registro del esquema DCMI (diccionario).• Citación, Agentes, Colecciones.• Soporte para el desarrollo de herramientas.
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Relaciones de la DCMI
• IMS y IEEE/Learning Object Metadata– Discutiendo la cooperación y armonización
• MARC y MODS– Discutiendo la transformación-compatibilidad [mapping]
de estándares
• OAI (Iniciativa de Archivos Abiertos)– Coordinando especificaciones y guías
• Instituciones de normalización formal: ISO, NISO, CEN
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Información útil
• Especificaciones– Conjunto de elementos, calificadores, vocabularios
• Guías de uso General – “Utilización del Dublin Core”
• Guías de codificación– (X)HTML, RFC2413 (en revisión)– XML, Recomendación de la DCMI, Abril 2003– RDF, Recomendación de la DCMI, Julio de 2002
DCMI: http://dublincore.org
Mirror en español: http://es.dublincore.org
Lista DCMI-ES: http://www.rediris.es/list/info/dcmi-es.es.html
DCMI: http://dublincore.org
Mirror en español: http://es.dublincore.org
Lista DCMI-ES: http://www.rediris.es/list/info/dcmi-es.es.html
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
DC-Lib: Perfil de aplicación de Dublin Core para bibliotecas
• Un perfil de aplicación es un esquema (schema) de metadatos que consiste en un conjunto de elementos trazados o seleccionados a partir de uno o varios espacios de nombres (namespaces), combinados por los desarrolladores de un determinado formato (como el DC) y optimizados para una aplicación particular, como por ejemplo las bibliotecas (library application profile) DC-Lib
• Usos posibles DC-Lib:– servir de formato de intercambio entre diversos sistemas que empleen
estándares de metadatos distintos– recolectar metadatos de fuentes de datos dentro y fuera del ámbito bibliotecario– apoyar la creación simple de registros catalográficos de la biblioteca para
recursos de una variedad de sistemas– exponer datos MARC a otras comunidades (con conversión a DC)– permitir la adquisición de metadatos de identificación de recursos para creadores
no bibliotecarios que usen DC.
Perfil de Aplicación (AP):Perfil de Aplicación (AP):
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
DC-Lib: Perfil de aplicación de Dublin Core para bibliotecas
• DC-Lib se compone de varios namespaces: – Dublin Core Metadata Element Set, Versión 1.1
[http://purl.org/dc/elements/1.1/] – Cualificadores Dublin Core [http://purl.org/dc/terms/] – Dublin Core Type Vocabulary
[http://dublincore.org/usage/terms/dcmitype/] – Dublin Core schemes de codificación– [http://dublincore.org/usage/terms/dc/current-schemes/] – Elementos MODS (Metadata Objects Description Schema)
[http://www.loc.gov/mods] : Location y Edition– Elementos DC-Ed (Perfil de Aplicación de DC para Educación)
[http://dublincore.org/groups/education/]: Audience.
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Metadatos: propósito específico
• Algunos dominios científicos (Internet communities) tienen mecanismos de descripción sofisticados, que plasman en sus sedes Web:– Bibliotecas (MARC, Z39.50)– Archivos (EAD)– Educación (IMS, IEEE/LOM)– Información Geográfica (FGDC, ISO19115)
• Estos estándares específicos pueden transformarse al Dublin Core (p. ej. OAI)
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECASPapel de los metadatos
Tipos de esquemas de metadatos (dominio)
Usos genéricosUsos genéricos
Creación de datos
Gestión de datos
DominiosDominios GEOESPACIAL
HUMANIDADES
GOBIERNO
IMAGEN
EDUCACIÓN
Rec. de Inf.
Comercio-E
Interoperabilidad
Accesibilidad
Conservación
Valoración
Rec. de Rec. de I Infnf..Rec. de Rec. de I Infnf..
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Basado en XML (eXtensible Mark-up Language)
Más que un mero formato de metadatos. Infraestructura de Descripción de recursos. RDF propone un modelo de datos coherente y un
marco sintáctico para los distintos modelos (ej. MARC, DC, TEI, GILS, EAD...etc.)
Resource Description Framework
RDF: http://www.w3.org/RDF RDF: http://www.w3.org/RDF
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
• El modelo de datos que propone RDF consiste en tres tipos de objetos:
Recursos
Tipos de propiedades
Descripciones
Recurso VALORTIPO DE
PROPIEDAD
Propiedad / descripción
RDF: Modelo de datos
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
DC en RDF
<?xml version="1.0" ?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/"> <rdf:Description rdf:about="http://dublincore.org/"> <dc:title>Dublin Core Metadata Initiative (DCMI) Home Page</dc:title> <dc:description>The Dublin Core Metadata Initiative is an open forum
engaged in the development of interoperable online metadata standards that support a broad range of purposes and business models. DCMI's activities include consensus-driven working groups, global workshops, conferences, standards liaison, and educational efforts to promote widespread acceptance of metadata standards and practices.</dc:description>
<dc:date>2003-11-03</dc:date> <dc:format>text/html</dc:format><dc:language>en</dc:language> <dc:contributor>Dublin Core Metadata Initiative</dc:contributor> </rdf:Description></rdf:RDF>
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
DC en XML
<?xml version="1.0"?> <metadata xmlns="http://example.org/myapp/"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://example.org/myapp/ http://example.org/myapp/schema.xsd" xmlns:dc="http://purl.org/dc/elements/1.1/">
<dc:title> UKOLN </dc:title> <dc:description> UKOLN is a national focus of expertise in digital
information management. It provides policy, research and awareness services to the UK library, information and cultural heritage communities. UKOLN is based at the University of Bath. </dc:description>
<dc:publisher> UKOLN, University of Bath </dc:publisher><dc:identifier> http://www.ukoln.ac.uk/ </dc:identifier></metadata>
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
DC en HTML/XHTML
<head profile="http://dublincore.org/documents/dcq-html/"> <title>Expressing Dublin Core in HTML/XHTML meta and link elements</title> <link rel="schema.DC" href="http://purl.org/dc/elements/1.1/" /> <link rel="schema.DCTERMS" href="http://purl.org/dc/terms/" /> <meta name="DC.title" lang="en" content="Expressing Dublin Core in
HTML/XHTML meta and link elements" /> <meta name="DC.creator" content="Andy Powell, UKOLN, University of Bath" /> <meta name="DCTERMS.issued" scheme="DCTERMS.W3CDTF" content="2003-
11-01" /> <meta name="DC.identifier" scheme="DCTERMS.URI"
content="http://dublincore.org/documents/dcq-html/" /><link rel="DCTERMS.replaces" hreflang="en"
href="http://dublincore.org/documents/2000/08/15/dcq-html/" /> <meta name="DCTERMS.abstract" content="This document describes how
qualified Dublin Core metadata can be encoded in HTML/XHTML <meta> elements" />
<meta name="DC.format" scheme="DCTERMS.IMT" content="text/html" /><meta name="DC.type" scheme="DCTERMS.DCMIType" content="Text" /></head>
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
METADATOS Y METAINFORMACIÓN EN LA AI
Metadatos en la Indización de contenidos
(Software y ejemplos)
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Metadatos para la indización
1. Indización genérica: promoción del Web (metaetiquetas): embebida en el código fuente HTML/XHTML
2. Indización de un sitio o sede web (conjunto finito de DLOs): Portales, Pasarelas temáticas (subject gateways), Sitios web institucionales, Servicios web (comercio electrónico, etc.) – Sistema de indización propietario (parte del CMS)– Distintos tipos de almacenamiento:
• Indización embebida• Indización externa
– Ficheros externos XML– Elemento link– Bases de datos, etc.
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
• Proceso sencillo de incorporación de etiquetas <META>
• Sintaxis HTML– Descriptores libres (keywords)– Resumen de autor (description)– Semántica DC en el <HEAD>
• Finalidad: aumentar la visibilidad de los recursos... poco útil
Edición de metaetiquetas
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Edición de metaetiquetas: TagGen 4.5
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Edición de metaetiquetas + indización automática: AutoMetatags
Indización automática sobre el documento Web
Título automático
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Realidad de las metaetiquetas en los Sistemas de búsqueda
• Muchos de ellos no las tienen en cuenta para el cálculo de la relevancia
– AltaVista: las metatags oportunidad para el abuso y el spamming.
– Excite: <META NAME="description"> para ofrecer el resumen de los resultados.
• Otros sistemas alternativos: page rank Google
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Edición de metadatos
• Proceso complejo que requiere una planificación a distintos niveles:
– Entorno informativo (selección/producción de documento-e)
– Sintaxis XML/SGML– Modelo o schema– Almacenamiento– Vocabulario o scheme
• Finalidad: Crear sistemas de información• Herramientas (edición de esquemas): Reggie,
Mantis, Metabrowser
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
Realidad de los metadadatos en los Sistemas de indización y búsqueda
• Dublin Core:– Ultraseek (Verity)– Swish-E– Microsoft's Index Server– Blue Angel Technologies MetaStar– Verity Search97 Information Server
http://www.lii.org/
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
METADATOS Y METAINFORMACIÓN EN LA AI
Para saber más...
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
• AGLS Australian Government Locator Service: http://www.naa.gov.au/recordkeeping/gov_online/agls/summary.html
• CIMI Consortium for the Computer Interchange of Museums Information http://www.cimi.org/publications.html
• DCMI Dublin Core Metadata Initiative: http://www.dublincore.org• DCMI-ES Mirror en español de la DCMI: http://es.dublincore.org • DCMES Dublin Core Metadata Element Set (ISO 15836-2003):
http://www.niso.org/international/SC4/n515.pdf• e-GMS e-Government Metadata Standard• http://www.govtalk.gov.uk/schemasstandards/metadata.asp • EAD Encoded Archival Description: http://www.loc.gov/ead • EdNA Educational Network Australia: http://www.edna.edu.au/metadata• FGDC Federal Geographic Data Committee: http://www.fgdc.gov• GEM Gateway to Educational Materials:http://www.thegateway.org/ • GILS Global Information Locator Service: http://
www.gils.net/standards.html
Sobre esquemas de metadatos...
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
• IEEE/LOM Learning Object Metadata: http://ltsc.ieee.org/wg12 • IMS Instructional Management Systems: http://www.imsproject.org• MODS Metadata Object Description Schema: http://
www.loc.gov/standards/mods • NDLTD Networked Digital Library of Theses and Dissertations: http://
www.theses.org • NZGLS New Zealand Government Locator Service:
http://www.e-government.govt.nz/nzgls • OAI Open Archives Initiative: http://www.openarchives.org • ONIX Online Information eXchange: http://www.editeur.org/onix.html • PADI Preserving Access to Digital Information: http://www.nla.gov.au/padi• RDF Resource Description Framework: http://www.w3.org/RDF • SW Semantic Web (W3C): http://www.w3.org/2001/sw • TEI Text Encoding Initiative: http://www.tei-c.org • W3C World-Wide Web Consortium: http://www.w3.org• XML eXtensible Markup Language: http://www.w3.org/XML
Sobre esquemas de metadatos...
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
• ADAM Art, Design, Architecture & Media Information Gateway: http://www.adam.ac.uk
• ADL Alexandria Digital Library: http://www.alexandria.ucsb.edu• ADT Australian Digital Theses Project: http://adt.caul.edu.au• AER Archivos Españoles en Red: http://aer.mcu.es/sgae/index_aer.jsp • AGNIC, Agriculture Network Information Center: http://www.agnic.org• AGRIGATE Agriculture Information Gateway for Australian Researchers:
http://www.agrigate.edu.au • ASGF Australian Subject Gateways Forum http://
www.nla.gov.au/initiatives/sg/gateways.html• AHDS, Arts and Humanities Data Service: http://ahds.ac.uk• AVEL Australian Virtual Engineering Library: http://avel.edu.au• EELS Engineering E-Library, Sweden: http://eels.lub.lu.se• EEVL Edinburgh Engineering Virtual Library: http://www.eevl.ac.uk• ELISE Electronic Library Image Service for Europe
http://nile.dmu.ac.uk/elise/e2_intro.html
Sobre sistemas de información Web...
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
• FEDORA Flexible and Extensible Digital Object and Repository Architecture: http://www.fedora.info
• GTEL Georgia Tech Electronic Library: http://www.library.gatech.edu• LETRS Library Electronic Text Resource Service http://
www.letrs.indiana.edu• MOA The Making Of America: http://moa.umdl.umich.edu; http://
moa.cit.cornell.edu/moa/index.html; • MOA II http://sunsite.berkeley.edu/moa2• NZGP New Zealand Government Portal: http://www.govt.nz• OMNI Organising Medical Networked Information: http://omni.ac.uk• ROADS Resource Organisation And Discovery in Subject-based Services
http://www.ilrt.bris.ac.uk/roads• SOSIG Social Science Information Gateway: http://sosig.ac.uk• VADS Visual Arts Data Service: http://vads.ahds.ac.uk ; http://
vads.ahds.ac.uk/search.html
Sobre sistemas de información Web...
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
• AAT Arts & Architecture Thesaurus: http://www.getty.edu/research/tools/vocabulary/aat
• AGIFT Australian Governments' Interactiva Functional Thesaurus http://www.naa.gov.au/recordkeeping/gov_online/agift/summary.html
• TGN Thesaurus of Geographical Names: http://www.getty.edu/research/tools/vocabulary/tgn
• ULAN: Union List of Artist Names http://www.getty.edu/research/tools/vocabulary/ulan
• Proyecto SKOS: Simple Knowledge Organisation Systems: http://www.w3.org/2001/sw/Europe/reports/thes/1.0/guide
Algunos schemes de contenido...
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
• AHMED, Kal, et al. Professional XML Meta Data. Birmingham: Wrox Press, 2001.
• BACA, Murtha (ed.). Introducción a los Metadatos: vías a la información digital. Los Angeles: J. Paul Getty Trust, 1999
• BERNERS-LEE, Tim. Tejiendo la red: el inventor del World Wide Web nos descubre su origen. Madrid: Siglo veintiuno, 2000.
• CAPLAN, Priscilla. Metadata Fundamentals for All Librarians. Chicago: ALA, 2003.
• CATALOGING the Web: Metadata, AACR, and MARC 21. Wayne Jones, Judith R. Ahronheim, and Josephine Crawford, eds. Lanham: Scarecrow Press, 2002.
• GREENBERG, Jane (ed.). Metadata and Organizing Educational Resources on the Internet. New York, London, Oxford: The Harworth Information Press, 2000.
• DACONTA, Michael C., Leo J. Obrst, Kevin T. Smith. The Semantic Web: A Guide to the Future of XML, Web Services, and Knowledge Management. New York, etc.: Wiley Computer Publishing, John Wiley & Sons, 2003
Recursos bibliográficos
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS
• HEERY, Rachel, Manjula Patel. Application profiles: mixing and matching metadata schemas. [En línea] Ariadne Issue 25, 2000. Disponible en: http://www.ariadne.ac.uk/issue25/app-profiles. [Consulta: 12/05/2005]
• HJELM, Johan. Creating the Semantic Web with RDF: Professional Developer's Guide. New York, etc.: Wiley Computer Publishing, John Wiley & Sons, 2001.
• HUDGINS, Jean, Grace Agnew, Elizabeth Brown. Getting Mileage out of Metadata: Applications for the Library. Chicago: ALA, 1999.
• MÉNDEZ RODRÍGUEZ, Eva Mª. Metadatos y recuperación de información: estándares, problemas y aplicabilidad en bibliotecas digitales. Gijón: Trea, 2002.
• TANNENBAUM, Adrienne. Metadata Solutions: Using Metamodels, Repositories, XML, and Enterprise Portals to Generate Information on Demand. Addison-Wesley, 2001.
Recursos bibliográficos