Universidad Nacional del Altiplano Puno
Curso DSpaceTítulo: Introducción a DSpace
Presenta: Elwin L. Huaman Quispe 1
Objetivos de este curso
Al final de esta presentación el participante:
● Conocerá la historia de DSpace● Entenderá que es DSpace, y para qué puede ser usado● Conocerá sobre la instalación de DSpace● Conocerá las características de DSpace y como está organizado● Sabrá conceptos básicos sobre Repositorios Institucionales (RI)● Sabrá las ventajas que supone implementar un RI● Otros.
2
Un poco de Historia
3
● 2002, Desarrollado por MIT y HP● 2005, DSpace 1.3 ● 2007 Julio, HP y MIT fundaron DSpace Foundation (soporte)● 2009 Mayo, Fedora Commons y la Fundación DSpace crearon la DuraSpace que
tiene la misión de proporcionar liderazgo e innovacion en tecnologias open source principalmente para bibliotecas, centros de investigación y organizaciones de patrimonio cultural.
● 2016 Marzo, La última versión estable es la 5.4 Link
Conceptos clave
4
● Repositorio: Un repositorio es una infraestructura web capaz de brindar un conjunto de servicios a una comunidad, destinados a recopilar, gestionar, difundir y preservar contenidos a través de una colección organizada y accesible en abierto y que pueda interoperar con otros repositorios.
● Preservación: Conjunto de prácticas de naturaleza política, estratégica y acciones concretas, destinadas a asegurar el acceso a los objetos digitales a largo plazo(UNESCO:Directrices para la preservación del Patrimonio Digital).
● Item: Es un elemento (Documento digital) que puede ser texto, imagen, audio, etc.● Persistencia: El uso de un sistema de identificación único y persistente para
cada ítem.● Derechos de Autor.
Concytec
5
● La recolección de metadatos son válidos según las directrices de DRIVER 2.0 y el esquema de metadatos Dublin Core.
● DRIVER(Digital Repository Infrastructure Vision for European Research) financiado por la UE que crea un marco de trabajo tecnológico organizativo en el ámbito de la investigación y la educación superior.
● Dublin Core (DC): es un modelo de metadatos elaborado y auspiciado por la DCMI (Dublin Core Metadata Initiative), es un sistema de 15 definiciones semánticas descriptivas que pretenden transmitir un significado semántico a las mismas.
¿Cual es el objetivo de crear este Repositorio Institucional?
6
¿Qué es DSpace?
● DSpace es una plataforma (software de código abierto) que permite la administración de ítems en cualquier formato (texto, video, audio y datos), distribuirlos en la web, e indexarlos.
● DSpace es típicamente usado como un Repositorio Institucional. Teniendo 3 principales funciones:○ Facilitar la captura y consumo de materiales, incluyendo metadatos○ Facilitar el fácil acceso a los materiales○ Facilitar la preservación a largo plazo de los materiales
● Puede almacenar:○ Artículos de revistas, Tesis digitales, Carteles de Conferencias○ Conjuntos de datos (Data sets), Informes○ Videos, Imagenes○ Otros documentos digitales
7
¿Quienes usan DSpace?
8Mapa de Repositorios: http://maps.repository66.org/
Instalacion de DSpace
9
Instalar DSpace 5.4
● Java JDK 7+ ● Apache Tomcat 7.+● PostgreSQL 9.+● Apache Maven 3.+● Apache Ant 1.9.+● DSpace 5.+
Arquitectura de DSpace
10
Arquitectura: Capa de almacenamiento
11
Interacción con la base de datos
● Items y sus metadatos● Personas y grupos● Información de autorización● Trabajos en curso (workflow)● Índices de búsqueda y exploración
Arquitectura: Capa de Lógica de Negocios
12
Ofrece
● Administración● Búsqueda● Exploración● Gestión de usuarios y grupos● Autorización● Carga de documentos● Workflow● Handle manager● Abstracción en Comunidades, Colecciones e● Items
Arquitectura: Capa de Aplicación
13
Conjunto de módulos que permiten la interacción con el mundo exterior
● Aplicación web: JSPUI y XMLUI● OAI-PMH Data Provider● Estadísticas● Importar/Exportar● MediaFilter
Modelo de Datos
14
Caracteristicas
● Las comunidades pueden contener subcomunidades o colecciones, pero no ítems
● Las colecciones sólo pueden contener ítems
● Un ítem pertenece a una sola colección, pero puede estar asociado a otras colecciones.
Modelo de Datos: Ejemplo
15
Gestión de Usuarios
16
● Denominados E-Person● Agrupados en E-Group
Un E-Group puede contener:
● múltiples E-Person● otros E-Group
Un E-Person puede pertenecer a muchos grupos (directa o indirectamente)
Gestión de Autorizaciones
17
Listado de derechos con tres elementos
(Objeto, Usuario, Derecho)
Objeto puede ser:
● Comunidad● Colección● Item● Bitstream
Usuario puede ser:
● E-Person● E-Group
Derecho puede ser:
● READ: ver o descargar● WRITE: modificar datos● ADD: agregar a un contenedor● REMOVE: eliminar de un contenedor● ADMIN: administración de
elementos
Gestión de Autorizaciones
18
● Existen dos grupos del sistema: Anonymous, Administrator● Todos los usuarios pertenecen al grupo Anonymous● Por defecto, todas las comunidades, colecciones e ítems tienen permiso de
READ para el grupo Anonymous● Existen Derechos especiales para el Workflow
Roles de Usuarios
19
● Administradores: tiene control sobre el elemento que administra○ Administrador del sitio○ Administrador de comunidad○ Administrador de colección
● Revisores: usuarios asociados a algún paso del workflow de revisión● Submitters: pueden realizar envíos de documentos en alguna colección● Anónimos: tienen acceso de sólo lectura (incluye a los usuarios registrados que
sólo pertenecen al grupo Anonymous)
Se definen según el grupo de pertenencia del usuario y las autorizaciones que dicho grupo (o el usuario mismo) posea en el sistema. Un usuario es considerado Submitter sólo si tiene permiso de ADD en alguna colección
2 opciones: original y configurable
Versión por defecto: 3 pasos de revisión
● Sólo visualización, aceptación o rechazo● Edición de metadatos, aceptación o rechazo● Edición de metadatos y aceptación (no se permite el rechazo)
Lista general de tareas pendientes
● Cualquier revisor puede asignarse una tarea disponible● Un revisor en cualquier momento puede liberar una tarea
Flujo de Trabajo de Revisión
20
2 opciones: original y configurable
Versión por defecto: 3 pasos de revisión
● Sólo visualización, aceptación o rechazo● Edición de metadatos, aceptación o rechazo● Edición de metadatos y aceptación (no se permite el rechazo)
Lista general de tareas pendientes
● Cualquier revisor puede asignarse una tarea disponible(permiso)● Un revisor en cualquier momento puede liberar una tarea● Rechazo del ítem (carga incompleta y envio de mail)
Flujo de Trabajo de Revisión
21
El Workflow configurable permite:
● Definir un conjunto de roles● Definir un scope para los roles
○ repository: debe ser un grupo existente en el repositorio○ collection: se asigna por colección○ ítem: se asume que algún paso en el workflow asignará una persona o grupo
● para revisar un ítem en particular
Flujo de Trabajo de Revisión(Configurable)
22
Provisto por el módulo de Discovery
● Aporta una mejora considerable en el tiempo de respuesta en las búsquedas● Capacidad para personalizar la interpretación de las consultas● Sugerencias de búsquedas● Facilidades para faceting de textos, números y fechas● Importante incremento en las capacidades de búsqueda usando los filtros en la
indexación○ stemmer○ edge n-grams○ stop words○ sinónimos○ tokenizing
Integración: Apache Solr
23
Características de DSpace
24
OAI-PMH
● Open Access Initiative - Protocol metadata Harvesting (Iniciativa de Acceso Abierto - Protocolo para la recolección de metadatos).
● Es una herramienta de interoperabilidad independiente de la aplicación que permite realizar el intercambio de información para que desde puntos (Proveedores de datos), se puedan recuperar la información de los items.
● Ofrece a los proveedores de datos una opción para poner sus metadatos a disposición de servicios basados en lso estandares abiertos HTTP y XML.
● Este protocolo obliga a que los archivos individuales mapeen sus metadatos en Dublin Core.
Sistema Handle
25
● El Sistema Handle es un sistema que permite la asignación de identificadores persistentes a los recursos de información u objetos digitales existentes en Internet (artículos, revistas, imágenes, etc.).
● Desarrollado por CNRI (Corporation for National Research Initiatives), se estructura en dos partes:○ - Prefijo (Prefix): identifica al productor del identificador (universidad, editorial, revista, etc.)
○ - Sufijo (Suffix): identifica a cada uno de los documentos u obras digitales (artículo, libro, capítulo, etc.)
¿Cómo se ve DSpace?
26
Beneficios de Usar DSpace
27
● Coleccion on-line (24/7)● Recuperar tu consulta rapidamente● Acceso global, gran visibilidad y accesibilidad● Almacenamiento de casi todo tipo de materiales● Gestionar y distribuir los items ● Tener un identificador persistente (HANDLE)● Preservación digital● Sindicación de contenidos RSS● Permite la Interoperabilidad (OAI-PMH)● Estadisticas de uso
Sugerencia
28
Metadatos Tradicionales
● ID● Título● Autor● Idioma● Fecha● etc.
Metadatos de preservación
● Procedencia● Autenticidad● Contexto● Gestion de derechos● Actividades de Preservación
Metadatos y Metadatos de Preservación
“Sin bibliotecas, ¿Que nos quedaría?; no tendríamos pasado ni futuro”
- (Ray Bradbury)
29
Gracias!
Contacto:
Elwin HuamanPuno, PerúUniversidad de oviedo, España
30