Upload
hoangthuy
View
218
Download
0
Embed Size (px)
Citation preview
INSTITUTO POLITCNICO NACIONAL
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE INGENIERA Y CIENCIAS SOCIALES
Y ADMINISTRATIVAS
GUIA PRCTICA PARA LA IMPLEMENTACIN DE UN MAPA DE INFORMACIN BSICO APOYNDOSE EN EL
ESTNDAR DE META MODELO DE BUSSINES INFORMATION DE CWM DE LA OMG
TESIS
Para obtener el grado de
MAESTRO EN CIENCIAS
con especialidad en Informtica
PRESENTA:
Gabriela Rivera Alvarez
Director de Tesis: Dr. Javier Garca Garca
Mxico, D.F. 2010
2
3
4
AGRADECIMIENTOS A Dios Gracias por prestarme la vida y dejarme cumplir hasta ahora mis sueos y anhelos.
A mi esposo Julio Cesar Infinitamente gracias por el apoyo que me diste para el logro de esta meta. Creme que t amor me motiva y es la mejor recompensa. Te amo con todo m ser.
A mis padres Gracias por haberme educado y por cultivar e inculcar en m los valores de responsabilidad y superacin. Gracias por todo lo que me han dando y sepan que los quiero mucho.
A mis hermanos Gracias por todo su apoyo y sus consejos. No cabe duda que han sido y seguirn siendo mis mejores maestros y amigos. Saben que siempre cuentan conmigo y que siempre estarn en mi mente y mi corazn. - Adriana, Guadalupe, Ricardo, Faustino, Roberto y Fernando.
A mi familia Gracias a todos mis familiares que me resulta difcil nombrarlos en tan poco espacio, sin embargo ustedes saben quienes son. Quiero dedicar esta tesis muy en especial a mis sobrinos a los que quiero mucho y deseo verlos realizados y convertidos en profesionales el da de maana.
A mi director de tesis Dr. Javier Garca Garca gracias por todo su apoyo, sus consejos, por compartirme sus conocimientos y experiencia profesional para el desarrollo de este trabajo.
A la Comisin Revisora Gracias por la atencin que tuvieron para revisar mi trabajo de tesis y agradezco el cuidado que tomaron para hacerme sus observaciones y as contribuir en la conformacin de este proyecto.
Al I.P.N. y U.P.I.I.C.S.A. Gracias por abrirme las puertas para poder continuar superndome y me siento orgullosa de ser uno de sus miembros.
En general quiero compartir y hacer partcipe el logro de esta meta con todos ustedes.
A todos mil gracias
Gabriela Rivera Alvarez
5
RESUMEN
Todas las organizaciones independientemente de su tamao, poseen
informacin la cul es considerada como un recurso clave y es
insumo base para la toma de decisiones, por lo que una de las
exigencias actuales es contar con un medio que provea a los
usuarios la informacin requerida de manera sencilla y rpida.
En la mayora de los casos el mundo de informacin que poseen
las organizaciones puede verse como: un supermercado donde las
latas se encuentran sin etiquetas, no hay signos o indicaciones
y no hay cabinas de atencin al cliente. El usuario de la
informacin en este escenario no tiene el conocimiento del
universo de informacin que posee su organizacin y no conoce
donde buscar lo que tiene en sus manos.
De ah la importancia de una buena estructura y organizacin de
los activos de informacin, que provea:
un medio que facilite su acceso, su identificacin y su documentacin
Para ello, el contar con un mapa de informacin que provea un
completo reporte de los activos de informacin es altamente
rentable en una organizacin, ya que a travs de este se
facilitar la consulta de los activos, dando como resultado una
herramienta que apoye satisfacer las necesidades de informacin
y apoyar las tomas de decisiones.
Un mapa de informacin es usado para catalogar, enumerar,
entender, organizar y explorar los activos de informacin. Y
este es un medio para disponer de la informacin o describe el
cmo acceder a ella.
El propsito del mapa de informacin es: ayudar al usuario a
entender, explorar, relacionar informacin e identifica la mejor
manera de usar la informacin.
Por lo que la presente tesis tiene por objetivo desarrollar una
gua que facilite la implementacin de un mapa de informacin,
brindando como beneficios el documentar la informacin de las
reas de negocio en las organizaciones en Mxico de forma
organizada, que facilite la bsqueda y acceso a la informacin
de manera oportuna, legible y consistente, apoyndose en l
estndar de metamodelo de Bussines Information de Common
Warehouse Metamodel (CWM) del Object Management Group (OMG).
6
SUMARY
All organizations regardless of size, have information which is
considered as a key resource and input basis for making
decisions, so that one of the current requirements is to have a
medium that provides users with the information required simply
and quickly.
In most cases the sea of information that can be held by
organizations such as: a supermarket where the cans are no
labels, no signs or indications and no customer service booths.
The user of the information in this setting has no knowledge of
the universe of information held in your organization and do not
know where to look you have in your hands.
Hence the importance of good structure and organization of
information assets that provide:
- An environment that facilitates their access,
- Identification and
- Documentation
To this end, having a map of information that provides a
complete report of information assets is highly profitable in an
organization, and that through this consultation will be
provided in assets, resulting in a tool to support meeting the
information needs and support decision making.
A map information is used to catalog, list, view, organize and
explore information assets. And this is a way to have the
information or describes how to access it.
The purpose of the map information is: helping the user to
understand, explore, relate information and identifies the best
way to use the information.
As this thesis aims to develop a guidance document supporting
the implementation of a map information, providing such benefits
to document the information in the areas of business
organizations in Mexico in an organized manner that facilitates
the search and access information in a timely, readable and
consistent, relying on standard metamodel Bussines Information
of Common Warehouse Metamodel (CWM) of the Object Management
Group (OMG).
7
NDICE GENERAL
INTRODUCCIN ....................................................................................................................... 9
CAPTULO I. ARQUITECTURA DE INFORMACIN ..................................................... 13
1.1 ANTECEDENTES .................................................................................................................... 13 ETIMOLOGA ................................................................................................................................ 13 INFLUENCIAS GENERALES ........................................................................................................... 14 RICHARD SAUL WURMAN ........................................................................................................... 15 ROSENFELD Y MORVILLE ............................................................................................................ 15 EDWARD TUFTE........................................................................................................................... 16 OTRAS INFLUENCIAS ................................................................................................................... 17 MOTIVOS SOCIALES Y TECNOLGICOS QUE DIERON ORIGEN A LA ARQUITECTURA DE
INFORMACIN ............................................................................................................................. 18 1.2 PERSPECTIVA DE LA INFORMACIN ................................................................................... 20 DATO ........................................................................................................................................... 21 INFORMACIN ............................................................................................................................. 22 CONOCIMIENTO ........................................................................................................................... 22 1.3 ARQUITECTURA DE INFORMACIN ..................................................................................... 23 1.4 LAS GENERACIONES DE LA AI ............................................................................................. 24 PRIMERA GENERACIN ............................................................................................................... 24 SEGUNDA GENERACIN .............................................................................................................. 25 TERCERA GENERACIN ............................................................................................................... 25 1.5 PROCESO PARA DESARROLLAR UNA ARQUITECTURA ....................................................... 26 DECIDIR LOS REQUISITOS DE GESTIN DE LA INFORMACIN. ..................................................... 26 CREACIN DE UN CONJUNTO DE HERRAMIENTAS DE GESTIN ................................................... 27 LA DEFINICIN DE UN MAPA DE INFORMACIN........................................................................... 27 USO DE LA INFORMACIN COMO RECURSO ................................................................................. 27 1.6 METAINFORMACIN METADATOS ................................................................................... 29 TIPOS DE METADATOS ................................................................................................................. 31 DUBLN CORE .............................................................................................................................. 32 E-GOVERNMENT METADATA STANDARD (EGMS) ..................................................................... 38 AGLS .......................................................................................................................................... 43 1.7 MAPA DE INFORMACIN ...................................................................................................... 47 ANTECEDENTES ........................................................................................................................... 47 QU ES UN MAPA DE INFORMACIN? ......................................................................................... 51
CAPTULO II. METAMODELO DE NEGOCIO ................................................................. 55
2.1 ANTECEDENTE ...................................................................................................................... 55 OMG (OBJECT MANAGEMENT GROUP) ...................................................................................... 55 2.2 CWM (COMMON WAREHOUSE METAMODEL) .................................................................. 56 EL META MODELO DE CWM ...................................................................................................... 57 ORGANIZACIN DE CWM ........................................................................................................... 57 MODELO INFORMACIN BASE DE CWM .................................................................................... 60 MODELO INFORMACIN DEL NEGOCIO ....................................................................................... 61 COMPARATIVO DEL MODELO DE INFORMACIN CON OTROS ESTNDARES ............................... 67
8
CAPITULO III. GUA PRCTICA PARA LA IMPLEMENTACIN DE UN MAPA DE
INFORMACIN ....................................................................................................................... 68
3.1 INTRODUCCIN .................................................................................................................... 68 3.2 REALIZAR UN DIAGNSTICO PARA EVALUAR SI LA ORGANIZACIN VE LA INFORMACIN
COMO UN RECURSO .................................................................................................................... 68 3.3 GUA PARA LA IMPLEMENTACIN DE UN MAPA DE INFORMACIN .................................. 69 DECIDIR LOS REQUERIMIENTOS DE INFORMACIN ...................................................................... 70 CREACIN DE UN CONJUNTO DE HERRAMIENTAS DE GESTIN ................................................... 71 LA DEFINICIN DE UN MAPA DE INFORMACIN........................................................................... 72 USO DE LA INFORMACIN COMO RECURSO ................................................................................. 76 3.4 METADATO DE ACTIVOS DE INFORMACIN ....................................................................... 76
CAPITULO IV. CASO DE ESTUDIO .................................................................................... 79
4.1 INTRODUCCIN .................................................................................................................... 79 4.2 OBJETIVO DEL CASO DE ESTUDIO ....................................................................................... 80 4.3 ALCANCE .............................................................................................................................. 80 SEGUIMIENTO Y DESARROLLO .................................................................................................. 80 FASE 1 ANLISIS ......................................................................................................................... 80 FASE 2 DISEO Y CONSTRUCCIN .............................................................................................. 82 FASE 3 IMPLEMENTACIN Y ALIMENTACIN DEL SISTEMA ........................................................ 82 4.4 CONCEPTUALIZACIN ......................................................................................................... 83 ORGANIZACIN DE CONTENIDOS ................................................................................................ 83 METADATOS ................................................................................................................................ 83 PALABRAS CLAVE Y VOCABULARIOS CONTROLADOS ................................................................. 84 CATEGORAS Y TAXONOMAS ...................................................................................................... 85 DE LA ARQUITECTURA A LA INTERACCIN .............................................................................. 85 SISTEMAS DE BSQUEDA ............................................................................................................. 85 SISTEMA DE NAVEGACIN .......................................................................................................... 86 4.5 MAPA DE INFORMACIN ...................................................................................................... 87 MAPA DE NAVEGACIN ............................................................................................................... 87 COMPONENTES DE PGINA. ......................................................................................................... 88 VISTAS DE USUARIO - ACCESO AL SISTEMA ............................................................................... 89 MAPA INFORMACIN ................................................................................................................... 90 REGISTRO DE PRODUCTOS DE INFORMACIN ............................................................................. 92 REGISTRO DE USUARIOS ............................................................................................................. 99 ACCESO PBLICO ...................................................................................................................... 103 ACCESO PRIVADO ...................................................................................................................... 104 PANTALLA INFORMATIVA (MAPA DE INFORMACIN) .............................................................. 106 ASIGNAR PRIVILEGIOS A USUARIOS.......................................................................................... 109
CONCLUSIONES ................................................................................................................... 111
BIBLIOGRAFA ..................................................................................................................... 115
ANEXO 1 ................................................................................................................................. 117
ANEXO 2 ................................................................................................................................. 120
9
Introduccin
El avance de la tecnologa en los ltimos tiempos, el
crecimiento de los mercados y de las propias sociedades en si,
ha acarreado entre sus mltiples consecuencias, la generacin de
grandes volmenes de informacin.
Todas las organizaciones independientemente de su tamao, poseen
informacin la cul es considerada como un recurso clave y es
insumo base para la toma de decisiones, su buen aprovechamiento
implica:
Reducir costos Mejorar los beneficios Mejor satisfaccin del cliente y fidelidad Clientes y staff confortables
En cada mbito del quehacer humano la cantidad de informacin
recolectada es enorme, pero an ms grande es la necesidad de
obtener ventaja y conocimiento til a partir de ella. Existen
muchas cosas que se deseara conocer a partir de los datos con
que cuenta un negocio o industria. Por ejemplo, conocer
oportunamente cuales son los reportes que se emiten del negocio,
conocer dnde puedo consultarlos de forma sencilla y oportuna,
bajo que reglas se calculan los informes, dnde conocer que
informacin genera el negocio, quienes son los responsables de
los activos de informacin, etc.
Los beneficios econmicos que se obtendran seran considerables
al contar con la informacin organizada y clasificada de tal
forma que provea oportunidad y facilidad para su consulta. Es
por ello que la necesidad de obtener informacin til a partir
de los datos con que se cuenta, es un punto de gran inters en
nuestros tiempos.
Es necesario contar con un medio que provea a los usuarios la
informacin requerida de manera sencilla y rpida.
Sin embargo, se tiene registrado que en una organizacin los
trabajadores buscan informacin llegando a invertir hasta 2
horas por da, con slo el 40% de xito1.
El mundo de informacin que poseen las organizaciones en la
mayora de los casos puede verse como: un supermercado pero
donde las latas se encuentran sin etiquetas, no hay signos o
indicaciones y no hay cabinas de atencin al cliente como una
biblioteca donde no hay etiquetas de los libros y no hay
sealizacin de temas en los estantes. El usuario de la
informacin en estos escenarios no tiene el conocimiento del
universo de informacin que posee su organizacin, no conoce
donde buscar que es lo que tiene en sus manos.
1 Sims Taylor (1998)
10
Por consecuencia, la no organizacin de la informacin repercute
en el logro de las metas y en el fracaso de proyectos, y se
puede observa la siguiente problemtica alrededor de los
usuarios con los activos de informacin2 en una organizacin:
Duplicidad de recursos y esfuerzos para el logro de actividades.
Improductividad e inoportunidad (por la no localizacin de los activos). Como consecuencia de la no organizacin
de los activos de informacin, el usuario se enfrenta a
una bsqueda a ciegas, dando como resultado una bsqueda
fracasada, siendo el tiempo de respuesta de la bsqueda
inoportuno o el resultado sea incorrecto.
No reutilizacin. El hecho de no haber encontrado lo que requera el usuario, implica el destinar recursos a la
realizacin de un activo de informacin que si existe
dentro de la organizacin.
No organizacin o existencia de documentacin. Lo que implica en el desconocimiento de la existencia de los
activos o reglas de negocio
Dependencia de terceras personas. Ya que para la localizacin de un recurso se depende de un tercero para
su ubicacin.
De ah la importancia de una buena estructura y organizacin de
los activos de informacin, que provea:
un medio que facilite su acceso, su identificacin y su documentacin
Las necesidades reales de las organizaciones se debern enfocar
en contar con una herramienta que facilite la consulta de los
activos de manera automtica y oportuna, que permita la bsqueda
eficiente de informacin, dando como resultado una herramienta
que apoye satisfacer las necesidades de informacin y apoyar las
tomas de decisiones adecuadas es un demanda global que va en
crecimiento.
La clasificacin y organizacin de la informacin que dicta la
presente gua soportada en la Arquitectura de la Informacin,
brinda a las organizaciones beneficios que se pueden traducir
fcilmente en beneficios econmicos.
Vivimos en la era de la informacin, donde se tienen compromisos
de tiempo, es clara la necesidad de la implementacin de un mapa
de informacin ya que provee un completo reporte de los activos
de informacin as como sus ms importantes caractersticas.
Un mapa de informacin es usado para catalogar, enumerar,
entender, organizar y explorar los activos de informacin. Y
2 Se entender por Activo de Informacin a todo Recurso de Informacin tales como reportes, informes
o productos
11
este es un medio para disponer de la informacin o describe el
como acceder a ella.
El propsito del mapa de informacin es: ayudar al usuario a
entender, explorar, relacionar informacin e identifica la mejor
manera de usar la informacin.
Y cabe destacar que los beneficios de contar con un mapa de
informacin conlleva:
Documentar el conocimiento Facilitar la bsqueda de informacin Facilitar el compartir informacin mediante el uso de
estndares
Mejorar el entendimiento de los datos y de la informacin
Administracin de la informacin como un recurso Responsabilidad de la documentacin de la informacin y
el conocimiento
Importante aumento de la calidad de las decisiones en su negocio.
Por lo que la presente tesis tiene por objetivo desarrollar una
gua que facilite la implementacin de un mapa de informacin,
brindando como beneficios el documentar la informacin de las
reas de negocio en las organizaciones en Mxico de forma
organizada, que facilite la bsqueda y acceso a la informacin
de manera oportuna, legible y consistente, apoyndose en l
estndar de metamodelo de Bussines Information de Common
Warehouse Metamodel (CWM) del Object Management Group (OMG).
El resto del contenido de esta tesis esta organizado de la
siguiente manera:
En el captulo 1 se proporcionan los fundamentos tericos de la Arquitectura de la Informacin: sus
influencias generales y su evolucin a travs de las
diferentes generaciones.
Adicionalmente se enfoca al estudio de los metadatos y
de los siguientes estndares: Dubln Core Metadata
Initiative, el estndar internacional e-Government
Metadata y AGLS Metadata Element.
Y finalmente se revisar la parte terica del concepto
mapa de informacin.
En el captulo 2 se describe el estndar Common Warehouse Metamodel (CWM) del Object Management Group
enfocndose en el Modelo de Informacin del Negocio, el
cul permite documentar los recursos de informacin de
las reas de negocio. Adicionalmente se hace un anlisis
comparativo de los estndares estudiados en el capitulo
anterior y el CWM identificndose: los elementos
12
comunes, los comunes en los otros estndares y no
identificados en el CWM; as como los elementos
exclusivos del CWM.
En el capitulo 3 tiene por objetivo orientar al lector de los pasos mas relevantes a seguir para la
implementacin eficaz y eficiente de un mapa de
informacin.
En el capitulo 4 se presenta el caso de estudio de la implementacin de un mapa de informacin en una
organizacin desde su fase de anlisis hasta su
implementacin, se describe la herramienta Mapa de
Informacin y se presenta un anlisis de los resultados
en el uso de la herramienta con los usuarios de mbito
directivo, estratgico y operativo.
13
Captulo I. Arquitectura de Informacin
En este apartado se muestra una panormica general del
surgimiento y evolucin de la Arquitectura de la Informacin, lo
anterior con el objetivo de contextualizar al lector en los
fundamentos de la AI.
De igual forma, el lector comprender la importancia de la
organizacin de la informacin y los beneficios de contar con
una AI que facilitar a los usuarios de la informacin una
gestin efectiva, navegacin y entendimiento, favoreciendo la
documentacin del conocimiento.
Cabe destacar que se relacionar al lector con el concepto de
metadato y la importancia que representan estos en una AI. Se
presentarn y describirn 3 estndares utilizados en diferentes
pases para la expresin de metadatos con la intencin de ser
analizados y comparados en el captulo 2 con l estndar de
metamodelo de Bussines Information de Common Warehouse Metamodel
(CWM) del Object Management Group (OMG).
Finalmente, apegndose en la introduccin de la AI y los
metadatos se describir el concepto de Mapa de Informacin, se
sealarn los elementos principales de est y los beneficios
directos al usuario de la informacin.
1.1 Antecedentes
Frecuentemente la bibliografa aborda que el acuamiento del
trmino se le debe a Richard Saul Wurman en el ao 1975 y que
alrededor del ao 1998 Rosenfeld y Morville lo popularizan
gracias a su libro llamado "Information Architecture for the
World Wide Web". Igualmente se menciona la figura de Edward R.
Tufte como iniciador, junto con Wurman, fuertemente ligados a la
disciplina Diseo de Informacin.
Sin embargo, antes del acuamiento del trmino por Wurman
existi el trmino Arquitectura de Informacin, y entre 1983 y
1998 se marcaron pautas en la Arquitectura de Informacin
moderna.
Etimologa
El trmino Arquitectura tiene su origen del latn architectra,
cuyo significado es: El arte de proyectar y construir edificios3
El uso del trmino Arquitectura de informacin tiene un origen
anglfono, donde el trmino de arquitecto es usado para
referirse a un creador, persona que inventa o crea cosas.
3 Diccionario de la Real Academia Espaola (DRAE)
14
Es necesario destacar que la forma en que se ha visto el trmino
"arquitectura de informacin" en ingls se muestran de dos
formas: "Architecture of information" e "Information
architecture". Ambas formas significan lo mismo, slo que la
primera est usada en un registro ms formal que la segunda, que
es ms coloquial.
Influencias generales
Existieron evidencias que marcaron el uso interdisciplinario del
trmino "arquitectura" y en el mundo de la computacin.
El trmino arquitectura se comienza a usar en el contexto
computacional por la empresa IBM alrededor del ao 19594, un
hecho que puede ser rastreado en el trabajo de Lyle R. Johnson y
Frederick P. Brook, miembros en 1959 del departamento de
Organizacin de Mquinas en el centro principal de investigacin
de la IBM.
Frederick P. Brook, escribi5 que "La arquitectura de
computadora, como la otra arquitectura, es el arte de determinar
las necesidades de los usuarios de una organizacin y luego
disear para satisfacer esas necesidades tan eficientemente como
sea posible dentro de condiciones econmicas y tecnolgicas".
Por otra parte, en la literatura tcnica de la IBM6 se
conceptualiza el trmino "arquitectura" como: "la estructura
conceptual y el comportamiento funcional, distinguindose de la
organizacin de los flujos de datos y los controles, el diseo
lgico, y la implementacin fsica"
En julio de 1970 surge la empresa Xerox, en sus inicios la
corporacin reuni a un grupo de cientficos, especializados en
Ciencias de la Informacin y Ciencias Naturales, y les dio la
misin de crear una "arquitectura de la informacin" (the
architecture of information)7
Es notorio que la primera evidencia documental del uso del
trmino compuesto de "Arquitectura de la Informacin" tiene dos
elementos interesantes: especialistas en Ciencias de la
Informacin y desarrollo enfocado a los usuarios. Este enfoque
4 Ronda Len, Rodrigo (2008). Arquitectura de Informacin: anlisis histrico-conceptual / No Slo
Usabilidad journal, n 7. 28 de abril de 2008. ISSN 1886-8592 5 W. Buchholz (1962) Libro Planning a Computer System: Project Stretch, captulo 2
6 Amdahl, G. M.; Blaauw, G. A; y Brooks Jr., F. P. (1964). Architecture of the IBM System/360. IBM
Journal for Research and Development, Abril 1964
7 Pake, G. E. (1985). Research at Xerox PARC: a founder's assessment. IEEE Spectrum, Octubre 1985.
Citado por Hearst, Marti A. Research in Support of Digital Libraries at Xerox PARC. Part I: The
Changing Social Roles of Documents. D-Lib Magazine, May 1996.
15
al usuario se evidencia tambin desde los primeros usos del
trmino "arquitectura".
A continuacin se explorar la evolucin de la Arquitectura de
la Informacin a travs de sus principales contribuyentes.
Richard Saul Wurman
La segunda evidencia histrica del uso del trmino se encuentra
en los trabajos de Richard Saul Wurman, entre los que se
encuentra un artculo escrito junto con Joel Katz titulado
"Beyond Graphics: The Architecture of Information" escrito en
octubre del 1975 y publicado por AIA Journal; y una conferencia,
ofrecida en el ao 1976, durante una reunin de American
Institute of Architecture (AIA) con el ttulo La Arquitectura de
la Informacin.
Wurman se ha enfocado, desde sus orgenes como profesional, en
el diseo de informacin en los entornos urbanos, haciendo
hincapi en los procesos de organizacin de la informacin, como
pasos previos para hacer la informacin visiblemente
comprensible para los usuarios, su pasin es "hacer la
informacin comprensible".
Richard Saul Wurman en su libro publicado en 1996 define el
trmino "Arquitectura de la Informacin" (AI) como:
El estudio de la organizacin de la informacin con el objetivo
de permitir al usuario encontrar su va de navegacin hacia el
conocimiento y la comprensin de la informacin.8
Este plantea que el arquitecto de Informacin es:
Una persona que organiza los patrones inherentes en los datos, haciendo claro lo complejo.
Una persona que crea el mapa o la estructura de informacin que permite a otros encontrar su camino
personal al conocimiento.
La ocupacin profesional enfocado en claridad, entendimiento humano y la ciencia de la organizacin de
la informacin.
Rosenfeld y Morville
Si nos enfocamos exclusivamente a la AI en el campo de la Web,
una de las definiciones que Louis Rosenfeld y Peter Morville
ofrecen en su libro "Information Architecture for the World Wide
Web " en 1998 es:
8 Richard Saul Wurman, Peter Bradford (1997) Information Architects, Publicado por Graphis, ISBN
1888001380, 9781888001389
16
El arte y la ciencia de estructurar y clasificar sitios Web e
intranets con el fin de ayudar a los usuarios a encontrar y
manejar la informacin9
Ellos plantean que la AI se define a travs de estas tres
frases:
La combinacin de esquemas de organizacin, etiquetado y navegacin, dentro de un sistema de informacin.
El diseo estructural de un espacio de informacin para facilitar la terminacin de tareas y el acceso intuitivo
al contenido.
El arte y la ciencia de estructurar y clasificar sitios web e intranets, para ayudar a las personas a encontrar y
administrar informacin.
Y con respecto a las tareas que debera desarrollar un
arquitecto de informacin, plantean definiciones muy concretas
al respecto:
Aclarar la misin y la visin del sitio, haciendo un balance entre las necesidades de la organizacin que lo
impulsa y las necesidades de sus audiencias.
Determina qu contenidos y funcionalidades deber contener el sitio.
Especifica cmo los usuarios van a encontrar la informacin al definir su organizacin, navegacin,
etiquetado y sistemas de bsqueda
Mapea cmo el sitio se va a acomodar al cambio y crecimiento en el tiempo
Edward Tufte
Edward Rolf Tufte (1942, Kansas City Misuri, EE. UU.), es
profesor emrito de la Universidad de Yale, en la que dict
cursos sobre evidencia estadstica y diseo de informacin y de
interfaces. Es autor de varios libros sobre visualizacin de
informacin cuantitativa.
Tufte conceptualiza a la AI como el diseo de la presentacin de
la informacin para facilitar el entendimiento.
Su trabajo, plasmado en tres libros, trata acerca de cmo
presentar todo tipo de informacin en la forma ms clara
posible. Adems de su trabajo acadmico y sus libros, Tufte es
reconocido por su participacin, la preparacin de evidencias
visuales en importantes juicios adems de consultora en
sistemas de informacin para grandes empresas.
9 Louis Rosenfeld, Peter Morville (2002) Information architecture for the World Wide Web Publicado
por O'Reilly, ISBN 0596000359, 9780596000356
http://es.wikipedia.org/wiki/1942http://es.wikipedia.org/wiki/Misuri_(estado)http://es.wikipedia.org/wiki/EE._UU.http://es.wikipedia.org/wiki/Dise%C3%B1o_de_informaci%C3%B3n17
Otras influencias
La tercera evidencia del uso del trmino "arquitectura de
informacin" la encontramos en una serie de artculos publicados
en la dcada de los 80s. Los autores de estos artculos se
refieren a la Arquitectura de Informacin como una herramienta
para el diseo y creacin se sistemas de informacin
Entre los autores ms destacados de estos trabajos se
encuentran:
James C. Wetherbe
Gordon B. Davis
Douglas R. Vogel
Gary W. Dickson
James C. Brancheau
Es interesante sealar que la mayora de los autores, en sus
artculos y trabajos, tienen una influencia notable del Diseo y
Anlisis Estructurado.
En el anexo 1 se muestra una cronologa de estos artculos que
demuestra el desarrollo de la profesin del arquitecto de
informacin en la dcada del 80 y principio de los 90. Estas
referencias fueron obtenidas principalmente de la base de datos
LISA10
.
Otro documento que aborda el tema de la Arquitectura de
Informacin fue la tesis doctoral de Weitzman11 (1995), titulada
"The architecture of information: interpretation and
presentation of information in dynamic environments", publicada
por el MIT (Massachusetts Institute of Technology).
En esta tesis, aparte de corroborar que fue la empresa Xerox
quien comenz a usar el trmino antes de los trabajos de Wurman
en 1975-76, nos muestra la arquitectura de informacin como una
herramienta para soportar el diseo y la presentacin de
documentos, trayendo a colacin el concepto de "estructura de
informacin" y planteando un concepto como el de Arquitectura de
Informacin Visual.
Al ao siguiente de la realizacin de esta tesis, comienza la
produccin de libros que se enfocaron en la divulgacin, a gran
escala, de la arquitectura de informacin como profesin. En el
10 LISA (1998). Reed Technology and Information Service Inc. Library and Information Science
Abstract, LISA. [CD-ROM] Reed Technology and Information Service Inc, Bowker-Saur. 1998
11 Weitzman, L. M. (1995). The architecture of information: interpretation and presentation of information
in dynamic environments. Tesis (Ph. D.) Massachusetts Institute of Technology, Program in Media Arts
& Sciences, 1995
http://www.nosolousabilidad.com/articulos/historia_arquitectura_informacion.htm#biblio#biblio18
anexo 2 se listan los libros ms destacados del perodo del 1996
al 1998.
Motivos sociales y tecnolgicos que dieron origen a la Arquitectura de Informacin
El primer enfoque de la AI, en la dcada de los 70s, se
focalizaba en el problema bsico de la desorganizacin de la
informacin que nos rodea, cuya solucin consista en
proporcionar un orden a dicha informacin en el naciente entorno
computacional.
Las empresas durante esta poca, ante el desarrollo de la
computacin, comienzan a utilizar la misma para la gestin de
los datos resultantes de los procesos internos. Comienzan a
crear sistemas de informacin independientes entre s.
A finales de los 70s y principio de los 80s, la necesidad
empresarial fue creciendo ya que se tenan creados varios
sistemas de gestin de datos que generaban nueva informacin, y
que por lo tanto necesitaban relacionarse entre ellos, es decir,
necesitaban integrar la informacin y para ello requeran de un
nuevo modelo que se lo permitiera.
Fue para principios de los 80s cuando dio comienzo un nuevo
enfoque en el modelo, al plantear una Arquitectura de
19
Informacin integrando salidas resultantes de sistemas de
gestin de datos.
Para Dickson y Wetherber12 la AI es: "Un gran mapa de los
requerimientos de informacin de una organizacin. Es una
representacin independiente de las principales categoras de
informacin, del personal, la organizacin y la tecnologa
dentro de una empresa
Resaltan los conceptos de Requerimientos, el de Mapa y el de
Categoras de Informacin. Donde las categoras de informacin
se relacionan con las principales tareas que lleva el negocio
para el logro de sus resultados y el como deben estar conectadas
para facilitar la toma de decisiones.
Para concretar su concepto Dickson y Wetherber, ms adelante
plantean: "Una arquitectura de informacin es un diseo o plano
para modelar los requerimientos de informacin global de una
empresa. Proporciona un modo de representar las necesidades de
informacin de una organizacin, relacionndolas con procesos de
negocio especficos y documentando sus relaciones. Este mapa del
proceso de la informacin se usa para guiar el desarrollo de las
aplicaciones y para facilitar integrar y compartir datos".
Para definir qu se hace en una AI estos autores plantean: "El
proceso se inicia desde una vista conceptual de alto nivel,
12 Dickson, G. W.; Wetherbe, J. C. (1985). The Management of Information System. McGraw-Hill, New
York, 1985. Citado por Brancheau, James C.; Schuter, Larry y March, Salvatore. Buinding and
implementing an information architecture. DATA BASE Summer, pag 9-17, 1989
20
luego es sucesivamente refinado hasta el nivel ms bajo en el
que la base de datos fsica puede ser implementada". Aqu se
evidencia el criterio de diseo de lo general a lo particular.
1.2 Perspectiva de la informacin
Actualmente la economa no est en la tecnologa, sea el
microchip o la red de las telecomunicaciones global. Est
centrada en el conocimiento.
Para entender el proceso de toma de decisiones en una
organizacin, se requiere de conocimiento, de informacin y de
datos, la manera en que estos elementos interactan en dicho
proceso se muestra en la Figura 1.
Figura 1. Proceso de toma de decisiones
El conocimiento no es ni datos ni informacin, aunque se
relaciona a ambos, y las diferencias entre estas condiciones son
a menudo una cuestin de grado. Arrancamos con estos porque
podemos entender mejor el conocimiento con referencia a ellos.
La confusin sobre datos, informacin y conocimiento es cmo
difieren, lo que esas palabras significan. Entender lo que esas
tres cosas son y cmo reciben de uno a otro es esencial hacer el
trabajo de conocimiento con xito. Se empezar con una
comparacin breve de las tres condiciones y los factores
involucrados transformando los datos en la informacin e
informacin en conocimiento.
Entonces, necesitamos primero definir y diferenciar las etapas
por las que pasa o debiera pasar la evolucin de los datos
dentro de la institucin (ver Figura 2).
Figura 2. Evolucin de los datos
Informacin Conocimiento
Dato
21
Dato
Los datos son la mnima unidad semntica, y se corresponden con
elementos primarios de informacin que por s solos son
irrelevantes como apoyo a la toma de decisiones. Tambin se
pueden ver como un conjunto discreto de valores, que no dicen
nada sobre el motivo de las cosas y no son orientativos para la
accin13.
Dentro de un contexto de negocio, el concepto de dato es
definido como un registro de transacciones. Un dato no dice nada
sobre el motivo de las cosas, y por s mismo tiene poca o
ninguna relevancia o propsito.
Un nmero telefnico o un nombre de una persona, por ejemplo,
son datos que, sin un propsito, una utilidad o un contexto no
sirven como base para apoyar la toma de una decisin. Los datos
pueden ser una coleccin de hechos almacenados en algn lugar
fsico como un papel, un dispositivo electrnico (CD, DVD, disco
duro...), o la mente de una persona. En este sentido las
tecnologas de la informacin han aportado mucho a recopilacin
de datos.
Las medidas cualitativas de los datos son la oportunidad,
relevancia y claridad: Tenemos el acceso a los datos cundo lo
necesitamos? Es lo que necesitamos? Podemos sacar el sentido
de los datos?
No hay ningn significado inherente fundamentalmente, en datos.
El dato describe slo una parte de lo que pas; no proporciona
ningn juicio o interpretacin y ninguna base sustentable de
accin. El dato no dice nada sobre su propia importancia o
impertinencia. Pero el dato es importante a las organizaciones,
porque es el material crudo esencial para la creacin de
informacin.
Los datos son importantes para las organizaciones, ya que son la
base para la creacin de informacin (ver Figura 3).
Figura 3. Pirmide del conocimiento
13
Davenport, T.; Prusak, L. (1998) Working Knowledge: How Organizations Manage What They
Know, Harvard Business School Press
22
Informacin
Segn Idalberto Chiavenato14, informacin "es un conjunto de
datos con un significado, o sea, que reduce la incertidumbre. En
verdad, la informacin es un mensaje con significado en un
determinado contexto, disponible para uso inmediato y que
proporciona orientacin a las acciones por el hecho de reducir
el margen de incertidumbre con respecto a nuestras decisiones".
En Wikipedia15, encontramos en un sentido general que informacin
es "un conjunto organizado de datos procesados, que constituyen
un mensaje sobre un determinado ente o fenmeno".
Por lo anterior se puede concluir que la informacin es un
conjunto de datos acerca de algn suceso, hecho o fenmeno, que
organizados en un contexto determinado tienen su significado,
cuyo propsito puede ser el de reducir la incertidumbre o
incrementar el conocimiento acerca de algo.
A diferencia de los datos, la informacin tiene significado
(relevancia y propsito). No slo puede formar potencialmente al
que la recibe, sino que esta organizada para algn propsito.
Los datos se convierten en informacin cuando su creador les
aade significado. Transformamos datos en informacin
aadindoles valor en varios sentidos. Hay varios mtodos:
Contextualizando: sabemos para qu propsito se generaron los datos.
Categorizando: conocemos las unidades de anlisis de los componentes principales de los datos.
Calculando: los datos pueden haber sido analizados matemtica o estadsticamente.
Corrigiendo: los errores se han eliminado de los datos.
Condensando: los datos se han podido resumir de forma ms concisa.
Conocimiento
Para Davenport y Prusak (1999) el conocimiento es una mezcla
fluida de experiencia ideada, valores, informacin contextual y
la visin especialista que proveen un armazn a evaluar e
incorporar nuevas experiencias e informacin. Origina y es
aplicado en las mentes.
En organizaciones, se incrusta a menudo no slo en documentos o
almacenes pero tambin en rutinas orgnicas, procesos, prcticas
y normas. El conocimiento no es simple. Es una mezcla de varios
elementos; es fluido as como formalmente estructurado; es
14
Chiavenato Idalberto (2006) Introduccin a la Teora General de la Administracin, Sptima Edicin,
de, McGraw-Hill Interamericana, 2006, Pg. 110 15
Wikipedia, la enciclopedia libre es.wikipedia.org/ (Mayo, 2009)
23
intuitivo y por consiguiente difcil de capturar en palabras o
entender completamente en condiciones lgicas.
Mientras encontramos los datos en archivos o transacciones, e
informacin en mensajes, obtenemos el conocimiento de individuos
o grupos de conocedores.
El conocimiento se deriva de la informacin, as como la
informacin se deriva de los datos. Para que la informacin se
convierta en conocimiento, las personas deben hacer
prcticamente todo el trabajo. Esta transformacin se produce
gracias a:
Comparacin.
Consecuencias.
Conexiones.
Conversacin.
Toda organizacin deber considerar preciso disponer de
informacin confiable y ordenada para sustentar la toma de
decisiones de manera oportuna, disear estrategias ptimas y
apoyar la operacin diaria.
1.3 Arquitectura de Informacin
Podemos concluir que la Arquitectura de la Informacin (AI) es
la disciplina que organiza conjuntos de Informacin, permitiendo
que cualquier persona los entienda y los integre a su propio
conocimiento, de manera simple. Se utiliza fundamentalmente en
espacios virtuales como los sitios web de Internet, donde se
requiere que el propio usuario obtenga la Informacin, sin ayuda
de terceros.
La AI se refiere al diseo, organizacin, etiquetado, navegacin
y sistemas de bsqueda que ayudan a los usuarios a encontrar y
gestionar la informacin de manera efectiva.
Por lo tanto la Arquitectura de informacin (AI) es la
disciplina encargada de estructurar la informacin de tal forma
que satisfaga las necesidades del usuario.
La Arquitectura de informacin permite que los usuarios:
entiendan grandes cantidades de informacin
busquen y encuentren la informacin que necesitan de manera simple
realicen acciones mediante el computador
La Arquitectura de informacin permite a los creadores de un
sitio web:
24
aclarar la misin y la visin del sitio, centrndose en las necesidades de sus audiencias
generar estructuras que soporten el cambio y el crecimiento en el tiempo
determinar qu contenidos y funcionalidades deber contener el sitio
poner nombres entendibles a las reas de informacin
crear sistemas de navegacin intuitivos
Finalmente, podemos afirmar que la Arquitectura de Informacin
es una disciplina que organiza conjuntos de informacin,
permitiendo que cualquier persona los entienda y los integre a
su propio conocimiento, de manera simple.
1.4 Las generaciones de la AI
En cuanto a las generaciones de la Arquitectura de la
Informacin (AI)16 tenemos lo siguiente.
El pensamiento actual de los arquitectos muestra tres maneras
para satisfacer las necesidades contemporneas. El ms
importante es el foco en la informacin, seguida por la
tecnologa, haciendo hincapi en el uso y el valor del contenido
de la informacin como ventaja competitiva de recursos.
La prioridad es la comprensin de los principios y las variables
dimensiones subyacentes a la utilizacin de la informacin; la
palabra "dimensin" denota los factores clave que deben
incluirse en una arquitectura de informacin.
Los usuarios y los arquitectos tienen una mayor comprensin de
la utilizacin de informacin a travs de la captura de
informacin acerca de la informacin, o metadatos.
La siguiente revisin de las generaciones est basada en el uso
de la informacin histrica de la arquitectura de informacin.
La arquitectura de la informacin ha evolucionado a travs de
tres distintas generaciones.
Primera Generacin
La primera generacin de AI fue publicada y descrita en la
dcada de 1970 a 1980 partiendo del desarrollo de aplicaciones
que se ejecutaban y controlaban de forma independiente
(standalone), por lo que se enfoc en aumentar la funcionalidad
y sofisticacin de las aplicaciones independientes.
16
Evernden, Roger and Evernden (2003) Third-generation information architecture. ACM, New York,
NY, USA
25
La primera y segunda generacin hicieron hincapi en las
soluciones tecnolgicas en lugar del uso de la informacin en la
organizacin.
Segunda Generacin
Surge en la dcada de 1990, enfocada en los sistemas integrados
por un conjunto de componentes, conducido por el crecimiento en
la complejidad del sistema y por la bsqueda de la reutilizacin
de software.
La primera y segunda generaciones de arquitecturas de la
informacin (fines de la dcada de 1970 hasta mediados de la
dcada de 1990) utiliza un solo diagrama para mostrar toda la
informacin. Sin embargo, es imposible describir todos los
resultados de cualquier proceso, incluida la arquitectura de la
informacin, en un solo diagrama; muchos proyectos nunca logran
sus objetivos por la limitacin en este sentido.
Tercera Generacin
La tercera generacin, se centra en la informacin en lugar de
la tecnologa.
La primera y segunda generaciones se centraban en un slo
diagrama, lo que puede tornar confuso el entendimiento al
usuario ya que se trata de comunicar demasiada informacin a la
vez. Para mayor claridad, en la tercera generacin los diagramas
son varios. Otra caracterstica es el paralelismo establecido
entre arquitectura de la informacin y el diseo fsico. La
arquitectura ahora es ms fcil que sea asociada con la
construccin de edificios, facilitando la compresin a las
personas, pero el nfasis en la informacin es diferente, por
ejemplo, la dimensin espacial es importante en los edificios,
mientras que la dimensin epistemolgica (si el conocimiento es
explcito o implcito) es un aspecto clave de la arquitectura de
la informacin.
A raz de la aparicin de la gestin del conocimiento durante la
dcada de 1990 como una funcin clave para el negocio y la
disponibilidad de una amplia gama de informacin a travs de
Internet, se vio la necesidad de enfocarse en la gestin de
contenidos.
Hoy en da, la tercera generacin refleja la necesidad de
separar la tecnologa de la arquitectura de informacin.
Aplicando esta distincin se hace ms fcil la labor para los
arquitectos de informacin para comprender las necesidades de
los usuarios, garantizando al mismo tiempo la arquitectura de la
informacin.
26
La reutilizacin de componentes es clave para el desarrollo de
los sistemas contemporneos, como resultado de ello, la
incorporacin del desarrollo de componentes, la construccin de
aplicaciones utilizando componentes y el gestionar la
reutilizacin. La informacin como un recurso intelectual, es
fcil de reproducir y reutilizar.
1.5 Proceso para desarrollar una arquitectura
El desarrollo de una arquitectura de informacin no es una tarea
fcil y la intencin de esta seccin es destacar los puntos
clave a considerar, con el objetivo de orientar al lector y
evitar que se fracase en el intento.
El proceso para el desarrollo de la arquitectura aconseja que se
tenga especial cuidado en la eleccin de la informacin que el
negocio requiere se organice, antes de pensar en los aspectos
tecnolgicos. Se sugiere el uso de una herramienta de tercera
generacin que permita mostrar la arquitectura desde diferentes
puntos de vista. Y se define que el objetivo de un mapa de
informacin dar es un panorama completo y nico de la
informacin.
Cabe destacar que una arquitectura no es esttica sino que
evoluciona a travs de la experiencia y el uso; por lo que parte
medular es capturar el aprendizaje y la retroalimentacin.
A continuacin se listan en forma simplificada los puntos ms
importantes a seguir para el desarrollo de un arquitectura.
Decidir los requisitos de gestin de la informacin.
El punto de partida es ser absolutamente claro acerca de la
necesidad del negocio en el aspecto de mejorar el uso de la
informacin. Ya que la consecuencia de elegir la informacin
errnea conlleva a desarrollar una arquitectura deficiente.
Los requisitos de informacin deben definirse antes de hacer las
consideraciones de la tecnologa.
El resultado de este paso incluye principios, directrices de
diseo de informacin, normas, y convenciones de nombres.
En esta etapa tambin se decide cuales dimensiones son en
realidad parte de la arquitectura. Y cabe destacar que
dimensin" denota los factores clave que deben incluirse en una
arquitectura de informacin, tales como: la clasificacin que se
le dar a la informacin para una coherente y eficiente
organizacin.
27
Creacin de un conjunto de herramientas de gestin.
Un conjunto de herramientas incluye listas, grficos y diagramas
derivados de las dimensiones, ya sea por cuenta propia o en
combinacin.
Las dimensiones transforman un problema complicado en uno
sencillo como consecuencia de una subdivisin en segmentos
permitiendo la colaboracin de diferentes personas; al mismo
tiempo, proporcionan una estructura coherente o un plan de largo
plazo de la estrategia de informacin, que permita el desarrollo
gradual de la informacin como recurso. El nmero de dimensiones
y la gama de posibilidades significa que las herramientas pueden
ser adaptadas a las condiciones y el contexto de uso.
Una herramienta comn de una estructura dimensin
arquitectnica de primera y segunda generacin (tales como el
marco Zachman y de la Informacin FrameWork) se basan a menudo
en una sola tabla de este tipo y se denominan marcos.
Las herramientas de tercera generacin, son multidimensionales,
utilizan un conjunto de grficos interrelacionados que permiten
mostrar la arquitectura desde diferentes puntos de vista.
La definicin de un mapa de informacin.
Un mapa de informacin muestra los elementos grficos de la
informacin, as como los vnculos y agrupaciones entre ellos;
contiene informacin acerca de la informacin (ms all de los
metadatos), incluyendo explicaciones acerca de cmo es o podra
ser utilizado, cmo est estructurado, y la razn por la que se
estructura en un camino. Cuanto mejor es la calidad de este
material, es ms til, ya que un mapa de informacin es un
panorama completo y nico en muchos aspectos para una
organizacin en particular.
Los modelos de la tercera generacin se basan en arquitecturas
multidimensionales, representan de manera formal y detallada la
informacin de los negocios y facilitan la organizacin del
conocimiento. Es recomendable que las descripciones,
definiciones y ejemplos, se describan en la lengua de gestin
empresarial, ms que en la jerga de la tecnologa.
La informacin acerca de cmo la informacin se utiliza tiene un
gran potencial para mejorar la eficacia de la informacin y
para la creacin de nuevas e innovadoras maneras de generar
ingresos.
Uso de la informacin como recurso.
Por ltimo, en la tercera generacin de la AI se tiene presente
que las arquitecturas no son estticas sino que evolucionan a
28
travs de la experiencia y el uso; y parte medular de esta
evolucin es capturar el aprendizaje y la retroalimentacin.
El esfuerzo de una AI es recompensado en trminos de agilidad
empresarial, la productividad, uso eficaz de la informacin y la
rentabilidad.
Los comentarios de los empleados, clientes y proveedores - de
cualquier persona que use la informacin retroalimenta a la
AI, lo que permite adaptar y madurar la arquitectura para
satisfacer las necesidades globales de la organizacin.
29
1.6 Metainformacin Metadatos
Los metadatos17 en s no son algo completamente nuevo, segn Howe
(1993), el trmino fue acuado por Jack Myers en la dcada de
los 60 para describir conjuntos de datos. La primera acepcin
que se le dio (y actualmente la ms extendida) fue la de dato
sobre el dato, ya que proporcionaban la informacin mnima
necesaria para identificar un recurso.
El tema de los metadatos o de la metainformacin no se puede
estudiar sin considerar que son trminos cuyo nacimiento y
desarrollo se encuentran ntimamente vinculados a los avances
tecnolgicos y, especficamente, a la aparicin de Internet, red
que ha trado consigo una nueva filosofa o concepcin imperante
a la hora de concebir la estructura de los documentos y, por
ende, al abordar el contenido de los mismos.
Para lograr un acercamiento adecuado al estudio terico de los
metadatos y de la metainformacin lo primero que se requiere
es el estudio de dichos trminos en el plano de la lengua, tanto
desde el punto de vista de su composicin, como de su
significado.
El prefijo meta proviene del griego, como una preposicin cuyo
significado es: junto a, despus, entre, con, de otro modo, ms
all de.
El sustantivo dato, proviene del Latn datum, que significa lo
que se da.
El concepto de datos es definido como registros icnicos,
simblicos (fonticos o numricos) o sgnicos (lingsticos,
lgicos o matemticos) por medio de los cuales se representan
hechos, conceptos o instrucciones.
Desde el punto de vista tcnico, los datos son las materias
primas que, al ser procesadas, dan lugar a la informacin.
As, los metadatos podrn ser aquellos detalles que van ms all
de los hechos, conceptos, o instrucciones y que permiten, por
tanto, representarlos y conocerlos de forma ms exacta y
organizada.
La metainformacin, por su parte, podr ser aquella indicacin
susceptible de ser interpretada por algunos receptores o aquella
imagen que se crea de un objeto, fenmeno o hecho y que va ms
all de este en s mismo.
17
Dorys Couceiro Arcs (2002) Metadatos- Metainformacin, Facultad de Comunicacin. Universidad
de La Habana
http://www.sedic.es/autoformacion/metadatos/bibliografia.htm#howe30
Los metadatos son datos adicionales que se aportan sobre un
"objeto", con el fin de representarlo, describirlo o hasta
llamar la atencin sobre elementos de utilidad, para los
posibles interesados, previendo su posterior recuperacin. Estos
"objetos" pueden ser de diversa naturaleza y poseer diferentes
formatos, por tanto, los elementos a tener en cuenta podrn
variar de un "objeto" a otro.
Los llamados "objetos" pueden constituir recursos de
informacin. Los metadatos que se van aportar acerca de estos
recursos de informacin van a consistir en caractersticas
fsicas de dichos recursos o en elementos resultantes del
conocimiento de los mismos, tal es el caso de la descripcin de
contenido, que lleva implcito todo un proceso de acercamiento y
aprehensin del contenido del recurso, para poder resumirlo,
reducirlo a ndices, ubicarlo dentro de clases, etc. y que
permita al usuario tener la idea ms exacta posible de l, sin
necesidad de tenerlo frente. De esta manera el concepto
correspondiente al trmino metadatos pertenece a la etapa de
procesamiento dentro del ciclo de vida de la informacin, ya que
en esta se contempla la descripcin tanto de contenido como de
forma de los recursos de informacin.
Los metadatos, para convertirse en metainformacin necesitan
estar representados en un contexto dado, estructurados y
organizados, segn determinado esquema comn.
Existen ciertas estructuras que permiten elegir qu metadatos
permitirn describir mejor determinado tipo de recurso de
informacin y que indican una forma comn para colocarlos y
contextualizarlos, convirtindolos en metainformacin, estos son
los formatos para la expresin de los metadatos.
Entre los formatos18 que se han creado para la expresin de los
metadatos, se encuentra:
el Dubln Metadata Core Element Set, ms conocido como Dubln Core y el cual consiste en una lista compacta de
elementos de metadatos,
e-Government Metadata Standard, provee una estructura de metadatos usada en el sector pblico de Inglaterra
AGLS Metadata Standard es un conjunto de 19 elementos para que los departamentos de gobierno y agencias puedan usarlo
para darle accesibilidad a su informacin en el Internet
18
Wikipedia, la enciclopedia libre Metadato, formatos y estndares es.wikipedia.org/ (Mayo, 2009)
31
Tipos de metadatos
A continuacin se presentan los tipos de metadatos, su
aplicacin y algunos ejemplos de uso concretos19, sealados por
Ann J. Gilliland-Swetland
Tipo Metadato Definicin /
Aplicacin Ejemplos
Administrativo
Usados en la
gestin y
administracin
de recursos de
informacin
Adquisicin de informacin
Derechos y reproduccin
Requerimientos legales para
el acceso
Localizacin de informacin
Criterios de seleccin para
la digitalizacin
Control de la versin
Descriptivo
Utilizados para
representar
recursos de
informacin
Registros catalogrficos
Proporcionar ayuda en la
bsqueda
ndices especializados
Hiperenlazar relaciones
entre recursos
Anotaciones de los usuarios
Dublin Core o Etiquetas
META de HTML
Preservacin
Para
salvaguardar
los recursos de
informacin
Informar sobre las
condiciones de uso de los
recursos fsicos
Informar sobre las acciones
llevadas a cabo para
preservar versiones fsicas
y digitales de recursos
Tcnico
Relativos a
cmo funcionan
los sistemas o
el
comportamiento
de los
metadatos
Documentacin de hardware y
software
Digitalizacin de la
informacin (formato, ratio
de compresin...)
Autentificacin y datos de
seguridad (encriptacin,
passwords, etc.)
19 Gilliland-Swetland, Anne J. (1998) Setting the Stage: Defining Metadata, in Introduction to
Metadata: Pathways to Digital Information
32
Tipo Metadato Definicin /
Aplicacin Ejemplos
Uso
Relativos al
nivel y tipo de
uso que se hace
con los
recursos
informativos
Informacin sobre versiones
Reutilizacin del contenido
del recurso
Estructurales
Facilitan la
navegacin y la
presentacin de
los recursos.
Proporcionan
informacin
sobre la
estructura
interna de los
documentos, as
como la
relacin entre
ellos
XML
RDF
SGML
Dubln Core
Dublin Core20 es un modelo de metadatos elaborado y auspiciado
por la DCMI (Dublin Core Metadata Initiative), una organizacin
dedicada a fomentar la adopcin extensa de los estndares
interoperables de los metadatos y a promover el desarrollo de
los vocabularios especializados de metadatos para describir
recursos para permitir sistemas ms inteligentes del
descubrimiento del recurso.
Las implementaciones de Dublin Core usan generalmente XML y se
basan en el Resource Description Framework. Dublin Core se
define por ISO en su norma ISO 15836 del ao 2003, y la norma
NISO Z39.85-2007.
El nombre viene por Dubln (Ohio, Estados Unidos), ciudad que en
1995 alberg la primera reunin a nivel mundial de muchos de los
especialistas en metadatos y Web de la poca.
20
The Dublin Core Metadata Initiative, or "DCMI" (2007). Disponible en: http://dublincore.org/ (Julio,
2009)
http://www.w3.org/MarkUp/SGML/33
Algunas de las fortalezas de este esquema de metadatos son:
Su simplicidad
La independencia sintctica (que ha permitido que se integre en la estructuracin de datos en XML/RDF).
Alto nivel de normalizacin formal: ANSI/NISOZ39.85-2001, ISO 15836-2003.
Crecimiento y evolucin del estndar a travs de una institucin formal: DCMI.
El conjunto de elementos Dubln Core (DC) se ha convertido en una infraestructura operacional del desarrollo de la
Web Semntica.
La norma ISO15836 define el Conjunto de Elementos Dublin Core, o
lo que se conoce habitualmente como "DC simple". Esos 15
elementos bsicos para describir cualquier objeto de
informacin, se presentan habitualmente divididos en tres grupos
que indican la clase o alcance de la informacin incluida en
ellos, y que responden, en cierta medida, a las expectativas que
tiene el usuario cuando se enfrenta a la informacin de la red:
Contenido -
Elementos
relacionados
principalmente
con el contenido
del recurso
Propiedad intelectual -
Elementos relacionados
principalmente con el
recurso cuando es visto
como una propiedad
intelectual
Instanciacin -
Elementos relacionados
principalmente con la
instanciacin del
recurso
Ttulo
Tema
Descripcin
Fuentes
Idioma
Relaciones
Cobertura
Autor
Editor
Contribuyente
Derechos
Fecha
Tipo
Formato
Identificador del
recurso
El Dubln Core fue concebido como una descripcin simple de
recursos de informacin. No obstante, debi proveer una base
para la interoperabilidad semntica con otros formatos
posiblemente ms complicados y, sentar las bases para la
descripcin de los recursos contenidos en la red, lo que
inicialmente se hizo con los documentos en HTML.
El Dubln Core pretenda definir un conjunto simple de elementos
de datos, de modo que los autores y editores de los documentos
de Internet pudieran crear sus propios registros de metadatos
sin requerir de un gran entrenamiento.
34
Entre los elementos descriptivos bsicos que propone este
formato se encuentran21:
Ttulo: nombre dado al recurso por quien lo crea o lo publica;
Autor: persona(s) u organizacin con responsabilidad primaria del contenido intelectual del recurso.
Editor: agente o agencia responsable de la confeccin del recurso disponible. Quien lo publica. Entidad responsable
de poner el recurso disponible en la forma actual. Casa
editorial, departamento universitario, entidades
corporativas, etc.;
Contribuyente: persona(s) u organizacin, no especificada en el elemento Autor, tales como editores, traductores,
redactores, ilustradores, quienes han hecho una
contribucin intelectual importante, pero secundaria al
recurso;
Fecha: puede ser la de creacin o publicacin del recurso. Se debe usar la norma ISO 8601 para las fechas. Esta
describe una gran cantidad de formatos de fecha / horario,
de los que se escoge el necesario, segn el nivel de
precisin requerido. La virtud principal de este conjunto
de formatos radica en que para el ao se reservan cuatro
dgitos, con lo cual se deja claro siempre el siglo del
que se trata. Puesto que se pretende casi siempre
consignar slo la fecha y no el horario, se escoge,
generalmente, de los formatos propuestos, el que presenta
la estructura siguiente: AAAA-MM-DD.
Tipo: gnero literario del recurso. Tipo de recurso (forma material). Categora del mismo, tal como Home Page,
novela, poema, reporte tcnico, ensayo, diccionario. Se
debe observar la siguiente lista que propone los
siguientes tipos, para que sea elegido el adecuado, segn
el recurso que se est describiendo:
- Texto: para un recurso que est constituido principalmente por texto, pero puede incluir
imgenes,
- Mapas, tablas, etc. Tal puede ser el caso de libros, folletos, ensayos, mensajes de correo
electrnico, reportes tcnicos y otros.
- Imagen: por ejemplo, fotografas, grficos, animados, videos.
21 Dublin Core Metadata Element Set, Version 1.1 (2008) Disponible en http://dublincore.org/documents/2008/01/14/dces/ (Julio, 2009)
35
- Sonido: todo tipo de sonidos. Por ejemplo, sonido hablado, msica, y sonidos ambientales.
- Software: cuando se tratan programas ejecutables y cdigos fuente.
- Datos: colecciones de datos alfanumricos. Por ejemplo, datos espaciales, registros
bibliogrficos, estadsticas, etc.
- Interactivo: conjuntos diseados para la interaccin con uno o ms usuarios. Por ejemplo:
juegos, servicios de conversacin y realidad
virtual;
Idioma: del contenido intelectual del recurso. Generalmente se utiliza la prctica definida en el RFC
1766, documento en el que se describe un lenguaje de
marcas para el caso en que se desee indicar el idioma en
que est expresado el contenido del recurso. Aunque se
recomienda la prctica definida por este, existen otros
esquemas.
Identificador del recurso: nmero o cadena de caracteres usado para identificar unvocamente al recurso. Pueden
ser, por ejemplo: URL (Uniform Resource locator), ISBN
(International Standard Book Number), International Serial
Standard Numbers (ISSN), the Digital Object Identifier
(DOI), etc.
Formato del recurso: opcionalmente, se pueden incluir las dimensiones (tamao, duracin) del recurso. Se usa para
identificar, por ejemplo, el software y hardware necesario
para tratarlo.
Fuentes: recursos, impresos o electrnicos, de los cuales se deriv el presente y que sean importantes para su
recuperacin. La mejor prctica recomendada para sealar
la fuente, es hacer una referencia al recurso por un
nmero o cadena de caracteres, conformando estos una
identificacin formal del sistema. Tambin se puede
utilizar un hipervnculo.
Derechos sobre el recurso: se puede utilizar un identificador que remita o enlace a otro recurso donde se
expongan los derechos sobre el recurso descrito.
Relacin: identifica la relacin del recurso con otro. Puede ser entre las partes de un recurso, entre las partes
de una coleccin y entre las partes de una serie. Tambin
se pueden consignar en este elemento los datos propios de
la mencin de edicin. Este formato adems, propone los
siguientes elementos para la descripcin de contenido de
los recursos de informacin
36
Tema: tpicamente se expresa por frases o palabras clave que describen el contenido del recurso. En este sentido,
es vlido el uso de lenguajes documentarios, como
vocabularios controlados, tesauros, esquemas de
clasificacin;
Cobertura: caractersticas espaciales o temporales del contenido intelectual del recurso.
- Espaciales (geogrficos): regin fsica, usando nombres o coordenadas (latitudes y longitudes).
- Temporales: fechas o rango de fechas, perodos, se puede usar la misma norma que se recomienda para
el elemento Fecha;
Descripcin: descripcin textual del contenido del recurso, incluyendo resmenes (en el caso de los recursos
compuestos principalmente por textos), descripciones (para
el caso de recursos en los que priman los detalles
visuales) y tablas de contenido.
Desde el diseo y codificacin de este conjunto de elementos, se
contemplaron adems, los siguientes aspectos:
Posibilidades de ampliacin: el conjunto puede ser ampliado con futuros elementos para describir datos
intrnsecos de particular relevancia para una comunidad de
inters especfica;
Carcter opcional: la inclusin de cada uno de los elementos del Dublin Core en un registro, es opcional;
Repetitividad: todos los elementos son repetibles, es decir pueden ser usados ms de una vez en un mismo
registro;
Posibilidades de modificacin: cualquier elemento puede ser modificado por uno o ms calificadores; tratamiento de
los documentos como objetos (DLOs), para poder ser
descritos por los elementos del formato.
37
Ejemplo:
38
e-Government Metadata Standard (eGMS)
La primera versin de la norma eGMS22, tal como se describe en el
e-GMF, se basaba en el Dublin Core (DC). Esto se ha convertido
en un estndar internacional reconocido (ISO 15836), y sigue
siendo la piedra angular de la e-GMS. En esta versin, los
elementos adicionales que han sido aadidos para facilitar la
informacin y gestin de documentos.
Provee una estructura de metadatos usada en el sector pblico de
Inglaterra
Define metadato como informacin estructurada acerca de un
recurso.
Tiene por caractersticas:
Independencia. Este estndar es lo suficientemente flexible como para satisfacer la recuperacin de la
informacin y los registros de las necesidades de gestin
de cualquier informacin que encuentre en cualquier
formato
Fcil de usar. La norma es fcilmente aplicable por los que tienen una amplia variedad de experiencia de
preparacin de descripciones de los recursos
Compatibilidad con otros estndares del gobierno del Reino Unido y polticas, como el e-GIF.
Cumplen las normas internacionales. La informacin es un recurso internacional, y el Reino Unido aspira a seguir
siendo un lder en la revolucin de la informacin
mundial. Para lograr esto, el estndar de metadatos
refleja las normas internacionales. Si existe una norma
internacional es adecuada y se mantiene hasta la fecha, se
incorporarn en el e-GMS.
Es estable. Los cambios a una norma requiere un considerable esfuerzo, tiempo y recursos para poner en
prctica. El e-GMS por lo tanto debe ser lo
suficientemente flexible para satisfacer las futuras, as
como las necesidades actuales
Ser extensible. Los elemento se puede agregar cuando se puede demostrar que estos son esenciales y el conjunto
existente no prev el requisito. Un balance tendr que ser
alcanzado entre la necesidad de la extensibilidad y la
necesidad de estabilidad
22
e-Government Metadata Standard (eGMS) Elements LAWs Project, Information Architecture &
Standards (2004) ISO8601 http://www.esd.org.uk/standards/egms/egms.pdf (Julio, 2009)
39
Ser inclusivo, teniendo en cuenta los muchos esquemas de metadatos existentes, con el objetivo de reducir al mnimo
la necesidad de reelaborar los productos existentes. Esto
se equilibrar con la necesidad de la mxima
interoperabilidad, que requiere coherencia en todas las
descripciones de informacin de recursos
Ante todo, se reunir la recuperacin de la informacin y las necesidades de gestin de los ciudadanos y del
gobierno.
Para facilitar la consulta, los elementos se enumeran en orden
alfabtico.
Para cada elemento se encuentran los siguientes datos:
Definicin: La definicin formal de los elementos, tomados de Dublin Core (ISO 15836) siempre que sea posible.
Obligacin: Cada elemento tiene un nivel de compromiso.
- Obligatorio: este elemento debe tener un valor
- Obligatorio si procede: este elemento se debe dar un valor si la informacin es aplicable
Recomendado: este elemento da un valor a los datos disponibles.
Opcional: este elemento puede dar un valor a los datos disponibles.
Objetivo: Dar a los efectos del elemento, informacin de antecedentes, su aplicacin a diferentes niveles de
agregacin y de otros factores.
Lista de los elementos para describir un metadato conforme al
estndar eGMS clasificados conforme a su obligacin.
Elementos
obligatorios
Obligatorio si
procede
Recomendado Opcional
Autor
Fecha
Tema
Ttulo
Accesibilidad.
Identificador
Editor
Cobertura
Idioma
Dirigido a
Agregacin
Audiencia
Contribuyente
Descripcin
Firma digital
Caducidad
Formato
Localizacin
Mandato.
Preservacin
Relacin
Derechos
Fuente
Estatus
Tipo
40
Elementos obligatorios
Autor
- La entidad principal responsable de hacer que el contenido del recurso.
- Para permitir al usuario encontrar los recursos que fueron escritos o preparadas de otra forma por
un individuo u organizacin.
Fecha
- Una fecha asociada con un evento en el ciclo de vida del recurso.
- Para permitir al usuario encontrar los recursos al limitar la bsqueda de acuerdo a una fecha, por
ejemplo, la fecha en que se puso a disposicin el
recurso.
Tema
- Tema del contenido del recurso
Ttulo
- Nombre dado al recurso
Elemento obligatorio si procede
Accesibilidad.
- Indica la disponibilidad del recurso y la facilidad de uso a grupos especficos.
- Permite a aquellos que no pueden utilizar todos los recursos de informacin para limitar la
bsqueda a los artculos para satisfacer sus
necesidades.
Identificador
- Una referencia inequvoca a los recursos dentro de un contexto dado.
Editor
- La entidad responsable de los recursos disponibles
Recomendado
Cobertura
- La magnitud o el alcance del contenido del recurso.
Idioma
- Idioma del contenido intelectual de los recursos.
Opcional
Dirigido a
- La persona (o personas) a quien va dirigido el recurso.
- Permite al usuario identificar a la persona(s) a quien se envi el recurso. Tenga en cuenta que
esto no aporta pruebas de que la persona destinada
efectivamente lo recibi o ley, ni que tena el
derecho o la capacidad para acceder.
Agregacin
41
- El nivel de recursos o la posicin en una jerarqua.
- Agregacin permite la bsqueda de los recursos a un nivel determinado. Tambin ayuda a indicar qu
acciones pueden llevarse a cabo en el recurso.
Audiencia
- Una categora de usuario para el que se destina el recurso.
- No utilice la audiencia a menos que el recurso se prepara con un grupo en particular en mente. Si es
para su liberacin general, djela en blanco
Contribuyente
- La entidad responsable de hacer contribuciones al contenido del recurso
- Permite a los usuarios recuperar un recurso que ha contribuido una persona u organizacin
Descripcin
- Resumen del contenido del recurso.
- Para ayudar al usuario a decidir si el recurso se ajusta a sus necesidades.
Firma digital
Caducidad
- La retencin y las instrucciones de eliminacin del recurso.
Formato
- La manifestacin fsica o digital del recurso.
Localizacin
- La ubicacin fsica del recurso.
Mandato.
- Mandato legislativo o de otro tipo en que se ha producido el recurso.
Preservacin
- La informacin para apoyar la conservacin a largo plazo de un recurso.
Relacin
- Una referencia a un recurso relacionado
Derechos
- Informacin sobre los derechos y celebrada en el recurso
Fuente
- Una referencia a un recurso del que se deriva el actual de los recursos
Estatus
- La posicin o el estado de los recursos
Tipo
- La naturaleza o gnero del contenido del recurso
Esto es un estndar de los meta datos solamente. No cubre la
puesta en prctica o ediciones tcnicas. La naturaleza del e-GMS
significa que necesita ser apoyada por la informacin, notas de
42
direccin y cajas de herramientas extensas. A la hora de
publicacin, stos estn en el desarrollo
A continuacin se da un ejemplo con el metadato del estndar
eGMS:
Elemento Contenido
Cobertura UK- REINO UNIDO
Autor LAWs Project, Information Architecture &
Standards
Fecha creacin 2004-03-29
Fecha
modificacin
2004-04-30
Descripcin LAWs representation of eGMS elements with
LAWs and CRM notes
Formato Microsoft Word
Idioma Eng
Editor Porism Limited, SW9 8BJ [email protected]
Relacin http://www.esd.org.uk/standards/eGMS/3.0/eGM
S.xml
Mandato e-GMS is subject to Crown Copyright.
This document is made available for use,
without guarantees and without licensing
costs, by local authorities, community
organisations and any other bodies
referencing local and community resources.
You may use and modify this document so long
as you credit the LAWs Project and Porism
Limited and you do not charge for it. In
doing so, you must abide by the provisions
of Crown Copyright.
Localizacin
http://www.esd.org.uk/standards/eGMS/3.0/eGM
S.doc
Ttulo e-Government Metadata Standard (eGMS)
Elements
mailto:[email protected]:[email protected]://www.esd.org.uk/standards/eGMS/3.0/eGMS.xmlhttp://www.esd.org.uk/standards/eGMS/3.0/eGMS.xmlhttp://www.esd.org.uk/standards/eGMS/3.0/eGMS.dochttp://www.esd.org.uk/standards/eGMS/3.0/eGMS.doc43
AGLS
El desarrollo del sistema del elemento de AGLS23 comenz en
diciembre de 1997 con un taller sostenido por los archivos
nacionales de Australia.
El taller reuni a los representantes de las agencias federales
y del estado del territorio Australiano, de otros partidos
interesados tales como la red de informacin federal de las
bibliotecas, y de la comunidad de investigacin acadmica.
Es una historia de xito en este mbito la inclusin de
metadatos adecuados sobre los sitios del gobierno federal en
Internet. El Gobierno de Australia ha respaldado el estndar
(AGLS) y por todos los gobiernos australianos y se publica
como una norma nacional de Normas de Australia desde finales de
2002. El uso de la AGLS por organismos a travs de las
jurisdicciones ha provocado un aumento de descubrimiento y, por
ende, el acceso a la informacin pertinente por parte de los
consumidores y los organismos.
AGLS es un estndar de metadatos diseado especficamente para
mejorar la detectabilidad de los recursos, tanto
fsicos y virtuales, en un entorno en lnea. El AGLS dicta una
norma de metadatos que se utilizan en los sitios web del
gobierno australiano.
El objetivo de utilizar la AGLS en los organismos de Gobierno de
Australia es garantizar que las personas que buscan informacin
del Gobierno de Australia en web sea rpido y eficaz a travs de
las descripciones de los recursos del gobierno.
AGLS metadatos debera permitir a la gente a localizar los
recursos del gobierno que necesitan sin tener que poseer un
conocimiento detallado de las estructuras de gobierno.
Esto a su vez ayuda a garantizar que la gente que busca en los
sitios web del gobierno obtenga resultados relevantes y
significativos en respuesta a las solicitudes de bsqueda.
La gente espera ser capaz de encontrar fcilmente toda la
informacin gubernamental y todos los servicios gubernamentales
en lnea. No tiene sentido invertir dinero y esfuerzo en la
publicacin de informacin o prestacin de un servicio en la
web, si el pblico destinatario no puede localizarlo.
El uso de esquemas de metadatos normalizados, tales como AGLS,
ayudar a la gente a encontrar la los recursos del gobierno que
23
AGLS Metadata Element Set Part 1: Reference Description (2002) National Archives of Australia
Diciembre, 2002 ISBN 0 642 34491 4 http://www.naa.gov.au/Images/AGLS_reference_description_v1-
3_tcm2-880.pdf (Julio, 2009)
http://www.naa.gov.au/Images/AGLS_reference_description_v1-3_tcm2-880.pdfhttp://www.naa.gov.au/Images/AGLS_reference_description_v1-3_tcm2-880