Upload
jose-maria-mendoza
View
214
Download
0
Embed Size (px)
DESCRIPTION
La gestion del conocimiento en internet
Citation preview
Disponible en: http://www.redalyc.org/articulo.oa?id=69510217
Red de Revistas Científicas de América Latina, el Caribe, España y Portugal
Sistema de Información Científica
Andrés Felipe Echavarría Ramírez
Una visión al mundo de la búsqueda y recuperación de la información electrónica
Revista Lasallista de Investigación, vol. 1, núm. 2, 2004, pp. 117-122,
Corporación Universitaria Lasallista
Colombia
¿Cómo citar? Fascículo completo Más información del artículo Página de la revista
Revista Lasallista de Investigación,
ISSN (Versión impresa): 1794-4449
Corporación Universitaria Lasallista
Colombia
www.redalyc.orgProyecto académico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto
117REVISTA LASALLISTA DE INVESTIGACIÓN - VOL. 1 No. 2
Aspectos Metodológicos
Una visión al mundo de la búsqueda y recuperaciónde la información electrónica
Andrés Felipe Echavarría RamírezBibliotecólogo, Biblioteca J. Ernesto Vélez Escobar. Corporación Universitaria Lasallista
Correspondencia: Andrés Felipe Echavarría Ramírez. email: [email protected]
A glimpse to the world of search and recovery of electronic information
Resumen
El creciente número de sitios y recursos en Internetha dificultado el proceso de búsqueda y recuperaciónde información útil para la formación e investigación.Aunque la Red cuenta con importantísimas fuentes,es desconocida por los motores de búsqueda tradi-cionales, a esta parte se le llama Red Profunda. Paraacceder a este pequeño universo de Internet es ne-cesario conocer los mecanismos, estrategias y herra-mientas que faciliten y garanticen el logro de nues-tros objetivos.
Palabras Clave: Internet. Red Profunda. Red Super-ficial. Bases de datos. Bibliotecas electrónicas.Buscadores. Estrategias de búsqueda.
Abstract
The increasing number of web sites and resourcesprovided by internet has made the process of searchand recovery of useful information for schooling andresearch more difficult. Even though the Net hasextremely important sources, these are unknown forthe majority of traditional search engines. This is whatit is known as “The Deep Net”. To access this smalluniverse of internet, it is necessary to know themechanisms, strategies and tools that facilitates andguarantee the achievement of our objectives.
Key words: Internet. Deep net. Shallow net. Databases, Electronic libraries. Searchers. Searchstrategies.
Introducción
Internet es considerada la biblioteca por excelen-cia y con mayor número de consultas del mundomoderno. Sólo se necesita mover el puntero porla pantalla, hacer clic y listo, ya estamos en la Redde redes. Pero el estar en ella no nos garantiza elque encontremos lo que se necesita, incluso enla mayoría de los casos y después de pasar másde hora y media frente al computador, no se con-sigue el resultado deseado y en contraposición aéste, sólo se logra comerciales de juegos en lí-nea, pantallas con publicidad pornográfica y has-ta invitaciones para entrar en comunidades debuscadores de pareja.
Buscar información en Internet puede convertir-se en el momento más difícil y frustrante del in-vestigador, ya que cuenta con millones de recur-sos y herramientas como ellas, los motores debúsqueda. El problema con los motores de bús-queda es que no solo hay que saber como usar-
los para sacarle el máximo provecho, sino porqueestos apenas indexan una mínima cantidad de loque Internet pueda ofrecer.
¿Entonces dónde se puede encontrar el resto dela información?. El resto de la información está yhace parte de lo que en 1994, la doctora JillEllsworth llamó «invisible Web» (Internet invisi-ble), para referirse a la información que los moto-res de búsqueda tradicionales no pueden encon-trar. Algunos autores prefieren llamarla “deep web”(Red profunda), ya que en realidad no es invisi-ble, sólo hay que saber llegar a ella1.
Un estudio más reciente con datos recogidos enmarzo del 2000 por la empresa BrightPlanet, diceque la información pública disponible en “deepweb” es de 400 a 500 veces mayor que en el quecomúnmente llamamos World Wide Web (www),y que la web profunda contiene 7500 terabytesde información comparado con 19 terabytes de laweb superficial2, situación que comúnmente es
118 REVISTA LASALLISTA DE INVESTIGACIÓN - VOL. 1 No. 2
comparado con la analogía del iceberg, océano ybanco de peces (ver gráfica 1). La parte superfi-cial del iceberg es comparada con la Red superfi-cial, y la gigantesca parte escondida es denomi-nada Red Profunda.
Gráfica1. Surface Web vs. Deep Web2
Contenido de la red profunda
La Red Profunda está conformada por gran partede información pública, pero en su gran mayoríaestá elaborada con protocolos no indexables porlos motores de búsqueda de la Web superficial,algunos de ellos son: Ftp (File Transfer Protocol),e-mail, grupos de noticias, Internet Relay Chat(IRC) ...
Según Isidro F. Aguillo, atendiendo a criteriosdocumentales y de ciencias de la información,podríamos agrupar en la Red profunda, los si-guientes documentos:
• Catálogos de bibliotecas y bases de datos bi-bliográficas nacionales e internacionales.
• Bases de datos no bibliográficas (Dialog, STN,Lexis-Nexis entre otras).
• Recursos de apoyo para la investigación y do-cumentos en formatos no indexables, comodocumentos en pdf, word, avi, mp3 entreotros.
• Revistas electrónicas, en las que es necesarioun registro previo y las que sólo se puede recu-
perar la información mediante búsquedas en subase de datos.
• Directorios de información mundial: por ejem-plo periódicos o páginas especializadas.
• Obras de referencia: enciclopedias, diccionariosen las que es necesario interrogar a la base dedatos para acceder al contenido.
• Información gubernamental, bursátil, comercialy educativa general 3.
Industria de la informaciónelectrónica
Ante el surgimiento y proliferación de las publica-ciones electrónicas, aparecieron varios protago-nistas en el mercado nacional e internacional, juntocon una industria de la información electrónica;la cual todavía se encuentra en evolución y no estan estable como otras industrias que tienen dé-cadas de existencia.
Ésta es una industria altamente dinámica y, has-ta cierto punto, difícil de visualizar. Sin embargo,es una industria con alto potencial y que atraecada vez más empresas de otras industrias, yaque se está descubriendo el alto potencial de lamisma.
Entre los participantes de esta industria contamoscon proveedores de importantísimas bases dedatos, así como bibliotecas electrónicas y porta-les de organismos científicos, pero todos bajo lasiguiente estructura.
Sistemas en línea: son sistemas de bases dedatos que permiten recuperar información delas mismas, con un lenguaje común de recu-peración de información y a distancia, confor-mados por sistemas profesionales orientadosa hombres de negocios y especialistas en in-formación o investigadores, sumando un pro-medio aproximado del 54% del total de la In-formación en la Red Profunda4. Algunos, losmás comunes en el medio por su antigüedad eimportancia son: Dialog, Dialog Corporation,Questel-Orbit, STN, OVID, Lexis-Nexis, DowJones Interactive, Gale, Wilson entre otros.(Gráfica 2).
119REVISTA LASALLISTA DE INVESTIGACIÓN - VOL. 1 No. 2
Gráfica 2. Contenido de la Red Profunda 2
Sistemas en CD-ROM: es una variación de lossistemas en línea a un entorno local o Intranet yen su gran mayoría son los mismos proveedores,aunque existen otras empresas dedicadas sólo aeste sector. Algunos son: SilverPlatter, DIALOGOnDisc, Bell & Howell Information and Learning(UMI), Gale, Wilson, entre otros.
Publicaciones y bibliotecas electrónicas: esla versión más demandada y en algunos de loscasos más costosa de la Red Profunda, ya queentre sus elementos de trabajo cuentan con losacervos más grandes de información electrónicaen texto completo y aunque existen empresas de-dicadas a este negocio como, (British Library Do-cument Supply Centre, UnCover – Ingenta, CISTI,OCLC, EBSCO, AIIP), existen alternativas mun-diales dedicadas a la distribución y recuperacióngratuita de infamación académica y científica5.
Estrategias de búsqueda deinformación electrónica
No basta con saber cuales son ni que recursos tie-ne la Red Profunda para nuestro saber y así lograrel éxito en la búsqueda de información, un ejemplode ello son los motores de búsqueda, los cualeshan mejorado sus herramientas y sus máquinaspara indexar y recuperar más y diferentes formatosde información, y aun así nos arrojan miles de re-sultados o en algunos casos la misma cantidad desiempre con elementos en su mayoría mediocres.
El éxito de una consulta depende de la planeacióny organización previa, es como elaborar un plan
de trabajo con sus respectivos planes de contin-gencia y correctivos. Pensemos en una consultaen Internet como si de una empresa se tratara ysi vemos de cerca esta analogía, nos daríamoscuenta que si la empresa es dirigida de formaimprovisada, ya que tarde o temprano caerá en elfracaso o en el peor de los casos en la quiebra.La improvisación sin planeación es la principalfuente de frustraciones en Internet. Sólo bastacon tomarnos 15 minutos con un papel en la manoy elaborar el siguiente plan:
Entrevista: es una reflexión inicial, pero justa parareconocer la necesidad real de información y, almismo tiempo, analizar las estrategias pasadas.Con ella buscamos establecer el objetivo y las me-tas a lograr. Para su correcto desempeño el inves-tigador debe hacerse las siguientes preguntas:
¿Requiero datos sobre?, ¿Dónde he bus-cado?, ¿Qué encontré?, ¿Me sirve?,¿Cómo me sirve?, ¿Por qué me sirve?,¿Qué más me falta?, ¿Para que lo necesi-to?, ¿Qué beneficio espero recibir de lo queencuentre?, ¿Para cuándo lo quiero?,¿Cómo lo quiero? y ¿Cuánto estoy dispues-to a pagar? 6.
Tema: a partir de la definición y respuesta a to-dos los interrogantes de la entrevista, es necesa-rio visualizar el tema a tratar, ya sea por medio deuna frase o una palabra. Lo que se busca esdejar claro cuál es la meta a lograr y que mejorpara ello que un enunciado que me permita jugarcon terminologías especificas o palabras clavesde mi interés.
Tema general y Subtema: para lograr claridaden la consulta es necesario esclarecer las ideas yanalizar nuestro objetivo, por medio de una es-tructura jerárquica de nuestro pensamiento, y paraello debo definir el tema general y subtema denuestro tema de consulta. Ejemplo:
o Tema general: Contaminacióno Tema: Perturbaciones ambientales de origen
Humanoo Subtema: Efecto Invernadero Lluvia ácida
Otros temas: en este punto debemos ampliar nues-tras fronteras y revisar temas que puedan comple-mentar o mejorar nuestro tema de consulta.
120 REVISTA LASALLISTA DE INVESTIGACIÓN - VOL. 1 No. 2
Términos de Consulta: en este paso se buscaelegir todas las palabras y posibles combinacio-nes que permitan hallar la información deseada ypara ello es necesario recurrir a sinónimos, siglas,terminologías específicas y lo más importante,términos en un segundo idioma.
Una vez que hemos elegido los términos adecua-dos es el momento de redactar nuestra estrate-gia de búsqueda. Para ello podemos combinarlos términos elegidos con diferentes operadoresy/o realizar los truncamientos que nos parezcanoportunos 7.
Entre ellos tenemos, los operadores boléanos, queson un tipo de operadores lógicos que se utilizanen la elaboración de una estrategia de búsqueday que nos permiten combinar diferentes términosde búsqueda entre ellos 8. Los más conocidosson, y (AND), o (OR), no (NOT).
Otro tipo de operadores son los operadores de proxi-midad, adyacencia y contexto. Estos operadoresnos permiten indicar en el sistema de búsqueda la
distancia que puede haber entre un término y otro.Entre los más comunes destacan los siguientes,NEAR (NEARn), PARRAFO (.P), ADJ, ADJn, “9.
Fuente: el gran número de bases de datos, mo-tores de búsqueda y herramientas para la con-sulta hace este proceso más complejo de lo pen-sado, pero sólo hace falta elegir nuestras lista deherramientas y organizarlas para futuras ocasio-nes, y en ésto podemos ayudarnos de los famo-sos Bookmark’s o Favoritos de la barra de herra-mientas de nuestro navegador.
Antes de realizar la consulta se debe elegir cuáles su fuente de mayor utilidad para el logro denuestro objetivo, sea esta un libro, artículo de re-vista, monografía, patente o informe técnico, loque en documentación es llamado fuente prima-ria. O una bibliografía, resumen o recopilación,también llamadas fuentes secundarias.
A continuación listado de Bases de datos y moto-res de búsqueda especializados en la Red Pro-funda:
Por SuscripciónSitio URL
Dialog http://www.dialog.com/British Library http://www.bl.uk/CISTI http://cat.cisti.nrc.ca/search/EBSCO (Pregunte en la Biblioteca J.Ernesto Vélez por este servicio) http://trial.epnet.comGALE http://infotrac.galegroup.com/itweb/lasallistaScience Direct http://www.sciencedirect.com/
GratuitasSitio URL
Highwire http://highwire.stanford.edu/Scielo http://www.scielo.org/DOAJ http://www.doag.org/CompletePlanet http://www.completeplanet.com/Profusion http://www.profusion.com/The Invisible Web Directory http://www.invisible-web.net/Librarians’ Index to the Internet http://lii.org/FindLaw http://www.findlaw.com/LookSmart’s FindArticles http://www.findarticles.com/Internet Invisible http://www.internetinvisible.com/
Tabla No. 1 Bibliotecas electrónicas y Bases de Datos
121REVISTA LASALLISTA DE INVESTIGACIÓN - VOL. 1 No. 2
Idioma: un segundo idioma es una realidad y unacondición tangible en Internet. El predominio delinglés en las áreas de ciencia y tecnología se debea varios factores de tipo socioeconómico, que setraducen en un enorme potencial de recursoseconómicos y humanos, en la investigación ydesarrollo de países como Estados Unidos, Ca-nadá y Reino Unido, etcétera 10.
Las enormes cifras de producción científica enestos países anglófonos, así como en otros dealto nivel de desarrollo que han adoptado el in-glés como lengua científica, ha dado lugar a unapresencia casi universal del inglés en los mediosespecializados de comunicación 11.
Fecha: elegir el periodo cronológico es importan-tísimo para establecer parámetros de consulta ymejorar los filtros y resultados.
Finalmente y no menos importante, es la ejecu-ción de la búsqueda, donde podemos poner enpráctica cada uno de estos parámetros, pero esnecesario recordar que si no cuenta con variasalternativas una consulta que puede durar diez oquince minutos se puede tornar en dos horas omás y no arrojar los resultados esperados.
Conclusiones
A pesar de la rapidez y de la gran variedad deservicios que nos ofrece Internet, el usuario co-mún invierte horas o días enteros intentado encon-trar recursos en la Web, pero sin lograr el objetivodeseado. Esto es debido a la falta de planeacióny desconocimiento de las herramientas existentes.
Internet es un océano de información, que ac-tualmente es clasificado en dos partes por los teó-ricos más importantes en el mundo académico,Red Superficial, que es la zona de la red con in-formación comercial y de poco interés académi-co, y Red Profunda que contiene toda la informa-ción invisible o no indexable para los motores debúsqueda tradicionales, en su mayoría es infor-mación académico-científica, de negocios y gu-bernamental.
La planeación es un paso fundamental y una ga-rantía para el éxito de una consulta, y para llevar-la a su ejecución es necesario separar diez o quin-ce minutos con papel y lápiz en mano, antes de
sentarnos frente al computador. Este procesofacilita un guión de trabajo y realizar planes decontingencia, que nos permita cambiar dedirección cuando estemos perdidos en la Red sinperder más tiempo que el usado para digitar unacombinación de palabras.
Aunque una estrategia de búsqueda es una ga-rantía para el éxito en la búsqueda de informa-ción, no es absolutamente infalible, se debe rea-lizar una evaluación conciente de la calidad, ve-racidad, actualidad y precisión de la información.
La Biblioteca J. Ernesto Vélez Escobar de la Cor-poración Universitaria Lasallista, ha integradoentre sus herramientas y recursos como apoyo ala actividad formadora-investigativa, bases dedatos y recursos de información electrónica na-cionales e internacionales y muy pronto contarácon la Base de Datos EBSCO, para la cual seprogramarán charlas, y cursos de capacitación,dirigidos a todos los públicos de la institución.Recuerde consultar el la Biblioteca por estos cur-sos y recursos.
Referencias
1. ALFONSO, Enrique et al. Encontrar lo que sebusca: sumergiéndose en las profundidades[on line]. s.l. : redcom.org, s.f. [Citado 14 denoviembre de 2004]. Disponible en http://w w w . r e d c o m . o r g / t p / p a r c i a l / g 0 3 /g03_parcial_base.htm
2. BERGMAN, Michael K. The Deep Web:Surfacing Hidden Value [on line]. s.l. :BrightPlanet, 2001. p.1. [Citado el 14 de no-viembre de 2004]. Disponible en http://beta.brightplanet.com/deepcontent/tutorials/DeepWeb/index.asp
3. AGUILLO, Isidro F. Internet invisible o Infranet:Definición, clasificación y evaluación. En :JORNADAS ESPAÑOLAS DE DOCUMENTA-CIÓN. (7 : 2000 : Bilabao). Ponencias VII Jor-nadas Españolas de Documentación. Bilbao:Universidad del País Vasco, 2000. 249-269.
4. BERGMAN. Op. Cit., p.10. [Citado el 14 denoviembre de 2004]. Disponible en http://beta.brightplanet.com/deepcontent/tutorials/DeepWeb/index.asp
122 REVISTA LASALLISTA DE INVESTIGACIÓN - VOL. 1 No. 2
5. TURNBULL M., Federico. Modulo de capaci-tación: Búsqueda de información. México :BANCOMEXT, 2002. Modulo 2.
6. CORTEZ, Jacqueline. La estrategia de bús-queda. México : Infoestratégica, 2002. p.2.
7. EL PROCESO de búsqueda y recuperaciónde la información [on line]. País Vasco : Uni-versidad del País Vasco, s.f. p.3. [Citado 10noviembre de 2004] Disponible en http://www.sc.ehu.es/seweb/webcentro/ cas/publica/numeros/n11/5.pdf
8. Ibid, p.3.
9. Ibid, p.4.
10.CENTRO VIRTUAL CERVANTES. Anuario1999: Conclusiones y comentarios [on line].España : Instituto Cervantes, 1999. [Citado10 noviembre de 2004] Disponible en http://cvc.cervantes.es/obref/anuario/anuario_99/cindoc/p07.htm
11.Ibid, [Citado 10 noviembre de 2004] Disponi-ble en http://cvc.cervantes.es/obref/anuario/anuario_99/cindoc/p07.htm