21
BUSCADORES WEB INFORME 2006 Daniel García Casado Laura Samper Soria Universitat Pompeu Fabra – Barcelona Febrero-Marzo 2006

Informe Comisi.n 1 - xtec.cat 07_08/4a sessio... · En este informe se presentan algunos buscadores, directorios, metabuscadores y servicios de búsqueda de información. Concretamente

  • Upload
    lamtu

  • View
    212

  • Download
    0

Embed Size (px)

Citation preview

BUSCADORES WEB

INFORME 2006

Daniel García Casado Laura Samper Soria

Universitat Pompeu Fabra – Barcelona Febrero-Marzo 2006

Buscadores web. Informe febrero 2006

2

SUMARIO

1. INTRODUCCIÓN........................................................................................................ 3 2. PRESENTACIÓN DE LOS BUSCADORES............................................................. 5

2.1. Mooter .................................................................................................................. 5 2.2. Amazon Search Inside.......................................................................................... 6 2.3. Dmoz ..................................................................................................................... 7 2.4. Google ................................................................................................................... 8 2.5. Kartoo .................................................................................................................... 9 2.6. Internet invisible .................................................................................................. 10 2.7. Thumbshots Ranking........................................................................................... 11 2.8. A9 ........................................................................................................................ 12 2.9. Yahoo! Search ..................................................................................................... 14 2.10. iBoogie .............................................................................................................. 14 2.11. WebBrain........................................................................................................... 15 2.12. Teoma ................................................................................................................ 16 2.13. Google Scholar .................................................................................................. 17 2.14. Google Books .................................................................................................... 18

3. CONCLUSIONES...................................................................................................... 19

Buscadores web. Informe febrero 2006

3

1. INTRODUCCIÓN Internet ofrece una cantidad de información tan grande que localizarla se

convierte a menudo en una tarea ardua y a veces frustrante. Las herramientas de búsqueda, sean directorios o sean motores, facilitan en gran medida el acceso a la información; su utilidad es tan alta que la mayoría de los accesos a sitios web se hacen a partir de búsquedas realizadas en estas herramientas, alrededor de un 80%.

Las herramientas tradicionales de búsqueda de la web son los cnocidos

buscadores Google, Yahoo!, MSN, etc. En cambio, hay otros sistemas que proporcionan formas de buscar y formas de presentar la información obtenida de diversas maneras, así como sistemas que tienen como objetivo algo más concreto que una búsqueda general en la web.

En este informe se presentan algunos buscadores, directorios, metabuscadores y

servicios de búsqueda de información. Concretamente se comentan las siguientes herramientas: Google, Mooter, Kartoo, Dmoz, Internet Invisible, Amazon Search Inside, Thumbshot Ranking, A9, Yahoo! Search, iBooggie, WebBrain, Teoma, Google Scholar y Google Books.

Se han categorizado estos 14 buscadores considerando si pertenecen a uno de

estos bloques (ver tabla 1):

1. Motores generalistas: buscadores de información en general 2. Clustering: buscadores que presentan los resultados agrupados por la relación

que se da entre ellos 3. Visualización: sistemas que presentan de forma gráfica los resultados 4. Académicos: buscadores centrados en el ámbito de la ciencia 5. Especializados: buscadores específicos 6. Libros: permiten localizar tanto libros como buscar dentro de su contenido

Con este estudio se pretende da a conocer otros motores de búsqueda menos

conocidos, pero que pueden resultar de igual o mayor utilidad que los generalistas, ya que algunos, debido a su especialización en diferentes temas, resultan más adecuados para determinadas búsquedas. Por otro lado, se ha realizado un análisis en profundidad con tal de conocer su funcionamiento, el tipo de búsqueda que realiza, las posibilidades que ofrece… También se ha intentado ofrecer una lista con la idoneidad del buscador en función de la necesidad de información por parte del usuario en un determinado momento.

La realización de la investigación se ha elaborado mediante la libre exploración

de los diferentes motores de búsqueda, atendiendo en especial al sistema para hacer la búsqueda (consulta o navegación, búsqueda simple o avanzada…), a la presentación de los resultados de la búsqueda (clustering, listado textual, visualización, etc), al tipo de información obtenida, al orden en que se obtiene, a los diferentes archivos que busca (páginas webs, imágenes, vídeos, libros), y especialmente, a los elementos diferenciadores de cada uno de ellos.

Buscadores web. Informe febrero 2006

4

Una vez efectuado el análisis individual se ha procedido a una recopilación de la información para posteriormente unificar criterios, comparar resultados y establecer una guía práctica para los usuarios. Finalmente, los dos comisionados han integrado en un mismo documento los diferentes análisis.

Buscador URL Categoría

http://www.google.es/ Motor generalista http://www.mooter.com/ Clustering

http://www.kartoo.com/ Visualización http://ranking.thumbshots.com/ Visualización

http://dmoz.org/ Académico

http://www.internetinvisible.com/ Especializado

http://www.amazon.com Libros

http://a9.com/ Libros

http://search.yahoo.com/ Motor generalista http://www.iboogie.com/ Clustering

http://www.webbrain.com Visualización http://www.teoma.com/ Académico

http://scholar.google.com/ Especializado http://books.google.com/ Libros

Tabla 1

Buscadores web. Informe febrero 2006

5

2. PRESENTACIÓN DE LOS BUSCADORES 2.1. Mooter www.mooter.com

Figura 1

Mooter es un sistema de búsqueda que fue fundado por Liesl Capper en 2001,

con el objetivo de proporcionar a los internautas una mejor organización de los resultados de sus búsquedas por internet.

Este sistema de búsqueda ofrece tanto consulta como navegación. El tipo de

búsqueda que ofrece mediante la consulta es muy simple con una única opción, es decir, no ofrece ningún tipo de búsqueda avanzada. En cuanto a la navegación en esta web sólo es posible si ha habido una consulta previa. El único caso en que se puede hacer directamente sin consulta previa es para acceder a información sobre la propia web desde el link en la parte inferior de la página principal.

Los resultados pueden ser presentados de dos formas según el tipo de consulta

que se realice. Si la consulta se realiza mediante la opción “Search” son presentados mediante una visualización gráfica tipo mapa conceptual con una serie de ramificaciones en forma de categorías del elemento consultado.

En esta fase de la búsqueda, el usuario tiene dos opciones: a) Dirigirse a una de

las distintas categorías; o b) Ver todos los resultados sin ningún orden ni estructuración concretos mediante la opción de “All results” o el pequeño icono en forma de pantalla de “I want it ALL!”. La pantalla a la que se llega es exactamente la misma: una lista de resultados en forma de enlaces textuales a otras webs.

La segunda opción de consulta es mediante “Moot Quicker!”, mediante la cual

se puede acceder de forma directa a la lista de resultados sin ningún orden concreto mencionada en el párrafo anterior.

Una diferencia muy importante respecto a otros buscadores como por ejemplo

Google o Yahoo!, pues aunque presenta una lista de resultados, en el margen izquierdo de la página sigue presente la categorización a la que se accede mediante “Search” pero de forma textual, de forma que si a pesar de haber accedido inicialmente a la lista de

Buscadores web. Informe febrero 2006

6

resultados sin ningún orden, podemos acceder a los resultados de una categoría en concreto.

Es importante mencionar también que no ofrece una única categorización, sino

que depende de la búsqueda que realicemos, pueden haber varias. Para ver las distintas categorizaciones se puede hacer mediante “Next clusters” para verlo de forma gráfica, o bien, una vez en la lista de resultados, clicando las siguientes páginas ([1] , [2], etc.) de “Cluster page”en el margen superior izquierdo de la página.

En cuanto a la información que busca Mooter podemos decir que es muy limitada ya que no existe la posibilidad de buscar sólo fotografías o vídeos, sino que sólo busca páginas web, aunque estas sí puedan contener noticias, fotografías y demás. Otra limitación importante en cuanto a la búsqueda es que no permite limitarla a un periodo concreto y que al ser un buscador estadounidense, al hacer una búsqueda en otro idioma, los resultados son un poco incoherentes.

A pesar de todos los inconvenientes mencionados sobre este buscador, tiene la ventaja respecto a otros buscadores de tener la función de clustering, que es la categorización o estructuración de los resultados por temas de forma automática, lo que nos puede ser útil a la hora de realizar búsquedas más concretas sobre un determinado tema.

2.2. Amazon Search Inside www.amazon.com Amazon es una tienda virtual que dispone de un buscador mediante el cual se

pueden adquirir todo tipo de productos por internet. Dentro de este buscador, concretamente en la sección de venta de libros, encontramos la herramienta Search Inside. Es una herramienta que sirve para buscar las páginas de un libro en las que aparece una palabra en concreto, de forma que, estando registrado/a, se puede acceder a diversas páginas de dicho libro. Ahora bien, cabe señalar que no todos los libros disponen de esta opción.

Figura 2

Buscadores web. Informe febrero 2006

7

Para acceder a esta herramienta se puede hacer mediante consulta o navegación. Para hacerlo mediante consulta basta con buscar un libro o autor dentro de la opción “Search”. También ofrece una búsqueda avanzada poniendo el ISBN y editor, aparte del título y autor. Y para hacerlo mediante navegación es tan simple como moverse por el menú del margen izquierdo. Este está muy bien organizado y categorizado, de forma que permite buscar un libro por temática, o incluso por tipo de libro o usuarios (p.e. de bolsillo, para jóvenes, etc...) e incluso por formatos (en cassette, CD...).

Al realizar una búsqueda dentro de Search Inside, lo que este nos ofrece

es una lista de resultados formados por la frase exacta del libro en la que figura el concepto por orden de aparición en el mismo. Además está acompañada por un link a la página dónde se encuentra el concepto, lo que nos permite, si estamos registrados, acceder a la página completa del libro.

Además de eso, existen otros recursos como por ejemplo la posibilidad de leer el

índice del libro, visualizar las portadas, etc., También ofrece un breve listado dónde se puede ver qué otros libros han adquirido las personas que han comprado el libro que estamos consultando.

Como se ha visto, Search Inside es un buscador que ofrece herramientas

realmente útiles e interesantes respecto a otros buscadores de la misma índole que facilitan en gran medida la adquisición (y/o la decisión de la misma) de libros que puedan interesar a los usuarios.

2.3. Dmoz www.dmoz.org Dmoz es el directorio abierto más extenso de la red, . Ha sido construido y se

mantiene existente gracias a una comunidad global de editores voluntarios. Este directorio es uno de los buscadores más potentes y populares de la red, ya

que varios portales y buscadores como Netscape Search, AOL Search, Google, Lycos, HotBot, DirectHit, y otros lo utilizan como directorio de búsqueda.

Este motor permite la consulta y la navegación. A su vez la búsqueda puede ser

tanto simple como avanzada, sin embargo, aunque esta última no permite tantas posibilidades como Google, ofrece la posibilidad de buscar por categorías de temas, o búsqueda por “sites”.

El resultado de la búsqueda presenta primeramente aquellas categorías del

directorio abierto de Dmoz, que contienen aquello que le hemos pedido que nos busque. Además, también presenta varias paginas webs oficiales, con una información

clara y definida de lo que contiene dicha web. Dmoz busca únicamente paginas Web, no busca noticias o imágenes, sino solo

paginas Web oficiales, principalmente académicas, donde aparece nuestra demanda de búsqueda.

Como aspectos especiales de este motor, podemos decir que es simple, de fácil

uso, bien estructurada, la información que otorga la presenta de forma clara, definida y

Buscadores web. Informe febrero 2006

8

ordenada. A su vez este directorio abierto permite la posibilidad a cualquiera de contribuir a ampliar y mejorar la red.

2.4. Google www.google.com

Google es un motor de búsqueda generalista que funciona con una combinación única de hardware y software avanzado. El corazón de su software es PageRank(TM), un sistema de clasificación de páginas web desarrollado por los fundadores Larry Page y Sergey Brin en la Universidad de Stanford. Su velocidad de búsqueda es muy alta ya que según sus autores permite buscar en más de 8.000 millones de direcciones URL.

Es un motor de consulta. Permite la búsqueda simple y avanzada según el interés del internauta. Su búsqueda avanzada permite amplias posibilidades de búsqueda

Los resultados de la búsqueda se ordenan de forma simple, es decir por webs, categorías o imágenes, según la forma que le hayas pedido anteriormente. Para la búsqueda en forma de web también ofrece enlaces patrocinados. Google presenta los resultados mediante el algoritmo PageRankTM que decide la importancia de una página. Es un dato valioso, porque es uno de los factores que determinan la posición que va a tener una página dentro de los resultados de la búsqueda. No es el único factor que Google utiliza para clasificar las páginas, pero sí es uno de los más importantes. Además, Google admite que una página no puede controlar los links que apuntan hacia ella, pero sí que puede controlar los enlaces que esta página coloca hacia otras páginas. Por ello, links hacia una página no pueden perjudicarla, pero sí que enlaces que una página coloque hacia sitios penalizados, pueden ser perjudiciales para su PageRankTM.

Figura 3

Google permite buscar cualquier tipo de información según la opción que le

indiques. Puede buscar la web en cuestión, las webs que contienen aquello que se consulta, puede buscar por imágenes, grupos, noticias y varios servicios más.

Los resultados de las búsquedas Google no sólo contienen todos los términos de

la búsqueda, sino que Google también analiza la proximidad de esos términos en la página. Google ofrece un servicio de búsqueda avanzada muy amplio con un gran número de opciones de búsqueda.

Buscadores web. Informe febrero 2006

9

Se pueden buscar resultados según varias palabras, introduciendo una palabra

exacta, con alguna de las palabras, o pidiendo que no aparezcan ciertas palabras. A su vez permite búsquedas de paginas en un determinado idioma, en formatos

específicos o de una fecha concreta, entre otras opciones. 2.5. Kartoo www.kartoo.com Kartoo es un buscador un tanto peculiar por dos motivos. Uno es debido a su

originalidad en la presentación de los resultados. Éstos son presentados de manera gráfica bajo la forma de un mapa. Y la otra peculiaridad responde al hecho que Kartoo es un motor de búsqueda. Esto significa que no dispone de una propia base de datos, sino que Kartoo busca en otros motores de búsqueda. En el apartado de opciones se pueden seleccionar los buscadores que se desean utilizar (AlltheWeb, Altavista, Yahoo, etc).

Figura 4

Este metamotor no goza de una búsqueda avanzada limitando así su efectividad

a la hora de realizar con éxito nuestras indagaciones. Por otro lado, la presentación de los resultados en forma de mapa es novedosa aunque poco útil. Las webs encontradas son representadas por páginas más o menos grandes según su pertinencia. Cuando pasamos el ratón por encima de alguna de estas páginas, las palabras claves se iluminan y una descripción breve de la site aperece en la izquierda de la pantalla. Además, como se puede observar en la siguiente captura de pantalla, se nos ofrece una pequeña imagen de la web en cuestión para que nos podamos hacer una idea acerca de ella.

El tipo de información que nos ofrece Kartoo son páginas web en general. No

existe ninguna opción para que podamos acotar nuestras búsquedas a por ejemplo

Buscadores web. Informe febrero 2006

10

archivos de imagen, sonidos o a formatos pdf. Aún así, Kartoo si que encuentra todo tipo de sites y formatos.

A pesar de las limitaciones comentadas anteriormente cabe destacar algunas

opciones bastante interesantes de este metamotor. Una de ellas es que de manera visual nos ofrece mucha información para analizar la búsqueda. Con esto queremos decir, que dependiendo del color de la página o de su tamaño podemos saber si el resultado encontrado es más pertinente o si es una pagina personalizada, patrocinada o formato word.

En definitiva, Kartoo es una herramienta innovadora ya que presenta los

resultados de un modo gráfico e intuitivo. Pero, este hecho carece de utilidad. La mayoría de usuarios buscamos fiabilidad y rapidez en los buscadores y no bonitos dibujos e interfaces agradables que nos alegren la vista...

2.6. Internet invisible www.internetinvisible.com Internet invisible.com es un buscador de bases de datos. Es capaz de recopilar,

describir y ofrecer enlaces a las bases de datos existentes en Internet en un directorio organizado en grupos temáticos. Se pueden realizar dos técnicas de búsqueda. Por un lado, se puede acceder a su directorio temático y por otro rellenar el típico formulario de búsqueda (tanto simple como avanzada).

Figura 5

La búsqueda avanzada no es tan completa como la que disponen otros motores

de búsqueda ya que sólo se pueden realizar búsquedas booleanas mediante los operadores AND, OR o NOT. Lo novedoso y útil de esta web es que nos permite acceder con rapidez y seguridad a lo inaccesible, al mundo invisible de las bases de datos residentes en la Red.

Internet invisible.com ordena los resultados de la búsqueda alfabéticamente y los

presenta de forma convencional, es decir, de manera textual. Este hecho puede no parecer muy riguroso ya que siempre aparecerán en las primeras opciones aquellas páginas que empiecen por “A” y no las que sean más relevantes para nosotros.

Un aspecto acertado y poderosamente útil es que la web nos ofrece de forma

bien ordenada información de uso frecuente sobre temas de “actualidad”, “obras de referencia” y “servicios”.

Buscadores web. Informe febrero 2006

11

Internet invisible.com tal como afirman sus autores, Ricardo Albiñana y Silvia Morales, pretende convertirse en un directorio de referencia en el estado español. Todos sus recursos están escritos en cualquier lengua oficial de nuestro territorio y se convierte así en una herramienta necesaria tanto para investigadores sociales como para navegantes curiosos que anhelan información reservada en bases de datos y oculta en los buscadores tradicionales.

2.7. Thumbshots Ranking ranking.thumbshots.com Thumbshots Ranking es una herramienta de consulta con importantes

peculiaridades dentro de este campo. Principalmente, su originalidad se encuentra en el hecho que este buscador no recupera propiamente la información, o al menos no tal como lo entendemos normalmente. En su lugar, lo que nos presenta Thumbshots es exclusivamente un tipo concreto de información que ningún otro buscador en la red ofrece por el momento.

En primer lugar, debemos mencionar que este buscador no permite la posibilidad

de realizar una búsqueda avanzada y los únicos instrumentos adicionales que ofrece son básicamente la posibilidad de colgar a la página un mensaje de opinión sobre el sitio web, enviar un mensaje informativo a un compañero e informar a los operarios de posibles virus.

La principal utilidad que ofrece esta herramienta consiste en disponer de un

Ranking entre dos buscadores sobre el orden y la coincidencia de los resultados de cada buscador. Así pues, da información gráfica sobre que resultados coinciden (normalmente de los primeros 100 de cada buscador) y las diferencias entre ambos buscadores de la forma de ordenarlos.

Figura 6

Adicionalmente, el buscador permite, una vez hecho el Ranking, que se consulte los resultados de los buscadores analizados por medio de un link.

Profundizando más sobre los resultados obtenidos, cabe decir que Thumbshots muestra los resultados de forma gráfica (con un dibujo compuesto por círculos, que representan los resultados y el orden de presentación de estos, y líneas que conectan

Buscadores web. Informe febrero 2006

12

estos círculos, que informan cual coincide con el otro. Además, juega con los colores para diferenciar los resultados coincidentes con los no coincidentes). La información que da de cada resultado es mínima, ya que solo informa de su posición comparada con la del otro buscador, aunque la ventaja que tiene es que ningún otro buscador ofrece tal posibilidad. No distingue entre imágenes, webs, vídeos ni nada, ya que ello dependerá de los buscadores que se comparen si disponen de tales herramientas o no. Aún así, el Ranking que establece se refiere, en principio, solo a las páginas web en general.

La figura muestra claramente el caso de una búsqueda en que la comparación entre Google y Alltheweb dan resultados poco coincidentes y con muchas diferencias a la hora de ordenarlas (las líneas cuanto más horizontales mayor diferencia de orden).

Figura 7 En este caso es importante destacar un par de cosas. En primer lugar, el sitio web

permite ver qué proyectos de innovación hay en marcha en la empresa y últimas noticias al respecto. En segundo lugar, se tiene que tener en cuenta que thumbshots no solo dispone de esta herramienta en su empresa, sino que con otros dominios se puede acceder a un completo directorio, con modo de búsqueda incluido, que presenta los sitios web con una captura de pantalla de su página principal y a una página de presentación de la empresa.

2.8. A9 www.a9.com

El buscador A9.com es una herramienta de consulta que ofrece tanto la posibilidad de realizar una búsqueda simple como avanzada.

Figura 8

Este buscador se caracteriza por ser el único que ofrece un pack de posibilidades en su interior, las cuales consisten en: encontrar información, organizarla y recordarla.

Buscadores web. Informe febrero 2006

13

Figura 9

A9.com da la posibilidad al internauta de encontrar gran variedad de tipos de información: Por defecto ofrece los resultados encontrados en la búsqueda en forma de páginas web e imágenes (resultados que saca del motor de Google.com); aún así, A9 también permite la posibilidad de hacer “Search Inside the Book” (proveniente de Amazon.com), búsqueda de referencias (desde GuruNet), de películas (desde IMDb), páginas amarillas, mapas, definiciones de Wikipedia, búsqueda de personajes, “IceRocket Blog Search” y muchas más opciones presentadas en un desplegable (izquierda).

Este buscador permite guardar tus propias notas sobre cualquier página web y buscarlas de forma automática sin necesidad de guardar la entrada. Esto lo permite el hecho que esta en disposición un “Diary” en la web. Además, recomienda nuevos sitios y recuerda los antiguos sitios favoritos de forma personalizada por medio del uso de bookmarks. De modo adicional, el buscador también ofrece la posibilidad de instalar la A9 Toolbar, para ahorrar tiempo al usuario. Además, se puede encontrar un apartado de preferencias, donde el usuario personalice la forma de dar la información como más le guste.

De forma original A9.com ofrece un Historial Personal y te recuerda si has visitado anteriormente o no un sitio web. Cada búsqueda realizada se registra en la columna de History, la cual puede ser pulsada cuando apetezca.

Como cosas a destacar se podría añadir cantidad de información, ya que A9.com ofrece elementos como el Highlight, las traducciones, etc. No obstante, aquí podremos en consideración solo dos:

En primer lugar, una de las cosas más interesantes de la web es que permite ver toda la información encontrada (imágenes, webs, personajes, etc.) en la misma página principal del buscador. Esto desmarca esta herramienta de las otras, ya que permite una búsqueda más ágil y polivalente.

Buscadores web. Informe febrero 2006

14

Figura 10

En segundo lugar, A9.com ofrece los “Site Info”, que equivalen a información detallada de la página web (rapidez, popularidad,...) con solo pasar el cursor por encima.

2.9. Yahoo! Search http://search.yahoo.com/ Yahoo! Search es uno de los motores de búsqueda más conocidos e importantes

de Internet. Este buscador permite al usuario disponer de herramientas muy útiles para mejorar la búsqueda de la información deseada. A parte de un directorio, el motor permite configurar la búsqueda en toda la web, en tu país, o en el idioma en el que estás navegando. También mediante las preferencias de idiomas y la búsqueda avanzada se puede perfilar los criterios de la búsqueda. Yahoo! Search incorpora como novedades, la existencia de unos “atajos” de diferentes temas, que permiten acceder de forma mucho más rápida a la información necesaria. Además incluye el nuevo sistema RSS.

Este motor de búsqueda no se limita únicamente a páginas webs, sino que

permite buscar diferentes tipos de archivos como imágenes, vídeos, etc. Como opción añadida, Yahoo! Search te ofrece enlaces relacionados al concepto buscado, especialmente útiles para aquellas búsquedas, en las que el usuario no tiene excesivamente claro qué es lo que está buscando, así como la opción de mi Yahoo!, que permite personalizar el buscador, cambiando los colores, teniendo a mano los enlaces usados más frecuentemente y las noticias de interés diarias.

Para los usuarios menos experimentados, Yahoo! Incorpora un sistema de ayuda,

con tal de facilitar el entendimiento de todas las opciones de las que dispone, con tal de que el navegante consiga optimizar su búsqueda.

2.10. iBoogie http://www.iboogie.com/ iBoogie es un motor de búsqueda que todavía se halla en una fase prematura de

desarrollo y por ello muchas de las opciones de las que dispone no se hallan operativas, como por ejemplo el directorio o la búsqueda avanzada. No obstante, esto no impide

Buscadores web. Informe febrero 2006

15

que iBoogie se presente como un motor de búsqueda con ciertas peculiaridades que lo diferencian claramente de otros buscadores.

En primer lugar, la presentación de los resultados de la búsqueda se realiza en

dos formatos diferentes: textual y por clustering. A la izquierda de la pantalla aparece el concepto buscado subdividido en las categorías más frecuentes, mientras que en el centro de figuran de forma textual y tradicional.

Otra de las características únicas de iBoogie es que permite realizar búsquedas

simultáneas en los sitios webs con buscador interno que previamente haya configurado el usuario. Por ejemplo podemos buscar temas académicos, realizando la búsqueda en el propio iBoogie y a la vez en las webs de la Pompeu Fabra, la Autónoma y la UPC, que previamente habremos configurado. Hasta 8 buscadores externos podremos añadir.

Figura 11

2.11. WebBrain http://www.webbrain.com Web Brain es un motor de búsqueda que presenta los resultados de forma visual,

usando para ello java, lo cual ocasiona una lenta carga de la página, llegando incluso a bloquearse. La web está dividida en tres partes. La parte superior representa un mapa animado con las categorías de búsqueda principales, siendo un sistema de búsqueda por navegación; la central es un sistema de búsqueda por consulta tradicional, y en la inferior se muestran los resultados de forma textual.

A diferencia de otros buscadores, Webbrain es un buscador manual basado en

partes del Open Directory. La información que se obtiene a través de este buscador, ya ha sido previamente seleccionada y organizada. Por lo tanto, los resultados que se pueden llegar a obtener no son excesivos, si no más bien, pocos y concretos.

En el caso de que utilicemos el sistema de navegación, se empieza por la

categoría principal y a medida que vamos haciendo clic sobre un tema, todas las materias relacionadas con el mismo se muestran en base a la relación que existe con la misma, es decir, la divide en partes, en la parte superior, muestra las materias “padres” de la categoría objeto de búsqueda. En la parte derecha, muestra subcategorías de las materias “padres”; en la parte izquierda, muestra categorías que no son subcategorías de

Buscadores web. Informe febrero 2006

16

las materias “padres” pero sí que están relacionadas con la materia que estás investigando. Y ya por último, en la parte inferior, muestra categorías “hijas” de la materia que se está buscando. Destaca por ser un buscador manual, no automático, dividiendo los resultados de la búsqueda en base a la relación que existe con la categoría principal.

Figura 12 2.12. Teoma http://www.teoma.com/ Teoma funciona mediante un sistema de búsqueda por consulta, especializado en

material científico. La presentación de los resultados se muestra en tres apartados: de forma textual, por agrupación (clustering) y mediante enlaces a recursos de expertos relacionados con el concepto de la búsqueda. Los resultados se presentan en conjuntos de documentos divididos en tres niveles: un nivel con las páginas más relevantes, al que llama “results” donde se muestra una lista de texto con aquellas páginas que contienen la información solicitada; otro nivel con las sugerencias de búsqueda, llamado “refine” que le permite al usuario llevar más allá su enfoque o buscar más específicamente; y un último nivel, denominado “resources” con enlaces a páginas web de expertos que han considerado que la información que se está buscando se encontrará en esas páginas.

la particularidad de Teoma es que no hace una búsqueda en el sistema

ofreciendo como resultados todas aquellas páginas que contienen la información que el usuario está solicitando, sino que muestra aquellas páginas donde la información que se está buscando ha sido citada un mayor número de veces por el resto de la web así como las que tienen un mayor número de enlaces por otras páginas. por lo tanto, Teoma no muestra aquellas páginas que tan solo hacen mención aislada de la palabra o palabras que estamos buscando, ni tampoco podrá mostrar una página que no tenga enlace con otra de la misma materia.

La forma que tiene Teoma de clasificar la información a diferencia de otros

buscadores, es que ordena la información que ha encontrado mostrándola al usuario de la siguiente forma: clasifica la información mostrando en primer lugar aquellas páginas que dentro del grupo de páginas encontradas tienen más relación entre ellas, es decir,

Buscadores web. Informe febrero 2006

17

mostrará las páginas que han sido citadas y enlazadas más veces, y en último lugar, las páginas menos citadas y enlazadas, siempre en base a la información solicitada, y solo entre el grupo de páginas que Teoma ha considerado que son más relevantes.

2.13. Google Scholar http://scholar.google.com/ Google Scholar es un buscador de Google en proceso de prueba que restringe su

búsqueda a artículos y material académico. El propio Google Scholar se define como “una forma sencilla de buscar ampliamente por la literatura académica. Desde un punto, puedes buscar entre muchas disciplinas y fuentes de información: peer-reviewed papers, tesis, libros, abstracts y artículos, de publicaciones profesionales, sociedades profesionales, universidades y otras organizaciones académicas. Google Scholar es una ayuda para identificar la investigación más relevante por todo el mundo de la investigación académica”.

En Google Scholar las consultas se hacen siguiendo el sistema de consulta o

interrogación. Ofrece un sistema de búsqueda simple, y también ofrece la opción de hacer una búsqueda avanzada:

Búsqueda con operadores booleanos (y, o, no) y frase exacta, y a la vez ofrece situar las palabras que buscamos: en el título del artículo o en cualquier parte del mismo

Búsqueda por autor Búsqueda por publicación Búsqueda por fecha de publicación Búsqueda por áreas temáticas: todas o sólo las que seleccionemos

(biología, economía, ciencias, matemáticas, medicina...) Del mismo modo, tiene un apartado de “Scholar preferences” para determinar en

qué idioma queremos que nos salga el Scholar search (al estar en fase de prueba hay muy pocos idiomas disponibles), entre las publicaciones de qué idioma queremos que busque el robot, e incluso ofrece la posibilidad de enlazarnos con algunas Bibliotecas que estén suscritas a periódicos online para poder leer artículos completos desde las mismas.

Google Scholar dispone de una guía tutorial qué explica cómo moverse por el

buscador. Si nos fijamos en cómo ofrece los resultados de la búsqueda, vemos que lo hace

de forma textual indicando: el título y link al abstract del artículo o al artículo completo si está disponible, identifica otros papers que han citado el paper que buscamos, informa de si se puede acceder al artículo desde alguna Biblioteca, señala las bibliotecas que tengan ese libro, ofrece otras versiones del artículo que puedan ser accesibles y ofrece la posibilidad de buscar información sobre ese paper en Google.

Los resultados, como se explica en el propio Google Scholar, se ordenan por

relevancia de los mismos. Al igual que pasa con el buscador general de Google, las referencias más útiles aparecen en lo más alto de la página. Google hace su Nanking

Buscadores web. Informe febrero 2006

18

atendiendo al texto completo del artículo, el autor, el lugar de publicación y cuán a menudo es citado dicho artículo en otra literatura académica.

2.14. Google Books http://books.google.com/ Google Books es otro buscador de Google, también en proceso de prueba, que

permite buscar dentro del contenido de muchos libros. ¿Cómo es posible eso? Los libros que se encuentran mediante la Búsqueda de libros de Google provienen de editores y de bibliotecas que han accedido a que sus libros estén disponibles en Internet para Google. Obviamente, y debido a la normativa de propiedad intelectual, sólo se puede visualizar una parte de los libros que tienen derechos de autor. Si el libro no tiene restricciones impuestas por los derechos de autor y se considera de dominio público, se puede consultar por completo. El principal objetivo del programa de Búsqueda de libros de Google es que el usuario descubra libros, no a que los lea de principio a fin. Vemos que, a diferencia de Google Scholar, la página de inicio se ofrece en castellano.

Google Books sigue el mismo sistema de consulta que Google y Google

Scholar: sistema de consulta o interrogación, con búsqueda simple y búsqueda avanzada. Dentro de la búsqueda avanzada encontramos:

Buscar resultados con todas/alguna/sin las palabras o frase exacta (sistema booleano)

Búsqueda por título Búsqueda por autor Búsqueda por editorial Búsqueda por fecha de publicación Búsqueda por código ISBN

También contiene un apartado de Ayuda en el que se presentan varias preguntas

que los usuarios pueden plantearse (FAQ) y sus correspondientes respuestas. En la lista de resultados ofrecidos se incluye una imagen de la portada, el título

del libro, el autor, la editorial, el año de publicación y el número de páginas, así como “más resultados de este libro” si los hay.

Los resultados se ofrecen del siguiente modo:

Buscadores web. Informe febrero 2006

19

Figura 13 Dependiendo de lo que cada editorial o autor permita ofrecer a Google, los

resultados ofrecidos variarán. Por ejemplo, algunas editoriales no permiten que se ofrezca ninguna página que muestre el contenido del libro, por lo que sólo ofrecerán una imagen de a portada, de la contraportada y del índice. En cambio hay otras editoriales que permiten que se muestre una o dos páginas del contenido mismo del libro.

3. CONCLUSIONES Una vez realizada una descripción del funcionamiento de los diferentes

buscadores estamos en disposición de afirmar lo siguiente: No hay un motor de búsqueda universal ni mejor que los demás, ya que cada uno

de ellos presenta ciertas características que lo diferencian de los otros. Por ejemplo, para búsquedas generales y de forma rápida, recomendamos usar,

de entre los analizados, Yahoo! Search o Google, ya que son los motores de búsqueda más completos y con mayor cantidad de páginas indizadas. Además ofrecen otros servicios de gran ayuda como el Directorio. También permiten una configuración y mayor optimización de la búsqueda a través de opciones tales como la búsqueda avanzada, la configuración de preferencias, las herramientas de idioma y los enlaces relacionados.

Buscadores web. Informe febrero 2006

20

Para búsquedas en las que el usuario no tiene claro el concepto exacto a buscar,

se aconseja usar WebBrain o Kartoo. Sus interfaces visuales facilitan al usuario encontrar la información de forma escalada, al igual que volver a las fuentes originales. Son buscadores muy completos, que también ofrecen los resultados por subcategorías, hecho que, junto a la enorme cantidad de información que proporcionan puede llevar a un usuario poco experto a perderse o a no encontrar un objetivo concreto.

IBoogie y Mooter resultan idóneos para realizar búsquedas simultáneas, sobre

todo cuando se quiere contrastar información de un sitio determinado con buscador interno con la de un buscador más general. Son herramientas muy útiles para aquellos usuarios que buscan información de índole más técnica o científica y que conocen sitios webs con buscadores internos que tratan la temática buscada.

A la hora de recuperar información más específica, se invita a probar con los

siguientes motores de búsqueda: Dmoz se presenta como el directorio más extenso de todo Internet,

manteniéndose en funcionamiento de un modo no excesivamente lucrativo. Existen personas encargadas de revisar y subir a la base de datos aquellas informaciones que puedan resultar de interés para el resto de la comunidad internauta.

Teoma resulta adecuado para temas científicos de alta calidad, debido a que la

información ofrecida proviene de fuentes de calidad. La presentación de los resultados se realiza a través de una selección previa del buscador, sobre aquellos sitios realmente relacionados con el tema, y que hayan sido enlazados con mayor frecuencia desde páginas relacionadas con la temática, como puede ser en el caso de biología molecular, los enlaces de instituciones científicas y universidades, obviando aquellas páginas que no estén intrínsecamente relacionadas con ese tema, como podría ser una tienda de cosmética.

Internet Invisible recopila, describe y ofrece el enlace a las bases de datos existentes en Internet en un directorio organizado en grupos temáticos, los cuales se subdividen a su vez en materias más específicas. Cuando accedemos al web mediante uno de sus dos modos de acceso: un directorio temático o un formulario de búsqueda -simple o avanzada- obtenemos una ficha con la descripción del contenido de la base de datos relacionada, el enlace a la pantalla de búsqueda y la entidad o persona responsable de su creación.

Google Scholar recupera “papers” de contenido académico, lo que resulta de gran utilidad al acotar la búsqueda sólo a este ámbito. Google Books es una herramienta interesante en la búsqueda de libros y sus contenidos, ya que permite al usuario ojear algunas páginas de los mismos. No obstante, en ocasiones, debido a restricciones legales por temas de derechos de autor, únicamente se ofrece el índice o la portada, sin poder entrar en su contenido. Sin embargo Google avisa de que Google Books, más que para leer libros enteros, sirve para descubrirlos. Nótese que ambos se hallan todavía en una versión beta.

Amazon es una herramienta diferente puesto que no tan solo realiza la búsqueda

de un concepto o palabra, si no que tiene como función principal la venta de libros, por

Buscadores web. Informe febrero 2006

21

un link a la página dónde se encuentra el concepto, lo que nos permite, si estamos registrados, acceder a la página completa del libro.

Por último, A9 es un buscador que se basa en ofrecer un valor añadido a la

información indexada por otros motores de búsqueda. Permite agrupar lo mejor de distintos buscadores y ofrece varios formatos de documentos en la misma página.

Como se ha visto, existe una gran variedad de buscadores en la Red.

Dependiendo de la necesidad de cada usuario será mejor uno u otro. No todo es Google. Coordinación general

Mari-Carmen Marcos

Elaboración del informe Daniel García Laura Samper

Colaboradores: Irene de Federico Jan Guijarro Guillem López Sergio López Julia Mirjam Raquel Rodríguez Jonathan Zaragoza