Buscadores web - galeon.comgaleon.com/siomariscanabal/t7.pdf · Referencias 10 Glosario 11 . ... Un ejemplo son los buscadores de Internet (algunos buscan únicamente en la web, pero

  • Upload
    vothuan

  • View
    216

  • Download
    1

Embed Size (px)

Citation preview

  • 2014

    SIOMARIS FERNANDA CANABAL PERAZA

    23-8-2014

    Buscadores web

  • ndice

    Introduccin 1

    Qu es un buscador web? 2

    Para qu sirve un buscador web? 3

    Cmo se usa un buscador web? 4

    Clasificacin de buscadores 5

    Conclusin 9

    Referencias 10

    Glosario 11

  • Introduccin

    La manera ms rpidas y moderna de buscar informacin, es por medio de la Internet. Hoy en da existen millones de sitios web en todo el mundo (billones de pginas indexadas por los buscadores), las cuales contienen la ms variada informacin posible de imaginar. Es por lo mismo, que con la globalizacin y la tecnologa, la bsqueda de informacin dej de estar limitada principalmente a las bibliotecas, para ahora llevarse a cabo en la red de informacin que accedemos por medio de la Internet. Y la cantidad de informacin disponible se va incrementando a una gran velocidad, ao tras ao. Por esta razn en este trabajo abordaremos el tema de los buscadores web.

    1

  • Qu es un buscador web?

    Los buscadores en Internet, son programas o aplicaciones que residen en un sitio o pgina web, los cuales, al ingresar palabras en sus recuadros de bsqueda, operan dentro de la base de datos del mismo buscador y recopilan todas las pginas que contengan informacin relevante y relacionada con lo que se busca; de hecho este es el principal desafo que enfrentan las compaas que brindan este servicio, el ser capaces de brindar un orden al verdadero ocano de informacin que es la web (hablamos de red o web tambin para referirnos a la Internet). Las palabras que ingresamos en los recuadros para buscar se denominan en el medio "palabras clave", o "keywords" en ingls, por su importancia para obtener la informacin necesaria de la gran base de datos que maneja cada buscador.

    Un motor de bsqueda, tambin conocido como buscador, es un sistema informtico que busca archivos almacenados en servidores web gracias a su spider (tambin llamado araa web). Un ejemplo son los buscadores de Internet (algunos buscan nicamente en la web, pero otros lo hacen adems en noticias, servicios como Gopher, FTP, etc.) cuando se pide informacin sobre algn tema. Las bsquedas se hacen con palabras clave o con rboles jerrquicos por temas; el resultado de la bsqueda Pgina de resultados del buscador es un listado de direcciones web en los que se mencionan temas relacionados con las palabras clave buscadas.

    Como operan de forma automtica, los motores de bsqueda contienen generalmente ms informacin que los directorios. Sin embargo, estos ltimos tambin han de construirse a partir de bsquedas (no automatizadas) o bien a partir de avisos dados por los creadores de pginas (lo cual puede ser muy limitante). Los buenos directorios combinan ambos sistemas. Hoy en da Internet se ha convertido en una herramienta rpida y eficiente para la bsqueda de informacin, para ello han surgido los buscadores que son un motor de bsqueda que nos facilita encontrar informacin rpida de cualquier tema de inters, en cualquier rea de las ciencias, y de cualquier parte del mundo.

    Un buscador es una pgina de internet que permite realizar bsquedas en la red. Su forma de utilizacin es muy sencilla, basta con introducir una o ms palabras clave en una casilla y el buscador generar una lista de pginas web que se supone guardan relacin con el tema solicitado.

    Aunque el modo de utilizacin es muy fcil a nivel bsico, los buscadores permiten opciones avanzadas para refinar la bsqueda, cuyo resultado puede ser en muchas ocasiones de miles de pginas. Mediante estas opciones avanzadas se puede acotar la bsqueda y obtener un nmero de pginas ms manejable. Debido al gran tamao de Internet y a su naturaleza cambiante, ningn buscador posee registro de todas las pginas que se encuentran en la red. Por ello es aconsejable visitar ms de un buscador para contrastar los resultados y en ningn caso pensar que si una pgina no aparece en un buscador, es que no existe.

    2

    http://es.wikipedia.org/wiki/%C3%8Dndice_(base_de_datos)http://es.wikipedia.org/wiki/Archivo_(inform%C3%A1tica)http://es.wikipedia.org/wiki/Servidor_webhttp://es.wikipedia.org/wiki/Ara%C3%B1a_webhttp://es.wikipedia.org/wiki/Internethttp://es.wikipedia.org/wiki/World_Wide_Webhttp://es.wikipedia.org/wiki/Gopherhttp://es.wikipedia.org/wiki/File_Transfer_Protocolhttp://es.wikipedia.org/wiki/P%C3%A1gina_de_resultados_del_buscadorhttp://es.wikipedia.org/wiki/Localizador_de_recursos_uniformehttp://es.wikipedia.org/wiki/Internethttp://es.wikipedia.org/wiki/Ciencia

  • Para qu sirve un buscador web?

    Los buscadores poseen enormes bases de datos que contienen informacin referente a pginas web. Estas bases de datos se generan por las altas de usuarios que han creado sus pginas web (esto equivaldra a poner tus datos en un listn telefnico). En muchos buscadores, si el creador de la pgina no se da de alta en el buscador, la pgina no aparecer. Para las empresas es muy importante promocionar sus pginas en los buscadores para que la gente las encuentre fcilmente. Otros buscadores, no contentos con ello, poseen programas especficos que rastrean la red 24 horas al da, todos los das. Estos programas procesan una gran cantidad de informacin y extraen palabras clave que puedan servir para identificar la temtica de la pgina web.

    Cuando necesitamos de Internet, normalmente buscamos informacin sobre un tema concreto, y es difcil acceder a una pgina que la contenga, simplemente pinchando vnculos. Como solucin a este problema surgieron los buscadores. Un buscador es una pgina web en la que se ofrece consultar una base de datos en la cual se relacionan direcciones de pginas web con su contenido. Su uso facilita enormemente la obtencin de un listado de pginas web que contienen informacin sobre el tema que nos interesa.

    Existen varios tipos de buscadores, en funcin del modo de construccin y acceso a la base de datos, pero todos ellos tienen en comn que permiten una consulta en la que el buscador nos devuelve una lista de direcciones de pginas web relacionadas con el tema consultado.

    El origen de los buscadores se remonta a abril de 1994, ao en el que una pareja de universitarios norteamericanos (David Filo y Jerry Yang) decidieron crear una pgina web en la que se ofreciera un directorio de pginas interesantes clasificadas por temas, pensando siempre en las necesidades de informacin que podran tener sus compaeros de estudios. Haba nacido Yahoo!. El xito de esta pgina fue tan grande que una empresa decidi comprarla y convertirla en el portal que hoy conocemos. Adems del buscador, hoy Yahoo! ofrece muchos ms servicios.

    3

  • Cmo se usa un buscador web?

    Si hablamos de los buscadores en Internet que operan mediante robots, estamos hablando de sitios como Google (a mi juicio el ms recomendable, y por lo mismo el ms usado a la fecha en el mundo), una de las pginas ms visitadas y exitosas en la bsqueda de informacin. Otra denominacin comn para los buscadores que operan a travs de robots es la de "motores de bsqueda", un sinnimo tcnico poco utilizado. Los robots o araas son programas que escudrian la web siguiendo los links o enlaces que van encontrando en las diferentes pginas, de tal manera de ir descubriendo y archivando lo que encuentran a su paso. Estas araas no descansan nunca, descubriendo cada vez nuevas pginas en la red; entre los robots ms conocidos tenemos al Googlebot, de Google, el Slurp, de Yahoo!!!!, el Bingbot (antes el MSN bot, de MSN search) de Microsoft y otros menos conocidos. En todo caso se mencionan aqu de manera informativa, ya que para el usuario todos estos tecnicismos son completamente transparentes, o sea no necesita saber ni de su existencia ni funcionamiento para poder utilizar un buscador.

    Yahoo! es el primer tipo de buscador que surgi. En los ndices de bsqueda, la base de datos con direcciones la construye un equipo humano. Es decir, un grupo de personas va rastreando la red en busca de pginas. Vistas stas son clasificadas por categoras o temas y subcategoras en funcin de su contenido. De este modo, la base de datos de un ndice de bsqueda contiene una lista de categoras y subcategoras relacionadas con un conjunto de direcciones de pginas web que tratan esos temas.

    La consulta de un ndice se realiza a travs de categoras.

    Temporalmente, los motores de bsqueda son posteriores a los ndices. El concepto es diferente: en este caso, el rastreo de la web lo hace un programa, llamado araa o motor (de ah viene el nombre del tipo de buscador). Este programa va visitando las pginas y, a la vez, creando una base de datos en la que relaciona la direccin de la pgina con las 100 primeras palabras que aparecen en ella. Como era de esperar, el acceso a esta base de datos se hace por palabras clave: la pgina del buscador me ofrece un espacio para que yo escriba la o las palabras relacionadas con el tema que me interesa, y como resultado me devuelve directamente un listado de pginas que contienen esas palabras clave. Por ejemplo, si utilizo un motor de bsqueda para localizar informacin sobre el Museo del Prado, simplemente tendr que escribir "Museo del Prado" en el espacio de bsqueda y pinchar en el botn Buscar. A continuacin se me devolver otra pgina con los resultados de la bsqueda: un listado con enlaces a las pginas solicitadas.

    Un buen ejemplo de motores de bsqueda es Google.

    4

  • Clasificacin de buscadores

    + Buscadores jerrquicos (araas o spiders)

    Las araas (tambin llamadas "spiders") de los motores de bsqueda, recorren las pginas recopilando informacin sobre los contenidos de las pginas. Cuando se busca una informacin concreta en los buscadores, ellos consultan su base de datos y presentan resultados clasificados por su relevancia para esa bsqueda concreta. Los buscadores pueden almacenar en sus bases de datos desde la pgina de entrada de cada web, hasta todas las pginas que residan en el servidor, una vez que las araas (spiders) las hayan reconocido e indexado.

    Si se busca una palabra (por ejemplo: ordenadores), en los resultados que ofrecer el motor de bsqueda aparecern pginas que contengan esta palabra en alguna parte de su texto de contenido.

    Si consideran que un sitio web es importante para el usuario, tienden a registrar todas sus pginas. Si no la consideran importante, no se almacenan todas.

    Cada cierto tiempo, los motores revisan los sitios web, para actualizar los contenidos de su base de datos, por tanto puede que los resultados de la bsqueda estn desactualizados.

    Los buscadores jerrquicos tienen una coleccin de programas simples y potentes con diferentes cometidos. Se suelen dividir en tres partes. Los programas que exploran la red -araas (spiders)-, los que construyen la base de datos y los que utiliza el usuario, el programa que explota la base de datos.

    Si se paga, se puede aparecer en las primeras posiciones de resultados, aunque los principales buscadores delimitan estos resultados e indican al usuario que se trata de anuncios (resultados esponsorizados o patrocinados). Hasta el momento, aparentemente, esta forma de publicidad es indicada explcitamente. Los buscadores jerrquicos se han visto obligados a comercializar este tipo de publicidad para poder seguir ofreciendo a los usuarios el servicio de forma gratuita.

    + Directorios

    Una tecnologa barata, ampliamente utilizada por gran cantidad de scripts en el mercado.

    No se requieren muchos recursos de informtica. En cambio, se requiere ms soporte humano y mantenimiento.

    Los algoritmos son mucho ms sencillos, presentando la informacin sobre los sitios registrados como una coleccin de directorios. No recorren los sitios web ni almacenan sus contenidos. Solo registran algunos de los datos

    5

  • de nuestra pgina, como el ttulo y la descripcin que se introduzcan en el momento de registrar el sitio en el directorio.

    Los resultados de la bsqueda, estarn determinados por la informacin que se haya suministrado al directorio cuando se registra el sitio. En cambio, a diferencia de los motores, son revisadas por operadores humanos, y clasificadas segn categoras, de forma que es ms fcil encontrar pginas del tema de nuestro inters.

    Ms que buscar informacin sobre contenidos de la pgina, los resultados sern presentados haciendo referencia a los contenidos y temtica del sitio.

    Su tecnologa es muy barata y sencilla.

    Como inconveniente cabe resaltar que los resultados estn ordenados por temtica, o por fecha de publicacin, pero no por relevancia o concordancia con una bsqueda concreta del usuario.

    Ejemplos de directorios: Antiguos directorios, Open Directory Project, Yahoo! Terra (antiguo Ol). Ahora, ambos utilizan tecnologa de bsqueda jerrquica, y Yahoo! conserva su directorio. Buscar Portal, es un directorio, y la mayora de motores hispanos son directorios.

    + Meta buscador

    Permite lanzar varias bsquedas en motores seleccionados respetando el formato original de los buscadores. Lo que hacen es realizar bsquedas en autnticos buscadores, analizan los resultados de la pgina y presentan sus propios resultados, segn un orden definido por el sistema estructural del meta buscador. Metacrawler y Aleyares son ejemplos de este tipo de buscador.

    + FFA - Enlaces gratuitos para todos

    FFA (acrnimo del ingls "Free For All"), Cualquiera puede inscribir su pgina durante un tiempo limitado en estos pequeos directorios. Los enlaces no son permanentes.

    + Buscadores verticales

    Los buscadores verticales o motores de bsqueda temticos son buscadores especializados en un sector concreto, lo que les permite analizar la informacin con mayor profundidad, disponer de resultados ms actualizados y ofrecer al usuario herramientas de bsqueda avanzadas.

    6

    http://es.wikipedia.org/wiki/DMOZhttp://es.wikipedia.org/wiki/Yahoo!http://es.wikipedia.org/wiki/Terra_Networkshttp://es.wikipedia.org/wiki/Ol%C3%A9_(buscador)http://es.wikipedia.org/wiki/Usuario_(inform%C3%A1tica)

  • Es importante resaltar que utilizan ndices especializados, para, de este modo, acceder a la informacin de una manera ms especfica y fcil. Algunos ejemplos de estos buscadores son: Trovit, Nestoria, Wolfram Alpha.

    Existen distintos tipos de estos buscadores, algunos estn especializados en una rama de una ciencia, y algunos abarcan todo tipo de materias. Tambin hay motores de bsqueda que solo ofrecen resultados sobre msica, ropa y otras temticas.

    Lo ms utilizados:

    Google:

    Es una herramienta que rastrea e indexa miles de millones de pginas web y documentos asociados, y realiza una clasificacin de su relevancia para cualquier trmino que el usuario busque.

    Esta clasificacin se realiza principalmente siguiendo el algoritmo PageRank, que se basa en que cada hiperenlace recibido por un documento significa un voto de calidad. Es el servicio ms popular de Google, aunque dispone de muchos ms, que buscan informacin contenida en otro tipo de soportes.

    Para rentabilizarlo econmicamente, en octubre de 2000 se lanz el programa publicitario Google AdWords, que permite a cualquier persona anunciarse dentro de la pgina de resultados del buscador, pagando una determinada cantidad por cada click que el usuario realice.

    Bing :

    Bing (anteriormente Live Search, Windows Live Search y MSN Search) es un buscador web de Microsoft. Presentado por el director ejecutivo de Microsoft, Steve Ballmer el 28 de mayo de 2009 en la Conferencia All Things Digital en San Diego. Fue puesto en lnea el 3 de junio de 2009 con una versin preliminar publicada el 1 de junio del 2009.

    Cambios notables incluyen la lista de sugerencias de bsqueda en tiempo real, y una lista de las bsquedas relacionadas (llamado "Panel de explorador" en el lado izquierdo de los resultados de bsqueda), basado en tecnologa semntica de Powerset que Microsoft compr en el 2008.

    7

    http://es.wikipedia.org/wiki/Nestoriahttp://es.wikipedia.org/wiki/Wolfram_Alphahttp://es.wikipedia.org/wiki/Cienciahttp://google.dirson.com/pagerank.phphttp://www.google.com/press/pressrel/pressrelease39.htmlhttp://google.dirson.com/adwords.phphttp://es.wikipedia.org/wiki/Motor_de_b%C3%BAsquedahttp://es.wikipedia.org/wiki/Microsofthttp://es.wikipedia.org/wiki/Director_ejecutivohttp://es.wikipedia.org/wiki/Steve_Ballmerhttp://es.wikipedia.org/wiki/3_de_junio

  • Ask:

    Ask.com, tambin conocido como Ask Jeeves, es un motor de bsqueda de Internet. Es parte de la compaa InterActive Corporation, fundada en 1996 por Garrett Gruener y David Warthen en Berkeley, California. El programa original fue implementado por Gary Chevsky basado en su propio diseo. El primer inversor fue el Grupo RODAS.

    Ask.com bsqueda y barras de herramientas relacionadas se clasifican como posibles programas no deseados que se promueven y difunden a travs de otros programas libres. Una vez que capta el equipo, que van a hacer una serie de modificaciones a su sistema, como el secuestro de los navegadores instalados cambiando pgina original y proveedor de bsqueda predeterminado para ask.com, nl.ask.com, search.ask.com, u otros sitios similares. De hecho, el secuestrador del navegador ask.com hizo su primera aparicin hace varios aos que puede remontarse a 2008, o incluso antes. Tal secuestrador del navegador parece seguir sus infecciones a ms usuarios de computadoras en diferentes variantes, desde antes conocida search.ask.com dominio a nl.ask.com recientemente encontrado.

    8

    http://es.wikipedia.org/wiki/Motor_de_b%C3%BAsquedahttp://es.wikipedia.org/wiki/Motor_de_b%C3%BAsquedahttp://es.wikipedia.org/wiki/Internethttp://es.wikipedia.org/w/index.php?title=InterActive_Corporation&action=edit&redlink=1http://es.wikipedia.org/w/index.php?title=InterActive_Corporation&action=edit&redlink=1http://es.wikipedia.org/wiki/1996http://es.wikipedia.org/wiki/Berkeley_(California)http://es.wikipedia.org/wiki/California

  • Conclusin

    Los buscadores en Internet, son programas o aplicaciones que residen en un sitio o pgina web, los cuales, al ingresar palabras en sus recuadros de bsqueda, operan dentro de la base de datos del mismo buscador y recopilan todas las pginas que contengan informacin relevante y relacionada con lo que se busca.

    Los buscadores web son muy fciles de usar, solo necesitas ingresar en el recuadro de bsqueda una palabra clave y el buscador te dar la lista de pginas relacionadas con tu bsqueda.

    Existen los jerrquicos, directorios, meta buscador, enlaces gratuitos y buscadores verticales. De los ms comunes buscadores es Google que utilizamos a diario aun sin saber su estructura o su historia.

    9

  • Bibliografa

    2. http://es.wikipedia.org/wiki/Motor_de_b%C3%BAsqueda

    3. http://www.alu.ua.es/r/rac6/Buscadores/que_es_un_buscador.html

    4. http://aula21.net/tallerwq/buscadores/buscador1.htm 5. http://google.dirson.com/o.a/google-web 6. http://www.misrespuestas.com/que-son-los-

    buscadores-en-internet.html 7. MENU

    10

    http://es.wikipedia.org/wiki/Motor_de_b%C3%BAsquedahttp://es.wikipedia.org/wiki/Motor_de_b%C3%BAsquedahttp://www.alu.ua.es/r/rac6/Buscadores/que_es_un_buscador.htmlhttp://www.alu.ua.es/r/rac6/Buscadores/que_es_un_buscador.htmlhttp://aula21.net/tallerwq/buscadores/buscador1.htmhttp://google.dirson.com/o.a/google-webhttp://www.misrespuestas.com/que-son-los-buscadores-en-internet.htmlhttp://www.misrespuestas.com/que-son-los-buscadores-en-internet.htmlhttp://galeon.com/siomariscanabal/MENU.HTML

  • Glosario

    1. Indexado: Es el nombre que se le da al proceso de recolectar y almacenar pginas web por parte de un buscador de internet. Luego de este proceso, pueden estar disponibles en las pginas con resultados de bsquedas que se realicen en ese buscador.

    2. Algoritmo: Es un conjunto prescrito de instrucciones o reglas bien definidas, ordenadas y finitas que permite realizar una actividad mediante pasos sucesivos que no generen dudas a quien deba realizar dicha actividad.

    11

    http://www.alegsa.com.ar/Dic/almacenamiento.phphttp://www.alegsa.com.ar/Dic/pagina%20web.phphttp://www.alegsa.com.ar/Dic/buscador.phphttp://www.alegsa.com.ar/Dic/internet.phphttp://www.alegsa.com.ar/Dic/resultados%20de%20busqueda.phphttp://www.alegsa.com.ar/Dic/resultados%20de%20busqueda.php